专用于人声的去混响模型,适用于 https://github.com/ZFTurbo/Music-Source-Separation-Training
微调自kim的人声乐器分离模型,所以保留了一些分离人声与乐器的能力
训练数据的干声为单声道单人演唱/说话,所以模型会尽可能使分离后的干声为单声道,导致在分离一些人声为立体声或者经过叠轨等处理的音频时可能会出问题,dereverb_mel_band_roformer_less_aggressive_anvuew_sdr_18.8050.ckpt
是使用为这些情况的样本挑出来的dereverb_mel_band_roformer_anvuew_sdr_19.1729.ckpt
训练中期的权重
dereverb_mel_band_roformer_anvuew_sdr_19.1729.ckpt
与dereverb_mel_band_roformer_less_aggressive_anvuew_sdr_18.8050.ckpt
两个权重由于训练代码bug,在训练时混响与人声实际并未对齐,所以这两个模型表现出一定程度的去除人声与乐器分离后的残留(通常是弦乐)以及部分和声(非中央声道)的能力
dereverb_mel_band_roformer_mono_anvuew_sdr_20.4029.ckpt
则因修复了对齐bug,去混响的能力更强了,但是去人声乐器分离残留以及和声的能力下降了
Inference Providers
NEW
This model is not currently available via any of the supported Inference Providers.
The model cannot be deployed to the HF Inference API:
The model has no library tag.