デムックスの分離精度を向上させる3つの主な方法
オーディオソースの品質とパラメータの選択は、セパレーションに直接影響します:
1.最適モデルの選択
- 優先順位付け
-n htdemucs_ft
モデルの微調整(バージョンv4) - 試してみたい複雑な音楽
-n htdemucs_6s
より多くの楽器をセパレートできる6トラック・モデリング - クラシック音楽を推奨
-n mdx_extra
専用モデル
2.入力品質の最適化
- MP3の代わりにロスレスWAVフォーマットを使用し、圧縮のロスを減らす
- オーディオ・サンプリング・レートが44.1kHz以上であること
- オーディオフロントエンドのミュート部分の削除
3.パラメーターの微調整技術
- 増加
--float32
32ビット浮動小数点計算を使用して精度を向上 - の使用は避ける。
--segment
パラメータが小さすぎる(10秒以上を推奨)。 - とおす
--shifts=2
予測数を増やす(処理時間が長くなる)
テストでは、WAV+htdemucs_ftの組み合わせを使用することで、デフォルト設定よりも約15%分離精度が向上することが示されている。
この答えは記事から得たものである。Demucs: 音楽トラックを分離するための無料のオープンソースツールについて