3 Wege zur Verbesserung der Trenngenauigkeit von Demucs
Die Qualität der Audioquelle und die Wahl der Parameter wirken sich direkt auf die Trennung aus:
1. die Auswahl des besten Modells
- Prioritätensetzung
-n htdemucs_ft
Feinabstimmung des Modells (Version v4) - Komplexe Musik zum Ausprobieren
-n htdemucs_6s
Sechs-Spur-Modellierung zur Trennung mehrerer Instrumente - Klassische Musik wird empfohlen
-n mdx_extra
Dedizierte Modelle
2. die Optimierung der Eingangsqualität
- Verwenden Sie das verlustfreie WAV-Format anstelle von MP3, um Komprimierungsverluste zu vermeiden.
- Sicherstellen, dass die Audio-Abtastrate ≥ 44,1kHz ist
- Entfernen Sie den stummgeschalteten Teil des Audio-Frontends
3. die Verfahren zur Feinabstimmung der Parameter
- erhöhen.
--float32
Verwendung von 32-Bit-Gleitkommaberechnungen zur Verbesserung der Genauigkeit - Vermeiden Sie die Verwendung von
--segment
Parameter schneiden zu kleine Segmente (≥10 Sekunden empfohlen) - passieren (eine Rechnung oder Inspektion etc.)
--shifts=2
Erhöhen Sie die Anzahl der Vorhersagen (was die Verarbeitungszeit erhöht)
Tests haben gezeigt, dass die Verwendung der Kombination WAV+htdemucs_ft die Trennungsgenauigkeit um etwa 151 TP3T gegenüber der Standardeinstellung verbessern kann.
Diese Antwort stammt aus dem ArtikelDemucs: kostenloses Open-Source-Tool zum Trennen von MusikstückenDie