Demucs v4, ein Meilenstein-Release, erzielt einen Durchbruch in der Track-Separation-Technologie durch die Integration der Hybrid-Transformer-Architektur. Diese Technologie kombiniert den Selbstaufmerksamkeitsmechanismus des Transformers mit traditionellen neuronalen Faltungsnetzwerken, um die Fähigkeiten zur Merkmalsextraktion deutlich zu verbessern und die Trennungsgenauigkeit auf ein branchenführendes Niveau zu bringen.
Zu den konkreten Umsetzungen gehören:
- Unterstützt die Trennung von sechs Spuren: Gesang, Schlagzeug, Bass, andere Begleitstimmen, Gitarre und Klavier.
- Unterschiede bei der Modellauswahl: htdemucs_ft ermöglicht eine Feinabstimmung der Modelle mit der höchsten Genauigkeit, htdemucs_6s unterstützt sechsspurige experimentelle Merkmale
- Optimierung der Verarbeitungszeit: Audio-Verarbeitungszeit ist etwa 1,5 mal der ursprünglichen Zeit, im Vergleich mit der v3-Version der Effizienzsteigerung von 30%
- Anforderungen an den Grafikspeicher: empfohlen 3 GB oder mehr GPU-Speicher, kann über den Parameter Ressourcenverbrauch - Segment optimiert werden
Diese Version ist besonders für die professionelle Musikproduktion geeignet und ermöglicht die präzise Extraktion bestimmter Instrumentenspuren für die Erstellung von Remixen.
Diese Antwort stammt aus dem ArtikelDemucs: kostenloses Open-Source-Tool zum Trennen von MusikstückenDie