AIVocal verwendet eine verbesserte Demucs-Architektur, um eine professionelle Quellentrennung zu erreichen, und seine dreischichtige Rest-U-Net-Struktur identifiziert und extrahiert präzise vier Arten von Spuren: Gesang, Schlagzeug, Bass und andere Instrumente. Im MUSDB18-Benchmark-Test erreicht der SDR-Wert für die Gesangstrennung 94,7% mit einem verbesserten Signal-Rausch-Verhältnis von 12,3 dB und übertrifft damit den Trenneffekt herkömmlicher NMF-Methoden.
Die Technologie bietet Musikern drei bahnbrechende Möglichkeiten: das Trennen jedes kommerziellen Songs in Split-Track-Material zum Abmischen und Lernen; das Extrahieren von reinem Gesang für Cover-Aufnahmen; und das Entfernen des Originalgesangs zum Erstellen professioneller Backing-Tracks. AIVocal bietet drei einzigartige Vorteile gegenüber herkömmlichen Ansätzen, die eine 10.000 Dollar teure RX10-Software erfordern:
- Durch die Verarbeitung in der Cloud entfällt der Bedarf an leistungsstarker lokaler Hardware
- Unterstützt Stapel-Upload-Verarbeitung ganzer Alben
- 96kbps OPUS-kodierte Ausgabe, die die ursprüngliche Klangqualität bewahrt
In der Praxis nutzen unabhängige Musiker die Plattform, um die Sampling-Effizienz um das Vierfache zu steigern, und K-Song-Anwendungen integrieren die API, um die Kosten für die Erzeugung von Begleitungen um 90% zu senken. Getrennte Spuren können direkt in die DAW-Software zur weiteren Bearbeitung importiert werden, wodurch ein vollständiger geschlossener Kreislauf der Musikproduktion entsteht.
Diese Antwort stammt aus dem ArtikelAIVocal: ein kostenloses KI-Tool zur Erstellung von Podcasts und zur AudiobearbeitungDie





























