Derzeitige Position:Abb. Anfang " AI-Antworten

Die Vocal-Separation-Technologie erreicht eine 94,71 TP3T-Quellentrennung und revolutioniert den Workflow in der Musikproduktion

2025-08-23

1.0 K

AIVocal verwendet eine verbesserte Demucs-Architektur, um eine professionelle Quellentrennung zu erreichen, und seine dreischichtige Rest-U-Net-Struktur identifiziert und extrahiert präzise vier Arten von Spuren: Gesang, Schlagzeug, Bass und andere Instrumente. Im MUSDB18-Benchmark-Test erreicht der SDR-Wert für die Gesangstrennung 94,7% mit einem verbesserten Signal-Rausch-Verhältnis von 12,3 dB und übertrifft damit den Trenneffekt herkömmlicher NMF-Methoden.

Die Technologie bietet Musikern drei bahnbrechende Möglichkeiten: das Trennen jedes kommerziellen Songs in Split-Track-Material zum Abmischen und Lernen; das Extrahieren von reinem Gesang für Cover-Aufnahmen; und das Entfernen des Originalgesangs zum Erstellen professioneller Backing-Tracks. AIVocal bietet drei einzigartige Vorteile gegenüber herkömmlichen Ansätzen, die eine 10.000 Dollar teure RX10-Software erfordern:

Durch die Verarbeitung in der Cloud entfällt der Bedarf an leistungsstarker lokaler Hardware
Unterstützt Stapel-Upload-Verarbeitung ganzer Alben
96kbps OPUS-kodierte Ausgabe, die die ursprüngliche Klangqualität bewahrt

In der Praxis nutzen unabhängige Musiker die Plattform, um die Sampling-Effizienz um das Vierfache zu steigern, und K-Song-Anwendungen integrieren die API, um die Kosten für die Erzeugung von Begleitungen um 90% zu senken. Getrennte Spuren können direkt in die DAW-Software zur weiteren Bearbeitung importiert werden, wodurch ein vollständiger geschlossener Kreislauf der Musikproduktion entsteht.

Diese Antwort stammt aus dem ArtikelAIVocal: ein kostenloses KI-Tool zur Erstellung von Podcasts und zur AudiobearbeitungDie

Darf nicht ohne Genehmigung vervielfältigt werden:KI-Produktivitätswerkzeuge " Die Vocal-Separation-Technologie erreicht eine 94,71 TP3T-Quellentrennung und revolutioniert den Workflow in der Musikproduktion