Zugang aus Übersee: www.kdjingpai.com
Ctrl + D Lesezeichen für diese Seite
Derzeitige Position:Abb. Anfang " AI-Nachrichten

Domestic AI Musik-Modell Mureka V7 veröffentlicht: technische Verbesserungen und Funktionalität realen Test

2025-07-23 23

Mit der kontinuierlichen Weiterentwicklung der KI-Technologie nimmt die Qualität und Popularität der KI-Musikerzeugung rasch zu. Die offensichtlichen Unzulänglichkeiten früherer KI-Musik in Bezug auf Klangtreue und Natürlichkeit des Gesangs werden durch die rasche Weiterentwicklung des Modells verbessert.

Am 23. Juli 2025 stellte Quintessence offiziell sein Musik-Megamodell der nächsten Generation vor Mureka V7. Offiziellen Angaben zufolge übertrifft das Modell ähnliche Produkte aus Übersee in einer Reihe von Schlüsselindikatoren wie durchschnittliche Leistungsbewertung, Mischqualität, Realismus der Stimmen und Gesamtklangqualität Suno (in Form eines Nominalausdrucks) V4.5 Version. Wie bei seinem Vorgänger V6 Verglichen mitMureka V7 Der Reichtum an melodischen Motiven und die Qualität der Arrangements wurden deutlich verbessert, während gleichzeitig der Realismus von Gesang und Instrumenten erhöht wurde.

Domestic AI Musik-Modell Mureka V7 veröffentlicht: technische Verbesserungen und Funktionalität der realen Test-1

Mureka V7 ist jetzt vollständig auf der offiziellen Website verfügbar und kann von den Nutzern erlebt werden.

Domestic AI Musik-Modell Mureka V7 veröffentlicht: technische Verbesserungen und Funktionalität der realen Test-1

Funktionalität in Aktion: von der Tonimitation zur Stilreferenz

Mureka V7 Eine der wichtigsten Funktionen ist "Custom Singers". Diese Funktion ermöglicht es Nutzern, Audiodaten hochzuladen oder einen Link zu einem Video bereitzustellen, damit das KI-Modell einen bestimmten Ton lernen und nachahmen kann, um einen brandneuen Song zu singen.

Nehmen wir das Timbre der Sängerin Faye Wong als Beispiel: Ihre Gesangslinie hat einen einzigartigen, luftigen Klang und eine luftige Gesangsverarbeitungstechnik. Durch die Verwendung von Mureka V7 Bei der Nachahmung und Neuinterpretation der Klangfarbe in Qingpingtiao wurden die stimmlichen Qualitäten des ursprünglichen Sängers weitgehend reproduziert, insbesondere in der Behandlung des Endes, das ein ähnliches Gefühl der Lethargie verkörperte.

 

Darüber hinaus ist "Music Reference" eine weitere nützliche Funktion. Das Modell analysiert die von den Nutzern hochgeladene Musik, erkennt ihren Stil, ihr Tempo, ihre Orchestrierung und ihre Stimmung und generiert Originalkompositionen mit ähnlichem Stil. So wird beispielsweise der aktuelle Social-Media-Hit "The Plane I Just Bought Got Hit", der sich an das indische Lied "Tunak Tunak Tun" anlehnt, als Referenz verwendet.Mureka V7 Fähigkeit, Tracks mit ähnlichen Melodien und Rhythmen zu erzeugen, die automatisch mit stilisierten visuellen Musikvideos gepaart werden.

Was die allgemeine Funktionalität angeht, so unterstützt das Modell die direkte Generierung verschiedener Musikstile aus Textbeschreibungen. Wenn man Li Bais Gedicht "Will Enter the Wine" eingibt und einen "Rap Metal"-Stil angibt, kann das Modell einen Song generieren, der das Gedicht mit Rockelementen kombiniert. Für die Erstellung von Hintergrundmusik (BGM) können Nutzer mit einfachen Vorgaben (z. B. "Erinnerung an die warme Klaviermelodie der Kindheit") urheberrechtsfreie reine Musikclips generieren oder Referenzaudio (z. B. den Titelsong von "Summer" oder "Game of Thrones") hochladen, um ähnliche Musikstile zu erstellen.

Bei unzureichender ErgebniserzielungMureka V7 Bietet grundlegende Audiobearbeitungstools mit Unterstützung für lokale Änderungen, Song-Erweiterung, Instrumentensplitting und Audio-Cropping und ist mit der Erstellung von Musik in zehn Sprachen kompatibel.

Technologischer Kern: die evolutionäre MusiCoT-Denkkette

Mureka V7 Die Leistungsverbesserung ist auf die selbstentwickelte musikgenerationsspezifische Denkkette zurückzuführen MusiCoT (Analyzable Chain-of-Musical-Thought Prompting) zur kontinuierlichen Optimierung.

Auf dem Gebiet der groß angelegten Sprachmodellierung ist die Gedankenkette (Chain-of-Thought, CoT) eine Methode, die ein Modell vor der Beantwortung einer Frage durch einen schrittweisen Denkprozess führt, um die Genauigkeit komplexer Aufgaben zu verbessern. Die Kernlogik von CoT besteht darin, "vor der Generierung über die Struktur nachzudenken", was den kreativen Prozess menschlicher Musiker simuliert. Bei der Ausgabe von spezifischem Audio Token Im Vorfeld plant das Modell die Gesamtstruktur der Musik, einschließlich der Passagen, des emotionalen Verlaufs und der choreografischen Gestaltung.

MusiCoT Ein weiteres Merkmal ist die Interpretierbarkeit und Kontrollierbarkeit der erzeugten Struktur. Mit Hilfe von CLAP (kontrastives Sprach-Audio-Vortrainingsmodell) wird die Gedankenkette, in der die KI Musik erzeugt, explizit lesbar. Dadurch kann der Benutzer das erzeugte Ergebnis genauer steuern, indem er Referenz-Audiodaten beliebiger Länge als stilistische Hinweise eingibt. Im Vergleich zu Suno und andere Modelle bei der Erforschung der musikalischen Struktur und Kontrollierbarkeit.Mureka (in Form eines Nominalausdrucks) MusiCoT Es wird ein besser interpretierbarer technischer Pfad bereitgestellt.

Ein neues Modell für die Sprachsynthese: Mureka TTS V1

Neben der Musikgenerierung hat Kunlun dieses Mal auch ein neues Audiomodell herausgebracht Mureka TTS V1mit Schwerpunkt auf allgemeiner Sprachsynthese.

Domestic AI Musik-Modell Mureka V7 veröffentlicht: technische Verbesserungen und Funktionalität der realen Test-1

Im Gegensatz zu Musikmodellen, bei denen Melodie und Harmonie im Vordergrund stehen, befassen sich TTS-Modelle (Text-to-Speech) eher mit der generischen Darstellung verschiedener Arten von Klängen.Mureka TTS V1 Die wichtigste Neuerung ist die Einführung von Voice Design Funktionen, die es dem Benutzer ermöglichen, die Merkmale der gewünschten Klangfarbe durch Textbeschreibungen in natürlicher Sprache zu definieren, anstatt nur aus einer Bibliothek von voreingestellten Tönen auszuwählen. Der Benutzer kann Geschlecht, Alter, Emotion, Intonationsstil und Sprechgeschwindigkeit der Stimme beschreiben, was eine hochgradig personalisierte Sprachsynthese ermöglicht.

Nach den offiziell veröffentlichten Vergleichsdaten im Vergleich zu den Hauptwettbewerbern der Branche ElevenLabs TTS V2 Bei einem Vergleich derMureka TTS V1 Es weist Stärken in der Sprachqualität, der Natürlichkeit des Konjunktivs und des Sprechrhythmus sowie der allgemeinen auditiven Wahrnehmung auf, hat aber leichte Defizite in der Aussprachegenauigkeit. Dies deutet darauf hin, dass dieMureka TTS V1 Es zeichnet sich durch "Kreativität" und "Definierbarkeit" des Klangs aus und eignet sich besonders für Film, Fernsehen, Spiele, Werbung und andere Szenarien, die ein hohes Maß an individueller Anpassung der Sprachaufnahmen erfordern.

Domestic AI Musik-Modell Mureka V7 veröffentlicht: technische Verbesserungen und Funktionalität der realen Test-1

Wenn Sie zum Beispiel "eine weibliche Kinderstimme, etwa 12 Jahre alt, mit einer klaren und angenehmen Stimme, voller Enthusiasmus" oder "ein männlicher Nachrichtensprecher, mit einer klaren und stabilen Stimme, ruhigem und rationalem Ton" eingeben, kann das Modell Audioclips erzeugen, die der Beschreibung entsprechen, und den gesamten Prozess der Erzeugung von Audioclips von der kreativen Beschreibung bis zur Sprachausgabe realisieren. Das Modell ist in der Lage, Audioclips zu generieren, die der Beschreibung entsprechen, wobei der gesamte Prozess von der kreativen Beschreibung bis zur Tonausgabe realisiert wird.

Bei großen Modellen Scaling laws Vor dem Hintergrund der schwindenden Grenznutzen der KI verlagert sich der Schwerpunkt der KI-Industrie allmählich auf die Entwicklung von Anwendungen in vertikalen Bereichen. Durch kontinuierliche Investitionen in Musik, Audio und andere Bereiche der KI-Erstellung will Kunlun Wanwei den Weg von der zugrundeliegenden Technologie zu den Anwendungsprodukten öffnen und die ökologische Position in der Szene der Inhaltserstellung einnehmen. Seit seinem Debüt im April 2024 hat dasMureka Die Modelle haben durch schnelle Iteration eine große Zahl von Nutzern angezogen, was die Beliebtheit ihrer Produkte auf dem Markt beweist.

Empfohlen

Sie können keine AI-Tools finden? Versuchen Sie es hier!

Geben Sie einfach das Schlüsselwort Barrierefreiheit Bing-SucheDer Bereich KI-Tools auf dieser Website bietet eine schnelle und einfache Möglichkeit, alle KI-Tools auf dieser Website zu finden.

Posteingang

Kontakt

zurück zum Anfang

de_DEDeutsch