Magenta RT bietet eine flexible multimodale Eingabe, die es den Nutzern ermöglicht, entweder Textstichwörter (z. B. "Light Jazz") einzugeben oder Audioclips als Grundlage für die Erzeugung hochzuladen. Noch leistungsfähiger ist die Möglichkeit, Text- und Audiohinweise zu mischen, indem die Gewichtung angepasst wird, z. B. "50% Jazz + 50% Audioeingabe". Diese hybride Eingabe ermöglicht es den Autoren, Stil und Tempo der Musik genau zu steuern und bietet so ein höheres Maß an Kontrolle und Kreativität bei der Musikgestaltung.
Das Ergebnis der Modellerzeugung ist 48-kHz-Stereo-Audio, das als Inspirationsclip oder zur sanften Artikulation der ersten 10 Sekunden des Audiokontextes (unter Verwendung von Überblendtechniken zur Verringerung von Grenzverzerrungen) verwendet werden kann. Die Ausgabe unterstützt die Echtzeit-Wiedergabe oder das Speichern als WAV-Datei.
Diese Antwort stammt aus dem ArtikelMagenta RealTime: ein Open-Source-Modell zur Erzeugung von Musik in EchtzeitDie