Zugang aus Übersee: www.kdjingpai.com
Ctrl + D Lesezeichen für diese Seite
Derzeitige Position:Abb. Anfang " AI-Werkzeugbibliothek

InspireMusic: Alis Open-Source-Framework für die einheitliche Erzeugung von Musik, Songs und Audio

2025-02-15 772

InspireMusic ist ein auf PyTorch basierendes Open-Source-Toolkit, das sich auf Musik-, Song- und Audiogenerierung konzentriert. Es bietet ein einheitliches Framework für die Erzeugung von hochwertigem Audio mit Kontrolle über Text-Cues, Musikstruktur und Musikstil. InspireMusic unterstützt 24kHz und 48kHz Audio-Generierung und ist in der Lage, lange Audio-Generierung. Das Toolkit bietet nicht nur Inferenz- und Trainingscode, sondern unterstützt auch Mixed-Precision-Training für die Feinabstimmung und Inferenz des Modells.InspireMusic hat sich zum Ziel gesetzt, den Nutzern bei der Innovation von Klanglandschaften zu helfen und die harmonische Ästhetik in der Musikforschung durch den Prozess des Audio-Labelling und De-Labelling zu verbessern.

InspireMusic:阿里开源的统一音乐、歌曲和音频生成框架-1

Demo: https://modelscope.cn/studios/iic/InspireMusic/summary

 

Funktionsliste

  • Text-to-MusicMusik aus Textstichworten generieren.
  • Kontrolle der MusikstrukturUnterstützung für die Erzeugung von Musik auf der Grundlage musikalischer Strukturen.
  • Musikstil-SteuerungSie können den Stil der erzeugten Musik bestimmen.
  • Hochwertige AudioerzeugungUnterstützt 24kHz und 48kHz Audiogenerierung.
  • Lange AudioerzeugungUnterstützt die Erzeugung von Audiodaten mit langer Dauer.
  • Gemischtes PräzisionstrainingUnterstützt BF16, FP16/FP32 Training mit gemischter Präzision.
  • Modell-Feinabstimmung und InferenzErmöglicht eine einfache Feinabstimmung und Überlegungen zu Skripten und Strategien.
  • Online-DemoEine Online-Demo ist verfügbar, und die Benutzer können sie auf ModelScope und HuggingFace ausprobieren.

 

Hilfe verwenden

Einbauverfahren

  1. Klon-Lagerhaus:
   git clone https://github.com/FunAudioLLM/InspireMusic.git
cd InspireMusic
  1. Installieren Sie die Abhängigkeit:
   pip install -r requirements.txt
  1. Installieren Sie PyTorch (wählen Sie den entsprechenden Installationsbefehl für Ihre CUDA-Version):
   pip install torch torchvision torchaudio

Leitlinien für die Verwendung

Text-to-Music

  1. 准备文本提示,例如 “生成一段欢快的钢琴音乐”。
  2. Führen Sie das Generierungsskript aus:
   python app.py --text "生成一段欢快的钢琴音乐"
  1. Die erzeugte Musik wird in dem angegebenen Ausgabeverzeichnis gespeichert.

Kontrolle der Musikstruktur

  1. Bereiten Sie eine Musikstrukturdatei vor, die die Rhythmen, Akkorde usw. der Musik definiert.
  2. Führen Sie das Generierungsskript aus:
   python app.py --structure path/to/structure/file
  1. Die erzeugte Musik wird auf der Strukturdatei basieren.

Musikstil-Steuerung

  1. 选择预定义的音乐风格,例如 “古典”、”爵士” 等。
  2. Führen Sie das Generierungsskript aus:
   python app.py --style "古典"
  1. Die erzeugte Musik wird dem ausgewählten Musikstil entsprechen.

Modell-Feinabstimmung und Inferenz

InspireMusic bietet bequeme Skripte zur Feinabstimmung und Inferenz, die es dem Benutzer ermöglichen, das Modell und die Inferenz nach seinen Bedürfnissen zu optimieren. Nachfolgend finden Sie ein einfaches Beispiel für die Feinabstimmung:

  1. Bereiten Sie den Trainingsdatensatz vor.
  2. Führen Sie das Feinabstimmungsskript aus:
   python finetune.py --data path/to/dataset --output path/to/output/model
  1. Inferenz mit einem fein abgestimmten Modell:
   python app.py --model path/to/output/model --text "生成一段新的音乐"

Online-Demo

Benutzer können die Online-Demoseiten auf ModelScope und HuggingFace besuchen, um die Leistungsfähigkeit von InspireMusic zu erleben. Geben Sie einfach Textanweisungen ein, um hochwertige Musik zu erzeugen.

 

jian27 Integrationspaket

AI生产力应用Dieser Inhalt wurde vom Autor versteckt, bitte geben Sie den Verifizierungscode ein, um den Inhalt zu sehen
Captcha:
Bitte achten Sie auf diese Website WeChat öffentliche Nummer, Antwort "CAPTCHA, eine Art von Challenge-Response-Test (Computertechnik)", um den Verifizierungscode zu erhalten. Suchen Sie in WeChat nach "AI-Produktivitätsanwendungen"oder"Künstlich9527" oder WeChat Scannen der rechten Seite des QR-Codes kann die Aufmerksamkeit auf diese Website WeChat öffentliche Zahl zu zahlen.

Empfohlen

Sie können keine AI-Tools finden? Versuchen Sie es hier!

Geben Sie einfach das Schlüsselwort Barrierefreiheit Bing-SucheDer Bereich KI-Tools auf dieser Website bietet eine schnelle und einfache Möglichkeit, alle KI-Tools auf dieser Website zu finden.

Posteingang

Kontakt

zurück zum Anfang

de_DEDeutsch