Zugang aus Übersee: www.kdjingpai.com
Ctrl + D Lesezeichen für diese Seite
Derzeitige Position:Abb. Anfang " AI-Werkzeugbibliothek

Step-Video-T2V: Ein Vincennes-Videomodell, das mehrsprachige Eingaben und die Erzeugung langer Videos unterstützt

2025-02-19 741

Step-Video-T2V是由StepFun AI(阶跃星辰)推出的一款先进的文本到视频转换模型。该模型拥有30亿参数,能够生成长达204帧的视频。通过深度压缩变分自编码器(VAE),模型实现了16×16的空间压缩和8x的时间压缩,从而提高了训练和推理的效率。Step-Video-T2V在视频生成领域表现出色,尤其在视频运动和效率方面。然而,对于处理复杂动作仍存在一定的挑战。该模型是开源的,使用者可以在GitHub上获取和贡献代码。

 

Funktionsliste

  • Erzeugen Sie Videos in hoher Qualität: Erzeugen Sie Videos mit bis zu 204 fps und 3 Milliarden Parametern.
  • 深度压缩技术:采用深度压缩变分自编码器,实现16×16空间压缩和8x时间压缩。
  • Zweisprachige Unterstützung: Unterstützt Textbenachrichtigungen in Englisch und Chinesisch.
  • Open Source und Unterstützung durch die Gemeinschaft: Modelle und Benchmark-Datensätze sind Open Source, um Innovationen zu fördern und die Urheber zu unterstützen.

 

Hilfe verwenden

Einbauverfahren

  1. Klonen von GitHub-Repositories:
    git clone https://github.com/stepfun-ai/Step-Video-T2V.git
    
  2. Rufen Sie den Projektkatalog auf:
    cd Step-Video-T2V
    
  3. Erstellen und aktivieren Sie eine virtuelle Umgebung:
    conda create -n stepvideo python=3.10
    conda activate stepvideo
    
  4. Installieren Sie die Abhängigkeit:
    pip install -e .
    pip install flash-attn --no-build-isolation  ## flash-attn是可选的
    

Leitlinien für die Verwendung

Video generieren

  1. Bereiten Sie Textaufforderungen vor, die in einer Datei gespeichert werden sollen, z. B.prompt.txt::
    飞机在蓝天中飞翔
    
  2. Führen Sie das Skript zur Videoerstellung aus:
    python generate_video.py --input prompt.txt --output video.mp4
    

Detaillierte Funktionsabläufe

  1. Erzeugen von Videos in hoher Qualität::
    • Texteingabe: Der Benutzer gibt einen Text ein, der den Inhalt des Videos beschreibt.
    • Modellverarbeitung: Das Step-Video-T2V-Modell analysiert den Text und erzeugt ein Video.
    • Videoausgabe: Das erzeugte Video wird im MP4-Format gespeichert, das von den Benutzern jederzeit angesehen und weitergegeben werden kann.
  2. Technologie der Tiefenkompression::
    • 空间压缩:通过16×16的空间压缩技术,提高视频生成效率。
    • Temporale Komprimierung: Die Geschwindigkeit und Qualität der Videoerstellung wird durch die 8-fache temporale Komprimierungstechnologie weiter optimiert.
  3. Zweisprachige Unterstützung::
    • Englisch-Unterstützung: Benutzer können englischen Text eingeben, und das Modell analysiert und generiert automatisch das entsprechende Video.
    • Chinesisch-Unterstützung: Benutzer können chinesischen Text eingeben, das Modell kann auch das entsprechende Video generieren, um die Bedürfnisse mehrsprachiger Benutzer zu unterstützen.
  4. Open Source und Unterstützung durch die Gemeinschaft::
    • Offener Quellcode: Benutzer können auf den vollständigen Code des Modells auf GitHub zugreifen, um ihn selbst einzusetzen und zu ändern.
    • Beitrag der Gemeinschaft: Nutzer können Code-Beiträge einreichen, um an der Verbesserung und Optimierung des Modells mitzuwirken.

Einzel-GPU-Inferenz und Quantifizierung

Das Step-Video-T2V Projekt unterstützt Single-GPU Inferenz und Quantisierung, was den benötigten Grafikspeicher erheblich reduziert. Bitte beachten SieVerwandte BeispieleWeitere Einzelheiten.

Best Practice Reasoning-Einstellungen

Step-Video-T2V schneidet bei der Inferenz gut ab und generiert durchgängig qualitativ hochwertige und dynamische Videos. Unsere Experimente zeigen jedoch, dass Variationen der Inferenz-Hyperparameter die Qualität der Generierung beeinflussen.

Modelle infer_steps cfg_skala zeit_verschiebung num_frames
Schritt-Video-T2V 30-50 9.0 13.0 204
Schritt-Video-T2V-Turbo (Inferenzschritt) Destillation) 10-15 5.0 17.0 204

Modell Download

Modellierung 🤗 Umarmungsgesicht 🤖 Modelscope
Schritt-Video-T2V Herunterladen von Herunterladen von
Schritt-Video-T2V-Turbo (Inferenzschritt-Destillation) Herunterladen von Herunterladen von

Empfohlen

Sie können keine AI-Tools finden? Versuchen Sie es hier!

Geben Sie einfach das Schlüsselwort Barrierefreiheit Bing-SucheDer Bereich KI-Tools auf dieser Website bietet eine schnelle und einfache Möglichkeit, alle KI-Tools auf dieser Website zu finden.

Posteingang

Kontakt

zurück zum Anfang

de_DEDeutsch