Derzeitige Position:Abb. Anfang " AI-Werkzeugbibliothek

Step-Video-T2V: Ein Vincennes-Videomodell, das mehrsprachige Eingaben und die Erzeugung langer Videos unterstützt

2025-02-19

741

Step-Video-T2V是由StepFun AI（阶跃星辰）推出的一款先进的文本到视频转换模型。该模型拥有30亿参数，能够生成长达204帧的视频。通过深度压缩变分自编码器（VAE），模型实现了16×16的空间压缩和8x的时间压缩，从而提高了训练和推理的效率。Step-Video-T2V在视频生成领域表现出色，尤其在视频运动和效率方面。然而，对于处理复杂动作仍存在一定的挑战。该模型是开源的，使用者可以在GitHub上获取和贡献代码。

Funktionsliste

Erzeugen Sie Videos in hoher Qualität: Erzeugen Sie Videos mit bis zu 204 fps und 3 Milliarden Parametern.
深度压缩技术：采用深度压缩变分自编码器，实现16×16空间压缩和8x时间压缩。
Zweisprachige Unterstützung: Unterstützt Textbenachrichtigungen in Englisch und Chinesisch.
Open Source und Unterstützung durch die Gemeinschaft: Modelle und Benchmark-Datensätze sind Open Source, um Innovationen zu fördern und die Urheber zu unterstützen.

Hilfe verwenden

Einbauverfahren

Klonen von GitHub-Repositories:

git clone https://github.com/stepfun-ai/Step-Video-T2V.git

Rufen Sie den Projektkatalog auf:
```
cd Step-Video-T2V
```

Erstellen und aktivieren Sie eine virtuelle Umgebung:

conda create -n stepvideo python=3.10
conda activate stepvideo

Installieren Sie die Abhängigkeit:

pip install -e .
pip install flash-attn --no-build-isolation  ## flash-attn是可选的

Leitlinien für die Verwendung

Video generieren

Bereiten Sie Textaufforderungen vor, die in einer Datei gespeichert werden sollen, z. B.prompt.txt::
```
飞机在蓝天中飞翔
```

Führen Sie das Skript zur Videoerstellung aus:

python generate_video.py --input prompt.txt --output video.mp4

Detaillierte Funktionsabläufe

Erzeugen von Videos in hoher Qualität::
- Texteingabe: Der Benutzer gibt einen Text ein, der den Inhalt des Videos beschreibt.
- Modellverarbeitung: Das Step-Video-T2V-Modell analysiert den Text und erzeugt ein Video.
- Videoausgabe: Das erzeugte Video wird im MP4-Format gespeichert, das von den Benutzern jederzeit angesehen und weitergegeben werden kann.
Technologie der Tiefenkompression::
- 空间压缩：通过16×16的空间压缩技术，提高视频生成效率。
- Temporale Komprimierung: Die Geschwindigkeit und Qualität der Videoerstellung wird durch die 8-fache temporale Komprimierungstechnologie weiter optimiert.
Zweisprachige Unterstützung::
- Englisch-Unterstützung: Benutzer können englischen Text eingeben, und das Modell analysiert und generiert automatisch das entsprechende Video.
- Chinesisch-Unterstützung: Benutzer können chinesischen Text eingeben, das Modell kann auch das entsprechende Video generieren, um die Bedürfnisse mehrsprachiger Benutzer zu unterstützen.
Open Source und Unterstützung durch die Gemeinschaft::
- Offener Quellcode: Benutzer können auf den vollständigen Code des Modells auf GitHub zugreifen, um ihn selbst einzusetzen und zu ändern.
- Beitrag der Gemeinschaft: Nutzer können Code-Beiträge einreichen, um an der Verbesserung und Optimierung des Modells mitzuwirken.

Einzel-GPU-Inferenz und Quantifizierung

Das Step-Video-T2V Projekt unterstützt Single-GPU Inferenz und Quantisierung, was den benötigten Grafikspeicher erheblich reduziert. Bitte beachten SieVerwandte BeispieleWeitere Einzelheiten.

Best Practice Reasoning-Einstellungen

Step-Video-T2V schneidet bei der Inferenz gut ab und generiert durchgängig qualitativ hochwertige und dynamische Videos. Unsere Experimente zeigen jedoch, dass Variationen der Inferenz-Hyperparameter die Qualität der Generierung beeinflussen.

Modelle	infer_steps	cfg_skala	zeit_verschiebung	num_frames
Schritt-Video-T2V	30-50	9.0	13.0	204
Schritt-Video-T2V-Turbo (Inferenzschritt) Destillation)	10-15	5.0	17.0	204

Modell Download

Modellierung	🤗 Umarmungsgesicht	🤖 Modelscope
Schritt-Video-T2V	Herunterladen von	Herunterladen von
Schritt-Video-T2V-Turbo (Inferenzschritt-Destillation)	Herunterladen von	Herunterladen von

Step-Video-T2V: Ein Vincennes-Videomodell, das mehrsprachige Eingaben und die Erzeugung langer Videos unterstützt

Funktionsliste

Hilfe verwenden

Einbauverfahren

Leitlinien für die Verwendung

Video generieren

Detaillierte Funktionsabläufe

Einzel-GPU-Inferenz und Quantifizierung

Best Practice Reasoning-Einstellungen

Modell Download

Ähnliche Artikel

Empfohlen

Sie können keine AI-Tools finden? Versuchen Sie es hier!

Empfehlungsschreiben

neueste