Unterstützte Sprachdiensttypen
- Open-Source-Modellz.B. Zyphra/Zonos-v0.1-hybrid (erfordert lokale GPU-Ressourcen)
- Business-APIs:: OpenAI-kompatible Dienste (kokoros.transformrs.org)
- Plattformen von DrittenDeepInfra, usw. (erfordert API-Schlüssel)
Verfahren zur Konfiguration
- Taste Einstellung:
export DEEPINFRA_KEY="你的密钥" - Dienst Bezeichnung:
- Basisbefehl:
--provider=openai-compatible(kokoros.transformrs.org) - Modellauswahl:
--model=tts-1 - Klangliche Parameter:
--voice=bm_lewis
- Basisbefehl:
- Audioausgang: Kann angegeben werden
--audio-format=waviso-format
Beachten Sie die Unterschiede in den Sprachstilen und den Kosten für die verschiedenen Dienste, und empfehlen Sie, vor der Erstellung von Chargen Proben zu testen.
Diese Antwort stammt aus dem ArtikelTRV: Schnelles Generieren von Präsentationsvideos aus Folien/PPTs und erläuternden Notizen》































