音声サービスの種類
- オープンソースモデル例:Zyphra/Zonos-v0.1-hybrid (ローカルGPUリソースが必要)
- ビジネスAPI:: OpenAI互換サービス (kokoros.transformrs.org)
- サード・パーティ・プラットフォームDeepInfraなど(APIキーが必要)
設定方法
- キーセッティング:
export DEEPINFRA_KEY="你的密钥" - サービス指定:
- ベース・コマンド
--provider=openai-compatible(kokoros.transformrs.org) - モデル選択:
--model=tts-1 - トーンパラメーター:
--voice=bm_lewis
- ベース・コマンド
- 音声出力指定可能
--audio-format=wavアイソフォーマット
サービスによる音声スタイルやコストの違いに注意し、バッチ生成の前にサンプルをテストすることを推奨する。
この答えは記事から得たものである。TRV:スライド/PPTと説明メモからプレゼンテーション動画を高速生成》































