プロジェクトが提供するデュアルAPIインターフェースは、さまざまな統合オプションをサポートする:
- 標準REST APIスルー
/tts
このインターフェースは、JSON形式のリクエスト(text/voiceパラメータ)を受け取り、WAVオーディオストリームを返します。 - OpenAI互換インターフェース::
/v1/audio/speech
OpenAI TTS API仕様と完全に互換性があり、公式サービスの代替となる
具体的な実施手順
- config.yamlで有効にする
api_key
認証がセキュリティを保証する - Python requests モジュールを使ったサンプルコード:
response = requests.post('http://localhost:8005/v1/audio/speech', json={'input':'文本内容','voice':'female1'})
- セットアップ
timeout=30
長いテキスト生成への対応
テストフェーズはSwaggerドキュメント(http://localhost:8005/docs
) インターフェース・パラメーターの高速検証。
この答えは記事から得たものである。Kitten-TTS-Server: セルフデプロイ可能な軽量音声合成サービスについて