Audibitは、オーディオ品質を保証するためにデュアルエンジン・パラレルストラテジーを採用しています:
- OpenAIエンジンイントネーションのコントロールや感情表現もサポート。
- レモンボックス・エンジン特に技術系コンテンツでは、専門用語の正確な発音を重視。
実際のテストでは、3,000語の技術記事を変換した後:
- 平均生成時間 約90秒(記事の長さによる)
- オーディオ・サンプリング・レートを44.1kHz CDレベルに維持
- バックグラウンドノイズを-60dB以下に制御
言語サポートについては、現在のバージョンでは以下の言語を自動的に認識します:
- 英語(アメリカ/イギリス発音は任意)
- 簡体字中国語
- 日本語
- スペイン語
注目すべきは、システムが記事のメタデータに基づいて自動的に言語タイプを決定することであり、ユーザーはconfig/tts.jsで好みの音声スキームを手動で設定することもできる。将来的には、言語検出モデルによって、より正確な自動マッチングを実現する予定である。
この答えは記事から得たものである。Audibit:人気の技術記事をすぐに聴ける音声ポッドキャストにするについて