Whisper_Cloudflareは、OpenAIのWhisperモデルとCloudflare Workersサーバーレスアーキテクチャを組み合わせたオープンソースプロジェクトで、開発者のthun888によってGitHubでホストされている:
- 音声テキスト多言語認識に対応し、音声をテキストに変換。
- サブタイトル・ジェネレーションSRT 形式のタイムスタンプ付き字幕ファイルを出力します。
- マルチフォーマット対応MP3、WAV、その他一般的なオーディオフォーマットを扱えます。
- 翻訳機能オーディオコンテンツは、指定された言語(英語、中国語など)に翻訳することができます。
- コンテキストの最適化のようなパラメータを使用する。
initial_prompt
転写精度の向上
このプロジェクトは完全に無料で、開発者やチームがサーバーを管理することなく迅速にデプロイするのに適している。
この答えは記事から得たものである。ウィスパー・オン・クラウドフレアAI:音声をテキストに変換し、字幕を生成する無料ツールについて