Cloudflare Workersのファイルサイズ制限に対しては、チャンキングスキームが利用可能です:
- 前処理 セグメンテーションFFmpegなどのツールを使って、オーディオを1MBのセグメントに分割する(WAVフォーマットを推奨)。
- 一括アップロード: ループ呼び出しによってブロックごとにAPIをコミットし、各ブロックの開始/終了タイムスタンプを記録する。
- 業績の統合を使用します。
cat file1.srt file2.srt > full.srt
複合サブタイトル
タイムラインのずれを防ぐため、サンプリングレートを一定に保つよう注意する。
この答えは記事から得たものである。ウィスパー・オン・クラウドフレアAI:音声をテキストに変換し、字幕を生成する無料ツールについて