Cloudflare Workersは1ファイルのサイズを25MBに制限しているため、大きなオーディオファイルは手動で分割する必要があります:
- 分割ファイルFFmpegのようなツールを使う)。
- ブロックごとのアップロード各ナゲットを順番にAPI経由で
/raw
もしかしたら/srt
インターフェース - 連結業績: 返されたJSONまたはSRTデータをタイムスタンプで分割する。銘記する転記ミスを避けるため、チャンキングの際に文脈の連続性を保つ必要がある。
例えば、41分の音声テストでは、処理時間は約1.9分であり、セグメンテーション後の総経過時間を推定する必要がある。
この答えは記事から得たものである。ウィスパー・オン・クラウドフレアAI:音声をテキストに変換し、字幕を生成する無料ツールについて