由于 Cloudflare Workers 限制单文件不能超过 25MB,处理大音频文件需手动分割:
- 分割文件:将音频切割为 1MB 左右的小块(可使用 FFmpeg 等工具)。
- 逐块上传:通过 API 依次发送每个小块到
/raw
或/srt
接口。 - 合并结果:将返回的 JSON 或 SRT 数据按时间戳拼接。注意:需确保分块时保留上下文连续性,避免转录错误。
例如,41 分钟的音频测试显示处理时间约为 1.9 分钟,分割后需预估总耗时。
本答案来源于文章《Whisper on Cloudflare AI:将音频转文字并生成字幕的免费工具》