针对 Cloudflare Workers 的文件大小限制,可采用分块处理方案:
- 预处理分割:使用 FFmpeg 等工具将音频切分为 1MB 的片段(建议 WAV 格式)
- 分批上传:通过循环调用 API 逐块提交,记录每块的 start/end 时间戳
- 结果合并:将返回的各段 JSON 数据按时间戳重新拼接,或用
cat file1.srt file2.srt > full.srt
合并字幕
注意保持采样率一致,避免时间轴错位。
本答案来源于文章《Whisper on Cloudflare AI:将音频转文字并生成字幕的免费工具》