Como o Cloudflare Workers limita o tamanho de um único arquivo a 25 MB, arquivos de áudio grandes precisam ser divididos manualmente:
- Dividir arquivoCorte o áudio em pequenos pedaços de cerca de 1 MB (use ferramentas como o FFmpeg).
- Carregamento bloco a blocoEnviar cada nugget por vez por meio da API para o
/raw
talvez/srt
Interface. - Resultados consolidadosEmenda os dados JSON ou SRT retornados por registro de data e hora.tomar nota deNecessidade de garantir que a continuidade contextual seja preservada durante a fragmentação para evitar erros de transcrição.
Por exemplo, um teste de áudio de 41 minutos mostrou um tempo de processamento de cerca de 1,9 minuto e, após a segmentação, o tempo total decorrido precisa ser estimado.
Essa resposta foi extraída do artigoWhisper on Cloudflare AI: uma ferramenta gratuita para converter áudio em texto e gerar legendasO