O Whisper_Cloudflare é um projeto de código aberto baseado no modelo Whisper da OpenAI, combinado com a arquitetura sem servidor do Cloudflare Workers, hospedado no GitHub pelo desenvolvedor thun888. Seus principais recursos incluem:
- conversão de voz em textoReconhecimento de vários idiomas para converter áudio em texto.
- Geração de subtítulosLegenda: Emite arquivos de legenda com registro de data e hora no formato SRT.
- compatível com vários formatosMP3: Manipula MP3, WAV e outros formatos de áudio comuns.
- função de traduçãoConteúdo de áudio: O conteúdo de áudio pode ser traduzido para um idioma específico (por exemplo, inglês, chinês).
- Otimização de contexto: por meio de um parâmetro como
initial_prompt
Aumento da precisão da transcrição.
O projeto é totalmente gratuito e adequado para desenvolvedores e equipes implantarem rapidamente sem gerenciar servidores.
Essa resposta foi extraída do artigoWhisper on Cloudflare AI: uma ferramenta gratuita para converter áudio em texto e gerar legendasO