Solução: superando as limitações de desempenho com a tecnologia WebGPU
Ao executar modelos TTS no navegador, a computação tradicional do WebAssembly pode enfrentar gargalos de desempenho. O kokoro WebGPU oferece dois esquemas de otimização:
- Solução de aceleração WebGPUUse o parâmetro do dispositivo definido como "webgpu" com dtype="fp32":
"`javascript
dispositivo: 'webgpu',
dtype: 'fp32'
"` Essa combinação maximiza os benefícios da computação paralela de GPU - Programa de modelagem quantitativaUma versão quantificada pode ser usada para reduzir a quantidade de cálculos quando o dispositivo não for compatível com WebGPUs:
"`javascript
dtype: 'q8' // ou uma versão mais leve de 'q4'
“`
Sugestão extra: para a síntese de textos longos, recomenda-se usar a estratégia de processamento de segmentação e controlar o tamanho do bloco de texto por meio do parâmetro split_pattern para evitar carga excessiva em um único cálculo.
Essa resposta foi extraída do artigoKokoro WebGPU: um serviço de conversão de texto em fala para operação off-line em navegadoresO































