Processo de cinco etapas para geração de fala
- Modificação do arquivo de configuração:: Editorialvoices.jsonSelecione o idioma e o tom de destino (por exemplo'en_US'(Voz feminina anglo-americana)
- entrada de textoNo script de exemplohello.py(usado em uma expressão nominal)text_to_speakAs variáveis preenchem o texto de destino (suporte a marcação SSML)
- ajuste de parâmetros: AjustesspeedTaxa de fala (0,5-2,0),pitchPitch (-20~+20) e outros parâmetros
- Geração de execução: Executarpython hello.pyacionar um processo sintético
- gerenciamento de resultadosGerado por padrãooutput.wavIsso pode ser feito modificando osoundfile.writeFormato de alteração do parâmetro
Operação de funções avançadas
- arquivo de loteListas de texto podem ser processadas por meio de uma estrutura de loop
- Saída de streaming em tempo real: ChamadastreamInterface para reprodução de frase por frase
- fusão de áudioSuporte experimental para a combinação de vários recursos de som (requer modificação do model_config.json)
Dicas de depuração
Quando ocorre uma exceção sintética, recomenda-se: verificar o valor da soma de verificação MD5 do arquivo onnx, confirmar se o ambiente Python é uma versão de 64 bits e atualizar o ONNX Runtime para a versão mais recente.
Essa resposta foi extraída do artigoKokoro-ONNX: ferramenta eficiente de conversão de texto em fala com suporte a vários idiomas e várias vozesO































 Português do Brasil
Português do Brasil				 简体中文
简体中文					           English
English					           日本語
日本語					           Deutsch
Deutsch