Requisitos do cenário de negócios
O Kokoro-ONNX atende às necessidades de sistemas de atendimento ao cliente, produção de audiolivros e outros cenários que exigem a alternância dinâmica de saídas de voz com tons diferentes usando o seguinte mecanismo:
Programa de implementação
- Extensão da biblioteca de voz: em
voices.jsonpara adicionar configurações de tom personalizadas, cada entrada contendo ospeaker_ide marcação de idioma - carregamento dinâmico (computação)Modificação
hello.py(usado em uma expressão nominal)SynthesizerParâmetros de inicialização da classe, passados para o destinospeaker_id - saída mista: Uso
soundfileA biblioteca mescla vários clipes de voz para efeitos de diálogo - Comutação em tempo realCriar um serviço WebSocket, por meio de um parâmetro da API
?voice=alicePronunciador Designado Dinâmico
advertência
1) Recomenda-se armazenar modelos de tons diferentes em diretórios separados 2) Mantenha a sessão de tempo de execução do ONNX longa ao alternar entre altas frequências 3) Certifique-se de usar a codificação UTF-8 para arquivos json em idiomas não latinos, como o chinês.
Essa resposta foi extraída do artigoKokoro-ONNX: ferramenta eficiente de conversão de texto em fala com suporte a vários idiomas e várias vozesO































