A ferramenta emprega tecnologia em várias etapas para obter a diferenciação de voz entre os personagens:
Etapa de reconhecimento de caracteres
- estar em movimento
saveBookJson.pyRoteiro: Utilize modelos de IA para analisar o conteúdo dos capítulos e atribuir diálogos aos respectivos personagens. - Gere um arquivo JSON documentando a correspondência entre os diálogos dos personagens.
Estratégia de distribuição de áudio
- Atribuir manualmente vozes aos personagens principais: através de
createUser.pyDefina tons de voz fixos para o protagonista e o narrador. - Alocação inteligente de papéis secundários: personagens com mais de 50 falas recebem uma voz distinta, enquanto aqueles com menos de 50 falas utilizam a voz da narração.
- Suporta vários bancos de voz para modelos como o CosyVoice2.
realização
O arquivo MP3 resultante oferece uma experiência de áudio semelhante a um drama de rádio, com características vocais distintas para cada personagem. Por exemplo, no caso de teste, o protagonista emprega uma voz masculina grave, enquanto o narrador usa uma voz feminina suave.
Essa resposta foi extraída do artigoUma ferramenta para rastrear automaticamente romances e gerar audiolivros com vários caracteresO































