Definição básica do Kokoro-ONNX
O Kokoro-ONNX é uma ferramenta de conversão de texto em fala (TTS) de código aberto baseada no tempo de execução ONNX, criada pelo desenvolvedor thewh1teagle. Ele foi projetado para síntese eficiente de fala, com uma arquitetura leve para resposta rápida, e é especialmente adequado às necessidades de integração de tecnologia de desenvolvedores e pesquisadores.
Lista de funções essenciais
- Suporte a vários idiomasInglês: no momento, há suporte para o inglês, com francês, japonês, coreano e chinês a serem expandidos no futuro.
- Diversidade de vozesOferece uma ampla seleção de tons, incluindo um modo de sussurro exclusivo (para cenários especiais)
- Motor de alto desempenhoGeração de fala quase em tempo real possível em dispositivos com chip macOS M1
- Instalação leveO pacote de instalação tem apenas 80 MB após a quantificação, e a versão completa tem cerca de 300 MB.
Características técnicas
O projeto usa licenças duplas Apache 2.0/MIT, e sua arquitetura ONNX se beneficia da compatibilidade entre plataformas e dos recursos de aceleração de hardware, com menor uso de recursos e velocidades de inferência mais rápidas do que as ferramentas TTS tradicionais.
Essa resposta foi extraída do artigoKokoro-ONNX: ferramenta eficiente de conversão de texto em fala com suporte a vários idiomas e várias vozesO





























