O Kokoro-ONNX é um mecanismo de conversão de texto em fala (TTS) de código aberto baseado no ONNX Runtime, criado pelo desenvolvedor thewh1teagle. O ONNX Runtime é um mecanismo de inferência de alto desempenho e multiplataforma com suporte para vários aceleradores de hardware. Como um projeto de código aberto, o Kokoro-ONNX segue as licenças duplas MIT e Apache 2.0, garantindo a flexibilidade de uso e a viabilidade de aplicativos comerciais.
A ferramenta foi projetada para destacar a alta eficiência, que se reflete principalmente em três aspectos: em primeiro lugar, sua velocidade de inferência é rápida e pode alcançar um desempenho quase em tempo real em dispositivos macOS M1; em segundo lugar, o tamanho do pacote de instalação é leve, com a versão padrão de cerca de 300 MB e quantificada em apenas 80 MB; e, por último, ela aproveita ao máximo as vantagens de plataforma cruzada do ONNX Runtime e pode ser bem adaptada aos ambientes de diferentes sistemas operacionais. Por fim, ele aproveita ao máximo as vantagens de plataforma cruzada do ONNX Runtime e pode ser bem adaptado a diferentes sistemas operacionais.
A natureza de código aberto, aliada ao desempenho eficiente do tempo de execução, faz do Kokoro-ONNX a escolha ideal para soluções TTS em pesquisas e aplicações do mundo real.
Essa resposta foi extraída do artigoKokoro-ONNX: ferramenta eficiente de conversão de texto em fala com suporte a vários idiomas e várias vozesO































