As interfaces de API duplas fornecidas pelo projeto oferecem suporte a várias opções de integração:
- API REST padrão: através de
/tts
A interface recebe uma solicitação no formato JSON (parâmetro de texto/voz) e retorna um fluxo de áudio WAV. - Interface compatível com OpenAI::
/v1/audio/speech
Totalmente compatível com a especificação da API OpenAI TTS, alternativa aos serviços oficiais
Etapas específicas de implementação:
- Habilitação em config.yaml
api_key
A autenticação garante a segurança - Código de amostra usando o módulo de solicitações do Python:
response = requests.post('http://localhost:8005/v1/audio/speech', json={'input':'文本内容','voice':'female1'})
- configurar
timeout=30
Como lidar com a geração de textos longos
A fase de teste pode ser feita por meio da documentação do Swagger (http://localhost:8005/docs
) Verificação rápida dos parâmetros da interface.
Essa resposta foi extraída do artigoKitten-TTS-Server: um serviço de conversão de texto em fala leve e autoimplantávelO