A geração de fala em chinês usando o Orpheus-TTS pode ser dividida em quatro etapas principais:
- Preparação ambientalInstalação: instale o Python 3.8-3.11, recomende uma GPU Nvidia (≥12 GB de memória de vídeo) e configure o ambiente CUDA.
- Instalação dos componentes principais::
Instale as dependências da versão estável via pip:pip install orpheus-speech vllm==0.7.3 transformers - Download de modelos chineses::
Obtenha modelos multilíngues do Hugging Face:huggingface-cli download canopylabs/orpheus-multilingual-research-release - Gerar discurso::
Chamado usando script Python (observe que os chineses precisam especificar funções de caracteres chineses):from orpheus_tts import OrpheusModel
model = OrpheusModel(model_name="canopylabs/orpheus-multilingual-research-release")
audio = model.generate_speech("zh_char: 欢迎使用中文语音合成系统")
Observação: o suporte ao chinês requer o carregamento de um pacote de modelo multilíngue; se encontrar erros no vLLM, tente fazer o downgrade para a versão 0.7.1; a primeira execução requer o download de um arquivo de modelo de cerca de 5 GB.
Essa resposta foi extraída do artigoOrpheus-TTS: uma ferramenta de conversão de texto em fala para gerar fala natural em chinêsO
































