A solução de execução em nuvem modal resolve principalmente o problema de hardware local insuficiente, e suas principais vantagens são mostradas a seguir:
Comparação dos principais pontos fortes:
- independente de hardwareNão é necessário ter uma placa de vídeo local de alto desempenho; chame diretamente os recursos de GPU da nuvem
- Mais rápidoPlacas de vídeo de nível profissional normalmente têm velocidades de processamento melhores do que os dispositivos de nível de consumidor
- Simplificação ambientalNão há necessidade de instalar drivers complexos, como o CUDA
Etapas de configuração:
- Instale o cliente Modal:
pip install modal - Obter um token de conta:
modal token new(Siga as orientações para fazer login/registro) - modificações
modal_voice_cloning.pyDocumentação:- configurar
context_audio_pathetc. (igual à execução local) - Certifique-se de que o token Hugging Face esteja configurado corretamente
- configurar
- Iniciar a tarefa:
modal run modal_voice_cloning.py
Após a conclusão do processamento na nuvem, o arquivo de saída é automaticamente baixado localmente. Observe que o Modal tem uma quantidade limitada de créditos gratuitos, e uma assinatura paga pode ser necessária para uso com alta frequência.
Essa resposta foi extraída do artigoClonagem de voz CSM: clonagem rápida de voz com o CSM-1BO































