Etapas de implementação
- Armazém de Clonagem:
git clone https://github.com/MoonshotAI/Kimi-Audio.git
cd Kimi-Audio
git submodule update --init --recursive - Instale a dependência: Ambiente recomendado para Python 3.10
pip install -r requirements.txt - Crie a imagem do Docker:
docker build -t kimi-audio:v0.1 .ou usar espelhos predefinidos
docker pull moonshotai/kimi-audio:v0.1
Requisitos ambientais
- Hardware: Recomenda-se um mínimo de 16 GB de memória de GPU
- Formato de áudio: O áudio de entrada deve estar no formato WAV com taxa de amostragem de 16kHz.
- Sistema operacional: Sistemas Linux recomendados
- Suporte acelerado: É necessário o CUDA 12.4 ou superior.
As implementações que não são do Docker exigem a instalação manual das dependências do sistema, conforme descrito na documentação do GitHub.
Essa resposta foi extraída do artigoKimi-Audio: processamento de áudio de código aberto e modelo de base de diálogoO































