Manual de solução de problemas de anomalias de áudio
Quando o áudio de saída contiver estalos ou ruídos, as etapas a seguir devem ser seguidas:
- Verificação da taxa de amostragemVerifique se o parâmetro de taxa de amostragem do audiofile.write é exatamente igual ao valor de 22050Hz definido pelo modelo
- Verificação da normalização dos dadosExecutar áudio = mx.clip(audio, -0.99, 0.99) antes de salvar o áudio para evitar o estouro da amplitude
- Ajuste do parâmetro de temperaturaSe o valor de temperatura for muito alto, isso levará à instabilidade; recomenda-se reduzir gradualmente o valor de 0,7 para 0,3 para testar o efeito.
- Remoção de interferência ambientalFeche outros aplicativos de áudio antes de executá-los para descartar conflitos de amostragem no nível do sistema
Esquema de processamento profundo: use a biblioteca librosa para pós-processar o áudio gerado, aplique o limitador e a filtragem de porta de ruído; o código de amostra pode ser consultado em librosa.effects.preemphasis.
Essa resposta foi extraída do artigocsm-mlx: modelo de geração de fala csm para dispositivos AppleO































