Etapas de instalação
- Clonagem do Project Warehouse:
git clone https://github.com/yangb05/PengChengStarling cd PengChengStarling - Instale a dependência:
pip install -r requirements.txt export PYTHONPATH=/tmp/PengChengStarling:$PYTHONPATH
Processo de uso
Preparação de dados
Execute o script prepare.py para adaptar o formato de dados e gerar o arquivo data.list e os recursos associados.
treinamento de modelos
- Configure os parâmetros no diretório config_train
- Execução de comandos de treinamento
./train.sh
reconhecimento de fala
- Preparar o arquivo de áudio para ser reconhecido
- estar em movimento
./eval.shinferência
Recomendações para o ajuste fino
Se houver necessidade de melhorar a precisão do reconhecimento em uma área específica:
- Dados relevantes na área de preparação
- realizar
./train.sh --finetuneajuste fino - Modelo ajustado e pronto para ser implantado
Essa resposta foi extraída do artigoPengChengStarling: ferramenta de conversão de fala em texto multilíngue menor e mais rápida que o Whisper-Large v3O































