O procedimento para extrair legendas de audiolivros por meio do LiberSonora é o seguinte:
- Preparação ambientalCertifique-se de que o Git e o Python 3.8+ estejam instalados, executando
pip install -r requirements.txtInstalação de dependências - Acesso a ferramentas: Uso
git clonepara clonar o repositório do projeto localmente - Preparação de áudioColocar os arquivos de áudio a serem processados no diretório especificado (por exemplo
./audio_files) - executar uma retiradaExecutar comando
python extract_subtitles.py --input_dir ./audio_files --output_dir ./subtitles
Após a execução, o sistema irá:
- Reconhecimento automático de conteúdo de fala em áudio
- Gerar arquivos de legenda com base na linha do tempo da voz
- Salvar o resultado no diretório de saída especificado
Algo para se ter em mente:
- Esse projeto é compatível com a aceleração de GPU, que pode ser ativada no arquivo de configuração
- O tempo de processamento depende da duração do áudio e do desempenho do hardware
- Os resultados de reconhecimento podem variar entre os idiomas
Essa resposta foi extraída do artigoLiberSonora: extração de legendas de audiolivros e tradução multilíngue, transcrição de audiolivros em vários idiomasO































