LiberSonoraを使ってオーディオブックの字幕を抽出する手順は以下の通りです:
- 環境準備GitとPython 3.8+がインストールされていることを確認してください。
pip install -r requirements.txt依存関係のインストール - ツールへのアクセス使用
git cloneコマンドでプロジェクトのリポジトリをローカルにクローンする - オーディオの準備処理する音声ファイルを指定されたディレクトリに置く。
./audio_files) - 撤退を実行する実行コマンド
python extract_subtitles.py --input_dir ./audio_files --output_dir ./subtitles
実行後、システムは
- 音声中の発話内容の自動認識
- 音声タイムラインに基づいて字幕ファイルを生成する
- 指定した出力ディレクトリに結果を保存
心に留めておくべきことがある:
- このプロジェクトはGPUアクセラレーションをサポートしています。
- 処理時間はオーディオの長さとハードウェアの性能に依存
- 認識結果は言語によって異なる場合があります。
この答えは記事から得たものである。LiberSonora:オーディオブック字幕抽出と多言語翻訳、オーディオブックの多言語書き起こしについて































