使用Dolphin进行语音转文本的命令行操作包含多种场景:
- ベース変換::
dolphin audio.wav
(自动下载默认模型处理WAV格式文件) - フォーマット変換:非WAV文件需通过FFmpeg预处理:
ffmpeg -i input.mp3 output.wav
- モデルの選択::
--model small --model_dir /data/models/dolphin/
指定小模型及其路径 - 方言识别:通过双层标记指定语言和地区,如中文普通话:
--lang_sym "zh" --region_sym "CN"
- 短音频处理:30秒内音频需启用填充:
--padding_speech true
典型用例流程:
- 将会议录音MP3转换为WAV格式
- はこびだす
dolphin meeting.wav --model small --lang_sym "ja" --region_sym "JP"
处理日语内容 - 输出结果将包含时间戳化文本和语言标识符
この答えは記事から得たものである。ドルフィン:アジア言語認識とアジア言語のための音声テキストモデルについて