使用Dolphin进行语音转文本的命令行操作包含多种场景:
- conversão de base::
dolphin audio.wav
(自动下载默认模型处理WAV格式文件) - conversão de formato:非WAV文件需通过FFmpeg预处理:
ffmpeg -i input.mp3 output.wav
- Seleção de modelos::
--model small --model_dir /data/models/dolphin/
指定小模型及其路径 - 方言识别:通过双层标记指定语言和地区,如中文普通话:
--lang_sym "zh" --region_sym "CN"
- 短音频处理:30秒内音频需启用填充:
--padding_speech true
典型用例流程:
- 将会议录音MP3转换为WAV格式
- realizar
dolphin meeting.wav --model small --lang_sym "ja" --region_sym "JP"
处理日语内容 - 输出结果将包含时间戳化文本和语言标识符
Essa resposta foi extraída do artigoDolphin: reconhecimento de idiomas asiáticos e modelagem de fala para texto para idiomas asiáticosO