使用Dolphin进行语音转文本的命令行操作包含多种场景:
- 基础转换::
dolphin audio.wav
(自动下载默认模型处理WAV格式文件) - Formatkonvertierung:非WAV文件需通过FFmpeg预处理:
ffmpeg -i input.mp3 output.wav
- Auswahl des Modells::
--model small --model_dir /data/models/dolphin/
指定小模型及其路径 - Dialekterkennung:通过双层标记指定语言和地区,如中文普通话:
--lang_sym "zh" --region_sym "CN"
- 短音频处理:30秒内音频需启用填充:
--padding_speech true
典型用例流程:
- 将会议录音MP3转换为WAV格式
- vollziehen
dolphin meeting.wav --model small --lang_sym "ja" --region_sym "JP"
处理日语内容 - 输出结果将包含时间戳化文本和语言标识符
Diese Antwort stammt aus dem ArtikelDolphin: Asiatische Spracherkennung und Speech-to-Text-Modelle für asiatische SprachenDie