FireRedASR使用方法
FireRedASR提供命令行和Python API两种使用方式,满足不同用户需求。
1. Command-line operations
最简单的使用方式,适合快速测试和简单任务:
单文件转录(AED模型):python speech2text.py --wav_path 音频路径 --asr_type "aed" --model_dir 模型目录
单文件转录(LLM模型):python speech2text.py --wav_path 音频路径 --asr_type "llm" --model_dir 模型目录
2. Python API操作
适合开发者集成到项目中:
from fireredasr.models.fireredasr import FireRedAsr
model = FireRedAsr.from_pretrained("aed", "pretrained_models/FireRedASR-AED-L")
results = model.transcribe(["音频ID"], ["音频路径"], {"use_gpu":1})
参数调整建议
- use_gpu:1启用GPU加速
- beam_size:增大可提高准确率但降低速度
- nbest:返回多个候选结果
Attention:AED模型最长支持60秒音频,LLM模型最长支持30秒。
This answer comes from the articleFireRedASR: An Open Source Model for Multilingual High-Precision Speech RecognitionThe