PengChengStarling简介
PengChengStarling是鹏城实验室开发的一款多语言自动语音识别(ASR)工具。它基于icefall项目构建,提供了完整的语音识别流程,能够将不同语言的语音转换为对应的文本。
core functionality
- Multi-language support:支持中文、英语、俄语、越南语、日语、泰语、印尼语和阿拉伯语共8种语言的语音识别
- 流式识别:支持实时语音识别,可以边说边识别
- Efficient Reasoning:模型大小仅为Whisper-Large v3的20%,推理速度快7倍
- 完整流程:包含数据处理、模型训练、推理、微调和部署全流程
application scenario
- 国际会议录音实时转写
- 多语言视频自动字幕生成
- 跨语言客服系统
- 语音助手和翻译工具开发
This answer comes from the articlePengChengStarling: Smaller and Faster Multilingual Speech-to-Text Tool than Whisper-Large v3The