Universal-2模型的全面升级
AssemblyAI Universal-2是该平台最新发布的语音转文字旗舰模型,基于前代Universal-1的重大改进。其核心突破体现在:
- 训练数据规模:模型训练采用超过1250万小时的多语言音频数据,覆盖更广泛的场景和口音
- 识别精准度:专有名词(如人名、品牌名)识别准确率提升24%,数字字母混合内容(如订单号、邮箱)准确率提高21%
- 文本结构化:自动标点、大小写等文本格式化功能改进15%,显著减少后期人工修正需求
这些改进使Universal-2特别擅长处理真实场景中的复杂对话,有效解决了传统语音模型在’最后一英里’(即细微差异识别)的瓶颈问题。
本答案来源于文章《AssemblyAI:高精度语音转文字与音频智能分析平台》