当前位置：首页 » AI答疑

怎样解决技术文章文本转音频后的专业术语发音问题？

2025-08-24

1.3 K

链接直达 

问题背景

科技类文章常包含编程术语（如Kubernetes）、数学符号等特殊内容，常规TTS引擎容易出现误读。Audibit通过双重技术方案确保发音准确性。

预处理阶段：
1. 在OpenAI API调用前添加术语替换规则（编辑src/utils/textProcessor.js）
2. 对代码片段启用<code>标签隔离处理
引擎选择：
- 技术类内容优先使用Lemonfox的『学术语音库』
- 普通内容采用OpenAI的whisper-large模型

建立自定义术语库（存放于public/glossary.json），社区用户可通过Pull Request补充新术语。对于持续出现的专业词汇，建议：

遇到即时性问题时，可暂时用拼音注释法（如@pragma→[praegma]）临时解决。