热词库配置完全指南
文件结构说明
软件目录下包含三类热词文件:
- hot-zh.txt:中文术语库(基于拼音匹配)
- hot-en.txt:英文术语库(基于拼写匹配)
- hot-rule.txt:自定义替换规则
配置方法
- 中文热词:每行填写一个词语(如”卷积神经网络”)
- 英文热词:每行填写一个单词(如”ReLU”)
- 规则热词:使用等号格式(如”NLP = 自然语言处理”)
最佳实践建议
- 专业领域建议维护100-500个核心术语
- 中英文混用词优先放入hot-rule.txt(如”CNN = 卷积神经网络”)
- 定期更新热词库(客户端的动态加载无需重启)
- 复杂缩写建议同时配置大小写变体(如”AI”和”ai”)
实际测试表明,合理配置热词可使专业文本识别错误率降低60%以上,特别适合法律、医疗等专业领域使用。
本答案来源于文章《CapsWriter-Offline:PC端的语音输入和字幕转录工具》