通过以下高级配置可优化模型性能:
- 提示优化循环:增加
-r
参数值(默认1次)能提升合成数据质量,例如-r 3
会进行三轮优化,但会延长训练时间。 - 边缘案例生成:默认开启的
--generate-edge-cases
功能会为每类生成50条复杂样本(如含拼写错误的评论),增强模型鲁棒性。 - 数据量调整:通过
--target-volume-per-class
增加单类样本数量(如设为100条),但需平衡训练效率。 - 模型选择:在配置文件中可指定不同的基础LLM(如Grok-3-beta),影响生成数据的多样性。
工具还会输出详细训练日志(如准确率、损失值),帮助开发者针对性调整参数。若效果不理想,建议通过GitHub社区讨论具体案例。
本答案来源于文章《WhiteLightning:一键生成轻量级离线文本分类模型的开源工具》