小样本训练解决方案
利用项目内置的三种应对策略:
- 数据增强:在SFT阶段启用
--augmentation mixup
参数进行语义扩展 - 迁移学习:訓練済みモデルの読み込み
--model_name_or_path Qwen/Qwen2.5-1.5B-Instruct
- 课程学习:ある
curriculum_learning.yaml
配置难度递增的任务序列
注意事项:建议初始阶段设置--batch_size 8
避免显存溢出,同时启用--use_peft
参数进行轻量化微调。可复用GAIA基准中的通用轨迹数据作为辅助训练集。
この答えは記事から得たものである。OpenManus-RL: 大規模モデルの微調整による知的身体推論と意思決定の強化について