Background to the issue
为AI/ML模型提供完整代码上下文时,人工收集样本常出现文件遗漏或结构混乱的情况,影响模型分析效果。
operating scheme
CodeWeaver提供完整的解决方案:
- 全量收录::
- fulfillment
./codeweaver -ignore=""
取消默认过滤 - probe
-included-paths-file
生成的文件确保覆盖全部路径
- fulfillment
- Structural reservations::
- 自动生成的Markdown会保持原始目录层级
- 文件内容以代码块形式原样保留
- version control:建议组合Git命令
git ls-files | xargs codeweaver
确保与版本库完全同步
best practice
推荐采用流水线处理:
- expense or outlay
-excluded-paths-file
记录排除项 - 对生成的codebase.md进行MD5校验
- 通过CI工具定期自动更新文档
This answer comes from the articleCodeWeaver: Automatically generate Markdown documents from code structure and content.The