Solution Overview
要解决大语言模型无法直接处理大型代码库的痛点,可以通过code2prompt工具的转换功能实现。以下为具体步骤:
- mounting tool:先通过Rust环境编译安装或直接下载预编译二进制文件,确保全局可用
- base conversion: Run
code2prompt /path/to/codebase
生成包含源代码树和所有文件内容的Markdown格式输出 - 上下文控制: Use
--tokens -c cl100k
参数统计token数,确保符合模型限制 - 分模块处理: By
--include
参数分批次转换大型项目
进阶优化方案
对于超大型项目:
- adoption
--exclude
过滤测试文件等非核心代码 - become man and wife
--diff
参数仅转换变更部分 - pass (a bill or inspection etc)
-o output.md
分段保存不同模块的输出
This answer comes from the articlecode2prompt: converting code libraries into big-model comprehensible prompt filesThe