海外访问:www.kdjingpai.com
Ctrl + D 收藏本站
当前位置:首页 » AI答疑

Yek如何智能识别需要处理的重要文件?有哪些过滤机制?

2025-09-10 1.8 K

文件筛选原理

Yek采用多层过滤机制确保处理高价值的文本内容:

  • 基础过滤
    • 严格执行.gitignore规则
    • 自动跳过二进制文件(通过内容检测)
    • 排除过大文件(默认阈值可配置)
  • 高级筛选
    • 分析Git提交频率识别核心文件
    • 结合最近修改时间判断文件活跃度
    • 支持通过yek.toml配置文件扩展过滤规则

该设计既保证了处理效率,又能聚焦对LLM训练最具价值的源代码和文档资源。

相关推荐

找不到AI工具?在这试试!

输入关键词,即可 无障碍访问 必应 搜索,快速找到本站所有 AI 工具。

回顶部

zh_CN简体中文