Simba的config.yaml文件是系统的核心配置模块,主要包含以下可自定义的重要参数:
LLM相关配置:
- 模型提供方选择(OpenAI或Ollama)
- 指定使用模型(如gpt-4o)
- 生成参数设置(temperature、max_tokens等)
嵌入和检索配置:
- 嵌入模型选择(HuggingFace或OpenAI)
- 向量存储类型配置
- 分块参数调整(chunk_size和chunk_overlap)
路径配置:
- 项目基本目录
- Markdown文档存储路径
- FAISS索引存储位置
功能开关:
- 解析器启用/禁用
- Celery任务系统配置
通过修改这些参数,用户可以完全控制系统的知识处理方式、使用的模型以及存储结构,满足不同场景下的需求。
Essa resposta foi extraída do artigoSimba: um sistema de gerenciamento de conhecimento para organizar documentos, perfeitamente integrado a qualquer sistema RAG.O