低配设备性能优化方案
针对8GB以下内存设备,可通过三重优化保证流畅运行:
1. 资源配置策略
- 强制使用轻量模型:
export FAST_LLM="gemini-lite"
- 关闭非必需组件:
export USE_LLM_COMPRESSOR="FALSE"
- 限制并发请求:
export MAX_CONCURRENT=2
2. 运行参数调优
- 缩短超时时间:
设置SEARCH_PROCESS_TIMEOUT=120
(单位:秒) - 启用结果缓存:
创建cache/
目录并添加export USE_CACHE=TRUE
- 精简输出内容:
添加命令行参数--compact
减少详情输出
3. Docker专项优化
修改docker-compose.yml
:
- 为每个服务添加资源限制:
deploy: resources: limits: memory: 2GB cpus: "0.5"
- 使用
--no-gpu
参数启动 - 关闭前端热更新:
npm run build --production
实测数据:经过优化后,4GB内存设备可稳定处理5个并发搜索任务。
本答案来源于文章《II-Researcher:深度搜索与分步推理解答复杂问题》