高性能容器部署调优指南
针对Docker/K8s环境,可通过以下手段提升性能:
- 资源配置:修改docker-compose.prod.yml中的资源限制,建议:
- API容器:4CPU/8GB内存
- 向量数据库:独立容器,16GB+内存
- Redis:启用持久化并分配2CPU/4GB内存
- 索引优化:调整QDRANT__PERFORMANCE__INDEXING_THRESHOLD参数控制内存与CPU平衡
- 缓存策略:在API层增加REDIS_CACHE_TTL(建议300秒),对高频查询结果缓存
- Horizontal expansion:K8s部署时,为api_server配置HPA,基于CPU使用率(60%)自动扩容
监控方案:
- 集成Prometheus监控关键指标:文档处理延迟、搜索命中率、LLM响应时间
- 对10万+文档场景,建议将PostgreSQL与向量数据库分离部署
- 定期执行docker system prune清理无用镜像释放资源
This answer comes from the articleOnyx: an intelligent AI chat platform that connects enterprise knowledge basesThe