OpenAgents 是一个开源平台,旨在让用户通过自然语言与智能体互动,完成数据分析、插件调用和网页浏览等任务。它由香港大学 XLANG NLP 实验室开发,包含三个核心智能体:数据智能体、插件智能体和网页智能体。平台提供直观的网页界面,方便普通用户快速上手,同时支持开发者和研究人员在本地部署,助力创新语言智能体的开发。OpenAgents 强调开源和社区协作,鼓励用户贡献代码和反馈,以推动语言智能体在现实世界的应用。项目代码托管在 GitHub,文档详细,部署流程清晰,适合广泛用户群体。
功能列表
- 数据智能体:支持使用 Python 和 SQL 进行数据分析,生成图表和报告。
- 插件智能体:集成超过 200 个第三方插件,覆盖日常任务如天气查询、在线购物等。
- 网页智能体:实现自主网页浏览,执行搜索和信息提取任务。
- 网页界面:提供聊天式交互界面,优化快速响应和错误处理。
- 本地部署:支持通过 Docker 或源码在本地搭建,适合开发和研究。
- 社区贡献:开放代码和文档,鼓励用户提交问题和代码改进。
- 多语言支持:提供中文、英文、韩文、日文等文档,方便全球用户。
使用帮助
安装与部署
OpenAgents 支持通过 Docker 或源码部署在本地。以下是详细的安装和使用流程:
1. 使用 Docker 部署
Docker 部署适合快速搭建测试环境,但可能存在功能不稳定或响应较慢的情况。推荐有经验的用户直接从源码部署以获得更稳定的体验。
步骤:
- 安装 Docker:确保系统中已安装 Docker 和 Docker Compose。如果需要 GPU 支持,需额外安装 Nvidia Container Toolkit。
- 克隆代码库:
git clone https://github.com/xlang-ai/OpenAgents.git cd OpenAgents
- 配置环境:编辑
docker-compose.yml
文件。如果使用 OpenAI API,需在文件中设置OPENAI_API_KEY
。若使用其他服务(如 FastChat),需修改OPENAI_API_BASE
。 - 启用 GPU(可选):取消
docker-compose.yml
中第 56-62 行的注释以启用 GPU 支持。 - 构建并启动服务:
docker compose build docker compose up -d
- 访问服务:服务启动后,通过浏览器访问
http://localhost:8000
进入网页界面。 - 注意事项:若使用 Kaggle 数据集,需修改
Dockerfile
中的相关信息。如果遇到网络问题(如 Hugging Face 权重文件下载超时),需自行解决。
2. 从源码部署
源码部署更稳定,适合需要定制或开发的用户。
步骤:
- 安装依赖:确保系统已安装 Python 3.8+ 和 Node.js。
- 克隆代码库:同 Docker 部署中的克隆步骤。
- 安装后端依赖:
cd backend pip install -r requirements.txt
- 安装前端依赖:
cd frontend npm install
- 配置后端:在
backend
目录下设置环境变量,例如OPENAI_API_KEY
。 - 启动后端:
python main.py
- 启动前端:
cd frontend npm run dev
- 访问服务:前端默认运行在
http://localhost:3000
,后端运行在http://localhost:8000
。
3. 使用 OpenAgents 功能
OpenAgents 的核心功能通过网页界面操作,界面设计直观,类似聊天应用。以下是各智能体的操作方法:
数据智能体:
- 功能:处理数据分析任务,支持 Python 和 SQL 代码生成与执行。
- 操作流程:
- 打开网页界面,选择“数据智能体”。
- 在聊天框输入任务,例如“分析 sales_data.csv 文件,生成销售趋势图”。
- 智能体会自动生成代码并执行,输出结果(如图表或报告)显示在界面。
- 可下载结果或继续修改任务要求。
- 注意:上传的数据文件需符合 CSV、JSON 等格式,文件路径需正确配置。
插件智能体:
- 功能:集成 200 多个插件,支持天气查询、在线购物、科学计算等。
- 操作流程:
- 在网页界面选择“插件智能体”。
- 输入任务,例如“查询上海明天天气”或“帮我搜索最新款手机”。
- 智能体调用相关插件,实时返回结果。
- 支持多个插件同时使用,例如“计划一次北京到上海的旅行”会调用天气、票务等插件。
- 注意:部分插件可能需要额外 API 密钥,需在后端配置。
网页智能体:
- 功能:自主浏览网页,执行搜索、提取信息等任务。
- 操作流程:
- 选择“网页智能体”,输入任务,如“搜索 AI 会议的最新消息”。
- 智能体自动打开浏览器,执行搜索并提取关键信息。
- 结果以文本或链接形式返回。
- 注意:网络连接需稳定,部分网站可能因限制无法访问。
4. 社区支持与问题反馈
- 文档查阅:详细文档位于
https://github.com/xlang-ai/OpenAgents
,包括概念、设计和用例。 - 问题反馈:在 GitHub 提交 issue,遵循
CONTRIBUTING.md
指南。 - 社区交流:加入 Discord 社区获取实时帮助。
5. 开发与扩展
开发者可通过以下步骤扩展 OpenAgents:
- 添加新智能体:在
frontend/types/agent.ts
中定义新智能体 ID,更新frontend/utils/app/api.ts
和const.ts
。 - 支持新数据类型:在
backend/display_streaming.py
中添加解析逻辑。 - 集成新 LLM:在
backend/api/language_model.py
注册新模型,参考lemur-chat
模板。
应用场景
- 数据分析
营销人员可上传销售数据,快速生成趋势图表,节省手动分析时间。 - 日常任务管理
用户通过插件智能体查询天气、预订机票或管理日程,提高效率。 - 信息检索
研究人员使用网页智能体搜索学术会议信息,自动整理关键内容。 - 开发测试
开发者在本地部署 OpenAgents,测试新智能体或插件的集成效果。
QA
- OpenAgents 支持哪些语言?
平台提供中文、英文、韩文、日文等多语言文档,界面支持英文和中文。 - 是否需要编程基础?
普通用户无需编程,通过网页界面即可操作;开发者需了解 Python 和 JavaScript 进行部署或扩展。 - 部署需要多长时间?
Docker 部署约 10-20 分钟,源码部署约 30 分钟,视硬件和网络条件而定。 - 遇到部署问题怎么办?
检查docker-compose.yml
配置,参考 GitHub 文档,或在 Discord 寻求帮助。 - 是否支持移动端?
当前主要为网页端,移动端支持正在开发中,可通过浏览器访问。