ChatGPT Agent 是 OpenAI 推出的一款智能工具,整合了网站操作、数据分析和对话能力。它通过语音或文字指令,帮助用户完成复杂电脑任务,如浏览网页、填写表单、分析数据或生成幻灯片。Agent 结合了 Operator 的网站操作能力和 Deep Research 的信息分析功能,在虚拟电脑环境中运行,确保高效执行任务。用户可随时控制任务进程,中断或调整方向。它支持安全登录和 API 数据获取,适合个人和企业处理日常工作。目前仅限 Pro、Plus 和 Team 用户使用,Enterprise 和 Education 用户将在 2025 年 7 月开放。
功能列表
- 智能浏览网站:点击链接、填写表单、筛选内容,获取精准信息。
- 数据分析与处理:运行代码,分析财务或市场数据,生成报表。
- 文件生成:创建可编辑的幻灯片和表格,适合演示或数据整理。
- API 快速连接:获取实时财经数据、体育比分等。
- 安全登录:支持访问需认证的网站,保护用户隐私。
- 任务自动化:执行多步骤任务,如日程安排、购物或研究。
- 语音与文字交互:通过对话或指令控制任务执行。
- 动态工具切换:根据任务需求选择最佳工具,提升效率。
使用帮助
安装与使用方式
ChatGPT Agent 无需独立安装,直接通过 OpenAI 官网(chatgpt.com)或 ChatGPT 移动应用(iOS 和 Android)访问。用户需注册 OpenAI 账户并订阅 Pro、Plus 或 Team 计划。登录后,在聊天界面点击工具下拉菜单,选择“Agent 模式”即可启动。Enterprise 和 Education 用户需等待 2025 年 7 月开放,具体时间请关注 OpenAI 官方公告。
功能操作流程
1. 启动 Agent 模式
登录 chatgpt.com 或移动端应用,进入聊天界面,点击工具栏中的“Agent 模式”。界面将切换到智能体工作环境,准备接受语音或文字指令。用户可输入任务,如“分析三家竞争对手并生成幻灯片”或“查看我的日历并总结会议内容”。
2. 智能浏览网站
Agent 提供视觉浏览器和文字浏览器两种工具。视觉浏览器模拟人类操作,可点击网页链接、填写表单或筛选内容。例如,输入“在亚马逊购买四人份早餐食材”,Agent 会浏览购物网站,筛选商品并提示用户安全登录以完成购买。文字浏览器适合快速查询,如获取实时股票价格或体育比分,效率更高。Agent 会根据任务自动选择适合的工具。
3. 数据分析与文件生成
Agent 支持复杂数据处理。用户输入“分析 Nvidia 第一季度财报并生成幻灯片”后,Agent 通过 API 或网页获取数据,运行代码生成分析结果,并输出 PowerPoint 幻灯片或 Excel 表格。生成文件可下载编辑,适合工作汇报。用户可随时查看进度,输入“添加图表”或“调整格式”优化结果。目前幻灯片功能处于 Beta 阶段,格式可能稍显简单,但元素可编辑,支持灵活调整。
4. 安全交互与用户控制
Agent 在访问需认证的网站(如 Gmail、GitHub)时,会提示用户接管浏览器并登录,确保数据安全。用户可随时中断任务,输入“暂停,检查进度”以查看当前结果,或提供更具体指令调整方向。例如,“从我的 Google Drive 获取文件并整理成表格”会触发 Agent 调用 API 完成任务。任务完成后,用户可保存结果或继续优化。
5. 语音与文字指令
Agent 支持语音输入,适合移动端用户。在 ChatGPT 应用中,启用语音模式,说出任务如“规划周末约会”,Agent 会搜索餐厅或活动信息,生成行程建议。文字输入适合复杂任务,指令越详细,结果越精准。例如,“分析三家公司的市场份额并生成柱状图”会触发数据分析和图表生成。
6. 动态工具切换
Agent 可在任务中动态切换工具。例如,规划旅行时,它可能先通过 API 获取航班信息,再用视觉浏览器浏览酒店网站,最后生成行程表格。这种灵活性确保任务高效完成,减少手动操作。
7. 连接器与外部整合
Agent 支持 OpenAI 连接器,安全访问用户数据,如 Google Drive 文件或日历信息。用户需授权唯读连接器,Agent 才能查看数据并执行任务,如“归纳收件箱邮件”或“查找空闲会议时间”。连接器确保数据安全,操作透明。
使用注意事项
- 指令清晰:提供具体任务描述,如“分析苹果、谷歌、三星的市场数据并生成幻灯片”比“分析竞争对手”更有效。
- 网络稳定:Agent 需稳定网络连接以访问网站或 API。
- 限额管理:Pro 用户每月 400 次指令,Plus 和 Team 用户 50 次,超出限额可加购额度。
- 隐私保护:Agent 不存储用户密码,敏感操作需手动登录。用户可在设置中删除浏览数据,登出所有网站会话。
- Beta 限制:幻灯片生成处于 Beta 阶段,格式可能不够精美,未来将优化。
示例操作
任务 1:生成竞争对手分析幻灯片
- 登录 chatgpt.com,进入 Agent 模式。
- 输入:“分析苹果、谷歌、三星的市场数据,生成幻灯片。”
- Agent 通过 API 和网页获取数据,可能提示用户登录以访问付费内容。
- Agent 运行分析,生成包含图表和文字的幻灯片,下载链接显示在界面。
- 用户可输入“添加更多图表”或“调整格式”优化结果。
任务 2:规划日程
- 输入:“查看我的 Google 日历,总结下周会议。”
- Agent 提示用户登录 Google 账户,获取日历数据。
- Agent 分析会议内容,结合新闻生成摘要,如“周一讨论新产品发布”。
- 用户可要求 Agent 安排回复邮件或调整日程。
应用场景
- 企业数据分析
分析师需快速生成竞争对手报告。Agent 可浏览市场数据网站,运行分析代码,生成包含图表的幻灯片,节省手动整理时间。 - 日常任务自动化
个人用户想购买食材或规划旅行。Agent 搜索购物或旅行网站,筛选最佳选项,提示用户确认购买,简化流程。 - 学术研究支持
学生需收集论文或新闻数据。Agent 访问学术网站,整理信息,生成总结表格或报告,适合快速完成研究。 - 编程与项目管理
开发者需调试代码或整理项目文件。Agent 通过 GitHub API 获取代码,运行命令,生成文档或分析结果。
QA
- ChatGPT Agent 是否免费?
仅限 Pro、Plus 和 Team 用户使用,免费用户无法访问。Pro 用户每月 400 次指令,Plus 和 Team 用户 50 次,可加购额度。 - 如何确保数据安全?
Agent 不存储用户密码,敏感操作需手动登录。用户可随时删除浏览数据,登出所有会话。任务执行遵循 OpenAI 安全政策。 - Agent 能处理多复杂任务?
Agent 可处理多步骤任务,如数据收集、分析和文件生成。它动态选择工具,适合简单查询到深入研究的需求。 - 语音模式如何使用?
在 ChatGPT 移动端应用启用语音输入,描述任务即可。Agent 根据语音指令执行操作,适合移动场景。 - 幻灯片生成有何限制?
目前处于 Beta 阶段,格式可能简单,但支持可编辑元素。未来将优化输出精美度和功能。