启用步骤详解
- 登录chatgpt.com或移动端APP后,点击工具栏中的‘Agent模式’切换按钮
- 在聊天框输入
"请用视觉浏览器查找..."
或直接描述网页操作需求 - 首次使用需授予浏览器控件权限(仅限会话期间)
支持的网页操作类型
操作类别 | 示例指令 | 适用场景 |
---|---|---|
基础导航 | “打开维基百科AI词条” | 信息查询 |
表单填写 | “在亚马逊注册页面输入我的收货地址” | 电商操作 |
内容筛选 | “找出TripAdvisor评分4.5+的东京酒店” | 旅行规划 |
数据抓取 | “提取纳斯达克Top10公司今日股价” | 金融分析 |
特殊注意事项
对需要登录的网站(如银行账户),系统会主动暂停并提示用户手动认证,整个过程采用端到端加密,不会存储任何账户凭证。
本答案来源于文章《ChatGPT Agent:通过语音和文字操作网站与分析数据的智能助手》