Magentic-UI 采用模块化设计,包含三类核心功能代理:
- WebSurfer 代理:负责网页自动化操作,支持点击按钮、填写表单、上传文件等交互行为。它能深层导航网站结构,处理需要多步骤操作的网页任务。
- Coder 代理:专门执行编程任务,可在 Docker 容器中安全运行 Python 和 Shell 代码。适用于数据爬取、转换和分析场景,如从网页提取数据生成可视化图表。
- FileSurfer 代理:管理本地文件系统,能够查找、读取项目文件,并将其转换为 Markdown 格式。还能分析文件内容,回答用户关于文件的特定问题。
这三个代理通过协作机制共同工作:WebSurfer 获取网页数据后,可能交由 Coder 进行处理和分析,最终结果由 FileSurfer 存储或进一步处理。用户可以随时查看各代理的操作记录,确保任务执行符合预期。
Essa resposta foi extraída do artigoMagentic-UI: uma ferramenta de agente inteligente para apoiar a colaboração do usuário em tarefas da WebO