Agent TARS简介
Agent TARS是由字节跳动开源的一款多模态AI智能体,专门设计用于通过compreensão visualresponder cantando系统命令交互来操作电脑。
funcionalidade principal
- Automação do navegador:可自动完成搜索、点击、表单填写等网页操作
- Integração da linha de comando:直接运行系统命令和脚本
- operação do sistema de arquivos:读取、编辑和生成各类文件
- Planejamento inteligente de tarefas:将复杂任务分解为可执行步骤
- interação multimodal:支持图像、文字和代码多种输入方式
Características técnicas
基于UI-TARS Desktop进行浏览器封装,对标Manus系统,采用模型上下文协议(MCP)提升功能灵活性。
Essa resposta foi extraída do artigoAgente TARS: uma inteligência de código aberto que usa visão e comandos para operar computadoresO