
OpenAdapt: an open source tool for automated manipulation of computer applications using large models
OpenAdapt 是一款开源的软件工具,它将强大的大型多模态模型(LMMs)与电脑的图形用户界面(GUI)连接起来,旨在实现流程自动化。传统上,大量脑力劳动被浪费在重复性的电脑操作上,而OpenAdapt的目标就是解决这一问题。它的工作原...

Step AI desktop intelligences: desktop intelligences that use natural language to operate computers
阶跃AI桌面伙伴是一款运行在个人电脑操作系统上的人工智能助手,它能理解并执行用户的自然语言指令,以完成各项电脑操作。这款工具不局限于浏览器,可以直接与操作系统进行深度交互,管理本地文件、访问互联网并执行跨应用的任务。用户通过一个悬浮在桌面右...

Youtu-agent: a framework for AI intelligences that operate computers to automate tasks
Youtu-agent是腾讯优图实验室开发的一款功能强大且设计简洁的AI智能体框架。 它专门为构建、运行和评估自主AI智能体而设计,其核心特色是全面拥抱开源模型,不依赖任何闭源大模型即可实现优异的性能。 该框架经过了严格的基准测试验证,在使...

Ninja AI: Automating Browser Tasks with AI Intelligentsia
Ninja AI 是一款人工智能(AI)智能体,它可以在用户的浏览器中运行,用于自动执行各种在线任务。这个工具的设计目标是像一个忍者一样,悄无声息地处理那些需要在浏览器中完成的、重复性高或耗时的工作。用户可以通过下达指令,让 Ninja A...

Asteroid AI: Artificial Intelligence Browser Intelligence for Business Process Automation
Asteroid AI是一个人工智能浏览器自动化平台,主要功能是让用户可以快速构建“浏览器智能体”来代替人工自动执行重复性的网页操作。不管是技术开发者还是非技术背景的业务人员都可以使用这个工具。用户通过可视化界面,使用自然语言下达指令,就可...

AutoGLM: Using voice and text to operate intelligences to complete automated computer and cell phone operations
AutoGLM是智谱AI(ZhipuAI)公司开发的一款AI智能体应用。它不是一个简单的聊天机器人,而是一个可以实际操作的执行型助手。用户可以通过简单的自然语言指令,让AutoGLM在云端的虚拟电脑或手机上自主完成各种任务。比如,它能自动操...

Bytebot: Automating Desktop Tasks in Linux Containers with Natural Language
Bytebot 是一个开源的自托管 AI 桌面代理,运行在容器化的 Linux 环境中,通过自然语言指令自动化完成电脑任务。它模拟人类操作电脑的方式,使用键盘、鼠标和屏幕,执行网页浏览、数据处理、文件管理等任务。Bytebot 强调隐私和可...

Browserfly: the smart plugin that lets AI automate browsers
Browserfly 是一款AI驱动的浏览器插件,直接在用户现有浏览器中运行。它通过自然语言指令,让AI像人类一样操作网页,完成搜索、整理信息或管理标签页等任务。无需虚拟机或额外浏览器,安装后即可在Chrome或Edge上使用。Browse...

Eigent: an open source desktop application for automated multi-intelligence collaboration
Eigent 是全球首款多智能体协作桌面应用,基于 CAMEL-AI 开源项目开发,旨在帮助用户构建和管理 AI 智能体团队,自动化处理复杂任务。它支持本地部署和云端运行,提供高度可定制的工具集成和数据隐私保护。Eigent 通过并行执行任...

CopyCat: AI tool for automating browser tasks
CopyCat 是一个人工智能驱动的浏览器自动化工具,旨在帮助企业和个人简化重复性网页任务。它通过结合智能浏览器代理和确定性操作,让用户无需编写代码即可创建自动化工作流程。CopyCat 支持处理复杂网页操作,例如填写表单、抓取数据或导航网...

NeuralAgent: an AI intelligence that uses speech and text to operate a computer to accomplish tasks
NeuralAgent 是一个开源的 AI 智能体工具,运行在用户本地电脑上。它通过模拟人类操作,如点击、输入、滚动和导航应用,完成各种任务。用户只需用自然语言下达指令,NeuralAgent 就能自动执行,例如填写表单、发送邮件或搜索信息...

Gabriel Operator: the AI assistant that transforms browsers into smart workspaces
Gabriel Operator 是一个将浏览器转变为智能工作空间的工具。它通过 AI 浏览器代理帮助用户完成自动化任务、提供辅助支持并适应不同工作场景。用户可以在浏览器中直接使用 AI 功能,简化日常操作,提高工作效率。网站设计简洁,功能...

Magentic-UI: An Intelligent Agent Tool to Support User Collaboration on Web Tasks
Magentic-UI 是微软研究院开发的一款开源智能代理工具,旨在帮助用户通过协作完成复杂的网页任务。它基于 AutoGen 框架,结合多代理系统,提供透明、可控的用户体验。Magentic-UI 不仅能自动化浏览网页、执行代码,还能管理...

OpenDia: An Open Source Tool to Connect Browsers to AI Models
OpenDia is an open source project that aims to seamlessly connect AI models to browsers through the Model Context Protocol (MCP) protocol. Users can install the OpenDia extension on browsers such as Chrome, Firefox, etc., and combine it with the locally running MCP...

Omni-Bot-SDK-OSS: A Visual Recognition-based Automation Framework for WeChat RPA
Omni-Bot-SDK-OSS 是一个开源的微信自动化框架,基于视觉识别技术,支持微信4.0版本的RPA(机器人流程自动化)操作。它通过自定义YOLO模型和OCR技术实现运行时零侵入,适合开发者构建自动化任务。用户可以动态接入插件,适配O...

Simular Browser: an AI browser that intelligently automates web operations
Simular Browser 是一款基于人工智能的浏览器,专为自动化网页操作设计,帮助用户高效完成重复性任务。它通过自然语言指令实现网页浏览、表单填写和数据抓取,无需编写复杂代码。Simular Browser 支持跨平台使用,集成智能代...

Simular Pro: an AI intelligence that uses voice and text to operate computers to accomplish automated tasks
Simular Pro是一款基于神经符号框架的AI智能体,专为MacOS(Apple Silicon)设计。它通过自然语言指令,模拟人类操作电脑的行为,如点击、输入和滚动,自动化完成复杂桌面任务。产品强调透明执行,用户可随时检查和修改每一步...

WebAgent: An Intelligent Web Information Search and Processing Tool
WebAgent is an open source project developed by Alibaba Tongyi Lab, focusing on intelligent web information search and processing. It consists of three main components: WebWalker, WebDancer and WebSailor.These tools utilize advanced language modeling and reinforcement learning techniques to help users high...

legacy-use: adding AI automation interfaces to legacy software without APIs
legacy-use是一个开源工具,它的核心作用是为那些陈旧、没有API接口的桌面软件(通常称为“遗留软件”)提供一个现代化的REST API接口。它通过一个AI智能体来“观察”软件的图形用户界面(GUI),并模拟人类用户的键鼠操作。这样一...
Top