mac assistant是一款专为macOS系统设计的AI智能体工具,通过整合本地软件与网络能力实现自动化操作。其核心定位是简化用户日常操作流程,主要具备以下功能特点:
1. 跨平台指令执行:深度集成DOM树和系统辅助功能,可自动完成网页/应用中的按钮点击等基础操作;
2. 双模AI支持:当前支持OpenAI和GEMINI两大主流API,未来将扩展对Ollama本地大语言模型的支持;
3. 工具链扩展:通过browser-use和macOS-use驱动,后续会开放更多系统工具调用权限;
4. 交互友好性:提供图形化界面(agent_ui.py)实现人机交互,支持自然语言指令输入。
该智能体特别适合需要重复性桌面操作的场景,但需要注意当前对Google Docs和PDF等文档操作的支持存在局限,这些功能将在未来版本迭代中增强。
本答案来源于文章《mac assistant:macOS设备自动执行桌面操作的AI智能体》