OpenCLI 是一个通用的命令行枢纽与 AI 原生运行时环境,致力于将任意网站、浏览器会话、本地二进制文件以及基于 Electron 的桌面应用程序,转化为标准且具有确定性的命令行接口(CLI)。系统内置了针对 Bilibili、知乎、小红书、Reddit、Twitter 等 87 个以上国内外主流平台的适配器,支持用户在终端直接拉取数据、执行任务并导出多种文件格式。系统通过浏览器扩展安全地复用本地 Chrome/Chromium 的用户登录态,具备全面的防指纹与反反爬策略,避免封号风险并保护隐私。除了为人类用户提供零成本、免配置的工作流外,OpenCLI 专为 AI 智能体设计,开放了网页探索、API解析和自动化适配器生成功能,使得 AI 能以无运行 Token 成本的方式直接控制底层浏览器和本地系统工具。
Funktionsliste
- 网站命令化 (Website to CLI): 预置 87 个以上的平台网络适配器(覆盖主流社交与资讯网站),将网站的网页交互功能抽象为标准的命令行执行操作。
- 零成本自动化运行 (Zero LLM Cost): 命令行任务一经生成,在后续的常态化运行中完全依赖确定的脚本执行,不消耗任何 AI 大模型 Token 成本。
- AI 智能体原生支持 (AI Agent Ready): 具备
explore(网页探索)、synthesize(代码合成)与generate(一键生成)工具链,支持智能体自主发现网站接口并生成长期可用的 CLI 工具。 - 浏览器状态复用与反侦察 (Account-safe & Anti-detection): 安全复用本地登录状态,凭证无需脱离浏览器;内置清理全局对象、伪造插件列表等防指纹防风控机制。
- 外部 CLI 与桌面应用集成 (CLI Hub & Desktop Apps): 统一接管和分发外部命令行工具(如 docker、gh),并提供针对 Electron 桌面应用(如 Cursor、Notion、ChatGPT)的基于 CDP 协议的底层控制。
- 灵活格式与管道支持 (Pipeline Friendly): 所有的内置数据提取命令支持输出为表格(Table)、JSON、YAML、Markdown 和 CSV 格式,便于系统层面的管道连接或数据处理。
- 媒体资源下载支持 (Download Support): 原生支持通过命令行从社交与视频网站一键批量无水印下载图片、文章、以及高清视频(整合 yt-dlp 支持)。
- 实时浏览器操控模式 (Live Browser Control): 提供供 AI 使用的底层接管指令(点击、输入、提取文本、截图),实现针对非常规动态页面的交互控制。
Hilfe verwenden
OpenCLI 的核心逻辑在于将基于前端界面的各类操作直接转化为可在终端执行的标准命令。为了让您充分利用其零成本、确定性的执行能力,请务必按照以下详细指南完成初始环境搭建,并掌握各类核心运行模式的操作流程。
一、 核心环境配置与安装流程
OpenCLI 的运行主要依赖于两个部分:命令控制中枢(CLI)以及提供真实登录态的浏览器连接扩展(Browser Bridge)。
1. 基础环境要求
请确保您的操作系统已安装 Node.js 运行环境(版本不低于 21.0.0)或 Bun(版本不低于 1.0)。同时,您的电脑中需要安装有 Chrome 或 Chromium 浏览器并保持日常使用登录,因为 OpenCLI 将依赖您的浏览器实例来建立通信并验证账号授权状态。
2. 安装 OpenCLI 主程序
打开您的操作系统的终端(Terminal)或命令行工具,执行以下 npm 命令进行全局依赖安装:
npm install -g @jackwener/opencli
如果您是为了配合本地的 AI 智能体环境安装打包好的技能组,可以直接执行:
npx skills add jackwener/opencli
3. 安装并配置浏览器桥接扩展(Browser Bridge)
这是实现“免输入密码复用登录状态”及“反反爬虫侦察”最为关键的一步配置:
- 访问 OpenCLI 在 GitHub 的 Releases 发版页面,下载名称为
opencli-extension.zip的压缩包文件。 - 将压缩包解压至本地电脑的一个固定文件夹目录中(解压后请勿随意移动或删除此目录)。
- 打开您的 Chrome 浏览器,在顶部地址栏输入
chrome://extensions并敲击回车进入扩展程序管理页。 - 在页面右上角开启“开发者模式”(Developer mode)开关。
- 点击左上角的“加载已解压的扩展程序”(Load unpacked),在弹出的文件资源管理器中选择您刚刚解压出的扩展文件夹。
4. 验证系统环境与连通状态
完成上述配置后,请确保 Chrome 浏览器处于正在运行的状态,并在终端中输入:
opencli doctor
该命令会自动诊断后台通信守护进程、扩展插件连接状态以及浏览器 DevTools 协议连通性。如果返回结果各项均为正常(绿色的检查项),表明系统安装彻底完毕。
二、 日常指令与自动化数据获取流程
当您作为普通开发者或用户,希望快速拉取各大平台的信息或对接数据时,可直接调用预置指令。
1. 执行平台数据提取命令
系统预置了高达 87 款主流网站的控制台适配器(如 Bilibili、知乎、小红书、HackerNews等)。在终端里即可直接获取对应网站的前台信息:
# 获取 Bilibili 网站热门视频排行榜前五名
opencli bilibili hot --limit 5
# 获取知乎网站的热榜列表
opencli zhihu hot
# 获取指定推特用户的最近 20 条动态推文
opencli twitter timeline <用户名> --limit 20
提示须知:执行数据抓取之前,必须确保您的 Chrome 浏览器在上述对应的平台网站中已经登录了您的个人账号。如果终端返回“Unauthorized(未授权)”或错误码 77,您只需切换回浏览器窗口,手动打开目标网站并完成一次常规登录,之后即可正常使用命令行提取。
2. 指定输出数据格式对接工作流
默认状态下数据以终端表格形态展示,您可以通过添加 -f 或 --format 参数定义序列化输出格式,便于代码脚本或管道(Pipeline)处理:
- 输出结构化的 JSON 数据用于代码解析:
opencli bilibili hot -f json - 输出 CSV 表格格式用于导入数据分析软件:
opencli bilibili hot -f csv - 输出 YAML 或纯文本 Markdown(参数为
-f yaml或-f md),这种结构高度契合 AI 大模型的文本信息抽取场景。
3. 跨平台多媒体资产下载操作
OpenCLI 搭载了高度整合的多媒体下载模块模块。针对各大平台实现了一键本地化数字资产封存操作(如涉及下载各类流媒体视频文件,请先通过所在系统的包管理工具安装预置依赖包 yt-dlp):
- 下载小红书特定笔记内容的无水印配图与视频资产:
opencli xiaohongshu download <笔记ID> --output ./xhs_folder - 下载 Bilibili 特定的单集视频及其元数据:
opencli bilibili download <BV视频号> --output ./B站下载 - 一键备份各类社交媒体账户下的指定图片流到本地硬盘的指定目录。
三、 为 AI 智能体开放的探针与学习工作流
OpenCLI 构建的初衷是为了给 AI 赋予底层的接管能力。AI 可以在此基础之上探索未知结构并合成新的接口。
1. 浏览器页面级实时控制 (Live Control)
若面对未能覆盖的动态网页或验证码流程,AI 智能体可通过调用底层的 opencli browser 指令集,通过 Chrome DevTools Protocol (CDP) 协议产生具备真实物理硬件特征的直接网页干预,包括 click(坐标/节点点击)、type(表单文本输入)、scroll(模拟手势滚动)与 screenshot(页面特征截图提取)。
2. 目标网站探索与适配器代码合成
当需要对一个小众且不支持基础接口的站点增加系统适配能力时,遵循如下功能使用流水线:
- 第一阶:特征探明 (
explore): End-to-End-Ausführungopencli explore <未知目标网页URL>。环境将静默接管浏览器打开该网页,侦测其前端网络请求模式、接口加密特征以及权限分布逻辑,以提取有效的抓取信道。 - 第二阶:授权探测 (
cascade): 并行使用opencli cascade <目标URL>探针,系统逐层试探该站点的防爬漏洞。包括无凭据开放调用、Cookie 直连越权或是检测特定的校验响应头。 - 第三阶:逻辑固化 (
generate): vollziehenopencli generate <目标网页URL> --goal "业务诉求简述"。结合前期获取的全景特征参数,直接生成并输出一份专属于该页面的纯 JavaScript 规则化控制适配文件(.js)。一旦适配器生成完毕,以后抓取该页面所有逻辑都将转为本地纯粹的代码推演执行,规避每一次都需要大模型在线推理产生的高昂 Token 开销。
四、 本地与桌面应用(Electron)融合操作
OpenCLI 的操作限界不仅局限于互联网服务,同时也渗透到系统的本地工具层:
- 外部 CLI 拦截与封装: OpenCLI 可以接管例如
docker、gh(GitHub命令行)等程序指令。当遇到不存在的工具时,内置的修复判定能够自动执行brew install提前补齐安装项。 - 操作 Electron 桌面应用: 无需研究第三方软件闭源的开放 API 规则,利用 CDP 强协议能力,直接在终端操纵如 Cursor、Notion 乃至 ChatGPT 的客户端。比如键入
opencli notion search <搜索词>,即使不申请 Notion API Developer Token,仍可在本地终端直接检索笔记块内容库数据。
五、 错误代码排错指南 (Troubleshooting)
为了更好地融入 CI/CD 和自动化脚本,OpenCLI 提供标准的 Unix 式退出状态码规则:
- 提示代码 69(EX_UNAVAILABLE): 表明 Browser Bridge 浏览器拓展未正常通信。排查方案:确认 Chrome 是否已正常开启或在扩展页中由于环境策略导致插件处于未启用状态。
- 提示代码 77(EX_NOPERM): 表示鉴权层失败。排查方案:直接使用浏览器手工访问目标业务站点的首页,确认登录会话正常活跃未过期。
- 超时与空白中断: 在抓取全量动态加载的冗长型页面时易触发超时熔断,可通过修改系统环境变量
OPENCLI_BROWSER_COMMAND_TIMEOUT=120(增加秒数限制),扩大单一命令执行时等待真实浏览器响应的时间范围。
Anwendungsszenario
- AI智能体自动化操控与交互编排
在研发和部署需要自主获取数据并反馈环境的 AI Agent 时,可通过调用 OpenCLI 的指令,让 AI 控制真实浏览器以人类视角完成信息收集、竞品数据分析或者跨页面的工作流调度,解决常规爬虫容易被屏蔽或限制的问题。 - 社交媒体与平台内容的无代码拉取与沉淀
自媒体运营者和数据分析师可直接使用命令行提取小红书、哔哩哔哩或 Reddit 上的热榜榜单数据、最新视频评论列表等;同时配合一键下载功能,实现素材资产的高速归档、去水印存储和线下重编辑。 - 桌面工具和本地环境的统一终端调度
开发人员可通过该枢纽不仅执行外部云端的抓取命令,也能无缝穿插调用本地的 GitHub 代码审查、Docker 容器管理及本地运行的各类 Electron 办公应用(如 Cursor 或 Notion),形成不离开终端控制台的全栈自动化闭环。
QA
- 使用 OpenCLI 时需要我提供各大网站的账号密码或 API Key 吗?
不需要提供。OpenCLI 系统使用底层的 Browser Bridge 插件,它会自动复用并在当前本地 Chrome 浏览器中的既有登录态下发起行为。您个人的密码、Cookie 等敏感验证信息全程不会离开本地的浏览器沙盒环境,极大保障了信息安全和隐私。 - 为什么在终端执行一些平台的命令时会返回“Unauthorized”并抓取失败?
此问题通常由于您在本地浏览器上尚未登录对应平台网页,或既有的用户登录会话已经由于长期未访问而超时过期。此时仅需在您的 Chrome 中手动打开该网站的首页确认账号已登录或重新登录一次,随即在终端重试命令即可顺利执行。 - 生成代码和执行命令的过程中,会消耗大量的 AI 语言模型 Tokens Was? - Ich weiß es nicht.
在常规的运行过程(提取数据、执行任务)中完全不会消耗 Token。OpenCLI 的运行机制是在一次生成适配器(或使用预置适配器)之后,转化为本地确定性的规则脚本执行机制;即使任务被循环执行数万次,其计算与通信成本均为零。只有在首次遭遇未覆盖目标并使用探索(Explore)与生成(Generate)指令时,才涉及底层逻辑分析模型的使用。






















