今天看到 Codex 的一个更新,不算大新闻,但我觉得很值得写一下。
OpenAI 给 Codex 的内置浏览器加了一个 device toolbar,也就是设备尺寸工具栏。以后在 Codex 里做网页、改 UI、调响应式布局,不用只盯着一个默认窗口看效果了。
你可以让 Codex 在不同尺寸下测试应用,比如手机、平板、桌面端。它会自己看页面,发现错位、溢出、按钮太小、间距不对、移动端导航崩掉这些问题,然后继续改代码。
入口也很简单,在 Codex 内置浏览器 URL 栏右侧点三个点就能用。
配图1:Codex App 代码审查界面
Codex App 正在把写代码、看变更、做 review 放到同一个工作台里。
图源:OpenAI Developers Codex App 页面
这件事表面上是一个小按钮,实际意义不小。
以前我们用 AI 写前端,最常见的问题是:代码能跑,页面也能打开,但一换设备就露馅。
桌面端看着还行,手机端标题挤成三行;卡片宽度写死,横向滚动条冒出来;按钮贴着屏幕边缘;弹窗在小屏幕上盖不全;导航栏直接变成灾难现场。
这些不是模型不会写代码,而是它过去缺少稳定的“看见”和“验证”环节。
前端真正麻烦的地方,从来不只是把 React 组件写出来。麻烦的是反复看、反复调、反复试尺寸。尤其是响应式页面,设计稿通常只给一两个状态,真实设备却有一堆奇怪尺寸。
这次 device toolbar 补上的,就是这块短板。
配图2:Codex App 新线程界面
一个前端任务可以从自然语言开始,再由 Codex 进入代码实现、页面检查和修改闭环。
图源:OpenAI Developers Codex 页面
Codex 现在不只是“写代码的助手”,而是在往“会自己检查前端效果的开发代理”靠近。
我更关心的是,这个功能会改变前端任务的交付方式。
过去你给 AI 的任务通常是:
帮我做一个响应式页面。
现在更好的说法应该是:
帮我实现这个页面,并分别在 390px、768px、1440px 下检查布局。发现问题后自行修复,最后告诉我每个尺寸下改了什么。
这就不一样了。
前者是让 AI 写代码,后者是让 AI 完成一个可验收的前端任务。
再往前走一步,Codex 可以形成一套很实用的闭环:
先生成页面,再打开本地应用,再切换不同设备尺寸,再观察页面问题,再修改 CSS 和组件结构,再跑一遍,最后提交 diff。
这才是 AI 前端生产力真正开始变硬的地方。
新增 device toolbar 后,Codex 可以在不同屏幕尺寸下检查页面,而不是只看桌面端效果。
OpenAI 这次还顺手改了几个细节:浏览器使用速度提升了大约 30%,鼠标光标动画更紧,新增全屏模式下隐藏 composer 的方式,还修了一些 Windows 浏览器使用问题。
这些听起来很碎,但对工具手感很重要。
AI 编码工具最怕什么?
不是少一个炫酷功能,而是用起来卡、慢、遮挡、打断思路。一旦你要频繁盯着浏览器看效果,这些小细节会被无限放大。浏览器快一点,光标更稳定一点,全屏少挡一点,都会让人更愿意把真实任务交给它。
配图3:Codex Web / Cloud 输入界面
Codex Web 可以在云端环境中处理任务,也可以并行执行多个开发任务。
图源:OpenAI Developers Codex Cloud 文档
这也是为什么我觉得 Codex 最近的方向很清楚。
它不是单纯在和 Claude Code 比谁更会写代码,而是在补“软件开发现场”里那些很脏、很碎、很真实的环节。
写代码只是第一步。真实开发里还有页面预览、异常复现、尺寸切换、测试反馈、PR 修改、review 证据。以前这些事情都要人盯着,现在 Codex 正在一点点接过去。
尤其是前端开发,最容易被这种能力改写。
因为前端不是只有逻辑正确,还要视觉正确、交互正确、设备正确。
按钮能不能点,弹窗有没有遮挡,移动端会不会溢出,暗色模式下对比度够不够,这些问题过去很难只靠代码判断。现在只要 Codex 能打开浏览器、切换尺寸、观察页面,它就有机会自己发现问题。
当然,我不建议完全放手。
尤其是品牌页、产品官网、复杂后台系统,AI 现在仍然容易犯一些“看着差不多”的错误。它能修掉明显 bug,但审美、信息层级、交互意图,还是要人来把关。
比较合理的方式是:让 Codex 负责第一轮实现和低级问题清理,人负责最终判断。
比如一个页面做好后,可以直接让 Codex 跑一轮:
- • 桌面端 1440px 检查一次
- • 平板端 768px 检查一次
- • 手机端 390px 检查一次
- • 重点检查标题换行、按钮遮挡、横向滚动、表单溢出、导航崩坏
- • 修复后提交 diff,并说明每个尺寸下改了什么
这类任务非常适合交给 AI。
因为它重复、琐碎、耗眼睛,但又确实影响交付质量。
响应式问题往往不是大 bug,而是标题换行、按钮贴边、卡片溢出、导航错位这些小问题。
从这个角度看,device toolbar 的价值不在于“模拟手机屏幕”本身。
浏览器开发者工具早就能做这件事。
真正关键的是:这个能力被放进了 Codex 的执行链路里。
人类开发者过去要做的动作是:
打开页面,看一眼,发现错位,回编辑器改代码,再刷新,再换尺寸,再看,再改。
现在这条链路开始可以交给 Codex 自己跑。
这才是变化。
配图4:Codex PR / 测试反馈界面
Codex 的交付物不应该只是代码,而应该是可以审查的 diff、测试结果和修改说明。
图源:OpenAI Developers Codex 页面
所以我更愿意把这次更新看成一个信号。
AI 写代码这件事,已经从“能不能生成”走到了“能不能自己验证”。
以前我们惊讶的是,AI 居然能把页面写出来。
接下来真正有价值的是,AI 能不能自己看页面,自己找问题,自己修复,再把结果交给人 review。
前端可能会是最先被改掉工作习惯的地方。
以后一个前端任务的标准交付,可能不再是“页面写好了”,而是:
桌面端看过了。
平板端看过了。
手机端看过了。
交互跑过了。
明显布局问题修过了。
diff 可以 review 了。
这才是 Codex 这个小更新背后的重点。
不是多了一个按钮。
是 AI 开始真正进入前端验收环节了。





























