Codex + Chrome 插件,真的原地起飞了
Codex 现在终于能在 macOS 和 Windows 的 Chrome 浏览器里直接用了。装上 Chrome 插件之后,它简直原地起飞。
它不再是那个只能在终端和 IDE 里折腾的编程 agent,
真正钻进了浏览器
:后台跨标签页并行运行,完全不接管我的浏览器,我自己刷网页、看视频完全不受影响。这一点真的太关键了。
查内部后台、刷 dashboard、在 CRM 里批量更新客户信息、走复杂多页的表单流程……以前这些最烦、最耗时间的活,现在它都能干了。
这直接把那道「AI 很强,但我的数据在登录墙后面」的鸿沟给填平了。
它的工作方式简单粗暴却高效:写代码、跑代码来操作页面。任务一来,它会自己判断。
能用现成插件解决就用插件,需要登录态的就走 Chrome,该混着用就混着用,特别聪明。
它不是在「模拟点击」,而是
真的在写程序解决问题
。这个本质区别,让它的上限
远远甩开传统 RPA
。
它能自动刷 Timeline、自动采集、自动总结、自动入库,也能自动填表、注册账号等。
特别好的一点是:
敏感操作前会停下来让我确认
,安全感拉满。它保持了「人在回路」的克制,而不是一味追求全自动,这点我很欣赏。
我之前让它帮我做京东订单导出,本以为要搞个大工程、还要跟反爬斗智斗勇,结果它
几分钟就给我生成了一个专属插件儿子
。
几千个订单,丝滑导出,全程无人值守,优雅得离谱。以前这类需求,要么自己熬夜写爬虫,要么外包,要么干脆放弃。
现在门槛低到只要「我想做」就能快速落地,这种变化是
质的飞跃
。
效率差距还在其次,更本质的区别是:用插件走的是「像人一样真实操作浏览器」,很多登录后的复杂流程、反爬严格的页面,用 API 根本无从下手,而 Codex + Chrome 插件直接把路走通了。
我现在越来越觉得,我们的想象力还是严重不够。很多人用 Codex 还停留在「帮我写段代码」「帮我 debug」的阶段,但它现在已经能完成
端到端的任务执行
了
从理解需求、规划方案、生成工具、操作浏览器,到最终拿到结构化结果,一条龙搞定。