Browserbase推出/browser-trace工具,通过完整记录CDP事件、DOM快照、网络请求与日志,为浏览器Agent提供了类似“黑匣子”的可观测性,解决了Agent执行过程不透明、难以调试复现的核心痛点。与此同时,蚂蚁发布的Ling-2.6-1T模型将token效率作为首要目标,以约四分之一成本达到接近GPT-5.4非推理水平的综合智能。这两项进展共同指向Agent工程化的关键:可靠的可观测性与可负担的生产成本,标志着行业竞赛正从参数规模转向真实生产落地能力。
今天看到一个东西,我觉得是2026年Agent工程化到目前为止最重要的进展之一!
说实话,我之前对各种Agent浏览器工具已经有点审美疲劳了。
无非就是能点按钮、能填表单,一到复杂页面就乱点,一出问题就抓瞎。
但Browserbase刚出的这个/browser-trace不一样。
他们做了个演示:让Claude在TikTok上自动刷视频,50秒内刷了几十条,全程后台悄无声息地记录了一切: 2077个CDP事件, 43张DOM和截图快照, 320多个网络请求,包括失败的、中断的、媒体预加载的, 所有console日志、JS异常、页面生命周期。
最后自动生成了一份带仪表盘的HTML报告,点任何一个事件都能跳转到对应的截图和DOM。
卧槽这个就太屌了, 以前Agent在网页上乱点卡住, 兄弟们知道最痛苦的是什么吗? 我想了很久,答案就是:你根本不知道它为什么卡住🤣🤣🤣
它看到了什么?它点击了哪里?网络请求返回了什么?有没有JS报错? 传统的Playwright调试已经够痛苦了,Agent更惨,
它自己决策、自己执行、自己出问题,你连复现都做不到。