阿绎 AYi@AYi_AInotes

2026-04-29 21:06·64天前

AI 摘要

Browserbase推出/browser-trace工具，通过完整记录CDP事件、DOM快照、网络请求与日志，为浏览器Agent提供了类似“黑匣子”的可观测性，解决了Agent执行过程不透明、难以调试复现的核心痛点。与此同时，蚂蚁发布的Ling-2.6-1T模型将token效率作为首要目标，以约四分之一成本达到接近GPT-5.4非推理水平的综合智能。这两项进展共同指向Agent工程化的关键：可靠的可观测性与可负担的生产成本，标志着行业竞赛正从参数规模转向真实生产落地能力。

今天看到一个东西，我觉得是2026年Agent工程化到目前为止最重要的进展之一！

说实话，我之前对各种Agent浏览器工具已经有点审美疲劳了。

无非就是能点按钮、能填表单，一到复杂页面就乱点，一出问题就抓瞎。

但Browserbase刚出的这个/browser-trace不一样。

他们做了个演示：让Claude在TikTok上自动刷视频，50秒内刷了几十条，全程后台悄无声息地记录了一切： 2077个CDP事件， 43张DOM和截图快照， 320多个网络请求，包括失败的、中断的、媒体预加载的，所有console日志、JS异常、页面生命周期。

最后自动生成了一份带仪表盘的HTML报告，点任何一个事件都能跳转到对应的截图和DOM。

卧槽这个就太屌了，以前Agent在网页上乱点卡住，兄弟们知道最痛苦的是什么吗？我想了很久，答案就是：你根本不知道它为什么卡住🤣🤣🤣

它看到了什么？它点击了哪里？网络请求返回了什么？有没有JS报错？传统的Playwright调试已经够痛苦了，Agent更惨，

它自己决策、自己执行、自己出问题，你连复现都做不到。

所以有时候你会发现，我们之前一直在给Agent造手和眼睛，但从来没人给它造黑匣子。

我觉得这才是/browser-trace真正的意义。它不是一个更好的调试器，更像一个浏览器Agent的OpenTelemetry。把浏览器从Agent的黑箱执行器，变成了一个完全透明、可查询、可复现的系统。而正是有了这种真正的可观测性，才构成了Agent可靠性的起点。

阿绎 AYi说个暴论,2026 年 AI 行业的转折点,不是 GPT-5.5,也不是 o3,是蚂蚁@AntLingAGI 刚刚发布的 Ling-2.6-1T。我用 Ling-2.6-1T 跑了一个查理芒格的 100 个思维模型的硬核任务, 结果真的太炸了,具体大家看视频演示。当大家都在卷参数、卷推理分、卷更长上下文, 只有它反...

智能体产品更新部署/工程

在 X 查看原推

阿绎 AYi@AYi_AInotes · X

60导出 Markdown