# BestBlogs早报06-19精讲：OpenAI Codex Record & Replay / Claude Code Artifacts / A2A协议满周岁

- 来源：ginobefun (@hongming731)
- 发布时间：2026-06-19 07:23
- AIHOT 分数：40
- AIHOT 链接：https://aihot.virxact.com/items/cmqk5znu303euslhi6gt95umc
- 原文链接：https://x.com/hongming731/status/2067749994904572321

## AI 摘要

OpenAI为Codex上线Record & Replay，演示一次完整操作即可复用浏览器工作流；Claude Code支持Artifacts渲染，会话实时生成可视化页面并自动更新，Beta面向Team/Enterprise组织；Google A2A协议满周岁，Python/Go SDK已达1.0 GA，以FoldRun为例展示智能体协作。其他动态：MosaicLeaks基准测试揭示深度研究智能体隐私泄露风险；SGLang-JAX在TPU v7x上优化Ling-2.6-1T MoE模型，延迟降低53%。

## 正文

BestBlogs 早报 · 06-19

# OpenAI Codex / Claude Code Artifacts / A2A 协议 / Record & Replay / FoldRun

【1】 ★ 精讲|OpenAI Codex Record & Replay：演示一次，即可复用浏览器工作流 【视频】
OpenAI 为 Codex 上线 Record & Replay：用户只需演示一次完整操作（如在 YouTube Studio 填写元数据、上传缩略图、保存私密视频），Codex 就能把这次录制转化为可复用技能，在新任务里自主匹配素材、填写信息、核验结果。能力覆盖电脑操作、浏览器操作和已连接插件，未来还能扩展到整理 PR、安排日程等场景--把「写提示词」换成了「做一次示范」。
来源：OpenAI
https://www.bestblogs.dev/video/cb0632f

【2】 ★ 精讲|Claude Code 现已支持 Artifacts 渲染功能
Claude Code 上线 Artifacts 功能：会话过程能被实时转化成可分享的可视化页面--PR 走查、系统说明、仪表盘、发布清单等，且随工作推进自动更新同一链接。基于会话上下文（代码库、连接器、对话本身）直接生成，无需额外搭建数据源。团队调试场景验证最多：工程师把故障排查过程发布成时间线、可疑提交和错误曲线，站会前已迭代两次，所有人对齐同一视图。目前 Beta 阶段面向 Team/Enterprise 组织开放。
来源：Claude Blog
https://www.bestblogs.dev/article/71cae674

【3】 ★ 精讲|A2A 如何构建一个协作智能体的世界
Google 的智能体协作协议 A2A 满周岁：相比把智能体当 API 调用，A2A 让智能体之间发起真正的协作--保护内部「秘方」逻辑不外泄、避免单一智能体上下文被海量依赖污染、支持智能体反馈不完整请求并追问。文章以蛋白质结构预测工具 FoldRun 为例：开发者只需把任务交给 FoldRun 这个独立智能体节点，无需自建 GPU 流水线和模型生命周期管理。A2A 的 Python/Go SDK 已 1.0 GA，正拓展到电商支付、企业数据流和跨平台运维场景。
来源：Google Developers Blog
https://www.bestblogs.dev/article/b9c75cf5

【4】 哪条路线，才能通往「世界模型」的终局？|对话黄碧薇：Aether AI 创始人 【播客】
黄碧薇教授深度拆解世界模型的技术现状，提出以因果 AI 为核心的第四条路线，分享了因果世界模型如何让机器人真正理解物理规律并实现举一反三，以及她从学者到创业者的心路历程。
来源：十字路口 Crossing
https://www.bestblogs.dev/podcast/62e0e8d

【5】 你的 Harness 工作流真的在进步吗？我们用一场考试撕掉了遮羞布
本文提出一套面向 Harness 工作流的可量化、可回归、闭环的评测体系，通过「出题-答题-改卷」的考试机制，解决工作流效果无法客观评估的问题。
来源：腾讯技术工程
https://www.bestblogs.dev/article/0e07faec

【6】 超越流水线的 CI/CD：Robert Erez 谈渐进式交付、GitOps 与前滚恢复 【视频】
Robert Erez 将 CI/CD 从流水线检查清单提升为一套务实的风险管理方法，其核心包括渐进式交付、实用主义 GitOps、前滚恢复以及规范的功能开关治理。
来源：The Pragmatic Engineer
https://www.bestblogs.dev/video/095dc0a

【7】 从开源到 Agent，从组织到个体：AIEC 大会现场侧记 【播客】
两位资深行业观察者在 AIEC 大会现场，深度复盘了 AI 领域从模型、Agent 到组织变革的核心共识与非共识，并探讨了技术洪流下个体的价值与定位。
来源：屠龙之术
https://www.bestblogs.dev/podcast/2784813

【8】 MosaicLeaks：你的研究智能体还能保守秘密吗？
MosaicLeaks 引入了一个基准测试和一种隐私感知的强化学习方法（PA-DR），表明深度研究智能体会通过网页查询中的马赛克效应泄露隐私信息，并且仅针对任务性能进行训练会使泄露问题更加严重。
来源：Hugging Face - Blog
https://www.bestblogs.dev/article/67ee7e6d

【9】 智能体化程度够了吗？用自有工具对开源模型进行基准测试
本文介绍了一种基准测试框架，它不仅衡量智能体是否成功完成任务，还衡量其付出的工作量，并以 `transformers` 库为例，展示了新的 CLI 和 Skill 能帮助大型开源模型，但会损害小型模型。
来源：Hugging Face - Blog
https://www.bestblogs.dev/article/b50a486d

【10】 TPU 上的 MoE 推理优化：SGLang-JAX 用 Pallas 内核砍延迟 53%
本文详细介绍了在 TPU v7x 上优化服务 Ling-2.6-1T MoE 模型的过程，重点是一种新颖的 Pallas 内核（Fused MoE V2），它将数据移动隐藏在计算之后，实现了 MoE 预填充延迟降低 53%，并在解码吞吐量上最高达到 H200 GPU 的 1.77 倍。
来源：LMSYS Blog
https://www.bestblogs.dev/article/8efc1b4e

---
http://BestBlogs.dev · 发现真正适合你的高质量内容
BestBlogs 是 AI 驱动的私人阅读助手，帮助你建立稳定、可信、个性化的高质量信息输入。 关注你感兴趣的来源和主题，每天生成一份更适合自己的「我的早报」。
在线阅读：https://www.bestblogs.dev/explore/brief/2026-06-19

### 引用推文

> ginobefun：http://x.com/i/article/2067749290982936576