本周科技领域聚焦Agent工程化落地。Anthropic与OpenAI分别将Claude Code和Codex集成至IDE,并详细披露了Computer Use、Windows沙箱等关键实施细节。行业同时推出了包含12项指标的Agent评估体系及开放的Agent Skill标准。国内TiDB、腾讯云Harness、AgentScope Java也相继发布相关产品,共同推动Agent技术进入实际生产环境。
本周没有新模型发布,却是 Agent 工程化信息密度极高的一周。Anthropic 与 OpenAI 同步把 Claude Code、Codex 推出 IDE,Computer Use、Windows 沙箱、截图分辨率等落地细节一次讲透;另有 12 项 Agent 评估指标、Agent Skill 开放标准,以及国内 TiDB、腾讯云 Harness、AgentScope Java 三连发。想把 Agent 真正推进生产,这期内容值得阅读和收藏。