xAI 的最新编码模型 Grok Build 0.1 已通过 xAI API 进入公开测试阶段。该模型专为智能体编码任务训练，支持网页开发、调试和 MCP，同时也是驱动 Grok Build CLI 的同一模型。其推理速度超过 100 tokens/秒，定价为输入 $1/m tokens，输出 $2/m tokens。除编码外，它也适用于通用智能体及工具调用场景，并可通过 OpenRouter 和 Vercel AI Gateway 获取。

xAI 模型发布编码

关联讨论 4 条

推荐理由：xAI 把编码模型卷到了 100+ t/s 和 $2/M 输出，专攻 agentic coding，这是直接在叫板 Claude Code 和 Cursor，做开发工具的同行该重新算账了。

01:14

The Verge：AI（RSS）

Claude 的新模型在"出错时更'诚实'"

Anthropic 在周四发布了其最新模型 Claude Opus 4.8。新模型在生成错误内容时，更倾向于主动标示不确定性，并减少做出无根据的断言。在内部评估中，其产出未经证实断言的可能性比前代模型降低约 4 倍。

Anthropic 安全/对齐模型发布

01:14

TechCrunch：AI（RSS）

同事件精选72

Anthropic 发布 Opus 4.8 并推出新型"动态工作流"工具

Anthropic 发布了最新的 Opus 4.8 大语言模型，并为该模型引入了一个名为“Dynamic Workflows”的新工具。该工具旨在协调由多个子代理组成的群组，以执行复杂任务。

智能体 Anthropic 推理模型发布

同一事件，精选展示《Claude Opus 4.8 发布：在编码、智能体技能与推理方面实现全面升级》

推荐理由：Opus 4.8 是 Anthropic 对 Opus 4.7 失望反应的快速回应，亮点不在跑分而在模型能主动标记不确定性，这比正确率更实用。动态工作流让跨子 agent 的代码迁移成为现实，开发团队值得关注。

01:08

Hacker News 热门（buzzing.cc 中文翻译）

克劳德作品4.8

Anthropic 发布了新版模型 Claude Opus 4.8。该模型的具体技术参数、性能基准与定价等详情暂未提供。本文提供了其官方公告页面的链接，并记录了该新闻在 Hacker News 上的讨论热度。

Anthropic 推理模型发布

关联讨论 12 条

01:05

Anthropic：Newsroom（网页）

精选85

Claude Opus 4.8 发布：在编码、智能体技能与推理方面实现全面升级

Anthropic 发布了新一代模型 Claude Opus 4.8，作为 Opus 4.7 的升级版本，其在编码、智能体技能、推理和实用知识工作等各项基准测试中均取得进步。Claude Opus 4.8 现已可用，价格与前代相同。同步推出的新功能包括：用户可控制任务投入程度、Claude Code 新增“动态工作流”特性，以及 Opus 4.8 的 2.5 倍速模式价格降低为以往的三分之一。早期测试者反馈其在智能体任务中的判断力更可靠、工具调用更高效。该模型在 Online-Mind2Web 测评中得分 84%，超越了 Opus 4.7 和 GPT-5.5。此外，其诚实度与对齐表现也得到提升，代码错误漏检率降低了约 75%。

智能体 Anthropic 推理模型发布

关联讨论 12 条

推荐理由：Opus 4.8看着是常规升级，但动态工作流让Claude Code能啃下跨十万行代码迁移这种硬骨头，快速模式降价三倍更是直接拉低了实时场景的入场券。

5月28日