Anthropic 发布 Claude Sonnet 5,定位最具 agent 能力,性能接近 Opus 4.8,8月31日前输入2美元/百万token、输出10美元,之后恢复3/15美元。Google DeepMind 推出 Nano Banana 2 Lite(文生图延迟约4秒,每千张0.034美元)和 Gemini Omni Flash(多模态视频生成,0.10美元/秒,上限10秒)。吴恩达总结 AI 智能体三大循环:编程循环、开发者反馈循环、外部反馈循环,强调人机协同。
BestBlogs 早报 · 07-01
Claude Sonnet 5 / Anthropic / Nano Banana 2 Lite / Gemini Omni Flash / 吴恩达
【1】 ★ 精讲|Claude Sonnet 5 发布 Anthropic 官方发布 Claude Sonnet 5,定位为最具 agent 能力的 Sonnet:能规划、调用浏览器与终端工具并自主执行多步任务,整体性能接近 Opus 4.8 但价格更低,在推理、工具使用、编程上较 Sonnet 4.6 显著提升。8 月 31 日前享入门价每百万输入 token 2 美元、输出 10 美元,之后回到 3/15 美元。早期用户反馈它能端到端完成以往会中途停下的任务,适合关注 agent 实战与成本平衡的开发者细读。 来源:Anthropic News https://www.bestblogs.dev/article/eff5a221
【2】 ★ 精讲|开始使用 Nano Banana 2 Lite 和 Gemini Omni Flash 进行构建 Google DeepMind 同日推出两款生成式媒体模型。Nano Banana 2 Lite 面向高吞吐场景,文生图延迟约 4 秒、每千张图 0.034 美元,并作为旧版 Nano Banana(gemini-2.5-flash-image)的推荐替代。Gemini Omni Flash 首次开放给开发者,支持文本、图像、视频混合输入的视频生成与会话式编辑,定价每秒视频输出 0.10 美元、与 Veo 3.1 Fast 持平,目前单次生成上限 10 秒。两者可串联使用并经 Interactions API 保留最多三次连续编辑的会话上下文,适合关注多媒体流水线与成本控制的产品与工程团队。 来源:Google DeepMind News https://www.bestblogs.dev/article/e2086adb