6月9日

04:16

elvis@omarsar0

AI智能体重塑知识工作的三个维度

一篇新论文从自主性、效率和工人移交任务的范围三个维度，分析AI智能体如何重塑知识工作。研究指出，当前人们使用智能体的主要障碍并非模型质量，而是几乎没有人接受过如何以这种方式工作的培训。

智能体 arXiv 论文/研究

04:07

宝玉@dotey

字节跳动豆包手机团队招聘设计工程师，需具备 Android 平台经验。团队调研总结了五种设计工程师画像：AI Design Engineer（转译 AI 能力为交互产品体验，处理 agent workflow、tool call、状态反馈等）、Product UI Craft Engineer（打磨高质量前端原型和交互细节）、Design Systems Engineer（建立设计系统与前端基础设施，连接 Figma 变量和代码组件）、Creative Technologist / Motion & Graphics Engineer（负责动效、实时图形、3D/空间交互）、AI Design Workflow Architect（搭建 AI 辅助设计工作流，使用 Claude Code、Cursor、v0 等工具）。多数设计工程师技能交叉，欢迎感兴趣者联系。

笑林: Cursor 招聘设计工程师了,非常令人心动,但我还犹豫着不能行动; 我在字节工作了8年,一直游走在动效设计师和设计工程师之间。最近我的团队(豆包手机团队)也在招聘设计工程师,但是我们需要的方向更多要有一些对 Android 平台的了解,和...

智能体 MCP/工具大佬观点

03:21

IT之家（RSS）

苹果发布 Xcode 27 Beta 与 Core AI 框架，称其为构建 AI 智能体"最佳场所"

在 2026 全球开发者大会（WWDC）上，苹果发布 Xcode 27 Beta 并推出 Core AI 框架。新版 Foundation Models 框架支持图像输入，开发者可将图片与文本一并传给设备端模型，处理多模态任务。Xcode 编码助手升级为智能体式编码工作流，已覆盖应用本地化、与模拟设备交互以及测试与调试环节。苹果软件工程高级副总裁 Craig Federighi 称 Xcode 已成为构建智能体 AI 应用的“最佳场所”。

智能体产品更新多模态编码

03:14

Apple：Newsroom（RSS）

同事件精选66

Apple 推出 Siri AI：由 Apple Intelligence 驱动的更强大、更个性化的个人助理

Apple 发布了 Siri AI，一款由 Apple Intelligence 驱动的个人助理，具备个人上下文、世界知识和屏幕感知能力，能提供更强大、更个性化的交互体验。

智能体产品更新多模态端侧

同一事件，精选展示《受 DMA 影响，Siri AI 在欧盟将随 iOS 27 和 iPadOS 27 延迟上线》

推荐理由：苹果对 Siri 的这次重构不是简单地换个模型，它把个人上下文、屏幕感知和视觉智能实际嵌进了系统，对普通用户来说日常交互方式可能要变。

02:51

Anthropic@AnthropicAI

新的科学博客：为什么 AI 在编码方面的进步比在生物学方面更快？对智能体而言，生物数据库就像汽车发明前建造的城市--开进去会让人抓狂，因为它们是针对不同的交通流量设计的。我们如何构建智能体可以使用的基础设施？ https://www.anthropic.com/research/agents-in-biology

智能体 Anthropic 现象/趋势

02:26

Josh Woodward@joshwoodward

NotebookLM 今日迎来重大升级，对话中新增智能体能力与更强推理，并可搜索用户源文件之外的网络内容。同时支持导出为 PDF、DOCX、XLSX、PPTX 及图表等新格式。该更新已向 Google AI Ultra 订阅者开放。

NotebookLM: Introducing a more powerful NotebookLM 🚀 Massive upgrades deliver agentic capabilities in chat, more advanced reasoning...

智能体 Google 产品更新搜索

02:21

IT之家（RSS）

苹果推出 Siri AI：独立 App，为灵动岛优化

苹果在 2026 年全球开发者大会（WWDC）上发布 Siri AI，称为“全新版本的 Siri”，具备更强的对话能力和表现力，用户可自定义语速、语气和口音。Siri AI 支持系统范围内读取屏幕内容并与应用互动，配有独立 App，灵动岛会显示大气泡。苹果强调每一步以隐私为重。语音优化同时适用于 CarPlay 和 AirPods，可用于查询演唱会信息、提醒报名抽奖、搜索照片等场景。

智能体产品更新语音

关联讨论 8 条

02:12

Rohan Paul@rohanpaul_ai

提示词时代正在终结。那太线性了，太受人类瓶颈限制了。我们正在进入AI智能体的循环机器。价值在于将判断上移，让人类设计流程，模型处理重复出现的摩擦。

Peter Steinberger 🦞: Here's your monthly reminder that you shouldn't be prompting coding agents anymore. You should be designing loops that p...

智能体大佬观点

01:51

jason@jxnlco

Codex和Computer Use非常强大

智能体 OpenAI 大佬观点编码

01:49

OpenAI Developers@OpenAIDevs

OpenAI Developers 五月更新：Codex 新增移动端持续运行、Mac 后台、电脑使用、Chrome 插件等，Realtime API 推出 Realtime-2

OpenAI Developers 五月发布多项更新：Codex 用户突破 500 万；新增 ChatGPT 移动端持续运行、Mac 后台运行、跨 Mac 应用电脑使用、Chrome 插件支持网页测试与 DevTools；⌘+⌘ 快捷键截图直达 Codex；Windows 版也支持电脑使用。Realtime API 推出新模型 Realtime-2，用于语音智能体、实时翻译与转录，并提供提示词指南。Agents SDK 新增 TypeScript 支持、沙箱智能体和开源 harness。私有 MCP 服务器可通过 HTTPS 连接 OpenAI 产品。

智能体 OpenAI 产品更新编码

01:49

Boris Cherny@bcherny

Claude Code GA一周年之际，Anthropic工程师Boris Cherny与@_catwu回顾产品演进。此前内部首次演示时在Slack上引发两种截然不同的反应。Cherny分享了他为何偏好auto mode而非plan mode，routines如何在bug出现前自动修复，以及他如今大部分编码都在手机上完成。视频访谈还探讨了Claude Code的未来方向。

ClaudeDevs: Claude Code's first demo got two Slack reactions. One year after GA, @bcherny and @_catwu look back: verification best p...

智能体 Anthropic 大佬观点编码

01:46

Anthropic：Research（发表成果 · 网页）

精选77

为生物学AI智能体铺路

一项实验让Claude、Biomni、Edison Analysis、GPT等科研智能体从病毒学数据库NCBI Virus中检索序列数据，即使最强模型也无法稳定达到可靠数据集构建所需的准确率。加入确定性检索层gget virus后，准确率接近100%。研究指出，当前生物学数据基础设施存在碎片化、格式特殊、接口不统一等问题，导致AI智能体难以像在软件领域那样高效工作。确定性检索工具是实现可靠智能体工作流的关键，生物学数据库需为智能体作为规模化用户而设计。

智能体 Anthropic 论文/研究

推荐理由：再强的模型在 NCBI Virus 上检索病毒序列都会翻车，Anthropic 加了个确定性检索层后准确率飙到近 100%。做 AI for science 的人该看看这个基础设施层的解法。

01:42

Yuchen Jin@Yuchenj_UW

总体来说： "你不应该再提示编码智能体了。你应该设计循环来提示你的智能体。" 循环是临时解决方案：如今的大语言模型判断力很差。它们难以判断何时继续、何时停止或何时调用工具。循环强制智能体更长时间地工作。对于目前可验证的目标，循环非常强大，正如AutoResearch所示。

智能体大佬观点编码

01:41

Rohan Paul@rohanpaul_ai

"CL-BENCH 基准测试：AI 智能体全上下文记忆优于复杂记忆系统"

新论文构建 CL-BENCH 基准，评估 AI 智能体在编程、数据库、预测、无线电信号、扑克、疾病研究 6 个领域中的持续学习能力。每个任务隐藏可随时间习得的模式，考察智能体能否超越预训练知识。测试前沿 LLM 系统采用全上下文记忆、草稿笔记、检索记忆、剧本式记忆及编码智能体设置，结果发现当前记忆密集型 AI 智能体并未可靠优于简单保留完整对话上下文。Claude Sonnet 4.6 使用普通上下文取得最佳总体分数。论文指出智能体仍需更好方法记住有用经验、遗忘过时信息并适应环境变化。

智能体 arXiv 论文/研究

01:17

ClaudeDevs@ClaudeDevs

精选74

Claude Code 的第一个演示收到了两个 Slack 反应。 GA 一周年之际，@bcherny 和 @_catwu 回顾：验证最佳实践、为何构建自动模式、例程和循环，以及下一步计划。 https://www.youtube.com/watch?v=Hth_tLaC2j8

智能体 Anthropic 教程/实践编码

推荐理由：Claude Code 一周年复盘，两位核心开发者把 auto mode 和 verification 的设计逻辑讲透了，比任何第三方教程都值得认真看。

01:12

Yuchen Jin@Yuchenj_UW

"你应该设计循环来提示你的智能体。" 循环是临时方案：今天的LLM判断力很差。它们很难知道何时继续、何时停止、何时调用工具。对于可验证的目标，循环非常强大，正如AutoResearch所示。

Peter Steinberger 🦞: Here's your monthly reminder that you shouldn't be prompting coding agents anymore. You should be designing loops that p...

智能体大佬观点

01:05

宝玉@dotey

宝玉评微信AI：超级入口或非微信，Agent才是未来

微信发布《开发者接入微信 AI 生态的指引》，引导小程序开发者接入微信 AI，让 AI 控制小程序。宝玉对此评论称，微信试图通过让 AI 操作小程序来维持自身超级入口地位，但未来年轻人不会主动打开微信，而是直接向自己的 Agent（如"帮我总结群聊"或"给妈妈发消息"）发出指令。承担超级入口职责的很可能不是微信 AI。

歸藏(guizang.ai): 微信终于要加 AI Agent 能力了? 微信发布了《开发者接入微信 AI 生态的指引》这篇文章,引导小程序开发者接入微信 AI 生态,让微信的 AI 控制小程序。感觉这个可能是未来微信 AI 上一个非常重要的功能

智能体 MCP/工具大佬观点现象/趋势

00:57

Perplexity@perplexity_ai

精选76

我们与哈佛大学发表新研究，关于从聊天界面转向像Computer这样的自主智能体的转变。超过3个月的研究结果表明，使用Computer的工人在完成任务上比仅使用搜索快87%，成本低94%，且满意度更高。 https://research.perplexity.ai/articles/how-ai-agents-reshape-knowledge-work

智能体论文/研究

关联讨论 1 条

推荐理由：Perplexity 和哈佛的联合研究，用三个月数据把“AI 代理取代聊天界面”从口号变成了硬数字——87% 时间缩减和 94% 成本下降，做企业决策的人该仔细读一下。

00:49

NotebookLM@NotebookLM

NotebookLM 迎来重大更新，在对话中新增智能体能力、更高级推理及多种新输出格式，旨在简化复杂多步骤研究。该更新面向 Google AI Ultra 订阅者以及拥有 AI Ultra Access 和 AI Expanded Access 的 Workspace 业务客户率先推出，后续计划扩展至更多用户。

NotebookLM: Introducing a more powerful NotebookLM 🚀 Massive upgrades deliver agentic capabilities in chat, more advanced reasoning...

智能体 Google 产品更新推理

关联讨论 1 条

00:46

🚨 AI News | TestingCatalog@testingcatalog

GOOGLE 🔥： @NotebookLM 现在在聊天中支持高级智能体推理，并新增了包括 Excel 表格和图片在内的输出格式。仅限 Ultra 订阅用户 👀

🚨 AI News | TestingCatalog: NotebookLM updates soon 👀 We are expecting Gemini 3.5 Flash and Gemini Omni upgrades, aside a bunch of new features. Wh...

智能体 Google 产品更新

6月8日

23:54

OpenRouter@OpenRouter

本月不出所料是成本削减月。根据我们过去3年的数据，重大突破之后往往会出现成本压力。我们将从今天开始，每周至少推出一次主要功能，帮助您降低推理成本。持续更新列表 👇

OpenRouter: New server tool: Advisor Let smaller models consult a higher-intelligence "advisor" model. Helps them escape doom loops,...

智能体产品更新部署/工程

关联讨论 1 条

23:44

elvis@omarsar0

@bcherny 分享5条技巧：1）开启自动权限模式，免手动确认；2）采用动态工作流，让Opus协调数百/数千Agent；3）使用/goal或/loop指令促使持续执行；4）在云端运行Claude Code，可关闭笔记本；5）确保Opus能端到端自验证--通过Chrome扩展验证网页、iOS/Android模拟MCP验证移动端、启动完整后端服务验证后端。Elvis Saravia强调/goal/loop和验证是关键。

Boris Cherny: Seeing a number of benchmarks showing Opus is the best model for long-running work. Five tips for running Opus autonomou...

智能体 Anthropic 教程/实践

23:38

TechCrunch：AI（RSS）

WWDC 2026 前瞻：Siri 备受期待的改造、Apple Intelligence 与 iOS 27

苹果 WWDC 2026 临近，Siri 备受期待的改造、Apple Intelligence 和 iOS 27 是本次大会的主要看点。

智能体行业动态语音

23:24

OpenRouter@OpenRouter

同事件精选72

新服务器工具：Advisor 让较小的模型咨询一个更高智能的"顾问"模型。帮助它们逃出困境循环，并帮助你迁移到更便宜的模型！🧵

智能体 MCP/工具产品更新

同一事件，精选展示《OpenRouter 推出 Advisor 工具：让低成本模型可随时调用强模型增强生成》

推荐理由：OpenRouter 这个 Advisor 工具，用大模型给小模型当顾问，专治死循环。想降本到小模型又怕质量跳水的团队，可以试试这个方案。

23:20

IT之家（RSS）

美团接入微信 AI 生态，未来提供外卖等 AI 生活服务体验

微信宣布向开发者提供 AI 生态接入功能，目前处于内测阶段。美团作为首批内测团队，已与微信联合开发并测试接入。未来用户可通过微信 Agent 调用美团外卖等本地生活服务，实现智能便捷的 AI 生活服务体验。此前携程已官宣接入微信 AI 生态，围绕酒店预订、机票等核心场景接入微信 AI Agent。另有传闻称京东也已作为首批内测团队接入。

智能体行业动态

23:20

IT之家（RSS）

Kimi 官宣将用 300 子 Agent 并行预测 104 场世界杯赛事，德国队或成市场低估黑马

月之暗面 Kimi 宣布调度 300 个子 Agent 并行分析 104 场世界杯赛事。每个 Agent 有独立视角，覆盖战术、球员、伤病、赛程、历史、舆情、赔率等维度，采用 Elo、FIFA 排名、Poisson、Dixon-Coles、xG/xT、Monte Carlo 模拟、贝叶斯等模型。最终以概率呈现并标注风险，不简单多数决。Kimi 框架认为西班牙、法国是夺冠热门，但模型发现德国队夺冠概率可能被市场低估。历史回测显示高置信度预测准确率约 85%-90%，中等约 55%-65%，低置信度接近随机。官方提示结果不构成投注建议。

智能体产品更新推理

23:12

Chubby♨️@kimmonismus

精选78

Hivemind推出面向AI编程智能体的持续学习功能，即日起开放

Hivemind发布面向AI编程智能体的持续学习功能，即日起开放。该工具收集团队运行的每个智能体（Claude Code、Codex、Cursor、Hermes、Pi）的轨迹，转化为可复用技能并推送到所有智能体，数据存储在用户自己的云存储中。内置SkillOpt使技能持续训练：Claude Code准确率提升+19.1分，Codex提升+24.8分，在全部52个测试设置中最佳或持平。开源，一行命令安装。

Davit: Coding agents that actually get better the more your team uses them. Introducing Hivemind: continual learning for AI cod...

智能体开源/仓库编码

推荐理由：Hivemind 让 Claude Code、Cursor 等不同 AI 编码助手互相学习，团队用得越多代理越准，开源一行安装，做工程管理的值得立刻试试。

22:54

gabriel@gabriel1

每份工作都将变成向 AI 解释你的意图向 AI 解释你想要什么其实相当耗时，程序员已经有 80% 的时间花在这上面，而这对每个人来说都将如此。

智能体现象/趋势

22:46

🚨 AI News | TestingCatalog@testingcatalog

Kimi for Work AI Agent已发布，支持原生Agent Swarm（多智能体群）、Browser Use（通过WebBridge实现）以及自有记忆系统。该应用可在macOS和Windows上运行，用户可本地启动多达300个智能体。官方表示这仅是开始，未来将增加更多数据源、工具和Agent能力。

Kimi.ai: 🔗Try it now: https://www.kimi.com/products/kimi-work We're just getting started. More data sources, more tools, more ag...

智能体产品更新

22:34

Kimi.ai@Kimi_Moonshot

同事件精选76

Kimi Work：本地桌面AI智能体，支持300智能体并行

Kimi发布Kimi Work，一款本地运行的桌面AI智能体。支持最多300个AI智能体同时在本地机器并行运行；配合WebBridge浏览器扩展，智能体可在浏览器中导航、搜索、点击、填写并完成任务；内置全球市场数据工具，可直接调用Yahoo Finance和世界银行数据，无需复杂API设置；记忆系统会记录用户偏好、过往决策和上下文。支持macOS（Apple Silicon）和Windows。

智能体 MCP/工具产品更新端侧

同一事件，精选展示《Kimi Work Beta版发布：面向知识工作者的本地Agent》

推荐理由：这个产品把AI agent从聊天窗口搬到了桌面，300个并行agent和内置金融工具直接对标专业人群，如果它能稳定运行，个人AI助手的形态又要被重新定义了。

22:14

elvis@omarsar0

关键在于，你应该开始实施在自动化中编码带有明确目标的指令/提示词的方法。这并不是什么新鲜事，但较新的大语言模型正在被训练以更长时间不间断地执行。循环就是利用这一点的一种方式。

Peter Steinberger 🦞: Here's your monthly reminder that you shouldn't be prompting coding agents anymore. You should be designing loops that p...

智能体大佬观点编码

22:09

The Decoder：AI News（RSS）

Frontier Radar #3：智能体AI如何将token转化为业务指标

生成式AI商业模式正从月订阅制转向按token消耗计费。智能体工作流消耗数倍于传统对话的token，可自主运行数小时，使固定费率不可持续。token价格因响应速度、专业化程度及结果经济价值而异。本期报告梳理订阅制向消费制迁移、看似低廉的token单价背后的实际成本，以及为何仅凭token消耗量衡量AI价值创造是片面的。

智能体现象/趋势

22:02

公众号：月之暗面（Kimi）

同事件精选76

Kimi Code 焕新升级（附视频教程）

Kimi Code 开源 Coding Agent 迎来大版本升级：一行命令安装，毫秒级启动；新增视频理解能力，支持提取视频风格生成 LUT 文件、长视频切片、根据录屏生成代码；集成同花顺、天眼查等权威数据源，可查询股票价格、财报、学术论文；支持 ACP 协议，可在 JetBrains、Zed 中使用；丰富 hook 生态方便集成其他工具。底层视觉推理由 Kimi K2.6 模型提供。

智能体产品更新开源生态编码

同一事件，精选展示《Kimi Code 焕新升级（附视频教程）》

推荐理由：Kimi Code 这次更新把安装和视频处理的门槛压到了最低，一行命令加拖拽视频就能用，开源 Agent 的体验终于开始反超商业版本。

21:50

Hugging Face：Blog（RSS）

精选62

开源社区支持 OpenEnv 用于智能体强化学习

今日，Hugging Face 宣布 OpenEnv 项目进一步开放，由 Meta-PyTorch、Reflection、Unsloth 等组成的委员会协调，并获得 PyTorch Foundation、vLLM、SkyRL（UCB）等机构支持。OpenEnv 是创建终端、浏览器等智能体执行环境的工具，定位为训练器与环境间的互操作层，标准化环境的发布、部署和消费，但不定义奖励或训练循环。它基于客户端/服务器架构提供 Gymnasium 风格 API（reset()、step()、state()），支持 HTTP、WebSocket、Docker 打包，并将 MCP 作为一等公民，使环境在模拟和生产模式下行为一致。未来将聚焦任务集对接数据集、外部奖励、Harness 集成及自动验证，以推动开源智能体 RL 基础建设。

智能体 Hugging Face MCP/工具 Meta

推荐理由：开源社区在 agent RL 环境上终于开始合流，Meta、Nvidia、Hugging Face 等联合推动 OpenEnv 成为接口标准，不做奖励框架，只做插线板。搞开源 agent 训练的人，这是少有的统一基础设施的机会。

21:50

Hugging Face：Blog（RSS）

精选57

五个模型经济体中消失的崩溃：控制与涌现

用五个不同实验室的AI模型（OpenAI、NVIDIA、OpenBMB及一个自微调的5亿参数模型）各自驱动一个智能体构建经济市场，试图复现此前单一模型下出现的银行挤兑式价格崩溃。结果同一场景下模型不仅不抛售反而囤积，导致价格不跌反涨。通过纯谣言、库存泛滥、加大做空三种方式均无法重现崩溃。最终在结算环节直接覆盖价格，使崩溃成为设计事实。实验表明，AI智能体的涌现行为是偶然的而非稳健的，有效系统需在涌现纹理与确定性控制之间找到精确接缝。

智能体大佬观点

推荐理由：做 agent 的人必读，自己动手构建一个多模型经济体后才发现，涌现行为脆弱，控制要卡在结算层而非输入层，廉价模拟器会给你虚假信心。这篇复盘比成功案例更值钱。

21:43

公众号：月之暗面（Kimi）

精选62

Kimi Code 焕新升级（附视频教程）

Kimi Code 开源 Coding Agent 大版本升级：一行命令安装，毫秒级启动；新增视频理解，可提取参考视频色调生成 LUT、将长视频切分为短视频、根据录屏生成代码；接入同花顺、天眼查等权威数据源，支持实时查询股票价格、财报和学术论文；兼容 ACP 协议，可在 JetBrains、Zed 等 IDE 使用；拓展 hook 生态方便集成。视频理解基于 Kimi K2.6 模型。通过 /plugins 安装 kimi-datasource 插件即可使用权威数据源。

智能体产品更新开源生态编码

推荐理由：Kimi Code 这次把视频理解功能做进了编码工作流，一行安装和 ACP 协议接入让上手成本几乎为零，做视频剪辑和自动化开发的同好值得一试。

21:20

IT之家（RSS）

9.9元/月起，字节火山引擎Agent Plan和Coding Plan限时优惠

字节跳动火山引擎宣布Agent Plan和Coding Plan限时优惠，两款套餐均集成MiniMax M3、DeepSeek V4系列、GLM-5.1等模型。即日起至2026年8月27日，新购、升级或续费Coding Plan Lite（原价40元/月）和Coding Plan Pro（原价200元/月），以及Agent Plan Small（原价40元/月）和Agent Plan Medium（原价200元/月），首两个月享2.5折，对应限时价9.9元/月和49.9元/月，第三个月起恢复原价。Agent Plan为火山引擎首推的“Agent套餐包”，内置字节自研Doubao-Seed、Seedance、Seedream模型，支持文本、代码、视频等多模态任务。

智能体编码行业动态

21:20

IT之家（RSS）

携程作为首批内测团队接入微信 AI 生态，聚焦酒旅出行等场景

6 月 8 日，微信开放平台发布指引，为开发者提供接入微信 AI 生态的能力，开发者可主动授权接入。携程小程序已作为首批内测开发者完成初步适配，未来将围绕酒店预订、机票查询、旅游度假、出行服务等核心场景接入微信 AI Agent。微信提供两种接入模式：自动模式（授权平台读取小程序源码，无需额外开发）和开发模式（开发者自主个性化开发，通过评测后可被微信 AI 调用），两种模式可同时开启。

智能体行业动态

20:36

小互@xiaohu

人机协作优于完全自动化：关键节点人工介入

小互分享个人经验：此前追求完全自动化，导致不断与AI扯皮、对技能和系统频繁修改，效果反而更差。现在删除所有规则，只在关键节点人工介入，与AI共同完成任务，不仅效果更好，人也轻松许多，不再频繁抱怨AI。

智能体大佬观点

20:14

歸藏(guizang.ai)@op7418

在字节工作8年的动效设计师笑林（@xiaolinbythesea）分享了设计工程师的五种画像：1） AI Design Engineer--将AI能力转化为可交互产品；2） Product UI Craft Engineer--从Figma写出高质量React原型；3） Design Systems Engineer--建立设计系统与代码基础设施；4） Creative Technologist--负责Canvas/WebGL动效与生成式视觉；5） AI Design Workflow Architect--搭建AI工具协作流程。他所在的豆包手机团队也在招聘侧重Android的设计工程师。

智能体现象/趋势