6月26日

08:00

HuggingFace Daily Papers（社区热门论文）

针对大语言模型多智能体系统协作不佳与缺乏细粒度信用分配的问题，提出GBC方法。GBC将多智能体系统建模为计算图，引入基于梯度的连接权重，在token级别量化每个智能体输出对下游的影响。通过构建归因图并反向传播任务损失，实现错误源精确定位与定向提示词优化。配套开发基于前缀梯度计算的AgentChord实现。在MultiWOZ和τ-bench上实验表明，GBC提升多智能体性能，超越强单智能体与多智能体基线，且归因质量越高优化效果越好。代码已开源。

智能体 GitHub 数据/训练论文/研究

08:00

HuggingFace Daily Papers（社区热门论文）

ProMSA：渐进式多模态搜索智能体用于知识型视觉问答

ProMSA是一种渐进式多模态搜索智能体，用于知识型视觉问答（KB-VQA）。给定图像-问题对，智能体在明确的工具调用预算和去重机制下，迭代选择图像搜索、文本搜索或停止。训练先通过拒绝采样SFT学习有效工具使用格式，再使用TN-GSPO序列级RL目标优化，该目标按生成长度和工具交互深度归一化更新。在E-VQA和InfoSeek基准上，ProMSA持续优于强RAG和智能体基线，提升了检索和端到端准确率。代码已开源。

智能体多模态论文/研究

08:00

HuggingFace Daily Papers（社区热门论文）

迈向自动化科学评审：Google 的 Paper Assistant Tool（PAT）

Google 发布 Paper Assistant Tool（PAT），一个用于深度科学评审和验证的智能体 AI 框架。PAT 能摄取完整学术论文，生成综合评估，包括检查理论结果、验证实验、提出改进建议和识别潜在缺陷。通过利用推理扩展技术，PAT 在 SPOT 基准上对数学错误的召回率比零样本提升 34%。该工具已在 STOC 和 ICML 两大计算机科学会议上作为作者预提交工具进行试点，可发现关键错误并提出实质性改进，在保留评审员对结果控制权的同时减轻其认知负担。

智能体 Google 推理论文/研究

06:12

Claude Code：GitHub Releases（RSS）

精选61

Claude Code v2.1.193 发布

Claude Code v2.1.193 新增 autoMode.classifyAllShell 设置，将全部 Bash/PowerShell 命令经自动模式分类器处理。自动模式拒绝原因现加入转录、拒绝提示及 /permissions 页面。新增 claude_code.assistant_response OpenTelemetry 日志事件（默认不记录，需设置 OTEL_LOG_ASSISTANT_RESPONSES=1）。Bash 模式支持实时文件路径自动补全；MCP 服务器需认证时显示启动提示。新增空闲后台 shell 命令自动内存压力回收（可禁用）。修复 /model UI 状态滞后、后台任务误取消、子 agent 隐藏同级等问题，并改进了后台 agent 启动指令、MCP 认证重连、插件自动重命名等行为。

智能体产品更新编码

推荐理由：一次扎实的工具更新，自动模式覆盖所有 shell 命令和 MCP 认证重连是最实用的改进，后台任务内存回收也解决了长期痛点，Claude Code 用户值得更新。

04:38

TechCrunch：AI（RSS）

Patronus AI 获 5000 万美元 B 轮融资，构建"数字世界"压力测试 AI 智能体

Patronus AI 宣布完成 5000 万美元 B 轮融资，由 Greenfield Partners 领投，Notable Capital、Lightspeed、Datadog 和 Samsung 参投，累计融资达 7000 万美元。该公司由前 Meta AI 研究员于 2023 年创立，利用“数字世界模型”创建网站和内部系统的模拟副本，通过强化学习对 AI 智能体进行压力测试，迭代奖励成功并惩罚错误。目前服务覆盖软件工程和金融领域，几乎所有前沿 AI 实验室和初创公司均为客户，过去一年收入增长 15 倍。

智能体安全/对齐行业动态

03:26

Ars Technica：AI（RSS）

Notion 宣布 9 月 22 日关闭 Notion Mail，全力投入 AI 智能体

Notion 今日宣布将于 9 月 22 日关闭 Notion Mail（网页、桌面和 iOS）。公司表示，超过半数用户通过 AI 智能体管理邮件而无需打开收件箱，因此决定全力投入智能体方案。用户邮件历史仍保留在 Gmail，但须在 9 月 21 日前导出草稿和定时邮件。依赖 HIPAA 覆盖的组织需在 2026 年 6 月 30 日前迁移。Notion Mail 由收购的 Skiff 团队打造，Skiff 曾服务 200 万用户。

智能体行业动态

02:41

Runway：News（网页）

精选65

Runway发布Agent 2.0

Runway发布Agent 2.0，帮助营销人员创建、测试和优化广告、视频及营销活动。品牌营销人员可在对话中开发活动概念、生成变体并自动本地化；绩效营销人员可上传创意并导入Meta、YouTube、TikTok或Google广告数据，由Agent分析后生成下一轮待测广告。社交媒体营销人员可一次性生成一周内容，自动裁切为9:16、16:9、1:1等格式；产品营销人员可借助Agent确定定位角度并构建活动资产。Agent 2.0面向所有用户开放。

智能体产品更新视频

推荐理由：Runway的Agent 2.0不只是生成视频，它试图打通从广告数据分析到全平台素材生成的闭环，做增长和社交内容的团队可以观望一下。

01:34

MarkTechPost（RSS）

DeepReinforce 发布 Ornith-1.0 开源编码模型族

DeepReinforce 发布 Ornith-1.0 开源编码模型族，基于 Gemma 4 和 Qwen 3.5 后训练，提供 9B、31B、35B-MoE（每 token 激活约 3B 参数）和 397B-MoE 四个尺寸，均以 MIT 许可在 HuggingFace 开放。与固定人工设计框架的编码智能体不同，Ornith-1.0 在强化学习中联合优化框架与解决方案，并引入三层防御（固定信任边界、确定性监视器、冻结 LLM 裁判）防止奖励黑客。旗舰版 Ornith-1.0-397B 在 Terminal-Bench 2.1 上得分 77.5、在 SWE-Bench Verified 上得分 82.4，超越 Claude Opus 4.7（70.3）但低于 Claude Opus 4.8（85）和 GLM-5.2-744B（81.0）。支持 vLLM、SGLang 等推理框架，9B 模型（bf16 约 19GB）可部署在单张 80GB GPU 上。

智能体开源/仓库模型发布编码

00:37

TechCrunch：AI（RSS）

精选71

General Intuition 完成 3.2 亿美元融资，用游戏数据训练通用 AI 智能体

General Intuition 以 23 亿美元估值完成 3.2 亿美元融资，累计披露融资 4.54 亿美元。公司从旗下游戏剪辑平台 Medal 获取数亿小时含精确按键动作标签的游戏操作数据，训练单一模型同时驾驭 Fortnite 等虚拟环境和四足机器人。演示中，AI 智能体在游戏中连续运行 100 小时，机器人仅靠 8 分钟真实街道数据微调即可自主探索办公室。本轮由 Khosla Ventures 领投，General Catalyst、Jeff Bezos、Eric Schmidt 等参投。资金将用于通过 CoreWeave 扩大计算规模、预训练下一代模型，计划夏末前开放 API。

智能体具身智能数据/训练行业动态

推荐理由：用游戏按键数据训练世界模型，并在真机上八分钟完成适配，这个思路让具身智能看到了一条可规模化的路径。投资人押注的其实是 Medial 独有的动作标注数据飞轮。

00:04

Hacker News：AI 热帖

精选71

OpenKnowledge：开源、AI 优先的 Obsidian/Notion 替代品

OpenKnowledge 是一款开源、本地优先的 Markdown 编辑器，私密免费，提供完整的所见即所得编辑体验。支持 macOS 桌面应用和 Web UI，内置文件导航、搜索、标签和图谱 wiki 链接查看器。可与 Claude、Codex、Cursor 等桌面应用协同实现 AI 编辑，并通过 MCP/CLI 兼容任意 AI 智能体框架。自带 MCP、技能和智能搜索，支持 LLM Wiki 和知识图谱。团队协作基于 Git/GitHub 实现无代码共享与自动同步。支持嵌入 HTML 及富文本组件。桌面应用内建 TUI，Linux/Windows/Intel Mac 用户可通过 CLI（Node.js 24+）以本地 Web 应用运行。可直接打开任何包含 Markdown/MDX 文件的文件夹。开源协议 GPL-3.0-or-later。

智能体 MCP/工具产品更新

推荐理由：把 Claude、Codex 等 AI 代理直接嵌进知识库编辑器，想法比 Notion AI 更灵活，但这类工具最终拼的是细节打磨和生态，现阶段可以尝鲜但别急着切换主力。

6月25日

19:30

公众号：百度智能云（文心）

浦发银行携手百度智能云：超2500个金融智能体上岗，覆盖营销风控等核心场景

浦发银行全行已上线超2500个金融智能体，近200个深度嵌入真实业务流程，覆盖营销、风控、运营等核心场景。智能体采用低代码与高代码结合、商用与开源模型互补的研发模式，并首创“三态管理”（创设、发布、运行）适配金融强监管。财报智能识别分析智能体将企业财报录入、校验与分析流程从数小时压缩至分钟级。百度智能云提供四层金融AI基础设施，包括昆仑芯国产芯片、异构算力平台、金融专精大模型及全流程AI治理平台。浦发银行计划推出面向C端的数字客户经理与数字分身，以对话交互实现“对话即服务”。

智能体行业动态部署/工程

18:13

HuggingFace Daily Papers（社区热门论文）

开放权重LLM中的约束代价：结构化输出约束下工具调用抑制的实证研究

当同时启用Tool Calling与JSON Schema约束时，多个开放权重LLM出现工具调用抑制（Tool Suppression）。控制实验在多模型与部署设置下复现了该现象。分析表明，JSON Schema约束被编译成基于语法的token掩码，导致工具调用token在解码中不可达。研究提出约束优先级反转（CPI）假设，并设计透明两遍执行（Transparent Two-Pass Execution）推理策略，将工具执行与模式约束响应生成解耦，无需重训练即可恢复工具调用并维持结构化输出。结果表明，单独评估工具使用与结构化输出可能掩盖生产Agent系统的可靠性问题。

智能体论文/研究部署/工程

18:07

The Decoder：AI News（RSS）

高通凭借自研处理器进入数据中心市场

高通推出数据中心处理器 Dragonfly C1000，针对 AI 智能体优化，主打低功耗高能效。Meta 计划 2028 年起部署该芯片。同时，高通以约 40 亿美元收购 AI 初创公司 Modular，其软件支持跨芯片架构运行 AI 应用。去年高通已发布两款数据中心 AI 加速芯片。受消息提振，高通盘后股价上涨 15%，公司预计到 2029 年非智能手机业务营收将翻倍至 400 亿美元，其中数据中心目标 150 亿美元。

智能体 Meta 产品更新推理

17:09

OpenAI：官网动态（RSS · 排除企业/客户案例）

精选65

OpenAI内部报告：智能体Codex如何改变工作

OpenAI 在2025年8月至2026年6月间观察到，智能体产品 Codex 取代 ChatGPT 成为主要工作工具，各部门输出 token 中 Codex 占比从不足10%升至99.8%。80.6%个体用户曾发起预计等效人类工作时间超30分钟的请求，70.2%超1小时，25.6%超8小时；99百分位用户每日生成超60小时 agent turns。非开发者用户增长迅猛：个体用户增长137倍，组织用户增长189倍。Legal、Finance、Recruiting 部门在2026年4月前后跨过 Codex 使用过半拐点，平均每位律师或招聘人员超85%输出 token 来自 Codex。

智能体 OpenAI 现象/趋势论文/研究

关联讨论 2 条

推荐理由：OpenAI 第一次用内部数据量化智能体如何改变工作，非开发者增速 137 倍比工程师还猛，Codex 已经吃掉内部 99.8% 的输出 token——这不是产品更新，但比大多数发布会都更值得做策略的人看一眼。