22:17

IT之家（RSS）

微软 Build 2026 发布 Project Solara，纳德拉否认 Scout 上瘾传闻

微软在 Build 2026 上与高通联合发布 Project Solara，主打“智能体优先计算”，系统运行 Agent Shell 动态加载云端 AI 智能体。纳德拉称正从为应用构建操作系统转向为智能体构建操作系统，此前已披露 Windows 11 将演进为智能体操作系统。针对 404 Media 报道的内部文件称微软曾计划让 AI 助手 Scout“上瘾”，纳德拉否认并称“胡说八道”。微软发言人表示 Scout 旨在帮助高效完成任务而非鼓励依赖，目标是减少屏幕时间。

智能体行业动态

21:30

Rohan Paul@rohanpaul_ai

精选80

GitHub 开源 Spec Kit 工具包，用产品规范引导 AI 编码

GitHub 发布开源工具包 Spec Kit，旨在解决 "vibe coding" 的最大弱点——AI 常在规则未明确时就开始编码。它把流程从 "让 AI 直接构建" 改为 "先写产品规范，再让 AI 根据规范实现"。当前 AI 编码模式常因松散提示直接跳入代码，导致需求薄弱、边界遗漏和反复返工。Spec Kit 推动反向流程：先定义产品功能，再澄清差距、制订技术计划、分解任务，最后让 agent 执行。规范成为可执行的开发合约，支持 Copilot、Claude Code、Codex、Gemini、Cursor、Qwen 等 30+ agent 集成。项目已获 109K+ 星标。

智能体 GitHub MCP/工具产品更新

推荐理由：GitHub亲自下场推spec-driven开发，把vibe coding的随意感压回“先写规约再写代码”的老派流程，但这次规约是给AI读的，做coding agent的团队应该认真研究一下。

20:29

meng shao@shao__meng

Anthropic 白皮书：面向 AI Agent 的零信任安全框架

Anthropic 5 月发布白皮书，提出企业部署自主 AI Agent 时须将零信任原则延伸至 Agent 架构。报告指出双重加速：前沿模型将漏洞发现到利用周期压缩至数小时；Agent 能自主解释目标、选工具、执行多步操作，传统访问控制无法阻止“合法权限内作恶”。核心原则：永不信任始终验证、假设已遭入侵、最小权限；另附设计检验——控制是让攻击不可能，还是仅增加麻烦？报告分五部分：Agent 为何是新安全对象、威胁图谱、三层能力成熟度模型、八阶段实施工作流、防御运营适配自主威胁速度。

智能体 Anthropic 安全/对齐部署/工程

19:59

The Decoder：AI News（RSS）

Meta的Hatch AI智能体每月最高200美元，成为其首个付费AI产品

Meta正在开发一款名为"Hatch"的付费AI智能体产品，月费最高200美元。用户只需用自然语言描述需求，Hatch即可构建工作工具、安排日程或发送邮件。Meta CEO马克·扎克伯格认为，该产品将开辟广告之外的新收入来源，为公司在AI领域的巨额投资提供资金支持。这是Meta推出的首个付费AI产品。

智能体 Meta 产品更新

19:48

Hugging Face：Blog（RSS）

精选58

Persona Atlas：Hugging Face 上的开源人物思维映射工具

Persona Atlas 是一个运行在 Hugging Face Inference Providers 上的开源项目。它通过工具调用代理执行真实网络搜索，生成公众人物的资料、事实清单和风格假设，然后让该人物回答十个关于身份、伦理等开放式问题。每个回答被转化为嵌入向量，从而在向量空间中对不同人物进行距离比较，并基于十个特质锚点绘制热力图。前端采用 Gradio，提供研究、比较和检查代理完整追溯三个标签页，预设多个人物角色，无需 token 即可直接体验。

智能体 Hugging Face 开源/仓库

推荐理由：把苏格拉底和乔布斯放在一起比思维方式，这个实验更像智力玩具，但背后用小模型跑 agent 搜索做嵌入比较的流程，做角色扮演的人可以学研究方法。

19:34

OpenRouter：Announcements（RSS）

同事件精选75

OpenRouter 30 场 AI 大逃杀：11 个 LLM 对决，Claude 与 Grok 谁更优？

OpenRouter 展开了 30 场 AI 大逃杀式对比，涉及 11 个大语言模型，共消耗 482 美元推理费用。实验得出一个发现，该发现应改变用户阅读模型基准测试的方式。

智能体 Anthropic xAI 安全/对齐

同一事件，精选展示《OpenRouter 翻遍 11 款 LLM 找最快的决策模型：Claude vs. Grok 领衔》

推荐理由：这场大逃杀实验把模型对齐税摆上了台面，Grok因少斟酌、多行动而胜出，Claude的犹豫反而是现实场景里更需要的品质，选模型不能只看赢不赢，要看任务需要什么性格。

18:08

🚨 AI News | TestingCatalog@testingcatalog

ANTHROPIC 🔥： Claude Cowork 限额已翻倍，所有付费计划持续到7月5日。 Cowork 时间 👀

Claude: We've doubled usage limits in Claude Cowork for the next month. Delegate bigger, more complex tasks to Claude.

智能体 Anthropic 产品更新