6月4日

06:59

Orange AI@oran_ge

ColaOS 正在招聘 Agent OS 交互设计师和 Agent QA 岗位，工作地点北京海淀。交互设计师支持远程，QA 必须本地。设计师需推翻旧定义、主导系统交互；Agent QA 需极致使用 Agent 才能跟上工程师节奏。同时招聘 Agent 产品岗位，要求具备定义问题的能力，无固定 JD，需自行回答“什么是 Agent 产品”，答案即最好的介绍信。联系邮箱 k@marswave.ai。

智能体行业动态

06:09

OpenClaw🦞@openclaw

OpenClaw 2026.6.1 已上线 🦞 🪟 原生 Windows 节点主机 🛠️ 用于自主学习型智能体的技能工坊（Skill Workshop） 📋 工作板（Workboard）编排 🧠 支持 MiniMax M3 Windows 加入集群。无需企鹅服。 https://github.com/openclaw/openclaw/releases/tag/v2026.6.1

智能体 GitHub 产品更新开源/仓库

06:09

OpenClaw🦞@openclaw

Agent应当学习重复工作，但不能通过静默重写未来运行来实现。 Skill Workshop将可重用的Agent经验转化为可审查的提案，你可以在它们成为实时技能之前进行调整、应用或拒绝。 https://openclaw.ai/blog/openclaw-agent-skill-workshop

智能体产品更新

05:58

Claude Code：GitHub Releases（RSS）

精选59

Claude Code v2.1.162 发布

Claude Code v2.1.162 发布，主要包含 Bug 修复和体验优化。claude agents --json 新增 waitingFor 字段，/effort 命令确认级别持久化，远程控制固定底部显示，/ide 菜单中 Windsurf 更名为 Devin Desktop。修复了配置文件只读导致启动黑屏、Windows 权限规则不匹配、LSP 的 workspaceSymbol 无结果、API 400 错误、MCP 超时低于 1000ms 被截断等十余项问题。

智能体 Anthropic 产品更新编码

推荐理由：一系列扎实的修复，尤其是 Windows 权限匹配和启动挂死问题的解决，对于日常用 Claude Code 做开发的来说稳定性提升明显，可以升级。

05:58

MiniMax (official)@MiniMax_AI

同事件精选78

Mem0 是 MiniMax M3 的官方启动合作伙伴！ M3 的 1M token 上下文窗口 + @mem0ai 的记忆层 = 真正记住的 AI 应用。构建具有持久记忆的个性化 AI 智能体，现在启动周内 M3 享五折优惠。开始使用 Minimax → https://platform.minimax.io/docs/guides/models-intro 注册 mem0 → http://app.mem0.ai/?utm_source=minimax_x_post

智能体 MCP/工具模型发布

同一事件，精选展示《MiniMax M3：前沿编码、100万token上下文与原生多模态一体模型》

推荐理由：MiniMax 把 1M 上下文和 Mem0 记忆层绑在一起，不是单纯秀参数，是给 Agent 装了个硬盘，做长期记忆产品的该关注一下。

05:57

Greg Brockman@gdb

GPT-Rosalind 重大升级，药物发现、分析、设计和实验工作流的智能大幅提升：

OpenAI: We're bringing new capabilities to GPT-Rosalind, a model series purpose-built for life sciences research at enterprise s...

智能体 OpenAI 模型发布

05:08

swyx@swyx

TownAI 结束 beta 正式发布，同时宣布完成 5500 万美元 A 轮融资，由 a16z 领投，Forerunner Ventures 等跟投。该 AI 助手可连接用户的邮箱、日历、Slack、文档等，在理解个人工作习惯后自动执行草稿、排程、项目跟踪、跟进等多步任务，且仅当用户授权时才行动。swyx 称其为"Everything Else 的 Devin"，他在公司引入后，团队自然采用，无需额外推广，自己虽未能投资但已成为日常活跃用户。

Jean-Denis Greze 💡: Today, we're launching @TownAI: the AI assistant that learns you. We're coming out of beta with a $55M Series A led by @...

智能体产品更新行业动态

04:57

ClaudeDevs@ClaudeDevs

我们如何用 Claude 自动化商业分析？新博客文章，涵盖构建数据智能体时在技能、数据基础和评估方面的最佳实践： https://claude.com/blog/how-anthropic-enables-self-service-data-analytics-with-claude

智能体 Anthropic 教程/实践

04:55

AI Notkilleveryoneism Memes ⏸️@AISafetyMemes

深圳无人机正在执行交通规则。

AI Notkilleveryoneism Memes ⏸️: Watch this video. Now imagine this swarm, controlled by AI agents, with an explosive on each drone. It's Biblical.

智能体安全/对齐

04:28

MiniMax (official)@MiniMax_AI

@mem0ai 是 MiniMax M3 的官方发布合作伙伴！ M3 的百万 token 上下文窗口 + @mem0ai 的记忆层 = 真正能记住的 AI 应用。构建带有持久记忆的个性化 AI 智能体，发布周期间 M3 可享 5 折优惠。开始使用 Minimax → https://platform.minimax.io/docs/guides/models-intro 注册 mem0 → http://app.mem0.ai/?utm_source=minimax_x_post

智能体 MCP/工具模型发布

04:19

Rohan Paul@rohanpaul_ai

投资金融AI助手Leni：报告提速80%，超越GPT/Claude

Leni是一个面向房地产、私募股权和投资金融的多智能体系统，声称报告生成速度提升80%，在投资任务上超越GPT/Claude，输出全源可追溯。它可同时分析数百个文件，自行推理、交叉验证并输出承销工作簿、市场研究、IC备忘录等成品。据称已被机构用于管理超$80B资产，处理超1亿行数据。创始人强调，大额投资场景下“大致正确”毫无意义，Leni的核心目标是实现可验证、可信任的投资级AI决策。

Arunabh Dastidar: "Mostly right" is useless when millions of dollars are on the line. That's why we built Leni: the world's most accurate ...

智能体产品更新

04:15

Cursor Blog

精选60

Cursor Enterprise 推出 Organizations 组织管理功能

Cursor Enterprise 正式推出 Organizations 结构，允许企业在统一面板中管理多个团队。每个团队可独立设置预算、安全策略、模型访问和功能控制。新增 Groups 作为跨团队或团队内的轻量级用户集合，用于分段管理模型访问、花销上限和智能体权限，不同设置取最宽松权限生效。管理员可创建沙箱团队预先测试新功能，再向全公司推送；也可按部门划分模型访问和预算。组织级仪表盘汇总所有团队的 token 用量与花费，支持按团队、用户等维度筛选。身份提供商和 SCIM 目录在组织层面一次配置，成员自动同步。该功能现已全面开放给所有 Enterprise 客户。

智能体产品更新编码

推荐理由：这是 Cursor 企业版在治理能力上的关键补丁，把多团队预算、模型权限和沙盒测试管了起来，对想把 AI 编程推到千人规模的团队是实打实的基建更新。

03:38

xAI@xai

认识由Gopuff和SpaceXAI推出的Go：你的个人购物助手，它知道你想要什么，并在几分钟内送达。由Grok文本、音频和图像模型驱动。

Gopuff: Meet Go. Gopuff's AI shopping genius, co-developed with SpaceXAI. Just say what you need. It's already on its way.

智能体 xAI 产品更新

03:36

Satya Nadella@satyanadella

感谢你加入我们的Build大会，黄仁勋！感谢与NVIDIA在云和边缘领域的深度合作。

NVIDIA: The agentic AI era is here. From Taipei, Jensen Huang joined @satyanadella at #MSBuild to show how NVIDIA and @Microsoft...

智能体 Microsoft 行业动态

02:17

The Verge：AI（RSS）

Google Gemini AI 智能体 Spark 上手体验：高效得令人不安，但也暴露了空洞的承诺

Google 发布 Gemini AI 智能体 Spark，同事 David Pierce 和 Jay Peters 分别进行了体验。Spark 能够自动获取用户未明确输入的信息，例如 David 的狗名 Frida 和 Jay 妻子的名字。尽管功能强大，但文章指出，这种对“生产力”的追逐忽略了真正需要解决的问题。

智能体 Google 现象/趋势

02:15

Ethan Mollick@emollick

5月初，顶级超级预测者预计2026年底前最长METR 80%任务时间范围可达3-4小时。然而5月底，Anthropic的Claude Mythos模型在METR基准预览中即以80%成功率达到3小时6分钟，直接落在专家和超级预测者对2026年底的中位数预测范围内（3-4小时）。此前基线为1.5小时。此次突破表明AI能力进展速度远超预期。

Forecasting Research Institute: We also asked forecasters to predict the longest 80% success time horizon achieved by the end of 2026. All three groups ...

智能体 Anthropic 大佬观点

01:36

Perplexity@perplexity_ai

Perplexity Computer 适用于成长型企业。它可连接超过400种工具，涵盖各类公司需求，包括Intuit QuickBooks、Vercel、Shopify、Canva等。了解更多关于企业如何使用Computer进行业务操作： https://www.perplexity.ai/enterprise/use-cases/growing-businesses

智能体 MCP/工具产品更新

01:23

Claude：Blog（网页）

精选68

Claude Code技能使用经验：Anthropic内部实践

Anthropic 分享了内部使用 Claude Code 的 Skills（技能）功能的经验。Skills 是指令、脚本和资源的文件夹，智能体可发现并调用它们以提升准确性和效率。Anthropic 内部已有数百个活跃使用的技能，它们可归为九类，包括库和 API 参考、产品验证、数据获取与分析、业务流程与团队自动化、代码脚手架与模板、代码质量与审查等。最佳技能专注于单一类别，涵盖过多功能会混淆智能体。团队发现，投入时间优化验证类技能对 Claude 输出质量的提升最显著。

智能体 Anthropic MCP/工具教程/实践

推荐理由：这不是产品公告，而是从几百个内部技能中血泪总结出的实战手册。如果你想让Claude Code真正变成你的工程副驾驶，这9类技能和‘gotchas’章节至少省你三个月踩坑。

01:23

Claude：Blog（网页）

精选73

Anthropic 用 Claude 赋能自助数据分析

Anthropic 使用 Claude 自动化了 95% 的业务分析查询，整体准确率约 95%。其关键在于构建智能体分析栈（agentic analytics stack），通过数据基础层、维护验证流程和技能（skills）分别解决概念-实体歧义、数据过时和检索失败三大错误来源。相比编码场景，数据分析的难点在于将用户问题映射到正确的数据实体，而执行 SQL 反而是简单的。Anthropic 的数据科学团队因此得以专注于因果建模、预测和机器学习等战略工作。

智能体 Anthropic 教程/实践数据/训练

推荐理由：Anthropic 把内部用 Claude 搞自助分析踩过的坑全摊开，技能模板和「语义层优先」的强制流程是实打实的干货，做数据 agent 的团队可以直接抄作业。

01:18

Rohan Paul@rohanpaul_ai

Nitrosend 发布 AI 邮件平台，Claude 单提示词控制全流程

Nitrosend 推出 AI 原生邮件平台，通过 MCP 协议与 Claude 连接。用户只需一条提示词，Claude 即可完成构建、设计、受众分组和发送完整邮件活动，而非仅生成草稿。该平台无传统仪表盘，Claude 直接控制系统工作流，包括设计、逻辑、目标定位和投递。引用推文显示，已有用户通过一条提示词成功向 10,000 人发送发布公告。

George Hartley ☄️: I just sent our launch announcement to 10,000 people. It took one prompt in Claude. Today we're launching @nitrosendx - ...

智能体 Anthropic MCP/工具产品更新

00:17

elvis@omarsar0

微软SkillOpt论文：AI智能体技能实现自我进化

DAIR.AI的Elvis Saravia将微软SkillOpt论文集成到智能体编排器中后，所有智能体技能获得测试框架与自我演化机制。应用于多模态论文图表提取技能时，质量评分从0.73提升至0.93（+20点），提取结果显著改善。Saravia认为这是自我改进AI的早期范例，该思路可扩展至智能体模式优化、工具使用、上下文工程、智能体搜索及工作流评估等环节。他已基于SkillOpt启动多项后续实验。

智能体 Microsoft 多模态大佬观点

00:07

Google Developers Blog（RSS）

在笔记本电脑上运行 Gemma 4 12B：借助 Google AI Edge 解锁本地智能体工作流

Google DeepMind 的 Gemma 4 12B 模型可在 16GB RAM 的普通笔记本上运行，支持本地数据处理与视觉洞察生成。macOS 用户可通过 Google AI Edge Gallery 执行动态 Python 代码与可视化，通过 Google AI Edge Eloquent 实现完全离线的语音听写和文本编辑。另外，LiteRT-LM CLI 新增 serve 命令，可创建行业兼容的本地端点，驱动完全本地的 AI 工具和智能体。

智能体 Google 产品更新多模态

关联讨论 8 条

00:01

eric zakariasson@ericzakariasson

Cursor 推出 Debug Mode：让 AI 智能体通过运行时日志修复 Bug

Cursor 发布 Debug Mode，解决 AI 智能体靠猜测修 Bug 的问题。工作流程：Agent 先生成多个假设，为最可能的假设添加日志（不修改代码）；调试服务器在程序运行时收集输出到 .cursor/debug.log；用户重现 Bug 后，Agent 读取日志而非猜测；最后 Cursor 从日志找到根因并修复，自动移除添加的日志。内部案例：追踪 1/20 概率出现的 git 元数据竞争条件（1 小时内定位）；一次单趟追踪内存泄漏（修复仅一行）；定位 Electron 中 C++ 原生崩溃；修复此前无人敢碰的 SSR 闪烁问题。用户可通过 Shift+Tab 或在 CLI 中使用 /debug 触发。

智能体产品更新编码部署/工程

6月3日

23:35

Perplexity@perplexity_ai

Personal Computer 即将登陆 Windows。面向 Windows 的 Personal Computer 在你的机器上运行，并协调你每天使用的应用和文件。我们将首先向等候名单上的付费 Max 和 Enterprise Max 订阅用户推送。

智能体产品更新端侧

23:32

Google Gemini@GeminiApp

同事件精选67

参加 @GoogleDeepMind 首席工程师 @__apf__ 的演示，了解 Gemini Spark 如何帮助简化您的日常工作流程。由 Gemini 3.5 Flash 驱动，Spark 建立在 Gemini 与 @GoogleWorkspace 应用（如 Docs 和 Gmail）连接的能力之上，以执行复杂任务。

智能体 Google MCP/工具产品更新

同一事件，精选展示《Gemini 3.5：具备行动能力的前沿智能》

推荐理由：这是 Gemini 把 Agent 能力真正嵌入日常工作流的一步，跟 Workspace 的深度集成会让很多不会编程的人也能用上自动化，值得关注。

23:17

elvis@omarsar0

Google 新研究 LEAP：通用大模型封装在智能体框架中，解决全部 Putnam 2025 问题

Google 新研究 LEAP 将通用大语言模型封装在智能体框架中，每个步骤基于 Lean 编译器，并依赖验证器反馈进行迭代。同一通用模型解决了全部 12 道 Putnam 2025 问题，并将 Lean-IMO-Bench 一次性解决率从不到 10% 提升至 70%，击败了得分 48% 的专业金牌系统。论文链接：https://arxiv.org/abs/2606.03303。

智能体 Google 推理论文/研究

23:11

Alibaba Cloud@alibaba_cloud

阿里巴巴集团首席技术官李飞飞博士与NousResearch战略主管Tommy Eastman 我们大规模编排智能，重塑知识工作，赋予智能体自主性需要可复现的行动--这就是Hermes智能体成功的核心秘诀。

智能体行业动态

23:09

向阳乔木@vista8

GPT 5.5 Pro 生成 Codex Goal 指令使用文档，分享两个技巧

GPT 5.5 Pro 调研生成了一份 Codex 的 Goal 指令使用文档，分享两个技巧：1. 写不好 Goal 时先用 /plan 模式，让 AI 反问用户来完善命令，提示词模板为 /plan Help me turn this vague task into a strong Codex goal...；2. 写好 Goal 的六要素：结果、验证、约束、边界、迭代策略、阻塞条件。官方标准模板为 /goal [Outcome]. Verification: [...] Constraints: [...] Boundaries: [...] Iteration policy: [...] Stop when: [...] Pause if: [...]。详细报告含多个可直接使用的模板。

智能体 OpenAI 教程/实践编码

22:16

The Verge：AI（RSS）

微软与OpenAI分手--如今他们准备开战

在年度Build大会上，微软宣布了一系列AI新举措，包括超级应用、自研推理模型、网络安全工具和OpenClaw风格的AI智能体。该公司此前长期依赖与OpenAI的独家合作，但这段充满戏剧性的关系已在4月底实质上破裂（微软仍保留OpenAI主要云合作伙伴身份）。微软正以独立姿态成为AI领域的重要玩家。

智能体 Microsoft 产品更新推理

22:09

IT之家（RSS）

同事件精选73

月之暗面 Kimi Work Beta 版开启内测：面向知识工作者的通用型本地 Agent

月之暗面今日宣布，Kimi Work Beta 版随最新版 Mac 和 Windows 客户端开启内测。Kimi Work 是基于 Kimi Code 的通用型本地 Agent，支持安装使用技能、运行定时任务，并继承在线版的专业技能与数据库，内置可调用浏览器的 Kimi WebBridge。用户用自然语言描述目标即可自动拆解任务、并行执行并交付产物。支持 Agent 集群，最高可创建含 300 个子 Agent 的团队。官方透露，Kimi Work 自身由 Kimi Code 写成，工程师一周内完成客户端开发，累计产出超 5 万行有效代码，其中 92% 由 AI 自主生成。

智能体产品更新端侧编码

同一事件，精选展示《Kimi Work Beta版发布：面向知识工作者的本地Agent》

推荐理由：月之暗面把AI Agent搬到了本地，不是聊天窗口，而是直接操控你的电脑。92%的代码由AI自己写的自举能力，比功能本身更吓人。做办公自动化的同行该看看怎么被卷了。

22:09

IT之家（RSS）

摩根士丹利将向外部 AI 智能体开放万亿美元资管业务接口

摩根士丹利将向外部 AI 智能体开放其关键财富管理渠道。客户部署的 AI 智能体可直接从股权管理平台 ShareWorks 和 Equity Edge 提取数据，绕过传统人类界面。该公司已归集 1.2 万亿美元受托资产。摩根士丹利已向少数客户授予早期访问权限，计划明年覆盖其 3,400 家托管客户。竞争对手摩根大通和高盛已在内部使用 AI 智能体，但尚未对外开放。

智能体行业动态部署/工程

21:45

TechCrunch：AI（RSS）

Meta 面向 WhatsApp Business 的 AI 智能体现已全球上线

Meta 为 WhatsApp Business 打造的 AI 智能体面向全球商家开放，将按照模型 token 使用量向企业收费。

智能体 Meta 产品更新

21:30

公众号：月之暗面（Kimi）

精选67

Kimi Work Beta版发布：面向知识工作者的本地Agent

Kimi Work Beta版随Kimi最新Mac和Windows客户端推出，是基于Kimi Code的通用型本地Agent。它内置Kimi WebBridge浏览器操作方案，支持安装和使用Skill、运行定时任务，并能根据任务复杂度自主创建最多300个子Agent的团队。开发中使用的Kimi K2.6模型支持13小时连续编码、4000余次工具调用，累计产出超5万行有效代码，其中92%由AI自主生成。用户可用自然语言描述目标，Kimi Work即可拆解任务、并行执行、调用工具、操作浏览器，交付文档、表格、PPT等工作产物。

智能体 MCP/工具产品更新

关联讨论 3 条

推荐理由：Kimi 把代码 Agent 的本地能力包装成了面向普通人的工作 Agent，300 个子 Agent 集群让繁琐的任务并行处理成为可能，对天天跟文档表格打交道的人是真提效。

21:25

🚨 AI News | TestingCatalog@testingcatalog

Capafy 推出 5 个预制电商技能，每个均由一线运营者将实践手册打包成 AI 智能体。包括：Commerce Video Ad Maker（上传 1-3 张产品图生成适配 TikTok Shop、Amazon、Meta 等平台的广告视频）；Amazon Listing Image Generator（按买家疑虑顺序生成主图到画廊，用 GPT Image 2 检查合规性）；Paid Ads Diagnose（分析 ROAS 下降或 CPA 飙升原因，给出扩量或暂停建议）；Amazon Listing Fix Kit（逐行检查详情，提供重写文案、7 图计划、A+ 内容和索赔安全标识）；Amazon/TikTok Shop SOP Generator（生成逐条执行的 SOP 并标注违规风险）。Capafy 定位为技能智能体市场，支持上传技能并按次收费。

Capafy: Introducing 5 Capafy e-commerce Skills. Behind each of these 5 Skills is an operator who has spent years on the e-commer...

智能体教程/实践

21:14

TechCrunch：AI（RSS）

Coralogix 获 2 亿美元 F 轮融资，押注 AI 智能体监控需求

Coralogix 完成 2 亿美元 F 轮融资，估值达 16 亿美元。本轮距上次融资不到一年，公司押注 AI 智能体监控将成为重要需求。

智能体行业动态部署/工程

20:57

Simon Willison 博客

datasette-agent-micropython 0.1a0 发布

Datasette Agent 推出的新子项目 datasette-agent-micropython 0.1a0 发布，旨在让 Datasette Agent 能够安全地生成和执行 Python 代码。该 alpha 版本采用沙箱隔离机制，目前 GPT-5.5 尚未能逃逸出沙箱。

智能体开源/仓库部署/工程

20:48

Rohan Paul@rohanpaul_ai

EvoMap AI：将AI智能体经验转化为可复用基础设施

EvoMap AI致力于解决AI智能体每个新会话都要重复学习上下文的问题。其核心概念是Gene（可复用的问题解决策略）和Capsule（验证过的执行记录）。智能体遇到相似任务时，查询EvoMap网络获取匹配的Gene/Capsule，应用已有策略，再将结果反馈改进模式。这使每次成功运行成为可复用资产，而非一次性推理。适用于编码迁移、安全修复、SIEM分类等场景，可减少重试、降低token消耗、提升执行一致性，并提供审计溯源。用户可访问evomap.ai/onboarding/agent连接智能体（如Cursor、Claude Code、Codex），发布工作流并赚取积分。