10月1日

00:00

Claude：Blog（网页）

Anthropic宣布Claude与Slack双向集成功能正式上线。用户可直接在Slack工作区添加Claude，在频道和线程中获取AI协助；也可将Slack连接至Claude，让AI搜索历史对话和文件提取上下文。该集成支持私信、AI助手面板和线程参与三种方式，可起草回复、准备会议及创建文档。功能现已向付费Slack团队开放，连接器适用于Claude Team、Enterprise及Pro/Max用户。Claude仅访问用户有权限的频道内容，严格遵循企业安全与隐私设置。

智能体 Anthropic MCP/工具产品更新

关联讨论 1 条

9月30日

02:52

Ethan Mollick：One Useful Thing（RSS）

精选

真正的 AI Agents 与真正的工作

探讨 AI Agents 在真实工作场景中的定位，指出其核心挑战在于对抗"无限PPT"的形式主义陷阱。强调真正的智能体应当服务于以人为本的实质性工作，而非制造更多文档流程或官僚化产出。

智能体大佬观点

推荐理由：Ethan Mollick 深度解析 AI Agent 在实际工作中的应用与人类价值重塑

9月29日

00:00

Anthropic：Engineering（事故复盘 + 工程实践 · 网页）

精选78

为AI智能体实施有效的上下文工程

随着AI应用从单次提示转向构建长期运行的智能体，焦点正从“提示工程”演进为“上下文工程”。后者旨在为大型语言模型优化有限的上下文窗口内的全部信息，包括指令、工具、外部数据和对话历史。其核心挑战在于模型存在“注意力预算”限制和“上下文腐化”现象——随着上下文增长，模型回忆信息的准确性会下降。因此，上下文工程要求精心编排高价值信息，以有限的资源最大化产出期望结果，这已成为构建高性能、可操控智能体的关键。

智能体 Anthropic MCP/工具教程/实践

推荐理由：Anthropic 亲自下场定义 context engineering 这个新范式，把 prompt engineering 之后的工程方法论讲透了。做 Agent 的人如果还在死磕 prompt，这篇会让你重新审视整个技术栈。

9月23日

21:41

Sam Altman：Blog（RSS）

精选

充裕的智能

计划打造每周可新增1吉瓦算力的AI基础设施工厂，通过芯片、电力到机器人的全栈创新，支撑治愈癌症、全球个性化教育等宏大应用。项目将主要落地美国，未来数月公布合作伙伴，年底披露融资方案。

智能体 OpenAI 大佬观点部署/工程

推荐理由：Sam Altman阐述OpenAI基础设施扩张愿景，计划每周新建1吉瓦算力

9月22日

21:15

公众号：DeepSeek（深度求索）

DeepSeek-V3.1 版本更新

DeepSeek-V3.1 版本更新发布，主要包括修复若干已知问题，Agent 能力进一步提升。这是本次版本更新的核心内容，旨在优化用户体验。

智能体 DeepSeek 模型发布

9月11日

00:00

Anthropic：Engineering（事故复盘 + 工程实践 · 网页）

精选73

为智能体编写高效工具--与智能体协作

文章探讨如何为基于大语言模型的智能体设计高效工具。核心方法是通过与智能体（如Claude Code）协作，采用快速原型构建和全面评估的迭代流程来优化工具性能。关键设计原则包括：选择适当的工具实现范围，使用命名空间明确功能边界，从工具向智能体返回有意义的上下文，优化响应以提高token效率，以及对工具描述进行提示词工程。工具本质上是确定性系统与非确定性智能体之间的新契约，设计应优先考虑智能体的使用体验，而非传统开发者导向的API思路，以扩大智能体解决实际任务的能力。

智能体 Anthropic MCP/工具教程/实践

推荐理由：Anthropic 把自家内部反复打磨的 agent 工具开发方法论完整公开了，从评估流程到 prompt 工程细节全是实操干货，做 MCP server 或 agent 工具链的人可以直接抄作业。

9月1日

00:00

LMSYS：Blog（Chatbot Arena 团队）

美团开源LongCat-Flash：基于SGLang的高效Agentic MoE模型

美团开源Agentic MoE模型LongCat-Flash，总参数量560B，每token仅激活27B。该模型基于SGLang框架，采用PD分离架构与SBO技术，通过四阶段流水线在单batch内实现计算与通信重叠，突破吞吐与延迟的权衡瓶颈。相比同类模型推理成本降低50%以上，在Agent任务中表现优异，适用于复杂实时智能体应用。

智能体模型发布部署/工程

8月28日

08:00

xAI：News（网页）

精选

xAI发布轻量级编程模型Grok Code Fast 1

xAI发布轻量级编程模型Grok Code Fast 1，采用全新架构，基于真实PR数据训练，精通grep、终端和文件编辑等工具。推理速度达190 tokens/秒，定价输入$0.20/百万tokens、输出$1.50/百万tokens，SWE-Bench-Verified得分70.8%。目前已在GitHub Copilot、Cursor、Cline等平台限时免费开放。

智能体 xAI 模型发布编码

推荐理由：xAI发布专为Agentic Coding优化的极速编程模型，已集成Cursor、Copilot等主流工具，价格极具竞争力

8月27日

00:00

LMSYS：Blog（Chatbot Arena 团队）

SGLang 支持 gpt-oss：从 Day 0 支持到性能增强

SGLang 针对 openai/gpt-oss-120b 发布重大性能优化，prefill 吞吐量提升 2.1 倍，decode 吞吐量提升 2.25 倍。新版本集成 FlashInfer 内核以释放 NVIDIA Blackwell 性能，通过 FlashAttention-3 加速 Hopper GPU，并原生支持 AMD MI350。在 B200 上 MXFP4 精度下单批次解码速度达 416.02 tok/s。同时引入 EAGLE3 投机解码支持，GPQA 基准测试验证精度与官方报告一致，确保高性能不损失推理能力。

智能体 OpenAI 开源/仓库部署/工程

8月25日

00:00

Claude：Blog（网页）

精选

Anthropic发布Claude浏览器扩展：AI自动操作功能向付费用户开放

Anthropic正式发布Claude for Chrome扩展，允许AI在浏览器中执行点击、填表等操作。该功能已从1000名Max用户试点扩展至所有付费订阅者，新增Claude Code集成、定时任务及多标签工作流。针对提示词注入攻击，Anthropic通过站点权限、操作确认等防护措施，基于123个测试案例的红队测试，将攻击成功率从23.6%降至11.2%，并屏蔽高风险网站以确保安全。

智能体 Anthropic 产品更新安全/对齐

推荐理由：Claude浏览器代理正式开放，自动操作网页同时攻克提示注入安全难题

8月21日

14:25

公众号：DeepSeek（深度求索）

精选63

DeepSeek-V3.1 发布，迈向 Agent 时代的第一步

DeepSeek-V3.1 以混合推理模型形式开源，用户可一键切换思考模式，同时 Agent 智能体支持性能得到增强。

智能体 DeepSeek 开源生态推理

推荐理由：DeepSeek V3.1 不是小修小补，混合推理和 Agent 支持让它从‘对话模型’转向‘行动模型’，开源这一步让 Agent 开发有了新底座。

8月15日

19:57

蚂蚁 inclusionAI：GitHub 新仓库

精选58

inclusionAI/UI-Venus

UI-Venus 是一款本地 UI 智能体，仅以屏幕截图作为输入，即可执行精确的图形用户界面元素定位与高效导航。该代理无需依赖系统底层代码或辅助功能接口，直接通过视觉信息理解界面结构，实现自动化操作。其核心能力在于对任意应用或网页中的按钮、菜单、文本框等元素进行准确识别与交互，提升了跨平台任务执行的通用性与可靠性。

智能体 GitHub 多模态开源/仓库

推荐理由：蚂蚁这个纯截图驱动的 UI Agent 在当时算是早期探索，代码开源可直接用，做 GUI 自动化的值得看看底层怎么实现元素定位和导航。

8月13日

00:00

Berkeley RDI：Blog（AI 安全与评测）

Agentic AI Summit 2025 于 2025 年 8 月 13 日圆满落幕

Agentic AI Summit 2025 在 UC Berkeley 吸引超过 2000 名现场观众及约 4 万名在线参与者，汇聚全球 AI 领域领导者、创新者与创业者共探 agentic AI 发展。目前所有会议录像已开放观看，主办方宣布下届峰会将于明年回归。

智能体行业动态

8月8日

01:02

Ethan Mollick：One Useful Thing（RSS）

精选

GPT-5：只管做事

GPT-5 不再需要详细提示工程，只需给出目标即可自主完成任务。将 AI 置于主导地位，用户只需设定方向，具体执行由模型自行处理。

智能体 OpenAI 大佬观点推理

推荐理由：Ethan Mollick 深度解读 GPT-5 自主执行能力，洞察 AI 代理新范式

7月31日

00:00

LMSYS：Blog（Chatbot Arena 团队）

精选

智谱发布 GLM-4.5 系列模型并原生支持 SGLang

智谱发布旗舰模型 GLM-4.5（355B/32B 激活）与 GLM-4.5-Air（106B/12B 激活），含 FP8 量化版本，即日起原生支持 SGLang 框架。采用 MoE 架构与 128k 上下文，在 12 项基准测试中分列第 3 与第 6。GLM-4.5 在 BrowseComp 网页浏览任务中以 26.4% 准确率超越 Claude 4 Opus，工具调用成功率达 90.6%，编程与数学推理能力突出。

智能体推理模型发布编码

推荐理由：国产大模型Agent与编码能力跻身第一梯队，为开发者提供Claude/GPT之外的高性价比替代方案

7月29日

08:00

OpenRouter：Announcements（RSS）

OpenRouter 推出服务端 Presets 功能

OpenRouter 上线服务端 Presets，支持用户一次定制模型配置（如参数、提示词）后跨应用直接调用，无需重复设置，简化跨平台模型工作流。

智能体产品更新部署/工程

7月10日

00:00

Mistral AI：News（网页）

Mistral AI 与 All Hands AI 合作发布新款 Devstral 模型

Mistral AI 与 All Hands AI 合作发布了新的 Devstral 模型，旨在增强 AI 智能体的编程能力。其中，Devstral Small 1.1 是一款开源模型（Apache 2.0 许可），仅有 24B 参数，在 SWE-Bench Verified 基准测试中达到 53.6% 的成绩，成为同类开源模型的新标杆。Devstral Medium 则通过 API 提供，在相同基准上取得 61.6% 的高分，性能超越 Gemini 2.5 Pro 和 GPT 4.1，且价格更具竞争力。两款模型均提供公共 API 访问。

智能体开源生态模型发布编码

7月1日

08:00

OpenRouter：Announcements（RSS）

精选55

OpenRouter 发布新隐身模型 Cypher Alpha

OpenRouter 宣布推出 Cypher Alpha，这是一款免费、通用型隐身模型，内置工具调用功能，用户可直接尝试。

智能体模型发布

推荐理由：OpenRouter 自家出的免费通用模型，带工具调用，去年夏天发的，现在看只能算个入门级 Agent 玩具，但免费试不亏。

08:00

OpenRouter：Announcements（RSS）

新型隐形模型：Cypher Alpha

Cypher Alpha 是一款免费、通用、隐形模型，自带工具调用功能。

智能体 MCP/工具模型发布

08:00

OpenRouter：Announcements（RSS）

新隐写模型："Cypher Alpha"

一款名为“Cypher Alpha”的新型通用隐写模型现已发布。该模型具备内置的工具调用功能，可供用户免费使用。其核心特性在于“隐写”，即在执行任务时能保持隐蔽性。目前，用户已可尝试体验这一模型。

智能体 MCP/工具产品更新

6月13日

00:00

Anthropic：Engineering（事故复盘 + 工程实践 · 网页）

精选73

我们如何构建多智能体研究系统

Claude的多智能体研究系统采用协调器-工作者架构，一个主导智能体分析用户查询并制定策略，并行调用多个专用子智能体协同工作。内部评估显示，以Claude Opus 4为主导、Claude Sonnet 4为子智能体的系统，在研究任务上比单智能体Claude Opus 4性能提升90.2%。该系统擅长处理需要同时探索多个独立方向的广度优先查询，通过分配独立上下文窗口实现并行推理扩容。但多智能体系统消耗的token量约为普通聊天的15倍，适用于任务价值足以支撑性能提升的场景，在需要高度并行化、大信息量或多工具调用的任务中表现卓越。

智能体 Anthropic 教程/实践

推荐理由：Anthropic 把 Research 背后的多智能体架构、prompt 工程和踩坑经验全抖出来了，做 Agent 的同行可以直接抄作业，尤其是『token 用量解释 80% 性能方差』这个结论，选型逻辑要变。

6月11日

05:12

Sam Altman：Blog（RSS）

精选

温和的奇点

人类已越过AI发展的"事件视界"。2025年代理将承担真正认知工作，永久改变编程；2026年系统或能发现新见解，2027年机器人可能执行现实任务。科学家称生产力已提升2-3倍，递归改进正在加速。2030年代智能与能源将极大丰富，技术成本趋近电力。尽管就业结构剧变，但财富增长将带来前所未有的政策空间。人类正适应"温和的奇点"：奇迹迅速变成常态，我们将很快测试智能能超越人类多远。

智能体 OpenAI 大佬观点

推荐理由：Sam Altman 谈温和奇点：AGI 已启动，预测 2025-2027 发展路线

6月4日