4月3日

13:08

Steve Yegge：Medium（RSS）

Gas Town（编程智能体框架）与Beads（智能体记忆系统）今日同步发布1.0.0正式版。Gas Town目前拥有13k星标，已进入稳定维护模式，让非技术人员也能构建软件。Beads则以轻量级问题工单为基础，将记录存储在Git中并支持SQL查询，为智能体提供跨会话的历史记录与上下文。

智能体产品更新开源生态

08:00

HuggingFace Daily Papers（社区热门论文）

OmniGUI：全模态智能手机环境中的GUI代理基准测试

OmniGUI 是一个步级基准，专门设计用于评估全模态智能手机环境中的图形用户界面代理。它提供每个动作步骤的连续交错多模态输入，包括静态图像、同步音频和视频片段，数据集覆盖709个专家演示片段、2579个动作步骤和29个应用程序，并标注了多模态依赖级别。评估显示，基础多模态模型在处理需要同步时序和听觉信号的任务时，动作预测性能显著下降。消融实验指出，跨模态干扰是主要瓶颈，尤其在处理任务无关环境噪声时。数据集、评估流程和基线提示已开源。

智能体多模态论文/研究

07:45

Claude Code：GitHub Releases（RSS）

Claude Code v2.1.91 版本更新

Claude Code v2.1.91 发布，支持 MCP 工具结果最大 500K 字符不截断，新增禁用技能内联 shell 执行选项，插件可打包 bin/ 目录可执行文件。修复了 --resume 转录链断裂、远程会话计划模式丢失、cmd+delete 快捷键等 bug，并优化了 ANSI 剥离性能。

智能体 Anthropic MCP/工具产品更新

03:59

Meta Engineering Blog（RSS）

精选82

KernelEvolve：Meta的Ranking Engineer Agent如何优化AI基础设施

Meta的Ranking Engineer Agent系列博客第二篇，聚焦其底层基础设施优化能力。该自主AI代理能够优化支撑广告排名模型运行的低层基础设施，旨在提升系统性能与效率。本篇承接首篇介绍的机器学习实验自主探索功能，进一步展示了该代理在硬件与系统层面的自动化优化实践。

智能体 Meta 产品更新部署/工程

推荐理由：Meta 内部工具展示 AI 自动化优化基础设施，工程师可借鉴实践。

4月2日

18:00

OpenAI：官网动态（RSS · 排除企业/客户案例）

Codex 为团队推出更灵活定价方案

Codex 新增按量付费模式，面向 ChatGPT Business 和 Enterprise 团队，支持按需灵活扩展使用规模。

智能体 OpenAI 产品更新编码

13:46

公众号：阶跃星辰（Step）

阶跃 Step 3.5 Flash 系列上新，Step Plan 用户现可体验

阶跃星辰发布 Step 3.5 Flash 系列，主打更快、更好用、更加 Agent-native，面向所有 Step Plan 用户开放体验。

智能体模型发布

12:32

公众号：通义实验室（千问）

Qwen3.6-Plus：编码智能体能力全面跃升！

智能体模型发布编码

08:00

Google Developers Blog（RSS）

精选81

通过 Gemma 4 将先进的智能体能力引入边缘

Google DeepMind 发布了 Gemma 4 系列开源模型，旨在直接在设备端实现多步骤规划和自主智能体工作流。该版本包含用于实验“智能体技能”的 Google AI Edge Gallery，以及为开发者提供显著速度提升和结构化输出的 LiteRT-LM 库。Gemma 4 采用 Apache 2.0 许可，支持超过 140 种语言，并兼容移动设备、台式机及树莓派等多种物联网硬件平台。

智能体 Google 模型发布端侧

推荐理由：开源 agentic 模型支持端侧运行，开发者可快速构建本地智能应用。

08:00

Cursor Blog

精选

Cursor 3.0 发布：以 Agent 为核心的统一开发空间

Cursor 3.0 正式发布，重构为以 Agent 为核心的统一工作空间。新界面原生支持多仓库协作，可并行运行本地与云端 Agent（覆盖移动端、Slack、GitHub 等入口），支持会话在环境间无缝迁移以便离线运行或本地迭代。完整保留 IDE 能力：文件编辑、LSP、内置浏览器及插件市场。基于自研 Composer 2 模型，目标是通过多 Agent 自主协作实现"代码库自动驾驶"。

智能体 MCP/工具产品更新编码

推荐理由：Cursor 3 重磅发布：原生 Agent 工作流、云地无缝切换与多仓库管理

07:41

Claude Code：GitHub Releases（RSS）

精选

Claude Code v2.1.90 版本更新

Claude Code 发布 v2.1.90 版本。新增 /powerup 交互式教程命令，通过动画演示教授功能使用；增加环境变量支持离线环境保留 marketplace 缓存。修复多项关键 bug：解决速率限制对话框崩溃、--resume 缓存未命中、编辑操作与 format-on-save 冲突等问题。性能方面优化 MCP 工具缓存、SSE 传输及长对话转录效率。同时移除 DNS 缓存查询自动权限以增强隐私，并加固 PowerShell 工具权限检查。

智能体 Anthropic 产品更新编码

推荐理由：Claude Code新增/powerup交互式教程与多项性能优化，提升开发体验

04:00

Qwen：Blog Retrieval（API）

Qwen3.6-Plus：迈向真实世界 Agent

Qwen3.6-Plus 定位真实世界 Agent 应用，Qwen Studio 平台集成聊天机器人、图像视频理解、图像生成、文档处理、网页搜索、工具调用及 Artifacts 等全栈功能，覆盖多模态任务与复杂场景需求。

智能体多模态模型发布

03:13

Gary Marcus：The Road to AI We Can Trust（RSS）

精选

关于就业，先别恐慌--至少现在还不必

就业市场即将面临剧烈变革，但短期内无需过度恐慌。尽管未来形势将趋于复杂动荡，大规模冲击不会立即显现，当前仍处于变化酝酿阶段。这种渐进式演变意味着就业者尚有调整与准备的时间窗口，不必对即时性失业风险过度反应。然而，长期结构性转变不可避免，需保持警惕并提前规划。

智能体大佬观点

推荐理由：Marcus认为AI就业替代不会瞬间发生，但剧烈变革正在路上，理性看待当前焦虑

00:00

智谱：研究（网页内嵌数据）

精选

GLM-5V-Turbo发布：多模态Coding基座模型

智谱发布GLM-5V-Turbo多模态Coding基座模型，原生支持图像、视频、设计稿理解及画框、截图、读网页等工具调用，上下文窗口达200k。采用新一代CogViT视觉编码器与30+任务协同强化学习，在保持纯文本编程能力的同时强化GUI Agent能力。与Claude Code、AutoClaw等框架深度协同，支持"图像即代码"前端复刻及GUI自主探索，提供开箱即用的官方Skills。

智能体多模态模型发布编码

推荐理由：智谱发布多模态Coding基座GLM-5V-Turbo，深度适配Claude Code等Agent

00:00

Claude：Blog（网页）

精选

构建 Claude 应用的三大最佳实践

Anthropic 分享构建 Claude 应用的三大实践：使用 Claude 已掌握的通用工具（如 bash 和文本编辑器）；允许其自行编排工具调用链，减少不必要的上下文回传以降低 token 消耗；随着模型能力进化，重新评估 agent harness 的预设限制。实测显示，让 Opus 4.6 自主过滤工具输出，在 BrowseComp 基准测试中准确率从 45.3% 提升至 61.6%。

智能体 Anthropic 教程/实践编码

推荐理由：Anthropic官方分享构建Claude Agent的三大最佳实践，含模型性能数据与代码编排技巧

4月1日

19:09

Hacker News：AI 热帖

询问 HN：客户用 vibe coding 接管了开发工作，该怎么办？

客户开始用 vibe coding 自行写代码接管项目开发，原外包开发者面临被 AI 工具替代的尴尬处境，在 HN 发帖询问该如何应对这种局面。

智能体现象/趋势编码

10:00

OpenAI：官网动态（RSS · 排除企业/客户案例）

Gradient Labs 为每位银行客户配备 AI 账户经理

Gradient Labs 使用 GPT-4.1 和 GPT-5.4 mini/nano 驱动 AI 智能体，为每位银行客户提供自动化 AI 账户经理服务，实现低延迟、高可靠性的银行支持工作流。

智能体 OpenAI 行业动态

09:07

Claude Code：GitHub Releases（RSS）

Claude Code v2.1.89 发布

Claude Code v2.1.89 发布，新增 defer 权限决策支持 headless 会话暂停恢复，引入 CLAUDE_CODE_NO_FLICKER 环境变量实现无闪烁渲染，新增 PermissionDenied hook 允许模型重试被拒命令。修复 Windows 平台 CRLF 处理、StructuredOutput 缓存失效、内存泄漏、LSP 僵尸进程、CJK 字符截断等 30 余项 bug。调整 Edit 工具行为，支持直接编辑通过 Bash 查看的文件；hook 输出超 5 万字符将转存磁盘；默认关闭 thinking summaries。优化 MCP 连接超时和子代理提及体验。

智能体 Anthropic 产品更新编码

08:00

Google Developers Blog（RSS）

精选71

开发者指南：使用技能构建ADK智能体

Agent Development Kit (ADK) SkillToolset 推出了“渐进式披露”架构，使AI智能体能够按需加载领域专业知识，与传统单体提示相比，可减少高达90%的令牌使用量。该系统通过四种模式——从简单的内联清单到智能体可自行编写代码的“技能工厂”——使智能体能在运行时利用通用的 agentskills.io 规范动态扩展其能力。这种模块化方法确保了复杂的指令和外部资源仅在相关时被访问，从而为现代AI开发构建了一个可扩展且能自我扩展的框架。

智能体 Google 教程/实践部署/工程

推荐理由：开发者可借鉴此架构，构建更智能、更经济的AI代理。

06:34

Ethan Mollick：One Useful Thing（RSS）

精选

Claude Dispatch 与界面的力量

AI 能力已足够强大，但人们仍缺乏趁手的工具和界面来完成实际工作。Claude Dispatch 强调，优秀的界面设计才是释放 AI 全部潜力的关键。

智能体 Anthropic 大佬观点

推荐理由：Ethan Mollick 深度解析 Claude 与 AI 界面力量，洞察工具与能力的鸿沟

3月31日

21:00

OpenAI：官网动态（RSS · 排除企业/客户案例）

精选

加速 AI 下一阶段发展

OpenAI 获 1220 亿美元新融资，用于全球扩展前沿 AI、投资下一代算力，满足 ChatGPT、Codex 及企业 AI 的需求增长。

智能体 OpenAI 行业动态

推荐理由：OpenAI获1220亿美元巨额融资，创AI行业融资纪录

19:03

公众号：昆仑万维（天工）

昆仑万维（天工）推出「天工短剧工作台」

昆仑万维（天工）正式推出「天工短剧工作台」，以AI智能体驱动短剧内容创作流程自动化。

智能体产品更新视频

15:06

Steve Yegge：Medium（RSS）

氛围维护者

一位开源项目维护者分享应对AI生成PR浪潮的“氛围维护者”工作流。他维护Beads（2万星）和Gas Town（1.3万星）两个项目，每天收到约50个PR。通过自动化处理超过半数简单PR，整体合入率约88%，中位解决时间15小时。即便如此，每周仍需投入15-20小时审核。他认为高效率是开源项目生存关键，拒绝贡献可能导致项目被分叉或取代。

智能体大佬观点开源生态部署/工程

08:00

Google Developers Blog（RSS）

精选81

ADK Go 1.0 正式发布：迈向生产就绪的多智能体开发框架

Agent Development Kit (ADK) for Go 1.0 版本正式发布，标志着其从实验性脚本转向生产就绪的服务框架。本次更新核心在于强化可观测性、安全性与可扩展性，主要特性包括：原生集成OpenTelemetry以实现深度追踪；支持自愈逻辑的新插件系统；在敏感操作中引入“人在回路”安全确认机制。此外，新版本提供了基于YAML的配置以加速迭代，并优化了Agent2Agent协议，以支持跨编程语言的智能体无缝通信。该框架使开发者能够依托Go语言的高性能工程标准，构建复杂且可靠的多智能体系统。

智能体 Google 产品更新

推荐理由：Go 语言开发者迎来官方 AI Agent 开发框架，可快速构建可靠多智能体系统。