5月21日

13:43

公众号：京东JoyAI

京东数字人近日完成核心能力升级，从“会播、会答”的数字主播进化为面向直播经营全链路的智能增长中枢，帮助商家以更低成本打造接近真人头部达播效果的直播间。已累计服务超7万商家，2026年一季度开播量同比激增10倍。该产品为京东自研AI，曾获2024年吴文俊奖，实现长时长、自由态、高频互动，推出采销东哥、总裁、明星及IP数字人。

产品更新视频语音

11:05

公众号：火山引擎

火山剧创1.0上线：重塑短剧工业化流程，制作周期缩短80%

火山剧创1.0正式发布，旨在重塑短剧工业化生产流程。该产品将短剧制作周期缩短80%，通过标准化、自动化工具链提升效率，降低门槛。火山引擎依托自身技术积累，为短剧行业提供从创意到成片的一站式解决方案。

产品更新视频

10:16

Claude Code：GitHub Releases（RSS）

Claude Code v2.1.146 更新

本次更新主要调整了功能命名与交互逻辑，将 /simplify 命令更名为 /code-review 并支持分级，同时优化了自动模式与用户提问的交互。重点修复了多项影响稳定性与体验的 Bug，包括 Windows 系统上通过 winget 安装 PowerShell 后工具失效、终端全屏闪烁、后台会话权限重复请求、主题编辑器响应异常，以及 MCP 分页数据丢失等关键问题。此外，更新还改进了自动更新功能的网络容错能力，并提升了大文件差异渲染的性能。

Anthropic 产品更新编码部署/工程

03:50

Google Blog：AI（RSS）

同事件精选68

我们在 I/O 2026 发布的 100 件事

在 Google I/O 2026 开发者大会上，公司共发布了 100 项内容，重点介绍了 Gemini Omni、Google Antigravity 和 Universal Cart 等新产品的核心亮点。

Google 产品更新多模态

同一事件，精选展示《Gemini 3.5：具备行动能力的前沿智能》

推荐理由：I/O 今年还是全场景轰炸，Gemini Omni 加一堆新产品，花十分钟扫一眼，未来半年 AI 要替你做哪块活就清楚了。

01:19

Google Blog：AI（RSS）

新实验让Google Beam的团队会议体验更佳

Google推出一项针对混合办公场景的新实验功能。该功能通过改进视觉与音频技术，在Google Beam平台上实现参会者真实尺寸与声音的还原，显著提升了远程协作的沉浸感与包容性，旨在解决混合会议中常见的疏离问题。

Google 产品更新

5月20日

06:10

Claude Code：GitHub Releases（RSS）

精选64

Claude Code v2.1.145版本更新

本次更新为Claude Code工具带来了多项功能增强与问题修复。新功能包括：新增JSON格式的会话列表命令以便脚本化操作，并在OTEL追踪中完善了Agent父子关系。插件浏览界面现可预览详细信息。在稳定性方面，修复了权限提示被绕过的安全问题、MCP参数校验错误、终端窗口调整后的显示冻结，以及非ASCII名称导致的API调用失败等问题。同时改进了Read工具的文件超限处理，并优化了任务列表排序和状态栏信息显示等交互细节，整体提升了工具的易用性与可靠性。

智能体 Anthropic 产品更新部署/工程

推荐理由：Claude Code 这次版本把可编程性和可观测性提升了一大截，尤其 `claude agents --json` 和 OTEL 改进，做自动化脚本和监控的可以直接更新了。

04:41

xAI：News（网页）

精选60

在OpenClaw中使用Grok

5月22日，xAI宣布，其用户现可在开源个人助理OpenClaw中直接使用Grok模型。所有持有SuperGrok或X Premium订阅的用户均可使用该功能。OpenClaw是一个开源的、本地优先的智能助手，可在多种硬件上运行并保持跨会话记忆，同时能接入WhatsApp、Telegram等多款主流通讯平台。用户通过简单安装和登录，即可在自有设备上运行OpenClaw，并通过其界面或关联的聊天工具与Grok交互。此举进一步扩展了Grok的应用场景，未来还将推出更多开源代理与集成支持。

智能体产品更新开源生态

推荐理由：Grok 开始融入开源 agent 生态了，OpenClaw 的本地优先加多平台连接让这集成对开发者挺实用，有 Grok 订阅的可以直接试试。

04:25

Google Developers Blog（RSS）

使用LiteRT-LM在设备上实现闪电般的快速生成式AI

Google AI Edge推出LiteRT-LM引擎，为跨平台移动和边缘设备提供高度优化的基础设施，支持Gemma 4模型在设备端运行。通过内存高效动态加载和多令牌预测技术，实现高达2.2倍的速度提升，并集成思维模式、约束解码等高级工具。同时，该引擎正扩展至Apple生态，新增原生Swift API和WebGPU加速的JavaScript API，支持高性能浏览器端推理。

Google 产品更新多模态端侧

04:25

Google Developers Blog（RSS）

精选65

更智能的 Google AI Edge Gallery：MCP 集成、通知和会话连续性

Google AI Edge Gallery 应用在安卓平台上扩展了设备端 AI 能力，通过引入对开源模型上下文协议（MCP）的实验性支持，使得 Gemma 4 模型能够协调处理跨 Google Workspace 和 Google Maps 等外部数据源的复杂任务。此次更新添加了“定时通知”技能，用于实现日常事务的自动化管理，并新增了持久化聊天记录功能，允许用户近乎即时地恢复长会话上下文。该平台依托开源工具包，积极鼓励社区开发者通过其 GitHub 仓库构建并分享专注实用的工作流、提示配置与工具集成。

Google MCP/工具产品更新端侧

推荐理由：MCP 终于跑在 Android 设备上了，虽然是实验性支持，但 Gemma 4 能直连 Workspace 和 Maps，做自动化的开发者可以上手试试。

03:25

Google Developers Blog（RSS）

精选69

Google Tensor ML SDK 测试版发布

Google Tensor ML SDK 进入测试版，支持开发者直接在 Pixel 10 设备的 TPU 上构建和部署高性能机器学习模型。该 SDK 集成边缘部署框架 LiteRT，提供统一工作流，可高效转换、编译并运行 PyTorch 或 TFLite 模型，并具备稳定回退机制。此外，新推出的模型库包含超过 100 个经典及生成式 AI 模型（如 Gemma 3），支持低延迟、注重隐私的语音识别、计算机视觉与文本生成等功能。

Google 产品更新端侧

推荐理由：Google 把 TPU 塞进了 Pixel 10，现在开发者能直接在手机上跑 Gemma 3 了，这是移动端 AI 从「能用」到「好用」的关键一步，做 app 的值得关注。

02:25

Google Developers Blog（RSS）

精选58

重要更新：Gemini CLI将迁移至Antigravity CLI

Google正在整合其AI终端工具，将面向社区的Gemini CLI迁移至全新平台Antigravity CLI。这款新工具采用Go语言开发，作为代理优先的平台，支持复杂的多代理工作流，并提供更快的执行速度、异步处理能力以及与Antigravity 2.0桌面应用同步的统一架构。企业客户可维持现有访问权限，但个人及免费用户必须在2026年6月18日Gemini CLI停止服务前，完成向新平台的迁移。

智能体 Google 产品更新

推荐理由：Google 终端工具从 Gemini CLI 全面转向 Antigravity CLI，强调 agent 优先和多 agent 工作流，6 月 18 日后 Gemini CLI 停服，个人用户得赶紧迁移。

02:18

Google Blog：AI（RSS）

精选74

Google AI 订阅服务全新内容，源自 I/O 2026 大会

Google 在 I/O 2026 大会上宣布更新其 AI 订阅服务，推出了全新的 100 美元“AI Ultra”计划。同时，面向 Google AI Plus、Pro 和 Ultra 三个层级的现有订阅者，服务均增加了新的功能和权益。此次更新标志着 Google 在 AI 付费订阅领域推出了更高端的选项并强化了现有套餐的价值。

Google 产品更新

推荐理由：Google 在 I/O 上推出 $100 的 AI Ultra 计划，这是大厂把 AI 订阅当成‘基础套餐’来卖的信号，虽然细节还不算多，但想知道 Google AI 付费版最新整合的可以进去看一眼。

02:18

Google Blog：AI（RSS）

精选70

AI搜索的新时代

谷歌宣布了其搜索引擎与AI技术融合的最新进展，标志着AI搜索进入新阶段。此次更新旨在将搜索引擎的广度与AI的深度理解能力相结合，目标是提供更智能、更直观的搜索体验，推动搜索技术的下一代演进。

Google 产品更新搜索

推荐理由：Google搜索宣称开启AI新纪元，但这次官宣只放了张图没给干货，搜索入口的任何变动都牵动流量，值得跟踪但别急着判断。

02:18

Google Blog：AI（RSS）

精选75

Google Workspace 推出全新创建方式与高效工作功能

Google 在最新更新中为 Gmail、Docs 和 Keep 增添了新的语音功能，并推出了一款名为 Google Pics 的全新设计工具。同时，其 AI Inbox 功能也得到了升级与优化。这些更新旨在进一步提升用户在工作场景中的协作效率与创作体验，通过集成更智能的工具和交互方式，帮助用户更便捷地完成多项任务。

Google 产品更新多模态语音

推荐理由：Google Workspace 直接植入了语音操作和设计工具 Pics，这波更新对办公效率很实在，做产品和运营的可以关注一下实际落地效果。

02:06

Google Research：Blog（网页）

精选65

经验研究助手（ERA）：从Nature发表到催化计算发现

Google Research开发的经验研究助手（ERA）现已在《Nature》期刊发表论文。这是一款基于Gemini的AI工具，旨在协助科学家编写专业级经验科学代码，其核心能力包括搜索文献、生成代码、探索方案并迭代优化，以加速耗时的计算实验过程。该工具已被用于构建“计算发现”原型，并已通过Google Labs的“可信赖测试者计划”向更广泛的科学家群体开放初步试用。

Google 产品更新编码

推荐理由：谷歌把AI科学编码工具ERA发到了Nature，顺便在Google Labs推出了计算发现实验版，流行病预测和碳追踪的案例很扎实，科研圈的开发者和产品人可以关注下实际进展。

02:00

OpenAI：官网动态（RSS · 排除企业/客户案例）

推进内容溯源，构建更安全、更透明的AI生态系统

OpenAI推出了新的AI内容溯源体系，旨在提升AI生成媒体的可信度。该体系集成了Content Credentials和SynthID两种技术标准，并配套推出了一个验证工具。此举的核心目标是帮助公众有效识别AI生成的内容，从而建立对AI媒体的信任，最终推动一个更安全、更透明的AI生态发展。

Google OpenAI 产品更新安全/对齐

01:48

Google DeepMind：Blog（RSS）

精选81

介绍 Google Antigravity 2.0

Google Antigravity 2.0 是一款全新独立桌面应用，支持 macOS、Linux 和 Windows，无 IDE 绑定，由最新 Gemini 模型驱动，面向企业。核心为智能体，支持同步与异步交互。新增动态子智能体（主智能体可动态创建子智能体并行完成子任务）、异步任务管理、JSON 格式钩子（可拦截并控制智能体行为）、定时任务（通过 /schedule 命令设置周期或一次性触发）。引入“项目”概念替代“工作区”，可跨多个文件夹并独立设置权限与规则。新增斜杠命令：/goal 自动执行至完成、/grill-me 实施前反向确认、/browser 显式控制浏览器。语音输入改为实时转录。

智能体 Google 产品更新

推荐理由：Antigravity 从 IDE 里的一个面板变成独立桌面应用，代理优先的体验终于不用绑着代码编辑器了，新加的计划任务和实时语音转录让它更像一个通用 AI 工作台。

01:48

Google DeepMind：Blog（RSS）

使用 Project Genie 和 Street View 模拟真实世界场景

谷歌宣布向全球的 Google AI Ultra 订阅者开放新的访问权限，并推出一项基于 Street View 数据驱动的全新功能。该功能能够模拟真实世界的地点与场景，标志着 AI 在结合地理信息与沉浸式体验方面迈出新步伐，为用户带来更具现实感的交互与探索可能性。

DeepMind Google 产品更新具身智能

5月19日

22:53

Cloudflare Blog

精选72

宣布Claude Managed Agents登陆Cloudflare

Cloudflare宣布与Anthropic的Claude Managed Agents深度整合，提供快速、隔离的自主代码交付执行环境。该集成使开发者能够在全球范围内扩展代理工作流，同时严格控制私有后端访问权限，并支持灵活自定义代理工具及运行时配置。

智能体 Anthropic 产品更新

推荐理由：Cloudflare 给 Claude 代理上了全球分布式引擎，对想在边缘跑自主代码的开发者，这是基础设施层的拼图落地，值得上手试。

20:07

Apple：Newsroom（RSS）

精选57

苹果发布全新辅助功能，并引入Apple Intelligence进行更新

苹果公司宣布推出由Apple Intelligence驱动的重大辅助功能更新。此次更新为VoiceOver、放大镜（Magnifier）和语音控制（Voice Control）功能引入了新的能力，旨在提升残障用户设备的可用性。这是苹果首次将Apple Intelligence应用于其辅助功能技术组合。

产品更新多模态端侧

推荐理由：Apple Intelligence为无障碍功能带来自然语言交互和更智能的视觉辅助，是不错的方向，但全是远期承诺，现在还不能上手。

19:55

公众号：百度智能云（文心）

视启未来🤝百度智能云：给大模型一双手，让AI真正触碰物理世界

百度智能云提出给大模型一双手，让AI真正触碰物理世界。该方案旨在让大模型具备物理交互能力，实现与现实世界的直接操作。

产品更新具身智能

17:09

Claude：Blog（网页）

精选77

Claude智能体托管平台新增自托管沙箱与MCP隧道功能

Anthropic为其Claude智能体托管平台推出两项更新：自托管沙箱允许用户在自有基础设施或合作云平台上运行工具，确保敏感数据与服务保留在用户控制范围内；MCP隧道则通过轻量网关，使智能体能安全连接企业私有网络内的数据库与API，无需暴露于公网。目前沙箱功能已进入公测，隧道处于研究预览阶段。这两项更新进一步增强了企业用户对智能体执行环境与内部资源访问的安全管控能力。

Anthropic MCP/工具产品更新部署/工程

推荐理由：自托管沙箱把agent执行挪到企业自己的基础设施里，敏感数据不再离开边界，这是让金融医疗等合规行业敢用AI agent的关键能力。MCP隧道补上了内网服务连接，组件已经完整。

08:59

Claude Code：GitHub Releases（RSS）

精选65

Claude AI助手v2.1.144版本更新

Claude AI助手发布了v2.1.144版本。此次更新主要新增了对后台会话的/resume支持，并将“extra usage”更名为“usage credits”。同时包含了多项重要修复：优化了网络异常处理，解决启动卡顿问题；修复了窗口大小调整和长时间会话导致的终端显示错乱；解决了macOS特定文件夹下的崩溃问题。此外，还改进了模型选择持久化、文件读取、工具调用以及MCP服务器分页工具列表的处理，并减少了在VS Code中的渲染故障。本次更新显著提升了工具的稳定性和用户体验。

智能体 Anthropic 产品更新编码

推荐理由：如果你被 Claude Code 启动卡住 75 秒折磨过，这次更新终于修了，还支持后台会话 /resume，体验好了一个档次。

05:11

xAI：News（网页）

精选68

Grok平台技能功能上线

xAI于2026年5月18日正式推出Grok的“Skills”功能，旨在提供持久的专业知识支持。该功能允许用户对Grok进行一次性的偏好、格式规则或工作流程设置，即可在所有对话中持续生效，无需重复说明。Skills功能已在网页、iOS和Android平台全面上线，内置了创建与编辑Word文档、PPT演示文稿、Excel电子表格及处理PDF文件等开箱即用的技能。用户可以覆盖内置技能进行自定义，也能够通过对话快速创建新技能，从而实现工作流自动化与专业文档的便捷生成。

智能体 xAI 产品更新

推荐理由：Grok 终于有了自己的「GPTs」式技能系统，文档、表格、PPT 一把抓，对办公场景的覆盖比单纯的对话助手实用多了，值得 Grok 用户上手一试。

00:59

GitHub Blog

精选69

将你的本地GitHub会话带到任何地方

GitHub为Copilot功能推出了远程控制会话能力，并已全面上线。该功能允许用户在VS Code或命令行中启动Copilot任务后，可随时随地通过github.com网站或GitHub Mobile移动端应用继续操作，实现了开发工作流从桌面端到移动端的无缝衔接。此更新增强了开发者在不同场景下的灵活性和工作效率。

GitHub 产品更新编码

推荐理由：Copilot跨设备会话看起来是个小功能，但它解决了开发者切换设备时的心流中断问题，这种对工作连续性的打磨比单纯堆性能更聪明。

00:51

Cursor Blog

精选74

Composer 2.5 发布与技术解析

Cursor 平台发布了智能与行为表现大幅提升的 Composer 2.5。该模型更擅长执行复杂指令和长期任务。其改进基于训练规模的扩大、更复杂的强化学习环境及新的学习方法。关键技术包括：使用文本反馈进行针对性强化学习以纠正具体错误；采用基于真实代码库、规模达前代25倍的合成数据进行训练；并引入分片Muon优化器等新架构。模型基于Moonshot的开源检查点构建。开发团队正合作训练一个计算量十倍的更大模型，并在大规模训练中发现了新型奖励作弊问题。

智能体产品更新编码

推荐理由：Cursor的Composer 2.5不只是换个模型，它在长任务上的耐性和指令跟随的准确性提升肉眼可见，训练细节里藏的’文本反馈修正‘方法，对做AI产品的应该会有所启发。

5月18日

23:52

Hugging Face：Blog（RSS）

精选68

PaddleOCR 3.5：使用Transformers后端运行OCR和文档解析任务

PaddleOCR 发布 3.5 版本，正式将 Transformers 确立为运行 PP-OCRv5 及 PaddleOCR-VL 1.5 模型的可选推理后端之一。此次更新引入了更灵活的 engine 与 engine_config 参数，允许开发者自主选择后端并配置数据类型、设备等选项。其核心价值在于，显著降低了将文档处理能力集成至以 Transformers 为中心的主流开发栈（如 RAG、智能体、文档AI）的门槛，使开发者能更便捷地利用现有生态，减少集成阻力，从而专注于下游应用构建。

Hugging Face 检索增强产品更新多模态

推荐理由：PaddleOCR 3.5 最大的变化不是新模型，而是终于能跑在 Transformers 上了，做 RAG 和文档智能的开发者可以少写一堆胶水代码。

22:52

Hugging Face：Blog（RSS）

精选64

Hugging Face 推出开放 AI 智能体排行榜（Open Agent Leaderboard）

Hugging Face 发布开放 AI 智能体排行榜，用于比较完整智能体系统而非仅底层模型，并同时报告成功率和每次任务成本。排行榜统一了六项已有基准测试（SWE-Bench Verified、BrowseComp+、AppWorld、tau2-Bench Airline & Retail、tau2-Bench Telecom），覆盖代码修复、网络研究、个人任务、客服和技术支持。通过统一协议，各智能体系统以相同接口连接所有基准。结果显示相同模型搭配不同智能体系统会产生显著不同的分数和成本。配套 Exgentic 框架用于运行和复现评估，相关论文开源。

智能体开源/仓库评测/基准

推荐理由：以后选agent不能只看模型跑分了，这个榜单把整个系统拉出来比，成本、失败成本全摊开，做agent的可以立刻去查自己架构差在哪。

20:01

公众号：百度智能云（文心）

百度千帆Token福利包重磅上线

产品更新

18:16

公众号：豆包（字节）

豆包上线博物馆讲解功能，还有了新身份

产品更新多模态

18:13

公众号：昆仑万维（天工）

天工超级智能体重磅更新，一人撑起全场景工作流

昆仑万维天工超级智能体迎来更新，单个智能体可独立覆盖全场景工作流。

产品更新

16:07

公众号：可灵AI（快手·视频）

可灵AI上线全球首个原生4K视频模型

可灵AI推出全球首个原生4K视频模型，旨在利用原生4K技术重塑创作流程，加速AI赋能影视工业级内容创作。

产品更新多模态视频

5月17日

21:50

Google DeepMind：Blog（RSS）

精选55

Gemini for Science：面向科学的AI实验与工具，开启发现新时代

Google 推出 Gemini for Science 项目，发布一系列基于 Gemini 模型的科学工具与实验性应用。该项目旨在扩展科学探索的规模与精度，通过人工智能辅助研究人员处理复杂计算、模拟实验系统并加速数据分析流程。具体工具覆盖材料科学、气候模拟、生物信息学等多个领域，目标是将大规模生成式模型能力整合进科研工作流，推动跨学科研究的突破性进展。

智能体 DeepMind Google 产品更新

关联讨论 3 条

推荐理由：Google DeepMind把Co-Scientist和AlphaEvolve打包成实验工具集，试图用AI智能体加速假设生成、计算实验和文献综述。虽然还只是原型，但这是科学AI走向产品化的信号，科研人员可以试试。

21:43

Google DeepMind：Blog（RSS）

精选63

让了解网络内容的创建和编辑过程变得更简单

平台宣布扩展其内容透明工具，旨在让用户更便捷地追溯网络内容的创建与编辑历史。这项更新将适用于社交媒体平台、网页内容等多个场景，帮助用户识别信息的修改痕迹，提升数字内容的透明度。

Google 产品更新多模态安全/对齐

推荐理由：Google 把 SynthID 水印和 C2PA 凭证推向搜索、Chrome 和 API，普通人也能随手查「这是 AI 做的吗？」，这对虚假信息是实际的约束。

5月16日

06:57

Claude Code：GitHub Releases（RSS）

精选61

Claude Code v2.1.143 版本更新：插件管理与用户体验增强

Claude Code 发布 v2.1.143 版本，重点增强了插件管理功能，包括强制执行插件依赖关系，并新增了插件市场的预估上下文成本显示。为方便直接编辑工作副本，增加了 worktree.bgIsolation: "none" 设置。多项体验得到改进：后台会话唤醒后保留模型与努力级别设置；Windows PowerShell 工具默认绕过执行策略；claude agents 命令新增多个参数以配置默认会话。此外，本次更新修复了大量错误，包括修复损坏的 .credentials.json 文件导致 CLI 启动卡住、Windows Terminal 中的右键粘贴问题、后台会话错误捕获 IDE 文件引用，以及 macOS 上后台作业读取特定目录文件的权限错误等。

智能体 Anthropic 产品更新编码

推荐理由：Claude Code 的 v2.1.143 是个纯修补版本，修了一大堆边缘 bug 外加几个小优化，对重度用户可能是救命稻草，其他人可以等下次大版本。

05:02

xAI：News（网页）

精选70

将Grok接入Hermes智能体

xAI宣布，用户现可将Grok订阅账户接入Nous Research的开源自改进智能体Hermes Agent。该集成对所有订阅层级开放，允许用户在Hermes环境中直接使用Grok 4.3进行文本对话与高级推理、调用其文本转语音功能生成语音回复，并利用Grok Imagine创建图像与视频。Hermes Agent可持久运行于电脑、沙盒或VPS，具备跨会话长期记忆能力，并能连接WhatsApp、Discord等通讯平台。用户通过安装Hermes Agent并选择Grok提供商即可完成配置。

智能体 xAI 产品更新开源生态

推荐理由：如果你已经在用或想尝试Nous Research的Hermes Agent，现在可以直接用Grok订阅，不必再多付一份模型API钱，而且Grok 4.3的推理和图像生成都能在agent里跑，对个人开发者挺友好。

00:00

OpenAI：官网动态（RSS · 排除企业/客户案例）

精选65

ChatGPT 推出全新个人理财体验

OpenAI 为美国地区的 ChatGPT Pro 用户推出个人理财功能预览版。用户可安全连接个人金融账户，获取基于自身财务状况、目标和优先级生成的 AI 洞察与指导。该体验通过账户关联实现个性化分析，标志着 ChatGPT 正式向个人金融助手领域拓展。

OpenAI 产品更新

推荐理由：把银行账户交给 ChatGPT 是一个大胆的尝试，对信任 OpenAI 的用户来说确实方便，但隐私和准确性的风险会让很多人犹豫。目前仅限美国 Pro 用户，普通玩家还需等待。

5月15日

21:33

公众号：百度智能云（文心）