1月14日

01:00

Google DeepMind：Blog（RSS）

Veo 3.1 Ingredients to Video：更强的一致性、创造力和控制力

Veo 3.1 版本新增竖屏视频生成功能，输出画面动态效果更自然生动，在一致性与创造力方面均有提升。

Google 产品更新视频

1月13日

21:04

公众号：豆包（字节）

这次，我们把「AI 老师」请进了豆包

产品更新

21:00

VentureBeat：AI（RSS）

Salesforce发布新版Slackbot AI智能体，角逐职场AI市场

Salesforce近日发布了完全重构的新版Slackbot，将其从一个简单的通知工具转变为功能完整的AI智能体。该智能体基于Anthropic的Claude大语言模型构建，能够搜索企业数据、起草文件并代表员工执行操作，现已面向Business+和Enterprise+客户开放。内部测试显示，在8万名员工中，三分之二已尝试使用，80%成为常规用户，每周可节省大量时间。未来，Slackbot计划支持Google Gemini等其他模型。此举是Salesforce将Slack定位为“智能体AI”运动核心的关键举措。

智能体 Anthropic MCP/工具产品更新

00:56

Hacker News：AI 热帖

Show HN：SolidWorks 中的 AI 功能

为 SolidWorks 开发的 AI 插件，支持自然语言生成三维模型、自动草图绘制和智能特征识别。提供安装包与演示视频，可直接集成到现有机械设计工作流中。

产品更新编码

1月12日

19:30

VentureBeat：AI（RSS）

Anthropic推出Cowork：无需编码，Claude桌面代理可直接操作用户文件

Anthropic发布了Claude桌面AI代理功能Cowork，它将Claude Code的能力扩展至非技术用户，允许AI在本地指定文件夹中读取、编辑和创建文件。该功能目前作为研究预览版，仅向每月100-200美元的Claude Max订阅者开放（macOS平台）。其开发仅耗时约一周半，且主要借助Claude Code自身完成。Cowork基于文件夹架构和代理循环，能处理整理文件、从截图生成费用表格等多任务，标志着AI代理正进入主流生产力工具市场，使Anthropic与微软Copilot等展开竞争。

智能体 Anthropic 产品更新

1月9日

08:00

OpenRouter：Announcements（RSS）

OpenRouter 1月发布：优先快速LLM、探索提供商、自定义自动路由、SDK技能加载与性能大提升

OpenRouter 1月发布聚焦优先选择快速大语言模型、探索提供商、自定义自动路由、在SDK中加载技能，以及大幅性能改进。

智能体产品更新部署/工程

08:00

OpenRouter：Announcements（RSS）

OpenRouter 1月更新：快速LLM优先、自定义自动路由、SDK技能加载与性能提升

OpenRouter 发布1月更新，新增快速LLM优先级排序功能，用户可优先选择低延迟模型；支持浏览和切换不同提供商；自动路由可自定义策略；SDK新增加载技能（skills）的能力；同时带来重大性能改进。

产品更新部署/工程

08:00

OpenRouter：Announcements（RSS）

January Release Spotlight

本次发布聚焦于提升大型语言模型（LLM）的速度与性能。核心更新包括优先支持快速LLM、探索更多模型提供商选项，以及允许用户自定义自动路由。软件开发工具包（SDK）现已支持加载技能，同时系统实现了显著的性能改进。这些更新旨在优化开发者的使用体验与模型运行效率。

MCP/工具产品更新部署/工程

1月5日

08:00

Hugging Face：Blog（RSS）

NVIDIA 借助 DGX Spark 与 Reachy Mini 将智能体带入现实

NVIDIA 推出 DGX Spark 平台与 Reachy Mini 机器人，旨在通过开源框架降低智能体开发门槛。该组合将大语言模型与物理执行器结合，使 AI 智能体能完成复杂任务。DGX Spark 提供分布式训练基础设施，Reachy Mini 则提供高精度七自由度机械臂硬件，共同推动具身智能发展。

智能体产品更新具身智能

00:00

Runway：News（网页）

Runway基于NVIDIA Rubin平台加速视频生成与世界模型

Runway率先在NVIDIA Rubin平台部署视频生成模型Gen-4.5与世界模型GWM-1。Gen-4.5在一天内从Hopper迁移至Vera Rubin NVL72，展现平台后向兼容性与生产就绪能力。Rubin单GPU提供50 PF推理算力，可加速实时长视频生成。GWM-1作为Runway首个通用世界模型家族，支持物理感知机器人训练、可探索虚拟世界及交互式化身，推动AI从文本理解向物理世界模拟演进。

产品更新具身智能视频

12月30日

08:00

xAI：News（网页）

精选

xAI推出Grok Business与Enterprise企业版

xAI发布Grok Business和Grok Enterprise企业版。Business版定价30美元/座位/月，支持自助开通，提供团队管理、统一账单及Google Drive集成（保留原文件权限），并承诺用户数据永不用于模型训练。Enterprise版面向大型组织，提供Custom SSO、Directory Sync及高级审计控制；可选的Enterprise Vault插件提供独立数据平面与客户自管加密密钥(CMEK)，实现应用级加密隔离。平台支持实时使用监控、安全对话共享及Projects功能。

智能体 xAI 产品更新部署/工程

推荐理由：xAI 推出 Grok 企业版，主打隐私保护与 Agent 能力，月费 30 美元起

12月25日

16:15

公众号：月之暗面（Kimi）

AlphaEngine Agent模型升级至Kimi K2 Thinking，7万金融投研人已在使用

金融投研工具AlphaEngine完成Agent模型升级，接入Kimi K2 Thinking。该工具目前已有7万金融投研人在使用。

智能体产品更新推理

12月24日

08:00

OpenRouter：Announcements（RSS）

利用NeMo Data Designer构建可蒸馏模型与合成数据管道

NVIDIA推出NeMo Data Designer工具，帮助企业生成合规的合成数据工作流，用于定制化大模型训练。该工具通过创建“许可证安全”的合成数据，规避版权风险，并支持构建可蒸馏的轻量级模型。它为在特定领域数据受限的企业提供了端到端的合成数据生成与管理解决方案，助力模型高效微调与优化。

产品更新数据/训练部署/工程

12月23日

13:08

Qwen：Blog Retrieval（API）

Qwen-Image-Edit-2511：提升一致性

Qwen Studio 集成聊天机器人、图像与视频理解、图像生成、文档处理、联网搜索、工具调用及 artifacts 等全栈 AI 功能。

产品更新图像生成多模态

00:00

Qwen：Blog Retrieval（API）

Qwen3-TTS 升级：支持语音克隆和语音设计！

Qwen3-TTS 新增语音克隆与语音设计能力，Qwen Studio 集成聊天机器人、图像视频理解、图像生成、文档处理、联网搜索、工具调用及 artifacts 等综合服务。

产品更新多模态语音

12月22日

08:00

xAI：News（网页）

Grok 发布 Collections API

Grok 推出 Collections API，支持上传 PDF、Excel、代码库等文件构建知识库，提供语义、关键词及混合搜索三种检索方式，帮助开发者零基础设施构建 RAG 应用。首周文件索引与存储免费，检索定价 $2.50/千次。基准测试显示，其在金融（93.0%）、法律（73.9%）、编码（86%）场景的检索准确率均优于 Gemini Pro 3 和 GPT 5.1。

检索增强 xAI 产品更新部署/工程

12月19日

12:47

公众号：豆包（字节）

豆包可以直接生成有声视频了

产品更新多模态

12月18日

08:00

OpenRouter：Announcements（RSS）

精选57

OpenRouter 推出 Response Healing：将 JSON 缺陷减少 80% 以上

OpenRouter 推出 Response Healing 新功能，可在响应到达应用前自动修复大语言模型产生的格式错误的 JSON，从而将 JSON 缺陷减少 80% 以上。

产品更新部署/工程

推荐理由：如果你无数次被 LLM 返回的残缺 JSON 搞到崩溃，OpenRouter 这个 response healing 能自动修复 80% 的缺陷，以后 debug 可以少肝半小时。

08:00

OpenRouter：Announcements（RSS）

OpenRouter 12月发布亮点：结构化输出响应修复、聊天室通知与长上下文模型排名

OpenRouter 推出结构化输出的响应修复（Response Healing）功能，新增聊天室通知，发布长上下文模型排行榜，并位列 Brex 增长最快 AI 基础设施榜单第一。

产品更新部署/工程

08:00

OpenRouter：Announcements（RSS）

OpenRouter 十二月发布：响应修复、聊天室通知、长上下文模型排名，登顶 Brex 最快增长 AI 基础设施榜单

OpenRouter 十二月版本更新引入响应修复（Response Healing）机制以提升结构化输出可靠性，新增聊天室通知功能，并推出长上下文模型排名。此外，OpenRouter 在 Brex 评选的增长最快 AI 基础设施公司榜单中位列第一。

产品更新部署/工程

08:00

OpenRouter：Announcements（RSS）

OpenRouter Response Healing 上线：将 JSON 错误减少 80%+

OpenRouter 推出 Response Healing 新功能，可在 JSON 响应到达应用程序之前自动修复大语言模型输出的畸形 JSON，从而将 JSON 缺陷减少 80% 以上。

产品更新编码

08:00

OpenRouter：Announcements（RSS）

十二月发布亮点

Anthropic 在十二月多项更新中重点推出结构化输出的 Response Healing 功能，可自动修复格式错误。平台新增聊天室通知系统，并发布长上下文模型性能排行榜，Claude 3.5 Sonnet 在 200K 上下文评测中领先。公司同时宣布其 AI 基础设施在 Brex 年度榜单中位列增长最快首位。

产品更新部署/工程

08:00

OpenRouter：Announcements（RSS）

精选61

Response Healing：将 JSON 缺陷减少 80% 以上

OpenRouter 推出新功能 Response Healing，可在 LLM 生成的畸形 JSON 响应抵达用户应用前自动修复。该功能旨在将 JSON 格式错误减少超过 80%，直接提升 API 响应的结构完整性与可靠性，减少下游应用的处理负担。

智能体产品更新部署/工程

推荐理由：做 Agent 的人最怕 JSON 解析炸掉整个 pipeline，OpenRouter 这个 Response Healing 相当于在网关层加了自动纠错，接入成本几乎为零，值得试试。

12月17日

08:00

xAI：News（网页）

精选

xAI 发布 Grok Voice Agent API

xAI 开放 Grok Voice Agent API，基于自研语音栈（VAD、tokenizer、音频模型），Big Bench Audio 基准排名第一，首音频延迟低于 1 秒（比竞品快近 5 倍），定价 $0.05/分钟。支持数十种语言自动切换、实时搜索 X 和网页、调用自定义工具，已深度集成特斯拉车机。提供 Ara、Eve 等多种自然声线，支持 [whisper] 等听觉标签，兼容 OpenAI Realtime API 规范。

智能体 xAI 产品更新语音

推荐理由：xAI发布Grok语音Agent API，延迟低于1秒且定价仅为OpenAI一半，已集成至Tesla车载系统

12月11日

09:00

公众号：蚂蚁百灵（Ling）

AReaL v0.5.0：强化学习框架的架构革新，执一驭万，智体同协

AReaL v0.5.0 是由蚂蚁百灵（Ling）发布的强化学习运行时服务框架，专为智能体与推理设计。

智能体产品更新推理

12月8日

00:00

智谱：研究（网页内嵌数据）

AutoGLM：每台手机，都可以成为 AI 手机

智谱发布全球首个手机Agent AutoGLM，创新采用ComputerRL、MobileRL与AgentRL技术架构，在Device Use基准测试中超越ChatGPT Agent等达到SOTA水平。支持通过自然语言指令完成点外卖、订酒店、办公等全场景任务，具备屏幕理解、自主规划与云端异步运行能力，可在专属云设备上"自动驾驶"手机而不占用本地资源。项目已开源并提供美团、微博、B站等实机操作案例。

智能体产品更新端侧

12月5日

00:00

Qwen：Blog Retrieval（API）

Qwen3-TTS 更新！49 种音色 + 10 种语言 + 9 种方言

Qwen3-TTS 发布更新，支持 49 种音色、10 种语言和 9 种方言。Qwen Studio 平台同步提供聊天机器人、图像视频理解、图像生成、文档处理、联网搜索、工具调用及 Artifacts 等全栈功能。

产品更新语音

11月25日

00:08

Hugging Face：Blog（RSS）

精选73

OVHcloud 成为 Hugging Face 官方推理服务提供商

OVHcloud 现已正式加入 Hugging Face Hub 的推理服务提供商生态。用户可直接在模型页面使用其全托管、无服务器化的 AI 端点服务，便捷调用 gpt-oss、Qwen3 等热门开源模型。该服务基于欧洲数据中心，保障数据主权与低延迟，首 token 响应时间低于 200 毫秒，并支持结构化输出等高级功能。定价为每百万 token 0.04 欧元起，用户可选择使用自定义 API 密钥或通过 Hugging Face 账户路由请求并计费。

Hugging Face 产品更新部署/工程

推荐理由：欧洲开发者可低成本合规访问前沿AI模型，推理选项更丰富。

11月24日

00:00

Anthropic：Engineering（事故复盘 + 工程实践 · 网页）

精选77

Claude开发者平台推出高级工具使用功能，提升AI代理效率

Anthropic在Claude开发者平台发布三项新功能，以解决传统工具调用消耗大量上下文、易出错的问题。工具搜索工具允许按需加载工具，内部测试中将上下文消耗从约7.7万令牌降至8700令牌，降幅达85%，并将准确率从49%提升至74%。程序化工具调用支持在代码环境中调用工具，减少对上下文窗口的影响，例如Claude for Excel可借此处理数千行数据。工具使用示例则提供了展示工具有效使用方法的通用标准。这些功能共同提升了AI代理处理大规模工具库的能力。

智能体 Anthropic MCP/工具产品更新

推荐理由：做 Agent 的人都卡在工具一多上下文就爆、调用就错这两个坑上，Anthropic 这三个功能直接把工具管理从「全塞进去」变成「按需加载+代码编排+示例纠错」，是目前最工程化的解法。

11月20日

23:13

Google DeepMind：Blog（RSS）

Gemini 应用新增 AI 图像验证功能，可识别 SynthID 水印

Google 在 Gemini 应用中上线 AI 图像验证工具，用户上传图片即可查询是否由 Google AI 生成或编辑。该功能通过检测 SynthID 数字水印实现，该技术已应用于超 200 亿个 AI 生成内容。未来验证范围将扩展至视频和音频，并支持 C2PA 内容凭证标准。本周起，Nano Banana Pro（Gemini 3 Pro Image）在 Gemini、Vertex AI 和 Google Ads 中生成的图像将嵌入 C2PA 元数据，未来还将支持验证 Google 生态系统外的模型生成内容。

DeepMind Google 产品更新图像生成

08:23

Midjourney：Updates（RSS）

Web 端更新

随 Profiles 功能今日上线，"Hide"过滤器更名为"Trash"。被移至 Trash 的创作内容将不再显示于 Create 页面，功能命名更贴合实际用途。

产品更新图像生成

03:04

Midjourney：Updates（RSS）

Midjourney 推出用户个人资料功能

Midjourney 正式推出用户个人资料功能，用户可创建专属主页向社区展示作品，支持自定义用户名、头像、横幅、简介及社交媒体链接。

产品更新图像生成

11月19日