5月26日

11:30

公众号：昆仑万维（天工）

天工AI今日推出SkyClaw-v1.0及轻量版SkyClaw-v1.0-lite，支持百万token上下文，深度适配复杂工具调用、多轮任务执行、代码生成与文件编辑等智能体场景。模型在主流Agent benchmark上全面超越Minimax 2.7、DeepSeek V4 Flash及Qwen 3.6，在OpenClaw任务上接近更大规模模型，定价低于Minimax 2.7与Qwen 3.6一半。训练采用大规模mid-train、合成轨迹SFT与端到端Agentic RL优化，适配OpenClaw、Hermes、Claude Code等主流Agent框架。模型已于5月22日接入天工Skywork，开放2至4周免费试用，并提供兼容OpenAI格式的免费API调用。

智能体模型发布编码

10:59

Tencent Hy@TencentHunyuan

腾讯混元新翻译模型双榜亮眼，小程序发布

腾讯混元发布翻译模型 Hy-MT2，在 Hugging Face 开源模型趋势排行榜上表现突出：1.8B 版本排名第一，30B-A3B（MoE）版本排名第四，下载量已超 7K。官方同步推出了基于该模型的“腾讯混译”微信小程序，支持语音输入与离线翻译，并可自定义翻译风格与指令。模型代码与权重已开源。

Hugging Face 开源生态模型发布

关联讨论 2 条

09:55

Alibaba Cloud@alibaba_cloud

Anthropic发布了Claude Code的更新，现在它可以在后台运行任务。

模型发布

09:11

IT之家（RSS）

Anthropic 或公开最强模型 Mythos，曾短暂现身多款产品

据科技媒体报道，Anthropic 似乎准备公开上线其前沿模型 Claude Mythos 预览版。该模型名称“claude-mythos-1-preview”曾短暂出现在 Claude Code 和 Claude Security 的公开版本中。Claude Mythos 定位为面向计算机安全任务的模型，相比现有旗舰模型 Opus 4.7，在代码推理和自主执行方面有显著提升。但因其能力过强，Anthropic 担忧公开发布可能带来安全风险，目前尚未全面开放。同时，Anthropic 还在推进名为“Glasswing”的联合项目，旨在保护关键软件系统。

Anthropic 安全/对齐模型发布

07:11

IT之家（RSS）

精选74

OpenAI GPT-5.6 模型曝下月发布：AI 上下文 150 万 tokens

多名开发者在 OpenAI Codex 后端日志中发现未官宣的 GPT-5.6 模型，内部代号 iris-alpha。该模型将支持 150 万 token 的上下文窗口，较当前 GPT-5.5 的 105 万 token 提升约 43%，有望于今年 6 月发布。测试显示，在输入达到 90 万 token 时仍能流畅响应。同系列还发现了 ember-alpha 与 beacon-alpha 版本。此外，GPT-5.6 在前端界面生成能力上也有所提升。基于爆料信息，Anthropic Claude、Google Gemini 及 xAI Grok 也可能瞄准同期发布新模型。

OpenAI 模型发布编码

推荐理由：开发者从后端日志扒出 GPT-5.6，150 万上下文是真香，直接生成商用级前端界面更让人眼馋，这代模型值得等。

03:20

Emad@EMostaque

xAI的Grok基础模型V9-Medium（1.5T参数）已完成训练，评测结果良好。在补充训练中加入了大量Cursor数据。该模型即将开始微调，几天后启动强化学习，预计2至3周后向公众发布。这将是相较于目前服务所有Grok生产流量的0.5T参数v8-small模型的重大改进，尤其在复杂编码任务上。有人推测其后训练可能使用了类似Cursor调整Kimi时远超预训练的计算量。

Elon Musk: Grok foundation model V9-Medium (1.5T) has finished training. Evals look good. A lot of Cursor data was added in supplem...

xAI 模型发布编码

5月25日

18:49

蚂蚁 inclusionAI：HuggingFace 新模型

同事件精选71

<中文标题>SingGuard：策略自适应多模态护栏模型族开源</中文标题>

<中文摘要>SingGuard 是一个策略自适应的多模态护栏模型族，包含 Sing-Guard-4b 和 Sing-Guard-8b 两个版本。它将安全策略作为运行时输入而非固定分类，部署团队可自定义自然语言规则而无需重训练模型。支持文本、图像、图文、多语言以及查询端与响应端的安全评估，提供快速和快慢结合两种推理模式。在涵盖多模态安全、纯图像安全、文本查询/响应安全、多语言查询/响应安全六大类基准上取得平均 SOTA 表现。模型已开源至 HuggingFace 和 ModelScope。</中文摘要>

Hugging Face 多模态安全/对齐模型发布

同一事件，精选展示《蚂蚁 inclusionAI 开源多模态安全护栏模型 SingGuard》

推荐理由：蚂蚁的 SingGuard 把安全策略变成了运行时输入，意味着审核规则可以随时改而不必重训模型，这对做内容安全的产品人是真省事，值得跟进。

18:48

蚂蚁 inclusionAI：HuggingFace 新模型

同事件精选69

蚂蚁 inclusionAI 发布策略自适应多模态安全护栏模型 Sing-Guard-8b

SingGuard 是蚂蚁 inclusionAI 推出的策略自适应多模态大语言模型安全护栏模型族（版本 Sing-Guard-8b），支持纯文本、纯图像、图文混合、多语言查询与回复的安全评估。其核心设计将安全策略作为运行时输入，部署团队可基于默认分类或自定义自然语言规则评估内容，无需重新训练模型。模型内置 fast-slow 动态推理流程：首 token 路由快速输出安全信号，需深度推理时继续生成更精确的最终判断。在涵盖多模态安全、纯图像安全、文本查询与回复安全、多语言查询与回复安全的六大基准测试上取得平均 SOTA 性能，并已开源至 HuggingFace 与 ModelScope。

Hugging Face 多模态安全/对齐开源/仓库

同一事件，精选展示《蚂蚁 inclusionAI 开源多模态安全护栏模型 SingGuard》

推荐理由：蚂蚁集团开源的多模态内容审核模型，最大亮点是运行时动态注入安全策略而不需重训，对需要灵活定制审核规则的团队是低门槛的高分工程实现。

18:48

蚂蚁 inclusionAI：HuggingFace 新模型

同事件精选68

inclusionAI 发布 Sing-Guard-2b：策略自适应多模态大模型安全护栏

inclusionAI 开源了 Sing-Guard 模型家族，版本包括 Sing-Guard-2b 和 Sing-Guard-8b。该模型将安全策略作为运行时输入，支持文本、图像、图文及多语言场景的查询侧

Hugging Face 多模态安全/对齐模型发布

同一事件，精选展示《蚂蚁 inclusionAI 开源多模态安全护栏模型 SingGuard》

推荐理由：SingGuard把安全策略变成运行时输入，不用再为新规则重新训练模型，这对需要频繁调整审核标准的团队来说是个实用的发布。

15:25

蚂蚁 inclusionAI：GitHub 新仓库

精选67

蚂蚁 inclusionAI 开源多模态安全护栏模型 SingGuard

SingGuard 是蚂蚁 inclusionAI 开源的多模态安全护栏模型族，提供 2B、4B、8B 三个参数版本。它将安全策略作为运行时输入，支持文本、图像、图文、多语言及查询/回复侧的安全评估，无需重新训练即可适配不同规则。采用快慢动态推理机制，在低延迟场景下输出紧凑判断，对模糊或高风险内容进行策略引导的推理。在多模态安全、图像安全、文本查询与回复安全、多语言查询与回复安全等基准上达到 SOTA 平均性能。模型已上架 HuggingFace 和 ModelScope。

多模态安全/对齐模型发布

推荐理由：蚂蚁 inclusionAI 把安全护栏做成了“运行时可配置”的模型，换审核规则不用重训，对需要快速适配法规的团队是个真需求。不过生态刚起步，暂时还是小众工具。

15:11

IT之家（RSS）

马斯克宣布 Grok V9-Medium 1.5T 模型完成训练：加入大量 Cursor 数据，两到三周内发布

xAI 模型发布编码

15:08

🚨 AI News | TestingCatalog@testingcatalog

Grok基础模型V9-Medium（参数规模1.5T）已完成训练，评估结果良好，预计2-3周内向公众发布。该模型相较于当前服务所有Grok生产流量的0.5T v8-Small版本有巨大改进，尤其针对高难度编码任务。训练中加入了大量Cursor数据，并且未来还会有更多补充训练。目前微调已进行，强化学习将在几天内开始。

Elon Musk: Grok foundation model V9-Medium (1.5T) has finished training. Evals look good. A lot of Cursor data was added in supplem...

xAI 模型发布编码

13:50

Elon Musk@elonmusk

精选71

Grok基础模型V9-Medium（1.5T）已完成训练。评估结果良好。补充训练中加入了大量Cursor数据，后续还会有更多。微调正在进行中，强化学习将在几天后开始。预计2到3周内公开发布。这将比当前服务所有Grok生产流量的0.5T v8-small模型有重大改进，尤其在复杂编码任务上。

xAI 模型发布编码

推荐理由：Grok 参数翻到 1.5T，还专门喂了 Cursor 代码数据，这波升级明显奔着 coding 去的。如果 evals 不注水，两周后的 coding 排行榜可能变天。

13:21

小互@xiaohu

影眸科技发布 Rodin Gen-2.5 3D 生成模型

影眸科技推出 Rodin Gen-2.5，号称全球首个千万面级 3D 生成模型。该模型提供从极低（4秒）到极高（80秒）的五档思考模式，以平衡生成速度与细节精度。其原生 3D 贴图算法能在三维空间直接生成纹理，支持 PBR 材质与 360° 无死角覆盖，并提供 Faithful（贴合参考）与 Creative（自动优化）两种贴图模式。该模型已获 SIGGRAPH 2025 最佳论文奖。

多模态模型发布

12:11

IT之家（RSS）

同事件精选72

面壁智能联合清华等开源中国首个基于华为昇腾训练的 1.58-bit 端侧大模型 BitCPM-CANN

开源生态模型发布端侧

同一事件，精选展示《首个基于华为昇腾910B NPU全栈训练的1.58比特开源大模型BitCPM-CANN发布》

推荐理由：谁说国产算力只能跑小模型？面壁这个1.58-bit模型在昇腾上原生训练，直接把8B塞进旗舰手机，开源全套训练底座，做端侧的该看一眼。

11:35

公众号：面壁智能（MiniCPM）

面壁智能联合清华开源中国首个基于昇腾训练的1.58-bit端侧大模型 BitCPM-CANN

面壁智能联合清华大学正式开源中国首个基于昇腾训练的1.58-bit端侧大模型BitCPM-CANN，实现6倍显存效率提升，可将60B参数大模型封装进手机等端侧设备。

推理模型发布端侧

07:06

MarkTechPost（RSS）

阶跃星辰发布StepAudio 2.5 Realtime：一款具有角色扮演RLHF和副语言理解的端到端语音模型

阶跃星辰于2026年5月发布StepAudio 2.5 Realtime，这是一款支持完全可定制个性化角色的端到端实时语音大语言模型。该模型通过WebSocket API提供服务，支持中英文。在2026年4月进行的五个基准测试维度中均排名第一，具体包括80.41的人类评测得分和82.18的副语言理解得分。

模型发布语音

06:27

Chubby♨️@kimmonismus

Google DeepMind的AlphaProof Nexus自主解决多个开放数学问题

Google DeepMind的AlphaProof Nexus系统自主解决了9个开放的Erdős问题（部分问题存在56年），每个问题的成本约几百美元。它还证明了44个OEIS猜想，解决了一个15年的代数几何问题，并在优化理论中发现了新算法参数。其核心机制是将大语言模型的推理能力与Lean形式化验证系统结合，Lean自动检查每一步逻辑，无需人工复核。研究发现，一个仅交替使用大语言模型生成与编译器反馈的基础智能体，便能复现全部9个Erdős问题的成功。该系统还能检测并修正现有数学文献中的表述错误。其局限在于成功案例集中于Lean数学库成熟的领域（如组合、数论），仍无法解决需要全新理论的大问题。

DeepMind 开源生态推理模型发布

5月24日

16:06

MarkTechPost（RSS）

NVIDIA发布Gated DeltaNet-2：解耦Delta规则中擦除与写入的线性注意力层

NVIDIA推出了改进的线性注意力模型Gated DeltaNet-2。其核心创新在于将Delta规则中控制记忆擦除与写入的单一门控机制，解耦为两个独立的通道级门控。该模型参数规模为1.3B，在100B个FineWeb-Edu令牌数据上训练。实验表明，它在语言建模、常识推理和长上下文检索等任务中全面超越了Mamba-2、Gated DeltaNet、KDA及Mamba-3等现有模型，尤其在RULER S-NIAH和多关键针检索任务中取得了最显著的性能提升。

推理搜索模型发布

07:27

Chubby♨️@kimmonismus

2026年AI大模型发布呈现鲜明对比与戏剧性。OpenAI采取审慎策略，通过"可信访问"机制，向验证过的安全专家限量推出GPT-5.5-Cyber。与之形成反差的是，Anthropic官方曾宣称其Claude Mythos模型因过于强大不适合公开发布，但该模型却意外短暂出现在用户界面中，并导致服务容量告罄。现有信息表明，Anthropic正为Claude Mythos（代号claude-mythos-1-preview）在Claude Code与Claude Security等企业产品线上的发布做准备，但这并不等同于面向公众的全面开放。整个过程充满了计划与意外的交织。

🚨 AI News | TestingCatalog: ANTHROPIC 🔥: Mythos 1, "claude-mythos-1-preview", is being prepared for a release on Claude Code and Claude Security. T...

Anthropic OpenAI 大佬观点模型发布

07:07

🚨 AI News | TestingCatalog@testingcatalog

ANTHROPIC 🔥：Mythos 1，即"claude-mythos-1-preview"，正准备在Claude Code和Claude Security上发布。该模型曾在Claude上短暂可见；此外，新增了提及Mythos的字符串。 > 在Claude Code和Claude Security中访问Claude Mythos模型。根据Anthropic之前的沟通，这仍不意味着公众将能访问此确切模型。更多详情请见下方 👇

Anthropic 推理模型发布

06:49

StepFun@StepFun_ai

精选76

StepAudio实时语音发布，能听懂你的语气与言外之意

StepAudio 2.5 Realtime 是一款实时语音交互模型。其核心优势在于能感知用户的副语言特征，如语气、节奏、停顿甚至轻叹，从而理解话语背后的真实意图。该模型支持通过 API 高度定制角色人格与说话风格，内置超过10,000种可组合的预置角色，并提供5种开箱即用的预设角色供体验。同时，模型经过RLHF优化，能在复杂的角色扮演压力测试中稳定保持设定的人设。支持中英文双语交互。

模型发布语音

推荐理由：StepFun 这个语音模型把副语言感知做进了实时 API，产品人想搞点情感化语音交互的可以试试，预设角色能省不少调 prompt 的功夫。