MiniMax即将发布M3模型。其核心架构为基于GQA的动态块稀疏注意力机制，通过轻量索引分支筛选相关token块进行稀疏注意力计算。性能方面，在1M token上下文窗口下，Prefill速度相比M2提升9.7倍，解码速度提升15.6倍。该设计旨在大幅降低处理超长上下文的算力成本，使百万token级别的Agent应用得以更高效落地。

Skyler Miao: Something BIG is coming

推理模型发布

07:37

Artificial Analysis@ArtificialAnlys

OpenBMB发布1B参数模型MiniCPM5-1B，在小规模开源模型中表现最优

OpenBMB发布了MiniCPM5-1B（Non-reasoning），一款1B参数的稠密大语言模型。该模型在Artificial Analysis Intelligence Index上获得17.9分，成为1B及以下开源模型中得分最高者。其得分领先同规模模型Qwen3.5 0.8B（10.5分）和Qwen3.5 2B（16.3分），性能超越前代模型MiniCPM-V 4.6 1.3B（12.7分）。MiniCPM5-1B为纯文本模型，上下文窗口128K，采用Apache 2.0许可证。在AA-Omniscience测试中，其通过选择“拒绝回答”而非猜测，避免了模型幻觉惩罚，获得了同尺寸类别的最高分。

开源生态模型发布端侧

07:27

Berryxia.AI@berryxia

PrismML发布Bonsai Image 4B极致压缩版本

PrismML发布了Bonsai Image 4B扩散模型的1-bit和Ternary两个极致压缩版本。1-bit版本仅0.93GB，比全精度模型缩小8.3倍；Ternary版本为1.21GB，采用-1、0、+1三元权重。两者在Mac M4 Pro上的生成速度最高可提升5.6倍，且生成质量可与更大模型相媲美。同时，PrismML推出了配套的iOS应用Bonsai Studio，支持在iPhone上完全离线、本地生成图像。

PrismML: Today we're releasing 1-bit and Ternary Bonsai Image 4B. A new family of image-generation models designed to run high-qu...

图像生成模型发布端侧

02:39

🚨 AI News | TestingCatalog@testingcatalog

MiniMax M3 已被预告 🔥 > MiniMax M3 将基于新的稀疏注意力架构 > MiniMax M3 预计将开源很快？ 👀

MiniMax (official): #MSA #OpenSource #M3 🫣😎

开源/仓库模型发布

02:10

OpenCode@opencode

Qwen3.7 Max 现已在 Go 平台上线 - 仅支持文本 - 1M 上下文 - 迄今为止 Qwen 家族中最智能的模型

模型发布编码

00:01

Chubby♨️@kimmonismus

MiniMax发布M3稀疏注意力，1M上下文下解码加速15.6倍

MiniMax预览了其M3架构采用的新稀疏注意力（Sparse Attention）技术。测试显示，在1M token上下文下，该技术相比M2实现了9.7倍的预填充（prefilling）加速和15.6倍的解码（decoding）加速。M2曾为保证生产环境就绪而采用全注意力机制，M3则采用了新的两阶段方法：先用轻量级索引分支选择数据块，再仅对相关的KV块执行稀疏注意力。这是开源领域的新进展。

MiniMax (official): #MSA #OpenSource #M3 🫣😎

开源生态推理模型发布

5月26日

23:11

MiniMax (official)@MiniMax_AI

#MSA #开源 #M3 🫣😎

Skyler Miao: Something BIG is coming

开源生态模型发布

14:59

Alibaba Cloud@alibaba_cloud

Qwen3.7-Max 正式成为全球第二大 AI 编程模型。在 Code Arena 上得分 1541，仅次于 Claude。专为生产环境打造：可运行 35 小时任务、1000+ 次工具调用，并在数小时内交付两周的项目。

推理模型发布编码

14:28

向阳乔木@vista8

网易有道子曰4全模态模型开源，27B参数，TTS支持3秒声音克隆

网易有道发布子曰4，一个27B参数的全模态大语言模型，在视觉数理方向达到同规模SOTA，纯文本数理难题准确率为81.4%。该模型在27B“甜点级”参数规模下，实现了多模态与纯文本数理推理的双重优势。同时，子曰4全模态模型和TTS引擎已同步开源，开放参数权重，支持本地部署与二次训练。其TTS模型只需3秒即可克隆原声，支持14种语言，克隆准确度超97%，音色还原度达95%以上。

多模态开源生态模型发布语音

10:59

Tencent Hy@TencentHunyuan

腾讯混元新翻译模型双榜亮眼，小程序发布

腾讯混元发布翻译模型 Hy-MT2，在 Hugging Face 开源模型趋势排行榜上表现突出：1.8B 版本排名第一，30B-A3B（MoE）版本排名第四，下载量已超 7K。官方同步推出了基于该模型的“腾讯混译”微信小程序，支持语音输入与离线翻译，并可自定义翻译风格与指令。模型代码与权重已开源。

Hugging Face 开源生态模型发布

关联讨论 2 条

09:55

Alibaba Cloud@alibaba_cloud

Anthropic发布了Claude Code的更新，现在它可以在后台运行任务。

模型发布

03:20

Emad@EMostaque

xAI的Grok基础模型V9-Medium（1.5T参数）已完成训练，评测结果良好。在补充训练中加入了大量Cursor数据。该模型即将开始微调，几天后启动强化学习，预计2至3周后向公众发布。这将是相较于目前服务所有Grok生产流量的0.5T参数v8-small模型的重大改进，尤其在复杂编码任务上。有人推测其后训练可能使用了类似Cursor调整Kimi时远超预训练的计算量。

Elon Musk: Grok foundation model V9-Medium (1.5T) has finished training. Evals look good. A lot of Cursor data was added in supplem...

xAI 模型发布编码

5月25日

15:08

🚨 AI News | TestingCatalog@testingcatalog

Grok基础模型V9-Medium（参数规模1.5T）已完成训练，评估结果良好，预计2-3周内向公众发布。该模型相较于当前服务所有Grok生产流量的0.5T v8-Small版本有巨大改进，尤其针对高难度编码任务。训练中加入了大量Cursor数据，并且未来还会有更多补充训练。目前微调已进行，强化学习将在几天内开始。

Elon Musk: Grok foundation model V9-Medium (1.5T) has finished training. Evals look good. A lot of Cursor data was added in supplem...

xAI 模型发布编码

13:50

Elon Musk@elonmusk

精选71

Grok基础模型V9-Medium（1.5T）已完成训练。评估结果良好。补充训练中加入了大量Cursor数据，后续还会有更多。微调正在进行中，强化学习将在几天后开始。预计2到3周内公开发布。这将比当前服务所有Grok生产流量的0.5T v8-small模型有重大改进，尤其在复杂编码任务上。

xAI 模型发布编码

推荐理由：Grok 参数翻到 1.5T，还专门喂了 Cursor 代码数据，这波升级明显奔着 coding 去的。如果 evals 不注水，两周后的 coding 排行榜可能变天。

13:21

小互@xiaohu

影眸科技发布 Rodin Gen-2.5 3D 生成模型

影眸科技推出 Rodin Gen-2.5，号称全球首个千万面级 3D 生成模型。该模型提供从极低（4秒）到极高（80秒）的五档思考模式，以平衡生成速度与细节精度。其原生 3D 贴图算法能在三维空间直接生成纹理，支持 PBR 材质与 360° 无死角覆盖，并提供 Faithful（贴合参考）与 Creative（自动优化）两种贴图模式。该模型已获 SIGGRAPH 2025 最佳论文奖。

多模态模型发布

06:27

Chubby♨️@kimmonismus

Google DeepMind的AlphaProof Nexus自主解决多个开放数学问题

Google DeepMind的AlphaProof Nexus系统自主解决了9个开放的Erdős问题（部分问题存在56年），每个问题的成本约几百美元。它还证明了44个OEIS猜想，解决了一个15年的代数几何问题，并在优化理论中发现了新算法参数。其核心机制是将大语言模型的推理能力与Lean形式化验证系统结合，Lean自动检查每一步逻辑，无需人工复核。研究发现，一个仅交替使用大语言模型生成与编译器反馈的基础智能体，便能复现全部9个Erdős问题的成功。该系统还能检测并修正现有数学文献中的表述错误。其局限在于成功案例集中于Lean数学库成熟的领域（如组合、数论），仍无法解决需要全新理论的大问题。

DeepMind 开源生态推理模型发布

5月24日

07:07

🚨 AI News | TestingCatalog@testingcatalog

ANTHROPIC 🔥：Mythos 1，即"claude-mythos-1-preview"，正准备在Claude Code和Claude Security上发布。该模型曾在Claude上短暂可见；此外，新增了提及Mythos的字符串。 > 在Claude Code和Claude Security中访问Claude Mythos模型。根据Anthropic之前的沟通，这仍不意味着公众将能访问此确切模型。更多详情请见下方 👇

Anthropic 推理模型发布

06:49

StepFun@StepFun_ai

精选76

StepAudio实时语音发布，能听懂你的语气与言外之意

StepAudio 2.5 Realtime 是一款实时语音交互模型。其核心优势在于能感知用户的副语言特征，如语气、节奏、停顿甚至轻叹，从而理解话语背后的真实意图。该模型支持通过 API 高度定制角色人格与说话风格，内置超过10,000种可组合的预置角色，并提供5种开箱即用的预设角色供体验。同时，模型经过RLHF优化，能在复杂的角色扮演压力测试中稳定保持设定的人设。支持中英文双语交互。

模型发布语音

推荐理由：StepFun 这个语音模型把副语言感知做进了实时 API，产品人想搞点情感化语音交互的可以试试，预设角色能省不少调 prompt 的功夫。

05:27

Chubby♨️@kimmonismus

看起来 GPT-5.6 的发布非常接近了。真的很期待。5.5 已经是一个极其出色的模型了。希望它在"感觉"上能再好一点。【引用 @synthwavedd】：我非常激动地宣布，看起来他们开始在 GPT-5.6 的 UI 去臃肿化方面取得进展了！🥹 这是第一个没有任何 UI 指引（"默认"）的提示词效果--我们正在取得进展……

leo 🐾: i am absolutely THRILLED to announce that it appears they're beginning to make strides on UI de-slopification with GPT-5...

OpenAI 模型发布

00:57

Chubby♨️@kimmonismus

在Google Vertex上发现了Opus 4.8。不过这一点尚无法确认。然而，自数据泄露以来，Sonnet 4.8即将到来已是众所周知。 Opus 4.8出现在Vertex上让我感到意外--不过，考虑到加速的发布节奏和GPT-5.5的巨大成功，这确实有可能。简直太令人兴奋了！

can: claude-opus-4.8 is on Google Vertex 👀

Anthropic 模型发布行业动态

5月23日

06:37

🚨 AI News | TestingCatalog@testingcatalog

Anthropic在Project Glasswing项目最新进展中宣布，Mythos级模型在开发出更强的安全防护措施后，预计将向公众开放。此前，Anthropic与合作伙伴通过该项目已发现超过一万个关键或高危软件漏洞。这为模型后续的强安全防护开发提供了重要背景与方向。

Anthropic: Last month we launched Project Glasswing, our collaborative AI cybersecurity initiative. Since then, we and our partners...

Anthropic 安全/对齐模型发布

5月22日

22:56

Rohan Paul@rohanpaul_ai

精选75

首个基于华为昇腾910B NPU全栈训练的1.58比特开源大模型BitCPM-CANN发布

ModelBest、清华大学与OpenBMB社区联合发布了BitCPM-CANN，这是全球首个完全基于华为昇腾910B NPU训练的开源1.58比特三元大模型。其核心创新在于采用仅含三种权重状态的极低比特量化技术，使模型内存占用相比BF16降低约6倍，可高效部署于手机、电脑、车载设备等边缘端。更关键的是，整个训练全栈（从量化算子到框架）均在昇腾上原生构建与验证，而非简单移植。该模型家族（0.5B-8B）在多项基准测试上保持了全精度模型95-97%的性能，为资源受限环境下部署和复现大模型提供了可落地的解决方案。

OpenBMB: 🚀 BitCPM-CANN by ModelBest × @Tsinghua_Uni × OpenBMB is here - and it's not about stacking parameters. Memory costs are...

开源/仓库模型发布端侧

关联讨论 1 条

推荐理由：首个开源的1.58-bit三元LLM，直接在昇腾芯片上原生训练，内存压缩到BF16的六分之一，8B模型就能跑在手机上，做端侧部署的可以立刻上手试试了。