5月27日

07:37

Artificial Analysis@ArtificialAnlys

OpenBMB发布1B参数模型MiniCPM5-1B，在小规模开源模型中表现最优

OpenBMB发布了MiniCPM5-1B（Non-reasoning），一款1B参数的稠密大语言模型。该模型在Artificial Analysis Intelligence Index上获得17.9分，成为1B及以下开源模型中得分最高者。其得分领先同规模模型Qwen3.5 0.8B（10.5分）和Qwen3.5 2B（16.3分），性能超越前代模型MiniCPM-V 4.6 1.3B（12.7分）。MiniCPM5-1B为纯文本模型，上下文窗口128K，采用Apache 2.0许可证。在AA-Omniscience测试中，其通过选择“拒绝回答”而非猜测，避免了模型幻觉惩罚，获得了同尺寸类别的最高分。

开源生态模型发布端侧

05:58

Nathan Lambert@natolambert

释放100B Gemma 4 MoE！Gemini Flash 3.5已发布，现在可以发布它了！

Google 大佬观点开源生态

03:20

swyx@swyx

每个人都在谈论中国追赶美国却很少有人谈论美国追赶中国干得好 @o_lacombe 等人，@robert_mchardy 等人！

Latent.Space: [AINews 3 Apr 2026] Gemma 4: The world's best small Multimodal Open Models, dramatically better than Gemma 3 in every wa...

Google 多模态大佬观点开源生态

00:01

Chubby♨️@kimmonismus

MiniMax发布M3稀疏注意力，1M上下文下解码加速15.6倍

MiniMax预览了其M3架构采用的新稀疏注意力（Sparse Attention）技术。测试显示，在1M token上下文下，该技术相比M2实现了9.7倍的预填充（prefilling）加速和15.6倍的解码（decoding）加速。M2曾为保证生产环境就绪而采用全注意力机制，M3则采用了新的两阶段方法：先用轻量级索引分支选择数据块，再仅对相关的KV块执行稀疏注意力。这是开源领域的新进展。

MiniMax (official): #MSA #OpenSource #M3 🫣😎

开源生态推理模型发布

5月26日

23:58

Nathan Lambert@natolambert

Gemma 4 在同规模模型上的采用率超过通义千问 3.5/3.6，标志着开源模型国际影响力格局的重大转变。

Interconnects: Some ideas for what comes next, May 2026 Gemini Flash 3.5, Mythos, open-closed balance, America's open-source surge, eme...

Google 大佬观点开源生态

23:49

Nathan Lambert：Interconnects（RSS）

精选67

未来展望：2026年5月的一些想法

文章展望了截至2026年5月AI领域的动态。内容涉及 Gemini Flash 3.5 的发布、名为 Mythos 的新产品或项目、开源与闭源生态平衡（open-closed balance）的讨论、美国开源力量的显著增长（America's open-source surge），以及由此引发的新兴权力博弈（emerging power struggles）。

Anthropic Google 大佬观点开源生态

推荐理由：Nathan Lambert 对开源模型追赶闭源的周期判断、Gemini 在编码代理领域的缺位分析，以及美国开源模型崛起的观察，为理解当前鼎立格局提供了扎实的坐标，值得从业者细读。

23:29

小互@xiaohu

Capafy让AI Skills闭源变现，解决开发者收益痛点

Capafy平台解决了一个AI生态痛点：Skill开发者因生态默认开源而无法盈利。在Capafy上，Skills作为闭源产品在云端运行，用户获得产出而非代码。开发者可自定价格，且每次被调用都能获得收益。平台还允许开发者上传在Claude Code、Codex或OpenClaw中构建的Skills并赚钱，同时用户可一键调用来自各行业顶尖人才的专业技能。

Capafy: Introducing Capafy: the Skill-based Agent Marketplace. Now your Skill runs as a product and earns while you sleep. On Ca...

智能体产品更新开源生态

23:29

SenseTime@SenseTime_AI

同事件精选77

开源多模态模型SenseNova-U1完整训练代码库

商汤开源了SenseNova-U1（8B dense + A3B MoE）的完整训练代码库。这是一个统一的框架，支持文本到图像、图像编辑、交错生成、文本与视觉理解等多种多模态任务的训练。其设计注重实用性与大规模训练，采用混合并行、流式可恢复数据管道、环境变量配置、解耦模块化设计，并支持从1×8 GPU扩展到多节点集群的规模。代码库以Apache-2.0协议开源。

多模态开源/仓库开源生态数据/训练

同一事件，精选展示《商汤发布信息图生成模型升级，增强多项核心能力》

推荐理由：商汤把 SenseNova-U1 的训练代码全量开源，支持多模态任务和 MoE，还给了完整的并行策略，做多模态训练的可以直接 fork 过去用，Apache-2.0 很友好。

23:27

Berryxia.AI@berryxia

论文《Language Models Need Sleep》摘要

CMU与UMD的研究团队在论文《Language Models Need Sleep》（arXiv 2605.26099）中指出，传统Transformer模型在处理长任务时，因注意力机制计算复杂度高及KV cache显存占用持续增长而导致效率低下。为此，他们提出了受生物启发的“类睡眠巩固”机制：模型会周期性进入“睡眠”状态，离线多轮处理最近的上下文，并将信息固化到模型状态空间块的fast weights中，随后清空KV cache。实验表明，增加睡眠深度或时长能显著提升模型后续的推理能力。该框架完全开源，提供了一种区别于暴力堆显存的长上下文处理新范式。

himanshu: very cool research (and nomenclature)

arXiv 开源生态推理论文/研究

23:19

Claude@claudeai

六个Claude项目都源于同一个问题："为什么不呢？"

Anthropic 开源生态教程/实践

23:11

MiniMax (official)@MiniMax_AI

#MSA #开源 #M3 🫣😎

Skyler Miao: Something BIG is coming

开源生态模型发布

22:58

SenseTime@SenseTime_AI

SenseNova-U1全训练代码开源，支持多模态多任务训练

OpenSenseNova开源了SenseNova-U1的完整训练代码库，支持其8B密集模型与A3B MoE架构。该代码库使用一个统一的框架，可同时训练多种多模态任务，包括文本到图像生成、图像编辑、交错生成及文本与视觉理解。工程上为大规模训练设计，支持混合并行、流式可恢复数据管线、环境变量驱动配置以及从1×8 GPUs到多节点集群的扩展能力。代码已在GitHub开源，采用Apache-2.0协议。

图像生成多模态开源/仓库开源生态

关联讨论 1 条

21:19

HuggingFace Daily Papers（社区热门论文）

CUA-Gym：为计算机使用智能体扩展可验证的训练环境与任务

针对计算机使用智能体（CUA）训练中可验证数据稀缺的问题，本文提出了CUA-Gym这一可扩展流水线，能够协同生成任务指令、环境状态与奖励函数。该流水线包含生成器智能体与判别器智能体，并通过协调器驱动执行与过滤。基于此流程，我们构建了包含32,112个验证元组、涵盖110个环境的数据集。使用GSPO算法在CUA-Gym上训练的A3B和A17B模型，在OSWorld-Verified基准上分别达到62.1%和72.6%的分数，优于同等规模的先前开源模型。模型还在未见过的WebArena基准上取得提升，展现了跨环境迁移能力。项目将开源完整的合成流程、数据集、环境及模型。

智能体 arXiv 开源生态数据/训练

20:30

Tencent Hy@TencentHunyuan

同事件精选70

腾讯 Hy-MT2 开源，HuggingFace 排行榜登顶

腾讯的 Hy-MT2 模型基于 Apache License 2.0 开源，可用于研究、商业使用、微调和衍生品，无任何限制。其两个变体在 Hugging Face 趋势排行榜上分别位居 #1 和 #4，鼓励社区克隆、分叉和反馈以推动迭代。

Hugging Face 开源生态行业动态

同一事件，精选展示《腾讯开源Hy-MT2多语言翻译模型》

推荐理由：腾讯把Hy-MT2改成Apache 2.0许可证，商用衍生都没问题，之前因为许可犹豫的人现在可以放心用了，模型在Hugging Face trending霸榜，值得重新评估。

18:13

IT之家（RSS）

小米 2026 财年第一财季经调整净利润 60.72 亿元，同比下降 43.1%

小米发布2026财年第一财季（1-3月）财报，营收991亿元，同比下降10.9%；经调整净利润60.72亿元，同比下降43.1%。AI进展方面，小米于2026年4月公测MiMo-V2.5系列大模型，其中MiMo-V2.5-Pro在开源大模型综合排名第一，随后开源该系列模型以供商用部署。

开源生态端侧行业动态

16:30

Alibaba Cloud@alibaba_cloud

AI Key Frames - 直击通义千问直播现场。当今大多数"AI智能体"只是多了几步操作的聊天机器人。Nous Research策略主管Tommy Eastman阐述了真正的智能体是什么样子，为何开源持续超越闭源实验室，以及AI作为万物操作层的意义。感受AI原生浪潮。 🚀 敬请关注：https://int.alibabacloud.com/m/1000413447/

智能体大佬观点开源生态

14:29

Alibaba Cloud@alibaba_cloud

AI Key Frames - 您在Qwen Conference 2026的Qwen直播前排席位。解码AI生产力的核心。用全栈AI重塑增长曲线。与行业先驱独家对话，跨越AI新前沿--推理、内容创作与开放AI生态系统。步入AI原生浪潮。 🚀 敬请关注：https://int.alibabacloud.com/m/1000413447/ #AlibabaCloud #AINative #QwenConference2026 #Qwen #LLM

开源生态推理行业动态

14:28

向阳乔木@vista8

网易有道子曰4全模态模型开源，27B参数，TTS支持3秒声音克隆

网易有道发布子曰4，一个27B参数的全模态大语言模型，在视觉数理方向达到同规模SOTA，纯文本数理难题准确率为81.4%。该模型在27B“甜点级”参数规模下，实现了多模态与纯文本数理推理的双重优势。同时，子曰4全模态模型和TTS引擎已同步开源，开放参数权重，支持本地部署与二次训练。其TTS模型只需3秒即可克隆原声，支持14种语言，克隆准确度超97%，音色还原度达95%以上。

多模态开源生态模型发布语音

14:11

IT之家（RSS）

精选76

面壁智能开源 MiniCPM5-1B：在 AA-Index 上超越所有 2B 参数以下模型，能跑在手机、浏览器上

面壁智能开源其新一代端侧大语言模型MiniCPM5-1B。该模型仅1B参数，在AA-Index榜单上超越所有2B参数以下模型，相比3个月前的Qwen3.5-2B效果更优且参数量减半。经INT4量化后权重仅0.5GB，支持在手机和浏览器上运行。其Base Model版本由面壁智能自主研发的AI训练框架ForgeTrain预训练完成，现已全面开源模型权重、训练数据集与部署方案。

开源生态模型发布端侧

推荐理由：1B参数干翻所有2B以下模型，量化后0.5GB就能塞进手机和浏览器，这个效率把端侧模型的门槛又压低了，做移动端AI的值得跟进。

13:11

IT之家（RSS）

同事件精选77

谷歌 AI 框架 AlphaProof Nexus 攻克 2 道悬置 56 年数学难题

智能体 DeepMind 开源生态推理

同一事件，精选展示《AlphaProof Nexus：用形式化验证驱动AI数学证明搜索》

推荐理由：AlphaProof Nexus 不是刷榜，是真解了 Erdős 难题，56 年悬而未决的那两道——这说明 AI 开始从具身数学题爬向纯数学研究了，做理论的人该认真看一眼。

12:29

Alibaba Cloud@alibaba_cloud

在 #QwenConference2026 上，新加坡总理公署高级部长、全国职工总会副秘书长Desmond Tan强调了科技生态系统的价值：🧵👇

开源生态行业动态

11:35

公众号：面壁智能（MiniCPM）

面壁智能联合清华大学、OpenBMB发布端侧文本基座模型MiniCPM5-1B

面壁智能联合清华大学、OpenBMB开源社区发布并开源MiniCPM5-1B，一款1B参数的端侧文本基座大模型。其在AA-Index榜单得分17.9分，超越所有2B以下参数模型，包括Qwen3.5-2B（16.3分），验证了智能密度约每3.5个月翻一番的密度定律。INT4量化后权重仅0.5GB，可运行于手机、浏览器等终端。Base Model由AI训练框架ForgeTrain（全球首个完全由AI编写，训练速度比Megatron快10%）在华为昇腾上预训练完成。模型全面开源权重、训练数据集Ultra-FineWeb-L3及部署方案，支持Llama_factory、SGLang、vLLM等主流框架。

Hugging Face 开源生态推理模型发布

10:59

Tencent Hy@TencentHunyuan

腾讯混元新翻译模型双榜亮眼，小程序发布

腾讯混元发布翻译模型 Hy-MT2，在 Hugging Face 开源模型趋势排行榜上表现突出：1.8B 版本排名第一，30B-A3B（MoE）版本排名第四，下载量已超 7K。官方同步推出了基于该模型的“腾讯混译”微信小程序，支持语音输入与离线翻译，并可自定义翻译风格与指令。模型代码与权重已开源。

Hugging Face 开源生态模型发布

关联讨论 2 条

09:11

IT之家（RSS）

托瓦兹再发飙：AI 干扰 Linux 内核节奏，撑大 RC5 体量

大佬观点开源生态编码