6月10日

07:27

Nathan Lambert：Interconnects（RSS）

同事件精选63

Claude Fable 5 与新的 AI 安全寓言

前沿 AI 系统的权力政治又向前迈进了一步。Claude Fable 5 及新 AI 安全寓言标志着这一进展。

Anthropic 大佬观点安全/对齐开源生态

同一事件，精选展示《Claude Fable 5 和 Claude Mythos 5》

推荐理由：Anthropic 在 Fable 5 上悄悄加了不告知用户的安全限制，对模型开发请求做手脚却不降级通知，这种做法让人很难信任这个「最聪明模型」，也意外给美国开源社区打了一针强心剂。

04:55

Hugging Face：Blog（RSS）

精选73

Cohere发布North Mini Code：面向开发者的开源编码模型

Cohere发布North Mini Code，一款30B参数MoE模型（3B活跃参数），Apache 2.0开源。在Artificial Analysis Coding Index上得分33.4，超越Qwen3.5、Gemma 4等同类模型。后训练采用两阶段SFT和RLVR，在SWE-Bench Verified上pass@10达80.2%，Terminal-Bench v2上达55.1%。支持64K/128K上下文长度，专为智能体编码任务优化。

智能体开源生态模型发布编码

推荐理由：Cohere的新编码模型North Mini Code以30B参数MoE架构，在SWE-bench pass@1达到61%，Apache 2.0开源，是小模型在agent coding领域真正可用的信号。

6月9日

11:40

公众号：小米 MiMo

精选80

小米 MiMo 与 TileRT 联合发布 UltraSpeed 模式，1T 模型输出突破 1000 tokens/s

小米 MiMo 与 TileRT 联合发布 MiMo-V2.5-Pro-UltraSpeed 模式，使 1T 参数旗舰模型输出速度首次突破 1000 tokens/s。模型侧采用 FP4 混合量化（仅量化 MoE Expert）与 DFlash 块级 masked 并行推测解码（coding 场景平均接受长度 6.30 tokens）；系统侧 TileRT 引入常驻内核引擎与异构流水线协作。API 限时开放（2026 年 6 月 9 日至 23 日），定价为 MiMo-V2.5-Pro 的 3 倍，速度提升约 10 倍。FP4 权重与 DFlash 模型 checkpoint 已开源至 HuggingFace。

开源生态推理模型发布部署/工程

关联讨论 3 条

推荐理由：万亿模型首次在通用GPU上突破1000 tokens/s，不是专用硬件的胜利而是模型与系统Codesign的胜利，做实时AI应用的都应该盯紧这一套方案。

00:41

Tomer Tunguz 博客（VC 分析）

精选56

AI 替代浪潮：三大力量重塑成本结构

三大力量重塑 AI 成本：前沿闭源模型持续涨价，开源模型在多数场景已足够好，买家开始替代。Coinbase 将提示词路由至更便宜模型，成本持平但 token 用量指数增长。Lindy 全切至 DeepSeek v4，节省数百万美元且多项核心性能提升。Harvey 在 Legal Agent Benchmark 上通过 SFT 使 Kimi 2.6 all-pass 率达 15%，超越 Opus 的 14%，同一 100 任务成本 $84 vs $954（约 11 倍价差）。Cursor 后训练 Kimi K2.5 得到 Composer 2.5，称其“性能优异且效率高达同类模型 10 倍”。闭源越来越贵，开源平价且性能接近，选择决定企业单位经济学的斜率。

Anthropic DeepSeek 开源生态推理

推荐理由：Tunguz 用 Coinbase、Lindy 等真实案例，把「用开源/便宜模型替代昂贵前沿模型」的趋势讲透了，做 AI 应用的人该重新算一下单位经济账。

6月8日

22:02

公众号：月之暗面（Kimi）

同事件精选76

Kimi Code 焕新升级（附视频教程）

Kimi Code 开源 Coding Agent 迎来大版本升级：一行命令安装，毫秒级启动；新增视频理解能力，支持提取视频风格生成 LUT 文件、长视频切片、根据录屏生成代码；集成同花顺、天眼查等权威数据源，可查询股票价格、财报、学术论文；支持 ACP 协议，可在 JetBrains、Zed 中使用；丰富 hook 生态方便集成其他工具。底层视觉推理由 Kimi K2.6 模型提供。

智能体产品更新开源生态编码

同一事件，精选展示《Kimi Code 焕新升级（附视频教程）》

推荐理由：Kimi Code 这次更新把安装和视频处理的门槛压到了最低，一行命令加拖拽视频就能用，开源 Agent 的体验终于开始反超商业版本。

21:50

Hugging Face：Blog（RSS）

精选62

开源社区支持 OpenEnv 用于智能体强化学习

今日，Hugging Face 宣布 OpenEnv 项目进一步开放，由 Meta-PyTorch、Reflection、Unsloth 等组成的委员会协调，并获得 PyTorch Foundation、vLLM、SkyRL（UCB）等机构支持。OpenEnv 是创建终端、浏览器等智能体执行环境的工具，定位为训练器与环境间的互操作层，标准化环境的发布、部署和消费，但不定义奖励或训练循环。它基于客户端/服务器架构提供 Gymnasium 风格 API（reset()、step()、state()），支持 HTTP、WebSocket、Docker 打包，并将 MCP 作为一等公民，使环境在模拟和生产模式下行为一致。未来将聚焦任务集对接数据集、外部奖励、Harness 集成及自动验证，以推动开源智能体 RL 基础建设。

智能体 Hugging Face MCP/工具 Meta

推荐理由：开源社区在 agent RL 环境上终于开始合流，Meta、Nvidia、Hugging Face 等联合推动 OpenEnv 成为接口标准，不做奖励框架，只做插线板。搞开源 agent 训练的人，这是少有的统一基础设施的机会。

21:43

公众号：月之暗面（Kimi）

精选62

Kimi Code 焕新升级（附视频教程）

Kimi Code 开源 Coding Agent 大版本升级：一行命令安装，毫秒级启动；新增视频理解，可提取参考视频色调生成 LUT、将长视频切分为短视频、根据录屏生成代码；接入同花顺、天眼查等权威数据源，支持实时查询股票价格、财报和学术论文；兼容 ACP 协议，可在 JetBrains、Zed 等 IDE 使用；拓展 hook 生态方便集成。视频理解基于 Kimi K2.6 模型。通过 /plugins 安装 kimi-datasource 插件即可使用权威数据源。

智能体产品更新开源生态编码

推荐理由：Kimi Code 这次把视频理解功能做进了编码工作流，一行安装和 ACP 协议接入让上手成本几乎为零，做视频剪辑和自动化开发的同好值得一试。

10:59

LMSYS：Blog（Chatbot Arena 团队）

LMSYS 2026 年博士奖学金首位获得者：Will Lin

LMSYS 宣布 2026 年博士奖学金首位得主 Will Lin。他是加州大学圣地亚哥 Hao AI 实验室六年级博士生，领导开源框架 FastVideo（GitHub 3.7k+ 星标），已被 NVIDIA Dynamo 集成，其模块化流水线影响 SGLang 等多模态生成设计。奖学金最高 5 万美元。他的研究覆盖生成式视频与世界模型全栈，包括稀疏注意力、量化、蒸馏、后训练、实时推理，共同主导首个交互延迟 1080p 文图到音视频生成流水线，近期包括自回归世界模型训练。他曾于 Anyscale 实习，现于 NVIDIA 实习推动产业合作。

开源生态行业动态

6月5日

19:22

公众号：腾讯混元

精选62

腾讯混元提出Stem稀疏注意力算法，被ICML 2026收录

Stem算法通过Token位置衰减（TPD）和输出感知度量（OAM）两项创新，仅用25%算力即逼近稠密注意力精度。配套HPC算子针对Hopper架构优化，支持FP8量化与vLLM的Paged KV Cache，在混元Hy3 preview上实现首字延迟降低3.6倍。HPC-BSA相比MIT-BSA稳定保持约3倍加速，在8K至256K序列长度上表现一致。

开源生态推理论文/研究部署/工程

推荐理由：把稀疏注意力从一刀切升级成按信息流分配预算，算子在Hopper上把理论加速几乎无损转化，3.6倍首字延迟下降不是灌水——做长上下文应用的值得照着开源代码试。

00:00

GitHub Blog

GitHub Universe 回归：齐聚智能体时代

GitHub Universe 2026 将于 10 月 28–29 日重返旧金山 Fort Mason Center，主题聚焦智能体（agentic）时代。

GitHub 开源生态行业动态

00:00

LMSYS：Blog（Chatbot Arena 团队）

精选62

不再遗漏任何Token：解析Miles中的Token-In-Token-Out（TITO）

Miles框架提出Token-In-Token-Out（TITO）原则，解决智能体强化学习中训练-推理不匹配：确保rollout过程token序列与训练器评估序列逐位一致。TITO将多轮轨迹视为一个连续序列（每任务一个样本），节省一个数量级计算开销并维持on-policy性。三种破坏场景：反分词-再分词不匹配、聊天模板修剪推理内容、有损模板重新渲染。Miles通过推理会话服务器、三级只追加保证、可插拔TITO分词器和序列比较器实现。典型任务（如SWE-Bench）轨迹含30-50轮。

开源生态数据/训练论文/研究

推荐理由：LMSYS团队把agent RL里最隐秘的训练-推理不一致问题解释透了，TITO原则直接告诉你为什么之前训练不稳，做agent训练的都该看看这篇。

6月4日

20:52

LMSYS：Blog（Chatbot Arena 团队）

SGLang 和 Miles 即日支持 NVIDIA Nemotron 3 Ultra

SGLang 与 Miles 在发布首日即支持 NVIDIA Nemotron 3 Ultra。该模型为开放前沿推理模型，总参数 550B、激活参数 55B，采用混合 Transformer-Mamba 架构的 MoE，支持最长 1M token 上下文。针对长运行自主智能体优化，具备工具调用、编码、深度研究与编排能力，后训练使用多环境强化学习（NeMo RL）。SGLang 提供高性能推理，支持 NVFP4 和 BF16 精度，NVFP4 检查点可在 Blackwell GPU 运行；Miles 支持强化学习工作流。模型权重、数据与配方均开源。在智能体生产力、指令遵循与长上下文任务上准确率领先，成本节省高达 30%。

智能体开源生态推理模型发布

关联讨论 9 条

02:49

Google Research：Blog（网页）

精选72

洪水韧性新篇章：Google 开源水文建模框架

Google Research 在 GitHub 开源了其水文建模框架，这是一个基于 PyTorch 的 Python 包，采用与 Flood Hub 河段洪水预报相同的模型架构和训练数据。该框架允许研究者和预报员训练 AI 洪水预报模型、添加新模型与数据，并已与捷克水文气象研究所（CHMI）等合作测试。开放模型架构和训练管线旨在让各国气象水文部门在保留数据完全控制权的同时，整合基于 AI 的洪水预报。

Google 开源/仓库开源生态数据/训练

推荐理由：谷歌开源的水文模型框架，是少数真正能救命的AI应用。不是秀参数，而是把工具直接塞给一线预报员，让他们用本地数据训练。务实，值得给赞。

6月3日

20:00

公众号：昆仑万维（天工）

昆仑万维方汉：智力与能源是中国AI底层逻辑，香港可做数据合规沙盒与学术桥梁

近日，昆仑万维董事长兼CEO方汉在2026年香港科创主题研讨会上指出，中国AI的底层逻辑是智力与能源，中国具备明显优势，全球最好的开源大模型DeepSeek已能在多个垂直领域与美国产品竞争。公司2026年第一季度营收25.70亿元，同比增长45.69%；海外收入24.87亿元，同比增长49.29%；短剧及AI短剧平台月流水超4800万美元，ARR超5.7亿美元。方汉认为香港可扮演数据合规“沙盒”与学术交流桥梁角色，并呼吁长期资本重视AI应用层，称生成式AI将内容制作成本压低至几万分之一，传统渠道将被重做，订阅制将被免费模式取代。

大佬观点开源生态

15:47

公众号：面壁智能（MiniCPM）

AI构筑"新丝路"，面壁智能以端侧AI赋能"一带一路"数字合作

面壁智能CEO李大海近日在中吉媒体合作论坛上指出，中亚可成为数字丝绸之路智能枢纽，需提供低成本、可落地、可信赖的AI能力。公司自研MiniCPM系列大模型累计下载突破3000万次，已在汽车、智能手机等领域落地。面壁智能曾参与老挝国家大模型建设，打造的老挝语翻译模型在专业评测中超越GPT-4o，并训练融入本土文化的大模型，设计低成本多模型联合推理方案。李大海提出AI应成为普惠基础设施，合作需从概念转向实体落地。面壁智能已跑通“主权大模型”全链路技术路径，形成可全球复用的智能底座。

大佬观点开源生态端侧

00:37

Tomer Tunguz 博客（VC 分析）

精选61

开放模型的繁荣生态

根据OpenRouter平台数据，自2025年以来，开放模型使用量显著增长。最新数据显示，开放权重模型产生了69.1%的token使用量，闭源模型为30.9%。新模型的发布会吸引开发者测试，推动token使用量达到新的平台期。开放模型市场内部竞争激烈，领导地位频繁更迭，如DeepSeek的早期优势在2025年末至2026年初被MiniMax与Kimi模型取代，随后MiMo、Qwen、腾讯Hy3、阿里巴巴及Arcee等模型的发布再次改变了份额格局。尽管开放模型目前仍只占推理总量的一小部分，但激烈的竞争与增长表明，开发者正越来越愿意将生产流量路由至开放模型。

开源生态现象/趋势

推荐理由：开放模型在OpenRouter上的token份额已到69%，而且每轮新模型发布都会把使用量推上一个台阶，做推理基础设施的应该重视这个信号。

6月2日

23:08

Nathan Lambert：Interconnects（RSS）

告别 Ai2

Nathan Lambert 离开 Allen Institute for AI (Ai2)，回顾了他在该机构最后一周的工作，特别是参与 Olmo 模型的开发，并强调了个人成长和产生广泛持久影响的机会。

大佬观点开源生态

19:34

蚂蚁 inclusionAI：HuggingFace 新模型

同事件精选61

蚂蚁 inclusionAI 开源万亿参数 MoE 基座模型 Ling-2.6-1T-base

Ling-2.6-1T-base 是蚂蚁 inclusionAI 开源的万亿参数 MoE 基座模型（总参约 1T，激活 63B）。它由 Ling-2.0-1T-base 升级而来，采用 Lightning Attention 与 MLA 以 7:1 混合的线性注意力架构，经约 9.6T token 的迁移预训练、持续预训练和中训练，上下文窗口从 4K 分阶段扩展至 256K。在 MMLU（86.82）、SimpleQA、LongBenchv2（43.54）等基准上超越前代。该模型仅供研究（继续预训练、微调、蒸馏等），不直接提供对话功能。

Hugging Face 开源生态推理模型发布

同一事件，精选展示《蚂蚁 inclusionAI 推出万亿参数推理模型 Ring-2.6-1T》

推荐理由：Ling-2.6 用混合线性注意力把万亿 MoE 基座模型的上下文能力推到了 256K，对于研究长上下文和 MoE 的团队是个有价值的基座，但它是未对齐的预训练模型，不能直接当对话助手用。

18:00

公众号：百度智能云（文心）

北京人形机器人创新中心联合百度智能云发起具身智能黑客松大赛

北京人形机器人创新中心与百度智能云发起具身智能黑客松大赛，设运动控制与VLA模型微调双赛道，面向全球征集真机可部署方案。提供百万奖金、天工3.0本体及世界人形机器人运动会直通名额。天工Ultra曾夺半马冠军（2:40:42）及百米冠军（21.50秒）。

具身智能开源生态行业动态

6月1日

13:24

Runway：News（网页）

精选55

介绍Cosmos Coalition

Runway宣布作为创始成员加入Cosmos Coalition，该联盟与NVIDIA及多家领先AI实验室合作，旨在构建并开源面向物理AI的前沿世界模型。首个项目将由Runway与NVIDIA共同开发一个基础模型，以推动下一代开放世界模型的研究与发展。

开源生态行业动态

关联讨论 1 条

推荐理由：Runway 和 NVIDIA 等联手成立 Cosmos Coalition，要开源世界模型，这份声明是视频生成和物理 AI 走向基础设施化的信号，但眼下没有可用的模型或代码，更像一份生态宣言。

5月29日

08:02

公众号：阶跃星辰（Step）

同事件精选61

阶跃发布 Step 3.7 Flash，面向生产级 Agent 的高效率 Flash 模型

阶跃星辰发布并开源 Step 3.7 Flash，采用稀疏 MoE 架构（总参数 196B+1.8B，激活 11B），最高生成速度 400 Tokens/s。围绕原生多模态理解与执行、联网与视觉搜索增强、高可靠工具调用与编排、Agent 生态兼容优化四大能力优化。在 Toolathlon 达 49.5%，ClawEval-1.1 达 67.1%，GDPval 达 45.8%，τ²-bench Telecom 通过率超 98%。兼容 Claude Code、KiloCode 等主流架构及 MCP/Skills 协议，支持云端与本地部署，已在 Kilo Code 等生态中完成接入验证。

智能体 MCP/工具多模态开源生态

同一事件，精选展示《在 NVIDIA GPU 上运行面向企业级就绪的多模态 AI--Step 3.7 Flash》

推荐理由：Step 3.7 Flash 用激活仅 11B 的 MoE 架构把 Agent 工作流稳定性做透了，兼容主流框架还开源，对需要低延迟、高可靠性的生产环境 Agent 是真正可用的选择。

5月28日

23:41

Google Developers Blog（RSS）

精选64

社区如何利用Tunix和TPU训练Gemma学会"思考"

Google在Kaggle举办的Tunix黑客马拉松，挑战开发者利用TPU和有限算力，将小型基础模型转变为通用推理引擎。获胜团队通过多阶段后训练流程实现了这一目标，该流程结合了监督微调（SFT）与GRPO、SimPO等先进对齐技术。比赛结果表明，社区能够借助开源资源成功训练出高能力的结构化推理模型。

Google 开源生态教程/实践数据/训练

推荐理由：Google 官方比赛总结，证明用 Kaggle TPU 和开源工具就能把 Gemma 训练出不错推理能力，对想自己微调模型的小团队是个实用参考。

22:04

公众号：小米 MiMo

Xiaomi MiMo Orbit 首批 Agent 生态共建合作伙伴公布

智能体开源生态行业动态

5月27日

19:50

公众号：面壁智能（MiniCPM）

面壁智能发布 MiniCPM5-1B 端侧基座模型，FlagOS 完成云到端跨芯片 Day-0 适配

5月25日，面壁智能发布并开源端侧基座模型MiniCPM5-1B。该模型以1B参数在AA-Index获17.9分，超越所有4B以下开源基座模型。INT4量化后权重仅0.5GB，可在90%以上终端运行。FlagOS社区通过vLLM-plugin-FL推理插件完成跨芯片适配，覆盖英伟达、华为昇腾等8类AI芯片及ARM端侧，支持int8、bf16、fp32精度。多款芯片首token延迟低于NVIDIA H20原生基线；平头哥真武810E在长序列场景下单位算力token吞吐量达H20的93.3%和95.3%。

开源生态教程/实践端侧

5月26日

23:49

Nathan Lambert：Interconnects（RSS）

精选67

未来展望：2026年5月的一些想法

文章展望了截至2026年5月AI领域的动态。内容涉及 Gemini Flash 3.5 的发布、名为 Mythos 的新产品或项目、开源与闭源生态平衡（open-closed balance）的讨论、美国开源力量的显著增长（America's open-source surge），以及由此引发的新兴权力博弈（emerging power struggles）。

Anthropic Google 大佬观点开源生态

推荐理由：Nathan Lambert 对开源模型追赶闭源的周期判断、Gemini 在编码代理领域的缺位分析，以及美国开源模型崛起的观察，为理解当前鼎立格局提供了扎实的坐标，值得从业者细读。

11:35

公众号：面壁智能（MiniCPM）

面壁智能联合清华大学、OpenBMB发布端侧文本基座模型MiniCPM5-1B

面壁智能联合清华大学、OpenBMB开源社区发布并开源MiniCPM5-1B，一款1B参数的端侧文本基座大模型。其在AA-Index榜单得分17.9分，超越所有2B以下参数模型，包括Qwen3.5-2B（16.3分），验证了智能密度约每3.5个月翻一番的密度定律。INT4量化后权重仅0.5GB，可运行于手机、浏览器等终端。Base Model由AI训练框架ForgeTrain（全球首个完全由AI编写，训练速度比Megatron快10%）在华为昇腾上预训练完成。模型全面开源权重、训练数据集Ultra-FineWeb-L3及部署方案，支持Llama_factory、SGLang、vLLM等主流框架。

Hugging Face 开源生态推理模型发布

5月23日

03:57

Anthropic：Research（发表成果 · 网页）

Project Glasswing项目阶段性进展

上月启动的Project Glasswing项目旨在利用AI能力保护关键软件安全。在约50家合作伙伴参与下，通过使用Claude Mythos Preview模型，已在全球最重要的系统软件中发现超过一万个高危或严重漏洞。Cloudflare等合作伙伴报告其漏洞发现效率提升超十倍，其中仅Cloudflare就在关键系统中发现了2000个漏洞。该模型在多个独立安全测试中表现突出，被评测为网络攻击模拟领域的首个全通关模型。当前的挑战已从快速发现漏洞，转向了如何快速验证、披露和修补海量漏洞。

智能体 Anthropic 安全/对齐开源生态

关联讨论 5 条

03:57

Anthropic：Newsroom（网页）

精选90

Project Glasswing：初步更新

上月启动的Project Glasswing项目，旨在利用先进AI模型保障关键软件安全。通过约50家合作伙伴使用Claude Mythos Preview模型，已在全球关键系统中发现超过10,000个高危或严重漏洞。多家合作伙伴报告漏洞发现效率提升超过十倍。例如，Cloudflare在关键路径系统发现2,000个漏洞；Mozilla在Firefox 150中发现并修复271个漏洞，数量远超前代模型。项目还扫描了千余个支撑互联网的开源项目，独立验证准确率达90.6%。这标志着AI网络安全能力进入新阶段，漏洞发现速度已远超人工。

Anthropic 安全/对齐开源生态

关联讨论 5 条

推荐理由：Mythos Preview用一个月找到的漏洞比过去一年还多，网络安全从「发现难」变成「修不过来」，这个转折点所有安全从业者都得读。

5月21日

17:26

公众号：面壁智能（MiniCPM）

面壁智能 x OpenBMB 端侧大模型开源周，即将来袭！

开源生态端侧行业动态

16:43

公众号：腾讯混元

腾讯混元全新翻译模型Hy-MT2开源，小程序「腾讯Hy翻译」开放体验

开源生态模型发布

5月20日

04:41

xAI：News（网页）

精选60

在OpenClaw中使用Grok

5月22日，xAI宣布，其用户现可在开源个人助理OpenClaw中直接使用Grok模型。所有持有SuperGrok或X Premium订阅的用户均可使用该功能。OpenClaw是一个开源的、本地优先的智能助手，可在多种硬件上运行并保持跨会话记忆，同时能接入WhatsApp、Telegram等多款主流通讯平台。用户通过简单安装和登录，即可在自有设备上运行OpenClaw，并通过其界面或关联的聊天工具与Grok交互。此举进一步扩展了Grok的应用场景，未来还将推出更多开源代理与集成支持。

智能体产品更新开源生态

推荐理由：Grok 开始融入开源 agent 生态了，OpenClaw 的本地优先加多平台连接让这集成对开发者挺实用，有 Grok 订阅的可以直接试试。

5月17日

01:32

Nathan Lambert：Interconnects（RSS）

本月开源AI模型领域迎来密集发布，包括Gemma 4、DeepSeek V4、Kimi K2.6、MiMo 2.5和GLM-5.1等一系列重要新版本。这些模型均在CAISI的V4评估框架下进行了性能评测。多个团队几乎同期推出旗舰级更新，反映出开源社区当前高速迭代的竞争态势。

DeepSeek Google 大佬观点开源生态

5月16日

05:02

xAI：News（网页）

精选70

将Grok接入Hermes智能体

xAI宣布，用户现可将Grok订阅账户接入Nous Research的开源自改进智能体Hermes Agent。该集成对所有订阅层级开放，允许用户在Hermes环境中直接使用Grok 4.3进行文本对话与高级推理、调用其文本转语音功能生成语音回复，并利用Grok Imagine创建图像与视频。Hermes Agent可持久运行于电脑、沙盒或VPS，具备跨会话长期记忆能力，并能连接WhatsApp、Discord等通讯平台。用户通过安装Hermes Agent并选择Grok提供商即可完成配置。

智能体 xAI 产品更新开源生态

推荐理由：如果你已经在用或想尝试Nous Research的Hermes Agent，现在可以直接用Grok订阅，不必再多付一份模型API钱，而且Grok 4.3的推理和图像生成都能在agent里跑，对个人开发者挺友好。

5月15日

09:00

公众号：蚂蚁百灵（Ling）

Ring-2.6-1T 正式开源：为真实复杂任务打造的万亿级思考模型

Ring-2.6-1T 正式开源，这是为真实复杂任务打造的万亿级思考模型，Agent 执行能力全面增强，采用双档推理配置，兼顾效率、成本与能力上限。

开源生态推理模型发布

03:45

Hugging Face：Blog（RSS）

精选60

IBM 发布 Granite Embedding Multilingual R2 开源多语言嵌入模型

IBM 发布两个 Apache 2.0 开源多语言嵌入模型：97M 参数的紧凑型（granite-embedding-97m-multilingual-r2）在 MTEB Multilingual Retrieval 上得 60.3 分，超越所有开放子 1 亿参数模型；311M 全尺寸模型（granite-embedding-311m-multilingual-r2）得 65.2 分，在 500M 以下开放模型中排第二，并支持 Matryoshka 维度。两者均基于 ModernBERT 架构，支持 200+ 种语言，针对 52 种语言和 9 种编程代码检索训练，上下文窗口达 32,768 tokens。可直接替换 sentence-transformers、LangChain、LlamaIndex 等框架中的默认模型，预置 ONNX 和 OpenVINO 权重以优化 CPU 推理。

检索增强开源生态搜索模型发布

推荐理由：97M小模型在跨语言检索上打败很多300M级选手，32K上下文让长文档处理不再鸡肋，Apache 2.0开源意味着做多语言RAG的可以直接拿来当默认嵌入模型了。

5月13日

16:50

公众号：腾讯混元

腾讯Q1财报：混元迈出重组后第一步，Hy3 preview全球token消耗稳居前列

腾讯混元在重组后推出Hy3 preview模型，该模型全球token消耗量位居前列。结束限免期后，Hy3 preview的日Token用量和周Token调用量仍保持榜首。

开源生态行业动态

00:26

Nathan Lambert：Interconnects（RSS）

精选64

开放模型生态的复合增长

中国AI生态呈现高参与度与开放优先特征，开源模型社区形成自我强化循环。开发者基于主流架构二次创新，国产开源模型下载量季度环比激增超200%。开放协作降低了技术门槛，推动应用层涌现大量行业解决方案，模型微调工具使用量同比大幅增长。生态参与者通过贡献代码、数据及优化方案，持续反哺核心模型迭代，构建了技术红利共享的复合增长网络。

大佬观点开源生态现象/趋势

推荐理由：Nathan Lambert这篇对中国开放模型生态的剖析，点出了‘参与人数×开源速度’的飞轮，做开源的人该认真看看。

5月12日

19:49

公众号：智谱（GLM）

同事件精选63

GLM-5.1获AA全新Coding Agent基准开源第一

全球权威评测机构Artificial Analysis发布全新Coding Agent Index，包含SWE-Bench-Pro-Hard-AA、Terminal-Bench v2和SWE-Atlas-QnA三项基准，用于衡量模型与Agent harness组合的真实编程能力。闭源模型Opus 4.7（在Cursor CLI中运行）全球第一，智谱GLM-5.1（在Claude Code中运行）获开源第一，代表国产大模型在实际编程Agent场景达到SOTA水平。

开源生态编码评测/基准

同一事件，精选展示《GLM-5.1开源：一个独立工作8小时的模型》

推荐理由：GLM-5.1 在 AA 的新 Coding Agent 基准上拿了开源第一，时隔一个月回头看，这个成绩对国产开源模型在编程 Agent 赛道的位置是个重要注脚，做工具链选型的还是值得扫一眼。

07:43

Hugging Face：Blog（RSS）

精选58

在AWS上进行基础模型训练与推理的核心构建模块

本文面向使用开源框架的机器学习工程师，阐述了AWS如何为大规模基础模型的全生命周期提供核心基础设施。其核心是三大紧密集成的组件：配备多代NVIDIA GPU（如H100、H200及新一代Blackwell B200/B300）的大显存加速计算实例；用于集体通信的高带宽、低延迟网络（节点内NVLink与节点间EFA）；以及可扩展的分布式存储。这些基础设施与Slurm/Kubernetes等资源编排系统、PyTorch/JAX等ML框架协同，共同支撑预训练、后训练和推理工作负载，并可通过Prometheus/Grafana实现全栈可观测性。

开源生态教程/实践数据/训练部署/工程

推荐理由：这篇把AWS上训大模型的全套基础设施串了一遍，从GPU选型到网络存储再到Slurm/K8s编排，是做云端大规模训练的工程师的必读参考。

5月10日

02:42

Hugging Face：Blog（RSS）

精选68

OncoAgent：一个用于隐私保护肿瘤临床决策支持的双层多智能体框架

研究团队发布了开源肿瘤临床决策支持系统OncoAgent。该系统采用双层多智能体框架，结合LangGraph拓扑与四阶段Corrective RAG流程，检索超过70份权威临床指南。系统根据查询复杂度，将任务路由至9B参数的速度优化模型或27B参数的深度推理模型，两者均通过QLoRA在AMD MI300X硬件上使用包含26万余病例的数据集进行微调。系统强制执行严格的零受保护健康信息政策，并通过三层反射安全验证器确保安全，支持完全本地部署以保护患者数据主权。

智能体 Hugging Face 检索增强开源生态

推荐理由：这个开源肿瘤AI系统把多智能体、RAG和隐私合规全塞进一台AMD服务器，临床落地又近了一步，不是那种只发论文不交代码的项目。