6月12日

08:00

HuggingFace Daily Papers（社区热门论文）

Nemotron 3 Ultra：开放高效混合专家Mamba-Transformer智能体推理模型

Nemotron 3 Ultra 是一个 550B 总参数、55B 激活参数的混合专家（MoE）Mamba-Attention 语言模型。它在 20T tokens 上预训练，上下文窗口扩展至 1M tokens，后训练采用监督微调（SFT）、强化学习（RL）和多方教师在线蒸馏（MOPD）。关键技术包括 LatentMoE、多 token 预测（MTP）、NVFP4 预训练、多环境 RLVR、MOPD 和推理预算控制。相比公开 SOTA 大语言模型，推理吞吐量提升约 6 倍且准确率持平，适合长时间运行的自主智能体任务。模型开源基础、后训练和量化检查点，以及训练数据和配方。

智能体推理模型发布

07:35

karminski-牙医@karminski3

Google 发布 Diffusion Gemma：26B/4B 激活，5090 达 700+ token/s

Google 推出 Diffusion Gemma，大小 26B、激活参数量 4B，与 NVIDIA 合作针对 RTX 4090/5090 优化，5090 上速度达 700+ token/s。该扩散文本模型以“刮奖式”并行生成而非逐 token 生成，输出质量略逊但优于此前同类模型：AIME 2026（数学）达 Gemma4-26B-A4B 的 94%，tau2 bench（Agent）达 82%。4bit 量化版仅需 16G 显存即可运行。

Google 推理模型发布部署/工程

03:02

Yuchen Jin@Yuchenj_UW

Claude Fable 5 到目前为止感觉不错，但我还不认为它相比 GPT-5.5 或 Opus 4.8 有巨大飞跃。我最大的不满：旧的AI研究论文/博客 + 基本问题常常触发自动降级到 Opus 4.8。 Anthropic 昨晚表示不会再有无声模型切换（很好），但请不要削弱基本的AI研究或生物问题。

Anthropic 大佬观点模型发布

02:32

Artificial Analysis@ArtificialAnlys

Ideogram 4.0 开源权重文生图模型发布

Ideogram 4.0 是 Ideogram 首个开源权重模型，生成 2K×2K 输出，支持多语言文本渲染、边界框布局控制和透明背景。采用结构化 JSON 提示，提示增强器仅限 Ideogram 专有 API。在 Artificial Analysis 开放权重排行榜排名第8，整体第31，领先 Seedream 3.0 等闭源模型。API 三档：Turbo $30/千张、Default $60/千张、Quality $100/千张。开源权重免费用于评估和非商业用途，商业自部署需单独许可。

图像生成开源生态模型发布

01:20

Logan Kilpatrick@OfficialLoganK

同事件精选81

Gemini Omni Flash 在图像到视频、文本到视频和视频编辑方面达到了 SATA ：）很高兴很快能将这一能力通过 API 提供给开发者！

Google 图像生成多模态模型发布

同一事件，精选展示《Gemini 3.5：具备行动能力的前沿智能》

推荐理由：视频生成正式进入全模态一体时代，Gemini Omni Flash 把图生视频、文生视频和剪辑整合在一个模型里，API 很快上线，做视频工具的可以提前琢磨对手在哪了。

01:17

Hacker News 热门（buzzing.cc 中文翻译）

精选72

DeepSeek-R1 的开源实现

DeepSeek-R1 的开源复现项目已在 GitHub 发布，在 Hacker News 上获得 101 个积分。该项目旨在以开源方式复现 DeepSeek-R1 模型。

Hugging Face 开源/仓库推理模型发布

推荐理由：Hugging Face 把 DeepSeek-R1 的完整训练管线拆解得清清楚楚，从数据蒸馏到 GRPO 强化学习都开源了，还放出了复现的模型和数据集。想理解或自己训练推理模型的开发者，这大概是目前最实用的路线图。

6月11日

21:08

MiniMax (official)@MiniMax_AI

我们高性能MSA内核库现已开源。M3权重预计本周五发布。感谢等待！ Github： https://github.com/MiniMax-AI/MSA Paper：https://github.com/MiniMax-AI/MSA/blob/main/docs/MiniMaxSparseAttention.pdf 主推文：权重周五发布🫶

RyanLee: Hey everyone - our high-performance MSA kernel library is now open-source. The M3 weights are expected to drop this Frid...

开源/仓库模型发布

16:54

MarkTechPost（RSS）

Cohere 发布 North Mini Code：30B 参数 MoE 编码模型，3B 活跃参数，单卡 H100 运行，支持 256K 上下文

Cohere 推出首款开发者编码模型 North Mini Code，采用 30B 总参数的混合专家（MoE）架构，每次推理仅激活 3B 参数，可在单块 H100 GPU 上运行，支持 256K token 上下文窗口，专为智能体编码场景设计，模型权重开源。

模型发布编码

12:18

Midjourney@midjourney

我们已将 V8.1 设为 Midjourney 所有用户的新默认模型。V8 将在两周后弃用。V8.2 即将开始测试。

Midjourney: V8.1 is live! Our iconic aesthetics are back w native 2K HD rendering - 3x faster and 3x cheaper vs V8. Full quality V8....

图像生成模型发布

关联讨论 2 条

12:10

Midjourney：Updates（RSS）

精选64

Midjourney V8.1 已成为默认模型

Midjourney 已将默认模型从 V7 升级为 V8.1。V8.1 在智能性、连贯性、对详细提示的遵循度以及文本渲染效果上均有提升，HD 模式也已支持。

图像生成模型发布

关联讨论 2 条

推荐理由：虽然V8.1不是大版本，但设为默认后所有用户自动升级，尤其是文本和复杂提示词的理解增强，做设计的朋友值得重新测试一下关键词。

10:51

小互@xiaohu

Google 开源扩散架构模型 DiffusionGemma

Google 开源 DiffusionGemma，基于扩散架构，一次性生成大段文本再逐步优化。H100 上达 1000+ tokens/s，RTX 5090 上 700+ tokens/s。26B 参数仅需 18GB 显存，一次生成 256 tokens。多轮迭代自我纠错，可修改已生成内容。

Google 开源/仓库推理模型发布