AIHOT

4月28日

23:51

Ant Ling@AntLingAGI

精选62

AntLingAGI与SGLang团队合作，正式推出Ling-2.6-flash（亦称Elephant-alpha）即时指令模型，并在SGLang平台上实现了首发支持。该模型总参数量达104B，但活跃参数仅7.4B，专为低延迟的智能体工作流优化，能够实现即时响应。它在编码、文档处理和智能体任务中展现出极高的token效率，所用token数量显著减少。尽管活跃参数较少，其模型质量仍与当前SOTA水平相当，兼具速度与执行力，适合需要快速响应的生产级智能体应用。团队强调，快速且稳定的推理是提升用户体验的关键。

智能体模型发布部署/工程

推荐理由：104B 总参但只激活 7.4B，蚂蚁这步棋是冲着 Agent 场景的低延迟去的，做 Agent 产品的人值得跑一下看看实际体感。

23:19

Ant Ling@AntLingAGI

灵码2.6-flash模型正式开源，专为高效智能体工作流打造

灵码2.6-flash模型现已开源，这是一个专为现实世界智能体工作流构建的快速、高效的指令模型。该模型总参数量达1040亿，激活参数量为74亿，并提供BF16、FP8和INT4多种量化版本以适应不同部署需求。其核心优势包括：生成速度高达每秒215个token，在完整评估中仅消耗1500万token，效率突出；在代码、文档处理和轻量级智能体工作流等实际任务中表现强劲；同时，其中英文切换能力及与主流编程框架的兼容性也得到了进一步改善。

智能体开源/仓库模型发布编码

23:15

OpenRouter@OpenRouter

精选64

@poolsideai 的首批公开基础模型刚刚在 OpenRouter 上发布！ Laguna M.1 和 Laguna XS.2。专为智能体编码和长周期工作从头构建。限时免费 ⬇️

智能体模型发布编码

推荐理由：Poolside 终于把自家模型放出来了，主打长上下文 agentic coding，免费期是薅羊毛窗口。做 coding agent 的团队值得拿 Laguna 跑一轮自己的 benchmark，看看和 Claude、Codex 的真实差距。

20:36

Chubby♨️@kimmonismus

Microsoft 推出 "TRELLIS.2"：一个开源的、40亿参数的图像转3D模型，可生成高达15363的PBR纹理资产。基于原生3D VAES，具有16倍空间压缩能力，提供高效、可扩展、高保真的资产生成。说实话，相当酷！

Microsoft多模态开源生态模型发布

20:25

SenseTime@SenseTime_AI

SenseNova U1 Lite系列开源，统一多模态理解与生成

SenseNova宣布开源其U1 Lite系列模型。该系列基于NEO-unify架构，原生统一了多模态理解与生成能力。其核心优势包括：在开源模型中具备领先的效率，紧凑的8B和A3B模型在保持商业级性能的同时实现了优异的成本效益；支持原生的图像-文本交织生成，单一模型即可在单次流程中生成连贯交织的图文内容，适用于制作指南等实用场景；并拥有高密度信息渲染能力，擅长为知识图解、海报、PPT、漫画等信息密集型格式生成结构丰富的版式。模型已在Hugging Face、GitHub等平台发布。

图像生成多模态开源/仓库模型发布

18:36

Berryxia.AI@berryxia

商汤开源多模态大模型SenseNova-U1，推动本地化部署

商汤发布开源可商用的多模态大模型SenseNova-U1，采用NEO-Unify架构统一处理视觉与语言。其核心功能包括图文交错生成、智能图像编辑与图表渲染。模型提供8B密集版和约3B活性参数的轻量版，适合个人显卡本地部署。现提供每日5小时及1500次免费调用额度，并即将推出办公场景应用功能。

图像生成多模态开源生态模型发布

17:51

蚂蚁 inclusionAI：HuggingFace 新模型

inclusionAI发布Ling-2.6-flash-int4模型

inclusionAI团队宣布推出Ling-2.6-flash-int4模型，作为其通过开源与开放科学推动人工智能技术进步与普及的重要举措。该版本延续了团队降低AI应用门槛、促进技术民主化的核心使命，以轻量化技术方案进一步优化模型性能与部署效率。

开源/仓库模型发布端侧

13:33

Alibaba Cloud@alibaba_cloud

Qwen3.6全系列模型已在NetMind平台上线，专为不同生产场景的智能体应用设计。该系列包含三个模型：Qwen3.6-Plus专注于前沿推理和长上下文，适用于复杂编码任务；Qwen3.6-Flash强调速度、规模和成本效益，适合大规模实时编码辅助；Qwen3.6-35B-A3B提供开源权重和Apache 2.0许可，支持自主托管和微调。所有模型共享高效的混合架构，具备函数调用和推理能力，并运行在NetMind的低延迟基础设施上，提供统一的OpenAI兼容端点。平台还提供即用代码，便于开发者快速集成和使用。

智能体模型发布编码

11:50

蚂蚁 inclusionAI：HuggingFace 新模型

inclusionAI/Ling-2.6-flash-fp8

inclusionAI 团队发布了 Ling-2.6-flash-fp8 模型，致力于通过开源与开放科学推动人工智能的发展与普及。该版本采用 FP8 精度优化，显著提升了推理效率并降低了计算资源消耗，是其在推进技术民主化进程中的最新实践。

开源/仓库模型发布端侧

11:27

蚂蚁 inclusionAI：HuggingFace 新模型

精选55

inclusionAI/Ling-2.6-flash

inclusionAI发布了Ling-2.6-flash模型。该模型是其开源语言模型系列的最新成员，旨在通过开源与开放科学推动人工智能的进步与民主化。此次发布延续了团队降低AI技术使用门槛、促进更广泛社区参与开发的使命。

开源/仓库模型发布端侧

推荐理由：蚂蚁 inclusionAI 的 Ling-2.6-flash 上线 HuggingFace，名字带 flash 大概率是轻量推理模型，但官方描述几乎空白，没有 benchmark 也没有用例，建议等社区实测再决定是否投入精力。

10:47

Simon Willison 博客

介绍 talkie：一个源自1930年的130亿参数复古语言模型

Nick Levine、David Duvenaud 和 Alec Radford 发布了 talkie，这是一个基于1931年前历史英文文本训练的130亿参数语言模型。其基础版本在2600亿token的已过版权数据上训练，而指令微调版本则用于驱动聊天界面。该版本借助Claude等现代模型生成合成数据进行训练，可能导致年代错位的知识污染。项目旨在探索此类模型预测未来、超越知识截止点进行发明等能力，并希望最终构建一个完全由复古模型自举的训练流程。模型采用Apache 2.0许可。

开源/仓库数据/训练模型发布端侧

10:47

Hacker News 热门（buzzing.cc 中文翻译）

Talkie：一款诞生于1930年的13B复古语言模型

Talkie是一款参数规模为130亿的复古风格语言模型，其设计灵感源于1930年代的语言特征与表达方式。该模型通过模拟特定历史时期的语料与文风，在文本生成中呈现出独特的复古韵味。项目已在官网发布，并在Hacker News社区获得102点热度关注。这一尝试展示了语言模型在风格化与历史语境模拟方面的技术拓展。

开源/仓库数据/训练模型发布

10:45

歸藏(guizang.ai)@op7418

作者表示将尝试为Codepilot用户争取免费的Token补贴。这一考虑基于小米MiMo -V2.5系列模型的开源动态，该模型采用MIT协议，允许自由商用、二次训练与微调。同时，小米推出了Orbit 100T Token计划，包含面向AI builder的"百万亿Token创造者激励计划"和面向Agent框架团队的"Agent生态共建计划"。激励计划为通过申请的用户提供Token支持，如最高16亿Credits。作者意图借鉴此机制为Codepilot社区谋取福利。

歸藏(guizang.ai)：小米 MiMo -V2.5 系列模型全部开源采用宽松的 MIT 协议，允许自由商用、二次训练与微调，无需额外授权。同时他们还推出了Orbit 100T …

开源/仓库模型发布

10:42

歸藏(guizang.ai)@op7418

精选74

小米 MiMo-V2.5 系列模型全部开源

小米正式开源MiMo-V2.5系列模型，采用宽松的MIT协议，允许自由商用、二次训练与微调。该系列包含两个支持100万token上下文窗口的模型：专为复杂Agent和编码任务设计、在多项评测领先的MiMo-V2.5-Pro，以及具备强大Agent能力的原生全模态模型MiMo-V2.5。同时，小米推出Orbit 100T Token计划，包含面向AI开发者的“百万亿Token创造者激励计划”，提供最高价值659元的Credits，以及面向Agent框架团队的“Agent生态共建计划”，为其用户提供MiMo token限免支持。

智能体开源/仓库模型发布端侧

关联讨论 3 条

推荐理由：小米把 MiMo-V2.5 全线 MIT 开源，Pro 版在 agent 和编码榜单冲到开源第一，百万亿 Token 激励计划更是直接送钱让你用，做 Vibe Coding 的人没理由不去薅一把。

09:45

meng shao@shao__meng

精选75

小米开源MiMo-V2.5系列大模型

小米正式开源MiMo-V2.5系列模型，包含专注于代码代理的1T参数MoE模型MiMo-V2.5-Pro，以及支持多模态代理的310B参数MoE模型MiMo-V2.5，两者均支持1M上下文长度。其架构核心采用混合注意力、多Token预测和稀疏MoE技术，以支撑万亿参数规模下的高效长文处理。后训练基于MOPD范式，通过多教师策略蒸馏提升模型综合能力。同时，小米推出100T Token的创造者激励计划，为开发者提供免费计算资源以鼓励创新。模型已在Hugging Face平台开源。

智能体开源/仓库模型发布端侧

关联讨论 3 条

推荐理由：小米把万亿参数 MoE 做到开源且百万上下文，MTP 三层原生集成让推理速度翻三倍，这在国内大厂开源里是第一个真正敢放权重的万亿级模型，做 Agent 的值得认真看看。

07:24

Marc Andreessen 🇺🇸@pmarca

😍 【引用 @DavidDuvenaud】：宣布 Talkie：一个全新的开放权重历史 LLM！我们在一个仅包含 1930 年前数据的新整理数据集上训练并微调了一个 13B 模型。欢迎在下方尝试！与 @AlecRad 和 @status_effects 合作 🧵

开源/仓库数据/训练模型发布

07:23

Berryxia.AI@berryxia

小米开源MiMo-V2.5系列模型，支持百万token上下文

小米正式开源MiMo-V2.5系列模型，采用MIT许可证，允许商业部署、持续训练和微调。两个模型均支持100万token上下文窗口：MiMo-V2.5-Pro专为复杂Agent和编码任务设计，在开源模型的GDPVal-AA和ClawEval基准测试中排名第一；MiMo-V2.5是原生多模态模型，具备强大的Agent能力。小米强调，模型的价值不应仅由排行榜衡量，而应取决于其解决实际问题的能力。

智能体开源/仓库模型发布编码

04:26

AK@_akhaliq

小米 MiMo-V2.5 已在 Hugging Face 发布 https：//huggingface.co/collections/XiaomiMiMo/mimo-v25

多模态开源/仓库模型发布

03:45

Fuli Luo@_LuoFuli

精选76

小米宣布开源两个大模型：专攻复杂智能体和编码任务的MiMo-V2.5-Pro，以及原生全模态模型MiMo-V2.5。两者均支持100万token的上下文长度，并采用允许商业部署和微调的MIT许可证。同时，小米为开发者和创作者提供了100万亿token的免费额度，鼓励基于此构建应用。模型的价值不仅在于其在GDPVal-AA和ClawEval等基准测试中的排名，更在于其解决实际问题的能力。

智能体开源/仓库模型发布编码

关联讨论 3 条

推荐理由：小米这次把 1T 参数的 Code Agent 模型直接 MIT 开源，还送 100T 免费 token，诚意拉满。做 coding agent 的团队值得认真看看，这可能是目前开源阵营里最强的代码智能体基座。

01:48

Xiaomi MiMo@XiaomiMiMo

精选71

小米开源MiMo-V2.5双模型，支持百万上下文与商用

小米正式开源MiMo-V2.5系列模型，采用MIT许可，支持商业部署、继续训练与微调。该系列包含两个支持100万令牌上下文窗口的模型：MiMo-V2.5-Pro专为复杂智能体和编码任务设计，在GDPVal-AA和ClawEval基准测试中位列开源模型第一；MiMo-V2.5则是具备强大智能体能力的原生全模态模型。官方强调，模型的价值不仅在于排名，更在于其解决实际问题的能力，并已公开模型权重与技术博客。

智能体开源生态模型发布编码

关联讨论 3 条

推荐理由：小米把 MiMo-V2.5 直接 MIT 开源且支持商用，1M 上下文 + Agent 能力在开源阵营里确实能打，做 Agent 产品的团队值得花半小时跑一下 benchmark 看看真实水平。

4月27日

19:20

IT之家（RSS）

精选74

阿里：视频生成模型 HappyHorse1.0 开启灰测，千问 App 首发支持 15 秒多镜头叙事

阿里巴巴视频生成模型 HappyHorse1.0 开启灰度测试，支持生成15秒多镜头叙事视频，具备多画幅适配和1080P超分输出功能。官网720P视频生成刊例价为0.9元/秒，千问App上体验价格低至0.44元/秒。大众用户可通过千问App使用，还能创作粤语、英语、法语、韩语等多种语言的剧情短片。该模型此前登顶AI Video Arena排行榜，并将于5月份正式发布商用。

多模态模型发布

关联讨论 1 条

推荐理由：HappyHorse 悄悄登顶 AI Video Arena 后才被阿里认领，这个反转让它不只是又一个视频模型。0.44 元/秒的定价对内容创作者是真金白银的信号，做短视频的值得现在就去千问 App 试一轮。