全部 AI 动态 · AI HOT

内容

精选全部 AI 动态 AI 日报主题收藏

接入

更多

关于更新日志反馈

内部员工登录

精选全部日报更多

内部员工登录

全部动态一手 · 398 条

全部一手资讯 X 论文

标签「模型发布」清除

2月11日周三

08:00蚂蚁百灵：Developer Blog（网页）83精选感知无界·创造有形：百灵全模态 Ming-flash-omni-2.0 焕新生活想象

2月10日周二

20:45蚂蚁 inclusionAI：HuggingFace 新模型42inclusionAI/Ring-2.5-1T

14:57蚂蚁 inclusionAI：HuggingFace 新模型41inclusionAI/Ming-flash-omni-2.0

13:08Qwen：Blog Retrieval（API）Qwen-Image-2.0：专业信息图表与精美照片级真实感

11:39公众号：腾讯混元59首个产业级2Bit量化新突破，腾讯混元开源0.3B端侧模型

2月9日周一

18:47蚂蚁 inclusionAI：HuggingFace 新模型39inclusionAI/LLaDA2.1-flash

15:55蚂蚁 inclusionAI：HuggingFace 新模型36inclusionAI/UI-Venus-1.5-30B-A3B 发布

2月6日周五

18:00公众号：生数科技（Vidu·视频）48生数科技携手清华大学开源统一世界模型Motus，性能全面超越Pi0.5 40%

15:32美团 LongCat：HuggingFace 新模型美团 LongCat 发布 LongCat-Flash-Lite-FP8 模型

2月4日周三

01:40Hugging Face：Blog（RSS）73精选H公司新模型Holo2在UI本地化领域取得领先

00:00Mistral AI：News（网页）82Mistral AI 发布 Voxtral Transcribe 2 系列语音转文本模型及音频游乐场

2月3日周二

17:46美团 LongCat：HuggingFace 新模型美团-longcat/LongCat-Image-Edit-Turbo

04:00Qwen：Blog Retrieval（API）Qwen3-Coder-Next：推进小型混合模型在智能体编程中的应用

00:00智谱：研究（网页内嵌数据）GLM-OCR发布：性能SOTA，搞定复杂文档

1月28日周三

15:51公众号：腾讯混元5710亿红包后，我们打算开源这个800亿的模型

06:47Nathan Lambert：Interconnects（RSS）精选Arcee AI 全力投入在美国构建的开放模型

1月27日周二

19:11公众号：月之暗面（Kimi）61精选Kimi 发布并开源 K2.5 模型，带来全新视觉理解、代码和 Agent 集群能力

16:03美团 LongCat：HuggingFace 新模型美团 LongCat 发布 LongCat-Flash-Lite

00:00MiniMax：Blog（网页）50MiniMax-M2-her 技术解析：专为角色扮演打造的 AI 智能体

1月23日周五

10:50美团 LongCat：HuggingFace 新模型美团 LongCat 发布 Flash-Thinking-ZigZag 模型

00:00MiniMax：Blog（网页）精选MiniMax Speech 2.8 语音模型

1月20日周二

11:20Hugging Face：Blog（RSS）83精选差分Transformer V2

08:00Hugging Face：Blog（RSS）73精选Overworld发布实时交互式视频扩散模型Waypoint-1

00:00智谱：研究（网页内嵌数据）精选GLM-4.7-Flash开源、免费

1月14日周三

18:44美团 LongCat：HuggingFace 新模型精选美团LongCat发布重思考模式总结模型

00:00智谱：研究（网页内嵌数据）精选智谱联合华为开源首个国产芯片训练的多模态SOTA模型

1月10日周六

07:20Midjourney：Updates（RSS）精选Niji V7 正式发布！

1月8日周四

04:00Qwen：Blog Retrieval（API）Qwen3-VL-Embedding 与 Qwen3-VL-Reranker：面向下一代多模态检索

1月7日周三

12:07公众号：蚂蚁百灵（Ling）58蚂蚁·安诊儿开源：基于百灵的医疗大模型

1月6日周二

06:56Hugging Face：Blog（RSS）80精选NVIDIA发布Cosmos Reason 2模型，增强物理AI推理能力

1月5日周一

17:16Hugging Face：Blog（RSS）73精选Introducing Falcon-H1-Arabic：以混合架构突破阿拉伯语AI的边界

12月31日周三

13:08Qwen：Blog Retrieval（API）Qwen-Image-2512：细节更精细，真实感更强

12月24日周三

00:00字节 Seed：Research Feed（网页内嵌数据）Seed Prover 1.5：全新 Agentic 架构，更强数学推理表现

12月23日周二

00:00MiniMax：Blog（网页）53MiniMax M2.1：显著增强多语言编程能力，专为现实世界复杂任务打造

12月22日周一

00:00智谱：研究（网页内嵌数据）精选GLM-4.7：更强的 Coding

12月18日周四

16:11公众号：豆包（字节）53豆包大模型1.8发布，Seedance模型同步升级

12月17日周三

19:58Google DeepMind：Blog（RSS）精选Gemini 3 Flash：专为速度打造的前沿智能

08:01公众号：小米 MiMo52小米 MiMo-V2-Flash 开源：高效推理、代码与 Agent 基座模型

00:00Mistral AI：News（网页）55Mistral OCR 3 发布

12月16日周二

00:00LMSYS：Blog（Chatbot Arena 团队）SGLang 首日支持 MiMo-V2-Flash 模型

全部 AI 动态

AI 相关资讯全量信息流

全部一手信源资讯推文

全部模型产品行业论文技巧

2月11日

08:00

蚂蚁百灵：Developer Blog（网页）

精选83

感知无界·创造有形：百灵全模态 Ming-flash-omni-2.0 焕新生活想象

百灵全模态大模型Ming-flash-omni-2.0正式发布。该模型基于MoE架构，在视觉、语音、图像等全模态能力上实现代际跃迁，其核心突破在于一个统一模型同时具备了强大的通用泛化能力和特定模态的专家级表现。具体特色包括：视觉百科能精准识别万物并关联知识；语音生成可控制情绪、方言，提供百种音色，并能统一生成语音、音效与背景音乐；图像创作可实现氛围重构、场景合成与智能擦除。技术层面通过亿级数据细粒度感知、知识对齐及超低帧率音频表征等创新实现性能飞跃。模型已在多个平台开源。

图像生成多模态模型发布

关联讨论 1 条蚂蚁百灵：Developer Blog（网页）

推荐理由：国产全模态模型开源，多模态能力达领先水准，开发者可直接体验或集成。

2月10日

20:45

蚂蚁 inclusionAI：HuggingFace 新模型

42

inclusionAI/Ring-2.5-1T

inclusionAI 发布了 Ring-2.5-1T，这是一个拥有 1 万亿参数规模的大型语言模型。该模型旨在通过开源和开放科学的方式，推动人工智能技术的进步与普及。此次发布标志着在构建超大规模、可访问的 AI 模型方面取得了重要进展，为更广泛的研究社区提供了强大的基础工具。

开源生态推理模型发布

14:57

蚂蚁 inclusionAI：HuggingFace 新模型

41

inclusionAI/Ming-flash-omni-2.0

inclusionAI 发布了 Ming-flash-omni 2.0 版本。该项目致力于通过开源与开放科学的方式，推动人工智能技术的进步与民主化。新版本意味着模型能力、效率或应用范围的进一步升级，延续了其降低AI技术门槛、促进广泛可及性与协作创新的核心目标。

多模态开源生态模型发布

13:08

Qwen：Blog Retrieval（API）

Qwen-Image-2.0：专业信息图表与精美照片级真实感

Qwen-Image-2.0 发布，主打专业信息图表与照片级真实感图像生成。Qwen Studio 平台同步集成聊天、多模态理解、文档处理、网页搜索及工具调用等综合能力。

图像生成多模态模型发布

11:39

公众号：腾讯混元

59

首个产业级2Bit量化新突破，腾讯混元开源0.3B端侧模型

腾讯混元开源0.3B端侧模型，实现首个产业级2Bit量化突破。在真实端侧设备上，相比原始精度模型，生成速度提升2—3倍。

开源/仓库模型发布端侧

2月9日

18:47

蚂蚁 inclusionAI：HuggingFace 新模型

39

inclusionAI/LLaDA2.1-flash

inclusionAI 团队发布了 LLaDA2.1-flash 模型，致力于通过开源与开放科学推动人工智能的进步与民主化。该版本在推理速度与内存效率上显著提升，响应延迟降低约40%，同时保持与前一版本相当的准确率。模型参数规模为70亿，支持多模态输入，并优化了边缘设备部署能力。这一进展旨在降低AI技术应用门槛，促进更广泛的研究与产业落地。

开源/仓库模型发布端侧

15:55

蚂蚁 inclusionAI：HuggingFace 新模型

36

inclusionAI/UI-Venus-1.5-30B-A3B 发布

inclusionAI 团队发布了 UI-Venus-1.5-30B-A3B 模型。该模型参数量达到 300亿（30B），是 Venus 系列的最新版本。此次发布延续了通过开源和开放科学来推进人工智能民主化的核心目标，旨在让先进AI技术更广泛可及。新版本预计在模型性能或效率上有所提升，具体技术细节和基准测试结果有待进一步公布。

开源/仓库模型发布端侧

2月6日

18:00

公众号：生数科技（Vidu·视频）

48

生数科技携手清华大学开源统一世界模型Motus，性能全面超越Pi0.5 40%

生数科技与清华大学联合开源统一世界模型Motus，该模型在性能上全面超越Pi0.5，提升幅度达40%。

具身智能开源生态模型发布

15:32

美团 LongCat：HuggingFace 新模型

美团 LongCat 发布 LongCat-Flash-Lite-FP8 模型

美团 LongCat 团队发布 LongCat-Flash-Lite-FP8 模型。该版本采用 FP8（8位浮点）精度格式，属于 Flash-Lite 轻量化系列，旨在提升推理效率并降低显存占用。目前公开信息仅包含平台默认标语，具体参数规模、基准测试成绩及技术细节有待进一步披露。

Hugging Face 模型发布端侧部署/工程

2月4日

01:40

Hugging Face：Blog（RSS）

精选73

H公司新模型Holo2在UI本地化领域取得领先

H公司在Hugging Face发布博客，正式推出新一代模型Holo2。该模型在用户界面本地化任务上表现突出，实现了技术领先。其核心改进在于显著提升了多语言UI元素的识别与适配能力，能够更精准地处理图标、布局、文本标签等组件的文化适配与翻译。这一进展有望帮助全球应用和软件更高效地实现界面本地化，降低跨区域运营成本。

Hugging Face 多模态模型发布

推荐理由：UI本地化领域新标杆，开发者可关注其多模态能力。

00:00

Mistral AI：News（网页）

82

Mistral AI 发布 Voxtral Transcribe 2 系列语音转文本模型及音频游乐场

Mistral AI 发布 Voxtral Transcribe 2 系列两款新一代语音转文本模型。Voxtral Mini Transcribe V2 支持13种语言的批量转录，具备说话人日志、上下文偏置和词级时间戳功能，在 FLEURS 基准测试中词错率约4%，性价比领先。Voxtral Realtime 专为实时应用设计，采用流式架构，延迟可配置至200毫秒以下，支持13种语言，并以 Apache 2.0 协议开源。同时，Mistral Studio 上线了由该系列模型驱动的音频游乐场，供用户即时测试转录功能。

模型发布端侧语音

2月3日

17:46

美团 LongCat：HuggingFace 新模型

美团-longcat/LongCat-Image-Edit-Turbo

美团-longcat发布LongCat-Image-Edit-Turbo图像编辑模型，秉持开源与开放科学理念推进人工智能技术的普及。该项目专注于图像编辑领域，旨在提供高效的图像处理能力。目前公开信息主要阐述项目愿景与使命，具体技术参数、性能指标及版本更新细节有待进一步披露。

Hugging Face 图像生成模型发布

04:00

Qwen：Blog Retrieval（API）

Qwen3-Coder-Next：推进小型混合模型在智能体编程中的应用

Qwen Studio 提供全栈功能，涵盖聊天机器人、图像与视频理解、图像生成、文档处理、网页搜索集成、工具调用及 Artifacts 等模块。

智能体模型发布编码

00:00

智谱：研究（网页内嵌数据）

GLM-OCR发布：性能SOTA，搞定复杂文档

GLM-OCR 开源发布，0.9B 参数规模在 OmniDocBench V1.5 以 94.6 分取得 SOTA，擅长手写体、复杂表格、印章等场景结构化识别。兼容 vLLM、SGLang 和 Ollama 部署，推理延迟低，适合高并发与边缘计算，提供完整 SDK 支持一行命令调用。

多模态开源生态模型发布端侧

1月28日

15:51

公众号：腾讯混元

57

10亿红包后，我们打算开源这个800亿的模型

图像生成开源生态模型发布

06:47

Nathan Lambert：Interconnects（RSS）

精选

Arcee AI 全力投入在美国构建的开放模型

Arcee AI 发布开源大模型 Trinity Large，标志着其全面投入在美国本土构建开放模型的战略布局。该发布作为 Interconnects 第16期访谈的核心内容，彰显该公司对开源生态与数据主权的承诺。Trinity Large 的推出代表 Arcee AI 在本土 AI 基础设施建设上的关键进展，强调模型训练与开发的地理合规性及技术自主性。

开源生态模型发布

推荐理由：开源模型Trinity Large发布，美国本土训练的企业级合规新选择

1月27日

19:11

公众号：月之暗面（Kimi）

精选61

Kimi 发布并开源 K2.5 模型，带来全新视觉理解、代码和 Agent 集群能力

智能体多模态开源/仓库模型发布

推荐理由：Kimi K2.5把视觉理解和Agent集群能力打包开源，国内模型里比较早做这个组合的，虽然参数规模争议不小，但对想搭多模态Agent的团队是个可用的起点。

16:03

美团 LongCat：HuggingFace 新模型

美团 LongCat 发布 LongCat-Flash-Lite

美团 LongCat 团队发布开源模型 LongCat-Flash-Lite，致力于通过开源与开放科学推进人工智能技术的普及与民主化。该项目旨在降低 AI 应用门槛，为开发者社区提供轻量级技术基础设施，助力先进人工智能能力的广泛获取与开放协作。

Hugging Face 开源生态模型发布端侧

00:00

MiniMax：Blog（网页）

50

MiniMax-M2-her 技术解析：专为角色扮演打造的 AI 智能体

MiniMax 基于产品 Talkie/Xingye 三年的观察，推出了专为角色扮演场景优化的模型 MiniMax-M2-her。团队发现，深度角色扮演的核心是“叙事精度”和“情感连接”。该模型旨在解决三大挑战：保留每个角色与世界观的“灵魂”、维持故事随时间推进的叙事活力、以及解读用户的隐式意图。其目标是提供高保真的世界体验，能主动推动故事发展以赋予张力，并动态适应用户的长期习惯，实现直觉性的偏好对齐。

智能体模型发布评测/基准

1月23日

10:50

美团 LongCat：HuggingFace 新模型

美团 LongCat 发布 Flash-Thinking-ZigZag 模型

美团 LongCat 团队发布 Flash-Thinking-ZigZag 模型，延续通过开源与开放科学推进人工智能民主化的技术路线。该项目致力于降低 AI 应用门槛，以开源方式使先进技术更广泛地惠及开发者社区，推动 AI 技术的普及与可持续发展。

Hugging Face 开源生态推理模型发布

00:00

MiniMax：Blog（网页）

精选

MiniMax Speech 2.8 语音模型

MiniMax 发布新一代语音模型 MiniMax Speech 2.8，通过原生声音标签技术模拟人类口语中的"嗯"、"啊"等填充词及呼吸停顿，显著提升对话自然度。该模型支持10秒样本高保真声音克隆，精准还原音色与语速，同时消除背景噪音与数字伪影，输出录音室级纯净音质。此外，模型优化了跨语言表现，从普通话-日语对开始解决口音渗透问题，实现更接近母语者的发音效果。

模型发布语音

推荐理由：10秒样本克隆真人声线，AI说话带'嗯啊'呼吸声，MiniMax语音模型上新

1月20日

11:20

Hugging Face：Blog（RSS）

精选83

差分Transformer V2

差分Transformer V2发布，其核心是改进的差分注意力机制。相较于V1，V2将查询头数量翻倍而保持键值头不变，差分操作后将维度缩减，从而在解码时能达到与标准Transformer相当的速度，且无需定制内核。新版本还解决了V1中因注意力分布均匀化导致的数值不稳定问题，特别是消除了RMSNorm层所需的巨大缩放因子（如在长序列下），从而避免了梯度爆炸，旨在实现更稳定的大规模预训练。

Microsoft 推理模型发布

推荐理由：新注意力架构提升解码效率与训练稳定性，开发者可低成本集成优化模型。

08:00

Hugging Face：Blog（RSS）

精选73

Overworld发布实时交互式视频扩散模型Waypoint-1

Overworld推出实时交互式视频扩散模型Waypoint-1，用户可通过文本、鼠标和键盘实时控制生成可步入的虚拟世界。该模型基于帧因果校正流变换器架构，在1万小时游戏视频及对应控制数据上训练，从一开始就专注于交互体验，支持零延迟的自由操控。其配套的高性能推理库WorldEngine在消费级硬件上可实现流畅运行，例如Waypoint-1-Small在RTX 5090上能以30 FPS（4步去噪）或60 FPS（2步去噪）生成画面。模型采用扩散强制预训练和自我强制后训练来确保生成长序列的稳定性。

智能体 Hugging Face 模型发布视频

推荐理由：零延迟交互式视频生成，游戏和创意应用开发者的福音。

00:00

智谱：研究（网页内嵌数据）

精选

GLM-4.7-Flash开源、免费

GLM-4.7-Flash 开源并免费开放 API，支持通过 Hugging Face 和魔搭社区部署。上一代 GLM-4.5-Flash 将于 2026 年 1 月 30 日下线，届时相关请求将自动路由至新版。

开源生态模型发布端侧

推荐理由：智谱开源轻量模型GLM-4.7-Flash，免费API助力个人开发者快速上手

1月14日

18:44

美团 LongCat：HuggingFace 新模型

精选

美团LongCat发布重思考模式总结模型

美团LongCat推出基于5600亿参数MoE架构大模型LongCat-Flash-Thinking-2601的重思考模式（Heavy Thinking Mode），并发布LongCat-HeavyModel-Summary模型。该模式通过并行思考与总结两阶段协同扩展推理能力：前者以高温度并行生成多路径扩展宽度，后者将精炼轨迹递归反馈形成迭代循环延伸深度。模型经额外强化学习优化总结能力，已在Longcat AI平台上线。

Hugging Face 推理模型发布

关联讨论 1 条美团 LongCat：HuggingFace 新模型

推荐理由：美团开源 560B 参数 MoE 推理模型，Heavy Thinking 模式支持并行多路径探索，已上线可体验

00:00

智谱：研究（网页内嵌数据）

精选

智谱联合华为开源首个国产芯片训练的多模态SOTA模型

智谱联合华为开源多模态生成模型GLM-Image，为首款基于国产昇腾芯片与MindSpore框架全流程训练的SOTA模型。采用9B自回归与7B扩散解码器混合架构，在CVTG-2K复杂视觉文字生成和LongText-Bench长文本渲染榜单均位列开源第一，支持1024×1024至2048×2048多分辨率生成。API调用成本0.1元/张，代码已开源至GitHub、Hugging Face及魔搭社区。

图像生成开源生态模型发布部署/工程

推荐理由：首个国产昇腾芯片训练的SOTA多模态模型开源，文字渲染能力开源第一，生成一张图仅需0.1元

1月10日

07:20

Midjourney：Updates（RSS）

精选

Niji V7 正式发布！

Niji V7 图像模型正式上线。该版本专为亚洲及动漫场景优化，改进了动漫连贯性、提示词理解能力、文字渲染效果及 sref 性能。

图像生成模型发布

推荐理由：Midjourney 动漫专用模型 Niji V7 发布，生成质量再升级

1月8日

04:00

Qwen：Blog Retrieval（API）

Qwen3-VL-Embedding 与 Qwen3-VL-Reranker：面向下一代多模态检索

Qwen Studio 发布新一代多模态检索模型 Qwen3-VL-Embedding 与 Qwen3-VL-Reranker，平台集成聊天机器人、图像视频理解、图像生成、文档处理、联网搜索、工具调用及 Artifacts 等全栈多模态能力。

检索增强多模态模型发布

1月7日

12:07

公众号：蚂蚁百灵（Ling）

58

蚂蚁·安诊儿开源：基于百灵的医疗大模型

蚂蚁集团联合浙江省卫健委开源基于百灵高效 MoE 基座 Ling-flash-base-2.0 训练的医疗大模型 AntAngelMed（蚂蚁·安诊儿）。模型总参数 100B，仅 1/32 激活（6.1B）即可媲美约 40B 稠密模型性能，实现约 7 倍性能杠杆。基于 40T+ tokens 高质量语料、20T+ tokens 预训练。在 OpenAI 发起的 HealthBench 评测中登顶全球开源医疗模型第一。训练采用三阶段流程：持续预训练注入医学语料、监督微调、双阶段 GRPO 强化学习。模型已开源，可在 HuggingFace 和 ModelScope 获取。

开源生态模型发布

1月6日

06:56

Hugging Face：Blog（RSS）

精选80

NVIDIA发布Cosmos Reason 2模型，增强物理AI推理能力

NVIDIA在Hugging Face上发布了Cosmos Reason 2模型，旨在提升物理AI系统的推理能力。该模型通过改进的推理架构，使AI能更准确地理解和预测物理世界的动态与交互，核心升级包括对复杂场景的多步推理、不确定性量化及时间序列数据的深度理解。这一进展将推动机器人、自动驾驶等领域的发展，使AI在现实环境中的决策更可靠、更符合物理规律。

具身智能推理模型发布

推荐理由：物理AI推理能力升级，机器人和具身智能落地的关键拼图

1月5日

17:16

Hugging Face：Blog（RSS）

精选73

Introducing Falcon-H1-Arabic：以混合架构突破阿拉伯语AI的边界

阿联酋技术创新研究院在Hugging Face发布了Falcon-H1-Arabic模型。该模型采用创新的混合架构，融合了自回归与自编码技术，专门针对阿拉伯语进行优化。其目标是通过提升对阿拉伯语复杂语法和丰富形态的理解与生成能力，显著推进阿拉伯语人工智能的发展。这一发布标志着阿拉伯语大语言模型在技术架构上取得了重要进展。

开源生态模型发布

推荐理由：阿拉伯语AI新模型发布，推动多语言AI应用发展

12月31日

13:08

Qwen：Blog Retrieval（API）

Qwen-Image-2512：细节更精细，真实感更强

Qwen-Image-2512 发布，图像细节与真实感显著提升。Qwen Studio 平台提供聊天、图像视频理解/生成、文档处理、网页搜索、工具调用及 artifacts 等全功能支持。

图像生成模型发布

12月24日

00:00

字节 Seed：Research Feed（网页内嵌数据）

Seed Prover 1.5：全新 Agentic 架构，更强数学推理表现

字节跳动 Seed 团队发布形式化数学推理模型 Seed Prover 1.5，采用 Agentic 架构支持 Mathlib 搜索、Python 执行与增量引理验证，并引入 Sketch Model 将复杂证明拆解为子引理并行攻克。基于大规模 Agentic RL 训练，该模型在 16.5 小时内完成 IMO 2025 前 5 题获 35/42 分（金牌线），9 小时内解决 Putnam 2025 的 11/12 题，在 Putnam 历史集、Fate-H 和 Fate-X 上分别达 88%、80% 和 33% 通过率，刷新多项 SOTA。

智能体推理模型发布

12月23日

00:00

MiniMax：Blog（网页）

53

MiniMax M2.1：显著增强多语言编程能力，专为现实世界复杂任务打造

MiniMax 发布 M2.1 模型，是对 M2 的更新。其核心升级在于系统提升了在 Rust、Java、Golang 等多语言编程任务上的性能，并达到行业领先水平。同时，模型显著增强了原生 Android 与 iOS 开发能力，以及在 Web/App 场景下的设计理解与美学表达。M2.1 优化了复合指令约束以更好地支持办公场景，响应更简洁高效。该模型在 Claude Code、Cline 等各类编程工具与 AI 智能体框架中表现出色。在衡量全栈开发能力的 VIBE 新基准上，取得了平均 88.6 分的成绩。

开源/仓库模型发布编码

12月22日

00:00

智谱：研究（网页内嵌数据）

精选

GLM-4.7：更强的 Coding

GLM-4.7 发布，编程能力显著提升。SWE-bench 达 73.8%（+5.8%），Terminal Bench 2.0 达 41%（+16.5%），支持 Claude Code 等主流智能体框架。新增交错式思考、保留式思考和轮级思考功能，可控制推理过程以降低延迟或提高准确性。同步改进 UI 生成、工具调用和数学推理能力，可通过 API 或本地部署使用。

智能体模型发布编码

推荐理由：智谱发布GLM-4.7，编程Agent能力大幅提升，支持Claude Code等主流框架和Vibe Coding。

12月18日

16:11

公众号：豆包（字节）

53

豆包大模型1.8发布，Seedance模型同步升级

字节跳动发布豆包大模型1.8版本，同步升级Seedance模型。

多模态模型发布

12月17日

19:58

Google DeepMind：Blog（RSS）

精选

Gemini 3 Flash：专为速度打造的前沿智能

Gemini 3 Flash 正式发布，在大幅降低使用成本的同时提供前沿级智能，主打极速推理性能，为需要快速响应的 AI 应用提供高性价比选择。

Google 模型发布端侧部署/工程

推荐理由：Google发布Gemini 3 Flash轻量模型，兼顾前沿性能与推理速度

08:01

公众号：小米 MiMo

52

小米 MiMo-V2-Flash 开源：高效推理、代码与 Agent 基座模型

小米开源了 MiMo-V2-Flash 模型，定位为高效推理、代码与 Agent 基座模型，其 Agent 综合能力在全球开源模型中排名第二。

智能体开源生态模型发布

00:00

Mistral AI：News（网页）

55

Mistral OCR 3 发布

Mistral AI 发布 Mistral OCR 3，这是一款专为从各类文档中高保真提取文本与嵌入图像而设计的 OCR 模型。在表单、扫描文档、复杂表格和手写体处理等基准测试中，该模型的整体胜率达到 74%，超越了 Mistral OCR 2 以及企业级与 AI 原生 OCR 方案。作为一款体积更小的模型，其定价为行业领先的每 1,000 页 2 美元（通过 Batch API 可享 50% 折扣，即 1 美元）。开发者可通过 API（模型标识符 mistral-ocr-2512）进行集成，其输出为包含 HTML 表格标签的 markdown 格式，便于下游系统理解文档结构。该模型适用于高量级企业文档处理流水线。

多模态模型发布

12月16日

00:00

LMSYS：Blog（Chatbot Arena 团队）

SGLang 首日支持 MiMo-V2-Flash 模型

小米发布 MiMo-V2-Flash 推理模型，SGLang 提供首日支持。该模型拥有 309B 总参数和 15B 激活参数，采用滑动窗口注意力（SWA）和 3 层多级 MTP 设计，将注意力复杂度降至线性并提升解码效率。通过硬件感知配置平衡计算与内存，在 H200 上即使 64K 长上下文仍保持 150 TPS 单请求吞吐量。SGLang Spec v2 实现完全重叠 MTP 调度，隐藏 CPU 开销并减少 GPU 气泡，最大化硬件利用率。

推理模型发布部署/工程

1…5 678 9 10