6月13日

14:36

IT之家（RSS）

Google Research发布Gemini-SQL2模型，基于Gemini 3.1 Pro，专攻自然语言转SQL任务。在BIRD单模型赛道执行准确率80.04%，超越此前Gemini-SQL。BIRD涵盖95个数据库、37个专业领域及12751组问题-SQL配对，含脏数据与外部知识需求。业务人员可用自然语言查询营收、流失等指标。谷歌尚未公布API、模型卡或技术报告，亦未确认产品接入。

Google 推理模型发布

14:36

IT之家（RSS）

智谱：GLM-5.2 面向 GLM Coding Plan 全量用户开放，下周开源

智谱今日宣布，GLM-5.2 面向 GLM Coding Plan 全量用户开放，覆盖 Lite/Pro/Max/团队版。其 API 将于下周上线，模型下周正式开源，遵循 MIT 协议。智谱称 GLM-5.2 是迄今能力最强的开源模型，支持真正可用的 1M 上下文，在长程任务中保持领先。此前，智谱于今年 3 月发布 GLM-5.1，5 月发布 GLM-5.1 高速版，输出速度达 400 tokens/s。

开源生态模型发布

13:17

蚂蚁 inclusionAI：HuggingFace 新模型

精选62

inclusionAI 发布 VISTA-4B GUI 定位视觉语言模型

VISTA-4B 是基于 Qwen3.5-4B 骨干的 GUI 定位模型，输入截图与自然语言指令，输出归一化 0-1000 坐标。训练采用视图一致 GRPO 和自验证交叉视图锚定。在 GUI 定位基准上，SSPro 得分 64.2（相比 GRPO-4B 提升 2.0），SSV2 得分 93.8（下降 0.4），OSWorld-G 得分 61.2（提升 1.3），OSWorld-G-R 得分 69.7（提升 0.5）。模型已开源在 HuggingFace，推荐使用提示词并返回 [x,y] 格式坐标。

智能体 Hugging Face 多模态模型发布

推荐理由：蚂蚁 inclusionAI 开源了一款 GUI 定位模型，基于 Qwen3.5 微调，在接地基准上小幅提升，关键是提供了自验证训练方法，做桌面自动化的可以直接下载用。

13:17

蚂蚁 inclusionAI：HuggingFace 新模型

inclusionAI/VISTA-9B：基于VISTA训练的GUI定位视觉语言模型

VISTA-9B是基于Qwen3.5 9B骨干训练的GUI定位模型，输入截图与自然语言指令，输出0-1000归一化坐标。采用VISTA（视图一致自验证）方法，含view-consistent GRPO与self-verified cross-view anchoring。在SSPro、SSV2、OSWorld-G、OSWorld-G-R上分别取得69.2、95.8、68.1、75.5分，超越Qwen3.5-9B与GRPO-9B基线。模型已开源，可通过HuggingFace加载使用。

智能体 Hugging Face 多模态模型发布

12:59

MarkTechPost（RSS）

Moonshot AI 开源 Kimi K2.7-Code：编程模型在 Kimi Code Bench v2 上较 K2.6 提升 21.8%

Moonshot AI 以 Modified MIT 许可证开源了 Kimi K2.7-Code，一款专注编程的智能体模型，基于 Kimi K2.6，拥有 256K 上下文窗口，推理 token 使用量降低约 30%。在六项基准测试中均优于 K2.6，其中在 Kimi Code Bench v2 上提升 21.8%。该模型可通过 Kimi API 和 Kimi Code 获取。

开源生态模型发布编码

12:15

MiniMax (official)@MiniMax_AI

MiniMax 宣布其 M3 模型的权重已开源（HuggingFace 链接）。此前，Anthropic 因美国以国家安全为由发布出口管制指令，被迫立即禁用 Fable 5 和 Mythos 5 模型，禁止任何外国国民访问（包括外国员工）。MiniMax 以"M3 would never"暗讽其模型不受此类限制，并强调权重已开放。

Anthropic: The US government, citing national security authorities, has issued an export control directive to suspend all access to...

Hugging Face 开源生态模型发布

关联讨论 12 条

10:45

MiniMax (official)@MiniMax_AI

MiniMax 发布全新开源模型 M3，具备前沿编码、智能体能力、原生图像视频输入、Computer Use 及 1M-token 上下文窗口。核心采用 MSA 稀疏注意力架构：每个 query 仅对 128-token 的 KV 块打分，只关注 top 块，使超长上下文实际可部署。M3 在 vLLM 获 Day-0 支持，已在 NVIDIA 和 AMD 硬件验证，包括 MSA 专用 prefill/decode kernel、1M-token 上下文服务（prefix caching + chunked prefill）、BF16/MXFP8 检查点（Hopper 和 Blackwell 的 MoE 后端）、原生多模态输入，以及工具调用、推理解析和思考模式控制等功能。

vLLM: 🎉 Congrats to @MiniMax_AI on releasing MiniMax M3! Frontier coding and agentic capabilities, native image and video inp...

多模态开源生态推理模型发布

关联讨论 12 条

09:14

Berryxia.AI@berryxia

Kimi 开源编码模型 Kimi-K2.7-Code，解决过度思考问题

Kimi 发布并开源最新编码模型 Kimi-K2.7-Code。相比 K2.6，该模型在 Kimi Code Bench v2 提升 21.8%，Program Bench 提升 11%，MLS Bench Lite 提升 31.5%。核心改进是解决编码模型“过度思考”问题，推理 token 使用量降低 30%，long-horizon 编码任务的指令跟随和端到端成功率显著提升。权重与代码已上传 Hugging Face，支持通过 Kimi API 和 Kimi Code 使用，同时开放 Beta 计划。团队预告即将推出 6x High-Speed Mode，进一步提升编码效率。

Kimi.ai: 🌘 Kimi-K2.7-Code, our latest coding model, is now released and open-sourced! 🔷 Improved coding & agent performance ove...

智能体模型发布编码

08:07

SemiAnalysis@SemiAnalysis_

祝贺 @vllm_project 和 @lmsysorg 在 CUDA 和 ROCm 堆栈上于第 0 天发布 MiniMax M3 428B！MiniMax M3 包含： 🟠 块稀疏注意力，预填充比 M2.7 快 9 倍 🟠 第 0 天开放 MXFP8 权重 🟠 此外，@Inferact 发布了第 0 天 EAGLE3 开放权重草稿模型支持期待尝试 MiniMax M3 的性能！

开源生态推理模型发布部署/工程

08:00

HuggingFace Daily Papers（社区热门论文）

同事件精选77

Ling-2.6与Ring-2.6技术报告：高效即时的万亿参数智能体智能

Ling-2.6优化即时响应与输出token能力，Ring-2.6针对深度推理和复杂智能体工作流。基于Ling-2.0通过架构迁移预训练和大规模后训练升级。架构引入融合Lightning Attention与MLA的混合线性注意力设计，提升长上下文训练与解码效率。通过进化思维链、语言单元策略优化、双向偏好对齐和最短正确响应蒸馏优化token效率。提出KPop强化学习框架支持Ring-2.6-1T在环境交互数据上稳定训练，通过异步调度提升编码、搜索、工具使用和工作流执行的训练效率。2.6系列全部检查点已开源。

智能体推理模型发布

同一事件，精选展示《蚂蚁 inclusionAI 推出万亿参数推理模型 Ring-2.6-1T》

推荐理由：万亿参数开源 Agent 模型，一个走即时响应，一个专攻复杂推理，对于做工具调用和自动化工作流的团队是能立刻上手的重要弹药。

07:14

karminski-牙医@karminski3

KIMI K2.7 Code发布，编程/Agent专项模型

KIMI K2.7 Code正式发布，为编程/Agent专项模型，架构与K2.6一致，属后训练优化版本。在kimi自测的kimi-code-bench-v2上较K2.6提升11%，其他Agent测试项目同样有提升。适用场景包括编程任务以及需要Agent参与的验证任务（如简历筛选、PR审查等）。

智能体模型发布编码

05:43

MiniMax (official)@MiniMax_AI

同事件精选82

MiniMax M3 发布，具备前沿编码与智能体能力，原生图像视频输入和计算机使用，1M-token 上下文。核心采用 MSA 稀疏注意力：每个 query 评分 128-token KV 块，仅对 top 块做注意力。vLLM 当日即支持 M3，包括专用 MSA prefill/decode 核、前缀缓存与分块 prefill、BF16 和 MXFP8 检查点、Hopper 与 Blackwell 的 MoE 后端，并在 NVIDIA 与 AMD 硬件上验证。同时支持原生多模态输入、工具调用、推理解析和思考模式控制等智能体工作负载。

vLLM: 🎉 Congrats to @MiniMax_AI on releasing MiniMax M3! Frontier coding and agentic capabilities, native image and video inp...

多模态开源生态推理模型发布

同一事件，精选展示《MiniMax M3：前沿编码、100万token上下文与原生多模态一体模型》

推荐理由：M3把1M上下文从‘理论上能做’变成了‘今天就能部署’，MSA稀疏注意力是关键，开源社区和推理框架的深度合作值得关注。