AIHOT
内容
精选全部 AI 动态AI 日报主题收藏
接入
Agent 接入
更多
关于更新日志反馈
内部员工登录
精选全部日报更多
内部员工登录
全部动态X · 980 条
全部一手资讯X论文
标签「模型发布」清除
meng shao@shao__meng · 6月15日23

智谱的 Codex ? 不,是 ZCode !

Rohan Paul@rohanpaul_ai · 6月14日29

Rumors suggest Dreamina (operated by ByteDance) is preparing a smaller new Seedance release. The buzz says Dreamina Seedance 2.0 mini could land on June 15, bringing near-Seedance 2.0 quality without the same painful price tag. For creators who love Seedance but not the bills, this could be very welcome. For a while, everyone focused on raw output quality. Now the bigger question is: how many serious attempts can you make before the process becomes too slow or expensive? Better AI video for less money is always nice. #dreamina #seedance #dreaminaseedance2mini You can try it here. https://aisecret.co/dreaminaseedance2.0mini

译传闻字节跳动旗下Dreamina正在准备一个更小、更便宜的Seedance版本——Seedance 2.0 mini,预计6月15日发布。该版本在质量上接近Seedance 2.0,但价格大幅降低,为喜欢Seedance但担忧成本的创作者提供了更经济的选择。

StepFun@StepFun_ai · 6月14日43

Step 3.7 Flash is now live on @DeepInfra 🚀 Developers can now try our open-source multimodal reasoning model through DeepInfra’s API, with private endpoint deployment available for dedicated workloads. Built for agentic coding, tool use, search, and vision workflows. Thanks to the DeepInfra team!

译Step 3.7 Flash 现已在 @DeepInfra 上线 🚀 开发者现在可以通过 DeepInfra 的 API 试用我们的开源多模态推理模型,并支持为专用工作负载部署私有端点。 专为智能体编程、工具使用、搜索和视觉工作流打造。 感谢 DeepInfra 团队!

🚨 AI News | TestingCatalog@testingcatalog · 6月14日78

ICYMI 👀: Z AI released GLM-5.2 for all users on GLM Coding Plans. > As our new flagship model, GLM-5.2 delivers powerful coding capabilities, usable 1M-context support, and continued strengths in long-horizon tasks. Open-source and API support are planned for next week.

译智谱发布最强开源模型GLM-5.2,面向所有GLM Coding Plan用户(Lite/Pro/Max)开放。该模型支持真正可用的100万上下文窗口,在长程任务独立完成方面保持领先,适合构建复杂AI智能体应用,也是国产最强编码模型的核心引擎。面对外部封锁限制,智谱强调科学全球性、AGI不应被高墙垄断,采取激进开源态度。GLM-5.2的开源与API预计下周同步上线。

Chubby♨️@kimmonismus · 6月14日65

Wait what? Rio 3.5 Open 397B, developed by IT company of Rio de Janeiro's city government is now SOTA open source and even outperforming Qwen 3.7? What is happening today. Never heard of them before.

译里约热内卢市政府 IT 公司开发的 Rio 3.5 Open 397B(397B 参数)开源模型达到 SOTA,性能超过阿里 Qwen 3.7。此前 Qwen 3.7 因专有立场逐渐退出前沿竞争,取而代之的是 MiniMax M3 和 Rio 3.5。该模型已上传至 HuggingFace(prefeitura-rio/Rio-3.5-Open-397B)。

SemiAnalysis@SemiAnalysis_ · 6月14日47

SITUATION DETECTED: The city of Rio de Janerio has post-trained a model. Based on Qwen 7/2, Rio 3.5 Open 397B adds SwiReasoning on top of the base Qwen model — a framework that dynamically switches between standard chain-of-thought and latent-space reasoning, guided by entropy-based confidence signals, so the model only "thinks out loud" when it needs to and otherwise reasons silently in hidden space for better token efficiency.

译情况检测到:里约热内卢市后训练了一个模型。 基于 Qwen 7/2,Rio 3.5 Open 397B 在基础 Qwen 模型之上添加了 SwiReasoning——一个在标准链式推理与隐空间推理之间动态切换的框架,由基于熵的置信信号引导,使模型仅在必要时"出声思考",其余时间在隐藏空间内静默推理,以提高 token 效率。

SemiAnalysis@SemiAnalysis_ · 6月14日66

DAY 0 ALERT: @MiniMax_AI M3 is now available on HuggingFace & has been added to InferenceX. The M3 architecture has ~428B parameters and ~23B activated parameters. Due to the 10x engineers from @inferact, M3 is already delivering pretty well-optimized performance on @NVIDIAAI B300 Blackwell Ultra on Day 0 @vllm_project! Furthermore, Inferact released their EAGLE3 heads, which enable even greater performance. Looking forward to Day 1, 2, and 3 performance & the team is grinding on benchmarking Day 0 MI355X performance on InferenceX too.

译MiniMax M3 模型已上线 HuggingFace 并集成至 InferenceX。M3 总参数量约 428B,激活参数约 23B。得益于 Inferact 工程支持,M3 在 NVIDIA B300 Blackwell Ultra 上通过 vLLM 实现 Day 0 优化推理。Inferact 还发布了 EAGLE3 heads 以进一步加速。团队正在 InferenceX 上基准测试 Day 0 MI355X 性能。

Chubby♨️@kimmonismus · 6月13日70

As I said before: The banning of Fable 5 was the biggest PR boost for open source models and companies.

译Kim指出,封禁Fable 5成为开源模型和公司最大的公关助推。智谱(Zhipu)随即宣布完全开源其最强模型GLM-5.2,支持实际可用的1M上下文窗口,在长程任务独立完成上保持领先,可为复杂智能体应用提供基础支持,并继续作为最强国产编程模型的主引擎。今晚5:21起,GLM-5.2将向所有GLM编程计划用户(Lite/Pro/Max)开放,API下周上线。

Rohan Paul@rohanpaul_ai · 6月13日68

Nvidia's Cosmos 3: 1 model that can understand, simulate, and act across many physical AI tasks. It treats action as a first-class language of the world. Most AI models look at reality from the outside: images become captions, videos become descriptions, and motion becomes something to label after the fact. Cosmos 3 tries to collapse that distance by putting language, image, video, audio, and action into one shared system, so a robot can connect what it sees with what might happen next and what it should do. A home robot cannot simply recognize a plate, a table, and a human instruction, because the useful question is what changes when it moves, grasps, slips, bumps, or waits. That is why the paper’s action-token design matters: it turns movement into something the model can condition on, infer from video, or generate alongside a future scene. ---- Link – arxiv. org/abs/2606.02800 Title: "Cosmos 3: Omnimodal World Models for Physical AI"

译Nvidia发布Cosmos 3——一种全模态世界模型,将语言、图像、视频、音频和动作整合到同一系统,使物理AI能跨越“理解、模拟、行动”三大任务。它把动作视为世界的第一类语言,通过动作token设计,让模型可基于视频推断动作,或同时生成未来场景及对应运动。这使机器人从“识别物体”升级为预测“移动、抓取、滑动”等交互后果。相关论文《Cosmos 3: Omnimodal World Models for Physical AI》已发布于arXiv。

Chubby♨️@kimmonismus · 6月13日64

The US government's decision was arguably the biggest PR boost for open source ever. Perhaps this will be retaliation, and Chinese open-source models can now position themselves as freedom software.

译智谱 AI 发布旗舰模型 GLM-5.2,面向所有 GLM Coding Plan 用户(Lite/Pro/Max/Team)。模型具备强大编码能力、可用 1M 上下文支持及长任务优势。API 和聊天机器人服务将于下周上线,模型也将于下周在 MIT 许可证下正式开源。该发布正值美国政府决策被视为开源最大 PR,中国开源模型可借此定位为自由软件。

Berryxia.AI@berryxia · 6月13日58

兄弟们!就说GLM 好久没有更新,应该快更新模型了。 果不其然,我们前天讨论更新的事儿。 今天就看到GLM-5.2 更新,目前先给codingPlan 的用户使用,API调用要到下周才可以支持~

译GLM-5.2作为智谱新旗舰模型,主打编码能力,支持可用的1M上下文,并在长任务上表现强劲。目前已面向所有GLM Coding Plan用户(包括Lite、Pro、Max、Team)开放,API和Chatbot服务将于下周上线。同时,该模型将于下周在MIT许可证下正式开源。

meng shao@shao__meng · 6月13日77

前沿智能不应只属于少数人,也不应被少数规则随时收回。它应该开放、可用、可构建,并服务于每一位开发者。 -- 智谱 致大洋彼岸的某厂和某政府。

译智谱(Zhipu AI)推出新旗舰模型GLM-5.2,已对GLM Coding Plan所有用户(Lite/Pro/Max/Team)开放。该模型具备强大编码能力,支持1M上下文窗口,在长周期任务中表现持续优秀。API和Chatbot服务将于下周上线,模型也将于下周以MIT许可证正式开源。智谱在声明中强调“前沿智能不应只属于少数人”,并暗讽大洋彼岸某厂商和政府,称未来AI属于开放和大众。

数字生命卡兹克@Khazix0918 · 6月13日61

千言万语汇成一句话: 国产之光,无愧于此。 GLM 5.2今晚Coding Plan上线,下周开源。

译GLM-5.2作为智谱新旗舰模型,今晚已向所有Coding Plan用户(Lite/Pro/Max/Team)开放,支持1M可用的上下文窗口,具备强大的编码能力。API和Chatbot服务将于下周推出,模型也将在下周以MIT许可证正式开源。

Z.ai@Zai_org · 6月13日73

Intelligence should be open, accessible, and ready to build with, empowering every developer, everywhere. GLM-5.2 is now available to all GLM Coding Plan users, including Lite, Pro, Max, and Team plans. http://docs.z.ai/devpack/latest-model As our new flagship model, GLM-5.2 delivers powerful coding capabilities, usable 1M-context support, and continued strengths in long-horizon tasks. API and Chatbot services will launch next week. The model will also be officially open-sourced next week under the MIT License. The future of AI is open, and it belongs to the people.

译智谱(Z.ai)发布新旗舰模型 GLM-5.2,现已对 GLM Coding Plan 用户(Lite/Pro/Max/Team 计划)开放。该模型具备强大编程能力、可用的 1M 上下文支持,并延续长程任务优势。API 和聊天机器人服务将于下周上线,模型也将于下周以 MIT 许可证正式开源。

MiniMax (official)@MiniMax_AI · 6月13日78

M3 would never 🙂‍↔️ As a matter of fact, the weights are now open, too. https://huggingface.co/MiniMaxAI/MiniMax-M3

译MiniMax 宣布其 M3 模型的权重已开源(HuggingFace 链接)。此前,Anthropic 因美国以国家安全为由发布出口管制指令,被迫立即禁用 Fable 5 和 Mythos 5 模型,禁止任何外国国民访问(包括外国员工)。MiniMax 以“M3 would never”暗讽其模型不受此类限制,并强调权重已开放。

MiniMax (official)@MiniMax_AI · 6月13日80

the kernels are doing the lord's work today, day-0 on @vllm_project, verified on nvidia and amd. go read the writeup 👇

译MiniMax 发布全新开源模型 M3,具备前沿编码、智能体能力、原生图像视频输入、Computer Use 及 1M-token 上下文窗口。核心采用 MSA 稀疏注意力架构:每个 query 仅对 128-token 的 KV 块打分,只关注 top 块,使超长上下文实际可部署。M3 在 vLLM 获 Day-0 支持,已在 NVIDIA 和 AMD 硬件验证,包括 MSA 专用 prefill/decode kernel、1M-token 上下文服务(prefix caching + chunked prefill)、BF16/MXFP8 检查点(Hopper 和 Blackwell 的 MoE 后端)、原生多模态输入,以及工具调用、推理解析和思考模式控制等功能。

Berryxia.AI@berryxia · 6月13日72

兄弟们,这几天国产模型都在疯狂更新啊! Kimi直接把coding model最烦人的“过度思考”这个毛病给治好了,2.7版比上一代少烧30% token,agent长任务成功率却反而大幅提升。 Kimi-K2.7-Code今天正式开源,Kimi Code Bench v2涨21.8%、Program Bench涨11%、MLS Bench Lite直接拉高31.5%,指令跟随和端到端完成率都明显更好。 以前大家做长horizon coding agent最头疼的就是模型越想越多、token越烧越多、最后半途而废! 现在Kimi用更高效的推理直接把这个瓶颈给砸开了,还顺手把权重和代码全扔到Hugging Face。 最狠的是他们还预告了即将到来的6x High-Speed Mode,coding效率要继续起飞。 开放API和Kimi Code今天就能用,同时开了Beta计划让开发者先试新功能。 这波更新证明了真正的coding agent进步,不是单纯堆参数,而是把“想得少但干得好”这件事做到极致。 开源之后,社区直接能把这个能力拿去魔改、组合、部署。 以前coding model总在“聪明但低效”和“高效但笨”之间摇摆,结果Kimi直接给出了第三条路。

译Kimi 发布并开源最新编码模型 Kimi-K2.7-Code。相比 K2.6,该模型在 Kimi Code Bench v2 提升 21.8%,Program Bench 提升 11%,MLS Bench Lite 提升 31.5%。核心改进是解决编码模型“过度思考”问题,推理 token 使用量降低 30%,long-horizon 编码任务的指令跟随和端到端成功率显著提升。权重与代码已上传 Hugging Face,支持通过 Kimi API 和 Kimi Code 使用,同时开放 Beta 计划。团队预告即将推出 6x High-Speed Mode,进一步提升编码效率。

SemiAnalysis@SemiAnalysis_ · 6月13日63

Congrats to @vllm_project & @lmsysorg for releasing MiniMax M3 428B on both the CUDA & ROCm stack on day 0! MiniMax M3 includes: 🟠 Block sparse attention which is 9x faster prefill over M2.7 🟠 Day 0 open MXFP8 weights 🟠 and Furthermore @Inferact released Day-0 EAGLE3 open weight draft model support Excited to try out the performance on MiniMax M3!

译祝贺 @vllm_project 和 @lmsysorg 在 CUDA 和 ROCm 堆栈上于第 0 天发布 MiniMax M3 428B!MiniMax M3 包含: 🟠 块稀疏注意力,预填充比 M2.7 快 9 倍 🟠 第 0 天开放 MXFP8 权重 🟠 此外,@Inferact 发布了第 0 天 EAGLE3 开放权重草稿模型支持 期待尝试 MiniMax M3 的性能!

karminski-牙医@karminski3 · 6月13日63

KIMI K2.7 Code 来了, K3 还会远吗? KIMI K2.7 Code 刚刚发布! 本次 K2.7-Code 是一个编程/Agent专项模型, 其中提升最大的是 kimi 自己的测试项目 kimi-code-bench-v2, 与 k2.6 相比提升了11%! 其它几个 Agent 测试项目也有不小的提升. 不过从架构上看, 其实这个模型与 K2.6 是完全一致的. 所以它是一个后训练优化版本. 于是我给大家写了个适用场景指南: 首先编程任务无疑使用这个新模型会更合适. 另外, Agentic 任务也可以尝试切换, 比如先用AI生成, 然后需要使用 Agent 进行验证的任务, 例如简历筛选, PR 审查这类需要外部 Agent 参与进行评分或者进行数据整合/格式化的的任务也很适合切换到这个新模型. 稍后有时间给大家带来详细测试! #kimik27code #kimik27

译KIMI K2.7 Code正式发布,为编程/Agent专项模型,架构与K2.6一致,属后训练优化版本。在kimi自测的kimi-code-bench-v2上较K2.6提升11%,其他Agent测试项目同样有提升。适用场景包括编程任务以及需要Agent参与的验证任务(如简历筛选、PR审查等)。

MiniMax (official)@MiniMax_AI · 6月13日82

day-0 in @vllm_project and it comes with: dedicated MSA prefill/decode kernels, 1M-context serving with prefix caching + chunked prefill, BF16 + MXFP8 on both Hopper and Blackwell 🚀 this is what open-weight done properly looks like. thanks @vllm_project, @NVIDIAAI, @AIatAMD, @inferact

译MiniMax M3 发布,具备前沿编码与智能体能力,原生图像视频输入和计算机使用,1M-token 上下文。核心采用 MSA 稀疏注意力:每个 query 评分 128-token KV 块,仅对 top 块做注意力。vLLM 当日即支持 M3,包括专用 MSA prefill/decode 核、前缀缓存与分块 prefill、BF16 和 MXFP8 检查点、Hopper 与 Blackwell 的 MoE 后端,并在 NVIDIA 与 AMD 硬件上验证。同时支持原生多模态输入、工具调用、推理解析和思考模式控制等智能体工作负载。

MiniMax (official)@MiniMax_AI · 6月13日73

With only ~428B params, and ~23B activated params M3 still handles frontier coding + long-horizon agents + native multimodal (text, image, video) at 1M-token context few open-weight models do any of this. M3 does all of it. Thanks @baseten 🚀

译MiniMax 开源 M3 模型,约 428B 总参数、23B 激活参数,支持前沿编码、长周期智能体任务及原生多模态(文本、图像、视频),上下文窗口达 1M token。开放权重,可在 Baseten 部署。在少于 500B 参数的模型中,能同时兼顾编码、智能体工作负载和 1M 上下文的模型极少,M3 全部实现。

elvis@omarsar0 · 6月13日62

Text-to-SQL might sound like a solved problem. Far from it. Data gets messy and complex really fast in the real world. Strong reasoning models are great, but nothing beats a custom model at this stuff. Gemini-SQL2 looks very strong here. BIRD is a tough benchmark. I suspect there are plenty of opportunities like this in KBs, search, graph databases, etc.

译GoogleResearch推出Gemini-SQL2,基于Gemini 3.1 Pro,在BIRD benchmark上达到Text-to-SQL的SOTA结果,能将自然语言翻译为可直接执行的SQL查询。DAIR.AI的Elvis Saravia指出,现实世界数据复杂混乱,尽管强推理模型表现不错,但定制模型(如Gemini-SQL2)在此类任务上更胜一筹。他认为在知识库、搜索、图数据库等领域也存在类似机会,BIRD是一个非常具有挑战性的基准。

🚨 AI News | TestingCatalog@testingcatalog · 6月13日48

Kimi-K2.7-Code is now available on AI/ML API 👀 > Kimi K2.7 Code is the latest agentic coding model from Kimi AI that supports extended reasoning and tool use. > AI/ML API is a single gateway to Chat, Reasoning, Image, Video, Audio, Voice, Search, and World models under one bill. Kimi K2.7 Code can be tested on both Playground and APIs.

译月之暗面最新智能体编码模型 Kimi-K2.7-Code 已在 AI/ML API 平台上线,支持扩展推理和工具使用,可通过 Playground 和 API 测试。为验证其自我修正能力(而非一次性生成),研究者让四个 Kimi 智能体运行一个 2D 飞行物理模拟,目标是从发射到入轨并让助推器着陆。四次飞行中:第一次在最大动压处解体;第二次过关但分离过早失败;第三次成功入轨但未抓住着陆船;第四次修正着陆计算后成功着陆。该过程展示了模型通过迭代闭环调试从失败中自动学习。

MiniMax (official)@MiniMax_AI · 6月13日56

means a lot coming from @NVIDIAAI free GPU-accelerated M3 endpoint are live now go try it 👇

译来自@NVIDIAAI的认可意义重大 免费GPU加速的M3端点现已上线 快来试试👇

MiniMax (official)@MiniMax_AI · 6月13日64

day-0 and already on @FireworksAI_HQ with blazing fast inference long-horizon agents, full-repo understanding, multimodal coding all in one model Try M3 today on Fireworks AI

译MiniMax M3 已在 Fireworks AI 上线,Day-0 即获最快推理端点。模型为开源权重,在 Artificial Analysis 指数排名第一。支持 512K 上下文窗口、原生图像及视频输入;采用 MSA 稀疏注意力机制,实现 9 倍更快的 prefill 与 15 倍更快的 decode。定价与 M2.7 持平。M3 将长周期智能体、全仓库理解与多模态编程集成于单一模型。

MiniMax (official)@MiniMax_AI · 6月13日69

Run M3 locally today with @UnslothAI

译MiniMax-M3 是一款拥有 428B(23B 激活)参数、1M 上下文的新开源模型,性能与 Gemini 3.1 Pro 相当。可在 138GB 内存/显存上运行动态 2-bit GGUF 版本,或 165GB 上运行 3-bit 版本。在 @UnslothAI 的帮助下,今天即可本地运行 M3。

MiniMax (official)@MiniMax_AI · 6月13日70

M3 open weight just dropped and it's live on @Modular cloud on day zero with up to a 1M-context and MSA architecture kernel-to-cloud optimization is exactly what M3 needs glad to have @Modular with us from the start

译MiniMax 发布 M3 模型开源权重,并宣布与 Modular 合作,在 Modular Cloud 上当天上线。M3 支持最高 1M-token 上下文长度,接受文本、图像、视频多模态输入,采用 MSA(Multi-Stream Attention)架构,专为长时间运行的智能体(Agent)与编码(Coding)工作负载优化。

🚨 AI News | TestingCatalog@testingcatalog · 6月13日51

NVIDIA ❤️ MiniMax MiniMax M3 weights are now available on @huggingface, and NVIDIA now offers a Free Endpoint on its platform for testing. Testing time 👀

译NVIDIA ❤️ MiniMax MiniMax M3 权重现已在 @huggingface 上发布,NVIDIA 在其平台上提供免费端点用于测试。 测试时间到 👀

Claude@claudeai · 6月12日40

Claude Fable 5 has been out for a couple of days. Some projects people have already built with it:

译Claude Fable 5 已经发布几天了。人们已经用它构建的一些项目:

Deedy@deedydas · 6月12日72

Claude 5 Fable (Ultracode) "Make a playable alpine glacial valley at sunrise" No meshes or models. Everything you see is math. Fable screenshotted its own work and iterated. Took ~30 mins, ~500k tokens, ~2500 lines of code, and ~$25. Extremely impressive.

译Claude 5 Fable (Ultracode) "在日出时制作一个可玩的高山冰川山谷" 没有网格或模型。你所看到的一切都是数学。Fable 截取了自己作品的屏幕截图并进行了迭代。 耗时约 30 分钟,约 500k tokens,约 2500 行代码,约 25 美元。极其令人印象深刻。

SenseTime@SenseTime_AI · 6月12日61

🚀 Introducing SenseNova-U1-8B-MoT-Interleaved—our newly optimized model purpose-built for interleaved text-and-image generation! Key upgrades where it matters most: ✨ 𝗡𝗮𝗿𝗿𝗮𝘁𝗶𝘃𝗲 𝗰𝗼𝗻𝘁𝗶𝗻𝘂𝗶𝘁𝘆 strengthened — coherent storytelling sustained across multiple pages 👥 𝗖𝗵𝗮𝗿𝗮𝗰𝘁𝗲𝗿 𝗰𝗼𝗻𝘀𝗶𝘀𝘁𝗲𝗻𝗰𝘆 improved — character identities and art style remain stable throughout 📝 𝗩𝗶𝘀𝘂𝗮𝗹 𝗾𝘂𝗮𝗹𝗶𝘁𝘆 elevated — cleaner text rendering and more reliable layouts with fewer artifacts Try it now 👇 https://huggingface.co/sensenova/SenseNova-U1-8B-MoT-Interleaved Showcases: https://github.com/OpenSenseNova/SenseNova-U1 Discord: https://discord.com/invite/BuTXPHmQub @huggingface @github

译商汤推出SenseNova-U1-8B-MoT-Interleaved模型,专门用于交错文本与图像生成。核心升级包括:叙事连续性增强,支持多页连贯故事;角色一致性改进,人物身份与艺术风格保持稳定;视觉质量提升,文字渲染更清晰、布局更可靠、伪影减少。模型已在HuggingFace开放体验。

MiniMax (official)@MiniMax_AI · 6月12日81

MiniMax M3, Open-Weight, Now On Hugging Face , with only ~428B parameters and ~23B activated parameters Weights: https://huggingface.co/MiniMaxAI/MiniMax-M3 MiniMax Sparse Attention: https://huggingface.co/papers/2606.13392

译MiniMax 发布开源权重模型 M3,约 428B 总参数、23B 激活参数,已上传 HuggingFace。该模型融合三种前沿能力:编码与智能体方面达 59.0% SWE-Bench Pro、66.0% Terminal Bench 2.1、34.8% SWE-fficiency、28.8% KernelBench Hard、74.2% MCP Atlas;采用 MiniMax 稀疏注意力将上下文窗口扩展至 1M token;原生多模态。同步上线 MiniMax Code 工具及 API 平台。权重与技术报告预计约 10 天后发布。

🚨 AI News | TestingCatalog@testingcatalog · 6月12日57

KIMI AI🔥: A new open-source “Kimi K2.7 Code” model has been released on APIs and Huggingface! > Improved coding & agent performance over K2.6 > Reasoning efficiency > Long-horizon coding Testing time 👀

译KIMI AI🔥: 一个新的开源“Kimi K2.7 Code”模型已在 API 和 Huggingface 上发布! > 相比 K2.6,编码与智能体性能提升 > 推理效率 > 长时域编码 测试时间 👀

X.PIN@thexpin · 6月12日72

Just attended Huawei Developer Conference 2026 in person. Huawei's "Doom Slayer," Richard Yu (Yu Chengdong), is back — this time taking over the LLM. He unveiled Huawei's new openPangu 2.0 model and was unusually candid about the shortcomings. Huawei short on its own compute. And Huawei badly needs AI talent: "We can't match internet companies on salary — the people building LLMs with us run on belief and conviction." At Huawei, when Yu gets handed a business, it's because the fight is brutally hard. And he keeps winning — phones from scratch in 2011, the Seres car partnership in 2021. In June 2025, Pangu was alleged to be highly similar to Qwen-2.5, and the responsible exec left. Yu taking over means Huawei's models are behind and need to catch up fast.

译华为开发者大会2026上,余承东正式接管华为LLM业务,发布openPangu 2.0模型。他坦诚华为自有算力不足,且AI人才招揽困难:“我们薪资拼不过互联网公司,一起做大模型的人靠信念和热情坚持。”2025年6月,旧版Pangu模型曾被指与Qwen-2.5高度相似,相关高管离职。余承东此前曾从零打造华为手机、推动赛力斯汽车合作。此次接管意味着华为模型落后,需加速追赶。

Chubby♨️@kimmonismus · 6月12日66

Moonshot just released Kimi-K2.7 code, a huge upgrade to Kimi-K2.6! Big jump over K2.6: +21.8% on Kimi Code Bench v2 +11.0% on Program Bench +31.5% on MLS Bench Lite It also uses 30% fewer reasoning tokens, follows instructions better, and improves long-horizon coding tasks. 6x High-Speed Mode is coming soon. Good to see open source competition catching up

译Moonshot 发布并开源 Kimi-K2.7-Code 编程模型,相比 K2.6 在多个基准上大幅提升:Kimi Code Bench v2 提高 21.8%,Program Bench 提高 11.0%,MLS Bench Lite 提高 31.5%。推理效率优化,推理 token 使用量降低 30%,指令遵循与长时编码任务成功率提升。即将推出 6 倍高速模式。模型现已通过 Kimi API 和 Kimi Code 开放使用。

🚨 AI News | TestingCatalog@testingcatalog · 6月12日60

KIMI AI🔥: A new open-source “Kimi K2.6 Code” model has been released on APIs and Huggingface! > Improved coding & agent performance over K2.6 > Reasoning efficiency > Long-horizon coding Testing time 👀

译KIMI AI🔥:全新开源 “Kimi K2.6 Code” 模型已在 API 及 HuggingFace 发布! > 较 K2.6 改进编码与智能体性能 > 推理效率 > 长时编码 测试时间 👀

meng shao@shao__meng · 6月12日70

Kimi 开源发布最新编码模型「Kimi-K2.7-Code」,在 K2.6 基础上针对编程 Agent 做专项优化的版本,目标很明确:长链路编码任务的成功率更高,推理 token 更少! # 三个核心改进 1. 编码:全面进步,尚未登顶 相对 K2.6,三项编码基准均有提升:Kimi Code Bench v2 +21.8%(50.9→62.0),Program Bench +11.0%,MLS Bench Lite +31.5%(涨幅最大,但绝对分仍低)。 与 GPT-5.5、Opus 4.8 比:综合编码任务差距明显缩小;MLS 与 GPT-5.5 基本持平;Program Bench 仍落后 GPT-5.5 一截。结论:稳健迭代,不是 leapfrog。 2. Agent:MCP 是亮点 Kimi Claw 24/7(长周期协作)和 MCP Atlas 均有提升,但仍落后于两大闭源模型。 MCP Mark Verified(81.1)超过 Opus 4.8(76.4) 是最有说服力的结果——覆盖 Notion、GitHub、Postgres、Playwright 等真实 MCP 环境,且经人工复核。说明 K2.7 在多工具编排上已具竞争力,GPT-5.5(92.9)仍是天花板。 3. 效率:更少 token,更高分 K2.7 不只提分,还降 reasoning token(官方称整体约 -30%): · Kimi Code Bench v2:62k→48k token,分数 51%→62% · Program Bench:176k→102k token(-42%),分数 48%→53% · MLS Bench Lite:42k→38k token,分数 27%→35% 对 Agent 的实际意义:同样预算能跑更多步,长任务更省、更稳。 # 关键技术特性 1. 强制 Thinking 模式 不支持 Instant 模式;推荐 temperature=1.0、top_p=0.95。面向复杂推理,而非快速补全。 2. Preserve Thinking(强制开启) 多轮对话中保留完整 reasoning 内容,不可关闭。对编码 Agent 很重要——模型能引用先前推理链中的中间结论,减少上下文丢失。 3. Interleaved Thinking + Multi-Step Tool Call 与 K2 Thinking 相同设计:推理与工具调用交替进行,适合「想一步、调一步、再看结果」的 Agent 循环。 4. 多模态 支持图像和视频输入(官方 API 已支持;第三方 vLLM/SGLang 部署的视频能力仍为实验性)。 开源地址: https://huggingface.co/moonshotai/Kimi-K2.7-Code

译Kimi 开源发布最新编码模型 Kimi-K2.7-Code,基于 K2.6 优化。编码基准全面提升:Kimi Code Bench v2 提高 21.8%,Program Bench +11.0%,MLS Bench Lite +31.5%。推理 token 整体降低约 30%。Agent 方面,MCP Mark Verified 得分 81.1,超过 Opus 4.8(76.4),GPT-5.5(92.9)仍为天花板。技术特性:强制 Thinking 模式、Preserve Thinking、Interleaved Thinking+多步工具调用,支持图像和视频输入。可通过 Kimi API 和 Kimi Code 使用,6x 高速模式即将推出。开源地址:HuggingFace 上的 moonshotai/Kimi-K2.7-Code。

Kimi.ai@Kimi_Moonshot · 6月12日70

🌘 Kimi-K2.7-Code, our latest coding model, is now released and open-sourced! 🔷 Improved coding & agent performance over K2.6: +21.8% on Kimi Code Bench v2, +11.0% on Program Bench, and +31.5% on MLS Bench Lite. 🔷 Reasoning efficiency: Less overthinking, with 30% lower reasoning-token usage compared to K2.6. 🔷 Long-horizon coding: Improved instruction following, higher end-to-end coding task success rates. ⚡️ 6x High-Speed Mode coming soon! 🔌 Available today via Kimi API and Kimi Code. 🔗 Kimi Code: https://kimi.com/code 🔗 API: https://platform.moonshot.ai

译Kimi 发布并开源最新代码模型 Kimi-K2.7-Code。相比 K2.6,其在 Kimi Code Bench v2 上提升 +21.8%,Program Bench 提升 +11.0%,MLS Bench Lite 提升 +31.5%。推理效率改进,推理 token 使用量降低 30%,长时编码任务中指令遵循和端到端成功率均提升。6x 高速模式即将推出,即日起可通过 Kimi API 和 Kimi Code 使用。

meng shao@shao__meng · 6月12日64

今天的华为开发者大会 HDC 2026 上,余承东宣布开源盘古全面升级,带来了 openPangu 2.0 余承东喊话会带领团队一路赶超,而在自己的字典里,没有第二,只有第一!

Alibaba Cloud@alibaba_cloud · 6月12日84

One prompt. Infinite possibilities. Meet Qwen3.7‑Max, the flagship model redefining agentic workloads that excels in frontend coding, generating rich, interactive web experiences from a single prompt, from Three.js 3D scenes to dynamic SVG graphics. Try Qwen3.7-Max — 50% Off for a Limited Time 🔗: https://int.alibabacloud.com/m/1000414100/ 🎥 Watch the video to see how Qwen3.7-Max transforms productivity.

译一个提示词,无限可能。 认识 Qwen3.7‑Max,旗舰模型重新定义智能体工作负载,在前端编码中表现出色,能从单个提示词生成丰富的交互式网页体验——从 Three.js 3D 场景到动态 SVG 图形。 立即体验 Qwen3.7-Max — 限时五折优惠 🔗: https://int.alibabacloud.com/m/1000414100/ 🎥 观看视频,了解 Qwen3.7-Max 如何提升生产力。

全部 AI 动态
AI 相关资讯全量信息流
全部一手信源资讯推文
全部模型产品行业论文技巧
6月15日
15:50
meng shao@shao__meng
23
智谱的 Codex?不,是 ZCode!
模型发布编码
6月14日
22:44
Rohan Paul@rohanpaul_ai
29
字节跳动Dreamina将推Seedance 2.0 mini

传闻字节跳动旗下Dreamina正在准备一个更小、更便宜的Seedance版本——Seedance 2.0 mini,预计6月15日发布。该版本在质量上接近Seedance 2.0,但价格大幅降低,为喜欢Seedance但担忧成本的创作者提供了更经济的选择。

模型发布
15:11
StepFun@StepFun_ai
43
Step 3.7 Flash 现已在 @DeepInfra 上线 🚀 开发者现在可以通过 DeepInfra 的 API 试用我们的开源多模态推理模型,并支持为专用工作负载部署私有端点。 专为智能体编程、工具使用、搜索和视觉工作流打造。 感谢 DeepInfra 团队!

DeepInfra: Step 3.7 Flash is Live on DeepInfra: An Agentic, Multimodal Model Built for Production

多模态推理模型发布
07:48
🚨 AI News | TestingCatalog@testingcatalog
同事件精选78
智谱发布最强开源模型GLM-5.2,面向所有GLM Coding Plan用户(Lite/Pro/Max)开放。该模型支持真正可用的100万上下文窗口,在长程任务独立完成方面保持领先,适合构建复杂AI智能体应用,也是国产最强编码模型的核心引擎。面对外部封锁限制,智谱强调科学全球性、AGI不应被高墙垄断,采取激进开源态度。GLM-5.2的开源与API预计下周同步上线。

jietang: GLM-5.2 is Fully Open, Frontier Intelligence Belongs to Everyone Today, the sudden restriction of certain frontier model...

开源生态模型发布编码
同一事件,精选展示《GLM-5.2 上线并开源:专注 Coding 与长程任务》
推荐理由:智谱发布 GLM-5.2,把 1M 上下文和强编码能力装进开源模型,在当前地缘限制下这种激进开放是难得的立场,做 agent 的值得上手一试。
06:00
Chubby♨️@kimmonismus
65
里约热内卢市政府 IT 公司开发的 Rio 3.5 Open 397B(397B 参数)开源模型达到 SOTA,性能超过阿里 Qwen 3.7。此前 Qwen 3.7 因专有立场逐渐退出前沿竞争,取而代之的是 MiniMax M3 和 Rio 3.5。该模型已上传至 HuggingFace(prefeitura-rio/Rio-3.5-Open-397B)。

Zen Magnets: Alibaba Qwen3.7 slowly fading into irrelevance at the frontier due to proprietary stance. In it's place we have Minimax ...

开源生态模型发布
04:44
SemiAnalysis@SemiAnalysis_
47
情况检测到:里约热内卢市后训练了一个模型。 基于 Qwen 7/2,Rio 3.5 Open 397B 在基础 Qwen 模型之上添加了 SwiReasoning--一个在标准链式推理与隐空间推理之间动态切换的框架,由基于熵的置信信号引导,使模型仅在必要时"出声思考",其余时间在隐藏空间内静默推理,以提高 token 效率。
推理模型发布
01:12
SemiAnalysis@SemiAnalysis_
66
MiniMax M3 上线 HuggingFace 并接入 InferenceX

MiniMax M3 模型已上线 HuggingFace 并集成至 InferenceX。M3 总参数量约 428B,激活参数约 23B。得益于 Inferact 工程支持,M3 在 NVIDIA B300 Blackwell Ultra 上通过 vLLM 实现 Day 0 优化推理。Inferact 还发布了 EAGLE3 heads 以进一步加速。团队正在 InferenceX 上基准测试 Day 0 MI355X 性能。

Hugging Face推理模型发布
6月13日
22:27
Chubby♨️@kimmonismus
70
Kim指出,封禁Fable 5成为开源模型和公司最大的公关助推。智谱(Zhipu)随即宣布完全开源其最强模型GLM-5.2,支持实际可用的1M上下文窗口,在长程任务独立完成上保持领先,可为复杂智能体应用提供基础支持,并继续作为最强国产编程模型的主引擎。今晚5:21起,GLM-5.2将向所有GLM编程计划用户(Lite/Pro/Max)开放,API下周上线。

jietang: GLM-5.2 is Fully Open, Frontier Intelligence Belongs to Everyone Today, the sudden restriction of certain frontier model...

开源生态模型发布编码
22:07
Rohan Paul@rohanpaul_ai
68
Nvidia 推出 Cosmos 3:全模态世界模型,让物理AI实现理解、模拟与行动

Nvidia发布Cosmos 3——一种全模态世界模型,将语言、图像、视频、音频和动作整合到同一系统,使物理AI能跨越“理解、模拟、行动”三大任务。它把动作视为世界的第一类语言,通过动作token设计,让模型可基于视频推断动作,或同时生成未来场景及对应运动。这使机器人从“识别物体”升级为预测“移动、抓取、滑动”等交互后果。相关论文《Cosmos 3: Omnimodal World Models for Physical AI》已发布于arXiv。

arXiv具身智能多模态模型发布
20:26
Chubby♨️@kimmonismus
64
智谱 AI 发布旗舰模型 GLM-5.2,面向所有 GLM Coding Plan 用户(Lite/Pro/Max/Team)。模型具备强大编码能力、可用 1M 上下文支持及长任务优势。API 和聊天机器人服务将于下周上线,模型也将于下周在 MIT 许可证下正式开源。该发布正值美国政府决策被视为开源最大 PR,中国开源模型可借此定位为自由软件。

Z.ai: Intelligence should be open, accessible, and ready to build with, empowering every developer, everywhere. GLM-5.2 is now...

开源生态模型发布
18:16
Berryxia.AI@berryxia
58
GLM-5.2作为智谱新旗舰模型,主打编码能力,支持可用的1M上下文,并在长任务上表现强劲。目前已面向所有GLM Coding Plan用户(包括Lite、Pro、Max、Team)开放,API和Chatbot服务将于下周上线。同时,该模型将于下周在MIT许可证下正式开源。

Z.ai: Intelligence should be open, accessible, and ready to build with, empowering every developer, everywhere. GLM-5.2 is now...

开源生态模型发布编码
17:07
meng shao@shao__meng
77
智谱(Zhipu AI)推出新旗舰模型GLM-5.2,已对GLM Coding Plan所有用户(Lite/Pro/Max/Team)开放。该模型具备强大编码能力,支持1M上下文窗口,在长周期任务中表现持续优秀。API和Chatbot服务将于下周上线,模型也将于下周以MIT许可证正式开源。智谱在声明中强调"前沿智能不应只属于少数人",并暗讽大洋彼岸某厂商和政府,称未来AI属于开放和大众。

Z.ai: Intelligence should be open, accessible, and ready to build with, empowering every developer, everywhere. GLM-5.2 is now...

开源生态模型发布编码
16:46
数字生命卡兹克@Khazix0918
61
GLM-5.2作为智谱新旗舰模型,今晚已向所有Coding Plan用户(Lite/Pro/Max/Team)开放,支持1M可用的上下文窗口,具备强大的编码能力。API和Chatbot服务将于下周推出,模型也将在下周以MIT许可证正式开源。

Z.ai: Intelligence should be open, accessible, and ready to build with, empowering every developer, everywhere. GLM-5.2 is now...

开源生态模型发布编码
16:14
Z.ai@Zai_org
73
智谱 GLM-5.2 旗舰模型发布:1M 上下文、下周开源

智谱(Z.ai)发布新旗舰模型 GLM-5.2,现已对 GLM Coding Plan 用户(Lite/Pro/Max/Team 计划)开放。该模型具备强大编程能力、可用的 1M 上下文支持,并延续长程任务优势。API 和聊天机器人服务将于下周上线,模型也将于下周以 MIT 许可证正式开源。

开源生态模型发布编码
关联讨论 8 条公众号:智谱(GLM)Hacker News 热门(buzzing.cc 中文翻译)X:硅基流动 SiliconFlow (@SiliconFlowAI)Simon Willison 博客The Decoder:AI News(RSS)Nathan Lambert:Interconnects(RSS)智谱:研究(网页内嵌数据)Hugging Face:Blog(RSS)
12:15
MiniMax (official)@MiniMax_AI
78
MiniMax 宣布其 M3 模型的权重已开源(HuggingFace 链接)。此前,Anthropic 因美国以国家安全为由发布出口管制指令,被迫立即禁用 Fable 5 和 Mythos 5 模型,禁止任何外国国民访问(包括外国员工)。MiniMax 以"M3 would never"暗讽其模型不受此类限制,并强调权重已开放。

Anthropic: The US government, citing national security authorities, has issued an export control directive to suspend all access to...

Hugging Face开源生态模型发布
关联讨论 12 条X:MiniMax (@MiniMax_AI)MiniMax:Blog(网页)X:Kim (@kimmonismus)X:Testing Catalog (@testingcatalog)HuggingFace Daily Papers(社区热门论文)公众号:MiniMax(稀宇科技)X:OpenRouter (@OpenRouter)X:karminski (@karminski3)X:硅基流动 SiliconFlow (@SiliconFlowAI)X:歸藏 (@op7418)MarkTechPost(RSS)IT之家(RSS)
10:45
MiniMax (official)@MiniMax_AI
80
MiniMax 发布全新开源模型 M3,具备前沿编码、智能体能力、原生图像视频输入、Computer Use 及 1M-token 上下文窗口。核心采用 MSA 稀疏注意力架构:每个 query 仅对 128-token 的 KV 块打分,只关注 top 块,使超长上下文实际可部署。M3 在 vLLM 获 Day-0 支持,已在 NVIDIA 和 AMD 硬件验证,包括 MSA 专用 prefill/decode kernel、1M-token 上下文服务(prefix caching + chunked prefill)、BF16/MXFP8 检查点(Hopper 和 Blackwell 的 MoE 后端)、原生多模态输入,以及工具调用、推理解析和思考模式控制等功能。

vLLM: 🎉 Congrats to @MiniMax_AI on releasing MiniMax M3! Frontier coding and agentic capabilities, native image and video inp...

多模态开源生态推理模型发布
关联讨论 12 条X:MiniMax (@MiniMax_AI)MiniMax:Blog(网页)X:Kim (@kimmonismus)X:Testing Catalog (@testingcatalog)HuggingFace Daily Papers(社区热门论文)公众号:MiniMax(稀宇科技)X:OpenRouter (@OpenRouter)X:karminski (@karminski3)X:硅基流动 SiliconFlow (@SiliconFlowAI)X:歸藏 (@op7418)MarkTechPost(RSS)IT之家(RSS)
09:14
Berryxia.AI@berryxia
72
Kimi 开源编码模型 Kimi-K2.7-Code,解决过度思考问题

Kimi 发布并开源最新编码模型 Kimi-K2.7-Code。相比 K2.6,该模型在 Kimi Code Bench v2 提升 21.8%,Program Bench 提升 11%,MLS Bench Lite 提升 31.5%。核心改进是解决编码模型“过度思考”问题,推理 token 使用量降低 30%,long-horizon 编码任务的指令跟随和端到端成功率显著提升。权重与代码已上传 Hugging Face,支持通过 Kimi API 和 Kimi Code 使用,同时开放 Beta 计划。团队预告即将推出 6x High-Speed Mode,进一步提升编码效率。

Kimi.ai: 🌘 Kimi-K2.7-Code, our latest coding model, is now released and open-sourced! 🔷 Improved coding & agent performance ove...

智能体模型发布编码
08:07
SemiAnalysis@SemiAnalysis_
63
祝贺 @vllm_project 和 @lmsysorg 在 CUDA 和 ROCm 堆栈上于第 0 天发布 MiniMax M3 428B!MiniMax M3 包含: 🟠 块稀疏注意力,预填充比 M2.7 快 9 倍 🟠 第 0 天开放 MXFP8 权重 🟠 此外,@Inferact 发布了第 0 天 EAGLE3 开放权重草稿模型支持 期待尝试 MiniMax M3 的性能!
开源生态推理模型发布部署/工程
07:14
karminski-牙医@karminski3
63
KIMI K2.7 Code发布,编程/Agent专项模型

KIMI K2.7 Code正式发布,为编程/Agent专项模型,架构与K2.6一致,属后训练优化版本。在kimi自测的kimi-code-bench-v2上较K2.6提升11%,其他Agent测试项目同样有提升。适用场景包括编程任务以及需要Agent参与的验证任务(如简历筛选、PR审查等)。

智能体模型发布编码
05:43
MiniMax (official)@MiniMax_AI
同事件精选82
MiniMax M3 发布,具备前沿编码与智能体能力,原生图像视频输入和计算机使用,1M-token 上下文。核心采用 MSA 稀疏注意力:每个 query 评分 128-token KV 块,仅对 top 块做注意力。vLLM 当日即支持 M3,包括专用 MSA prefill/decode 核、前缀缓存与分块 prefill、BF16 和 MXFP8 检查点、Hopper 与 Blackwell 的 MoE 后端,并在 NVIDIA 与 AMD 硬件上验证。同时支持原生多模态输入、工具调用、推理解析和思考模式控制等智能体工作负载。

vLLM: 🎉 Congrats to @MiniMax_AI on releasing MiniMax M3! Frontier coding and agentic capabilities, native image and video inp...

多模态开源生态推理模型发布
同一事件,精选展示《MiniMax M3:前沿编码、100万token上下文与原生多模态一体模型》
推荐理由:M3把1M上下文从‘理论上能做’变成了‘今天就能部署’,MSA稀疏注意力是关键,开源社区和推理框架的深度合作值得关注。
05:13
MiniMax (official)@MiniMax_AI
73
MiniMax 开源 M3 模型,约 428B 总参数、23B 激活参数,支持前沿编码、长周期智能体任务及原生多模态(文本、图像、视频),上下文窗口达 1M token。开放权重,可在 Baseten 部署。在少于 500B 参数的模型中,能同时兼顾编码、智能体工作负载和 1M 上下文的模型极少,M3 全部实现。

Baseten: Congrats to the MiniMax team on the open-source launch of M3! There are very few <500bn parameter models that can tackle...

多模态模型发布编码
04:38
elvis@omarsar0
62
GoogleResearch推出Gemini-SQL2,基于Gemini 3.1 Pro,在BIRD benchmark上达到Text-to-SQL的SOTA结果,能将自然语言翻译为可直接执行的SQL查询。DAIR.AI的Elvis Saravia指出,现实世界数据复杂混乱,尽管强推理模型表现不错,但定制模型(如Gemini-SQL2)在此类任务上更胜一筹。他认为在知识库、搜索、图数据库等领域也存在类似机会,BIRD是一个非常具有挑战性的基准。

Google Research: 🚀 Introducing Gemini-SQL2, our breakthrough text-to-SQL capability powered by Gemini 3.1 Pro! We've achieved state-of-t...

Google数据/训练模型发布
04:13
🚨 AI News | TestingCatalog@testingcatalog
48
月之暗面最新智能体编码模型 Kimi-K2.7-Code 已在 AI/ML API 平台上线,支持扩展推理和工具使用,可通过 Playground 和 API 测试。为验证其自我修正能力(而非一次性生成),研究者让四个 Kimi 智能体运行一个 2D 飞行物理模拟,目标是从发射到入轨并让助推器着陆。四次飞行中:第一次在最大动压处解体;第二次过关但分离过早失败;第三次成功入轨但未抓住着陆船;第四次修正着陆计算后成功着陆。该过程展示了模型通过迭代闭环调试从失败中自动学习。

AI/ML API: Kimi K2.7-Code is now available on AI/ML API! Moonshot's latest is built for long-horizon agentic coding that self-corre...

智能体模型发布编码
03:43
MiniMax (official)@MiniMax_AI
56
来自@NVIDIAAI的认可意义重大 免费GPU加速的M3端点现已上线 快来试试👇

NVIDIA AI: Congrats to the @MiniMax_AI team on the release of MiniMax M3, a long-context multimodal model for text, image, and vide...

多模态模型发布视频
03:13
MiniMax (official)@MiniMax_AI
64
MiniMax M3 已在 Fireworks AI 上线,Day-0 即获最快推理端点。模型为开源权重,在 Artificial Analysis 指数排名第一。支持 512K 上下文窗口、原生图像及视频输入;采用 MSA 稀疏注意力机制,实现 9 倍更快的 prefill 与 15 倍更快的 decode。定价与 M2.7 持平。M3 将长周期智能体、全仓库理解与多模态编程集成于单一模型。

Fireworks AI: MiniMax M3 is live on Fireworks. Day-0, fastest endpoint for the MiniMax series. → Top open-weight model on the Artifici...

智能体多模态推理模型发布
02:43
MiniMax (official)@MiniMax_AI
69
MiniMax-M3 是一款拥有 428B(23B 激活)参数、1M 上下文的新开源模型,性能与 Gemini 3.1 Pro 相当。可在 138GB 内存/显存上运行动态 2-bit GGUF 版本,或 165GB 上运行 3-bit 版本。在 @UnslothAI 的帮助下,今天即可本地运行 M3。

Unsloth AI: MiniMax M3 can now be run locally!🔥 MiniMax-M3 is a new 428B (23B active) open model with 1M context that performs on p...

Hugging Face开源生态模型发布
00:43
MiniMax (official)@MiniMax_AI
70
MiniMax 发布 M3 模型开源权重,并宣布与 Modular 合作,在 Modular Cloud 上当天上线。M3 支持最高 1M-token 上下文长度,接受文本、图像、视频多模态输入,采用 MSA(Multi-Stream Attention)架构,专为长时间运行的智能体(Agent)与编码(Coding)工作负载优化。

Modular: M3 open weights from @MiniMax_AI just dropped, and Modular is a Day Zero launch partner. 1M-token context. Text, image, ...

智能体多模态开源/仓库模型发布
00:42
🚨 AI News | TestingCatalog@testingcatalog
51
NVIDIA ❤️ MiniMax MiniMax M3 权重现已在 @huggingface 上发布,NVIDIA 在其平台上提供免费端点用于测试。 测试时间到 👀

NVIDIA AI: Congrats to the @MiniMax_AI team on the release of MiniMax M3, a long-context multimodal model for text, image, and vide...

Hugging Face多模态开源/仓库模型发布
6月12日
23:54
Claude@claudeai
40
Claude Fable 5 已经发布几天了。人们已经用它构建的一些项目:
Anthropic模型发布编码
23:32
Deedy@deedydas
72
Claude 5 Fable (Ultracode) "在日出时制作一个可玩的高山冰川山谷" 没有网格或模型。你所看到的一切都是数学。Fable 截取了自己作品的屏幕截图并进行了迭代。 耗时约 30 分钟,约 500k tokens,约 2500 行代码,约 25 美元。极其令人印象深刻。
Anthropic多模态模型发布编码
22:34
SenseTime@SenseTime_AI
61
商汤SenseNova-U1-8B-MoT-Interleaved发布

商汤推出SenseNova-U1-8B-MoT-Interleaved模型,专门用于交错文本与图像生成。核心升级包括:叙事连续性增强,支持多页连贯故事;角色一致性改进,人物身份与艺术风格保持稳定;视觉质量提升,文字渲染更清晰、布局更可靠、伪影减少。模型已在HuggingFace开放体验。

图像生成多模态开源/仓库模型发布
22:12
MiniMax (official)@MiniMax_AI
同事件精选81
MiniMax 发布开源权重模型 M3,约 428B 总参数、23B 激活参数,已上传 HuggingFace。该模型融合三种前沿能力:编码与智能体方面达 59.0% SWE-Bench Pro、66.0% Terminal Bench 2.1、34.8% SWE-fficiency、28.8% KernelBench Hard、74.2% MCP Atlas;采用 MiniMax 稀疏注意力将上下文窗口扩展至 1M token;原生多模态。同步上线 MiniMax Code 工具及 API 平台。权重与技术报告预计约 10 天后发布。

MiniMax (official): Introducing MiniMax M3: The First Open-Weights Model to Combine Three Frontier Capabilities - Coding & Agentic Frontier:...

Hugging Face多模态推理模型发布
同一事件,精选展示《MiniMax M3:前沿编码、100万token上下文与原生多模态一体模型》
推荐理由:开放权重模型首次把编码 Agent 和多模态拉满,SWE-bench Pro 59% 逼近专有前沿,附带稀疏注意力 1M 上下文。做代码工具和 Agent 的团队应该都盯上它了。
21:41
🚨 AI News | TestingCatalog@testingcatalog
57
KIMI AI🔥: 一个新的开源"Kimi K2.7 Code"模型已在 API 和 Huggingface 上发布! > 相比 K2.6,编码与智能体性能提升 > 推理效率 > 长时域编码 测试时间 👀

Kimi.ai: 🔗 Weights & code: https://huggingface.co/moonshotai/Kimi-K2.7-Code

Hugging Face开源生态推理模型发布
21:28
X.PIN@thexpin
72
余承东发布华为openPangu 2.0,坦诚AI短板

华为开发者大会2026上,余承东正式接管华为LLM业务,发布openPangu 2.0模型。他坦诚华为自有算力不足,且AI人才招揽困难:“我们薪资拼不过互联网公司,一起做大模型的人靠信念和热情坚持。”2025年6月,旧版Pangu模型曾被指与Qwen-2.5高度相似,相关高管离职。余承东此前曾从零打造华为手机、推动赛力斯汽车合作。此次接管意味着华为模型落后,需加速追赶。

开源生态模型发布
21:20
Chubby♨️@kimmonismus
66
Moonshot 发布并开源 Kimi-K2.7-Code 编程模型,相比 K2.6 在多个基准上大幅提升:Kimi Code Bench v2 提高 21.8%,Program Bench 提高 11.0%,MLS Bench Lite 提高 31.5%。推理效率优化,推理 token 使用量降低 30%,指令遵循与长时编码任务成功率提升。即将推出 6 倍高速模式。模型现已通过 Kimi API 和 Kimi Code 开放使用。

Kimi.ai: 🌘 Kimi-K2.7-Code, our latest coding model, is now released and open-sourced! 🔷 Improved coding & agent performance ove...

开源生态推理模型发布编码
21:11
🚨 AI News | TestingCatalog@testingcatalog
60
KIMI AI🔥:全新开源 "Kimi K2.6 Code" 模型已在 API 及 HuggingFace 发布! > 较 K2.6 改进编码与智能体性能 > 推理效率 > 长时编码 测试时间 👀

Kimi.ai: 🔗 Weights & code: https://huggingface.co/moonshotai/Kimi-K2.7-Code

开源/仓库模型发布编码
19:32
meng shao@shao__meng
70
Kimi 开源发布编码模型 Kimi-K2.7-Code

Kimi 开源发布最新编码模型 Kimi-K2.7-Code,基于 K2.6 优化。编码基准全面提升:Kimi Code Bench v2 提高 21.8%,Program Bench +11.0%,MLS Bench Lite +31.5%。推理 token 整体降低约 30%。Agent 方面,MCP Mark Verified 得分 81.1,超过 Opus 4.8(76.4),GPT-5.5(92.9)仍为天花板。技术特性:强制 Thinking 模式、Preserve Thinking、Interleaved Thinking+多步工具调用,支持图像和视频输入。可通过 Kimi API 和 Kimi Code 使用,6x 高速模式即将推出。开源地址:HuggingFace 上的 moonshotai/Kimi-K2.7-Code。

Kimi.ai: 🌘 Kimi-K2.7-Code, our latest coding model, is now released and open-sourced! 🔷 Improved coding & agent performance ove...

智能体开源生态推理模型发布
18:24
Kimi.ai@Kimi_Moonshot
同事件精选70
Kimi 发布并开源最新代码模型 Kimi-K2.7-Code

Kimi 发布并开源最新代码模型 Kimi-K2.7-Code。相比 K2.6,其在 Kimi Code Bench v2 上提升 +21.8%,Program Bench 提升 +11.0%,MLS Bench Lite 提升 +31.5%。推理效率改进,推理 token 使用量降低 30%,长时编码任务中指令遵循和端到端成功率均提升。6x 高速模式即将推出,即日起可通过 Kimi API 和 Kimi Code 使用。

开源生态推理模型发布编码
同一事件,精选展示《6倍速!Kimi K2.7 Code 高速版已上线》
推荐理由:月之暗面这次把编码模型做到 K2.7 还直接开源,Bench 提升不小,关键是把「想太多」的毛病治了,推理 token 省了三成,做 coding agent 的可以立刻换上试试。
18:01
meng shao@shao__meng
64
今天的华为开发者大会 HDC 2026 上,余承东宣布开源盘古全面升级,带来了 openPangu 2.0 余承东喊话会带领团队一路赶超,而在自己的字典里,没有第二,只有第一!
开源生态模型发布
15:38
Alibaba Cloud@alibaba_cloud
同事件精选84
一个提示词,无限可能。 认识 Qwen3.7-Max,旗舰模型重新定义智能体工作负载,在前端编码中表现出色,能从单个提示词生成丰富的交互式网页体验--从 Three.js 3D 场景到动态 SVG 图形。 立即体验 Qwen3.7-Max - 限时五折优惠 🔗: https://int.alibabacloud.com/m/1000414100/ 🎥 观看视频,了解 Qwen3.7-Max 如何提升生产力。
智能体模型发布编码
同一事件,精选展示《Qwen3.7-Max:面向智能体时代的最新专有模型》
推荐理由:Qwen3.7‑Max不只是参数升级,它主打从单个prompt直接生成可交互网页,Three.js 3D场景都不在话下,做前端或agent的可以认真看看,这方向比刷榜有意思。
‹ 上一页
1…56789…25
下一页 ›