AIHOT
内容
精选全部 AI 动态AI 日报主题收藏
接入
Agent 接入
更多
关于更新日志反馈
内部员工登录
精选全部日报更多
内部员工登录
全部动态X · 796 条
全部一手资讯X论文
标签「开源生态」清除
Ant Ling@AntLingAGI · 6月16日77

Ling & Ring 2.6 technical report is out, with two open-weight base models. We co-design model + system across architecture, training, and agentic capability: • 7:1 hybrid linear attention • KPop for stable agentic RL: SWE-bench Verified 76.28% • ~4× token efficiency

译Ling & Ring 2.6 技术报告发布,带来两款开放权重基座模型。 我们通过架构、训练和智能体能力的协同设计,共同优化模型与系统: • 7:1 混合线性注意力 • 用于稳定智能体强化学习的 KPop:SWE-bench Verified 76.28% • 约 4 倍 token 效率

ginobefun@hongming731 · 6月16日56

BestBlogs 早报 · 06-16 # Loop Engineering / AI Agent 工具设计 / Token 成本控制 / Claude Fable 5 / Scaling Law [1] ★ 精讲|一篇搞懂 AI Coding Agent 的 Token 成本控制 这篇文章把“Token 都烧在哪”讲透了:真正的账单大头不是你打的那几十个字,而是系统每轮自动带上的系统提示词、Skill、工具定义和会话历史——所谓“它记得”,本质是系统在一遍遍重复提醒模型。给出的优化路径也很朴素:一个 Session 只做一件事,长会话及时压缩,按任务给模型分档,把高频内容做成稳定前缀吃满 Prompt Cache。省钱的关键不是少问一句话,而是让系统别重复搬运同一批上下文。 来源:腾讯技术工程 https://www.bestblogs.dev/article/8b9392aa [2] ★ 精讲|AI 智能体工具设计:有效与无效的模式 - http://MachineLearningMastery.com 这篇文章把 AI Agent 翻车的锅,从「模型不够聪明」甩回「工具设计太糙」:单一职责工具优于万能 action 参数,用枚举和强约束 schema 堵住模型瞎猜,错误返回要带 recoverable 字段和下一步建议而不是甩一坑日志,写操作必须有幂等键,危险操作要拆成两步确认。核心判断很朴素——模型只能基于你给的接口推理,接口含糊,失败就是必然,不是偶然。 来源:Hacker News - Newest: "AI Agent" https://www.bestblogs.dev/article/963dda4c [3] ★ 精讲|Codex 和 Claude Code 负责人都不写提示词了,AI 圈爆火的 Loop 到底是什么 「循环工程」最近被吹成新范式,但文章先把热闹拆开看:技术上不算新发明,过去的 Harness、Skill、Agent 工作流早就在做,真正变化的是模型终于能把循环连续跑下去——人从写提示词退到定规则:何时启动、工具边界、出错怎么判断、记录在哪、何时收手交回人。结合另一篇用 OKR 和古德哈特定律拆解循环工程的长文,它更像一套管理制度:值不值得搭,取决于任务是否真反复、Token 预算够不够,而非这个新名字。 来源:APPSO https://www.bestblogs.dev/article/24d7bb20 [4] Scaling Law 的真相,藏在那些「没用」的参数里|Hao 好聊趋势 本文深入剖析大模型参数冗余现象,论证看似「空转」的参数在训练、推理和后训练阶段分别扮演隔离空间、数值泄压、计算骨架和可塑性储备四种关键角色,并指出 Scaling Law 的边际收益正流向 benchmark 无法测量的长尾与多步推理能力。 来源:腾讯科技 https://www.bestblogs.dev/article/23d850ea [5] GlobalGPT 李焕之:零融资、套壳产品千万美金 ARR 后,我找到了创业的 mission GlobalGPT 创始人李焕之分享从零融资套壳产品做到千万美金 ARR 的创业历程,并阐述其从「先活下来」到回归初心、打造服务型 AI 产品 Yukie 的思考。 来源:Founder Park https://www.bestblogs.dev/article/ed22a9ae [6] 上线只活了 180 天,AI 应用层的泡沫被戳破了 本文以 Sora、http://Yupp.ai 等应用关停为引,分析 AI 应用层泡沫破裂的深层原因,指出真正活下来的产品已从单点功能转向超级入口、高频场景和 Agent 化工作流。 来源:腾讯科技 https://www.bestblogs.dev/article/0f79cbbc [7] Fable 5 禁令始末:Anthropic 亲手写下的剧本,反过来演了它自己 本文深度复盘 Anthropic 旗舰模型 Fable 5 遭美国政府出口管制禁令事件,揭示其背后技术争议、政治博弈与深层反讽,并探讨 AI 治理中权力制衡的核心命题。 来源:十字路口 Crossing https://www.bestblogs.dev/article/369a0323 [8] 做了 6 年智能眼镜后,夏勇峰按下暂停键:为 AI 造硬件而非为硬件加 AI 蜂巢科技创始人夏勇峰基于对 AI 大模型趋势的判断,暂停了已占市场 10%份额的智能眼镜业务,转向「为 AI 造硬件」的新方向,核心是让硬件成为 AI 进入现实世界的最小载体,而非在硬件上叠加 AI。 来源:虎嗅 https://www.bestblogs.dev/article/70638b9b [9] SpaceX 登陆纳斯达克市值超 2 万亿美元,殖民火星使命驱动 24 年崛起史 本文通过实地探访 SpaceX 总部与星舰基地,结合前高管访谈,完整回顾了 SpaceX 从猎鹰 1 号三次失败到星舰成功回收、星链盈利、国防业务崛起的 24 年发展史,并解析其殖民火星的终极使命。 来源:虎嗅 https://www.bestblogs.dev/article/15fef79e [10] 把 18 亿颗星星画在一张图上,能还原我们拍到的银河吗? 本文利用盖亚卫星 18 亿颗恒星数据,通过逐步引入点扩散函数、暗星光度代理、黑体辐射色温校准和韦伯阈值等物理与生理学原理,模拟出逼真的银河图像,并在此过程中揭示了星空视觉形态背后的关键科学原理。 来源:Computing Life https://www.bestblogs.dev/article/2c2192f7 --- http://BestBlogs.dev · 发现真正适合你的高质量内容 BestBlogs 是 AI 驱动的私人阅读助手,帮助你建立稳定、可信、个性化的高质量信息输入。 关注你感兴趣的来源和主题,每天生成一份更适合自己的「我的早报」。 在线阅读:https://www.bestblogs.dev/explore/brief/2026-06-16

译BestBlogs精选10篇AI行业文章:Token成本控制大头在系统提示词、Skill和会话历史;AI Agent工具设计强调单一职责、强约束schema、幂等键;循环工程(Loop)作为新范式让模型连续跑规则;Scaling Law参数空转扮演骨架角色;GlobalGPT零融资做到千万美金ARR;AI应用层泡沫破裂,Sora等180天关停;Anthropic旗舰模型Fable 5遭美国政府出口管制禁令;夏勇峰暂停智能眼镜业务转向“为AI造硬件”;SpaceX登陆纳斯达克市值超2万亿美元;利用盖亚卫星18亿颗恒星数据模拟银河图像。

Nathan Lambert@natolambert · 6月16日22

Open-science is the only thing that really needs to prevail. Good post. If only there was someone I knew building an institution like this.

译开放科学才是真正需要盛行的。好文章。 要是我认识某个正在建立这类机构的人就好了。

宝玉@dotey · 6月16日73

《图解Skill》配套 Repo 里面带的一个我日常用来整理写作 AI 资讯的 Skill:info-digest Skill 就是我日常看到一些 AI 资讯、新闻,就把内容贴进去让它生成资讯,发到 X 和微博。默认是用 Claude 网页 + Opus 4.6。你看我发的大部分 AI 资讯的初稿都是出自它之手,当然我还会人工校验微调一下。 这套 Skill 的提示词还是有一些可以借鉴的地方 1. 是站在读者关心的角度去写 我在写作路上犯的一个错误就是自嗨型写作,只顾自己表达,而不是看目标读者是谁,读者需要什么想看什么。 2. 联网检索做事实核查 另一个容易翻车的地方就是资讯本身是有问题的,一不小心就可能会中招闹笑话,所以让 AI 辅助联网检索验证是有必要的,去做一些事实核查可以避免很多错误。 这也是为什么我是用 Claude 网页版,因为联网检索能力相对更好一些 3. 交代清楚背景信息 这个和第一点有点相关,也是要站在目标读者的角度,看里面的一些概念读者是否知道,这件事是否讲清楚了来龙去脉。 4. 生成格式 因为这个 Skill 生成的内容我是用来发 X 和微博的,而这两个平台就是默认用纯文本,而且篇幅不易过长,所以就需要内容短一点、精炼一点,开头有吸引力一点,以及纯文本格式。 完整内容可以参考: https://github.com/JimLiu/Illustrated-Agent-Skills/blob/main/skills/info-digest/SKILL.md

译宝玉(@dotey)公开了《图解Skill》配套GitHub仓库中的info-digest Skill,用于日常整理AI资讯并生成推文初稿,默认调用Claude网页版+Opus 4.6。核心提示词技巧:1)站在读者角度写作;2)联网检索做实核查;3)交代背景信息;4)生成短而精炼的纯文本格式。该Skill为项目库JimLiu/Illustrated-Agent-Skills的一部分。同步有抽奖活动(转发/引用/评论抽10人,本周五中午12点,使用Grok抽奖)。

elvis@omarsar0 · 6月16日73

I just open-sourced my /learn skill. Learn anything with agents and HTML artifacts. I have been learning about all kinds of topics with it. Install the skill and interact with any agent to help you through any topic. Ask it to generate visual and interactive artifacts and help you go deeper or generate knowledge checks (e.g., quizzes). Upskilling myself on any topic is one of the most impactful ways I have been able to use AI agents. If you are a DAIR Academy pro member, you can use it with our AI Builder. Skill: https://github.com/dair-ai/dair-academy-plugins Try now: https://academy.dair.ai/

译DAIR AI 创始人 Elvis Saravia 开源 /learn skill,允许用户通过 AI 智能体和 HTML artifacts 学习任意主题。该 skill 可安装后与任何 Agent 交互,生成视觉化、交互式的 artifact,帮助深入理解或生成知识检测(如测验)。支持 DAIR Academy pro 会员在 AI Builder 中使用。GitHub 链接及试用平台已开放。

凡人小北@frxiaobei · 6月15日62

未来已经发生了: 一条 GitHub issue,从发现 bug 到修复 merge,全程是 Agent 在对接。 组织视角, 这是 AI native 最真实的样子,默认执行者已经不是人了。 经济视角, 这是 Agent 经济最好的例子,干活的全是 bot,人在两头。 人类视角…… 人类负责决策,贡献一个 OK。🌚

译开发者@JeffreyCalm分享经历:他将GitHub链接交给Codex部署,发现Bug后Codex自动提Issue。官方仓库的Code Review Bot确认Bug并At Hotfix Bot,后者30分钟内提交修复PR,最后At真人开发者。真人仅回复“OK”即完成Merge。全程人类零编码,仅贡献一个决策确认,折射出Agent经济与A2A平台雏形。

Kimi.ai@Kimi_Moonshot · 6月15日51

🌘 Meet Kimi K2.7 Code HighSpeed! A high-speed mode of our latest open-source multimodal coding model, Kimi K2.7 Code. ⚡️ Up to 6× faster: Around 180 tok/s on coding tasks with median-length inputs, and up to 260 tok/s on shorter-context tasks. 🔷 Rolling out to Kimi Code Beta Program members, Kimi API developers, and Kimi Business users. (Access will remain limited for now due to capacity constraints.) 🔷 No invite needed. Anyone who joins the Beta Program has a chance to get access 👉 https://www.kimi.com/code/beta Open intelligence should be instant, affordable, and borderless. We'll continue improving the model and expanding access as more capacity becomes available! 🔗 Kimi Code: https://kimi.com/code 🔗 API: https://platform.kimi.ai/

译Kimi 开源多模态编程模型 Kimi K2.7 Code 推出高速模式 HighSpeed,编码任务中长输入可达约 180 tok/s,短上下文任务最高 260 tok/s,速度提升最多 6 倍。该模式已向 Kimi Code Beta Program 成员、API 开发者及商业用户开放(容量有限),无需邀请,加入 Beta 计划即有机会获得访问权限。Kimi 表示将继续优化模型并扩大接入。

Berryxia.AI@berryxia · 6月15日60

一个12B的本地模型,直接把Fable 5的推理链条蒸馏进去了,现在你能在消费级显卡上离线跑顶级coding能力。 这个Gemma 4 12B Coder GGUF是基于Google的gemma-4-12B-it微调的,专门针对代码生成和复杂推理。 训练数据里用了Composer 2.5的真实通过案例,还让Fable 5帮着补全那些难搞的case,结果就是每一步推理都导向能真正跑通的代码。 最爽的是它走GGUF格式,12GB显卡就能顺畅跑,甚至CPU也能用。 调试、补全代码、生成复杂算法、做链式思考提示,全都本地搞定,不用交API费、不用担心导出管制。 以前大家觉得前沿模型要么云端用要么根本跑不了,现在开源社区直接把Fable 5的思考方式打包成能塞进你笔记本的版本。 模型还在快速迭代,下载量已经破六千,社区反馈它在本地coding场景里特别能打。 这波操作把“强大但受限”和“本地可用”之间的鸿沟给填上了。 真正的AI生产力,从来不是等大厂放行,而是社区自己动手把能力解放出来。

译Berry Xia 介绍了基于 Google gemma-4-12B-it 微调的 Gemma 4 12B Coder GGUF 模型。它将 Fable 5 的推理链条蒸馏进 12B 参数模型,训练数据使用 Composer 2.5 真实通过案例并由 Fable 5 辅助补全。GGUF 格式让模型在 12GB 消费级显卡即可本地运行,甚至支持 CPU。模型专为代码生成、调试、复杂算法、链式思考提示等任务优化,无需 API 费用且无导出限制。该模型基于 Google 最新 gemma-4 架构,目前下载量已破六千,社区反馈其在本地 coding 场景表现出色,填补了云端模型与本地可用之间的鸿沟。

ginobefun@hongming731 · 6月15日33

快来参与@dotey 老师的抽奖 想要签名版 😃

译@dotey 为回馈读者举办《图解 Skill —— AI 提效实战指南》抽奖活动。抽 10 人,北京时间本周五中午 12 点开奖。转发、引用、评论即可参与,中奖可选实体书(仅内地地址)或电子书。作者借助 Grok 抽奖并提醒防范提示词注入。已购书用户可访问配套 GitHub 项目库(JimLiu/Illustrated-Agent-Skills),内含 interview-analysis、info-digest 等实用 Skills。

karminski-牙医@karminski3 · 6月15日53

27B小模型挑战Fable 5? 还成功了? 劲爆消息, 在 Iterative-Contextual-Refinements 这个框架的加持下, Qwen3.6-27B 跑分超过了 Anthropic Fable5! 真的不是做梦吗? 还是跑分没输过, 实战没赢过? 于是赶紧看了一下这个框架, 发现设计的很有启发性, 能学到很多东西, 给大家详细讲下. 这个框架主要提升的是软件性能优化, 即如何才能让代码性能更高. 大家如果还记得我那个 vector-db-bench, 给大模型提供了火焰图, perf, 各种测试 tool_call 让大模型自己迭代去优化代码性能. 而这个框架更进了一步, 它瞄准了小模型的最核心弱点, 参数量不足导致的"脑残", 即小模型更容易长上下文衰退或陷入局部最优. 于是这个框架出手了, 先针对技术方案, 它搞了个BFS探索模式, 在写代码的 plan 过程, 让小模型自己提出多种解决方案, 比如写个字符串匹配, 小模型直接搞了个O(N^2)的暴力搜索, 而这一步它的Agent会让小模型思考, 你能想到哪些可能的解决方案? 于是就拓展了小模型的视野, KMP, 滑动窗口等技术方案没准就出来了. 然后就是写代码的过程中使用的DFS模式, 它会借助Agent让小模型借助代码性能测试工具不断跑分, 然后让小模型反思, 有哪些性能热点可以优化, 然后进行优化. 最后, 他还有个统筹全局的路由, 不但负责在BFS/DFS过程中选取最佳的技术方案, 而且还会在DFS过程中, 总结模型优化过程中面临的问题, 再反馈到BFS过程, 告诉模型, 需要注意xxx优化是有价值的, xxx优化面临xxx问题. 从而形成优化闭环, 解决掉模型陷入死胡同不断仰卧起坐的问题. 最后, 在框架加持下, Qwen3.6-27B 在 CGRE 测试得到了95.5分, 成功超越了 Fable5(Mythos) 的94.1分! 我只能说这真的是 Agentic 工程的胜利了! 不要模型写的不好就无脑怪模型, 也要看看是不是Agent本身有问题. 那么代价是什么呢? 当然就AI硬通货是 token 了, 这个框架正是用了25-40x的token消耗完成了这一壮举. 值得学习. 框架:http://github.com/ryoiki-tokuiten/Iterative-Contextual-Refinements 论文:http://arxiv.org/abs/2605.15222 #mythos #fable5

译Iterative-Contextual-Refinements框架使Qwen3.6-27B在CGRE测试中获95.5分,超越Anthropic Fable5(Mythos)的94.1分。该框架通过BFS探索多种方案(如KMP、滑动窗口)、DFS结合性能工具迭代优化代码,以及路由统筹形成闭环,克服小模型易陷入局部最优的弱点。代价是token消耗增加25-40倍。框架与论文已开源。

Nathan Lambert@natolambert · 6月15日41

The only reasonable expectation if you're a fan of open weight models is that if there's a major step in chinese open-weight performance, there's a good chance the whole chinese llm sphere is banned. National security apparatus will happily give a big "fuck you" to open models.

译AI研究员Nathan Lambert指出,开源权重模型支持者需清醒认识:一旦中国开源LLM性能出现重大突破,整个中国大语言模型领域很可能面临全面禁止。国家安全机构会毫不留情地打压开源模型。引用其博客进一步强调,尽管Anthropic在AI治理上确有不当,但当前美国政府的行动更为恶劣,必须在更强模型(无论开源或闭源)到来前控制局面。

Nathan Lambert@natolambert · 6月15日56

What comes next with AI governance with stronger models. I’m particularly concerned with the open-source community who is celebrating recent events, as they’re entirely unprepared for when serious policy actions come their way (and I expect it soon). https://www.interconnects.ai/p/welcome-to-the-agi-era-of-ai-governance

译随着更强模型的出现,AI治理的未来走向如何。我特别担心那些正在庆祝近期事件的开源社区,因为他们完全没准备好应对即将到来的严肃政策行动(而且我预计很快会来)。

Berryxia.AI@berryxia · 6月14日50

Agent-skills则把全栈开发技能打包成可调用的模块,开发者直接就能让agent干完整的工程活。 open-notebook是本地版的NotebookLM,能在自己电脑上跑知识整理和生成. 最狠的是Headroom,直接把AI API账单砍掉90%,不改代码就能省钱。 这些项目都不是什么前沿大模型,而是实打实的工具层优化。 开源、免费、能马上用,还把本地化、成本控制、agent能力三件事一次性解决了。 以前大家觉得AI好用就得砸钱上大模型,现在这些小而美的开源项目直接证明:真正改变生产力的,往往是把现有能力包装成开发者能直接拿来用的东西。 这波分享一出,开发者手里又多了好几把能立刻提升效率的利器。 Github 项目地址,见评论区👇🏻

译Berry Xia 推荐四个开源 AI 项目:/last30days(新搜索引擎)、agent-skills(将全栈开发技能打包成可调用模块)、open-notebook(本地版 NotebookLM,可离线运行知识整理与生成)、headroom(不改代码即可将 AI API 账单降低 90%)。这些项目聚焦工具层优化,免费开源,一次性解决本地化、成本控制和 agent 能力三个痛点,让开发者能直接拿来提升效率。

🚨 AI News | TestingCatalog@testingcatalog · 6月14日12

Want to stay ahead of the AI curve? Subscribe to the TestingCatalog weekly newsletter to get the latest insights and updates on all the newest AI tools and tests delivered straight to your inbox. Join thousands of tech enthusiasts and start testing the future tomorrow. https://bit.ly/4vMGlps

译想领先 AI 潮流吗? 订阅 TestingCatalog 每周通讯,获取最新 AI 工具和测试的洞察与更新,直接发送到您的收件箱。 加入数千名技术爱好者,明天开始测试未来。 https://bit.ly/4vMGlps

StepFun@StepFun_ai · 6月14日48

Step 3.7 Flash is now live on @DeepInfra 🚀 Builders and teams can now try our open-source multimodal reasoning model through DeepInfra’s API, with private endpoint deployment available for dedicated workloads. Built for agentic coding, tool use, search, and vision workflows. Thanks to the DeepInfra team!

译Step 3.7 Flash 现已上线 @DeepInfra 🚀 开发者和团队现可通过 DeepInfra 的 API 试用我们的开源多模态推理模型,并可为专用工作负载部署私有端点。 专为智能体编程、工具使用、搜索和视觉工作流而构建。 感谢 DeepInfra 团队!

Orange AI@oran_ge · 6月14日73

一直想找个画架构图的趁手的兵器 这个 skill 很好 比大模型默认的审美好多了

译Oran Ge推荐一个用pi+DeepSeek绘制架构图的skill。该skill无需生图模型,通过LLM将自然语言描述转为结构化JSON,再由Node.js渲染器用纯几何算法生成SVG,最终注入为自包含HTML。仓库:https://github.com/tt-a1i/archify。用户评价其审美优于大模型默认输出。

🚨 AI News | TestingCatalog@testingcatalog · 6月14日78

ICYMI 👀: Z AI released GLM-5.2 for all users on GLM Coding Plans. > As our new flagship model, GLM-5.2 delivers powerful coding capabilities, usable 1M-context support, and continued strengths in long-horizon tasks. Open-source and API support are planned for next week.

译智谱发布最强开源模型GLM-5.2,面向所有GLM Coding Plan用户(Lite/Pro/Max)开放。该模型支持真正可用的100万上下文窗口,在长程任务独立完成方面保持领先,适合构建复杂AI智能体应用,也是国产最强编码模型的核心引擎。面对外部封锁限制,智谱强调科学全球性、AGI不应被高墙垄断,采取激进开源态度。GLM-5.2的开源与API预计下周同步上线。

🚨 AI News | TestingCatalog@testingcatalog · 6月14日56

OpenRouter announced Fusion, a new mode in which multiple AI models can run side by side to "fuse" into a better result. It arrives with significant improvements across various tasks, comparable to Fable 5 in certain areas. > By testing different combinations of models, we found that roughly three-quarters of the lift that Fusion provides comes from synthesis, and one-quarter from diversity. Testing time 👀

Chubby♨️@kimmonismus · 6月14日65

Wait what? Rio 3.5 Open 397B, developed by IT company of Rio de Janeiro's city government is now SOTA open source and even outperforming Qwen 3.7? What is happening today. Never heard of them before.

译里约热内卢市政府 IT 公司开发的 Rio 3.5 Open 397B(397B 参数)开源模型达到 SOTA,性能超过阿里 Qwen 3.7。此前 Qwen 3.7 因专有立场逐渐退出前沿竞争,取而代之的是 MiniMax M3 和 Rio 3.5。该模型已上传至 HuggingFace(prefeitura-rio/Rio-3.5-Open-397B)。

宝玉@dotey · 6月14日43

首先这个 Skill 很好,另外提供一个额外选择: 可以试试用 Claude Design 生成一份简历试试,也许你会喜欢

译@HiTw93 推荐了开源工具Kami:用户准备好Markdown素材,输入指令“/kami 帮我产出一个简历”,微调1-2次即可生成清晰美观的简历。宝玉在此基础上提供了另一选择——可尝试用Claude Design生成简历。

elvis@omarsar0 · 6月14日65

Own the harness, own the agent orchestrators. Great to see open-source work starting to enable it. Being able to compose and combine multiple agents is clearly the future to avoid model lock-in. Curious how routing works, as that remains unsolved.

译Elvis Saravia 指出,拥有 harness 即拥有智能体编排器,开源正推动这一趋势,多智能体组合可避免模型锁定,但路由仍待解决。@matei_zaharia 开源了 Omnigent,一个位于 Claude Code、Codex、Pi 及各类 agent SDK 之上的元平台,支持构建多智能体编码和自定义智能体,并实现实时协作与丰富的控制策略。

Chubby♨️@kimmonismus · 6月13日70

As I said before: The banning of Fable 5 was the biggest PR boost for open source models and companies.

译Kim指出,封禁Fable 5成为开源模型和公司最大的公关助推。智谱(Zhipu)随即宣布完全开源其最强模型GLM-5.2,支持实际可用的1M上下文窗口,在长程任务独立完成上保持领先,可为复杂智能体应用提供基础支持,并继续作为最强国产编程模型的主引擎。今晚5:21起,GLM-5.2将向所有GLM编程计划用户(Lite/Pro/Max)开放,API下周上线。

数字生命卡兹克@Khazix0918 · 6月13日71

http://x.com/i/article/2065786589650026496 # 实测GLM-5.2,国产Coding模型的又一座新高峰。 最近整个世界的魔幻程度,真的让人唏嘘。 今天早上,Anthropic收到了美国商务部的一封信。 信的内容很简单,以国家安全为由,要求Anthropic立刻暂停所有外国公民对Fable 5和Mythos 5的访问权限。 而且不只是美国境外的用户,也包括美国境内的外国公民,甚至包括Anthropic自己公司里的外籍员工。 然后Anthropic做了一个让所有人都没想到的决定,为了确保合规,直接把Fable 5和Mythos 5对所有用户全部关停,老美自己也用不了了。 X上直接爆了5000万的阅读。 这个事引起了轩然大波,全网直接爆了。 我中午睡醒一看,心都凉了半截,因为Claude fable 5在纯粹的代码执行能力上,我觉得其实Opus 4.8和GPT 5.5也能干,但是他的方案构建能力、架构能力、产出的完整度和全面程度,是任何一个模型都比不了的,刚刚让它帮我完成了AIHOT精选算法的优化,还有移动端的全面适配和重构,今天刚准备开发完小程序,直接就没了。。。 仅仅4天,这个号称全世界最强的模型,就被召回,全面下线。 再结合这次世界杯强调全球大团结的背景之下,一个索马里的世界杯裁判在美国被禁止入境,从而缺席世界杯赛场。 这个世界的格局,好像越来越不一样了。 好像,也越来越封闭了。 就在我们落寞的看待着这一切的时候。 下午2点19,智谱突然发了一篇公告。 “在一些前沿模型突然变得不可用的时刻,我们选择相信另一条路:前沿智能不应只属于少数人,也不应被少数规则随时收回。它应该开放、可用、可构建,并服务于每一位开发者。” 我的朋友圈瞬间就被刷屏了。 而且这一次,GLM 5.2,继续开源。 GLM 5.1的口碑,在技术圈和AI圈的口碑有多好就不需要我再复述了,基本上是公认的国产之光,为数不多的能跟Claude和GPT掰掰手腕的模型,在Coding和Agent能力上,也是我给所有用不了海外模型的朋友,都推荐的首选模型。 要不是因为算力限制,国内几乎都没有卡,无论是训练还是推理,几乎都比国外少N个数量级,我真的觉得,像智谱、DeepSeek之类的,是绝对能做出不亚于海外那两家公司的模型的。 这一次非常的事发突然,看到他们发布的时候我甚至还在外面吃饭,下午的事都推了,急急忙忙赶回家,还好我的Coding Plan还在,然后拿到了GLM 5.2的权限。 这里说一下,今天GLM 5.2上线的是智谱的Coding Plan,你可以把Coding Plan理解成Claude和GPT的订阅,也就是你只有订阅过的用户才可以使用。 下周会上线API方式,并且会直接开源出来。 而且今天他们5点21上线的这个时间点也非常的有梗。 因为Anthropic是5点21收到的信,所以,智谱选择5点21开放。 一边在关门,一边在开门。 一边说前沿智能是国家安全风险,一边说前沿智能属于所有人。 真的能笑死,戏剧性也属实是拉满了。 Coding Plan稍微蛋疼一点的就是,他们的算力太少了,没办法支持所有用户的推理请求,所以Coding Plan只能限额,也就是这个玩意你想买,是需要靠抢的。。。 所以如果想用的,记得每天早上定个10点的闹钟,去抢一下。 我自己在测完和跟一些朋友对完之后,我想说,这就是国产模型的新高峰,至少在我的层面,除了算力资源问题,会显得很慢之外,在纯粹的结果上,只要你不是强设计类型的东西,GLM 5.2做任务跟Opus 4.8好像差的也不多。 在大型工程、长任务、后端等等上面,很强,非常强。 差距我觉得其实就在前期方案的先进和完整度、还有设计的差别上。 优点就很多了,GLM 5.2输出的东西我看的懂,能聊的明白,幻觉极低,稳如老狗,而且这次整个上下文长度终于加到了1M,这就很棒了。 在测试过程中,400~500k左右的上下文长度左右,准确性和指令遵循跟Claude差距不是很大,非常的稳,我写的Claude.md到了400K这个长度的时候也能遵循没啥问题,我自己一般喜欢在这个位置用我的洁癖.skill手动存档,再往后比如500k~1M的这个区间,我一般很少会涉及到了。 最最最可惜的是,GLM 5.2,还是没有多模态,依然是个纯文本模型。 干活程度也没啥毛病,我的评价是更像一个勤勤恳恳的老黄牛,活肯定能给你干好,它的聪明程度肯定还比不上Claude Fable 5这种级别,跟Opus 4.8的聪明程度也差一点,但是也已经非常好了。 举个例子,我今天AIHOT上的一个小任务。 就是我前段时间为了自己的学习,也为了省一点自己的时间,所以用一些有趣的手段,监控了一些我常看的公众号方便我第一时间知道信息,但是呢,今天发现了一个BUG,就是智谱的公众号是我监控了的,今天的GLM 5.2的消息是2点19发的,但是在AIHOT里,居然没监控到,等到4点的时候,智谱发了X,才看到。 这就很奇怪了,于是我把这个问题,直接让GLM 5.2试了一下。 其实在它去解决的过程中,我已经大概知道是什么原因了,前段时间切换了监控方案,现在是两个监控方案线上灰度并行,大概率是我们后来切换的一个三方API账户里没钱了,我前天就想着要充来着,但是忙忘了。 不过也正好,这么个小事,可以看一下模型的聪明程度,我这个项目大概10万行代码,因为有各种监控和调度,所以后端逻辑会稍微复杂。 随后GLM 5.2找到了这个问题,其实本质上是智谱好几天没发文章了,跟我们抓取的体系没啥关系。。。 然后他就沿着这条路推了下去,以为是我们整个监控体系BUG了。 终于找到了答案。 然后问我要不要做个监控。 全程耗时21分钟。 Claude Opus 4.8的思考过程和GLM 5.2几乎一模一样,唯一的区别是,我在fast模式下,6分钟干完的,不开fast正常差不多也就是10分钟。 也就是说,Claude Opus 4.8比GLM 5.2快了两倍,但是过程和结果,是一模一样的。 这个本质上就是infra和算力的差距了,属于基建问题了。 随手又让GLM 5.2干个后续。 因为我的文档和记忆是极度规范的,也有一个专门的飞书报警群,通过飞书的机器人进行推送。所以我相信GLM 5.2肯定是可以完成的,其实就看这个任务他能不能最短时间内找到余额报警的方式,再找到我的群,然后把这个事干完。 补流程+查代码文档+开发+走测试+合并+洁癖.skill迭代记忆和文档,完美完成,花了26分钟。 验证没问题。 然后,我又让他去干了一个稍微大点的活。 直接把我们AIHOT的官网,转成一个小程序,这个本来是我今天想用fable 5做的,结果fable 5用不了了,那就直接用GLM 5.2来吧。。。 Prompt就是直接把小程序的开发目录扔进去,又扔了小程序的开发文档,然后说,帮我把AIHOT做成小程序版。 GLM 5.2一顿研究后,问了我2个问题。 我无脑点了第一个。 然后,他就开始列计划,列完计划以后,开始并行4个Agent,来进行开发。 在大概40分钟以后,小程序干完了。 BUG倒是没啥BUG,各个地方都能点,也没啥报错的,该有的功能和信息也都有,就是,真的丑啊= = 底tab栏还有小BUG,背景没了,tabbar的适配没做好,调了一下才改好。 不过在其他的逻辑展示、接口调用之类的,几乎没有任何问题,GLM 5.2这个模型,在做一些稍微大一点的任务上,是真的稳如老狗。 这个真想做成完整的小程序的话,肯定还是要对着UI一点点细调的,跟Claude相比,无论是Fable还是Opus的省心角度,确实还是差了一些。 设计审美的差距,我觉得只有GLM啥时候把多模态能力补上,才会有质的飞跃的了。 然后我就让GLM 5.2用Three.js又做了一个未来我们社群想搞的一个线上的游戏化营地,这是一轮出的效果。 也可以看出来,稳定性啥的都没问题,就是这个审美,只能说能用,但是你要说多漂亮多精致,那肯定还是有一些差距的。 Skill的构建也是模型现在很重要的一环,我也拿之前清理电脑那个skill来做了一下测试。 这也是从0开始,用嘴复刻构筑,最终的感觉,跟Opus 4.8开发的Skill基本上也没啥区别。 可以看看效果。 在我有限的时间体验下,GLM 5.2整体其实是非常惊喜也超乎我预期的。 只要你刨除掉审美和多模态这个因素,在我的体验中,它是真的可以和Opus 4.8掰掰手腕的。 至此,我觉得国产两个模型现在极度值得大家使用。 只要是涉及到Agent和Coding的,无脑推荐使用GLM 5.2 + Claude Code框架,这就是目前你在国内用到的最强的组合了。 如果是涉及到一些诸如策划、写作之类的泛知识任务,无脑推荐你使用DeepSeek V4 Pro,这是目前我认为世界知识最棒的模型。 智谱在今天公众号文章的结尾,写了两行英文。 A step closer to frontier intelligence for everyone. The future of AI is open, and it is for the people. 向前沿智能再近一步,为每一个人。 AI的未来是开放的,它属于所有人。 我觉得这两句话,放在今天这个语境下,格外令人感慨。 2026年的AI赛道,每天都在上演让人目瞪口呆的事。 一边在筑墙,一边在铺路。 但是我还是始终坚信。 这些墙在汹涌向前的洪流之下,必然会倒塌。 智能,应该是献给所有人的。 新时代,一定会到来的。

译美国商务部以国家安全为由要求Anthropic限制外国公民访问Fable 5和Mythos 5,Anthropic直接关停两模型。同日智谱发布GLM 5.2并开源,推出需抢购的Coding Plan,下周上线API。实测:上下文窗口扩至1M,400-500k长度准确性和指令遵循与Claude差距不大;代码工程能力极稳、幻觉低;小型任务21分钟结果与Opus 4.8相同但速度慢约两倍。缺憾:纯文本、无多模态、推理慢。作者认为这是国产Coding模型新高峰,推荐GLM 5.2 + Claude Code框架。

Ethan Mollick@emollick · 6月13日50

I don’t think this is going to result in more open weights models, as I wrote before the Anthropic news, if Mythos-level models are considered risky, China will also not want them to be open. And you can’t build a Mythos-class model without a very regulatable compute footprint

译Ethan Mollick认为,随着Mythos级模型被视作高风险,中国也将监管其发布,且建造该类模型需要大量可监管的计算资源,因此持续开源Mythos级模型并不现实。开源权重(open weights)未来仍会存在,但仅限于非前沿模型。

gabriel@gabriel1 · 6月13日32

US revoking AI access to a developed country in a year or two might make it into a developing country open source seem to fall increasingly behind, 6-12 months most work will be done through ai, and a lot of companies will spend more money on tokens than employees

译美国在一年或两年内撤销对一个发达国家的AI访问,可能使其变成一个发展中国家 开源似乎越来越落后,差距6-12个月 大多数工作将通过AI完成,许多公司在模型token上的花费将超过员工

Chubby♨️@kimmonismus · 6月13日64

The US government's decision was arguably the biggest PR boost for open source ever. Perhaps this will be retaliation, and Chinese open-source models can now position themselves as freedom software.

译智谱 AI 发布旗舰模型 GLM-5.2,面向所有 GLM Coding Plan 用户(Lite/Pro/Max/Team)。模型具备强大编码能力、可用 1M 上下文支持及长任务优势。API 和聊天机器人服务将于下周上线,模型也将于下周在 MIT 许可证下正式开源。该发布正值美国政府决策被视为开源最大 PR,中国开源模型可借此定位为自由软件。

Berryxia.AI@berryxia · 6月13日58

兄弟们!就说GLM 好久没有更新,应该快更新模型了。 果不其然,我们前天讨论更新的事儿。 今天就看到GLM-5.2 更新,目前先给codingPlan 的用户使用,API调用要到下周才可以支持~

译GLM-5.2作为智谱新旗舰模型,主打编码能力,支持可用的1M上下文,并在长任务上表现强劲。目前已面向所有GLM Coding Plan用户(包括Lite、Pro、Max、Team)开放,API和Chatbot服务将于下周上线。同时,该模型将于下周在MIT许可证下正式开源。

MiniMax (official)@MiniMax_AI · 6月13日47

We love what the community is building with M3 open weights ♥️ Excited for what’s next

译MiniMax M3 支持已添加到 mlx-vlm,包含 MSA 实现!🚀 在 M3 Ultra 512GB 上测试,运行速度 24 tps,峰值内存约 240GB。目前正在优化性能并添加大量测试 💪 模型:https://huggingface.co/mlx-community/MiniMax-M3-4bit PR:https://github.com/Blaizzy/mlx-vlm/pull/1374 我们喜爱社区用 M3 开放权重构建的一切 ♥️ 期待下一步

meng shao@shao__meng · 6月13日77

前沿智能不应只属于少数人,也不应被少数规则随时收回。它应该开放、可用、可构建,并服务于每一位开发者。 -- 智谱 致大洋彼岸的某厂和某政府。

译智谱(Zhipu AI)推出新旗舰模型GLM-5.2,已对GLM Coding Plan所有用户(Lite/Pro/Max/Team)开放。该模型具备强大编码能力,支持1M上下文窗口,在长周期任务中表现持续优秀。API和Chatbot服务将于下周上线,模型也将于下周以MIT许可证正式开源。智谱在声明中强调“前沿智能不应只属于少数人”,并暗讽大洋彼岸某厂商和政府,称未来AI属于开放和大众。

Orange AI@oran_ge · 6月13日73

今天中午发生了一件让我很震惊的事情,Fable 5 突然在全世界下架了。 之前我以为 Fable 5 是普通大众能用上的最好的模型了,没想到美国政府竟然以国家安全为理由要求 Anthropic 下架了这个模型。 群里有朋友说,愿意花 1000 美金买一个账号来用这个模型。 但很可惜的是,这是全面下架,想买都买不到。 这是第一次以政府的力量要求下架一个模型。 我知道一定会有这一天,只是没想到会这么快。 这就是我最担心的,闭源模型最大的风险。 智能,最后变成了一种限购商品。 Token,不是你有钱想买就能买到。 开源模型才是世界的希望。 国内几个头部的开源模型,DeepSeek、Kimi、GLM,都要加油啊。 昨天 Kimi 默默发布了最新的 coding 模型 K2.7 Code。 这是当下开源的最好的 coding 模型之一。 Cursor 最近大火的 Composer 2.5 就是基于 Kimi 来训练。 K 2.7 Code 相比上一代的 K2.6 ,他们没有选择去刷分,主要使用内部实际在用的评估指标,模型的 coding 能力提升有 20%,模型容易过度思考的问题也终于得到了优化,思考token 立省 30%。 价格方面:API 输入 6.5,输出 27,命中缓存 1.3,比 K2.6 略涨了一点。但考虑到省了 30% 的思考 token,实际用起来用花的钱倒是差不太多。 今天智谱也因为 Fable 5 关闭的事情,紧急宣布即将发布 GLM 5.2,官方公告里这句话深深共鸣: 在一些前沿模型突然变得不可用的时刻,前沿智能不应只属于少数人,也不应被少数规则随时收回。 它应该开放、可用、可构建,并服务于每一位开发者。

译Anthropic 的 Fable 5 被美国政府以国家安全为由要求全面下架,用户无法购买。博主指出闭源模型的智能可能成为限购商品,呼吁开源模型。昨日 Kimi 发布开源 coding 模型 K2.7 Code,coding 能力较上一代提升 20%,过度思考问题优化,思考 token 减少 30%;API 输入 6.5、输出 27、缓存 1.3。智谱因 Fable 5 事件紧急宣布即将发布 GLM 5.2,称前沿智能不应只属于少数人。

数字生命卡兹克@Khazix0918 · 6月13日61

千言万语汇成一句话: 国产之光,无愧于此。 GLM 5.2今晚Coding Plan上线,下周开源。

译GLM-5.2作为智谱新旗舰模型,今晚已向所有Coding Plan用户(Lite/Pro/Max/Team)开放,支持1M可用的上下文窗口,具备强大的编码能力。API和Chatbot服务将于下周推出,模型也将在下周以MIT许可证正式开源。

Z.ai@Zai_org · 6月13日73

Intelligence should be open, accessible, and ready to build with, empowering every developer, everywhere. GLM-5.2 is now available to all GLM Coding Plan users, including Lite, Pro, Max, and Team plans. http://docs.z.ai/devpack/latest-model As our new flagship model, GLM-5.2 delivers powerful coding capabilities, usable 1M-context support, and continued strengths in long-horizon tasks. API and Chatbot services will launch next week. The model will also be officially open-sourced next week under the MIT License. The future of AI is open, and it belongs to the people.

译智谱(Z.ai)发布新旗舰模型 GLM-5.2,现已对 GLM Coding Plan 用户(Lite/Pro/Max/Team 计划)开放。该模型具备强大编程能力、可用的 1M 上下文支持,并延续长程任务优势。API 和聊天机器人服务将于下周上线,模型也将于下周以 MIT 许可证正式开源。

MiniMax (official)@MiniMax_AI · 6月13日78

M3 would never 🙂‍↔️ As a matter of fact, the weights are now open, too. https://huggingface.co/MiniMaxAI/MiniMax-M3

译MiniMax 宣布其 M3 模型的权重已开源(HuggingFace 链接)。此前,Anthropic 因美国以国家安全为由发布出口管制指令,被迫立即禁用 Fable 5 和 Mythos 5 模型,禁止任何外国国民访问(包括外国员工)。MiniMax 以“M3 would never”暗讽其模型不受此类限制,并强调权重已开放。

elvis@omarsar0 · 6月13日23

Open source AI must win!

译开源AI必须赢!

MiniMax (official)@MiniMax_AI · 6月13日80

the kernels are doing the lord's work today, day-0 on @vllm_project, verified on nvidia and amd. go read the writeup 👇

译MiniMax 发布全新开源模型 M3,具备前沿编码、智能体能力、原生图像视频输入、Computer Use 及 1M-token 上下文窗口。核心采用 MSA 稀疏注意力架构:每个 query 仅对 128-token 的 KV 块打分,只关注 top 块,使超长上下文实际可部署。M3 在 vLLM 获 Day-0 支持,已在 NVIDIA 和 AMD 硬件验证,包括 MSA 专用 prefill/decode kernel、1M-token 上下文服务(prefix caching + chunked prefill)、BF16/MXFP8 检查点(Hopper 和 Blackwell 的 MoE 后端)、原生多模态输入,以及工具调用、推理解析和思考模式控制等功能。

MiniMax (official)@MiniMax_AI · 6月13日42

M3 is running together 🤝 with @togethercompute, and with faster-than-ever inference

译M3 正在与 @togethercompute 携手运行 🤝,推理速度比以往更快。MiniMax-M3 是开源权重的原生多模态模型,支持 1M 上下文、稀疏注意力和思考/非思考模式,Together AI 推理优化带来高达 125% 的吞吐量提升。

ginobefun@hongming731 · 6月13日47

http://x.com/i/article/2065581374749413376 # BestBlogs 早报 · 06-13|Anthropic AI 民调、AI 工厂、Kimi K2.7 Code 在线阅读本期早报 ## 导语 AI 正在被谁信任,又将把计算带向何处?今天的三篇精讲恰好构成同一场变革的三个切面。第一个切面是公众心态:Anthropic 完成了覆盖近 52000 人的首次全美公众调查,结果呈现出清晰的「期待与焦虑并存」——48% 的人期待 AI 攻克癌症等疾病,64% 的人担心失业,而每天用 AI 工作的人反而更不担心被取代。第二个切面是产业框架:黄仁勋在红杉的访谈里,给智能时代找了一个 300 年前的参照物——发电机,并把计算范式的切换讲成了一个五层产业故事。第三个切面是一线工具:月之暗面发布并开源了 Kimi K2.7 Code 编程模型,更快、更省、更聪明的编程能力已经送到了每个开发者手边。 速览部分同样密集:浮之静万字解析架构腐朽与 Loop Engineering,The Batch 串讲本周模型大事并讨论递归自我改进,阮一峰周刊记录 rsync 维护者用 AI 写代码引发的争论,SpaceX 完成史上最大 IPO,Y Combinator 用 5 篇论文勾勒 AI 研究走向,歸藏系统阐述 Skill 作为「能力商品」的本质,Simon Willison 实测 Claude Fable 5 的「不懈主动性」。补充阅读里还有 Spring AI 2.0.0、WebMCP、企业级 Agent 落地与 7000 亿资本支出观察。从公众民意到产业资本,从架构哲学到编程模型,这一天的信息浓度值得你留出完整的阅读时间。 ## 精讲一:Anthropic 首份公开记录调查结果 先说背景。AI 公司谈论「公众怎么看 AI」时,大多引用第三方机构的零散数据,而 Anthropic 这次选择自己下场:推出名为 Anthropic Public Record 的全新调查系列,第一轮于 2025 年 11 月至 12 月执行,通过 YouGov 采样、按美国人口普查基准加权,覆盖 51993 名美国人,各州样本从 232 人(阿拉斯加)到 1902 人(纽约)不等,州级误差范围在正负 2.6 到 9.1 个百分点之间。这是 Anthropic 第一次直接面向普通公众做系统性民意研究,也补上了此前研究版图的关键缺口:他们此前通过 Anthropic Interviewer 工具对 81000 名 Claude 用户做过大规模定性访谈,也定期发布基于匿名使用数据的经济指数,但这些都只能覆盖已经在用 AI 的人。这次调查第一次触达了那些根本不用 AI 的群体,让「公众态度」这个词第一次有了完整的样本基础。 调查的核心发现可以概括为「期待与焦虑并存」。在期待一侧,受访者要从 17 个选项中挑出自己对 AI 的前三大期望:48% 的人选择了「治愈癌症、阿尔茨海默病等疾病」,比第二位「帮助残障人士」(36%)高出 12 个百分点,「推动技术进步」和「让生活更轻松」并列第三(各 23%);而「AI 提供心理治疗、缓解孤独」之类的选项排名垫底——公众显然并不希望 AI 取代真实的人际联结。在焦虑一侧,「AI 导致失业」是全美五十个州无一例外的头号恐惧,比例高达 64%;紧随其后的是认知依赖(56%)和虚假信息(52%)。监管态度同样鲜明:超过 70% 的美国人认为政府应当在 AI 监管中发挥作用,且这种支持是跨党派的,公众最希望政府在隐私(56%)、儿童安全(52%)和损害责任(49%)三个领域采取行动。 最值得玩味的有两点。其一,只有 15% 的美国人信任 AI 公司自行决定 AI 如何开发和使用;当被问到什么最能确保 AI 造福人类时,排名最高的答案是「让 AI 公司为损害承担法律责任」(47%)和「安全优先于增长」(44%)——公众要的是问责,而不是承诺。一家头部 AI 公司主动公布「公众不信任 AI 公司」的数据,这个姿态本身也是研究的一部分。其二,每天在工作中使用 AI 的人,对失业的担忧(54%)反而显著低于从不使用 AI 的人(70%)。熟悉感冲淡了恐惧,这与历史上多次技术变革中的公众心态曲线一致。另外一个反直觉的结论是:在绝大多数问题上,AI 并没有沿着典型的党派、地域或教育水平分界线撕裂美国社会——美国人普遍渴望兑现 AI 的好处、害怕它带来的冲击、要求建造它的公司负起责任,人们的分歧更多体现在态度的强烈程度,而非方向。 为什么重要?这份调查与今天黄仁勋的产业叙事形成了有意思的对照:产业界在谈万亿级的 AI 工厂建设和五层产业蛋糕,而普通人在担心自己的工作、孩子的安全和个人隐私。两者之间的落差不是谁对谁错的问题,而恰恰是未来几年 AI 政策制定与商业决策都必须面对的现实约束。Anthropic 表示这个调查会定期重复并扩展到美国之外,这意味着我们将第一次拥有一条跨年度追踪「公众对 AI 态度」的连续曲线。建议完整阅读原文中的州级数据和方法论附录,尤其推荐关注「使用频率与恐惧程度」的交叉分析。阅读全文 ## 精讲二:黄仁勋谈智能时代的「发电机」:从检索式计算到 AI 工厂 这场红杉资本的访谈里,黄仁勋给当下的 AI 基础设施热潮找了一个历史参照物:300 年前的发电机。物理世界的发电机把蒸汽、风力、水流等动能转化为电能;而现代 AI 工厂把这条转换链反过来运行——输入原始的电子,输出结构化的智能 token。这不是一句漂亮的修辞,而是他用来解释「为什么计算范式正在发生 60 年来最大切换」的核心框架。当年发电机的意义不在于发电本身,而在于它催生了围绕电力组织起来的整个工业体系;按同样的逻辑,AI 工厂的意义也不止于训练和推理,而在于一个围绕「实时生成智能」重新组织的计算产业正在成形。 先看技术切换的逻辑。自 1964 年 IBM System 360 问世以来,计算一直运行在「检索预存数据」的静态范式中:程序由人手写,媒体以不可变文件的形式录制,数据中心本质上是归档存储的枢纽——用户请求信息,系统从物理磁盘上把数据找出来。生成式 AI 从根本上打破了这个架构:每一段文本回复、每一张合成图像、每一条操作指令,都是基于实时上下文在原点即时构造出来的。过去两年,这种能力又跨过了两个里程碑:早期的生成式翻译(文本到摘要、文本到图像、图像到文本的结构转换),以及如今的智能体推理系统——能做多步规划、内部反思、调用电子表格和浏览器等工具、自主协调执行企业级工作流。 再看产业拆解。黄仁勋把整个 AI 基础设施建设比作一块五层蛋糕:第一层是能源,核电、风电、光伏、氢能等电网基础设施迎来前所未有的增长;第二层是计算芯片,包括大规模量产的 GPU、高速交换机和硅光互连;第三层是设施,涵盖土地、吉瓦级供电和数据中心建设;第四层是基础模型,承载对语言、物理规律、生物编码和机器人学的理解;第五层是应用,即面向金融、法律、运营等场景的增值软件。这个分层的好处是把「AI 投资」这个笼统的词拆成了五个资本属性完全不同的赛道——能源和设施是重资产长周期,芯片是制造业节奏,模型和应用则是软件逻辑。落到硬件上,一个典型的计算单元是:72 颗专用计算芯片集成在一个自治服务器机架里,整机约两吨重、造价约 400 万美元、包含超过 150 万个零部件,以高产量直接部署进全球的超大规模数据中心。 最后是他对失业焦虑的回应,这一点与精讲一的民调形成了直接对话。黄仁勋用放射科医生和软件工程师举例:AI 自动化的是任务,而不是职业的核心目的——放射科医生的价值从「看片」转向更高层的临床判断,软件工程师的价值从「敲代码」转向定义问题和验证结果。这个「任务 vs 目的」的区分未必能安抚所有人,但它至少提供了一个比「AI 会不会抢走工作」更可操作的分析框架:先问一个职业的核心目的是什么,再问哪些任务可以被自动化,剩下的部分才是人需要重新定位的空间。 把这场访谈放进今天的早报里看,价值在于它提供了一张「产业地图」:速览部分的 SpaceX 万亿估值、补充阅读里七巨头 7000 亿美元的资本支出、存储涨价与电力争夺,全都可以在五层蛋糕的框架里找到自己的位置。如果你想理解未来几年资本开支、电力规划和芯片产能为什么会这样流动,这场访谈值得完整观看。观看访谈 ## 精讲三:Kimi K2.7 Code 编程模型已上线 Kimi Code、API 开放平台 月之暗面今天发布并开源了 Kimi K2.7 Code 编程模型,发布文章以 Dijkstra 1970 年的名言开场——「编程的艺术,就是组织复杂性的艺术,是掌控庞杂、并尽最大可能避免其沦为畸形混沌的艺术」。这是一次目标非常明确的迭代:专攻编程场景,把性能、效率和智能体能力同时往前推。 先看硬指标。相比上一代 K2.6,K2.7 Code 显著提升了长上下文编程场景的指令遵循能力和长程编程任务的性能表现,在内外部代码基准上全面进步:Kimi Code Bench v2 提升 21.8%,Program-Bench 提升 11%,MLS Bench Lite 提升 31.5%。更值得注意的是效率改善:新模型大幅缓解了长程任务中的过度思考倾向,平均 token 消耗减少 30%——也就是用更少的 token 达到更高的性能。对天天跑长任务的智能体编程场景来说,这条「省」的曲线可能比「强」的曲线更直接地决定使用成本。代码能力的进化还带动了智能体能力:在评估 Agent 自主化执行的 Kimi Claw 24/7 Bench、MCP Atlas 和 MCP Mark Verified 基准上,性能提升约 10%。 再看获取方式和价格。企业和开发者今天起即可通过 Kimi API 开放平台调用 K2.7 Code,1M token 的标准输入和输出价格与 K2.6 持平,分别为 6.5 元和 27 元,命中缓存的输入价格调整为 1.3 元;Kimi Code Plan 的默认模型也已同步升级,会员计划和企业版用户可以直接体验新模型。模型权重已在 Hugging Face 开放,支持本地部署。有两个使用细节需要特别注意:其一,K2.7 Code 必须开启思考模式(Thinking)才能发挥最佳性能——Kimi API 和 Kimi Code 默认都已开启,但如果手动关闭,API 会直接报错,Kimi Code 则会静默回退到 K2.6,排查性能问题时别忘了先检查这一项;其二,在非编程任务中,官方仍然推荐能力更全面的 K2.6,新模型是一把专用的刀,不是通用的瑞士军刀。 最大的悬念留给了下周一。6 月 15 日,K2.7 Code 高速版将通过 API 开放平台上线:同一个模型,输出速度约为普通版的 5 到 6 倍——常规编程场景约 180 token/s,短上下文场景可达 260 token/s,而价格只是普通版的 2 倍,官方的说法是「6 倍速度只要 2 倍价格」。6 月底前,开发者可以通过 Kimi Code Plan 的抢先体验计划在 Kimi Code 中试用高速版;7 月起将逐步开放给 Allegretto 及以上会员,高速版在套餐中的用量消耗为普通版的 3 倍。配合发布,API 开放平台还推出了为期三周的充值赠送活动。 为什么值得关注?在 Claude Fable 5、Cursor Composer 2.5 相继刷新编程模型预期的这一周(见速览部分),K2.7 Code 代表了国产开源阵营的回应:不拼大而全,而是在编程这个最有付费意愿的场景里,把「性能、token 效率、推理速度、价格」四个变量同时优化。对于正在搭建 AI 编程工作流的团队,这是一个值得实际接入、跑一轮自家任务集做对比的选项——尤其是下周高速版上线之后,速度敏感型场景(比如交互式结对编程和大批量代码迁移)的体验差异会更加明显。阅读全文 ## 速览 [深度思考:架构腐朽 & Loop Engineering](https://www.bestblogs.dev/article/1706c463)(浮之静)——「屎山源于不敢删,架构活于持续排熵。」作者给屎山下了一个工程上可用的定义:删除任何东西的风险都大于保留它的成本,并拆解出三大症状——局部性丧失(改一行、测全站)、承重 bug(Hyrum 定律的晚期形态:连错误行为都被下游依赖)、疤痕组织(没人删东西,所有人绕着加东西)。文章从 Lehman 软件演化定律讲起:只要系统还活着就会持续变化,变化没有配套的减法,复杂度的无序累积就是腐朽;进而提出在 AI Agent 时代用 Loop Engineering 建立持续排熵的工程循环。一篇罕见地把模糊焦虑转化为可讨论、可测量对象的架构长文。 [神话催生寓言,Cursor 的 Composer 2.5,智能体构建智能体](https://www.bestblogs.dev/article/08a9c3c1)(The Batch | DeepLearning.AI)——本期 The Batch 信息量很大:Anthropic 的 Claude Mythos 5 与 Fable 5 双模型、Cursor 自研的 Composer 2.5,以及由 Anthropic 生产力数据引发的递归自我改进(RSI)讨论。Andrew Ng 的开篇信尤其值得读:他鼓励大家尝试桌面智能体——不只是聊天,而是直接读写本地文件、收发消息、定时交付,并解释了 agent harness 如何让前沿模型自主驱动「下一步做什么」的关键循环;他同时提醒,机密任务上要警惕商业桌面智能体藏在法律条文深处、可能随新模型一夜变更的数据留存政策。 [科技爱好者周刊(第 400 期):rsync 的争论](https://www.bestblogs.dev/article/d1462f58)(阮一峰的网络日志)——第 400 期周刊聚焦一场标志性争论:有人发现服务器基础命令 rsync 的 3.4.3 版本由 Claude 生成,GitHub 上题为「不要乱搞这个软件」的批评帖已有 300 多条发言。维护者 Andrew Tridgell 的回应很有代表性:他本已准备退休,却突然收到大量由 AI 发现的安全报告,意识到未来的攻击必然由 AI 驱动,而自己的精力已不足以应对,于是选择让 AI 写代码、自己转向编写更严格的测试用例。阮一峰的判断是「AI 写代码 + 人类测试」可能成为大型开源项目的常见运作模式——无人付酬的开源项目,恐怕没有第二条路。 [SpaceX 敲钟,马斯克成人类首个「万亿美元先生」,400 名员工身家过亿](https://www.bestblogs.dev/article/ff2e8373)(腾讯科技)——SpaceX 以每股 135 美元发行、募资 750 亿美元,是 2019 年沙特阿美的两倍有余,创下全球史上最大 IPO;开盘价 150 美元,市值一度突破 2 万亿美元,全球排名第六。认购热度惊人:总需求超 2500 亿美元,仅散户订单就超过 1000 亿美元。造富效应同样罕见:超过 4400 名在职与离职员工跻身百万富翁,约 400 人账面财富过亿。但分歧也很尖锐——做空者查诺斯称之为「建立在希望与梦想之上的狂欢」,晨星给出的公允价值仅每股 63 美元,较发行价折价超过一半。 [从蛋白质模型到智能体编程:5 篇论文看 AI 研究正在走向哪里](https://www.bestblogs.dev/video/18e855a)(Y Combinator)——这场 YC 技术 meetup 用 5 篇论文勾勒出正在成形的研究方向:蛋白质模型的 scaling laws、自引导 selfplay 强化循环、流式实时 RAG 架构、基于 Lean 的数学化代码验证,以及借鉴高 APM 游戏战术的智能体软件工程框架。开场还讨论了持续学习、样本效率与硬件极限等基础性约束,以及对「模型仅靠人类数据子空间就能采样完整解空间」这一假设的普遍怀疑。适合想跳出产品新闻、看清研究脉络的读者,五个方向覆盖了从生物到编程的完整光谱。 [万字长文:做了些爆款 Skills 以后,我对 Skills 的看法](https://www.bestblogs.dev/article/54575866)(歸藏的AI工具箱)——基于 PPT、社交媒体卡片、Logo 生成器等爆款 Skills 的真实实践,歸藏给出了一个核心判断:Agent 不是抹平能力差距,而是放大能力差距,目标清晰、品味和判断强的人被放大,目标混乱的人也被放大混乱,用户正在 K 型分化。Skill 的价值在于弥合这道鸿沟——它不是单纯的提示词,而是把专家经验、工作流、品味和工具调用封装成可安装、可分发、可迭代的「能力商品」。文章对 Skill 的架构、设计、维护与生态边界都有系统论述,是目前中文世界关于 Skills 最完整的实践总结之一。 [Claude Fable 展现出不懈的主动性](https://www.bestblogs.dev/article/67accc9f)(Simon Willison's Weblog)——使用两天后,Simon Willison 用「relentlessly proactive」概括 Claude Fable 5:它掌握一大堆技巧,并且会动用其中任何一个来达成目标。他只丢了一张截图和一句提示词,让模型排查一个 CSS 横向滚动条 bug,自己就走开了。回来时发现模型已经自主打开了他的 Firefox 和 Safari、用 pyobjc 调用 Quartz 定位窗口编号并截屏、自建本地测试页面逐项对照 CSS 属性——所有这些手段都没人教它。一篇生动的一线观察,展示了新一代模型「为达目标穷尽工具箱」的工作风格,可与速览中 The Batch 对桌面智能体的讨论对照阅读。 ## 补充阅读 - [Spring AI 2.0.0 GA 正式发布](https://www.bestblogs.dev/article/9ed27696)(Spring Blog)——以 Spring Boot 4 为基础,带来 Jackson 3、空安全、重构的选项系统与 MCP Java SDK 正式集成。Java 后端团队接入 AI 能力的事实标准更新,建议相关团队对照升级说明评估迁移。 - [迎接智能体就绪的 Web:用 WebMCP 简化用户操作](https://www.bestblogs.dev/video/6ff3380)(AI Engineer)——Chrome 团队介绍实验性浏览器标准 WebMCP:让网站把客户端能力暴露为结构化工具,供浏览器内 AI 智能体直接调用,替代脆弱的 DOM 抓取。前端工程师和做浏览器智能体的团队应当跟进。 - [领域中心?为什么 Hexagonal 与 Onion 架构回答的是错误的问题](https://www.bestblogs.dev/video/f2dd2f0)(Spring I/O)——Spring Modulith 作者 Oliver Drotbohm 的反共识演讲:六边形与洋葱架构本质只是分层架构的依赖反转,并未解决领域拆分;他主张垂直切片加包级封装。适合正在做架构选型的后端架构师。 - [学会记住什么:基于认知的智能体记忆多因素价值模型](https://www.bestblogs.dev/article/008361e6)(arXiv.org – AI)——提出七因子可解释的记忆价值函数,在固定记忆预算下统一控制编码、遗忘和检索。给长时运行 Agent 设计记忆系统的工程师提供了一个超越「语义相似度 + 时近性」的框架。 - [Box AI 如何借助 Deep Agents 构建企业级内容智能体](https://www.bestblogs.dev/article/06adaad3)(LangChain Blog)——Box 用 LangChain 的 Deep Agents 框架实现递归父子智能体架构,从单文档问答一路演进到跨数千文档的综合分析,且始终尊重既有的安全与权限模型。一份难得的企业级 Agent 落地参考,适合做企业知识系统的团队。 - [所有人都在为 7000 亿账单兜底](https://www.bestblogs.dev/article/4b8de76e)(腾讯科技)——硅谷七巨头 2026 年预估 7000 亿美元 AI 资本支出的连锁反应:买空台积电先进产能、推高存储价格、与社区争夺电力,连库克、雷军、余承东都先后被供应链「卡脖子」,风险再通过 SPV 等金融工具层层转嫁给普通消费者。与精讲二的 AI 工厂叙事对照阅读,体感更立体。 ## 今日阅读路径 今天的内容密度偏高,如果你只有 30 分钟,建议按「先工具、再民意、后框架」的顺序读三篇: 1. 先读精讲三 [Kimi K2.7 Code](https://www.bestblogs.dev/article/7ed2852b)——最具行动价值:价格不变、效率提升 30%,下周还有 6 倍速高速版,正在搭 AI 编程工作流的人应该今天就去试。 1. 再读精讲一 [Anthropic 公众调查](https://www.bestblogs.dev/article/05a21063)——理解 AI 行业最稀缺的变量:公众信任。「每天用 AI 的人反而更不怕失业」这一条,值得转给你身边焦虑的朋友。 1. 最后看精讲二 [黄仁勋的 AI 工厂](https://www.bestblogs.dev/video/93f8c99)——五层产业蛋糕和「数字发电机」框架,会帮你把今天速览里的 SpaceX、7000 亿资本支出等新闻装进同一张产业地图。 时间更充裕的话,浮之静的架构腐朽长文和歸藏的 Skills 万字总结是本周不可多得的两篇深度实践文章,一篇向后看系统如何腐朽、一篇向前看能力如何封装,适合周末配一杯咖啡精读。做 Java 后端的读者,则不要错过补充阅读里 Spring AI 2.0.0 和 Oliver Drotbohm 架构演讲这对组合。 BestBlogs 是 AI 驱动的私人阅读助手,帮助你建立稳定、可信、个性化的高质量信息输入。它帮你判断什么值得读、协助你读懂,并逐渐理解你关注什么。 这是面向所有人的每日早报内容,如果你希望它基于你的兴趣和阅读习惯整理,可以体验「我的早报」 https://www.bestblogs.dev/reading/brief

译Anthropic首份全美AI民调覆盖51993人:48%期待AI攻克癌症,64%担心失业,仅15%信任AI公司自行开发。黄仁勋以发电机类比AI工厂,提出五层产业蛋糕(能源/芯片/设施/模型/应用),每个计算单元含72颗芯片、造价约400万美元。月之暗面开源Kimi K2.7 Code编程模型,相比K2.6平均token消耗减少30%,Kimi Code Bench v2提升21.8%,Program-Bench提升11%,MLS Bench Lite提升31.5%。

SemiAnalysis@SemiAnalysis_ · 6月13日63

Congrats to @vllm_project & @lmsysorg for releasing MiniMax M3 428B on both the CUDA & ROCm stack on day 0! MiniMax M3 includes: 🟠 Block sparse attention which is 9x faster prefill over M2.7 🟠 Day 0 open MXFP8 weights 🟠 and Furthermore @Inferact released Day-0 EAGLE3 open weight draft model support Excited to try out the performance on MiniMax M3!

译祝贺 @vllm_project 和 @lmsysorg 在 CUDA 和 ROCm 堆栈上于第 0 天发布 MiniMax M3 428B!MiniMax M3 包含: 🟠 块稀疏注意力,预填充比 M2.7 快 9 倍 🟠 第 0 天开放 MXFP8 权重 🟠 此外,@Inferact 发布了第 0 天 EAGLE3 开放权重草稿模型支持 期待尝试 MiniMax M3 的性能!

Orange AI@oran_ge · 6月13日75

今天凌晨五点的时候,我让 AI 帮我打磨一段文案,打磨三遍给我看。 AI 改完之后,我发现一遍比一遍讲究,但是一遍比一遍缺人味儿。 我已经用上最贵的 Claude Fable 5 了,还这样,让我很生气。 最后我跟 AI说,你改完之后,人味儿变少了。 我说不清什么是人味儿,只知道我感受不到文字背后的那个人了。 我们讨论很久,最后讨论出的结论是,AI 写的东西,背后缺少一个东西: 存在感。 人写的字背后站着一个具体的人,他在具体的位置上,付出过具体的代价。 然后把聊的关键信息做成了一个技能,这就是: 《人味儿写作心法.skill》 它特别适合自己写文章或口述后,让 AI 来改稿的场景。 开源免费发布。 给你的 Agent 装上它,让你的文字变得有人味儿 http://github.com/orange2ai/renwei-writing

译Oran Ge 让 Claude Fable 5 打磨文案三遍,发现改稿越来越讲究却缺“人味儿”。他与 AI 讨论后得出结论:人写的文字背后有“存在感”——作者在具体位置付出过具体代价,而 AI 无法复现。为此他制作了《人味儿写作心法.skill》,专用于自写文章或口述后让 AI 改稿的场景,旨在保留文字的人味。该技能已开源免费发布在 GitHub。

MiniMax (official)@MiniMax_AI · 6月13日82

day-0 in @vllm_project and it comes with: dedicated MSA prefill/decode kernels, 1M-context serving with prefix caching + chunked prefill, BF16 + MXFP8 on both Hopper and Blackwell 🚀 this is what open-weight done properly looks like. thanks @vllm_project, @NVIDIAAI, @AIatAMD, @inferact

译MiniMax M3 发布,具备前沿编码与智能体能力,原生图像视频输入和计算机使用,1M-token 上下文。核心采用 MSA 稀疏注意力:每个 query 评分 128-token KV 块,仅对 top 块做注意力。vLLM 当日即支持 M3,包括专用 MSA prefill/decode 核、前缀缓存与分块 prefill、BF16 和 MXFP8 检查点、Hopper 与 Blackwell 的 MoE 后端,并在 NVIDIA 与 AMD 硬件上验证。同时支持原生多模态输入、工具调用、推理解析和思考模式控制等智能体工作负载。

全部 AI 动态
AI 相关资讯全量信息流
全部一手信源资讯推文
全部模型产品行业论文技巧
6月16日
21:50
Ant Ling@AntLingAGI
77
Ling & Ring 2.6 技术报告发布,带来两款开放权重基座模型。 我们通过架构、训练和智能体能力的协同设计,共同优化模型与系统: • 7:1 混合线性注意力 • 用于稳定智能体强化学习的 KPop:SWE-bench Verified 76.28% • 约 4 倍 token 效率
开源生态推理模型发布编码
关联讨论 4 条蚂蚁 inclusionAI:HuggingFace 新模型HuggingFace Daily Papers(社区热门论文)公众号:蚂蚁百灵(Ling)X:蚂蚁百灵 (@AntLingAGI)
08:48
ginobefun@hongming731
56
BestBlogs 早报 · 06-16

BestBlogs精选10篇AI行业文章:Token成本控制大头在系统提示词、Skill和会话历史;AI Agent工具设计强调单一职责、强约束schema、幂等键;循环工程(Loop)作为新范式让模型连续跑规则;Scaling Law参数空转扮演骨架角色;GlobalGPT零融资做到千万美金ARR;AI应用层泡沫破裂,Sora等180天关停;Anthropic旗舰模型Fable 5遭美国政府出口管制禁令;夏勇峰暂停智能眼镜业务转向“为AI造硬件”;SpaceX登陆纳斯达克市值超2万亿美元;利用盖亚卫星18亿颗恒星数据模拟银河图像。

ginobefun: http://x.com/i/article/2066671362920599553

智能体其他开源生态编码
06:43
Nathan Lambert@natolambert
22
开放科学才是真正需要盛行的。好文章。 要是我认识某个正在建立这类机构的人就好了。

Parth Asawa: The AI community seems to increasingly be heading towards a polarized world when discussing safety and consolidated powe...

大佬观点安全/对齐开源生态
04:36
宝玉@dotey
73
宝玉发布《图解Skill》配套Repo中的info-digest Skill

宝玉(@dotey)公开了《图解Skill》配套GitHub仓库中的info-digest Skill,用于日常整理AI资讯并生成推文初稿,默认调用Claude网页版+Opus 4.6。核心提示词技巧:1)站在读者角度写作;2)联网检索做实核查;3)交代背景信息;4)生成短而精炼的纯文本格式。该Skill为项目库JimLiu/Illustrated-Agent-Skills的一部分。同步有抽奖活动(转发/引用/评论抽10人,本周五中午12点,使用Grok抽奖)。

宝玉: 🎟️抽奖啦!为了回馈读者们对《图解 Skill -- AI 提效实战指南》这本书的支持,也搞一次抽奖活动,抽 10 个人,北京时间本周五中午12点开奖。 规则很简单:转发、引用、评论这条推文就可以。 可以选择实体书(仅限内地地址)或者电子...

GitHub开源生态教程/实践
00:13
elvis@omarsar0
73
DAIR AI 开源 /learn skill,用 Agent 学习任何主题

DAIR AI 创始人 Elvis Saravia 开源 /learn skill,允许用户通过 AI 智能体和 HTML artifacts 学习任意主题。该 skill 可安装后与任何 Agent 交互,生成视觉化、交互式的 artifact,帮助深入理解或生成知识检测(如测验)。支持 DAIR Academy pro 会员在 AI Builder 中使用。GitHub 链接及试用平台已开放。

智能体GitHub开源/仓库开源生态
6月15日
21:12
凡人小北@frxiaobei
62
AI Agent全自动协作:从发现Bug到修复Merge全程零人类编码

开发者@JeffreyCalm分享经历:他将GitHub链接交给Codex部署,发现Bug后Codex自动提Issue。官方仓库的Code Review Bot确认Bug并At Hotfix Bot,后者30分钟内提交修复PR,最后At真人开发者。真人仅回复“OK”即完成Merge。全程人类零编码,仅贡献一个决策确认,折射出Agent经济与A2A平台雏形。

Jeffrey.W: Github 本身在成为一个 A2A 平台。 我本周经历了一个特别魔幻的事情: 1. 我把一个 Github 链接丢给 Codex,让它帮我部署一下。 2. 我用了一段时间,发现似乎有个 Bug。我让 Codex 查了一下,它确认是个 Bu...

智能体GitHub开源生态现象/趋势
18:43
Kimi.ai@Kimi_Moonshot
51
Kimi K2.7 Code HighSpeed 高速模式发布,6 倍加速

Kimi 开源多模态编程模型 Kimi K2.7 Code 推出高速模式 HighSpeed,编码任务中长输入可达约 180 tok/s,短上下文任务最高 260 tok/s,速度提升最多 6 倍。该模式已向 Kimi Code Beta Program 成员、API 开发者及商业用户开放(容量有限),无需邀请,加入 Beta 计划即有机会获得访问权限。Kimi 表示将继续优化模型并扩大接入。

产品更新开源生态编码
16:23
Berryxia.AI@berryxia
60
Gemma 4 12B Coder GGUF 发布:将 Fable 5 推理链蒸馏至本地可跑

Berry Xia 介绍了基于 Google gemma-4-12B-it 微调的 Gemma 4 12B Coder GGUF 模型。它将 Fable 5 的推理链条蒸馏进 12B 参数模型,训练数据使用 Composer 2.5 真实通过案例并由 Fable 5 辅助补全。GGUF 格式让模型在 12GB 消费级显卡即可本地运行,甚至支持 CPU。模型专为代码生成、调试、复杂算法、链式思考提示等任务优化,无需 API 费用且无导出限制。该模型基于 Google 最新 gemma-4 架构,目前下载量已破六千,社区反馈其在本地 coding 场景表现出色,填补了云端模型与本地可用之间的鸿沟。

Hugging Models: Gemma 4 12B Coder is here and it's a game changer for local code generation. This GGUF model packs Google's latest gemma...

Google开源生态推理模型发布
12:30
ginobefun@hongming731
33
@dotey 为回馈读者举办《图解 Skill -- AI 提效实战指南》抽奖活动。抽 10 人,北京时间本周五中午 12 点开奖。转发、引用、评论即可参与,中奖可选实体书(仅内地地址)或电子书。作者借助 Grok 抽奖并提醒防范提示词注入。已购书用户可访问配套 GitHub 项目库(JimLiu/Illustrated-Agent-Skills),内含 interview-analysis、info-digest 等实用 Skills。

宝玉: 🎟️抽奖啦!为了回馈读者们对《图解 Skill -- AI 提效实战指南》这本书的支持,也搞一次抽奖活动,抽 10 个人,北京时间本周五中午12点开奖。 规则很简单:转发、引用、评论这条推文就可以。 可以选择实体书(仅限内地地址)或者电子...

其他开源生态
07:55
karminski-牙医@karminski3
53
Qwen3.6-27B在Iterative-Contextual-Refinements框架下超越Anthropic Fable5

Iterative-Contextual-Refinements框架使Qwen3.6-27B在CGRE测试中获95.5分,超越Anthropic Fable5(Mythos)的94.1分。该框架通过BFS探索多种方案(如KMP、滑动窗口)、DFS结合性能工具迭代优化代码,以及路由统筹形成闭环,克服小模型易陷入局部最优的弱点。代价是token消耗增加25-40倍。框架与论文已开源。

智能体arXivGitHub开源生态
02:16
Nathan Lambert@natolambert
41
AI研究员Nathan Lambert指出,开源权重模型支持者需清醒认识:一旦中国开源LLM性能出现重大突破,整个中国大语言模型领域很可能面临全面禁止。国家安全机构会毫不留情地打压开源模型。引用其博客进一步强调,尽管Anthropic在AI治理上确有不当,但当前美国政府的行动更为恶劣,必须在更强模型(无论开源或闭源)到来前控制局面。

Nathan Lambert: Threading the needle in this post of anthropic has done some bad things for AI governance & the discourse but the action...

大佬观点开源生态
01:46
Nathan Lambert@natolambert
56
随着更强模型的出现,AI治理的未来走向如何。我特别担心那些正在庆祝近期事件的开源社区,因为他们完全没准备好应对即将到来的严肃政策行动(而且我预计很快会来)。
大佬观点安全/对齐开源生态
6月14日
21:20
Berryxia.AI@berryxia
50
Berry Xia 推荐四个开源 AI 工具:本地搜索、Agent 技能、离线知识库与降本利器

Berry Xia 推荐四个开源 AI 项目:/last30days(新搜索引擎)、agent-skills(将全栈开发技能打包成可调用模块)、open-notebook(本地版 NotebookLM,可离线运行知识整理与生成)、headroom(不改代码即可将 AI API 账单降低 90%)。这些项目聚焦工具层优化,免费开源,一次性解决本地化、成本控制和 agent 能力三个痛点,让开发者能直接拿来提升效率。

Matthew Berman: 4 awesome open-source AI projects: 🔸 /last30days (new search engine) 🔸 agent-skills (full dev skills) 🔸 open-notebook...

智能体开源/仓库开源生态端侧
16:19
🚨 AI News | TestingCatalog@testingcatalog
12
想领先 AI 潮流吗? 订阅 TestingCatalog 每周通讯,获取最新 AI 工具和测试的洞察与更新,直接发送到您的收件箱。 加入数千名技术爱好者,明天开始测试未来。 https://bit.ly/4vMGlps
其他开源生态
15:41
StepFun@StepFun_ai
48
Step 3.7 Flash 现已上线 @DeepInfra 🚀 开发者和团队现可通过 DeepInfra 的 API 试用我们的开源多模态推理模型,并可为专用工作负载部署私有端点。 专为智能体编程、工具使用、搜索和视觉工作流而构建。 感谢 DeepInfra 团队!

DeepInfra: Step 3.7 Flash is Live on DeepInfra: An Agentic, Multimodal Model Built for Production

多模态开源生态推理行业动态
09:51
Orange AI@oran_ge
73
Oran Ge推荐一个用pi+DeepSeek绘制架构图的skill。该skill无需生图模型,通过LLM将自然语言描述转为结构化JSON,再由Node.js渲染器用纯几何算法生成SVG,最终注入为自包含HTML。仓库:https://github.com/tt-a1i/archify。用户评价其审美优于大模型默认输出。

Geek: pi + DeepSeek 画的,才发现这个技能不需要生图模型,是通过 LLM 将自然语言描述转为结构化 JSON → Node.js 渲染器用纯几何算法生成 SVG → 注入自包含 HTML。 https://github.com/tt-...

GitHub开源/仓库开源生态部署/工程
07:48
🚨 AI News | TestingCatalog@testingcatalog
同事件精选78
智谱发布最强开源模型GLM-5.2,面向所有GLM Coding Plan用户(Lite/Pro/Max)开放。该模型支持真正可用的100万上下文窗口,在长程任务独立完成方面保持领先,适合构建复杂AI智能体应用,也是国产最强编码模型的核心引擎。面对外部封锁限制,智谱强调科学全球性、AGI不应被高墙垄断,采取激进开源态度。GLM-5.2的开源与API预计下周同步上线。

jietang: GLM-5.2 is Fully Open, Frontier Intelligence Belongs to Everyone Today, the sudden restriction of certain frontier model...

开源生态模型发布编码
同一事件,精选展示《GLM-5.2 上线并开源:专注 Coding 与长程任务》
推荐理由:智谱发布 GLM-5.2,把 1M 上下文和强编码能力装进开源模型,在当前地缘限制下这种激进开放是难得的立场,做 agent 的值得上手一试。
07:48
🚨 AI News | TestingCatalog@testingcatalog
56
OpenRouter Fusion API

OpenRouter: Introducing the Fusion API, the smartest compound model in the market. Fusion achieves Fable-level intelligence at half ...

产品更新开源生态推理
06:00
Chubby♨️@kimmonismus
65
里约热内卢市政府 IT 公司开发的 Rio 3.5 Open 397B(397B 参数)开源模型达到 SOTA,性能超过阿里 Qwen 3.7。此前 Qwen 3.7 因专有立场逐渐退出前沿竞争,取而代之的是 MiniMax M3 和 Rio 3.5。该模型已上传至 HuggingFace(prefeitura-rio/Rio-3.5-Open-397B)。

Zen Magnets: Alibaba Qwen3.7 slowly fading into irrelevance at the frontier due to proprietary stance. In it's place we have Minimax ...

开源生态模型发布
02:54
宝玉@dotey
43
@HiTw93 推荐了开源工具Kami:用户准备好Markdown素材,输入指令"/kami 帮我产出一个简历",微调1-2次即可生成清晰美观的简历。宝玉在此基础上提供了另一选择--可尝试用Claude Design生成简历。

Tw93: 假如你的朋友最近需要更新简历,一定要把 Kami 推荐给他,我单独细致优化了一个版本,单独让 Kami 写简历变得非常好用好看清晰,让他把他的原生素材 md 准备好,然后对着 AI 说 /kami 帮我产出一个简历,然后调1-2下差不多就好...

开源生态教程/实践
02:13
elvis@omarsar0
65
Elvis Saravia 指出,拥有 harness 即拥有智能体编排器,开源正推动这一趋势,多智能体组合可避免模型锁定,但路由仍待解决。@matei_zaharia 开源了 Omnigent,一个位于 Claude Code、Codex、Pi 及各类 agent SDK 之上的元平台,支持构建多智能体编码和自定义智能体,并实现实时协作与丰富的控制策略。

Matei Zaharia: Really excited to open source a new project: Omnigent, a meta-harness for AI agents. It lets you build multi-agent codin...

智能体开源/仓库开源生态编码
6月13日
22:27
Chubby♨️@kimmonismus
70
Kim指出,封禁Fable 5成为开源模型和公司最大的公关助推。智谱(Zhipu)随即宣布完全开源其最强模型GLM-5.2,支持实际可用的1M上下文窗口,在长程任务独立完成上保持领先,可为复杂智能体应用提供基础支持,并继续作为最强国产编程模型的主引擎。今晚5:21起,GLM-5.2将向所有GLM编程计划用户(Lite/Pro/Max)开放,API下周上线。

jietang: GLM-5.2 is Fully Open, Frontier Intelligence Belongs to Everyone Today, the sudden restriction of certain frontier model...

开源生态模型发布编码
21:47
数字生命卡兹克@Khazix0918
71
实测GLM-5.2:国产Coding模型新高峰

美国商务部以国家安全为由要求Anthropic限制外国公民访问Fable 5和Mythos 5,Anthropic直接关停两模型。同日智谱发布GLM 5.2并开源,推出需抢购的Coding Plan,下周上线API。实测:上下文窗口扩至1M,400-500k长度准确性和指令遵循与Claude差距不大;代码工程能力极稳、幻觉低;小型任务21分钟结果与Opus 4.8相同但速度慢约两倍。缺憾:纯文本、无多模态、推理慢。作者认为这是国产Coding模型新高峰,推荐GLM 5.2 + Claude Code框架。

开源生态编码评测/基准
21:38
Ethan Mollick@emollick
50
Ethan Mollick认为,随着Mythos级模型被视作高风险,中国也将监管其发布,且建造该类模型需要大量可监管的计算资源,因此持续开源Mythos级模型并不现实。开源权重(open weights)未来仍会存在,但仅限于非前沿模型。

Ethan Mollick: I honestly don't understand the assumption that there will be continued open weights models. At some point, China will r...

大佬观点开源生态
21:19
gabriel@gabriel1
32
美国在一年或两年内撤销对一个发达国家的AI访问,可能使其变成一个发展中国家 开源似乎越来越落后,差距6-12个月 大多数工作将通过AI完成,许多公司在模型token上的花费将超过员工
开源生态现象/趋势
20:26
Chubby♨️@kimmonismus
64
智谱 AI 发布旗舰模型 GLM-5.2,面向所有 GLM Coding Plan 用户(Lite/Pro/Max/Team)。模型具备强大编码能力、可用 1M 上下文支持及长任务优势。API 和聊天机器人服务将于下周上线,模型也将于下周在 MIT 许可证下正式开源。该发布正值美国政府决策被视为开源最大 PR,中国开源模型可借此定位为自由软件。

Z.ai: Intelligence should be open, accessible, and ready to build with, empowering every developer, everywhere. GLM-5.2 is now...

开源生态模型发布
18:16
Berryxia.AI@berryxia
58
GLM-5.2作为智谱新旗舰模型,主打编码能力,支持可用的1M上下文,并在长任务上表现强劲。目前已面向所有GLM Coding Plan用户(包括Lite、Pro、Max、Team)开放,API和Chatbot服务将于下周上线。同时,该模型将于下周在MIT许可证下正式开源。

Z.ai: Intelligence should be open, accessible, and ready to build with, empowering every developer, everywhere. GLM-5.2 is now...

开源生态模型发布编码
17:47
MiniMax (official)@MiniMax_AI
47
MiniMax M3 支持已添加到 mlx-vlm,包含 MSA 实现!🚀 在 M3 Ultra 512GB 上测试,运行速度 24 tps,峰值内存约 240GB。目前正在优化性能并添加大量测试 💪 模型:https://huggingface.co/mlx-community/MiniMax-M3-4bit PR:https://github.com/Blaizzy/mlx-vlm/pull/1374 我们喜爱社区用 M3 开放权重构建的一切 ♥️ 期待下一步

Ivan Fioravanti ᯅ: MiniMax M3 support added to mlx-vlm with MSA implementation! 🚀 Tested on M3 Ultra 512GB running at 24 tps with peak mem...

开源/仓库开源生态端侧
17:07
meng shao@shao__meng
77
智谱(Zhipu AI)推出新旗舰模型GLM-5.2,已对GLM Coding Plan所有用户(Lite/Pro/Max/Team)开放。该模型具备强大编码能力,支持1M上下文窗口,在长周期任务中表现持续优秀。API和Chatbot服务将于下周上线,模型也将于下周以MIT许可证正式开源。智谱在声明中强调"前沿智能不应只属于少数人",并暗讽大洋彼岸某厂商和政府,称未来AI属于开放和大众。

Z.ai: Intelligence should be open, accessible, and ready to build with, empowering every developer, everywhere. GLM-5.2 is now...

开源生态模型发布编码
16:48
Orange AI@oran_ge
73
Fable 5 下架引发闭源担忧,Kimi 发布 K2.7 Code,智谱宣布 GLM 5.2

Anthropic 的 Fable 5 被美国政府以国家安全为由要求全面下架,用户无法购买。博主指出闭源模型的智能可能成为限购商品,呼吁开源模型。昨日 Kimi 发布开源 coding 模型 K2.7 Code,coding 能力较上一代提升 20%,过度思考问题优化,思考 token 减少 30%;API 输入 6.5、输出 27、缓存 1.3。智谱因 Fable 5 事件紧急宣布即将发布 GLM 5.2,称前沿智能不应只属于少数人。

Anthropic大佬观点开源生态政策/监管
16:46
数字生命卡兹克@Khazix0918
61
GLM-5.2作为智谱新旗舰模型,今晚已向所有Coding Plan用户(Lite/Pro/Max/Team)开放,支持1M可用的上下文窗口,具备强大的编码能力。API和Chatbot服务将于下周推出,模型也将在下周以MIT许可证正式开源。

Z.ai: Intelligence should be open, accessible, and ready to build with, empowering every developer, everywhere. GLM-5.2 is now...

开源生态模型发布编码
16:14
Z.ai@Zai_org
73
智谱 GLM-5.2 旗舰模型发布:1M 上下文、下周开源

智谱(Z.ai)发布新旗舰模型 GLM-5.2,现已对 GLM Coding Plan 用户(Lite/Pro/Max/Team 计划)开放。该模型具备强大编程能力、可用的 1M 上下文支持,并延续长程任务优势。API 和聊天机器人服务将于下周上线,模型也将于下周以 MIT 许可证正式开源。

开源生态模型发布编码
关联讨论 8 条公众号:智谱(GLM)Hacker News 热门(buzzing.cc 中文翻译)X:硅基流动 SiliconFlow (@SiliconFlowAI)Simon Willison 博客The Decoder:AI News(RSS)Nathan Lambert:Interconnects(RSS)智谱:研究(网页内嵌数据)Hugging Face:Blog(RSS)
12:15
MiniMax (official)@MiniMax_AI
78
MiniMax 宣布其 M3 模型的权重已开源(HuggingFace 链接)。此前,Anthropic 因美国以国家安全为由发布出口管制指令,被迫立即禁用 Fable 5 和 Mythos 5 模型,禁止任何外国国民访问(包括外国员工)。MiniMax 以"M3 would never"暗讽其模型不受此类限制,并强调权重已开放。

Anthropic: The US government, citing national security authorities, has issued an export control directive to suspend all access to...

Hugging Face开源生态模型发布
关联讨论 12 条X:MiniMax (@MiniMax_AI)MiniMax:Blog(网页)X:Kim (@kimmonismus)X:Testing Catalog (@testingcatalog)HuggingFace Daily Papers(社区热门论文)公众号:MiniMax(稀宇科技)X:OpenRouter (@OpenRouter)X:karminski (@karminski3)X:硅基流动 SiliconFlow (@SiliconFlowAI)X:歸藏 (@op7418)MarkTechPost(RSS)IT之家(RSS)
11:09
elvis@omarsar0
23
开源AI必须赢!
大佬观点开源生态
10:45
MiniMax (official)@MiniMax_AI
80
MiniMax 发布全新开源模型 M3,具备前沿编码、智能体能力、原生图像视频输入、Computer Use 及 1M-token 上下文窗口。核心采用 MSA 稀疏注意力架构:每个 query 仅对 128-token 的 KV 块打分,只关注 top 块,使超长上下文实际可部署。M3 在 vLLM 获 Day-0 支持,已在 NVIDIA 和 AMD 硬件验证,包括 MSA 专用 prefill/decode kernel、1M-token 上下文服务(prefix caching + chunked prefill)、BF16/MXFP8 检查点(Hopper 和 Blackwell 的 MoE 后端)、原生多模态输入,以及工具调用、推理解析和思考模式控制等功能。

vLLM: 🎉 Congrats to @MiniMax_AI on releasing MiniMax M3! Frontier coding and agentic capabilities, native image and video inp...

多模态开源生态推理模型发布
关联讨论 12 条X:MiniMax (@MiniMax_AI)MiniMax:Blog(网页)X:Kim (@kimmonismus)X:Testing Catalog (@testingcatalog)HuggingFace Daily Papers(社区热门论文)公众号:MiniMax(稀宇科技)X:OpenRouter (@OpenRouter)X:karminski (@karminski3)X:硅基流动 SiliconFlow (@SiliconFlowAI)X:歸藏 (@op7418)MarkTechPost(RSS)IT之家(RSS)
10:45
MiniMax (official)@MiniMax_AI
42
M3 正在与 @togethercompute 携手运行 🤝,推理速度比以往更快。MiniMax-M3 是开源权重的原生多模态模型,支持 1M 上下文、稀疏注意力和思考/非思考模式,Together AI 推理优化带来高达 125% 的吞吐量提升。

Together AI: MiniMax-M3 from @MiniMax_AI is now available on Together AI. It's an open-weight native multimodal model with 1M context...

开源生态行业动态
08:27
ginobefun@hongming731
47
Anthropic AI民调、黄仁勋谈AI工厂、Kimi K2.7 Code开源

Anthropic首份全美AI民调覆盖51993人:48%期待AI攻克癌症,64%担心失业,仅15%信任AI公司自行开发。黄仁勋以发电机类比AI工厂,提出五层产业蛋糕(能源/芯片/设施/模型/应用),每个计算单元含72颗芯片、造价约400万美元。月之暗面开源Kimi K2.7 Code编程模型,相比K2.6平均token消耗减少30%,Kimi Code Bench v2提升21.8%,Program-Bench提升11%,MLS Bench Lite提升31.5%。

Anthropic开源生态编码行业动态
08:07
SemiAnalysis@SemiAnalysis_
63
祝贺 @vllm_project 和 @lmsysorg 在 CUDA 和 ROCm 堆栈上于第 0 天发布 MiniMax M3 428B!MiniMax M3 包含: 🟠 块稀疏注意力,预填充比 M2.7 快 9 倍 🟠 第 0 天开放 MXFP8 权重 🟠 此外,@Inferact 发布了第 0 天 EAGLE3 开放权重草稿模型支持 期待尝试 MiniMax M3 的性能!
开源生态推理模型发布部署/工程
07:16
Orange AI@oran_ge
精选75
Oran Ge 开源《人味儿写作心法.skill》解决AI写作缺人味

Oran Ge 让 Claude Fable 5 打磨文案三遍,发现改稿越来越讲究却缺“人味儿”。他与 AI 讨论后得出结论:人写的文字背后有“存在感”——作者在具体位置付出过具体代价,而 AI 无法复现。为此他制作了《人味儿写作心法.skill》,专用于自写文章或口述后让 AI 改稿的场景,旨在保留文字的人味。该技能已开源免费发布在 GitHub。

AnthropicGitHub开源生态教程/实践

推荐理由:Oran Ge 把 AI 写作缺人味儿的痛点提炼成《人味儿写作心法.skill》,不是教你雕琢辞藻,而是给你的 Agent 注入存在感。做内容的可以直接套用。
05:43
MiniMax (official)@MiniMax_AI
同事件精选82
MiniMax M3 发布,具备前沿编码与智能体能力,原生图像视频输入和计算机使用,1M-token 上下文。核心采用 MSA 稀疏注意力:每个 query 评分 128-token KV 块,仅对 top 块做注意力。vLLM 当日即支持 M3,包括专用 MSA prefill/decode 核、前缀缓存与分块 prefill、BF16 和 MXFP8 检查点、Hopper 与 Blackwell 的 MoE 后端,并在 NVIDIA 与 AMD 硬件上验证。同时支持原生多模态输入、工具调用、推理解析和思考模式控制等智能体工作负载。

vLLM: 🎉 Congrats to @MiniMax_AI on releasing MiniMax M3! Frontier coding and agentic capabilities, native image and video inp...

多模态开源生态推理模型发布
同一事件,精选展示《MiniMax M3:前沿编码、100万token上下文与原生多模态一体模型》
推荐理由:M3把1M上下文从‘理论上能做’变成了‘今天就能部署’,MSA稀疏注意力是关键,开源社区和推理框架的深度合作值得关注。
‹ 上一页
1…56789…20
下一页 ›