6月17日

06:26

Hacker News 热门（buzzing.cc 中文翻译）

TNO 联合 SURF 和荷兰法医研究所（NFI）正构建独立荷兰语言模型 GPT‑NL，旨在增强荷兰与欧洲的数字自主权。该模型完全从零训练，避免数据溯源不清和版权风险；数据收集严格保护知识产权、去除个人数据、排除机密和有害内容。GPT‑NL 强调开放透明，公开源代码，模型权重在受控许可下发布。项目获荷兰企业局（RVO）1350 万欧元公共资金，致力于在治理、隐私和价值观上实现主权与可信的 AI。

开源生态数据/训练行业动态

05:56

Chubby♨️@kimmonismus

GLM-5.2 以 Elo 1360 在 Design Arena 代码类别中跃居第一，超越现已下架的 Claude Fable 5，且权重开放。这是自该榜单启动以来代码类别的最高 Elo 分数之一，较之前提升了 4 个名次和 27 Elo 分。 Open Source is so back. Let's freaking go

Design Arena: BREAKING: GLM-5.2 is now 1st on Design Arena. With an Elo of 1360, GLM-5.2 has jumped ahead of the now unavailable Claud...

开源生态编码评测/基准

05:53

MiniMax (official)@MiniMax_AI

本周末，我们将把 M3 开源权重带到首届 RSI 聚焦的黑客马拉松，由 @hud_evals × @ycombinator 联合主办。在 24 小时内，顶尖构建者将把可验证任务转化为 RL 环境、评测、RFT 工作流和 AI 智能体。因为你可以改进任何你能验证的事情上的模型。唯一剩下的问题是：你会教它们什么？ RSVP 开放至明天，6 月 17 日 👇

开源生态行业动态

05:05

Rohan Paul@rohanpaul_ai

DeepSeek获74亿美元融资，估值500亿美元成中国AI第一

DeepSeek完成74亿美元融资，估值达500亿美元，成为中国估值最高的AI初创公司。创始人梁文峰在融资前持股近90%，并以约30亿美元个人出资成为最大投资方。本轮主要投资者包括腾讯（约15亿美元）、宁德时代（约7.4亿美元）以及国家人工智能产业投资基金（约1.5亿美元）。DeepSeek计划继续推进开源模型和AGI研究，同时帮助华为等国内芯片制造商在美国芯片限制下运行强大模型。

DeepSeek 开源生态行业动态

03:56

Nathan Lambert@natolambert

很难精确衡量开源与闭源的差距等等，但我信任 @arena 团队，直接看 GLM 5.2 所处的位置就行。这是一个采用 MIT 许可证、即将开源权重的模型。到这一步，你甚至可以说它的智能体比 Gemini 还要好。这是实打实的成就。

智能体大佬观点开源生态

03:55

elvis@omarsar0

Z.AI 发布 GLM-5.2，采用 MIT 许可证开源权重。模型在编码与智能体任务上显著提升，支持 1M 上下文窗口，具备长时能力。提供两种推理力度：GLM-5.2 （max）与 GLM-5.2 （high），后者平衡性能与 token 效率。API 定价与 GLM-5.1 相同。DAIR.AI 的 Elvis Saravia 评价其在前沿开放权重模型中表现令人印象深刻，并关注其长时任务表现。

Z.ai: Introducing GLM-5.2: Frontier Intelligence, Open Weights - Significant improvements in coding and agentic tasks - Strong...

智能体开源生态推理模型发布

03:25

Nathan Lambert@natolambert

Design Arena: BREAKING: GLM-5.2 is now 1st on Design Arena. With an Elo of 1360, GLM-5.2 has jumped ahead of the now unavailable Claud...

大佬观点开源生态编码

02:24

Chubby♨️@kimmonismus

精选75

微软考虑为 Copilot Cowork 集成 DeepSeek V4

微软正考虑为 Copilot Cowork 提供微软托管的 DeepSeek V4 版本，作为更便宜的模型选项。Copilot Cowork 将放弃无限定价，转向按使用量计费，原因是成本过高（用户每周执行数百项任务导致费用激增）。若采用 DeepSeek，该模型将是可选的、经过微调与安全防护，并完全托管于 Azure。Axios 报道称微软已微调了一个可用模型，最终决定待定。

Ina Fried: New @axios: Microsoft eyes DeepSeek for Copilot Cowork as it also joins the shift to usage based pricing. Says final dec...

DeepSeek Microsoft 开源生态行业动态

推荐理由：微软考虑在 Copilot Cowork 中引入 DeepSeek V4 作为便宜选项，同时转向按用量计价。如果落地，这不仅是成本策略的转向，更可能打破企业 AI 对开源模型的信任壁垒，定价变革也会给全行业施加压力。

02:24

Chubby♨️@kimmonismus

GLM-5.2 作为开放权重模型发布，采用 MIT 许可，拥有 1M 上下文窗口。提供两种推理模式：max（极限推理）和 high（平衡性能与 token 效率）。在编码和智能体任务上有显著提升，专为大规模实现、自动化研究、性能优化和复杂调试训练。API 定价与 GLM-5.1 保持一致。

Z.ai: Introducing GLM-5.2: Frontier Intelligence, Open Weights - Significant improvements in coding and agentic tasks - Strong...

Hugging Face 开源生态推理模型发布

02:16

🚨 AI News | TestingCatalog@testingcatalog

ZAI 在 Hugging Face 上发布 GLM-5.2，采用 MIT 开源许可，API 定价与 GLM-5.1 相同。模型支持 1M 上下文窗口，提供两种推理努力级别：max（极致性能）和 high（平衡性能与 token 效率）。在编程和 AI 智能体任务上有显著提升，具备长程任务能力。DeepSWE 基准得分 46.2%，创下开源权重模型的 SOTA 纪录。

Z.ai: Introducing GLM-5.2: Frontier Intelligence, Open Weights - Significant improvements in coding and agentic tasks - Strong...

Hugging Face 开源生态推理模型发布

02:03

Z.ai@Zai_org

智谱发布GLM-5.2：开源权重与1M上下文

智谱（Z.ai）正式发布GLM-5.2，采用MIT开源协议开放模型权重。相比前代，在编码和智能体任务上有显著提升，支持1M上下文窗口。提供两种推理努力级别：GLM-5.2（max）追求极致性能，GLM-5.2（high）在效果与token效率间取得平衡。API定价与GLM-5.1保持一致。技术博客、权重及API文档均已上线。

开源生态模型发布编码

00:53

eric zakariasson@ericzakariasson

非常兴奋能加入这个才华横溢的团队。很多工作正在进行中！（引用推文要点：Cursor宣布与SpaceX联手，推动实用AI前沿，预计Cursor将很快迎来重大改进。）

Cursor: We're excited to join forces with @SpaceX to advance the frontier of useful AI. Expect significant improvements to Curso...

开源生态行业动态

00:52

Jim Fan@DrJimFan

NVIDIA GEAR 实验室推出 ENPIRE：首次在物理世界启用 AutoResearch

NVIDIA GEAR 实验室首次在物理世界启用 AutoResearch，推出 ENPIRE 项目。给 8 个 Codex 智能体分配机器人舰队、GPU 和 token 预算，目标快速安全完成任务。人类退出后，机器人舰队自主学会寻找视觉线索、重置场景、练习新技能、调整控制栈、阅读论文、辩论反思。ENPIRE 能高精度完成扎带、整理细针、安装 GPU 等任务。发现物理扩展：8 机器人并行探索比少机器人效率显著提升。实验室部分可整夜自我改进，早上读取报告。所有内容将开源。

智能体产品更新具身智能开源生态

00:46

🚨 AI News | TestingCatalog@testingcatalog

Mistral预告今夏推出新"fat"开源模型系列

Mistral 预告将在今年夏季推出一个新的“fat”模型系列，模型为 open-weight，7 月面向研究、政府和行业关键合作伙伴开放早期访问。官方称该系列“fat indeed, but sparse”（大但稀疏），并强调开放权重对客户信任和开发者社区至关重要。后续模型也将保持开源。此外，推文还提及了“Le Chaton Fat”的代号。

Arthur Mensch: We somehow got put in the spotlight the last few days! First we'd like to thank the organizers of the AI show for that, ...

开源生态模型发布

6月16日

23:27

向阳乔木@vista8

Factory AI CEO 播客：开源模型与AI未来趋势

Factory AI CEO 在播客中分享观点：约80%-90%的任务可用开源模型完成，顶级模型更适合规划与决策；AI工具对高杠杆人群提升更大，低杠杆者受益有限；未来最值钱的工程师是能端到端拥有业务结果的人，而非仅写代码者；预计三年内Token支出中位数将与薪资处于同一数量级。

大佬观点开源生态编码

23:27

向阳乔木@vista8

一个轻量快速的RSS免费客户端，还支持用自己的API key做 AI总结、问答。感觉Papr是个不错的项目，地址和安装见评论区。

开源/仓库开源生态

22:18

Chubby♨️@kimmonismus

Axios：白宫对Anthropic Claude Fable 5出口管制引发行业信任危机

Axios报道称行业担忧白宫对Anthropic最新模型Claude Fable 5的出口管制可能损害整个美国AI产业。核心问题是信任——如德意志银行Jim Reid所言，“你不能依赖可能被关闭的东西”。若公司担心OpenAI、Anthropic或Google的未来前沿模型可被一夜限制，它们将加速多元化，这为开源模型带来重大优势。据Wired，Anthropic与特朗普政府周一谈判无果，对Fable 5的出口管制仍在持续。核心分歧：Fable 5的护栏能否被剥离以解锁更强大的Mythos能力——NSA认为可以，Anthropic则认为风险被夸大。目前尚无下一步方案。

Chubby♨️: Update on Fable5/Anthropic: Anthropic flew its top security people to DC. The export controls are still there. Via Wired...

Anthropic 安全/对齐开源生态行业动态

22:01

Nathan Lambert：Interconnects（RSS）

前沿大模型后训练配方回顾：与 Finbarr Timbers 对谈

Interconnects 播客邀请 Finbarr Timbers 回顾后训练配方的演变：从 InstructGPT 的 SFT→奖励模型→RL 三阶段，到 Llama 3 / Tülu 3 的 SFT→DPO→可验证奖励 RL，再至 DeepSeek R1 以大规模 RL 为核心。2026 年配方分化为多个领域专家模型再合并回统一模型。新出现模式为 Multi-teacher On-Policy Distillation（MOPD）：训练 N 个领域专家（经 SFT 和领域 RL），再通过在线采样、逐 token 最小化反向 KL 散度训练通用学生模型。MiMo Flash V2 率先引入，DeepSeek V4 与 Nemotron 3 Ultra 扩展至超过 10 个教师。MOPD 兴起源于单一 RL 流程在多领域间产生能力冲突，而专家模型易于并行训练，在线蒸馏技术日趋成熟。

DeepSeek 大佬观点开源生态推理

21:50

Ant Ling@AntLingAGI

Ling & Ring 2.6 技术报告发布，带来两款开放权重基座模型。我们通过架构、训练和智能体能力的协同设计，共同优化模型与系统： • 7：1 混合线性注意力 • 用于稳定智能体强化学习的 KPop：SWE-bench Verified 76.28% • 约 4 倍 token 效率

开源生态推理模型发布编码

关联讨论 4 条

17:57

The Decoder：AI News（RSS）

同事件精选72

DeepSeek 完成首轮外部融资，估值超 500 亿美元

中国 AI 初创公司 DeepSeek 完成首轮外部融资，募资超 500 亿元人民币（约 74 亿美元），估值超 500 亿美元。投资结构特殊：多数投资者将资金投入 CEO 梁文锋管理的有限合伙企业，无投票权且锁定期五年；仅国资 AI 基金直接投资并保留投票权。创始人梁文锋个人投入约 200 亿元，腾讯和宁德时代为主要外部投资者。梁文锋表示优先基础 AI 研究与 AGI 开发，将继续开源。DeepSeek 去年初凭 V3、R1 模型获全球关注，今年 4 月发布运行于华为芯片的最大开源权重模型 V4，并将 V4 Pro 永久折扣 75%，输入价格约为 OpenAI GPT-5.5 的 1/11，输出价格约为 1/35。

DeepSeek 开源生态行业动态

同一事件，精选展示《DeepSeek 推进 700 亿元融资，梁文锋承诺坚持开发开源 AI 模型而非追求短期商业化目标》

推荐理由：DeepSeek 首次外部融资估值冲到 500 亿美元，交易结构却排除了投资人话语权，看得出梁文锋仍把控制权抓得很紧，开源路线和极致性价比是最大的筹码。

12:39

Qwen：Blog Retrieval（API）

同事件精选72

Qwen-RobotManip：对齐解锁机器人操作基础模型的规模化能力

Qwen-RobotManip 是通义千问基于 Qwen-VL 的视觉-语言-动作（VLA）基础模型，引入覆盖表示、运动和行为三维度的统一对齐框架。仅使用开源机器人数据集和人演示视频，构建约 38,100 小时预训练语料，涵盖 15 种机器人形态。在 LIBERO-Plus 达 91.4%，RoboTwin-C2R Hard 达 69.4%，RoboCasa365 Composite-Unseen 达 14.9%，EBench 达 45.6%，RoboTwin-IF 达 72.0%，并在 RoboChallenge Table30 v1 generalist track 夺冠。模型采用 80 维状态-动作表示、人-机器人数据合成管道（1,933 小时第一人称视频转 24,808 小时数据）及上下文策略适配。

具身智能开源生态数据/训练模型发布

同一事件，精选展示《Qwen-RobotWorld：具身智能体的无界世界》

推荐理由：Qwen 这次发布的机器人模型，用统一对齐框架把跨实体数据规模化训练跑通了，OOD 泛化大幅领先，做具身智能的值得认真看一下。

09:59

Berkeley RDI：Blog（AI 安全与评测）

精选83

伯克利RDI发布Agents' Last Exam基准

2026年6月，伯克利RDI发布Agents’ Last Exam（ALE）基准，包含1,500余项源于真实工作的任务，覆盖55个非体力职业。对Fable 5、GPT-5.5、Composer 2.5等前沿智能体的测评显示：在最困难层级成功率均为0%；整体任务表现接近，但单任务成本差异巨大（Fable 5约$15.70，GPT-5.5约$3.80，Composer 2.5约$1.33）。CLI子集ALE-CLI最佳通过率仅25.2%。主要失败模式是智能体未验证输出即宣称完成。数据集、代码及CLI子集已开源。

智能体 arXiv Hugging Face 开源生态

推荐理由：在Fable 5发布后，Berkeley的ALE基准首次大规模量化了agent在专业任务上的真实水平，最难任务0%成功率的结果值得所有押注agent落地的团队冷静下来。

08:48

ginobefun@hongming731

BestBlogs 早报 · 06-16

BestBlogs精选10篇AI行业文章：Token成本控制大头在系统提示词、Skill和会话历史；AI Agent工具设计强调单一职责、强约束schema、幂等键；循环工程（Loop）作为新范式让模型连续跑规则；Scaling Law参数空转扮演骨架角色；GlobalGPT零融资做到千万美金ARR；AI应用层泡沫破裂，Sora等180天关停；Anthropic旗舰模型Fable 5遭美国政府出口管制禁令；夏勇峰暂停智能眼镜业务转向“为AI造硬件”；SpaceX登陆纳斯达克市值超2万亿美元；利用盖亚卫星18亿颗恒星数据模拟银河图像。

ginobefun: http://x.com/i/article/2066671362920599553

智能体其他开源生态编码