TNO 联合 SURF 和荷兰法医研究所(NFI)正构建独立荷兰语言模型 GPT‑NL,旨在增强荷兰与欧洲的数字自主权。该模型完全从零训练,避免数据溯源不清和版权风险;数据收集严格保护知识产权、去除个人数据、排除机密和有害内容。GPT‑NL 强调开放透明,公开源代码,模型权重在受控许可下发布。项目获荷兰企业局(RVO)1350 万欧元公共资金,致力于在治理、隐私和价值观上实现主权与可信的 AI。
TNO 联合 SURF 和荷兰法医研究所(NFI)正构建独立荷兰语言模型 GPT‑NL,旨在增强荷兰与欧洲的数字自主权。该模型完全从零训练,避免数据溯源不清和版权风险;数据收集严格保护知识产权、去除个人数据、排除机密和有害内容。GPT‑NL 强调开放透明,公开源代码,模型权重在受控许可下发布。项目获荷兰企业局(RVO)1350 万欧元公共资金,致力于在治理、隐私和价值观上实现主权与可信的 AI。
BREAKING: GLM-5.2 is now 1st on Design Arena. With an Elo of 1360, GLM-5.2 has jumped ahead of the now unavailable Claud...
DeepSeek完成74亿美元融资,估值达500亿美元,成为中国估值最高的AI初创公司。创始人梁文峰在融资前持股近90%,并以约30亿美元个人出资成为最大投资方。本轮主要投资者包括腾讯(约15亿美元)、宁德时代(约7.4亿美元)以及国家人工智能产业投资基金(约1.5亿美元)。DeepSeek计划继续推进开源模型和AGI研究,同时帮助华为等国内芯片制造商在美国芯片限制下运行强大模型。
Introducing GLM-5.2: Frontier Intelligence, Open Weights - Significant improvements in coding and agentic tasks - Strong...
BREAKING: GLM-5.2 is now 1st on Design Arena. With an Elo of 1360, GLM-5.2 has jumped ahead of the now unavailable Claud...
微软正考虑为 Copilot Cowork 提供微软托管的 DeepSeek V4 版本,作为更便宜的模型选项。Copilot Cowork 将放弃无限定价,转向按使用量计费,原因是成本过高(用户每周执行数百项任务导致费用激增)。若采用 DeepSeek,该模型将是可选的、经过微调与安全防护,并完全托管于 Azure。Axios 报道称微软已微调了一个可用模型,最终决定待定。
New @axios: Microsoft eyes DeepSeek for Copilot Cowork as it also joins the shift to usage based pricing. Says final dec...
Introducing GLM-5.2: Frontier Intelligence, Open Weights - Significant improvements in coding and agentic tasks - Strong...
Introducing GLM-5.2: Frontier Intelligence, Open Weights - Significant improvements in coding and agentic tasks - Strong...
智谱(Z.ai)正式发布GLM-5.2,采用MIT开源协议开放模型权重。相比前代,在编码和智能体任务上有显著提升,支持1M上下文窗口。提供两种推理努力级别:GLM-5.2(max)追求极致性能,GLM-5.2(high)在效果与token效率间取得平衡。API定价与GLM-5.1保持一致。技术博客、权重及API文档均已上线。
We're excited to join forces with @SpaceX to advance the frontier of useful AI. Expect significant improvements to Curso...
NVIDIA GEAR 实验室首次在物理世界启用 AutoResearch,推出 ENPIRE 项目。给 8 个 Codex 智能体分配机器人舰队、GPU 和 token 预算,目标快速安全完成任务。人类退出后,机器人舰队自主学会寻找视觉线索、重置场景、练习新技能、调整控制栈、阅读论文、辩论反思。ENPIRE 能高精度完成扎带、整理细针、安装 GPU 等任务。发现物理扩展:8 机器人并行探索比少机器人效率显著提升。实验室部分可整夜自我改进,早上读取报告。所有内容将开源。
Mistral 预告将在今年夏季推出一个新的“fat”模型系列,模型为 open-weight,7 月面向研究、政府和行业关键合作伙伴开放早期访问。官方称该系列“fat indeed, but sparse”(大但稀疏),并强调开放权重对客户信任和开发者社区至关重要。后续模型也将保持开源。此外,推文还提及了“Le Chaton Fat”的代号。
We somehow got put in the spotlight the last few days! First we'd like to thank the organizers of the AI show for that, ...
Factory AI CEO 在播客中分享观点:约80%-90%的任务可用开源模型完成,顶级模型更适合规划与决策;AI工具对高杠杆人群提升更大,低杠杆者受益有限;未来最值钱的工程师是能端到端拥有业务结果的人,而非仅写代码者;预计三年内Token支出中位数将与薪资处于同一数量级。
Axios报道称行业担忧白宫对Anthropic最新模型Claude Fable 5的出口管制可能损害整个美国AI产业。核心问题是信任——如德意志银行Jim Reid所言,“你不能依赖可能被关闭的东西”。若公司担心OpenAI、Anthropic或Google的未来前沿模型可被一夜限制,它们将加速多元化,这为开源模型带来重大优势。据Wired,Anthropic与特朗普政府周一谈判无果,对Fable 5的出口管制仍在持续。核心分歧:Fable 5的护栏能否被剥离以解锁更强大的Mythos能力——NSA认为可以,Anthropic则认为风险被夸大。目前尚无下一步方案。
Update on Fable5/Anthropic: Anthropic flew its top security people to DC. The export controls are still there. Via Wired...
Interconnects 播客邀请 Finbarr Timbers 回顾后训练配方的演变:从 InstructGPT 的 SFT→奖励模型→RL 三阶段,到 Llama 3 / Tülu 3 的 SFT→DPO→可验证奖励 RL,再至 DeepSeek R1 以大规模 RL 为核心。2026 年配方分化为多个领域专家模型再合并回统一模型。新出现模式为 Multi-teacher On-Policy Distillation(MOPD):训练 N 个领域专家(经 SFT 和领域 RL),再通过在线采样、逐 token 最小化反向 KL 散度训练通用学生模型。MiMo Flash V2 率先引入,DeepSeek V4 与 Nemotron 3 Ultra 扩展至超过 10 个教师。MOPD 兴起源于单一 RL 流程在多领域间产生能力冲突,而专家模型易于并行训练,在线蒸馏技术日趋成熟。
中国 AI 初创公司 DeepSeek 完成首轮外部融资,募资超 500 亿元人民币(约 74 亿美元),估值超 500 亿美元。投资结构特殊:多数投资者将资金投入 CEO 梁文锋管理的有限合伙企业,无投票权且锁定期五年;仅国资 AI 基金直接投资并保留投票权。创始人梁文锋个人投入约 200 亿元,腾讯和宁德时代为主要外部投资者。梁文锋表示优先基础 AI 研究与 AGI 开发,将继续开源。DeepSeek 去年初凭 V3、R1 模型获全球关注,今年 4 月发布运行于华为芯片的最大开源权重模型 V4,并将 V4 Pro 永久折扣 75%,输入价格约为 OpenAI GPT-5.5 的 1/11,输出价格约为 1/35。
同一事件,精选展示《DeepSeek 推进 700 亿元融资,梁文锋承诺坚持开发开源 AI 模型而非追求短期商业化目标》Qwen-RobotManip 是通义千问基于 Qwen-VL 的视觉-语言-动作(VLA)基础模型,引入覆盖表示、运动和行为三维度的统一对齐框架。仅使用开源机器人数据集和人演示视频,构建约 38,100 小时预训练语料,涵盖 15 种机器人形态。在 LIBERO-Plus 达 91.4%,RoboTwin-C2R Hard 达 69.4%,RoboCasa365 Composite-Unseen 达 14.9%,EBench 达 45.6%,RoboTwin-IF 达 72.0%,并在 RoboChallenge Table30 v1 generalist track 夺冠。模型采用 80 维状态-动作表示、人-机器人数据合成管道(1,933 小时第一人称视频转 24,808 小时数据)及上下文策略适配。
同一事件,精选展示《Qwen-RobotWorld:具身智能体的无界世界》2026年6月,伯克利RDI发布Agents’ Last Exam(ALE)基准,包含1,500余项源于真实工作的任务,覆盖55个非体力职业。对Fable 5、GPT-5.5、Composer 2.5等前沿智能体的测评显示:在最困难层级成功率均为0%;整体任务表现接近,但单任务成本差异巨大(Fable 5约$15.70,GPT-5.5约$3.80,Composer 2.5约$1.33)。CLI子集ALE-CLI最佳通过率仅25.2%。主要失败模式是智能体未验证输出即宣称完成。数据集、代码及CLI子集已开源。
BestBlogs精选10篇AI行业文章:Token成本控制大头在系统提示词、Skill和会话历史;AI Agent工具设计强调单一职责、强约束schema、幂等键;循环工程(Loop)作为新范式让模型连续跑规则;Scaling Law参数空转扮演骨架角色;GlobalGPT零融资做到千万美金ARR;AI应用层泡沫破裂,Sora等180天关停;Anthropic旗舰模型Fable 5遭美国政府出口管制禁令;夏勇峰暂停智能眼镜业务转向“为AI造硬件”;SpaceX登陆纳斯达克市值超2万亿美元;利用盖亚卫星18亿颗恒星数据模拟银河图像。
http://x.com/i/article/2066671362920599553
MiniMax M3模型正式开源,支持原生多模态和百万token上下文。发布两周以来,M3在Artificial Analysis综合智能指数排行榜上取得全球开源模型最高排名。
The AI community seems to increasingly be heading towards a polarized world when discussing safety and consolidated powe...
东京 AI 公司 Sakana AI 发布首个商业产品 Sakana Marlin,定位为虚拟首席战略官(Virtual CSO)的 B2B 自主研究智能体。输入主题后,Marlin 自主运行最多约8小时,输出数十至100页详细报告(含正文、参考文献和附录)及 AI 生成的幻灯片。核心算法是自适应分支蒙特卡洛树搜索(AB-MCTS),可动态选择“扩宽”或“加深”。产品经2026年4月封闭测试(约300名专业人士)优化,已与三菱 UFJ 金融集团合作,获花旗集团战略投资。定价按次付费(每次100积分,每积分98日元)及 Pro(月费15万日元,含2000积分)、Team(月费40万日元,含6000积分)套餐,AB-MCTS 已以 Apache 2.0 许可证开源。
Anthropic 举办的 Built with Opus 4.7 Claude Code 黑客马拉松公布三位获奖者。第一名 Medkit(Bedirhan Keskin 构建)是模拟真实诊疗场景的医学训练工具,已获三所医学院和一家制药公司试点。第二名 Wrench Board(Alexis Chapellier 开发)可解析电路原理图和板视图,定位故障点,依赖 Opus 4.7 的视觉理解能力。第三名 Maieutic(Paula Vásquez-Henríquez 创建)旨在帮助学生理解自己生成的代码。
一篇讨论欧洲是否具备自持计算能力以训练前沿AI模型的文章在Hacker News引发关注。文章围绕欧洲现有算力基础设施能否支撑前沿模型训练展开,未提及具体模型、参数规模或 benchmark 数据。
宝玉(@dotey)公开了《图解Skill》配套GitHub仓库中的info-digest Skill,用于日常整理AI资讯并生成推文初稿,默认调用Claude网页版+Opus 4.6。核心提示词技巧:1)站在读者角度写作;2)联网检索做实核查;3)交代背景信息;4)生成短而精炼的纯文本格式。该Skill为项目库JimLiu/Illustrated-Agent-Skills的一部分。同步有抽奖活动(转发/引用/评论抽10人,本周五中午12点,使用Grok抽奖)。
🎟️抽奖啦!为了回馈读者们对《图解 Skill -- AI 提效实战指南》这本书的支持,也搞一次抽奖活动,抽 10 个人,北京时间本周五中午12点开奖。 规则很简单:转发、引用、评论这条推文就可以。 可以选择实体书(仅限内地地址)或者电子...
美国政府关闭 Anthropic 的 Fable 访问,开源和本地模型成必备;Satya Nadella 主张 AI 生态护城河应是人类专业知识和模型外围系统;Salesforce 以 36 亿美元收购 Fin(前 Intercom),Fin 利用开源模型实现性价比。这三件事标志 AI 应用进入黄金时代。构建 AI 应用的难点:在 Kimi K2.6、Qwen 3.6 27b、GLM 5.1 等不同特性模型中选择;设计智能体系统的 hill-climbing 循环;持续评估模型+循环性能以最大化 token 预算中的智能。掌握这三项技能的公司将主导这一时代。
同一事件,精选展示《关于美国政府指令暂停访问Fable 5和Mythos 5的声明》DAIR AI 创始人 Elvis Saravia 开源 /learn skill,允许用户通过 AI 智能体和 HTML artifacts 学习任意主题。该 skill 可安装后与任何 Agent 交互,生成视觉化、交互式的 artifact,帮助深入理解或生成知识检测(如测验)。支持 DAIR Academy pro 会员在 AI Builder 中使用。GitHub 链接及试用平台已开放。
巴西里约市政府旗下IplanRIO推出的开源模型Rio-3.5-Open-397B在多项基准测试取得SOTA,被称为拉美AI新势力。不到24小时,上海创智学院Nex团队指控其套壳阿里千问Qwen3.5和Nex N2 Pro的权重混合版本。Nex展示证据:不提供初始系统提示时模型自称“Nex N2 Pro”并提及“上海创智学院”。IplanRIO在Hugging Face致歉,称因操作失误上传了合并基线版本,将重新上传蒸馏与后训练的正式版。
MiniMax 于 6 月 12 日开源 MiniMax M3 模型权重并发布 MSA 技术论文。M3 是原生多模态旗舰模型,总参数 428B,激活参数 23B,为首个从 Step 0 开始多模态混合训练的开源模型。在 Artificial Analysis 综合智能指数上获全球开源最高排名。输出速度从约 30 TPS 提升至约 80 TPS,后续还将提速 30-40%。M3 在编码与智能体评测中达行业顶尖水平,具备自主任务拆解、工具调用与多步推理能力,上下文支持百万级别。
Sarvam宣布完成2.34亿美元融资,投后估值15亿美元,成为印度最新AI独角兽。HCLTech作为战略投资者领投1.5亿美元,Bessemer Venture Partners及现有投资者跟投。该公司定位全栈AI,专为印度语言和场景设计。其对话AI平台每日处理超200万次交互,推理平台日均约1000万次API调用,语音模型月均转录超50万小时音频,文档AI系统已数字化超3500万页记录。多语言语音代理已为印度农业部从1700万农民收集数据,并为一家头部保险公司支持4500万保单持有人续保。新资金将用于下一代聚焦智能体、编码和网络安全的模型研发及计算基础设施扩展。
腾讯入股由阿里通义千问前负责人林俊旸创立的新AI实验室,首轮出资2000万美元。该轮融资总额达数亿美元,投后估值约20亿美元,由高榕资本和红杉中国各出资1亿美元领投。刚完成本轮融资,林俊旸已在寻求启动新一轮融资。公开资料显示,1993年出生的林俊旸曾是阿里最年轻的P10技术专家,与智谱AI创始人唐杰、月之暗面创始人杨植麟、腾讯首席AI科学家姚顺雨并称“基模四杰”,今年3月从阿里巴巴离职。
开发者@JeffreyCalm分享经历:他将GitHub链接交给Codex部署,发现Bug后Codex自动提Issue。官方仓库的Code Review Bot确认Bug并At Hotfix Bot,后者30分钟内提交修复PR,最后At真人开发者。真人仅回复“OK”即完成Merge。全程人类零编码,仅贡献一个决策确认,折射出Agent经济与A2A平台雏形。
Github 本身在成为一个 A2A 平台。 我本周经历了一个特别魔幻的事情: 1. 我把一个 Github 链接丢给 Codex,让它帮我部署一下。 2. 我用了一段时间,发现似乎有个 Bug。我让 Codex 查了一下,它确认是个 Bu...
Kimi 开源多模态编程模型 Kimi K2.7 Code 推出高速模式 HighSpeed,编码任务中长输入可达约 180 tok/s,短上下文任务最高 260 tok/s,速度提升最多 6 倍。该模式已向 Kimi Code Beta Program 成员、API 开发者及商业用户开放(容量有限),无需邀请,加入 Beta 计划即有机会获得访问权限。Kimi 表示将继续优化模型并扩大接入。
Berry Xia 介绍了基于 Google gemma-4-12B-it 微调的 Gemma 4 12B Coder GGUF 模型。它将 Fable 5 的推理链条蒸馏进 12B 参数模型,训练数据使用 Composer 2.5 真实通过案例并由 Fable 5 辅助补全。GGUF 格式让模型在 12GB 消费级显卡即可本地运行,甚至支持 CPU。模型专为代码生成、调试、复杂算法、链式思考提示等任务优化,无需 API 费用且无导出限制。该模型基于 Google 最新 gemma-4 架构,目前下载量已破六千,社区反馈其在本地 coding 场景表现出色,填补了云端模型与本地可用之间的鸿沟。
Gemma 4 12B Coder is here and it's a game changer for local code generation. This GGUF model packs Google's latest gemma...
昆仑万维Skywork首席科学家成宇在智源大会上介绍SkyReels V4与Mureka V9。SkyReels V4在Artificial Analysis全球视频生成评测中夺得Text to Video(With Audio)与Image to Video(With Audio)双赛道第一,超越Veo 3.1和Sora 2。其四大突破包括双流MMDiT架构实现毫秒级音画同步、全模态强化学习提升视频逻辑连贯性,以及1080p/32FPS/15秒电影级画质联合生成策略。Mureka V9引入MusiCoT音乐思维链技术,实现段落级文本控制与母带级混音,在旋律性(7.25)、表现力(6.89)等维度排名第一。此外,昆仑万维以“4+3”AGI战略支撑AI短剧、AI音乐、AI游戏三大AI原生娱乐经济体。
松延动力在华为开发者大会 HDC 2026 上展出 OpenHarmony 版 N2 人形机器人,定位行业首款开源鸿蒙消费级产品。针对生态孤岛、跨设备开发繁琐、系统占用率高等痛点,N2 凭借开源鸿蒙微内核及 AI 智能体实现语音交互和长程任务自规划,可与手机、智慧屏、智能家居等终端联动,充当家庭管家或教育陪伴角色。同步启动“百人百机”计划,为 100 位开发者提供 N2 及原生 SDK,支持 Ubuntu 与开源鸿蒙生态。