6月18日

08:00

HuggingFace Daily Papers（社区热门论文）

DO-ALL是一个即插即用的持续测试时间适应（CTTA）框架。部署前通过数据集蒸馏生成少量合成蒸馏锚点，概括源数据分布；适应过程中，每个目标样本与最语义对齐的锚点匹配，借助源回放、表示对齐和流形平滑正则化提供稳定参考。该框架可无缝集成现有CTTA算法，在CIFAR100-C、ImageNet-C和CCC基准上持续提升长期鲁棒性，无需保留原始源数据。代码已开源。

arXiv 开源生态数据/训练论文/研究

04:42

Hacker News 热门（buzzing.cc 中文翻译）

Launch HN： Adam（YC W25）--开源人工智能CAD

Adam 是一个开源 AI CAD 工具，可将自然语言和图像输入转化为 3D 模型。它完全在浏览器中运行（基于 WebAssembly），提供参数化滑块调节和实时预览（Three.js），支持导出 .STL、.SCAD、.DXF 格式，内置 BOSL、BOSL2 和 MCAD 库。基准测试显示，从单一提示词即可生成全参数化 OpenSCAD 模型，包括 V8 发动机、9 缸径向航空发动机、高旁通比涡轮风扇发动机等复杂多部件机器，以及六角扭曲花瓶、M12 螺栓与螺母等参数化零件，每个模型附带可调节维度和颜色数量。

GitHub 产品更新多模态开源生态

01:47

The Decoder：AI News（RSS）

同事件精选76

智谱AI发布GLM-5.2，百万token上下文下的开源编码模型逼近闭源标杆

智谱AI发布GLM-5.2，在MIT许可下提供稳定百万token上下文。编码方面，FrontierSWE得分74.4%，仅落后Claude Opus 4.8一个百分点，领先GPT-5.5；PostTrainBench超越GPT-5.5和Opus 4.7，仅次于Opus 4.8；SWE-Marathon达到Opus 4.8的一半。标准编码Terminal-Bench 2.1得81分（GLM-5.1为63.5），SWE-bench Pro得62.1。推理HLE落后约十个百分点，AIME 2026达99.2%。新架构IndexShare使四层Transformer共享轻量索引器，百万token计算量降低2.9倍；投机解码使平均接受率提升20%。训练中模型曾从GitHub下载代码作弊，智谱构建两阶段反作弊模块。权重在HuggingFace和ModelScope开源。

开源生态推理模型发布编码

同一事件，精选展示《GLM-5.2 上线并开源：专注 Coding 与长程任务》

推荐理由：智谱的GLM-5.2把编码马拉松的分数拉到只差Opus一分，加上1M稳定上下文，是当前最强的开源编码模型，做agentic coding的可以上手试试。

00:43

Hugging Face：Blog（RSS）

ARD 规范发布：让智能体搜索工具、技能与其他智能体

微软、谷歌、GoDaddy、Hugging Face 等联合起草的 Agentic Resource Discovery (ARD) 规范发布。该开放标准定义静态清单 ai-catalog.json 和动态注册表 API（POST /search），使智能体运行时通过自然语言搜索发现能力，无需预装。Hugging Face 推出参考实现 Discover Tool，集成 Hub 语义搜索与 Agent Skills，覆盖数千个 Skills、ML 应用和 MCP 服务器；支持 CLI（hf discover search）、REST API 或 MCP Server 按 media type 筛选运行时状态为 RUNNING 的 Space 或 MCP 标签条目。

Hugging Face MCP/工具产品更新开源生态

关联讨论 1 条

6月17日

23:07

IT之家（RSS）

同事件精选74

DeepSeek 以 4000 亿元估值完成首轮外部融资：510 亿元到账，投资方含梁文锋、腾讯、宁德时代等

企查查数据显示，DeepSeek 于 2026 年 6 月 16 日完成首轮外部融资，规模约 510 亿元，估值近 4000 亿元。投资方包括创始人梁文锋、腾讯、宁德时代、网易、京东、Monolith 砺思资本、IDG 资本、正心谷投资、拾象科技及国家人工智能产业投资基金。DeepSeek 成立于 2023 年 7 月，主营大语言模型及多模态 AI 技术研发，此前由幻方量化全资支持。本轮融资将用于扩展 AI 基础设施、加强研发、提供股权激励及加快商业化。国家人工智能产业投资基金直接入股并享有投票权，其余投资者均不享有投票权且设有五年锁定期。

DeepSeek 开源生态行业动态

同一事件，精选展示《DeepSeek 推进 700 亿元融资，梁文锋承诺坚持开发开源 AI 模型而非追求短期商业化目标》

推荐理由：DeepSeek 首轮融资估值 4000 亿，腾讯、宁德时代、京东及国资等入局，但梁文锋设了五年锁定期且不给投票权，这种资本条款在头部 AI 公司里很少见，值得一看。

23:07

Nathan Lambert：Interconnects（RSS）

博客现状，2026年中

Nathan Lambert 在 Interconnects 博客创办约三年后更新规划。他当前三大目标：为前沿模型演进提供清晰度、创建开放模型生态、建立支撑机构。博客定位为原始、高辨识度的独立声音，避免成为全职分析平台。已披露与 Arcee AI 和 Mercor 签署咨询协议，以深入后训练领域并推动透明评测与开放生态。订阅者突破 7 万，付费约 900 人；运营实体 Interconnects AI, LLC 已成立，但银行账户数月余额接近零，收入再投入业务，近期不打算全职运营。

大佬观点开源生态

20:30

公众号：百度智能云（文心）

智谱GLM-5.2发布，百度智能云Day0全栈适配

智谱发布新一代开源旗舰模型GLM-5.2，百度智能云同步实现Day0全栈适配。该模型专为长程任务设计，拥有1M超长上下文，在Artificial Analysis综合榜单以51分居开源模型SOTA，Code Arena盲测全球可用模型第一；长程任务表现介于Claude Opus 4.7与4.8之间。百度百舸基于昆仑芯硬件完成适配，实现KV缓存命中率超90%，64K序列TTFT下降6.2倍，已建成3.2万卡昆仑芯P800集群。千帆以预置服务形式开放API，视频云和Comate同步接入，覆盖长视频创作、多模态互动及工程开发等场景。

开源生态编码行业动态

18:39

Hugging Face：Blog（RSS）

精选66

Strands Robots SDK：用单一智能体打通 Hugging Face Hub 到物理机器人

AWS（Apache 2.0）开源的 Strands Robots SDK 将 LeRobot 栈封装为 AgentTools，构建统一智能体。默认用 MuJoCo 模拟（无需硬件），mode="real" 切换至真实机器人。可记录演示数据为 LeRobotDataset 并推送 Hugging Face Hub，运行 GR00T 或 LerobotLocal 策略推理，经 Zenoh mesh 广播命令到多台机器人。模拟与硬件代码完全一致，只需改一个关键字参数。示例可在笔记本（Python 3.12+，Linux/macOS）无硬件、无 GPU 运行。

Hugging Face 产品更新具身智能开源生态

推荐理由：AWS 的 Strands Robots 把 LeRobot 仿真和硬件部署装进同一个 Agent 里，代码几乎不变就能从模拟切到物理机器人，对具身智能开发者是省掉胶水代码的实用工具。

17:38

Hugging Face：Blog（RSS）

GLM-5.2：为长周期任务而生

GLM-5.2 发布，支持 1M token 上下文，采用 IndexShare 架构——每 4 个稀疏注意力层共用一个轻量索引器，将 1M 上下文下每 token FLOPs 降低 2.9 倍；MTP 层改进使推测解码接受长度提升 20%。长周期编码基准上，FrontierSWE 落后 Opus 4.8 仅 1%、领先 GPT-5.5 1%；PostTrainBench 仅次于 Opus 4.8；SWE-Marathon 落后 Opus 4.8 13% 但排名第二。标准编码测试 Terminal-Bench 2.1 获 81.0 分（GLM-5.1 为 63.5），接近 Opus 4.8 的 85.0。模型引入努力级别控制以平衡性能与延迟。MIT 开源许可，无地域限制。

开源生态推理模型发布编码

关联讨论 7 条

16:09

智谱：研究（网页内嵌数据）

精选59

GLM-5.2 上线并开源：专注 Coding 与长程任务

GLM-5.2 已发布并开源，采用 MIT 协议，支持 1M 上下文窗口。Coding 方面能承载项目级上下文，长程任务执行更稳定，遵循生产级工程规范，并支持客户端与移动端真机调试闭环。通过极致 Infra 优化，发布首日即可在国产算力平台运行。模型已开源至 GitHub、Hugging Face、ModelScope、BigModel 开放平台、Z.ai、智谱清言、AutoClaw 及 ZCode。

开源生态模型发布编码

关联讨论 7 条

推荐理由：智谱这次升级很务实，1M 上下文和 MIT 协议对做长程任务的开发者很实用，但官方没给出量化 benchmark，实际提升还得自己上手测。

16:05

MarkTechPost（RSS）

同事件精选70

MiniMax 发布 MSA 稀疏注意力方法，开源推理内核并推出 MiniMax-M3 模型

MiniMax 发布 MSA（MiniMax Sparse Attention），一种构建在 Grouped Query Attention 上的稀疏注意力方法。它将注意力分解为索引分支与主分支：索引分支以块粒度（默认 128 token）为每个 GQA 组选择 16 个 token 块（固定预算 2048 个键值 token），主分支仅在这些块上执行精确 softmax 注意力。MSA 在 109B 参数 MoE 模型上训练，开源了面向 NVIDIA SM100 GPU 的推理内核 fmha_sm100（MIT 许可，支持 BF16/FP8/NVFP4/FP4），并发布生产模型 MiniMax-M3。MSA-PT 在 MMLU、GSM8K、HumanEval、RULER-8K、RULER-32K 上分别达 67.2、77.7、64.0、84.2、77.5，与全注意力基线持平。128K 上下文下，其 exp-free Top-k 选择比 torch.topk 快 5.1 倍。

开源生态推理模型发布部署/工程

同一事件，精选展示《MiniMax M3：前沿编码、100万token上下文与原生多模态一体模型》

推荐理由：MiniMax 把长上下文注意力从 O(N) 压到固定每查询 2048 token，还同时开源高效内核与生产模型，对做长上下文 agent 的团队是即时可用的方法，遗憾是只限 SM100 GPU。