6月9日

08:00

HuggingFace Daily Papers（社区热门论文）

提出基于累积FLOPs的计算感知评估框架，以计算压力替代固定查询预算，引入风险-计算曲线和两项总结指标。在三个系列、四个训练/对齐阶段的十个模型上，使用梯度、迭代优化和模板三种攻击策略在两个越狱鲁棒性基准上测试发现：对齐训练对计算空间鲁棒性呈非单调影响；模型规模扩大降低梯度攻击效果但对低成本模板攻击影响有限；梯度攻击可跨模型迁移；单个模型内不同危害类别间计算成本差异约5倍；安全对齐的RL增加整体攻击成本，但部分类别仍较易攻破。框架已开源。

安全/对齐开源生态

08:00

HuggingFace Daily Papers（社区热门论文）

精选82

i1：面向强文生图模型的简单且完全开源配方

i1 是一个 3B 参数的文本到图像扩散模型，仅使用公开数据集训练。在 GenEval、DPG、PRISM、CVTG-2K 和 LongText 五个基准上，i1 性能与领先模型相当，平均比最佳现有完全开源模型高 29.5 个百分点。研究基于 300 余项控制实验（超 700K TPU v6e 小时），发现等权重混合 curated 数据集是强默认配置、更大文本编码器适配器以极少参数提升性能。i1 的检查点、训练与推理代码及数据处理流程已全部开源。

arXiv 图像生成多模态开源生态

推荐理由：i1 是第一个用全公开数据、完全开源代码/权重/数据管线打造的 3B 模型，直接把全开放模型的性能拉到可与闭源竞争，对做文生图研究的同行是个扎实起点。

08:00

HuggingFace Daily Papers（社区热门论文）

精选78

Embodied-R1.5：通过具身基础模型演化物理智能

Embodied-R1.5是一个统一具身基础模型，将具身认知、任务规划、纠错与指向能力整合在单一架构中。基于三条自动化数据构建流水线，团队搭建超过150亿模型token的数据系统，并设计多任务平衡强化学习方案以缓解异构任务冲突。其Planner-Grounder-Corrector闭环框架使模型能在长周期任务中自主执行并自我纠正。仅8B参数的Embodied-R1.5在24个具身VLM基准中的16个上达到SOTA，超越Gemini-Robotics-ER-1.5与GPT-5.4，并可微调为VLA，在4个操作任务基准上领先π_{0.5}等模型。零样本真实机器人实验验证了其指令遵循、可操作物体判别、铰接物体操控与长周期复杂任务中的泛化能力。模型权重、数据集、训练代码及评估框架EmbodiedEvalKit已开源。

arXiv 具身智能开源生态论文/研究

推荐理由：仅8B参数就在24项具身视觉语言基准上赢过GPT-5.4和Gemini-Robotics，还把模型权重、训练代码全开源了，做具身智能的团队不跟进就是犯罪。

07:33

Hacker News 热门（buzzing.cc 中文翻译）

Ask HN：自AI问世以来你为自己开发了哪些工具？

Hacker News 用户发起讨论，询问大家自 AI 兴起以来为自己开发了哪些个人工具。该提问来自 HN（news.ycombinator.com），获得 100 个点赞，标签为 #Ask HN。

智能体开源生态现象/趋势

02:46

Ars Technica：AI（RSS）

精选70

数周内第二次：微软软件包被植入凭据窃取器

73个软件包被植入自复制窃密程序，一旦被AI智能体打开就会立即运行。这是数周内第二次发现微软相关软件包被伪装成凭据窃取器。

GitHub Microsoft 开源生态编码

推荐理由：微软官方仓库第二次被供应链攻击者劫持，这次恶意包专门在 AI 编码代理中触发凭证窃取，蠕虫还能伪造 SLSA 信任链，任何用过受感染包的开发者都应立刻排查。

02:11

The Decoder：AI News（RSS）

微软研究院的Lens：详细描述比原始规模更能训练高效图像生成器

微软研究院推出Lens，一个仅3.8B参数的文本到图像模型。依靠由GPT-4.1生成的8亿条详细图像标题，而非模糊的网页替代文本，Lens在基准测试上匹配了规模更大的竞品，训练成本仅一小部分。代码和权重以开源许可证公开可用。

Microsoft 图像生成开源生态数据/训练

01:01

Hacker News 热门（buzzing.cc 中文翻译）

同事件精选74

小米 MiMo-v2.5-Pro-UltraSpeed 发布：1T 参数模型，每秒 1000 token

小米在 6 月 8 日发布 MiMo-v2.5-Pro-UltraSpeed 模型，拥有 1T 参数规模，推理速度达到每秒 1000 个 token。该模型来自小米旗下的 mimo.xiaomi.com 项目。

arXiv 开源生态推理模型发布

同一事件，精选展示《小米 MiMo 与 TileRT 联合发布 UltraSpeed 模式，1T 模型输出突破 1000 tokens/s》

推荐理由：小米把万亿模型推上 1000 tokens/s，不是纸面速度，而是模型与系统深耦合的结果，对实时推理和编程智能体是真正可落地的信号。限时申请有点可惜，但开源部分值得关注。

00:41

Tomer Tunguz 博客（VC 分析）

精选56

AI 替代浪潮：三大力量重塑成本结构

三大力量重塑 AI 成本：前沿闭源模型持续涨价，开源模型在多数场景已足够好，买家开始替代。Coinbase 将提示词路由至更便宜模型，成本持平但 token 用量指数增长。Lindy 全切至 DeepSeek v4，节省数百万美元且多项核心性能提升。Harvey 在 Legal Agent Benchmark 上通过 SFT 使 Kimi 2.6 all-pass 率达 15%，超越 Opus 的 14%，同一 100 任务成本 $84 vs $954（约 11 倍价差）。Cursor 后训练 Kimi K2.5 得到 Composer 2.5，称其“性能优异且效率高达同类模型 10 倍”。闭源越来越贵，开源平价且性能接近，选择决定企业单位经济学的斜率。

Anthropic DeepSeek 开源生态推理

推荐理由：Tunguz 用 Coinbase、Lindy 等真实案例，把「用开源/便宜模型替代昂贵前沿模型」的趋势讲透了，做 AI 应用的人该重新算一下单位经济账。

6月8日

22:02

公众号：月之暗面（Kimi）

同事件精选76

Kimi Code 焕新升级（附视频教程）

Kimi Code 开源 Coding Agent 迎来大版本升级：一行命令安装，毫秒级启动；新增视频理解能力，支持提取视频风格生成 LUT 文件、长视频切片、根据录屏生成代码；集成同花顺、天眼查等权威数据源，可查询股票价格、财报、学术论文；支持 ACP 协议，可在 JetBrains、Zed 中使用；丰富 hook 生态方便集成其他工具。底层视觉推理由 Kimi K2.6 模型提供。

智能体产品更新开源生态编码

同一事件，精选展示《Kimi Code 焕新升级（附视频教程）》

推荐理由：Kimi Code 这次更新把安装和视频处理的门槛压到了最低，一行命令加拖拽视频就能用，开源 Agent 的体验终于开始反超商业版本。

21:50

Hugging Face：Blog（RSS）

精选62

开源社区支持 OpenEnv 用于智能体强化学习

今日，Hugging Face 宣布 OpenEnv 项目进一步开放，由 Meta-PyTorch、Reflection、Unsloth 等组成的委员会协调，并获得 PyTorch Foundation、vLLM、SkyRL（UCB）等机构支持。OpenEnv 是创建终端、浏览器等智能体执行环境的工具，定位为训练器与环境间的互操作层，标准化环境的发布、部署和消费，但不定义奖励或训练循环。它基于客户端/服务器架构提供 Gymnasium 风格 API（reset()、step()、state()），支持 HTTP、WebSocket、Docker 打包，并将 MCP 作为一等公民，使环境在模拟和生产模式下行为一致。未来将聚焦任务集对接数据集、外部奖励、Harness 集成及自动验证，以推动开源智能体 RL 基础建设。

智能体 Hugging Face MCP/工具 Meta

推荐理由：开源社区在 agent RL 环境上终于开始合流，Meta、Nvidia、Hugging Face 等联合推动 OpenEnv 成为接口标准，不做奖励框架，只做插线板。搞开源 agent 训练的人，这是少有的统一基础设施的机会。

21:43

公众号：月之暗面（Kimi）

精选62

Kimi Code 焕新升级（附视频教程）

Kimi Code 开源 Coding Agent 大版本升级：一行命令安装，毫秒级启动；新增视频理解，可提取参考视频色调生成 LUT、将长视频切分为短视频、根据录屏生成代码；接入同花顺、天眼查等权威数据源，支持实时查询股票价格、财报和学术论文；兼容 ACP 协议，可在 JetBrains、Zed 等 IDE 使用；拓展 hook 生态方便集成。视频理解基于 Kimi K2.6 模型。通过 /plugins 安装 kimi-datasource 插件即可使用权威数据源。

智能体产品更新开源生态编码

推荐理由：Kimi Code 这次把视频理解功能做进了编码工作流，一行安装和 ACP 协议接入让上手成本几乎为零，做视频剪辑和自动化开发的同好值得一试。