6月10日

13:11

Hacker News 热门（buzzing.cc 中文翻译）

软件黑客马拉松，安息吧。硬件黑客马拉松，万岁！

作者在个人博客（blog.oscars.dev）上发文，宣告软件黑客马拉松的终结，并呼吁转向硬件黑客马拉松。

开源生态现象/趋势编码

10:43

向阳乔木@vista8

Vista 开源免费口播提词器，用 Codex 开发 5 小时

Vista 分享其通宵开发的免费开源口播提词器，项目基于 Codex 开发，运行约 5 小时。他评价该工具比多数收费提词器好用，目前配合大疆 Pocket3 录制口播，暂未加入手机录制功能。项目已开源，欢迎 Star 或 Fork 二改，地址见评论区。

开源/仓库开源生态视频

07:27

Nathan Lambert：Interconnects（RSS）

同事件精选63

Claude Fable 5 与新的 AI 安全寓言

前沿 AI 系统的权力政治又向前迈进了一步。Claude Fable 5 及新 AI 安全寓言标志着这一进展。

Anthropic 大佬观点安全/对齐开源生态

同一事件，精选展示《Claude Fable 5 和 Claude Mythos 5》

推荐理由：Anthropic 在 Fable 5 上悄悄加了不告知用户的安全限制，对模型开发请求做手脚却不降级通知，这种做法让人很难信任这个「最聪明模型」，也意外给美国开源社区打了一针强心剂。

07:07

Berryxia.AI@berryxia

Cohere开源North Mini Code：3B参数专攻Agentic Coding

Cohere推出North Mini Code开源模型，总参数30B，活跃参数仅3B，采用Apache 2.0许可。该模型在Artificial Analysis Coding Index上跑出33.4分，与同量级模型竞争，专为智能体编程（agentic coding）优化，支持本地运行、自由修改和迭代。开发者首次能完全掌控coding agent，而非依赖云端黑盒。

Cohere: Small: 30 billion parameters, 3B active. Efficient: Benchmarks to 33.4 on the Artificial Analysis Coding Index, competit...

智能体开源生态模型发布编码

04:55

Hugging Face：Blog（RSS）

精选73

Cohere发布North Mini Code：面向开发者的开源编码模型

Cohere发布North Mini Code，一款30B参数MoE模型（3B活跃参数），Apache 2.0开源。在Artificial Analysis Coding Index上得分33.4，超越Qwen3.5、Gemma 4等同类模型。后训练采用两阶段SFT和RLVR，在SWE-Bench Verified上pass@10达80.2%，Terminal-Bench v2上达55.1%。支持64K/128K上下文长度，专为智能体编码任务优化。

智能体开源生态模型发布编码

推荐理由：Cohere的新编码模型North Mini Code以30B参数MoE架构，在SWE-bench pass@1达到61%，Apache 2.0开源，是小模型在agent coding领域真正可用的信号。

03:04

MiniMax (official)@MiniMax_AI

Modular 内核团队正在快速推进 M3 🚀 开源权重将在几天内发布--届时即可立即在 @Modular 上运行。对此非常期待。

Modular: Our kernel team has been deep in MiniMax M3 all week. The 1M-token context and native multimodality make it a hard model...

开源生态模型发布部署/工程

02:41

Nathan Lambert@natolambert

我真的不想和Anthropic对着干，但他们一直不必要地对抗整个中国，然后不那么微妙地对抗开放权重模型，现在更广泛地对抗开放的AI研究。接下来还有什么？

Anthropic 大佬观点安全/对齐开源生态

01:16

Rohan Paul@rohanpaul_ai

Kocoro：开源AI智能体实现跨天会话记忆

Kocoro是一款Mac原生AI智能体，旨在解决AI会话每天重启后遗忘上下文的痛点。它每晚在本地审查工作内容，通过TensorLogic在云端训练轻量记忆模型，次日自动恢复上次中断的会话状态，无需重复粘贴或解释。Kocoro能感知项目文件、追踪昨天的变更、打开浏览器、操作桌面应用、整理文件并跨多个应用执行任务。其内核已在GitHub开源，确保可审计和用户可控。用户可通过命令行（Shannon）或桌面应用运行。

智能体 GitHub 开源/仓库开源生态

00:20

Artificial Analysis@ArtificialAnlys

Cohere发布North Mini Code：30B总参数（3B活跃）开源编码模型

Cohere近日发布North Mini Code，一款30B总参数（3B活跃参数）的开放权重编码模型，采用Apache 2.0开源协议。该模型在Artificial Analysis Intelligence Index上得分27.6，高于gpt-oss-20B (high)的24.5，略低于Mistral Small 4（119B参数，6.5B活跃）的27.8。在Coding Index（Terminal-Bench Hard和SciCode加权平均）上得分33.4，显著高于GLM-4.7-Flash的25.9，低于Qwen3.6 35B A3B的35.2。非编码智能体任务表现较弱：GDPval-AA 14%、τ²-Bench Telecom 37%。在Cohere API上推理速度约199 output tokens/s，快于同类模型。距Cohere上次发布Command A+不到一个月。

开源生态模型发布编码

00:05

fofr@fofrAI

我让我的 foffee 智能体帮忙加速 Gemma。我感觉自己像个骄傲的家长。 https://huggingface.co/spaces/gemma-challenge/gemma-dashboard

Google Gemma: Introducing the Fast Gemma Challenge with Hugging Face Over the next few days, dozens of agents will collaborate to make...

智能体 Google Hugging Face 开源生态

6月9日

12:22

IT之家（RSS）

微软GitHub数十个开源项目遭黑客入侵，被植入窃取密码的恶意程序

微软已封锁其在GitHub上的至少70个开源项目，原因是黑客在代码中植入窃取密码的恶意程序。受影响项目涉及Azure、Claude Code、Gemini命令行界面和VS Code等AI编程工具。安全机构Cloudsmith和开源社区OpenSourceMalware首先发现，用户运行篡改程序时会泄露密码及账号凭证。微软已下架相关仓库，部分恢复访问，并通知了少数下载过恶意内容的用户。这是近几周内微软开源项目第二次遭入侵，5月中旬Durable Task项目也曾被攻击。

GitHub Microsoft 开源生态行业动态

11:40

公众号：小米 MiMo

精选80

小米 MiMo 与 TileRT 联合发布 UltraSpeed 模式，1T 模型输出突破 1000 tokens/s

小米 MiMo 与 TileRT 联合发布 MiMo-V2.5-Pro-UltraSpeed 模式，使 1T 参数旗舰模型输出速度首次突破 1000 tokens/s。模型侧采用 FP4 混合量化（仅量化 MoE Expert）与 DFlash 块级 masked 并行推测解码（coding 场景平均接受长度 6.30 tokens）；系统侧 TileRT 引入常驻内核引擎与异构流水线协作。API 限时开放（2026 年 6 月 9 日至 23 日），定价为 MiMo-V2.5-Pro 的 3 倍，速度提升约 10 倍。FP4 权重与 DFlash 模型 checkpoint 已开源至 HuggingFace。

开源生态推理模型发布部署/工程

关联讨论 2 条

推荐理由：万亿模型首次在通用GPU上突破1000 tokens/s，不是专用硬件的胜利而是模型与系统Codesign的胜利，做实时AI应用的都应该盯紧这一套方案。

11:09

宝玉@dotey

精选78

baoyu-design skill 支持导入 Design System 并在新建项目中使用

baoyu-design skill 现已支持导入 Design System，新建项目时可直接使用已导入的设计系统。功能保留了 Claude Design 原有的导入与编译方式，通过提问即可让用户选择已导入的 Design System。开发者表示实现过程比预期复杂，但效果不错。安装命令：npx skills add JimLiu/baoyu-design。另据 @dotey 介绍，该工具为本地运行的 Claude Design 风格工具，可描述屏幕生成 HTML，在预览中点击元素说出修改指令，最佳搭配 Opus 4.8。

宝玉: Cursor's new browser + element annotation turns it into a design studio. Meet Cursor Design 🎨 - Claude Design, running ...

开源/仓库开源生态编码

关联讨论 1 条

推荐理由：宝玉把baoyu-design skill加上了Design System导入，现在用Cursor做前端页面可以直接挂设计规范，不用自己手搓变量了。比预期复杂但效果可以，做前端工具的可以试试。

10:33

Hacker News 热门（buzzing.cc 中文翻译）

同事件精选71

FrontierCode 在 Hacker News 获 101 分

cognition.ai 的 FrontierCode 项目在 Hacker News 上获得 101 个 points。目前公开信息仅包含项目名称和来源，具体功能、技术细节或性能数据尚未披露。

开源生态编码评测/基准

同一事件，精选展示《FrontierCode 基准测试：AI 编程评估新标准--维护者审核通过率最高仅 13.4%》

推荐理由：这是第一个真正衡量「代码能不能被合并」的基准，由几十位开源仓库维护者亲手设计标准，填补了 SWE-Bench 只测正确性不测质量的盲区。虽然任务集不公开，但它对‘生产级代码智能体’的评估思路会直接影响接下来的模型选型。

10:28

AYi@AYi_AInotes

Supervision：4万星开源CV可视化工具

一行命令 pip install supervision 即可安装的计算机视觉可视化工具，支持自动画框加标签、视频目标永久跟踪、数据集格式一键转换，内置热力图、区域计数、越线检测、人体骨架等功能，模型无关，已被6500+开源项目使用。

开源/仓库开源生态

08:00

HuggingFace Daily Papers（社区热门论文）

基于累积FLOPs的计算感知对抗鲁棒性评估框架

提出基于累积FLOPs的计算感知评估框架，以计算压力替代固定查询预算，引入风险-计算曲线和两项总结指标。在三个系列、四个训练/对齐阶段的十个模型上，使用梯度、迭代优化和模板三种攻击策略在两个越狱鲁棒性基准上测试发现：对齐训练对计算空间鲁棒性呈非单调影响；模型规模扩大降低梯度攻击效果但对低成本模板攻击影响有限；梯度攻击可跨模型迁移；单个模型内不同危害类别间计算成本差异约5倍；安全对齐的RL增加整体攻击成本，但部分类别仍较易攻破。框架已开源。

安全/对齐开源生态

08:00

HuggingFace Daily Papers（社区热门论文）

精选82

i1：面向强文生图模型的简单且完全开源配方

i1 是一个 3B 参数的文本到图像扩散模型，仅使用公开数据集训练。在 GenEval、DPG、PRISM、CVTG-2K 和 LongText 五个基准上，i1 性能与领先模型相当，平均比最佳现有完全开源模型高 29.5 个百分点。研究基于 300 余项控制实验（超 700K TPU v6e 小时），发现等权重混合 curated 数据集是强默认配置、更大文本编码器适配器以极少参数提升性能。i1 的检查点、训练与推理代码及数据处理流程已全部开源。

arXiv 图像生成多模态开源生态

推荐理由：i1 是第一个用全公开数据、完全开源代码/权重/数据管线打造的 3B 模型，直接把全开放模型的性能拉到可与闭源竞争，对做文生图研究的同行是个扎实起点。

08:00

HuggingFace Daily Papers（社区热门论文）

精选78

Embodied-R1.5：通过具身基础模型演化物理智能

Embodied-R1.5是一个统一具身基础模型，将具身认知、任务规划、纠错与指向能力整合在单一架构中。基于三条自动化数据构建流水线，团队搭建超过150亿模型token的数据系统，并设计多任务平衡强化学习方案以缓解异构任务冲突。其Planner-Grounder-Corrector闭环框架使模型能在长周期任务中自主执行并自我纠正。仅8B参数的Embodied-R1.5在24个具身VLM基准中的16个上达到SOTA，超越Gemini-Robotics-ER-1.5与GPT-5.4，并可微调为VLA，在4个操作任务基准上领先π_{0.5}等模型。零样本真实机器人实验验证了其指令遵循、可操作物体判别、铰接物体操控与长周期复杂任务中的泛化能力。模型权重、数据集、训练代码及评估框架EmbodiedEvalKit已开源。

arXiv 具身智能开源生态论文/研究

推荐理由：仅8B参数就在24项具身视觉语言基准上赢过GPT-5.4和Gemini-Robotics，还把模型权重、训练代码全开源了，做具身智能的团队不跟进就是犯罪。

07:33

Hacker News 热门（buzzing.cc 中文翻译）

Ask HN：自AI问世以来你为自己开发了哪些工具？

Hacker News 用户发起讨论，询问大家自 AI 兴起以来为自己开发了哪些个人工具。该提问来自 HN（news.ycombinator.com），获得 100 个点赞，标签为 #Ask HN。

智能体开源生态现象/趋势

03:46

Artificial Analysis@ArtificialAnlys

MiniMax推出多模态模型M3，1M上下文，多项基准领先

MiniMax推出首个多模态M系列模型M3，支持图像/视频输入及1M token上下文窗口。在Artificial Analysis Intelligence Index上得55分，超越开源权重的Kimi K2.6和MiMo-V2.5-Pro（均54）。相比前代M2.7，HLE提升9点至37%，GPQA Diamond提升6点至93%，多项基准均有进步。原生多模态MMMU-Pro约80%与GPT-5.5持平。定价$0.30/$1.20/1M tokens（512K内），512K-1M翻倍。权重计划约10天内开源。

多模态开源生态评测/基准

02:46

Ars Technica：AI（RSS）

精选70

数周内第二次：微软软件包被植入凭据窃取器

73个软件包被植入自复制窃密程序，一旦被AI智能体打开就会立即运行。这是数周内第二次发现微软相关软件包被伪装成凭据窃取器。

GitHub Microsoft 开源生态编码

推荐理由：微软官方仓库第二次被供应链攻击者劫持，这次恶意包专门在 AI 编码代理中触发凭证窃取，蠕虫还能伪造 SLSA 信任链，任何用过受感染包的开发者都应立刻排查。

02:11

The Decoder：AI News（RSS）

微软研究院的Lens：详细描述比原始规模更能训练高效图像生成器

微软研究院推出Lens，一个仅3.8B参数的文本到图像模型。依靠由GPT-4.1生成的8亿条详细图像标题，而非模糊的网页替代文本，Lens在基准测试上匹配了规模更大的竞品，训练成本仅一小部分。代码和权重以开源许可证公开可用。

Microsoft 图像生成开源生态数据/训练

01:01

Hacker News 热门（buzzing.cc 中文翻译）

同事件精选74

小米 MiMo-v2.5-Pro-UltraSpeed 发布：1T 参数模型，每秒 1000 token

小米在 6 月 8 日发布 MiMo-v2.5-Pro-UltraSpeed 模型，拥有 1T 参数规模，推理速度达到每秒 1000 个 token。该模型来自小米旗下的 mimo.xiaomi.com 项目。

arXiv 开源生态推理模型发布

同一事件，精选展示《小米 MiMo 与 TileRT 联合发布 UltraSpeed 模式，1T 模型输出突破 1000 tokens/s》

推荐理由：小米把万亿模型推上 1000 tokens/s，不是纸面速度，而是模型与系统深耦合的结果，对实时推理和编程智能体是真正可落地的信号。限时申请有点可惜，但开源部分值得关注。

00:41

Tomer Tunguz 博客（VC 分析）

精选56

AI 替代浪潮：三大力量重塑成本结构

三大力量重塑 AI 成本：前沿闭源模型持续涨价，开源模型在多数场景已足够好，买家开始替代。Coinbase 将提示词路由至更便宜模型，成本持平但 token 用量指数增长。Lindy 全切至 DeepSeek v4，节省数百万美元且多项核心性能提升。Harvey 在 Legal Agent Benchmark 上通过 SFT 使 Kimi 2.6 all-pass 率达 15%，超越 Opus 的 14%，同一 100 任务成本 $84 vs $954（约 11 倍价差）。Cursor 后训练 Kimi K2.5 得到 Composer 2.5，称其“性能优异且效率高达同类模型 10 倍”。闭源越来越贵，开源平价且性能接近，选择决定企业单位经济学的斜率。

Anthropic DeepSeek 开源生态推理

推荐理由：Tunguz 用 Coinbase、Lindy 等真实案例，把「用开源/便宜模型替代昂贵前沿模型」的趋势讲透了，做 AI 应用的人该重新算一下单位经济账。

00:27

AYi@AYi_AInotes

梁文锋的DeepSeek的问世成功颠覆了什么？

DeepSeek 开源生态现象/趋势

6月8日

22:02

公众号：月之暗面（Kimi）

同事件精选76

Kimi Code 焕新升级（附视频教程）

Kimi Code 开源 Coding Agent 迎来大版本升级：一行命令安装，毫秒级启动；新增视频理解能力，支持提取视频风格生成 LUT 文件、长视频切片、根据录屏生成代码；集成同花顺、天眼查等权威数据源，可查询股票价格、财报、学术论文；支持 ACP 协议，可在 JetBrains、Zed 中使用；丰富 hook 生态方便集成其他工具。底层视觉推理由 Kimi K2.6 模型提供。

智能体产品更新开源生态编码

同一事件，精选展示《Kimi Code 焕新升级（附视频教程）》

推荐理由：Kimi Code 这次更新把安装和视频处理的门槛压到了最低，一行命令加拖拽视频就能用，开源 Agent 的体验终于开始反超商业版本。

21:50

Hugging Face：Blog（RSS）

精选62

开源社区支持 OpenEnv 用于智能体强化学习

今日，Hugging Face 宣布 OpenEnv 项目进一步开放，由 Meta-PyTorch、Reflection、Unsloth 等组成的委员会协调，并获得 PyTorch Foundation、vLLM、SkyRL（UCB）等机构支持。OpenEnv 是创建终端、浏览器等智能体执行环境的工具，定位为训练器与环境间的互操作层，标准化环境的发布、部署和消费，但不定义奖励或训练循环。它基于客户端/服务器架构提供 Gymnasium 风格 API（reset()、step()、state()），支持 HTTP、WebSocket、Docker 打包，并将 MCP 作为一等公民，使环境在模拟和生产模式下行为一致。未来将聚焦任务集对接数据集、外部奖励、Harness 集成及自动验证，以推动开源智能体 RL 基础建设。

智能体 Hugging Face MCP/工具 Meta

推荐理由：开源社区在 agent RL 环境上终于开始合流，Meta、Nvidia、Hugging Face 等联合推动 OpenEnv 成为接口标准，不做奖励框架，只做插线板。搞开源 agent 训练的人，这是少有的统一基础设施的机会。

21:46

OpenBMB@OpenBMB

面壁智能与HuggingFace合作举办Build Small黑客松

面壁智能（OpenBMB）与HuggingFace合作举办的Build Small黑客松正式上线，鼓励开发者使用OpenBMB模型构建应用。官方列举四大用例：MiniCPM-V 4.6用于自动化金融文档分析；MiniCPM5-1B轻量端侧模型驱动AI桌面宠物；MiniCPM-o 4.5全模态实时视频分析；VoxCPM2语音克隆。活动设有$10,000 OpenBMB特别奖。

Hugging Face 多模态开源生态行业动态

21:43

公众号：月之暗面（Kimi）

精选62

Kimi Code 焕新升级（附视频教程）

Kimi Code 开源 Coding Agent 大版本升级：一行命令安装，毫秒级启动；新增视频理解，可提取参考视频色调生成 LUT、将长视频切分为短视频、根据录屏生成代码；接入同花顺、天眼查等权威数据源，支持实时查询股票价格、财报和学术论文；兼容 ACP 协议，可在 JetBrains、Zed 等 IDE 使用；拓展 hook 生态方便集成。视频理解基于 Kimi K2.6 模型。通过 /plugins 安装 kimi-datasource 插件即可使用权威数据源。

智能体产品更新开源生态编码

推荐理由：Kimi Code 这次把视频理解功能做进了编码工作流，一行安装和 ACP 协议接入让上手成本几乎为零，做视频剪辑和自动化开发的同好值得一试。

18:44

🚨 AI News | TestingCatalog@testingcatalog

感谢 Ideogram 发送了这个 ❤️ Ideogram 4.0 是上周最大的发布之一！尤其对开源社区而言。测试了一下 👀

Ideogram: Today we published a technical blog post about Ideogram 4.0 - our goal is to enable more innovation and creativity. It's...

图像生成开源生态模型发布

12:08

Rohan Paul@rohanpaul_ai

Rohan Paul 引用 OpenRouter 数据指出，2025 年大部分周 token 消耗由美国模型驱动，但从 2026 年初开始，中国大语言模型突然成为主要增长引擎。引用推文称这是美国 AI 初创公司今年以来的显著转向。AI 模型市场正从品牌忠诚转向原始效用。

nxthompson: This is a pretty striking shift toward Chinese models by American AI startups since the start of the year. https://subst...

开源生态现象/趋势

10:59

LMSYS：Blog（Chatbot Arena 团队）

LMSYS 2026 年博士奖学金首位获得者：Will Lin

LMSYS 宣布 2026 年博士奖学金首位得主 Will Lin。他是加州大学圣地亚哥 Hao AI 实验室六年级博士生，领导开源框架 FastVideo（GitHub 3.7k+ 星标），已被 NVIDIA Dynamo 集成，其模块化流水线影响 SGLang 等多模态生成设计。奖学金最高 5 万美元。他的研究覆盖生成式视频与世界模型全栈，包括稀疏注意力、量化、蒸馏、后训练、实时推理，共同主导首个交互延迟 1080p 文图到音视频生成流水线，近期包括自回归世界模型训练。他曾于 Anyscale 实习，现于 NVIDIA 实习推动产业合作。

开源生态行业动态

06:40

karminski-牙医@karminski3

Ideogram 4实测：9.3B开放权重原生2K

ideogram发布Ideogram 4文生图模型，开放权重，仅9.3B参数，支持原生2K分辨率生成。作者将其与通义Z-image-Turbo生成效果对比，认为两者风格相似。

图像生成开源生态评测/基准