6月7日

15:14

凡人小北@frxiaobei

AI 时代的又一受益者，开源后端即服务（BaaS）平台 Supabase 宣布完成 5 亿美元 F 轮融资，公司估值达到 100 亿美元，而一年前估值仅为 20 亿美元。

Supabase: http://x.com/i/article/2063139569118093312

开源生态行业动态

13:34

MarkTechPost（RSS）

NVIDIA garak 教程：构建完整的防御性 LLM 红队工作流，支持自定义探针和检测器

NVIDIA garak 教程演示了端到端的防御性 LLM 红队工作流，包括框架设置、插件发现、模拟运行、在 Hugging Face 生成器上对真实模型进行扫描以及多探针评估。流程随后分析安全评分与攻击成功率，审查被标记的输出，并通过自定义探针和检测器扩展 garak 功能，最后以 AVID 格式导出结构化漏洞报告。

Hugging Face 开源生态教程/实践

09:55

swyx@swyx

流行理论：论文发表式微，加州非竞争协议推动知识传播

一种流行理论认为，研究论文和实验室发表式微，是因为研究人员发现与其与营销部门周旋，不如直接离职，凭借受法律保护的隐性知识获得超1亿美元融资。加州非竞争协议对知识传播的推动力超过GitHub、arXiv和HuggingFace总和。@tszzl指出，OpenAI知识产权泄露规模惊人，可能达数万亿美元，确实相当开放。swyx因此考虑将@aidotengineer设为以产品为中心的行业会议，补足以论文为中心的学术会议。

roon: @beffjezos the sheer dollar quantity of ip leakage from openai has been just tremendous, probably in the trillions. open...

开源生态现象/趋势

09:09

ginobefun@hongming731

洪明分享BestBlogs订阅源：含57个播客和119个YouTube频道

洪明分享了BestBlogs整理的播客和视频订阅源，包含57个小宇宙播客和119个YouTube频道，覆盖AI、编程、商业科技、投资财经、产品设计、效率成长、媒体资讯、生活文化等方向。所有源已整理成文章并开放OPML，支持一键导入RSS阅读器，也可接入Agent或自动化内容工作流。BestBlogs的“我的关注”功能可帮助用户筛选、排序、摘要和评分音视频内容，生成个性化早报。

ginobefun: http://x.com/i/article/2063420344678158336

开源生态教程/实践

09:09

ginobefun@hongming731

BestBlogs发布多平台交流与内容入口汇总

BestBlogs 整理了对外交流和发布入口，包括微信交流群、微信公众号、飞书群、小宇宙（中英文版）、Apple Podcasts、公开仓库（GitHub）、作者博客以及 Gino 和小光的推特。适合对 RSS、AI 阅读、Agent 工作流、高质量信息源和个人内容管理感兴趣的用户关注，可获取产品动态、订阅源、技术架构和独立开发思考等内容。

ginobefun: http://x.com/i/article/2063420344678158336

智能体 GitHub 其他开源生态

03:13

MiniMax (official)@MiniMax_AI

MiniMax 将于6月9日在旧金山 AWS Builder Loft 举办开源权重模型之夜

MiniMax 将于6月9日在旧金山 AWS Builder Loft 举办开源权重模型之夜，重点展示其开源权重模型 MiniMax M3，及其关键架构 MiniMax Sparse Attention。该架构支撑了 M3 的 1M-token 上下文窗口、强大的编码与智能体性能以及原生多模态能力。合作伙伴包括 @ArtificialAnlys、@coderabbitai、NVIDIA 和 Daily。活动时间为 5:00–8:30 PM，入场需出示政府颁发的身份证件。

开源生态行业动态

00:58

Berryxia.AI@berryxia

mlx-audio v0.4.4 发布：新增 15+ 个 TTS/ASR/VAD 模型及服务器改进

mlx-audio v0.4.4 发布，所有模型均运行在 Apple Silicon。新增 15+ 个模型：TTS 包括 VoxCPM2（2B 参数、48kHz、30 种语言）、MOSS-TTS、Higgs Audio v3 等；ASR 包括 Mega-ASR（基于 Qwen3-ASR-1.7B + LoRA 路由）、Nemotron 3.5 ASR（实时流式）、Cohere ASR（长文本转录速度提升 1.7 倍）等；VAD 新增 Silero VAD、FSMN-VAD、Step-Audio 2。服务器改进支持 OpenAI 兼容的 response_format、/v1/audio/voices 接口及逐词时间戳。安装命令：uv pip install -U mlx-audio。

Prince Canuma: 🚀 mlx-audio v0.4.4 is out - our biggest model drop yet. 15+ new TTS, ASR & VAD models, faster long-form transcription, ...

开源/仓库开源生态语音

00:43

jason@jxnlco

现在想想，这其实是个天才的联盟计划。补贴一个方案，让人们发推宣传它。

Leon Lin: Got poke pro for 1cent per month 😭

其他开源生态

6月6日

23:26

向阳乔木@vista8

Open Design：用本地Agent替代Figma的开源设计工具

Open Design 是一个用本地 Agent 驱动的开源设计工具。一个月内获得近 60K GitHub Star（20 天达 50k+），全球 30 多国用户，340 名贡献者。它识别本地的 Claude Code、Codex 等 Code Agent 作为设计引擎，生成 HTML 单文件而非

智能体开源/仓库开源生态教程/实践

18:24

AYi@AYi_AInotes

OpenCut：GitHub 5万星开源AI剪辑工具，本地优先、永久免费、无水印无会员

OpenCut 是一个 GitHub 5 万星的开源 AI 剪辑工具，主打本地优先，视频无需上传服务器，永久免费、无水印、无会员墙。目前处于 Early Beta 阶段，网页版支持基础剪辑（导入视频、时间线、切割），但导出、特效、转场等功能仍在开发。路线图包括 Rust 重写核心、Web+桌面+移动统一、插件系统、Editor API 及 MCP Server（让 AI Agent 直接调用工具），目标是成为可编程的视频底座，而非对标剪映的封闭工具。

AYi: http://x.com/i/article/2060717603987791878

GitHub MCP/工具开源/仓库开源生态

17:17

IT之家（RSS）

Ramp：美国企业 AI 成本飙升，DeepSeek 成为 B2B 市场新宠

美国企业 AI 累计投入突破 1 万亿美元，模型推理成本飙升，降本增效未达预期。Ramp 报告显示 DeepSeek 首次登上其软件趋势榜榜首。案例包括某企业一个月为 Claude 支付 5 亿美元，Uber 四个月内耗尽全年 Token 预算。DeepSeek 宣布 API 价格永久下调 75%，MiniMax 压至新低。Ramp 首席经济学家称这是美国企业寻找 OpenAI、Anthropic 低成本替代方案的最明确信号。部分企业已直接向 DeepSeek 付费。2025 年初 DeepSeek R1 模型曾登顶 App Store，但企业采用率一度达 0.3%，后回落至 0.1% 并维持到 2026 年 4 月。成本压力是再度受关注的主因。

Anthropic DeepSeek 开源生态推理

11:16

IT之家（RSS）

Ladybird 浏览器冲刺首个 Alpha 发布，因 AI 风险关闭公开 PR

Ladybird 浏览器项目正冲刺首个 Alpha 版本，宣布不再接受公开拉取请求，仅允许维护者提交代码。创始人 Andreas Kling 表示，生成式 AI 让任何人可快速生成看似完整的代码变更，但提交者未必真正理解项目。浏览器处理全网不受信任输入，一个伪装良好的漏洞就可能被利用。所有未处理的公开 PR 已立即关闭。

安全/对齐开源生态行业动态

08:07

ginobefun@hongming731

姚顺雨首次公开亮相：AI下半场战略与Hy3 preview模型

姚顺雨在腾讯云AI大会上首次公开亮相，指出AI已进入下半场，核心从“怎么训练”转向“找好问题”，认为context是Agent时代关键壁垒，腾讯在场景、数据、工具链上有结构性优势。他披露Hy3 preview模型：295B总参数、21B激活参数，首token延迟降低54%，可驱动最长495步Agent工作流。他还提出Co-Design理念，强调模型与产品深度协同，该模型以实用性为导向，不在榜单过度竞争。

智能体 Anthropic 开源生态现象/趋势

07:59

Rohan Paul@rohanpaul_ai

AI 简报：Anthropic、Google、阿里等最新动态

Anthropic 称其 80% 的新生产代码由 Claude 编写。Google 新论文显示，通用 LLM 通过规划证明与逐步验证，将形式数学求解性能从低于 10% 提升至 70%。Google 开源 Gemma 4 12B，可在消费级 16GB GPU 上本地运行，支持音频和视频分析。通义千问发布 Qwen3.7-Plus，支持文本、视频、图像输入，价格 $0.4/$1.6 每百万 token，闭源。Anthropic 新化学报告有惊人结果。

Anthropic Google 多模态开源生态

01:20

Google AI@GoogleAI

精选78

Google AI 本周产品更新：Nano Banana 2、Co-Scientist、dreambeans、Gemma 4 等

Google AI 本周发布多项更新：Nano Banana 2 及 Pro 正式 GA，可通过 Gemini Enterprise Agent Platform、Gemini API 和 Google AI Studio 获取；Co-Scientist 多智能体系统面向科研自动生成优化新假设；Google Labs 推出 dreambeans，根据用户 Google 应用数据每日生成个性化话题集；Gemma 4 12B 统一无编码器多模态模型可完全离线运行于笔记本；Gemma 4 系列及草稿模型引入 QAT 降低内存需求；Google Magenta RealTime 2 开源实时音乐模型，支持 MIDI 键盘、文本提示和手势演奏。

智能体 Google 产品更新多模态

推荐理由：周报里藏了个大号：Gemma 4 12B开源多模态且完全离线，开发者今天就能在自己笔记本上跑起来，Co-Scientist的多agent科学推理也有看头。

01:02

SemiAnalysis@SemiAnalysis_

我们从根本上不同意共产主义委员会式的"Nemotron Coalition"方法来开发开源模型，并且我们不认为这是模型开发的正确路径。对于开源模型，我们的团队将只使用资本主义、自由市场驱动的中国模型，如Kimi、DeepSeek V4、GLM-5、Qwen、MiniMax等。（1/2）🧵

大佬观点开源生态

6月5日

23:47

HuggingFace Daily Papers（社区热门论文）

Code2LoRA：超网络生成适配器助力代码语言模型应对软件演化

Code2LoRA 是一种超网络框架，可生成仓库专属的 LoRA 适配器，在推理时零 token 开销注入仓库知识。它支持两种模式：Code2LoRA-Static 将单一仓库快照转为适配器，适合稳定代码库；Code2LoRA-Evo 通过 GRU 隐藏状态随代码 diff 更新适配器，适合演化中的活跃开发。团队构建了含 604 个 Python 仓库的 RepoPeftBench 基准。静态任务中，Code2LoRA-Static 跨仓库 exact match 达 63.8%，仓库内达 66.2%，持平逐仓库 LoRA 上界；演化任务中，Code2LoRA-Evo 跨仓库 exact match 达 60.3%，比单一共享 LoRA 高 5.2 个百分点。代码和数据集已开源。

arXiv Hugging Face 开源生态编码

22:15

IT之家（RSS）

精选72

开源鸿蒙 OpenHarmony 具身智能版本 EmbodiedAI 1.0.1 发布

6月5日，开源鸿蒙具身智能PMC（筹）发布EmbodiedAI 1.0.1版本。该版本聚焦机器人控制与智能体应用，升级导航规划、运动控制、仿真开发、硬件适配等核心能力，兼容ROS生态、机器人模拟器及多种本体形态。集成开源鸿蒙原生模拟器、MuJoCo、Gazebo三大仿真环境，打通从代码开发到真机验证的全流程链路。人形机器人、四足机器狗、商用服务机器人等已完成适配验证。目前具身智能方向已组建18个专项SIG工作组，版本源码已正式开放。

产品更新具身智能开源生态

推荐理由：开源鸿蒙的具身智能框架终于从概念走向工程交付，EmbodiedAI 1.0.1 打通仿真和真机，对于不想被ROS绑架的机器人团队是个新选择。

20:06

Simon Willison 博客

Ladybird 浏览器不再接受公开 Pull Request：代码责任归属优先于生成方式

Ladybird 浏览器项目宣布不再接受公开 pull request。维护者 Andreas Kling 指出，过去提交大量补丁意味着付出实质性努力，可作为善意的合理代理，但这一假设已不再成立。代码是手工输入还是由 AI 生成已无关紧要，关键是谁对进入浏览器的代码负责。Ladybird 正成为面向真实用户的浏览器，引入变更的人必须是决定该变更属于项目并承担后果的人。

开源/仓库开源生态

19:22

公众号：腾讯混元

精选62

腾讯混元提出Stem稀疏注意力算法，被ICML 2026收录

Stem算法通过Token位置衰减（TPD）和输出感知度量（OAM）两项创新，仅用25%算力即逼近稠密注意力精度。配套HPC算子针对Hopper架构优化，支持FP8量化与vLLM的Paged KV Cache，在混元Hy3 preview上实现首字延迟降低3.6倍。HPC-BSA相比MIT-BSA稳定保持约3倍加速，在8K至256K序列长度上表现一致。

开源生态推理论文/研究部署/工程

推荐理由：把稀疏注意力从一刀切升级成按信息流分配预算，算子在Hopper上把理论加速几乎无损转化，3.6倍首字延迟下降不是灌水——做长上下文应用的值得照着开源代码试。

19:20

AYi@AYi_AInotes

X创作者收益预测平台将开源

博主@AYi_AInotes研究X平台算法后，称已掌握底层收益算法逻辑，正计划构建X创作者收益预测平台。为打磨预测模型，博主公开征集用户近两周的创作数据，承诺完成后将开源该平台，供创作者分析自身收益数据。

AYi: http://x.com/i/article/2060717603987791878

开源/仓库开源生态

16:07

歸藏(guizang.ai)@op7418

歸藏提醒：PPT Skills 需署名开源或走商业授权

歸藏指出，部分用户在使用 GitHub 时过于关注发言、原生等细节，却忽略版权协议。其 PPT Skills 要求必须署名且开源，如需闭源可联系作者获取商业授权。他同时提醒，抄袭点子、代码甚至项目名称的行为不可取。在引用推文中，歸藏表示 PPT Skills 将继续更新，得益于近期赞助，将推出第三套惊艳的主题，并将小红书图文卡片的经验融入新版。

歸藏(guizang.ai): 说一下 guizang PPT Skills 还会继续更新啊。得益于最近的几个赞助,可以找时间去更新第三套主题了,依旧非常惊艳。同时,在小红书那个图文卡片部分积累的好经验,也会用到 PPT Skills 的新版里面。

开源/仓库开源生态

14:52

小互@xiaohu

宝玉老师《图解Skill》抽奖送书活动

博主小互推荐宝玉老师新书《图解Skill》，称其技能多得益于宝玉老师。本书秉持开源分享理念，博主将陆续分享自己使用的技能。为回馈关注，现转发本推文即可参与抽奖，共送出10本《图解Skill》，下周一开奖。

产品更新开源生态教程/实践

14:07

ginobefun@hongming731

OpenAI 今年 3 月推出 Codex for Open Source 项目，为开源维护者提供 6 个月免费 ChatGPT Pro（价值 $1200）、API 积分和 AI 安全审查。门槛不高，不卡 Star 数，核心维护者即可申请。洪明表示 BestBlogs 项目（3.7K Star）正好可以试试。

雪踏乌云: OpenAI 今年 3 月推了 Codex for Open Source,给开源维护者发福利: 6 个月免费 ChatGPT Pro($1200)+ API 积分 + AI 安全审查。门槛不高,不卡 Star 数,核心维护者就能申,so...

OpenAI 开源生态行业动态

13:19

Hacker News 热门（buzzing.cc 中文翻译）

精选76

Open Code Review - 一款基于人工智能的代码审查命令行工具

Open Code Review 是一个基于人工智能的代码审查命令行（CLI）工具，旨在帮助开发者通过自动化的方式提升代码审查效率。

产品更新开源生态编码

推荐理由：阿里巴巴把内部用了两年、审查了数百万缺陷的AI代码审查工具开源，它不走纯Agent路线，用确定性工程保证覆盖和位置准确，想落地AI代码审查的团队可以直接用。

12:24

Ethan Mollick@emollick

此外，很大程度取决于中国实验室继续发布开放权重模型。如果他们停止，前沿将越来越落后于那些想要使用本地/微调模型的人。我认为这是可能的，因为随着成本上升，开放权重可能不是好的商业模式。

大佬观点开源生态

11:24

Ethan Mollick@emollick

至少在快速进步停止之前（如果会停止的话），似乎不太可能有人能追上三大AI实验室。微软和Meta发布了自己的模型，这些模型还不错，但并非前沿。SpaceX也未能重新夺回其地位。中国模型正在改进，但仍然落后。

大佬观点开源生态

10:48

Hacker News 热门（buzzing.cc 中文翻译）

Transformer 需要三个投影吗？--对 QKV 变体的系统研究

一项系统研究探讨 Transformer 注意力机制中是否必须使用三个独立的投影（Query、Key、Value）。通过分析多种 QKV 变体结构，论文对「三投影」这一设计选择进行了系统性评估。

arXiv 开源生态论文/研究部署/工程

09:24

meng shao@shao__meng

Kimi Code重构版发布：顶级程序员效率翻20倍

月之暗面旗下Kimi Code完成架构重构并开源。开发团队在一个月内进行封闭开发，频繁在白板前争论迭代，实现集体主义远胜个人英雄主义的工程效率。作者强调，AI Agent不会替代所有程序员，但会让顶级程序员生产力提升20倍，同时淘汰其他程序员。重构过程中，作者花数千美元token进行架构分析与验证，开源后因皮质醇过度分泌病倒。一周消耗整箱红牛，且感性上感觉时间已过一个月，实际仅开源一周多。

Kai: 过去一个月是疯狂的一个月大概一个月前,我下定决心重构 kimi-code,开始设计新的架构。我大概抱着电脑和便携屏在汤泉卷了两整天,花了几千刀的 token 去做架构分析、设计和验证,最终得到了一份我认为最优的架构方案。我觉得在 vi...

智能体大佬观点开源生态编码

08:27

Artificial Analysis@ArtificialAnlys

开放权重正在重塑编码和智能体工作负载，我们很高兴能在线下继续这场对话。请与 @nvidia 、@AWSstartups 、@MiniMax_AI 、@coderabbitai 和 @trydaily 一起，讨论开放权重模型以及生态系统的未来方向：https://luma.com/jf188vvq?tk=9QRzzY

智能体开源生态行业动态

08:00

HuggingFace Daily Papers（社区热门论文）

精选73

dots.tts 技术报告

dots.tts 是一个 2B 参数的连续自回归 TTS 基座模型，在连续潜在空间中建模语音。其创新包括：多目标训练的 AudioVAE 构建语义结构化连续语音空间；全历史条件的 flow-matching 头保持长程一致性；无奖励自纠正后训练提升鲁棒性和音质。在 Seed-TTS-Eval 上取得最佳平均性能，中文/英文/中文-hard 的 WER 分别为 0.94%/1.30%/6.60%，SIM 分别为 81.0/77.1/79.5。其他基准也达开源 SOTA。基于 CFG 的 MeanFlow 蒸馏实现低延迟推理，输出流首包 85ms，双流 54ms。训练推理代码及检查点已开源。

多模态开源生态论文/研究

推荐理由：dots.tts 在中文 TTS 上把 WER 压到 0.94%，开源且 Apache 2.0 许可，想做语音产品的团队该立刻拉代码试试，单看延迟数据就值了。

07:54

Berryxia.AI@berryxia

Firecrawl两年抓取80亿+网页，成AI基础设施

Firecrawl在两年内已抓取80亿+网页，拥有125万+开发者、15万+公司客户，GitHub星标125K+（全球前100仓库），npm和PyPI周下载量超250万。主推文指出，这一数据表明AI竞争正从模型参数转向“将互联网转化为可供AI直接消费的上下文”——Firecrawl通过API提供干净、结构化、可规模化的实时网页数据，填平了智能体获取最新内容的瓶颈，成为AI时代的基础设施层。

Firecrawl: We've now fetched 8,000,000,000+ pages at Firecrawl 🔥 A few other milestones in 2 short years: - 1.25M+ developers - 15...

智能体开源生态搜索现象/趋势

05:54

MarkTechPost（RSS）

NVIDIA AI 发布 Nemotron 3 Ultra：开源 550B MoE 混合 Mamba-Transformer，面向长时间运行智能体

NVIDIA 发布 Nemotron 3 Ultra，总参数量 550B（活跃参数 55B）的开源混合专家（MoE）模型，采用 Mamba-Transformer 混合架构，专为长时间运行的 AI 智能体设计。该模型支持 1M token 上下文窗口，推理吞吐量比同等准确率的开源大语言模型最高提升约 6 倍。权重、训练数据和配方以 OpenMDW-1.1 许可开放。

智能体开源生态模型发布

04:03

🚨 AI News | TestingCatalog@testingcatalog

NVIDIA 在 Huggingface 上发布 Nemotron 3 Ultra（Nemotron-3-Ultra-550B-A55B-NVFP4），一个 550B 参数的 MoE 前沿智能开源大语言模型，专为长时间运行的 AI 智能体设计。相比其他开源前沿模型，推理速度提升 5 倍，复杂智能体任务成本降低 30%。模型具备强大的智能体、推理和对话能力。

NVIDIA AI: Today we're shipping Nemotron 3 Ultra. A 550B MoE frontier-intelligence open model built for long-running agents. It del...

智能体开源生态推理模型发布

03:55

Chubby♨️@kimmonismus

那太酷了！我爱这些家伙的创意。一个仅2.4B参数的开放模型，用于实时音乐生成。如果你在长途飞行中无聊，现在可以开始创作神曲了。

Omar Sanseviero: Introducing Magenta RealTime 2 🎺 - Open model for live music generation - Just 2.4B parameters, perfect for on-device -...

Google 开源生态模型发布端侧

02:54

Google AI Developers@googleaidevs

精选70

Google AI for Developers 宣布推出开放权重的实时音乐模型 Magenta RealTime 2 （MRT2）。该模型可通过 MIDI 键盘、实时文本提示甚至手势进行演奏。MRT2 在 MacBook 上原生运行，延迟低于 200ms，提供开放权重、开源推理引擎以及配套应用和插件套件。

Google Magenta Project: Introducing Magenta RealTime 2 (MRT2): the live music model you can play as an instrument. MRT2 offers MIDI and prompt c...

Google 多模态开源生态模型发布

关联讨论 1 条

推荐理由：Magenta RealTime 2 把音乐生成从「后期制作」拉到了「实时演奏」，开放权重且延迟低于 200ms，音乐创作者值得立刻上手试试。

01:16

宝玉@dotey

宝玉：AI Agent团队自愿加班，好奇Kimi Code用token偏好

宝玉发推称所有AI Agent团队都为理想自愿加班封闭开发，并好奇Kimi团队开发Kimi Code时用自家token多还是Claude/GPT token多。@real_kai42透露，一个月前他决心重构Kimi Code，花几千刀token做架构分析与验证，确定方案后组建团队封闭开发，过程中不断吵架推翻重来，最终开源后因皮质醇过度分泌病倒。他感叹封闭开发是工程效率奇迹，集体主义远胜个人英雄主义。

智能体大佬观点开源生态

01:15