6月3日

01:14

Krea@krea_ai

Krea 2 现已上线 @ArtificialAnlys 独立研究实验室排名第一的图像模型，全球文本到图像排行榜第六。开源版本正在制作中，即将推出。

图像生成开源生态评测/基准

00:15

Rohan Paul@rohanpaul_ai

Kombai 发布前端专用 AI 编程智能体

Kombai 推出了首个专用于前端开发的AI编程智能体。针对通用智能体在处理前端任务时的不足，Kombai 通过读取设计上下文、浏览器状态、组件等数据，像前端工程师一样进行代码编辑。推文称，Kombai 在真实代码库任务上的表现超越了 SOTA 模型和通用编程助手，并在一个超过 50 万行的开源代码库中演示了添加复杂功能。此外，Kombai 还开源了一个可用于评测复杂前端任务的基准数据集。

Dipanjan Dey: Introducing Kombai, the first AI agent built for frontend development. Kombai vastly outperforms SOTA models + generic a...

智能体产品更新开源生态编码

6月2日

22:33

Nathan Lambert@natolambert

精选75

Nathan Lambert离开Ai2，结束2.5年OLMO等项目工作

Ai2（Allen Institute for AI）研究员Nathan Lambert宣布离职。他在Ai2工作超过2.5年，期间主导或参与了OLMO和Tulu等开源模型项目，称其为职业生涯的巅峰。他表示将暂时休息，未来仍会继续深耕开源模型与开放科学领域。

开源生态行业动态

推荐理由：Olmo 和 Tulu 的核心推手离开 Ai2，对开放模型圈是个不小的人事地震，他下一步去哪，可能比这条离职声明更值得盯。

20:44

Chubby♨️@kimmonismus

在 Google I/O 上，我与 Google DeepMind 的 @osanseviero 和 @DynamicWebPaige 坐下来，聊了聊 Gemma、开源模型、AI Studio、端侧 AI、主权 AI 以及 AI 开发的未来。一场关于 AI 构建如何变得更开放、更本地化、更易获取的精彩对话。

DeepMind Google 大佬观点开源生态

12:35

SenseTime@SenseTime_AI

同事件精选73

感谢使用我们的模型来创建这些复杂的图表和图表。看到具有挑战性的信息被转化为清晰、准确和可读的视觉效果真是太棒了。这就是我们的目标。😄

The AI Colony: SenseNova U1 just released an infographic-specialized version and +18.2 on IGenBench Q-ACC isn't a rounding error. It me...

Hugging Face 图像生成开源生态模型发布

同一事件，精选展示《商汤发布信息图生成模型升级，增强多项核心能力》

推荐理由：SenseNova U1 这波信息图特化不是刷分，+18.2 Q-ACC 证明模型真的懂了排版，做汇报、做图表的可以直接上 Hugging Face 扒下来用。

11:53

MiniMax (official)@MiniMax_AI

MiniMax宣布推出首个开源权重模型M3。该模型结合了三大前沿能力：在编程与智能体方面，它在SWE-Bench Pro等评测上取得了具体分数；通过MiniMax Sparse Attention技术，其上下文窗口可扩展至1M tokens；并且模型从零开始原生支持多模态。模型的权重与技术报告将在约10天后发布。

MiniMax (official): Introducing MiniMax M3: The First Open-Weights Model to Combine Three Frontier Capabilities - Coding & Agentic Frontier:...

开源生态模型发布编码

关联讨论 10 条

11:47

Berryxia.AI@berryxia

有朋友问我这个翻译工具是什么？

用户日常使用Memo和沉浸式翻译两款工具。Memo用于本地视频处理，先调用Whisper本地模型转录，再接入DeepSeek-V4-Flash进行翻译，最后在软件内完成字幕烧录与编辑导出。对于网页和在线视频，则使用沉浸式翻译，因其能较好保持原文格式。用户强调这两个工具自由度高，允许接入并自由切换不同的API模型。

Berryxia.AI: 特么终于搞完了,太费劲了! 整整花了1晚上才把它翻译中文、剪辑、上传完毕。富人也有富人的烦恼,只是我们的烦恼不一样罢了! 这两天刷屏的Ivanka Trump (特朗普的长女千金)的长播客采访。整个播客中有些观点不能说多么锐利,但是也从...

开源生态教程/实践

08:47

Berryxia.AI@berryxia

ComfyUI 5月工作流更新：集成11个新模型

ComfyUI在5月集成了11个涵盖图像、3D、音频、视频和多模态的新模型，将前沿AI能力转化为可本地运行的节点。亮点包括：Krea 2以Partner Node形式上线，专注于风格优先的图像生成；来自Netflix的VOID可干净移除对象及其引发的阴影、反射等物理交互；Tripo 3.1与TripoSplat结合，实现单图端到端生成3D Gaussian资产。此外，Gemma 4、Stable Audio 3等模型也已同步上线。用户无需单独调用API或处理兼容性，通过节点拖拽即可构建复杂工作流。

ComfyUI: In May, we integrated 11 new models spanning image, 3D, audio, video, and multimodal. The highlights: → Krea 2 - style-f...

产品更新图像生成多模态开源生态

03:41

Chubby♨️@kimmonismus

我真他妈爱死这个了。

Nous Research: We have been working closely with @nvidia to ensure Hermes Agent works smoothly on their new @NVIDIARTXSpark superchip a...

智能体 Microsoft 开源生态端侧

01:11

Artificial Analysis@ArtificialAnlys

NVIDIA Cosmos 3 荣登开放权重模型图像与视频生成双榜榜首

NVIDIA 的 Cosmos 3 全模态世界模型在 Artificial Analysis 排行榜的开放权重类别中，同时夺得文本生成图像和图像生成视频两项第一。该模型基于 Mixture-of-Transformers 架构，结合自回归推理器与扩散生成器，提供 16B 参数的 Nano 和 64B 参数的 Super 等变体。其中，Cosmos3-Super-Text2Image 与 Cosmos3-Super-Image2Video 版本分别超越了 HiDream-O1-Image-Dev-2604、通义千问（Qwen）Image Max 2512、FLUX.2 [dev] 以及 LTX-2、万相（Wan）2.2 A14B 等模型。Cosmos 3 的生成器接受结构化 JSON 提示词，可通过外部工具或模型自身的推理器分支进行提示词上采样。该模型完全开源，采用 OpenMDW 1.1 许可，提供权重、代码、精选数据集和微调方案。

Hugging Face 多模态开源生态模型发布

关联讨论 10 条

00:10

Chubby♨️@kimmonismus

MiniMax发布开源模型M3，它是首个将前沿编码能力、1M token上下文窗口与原生多模态集成于单一系统的开源模型。M3在SWE-Bench Pro上得分为59.0%，略高于GPT-5.5（58.6%）与Gemini 3.1 Pro（54.2%）；在BrowseComp自主浏览任务中以83.5%领先Opus 4.7。此外，模型在Terminal Bench 2.1（66.0%）、MCP Atlas（74.2%）等基准上表现优异。其每token成本约为GPT-5.5的十二分之一，模型权重及技术报告预计在10天后发布。

MiniMax (official): Introducing MiniMax M3: The First Open-Weights Model to Combine Three Frontier Capabilities - Coding & Agentic Frontier:...

智能体多模态开源生态模型发布

关联讨论 10 条

6月1日

22:33

Runway@runwayml

今天我们宣布伦敦将成为Runway新的欧洲总部，以及我们专注于通用世界模型的最新研究枢纽。未来18个月，我们计划向英国AI生态系统投资1亿美元，随着我们扩大欧洲业务，这一数字到2028年将翻倍以上。了解更多并探索开放职位，请点击下方链接。

开源生态行业动态

关联讨论 1 条

22:28

Nathan Lambert@natolambert

推文探讨了闭源模型与开源模型未来不同的发展轨迹。观点认为，闭源实验室可以通过提供成本高昂的高端服务（如高端知识工作）来创造并维持利润，这将推动 OpenAI、Anthropic 等公司获得高估值。与此同时，开源模型经济体将逐步发展并壮大，服务于更广泛的长尾应用市场。这表明两种模型体系将在不同的维度上增长，其中闭源模型在边际智能价值驱动溢价的领域优势明显，而开源模型则在其他场景下逐步扩大影响。

Interconnects: Open and closed models are on different exponentials Where marginally higher intelligence drives value, and where it doe...

大佬观点开源生态

22:04

向阳乔木@vista8

精选80

作者分享使用 Codex App 开发的开源项目合集

作者分享了使用 Codex App 等工具开发的一系列开源项目，包括4个 Chrome 插件（如快捷提示词、新标签页）、4个网站（如艺术家风格对比、音乐展示）和5个 AI Skill（如论文解读、阅读助手）。项目基于 GPT-Image-2 API、Suno 等技术，并整合了 Read-frog、Hyperframe 等开源项目。

开源生态教程/实践编码

推荐理由：乔木一口气开源了8个工具和5个Skill，从提示词插件到Suno音乐制作，看完就能直接用，做内容和开发的读完可以少写半个月代码。

19:48

AYi@AYi_AInotes

说个暴论：信息差是普通人最后的红利。

推文指出，在AI时代，真正的贫富差距已转变为信息差。信息玩家能通过各种渠道节省开支或获取免费资源，例如以五折价购得几乎全新的商品、利用学生身份免费使用一年Cursor、作为开源项目维护者领取半年ChatGPT Pro，或为初创公司获取数万美元云额度。推文引用的具体福利显示，任何公开开源项目的维护者，均可申请免费获得价值$1200的6个月ChatGPT Pro。这些高杠杆的免费通道不会主动出现，因此推文建议养成在消费前先审视自身是否为“冤种”的习惯，以抓住信息差带来的红利。

AYi: 免费领6个月ChatGPT Pro, 价值$ 1200🤩 这可能是今年对开发者最实在的福利了, 没有硬性Star数要求, 有项目链接基本都能过, 只要你是任何一个公开开源项目的维护者,哪怕只有你一个人在维护, 都可以去申请试试: http...

OpenAI 开源生态教程/实践

19:17

MiniMax (official)@MiniMax_AI

我可以整天看SVG测试！快用M3多发点给我 👀

WorldofAI: Minimax M3 is excellent at SVG generation, reaching close to Gemini 3.5 Flash levels and beating Opus 4.7 on SVG-Bench. ...

图像生成开源生态评测/基准

18:47

MiniMax (official)@MiniMax_AI

确实如此 😎 #M3

Arif: MiniMax M3 scores 90.3% GPT 5.5 Scores 92.4% Just a 2.1% gap now at @convex. Incredible to see the open-source models cl...

开源生态推理模型发布

18:42

Berryxia.AI@berryxia

KwaiKeye开源多模态大模型Keye VL 2.0-30B-A3B

KwaiKeye开源了多模态大模型Keye VL 2.0-30B-A3B，采用Apache 2.0许可。该模型总参数为30B，但仅激活3B参数。其核心亮点是通过DeepSeek稀疏注意力技术实现了256K的上下文长度。该模型的视频理解能力表现出一个反直觉的特性：喂入的帧数越多，其准确率反而持续上升。在基准测试中，其表现已与Qwen3 VL、Gemini 3 Flash等模型相当。

Adina Yakup: Keye VL 2.0-30B-A3B 🔥 New multimodal model from @KwaiKeye ✨ 30B/3B active - Apache 2.0 ✨ 256K context via DeepSeek Spar...

多模态开源生态推理模型发布

15:48

Emad@EMostaque

借助Nemotron与Cosmos，NVIDIA将把所有人的互补能力商品化。

大佬观点开源生态

13:36

🚨 AI News | TestingCatalog@testingcatalog

MiniMax发布开源模型M3

MiniMax发布了新开源权重模型M3，现已通过API和MiniMax Agent提供服务。该模型在SWE-Bench Pro上得分59.0%，在Terminal Bench 2.1上得分66.0%，并支持高达1M的上下文窗口。同时，MiniMax Agent更新了持久记忆与进化技能等能力。此外，MiniMax Code也已发布，模型权重与技术报告将在约10天后公开。

MiniMax (official): Introducing MiniMax M3: The First Open-Weights Model to Combine Three Frontier Capabilities - Coding & Agentic Frontier:...

多模态开源生态模型发布编码

关联讨论 10 条

13:31

Runway@runwayml

介绍Cosmos联盟一项与NVIDIA及领先AI实验室合作的新全球倡议，旨在构建并开源用于物理AI的前沿世界模型。Runway作为创始成员加入，与NVIDIA及一系列领先AI实验室共同工作，通过一个共同的开放生态系统来构建、共享并加速世界模型的研究与开发。

具身智能开源生态行业动态

关联讨论 1 条

09:25

swyx@swyx

PewDiePie发布个人AI生产力套件，成为DIY新标杆

2025年2月，soumithchintala关于个人、本地、私有AI智能体的愿景曾遭质疑。而至2026年6月，知名玩家PewDiePie已基于opencode封装发布了一款vibecoded的个人AI生产力套件，功能涵盖邮件、文档和日历。该产品在Hacker News上迅速获得超过1百万次浏览和超过10k星标。推文指出，这一成果为知识工作智能体初创公司设立了新的DIY基准。

智能体开源生态现象/趋势

04:55

Artificial Analysis@ArtificialAnlys

HiDream发布O1-Image系列文生图模型

HiDream发布O1-Image系列文生图模型，包含8B参数的HiDream-O1-Image、其蒸馏版本HiDream-O1-Image-Dev，以及基于Dev微调并集成提示增强管线的HiDream-O1-Image-Dev-2604。在Artificial Analysis Text to Image Arena榜单上，Dev-2604版本在所有开源权重模型中排名第一，生成质量接近Seedream 4.0和FLUX.2 [max]等闭源模型。在图像编辑任务中，HiDream-O1-Image是排名第二高的开源模型，仅次于腾讯的HunyuanImage 3.0 Instruct。所有模型的权重及完整推理管线均以MIT许可证开源。HiDream-O1-Image与HiDream-O1-Image-Dev也通过Fal等第三方API提供，价格分别为$10/1k images和$5/1k images。

Hugging Face 图像生成开源生态模型发布

5月31日

21:20

Peter Steinberger 🦞@steipete

OpenClaw的理念始终是它应该属于你。它是模块化且精简的，只添加你需要的功能。更少的技能，更少的工具 = 你的智能体可以更高效地工作。

EdgeDimi: @theo Seeing different paths ioenclaw started as a heavy package and became lean now hermes becomes the heabty trash pac...

智能体大佬观点开源生态

08:44

向阳乔木@vista8

GEO公开课首期举办，全套资料开放获取

首期GEO公开课于上周末直播，由姚老师主讲，吸引了飞书和视频号数千人在线参与。课后已将直播PPT、免费开源的GEOflow系统及全部提示词等干货资源在评论区开放分享。

开源/仓库开源生态搜索

05:43

Nathan Lambert@natolambert

关于开源还是闭源模型会胜出的争论，归结于边际智能提升是否带来不成比例的价值。相信这一点的人，与认为开源模型"足够好"的阵营相对而立。闭源模型将保持略微更智能。开源模型将更便宜。

大佬观点开源生态

5月30日

23:34

AYi@AYi_AInotes

精选75

免费领取6个月ChatGPT Pro及AI工具思考

OpenAI为开源项目维护者提供福利，可免费领取6个月ChatGPT Pro（价值$1200），申请无硬性Star数要求，有项目链接即可。同时，文章引用讨论了AI工具的分类：一类是“agent型”（如Claude Code、Codex），可自主运行；另一类是“实习生型”（如Cursor），需人工决策，有助于使用者以术入道、培养判断力，但受限于需人在场。作者推荐了网易的UU远程工具，称其免费两年，支持4K 144帧无延迟连接Mac并可使用原生终端，解决了“实习生型”工具的地点限制问题。

AYi: 今天,把一件关于 AI 很底层的事,彻底想透了。使用 AI 的最佳方式是以道御术,但前提是你得先以术入道。就像黄仁勋说的--真正会用 AI 的人,都是极高认知的提问者,带着自己的认知去提问,让 AI 帮你叩开未知的边界,而不是让它替你思...

OpenAI 其他开源生态

推荐理由：OpenAI 给开源维护者送 6 个月 Pro，没 Star 要求，有项目链接就行，我觉得这是今年最实在的开发者福利，手慢无。

23:14

Ethan Mollick@emollick

Epoch AI 使用其综合指标 Epoch Capabilities Index 测量发现，开源模型与闭源模型的能力差距平均约为三个月。但主推文作者对此表示怀疑，认为开源大语言模型的实际表现（尤其是在分布外任务上）比评测分数所显示的更为脆弱，真实的体感差距可能远不止三四个月。

Epoch AI: We measure the gap using the Epoch Capabilities Index, our aggregate measure of model capability. Compared to our last a...

大佬观点开源生态评测/基准

13:11

向阳乔木@vista8

近期X平台用户互动下降，主要受两大因素影响。一是全球自动翻译功能于2026年4月7日上线，打破了语言壁垒，使得同主题内容（如地缘政治）的潜在竞争者数量从约5000个英语账户剧增至约5万个全语言账户，大幅降低了单个帖子的能见度。二是推荐算法根本性转变：粉丝权重降低，每条帖子需基于预测互动独立赢得受众。新算法采用两阶段机制：先通过语义匹配从全平台筛选出约1500个候选帖，再通过一个Grok模型基于15项预测互动指标（如点赞、回复、停留时间等）进行排序。其中，负面互动（如标记不感兴趣、屏蔽）会被负向加权，直接影响展示优先级。

Arnaud Bertrand: So I spent some time studying the new Twitter/X algorithm today since the latest version was published about a week ago ...

开源生态现象/趋势

12:18

SemiAnalysis@SemiAnalysis_

精选76

突发新闻：JAX NVIDIA GPU & XLA：GPU最大客户刚刚宣布已放弃JAX GPU，宁愿用Grok Build"氛围编程"一个C训练框架。据报道xAI的JAX堆栈MFU低于10%。NVIDIA JAX团队过去两年全部主力996专注于支持xAI却失败了，我想他们现在可以休息并兑现期权了。

xAI 开源生态行业动态

推荐理由：xAI 这个 GPU 最大客户突然甩了 JAX，要自研 C 训练框架，理由是 JAX 利用率太低。如果连万亿参数集群都搞不定，JAX 的底层缺陷可能比想象的大，做大规模训练的团队得认真评估了。

08:08

Nathan Lambert@natolambert

推文强调开放科学在AI讨论和研究中的基础性作用，以Tulu 3项目创建RLVR（基于强化学习的验证与推理）为例，说明公开研究方法能为领域设定标准并减少未来冗余。同时指出一个关键现象：AI前沿实验室的创新常被学术界独立重现，但外部人员无法接触这些内部工作，唯一的参考来源就是公开分享的研究。因此，开放科学对推动整个领域进步至关重要。

Rishabh Agarwal: Someone once told me: "You should be the last one to reinvent something" -- not sure how useful this is, but this is a c...

大佬观点开源生态现象/趋势

08:06

OpenRouter@OpenRouter

精选72

现在你可以直接在ComfyUI工作流中使用你的OpenRouter模型了！【引用 @ComfyUI】：ComfyUI刚刚添加了@OpenRouter支持。你不再局限于单一的大语言模型，现在可以直接在Comfy中访问20多个模型。更多灵活性，更少摩擦，同样的工作流。工作流链接在下方👇

ComfyUI: ComfyUI just added @OpenRouter support. Instead of being locked into a single LLM, you can now access 20+ models directl...

产品更新多模态开源生态

推荐理由：ComfyUI 首次直接集成 LLM 路由服务，等于给图像管线加了个「外挂大脑」，做自动化工作流的人可以直接在节点里调用 20+ 模型，省掉一堆 API tinker 环节。