6月2日

10:47

Berryxia.AI@berryxia

推文分享作者日常使用的两个AI翻译工具及工作流。1. Memo软件（免费开源）：用于处理本地视频。流程为下载视频后，使用Whisper本地模型进行转录以节省成本，再接入DeepSeek-V4-Flash API进行翻译。该软件支持字幕烧录、编辑和导出，但在X平台上传速度慢。2. 沉浸式翻译：主要用于网页、YouTube视频及图书翻译，优点是格式保持较好。两者均支持接入用户自定义的API模型。

Berryxia.AI: 特么终于搞完了,太费劲了! 整整花了1晚上才把它翻译中文、剪辑、上传完毕。富人也有富人的烦恼,只是我们的烦恼不一样罢了! 这两天刷屏的Ivanka Trump (特朗普的长女千金)的长播客采访。整个播客中有些观点不能说多么锐利,但是也从...

DeepSeek 多模态开源/仓库教程/实践

09:18

SemiAnalysis@SemiAnalysis_

你的强化学习训练效率取决于沙盒基础设施。来看看 Modal 如何让你的 rollout 持续运行！

Modal: Reinforcement learning has exploded on Modal, and we've been cooking. Here's a review of lessons learned helping teams t...

开源/仓库部署/工程

08:47

凡人小北@frxiaobei

Codex 正在变成 Agent 的默认 Runtime。 codex 其实还同时有 typescript sdk。如果你要搭建一个 agent，技术栈可以是： typescript + codex + cc-switch

Vaibhav (VB) Srivastav: We just released the Codex Python SDK 🔥 You can now embed Codex directly into your Python apps and workflows! > Start t...

智能体 OpenAI 开源/仓库

07:54

ginobefun@hongming731

MiniMax发布开源模型M3：集成编码、长上下文与多模态

MiniMax开源发布了国内首个集成前沿Coding能力、1M超长上下文和原生多模态的模型M3。该模型能在24小时内自主完成145次CUDA算子迭代。与此同时，xAI前负责人指出，视频模型的上限将由LLM决定，下一个类似Sora的产品应是视频Agent，而非单纯的视频生成模型。

多模态开源/仓库模型发布编码

07:19

MiniMax (official)@MiniMax_AI

同事件精选81

M3 on Cloudflare AI Gateway， day one ⚡ 前沿编码能力，1M 上下文，原生多模态，现在一次 fetch 即可调用。是时候构建些东西了。 🦞

Cloudflare Developers: M3 from @MiniMax_AI is now available on Cloudflare AI Gateway: - First open model to push SOTA coding frontier - 1M cont...

多模态开源/仓库模型发布编码

同一事件，精选展示《MiniMax M3：前沿编码、100万token上下文与原生多模态一体模型》

推荐理由：MiniMax的M3把开源编码模型拉到新高度，1M上下文加原生多模态是惊喜，上线首周5折，值得跑一下看是不是真能干翻闭源。

04:48

jason@jxnlco

你将构建什么？【引用 @jxnlco】：哇，我们刚刚发布了 Codex 的 Python 应用服务器感谢 @ah20im

jason: wow we just shipped codex app server for python shoutouts to @ah20im

OpenAI 产品更新开源/仓库部署/工程

02:18

MiniMax (official)@MiniMax_AI

MiniMax M3现已在Happycapy上线，主要升级在于处理复杂、多模态、大规模任务的能力。该模型支持原生多模态输入，包括PDF、视频、图像、截图及长文档，并在编程和智能体任务（如仓库级调试、问题追踪）上表现较强。此外，M3采用开源权重，价格约为Sonnet的三分之一。

Happycapy: MiniMax M3 @MiniMax_AI is now live on Happycapy 🎉 A major upgrade for agent workflows, especially when the task is mess...

多模态开源/仓库模型发布编码

01:18

MiniMax (official)@MiniMax_AI

MiniMax的M3模型现已在Qubrid AI平台上线。该模型具备100万token上下文、原生多模态、前沿的代码性能，并支持长期智能体工作流，被评为年度技术上最有趣的开放权重模型之一。Qubrid AI作为首发合作伙伴，为早期用户提供50%的折扣。

Qubrid AI: @MiniMax_AI M3 is now live on Qubrid AI. https://platform.qubrid.com/model/minimax-m3 - 1M-token context. - Native multi...

智能体多模态开源/仓库模型发布

关联讨论 11 条

6月1日

23:42

Berryxia.AI@berryxia

FastClaw是一个面向云原生多租户场景的轻量级Agent运行框架。它通过存算分离的架构，让Agent无需常驻，而是根据请求动态挂载sandbox提供服务。实测显示，将托管服务从OpenClaw迁移到FastClaw后，服务器数量从18台降至3台，运营成本降至约1/6。此外，FastClaw代码体积约为OpenClaw的1/40，运行资源占用约为其1/7，支持单二进制分发和秒级启动。这个框架非常适合处理批量任务。

idoubi: 我年初开始做 OpenClaw 托管服务,在一套 k8s 集群部署了 500 个 Pod,每个 Pod 限制 4g 的运行内存。日常开着 18 台 4c16g 的服务器作为节点池,一个月成本将近 5k 刀。几个月下来,托管服务的 MRR ...

智能体 GitHub 开源/仓库部署/工程

22:04

向阳乔木@vista8

最近vibe coding的所有工具和skill，全部免费开源，Codex和CC是成年人的六一儿童节玩具。

向阳乔木: http://x.com/i/article/2061439796745297920

开源/仓库编码

21:58

Nathan Lambert@natolambert

英伟达是美国日益壮大的开源模型努力的先锋。虽然酝酿已久，但当一个550B模型发布时，更多人会注意到这一点，这是显而易见的。许多人不会意识到他们发布的训练数据也很有价值。

NVIDIA AI: Nemotron 3 Ultra is coming this week. ⌛️

开源/仓库行业动态

21:12

OpenBMB@OpenBMB

同事件精选78

OpenBMB发布UltraData两大开源数据集，登顶HuggingFace趋势榜

OpenBMB联合清华NLP与Modelbest发布两个开源数据集：Ultra-FineWeb-L3（预训练合成数据）包含600B+ tokens（超400B英文、200B+中文），是迄今最大开源中文预训练合成数据集；UltraData-SFT-2605（后训练SFT数据）包含15M+样本，是中国首个开源且包含思考与非思考标注的大规模SFT数据集，覆盖数学、代码、知识和指令遵循。两者均基于UltraData L0-L4框架构建，并在MiniCPM5-1B训练中完成验证。数据集已在HuggingFace免费开放。

Hugging Face 开源/仓库数据/训练

同一事件，精选展示《面壁智能联合清华、OpenBMB开源最大中文预训练合成数据集及千万级SFT数据集，公开MiniCPM5-1B核心数据》

推荐理由：面壁开源了两个王炸数据集，预训练的 600B+ token 中文合成数据史上最大，SFT 那边 1500 万条带思考链的指令更是头一回见，做中文基础模型的可以无脑下载了。

21:09

Chubby♨️@kimmonismus

NVIDIA在GTC Taipei上宣布完全开源Cosmos 3。这是首个针对物理AI的"全能模型"，具备原生视觉推理能力，可理解真实世界、预测未来并生成机器人应采取的行动。本次发布包含两个变体：Super（32B）和Nano（8B）。模型权重、代码及数据集均已完全开放。

NVIDIA AI: Introducing Cosmos 3: Our latest frontier model for Physical AI Cosmos 3 is the world's first fully open omnimodel with ...

具身智能开源/仓库模型发布

关联讨论 10 条

21:02

SiliconFlow@SiliconFlowAI

MiniMax M3 现已上线 SiliconFlow 平台

MiniMax M3 现已在 SiliconFlow 平台上线，并提供限时7天的50%折扣。定价为：缓存 $0.06、输入 $0.30、输出 $1.20（每百万 token）。M3 是首个同时具备三大前沿能力的开源模型：一是编码与智能体能力，在 SWE-Bench Pro 评测中击败了 GPT-5.5 和 Gemini 3.1 Pro；二是支持 100万 token 上下文窗口（通过 MiniMax Sparse Attention 技术实现）；三是具备原生多模态能力，支持图像、视频与计算机操作。

多模态开源/仓库模型发布编码

关联讨论 11 条

20:48

AYi@AYi_AInotes

精选79

使用Claude Opus 4.8将书籍转化为AI技能的教程

本文以《非暴力沟通》为例，提供了一个将书籍转化为可调用AI技能（Skill）的六步教程。作者使用Claude Opus 4.8模型，因其具备100万token上下文窗口、结构化输出及多步智能体（Agent）能力，能一次性处理全书逻辑。流程包含文本准备、全局结构分析、五类提炼（框架/原则/技法/反模式/作者声音）、技能生成及关键的自检步骤。生成的技能保留了书中原始框架命名（如OFNR四要素、长颈鹿语言），并将触发词优化为“怎么提意见不像在指责”等日常表达。整个流程耗时约45分钟，消耗约30万token，成本不到20元人民币。

开源/仓库教程/实践

推荐理由：不是摘要，是真能用的skill。把整本书喂给Claude Opus 4.8，提炼成能随时唤起的工具箱，连自检步骤都帮你做好了，想把自己读过但用不上的书激活的，直接抄。

20:47

MiniMax (official)@MiniMax_AI

1. 视频控制 + 游戏 + M3 2. 开放权重 + 海量上下文 + 强编码能力 3. 现在就取消我的周末计划【引用 @MinLiBuilds】：跟祖传的 20K context 说 bye bye 了。 MiniMax M3 发布了，三个亮点： 1M context、原生多模态、Agentic。我这次做了一次完整评测，使用CC workflow 、 @ZenMuxAI和MiniMax M3：给一张截图，做一个"凡人修仙剑阵对决手势游戏"。要求是：支持双人对决、使用 workflow 拆解任务、加入石头剪刀布机制。 2 小时后，游戏真的跑起来了。这一代LLM的版本答案我知道了： 1M 上下文 + 多模态+ agent 模式。 1M context 是推理深度的基础，多 agent 负责拆任务和执行。

实践哥MinLi: 跟祖传的 20K context 说 bye bye 了。 MiniMax M3 发布了,三个亮点: 1M context、原生多模态、Agentic。我这次做了一次完整评测,使用CC workflow 、 @ZenMuxAI和MiniM...

智能体多模态开源/仓库模型发布

20:43

🚨 AI News | TestingCatalog@testingcatalog

NVIDIA宣布将于本周晚些时候发布Nemotron 3 Ultra，这是一个550B参数的开放权重模型。根据Artificial Analysis，它被定位为美国实验室最智能的开放权重模型。 Soon 👀

NVIDIA AI: Nemotron 3 Ultra is coming this week. ⌛️

开源/仓库推理模型发布

16:17

MiniMax (official)@MiniMax_AI

太棒了 🙌 快去 @orca_build 里用 @opencode 试试 M3 【引用 @JinjingLiang】：MiniMax M3 让我惊艳我一直在 @orca_build 里用 @opencode 智能体免费使用它目前主要做 UI 任务和代码审查，但感觉性能与 Opus-4.7 不相上下没想到它这么好用。（而且目前免费）

Jinjing Liang: Blown away by MiniMax M3 I've been using it for free inside @orca_build with the @opencode agent Mostly UI tasks & code ...

开源/仓库编码评测/基准

14:17

MiniMax (official)@MiniMax_AI

这很火🔥 M3 首日上线 @OrcaRouter 快去跑起来（首周五折👀）

OrcaRouter 🐳: 🚀 @MiniMax_AI M3 is now available on OrcaRouter. One of the most anticipated open model releases, bringing next-gen spa...

智能体开源/仓库模型发布

12:42

Berryxia.AI@berryxia

用两周开发一个可走进、可对话的盛唐长安3D世界

开发者使用Three.js，耗时两周构建了可在线体验的盛唐长安3D互动项目。核心功能包括通过WASD模式在城市场景中自由漫游，并接入Agora ConvoAI实时语音Agent，使用户能与李白、杜甫等NPC进行真实语音对话。项目还融合了飞花令等诗词小游戏及AI展馆，将历史文化与AI能力场景化结合。该开源项目（GitHub Pages）代码结构清晰，旨在为创作者提供一个可复用的数字文旅样板。

Berryxia.AI: http://x.com/i/article/2060375125825036288

智能体多模态开源/仓库教程/实践

12:35

Artificial Analysis@ArtificialAnlys

NVIDIA发布最大Nemotron 3模型Nemotron 3 Ultra

NVIDIA在Computex上发布了Nemotron 3 Ultra，总参数达550B（激活参数55B），是目前最大的Nemotron 3模型。该模型在美国开放权重模型中智能性最强，在Artificial Analysis Intelligence Index评测中得分为48，超越了Gemma 4 31B（39分），但仍落后于月之暗面（Kimi）的K2.6（54分）。在推理速度方面，其在预发布端点上超过了300 tokens/s，远高于同级别中国模型通常的50-100 tokens/s。该模型将提供BF16权重及NVFP4量化版本以提升推理性能。

开源/仓库推理模型发布评测/基准

关联讨论 10 条

11:46

MiniMax (official)@MiniMax_AI

出发吧🔥 M3 + @visionagents_ai 实现实时语音与视频去构建些令人兴奋的东西吧！【引用 @visionagents_ai】：祝贺 @MiniMax_AI 团队发布 M3！ 👉 一款前沿级开源权重模型 👉 100万 token 上下文窗口 👉 原生多模态（图像与视频）

Vision Agents: Congrats to the @MiniMax_AI team on the release of M3! 👉 A frontier-class open-weight model 👉 1M context window 👉 Nat...

多模态开源/仓库模型发布视频

关联讨论 11 条

11:15

MiniMax (official)@MiniMax_AI

M3现已在@AskVenice上线，支持匿名使用🔥 开源权重，前沿编码与智能体能力，1M上下文，原生多模态。首日即上线

Venice: MiniMax-M3 by @MiniMax_AI is now live on Venice. The first open-weight model to deliver frontier coding and agentic perf...

智能体多模态开源/仓库模型发布

08:41

Berryxia.AI@berryxia

GitHub开源项目挑战付费订阅模式

该推文指出，许多付费的AI工具和专业软件（如Bloomberg）是资本维持收入的机制。GitHub上已有10个开源项目可替代它们，提供免费、功能强大且支持自托管的选项。示例包括：AutoHedge（自主交易代理）、Vibe-Trading（金融技能与代理系统）、Fincept Terminal（Bloomberg替代品）、LibreChat（多模型聊天）以及Open Higgsfield AI（电影工作室）等。这些项目让用户能完全掌控自己的数据和控制权，将原本昂贵的订阅服务免费提供给普通人。

Harman: 10 GitHub repos so good they shouldn't be free. 1. AutoHedge An autonomous hedge fund built in Python with four AI agent...

智能体多模态开源/仓库部署/工程

00:46

向阳乔木@vista8

基于开源翻译插件的沉浸式单词学习系统

用户基于开源沉浸式翻译插件 read-frog，使用 Codex 开发了一套单词学习系统。该系统能将用户在阅读英文网页时收藏的单词自动生成闪卡进行复习，并基于艾宾浩斯遗忘曲线安排学习周期。系统会根据单词难度（例如 CET6+）在旁边添加中文翻译，并标记单词的掌握情况。通过此模式，当一篇文章不再显示生词翻译时，即表明学习者已基本掌握该文章词汇。

开源/仓库教程/实践

00:35

Berryxia.AI@berryxia

一个用Claude模型和Three.js搭建的盛唐长安实时语音互动小游戏已开源。项目由个人开发者耗时2周、花费800刀完成，通过Agora Skills实现实时语音交互。玩家可在其中与NPC对话、与李白对诗、玩诗词小游戏，还能进入珍宝馆欣赏诗画，体验古文明与AI结合的沉浸感。

Berryxia.AI: 🔥我尼玛,兄弟们,这下真的是爆肝了。已经开源在GitHub了,记得Star一波啊! 我肝了2周+花费了800刀干出来的项目~😭 自己可以真实去体验,文旅馆的真的都可以搞一搞! 一个用 3D 渲染技术three.JS 搭起来的盛唐长安互...

多模态开源/仓库语音

5月31日

10:14

向阳乔木@vista8

只需提供一个Suno歌曲的URL，用Codex自动生成音乐MTV。 Codex自动调用生图、组织画面、生成对齐的歌词。 Skill等继续完善后就可以开源了。

MCP/工具多模态开源/仓库视频

09:45

小互@xiaohu

用户开发的"中文小黑怪诞"正文配图生成 Skill，在 GitHub 周榜上位列第二。该项目原本是为自己 Notion 文档生成配图而开发，特点是 16：9 比例、白底手绘风格，并带少量红、橙、蓝三色批注。用户发现该项目意外上榜后，表达了对排名的惊喜与再接再厉的心情。

Ian (伊恩): 我的天!我的 Skill 在 GitHub 本周排第二啦! 刚刷到藏师傅项目冲到第一,我点进去一看,笑死,我这个也在榜上,排第二就是这个中文小黑怪诞正文配图生成 Skill: http://github.com/helloianneo/i...

GitHub 图像生成开源/仓库

08:44

向阳乔木@vista8

GEO公开课首期举办，全套资料开放获取

首期GEO公开课于上周末直播，由姚老师主讲，吸引了飞书和视频号数千人在线参与。课后已将直播PPT、免费开源的GEOflow系统及全部提示词等干货资源在评论区开放分享。

开源/仓库开源生态搜索

07:43

宝玉@dotey

开源工具Sandcastle：编排多AI智能体协同工作流程

Sandcastle是由@mattpocockuk开源的一个TypeScript工具，允许用户通过脚本编排Workflow，在虚拟机中协同调用Codex、Claude Code、Cursor、GitHub Copilot等多个AI智能体来完成复杂任务。它定位为面向追求极致效率场景的极客工具，适用于需要多智能体协作或“赛博养蛊”式的任务，例如让各智能体分别生成技术方案再相互评审完善。

Matt Pocock: I built my own software factory, and I open-sourced it. It's called Sandcastle. Here's how to use it:

智能体 MCP/工具开源/仓库

05:43

OpenClaw🦞@openclaw

OpenClaw 2026.5.28 已上线 🧠 支持 Claude Opus 4.8 🎨 通过 fal 支持 Krea 图像模型 ⚡ 更快的 Gateway/插件/会话热路径 💬 Discord 进度草稿现在显示评论更锐利的模型，更活跃的运行。 https://github.com/openclaw/openclaw/releases/tag/v2026.5.28

Anthropic 产品更新开源/仓库

00:34

Berryxia.AI@berryxia

阶跃星辰 Step 3.7 Flash 模型成功移植到 mlx-vlm 项目

Ivan Fioravanti 在 mlx-vlm 项目中成功将阶跃星辰的 Step 3.7 Flash 模型移植到 MLX 框架，实现了视觉理解和文本生成。测试表明，该模型的 4bit 量化版本在 128GB Apple Silicon Mac 上支持 32K 上下文，生成速度超过 53 tokens/s。对截图的分析也准确高效。这意味着高质量的本地多模态 AI 能力可以在个人 Mac 上运行，兼顾了隐私与性能。

Ivan Fioravanti ᯅ: Step 3.7 Flash support added to mlx-vlm! 🚀 ✅ Conversion to MLX ✅ Vision ✅ Text This model is ultra fast! I'm gonna publ...

多模态开源/仓库端侧

5月30日

19:11

StepFun@StepFun_ai

小即是美。😌

Teortaxes▶️ (DeepSeek 推特🐋铁粉 2023 - ∞): I've been waiting for this! They managed to do it before June, and they open sourced it right away! @antirez I've been s...

多模态开源/仓库模型发布端侧

18:42

歸藏(guizang.ai)@op7418

GitHub周榜第一：社交媒体卡片Skill

一个名为“guizang-social-card-skill”的社交媒体卡片技能，在GitHub本周新建项目Star排名中冲到了第一名。作者通过群友发现自己的项目登顶，并亲自确认了这一成绩。

歸藏(guizang.ai): http://x.com/i/article/2059811469081141248

开源/仓库

12:41

向阳乔木@vista8

推文宣布了与姚老师合作举办的GEO公开课。姚老师将主讲GEO的底层逻辑、方法、系统原理及理念，并分享一系列核心资源，包括GEOFlow系统、用于创建技能的元Skill、17套GEO Skill合集，以及收录41篇最新论文的资料库。此外，分享内容还涵盖《GEO到底是什么》等多篇白皮书、红皮书、蓝皮书及AI营销提示词合集。该公开课将通过WaytoAGI进行直播，另一位主讲人将负责AI工具与模型相关的问答环节。

姚金刚: 今晚八点,会通过WaytoAGI做第一场GEO直播分享,会把GEO的底层逻辑、方法、系统原理及理念做一轮讲解,相关的一些资料和系统如下,分享给大家: 1、GEOFlow,今晚主讲的系统和背后的GEO原理 https://github.com...

开源/仓库搜索教程/实践

06:42

ginobefun@hongming731

精选78

claude-design-card 是一款专为中文内容创作者设计的 Skill。它能将文字、URL 或文章直接转化为可发布的视觉卡片，如公众号首图、小红书图文卡、教程步骤卡等，支持 28 种布局与 10 种主题。其核心价值在于自动化了"写完文章"后最繁琐的流程：自动提炼重点、选择版式、生成 HTML 并截图成 PNG，替代了以往手动使用 Figma 或 Canva 等工具的步骤。该工具开源，适合经常撰写相关内容的创作者尝试。

撸毛吃猪脚饭: 昨天那个 md2wechat-skill 很多人收藏今天再分享一个很适合中文创作者的 Skill:claude-design-card。它可以把一段文字、一个 URL、一篇文章,直接生成能发出去的视觉卡片,比如公众号首图、小红书图文卡、...

GitHub 图像生成开源/仓库

推荐理由：这个 Skill 把内容创作者最烦的「写文→排卡片→出图」流程直接打通了，28 种布局一键生成，做公众号和小红书的可以立刻收藏，关键不是好看是真省时间。

00:15

AK@_akhaliq

minWM 一个用于实时交互视频世界模型的全栈开源框架

开源/仓库开源生态视频

5月29日

23:34

Berryxia.AI@berryxia

这是一个用Three.js搭建的盛唐长安3D互动世界，接入Agora技能实现核心实时语音交互功能。用户可与NPC对话、与李白对诗、玩诗词小游戏，并参观珍宝馆和AI展馆。开发者耗时两周、花费800刀完成，现已开源。

多模态开源/仓库语音

22:34

Berryxia.AI@berryxia

开源项目：Three.js打造3D盛唐长安互动世界

作者开源了一个使用3D渲染技术Three.js搭建的盛唐长安互动世界项目。项目核心功能是接入Agora Skills，实现了实时语音互动。用户可以在虚拟世界中与NPC对话、与李白对诗、玩诗词小游戏、进入珍宝馆欣赏诗画，以及逛AI展馆体验古今融合。作者透露该项目花费了2周开发时间及800美元成本，现已托管在GitHub上并开放体验。

多模态开源/仓库语音

21:34

AYi@AYi_AInotes

本文探讨"以术入道"的AI使用哲学。作者将AI工具分为两类：自主运行的Agent型（如Claude Code），和需人工逐步判断的"实习生型"（如Cursor）。后者是培养用户判断力的关键，但受限于必须在场的瓶颈。文中介绍了网易的免费远程软件UU远程，它允许用户通过手机连接Mac运行Cursor，实现低延迟操作，包括原生终端支持，从而打破了物理距离的限制。作者认为，AI发展的当前阶段，更需要这种能随时与AI协同思考的连接方式。

AYi: 今天,把一件关于 AI 很底层的事,彻底想透了。使用 AI 的最佳方式是以道御术,但前提是你得先以术入道。就像黄仁勋说的--真正会用 AI 的人,都是极高认知的提问者,带着自己的认知去提问,让 AI 帮你叩开未知的边界,而不是让它替你思...

其他开源/仓库教程/实践