5月18日

00:59

Simon Willison 博客

针对英国国家医疗服务体系（NHS）为应对“玻璃翼项目”漏洞而关闭开源代码库的决定，英国政府数字服务署（GDS）于5月14日发布指南，明确提出“默认保持开放”的核心建议。指南虽未直接点名NHS，但被普遍视为对此事的公开回应。GDS指出，将代码全面私有化会增加成本，并削弱代码复用与审查。这一官方表态被解读为罕见的内部争议公开化信号，标志着围绕公共部门开源策略的讨论已升级。

安全/对齐开源生态现象/趋势

5月17日

23:54

Berryxia.AI@berryxia

Grok免费接入Hermes Agent教程：强化实时信息处理能力

xAI与Nous Research合作，允许Grok订阅用户免费将模型接入Hermes Agent。此举旨在结合Grok的实时信息检索优势与Hermes Agent的24小时持续运行能力，用户可在Agent内使用Grok进行对话、语音合成及图像生成。安装过程主要分为三步：安装Hermes Agent、选择xAI提供商并授权、安装所需服务后启动。若遇问题，可借助Claude等工具修复。未来预计有更多开源Agent集成计划。

智能体 xAI 开源生态教程/实践

19:44

IT之家（RSS）

无预算约束，OpenClaw 团队一个月烧掉 130 万美元 API 费用

奥地利开发者彼得・施泰因贝格尔披露，其领导的OpenClaw项目在30天内消耗OpenAI API费用高达130万美元，涉及760万次请求和6030亿词元。这笔费用由约100个Codex实例产生，用于自动化代码审核、漏洞修复等任务。施泰因贝格尔解释，这是“极速模式”下的结果，关闭后成本可降至约30万美元。该实验旨在无预算约束下探索AI辅助软件开发的极限，所有成果保持开源。

OpenAI 开源生态编码行业动态

17:23

meng shao@shao__meng

小区电梯里看到的广告，迷你主机支持 OpenClaw 云端和本地主流大模型部署蹭 OpenClaw 热点的广告，可能是生命周期最短，简称最短命的广告了吧 👀

开源生态现象/趋势

14:19

swyx 🇸🇬 AIE Singapore!@swyx

AIE即将登陆印度很快！【引用 @adi_myth】：Marking this as a moment convincing @swyx to bring @aiDotEngineer to India next year with @sanjeed_i @udayan_w Exciting times！！ 🥳

Aditya Mishra: Marking this as a moment convincing @swyx to bring @aiDotEngineer to India next year with @sanjeed_i @udayan_w Exciting ...

开源生态行业动态

10:40

Rohan Paul@rohanpaul_ai

🇨🇳 与其他国家相比，中国公众对AI产品的态度异常积极，这降低了采用阻力，使得将AI大规模融入日常服务变得更加容易。无论如何，在开源领域，开发者重心正转向中国，下载份额正逐渐从美国和欧洲转移。

开源生态现象/趋势

04:59

Simon Willison 博客

从Warelay到OpenClaw：一个项目的六次更名史

作者为准备PyCon US闪电演讲，使用first_line_history.py工具追溯了OpenClaw项目自2025年11月首次提交以来的名称演变。根据Git历史记录，该项目在短短两个多月内经历了六次更名：从最初的Warelay，依次变为CLAWDIS、CLAWDBOT、Clawdbot、Moltbot，最终定名为OpenClaw。其定位也从基于Twilio的WhatsApp中继命令行工具，逐步演变为支持WhatsApp和Telegram的AI代理网关，最终定型为“个人AI助手”。

GitHub 开源/仓库开源生态

04:41

SemiAnalysis@SemiAnalysis_

AMD代码贡献获NVIDIA接纳，开源社区迎里程碑

NVIDIA的AI性能基准测试项目AIPerf接受了来自AMD的上游代码贡献，这被认为是AMD代码首次被纳入NVIDIA官方仓库。此举被视为开源社区的重要时刻，意味着高质量的、不依赖特定厂商的代码将能供所有人使用。社区期待未来能有更多此类合作，例如将AMD的RIXL部分代码整合进NVIDIA的NIXL，而非维持独立分支。

开源生态行业动态部署/工程

01:32

Nathan Lambert：Interconnects（RSS）

本月开源AI模型领域迎来密集发布，包括Gemma 4、DeepSeek V4、Kimi K2.6、MiMo 2.5和GLM-5.1等一系列重要新版本。这些模型均在CAISI的V4评估框架下进行了性能评测。多个团队几乎同期推出旗舰级更新，反映出开源社区当前高速迭代的竞争态势。

DeepSeek Google 大佬观点开源生态

00:51

Ant Ling@AntLingAGI

精选80

又一次Day0协作，又一次社区胜利。感谢@vllm_project团队始终可靠的支持~ 🫡🫡

vLLM: Congrats to @AntLingAGI on Ring-2.6-1T going open! 🎉 The thinking sibling of Ling-2.6-1T - trillion-scale, built for ag...

智能体开源生态推理模型发布

推荐理由：蚂蚁百灵把万亿参数的 thinking 模型开源，vLLM 第一天就能跑，想自己搭 agent 推理服务的可以直接动手了，开源生态的齿轮转得比想象中快。

00:51

Ant Ling@AntLingAGI

精选76

蚂蚁集团发布万亿参数推理模型Ring-2.6-1T，专为现实世界智能体工作流构建。该模型采用MIT许可，上下文长度通过YaRN技术从128K扩展至256K，并采用Async RL与IcePop混合训练架构。其核心特点是具备双推理努力模式："high"模式用于快速智能体循环，"xhigh"模式用于深度推理，旨在实现更好的成本与性能平衡。模型已开源，欢迎社区反馈。

Adina Yakup: Ant group just dropped Ring-2.6-1T 🔥 1T reasoning model, built for real world agent workflows. ✨ MIT license ✨ 128K >> ...

智能体 Hugging Face 开源生态推理

推荐理由：蚂蚁把1T推理模型以MIT许可开源，还专门为Agent循环做了高低推理双模式，做开源Agent的团队直接多了一个强力基座可选。

00:21

Ant Ling@AntLingAGI

Ring-2.6-1T模型现已开源，并上线OpenRouter平台，5月底前享有75%折扣。该模型由AntLingAGI开发，是一个为现实世界智能体构建的万亿级推理模型，其核心设计目标不仅是回答问题，更是执行任务。它专注于规划步骤、使用工具、维持上下文和完成复杂工作流，具备强大的智能体执行能力和高推理模式，并采用了Async RL与IcePop训练方法。

Novita AI: 🚀 Ring-2.6-1T is now open source (from @AntLingAGI). Now 90% off on @OpenRouter via @novita_labs - a great time to star...

智能体开源生态推理模型发布

5月16日

23:31

Hacker News 热门（buzzing.cc 中文翻译）

精选73

SANA-WM：一个用于生成1分钟720p视频的26亿级开源世界模型

NVIDIA研究团队发布了SANA-WM，这是一个参数规模达26亿的开源世界模型，专门用于生成长达1分钟、分辨率为720p的视频。该模型已在GitHub页面开源，旨在推动高质量长视频生成的研发。其在Hacker News社区获得了107点热度，显示出业界对该技术进展的关注。

开源生态模型发布视频

推荐理由：开源且能跑 1 分钟 720p，NVIDIA 这个 2.6B 世界模型在物理一致性上跨了一大步，做视频生成和物理仿真的同行该坐不住了。

22:54

Berryxia.AI@berryxia

无需重训，对齐即可高效训练扩散语言模型

杜克大学团队提出一种高效训练扩散语言模型的新方法。核心观点是无需从头训练，而是将现有强大的预训练自回归语言模型作为知识源。他们提出的REPR-ALIGN方法，在掩码扩散训练过程中，通过余弦相似度逐层将扩散模型的隐藏状态与冻结的自回归教师模型对齐。该方法无需添加适配器或改变架构，仅调整注意力掩码。实验结果显示，训练速度最高可提升4倍，在低数据场景下效果提升尤其显著。

Fred Peng: How to Train Diffusion LLM more efficiently? Our paper has an answer for you: Don't Retrain, Align: Adapting Autoregress...

arXiv 开源生态数据/训练论文/研究

15:42

IT之家（RSS）

蚂蚁集团百灵开源万亿级思考模型 Ring-2.6-1T，支持 high 与 xhigh 两种推理强度

蚂蚁集团百灵大模型开源了面向复杂任务的万亿级思考模型 Ring-2.6-1T。该模型创新性地引入了可调节推理强度机制，提供 high 和 xhigh 两种模式。high 模式适用于高频 Agent 工作流，具有低 Token 开销和快速多步执行能力，适合多轮交互与工具协作；xhigh 模式则为数学、科研及复杂逻辑分析等高难任务提供更充分的思考深度。开发者可根据任务需求灵活选择，以平衡效果、速度与成本。模型已在 Hugging Face 和 ModelScope 平台开放。

Hugging Face 开源生态推理模型发布

10:42

AYi@AYi_AInotes

xAI将Grok集成至Hermes Agent，用户可零成本扩展AI能力

xAI宣布，Grok订阅用户现可一键通过OAuth登录，将服务直接集成到开源个人代理Hermes Agent中使用，无需额外付费或复杂配置。xAI并未自建代理生态，而是将Grok作为“即插即用”大脑嵌入成熟的Hermes Agent中，此举大幅降低了开发与推广成本。集成后，Hermes Agent在原有长期记忆、多平台连接等功能基础上，增强了Grok的推理、生图、生视频与语音能力，用户体验显著提升。这意味着用户仅凭现有订阅，即可获得一个完全可控的本地AI代理。xAI表示更多开源代理集成即将到来，Grok正从X平台聊天工具转型为更广泛的AI生态通用大脑。

xAI: You can now use your @grok subscription inside @NousResearch Hermes Agent. http://x.ai/news/grok-hermes

智能体 xAI 产品更新多模态

10:42

AYi@AYi_AInotes

体验飞书透明CLI后，论其为何优于Notion的MCP黑箱路线及字节跳动的AI潜力

作者通过亲身体验飞书CLI工具，发现其允许AI通过命令行直接操作飞书，执行建群、建文档等任务。关键优势在于每一步操作都可见、可预览、可审查，与Notion、Figma采用的MCP在云端“黑箱”执行的体验截然不同。飞书lark-cli开源45天GitHub star破万，且已有10位外部开发者贡献代码被合并，而钉钉、企业微信的同类项目贡献者为零。这种透明性和活跃的开发者生态，被认为是构建可靠AI Agent的基础，也促使作者看好字节跳动在国内AI领域的未来。

AYi: 刚刚花三分钟装了飞书官方那个 CLI 工具, 跑了一句话,建群、建文档、发通知,一次性全做完了, 我盯着终端看了几秒钟, 才反应过来这玩意儿真的能让 AI 直接操作飞书。装的过程没啥可说的, 一行 npx @larksuite/cli@l...

智能体开源生态现象/趋势

08:54

Berryxia.AI@berryxia

精选77

智能体驱动系统Articraft实现3D资产生成自动化，开源万件数据集降低门槛

剑桥大学团队推出Articraft，这是一个由智能体驱动的编码系统，能全自动生成带关节、可运动的交互式3D资产。系统通过AI智能体自主编写代码、执行并接收物理反馈迭代优化，将以往需数日甚至数周的创作过程极大简化。团队同时开源了Articraft-10K数据集，包含超1万个物体，覆盖250个类别，所有资产均仿真就绪。此举显著降低了机器人训练和物理AI领域对高质量3D资产的数据门槛，为解决“数据饥渴”问题提供了高效的自动化方案。

Elliott / Shangzhe Wu: Check out Ariticraft 🦾 - a highly efficient agentic system that generates articulated 3D assets fully automatically at ...

智能体具身智能开源生态论文/研究

推荐理由：这个开源直接把物理AI训练的资产瓶颈打掉了一大半，agent全自动生成带关节的可交互3D，做仿真和机器人的可以立刻拉代码试试，诚意很足。

08:11

🚨 AI News | TestingCatalog@testingcatalog

SpaceXAI ❤️ Hermes 用户现在可以直接在Hermes智能体中使用他们的Grok订阅服务。真是绝佳组合！

Nous Research: SuperGrok now in Hermes Agent

智能体 xAI 产品更新开源生态

08:00

HuggingFace Daily Papers（社区热门论文）

AgentKernelArena：一个用于评估GPU内核优化AI编程代理的开源基准平台

AgentKernelArena是一个开源基准平台，专门用于系统评估AI编程代理在GPU内核优化任务上的能力。平台包含196个任务，涵盖HIP到HIP、Triton到Triton优化以及PyTorch到HIP翻译三大类。它采用隔离工作空间和分级评估（编译、正确性、性能）来测试代理的完整工作流，并创新性地引入了“未见配置”泛化测试。基准测试发现，主流AI代理在大多数任务上能近乎完美地编译和正确完成，并在PyTorch到HIP任务上实现高达6.89倍的平均加速。然而，泛化测试显示，从零生成内核的代理（PyTorch到HIP）在新配置下正确率显著下降，表明其常固化特定形状假设。该平台为严谨评估不同代理、任务和硬件目标提供了模块化框架。

arXiv 开源生态编码论文/研究

05:02

xAI：News（网页）

精选70

将Grok接入Hermes智能体

xAI宣布，用户现可将Grok订阅账户接入Nous Research的开源自改进智能体Hermes Agent。该集成对所有订阅层级开放，允许用户在Hermes环境中直接使用Grok 4.3进行文本对话与高级推理、调用其文本转语音功能生成语音回复，并利用Grok Imagine创建图像与视频。Hermes Agent可持久运行于电脑、沙盒或VPS，具备跨会话长期记忆能力，并能连接WhatsApp、Discord等通讯平台。用户通过安装Hermes Agent并选择Grok提供商即可完成配置。

智能体 xAI 产品更新开源生态

推荐理由：如果你已经在用或想尝试Nous Research的Hermes Agent，现在可以直接用Grok订阅，不必再多付一份模型API钱，而且Grok 4.3的推理和图像生成都能在agent里跑，对个人开发者挺友好。

04:20

xAI@xai

你现在可以在@NousResearch Hermes Agent中使用你的@grok订阅。 http://x.ai/news/grok-hermes

智能体产品更新开源生态

02:37

Rohan Paul@rohanpaul_ai

@bgurley 的一篇精彩博客开放性可以成为对抗垄断力量的武器。并且"到2030年，中国开源模型可能成为全球默认选择。"

Bill Gurley: A new @bgurley blog post! I have been thinking about how sophisticated executives are using open source in super creativ...

开源生态现象/趋势

01:37

Rohan Paul@rohanpaul_ai

X平台开源最新"For You"信息流推荐算法

X平台（原推特）已将其最新的“For You”信息流推荐算法在GitHub上开源。新算法从依赖点赞、转发等硬性规则排序，转向更接近Grok风格的AI智能排名系统。该系统通过Thunder实时获取用户关注账号的帖子，再通过Phoenix从全平台检索相关的外部内容进行补充。其核心排名模型不再单一判断帖子质量，而是像Transformer模型一样，将用户、帖子和历史行为作为一个整体进行预测，评估用户可能进行回复、点赞、转发、观看或跳过等多种互动可能性，从而实现更个性化的内容推荐。

Elon Musk: The latest X algorithm has been published to GitHub https://github.com/xai-org/x-algorithm

GitHub xAI 开源/仓库开源生态

01:07

MiniMax (official)@MiniMax_AI

M2.7已在@OrcaRouter上线--可通过单一OpenAI兼容API访问。今天就来试试吧！🐋

OrcaRouter 🐳: MiniMax M2.7 is now on OrcaRouter 🐋 One of the strongest open-source models available today - now accessible through a ...

开源生态模型发布

00:54

歸藏(guizang.ai)@op7418

飞书CLI工具开源一个多月便在GitHub获得万星，显示市场高度认可。该工具几乎能控制飞书所有能力，让用户无需与传统UI交互即可完成工作。作者指出，AI时代SaaS软件的竞争焦点正从UI转向对Agent的适配程度和覆盖率。飞书CLI通过分层架构、Skills说明书及Dry Run等对Agent友好的设计，有效降低了复杂软件的使用门槛，并为其快速迭代投入巨大。这为开发者提供了新路径：结合飞书CLI与Agent框架，可直接利用飞书的聊天界面、多维表格和群组构建Agent产品，无需从头开发前端界面。

歸藏(guizang.ai): 飞书 CLI 牛皮啊,发布一个月多点就达到 10000 Star 了! 说明用户和市场相当认可这个动作最近我们可以发现,越来越多的传统办公产品开始发布 CLI 和 Agent。 AI 时代的 SaaS 软件可能得换个做法了:UI 只是最基...

智能体 GitHub MCP/工具大佬观点

00:42

AYi@AYi_AInotes

马斯克开源了最新的X 算法（2026.5.15）

马斯克将X平台“For You”推荐算法开源。其核心是使用Grok Transformer端到端预测用户对帖子各项互动动作的概率，并通过加权求和得出最终得分以决定推荐。推荐流水线包含用户画像、候选池检索、元数据补全、硬过滤、打分及最终选择六个步骤。对创作者的启示包括：必带媒体内容提升点击与停留时长、设计高互动钩子、避免同一主题连发以防被惩罚、警惕引发负向互动信号。值得注意的是，本次开源了流程代码与架构，但未公开具体的模型权重、训练数据及生产环境参数。

Elon Musk: The latest X algorithm has been published to GitHub https://github.com/xai-org/x-algorithm

xAI 开源生态搜索教程/实践

5月15日

22:48

Nathan Lambert@natolambert

我重读了许多比尔关于开源商业策略的基础博客，很高兴他针对该主题及AI领域撰写了更新版。必读之作。【引用 @bgurley】：一篇新的@bgurley博客文章！ https://substack.com/home/post/p-197032865?source=queue

Bill Gurley: A new @bgurley blog post! I have been thinking about how sophisticated executives are using open source in super creativ...

大佬观点开源生态

21:39

DogeDesigner@cb_doge

精选76

X平台开源"For You"信息流推荐算法

X平台在GitHub开源了其“For You”信息流的最新推荐算法。该算法融合来自已关注账号的内容和通过相似性搜索发现的网络外内容，并利用基于Grok架构的Phoenix Transformer模型进行统一评分。模型通过分析用户近期互动，同时预测点赞、回复、转发等多种互动概率，并综合成最终相关性分数。排序过程包括候选内容收集、上下文信息补充、AI模型评分、多样性调整及垃圾信息过滤等步骤。此次开源提供了完整的可运行管道、预训练模型、内容理解服务及内置广告混合模块，核心计算完全由Transformer模型驱动。

GitHub 产品更新开源生态

推荐理由：X 把推荐算法完整开源，带可跑的预训练 Phoenix 模型，这比任何论文都实在，做信息流产品的可以直接拉到本地研究。

20:54

Berryxia.AI@berryxia

Qwen 3.6 Plus &amp； OpenCode 免费开整啊！！！

开源生态模型发布编码

20:42

AYi@AYi_AInotes

精选76

飞书开源CLI工具45天获万星，AI操作可见可控引关注

飞书开源命令行工具lark-cli在45天内获得超过1万GitHub star，成为国内首个破万星的办公套件开源项目。该工具允许AI通过命令行直接操作飞书，执行建群、建文档等任务，且每一步操作都可预览、可审查，与云端不可见的MCP模式形成对比。其主干代码已合并10位外部开发者的贡献，而同类产品钉钉和企业微信则为零。这种可见、可控的特性被视为开发者放心将任务交给AI Agent的前提，预示着一句话指令驱动完整项目流程成为可能。

智能体 MCP/工具开源生态教程/实践

推荐理由：飞书CLI把AI操作办公套件的每一步都摊在终端里，这种透明感是MCP黑箱给不了的，加上1万星和10个外部PR，这组数字比任何PR稿都诚实。

16:54

ginobefun@hongming731

Agent 工程化的全面落地

近期AI领域焦点从模型能力转向Agent工程化落地。Anthropic发布Claude Code实践，强调放弃RAG索引，采用Agentic Search导航大型代码库，并推出管理并行会话的Agent View及Computer Use最佳实践。OpenAI的Codex推出独立光标的Computer Use功能，解决了Windows平台沙箱安全问题，其负责人指出Codex正演变为可执行长期自主任务的本地Agent。国内厂商如阿里、腾讯等也在同步推进Multi-Agent实战，标志着AI Agent进入全面工程化应用阶段。

智能体 Anthropic OpenAI 开源生态

15:37

MiniMax (official)@MiniMax_AI

MiniMax AI已作为原生适配器集成至open-multi-agent框架，旨在解决多智能体系统在生产环境部署的核心成本难题。该框架能自动将目标分解为DAG任务并并行执行，但传统多智能体方案的token成本会随智能体数量、交互轮次和工具调用次数快速复合增长，这常导致实际生产部署受阻。此次集成使得由目标驱动的智能体团队不仅能高效运行，更能保持可负担的生产成本，从而推动其从演示场景走向实际应用。

JackChen: Multi-agent's quiet problem: token cost scales with agents × turns × tool calls. It compounds fast , and that's the bill...

智能体开源生态行业动态

14:54

歸藏(guizang.ai)@op7418

飞书CLI获市场认可，展现AI时代SaaS竞争新方向

飞书CLI工具发布一个多月即获10000 Star，显示市场对其方向的认可。在AI时代，SaaS软件的竞争正从传统UI转向对Agent的适配。飞书通过开放全部能力的CLI，允许用户和Agent完全绕过复杂UI进行操作，大幅降低了使用门槛。其CLI设计采用分层结构，并配套大量Skills作为“说明书”，便于Agent调用。同时，CLI在命令包装上注重对Agent友好，内置Dry Run、结构化输出等功能，方便AI调试。这为创业或构建Agent提供了新路径，可依托飞书CLI和Agent框架，直接利用其聊天界面、多维表格及组织成员作为基础设施。

智能体开源生态现象/趋势

12:54

Berryxia.AI@berryxia

蚂蚁集团开源万亿参数思考模型Ring-2.6-1T，推动企业级AI本地部署

蚂蚁集团AGI团队开源了万亿参数旗舰思考模型Ring-2.6-1T。该模型专为处理Agent工作流、代码工程、长时序执行等复杂任务设计，具备上下文理解、规划与工具调用能力，并提供高效与极致两种推理模式。其采用IcePop算法稳定训练，并借助MoE架构降低部署门槛。完全开源允许企业将模型部署于本地或端侧，确保数据不出域，有效解决了金融、政务等敏感领域对数据安全与合规的迫切需求。模型已在Hugging Face和ModelScope平台发布。

智能体开源生态推理模型发布

12:42

宝玉@dotey

飞书CLI获万星认可，开源项目评估四准则

飞书CLI在GitHub上的star数已过万，作者认为这印证了飞书是国内对Agent最友好的平台。作者提出评估开源项目是否靠谱的四项关键标准：star数量反映项目热度；活跃的commit历史表明项目持续维护；issues的数量与关闭速度体现用户活跃度和问题处理效率；社区PR被合并的记录则显示项目对社区参与的重视。飞书CLI在这些方面均表现良好。

数字生命卡兹克: 我靠!刚看到GitHub上,飞书CLI的star数过万了hhh 牛啊。。。感觉那个周末一起床,发现飞书开源CLI才过去没几天==。

智能体大佬观点开源生态

11:30

Hacker News 热门（buzzing.cc 中文翻译）

除了配重之外，GGUF里还包含什么--又还缺少什么？

GGUF 文件格式在存储机器学习模型权重的基础上，还包含了模型架构、超参数配置、分词器信息等关键元数据，提升了模型部署的便利性。然而，该格式目前仍缺乏标准化验证工具、完善的版本控制机制以及跨平台兼容性支持，限制了其广泛应用。文章在 Hacker News 上获得 101 点关注，反映了开发者对模型格式标准化与改进的持续讨论。

开源生态教程/实践部署/工程

10:48

HuggingFace Daily Papers（社区热门论文）

超越个体智能：基于LLM的多智能体系统中的协作、故障归因与自我演化综述

本文提出LIFE统一框架，系统综述基于大语言模型的多智能体系统。该框架涵盖能力奠基、协作整合、故障归因与自主演化四个因果关联阶段。研究指出，当前系统在需持续协调的任务中存在局限，且紧密协作会放大错误传播风险。现有工作多孤立探讨各阶段，本文通过形式化表征阶段间依赖关系，揭示了它们如何相互制约与支撑。在此基础上，文章针对阶段衔接处的开放挑战提出了跨阶段研究议程，旨在推动系统向能持续诊断故障、重组结构、优化行为的自组织集体智能演进。

智能体开源生态论文/研究

10:18