5月21日

08:00

HuggingFace Daily Papers（社区热门论文）

研究比较了按时间顺序排列数据与传统打乱数据两种预训练方式，针对一个在6B参数模型上训练的实验。研究引入了包含超过7000个时间锚定问题的新基准。结果发现，时间有序预训练的模型在通用语言能力上与打乱预训练基线持平，但其知识更及时、时间定位更准确；打乱预训练则在旧数据上表现达到峰值。代码、模型检查点和数据集已开源。

arXiv GitHub 开源生态数据/训练

08:00

HuggingFace Daily Papers（社区热门论文）

表征优于路由：克服多时间尺度PPO中的替代目标劫持

在强化学习中，多时间尺度PPO虽旨在平衡短期与长期规划，但在复杂延迟奖励任务中盲目融合多时间信号会导致严重的算法问题。研究发现，将时间注意力路由机制暴露于策略梯度会导致替代目标劫持，而无梯度不确定性加权则会引发不可逆的短视退化。为此，研究提出Target Decoupling架构：Critic侧保留多时间尺度预测以辅助表征学习，Actor侧则严格隔离短期信号并仅基于长期优势更新策略。在LunarLander-v2环境中的实验证明，该架构无需超参数调整即可稳定超越解决阈值，消除策略崩溃并跳出局部最优。实验代码已开源：https://github.com/ben-dlwlrma/Representation-Over-Routing。

arXiv 开源生态论文/研究

05:18

OpenClaw🦞@openclaw

精选66

OpenClaw 2026.5.19 🦞 📱 Android Talk Mode 实现实时化 🍎 Mac 设置界面更清爽 🔐 xAI 登录支持无头模式 🧵 Telegram 话题功能更稳定大版本更新，简短公告。 https://github.com/openclaw/openclaw/releases/tag/v2026.5.19

产品更新开源生态语音

推荐理由：一堆小修小补但都很实用，尤其 Android 实时对话模式，开源 AI 客户端里难得把体验做到这个程度，值得更新。

02:24

MarkTechPost（RSS）

如何使用 kg-gen、NetworkX 分析和交互式可视化工具从文本构建知识图谱生成管道

该教程演示了如何利用 kg-gen 工具，结合 LLM 与 LiteLLM 配置，从纯文本、对话及多源文档中提取实体、谓词和关系，并生成知识图谱。内容涵盖了从简单文本处理到使用分块与聚类技术应对长文本的进阶步骤，随后通过 NetworkX 进行图谱分析，并最终实现交互式可视化，为构建端到端的知识图谱生成流程提供了实践指南。

开源生态教程/实践数据/训练

01:36

Rohan Paul@rohanpaul_ai

Velobase开源AI SaaS商业基础设施框架

Velobase宣布开源其AI SaaS框架Velobase Harness。该项目强调，在AI应用时代，产品本身并非真正的护城河，将用户转化为收入的基础设施才是关键。Velobase自身从应用无人问津发展到实现八位数ARR的经历，印证了这一观点。该框架旨在补全从可用应用到盈利业务之间的缺失环节，提供包括支付计费、用户归因、分析与A/B测试在内的全套后端服务。

Velobase: Everyone can build an app now. Almost no one makes a dollar from it. We went from the same problem to 8-figure ARR. The ...

开源/仓库开源生态部署/工程

5月20日

23:00

TechCrunch：AI（RSS）

Stability AI发布可生成6分钟音频的新模型

Stability AI正式推出Stability Audio 3.0 small模型，该模型可在用户设备本地运行，生成时长最高达两分钟的音乐音轨。与此前云端生成较长音频的方案不同，此次更新强调了模型的轻量化与端侧部署能力，降低了对云计算资源的依赖。

多模态开源生态模型发布

20:08

Berryxia.AI@berryxia

本地AI生图"意外"加速，Draw Things新发现

在开源生图软件Draw Things中，一项意外发现显著提升了本地AI生图速度。将原为Z-Image Base训练的Z-Image-Fun-Lora-Distill与Z Image Turbo搭配使用后，原本需要8-9步的生成过程可缩减至3-4步，大幅缩短了本地生成时间，同时保持了画质与细节的稳定。这一组合有效突破了此前本地生图速度较慢的限制。

Draw Things: 🔍 An interesting discovery! 🧩 Z-Image-Fun-Lora-Distill from alibaba-pai was originally trained for Z-Image Base, with ...

图像生成开源生态教程/实践

15:33

Alibaba Cloud@alibaba_cloud

Qwen Conference 2026即将举行！ 5月26日，新加坡金沙会展中心。主讲全栈AI突破，设3个平行论坛， 1000平方米展区展示7+模型与6+ Agent工具。立即注册：https://click.qwencloud.com/m/20000000142/

智能体开源生态行业动态

14:31

向阳乔木@vista8

精选76

开源油猴脚本实现小红书、抖音、微信公众号的截图粘贴自动上传，并支持YouTube字幕复制、倍速调节及内容导出至NotebookLM、ChatGPT等工具。主推文作者表示，该工具增强了将X平台内容同步至国内平台的意愿，尽管部分平台体验欠佳。

向阳乔木: 完成了第一项工作,开源自己常用的油猴脚本。 1. 小红书、抖音、微信贴图,截图粘贴自动上传。 2. Youtube字幕复制,倍速调节,复制字幕给NotebookLM、ChatGPT处理。 3. 小宇宙网页版倍速调整开源地址:https:/...

GitHub 开源/仓库开源生态

推荐理由：向阳乔木开源了一套油猴脚本，让截图直接粘贴上传到小红书、抖音等平台，对多平台内容分发的人来说是一个小而实在的时间节省利器。

14:01

向阳乔木@vista8

开源实用油猴脚本，不上班却更忙更充实

作者开源了自己常用的油猴脚本，主要功能包括小红书、抖音等平台的截图自动上传，以及YouTube字幕复制与倍速调节，方便与NotebookLM、ChatGPT等工具配合使用，同时支持小宇宙网页版调速。这是其个人工作清单的一项，作者感叹不上班后的日程（如测试AI产品、体验谷歌新模型等）反而更满，但核心在于所有事务都是自主选择并乐在其中。

向阳乔木: 今天的 Todolist 清单: 1. 上架一个快捷提示词 Chrome 插件 2. 开源几个油猴脚本 3. 测朋友的 AI 产品,写个简单评测 4. 准备周六直播问题 5. 去海河钓鱼 6. 体验谷歌昨天的发布模型和工具 ... 不上班比...

开源/仓库开源生态

12:05

HuggingFace Daily Papers（社区热门论文）

精选72

GoLongRL：面向能力的长期上下文强化学习与多任务对齐

GoLongRL是一个全开源的长期上下文强化学习方案，聚焦于使用可验证奖励的强化学习。该工作提出了面向能力的数据构建方法，公开发布了包含23K样本的数据集、完整构建管线及训练代码。数据集依据长期上下文能力分类，涵盖9种任务类型，由真实文档生成的问答对构成；实验证明该数据集性能优于闭源的QwenLong-L1.5数据集。训练得到的Qwen3-30B-A3B模型在长期上下文任务上达到了与DeepSeek-R1-0528等先进模型可比的性能。此外，提出了TMN-Reweight多任务优化方法，通过任务级归一化和难度自适应加权，在提升平均性能的同时保持或增强了通用能力。

开源生态推理数据/训练论文/研究

推荐理由：开源长上下文RL的配方直接放出来了，数据集+代码全都有。更狠的是单靠数据多样性就干掉了闭源竞品，甚至摸到了DeepSeek-R1的水平，做长上下文的值得复现。

12:02

Alibaba Cloud@alibaba_cloud

Qwen Conference 2026即将到来！ 5月26日，新加坡金沙会展中心，全栈AI突破、3场平行论坛、1000平方米展区，展示7+模型与6+ Agent工具。立即注册：https://click.qwencloud.com/m/20000000142/

智能体开源生态行业动态

11:34

Rohan Paul@rohanpaul_ai

SenseNova U1开源发布，革新原生多模态生成

商汤科技SenseNova U1已开源发布。其核心创新在于原生多模态统一建模，将视觉、语言与图像生成视为一个统一问题，而非分立模块的链式处理，从而减少了信息损失。该模型采用MoT架构（38B-Active 3B MoE），在生成信息图、海报、漫画等结构复杂的密集图文内容时能保持高度一致性。详细的技术报告披露了其包括近无损视觉接口、联合训练策略在内的完整构建方案，为行业提供了前沿参考。

SenseTime: 🔥 New week, New SenseNova-U1 Drop - and this one goes Deep!🔥 📄 The full Technical Report is OUT - the most detailed d...

图像生成多模态开源生态模型发布

08:10

Simon Willison 博客

datasette-llm-accountant 0.1a4版发布

Datasette 生态下的 LLM 账户管理工具 datasette-llm-accountant 发布了 0.1a4 预览版。本次更新修复了一个关键问题，即追踪对话链（chains of responses）时存在的缺陷，相关修复可追溯至 datasette-llm#7 问题。该版本主要用于提升使用 Datasette 管理与分析大语言模型调用时的稳定性和准确性。

产品更新开源生态

08:00

HuggingFace Daily Papers（社区热门论文）

SciAtlas：面向自动化科学研究的大规模知识图谱

SciAtlas 是一个大规模、多学科、异构的学术资源知识图谱，旨在为自动化科学研究提供“认知地图”。它整合了26个学科的超过4300万篇论文，包含1.57亿实体和30亿三元组，构建了可打破学科壁垒的结构化拓扑认知底座。为克服现有检索工具缺乏拓扑推理能力的问题，其开发了具备三路协同召回和图重排序功能的神经符号检索算法，实现从语义匹配到确定性关联发现的过渡。应用方向包括文献综述、研究趋势综合、想法定位与学术轨迹探索，旨在以结构化方式赋能科研全流程并显著降低推理成本。相关接口已在GitHub开源。

智能体开源生态搜索论文/研究

04:41

xAI：News（网页）

精选60

在OpenClaw中使用Grok

5月22日，xAI宣布，其用户现可在开源个人助理OpenClaw中直接使用Grok模型。所有持有SuperGrok或X Premium订阅的用户均可使用该功能。OpenClaw是一个开源的、本地优先的智能助手，可在多种硬件上运行并保持跨会话记忆，同时能接入WhatsApp、Telegram等多款主流通讯平台。用户通过简单安装和登录，即可在自有设备上运行OpenClaw，并通过其界面或关联的聊天工具与Grok交互。此举进一步扩展了Grok的应用场景，未来还将推出更多开源代理与集成支持。

智能体产品更新开源生态

推荐理由：Grok 开始融入开源 agent 生态了，OpenClaw 的本地优先加多平台连接让这集成对开发者挺实用，有 Grok 订阅的可以直接试试。

02:55

IT之家（RSS）

谷歌推出 AI 通用购物车，联合亚马逊、Meta、微软打造 AI 电商协议

在2026年I/O开发者大会上，谷歌宣布推出AI电商通用购物车“Universal Cart”及相关协议。核心协议包括开源的通用购物车协议UCP（获亚马逊、Meta、微软等支持），旨在为智能体提供通用语言；以及智能体支付协议AP2，用于管理AI支付流程。该功能将于今年夏天在谷歌搜索、Gemini、YouTube、Gmail中上线，支持多场景添加商品、追踪优惠与历史价格，并具备智能推理能力，可检测兼容性并推荐替代品。

智能体 Google 产品更新开源生态

01:02

Berryxia.AI@berryxia

推特科技圈宝藏AI架构师与社群推荐

推文推荐了AI架构师“烟花老师”，其社群运营出色，汇聚了众多研发、产品与创业领域的高质量成员，交流氛围与深度俱佳。他在X（原Twitter）平台比在国内其他自媒体平台获得了更积极的反馈与传播。作为近40个垂直AI免费社群的联创，其开源项目fireworks-tech-graph在X平台传播下获得了近7k star的关注。整体展现了其作为优质信息源与社区构建者的价值。

烟花老师: 还有一百多就五千订阅了,不知道一觉醒来会不会有惊喜。我经常不按常理出牌,就提前写好庆祝5k订阅达成吧,哈哈🎆 我主业是一个AI架构师,也是一支烟花AI社区的联创,从23年至今大概积累了40个垂直的AI社群,大家都很纯粹全都是免费的社群,...

开源生态行业动态

00:42

Nathan Lambert@natolambert

学术失衡：AI研究转向闭源与全球知识扩散

本文指出，AI研究正从学术界主导向工业界闭源化转变，打破了长期由中立学者传播前沿知识的社会平衡。科技公司通过制造不信任感掌控叙事，削弱了科学界服务公众的传统。同时，金融驱动的“错失恐惧症”迫使许多志在学术的人才流向工业界。作者认为，尽管短期内发展由闭源模型主导，但知识最终必然扩散，其长期轨迹仍与开放科学紧密相连。在这一趋势下，凭借更利于研究获取与传播的环境，中国有望在未来成为全球AI研究的新中心。

大佬观点开源生态现象/趋势

5月19日

20:52

AYi@AYi_AInotes

Damn it！SAM3绝逼要封神了！不但开源而且强的一批！最牛逼的地方是追踪能力，即使在篮球比赛这种复杂到爆炸的场景里也稳得一逼！！

Meta 开源生态模型发布视频

17:07

歸藏(guizang.ai)@op7418

藏师傅PPT Skill 25天破万Star，质量制胜

藏师傅开发的PPT Skill项目在25天内突破1万Star，速度远超许多大厂知名项目，成为其vibe coding实践中首个达成此里程碑的项目。尽管市场存在众多PPT生成工具，但该项目通过注重质量和用户体验实现了快速增长，凸显了在激烈竞争中，高品质输出是核心决定因素。作者还感谢了用户和推广者的支持与反馈。

开源生态行业动态

16:51

IT之家（RSS）

精选74

地平线开源 HoloMotion-1 4 亿参数机器人小脑大模型，可实现舞蹈、健身、搬箱子等动作

地平线机器人实验室发布了其开源的人形机器人全身控制模型 HoloMotion-1。这是一个拥有 4 亿参数的“小脑”大模型，通过 MoE 稀疏激活与 KV-cache 推理机制，在端侧实现了约 300FPS 的实时推理能力。该模型利用互联网视频、光学动捕、VR 遥操作等多种来源的动作数据进行训练，并在真实机器人上成功展示了舞蹈、爬行、健身、搬箱子等复杂动作的零样本迁移能力。相关代码与技术报告已公开。

具身智能开源生态模型发布

推荐理由：地平线开源的这个4亿参数模型，把机器人“小脑”拉到一个小模型级别，300FPS实时跑在端侧，零样本跳舞搬箱子，搞具身智能的该跟进看看了。

16:49

Xiaomi MiMo@XiaomiMiMo

📢致所有Apache软件基金会提交者小米MiMo将通过"100T Token Builder计划"向您免费提供我们的Max Token套餐。使用您的http://apache.org邮箱注册 → 即刻激活。立即注册：http://platform.xiaomimimo.com

产品更新开源生态

15:51

IT之家（RSS）

精选73

Kimi最新融资获国资与央企加注，估值半年翻四倍

月之暗面旗下AI助手Kimi正在进行20亿美元新融资，国智投、中国移动等国资机构及央企已加入股东名单，该轮融资已进入收尾阶段。今年1月和2月，Kimi已密集完成3轮融资，累计融资超39亿美元（约376亿元人民币），最新估值相比去年11月已翻4倍有余，成为大模型创业公司中融资最多的企业。产品层面，基于Kimi K2.5模型的Composer 2.5已集成至编程应用Cursor，公司近期也发布了开源模型Kimi K2.6。

开源生态行业动态

推荐理由：国资加码、估值一年翻 4 倍，Kimi 成了国内大模型创业里融钱最多的公司。不仅是钱的问题，C 轮之后国家队正式入场，未来政策倾斜和资源整合才是看点。

15:00

swyx🛬 SFO@swyx

正在为 Vercel 和 Supabase 下注

altra: Bun goes to Anthropic Stainless goes to Anthropic Astral goes to OpenAI Mintlify goes to OpenAI (???)

开源生态行业动态

11:04

Tencent Hy@TencentHunyuan

精选72

开源古代汉字视觉感知评估基准Chronicles-OCR

开源了评估视觉大语言模型（VLLM）对古代汉字视觉感知能力的基准测试Chronicles-OCR。该数据集覆盖了从甲骨文到草书的3000年演变历程，包含7种历史书体与2800张均衡图像。评估涵盖字形定位、细粒度识别、古代文本解析和字体分类四项核心任务，旨在探究视觉分布随时间的变化如何影响模型感知。相关论文与代码已开源。

多模态开源生态论文/研究

推荐理由：腾讯混元开源的视觉感知基准，专攻古汉字识别，覆盖从甲骨文到草书的三千年演变，做 OCR 和视觉模型的可以拿来测测自家模型在历史文本上的感知退化。