5月22日

08:00

HuggingFace Daily Papers（社区热门论文）

QUEST是一个参数规模从2B到35B的开源模型家族，旨在作为通用深度研究智能体，处理广泛的长期搜索任务，在事实查询、引用定位和报告合成方面能力突出。其训练方案结合了中期训练、监督微调与强化学习，核心是基于统一评分树的合成数据流水线，能为多样任务类型自动生成带可验证奖励的训练数据，无需人工标注。模型还内置上下文管理机制以支持长期推理。仅用8K个合成任务，QUEST在八个深度研究基准上接近或超越前沿闭源智能体，并在近期开源智能体中综合性能最佳。项目已开源所有模型、数据与训练脚本。

智能体搜索数据/训练论文/研究

08:00

HuggingFace Daily Papers（社区热门论文）

大语言模型作为噪声信道：从香农视角看模型容量与缩放定律

现有大语言模型缩放定律多为单调幂律，无法解释灾难性过训练或量化等非单调现象。研究提出Shannon Scaling Law，将LLM训练建模为基于Shannon-Hartley定理的噪声信道信息传输，模型参数映射为信道带宽，训练token映射为信号功率。该框架揭示LLM存在基本容量极限：若无法维持足够信噪比，盲目扩大规模将放大噪声，导致性能从单调改进转为U型退化。在Pythia和OLMo2模型上的实验验证了该定律能准确捕捉性能谷底，并具备外推能力：用不超过6.9B参数、180B token训练的模型，可预测未见过的12B模型在307B token时的表现，池化R²达0.847。

推理数据/训练论文/研究

06:05

Ars Technica：AI（RSS）

Grok表现不佳，SpaceX押注在AI领域击败大型科技公司

SpaceX在IPO文件中提出建设轨道数据中心的构想，计划利用太空设施增强AI计算能力。该战略的背景是旗下AI服务Grok目前落后于其他竞争对手。这一举措显示SpaceX正寻求将太空技术优势转化为AI领域的竞争力，挑战现有科技巨头的市场地位。

智能体 xAI 数据/训练行业动态

04:30

Simon Willison 博客

精选71

Datasette Agent

Datasette Agent是Datasette推出的首个可扩展AI助手，为用户提供对话式界面以查询数据，并支持通过插件生成图表。该工具基于其LLM Python库构建，是LLM与Datasette整合的重要成果。目前提供图表生成、AI图像创建和沙箱代码执行等官方插件。它既可运行于Gemini 3.1 Flash-Lite等云端模型，也支持通过LM Studio连接本地开源模型，具备可靠的工具调用与查询能力。

智能体产品更新开源/仓库数据/训练

推荐理由：Simon 终于把 Datasette 和 LLM 接上了，自然语言查 SQL 数据库有了现成方案，插件生态和本地模型支持让这工具的可玩性极高，做数据分析的值得试试。

01:56

Hacker News 热门（buzzing.cc 中文翻译）

伦敦市长叫停帕兰蒂尔

伦敦市长萨迪克·汗于2026年5月21日叫停了伦敦警察厅与美国科技公司帕兰蒂尔的数据分析交易，阻止其警务技术合作。这一决定基于隐私和伦理担忧，直接叫停了帕兰蒂尔技术在伦敦警务中的应用，原计划涉及大规模数据监控以提升犯罪侦查效率，但最终因公众争议被终止。事件凸显了科技公司与政府合作中隐私保护的紧张关系，市长强调此举旨在维护市民数据安全。

政策/监管数据/训练

00:37

Epoch AI@EpochAIResearch

OpenAI在2023年开启了AI算力建设浪潮。但如今它仅占全球算力的约10%，顶尖实验室的总和可能也不到一半。在本周的通讯中，@justjoshinyou13 探讨了这一份额可能如何变化，以及何时会触及天花板。 🧵

数据/训练现象/趋势

5月21日

22:41

Krea@krea_ai

精选69

为 Krea 2（测试版）引入 LoRA。我们迄今最强大的微调系统；现在你可以用惊人的精度，在 Krea 2 上训练你自己的特定风格、对象或角色。了解其工作原理 👇

产品更新图像生成数据/训练

推荐理由：Krea 2 把 LoRA 微调直接做进了产品，对需要固定角色或风格的设计师来说省事了，虽然不是新概念但低门槛就是好文明。