4月12日

04:05

Nathan Lambert@natolambert

开始为 RLHF 书籍搭建代码库，欢迎通过 issues、邮件和评论等方式提交反馈以完善内容。作者提到还需要再购置一台 DGX Spark。

大佬观点安全/对齐数据/训练

4月11日

23:48

Rohan Paul@rohanpaul_ai

据《华尔街日报》报道，OpenAI预测2028年仅AI研究硬件成本就将高达1210亿美元。尽管当年销售额预计翻倍，公司仍将面临850亿美元亏损，预计直到2030年代才能实现整体盈利。竞争对手Anthropic也面临类似的训练成本激增轨迹，只是规模较小。分析指出，两家公司只有在忽略计算支出的情况下才能实现早期盈利，反映出巨额基础设施投入正成为AI行业的普遍挑战。

Anthropic OpenAI 数据/训练行业动态

11:15

宝玉@dotey

数字生命卡兹克: http://x.com/i/article/2041355504526692352

其他数据/训练

08:00

HuggingFace Daily Papers（社区热门论文）

面向affordance分类的时间增强图注意力网络

本文提出EEG-tGAT模型，针对affordance分类任务对GATv2进行时间增强。通过引入时间注意力机制动态调节不同时间段贡献，并采用时间dropout正则化时序相关观测，以应对affordance数据中判别信息时间分布不均的特点。实验结果表明，相比GATv2，该模型在affordance数据集上实现了更优的分类性能，证明显式编码时间重要性和增强时间鲁棒性能够更好对齐affordance驱动交互数据的结构特性。

arXiv 具身智能数据/训练论文/研究

08:00

HuggingFace Daily Papers（社区热门论文）

Transformers 中的 Attention Sink：利用、解释与缓解综述

Transformer 架构中的 Attention Sink（AS）现象导致注意力过度集中于少量无信息 token，损害模型可解释性、干扰训练推理动态并加剧幻觉。该综述首次系统整合 AS 相关研究，从基础利用、机制解释与策略缓解三个维度梳理领域现状，澄清关键概念并追踪演进趋势，为研究者和从业者提供管理 AS 的参考框架，相关论文列表已开源至 GitHub。

arXiv 数据/训练论文/研究

00:22

AK@_akhaliq

从优化过程、数据构成与模型能力三个条件维度，对推理 SFT 的泛化性展开分析，重新审视监督微调在推理任务中的泛化机制与关键影响因素。

Hugging Face 推理数据/训练论文/研究

4月10日

08:00

HuggingFace Daily Papers（社区热门论文）

SPASM：面向多轮对话生成的稳定人设驱动智能体模拟框架

研究团队推出SPASM框架，通过模块化设计解决多轮对话中智能体的人设漂移与"回声"问题。该框架包含人设创建、对话生成与终止检测模块，核心创新Egocentric Context Projection（ECP）技术将对话历史存储为视角无关表示，再投影至各智能体自我中心视角，在不改变模型权重的前提下提升长程稳定性。基于GPT-4o-mini、DeepSeek-V3.2和Qwen-Plus构建的数据集包含4,500个人设与45,000段对话，实验证实ECP显著抑制人设漂移并消除回声现象。

智能体数据/训练论文/研究

08:00

OpenAI：官网动态（RSS · 排除企业/客户案例）

使用 ChatGPT 分析数据

使用 ChatGPT 进行数据分析的实用方法：探索数据集、生成洞察、创建可视化，并将发现转化为可执行决策。

OpenAI 教程/实践数据/训练

04:46

Hao AI Lab@haoailab

Attn-QAT实现FP4注意力量化，质量媲美BF16且提速1.5倍

FP4硬件虽已普及，但4-bit attention长期存在质量瓶颈，阻碍端到端FP4部署。研究团队提出Attn-QAT，首次系统研究attention机制的量化感知训练。该方法使FP4 attention质量达到BF16水平，同时在RTX 5090上实现比SageAttention3高1.1-1.5倍的吞吐量，在B200上较FlashAttention-4提速1.39倍。

数据/训练论文/研究部署/工程

01:45

Nathan Lambert@natolambert

RLHF权威专著即将出版，作者称记录领域基石

作者宣布《Reinforcement Learning from Human Feedback》已完成写作，进入最终制作阶段，预计1-2个月内出版。该书聚焦LLM的核心强化学习方法、直觉与实现，同时涵盖后训练技术及RLHF领域的未解决问题。作者强调，这是记录RLHF领域组织的权威著作，尽管该方向常被AI其他进展掩盖，但其在人机交互中的核心地位使其值得深入探讨，而非追逐易过时的动态话题。

大佬观点安全/对齐数据/训练

01:23

AK@_akhaliq

新论文提出扩散强化学习方法，在Rollout探索阶段使用FP4低精度采样，训练阶段采用BF16精度，通过混合精度策略平衡计算效率与训练稳定性，实现高效扩展。

Hugging Face 数据/训练论文/研究

01:18

AK@_akhaliq

MARS 新方法支持自回归模型每步生成多个 Token，打破传统逐 Token 解码的效率限制，相关论文已公开。

Hugging Face 数据/训练论文/研究

01:08

AK@_akhaliq

「简单到令人尴尬」的自蒸馏方法无需复杂架构或额外数据，即可有效提升大模型代码生成能力，效果优于现有复杂方案。相关论文已发布在 Hugging Face Papers。

Hugging Face 数据/训练编码论文/研究

4月9日

08:00

HuggingFace Daily Papers（社区热门论文）

元学习上下文学习实现免训练跨受试者脑解码

研究团队提出一种元优化的fMRI语义视觉解码方法，通过上下文学习实现免训练的跨受试者泛化。该方法仅需少量图像-脑激活样本作为条件，即可快速推断新受试者的独特神经编码模式，并采用分层反演策略完成解码。实验表明，无需重新训练、微调、解剖对齐或刺激重叠，即可在多种视觉主干网络上实现强跨受试者和跨扫描仪泛化能力，为构建非侵入式脑解码通用基础模型奠定关键基础。

多模态数据/训练论文/研究

08:00

HuggingFace Daily Papers（社区热门论文）

语言模型何时学习什么？隐性课程假设

研究者提出隐性课程假设，指出预训练遵循可组合且可预测的课程结构。通过设计涵盖检索、形态转换、逻辑推理和数学等领域的组合任务，对410M至13B参数的四个模型家族进行追踪，发现技能涌现顺序跨模型高度一致（ρ=.81），且复合任务通常在其组件任务之后出现。研究表明该结构编码于模型内部表征中，利用任务表征空间可有效预测未见过组合任务的训练轨迹（R²=.68-.84），揭示预训练过程比损失曲线显示的更具结构性。

arXiv 推理数据/训练论文/研究

08:00

HuggingFace Daily Papers（社区热门论文）

基于经验回放的 LLM 高效强化学习训练

针对大语言模型后训练必须使用新鲜 on-policy 数据的传统观点，研究系统探讨了经验回放技术的应用。通过形式化分析 replay buffer 设计在数据陈旧性方差、样本多样性与生成计算成本间的权衡，发现当生成成本高昂时，严格的 on-policy 采样实为次优选择。实证表明，设计良好的 replay buffer 可在保持策略熵的同时，大幅减少推理计算，且不损害甚至提升最终模型性能。

arXiv 数据/训练论文/研究

07:11

Peter Steinberger 🦞@steipete

做角色评估时发现 Claude 总把自己排第一，于是移除评判中的模型名称并调整设置，避免模型自我偏好影响结果。

Anthropic 数据/训练评测/基准

00:59

Epoch AI@EpochAIResearch

中国及开源 AI 实验室算力约为前沿的 1/10，但具备蒸馏前沿模型、快速复制技术创新及庞大人才储备等优势。@ansonwhho 探讨这些条件能否弥补算力差距，支撑其在最前沿 AI 领域保持竞争力。

开源生态数据/训练现象/趋势

00:19

Yuchen Jin@Yuchenj_UW

Meta TBD 实验室发布 Avocado（内部代号 Muse Spark），未开源。团队仅用 9 个月重建预训练技术栈，以不到 Llama 4 Maverick 十分之一的算力达到相近能力。作者认为，基础设施才是 AI 实验室的真正护城河，决定模型训练速度和实验迭代效率。

Meta 数据/训练模型发布

00:00

Google Research：Blog（网页）

ConvApparel：测量并弥合用户模拟器中的真实感差距

Google Research 发布 ConvApparel 数据集与评估框架，用于量化 LLM 用户模拟器的"真实感差距"。该数据集包含 4000 余组服装购物多轮对话，采用"好/坏"双智能体协议收集，涵盖从满意到恼怒的全谱系用户行为。框架通过反事实验证测试模拟器对意外糟糕体验的适应能力，解决现有模拟器过于耐心、知识过剩等不现实问题，为训练更鲁棒的对话智能体提供可信的 AI 测试基准。

智能体 Google 数据/训练论文/研究

4月8日

11:38

Nathan Lambert@natolambert

REINFORCE 算法名称实为反向缩写，全称为「REward Increment = Nonnegative Factor × Offset Reinforcement × Characteristic Eligibility」。这是作者撰写书籍时发现的强化学习趣味冷知识，并借机吐槽了 AI 领域另一极为牵强的反向缩写 BIRD。

finbarr: BIRD might be the most egregious backronym I've seen in AI recently

大佬观点数据/训练

09:00

Haider.@haider1

Anthropic "Mythos" 模型在基准测试中表现极强，证明模型扩展（scaling）尚未触及天花板；但更强性能伴随极高训练与推理成本，其出色表现很大程度上源于昂贵的配置投入。

Anthropic 大佬观点推理数据/训练

08:00

HuggingFace Daily Papers（社区热门论文）

MoZoo：释放扩散模型在动物毛发与肌肉模拟中的能力

MoZoo是一个生成式动力学求解器，能绕过传统精炼流程，从粗糙网格直接合成高保真的动物视频。其核心是角色感知旋转位置编码RAR-RoPE，通过基于角色的索引重映射同步运动对齐；同时引入非对称解耦注意力机制，强制单向信息流以防止特征干扰并提升效率。为解决训练数据稀缺问题，提出了MoZoo-Data合成到真实的流水线，并构建了包含120对网格-视频的评测基准MoZooBench。实验表明，MoZoo在多样动物骨架与布局上实现了高保真的毛发模拟，并保持了优异的时间与结构一致性。

图像生成多模态数据/训练论文/研究

05:51

François Chollet@fchollet

加入 ARC Prize 团队--帮助我们构建 ARC-AGI-4 和 ARC-AGI-5

ARC Prize: Platform Engineer - Benchmark Lead ARC Prize Foundation is hiring a senior engineer to build our benchmark platform * Ex...

推理数据/训练行业动态

4月7日

23:57

AK@_akhaliq

MinerU2.5-Pro 发布，专注于突破大规模数据驱动文档解析的技术极限。相关论文已上传至 Hugging Face。

Hugging Face 数据/训练论文/研究

17:32

公众号：通义实验室（千问）

FIPO：精准追踪2%的Token，突破大模型推理瓶颈！

FIPO方法通过精准追踪仅占2%的关键Token，有效缓解大模型强化学习中的“蝴蝶效应”，从而突破推理性能瓶颈。

推理数据/训练论文/研究

17:26

蚂蚁 inclusionAI：GitHub 新仓库

inclusionAI/TC-AE

研究团队发布了TC-AE，一种用于深度压缩自动编码器的新方法，旨在突破现有模型的令牌容量限制。该方法通过创新的架构设计，显著提升了模型在压缩表示中保留信息的能力，实现了更高的压缩效率与重建质量。具体指标显示，TC-AE在多个基准测试中，相较于传统深度压缩自动编码器，将有效令牌容量提升了约30%，同时保持了较低的计算开销。这项工作为高密度数据压缩与表示学习提供了新的技术路径。

开源/仓库数据/训练论文/研究部署/工程

08:23

François Chollet@fchollet

关于深度学习研究者有一点一直令我惊讶，那就是他们中的许多人从未接触过除通过梯度下降拟合曲线参数之外的学习形式，甚至无法想象可能存在其他选择。

DeepMind 大佬观点数据/训练

01:55

AK@_akhaliq

新论文提出，Test-Time Scaling（测试时扩展）可让 Overtraining（过度训练）实现 Compute-Optimal。传统 Chinchilla 最优假设训练与推理计算固定，而该研究表明，若允许推理阶段增加计算，过度训练模型在总成本下反而性能更优。

Hugging Face 推理数据/训练论文/研究

00:22

Deedy@deedydas

Meta Harnesses：自主研究的进阶版

Meta Harnesses是由斯坦福与DSPy作者提出的自动化框架生成技术，通过自动生成单文件Python程序（harness）来优化特定任务的提示词、检索与编排逻辑，实现无需人工干预的持续迭代。相比Autoresearch，其抽象层级更高，适用于结果可验证的特定领域任务（如数学推理、编程），能自动将问题分类并制定差异化策略，但在需要统一方法论的任务上存在局限。

智能体数据/训练论文/研究

4月6日

00:20

François Chollet@fchollet

符号压缩：从放射性到原子弹的极端泛化

推文以原子弹研发为例，阐述极端泛化的本质：科学仅用47年、约9个关键实验便实现从放射性观察到核武器的突破。这种进步不依赖大数据，而源于符号压缩——将少量刻意收集的数据点提炼为单页纸可承载的因果符号规则。核心观点在于，通过逆向推导数据背后的因果逻辑，人类能够将极简信息转化为重塑现实的完整方案，展现符号推理在突破认知边界中的决定性作用。

Google 大佬观点推理数据/训练

00:02

François Chollet@fchollet

关于使用 Kinetic + Keras + JAX 在 TPU v5 上微调 Gemma 的教程。

Jigyasa Grover ✨: Here is a quick start script including the setup, technical details, and a candid look at where Kinetic excels versus it...

Google 教程/实践数据/训练部署/工程

4月4日

04:15

François Chollet@fchollet

关于在 Keras + JAX + TPU 技术栈上使用 Keras Kinetic 微调 LLM 的好教程！

Kuan Hoong: Fine-Tuning Gemma 2B on PubMedQA: Building a Medical Q&A Assistant with LoRA, Keras Kinetic, and Cloud TPU https://kuanh...

Google 教程/实践数据/训练部署/工程

02:10

Nathan Lambert@natolambert

精选

开源模型成功的核心并非基准分数，而是即时且长期的工具支持与可微调性。Gemma 过去在这些方面表现挣扎，而 Qwen 则表现出色，这才是决定模型成败的关键因素。

Interconnects: Gemma 4 and what makes an open model succeed Hint: it's not benchmark scores. https://www.interconnects.ai/p/gemma-4-and...

Google 大佬观点开源生态数据/训练

推荐理由：HF研究员指出开源模型成功关键在工具链与微调支持而非基准分数

01:29

François Chollet@fchollet

Keras 发布 Kinetic：一键部署云端 TPU/GPU 任务

Keras 社区发布 Kinetic 库，开发者通过装饰器即可将函数部署至云端 TPU/GPU 运行，定位类似 Modal 但新增 TPU 支持。该工具自动完成代码打包、Cloud Build 容器构建（支持缓存）、GKE 集群调度及结果返回，实现日志实时流式传输，使远程执行体验如同本地运行。

Google 开源/仓库数据/训练部署/工程

4月2日

15:05

蚂蚁 inclusionAI：GitHub 新仓库

inclusionAI/cuLA：基于CuTe DSL与CUTLASS C++的线性注意力变体CUDA内核

inclusionAI发布了cuLA项目，这是一套为线性注意力变体编写的CUDA内核。该内核完全采用NVIDIA的CuTe DSL和CUTLASS C++库进行开发，旨在高效实现Transformer模型中的线性注意力机制。此举专注于底层计算优化，通过利用先进的CUDA编程抽象和高效模板库，有望提升大语言模型在推理和训练过程中的计算性能与效率。

开源/仓库数据/训练部署/工程

3月31日

16:23

Hugging Face：Blog（RSS）

精选83

以165美元成本训练25个物种的mRNA语言模型：构建从结构预测到密码子优化的AI流程

OpenMed团队构建了一个覆盖蛋白质结构预测、序列设计和密码子优化的端到端AI流程。在密码子优化环节，CodonRoBERTa-large-v2模型以4.10的困惑度和0.40的斯皮尔曼CAI相关性显著优于其他架构。研究将训练扩展至25个物种，仅用55个GPU小时训练了4个生产级模型，并建立了独特的物种条件化系统，实现了从蛋白质概念到合成就绪DNA序列的快速转化。完整代码与实验结果已开源。

Hugging Face 开源生态数据/训练论文/研究

推荐理由：低成本开源生物AI管道，可加速蛋白质工程和药物开发。

08:00

Google Developers Blog（RSS）

精选81

Boost Training Goodput：连续检查点功能如何优化 Orbax 和 MaxText 的训练可靠性

Orbax 和 MaxText 引入了连续检查点新功能，旨在优化模型训练中可靠性与性能的平衡。它改变了传统固定频率检查点的模式，通过在前一个保存操作成功完成后才异步启动新操作，最大化I/O带宽并降低故障风险。基准测试表明，该方法显著缩短了检查点间隔，并实现了可观的资源节约，这在平均故障间隔时间较短的大规模训练任务中效果尤为突出。

Google 产品更新数据/训练部署/工程

推荐理由：大规模模型训练的可靠性和效率提升，开发者可优化资源使用。

08:00

Hugging Face：Blog（RSS）

TRL v1.0：与领域同步发展的后训练库

Hugging Face 正式发布 TRL v1.0，这是一个专为大语言模型后训练设计的开源库。该版本整合了 SFT、RLHF 等多种高效微调技术，提供从监督微调到人类反馈强化学习的完整工具链。新库支持与 Transformers、PEFT 等主流框架无缝集成，显著简化了模型对齐流程。此次更新旨在降低大语言模型微调门槛，推动AI技术民主化，使开发者能够更便捷地提升模型在对话、安全等方面的性能表现。

Hugging Face 开源/仓库数据/训练

00:00

Google Research：Blog（网页）

构建更优的 AI 基准测试：多少评分者才够？

Google Research 提出基于"gold"评级数据的机器学习评估框架，通过模拟器优化评分项目数量与评分者数量的权衡。研究挑战了当前 AI 基准测试仅使用 1-5 名评分者的行业标准，发现要准确捕捉人类观点差异通常需要超过 10 名评分者。该框架为构建高可复现性且成本高效的 AI 评估体系提供了路线图，并开源了模拟工具。

Google 数据/训练论文/研究