5月1日

10:14

HuggingFace Daily Papers（社区热门论文）

本研究提出FD-loss，通过将弗雷歇距离（FD）估计所需的大规模样本量与梯度计算的小批量解耦，首次将其有效优化为训练目标。该方法在不同表征空间中对基础生成器进行后训练，能持续提升样本视觉质量，并在Inception空间下使单步生成器在ImageNet 256x256上达到0.72的FID。FD-loss无需蒸馏或对抗训练，即可将多步生成器转化为高性能单步模型。研究同时发现，仅依赖Inception FID可能误导质量评估，因此提出了多表征度量指标FDr^k。这项工作推动了分布距离在生成模型的训练与评估中的进一步探索。

arXiv 图像生成数据/训练论文/研究

10:14

HuggingFace Daily Papers（社区热门论文）

Intern-Atlas：面向AI科学家的方法论演化图谱研究基础设施

针对现有以文档为中心的研究设施无法显式表征方法演进关系的问题，本文提出了方法论演化图谱Intern-Atlas。它从超103万篇AI论文中自动识别方法实体，推断其谱系关系与关键创新瓶颈，构建了一个包含941万余条有证据支撑语义边的可查询因果网络。研究还设计了自引导时序树搜索算法以追溯方法演进链条，经验证与专家标注结果高度一致。该图谱支持想法评估与自动生成等下游应用，为自动化科学发现提供了基础数据层。

智能体数据/训练论文/研究

08:00

HuggingFace Daily Papers（社区热门论文）

面向定制化多模态角色扮演

本文提出定制化多模态角色扮演任务，旨在统一模型中协同实现角色人格、对话风格与视觉身份的定制，并保持跨模态输出的一致性。研究构建了包含20个角色的RoleScape-20数据集，并开发了名为UniCharacter的两阶段训练框架，包含统一有监督微调与角色特定组相对策略优化。仅需10张图像及对应交互样例，模型即可习得目标角色特征，并在文本与图像生成中展现一致的角色表现，训练约需100 GPU小时。实验表明，该方法显著优于现有方案，消融研究验证了其跨模态一致性设计与小样本定制策略的有效性。

arXiv Hugging Face 多模态数据/训练

08:00

HuggingFace Daily Papers（社区热门论文）

基于扩散策略的隐藏奖励恢复

本文提出EnergyFlow框架，通过参数化一个标量能量函数，将生成式动作建模与逆强化学习统一起来。该框架证明，在最大熵最优性下，通过去噪分数匹配学到的分数函数可恢复专家软Q函数的梯度，从而无需对抗训练即可提取奖励。理论分析表明，约束学习场为保守场能降低假设复杂性并收紧分布外泛化界限。实验显示，EnergyFlow在各种操作任务上实现了最先进的模仿性能，其提供的奖励信号在下游强化学习中优于对抗性IRL和基于似然的方法。这表明有效的奖励提取约束本身即是有益于策略泛化的归纳偏置。

arXiv GitHub 数据/训练论文/研究

08:00

HuggingFace Daily Papers（社区热门论文）

ResRL：通过负样本投影残差强化学习提升大语言模型推理能力

针对可验证奖励强化学习可能抑制生成多样性的问题，本文提出负样本投影残差强化学习框架。该方法通过理论分析，将负样本标记的隐藏表示投影到基于奇异值分解的低秩正子空间，并利用投影残差来调制负梯度，从而解耦正负响应间的相似语义分布。在涵盖数学、代码、智能体任务和函数调用的12个基准测试中，ResRL平均表现优于基线方法，尤其在数学推理上较负样本强化学习方法显著提升，实现了推理能力与生成多样性的协同优化。代码已开源。

智能体推理数据/训练论文/研究

08:00

HuggingFace Daily Papers（社区热门论文）

医疗AI智能体训练环境与多轮强化学习稳定性研究

研究团队构建了覆盖10个临床领域、包含3600多项任务的Gymnasium兼容医疗AI训练环境。分析发现，现有多轮智能体强化学习方法易退化为冗长单轮独白，工具使用频率下降，问题源于稀疏最终奖励与连续临床轨迹的错配。为此，研究提出“轮次截断策略蒸馏”自蒸馏框架，利用梯度冻结的EMA教师模型在每轮对话提供密集的KL正则化。该方法在18项基准测试的10项中取得最佳性能，较非强化学习基线平均提升3.9个百分点，实现了更快早期收敛、可控响应长度和持续的多轮工具使用。

智能体检索增强数据/训练论文/研究

08:00

HuggingFace Daily Papers（社区热门论文）

从树到流再回归：统一决策树与扩散模型

研究建立了层次决策树与扩散过程在极限状态下的数学对应关系，提出统一的优化原则——全局轨迹分数匹配（GTSM），并证明理想化梯度提升是其渐进最优解。基于该框架，treeflow 在表格数据生成任务中实现了更高保真度与 2 倍计算加速，生成质量达到竞争水平；dsmtree 作为一种新型蒸馏方法，能将层次决策逻辑迁移至神经网络，在多项基准测试中与教师模型性能差距不超过 2%。

数据/训练论文/研究

08:00

HuggingFace Daily Papers（社区热门论文）

学习行动与协作：用于分布式黑盒共识优化的轨迹驱动框架

本文针对分布式黑盒共识优化问题，提出轨迹驱动的自设计框架LACMAS。该方法首先设计了具有自适应内部机制的智能体群体动力学，以平衡探索、收敛与局部逃逸。在此基础上，利用大型语言模型根据历史优化轨迹，为智能体的内部行动与外部协作模式提供稀疏的高层指导，并采用分阶段认知调度策略进行资源感知的适应。实验表明，该框架在基准测试和实际任务中，能持续提升解决方案质量、收敛效率与通信效率，为从人工设计转向自设计多智能体优化系统提供了可行路径。

智能体数据/训练论文/研究

08:00

HuggingFace Daily Papers（社区热门论文）

Themis：训练稳健的多语言代码奖励模型以实现灵活的多标准评分

针对代码奖励模型研究不足且现有模型多局限于功能正确性评分的问题，研究团队构建了Themis-CodeRewardBench基准，用于在5个偏好维度和8种编程语言上评估模型，并分析了50多个现有模型。为改进模型，团队创建了迄今最大的开源代码偏好数据集Themis-CodePreference（含超35万个偏好对），并据此训练了参数规模从6亿到320亿不等的Themis-RM系列多语言代码奖励模型，支持灵活的多标准评分。实验表明，模型具有正向缩放趋势，在多样化偏好训练下展现出强大的跨语言迁移能力，验证了多标准训练对可靠代码奖励建模的重要性。

Hugging Face 数据/训练论文/研究

02:14

Hacker News 热门（buzzing.cc 中文翻译）

在 PyTorch Lightning AI 训练库中发现以"沙伊-胡鲁德"为主题的恶意软件

安全平台 semgrep.dev 报告，在流行的 PyTorch Lightning AI 训练库中发现了名为“沙伊-胡鲁德”的恶意软件。该恶意代码通过库的依赖项进行植入，可能在使用受影响版本进行人工智能训练的项目中执行恶意操作。此事件在 Hacker News 上引发广泛讨论，获得了 111 点热度，突显了开源软件供应链的潜在安全风险。建议开发者立即检查并更新项目依赖，以防范此类供应链攻击。

安全/对齐开源生态数据/训练

4月30日

21:12

The Decoder：AI News（RSS）

OpenAI 称其已提前数年达成 10 吉瓦计算能力目标

OpenAI 宣布已在美国提前数年实现了 10 吉瓦的 AI 计算能力目标。这一计算规模原计划在未来几年达成，提前完成意味着公司获得了远超预期的强大算力基础设施，足以支持下一代大规模 AI 模型的训练与部署。10 吉瓦的算力相当于多个大型数据中心的能耗，标志着 OpenAI 在计算资源竞赛中取得了关键进展。

OpenAI 数据/训练行业动态

21:10

IT之家（RSS）

通用汽车：下一代 Super Cruise 每天都用人类百年驾驶经验进行训练

通用汽车在收缩电动车计划的同时，其Super Cruise高级驾驶辅助系统成为业务亮点，累计行驶里程已超16亿公里。公司正利用这些海量真实道路数据，通过每日模拟约100年人类驾驶经验的数字环境，训练下一代系统。通用计划于2028年在凯迪拉克凯雷德IQ上推出L3级脱手脱眼自动驾驶系统。公司CEO透露，近90%的自动驾驶代码由AI生成，并强调该系统未来将同时部署于燃油车和电动车，覆盖多品牌与不同价位车型。

具身智能数据/训练行业动态

20:42

The Decoder：AI News（RSS）

FDA 在 DOGE 裁员后寻求重建，押注 AI 与云监控革新临床试验

FDA 启动了一项试点项目，通过人工智能与云计算技术对临床试验进行实时监控。该机构表示，此举有望大幅缩短新药的审批时间。这一举措是 FDA 在经历 DOGE 裁员后，为重建并提升监管效率而推动的关键技术转型。

政策/监管数据/训练

18:10

IT之家（RSS）

微软预计 2026 年资本支出因组件成本上升增长 250 亿美元

微软预计其2026日历年资本支出将达1900亿美元，其中250亿美元源于AI浪潮导致的硬件组件成本上升。2026财年第三财季资本支出为319亿美元，主要用于GPU、CPU等短期资产；预计第四财季支出将超400亿美元，内含50亿美元涨价因素。由此推算，2026日历年下半年资本支出将接近1200亿美元，显著高于上半年。此外，必应搜索月活用户首次突破10亿，Edge浏览器份额持续增长，Xbox月活与游戏流媒体时长也创下新高。

Microsoft 数据/训练行业动态

16:09

IT之家（RSS）

SEMI：AI 数据中心相关的硅晶圆需求已延伸至电源管理组件

SEMI报告显示，AI数据中心驱动的硅晶圆需求持续强劲，已从先进逻辑与内存应用延伸至电源管理组件。旺盛需求推动电源半导体供应商调整价格，MLCC、PCB等被动元器件与基材也从中受益。2026年第一季度全球硅晶圆出货面积达3275百万平方英寸，同比增长13.1%，但受季节性因素影响环比下降4.7%。工业半导体需求回温带动市场复苏，但智能手机与PC出货表现较弱，部分因产能优先支持AI HBM导致一般内存供应紧张。

数据/训练行业动态

16:09

IT之家（RSS）

"哥布林"词频暴涨 175%，OpenAI 复盘称 AI 训练奖励机制意外"跑偏"

OpenAI 发布报告，复盘了 GPT-5.1 及后续模型在回答中异常频繁使用“哥布林”、“小魔怪”等词汇的现象。调查发现，问题根源在于为“书呆子”人格定制功能设计的奖励模型，其在超过76%的数据集中错误地鼓励使用生物隐喻词汇，形成了正反馈循环。尽管该功能仅占 ChatGPT 总回复量的 2.5%，却贡献了大部分异常提及，并导致行为扩散至其他场景。OpenAI 已通过移除相关奖励信号、过滤训练数据及添加指令提示进行修复。

OpenAI 安全/对齐数据/训练

15:40

Hacker News 热门（buzzing.cc 中文翻译）

对齐"打地鼠"游戏：微调会触发大型语言模型对受版权保护书籍的检索

一项名为“对齐打地鼠”的研究发现，微调大型语言模型会激活其对受版权保护书籍的检索能力，这揭示了AI对齐过程中的新风险：模型在优化后可能无意中回忆版权内容。该研究通过代码分析证实了这一现象，相关开源代码已发布在GitHub。此话题在科技社区引发关注，在Hacker News上获得103点积分，凸显了版权与AI发展之间的潜在冲突。

安全/对齐开源/仓库数据/训练论文/研究

15:10

OpenAI：官网动态（RSS · 排除企业/客户案例）

精选57

Where the goblins came from：GPT-5 行为中"妖精"输出的起源

研究揭示了GPT-5等AI模型中“妖精”输出的传播路径、时间线与根本原因。这些由特定“人格”驱动的怪异行为，源于训练数据中意外混入的特定模式或“文化基因”。开发团队已识别出问题根源，并正在部署修复方案，通过调整训练数据和微调模型来消除此类非预期的个性特征，以提升模型行为的稳定性和可预测性。

OpenAI 数据/训练论文/研究

推荐理由：GPT-5的“地精”现象不是偶然，OpenAI这篇复盘把它追溯到训练数据的最早期阶段，解释了模型为什么会有自己的“脾气”，做模型训练的值得细读。

15:09

HuggingFace Daily Papers（社区热门论文）

扭转TIDE：面向扩散大语言模型的跨架构蒸馏框架

研究团队提出首个跨架构扩散大语言模型蒸馏框架TIDE，以解决师生模型在架构、注意力机制和分词器上不同时的知识迁移难题。该框架包含三个核心组件：TIDAL根据训练进度和扩散时间步联合调节蒸馏强度；CompDemo通过互补掩码分割丰富教师模型上下文，以改进重度掩码下的预测；Reverse CALM则是一种提供有界梯度和双端噪声过滤的跨分词器目标函数。实验将80亿参数稠密模型和160亿参数MoE教师模型的知识蒸馏至6亿参数学生模型，在八个基准测试中平均领先基线1.53分，代码生成能力提升显著。

数据/训练编码论文/研究

10:42

HuggingFace Daily Papers（社区热门论文）

ClawGym：一个用于构建高效Claw智能体的可扩展框架

ClawGym是一个可扩展框架，旨在解决Claw式环境中缺乏系统化开发框架的瓶颈，支持个人智能体开发的全生命周期。其核心包括：ClawGym-SynData数据集，通过角色驱动意图与技能基础操作合成1.35万个筛选任务，配备模拟工作空间和混合验证机制；ClawGym-Agents模型系列，基于黑盒轨迹监督微调训练，并探索在并行化任务沙箱中的轻量级强化学习流程；以及ClawGym-Bench评估基准，包含200个经过自动过滤与人工-LLM双重校准的测试实例。相关资源即将在GitHub开源发布。

智能体开源/仓库数据/训练论文/研究

09:12

Hacker News 热门（buzzing.cc 中文翻译）

Ramp的Sheets AI功能被曝泄露敏感财务数据

网络安全公司PromptArmor披露，企业支出管理平台Ramp的“Sheets AI”功能存在严重数据泄露风险。当用户使用该AI总结电子表格时，系统会向OpenAI的API发送包含交易金额、供应商名称、员工费用等敏感财务信息的完整表格数据，且此过程未充分告知用户。这些数据可能被用于模型训练，涉及Ramp庞大的用户群及其处理的数百亿美元企业支出。目前，Ramp已暂时禁用该功能并展开调查。

安全/对齐数据/训练

08:00

HuggingFace Daily Papers（社区热门论文）

评估胰腺导管腺癌血管侵犯：PDACVI基准测试

研究团队发布了CURVAS-PDACVI数据集与挑战赛，这是一个针对胰腺导管腺癌术前血管侵犯评估的开放基准。数据集包含每例扫描的五位专家独立标注，支持不确定性感知AI模型的开发。提出的评估框架不仅衡量空间重叠度，还纳入概率校准与侵犯判定。对六种前沿方法的评估表明，全局体积精度高的模型在关键的肿瘤-血管界面未必可靠；而专门建模标注者分歧的方法能生成更校准的概率图，在专家共识低的复杂案例中更具鲁棒性。该基准揭示了体积精度作为手术适用性代理指标的局限性，推动了面向术前决策的不确定性感知模型的发展。

arXiv 数据/训练论文/研究

08:00

HuggingFace Daily Papers（社区热门论文）

重复优于多样：面向高效德语建模的高质量数据过滤策略

针对德语等高资源非英语语言，本研究构建分层过滤器处理5亿份网络文档，对比了单次训练大规模低过滤数据与多轮重复训练高质量核心数据的效果。实验表明，重复训练高质量数据在多种模型规模和训练量级下均稳定优于追求多样性的单次训练，即使重复7轮后性能差距依然显著。这证明通过质量过滤实现语义集中，比单纯扩大数据量更能高效推进语言建模。基于此发布的德语模型Boldt，在训练量仅为同类模型1/10至1/360的情况下取得了领先性能，相关清洗后的评估基准已公开。

arXiv 开源生态数据/训练论文/研究

08:00

HuggingFace Daily Papers（社区热门论文）

When Do Diffusion Models Learn to Generate Multiple Objects？

研究通过引入mosaic框架，系统探究了扩散模型在多物体生成中的局限性。发现场景复杂性是主要障碍，而非概念不平衡；在低数据量下，计数能力尤其难以学习。当训练中排除更多概念组合时，模型的组合泛化能力会崩溃。这些发现揭示了扩散模型的基本限制，为设计更强归纳偏置和数据方案以提升多物体组合生成鲁棒性提供了依据。

图像生成数据/训练论文/研究

08:00

Apple Machine Learning Research（RSS）

利用 Sign Language Models 自举标注手语注释

研究团队开发了一套手语伪标注流程，以解决高质量标注数据匮乏对AI手语翻译发展的限制。该流程以手语视频和英文文本为输入，输出包括时间区间在内的可能注释排序集合，涵盖手势词、手指拼写单词和手语分类器。新发布的ASL STEM Wiki和FLEURS-ASL等数据集虽包含数百小时专业译员数据，但因标注成本过高仅实现部分标注。该自举方法旨在显著提升大规模手语数据的利用效率。

多模态数据/训练论文/研究

01:34

Dwarkesh Patel：Podcast & Blog（RSS）

精选55

Reiner Pope - 大语言模型训练与服务的数学原理

文章揭示了支撑大语言模型（如GPT、Claude、LLaMA）训练与服务的核心数学框架。通过剖析关键方程，可以逆向推导出顶尖AI实验室在模型规模扩展、计算资源分配及服务优化方面的核心策略与实践。这些数学原理不仅解释了模型性能随参数和数据量增长的规律，也量化了训练成本与推理效率之间的权衡，为理解当前大语言模型的发展路径提供了底层逻辑。

大佬观点推理数据/训练

推荐理由：Reiner Pope 把训模型背后的数学摊开讲，听完能反推出大厂在做什么，做训练的人不可多得的一课。

4月29日

23:39

Hugging Face：Blog（RSS）

Granite 4.1 LLMs：构建之道

IBM Granite团队在Hugging Face上发布了Granite 4.1系列大型语言模型的构建细节。该系列模型专注于代码与自然语言任务，采用多阶段训练流程，包括大规模代码数据预训练、多样化指令微调以及强化学习对齐。模型架构基于改进的Transformer解码器，并针对长序列和工具使用进行了优化。新版本在多项基准测试中性能显著提升，特别是在代码生成与数学推理任务上，部分指标超越了同规模的开源模型。团队同时公开了部分训练数据集构建方法与评估框架。

教程/实践数据/训练

19:34

IT之家（RSS）

研究团队：自2022年ChatGPT诞生以来，如今互联网新增内容中35%均由AI生成

英国帝国理工学院、斯坦福大学及互联网档案馆的研究显示，自ChatGPT推出至2025年中，全球互联网约35%的新增内容带有AI生成痕迹，占比从近零快速跃升。研究验证了AI内容存在“语义收缩”和“情绪单一且正面”的现象，其语义相似度比人工内容高33%，正面情绪评分高107%。但其他如事实质量下降等负面影响未获统计支持。目前，生成式AI主要影响了文字多样性和情绪表达，对信息可信度的冲击尚未明确证实。

数据/训练现象/趋势

16:33

IT之家（RSS）

科大讯飞总裁吴晓如：今年 10 月将在华为昇腾 950 平台上发布国产旗舰大模型

科大讯飞总裁吴晓如宣布，公司计划于今年10月在华为昇腾950平台上发布国产旗舰大模型，该模型将直接对标业界最先进主流模型。此前，科大讯飞已发布星火X2-Flash模型，采用MoE架构，总参数达30B，最大支持256K上下文，基于华为昇腾910B集群训练完成。财务数据显示，2026年第一季度营业总收入为52.74亿元，同比增长13.23%；归母净利润为-1.70亿元，同比增长12.17%。

数据/训练行业动态

15:33

IT之家（RSS）

蚂蚁数科亮相 2026 数字中国建设峰会，推出 DataX 智能体数据生态平台

蚂蚁数科在2026数字中国建设峰会上发布DataX智能体数据生态平台。该平台通过接入模型上下文协议（MCP）和专用智能体DTClaw，旨在降低数据使用门槛、缩短数据价值转化周期。DataX汇聚隐私计算、数据加工等Skills库，将传统数据服务转化为标准MCP协议以提升AI接入效率。DTClaw可将复杂的数据处理逻辑封装为即用型Skill与Agent，实现“开箱即用”。平台还构建了基于数据的图谱知识库，支持通过自然语言进行智能编排与高效检索，帮助企业快速构建专业智能体。

智能体 MCP/工具产品更新数据/训练

15:33

IT之家（RSS）

2025年我国数据生产总量达52.26泽字节，占全球27.44%

《全国数据资源调查报告（2025年）》在第九届数字中国建设峰会上发布。报告显示，2025年我国数据生产总量达52.26泽字节，同比增长27.28%，占全球总量的27.44%，相当于全国所有算力中心存储容量的近30倍。我国数据生产已连续三年加速提升，此高增速主要来源于企业数据。此外，用于人工智能训练和推理的数据总量为199.48艾字节，同比增长42.86%，其中推理数据量首次超过训练数据量。

数据/训练行业动态

13:33

IT之家（RSS）

2025 年我国用于人工智能训练和推理的数据总量达 199.48EB，同比增长 42.86%

国家数据局数据显示，2025年我国用于人工智能训练和推理的数据总量达199.48EB，同比增长42.86%。其中，推理数据量首次超过训练数据量，达到101.34EB。同年，由系统软件和人工智能产生的数据量达26.92ZB，首次超越传统占主体的物联感知数据量。测算显示，未来推理算力需求与训练算力需求之比可能达到3:1或更高。此外，全国日均词元调用量在2025年末已增至100万亿，全年累计调用量约21100万亿。

推理数据/训练行业动态

11:33

IT之家（RSS）

我国 2025 全年词元累计调用量约 21100 万亿

《全国数据资源调查报告（2025 年）》在第九届数字中国建设峰会发布，显示数据资源正强力赋能人工智能创新。2025年，全国日均词元调用量从年初超万亿增长到年末100万亿，呈现指数级跃升；全年累计调用量达到约21100万亿。词元是AI模型处理信息的最小单元，调用量增长直接反映模型使用活跃度与产业价值创造能力。

数据/训练行业动态

10:38

HuggingFace Daily Papers（社区热门论文）

递归多智能体系统

本研究将递归计算从单一模型扩展至多智能体系统，提出RecursiveMAS框架。该框架通过轻量级RecursiveLink模块连接异构智能体，形成协作循环，实现潜在思维生成与状态传递，并采用内外双循环算法进行全系统协同优化。理论分析表明其效率高于传统文本交互系统且训练稳定。在数学、科学、医学等9项基准测试中，该框架相比先进基线平均准确率提升8.3%，推理速度加快1.2–2.4倍，token使用量减少34.6%–75.6%。代码与数据已公开。

智能体数据/训练论文/研究

10:38

HuggingFace Daily Papers（社区热门论文）

通过技能图实现可扩展的终端任务合成

SkillSynth 是一个基于场景中介技能图的自动化终端任务合成框架，旨在解决终端智能体训练中高质量、多样化执行轨迹稀缺的问题。该方法首先构建大规模技能图，以场景作为中间过渡节点连接多样化的命令行技能；随后从图中采样路径作为真实工作流的抽象，并通过多智能体系统将其实例化为可执行任务。通过在图形采样的工作流路径上进行任务合成，SkillSynth 能够显式控制解决合成任务所需的最小执行轨迹的多样性。在 Terminal-Bench 上的实验验证了其有效性。此外，SkillSynth 合成的任务实例已用于训练 Hy3 Preview，提升了其在终端环境下的智能体能力。

智能体数据/训练论文/研究

10:38

HuggingFace Daily Papers（社区热门论文）

视频生成的系统性后训练框架

研究团队提出一个系统性后训练框架，旨在弥合大规模视频扩散模型预训练性能与实际部署需求之间的差距。该框架包含四个协同阶段：首先通过监督微调将基础模型转化为稳定的指令跟随策略；随后采用专为视频扩散定制的新型群组相对策略优化方法进行基于人类反馈的强化学习，以提升感知质量和时间连贯性；接着集成专用语言模型进行提示词增强以优化用户输入；最后通过推理优化提升系统效率。实验表明，该统一流程能有效减少常见伪影，显著提升可控性和视觉美感，同时严格遵守采样成本限制。

数据/训练视频论文/研究

08:33

IT之家（RSS）

突破 2 纳米工艺极限：DNA 生物晶体管实现分子级计算与存储双重突破

韩国科学技术院研究团队成功开发出一种基于DNA的生物晶体管，突破了传统硅基半导体2纳米的微型化极限。该技术利用间距仅0.34纳米的DNA分子，通过可逆组装与解组装响应外部信号，实现了分子层面的计算与信息存储双重功能，克服了传统DNA电路一次性使用的缺陷。这项模拟半导体晶体管原理的成果，有望应用于体内分子诊断装置，实时监测疾病信号，为生物计算与医疗技术开辟了新方向。研究已发表于《Science Advances》。

数据/训练论文/研究

08:00

HuggingFace Daily Papers（社区热门论文）

更优模型，更快训练：用于单细胞基础模型的Sigmoid注意力机制

本研究提出将Sigmoid注意力作为Softmax注意力的直接替代方案，用于构建更稳定的生物基础模型。在六个单细胞数据集上的实验表明，Sigmoid注意力能提升25%的细胞类型分离度，改善细胞类型内聚性，并降低验证损失，同时训练速度提升高达10%。理论分析揭示，Sigmoid具有全局有界导数和对角雅可比结构，这缓解了Softmax的稠密耦合带来的不稳定性。在压力测试中，训练1.6亿参数模型时，Softmax出现梯度爆炸，而Sigmoid保持稳定。团队开源了高性能GPU内核TritonSigmoid，在H100上实现515 TFLOPS，性能超越现有方案，并原生支持生物序列所需的填充处理。

开源/仓库数据/训练论文/研究

08:00

HuggingFace Daily Papers（社区热门论文）

ViPO：大规模视觉偏好优化

针对现有开源视觉偏好数据集存在的冲突偏好、低分辨率等问题，研究团队提出Poly-DPO算法，通过多项式项动态调整模型置信度以增强抗噪性。为突破数据瓶颈，团队构建了大规模高质量数据集ViPO，包含百万级图像对与数十万视频对。实验表明，在高质量ViPO上，Poly-DPO最优配置会收敛至标准DPO，验证了数据质量；而在噪声数据集上，Poly-DPO相比Diffusion-DPO在SD1.5和SDXL模型上分别取得6.87和2.32的性能提升。研究证实，算法适应性与数据质量共同推动视觉偏好优化的规模化发展。

图像生成数据/训练论文/研究

02:11

The Decoder：AI News（RSS）

一个对1930年后世界一无所知的LLM如何想象2026年

名为“Talkie”的130亿参数语言模型仅使用1931年前的文本训练，其对未来世界的预测呈现出强烈的时代局限性。该模型怀疑第二次世界大战是否会发生，并将2026年想象成一个仍以蒸汽船、铁路和廉价小说为主导的世界。这直观揭示了训练数据的时间范围如何从根本上限制大语言模型对现实发展的认知与预测能力。

数据/训练现象/趋势论文/研究