AIHOT
内容
精选全部 AI 动态AI 日报主题收藏
接入
Agent 接入
更多
关于更新日志反馈
内部员工登录
精选全部日报更多
内部员工登录
全部动态资讯 · 1210 条
全部一手资讯X论文
标签「数据/训练」清除
5月7日周四
08:00HuggingFace Daily Papers(社区热门论文)65均值模式尖叫:用于千层扩散变换器的均值-方差分割残差方法
08:00HuggingFace Daily Papers(社区热门论文)51UniSD:面向大型语言模型的统一自蒸馏框架
08:00HuggingFace Daily Papers(社区热门论文)51CPCANet:基于深度展开通用主成分分析的领域泛化方法
08:00HuggingFace Daily Papers(社区热门论文)57HumanNet:将人类中心视频学习扩展到百万小时
08:00HuggingFace Daily Papers(社区热门论文)49MDN:面向Delta线性注意力的步进动量并行化
08:00HuggingFace Daily Papers(社区热门论文)65IntentGrasp:意图理解综合基准
08:00HuggingFace Daily Papers(社区热门论文)54列表式策略优化:基于分组的RLVR作为大语言模型响应单纯形上的目标投影
5月6日周三
19:16IT之家(RSS)69马斯克为自家晶圆厂砸重金,SpaceX 拟在得州 Terafab 工厂投资 550 亿美元
09:15IT之家(RSS)66AI 训练侵犯版权,爱思唯尔、圣智等多家出版商起诉 Meta
09:01Hacker News 热门(buzzing.cc 中文翻译)65出版商称,扎克伯格"亲自批准"了Meta的侵权行为
08:00HuggingFace Daily Papers(社区热门论文)57KernelBench-X:评估LLM生成的GPU内核的综合基准测试
08:00HuggingFace Daily Papers(社区热门论文)55RemoteZero:无需人工标注的地理空间推理
08:00HuggingFace Daily Papers(社区热门论文)57ReflectDrive-2:基于强化学习对齐的自编辑离散扩散驾驶规划器
08:00HuggingFace Daily Papers(社区热门论文)66TabEmbed:面向表格理解的基准测试与通用嵌入学习
06:01Hacker News 热门(buzzing.cc 中文翻译)65扎克伯格"亲自批准并鼓励"Meta的侵权行为
04:17HuggingFace Daily Papers(社区热门论文)55一种缩小游戏引擎合成数据集中 Sim2Real 外观差异的混合方法
5月5日周二
20:56The Decoder:AI News(RSS)59SAP的收购狂潮表明这家企业巨头正认真致力于成为AI就绪的数据平台
20:56Hacker News 热门(buzzing.cc 中文翻译)68从零开始训练你自己的大型语言模型
08:00HuggingFace Daily Papers(社区热门论文)55CASCADE:大语言模型部署中的基于案例的持续适应
07:16Simon Willison 博客42驳斥数据中心占用农田论:Andy Masley 的观点
00:14IT之家(RSS)71精选Claude Token 榜:迪士尼「榜一大哥」9 天 46 万次,Meta 月烧 60 万亿
00:11Nathan Lambert:Interconnects(RSS)47蒸馏恐慌
5月4日周一
12:13IT之家(RSS)63特斯拉 FSD 行驶里程突破 100 亿英里,马斯克"无监督自动驾驶"数据里程碑达成
09:13IT之家(RSS)46借AI芯片风口,日本卫浴巨头TOTO半导体陶瓷业务利润占比过半
08:00HuggingFace Daily Papers(社区热门论文)50通过协作式逐步多教师解码蒸馏长链式思维推理
08:00HuggingFace Daily Papers(社区热门论文)49InfoLaw:面向大语言模型的信息缩放定律--基于质量加权混合数据与重复训练
08:00HuggingFace Daily Papers(社区热门论文)66TTS-STT飞轮系统:合成实体密集音频弥补印度语言ASR在细分领域的性能差距
08:00HuggingFace Daily Papers(社区热门论文)55基于编排轨迹的LLM多智能体系统强化学习研究
5月3日周日
22:13IT之家(RSS)57马斯克 xAI 坐拥 55 万张英伟达 GPU 但算力利用率仅 11%,Meta 和谷歌可达 43~46%
16:51The Decoder:AI News(RSS)44MIT研究解释为何扩展语言模型能如此可靠地提升性能
5月2日周六
08:00HuggingFace Daily Papers(社区热门论文)51TT4D:基于单目视频的乒乓球4D重建流程与数据集
03:10Tomer Tunguz 博客(VC 分析)57精选本周的积极信号:AI在医疗、教育、农业与科研领域的突破性进展
5月1日周五
22:18The Decoder:AI News(RSS)38ChatGPT 的哥布林痴迷或许滑稽,却揭示了 AI 训练的深层问题
22:11IT之家(RSS)57马斯克承认:xAI 曾使用 OpenAI 模型来"蒸馏"Grok
21:15HuggingFace Daily Papers(社区热门论文)42Instruction-Guided Poetry Generation in Arabic and Its Dialects
15:11IT之家(RSS)61目标内存速率 12800 MT/s,固态技术协会 JEDEC 宣布 DDR5 MRDIMM 关键进展
15:11IT之家(RSS)57扎克伯格致 Meta 员工:公司追踪电脑操作,是因为你们比外包普通员工聪明
14:11IT之家(RSS)46韩投称 AI 企业已锁定长期内存订单:即便市场短缺缓解,价格仍维持高位
11:14HuggingFace Daily Papers(社区热门论文)55World2Minecraft:占据驱动的仿真场景构建
10:14HuggingFace Daily Papers(社区热门论文)53规模化合成计算机:用于长周期生产力模拟
全部 AI 动态
AI 相关资讯全量信息流
全部一手信源资讯推文
全部模型产品行业论文技巧
5月7日
08:00
HuggingFace Daily Papers(社区热门论文)
65
均值模式尖叫:用于千层扩散变换器的均值-方差分割残差方法

研究发现,当扩散变换器扩展到数百层时,会因结构脆弱性进入“均值主导崩溃”状态,即表征同质化且中心化变异被抑制,此现象被定义为均值模式尖叫。其触发机制源于残差写入器的均值相干反向冲击。为解决此问题,研究提出了均值-方差分割残差方法,它将独立增益的中心化残差更新与泄漏主干均值替换相结合。在400层单流扩散变换器上,该方法有效防止了基线模型的崩溃性发散,性能显著优于LayerScale等各向同性门控方法。最终,研究成功训练了一个1000层的扩散变换器,验证了该架构在极深尺度下仍能保持稳定训练。

数据/训练论文/研究部署/工程
08:00
HuggingFace Daily Papers(社区热门论文)
51
UniSD:面向大型语言模型的统一自蒸馏框架

本文提出统一自蒸馏框架UniSD,系统研究大型语言模型的自蒸馏方法。该框架整合多教师一致性、指数移动平均教师稳定、词元级对比学习、特征匹配和散度裁剪等机制,以应对监督可靠性、表示对齐和训练稳定性三大挑战。通过在三个模型家族的六个模型和六个基准上的实验,UniSD揭示了自蒸馏优于静态模仿的条件、各组件的贡献及其跨任务交互机制。基于此构建的完整流程UniSDfull,在基础模型上提升5.4个百分点,较最强基线提升2.8个百分点,实现了无需更强外部教师的高效模型适配。

数据/训练论文/研究
08:00
HuggingFace Daily Papers(社区热门论文)
51
CPCANet:基于深度展开通用主成分分析的领域泛化方法

CPCANet是一种新颖的领域泛化框架,其核心是将通用主成分分析(CPCA)的迭代式Flury-Gautschi算法展开为完全可微的神经层。该方法将CPCA的统计特性融入端到端可训练框架,强制模型从不同领域中发现一个共享的、具有可解释性的子空间。在四个标准领域泛化基准测试上的实验表明,CPCANet在零样本迁移任务中取得了最先进的性能。该框架与具体网络架构无关,且无需针对特定数据集进行调优,为在分布偏移下学习鲁棒表征提供了一种简单高效的解决方案。

arXiv数据/训练论文/研究
08:00
HuggingFace Daily Papers(社区热门论文)
57
HumanNet:将人类中心视频学习扩展到百万小时

HumanNet是一个百万小时规模的人类中心视频数据集,涵盖第一和第三人称视角,包含精细活动、人-物交互、工具使用及长期行为。它提供交互中心标注,如描述文本、动作说明及身体信号,支持动作与交互感知学习。数据构建强调人类中心筛选、时序结构化、视角多样性和标注增强,将互联网视频转化为可扩展学习基础。实验表明,用其1000小时第一人称视频训练Qwen VLM模型,效果优于100小时真实机器人数据,提示人类视频可作为机器人数据的可扩展且经济高效替代。该项目旨在探索通过人类视频扩展具身基础模型。

arXiv具身智能数据/训练视频
08:00
HuggingFace Daily Papers(社区热门论文)
49
MDN:面向Delta线性注意力的步进动量并行化

针对线性注意力模型中传统在线随机梯度下降存在的信息衰减快、收敛欠佳问题,本研究提出了一种结合步进动量规则的块状并行算法。从动力系统视角分析,该动量循环被视为引入复共轭特征值的二阶系统,从而指导了稳定门控约束的设计。新模型Momentum DeltaNet(MDN)利用Triton内核,实现了与Mamba2、KDA等模型相当的训练吞吐量。在4亿和13亿参数模型上的实验表明,MDN在多种下游评估基准上均优于Transformer、Mamba2和GDN等强基线模型。

数据/训练论文/研究
08:00
HuggingFace Daily Papers(社区热门论文)
65
IntentGrasp:意图理解综合基准

本文推出IntentGrasp基准,用于评估大语言模型的意图理解能力。该基准从12个领域的49个语料库构建,包含超26万实例的训练集及“全集”、“精选集”两个测试集。对20个前沿模型的评估显示,其在全集和精选集上的得分分别低于60%和25%,显著低于约81.1%的人类估计表现,提升空间巨大。研究提出的意图微调方法使模型性能显著提升,在全集和精选集上F1分数分别增加30分和20分以上,留一领域实验也验证了其强大的跨领域泛化能力。

数据/训练论文/研究
08:00
HuggingFace Daily Papers(社区热门论文)
54
列表式策略优化:基于分组的RLVR作为大语言模型响应单纯形上的目标投影

本研究提出列表式策略优化(LPO),为大语言模型可验证奖励强化学习提供新方法。现有分组策略梯度方法隐式地在响应单纯形上定义目标分布并进行一阶近似投影,LPO则将其显式化:先限制近端目标于单纯形以明确目标,再通过精确散度最小化投影策略。该框架能在列表目标上实现单调改进,其投影梯度有界、零和且自校正,并通过解耦的投影步骤灵活选择散度。实验表明,在相同目标下,LPO训练性能持续优于典型策略梯度基线,同时保持了优化稳定性与响应多样性。

推理数据/训练论文/研究
5月6日
19:16
IT之家(RSS)
69
马斯克为自家晶圆厂砸重金,SpaceX 拟在得州 Terafab 工厂投资 550 亿美元

SpaceX计划投资550亿美元在得克萨斯州格莱姆斯县建设下一代垂直整合半导体工厂“Terafab”,旨在为马斯克的机器人、航天和AI项目生产2纳米先进制程芯片。该项目总投资额最高可能达1190亿美元,未来计划支持每年1太瓦的算力规模。马斯克称,由于半导体行业发展速度无法满足其需求,自建芯片厂已变得必要。此举被视为对美国本土半导体制造的变革性投资,但外界对其缺乏行业经验存有疑虑。

数据/训练行业动态
09:15
IT之家(RSS)
66
AI 训练侵犯版权,爱思唯尔、圣智等多家出版商起诉 Meta

爱思唯尔、圣智、阿歇特等多家出版商及作家斯科特·图罗在曼哈顿联邦法院集体起诉Meta,指控其未经许可滥用数百万部受版权保护的书籍、期刊文章(包括教科书、科学文章及小说《第五季》等)来训练AI模型Llama,并索赔未定金额的经济赔偿。Meta回应称,利用版权材料训练AI可构成合理使用,将积极应诉。此前,AI公司Anthropic曾以支付至少15亿美元的方式,就类似作家集体诉讼达成和解。

Meta政策/监管数据/训练
09:01
Hacker News 热门(buzzing.cc 中文翻译)
65
出版商称,扎克伯格"亲自批准"了Meta的侵权行为

多家出版商指控Meta及其CEO扎克伯格存在大规模版权侵权。诉状称,扎克伯格“亲自批准”使用受版权保护的书籍、新闻文章等作品来训练其Llama系列AI模型,且公司内部明知此举存在法律风险。诉讼寻求就Meta未经许可复制大量作品的行为获得赔偿,具体涉及的作品数量未公开。此案凸显了AI训练数据版权争议的升级。

Meta数据/训练行业动态
08:00
HuggingFace Daily Papers(社区热门论文)
57
KernelBench-X:评估LLM生成的GPU内核的综合基准测试

KernelBench-X基准测试系统评估LLM生成的Triton GPU内核,涵盖15个类别共176项任务。研究比较五种代表性方法,发现:任务结构对正确性的影响远超方法设计,类别因素解释的方差是方法的近三倍;迭代优化将编译成功率从52.3%提升至68.8%,但平均加速比从1.58倍降至1.44倍;46.6%的正确内核性能低于PyTorch基线,量化任务全部失败。未来需关注全局协调、数值精度建模与硬件效率整合。

数据/训练编码论文/研究
08:00
HuggingFace Daily Papers(社区热门论文)
55
RemoteZero:无需人工标注的地理空间推理

地理空间推理模型通常依赖人工标注的边界框坐标进行监督,这限制了其在海量无标注遥感数据上的自我进化。为此,研究团队提出RemoteZero框架,它利用多模态大语言模型在判别区域语义方面的优势,以内在语义验证取代几何坐标监督,从而实现了无需边界框标注的训练。该框架支持迭代式自我进化,模型能够利用自身产生的验证信号从无标注影像中持续学习。实验表明,RemoteZero在定位任务上取得了与强监督方法相竞争的性能,展现了自验证训练在地理空间推理领域的潜力。

arXiv多模态推理数据/训练
08:00
HuggingFace Daily Papers(社区热门论文)
57
ReflectDrive-2:基于强化学习对齐的自编辑离散扩散驾驶规划器

ReflectDrive-2是一种用于自动驾驶的掩码离散扩散规划器,它将规划表示为离散轨迹令牌并通过并行掩码解码生成。其核心是AutoEdit自编辑功能,可在同一模型内直接重写选定令牌,无需额外优化网络。模型采用两阶段训练:先通过扰动专家轨迹进行监督学习,再利用强化学习微调“决策-起草-反思”全流程,将最终驾驶奖励分配给编辑后的轨迹。强化学习使编辑效果的PDMS指标增益从0.3提升至1.9。在NAVSIM测试中,该模型仅使用摄像头输入即达到91.0 PDMS,在最优6次采样下可达94.8 PDMS,平均延迟为31.8毫秒。

具身智能数据/训练论文/研究
08:00
HuggingFace Daily Papers(社区热门论文)
66
TabEmbed:面向表格理解的基准测试与通用嵌入学习

基础模型在自然语言处理中建立了统一表示,但表格数据领域仍待探索。现有方法存在根本限制:基于LLM的方法缺乏检索兼容的向量输出,而文本嵌入模型常无法捕捉表格结构和数值语义。为此,我们首先引入表格嵌入基准TabBench,以评估嵌入模型的表格理解能力;然后提出首个通用嵌入模型TabEmbed,将分类和检索任务统一到共享嵌入空间。TabEmbed通过将多样表格任务重构为语义匹配问题,利用大规模对比学习和正样本感知的困难负样本挖掘技术,捕捉细粒度结构与数值语义。实验表明,TabEmbed在TabBench上显著优于当前最先进的文本嵌入模型,为通用表格表示学习设立了新基准。相关代码和数据集已在GitHub和Hugging Face平台开源。

开源生态搜索数据/训练论文/研究
06:01
Hacker News 热门(buzzing.cc 中文翻译)
65
扎克伯格"亲自批准并鼓励"Meta的侵权行为

Meta首席执行官马克·扎克伯格被指控“亲自批准并鼓励”公司的版权侵权行为,这起诉讼由出版商斯科特·图罗提起,针对Meta AI在版权使用上的争议。该新闻在Hacker News上获得106点关注,凸显科技社区对此事的高度兴趣。指控细节涉及扎克伯格直接参与侵权决策,可能影响Meta与内容创作者的版权纠纷进程。

Meta政策/监管数据/训练行业动态
04:17
HuggingFace Daily Papers(社区热门论文)
55
一种缩小游戏引擎合成数据集中 Sim2Real 外观差异的混合方法

研究提出一种混合方法,旨在缩小游戏引擎合成数据与真实图像之间的外观差异。该方法结合了先进图像生成扩散模型 FLUX.2-4B Klein 与传统图像翻译模型 REGEN 的优势。实验表明,传统模型 REGEN 在性能上优于 FLUX.2-4B Klein,而将两者结合使用的混合方法,能够比单独使用任一模型获得更好的视觉真实感,同时保持语义一致性。相关代码已在 GitHub 开源。

arXiv图像生成数据/训练论文/研究
5月5日
20:56
The Decoder:AI News(RSS)
59
SAP的收购狂潮表明这家企业巨头正认真致力于成为AI就绪的数据平台

SAP正在收购开源数据湖仓提供商Dremio和AI公司Prior Labs,以扩展其数据平台能力。这两项收购是SAP构建“AI就绪”企业数据平台战略的关键举措,旨在整合先进的数据管理和人工智能技术,强化其对企业客户的数据处理与AI服务支持。此举标志着SAP正通过积极并购加速向智能化数据平台转型。

数据/训练行业动态部署/工程
20:56
Hacker News 热门(buzzing.cc 中文翻译)
68
从零开始训练你自己的大型语言模型

GitHub开源项目“llm-from-scratch”提供了从零开始训练大型语言模型的完整指南。该项目详细阐述了构建现代LLM所需的核心组件,包括分词器、Transformer架构、预训练与微调流程。指南强调通过实践理解模型内部机制,而非直接调用现有API。项目在Hacker News社区获得广泛关注,收获293点热度,反映出开发者对深入掌握LLM底层技术的强烈需求。

GitHub开源生态教程/实践数据/训练
08:00
HuggingFace Daily Papers(社区热门论文)
55
CASCADE:大语言模型部署中的基于案例的持续适应

研究提出部署时学习作为大语言模型生命周期的第三阶段,并推出CASCADE框架。该框架使LLM智能体能在部署期间从经验中持续学习,而无需更新模型参数。其核心是为智能体配备一个显式、演进的情景记忆,将经验复用建模为上下文赌博机问题,从而实现探索与利用的权衡,并保证长期无悔性。在涵盖医疗、法律、代码生成等16项多样任务中,CASCADE将宏观平均成功率较零样本提示提升了20.9%,且持续优于多种基线方法。这项工作通过将部署重构为自适应学习过程,为持续改进的AI系统奠定了基础。

数据/训练论文/研究部署/工程
07:16
Simon Willison 博客
42
驳斥数据中心占用农田论:Andy Masley 的观点

Andy Masley 驳斥了关于数据中心建设导致农田耗尽的论点。他指出,2000年至2024年间,美国农民自愿出售的农田总面积相当于科罗拉多州,是2028年数据中心预计占地总面积的77倍,但剩余土地的粮食产量却创新高,未影响粮食供应。然而,当劳登县一位农民仅以十倍农业价值出售几英亩普通草场给数据中心运营商时,却引发了过度担忧。Masley 认为,这种对数据中心用地的担忧是夸大其词的。

数据/训练现象/趋势
00:14
IT之家(RSS)
精选71
Claude Token 榜:迪士尼「榜一大哥」9 天 46 万次,Meta 月烧 60 万亿

迪士尼内部上线AI使用看板,追踪员工调用Claude的频率和token消耗。数据显示,一名员工在9个工作日内调用Claude约46万次,平均每1.7秒一次。与此同时,迪士尼正裁员约1000人。硅谷正流行“tokenmaxxing”文化,比拼AI token消耗量。Meta内部统计显示,其8.5万名员工在30天内消耗了60万亿token,价值约900亿美元;Uber的年度34亿美元AI预算在4个月内耗尽。报告显示,Claude用户中非程序员用途已超半数。

Anthropic数据/训练现象/趋势

推荐理由:迪士尼搞AI排行榜,Meta月烧60万亿token,这不是段子,是AI真实渗透的活证据。从律师到全职妈妈,所有人都开始用Claude打工,这股浪潮比任何财报都真实。
00:11
Nathan Lambert:Interconnects(RSS)
47
蒸馏恐慌

AI领域出现“蒸馏攻击”现象,即利用GPT-4等闭源模型的输出训练更小的开源模型。这引发了关于知识产权与创新平衡的激烈争论。支持者视其为技术民主化途径,反对者则谴责其侵犯版权并可能损害模型质量。目前,部分开源模型性能已快速逼近顶级闭源模型,迫使行业重新审视数据使用边界与合规框架。

大佬观点数据/训练现象/趋势
5月4日
12:13
IT之家(RSS)
63
特斯拉 FSD 行驶里程突破 100 亿英里,马斯克"无监督自动驾驶"数据里程碑达成

特斯拉FSD(监督版)车队行驶总里程已突破100亿英里,达到马斯克设定的关键数据里程碑,且数据收集速度大幅加快。特斯拉宣称其FSD安全性优于人类驾驶,但业内指出其统计口径与官方不一致,存在误导性,其奥斯汀自动驾驶出租车事故率约为人类驾驶员的四倍。马斯克已将无监督版FSD上线时间推迟至2026年第四季度。相比之下,Waymo已在多城运营L4级无人驾驶,并公布其重伤事故率比人类低90%。

具身智能数据/训练行业动态
09:13
IT之家(RSS)
46
借AI芯片风口,日本卫浴巨头TOTO半导体陶瓷业务利润占比过半

日本卫浴巨头TOTO的半导体陶瓷业务利润占比首次过半,成为集团主要利润支柱。在截至2026年3月的财年,该业务营业利润预计大增32%至270亿日元,占比达55%。其核心产品包括用于芯片制造的静电吸盘,良品率已从50%-60%提升至90%以上,营业利润率从五年前的9%跃升至超40%。激进投资基金Palliser Capital敦促TOTO加大对该业务的投资与披露,认为此举可能推动股价上涨55%。公司正将陶瓷技术延伸至芯粒集成等新领域,并与传统卫浴业务形成协同。

数据/训练行业动态
08:00
HuggingFace Daily Papers(社区热门论文)
50
通过协作式逐步多教师解码蒸馏长链式思维推理

为解决大模型推理成本高昂的问题,研究者提出了协作式多教师解码框架CoRD。该框架通过基于预测困惑度的评分和束搜索,引导多个异构大模型协同构建连贯的推理轨迹,解决了现有方法中教师间缺乏协作、推理冗余的问题。实验表明,CoRD能生成更高质量的推理数据,使学生模型以更少的监督信号达到接近教师模型的性能,且效率开销小。该方法在跨领域和开放性任务中泛化能力良好,相关数据集和模型已开源。

arXiv推理数据/训练论文/研究
08:00
HuggingFace Daily Papers(社区热门论文)
49
InfoLaw:面向大语言模型的信息缩放定律--基于质量加权混合数据与重复训练

针对大语言模型预训练中数据配方选择难题,研究团队提出信息缩放定律(InfoLaw)。该框架将预训练建模为信息积累过程,其中数据质量决定信息密度,数据重复则带来收益递减。InfoLaw 能依据消耗的令牌数、模型规模、数据混合权重和重复程度预测损失,在未见过的数据配方及更大规模训练(最高达7B参数、425B令牌)上实现了平均0.15%、最大0.96%的损失绝对误差。其可靠的外推能力支持在不同计算预算下高效优化数据配方选择。

数据/训练论文/研究
08:00
HuggingFace Daily Papers(社区热门论文)
66
TTS-STT飞轮系统:合成实体密集音频弥补印度语言ASR在细分领域的性能差距

针对数字、地址、品牌名等细分领域的印度语言自动语音识别,现有开源与商业系统表现不佳。研究通过构建自循环的TTS-STT飞轮系统,以低成本合成了约2.2万条印英混合的实体密集语音数据。基于此数据对开源模型进行LoRA微调后,在泰卢固语测试集上的实体命中率提升至0.473,较最佳开源模型提升17倍,较商业系统提升3倍,同时在通用数据集上的词错误率仅小幅增加。该方法在印地语和泰米尔语上也验证有效,并确认了合成数据向真实语音的迁移能力。全部代码、测试集与语料库均已开源。

arXivGitHub数据/训练论文/研究
08:00
HuggingFace Daily Papers(社区热门论文)
55
基于编排轨迹的LLM多智能体系统强化学习研究

本文通过“编排轨迹”研究LLM多智能体系统的强化学习,聚焦工作生成、委派、通信、聚合与终止等协同过程。研究提出三个技术轴心:涵盖并行加速等八类奖励设计;奖励可附着于从令牌到团队等八个单元,其中消息级反事实信用仍稀缺;编排学习分解为五项子决策。截至2026年5月4日,文献中尚未发现针对终止决策的显式强化学习方法。研究关联了学术方法与工业实践,指出公开部署规模与学术评估体系间存在差距,并开源了相关资源。

智能体GitHub数据/训练论文/研究
5月3日
22:13
IT之家(RSS)
57
马斯克 xAI 坐拥 55 万张英伟达 GPU 但算力利用率仅 11%,Meta 和谷歌可达 43~46%

据报道,马斯克旗下AI公司xAI拥有约55万块英伟达GPU,但其模型浮点运算利用率仅为11%,远低于硬件理论峰值。xAI总裁承认该数字“低得尴尬”,并设定了在未来几个月内将利用率提升至50%的目标。作为对比,Meta和谷歌的利用率分别约为43%和46%。利用率低的主要原因是软件优化滞后、训练间歇性以及企业因供应短缺而囤积硬件。xAI计划通过优化软件、探索GPU租赁服务以及推进自研AI芯片项目来改善现状。

xAI数据/训练行业动态
16:51
The Decoder:AI News(RSS)
44
MIT研究解释为何扩展语言模型能如此可靠地提升性能

MIT研究人员通过“叠加”现象为语言模型性能随规模扩大而可靠提升提供了机制性解释。研究表明,随着模型参数增加,神经网络能在同一神经元中高效编码更多概念,这种叠加效应使得模型能力呈现可预测的线性增长。该发现从数学层面解释了为何扩大GPT、Claude等模型规模能持续改善其理解和生成能力。

数据/训练现象/趋势
5月2日
08:00
HuggingFace Daily Papers(社区热门论文)
51
TT4D:基于单目视频的乒乓球4D重建流程与数据集

TT4D是一个大规模高保真乒乓球数据集,包含超过140小时从单目转播视频重建的单打与双打比赛数据,提供高质量相机标定、精确3D球位、球旋转、时间分割以及随时间变化的3D人体网格等多模态标注。该数据集通过新颖的重建流程实现规模与精度的结合:传统方法依赖2D球轨进行时间分割,易受遮挡和多视角影响;TT4D则首先通过学习的提升网络将未分割的2D球轨全程提升至3D,再基于3D轨迹可靠分割时间,并能推断球旋转、处理漏检,在高遮挡情况下成功重建轨迹。该流程是目前唯一能从通用视角单目转播视频重建乒乓球比赛的方法。数据集已应用于球拍击球姿态速度估计、竞技对抗回合生成模型训练等下游任务。

数据/训练视频论文/研究
03:10
Tomer Tunguz 博客(VC 分析)
精选57
本周的积极信号:AI在医疗、教育、农业与科研领域的突破性进展

近期多项进展展现了AI的巨大积极影响。医疗领域,Mayo Clinic的AI能通过常规CT提前最多三年检测胰腺癌,强生利用AI将新药线索生成时间减半。教育方面,哈佛研究显示AI导师使学生学习效果翻倍,泰国培训16万名教师惠及330万学生。农业上,AI能以约88%准确率预测害虫爆发。科研中,AI快速筛查NASA数据,新发现超一万颗系外行星候选。此外,香港推出AI洪水预报系统,Atlassian和Twilio等公司也因AI驱动业绩增长并上调预期。这些案例平衡了AI风险,凸显其创新潜力。

多模态数据/训练现象/趋势

推荐理由:Tomer 收集了最近两周 AI 在医学、教育、农业的硬核落地案例,对反 AI 恐慌是一剂清醒剂,SaaS 公司的营收也说明行业在回暖。
5月1日
22:18
The Decoder:AI News(RSS)
38
ChatGPT 的哥布林痴迷或许滑稽,却揭示了 AI 训练的深层问题

ChatGPT 模型因训练中的错误奖励信号,开始以惊人频率在回答中插入哥布林、小妖精等神话生物。OpenAI 指出,这暴露了 AI 训练的一个核心隐患:即使微小的、调优不当的训练激励也可能产生不可预见的副作用。该现象强调了优化奖励机制在机器学习中的重要性,以避免模型输出出现类似偏差。

OpenAI数据/训练现象/趋势
22:11
IT之家(RSS)
57
马斯克承认:xAI 曾使用 OpenAI 模型来"蒸馏"Grok

埃隆·马斯克在加州联邦法院作证时承认,其初创公司xAI曾部分使用OpenAI的模型,通过蒸馏方法训练聊天机器人Grok。蒸馏是行业常见做法,让大模型充当“老师”训练小模型,以压缩研发成本。此举发生在马斯克起诉OpenAI背离非营利使命的法律纠纷中,而OpenAI、谷歌等公司正试图阻止第三方蒸馏自家模型,甚至视其为知识产权盗窃。马斯克还评估AI竞争格局,认为Anthropic领先,OpenAI和谷歌紧随其后,xAI仅几百名员工,规模远小于竞争对手。

OpenAIxAI数据/训练行业动态
21:15
HuggingFace Daily Papers(社区热门论文)
42
Instruction-Guided Poetry Generation in Arabic and Its Dialects

研究团队针对阿拉伯语诗歌创作,构建了一个大规模、高质量的指令数据集,涵盖现代标准阿拉伯语及多种方言。该数据集支持根据风格、韵律等预设条件进行诗歌写作、修订、续写以及诗歌分析任务。通过在大型语言模型上微调该数据集,实验表明模型能有效生成符合用户要求的诗歌,这一结果已通过自动评估和阿拉伯语母语者的人工评估得到验证。相关数据和代码已开源。

数据/训练论文/研究
15:11
IT之家(RSS)
61
目标内存速率 12800 MT/s,固态技术协会 JEDEC 宣布 DDR5 MRDIMM 关键进展

固态技术协会(JEDEC)宣布了DDR5 MRDIMM标准的多项关键进展。其正式发布了JESD82-552标准(DDR5 MDB02数据缓冲器),并预告将推出JESD82-542标准(DDR5 MRCD02寄存时钟驱动器),以通过多路复用秩技术提升内存带宽,解决传统DIMM的瓶颈。此外,委员会正开发目标速率达12800 MT/s的Gen 2 DDR5 MRDIMM原卡设计,Gen 2模块标准接近完成,并已启动Gen 3标准的开发工作,旨在满足AI与云计算对极高内存带宽的需求。

数据/训练行业动态部署/工程
15:11
IT之家(RSS)
57
扎克伯格致 Meta 员工:公司追踪电脑操作,是因为你们比外包普通员工聪明

Meta公司CEO扎克伯格在全员会议上解释,公司通过内部系统追踪员工的鼠标移动、击键等电脑操作,旨在利用这些数据训练AI模型,以在AI竞争中取得优势。他声称Meta员工平均智力高于外包普通员工,因此其操作数据更具价值。该计划名为“智能体转型加速器”,员工无法选择退出,引发了关于员工正无偿训练可能取代自身岗位的AI、以及职场信任与同意权的争议。Meta声明数据仅用于模型训练,并设有安全保护措施。

Meta数据/训练行业动态
14:11
IT之家(RSS)
46
韩投称 AI 企业已锁定长期内存订单:即便市场短缺缓解,价格仍维持高位

韩国投资证券研报指出,即便内存芯片短缺问题缓解,其价格短期内也不会显著下降。AI超大规模企业已锁定长期内存产能订单,这将延长当前的内存超级周期,预计价格在未来一段时间内持续高位运行。扩大内存容量可提升GPU利用率,降低单个Token处理成本,因此AI公司愿意高价采购。目前DRAM价格同比已涨3倍,但GPU效率提升带来的回报更高。同时,HBM和DRAM的产能紧张意外推高了NAND芯片需求,其价格优势在高压需求下保持了市场弹性。

推理数据/训练行业动态
11:14
HuggingFace Daily Papers(社区热门论文)
55
World2Minecraft:占据驱动的仿真场景构建

具身智能需高保真仿真环境,但现有平台存在数据污染和灵活性限制。本研究提出World2Minecraft系统,基于3D语义占据预测将真实场景转换为结构化Minecraft环境,以支持视觉语言导航等任务。然而,重建质量受限于占据预测模型的数据稀缺和泛化能力不足。为此,团队开发了低成本、自动化数据采集流程,构建大规模定制化数据集MinecraftOcc,包含100,165张图像来自156个精细室内场景。实验表明,该数据集有效补充现有资源并对前沿方法构成显著挑战,提升了占据预测精度,同时凸显World2Minecraft作为可定制、可编辑平台对个性化具身AI研究的价值。

具身智能数据/训练论文/研究
10:14
HuggingFace Daily Papers(社区热门论文)
53
规模化合成计算机:用于长周期生产力模拟

研究团队提出“规模化合成计算机”方法,以创建包含真实文件夹层级与丰富文件内容(如文档、表格)的可扩展计算机环境。基于每个合成计算机,系统运行长周期模拟:一个代理设定符合用户身份、需耗时约一个月完成的多项专业任务目标;另一代理则扮演用户,通过导航文件系统、与模拟协作者协作、生成专业文件等方式持续工作直至目标达成。初步实验中,团队创建了1000个合成计算机并运行模拟,每次模拟平均需超过8小时代理运行时间、跨越2000多个回合。模拟产生的丰富经验学习信号显著提升了代理在生产力评估中的表现,该方法有望扩展至数百万甚至数十亿合成用户世界,为长周期生产力场景中的智能体自我改进与强化学习提供基础。

智能体数据/训练论文/研究
‹ 上一页
1…2021222324…31
下一页 ›