全部 AI 动态 · AI HOT

内容

精选全部 AI 动态 AI 日报主题收藏

接入

更多

关于更新日志反馈

内部员工登录

精选全部日报更多

内部员工登录

全部动态

全部一手资讯 X 论文

标签「数据/训练」清除

今天7月3日周五

05:08Apple Machine Learning Research（RSS）31反因果域泛化：利用无标签数据

05:08Apple Machine Learning Research（RSS）46学习扩散语言模型的去掩码策略

04:03Krea33Krea AI用Tinker原型奖励模型并进行RL训练

03:21Simon Willison 博客65使用 DSPy 评估和优化 Datasette Agent 的 SQL 系统提示词

02:44Hacker News 热门（buzzing.cc 中文翻译）68单层Transformer即可匹配全参数强化学习训练：Qwen3/Qwen2.5等模型研究

01:08Apple Machine Learning Research（RSS）46通过可追踪轨迹控制学习结构化推理

01:08Apple Machine Learning Research（RSS）38MemoryLLM：可插拔可解释的Transformer前馈记忆

01:08Apple Machine Learning Research（RSS）56精选VideoFlexTok：可变长度粗到细视频分词

7月2日周四

23:10Ars Technica：AI（RSS）57马斯克的X对美国人隐私构成严重风险，倡导组织警告FTC

17:31HuggingFace Daily Papers（社区热门论文）49图原生强化学习通过概念重组实现可追溯的科学假设生成

17:06MarkTechPost（RSS）72精选Google Health API 推出 CLI：ghealth 是一款针对 Fitbit 数据的开源工具

12:28HuggingFace Daily Papers（社区热门论文）53状态预测分离假说：双计算流Transformer变体提升语言建模效率

12:04IT之家（RSS）61Cloudflare 细化爬虫屏蔽管理，2026 年将默认禁止 AI 代理与训练爬虫访问广告页面

11:28HuggingFace Daily Papers（社区热门论文）41CausalMix：将数据混合优化重构为因果推断问题

10:35Rohan Paul55加州AI失业追踪器：高学历暴露岗位申请升20%

10:28HuggingFace Daily Papers（社区热门论文）46DiscoPER：基于迭代元反思的自主科学发现框架

10:28HuggingFace Daily Papers（社区热门论文）39ABot-M0.5：统一的移动与操作世界动作模型

06:34Rohan Paul46AI基础模型竞赛转向架构创新：Transformer vs 后Transformer

05:34MarkTechPost（RSS）69使用 Lift 将研究 PDF 转换为结构化 JSON：受控的、模式引导的字段级评估

04:35Nathan Lambert43Nathan Lambert 发布 RL 推导修正 Q&A 视频

04:07elvis46DAIR.AI创始人Elvis Saravia：微调革命前夜，PorTAL解决基座过时困境

03:59Ethan Mollick54AI未来讨论：公司各说各话

03:28HuggingFace Daily Papers（社区热门论文）35TRIAGE：智能体强化学习的角色类型化信用分配框架

02:02TechCrunch：AI（RSS）72同事件精选Cloudflare新政策：默认屏蔽混合爬虫，推动AI公司付费同一事件，精选展示《Cloudflare 推出全新AI流量管理选项：区分搜索、智能体与训练爬虫，保护广告页面》

01:39Meta Engineering Blog（RSS）71精选Meta 大规模 AI 存储蓝图

01:03Rohan Paul53Ivo Benchmarks：AI将合同谈判史转为实时指导

00:07AK49LiteResearcher：可扩展深度研究智能体RL训练框架

7月1日周三

23:36Deedy69Thinking Machines Tinker ARR数亿美元

23:27Epoch AI28Epoch AI新增13项评测基准，7项纳入ECI

23:03IT之家（RSS）57OpenAI 推出 GeneBench-Pro 基准测试，评估 AI 模型生物学计算能力

22:28HuggingFace Daily Papers（社区热门论文）39Goku：面向指令视频编辑的百万级通用数据集与基准

18:03IT之家（RSS）57施耐德电气31亿美元收购工业AI公司Cognite

16:02MarkTechPost（RSS）69Google Research 推出 TabFM：面向表格数据的零样本分类与回归基座模型

15:03IT之家（RSS）59美国能源部长赖特：公众对数据中心的担忧合理但被夸大

14:28HuggingFace Daily Papers（社区热门论文）62基于元认知反馈的强化学习实现大语言模型忠实不确定性表达

14:28HuggingFace Daily Papers（社区热门论文）40多块扩散语言模型

13:28HuggingFace Daily Papers（社区热门论文）49TerraDiT-Ω：基于任意地理空间基元的卫星图像合成统一空间控制框架

12:21向阳乔木61美团发布并开源LongCat-2.0万亿参数MoE大模型

09:08Hacker News 热门（buzzing.cc 中文翻译）68Meta AI 发布 Brain2Qwerty v2：无需手术的脑电波解码系统

07:32Nathan Lambert48RLHF Book代码库新增on-policy自蒸馏示例

全部 AI 动态

AI 相关资讯全量信息流

全部一手信源资讯推文

全部模型产品行业论文技巧

7月3日

05:08

Apple Machine Learning Research（RSS）

31

反因果域泛化：利用无标签数据

针对目标环境分布偏移下的域泛化问题，在反因果设定中（结果变量导致观测协变量），环境扰动不影响结果变量，因此可通过正则化模型对这些扰动的敏感性来提升鲁棒性。估计扰动方向无需标签，从而能利用多环境中的无标签数据。提出两种方法，分别惩罚模型在环境间协变量均值和协方差的变化，并证明其在特定环境类下具有最坏情况最优性。在受控物理系统和生理信号数据集上验证了方法的有效性。

数据/训练论文/研究

05:08

Apple Machine Learning Research（RSS）

46

学习扩散语言模型的去掩码策略

研究人员提出使用强化学习训练扩散语言模型（dLLM）的采样策略。该方法将掩码扩散采样形式化为马尔可夫决策过程，以 dLLM 为环境，采用单层 Transformer 策略网络将 token 置信度映射为去掩码决策。实验表明，在半自回归（块）生成中，该策略匹配了最先进的启发式方法，在全扩散设置中则超越后者。

数据/训练论文/研究

04:03

Krea@krea_ai

33

感谢Thinking Machines团队，我们使用Tinker原型化了我们的奖励模型，并通过RL训练了提示词扩展器。更多信息，请阅读关于Krea 2背后数据、架构和训练的完整技术报告 👇

Tinker: Training image models requires a surprising amount of Tinkering: prototyping reward models, training a prompt expander, ...

图像生成数据/训练论文/研究

03:21

Simon Willison 博客

65

使用 DSPy 评估和优化 Datasette Agent 的 SQL 系统提示词

Simon Willison 通过 Claude Code 中的异步研究任务（基于 Claude Fable 5）尝试用 DSPy 对 Datasette Agent 执行只读 SQL 查询时的系统提示词做评估与优化。Fable 选择测试 GPT 4.1 mini 和 nano，发现改进方向：模式列表仅给出表名，而“如果已有信息不要调用 describe_table”的建议导致列名猜测和错误重试循环。建议在提示词的模式列表中包含列名或软化该建议。

智能体教程/实践数据/训练

02:44

Hacker News 热门（buzzing.cc 中文翻译）

68

单层Transformer即可匹配全参数强化学习训练：Qwen3/Qwen2.5等模型研究

研究发现，训练单个Transformer层即可恢复甚至超越全参数强化学习（RL）后训练带来的收益。研究引入“层贡献度”量化指标，在Qwen3和Qwen2.5两个模型家族的七个模型上，使用GRPO、GiGPO、Dr. GRPO三种RL算法，覆盖数学推理、代码生成和智能体决策任务，发现RL收益高度集中于少数Transformer层，且高贡献层集中在堆栈中间，两端层贡献显著较小。

arXiv 数据/训练论文/研究

01:08

Apple Machine Learning Research（RSS）

46

通过可追踪轨迹控制学习结构化推理

大语言模型可涌现推理行为，但复杂推理轨迹在无约束采样中稀疏，标准强化学习难以保证多样性。Ctrl-R框架通过可追踪轨迹控制主动引导rollout，激励探索多样推理模式，并利用重要性采样实现无偏on-policy优化，引入重要性采样权重的幂缩放因子以选择性学习分布外轨迹。实验表明，Ctrl-R在语言和视觉-语言模型的数学推理任务上均取得一致改进。

推理数据/训练论文/研究

01:08

Apple Machine Learning Research（RSS）

38

MemoryLLM：可插拔可解释的Transformer前馈记忆

MemoryLLM将Transformer中的前馈模块（FFN）与自注意力解耦，使其作为无上下文的token级神经检索记忆运行。训练时FFN与自注意力隔离，直接使用token嵌入，从而可预计算为token级查找（ToL），实现VRAM与存储间的按需传输，提升推理效率。此外还提出了介于传统Transformer与MemoryLLM之间的Flex-MemoryLLM架构，以弥补因使用无上下文token嵌入训练FFN导致的性能差距。

数据/训练论文/研究

01:08

Apple Machine Learning Research（RSS）

精选56

VideoFlexTok：可变长度粗到细视频分词

VideoFlexTok提出一种可变长度token序列的视频表示方法，采用粗到细结构——首个token捕捉语义和运动等抽象信息，后续token添加精细细节，生成流解码器支持任意token数量的视频重建。相比传统3D网格分词，该结构允许根据下游需求调整token数，在相同预算下编码更长视频。在类别和文本到视频生成任务中，VideoFlexTok以1.1B参数（5.2B的1/5）达到可比生成质量（gFVD和ViCLIP Score）。训练一个处理10秒81帧视频的文本到视频模型仅需672个token，比同等3D网格分词器少8倍。

数据/训练视频论文/研究

推荐理由：把视频 tokenization 从固定网格改成变长 coarse-to-fine，训练效率提升明显，还能做更长的视频。研究角度挺漂亮，但离产品落地还有距离，做视频生成的可以追一下。

7月2日

23:10

Ars Technica：AI（RSS）

57

马斯克的X对美国人隐私构成严重风险，倡导组织警告FTC

7月2日公众评论截止前，15个隐私与消费者保护组织联名致信FTC，要求拒绝X终止数据处理审计的请求。X主张因公司更名及已在欧盟GDPR下承担类似义务而终止。该命令源于Twitter时期将双重认证提交的联系信息用于广告定向。目前X需接受昂贵独立审计，FTC有权直接调取文件。倡导者警告，放任X逃脱监督将对美国人隐私构成严重风险。

政策/监管数据/训练

17:31

HuggingFace Daily Papers（社区热门论文）

49

图原生强化学习通过概念重组实现可追溯的科学假设生成

研究团队开发 Graph-PRefLexOR，一组图原生推理模型，用 GRPO 微调，将推理组织为机制探索、图构建、模式提取和假设合成等显式阶段。在材料科学与力学的 100 个开放式问题上，相较基础模型提升 40–65%，最大增益来自推理可追溯性。嵌入分析显示语义多样性约为基线 2–3 倍；层间隐藏状态分析表明结构化推理与最终答案对齐更强。测试时图扩展表明，额外算力主要增加有限语义空间内的长距离概念重组。

arXiv 推理数据/训练论文/研究

17:06

MarkTechPost（RSS）

精选72

Google Health API 推出 CLI：ghealth 是一款针对 Fitbit 数据的开源工具

ghealth 是一款封装 Google Health API v4 的开源命令行工具，以单个 Go 二进制文件发布（Apache 2.0 协议）。它提供 40 种已验证的数据类型（包括步数、心率、睡眠、体重、血氧饱和度、心率变异性等）的结构化 JSON 输出。工具采用 Agent 优先设计，具备确定性退出码、--dry-run 和 --raw 标志，并附带两个 SKILL.md 文件供 AI 智能体使用。用户需自行创建 OAuth 凭据，通过 PKCE S256 认证。数据来源覆盖 Fitbit、Pixel Watch 及连接的第三方设备。

Google MCP/工具开源/仓库数据/训练

推荐理由：把 Google Health API 封装成终端和 AI 代理友好的 CLI，一次性解决了认证、JSON 输出和分页这些烦人细节，想用 Fitbit 数据做健康分析或喂给代理的人可以直接上手，但它的影响仅限于个人健康数据爱好者这个小圈层。

12:28

HuggingFace Daily Papers（社区热门论文）

53

状态预测分离假说：双计算流Transformer变体提升语言建模效率

Transformer使用同一前向计算流同时预测下一个token和存储用于未来预测的状态。为解耦这两个角色，作者提出状态预测分离假说，并设计了一种采用双计算流的Transformer变体。不同规模下的预训练实验表明，该方法在数据和计算效率上持续优于标准Transformer，验证损失更低，下游任务平均性能提升2-3个百分点。进一步的实证分析排除了潜在混淆因素，揭示了新设计在梯度上的根本差异。

数据/训练论文/研究

12:04

IT之家（RSS）

61

Cloudflare 细化爬虫屏蔽管理，2026 年将默认禁止 AI 代理与训练爬虫访问广告页面

Cloudflare 7 月 1 日宣布细化网络爬虫屏蔽管理，为爬虫机器人赋予搜索、代理、训练等标签，计划在 2026 年 9 月 15 日默认禁止 AI 代理与训练爬虫访问含广告的网页。爬虫管理器会为混合型爬虫匹配所有行为模式，只要一种行为被网页所有者禁止，该多任务爬虫就无法在该网站爬取。Cloudflare 还将推出新版归因业务洞察仪表板，适配 SEO 到 GEO 再到 AEO 的变迁，提供页面变动监控以避免重复抓取，并推出按使用计价的抓取付费模式。

产品更新数据/训练

11:28

HuggingFace Daily Papers（社区热门论文）

41

CausalMix：将数据混合优化重构为因果推断问题

CausalMix将大语言模型训练中的数据混合优化重构为因果推断问题，将数据池统计特征作为协变量、领域混合作为处理变量，在512次Qwen2.5-0.5B运行上拟合因果模型估计条件平均处理效应（CATE），外推出800K数据池的最优混合比例并用于训练7B模型。该框架还能泛化至Qwen3-4B-Base的长链式推理数据。通过因果建模隔离混杂偏差，CausalMix动态推断状态依赖的最优数据混合，在多个下游任务上优于RegMix等基线，并借助CATE解释器提供可视化分析。

arXiv 数据/训练论文/研究

10:35

Rohan Paul@rohanpaul_ai

55

加州AI失业追踪器：高学历暴露岗位申请升20%

加州首个AI失业追踪器研究发现，在LLM可承担主要任务份额的暴露岗位中，高学历人群的失业救济申请上升20%。湾区高暴露岗位申请增长超50%，且持续高于全州水平。信息与专业服务及金融行业承受压力最大。但研究者von Wachter指出，全州范围内并未出现大规模裁员潮。白领岗位风险真实存在，但影响集中在大学毕业生、湾区和科技行业，并非均匀分布。

数据/训练现象/趋势

10:28

HuggingFace Daily Papers（社区热门论文）

46

DiscoPER：基于迭代元反思的自主科学发现框架

DiscoPER 是一个大语言模型驱动的自主科学发现框架。它无需预设研究目标，动态生成代码探索数据集，且每个发现必须通过统计检验。框架引入二阶元反思机制，周期性分析自身已有发现，识别结构模式、混淆和认知空白，主动将假设探索重定向到未知区域。结合工具使用，可处理多模态来源（如图像）的信息。在 iNatDisco 生态基准上，DiscoPER 恢复 8/9 已知模式，假设支持率 72.7%，优于经典因果发现与 LLM 引导基线。消融实验证实随数据规模扩展及二阶元反思的收益。

多模态数据/训练论文/研究

10:28

HuggingFace Daily Papers（社区热门论文）

39

ABot-M0.5：统一的移动与操作世界动作模型

ABot-M0.5 是一种面向机器人移动操作的新型 World Action Model（WAM）。它从三个层面解决现有 WAM 的对齐问题：时间粒度对齐通过引入中间潜在动作捕捉局部视觉状态转换，作为视频潜在与具身控制之间的桥接；动作空间对齐采用双级 Mixture-of-Transformers 架构，解耦模态表示与异构动作子空间（如底座移动与机械臂操作）；推理条件对齐提出 dream-forcing 训练策略，在模型预测视频上逐步训练逆动力学，提升自回归推理时的对齐与鲁棒性。在移动与精细操作基准上，ABot-M0.5 在长程任务成功率与细粒度控制精度上均达到当前最优。

具身智能数据/训练论文/研究

06:34

Rohan Paul@rohanpaul_ai

46

AI基础模型竞赛转向架构创新：Transformer vs 后Transformer

AI基础模型竞赛焦点从“谁有最大模型”转向“哪种架构能超越Transformer”。核心分界线是继续扩展Transformer还是转入后Transformer阵营。两大维度：范围（通用vs领域模型）和架构（Transformer vs后Transformer）。Transformer仍主导，但注意力机制随上下文增长成本激增，而实际产品需要长记忆、低延迟、持续交互。前沿实验室不再只问谁能训练最大模型，而是追问智能是否需要不同的运行节奏。这场架构之争将在未来2年定义行业格局。

数据/训练现象/趋势

05:34

MarkTechPost（RSS）

69

使用 Lift 将研究 PDF 转换为结构化 JSON：受控的、模式引导的字段级评估

Lift 是一个 PDF 到结构化数据的提取工具，本教程构建了完整的受控评估工作流。通过 4-bit NF4 量化，约 10B 参数模型可在 16 GB GPU（如 T4/L4）上运行。教程生成含干扰项的合成多页研究论文，测试模型在真实文档布局中恢复标题、作者、数据集、指标、超参数、局限性和仓库链接的能力，并输出结构化 JSON，实现模式引导的字段级评估。

开源生态教程/实践数据/训练

04:35

Nathan Lambert@natolambert

43

我在课程中陆续制作 Q&A 视频。这是下一期，涵盖 on-policy 蒸馏和奖励模型推导中的细微修正、做这类数学时常见的符号陷阱，以及更多深入资料（例如 @johnschulman2 的 KL 估计博客）。 Q&A 2 来了！ 00：00 推导修正 06：10 代码示例与额外资源 08：08 更多 RL 符号与注释继续在 YouTube、GitHub 和 Discord 上发送问题吧。我和 Phoebe 都很喜欢这些问题。

安全/对齐教程/实践数据/训练

04:07

elvis@omarsar0

46

DAIR.AI 创始人 Elvis Saravia 认为微调问题仍未被充分探索，当前正处于微调革命前夜，智能体微调将大幅改变 AI 格局。@rahulgs 进一步指出，微调或 RL 定制模型本质上是对模型进步的押注，在开源发布速度极快的当下，容易导致基座模型迅速过时（如 Kimi 2.6 仅数月就已落后）。为此他们推出 PorTAL，允许快速切换基座模型，将已学到的任务特定行为无缝迁移到新模型上，从而摆脱基座过时的困境。

rahul: In many ways, finetuning or RLing a custom model is a bet against model progress and scaling. It's to choose to say "we ...

产品更新数据/训练

03:59

Ethan Mollick@emollick

54

这里关于AI未来的讨论有时过于轻信公司愿景。人们往往推销自己所拥有的。三大AI实验室会说更大的模型是未来。其他所有公司只有小模型可卖，所以他们会告诉你小模型是未来。

大佬观点数据/训练

03:28

HuggingFace Daily Papers（社区热门论文）

35

TRIAGE：智能体强化学习的角色类型化信用分配框架

TRIAGE 提出角色类型化信用分配框架，替代标准 GRPO 的均匀优势信号。结构化判断器将每个智能体片段分类为决定性进展、有用探索、无进展基础设施或回归，并映射为固定角色条件规则下的过程奖励，修正纯结果信用对失败轨迹中有用探索的惩罚和对成功轨迹中冗余/倒退动作的强化。在 ALFWorld、Search-QA 和 WebShop 上，TRIAGE 提升成功率，优于标量判断器过程奖励和结果监督共享主干价值基线。消融实验表明收益来自角色类型化，成功轨迹内的回归检测是主要贡献，探索信用提供二次增益；在完整轨迹上，TRIAGE 分别减少 10.4% 和 14.8% 的环境交互轮数。

智能体数据/训练论文/研究

02:02

TechCrunch：AI（RSS）

同事件精选72

Cloudflare新政策：默认屏蔽混合爬虫，推动AI公司付费

Cloudflare宣布，自2026年9月15日起，其默认设置将屏蔽同时用于搜索、AI智能体及训练的“混合用途”爬虫访问托管广告的页面，除非站点所有者手动调整。此举旨在保护出版商内容不被无偿使用。同时将原有的“Pay Per Crawl”模式升级为“Pay Per Use”，允许出版商在内容创造价值时向AI公司收费，初期合作方为Ceramic.ai和You.com。Cloudflare数据显示，AI爬虫超过50%的抓取流量浪费在重复获取未变更页面上。新政策适用于新客户、现有客户的新站点及所有现有免费客户。

搜索数据/训练行业动态

同一事件，精选展示《Cloudflare 推出全新AI流量管理选项：区分搜索、智能体与训练爬虫，保护广告页面》

推荐理由：Cloudflare用基础设施商的话语权重新划定了AI内容付费线，默认屏蔽混合爬虫这一刀切下去，从Google到创业公司都躲不开，出版商到底该分多少钱的讨论终于有了一个落地的支点。

01:39

Meta Engineering Blog（RSS）

精选71

Meta 大规模 AI 存储蓝图

Meta 运营数百 EB 级存储集群，基于 Tectonic 分层存储层构建 BLOB 存储架构，以应对两大挑战：最大化 GPU 利用率与研究迭代速度。传统 BLOB 架构的多层元数据查询可导致数百毫秒延迟，使 GPU 因 I/O 等待停顿。新架构将训练栈逐步迁移到 BLOB 存储接口上，利用闪存提供可预测的低 pMax 延迟，避免单 GPU 慢速拖慢整批任务。同时，统一的数据湖访问支持地理分布 GPU 间的数据高速注入与跨区移动，提升研究效率。

Meta 数据/训练现象/趋势部署/工程

推荐理由：Meta的存储架构复盘给出了一条明确路径，从重写元数据到分层缓存，他们把GPU利用率和研究者迭代速度同时提升了一个档次，做AI训练平台的值得细读。

01:03

Rohan Paul@rohanpaul_ai

53

Ivo Benchmarks：AI将合同谈判史转为实时指导

Ivo Benchmarks 正式发布，利用公司全部合同谈判历史来审查和修订协议。它将资深律师的私人判断（如不接受某赔偿条款、更短的续约窗口通常可行）转化为文档化的机构记忆，通过对比当前条款与公司过往实际立场，在律师审阅时提供实时指导。该工具由 Ivo 团队与全球领先企业合作开发，解决企业拥有数百万份合同却缺乏反馈循环的痛点。

Min-Kyu Jung: Introducing Ivo Benchmarks. Benchmarks reviews and redlines agreements by drawing upon your company's entire history of ...

产品更新数据/训练

00:07

AK@_akhaliq

49

LiteResearcher 用于深度研究智能体的可扩展智能体RL训练框架

智能体数据/训练论文/研究

7月1日

23:36

Deedy@deedydas

69

"Thinking Machines 的 Tinker 做到了数亿美元的 ARR"--Dylan Patel 在他的最新播客中说道 TML 估值 120 亿美元，正尝试以 500 亿美元估值融资。Tinker 是一个帮助你对大语言模型进行后训练的 API。这是目前约 75 家新实验室中已知的最高营收。

数据/训练行业动态

23:27

Epoch AI@EpochAIResearch

28

我们最近开始在评测中枢跟踪13项新基准。其中7项已被纳入Epoch能力指数（ECI）。

数据/训练评测/基准

23:03

IT之家（RSS）

57

OpenAI 推出 GeneBench-Pro 基准测试，评估 AI 模型生物学计算能力

OpenAI 发布 GeneBench-Pro 基准测试，评估 AI 模型在生物学计算中的真实研究能力。测试让模型面对模糊、不完整甚至带干扰的数据环境，自主完成数据探索、方法选择和策略修正。GeneBench-Pro 覆盖基因组学、定量生物学和转化医学等方向，共 129 道题，分布于 10 个大领域和 21 个子领域。为避免长流程评分偏差，OpenAI 采用合成数据构建题目。目前已在 Hugging Face 开源 10 道示例题并提供交互界面，后续将开放 50 道题给 Artificial Analysis 进行第三方独立评测。

OpenAI 数据/训练评测/基准

22:28

HuggingFace Daily Papers（社区热门论文）

39

Goku：面向指令视频编辑的百万级通用数据集与基准

Goku是一个包含200万高质量视频编辑对的百万级数据集，首次将基于指令的视频编辑从单一外观扩展至多任务和结构操控（如主体运动控制）。研究者设计了分解式数据合成流水线与渐进式过滤系统以解决复杂编辑的数据合成难题。基于该数据集训练的Goku-Edit模型采用MLLM作为文本编码器，并采用解耦双分支架构：专用掩码分支处理结构控制，主分支负责外观渲染。配套基准Goku-Bench包含1000个人工验证测试用例和7项新增编辑指标，Goku-Edit的指令遵循能力较其他开源模型提升高达+8%。

数据/训练论文/研究

18:03

IT之家（RSS）

57

施耐德电气31亿美元收购工业AI公司Cognite

施耐德电气宣布以31亿美元全现金收购工业AI软件公司Cognite。Cognite成立于2016年，核心产品为工业数据平台Cognite Data Fusion，2025年营收超1.7亿美元，全球员工约800人。交易完成后Cognite将并入施耐德旗下工业软件业务单元AVEVA，旨在整合工业数据平台与AVEVA软件组合，增强工业人工智能和数据管理能力，预计未来几个季度内完成。

数据/训练行业动态

16:02

MarkTechPost（RSS）

69

Google Research 推出 TabFM：面向表格数据的零样本分类与回归基座模型

Google Research 发布 TabFM v1.0.0，一种面向表格数据的零样本基座模型，无需针对特定数据集训练、调参或特征工程即可进行分类和回归。TabFM 将整个数据集作为统一提示，通过上下文学习在单次前向传播中生成预测。其架构融合 TabPFN 风格的行/列交替注意力与 TabICL 风格的行压缩和上下文学习。模型在数亿个由结构因果模型动态生成的合成数据集上训练。在 TabArena 基准（38 个分类、13 个回归数据集，样本量 700 至 15 万）上，TabFM 及添加交叉特征和 SVD 特征、采用 32 路集成的 TabFM-Ensemble 均优于经过深度调优的监督算法。模型已开源在 Hugging Face 和 GitHub，Google BigQuery 即将通过 AI.PREDICT SQL 命令集成。

Google 开源生态数据/训练模型发布

15:03

IT之家（RSS）

59

美国能源部长赖特：公众对数据中心的担忧合理但被夸大

美国能源部长克里斯·赖特称公众对数据中心的担忧并非毫无根据，但程度被“夸大”。他呼吁支持者积极反驳反对声音，称数据中心好处远大于坏处，可降低电力成本，用水量相比创造价值“微不足道”。盖洛普5月调查显示，1000名受访者中七成反对在居住区建设AI数据中心，近一半“强烈反对”。截至去年底，美国已建成或获批超1400座数据中心，其水资源消耗、柴油发电机致空气质量问题及所有权缺乏透明度引发争议。

政策/监管数据/训练行业动态

14:28

HuggingFace Daily Papers（社区热门论文）

62

基于元认知反馈的强化学习实现大语言模型忠实不确定性表达

大语言模型在元认知能力上存在系统性缺陷（高置信度幻觉、无法识别知识边界等）。研究者提出两种新机制：基于元认知反馈的强化学习（RLMF）——根据模型自我判断质量调整完成排名；以及元认知数据选择——利用自我判断识别高价值训练样本。应用于忠实校准任务，先校准模型置信度分数，再映射为自然语言不确定性。实验表明RLMF达到可泛化的SOTA性能，相较标准RL提升高达63%，同时增强模型评估自身能力边界的能力。

安全/对齐数据/训练论文/研究

14:28

HuggingFace Daily Papers（社区热门论文）

40

多块扩散语言模型

MBD-LMs通过多块教师强制（MultiTF）后训练块扩散语言模型（BD-LMs）得到。MultiTF结合教师强制与扩散强制，在干净前缀上训练有界噪声组，采用随机噪声调度器匹配多块扩散推理状态。基于Block Buffer的优化解码实现前缀缓存复用和输入形状静态化，将更高并行度转为实际加速。MBD-LLaDA2-Mini的TPF从3.47提升至6.19，准确率从79.95%提升至81.03%；结合DMax后TPF

推理数据/训练论文/研究

13:28

HuggingFace Daily Papers（社区热门论文）

49

TerraDiT-Ω：基于任意地理空间基元的卫星图像合成统一空间控制框架

TerraDiT-Ω是一个统一空间控制框架，可直接利用任意地理空间基元（多边形、折线、边界框、点）进行卫星图像生成。它联合使用精确和粗略标注，适应不同标注预算，适用于城市规划等设计任务。提出Geometry-Aware Local Attention机制，将几何线索注入注意力空间。在所有格式上优于密集和稀疏控制基线。该框架支持可控数据增强，提升土地覆盖分割、目标检测、道路图提取、场景分类等下游性能。代码、数据、权重已开源。

arXiv GitHub 图像生成数据/训练

12:21

向阳乔木@vista8

61

美团发布并开源LongCat-2.0万亿参数MoE大模型

美团发布并开源LongCat-2.0，1.6万亿总参数、480亿激活参数（3%）的MoE大模型。使用35万亿token训练，在5万片国产芯片上“全程无回滚”完成。引入LongCat稀疏注意力（LSA），包含流感知索引、跨层索引和层级化索引，解决长文本注意力瓶颈。采用5-gram N-gram Embedding增加135B参数，在不增加MoE专家竞争的情况下增强局部上下文理解。训练使用6D并行技术适配国产算力。计划2026年6月30日发布并开源。

开源生态推理教程/实践数据/训练

09:08

Hacker News 热门（buzzing.cc 中文翻译）

68

Meta AI 发布 Brain2Qwerty v2：无需手术的脑电波解码系统

Meta AI 推出 Brain2Qwerty v2，一种无需手术植入即可实时从脑电波解码句子的非侵入式系统。基于脑磁图（MEG）设备记录 9 名志愿者各 10 小时的打字脑活动，训练约 22,000 个句子，采用端到端深度学习并微调大语言模型。词准确率达 61%，最佳参与者达 78%，远超其他非侵入方法的 8%。解码精度随数据量对数线性提升，有望进一步缩小与手术方法的差距。Meta 已开源 v1 和 v2 训练代码，合作方 BCBL 开放 v1 数据集。

Meta 开源/仓库数据/训练论文/研究

07:32

Nathan Lambert@natolambert

48

很高兴宣布 @zafstojano -- 一位新增的维护者，他帮助我维护 RLHF Book 代码 -- 向代码库添加了一个简单的在线策略自蒸馏示例，可在一些玩具问题上运行。期待进一步探索，很高兴看到仓库不断完善！

安全/对齐开源/仓库数据/训练

‹ 上一页

12 3…42