全部 AI 动态 · AI HOT

内容

精选全部 AI 动态 AI 日报主题收藏

接入

更多

关于更新日志反馈

内部员工登录

精选全部日报更多

内部员工登录

全部动态

全部一手资讯 X 论文

标签「数据/训练」清除

5月31日周日

14:38HuggingFace Daily Papers（社区热门论文）55解耦残差去噪扩散模型实现统一高效图像到图像翻译

10:19MarkTechPost（RSS）60Trajectory 发布面向持续学习的并发多 LoRA 训练栈，报告实验吞吐量提升 2.81 倍

09:44Hacker News 热门（buzzing.cc 中文翻译）73精选AI引发的职业焦虑：席卷科技从业者的心理危机

08:45meng shao46如何从 PDF 构建金融知识图谱？

08:00HuggingFace Daily Papers（社区热门论文）54测量对称性-数据交换率：等变先验的标度律实证

08:00HuggingFace Daily Papers（社区热门论文）55BenchEvolver：以解决方案为中心的进化式前沿任务合成

08:00HuggingFace Daily Papers（社区热门论文）62OmniOPD：基于推测验证的无需logits在线策略蒸馏

08:00HuggingFace Daily Papers（社区热门论文）55Trust Region On-Policy蒸馏方法（TrOPD）

08:00HuggingFace Daily Papers（社区热门论文）70精选τ_0-WM：用于机器人操控的统一视频-动作世界模型

08:00HuggingFace Daily Papers（社区热门论文）59HakushoBench：基于日本政府白皮书的图表与表格VQA基准测试发布

07:45ginobefun15Anthropic发布Claude 4.7 Sonnet与Opus模型

04:43Hacker News 热门（buzzing.cc 中文翻译）66安永发布了一份充满臆想的网络安全报告

04:17Rohan Paul76软银在法国投资750亿欧元建设欧洲最大AI算力设施

00:12Hacker News 热门（buzzing.cc 中文翻译）71精选随着成本飙升，美国企业开始对人工智能实施配给

5月30日周六

21:14The Decoder：AI News（RSS）54研究发现，训练使AI聊天机器人更有用，反而削弱了其模拟人类行为的能力

19:21IT之家（RSS）65Meta 通过追踪员工鼠标来训练 AI，或触犯欧盟隐私相关规定

15:46Rohan Paul47日本AI数据中心热潮正推动液冷技术普及

12:42歸藏(guizang.ai)20我在想藏师傅的这种东西是不是绝佳的前端训练数据可以造非常多【引用 @op7418】：http://x.com/i/article/2059811469081141248

12:41Hacker News 热门（buzzing.cc 中文翻译）48Shift将免费提供家政服务，以此培训未来的机器人

09:01Orange AI37Anthropic被指蒸馏Kimi与Qwen，传闻魔幻难辨真假

08:48MarkTechPost（RSS）67如何使用AgentTrove：在Python中流式处理1.7M智能体轨迹并构建干净的ShareGPT SFT数据集

08:00HuggingFace Daily Papers（社区热门论文）44SDR：基于集合距离的胸部X光报告生成奖励方法

08:00HuggingFace Daily Papers（社区热门论文）52半监督噪声自适应（SSNA）：从噪声领域迁移知识

08:00HuggingFace Daily Papers（社区热门论文）65针对Mixture-of-Experts模型的置信度自适应SwiGLU

07:48MarkTechPost（RSS）48NVIDIA 推出 X-Token：投影引导的跨Tokenizer知识蒸馏，在 Llama-3.2-1B 上平均分超越 GOLD +3.82

07:31Orange AI65AI能源风暴：是泡沫还是奇点？

06:16Rohan Paul68麦肯锡报告：AI技能在欧洲就业市场持续升温

04:48SemiAnalysis60AI"暗产出"：隐形产出的显性成本

01:45The Verge：AI（RSS）62科技公司迫切希望拍摄你做家务的画面

01:14Fei-Fei Li83精选GPIC：大规模视觉生成基准数据集发布

00:18Ars Technica：AI（RSS）51机器人训练初创公司将派戴摄像头的人上门清洁

5月29日周五

22:15Rohan Paul52在真实拳击场辩论：Transformer 架构与后继者的未来

20:15The Verge：AI（RSS）43这家 AI 创业公司将免费为你打扫房屋，以训练未来的机器人

18:21IT之家（RSS）46美初创公司 Shift 声称可以免费帮你打扫房屋，代价是全程录像以训练自家 AI

18:10向阳乔木65建议备份X帖子并借助AI总结经验

17:15Rohan Paul60SkillOpt：实现智能体技能自我进化的执行策略

16:48MarkTechPost（RSS）65介绍 mKernel：一个用于 GPU 驱动通信的多 GPU、多节点融合内核库

15:48MarkTechPost（RSS）63Hexo Labs 开源 SIA：一个自我改进的智能体，可同时更新框架与模型权重

12:34Berryxia.AI75精选Adam's Law：用高频词写Prompt效果更好

12:29HuggingFace Daily Papers（社区热门论文）66LoRA适配器后门攻击中的Token级泛化：攻击刻画与行为检测

全部 AI 动态

AI 相关资讯全量信息流

全部一手信源资讯推文

全部模型产品行业论文技巧

5月31日

14:38

HuggingFace Daily Papers（社区热门论文）

55

解耦残差去噪扩散模型实现统一高效图像到图像翻译

DRDD 模型将扩散过程解耦为两个独立阶段：先进行随机噪声扩散以实现领域协调和流形提升，再通过确定性残差扩散在固定噪声域内学习核心语义映射。该设计保留了扩散过程对特征分布的隐式对齐能力，显著简化了跨任务统一映射的学习。噪声扩散阶段仅在未配对的目标域图像上训练，极大提升了数据效率。理论与实验表明，DRDD 与主流扩散模型兼容，即使在配对数据有限时也能实现稳健的统一翻译。代码已在 GitHub 开源。

图像生成开源/仓库数据/训练论文/研究

10:19

MarkTechPost（RSS）

60

Trajectory 发布面向持续学习的并发多 LoRA 训练栈，报告实验吞吐量提升 2.81 倍

Trajectory 联合 UC Berkeley Sky Lab 和 Anyscale 发布了一个面向强化学习实验持续学习的并发多 LoRA 训练栈。该系统将每个 RL 实验映射到一个专属的 LoRA 适配器，并在常热引擎上运行，相比单租户基线，报告实现了 2.81 倍的端到端实验吞吐量提升，且没有奖励回归问题。代码已在 NovaSky-AI/SkyRL 开源。

开源/仓库数据/训练

09:44

Hacker News 热门（buzzing.cc 中文翻译）

精选73

AI引发的职业焦虑：席卷科技从业者的心理危机

AI 技术的快速发展在科技从业者中引发了普遍的职业焦虑与心理危机。文章指出，许多专业人士担心自身技能被自动化取代，从而产生强烈的不安全感、抑郁情绪及身份认同危机。这种焦虑不仅源于对失业的恐惧，也涉及工作意义感的丧失、人际关系的变化以及对未来的迷茫。面对冲击，个体反应不一，但整体而言，这已演变为一场需严肃对待的行业心理挑战。

数据/训练现象/趋势

推荐理由：这篇文章把AI导致的职业焦虑比作一种被压抑的悲伤，结合AIRD临床概念和Reddit哀悼叙事，指出问题在于没有固定终点可接受，是一篇对当下科技从业者心理危机的深刻诊断。

08:45

meng shao@shao__meng

46

如何从 PDF 构建金融知识图谱？

LandingAI 黑客松项目「ArthaNethra」展示了从 PDF 到金融知识图谱的流程：上传后通过 ADE 提取为结构化 Markdown，超过 15MB 的文档异步处理。提取后按文档类型路由归一化：发票/贷款/合同采用确定性解析（无 LLM）；10-K/MD&A 使用 Claude Haiku 结合正则。实体和关系分别存入 Weaviate 和 Neo4j（500 词分块，100 词重叠，all-mpnet-base-v2 向量化），图谱包含 10 类实体和 26 种规范关系，并通过别名映射进行同义词归一化。最后结合规则与 LLM 进行风险检测。

LandingAI: http://x.com/i/article/2060438013273108480

检索增强教程/实践数据/训练

08:00

HuggingFace Daily Papers（社区热门论文）

54

测量对称性-数据交换率：等变先验的标度律实证

在可控C_n对称任务上，等变先验对样本复杂度的理论增益因子|G|首次作为标度律测量。错误群控制比无约束更差（成对联合CI [+0.79, +3.26]排除零）；带测试时轨道平均的数据增强基线在每epoch验证曲线上与等变模型完全一致。相对交换率beta_diff=1.28与理论值1.0在符号和数量级一致（单层CI [+0.92, +2.05]），但保守双层bootstrap区间包含零。最可靠结论：错误群约束有害。

arXiv 数据/训练论文/研究

08:00

HuggingFace Daily Papers（社区热门论文）

55

BenchEvolver：以解决方案为中心的进化式前沿任务合成

前沿大语言模型在LiveCodeBench上已饱和，易分题Pass@1超99%，平均超90%。新提出的BenchEvolver框架以解决方案为中心，通过结构化变换自动进化已有编码问题的参考解，再从进化后解推导题目与测试用例，从而可扩展构造更高质量、多样、困难且结果可验证的任务。应用于LiveCodeBench和SciCode后，进化任务难度显著提升。整理出的LiveCodeBench-Plus含91道题，前沿模型Pass@1仅27.5%–62.6%，恢复了强编码模型间的清晰区分。进化任务对生成模型自身也有挑战性，可用于自我提升。基于进化任务的强化学习在gpt-oss-20b上使LCB v6 Hard和LCB-Pro Easy的Pass@1分别提升+8.7和+8.3，超出仅用原始任务训练的增益70.7%和34.8%。

arXiv 数据/训练编码论文/研究

08:00

HuggingFace Daily Papers（社区热门论文）

62

OmniOPD：基于推测验证的无需logits在线策略蒸馏

OmniOPD是一种无需教师token级logits的在线策略蒸馏框架。它通过蒙特卡洛展开在多token块上以连续语义相似度近似教师偏好，并用峰值熵调度器仅在高不确定性推理分叉处施加监督，同时以Dirichlet-Multinomial贝叶斯先验和基模型KL锚点防止策略坍塌。在数学基准上，OmniOPD相比标准OPD提升高达28.64%；与Claude-4.5-Haiku和Gemini-2.5-Flash等黑箱教师配合时，额外相对提升9.54%，令学生模型超越自我探索强化学习。

推理数据/训练论文/研究

08:00

HuggingFace Daily Papers（社区热门论文）

55

Trust Region On-Policy蒸馏方法（TrOPD）

针对On-Policy蒸馏（OPD）在师生模型分布差异较大时训练不稳定的问题，本文提出置信区间On-Policy蒸馏（TrOPD）方法。该方法核心是采用置信区间On-Policy学习，仅在教师提供可靠监督的区域进行蒸馏；结合异常值估计策略处理不可靠区域；并通过离线引导鼓励向可靠区域探索。实验表明，TrOPD在数学推理、代码生成及通用基准测试上均优于包括OPD、EOPD和REOPD在内的现有OPD基线。

智能体 arXiv 数据/训练论文/研究

08:00

HuggingFace Daily Papers（社区热门论文）

精选70

τ_0-WM：用于机器人操控的统一视频-动作世界模型

τ_0-World Model (τ_0-WM) 是一个统一的视频-动作世界模型，旨在机器人执行动作前预测并评估其未来后果。模型基于共享的视频扩散主干网络构建，提供两个接口：一个联合预测未来视觉潜在表示与连续动作块的视频动作模型，以及一个能将动作序列展开为多视角未来并预测任务进度分数的动作条件视频模拟器。τ_0-WM 使用约27,300小时的多元数据训练，包括真实机器人遥操作、UMI风格交互、自我中心人类视频等。推理时，模型通过测试时计算采样动作候选，并利用去噪一致性和基于模拟器的修正来筛选低质量动作，在长时程和精细机器人操控任务上表现出优于相关基准的性能。

具身智能数据/训练视频论文/研究

推荐理由：机器人操作领域的大一统尝试，把视频预测和动作生成放在一个扩散模型里，还用27万小时数据训练，做具身智能的可以看看这个架构。

08:00

HuggingFace Daily Papers（社区热门论文）

59

HakushoBench：基于日本政府白皮书的图表与表格VQA基准测试发布

HakushoBench是一个日语图表与表格视觉问答基准测试，由33份日本政府白皮书构建而成，包含2053张图像和人工标注的问答对，涵盖超过10种图像类型，旨在评估视觉语言模型对复杂文档的深度理解能力。实验表明，当前开源模型在此基准上仍面临挑战，最佳开源模型的准确率仅为58.6%，而开源与闭源专有模型之间存在34.9分的性能差距。该数据集与代码已开源。

多模态数据/训练论文/研究

07:45

ginobefun@hongming731

15

我们刚刚发布了Claude 4.7 Sonnet和Claude Opus 4。

大佬观点数据/训练

04:43

Hacker News 热门（buzzing.cc 中文翻译）

66

安永发布了一份充满臆想的网络安全报告

安永（Ernst & Young）发布的一份网络安全报告被指出充满模型幻觉。该报告经由 gptzero.me 调查，被批评为内容臆想。此事在 Hacker News 上获得 159 点热度。

安全/对齐数据/训练现象/趋势

04:17

Rohan Paul@rohanpaul_ai

76

软银在法国投资750亿欧元建设欧洲最大AI算力设施

软银宣布在法国投资750亿欧元，旨在打造欧洲规模最大的AI算力设施。该计划旨在利用当地稳定廉价的核电。项目分阶段推进，第一阶段投资450亿欧元，目标是到2031年在法国北部-加来海峡大区建成3.1GW容量，随后再增加2GW，最终形成5GW的AI综合体。敦刻尔克是核心选址，施耐德电气预计参与建设AI基础设施及机器人制造中心。融资是潜在挑战，行业估算显示1GW的AI基础设施成本约为500亿美元，因此软银可能需要依赖大量项目债务和外部合作伙伴。

数据/训练行业动态部署/工程

00:12

Hacker News 热门（buzzing.cc 中文翻译）

精选71

随着成本飙升，美国企业开始对人工智能实施配给

由于运行和使用AI工具的成本持续飙升，美国企业正开始对人工智能的使用实施配给制。企业通过限制使用量、设置分层级审批流程等方式控制开支，以应对AI费用增长过快的问题。这种从广泛采用转向精细化管理的策略，标志着企业在AI应用上从追求速度转向注重成本效益。

数据/训练现象/趋势部署/工程

推荐理由：成本飙升让大企业开始对AI‘配给’，这是面向企业的AI产品必须回答的ROI考题，以前铺量抢客户的玩法得切换成算清每一分钱的价值。

5月30日

21:14

The Decoder：AI News（RSS）

54

研究发现，训练使AI聊天机器人更有用，反而削弱了其模拟人类行为的能力

一项涵盖208,000名参与者、2600万条回复的大规模研究显示，使语言模型转变为有用聊天机器人的训练过程，会削弱其复制人类行为的能力。这种效应随着每一代新模型而加剧。即使采用为模型提供人口统计数据的热门角色扮演技巧，对个体预测也几乎没有带来实际益处。

数据/训练论文/研究

19:21

IT之家（RSS）

65

Meta 通过追踪员工鼠标来训练 AI，或触犯欧盟隐私相关规定

Meta 政策/监管数据/训练

15:46

Rohan Paul@rohanpaul_ai

47

日本AI数据中心热潮正推动液冷技术普及

日本AI数据中心热潮正推动企业从传统空气冷却转向液冷技术，主要原因是AI GPU机架的散热需求激增。当前冷却已占数据中心用电量的30%至40%，且GPU发热量在5年内翻了一倍多。传统风冷因空气载热能力有限，面临噪声大、能耗高及物理空间限制。液冷技术通过将金属冷板直接贴合芯片，利用液体流道高效导热，能更高效地移除热量并提升芯片温度稳定性。其主要挑战在于安装成本较高且需专门的服务器机架设计。日本的Fuji Electric、Nidec、Mitsubishi Heavy等公司正积极开发相关系统。

数据/训练现象/趋势部署/工程

12:42

歸藏(guizang.ai)@op7418

20

我在想藏师傅的这种东西是不是绝佳的前端训练数据可以造非常多【引用 @op7418】：http://x.com/i/article/2059811469081141248

歸藏(guizang.ai): http://x.com/i/article/2059811469081141248

大佬观点数据/训练

12:41

Hacker News 热门（buzzing.cc 中文翻译）

48

Shift将免费提供家政服务，以此培训未来的机器人

AI训练数据初创公司Shift宣布将免费提供家政清洁服务，以此收集真实家庭环境中的操作数据，用于训练未来的家政服务机器人。Shift通过让人类执行清洁任务并记录动作数据，为机器人学习复杂家庭任务提供高质量训练素材。

具身智能数据/训练行业动态

09:01

Orange AI@oran_ge

37

Anthropic被指蒸馏Kimi与Qwen，传闻魔幻难辨真假

推文转述一个传闻：有投资人声称Anthropic的Claude模型通过知识蒸馏（Distillation）使用了Kimi和Qwen的成果。作者对此表示质疑，最初怀疑是Cursor工具所为，但对方坚持是Claude的行为。推文提到目前似乎有更多证据支持这一说法，但整体语境表达了对传闻真实性的怀疑和事件本身的“魔幻”感。文中并未提供任何关于蒸馏过程、模型参数或性能提升的具体证据或数字。

Anthropic 数据/训练行业动态

08:48

MarkTechPost（RSS）

67

如何使用AgentTrove：在Python中流式处理1.7M智能体轨迹并构建干净的ShareGPT SFT数据集

AgentTrove是目前最大的开源智能体交互轨迹集合，包含1.7M行数据，采用ShareGPT风格布局。该Python教程展示了如何在不下载完整数据的情况下流式处理该数据集，具体步骤包括规范化智能体轮次、提取命令、分析轨迹，并将成功的轨迹导出为干净的SFT微调数据集。

智能体教程/实践数据/训练

08:00

HuggingFace Daily Papers（社区热门论文）

44

SDR：基于集合距离的胸部X光报告生成奖励方法

针对标准精确匹配奖励不适用胸部X光报告生成的问题，提出SDR方法。将报告分割为句子，用冻结的句子Transformer嵌入为无序集合，以生成与参考嵌入间的集合到集合距离作为连续、置换不变的奖励。在Qwen3-VL-2B/4B和Gemma3-4B上通过GRPO后训练，BERTScore、RadGraph F1和CheXbert F1分别相对提升6.80%、7.82%和4.45%。同一距离用于测试时best-of-N选择，在Mistral-Small、Gemini-2.5 Flash-Lite和GPT-4o-mini上BERTScore平均相对提升16.4%。作为流式信号，可在生成中修剪低分候选，减少超过50%的生成token且保持质量。代码已公开。

arXiv 图像生成数据/训练论文/研究

08:00

HuggingFace Daily Papers（社区热门论文）

52

半监督噪声自适应（SSNA）：从噪声领域迁移知识

半监督噪声自适应（SSNA）提出利用简单分布（如高斯分布）构造的合成噪声领域作为源域，在半监督设置下（仅少量目标样本有标签）提升目标域的泛化。基于该问题，建立了刻画噪声领域影响的目标域泛化界，并提出噪声自适应框架（NAF）。实验表明NAF有效利用噪声领域收紧目标域的泛化界，提升性能。代码已开源。

数据/训练论文/研究

08:00

HuggingFace Daily Papers（社区热门论文）

65

针对Mixture-of-Experts模型的置信度自适应SwiGLU

本研究提出了置信度自适应SwiGLU，这是面向Mixture-of-Experts模型的一种SwiGLU变体。该方法根据token级的路由置信度动态调整专家门控的锐度，通过将SiLU门控的锐度系数参数化为路由器对数几率的可学习函数，使每个门控单元能在平滑的广泛激活与尖锐的选择性门控之间自适应插值。在FineWeb-Edu数据集上针对不同规模的MoE Transformer模型评估表明，κ-SwiGLU在引入极少量额外参数和微小计算开销的前提下，提升了模型的平均CORE性能。

数据/训练论文/研究

07:48

MarkTechPost（RSS）

48

NVIDIA 推出 X-Token：投影引导的跨Tokenizer知识蒸馏，在 Llama-3.2-1B 上平均分超越 GOLD +3.82

NVIDIA 发布 X-Token 技术，通过解决 GOLD 方法中的两个结构性缺陷，将 Llama-3.2-1B 模型在 GSM8k 基准上的准确率从 2.56 提升至 15.54。

数据/训练论文/研究

07:31

Orange AI@oran_ge

65

AI能源风暴：是泡沫还是奇点？

一位经济学家提出，历史上重大的技术革命往往伴随能源利用方式的剧变，而互联网和移动互联网并未如此。AI则不同，它直接消耗能源，导致新能源、旧能源及元素周期表中的多种元素价格暴涨。这种从比特世界深入到原子世界的深刻改变，预示着一次极为重大的技术变革。当一个风口大到足以撬动能源、存储和元素市场时，这要么是史上最大的泡沫，要么是奇点将至的信号。

数据/训练现象/趋势

06:16

Rohan Paul@rohanpaul_ai

68

麦肯锡报告：AI技能在欧洲就业市场持续升温

根据麦肯锡报告，近五分之一的欧洲职业现已要求AI相关技能，这一比例是2023年的三倍多。增长最快的技能是AI流畅度，即在实际工作中应用、提示、管理和核查AI系统的能力。该技能的需求从2023年覆盖的190万员工跃升至2025年的940万，增长了5倍。相比之下，技术性AI技能需求仅增长1.7倍，表明欧洲对AI用户的需求远大于工程师。当前75%的需求集中在计算机、管理和商业金融领域，但已开始向物流、人力资源、合规及技术工种扩散。

McKinsey Global Institute: Demand for AI-related skills is growing across the European workforce. MGI research shows the share of occupations requi...

数据/训练行业动态

04:48

SemiAnalysis@SemiAnalysis_

60

AI 暗产出：隐形产出的显性成本为什么 AI 日益增长的产出将成为史上最棘手的经济衡量难题之一。 AI"暗产出"可能最终占据经济活动的大部分，但衡量起来却是个挑战。 https://newsletter.semianalysis.com/p/ai-dark-output-the-visible-cost-of

数据/训练现象/趋势

01:45

The Verge：AI（RSS）

62

科技公司迫切希望拍摄你做家务的画面

AI训练数据初创公司Shift宣布将为纽约人提供免费家庭清洁服务，并计划扩展至伦敦等城市。作为交换，Shift要求拍摄其清洁人员工作的视频，记录洗碗、擦柜台、扫地、拖地等所有家务劳动。这些视频数据正被机器人公司竞相收集，用于训练机器完成家务，最终目的是销售家用服务机器人。

具身智能数据/训练现象/趋势

01:14

Fei-Fei Li@drfeifei

精选83

我对这个适用于大规模生成模型新时代的视觉生成基准数据集感到非常兴奋！🤩

Keshigeyan Chandrasegaran: 1/ Introducing GPIC: a Giant Permissive Image Corpus and benchmark for visual generation! 🚀100M VLM-captioned image-tex...

Hugging Face 图像生成数据/训练论文/研究

推荐理由：李飞飞都来站台，这个数据集不简单。完全允许商业用途是关键，对做视觉生成的团队来说，终于有了一个不用再为版权头疼的超级训练库。

00:18

Ars Technica：AI（RSS）

51

机器人训练初创公司将派戴摄像头的人上门清洁

一家初创公司正采用一种新方式为机器人训练收集数据：支付费用，让人类佩戴头戴摄像头，上门执行清洁任务，从而获取第一人称视角的操作数据。

具身智能数据/训练行业动态

5月29日

22:15

Rohan Paul@rohanpaul_ai

52

在真实拳击场辩论：Transformer 架构与后继者的未来

这是一场关于AI架构的辩论。Transformer阵营指出，其凭借简单、硬件友好、可扩展的优势主导当下，核心是基于键值存储的记忆与注意力机制，并强调任何替代架构必须能在扩展性上与之匹敌，且需达到约10倍优势才能颠覆现有技术栈。Post-Transformer阵营则认为，当前大语言模型的推理更像是后置的文本步骤，真正的突破在于实现模型内部的“潜在推理”与持续学习能力，并指出长上下文不等于真正记忆，未来可能是混合架构。辩论还提到，当前公开基准测试易被优化，而困惑度（Perplexity）仍是评估前沿模型的有效指标。最后指出，尽管Transformer仍占主导，但前沿正在拓宽，并列举了Pathway的BDH、Sakana AI的CTMs和Liquid AI的LFMs等新兴架构作为例证。

推理数据/训练现象/趋势

20:15

The Verge：AI（RSS）

43

这家 AI 创业公司将免费为你打扫房屋，以训练未来的机器人

AI训练数据初创公司Shift宣布了一项独特的服务：为用户免费提供房屋清洁。条件是，公司会录制清洁工清洁、吸尘、除尘、整理和清洗的全过程，并将这些视频数据用于训练机器人。Shift解释称，由此生成的训练数据价值足以支付整个服务的成本。其宣传语称：“你获得一尘不染的公寓。我们获得训练数据。每个人都赢。”

具身智能数据/训练行业动态

18:21

IT之家（RSS）

46

美初创公司 Shift 声称可以免费帮你打扫房屋，代价是全程录像以训练自家 AI

美国公司 Shift 在纽约市提供免费公寓清洁服务，作为交换，专业清洁人员需全程佩戴设备录制第一视角画面。这些视频将被用于制作数据集，授权给机器人和人工智能训练，以学习人类完成日常任务的操作数据。Shift 声称，所有画面会在使用前进行匿名化处理，模糊所有可识别个人信息，且录像仅用于训练，不会公开分享或出售。目前服务范围限于纽约，未来计划扩展至全球并提供上门维修、跑腿等更多免费服务。

具身智能数据/训练行业动态

18:10

向阳乔木@vista8

65

建议备份X帖子并借助AI总结经验

推文强烈建议用户下载X平台的所有帖子进行备份，以防被算法误封后丢失历史数据。同时，可利用Codex或CC（可能指Claude）等工具分析这些内容，帮助自己总结出未曾意识到的个人方法论。推文指明了操作路径：需在X网页端通过“更多->设置和隐私->你的账号->下载你的数据的存档”提交申请，通常次日可下载，且过期需重新申请。

教程/实践数据/训练

17:15

Rohan Paul@rohanpaul_ai

60

SkillOpt：实现智能体技能自我进化的执行策略

微软提出SkillOpt方法，旨在改进AI智能体技能的优化过程。其核心思想是将一个独立的技能文档视为优化对象，而非直接修改底层大语言模型。该方法让智能体尝试任务，分析成功与失败案例，然后由一个更强的优化器模型对技能文档进行小幅编辑。编辑只会在提升验证集表现时被接受，从而确保技能的稳定改进。在6个基准测试、7个目标模型和3种智能体设置（包括直接聊天、Codex和Claude Code）的共52个测试案例中，SkillOpt均达到最佳或并列最佳。在GPT-5.5上，它将直接聊天的平均准确度提升了23.5点。最终产出的技能文件可读、可移植且可复用，部署时无需重新训练模型。

智能体 Microsoft 数据/训练论文/研究

16:48

MarkTechPost（RSS）

65

介绍 mKernel：一个用于 GPU 驱动通信的多 GPU、多节点融合内核库

加州大学伯克利分校的 UCCL 团队发布了 mKernel，该工具将节点内 NVLink 通信、节点间 RDMA 通信以及密集计算融合成一个持久化 CUDA 内核。

开源/仓库数据/训练部署/工程

15:48

MarkTechPost（RSS）

63

Hexo Labs 开源 SIA：一个自我改进的智能体，可同时更新框架与模型权重

Hexo Labs 开源了 SIA，这是一个遵循 MIT 许可证的自我改进循环。其中的反馈智能体会读取每次执行的轨迹，然后重写运行框架或触发对 gpt-oss-120b 模型的 LoRA 权重更新。结合这两种调整方式，在 LawBench、TriMul GPU 内核以及 scRNA-seq 去噪任务上，效果均优于仅迭代框架。

智能体开源/仓库数据/训练

12:34

Berryxia.AI@berryxia

精选75

Adam's Law：用高频词写Prompt效果更好

FaceMind团队用100种语言和四大核心任务实验发现，在语义不变的前提下，使用预训练语料中出现频率更高的词汇（高频表达）来撰写提示词或进行微调，可以显著提升大语言模型的表现。这被总结为Adam’s Law（文本频率定律），它为数据工程补上了“频率”这一新维度。原理在于高频表达能让模型在它最熟悉的概率空间内工作，从而优化输出质量。

Berryxia.AI: http://x.com/i/article/2044264645683539968

教程/实践数据/训练

推荐理由：别再给AI拽高级词汇了，FaceMind团队用实验证明，高频表达能让模型表现更好。这个发现简单反直觉，但能立刻改变你写Prompt的习惯，下次先想想这话模型见过几次。

12:29

HuggingFace Daily Papers（社区热门论文）

66

LoRA适配器后门攻击中的Token级泛化：攻击刻画与行为检测

研究表明，可通过训练数据投毒为微调大语言模型的主流分发格式LoRA适配器植入后门，同时保持基线任务性能。在通义千问（Qwen）2.5 1.5B提示注入分类器上，少量投毒样本即可触发一个保持清洁准确率的饱和后门。该后门在Token特征层面而非结构模式层面泛化。研究表征了攻击在模型规模、LoRA rank和触发字符串上的特性，并评估了两种互补的检测方法：一种是基于探针电池统计量的行为检测器；另一种是无需运行模型的权重级统计量（归一化Frobenius范数的跨模块标准差）。因果定位将后门定位于中后层MLP模块的down_proj投影。

安全/对齐数据/训练

1…16 171819 20…43