4月30日

16:39

Rohan Paul@rohanpaul_ai

美国劳工部推出全国性AI学徒门户网站，旨在为AI时代培养劳动力。该网站将资源分为通用AI技能、行业特定模块以及学徒计划的三种整合路径。雇主可选择加入现有计划、创建新的AI重点注册学徒计划，或更新现有计划将AI技能融入现有技能栈。学徒机会由雇主或项目发起方提供，求职者应使用“学徒工作查找器”进行搜索，并直接向雇主或发起方申请。

政策/监管数据/训练

12:15

宝玉@dotey

OpenAI调查模型为何频说"哥布林"与"小精灵"

OpenAI技术博客深入调查了其模型（从GPT-5.1到GPT-5.4）输出中“goblin”和“gremlin”等奇幻生物词汇异常激增的现象。根源在于ChatGPT的“Nerdy”性格定制功能：其奖励模型在训练中无意间高奖励了包含此类词汇的“俏皮”表达。尽管该性格仅占全部回复的2.5%，却贡献了超66%的“goblin”出现次数，并通过强化学习的反馈循环污染了模型的整体输出，形成了“tic词”。OpenAI已下架该性格并调整训练数据，但此案例揭示了微小的奖励信号在AI训练中可能被意外放大和泛化的核心难题。

OpenAI: We're talking about Goblins. https://openai.com/index/where-the-goblins-came-from/

OpenAI 安全/对齐数据/训练论文/研究

09:13

swyx 🇸🇬@swyx

Talkie复古语言模型：基于1931年前文本的训练与伦理挑战

为应对互联网被AI生成内容污染的问题，研究者提出“低背景标记”设想，计划训练仅使用历史文本的复古模型。团队集结了包括GPT-1/2开发者在内的专家，通过训练复古OCR模型处理旧书籍、报纸等资料，并利用礼仪手册、词典等结构化历史文本合成RLHF数据。为确保数据纯净，他们开发了基于文档n-gram的时代错位分类器，精心筛选了数千亿1931年前的公共领域标记进行训练。最终发布了130亿参数的Talkie模型，旨在探索语言模型的泛化能力。然而，该模型在发布后表现出强烈的种族偏见倾向，引发了新的伦理担忧。

Nick Levine: New work with @AlecRad and @DavidDuvenaud: Have you ever dreamed of talking to someone from the past? Introducing talkie...

大佬观点数据/训练

04:39

Rohan Paul@rohanpaul_ai

深度学习迈向科学理论：顶尖实验室提出"学习力学"新范式

哈佛、斯坦福、UC伯克利等顶尖实验室联合提出，深度学习正从经验优化转向可解释的科学理论。尽管神经网络架构、数据等完全公开，但其复杂互动使得预测训练过程仍依赖大量实验。作者倡导建立“学习力学”，类似物理学关注宏观规律，通过可解玩具模型、无限宽度极限、缩放定律等五种路径，揭示训练动态与性能演化的整体性法则。这一理论与专注于局部电路的机制可解释性研究形成互补，共同探索学习的全局定律。

推理数据/训练论文/研究

04:08

Anthropic@AnthropicAI

在新的Anthropic Fellows研究中，我们探讨了"内省适配器"：这种工具能让语言模型自我报告在训练过程中习得的行为--包括潜在的错位。【引用 @kshenoy_】：大型语言模型能否直接告诉我们它们在训练中习得的不良行为？我们训练了一个单一的内省适配器（IA），使微调后的模型能够描述自身行为。该方法可推广至检测隐藏的错位、后门和安全措施移除。

keshav: Can LLMs simply tell us about unwanted behaviors they've picked up in training? We train a single Introspection Adapter ...

Anthropic 数据/训练论文/研究

00:41

Deedy@deedydas

研究通过知识问题估算LLM参数规模

研究人员通过询问不同难度知识问题，估计大型语言模型参数大小。结果显示，GPT 5.5约10T参数，Claude Opus 4.x约4-5T，Grok 4约3T。事实性知识容量与模型规模呈对数线性关系。论文提出7个知识层级，最高层级T7对所有模型接近零，表明预训练仍有显著提升空间。Gemini 3.1 Pro可能超过10T参数。此方法有助于推断模型训练成本及后训练在非事实性任务上的性能。

Anthropic OpenAI 数据/训练模型发布

4月29日

11:11

向阳乔木@vista8

姚老师和张凯的GEO论文已在全球最大论文平台arxiv完成审核并发布，这是全球第二篇GEO专项研究。论文基于今年3月最新数据，涵盖大量Prompt、引用和AI抓取记录，采用科学方法进行GEO分析，类似数据驱动的增长洞察。研究成果以正式报告形式呈现，源数据已开源在GitHub。作者表示，如果对社区有帮助，将继续抓取更多数据进行专项研究并开放成果。

姚金刚: 我和张凯的GEO论文,在全球最大的论文平台http://arxiv.org完成审核并正式发布这应该是全球第二篇与GEO有关的专项论文论文基于今年3月份最新的数据,包括602条 Prompt、21143 条引用、23745条AI抓取记录,...

arXiv 搜索数据/训练论文/研究

03:07

Chubby♨️@kimmonismus

SandboxAQ从谷歌分拆出来，筹集了超过9.5亿美元，并获得了英伟达的支持。每个人都在谈论LLMs。几乎没有人谈论LQMs。 Sandbox的赌注：通过模拟物理和化学的大型定量模型来发明新药物和新材料。我与他们的AI模拟总经理Nadia Harhen讨论了为什么对于物理世界来说，LQMs可能比LLMs更重要。我们最新（也是第二期）的《超级智能播客》节目现已发布！链接在评论中

Google 大佬观点数据/训练

4月28日

08:31

Ethan Mollick@emollick

研究人员推出了仅使用1931年前文本训练的13B模型Talkie，旨在探索语言模型的泛化能力。该实验发现，模型虽掌握截至1931年的信息，但在某些科学议题上明显停留在20世纪初的认知框架中。例如，它仍坚持"发光以太"假说，并对狭义相对论表现出不信任。这凸显了训练数据的时间范围会深刻固化模型的知识体系与世界观。

Nick Levine: New work with @AlecRad and @DavidDuvenaud: Have you ever dreamed of talking to someone from the past? Introducing talkie...

数据/训练现象/趋势论文/研究

4月27日

23:28

elvis@omarsar0

多智能体系统自动化管理成为AI前沿研究方向

推文作者指出，优化多智能体系统以实现自动化知识发现或调优高级AI系统是当前AI领域极具潜力的方向。文中引用的研究通过强化学习训练“指挥家”模型，使其能自动管理其他模型：针对简单问题直接查询单一模型，面对复杂编码任务则自主组建包含规划器、编码器和验证器的完整流程。这标志着从单智能体“思维链”向多智能体“指挥链”的演进，相关技术已应用于Sakana Fugu等新系统，展现了AI管理AI范式的广阔探索空间。

hardmaru: For the past few years, humans have been doing "prompt engineering" to coax the best performance out of different LLMs. ...

智能体数据/训练论文/研究

4月24日

12:54

Yuchen Jin@Yuchenj_UW

我依然惊叹于 DeepSeek、Kimi 和 Qwen 能够用少得多且经常是降配的 NVIDIA GPU，甚至华为芯片，训练出非常强大的大语言模型。 DeepSeek V4 的报告显示，他们发明了新的注意力架构，使训练/推理更加高效。创造力热爱约束。我真心希望我们看到有强大的美国开源模型能够参与竞争。

大佬观点开源生态数据/训练

07:54

Nathan Lambert@natolambert

前ByteDance AI研究员在采访中表示，中文LLM领域并未赶上美国模型，反而差距在扩大。关键挑战包括Benchmaxxing、对美国模型的Distillation、数据质量与基础设施差，以及计算约束。他否认了中文模型正在追赶的假设，认为技术依赖和资源限制导致落后局面加剧。

Kyle Chan: Must-listen interview by @Changxche with ex-ByteDance AI researcher: - Benchmaxxing - Distillation on US models - Poor d...

大佬观点数据/训练现象/趋势

00:48

AK@_akhaliq

近未来策略优化论文：https://huggingface.co/papers/2604.20733

推理数据/训练论文/研究

4月23日

00:16

AK@_akhaliq

OpenAI 刚刚在 Hugging Face 上发布了 privacy-filter 一个用于文本中个人身份信息（PII）检测与掩码的双向 token 分类模型模型：https://huggingface.co/openai/privacy-filter

Hugging Face OpenAI 开源/仓库数据/训练

00:13

AI Notkilleveryoneism Memes ⏸️@AISafetyMemes

预言中了 "Meta 正在员工的电脑上安装追踪软件，以捕获鼠标移动、点击和按键操作，用于训练其 AI 模型，从而构建可自主工作的 AI agent。" "该工具还将对员工屏幕上的内容进行截图。"

AI Notkilleveryoneism Memes ⏸️: It begins. Exactly what I wrote 4 months ago: STEP 1: Companies install keyloggers etc on employees' computers STEP 2: A...

智能体 Meta 数据/训练现象/趋势

4月22日

22:46

Chubby♨️@kimmonismus

与数据中心的扩张相比，曼哈顿计划简直是个笑话。但愿伊朗战争不会中断芯片生产。

OpenAI Newsroom: In January 2025, we committed to generating 10GW of compute and have already identified over 8GW of that. Now, we're pla...

OpenAI 数据/训练行业动态部署/工程

14:44

Rohan Paul@rohanpaul_ai

卢森堡大学与LIH研究揭示LLM约束推理关键缺陷

卢森堡大学与LIH研究揭示，LLM在结构化约束推理中存在关键缺陷。通过最优潮流问题测试发现，各类模型约束满足率停滞于55%-60%，主要瓶颈是无法满足电力系统物理约束方程。研究表明，模型仅学会"解的形状"却未真正执行约束搜索，导致输出看似合理（格式正确、误差小）却物理不可行。监督微调虽改善表面指标，但无法提升物理可行性；强化学习亦效果有限。研究警示：流畅近似不等于约束优化，"看起来合理"是危险标准。

arXiv 推理数据/训练论文/研究

04:15

Rohan Paul@rohanpaul_ai

Meta监控员工操作数据训练AI

Meta正在美国员工电脑上部署追踪软件，记录鼠标移动、点击和按键行为，作为Model Capability Initiative的一部分，将日常工作转化为AI训练数据，使模型学习数字工作的逐步模式。这反映了Meta内部更广泛的战略转向：推动员工使用AI代理、将职位重组为AI相关工作，并计划裁员10%。Meta声称收集的数据仅用于模型训练，不会用于绩效评估。

智能体 Meta 数据/训练行业动态

01:45

Rohan Paul@rohanpaul_ai

GenRobot发布DAS Ego六摄像头具身数据采集设备

GenRobot推出DAS Ego六摄像头仿生可穿戴设备，以270°零畸变视场角与毫秒级头手同步解决传统单目方案的遮挡与深度盲区，实现毫米级轨迹重建与厘米级关节追踪。同步开源的Gen Ego Data数据集涵盖20余环境及200余项技能，通过第一人称视角采集帮助具身AI模型学习物理规律与"感知-动作-结果"因果关系，为真实场景部署提供核心数据支撑。

Genrobot.AI: Perception is a system problem. One camera misses depth, occlusion, and hand interactions. Gen DAS Ego uses 6 synced cam...

产品更新具身智能数据/训练

4月21日

03:06

Nathan Lambert@natolambert

开放权重模型追赶闭源AI的现状与变数

当前开放权重模型与闭源实验室的性能差距维持动态平衡。在训练范式改变前，开放模型能够持续 fast-follow 闭源模型，尚无证据表明前者会落后。这一均衡取决于基准测试演变、模型实际表现与排名关联度，以及训练制度调整等因素。若闭源模型通过整合用户训练数据形成数据壁垒，或经济力量驱动战略转变，现有格局才可能被打破。

Interconnects: Reading today's open-closed performance gap The complex factors that determine the single evaluation number so many focu...

大佬观点开源生态数据/训练

01:06

Nathan Lambert@natolambert

看着所有模型依托快速改进的后训练陆续发布，显然我们需要一个完全开放的实验室，展示现代后训练中应优先拉动哪些杠杆。现有的完全开放方案如 olmo 3 正迅速落后。糟糕的均衡。

大佬观点开源生态数据/训练

4月20日

03:44

Rohan Paul@rohanpaul_ai

Larry Page 2007年预言：AI将依赖算力而非算法

Larry Page于2007年提出对AI发展的核心洞见：人工智能的突破将依赖海量计算（computation）而非精巧算法设计。他以人类DNA仅约600MB压缩数据却能构建完整生命系统为例，说明复杂智能不需要庞大代码库。这一观点精准预示了现代AI依靠算力规模取胜的技术范式，体现了对机器学习本质的深刻洞察。

Google 大佬观点数据/训练

4月18日

23:37

François Chollet@fchollet

查看深度学习简历时，区分平庸与优秀候选人最明显的标志之一，就是他们列出的是 PyTorch 还是 JAX。

DeepMind 大佬观点数据/训练