4月24日

07:54

Nathan Lambert@natolambert

前ByteDance AI研究员在采访中表示，中文LLM领域并未赶上美国模型，反而差距在扩大。关键挑战包括Benchmaxxing、对美国模型的Distillation、数据质量与基础设施差，以及计算约束。他否认了中文模型正在追赶的假设，认为技术依赖和资源限制导致落后局面加剧。

Kyle Chan: Must-listen interview by @Changxche with ex-ByteDance AI researcher: - Benchmaxxing - Distillation on US models - Poor d...

大佬观点数据/训练现象/趋势

00:48

AK@_akhaliq

近未来策略优化论文：https://huggingface.co/papers/2604.20733

推理数据/训练论文/研究

4月23日

19:58

公众号：龙猫LongCat（美团）

LARYBench 发布：定义具身动作表征 ImageNet，首次度量从人类视频学习的泛化表征

LARYBench 是一个系统化评测基准，旨在从大规模视觉数据中学习通用的隐式动作表征。它首次提供了度量标准，用于评估从人类视频学习到的表征的泛化能力，类似 ImageNet 在视觉领域的定位。

具身智能数据/训练论文/研究

00:16

AK@_akhaliq

OpenAI 刚刚在 Hugging Face 上发布了 privacy-filter 一个用于文本中个人身份信息（PII）检测与掩码的双向 token 分类模型模型：https://huggingface.co/openai/privacy-filter

Hugging Face OpenAI 开源/仓库数据/训练

00:13

AI Notkilleveryoneism Memes ⏸️@AISafetyMemes

预言中了 "Meta 正在员工的电脑上安装追踪软件，以捕获鼠标移动、点击和按键操作，用于训练其 AI 模型，从而构建可自主工作的 AI agent。" "该工具还将对员工屏幕上的内容进行截图。"

AI Notkilleveryoneism Memes ⏸️: It begins. Exactly what I wrote 4 months ago: STEP 1: Companies install keyloggers etc on employees' computers STEP 2: A...

智能体 Meta 数据/训练现象/趋势

4月22日

23:13

HuggingFace Daily Papers（社区热门论文）

RDP LoRA：大语言模型参数高效适应的几何驱动识别方法

研究团队提出RDP LoRA方法，将大语言模型隐藏状态演化建模为高维几何轨迹，利用Ramer-Douglas-Peucker算法无训练地识别表征路径关键断点，并直接作为层选择信号。在Qwen3-8B-Base的LoRA微调实验中，仅需适配13个RDP选择的层，便在MMLU-Math上达到81.67%准确率，显著优于全层适配的79.32%和随机选择的75.56%，证明几何轨迹分析可优化参数高效微调中的层选择决策。

Hugging Face 数据/训练论文/研究

23:07

OpenAI：官网动态（RSS · 排除企业/客户案例）

OpenAI 推出 Privacy Filter

OpenAI 发布 Privacy Filter，一款用于检测和脱敏文本中个人身份信息（PII）的开源权重模型。该模型在 PII 识别任务上达到业界领先的准确率，支持开发者本地部署和定制。作为开放权重模型，它可自动识别并编辑敏感个人信息，为企业数据隐私保护和合规处理提供高效的技术解决方案。

OpenAI 开源/仓库数据/训练部署/工程

22:46

Chubby♨️@kimmonismus

与数据中心的扩张相比，曼哈顿计划简直是个笑话。但愿伊朗战争不会中断芯片生产。

OpenAI Newsroom: In January 2025, we committed to generating 10GW of compute and have already identified over 8GW of that. Now, we're pla...

OpenAI 数据/训练行业动态部署/工程