AIHOT
内容
精选全部 AI 动态AI 日报主题收藏
接入
Agent 接入
更多
关于更新日志反馈
内部员工登录
精选全部日报更多
内部员工登录
全部动态论文 · 25 条
全部一手资讯X论文
标签「Meta」清除
7月2日周四
05:03Rohan Paul42Meta 研究:量化推理模型因自我怀疑导致过度思考,小幅惩罚可缓解
7月1日周三
23:40The Decoder:AI News(RSS)48Meta 发布非侵入式脑机接口 Brain2Qwerty v2,词错误率降至 39%
09:08Hacker News 热门(buzzing.cc 中文翻译)68Meta AI 发布 Brain2Qwerty v2:无需手术的脑电波解码系统
6月30日周二
20:02IT之家(RSS)50Meta 公布 Brain2Qwerty v2 非侵入式脑机接口新研究:AI 从脑磁信号中"读心",准确率最高达 78%
12:02IT之家(RSS)55Meta 发布自研 Vistara 芯片,复用拆机 DDR4 内存搭配 DDR5 新服务器
08:06小互75Meta发布无创脑机接口Brain2Qwerty v2,字词准确率达61%
02:28宝玉79同事件精选Meta 发布 Brain2Qwerty v1 论文与 v2,非侵入式脑机接口解码准确率大幅提升同一事件,精选展示《Meta发布Brain2Qwerty v2:非侵入式实时句子解码》
02:19AYi71Meta 发布 Brain2Qwerty v2:非侵入式脑机解码达单词级实时输出
6月29日周一
23:04elvis77Meta Brain2Qwerty v2:非侵入式实时脑解码新突破
6月26日周五
04:25elvis41Meta Autodata:智能体自动构建合成训练数据
01:23Rohan Paul47Meta论文Autodata:智能体数据科学家生成高质量合成数据
6月5日周五
23:33AI at Meta64Meta SAM 3D 获 CVPR26 最佳论文荣誉提名
5月29日周五
09:44Rohan Paul65LeJEPA何时学习世界模型?
5月28日周四
04:19Meta Engineering Blog(RSS)69精选SilverTorch:索引即模型--推荐系统的新检索范式
5月26日周二
23:03Rohan Paul61论文提出Self-play SWE-RL方法,通过自我博弈提升软件智能体能力
04:58Rohan Paul65AI智能体以代码为主要工作层时性能更佳
5月19日周二
02:09elvis67Meta新系统双代理协同,自动设计超越Llama 3.2的神经架构
5月18日周一
08:00HuggingFace Daily Papers(社区热门论文)58基于上下文记忆的高效长上下文生成方法
5月4日周一
23:24elvis66Meta发布Autodata:代理式数据科学家,通过自主循环构建高质量数据
5月1日周五
22:16elvis56Meta FAIR研究:预训练阶段自改进LLM的新范式
08:00HuggingFace Daily Papers(社区热门论文)51Code World Model 准备情况报告
4月30日周四
08:34IT之家(RSS)52苹果发布 AI 框架 LaDiR:突破单一思维,并行探索多条推理路径
4月29日周三
01:38AK66Meta发布Tuna-2模型 像素嵌入超越视觉编码器
01:08AK57Meta发布TUNA框架统一视觉表征
4月23日周四
08:00HuggingFace Daily Papers(社区热门论文)63Sapiens2
没有更多了
全部 AI 动态
AI 相关资讯全量信息流
全部一手信源资讯推文
全部模型产品行业论文技巧
7月2日
05:03
Rohan Paul@rohanpaul_ai
42
Meta 研究:量化推理模型因自我怀疑导致过度思考,小幅惩罚可缓解

Meta 新论文发现,后训练量化虽能缩小推理模型、降低部署成本,但会导致模型在已得出正确答案后反复自我怀疑,浪费 token。量化在不确定的词选择上引入噪声,使模型更倾向使用“wait”“but”“alternatively”等词重新开启推理。在 5 个推理模型(1.5B-32B)的数学、编程和科学任务上,激进量化使过度思考失败率最高达 52%。通过给 50 个犹豫词施以小惩罚,可剪掉 12%-23% 的推理长度,同时保持甚至提升准确率。

Meta推理论文/研究
7月1日
23:40
The Decoder:AI News(RSS)
48
Meta 发布非侵入式脑机接口 Brain2Qwerty v2,词错误率降至 39%

Meta FAIR 团队发布 Brain2Qwerty v2,从非侵入性 MEG 脑信号重建完整句子。九名志愿者输入 22000 句,平均词错误率 39%,最佳参与者 22%。v2 采用异步连续信号窗口,无需击键时间戳。模型使用三个 AI 构建块,包括基于 Qwen3 微调的语言模型将噪声信号转为连贯句子。字符错误率 31%,高于 v1 N-gram 模型的 26%,但词错误率和语义准确率更优。当前与植入式系统(词错误率 <2%)仍有差距,但数据量增加后精度持续提升。

Meta论文/研究
09:08
Hacker News 热门(buzzing.cc 中文翻译)
68
Meta AI 发布 Brain2Qwerty v2:无需手术的脑电波解码系统

Meta AI 推出 Brain2Qwerty v2,一种无需手术植入即可实时从脑电波解码句子的非侵入式系统。基于脑磁图(MEG)设备记录 9 名志愿者各 10 小时的打字脑活动,训练约 22,000 个句子,采用端到端深度学习并微调大语言模型。词准确率达 61%,最佳参与者达 78%,远超其他非侵入方法的 8%。解码精度随数据量对数线性提升,有望进一步缩小与手术方法的差距。Meta 已开源 v1 和 v2 训练代码,合作方 BCBL 开放 v1 数据集。

Meta开源/仓库数据/训练论文/研究
6月30日
20:02
IT之家(RSS)
50
Meta 公布 Brain2Qwerty v2 非侵入式脑机接口新研究:AI 从脑磁信号中"读心",准确率最高达 78%

Meta 推出 Brain2Qwerty v2 非侵入式脑机接口研究,利用脑磁图(MEG)设备记录脑部磁场信号,通过 AI 模型还原自然语言。模型基于 9 名志愿者约 10 小时、22000 句子数据训练,并利用上下文补全噪声信号。实验显示平均单词识别准确率约 61%,最佳受试者达 78%,超半数测试句子错误不超过 1 个单词。目前仍需大型实验室级 MEG 设备,距离实用化有差距。Meta 已在 GitHub 开源训练代码,v2 数据集待论文接收后开放。

Meta论文/研究
12:02
IT之家(RSS)
55
Meta 发布自研 Vistara 芯片,复用拆机 DDR4 内存搭配 DDR5 新服务器

Meta 在 ISCA 2026 大会发布自研 Vistara ASIC 方案,通过 CXL 2.0/1.1 规范的 PCIe Gen5 x16 接口将拆机 DDR4 内存桥接到新服务器。每台 MemServer 配备 768GB DDR5 和 256GB DDR4(3:1 配比),单个 ASIC 支持双通道 DDR4 最高 3200 MT/s、最大 256GB。该方案已在数百万台服务器中用于分离式机器学习推理、大数据处理等场景,可将推理服务器数量最多减少 25%,分布式缓存平均延迟降低 29%。

Meta论文/研究部署/工程
08:06
小互@xiaohu
75
Meta发布无创脑机接口Brain2Qwerty v2,字词准确率达61%

Meta 发布 Brain2Qwerty v2,无需手术植入,仅佩戴 MEG(脑磁图)头盔即可将大脑磁信号实时解码为连贯句子。字词准确率达 61%,约为其他无创脑机接口方法(8%)的 7.6 倍;最佳参与者达 78%,超半数句子只差一个词。Meta 称这是目前性能最高的非侵入式脑机接口系统。

Meta多模态论文/研究
关联讨论 1 条X:AI at Meta (@AIatMeta)
02:28
宝玉@dotey
同事件精选79
Meta 发布 Brain2Qwerty v1 论文与 v2,非侵入式脑机接口解码准确率大幅提升

Meta 在 Nature Neuroscience 发表 Brain2Qwerty v1 论文,同日发布 v2。v1 从脑电信号逐字母解码,字符错误率 32%。v2 实现句子级实时解码,平均单词准确率 61%,最优 78%,过半句子误差一个词内。此前非侵入式准确率仅 8%。v2 用 MEG 设备采集 9 名志愿者各约 10 小时打字数据(约 2.2 万句子),结合端到端深度学习与微调大语言模型。准确率随数据量对数线性提升。Meta 开源 v1、v2 全部训练代码。MEG 设备仍体积大、成本高,但该成果为脑损伤患者提供了无需开颅的可行路径。

AI at Meta: We're sharing the next major milestone in our non-invasive brain-to-text decoder research: Brain2Qwerty v2. Building on ...

Meta多模态开源/仓库论文/研究
同一事件,精选展示《Meta发布Brain2Qwerty v2:非侵入式实时句子解码》
推荐理由:非侵入式脑机接口从近乎不能用进步到能大致沟通,这一步证明了不开颅也可能接近侵入式的效果,剩下的主要是工程问题。做脑机接口或医疗 AI 的都值得关注。
02:19
AYi@AYi_AInotes
71
Meta(扎克伯格团队)在非侵入式脑机接口研究上取得重大突破,推出 Brain2Qwerty v2。该模型基于同日发表在 Nature 上的 v1,是目前最高性能的端到端管道,能从原始脑信号实时解码句子,将解码能力从字符级提升至单词和语义级,显著提升整体通信准确性。这一进展比预期更快,有望帮助数百万因脑损伤或疾病无法交流的患者。

AI at Meta: We're sharing the next major milestone in our non-invasive brain-to-text decoder research: Brain2Qwerty v2. Building on ...

Meta论文/研究
6月29日
23:04
elvis@omarsar0
77
Meta AI 发布 Brain2Qwerty v2,非侵入性脑信号编码器最新里程碑,论文同日发表于《Nature》。该模型能从原始脑信号实时解码完整句子,准确度逼近需开颅手术的侵入式技术;从 v1 的字符级解码升级为词语及语义级解码,显著提升通信精度,有望帮助因脑损伤或障碍无法交流的数百万患者。

AI at Meta: We're sharing the next major milestone in our non-invasive brain-to-text decoder research: Brain2Qwerty v2. Building on ...

Meta多模态论文/研究
关联讨论 1 条X:AI at Meta (@AIatMeta)
6月26日
04:25
elvis@omarsar0
41
Meta Autodata:智能体自动构建合成训练数据

Meta 发布新研究 Autodata,提出 Agentic Self-Instruct 方法。该方法将 AI 智能体视为数据科学家,通过智能体规划与工具使用,替代传统手工调优后固定的合成数据流水线。该智能体自身可通过元优化持续改进,从而生成更强训练数据。实验在计算机科学、法律推理、数学对象推理三个领域均超越经典合成数据方法,且元优化带来更大提升。论文见 arxiv。

智能体Meta数据/训练论文/研究
01:23
Rohan Paul@rohanpaul_ai
47
Meta论文Autodata:智能体数据科学家生成高质量合成数据

Meta提出Autodata,将合成数据生成视为智能体数据科学家的任务。核心方法“Agentic Self-Instruct”让AI智能体生成并元优化合成训练与评估数据。循环流程:生成示例→弱模型与强模型分别尝试→判断结果→修订配方直至示例处于有用区间。论文强调难度不是美德,示例应针对弱模型的学习点。关键结果:在法律任务上,4B模型训练后超越了更大的397B基线。

Meta数据/训练论文/研究
6月5日
23:33
AI at Meta@AIatMeta
64
热烈祝贺我们的 SAM 3D 团队在 #CVPR26 获得最佳论文荣誉提名!这项殊荣凸显了他们在推动计算机视觉边界方面的杰出工作。 论文链接:https://arxiv.org/abs/2511.16624
Meta多模态论文/研究
5月29日
09:44
Rohan Paul@rohanpaul_ai
65
LeJEPA何时学习世界模型?

Yann LeCun团队的新论文探讨了LeJEPA模型学习真实世界隐藏变量的条件。其核心结论是,LeJEPA只有在真实的隐藏变量呈现高斯云结构时,才能可靠地学习它们。论文通过数学证明,当这些隐藏变量是独立高斯变量,并且配对视图由一个稳定的噪声过程生成时,LeJEPA的最优解能够以旋转或翻转等价的形式恢复这些变量。这项研究为自监督AI模型究竟在何时能真正理解世界结构(而不仅仅是提取在测试集上有效的特征)提供了理论解释。

Meta多模态论文/研究
5月28日
04:19
Meta Engineering Blog(RSS)
精选69
SilverTorch:索引即模型--推荐系统的新检索范式

Meta 推出SilverTorch推荐系统架构,统一了用户生成内容的所有检索组件。该架构吞吐量比现有技术高23.7倍,计算成本效率比CPU方案高20.9倍,同时提升了准确性。

Meta搜索论文/研究

推荐理由:SilverTorch 把索引本身变成模型,在推荐检索上拿到 23 倍吞吐提升,这个思路对搜索和推荐工程师都有启发,虽然离普通人有点远。
5月26日
23:03
Rohan Paul@rohanpaul_ai
61
论文提出Self-play SWE-RL方法,通过自我博弈提升软件智能体能力

Meta、CMU等机构在论文中提出了Self-play SWE-RL方法。该方法让编程智能体通过“自我博弈”生成训练数据,而非仅依赖人工标注的问题。具体而言,一个模型探索代码库、注入bug并留下测试用例来描述问题;另一个模型则学习根据测试修复系统。其中,测试成为了描述问题的核心语言。该方法在SWE-bench Verified上提升了+10.4分,在SWE-Bench Pro上提升了+7.8分。值得注意的是,评估使用了该系统未训练过的自然语言问题,表明其可能学到了更深层的软件理解能力。

智能体arXivMeta编码
04:58
Rohan Paul@rohanpaul_ai
65
AI智能体以代码为主要工作层时性能更佳

Meta、斯坦福与伊利诺伊的研究论文指出,AI智能体在将代码作为主要工作层时性能更佳。论文认为,大语言模型(LLM)作为文本预测器,在处理长任务时存在状态丢失、错误隐蔽等问题。真正的进步并非“AI写代码”,而是“AI在代码环境中思考”。论文的核心是提出一个以代码为中心的“智能体框架”,即工具、记忆、沙箱等系统。在此框架中,测试成为传感器,代码库成为记忆,日志成为历史,沙箱成为边界。生成的脚本成为可运行、检查、修改和共享的操控对象。总结发现,代码能通过可执行步骤帮助智能体推理,通过工具调用行动,并通过测试、日志等对环境进行建模。

智能体arXivMeta编码
5月19日
02:09
elvis@omarsar0
67
Meta新系统双代理协同,自动设计超越Llama 3.2的神经架构

Meta提出AIRA系统,通过分离策略与实现的双代理架构,实现神经架构的自主发现。AIRA-Compose负责宏观架构搜索,AIRA-Design专注低级机制实现。该系统在24小时计算预算内,于350M、1B和3B规模上找到超越Llama 3.2的架构。其核心方法论表明,在复杂任务中分离规划代理与实现代理能提升效能,此思路同样适用于流水线组装、查询规划等其他AI代理场景。

智能体Meta数据/训练论文/研究
5月18日
08:00
HuggingFace Daily Papers(社区热门论文)
58
基于上下文记忆的高效长上下文生成方法

针对大语言模型在使用长上下文前缀时面临影响力衰减和计算开销大这两个问题,本文提出了一种名为“注意力状态记忆”的无训练方法。该方法将上下文前缀外化为一个轻量级、基于查找的预计算记忆库,存储了前缀与查询词之间的注意力状态。实验表明,在 LLaMA-3.1-8B 上,该方法在 1K-8K 记忆预算下提升了准确率,并将注意力计算延迟降低了 1.36 倍。同时,它在 NBA 基准测试中,仅用全注意力 RAG 20% 的内存开销,便超越了其性能表现。

Meta检索增强推理论文/研究
5月4日
23:24
elvis@omarsar0
66
Meta FAIR开发的Autodata是一个能自主构建高质量训练与评估数据的代理系统。其核心在于"代理式自我指导"循环:编排器LLM指导挑战者代理基于领域文档生成问题,由弱、强解算器尝试解答,法官评分后分析失败并循环优化,从而产出能有效区分模型能力的挑战性数据。在CS研究QA任务中,该方法产生了34个百分点的性能差距,远超标准方法的1.9点。系统还具备元优化能力,通过外循环调整指令,将验证通过率从12.8%提升至42.4%。研究处理了超万篇论文,产出2,117个优质QA对,通过增加推理计算使数据更具挑战性,从而提升下游模型性能。

DAIR.AI: Banger paper from Meta FAIR. They introduce Autodata, an agentic data scientist that builds high-quality training and ev...

智能体Meta数据/训练论文/研究
5月1日
22:16
elvis@omarsar0
56
Meta FAIR研究:预训练阶段自改进LLM的新范式

Meta FAIR的研究提出一种新范式,将LLM的改进从后训练移至预训练阶段。该方法利用强大的后训练模型作为改写器和评判器,对预训练数据的后缀进行高质量、高安全性的改写,并通过强化学习直接优化预训练模型。模型从开始就学习序列生成,并获得质量、安全性和事实性的奖励。实验结果显示,相比标准预训练,该方法在事实性上取得36.2%的相对提升,安全性提升18.5%,生成质量胜率最高达86.3%。核心结论是,现有后训练模型可用于预训练出更优的下一代模型。

Meta安全/对齐论文/研究
08:00
HuggingFace Daily Papers(社区热门论文)
51
Code World Model 准备情况报告

Meta 发布了用于代码生成与推理的 Code World Model,并对其进行了前沿风险准备情况评估。报告显示,该模型在预设的可能带来灾难性风险的领域测试中,未表现出超越当前 AI 生态系统的额外前沿风险。基于评估结果,Meta 决定以开放权重模型的形式公开发布 CWM。

Meta安全/对齐开源/仓库模型发布
4月30日
08:34
IT之家(RSS)
52
苹果发布 AI 框架 LaDiR:突破单一思维,并行探索多条推理路径

苹果公司与加州大学圣迭戈分校团队联合发布名为LaDiR的AI推理框架。该框架并非新模型,而是一个可叠加于现有大语言模型之上的通用架构,其核心创新在于结合扩散模型与自回归模型。在推理阶段,LaDiR利用扩散过程并行探索多条独立路径,并通过多样性鼓励机制防止思维过早收敛,最后以自回归方式输出最终答案。测试显示,该框架在LLaMA 3.1 8B等模型上,于数学推理、代码生成及谜题规划任务中,其准确率和可靠性均优于现有通用方法。

Meta推理论文/研究
4月29日
01:38
AK@_akhaliq
66
Meta 推出 Tuna-2 像素嵌入优于视觉编码器,用于多模态理解与生成 paper: https://huggingface.co/papers/2604.24763
Meta多模态论文/研究
01:08
AK@_akhaliq
57
Meta 推出 TUNA 驯服统一视觉表示以构建原生统一多模态模型 论文:https://huggingface.co/papers/2512.02014
Meta多模态论文/研究
4月23日
08:00
HuggingFace Daily Papers(社区热门论文)
63
Sapiens2

Sapiens2是一个专注于以人为中心的视觉任务的高分辨率Transformer模型家族,旨在实现泛化性、多功能性和高保真输出。模型参数量从4亿到50亿不等,原生支持1K分辨率,其分层变体可支持4K。相比前代,Sapiens2在预训练和后训练阶段均有显著改进:结合了掩码图像重建与自蒸馏对比目标以学习兼顾低级细节和高级语义的特征;在10亿张高质量人体图像数据集上进行预训练,并提升了任务标注的质量与数量;架构上吸收了前沿模型的进展,支持更长的稳定训练。其4K模型采用窗口注意力机制处理更长空间上下文,并以2K输出分辨率进行预训练。该模型在姿态估计、身体部位分割、法线估计等任务上刷新了最佳性能,并扩展了点云图和反照率估计等新任务。

Meta多模态论文/研究