Meta 新论文发现,后训练量化虽能缩小推理模型、降低部署成本,但会导致模型在已得出正确答案后反复自我怀疑,浪费 token。量化在不确定的词选择上引入噪声,使模型更倾向使用“wait”“but”“alternatively”等词重新开启推理。在 5 个推理模型(1.5B-32B)的数学、编程和科学任务上,激进量化使过度思考失败率最高达 52%。通过给 50 个犹豫词施以小惩罚,可剪掉 12%-23% 的推理长度,同时保持甚至提升准确率。
Meta is turning excess AI compute into a cloud business after shares jumped more than 10%. Meta built huge AI infrastruc...
Meta 利用为自有模型、广告和助手建设的大型 AI 基础设施产生的过剩算力,计划向开发者出租模型访问(类似 AWS Bedrock)及原始算力。消息引发股价剧烈反应:Meta 涨超 10%,而 AI 云公司 CoreWeave 跌 10.8%、Nebius 跌 12.4%。Zuckerberg 此前透露外部公司几乎每周都向 Meta 请求算力。此举既降低 Meta 对广告收入的依赖,也证明其 AI 建设的外部价值,但云业务涉及计费、安全、工具支持等复杂环节,Meta 难以快速成为 AWS 级别的云服务商。
Meta 已投入数百亿美元建设 AI 数据中心和芯片,现计划通过出售多余 AI 算力和托管模型来变现。据 Bloomberg 报道,Meta 的商业模式将覆盖两个方向:类似 AWS Bedrock 的模型托管服务,以及类似 CoreWeave 的裸 GPU 算力租赁。这一举动将 Meta 推入拥挤但利润丰厚的赛道,同时也回应了投资者对巨额支出如何转化为收入的持续质疑。
Meta开源非侵入式脑机接口系统Brain2Qwerty v2,通过读取MEG头盔采集的脑信号实现文字输出,无需植入电极。9名志愿者每人录入约10小时、共约2.2万句神经活动数据。系统平均词准确率61%,最强参与者达78%;超50%句子解码误差不超过1个词。v2版本联合映射脑信号到字符、词汇及完整句义,深度学习直接从原始信号学习模式,再经微调LLM利用上下文修正错误。相比早期非侵入方法8%的准确率显著提升,且准确率随训练数据量增加而提高。
Meta 发布 Brain2Qwerty v2,无需手术植入,仅佩戴 MEG(脑磁图)头盔即可将大脑磁信号实时解码为连贯句子。字词准确率达 61%,约为其他无创脑机接口方法(8%)的 7.6 倍;最佳参与者达 78%,超半数句子只差一个词。Meta 称这是目前性能最高的非侵入式脑机接口系统。
关联讨论 1 条X:AI at Meta (@AIatMeta)Meta发布Brain2Qwerty v2,一种非侵入式脑机接口系统,能从实时脑信号解码完整自然句子,单词准确率达61%。系统基于约22000个句子训练,9名志愿者每人使用MEG记录10小时。相比此前非侵入方法8%的准确率大幅提升,最佳参与者达78%,超半数解码句子仅错一个词或更少。该端到端管线能实时将原始脑信号解码为单词和语义。但研究仍在受控实验室阶段:参与者样本小、依赖MEG硬件、数据来自主动打字、结果由公司报告,尚未成为临床通信设备。Meta已开源训练代码,BCBL发布v1数据集。
We're sharing the next major milestone in our non-invasive brain-to-text decoder research: Brain2Qwerty v2. Building on ...
Meta 在 Nature Neuroscience 发表 Brain2Qwerty v1 论文,同日发布 v2。v1 从脑电信号逐字母解码,字符错误率 32%。v2 实现句子级实时解码,平均单词准确率 61%,最优 78%,过半句子误差一个词内。此前非侵入式准确率仅 8%。v2 用 MEG 设备采集 9 名志愿者各约 10 小时打字数据(约 2.2 万句子),结合端到端深度学习与微调大语言模型。准确率随数据量对数线性提升。Meta 开源 v1、v2 全部训练代码。MEG 设备仍体积大、成本高,但该成果为脑损伤患者提供了无需开颅的可行路径。
We're sharing the next major milestone in our non-invasive brain-to-text decoder research: Brain2Qwerty v2. Building on ...
同一事件,精选展示《Meta发布Brain2Qwerty v2:非侵入式实时句子解码》The Information报道,Meta已限制工程师使用Anthropic的Claude Code和OpenAI的Codex,原因是为防止竞争对手模型输出污染Meta自身AI训练数据,并引发合同纠纷。OpenAI和Anthropic的服务条款均禁止使用其输出来开发竞争模型。知识蒸馏风险在于即使意外复用竞品输出也可能被视为从竞争对手提取能力。建议的策略包括成分追踪:仅在不用于模型训练管线、评测集、基准生成、后训练数据、奖励模型数据及内部数据集时才使用竞品工具。典型防护措施有隔离规则、企业账户审批、训练数据溯源日志、数据集隔离及自动扫描“AI生成”标记等。
We're sharing the next major milestone in our non-invasive brain-to-text decoder research: Brain2Qwerty v2. Building on ...
We're sharing the next major milestone in our non-invasive brain-to-text decoder research: Brain2Qwerty v2. Building on ...
关联讨论 1 条X:AI at Meta (@AIatMeta)Meta 正面临每个 AI 公司都会遇到的难题:想用内部系统 MetaCode 取代 Claude Code、Codex 等昂贵的外部编码工具,但在构建更好的编码模型时,必须确保不意外地使用竞争对手模型的输出进行训练或评估。这就是知识蒸馏陷阱——公司越依赖前沿模型建设内部 AI 基础设施,就越难证明智能来源的独立性。
BREAKING: US Government Bans Llama 4, citing concerns that it is "just really bad"
Google限制了Meta对Gemini模型的使用,原因是Meta要求的计算容量超出Google供应能力。Meta在安全自动化、客服、广告工具、编程及内部工作流中均依赖Gemini。Google面临自身云客户、Gemini产品与有限数据中心容量之间的资源竞争。Google Cloud 3月季度收入增至200亿美元,CEO Sundar Pichai表示计算容量短缺制约了增长,并导致未交付订单较前一季度近乎翻倍。
Meta 发布新研究 Autodata,提出 Agentic Self-Instruct 方法。该方法将 AI 智能体视为数据科学家,通过智能体规划与工具使用,替代传统手工调优后固定的合成数据流水线。该智能体自身可通过元优化持续改进,从而生成更强训练数据。实验在计算机科学、法律推理、数学对象推理三个领域均超越经典合成数据方法,且元优化带来更大提升。论文见 arxiv。
Meta提出Autodata,将合成数据生成视为智能体数据科学家的任务。核心方法“Agentic Self-Instruct”让AI智能体生成并元优化合成训练与评估数据。循环流程:生成示例→弱模型与强模型分别尝试→判断结果→修订配方直至示例处于有用区间。论文强调难度不是美德,示例应针对弱模型的学习点。关键结果:在法律任务上,4B模型训练后超越了更大的397B基线。
据NYT 2026年6月23日报道,特朗普政府正施压Meta,要求其AI模型在公开发布前提交政府审查。Meta目前是美国唯一未加入该自愿审查系统的主要AI实验室。OpenAI、Anthropic、Google、xAI和微软均已同意与政府AI安全小组共享模型。审查目的旨在测试先进模型是否可用于敏感网络任务、暴露安全漏洞或构成国家安全风险。
Kim 评论 Meta Mythos 传闻,认为其固然令人兴奋,但对 Meta 的战略意义远不及对 OpenAI 或 Anthropic 那样关键。原因是 Meta 已有稳定营收并走不同路线,其 LLM 只需足够好以维持消费者日常使用(简单问答及稍复杂任务),当前模型已胜任且持续改进。除非 Meta 计划切入自主科研等领域,否则 Mythos 级模型的真正目的何在仍存疑问。
OpenAI将前沿级健康AI从高级推理模型移至免费的GPT-5.5 Instant模型。Satya Nadella关于AI组织经济学和“token资本”的文章走红。Anthropic展示Claude Opus 4.7用12分07秒编程机器人狗,比去年人类团队快20倍,并推出Claude Design大更新(支持设计系统导入、代码往返、修复高token用量)。AI金融领域推动SEC文件可机器读取但不简化会计逻辑。扎克伯格裁员8000人后试图重启Meta黑客文化,员工抵制。
Meta CTO Andrew Bosworth表示公司士气跌至20年来最低点,堪比剑桥分析事件时期。过去一段时间Meta已裁员10%,又将约10%员工调岗支持AI模型训练,因追踪鼠标移动和键盘敲击用于AI改进而引发争议。CEO Mark Zuckerberg在8000人裁员后试图重启黑客文化,但遭员工抵制;他承诺7月举办全公司AI黑客松,员工反应冷淡。
Mark Zuckerberg is trying to restart Meta's hacker culture after 8,000 layoffs but employees are pushing back. In an int...
路透社报道,Meta在重建AI团队时动作过快。10%员工被裁,7000人转入AI工作流岗位,扎克伯格在内部备忘录中承认部分安排不匹配,可能需将部分员工调回。新成立的Applied AI Engineering单元管理跨度达50:1。Meta仍在大力投入,年度资本支出上调至$125B-$145B,主要用于算力、数据中心、网络和电力。
Can we just make @ylecun president of AI and call it a day please?
Meta正准备迄今规模最大的AI可穿戴设备推进,包括AI项链、更多AI眼镜以及企业服务“Wearables for Work”。其押注下一代AI交互界面不是聊天框,而是具备丰富传感器、能记住会议、总结对话、回答视觉问题并触发操作的AI助手设备。报道的销售目标宏大:2026年下半年销量目标1000万台,年底月活用户目标680万。软件层被视作关键,可将设备销售转化为持续性AI收入。此举背后的财务压力明显:Reality Labs在2026年第一季度录得40.3亿美元运营亏损,营收仅为4.02亿美元,因此Meta亟需将可穿戴设备发展成一个平台,而非又一条昂贵的硬件产品线。
Yann LeCun团队的新论文探讨了LeJEPA模型学习真实世界隐藏变量的条件。其核心结论是,LeJEPA只有在真实的隐藏变量呈现高斯云结构时,才能可靠地学习它们。论文通过数学证明,当这些隐藏变量是独立高斯变量,并且配对视图由一个稳定的噪声过程生成时,LeJEPA的最优解能够以旋转或翻转等价的形式恢复这些变量。这项研究为自监督AI模型究竟在何时能真正理解世界结构(而不仅仅是提取在测试集上有效的特征)提供了理论解释。