Meta、CMU等机构在论文中提出了Self-play SWE-RL方法。该方法让编程智能体通过“自我博弈”生成训练数据,而非仅依赖人工标注的问题。具体而言,一个模型探索代码库、注入bug并留下测试用例来描述问题;另一个模型则学习根据测试修复系统。其中,测试成为了描述问题的核心语言。该方法在SWE-bench Verified上提升了+10.4分,在SWE-Bench Pro上提升了+7.8分。值得注意的是,评估使用了该系统未训练过的自然语言问题,表明其可能学到了更深层的软件理解能力。
Meta、CMU等机构在论文中提出了Self-play SWE-RL方法。该方法让编程智能体通过“自我博弈”生成训练数据,而非仅依赖人工标注的问题。具体而言,一个模型探索代码库、注入bug并留下测试用例来描述问题;另一个模型则学习根据测试修复系统。其中,测试成为了描述问题的核心语言。该方法在SWE-bench Verified上提升了+10.4分,在SWE-Bench Pro上提升了+7.8分。值得注意的是,评估使用了该系统未训练过的自然语言问题,表明其可能学到了更深层的软件理解能力。
Meta、斯坦福等机构提出AutoResearchClaw,这是一个通过AI智能体进行自主研究的框架。其核心理念是将科研过程转化为一个受流程约束的循环,而非简单的生产线。系统整合了辩论、修复、验证、记忆和选择性的人类反馈,并将失败视为有效证据。在ARC-Bench基准测试中,该系统在结果分析等任务上性能比AI Scientist v2提升54.7%。人类协作实验显示:CoPilot模式(适时介入)接受率达87.5%,完全自主仅25%,逐步监督为50%。一个关键失败案例揭示了当所有交叉验证方法返回相同零偏差输出时,系统虽通过数值验证却失去了科学意义,凸显了人类判断的关键作用。
扎克伯格在播客中批评苹果自iPhone后创新停滞,称其只是在吃乔布斯留下的老本。他指出iPhone升级体验提升有限,用户换机周期延长;AirPods虽成功但苹果通过封闭生态限制第三方接入。苹果ATT政策导致Meta广告收入损失超100亿美元,双方在Vision Pro与Quest等领域存在竞争。扎克伯格正推动Meta在AI眼镜、开源大模型如Llama等方向发展。
Mark Zuckerberg says Apple's lack of innovation since the iPhone will lead to its decline "They haven't really invented ...
Meta、斯坦福与伊利诺伊的研究论文指出,AI智能体在将代码作为主要工作层时性能更佳。论文认为,大语言模型(LLM)作为文本预测器,在处理长任务时存在状态丢失、错误隐蔽等问题。真正的进步并非“AI写代码”,而是“AI在代码环境中思考”。论文的核心是提出一个以代码为中心的“智能体框架”,即工具、记忆、沙箱等系统。在此框架中,测试成为传感器,代码库成为记忆,日志成为历史,沙箱成为边界。生成的脚本成为可运行、检查、修改和共享的操控对象。总结发现,代码能通过可执行步骤帮助智能体推理,通过工具调用行动,并通过测试、日志等对环境进行建模。
2026年科技行业出现大规模裁员,多家公司公开将人力成本转向AI投资。Meta裁员8000人,同时投入1000亿美元建设AI数据中心;Cisco CEO称裁员4000人已是“乐观地低”;Intuit裁员3000人以重构业务,但对媒体否认“因AI裁员”。据统计,今年已有超10万科技岗位流失,TrueUp预测全年可能达37万。推文指出,核心变化在于公司不再避讳,正公开地将人力预算“转换为GPU集群”。
Meta研究发现,在编程智能体任务中,通过复用过往尝试的简短摘要,其性能显著优于使用原始日志。该论文指出,对于长程编程任务,主要瓶颈已从代码生成转向了如何有效记忆与表示智能体的工作过程。其方法是将每次充满错误的“混乱轨迹”转化为包含核心假设、进展与失败点的紧凑摘要,系统通过锦标赛式选择最佳摘要来指导新一轮尝试。在Claude 4.5 Opus的测试中,该方法使其在SWE-Bench Verified上的得分从70.9%大幅提升至77.6%,证明提升性能的关键在于以可复用的形式存储经验。
Meta正利用内部工程师的工作痕迹——如代码编写、工具使用和问题解决步骤——来训练其编程AI。CEO扎克伯格认为,让AI观察“聪明人”执行任务(行为克隆),比使用外部承包商代码样本更有效。同时,Meta正裁员约8000人,并计划让约7000名员工转向AI相关岗位。此举反映科技行业新趋势:公司正将人类专业知识直接转化为训练数据,AI不再只是工具,而是能吸收并压缩员工工作模式的系统。
LEAKED AUDIO: In an all-hands meeting on April 30, Mark Zuckerberg tells employees that he's training AI on them ahead o...
Meta启动大规模裁员,计划削减约8000个岗位。与此同时,约7000名员工将被调配至新的AI相关职位。此次调整并非单纯的削减成本,更是公司围绕AI进行内部结构重塑的关键举措,重点将资源集中于AI基础设施、基础模型的构建以及AI技术的商业化,旨在打造从模型训练、产品开发到实现盈利的完整链条。
关联讨论 2 条IT之家(RSS)Hacker News 热门(buzzing.cc 中文翻译)扎克伯格在给员工的备忘录中表示,裁员8000人是因为“成功并非必然”,AI是决定性技术,领先企业将定义下一代。此次裁员与公司重组相关:Meta在裁减岗位的同时,将约7000名员工转向AI相关的新岗位,重塑公司结构以聚焦AI基础设施、基础模型开发及AI变现。扎克伯格对离开的员工表示感谢,并重申Meta拥有定义未来的实力。他承诺今年不会再有全公司范围的裁员,同时承认公司沟通方式有待改进。
CNBC: Meta starts major cuts with 8,000 layoffs as AI shakes the tech giant. Along with the layoffs, around 7,000 employ...
近日,Meta CEO扎克伯格的内部音频泄露,他承认公司秘密收集员工键盘、鼠标和屏幕数据,用于训练Llama等AI模型,因Meta员工智力高可提升模型能力。然而,数据收集约20天后,Meta裁员8000人,引发“企业食人主义”批评:员工在不知情下训练可能取代自己的AI,资本剥削从时间升级到智慧。这损害了员工信任,揭示了AI时代高效但冷酷的用人逻辑——员工越优秀,其价值被快速榨取并抛弃的风险越高。
LEAKED AUDIO: In an all-hands meeting on April 30, Mark Zuckerberg tells employees that he's training AI on them ahead o...
Holy: Leaked audio from a Meta all-hands on April 30: Zuckerberg told employees the company is using them to train AI mo...
LEAKED AUDIO: In an all-hands meeting on April 30, Mark Zuckerberg tells employees that he's training AI on them ahead o...
Yann LeCun离职Meta后创办AMI,押注基于世界模型的JEPA架构,与主流LLM不同。他批评LLM虽在语言任务有效,但缺乏预测行动后果和规划能力,无法真正理解物理世界且结构上不安全。LeCun倡导在抽象表示空间进行预测的自监督学习,以推动智能泛化。同时,他推进Tapestry项目,通过联邦学习构建去中心化的全球共识模型,应对AI控制集中化问题。
Meta提出AIRA系统,通过分离策略与实现的双代理架构,实现神经架构的自主发现。AIRA-Compose负责宏观架构搜索,AIRA-Design专注低级机制实现。该系统在24小时计算预算内,于350M、1B和3B规模上找到超越Llama 3.2的架构。其核心方法论表明,在复杂任务中分离规划代理与实现代理能提升效能,此思路同样适用于流水线组装、查询规划等其他AI代理场景。
Meta AI首席科学家Yann LeCun预测,未来12到18个月内将出现训练分层世界模型的通用方法。这些模型将从视频和真实世界数据中学习,具备理解物理因果和规划行动的能力,可应用于机器人、医疗等多个领域解决实际问题。最终目标是将其扩展为通用的世界模型。这标志着AI研究重点可能从当前以LLM为代表的“会聊天”模型,转向能够理解并作用于物理世界的“会做事”模型。
Yann LeCun says that within a year to 18 months, we'll have a general method for training hierarchical world models Thes...
I don't think people understand just how bad it will be if an American open source champion doesn't emerge soon and the ...
American science is at extraordinary risk. NIH has awarded less than half as many grants as it has compared to the past ...
It's hard to imagine more of a dream Unsupervised Learning guest than @ylecun. Yann is one of the godfathers of AI, and ...
Meta近日推出Incognito Chat with Meta AI,号称全球首个真正私密的AI聊天方式,承诺聊天内容不留记录、不用于模型训练、不推送广告且不被任何人查看。这一举措与Meta依赖用户数据的商业模式形成鲜明反差。针对其真实私密性、Meta是否仍能访问内容、第三方安全风险及与广告业务的矛盾等核心质疑,采访了WhatsApp负责人Will Cathcart和Meta AI产品副总裁Vishal Shah进行解答。此次推出可能标志着AI隐私保护的重要转折,Meta主动为用户提供“绝对安全”的对话空间,显得颇为反直觉。
Meta just launched Incognito Chat with Meta AI - the world's first truly private way to chat with AI. But I had a lot of...
Meta 收购 Manus 时,第一反应是: Microsoft 要收购 GenSpark 了吧,这可能是 Microsoft 唯一的选择 但后来 OpenClaw 很快就横空出世,Manus 的产品形态变得更普遍甚至被超越,Meta 一时间变成了“冤大头”,随即后面商务部叫停了收购,Meta 也算是意外免去了损失 在 Hermes Agent 等一众 OpenClaw 接替产品,和 Codex、Claude Code 等不断变成通用 Agent 的时间点,留给 GenSpark 和 Manus 的方向是什么呢?
I'm very happy to have been invited to the Microsoft CEO Summit, and to see my former boss Satya again. ❤️
Today, we're launching Incognito Chat with Meta AI on @WhatsApp and the Meta AI app, a new way to have completely privat...
Meta首席AI官宣布,Incognito Chat功能正式登陆WhatsApp和Meta AI。与ChatGPT等仅不保存历史记录的“临时聊天”不同,该功能的关键创新在于:对话推理完全在用户手机的硬件安全飞地内进行,Meta工程师无法获取明文,且不产生任何服务器日志,会话结束后数据永久消失。此举将WhatsApp成熟的端到端加密标准应用于AI对话,旨在彻底解决用户对隐私的顾虑,从而鼓励用户与AI讨论健康、财务等敏感话题。作者认为,通过建立深度信任来获取用户更真实的prompt,是推动AI从“玩具”转变为生活基础设施的关键,并预测此类隐私保护模式将成为未来AI产品的标准配置。
incognito chat with meta ai coming to WhatsApp + Meta AI app! people use AI to discuss personal topics and we want to ma...
在百度Create大会上,李彦宏提出DAA(日活智能体数)指标,用于衡量每日运行并交付结果的AI智能体数量,以替代仅反映成本消耗的Token。他认为DAA能更有效评估AI实际产出,并预测未来全球DAA将超100亿,远超当前日活用户数,同时提及僵尸agent是否计入日活的现实问题。
世界模型被视为AI继大语言模型后的关键新范式,过去18个月已获百亿美元投资,其核心承诺是通过规模化数据推动机器人基础模型发展。然而,该术语目前被广泛滥用,含义模糊。本文系统阐述了世界模型的五大特质,对比了不同技术路径,探讨了其在机器人及其他领域的应用与未来机遇。领域参与者包括谷歌Genie、特斯拉Optimus等巨头产品,以及众多专注世界模型或机器人基础模型的初创公司。它很可能成为未来十年的奠基性技术之一。
Meta发布了由Muse Spark驱动的Meta AI Voice Conversations,实现实时语音与视觉交互。该功能支持打断对话、切换话题,在聊天过程中生成图像和拉取内容,并能通过相机对准现实世界进行实时视觉问答。这一技术即将集成到Ray-Ban Meta智能眼镜中,提升穿戴设备的AI体验。
Meta宣布推出由Muse Spark驱动的AI语音对话功能,支持自然语言交流、实时生成图像及从Reels、地图等多源获取信息。该功能将整合至Meta AI应用的新语音模式和实时摄像头视图中,用户可通过摄像头对现实世界进行实时问答。购物模式新增了搜索Facebook Marketplace等能力。Muse Spark将逐步在Ray-Ban Meta等智能眼镜上于美加推出,并于今夏登陆Meta Ray-Ban Display,其智能能力也将扩展至WhatsApp、Instagram等全平台的多类场景中。
Today we're introducing Meta AI Voice Conversations powered by Muse Spark that let you talk naturally to Meta AI (interr...
Meta即将推出名为“Hatch”的常驻AI智能体,目前已开放候补名单。该智能体将基于Instagram和Facebook的社交数据进行训练与信息落地。据披露,内部测试计划于6月底启动,Meta为此构建了模拟Reddit、Etsy和DoorDash的环境,以训练其工具使用行为。技术架构方面,最终将由Meta自家的Muse Spark模型系列作为核心支撑,而在过渡阶段,将暂时采用Anthropic的Claude Opus 4.6和Sonnet 4.6模型作为中间层。
Meta研究发现,强制大语言模型(LLM)在分析代码时遵循检查清单、逐步展示推理证明,能将其代码补丁错误率降低近50%。常见错误源于模型过早识别熟悉名称(如“format”)并直接套用通用含义,而非实际检查项目文件,导致其依赖自信猜测而非深入分析。通过要求模型明确写出修改内容、追踪执行路径并用具体证据证明结论,这一方法迫使其实际阅读本地文件、遵循真实逻辑,从而将准确率提升至93%。该方法无需昂贵的新训练或复杂系统,仅通过基本的结构化提示即可实现高可靠性的代码验证,节省了运行软件测试的巨大计算成本。
Most participants who had a 20-minute discussion with AI chatbots about health, careers or relationships followed its ad...
Banger paper from Meta FAIR. They introduce Autodata, an agentic data scientist that builds high-quality training and ev...