前微软高管指出,尽管微软每季度投入巨额资金于AI,但其Copilot等产品的实际用户付费率极低,未能有效激发市场热情。硬件厂商在笔记本电脑中内置NPU芯片,却未能催生出具有吸引力的杀手级应用,这反映出即使是擅长分发的巨头,若产品本身缺乏足够的拉动力,也难以取得成功。与此同时,该高管也强调微软在企业市场拥有的强大护城河依然稳固。这种矛盾的现状,使得未来18个月对微软AI战略的走向至关重要。
Anthropic CFO在访谈中透露,公司今年一季度年化营收从90亿美元猛增至300亿美元以上。算力被高效复用以同步支持模型训练、内部研发和客户服务,CFO近半时间投入算力决策,强调需超越线性思维进行情景规划。内部研发形成“更好模型驱动更快研发,进而产出更优模型”的飞轮效应,同时降低对外服务成本。公司超90%代码由Claude Code完成,显著提升效率;在可解释性与对齐研究上的投入,则增强了客户信任,形成差异化优势。
本文作者以资深工程师的视角,阐述了其不采用“凭感觉编程”(Vibe Coding)的原因。核心论点是:AI工具主要缓解了软件开发中编写代码等“偶然复杂性”,但无法触及设计健壮、可维护系统架构这一“本质复杂性”,后者仍需依赖深厚的人类经验与判断。作者进一步指出,大语言模型(LLM)仅在符号层面运作,缺乏人类对上下文、社会现实及模型自身局限性的“元认知”能力,无法审问和反思数据与抽象背后的简化与遮蔽。因此,他认为构建清晰系统的关键仍在于人类的专业判断与反思。
if you think AI chatter has reached an annoying level right now you're in for something else. it's going to be the only ...
We got bored. Time for Man vs. Machine https://x.com/i/broadcasts/1qGvvkQMgNgGB
Addy Osmani 警示工程师过度依赖AI生成代码会导致“认知投降”,即牺牲深度理解换取效率。研究显示,依赖AI会削弱问题理解、脑部活动和决策质量。产品设计追求效率,但学习恰恰发生在“摩擦力”中。AI委托在样板代码中有效,但在调试、AI犯错、底层变化、处理独特问题及面对市场价值重估时必然失败。作者建议应形成假设再提问、先要解释再要代码、开启学习模式、审阅AI输出如PR、徒手重写代码,并区分“交付”与“学习”指标,避免用未来能力换取短期轻松。
http://x.com/i/article/2055936913211899904
Meta AI首席科学家Yann LeCun预测,未来12到18个月内将出现训练分层世界模型的通用方法。这些模型将从视频和真实世界数据中学习,具备理解物理因果和规划行动的能力,可应用于机器人、医疗等多个领域解决实际问题。最终目标是将其扩展为通用的世界模型。这标志着AI研究重点可能从当前以LLM为代表的“会聊天”模型,转向能够理解并作用于物理世界的“会做事”模型。
Yann LeCun says that within a year to 18 months, we'll have a general method for training hierarchical world models Thes...
🚨 New Gemini App UI Update This looks so cool 🤩 like I love it , btw use Gemini flash it's routing to Gemini 3.2 Every...
推文以哲学比喻对比互联网与AI时代。互联网时代的底层逻辑是不断缩短“欲望-满足”的循环,产品旨在喂养用户欲望,人被推着走,最终造就“末人”。AI时代则不同,当AI接管大量执行力后,能力不再是瓶颈,人被推向核心问题:你到底要什么?瓶颈变成了方向、判断和承担。这迫使个体进行自我超越,主动选择并承担风险,其本质更接近尼采的“权力意志”,旨在造就“超人”。
"The Cybernetic Teammate" is a fascinating field experiment by a superstar team of researchers, including @raffasadun @e...
too many SF AI discussions reduce to whether you a) believe we are in the singularity b) what part of the takeoff curve ...
Thinking Machines Lab与OpenBMB团队正推动AI交互从传统的“对讲机”式轮转模式,向全双工、时间对齐的微轮转模式演进。其核心是通过Omni-Flow等框架,将视觉、听觉输入与语音、文本输出对齐到统一时间轴,实现感知与响应的同步。作为实践,开源的90亿参数多模态模型MiniCPM-o 4.5已能同时看、听、说,并在多模态能力和语音生成质量上超越了更大规模的模型。这标志着AI交互层的重要突破,使实时、自然的类人对话成为可能,且已具备代码、权重及边缘部署方案。
People talk, listen, watch, think, and collaborate at the same time, in real time. We've designed an AI that works with ...
May I present to you the best chart ever published in an academic paper 👇 It comes from a study of humor designed to te...
I don't think people understand just how bad it will be if an American open source champion doesn't emerge soon and the ...
http://x.com/i/article/2054904722663133186
作者指出,xAI开源后,市面上95%的解读内容是由AI批量生产的同质化废话,分析者甚至没有查看过源码文件。这些内容充斥着“多互动”“账号要垂直”等泛泛而谈的建议,缺乏实际价值。真正隐藏在xAI算法深处的关键机制,大多数讨论者连名字都未曾提及,却在指导他人如何运营X平台。作者呼吁推荐真正有价值的深度解读,并暗示自己通过仔细研读源码获得了不断惊喜的发现。
We are, indeed, living through the singularity - and it has been fascinating to watch this realization slowly permeate t...
Citadel创始人兼CEO Ken Griffin对AI的看法在短时间内发生剧烈转变。他从去年质疑生成式AI无法挖掘超额收益,到近期在斯坦福坦言,AI代理如今能在几天内完成金融硕士和博士需耗时数周甚至数月的高技能工作。这种生产力飞跃已超越炒作,对高技能岗位的自动化影响令他感到震撼与沮丧,并预见到其将对社会产生巨大冲击。这一从怀疑论者到亲历者的快速转变,凸显了AI技术近期发展的颠覆性力量。
CItadel的CEO和创始人肯·格里芬对AI的看法发生了重大转变: "首先,在过去的几个月里,人工智能工具包的生产力发生了飞跃式的变化。它比九个月前强大得多。对我们 Citadel 来说,这使我们能够开发出更广泛的人工智能应用场景。 坦白...
研究指出,在编码智能体需精确定位证据(如符号、函数名、错误信息)的任务中,基于grep的精确字符串搜索比向量检索更具优势。关键在于,检索性能高度依赖智能体的设计框架——结果呈现方式(内联、文件或CLI)会极大影响搜索效果。论文挑战了“智能体栈必须始于嵌入”的默认假设,强调应区分任务类型:是语义发现问题,还是证据定位问题。对于后者,为模型提供原始工具、清晰上下文和精确搜索的框架,往往比构建复杂索引更有效。向量数据库在模糊语义搜索和大规模场景中仍有价值。
研究表明,AI代理使用grep、文件读取等基础终端工具直接搜索原始数据,在多项基准测试中表现远超传统语义检索系统。例如,在BrowseComp-Plus基准上,终端搜索将准确率从69%提升至80%,同时降低成本。核心观点在于,检索不仅是模型问题,更是交互界面问题。直接语料交互允许代理进行精确字符串搜索、检查上下文并持续验证假设,从而从已定位文档中提取更多有效证据,其增益主要来自更充分地利用已发现文档,而非找到更多相关文档。局限性在于,随着语料库规模扩大,定位初始锚点的成本迅速增加,因此终端搜索无法完全替代大型索引。但对于强大AI代理,性能瓶颈可能在于工具允许其“触及”数据的深度。
Citadel创始人Ken Griffin承认,过去几个月AI工具出现阶跃式进步,生产力大幅提升。其公司内部原本需高级金融专家耗时数周至数月完成的高端研究工作,现可由AI代理在数天內完成。Griffin强调这自动化的是极高技能的顶尖认知劳动,非普通白领工作,他对此深感震撼与忧虑,认为将对社会产生戏剧性冲击。金融已成为AI首个杀手级应用场景,法律、医疗等行业将紧随其后。建议普通人立刻转向使用智能体AI、掌握设计多代理工作流,并让AI承担大部分重活,自身专注于判断与洞察。
A big pivot from Ken Griffin on AI: "Number one is, in the last few months, there has been a step change in the producti...
微软AI CEO Mustafa Suleyman预测,AI将在18个月内实现人类水平的性能,自动化大多数专业任务,包括会计、法律、营销和项目管理。他在Fortune采访中指出,所有涉及“坐在电脑前”的白领工作都将被AI完全取代。Suleyman透露自己的使命是构建“超级智能”,并展望未来创建新AI模型将像制作播客或写博客一样便捷。
斯坦福论文论证,在相等推理令牌预算下,单个LLM解决多跳问题通常比多代理系统更有效。核心在于单代理能保持完整的内部思维链,而多代理需将思维分割为消息传递与交接,每次交接都压缩信息并导致丢失,这以数据处理不等式为形式化解释。实验在多个模型和数据集上验证,预算匹配时单代理表现等同或优于多种多代理设置。多代理的常见增益可能源于额外计算或评估偏差,而非架构优势。论文建议,多跳推理应默认从强单代理开始,仅当单代理上下文受干扰退化时,才将多代理结构作为修复策略使用。
When do you reach for other models instead of Codex? What can we do better? Hit me with all of your frustrations. dms op...
Anthropic CEO Dario Amodei在《华尔街日报》YouTube频道采访中表示,软件成本将急剧下降,可能基本免费,传统软件需百万用户分摊成本的前提将不再成立。同时,数十年来建立的许多工作和职业可能消失。Amodei认为社会能够应对并适应这种变化,但他警告人们目前完全未意识到即将到来的变革及其巨大规模。
Anthropic CEO Dario Amodei 指出,AI将引领一个前所未有的颠覆性时代:经济可能实现5%-10%的高GDP增长,但同时伴随高失业率与不平等加剧。他举例称,软件成本将大幅下降甚至近乎免费,传统软件商业模式的前提或将瓦解。尽管目前工程师可转向编辑或升级工作,但AI模型将持续承担更多任务,导致许多延续数十年的职业逐渐消失。他强调,社会尚未充分意识到这场变革的巨大规模与冲击,对此他既感到兴奋又深表担忧。
Anthropic CEO Dario Amodei : "Software is going to become cheap, maybe essentially free. The premise that you need to am...