🚨 ChatGPT is running TWO A/B tests at once right now: → text model → image model both showed up yesterday and today. ca...
在智能出行峰会上,Elon Musk展望了由AI和机器人驱动的未来。他透露,特斯拉完全自动驾驶系统(FSD)及无人驾驶出租车业务预计将于2026年底前在美国和以色列推出。他构想人形机器人将远超人类数量,创造巨大物质丰富,甚至可能实现“普遍高收入”。Musk强调,星舰的快速可复用性是实现火星殖民的关键,而Neuralink等脑机接口技术旨在恢复残障人士的功能。整体上,他平衡了乐观与风险意识,认为自主技术、机器人、太空探索与脑机接口共同致力于提升文明未来的概率。
Back at the airport, on my way to the US for Google I/O. I'm really hoping we'll also see some announcements around the ...
前微软高管指出,尽管微软每季度投入巨额资金于AI,但其Copilot等产品的实际用户付费率极低,未能有效激发市场热情。硬件厂商在笔记本电脑中内置NPU芯片,却未能催生出具有吸引力的杀手级应用,这反映出即使是擅长分发的巨头,若产品本身缺乏足够的拉动力,也难以取得成功。与此同时,该高管也强调微软在企业市场拥有的强大护城河依然稳固。这种矛盾的现状,使得未来18个月对微软AI战略的走向至关重要。
欧洲AI公司Mistral的首席执行官近日警告,欧洲在人工智能竞赛中正落后于美国和中国,并强调其AI“主权”正面临风险。他明确指出,欧洲只有两年的时间窗口来采取行动,否则将沦为美国的AI“附庸国”。该公司作为欧洲AI领域的代表,呼吁必须立即加强欧洲自身的AI研发与产业生态。
Anthropic CFO在访谈中透露,公司今年一季度年化营收从90亿美元猛增至300亿美元以上。算力被高效复用以同步支持模型训练、内部研发和客户服务,CFO近半时间投入算力决策,强调需超越线性思维进行情景规划。内部研发形成“更好模型驱动更快研发,进而产出更优模型”的飞轮效应,同时降低对外服务成本。公司超90%代码由Claude Code完成,显著提升效率;在可解释性与对齐研究上的投入,则增强了客户信任,形成差异化优势。
本文作者以资深工程师的视角,阐述了其不采用“凭感觉编程”(Vibe Coding)的原因。核心论点是:AI工具主要缓解了软件开发中编写代码等“偶然复杂性”,但无法触及设计健壮、可维护系统架构这一“本质复杂性”,后者仍需依赖深厚的人类经验与判断。作者进一步指出,大语言模型(LLM)仅在符号层面运作,缺乏人类对上下文、社会现实及模型自身局限性的“元认知”能力,无法审问和反思数据与抽象背后的简化与遮蔽。因此,他认为构建清晰系统的关键仍在于人类的专业判断与反思。
Linus Torvalds 发布 Linux 7.1 第四个候选版本,并批评 AI 工具导致大量重复 bug 报告,使安全列表难以管理。他强调开发者应直接提交修复方案,而非仅报告问题,以减少不必要工作。Linus 表示自己过去20年更多担任技术维护者,AI 只是工具,不会替代程序员。
if you think AI chatter has reached an annoying level right now you're in for something else. it's going to be the only ...
We got bored. Time for Man vs. Machine https://x.com/i/broadcasts/1qGvvkQMgNgGB
Addy Osmani 警示工程师过度依赖AI生成代码会导致“认知投降”,即牺牲深度理解换取效率。研究显示,依赖AI会削弱问题理解、脑部活动和决策质量。产品设计追求效率,但学习恰恰发生在“摩擦力”中。AI委托在样板代码中有效,但在调试、AI犯错、底层变化、处理独特问题及面对市场价值重估时必然失败。作者建议应形成假设再提问、先要解释再要代码、开启学习模式、审阅AI输出如PR、徒手重写代码,并区分“交付”与“学习”指标,避免用未来能力换取短期轻松。
http://x.com/i/article/2055936913211899904
Meta AI首席科学家Yann LeCun预测,未来12到18个月内将出现训练分层世界模型的通用方法。这些模型将从视频和真实世界数据中学习,具备理解物理因果和规划行动的能力,可应用于机器人、医疗等多个领域解决实际问题。最终目标是将其扩展为通用的世界模型。这标志着AI研究重点可能从当前以LLM为代表的“会聊天”模型,转向能够理解并作用于物理世界的“会做事”模型。
Yann LeCun says that within a year to 18 months, we'll have a general method for training hierarchical world models Thes...
🚨 New Gemini App UI Update This looks so cool 🤩 like I love it , btw use Gemini flash it's routing to Gemini 3.2 Every...
前微软高管Mat Velloso批评公司AI战略存在严重失误。尽管微软每季度投入高达375亿美元,但其王牌产品必应未能从谷歌手中夺取市场份额,Windows和Office中强推的AI功能付费用户活跃度也不足3%。由于未能创造高价值新场景,用户反应冷淡,导致投资回报严重失衡。面临成本与股东压力,微软被迫开始倾听用户反馈。Velloso指出,微软重复了错过互联网与移动浪潮的错误,再次陷入战略被动。
推文以哲学比喻对比互联网与AI时代。互联网时代的底层逻辑是不断缩短“欲望-满足”的循环,产品旨在喂养用户欲望,人被推着走,最终造就“末人”。AI时代则不同,当AI接管大量执行力后,能力不再是瓶颈,人被推向核心问题:你到底要什么?瓶颈变成了方向、判断和承担。这迫使个体进行自我超越,主动选择并承担风险,其本质更接近尼采的“权力意志”,旨在造就“超人”。
"The Cybernetic Teammate" is a fascinating field experiment by a superstar team of researchers, including @raffasadun @e...
too many SF AI discussions reduce to whether you a) believe we are in the singularity b) what part of the takeoff curve ...
Thinking Machines Lab与OpenBMB团队正推动AI交互从传统的“对讲机”式轮转模式,向全双工、时间对齐的微轮转模式演进。其核心是通过Omni-Flow等框架,将视觉、听觉输入与语音、文本输出对齐到统一时间轴,实现感知与响应的同步。作为实践,开源的90亿参数多模态模型MiniCPM-o 4.5已能同时看、听、说,并在多模态能力和语音生成质量上超越了更大规模的模型。这标志着AI交互层的重要突破,使实时、自然的类人对话成为可能,且已具备代码、权重及边缘部署方案。
People talk, listen, watch, think, and collaborate at the same time, in real time. We've designed an AI that works with ...
May I present to you the best chart ever published in an academic paper 👇 It comes from a study of humor designed to te...
I don't think people understand just how bad it will be if an American open source champion doesn't emerge soon and the ...
http://x.com/i/article/2054904722663133186
人工智能被重新定义为一项基础技术,而非独立产品。一篇发布于2026年5月17日的文章强调,AI的核心是技术演进,类似于电力或互联网,它赋能各种应用但本身不是终端商品。这一观点在Hacker News上获得101点,反映科技社区的高度认同。文章指出,AI的集成正驱动行业变革,但其技术属性应优先于产品化,以避免误解并推动持续创新。当前趋势显示,AI作为工具正渗透到多个领域,但本质仍是支撑性技术。
作者指出,xAI开源后,市面上95%的解读内容是由AI批量生产的同质化废话,分析者甚至没有查看过源码文件。这些内容充斥着“多互动”“账号要垂直”等泛泛而谈的建议,缺乏实际价值。真正隐藏在xAI算法深处的关键机制,大多数讨论者连名字都未曾提及,却在指导他人如何运营X平台。作者呼吁推荐真正有价值的深度解读,并暗示自己通过仔细研读源码获得了不断惊喜的发现。
We are, indeed, living through the singularity - and it has been fascinating to watch this realization slowly permeate t...
Citadel创始人兼CEO Ken Griffin对AI的看法在短时间内发生剧烈转变。他从去年质疑生成式AI无法挖掘超额收益,到近期在斯坦福坦言,AI代理如今能在几天内完成金融硕士和博士需耗时数周甚至数月的高技能工作。这种生产力飞跃已超越炒作,对高技能岗位的自动化影响令他感到震撼与沮丧,并预见到其将对社会产生巨大冲击。这一从怀疑论者到亲历者的快速转变,凸显了AI技术近期发展的颠覆性力量。
CItadel的CEO和创始人肯·格里芬对AI的看法发生了重大转变: "首先,在过去的几个月里,人工智能工具包的生产力发生了飞跃式的变化。它比九个月前强大得多。对我们 Citadel 来说,这使我们能够开发出更广泛的人工智能应用场景。 坦白...
研究指出,在编码智能体需精确定位证据(如符号、函数名、错误信息)的任务中,基于grep的精确字符串搜索比向量检索更具优势。关键在于,检索性能高度依赖智能体的设计框架——结果呈现方式(内联、文件或CLI)会极大影响搜索效果。论文挑战了“智能体栈必须始于嵌入”的默认假设,强调应区分任务类型:是语义发现问题,还是证据定位问题。对于后者,为模型提供原始工具、清晰上下文和精确搜索的框架,往往比构建复杂索引更有效。向量数据库在模糊语义搜索和大规模场景中仍有价值。
研究表明,AI代理使用grep、文件读取等基础终端工具直接搜索原始数据,在多项基准测试中表现远超传统语义检索系统。例如,在BrowseComp-Plus基准上,终端搜索将准确率从69%提升至80%,同时降低成本。核心观点在于,检索不仅是模型问题,更是交互界面问题。直接语料交互允许代理进行精确字符串搜索、检查上下文并持续验证假设,从而从已定位文档中提取更多有效证据,其增益主要来自更充分地利用已发现文档,而非找到更多相关文档。局限性在于,随着语料库规模扩大,定位初始锚点的成本迅速增加,因此终端搜索无法完全替代大型索引。但对于强大AI代理,性能瓶颈可能在于工具允许其“触及”数据的深度。