Anthropic 发布 Claude Fable,这是一款提供截然不同推理体验的 AI 模型。它擅长规划与生成复杂代码库,在需要精确构建代码结构或理解程序员深层需求的场景中,其表现相比 Claude Sonnet 有了大幅提升。用户描述与它协作更像与一位直觉敏锐的资深工程师合作,其对代码意图的捕捉和方案生成能力令人惊叹,但并非通用型 AI。
同一事件,精选展示《Claude Fable 5 和 Claude Mythos 5》Anthropic 发布 Claude Fable,这是一款提供截然不同推理体验的 AI 模型。它擅长规划与生成复杂代码库,在需要精确构建代码结构或理解程序员深层需求的场景中,其表现相比 Claude Sonnet 有了大幅提升。用户描述与它协作更像与一位直觉敏锐的资深工程师合作,其对代码意图的捕捉和方案生成能力令人惊叹,但并非通用型 AI。
同一事件,精选展示《Claude Fable 5 和 Claude Mythos 5》Claude 5 Fable tl;dr - It is state-of-the-art on nearly all tested benchmarks of AI capability, showing exceptional perf...
微软 AI 部门 CEO 穆斯塔法·苏莱曼在昨天的播客节目中收回其此前“白领工作将在 12-18 个月内被 AI 完全自动化”的言论,改口称 AI 将帮助白领完成发邮件、与同事沟通、制作 PPT 等重复性任务,而非直接取代职业。他表示这些工作本身依赖人工且耗时,技术发展的方向是让生活更轻松、更高效,白领职位不会因此消失。
Introducing Searchmaxxing. The new discipline for being visible everywhere AI looks. Across all platforms. This is how b...
http://x.com/i/article/2057694226981257216
前钉钉副总裁、AI产品负责人马锐拉(汪佳敏)5月15日办完离职手续,告别三年阿里生涯。他在文中提及钉钉内部7.5万字长文《置身钉内》,该文由“ONE”项目核心产品经理滕雅辛执笔,复盘了AI产品从立项、冲高至300万DAU再到收缩的全过程。马锐拉心疼那些认真挣扎过的同事,坦言自己越来越难确认是在创造产品还是消耗身体,曾长期一周工作7天、每天9点到凌晨2点。他称对钉钉爱得深沉,阿里仍是伟大公司,唯一遗憾是无法陪它走完下一个十年。
设计真正的AI系统涉及大量工程细节,提示词工程、上下文工程、记忆模块、skills等环节缺一不可,彼此环环相扣形成了一个完整系统。Berry Xia引用了一篇关于Loop Engineering的清晰阐述,强调这些组件的系统性整合才是关键。
http://x.com/i/article/2064143847765020672
苹果WWDC 2026落幕,核心仍是AI。Apple Intelligence新架构:与Google Gemini合作开发5个模型;端侧分AFM 3 Core(3B)和AFM 3 Core Advanced(20B MoE)。新Siri正式命名Siri AI,基于系统编排器融合上下文理解、App Actions、屏幕感知等能力,支持连续对话、跨平台同步及独立App,但未展示自主Agent能力。视觉智能、全系统听写、写作工具等同步更新。目前仅支持英语,国区不可用,可用时间未知。
Noam Brown指出,LLM基准性能日益依赖测试时计算,当前标准评估因忽略推理预算而低估模型能力。以GPT-5.5与GPT-5.4为例:控制测试时计算后,5.5表现远超5.4。Karpathy的自动化实验和AISecurityInst的网络评估均显示,即使消耗超1亿token,强模型性能仍持续提升。Brown建议改用性能-测试时计算曲线评估,安全评估也应计入推理预算,如Gemini 3 Deep Think发布时未配套风险说明,关键在于业界未统一考虑测试时计算。
马斯克近日宣布SpaceX/xAI太空计算蓝图:首颗AI卫星采用Starlink太阳能技术,峰值功率150千瓦、持续算力120千瓦,翼展70米,配110平方米液体散热器,通过星舰发射,使用激光链路通信。计划建设Terafab太空算力工厂,占地约1亿平方英尺(特斯拉Giga Texas的10倍),算力供应达1TW/年,相当于当前美国年消耗量(0.5TW)的两倍。目标将数据中心送入太空捕获太阳能,实现卡尔达肖夫等级跃迁。该项目依赖星舰完全可复用技术,预计三年内将年入轨量从约2500吨提升至百万吨级。
没有熬夜的兄弟们来看,WWDC 2026 速览! 另插一嘴,Apple真的没有特别的新东西。 一、历史性时刻 1库克谢幕:Tim Cook最后一次以CEO身份主持WWDC,9月1日将交接给硬件工程副总裁John Ternus 2基调延续:发...
Claude Code 负责人Boris Cherny与Cat Wu回顾一周年核心方法论:每次Claude犯错写入CLAUDE.md或Skill持久化规则而非口头纠正;Verification指agent亲自跑起来验证(如启动模拟器、computer use测试)。Auto Mode取代Plan Mode,用独立分类模型筛权限风险而非人工审批。Routines实现自动化运维(如监听GitHub bug自动提PR)。Context Minimalism主张最小system prompt和工具集。团队预判未来agent运行更久、成百上千并行,产品形态将巨变。
Claude Code's first demo got two Slack reactions. One year after GA, @bcherny and @_catwu look back: verification best p...
Google DeepMind CEO Demis Hassabis在Google I/O和斯坦福对谈中称,我们正站在奇点山脚,AGI约2030年出现,将进入新人类时代,社会需重视并做准备。这位一向保守的科学家此次改口引发广泛关注。
苹果在 WWDC 2026 推出全新 Siri AI,采用定制的 Gemini 衍生模型运行于 Private Cloud Compute,并利用视觉 LLM 从屏幕提取信息,绕开了已有应用单独集成 Apple Intelligence 的需求。同时发布 Core AI 库,集成 Meta 的 PyTorch 生态,允许开发者在苹果硬件上将 PyTorch 模型转换为 Core AI 程序运行。iOS 27 Developer Beta 已上线,但用户需通过等待列表才能使用新 Siri AI。
Nathan Lambert 批评 AI 领域过度关注持续学习与样本效率,认为这如同专注于弥补弱点而非最大化优势。人类大脑虽是存在性证明,但未必是 AI 最佳路径。前沿实验室实际加速推进现有开发树,对进步有利,但对安全与地缘政治影响复杂。他引用 @dwarkesh_sp 的观点:数据是进步主要驱动力,开源与后来者可通过从公开 API 蒸馏数据快速追赶前沿,而超参数、训练技巧等难以复制。他认为未来已来,AGI 研究应拥抱未知、规模化资源,而非等待不确定的科学突破。
New blog post: on the million-x sample efficiency gap between AIs and humans, and whether it matters: "The reason it is ...
马斯克称,要达到1000太瓦(TW)的AI电力,即从当前1太瓦/年增长1000倍,唯一途径是在月球建造质量驱动器。方案是在月球本地生产光伏板和散热器,芯片可从地球运来或在月球制造。由于月球无大气且重力仅地球1/6,可用电磁轨道炮(线性电动机)将AI卫星射入深空,无需火箭。
Elon Musk 提出,要将 AI 计算从每年 1 太瓦扩展到 1000 倍,唯一可行方案是在月球上建造质量驱动器(mass driver)。他设想在月球本地生产光伏板和散热器,芯片可能从地球运抵或直接在月球制造。利用月球无大气、仅 1/6 地球重力的条件,通过电磁加速器(线性电动机)将 AI 卫星射入深空,无需火箭运载。
Elon Musk 在 SpaceX 技术更新中指出,太空“永远晴天”,太阳能持续高功率且近乎零边际成本;真空环境仅靠辐射散热,无需风扇或水。结合 Starship 低成本入轨发射,可避免建造地面电站或受制于电网、土地、冷却限制。他估计 2–3 年内,太空将成为产生 AI 算力成本最低的方式,能经济扩展至太瓦级芯片集群。SpaceX 已具备大规模制造、发射、运营 AI 卫星的能力。
Watch @ElonMusk provide a technical update on SpaceX's capability to manufacture, launch, and operate AI satellites at s...
From op-eds in newspapers to NeurIPS position papers, AI is increasingly shaping long-form public discourse. Its argumen...
Elon Musk 指出人类要成为卡尔达舍夫文明需突破三大瓶颈:一、质量到轨道——借助 Starship 实现将数百万吨基础设施(太阳能阵列、散热器、工厂、数据中心)送入太空,大幅降低发射成本;二、发电——在太空部署太瓦级太阳能系统,获取太阳能量的可观份额,而非仅依赖地球资源;三、AI 芯片——太瓦级能源需要太瓦级计算力,先进芯片是星际文明的关键要素。当前人类在卡尔达舍夫尺度上还几乎未入级。
NotebookLM 前核心成员创立的 Huxe 已下架。该产品将邮件、RSS 一键转为可语音交互的播客,但缺乏网络效应和商业模式,按 token 收费无法产生 ROI。作者同期开发 ListenHub,后转向创作者模式,现自负盈亏,预计可再活十年。
今天才发现,NotebookLM 前核心成员出来创业的明星产品 Huxe 居然已下架。有段时间很喜欢。 Huxe 创立于 2024 年,融了很多钱。核心功能是把邮件、RSS 等一键变成可语音交互的播客。很有创意和品味。 品味明显并没有成为 ...
马斯克阐述卡尔达肖夫指数:I型文明能利用行星全部能量,II型能利用恒星全部能量,III型能利用星系全部能量。目前人类处于I型极低水平,仅利用地球能源的极小部分,几乎未利用太阳能源。太阳占太阳系总质量的99.86%。马斯克认为AI将帮助实现III型文明。
Here is our current plan for OpenAI: https://openai.com/index/built-to-benefit-everyone-our-plan/
同一事件,精选展示《OpenAI 公布让 AGI 造福所有人的计划》OpenAI 发布计划,阐述让 AGI 造福所有人的愿景。该计划聚焦于 AI 的可及性、安全性和共享繁荣,确保技术进步惠及每个人。
关联讨论 3 条X:Rohan Paul (@rohanpaul_ai)IT之家(RSS)X:Sam Altman (@sama)Cursor 招聘设计工程师了,非常令人心动,但我还犹豫着不能行动; 我在字节工作了8年,一直游走在动效设计师和设计工程师之间。最近我的团队(豆包手机团队)也在招聘设计工程师,但是我们需要的方向更多要有一些对 Android 平台的了解,和...
Gary Marcus 在博文中引用“幻想之地”的比喻,指出整个 AI 行业建立在不合理的数学基础之上。
在 2026 年全球开发者大会上,苹果软件工程高级副总裁 Craig Federighi 抨击企业急于将 AI 塞进生活各个方面而不顾及最终服务对象的现象,强调真正有用的 AI 必须以用户和用户的需求为中心。他透露新一代 Apple Intelligence 技术将使苹果产品更加个性化和实用。
将AI比作一个闪耀着能力的星系,其核心存在一个肉眼不可见的巨大黑洞——数据。这个比喻揭示了AI模型惊人能力背后对海量数据的依赖,样本效率的瓶颈如同引力中心,将各色能力凝聚在一起。
Siri update - image understanding - more conversational - reworked voice-tone / sound. Sounds real human
Apple Intelligence sounds like a very good update. But did I miss all the relevant (nerd) stuff like paramters, evals in...