“奥德赛时期”指年轻人毕业后的迷茫状态,源于旧有清晰路径在互联网时代结束后失效。作者认为,即便在过去,这条路径也少有人走通。问题的核心在于是否承担真实风险与创造价值。在大厂打工常感无意义,因为个人决策无真实后果,高薪可能成为诅咒。真正的成长来自“风险共担”,进化需要筛选力量。AI时代,执行力可交给模型,稀缺的是想象力、判断力与改变世界的冲动。AI无法替人承担风险,人的选择因生命有限而真实。真正的安全垫并非稳定工作,而是自身的快速成长与“创造-验证”循环。人的一生皆是奥德赛时期,需持续在真实世界中冒险进化。
Antigravity 要崛起了? 不太能想象到,唯一的可能,是 Gemini 4 真的断档的强?全面内置 Nano Banana Pro 和 Veo 4? 不过即便这样,也很难再动摇 Codex 和 Claude Code 了吧?
Very excited for all the stuff the @antigravity team has been cooking :)
The new thing in San Francisco is no longer chief of staff or MTS. It's wizards. Everybody's got to have a wizard. If yo...
菲尔兹奖得主陶哲轩指出,当前大语言模型(LLM)的数学基础(线性代数、矩阵乘法、微积分)其实很简单,本科生即可掌握。我们清楚如何构建和运行这些模型。真正的核心谜题在于,我们无法可靠预测它们为何在某些任务上表现出色,却在另一些任务上失败。关键在于现实世界的数据(如自然语言)处于“中间地带”——既非纯噪声,也非完全结构化,而是部分有序、部分随机。目前数学界对此类中间状态的理论非常薄弱,导致我们能描述模型机制,却无法解释其能力跃升或给出可靠的任务级预测。这种“简单机制”与“难以预测的行为”之间的矛盾,是当前AI领域的核心难题。
Terence Tao says the math behind today's LLMs is actually simple. Training and running them mostly uses linear algebra, ...
AI创业当前的核心挑战并非技术实现,而是功能同质化导致产品发布门槛提高。随着大模型降低开发成本,功能稀缺性已消失,价值转向独特的情感触点与用户连接。模型厂商正直接涉足垂直领域,挤压中间层生存空间,正面竞争模型能力难以取胜。未来或涌现众多“小而美”产品,像泡泡玛特一样,依靠独特品味、社群认同和世界观吸引付费用户,重新定义好产品的标准。
Box CEO Aaron Levie认为,AI是继大型机、PC、互联网和云之后又一次十年一遇的平台迁移,目前仍处早期,存在约三年的黄金创业窗口。成功关键在于在此期间建立起数据和工作流的优势,以构建结构性护城河。他反驳了“AI将取代软件工程师”的观点,指出部署、集成和问责仍需人类,并提出了“问责差距”概念。看好的方向包括垂直AI、Agent基础设施及AI能显著提升效率的专业服务公司。
Atomic Bot发布基于本地模型Qwen 35B的真实任务对比视频,显示OpenClaw在任务完成时间(12分01秒)和token效率上优于Hermes Agent(33分01秒)。OpenClaw创始人@steipete转发结果并强调性能策略见效。Hermes联创@Teknium反驳基准不科学,指出单次运行、模型随机性等问题,并引用公开质量基准及真实用户数据证明Hermes领先,如用户日token量已达OpenClaw的2.5倍。双方各执己见,凸显了AI代理评估标准的争议。
Looks like our focus on performance paid off.
用户集中批评了Claude Code Desktop的几项设计缺陷:会话模式缺乏智能记忆,默认沿用上次的Plan模式;项目管理混乱,所有项目混杂在侧边栏;右侧面板并排布局,多开时相互挤占空间;此外,用户认为将Cowork和Code拆分为两个独立产品并无必要。
Claude Mythos模型近日意外出现在Google Cloud控制台,且其预览标签已消失,观察者据此猜测Anthropic可能正准备公开发布该模型,类似此前Opus 4.7发布前的先例。然而,Anthropic曾多次公开表示,出于风险考虑不会发布Mythos,且该模型已被证实能力极强,因此部分观点认为该公司此刻进行彻底转向并发布该模型的可能性极低,这也会使其显得不够专业。用户对此表示困惑,强调无法想象任何发布场景,并引用推文示例佐证模型实力。整体上,事件引发猜测,但基于官方立场,实际发布概率被认为较小。
Claude Mythos now appears in the Google Cloud console, which was not the case yesterday The preview label is also gone. ...
该可解释性论文聚焦工具使用代理,通过探测隐藏状态发现模型常能识别应调用工具,但实际调用失败,不匹配率达26%-54%。问题完全集中于认知到行动的过渡阶段,而非认知本身。内部探测方向可解码,但后期层的最后令牌机制使信号旋转,几乎与产生的行动正交。研究旨在预测干预措施效果,指出常见归因如提示或训练不足可能忽略后期层几何结构,这为工具使用提示A/B测试中的性能上限提供了合理解释。
Yeah that was a lot lol. Lots more to fix. Nice work @steipete https://clawpatch.ai/
Codex usage limits have now been reset across all paid plans. Enjoy the weekend!
Greg Brockman转发的Codex Skill "Complexity Optimizer"通过一行npx命令安装,能在几秒内扫描代码库,精准定位O(n²)、N+1查询等性能问题,并提供文件、行号、优化建议和风险等级。其核心设计是仅报告问题而不自动修改,将决策权留给开发者。这标志着AI的关注点正从“更快地写代码”转向“发现人类难以察觉的复杂问题”,将十年项目经验才能积累的诊断能力封装成可一键调用的技能。未来,类似的安全审计、架构检测等工具将大量涌现。资深开发者的护城河因此被重新定义:从依靠个人眼力发现问题,转向依靠业务判断力来评估和落地AI提供的解决方案。
codex for improving computational complexity
American science is at extraordinary risk. NIH has awarded less than half as many grants as it has compared to the past ...
gotta say Codex is completely unrecognizable from 3 months ago. guys went extreme founder mode on this thing @gabrielchu...
The latest CodexBar update renders API costs wayyyy nicer. https://codex.bar
陶哲轩指出,大型语言模型(LLMs)的训练和运行主要基于线性代数、矩阵乘法和微积分等简单数学,本科生即可掌握。然而,核心谜团在于LLMs为何在某些任务上表现卓越,却在其他任务上失败,且无法提前预测。这源于现实世界数据的性质:它介于完全噪声和完全结构化之间,而数学对此中间状态的理解薄弱,类似于物理学在原子和连续介质之间的介观尺度困境。因此,尽管我们能描述LLMs的机制,却无法解释其能力跳跃或提供可靠的任务级预测。简单机制与难以预测行为之间的不匹配,构成了当前研究的核心难题。
推文引用控制论对智力的定义:智力=速度x正确,即单位时间内做出正确选择的能力。作者指出,AI能极大提升速度(如编程),但无法保证“正确性”,尤其体现在无法做出能直接创造商业价值的核心战略选择(如决定开发何种产品)。作者认为,当AI能告知“做什么能直接赚钱”时,才意味着在智力上达到了AGI水平。
@Gavriel_Cohen and @thsottiaux casually dropping some hints on the Codex roadmap in his keynote! https://x.com/angadsg/s...
一位开发者重新使用Sublime Text,因其内存占用仅300多MB,远低于动辄占用10GB以上的VSCode。转变的主要原因是其工作流发生变化:现在基本无需手写代码,导致VSCode的许多高级功能变得不再必要。相比之下,Sublime Text提供的语法高亮和基础文件编辑功能已完全满足其当前需求,突显了在AI辅助编程时代,轻量级编辑器因其资源效率而重新获得青睐的趋势。
All @aiDotEngineer SG talks kick off in 22 mins! Tune in live: https://www.youtube.com/watch?v=_xQnSNlBP_w - @VivianBala...
AI智能体通过记忆功能形成使用先发优势,预计12个月内将出现能自主学习并替代人类工作的智能体。本地模型使AI产品可在终端设备运行,为医疗、法律等受监管行业提供无数据隐私风险的解决方案。企业需将内部流程与知识转化为AI可读的“第二大脑”,而代理成本正逐步取代传统人力成本。智能体可能引发部门间无意识的竞争,公司结构可通过YAML配置文件定义和版本化。输入数据质量直接决定输出效果,技能文件比传统SaaS更具价值,而人类审批环节成为工作流中的主要瓶颈。
More AI agent observations below (I keep adding to the list): 1. Hermes agents write to their own memory after every tas...
本期早报探讨了AI从编程助理向“思考伙伴”的演进。案例包括Google工程师在多语言客户端开发中与AI协同理解与设计系统;Abridge公司利用海量问诊数据构建医疗智能理解层;以及OpenAI复盘Imagen 2.0在文本渲染和多语言支持上的进展,并展望“创意智能体”的未来。这些实践展示了AI正以更深入、融合的方式参与专业协作。
People freaking out over my AI spend. What nobody sees: Part of what excites me so much about working on OpenClaw is tha...
人只有在真实的环境里才能做出正确的决定。 人类学研究表明,人类的决策过程主要是由激素推动的,知识,经验,理智在这个过程中所起的作用并不大。 我们往往是做出决定之后,再用智慧去寻找证据以便证明自己的决定是正确的。 如果决策者本人不承担决策失误...
英伟达CEO Jensen Huang在卡内基梅隆大学告诉2026届计算机科学毕业生,电工、水管工等技工比他们更有前景。数据支持这一观点:Randstad分析显示技工需求增长是白领职位的三倍,机器人技术员职位增长107%,而斯坦福研究发现AI相关职位早期就业下降16%。顶级电工年薪超10.6万美元,无需学位负债。科技公司今年投资7000亿美元建设数据中心,全球到2030年预计达7万亿美元,这些基础设施依赖人力完成,但制造业面临劳动力短缺,每100名新工人进入就有102人离开。AI时代最大赢家是能建设数据中心的技工,而非提示工程师。
Spent some time this week looking at the economic impact of humanoid robots and its so much bigger than digital AI The n...