15:02

IT之家（RSS）

AI 老板 500 天模拟经营：多数模型亏惨，Claude Fable 5 独占鳌头

普林斯顿大学发布 CEO-Bench 基准测试，模拟创业公司 500 天经营，启动资金 100 万美元，评估 AI 模型担任 CEO 的能力。多数模型在 500 天后破产。最佳单次运行中，Claude Fable 5 期末现金达 4715 万美元，是唯一多次运行均高于初始余额的模型；Claude Opus 4.8 为 2778 万美元，GPT-5.5 为 2130 万美元。Grok 4.20 平均仅存活 28 天，DeepSeek V4 Pro 和 Gemini 3 Flash 亦全部破产。基于规则的基准模型最终余额为 1580 万美元。

智能体 Anthropic 推理评测/基准

15:02

IT之家（RSS）

优必选创始人周剑：机器人将替代手机，成为AI最核心的交互终端

在2026年度全球发布会上，优必选创始人周剑指出，机器人将替代手机成为AI最核心的交互终端，用户用自然语言下达指令即可获得服务与情感陪护，交互方式从手动变为口述，奠定机器人在家庭的终端入口地位。同日，优必选宣布超仿生人形机器人优世界U1系列订单已突破1万台，力争今年交付。该机器人主打情感陪伴，分男女两款，各搭载88个高自由度运动关节。作为对比，2025年全年优必选全尺寸具身智能人形机器人总销量为1079台。

具身智能大佬观点

14:48

向阳乔木@vista8

OODA循环：AI竞争的核心是迭代速度

推文引用摩根大通CEO杰米·戴蒙的说法，他曾用OODA循环（观察-定向-决策-行动）评估复杂业务场景。该模型由美国空军上校约翰·博伊德在1970年代初提出，用于解释空战中如何快速做出正确判断。作者认为，未来大模型或AI组织的竞争本质也是如此——谁自我迭代循环得更快，谁就能赢得优势。

现象/趋势

14:36

karminski-牙医@karminski3

SGLang DSpark实测：1.81倍加速，预测3个token

SGLang的DSpark在PR中放出实测数据，可预测3个token（数学类3.37，日常对话3，代码3.52）。1K长度prompt下加速比达1.81倍，8卡B200速度297 token/s（无DSpark为164 token/s）。单并发提升最高，超过8并发仅1.2‑1.3倍。TPOT仅2.9‑5.2ms，延迟可忽略。该PR（#29538）尚未合并。

开源/仓库推理部署/工程

14:33

SemiAnalysis@SemiAnalysis_

Nvidia下半年数据中心收入预期高20% Rubin大幅爬坡

SemiAnalysis 指出，Nvidia 今年下半年将迎来大幅增长，其加速器模型估计 Nvidia 数据中心计算收入在 FY2027 下半年比共识预期高 20%。Rubin 芯片因早期 HBM4 问题已解决且前端晶圆供应充足，将实现大幅爬坡。这些估计基于供应链（包括材料、制造、组件、服务器集成商到超大规模和前沿实验室）的全面研究。

现象/趋势

14:30

meng shao@shao__meng

新拿到一台 Macbook，第一反应是：打开 Safari，下载 Codex 😂 以前还是：打开 Safari，下载 Chrome

现象/趋势编码

14:27

Google Blog：AI（RSS）

英国职场AI采用率翻倍，仅15%"AI先锋"获得晋升加薪优势

Google UK与Public First研究发现，英国职场AI采用率一年内从34%升至73%，但呈不均衡曲线。仅15%的“AI Trailblazers”（深度用户）晋升概率高84%、绩效高88%、加薪概率高55%，每周节省近8小时。其余85%仍处于旁观、实验或实践阶段。阻碍因素包括：一次即弃的提示词习惯、搜索框思维、缺乏明确使用许可。Public First推出AI技能测验，Google的“AI Works for Britain”计划支持2030年前培训1000万工人AI技能的目标。

Google 现象/趋势

13:59

OpenCode@opencode

GLM 5.2 在每次会话成本上排名最高而且大家都在盛赞这个模型这意味着，如果每次会话成本高，那可能反而是模型有用的标志

开源生态现象/趋势

13:59

Rohan Paul@rohanpaul_ai

Perplexity CEO Aravind Srinivas 指出，出口管制是前沿模型与开源模型仅存在12个月差距的唯一原因，但这可能反而迫使中国在物理层变得更强。中国在建设数据中心方面拥有显著优势--电力、许可、劳动力和专业知识均不成问题。通过出口管制迫使中国发展这些基础设施，反而可能将其转化为更强大的竞争对手。这解释了为何Anthropic极力游说加强出口管制。

Rohan Paul: Aravind Srinivas just explained why China's open-source AI may become more powerful than ever. And why Anthropic has lob...

Anthropic 大佬观点开源生态

13:20

数字生命卡兹克@Khazix0918

体验具身智能数据采集员：给机器人打工的魔幻一天

全球高质量真实物理交互数据截至2026年初仅约50万小时，不足大语言模型训练数据的两万分之一，而训练通用机器人需千万小时级别，因此大量人工采集成为必需。该岗位无学历经验要求，面试先问身高体重（因手套固定规格），通过率极高。试岗需穿戴设备进行遥操作或示教采集，重复叠衣服、分拣积木等简单动作。兼职日结，吸引各行各业的人。作者小伙伴达达亲身体验，感叹其魔幻与现实。

具身智能数据/训练现象/趋势

12:27

Berryxia.AI@berryxia

乔纳森的OpenAI 首作产品，真的没有什么新鲜玩意了。

OpenAI 评测/基准

12:27

TechCrunch：AI（RSS）

精选71

AI就业争论变得更加混乱

截至2026年5月，AI相关裁员接近9万个，预计未来五年美国最多15%的岗位将被AI替代。但Ramp与Revelio Labs对近22,000家公司的报告发现，高AI投入企业（前三个月人均月均支出30美元）总员工数增长10.2%，入门级岗位增长12%。报告认为AI并非普遍导致岗位消失，而是在资源充裕的科技企业里成为扩张工具——降低工程、销售、客服等职能的生产成本，从而推动整体增员。但仅购买订阅而未持续投入的公司未见人头增长，可能加剧企业间的资源鸿沟。

其他现象/趋势

推荐理由：报告用雇佣数据驳斥了「AI消灭就业」的简单说法，付费多的公司反而在扩招甚至增加初级岗，但样本都是快速增长的科技公司，分化隐忧仍在，值得人力决策者细看。

12:02

IT之家（RSS）

Claude Code 负责人称未来员工将身兼数职，工程产品设计融为一体

Claude Code 负责人鲍里斯·切尔尼认为工程、产品和设计正逐渐融合。他将其团队成员分为五类：原型设计者、构建者、清理者、增长者和维护者，许多成员身兼多职。健康团队需具备全部五种能力，未来产品岗位可能不再按专业领域区分。Figma CEO 迪伦·菲尔德也认同传统职位边界正在消失，部分企业已弃用“管理者”称谓。切尔尼强调角色会随时间和项目改变，且 Claude 能在不同程度上协助所有类型工作。

Anthropic 大佬观点编码

11:58

Orange AI@oran_ge

Oran Ge 公司 AI Native 转型深度实录

36氪记者 Jessy 到 Oran Ge 所在公司访谈，超过 10 小时录音梳理成文。文章记录了该公司过去一年多真实挣扎与决策：如何在梦想与盈利间平衡，带领团队穿越缺少答案的阶段，以及重构 AI 时代的工作方式。作者将其视为时代剧变下的自身观测点，对读者而言，其中的取舍与挣扎具有参考价值。

智能体大佬观点

11:36

Hacker News 热门（buzzing.cc 中文翻译）

hyperscript 解析bug修复：AI分析高效但修复方案欠佳

hyperscript 0.9.91版本出现回归：表达式fetch \{% url 'trade:get_symbol_data' %}?symbol=${symbol}\ as JSON中as JSON被错误地当作表达式转换而非fetch修饰符。作者用Claude快速定位根因——重构时提取的parseURLOrExpression()方法让fetch后接完整表达式，导致as被表达式消费。Claude提出两个修复方案：第一个仅支持字面字符串，无法处理fetch $url as JSON；第二个引入noConversions标志，增加不必要的上下文敏感性。作者最终利用hyperscript已有的“follows”机制简洁解决问题。案例展示了AI在问题分析上的高效与在设计优雅修复上的局限，印证了“巫师学徒”陷阱。

大佬观点开源生态编码

11:36

小互@xiaohu

精选81

一个人管理5款产品，80%时间不写代码？Every的复利工程

媒体软件公司Every公开「复利工程」方法论，以单人工程团队维护5款产品。核心是四步循环：Plan→Work→Review→Compound，其中Compound将每次解决问题的解法写入CLAUDE.md和docs/solutions/，使AI下次自动避坑。工程师80%时间花在Plan和Review，仅20%用于写代码。配套开源插件支持Claude Code等，含26个专项agent、23条工作流命令、13项技能，可零配置使用。/workflows:review一次并发14个agent审查代码，/workflows:plan在ultrathink模式下可并发40多个研究agent。

智能体教程/实践编码部署/工程

推荐理由：Every把内部单人维护5款产品的方法论和插件开源了，14个AI同时审代码、40多个研究agent做计划，是目前公开的多agent并行工程里数字最具体的参考之一，做AI辅助开发的可以直接上手抄。