If you are in SF for AIE week, do come down to Moscone today 5pm-9pm for badge pickup and New Engineer Orientation - meet friends, plan your week, and pay it forward to newbies! if worried about tweet volume, remb u can use the ai eng x community: https://x.com/i/communities/1929211810798043448

译如果你在旧金山参加AIE周，今天下午5点到9点请来Moscone中心领取徽章并参加新工程师入职介绍——认识朋友，规划你的周行程，并向新手伸出援手！如果担心推文太多，记住你可以使用AI Eng X社区： https://x.com/i/communities/1929211810798043448

Rohan Paul@rohanpaul_ai · 4天前58

Central bankers now fear the AI gold rush could seed the next major financial shock. Bank for International Settlements (BIS) just issued one of its sharpest warnings yet about debt building behind the AI boom. The danger is not AI itself; the danger is building a leveraged supply chain around revenue that has not yet proved durable. The risk is that if AI demand disappoints, data-center spending could slow, borrowers could struggle to repay, and stress could spread from tech into credit markets. AI demand pushed hyperscalers to spend heavily on chips, data centers, and power capacity, and that spending supported growth, trade, and easy financial conditions while equity investors priced in years of high earnings growth. Debt changed the shape of the boom because hyperscaler bond issuance topped $100B in 2025, while off-balance sheet vehicles shifted data-center obligations toward private credit funds, insurers, and other non-bank lenders. Circular financing adds another weak point because chipmakers, hyperscalers, AI labs, and compute providers can fund each other while also booking future sales from each other, which can make real demand harder to read. A capex slowdown could hit suppliers first, then credit markets, then households, because US stocks make up about 64% of the MSCI Global index and household equity exposure is higher than in past cycles. Private credit raises the systemic risk because direct lenders have quadrupled AI and IT exposure in 5 years to about 15% of portfolios, while some retail-facing funds already face redemption pressure. AI can still deliver real productivity gains, but the financing stack now assumes that delivery arrives fast enough to support huge fixed costs.

译BIS警告，AI热潮背后积累的债务可能引发金融冲击。风险不在AI本身，而在于围绕尚未被证明持久性的收入构建的杠杆化供应链。若AI需求不及预期，数据中心支出放缓，借款者难偿还，压力从科技蔓延至信贷市场。超大规模企业2025年债券发行超1000亿美元；表外工具将数据中心债务转移至私人信贷基金和保险机构；私人信贷基金5年内AI/IT敞口翻两番至约15%，部分零售基金已面临赎回压力。美国股市占MSCI全球指数约64%，家庭股票敞口高于以往周期。芯片商、超大规模企业间循环融资使真实需求更难判断。BIS认为AI仍可提升生产力，但融资结构假定这些提升能快速实现以支撑巨额固定成本。

MiniMax (official)@MiniMax_AI · 4天前23

Congrats to all the winners of our cohosted hackathon with @cysic_xyz Check out the stellar projects built with M3 👇

译祝贺所有与我们和@cysic_xyz 联合举办的黑客松的获奖者！查看基于 M3 构建的出色项目 👇

Tibo@thsottiaux · 4天前33

Codex team is in a warroom on a Sunday combing through logs and checking whether there is anything that could lead to increased usage drains for some users. Taking it very seriously and won't rest until we get to the bottom of it.

译Codex 团队周日待在作战室里，梳理日志，检查是否有任何可能导致部分用户使用消耗增加的情况。他们非常重视此事，不彻底查清绝不罢休。

SemiAnalysis@SemiAnalysis_ · 4天前65

BREAKING NEWS: The Founder/CEO of LeptonAI has left only a year after LeptonAI’s acquisition. This is quite shocking, as Jensen reportedly spent $700M acquiring LeptonAI. What did he see? DGX Lepton flopped and got nowhere near the success Jensen expected. 1/7🧵

译突发新闻：LeptonAI 创始人兼 CEO 在收购仅一年后离职。这相当令人震惊，据报道 Jensen 花费 7 亿美元收购 LeptonAI。他看到了什么？DGX Lepton 惨败，远未达到 Jensen 预期的成功。1/7🧵

Rohan Paul@rohanpaul_ai · 4天前52

FT: Google capped Meta’s use of Gemini after Meta asked for more model compute capacity than Google could supply. Meta’s problem is that it uses Gemini inside safety automation, customer support, ad tools, coding, and internal workflows. Google’s problem is different because it has paying cloud customers, its own Gemini products, and limited data center capacity all competing for the same chips, power, and networking. Google Cloud’s March-quarter revenue rose to $20 billion, but Sundar Pichai said a shortage of compute capacity kept growth lower and helped backlog nearly double versus the previous quarter. --- ft .com/content/c5d52f72-71ef-40bc-bad3-61afdba8b378?syn-25a6b1a6=1

译Google限制了Meta对Gemini模型的使用，原因是Meta要求的计算容量超出Google供应能力。Meta在安全自动化、客服、广告工具、编程及内部工作流中均依赖Gemini。Google面临自身云客户、Gemini产品与有限数据中心容量之间的资源竞争。Google Cloud 3月季度收入增至200亿美元，CEO Sundar Pichai表示计算容量短缺制约了增长，并导致未交付订单较前一季度近乎翻倍。

AK@_akhaliq · 4天前46

baidu/Unlimited-OCR is now number 1 model on huggingface

译baidu/Unlimited-OCR 现在在 HuggingFace 上排名第一

Rohan Paul@rohanpaul_ai · 4天前32

Interesting thread. on naming OpenAI.

译2015 年 11 月 23 日，一篇关于 OpenAI 命名的文章发布。主推文评论称“有趣的讨论”。

Rohan Paul@rohanpaul_ai · 4天前56

Techcrunch: Micron, the only U.S.-based manufacturer of high bandwidth memory chips, just became Wall Street’s newest AI infrastructure bet because AI servers now need huge amounts of HBM, DRAM, and NAND beside every GPU. Micron’s case got stronger after Q3 revenue hit $41.46B, gross margin reached 84.6%, and Q4 guidance moved to $49 B-$51B. Current market cap ~$1.27 trillion. Memory has usually been a boom-bust business because factories take years and billions to build, then prices collapse when too much supply arrives. Micron is trying to break that cycle with 16 strategic customer agreements worth $22B, using deposits, pricing floors, and take-or-pay terms to make demand harder to cancel. --- 📌 The current state of the global memory market. This market has 2 main layers: DRAM, which includes the memory used next to CPUs and AI GPUs, and NAND flash, which is the storage inside SSDs, phones, and data centers. In DRAM, the market is extremely concentrated, with Samsung at 38.5%, SK hynix at 28.8%, and Micron at 22.4% in 1Q26, meaning the top 3 control about 90% of global DRAM revenue. In HBM, which is a premium submarket inside DRAM, the AI-specific memory used beside Nvidia GPUs, SK hynix is the market leader, with 58% share in 1Q26, while Samsung and Micron each had 21%. HBM, or High Bandwidth Memory, is a special form of DRAM built for extreme data movement. The difference is physical design. Normal DRAM chips usually sit on memory modules or near the processor, and data moves through relatively narrower connections. HBM stacks multiple DRAM dies vertically and places them very close to the GPU through advanced packaging, which creates a much wider data path. That wider path gives AI chips much higher memory bandwidth, meaning the GPU can receive data faster instead of sitting idle. --- techcrunch .com/2026/06/28/why-wall-street-thinks-us-memory-maker-micron-is-the-next-nvidia/

译美光是美国唯一高带宽内存（HBM）制造商，因AI服务器需求激增成为华尔街新宠。Q3营收414.6亿美元，毛利率84.6%，Q4指引490-510亿；利润同比增长15倍，调整后毛利率84.9%（去年39%）。全球DRAM市场高度集中，三星、SK海力士、美光合计占约90%收入；HBM细分领域SK海力士占58%，美光占21%。为打破内存行业周期性，美光签下16个价值220亿美元的战略客户协议，通过定金、价格下限和照付不议条款稳定需求。

swyx 🔜 @aiDotEngineer@swyx · 4天前26

any guesses what the AIEWF Stress Curve* looked like for this year lol *the gini coefficient over time from 0 to sold out

译2026年AI世界博览会（AIEWF）所有主门票已售罄，包括领导力专场、工作坊及所有晚鸟票均无余票。主办方仅开放少量无座位保证的溢出票，并提醒65场边会仍免费开放。swyx发推调侃今年的“售罄压力曲线”（从0到售罄的基尼系数变化），侧面印证了这场全球最大AI行业博览会的火爆程度。

🚨 AI News | TestingCatalog@testingcatalog · 4天前52

Google vs Meta 🤖 > Google introduces restrictions on Meta's use on Gemini amid capacity shortage, according to the Financial Times. > Reportedly, this negatively affected internal projects at Meta related to customer support and content moderation, causing delays. I bet token efficiency will be a huge market in the long run, with a very transparent and predictable business model.

译Google vs Meta 🤖 > 据《金融时报》报道，Google因容量短缺对Meta使用Gemini施加限制。 > 据报道，这负面影响了Meta内部与客户支持和内容审核相关的项目，导致项目延期。我敢打赌，从长远来看，token效率将成为一个巨大的市场，其商业模式非常透明且可预测。

meng shao@shao__meng · 4天前45

LoanLens 是一套基于 LandingAI 的 AI 审贷初筛系统：从六类借款人文档中抽取结构化字段、做欺诈检测与可解释评分，并附带仅限当前案件的 RAG 问答，把人工核对文档的工作自动化为第一遍机器审查。处理流水线 6 类文档 → ADE 结构化抽取 → KPI → 欺诈检测 → 评分决策 → 案件 RAG 为何不用普通 OCR 审贷要的是可接入业务逻辑的结构化证据，不是文本块： · Schema 驱动：按字段契约抽取，不是猜模板 · 可追溯：字段能回溯源文档 · 视觉层：AOD 补文本抓不到的布局/篡改信号欺诈与评分 · 姓名一致性：六类文档姓名 TF-IDF 比对，相似度 < 0.95 告警 · 护照篡改：核心组件相对位置 vs 参考几何；严重视觉欺诈可直接否决评分刻意简单透明（信用 23%、DTI 23%、收入时效 20% 等；≥60 批准，40–59 复核，<40 拒绝），审核员可 inspect 各信号贡献，无黑盒总分。

译LoanLens从六类借款人文档抽取结构化字段，进行欺诈检测与可解释评分，并附带案件RAG问答。采用Schema驱动抽取，可追溯字段来源；欺诈检测包括姓名TF-IDF比对和护照篡改检测；评分透明（信用23%、DTI 23%等），≥60批准，40–59复核，<40拒绝。

Chubby♨️@kimmonismus · 4天前68

Supposedly, "a new model from" from zAI is said to be at least as strong as Fable5 in cybersecurity-related aspects. I did some research and only came across a Wall Street Journal article, which, however, does not refer to a new model, but to GLM 5.2 as a relatively new model that was released recently. So either GLM 5.2 is stronger than people think, or the news being circulated is misleading. According to WSJ, Zhipu AI’s GLM-5.2 can match top US models in some bug-finding scenarios, and China’s 360 Security says its new Tulongfeng tool is comparable to Anthropic’s Mythos.

译有传言称zAI新模型在网络安全方面至少与Fable5相当。博主@Kim查找发现只有《华尔街日报》一篇相关文章，但提及的是智谱AI的GLM-5.2，并非新模型。WSJ称GLM-5.2在某些找bug场景可匹配美国顶尖模型；360安全称其Tulongfeng工具可比肩Anthropic的Mythos。@Polymarket也曾引用消息称智谱AI新模型在查找安全漏洞上达到Claude Mythos水平。目前这些说法均未获官方确认，存在信息混淆可能。

Rohan Paul@rohanpaul_ai · 4天前57

I’m hearing that "Owl Alpha", one of OpenRouter’s fastest-growing agent models, is actually Meituan LongCat-2.0-Preview The reported design is a huge 1.6T-parameter MoE, active 48B. A dynamic active range of roughly 33B to 56B, and natively supports a 1M-token context window. "Owl Alpha" has been quietly trialed on OpenRouter for nearly two months and has already become one of the most used agent models globally. The usage numbers are striking. Captured OpenRouter data shows: - #1 on Hermes Agent - #2 on Claude Code - #3 on OpenClaw - 10.1T monthly tokens - 559B daily tokens - +242% monthly growth That is extraordinary for a model still operating under an anonymous name.

译据X用户Rohan Paul爆料，OpenRouter增长最快的智能体模型"Owl Alpha"实为美团LongCat-2.0-Preview。该模型采用1.6T参数MoE架构，激活参数量48B，动态激活范围33B-56B，原生支持1M token上下文窗口。已在OpenRouter秘密测试近两月，成为全球使用最多的AI智能体模型之一。OpenRouter数据显示其排名：Hermes Agent第1、Claude Code第2、OpenClaw第3；月处理token 10.1T，日token 559B，月增长率242%。

Rohan Paul@rohanpaul_ai · 4天前29

Somebody quit his data center job and leased an empty warehouse. filled it with rows of server machines. charges clients between $4-6 K p/month for private isolated deployment. Each client receives dedicated machines to host model. He runs all on vLLM.

译某人辞去了数据中心的工作，租了一个空仓库。里面摆满了成排的

ginobefun@hongming731 · 4天前48

http://x.com/i/article/2071059009222901760 # BestBlogs 早报 · 06-28｜GPT-5.6 发布但首发受政府限制，魏小康谈招聘哲学，HBR 称 AI 落地卡在中层经理在线阅读本期早报 BestBlogs.dev 是 AI 驱动的私人阅读助手。这是面向所有人的每日早报内容，如果你希望它基于你的兴趣和阅读习惯整理，可以体验「我的早报」。 ## 导语今天的三条精讲，刚好串成一条从「模型」到「组织」再到「人」的线。 OpenAI 正式发布了 GPT-5.6 系列，旗舰款 Sol 在编程、生物信息学和网络安全几个方向刷新了基准。不过比性能更值得留意的，是它的发布方式：模型先以「有限预览」上线，首批仅约 20 家获批合作伙伴能访问，个人用户暂时没有申请通道，前沿模型的发布节奏正在被纳入国家安全框架。两周前 Anthropic 因为类似的政府要求停用过自己最强的模型之一，这条线索在今天的补充阅读里还会再出现一次。另外两篇把视线从模型拉回组织和人。魏小康是少见的、先后深度参与过字节和美团组织建设的样本，他在 42 章经的对谈里抛出一个挺硬的判断：创业公司八成到九成的时间都该花在招聘上，而招聘里最重要的既不是面试、谈 offer 时也不是钱。哈佛商业评论则访谈了两家咨询公司的 18 个人，得出一个反直觉的结论：AI 落地的真正卡点不在技术，而在被高管雄心和一线现实夹在中间的中层管理者。如果说模型在变强、发布在变紧，那么真正决定这些能力能否落地的，可能还是组织怎么招人、中层怎么扛事这些「旧问题」。今天的速览和补充阅读也大多围绕这条线索展开：从 AI Native 团队的工程实践，到本地编码智能体、Agent 架构里 harness 与 loop 的争论，再到 Notion 砍掉自家邮件产品的取舍，几乎都在回答同一个问题——当模型本身不再是瓶颈，我们该把工程和组织的重心放到哪里。 ## ★ 精讲一：刚刚，GPT-5.6 正式发布，史上最强但被自己坑惨了先给不熟悉背景的读者补一句：GPT-5.6 是 OpenAI 最新一代模型，这次一口气端出三款，命名也换了思路——Sol（太阳）是旗舰、也是官方口中目前最强的模型；Terra（地球）是面向日常工作的均衡款，性能对标上一代 GPT-5.5 但价格便宜一半；Luna（月亮）主打速度和低成本。数字代表代际，三个名字对应不同的能力、速度与成本档位，相当于 OpenAI 顺手把整条产品线重新分了层。来源：爱范儿。关键事实：Sol 的能力展示集中在编程、生物信息学和网络安全三个方向，共同特征都是复杂、长链条、强依赖上下文的 agentic 任务，模型需要在任务里持续规划、推理、调用工具、修正错误并不断推进。在 Terminal-Bench 2.1 上，GPT-5.6 Sol Ultra 得分 91.9%、Sol 得分 88.8%，作为对照 GPT-5.5 为 88.0%、Terra 为 82.5%、Luna 为 84.3%；横向看 Claude Mythos 5 为 84.3%、Gemini 3.1 Pro Preview 为 70.7%。这次还新增了一个 Ultra 模式，会调度多个子 Agent 把复杂任务拆开处理再汇总结果，对应「理解项目结构、读文件、改代码、跑命令、看报错、再修改」这类一次回答做不完的真实开发流程。生物方向上 Sol 在 GeneBench v1 上用更少的输出 tokens 取得了更强结果；网络安全方向，Sol 在 ExploitBench 上接近此前的 Mythos Preview，但只用了约三分之一的输出 tokens。价格方面，按每百万 tokens 计费，Sol 输入 5 美元、输出 30 美元，Terra 与 Luna 依次更低，并引入了缓存读取九折、写入 1.25 倍的 prompt caching 机制，缓存生命周期至少 30 分钟。为什么值得关注：这次发布说明里，安全罕见地占了很大篇幅。OpenAI 一边要证明 Sol 在网络安全任务上确实强了很多，一边又刻意强调它「尚未跨过 Preparedness Framework 里的网络安全关键风险阈值」——在涉及 Chromium 和 Firefox 的评估中，Sol 能识别漏洞，但在测试条件下没有自主生成可运行的完整攻击链。为此 OpenAI 在自动化红队测试上投入了超过 70 万 A100 等效 GPU 小时。更值得玩味的是发布机制本身：OpenAI 在博客中承认，发布前已向美国政府展示能力与计划，按政府要求先以有限预览形式上线，首批合作伙伴名单也已与政府共享。彭博社报道首批约 20 家，《华盛顿邮报》则提到联邦政府将审核哪些公司可以访问。OpenAI 自己也说，不认为政府介入访问流程应当成为长期默认机制，但现实是它还是接受了这套安排。和今天其他内容的关系：这条线索并不孤立。两周前 Anthropic 就因美国政府的国家安全要求停用过 Fable 5，今天补充阅读里那篇「美国大模型走向封闭」会把整条「叫停—谈判—有条件放行」的时间线讲得更完整。把这两篇对照着读，能更清楚地看到一个趋势：模型能力越往上走，发布的自由度可能越往下收。阅读建议：如果你关心模型能力本身，重点看基准对比和安全栈那两段；如果你更关心行业格局，可以直接跳到发布机制部分，再接着读补充阅读里那篇政府管制的复盘。需要提醒的是，OpenAI 也坦言基准无法覆盖所有真实用法，这些数字更适合当参考而非定论。详见 ## ★ 精讲二：唯一深度参与过字节、美团组织建设的人｜对谈 AI 创业者魏小康先交代下嘉宾：魏小康可能是国内最懂组织建设和招聘的人之一，也是个稀缺样本——2017 到 2020 年他在字节担任招聘负责人，经历了抖音的高速增长与国际化；2020 到 2026 年又在美团担任招聘负责人兼 AI 产品经理。他早年创办的猎头公司 Offercome 被字节收购，如今正在创业做一款 AI 招聘产品。这期 42 章经的对谈，就从他在这两家公司的一手经历聊起。关键观点：魏小康把组织建设拆成两件事——一是怎么让人运转起来，包括人的「选、用、育、励、汰」以及文化、薪酬、职级；二是怎么让人和业务一起运转，包括目标拆解、分工协作。在这个框架之上，他抛出最硬的一句判断：创业公司组织建设里，80% 到 90% 的时间都应该花在招聘上，而很多创业者恰恰把劲使错了地方。他还有一连串非共识观点：创业公司不需要花很多时间搞文化、也不需要搞绩效体系，纯属浪费时间；人其实是培养不出来的；面试并不是人才评估中最重要的一环，谈 offer 时重点也不是谈钱；他甚至认为 OPC 是对这个时代和自己的浪费，00 后创始人在这一波里其实是吃亏的。节目里他也聊到一个有意思的角度：怎么区分一个创始人是 ego 大还是真自信，以及张一鸣、王兴这样的优秀创业者身上有哪些共同特征。这些判断没有停在结论上，而是配着两家公司的具体场景一路讲下来。为什么值得一听：这些判断之所以有分量，是因为它们都来自字节和美团两套不同组织思路的一手对照，而不是二手方法论。比如他点出招聘里最难的事其实是「扩大人才供给」，而不是把面试做得多漂亮；又比如他解释字节、拼多多溢价招人到底算的是一笔什么账。对正在搭团队的 AI 创业者来说，这是一份关于「把劲用对地方」的经验，提醒你别在文化墙和绩效表上消耗，而要把注意力放到真正稀缺的人身上。和今天其他内容的关系：这条恰好能和速览里 Claude Code 负责人 Fiona Fung 那篇对照着看——Fiona 谈的是 AI Native 团队怎么招人、怎么把验证和衡量当成新瓶颈，魏小康谈的是更底层的招聘哲学，两者一个偏实践、一个偏认知，叠在一起就是一套相对完整的「AI 时代怎么搭团队」。收听建议：时间紧可以直接奔着 Part 2「怎么让人运转起来」去听，那里集中了招聘的核心判断；如果对组织形态感兴趣，再补 Part 3 里 Google、字节类公司和亚马逊、美团类公司的对比。（节目里对嘉宾声音做了变声处理，不影响内容。）详见 ## ★ 精讲三：AI 普及正在压垮中层管理者先讲清楚这篇在说什么：大多数组织把 AI 落地当成一个技术问题——一次由 IT 部门推动、由高管庆祝的软件铺开，有的甚至直接当成裁员的快车道。哈佛商业评论为了搞清楚 AI 在真实场景里到底怎么落地，对两家大型咨询公司的合伙人、经理和初级顾问做了 18 场半结构化访谈，问的不是泛泛的态度，而是每个层级具体怎么用 AI、得到了什么支持、卡在哪里。结果浮现出来的不是一个技术故事，而是一个组织故事，两家公司的压力点高度一致：中层管理者。来源：HBR.org。关键事实：调研引用的数据显示，约 88% 的组织已经在至少一个业务职能里用上了 AI，但只有约四分之一真正发展出了能产生切实价值的能力。麦肯锡的研究把差距归因于工作流重构，而非技术先进度——这一点访谈给出了具体的解释。在高层，领导们正拥抱 AI 的战略潜力，用更精简的团队扩大业务范围、加速交付、重新设计服务；在基层，初级顾问报告了惊人的效率提升：原本要几天的桌面调研现在 30 分钟搞定，原本几周的分析现在只要几小时，从早期繁琐工作里被解放出来后，他们比以往任何一代都更早地参与战略综合、更早地坐进客户访谈。但顶部的雄心和底部的效率，最终都汇聚到同一个压力点上：中层经理。研究特别指出，这个模式虽然来自咨询行业，但「被夹在高管雄心与运营现实之间、又缺乏正式支持」的处境，在各类知识密集型行业的管理者身上大概都不陌生。为什么值得关注：文章用一个「典型经理的一天」把这种困境讲得很具体——她一早要先学新的提示词技巧再等团队上线，白天在客户会议上回答「你们怎么用 AI」，中午要替 AI 生成的客户成果纠错、带一个从没从零做过 deck 的新分析师、还要揣摩合伙人嘴里那份所谓「AI 增强」的备忘录到底指什么，到了下班再把当天的经验记录下来好让团队复用。研究把中层正在做的事概括为：在交付压力不减甚至增加、又缺乏正式支持结构的情况下，去验证 AI 产出、识别错误、纠正那些看着专业却没有实质的「workslop」，同时还要给团队做 AI 技能和基本职业素养的双重辅导。和今天其他内容的关系：把这篇和前两条放在一起看会更有意思。精讲一里模型在变强、发布在变紧，精讲二里魏小康强调把时间花在招对人上，而这篇恰恰提醒：哪怕模型再强、人招得再对，如果中层这一环没有被重新设计和支撑，AI 落地依然会卡住。它和速览里 Fiona Fung 那篇也能呼应——Fiona 谈的是怎么把验证体系建起来，而这篇谈的是当下这套验证负担正实实在在地压在谁身上。阅读建议：管理者尤其是带团队的中层值得完整读一遍，把「典型经理的一天」当成一面镜子；如果你是高管，重点看「能力—现实差距」那一节，它解释了为什么单纯加大 AI 投入不一定换来价值。文章给的是观察和访谈，不是处方，结论还需要结合自己组织的情况再判断。详见 ## 速览今天的七条精选，主线集中在 AI 工程实践与产品取舍，几条放在一起读能看出当下从业者关心的共同问题。 Claude Code 工程负责人 Fiona Fung：如何打造全世界最 AI Native 的工程团队？ Fiona 统管 Claude Code 与 Cowork 两条产品线，有 25 年以上工程经验。她的核心判断是：写代码本身不再是瓶颈，验证和衡量才是——当设计师和 PM 都在提交代码，约束就从「谁来写」变成「怎么验证」，办法是把「什么算好」写成规范放进仓库让 Claude 比对。她招人只认两类：会做梦的产品型 builder 和啃硬骨头的系统专家，底层逻辑是 trust but verify；管理动作也在被一个挂在所有代码库上的常驻 Claude 自动化。和今天精讲二魏小康的招聘哲学对照着读很合适。使用本地编码智能体（Ahead of AI）。 Sebastian Raschka 写的一份实操教程，讲怎么用开源工具（Ollama、Qwen-Code）和开放权重模型（Qwen3.6、North Mini Code）搭一套完全本地、可读文件、能改代码、会跑命令并自行验证的编码智能体，包含安装步骤和性能基准。作者把模型比作提供推理与代码生成的「引擎」，把周边 harness 看作让引擎能在本地项目里干实事的「运行环境」。本地方案的好处是透明、可检查、除硬件和电费外免费，整条链路完全在自己掌控之中，还能随意改造 harness。适合想摆脱专有服务、亲手搭一套本地栈的开发者照着动手。金融科技工程手册（Hacker News）。一份系统梳理「以钱为核心的系统」该用哪些工程模式的手册，覆盖货币表示、账本记录和执行流程。它把一切归结为三条原则：不凭空造数据（靠幂等、去重、对账）、不丢数据（靠全精度、至少一次投递、事件溯源、审计与不可变）、不轻信（验证 webhook、跨源交叉校验、假设被打破时大声失败）。手册也专门讨论了在动账之前「怎么表示一笔钱」这件容易被忽视的事——金额怎么建模、存储、计算和换算，一旦这层错了，上面每一层都会继承这个错误。要进金融科技、已经在金融科技、或想理解「为钱写代码」和普通业务有何不同的人，都值得收藏当参考。别再写单一语气指令了，把它们分层（AI Engineer，视频）。 Isadora Martin-Dye 提出用四层提示词堆栈替代单一的语气指令：与其指望一个系统提示词同时做到情境化、有表达力又能自我检查，不如把品牌对齐当成一个结构性的架构问题来工程化。她把大模型比作高 IQ、零 EQ 的实习生——记忆力惊人却毫无看场合的本能，所以要像管理实习生一样设结构化护栏并主动复核。做 AI 产品、又在意品牌一致性的人会有共鸣。 Loop 不是 Agent 架构，Harness 才是（浮之静）。作者吐槽近期被 Loop Engineering 各种讨论刷屏，亮明观点：harness > all（除 LLM 外），没必要一直造词。他用「恒温器、PID、TCP 拥塞控制、Raft」等例子说明，loop 只是外观，真正的工程含量藏在控制律、状态语义、边界条件、失败处理、验证机制和系统不变量里——「loop 不是工程，受控的 loop 才可能成为工程」。对正在搭 Agent 系统、又被各种新词绕晕的人是一剂清醒剂。上线 14 个月，Notion 关掉了自己的 AI 邮件产品（Founder Park）。 Notion 宣布将于 9 月 22 日全面关闭 Notion Mail，理由很直接：随着 Agent 能力变强，超过一半的 Notion Mail 用户已经在不打开收件箱的情况下管理邮件，所以干脆全面转向由 Agent 来管理收件箱。这个决定折射出 AI 邮件赛道的一次转向——从「优化用户体验的功能叠加」转向「为 Agent 打造通信基础设施」，邮件的未来可能不是让人用得更好，而是让人根本不用再看。关心 AI 产品形态演进的人值得一读。我把自己的 IP 配图技能开源了，顺手做了 31 个现成角色（小互 AI）。作者把日常在用的个人 IP 配图技能「小互 IP Studio」开源（MIT），还做了 31 个统一画风的原创角色，解决了「别人没有自己 IP 形象就没法用」的问题。技能能自己读完整篇文章、判断哪段该配图、决定配哪种图（情绪图 / 示意图 / 四格漫画）、写提示词、定横竖尺寸并自查返工，使用者基本只需要拍两次板。角色分手绘线稿和谐音梗 meme 两大系列，写哪类文章就调哪个主角，一篇锁定一个形象整组图的气质就立住了。常写公众号、需要稳定配图风格的创作者可以直接拿来用。详见 ## 补充阅读下面几条是今天的延伸内容，按需取用。 - 「尴尬」的智能眼镜，终于不用说「明年是元年了」（腾讯科技）。 Rokid 创始人 Misa 称「火箭已经点火升空」，但发令枪还没响，行业仍缺 killer app。他公布销量同比增长 800%、覆盖 166 个国家，并强调最看重的是复购率和用户时长而非市占率。关心 AI 硬件落地节奏的人可以读。详见 - 对话蔡崇信：人们都坐在户外喝咖啡，享受生活，这就是 AI 的未来（砺石商业评论）。阿里董事长蔡崇信认为 AI 的总盘子可达 50 万亿美元，阿里采取四层全面布局，并强调开源模型对欧洲主权需求的价值。适合想了解大厂 AI 战略全景的读者。详见 - 探访北京探月学校：AI 时代的「第三种可能」（硅谷 101）。一篇关于创新教育的深度报道，记录了探月学校如何用项目式学习和真实创业，为学生提供高考与留学之外的另一条路，同时也呈现了它在学费与升学结果上的争议。报道里既有 17 岁学生论文被马斯克点赞这样的高光，也有对二十多万学费和升学结果的质疑，呈现得相对克制。关心教育与 AI 时代人才培养的人值得一看。详见 - Mark Pincus 在 YC 访谈中分享 30 年产品哲学与创始人 playbook（Y Combinator）。 Zynga 创始人在 YC Main Function 节目里复盘历经三次平台变革的创业历程，分享如何识别真正的产品—市场契合（PMF）以及创始人模式。做消费级产品的创业者会感兴趣。详见 - 具身智能风口来了，普通人怎么分钱？（第一财经）。眸深智能 CEO 穆泽林拆解具身智能赛道的技术逻辑、产业链分工与泡沫真相，从资本、技术、落地三个维度讲清这条赛道的赚钱逻辑。对机器人投资和创业方向感兴趣的人可以听。详见 - 美国大模型走向封闭，以安全之名（腾讯科技）。这是今天精讲一的最佳延伸：文章梳理了从 6 月 2 日特朗普签署 AI 行政令，到 Anthropic、OpenAI 前沿模型被「叫停—谈判—有条件放行」的完整时间线，并点出最核心的矛盾——审批标准不公开、没有明确阈值、也没有申诉程序，连政府部门自己似乎都说不清要求是什么。想把今天的模型管制看透，建议和精讲一连着读。详见 ## 今日阅读路径如果今天时间有限，建议按这个顺序读三篇： 1. 精讲一《GPT-5.6 正式发布》 —— 先掌握今天最重要的产品与行业动向，尤其是发布机制背后的政府审批变化。详见 1. 补充阅读《美国大模型走向封闭》 —— 紧接着读这篇，把模型管制的完整时间线和深层矛盾补齐，两篇合起来才是一个完整的故事。详见 1. 精讲三《AI 普及正在压垮中层管理者》 —— 最后把视线拉回组织，看看模型能力之外，AI 真正落地时卡在哪里。如果你在带团队，这篇可能比前两篇更切身。详见读完还有余力，再去听精讲二魏小康那期，把「AI 时代怎么搭团队」这条线补完整；它和速览里 Fiona Fung 谈 AI Native 工程团队那篇，正好是一对从认知到实践的互补阅读。 BestBlogs 是 AI 驱动的私人阅读助手，帮助你发现真正适合你的高质量内容，欢迎体验。

译OpenAI 发布 GPT-5.6 系列，包括旗舰 Sol、均衡 Terra 和速度型 Luna。Sol 在 Terminal-Bench 2.1 得分为 88.8%（Ultra 模式 91.9%），领先 GPT-5.5 的 88.0% 和 Claude Mythos 5 的 84.3%；GeneBench v1 以更少输出 tokens 获更强结果，ExploitBench 接近此前 Mythos 但仅用约 1/3 输出 tokens。价格：Sol 输入 $5/百万 tokens、输出 $30，缓存读取九折。发布前 OpenAI 向美国政府展示能力，按政府要求先以有限预览上线，首批约 20 家合作伙伴可访问。

ginobefun@hongming731 · 4天前43

BestBlogs 早报 · 06-28 # GPT-5.6 / OpenAI / 政府审核访问 / 魏小康 / 组织建设 [1] ★ 精讲｜刚刚，GPT-5.6 正式发布，史上最强但被自己坑惨了 OpenAI 正式发布 GPT-5.6 系列：旗舰 Sol、均衡款 Terra、低成本 Luna。Sol 在 Terminal-Bench 2.1、GeneBench、ExploitBench 上刷新成绩，但 OpenAI 刻意强调它尚未跨越关键安全阈值，并按模型档位配置了强度递增的分级安全栈。比性能更值得注意的是发布机制本身：美国政府要求发布前展示能力，首批仅约 20 家获批合作伙伴可访问，个人用户暂时无法申请——前沿模型的发布节奏正被纳入国家安全框架。来源：爱范儿 https://www.bestblogs.dev/article/9a7132f3 [2] ★ 精讲｜唯一深度参与过字节、美团组织建设的人｜对谈 AI 创业者魏小康 [播客] 魏小康先后在字节（2017-2020）和美团担任招聘负责人，是少见的深度参与两家顶级公司组织建设的样本。他把组织建设拆成两件事：怎么让人运转（选用育励汰、文化薪酬职级），以及怎么让人和业务一起运转（目标拆解、分工协作）。他的非共识判断很硬：创业公司 80% 到 90% 的时间都该花在招聘上，而招聘里最重要的不是面试、谈 offer 最重要的也不是钱。对正在搭团队的 AI 创业者，这是一份关于把劲用对地方的一手经验。来源：42 章经 https://www.bestblogs.dev/podcast/4c4475e [3] ★ 精讲｜AI 普及正在压垮中层管理者哈佛商业评论访谈了两家咨询公司的 18 位合伙人、经理与初级顾问，得出一个反直觉结论：AI 落地的成败不在技术，而在中层管理者。88% 的组织已在至少一个职能用上 AI，却只有约四分之一真正产出切实价值，差距根源是工作流重构而非模型先进度。中层经理被夹在高管的雄心与一线的现实之间——既要教团队用 AI、又要替 AI 产出的成果纠错、还要在缺乏指引下揣摩上级口中那份所谓 AI 增强备忘录到底指什么。来源：http://HBR.org https://www.bestblogs.dev/article/e44268ef [4] 金融科技工程手册本手册提供了一套全面的工程模式，用于构建可信赖的金融系统，涵盖货币表示、账本记录和执行流程。来源：Hacker News https://www.bestblogs.dev/article/9b7ac3e7 [5] 别再写单一语气指令了，把它们分层 —— Isadora Martin-Dye，Isadora & Co [视频] 本文提出一种四层提示词堆栈架构来替代单一的语气指令，将品牌对齐视为一个结构性系统工程问题，而非提示词工程问题。来源：AI Engineer https://www.bestblogs.dev/video/f381041 [6] 上线 14 个月，Notion 关掉了自己的 AI 邮件产品 Notion 宣布关闭上线仅 14 个月的 AI 邮件客户端 Notion Mail，转向由 Agent 完全管理收件箱，这一决策折射出 AI 邮件赛道的根本转变：从优化用户体验的功能叠加，转向为 AI Agent 打造独立通信基础设施。来源：Founder Park https://www.bestblogs.dev/article/669cd820 [7] 我把自己的 IP 配图技能开源了顺手做了 31 个现成角色本文开源作者日常使用的 AI 配图技能「小互 IP Studio」，包含 31 个原创角色、多画风皮肤和一套配图方法论，让 AI 能自动读文章、规划配图并生成统一画风的插图。来源：小互 AI https://www.bestblogs.dev/article/cb2309c5 [8] 使用本地编码智能体关于使用开源工具（Ollama、Qwen-Code）和开放权重 LLM（Qwen3.6、North Mini Code）设置本地编码智能体的实用教程，包括安装步骤和性能基准测试。来源：Ahead of AI https://www.bestblogs.dev/article/6458a9db [9] Loop 不是 Agent 架构，Harness 才是本文批判将 loop 视为 Agent 核心架构的倾向，提出真正可靠的 Agent 系统应建立在包含边界、状态、验证、审计与恢复的 Harness 工程框架之上，而非简单的循环。来源：浮之静 https://www.bestblogs.dev/article/731e27c5 [10] Claude Code 工程负责人 Fiona Fung：如何打造全世界最 AI Native 的工程团队? Claude Code 负责人 Fiona Fung 分享如何打造 AI Native 工程团队：写代码不再是瓶颈，验证与衡量成为核心；招人分产品型 builder 和深度系统专家；管理动作通过常驻 Claude 实现自动化，强调高 agency 配高 accountability。来源：十字路口 Crossing https://www.bestblogs.dev/article/e67ff5dc --- http://BestBlogs.dev · 发现真正适合你的高质量内容 BestBlogs 是 AI 驱动的私人阅读助手，帮助你发现真正适合你的高质量内容，欢迎体验。在线阅读：https://www.bestblogs.dev/explore/brief/2026-06-28

译OpenAI 发布 GPT-5.6 系列（旗舰 Sol、均衡 Terra、低成本 Luna），在 Terminal-Bench 2.1、GeneBench、ExploitBench 刷新成绩，

SemiAnalysis@SemiAnalysis_ · 5天前49

SHOCKING: Many neocloud executives we spoke with feel that if they have non-NVIDIA networking gear on their cluster, or if their cloud has an AMD GPU or TPU offering, NVIDIA will retaliate. They feel that retaliation includes not giving early allocation or no longer supporting a potential IPO/VC raise.(1/3)🧵

译震惊：许多我们交谈过的neocloud高管认为，如果他们的集群中有非NVIDIA的网络设备，或者他们的云提供AMD GPU或TPU，NVIDIA就会报复。他们认为报复包括不给予早期分配或不再支持潜在的IPO/VC融资。(1/3)🧵

Rohan Paul@rohanpaul_ai · 5天前50

Bloomberg: Two prominent Chinese hedge funds are warning that the global AI stock boom has crossed from strong demand into a super bubble. Their point is that many AI-linked stocks now price in years of perfect growth before the businesses have proved they can defend profits. The weakest point is AI infrastructure, where companies must keep spending huge amounts on chips, servers, power, and data centers just to stay relevant. A business with a moat can protect pricing, margins, and customers, while a business built only on sudden demand can look brilliant until supply catches up or customers push back. Wealspring says some hot Chinese AI shares could fall more than 80%, while Banxia points to Anthropic’s revenue run-rate as a pressure point because token costs can rise faster than customer budgets. --- bloomberg. com/news/articles/2026-06-26/chinese-hedge-funds-warn-the-ai-super-bubble-is-ready-to-burst

译彭博社报道，两家中国对冲基金警告全球AI股票繁荣已从强劲需求转为超级泡沫。许多AI相关股票的定价已包含多年完美增长预期，但企业尚未证明能捍卫利润。最薄弱环节是AI基础设施——公司必须持续在芯片、服务器、电力和数据中心上巨额投入以维持竞争力。Wealspring称部分热门中国AI股可能下跌超80%；Banxia指出Anthropic的收入运行率是压力点，因为token成本上升速度可能超过客户预算。

MiniMax (official)@MiniMax_AI · 5天前28

next week at @aiDotEngineer, we are joining @togethercompute for a conversation on what goes into running agents at scale. @olive_jy_song, Research Lead, RL at MiniMax, and @realDanFu, VP of Kernels at Together AI, will walk through both sides of M3: the training decisions behind long-context reasoning and tool use, and the infrastructure work needed to serve agentic workloads in production. Wed July 1, 2:50 PM PDT Room 2016, Track 9 Catch you there!

译下周在 @aiDotEngineer，我们将与 @togethercompute 对话，探讨大规模运行智能体背后的要素。 @olive_jy_song，MiniMax 强化学习研究负责人，以及 @realDanFu，Together AI 内核副总裁，将分享 M3 的两个侧面：长上下文推理和工具使用背后的训练决策，以及在生产中服务智能体工作负载所需的基础设施。 7月1日周三下午2:50 PDT Room 2016, Track 9 现场见！

AI Notkilleveryoneism Memes ⏸️@AISafetyMemes · 5天前47

"During a closed-door demonstration, Anthropic showed members that Mythos could wipe out private bank accounts." Anthropic "told the model to find a vulnerability in a bank and empty accounts, and then it went and did it."

译AI安全账号@AISafetyMemes披露，Anthropic在闭门演示中让Mythos模型“查找银行漏洞并清空账户”，模型成功执行。引用推文警告，Anthropic目前已掌握针对所有主流操作系统和浏览器的零日漏洞（强大漏洞），若此类模型或其后续版本泄露，后果可能灾难性——如同“软件界的COVID”。

Rohan Paul@rohanpaul_ai · 5天前54

Ford’s AI push hit a hard limit: factories still need human failure memory. They hiring back 350 specialists to catch failures machines missed. Ford leaned on automated inspection to find defects faster, but car manufacturing is full of edge cases where tiny design, material, supplier, and assembly changes interact in ways rules-based systems and trained models can miss. The missing ingredient was tacit engineering knowledge, the hard-earned pattern memory built from many product cycles, failed parts, supplier mistakes. Ford’s rehired “gray beards” now review designs before parts reach the plant floor, while also helping improve the training data behind the AI systems. --- independent. co .uk/tech/ford-ai-automation-human-workers-b3003787.html

译福特汽车的AI自动化缺陷检测遇到硬限制：汽车制造中存在大量边缘案例，微小设计、材料、供应商和装配变化相互作用，导致基于规则的系统与训练模型容易遗漏故障。福特因此召回350名经验丰富的工程师（“gray beards”），利用他们多年积累的隐性工程知识（即故障模式记忆），在零件到达工厂前审查设计，同时帮助改进AI系统的训练数据。

DogeDesigner@cb_doge · 5天前76

NEWS: SpaceX just trademarked “SpaceXAI” Elon Musk says xAI will be dissolved as a separate company, so it will just be SpaceXAI, the AI products from SpaceX.

译消息：SpaceX 刚刚注册了“SpaceXAI”商标。埃隆·马斯克表示 xAI 将解散，不再作为独立公司，因此它将只是 SpaceXAI，SpaceX 的 AI 产品。

Rohan Paul@rohanpaul_ai · 5天前48

Axios reports that Anthropic’s Fable 5 may soon return, as soon as this coming week. Anthropic now appears closer to a deal after government agencies signaled progress on safety controls, trusted-user access, and release protocols. --- axios .com/2026/06/27/anthropic-fable-5-return-soon

译Axios报道，Anthropic的Fable 5可能很快回归，最快下周。 Anthropic现在似乎更接近达成协议，因为政府机构在安全控制、可信用户访问和发布协议方面取得了进展。

Rohan Paul@rohanpaul_ai · 5天前71

Gallup found that 71% of Americans oppose building local AI data centers. Women (55%) are also more likely than men (43%) to register strong opposition to data center construction. There are no meaningful differences in total opposition by age, race, education, income or urbanicity. Opposition is slightly lower among those living in the West (63%) and East (68%) than in the Midwest (76%) and South (75%). The opposition is not mainly abstract fear of AI, because 50% of opponents mention resource strain, including 18% water use and 18% electricity demand. Local residents are reacting to AI as a land, grid, water, noise, traffic, and bill-pressure issue. Supporters see the other side of the bargain, with 66% citing local economic benefits and 55% naming jobs. The political risk is unusually broad because majorities of Democrats, independents, and Republicans all oppose local construction, even though Democrats show the strongest opposition at 56% strongly opposed.

译Gallup民调显示，71%美国人反对在本地建设AI数据中心，女性（55%）强烈反对比例高于男性（43%）。反对主因并非恐惧AI，而是资源压力（50%反对者提及，其中水、电各占18%）；支持者则看重经济（66%）和就业（55%）。政治风险广泛，多数民主党、独立派、共和党均反对，民主党最强烈（56%强烈反对）。自2023年以来，美国已出现300+州及地方数据中心禁令/暂停。但现代数据中心已能缓解担忧：微软新一代芯片级闭环冷却零水耗；谷歌全球PUE 1.09低于行业平均1.56；数据中心未推高居民电价；"自带电力"成趋势，Google、微软、Meta纷纷签订核电合同。

swyx 🔜 @aiDotEngineer@swyx · 5天前28

btw we crossed our 6k attendee mark a while ago. will probably call sold out when we hit 7k this weekend. do get tix now, this is the epicenter of ai next week. if you are a student or between jobs, head to /associates to help us out.

译swyx 宣布 AI Engineer World's Fair 2026 参会人数已超6000，预计本周末达到7000时正式售罄。本届博览会规模为历届最大：展区扩大4倍，设4个展区舞台；新增研究员海报与 Poaster 环节、AI 领袖闭门会议（Token Billionaires & Off the Record）；覆盖医疗、GTM、FDE、AGC、金融等垂直领域；边会包括 NEO 和 Kids day。每位参会者可获得 $40k 信用额度试用赞助商产品。

Berryxia.AI@berryxia · 5天前76

刚刚！苹果VisionPro 眼镜负责大神跳槽OpenAI！AI 硬件大战，库克最担心的事儿发生了！ Apple 这几天也是亏麻了！宣布涨价以来，市值直接蒸发2300 多e美金！ 2026年6月26日，Mark Gurman在一天内发了两条关于苹果的重大新闻。第一条更重磅。 Paul Meade，苹果Vision产品组的副总裁，下周离开苹果，加入OpenAI的硬件部门。这个人的职责范围不只是Vision Pro头显。他负责苹果所有智能眼镜的开发，包括计划明年发布的无屏幕AI智能眼镜，以及本十年末的增强现实眼镜路线图。他还掌管苹果一系列其他AI可穿戴设备的研发。他的团队叫VPG，Vision Products Group。是苹果空间计算和AI硬件战略的核心执行层。他不是唯一一个。苹果在过去一年经历了多起高管向竞争对手流失的事件。但这次不同。 Paul Meade去的不是Meta，不是Google，是OpenAI。 OpenAI正在组建自己的硬件团队。他们已经在开发AI驱动的设备家族。根据郭明錤的分析，OpenAI甚至在计划一款智能手机，采用联发科天玑9600定制版芯片，由立讯精密代工。目标直指iPhone。这意味着什么？ OpenAI不再满足于做软件。他们要进入硬件。而他们挖走的人，恰好是苹果硬件战略中最前沿的那个板块的负责人。苹果在Vision和智能眼镜上的投入，数十亿美元的研发、数年的工程积累，现在为竞争对手提供了核心人才。第二条新闻关于MacBook。苹果计划在首款触控OLED高端MacBook上使用现有的M5 Pro和M5 Max芯片。不是新的M6系列。直接跳到M7 Pro和M7 Max，最早2027年底发布。这个决策透露了一个信号。苹果不想等。触控OLED MacBook是用户等了好几年的产品，苹果选择用现有芯片加速上市，而不是为了一代新芯片推迟发布。 M6系列只会有基础版M6，没有Pro和Max。苹果把高端触控OLED的赌注押在了M7上。 2026年底到2027年初，你会看到第一款触控OLED MacBook Pro。 M5 Pro/Max驱动。保留键盘和触控板。屏幕支持触控操作。 2027年底，M7 Pro/Max版本跟进。那才是真正完整的下一代。同一天。一边是苹果最重要的硬件高管跳槽到OpenAI。一边是苹果用现有芯片赶工触控OLED MacBook。两件事指向同一个趋势：AI硬件的竞争已经不是未来时了。它正在发生，而且正在加速。

译2026年6月26日，Mark Gurman称苹果Vision产品组副总裁Paul Meade下周离职加入OpenAI硬件部门。他负责Vision Pro、无屏幕AI智能眼镜及AR眼镜研发。苹果计划首款触控OLED MacBook使用M5 Pro/Max芯片，2026年底到2027年初发布；M7 Pro/Max版本2027年底跟进。苹果此前因涨价市值蒸发2300多亿美元。核心高管流失至OpenAI凸显AI硬件竞争加速。

Ethan Mollick@emollick · 5天前25

So this new licensing regime is probably the end of new model vague posting from the Labs. Good night, sweet prince, and flights of angels sing thee to thy rest.

译所以，这一新的许可制度可能意味着实验室不再发布模糊的新模型预告。晚安，亲爱的王子，愿天使的歌声伴你安息。

Replit ⠕@Replit · 5天前26

Rio brought 30,000 founders and builders. We brought Replit. One takeaway from it all: the gap between idea and working app is closing fast, and we're here for it. 🇧🇷🚀

译Rio 带来了 30,000 名创始人和开发者。我们带来了 Replit。从中得到一个启示：从想法到可运行应用之间的差距正在快速缩小，我们为此而来。🇧🇷🚀

Chubby♨️@kimmonismus · 5天前47

Per Axios: Fable 5 is expected to be back and available starting next week. Let’s hope it won’t be too heavily guardrailed or lobotomized, and that access will be broad.

译据 Axios 报道：Fable 5 预计将从下周起回归并可用。希望它不会受到过于严格的护栏或削弱，且访问权限能广泛开放。

Chubby♨️@kimmonismus · 5天前63

Apple wants to buy RAM from China. Everyone now wants to use open-source models from China because of all the drama surrounding Anthropic, OpenAI, and the U.S. government. What comes next: asking whether Huawei will now also sell GPUs to the West for training new models? What a crazy time.

译苹果正游说特朗普政府，希望获准从被列入五角大楼黑名单的中国芯片制造商长鑫存储（CXMT）采购DRAM。内存价格上涨已迫使苹果提高MacBook和iPad售价，导致市值蒸发2630亿美元。苹果称内存价格已“不可持续”，目前其DRAM供应商为美光、三星和SK海力士。与此同时，受Anthropic、OpenAI与美国政府纠纷影响，AI业界正转向使用中国开源模型。下一步市场关注华为是否会向西方提供GPU用于模型训练。

Chubby♨️@kimmonismus · 5天前59

A new GMAC survey of 600+ recruiters found that 1 in 3 employers say they are replacing entry-level jobs with AI. Tech is hit hardest: 40% of employers in the industry said AI is replacing junior roles, followed closely by manufacturing. The sharp line from GMAC: "Employers are increasingly using AI to automate routine tasks in areas like coding, data processing, and customer service." Even MBAs are not fully insulated. Only 13% of employers said they hired more MBA grads in 2025 than the year before, and estimated median MBA starting pay is slipping from $125,000 to $120,000.

译一项针对600+招聘人员的GMAC调查显示，1/3雇主正用AI替代入门级工作。科技行业受冲击最大（40%），制造业紧随其后。GMAC指出，雇主越来越多地使用AI自动化编码、数据处理和客服等常规任务。MBA毕业生也未能幸免：仅13%的雇主称2025年雇佣了更多MBA毕业生，预计起薪中位数从$125,000降至$120,000。

SemiAnalysis@SemiAnalysis_ · 5天前24

Spotted in @modal NYC office

译在@modal纽约办公室被发现。

Rohan Paul@rohanpaul_ai · 5天前74

"the share of tokens used for US models on OpenRouter has collapsed" Bloomberg On OpenRouter, US model token share fell from around 70% to around 30% in a year. A clean warning signal. open-weight Chinese models are becoming capable enough for routine work, cheaper to run, easier to customize, and less dependent on permission from a frontier lab.

译OpenRouter 上美国模型 token 使用份额在一年内从约 70% 降至约 30%。UBS 调查显示，60% 关注 AI 预算的公司正转向更便宜模型和开源中国模型，主因是极端账单：用户月花费高达 3.5 万美元、团队超配额 200%、公司从 5 个内部 AI 工具削减至 2 个。企业采用模型路由策略，将简单任务交给低成本模型，保留高级模型用于复杂推理、代码和长上下文任务。中国开源模型 Qwen、DeepSeek、MiniMax、GLM、Kimi 因可本地运行或通过云目录使用，契合企业成本曲线。

Rohan Paul@rohanpaul_ai · 5天前60

Q1 marked an inflection point for Robotics and Physical AI: PitchBook recorded roughly $16B of investment across just under 500 deals, an all-time high on both axes. versus the 2021–2025 run-rate, deal count is up about 2x while deal value is up 4.5x. So investors are underwriting a new AI cost curve: foundation-model capability migrating from screens into manipulators, vehicles, warehouses, factories, hospitals, and homes. --- Source: A16Z substack .com/@ therealrandomwalk/p-203608554

译Q1 标志着机器人与物理 AI 的一个转折点： PitchBook 录得约 160 亿美元投资，涉及近 500 笔交易，两者均创历史新高。与 2021–2025 年运行率相比，交易数量增长约 2 倍，交易价值增长 4.5 倍。因此，投资者正在为一条新的 AI 成本曲线承保：基础模型能力从屏幕迁移到机械臂、车辆、仓库、工厂、医院和家庭。

Logan Kilpatrick@OfficialLoganK · 5天前47

In the last month, almost 200,000 apps built in @GoogleAIStudio were successfully deployed and shared with the world (totally for free). Everyone should be able to bring their idea to life!

译上个月，在 Google AI Studio 中构建的近 20 万个应用成功部署并分享给世界（完全免费）。每个人都应该能将自己的想法变为现实！

小互@xiaohu · 6天前23

Codex 用量又被重置了最近Codex消耗特别快，官方说是他们的滥用和欺诈机制错误的标记了一些账号导致的bug 所以全体重置天天找理由重置😅

ginobefun@hongming731 · 6天前53

BestBlogs 早报 · 06-27 # GPT-5.6 Sol / Deep Agents 提示词缓存 / AI 推理成本 / Scaling Laws / 翁荔 [1] ★ 精讲｜GPT-5.6 Sol 前瞻：下一代模型预览 OpenAI 启动 GPT-5.6 系列有限预览：旗舰 Sol、均衡款 Terra（性能比肩 GPT-5.5 但便宜一半）、低成本 Luna。新增 max 深度推理档与调用子智能体的 ultra 模式，Sol 在 Terminal-Bench 2.1 上以 88.8% 刷新编码 SOTA。这次首发只面向少数可信伙伴，并配合美国政府网络安全审查分阶段放开——能力跃升与安全门槛同步收紧，才是本次发布最值得关注的信号。来源：OpenAI News https://www.bestblogs.dev/article/97e62d58 [2] ★ 精讲｜Deep Agents 的提示词缓存 LangChain 拆解了把生产级 Agent 成本压下来的关键杠杆——提示词缓存。难点在于各家策略割裂：Anthropic、Gemini 支持显式断点，OpenAI 走最长前缀自动缓存，Gemini 仅有隐式缓存。其 Deep Agents 框架做了 provider 无关封装，在真实 Agent 轨迹上把 token 成本砍掉 49%-80%（claude-haiku -77%、gpt-5.4-mini -80%）。会话越长收益越大，长程任务最受益。来源：LangChain Blog https://www.bestblogs.dev/article/91444258 [3] ★ 精讲｜AI 推理显然是盈利的不少人认为 AI 推理服务本身在亏钱、只能靠投资人输血续命，Sean Goedecke 算了一笔账反驳：4 张 A100 跑 70B 模型约 2M token/小时，电费加散热每百万 token 仅约 13 美分，摊上 GPU 折旧综合成本约 1 美元；而 GPT-5.4-mini 卖 4.5 美元，70%-80% 毛利完全成立。DeepSeek-V4-Pro 市场价约 87 美分已贴近成本佐证。真正亏的不是推理，而是 AI 实验室拿推理利润补贴训练军备竞赛。来源：Sean Goedecke https://www.bestblogs.dev/article/262173e6 [4] 新一代学习 AI，苹果端侧模型配方，GLM-5.2 攻克开放性问题吴恩达分享了指导 AI 原生产品构建的三个关键软件开发循环（智能体编码、开发者反馈、外部反馈），同时涵盖了 GLM-5.2 领先的智能体表现以及美国大学 AI 学位兴起的相关资讯。来源：The Batch | http://DeepLearning.AI https://www.bestblogs.dev/article/6a65696f [5] 科技爱好者周刊（第 401 期）：如何赚到 10 亿美元本文摘录了 Paul Graham 关于如何通过创业赚取 10 亿美元的演讲，核心观点是保持高增长率并进入大市场，并辅以增长计算示例和其他科技资讯。来源：阮一峰的网络日志 https://www.bestblogs.dev/article/a93f6c93 [6] 腾讯混元 AI Infra 如何优化 Hy3 Preview：一次大模型推理性能提升的技术拆解本文拆解腾讯混元 Hy3 大模型在 Hopper 卡上从算子、融合、并行、缓存到量化的全栈推理优化方案，实测性能提升显著。来源：腾讯技术工程 https://www.bestblogs.dev/article/a0f9d2c7 [7] OpenSandbox 再进化：Credential Vault 让真实密钥不再进入沙箱 OpenSandbox 推出 Credential Vault 功能，通过出站代理在沙箱外注入凭据，使 AI Agent 沙箱不再需要保存真实密钥。来源：阿里技术 https://www.bestblogs.dev/article/eb89e83b [8] Zynga 创始人 Mark Pincus：消费者产品「现在没法投」，恰恰是你该入场的理由 [视频] Zynga 创始人 Mark Pincus 反向立论，指出现在正是押注消费者产品的时机，并分享了「Proven Better New」框架、「鱼群来袭」产品市场契合测试法，以及 AI 消费革命将在 2029 年到来的预测。来源：Y Combinator https://www.bestblogs.dev/video/39f15d3 [9] 翁荔最新万字长文：大模型 Scaling Laws，要谨慎理解本文系统梳理大模型 Scaling Laws 的研究脉络，从早期机器学习损失可预测性、Kaplan 与 Chinchilla 的计算最优分配，到数据受限区域及实际拟合中的敏感陷阱，为理解缩放定律提供了全面且深入的导览。来源：AINLP https://www.bestblogs.dev/article/f547eb02 [10] 火山引擎 AI 搜索千万级 Agent 架构演进与实践：从 ReAct 三节点到 Unified Policy 本文详细解析火山引擎 AI 搜索团队如何将标准 ReAct 架构演进为 Unified Policy Agent 架构，通过 Workflow 与 Agent 分层、统一控制/行为/状态，实现 TTFT 降低 30%与推荐质量提升。来源：字节跳动技术团队 https://www.bestblogs.dev/article/b02cc219 --- http://BestBlogs.dev · 发现真正适合你的高质量内容 BestBlogs 是 AI 驱动的私人阅读助手，帮助你发现真正适合你的高质量内容，欢迎体验。在线阅读：https://www.bestblogs.dev/explore/brief/2026-06-27

译OpenAI 启动 GPT-5.6 系列有限预览：旗舰 Sol、均衡款 Terra（性能比肩 GPT-5.5 但便宜一半）和低成本 Luna。新增 max 深度推理档与 ultra 模式，Sol 在 Terminal-Bench 2.1 以 88.8% 刷新编码 SOTA。LangChain 拆解 Deep Agents 提示词缓存，可削减 token 成本 49%-80%（claude-haiku -77%、gpt-5.4-mini -80%）。Sean Goedecke 核算 AI 推理服务毛利率可达 70%-80%，DeepSeek-V4-Pro 市场价约 87 美分已贴近成本。

jason@jxnlco · 6天前37

Culture is a collection of sacred people, sacred objects, and sacred rituals. Tibo and the reset button is the culture

译Codex 所有用户将获得免费使用量重置，预计几小时内到账。已采取缓解措施，调查未发现大规模影响。

Tibo@thsottiaux · 6天前41

We are giving all Codex users a usage reset on the house. Should be showing in your accounts in the next few hours. We have applied some mitigations, but our investigation hasn't shown users being impacted at large. We are continuing to monitor the situation.

译Codex 团队发现部分账户出现用量消耗异常加快的问题，怀疑是滥用与欺诈防护机制过度标记所致。作为回应，团队为所有 Codex 用户免费重置一次用量额度，预计数小时内到账。目前已完成部分缓解措施，调查未显示用户大面积受影响，团队将继续监控。