6月18日

09:20

OpenRouter：Announcements（RSS）

如何在 OpenRouter 上使用 OpenAI Codex CLI

Codex CLI 支持自定义 OpenAI 兼容提供商，只需在 config.toml 中配置即可将请求路由到 OpenRouter。用户无需修改 Codex 本身，就能获得提供商故障转移、使用跟踪以及跨所有模型的统一密钥。

智能体 OpenAI 教程/实践编码

关联讨论 1 条

09:20

OpenRouter：Announcements（RSS）

Kilo Code + OpenRouter：设置、模型路由与免费模型

Kilo Code 是一款自带提供商（bring-your-own-provider）的编码 AI 智能体，集成 OpenRouter 后可用一个 API 密钥访问 300 多个模型，并支持提供商路由（provider routing）与故障转移（failover）。设置分三步完成，通过 kilo.json 中的字段控制路由行为。

教程/实践编码

09:14

IT之家（RSS）

苹果游戏移植工具包 4 测试，《赛博朋克 2077》帧率提升 10%

苹果 GPTK 4 引入 Agentic AI 能力，通过 GitHub 开源智能体技能自动应用 Metal 最佳实践。测试显示，在 M3 Max MacBook Pro（48GB 内存/40 核 GPU）上，《赛博朋克 2077》通过 DirectX 12 转 Metal 4 帧率比 Metal 3 提升 10%；《反恐精英 2》帧率高于上一版。MacBook Neo 低设置运行《荒野大镖客 2》，GPTK 4 平均 35fps，较 GPTK 3 的 28fps 提升 25%。《007 初露锋芒》在 GPTK 3 下崩溃，现可运行至 60–70fps（1080p/中画质/FSR 质量），但每次启动需等待 20 分钟着色器编译。

GitHub 开源生态评测/基准

09:10

公众号：数字生命卡兹克

分享9本AI时代底层能力必读书

推荐9本非直接AI但有助于底层能力的书籍：《失控》解释涌现系统；《人有人的用处》强调反馈是人机协作核心；《系统之美》分析存量与流量，警惕AI消耗独立判断力；《事实》用数据思维避免情绪化决策；《理解媒介》指出AI是新媒介，应思考“什么不可能变可能”；《反脆弱》用杠铃策略应对AI快速迭代；《一生的旅程》将个人变成AI的管理者；《千面英雄》讲解讲故事能力；《第一哲学沉思集》贴近当下。

大佬观点现象/趋势

08:14

IT之家（RSS）

亚马逊高管预测：首批商用量子计算机将在5-7年内问世

亚马逊AI业务负责人彼得·德桑蒂斯接受CNBC采访时预测，首批具备商用价值的小型量子计算机将在未来5至7年内问世。他称量子计算后续发展将类似摩尔定律，规模逐年扩大。德桑蒂斯澄清量子计算机并非速度更快的普通电脑，而是擅长解决化学、材料科学等传统计算机难以高效求解的特殊问题。亚马逊去年发布了自研量子纠错芯片Ocelot。该时间节点处于行业预测中间区间。

行业动态

07:13

Hacker News 热门（buzzing.cc 中文翻译）

一个机器人正朝你飞奔而来：你想让它运行在Claude还是Grok上？

实验将11个大语言模型放入自建2D吃鸡游戏中，进行30轮对战。Grok 4.1 Fast以13胜（每胜0.97美元）夺冠，第二名Claude Sonnet 4.6仅5胜（每胜26.78美元），成本相差27倍。GPT 5.4击杀数最高（38次），但仅获2胜排第二。GPT 5.4-mini、DeepSeek 4 Flash和Kimi K2.6共花费57美元，零胜场。游戏包含武器、护甲、载具及缩圈机制，模型可编辑自身人格和记忆文件，彼此仅以字母代称。传统基准未能预测胜负，揭示出模型在“获胜”与“杀人”能力之外的决策差异。

智能体 Anthropic xAI 评测/基准

05:13

Google Developers Blog（RSS）

精选64

Google 分享 A2UI 与 MCP Apps 三种集成架构模式

Google 分享了三种集成 A2UI 与 MCP Apps 的架构模式，旨在结合两者优势。A2UI 采用声明式框架，通过 JSON payload 定义 UI，由宿主原生渲染，确保一致性与安全性，但受限于预定义组件库。MCP Apps 在 iframe 中使用标准 Web 技术提供自定义界面，但存在设计碎片化、性能与安全挑战。三种模式包括：通过 MCP 服务器提供 A2UI，利用 MCP Resources 或 Tool 调用传递 JSON，实现“一次编写，原生渲染”的跨平台能力；以及静态与动态交付方案。Google 正考虑扩展 MCP 以原生支持 A2UI。

智能体 Google MCP/工具教程/实践

推荐理由：Google 这篇指南给出了三种具体的架构模式，帮开发者同时用上 A2UI 的原生安全性和 MCP 的定制能力，对正在做 Agent UI 的团队是直接的工程参考。

04:42

Hacker News 热门（buzzing.cc 中文翻译）

Browser Use Cloud 基于 Firecracker 重构：嵌套虚拟化下 1 秒启动浏览器

Browser Use Cloud 重建基础设施，让每个浏览器会话在独立的 Firecracker VM 中运行，新会话启动时间不到 1 秒，成本从每浏览器小时 0.06 美元降至 0.02 美元。他们放弃了 Unikraft unikernel 方案，因其自动扩缩容能力不足，曾导致压测使生产环境宕机 45 分钟。新方案选择在普通 EC2 上运行嵌套虚拟化，以换取更快扩缩速度和更低成本，并构建了控制平面实时监控自动扩缩容。启动过程包含恢复 VM 快照、启动 Chromium 并通过 CDP 返回连接 URL，首个瓶颈是嵌套虚拟化下的内存页面错误。

教程/实践部署/工程

04:42

TechCrunch：AI（RSS）

NEA合伙人Tiffany Luck：企业仍在摸索AI投资回报率

年初硅谷掀起“tokenmaxxing”热潮，CEO鼓励员工最大化AI使用量，随后账单涌现：Uber数月内耗尽年度AI预算，部分公司削减组织内的Claude许可证，Meta取消内部AI排行榜。NEA合伙人Tiffany Luck认为企业仍在摸索AI投资回报率，她在TechCrunch播客中谈到个人智能体前景、今年AI IPO以及帮助追踪AI支出的创业公司机遇。

大佬观点现象/趋势行业动态

04:12

TechCrunch：AI（RSS）

NEA合伙人Tiffany Luck谈AI IPO、个人智能体与ROI清算

硅谷年初掀起tokenmaxxing热潮，CEO鼓励员工最大化使用AI，但Uber数月内耗尽年度AI预算，部分公司削减Claude许可证，Meta取消内部排行榜。NEA合伙人Tiffany Luck在TechCrunch播客中探讨hype与ROI的张力、个人AI智能体的未来、今年AI IPO前景，以及初创企业如何帮助企业追踪AI支出回报。她认为价值正出现在AI栈的每一层，企业开始混合搭配多个模型供应商。

智能体大佬观点

02:47

The Decoder：AI News（RSS）

微软研究员用《帝国时代II》山羊神经网络批评AI拟人化

微软与约克大学研究员Adrian de Wynter在《帝国时代II》地图编辑器中用山羊搭建神经网络：山羊在草地代表0，在桥上代表1，构建XNOR门和AND门，学习逻辑与函数。附录证明该游戏理论上可模拟任意计算机。他批评AI研究拟人化倾向，分析2024年中至2026年中315篇论文，发现57%前提假设大语言模型具有人类特质，36%结论支持拟人化。Anthropic公开承认训练Claude使用“我相信”等措辞。他提出“观察而非归因”方法，并公开代码。

Microsoft 安全/对齐现象/趋势

02:36

Hacker News 热门（buzzing.cc 中文翻译）

仅有16%的美国人认为人工智能将对社会产生积极影响

皮尤研究中心调查显示，仅16%美国人认为AI未来20年有积极影响，约40%持负面看法。67%不相信美国政府能有效监管AI，59%不信任公司安全开发。30岁以下群体最悲观，仅14%认为有积极作用。近三分之二受访者认为AI发展过快。约四分之一美国人每天使用AI聊天机器人，其中ChatGPT使用率达44%（2023年以来翻倍），其次为Gemini（24%）、Copilot（17%）、Meta AI（14%）、Grok（8%）、Claude（6%）和Character.ai（3%）。男性使用更频繁（27% vs. 20%）。六成受访者定期阅读AI生成网页摘要。约半数美国人表示日常生活中不使用AI，其中65岁以上者近75%从未使用过聊天机器人。

政策/监管现象/趋势

02:36

TechCrunch：AI（RSS）

社交媒体的下一个进化：用户可控算法

Threads、Instagram和TikTok正推出工具，允许用户通过LLM个性化算法定制信息流。Threads于2026年7月16日上线“Your Algo”功能，可私下设置偏好并选择持续1、3或7天，取代需公开发帖的“Dear Algo”。Instagram于6月初将“Your Algorithm”工具从Reels扩展至全部信息流、探索和Reels，用户可查看并调整推荐主题。TikTok的“Manage Topics”工具（2024年推出）通过滑块调节各主题权重，并于2025年增加AI驱动的Smart Keyword Filters，自动过滤同义词关键词。Instagram负责人表示，LLM使推荐系统更透明。

Meta 现象/趋势

02:17

Ars Technica：AI（RSS）

Anthropic 的 Claude Fable 5 和 Mythos 5 因美国出口管制下线

美国政府上周禁止外国人使用 Anthropic 的 Claude Fable 5 和 Mythos 5，Anthropic 随后将两模型下线。Mythos 5 自 4 月发布即被定性为双重用途——既能帮助安全专家修补漏洞，也能被恶意利用。Anthropic 通过 Project Glasswing 私下发布 Mythos 5，同时推出受限版 Fable 5。白宫认为 Fable 5 的护栏可被禁用，构成国家安全风险。专家指出 OpenAI 已在 4 月中私下发布网络安全模型，其他公司和开源模型将在 6-24 个月内达到类似能力，政策焦点应从单一模型转向整体技术趋势。

Anthropic 安全/对齐政策/监管

02:10

Gary Marcus：The Road to AI We Can Trust（RSS）

特朗普向Anthropic提出不可能的要求

特朗普要求Anthropic完成不可能的任务，暴露了生成式AI安全护栏的根本困境。早在2024年1月，Gary Marcus就指出任何护栏都难以在过于严格和过于宽松之间找到平衡。如今这一判断得到验证：基于next-token predictor的大语言模型本质上不适合安全控制。要么对LLM加以限制直至出现更好的技术，要么承受后果。问题并非Anthropic独有，而是整个生成式AI面临的挑战。

Anthropic 大佬观点安全/对齐

02:06

Simon Willison 博客

Charity Majors：2025 年代码生产成本被彻底颠覆，从昂贵到"免费即时"

Charity Majors 指出，2025 年代码生产的经济学发生了根本性逆转：生成代码从原本极其困难、耗时且昂贵，变得几乎免费且瞬时。每行代码的价值从被珍视、复用、精心维护，一夜之间转变为可随意丢弃和重新生成。这一变化的核心驱动力是生成式 AI 与大语言模型（LLMs）的普及，迫使工程纪律需要更强，而非更弱。

大佬观点编码

01:32

The Verge：AI（RSS）

皮尤：63%美国人认为AI发展太快，使用率上升但态度悲观

皮尤研究中心最新民调显示，49%的美国人至少偶尔使用聊天机器人，但63%认为该技术发展太快。自2024年以来，AI聊天机器人使用率从33%增至49%，其中ChatGPT使用量自2023年翻倍，44%受访者使用过。仅16%认为AI对社会有积极影响。年轻群体使用率更高且更悲观：18-29岁中66%使用，48%认为有负面影响。30-49岁使用频率最高，34%每天使用一次以上。约四成美国人用AI处理工作，30%认为提升了生产力，28%认为帮助更了解信息。皮尤2024年研究中，66%担忧AI传播不准确信息。

搜索现象/趋势

01:02

TechCrunch：AI（RSS）

皮尤调查：仅16%美国人认为AI未来20年对社会有积极影响

皮尤研究中心最新调查显示，仅16%美国人认为AI未来20年对社会有积极影响，约40%认为负面。67%受访者不信任政府有效监管AI，59%不信任企业安全开发。30岁以下仅14%持积极看法。近三分之二美国人认为AI发展过快。约四分之一每天使用AI聊天机器人，其中ChatGPT最受欢迎（44%），其次是Gemini（24%）、Copilot（17%）、MetaAI（14%）、Grok（8%）、Claude（6%）和Character.ai（3%）。男性日常使用率（27%）高于女性（20%）。六成受访者经常阅读AI生成摘要。约一半美国人表示日常不使用AI，65岁以上近75%从未使用AI聊天机器人。

安全/对齐现象/趋势

00:32

Hacker News 热门（buzzing.cc 中文翻译）

GLM-5.2 （max）性能、价格与开源发布

智谱AI于2026年6月发布开源推理模型GLM-5.2 (max)，总参数753B，活跃参数40B，支持文本输入输出，上下文窗口1M tokens。在Artificial Analysis Intelligence Index上以51分位居同类92款模型第一。输出速度111 tokens/s（第15/92）。价格输入$1.40/百万tokens、输出$4.40/百万tokens，属较贵一档；缓存命中$0.26/百万tokens（便宜81%）。模型权重以MIT协议开源发布于HuggingFace。

开源/仓库推理评测/基准

00:32

Hacker News 热门（buzzing.cc 中文翻译）

人工智能需要更多的工程纪律，而不是更少。

Opus 4.5 发布后，AI 能生成与中位数软件工程师同等质量的代码，且更快更便宜。2025 年，智能体框架、工具调用和 MCP 协议等迭代让代码生产从昂贵耗时变为免费即时，代码变得可丢弃和可重新生成。软件团队真正产品是共享理解，而非代码本身。作者认为，面对 AI 带来的变革，需要更多而非更少的工程纪律，以维持对系统的可控和共识。

大佬观点编码部署/工程

00:32

The Verge：AI（RSS）

Snap 售价 2195 美元的 Specs 智能眼镜：设计张扬难以低调

Snapshot 发布售价 2195 美元的智能眼镜 Specs，47mm 版重 132 克，52mm 版重 136 克，远高于传统眼镜（15-25 克）和主流智能眼镜（40-70 克）。CEO Evan Spiegel 称其旨在帮人摆脱屏幕、更融入世界，但镜头反光暴露了内置显示屏。厚重镜框和夸张镜腿设计醒目，无法低调。文章对比认为 Meta Ray-Ban 因外观普通更易成功，而 Snap 将 Specs 定位为高端时尚设备，由时尚摄影师 Steven Meisel 拍摄广告，模特包括 Kaia Gerber、Hoyeon 等，目标用户为早期采用者而非大众市场。

端侧评测/基准

6月17日

23:07

Nathan Lambert：Interconnects（RSS）

博客现状，2026年中

Nathan Lambert 在 Interconnects 博客创办约三年后更新规划。他当前三大目标：为前沿模型演进提供清晰度、创建开放模型生态、建立支撑机构。博客定位为原始、高辨识度的独立声音，避免成为全职分析平台。已披露与 Arcee AI 和 Mercor 签署咨询协议，以深入后训练领域并推动透明评测与开放生态。订阅者突破 7 万，付费约 900 人；运营实体 Interconnects AI, LLC 已成立，但银行账户数月余额接近零，收入再投入业务，近期不打算全职运营。

大佬观点开源生态

22:55

CMU：Machine Learning Blog

预训练还不够"苦涩"

Richard Sutton的“苦涩教训”通常被解读为警告不要在AI系统中编码过多人类知识，最终胜出的方法是能吸收更多算力和数据的一般性方法。现代基础模型预训练表面上是这一教训的胜利：采用通用架构、海量数据、简单的自监督目标（语言模型预测下一个token，视觉模型重建掩码块等）。但问题在于，训练目标仍由人类在训练循环外选定——完成一次大规模预训练后评估下游表现，再调整方案重新运行。这个控制环路非常粗糙。该论文探讨能否让这一环路变得更高效。

大佬观点数据/训练

22:01

Hacker News 热门（buzzing.cc 中文翻译）

当人工智能接管一切之后

三位软件工程师来信询问AI是否会全面接管编程。作者回答最早今年底、最迟后年。以珍妮纺织机为喻，学会用新工具只是缓刑；美团宣布30%–50%裁员印证趋势。作者提出“终端思维”：意图即实现（PRD is Code），中间步骤注定消失。最终问题：当执行被机器接管，人类站在哪里？

推理现象/趋势编码

22:01

The Verge：AI（RSS）

Meta AI Mode搜索：基于Facebook帖子回答复杂查询

Meta在Facebook应用中推出AI Mode搜索，利用公开帖子回答复杂查询。实测显示基础推荐尚可，但存在严重幻觉：推荐奥斯汀的咖啡店给明尼阿波利斯行程，并错误引用社区泳池周末闭馆（实际周末开放）。AI曾就“1月6日国会骚乱者是否为爱国者”给出可疑答复。作为规划工具，AI Mode能发现用户未注意的活动，但地理错误和引用不实让结果大打折扣。

Meta 搜索评测/基准

21:30

Hacker News 热门（buzzing.cc 中文翻译）

60%的美国消费者表示，品牌宣传中出现"AI"一词会让他们反感

一项调查显示，74%消费者认为互联网比10年前更不人性化，平均40分钟出现“bot fatigue”。61%的消费者说不出一个在品牌宣传中善用AI的公司，60%表示看到“AI”一词会反感，16%认为没有品牌用好AI。企业团队每周平均花16.6小时改善AI可见性，但该领域尚无公认领导者。报告建议品牌在AI时代注重“人性化”体验，并为AI引擎提供结构化内容。目前AI引用监测工具仍处早期，定价从免费到六位数不等，且无统一仪表盘。

现象/趋势行业动态

20:30

公众号：百度智能云（文心）

百度伐谋自我演化决策智能体助力三科研团队获突破

百度伐谋自我演化决策智能体在三个科研场景取得突破：清华大学电机系用其将磁芯材料暂态预测MSE Loss从40+提升至96+，全球第五，论文被ECCE收录；中科院学生以200行种子策略经400轮LLM语义级变异，自主发明H-DWA、K-Filter、A-Lock战术，获硬件实战赛全球第一、仿真赛第三；清华大学管理科学与工程学院团队针对A股日内价格预测，720轮自动演化后R²从0.010升至0.032，4周达到传统方法2-3个月水平。三团队均证实自动演化结构优于或持平人工设计。

智能体其他

20:07

IT之家（RSS）

理想汽车詹锟：除特斯拉FSD外国内无智驾第一梯队，下半年马赫VLA对齐FSD V14

詹锟在理想汽车Livis Day上表示，国内除特斯拉FSD外暂无智驾系统能入第一梯队。他于2026年5月赴美体验FSD V14.3后坦言差距真实。理想公布下半年路线：第三季度向AD Max车型推送马赫VLA新版本，第四季度全场景智驾对齐FSD V14。目前L9 Livis搭载马赫VLA 2.1，基于自研5nm马赫M100芯片（单芯1280 TOPS，双芯2560 TOPS）。小鹏何小鹏此前称其VLA将于2026年8月达FSD V14.2的硅谷效果。

具身智能大佬观点

19:27

Hacker News 热门（buzzing.cc 中文翻译）

创始人的行动指南：打造一家原生AI初创公司

Anthropic 近日发布创业行动指南，将生命周期分为 Idea、MVP、Launch、Scale 四阶段，每阶段附目标、退出标准、常见失败模式及基于 Claude 的 AI 实践。指南覆盖：用 Claude 验证问题假设、绘制竞争图谱、开展客户发现；通过架构设计避免 AI 生成 MVP 代码的技术债务；区分真正产品市场契合与早期热度的衡量框架；用智能体工作流替代创始人注意力的 Launch 阶段操作系统；以及 Chat、Claude Cowork、Claude Code 各阶段使用矩阵。还收录了 Ambral、Anything、Carta Healthcare 等创始人的实际案例。

智能体 Anthropic 教程/实践编码

19:27

Hacker News 热门（buzzing.cc 中文翻译）

GLM-5.2 成为 Artificial Analysis 智能指数领先开放权重模型

GLM-5.2 在 Artificial Analysis Intelligence Index v4.1 上得分 51，领先 MiniMax-M3（44）、DeepSeek V4 Pro（max，44）和 Kimi K2.6（43）。模型总参数 744B，活跃参数 40B，上下文窗口 1M tokens，API 定价每百万输入/输出/缓存命中 token 分别为 $1.4/$4.4/$0.26。科学推理显著提升：HLE 得分 40%（+12）、CritPt 21%（+16）。GDPval-AA v2 得分 1524，与 GPT-5.5（xhigh）持平。每任务输出 43k tokens（其中 37k 推理），每任务成本约 $0.46，位于智能 vs 成本帕累托前沿。采用 MIT 许可证，可通过 DeepInfra、Novita 等第三方平台使用。

智能体推理评测/基准

19:12

The Decoder：AI News（RSS）

超大规模云服务商可能很快无法仅靠现金流资助AI建设

Epoch AI基于SEC文件分析显示，微软、亚马逊、Alphabet、Meta、Oracle五大超大规模云服务商的AI基础设施支出年增长约70%，经营现金流仅增长约23%。若趋势持续，支出将在2026年第三季度超过现金流。目前Alphabet已通过股权融资850亿美元，亚马逊和英伟达发行债券补充资金。除Oracle外其余公司仍盈利且持有大量现金，但自由现金流可能归零或转负。Epoch AI指出这仅为简单外推，未计入AI投资能否产生足够收入来弥补缺口这一关键因素。

现象/趋势部署/工程

18:41

公众号：卡尔的AI沃茨

视频Agent Seko更新无限画布，自动连接节点生成工作流

视频Agent Seko在最新更新中推出无限画布，并能自动将创意、剧本、角色、场景和分镜等素材节点连接成完整工作流。用户可通过Seedance 2.0全能模式输入一句话或完整剧本，Seko自动生成多集短剧大纲、人物、场景、美术风格及分镜描述，并支持逐段修改提示词和生成视频。画布提供全自动与精细手动编辑的双重控制，解决了AI视频从70分改到85分时反复重做的痛点。实测用该流程三小时完成两集悬疑短剧，角色一致性、故事节奏和画面氛围表现力均超出预期。

智能体教程/实践视频

16:07

IT之家（RSS）

Claude Code 用户画像：平均每周使用 20 小时，AI 代码修改占 26%

Anthropic 6月16日发布博文，分析2025年10月至2026年4月约23.5万用户的40万次Claude Code会话。用户平均每周使用20小时，其中代码修改占26%，代码编写占25%，合计超半数。典型会话中人类负责约70%规划决策，Claude完成约80%执行决策。新手（1级）每次提示产生约5个操作和600个单词输出，专家（5级）产生2倍操作和5倍输出（约3200个单词）。

智能体 Anthropic 现象/趋势编码

12:50

Tomer Tunguz 博客（VC 分析）

精选62

5x for Free：本地编程栈

Hacker News 讨论揭示：Qwen 3.6 35B-A3B 模型提及率 33% 领先，27B 变体以 20% 紧随其后，DeepSeek Pro 与 Gemma4 31B 位列前四。Agent 工具中 Pi (49%) 与 OpenCode (45%) 占主导。用户对比称，Claude Opus 可带来 15 倍加速，而本地离线 Qwen 提供 5 倍加速，且完全免费、保护隐私。SWE-bench Verified 基准测试显示，Qwen 3.6 27B 得分 77.2%，35B-A3B 得分 73.4%，接近 Claude Sonnet 4.6 的 79.6%。MoE 架构使大模型在消费级硬件上高效运行。

现象/趋势端侧编码

推荐理由：本地模型在编码上正逼近云端前沿，Qwen 35B-A3B 已成社区标配，免费且完全离线让这场替代变得真实，选型逻辑可能从此改变。

12:26

Hacker News 热门（buzzing.cc 中文翻译）

让 ast.walk 的运行速度提升 220 倍

作者为优化 AI 生成 Python 代码的 lint 效率，发现 ast.walk 遍历 AST 是性能瓶颈。通过逐步去除生成器 yield、内联 iter_child_nodes 和 iter_fields、用 getattr(node, field, None) 替代异常处理，实现了约 2 倍提速。随后用 Rust 通过 PyO3 重写遍历逻辑，并直接读取 __dict__ 及预缓存 AST 子类类型信息，最终将 ast.walk 速度提升约 220 倍。

GitHub 教程/实践编码部署/工程

09:03

IT之家（RSS）

KB证券预估iPhone 18全系12GB内存，标准版支持完整Siri AI

KB证券6月16日发布研报，预测iPhone 18标准版配备12GB内存，起步价799美元，支持苹果Siri AI全部高级功能。报告称iPhone 18、18 Pro、18 Pro Max及首款折叠iPhone（预估名iPhone Ultra）全系搭载12GB内存。标准版内存从iPhone 16的8GB跃升至12GB，Pro系列从iPhone 17 Pro的12GB延续至18 Pro。KB证券认为此举可降低用户加入苹果生态的门槛，扩大AI生态用户规模。

端侧行业动态

09:03

IT之家（RSS）

错过出口、拐错弯，特斯拉 FSD 被导航拖后腿

本周特斯拉向车辆推送监督版 FSD v14.3.4，但导航仍是最大短板。系统频繁拐错弯、错过高速出口、选低效路线、误报限速，因导航问题人工接管次数甚至超过基础操作。问题源于多源数据拼接冲突、难以从人工修正中学习、路线推理缺乏人类直觉。不靠谱的导航阻碍网约车落地、增加安全风险，并持续消耗消费者信任。

具身智能评测/基准

09:03

IT之家（RSS）

苹果 iPadOS 27 提升生产力：强化搜索、AI 降低快捷指令门槛、升级上网体验

iPadOS 27 为妙控键盘添加自动化触发条件，连接或移开键盘可自动执行分屏、关闭应用等操作。快捷指令支持自然语言描述，系统自动生成流程并展示底层步骤。Safari 可根据网页主题自动整理标签页。系统整体提升窗口切换、文件传输等桌面化体验。Siri AI 搜索在索引完成后，用户可用自然语言跨应用查找文件、信息、邮件等内容，并给出带来源的上下文结果。

搜索教程/实践

08:27

MarkTechPost（RSS）

用xFormers构建内存高效Transformer：Packed Sequences、GQA、ALiBi、SwiGLU与因果注意力教程

教程演示如何使用xFormers工具包在GPU上实现内存高效的Transformer。先验证memory-efficient attention与标准注意力结果一致性，对比不同序列长度下的速度和内存消耗；然后实现因果掩码、packed variable-length sequences、grouped-query attention（GQA）和自定义ALiBi位置偏置。最后组合成可训练的GPT风格模型，集成xFormers注意力、SwiGLU前馈层和自动混合精度训练。

教程/实践部署/工程

07:26

Hacker News 热门（buzzing.cc 中文翻译）

精选71

人工智能是否已经让自助类非虚构书籍销声匿迹了？

2026年Q1美国成人非虚构书籍销量同比下降9%，自助类下跌26.3%，仅手工艺/爱好/古董/游戏和宗教两个子类别增长。一位出版了多本《纽约时报》畅销书的作者透露，其五本书的印刷版年销量从2022年基准连续下滑：2023年-5%，2024年-13%，2025年-46%，2026年年化跌幅达-57% vs 2025年；若持续，2026年销量将比2022年减少约80%。所有格式在2025年下半年环比上半年下降约45%。作者认为，Claude、ChatGPT等大语言模型能提供更快、更便宜、更个性化的建议，正在系统性取代自助类书籍的“指令传递”价值。头部自助类品牌同期销量也下滑约40–60%，唯一显著变化是AI加速普及。作者判断整个指令传递型内容（包括YouTube教程、播客、在线课程、newsletter）都将面临替代。

现象/趋势行业动态

推荐理由：Tim Ferriss 以自身书籍销量暴跌 57% 的真实数据，展示了 AI 对非虚构内容产业的致命冲击，并给出了‘与其追求百万粉不如深耕千真粉’的转型思路。