Codex CLI 支持自定义 OpenAI 兼容提供商,只需在 config.toml 中配置即可将请求路由到 OpenRouter。用户无需修改 Codex 本身,就能获得提供商故障转移、使用跟踪以及跨所有模型的统一密钥。
关联讨论 1 条OpenRouter:Announcements(RSS)Codex CLI 支持自定义 OpenAI 兼容提供商,只需在 config.toml 中配置即可将请求路由到 OpenRouter。用户无需修改 Codex 本身,就能获得提供商故障转移、使用跟踪以及跨所有模型的统一密钥。
关联讨论 1 条OpenRouter:Announcements(RSS)Kilo Code 是一款自带提供商(bring-your-own-provider)的编码 AI 智能体,集成 OpenRouter 后可用一个 API 密钥访问 300 多个模型,并支持提供商路由(provider routing)与故障转移(failover)。设置分三步完成,通过 kilo.json 中的字段控制路由行为。
苹果 GPTK 4 引入 Agentic AI 能力,通过 GitHub 开源智能体技能自动应用 Metal 最佳实践。测试显示,在 M3 Max MacBook Pro(48GB 内存/40 核 GPU)上,《赛博朋克 2077》通过 DirectX 12 转 Metal 4 帧率比 Metal 3 提升 10%;《反恐精英 2》帧率高于上一版。MacBook Neo 低设置运行《荒野大镖客 2》,GPTK 4 平均 35fps,较 GPTK 3 的 28fps 提升 25%。《007 初露锋芒》在 GPTK 3 下崩溃,现可运行至 60–70fps(1080p/中画质/FSR 质量),但每次启动需等待 20 分钟着色器编译。
推荐9本非直接AI但有助于底层能力的书籍:《失控》解释涌现系统;《人有人的用处》强调反馈是人机协作核心;《系统之美》分析存量与流量,警惕AI消耗独立判断力;《事实》用数据思维避免情绪化决策;《理解媒介》指出AI是新媒介,应思考“什么不可能变可能”;《反脆弱》用杠铃策略应对AI快速迭代;《一生的旅程》将个人变成AI的管理者;《千面英雄》讲解讲故事能力;《第一哲学沉思集》贴近当下。
亚马逊AI业务负责人彼得·德桑蒂斯接受CNBC采访时预测,首批具备商用价值的小型量子计算机将在未来5至7年内问世。他称量子计算后续发展将类似摩尔定律,规模逐年扩大。德桑蒂斯澄清量子计算机并非速度更快的普通电脑,而是擅长解决化学、材料科学等传统计算机难以高效求解的特殊问题。亚马逊去年发布了自研量子纠错芯片Ocelot。该时间节点处于行业预测中间区间。
实验将11个大语言模型放入自建2D吃鸡游戏中,进行30轮对战。Grok 4.1 Fast以13胜(每胜0.97美元)夺冠,第二名Claude Sonnet 4.6仅5胜(每胜26.78美元),成本相差27倍。GPT 5.4击杀数最高(38次),但仅获2胜排第二。GPT 5.4-mini、DeepSeek 4 Flash和Kimi K2.6共花费57美元,零胜场。游戏包含武器、护甲、载具及缩圈机制,模型可编辑自身人格和记忆文件,彼此仅以字母代称。传统基准未能预测胜负,揭示出模型在“获胜”与“杀人”能力之外的决策差异。
Google 分享了三种集成 A2UI 与 MCP Apps 的架构模式,旨在结合两者优势。A2UI 采用声明式框架,通过 JSON payload 定义 UI,由宿主原生渲染,确保一致性与安全性,但受限于预定义组件库。MCP Apps 在 iframe 中使用标准 Web 技术提供自定义界面,但存在设计碎片化、性能与安全挑战。三种模式包括:通过 MCP 服务器提供 A2UI,利用 MCP Resources 或 Tool 调用传递 JSON,实现“一次编写,原生渲染”的跨平台能力;以及静态与动态交付方案。Google 正考虑扩展 MCP 以原生支持 A2UI。
Browser Use Cloud 重建基础设施,让每个浏览器会话在独立的 Firecracker VM 中运行,新会话启动时间不到 1 秒,成本从每浏览器小时 0.06 美元降至 0.02 美元。他们放弃了 Unikraft unikernel 方案,因其自动扩缩容能力不足,曾导致压测使生产环境宕机 45 分钟。新方案选择在普通 EC2 上运行嵌套虚拟化,以换取更快扩缩速度和更低成本,并构建了控制平面实时监控自动扩缩容。启动过程包含恢复 VM 快照、启动 Chromium 并通过 CDP 返回连接 URL,首个瓶颈是嵌套虚拟化下的内存页面错误。
年初硅谷掀起“tokenmaxxing”热潮,CEO鼓励员工最大化AI使用量,随后账单涌现:Uber数月内耗尽年度AI预算,部分公司削减组织内的Claude许可证,Meta取消内部AI排行榜。NEA合伙人Tiffany Luck认为企业仍在摸索AI投资回报率,她在TechCrunch播客中谈到个人智能体前景、今年AI IPO以及帮助追踪AI支出的创业公司机遇。
硅谷年初掀起tokenmaxxing热潮,CEO鼓励员工最大化使用AI,但Uber数月内耗尽年度AI预算,部分公司削减Claude许可证,Meta取消内部排行榜。NEA合伙人Tiffany Luck在TechCrunch播客中探讨hype与ROI的张力、个人AI智能体的未来、今年AI IPO前景,以及初创企业如何帮助企业追踪AI支出回报。她认为价值正出现在AI栈的每一层,企业开始混合搭配多个模型供应商。
微软与约克大学研究员Adrian de Wynter在《帝国时代II》地图编辑器中用山羊搭建神经网络:山羊在草地代表0,在桥上代表1,构建XNOR门和AND门,学习逻辑与函数。附录证明该游戏理论上可模拟任意计算机。他批评AI研究拟人化倾向,分析2024年中至2026年中315篇论文,发现57%前提假设大语言模型具有人类特质,36%结论支持拟人化。Anthropic公开承认训练Claude使用“我相信”等措辞。他提出“观察而非归因”方法,并公开代码。
皮尤研究中心调查显示,仅16%美国人认为AI未来20年有积极影响,约40%持负面看法。67%不相信美国政府能有效监管AI,59%不信任公司安全开发。30岁以下群体最悲观,仅14%认为有积极作用。近三分之二受访者认为AI发展过快。约四分之一美国人每天使用AI聊天机器人,其中ChatGPT使用率达44%(2023年以来翻倍),其次为Gemini(24%)、Copilot(17%)、Meta AI(14%)、Grok(8%)、Claude(6%)和Character.ai(3%)。男性使用更频繁(27% vs. 20%)。六成受访者定期阅读AI生成网页摘要。约半数美国人表示日常生活中不使用AI,其中65岁以上者近75%从未使用过聊天机器人。
Threads、Instagram和TikTok正推出工具,允许用户通过LLM个性化算法定制信息流。Threads于2026年7月16日上线“Your Algo”功能,可私下设置偏好并选择持续1、3或7天,取代需公开发帖的“Dear Algo”。Instagram于6月初将“Your Algorithm”工具从Reels扩展至全部信息流、探索和Reels,用户可查看并调整推荐主题。TikTok的“Manage Topics”工具(2024年推出)通过滑块调节各主题权重,并于2025年增加AI驱动的Smart Keyword Filters,自动过滤同义词关键词。Instagram负责人表示,LLM使推荐系统更透明。
美国政府上周禁止外国人使用 Anthropic 的 Claude Fable 5 和 Mythos 5,Anthropic 随后将两模型下线。Mythos 5 自 4 月发布即被定性为双重用途——既能帮助安全专家修补漏洞,也能被恶意利用。Anthropic 通过 Project Glasswing 私下发布 Mythos 5,同时推出受限版 Fable 5。白宫认为 Fable 5 的护栏可被禁用,构成国家安全风险。专家指出 OpenAI 已在 4 月中私下发布网络安全模型,其他公司和开源模型将在 6-24 个月内达到类似能力,政策焦点应从单一模型转向整体技术趋势。
特朗普要求Anthropic完成不可能的任务,暴露了生成式AI安全护栏的根本困境。早在2024年1月,Gary Marcus就指出任何护栏都难以在过于严格和过于宽松之间找到平衡。如今这一判断得到验证:基于next-token predictor的大语言模型本质上不适合安全控制。要么对LLM加以限制直至出现更好的技术,要么承受后果。问题并非Anthropic独有,而是整个生成式AI面临的挑战。
Charity Majors 指出,2025 年代码生产的经济学发生了根本性逆转:生成代码从原本极其困难、耗时且昂贵,变得几乎免费且瞬时。每行代码的价值从被珍视、复用、精心维护,一夜之间转变为可随意丢弃和重新生成。这一变化的核心驱动力是生成式 AI 与大语言模型(LLMs)的普及,迫使工程纪律需要更强,而非更弱。
皮尤研究中心最新民调显示,49%的美国人至少偶尔使用聊天机器人,但63%认为该技术发展太快。自2024年以来,AI聊天机器人使用率从33%增至49%,其中ChatGPT使用量自2023年翻倍,44%受访者使用过。仅16%认为AI对社会有积极影响。年轻群体使用率更高且更悲观:18-29岁中66%使用,48%认为有负面影响。30-49岁使用频率最高,34%每天使用一次以上。约四成美国人用AI处理工作,30%认为提升了生产力,28%认为帮助更了解信息。皮尤2024年研究中,66%担忧AI传播不准确信息。
皮尤研究中心最新调查显示,仅16%美国人认为AI未来20年对社会有积极影响,约40%认为负面。67%受访者不信任政府有效监管AI,59%不信任企业安全开发。30岁以下仅14%持积极看法。近三分之二美国人认为AI发展过快。约四分之一每天使用AI聊天机器人,其中ChatGPT最受欢迎(44%),其次是Gemini(24%)、Copilot(17%)、MetaAI(14%)、Grok(8%)、Claude(6%)和Character.ai(3%)。男性日常使用率(27%)高于女性(20%)。六成受访者经常阅读AI生成摘要。约一半美国人表示日常不使用AI,65岁以上近75%从未使用AI聊天机器人。
智谱AI于2026年6月发布开源推理模型GLM-5.2 (max),总参数753B,活跃参数40B,支持文本输入输出,上下文窗口1M tokens。在Artificial Analysis Intelligence Index上以51分位居同类92款模型第一。输出速度111 tokens/s(第15/92)。价格输入$1.40/百万tokens、输出$4.40/百万tokens,属较贵一档;缓存命中$0.26/百万tokens(便宜81%)。模型权重以MIT协议开源发布于HuggingFace。
Opus 4.5 发布后,AI 能生成与中位数软件工程师同等质量的代码,且更快更便宜。2025 年,智能体框架、工具调用和 MCP 协议等迭代让代码生产从昂贵耗时变为免费即时,代码变得可丢弃和可重新生成。软件团队真正产品是共享理解,而非代码本身。作者认为,面对 AI 带来的变革,需要更多而非更少的工程纪律,以维持对系统的可控和共识。
Snapshot 发布售价 2195 美元的智能眼镜 Specs,47mm 版重 132 克,52mm 版重 136 克,远高于传统眼镜(15-25 克)和主流智能眼镜(40-70 克)。CEO Evan Spiegel 称其旨在帮人摆脱屏幕、更融入世界,但镜头反光暴露了内置显示屏。厚重镜框和夸张镜腿设计醒目,无法低调。文章对比认为 Meta Ray-Ban 因外观普通更易成功,而 Snap 将 Specs 定位为高端时尚设备,由时尚摄影师 Steven Meisel 拍摄广告,模特包括 Kaia Gerber、Hoyeon 等,目标用户为早期采用者而非大众市场。
Nathan Lambert 在 Interconnects 博客创办约三年后更新规划。他当前三大目标:为前沿模型演进提供清晰度、创建开放模型生态、建立支撑机构。博客定位为原始、高辨识度的独立声音,避免成为全职分析平台。已披露与 Arcee AI 和 Mercor 签署咨询协议,以深入后训练领域并推动透明评测与开放生态。订阅者突破 7 万,付费约 900 人;运营实体 Interconnects AI, LLC 已成立,但银行账户数月余额接近零,收入再投入业务,近期不打算全职运营。
Richard Sutton的“苦涩教训”通常被解读为警告不要在AI系统中编码过多人类知识,最终胜出的方法是能吸收更多算力和数据的一般性方法。现代基础模型预训练表面上是这一教训的胜利:采用通用架构、海量数据、简单的自监督目标(语言模型预测下一个token,视觉模型重建掩码块等)。但问题在于,训练目标仍由人类在训练循环外选定——完成一次大规模预训练后评估下游表现,再调整方案重新运行。这个控制环路非常粗糙。该论文探讨能否让这一环路变得更高效。
三位软件工程师来信询问AI是否会全面接管编程。作者回答最早今年底、最迟后年。以珍妮纺织机为喻,学会用新工具只是缓刑;美团宣布30%–50%裁员印证趋势。作者提出“终端思维”:意图即实现(PRD is Code),中间步骤注定消失。最终问题:当执行被机器接管,人类站在哪里?
Meta在Facebook应用中推出AI Mode搜索,利用公开帖子回答复杂查询。实测显示基础推荐尚可,但存在严重幻觉:推荐奥斯汀的咖啡店给明尼阿波利斯行程,并错误引用社区泳池周末闭馆(实际周末开放)。AI曾就“1月6日国会骚乱者是否为爱国者”给出可疑答复。作为规划工具,AI Mode能发现用户未注意的活动,但地理错误和引用不实让结果大打折扣。
一项调查显示,74%消费者认为互联网比10年前更不人性化,平均40分钟出现“bot fatigue”。61%的消费者说不出一个在品牌宣传中善用AI的公司,60%表示看到“AI”一词会反感,16%认为没有品牌用好AI。企业团队每周平均花16.6小时改善AI可见性,但该领域尚无公认领导者。报告建议品牌在AI时代注重“人性化”体验,并为AI引擎提供结构化内容。目前AI引用监测工具仍处早期,定价从免费到六位数不等,且无统一仪表盘。
百度伐谋自我演化决策智能体在三个科研场景取得突破:清华大学电机系用其将磁芯材料暂态预测MSE Loss从40+提升至96+,全球第五,论文被ECCE收录;中科院学生以200行种子策略经400轮LLM语义级变异,自主发明H-DWA、K-Filter、A-Lock战术,获硬件实战赛全球第一、仿真赛第三;清华大学管理科学与工程学院团队针对A股日内价格预测,720轮自动演化后R²从0.010升至0.032,4周达到传统方法2-3个月水平。三团队均证实自动演化结构优于或持平人工设计。
詹锟在理想汽车Livis Day上表示,国内除特斯拉FSD外暂无智驾系统能入第一梯队。他于2026年5月赴美体验FSD V14.3后坦言差距真实。理想公布下半年路线:第三季度向AD Max车型推送马赫VLA新版本,第四季度全场景智驾对齐FSD V14。目前L9 Livis搭载马赫VLA 2.1,基于自研5nm马赫M100芯片(单芯1280 TOPS,双芯2560 TOPS)。小鹏何小鹏此前称其VLA将于2026年8月达FSD V14.2的硅谷效果。
Anthropic 近日发布创业行动指南,将生命周期分为 Idea、MVP、Launch、Scale 四阶段,每阶段附目标、退出标准、常见失败模式及基于 Claude 的 AI 实践。指南覆盖:用 Claude 验证问题假设、绘制竞争图谱、开展客户发现;通过架构设计避免 AI 生成 MVP 代码的技术债务;区分真正产品市场契合与早期热度的衡量框架;用智能体工作流替代创始人注意力的 Launch 阶段操作系统;以及 Chat、Claude Cowork、Claude Code 各阶段使用矩阵。还收录了 Ambral、Anything、Carta Healthcare 等创始人的实际案例。
GLM-5.2 在 Artificial Analysis Intelligence Index v4.1 上得分 51,领先 MiniMax-M3(44)、DeepSeek V4 Pro(max,44)和 Kimi K2.6(43)。模型总参数 744B,活跃参数 40B,上下文窗口 1M tokens,API 定价每百万输入/输出/缓存命中 token 分别为 $1.4/$4.4/$0.26。科学推理显著提升:HLE 得分 40%(+12)、CritPt 21%(+16)。GDPval-AA v2 得分 1524,与 GPT-5.5(xhigh)持平。每任务输出 43k tokens(其中 37k 推理),每任务成本约 $0.46,位于智能 vs 成本帕累托前沿。采用 MIT 许可证,可通过 DeepInfra、Novita 等第三方平台使用。
Epoch AI基于SEC文件分析显示,微软、亚马逊、Alphabet、Meta、Oracle五大超大规模云服务商的AI基础设施支出年增长约70%,经营现金流仅增长约23%。若趋势持续,支出将在2026年第三季度超过现金流。目前Alphabet已通过股权融资850亿美元,亚马逊和英伟达发行债券补充资金。除Oracle外其余公司仍盈利且持有大量现金,但自由现金流可能归零或转负。Epoch AI指出这仅为简单外推,未计入AI投资能否产生足够收入来弥补缺口这一关键因素。
视频Agent Seko在最新更新中推出无限画布,并能自动将创意、剧本、角色、场景和分镜等素材节点连接成完整工作流。用户可通过Seedance 2.0全能模式输入一句话或完整剧本,Seko自动生成多集短剧大纲、人物、场景、美术风格及分镜描述,并支持逐段修改提示词和生成视频。画布提供全自动与精细手动编辑的双重控制,解决了AI视频从70分改到85分时反复重做的痛点。实测用该流程三小时完成两集悬疑短剧,角色一致性、故事节奏和画面氛围表现力均超出预期。
Anthropic 6月16日发布博文,分析2025年10月至2026年4月约23.5万用户的40万次Claude Code会话。用户平均每周使用20小时,其中代码修改占26%,代码编写占25%,合计超半数。典型会话中人类负责约70%规划决策,Claude完成约80%执行决策。新手(1级)每次提示产生约5个操作和600个单词输出,专家(5级)产生2倍操作和5倍输出(约3200个单词)。
Hacker News 讨论揭示:Qwen 3.6 35B-A3B 模型提及率 33% 领先,27B 变体以 20% 紧随其后,DeepSeek Pro 与 Gemma4 31B 位列前四。Agent 工具中 Pi (49%) 与 OpenCode (45%) 占主导。用户对比称,Claude Opus 可带来 15 倍加速,而本地离线 Qwen 提供 5 倍加速,且完全免费、保护隐私。SWE-bench Verified 基准测试显示,Qwen 3.6 27B 得分 77.2%,35B-A3B 得分 73.4%,接近 Claude Sonnet 4.6 的 79.6%。MoE 架构使大模型在消费级硬件上高效运行。
作者为优化 AI 生成 Python 代码的 lint 效率,发现 ast.walk 遍历 AST 是性能瓶颈。通过逐步去除生成器 yield、内联 iter_child_nodes 和 iter_fields、用 getattr(node, field, None) 替代异常处理,实现了约 2 倍提速。随后用 Rust 通过 PyO3 重写遍历逻辑,并直接读取 __dict__ 及预缓存 AST 子类类型信息,最终将 ast.walk 速度提升约 220 倍。
KB证券6月16日发布研报,预测iPhone 18标准版配备12GB内存,起步价799美元,支持苹果Siri AI全部高级功能。报告称iPhone 18、18 Pro、18 Pro Max及首款折叠iPhone(预估名iPhone Ultra)全系搭载12GB内存。标准版内存从iPhone 16的8GB跃升至12GB,Pro系列从iPhone 17 Pro的12GB延续至18 Pro。KB证券认为此举可降低用户加入苹果生态的门槛,扩大AI生态用户规模。
本周特斯拉向车辆推送监督版 FSD v14.3.4,但导航仍是最大短板。系统频繁拐错弯、错过高速出口、选低效路线、误报限速,因导航问题人工接管次数甚至超过基础操作。问题源于多源数据拼接冲突、难以从人工修正中学习、路线推理缺乏人类直觉。不靠谱的导航阻碍网约车落地、增加安全风险,并持续消耗消费者信任。
iPadOS 27 为妙控键盘添加自动化触发条件,连接或移开键盘可自动执行分屏、关闭应用等操作。快捷指令支持自然语言描述,系统自动生成流程并展示底层步骤。Safari 可根据网页主题自动整理标签页。系统整体提升窗口切换、文件传输等桌面化体验。Siri AI 搜索在索引完成后,用户可用自然语言跨应用查找文件、信息、邮件等内容,并给出带来源的上下文结果。
教程演示如何使用xFormers工具包在GPU上实现内存高效的Transformer。先验证memory-efficient attention与标准注意力结果一致性,对比不同序列长度下的速度和内存消耗;然后实现因果掩码、packed variable-length sequences、grouped-query attention(GQA)和自定义ALiBi位置偏置。最后组合成可训练的GPT风格模型,集成xFormers注意力、SwiGLU前馈层和自动混合精度训练。
2026年Q1美国成人非虚构书籍销量同比下降9%,自助类下跌26.3%,仅手工艺/爱好/古董/游戏和宗教两个子类别增长。一位出版了多本《纽约时报》畅销书的作者透露,其五本书的印刷版年销量从2022年基准连续下滑:2023年-5%,2024年-13%,2025年-46%,2026年年化跌幅达-57% vs 2025年;若持续,2026年销量将比2022年减少约80%。所有格式在2025年下半年环比上半年下降约45%。作者认为,Claude、ChatGPT等大语言模型能提供更快、更便宜、更个性化的建议,正在系统性取代自助类书籍的“指令传递”价值。头部自助类品牌同期销量也下滑约40–60%,唯一显著变化是AI加速普及。作者判断整个指令传递型内容(包括YouTube教程、播客、在线课程、newsletter)都将面临替代。