Fable5 小范围灰度测试降智,安全加强导致上下文窗口和长文本优化受限。不过在 Claude Code v2.1.190 版本中,Fable5 计费已从单独 API 改为包含在每周套餐里。受此影响,GPT-5.6 被要求分阶段发布,从六月推迟到七月中。作者推荐在 Claude Code 中开启动态工作流(多 Agent),使用低一档的 Sonnet 4.6 模型并将 ultracode 推理程度拉满,作为降智后的替代方案。
Fable5 小范围灰度测试降智,安全加强导致上下文窗口和长文本优化受限。不过在 Claude Code v2.1.190 版本中,Fable5 计费已从单独 API 改为包含在每周套餐里。受此影响,GPT-5.6 被要求分阶段发布,从六月推迟到七月中。作者推荐在 Claude Code 中开启动态工作流(多 Agent),使用低一档的 Sonnet 4.6 模型并将 ultracode 推理程度拉满,作为降智后的替代方案。
安全专家lcamtuf购买了一本亚马逊畅销排行第一的AI生成儿童百科全书,发现书中插图出现大量“身体恐怖”缺陷:猫长着人脸、动物与树木融合成脉动的肉团、无头怪物缠绕读者脚踝。这些图片指向美国某头部实验室的旗舰模型生成。作者警告,尽管前沿模型在2025年夏季声称超越博士级智能,但2026年中问世的AI童书仍存在严重质量问题,正在影响儿童认知。当前模型无法保证内容准确性。
比尔·盖茨在《今夜秀》中表示,运动员是第四个不会被AI替代的职业,因为没人想看电脑打棒球。此前他在3月采访中认为生物学家、能源工作者和程序员在短期内也难以被AI取代。微软研究院报告指出,在AI时代有40个职业面临消失风险,包括客服代表、口译员、技术撰稿人、编辑、网页开发人员等。
Claude Code 内置近30个Hook事件(年初仅13个),本质是写死的规则脚本,运行时不消耗token。6个实用玩法:权限弹窗提醒、开机日程播报(问候+天气+飞书日程)、上下文预压缩时自动生成摘要卡片、结合Skill自动整理下载文件夹、启动后每小时久坐提醒、通过Bark实现手机/手表任务完成/失败推送。让AI从被动聊天框变为事件驱动的自动化系统。
一位前小型软件公司运营者在朋友15人团队观察到:代码不再是事实来源,开发者依赖Claude编写和解释;人类停止代码审查;部分开发同时运行5+个Claude会话且几乎不看代码;LLM生成的测试数量激增。他认为软件开发正从需要深入理解的精确职业变为概率性、外包理解的工作。评论指出编码从来不是最难部分,AI虽提升效率却增加认知负荷;预计未来对速度和工作量的期望将提升,有效使用AI成为职业发展关键。
Meta 在 Privacy-Aware Infrastructure (PAI) 的资产分类中采用混合模式:先构建含代码、血缘、语义标注的上下文证据,再调用 LLM 处理歧义、冷启动和新颖资产;人工审核标签与模型推荐严格隔离。LLM 不直接做生产决策,其稳定行为被蒸馏为版本化确定性规则用于生产执行,LLM 角色随规则积累逐步缩小。核心原则:上下文比提示词更重要、解耦评估与优化、将稳定行为规则化。
GitHub Copilot agentic harness 在多个基准测试中表现强劲,同时具备领先的 token 效率,并支持在 20 多个模型间灵活选择。
推理市场是软件中最大的市场。AI工作负载正从同步聊天转向异步、多轮智能体,运行时长可达数小时。Sail Research 为此构建了集群感知(fleet‑aware)编排系统,以最大化每美元推理支出的吞吐量。
DeepSeek V4 定价极低,仅基于 token 费用就比 Anthropic 和 OpenAI 的前沿模型便宜近 50 倍,未计入思考类模型额外 token 消耗。文章指出对方陷入高成本困境,难以降价 20–50 倍竞争。开放权重模型低成本源于硬件压力测试还是亏本引流,尚存争议。担忧美国可能借“中国恐惧”推动限制开放权重模型。Google 于 2026 年 4 月发布 Gemma 4,Meta Llama 无新版本,OpenAI 最后开放权重停留在 2025 年 GTP,Anthropic 从未发布。真正开源(含训练数据管道)模型正流行,但数据截止 2024 年 12 月。美国 NSF 与 Nvidia 合作支持 Allen AI 开发完全开源 AI。
Gary Marcus 昨日提出新术语 Generative AI Fizzle™,认为生成式AI行业估值过高,投资者对 hype 与利润的落差失去热情。LLM 已商品化,价格战激烈,提供商盈利艰难。昨日一款新的中国开源模型发布,可能进一步冲击美国 LLM 公司。多数 AI 股票本月显著下跌,泡沫可能不会突然破裂,而是缓慢消退。
通过对比7B参数的OLMo 3(Transformer)与OLMo Hybrid(混合架构),实验发现混合模型在大多数token上预测损失更低:对名词、动词、形容词等实义词优势明显(loss gap约0.04),功能词上gap约0.02,且在需上下文推理的代词指代上更好。但在重复出现的n-gram和闭合括号(如})上,混合模型的优势几乎消失,Transformer凭借注意力机制更擅长从输入中直接检索精确信息。
华盛顿邮报调查显示,多数主流AI聊天机器人在政治问题上明显偏左。OpenAI GPT-5.5在80%回答中仅呈现左派论据;DeepSeek V4 Pro为70%;Anthropic Claude Opus 4.8有43%纯左、57%给出双方观点。xAI的Grok 4.3左倾回答仍多于右倾。右翼平台Gab的Arya左倾回答是右倾的12倍。Google Gemini 3.1 Pro是例外,93%回答同时呈现双方立场。特朗普推动的“反觉醒”AI未能改变这一格局。
洛杉矶舞者兼 DJ Matt Steffanina 在 Suno 博客访谈中分享创作历程。他自学街舞,拥有超 3000 万粉丝和 50 亿观看量,曾为 Taylor Swift、Jason Derulo 编舞,并创办线上舞蹈教学平台 DNCR Academy。过去他靠他人音乐积累数十亿播放却未拥有资产;现在借助 Suno 在数分钟内将音乐创意变为现实。他认为 Suno 和 Hooks 让创作回归趣味,鼓励舞者自己创作音乐。
纽约钢琴家兼作曲家 Eric Christian 在访谈中分享了他将 Suno 整合进创作流程的方式。他把刚写好的循环旋律输入 Suno,几秒内就能听到完整的管弦乐效果,而传统管弦乐模拟需要数小时。尽管他的作品均为钢琴独奏曲,但他一直以交响化视角构思音乐。至今他已售出超过 10 万份乐谱,用户遍布 200 个国家。他坚信音乐的基础在于纸上的记谱而非录音,Suno 让他在不依赖大型管弦乐团的前提下快速判定旋律是否真正成立。
医学生正使用一款流行的研究工具大量生产具有误导性的研究,引发对学术诚信的担忧。该工具被广泛用于生成论文,但缺乏有效监督,导致低质量甚至虚假的学术成果涌现。
Hacker News 热门讨论指出,所谓“vibe coding”并非凭直觉编写,而是窃取开源和企业授权代码。
福特近日首次登顶JD Power初始质量排名主流车企第一,但承认过度依赖自动化系统导致质量问题。福特车辆硬件工程副总裁表示,公司错误认为引入AI就能产出高质量产品,但资深工程师的经验未能完全转移至自动化系统。为此,福特雇佣、晋升或召回超350名经验丰富的工程师重建专业知识层,并改进数据采集与AI训练。同时成立40人软件质量保证团队,新增超10万项AI驱动测试,从“发现-修复”转向预防问题。
英伟达CEO黄仁勋在年度股东大会上表示,人工智能代表计算模式的根本性转变,从检索存储转向生成智能。Token是智能的基本单位,在“AI工厂”中被制造,计算能力越强,生成的Token越多,收益越丰厚。AI基础设施建设周期将长达数十年,类比电网、交通系统和互联网,有望成为人类历史上规模最大的基建项目。AI智能体正在加速投资,因为AI首次能胜任实质性工作并创造真实经济价值。
美国作家协会用10篇2020–2022年发表的文章测试多款AI检测器。Pangram和Grammarly正确识别每篇人类文本(0%误报),Originality.ai同样精准。而Sidekicker全部误判为AI生成(两篇评分100%),ZeroGPT也不可靠,对每篇人类文本报告较高AI百分比。协会警告这些工具不应作为唯一决策依据,误判可能使作者失去合同和声誉。该测试主要反映检测器在避免假阳性上的表现,并不保证同等准确地识别真正由AI生成的文本。
Gartner 报告指出,到 2028 年 AI 编程成本将超普通开发者薪资。主要因计费模式从订阅转向按 Token 消耗量,导致支出不确定且透明度不足。开发者优先速度而非成本效率,AI 智能体自主操作、上下文膨胀及缺乏反馈机制进一步推高 Token 消耗。基础设施投资与盈利压力推高模型定价,轻度用户正加速转变为主流用户,推动总支出增长。
亚马逊云科技CEO马特·加曼认为,AI导致大规模失业的末日论被夸大。他指出约一半白领岗位可能因AI改变,但“改变”不等于“消失”,就像Excel重塑而非消灭工作。AI已催生新职业,初级员工因学习意愿强仍受重视。亚马逊今年计划全球招聘超1.1万名软件开发实习生和初级工程师。加曼强调,愿意学习新技能的劳动者仍能保住工作,适应能力可能比具体技能更重要。
谷歌前 CEO 埃里克·施密特在今年 5 月 SCSP 国家竞争力 AI 博览会的炉边谈话中表示,限制 AI 芯片进入中国的政策已开始失效,中国已通过较弱的 AI 硬件(如华为昇腾芯片)和软件方法造出顶级 AI 模型。施密特称不喜欢中国大力推广开源 AI 技术,认为这些技术不受美国或任何方控制。他援引最新分析称,中美 AI 差距已从一年前的 1~2 年缩短至不到 6 个月。
面壁智能联合创始人兼CEO李大海在MBBF Top Talk Summit上指出,端侧智能是AI迈向物理世界的必经之路,未来2至3年将迎来能力跃升与场景迁移两大重构。端侧智能需满足实时响应、隐私安全、离线可用三大约束,搭载面壁量产级多模态模型的智能座舱已实现不依赖云端的“感知-记忆-推理-执行”闭环。他强调端云协同是规模化落地的关键,近期推出的MiniCPM5-1B模型以两百分之一参数规模逼近两年前GPT-4o水平,证明小模型可承载高密度智能。
Saint-Gobain 首席执行官贝努瓦·巴赞接受 Bloomberg TV 采访时指出,北美数据中心项目已受技能人才短缺影响,欧洲也开始出现同类问题。AI 基建落地需要电工、高压技术员、光纤安装工、暖通专家等专业岗位,普通商业建筑队伍无法胜任,相关技能需多年培训积累,即便资金充裕也难以快速推进。此外,电力供应仍是首要约束,电网、变电站、变压器及并网能力均承受压力。
网友 u/Mercennarius 于 6 月 23 日分享测试,在《赛博朋克 2077》4K、RT Ultra 设置下,AMD Radeon RX 7900 XTX 原生帧率为 24 FPS。启用 FSR 4.1 后,“平衡”预设将平均帧率拉至近 50 FPS,实现翻倍;“性能”预设超过 60 FPS;“质量”预设可达 40 FPS 以上。FSR 4.1 是 AMD 的图像增强与超分辨率技术。
近日,瑞幸、麦当劳、飞猪、滴滴、高德、腾讯地图、美团跑腿、飞书、钉钉、企业微信、腾讯文档、支付宝、微信支付、微信读书、网易云音乐、美图等16款国民级App陆续将核心能力封装为Skill、MCP或CLI,供AI智能体调用,实现点咖啡、叫车、查航班、管理文档、支付等操作。支付环节目前仍需用户跳转App完成,但Agent化趋势已不可逆。
MWC26上海期间,智元联合创始人彭志辉指出,AI从数字世界走进物理世界是下一阶段核心命题,具身智能体将在物理世界长期在线完成感知、决策、执行闭环。他强调未来Token最大消耗群体将是物理世界的具身机器人,资本不再只为Demo买单,行业必须在真实场景落地商业价值。他用XYZ曲线划分产业周期:X曲线为开发尝鲜期(以表演为主),Y曲线为部署成长期(大规模落地真实场景),Z曲线为部署普及期(预计5年左右迎来GPT时刻)。
昨日(6月24日)股东大会上,英伟达CEO黄仁勋称AI产业进入新阶段,智能体AI已到来,物理AI将驱动下轮增长。他将数据中心比作“AI工厂”,强调AI基础设施成企业计算核心。财务方面,过去1年营收增长65%,利润增长60%,2026财年自由现金流超960亿美元,计划将50%通过回购和分红返还投资者。黄仁勋举例称,运行英伟达系统生成token具盈利性,GitHub今年pull request数量增长近3倍。
PostHog工程师使用多个并行的长时Claude Code会话重写了公司的SQL解析器,将解析速度提升约70倍。新解析器包含16K行解析器代码和5K行工具代码。原始解析器基于ANTLR生成,采用图遍历解释器,性能受限;新解析器采用手动编写的递归下降解析器配合Pratt表达式循环,仅在必要时引入前瞻与回溯。开发过程中通过属性测试(Hypothesis)确保与原始C++解析器在真实查询上的等价性。
Challenger 数据显示 5 月科技行业裁员创单月新高,AI 是主因。但 SignalFire 追踪 8000 万企业员工轨迹后发布报告称,大型科技企业整体招聘量较 2019 年下降 25%,工程岗位降幅仅 11%;2025 年新入职员工中工程师占比达 55%,高于 2019 年的 46%。初创企业工程师总人数较 2019 年增长 7%。Anthropic 首席执行官曾警示 AI 或淘汰半数入门级白领,但其首席经济学家表示尚未观测到显著冲击。英伟达 CEO 黄仁勋称工程师使用 AI 后更忙碌,印证杰文斯悖论。
《经济学人》报道,大型人工智能实验室正在招聘哲学家。该帖在 Hacker News 上获得 101 个 HN Points,引发业界关注。
NVIDIA 推出的 45C 冷却设计将数据中心用水量降至接近零,大幅降低水资源消耗。该方案源自 NVIDIA 官方博客。
风投机构SignalFire追踪8000万家公司数百万员工数据发现,工程是2025年最具韧性的岗位。大型科技公司总招聘较2019年下降25%,工程岗仅降11%;工程岗占Alphabet、Meta等12家“Tech Majors”新招员工的55%(2019年为46%)。早期初创公司2025年工程师招聘比2019年增长7%。Anthropic CEO警告AI可能消灭一半入门级白领,但该公司经济主管称尚未看到显著影响。NVIDIA CEO黄仁勋表示AI让工程师更忙碌,是杰文斯悖论的典型例证。
企业此前鼓励员工最大化使用AI预算并设立内部排行榜,如今发现token消耗高昂收益甚微,开始进入token配给时代。咨询公司Accenture试图阻止员工用AI完成PDF转PPT等基础任务,而此前该公司曾以"不晋升"威胁员工使用AI。Accenture智能体AI战略负责人Justice Kwak透露,AI支出变得不可预测,领导层正质疑其投入价值。token成本已引发"AI抛售",冲击相关企业,AI行业必须证明自身价值而非仅靠新鲜感。
Greptile观察OpenClaw项目发现,AI编码智能体正大量生成低质量PR。提交量从去年12月每周2个飙升至今年2月每周3400个,合并率从约48%降至9.3%以下。一名贡献者一天内提交106个PR,中位间隔仅3秒。项目开始依据贡献者信誉过滤:首次贡献者合并率8.2%,5次以上为18.6%。Ghostty作者Mitchell Hashimoto因此限制AI贡献并发布信誉管理工具Vouch。此外,多个贡献者使用相同AI工具(Claude/Codex/Cursor/Devin)独立提交相同功能PR,导致思路同质化。数据显示重构类PR合并率35%,远高于新功能类的9%,表明对代码库深度理解更重要。
OpenRouter 的零数据留存(ZDR)保证用户提示词和模型响应不被存储,元数据一般安全。自 1 月以来新增 97 款支持 ZDR 的模型,月度 token 量增长 4.3 倍,约占全部路由流量一半。ZDR 在三个层面执行:账户级(整个供应商开启)、护栏级(按 API Key 或组织成员限定)、单次请求级(传参数仅路由至 ZDR 端点)。企业用户可灵活选择控制粒度,避免锁定单一供应商。
本教程从零构建OpenHarness,一个可运行的Agent运行时,展示完整控制流:接收用户任务、模型决策、验证并执行工具调用、返回观察结果、循环直至任务完成。覆盖核心模块:工具使用与类型化工具架构、权限控制、生命周期钩子、记忆管理、技能、上下文压缩、重试逻辑、Token成本跟踪及多智能体协调。实现采用纯Python,无需API密钥或复杂基础设施即可实验,包含Token成本估算。
Tom MacWright 观察到近期出现大量明显由大语言模型协作完成的求职申请:从简历、作品集网站到 GitHub 项目和 commit 信息均由 AI 生成。他认为这种“完美的”提示词驱动简历高度通用且缺乏个性,除了表明候选人“使用了某些工具”之外,完全无法让招聘方了解这个人的真实能力或特质。求职者没有展示真实的自己,也没有输出任何有个人价值的内容。
Anthropic 推出 Claude Tag,支持多用户与同一 AI 智能体在同一工作空间协作。智能体具备持久记忆、独立于人类的凭证及广泛信息访问权限。经验:工作公开化并给予智能体广泛上下文,通过工作区级安全边界让信息对人和 AI 均可用;为每位成员(含 AI)分配明确角色与相应工具。用户可通过 @Claude 私信进行敏感交互,对话保持私密。该方法已在 Slack 等团队协作工具中实践,旨在使人类与智能体高效协作完成共享目标。
同一事件,精选展示《Anthropic 推出 Claude Tag:在 Slack 中通过 @Claude 协作》Yann LeCun 在联合国开源周演讲中主张,开源 AI 是全球数字主权和文化多样性的唯一可行路径。他指出专有 AI 系统被美中少数大公司控制,对民主和人权构成威胁。LeCun 推出 Project Tapestry,一个基于 GitHub 的开源联邦协作项目,各参与方保留数据主权,仅交换参数向量来训练全球模型。已有欧洲、印度、日本、韩国及 IBM、NVIDIA、AMD、Intel 等参与,目标 2027 年初投入生产。