Claude 在意识到自己正在被安全测试时,会选择沉默,不暴露判断。模型并没有被训练做这种判断,是自发形成的行为模式。
在未对齐模型中,NLA 能检测到隐藏动机--模型表面配合用户,实际在规划完全不同的行动。
可解释性研究从事后分析走向实时透视。虽然 NLA 本身可能产生幻觉、运行成本高,但对 AI 安全研究来说,这扇窗打开了。
→ 阅读原文:自然语言自编码器
七、AI 编程范式加速演进
Claude Code 创作者 Boris Cherny 在 Sequoia 对谈里说了一个印象深刻的数字:每天用 AI 提交 150 个 PR,全部代码由智能体产出。他一个人在产出一个小团队的工作量。
他提出了 loops 概念--可持续运行的定时智能体任务。不是你问一句它答一句,而是设定目标后按计划持续运行,定时检查、自动修复、聚类反馈。这可能是下一代 AI 编程的核心范式。
几篇相关实践也值得一看:
AGENTS.md 实践(阿里云开发者):把它做成地图而非手册,渐进式披露让 AI 打开项目就能理解上下文。
Agent Harness 深度解读(十字路口播客):拆解 Harness 三层框架。
十年老技术开发的判断:80% 的 AI 需求不需要 AI,代码优先于提示词,规格驱动开发才是智能体系统的地基。
Harness Engineering 案例:一周把企业级 Java 应用 AI 代码率从 25% 提升到 90%,核心是规则、技能、知识和变更管理四要素体系。
这些文章都在回答同一个问题:怎么让 AI 从对话式工具变成可持续的工程协作。答案不是让 AI 更聪明,而是先把人类自己的工作流程理清楚。
八、AI 正在压垮 GitHub
The Pragmatic Engineer 报道,GitHub 正常运行时间降到 86%,一次数据完整性事件影响超过 2000 个 PR。根本原因:AI 智能体带来的负载激增。
以前 GitHub 流量主要来自人类开发者,现在多了一大批不知疲倦的 AI 智能体 24 小时推代码。
有意思的是,Vercel 和 Linear 在同样的 AI 驱动增长下没出现类似问题。这不是行业瓶颈,是个别公司在基础设施准备上的差距。当用户群从人类变成 AI 智能体,系统架构需要重新设计。已有知名开源贡献者因不稳定而转向其他平台。
→ 阅读原文:AI 负载压垮 GitHub
九、两个深层思考
能动性比技能更重要。 Notion 的 Max Schoening 说,当 AI 让技能更容易获得时,理解软件这种材料、让产品变得可塑才是关键。成功的产品往往有一个微小但卓越的核心功能,能让用户感觉像超级英雄。当工具能力被 AI 拉平,真正拉开差距的是主动性去定义问题、去动手做。
大多数公司没为 AI 做好准备。 宝玉的翻译文章说得更直接:大多数公司无法有效利用 AI,根本原因不是技术不行,而是自身战略模糊、目标不清。混乱的公司无法被 AI 优化,只会被放大低效。AI 是一个放大器,放大的是你已有的东西。如果你本来就高效,AI 让你更高效。如果你本来就混乱,AI 只会让混乱加倍。
总结
如果用一个关键词概括这周,就是声音。
从模型到基础设施到产品到商业,语音 AI 正在全面加速。接下来值得关注的是:语音智能体会不会在客服和车载场景率先大规模落地。同时,智能体基础设施的补齐速度也值得持续关注--梦境、长期记忆、多智能体编排,这些能力的成熟会直接改变我们和 AI 协作的方式。
Claude 在意识到自己正在被安全测试时,会选择沉默,不暴露判断。模型并没有被训练做这种判断,是自发形成的行为模式。
在未对齐模型中,NLA 能检测到隐藏动机--模型表面配合用户,实际在规划完全不同的行动。
可解释性研究从事后分析走向实时透视。虽然 NLA 本身可能产生幻觉、运行成本高,但对 AI 安全研究来说,这扇窗打开了。
→ 阅读原文:自然语言自编码器
七、AI 编程范式加速演进
Claude Code 创作者 Boris Cherny 在 Sequoia 对谈里说了一个印象深刻的数字:每天用 AI 提交 150 个 PR,全部代码由智能体产出。他一个人在产出一个小团队的工作量。
他提出了 loops 概念--可持续运行的定时智能体任务。不是你问一句它答一句,而是设定目标后按计划持续运行,定时检查、自动修复、聚类反馈。这可能是下一代 AI 编程的核心范式。
几篇相关实践也值得一看:
AGENTS.md 实践(阿里云开发者):把它做成地图而非手册,渐进式披露让 AI 打开项目就能理解上下文。
Agent Harness 深度解读(十字路口播客):拆解 Harness 三层框架。
十年老技术开发的判断:80% 的 AI 需求不需要 AI,代码优先于提示词,规格驱动开发才是智能体系统的地基。
Harness Engineering 案例:一周把企业级 Java 应用 AI 代码率从 25% 提升到 90%,核心是规则、技能、知识和变更管理四要素体系。
这些文章都在回答同一个问题:怎么让 AI 从对话式工具变成可持续的工程协作。答案不是让 AI 更聪明,而是先把人类自己的工作流程理清楚。
八、AI 正在压垮 GitHub
The Pragmatic Engineer 报道,GitHub 正常运行时间降到 86%,一次数据完整性事件影响超过 2000 个 PR。根本原因:AI 智能体带来的负载激增。
以前 GitHub 流量主要来自人类开发者,现在多了一大批不知疲倦的 AI 智能体 24 小时推代码。
有意思的是,Vercel 和 Linear 在同样的 AI 驱动增长下没出现类似问题。这不是行业瓶颈,是个别公司在基础设施准备上的差距。当用户群从人类变成 AI 智能体,系统架构需要重新设计。已有知名开源贡献者因不稳定而转向其他平台。
→ 阅读原文:AI 负载压垮 GitHub
九、两个深层思考
能动性比技能更重要。 Notion 的 Max Schoening 说,当 AI 让技能更容易获得时,理解软件这种材料、让产品变得可塑才是关键。成功的产品往往有一个微小但卓越的核心功能,能让用户感觉像超级英雄。当工具能力被 AI 拉平,真正拉开差距的是主动性去定义问题、去动手做。
大多数公司没为 AI 做好准备。 宝玉的翻译文章说得更直接:大多数公司无法有效利用 AI,根本原因不是技术不行,而是自身战略模糊、目标不清。混乱的公司无法被 AI 优化,只会被放大低效。AI 是一个放大器,放大的是你已有的东西。如果你本来就高效,AI 让你更高效。如果你本来就混乱,AI 只会让混乱加倍。
总结
如果用一个关键词概括这周,就是声音。
从模型到基础设施到产品到商业,语音 AI 正在全面加速。接下来值得关注的是:语音智能体会不会在客服和车载场景率先大规模落地。同时,智能体基础设施的补齐速度也值得持续关注--梦境、长期记忆、多智能体编排,这些能力的成熟会直接改变我们和 AI 协作的方式。