全部 AI 动态 · AI HOT

内容

精选全部 AI 动态 AI 日报主题收藏

接入

更多

关于更新日志反馈

内部员工登录

精选全部日报更多

内部员工登录

全部动态X · 2081 条

全部一手资讯 X 论文

标签「编码」清除

Berryxia.AI@berryxia · 5月4日49

所有人都在担心AI抢程序员饭碗， Anthropic CEO却直接甩出一句狠话： “AI将在一年内写出100%的代码。” 程序员花4年大学学编码， Claude却从人类写过的每一本书里学会了。最难的技能已经被AI干掉，真正的差距不再是你“知道什么”，而是你“有没有把这个无所不知的工具配置到极致”。大多数人，还根本没开始认真配置和使用好它。代码从来不是瓶颈，瓶颈是：你能不能让AI真正为你所用。未来程序员的竞争力，不是会写代码，而是会“指挥”代码。

译Anthropic CEO断言AI将在一年内完成所有代码编写。他指出，像Claude这样的AI系统已通过海量文本掌握了编程知识，而人类通常需花费数年学习。这意味着编程技能本身不再是核心竞争力，最难的技能已被AI掌握。未来的关键差距在于能否高效配置和运用这些“无所不知”的工具，而目前多数人尚未开始认真使用。因此，未来程序员的竞争力将转向善于“指挥”AI生成代码，而非亲自编写。

Peter Steinberger 🦞@steipete · 5月4日40

Here's codex validating a [macOS only] launchd issue I previously had that you can't reliably reproduce on a non-fresh install. Crabboxes ftw!

译这是codex验证我之前遇到的[仅限macOS] launchd问题，该问题在非全新安装的系统上无法可靠复现。 Crabboxes ftw!

OpenClaw🦞@openclaw · 5月4日58

ClawSweeper 0.2.0 🦞 The OpenClaw maintenance bot now handles the loop: issue → @clawsweeper fix/build → guarded PR → review → repair → re-review → automerge Still conservative. Much less manual. https://clawsweeper.bot

译ClawSweeper 0.2.0 🦞 OpenClaw 维护机器人现已处理整个循环：问题 → @clawsweeper 修复/构建 → 受保护的 PR → 审查 → 修复 → 重新审查 → 自动合并依然保守。手动操作大幅减少。 https://clawsweeper.bot

Peter Steinberger 🦞@steipete · 5月4日74

This is the most useful tooling I built for OpenClaw to date. It's open source, runs on codex and you can fork and use it for any repo. For all the hard working oss folks that drown in issues and PRs, this is for you.

译这是我迄今为止为 OpenClaw 构建的最有用的工具。它是开源的，运行在 codex 上，你可以 fork 并将其用于任何代码库。献给所有在 issue 和 PR 中辛勤工作的开源贡献者们，这是为你们准备的。

Peter Steinberger 🦞@steipete · 5月4日58

🦀📦Crabbox 0.4.0. Often I need to quickly recreate conditions on macOS, Linux and Windows and need fast empheral machines. Crabbox are machines for agents on the fly, using AWS spot instances, Hetzner or @useblacksmith. Infinite codex + tests! https://crabbox.sh/

译🦀📦Crabbox 0.4.0。我经常需要快速在 macOS、Linux 和 Windows 上重建环境，并且需要快速的临时机器。 Crabbox 是为即时代理提供的机器，使用 AWS 竞价实例、Hetzner 或 @useblacksmith。无限代码库 + 测试！ https://crabbox.sh/

Peter Steinberger 🦞@steipete · 5月4日19

Seems I have to build all the tooling for the future of software myself. With Claws and Tokens!

译看来我得自己用 Claws 和 Tokens 来构建所有为了软件未来的工具。

TestingCatalog News 🗞@testingcatalog · 5月4日52

Google is working on Figma and GitHub import options for AI Studio Build. h/t @Thomas16937378

译Google正在为AI Studio Build开发Figma和GitHub导入选项。 h/t @Thomas16937378

Peter Steinberger 🦞@steipete · 5月4日37

Codex... what is this... are these signs of CHARACTER?

译Codex... 这是什么... 这些是 CHARACTER 的迹象吗？

Tibo@thsottiaux · 5月4日75

Last week, we released *Auto-Review* mode in Codex! It is now the default within OpenAI and reduces amount of approvals needed by ~200X. Amazing work from our alignment team. Read the blog at https://alignment.openai.com/auto-review

译上周，我们在 Codex 中发布了 *Auto-Review* 模式！它现已成为 OpenAI 内部的默认设置，并将所需的批准数量减少了约 200 倍。我们的对齐团队完成了出色的工作。阅读博客：https://alignment.openai.com/auto-review

Sam Altman@sama · 5月3日22

it really is!

译确实如此！

meng shao@shao__meng · 5月3日38

写了一篇 OpenAI Codex App 入门指南本来想把 Markdown 编辑为 X Article 格式分享，不过 X Article 的编辑体验还是太费时间了，明天先发公众号，再整理 X Article 格式（朋友们如果有好的 Markdown -> X Article 工具或 Skills，感谢分享！）刚好这两天受 @yudDIDit 邀请体验 @editframe Skills，安装后用它做了这个「OpenAI Codex App 入门指南」的预览视频，先分享出来大家看看。公众号明天发布后我再补充文章链接 🔗

译作者撰写了OpenAI Codex App入门指南，原计划将Markdown内容编辑为X Article格式分享，但因编辑过程费时，决定先发布到公众号。在体验@editframe Skills期间，他利用该工具制作了指南的预览视频。@editframe近日从隐匿模式推出，强调代理需要视频功能，其Agent Skills允许用户通过提示Claude Code、Cursor或Codex等AI编码工具，直接生成可运行视频或完整交互式图形界面。所示视频仅通过提示创建，体现了@editframe在自动化视频生成方面的能力。

meng shao@shao__meng · 5月3日72

解决真正工程问题的 Skills：Skills For Real Engineers 作者 @mattpocockuk 公开了自己 .claude/ 目录中每天在用的 Agent Skills 集合，目标读者是在做真正工程的人们，解决真正的工程问题。 # 真正想解决的四类失败模式 1. Agent 没做对你想要的事 —— 沟通鸿沟引用 The Pragmatic Programmer："没人确切知道自己想要什么。" 修复：在动工前先被 Agent 反向拷问。 · /grill-me：通用版逼问 · /grill-with-docs：工程版逼问，同时维护项目术语表与 ADR 这是作者明说的"最受欢迎的两个 Skill"。 2. Agent 太啰嗦 —— 缺少共享语言引用 Eric Evans 的 DDD：领域专家与开发者一开始说的就不是同一种语言，Agent 也一样。修复：项目根目录维护一份 CONTEXT.md（领域词典）+ docs/adr/（架构决策记录）。作者举了自己 course-video-manager 仓库的例子： · Before："a lesson inside a section of a course is made 'real' …" · After："problem with the materialization cascade" 共享语言带来的连锁收益：命名一致 → 代码可导航 → 思考 token 更少。这一条被作者称为"整个 repo 里最酷的技术"。 3. 代码跑不通 —— 反馈回路缺失引 Pragmatic Programmer："反馈速率就是你的速度上限。" 修复：把静态类型 / 浏览器 / 自动化测试的反馈接回来。 · /tdd：强制 red-green-refactor，并明确反对"horizontal slicing"（先把所有测试写完再实现）——只能 vertical slice，一次一个 tracer bullet · /diagnose：固定的"复现 → 最小化 → 假设 → 插桩 → 修 → 回归测试"诊断循环 4. 系统变成屎山 —— Agent 加速软件熵增引 Kent Beck 与 John Ousterhout：每天投资设计，深模块（窄接口、厚实现）优先。修复： · /to-prd 在写 PRD 前会问"这个改动到底碰哪些模块"； · /zoom-out 强制 Agent 把局部代码放回系统全景里讲； · /improve-codebase-architecture 是"周期性救火"——作者建议每隔几天对代码库跑一次。 # Skill 清单结构仓库分三类，命名上都是 Slash Command 风格： Engineering（日常代码工作） grill-with-docs、tdd、diagnose、to-prd、to-issues、triage、improve-codebase-architecture、zoom-out、setup-matt-pocock-skills Productivity（通用工作流） grill-me、caveman（极简通信模式，省 ~75% token）、write-a-skill Misc（不常用工具） git-guardrails-claude-code、migrate-to-shoehorn、scaffold-exercises、setup-pre-commit 各 Skill 之间不是孤立的，而是一条从对话到落地的流水线：对齐与设计落地与守护 ────── ──────── grill-with-docs → tdd ↓ ↓ to-prd diagnose ↓ ↓ to-issues zoom-out ↓ ↓ triage ───→ improve-architecture ↑ ↓ └──── CONTEXT.md / ADR ──┘ 项目地址 https://github.com/mattpocock/skills

译作者@mattpocockuk公开了其.claude/目录下的实用Agent Skills集合，旨在解决四大工程痛点：1) 通过/grill-me等技能在动工前对齐需求，修复沟通鸿沟；2) 维护CONTEXT.md与ADR建立共享语言，提升代码一致性；3) 利用/tdd和/diagnose建立快速测试与诊断反馈回路；4) 通过/to-prd、/zoom-out等技能对抗代码熵增，持续投资设计。这些技能分为工程、效率与工具三类，形成从需求对齐到代码落地的完整工作流。

阿绎 AYi@AYi_AInotes · 5月3日60

说个暴论，PM这个岗位，正在被AI一点点拆碎重写。 Marcus用Claude Code加一个自定义插件，一个人跑完了传统PM团队的完整交付流程。他说的一句话直接击穿了本质：The conversation is the work。不是比喻，就是是字面意思。他的工作流现在是这样的， 1️⃣策略阶段，输入/ce-strategy，代理会对话式采访你，直到生成完整的strategy.md。 2️⃣规划阶段，/ce-ideate /ce-brainstorm /ce-plan，自动生成所有票据直接推到Linear。 3️⃣每日监控，早上八点自动收到单页产品脉搏报告，数据异常会自动标注。以前PM80%的时间，都在协调跨部门，写用户故事，追进度，刷仪表盘。现在这些工作被压缩到了几乎为零，剩下的20%，战略，用户洞察，判断力，反而被放大了一百倍。兄弟们，这就不只是什么效率提升那么简单了，简直就是工作性质的彻底改变。从我做OD的视角看，这才是AI对组织最根本的冲击。过去一百年，我们设计的所有组织架构，本质上都是为了解决信息传递和执行协调的问题。 PM这个岗位本身，就是这个体系的中间节点。而现在，AI直接把这个节点给吃掉了。所有的执行在AI时代变得无限廉价，真正稀缺的，是定义什么值得做的能力。是能从用户的只言片语里摸到真实需求的直觉。能在无数个选项里做出正确取舍的判断力。能把模糊的愿景变成清晰方向的战略思考。 Marcus仍然坚持每周花15分钟和真人用户通话，这件事他没有交给AI，因为他知道这才是所有答案的核心。我觉得未来不会有那么多PM了，但会有极少数真正的产品人，带着一支AI Agent组成的军队，做出以前整个团队才能做出来的产品。我相信所有知识工作，最终都会走向这个结局。 #产品经理 #AI #组织发展 #ClaudeCode #职场

译作者以Marcus为例，指出AI（如Claude Code）正在彻底改变产品经理的工作性质。传统PM耗费80%时间在协调、写需求、追进度等执行环节，如今这些工作可被AI代理自动化压缩至近乎为零。剩余20%的战略思考、用户洞察和关键判断力价值被极大放大。AI充当了高效执行层，使得“对话即工作”成为现实。这直接冲击了以解决信息传递与协调为核心的传统组织架构，PM作为中间节点的职能被消解。未来，少数具备核心战略能力的“产品人”将指挥AI Agent军队完成产品交付。

Tibo@thsottiaux · 5月3日68

/goal might be the most consequential thing we have shipped in codex The value of good instructions has never been higher.

译/goal 可能是我们在 codex 中推出的最重要的功能优质指令的价值从未如此之高。

Yuchen Jin@Yuchenj_UW · 5月3日33

People debate whether models should be smarter or cheaper/faster. My cycle with every new model: Day 1: “This is so smart. Just make it faster!” Day 7: “Never mind. It’s still dumb in 37 different ways. I’ll wait longer and pay more if it gets smarter.” At least for coding, LLMs haven’t hit the inflection point.

译人们争论模型应该更智能还是更便宜/更快速。我对每个新模型的循环：第一天：“这太聪明了。只要让它更快些！” 第七天：“算了。它仍然有37种不同的愚蠢表现。如果能更智能，我愿意等更久、付更多钱。” 至少在编程领域，LLM尚未达到拐点。

swyx 🇸🇬@swyx · 5月3日59

Much respect to @tokengobbler who shutdown Vibe-kanban live onstage at AIE Europe - still with 30,000 MAU, and still living on as an open source project. "Everyone who is making money is doing 2 things: selling to enterprise, and reselling tokens. We were doing neither." surprisingly not the first company to shutter at AIE but there's a lot to learn from the process and the software engineering retrospective from 2021-2025 will stick in my mind!

译在AIE Europe大会上，@tokengobbler宣布关闭拥有3万月活用户的Vibe-kanban项目并转为开源。项目失败主因是未采用当前主流盈利模式：向企业销售和代币转售。这一案例引发对AI时代软件工程形态的反思。有观点指出，AI正在重塑工作流程，工程师的时间日益集中于“规划”与“评审”两端——即规划工作和审查AI产出。因此，提升这两端的效率成为加速交付的关键。这促使业界重新思考敏捷开发等方法是否适应AI原生团队的新工作形态。

Berryxia.AI@berryxia · 5月3日44

最近Codex+ GPT-Image-2 的联合再次让Codex的热度超过Claude Code. 果然你们这帮家伙，有了新欢，旧爱就不香了！

Berryxia.AI@berryxia · 5月3日68

20 个 Claude Code 技巧： 1. Esc+Esc：将您的会话回退到任何之前的检查点；将其视为免费的撤销功能，让代理尝试风险更改。 2. CTRL+V：直接将截图粘贴到 Claude Code 中。 3. CTRL+G：打开您的编辑器来撰写长提示，而不是在终端中输入它们。 4. CTRL+R：搜索您的提示历史记录。 5. /rewind：回滚更改到检查点，然后提供更具体的反馈并重试。 6. /rewind → "Summarize from here"：选择一个检查点并仅压缩其后的消息，保持宝贵的前文上下文完整。 7. /insights：生成使用报告，然后将其附加到 Claude 会话中，并询问改进工作流程的经验教训。 8. /memory：保存应在所有项目中持久化的个人偏好。 9. /statusline：永久显示您当前正在使用的上下文量。 10. cat error.log | claude "fix this"：直接管道传输错误，而不是复制/粘贴，从而为模型提供更多上下文。 11. .claudeignore：将此文件添加到您的项目中，以列出代理不应读取或修改的路径。 12. #：以 # 开头一条消息，将其保存为 CLAUDE .md 文件中的持久指令。 13. "ultrathink"：在提示中的任何位置插入这个词，将模型的努力程度提升到 HIGH，用于复杂推理任务。 14. /diff：打开交互式查看器，查看未提交的更改和每轮差异。 15. /effort max：当您想最大化 Claude 的能力时使用（这很昂贵！） 16. /loop：本地调度一个重复任务。 17. /schedule：类似于 /loop，但作业在云端运行，而不是本地。 18. claude --worktree：在隔离的 git 工作树中启动一个会话，以便并行运行更多 Claude 实例。 19. /sandbox：在具有文件和网络隔离的沙箱中运行 Claude。 20. /voice：激活语音输入并按住空格键来说出您的提示。

译本文介绍了20项Claude Code的核心使用技巧，旨在优化开发工作流。关键功能包括：通过Esc+Esc或/rewind命令回退到历史检查点，实现“撤销”与选择性总结；利用快捷键直接粘贴截图或打开编辑器编写长提示；通过管道命令传输错误日志，为模型提供丰富上下文。此外，用户可借助.claudeignore文件排除路径、用#保存持久指令、或输入“ultrathink”提升模型处理复杂任务的努力等级。高级功能涵盖生成使用报告、保存个人偏好、查看上下文用量，以及在隔离环境或云端运行任务。语音输入功能允许通过按住空格键进行口述提示。

elvis@omarsar0 · 5月3日57

Claude Opus 4.7 just implemented an AlphaZero-style self-play pipeline from scratch. It did this on consumer hardware in three hours, then beat the Pascal Pons solver 7 of 8 as first-mover on Connect Four. No other frontier coding agent tested cleared 2 of 8. This paper proposes a new way to evaluate coding agents: hand them a minimal task description, give them a tight budget, and ask them to autonomously rebuild a famous ML breakthrough. Connect Four + AlphaZero is the first instance. It's small enough to run on a laptop and hard enough to require a real research engineering loop (MCTS, neural value/policy nets, self-play, training schedule). We've been measuring coding agents on patches and unit tests. This shifts the bar to "can the agent build a non-trivial ML system end-to-end on its own?" The answer is now yes for at least one frontier model. Paper: https://arxiv.org/abs/2604.25067 Learn to build effective AI agents in our academy: https://academy.dair.ai/

译本研究提出评估编程智能体的新范式：要求其在有限预算下，仅凭简要任务描述自主重建一项著名机器学习突破。首个测试案例为四子棋AlphaZero系统，其规模适于笔记本电脑运行，但复杂度要求完成完整的研究工程闭环。Claude Opus 4.7在三小时内从零构建了自博弈训练管道，并作为先手以7:1的成绩击败了Pascal Pons求解器，而其他前沿智能体均未通过2/8的测试。这标志着评估标准已从代码补全提升为端到端构建非平凡机器学习系统的能力。

Greg Brockman@gdb · 5月3日19

codex for improving your ergonomics

译用于改善人体工学的codex [引用 @jxnlco]：有了codex我不需要第二台显示器我把它变成了站立式办公桌

Rohan Paul@rohanpaul_ai · 5月3日43

Brilliant explanation from Nvidia CEO Jensen Huang on AI's job effect: In software, AI makes coding faster, but that does not mean fewer engineers are needed. Before AI, we could write 1 billion lines of code; now, with AI, we can aim for 1 trillion.

译Nvidia CEO Jensen Huang 对 AI 就业影响的精彩解释：在软件领域，AI 让编码更快，但这并不意味着需要更少的工程师。在 AI 之前，我们能写 10 亿行代码；现在有了 AI，我们可以瞄准 1 万亿行。

OpenCode@opencode · 5月3日46

we've had intermittent issues with kimi 2.6 on OpenCode Go we're investigating with our providers, sorry about that hopefully can use one of the other models in the meantime

译我们在 OpenCode Go 上遇到了 Kimi 2.6 的间歇性问题我们正在与供应商一起调查，对此表示抱歉希望在此期间可以暂时使用其他模型之一

宝玉@dotey · 5月3日67

值得试试，挺有价值的，让 Codex 帮你分析电脑操作习惯+Codex任务执行情况，给出具体的对工作习惯上的优化建议。注意：Chronicle 是一款用于记录和分析用户电脑操作轨迹的追踪软件或系统级功能在 Codex 上输入： > 根据 Chronicle 的数据记录，我在使用电脑时，有哪些习惯或操作效率极低？请给我一些切实的改进建议。说话直接点，哪怕忠言逆耳，也请直戳痛点，告诉我真正需要听的大实话。

译Codex 可利用 Chronicle 记录的电脑操作数据，分析用户习惯并识别效率低下之处，提供直接改进建议。用户通过输入特定提示（如询问低效操作），即可获得忠言逆耳式的优化反馈。该功能虽处于实验阶段且被隐藏，但具有试用价值，能帮助提升工作习惯和操作效率。引用推文关键点指出，此功能是实验性的，并提供了英文输入示例以触发分析。

Greg Brockman@gdb · 5月3日72

gallery for codex pet sharing:

译codex宠物分享的图库：提交入口已开放，可通过下方链接提交👇

Chubby♨️@kimmonismus · 5月2日48

For many AI looked bubbly six months ago, but the more and more articles and journalist argue that agentic coding tools like Claude Code have changed the economics: developers are adopting them fast, productivity gains are becoming measurable, and companies like Anthropic are seeing explosive revenue growth. Their remaining bubble risk is that this boom may be concentrated in coding, but if AI agents can generalize to broader white-collar work - law, finance, consulting, marketing, operations - then the burden of proof has shifted from AI bulls to the skeptics. tl;dr people come to realize AI in general is not a bubble.

译半年前AI领域看似存在泡沫，但以Claude Code为代表的智能体编码工具正改变经济逻辑。开发者快速采用，生产力提升可测量，Anthropic等公司收入爆发式增长。当前风险在于繁荣可能集中于编码领域，但如果AI智能体能推广至法律、金融、咨询等更广泛的白领工作，则举证责任已从AI乐观者转向怀疑者。核心结论是：人们正认识到AI整体并非泡沫。

TestingCatalog News 🗞@testingcatalog · 5月2日45

Codex named him "Minty" 👀 Which Codex Pets did you make? Drop them below!

译Codex 给它起名叫“Minty”👀 你创造了哪些 Codex Pets？在下面分享！

凡人小北@frxiaobei · 5月2日26

LLMs are the Tower of Babel. Coding made it obvious, language was never the real problem. In other domains, it still is.

译LLMs 是巴别塔。编码让它变得显而易见，语言从来不是真正的问题。在其他领域，它仍然是问题。

ginobefun@hongming731 · 5月2日63

http://x.com/i/article/2050470671755730944 # BestBlogs 周刊第 93 期 · AI 次方变革 > 本期主题：把 AI 放到指数位上，而不是加号边上 —— 用杨斌的「AI 次方变革」串起 Karpathy 的 Software 3.0、Demis 的 AGI 路径、国内三家大厂的 Harness 中文化、Anthropic 两份 Claude Code 工程心法、OpenAI 编排栈、企业生产实战，以及 OpenAI × 微软的关系新阶段。🎧 同步播客：BestBlogs 周刊第 93 期 · AI 次方变革（在小宇宙搜索 BestBlogs 周刊）📚 完整周刊：https://www.bestblogs.dev/newsletter/issue93 ## 导语：组织的中年撞上技术的青春期清华经管学院杨斌教授本周提出 AI 次方变革 —— 把 AI 放到指数位上，而不是加号边上。「+AI」的心智追求即期绩效、主流一致、线性稳进，但 AI 不是一种成熟工具，它每天都在变；底数（组织 / 心智 / 知识）如果没有先质变，幂位再怎么放大也没用。底数小于一时，幂位甚至会让结果塌陷。这一期读完 20 篇内容，杨斌这个隐喻像一根串绳：Karpathy 在 Sequoia 给出 Software 3.0 的完整框架，Demis 在 Y Combinator 把 AGI 时间表压到 2030，国内三家大厂同周给出 Harness Engineering 的中文版第一性原理，Anthropic 把 Claude Code 的两份内部经验贴出来，OpenAI 把 Codex 编排栈打开，京东和 Java 阵营把企业实战补齐。这些动作放在一起看，像同一句话被翻译成不同口音在不同地方反复说。回头看前两期周刊，第 91 期是基建周，第 92 期是模型周。这一期不再是单一爆发，而是大家集体在往同一个方向上汇拢 —— 从 +AI 走向 AI 次方。 ## 个人更新：BestBlogs 四月内测收官，五月进入早鸟期四月份 BestBlogs 的内测正式收官。这一个月里我们做了挺多事情，挑用户能感知的几条说一下： 1. 开放能力发布（v2.0.7）：上线 OpenAPI、命令行工具 @bestblogs/cli、还有给 Claude Code 这类智能体准备的 skills 套件，让外部开发者可以直接调用站内数据和功能。 1. 内建翻译升级到 v2（v2.1.0）：同一篇内容只扣一次配额，中英双向，覆盖文章 / 播客 / 视频。文章和推文详情页可以直接读译文，不再需要跳转 wenrun.ai。 1. 每日回顾上线（v2.0.11 + v2.1.1）：AI 根据你当天的阅读足迹提炼洞察，可邮件投递。Pro 内测用户每天会收到一封中英双语的 Daily Review。 1. 主题深度解读（v2.1.0 + v2.1.3）：上线 Topic Pages，目前支持事件、领域、人物 / 组织、对比四种类型，编辑可以把最值得读的主题置顶。 1. Pro 早报双形态（v2.1.0）：文字版（一句话总结 + 关键洞察 + 头条卡片）和播客版可以即时切换，喜欢扫读的有了文字版，喜欢通勤听的还是播客版。此外还上线了公开 /docs 文档中心和 Mobile App 内测。完整更新日志在 bestblogs.dev/changelog。五月开始，BestBlogs 正式进入早鸟期，欢迎大家订阅、使用，把反馈直接告诉我。 ## 一、三个理论框架：杨斌、Karpathy、Demis 同周给出三种语言这一周最有意思的地方是，三个完全不同背景的人，几乎在同一周给出了同一种判断的不同版本。杨斌：组织的中年撞上技术的青春期杨斌教授的版本最直接。他说「+AI」是组织的中年心智，追求即期绩效、主流一致、线性稳进。这种心智把 AI 当成现有流程的一个有益补充，不挑战既有的权力分布，也不挑战既有的文化假设。但 AI 不是一种成熟工具，它每天都在变。如果底数没有先发生质变，幂位再怎么放大都没有用。底数小于一时，幂位甚至会让结果塌陷。正确的做法是把 AI 放到指数位上 —— 破执重构，让组织从大写变小写，让主流让位给杨斌说的「流人和边域」。他在演讲里点名 Claude Code 和 OpenClaw 这两个产品，说它们都是流人作品，都是在边缘环境里长出来的，不是被规划出来的。这一点和涌现的本质相关：涌现不能被计划，但有规律。杨斌引用了两句英文：context not control，emerging not planning。情境而不是控制，涌现而不是计划。 → 阅读原文：杨斌：我为什么要提「AI 次方变革」 Karpathy: Software 3.0 + Vibe Coding + Agentic Engineering Karpathy 在 Sequoia 现场给硅谷版的「AI 次方」搭了一套完整语言。他把过去的程序员演化拆成三段： - Software 1.0：人类用代码显式写规则 - Software 2.0：用神经网络的权重学规则 - Software 3.0：大语言模型变成计算机本身，上下文窗口变成新的接口。在这个范式里，编程不是写代码，是设计上下文然后他给了两个新词。Vibe Coding 是抬高地板，让所有人都可以靠描述意图做出软件。Agentic Engineering 是给智能体保持质量和边界，因为这些智能体本质上是有锯齿（spiky）、有概率性的工程实体，需要被驯服。 Karpathy 在访谈里有一句话我印象很深：You can outsource your thinking, but you can't outsource your understanding。未来的程序员是 director，是导演，是那个决定 taste 和 systems design 的角色，那部分是不可被外包的。 → 阅读原文（中文整理）：Karpathy 最新访谈：Vibe Coding 只是开始，真正重要的是 Agentic Engineering → 视频原始版：Andrej Karpathy: Software 3.0 完整框架 Demis Hassabis：AGI 还差什么 + 创业者怎么办 Demis Hassabis 在 Y Combinator 现场，从科学家的角度回答 AGI 还差什么。他把 AGI 时间表压到大概 2030 年，并且明确指出还差三块「大想法」： 1. 持续学习（Continual Learning）：模型要能在不忘旧知识的情况下持续吸收新知识 1. 长程推理（Long-term Reasoning）：从简单的链式思考升级到能做计划和自省的更稳健推理 1. 类脑工作记忆（Brain-style Working Memory）：从蛮力堆上下文窗口升级到更接近人脑的高效记忆 Demis 给创业者的建议很硬：假设 AGI 会在你公司生命周期的中段出现。所以产品要去截击 AI 曲线，去那些「暴力搜索失效但 AI 推理擅长」的组合空间，比如材料科学、医药、Isomorphic Labs 在做的虚拟细胞。不要去和「AGI + 一行 prompt」竞争，那条路是没有壁垒的。 → 阅读原文：How to Build the Future: Demis Hassabis 把这三个人的话叠在一起，会发现一个共同信号 —— 新范式的关键不是模型本身，是组织怎么改、人在哪里、产品打哪个空间。杨斌讲的是组织的底数得先质变，Karpathy 讲的是程序员要变成导演，Demis 讲的是产品要去截击曲线。三个人从三个层面回答同一个问题。 ## 二、Harness Engineering 中文化：四篇同周给出第一性原理有了框架，看落地。这一周国内三家大厂几乎同步给出了 Harness Engineering 的中文版第一性原理，加上腾讯云开发者那篇挑衅式的「RAG 已死」，构成了本周最密集的一组中文 Agent 工程化讨论。楼天城：开发主导权正在交给 AI 最让我意外的是小马智行 CTO 楼天城接受量子位的访谈。一个开发自动驾驶十年的人，公开承认开发的主导权正在交给 AI。原文里他用了一句话： > Harness 是这个时代最关键的能力之一。他把今天的 AI 形容成一匹脱缰野马，能调用工具、能调用各种 skill，主动性和能量都在大幅提升。然后他抛出一个让人停下来想一下的判断：未来甚至连人类，都可能成为被「调用」的一环。这一段听起来有点黑色幽默，但他的逻辑是直的 —— L4 级自动驾驶不能靠人类兜底，模仿学习的天花板就是人类本身。当 AI 司机的安全性全面超过人类，再让人类工程师手把手教 AI 开车，就像让业余棋手去辅导 AlphaGo。这是范式问题，不是态度问题。 → 阅读原文：量子位专访楼天城：AI 是匹脱缰野马，Harness 是这个时代最关键的能力腾讯：Harness 不是目的，知识才是护城河腾讯技术工程团队再上一层定义：Harness 不是目的，知识才是护城河。这个判断把抽象提了一级。 Harness 是工程实现，是 SOP 和 Skill 库的集合。但真正决定一个团队能不能持续受益的，是这套 Harness 背后能沉淀什么知识。腾讯给出的是一个从 SOP 到 Skill 库的工程交付路线，描述了一个团队怎么把每天踩的坑沉淀成可复用的能力。 → 阅读原文：Harness 不是目的，知识才是护城河 —— 一个 AI 工程交付团队的知识沉淀实践阿里云：拆 OpenClaw 的 Agent 架构，三条反直觉结论阿里云开发者用一篇长文系统拆 OpenClaw 的 Agent 架构。这篇文章值得做 Agent 的同学读，因为里面有几个反直觉结论： 1. 更贵的模型没你想象中那么有用，Harness 和验证测试的质量对成功率的影响更大 1. 调试 Agent 行为时，应该优先检查工具定义 —— 多数工具调用错误来自描述不准确，不是模型不够聪明 1. 评测系统本身的问题，往往比 Agent 的问题更难发现。如果一直在 Agent 代码上调，效果可能上不去 → 阅读原文：你不知道的 Agent：原理、架构与工程实践腾讯云：RAG 已死？不，是 Grep 回归了最后是腾讯云开发者那篇 RAG 已死？不，是 Grep 回归了！标题挑衅，但论点扎实。作者的判断是：高质量的 Skill 和工具描述比向量索引更值钱。当模型本身越来越强，长上下文越来越便宜的时候，传统 RAG 那套切片、向量化、相似度召回的复杂度就显得多余。直接用 Grep，用关键字搜索，加上准确的工具描述，效果反而更好。这其实和阿里那篇结论是相通的，都指向同一件事 —— 工具描述和 Harness 比模型选型更重要。 → 阅读原文：RAG 已死？不，是 Grep 回归了！把这四篇放在杨斌的框架下看，就是底数的质变。组织如果还在比谁的模型更贵，那就是把变革放在加号位上。组织如果开始研究 Harness、研究知识沉淀、研究工具描述，那就是开始把变革放在指数位上。 ## 三、Anthropic 两连发：Claude Code 心法 + 提示缓存这一周 Anthropic 官方贴了两份 Claude Code 团队的内部经验，正好补上了 Karpathy 没回答的工程细节。像带新人一样引导 Claude Code 第一篇用了一个真实案例。MacCoss Lab 是华盛顿大学的一个蛋白质分析实验室，他们的开源软件 Skyline 已经维护了 17 年，70 万行 C# 代码。主开发者 Brendan 一开始很怀疑 Claude Code 能不能搞定这种长寿命项目。最后他想清楚了一件事：自己过去十几年带本科生、研究生、博士后进入这套代码库，那一整套 onboarding 方法论，可以原封不动地用在 Claude Code 上。先给「实验室手册」，再交工作任务。把 AI 当作一个新进研究员来带，而不是当成一个魔法盒子。这一篇值得做工程的同学读。它没有讲什么新概念，但它把心法落到了具体场景。 → 阅读原文：像带新人一样引导 Claude Code：来自 17 年开发经验的启示提示缓存对 Coding Agent 至关重要第二篇是 Claude Code 团队自己的复盘：提示缓存对编程智能体是至关重要的，命中率直接决定了一个长程任务能不能跑稳。这听起来很工程，但它其实是一个范式判断 —— 当智能体要持续可靠地干完长任务，关键变量不是模型本身的智能，而是它能不能稳定地保留上下文。提示缓存就是这个稳定性的最直接来源。两篇加起来，把 Karpathy 留下的工程黑盒打开了。 → 阅读原文：构建 Claude Code 的经验教训：提示缓存至关重要 ## 四、OpenAI 编排栈 + Cloudflare：让 Agent 上手干活聊完心法，看落地的几条路径。 OpenAI 把 Codex 编排栈打开 OpenAI 这一周三件事可以放在一起看： 1. Symphony：把 Codex 多智能体编排做成开源规范 → 阅读原文 1. AI Engineer 现场拆解 Codex 子智能体：把 OpenAI 的 AI 工程平台从 IDE 里拎出来 → 阅读原文 1. 长时间运行的智能体（Elevate）：补另一面 —— 让 Agent 持续可靠干完长任务，要从持久化、子线程、检查点设计起 → 阅读原文这一组三篇组合起来，像极了 Cloudflare 上一期做的「Agent 基建周」，只不过这次是 OpenAI 在做。 Cloudflare：Agent 自己开户、买域名、部署应用这一期 Cloudflare 的代表作是一个干净的 one-shot 演示 —— AI Agent 能自己创建 Cloudflare 账户、买域名、把 Workers 部署上线。背后有 Managed OAuth + Mesh 撑起私有联网。这件事小，但意义大。它把「Agent 上手干活」从 demo 推到了生产入口。Software 3.0 真正能跑的标志，不是 Agent 能写多少代码，而是 Agent 能不能从注册账户开始，把整个交付流水线走完。 → 阅读原文：AI 智能体现在可以创建 Cloudflare 账户、购买域名并部署应用 ## 五、企业生产实战：京东 GRAM + Java MCP 两篇值得说，是企业版的「AI 次方」基础设施。京东 GRAM：50ms 端到端的生成式推荐京东广告团队披露 GRAM 架构 —— 他们把生成式推荐做到了端到端 50 毫秒。这是什么概念呢，50 毫秒是用户感知不到的延迟。在电商场景下，把「模型即推荐系统」这个判断打了第一个范本。这背后涉及到训练侧的稀疏化、推理侧的工程化、还有大量的算子优化，是真正的工程硬功夫。 → 阅读原文：京东广告大模型实战：GRAM 架构如何在 50ms 内完成生成式推荐？ Java 世界中的 MCP：把 LLM 集成提升到架构纪律 InfoQ 的长文，讲 Java MCP SDK。这篇文章我推荐 Java 同学读一下。它的视角是把 MCP 看作架构纪律，不是 prompt 工程： - 显式契约：Models 只调用通过协议声明的工具 - 反腐败层：MCP Server 在 LLM 和核心系统之间隔一层，控制能力暴露范围 - 控制平面：把 LLM 集成放进 Spring 和 JVM 团队熟悉的服务边界、可观测性、资源管理体系里它不是教你写 MCP 代码，是教你把 LLM 集成放进企业架构的那条线里。 → 阅读原文：Java 世界中的 MCP：为 LLM 集成带来架构策略 ## 六、范式思辨：Skill 蒸馏、Language Agent 60 年史、智能体失败案例 Skill 到底能蒸馏我们的几分之几？腾讯科技的这篇文章，从 GitHub 上一批 skill 类项目的爆火谈起。三月底同时火起来的有「同事 skill」「老板 skill」「女娲 skill」 —— 同事 skill 把离职同事的飞书消息、钉钉文档、Slack 记录、微信聊天都喂给 Claude，自动生成一个 skill 文件。装上之后 AI 能「变成」那个同事，连说话语气都模仿。然后 CMU 出了一篇论文，跑出来 SkillFoundry，一次扫一遍 GitHub 仓库、API 文档、Jupyter Notebook、学术论文，挖出 286 个 skill。BenchFlow 团队的 SkillsBench 测了 84 个任务，加 Skill 后平均通过率提升 16.2 个百分点。但同一周还出现了一个反向项目 anti-distill，帮你生成一份看起来完整、核心知识却被掏空的 skill 文件。作者追问的问题是：那层能被掏空的是什么，那层掏不空的又是什么？这个问题没有答案，但值得每个内容工作者放在心里。 → 阅读原文：严肃聊聊，Skill 到底能蒸馏我们的几分之几？张小珺 × 苏煜：Language Agent 60 年技术史张小珺这一期访谈，嘉宾是俄亥俄州立大学的苏煜教授。两个小时的长对谈，把 Language Agent 60 年的技术史复盘了一遍 —— 从 1960 年代的逻辑代理，到神经代理、语义解析，再到今天的语言代理。苏煜给出一个判断：OpenClaw Moment 像 ChatGPT Moment。意思是 OpenClaw 的出现，可能是 Agent 时代的那个分水岭。这一期我推荐五一假期听，节奏不快，信息密度大。 → 阅读原文：139.【Agent 综述】和苏煜聊 Agent 技术史、OpenClaw Moment、边界的消弭和社会的辐射 PostHog：LLM 代码生成的五条修法 PostHog 的 Danilo 在 AI Engineer 现场分享了一个智能体的失败案例。他们做的 Wizard 是一个一个月服务 15,000 用户的自动化集成助手，模型很容易因为静态训练数据过期而搞砸事情。 Danilo 给了五条修法： 1. 新鲜上下文：把最新的 Markdown 文档直接注入上下文（避开复杂 RAG） 1. 模型飞机：用简化版的真实应用做模板 1. 面包屑：把大任务拆成顺序步骤 1. 推理时审讯：每次跑完问 Agent「我应该怎么做才能让你成功？」 1. prose > scaffolding：纯文本散文比脚手架代码更值钱最后一条留下一句话挺有力 —— 在 AI 时代，文档质量是面向未来的资产，硬编码的逻辑是在折旧。 → 阅读原文：LLM 代码生成为什么会失败，以及如何避免 ## 七、商业重构：OpenAI 与微软的新阶段 OpenAI 和微软这周宣布了一个重要的合作新阶段。新协议把双方关系从独占走向灵活。三件事可以注意： 1. OpenAI 产品仍然优先在 Azure 上发布，但现在可以服务任何云供应商 1. 微软对 OpenAI 知识产权的授权，从独占改成非独占，同时微软不再向 OpenAI 支付收入分成 1. 微软作为大股东继续参与 OpenAI 的增长，OpenAI 到 2030 年仍按比例向微软分成（有总额上限）这是过去两年商业重构里最值得记下的一笔。OpenAI 走向「基础设施级」独立的关键一步迈出去了。 → 阅读原文：微软与 OpenAI 合作的新阶段 ## 写在最后：本周三条判断整理一下我自己读完这一周内容的判断。第一，杨斌的「AI 次方变革」不是又一个 buzz word，是给企业的一个很有用的提醒。如果你团队还在讨论怎么让大模型给现有流程加分，那就是把 AI 放在加号位上。如果你团队开始讨论 Harness、知识沉淀、工具描述，那就是开始把 AI 放在指数位上。第二，Karpathy 的 director 比喻和 Demis 的「截击 AI 曲线」建议，加上国内三家大厂的 Harness 中文化，这一组信号让我相信 Agentic Engineering 已经从概念阶段进入工程阶段。下一阶段比拼的不是谁的模型更强，而是谁的工程纪律更扎实。第三，Anthropic 那篇「带新人」的故事我会推荐给所有团队的同学读一下。它没有讲什么 cutting edge 的东西，但它把心法落到了你今天就能用的实践里。完整 20 篇精选：https://www.bestblogs.dev/newsletter/issue93 订阅 BestBlogs Pro，每天早上收到双语早报，五月起进入早鸟价：https://www.bestblogs.dev 保持好奇，我们下周见。

译本期核心观点是应将AI视为驱动根本性变革的“指数”，而非线性补充工具。杨斌教授指出，组织心智与知识底数需先质变，否则AI放大效应将失效。Karpathy提出编程将演变为设计上下文，程序员角色转向把握品味的“导演”。Demis Hassabis将AGI时间表压至2030年，并指出持续学习与长程推理是关键缺口，建议创业者瞄准“AI推理擅长而暴力搜索失效”的领域构建壁垒。国内实践同样强调，驾驭AI（Harness）与知识沉淀是关键能力。

凡人小北@frxiaobei · 5月2日53

AI Coding 走到现在，还有人认真看执行过程吗？反正我观察到的大多数程序员的日常工作已经变成无脑点 yes 的流程化操作了（看到最后，最后那个才是程序员日常 be like）。和视频里流水线工人，差别没想象中那么大。如果还想让效率继续往上抬一个量级，就必须把人从盯着电脑屏幕这个状态解放出来。然后做更高一层的事情。这就是为什么我要在团队推动 auto Coding 平台的构建，这也是三个月跟 Finn 合伙下来最真实的感受让 Agent 去指挥 Agents。

译AI Coding的发展使程序员日常工作变得流程化，类似于流水线工人。要进一步提升效率，必须将人从紧盯电脑屏幕的状态中解放出来，转向更高层次的决策和设计。作者基于此观点，在团队中推动构建auto Coding平台，实现让Agent指挥多个Agents的自动化编码模式，以推动效率的质变。

小互@xiaohu · 5月2日51

Codex 也发布了宠物功能 8个形态三个状态提示：running（在跑）／waiting for input（等你接话）／ready for review（等你看 diff）打开方法：输入框打 /pet 或者去 Settings → Appearance → Pets 内置宠物直接选，也能自己做一只，让它根据你最近写的代码生成。比如你这周一直写 Rust，可能孵出一只螃蟹。

译GitHub Copilot的Codex功能新增“宠物”特性。用户可通过输入“/pet”或在设置中启用该功能。宠物提供8种不同形态，并会实时显示三种状态：运行中、等待输入、等待代码审查。系统内置宠物可直接选择，也支持用户自定义生成。自定义宠物能根据用户近期编写的代码语言自动生成相应形象，例如频繁使用Rust可能生成螃蟹形态的宠物。

swyx 🇸🇬@swyx · 5月2日48

small milestone: uninstalled the chatgpt app. codex is strict superset now! found something cool - among frontier models, @xai @grok 4.30 is the most intelligence per dollar you can get, beating even open models like MiMo, Kimi, and DeepSeek. numbers pulled from @ArtificialAnlys

译一个小里程碑：卸载了 chatgpt 应用。 codex 现在是严格的超集了！发现一个很酷的事情——在前沿模型中，@xai @grok 4.30 是你能获得的每美元智能最高的，甚至击败了 MiMo、Kimi 和 DeepSeek 等开放模型。数据来自 @ArtificialAnlys

宝玉@dotey · 5月2日57

我觉得判断谁写的代码更快更好，应该是 1. 擅长定义清楚问题，或者说把需求拆解成AI能执行的任务 2. 判断结果的好坏，能识别AI生成结果的质量，对于质量差的能指导AI完善

译推文认为，在AI辅助编程时代，决定谁写代码更快更好的关键能力，已从传统的算法功底转向两项新技能：一是擅长清晰定义问题，或将需求拆解为AI可执行的任务；二是能准确判断AI生成结果的质量，并对质量不佳的部分进行有效指导。引用推文进一步指出，一个认真撰写文档注释的普通开发者，可能比仅精通数据结构和算法的高手更具优势，因为核心产出已从代码本身转向用于指导AI的注释。

Sam Altman@sama · 5月2日19

its weird how much i want to get something to run for the record longest

译很奇怪我有多想为了创纪录的最长时间而运行某个东西

TestingCatalog News 🗞@testingcatalog · 5月2日53

OpenAI made it easier to switch to Codex, as now you can import settings, plugins, agents, and project configuration from other tools. At launch, Codex will also automatically detect new configs and suggest importing them. ALLYOURCONFIGSBELONGTOUS 👀

译OpenAI 让切换到 Codex 变得更简单，因为现在你可以从其他工具导入设置、插件、代理和项目配置。发布时，Codex 还会自动检测新配置并建议导入它们。 ALLYOURCONFIGSBELONGTOUS 👀

Replit ⠕@Replit · 5月2日52

Replit Agent is free tomorrow for everyone starting at 5am PST Show use what you can build in 24 hours And Replit is turning10! A trip down the memory lane on what got us here

译Replit Agent 将于明天太平洋标准时间上午5点起向所有人免费开放向我们展示你能在24小时内构建什么而 Replit 即将迎来十周年！回顾让我们走到今天的记忆长廊

OpenAI@OpenAI · 5月2日68

Bring your workflow to Codex in just a few clicks. Import settings, plugins, agents, project configuration, and more so you can keep working with fewer interruptions. Your move.

译只需点击几下，即可将您的工作流程带入Codex。导入设置、插件、代理、项目配置等，以便您能更少中断地继续工作。该您行动了。

OpenAI Developers@OpenAIDevs · 5月2日64

It’s really that easy.

译就是这么简单。

Tibo@thsottiaux · 5月2日47

Hatch a pet now in a codex app near you. It makes me actually more productive too by having the context follow me around as I multitask. Please no comments on us having too much fun, we are also working on capability maxing 👀

译立即在你附近的Codex应用中孵化一只宠物。它让我的工作效率更高，因为当我同时处理多项任务时，上下文会一直跟随我。请不要评论我们玩得太开心，我们也在努力提升能力上限👀

Sam Altman@sama · 5月2日33

you know what all of these "which is better" polls are silly use codex or claude code, whatever works best for you i am grateful we live in a time with such amazing tools, and grateful there is a choice

译你知道吗所有这些“哪个更好”的投票都很傻用 Codex 或 Claude Code，哪个对你最有效就用哪个我很感激我们生活在拥有如此神奇工具的时代，也很感激能有选择

Peter Steinberger 🦞@steipete · 5月2日49

The new /goal feature in codex slaps.

译codex 中的新 /goal 功能太棒了。

全部 AI 动态

AI 相关资讯全量信息流

全部一手信源资讯推文

全部模型产品行业论文技巧

5月4日

08:13

Berryxia.AI@berryxia

49

Anthropic CEO预言AI一年内将编写全部代码，程序员核心竞争力转向"指挥"AI

Anthropic CEO断言AI将在一年内完成所有代码编写。他指出，像Claude这样的AI系统已通过海量文本掌握了编程知识，而人类通常需花费数年学习。这意味着编程技能本身不再是核心竞争力，最难的技能已被AI掌握。未来的关键差距在于能否高效配置和运用这些“无所不知”的工具，而目前多数人尚未开始认真使用。因此，未来程序员的竞争力将转向善于“指挥”AI生成代码，而非亲自编写。

Anatoli Kopadze: Anthropic CEO: "AI will write 100% of code within a year" developers spend 4 years in university learning to code Claude...

Anthropic 大佬观点编码

04:20

Peter Steinberger 🦞@steipete

40

这是codex验证我之前遇到的【仅限macOS】 launchd问题，该问题在非全新安装的系统上无法可靠复现。 Crabboxes ftw！

OpenAI 教程/实践编码

03:51

OpenClaw🦞@openclaw

58

ClawSweeper 0.2.0 🦞 OpenClaw 维护机器人现已处理整个循环：问题 → @clawsweeper 修复/构建 → 受保护的 PR → 审查 → 修复 → 重新审查 → 自动合并依然保守。手动操作大幅减少。 https://clawsweeper.bot

产品更新编码部署/工程

03:50

Peter Steinberger 🦞@steipete

精选74

这是我迄今为止为 OpenClaw 构建的最有用的工具。它是开源的，运行在 codex 上，你可以 fork 并将其用于任何代码库。献给所有在 issue 和 PR 中辛勤工作的开源贡献者们，这是为你们准备的。

OpenClaw🦞: ClawSweeper 0.2.0 🦞 The OpenClaw maintenance bot now handles the loop: issue → @clawsweeper fix/build → guarded PR → re...

智能体开源/仓库编码

推荐理由：开源维护者的救命稻草，把 issue 到 automerge 的冗长循环扔给 ClawSweeper 自动修复，保守但足够实用，fork 就能用在任何仓库。

03:50

Peter Steinberger 🦞@steipete

58

🦀📦Crabbox 0.4.0。我经常需要快速在 macOS、Linux 和 Windows 上重建环境，并且需要快速的临时机器。 Crabbox 是为即时代理提供的机器，使用 AWS 竞价实例、Hetzner 或 @useblacksmith。无限代码库 + 测试！ https://crabbox.sh/

智能体开源/仓库编码部署/工程

03:50

Peter Steinberger 🦞@steipete

19

看来我得自己用 Claws 和 Tokens 来构建所有为了软件未来的工具。

大佬观点编码

02:51

TestingCatalog News 🗞@testingcatalog

52

Google正在为AI Studio Build开发Figma和GitHub导入选项。 h/t @Thomas16937378

Google 产品更新编码

02:50

Peter Steinberger 🦞@steipete

37

Codex… 这是什么… 这些是 CHARACTER 的迹象吗？

OpenAI 大佬观点编码

01:51

Tibo@thsottiaux

精选75

上周，我们在 Codex 中发布了 *Auto-Review* 模式！它现已成为 OpenAI 内部的默认设置，并将所需的批准数量减少了约 200 倍。我们的对齐团队完成了出色的工作。阅读博客：https://alignment.openai.com/auto-review

Maja Trebacz: Clicking the "Approve permission" button is difficult. We show that agents can do that for you. Check out our alignment ...

智能体 OpenAI 产品更新编码

推荐理由：Codex 这个自动审查模式把审批量砍了 200 倍，而且已经成了 OpenAI 内部默认设置。这意味着 AI 编程 Agent 真正开始被信任，做 Agent 工作流的人可以认真研究一下。

5月3日

23:50

Sam Altman@sama

22

确实如此！

Mitch Malone: Oh man, @openclaw with @OpenAI Codex 5.5 is insanely good. It's so good.

OpenAI 其他编码

22:48

meng shao@shao__meng

38

OpenAI Codex App入门指南撰写与@editframe Skills视频制作体验

作者撰写了OpenAI Codex App入门指南，原计划将Markdown内容编辑为X Article格式分享，但因编辑过程费时，决定先发布到公众号。在体验@editframe Skills期间，他利用该工具制作了指南的预览视频。@editframe近日从隐匿模式推出，强调代理需要视频功能，其Agent Skills允许用户通过提示Claude Code、Cursor或Codex等AI编码工具，直接生成可运行视频或完整交互式图形界面。所示视频仅通过提示创建，体现了@editframe在自动化视频生成方面的能力。

Jeremy Yudkin: Today, @editframe emerges from stealth. Agents need video. Editframe Agent Skills: npm create @editframe@latest Just pro...

OpenAI 教程/实践编码

19:18

meng shao@shao__meng

精选72

解决真正工程问题的Agent Skills集合

作者@mattpocockuk公开了其.claude/目录下的实用Agent Skills集合，旨在解决四大工程痛点：1) 通过/grill-me等技能在动工前对齐需求，修复沟通鸿沟；2) 维护CONTEXT.md与ADR建立共享语言，提升代码一致性；3) 利用/tdd和/diagnose建立快速测试与诊断反馈回路；4) 通过/to-prd、/zoom-out等技能对抗代码熵增，持续投资设计。这些技能分为工程、效率与工具三类，形成从需求对齐到代码落地的完整工作流。

智能体 GitHub 教程/实践编码

推荐理由：matt pocock 把自己 Claude Code 里实际用的 Skills 全开源了，专治 Agent 瞎编、啰嗦、跑不通和屎山，grill-me 反向拷问和共享语言这两招很开眼。

18:13

阿绎 AYi@AYi_AInotes

60

说个暴论，PM这个岗位，正在被AI一点点拆碎重写。

作者以Marcus为例，指出AI（如Claude Code）正在彻底改变产品经理的工作性质。传统PM耗费80%时间在协调、写需求、追进度等执行环节，如今这些工作可被AI代理自动化压缩至近乎为零。剩余20%的战略思考、用户洞察和关键判断力价值被极大放大。AI充当了高效执行层，使得“对话即工作”成为现实。这直接冲击了以解决信息传递与协调为核心的传统组织架构，PM作为中间节点的职能被消解。未来，少数具备核心战略能力的“产品人”将指挥AI Agent军队完成产品交付。

Dan Shipper 📧: must read Marcus went from product manager to shipping product like a madman @every with coding agents he wrote the defi...

智能体大佬观点现象/趋势编码

13:51

Tibo@thsottiaux

68

/goal 可能是我们在 codex 中推出的最重要的功能优质指令的价值从未如此之高。

OpenAI 产品更新编码

12:21

Yuchen Jin@Yuchenj_UW

33

人们争论模型应该更智能还是更便宜/更快速。我对每个新模型的循环：第一天："这太聪明了。只要让它更快些！" 第七天："算了。它仍然有37种不同的愚蠢表现。如果能更智能，我愿意等更久、付更多钱。" 至少在编程领域，LLM尚未达到拐点。

大佬观点编码

09:51

swyx 🇸🇬@swyx

59

在AIE Europe大会上，@tokengobbler宣布关闭拥有3万月活用户的Vibe-kanban项目并转为开源。项目失败主因是未采用当前主流盈利模式：向企业销售和代币转售。这一案例引发对AI时代软件工程形态的反思。有观点指出，AI正在重塑工作流程，工程师的时间日益集中于"规划"与"评审"两端--即规划工作和审查AI产出。因此，提升这两端的效率成为加速交付的关键。这促使业界重新思考敏捷开发等方法是否适应AI原生团队的新工作形态。

AI Engineer: 🆕 Software Engineering Is Becoming Plan and Review https://www.youtube.com/watch?v=W76woOYHlvY AI eats the middle. If s...

智能体大佬观点编码

09:12

Berryxia.AI@berryxia

44

最近Codex+ GPT-Image-2 的联合再次让Codex的热度超过Claude Code. 果然你们这帮家伙，有了新欢，旧爱就不香了！

现象/趋势编码

08:12

Berryxia.AI@berryxia

68

20 个提升效率的 Claude Code 使用技巧

本文介绍了20项Claude Code的核心使用技巧，旨在优化开发工作流。关键功能包括：通过Esc+Esc或/rewind命令回退到历史检查点，实现“撤销”与选择性总结；利用快捷键直接粘贴截图或打开编辑器编写长提示；通过管道命令传输错误日志，为模型提供丰富上下文。此外，用户可借助.claudeignore文件排除路径、用#保存持久指令、或输入“ultrathink”提升模型处理复杂任务的努力等级。高级功能涵盖生成使用报告、保存个人偏好、查看上下文用量，以及在隔离环境或云端运行任务。语音输入功能允许通过按住空格键进行口述提示。

Santiago: 20 Claude Code tips: 1. Esc+Esc: Rewind your session to any previous checkpoint; treat it as free undo so you can let th...

智能体 Anthropic 教程/实践编码

05:47

elvis@omarsar0

57

Claude Opus 4.7自主构建AlphaZero风格训练管道并在四子棋中击败专业求解器

本研究提出评估编程智能体的新范式：要求其在有限预算下，仅凭简要任务描述自主重建一项著名机器学习突破。首个测试案例为四子棋AlphaZero系统，其规模适于笔记本电脑运行，但复杂度要求完成完整的研究工程闭环。Claude Opus 4.7在三小时内从零构建了自博弈训练管道，并作为先手以7:1的成绩击败了Pascal Pons求解器，而其他前沿智能体均未通过2/8的测试。这标志着评估标准已从代码补全提升为端到端构建非平凡机器学习系统的能力。

智能体 Anthropic 编码论文/研究

04:17

Greg Brockman@gdb

19

用于改善人体工学的codex 【引用 @jxnlco】：有了codex我不需要第二台显示器我把它变成了站立式办公桌

jason liu: With codex I don't need a second monitor I turned it into a standing desk

OpenAI 大佬观点编码

04:12

Rohan Paul@rohanpaul_ai

43

Nvidia CEO Jensen Huang 对 AI 就业影响的精彩解释：在软件领域，AI 让编码更快，但这并不意味着需要更少的工程师。在 AI 之前，我们能写 10 亿行代码；现在有了 AI，我们可以瞄准 1 万亿行。

大佬观点编码

02:49

OpenCode@opencode

46

我们在 OpenCode Go 上遇到了 Kimi 2.6 的间歇性问题我们正在与供应商一起调查，对此表示抱歉希望在此期间可以暂时使用其他模型之一

产品更新编码

02:18

宝玉@dotey

67

Codex实验功能分析Chronicle数据优化电脑操作习惯

Codex 可利用 Chronicle 记录的电脑操作数据，分析用户习惯并识别效率低下之处，提供直接改进建议。用户通过输入特定提示（如询问低效操作），即可获得忠言逆耳式的优化反馈。该功能虽处于实验阶段且被隐藏，但具有试用价值，能帮助提升工作习惯和操作效率。引用推文关键点指出，此功能是实验性的，并提供了英文输入示例以触发分析。

Andrew Ambrosino: it's still experimental so we hide it a bit, but in the codex app, try: > what have i been doing very inefficiently on m...

OpenAI 教程/实践编码

02:17

Greg Brockman@gdb

精选72

codex宠物分享的图库：提交入口已开放，可通过下方链接提交👇

Hunter ♠️: Built Petdex, a public gallery to discover, share, and install Codex pets with one curl. Submissions open at link below ...

智能体 OpenAI 开源/仓库编码

推荐理由：Greg Brockman 亲自转发的社区画廊，把 Codex pets 的发现和安装简化成一条 curl 命令，对于正在玩 Codex Agent 的开发者来说是个实用的工具箱。

5月2日

20:15

Chubby♨️@kimmonismus

48

AI非泡沫，智能体工具重塑生产力与经济

半年前AI领域看似存在泡沫，但以Claude Code为代表的智能体编码工具正改变经济逻辑。开发者快速采用，生产力提升可测量，Anthropic等公司收入爆发式增长。当前风险在于繁荣可能集中于编码领域，但如果AI智能体能推广至法律、金融、咨询等更广泛的白领工作，则举证责任已从AI乐观者转向怀疑者。核心结论是：人们正认识到AI整体并非泡沫。

Anthropic 大佬观点现象/趋势编码

15:20

TestingCatalog News 🗞@testingcatalog

45

Codex 给它起名叫"Minty"👀 你创造了哪些 Codex Pets？在下面分享！

OpenAI Developers: Pets. Now in Codex. Use /pet to wake your pet.

OpenAI 产品更新编码

15:18

凡人小北@frxiaobei

26

LLMs 是巴别塔。编码让它变得显而易见，语言从来不是真正的问题。在其他领域，它仍然是问题。

Andrej Karpathy: The hottest new programming language is English

现象/趋势编码

15:11

ginobefun@hongming731

63

BestBlogs 周刊第 93 期 · AI 次方变革

本期核心观点是应将AI视为驱动根本性变革的“指数”，而非线性补充工具。杨斌教授指出，组织心智与知识底数需先质变，否则AI放大效应将失效。Karpathy提出编程将演变为设计上下文，程序员角色转向把握品味的“导演”。Demis Hassabis将AGI时间表压至2030年，并指出持续学习与长程推理是关键缺口，建议创业者瞄准“AI推理擅长而暴力搜索失效”的领域构建壁垒。国内实践同样强调，驾驭AI（Harness）与知识沉淀是关键能力。

智能体 Anthropic OpenAI 推理

12:48

凡人小北@frxiaobei

53

AI Coding时代：程序员解放与Agent指挥

AI Coding的发展使程序员日常工作变得流程化，类似于流水线工人。要进一步提升效率，必须将人从紧盯电脑屏幕的状态中解放出来，转向更高层次的决策和设计。作者基于此观点，在团队中推动构建auto Coding平台，实现让Agent指挥多个Agents的自动化编码模式，以推动效率的质变。

智能体现象/趋势编码

10:19

小互@xiaohu

51

GitHub Copilot推出代码宠物功能，可自定义形态与状态

GitHub Copilot的Codex功能新增“宠物”特性。用户可通过输入“/pet”或在设置中启用该功能。宠物提供8种不同形态，并会实时显示三种状态：运行中、等待输入、等待代码审查。系统内置宠物可直接选择，也支持用户自定义生成。自定义宠物能根据用户近期编写的代码语言自动生成相应形象，例如频繁使用Rust可能生成螃蟹形态的宠物。

产品更新编码

09:49

swyx 🇸🇬@swyx

48

一个小里程碑：卸载了 chatgpt 应用。 codex 现在是严格的超集了！发现一个很酷的事情--在前沿模型中，@xai @grok 4.30 是你能获得的每美元智能最高的，甚至击败了 MiMo、Kimi 和 DeepSeek 等开放模型。数据来自 @ArtificialAnlys

OpenAI xAI 大佬观点编码

08:18

宝玉@dotey

57

推文认为，在AI辅助编程时代，决定谁写代码更快更好的关键能力，已从传统的算法功底转向两项新技能：一是擅长清晰定义问题，或将需求拆解为AI可执行的任务；二是能准确判断AI生成结果的质量，并对质量不佳的部分进行有效指导。引用推文进一步指出，一个认真撰写文档注释的普通开发者，可能比仅精通数据结构和算法的高手更具优势，因为核心产出已从代码本身转向用于指导AI的注释。

鸭哥: 一个熟练掌握数据结构和算法的高手,和一个水平一般但认真写Docstring的人,谁用AI写代码更快更好?答案可能让你不舒服:后者赢面更大。因为AI辅助编程的核心产出不再是代码,而是注释。

大佬观点编码

04:18

Sam Altman@sama

19

很奇怪我有多想为了创纪录的最长时间而运行某个东西

Peter Steinberger 🦞: The new /goal feature in codex slaps.

智能体 OpenAI 大佬观点编码

03:18

TestingCatalog News 🗞@testingcatalog

53

OpenAI 让切换到 Codex 变得更简单，因为现在你可以从其他工具导入设置、插件、代理和项目配置。发布时，Codex 还会自动检测新配置并建议导入它们。 ALLYOURCONFIGSBELONGTOUS 👀

OpenAI: Bring your workflow to Codex in just a few clicks. Import settings, plugins, agents, project configuration, and more so ...

OpenAI 产品更新编码

03:18

Replit ⠕@Replit

52

Replit Agent 将于明天太平洋标准时间上午5点起向所有人免费开放向我们展示你能在24小时内构建什么而 Replit 即将迎来十周年！回顾让我们走到今天的记忆长廊

智能体编码行业动态

03:18

OpenAI@OpenAI

精选68

只需点击几下，即可将您的工作流程带入Codex。导入设置、插件、代理、项目配置等，以便您能更少中断地继续工作。该您行动了。

OpenAI 产品更新编码

推荐理由：Codex 这个导入功能，把迁移成本降到了最低，对已经在用其他 IDE 的开发者算是个贴心的零门槛入口，虽然不算重大更新，但够实用。

03:16

OpenAI Developers@OpenAIDevs

64

就是这么简单。

OpenAI: Bring your workflow to Codex in just a few clicks. Import settings, plugins, agents, project configuration, and more so ...

智能体 OpenAI 产品更新编码

02:48

Tibo@thsottiaux

47

立即在你附近的Codex应用中孵化一只宠物。它让我的工作效率更高，因为当我同时处理多项任务时，上下文会一直跟随我。请不要评论我们玩得太开心，我们也在努力提升能力上限👀

OpenAI Developers: Pets. Now in Codex. Use /pet to wake your pet.

OpenAI 产品更新编码

02:18

Sam Altman@sama

33

你知道吗所有这些"哪个更好"的投票都很傻用 Codex 或 Claude Code，哪个对你最有效就用哪个我很感激我们生活在拥有如此神奇工具的时代，也很感激能有选择

Anthropic OpenAI 大佬观点编码

02:18

Peter Steinberger 🦞@steipete

49

codex 中的新 /goal 功能太棒了。

OpenAI 产品更新编码

1…39 404142 43…50