6月8日

15:20

IT之家（RSS）

猎豹移动董事长兼CEO傅盛今日接受访谈，总结了用AI改造组织体系的四个步骤：一把手自己得懂；全员思想变革；所有人都要用AI写代码，包括行政；建立以年轻人为核心的“特区”。傅盛早在2019年就表示人工智能业务走在正确道路上，并相信未来10到20年AI会把人从繁重工作中解放出来，让人有时间阅读、提升、寻找自我。

现象/趋势编码

10:04

小互@xiaohu

Claude 写 Anthropic 超 80% 代码

Claude 现在写了 Anthropic 大部分代码截至 2026 年 5 月，合并进 Anthropic 代码库的代码里，超过 80% 是 Claude 写的。而在 2025 年 2 月 Claude Code 发布前，这个比例还只有个位数...

小互: http://x.com/i/article/2063076298592051200

Anthropic 编码行业动态

09:49

jason@jxnlco

cowork 有哪些你希望 codex 也有的功能？反之亦然？

OpenAI 其他编码

09:46

Boris Cherny@bcherny

Claude Opus 长时间运行工作最佳模型及自主运行技巧

多项基准显示 Claude Opus 是长时间运行工作的最佳模型。SWE-Marathon 基准评估编码智能体在 10 亿 token 预算下自主完成长期软件任务（如重写 JAX 代码为 PyTorch、用 Rust 构建 C 编译器）。Opus 在此类任务上领先。Boris Cherny 给出 5 个技巧：使用自动权限模式避免审批；用动态工作流协调数百/数千个智能体；用 /goal 或 /loop 推动持续执行；在云端使用 Claude Code（桌面/移动端）以便关闭笔记本；确保 Claude 能端到端自验证——Chrome 扩展验证网页、iOS/Android 模拟 MCP、启动完整后端服务。

Rishi Desai: Can coding agents stay coherent over a 1 billion token budget? Can they build Slack from scratch? Rewrite a JAX codebase...

智能体 Anthropic MCP/工具教程/实践

09:37

meng shao@shao__meng

AGENTS.md 在 Coding Agents 中真的有用吗？

论文大规模实证检验 AGENTS.md 等仓库级上下文文件对编码 Agent 的影响。在 SWE-bench Lite（300 任务）和新建 AGENTBENCH（138 任务）上测试 Claude Code、Codex、Qwen Code 等组合。核心发现：LLM 自动生成的 context file 在 8 组设置中 5 组成功率下降，平均 -0.5%（SWE-bench）/-2%（AGENTBENCH），成本增加 +20%+；开发者手写仅平均 +4%。冗余假说：移除其他文档后，自动生成反而 +2.7%。建议避免自动生成，精简测试/lint 命令，优先写入仓库专用工具。

Sebastian Raschka: http://x.com/i/article/2063647807437705216

智能体 arXiv 编码论文/研究

09:07

meng shao@shao__meng

不写 Prompt，写 Loops - Boris Cherny 谈 AI 编程范式转变

Anthropic Claude Code 负责人 Boris Cherny 表示，他不再手动写提示词，而是编写 Loops 让 AI 自主决策和解决问题。伴随 Claude Opus 4.8 和 GPT-5.5 等高智能模型出现，手把手写 Prompt 的模式将被取代。但 Loops 方案消耗 Token 过快，一个 Goals 可能耗尽 5 小时用量，企业仍需严格审查 Token 消耗的 ROI，因此实践中会通过前置的 Spec、AGENTS.md 等约束让 AI 做确定性可控的部分。Boris 预测这一转变将在今年剩余时间持续。

Rohan Paul: "I don't prompt Claude anymore. I have loops running that prompt Claude and figuring out what to do. My job is to write ...

智能体 Anthropic 大佬观点编码

09:07

meng shao@shao__meng

你现在在用哪个 Coding Agent？ Warp团队 @BHolmesDev 进行的调查得到了 2095 个投票，其中 Codex App 占到 51.1%、Warp CLI 占到 30.9%、Claude App 7.4% 没错，Claude App 只有 7.4%，因为投票中没有包含 Claude Code 😄

Ben Holmes: How do you use coding agents right now?

智能体现象/趋势编码

08:33

宝玉@dotey

谈"选HTML不选React"--宝玉的反对观点

宝玉不认同“选HTML而非React”的观点。首先，设计稿需要动态数据交互，HTML难以胜任，而Claude Design是UX交互工具。其次，复杂UI必须拆分为小组件，React能实现重用与低上下文修改，大型HTML则维护困难。再者，React天然形成结构化树形设计，方便coding agent开发，HTML结构割裂、难以与设计映射。至于文章说模型注意力需放在React运行准确率上，宝玉认为当前大模型能力已使此问题不复存在。

向阳乔木: http://x.com/i/article/2063275048157458432

大佬观点编码

08:28

Sam Altman@sama

Codex 推出了一个新的"大按钮"。在接下来的 100 天里，每天会选出一位用 Codex 做出了令人印象深刻或极其有用工作的人，给他们一个月的 10 倍使用限额，看看他们能做出什么。明天开始第一个。Sam Altman 评论称"这里可能有个有趣的递归循环"。

Tibo: I have a new kind of big button that I can press for Codex. Over the next 100 days, we will select one person per day wh...

OpenAI 大佬观点编码

08:11

ginobefun@hongming731

BestBlogs早报：iPod之父、Codex、Coding Agent

BestBlogs早报06-08聚焦三篇AI工程实践精讲：iPod之父Tony Fadell系统阐述“知情直觉”与“三代法则”，警告AI时代的“认知投降”和“快时尚软件”；OpenAI工程团队分享使用Codex

智能体 OpenAI 现象/趋势编码

08:11

ginobefun@hongming731

早报：Tony Fadell谈"知情直觉"；OpenAI用Codex零人工写百万行代码；Coding Agent范式转移

今日早报聚焦AI产品与工程前沿：iPod之父Tony Fadell提出创新依赖“知情直觉”而非数据，并总结“三代法则”；OpenAI内部用Codex全程零人工代码交付约100万行代码，合并1500个PR，效率为手写代码10倍；Thoughtworks专家梳理Coding Agent范式转移，指出Context Engineering是双向放大器，并强调Harness Engineering构建安全网；Anthropic首次公开内部Claude Code Skills经验；OpenAI计划将Codex并入ChatGPT打造超级应用。

ginobefun: http://x.com/i/article/2063761613795270656

智能体 Anthropic OpenAI 编码

07:59

Berryxia.AI@berryxia

OpenAI 发布 Codex 应用场景新页面，列出七大领域委托任务

OpenAI 发布 Codex 应用场景新页面，展示各团队已委托编码代理执行的七大类任务：工程开发、产品开发、质量测试、安全检查、数据分析、内部工具及生命科学工作流程。具体案例包括审查 GitHub PR 并理解大型代码库、将截图转为响应式 UI、模拟真实用户操作进行 QA 测试、重构老旧代码与数据迁移、修复安全漏洞、撰写 PRD、分析数据集、开发内部应用及辅助生命科学研究。页面表明编码代理正从演示阶段融入日常工作。

Mark Kretschmann: OpenAI just published a new Codex use-case page, and it's basically a catalog of what teams are already handing over to ...

智能体 OpenAI 产品更新编码

07:31

宝玉@dotey

Claude Code 虽然移动端可以 remote control，但是 plan 后不能 bypass permission，需要不停的确认，神烦

Anthropic 大佬观点编码

07:08

Rohan Paul@rohanpaul_ai

MIT研究追踪超10万GitHub开发者：AI编码工具使代码量增300%，但发布仅增30%

麻省理工新研究追踪超10万GitHub开发者使用三代AI编码工具（自动补全、交互式agent、自主agent）的生产漏斗。自主AI agent使代码提交数提升180%，但实际发布仅增30%。代码量激增近300%，经人工审核后收益降至150%，最终发布仅增约30%。研究估算替代弹性为0.25，即AI能力大幅提升时仅能替代少量人类工作。应用市场同样显示新应用数量增加，但总使用量未升。瓶颈在于人类仍需负责审查、测试、打包和发布等环节，AI加速的局部任务并未转化为同等产出增长。

Rohan Paul: FT publisehd a piece. AI is raising software supply faster than demand. AI is producing far more work inside companies, ...

GitHub 编码论文/研究