Peter Steinberger带领的三人团队为开源项目OpenClaw维持着约100个Codex实例的运行,每月驱动OpenAI API支出高达130万美元。他将这笔巨额开支定位为一项研究投资,旨在探索当令牌成本不再受限时,软件开发会呈现何种形态。该实验的核心是观察AI代理在编码、审查拉取请求和查找漏洞等任务上的规模化协作效能。
Cursor CEO的演讲指出,AI编程正经历根本性范式转移。当业界仍聚焦于比较不同模型生成代码的优劣时,Cursor已进入“多代理协作”时代。工程师角色转变为管理AI团队的经理,不再亲自编码。其系统单周运行超两千个并发代理,自动生成三百万行代码,并将任务分解为规划、编码、测试等角色并行处理。人类仅需定义任务与最终审核,中间流程全由AI自主完成,体现了多代理系统的核心优势。有用户亦证实其高效支持,迅速获得了高额权限与信用额度。
Cursor效率是真的高,昨天联系确认邮箱, 今天上午就反馈Ultra+$10000额度就到账了, @cursor_ai this is incredible - thank you so much! A $10K credit is fa...
Hermes Agent vs OpenClaw using Qwen 35B Local Model We asked agents to scrape GitHub star history for both tools, find w...
三名研究人员借助Anthropic的Mythos工具,成功开发出一个可绕过苹果M5芯片内存完整性执行(MIE)安全机制的macOS内核漏洞利用程序。MIE是苹果耗时五年、投入巨资为M5和A19芯片打造的旗舰安全功能,旨在彻底消除内存损坏漏洞。研究团队于4月25日发现漏洞,5月1日即完成开发,并亲自前往苹果园区提交报告。该攻击采用纯数据攻击方式,无需操纵指针,仅通过非特权用户的标准系统调用即可获取根权限。完整技术报告将在苹果发布补丁后公开。
Video of exploit in action. Source: https://blog.calif.io/p/first-public-kernel-memory-corruption
在多数AI服务按token涨价之际,OpenAI采取了相反策略,将其ChatGPT的订阅额度共享给了代码编辑器Zed。用户无需额外付费,即可在Zed中直接使用该额度。关键细节在于,Zed中消耗的额度与ChatGPT网页版的订阅限额是共享且实时同步的。这意味着用户在Zed中用尽额度后,仍可返回ChatGPT网页版继续使用其服务。这一合作被形象地比作Codex(OpenAI的代码生成模型)与Zed编辑器的深度结合。
Codex🫸🫷Zed
Codex应用最新更新引入了侧边聊天功能,用户可通过输入“/side”或使用菜单创建。该系统提示明确界定了侧边对话的用途:它专用于在不干扰主线程的情况下进行提问和轻量级探索。侧边聊天不会继承或执行主线程历史中的任何活动任务、计划或工具调用指令,仅将其作为参考上下文。其主要权限限于非破坏性操作,如读取和搜索文件,除非用户在当前侧边对话中明确请求,否则不会修改任何工作区状态或文件。
A new feature sneaked in the Codex app's latest update. You can now do /side (or use the ... menu) to spawn a side chat!...
You can now use your ChatGPT subscription in the Zed agent, with the same usage and rate limits you benefit from in Code...
BIG one for devs today. Introducing the Notion Developer Platform: - Notion CLI, ntn (Notion in your terminal) - Workers...
马斯克旗下xAI与Cursor的交易是一份精明的“期权”。支付10亿美元“分手费”的核心目的,是获取Cursor平台半年内顶级开发者的真实编码轨迹数据,这类数据对提升AI编程能力至关重要。若Cursor发展良好,xAI将以60亿美元完成收购。此举使xAI整合了从Colossus超算算力、Grok V9基座模型到Cursor开发者入口及特斯拉等真实场景的全链路能力。而此前依赖Claude模型的Cursor,其核心数据源可能因此被削弱。这被视为马斯克在AI编程竞争中的一次关键不对称下注。
@beffjezos Our recently completed Grok V9 1.5T run is looking great and that is before Cursor data is added in supplemen...
在Pwn2Own Berlin 2026活动第二天,安全研究人员共报告15个零日漏洞,获得总计38.575万美元奖金。其中,DEVCORE Research Team的Cheng-Da Tsai通过串联3个漏洞攻破微软Exchange,实现远程代码执行并提升至SYSTEM权限,赢得当天最高单项奖金20万美元。Windows 11系统再次被利用整数溢出漏洞攻破。此外,Red Hat Enterprise Linux及多款AI编码工具也成为了成功攻击的目标。
据报道,微软正要求包括Windows 11、Microsoft 365、Outlook、Teams和Surface在内的工程团队,在6月底前停止使用Claude Code并迁移至GitHub Copilot CLI。此举基于半年的并行测试评估,微软认为自有产品能更好地整合内部代码库与安全需求。成本控制也是因素之一,以便在新财年开始前削减支出。尽管Claude Code在内部颇受欢迎,微软仍决定推动统一转向。
一位开发者重新使用Sublime Text,因其内存占用仅300多MB,远低于动辄占用10GB以上的VSCode。转变的主要原因是其工作流发生变化:现在基本无需手写代码,导致VSCode的许多高级功能变得不再必要。相比之下,Sublime Text提供的语法高亮和基础文件编辑功能已完全满足其当前需求,突显了在AI辅助编程时代,轻量级编辑器因其资源效率而重新获得青睐的趋势。
Codex 和 Claude Code 的竞争真的越来越正面了 这是 Claude Code 第一次主动重置 rate limit 吗?是在模仿 Codex @thsottiaux 吗 😃 这种模仿,可以有。
Happy Friday! We've reset everyone's 5-hour and weekly rate limits.
本期早报通过三个深度案例,展现AI应用正从单点任务转向系统集成。Google工程师将AI作为“思考伙伴”,将复杂决策时间从数天压缩至数小时;医疗AI公司Abridge通过处理海量就诊,为医生每周节省10-20小时,并构建临床智能层;OpenAI则复盘了Imagen 2.0的巨大生成量及未来路线图。核心趋势在于利用AI重构工作流程与系统设计。
本期早报探讨了AI从编程助理向“思考伙伴”的演进。案例包括Google工程师在多语言客户端开发中与AI协同理解与设计系统;Abridge公司利用海量问诊数据构建医疗智能理解层;以及OpenAI复盘Imagen 2.0在文本渲染和多语言支持上的进展,并展望“创意智能体”的未来。这些实践展示了AI正以更深入、融合的方式参与专业协作。
Codex team is aware of reports of GPT-5.5 performing worse for some users and investigating. We don't have anything conc...
苹果App Store已恢复AI编程应用Replit的更新,其iPhone和iPad版本在停滞4个月后发布新版本。Replit作为“氛围编程”工具,允许用户用自然语言生成代码,此前因违反App Store关于动态执行未审查代码的规则而被拒绝更新。此次更新同步了桌面端的Agent 4等新功能,包括并行智能体处理和团队协作能力。双方已解决审核争议,但未披露Replit是否修改了移动端预览AI生成代码的方式。此事被视为AI生成内容如何适应App Store规则的重要案例。
Ruth作为设计师,多年未学编码,但通过Replit的AI agent在IDE中构建数字产品。她持续发布项目18个月,与儿子James合作开发了sheethappens.xyz,基于他的概念和提示。此外,她致力于复合投资教育书和游戏、GCSE复习应用,以及获奖的AR游戏。这些成果展示了个人潜力在Replit工具的帮助下得以实现。
People freaking out over my AI spend. What nobody sees: Part of what excites me so much about working on OpenClaw is tha...
AgentKernelArena是一个开源基准平台,专门用于系统评估AI编程代理在GPU内核优化任务上的能力。平台包含196个任务,涵盖HIP到HIP、Triton到Triton优化以及PyTorch到HIP翻译三大类。它采用隔离工作空间和分级评估(编译、正确性、性能)来测试代理的完整工作流,并创新性地引入了“未见配置”泛化测试。基准测试发现,主流AI代理在大多数任务上能近乎完美地编译和正确完成,并在PyTorch到HIP任务上实现高达6.89倍的平均加速。然而,泛化测试显示,从零生成内核的代理(PyTorch到HIP)在新配置下正确率显著下降,表明其常固化特定形状假设。该平台为严谨评估不同代理、任务和硬件目标提供了模块化框架。
Claude Code 发布 v2.1.143 版本,重点增强了插件管理功能,包括强制执行插件依赖关系,并新增了插件市场的预估上下文成本显示。为方便直接编辑工作副本,增加了 worktree.bgIsolation: "none" 设置。多项体验得到改进:后台会话唤醒后保留模型与努力级别设置;Windows PowerShell 工具默认绕过执行策略;claude agents 命令新增多个参数以配置默认会话。此外,本次更新修复了大量错误,包括修复损坏的 .credentials.json 文件导致 CLI 启动卡住、Windows Terminal 中的右键粘贴问题、后台会话错误捕获 IDE 文件引用,以及 macOS 上后台作业读取特定目录文件的权限错误等。
Google发布了Gemini 3.5模型,该模型专注于提升执行复杂任务的能力。其核心特点是支持“代理式工作流”,即能够像助手一样自主规划并执行一系列多步骤、复杂的操作,旨在将先进的语言理解与实际问题解决能力相结合。
关联讨论 19 条X:Google AI (@GoogleAI)Google Blog:AI(RSS)X:Sundar Pichai (@sundarpichai)Google DeepMind:Blog(RSS)The Verge:AI(RSS)X:Google DeepMind (@GoogleDeepMind)Google Developers Blog(RSS)The Decoder:AI News(RSS)IT之家(RSS)X:Berry Xia (@berryxia)X:Jeff Dean (@JeffDean)X:Gemini (@GeminiApp)Hacker News 热门(buzzing.cc 中文翻译)X:Google AI for Developers (@googleaidevs)X:Rohan Paul (@rohanpaul_ai)X:Logan Kilpatrick (@OfficialLoganK)X:Ethan Mollick (@emollick)X:阿易 AI Notes (@AYi_AInotes)X:Kim (@kimmonismus)作者在OpenClaw项目中大规模运用AI,探索在“令牌成本无关紧要”的未来如何构建软件。团队持续运行约100个Codex实例,自动化处理多项核心工作:审查代码与安全问题、去重归类议题、自动重现复杂测试环境并录制验证视频、从会议讨论中主动创建任务、过滤垃圾评论以及监控性能回归。通过clawpatch.ai等工具将项目拆分为功能单元进行审查,并整合Vercel DeepSec等进行安全分析。整套自动化体系使得项目能够以极精简的团队高效运作。
You can now use your ChatGPT subscription in the Zed agent, with the same usage and rate limits you benefit from in Code...
一项研究发现,将grep风格的文本搜索置于合适的智能体框架中,在代码智能体任务上的表现可匹配甚至超越基于嵌入向量的检索方法。这引发了对向量数据库必要性的质疑,核心观点指出代码智能体可能并非需要更好的嵌入模型,而是需要对基础工具进行更优的框架设计。作者建议依赖向量数据库的代码智能体栈应重新评估方案。虽然向量数据库在大规模场景中仍有优势,但智能体搜索若设计得当,已能满足多数用例。目前,结合两者的混合方法通常最优,但尚未被充分掌握。
Anthropic官方推出Claude Code 101教程,共9节课系统讲解Claude Code的定义、安装、工作方式、提示词编写、三种模式、MCP协议、上下文管理及Hooks使用等核心内容,为学习者提供权威学习路径。建议配合翻译插件加速掌握。
埃隆·马斯克的人工智能公司 x.AI 发布了其首款基于终端的编码助手 Grok Build,正式进入编码代理领域。该工具旨在通过命令行界面直接辅助开发者进行编程任务,标志着 x.AI 在竞争激烈的人工智能编程工具市场中迈出了关键一步。
微软已撤销数千名开发人员对 Anthropic 编程工具 Claude Code 的使用许可,转而推动他们采用自家的 GitHub Copilot CLI。此举意味着微软正主动将内部开发资源从第三方 AI 编程助手转向其自有产品,旨在巩固其开发生态系统的控制力并推广自有工具。
You've been asking for this one... Now in preview: Codex in the ChatGPT mobile app. Start new work, review outputs, stee...
Anthropic 的产品负责人 Cat Wu 在谈及 Claude Code 时透露,团队没有制定宏大计划,但这是有意设计的产品策略。这一发言强调了公司在发展过程中注重灵活性和实用性,可能通过精益方法来调整使用限制和提升透明度,以适应不断变化的市场需求,确保产品迭代更贴合用户实际体验。