AIHOT
内容
精选全部 AI 动态AI 日报主题收藏
接入
Agent 接入
更多
关于更新日志反馈
内部员工登录
精选全部日报更多
内部员工登录
全部动态X · 2087 条
全部一手资讯X论文
标签「编码」清除
Artificial Analysis@ArtificialAnlys · 5月23日58

Cursor Composer 2.5's is 3–18x cheaper than Opus 4.7 in Claude Code (medium reasoning), and 5–32x cheaper than GPT-5.5 in Codex (medium) based on API pricing This low Cost per Task isn't just driven by relatively low token pricing, it's also driven by low relatively low token usage compared to other leading models. @cursor_ai Composer 2.5 only used 1.6M token to complete our Coding Agent Index benchmarks, while other models used up to 5.7M. This lower token usage also contributes to a low Time per Task. Across the Coding Agent Index configurations shown, average Time per Task was ~12 minutes. Composer 2.5 completed tasks in ~9 minutes on average, making it ~1.3x faster than average, while Composer 2.5 Fast completed tasks in ~7 minutes, making it ~1.8x faster than the average across agents. Link to full benchmark results below

译基准测试显示,Cursor Composer 2.5在编程任务中展现出卓越的成本与效率优势。其单任务成本仅为Claude Opus 4.7的1/3至1/18,更是GPT-5.5的1/5至1/32。这一低成本源于其极高的token使用效率:完成全部测试仅消耗1.6M token,远低于同类模型的5.7M。效率方面,其平均任务完成时间约9分钟,比行业平均水平快约1.3倍,其快速版本更可将时间缩短至约7分钟。

小互@xiaohu · 5月23日74

好思路🫡

译一种轻量化的Codex远程服务器配置方案。无需安装完整版应用,仅需在远程服务器上安装并运行CLI版Codex。执行`codex remote-control`命令后,手机端ChatGPT应用内的Codex功能即可发现并连接该服务器,远程体验与完整版无异。两种配置在应用内通过不同图标(“终端”与“电脑”)进行区分。

swyx@swyx · 5月23日78

Kakuna: skills with checklists that only know how to harden your codebase /plan with it then let it /goal for a day, it comes back with same functionality but all the boring stuff done for you + an audit of its own work. focus on subagent parallelism and encodes strong opinions on how AI engineers should design apps for human and agent access/devops/product mgmt. instead of dark factory, go "mullet factory" - party in front (ship unique lovable features), dark in the back (timeless production principles). basically its the antientropy/antislop part of symphony broken out as its own thing not gonna go psychosis further than this but extend as you will. link below

译Kakuna是一款AI代理工具,旨在将早期快速原型自动转化为可维护的生产级代码库。它通过内置的检查清单和“计划-目标”工作流,模拟人类开发与运维流程,在保持功能不变的前提下,自动执行代码审查、测试补充、重构等“无聊”工作,并强调子代理并行以提升效率。该工具是为“人类与代理协作”而设计的范例,其核心是“反熵增”与“反代码腐化”。例如,一次约16小时的运行能生成上百次提交,将一个脆弱的MVP转变为一个结构清晰、可长期构建的稳定项目。

Boris Cherny@bcherny · 5月23日69

Big fan of teaching more people the basics of using Claude Code in an accessible way. So much of the world has not yet used agents. There's a lot of opportunity to level the playing field and expand access.

译推文介绍了一个名为“zero2claude”的免费课程,旨在帮助完全没有编程或终端使用经验的用户系统学习并掌握Claude Code。课程内容从零基础逐步深入至高级应用,目前已吸引超过1.7万名学生,并提供7种语言版本。值得注意的是,整个教学平台完全由一人借助Claude Code独立构建和运营,其出色的性能表现(如高访问量与极低错误率)验证了Claude Code开发生产级产品的能力。推广者强调,扩大AI应用的关键在于赋能用户提升技能,而非简化工具本身,因此该课程不设任何付费门槛,完全免费向社区开放。

Google AI@GoogleAI · 5月23日70

http://x.com/i/article/2057866361636888576 # I/O Developer News Recap ICYMI: here’s a quick rundown based on your vibe. (Pro tip: Bookmark this post!) For Building with Agents in Google @Antigravity: — Antigravity 2.0: A new standalone desktop application built for the next era of how we build, work, and automate with agents — Antigravity CLI: For those who prefer the terminal, this delivers a lightweight, high-velocity surface to invoke, monitor, and interact with agents — Antigravity SDK: Programmatic access to the Antigravity coding agent so you can customize agent behavior and deploy it on your own infrastructure of choice — Increased usage limits in Antigravity: We’ve upped the limits to keep developers in flow state For Bringing Ideas to Life in Google AI Studio: — Vibe Code Android Apps: @googleaistudio now has native Kotlin support to build full-stack Android apps. Test via Android Emulator and publish straight to the Test Track in @GooglePlayStore, all from AI Studio — Seamless Context Export to Antigravity: The new export flow brings your code and your context straight into Antigravity — AI Studio Mobile App: Bring your ideas to life while on-the-go with the new iOS and Android mobile app coming soon! For Building on Android & Web: — Managed Agents in the Gemini API: Build production-ready custom agents with the Antigravity agent harness and our Gemini models, fully hosted on our infrastructure. With one API call, you get the agent, environment and tools — Android CLI and skills: The @AndroidDev team introduced an Android CLI and open-sourced skills to make it easier to create high-quality, native Android apps with coding agents — WebMCP: The open web standard that allows you to expose web tools to browser-based agents is available in original trial in Chrome 149 — Chrome DevTools for agents: AI agents can now autonomously use DevTools to scale workflows for verifying, debugging, and optimizing code in real-time For Enterprise & More: — Google Cloud Availability: Antigravity can now be connected directly to Google Cloud projects. Antigravity will be supported in the coming months for existing Gemini Enterprise customers — Specialized Skills: Introducing new domain-specific skill bundles, starting with Science Skills from Google DeepMind to equip agents with specific science primitives to accelerate health, biology, and scientific research workflows.

译谷歌在I/O开发者大会宣布,系统性构建面向AI代理(Agent)的开发与部署工具链。核心更新包括:独立桌面应用Antigravity 2.0及其命令行工具、SDK面世;Google AI Studio新增Kotlin支持,可一键开发安卓应用并发布,同时推出移动端App。此外,Gemini API推出托管代理服务,实现一键部署;WebMCP作为开放标准在Chrome 149中推出,允许网页向代理暴露工具;Chrome DevTools也开放给AI代理以自动化调试。企业级客户可直接连接Google Cloud项目,而DeepMind的科学技能包则加速特定领域研究。此举标志着谷歌正全面打造从开发、接口到部署的完整AI代理生态系统。

SemiAnalysis@SemiAnalysis_ · 5月23日82

Agentic workloads are quietly rewriting inference economics. We pulled data from 432k real coding agent requests at SemiAnalysis and the median one isn't 32k, isn't 64k, but 96k input tokens. For context, that's more than the entire text of The Great Gatsby being shoved into the model before you've even typed your question. (1/3)🧵

译智能体工作负载正在悄然重塑推理经济学。我们从SemiAnalysis的43.2万个真实编码智能体请求中提取数据,发现中位数并非3.2万或6.4万,而是9.6万输入token。作为参考,这意味着在你输入问题之前,模型已处理了超过《了不起的盖茨比》全文长度的文本。(1/3)🧵

Replit ⠕@Replit · 5月23日32

Secure Your Vibe-Coded App + What's New in Connectors https://x.com/i/broadcasts/1qKVmQdjnmpxB

译保护你的Vibe-Coded应用 + 连接器新动态 https://x.com/i/broadcasts/1qKVmQdjnmpxB

Replit ⠕@Replit · 5月23日45

Most vibe-coded apps forget every user who opens them. With one prompt to Replit Agent fixes it! 💻 Try adding authentication to your app today!

译大多数氛围编码应用会忘记每个打开它们的用户。 用一条提示让 Replit Agent 修复它!💻 今天就尝试为你的应用添加认证功能吧!

Greg Brockman@gdb · 5月22日75

try Appshots in the Codex app:

译OpenAI的Codex应用推出了名为Appshots的新功能。用户通过同时按下两个CMD键,即可将当前应用的完整上下文(包括可见与不可见的屏幕内容)发送给Codex,远超普通截图所能提供的信息。与此同时,OpenAI更新了远程Codex,使其在笔记本电脑锁屏状态下仍可正常运行,允许用户安全地将笔记本留在家中,通过手机进行远程编码。该应用集成了多项独特功能,提升了使用体验。

AYi@AYi_AInotes · 5月22日76

Damn,这个必须卧槽一下了,Karpathy 的 CLAUDE.md 只有 65 行, 居然能把 AI 编程准确率从 65% 拉到 94%, 以22 万星标登顶 GitHub 趋势榜,而且绝大多数开发者还没读过, 里面没有一行奇技淫巧,4 条规则全是同一个方向: → 先想清楚再写代码 陈述假设,不确定就问,杜绝猜测 → 从最简方案入手 只写能解决问题的最少代码,不加任何多余抽象 → 像手术一样精准修改 不碰与需求无关的代码,每行改动都对应明确要求 → 以目标驱动执行 写第一行代码前,把模糊指令转化为可验证的成功标准 65 行,4 条规则,每一条都在对抗开发者“先写再说”的本能, 本质上是把慢下来这件事变成硬规则, 趁别人还没保存,赶紧先存好 👇

译Karpathy发布的CLAUDE.md文件以其简洁高效的AI编程指导原则引爆GitHub,获得超22万星标并登顶趋势榜。该文件仅含65行、4条核心规则,却能将AI编程的准确率从65%显著提升至94%。其核心在于强制开发者“慢下来”,将深度思考、追求简洁、精准修改和目标驱动等原则变为硬性编码准则,旨在对抗开发者习惯性“先写再说”的本能。目前大多数开发者尚未深入研读这一备受关注的效率指南。

Alibaba Cloud@alibaba_cloud · 5月22日82

Qwen3.7-Max is now live on Model Studio with 50% OFF (May 22–June 22)! Flagship Coding Agent Performance. Engineered for reliable, multi-step software execution with minimal human intervention. 🚀 Try it: https://int.alibabacloud.com/m/1000413314/

译Qwen3.7-Max现已登陆Model Studio,限时五折(5月22日至6月22日)! 旗舰级编程智能体性能。专为可靠、多步骤的软件执行而设计,最大限度减少人工干预。 🚀 立即体验:https://int.alibabacloud.com/m/1000413314/

Qwen@Alibaba_Qwen · 5月22日77

⚡️⚡️

译⚡️⚡️ [引用 @OpenRouter]:来自 @Alibaba_Qwen 的全新 Qwen3.7-Max 已在 OpenRouter 上线。 作为 Qwen3.7 系列的旗舰模型,专为以智能体为中心的工作而构建:编程、办公与生产力任务,以及长周期自主执行。在编程和智能体基准测试中较 Qwen3.6 有显著提升,并支持显式的提示缓存以处理重复上下文。

Emad@EMostaque · 5月22日64

20x sales for something growing that fast js a great deal for @SpaceX It will be immediately accretive given @SpaceX is likely coming to the market at over 50x sales

译对于增长如此迅速的公司,20倍销售额的收购价对@SpaceX来说非常划算 考虑到@SpaceX上市时估值可能超过50倍销售额,这笔交易将立即增厚其收益

Rohan Paul@rohanpaul_ai · 5月22日74

Bloomberg: Cursor has reached a $3B annual sales rate as SpaceX prepares a possible $60B acquisition that would tie AI coding software directly to one of the world’s largest engineering machines. Cursor reportedly crossed $2B in annualized revenue in February and $3B by late April, with more than 3,000 customers paying at least $100K a year. SpaceX’s interest is not just financial, because a company building rockets, satellites, factories, chips, robotics, and flight software can gain real leverage if AI tools shorten engineering cycles. The deal structure is unusual: SpaceX can buy Cursor for $60B, or pay a $10B fee tied to their work together, including $1.5B in cash and $8.5B as a deferred services fee. Composer 2.5 using SpaceX data-center compute is another huge levereage, because top coding models are now limited not only by algorithms, but by access to huge training and inference capacity. Cursor is also huge for the SpaceX IPO because it turns SpaceX’s AI story from “we are spending billions on compute” into “we may own one of the fastest-growing AI software products selling into real companies.” SpaceX’s filing is so crucial here because public investors are being asked to value the company around a massive future AI thesis. Cursor helps answer the investor question: who will actually use all this compute, and what software layer will turn those GPUs into revenue? SpaceX IPO buyers are not only buying SpaceX’s current business, they are buying the idea that SpaceX can become an AI infrastructure and software platform. Cursor also makes SpaceX shares more useful as acquisition currency, because a public listing gives SpaceX a market-priced stock it can use for a $60B deal instead of spending only cash. The $10B walk-away exposure signals seriousness, because Cursor would receive $1.5B as a termination fee plus $8.5B as a deferred services fee if the deal fails under the stated terms. The news is soo great for the SpaceX IPO in so many ways, as it gives investors a cleaner story: SpaceX is not only building AI capacity, it is trying to own the coding product that consumes that capacity and sits inside daily developer work in every enterprises. --- bloomberg .com/news/articles/2026-05-21/cursor-hits-3-billion-annual-sales-rate-ahead-of-spacex-deal

译据彭博社报道,AI编程软件Cursor年销售额已突破30亿美元,并正与SpaceX洽谈一项约600亿美元的收购交易。这笔交易的战略意义远超财务投资:对于正准备启动史上最大规模IPO之一的SpaceX而言,收购Cursor能将其对AI算力的巨额投资故事变得完整。它向投资者证明,SpaceX不仅能建设算力,更能将其转化为面向企业开发者的软件产品和收入流,这与其从航天承包商转型为“平台公司”的IPO叙事高度契合。交易结构特殊,包含高达10亿美元的潜在分手费,显示了双方的严肃态度。

meng shao@shao__meng · 5月22日66

VSCode 团队介绍 Agent-First Development 的五大支柱 1. Model —— 选择思考的深度 模型不是"越大越好",而是"匹配任务"。 Copilot 提供 Low / Medium / High / Auto 四档思考深度: · Low:补全、改名、格式化等机械任务,追求延迟 · Medium:常规功能开发,平衡速度与质量 · High:架构设计、复杂 bug、跨文件重构,宁可慢也要对 · Auto:让系统按任务复杂度自动调度 真正的认知是:思考深度是有成本的(时间、token、用户耐心)。Agent-First 的成熟用户会主动为任务"挑档位",而不是默认全开 High。 2. Harness —— Agent 的行动边界 Harness 指 Agent 能做什么、不能做什么的运行环境。Copilot Chat 面板就是 harness,它决定了 Agent 是"嘴上说说"还是"动手执行"。 三种模式构成了一个渐进信任阶梯: · Ask:只对话,不动文件 - 探索、问问题、学习代码 · Plan:列出步骤,等你批准 - 方案讨论、风险大的改动 · Agent:自主规划、执行、迭代 - 方向明确、需要落地的任务 关键洞察:从 Ask → Plan → Agent 是从"我主导"到"它主导"的权力让渡。强行一上来用 Agent 模式做模糊任务,等于让一个不了解情况的人替你做决定——失控是必然结果。 3. Context —— Agent 的"视野" 模型本身不知道你的代码库。Context 是它做对事的前提。 Copilot 获取 context 的方式分两类: · 自动:搜索 workspace、读取相关文件 · 手动(更可靠):用 # codebase、# file、# fetch 显式指定 这是最容易被低估的一环。多数"Agent 改坏了代码"的案例,根因不是模型不行,而是它根本没看到关键文件就开始猜。显式提供 context 不是冗余,是控制变量。 4. Prompt —— 意图的精度 Prompt = 目标 + 约束 + 验收标准。 "帮我加个登录功能" 和 "在 auth/ 目录下用现有的 SessionService 实现邮箱登录,复用 LoginForm 组件,错误信息走 toast,不要引入新依赖" 得到的结果完全不同。 专业用户的 prompt 通常包含: · 要做什么(goal) · 在哪里做(scope) · 不能做什么(constraints) · 怎么算完成(acceptance) 模糊的输入只能换来通用的输出。 5. Tools —— Agent 的"手" Tools 是 Agent 实际能调用的能力:读文件、跑命令、搜索、调 API、跑测试…… Tools 越多越强,但也意味着爆炸半径越大。Agent-First 的纪律是: · 给它需要的工具,不给不必要的工具 · 危险操作(删库、推 main、改 prod 配置)应当显式审批 · 工具链应可观测——Agent 跑了什么命令、改了什么文件,必须可见可回滚 整体框架:五个旋钮,而不是五个步骤 结果差 = f(模型档位错 × 载体模式错 × 上下文缺失 × 提示模糊 × 工具不够/太多) Agent-First Development 的本质是承认一件事:写代码的主体正在从"人 + 编辑器"变成"人 + Agent + 编辑器"。人的角色从"打字员"转向"模型选择者、上下文提供者、意图定义者、边界设定者"。 VS Code Learn 系列视频 https://www.youtube.com/playlist?list=PLj6YeMhvp2S4l1_iP4-pS6p7lgyqKo-Ix

译VSCode团队提出Agent-First Development框架,核心理念是开发主体从“人+编辑器”转向“人+Agent+编辑器”,人的角色转变为选择模型、提供上下文、定义意图和设定边界。五大支柱为:模型(匹配任务深度,按需选择思考档位)、执行边界(从问答到自主规划的渐进信任模式)、上下文(显式提供关键信息以避免错误)、提示(需清晰包含目标、范围与约束)与工具(能力需可控、可审计)。该框架旨在系统化指导人与AI代理高效协作开发。

AYi@AYi_AInotes · 5月22日57

宝子们,压箱底的8套神级 Prompt开源了啦,至少价值上万! 覆盖工作、生活、学习、副业等所有场景,文章最后还有宝藏彩蛋喔🎁 1️⃣KERNEL-X 终极动态专家系统(助我3个月从0-1涨粉到3万+的王炸系统) 2️⃣HE COMPILER IDENTITY (全栈编译器人格) 3️⃣唯一需要的Vibe Coding提示词 4️⃣Naval Ravikant分身(决策神器,哲学/人生Prompt) 5️⃣AI工作流程专家系统提示词 6️⃣认知挖掘提示词 7️⃣深度研究报告Prompt 8️⃣神级反思Prompt 用上之后你会从眉头紧锁的焦虑到豁然开朗,就像视频的这样👇

译本次分享开源了8套被称作“神级”的Prompt模板,宣称总价值超过万元。这些模板覆盖了工作、生活、学习、副业等多领域场景,包括KERNEL-X、AI工作流专家、深度研究等具体系统,旨在帮助用户提升效率、解决实际问题,实现从焦虑到豁然开朗的状态转变。

Greg Brockman@gdb · 5月22日17

trying to remember what it was like to code before codex

译试图回忆在Codex出现之前编程是什么感觉

歸藏(guizang.ai)@op7418 · 5月22日73

Codex 昨晚发布史诗级更新,体验爆炸提升! 其中快捷截图添加上下文和内置浏览器高级注释的功能太有用了。 你只需要同时按住左边和右边的 Command 键,它就会把你当前鼠标所在位置的窗口全部截下来,然后自动填入到 Codex 的输入框里。 它这个截图不只是你当前窗口的这个位置,而且它会把屏幕上没有的文本,也都填入到上下文里。 然后 /goal 这个功能已经正式上线到 Codex App 了。 这个功能更猛,你只要给它一个目标,它就会一直执行直到完成任务。这个过程可能持续几小时甚至几天时间。 而且你还可以:随时更改它的目标和引导、随时暂停,等你需要的时候继续执行。 如果你按下这个斜杠命令以后,没有出现这个可选项的话,你需要去它的 config 文件里改一下这个指令,它就能开启。 具体方式是:在 config.toml 中启用 features.goals goals = true 应用内浏览器也变得非常快和流畅。它有一个高级注释模式,可以让你在评论元素的同时去修改这些元素,甚至可以直接编辑。 这个可太爽了!你比如说用了我的 PPT Skills 以后,你觉得这个字太小或者里边的文字不对,你就可以直接编辑这个文字,而不用让 Codex 去帮你编辑。 还有一个是团队共享插件。在团队版本中,现在可以给你的团队成员批量安装插件了,目前该功能支持 Business 用户使用。

译Codex发布重要更新,核心提升在于上下文获取与任务自动化。新推出的“Appshots”功能,通过同时按住左右Command键,即可截取当前窗口并将屏幕内外的可见与不可见文本一并自动填入对话,极大简化背景提供流程。已正式上线的“/goal”功能支持设定长期目标,Codex可持续自主执行数小时至数天,且允许中途调整与暂停。此外,应用内浏览器速度提升,并新增可直接编辑页面元素的高级注释模式。团队版本则新增了批量安装插件的功能,提升了协作效率。

宝玉@dotey · 5月22日76

如何在 Codex App 使用 /goal 的简单说明: 1. 升级 Codex App 到最新版本 2. 先在命令行运行一下下面的指令: > codex features enable goals 或者手动修改 ~/.codex/config.toml [features] goals = true 3. 开头输入 /goal,或者点 + 弹出菜单中选择 4. 开始后,输入框上方可以暂停、编辑、删除

译OpenAI宣布Codex的/goal模式已结束实验,成为稳定功能。用户可在Codex应用、IDE扩展或CLI中使用,通过设定具体里程碑,让AI持续工作直至完成,任务可运行数小时甚至数天。过程中支持随时检查、调整方向及暂停。使用前需升级应用并启用该功能(可通过命令行指令或手动修改配置文件实现)。开启后,可在输入框管理任务,并利用侧边对话查看进度而不中断主任务。该功能旨在高效处理各类复杂任务。

宝玉@dotey · 5月22日57

微软开始大规模收回内部员工的 Claude Code 许可证,要求开发者转向自家的 GitHub Copilot CLI。 据 The Verge 报道,微软去年 12 月开始在内部推广 Claude Code,鼓励项目经理、设计师等非技术岗位尝试用 AI 写代码。半年下来,Claude Code 在微软内部非常受欢迎,但这个受欢迎反而成了问题:它让微软自家刚推出的 GitHub Copilot CLI 显得尴尬了。 Copilot CLI 是 GitHub Copilot 的命令行版本,跟 Claude Code 的定位高度重叠。微软负责 Windows、Microsoft 365、Outlook、Teams 和 Surface 的 Experiences + Devices 团队,已经要求工程师在 6 月底前完成迁移,全面切换到 Copilot CLI。 微软对内的说法是统一工具链,但知情人士透露,背后也有成本考量。毕竟每个 Claude Code 的 license 费用都是交给竞争对手 Anthropic 的。 据悉,被要求迁移的工程师对此并不情愿。

译微软已开始大规模收回内部员工对Anthropic公司Claude Code工具的访问权限,要求开发者转向自家的GitHub Copilot CLI。尽管Claude Code在微软内部广受欢迎,但其成功反而凸显了自家Copilot CLI的定位尴尬。微软以统一工具链为由推动此次迁移,但核心考量也包括将支付给竞争对手Anthropic的成本收回。此举已引发被要求迁移工程师的普遍抵触。

Elon Musk@elonmusk · 5月22日36

Daily Grok Build bug fixes

译Grok Build发布0.1.214版本,修复多项功能与界面问题。此次更新重点推出X搜索功能并大幅提升网页搜索速度(计划于当日完成),同时解决了Windows平台powershell下的渲染错误、模态框按键冲突、非vim模式提示显示等操作体验问题。此外,版本还优化了链接点击交互、会话筛选逻辑,并增强了对插件更新、MCP服务器令牌过期等场景的稳定性支持。更新说明可通过终端界面查看。

meng shao@shao__meng · 5月22日67

一起看看 Cursor 团队内部最常用的 Skills thermo-nuclear-code-quality-review,一位苛刻的代码质量审计员,它的设计目标是:在 PR 合并之前,识别那些"能跑、但让代码库变得更糟"的改动并拒掉它们。 在这安装 @cursor_ai Team Kit: https://cursor.com/marketplace/cursor/cursor-team-kit 四条核心审计原则 1. 删除复杂性,而不是搬运复杂性 重构的常见反模式是把一坨复杂逻辑从 A 文件挪到 B 文件,调用栈变深,但总复杂度没降甚至上升。该 skill 要求改动产生净简化,而非位置转移。 2. 阻止超过 1000 行的文件 硬性上限。超过 1k 行的文件几乎必然意味着职责不清、难以测试、难以并行修改。这是一条"宁可错杀"的工程红线。 3. 标记薄包装层和泄漏的逻辑 · Thin wrappers:只是转发参数、没有实质行为的函数/类,徒增间接层。 · Leaked logic:本该封装在某层的业务规则散落到了调用方,破坏边界。 4. 拒绝"能工作但让代码更乱"的 PR 这是最关键的一条立场:功能正确 ≠ 可以合并。维护性是一等公民,与功能性同等重要。 两阶段、父子 Agent 协作的运行机制 阶段 1 — 父 agent 准备上下文(并行) · 一个 shell 子 agent 执行 git diff <base>...HEAD(默认 base 为 main) · 一个 explore 子 agent 抓取所有变更文件的完整内容 阶段 2 — 调用审计 agent 父 agent 把上面两份产物组装成带 ### Git / diff output 和 ### Changed file contents 两个标注段落的 prompt,传给 thermo-nuclear-code-quality-review 子 agent 执行审计。 这个设计有几个值得注意的点: · 审计 agent 本身不做信息收集,输入是结构化的、确定的,避免它在探索阶段被噪声干扰。 · 禁止嵌套子 agent(除非显式要求),强制单次、聚焦的判断。 · 只评判 diff 中看得见的东西,但当改动触及模块边界时要追踪跨文件影响——这避免了"只见树木"的局部审查。 Rubric 的兜底逻辑 Skill 明确写了一个 fallback:如果 cursor-team-kit 插件不在,就退化为一次"严厉的可维护性审计",目标对齐: · 大胆简化(ambitious simplification) · 文件不无故膨胀超过 ~1k 行 · 不容忍随手加 if/else 让分支无序增长 · 显式类型与边界 · 规范的分层(canonical layers)

译Cursor 团队内部广泛使用的代码审查技能“thermo-nuclear-code-quality-review”,其核心目标是在代码合并前,拦截那些“能运行但会使代码库变糟”的提交。它基于四条硬性原则:强制实现复杂度净简化而非转移、限制单文件不超过1000行、标记无用的封装与散落的逻辑、坚持维护性与功能同等重要。该技能采用父子Agent两阶段协作机制:父Agent并行收集结构化差异与文件内容,再交由审计Agent进行单次、聚焦的严格评判。即使插件未安装,也会触发一套对齐上述原则的可维护性降级审计。

宝玉@dotey · 5月22日42

Cursor 的手机版马上也要出了

Berryxia.AI@berryxia · 5月22日70

最近𝕏 开始支持和拥抱各种生态,从小龙虾、Hermes 再到直接工具类的OpenCode 。 如今你可以直接在OpenCode中使用Grok 或者𝕏 Premium 的订阅z

Berryxia.AI@berryxia · 5月22日66

兄弟们,Codex 这个功能更新是非常实用了啊! 当你在Mac 上正在用 Codex 聊天的时候,你突然按两下 Command 键。 Codex 立刻截取了你当前应用窗口的画面,还把窗口里所有文字内容,包括没显示在屏幕上的部分,一起抓了过来。 这就是他们今天刚推的 Appshots。 更进一步的是 /goal 模式。 你直接扔给它一个明确目标,比如把某个功能完整跑通、写完测试、或者把页面改到符合要求。 它会自己干活,跨好几个小时甚至好几天都不停。 你想中途 看进度就看,想调整方向就调整,还能单独开个小聊天问它目前干了什么,完全不打断主任务。 可现实是,这些最能体现 agent 能力的更新,目前主要只在 Mac 上体验最好。 Windows 用户还在等最基础的远程控制和功能同步。

译Codex近期推出Appshots功能,用户可在Mac上双击Command键,快速将当前应用窗口的截图与文字内容(包括屏幕外部分)投喂给AI。同时上线的/goal模式支持用户设定明确任务目标(如跑通功能、编写测试),AI可自主跨时执行,允许用户随时查看进度或调整方向。这些更新凸显了AI Agent的自主能力,但目前Mac端体验最佳,Windows用户仍在等待基础远程控制与功能同步。

小互@xiaohu · 5月22日61

Codex 推出 Locked Use(锁屏使用)功能 可以在你的 Mac 锁屏之后操作你的电脑继续干活 你也可以通过手机远程给Codex下达任务,它在锁屏状态下依旧能工作... 用的是苹果官方 Authorization Plug-in 机制,临时解锁 Mac,干完该干的事,自动再锁上。 而且全程屏幕依旧是黑的,处于保护状态... 四层安全设计: 🛡️ 授权窗口极短,只针对单次解锁尝试 🛡️ 自动解锁只在 Codex 主动操作期间可用 🛡️ 解锁期间 Codex 会遮住所有显示器,旁人看不到屏幕在干什么 🛡️ 一旦检测到本地键盘鼠标输入,立即重新锁屏 给你办公室的电脑装codex后,你回家躺在床上,老板临时有需求来,你依然能通过手机操控你的电脑干活,或者提取电脑里的文件等等。

译Codex 新增“锁屏使用”功能,允许用户在 Mac 锁屏状态下,通过手机远程下发指令,让电脑继续执行任务。该功能基于苹果官方授权机制临时解锁,操作全程屏幕保持黑屏以保护隐私,并具备四层安全设计,如短时授权、检测到本地操作即刻重锁,确保了远程操作的安全性与便利性。

🚨 AI News | TestingCatalog@testingcatalog · 5月22日71

OPENAI 🔥: Codex on macOS now supports Appshots, allowing users to quickly add context from any app directly to the prompt. Besides that, a new annotation editor is now available in the browser, the/goal command is enabled by default, and Plugins are now shareable.

译OpenAI宣布Codex在macOS平台推出重要更新,核心功能为“Appshots”。该功能允许用户通过快捷键快速将任何应用窗口的完整上下文(包括屏幕截图与可访问文本)附加至Codex对话线程,从而为AI提供更全面的工作背景信息。此外,本次更新还包括浏览器端的新版注释编辑器、默认启用的/goal命令,以及现已支持分享的插件功能。Appshots已向所有Mac端用户开放。

宝玉@dotey · 5月22日67

OpenAI 今天发了一波 Codex 更新。 【1】Appshots:把屏幕上的东西直接发送到 Codex Mac 上同时点击左右 Command 键(这个快捷键在设置里面能修改),就能把当前窗口截屏后发送给 Codex。 不只是截图,它还能读取窗口里的文字内容,包括屏幕上没显示出来的部分。 这解决了一个很实际的痛点:你在浏览器里看到一个 bug、在设计稿里看到一个需要实现的界面,以前得自己截图粘贴,现在一个快捷键就把完整上下文带进去了。 所有付费计划都能用,企业版还在路上。 【2】桌面版正式支持/goal(Goal 模式) 之前还是实验功能,现在正式上线了。你给 Codex 一个目标,它会持续工作直到完成,哪怕跨越几小时甚至几天。中途可以随时查看进度、调整方向、暂停。还能开 side chat 来了解当前进展,不打断主任务。 适合那种拆解下来步骤很多、需要反复迭代的大任务。 【3】高级标注模式:设计师终于能直接指哪改哪了 在 Codex 内置浏览器里预览页面时,可以直接拖拽、调整页面元素,同时留批注,改完即时预览。多条修改可以攒一批一起提交。 这个功能明显是给设计师和前端协作场景准备的,不用再截图画圈写"这里往左移 10px"了。 【4】插件可以团队共享了 Business 用户现在可以把自定义插件分发给团队,统一管理工作区内可用的工具。企业版需要联系开通。 另外 Analytics 面板也做了升级,能看到活跃用户、Token 消耗、代码生成行数、插件使用情况这些细粒度数据,API 也同步更新了。 看起来 Codex 在从个人编程助手往团队协作平台的方向走。Appshots 和标注模式降低了非工程师参与开发流程的门槛,插件共享和 Analytics 则是典型的企业级功能。

译OpenAI 近日对 Codex 进行了一系列重要更新,旨在提升团队协作效率并降低开发门槛。核心功能包括:通过快捷键快速发送当前窗口上下文至 Codex,解决工作流中断问题;桌面版正式推出/goal 模式,支持长时间自主执行复杂任务;新增高级标注模式,方便设计师在页面预览中直接调整与批注;企业用户现可共享自定义插件,并通过升级的 Analytics 面板查看细粒度使用数据。这些更新标志着 Codex 正从个人编程助手向更强大的团队协作平台演进。

宝玉@dotey · 5月22日64

OpenAI 今天发了一波 Codex 更新。 【1】Appshots:把屏幕上的东西直接发送到 Codex Mac 上同时点击左右 Command 键(这个快捷键在设置里面能修改),就能把当前窗口截屏后发送给 Codex。 不只是截图,它还能读取窗口里的文字内容,包括屏幕上没显示出来的部分。 这解决了一个很实际的痛点:你在浏览器里看到一个 bug、在设计稿里看到一个需要实现的界面,以前得自己截图粘贴,现在一个快捷键就把完整上下文带进去了。 所有付费计划都能用,企业版还在路上。 【2】桌面版正式支持/goal(Goal 模式) 之前还是实验功能,现在正式上线了。你给 Codex 一个目标,它会持续工作直到完成,哪怕跨越几小时甚至几天。中途可以随时查看进度、调整方向、暂停。还能开 side chat 来了解当前进展,不打断主任务。 适合那种拆解下来步骤很多、需要反复迭代的大任务。 需要运行一下下面的指令: > codex features enable goals 【3】高级标注模式:设计师终于能直接指哪改哪了 在 Codex 内置浏览器里预览页面时,可以直接拖拽、调整页面元素,同时留批注,改完即时预览。多条修改可以攒一批一起提交。 这个功能明显是给设计师和前端协作场景准备的,不用再截图画圈写"这里往左移 10px"了。 【4】插件可以团队共享了 Business 用户现在可以把自定义插件分发给团队,统一管理工作区内可用的工具。企业版需要联系开通。 另外 Analytics 面板也做了升级,能看到活跃用户、Token 消耗、代码生成行数、插件使用情况这些细粒度数据,API 也同步更新了。 看起来 Codex 在从个人编程助手往团队协作平台的方向走。Appshots 和标注模式降低了非工程师参与开发流程的门槛,插件共享和 Analytics 则是典型的企业级功能。

译OpenAI 为编程助手 Codex 推出一系列重要更新,旨在降低参与门槛并提升团队协作效率。主要更新包括:“Appshots”功能,用户可通过快捷键将当前应用窗口的截图与文本内容(含屏幕外部分)直接发送至 Codex;桌面版正式支持“/goal”模式,允许 Codex 自主执行跨时长的复杂任务;新增高级标注模式,设计师可在预览中直接拖拽调整元素并提交修改。此外,Business 用户现可共享自定义插件,Analytics 面板也升级了细粒度数据监控。这些举措标志着 Codex 正从个人编程助手向团队协作平台演进。

Sam Altman@sama · 5月22日73

new codex ships today!

译新版Codex今日发布! [引用 @OpenAIDevs]:今天是Codex周四,我们带来了更新。 首先是Appshots,一种将你正在处理的应用上下文带入Codex的新方式。 在Mac上,按Command-Command键即可将应用窗口附加到Codex线程。Codex会获取窗口的截图和文本,包括屏幕上不可见的内容。 Appshots已在Mac的所有套餐中可用,企业版访问权限即将推出。

swyx🛬 SFO@swyx · 5月22日51

working on a "take this vibecoded slop app and make it a production-ready, e2e tested, maintainable, parallelizable agent repo" skill. this thing ran for ~16 hours yesterday and made 103 commits all told and i ended up with exactly the same app but instead of fragile mvp it now looks like a codebase i can actually build on for th elong run

译正在开发一项技能,用于将“Vibe编码的粗糙应用”转化为“生产就绪、端到端测试、可维护、可并行化的智能体代码库”。 这个过程昨天运行了约16小时,共产生103次提交,最终得到了完全相同的应用程序——但不再是脆弱的MVP,而是一个可以长期构建的代码库。

小互@xiaohu · 5月22日58

OpenAI 给 Codex 加了一个新的功能,叫 Appshots。 将任意窗口上下文传输给 Codex: 你在 Mac 上开发、设计、写文档、看网页时,可以直接把“当前正在操作的窗口上下文”发给 Codex。 操作方式: 在 Mac 上按两次 Command 键(⌘⌘),就能把当前应用窗口附加到 Codex 对话线程里。 重点不是单纯截图。 Codex 会同时获取: • 当前窗口的截图 • 窗口里的文本内容 • 甚至包括屏幕上没显示出来的部分内容 比如: 你现在在 VS Code 里写代码。 虽然屏幕只显示前 50 行,但整个文件其实有几百行。 Appshots 不只是拍一张图片,它还能读取编辑器里的文本上下文,所以 Codex 能理解完整代码结构。 再比如: 你在 Figma、Notion、浏览器、终端里工作。 按 ⌘⌘ 后,Codex 可以直接看到: • 当前 UI 长什么样 • 页面文字内容 • 控制台报错 • 文档说明 • 设计稿结构 这样你就不用: “复制粘贴代码 + 截图 + 手动解释半天”。 它更像: 把你的当前工作界面“共享”给 AI。 https://x.com/OpenAIDevs/status/2057530207976989179/video/1

译OpenAI为Codex推出Appshots功能,用户可通过快捷键(连续按两次Command键)将当前操作窗口的完整上下文分享给AI。该功能不仅传输屏幕截图,还能提取窗口内的文本内容及未显示的隐藏信息,例如完整代码结构、设计稿内容或控制台报错等。这免去了开发者、设计师手动复制粘贴代码与截图的繁琐流程,实现了工作界面的直接共享。

Greg Brockman@gdb · 5月22日68

codex app continues to get extremely good, plus features for businesses and enterprise such as token analytics and plugin sharing

译OpenAI为Codex应用推出“Appshots”新功能,用户可通过快捷键(如Mac的Command-Command)将当前应用窗口的截图与文本内容直接附加到对话中,从而为AI提供更全面的上下文信息,包括屏幕外内容。该功能现已在Mac端全套餐开放,企业版访问权限也将很快推出。此外,Codex还新增了面向企业和商业场景的功能,如token使用分析和插件共享,以增强协作与数据分析能力。

Rohan Paul@rohanpaul_ai · 5月22日62

Qwen 3.7 Max is super close to the frontier models for coding and agentic abilities. And and it’s now available on AI/ML API. Agent reliability the center of the story and also on Artificial Analysis it's sitting at 5th, pretty much on par with GPT 5.4 (xhigh) and a notch above the just released Gemini 3.5 Flash. AI/ML API is also giving away free codes for users who want to try it. see the quoted tweet.

译阿里云的 Qwen 3.7 Max 在编码与智能体(Agent)能力上已非常接近前沿模型,并现已在 AI/ML API 平台上线。根据 Artificial Analysis 的评测,其智能体可靠性排名第五,性能与 GPT 5.4 (xhigh) 相当,并略高于新发布的 Gemini 3.5 Flash。AI/ML API 将其定位为面向智能体时代的模型,突出其能支持超过35小时的自主执行,并兼容 Claude Code 等工具。平台还提供了包括 GPQA Diamond(92.4分)在内的基准测试成绩,并为用户提供免费试用码。

OpenCode@opencode · 5月22日75

OpenCode can now officially be used with your Grok or X Premium subscriptions Try it with the new Grok Build model

译OpenCode现已正式支持您的Grok或X Premium订阅 尝试使用全新的Grok Build模型 https://x.ai/news/grok-opencode

OpenAI Developers@OpenAIDevs · 5月22日64

It’s Codex Thursday, and yes, we have updates for you. First up: Appshots, a new way to bring the context of what you’re working on into Codex. On your Mac, press Command-Command to attach your app window to a Codex thread. Codex gets both a screenshot and text from the window, including content beyond what’s visible onscreen. Appshots are available across plans on Mac, with enterprise access coming soon.

译又是Codex周四,我们带来了更新。 首先是Appshots,一种将你工作上下文引入Codex的新方式。 在Mac上,按Command-Command即可将应用窗口附加到Codex线程。Codex会获取窗口的截图和文本,包括屏幕上不可见的内容。 Appshots已在Mac各计划中推出,企业版访问权限即将上线。

Alibaba Cloud@alibaba_cloud · 5月22日75

Qwen3.7-Max is live on @OpenRouter https://x.com/OpenRouter/status/2057500097206976983?s=20

译Qwen3.7-Max已在@OpenRouter上线 https://x.com/OpenRouter/status/2057500097206976983?s=20

AYi@AYi_AInotes · 5月22日72

Damn,Claude Code 终于出 /usage 了, token 消耗拆到每个 Skill、每个子代理、每个 MCP 头上,再也不用猜钱花哪了, 我查了一下自己的才发现: • babysit 子代理在后台默默吃掉 13% • 有个 testmcp 一直挂在那偷跑 11% • 以前完全不知道它们的存在 我觉得/usage 最狠的还不是统计,而是归因,下游触发的 token 也会追回源头,谁引发的雪崩,一眼看到, 支持按天/周筛选历史数据,CLI 已经上线,桌面版也会马上跟进, 三个动作现在就能做: 1. 敲 /usage 看全局占比 2. 揪出占比最高的 Skill/MCP 3. 不用的直接禁用,太贵的在 settings.json 里加限制 讲真,从“感觉 token 烧得快”到“知道谁在烧钱”,这一步等了太久了, 现在打开 Claude Code,敲 /usage,你会第一次真正看清自己的 AI 工作流 👇

译Claude Code上线了/usage指令,实现token消耗的精细化归因。该功能可展示每个Skill、子代理及MCP的用量占比,并能追踪由下游操作触发的消耗源头。支持按天/周筛选历史数据,CLI端已可使用,桌面端即将跟进。这一更新使用户能从模糊感知转向精确掌握AI工作流的具体成本构成。

xAI@xai · 5月22日66

You can now use your @grok or X Premium subscription in @opencode. Use the model powering Grok Build for high speed and codebase intelligence. https://x.ai/news/grok-opencode

译您现在可以在 @opencode 中使用您的 @grok 或 X Premium 订阅。 使用驱动 Grok Build 的模型,享受高速与代码库智能。 https://x.ai/news/grok-opencode

宝玉@dotey · 5月22日70

Claude Code 专门升级了 /usage ,可以看到 Token 到底花在哪里了 👍

全部 AI 动态
AI 相关资讯全量信息流
全部一手信源资讯推文
全部模型产品行业论文技巧
5月23日
04:05
Artificial Analysis@ArtificialAnlys
58
Cursor Composer 2.5在成本与效率上实现突破性优势

基准测试显示,Cursor Composer 2.5在编程任务中展现出卓越的成本与效率优势。其单任务成本仅为Claude Opus 4.7的1/3至1/18,更是GPT-5.5的1/5至1/32。这一低成本源于其极高的token使用效率:完成全部测试仅消耗1.6M token,远低于同类模型的5.7M。效率方面,其平均任务完成时间约9分钟,比行业平均水平快约1.3倍,其快速版本更可将时间缩短至约7分钟。

智能体编码评测/基准
03:49
小互@xiaohu
74
一种轻量化的Codex远程服务器配置方案。无需安装完整版应用,仅需在远程服务器上安装并运行CLI版Codex。执行`codex remote-control`命令后,手机端ChatGPT应用内的Codex功能即可发现并连接该服务器,远程体验与完整版无异。两种配置在应用内通过不同图标("终端"与"电脑")进行区分。

Oasis Feng: 其实远程服务器上并不需要安装一个完整版的 Codex app,只需要安装 CLI 版的 Codex,并运行: codex remote-control 这样手机上 ChatGPT 应用里的 Codex 就会显示出一个有「终端」图标的服务器名...

智能体OpenAI教程/实践编码
01:44
swyx@swyx
精选78
Kakuna:自动化加固代码库的AI代理工具

Kakuna是一款AI代理工具,旨在将早期快速原型自动转化为可维护的生产级代码库。它通过内置的检查清单和“计划-目标”工作流,模拟人类开发与运维流程,在保持功能不变的前提下,自动执行代码审查、测试补充、重构等“无聊”工作,并强调子代理并行以提升效率。该工具是为“人类与代理协作”而设计的范例,其核心是“反熵增”与“反代码腐化”。例如,一次约16小时的运行能生成上百次提交,将一个脆弱的MVP转变为一个结构清晰、可长期构建的稳定项目。

swyx: working on a "take this vibecoded slop app and make it a production-ready, e2e tested, maintainable, parallelizable agen...

教程/实践编码部署/工程

推荐理由:如果你还在为 vibe coding 产出的屎山头疼,swyx 这个 skill 刚开源,16 小时自动重构 103 次提交交付一个可维护的代码库,做独立开发的很值得抄一下。
01:37
Boris Cherny@bcherny
69
推文介绍了一个名为"zero2claude"的免费课程,旨在帮助完全没有编程或终端使用经验的用户系统学习并掌握Claude Code。课程内容从零基础逐步深入至高级应用,目前已吸引超过1.7万名学生,并提供7种语言版本。值得注意的是,整个教学平台完全由一人借助Claude Code独立构建和运营,其出色的性能表现(如高访问量与极低错误率)验证了Claude Code开发生产级产品的能力。推广者强调,扩大AI应用的关键在于赋能用户提升技能,而非简化工具本身,因此该课程不设任何付费门槛,完全免费向社区开放。

itay shmool 🇮🇱: I built "zero2claude", a free course that takes people from zero terminal experience to shipping with Claude Code. The c...

Anthropic教程/实践编码
01:15
Google AI@GoogleAI
同事件精选70
谷歌I/O大会发布AI代理全套开发工具链

谷歌在I/O开发者大会宣布,系统性构建面向AI代理(Agent)的开发与部署工具链。核心更新包括:独立桌面应用Antigravity 2.0及其命令行工具、SDK面世;Google AI Studio新增Kotlin支持,可一键开发安卓应用并发布,同时推出移动端App。此外,Gemini API推出托管代理服务,实现一键部署;WebMCP作为开放标准在Chrome 149中推出,允许网页向代理暴露工具;Chrome DevTools也开放给AI代理以自动化调试。企业级客户可直接连接Google Cloud项目,而DeepMind的科学技能包则加速特定领域研究。此举标志着谷歌正全面打造从开发、接口到部署的完整AI代理生态系统。

智能体Google产品更新编码
同一事件,精选展示《Gemini 3.5:具备行动能力的前沿智能》
推荐理由:Google把今年I/O的Agent相关更新打包放出,Antigravity 2.0从IDE变桌面应用、AI Studio能直接做Android App,对Google生态开发者是必读速览。
01:05
SemiAnalysis@SemiAnalysis_
精选82
智能体工作负载正在悄然重塑推理经济学。我们从SemiAnalysis的43.2万个真实编码智能体请求中提取数据,发现中位数并非3.2万或6.4万,而是9.6万输入token。作为参考,这意味着在你输入问题之前,模型已处理了超过《了不起的盖茨比》全文长度的文本。(1/3)🧵
智能体推理现象/趋势编码

推荐理由:SemiAnalysis 用 43 万次真实编码请求数据揭开了 Agent 推理经济学的真面目,中位输入 9.6 万 token 这个数字足够反直觉,所有做推理服务和模型定价的人都得重新算了。
00:07
Replit ⠕@Replit
32
保护你的Vibe-Coded应用 + 连接器新动态 https://x.com/i/broadcasts/1qKVmQdjnmpxB
产品更新安全/对齐编码
00:07
Replit ⠕@Replit
45
大多数氛围编码应用会忘记每个打开它们的用户。 用一条提示让 Replit Agent 修复它!💻 今天就尝试为你的应用添加认证功能吧!
智能体产品更新编码
5月22日
20:35
Greg Brockman@gdb
75
OpenAI的Codex应用推出了名为Appshots的新功能。用户通过同时按下两个CMD键,即可将当前应用的完整上下文(包括可见与不可见的屏幕内容)发送给Codex,远超普通截图所能提供的信息。与此同时,OpenAI更新了远程Codex,使其在笔记本电脑锁屏状态下仍可正常运行,允许用户安全地将笔记本留在家中,通过手机进行远程编码。该应用集成了多项独特功能,提升了使用体验。

Anthony Kroeger: Codex just launched one of the coolest features - Appshots. by pressing both CMD keyboard buttons, context of whatever a...

OpenAI产品更新多模态编码
20:16
AYi@AYi_AInotes
精选76
Karpathy的CLAUDE.md四条规则让AI编程准确率飙升至94%

Karpathy发布的CLAUDE.md文件以其简洁高效的AI编程指导原则引爆GitHub,获得超22万星标并登顶趋势榜。该文件仅含65行、4条核心规则,却能将AI编程的准确率从65%显著提升至94%。其核心在于强制开发者“慢下来”,将深度思考、追求简洁、精准修改和目标驱动等原则变为硬性编码准则,旨在对抗开发者习惯性“先写再说”的本能。目前大多数开发者尚未深入研读这一备受关注的效率指南。

self.dll: karpathy's CLAUDE.md hit #1 on github trending. 220,000 stars. most devs still haven't read it. it's 65 lines. it took A...

开源生态教程/实践编码

推荐理由:Karpathy 这 65 行不是新模型,是给 AI 编程装了道刹车,先想清楚再动手这条反直觉规则把准确率从 65 拉到 94,所有用 Cursor 的都该立刻抄一份。
18:50
Alibaba Cloud@alibaba_cloud
82
Qwen3.7-Max现已登陆Model Studio,限时五折(5月22日至6月22日)! 旗舰级编程智能体性能。专为可靠、多步骤的软件执行而设计,最大限度减少人工干预。 🚀 立即体验:https://int.alibabacloud.com/m/1000413314/
智能体模型发布编码
关联讨论 8 条公众号:通义实验室(千问)X:通义千问 / Qwen (@Alibaba_Qwen)X:阿里云 / Alibaba Cloud (@alibaba_cloud)X:X.PIN (@thexpin)X:Rohan Paul (@rohanpaul_ai)Qwen:Blog Retrieval(API)Hacker News 热门(buzzing.cc 中文翻译)IT之家(RSS)
18:19
Qwen@Alibaba_Qwen
77
⚡️⚡️ 【引用 @OpenRouter】:来自 @Alibaba_Qwen 的全新 Qwen3.7-Max 已在 OpenRouter 上线。 作为 Qwen3.7 系列的旗舰模型,专为以智能体为中心的工作而构建:编程、办公与生产力任务,以及长周期自主执行。在编程和智能体基准测试中较 Qwen3.6 有显著提升,并支持显式的提示缓存以处理重复上下文。

OpenRouter: The new Qwen3.7-Max from @Alibaba_Qwen is live on OpenRouter. The flagship of the Qwen3.7 series, built for agent-centri...

智能体模型发布编码
关联讨论 8 条公众号:通义实验室(千问)X:通义千问 / Qwen (@Alibaba_Qwen)X:阿里云 / Alibaba Cloud (@alibaba_cloud)X:X.PIN (@thexpin)X:Rohan Paul (@rohanpaul_ai)Qwen:Blog Retrieval(API)Hacker News 热门(buzzing.cc 中文翻译)IT之家(RSS)
16:16
Emad@EMostaque
64
对于增长如此迅速的公司,20倍销售额的收购价对@SpaceX来说非常划算 考虑到@SpaceX上市时估值可能超过50倍销售额,这笔交易将立即增厚其收益

Techmeme: Source: Cursor reached $3B in annualized revenue in late April and now has 3,000+ customers paying at least $100K each f...

编码行业动态
15:56
Rohan Paul@rohanpaul_ai
74
Cursor年销售额达30亿美元,或被SpaceX以600亿美元收购

据彭博社报道,AI编程软件Cursor年销售额已突破30亿美元,并正与SpaceX洽谈一项约600亿美元的收购交易。这笔交易的战略意义远超财务投资:对于正准备启动史上最大规模IPO之一的SpaceX而言,收购Cursor能将其对AI算力的巨额投资故事变得完整。它向投资者证明,SpaceX不仅能建设算力,更能将其转化为面向企业开发者的软件产品和收入流,这与其从航天承包商转型为“平台公司”的IPO叙事高度契合。交易结构特殊,包含高达10亿美元的潜在分手费,显示了双方的严肃态度。

Rohan Paul: SpaceX just filed for a Nasdaq IPO under SPCX that could turn Elon Musk's SpaceX stake into the first $1T personal fortu...

编码行业动态
15:46
meng shao@shao__meng
66
VSCode Agent-First Development五大支柱解析

VSCode团队提出Agent-First Development框架,核心理念是开发主体从“人+编辑器”转向“人+Agent+编辑器”,人的角色转变为选择模型、提供上下文、定义意图和设定边界。五大支柱为:模型(匹配任务深度,按需选择思考档位)、执行边界(从问答到自主规划的渐进信任模式)、上下文(显式提供关键信息以避免错误)、提示(需清晰包含目标、范围与约束)与工具(能力需可控、可审计)。该框架旨在系统化指导人与AI代理高效协作开发。

Microsoft Developer: The @code team released a new Introduction to Agent-First Development series. It breaks down these 5 pillars behind grea...

智能体Microsoft教程/实践编码
15:14
AYi@AYi_AInotes
57
8套价值上万的神级Prompt模板开源分享

本次分享开源了8套被称作“神级”的Prompt模板,宣称总价值超过万元。这些模板覆盖了工作、生活、学习、副业等多领域场景,包括KERNEL-X、AI工作流专家、深度研究等具体系统,旨在帮助用户提升效率、解决实际问题,实现从焦虑到豁然开朗的状态转变。

AYi: http://x.com/i/article/2057300084354670592

智能体教程/实践编码
14:05
Greg Brockman@gdb
17
试图回忆在Codex出现之前编程是什么感觉
OpenAI大佬观点编码
12:30
歸藏(guizang.ai)@op7418
73
Codex 昨晚发布史诗级更新,体验爆炸提升!

Codex发布重要更新,核心提升在于上下文获取与任务自动化。新推出的“Appshots”功能,通过同时按住左右Command键,即可截取当前窗口并将屏幕内外的可见与不可见文本一并自动填入对话,极大简化背景提供流程。已正式上线的“/goal”功能支持设定长期目标,Codex可持续自主执行数小时至数天,且允许中途调整与暂停。此外,应用内浏览器速度提升,并新增可直接编辑页面元素的高级注释模式。团队版本则新增了批量安装插件的功能,提升了协作效率。

OpenAI Developers: It's Codex Thursday, and yes, we have updates for you. First up: Appshots, a new way to bring the context of what you're...

智能体OpenAI产品更新编码
12:13
宝玉@dotey
精选76
OpenAI Codex /goal功能正式发布及使用指南

OpenAI宣布Codex的/goal模式已结束实验,成为稳定功能。用户可在Codex应用、IDE扩展或CLI中使用,通过设定具体里程碑,让AI持续工作直至完成,任务可运行数小时甚至数天。过程中支持随时检查、调整方向及暂停。使用前需升级应用并启用该功能(可通过命令行指令或手动修改配置文件实现)。开启后,可在输入框管理任务,并利用侧边对话查看进度而不中断主任务。该功能旨在高效处理各类复杂任务。

OpenAI Developers: 🥅 /goal has graduated from an experiment-for tasks big and small, Codex gets your work done. Use goal mode in the Codex...

智能体OpenAI教程/实践编码

推荐理由:Codex的goal模式从实验毕业,意味着你可以真的放手让AI去跑长时间任务,做开发的不用再守在电脑前,这是agent落地的真信号。
10:43
宝玉@dotey
57
微软内部收回Claude Code权限,力推自家Copilot CLI

微软已开始大规模收回内部员工对Anthropic公司Claude Code工具的访问权限,要求开发者转向自家的GitHub Copilot CLI。尽管Claude Code在微软内部广受欢迎,但其成功反而凸显了自家Copilot CLI的定位尴尬。微软以统一工具链为由推动此次迁移,但核心考量也包括将支付给竞争对手Anthropic的成本收回。此举已引发被要求迁移工程师的普遍抵触。

Microsoft产品更新编码行业动态
09:08
Elon Musk@elonmusk
36
Grok Build发布0.1.214版本,修复多项功能与界面问题。此次更新重点推出X搜索功能并大幅提升网页搜索速度(计划于当日完成),同时解决了Windows平台powershell下的渲染错误、模态框按键冲突、非vim模式提示显示等操作体验问题。此外,版本还优化了链接点击交互、会话筛选逻辑,并增强了对插件更新、MCP服务器令牌过期等场景的稳定性支持。更新说明可通过终端界面查看。

skcd: Bug fixes shipping to Grok Build (release notes will be available in the TUI) 0.1.214 - Rolling out X search and a much ...

xAI产品更新编码
08:42
meng shao@shao__meng
67
一起看看 Cursor 团队内部最常用的 Skills

Cursor 团队内部广泛使用的代码审查技能“thermo-nuclear-code-quality-review”,其核心目标是在代码合并前,拦截那些“能运行但会使代码库变糟”的提交。它基于四条硬性原则:强制实现复杂度净简化而非转移、限制单文件不超过1000行、标记无用的封装与散落的逻辑、坚持维护性与功能同等重要。该技能采用父子Agent两阶段协作机制:父Agent并行收集结构化差异与文件内容,再交由审计Agent进行单次、聚焦的严格评判。即使插件未安装,也会触发一套对齐上述原则的可维护性降级审计。

eric zakariasson: the most used skill internally at cursor right now /thermo-nuclear-code-quality-review - deletes complexity instead of m...

智能体教程/实践编码
08:08
宝玉@dotey
42
Cursor 的手机版马上也要出了

Michael Truell: @jonathan_wilke @cursor_ai Soon!

产品更新编码
07:12
Berryxia.AI@berryxia
70
最近X 开始支持和拥抱各种生态,从小龙虾、Hermes 再到直接工具类的OpenCode 。 如今你可以直接在OpenCode中使用Grok 或者X Premium 的订阅z

OpenCode: OpenCode can now officially be used with your Grok or X Premium subscriptions Try it with the new Grok Build model

MCP/工具xAI产品更新编码
07:12
Berryxia.AI@berryxia
66
Codex新增应用截图抓取与长期目标执行功能

Codex近期推出Appshots功能,用户可在Mac上双击Command键,快速将当前应用窗口的截图与文字内容(包括屏幕外部分)投喂给AI。同时上线的/goal模式支持用户设定明确任务目标(如跑通功能、编写测试),AI可自主跨时执行,允许用户随时查看进度或调整方向。这些更新凸显了AI Agent的自主能力,但目前Mac端体验最佳,Windows用户仍在等待基础远程控制与功能同步。

OpenAI Developers: It's Codex Thursday, and yes, we have updates for you. First up: Appshots, a new way to bring the context of what you're...

智能体OpenAI产品更新编码
05:38
小互@xiaohu
61
Codex 推出 Locked Use(锁屏使用)功能

Codex 新增“锁屏使用”功能,允许用户在 Mac 锁屏状态下,通过手机远程下发指令,让电脑继续执行任务。该功能基于苹果官方授权机制临时解锁,操作全程屏幕保持黑屏以保护隐私,并具备四层安全设计,如短时授权、检测到本地操作即刻重锁,确保了远程操作的安全性与便利性。

产品更新端侧编码
05:05
🚨 AI News | TestingCatalog@testingcatalog
71
OpenAI宣布Codex在macOS平台推出重要更新,核心功能为"Appshots"。该功能允许用户通过快捷键快速将任何应用窗口的完整上下文(包括屏幕截图与可访问文本)附加至Codex对话线程,从而为AI提供更全面的工作背景信息。此外,本次更新还包括浏览器端的新版注释编辑器、默认启用的/goal命令,以及现已支持分享的插件功能。Appshots已向所有Mac端用户开放。

OpenAI Developers: It's Codex Thursday, and yes, we have updates for you. First up: Appshots, a new way to bring the context of what you're...

OpenAI产品更新多模态编码
04:38
宝玉@dotey
67
OpenAI Codex 更新:强化协作与自主执行能力

OpenAI 近日对 Codex 进行了一系列重要更新,旨在提升团队协作效率并降低开发门槛。核心功能包括:通过快捷键快速发送当前窗口上下文至 Codex,解决工作流中断问题;桌面版正式推出/goal 模式,支持长时间自主执行复杂任务;新增高级标注模式,方便设计师在页面预览中直接调整与批注;企业用户现可共享自定义插件,并通过升级的 Analytics 面板查看细粒度使用数据。这些更新标志着 Codex 正从个人编程助手向更强大的团队协作平台演进。

OpenAI Developers: It's Codex Thursday, and yes, we have updates for you. First up: Appshots, a new way to bring the context of what you're...

OpenAI产品更新编码
04:38
宝玉@dotey
64
OpenAI Codex 重大更新:推出多项协作新功能

OpenAI 为编程助手 Codex 推出一系列重要更新,旨在降低参与门槛并提升团队协作效率。主要更新包括:“Appshots”功能,用户可通过快捷键将当前应用窗口的截图与文本内容(含屏幕外部分)直接发送至 Codex;桌面版正式支持“/goal”模式,允许 Codex 自主执行跨时长的复杂任务;新增高级标注模式,设计师可在预览中直接拖拽调整元素并提交修改。此外,Business 用户现可共享自定义插件,Analytics 面板也升级了细粒度数据监控。这些举措标志着 Codex 正从个人编程助手向团队协作平台演进。

OpenAI Developers: It's Codex Thursday, and yes, we have updates for you. First up: Appshots, a new way to bring the context of what you're...

智能体OpenAI产品更新编码
04:38
Sam Altman@sama
精选73
新版Codex今日发布! 【引用 @OpenAIDevs】:今天是Codex周四,我们带来了更新。 首先是Appshots,一种将你正在处理的应用上下文带入Codex的新方式。 在Mac上,按Command-Command键即可将应用窗口附加到Codex线程。Codex会获取窗口的截图和文本,包括屏幕上不可见的内容。 Appshots已在Mac的所有套餐中可用,企业版访问权限即将推出。

OpenAI Developers: It's Codex Thursday, and yes, we have updates for you. First up: Appshots, a new way to bring the context of what you're...

智能体OpenAI产品更新编码

推荐理由:Codex 这次更新的 Appshots 看似一个小功能,但把应用窗口上下文直接喂给 Agent 的思路是质的跳跃,Mac 开发者现在就能用,这个交互范式可能会被抄很久。
04:36
swyx🛬 SFO@swyx
51
正在开发一项技能,用于将"Vibe编码的粗糙应用"转化为"生产就绪、端到端测试、可维护、可并行化的智能体代码库"。 这个过程昨天运行了约16小时,共产生103次提交,最终得到了完全相同的应用程序--但不再是脆弱的MVP,而是一个可以长期构建的代码库。
智能体教程/实践编码
04:08
小互@xiaohu
58
Codex新功能Appshots:一键共享工作界面给AI

OpenAI为Codex推出Appshots功能,用户可通过快捷键(连续按两次Command键)将当前操作窗口的完整上下文分享给AI。该功能不仅传输屏幕截图,还能提取窗口内的文本内容及未显示的隐藏信息,例如完整代码结构、设计稿内容或控制台报错等。这免去了开发者、设计师手动复制粘贴代码与截图的繁琐流程,实现了工作界面的直接共享。

OpenAI产品更新编码
04:02
Greg Brockman@gdb
68
OpenAI为Codex应用推出"Appshots"新功能,用户可通过快捷键(如Mac的Command-Command)将当前应用窗口的截图与文本内容直接附加到对话中,从而为AI提供更全面的上下文信息,包括屏幕外内容。该功能现已在Mac端全套餐开放,企业版访问权限也将很快推出。此外,Codex还新增了面向企业和商业场景的功能,如token使用分析和插件共享,以增强协作与数据分析能力。

OpenAI Developers: It's Codex Thursday, and yes, we have updates for you. First up: Appshots, a new way to bring the context of what you're...

OpenAI产品更新多模态编码
03:26
Rohan Paul@rohanpaul_ai
62
阿里云的 Qwen 3.7 Max 在编码与智能体(Agent)能力上已非常接近前沿模型,并现已在 AI/ML API 平台上线。根据 Artificial Analysis 的评测,其智能体可靠性排名第五,性能与 GPT 5.4 (xhigh) 相当,并略高于新发布的 Gemini 3.5 Flash。AI/ML API 将其定位为面向智能体时代的模型,突出其能支持超过35小时的自主执行,并兼容 Claude Code 等工具。平台还提供了包括 GPQA Diamond(92.4分)在内的基准测试成绩,并为用户提供免费试用码。

AI/ML API: Qwen3.7-Max on AI/ML API - built for the agent era GPQA Diamond (92.4), HMMT (97.1), Apex (44.5) Sustains 35+ hours of a...

智能体大佬观点编码
02:35
OpenCode@opencode
75
OpenCode现已正式支持您的Grok或X Premium订阅 尝试使用全新的Grok Build模型 https://x.ai/news/grok-opencode

xAI: You can now use your @grok or X Premium subscription in @opencode. Use the model powering Grok Build for high speed and ...

xAI产品更新编码
关联讨论 1 条xAI:News(网页)
02:33
OpenAI Developers@OpenAIDevs
64
又是Codex周四,我们带来了更新。 首先是Appshots,一种将你工作上下文引入Codex的新方式。 在Mac上,按Command-Command即可将应用窗口附加到Codex线程。Codex会获取窗口的截图和文本,包括屏幕上不可见的内容。 Appshots已在Mac各计划中推出,企业版访问权限即将上线。
OpenAI产品更新编码
02:13
Alibaba Cloud@alibaba_cloud
75
Qwen3.7-Max已在@OpenRouter上线 https://x.com/OpenRouter/status/2057500097206976983?s=20

OpenRouter: The new Qwen3.7-Max from @Alibaba_Qwen is live on OpenRouter. The flagship of the Qwen3.7 series, built for agent-centri...

智能体模型发布编码
关联讨论 8 条公众号:通义实验室(千问)X:通义千问 / Qwen (@Alibaba_Qwen)X:阿里云 / Alibaba Cloud (@alibaba_cloud)X:X.PIN (@thexpin)X:Rohan Paul (@rohanpaul_ai)Qwen:Blog Retrieval(API)Hacker News 热门(buzzing.cc 中文翻译)IT之家(RSS)
02:11
AYi@AYi_AInotes
72
Claude Code推出用量追踪功能

Claude Code上线了/usage指令,实现token消耗的精细化归因。该功能可展示每个Skill、子代理及MCP的用量占比,并能追踪由下游操作触发的消耗源头。支持按天/周筛选历史数据,CLI端已可使用,桌面端即将跟进。这一更新使用户能从模糊感知转向精确掌握AI工作流的具体成本构成。

Boris Cherny: In the next version of Claude Code: run /usage to see a breakdown of which Skills, Agents, MCPs, and Plugins are using y...

AnthropicMCP/工具产品更新编码
02:08
xAI@xai
66
您现在可以在 @opencode 中使用您的 @grok 或 X Premium 订阅。 使用驱动 Grok Build 的模型,享受高速与代码库智能。 https://x.ai/news/grok-opencode
xAI产品更新编码
关联讨论 1 条xAI:News(网页)
00:37
宝玉@dotey
70
Claude Code 专门升级了 /usage ,可以看到 Token 到底花在哪里了 👍

Boris Cherny: In the next version of Claude Code: run /usage to see a breakdown of which Skills, Agents, MCPs, and Plugins are using y...

AnthropicMCP/工具产品更新编码
‹ 上一页
1…2728293031…50
下一页 ›