5月23日

04:05

Artificial Analysis@ArtificialAnlys

基准测试显示，Cursor Composer 2.5在编程任务中展现出卓越的成本与效率优势。其单任务成本仅为Claude Opus 4.7的1/3至1/18，更是GPT-5.5的1/5至1/32。这一低成本源于其极高的token使用效率：完成全部测试仅消耗1.6M token，远低于同类模型的5.7M。效率方面，其平均任务完成时间约9分钟，比行业平均水平快约1.3倍，其快速版本更可将时间缩短至约7分钟。

智能体编码评测/基准

03:49

小互@xiaohu

一种轻量化的Codex远程服务器配置方案。无需安装完整版应用，仅需在远程服务器上安装并运行CLI版Codex。执行`codex remote-control`命令后，手机端ChatGPT应用内的Codex功能即可发现并连接该服务器，远程体验与完整版无异。两种配置在应用内通过不同图标（"终端"与"电脑"）进行区分。

Oasis Feng: 其实远程服务器上并不需要安装一个完整版的 Codex app,只需要安装 CLI 版的 Codex,并运行: codex remote-control 这样手机上 ChatGPT 应用里的 Codex 就会显示出一个有「终端」图标的服务器名...

智能体 OpenAI 教程/实践编码

01:44

swyx@swyx

精选78

Kakuna：自动化加固代码库的AI代理工具

Kakuna是一款AI代理工具，旨在将早期快速原型自动转化为可维护的生产级代码库。它通过内置的检查清单和“计划-目标”工作流，模拟人类开发与运维流程，在保持功能不变的前提下，自动执行代码审查、测试补充、重构等“无聊”工作，并强调子代理并行以提升效率。该工具是为“人类与代理协作”而设计的范例，其核心是“反熵增”与“反代码腐化”。例如，一次约16小时的运行能生成上百次提交，将一个脆弱的MVP转变为一个结构清晰、可长期构建的稳定项目。

swyx: working on a "take this vibecoded slop app and make it a production-ready, e2e tested, maintainable, parallelizable agen...

教程/实践编码部署/工程

推荐理由：如果你还在为 vibe coding 产出的屎山头疼，swyx 这个 skill 刚开源，16 小时自动重构 103 次提交交付一个可维护的代码库，做独立开发的很值得抄一下。

01:37

Boris Cherny@bcherny

推文介绍了一个名为"zero2claude"的免费课程，旨在帮助完全没有编程或终端使用经验的用户系统学习并掌握Claude Code。课程内容从零基础逐步深入至高级应用，目前已吸引超过1.7万名学生，并提供7种语言版本。值得注意的是，整个教学平台完全由一人借助Claude Code独立构建和运营，其出色的性能表现（如高访问量与极低错误率）验证了Claude Code开发生产级产品的能力。推广者强调，扩大AI应用的关键在于赋能用户提升技能，而非简化工具本身，因此该课程不设任何付费门槛，完全免费向社区开放。

itay shmool 🇮🇱: I built "zero2claude", a free course that takes people from zero terminal experience to shipping with Claude Code. The c...

Anthropic 教程/实践编码

01:15

Google AI@GoogleAI

同事件精选70

谷歌I/O大会发布AI代理全套开发工具链

谷歌在I/O开发者大会宣布，系统性构建面向AI代理（Agent）的开发与部署工具链。核心更新包括：独立桌面应用Antigravity 2.0及其命令行工具、SDK面世；Google AI Studio新增Kotlin支持，可一键开发安卓应用并发布，同时推出移动端App。此外，Gemini API推出托管代理服务，实现一键部署；WebMCP作为开放标准在Chrome 149中推出，允许网页向代理暴露工具；Chrome DevTools也开放给AI代理以自动化调试。企业级客户可直接连接Google Cloud项目，而DeepMind的科学技能包则加速特定领域研究。此举标志着谷歌正全面打造从开发、接口到部署的完整AI代理生态系统。

智能体 Google 产品更新编码

同一事件，精选展示《Gemini 3.5：具备行动能力的前沿智能》

推荐理由：Google把今年I/O的Agent相关更新打包放出，Antigravity 2.0从IDE变桌面应用、AI Studio能直接做Android App，对Google生态开发者是必读速览。

01:05

SemiAnalysis@SemiAnalysis_

精选82

智能体工作负载正在悄然重塑推理经济学。我们从SemiAnalysis的43.2万个真实编码智能体请求中提取数据，发现中位数并非3.2万或6.4万，而是9.6万输入token。作为参考，这意味着在你输入问题之前，模型已处理了超过《了不起的盖茨比》全文长度的文本。（1/3）🧵

智能体推理现象/趋势编码

推荐理由：SemiAnalysis 用 43 万次真实编码请求数据揭开了 Agent 推理经济学的真面目，中位输入 9.6 万 token 这个数字足够反直觉，所有做推理服务和模型定价的人都得重新算了。

00:07

Replit ⠕@Replit

保护你的Vibe-Coded应用 + 连接器新动态 https://x.com/i/broadcasts/1qKVmQdjnmpxB

产品更新安全/对齐编码

00:07

Replit ⠕@Replit

大多数氛围编码应用会忘记每个打开它们的用户。用一条提示让 Replit Agent 修复它！💻 今天就尝试为你的应用添加认证功能吧！

智能体产品更新编码

5月22日

20:35

Greg Brockman@gdb

OpenAI的Codex应用推出了名为Appshots的新功能。用户通过同时按下两个CMD键，即可将当前应用的完整上下文（包括可见与不可见的屏幕内容）发送给Codex，远超普通截图所能提供的信息。与此同时，OpenAI更新了远程Codex，使其在笔记本电脑锁屏状态下仍可正常运行，允许用户安全地将笔记本留在家中，通过手机进行远程编码。该应用集成了多项独特功能，提升了使用体验。

Anthony Kroeger: Codex just launched one of the coolest features - Appshots. by pressing both CMD keyboard buttons, context of whatever a...

OpenAI 产品更新多模态编码

20:16

AYi@AYi_AInotes

精选76

Karpathy的CLAUDE.md四条规则让AI编程准确率飙升至94%

Karpathy发布的CLAUDE.md文件以其简洁高效的AI编程指导原则引爆GitHub，获得超22万星标并登顶趋势榜。该文件仅含65行、4条核心规则，却能将AI编程的准确率从65%显著提升至94%。其核心在于强制开发者“慢下来”，将深度思考、追求简洁、精准修改和目标驱动等原则变为硬性编码准则，旨在对抗开发者习惯性“先写再说”的本能。目前大多数开发者尚未深入研读这一备受关注的效率指南。

self.dll: karpathy's CLAUDE.md hit #1 on github trending. 220,000 stars. most devs still haven't read it. it's 65 lines. it took A...

开源生态教程/实践编码

推荐理由：Karpathy 这 65 行不是新模型，是给 AI 编程装了道刹车，先想清楚再动手这条反直觉规则把准确率从 65 拉到 94，所有用 Cursor 的都该立刻抄一份。

18:50

Alibaba Cloud@alibaba_cloud

Qwen3.7-Max现已登陆Model Studio，限时五折（5月22日至6月22日）！旗舰级编程智能体性能。专为可靠、多步骤的软件执行而设计，最大限度减少人工干预。 🚀 立即体验：https://int.alibabacloud.com/m/1000413314/

智能体模型发布编码

关联讨论 8 条

18:19

Qwen@Alibaba_Qwen

⚡️⚡️ 【引用 @OpenRouter】：来自 @Alibaba_Qwen 的全新 Qwen3.7-Max 已在 OpenRouter 上线。作为 Qwen3.7 系列的旗舰模型，专为以智能体为中心的工作而构建：编程、办公与生产力任务，以及长周期自主执行。在编程和智能体基准测试中较 Qwen3.6 有显著提升，并支持显式的提示缓存以处理重复上下文。

OpenRouter: The new Qwen3.7-Max from @Alibaba_Qwen is live on OpenRouter. The flagship of the Qwen3.7 series, built for agent-centri...

智能体模型发布编码

关联讨论 8 条

16:16

Emad@EMostaque

对于增长如此迅速的公司，20倍销售额的收购价对@SpaceX来说非常划算考虑到@SpaceX上市时估值可能超过50倍销售额，这笔交易将立即增厚其收益

Techmeme: Source: Cursor reached $3B in annualized revenue in late April and now has 3,000+ customers paying at least $100K each f...

编码行业动态

15:56

Rohan Paul@rohanpaul_ai

Cursor年销售额达30亿美元，或被SpaceX以600亿美元收购

据彭博社报道，AI编程软件Cursor年销售额已突破30亿美元，并正与SpaceX洽谈一项约600亿美元的收购交易。这笔交易的战略意义远超财务投资：对于正准备启动史上最大规模IPO之一的SpaceX而言，收购Cursor能将其对AI算力的巨额投资故事变得完整。它向投资者证明，SpaceX不仅能建设算力，更能将其转化为面向企业开发者的软件产品和收入流，这与其从航天承包商转型为“平台公司”的IPO叙事高度契合。交易结构特殊，包含高达10亿美元的潜在分手费，显示了双方的严肃态度。

Rohan Paul: SpaceX just filed for a Nasdaq IPO under SPCX that could turn Elon Musk's SpaceX stake into the first $1T personal fortu...

编码行业动态

15:46

meng shao@shao__meng

VSCode Agent-First Development五大支柱解析

VSCode团队提出Agent-First Development框架，核心理念是开发主体从“人+编辑器”转向“人+Agent+编辑器”，人的角色转变为选择模型、提供上下文、定义意图和设定边界。五大支柱为：模型（匹配任务深度，按需选择思考档位）、执行边界（从问答到自主规划的渐进信任模式）、上下文（显式提供关键信息以避免错误）、提示（需清晰包含目标、范围与约束）与工具（能力需可控、可审计）。该框架旨在系统化指导人与AI代理高效协作开发。

Microsoft Developer: The @code team released a new Introduction to Agent-First Development series. It breaks down these 5 pillars behind grea...

智能体 Microsoft 教程/实践编码

15:14

AYi@AYi_AInotes

8套价值上万的神级Prompt模板开源分享

本次分享开源了8套被称作“神级”的Prompt模板，宣称总价值超过万元。这些模板覆盖了工作、生活、学习、副业等多领域场景，包括KERNEL-X、AI工作流专家、深度研究等具体系统，旨在帮助用户提升效率、解决实际问题，实现从焦虑到豁然开朗的状态转变。

AYi: http://x.com/i/article/2057300084354670592

智能体教程/实践编码

14:05

Greg Brockman@gdb

试图回忆在Codex出现之前编程是什么感觉

OpenAI 大佬观点编码

12:30

歸藏(guizang.ai)@op7418

Codex 昨晚发布史诗级更新，体验爆炸提升！

Codex发布重要更新，核心提升在于上下文获取与任务自动化。新推出的“Appshots”功能，通过同时按住左右Command键，即可截取当前窗口并将屏幕内外的可见与不可见文本一并自动填入对话，极大简化背景提供流程。已正式上线的“/goal”功能支持设定长期目标，Codex可持续自主执行数小时至数天，且允许中途调整与暂停。此外，应用内浏览器速度提升，并新增可直接编辑页面元素的高级注释模式。团队版本则新增了批量安装插件的功能，提升了协作效率。

OpenAI Developers: It's Codex Thursday, and yes, we have updates for you. First up: Appshots, a new way to bring the context of what you're...

智能体 OpenAI 产品更新编码

12:13

宝玉@dotey

精选76

OpenAI Codex /goal功能正式发布及使用指南

OpenAI宣布Codex的/goal模式已结束实验，成为稳定功能。用户可在Codex应用、IDE扩展或CLI中使用，通过设定具体里程碑，让AI持续工作直至完成，任务可运行数小时甚至数天。过程中支持随时检查、调整方向及暂停。使用前需升级应用并启用该功能（可通过命令行指令或手动修改配置文件实现）。开启后，可在输入框管理任务，并利用侧边对话查看进度而不中断主任务。该功能旨在高效处理各类复杂任务。

OpenAI Developers: 🥅 /goal has graduated from an experiment-for tasks big and small, Codex gets your work done. Use goal mode in the Codex...

智能体 OpenAI 教程/实践编码

推荐理由：Codex的goal模式从实验毕业，意味着你可以真的放手让AI去跑长时间任务，做开发的不用再守在电脑前，这是agent落地的真信号。

10:43

宝玉@dotey

微软内部收回Claude Code权限，力推自家Copilot CLI

微软已开始大规模收回内部员工对Anthropic公司Claude Code工具的访问权限，要求开发者转向自家的GitHub Copilot CLI。尽管Claude Code在微软内部广受欢迎，但其成功反而凸显了自家Copilot CLI的定位尴尬。微软以统一工具链为由推动此次迁移，但核心考量也包括将支付给竞争对手Anthropic的成本收回。此举已引发被要求迁移工程师的普遍抵触。

Microsoft 产品更新编码行业动态

09:08

Elon Musk@elonmusk

Grok Build发布0.1.214版本，修复多项功能与界面问题。此次更新重点推出X搜索功能并大幅提升网页搜索速度（计划于当日完成），同时解决了Windows平台powershell下的渲染错误、模态框按键冲突、非vim模式提示显示等操作体验问题。此外，版本还优化了链接点击交互、会话筛选逻辑，并增强了对插件更新、MCP服务器令牌过期等场景的稳定性支持。更新说明可通过终端界面查看。

skcd: Bug fixes shipping to Grok Build (release notes will be available in the TUI) 0.1.214 - Rolling out X search and a much ...

xAI 产品更新编码

08:42

meng shao@shao__meng

一起看看 Cursor 团队内部最常用的 Skills

Cursor 团队内部广泛使用的代码审查技能“thermo-nuclear-code-quality-review”，其核心目标是在代码合并前，拦截那些“能运行但会使代码库变糟”的提交。它基于四条硬性原则：强制实现复杂度净简化而非转移、限制单文件不超过1000行、标记无用的封装与散落的逻辑、坚持维护性与功能同等重要。该技能采用父子Agent两阶段协作机制：父Agent并行收集结构化差异与文件内容，再交由审计Agent进行单次、聚焦的严格评判。即使插件未安装，也会触发一套对齐上述原则的可维护性降级审计。

eric zakariasson: the most used skill internally at cursor right now /thermo-nuclear-code-quality-review - deletes complexity instead of m...

智能体教程/实践编码