基准测试显示,Cursor Composer 2.5在编程任务中展现出卓越的成本与效率优势。其单任务成本仅为Claude Opus 4.7的1/3至1/18,更是GPT-5.5的1/5至1/32。这一低成本源于其极高的token使用效率:完成全部测试仅消耗1.6M token,远低于同类模型的5.7M。效率方面,其平均任务完成时间约9分钟,比行业平均水平快约1.3倍,其快速版本更可将时间缩短至约7分钟。
基准测试显示,Cursor Composer 2.5在编程任务中展现出卓越的成本与效率优势。其单任务成本仅为Claude Opus 4.7的1/3至1/18,更是GPT-5.5的1/5至1/32。这一低成本源于其极高的token使用效率:完成全部测试仅消耗1.6M token,远低于同类模型的5.7M。效率方面,其平均任务完成时间约9分钟,比行业平均水平快约1.3倍,其快速版本更可将时间缩短至约7分钟。
其实远程服务器上并不需要安装一个完整版的 Codex app,只需要安装 CLI 版的 Codex,并运行: codex remote-control 这样手机上 ChatGPT 应用里的 Codex 就会显示出一个有「终端」图标的服务器名...
Kakuna是一款AI代理工具,旨在将早期快速原型自动转化为可维护的生产级代码库。它通过内置的检查清单和“计划-目标”工作流,模拟人类开发与运维流程,在保持功能不变的前提下,自动执行代码审查、测试补充、重构等“无聊”工作,并强调子代理并行以提升效率。该工具是为“人类与代理协作”而设计的范例,其核心是“反熵增”与“反代码腐化”。例如,一次约16小时的运行能生成上百次提交,将一个脆弱的MVP转变为一个结构清晰、可长期构建的稳定项目。
working on a "take this vibecoded slop app and make it a production-ready, e2e tested, maintainable, parallelizable agen...
I built "zero2claude", a free course that takes people from zero terminal experience to shipping with Claude Code. The c...
谷歌在I/O开发者大会宣布,系统性构建面向AI代理(Agent)的开发与部署工具链。核心更新包括:独立桌面应用Antigravity 2.0及其命令行工具、SDK面世;Google AI Studio新增Kotlin支持,可一键开发安卓应用并发布,同时推出移动端App。此外,Gemini API推出托管代理服务,实现一键部署;WebMCP作为开放标准在Chrome 149中推出,允许网页向代理暴露工具;Chrome DevTools也开放给AI代理以自动化调试。企业级客户可直接连接Google Cloud项目,而DeepMind的科学技能包则加速特定领域研究。此举标志着谷歌正全面打造从开发、接口到部署的完整AI代理生态系统。
同一事件,精选展示《Gemini 3.5:具备行动能力的前沿智能》Codex just launched one of the coolest features - Appshots. by pressing both CMD keyboard buttons, context of whatever a...
Karpathy发布的CLAUDE.md文件以其简洁高效的AI编程指导原则引爆GitHub,获得超22万星标并登顶趋势榜。该文件仅含65行、4条核心规则,却能将AI编程的准确率从65%显著提升至94%。其核心在于强制开发者“慢下来”,将深度思考、追求简洁、精准修改和目标驱动等原则变为硬性编码准则,旨在对抗开发者习惯性“先写再说”的本能。目前大多数开发者尚未深入研读这一备受关注的效率指南。
karpathy's CLAUDE.md hit #1 on github trending. 220,000 stars. most devs still haven't read it. it's 65 lines. it took A...
The new Qwen3.7-Max from @Alibaba_Qwen is live on OpenRouter. The flagship of the Qwen3.7 series, built for agent-centri...
关联讨论 8 条公众号:通义实验室(千问)X:通义千问 / Qwen (@Alibaba_Qwen)X:阿里云 / Alibaba Cloud (@alibaba_cloud)X:X.PIN (@thexpin)X:Rohan Paul (@rohanpaul_ai)Qwen:Blog Retrieval(API)Hacker News 热门(buzzing.cc 中文翻译)IT之家(RSS)Source: Cursor reached $3B in annualized revenue in late April and now has 3,000+ customers paying at least $100K each f...
据彭博社报道,AI编程软件Cursor年销售额已突破30亿美元,并正与SpaceX洽谈一项约600亿美元的收购交易。这笔交易的战略意义远超财务投资:对于正准备启动史上最大规模IPO之一的SpaceX而言,收购Cursor能将其对AI算力的巨额投资故事变得完整。它向投资者证明,SpaceX不仅能建设算力,更能将其转化为面向企业开发者的软件产品和收入流,这与其从航天承包商转型为“平台公司”的IPO叙事高度契合。交易结构特殊,包含高达10亿美元的潜在分手费,显示了双方的严肃态度。
SpaceX just filed for a Nasdaq IPO under SPCX that could turn Elon Musk's SpaceX stake into the first $1T personal fortu...
VSCode团队提出Agent-First Development框架,核心理念是开发主体从“人+编辑器”转向“人+Agent+编辑器”,人的角色转变为选择模型、提供上下文、定义意图和设定边界。五大支柱为:模型(匹配任务深度,按需选择思考档位)、执行边界(从问答到自主规划的渐进信任模式)、上下文(显式提供关键信息以避免错误)、提示(需清晰包含目标、范围与约束)与工具(能力需可控、可审计)。该框架旨在系统化指导人与AI代理高效协作开发。
The @code team released a new Introduction to Agent-First Development series. It breaks down these 5 pillars behind grea...
本次分享开源了8套被称作“神级”的Prompt模板,宣称总价值超过万元。这些模板覆盖了工作、生活、学习、副业等多领域场景,包括KERNEL-X、AI工作流专家、深度研究等具体系统,旨在帮助用户提升效率、解决实际问题,实现从焦虑到豁然开朗的状态转变。
http://x.com/i/article/2057300084354670592
Codex发布重要更新,核心提升在于上下文获取与任务自动化。新推出的“Appshots”功能,通过同时按住左右Command键,即可截取当前窗口并将屏幕内外的可见与不可见文本一并自动填入对话,极大简化背景提供流程。已正式上线的“/goal”功能支持设定长期目标,Codex可持续自主执行数小时至数天,且允许中途调整与暂停。此外,应用内浏览器速度提升,并新增可直接编辑页面元素的高级注释模式。团队版本则新增了批量安装插件的功能,提升了协作效率。
It's Codex Thursday, and yes, we have updates for you. First up: Appshots, a new way to bring the context of what you're...
OpenAI宣布Codex的/goal模式已结束实验,成为稳定功能。用户可在Codex应用、IDE扩展或CLI中使用,通过设定具体里程碑,让AI持续工作直至完成,任务可运行数小时甚至数天。过程中支持随时检查、调整方向及暂停。使用前需升级应用并启用该功能(可通过命令行指令或手动修改配置文件实现)。开启后,可在输入框管理任务,并利用侧边对话查看进度而不中断主任务。该功能旨在高效处理各类复杂任务。
🥅 /goal has graduated from an experiment-for tasks big and small, Codex gets your work done. Use goal mode in the Codex...
微软已开始大规模收回内部员工对Anthropic公司Claude Code工具的访问权限,要求开发者转向自家的GitHub Copilot CLI。尽管Claude Code在微软内部广受欢迎,但其成功反而凸显了自家Copilot CLI的定位尴尬。微软以统一工具链为由推动此次迁移,但核心考量也包括将支付给竞争对手Anthropic的成本收回。此举已引发被要求迁移工程师的普遍抵触。
Bug fixes shipping to Grok Build (release notes will be available in the TUI) 0.1.214 - Rolling out X search and a much ...
Cursor 团队内部广泛使用的代码审查技能“thermo-nuclear-code-quality-review”,其核心目标是在代码合并前,拦截那些“能运行但会使代码库变糟”的提交。它基于四条硬性原则:强制实现复杂度净简化而非转移、限制单文件不超过1000行、标记无用的封装与散落的逻辑、坚持维护性与功能同等重要。该技能采用父子Agent两阶段协作机制:父Agent并行收集结构化差异与文件内容,再交由审计Agent进行单次、聚焦的严格评判。即使插件未安装,也会触发一套对齐上述原则的可维护性降级审计。
the most used skill internally at cursor right now /thermo-nuclear-code-quality-review - deletes complexity instead of m...
OpenCode can now officially be used with your Grok or X Premium subscriptions Try it with the new Grok Build model
Codex近期推出Appshots功能,用户可在Mac上双击Command键,快速将当前应用窗口的截图与文字内容(包括屏幕外部分)投喂给AI。同时上线的/goal模式支持用户设定明确任务目标(如跑通功能、编写测试),AI可自主跨时执行,允许用户随时查看进度或调整方向。这些更新凸显了AI Agent的自主能力,但目前Mac端体验最佳,Windows用户仍在等待基础远程控制与功能同步。
It's Codex Thursday, and yes, we have updates for you. First up: Appshots, a new way to bring the context of what you're...
Codex 新增“锁屏使用”功能,允许用户在 Mac 锁屏状态下,通过手机远程下发指令,让电脑继续执行任务。该功能基于苹果官方授权机制临时解锁,操作全程屏幕保持黑屏以保护隐私,并具备四层安全设计,如短时授权、检测到本地操作即刻重锁,确保了远程操作的安全性与便利性。
It's Codex Thursday, and yes, we have updates for you. First up: Appshots, a new way to bring the context of what you're...
OpenAI 近日对 Codex 进行了一系列重要更新,旨在提升团队协作效率并降低开发门槛。核心功能包括:通过快捷键快速发送当前窗口上下文至 Codex,解决工作流中断问题;桌面版正式推出/goal 模式,支持长时间自主执行复杂任务;新增高级标注模式,方便设计师在页面预览中直接调整与批注;企业用户现可共享自定义插件,并通过升级的 Analytics 面板查看细粒度使用数据。这些更新标志着 Codex 正从个人编程助手向更强大的团队协作平台演进。
It's Codex Thursday, and yes, we have updates for you. First up: Appshots, a new way to bring the context of what you're...
OpenAI 为编程助手 Codex 推出一系列重要更新,旨在降低参与门槛并提升团队协作效率。主要更新包括:“Appshots”功能,用户可通过快捷键将当前应用窗口的截图与文本内容(含屏幕外部分)直接发送至 Codex;桌面版正式支持“/goal”模式,允许 Codex 自主执行跨时长的复杂任务;新增高级标注模式,设计师可在预览中直接拖拽调整元素并提交修改。此外,Business 用户现可共享自定义插件,Analytics 面板也升级了细粒度数据监控。这些举措标志着 Codex 正从个人编程助手向团队协作平台演进。
It's Codex Thursday, and yes, we have updates for you. First up: Appshots, a new way to bring the context of what you're...
It's Codex Thursday, and yes, we have updates for you. First up: Appshots, a new way to bring the context of what you're...
OpenAI为Codex推出Appshots功能,用户可通过快捷键(连续按两次Command键)将当前操作窗口的完整上下文分享给AI。该功能不仅传输屏幕截图,还能提取窗口内的文本内容及未显示的隐藏信息,例如完整代码结构、设计稿内容或控制台报错等。这免去了开发者、设计师手动复制粘贴代码与截图的繁琐流程,实现了工作界面的直接共享。
It's Codex Thursday, and yes, we have updates for you. First up: Appshots, a new way to bring the context of what you're...
Qwen3.7-Max on AI/ML API - built for the agent era GPQA Diamond (92.4), HMMT (97.1), Apex (44.5) Sustains 35+ hours of a...
You can now use your @grok or X Premium subscription in @opencode. Use the model powering Grok Build for high speed and ...
关联讨论 1 条xAI:News(网页)The new Qwen3.7-Max from @Alibaba_Qwen is live on OpenRouter. The flagship of the Qwen3.7 series, built for agent-centri...
关联讨论 8 条公众号:通义实验室(千问)X:通义千问 / Qwen (@Alibaba_Qwen)X:阿里云 / Alibaba Cloud (@alibaba_cloud)X:X.PIN (@thexpin)X:Rohan Paul (@rohanpaul_ai)Qwen:Blog Retrieval(API)Hacker News 热门(buzzing.cc 中文翻译)IT之家(RSS)Claude Code上线了/usage指令,实现token消耗的精细化归因。该功能可展示每个Skill、子代理及MCP的用量占比,并能追踪由下游操作触发的消耗源头。支持按天/周筛选历史数据,CLI端已可使用,桌面端即将跟进。这一更新使用户能从模糊感知转向精确掌握AI工作流的具体成本构成。
In the next version of Claude Code: run /usage to see a breakdown of which Skills, Agents, MCPs, and Plugins are using y...
In the next version of Claude Code: run /usage to see a breakdown of which Skills, Agents, MCPs, and Plugins are using y...