10h 45m was codex picking the 5.5 party guests codex > settings > profile
10h 45m was codex picking the 5.5 party guests codex > settings > profile
tokens
grok-build-0.1 is now available via the xAI API in public beta. This is the same model that powers the Grok Build CLI an...
关联讨论 4 条X:xAI (@xai)X:Elon Musk (@elonmusk, xAI)X:阿易 AI Notes (@AYi_AInotes)xAI:News(网页)If you ever get tired of managing your Codex threads, just let Codex manage itself! Codex can now create threads, search...
If you ever get tired of managing your Codex threads, just let Codex manage itself! Codex can now create threads, search...
did you wish codex ask__user_question tool was available outside of plan mode
针对后续UI改动可能导致Claude Design与实际代码不一致的问题,分享的实践方法是:始终将Claude Design作为唯一设计源,并在更新时生成changelog供Claude Code同步。遵循先修改设计再改代码的原则,若临时修改了代码,事后也应同步回Claude Design。
@dotey 这里有一个小问题,后续ui 改动怎们办?先改 claude design,有时候小改动直接改code,但是这样时间长了 design 和 code就 不一致了
Windows users, this one's for you. Computer use now works on Windows, so Codex can take action on your Windows computer....
关联讨论 4 条X:OpenAI Developers (@OpenAIDevs)IT之家(RSS)X:OpenAI (@OpenAI)X:Berry Xia (@berryxia)Windows users, this one's for you. Computer use now works on Windows, so Codex can take action on your Windows computer....
I gave the same Go MMRPG backend spec to two coding agents and then asked Claude to judge the performance. CC (with Sonn...
The scariest bug from a coding agent isn't the one that crashes. It's the one that runs cleanly, passes tests, and quiet...
一位开发者分享了借助AI开发Mac应用的四点经验:建议优先使用AppKit而非SwiftUI,因后者界面较弱,而AI已弥补了AppKit开发复杂度高的短板;推荐在编码前先用Claude Design打磨UI与UX;指出Opus模型生成的UI优于GPT-5.5;并提到Codex提供了一个名为“Build macOS Apps”的官方插件可供使用。
今天想到一点,我是否可以去做 mac app? 理由如下 - 会 objective-c/swift 我是国内比较早进入 iOS 开发的那批人 - 正好有个 idea - 正好有 claude code ,以前总觉得 appkit 很难用,...
More musings after some people got upset about the word clanker. https://lucumr.pocoo.org/2026/5/26/clankers/
While the Linux Kernel is quickly becoming "Vibe Coded", many other Open Source projects are outright banning all AI / L...
If you update to the latest ChatGPT iOS app version we have a few cool new things for Codex Mobile, including /side to a...
grok build is available in cursor, try it out!
本文探讨了使用AI的两种核心路径:以Claude Code、Codex为代表的AI智能体型工具,可自主执行任务;以及以Cursor为代表的实习生型工具,需用户监督判断,后者是磨练判断力(以术入道)的关键。但Cursor依赖本地运行,限制了使用场景。作者通过UU远程(网易出品,免费)解决了这一问题,其手机端可实现4K 144帧低延迟连接,并原生支持完整终端,方便在移动端操作Cursor,实现了与AI实习生的随时连接。核心观点是AI工具的尽头是磨练我们成为值得被认真回答的提问者。
Cursor发布开发者报告,基于全球最全面的AI编程数据集指出:头部AI用户的代码产出、token消耗和PR合并量远高于中位数且差距持续扩大。报告关键发现是AI在生成代码前“阅读”(理解上下文)的成本急剧上升,input/output token ratio显著增加,表明真正的成本在于理解代码库与任务。这凸显了上下文缓存、增量理解和长期记忆等技术将成为未来智能体的核心竞争力。此外,AI自主性提高,手动确认减少,更多改动直接进入代码流程;同时PR规模变大,对代码审查和测试要求更高。
Introducing the Cursor Developer Habits Report. We're sharing some of our findings on how software development is changi...
推文作者全天遭遇网络代理(🪜)问题,导致Codex连接失败。他使用Cursor分析代理设置,Cursor在几分钟内分析了代理实现、执行测试并修复了代理方式,随后亲自调用CLI测试Codex以确认修复。为预防未来问题,Cursor还集成了用户此前提供的DeepSeek API密钥,创建了一键切换至DeepSeek的选项,确保了服务可用性。
Anthropic发布Claude Opus 4.8,距上代4.7发布仅42天。价格($5/M输入、$25/M输出)与参数均不变。模型在多数基准跑分有所提升,但Terminal-Bench 2.1仍是唯一未超越GPT-5.5的类别。此次更新将思考强度(effort)控制开放给所有用户。核心变化是模型变得更精确、更遵循指令,代码瑕疵概率比上代低约4倍,且在防“偷懒”测试中达到0%不良率。然而,这带来了主动性降低的副作用,模型不再主动推测用户隐含需求。此外,其内容创作能力虽优于4.7,但被认为仍不及4.6版本。同时,快速模式(fast mode)升级,速度达标准版2.5倍,价格从标准版6倍降至2倍。Claude Code还推出了可并行调用数十至上百个子Agent的动态工作流功能。
Claude Code 近期推出实验性动态工作流(Dynamic Workflows)功能。该功能延续并发子代理(Subagent)逻辑,可启动数百个子代理,用于处理代码库调研、生成大型报告等大规模任务。官方定位是加速处理基础但工作量巨大的任务,而非直接修改代码。触发方式有两种:在提示词中使用“workflow”一词,或启动 Ultra Code 模式(该模式仅当前对话生效)。
New in Claude Code (research preview): dynamic workflows. Claude writes an orchestration script on the fly, then spins u...
Anthropic 旗舰模型 Claude Opus 4.8 现已在 ZenMux 平台提供免费体验。实测中,该模型根据提示词一次生成可运行的 HTML 网页,仅用 Three.js 内置几何体纯手搓出一架包含后掠机翼、四台发动机、可收放起落架等复杂结构的高细节波音 747-400,比例精准、效果惊艳。模型在 SWE-bench、Terminal-Bench、Agentic Coding 等多项榜单排名第一,代码与多模态理解能力较上一代有显著提升。ZenMux 平台以 ZeroDelay 方式首发新模型,并提供限时免费额度。
Anthropic发布Claude Opus 4.8,其复杂空间推理与代码生成能力受到关注。有用户使用其测试生成一架高细节波音747-400的Three.js模型,要求仅使用内置几何体,生成完整的单文件HTML。Claude Opus 4.8一次生成了可运行代码,模型具有后掠机翼约35度、四发动机、可收放起落架等细节,比例严谨。ZenMux平台现已支持该模型的API调用与免费体验。据称,Claude Opus 4.8在SWE-bench、Terminal-Bench、Agentic Coding等榜单排名第一。
兄弟们! 现在已经可以在 ZenMux 上免费体验 Claude Opus 4.8 了! 我第一时间用它跑了那个Hugging Face大佬M 硬核的「Three.js 纯图元造飞机测试」,要求只用内置几何体(Box、Cylinder、Co...
Introducing Claude Opus 4.8: it builds on Opus 4.7 with sharper judgment, more honesty about its own progress, and the a...
报告显示,AI正深刻改变开发工作形态。开发者周均代码产出从约3.6K行增至8.6K行,更大规模的PR(千行以上)占比上升。AI智能体在单次会话中的工具调用数增加约30%,正在处理更复杂的任务。同时,被接受的AI代码在60分钟后的留存率从约76%提升至约81%,表明更多AI生成内容进入了实际代码库。这些趋势共同指向AI已从个人辅助工具,演进为推动开发向更大规模任务与自动化基础设施发展的核心力量。
Introducing the Cursor Developer Habits Report. We're sharing some of our findings on how software development is changi...
AI编程系统中,人类开发者的注意力是不可并行的稀缺资源。智能体可并行工作,但其结果必须由人审查、判断和决策,这一过程无法并行,被称为“编排成本”,类比于Python的GIL。盲目增加智能体数量不会提升最终质量,反而因大量上下文切换增加审查负担。成熟的AI编程能力在于合理分配注意力:按自身审查能力控制智能体数量,将深度思考时间留给最关键的架构与决策环节。
http://x.com/i/article/2059839454370828288
Claude Opus 4.8 is LIVE on AIMLAPI - Hour 0 availability! ~4x less likely to let code flaws slip through vs 4.7 Fast mod...