MiniMax-M3 实测:前端适配 KCORES2026p2,空间理解、建模精度、美学表现优秀,颜色运用佳;复杂需求如光追引擎需迭代。后端得分超 deepseek-v4-pro 及国产模型,略逊 GPT-5.4-Pro (xhigh)。Agent 能力达榜单第二接单量,规划突出。使用经验:M3 偏好长推理,单次输出可达 64k token,适合嵌入带 plan 模式的 Coding Agent,需做好 prompt 编排,避免大量 tool call;执行约束不足,需增加代码级 harness 闭环。
OpenAI Codex 负责人 Tibo 因 24 小时内 3 次可靠性事故,重置所有付费计划额度。Codex 按推理时间计费:Plus 下 GPT-5.4 约 40 分钟耗尽 5 小时窗口,GPT-5.3 约 60 分钟。重置常将下个计费周期提前,导致精打细算攒的额度被覆盖,立即消耗者反而获得更多推理时间。作者认为系统奖励即刻消耗,建议本地模型兜底、云端冲峰值,夺回生产力控制权。
Hi. Over the last 24 hours we had three separate small incidents that affected Codex reliability. Those are three too ma...
How do I make Codex the default tab when I open the ChatGPT app
你们现在千万别选计算机专业,现在程序员都在大量失业,AI一出来,程序员全裁员饿死了。 现在AI太厉害了,不仅SaaS死了,传统软件更是被AI打得满地找牙。 我一个朋友的startup里,一堆员工抱怨windows太耗电,他们公司全员AI n...
codex突然大降智,原计划跑2天的goal刚才20分钟给我交付了 拿去评分,给了AI评分以来最低的5/10分
2026年6月18日起,Gemini CLI和Gemini Code Assist的部分免费/消费级接入将停止服务,但企业版和付费API key接入不受影响。推文作者表示尚未使用过Gemini CLI。
Cursor 推出 Debug Mode,解决传统 AI Agent 依赖静态推理易产生“假修复”的问题。其核心是通过添加临时日志、让用户复现 Bug,收集运行时证据进行诊断,再自动清除日志。Cursor 团队内部案例显示,该模式能高效定位概率性竞态条件、内存泄漏、C++ 原生崩溃及 SSR 渲染等难以静态分析的 Bug,将“猜测”转为“基于证据的诊断”。
http://x.com/i/article/2061967596568875008
Hi. Over the last 24 hours we had three separate small incidents that affected Codex reliability. Those are three too ma...
StepFun Step 3.7 Flash smashed DeepSeek V4-Flash in a physics contest We gave two open-weight models the same task: writ...
Cursor 发布 Debug Mode,解决 AI 智能体靠猜测修 Bug 的问题。工作流程:Agent 先生成多个假设,为最可能的假设添加日志(不修改代码);调试服务器在程序运行时收集输出到 .cursor/debug.log;用户重现 Bug 后,Agent 读取日志而非猜测;最后 Cursor 从日志找到根因并修复,自动移除添加的日志。内部案例:追踪 1/20 概率出现的 git 元数据竞争条件(1 小时内定位);一次单趟追踪内存泄漏(修复仅一行);定位 Electron 中 C++ 原生崩溃;修复此前无人敢碰的 SSR 闪烁问题。用户可通过 Shift+Tab 或在 CLI 中使用 /debug 触发。
GPT 5.5 Pro 调研生成了一份 Codex 的 Goal 指令使用文档,分享两个技巧:1. 写不好 Goal 时先用 /plan 模式,让 AI 反问用户来完善命令,提示词模板为 /plan Help me turn this vague task into a strong Codex goal...;2. 写好 Goal 的六要素:结果、验证、约束、边界、迭代策略、阻塞条件。官方标准模板为 /goal [Outcome]. Verification: [...] Constraints: [...] Boundaries: [...] Iteration policy: [...] Stop when: [...] Pause if: [...]。详细报告含多个可直接使用的模板。
openrouter's pareto router (for coding) is probably the most underrated way to save on ai coding costs you set the intel...
Lee Robinson 认为该说法是过度简化的播客话术。现实更复杂:即便大量“技术专家”存在,仍需要有人百分百专注产品或设计;AI 虽让生成代码变易,但缺乏优秀工程师会导致灾难。硅谷常把创业公司经验套用于大公司,却难以颠覆内部政治、遗留系统等极度人性化的部分。他判断 AI 颠覆知识工作需要数十年,因为本质是社会/组织问题,而非纯智力问题。
若多台电脑均安装 Codex 并登录同一 ChatGPT 账号,可在设置 -> 连接 -> 控制其他设备中添加其他电脑。之后本机创建项目时即可选择添加远程项目,例如远程控制家中电脑上的 Codex 进行代码编写。该功能无需额外配置,利用账号同步实现跨设备协作。
阿里云推出基于 Qwen 的 Agentic Coding,帮助开发者加速开发周期、锁定可预测成本(固定月配额,零意外账单),并能无缝集成主流 AI 工具。官方称使用该方案可节省高达 70% 的成本,同时保持技术栈不变。
Codex now has more than 5M weekly active users. But the bigger story is what people are using it for: not just writing c...
Codex can now deploy and host websites for you using Sites! 🎉 This includes storage for data and files using D1 and R2 ...
Claude 推出了名为 ant 的 CLI 原生工具,它将 Claude Platform 的 Messages API、托管 Agent 等全部 API 端点集成到了命令行中。用户现在可以直接在终端调用这些功能,并将结果通过管道(pipe)输出到 shell,省去了以往翻阅文档、拼接请求和处理 JSON 的步骤。该工具对 coding agent 友好,Claude Code 能通过 claude-api skill 理解并使用 ant,从而更直接地调用官方 API。这标志着 Claude 正从网页工具延伸向终端基础设施。
We've added a CLI for Claude Platform to make every API endpoint runnable from your terminal. Call the Messages API, sta...
推文指出,尽管有人批评 Opus 4.8,但它在编写 Mac App UI 时能力很强,配合 Claude Design 使用,界面还原度相当不错。作者同时引用了对 Cursor Agent 的评价作为对比:在常用 GUI Agent 中排名为 Codex App、Cursor 和 Claude Desktop。Cursor 的亮点包括支持多任务并行和灵活选择模型,Plan 模式步骤详细稳定;不足是暂不支持 /goal、手机版,且调试功能仅有内置浏览器。
Cursor 在为用户增加使用额度。最近我重度使用了 Cursor 的 Agent,效果相当不错。我常用的 GUI Agent 里面,Codex App > Cursor > Claude Desktop。 几个亮点: 1. 它的 mult...
Building apps has never been easier. With Sites, Codex can turn your work, ideas, and plans into an interactive website ...
推文表达了对 Codex 工具的喜爱。用户提到让朋友用 Codex 撰写新书推荐语,并分享了自己的使用数据:已不间断连续使用 11 天,单次最长任务时长为 8 小时。推文最后邀请其他用户在 Codex 个人资料中查看并分享自己的 Token 使用统计。
Codex平台近日上线了名为Site的新插件。该插件功能类似于Claude Design,能够帮助用户设计并生成网页,并自动完成部署,生成可直接访问的链接。目前此功能的使用权限受限,Pro用户无法使用,仅向Business及组织类用户开放。
Coding like Opus4.7 / 1M context window / Native multimodal @MiniMax_AI M3 is now on SiliconFlow with day-0 support 🔥 �...
Building apps has never been easier. With Sites, Codex can turn your work, ideas, and plans into an interactive website ...
微软在Build大会宣布推出七个全新的MAI模型家族。该家族以“干净数据血统”从零开始训练,旨在任务专精并能无缝协作。其中,MAI-Code-1-Flash在SWE-Bench Verified上得分71.6,比Claude Haiku 4.5高出5分,并能节省60% token。MAI-Transcribe-1.5处理一小时音频仅需15秒,在43种语言上实现速度与准度领先。微软此次发布旨在展示其从零构建、专精且能协同工作的模型发展路径。
Seven new models launching at Build: let's go! Reasoning. Code. Image. Transcribe. Voice. Built from scratch on a clean ...
Introducing Devin Desktop: the next generation of Windsurf Manage fleets of local and cloud agents from one surface Supp...
该内容源自@mvanhorn的分享,介绍了“智能体工程”如何重塑软件开发。其核心是从“人主导编码”转向“人主导方向、智能体执行”,中心从IDE变为终端与计划文件。方法论遵循Research → Plan → Work循环,核心是让plan.md约束智能体行为。分享者总结了22条实战技巧,涵盖规划、并行执行、输入方式、远程控制等方面,并列出了完整的工具栈。
http://x.com/i/article/2061440101411102721
OpenAI计划将ChatGPT、编程工具Codex及Atlas浏览器整合为一个桌面应用,并将Codex从纯编码工具转型为面向所有人的生产力平台。公司内部数据显示,Codex周活跃用户达500万,企业收入周环比增长50%,用量每日增长5%。此外,GPT-5.6模型也即将推出。