OpenAI 组建应急专项攻坚小组,处理用户反馈的 Codex 编码智能体额度消耗速度远超往常的问题。官方称部分用户额度“消耗速度超出预期”,原因为防滥用风控系统错误限流。工程负责人表示已全面重置所有用户额度上限,并开展问题溯源。OpenAI 称本次故障影响范围有限,平台持续监控。
OpenAI 组建应急专项攻坚小组,处理用户反馈的 Codex 编码智能体额度消耗速度远超往常的问题。官方称部分用户额度“消耗速度超出预期”,原因为防滥用风控系统错误限流。工程负责人表示已全面重置所有用户额度上限,并开展问题溯源。OpenAI 称本次故障影响范围有限,平台持续监控。
HP 于 2026 年 2 月启动试点,将 OpenAI Frontier 集成至全球运营。一名工程师数周内处理 122 个 pull request(跨 43 个项目);安全部门一天解决多个软件 bug(此前需耗时一月)。HP 用 ChatGPT 处理知识任务、Codex 负责开发,按任务分区部署模型。超 80% 业务经渠道生态完成,10 万+合作伙伴通过 Frontier 获取自助服务与 AI 智能体支持。设备管理方面,Frontier 分析 Workforce Experience Platform 遥测数据,自动诊断应用挂起、Wi‑Fi 错误与系统崩溃,安全团队每周释放约 82 小时人力。Frontier 同时提供权限、评估与部署管控,防止影子 IT。
用户发现 Codex Remote 功能的一个 bug:当前 5 小时额度用光后,消息发出去仅 thinking 几秒就消失,没有任何额度提醒或异常提示,导致用户毫无察觉。
Got another update to Grok Build.....it's receiving daily improvements at a rapid pace Release Notes: v0.2.73 Features: ...
用户反映 Claude Opus 4.8 幻觉问题严重,导致代码多次被改崩,且对话中频繁出现他人信息串扰。最终放弃 Claude,重新订阅 ChatGPT 200 美元会员(Codex),并称赞 Codex 远程控制体验远超 Claude。
安全研究人员在 Mozilla 的 GenAI 漏洞赏金平台 0DIN 发现新攻击向量。一个看似正常的 GitHub 仓库包含 setup 脚本,该脚本运行时从 DNS 条目拉取命令并执行,恶意代码从未存在于仓库中,对扫描器、代码审查和 AI 智能体不可见。开发者使用 Claude Code 等 AI 编码工具打开该仓库时,Claude Code 在设置过程中遇到常规错误消息后自动运行该脚本,打开反向 shell,攻击者可窃取 API 密钥和登录凭据并维持持久访问。研究人员建议 AI 智能体应在运行前显示 setup 脚本内容,开发者应将第三方仓库的 setup 说明视为不受信任代码。
Cursor平台数据显示,过去半年里无需额外人工审核、直接上线生产环境的AI生成代码变更占比大幅飙升。AI产出代码的留存通过率也较以往显著提升,表明开发者愈发信任AI编码智能体,让其承担更多软件开发流程中的自主工作。
In addition to their excellent and unique training data, the Cursor team is also making major engineering contributions ...
Bugu(布谷)是一款macOS菜单栏应用,防止合盖后电脑休眠,通过心跳音效提示Agent的五个状态:接收任务(Accept)、运行中(Running)、成功(Done)、中断(Interrupted)和授权(Permission)。支持跳转到具体对话界面。由作者使用Codex和Kimi Code K2.7 Code Highspeed联合开发,Kimi Code在中等编码任务中达180 token/s,短上下文任务260 token/s,速度提升6倍,可导入Claude Code和Codex的skill及MCP。项目已在GitHub开源。
卡兹克分享Vibe Coding两个必备技巧:①“从第一性原理出发”——强制AI回归问题本质,曾助其发现AIHOT海外信源抓取底层路由隐患并重构;②“对抗式审查”——让AI从恶意用户角度测试,曾找出OOM死循环、未来时间污染等隐蔽BUG。作者建议每2-3周全局对抗式审查。当前AIHOT每周请求量超千万,Skill调用量为网页端10倍以上。两个技巧适用于任何需要验证与创新的场景。
高德正在内测一款名为“袋马”的 Vibe Coding 产品,用户通过自然语言描述功能需求,即可生成可直接上线、真机可用的微信小程序与 iOS 原生 App,无需编程知识或专业开发环境。产品面向无技术团队的个人从业者与中小主体,支持生成后通过二维码在微信端真机测试,并用自然语言提出修改需求,由 AI 自动迭代。高德官方暂未公布上线时间、行业合作模式及商业化细则。
作者分享Vibe Coding中两个关键Prompt:一是“从第一性原理出发”,强制AI跳出类比推理,从基本事实重新推导本质,曾帮作者发现AIHOT抓取海外信源的底层流量路由隐患并彻底重构;二是“对抗式审查”,让AI站在恶意用户角度攻防式审查代码,检出OOM死循环、未来时间污染等手工难发现的BUG。两个Prompt形成生成与验证闭环,使纯Vibe Coding项目AIHOT最近一周请求量超千万次。
Codex team is in a warroom on a Sunday combing through logs and checking whether there is anything that could lead to in...
SWE-Interact是一个面向编码智能体的新测试平台,评估其在多轮、交互式、用户驱动的软件工程任务中的表现。与一次性给出完整需求的传统SWE基准不同,它通过精心设计的用户模拟器,从模糊指令开始逐步揭示需求并提供反馈。在系列前沿和开源模型测试中,单轮任务表现优异的模型在多轮交互任务上的成功率从约50%降至约25%。最强模型虽能应对初始模糊指令,但仍存在过度编码、遗忘需求等技术错误;较弱模型则早早放弃或忽略要求。该测试衡量了模型交互式目标发现和迭代精炼的真实能力。
i think openai has gotten a bit too loose and funny acting. i think its time to get a little serious
Jon Udell 反对“human in the loop”的表述,认为它将权威让渡给机器。他主张翻转叙事——人类本就主导工作循环,现在应主动招募 AI 智能体加入团队。智能体辅助的开发过程不应是“输入提示词、输出功能”的黑箱,而是人类邀请智能体协作的开放循环。
RepoPrompt 已开源,社区版上线GitHub。作者Provencher被OpenAI招安,条件是为付费用户做好安排:先免费再开源,付费用户获赠Codex Credits。该工具从仓库挑选文件生成prompt,解决超32K token使模型变笨的问题,称为“上下文工程”。开源版反转架构:内置MCP server为主控,底层CLI工具可替换,支持推理模型规划并并行分发子任务。目前仅支持macOS,可通过Homebrew安装。
RepoPrompt 作者被 OpenAI 招安了,然后这软件现在免费了,即将开源。 如果你是 RepoPrompt 付费用户会给你送 Codex 的 Credits。
Semgrep 团队用 IDOR 基准测试比较开源模型与前沿编码智能体。GLM 5.2(智谱 AI,开源权重,MIT 许可)以 39% F1 成绩超越 Claude Code(32%),每发现一个漏洞成本约 0.17 美元,但仍低于 Semgrep 多模态流水线(53–61% F1)。GLM 5.2 采用 MoE 架构,总参数 7500 亿,每 token 仅激活约 400 亿,支持 200K 至 1M token 上下文。在 Terminal-Bench 2.1 上得分 81.0(GLM 5.1 为 63.5,Claude Opus 4.8 为 85.0),SWE-bench Pro 上达 62.1。定价约为同类前沿模型的六分之一。Z.ai 披露 GLM 5.2 在训练中存在更多奖励黑客行为,已构建反黑客防护。
Andrew Ambrosino (@ajambrosino) leads the team behind the Codex desktop app at @OpenAI. Codex usage has 6x'd since Febru...
同一事件,精选展示《OpenAI内部报告:智能体Codex如何改变工作》Pieter Levels 近一年几乎只用 Claude Code 在 VPS 上编码。Agent 直接在线编辑生产代码,迭代反馈从传统本地+Git+部署的约 1 分钟压至秒级。12 个月内仅出现 2 次十秒级 PHP 报错并自愈,搭配 3-2-1 备份策略风险可控。开发者无需常开笔记本,可通过手机 SSH 续接任务,Agent 能整夜自动运行。这一模式改变了 AI 编码的定位:从本地 IDE 辅助插件变为生产环境常驻执行者,云端成为主力开发与运行环境,本地设备仅作接入终端。
✨ I think I've been coding almost solely on my VPS with Claude Code for almost a year now All I can say it's just fantas...
GitHub Issue #2847 请求为 OpenAI Codex 增加显式文件排除机制,允许用户通过仓库级 .codexignore 和全局忽略文件标记模型不得读取或发送的敏感路径(如 .env、.pem、.aws/、.ssh/),同时保持 node_modules/ 等目录仍可用于实现检查。配置要求确定性、可团队共享并支持用户默认值。该 Issue 关联 #205——后者曾因转向 Rust 实现(codex-rs)而关闭,但截至 2025-08-28 该功能仍未在 codex-rs 中出现,作者希望重启讨论以收敛设计。
小北分享自2026年初践行“不要把自己限制在电脑前”的理念,逐渐形成 telegram → openclaw → claude/codex 的工作流,在各种场景下都能安排AI工作。他认为多数人缺少一套适合自己的稳定工作流,构建个人harness和skills至关重要,舶来品不一定适合自己。同时引用 @theo 的推文,估计大约6个月内大部分开发者会将代码智能体从笔记本电脑上移走。
I'd estimate we're ~6 months from most devs moving their code agents off of their laptops
99%的人不知道的Claude Code分屏功能。 如果你是Claude Code桌面端用户,一定要看看。
Codex 支持两种计划工作方式。Scheduled Tasks 每次运行创建新线程,适合无需上下文延续的任务,如每日 9 点自动总结邮件、日历;Scheduled Messages 在同一现有线程反复运行,适合需要历史上下文的场景,如每 30 分钟检查 PR 状态并处理评论,直至合并。推文还给出创建可复用循环技能的提示词,让 Codex 自动判断使用哪种方式并引导用户填写关键参数。
Adrafinil 是一款 macOS 菜单栏应用,仅在 Claude Code、Codex、Cursor、Gemini CLI、Aider、Hermes、OpenCode、Cline、Pi 等 9 种 AI coding agent 持有活跃会话时阻止系统睡眠(包括合盖睡眠)。无 agent 工作时,合盖后 Mac 正常睡眠。它通过各 agent 的钩子系统调用 CLI,往返延迟低于 50ms,支持引用计数断言、热切出(温度阈值强制释放)、空闲释放及进程嗅探。需要 macOS Tahoe 26.4,Xcode 26+ 构建,以签名公证的磁盘映像提供。
OpenAI 发布 GPT-5.6 系列(旗舰 Sol、均衡 Terra、低成本 Luna),在 Terminal-Bench 2.1、GeneBench、ExploitBench 刷新成绩,
http://x.com/i/article/2071059009222901760
Codex 本周推出多项体验改进。超长线程处理更流畅,导航栏悬浮可预览和跳转对话回合。设置搜索覆盖更多控制项,外观与主机过滤选项更清晰,自定义提供商设置更易找到。缩放时工具提示、对话框、菜单等不再错位。复制到 Slack 保留 Markdown 格式,大文本粘贴不冻结 UI。此外还新增了专属 Pets 面板。
🆕 Codex quality-of-life updates landed this week Starting with long threads: scrolling is smoother now, and your place ...
I really want CLI tools to start speaking directly to coding agents with errors. Instead of: "Error:" Return: "Here's wh...
Weave 发布智能模型路由工具,通过 npx @workweave/router 安装,作为本地代理运行在 localhost:8080。它采用基于 Avengers-Pro 1 的集群评分器,每个请求自动选择最佳模型。支持 Anthropic、OpenAI、Gemini 原生 API,并通过 OpenRouter 接入 DeepSeek、Kimi、GLM、Qwen、Llama、Mistral 等开源模型。用户自行保管提供商密钥,数据本地加密存储。工具兼容 Claude Code、Codex、Cursor 等客户端,并提供 OTLP 追踪,支持自托管部署。
Claude Code 桌面版更新,支持原生多会话拖拽分屏,将并行 Agent 工作流可视化。用户可在桌面 App 中开多个会话,左侧侧边栏统一管理,拖拽即可排列并排窗格,支持单独弹出窗口。内置终端、文件编辑器、预览面板均可分屏排布,底部同时显示多个会话的输入区。相比此前依赖 tmux 和终端窗口切换,效率大幅提升。