codex突然大降智,原计划跑2天的goal刚才20分钟给我交付了 拿去评分,给了AI评分以来最低的5/10分
codex突然大降智,原计划跑2天的goal刚才20分钟给我交付了 拿去评分,给了AI评分以来最低的5/10分
Zara Zhang 的开源项目 feishu-claude-code-bridge 现已升级,新增支持连接本机 Codex CLI。由于 6 月 15 日起 Claude 订阅计划对 claude -p 和 Agent SDK 独立计费,不走订阅额度,用户可改用 Codex 避免此限制。Codex 支持调用 GPT Image 2 画图,可在飞书内指挥它抓取网页、翻译并生成中文手绘教育风信息图,直接创建飞书文档。连接命令改为 lark-channel-bridge run --profile codex。项目 README 提供中英文说明。
如果你同时用飞书和 Claude Code 的话,Zara Zhang这个开源项目 feishu-claude-code-bridge 值得一试,它可以让你在飞书里面直接连接 Claude Code,从飞书指挥 Claude Code,反过...
加州大学伯克利分校的计算机科学课程中,随着学生越来越多地使用AI工具,课程不及格率显著上升,同时学生的数学基础能力持续下滑。
OpenAI 首席执行官奥尔特曼透露,公司内部词元消耗冠军每月用掉约 1000 亿个词元,六年前这一数字仅为十万个。外部用户消耗更高。公司设有词元消耗排行榜,员工在 X 平台炫耀使用量;有截图显示 30 天内消耗 6030 亿个词元,《纽约时报》报道一名员工单周用掉 2100 亿个词元。与此同时,亚马逊关停内部词元榜单,Uber 则出台限额制度。奥尔特曼表示,OpenAI 正通过模型迭代和降本增效方案力求降低成本,AI 使用成本已从 2026 年初的无人介意变为亟待解决的难题。
OpenAI:我们出问题了,我们重置了 Anthropic:你的账号被 ban 了 Google:我们发新模型啦,好像没人理我们
网络安全公司 Calif 借助 OpenAI Codex 智能体发现 HTTP/2 Bomb 拒绝服务攻击,单机在 100 Mbps 连接下数秒至数十秒内可拖垮 Web 服务器。攻击利用 HPACK 压缩放大请求头(Envoy 放大比 5700:1,Apache httpd 4000:1)并借零字节流控窗口滞留请求,迫使服务器分配大量内存且无法释放。测试显示 Envoy 1.37.2 约 10 秒耗尽 32GB 内存,Apache httpd 2.4.67 约 18 秒耗尽 32GB。nginx 1.29.8 已加入 max_headers 指令,Apache mod_http2 2.0.41 修复(CVE-2026-49975);IIS、Envoy 和 Pingora 暂无补丁,建议关闭 HTTP/2 或在前端限制请求头数量。
Hi. Over the last 24 hours we had three separate small incidents that affected Codex reliability. Those are three too ma...
OpenAI 为专为生命科学研究打造的企业级模型系列 GPT-Rosalind 增加新能力,融合 GPT-5.5 的 Agentic Coding 与工具调用能力。Rosalind 可自主生成假设、调用工具模拟、设计实验方案并追踪工作流可重复性,面向药物发现、分子分析、实验设计及湿实验流程。该模型非通用模型加生命科学提示,而是从头针对药物发现、蛋白设计等场景专项强化,支持企业级海量数据处理、跨团队协作与合规审计。命名致敬 DNA 结构科学家 Rosalind Franklin。
We're bringing new capabilities to GPT-Rosalind, a model series purpose-built for life sciences research at enterprise s...
Wasmer 借助 Codex(基于 GPT-5.5)构建了一个用于边缘计算的 Node.js 运行时,将开发速度提升 10 到 20 倍,交付周期从数月缩短至数周。
We're bringing new capabilities to GPT-Rosalind, a model series purpose-built for life sciences research at enterprise s...
GPT-Rosalind 在生命科学研究领域推出新功能,增强了生物推理、药物化学专业知识、基因组学分析以及实验工作流处理能力。
There's real momentum right now for AI safety policy. Yesterday's EO on cyber was an important step forward. We're propo...
I find it unbelievable that, less than two weeks before blaming the violence against Sam Altman on doomer rhetoric, @Nat...
to be underestimated is to be free
I find it unbelievable that, less than two weeks before blaming the violence against Sam Altman on doomer rhetoric, @Nat...
美国参议员伯尼·桑德斯(Bernie Sanders)在其官网发布的专栏文章中提出,大型人工智能公司的一半股份应归公众所有。
关联讨论 1 条Ars Technica:AI(RSS)OpenAI 公布其 AI 公共政策议程,涵盖安全、青少年保护、劳动力转型和全球标准四大领域,旨在确保 AI 技术造福全社会。
OpenAI 发布了一份针对美国前沿 AI 治理的蓝图,提出建立联邦层面的框架,以保障安全性、韧性和国家安全。该蓝图聚焦于前沿 AI 的民主治理,强调通过政府监管与行业协作来应对潜在风险。
GPT 5.5 Pro 调研生成了一份 Codex 的 Goal 指令使用文档,分享两个技巧:1. 写不好 Goal 时先用 /plan 模式,让 AI 反问用户来完善命令,提示词模板为 /plan Help me turn this vague task into a strong Codex goal...;2. 写好 Goal 的六要素:结果、验证、约束、边界、迭代策略、阻塞条件。官方标准模板为 /goal [Outcome]. Verification: [...] Constraints: [...] Boundaries: [...] Iteration policy: [...] Stop when: [...] Pause if: [...]。详细报告含多个可直接使用的模板。
若多台电脑均安装 Codex 并登录同一 ChatGPT 账号,可在设置 -> 连接 -> 控制其他设备中添加其他电脑。之后本机创建项目时即可选择添加远程项目,例如远程控制家中电脑上的 Codex 进行代码编写。该功能无需额外配置,利用账号同步实现跨设备协作。
微软在模型发布卡中首次加入平均token使用量指标。其模型在SWE-Bench Verified上达71.6分,仅消耗约Claude Haiku 4.5三分之一的token。Artificial Analysis的Intelligence Index显示GPT 5.5与Claude Opus 4.8得分相近(约60分),但Opus 4.8运行成本高出40%($4,685 vs $3,357)。Uber因四个月内AI预算超支而限制员工使用;Salesforce花费$3亿购买Anthropic tokens并冻结工程招聘。模型公司如今需同时在性能和成本两个维度竞争。
Codex和Claude Code的额度限制采用5小时滚动窗口,从用户发送第一条消息开始计时,用完需等待窗口结束才能重置。但窗口结束后系统不会自动开启新窗口,需等到下一条消息才重新计时。利用此机制,可在主要工作时段前3小时(如上午11点)提前发送一条消息激活窗口,使重置时间落在工作时段中间(如下午4点)。这样在2-6点的核心工作中,能享受两个5小时窗口,变相将额度翻倍。设置方法:Codex可在自动化中创建每日定时任务发送短消息;Claude CLI可通过crontab(Mac)或任务计划程序(Windows)实现。注意仍有周额度上限,适度使用即可。
Codex 和 Claude Code 的额度限制基于 5 小时滚动窗口:从发送第一条消息开始计时,窗口结束后不会自动重置,需等下次发消息才开启新窗口。提前数小时发送一条短消息,可使重置时间落在工作时段内,从而在核心工作时间获得两个完整窗口。设置方法:Codex 在左侧“自动化”中建每日定时任务;Claude Code 可通过客户端 Routines 或 CLI 版 crontab 配置。注意 5 小时窗口之上还有周额度上限,需合理规划。
Codex now has more than 5M weekly active users. But the bigger story is what people are using it for: not just writing c...
Codex can now deploy and host websites for you using Sites! 🎉 This includes storage for data and files using D1 and R2 ...