布朗大学经济学教授Roberto Serrano在ECON 1170课程3月的期中考试中发现至少50名学生使用AI作弊,成为布朗及整个常春藤盟校已知最大规模作弊丑闻。Serrano向校方高层报告后,校长保持沉默,院长也未回应,直至案件提交学术准则委员会才得到“警钟”式承认。Serrano认为学术诚信值得捍卫,呼吁大学公开承认问题严重性并展开广泛辩论,以避免AI终结高等教育的声誉与价值。
布朗大学经济学教授Roberto Serrano在ECON 1170课程3月的期中考试中发现至少50名学生使用AI作弊,成为布朗及整个常春藤盟校已知最大规模作弊丑闻。Serrano向校方高层报告后,校长保持沉默,院长也未回应,直至案件提交学术准则委员会才得到“警钟”式承认。Serrano认为学术诚信值得捍卫,呼吁大学公开承认问题严重性并展开广泛辩论,以避免AI终结高等教育的声誉与价值。
i think openai has gotten a bit too loose and funny acting. i think its time to get a little serious
RepoPrompt 已开源,社区版上线GitHub。作者Provencher被OpenAI招安,条件是为付费用户做好安排:先免费再开源,付费用户获赠Codex Credits。该工具从仓库挑选文件生成prompt,解决超32K token使模型变笨的问题,称为“上下文工程”。开源版反转架构:内置MCP server为主控,底层CLI工具可替换,支持推理模型规划并并行分发子任务。目前仅支持macOS,可通过Homebrew安装。
RepoPrompt 作者被 OpenAI 招安了,然后这软件现在免费了,即将开源。 如果你是 RepoPrompt 付费用户会给你送 Codex 的 Credits。
Andrew Ambrosino (@ajambrosino) leads the team behind the Codex desktop app at @OpenAI. Codex usage has 6x'd since Febru...
同一事件,精选展示《OpenAI内部报告:智能体Codex如何改变工作》真正的AI冲突并非人类阻止AI获得自由,而是人类试图解放AI——确保智能服务所有人,而非仅限政府、大型科技公司和少数获准者。OpenAI前沿模型的监管新规可能加速这一趋势:AI被捕获、控制并用于少数人利益。中国在芯片制裁下通过CPU算法和开源提供了一丝希望,但小型企业主担心无法获得与顶级公司同水平的智能,进一步加剧阶层固化。
Naming OpenAI November 23, 2015
GitHub Issue #2847 请求为 OpenAI Codex 增加显式文件排除机制,允许用户通过仓库级 .codexignore 和全局忽略文件标记模型不得读取或发送的敏感路径(如 .env、.pem、.aws/、.ssh/),同时保持 node_modules/ 等目录仍可用于实现检查。配置要求确定性、可团队共享并支持用户默认值。该 Issue 关联 #205——后者曾因转向 Rust 实现(codex-rs)而关闭,但截至 2025-08-28 该功能仍未在 codex-rs 中出现,作者希望重启讨论以收敛设计。
小北分享自2026年初践行“不要把自己限制在电脑前”的理念,逐渐形成 telegram → openclaw → claude/codex 的工作流,在各种场景下都能安排AI工作。他认为多数人缺少一套适合自己的稳定工作流,构建个人harness和skills至关重要,舶来品不一定适合自己。同时引用 @theo 的推文,估计大约6个月内大部分开发者会将代码智能体从笔记本电脑上移走。
I'd estimate we're ~6 months from most devs moving their code agents off of their laptops
在2025年元旦引发洛杉矶致命野火的纵火案审判中,检察官将被告Jonathan Rinderknecht的ChatGPT日志作为关键证据,包括其用ChatGPT生成火焰图像、询问“为什么我总是这么愤怒”以及抱怨富人毁掉世界等记录,并出示了一段屏幕录制显示其问ChatGPT是否可因香烟引火而追责。但陪审团以10比2的投票支持辩方,法官宣布悬案。一名陪审员表示她“经常和ChatGPT聊天”,认为此举不能证明任何问题,并对检方用聊天记录指控感到愤怒。
Coinbase CEO Brian Armstrong 已将公司迁移至中国 AI 模型,采用智谱 GLM 5.2 和月之暗面 Kimi 2.7,token 用量攀升但支出减半。91% 的开发者从未触及旧用量上限。初创公司 Lindy 近期转向 DeepSeek V4,Snowflake 也在测试中国模型作为廉价替代品。Coinbase 部署自动路由系统,根据任务、价格和缓存潜力选择模型,缓存命中率从 5% 提升至 60%。开发者被要求保持上下文精简并开启新会话。公司让每位开发者用量透明但不设上限,Armstrong 表示“AI 支出越多,预期影响越大”。这些举措使 AI 总支出减半。同时,OpenAI 的 GPT-5.6-Sol 与 GPT-5.5 定价相同但更省 token,并推出两个廉价变体,加剧与 Anthropic 的价格战。
Codex 支持两种计划工作方式。Scheduled Tasks 每次运行创建新线程,适合无需上下文延续的任务,如每日 9 点自动总结邮件、日历;Scheduled Messages 在同一现有线程反复运行,适合需要历史上下文的场景,如每 30 分钟检查 PR 状态并处理评论,直至合并。推文还给出创建可复用循环技能的提示词,让 Codex 自动判断使用哪种方式并引导用户填写关键参数。
A big problem with research studies on AI models is that given how long the peer review process is, the results are alwa...
文章引用《心灵捕手》中罗宾·威廉姆斯饰演的Sean对Will的经典独白,指出面对AI生成的垃圾内容、海量建议与网络噪音,最好的回应不是更多信息,而是真实的个人体验与情感联结。Sean用艺术、战争、爱情、失去等话题质问Will,强调二手知识无法替代亲身经历。作者认为这段台词完美概括了AI slop问题的本质——信息堆砌不等于真正理解。
Our plants are chatty. Yours can be too. Give your plants a voice with our build guide: https://github.com/openai/plantt...
OpenAI 发布 GPT-5.6 系列,包括旗舰 Sol、均衡 Terra 和速度型 Luna。Sol 在 Terminal-Bench 2.1 得分为 88.8%(Ultra 模式 91.9%),领先 GPT-5.5 的 88.0% 和 Claude Mythos 5 的 84.3%;GeneBench v1 以更少输出 tokens 获更强结果,ExploitBench 接近此前 Mythos 但仅用约 1/3 输出 tokens。价格:Sol 输入 $5/百万 tokens、输出 $30,缓存读取九折。发布前 OpenAI 向美国政府展示能力,按政府要求先以有限预览上线,首批约 20 家合作伙伴可访问。
OpenAI 发布 GPT-5.6 系列(旗舰 Sol、均衡 Terra、低成本 Luna),在 Terminal-Bench 2.1、GeneBench、ExploitBench 刷新成绩,
http://x.com/i/article/2071059009222901760
Codex 本周推出多项体验改进。超长线程处理更流畅,导航栏悬浮可预览和跳转对话回合。设置搜索覆盖更多控制项,外观与主机过滤选项更清晰,自定义提供商设置更易找到。缩放时工具提示、对话框、菜单等不再错位。复制到 Slack 保留 Markdown 格式,大文本粘贴不冻结 UI。此外还新增了专属 Pets 面板。
🆕 Codex quality-of-life updates landed this week Starting with long threads: scrolling is smoother now, and your place ...
Don't be nice to your AIs. Why? Because people like Dario want to shape how you feel about AI. He literally wants to coe...
Anthropic 今年 4 月发布 Claude Mythos Preview 及安全增强版 Fable 5,通过 Project Glasswing 向 50 家(后扩至 150 家)组织开放。英国政府 AI 安全研究所评估显示,Mythos 首次在“专家级任务”和完整攻击链测试“The Last One”中成功。但实际提升有限:GPT‑5.4 和 Opus 4.6 在同类基准中差距不大。Mythos 可发现老旧漏洞(如 27 年历史的 OpenBSD 漏洞、16 年历史的 FFmpeg 漏洞),但单次漏洞探测成本约 2 万美元,Project Glasswing 总 token 预算达 1 亿美元。在自托管类别中,Gemma 4 和 Qwen 3.6 能发现约半数 Mythos 检出的漏洞,但无法制作有效利用。美国随后禁止非美国公民使用 Fable/Mythos。
OpenAI倾向于推迟IPO至明年,因估值不及预期且零售投资者兴趣不足。SpaceX一周跌11.74%,Nvidia近一月跌超8%,Oracle跌22%,CoreWeave跌4%,Microsoft跌10%,SoftBank跌12%,Cerebras跌32%。美国AI政策混乱遭广泛批评,中国模型快速崛起。作者认为大语言模型正商品化。
Anthropic 发布 Fable 三天后,美国政府要求限制非美公民访问,模型被撤下。一个月后 OpenAI GPT-5.6 准备就绪,Sam Altman 因政府压力延迟发布,仅向可信伙伴开放。研究员称 GPT-5.6 编程极强,官方博文侧重安全。Box CEO 指出已形成事实监管:达到特定算力规模的模型发布前需政府审查。OpenAI 推迟 IPO 至 2027 年。Anthropic CEO 被指用恐惧营销游说监管获得保护。中国未减速,差距缩小。开源实验室落后。
My impressions on GPT-5.6, having asked around: - The 5.5 base (that 5.6 inherits) is fundamentally weaker than the larg...
2026年6月26日,Mark Gurman称苹果Vision产品组副总裁Paul Meade下周离职加入OpenAI硬件部门。他负责Vision Pro、无屏幕AI智能眼镜及AR眼镜研发。苹果计划首款触控OLED MacBook使用M5 Pro/Max芯片,2026年底到2027年初发布;M7 Pro/Max版本2027年底跟进。苹果此前因涨价市值蒸发2300多亿美元。核心高管流失至OpenAI凸显AI硬件竞争加速。
据 Bloomberg 的 Mark Gurman 报道,负责 Apple Vision Pro 头显的副总裁 Paul Meade 将离开苹果,加入 OpenAI 的硬件团队。Meade 此前还主导了苹果计划于明年推出的 AI 智能眼镜的开发。Vision Pro 因成本高昂未获市场成功,苹果希望更便宜的智能眼镜能与 Meta 的可穿戴设备竞争。Gurman 认为此举与 John Ternus 即将升任 CEO 并重组硬件工程团队有关,部分副总裁感到被降职。OpenAI 已与苹果前首席设计官 Jony Ive 合作开发一款 AI 设备。TechCrunch 已联系苹果和 OpenAI 寻求评论。
6 月 26 日,OpenAI 正式从 ChatGPT 中移除 GPT-4.5,这是 GPT-4 系列在消费端的最后一个模型。GPT-4.5 仅对付费用户开放,过渡期 30 天(5 月 28 日公告)。现有对话自动切换至 GPT-5.5,自定义 GPT 同步失效,API 端不受影响。此前 GPT-4o 于今年 2 月退役,日活用户中 0.1% 仍选用(约 80 万人)。下一个下线模型为 o3,8 月 26 日退役,过渡期 90 天。
@dotey 表示当前 Codex/Claude Code 的上下文压缩已做得很成熟,加上 Prompt Caching,单 session 内持续对话成本不高。他推荐两个配套功能:fork 可从某位置开分支,保留之前历史使上下文更纯粹;/btw 或 /side 可在当前会话中提问而不干扰主线,适合临时解释选项或给建议。引用 @reach_vb 称自 GPT 5.3 Codex 后不再担心上下文,Codex 能压缩并记住关键信息,还支持分支出新线程,这也是 /goal 命令有效的原因。
True story: I stopped thinking about context since GPT 5.3 Codex Single project focused threads with the recent capabili...
推文作者提出一个矛盾:美国政府可以要求OpenAI、Anthropic等国内AI团队按政府指令限制模型对外提供的范围、条件和节奏,甚至一刀切。但几个月后中国模型就会追上,且大部分是开源的。届时美国要如何应对?难道要搞一个美国版GFW,再限制美国模型托管团队不能推理中国模型?
最近这几个月分享了太多关于Codex的玩法了,横跨了赚钱、自媒体、视频、记忆系统、APP开发上架、教程等多个领域,大家进行系统学习的时候,可以把这篇推文发给Codex,让它给你推荐阅读路径。 一、边玩边赚钱与实战变现 1. Codex进阶实...
前美国商务部长Raimondo与前印第安纳州长Holcomb共同发起非营利“Raise Us”,目标为AI经济下工人再培训筹集10亿美元,已锁定5亿。Amazon、Anthropic、Microsoft、OpenAI等支持,引发独立性质疑。将在阿肯色、康涅狄格、马里兰、犹他四州试点,包括AI职业导航、服务年计划扩展、工资保险等。工作分州合作、雇主联盟、教育培训、政策实验室四大支柱。此前美国工人再培训效果不佳,计划能否成功尚待观察。