You can now transcribe meetings in real time using Codex and ask Codex questions about meetings as they're happening! I ...
You can now transcribe meetings in real time using Codex and ask Codex questions about meetings as they're happening! I ...
用户实测发现,GPT Image 2 在仅给出简单指令的情况下,能自主生成结构清晰、可直接使用的排版图,体验震撼。有分析指出,GPT 这种出色的结构化排版能力,本质上源于其预训练过程中接触了大量此类素材,而非模型审美本身有巨大提升,但其默认效果已足够好用。
卧槽,GPT Image 2 的默认审美已经到这个程度了? 今天拍了份数学卷子,让它分析错题 分析完我随手加了一句: "将上面的孩子的最主要问题以及解决方案,平时训练建议都用一张图画出来" 没配色、没构图、没风格限定 结果它自己排版、标记 ...
Anthropic CEO Dario Amodei曾预测AI将在数年内大幅取代白领工作,但他本人近期已转向“杰文斯悖论”观点,即自动化最终会创造更多需求。OpenAI CEO Sam Altman也承认此前的预测“大错特错”。然而,耶鲁大学预算实验室自ChatGPT推出以来的持续追踪数据显示,美国职业结构并未发生显著变化,AI曝光度高的岗位失业率也未加速增长。德意志银行为此创造了“AI冗余清洗”一词。目前,AI能力的快速增长与实际就业市场反应之间,存在着前所未有的差距。
一份由开发者“苍老师”撰写的免费开源Codex实战指南(CodexGuide)已发布,旨在帮助新手跳过入门门槛。手册按四层结构组织:认识入口、跑通任务、建立方法、团队沉淀,详细覆盖CLI入门、桌面端安装、Plus订阅,乃至通过ChatGPT App远程指挥Mac Mini等场景。目前,该指南已收录13个可直接复刻的实战案例,例如配合Draw.io自动绘制架构图、GitHub Actions CI失败自动修复、以及在Obsidian中搭建AI知识库。
http://x.com/i/article/2059577896449331201
近期两个事件表明,前沿模型在高级抽象层面的可靠推理能力已跨越临界点。一是Anthropic发布了Claude Mythos Preview,其网络攻防能力过强,因此未公开,仅开放给合作伙伴用于防御。二是OpenAI的内部通用推理模型成功推翻了数学家Paul Erdős提出的一个猜想。两者共同显示,模型稳定处理的推理单元已从句子层级跃升至能维持核心论点、建立逻辑结构的“段落”与“整篇论证”层级,标志着能力的关键跃迁。
http://x.com/i/article/2058529613370802177
DeepSWE新基准模拟了真实的长链编程任务,如定位文件、复现bug和验证修复,挑战了旧有基准的局限性。测试显示,在顶级模型上分数差异模糊的SWE-Bench,被新基准拉开了差距:GPT-5.5达到70%,而Claude Opus为54%。研究发现,使用简单的mini-swe-agent即可取得与复杂定制工具相当的成绩,表明许多高分可能源于提示词工程。该基准作者@theo评论称,这是首个与真实编码体验相符的评测。
This is the first code bench that actually aligns with how it feels to use these models coding.
高盛CEO David Solomon 批驳AI将消除25%工作的论点,认为人们将更高效利用时间。他以自身分析师经历为例,曾需数小时手动制作图表,如今借助工具秒级完成,但银行雇佣人数反增。工具使业务复杂度自然扩展。他反问在有Excel、邮件和Zoom的今天,谁觉得工作变少?此观点呼应OpenAI CEO Sam Altman的看法:他承认对AI冲击白领工作的预期过于悲观,因为公司仍需人类的判断、信任、品味和复杂沟通能力。
wionews: OpenAI CEO Sam Altman now says the feared AI white-collar job collapse has not arrived as fast as he expected. ...
So this seems to work and not give me a once an hour hadn't shipped alert This seems like a big feature in ChatGPT?
推文分享了使用OpenAI Codex自动完成Chrome插件上架流程的案例。Codex能调用Computer Use和Chrome模拟人类操作浏览器,自动填写商店后台资料、生成缺失的Logo和截图、并编写隐私协议。整个过程耗时13分钟,消耗65万Token。作者同时表达了对OpenAI产品力的看法,认为其配套开发工具丰富,但指出GPT在写作方面目前仍不如Claude。
If you know one thing about every right now, it's that we're heavily Codex pilled. So we wrote a guide on how to use Cod...
Google其实比OpenAI更早做MoE。 我们专访到了Gemini前核心科学家Andrew Dai。Andrew回忆,Google Brain在 2021 年就已经做出了比GPT-3更强的MoE大模型GLaM,PaLM 2甚至在2023...
一种提升Codex表现的方法是让其自动从用户交互中学习。具体做法是让Codex扫描本周的对话记录,由AI提炼用户的开发经验与审美偏好等信息,并将其写入Skill(技能)中。这个过程可以让Codex持续、自动地更新其能力。参考案例显示,有开发者借此实现了其Skill waza的每周无痛更新,从而使工具“越来越聪明,越来越懂你”。
I recently put together a 50-state legal research workflow in Codex. This is the kind of work that a team of associates ...
It took me like 2 months, but I've grown to love gpt-5.5. You have to prompt entirely different and put some time into y...
Today we're releasing DeepSWE, a new standard for agentic coding benchmarks. On public leaderboards, top models often lo...
60多个公民团体要求加州总检察长调查OpenAI与芯片公司Cerebras的交易,指控存在利益输送。该交易涉及数十亿美元的云计算采购。报道指出,OpenAI CEO Sam Altman和总裁Greg Brockman是Cerebras的大额个人投资者,且Brockman曾在法庭上隐瞒此持股。该交易直接推动Cerebras估值从约80亿美元飙升至230亿美元,并最终以约300亿美元估值进行IPO。批评者认为此举可能违反加州法律禁止的自利交易条款,并质疑OpenAI已偏离其造福人类的非营利初衷。
Codex Mobile is making me a better developer in a way I didn't expect: I step away from my laptop and stop micromanaging...
OpenAI CEO Sam Altman承认,此前警告的AI冲击白领工作的情况并未如预期般快速发生。他之前曾警告常规办公工作,尤其是入门级任务,可能因AI受到重击。其新观点认为,由于企业在判断、信任、品味、情绪感知和依赖语境的复杂沟通等方面仍需依赖人类,工作模式正在发生弯曲而非断裂式崩溃。
so Codex on iPad acts like a Codex mobile phone, which gives you the full desktop UI/UX. meaning, you can use your iPad ...
一条关于Chrome新标签页的UI设计推文。其核心创意是增加一个“专注模式”:点击特定图标后,界面切换为番茄钟显示,旨在帮助用户在专注工作时忘记时间流逝。此外,推文提出将“最近访问”、“收藏夹”等非高频功能模块折叠至侧边栏,以减少主界面干扰。该设计想法及原型均由AI模型Codex生成。
Over the weekend, I asked Codex to analyze my Slack message history and recommend a better way to organize my growing nu...
What you say is true, but nonetheless our AI will be great. Whether it is the best remains to be seen, but I will never ...
i had codex audit my entire macbook to see how much space we can save and it's found 500 GB to save, AWESOME prompt was:...
用户通过Codex在VPS上自部署了umami统计工具,可为网站添加无限量流量监控。相比官方版有限制,自部署方案支持对任意网站通过指令快速启用统计功能。整个过程包括网站搭建、域名配置及数据统计均可由Codex通过SSH自动化完成,体现了“口喷建站”的便捷性。