Something a little fun for Friday! This was super fun to work on with @Rjdleee. Pets adds a little more whimsy to Codex,...
Codex redefines my workflow to the point where I should probably buy a new machine Last year I bought a 36GB M4 Pro MBP ...
Adam Tornhill重新探讨函数应写多长的问题。AI模型理解代码的方式与人类不同,依赖字面特征如命名、结构和局部上下文,研究表明变量名对AI理解能力影响显著。Fowler认为函数长短本身不重要,关键是将意图与实现分离;若代码需阅读才能理解其功能,就应提取为函数并用清晰名称表达意图。这一逻辑在AI编程中同样成立,强调命名和结构对提升AI代码理解的重要性。
Codex 0.128.0 is huge, even better than a @thsottiaux reset. Codex is moving more goal oriented with a new /goal command...
http://x.com/i/article/2049902517254070272
鲸鱼兄弟们好,我是做 DeepSeek-TUI 的那个美国佬。 说真的,特别想跟国内的鲸鱼兄弟们一起混--但我的翻墙技能仅限于写代码,微信到现在都没搞定,属实有点丢人。 求各位大佬帮个忙: 1)帮忙转发扩散一下,让这个开源终端工具翻过高墙被...
Andrej Karpathy指出,LLM的核心价值并非加速现有工作,而是创造以前不可能存在的事物,例如完全无需传统代码、由LLM原生驱动的应用。他提出“锯齿状智能”模型,解释LLM能力不均的现象:高价值、可验证领域因经济驱动获得密集训练,能力突出;其他领域则依赖泛化,表现不稳定。未来产品将被解构为感知、执行与逻辑,横跨软件1.0至3.0范式。程序员角色将转变为设计智能体系统、守护人类品味的架构师。真正的护城河在于理解LLM能力地图并设计放大人类意图的智能体系统。
Fireside chat at Sequoia Ascent 2026 from a ~week ago. Some highlights: The first theme I tried to push on is that LLMs ...
Codex App 结合 GPT-5.5 与 GPT-Image-2,构建了从视觉理解到代码生成、浏览器执行及效果评估的开发闭环。GPT-5.5 提升了编码细节与复杂逻辑处理能力,GPT-Image-2 擅长生成高保真UI。工作流支持输入截图或概念设计,自动分析、生成交互应用并修正设计偏差,内置结构化流程以提高实现保真度。这大幅缩短了从想法到高保真应用的迭代周期,适用于Web、移动及复杂工具开发,但复杂任务仍需人工提示与设计把关。
http://x.com/i/article/2049579443216338944
http://x.com/i/article/2049902517254070272
开发者仅通过向Codex描述想法,便在一个下午内完成了roguelike卡牌游戏《夜巡录:荒庙篇》的开发。Codex不仅生成游戏原型,还自主构建了素材生产流水线,包括调用GPT-Image 2.0生成绿幕图并自动抠图。面对大量未命名素材,它创新性地将所有图片拼合成一张大图供多模态模型一次性识别筛选。后期还打磨了受击反馈、音效及使用Seedance 2.0生成的动画等细节,展现了其结合内置工具与强大执行力的综合能力。
http://x.com/i/article/2049902517254070272
作者利用Emergent和Claude Agent,无需编写Three.js代码或搭建环境,仅通过上传参考视频和描述需求,即在一个下午内全自动生成并迭代出可运行的3D交互网站原型。成本仅为每月20美元Claude订阅费,而以往同类外包项目报价高达8000至15000美元,标志着3D网站开发门槛已大幅降低。
本来是想随便玩一下的。 没想到 Codex 真的用一下午帮我开发了一个非常完整的类似《杀戮尖塔》的卡牌游戏。 代码和客户端都已经开源了,大家可以试试
OpenAI在Codex CLI 0.128.0版本中正式推出Ralph loop功能,通过新增的/goal命令实现目标驱动的持续执行。用户只需在配置文件中启用该功能,即可为AI助手设定一个目标,系统将自动保持该目标在多轮对话中的连续性,直至任务完成。此举简化了工作流程,用户无需再手动编写脚本或借助外部工具进行状态维护。该功能目前仅限终端CLI使用,桌面应用程序暂未支持。
/goal also lands in Codex CLI 0.128.0. Our take on the Ralph loop: keep a goal alive across turns. Don't stop until it's...
Karpathy指出,LLM的核心价值在于创造新可能性(如取代传统代码的MenuGen、.md技能和知识库),而非仅加速旧流程。模型能力呈现“锯齿状”分布,由任务可验证性和商业利益共同塑造。未来将进入“Agent原生”经济,基础设施需面向智能体设计,强调信息的可读性,Agentic Engineering成为新兴工种,神经计算可能主导任务处理,经典CPU退化为协处理器。
Fireside chat at Sequoia Ascent 2026 from a ~week ago. Some highlights: The first theme I tried to push on is that LLMs ...
Andrej Karpathy提出软件3.0时代,编程核心转向上下文工程,并区分了Vibe Coding与Agentic Engineering两种开发姿态。OpenAI总裁Greg Brockman指出,算力套利是商业模式,人类注意力已成为新瓶颈,并估算AGI进程已完成八成。Anthropic的Claude Code团队则将Prompt Caching提升为核心工程纪律,通过优化prompt布局和更新机制,将缓存命中率作为关键SLA监控,以控制成本并保证系统性能。
Karpathy提出软件3.0概念,编程核心从写代码转向提供上下文,并区分Vibe Coding与Agentic Engineering两种模式。OpenAI总裁Brockman将AGI瓶颈从算力移至人类注意力,估计已完成80%。Anthropic分享Claude Code实战,以Prompt Caching命中率为SLA监控,将“上下文即新代码”转化为工程纪律。
http://x.com/i/article/2050006014297346048
测试者使用 DeepSeek-V4-Pro 在 Pi 编码智能体上构建了一个 LLM 知识库,对其开箱即用的表现感到震撼。这是首个在推理能力上媲美 Claude 和 Codex 的开源权重模型,且成本效益高,支持 100 万上下文长度。该模型无需复杂配置即可在基础框架中直接运行,擅长智能体编码和知识密集型推理任务,能跨公司文档、论坛、论文和代码库进行多步骤研究、代码生成与上下文推理。其高效运行得益于 Fireworks 的市场最快推理速度及混合注意力设计,将 KV 缓存降至 10%,推理计算量减少近 4 倍,实现了快速且低成本的实践部署。
Apple accidentally left Claude.md files in today's Apple Support app update (v5.13)
Karpathy指出,2025年12月AI生成代码从需修改变为直接可用,标志进入Vibe Coding状态。软件开发进入Software 3.0大语言模型时代,编程核心转为通过prompt等操纵LLM。LLM能力呈锯齿状智能,在可验证、RL优化领域强,但常识任务上易犯错。他区分Vibe Coding(提高开发下限)与Agentic Engineering(守住质量、安全上限),强调人类理解、品味和判断仍最宝贵。未来可能转向神经计算机,基础设施需Agent-first。
http://x.com/i/article/2049616699541090304
刚刚看到Claude Security 现已进入公测阶段!可以让Claude 帮你检查漏洞了啊! 目前已经内置于网页版的 Claude Code 中。 只需将其指向一个代码仓库,即可获得经过验证的漏洞发现结果,并在 正在编写代码的同一位置修复它们! 这个功能挺实用,什么时候可以直接cc里可以用。 地址:https://claude.com/product/claude-security
Claude Security is now in public beta, built into Claude Code on the web. Point it at a repo, get validated vulnerabilit...
Naval提出“氛围编程”(vibe coding)概念,将其比喻为带有真实世界奖励的视频游戏。用户通过自然语言描述想法,AI即可生成可运行的真实应用,创造出能分享、盈利甚至改变生活的产品。这消除了传统开发中对工程师的依赖,允许创作者完全按自身愿景迭代。其核心变革在于应用开发主体的扩大:从专业程序员转变为任何能用清晰语言描述想法的人。这标志着创作者经济进入从内容创作到直接构建产品的新阶段,并可能催生更多个人开发的爆款应用。该过程具有游戏的即时反馈与成瘾性,却在现实中积累真实资产。AI并非取代程序员,而是将编程转变为一种人人可用的超级能力。
Follow @navalpodcast. We are posting more clips there.
Codex goal feature seems cool Looks like you can give Codex a goal and it'll continue to work, plan, and test until it's...
Anthropic为Claude Enterprise客户推出Claude Security公开测试版,将Claude.ai转变为代码库扫描器,用于发现漏洞、验证上下文并生成补丁建议。与传统模式匹配扫描器不同,该工具能处理跨文件的复杂漏洞,减少误报和漏报。产品作为内置工作流集成,无需额外API或代理构建,支持扫描范围设置、并行项目和定期扫描。发现可导出、推送或用于修复会话,提升企业代码安全效率。
Claude Security is now in public beta for Claude Enterprise customers. Claude scans your codebase for vulnerabilities, v...
Codex for everything: - Dynamic UI for the task at hand - 20% faster computer & browser use - Even better slides and she...
It's never been easier to do everyday work with Codex. Choose your role, connect the apps you use every day, and try sug...
给大家说下目前使用 DeepSeek-V4 (pro/flash) 的最需要注意的问题. 本身其实并不算 bug, 但是却很致命. 问题大概是这样的, 在请求 DeepSeek API 或者 terminal coding agent (c...
Claude Security is now in public beta for Claude Enterprise customers. Claude scans your codebase for vulnerabilities, v...
CodexPotter 是一个命令行工具,通过后台启动 Codex CLI 并采用“Ralph Loop”机制执行任务。它先将用户目标写入 MAIN.md 文件,随后在全新上下文中反复启动 Codex 会话,对照该文件检查并修正代码,直至输出与目标一致,默认最多进行 6 轮迭代。该工具适用于目标明确的任务(如按文档实现功能),而非交互式讨论。其名称灵感来源于《辛普森一家》中爱重复说话的 Ralph Wiggum。作者推荐此工具,以回应寻找类似 Claude Code 中 Ralph 插件的需求,并指出其不会像某些插件那样修改用户配置。
请问有没有好用的 Ralph Loop for Codex? 类似于 Claude Code 的 Ralph Wiggum Plugin https://github.com/anthropics/claude-code/blob/main...
Fun fact - if you have a recent commit that mentions OpenClaw in a json blob, Claude Code will either refuse your reques...
我操,Codex 太牛逼了! 自己给我做了一个类似于《杀戮尖塔》的爬塔游戏,从代码到素材全是自己搞。 我就跟他说了一个要做类似《杀戮尖塔》的游戏,要中国风格的 这是能玩的!
太猛了,Codex 做类《杀戮尖塔》游戏完整关卡演示! 现在非常细了,除了没有声音以外,其他的都相当完美了! 主要的场景和角色素材是 GPT-Image 生成的,其他的素材是他自己找的。
我操,Codex 太牛逼了! 自己给我做了一个类似于《杀戮尖塔》的爬塔游戏,从代码到素材全是自己搞。 我就跟他说了一个要做类似《杀戮尖塔》的游戏,要中国风格的 这是能玩的!