Netflix 工程师开源 Headroom,在 Codex、Cursor 等 AI 编码工具外包围本地 Agent,自动压缩日志、JSON 和代码,保留逻辑准确性,减少 95% token 消耗。数据本地化,无需改代码,已获 35k GitHub 星标。核心将降本从改提示词、换模型转向输入前置处理。
Netflix 工程师开源 Headroom,在 Codex、Cursor 等 AI 编码工具外包围本地 Agent,自动压缩日志、JSON 和代码,保留逻辑准确性,减少 95% token 消耗。数据本地化,无需改代码,已获 35k GitHub 星标。核心将降本从改提示词、换模型转向输入前置处理。
This "loop" automation is nuts inside of Codex. "/goal go over every single feature in this app create a user story with...
GLM 5.2 is now on DeepSWE as the top open-source model on our leaderboard. With a pass@1 score of 44% at max effort, GLM...
Ethan Mollick指出,Codex/Cowork/Code等Agentic工具本质上是“软件脑”设计,只重最终代码,而多数知识工作的过程(研究、探索、原型分支等)与结果同样重要。长时运行模型Fable也因专注交付最终产品而难以用于深度知识工作,用户需费力用提示词绕过限制。这种工具与管理者/分析师思考方式的脱节,是突破编程领域、扩展到其他知识工作的关键障碍。
不求设计师!Codex一句话生成App图标,加快项目开发速度。 开源乔木icon设计Skill,支持两种方案: 1. Codex内调用Imagen生图能力,参考小耳@xiaoerzhan收集的几百个图标参考生成。 2. 支持搜索 2w SV...
Nah kalau lo pakai Devin, bisa akses GLM 5.2 gratis dan unlimited🤯 cuma konteksnya maksimal 200 ribu, kalau pakai yg ve...
开发者整理出一套Agentic Engineering Workflow,覆盖任务拆解、工具调用、记忆管理到错误恢复全流程,让AI像工程师一样自主规划、写代码、调试和交付,而非仅聊天写文案。该工作流包含tmux、agent记忆、skills、语音输入、长任务执行、并行worktree管理、多agent调度,以及可视化HTML编辑器Lavish和代码变更校验流水线no-mistakes。所有步骤均已在真实项目中跑通,强调工程方法比模型能力更重要。
目前看到关于 "Agentic Engineering Workflow"的最完整的介绍👇 花了一个小时完整看完了,完全可以做成一个付费教程。 内容涵盖了tmux,agent记忆,skills,语音输入,长任务执行,并行worktree管...
一位开发者花几个周末用AI辅助编程制作了一款类似Pokemon Go的App,但抓的是真实世界的猫。用户打开摄像头拍路边猫,App会检测照片中是否有真实的猫(防止截屏),然后将猫转化为复古卡通风格插画(奶油色调、粗轮廓),并添加到玩家的图鉴中。每只猫拥有名字、稀有度、等级、状态页和收藏卡,世界地图还能显示附近其他玩家抓到的猫。该App无融资、无团队、无市场预算,利用“全球六亿只流浪猫”这一普遍事实,让玩家不再错过路边的猫。
SOMEONE VIBE CODED POKEMON GO BUT FOR CATS YOU MEET IN REAL LIFE see a cat, open the camera, snap it, and it gets added ...
Genuinely impressed, almost shocked, at how good GLM-5.2 by @zai_org is at coding. This changes things.
兄弟们,喜大普奔哈哈! DeepSeek-V4-Flash 免费到6月28号,直接冲啊! 284B MoE,1M上下文,编码和Agent能力都不错,直接可以用起来,截止日期到6月28号。 链接:https://www.openmodel.ai
DeepSeek-V4-Flash is FREE until June 28! OpenModel Limited-Time Event: → Input: $0.00 / M → Output: $0.00 / M Powerful 2...
Genuinely impressed, almost shocked, at how good GLM-5.2 by @zai_org is at coding. This changes things.
一个自学编程的人,用 Claude Code 破解了3500 年前克里特岛的 Linear A 文字🤯 过去三年我们一直在说 AI 会取代人类专家,Linear A 这个案例恰好反过来了,一个自学工程师用 Claude Code 写了几百行 Python,交叉比对两个公开数据库,输出了一套 408 词的词典,但他从头到尾没让 AI "自己判断",所有假设都是他提的,AI 只负责跑验证。 Tom 用的方法很朴素:
Cool way to use Claude Code: deciphering Linear A, a 3500 year old written language from Crete https://aiclambake.com/cl...
BestBlogs周刊第100期特刊回顾两年AI发展,核心洞察:答案变便宜,判断变贵。模型层:DeepSeek-V3(6700亿参数、每次激活370亿、训练成本约557万美元)和R1(纯强化学习推理开源)将效率与开源变成新范式。AI编程层:Codex案例中模型7小时迭代200轮测试仅改动500行代码,验证成为新瓶颈;Claude Code内部编写约80%代码。工程范式从提示词转向上下文工程。两年间模型从问答知识库长成独立执行器,人从写代码退到判断、验证和为结果负责的位置。
随着实现速度加快,审查AI生成代码成为新瓶颈。作者发现,即便遵循分阶段、小变更等良好实践,审查自己未亲手思考过的代码仍带来认知过载。他经常拒绝AI编码助手生成的全部代码并从头重写,理由包括:无法用自己的话解释其思路、diff大于问题本身、在未证明必要性前就引入抽象、本地能运行但让系统更难推理、信任输出超过理解。作者主张必须人工审查与AI审查结合,强调AI仍需优秀工程师引导才能产出可持续的解决方案。
Cowart:Codex + 无限画布工具插件开源,大家可以来试试啦,这个插件先取名叫 Cowart,别问为什么叫这个,我只能说 Code with Art 这种冠冕堂皇的理由:https://github.com/zhongerxin/c...
李飞飞与David Roger提出“哑铃效应”:文本智能成本趋零,劳动力向顶尖1%专家和高能动性通才两极坍缩,中间岗位萎缩。Tokenmaxxing三月潮起——OpenAI工程师周耗2100亿token,Claude Code重度用户月花15万美元;五月迅速退烧——Amazon关闭排行榜,Uber烧光2026年全年预算,微软将工程师迁回Copilot CLI。数据揭示Agentic coding token消耗是普通问答千倍,70%耗于探索与修复;写代码效率增180%,但传导到发布仅剩30%增量。Claude Code八种上下文注入机制为高能动性通才提供工程抓手。
李飞飞提出“哑铃效应”,未来劳动力两极分化:顶尖工匠与高能动性通才。Tokenmaxxing 揭示,Agentic coding 真实成本是普通问答千倍,七成消耗在试错;写代码效率提升180%,但发布上线增量仅30%。Claude Code 详解八种上下文注入机制,引出 Dynamic Workflows。Microsoft 披露 AutoJack 攻击,浏览型AI Agent 被诱骗利用 MCP WebSocket 在 AutoGen Studio 主机实现代码执行。Vercel 推出 Agent Stack,集成 AI SDK、Gateway、Workflow SDK 等构建生产级 Agent。
http://x.com/i/article/2068480429980876800
OpenAI changing over their ChatGPT billboards in the city to Codex ones
现在 Codex 能将代码线程从笔记本无缝 handoff 到远程服务器,再随时接回。过程自动打包 Git 状态、未提交变更、分支、工作树等全部上下文,无需手动 sync 或重建环境。该功能消除了本地开发与远程重型计算之间的摩擦,让 agent 自动管理状态流动,用户可根据需要自由切换场景。
Codex can now hand off threads between local and remote hosts. Start work on your laptop, send it to a remote box before...
You can do this with a Steam Controller.
卧槽, 这真的有点东西哈哈~ Codex + Excalidraw = 无线画布,并且原生,无需额外插件👇👇
🚨 The Sims one shotted by GPT-5.6 Pro this is without codex or any coding harness , one shot entire game with logic in ...
Deedy Das观察到,随着CTO们极力推崇tokenmaxxing,软件工程师分裂为“懒惰者”与“工匠者”。懒惰者依赖AI代写代码、测试、回复消息,甚至同时胜任多份工作;工匠者则疲于审查堆积如山的PR和Slack消息,同事的AI代码敷衍了事,最终工匠者也放弃沦为懒惰者。这种现象常见于成立超10年的大公司,但并非所有公司如此——部分团队凭借合理的AI开发原则和互信机制仍保持高效。
宝玉认为处理错误应先恢复生产(回滚或打补丁,保留日志),再找根因(逻辑错误、边界条件、需求理解偏差),最后根据根因决定如何避免。仅当根因是AI对项目特有约定缺乏了解时(如命名规范、API隐含限制、团队测试规范),才应更新AGENTS.md。其他情况应分别用新增测试用例、重构架构、改进Code Review等方式解决。将一切塞入AGENTS.md会导致文件臃肿、规则繁多,AI反而忽略关键规则。
错误发生 → 修复问题 → 追问原因 → 写入 AGENTS.md → 以后 AI 记住规则。
科技媒体 testingcatalog 报道,OpenAI 有望下周推出 GPT-5.6 系列,涵盖 mini、标准版和 Pro 版。部分 Pro 订阅用户已可访问 GPT-5.6 Pro,理解力增强,前端/Web 开发认知有进步。性能方面,上下文窗口从 100 万 tokens 扩展至 150 万 tokens,优化了长周期编码能力和 Codex 响应速度。消息称在智能体编码中,GPT-5.6 已优于 Anthropic 的 Mythos 系列。定价上,OpenAI 当前 token 价格仅为 Anthropic 一半左右,计划进一步降价。
Codex 推出 Handoff 功能,支持用自然语言指令将正在进行的任务连同完整 Git 状态(未提交代码、当前分支)从笔记本迁移到远程服务器继续运行,之后可再拉回本地。前提:本地需在 Settings > Connections > SSH 配置远程主机;远程也需安装 Codex 并开启“允许其他设备连接”,双方登录同一 ChatGPT 账号;远程需有同一 Git 仓库的克隆并保存为项目,子目录路径需匹配。该功能解决了 AI 编程中途离开时任务进度的托管问题。
Codex can now hand off threads between local and remote hosts. Start work on your laptop, send it to a remote box before...