OpenAI 将其 AI 编程助手 Codex 集成到 iOS 和 Android 平台的 ChatGPT 应用中。这一更新使移动开发者能够通过 ChatGPT 应用直接访问 Codex 的编程辅助功能,支持代码生成、调试和优化等任务,扩展了 AI 工具在移动端的应用场景。
OpenAI 将其 AI 编程助手 Codex 集成到 iOS 和 Android 平台的 ChatGPT 应用中。这一更新使移动开发者能够通过 ChatGPT 应用直接访问 Codex 的编程辅助功能,支持代码生成、调试和优化等任务,扩展了 AI 工具在移动端的应用场景。
FrontierSmith 是一个自动化系统,能从现有封闭式编码任务中迭代演化出开放式问题。它通过改变问题目标、限制输出和泛化输入生成候选变体,并利用量化思维发散指标筛选能激发多元解法的问题,再由智能体生成测试用例与验证器。在两个开放式编码基准测试中,使用合成数据训练后,基础模型性能显著提升:Qwen3.5-9B 在 FrontierCS 上得分提高 +8.82,在 ALE-bench 上基于 Elo 评分的性能提升 +306.36;Qwen3.5-27B 分别提升 +12.12 和 +309.12。合成问题还使智能体进行更多轮次、消耗更多令牌,其特性与人工构建问题相似,表明封闭式问题种子可作为生成长视野编码数据的实用起点。
Wrote a skill that runs codex /review in a loop until there's no booboos anymore. Caveat: It won't fix system architectu...
Claude Code 在大型代码库中的工作原理文章发布,阐述该AI代码助手如何解析、理解和操作庞大代码项目,涵盖最佳实践与入门指南。内容涉及代码重构、效率提升等关键变化,并在Hacker News社区获得109点高度关注,反映开发者对其技术细节的广泛兴趣。
阿里发布AI编程工具Qoder 1.0,定位从“AI IDE”升级为“智能体自主开发工作台”。新版本将Quest模式升级为独立视窗,集成了任务管理、状态追踪等功能,开发者定义目标后,Agent可自主完成执行、验证和交付全流程。它支持跨项目、跨代码库并行运行多个Agent任务,并提供全局状态概览。此外,新增的自定义专家能力允许开发者配置专属Agent团队,融入特定领域知识与外部工具。
一名比特币玩家通过Claude成功找回11年前因密码遗忘而锁定的5个BTC(现价约40万美元)。关键并非暴力破解,而是Claude从其大学时代的混乱数据中,定位到一个可能早于密码更改的2019年钱包备份,并发现了开源恢复工具btcrecover中的一个逻辑错误。修复该错误后,钱包被成功解锁。相比之下,传统暴力破解方法耗时漫长,凸显了LLM在处理复杂历史数据与代码逻辑问题上的实用价值。
HOLY FUCKING SHIT OMG CLAUDE JUST CRACKED THIS SHIT, THANK YOU @AnthropicAI THANK YOU @DarioAmodei NAMING MY KID AFTER Y...
Grok Build is amazing. The early beta just dropped for SuperGrok Heavy users and the first real feedback from developers...
微软正通过WinUI 3框架优化Windows 11原生体验,旨在解决系统卡顿、臃肿及过度依赖网页技术等问题。优化已见成效:文件资源管理器启动过程中,WinUI框架内存分配次数减少41%,临时内存分配减少63%,代码执行时间降低25%。同时,开始菜单等核心组件正转向纯原生开发。微软还发布了新的命令行项目模板以简化开发,并引入AI智能体插件辅助编程。不过,部分优化因涉及破坏性改动,目前仍需开发者手动启用。
Sea Limited 首席产品官阐述了公司为何在工程团队中全面部署 Codex,以加速亚洲地区的 AI 原生软件开发。公司正推动开发模式向“智能体化”转变,让 AI 智能体承担从需求分析到代码生成、测试的更多开发任务。这一举措旨在显著提升工程效率,缩短产品迭代周期,并应对亚洲市场对敏捷、智能化软件开发日益增长的需求。
Cooking up something new 🧑🍳 Join the waitlist for early access to technical preview of the GitHub Copilot app 👇 https...
针对智能体建模领域因依赖闭源资源而受限的问题,研究团队推出了开源框架Orchard。其核心是轻量级环境服务Orchard Env,提供跨任务和流程的可复用沙箱管理基元。基于此构建了三个高效智能体方案:编码智能体Orchard-SWE在SWE-bench Verified上达到67.5%的准确率;视觉语言计算机使用智能体Orchard-GUI仅用少量数据便在多项基准测试中取得64.0%-74.1%的成功率;个人助理智能体Orchard-Claw仅用0.2K合成任务便在Claw-Eval上实现59.6%的pass@3成功率。该框架证明了其跨领域实现可复用数据、训练与评估的能力。
xAI推出Grok Build早期beta版,这是一个面向SuperGrok Heavy订阅者的代理CLI工具。其核心突破在于并行子代理机制,主代理可指挥多个子代理协同执行编码、研究等任务,实现结构化效率革命。战略上选择CLI界面,以支持脚本化、版本控制及与开发现有工具链集成。高价订阅旨在筛选重度开发者,获取真实项目中的高质量训练数据,加速产品迭代。此举标志着AI代理时代正式开启,未来开发者角色将向指挥AI代理军团协作转变。
An early beta of Grok Build, an agentic CLI for coding, building apps, and automating workflows is now available for Sup...
在ChatGPT客户端中使用Codex需先更新本地客户端,左侧会出现“设置 Codex 移动版”入口,但必须使用官方订阅账号,API模式无法显示。点击入口后,需用苹果或安卓原生相机扫码,ChatGPT应用内无扫码功能且微信不适用。接着登录ChatGPT账号,即使App已登录也需重新验证。授权后即可完成配置,后续可调整电脑保持唤醒状态的设置。客户端下载地址见评论。
让一百个人爱上你的产品,好过让一百万个人"有点喜欢"你的产品。 创业以后,特别认可一句话叫"优秀是卓越的阻碍"。就是说,一个很"优秀"的人,一个很"优秀"的产品很难有动力去把事情做到最后一公里。真正做出好东西的founder,很少有履历一路...
资深开发者与业务团队存在根本认知差异。业务团队生活在“消除不确定性”的循环中,追求快速试错验证,核心是速度。而资深开发者身处“管理复杂性”的循环,核心职责是保障付费服务的长期稳定,因此对增加系统复杂性的行为极为警惕。沟通失败在于,开发者用“控制复杂性”的理由拒绝需求,却未回应业务端“消除不确定性”的迫切诉求。解决方案是,开发者应将其精简需求、复用代码等专业能力,包装成能帮助业务“更快获得答案”的方案,例如使用“我们能不能试个更快的办法?”这样的话术。尽管AI能快速生成代码,但资深开发者不可替代的价值在于为系统长期稳定“承担责任”。
You've been asking for this one... Now in preview: Codex in the ChatGPT mobile app. Start new work, review outputs, stee...
OpenAI 在 ChatGPT 移动应用中推出 Codex 预览功能,用户可远程连接运行 Codex 的本地机器(如笔记本或 Mac mini)。通过安全中继层架构,系统能实时同步工作线程、审批请求与项目上下文,并回传截图、终端输出等结果,而所有文件与凭证均保留在本地,不上传云端。用户可在移动中启动任务、审阅输出或决策分叉,实现“云端中继+本地执行”的混合办公模式。目前该功能暂未支持 Windows 端。
You've been asking for this one... Now in preview: Codex in the ChatGPT mobile app. Start new work, review outputs, stee...
本期早报重点推荐了三项内容。Anthropic发布了Claude Code在大型代码库中的官方实践指南。OpenAI则公开了GPT-Realtime-2的实现细节并提供了开发演示视频。此外,少楠探讨了在大模型时代,当效率大幅提升(效率溢出)之后所带来的深层思考。
由于这篇文章太伟大了,所以我把它变成了一个 Agent Skill。 大家可以使用自己的 Coding Agent 安装一下这个 Skill,这样就可以用「最佳实践」来轻松地重构或者开发一个既容易跨平台、又极其接近 Native 性能的桌面...
xAI 面向 SuperGrok Heavy 订阅用户推出了 Grok Build CLI 测试版,这是一个用于编码、应用构建与工作流自动化的智能体命令行工具。其发布旨在通过用户反馈迭代产品。该工具核心特性包括优化的终端渲染性能、用于审阅复杂任务的可视化计划视图、支持并行执行最多8个角色的子智能体系统、可装载团队规范与知识的技能模块,以及支持团队共享的插件市场。其底层模型 grok-code-fast-1 在 SWE-Bench Verified 基准测试中成绩为70.8%,上下文窗口为256K。
An early beta of Grok Build, an agentic CLI for coding, building apps, and automating workflows is now available for Sup...
xAI 发布专为软件工程设计的编程智能体 Grok Build 早期测试版,目前仅限 SuperGrok 订阅用户在终端使用。该智能体提供“规划模式”,允许用户在任务执行前审核、修改或重写计划,批准后所有改动会以 Diff 形式呈现。此外,它支持直接调用 AGENTS.md 文件、插件、hooks、skills 及 MCP 服务,并兼容无头模式,便于集成到脚本与自动化流程中。CLI 还提供完整的 ACP 支持,以帮助用户构建机器人和智能体编排应用。
单亲妈妈Rebecca Braden基于自身在监护权诉讼中的艰难经历,开发了AI应用Case Clarity。该应用不替代律师,而是作为辅助工具,帮助身处法律程序中的人员集中管理文档、沟通记录和时间线,使律师依赖的信息更清晰可用。该应用基于Replit平台开发,源于真实生活经验。
OpenAI 宣布其代码生成模型 Codex 现已正式集成到 ChatGPT 移动应用中,用户可通过智能手机直接访问该功能,实现在移动环境中实时生成、编辑和调试代码。这一更新将 Codex 从桌面端扩展至移动平台,提升了编程的便携性和灵活性,方便开发者在户外或旅途中高效工作。该消息在 Hacker News 上获得 109 点关注度,显示出技术社区对此举的高度兴趣与积极反响。
Mitchell Hashimoto 关于 Bun 从 Zig 迁移到 Rust 的评论,引发了对技术选择锁定的思考。一家中型科技公司近期利用编码智能体,将原有的 iPhone 和 Android 原生应用重写为 React Native。团队选择 React Native 并非因为 AI 降低了维护两套代码的成本,而是因为 React Native 近年来的发展已能满足其所有需求。关键在于,即便未来证明此选择错误,他们也能轻松迁移回原生平台。这印证了当前编程语言与技术框架的“锁定效应”已显著减弱,技术回退或切换的成本和风险大大降低。
Anthropic发布Claude Code大型代码库实践指南,强调Harness配置(如CLAUDE.md、Hooks)与模型能力同等重要,是决定实际体验的关键,并指出RAG在高速迭代代码库中存在时效性局限。同时,OpenAI通过Build Hour解析GPT-Realtime-2,展示语音Agent正从聊天机器人演进为“语音→行动”的自主工作流。此外,当AI将开发周期从月压缩到小时,效率提升正引发协作方式与组织结构的重构难题。
xAI正式发布Grok Build的早期Beta版本,这是一个专为编码、构建应用和自动化工作流设计的agentic命令行界面。它支持并行子代理、计划视图及团队共享市场,并能集成MCP skills等扩展功能。目前仅面向SuperGrok Heavy订阅者开放。xAI选择深耕CLI,旨在让开发者直接在终端驱动agent团队,推动agent技术从演示融入实际工作流。
Codex手机版已正式推出,但并非独立的应用程序,而是直接集成在ChatGPT手机App内部。用户只需在客户端选择并设置Codex,即可通过手机远程控制AI编程任务。核心功能是让用户即使不在电脑前,也能实时监控AI的代码编写、任务执行进度与卡顿点,并可直接批准其继续运行。具体操作包括查看任务线程、检查代码差异与测试结果、向Agent发送新指令、批准危险操作、切换模型以及创建并运行新任务。
Mitchell Hashimoto 针对 Bun 从 Zig 移植到 Rust 一事发表评论,指出编程语言正变得越来越可替代。他认为,过去编程语言常形成技术锁定,但现在情况已大不相同。Bun 团队展示出他们可以在大约一两周内用任何他们想要的语言重写项目,Rust 也不例外。语言变得可消耗,有用时则用,不再适用时便可弃用,这一现象值得关注。
Claude 代理工具发布 v2.1.142 版本。本次更新新增了 --add-dir、--settings、--model 等 8 个用于配置后台会话的命令行标志,并将 Fast 模式的默认模型升级为 Opus 4.7。插件功能得到增强,拥有根目录 SKILL.md 的插件现可被识别为技能,插件详情面板会显示其提供的 LSP 服务器。此外,版本修复了超过 15 项问题,包括 MCP 工具超时设置失效、后台会话在系统休眠后异常断开、守护进程升级后无法正常退出、Windows 网络驱动器工作目录下死锁等关键错误,并改进了响应式压缩和钩子配置错误提示。
You've been asking for this one... Now in preview: Codex in the ChatGPT mobile app. Start new work, review outputs, stee...
Codex is getting easier to automate and customize around your code. 🪝 Hooks customize the Codex loop with scripts that ...
OpenAI在ChatGPT的iOS和安卓App中推出Codex预览功能,所有用户均可使用。该功能并非让手机直接运行代码,而是作为一个远程操作窗口,允许用户在外出时查看任务进度、审核代码差异与测试结果,并进行决策。实际计算任务仍在用户的笔记本电脑、Mac mini或devbox上执行,文件与凭证不会传输至手机。此举旨在满足Codex每周超400万活跃用户处理长任务时的远程监控需求。目前手机端仅支持连接macOS设备,Windows版本即将推出。该集成符合OpenAI将多项服务合并至单一入口的“超级App”战略。
You've been asking for this one... Now in preview: Codex in the ChatGPT mobile app. Start new work, review outputs, stee...