AIHOT
内容
精选全部 AI 动态AI 日报主题收藏
接入
Agent 接入
更多
关于更新日志反馈
内部员工登录
精选全部日报更多
内部员工登录
全部动态X · 2081 条
全部一手资讯X论文
标签「编码」清除
Rohan Paul@rohanpaul_ai · 4月30日54

The paper proposes a way for a coding agent to rewrite its own tools and rules, then check whether each change really helped. The big deal is that it turns harness tuning from guesswork into an auditable experiment, so the part of agent systems that quietly eats the most time and effort can now improve itself in a controlled and measurable way. The problem is that agent harnesses, meaning the prompts, tools, memory, and rules around a model, are usually tuned by hand or changed through messy self-improvement loops that produce lots of edits but little clear evidence about what helped. The method, called Agentic Harness Engineering, turns those edits into file-level parts that can be changed or rolled back, compresses huge run logs into short failure evidence, and makes the agent write a prediction for each edit that later gets checked against real task results. They tested this on Terminal-Bench 2, a hard coding benchmark in a terminal, by starting from a very small shell-only harness and letting the loop run for 10 rounds while keeping the base model fixed. The single-try success rate rose from 69.7% to 77.0%, beating Codex-CLI at 71.9% and other self-evolving baselines, which suggests the gains came from better harness design rather than from swapping in a stronger model. The final harness also carried over to other models and to SWE-bench-verified, with gains of 5.1 to 10.1 points across model families and 12% fewer tokens than the seed on SWE-bench-verified, which matters because harness work is expensive and this gives a more reliable way to let that layer improve itself without drifting into random noise. ---- Paper Link – arxiv. org/abs/2604.25850 Paper Title: "Agentic Harness Engineering: Observability-Driven Automatic Evolution of Coding-Agent Harnesses"

译本文提出Agentic Harness Engineering方法,使编码代理能自动重写自身工具和规则,并通过可审计实验验证每次更改的有效性。传统代理工具调整依赖手动或混乱自我改进循环,缺乏明确证据。该方法将编辑转化为文件级可回滚部分,压缩运行日志为简短失败证据,并让代理为编辑写预测后基于任务结果检查。在Terminal-Bench 2测试中,从小型shell-only工具开始,经10轮进化且基础模型固定,单次尝试成功率从69.7%提升至77.0%,超越其他基线。最终工具可迁移至其他模型和SWE-bench-verified任务,在不同模型家族获得5.1到10.1点提升,并减少12%令牌使用,为昂贵工具工作提供可靠、可控的自我改进途径。

Alibaba Cloud@alibaba_cloud · 4月30日65

Qwen3.6-Plus is now available on @togethercompute. Ship it.

译Qwen3.6-Plus 现已在 @togethercompute 上线。快来使用吧。

阿绎 AYi@AYi_AInotes · 4月30日49

我最近在想一件事, 为什么 Cursor 要做 Agent Kanban? 表面上是个看板——像 Linear,或者像 Trello, 但每张卡片对应的不是任务, 更像一个正在运行的 Agent。 Completed、Failed、Running、Pending,状态实时更新, 还能直接看 artifact、PR 链接,失败原因一目了然。 你不需要去聊天框里一遍遍 @它 , 只需要把任务扔进去。 更有意思的是, 这个东西叫 cookbook 示例, 官方说这是个参考实现, 你拿去自己造。 Cursor 也没说这是个完整的产品, 他们说的是你照着这个思路自己搭。 我觉得这是个很重要的信号。 讲真我想了一下才反应过来,这件事真正改变的是啥。 首先肯定不是速度,也不是界面, 真正改变的是你和代码之间的关系。 比如说以前是你写代码 , 后来是你 prompt AI 写代码, 现在是你扔任务, Agent 去认领、执行、更新状态, 你坐在看板后面看进度, 然后backlog 变成了编程语言。 当然,也有没说清楚的部分, 比如demo 里就有 FAILED 和 EXPIRED 的卡片, 看到社区有人说,没有人在做 review 层,Agent 标 Completed 不代表它做对了之类的, 但其实60 分钟运行上限、rate limit、失败率,这些都还在。 所以原型迭代快,生产还是得靠人扛才行😂 但我一直觉得,工具的边界在哪里其实也没那么重要, 真正重要的是你在用它之前,有没有想清楚,那些机械的、重复的、可以被描述清楚的活儿,为什么还要自己做?

译Cursor推出的Agent Kanban并非完整产品,而是一个鼓励开发者自行搭建的参考实现。其核心变革在于改变了开发者与代码的交互模式:从亲自编写,到用prompt指挥AI,如今演变为将任务抛入看板,由Agent自主认领、执行并更新状态,开发者则退居幕后监控进度,使任务待办列表本身成为一种“编程语言”。尽管当前原型存在运行时限、失败率等限制,且缺乏结果审核机制,但其关键启示在于促使开发者重新思考:为何还要亲自处理那些机械、可被清晰描述的重复杂任务。

Yuchen Jin@Yuchenj_UW · 4月30日46

Shots fired. “If you have a recent commit that mentions OpenClaw in a json blob, Claude Code will either refuse your request or bill you extra money.” Seriously??? I can’t believe this is real.

译开火了。 "如果你的近期提交中,在某个json数据块里提到了OpenClaw,Claude Code要么会拒绝你的请求,要么会向你额外收费。" 真的假的???我简直不敢相信这是真的。

Tibo@thsottiaux · 4月30日34

Send us feature requests for codex in the form of an images 2.0 generated image. It makes it easier for codex to implement if we decide to go for it. Saw some good ones today already that codex is cooking on.

译请以图像2.0生成的图片形式提交您对codex的功能请求。如果我们决定采纳,这将使codex更容易实现。今天已经看到一些codex正在酝酿的优秀建议。

歸藏(guizang.ai)@op7418 · 4月30日37

我操,Codex 太牛逼了! 自己给我做了一个类似于《杀戮尖塔》的爬塔游戏,从代码到素材全是自己搞。 我就跟他说了一个要做类似《杀戮尖塔》的游戏,要中国风格的 这是能玩的!

ginobefun@hongming731 · 4月30日51

Codex 现在进化得也很快,不再只是编码助手了,OpenAI 内部将其定位为软件工程智能体,可在「读取-规划-执行循环」中运行测试并协调子智能体。 最新 AI Engineer 里有一个一小时左右的 Full Workshop,讲解子智能体并行执行、插件生态扩展、Guardian 安全门控与 MCP 集成,以及 Codex 获得 300 万周活跃用户背后的工程基础。值得一看。

译Codex已从编码助手快速进化为软件工程智能体,OpenAI内部将其定位为能在读取-规划-执行循环中运行测试并协调子智能体的系统。最新AI Engineer的Full Workshop讲解了子智能体并行执行、插件生态扩展、Guardian安全门控与MCP集成,以及Codex获得300万周活跃用户背后的工程基础,展示了其在软件工程领域的应用潜力和发展进展。

OpenAI Developers@OpenAIDevs · 4月30日63

You can just build web apps

译你完全可以构建网络应用

OpenAI Developers@OpenAIDevs · 4月30日64

With the Figma plugin, Codex can now turn implementation plans into visual FigJam boards.

译通过Figma插件,Codex现在可以将实施计划转化为可视化的FigJam白板。

Replit ⠕@Replit · 4月30日41

The age of prompting is ending. What comes next: new interfaces and fully autonomous agents that push instead of pull. Amjad on the post-prompting era, live with @southpkcommons ⠕ Full conversation below.

译提示词时代正在终结。 接下来是:新的界面和全自主代理,它们将推送而非拉取。 Amjad 谈后提示时代,与 @southpkcommons 直播中 ⠕ 完整对话如下。

OpenAI@OpenAI · 4月30日26

Still wondering how you can use Codex for (almost) everything? Codex can help with more of the work that supports the work, from organizing research to making spreadsheets, decks, and summaries.

译还在思考如何将Codex用于(几乎)所有事情吗? Codex能协助更多支持性工作,从整理研究到制作电子表格、演示文稿和摘要。

阿绎 AYi@AYi_AInotes · 4月30日67

我等了整整一年的东西,终于来了, Cursor今天正式发布了它的SDK, 这回可远不只是又一个编程工具的小更新, 可以说是人类历史上第一次, 把生产级的编程能力,变成了可以随便嵌入的基础设施, 以前你只能在Cursor编辑器里用它的Agent, 现在你可以把同一个Agent, 塞进你的CI流水线, 塞进你的自动化脚本, 塞进你自己的产品里, 甚至塞进任何你能想到的地方, 最狠的是, 它用的是和桌面端完全一样的runtime, 一样的harness, 一样的模型, 你在编辑器里看到Agent有多聪明, 你嵌入到产品里的Agent就有多聪明, 不用自己搭沙箱, 不用自己做上下文管理, 不用自己写工具调用, 所有Cursor过去一年踩过的坑, 打磨过的所有细节, 现在全部免费开放给你了, 可能很多人还没意识到这件事的分量, 这么说吧,过去所有的编程Agent, 都只是在编辑器里帮你写代码, 但从今天开始, Agent可以在任何地方写代码, 它可以在后台自动修bug,自动提PR, 可以在用户点击按钮的时候,实时生成功能, 可以在CI失败的时候,自己修复构建错误, 充当开发者的角色,第一次从写代码的人,变成了指挥Agent写代码的人, 现在Cursor也不再只是一个更好的VS Code, 它正在变成整个AI编程时代的操作系统, 这意味着我们所有人,都站在了一个新时代的门口🚪🚀💻🤖

译Cursor正式发布SDK,将生产级编程Agent能力转化为可嵌入基础设施。此前Agent仅限于编辑器内使用,现可通过SDK集成到CI/CD流水线、自动化脚本或自有产品中,且采用与桌面端相同的runtime、harness和模型,确保智能程度一致。用户无需自行处理沙箱、上下文管理或工具调用,即可免费利用Cursor积累的经验。这使编程Agent能突破编辑器限制,在后台自动修bug、提PR、实时生成功能,甚至修复CI构建错误。开发者角色从直接编码转变为指挥Agent,Cursor正演变为AI编程时代的操作系统。

Ant Ling@AntLingAGI · 4月30日72

What's the secret sauce behind the flagship instruct model built for fast execution & high efficiency at scale? Reliable infra with the proper optimizations, from the #SGLang friends at @lmsysorg 以为昨天的 100B 已经打满,今日 1T 方知,打得还可以更满~ 🥳 Onto the next optimization~ 🫡

译SGLang团队(隶属于LMSYS Org)揭示了其旗舰指令模型实现快速、高效、大规模执行的关键在于可靠的基础设施与针对性优化。团队宣布对AntLingAGI发布的Ling-2.6-1T万亿参数模型提供Day-0支持。该模型采用快速思考方法,在保持质量的同时,成本可比同类模型降低约4倍,并在AIME26和SWE-bench基准测试中达到SOTA水平。它专为高级编码、复杂推理和大规模智能体工作流设计,具备万亿参数能力与即时模型延迟。团队正持续进行优化,以进一步提升性能。

Yuchen Jin@Yuchenj_UW · 4月30日54

AI lets you outsource coding. The trap is thinking you can outsource understanding.

译AI让你可以将编码外包。 陷阱在于你认为自己可以将理解外包。

Claude@claudeai · 4月30日27

Another Claude Code hackathon comes to an end. Thank you to everyone who spent a week building with Opus 4.7, and to @cerebral_valley for co-hosting. Introducing the winners:

译又一场Claude Code黑客马拉松落下帷幕。 感谢所有花一周时间基于Opus 4.7进行构建的参与者,也感谢联合主办方@cerebral_valley。 现在揭晓获奖者:

凡人小北@frxiaobei · 4月30日38

刚好今天下午跟团队开会,聊到了 Symphony。 过去这段时间团队手搓了一套系统,想解决一个很现实的问题: 别再让产品和技术被各自的工具链锁住了。 现阶段虽然 AI Coding 大家虽然玩的很溜,但认知上还未对齐,还在遵守老的规范,产品做需求,做完需求评审,评审完以后技术守着 codex、claude code 或者 cursor 这种本地工具,开发协作还是靠人肉对齐,整个过程其实很割裂,效率也不稳定。 这个平台做的事情很简单粗暴,要把这些能力收敛到同一套平台里,让 coding 从人驱动工具切换变成 Agent 任务驱动。 今天刚好讨论的一个关键点就是任务要用 Symphony 串起来。 什么意思? 就是以后团队里任何一个人,只要不颠覆大的设计目标,都可以直接提需求 → AI 自动拆解 → 自动构建 → 自动交付初版。 所有人要做的事情只剩两件,提需求、验证、兜底。 你可能会说,OpenAI、Authoropic 这些公司已经这么干了,但其实对于我们来说,现阶段可能刚刚好。 现状是开发到提测这个流程是没什么问题了,接下来我们打算把产品也收到这里边来,测试也尝试对接进来,看看到底能走到一哪一步。

译团队开发了Symphony平台,旨在解决产品与技术因工具链割裂导致的协作效率低下问题。该平台将AI Coding能力收敛至统一环境,推动开发模式从人驱动工具转变为Agent任务驱动。其核心是让AI自动处理需求拆解、构建与交付初版,团队仅需负责提出需求、验证结果与提供兜底。尽管类似实践已在行业中出现,但对团队而言当前正是推行时机。未来计划进一步整合产品与测试流程,以探索自动化开发的极限。

Peter Steinberger 🦞@steipete · 4月30日58

Integrated codex review into clawsweeper. I'm using a very similar system prompt so this gets you the same as /review, and clawsweeper has automerge, loops until it stops finding new issues. https://github.com/openclaw/clawsweeper

译已将代码审查集成到 clawsweeper 中。 我使用了非常相似的系统提示,因此这能提供与 /review 相同的效果,而且 clawsweeper 具备自动合并功能,会循环运行直至不再发现新问题。https://github.com/openclaw/clawsweeper

OpenAI Developers@OpenAIDevs · 4月29日48

Add Codex seats with a $0 seat fee for a limited time. Through the end of June, eligible ChatGPT Business and Enterprise customers can add Codex-only seats, making it easier to give more developers access to Codex in their day-to-day workflows.

译限时添加 Codex 席位,免收席位费。 在六月底之前,符合条件的 ChatGPT Business 和 Enterprise 客户可以添加仅限 Codex 的席位,从而更轻松地让更多开发者在日常工作流程中使用 Codex。

elvis@omarsar0 · 4月29日55

// Agentic Harness Engineering // Pay attention to this one, AI devs. (bookmark it) Most coding-agent harnesses are still tuned by hand or brittle trial-and-error self-evolution. This new work introduces Agentic Harness Engineering, a framework that makes harness evolution observable. They do this through three layers: components as revertible files, experience as condensed evidence from millions of trajectory tokens, and decisions as falsifiable predictions checked against task outcomes. Each edit becomes a contract you can verify or revert. Results: pass@1 on Terminal-Bench 2 climbs from 69.7% to 77.0% in ten iterations, beating human-designed Codex-CLI (71.9%) and self-evolving baselines like ACE and TF-GRPO. The evolved harness also transfers across model families with +5.1 to +10.1 point gains, while using 12% fewer tokens than the seed on SWE-bench-verified. Harness work is the biggest hidden cost in most agent systems. This is the first credible recipe for letting the harness improve itself without drifting into noise. Paper: https://arxiv.org/abs/2604.25850 Learn to build effective AI agents in our academy: https://academy.dair.ai/

译针对AI智能体开发中依赖人工调试、成本高昂且脆弱的“缰绳”设计问题,研究者提出了“智能体缰绳工程”框架。该框架通过三层设计实现可观测的进化:将组件视为可回滚的文件、从海量运行轨迹中提炼经验证据、将决策转化为可由任务结果验证的预测。每次修改都成为可验证或回滚的“合约”。实验表明,该框架在十次迭代内将Terminal-Bench 2的pass@1分数从69.7%提升至77.0%,超越人工设计与基线方法。进化后的缰绳能跨模型迁移并提升性能,同时在SWE-bench上减少12%的令牌消耗,为智能体系统的核心组件提供了首个自动化、可靠的优化方案。

Sam Altman@sama · 4月29日48

i love that the team does stuff like this

译我喜欢团队做这样的事 [引用 @Mugilan_SS]:Codex 和 claude code 不一样。 如果你知道限制即将结束,比如最后10%到8%,给它一个很长的运行任务,即使限制时间到了,它也会继续执行任务直到完成。 向 @OpenAI 团队致敬。

Sam Altman@sama · 4月29日46

feels like codex is having a chatgpt moment

译感觉Codex正在经历一个ChatGPT时刻

向阳乔木@vista8 · 4月29日43

这个Skill有点意思,提示词优化大师Skill。 像我和姚老师写的元Prompt。 虽然是纯文本Skill,但针对了不同场景做优化,比如哪怕是写代码,也有不同的工具,比如Claude Code还是Cursor,提示词会有差异。 生图提示词会考虑用Midjourney还是其他,给出不同提示词。 目前有6k多Star,等我测试下,地址见评论区

译一款名为“提示词优化大师”的纯文本Skill获得了超过6000个Star。其核心价值在于针对不同的具体使用场景和工具,提供差异化的优化提示词。例如,在代码生成场景中,会根据用户是使用Claude Code还是Cursor来调整提示词;在图像生成场景中,则会区分Midjourney等不同工具来提供相应的提示词。该Skill的设计思路类似于精心编写的“元Prompt”,旨在提升用户与各类AI模型交互的效率和效果。

Peter Steinberger 🦞@steipete · 4月29日53

codex now runs on each commit we land, reviews it - and if a booboo is found, a new codex spins up and (if still relevant) makes a PR for the fix. Then a review agent spins up. If an issue is found, another agent will fix the issues. (up to 5 loops) https://github.com/openclaw/openclaw/pull/74065

译codex 现在在我们每次提交的代码上运行,并对其进行审查——如果发现错误,就会启动一个新的 codex 实例,并在(问题仍然存在的情况下)创建一个修复该问题的 PR。 随后会启动一个审查代理。如果发现问题,另一个代理将负责修复这些问题。(最多循环 5 次)https://github.com/openclaw/openclaw/pull/74065

Tibo@thsottiaux · 4月29日42

With some small tweaks, Codex can work for days on hard tasks. We will release some changes to make this easier to use for everyone. What’s the hardest task you’ve seen GPT-5.5 succeed at?

译通过一些小调整,Codex 能在困难任务上连续工作数天。我们将发布一些更新,让每个人都能更轻松地使用它。 你见过 GPT-5.5 成功完成的最困难任务是什么?

ginobefun@hongming731 · 4月29日72

分享创业公司的三大生存法则:差异化、专注与速度

译针对AI初创公司是否必须被大模型实验室收购的讨论,Cognition公司的经验表明,同行被收购反而会强化剩余独立公司的地位。独立公司在软件工程等动态领域拥有明确市场,客户重视模型灵活性。其成功关键在于三大法则:一是建立清晰差异化,如专注企业市场、加速全开发周期、解决复杂部署难题并保持模型独立;二是极致专注,在特定领域深挖边缘复杂性问题,做到实验室无法比拟;三是保持速度优势,利用小团队决策快、工具链高效和工程文化,通过快速迭代建立竞争壁垒。

Yuchen Jin@Yuchenj_UW · 4月29日14

“Claude is killing jobs. Software engineering is dying.” 50 bugs in Claude Code. 💀

译“Claude 正在扼杀工作。软件工程正在消亡。” Claude Code 中有 50 个漏洞。💀

小互@xiaohu · 4月29日57

TRAE 也推出了内置语音功能 可以直接进行语音输入... 还和 Insta360 推出了联名的 Mic Air 无线麦克风 用嘴写代码 用嘴办公正在流行起来🥲 这个内置语音功能,除了能将你嗯嗯啊啊很多语气词大段内容转录成结构化的文字外 它有个牛P的功能就是:命令和技能也能语音识别除了,给你加在输入框... 用了一周,感觉还是很不错的,下面是体验↓

译TRAE推出内置语音功能,支持直接语音输入,并能将包含大量语气词的即兴口语转录为结构化文字。其核心亮点在于能够识别语音命令和技能,用户可通过语音直接操作输入框等功能。此外,TRAE还与Insta360合作推出了联名Mic Air无线麦克风。这一功能体现了“用嘴写代码、用嘴办公”的交互趋势,初步用户体验反馈积极。

ginobefun@hongming731 · 4月29日61

结构化提示驱动开发(SPDD):让 AI 编码从个人提效走向团队规模化 原文:https://martinfowler.com/articles/structured-prompt-driven/ 团队用上 AI 编码助手之后,最先感受到的提速发生在个人层面。但交付速度的瓶颈从来就不在打字。把视野拉到从需求到上线的完整链路上,新的摩擦立刻浮现:模糊的需求被快速翻译成代码,误解也被同步放大;评审要消化的变更更多,质量更容易参差不齐;集成和测试问题增加,因为「生成出来」并不等于「真正对齐」;变更体量一大,生产风险也更难评估。局部快了,系统级吞吐却未必跟上。这就像买了一辆法拉利却开在泥泞乡道上,发动机再强,到达时间还是被路况决定。 Thoughtworks 内部 IT 团队由此走向了一套被称为「结构化提示驱动开发(SPDD)」的方法。它的核心主张是,把提示当作一等交付物来对待,纳入版本管理,可以被评审、被复用、被持续打磨。SPDD 由两个组件组成。 第一个组件是 REASONS 画布,一个由七个部分构成的提示结构,引导一份提示从意图走到设计再走到执行和治理。 - R 是 Requirements,明确要解决的问题和完成标准; - E 是 Entities,梳理领域实体及其关系; - A 是 Approach,给出解决思路; - S 是 Structure,说明变更落在系统中的哪个位置; - O 是 Operations,把策略拆成可执行的步骤; - N 是 Norms,沉淀通用工程规范; - S 是 Safeguards,划出不可妥协的边界。 这套结构强迫团队在写代码之前就把意图和约束讲清楚,把不确定性左移。 第二个组件是 SPDD 工作流,把提示和代码放在同一套工程纪律下。它的关键约束很简单,当现实和提示出现偏差时,先修提示,再改代码。落到工具层面,是一组叫 openspdd 的命令行命令: - /spdd-story 把大需求拆成符合 INVEST 原则的故事 - /spdd-analysis 提取领域关键词并扫描相关代码生成策略性分析, - /spdd-reasons-canvas 产出完整的七维度蓝图 - /spdd-generate 严格按画布生成代码 - /spdd-prompt-update 在需求变化时增量更新画布 - /spdd-sync 则把代码侧的重构反向同步回画布,让提示始终是当前代码的准确记录。 文章用一个计费引擎的增强案例完整走了一遍这套流程。开发者依次执行:从需求生成简化版用户故事,澄清核心逻辑和范围边界,跑分析命令拿到上下文,生成 REASONS 画布并审阅意图,再生成代码、跑接口测试。整个过程下来,意图对齐度据作者描述能达到 99% 左右。 SPDD 沉淀出三项核心技能。 - 抽象优先要求在生成代码之前先想清楚有哪些对象、它们如何协作、边界在哪里,否则 AI 会冲进实现细节而结构散掉。 - 对齐强调在写代码前就把要做什么和不做什么显式写出来,把规范和硬约束摆到台面上。 - 迭代评审则把 AI 辅助变成一个受控循环,避免一次性草稿式的产出。 同时作者也强调,SPDD 不是万能药。在规模化、标准化交付,以及高合规、强约束的场景里它最值钱;在救火热修复、探索性原型、一次性脚本,以及业务规则极度模糊的领域里,它的治理成本会显著超过收益。它的回报包括确定性、可追溯性、更快的评审、可解释性和更安全的演进,代价是心态转变、对前置抽象能力的要求,以及自动化工具链的搭建。 文章的结尾点出了它真正的精神所在。SPDD 提供的只是「招式」,真正的优势来自背后的元能力,包括抽象建模、系统化分析和对业务的整体理解。在 AI 时代,软件开发比拼的并非模型 IQ,而是工程师的认知带宽,是能否清晰思考、准确框定问题、坚决做出决策。正如 Hamming 所说,在科学里如果你知道自己在做什么,那你就不该在做这件事;在工程里如果你不知道自己在做什么,那你就不该在做这件事。

译Thoughtworks提出结构化提示驱动开发(SPDD),以解决AI编码助手带来的团队协作与系统交付瓶颈。该方法将提示视为一等交付物,通过REASONS画布(需求、实体、方法、结构、操作、规范、保障)在编码前明确意图与约束,并配套工具链支持从分析到生成的全流程。SPDD强调抽象优先、对齐和迭代评审,适用于规模化、高合规场景,能提升交付确定性与可追溯性,但其价值高度依赖团队的抽象建模与系统分析能力。

Peter Steinberger 🦞@steipete · 4月29日50

I'm now spinning up a codex instance on every commit landing on main, looking for booboos (regressions, security issues) It's live for 10 min and already found one of mine. https://github.com/openclaw/clawsweeper/blob/main/records/openclaw-openclaw/commits/212a32648fe70e9f8088d8145736a0e31e6ba0b3.md

译我现在在每次提交到主分支时都会启动一个codex实例,用于查找问题(回归、安全问题) 它已运行10分钟,并且已经发现了一个我的问题。https://github.com/openclaw/clawsweeper/blob/main/records/openclaw-openclaw/commits/212a32648fe70e9f8088d8145736a0e31e6ba0b3.md

Berryxia.AI@berryxia · 4月29日58

Google Gemma 官方教你本地跑 Coding Agent! 本地完美组合来了: • Pi Agent • Gemma 4 26B 模型 • LM Studio / Ollama / llama.cpp 等 serving engine 完全离线运行、零 API 费用、100% 隐私保护、零延迟!本地开发者 Agentic 开发神器! 附 @patloeber 详细一步步搭建教程👇 https://patloeber.com/gemma-4-pi-agent/

小互@xiaohu · 4月29日53

智能终端工具Warp 宣布开源 并引入"AI 智能体驱动"的全新协作开发模式 开源后启用新协作方式:Warp 的云端 AI(叫 Oz)负责写代码、测试、规划等繁重工作,你只需要 review即可 OpenAI 是首位赞助商,开源仓库的 agent 工作流由 GPT 模型驱动(含 GPT-5.5) 同步推出三大产品改进“ 1、支持更多开源 AI 模型,包括 Kimi、MiniMax、通义千问(Qwen),还有"自动选最优开源模型"功能 2、界面和功能高度可定制:可以只用纯终端,也可以开启完整的 AI 开发环境 3、终于推出了配置文件(Settings File),方便跨设备迁移和程序化控制

译智能终端工具Warp宣布开源,并引入由云端AI(Oz)驱动的协作开发模式,该AI可负责代码编写、测试等任务,开发者主要进行审核。OpenAI成为首位赞助商,其GPT模型驱动开源仓库的智能体工作流。产品改进包括支持Kimi、MiniMax、通义千问等多款开源AI模型,具备自动选择最优模型功能;提供高度可定制的界面,支持从纯终端到完整AI开发环境;新增配置文件,便于跨设备迁移和程序化控制。

Berryxia.AI@berryxia · 4月29日67

前Github CTO team带着新模型来了! 他们的Poolside AI 团队刚刚开源了他们的首个权重模型! 模型名称 Laguna XS.2 • 33B total / 3B active MoE • Apache 2.0 完全开源 • 专为 Agentic Coding + 长时序任务设计 • 单张 GPU 即可流畅运行 同时发布 Laguna M.1(当前最强版)和 Agent Harness。 由前 GitHub CTO Jason Warner 创立的团队,coding agent 赛道新力量! ```

译由前GitHub CTO Jason Warner创立的Poolside AI团队开源了其首个权重模型Laguna XS.2。该模型采用33B总参数、3B激活参数的MoE架构,专为Agentic Coding和长时序任务设计,可在单张GPU上运行,并采用Apache 2.0开源协议。团队同时发布了当前最强版模型Laguna M.1以及Agent Harness,标志着其在智能编码代理赛道成为新的竞争者。

ginobefun@hongming731 · 4月29日50

#BestBlogs 早报 2026-04-29 今日主题:老代码、AI 工具与组织治理三件事正在合流。Anthropic 把 Claude Code 当新员工,带进 17 年 70 万行的 Skyline 老仓库;Thoughtworks 让提示词变成版本化、可审查的一等交付物;NVIDIA 把文本、图片、视频、音频压进同一个全模态主干。模型已经能写代码,工程的难题就从生成转向了治理:让它持续记住项目,让它的输出可以被复用,让多模态真正进入生产。

译当前,遗留代码、AI工具与组织治理正加速融合。Anthropic将Claude Code作为“新员工”引入拥有70万行代码的17年老项目;Thoughtworks推动提示词成为可版本化、可审查的一等交付物;NVIDIA致力于构建统一的全模态主干模型。随着AI已具备代码生成能力,工程挑战的核心正从“生成”转向“治理”,关键在于让AI持续理解项目上下文、使其输出可复用,并推动多模态技术落地生产环境。

OpenAI Developers@OpenAIDevs · 4月29日42

You can ask Codex to update an existing repo to GPT-5.5.

译你可以要求Codex将现有仓库更新至GPT-5.5。

Peter Steinberger 🦞@steipete · 4月29日19

Will experiment with https://github.com/brunoborges/ghx since I constantly run into GitHub rate limit issues. Team there does the best to help and even moved us to Enterprise, still. Agents just HAMMER their API.

译我将试用 https://github.com/brunoborges/ghx,因为我经常遇到 GitHub 速率限制问题。那里的团队尽力提供帮助,甚至将我们迁移到企业版,但代理程序仍然猛烈冲击他们的 API。

ClaudeDevs@ClaudeDevs · 4月29日54

In the last four Claude Code CLI releases, we’ve shipped 50+ stability and performance fixes. Faster resume, stable auth, lower memory, fewer hangs: 🧵

译在最近四个Claude Code CLI版本中,我们已经发布了50多项稳定性和性能修复。 更快的恢复速度、稳定的身份验证、更低的内存占用、更少的卡顿现象:🧵

Thariq@trq212 · 4月29日48

we're doing a lot more of this, hunting down some of the most annoying bugs in Claude Code let me know if you have any white whales

译我们正在更多地做这类工作,追查Claude Code中一些最令人头疼的bug 如果你们有任何难缠的问题,请告诉我

Yuchen Jin@Yuchenj_UW · 4月29日58

Claude Code is down. The whole Silicon Valley:

译Claude Code 宕机了。 整个硅谷:

宝玉@dotey · 4月29日53

AI 终端工具 Warp 宣布客户端代码正式开源,采用 AGPL 协议,代码托管在 http://github.com/warpdotdev/warp。OpenAI 是这个开源仓库的创始赞助商。 Warp 是一个用 Rust 写的现代终端,目前有超过 70 万开发者在用。它最大的卖点是把 AI 能力直接塞进了终端,你可以用自然语言描述想做的事,它帮你生成命令。同时支持 Claude Code、Codex、Gemini CLI 等主流 AI 编程工具。 这次开源有个很特别的地方:社区贡献的流程本身就是"AI 优先"的。Warp 自家的云端 AI 平台 Oz 负责干活,包括写代码、做规划、跑测试,社区成员主要负责提想法、定方向、做验证。简单说,人管方向,AI 干活,这是他们设想的未来软件开发模式。 除了开源,Warp 同步上线了几个更新:支持更多开源模型,包括 Kimi、MiniMax、Qwen,还有一个自动路由模式帮你挑最合适的开源模型;终端界面可以按需定制,从纯终端到带 diff 视图和文件树的完整开发环境,丰俭由人;另外终于支持配置文件了,方便在不同设备间同步设置。 需要注意的是,开源的只是客户端,服务端代码仍然闭源。 Warp 创始人 Zach Lloyd 说,五年前 Warp 刚上线时就计划开源,但一直犹豫。今年 AI Agent 的爆发让天平倾斜了,用他的话说,大量不同背景的贡献者加上 AI 代理的结构化流程,能做出比纯内部团队更好的产品。OpenAI 作为创始赞助商介入,意味着这套"人管 AI 干"的开源协作模式,会被当成一个行业实验来推。 对开发者来说,如果你已经在用 Warp,现在可以直接去 GitHub 提 issue、参与讨论,甚至通过终端里新增的 /feedback 命令直接反馈。如果你之前因为闭源犹豫没用,现在少了一个顾虑。公开路线图显示 5 到 6 月的开发计划已经挂出来了。

译现代终端工具Warp宣布将其客户端代码在GitHub上以AGPL协议开源,OpenAI为创始赞助商。Warp核心特色是深度集成AI,允许用户用自然语言生成命令。此次开源的独特之处在于其“AI优先”的社区贡献流程:由Warp自研的AI平台Oz负责执行写代码、测试等具体工作,社区成员主要进行方向决策与验证,旨在探索未来软件开发新模式。同步更新包括支持更多开源模型、可定制化界面及配置文件同步功能。创始人表示,AI Agent的爆发是促使其开源的关键,希望结合广泛贡献者与AI代理打造更优产品。需注意,服务端代码仍保持闭源。

Yuchen Jin@Yuchenj_UW · 4月29日33

“No one can code now!” Come on dude, everyone can build now.

译“现在没人会写代码了!” 拜托老兄,现在每个人都能开发了。

全部 AI 动态
AI 相关资讯全量信息流
全部一手信源资讯推文
全部模型产品行业论文技巧
4月30日
17:09
Rohan Paul@rohanpaul_ai
54
代理性工具工程:基于可观测性的编码代理工具自动演化

本文提出Agentic Harness Engineering方法,使编码代理能自动重写自身工具和规则,并通过可审计实验验证每次更改的有效性。传统代理工具调整依赖手动或混乱自我改进循环,缺乏明确证据。该方法将编辑转化为文件级可回滚部分,压缩运行日志为简短失败证据,并让代理为编辑写预测后基于任务结果检查。在Terminal-Bench 2测试中,从小型shell-only工具开始,经10轮进化且基础模型固定,单次尝试成功率从69.7%提升至77.0%,超越其他基线。最终工具可迁移至其他模型和SWE-bench-verified任务,在不同模型家族获得5.1到10.1点提升,并减少12%令牌使用,为昂贵工具工作提供可靠、可控的自我改进途径。

智能体arXiv编码论文/研究
14:52
Alibaba Cloud@alibaba_cloud
精选65
Qwen3.6-Plus 现已在 @togethercompute 上线。快来使用吧。

Together AI: Introducing Qwen3.6-Plus from @Alibaba_Qwen, a 1M-context model built for real-world agents, agentic coding, and multimo...

智能体模型发布编码

推荐理由:Qwen 这次步子不小,直接把百万上下文、多模态推理和 agent 能力整合进一个模型,做 coding agent 的终于不用再拼拼凑凑了。
14:37
阿绎 AYi@AYi_AInotes
49
Cursor推出Agent Kanban:看板即编程,开发者退居监控者

Cursor推出的Agent Kanban并非完整产品,而是一个鼓励开发者自行搭建的参考实现。其核心变革在于改变了开发者与代码的交互模式:从亲自编写,到用prompt指挥AI,如今演变为将任务抛入看板,由Agent自主认领、执行并更新状态,开发者则退居幕后监控进度,使任务待办列表本身成为一种“编程语言”。尽管当前原型存在运行时限、失败率等限制,且缺乏结果审核机制,但其关键启示在于促使开发者重新思考:为何还要亲自处理那些机械、可被清晰描述的重复杂任务。

智能体现象/趋势编码
13:13
Yuchen Jin@Yuchenj_UW
46
开火了。 "如果你的近期提交中,在某个json数据块里提到了OpenClaw,Claude Code要么会拒绝你的请求,要么会向你额外收费。" 真的假的???我简直不敢相信这是真的。
Anthropic编码行业动态
12:43
Tibo@thsottiaux
34
请以图像2.0生成的图片形式提交您对codex的功能请求。如果我们决定采纳,这将使codex更容易实现。今天已经看到一些codex正在酝酿的优秀建议。
OpenAI编码行业动态
12:38
歸藏(guizang.ai)@op7418
37
我操,Codex 太牛逼了! 自己给我做了一个类似于《杀戮尖塔》的爬塔游戏,从代码到素材全是自己搞。 我就跟他说了一个要做类似《杀戮尖塔》的游戏,要中国风格的 这是能玩的!
OpenAI图像生成大佬观点编码
09:40
ginobefun@hongming731
51
Codex进化为软件工程智能体,AI Engineer Workshop解析关键技术

Codex已从编码助手快速进化为软件工程智能体,OpenAI内部将其定位为能在读取-规划-执行循环中运行测试并协调子智能体的系统。最新AI Engineer的Full Workshop讲解了子智能体并行执行、插件生态扩展、Guardian安全门控与MCP集成,以及Codex获得300万周活跃用户背后的工程基础,展示了其在软件工程领域的应用潜力和发展进展。

智能体MCP/工具OpenAI教程/实践
07:09
OpenAI Developers@OpenAIDevs
精选63
你完全可以构建网络应用

dominik kundel: http://x.com/i/article/2049579443216338944

OpenAI教程/实践编码部署/工程

推荐理由:OpenAI开发者官方转发了这篇‘直接构建web应用’的文章,说明这可能是他们认可的实践路径,对想用AI快速搭应用的开发者算是个值得收藏的参考。
06:09
OpenAI Developers@OpenAIDevs
精选64
通过Figma插件,Codex现在可以将实施计划转化为可视化的FigJam白板。

Figma: MCP updates in FigJam so you can visualize your systems (and not just read code) → generate_diagram to create architectu...

MCP/工具OpenAI产品更新编码

推荐理由:Codex 这次更新不是小功能补丁,它把 Figma 从设计师专属变成了开发者的白板,generate_diagram 直接画架构图,做系统设计的可以扔了 Lucidchart 了。
05:14
Replit ⠕@Replit
41
提示词时代正在终结。 接下来是:新的界面和全自主代理,它们将推送而非拉取。 Amjad 谈后提示时代,与 @southpkcommons 直播中 ⠕ 完整对话如下。
智能体大佬观点现象/趋势编码
04:41
OpenAI@OpenAI
26
还在思考如何将Codex用于(几乎)所有事情吗? Codex能协助更多支持性工作,从整理研究到制作电子表格、演示文稿和摘要。
OpenAI其他编码
02:36
阿绎 AYi@AYi_AInotes
67
Cursor发布SDK:将生产级编程Agent能力嵌入基础设施

Cursor正式发布SDK,将生产级编程Agent能力转化为可嵌入基础设施。此前Agent仅限于编辑器内使用,现可通过SDK集成到CI/CD流水线、自动化脚本或自有产品中,且采用与桌面端相同的runtime、harness和模型,确保智能程度一致。用户无需自行处理沙箱、上下文管理或工具调用,即可免费利用Cursor积累的经验。这使编程Agent能突破编辑器限制,在后台自动修bug、提PR、实时生成功能,甚至修复CI构建错误。开发者角色从直接编码转变为指挥Agent,Cursor正演变为AI编程时代的操作系统。

Cursor: We're introducing the Cursor SDK so you can build agents with the same runtime, harness, and models that power Cursor. R...

智能体产品更新编码
01:42
Ant Ling@AntLingAGI
精选72
SGLang团队(隶属于LMSYS Org)揭示了其旗舰指令模型实现快速、高效、大规模执行的关键在于可靠的基础设施与针对性优化。团队宣布对AntLingAGI发布的Ling-2.6-1T万亿参数模型提供Day-0支持。该模型采用快速思考方法,在保持质量的同时,成本可比同类模型降低约4倍,并在AIME26和SWE-bench基准测试中达到SOTA水平。它专为高级编码、复杂推理和大规模智能体工作流设计,具备万亿参数能力与即时模型延迟。团队正持续进行优化,以进一步提升性能。

LMSYS Org: 👏 Meet Ling-2.6-1T from @AntLingAGI, the trillion-parameter flagship instant instruct model built for fast execution & ...

智能体推理模型发布编码

推荐理由:万亿参数做到即时延迟和4倍成本优势,还有SWE-bench SOTA,这份承诺如果兑现,会改变大规模Agent部署的性价比计算。值得去cookbook跑一下验证。
01:12
Yuchen Jin@Yuchenj_UW
54
AI让你可以将编码外包。 陷阱在于你认为自己可以将理解外包。
大佬观点编码
00:38
Claude@claudeai
27
又一场Claude Code黑客马拉松落下帷幕。 感谢所有花一周时间基于Opus 4.7进行构建的参与者,也感谢联合主办方@cerebral_valley。 现在揭晓获奖者:
Anthropic编码行业动态
00:13
凡人小北@frxiaobei
38
团队开发Symphony平台以整合工具链并转向AI任务驱动开发

团队开发了Symphony平台,旨在解决产品与技术因工具链割裂导致的协作效率低下问题。该平台将AI Coding能力收敛至统一环境,推动开发模式从人驱动工具转变为Agent任务驱动。其核心是让AI自动处理需求拆解、构建与交付初版,团队仅需负责提出需求、验证结果与提供兜底。尽管类似实践已在行业中出现,但对团队而言当前正是推行时机。未来计划进一步整合产品与测试流程,以探索自动化开发的极限。

向阳乔木: http://x.com/i/article/2049481992996323328

智能体现象/趋势编码
00:12
Peter Steinberger 🦞@steipete
58
已将代码审查集成到 clawsweeper 中。 我使用了非常相似的系统提示,因此这能提供与 /review 相同的效果,而且 clawsweeper 具备自动合并功能,会循环运行直至不再发现新问题。https://github.com/openclaw/clawsweeper
GitHub开源/仓库编码
4月29日
23:09
OpenAI Developers@OpenAIDevs
48
限时添加 Codex 席位,免收席位费。 在六月底之前,符合条件的 ChatGPT Business 和 Enterprise 客户可以添加仅限 Codex 的席位,从而更轻松地让更多开发者在日常工作流程中使用 Codex。
OpenAI产品更新编码
22:43
elvis@omarsar0
55
智能体缰绳工程:实现AI智能体核心组件的可观测自动化进化

针对AI智能体开发中依赖人工调试、成本高昂且脆弱的“缰绳”设计问题,研究者提出了“智能体缰绳工程”框架。该框架通过三层设计实现可观测的进化:将组件视为可回滚的文件、从海量运行轨迹中提炼经验证据、将决策转化为可由任务结果验证的预测。每次修改都成为可验证或回滚的“合约”。实验表明,该框架在十次迭代内将Terminal-Bench 2的pass@1分数从69.7%提升至77.0%,超越人工设计与基线方法。进化后的缰绳能跨模型迁移并提升性能,同时在SWE-bench上减少12%的令牌消耗,为智能体系统的核心组件提供了首个自动化、可靠的优化方案。

智能体arXivMCP/工具编码
22:38
Sam Altman@sama
48
我喜欢团队做这样的事 【引用 @Mugilan_SS】:Codex 和 claude code 不一样。 如果你知道限制即将结束,比如最后10%到8%,给它一个很长的运行任务,即使限制时间到了,它也会继续执行任务直到完成。 向 @OpenAI 团队致敬。

Mugilan S: Codex is not like claude code. if you know the limit is going to end, like last 10 to 8%, give an very long run task, an...

OpenAI教程/实践编码
22:38
Sam Altman@sama
46
感觉Codex正在经历一个ChatGPT时刻
OpenAI大佬观点编码
17:11
向阳乔木@vista8
43
提示词优化大师Skill:针对不同AI场景的Prompt工具

一款名为“提示词优化大师”的纯文本Skill获得了超过6000个Star。其核心价值在于针对不同的具体使用场景和工具,提供差异化的优化提示词。例如,在代码生成场景中,会根据用户是使用Claude Code还是Cursor来调整提示词;在图像生成场景中,则会区分Midjourney等不同工具来提供相应的提示词。该Skill的设计思路类似于精心编写的“元Prompt”,旨在提升用户与各类AI模型交互的效率和效果。

开源/仓库开源生态编码
13:40
Peter Steinberger 🦞@steipete
53
codex 现在在我们每次提交的代码上运行,并对其进行审查--如果发现错误,就会启动一个新的 codex 实例,并在(问题仍然存在的情况下)创建一个修复该问题的 PR。 随后会启动一个审查代理。如果发现问题,另一个代理将负责修复这些问题。(最多循环 5 次)https://github.com/openclaw/openclaw/pull/74065
智能体GitHub教程/实践编码
13:40
Tibo@thsottiaux
42
通过一些小调整,Codex 能在困难任务上连续工作数天。我们将发布一些更新,让每个人都能更轻松地使用它。 你见过 GPT-5.5 成功完成的最困难任务是什么?
OpenAI产品更新编码
12:38
ginobefun@hongming731
精选72
针对AI初创公司是否必须被大模型实验室收购的讨论,Cognition公司的经验表明,同行被收购反而会强化剩余独立公司的地位。独立公司在软件工程等动态领域拥有明确市场,客户重视模型灵活性。其成功关键在于三大法则:一是建立清晰差异化,如专注企业市场、加速全开发周期、解决复杂部署难题并保持模型独立;二是极致专注,在特定领域深挖边缘复杂性问题,做到实验室无法比拟;三是保持速度优势,利用小团队决策快、工具链高效和工程文化,通过快速迭代建立竞争壁垒。

Russell Kaplan: # The Path Forward for AI Startups A lot of founders are messaging each other after the SpaceXAI <> Cursor "IPO-deferred...

智能体大佬观点编码

推荐理由:Russell Kaplan 借 Cursor 被收购节点复盘 Cognition 的打法,差异化、专注、速度三条铁律不是空话,全是带数据和细节的实战复盘,做 AI 创业的值得细读。
12:10
Yuchen Jin@Yuchenj_UW
14
"Claude 正在扼杀工作。软件工程正在消亡。" Claude Code 中有 50 个漏洞。💀
Anthropic大佬观点编码
11:41
小互@xiaohu
57
TRAE内置语音功能上线,支持语音命令与技能识别

TRAE推出内置语音功能,支持直接语音输入,并能将包含大量语气词的即兴口语转录为结构化文字。其核心亮点在于能够识别语音命令和技能,用户可通过语音直接操作输入框等功能。此外,TRAE还与Insta360合作推出了联名Mic Air无线麦克风。这一功能体现了“用嘴写代码、用嘴办公”的交互趋势,初步用户体验反馈积极。

产品更新编码语音
09:38
ginobefun@hongming731
61
结构化提示驱动开发(SPDD):让 AI 编码从个人提效走向团队规模化

Thoughtworks提出结构化提示驱动开发(SPDD),以解决AI编码助手带来的团队协作与系统交付瓶颈。该方法将提示视为一等交付物,通过REASONS画布(需求、实体、方法、结构、操作、规范、保障)在编码前明确意图与约束,并配套工具链支持从分析到生成的全流程。SPDD强调抽象优先、对齐和迭代评审,适用于规模化、高合规场景,能提升交付确定性与可追溯性,但其价值高度依赖团队的抽象建模与系统分析能力。

大佬观点编码
09:10
Peter Steinberger 🦞@steipete
50
我现在在每次提交到主分支时都会启动一个codex实例,用于查找问题(回归、安全问题) 它已运行10分钟,并且已经发现了一个我的问题。https://github.com/openclaw/clawsweeper/blob/main/records/openclaw-openclaw/commits/212a32648fe70e9f8088d8145736a0e31e6ba0b3.md
教程/实践编码
08:38
Berryxia.AI@berryxia
58
Google Gemma 官方教你本地跑 Coding Agent! 本地完美组合来了: • Pi Agent • Gemma 4 26B 模型 • LM Studio / Ollama / llama.cpp 等 serving engine 完全离线运行、零 API 费用、100% 隐私保护、零延迟!本地开发者 Agentic 开发神器! 附 @patloeber 详细一步步搭建教程👇 https://patloeber.com/gemma-4-pi-agent/

Google Gemma: Learn how to run a local coding agent! Use: - Pi agent - Gemma 4 26B - Serving engine of choice: e.g. LM Studio

智能体Google教程/实践端侧
07:41
小互@xiaohu
53
智能终端工具Warp 宣布开源

智能终端工具Warp宣布开源,并引入由云端AI(Oz)驱动的协作开发模式,该AI可负责代码编写、测试等任务,开发者主要进行审核。OpenAI成为首位赞助商,其GPT模型驱动开源仓库的智能体工作流。产品改进包括支持Kimi、MiniMax、通义千问等多款开源AI模型,具备自动选择最优模型功能;提供高度可定制的界面,支持从纯终端到完整AI开发环境;新增配置文件,便于跨设备迁移和程序化控制。

智能体OpenAI产品更新开源生态
07:38
Berryxia.AI@berryxia
67
由前GitHub CTO Jason Warner创立的Poolside AI团队开源了其首个权重模型Laguna XS.2。该模型采用33B总参数、3B激活参数的MoE架构,专为Agentic Coding和长时序任务设计,可在单张GPU上运行,并采用Apache 2.0开源协议。团队同时发布了当前最强版模型Laguna M.1以及Agent Harness,标志着其在智能编码代理赛道成为新的竞争者。

poolside: Today we're releasing Laguna XS.2, Poolside's first open-weight model. It's a 33B total / 3B active MoE model built for ...

智能体开源生态模型发布编码
07:38
ginobefun@hongming731
50
老代码、AI工具与组织治理的融合趋势

当前,遗留代码、AI工具与组织治理正加速融合。Anthropic将Claude Code作为“新员工”引入拥有70万行代码的17年老项目;Thoughtworks推动提示词成为可版本化、可审查的一等交付物;NVIDIA致力于构建统一的全模态主干模型。随着AI已具备代码生成能力,工程挑战的核心正从“生成”转向“治理”,关键在于让AI持续理解项目上下文、使其输出可复用,并推动多模态技术落地生产环境。

AnthropicMCP/工具多模态现象/趋势
06:37
OpenAI Developers@OpenAIDevs
42
你可以要求Codex将现有仓库更新至GPT-5.5。
OpenAI产品更新编码
06:10
Peter Steinberger 🦞@steipete
19
我将试用 https://github.com/brunoborges/ghx,因为我经常遇到 GitHub 速率限制问题。那里的团队尽力提供帮助,甚至将我们迁移到企业版,但代理程序仍然猛烈冲击他们的 API。
智能体开源/仓库编码
05:10
ClaudeDevs@ClaudeDevs
54
在最近四个Claude Code CLI版本中,我们已经发布了50多项稳定性和性能修复。 更快的恢复速度、稳定的身份验证、更低的内存占用、更少的卡顿现象:🧵
Anthropic产品更新编码
05:10
Thariq@trq212
48
我们正在更多地做这类工作,追查Claude Code中一些最令人头疼的bug 如果你们有任何难缠的问题,请告诉我

ClaudeDevs: In the last four Claude Code CLI releases, we've shipped 50+ stability and performance fixes. Faster resume, stable auth...

Anthropic产品更新编码
03:10
Yuchen Jin@Yuchenj_UW
58
Claude Code 宕机了。 整个硅谷:
Anthropic编码行业动态
01:40
宝玉@dotey
53
AI终端工具Warp客户端正式开源,推行"人管方向,AI干活"新模式

现代终端工具Warp宣布将其客户端代码在GitHub上以AGPL协议开源,OpenAI为创始赞助商。Warp核心特色是深度集成AI,允许用户用自然语言生成命令。此次开源的独特之处在于其“AI优先”的社区贡献流程:由Warp自研的AI平台Oz负责执行写代码、测试等具体工作,社区成员主要进行方向决策与验证,旨在探索未来软件开发新模式。同步更新包括支持更多开源模型、可定制化界面及配置文件同步功能。创始人表示,AI Agent的爆发是促使其开源的关键,希望结合广泛贡献者与AI代理打造更优产品。需注意,服务端代码仍保持闭源。

Warp: Warp is now open-source.

开源/仓库编码部署/工程
01:09
Yuchen Jin@Yuchenj_UW
33
"现在没人会写代码了!" 拜托老兄,现在每个人都能开发了。
大佬观点编码
‹ 上一页
1…4142434445…50
下一页 ›