4月30日

17:09

Rohan Paul@rohanpaul_ai

本文提出Agentic Harness Engineering方法，使编码代理能自动重写自身工具和规则，并通过可审计实验验证每次更改的有效性。传统代理工具调整依赖手动或混乱自我改进循环，缺乏明确证据。该方法将编辑转化为文件级可回滚部分，压缩运行日志为简短失败证据，并让代理为编辑写预测后基于任务结果检查。在Terminal-Bench 2测试中，从小型shell-only工具开始，经10轮进化且基础模型固定，单次尝试成功率从69.7%提升至77.0%，超越其他基线。最终工具可迁移至其他模型和SWE-bench-verified任务，在不同模型家族获得5.1到10.1点提升，并减少12%令牌使用，为昂贵工具工作提供可靠、可控的自我改进途径。

智能体 arXiv 编码论文/研究

14:52

Alibaba Cloud@alibaba_cloud

精选65

Qwen3.6-Plus 现已在 @togethercompute 上线。快来使用吧。

Together AI: Introducing Qwen3.6-Plus from @Alibaba_Qwen, a 1M-context model built for real-world agents, agentic coding, and multimo...

智能体模型发布编码

推荐理由：Qwen 这次步子不小，直接把百万上下文、多模态推理和 agent 能力整合进一个模型，做 coding agent 的终于不用再拼拼凑凑了。

14:37

阿绎 AYi@AYi_AInotes

Cursor推出Agent Kanban：看板即编程，开发者退居监控者

Cursor推出的Agent Kanban并非完整产品，而是一个鼓励开发者自行搭建的参考实现。其核心变革在于改变了开发者与代码的交互模式：从亲自编写，到用prompt指挥AI，如今演变为将任务抛入看板，由Agent自主认领、执行并更新状态，开发者则退居幕后监控进度，使任务待办列表本身成为一种“编程语言”。尽管当前原型存在运行时限、失败率等限制，且缺乏结果审核机制，但其关键启示在于促使开发者重新思考：为何还要亲自处理那些机械、可被清晰描述的重复杂任务。

智能体现象/趋势编码

13:13

Yuchen Jin@Yuchenj_UW

开火了。 "如果你的近期提交中，在某个json数据块里提到了OpenClaw，Claude Code要么会拒绝你的请求，要么会向你额外收费。" 真的假的？？？我简直不敢相信这是真的。

Anthropic 编码行业动态

12:43

Tibo@thsottiaux

请以图像2.0生成的图片形式提交您对codex的功能请求。如果我们决定采纳，这将使codex更容易实现。今天已经看到一些codex正在酝酿的优秀建议。

OpenAI 编码行业动态

12:38

歸藏(guizang.ai)@op7418

我操，Codex 太牛逼了！自己给我做了一个类似于《杀戮尖塔》的爬塔游戏，从代码到素材全是自己搞。我就跟他说了一个要做类似《杀戮尖塔》的游戏，要中国风格的这是能玩的！

OpenAI 图像生成大佬观点编码

09:40

ginobefun@hongming731

Codex进化为软件工程智能体，AI Engineer Workshop解析关键技术

Codex已从编码助手快速进化为软件工程智能体，OpenAI内部将其定位为能在读取-规划-执行循环中运行测试并协调子智能体的系统。最新AI Engineer的Full Workshop讲解了子智能体并行执行、插件生态扩展、Guardian安全门控与MCP集成，以及Codex获得300万周活跃用户背后的工程基础，展示了其在软件工程领域的应用潜力和发展进展。

智能体 MCP/工具 OpenAI 教程/实践

07:09

OpenAI Developers@OpenAIDevs

精选63

你完全可以构建网络应用

dominik kundel: http://x.com/i/article/2049579443216338944

OpenAI 教程/实践编码部署/工程

推荐理由：OpenAI开发者官方转发了这篇‘直接构建web应用’的文章，说明这可能是他们认可的实践路径，对想用AI快速搭应用的开发者算是个值得收藏的参考。

06:09

OpenAI Developers@OpenAIDevs

精选64

通过Figma插件，Codex现在可以将实施计划转化为可视化的FigJam白板。

Figma: MCP updates in FigJam so you can visualize your systems (and not just read code) → generate_diagram to create architectu...

MCP/工具 OpenAI 产品更新编码

推荐理由：Codex 这次更新不是小功能补丁，它把 Figma 从设计师专属变成了开发者的白板，generate_diagram 直接画架构图，做系统设计的可以扔了 Lucidchart 了。

05:14

Replit ⠕@Replit

提示词时代正在终结。接下来是：新的界面和全自主代理，它们将推送而非拉取。 Amjad 谈后提示时代，与 @southpkcommons 直播中 ⠕ 完整对话如下。

智能体大佬观点现象/趋势编码

04:41

OpenAI@OpenAI

还在思考如何将Codex用于（几乎）所有事情吗？ Codex能协助更多支持性工作，从整理研究到制作电子表格、演示文稿和摘要。

OpenAI 其他编码

02:36

阿绎 AYi@AYi_AInotes

Cursor发布SDK：将生产级编程Agent能力嵌入基础设施

Cursor正式发布SDK，将生产级编程Agent能力转化为可嵌入基础设施。此前Agent仅限于编辑器内使用，现可通过SDK集成到CI/CD流水线、自动化脚本或自有产品中，且采用与桌面端相同的runtime、harness和模型，确保智能程度一致。用户无需自行处理沙箱、上下文管理或工具调用，即可免费利用Cursor积累的经验。这使编程Agent能突破编辑器限制，在后台自动修bug、提PR、实时生成功能，甚至修复CI构建错误。开发者角色从直接编码转变为指挥Agent，Cursor正演变为AI编程时代的操作系统。

Cursor: We're introducing the Cursor SDK so you can build agents with the same runtime, harness, and models that power Cursor. R...

智能体产品更新编码

01:42

Ant Ling@AntLingAGI

精选72

SGLang团队（隶属于LMSYS Org）揭示了其旗舰指令模型实现快速、高效、大规模执行的关键在于可靠的基础设施与针对性优化。团队宣布对AntLingAGI发布的Ling-2.6-1T万亿参数模型提供Day-0支持。该模型采用快速思考方法，在保持质量的同时，成本可比同类模型降低约4倍，并在AIME26和SWE-bench基准测试中达到SOTA水平。它专为高级编码、复杂推理和大规模智能体工作流设计，具备万亿参数能力与即时模型延迟。团队正持续进行优化，以进一步提升性能。

LMSYS Org: 👏 Meet Ling-2.6-1T from @AntLingAGI, the trillion-parameter flagship instant instruct model built for fast execution & ...

智能体推理模型发布编码

推荐理由：万亿参数做到即时延迟和4倍成本优势，还有SWE-bench SOTA，这份承诺如果兑现，会改变大规模Agent部署的性价比计算。值得去cookbook跑一下验证。

01:12

Yuchen Jin@Yuchenj_UW

AI让你可以将编码外包。陷阱在于你认为自己可以将理解外包。

大佬观点编码

00:38

Claude@claudeai

又一场Claude Code黑客马拉松落下帷幕。感谢所有花一周时间基于Opus 4.7进行构建的参与者，也感谢联合主办方@cerebral_valley。现在揭晓获奖者：

Anthropic 编码行业动态

00:13

凡人小北@frxiaobei

团队开发Symphony平台以整合工具链并转向AI任务驱动开发

团队开发了Symphony平台，旨在解决产品与技术因工具链割裂导致的协作效率低下问题。该平台将AI Coding能力收敛至统一环境，推动开发模式从人驱动工具转变为Agent任务驱动。其核心是让AI自动处理需求拆解、构建与交付初版，团队仅需负责提出需求、验证结果与提供兜底。尽管类似实践已在行业中出现，但对团队而言当前正是推行时机。未来计划进一步整合产品与测试流程，以探索自动化开发的极限。

向阳乔木: http://x.com/i/article/2049481992996323328

智能体现象/趋势编码

00:12

Peter Steinberger 🦞@steipete

已将代码审查集成到 clawsweeper 中。我使用了非常相似的系统提示，因此这能提供与 /review 相同的效果，而且 clawsweeper 具备自动合并功能，会循环运行直至不再发现新问题。https://github.com/openclaw/clawsweeper

GitHub 开源/仓库编码

4月29日

23:09

OpenAI Developers@OpenAIDevs

限时添加 Codex 席位，免收席位费。在六月底之前，符合条件的 ChatGPT Business 和 Enterprise 客户可以添加仅限 Codex 的席位，从而更轻松地让更多开发者在日常工作流程中使用 Codex。

OpenAI 产品更新编码

22:43

elvis@omarsar0

智能体缰绳工程：实现AI智能体核心组件的可观测自动化进化

针对AI智能体开发中依赖人工调试、成本高昂且脆弱的“缰绳”设计问题，研究者提出了“智能体缰绳工程”框架。该框架通过三层设计实现可观测的进化：将组件视为可回滚的文件、从海量运行轨迹中提炼经验证据、将决策转化为可由任务结果验证的预测。每次修改都成为可验证或回滚的“合约”。实验表明，该框架在十次迭代内将Terminal-Bench 2的pass@1分数从69.7%提升至77.0%，超越人工设计与基线方法。进化后的缰绳能跨模型迁移并提升性能，同时在SWE-bench上减少12%的令牌消耗，为智能体系统的核心组件提供了首个自动化、可靠的优化方案。

智能体 arXiv MCP/工具编码

22:38

Sam Altman@sama

我喜欢团队做这样的事【引用 @Mugilan_SS】：Codex 和 claude code 不一样。如果你知道限制即将结束，比如最后10%到8%，给它一个很长的运行任务，即使限制时间到了，它也会继续执行任务直到完成。向 @OpenAI 团队致敬。

Mugilan S: Codex is not like claude code. if you know the limit is going to end, like last 10 to 8%, give an very long run task, an...

OpenAI 教程/实践编码

22:38

Sam Altman@sama

感觉Codex正在经历一个ChatGPT时刻

OpenAI 大佬观点编码

17:11

向阳乔木@vista8

提示词优化大师Skill：针对不同AI场景的Prompt工具

一款名为“提示词优化大师”的纯文本Skill获得了超过6000个Star。其核心价值在于针对不同的具体使用场景和工具，提供差异化的优化提示词。例如，在代码生成场景中，会根据用户是使用Claude Code还是Cursor来调整提示词；在图像生成场景中，则会区分Midjourney等不同工具来提供相应的提示词。该Skill的设计思路类似于精心编写的“元Prompt”，旨在提升用户与各类AI模型交互的效率和效果。

开源/仓库开源生态编码

13:40

Peter Steinberger 🦞@steipete

codex 现在在我们每次提交的代码上运行，并对其进行审查--如果发现错误，就会启动一个新的 codex 实例，并在（问题仍然存在的情况下）创建一个修复该问题的 PR。随后会启动一个审查代理。如果发现问题，另一个代理将负责修复这些问题。（最多循环 5 次）https://github.com/openclaw/openclaw/pull/74065

智能体 GitHub 教程/实践编码

13:40

Tibo@thsottiaux

通过一些小调整，Codex 能在困难任务上连续工作数天。我们将发布一些更新，让每个人都能更轻松地使用它。你见过 GPT-5.5 成功完成的最困难任务是什么？

OpenAI 产品更新编码

12:38

ginobefun@hongming731

精选72

针对AI初创公司是否必须被大模型实验室收购的讨论，Cognition公司的经验表明，同行被收购反而会强化剩余独立公司的地位。独立公司在软件工程等动态领域拥有明确市场，客户重视模型灵活性。其成功关键在于三大法则：一是建立清晰差异化，如专注企业市场、加速全开发周期、解决复杂部署难题并保持模型独立；二是极致专注，在特定领域深挖边缘复杂性问题，做到实验室无法比拟；三是保持速度优势，利用小团队决策快、工具链高效和工程文化，通过快速迭代建立竞争壁垒。

Russell Kaplan: # The Path Forward for AI Startups A lot of founders are messaging each other after the SpaceXAI <> Cursor "IPO-deferred...

智能体大佬观点编码

推荐理由：Russell Kaplan 借 Cursor 被收购节点复盘 Cognition 的打法，差异化、专注、速度三条铁律不是空话，全是带数据和细节的实战复盘，做 AI 创业的值得细读。

12:10

Yuchen Jin@Yuchenj_UW

"Claude 正在扼杀工作。软件工程正在消亡。" Claude Code 中有 50 个漏洞。💀

Anthropic 大佬观点编码

11:41

小互@xiaohu

TRAE内置语音功能上线，支持语音命令与技能识别

TRAE推出内置语音功能，支持直接语音输入，并能将包含大量语气词的即兴口语转录为结构化文字。其核心亮点在于能够识别语音命令和技能，用户可通过语音直接操作输入框等功能。此外，TRAE还与Insta360合作推出了联名Mic Air无线麦克风。这一功能体现了“用嘴写代码、用嘴办公”的交互趋势，初步用户体验反馈积极。

产品更新编码语音

09:38

ginobefun@hongming731

结构化提示驱动开发（SPDD）：让 AI 编码从个人提效走向团队规模化

Thoughtworks提出结构化提示驱动开发（SPDD），以解决AI编码助手带来的团队协作与系统交付瓶颈。该方法将提示视为一等交付物，通过REASONS画布（需求、实体、方法、结构、操作、规范、保障）在编码前明确意图与约束，并配套工具链支持从分析到生成的全流程。SPDD强调抽象优先、对齐和迭代评审，适用于规模化、高合规场景，能提升交付确定性与可追溯性，但其价值高度依赖团队的抽象建模与系统分析能力。

大佬观点编码