Codex in the ChatGPT app let your agents work for you from anywhere

译ChatGPT应用中的Codex 让你的智能体随处为你工作

More products. More markets. More formats. No more bottlenecks. Define the brief. Set the aesthetic. Luma Agents handle every e-commerce campaign asset from there. Scale it now → http://lumalabs.ai/app

译更多产品。更多市场。更多格式。再无瓶颈。定义需求。设定风格。Luma Agents 从此处理所有电商活动素材。立即扩展 → http://lumalabs.ai/app

Orange AI@oran_ge · 5月15日55

企业里的人+Agent 协作产品 Syncless 发布了

Orange AI@oran_ge · 5月15日35

我们不断地去思考协作的本质是什么团队之间真正需要对齐的是什么只有把沟通协作的模型想透彻才能做出 Human-Agent 产品

Greg Brockman@gdb · 5月15日74

You can now use Codex, wherever you have it running, from the ChatGPT app. Huge step forward for universal usage of agents.

译现在，无论Codex在哪里运行，你都可以从ChatGPT应用中使用它。对于代理的通用使用来说，这是一大步前进。

宝玉@dotey · 5月15日66

OpenAI 把 Codex 搬进了 ChatGPT 手机 App，今天在 iOS 和安卓上同步开启 preview，所有 ChatGPT 用户都能用，包括免费版和最低价的 Go 套餐。手机端不是让你在手机上写代码。真正干活的 Codex 还是跑在你的笔记本、Mac mini 或者 devbox 上，手机只是一个远程窗口：地铁上能看 Codex 跑到哪一步、审一眼它改的 diff 和跑的测试结果、批准下一步操作，或者临时换个方向走。文件、凭证、权限都留在原来那台机器上，不上传到手机。 OpenAI 的解释是底层走了一层 secure relay 中继,让跑着 Codex 的机器能跨设备保持可达,又不直接暴露在公网上。你在哪台设备登录 ChatGPT，会话状态和上下文就跟到哪里。为什么现在做。OpenAI 自己公布的数字是 Codex 每周活跃用户已经过 400 万。当 agent 越来越多地跑长任务，几十分钟甚至几小时的那种，人坐在电脑前盯着就很傻，你需要随手能看一眼、能拍板的能力。一个明显限制：手机端目前只能连 macOS 上的 Codex，Windows 支持据说”很快”。另一层意思是，OpenAI 没给 Codex 单独做手机 App，而是塞进 ChatGPT 主 App。这跟他们之前透露过的”超级 App”路线一致，把 ChatGPT、Codex、Atlas 浏览器整合成一个入口。桌面端是独立的 Codex App，手机端直接合并进 ChatGPT。参照系是 Anthropic。Claude Code 从去年秋天起就支持手机远程查看和介入正在跑的任务，后面的 Cowork 配套移动端走的也是类似 dispatch 思路。Codex 这次把覆盖范围扩到了 devbox 和远程企业环境（支持 remote SSH 接入），算是追平加扩张。

译OpenAI在ChatGPT的iOS和安卓App中推出Codex预览功能，所有用户均可使用。该功能并非让手机直接运行代码，而是作为一个远程操作窗口，允许用户在外出时查看任务进度、审核代码差异与测试结果，并进行决策。实际计算任务仍在用户的笔记本电脑、Mac mini或devbox上执行，文件与凭证不会传输至手机。此举旨在满足Codex每周超400万活跃用户处理长任务时的远程监控需求。目前手机端仅支持连接macOS设备，Windows版本即将推出。该集成符合OpenAI将多项服务合并至单一入口的“超级App”战略。

Tibo@thsottiaux · 5月15日75

Codex everywhere

译Codex everywhere [引用 @OpenAIDevs]：离开你的笔记本电脑。在手机上继续用Codex进行构建。 Codex在你的电脑上持续工作，你的文件和项目上下文仍保持原样。口袋大小的访问。完整的Codex工作状态。 https://x.com/OpenAI/status/2055016850849993072

Noam Brown@polynoamial · 5月15日68

It's now even easier to keep your agents running productively 24/7

译现在让你的智能体保持24/7高效运行变得更加容易 [引用 @OpenAI]：这是你们一直期待的功能... 现推出预览版：ChatGPT移动应用中的Codex。从ChatGPT移动应用启动新任务、审查输出、引导执行并批准后续步骤。Codex将持续在你的笔记本电脑、Mac mini或开发机上运行。

Replit ⠕@Replit · 5月15日63

Ship it. Measure it. All in one flow. @Mixpanel is on Replit MCP. See it live at the London hackathon next week 👇

译发布产品。衡量效果。全在一个流程中完成。 @Mixpanel 现已登陆 Replit MCP。下周伦敦黑客松现场演示👇

DogeDesigner@cb_doge · 5月15日74

SuperGrok Heavy is now ~67% off for 6 months i.e. just $99/month instead of $300/month. Highly recommended to upgrade to Heavy and try out the beta of Grok Build.

译SuperGrok Heavy 现提供约67%的半年折扣，即每月仅需99美元（原价300美元）。强烈建议升级至Heavy版本，并试用Grok Build的测试版。

Chubby♨️@kimmonismus · 5月15日74

Aaaaaaand official: codex in the ChatGPT mobile app!! Love it Codex is goated. I love it.

译官宣：ChatGPT手机应用现已集成Codex！！太棒了 Codex真是强大。我太喜欢了。

OpenClaw🦞@openclaw · 5月15日56

OpenClaw 2026.5.12 🦞 🧠 OpenAI setup defaults to Codex login 🛟 Runtime fallbacks + stalled-stream recovery 📬 Telegram polling survives stalls ⚡ Leaner installs, faster startup paths Faster, calmer, harder to wedge. https://github.com/openclaw/openclaw/releases/tag/v2026.5.12

译OpenClaw 2026.5.12 🦞 🧠 OpenAI 默认设置为 Codex 登录 🛟 运行时回退 + 停滞流恢复 📬 Telegram 轮询在停滞时保持存活 ⚡ 更精简的安装，更快的启动路径更快、更稳定、更难卡死。 https://github.com/openclaw/openclaw/releases/tag/v2026.5.12

OpenAI@OpenAI · 5月15日70

You've been asking for this one... Now in preview: Codex in the ChatGPT mobile app. Start new work, review outputs, steer execution, and approve next steps, all from the ChatGPT mobile app. Codex will keep running on your laptop, Mac mini, or devbox.

译你们一直期待的功能来了... 现已在预览版推出：ChatGPT移动应用中的Codex。从ChatGPT移动应用启动新工作、查看输出、引导执行并批准后续步骤。Codex将持续在你的笔记本电脑、Mac mini或开发机上运行。

Elon Musk@elonmusk · 5月15日63

Grok Build

译Grok Build [引用 @JasonBud]：Grok Build是一款完全交互式的CLI，这意味着你实际上可以用鼠标点击。无闪烁。尤其有用的是，我发现自己同时运行5个以上代理并在不同计划间跳转。

OpenAI Developers@OpenAIDevs · 5月15日75

Step away from your laptop. Keep building with Codex on your phone. Codex keeps working on your computer, with your files and project context still in place. Pocket-sized access. Full Codex working state. https://x.com/OpenAI/status/2055016850849993072

译OpenAI宣布在ChatGPT移动应用中预览集成Codex功能。开发者现可通过手机远程启动新工作、审查输出、指导执行并批准后续步骤，实现移动操控。与此同时，Codex进程将持续在用户的笔记本电脑、Mac mini或开发机上运行，保持完整的项目上下文和文件访问。这提供了对Codex工作状态的“口袋式”访问，允许开发者离开电脑后仍能继续推进开发工作。

Elon Musk@elonmusk · 5月15日63

Try this early Grok Build (anything) beta and let us know what to improve. Much appreciated!

译试用这个早期Grok Build（任意功能）测试版，并告诉我们如何改进。非常感谢！

DogeDesigner@cb_doge · 5月15日71

NEWS: xAI just launched the early beta of Grok Build, an agentic CLI for developers. Grok Build brings Grok directly into your terminal, helping you: • Code faster • Build apps • Automate workflows • Plan complex projects • Use subagents for parallel research, building, and review • Customize workflows with skills and plugins This is currently available for SuperGrok Heavy subscribers. This is an early beta and the product will keep improving based on user feedback. Try it here: http://x.ai/cli

译xAI推出了Grok Build的早期测试版，这是一个面向开发者的智能命令行界面（CLI）工具。它将Grok直接集成到终端中，旨在帮助开发者更快地编写代码、构建应用程序、自动化工作流程以及规划复杂项目。该工具支持使用子代理进行并行研究、构建和审查，并可通过技能和插件自定义工作流。目前，该功能仅面向SuperGrok Heavy订阅者开放，处于早期测试阶段，未来将根据用户反馈持续改进。

elvis@omarsar0 · 5月15日60

Interesting position paper on agentic AI as a foreseeable pathway to AGI. (bookmark it) There has been strong debate on whether a larger single model get us there or a multi-agent system. The authors argue that agentic AI systems, not bigger foundation models on their own, are the most foreseeable route to AGI. Formalizes what "agentic" actually contributes beyond the base model: memory, reasoning, tool use, self-improvement, alignment. Each is a separable axis with its own bottlenecks (long-horizon coherence, credit assignment, safety auditing). They argues that none of those bottlenecks get solved by another order of magnitude on pretraining compute. Paper: https://arxiv.org/abs/2605.12966 Learn to build effective AI agents in our academy: https://academy.dair.ai/

译一篇立场论文认为，实现通用人工智能（AGI）最可预见的途径是智能体AI系统，而非单纯扩大基础模型规模。作者将“智能体”能力形式化为超越基础模型的几个可分离维度：记忆、推理、工具使用、自我改进和对齐。每个维度都存在自身瓶颈，如长程连贯性、信用分配和安全审计。这些瓶颈无法仅通过增加一个数量级的预训练计算来解决。论文回应了关于AGI路径的争论，即究竟是单一大型模型还是多智能体系统更有效。

Luma@LumaLabsAI · 5月15日43

Side by side. No contest. Define the comparison. Set the direction. Luma Agents build every ad that makes the choice obvious from there. Make it obvious → http://lumalabs.ai/app

译并排展示。高下立判。定义比较标准。设定方向。 Luma Agents制作的每支广告，都能让选择从此变得显而易见。让选择显而易见 → http://lumalabs.ai/app

xAI@xai · 5月15日70

An early beta of Grok Build, an agentic CLI for coding, building apps, and automating workflows is now available for SuperGrok Heavy subscribers. Through this early beta, we will improve the model and product based on your feedback. Try it at http://x.ai/cli

译专为编码、构建应用和自动化工作流程设计的智能命令行工具 Grok Build 的早期测试版现已面向 SuperGrok Heavy 订阅者开放。通过此早期测试版，我们将根据您的反馈改进模型和产品。试用地址：http://x.ai/cli

🚨 AI News | TestingCatalog@testingcatalog · 5月15日65

SPACEXAI 🔥: Grok Build CLI is now live in Beta for Grok Heavy users. It supports Skills, Subagents, Plugins, and Planning Mode. Heavy testing time /btw 👀

译SPACEXAI 🔥: Grok Build CLI 现已面向 Grok Heavy 用户推出 Beta 版。它支持技能、子代理、插件和规划模式。全力测试时间 /顺便说一句 👀

Chubby♨️@kimmonismus · 5月15日63

I've been testing Higgsfield's Supercomputer for the past few days, and it genuinely caught me off guard. You type a task in plain language. The system picks from 61 production skills, routes each sub-task to the best available model (GPT-5.5, Claude Opus, Gemini, Seedance, Veo, Kling, and more), runs them in parallel, and delivers finished assets. I pointed it at my own X post analytics, expecting something generic. It came back with senior-analyst-grade breakdowns: median engagement rates, hook score analysis, content pattern detection. Properly useful output, not a summary paragraph. A few things that really surprised me: - It generates up to 60 (!) minutes of video from a single prompt - Native Obsidian integration for persistent knowledge (the "LLM wiki" concept Karpathy floated recently, already shipping, and which I was building myself just recently) - 27 platform connectors (Slack, Drive, Notion, YouTube, Frame. io, the full stack) - Brand and identity locks persist across sessions, so your outputs stay consistent over time - Skills actually improve with use, version-tracked and eval-tested The whole thing runs cloud-side on GPU-colocated infrastructure, which means generations keep running even if you close the browser. Scheduled tasks just work without a local machine.

译Higgsfield的Supercomputer平台允许用户以自然语言描述任务，系统从61种生产技能中自动选取，并将子任务路由至GPT-4o、Claude Opus、Gemini及多种图像视频模型并行处理。它能生成长达60分钟的视频，原生集成Obsidian构建持久化知识库，并通过27个平台连接器连接各类工具。平台运行于云端GPU基础设施，支持品牌标识锁定和后台任务调度。其技能在使用中通过版本追踪和评估测试不断自我改进，用户可通过浏览器或Telegram直接访问，无需本地设置。

Peter Steinberger 🦞@steipete · 5月15日43

mcporter 0.11.0 is live I use mcporter mainly as more stable browser automation cli these days and for agents to test MCPs without having to restart. I do love that code mode is slowly being adopted by harnesses so this will be less needed. https://github.com/openclaw/mcporter/releases/tag/v0.11.0

译mcporter 0.11.0 已上线如今我主要将 mcporter 用作更稳定的浏览器自动化命令行工具，并供代理测试 MCP 而无需重启。我很高兴代码模式正逐渐被测试框架采用，因此对此的需求将减少。 https://github.com/openclaw/mcporter/releases/tag/v0.11.0

Berryxia.AI@berryxia · 5月15日82

Tom 兄弟最近直接把 html-anything 开源了。他花了整整3天，写了1.5万行代码，核心就一个目的：让你的 AI Agent 把任何数据直接转成高质量、专业设计的 HTML。 Markdown、CSV、JSON、图片、代码……11种格式随便扔进去，它就能按照内置的75套模板，输出杂志风格、Keynote、海报、小红书笔记、推文卡片、简历、视频帧等不同形态，每套模板都有真实示例可以直接打开看效果。它能自动识别并支持 Claude Code、Cursor、Codex、Hermes 等十几个本地 code agent，一键切换，复用已登录会话，完全本地运行，不需要 API key，边际成本几乎为零。以前 Agent 输出往往是干巴巴的纯文本，现在它直接把呈现能力补上了。对每天用 Agent 做内容、做报告、做产品演示的人来说，这一步提升很实在。项目地址在评论区，感兴趣的可以去试。

译Tom 兄弟开源了“html-anything”项目，旨在让 AI Agent 能将多种数据格式直接转换为专业设计的 HTML。该工具支持 Markdown、CSV、JSON 等 11 种输入格式，并内置 75 套模板，可生成杂志、海报、推文卡片等多种形态。它能自动兼容 Claude Code、Cursor 等主流本地 code agent，实现一键切换、完全本地运行，无需 API 密钥，边际成本极低。这一能力显著提升了 Agent 的内容呈现效果，对日常使用 Agent 进行内容创作、报告和演示的用户具有实用价值。

🚨 AI News | TestingCatalog@testingcatalog · 5月15日76

Kimi released Kimi Web Bridge, a new browser extension that works with various agents, including Claude Code, Hermes, Codex, Kimi Code CLI, and more. One Browser Use for all 👀

译Kimi发布了Kimi Web Bridge，这是一款可与多种代理协同工作的新浏览器扩展，包括Claude Code、Hermes、Codex、Kimi Code CLI等。一浏览器通用于所有 👀 试用地址：http://kimi.com/features/webbridge 及Chrome网上应用店。

向阳乔木@vista8 · 5月15日68

刚安装了Raycast 的Beta版本，终于支持了Agent和Skill。安装这个版本好像可以免费用各种顶级 AI 模型。但Bug不少，因不支持Cloud同步，所以你的各种快捷键和Prompt都需要重新设置。下载体验地址 http://raycast.com/new

译Raycast Beta版本新增了对Agent和Skill的支持，用户可通过该版本免费使用多种顶级AI模型。然而，当前版本存在较多Bug，且暂不支持Cloud同步功能，这意味着用户的快捷键设置和自定义Prompt等个人化配置无法云端备份，需要在新安装时重新手动设置。

MiniMax (official)@MiniMax_AI · 5月15日42

We're speaking at @awscloud 's Technical Leader's AI Agent Playbook in Palo Alto this Friday! Justin Jia, Solutions Architect at @MiniMax_AI will join the conversation on taking AI agents from POC to production. May 15 · 9AM PDT RSVP here👇 https://aws-experience.com/amer/smb/e/1f1b6/the-technical-leaders-genai-and-ai-agent-playbook-15-checkpoints-from-poc-to-production

译本周五我们将在帕洛阿尔托的@awscloud技术领袖AI智能体实战研讨会上发言！ @MiniMax_AI 解决方案架构师Justin Jia将参与关于AI智能体从概念验证到生产部署的讨论。 5月15日 · 太平洋时间上午9点在此预约👇 https://aws-experience.com/amer/smb/e/1f1b6/the-technical-leaders-genai-and-ai-agent-playbook-15-checkpoints-from-poc-to-production

Ant Ling@AntLingAGI · 5月14日83

🚀 Ring-2.6-1T is now open source. A trillion-scale flagship thinking model built for real-world complex tasks: Agent workflows, coding & engineering, long-horizon tasks, complex reasoning, research, and enterprise automation. It is designed to move beyond “answering” toward execution: understanding context, planning steps, calling tools, and staying stable across long task chains. Highlights： - Advanced agentic workflow support. - Reasoning effort levels: high for agentic tasks, xhigh for complex reasoning. - Scalable asynchronous RL via the IcePop algorithm, enabling stable, trillion-scale training for long-horizon agentic RL.

译Ring-2.6-1T 正式开源，这是一个专为现实世界复杂任务构建的万亿规模旗舰思考模型。其设计目标超越单纯的“回答”，转向任务执行，能够理解上下文、规划步骤、调用工具，并在长任务链中保持稳定。模型重点支持高级智能体工作流，提供不同级别的推理努力配置：常规任务采用高级别，复杂推理则启用更高强度。通过 IcePop 算法实现了可扩展的异步强化学习，从而支撑了面向长周期智能体任务的稳定万亿规模训练。

Microsoft Research@MSFTResearch · 5月14日44

New releases from Microsoft Research, live in 1 hour. Join for ai that runs your repo + verification-first research + more. 👉 https://msft.it/6014vRGqK ⏰ 9 AM PT/12 PM ET 💬 Join live + ask questions in chat

译微软研究院新发布，一小时后直播。加入我们，了解运行代码库的AI + 验证优先研究 + 更多内容。 👉 https://msft.it/6014vRGqK ⏰ 太平洋时间上午9点/东部时间中午12点 💬 参与直播 + 在聊天中提问

meng shao@shao__meng · 5月14日58

Meta 收购 Manus 时，第一反应是： Microsoft 要收购 GenSpark 了吧，这可能是 Microsoft 唯一的选择但后来 OpenClaw 很快就横空出世，Manus 的产品形态变得更普遍甚至被超越，Meta 一时间变成了“冤大头”，随即后面商务部叫停了收购，Meta 也算是意外免去了损失在 Hermes Agent 等一众 OpenClaw 接替产品，和 Codex、Claude Code 等不断变成通用 Agent 的时间点，留给 GenSpark 和 Manus 的方向是什么呢？

elvis@omarsar0 · 5月14日23

Any good alternatives to the Claude Agent SDK? I have used OpenAI Agent SDK and ADK a bit in the past but not sure about their state today.

译有没有Claude Agent SDK的好替代品？过去我用过一些OpenAI Agent SDK和ADK，但不确定它们现在的状态。

Berryxia.AI@berryxia · 5月14日79

看来最近Kimi闷声干大事啊，看完这几个Demo演示视频！我后背到没有发凉。倒是热血沸腾，觉得真的觉得牛逼！ Kimi今天直接把AI agent从“只会聊天”拉到了“像人一样操作浏览器”。他们放出了Web Bridge浏览器扩展。一句话命令，Agent就能自己搜索、滚动、点击、输入，完成整套任务。我看完那几段演示后彻底惊了。第一个demo：Agent同时在X、Reddit、Hacker News上搜Kimi K2.6相关帖子，过滤高互动内容，把标题、平台、链接、关键点全部自动拉进Excel表格，几秒钟搞定。第二个demo更离谱。 K2.6多模态能力上线后，agent直接打开一个网站，分析完结构、图片、图表，然后把整个页面完整复制出来，连本地服务器都帮你启动好了。第三个demo：你随便聊一句，它就自动打开Google Forms，帮你把整个调研问卷从零搭好。更重要的是，它现在原生支持Kimi Code CLI、Claude Code、Cursor、Codex、Hermes等一堆工具。以前agent最大的痛点就是“只能看不能动”。现在Kimi直接把浏览器变成了agent的真实操作界面。这波操作把AI agent的生产力直接拉到新维度。以前我们还在纠结上下文长度，现在它们已经能像真人一样在网页上干活了。 Web Bridge已经在Chrome应用商店上线。去 https://www.kimi.com/features/webbridge 试试。你还在用只会聊天的agent吗？

译Kimi近日发布Web Bridge浏览器扩展，标志着AI Agent能力实现从“只能对话”到“像人一样操作浏览器”的实质性跨越。通过该扩展，Agent可自主执行搜索、滚动、点击、输入等操作，完成跨平台信息搜集整理、网页结构分析与复制、自动创建表单等复杂任务。它原生支持Kimi Code CLI、Claude Code、Cursor等多种开发工具，极大提升了AI助手的工作流自动化水平与生产力维度。该扩展已在Chrome应用商店正式上线。

Berryxia.AI@berryxia · 5月14日68

Agent 记忆真是太特么卷了啊！不得不说，这个赛道越多人加入越爽啊！ Tencent AI团队花了整整6个月，就死磕一个问题：AI agent长会话里疯狂丢上下文。他们最后把一套记忆系统做完，直接开源了。我看完他们的分享，最大的感受是，99%的人还在卷上下文长度，真正把agent拉回正轨的，是这三招硬核操作。第一招，实时压缩过期上下文。直接把token消耗砍掉61%。以前动不动就爆上下文，现在中途就瘦身，agent还能保持清醒。第二招，给agent画一张结构化的任务地图，用mermaid语法直接生成。 30多步的复杂流程里，丢轨概率大幅下降。 agent不再像无头苍蝇，它知道自己现在在哪一步，该往哪走。第三招，专门给agent建了Persona记忆。人格一致性从48%直接跳到76%。它不再一会儿专业一会儿随意，回答风格和角色设定稳得一批。这套东西不是理论，是他们真实踩坑6个月踩出来的。 Repo已经挂出来了，谁在做agent的赶紧去试。以前总觉得agent记忆难，是因为我们把问题想简单了。真正难的不再是存更多信息，是需要解决让它在正确的时间用正确的方式想起正确的东西。你还在靠堆token解决agent记忆问题吗？项目地址：https://github.com/Tencent/TencentDB-Agent-Memory

译腾讯AI团队耗时6个月，针对AI agent在长会话中频繁丢失上下文的问题，开发并开源了一套记忆系统。该系统通过三大核心操作提升性能：实时压缩过期上下文，将token消耗降低61%；利用mermaid语法生成结构化任务地图，使agent在30多步复杂工作流中不易迷失；建立专用Persona记忆，将人格一致性从48%提升至76%。方案基于实际踩坑经验，强调agent记忆的难点在于在正确时间以正确方式回忆正确信息，而非单纯堆叠token。项目已在GitHub开源，为AI agent发展提供实用解决方案。

meng shao@shao__meng · 5月14日67

Cline SDK 终于发布了，同时发布的还有以 Cline SDK 为基础的 Cline CLI 和 Skills @cline 是最早一批 Agentic Coding 工具了，之前主要以 IDE 插件的形式存在，Cline 的实际表现一直都很强，而且团队有很多技术工程实践，都早于 Claude Code 等团队，技术博客价值很高！后来经历了一些变动，工程团队很多人都去了 Codex，现在重新看到 Cline 的最新进展，还是很期待实际表现。 https://cline.bot/blog/introducing-cline-sdk-the-upgraded-agent-runtime 最新发布的 Cline CLI 在 Terminal Benchmark 上多项第一，超过 Claude Code、Codex 和 Droid 等 Agent，咱们一起看看它在 Harness 方面的重要实践。 Cline 在 Harness 方面的升级 Cline 2.0 重写了 prompts、简化 loop、收紧上下文管理、改进反馈与错误处理、重新设计了工具如何暴露给模型。官方公布的 Terminal-Bench 2.0 成绩： 1. 前沿模型上 Cline CLI 的表现： · claude-opus-4.7：74.2%（Claude Code 同模型 69.4%） · claude-opus-4.6：71.9%（Claude Code 65.4%，Droid 69.9%） · gpt-5.3-codex：73.0%（Codex CLI 75.1%、Droid 77.3% 略高） 2. 开源权重模型上更明显的领先： · kimi-k2.6：Cline 55.1% vs OpenCode 37.1% / Pi-Code 45.5% · deepseek-v4-pro：53.9% vs 51.7% / 52.9% 值得关注的能力点 1. Plugin 层：可注册工具、监听生命周期、加规则与命令、塑造 agent 视野。可从单个 .ts 文件起步，逐步演进为带 cline.plugins manifest 的包。 2. Provider 开放性：@ cline/llms 把模型目录与 provider 配置从 agent loop 中剥离，支持 Anthropic / OpenAI / Google / Bedrock / Mistral / LiteLLM / vLLM / Together / Fireworks。新 provider 只需实现 ApiHandler 并 registerHandler。 3. 原生 Agent Teams / Subagents：子 agent 有自己的模型、工具、prompt，bundled plugin 提供启动、消息、状态、handoff notes 等工具——不需要自己写 orchestration。 4. 开箱即用：CRON、checkpointing、Web search、MCP connector 全部原生。 5. CLI Connectors（实验性）：cline connect 向导可把 agent 接入 Telegram / WhatsApp / Slack。

译Cline发布了全新的SDK、CLI和Skills，对其早期智能编码代理工具进行了全面升级。其CLI在Terminal Benchmark 2.0测试中表现优异，在Claude Opus等前沿模型上超越或比肩Claude Code等对手，在开源模型上领先优势更明显。SDK核心重构了“Harness”，包括重写提示词、简化循环、改进工具暴露方式。关键特性包括强大的Plugin层、开放的Provider支持、原生Agent Teams功能，以及开箱即用的CRON、Web搜索等工具。团队基于2024年以来的经验，将这一运行时开源供开发者使用。

meng shao@shao__meng · 5月14日78

Kimi 发布了浏览器扩展 ~ Kimi Web Bridge https://www.kimi.com/features/webbridge Kimi Web Bridge 把已有的编码型 / 通用型 Agent 接入到用户本地的 Chrome / Edge 浏览器里，使其具备真实的网页操作能力（点击、滚动、输入、抓取、截图）。关键设计取舍 1. 复用用户的真实浏览器，而不开新沙箱 2. 完全本地化执行 3. 开放接入而非闭环产品官方四个案例参考 1. 跨平台批量搜索 → 写表格 2. 看一个网站 → 复刻一个 3. 从日常操作学 Skills 4. 自动填 Google Form

译Kimi 近日推出了名为 Kimi Web Bridge 的浏览器扩展。该扩展能将现有的编码型或通用型 AI Agent 接入用户本地的 Chrome 或 Edge 浏览器，使其获得如点击、滚动、输入、抓取和截图等真实的网页交互能力。其设计核心在于复用用户真实浏览器环境、完全本地化执行，并采用开放接入模式。官方展示了跨平台搜索制表、网站复刻等应用案例。目前，该扩展已支持 Kimi Code CLI、Claude Code、Cursor 等多种 Agent 工具，用户可通过官网和 Chrome 应用商店获取。

Baidu Inc.@Baidu_Inc · 5月14日61

As agent applications move into larger-scale deployment, the cloud stack behind them has to scale with them. At Baidu Create, our EVP and President of Baidu AI Cloud, Dou Shen, announced a new full-stack AI cloud purpose-built for large-scale agent applications, with upgrades spanning Agent Infra and AI Infra. A dedicated cluster powered by our proprietary Kunlunxin AI chip has already supported the training of a key model in the ERNIE 5.1 series.

译随着智能体应用迈向更大规模部署，其背后的云技术栈也需同步扩展。在百度Create大会上，百度集团执行副总裁、百度智能云事业群总裁沈抖宣布推出专为大规模智能体应用打造的全新全栈AI云，其升级涵盖智能体基础设施与AI基础设施。基于我们自研的昆仑芯AI芯片构建的专用集群，已支持ERNIE 5.1系列中一个关键模型的训练。

小互@xiaohu · 5月14日70

感觉效果不错我那天做了个效果不行

译用户分享了对开源项目html-anything的积极体验。该项目旨在让AI Agent能将任何数据转换为具有世界级设计水准的HTML代码。该项目历时三天开发，包含约一万五千行代码，支持75套Skills和9种导出格式，并能兼容包括Claude Code、Codex、OpenClaw、Hermes在内的多种代码生成Agent。

Ethan Mollick@emollick · 5月14日64

“Whimsey attacks” that seem absurd (“I cannot pay that much because of the Geneva Convention”) work against AI agents as guardrails are weak against out-of-distribution arguments. Smaller models fall often, but it even gives an edge against bigger ones. https://www.microsoft.com/en-us/research/articles/whimsical-strategies-break-ai-agents-generating-out-of-distribution-adversarial-strategies-at-scale/

译看似荒谬的“荒诞攻击”（例如“根据日内瓦公约我无法支付这么多”）对AI代理有效，因为防护机制难以应对非常规论点。较小模型常被攻破，但即使较大模型也略受影响。https://www.microsoft.com/en-us/research/articles/whimsical-strategies-break-ai-agents-generating-out-of-distribution-adversarial-strategies-at-scale/

Baidu Inc.@Baidu_Inc · 5月14日57

As agent applications move into larger-scale deployment, the cloud stack behind them has to scale with them. At Baidu Create, our EVP and President of Baidu AI Cloud, Dou Shen, announced a new full-stack AI cloud purpose-built for large-scale agent applications, with upgrades spanning Agent Infra and AI Infra. A dedicated cluster powered by our proprietary Kunlunxin AI chip has already supported the training of a key model in the ERNIE 5.1 series.

译随着智能体应用迈向更大规模部署，其背后的云技术栈也必须随之扩展。在百度Create大会上，百度集团执行副总裁、百度智能云事业群总裁沈抖宣布推出全新的全栈AI云，专为大规模智能体应用构建，其升级涵盖智能体基础设施和AI基础设施。基于我们自研的昆仑芯AI芯片的专用集群，已经支持了ERNIE 5.1系列中一个关键模型的训练。

Kimi.ai@Kimi_Moonshot · 5月14日80

Meet Kimi Web Bridge - Kimi's browser extension. Agent can now interact with websites like a human: search, scroll, click, type and complete tasks. Supports Kimi Code CLI, Claude Code, Cursor, Codex, Hermes, and more. Available now on http://kimi.com/features/webbridge and the Chrome Web Store.

译认识Kimi网页桥接——Kimi的浏览器扩展。现在智能体可以像人类一样与网站互动：搜索、滚动、点击、输入并完成任务。支持Kimi Code CLI、Claude Code、Cursor、Codex、Hermes等平台。现已在http://kimi.com/features/webbridge和Chrome应用商店上线。