5月19日

08:56

ginobefun@hongming731

BestBlogs 早报 · 05-19 · Composer 2.5、长时 Agent 与 AI 生码率

本文聚焦AI编码领域正从追求“写得快”向“做得对”的工程化范式转变。文章通过三条核心线索展开：Cursor发布Composer 2.5并公开训练栈，标志着从产品公司转向模型迭代；Anthropic工程师提出对抗式生成-评估架构，将长时Agent自主运行时间从1小时提升至12小时；阿里云CIO则指出“AI生码率”是危险指标，强调代码是负债，工程化与组织能力才是关键。这共同指向一个结论：AI降低了代码生成成本，但将其转化为资产需要深度工程化。

智能体 Anthropic MCP/工具现象/趋势

08:06

Chubby♨️@kimmonismus

LobeHub：从模型智能转向架构编排的AI代理操作系统

当前AI发展的核心瓶颈已从模型智能转向架构编排。LobeHub推出了名为Chief Agent Operator（CAO）的后端管理层，能够根据高层级策略自动组建代理团队并行处理任务。该平台作为编排系统无缝集成到Claude Code、Cursor等开发者环境中，接入庞大的技能市场，并在云端全天候运行，无需本地维护，从而显著降低运营成本。用户专注于制定宏观策略，而由CAO负责管理和执行具体的代理工作。

LobeHub: Meet your Chief Agent Operator in LobeHub now. You don't manage agents. Your CAO does. LobeHub hires agents from a 273K-...

智能体 MCP/工具产品更新

06:55

OpenClaw🦞@openclaw

OpenClaw 2026.5.18 已上线 🤖 xAI/Grok OAuth + sidecar 认证修复 🎙️ 实时 Android 对话模式 💬 Telegram 媒体 + 论坛主题推送修复 🪟 浏览器对话框可见且可应答一周的打磨、优化，减少小问题。 https://github.com/openclaw/openclaw/releases/tag/v2026.5.18

智能体开源/仓库部署/工程

05:42

Rohan Paul@rohanpaul_ai

专精小模型挑战行业巨头：PolyAI的客服AI新突破

PolyAI研究证实，专为客服设计的较小模型Raven 3.5，在性能上显著超越了规模大其100倍的通用前沿模型。该模型在所有四项客服基准测试中击败GPT-5和Claude Sonnet 4.6，并将响应延迟控制在300毫秒内。这项发布同时包括ADK代码开发工具包和PolyPhone网页语音生成工具，助力企业快速构建生产级语音代理。此举旨在将企业语音AI从大型项目转变为可快速部署的基础设施，从而有效解决客服等待时间长、成本高等问题，提升服务效率与客户体验。

智能体模型发布语音

03:42

Rohan Paul@rohanpaul_ai

多智能体世界模型Agoro-1突破共享现实一致性难题

Odyssey团队推出的Agoro-1是首个支持多智能体交互的世界模型，解决了多人共享同一虚拟环境时维持现实一致性的核心瓶颈。该模型突破了传统单玩家预测模式的限制，能够实时模拟多个参与者（人类或AI）在同一世界中的交互行为，并保持世界状态的稳定连贯。这意味着世界模型从单向预测演进为支持动态因果关系的共享实时环境，其真实性不再仅依赖视觉保真度，而取决于多方干预下世界逻辑的自洽性。

Odyssey: Introducing Agora-1, a multi-agent world model. Multiple participants-human or AI-can now interact inside the same world...

智能体模型发布

03:27

Nathan Lambert@natolambert

系统才是产品。如今模型只是其中一个组成部分，我同意 Joanne 的观点。

Joanne Jang: learned this quote from 2023 is making rounds -- i actually don't think this is true anymore in 2026! The model should b...

智能体大佬观点现象/趋势

03:09

Greg Brockman@gdb

通过ChatGPT应用中的Codex，让你的Mac保持唤醒状态，以便你可以在手机上进行构建和工作：【引用 @OpenAIDevs】：你的Mac可以在你用手机工作时坚守岗位。在Codex桌面应用中启用远程连接，然后开启"保持此Mac唤醒"。当你的Mac开机并接通电源时，Codex可以持续运行，而你可以在ChatGPT移动应用上工作。

OpenAI Developers: Your Mac can hold down the fort while you work from your phone. Enable remote connection in the Codex desktop app, then ...

智能体 OpenAI 产品更新

02:45

AYi@AYi_AInotes

Composer 2.5：重RL后训练的Agentic模型突破

Cursor发布的Composer 2.5并非全新底座，而是将85%算力集中于强化学习后训练的agentic模型。它在CursorBench 3.1上达63.2%性能，单任务成本极低。其核心突破在于通过“textual feedback RL”解决了长任务中的信用分配难题，实现精细化调优。该模型真正的优势是长时间运行下的稳定性与行为校准，这是现有基准未能体现但开发者能感知的关键能力。这标志着行业评价标准正从迷信底座规模转向衡量RL与合成数据闭环的投入效率。

Cursor: Introducing Composer 2.5, our most powerful model yet. It's more intelligent, better at sustained work on long-running t...

智能体产品更新推理编码