You can ask Codex to update an existing repo to GPT-5.5.
译你可以要求Codex将现有仓库更新至GPT-5.5。
Every great idea starts as a sketch. Now it doesn't have to stop there. Upload your reference, set the aesthetic, and watch Luma Agents transform your sketch into a fully rendered visual. Architecture. Product design. Characters. Any concept, any style, rendered and ready. Bring it to life → https://app.lumalabs.ai/?seed=984aa029-e3fb-42a6-bcfa-f157330bfdcc
译每个伟大的创意都始于草图。现在它不必止步于此。 上传你的参考图,设定美学风格,看着Luma Agents将你的草图转化为完整的渲染视觉。建筑。产品设计。角色。任何概念,任何风格,皆可渲染就绪。 赋予它生命 → https://app.lumalabs.ai/?seed=984aa029-e3fb-42a6-bcfa-f157330bfdcc
Sigma: A fully private AI browser that runs agents locally on your machine. -No cloud. -No data leaving your device. -Open Source Qwen, Gemma, Nemotron – all running right in your browser. This is the direction browser AI should go!
译Sigma:一款完全私密的AI浏览器,可在您的设备上本地运行智能体。 -无需云端。 -数据不会离开您的设备。 -开源 Qwen、Gemma、Nemotron——全部直接在浏览器中运行。这才是浏览器AI应有的发展方向! [引用 @Sigma_Browser]:搭载OpenClaw智能体的私密AI浏览器,基于免费本地模型运行 在浏览器中直接使用Qwen、Gemma或Nemotron运行您的智能体 开源。私密。在您的本地设备上运行
Ready to have some fun building this weekend?
译这个周末准备好享受构建的乐趣了吗?
Anthropic released new Connectors to Claude, focused on Creative Work. New Connectors: Adobe Creative Cloud, Ableton, Splice, Canva Affinity, SketchUp, Resolume, Autodesk Fusion, and Blender.
译Anthropic 发布了面向创意工作的 Claude 新连接器。 新连接器包括:Adobe Creative Cloud、Ableton、Splice、Canva Affinity、SketchUp、Resolume、Autodesk Fusion 以及 Blender。
Claude Code can now notify you via a push notification when it has finished the task. Claude push 👀
译Claude Code 现在可以在完成任务时通过推送通知提醒您。 Claude 推送 👀
Sigma (@Sigma_Browser) just announced an open-source private AI browser that runs the OpenClaw agent and local models like Qwen, Gemma, and Nemotron on your device. Most AI browsers send page context and task steps to remote servers, which adds delay and creates a privacy gap. Sigma’s proposal is to place a local LLM inside a Chromium browser, then let it read pages, understand intent, and act on the web directly. That changes the browser from a passive viewer into a working surface where AI can click, type, summarize, and automate routine online tasks. Because the browser already holds your real working context: tabs, forms, searches, accounts, and all the messy state of a task in progress. Once an agent lives there, the interface shifts from asking for information to delegating action.
译Sigma发布了一款开源私有AI浏览器,其核心是将本地大语言模型(如Qwen、Gemma、Nemotron)与Chromium浏览器深度集成。该浏览器通过内置的OpenClaw智能体,能直接读取页面内容、理解用户意图,并执行点击、输入、总结等自动化操作,从而将浏览器从被动查看工具转变为能直接处理任务的AI工作界面。此举旨在解决多数AI浏览器需将数据发送至远程服务器导致的延迟和隐私风险,所有计算均在用户本地设备完成,确保了隐私安全和响应速度。
at long last
译终于
In the last four Claude Code CLI releases, we’ve shipped 50+ stability and performance fixes. Faster resume, stable auth, lower memory, fewer hangs: 🧵
译在最近四个Claude Code CLI版本中,我们已经发布了50多项稳定性和性能修复。 更快的恢复速度、稳定的身份验证、更低的内存占用、更少的卡顿现象:🧵
we're doing a lot more of this, hunting down some of the most annoying bugs in Claude Code let me know if you have any white whales
译我们正在更多地做这类工作,追查Claude Code中一些最令人头疼的bug 如果你们有任何难缠的问题,请告诉我
xAI keeps working on SKILLs support 👀 A new Skills tab is now available (but hidden), while Grok 4.3 now supports Skills creation. With all the features being prepared and Google I/O approaching in May, I bet we should expect a Keynote from xAI quite soon.
译xAI 持续开发 SKILLs 支持功能 👀 新的 Skills 标签现已可用(但处于隐藏状态),同时 Grok 4.3 现已支持 Skills 创建。 随着所有功能准备就绪以及五月 Google I/O 的临近,我打赌我们应该很快就能看到 xAI 的主题演讲了。
Now you can run a private OpenClaw Agent powered by local models directly inside a Sigma browser. > Gemma 4, Qwen, 3.5, or Nemotron 3 models are available. All your browser data stays on your machine. > Private AI Agent can manage tabs, navigate to pages, and more!
译现在你可以在Sigma浏览器内直接运行由本地模型驱动的私有OpenClaw智能体。 > 可选Gemma 4、Qwen、3.5或Nemotron 3模型。所有浏览器数据均保留在本地设备。 > 私有AI智能体可管理标签页、跳转页面,功能丰富!
Colors. Typography. Packaging. Campaign assets. All of it, consistent. Set your brand direction and let Luma Agents build out the full system from there. Build it now → https://app.lumalabs.ai/?seed=20c28b58-6310-4f7e-8b78-c334121d3f8c
译色彩。字体。包装。宣传素材。所有这一切,保持一致。 设定你的品牌方向,然后让 Luma Agents 在此基础上构建完整的系统。 立即构建 → https://app.lumalabs.ai/?seed=20c28b58-6310-4f7e-8b78-c334121d3f8c
Advanced memory systems unlock agents unlike anything we've ever seen. This Large Memory Model (LMM) enables proactive memory and allows agents to automatically surface vital context, without explicit prompting. The LMM is purpose-built to give apps persistent human memory without any search or prompting from the user It works across many tools like Gmail & Slack. Worth checking out if you are building advanced AI agents: https://engramme.com
译Engramme公司推出专为AI智能体设计的大型记忆模型,旨在解决AI缺乏持久记忆的核心痛点。该LMM无需用户主动搜索或提示,即可在Gmail、Slack等各类工具中自动提取并呈现关键上下文信息,实现主动记忆功能。其核心观点认为,持久记忆是当前AI的阿喀琉斯之踵,而该技术旨在为所有应用赋予类似人类的持久记忆能力,与Google解决搜索、OpenAI解决语言问题并列。
身边朋友都说mimo 2.5 的Agentic能力不错,申请试试。
AI 终端工具 Warp 宣布客户端代码正式开源,采用 AGPL 协议,代码托管在 http://github.com/warpdotdev/warp。OpenAI 是这个开源仓库的创始赞助商。 Warp 是一个用 Rust 写的现代终端,目前有超过 70 万开发者在用。它最大的卖点是把 AI 能力直接塞进了终端,你可以用自然语言描述想做的事,它帮你生成命令。同时支持 Claude Code、Codex、Gemini CLI 等主流 AI 编程工具。 这次开源有个很特别的地方:社区贡献的流程本身就是"AI 优先"的。Warp 自家的云端 AI 平台 Oz 负责干活,包括写代码、做规划、跑测试,社区成员主要负责提想法、定方向、做验证。简单说,人管方向,AI 干活,这是他们设想的未来软件开发模式。 除了开源,Warp 同步上线了几个更新:支持更多开源模型,包括 Kimi、MiniMax、Qwen,还有一个自动路由模式帮你挑最合适的开源模型;终端界面可以按需定制,从纯终端到带 diff 视图和文件树的完整开发环境,丰俭由人;另外终于支持配置文件了,方便在不同设备间同步设置。 需要注意的是,开源的只是客户端,服务端代码仍然闭源。 Warp 创始人 Zach Lloyd 说,五年前 Warp 刚上线时就计划开源,但一直犹豫。今年 AI Agent 的爆发让天平倾斜了,用他的话说,大量不同背景的贡献者加上 AI 代理的结构化流程,能做出比纯内部团队更好的产品。OpenAI 作为创始赞助商介入,意味着这套"人管 AI 干"的开源协作模式,会被当成一个行业实验来推。 对开发者来说,如果你已经在用 Warp,现在可以直接去 GitHub 提 issue、参与讨论,甚至通过终端里新增的 /feedback 命令直接反馈。如果你之前因为闭源犹豫没用,现在少了一个顾虑。公开路线图显示 5 到 6 月的开发计划已经挂出来了。
译现代终端工具Warp宣布将其客户端代码在GitHub上以AGPL协议开源,OpenAI为创始赞助商。Warp核心特色是深度集成AI,允许用户用自然语言生成命令。此次开源的独特之处在于其“AI优先”的社区贡献流程:由Warp自研的AI平台Oz负责执行写代码、测试等具体工作,社区成员主要进行方向决策与验证,旨在探索未来软件开发新模式。同步更新包括支持更多开源模型、可定制化界面及配置文件同步功能。创始人表示,AI Agent的爆发是促使其开源的关键,希望结合广泛贡献者与AI代理打造更优产品。需注意,服务端代码仍保持闭源。
RAG is how 51% of enterprise AI ships in production according to Menlo Ventures. only 9% rely primarily on fine-tuning. Actian just launched VectorAI DB, a vector database built for RAG in places where cloud access is too slow, too risky, or not allowed. VectorAI DB runs RAG pipelines, semantic search, and real-time AI agents on-premises, at the edge, or air-gapped. - embeddings stay inside your network, queries resolve locally - LangChain and LlamaIndex integration that connects natively - real-time indexing keeps context current as documents update - hybrid search handles semantic and keyword queries in the same call
译根据Menlo Ventures数据,51%的企业AI生产部署采用RAG技术,而仅9%主要依赖微调。Actian推出的VectorAI DB是一款专为云访问受限、延迟高或风险大的边缘环境设计的向量数据库。它支持在本地、边缘或物理隔离网络中运行RAG流水线、语义搜索和实时AI智能体,核心优势包括数据保留在内部网络、原生集成LangChain/LlamaIndex、实时索引更新以及混合搜索功能。该产品已通过黑客马拉松验证,应用于海事AI、设备端治疗师等场景,现正式向公众开放。
NVIDIA Nemotron™ 3 Nano Omni is live on OpenRouter. An open 30B-A3B multimodal model for agentic workflows: text, image, video, and audio in → text out, with a 256k context window and efficient MoE architecture for computer use, documents, and AV reasoning.
译NVIDIA Nemotron™ 3 Nano Omni 已在 OpenRouter 上线。 这是一个用于智能体工作流的开源 30B-A3B 多模态模型:文本、图像、视频和音频输入 → 文本输出,拥有 256k 上下文窗口和高效的 MoE 架构,适用于计算机使用、文档和音视频推理。
You're going to be embarrassed by the slides you made before AI Meet Replit Slides The first AI slides with stunning design
译你会为自己在AI之前制作的幻灯片感到尴尬 认识一下Replit Slides 首个拥有惊艳设计的AI幻灯片
Claude Code can now send push notifications to your phone when a long task finishes or Claude needs your input. Walk away from the terminal, we'll let you know when it's done.
译Claude Code 现在可以在长时间任务完成或需要您输入时,向您的手机发送推送通知。 离开终端吧,完成后我们会通知您。
Almost every day, I'm seeing a new AI-powered product launch, that is removing friction from daily business work. Miniloop just launched an AI workforce platform that turns GTM (go-to-market) work into a set of autonomous agents that can prospect, qualify leads, write content, and engage prospects without much human intervention. These agents are not just rule-based automations, because each one carries memory, can use communication channels like Slack or Telegram, can connect to your existing stack, and can run multi-step workflows that change based on context.
译当前,各类AI产品正不断涌现,致力于消除日常商业工作中的摩擦。Miniloop最新推出的AI劳动力平台,能将市场进入工作转化为一系列具备记忆、可接入通信工具、连接现有技术栈的自主代理。这些代理可运行根据上下文调整的多步骤工作流,实现潜在客户挖掘、资质审核、内容创作和客户互动的高度自动化。其效果如同一位24小时不间断工作的初级营销人员,据用户反馈每周可节省超过20小时,而成本仅为雇佣真人团队的十分之一。
Claude's new connectors will let it work inside Blender, Autodesk Fusion, Adobe Creative Cloud, Ableton, Splice, Canva Affinity, SketchUp, and Resolume. So now it has got direct access to real creative tools, so Claude can read docs, inspect project state, write scripts, and carry out repetitive actions where the work already lives. The Blender connector exposes Blender’s Python API through natural language, which means Claude can debug a scene, inspect object relationships, build small tools, and batch-edit many objects without the user manually clicking through the interface. The Fusion connector pushes the same idea into 3D CAD, where conversation can create or modify models, turning chat from a helper into a control layer for design software. Main benefits is we get fewer manual steps, faster learning, and easier automation for jobs like layer cleanup, export pipelines, scene-wide edits, and tool-building that used to demand deeper scripting skill. The interesting part is that Claude is moving from answering questions to operating inside production workflows. Creative work is full of small translation costs: finding the right menu, remembering syntax, renaming layers, moving assets between tools, writing one-off scripts, debugging scenes, and repeating the same fix across fifty objects. Those are not glamorous problems, but they quietly decide how much ambition survives contact with deadline and fatigue. The connectors Anthropic just announced target exactly that layer. Blender gets a natural-language bridge to its Python API, which means Claude can inspect scenes, explain what is broken, and generate tools inside the software rather than outside it. Fusion, Adobe, Ableton, SketchUp, Affinity, Resolume, and Splice push the same idea into design, audio, and 3D workflows: less context switching, more direct manipulation, and fewer manual handoffs.
译Anthropic为Claude推出了一系列针对创意软件的原生连接器,使其能直接接入Blender、Autodesk Fusion、Adobe Creative Cloud等专业工具内部工作流。这标志着Claude从问答助手转变为能在生产环境中直接操作的智能体。其核心突破在于通过自然语言桥接软件API,例如在Blender中调试场景、批量编辑对象,在Fusion中直接创建或修改3D CAD模型。此举旨在消除创意工作中大量的琐碎“翻译成本”,如寻找菜单、记忆语法、编写一次性脚本等,从而实现更少的上下文切换、更直接的操作和更高的自动化程度,提升工作效率。
Plurai introduced vibe-training 👀 A new way to build real-time, tailored evals and guardrails for your agent, with high accuracy at a fraction of the LLM cost. > Goes from intent to a production-ready API endpoint in minutes > SLMs run at sub-100ms latency, over 8x cheaper than LLM-as-a-judge > 43% fewer failures reaching users vs frontier LLM judges
译Plurai公司推出vibe-training方法,旨在解决AI代理在演示中表现良好但面对真实用户时易出错的痛点。该方法允许开发者通过提示或少量示例快速定义意图,自动生成边缘案例数据集,并训练出与特定用例对齐的专用模型。其核心优势在于能在几分钟内构建生产就绪的实时评估与防护机制,使用小型语言模型实现低于100毫秒的延迟,成本比使用大型语言模型作为评判器降低超过8倍,并将到达用户的故障率较前沿LLM评判器减少43%,从而以极低成本实现超越现有大模型的性能。
OpenAI and Anthropic are racing to build the smartest agents. Base44 is building the platform those agents actually need to run on. While the labs ship models, Base44 just shipped: One-click migration from 6 major platforms Schema reconstruction Custom UI generation Agent workflows on top of your data Different layer of the stack. Maybe the more important one. Pretty cool, ngl
译在OpenAI和Anthropic等公司专注于开发AI模型本身的同时,Base44另辟蹊径,致力于构建这些智能体实际运行所需的基础设施平台。该平台最新推出了一键迁移功能,支持用户将项目从Salesforce、Shopify、WordPress、Lovable、Bolt和Replit这六大平台快速迁移至Base44。迁移过程不仅包含数据转移,还提供数据结构重建、自定义界面生成服务,并允许用户在自身数据之上构建智能体工作流。为庆祝功能发布,在5月5日东部时间零点前完成迁移的用户可获得25个免费积分。Base44此举凸显了其在AI技术栈中专注于可能更为关键的基础层。
Claude now connects to the tools creative professionals already use. With the new Blender connector, you can debug a scene, build new tools, or batch-apply changes across every object, directly from Claude.
译Claude 现已连接创意专业人士已在使用的工具。 通过新的 Blender 连接器,您可以直接从 Claude 中调试场景、构建新工具,或对每个对象批量应用更改。
xAI is rolling out support for shareable Imagine templates on the Grok web. Users can now create custom templates with 3 different options - Photo > Video - Photo > Style Edit - Photo > Edit > Video Additionally, the "Image Reference" template type is also in the works.
译xAI 正在 Grok 网页版上推出可共享的 Imagine 模板功能。 用户现在可以通过 3 种不同选项创建自定义模板 - 照片 > 视频 - 照片 > 风格编辑 - 照片 > 编辑 > 视频 此外,“图像参考”模板类型也正在开发中。
Mistral AI launched Workflows on Mistral Studio for Enterprise customers! > Durable execution - Workflows track state at every step > Observability - Every branch, retry, and state change is recorded in Studio > Human-in-the-loop - A single line of code pauses a workflow for approval > Native to Studio - Workflows use the same agents and connectors as the rest of Studio > Enterprise readiness - Workspaces within Studio keep teams and projects separated > Built for developers and business teams > Deployment flexibility - The control plane runs on Mistral
译Mistral AI正式为企业客户在Mistral Studio平台推出“工作流”功能。该功能具备持久化执行能力,可追踪每一步状态,并提供完整的可观测性,记录所有分支、重试和状态变更。其核心特性包括支持“人在回路”,仅需一行代码即可暂停工作流等待人工审批,且与Studio原生集成,使用相同的智能体和连接器。该方案注重企业就绪性,通过工作区实现团队与项目隔离,同时服务于开发者和业务团队。在部署上,其控制平面运行于Mistral自有基础设施,提供了灵活性。
holy shit, 兄弟们,这才是程序员的终极形态啊,太牛逼了😲😲😲 Beff刚刚转发的这个演示,直接给我看麻了,忍不住喊了好几声卧槽,把我家猫都吓一激灵🤣🤣🤣 Even Realities的G2智能眼镜出了Terminal Mode, 把一个完整的Claude终端, 直接浮在了你的眼球上🤯🤯🤯 你不用再坐下来,不用再开电脑, 不用再等笔记本加载。 在公园散步的时候,边走边让AI帮你写接口。 坐火车的时候,窗外的风景上飘着终端,AI在实时输出设计规范。 深夜走在街头,霓虹灯旁边就是正在生成的3D交互逻辑。 你说一句话,AI就自动适配眼镜的硬件限制,直接给你代码、逻辑、动画描述。真正做到了走到哪,写到哪。 Beff说的太对了,你可能不喜欢, 但这就是巅峰性能的样子。 它直接把开发环境从电脑里,搬进了你的眼睛里,把上下文切换成本干到了零,damn🤨🤨🤨 以后vibe coding再也不是梗了, 直接变成了真实的工作流。 以前你需要专门腾出时间进入coding状态,现在你任何碎片时间都能迭代产品。 等咖啡的两分钟,地铁上的半小时,散步放空的时候,全都是生产力。 对于solo founder来说,这就是核弹级的武器。 当然也有人吐槽,说这样再也没有真正的下班了,注意力边界会彻底消失。 但Beff那句“You may not like it”已经说透了, 老派的生活方式注定要被淘汰, 你喜欢不喜欢,历史的车轮都会碾过去。 这已经不是一个新功能了兄弟们,一个新物种诞生了! 一个可以边走边思考,边看世界边创造的后人类程序员诞生了! 而且我认为眼镜也只是过渡, 下一步,就是直接连到大脑🤯🤯🤯
译Even Realities推出的G2智能眼镜具备“终端模式”,可将完整的Claude AI终端直接投射到用户视野中。开发者能在移动场景(如散步、通勤)中通过语音与AI交互,实时获取代码、设计规范等内容,实现开发环境与物理世界的无缝融合。该技术彻底消除了上下文切换成本,将碎片时间转化为生产力,被视为“vibe coding”的终极形态。尽管引发工作与生活界限的担忧,但这代表了程序员工作流的革命性变革,被形容为“巅峰性能”和“新物种”的诞生。
🆕 Today, we're releasing the public preview of Workflows, the orchestration layer for enterprise AI. 🌎 Enterprise teams have capable models. What they don't have is a way to run them reliably in production. That's the gap Workflows fills. It takes AI-powered business processes from prototype to production, with the durability, observability, and fault tolerance that production actually requires. Leading organisations like ASML, ABANCA, CMA-CGM, France Travail, La Banque Postale, Moeve, and many others are already using Workflows to automate critical processes.
译企业AI编排平台Workflows发布公开预览版,旨在解决企业团队将AI模型可靠投入生产环境的难题。该平台专注于为AI赋能的业务流程提供生产环境所需的持久性、可观测性和容错能力,帮助其从原型阶段过渡到实际生产。包括ASML、ABANCA、CMA-CGM在内的多家领先机构已使用Workflows来自动化其关键流程。
我靠,今天产品负责人又抽疯了 他竟然说 DeepSeek V4 官方打 2.5 折太抠门了 他要在 ColaOS 里的免费给大家用 V4 我:???你认真的吗, Agent 里的模型那么贵,我们兜得住吗? 这次他又给了一个我完全无法拒绝的理由... 我说好吧,那我们先免费到五一假期结束吧... 如果你还没有邀请码,用这个: x-USGB739K 下载地址 http://colaos.ai 目前只支持 Mac
译ColaOS产品负责人决定在ColaOS中免费提供DeepSeek V4模型,而非仅提供官方2.5折优惠。面对内部对高昂模型成本的担忧,负责人给出了一个“无法拒绝的理由”,最终团队达成妥协,将免费使用期限设定为五一假期结束前。推文同时提供了下载地址(目前仅支持Mac)和一个用户邀请码。
图像类产品现在分两派: 把单次生成做到极致,和把整个视觉工作流跑通。 flowith 明显是后者,还顺手把视频给 seedance 出来了。 关键是底层就是 image2,而且不止这一个模型。 不管底层怎么换,上层工作流都很稳。 单点极致 + 工作流闭环,两派合一。 对我这种普通用户非常有价值。
译当前图像生成产品主要分为追求单次生成效果极致与打通完整视觉工作流两大方向。Flowith属于后者,其推出的Image Agent不仅能够生成高质量图像,更核心的价值在于构建了稳定的视觉工作流体系。该平台底层集成多个模型(如Image2等),且上层工作流架构设计稳健,不受底层模型更换的影响。它能将单一文本提示转化为完整的营销活动工作流,提供可放大的细节、有效的文字渲染、具备搜索感知的创意智能,并能通过Seedance 2.0技术将图像转化为视频,从而成功融合了“单点极致”与“工作流闭环”两种路径,为用户提供了显著的综合价值。
ElevenLabs released Agent Templates to accelerate bootstrapping of AI Agents for customer support, education, and administrative use cases. > Agent Templates are ready-made starting points for building conversational agents. Rather than configuring an agent from scratch, you pick a template that matches your use case, customize the details for your business, and deploy.
译ElevenLabs近日推出Agent Templates,旨在加速AI智能体在客户支持、教育和行政等用例的启动过程。这些模板是预配置的ElevenAgents,为用户提供了构建对话式智能体的快速起点。用户无需从零开始繁琐配置,只需选择与自身业务场景匹配的模板,自定义相关细节,即可快速部署。据官方介绍,这些模板可在企业的支持、销售和运营等多个环节广泛部署,每增加一个用例,其价值便得到叠加和增强。目前平台提供超过50个模板,内含预定义的提示词、工作流程和集成方案,极大地简化了实施流程。
OpenAI 开源 Codex 编排规范 Symphony 来自 OpenAI Engineering 博客,先说文章中能学到的: · 重新定义"开发工作"的单位:从 PR/会话 → ticket/交付物。 · 把隐式流程文档化:写一份 WORKFLOW.md,让 agent 也能遵守人类约定。 · 把代码生成视作近乎免费:技术选型可以重新按"语言强项"决策。 · 不要把 agent 当节点,要给它目标 + 工具 + 上下文。 · 失败不是修补对象,而是补强系统的输入:把单次纠偏变成 skill/guardrail。 · issue tracker 即控制平面:你已有的 Linear/Jira 可能就是最好的 agent 编排入口。 博客原文在这,接着看看详细内容解读: http://openai.com/index/open-source-codex-orchestration-symphony # 为什么需要 Symphony? OpenAI 内部团队半年前定下一条规则:项目仓库内 每一行代码都必须由 Codex 生成,人不写代码(之前 OpenAI Developers 的 harness engineering 博客有介绍)。这条路走通了,但很快撞上新的瓶颈——人的上下文切换。 每位工程师同时驾驭 Codex 会话的极限大约是 3–5 个:再多就开始忘记每个会话在做什么、在终端间来回纠偏、调试半途卡死的任务。 Agent 很快,但人脑成了系统瓶颈。OpenAI 团队意识到自己"造了一支极有能力的初级工程师团队,却让资深工程师去当保姆",这无法 scale。 # 视角的根本性转变 他们重新审视后意识到一个核心错误:优化目标错了。 传统做法围绕"会话 + PR"来组织工作,但真正驱动软件工程的是交付物——issue、ticket、milestone。 于是反转思路:不再让人去监督 agent,而是让 agent 自己从任务看板拉取工作。这就是 Symphony 的起点。 # Symphony 是什么? 一句话定义: 把 Linear(或任意 issue tracker)变成 coding agent 的控制平面。 核心机制: · 每个 open issue → 一个独立的 agent workspace · Symphony 持续轮询任务板,确保每个活跃任务都有 agent 在跑 · agent 崩溃/卡死 → 自动重启 · 新任务出现 → 自动接管 · ticket 状态本身就是状态机 这意味着工作流被与会话和 PR 解耦:一个 ticket 可以产生多个跨仓库 PR,也可以是纯调研而完全不碰代码。 # 带来的实际变化 量的变化:部分团队上线 Symphony 三周内,已合入的 PR 数量增长 500%。 质的变化更深: · 改变的是"代码变更的经济学":当人不再投入精力驱动实现,每一次变更的感知成本骤降。 · 试错变得几乎免费:随手开个 ticket 让 agent 去原型探索,结果不满意就丢掉,几乎零成本。 · 发起工作的人扩大了:PM 和设计师可以直接在 Linear 提需求,拿回的是一份包含真实产品中功能演示视频的 review 包,无需 checkout 仓库或开 Codex 会话。 · DAG 自动并行执行:agent 只处理未被阻塞的任务。例如标记"React 升级 blocked on Vite 迁移",agent 会先迁完 Vite 再升 React。 · agent 自己创建工作:实施或 review 中发现的性能问题、重构机会,会被自动开成新的 ticket,再由其他 agent 接力。 · 大型 monorepo 的"最后一公里":Symphony 监控 CI、自动 rebase、解决冲突、重试 flaky 测试,直到代码安全合入主干。 文中举了一个生动例子:一位工程师坐在网络很差的山间小屋里,仅用手机上的 Linear App 就完成了三个重大改动。 # 新出现的问题与权衡 把 agent 提到"ticket 级别"后,失去了对会话中途的实时纠偏。OpenAI 选择的应对方式是: · 不修补单次结果,而是补强系统:把失败案例转化为新的 guardrail 和 skill,让 agent 下次能自己做对。 · 由此衍生出新能力:跑端到端测试、用 Chrome DevTools 驱动应用、QA 冒烟测试管理等。 并非所有工作都适合 Symphony。模糊的、需要强判断和深度专业的任务仍然适合人与 Codex 交互式合作——而这恰恰是工程师最享受的部分。Symphony 解决的是"占用大量精力的常规实现工作"。 另一个反思:不要把 agent 当作状态机里的死节点。早期版本只让 Codex"实现任务",事实证明太局限。后来给它配 gh CLI、读 CI 日志的 skill 等,于是 Codex 也能关闭旧 PR、汇报已完成/被废弃的工作。结论是: 给 agent 目标,而不是僵硬的状态转移。像好的经理给下属布置 goal 一样:给工具、给上下文,让它自己思考。 # Symphony 的"轻量级"本质 打开 Symphony 仓库 会发现一件令人意外的事:Symphony 本质上只是一个 SPEC.md 文件——一份对问题与解法的定义。 参考实现用 Elixir 写(因为代码生成已经几乎免费,可以纯按语言强项选型,Elixir 的并发/监督树非常契合)。但 OpenAI 鼓励的方式是: 把这份规范喂给你喜欢的 coding agent,让它给你实现一份属于你自己的版本。 为了打磨规范,OpenAI 让 Codex 用 TypeScript、Go、Rust、Java、Python 各自实现了一遍,借多语言交叉验证去消除歧义、简化系统——每种语言都一次成功。 # 规范的关键架构(来自 SPEC.md) Symphony 服务被分为可移植的若干层: · Policy Layer:仓库内 WORKFLOW.md,定义团队规则 · Configuration Layer:front-matter 解析、默认值、env 变量 · Coordination Layer:轮询、调度、并发、重试、对账 · Execution Layer:workspace 生命周期 + coding agent 子进程 · Integration Layer:tracker 适配器(当前是 Linear) · Observability Layer:日志 + 可选状态界面 核心设计原则: · Symphony 只负责调度与运行 + 读取 tracker;ticket 的写操作(状态、评论、PR 链接)由 coding agent 自己用工具完成。 · WORKFLOW.md 在仓库内:把"work-on-issue → checkout → in-progress → 提 PR → review → 附视频"这套过去隐式的人类流程版本化,agent 跟随它工作。流程要变?改 WORKFLOW.md。 · 每个 issue 的 workspace 严格隔离,路径必须落在配置好的 root 之内,identifier 经过字符白名单清洗。 · 重试用指数退避,连续 turn 在同一 thread 上进行,避免重复发送原始 prompt。 · 对账(reconciliation)每个 tick 跑一次:检测 stall、刷新 tracker 状态、终止已不再活跃的 worker。 # 关键技术亮点:Codex App Server Symphony 选择以 Codex App Server(Codex 的 headless 模式)作为运行底座,通过 JSON-RPC over stdio 与 Codex 通信,比 CLI 或 tmux 更可靠、可扩展。 值得一提:通过 dynamic tool calls 暴露了一个名为 linear_graphql 的客户端工具,让 agent 直接执行任意 Linear GraphQL,而不需要把 Linear access token 暴露给子 agent / 容器——这是 MCP 之外更轻量的一种安全方案。 # 未来与启示 OpenAI 明确表示:Symphony 不会作为独立产品长期维护,它是一份参考实现。意图是展示 Codex App Server 与工作流工具结合的潜力。 对行业的核心判断: 随着 coding agent 推理与遵循指令能力增强,瓶颈正从"写代码"转向"管理 agent 化的工作"。 而搭一套 agent 系统的门槛已经低到——直接用 Codex 把它造出来即可。
译OpenAI 开源了Codex编排规范Symphony,其核心是将Linear等任务追踪系统转变为AI agent的自动化控制平面。该规范让每个未解决的任务自动分配一个独立的agent工作区,持续执行直至完成,实现了工作流与具体会话和PR的解耦。这显著降低了代码变更与试错的成本,并允许产品经理等非技术人员直接通过看板发起工作。OpenAI强调,其目标是展示如何将团队隐式工作流程文档化,让agent遵循人类约定,并将失败案例转化为系统防护栏与技能,推动开发瓶颈从“写代码”转向“管理agent化的工作”。
OpenAI刚刚开源的这个东西,感觉要把程序员的工作方式给整个改写了。 现在大家都在卷模型写代码有多强,但其实真正的瓶颈早就不是生成了。 一个人每天最多同时有效监督3-5个编码Agent,再多就会注意力崩溃,生产力直接归零。 有了Symphony,直接把这个上限干到了几十个。 它把你的Linear、GitHub Issues直接变成了永远在线的Agent调度器。 你开一个任务,它自动启动一个独立隔离的Codex Agent。 自己写代码,自己跑测试,自己做交叉Review,damn! 全部搞定之后,会给你提交一个完整的证据包。 CI全绿,安全和性能专项审查通过,改了UI就自动录好操作视频。 所有验证全过了,才会出现在你的Human Review队列里。 以后人类的角色可能会被彻底颠覆了。 以前你是监工,盯着Agent一步一步写代码,上下文切到吐。 现在你是老板,只需要看最终的结果。 满意就点合并,不满意就去仓库里补规则补文档补Guardrails。 记住兄弟们,永远不要手把手指挥Agent,永远不要替它干活。 这可不是啥实验室概念,OpenAI自己已经这么干了。 三个工程师,五个月,写了一百万行代码,0行人工写的。 产品已经有几百个内部用户,每天都在迭代。 我觉得他们最厉害的不是模型,是他们把整个仓库变成了Agent能看懂能自主工作的乐园。 现在很多人都搞错了Agent时代的核心竞争力。未来不是谁的模型更聪明,而是看谁能设计出让Agent可靠自主工作的环境。 我觉得未来最好的工程师,再也不是写代码最快的人,而是那些最会写规则,最会设计反馈回路,最会给Agent搭舞台的人。 现在Symphony已经开源了,它甚至不是一个成品。 是一个17k token的完整SPEC。 你把这个SPEC喂给任何一个编码Agent,十分钟就能生成你自己定制版的Symphony。 GitHub地址评论区自取👇
译OpenAI开源代理编排器Symphony,将Linear、GitHub Issues等任务跟踪器转化为始终在线的Codex Agent调度系统。它突破了人类同时有效监督仅3-5个编码Agent的瓶颈,允许管理几十个Agent,实现自动编码、测试、交叉审查,并提交包含CI全绿和安全审查的证据包。所有验证通过后,任务才进入Human Review队列,使人类角色从微观监督转变为结果审查与指导。OpenAI内部已实践此模式,三名工程师五个月生成一百万行代码且零人工编写。未来核心竞争力在于设计让Agent可靠自主工作的环境,而非模型本身。Symphony是一个17k token的SPEC,可喂给任何编码Agent生成定制版本。
SpaceXAI is working on a new discovery feed for Grok Imagine powered by video generations from X users. It feels like X Discovery feed is moderated but I don’t think it is transparent to creators that their videos can be seen by other people at this moment. @Kyrannio 👀
译SpaceXAI 正在为 Grok Imagine 开发一个由 X 用户生成的视频驱动的新发现推送。 感觉 X 发现推送经过了审核,但我认为创作者目前并不清楚他们的视频可能被其他人看到。 @Kyrannio 👀
FateTell 是 AI 算命的集大成之作 需要的一定要试试
译FateTell 是一款 AI 算命应用,由西元Levy及其团队开发。作者受传统教育影响不信算命,但体验后震惊于其交互设计和品味,认为团队真心相信且算得准确。即使不信算命,作者也强烈推荐下载体验,并称用户会因此返回。应用可在 App Store 搜索 fatetell 下载,使用美区账号,其他区情况未知。作者还提供了年费会员兑换码,供需求者获取。
🚀 Alibaba Cloud AI Gateway now supports DeepSeek V4! ☁️ Plug-and-play via OpenAI/Anthropic-compatible APIs ☁️ Smart routing + automatic fallback (e.g., Qwen) ☁️ Full support for 1M-context, Tool Calls, and thinking mode ☁️ Unified management for security, quotas, and observability 🧠 Deploy DeepSeek V4 in production—securely, reliably, and at scale! 🔗 Learn more: https://int.alibabacloud.com/m/1000412507/
译🚀 阿里云AI网关现已支持DeepSeek V4! ☁️ 通过OpenAI/Anthropic兼容API即插即用 ☁️ 智能路由 + 自动回退(例如,Qwen) ☁️ 全面支持100万上下文、工具调用及思考模式 ☁️ 统一管理安全性、配额与可观测性 🧠 安全、可靠、大规模地部署DeepSeek V4至生产环境! 🔗 了解更多:https://int.alibabacloud.com/m/1000412507/
Looks like either today or Thursday is shipping day - again. Excited for the coming release
译看起来今天或者周四又是发布日了。对即将到来的发布感到兴奋
Your media library should be a valuable asset, not a liability. Alibaba Cloud’s Media AI solution provides a unified AI platform that understands, organizes, and accelerates your entire media workflow by automatically tagging and summarizing video content, moderating content at the frame level, and enabling AI search across multimodal content. So your content finally starts working for you. 🔗 https://int.alibabacloud.com/m/1000412499/
译您的媒体库应成为宝贵资产,而非负担。阿里云媒体AI解决方案提供统一的AI平台,通过自动标记和总结视频内容、帧级内容审核以及支持跨模态内容的AI搜索,来理解、组织并加速您的整个媒体工作流程。让您的内容最终为您所用。 🔗 https://int.alibabacloud.com/m/1000412499/
小米牛皮!早上申请的中午就到了 直接给了 329 的赠金,相当于一个月的 Codeplan Pro 会员
译小米宣布将其MiMo-V2.5系列模型全部开源,采用宽松的MIT协议,允许自由商用、二次训练与微调。同时,公司推出了Orbit 100T Token计划,旨在激励开发者和构建者。该计划包含两部分:面向AI builder的“百万亿Token创造者激励计划”,成功申请者最高可获得价值659元的16亿Credits;以及面向Agent框架团队的“Agent生态共建计划”,将为框架提供MiMo token限免支持,让终端用户免费体验模型。
Private AI browser with the OpenClaw agent on free local models Run your agent on Qwen, Gemma, or Nemotron directly in t...
Claude now connects to the tools creative professionals already use. With the new Blender connector, you can debug a sce...
关联讨论 2 条Anthropic:Newsroom(网页)X:阿易 AI Notes (@AYi_AInotes)To enable: install the Claude mobile app → /remote-control to pair the mobile app → /config → enable "Push when Claude d...
Sigma发布了一款开源私有AI浏览器,其核心是将本地大语言模型(如Qwen、Gemma、Nemotron)与Chromium浏览器深度集成。该浏览器通过内置的OpenClaw智能体,能直接读取页面内容、理解用户意图,并执行点击、输入、总结等自动化操作,从而将浏览器从被动查看工具转变为能直接处理任务的AI工作界面。此举旨在解决多数AI浏览器需将数据发送至远程服务器导致的延迟和隐私风险,所有计算均在用户本地设备完成,确保了隐私安全和响应速度。
Private AI browser with the OpenClaw agent on free local models Run your agent on Qwen, Gemma, or Nemotron directly in t...
In the last four Claude Code CLI releases, we've shipped 50+ stability and performance fixes. Faster resume, stable auth...
Private AI browser with the OpenClaw agent on free local models Run your agent on Qwen, Gemma, or Nemotron directly in t...
Persistent memory is the Achilles heel of AI. Engramme's Large Memory Models (LMMs) empower every app with persistent me...
现代终端工具Warp宣布将其客户端代码在GitHub上以AGPL协议开源,OpenAI为创始赞助商。Warp核心特色是深度集成AI,允许用户用自然语言生成命令。此次开源的独特之处在于其“AI优先”的社区贡献流程:由Warp自研的AI平台Oz负责执行写代码、测试等具体工作,社区成员主要进行方向决策与验证,旨在探索未来软件开发新模式。同步更新包括支持更多开源模型、可定制化界面及配置文件同步功能。创始人表示,AI Agent的爆发是促使其开源的关键,希望结合广泛贡献者与AI代理打造更优产品。需注意,服务端代码仍保持闭源。
Warp is now open-source.
根据Menlo Ventures数据,51%的企业AI生产部署采用RAG技术,而仅9%主要依赖微调。Actian推出的VectorAI DB是一款专为云访问受限、延迟高或风险大的边缘环境设计的向量数据库。它支持在本地、边缘或物理隔离网络中运行RAG流水线、语义搜索和实时AI智能体,核心优势包括数据保留在内部网络、原生集成LangChain/LlamaIndex、实时索引更新以及混合搜索功能。该产品已通过黑客马拉松验证,应用于海事AI、设备端治疗师等场景,现正式向公众开放。
We're excited to announce VectorAI DB, the first vector database purpose-built for high-performance, reliable AI at the ...
当前,各类AI产品正不断涌现,致力于消除日常商业工作中的摩擦。Miniloop最新推出的AI劳动力平台,能将市场进入工作转化为一系列具备记忆、可接入通信工具、连接现有技术栈的自主代理。这些代理可运行根据上下文调整的多步骤工作流,实现潜在客户挖掘、资质审核、内容创作和客户互动的高度自动化。其效果如同一位24小时不间断工作的初级营销人员,据用户反馈每周可节省超过20小时,而成本仅为雇佣真人团队的十分之一。
i built an AI that runs my go-to-market. writes blogs, finds leads, emails users its basically a junior marketing hire t...
Anthropic为Claude推出了一系列针对创意软件的原生连接器,使其能直接接入Blender、Autodesk Fusion、Adobe Creative Cloud等专业工具内部工作流。这标志着Claude从问答助手转变为能在生产环境中直接操作的智能体。其核心突破在于通过自然语言桥接软件API,例如在Blender中调试场景、批量编辑对象,在Fusion中直接创建或修改3D CAD模型。此举旨在消除创意工作中大量的琐碎“翻译成本”,如寻找菜单、记忆语法、编写一次性脚本等,从而实现更少的上下文切换、更直接的操作和更高的自动化程度,提升工作效率。
Claude now connects to the tools creative professionals already use. With the new Blender connector, you can debug a sce...
关联讨论 2 条Anthropic:Newsroom(网页)X:阿易 AI Notes (@AYi_AInotes)Big day for us, finally sharing what we've been cooking for a while. Over the past year, we kept seeing the same pattern...
Introducing: Base44's new platform migration feature. If your needs have outgrown your current software, you can now bri...
Mistral AI正式为企业客户在Mistral Studio平台推出“工作流”功能。该功能具备持久化执行能力,可追踪每一步状态,并提供完整的可观测性,记录所有分支、重试和状态变更。其核心特性包括支持“人在回路”,仅需一行代码即可暂停工作流等待人工审批,且与Studio原生集成,使用相同的智能体和连接器。该方案注重企业就绪性,通过工作区实现团队与项目隔离,同时服务于开发者和业务团队。在部署上,其控制平面运行于Mistral自有基础设施,提供了灵活性。
Hear from our team:
Even Realities推出的G2智能眼镜具备“终端模式”,可将完整的Claude AI终端直接投射到用户视野中。开发者能在移动场景(如散步、通勤)中通过语音与AI交互,实时获取代码、设计规范等内容,实现开发环境与物理世界的无缝融合。该技术彻底消除了上下文切换成本,将碎片时间转化为生产力,被视为“vibe coding”的终极形态。尽管引发工作与生活界限的担忧,但这代表了程序员工作流的革命性变革,被形容为“巅峰性能”和“新物种”的诞生。
You may not like it, but this is what peak performance looks like. Vibe coding everywhere, straight to your eyeballs. Ma...
企业AI编排平台Workflows发布公开预览版,旨在解决企业团队将AI模型可靠投入生产环境的难题。该平台专注于为AI赋能的业务流程提供生产环境所需的持久性、可观测性和容错能力,帮助其从原型阶段过渡到实际生产。包括ASML、ABANCA、CMA-CGM在内的多家领先机构已使用Workflows来自动化其关键流程。
ColaOS产品负责人决定在ColaOS中免费提供DeepSeek V4模型,而非仅提供官方2.5折优惠。面对内部对高昂模型成本的担忧,负责人给出了一个“无法拒绝的理由”,最终团队达成妥协,将免费使用期限设定为五一假期结束前。推文同时提供了下载地址(目前仅支持Mac)和一个用户邀请码。
当前图像生成产品主要分为追求单次生成效果极致与打通完整视觉工作流两大方向。Flowith属于后者,其推出的Image Agent不仅能够生成高质量图像,更核心的价值在于构建了稳定的视觉工作流体系。该平台底层集成多个模型(如Image2等),且上层工作流架构设计稳健,不受底层模型更换的影响。它能将单一文本提示转化为完整的营销活动工作流,提供可放大的细节、有效的文字渲染、具备搜索感知的创意智能,并能通过Seedance 2.0技术将图像转化为视频,从而成功融合了“单点极致”与“工作流闭环”两种路径,为用户提供了显著的综合价值。
the most powerful image agent has arrived. flowith image agent doesn't just make better images. It builds perfect visual...
Introducing Agent Templates - pre-configured ElevenAgents you can deploy across your business. The best teams run agents...
OpenAI 开源了Codex编排规范Symphony,其核心是将Linear等任务追踪系统转变为AI agent的自动化控制平面。该规范让每个未解决的任务自动分配一个独立的agent工作区,持续执行直至完成,实现了工作流与具体会话和PR的解耦。这显著降低了代码变更与试错的成本,并允许产品经理等非技术人员直接通过看板发起工作。OpenAI强调,其目标是展示如何将团队隐式工作流程文档化,让agent遵循人类约定,并将失败案例转化为系统防护栏与技能,推动开发瓶颈从“写代码”转向“管理agent化的工作”。
📣 What if every open issue had a Codex agent? That's the idea behind Symphony, an open-source agent orchestrator for Co...
关联讨论 2 条X:Vista (@vista8)OpenAI:官网动态(RSS · 排除企业/客户案例)OpenAI开源代理编排器Symphony,将Linear、GitHub Issues等任务跟踪器转化为始终在线的Codex Agent调度系统。它突破了人类同时有效监督仅3-5个编码Agent的瓶颈,允许管理几十个Agent,实现自动编码、测试、交叉审查,并提交包含CI全绿和安全审查的证据包。所有验证通过后,任务才进入Human Review队列,使人类角色从微观监督转变为结果审查与指导。OpenAI内部已实践此模式,三名工程师五个月生成一百万行代码且零人工编写。未来核心竞争力在于设计让Agent可靠自主工作的环境,而非模型本身。Symphony是一个17k token的SPEC,可喂给任何编码Agent生成定制版本。
📣 What if every open issue had a Codex agent? That's the idea behind Symphony, an open-source agent orchestrator for Co...
关联讨论 2 条X:Vista (@vista8)OpenAI:官网动态(RSS · 排除企业/客户案例)受传统教育影响,个人不信算命。 但身边不少朋友对这方面有专研,听过好多离奇的故事。 三年前在飞书工作时认识一个朋友叫西元Levy。 他做了个App叫 @FateTell,他和他的团队是真信,而且据说算的相当好。 试完有点震惊,交互设计和品味...
We will ship again this week. Codex has achieved escape velocity and will keep improving rapidly.
小米 MiMo -V2.5 系列模型全部开源 采用宽松的 MIT 协议,允许自由商用、二次训练与微调,无需额外授权。 同时他们还推出了Orbit 100T Token 计划。 这个太牛批了!如果你有自己 Vibe Coding 一些东西可以...