With Opus 4.8, you can add system instructions mid-conversation without breaking the prompt cache. More cache hits means lower cost and latency for your API requests.

译使用 Opus 4.8，您可以在对话中途添加系统指令，而不会破坏提示词缓存。更多缓存命中意味着您的 API 请求成本更低、延迟更小。

Greg Brockman@gdb · 5月30日71

Significant upgrades for Codex users on Windows:

译Codex 用户在 Windows 上迎来重大升级：现在计算机操作功能已在 Windows 上可用，Codex 可以在你的 Windows 电脑上执行操作。同时，ChatGPT 移动应用中的 Codex 也支持 Windows，让你可以随时随地启动、审查和引导任务，而工作则在你的 Windows 机器上继续进行。这是一次早期体验，但我们正在努力提供更多方式，让你无论身在何处都能保持工作推进。

Chubby♨️@kimmonismus · 5月30日63

Codex can now control and work on Windows computers, including through the ChatGPT mobile app, so users can start, monitor, and steer coding tasks remotely while work continues on their PC.

译Codex现在可以控制和操作Windows电脑，包括通过ChatGPT移动应用，这样用户就可以在PC上继续工作的同时，远程启动、监控和引导编码任务。

OpenAI@OpenAI · 5月30日73

Windows users, this one’s for you. Computer use now works on Windows, so Codex can take action on your Windows computer. And with Windows support for Codex in the ChatGPT mobile app, you can start, review, and steer tasks on the go while work continues on your Windows machine. An early experience, but we’re working on more ways to keep your work moving, wherever you are.

译Windows用户，这条消息是给你的。计算机使用功能现已在Windows上可用，因此Codex可以在你的Windows电脑上执行操作。通过ChatGPT移动应用中Codex的Windows支持，你可以在工作继续在Windows电脑上进行时，随时随地启动、审查和引导任务。这是一项早期体验，但我们正在努力提供更多方式，让你的工作无论身在何处都能持续进行。

Greg Brockman@gdb · 5月30日53

defensive acceleration in biology with Rosalind:

译OpenAI宣布启动Rosalind Biodefense，旨在为可信开发者提供新的生物防御和大流行病防范能力。同时，将扩大GPT-Rosalind的可信访问权限，面向支持公共卫生与生物防御任务的美国政府及盟友合作伙伴。此举旨在利用前沿AI技术，强化社会预防、检测和应对生物威胁的能力，构建更健全的生物防御生态系统。

Rohan Paul@rohanpaul_ai · 5月30日60

Jensen Huang talked about how a real-time AI tutor is making personalized, one-on-one instruction widely accessible. Instead of giving answers, it coaches step-by-step, adapting in real time. What was once expensive private tutoring is now becoming available to anyone as they learn. --- (Video credit - WWT Fireside Chat, Jensen Huang & Jim Kavanaugh)

译黄仁勋阐述了一种实时AI导师如何通过逐步引导和实时适应，提供个性化一对一教学，从而将原本昂贵的私人辅导服务变得普及可用。引用推文为这一场景提供了背景：当前AI在教育中的应用可能让学习者被动接受信息，而像Koji这样的AI导师工具则旨在引导学生真正思考，改变这一现状。

Luma@LumaLabsAI · 5月30日20

The conversation was great. Now make sure the promo stops people in their tracks. Define the moment that hooked you most. Set the aesthetic. Luma Agents build every podcast promo asset around it from there. Make it heard → http://lumalabs.ai/app

译对话很棒。现在确保宣传能让人驻足。定义最吸引你的瞬间。设定美学风格。Luma Agents将围绕此构建所有播客宣传素材。让它被听见 → http://lumalabs.ai/app

宝玉@dotey · 5月30日62

Claude Opus 4.8 发布的同时，Anthropic 还上线了一个 API 层面的新能力：mid-conversation system messages（对话中途系统消息）。对于做 Agent 开发的会很有用。简单来说它就是类似于后续注入的方式修改原始系统提示词（System Prompt），并且不会影响 Prompt Caching。 4.8 之前 Claude 是不能发送类型是 system 的消息，只能支持 user 或者 assistant 消息，system prompt 只能在最前面。所以 Claude Code 之前是用的一种特殊的消息内容：<system-reminder>，尝试覆盖系统消息指令。举个例子，你在初始 system message 指定这个 Agent 是一个系统设计师的角色，擅长做系统设计，但是不允许写代码，只写文档。然后随着任务推进，现在得让这个 Agent 开始写代码了，但你就算通过 user message 去让它可以写代码，因为权重不够高，它还是会倾向于不写代码写文档。现在有了 mid-conversation system messages，你就可以新加一条指令，明确要求它转变角色变成一个开发工程师，不必再遵守之前不写代码只写文档的约定，并且 mid-conversation system messages 的优先级更高，能覆盖原始 system message 的设定。这个功能目前只支持 Claude Opus 4.8，只在 Anthropic 自家 API 和 AWS 上的 Claude Platform 可用，Bedrock、Vertex AI、Microsoft Foundry 都不支持。系统消息不能放在对话开头（开头还是用顶层 system 字段），也不能连续放两条，必须跟在 user 消息后面。对于普通用户，这功能无需关心。

译Anthropic为Claude Opus 4.8新增mid-conversation system messages API功能。该功能允许在对话进行中动态修改系统提示词（System Prompt），且不会影响Prompt Caching。此前，系统提示词只能在对话开头固定设置，开发者有时通过user消息中的特殊标签尝试覆盖。新功能支持插入更高优先级的系统指令以调整Agent行为。此功能目前仅限Claude Opus 4.8及其官方API与AWS上的Claude Platform。

Google Gemini@GeminiApp · 5月30日63

Gemini Spark is now available to all Google AI Ultra subscribers in the U.S. It can handle the heavy lifting and connect the dots across your digital ecosystem to take action where it matters most. Whether you watch it work or let it run in the background, Gemini Spark is always under your direction. Give it a try at http://gemini.google or in the app and let us know what you think.

译谷歌宣布Gemini Spark现已向所有美国的Google AI Ultra订阅用户开放。这是一款24/7个人AI智能体，可自主在后台工作，即使设备关闭也能执行任务。它旨在连接用户的数字生态系统并采取行动，但重大操作前会与用户确认。用户可通过gemini.google网页端或应用体验。

Replit ⠕@Replit · 5月30日73

Did you try the new Replit Canvas yet? - Explore multiple design directions - Tweak designs by chatting with design frames - Design UI prototypes and convert them into apps - Create marketing assets for social media

译你试过新的 Replit Canvas 了吗？ - 探索多种设计方向 - 通过与设计框架对话来调整设计 - 设计 UI 原型并将其转换为应用 - 为社交媒体创建营销素材

PixVerse@PixVerse_ · 5月30日19

PixVerse can turn any moment into a cool transformation #pixverse #viral #fyp

译PixVerse可以将任何瞬间变成酷炫的变换 #pixverse #viral #fyp

Google Gemini@GeminiApp · 5月30日63

From a newly redesigned Gemini experience to 24/7 agentic assistance with Gemini Spark, here’s a look at this month’s Gemini Drops. 🧵

译从全新设计的 Gemini 界面，到 Gemini Spark 提供的全天候智能体辅助，以下是本月 Gemini 更新概览。🧵

OpenRouter@OpenRouter · 5月30日72

OpenRouter now supports "apply_patch," a server tool that lets any model propose file edits using V4A diffs through the Responses API. The model generates a patch (create, update, or delete a file). OpenRouter validates the diff syntax server-side.

译OpenRouter 现已支持 "apply_patch"，这是一个服务器工具，允许任何模型通过 Responses API 使用 V4A diffs 提出文件编辑建议。模型生成一个补丁（创建、更新或删除文件）。OpenRouter 在服务器端验证 diff 语法。

Replit ⠕@Replit · 5月30日62

What's New in Canvas + Customizable Sign-In with Clerk https://x.com/i/broadcasts/1pJdRRzreMRKW

译Canvas 新功能 + 使用 Clerk 自定义登录 https://x.com/i/broadcasts/1pJdRRzreMRKW

AK@_akhaliq · 5月30日58

81k models available through huggingface inference api

译81k 模型可通过 HuggingFace 推理 API 使用

🚨 AI News | TestingCatalog@testingcatalog · 5月29日62

OPENAI 👀: Codex in ChatGPT now supports Side Conversions, allowing users to ask side questions without disrupting the main thread. /Side testing 🤖

译OPENAI 👀：ChatGPT中的Codex现在支持侧边对话，允许用户在不打断主线程的情况下提出旁支问题。 /Side测试 🤖

meng shao@shao__meng · 5月29日61

Grok Build 0.1 在 Cursor 中已经可用了！

🚨 AI News | TestingCatalog@testingcatalog · 5月29日69

Explee launched AutoGTM, a 24/7 AI sales agent that reads your website, maps your ideal customer profile, finds matching buyers across 105M+ companies, and sends personalized cold emails. Get started with $50 in free credits 👀 https://explee.com/auto-gtm/x/an1 It’s composed of seven autonomous agents: market research, ICP sharpening, prospect discovery, email writing, sequencing, and follow-ups, with pre-warmed mailboxes ready from day one and 97% claimed deliverability. Built for AI-native founders and product teams running outbound manually while everything else runs on AI. AutoGTM covers 105M company profiles and 536M people profiles, runs at $0.03 per email, and is positioned at 15x lower cost than ZoomInfo or Apollo.

译Explee发布了AutoGTM，一个全天候工作的AI销售智能体。它由七个自主智能体构成，负责市场研究、理想客户画像、潜在客户发现、邮件撰写、序列安排及跟进。该产品能从超过1.05亿家公司和5.36亿个人资料中匹配目标客户，并发送个性化冷邮件。AutoGTM提供预热邮箱，声称邮件送达率达97%，每封邮件成本为$0.03，定位成本低于ZoomInfo或Apollo达15倍。该产品面向AI原生团队。

🚨 AI News | TestingCatalog@testingcatalog · 5月29日56

Microsoft announced a major redesign of its 365 Copilot, which now looks a lot like ChatGPT. Which makes total sense, considering the amount of user research hours put into the current UX. ChatGPTfy 👀

译微软宣布对其365 Copilot进行重大重新设计，现在看起来非常像ChatGPT。考虑到在当前用户体验上投入的大量用户研究时间，这完全合乎情理。 ChatGPTfy 👀

小互@xiaohu · 5月29日65

苹果 iOS 27 曝光 Siri 将变成一个独立聊天 App，长得像 ChatGPT，还住进灵动岛而且苹果将允许Sir接入各种AI模型，包括ChatGPT、Gemini、Claude等主角：Siri 大改造交互方式变了，出现一个叫「Search or Ask（搜索或提问）」的新界面。体验会更像聊天，你既能搜东西，也能直接像聊天一样问它问题。有分析说这其实有点像 iPhone 用了多年的 Spotlight 搜索，区别是它可能在任何 App 里都能调出来。

译苹果iOS 27或将对Siri进行大改造，将其转变为类似ChatGPT的独立聊天App，并可能整合进灵动岛。核心变化是允许Siri接入ChatGPT、Gemini、Claude等多种外部AI模型。交互界面将变为“Search or Ask（搜索或提问）”，体验更偏向对话式。

Rohan Paul@rohanpaul_ai · 5月29日56

Google fixed some issues around Gemini’s usage/quota limits. - The biggest issue was that 1 or 2 Omni videos could drain limits for some users because of a bug; Ultra users now get 2X Omni generations - Pro prompts now have a per-prompt quota cap - Failed requests won’t count against quota - Flash-Lite is free and won’t use quota - Granular usage breakdowns/alerts are coming - Selected model will stay remembered unless you change it or hit a cap

译Google针对Gemini应用配额问题推出多项修复。主要修复了一个导致1-2个Omni视频即耗尽部分用户配额的bug，Ultra用户的Omni生成次数提升至2倍。Pro提示词现在设有每提示配额上限，失败的请求不再计入配额。Flash-Lite模型免费使用且不占用配额。此外，系统将记住用户选择的模型，除非用户主动更改或达到配额上限。更详细的用量分析和提醒功能即将推出。

小互@xiaohu · 5月29日67

让一个AI 实时监督另一个 AI 干活 OpenAI 产品负责人 Nick Turley 在采访里讲的介绍了他们的 Auto Review功能 • 主 Agent 干活 • 第二 Agent 实时验证主 Agent 的每个动作 • 检查它没在做任何可能伤害你的事 "这是OpenAI安全团队和对齐团队的研究的成果"，内部是用一个AI来监督另一个AI防止它干坏事... 然后无意是它解锁了一种全新的用法：你终于敢把生活里很多东西的访问权交给 Agent，让它整夜跑着处理敏感数据，第二天起床你只批准几件关键的，剩下的它自己搞完。不用担心半夜你的 Agent 给一个陌生人发了一封带你个人信息的邮件... 说白了，这是"AI 对齐研究"第一次以普通用户摸得着的方式落地。以前对齐是论文里的曲线，现在变成了"我能放心睡过夜"。

译OpenAI 产品负责人介绍了 Auto Review 功能，其核心是一个 AI 智能体执行任务时，由另一个 AI 智能体实时验证其动作的安全性。该功能是 OpenAI 安全与对齐团队的研究成果，旨在让“AI 对齐”从研究概念变为实际产品，使用户能放心地让智能体处理敏感任务。

Berryxia.AI@berryxia · 5月29日54

中午给kfc的轻食来个海报～使用我的这个海报Agent 非常丝滑… 就是随便的提示词，完全不吃你的提示词。

译一位用户分享了使用Bloome平台上的海报设计智能体生成KFC轻食海报的体验，称其过程“非常丝滑”，且对提示词要求不高。该智能体由@berryxia开发，源于其此前分享的高效提示词，旨在简化海报生成流程。该智能体目前需支付1美元解锁，据称在限时期间（约一周）可生成约100张图片。

凡人小北@frxiaobei · 5月29日37

workflow -> agent > dynamic workflow 🤔

译工作流 -> 智能体 -> 动态工作流 🤔

Elon Musk@elonmusk · 5月29日19

Check out the daily Grok Build version updates at https://x.ai/build/changelog

译查看每日 Grok Build 版本更新，请访问 https://x.ai/build/changelog

Josh Woodward@joshwoodward · 5月29日41

We’ve heard your feedback about hitting limits too quickly on @GeminiApp. We're rolling out several fixes to make your quota stretch further and feel more predictable… 🧵

译我们已收到关于在@GeminiApp上过快达到使用限制的反馈。我们正在推出多项修复措施，以使您的配额使用更持久、体验更可预测… 🧵

Rohan Paul@rohanpaul_ai · 5月29日66

Fast mode for Claude Opus 4.8 is roughly 2.5x the speed while being 3X cheaper than before. AI/ML API (@aimlapi) already integrated it on their platform and now also gives some free access to it for selected users. Their platform provides one API for 500+ AI models.

译Claude Opus 4.8发布快速模式，速度提升至2.5倍，价格变为原来的三分之一。该模型在代码质量上相比4.7版本有显著改进，代码缺陷概率降低约4倍。标准API价格为输入$5/百万token，输出$25/百万token。AI/ML API平台已第一时间集成此模型，提供500+模型的统一API接口，并为部分用户推出限时免费体验活动。

小互@xiaohu · 5月29日62

ElevenLabs 推出 Dubbing V2 端到端的AI配音模型... 最大的变化：配音不再是"先转写、再翻译、最后合成"三段式拼接，而是模型直接基于原始表演建模声音。并将音色、情绪、演绎都跟着穿越进每一种语言也就是说，同一个人开口讲六国语言，听上去还是他本人，连情绪和呼吸节奏都对得上 Dubbing v2 支持 90 多种语言和口音，原理：它针对原始表演来生成，而不是针对一段转录文本，所以语气、情绪、表达方式会跨语言保留下来，声音克隆全自动，会给原说话人建一个声音模型并应用到所有目标语言，保留身份、音高和语气，不用手动设置。另外支持音频、视频和文字三种输入具体能力： • 音色穿越：不是模仿你的声音，是你的声音直接在另一种语言里说话 • 情绪保真：原片里你笑你叹气你激动，译版照样有 • 同步感知翻译：译文长度匹配原片口型和停顿，不会嘴动完了字幕还在跑 • 措辞本地化：不是字面直译，每种语言用自己的表达方式 • 端到端全自动：传一个视频进去出一份配音，中间没有手工拼接视频里他们演了三个场景： MrBeast 风格的荒岛求生在 English/German/French 之间无缝切换一段财务部门的快节奏对白试连贯性一个童话故事试表达力

译ElevenLabs 推出 Dubbing V2，一个端到端的AI配音模型。它突破了传统“转写-翻译-合成”的拼接流程，直接基于原始表演建模声音，从而将说话者的音色、情绪和演绎完整迁移到目标语言中。该模型支持 90 多种语言和口音，支持音频、视频及文本输入。其核心能力包括跨语言音色克隆、情绪演绎保留、输出时长与原片口型同步，以及本地化自然表达。演示视频展示了其在多语种无缝切换、快节奏对白及故事叙述中的应用效果。

meng shao@shao__meng · 5月29日76

Claude Code 推出 Dynamic Workflows：从「一个 agent 干到底」升级到「agent 自己当项目经理 + 调度层」，标杆案例是 Bun Zig → Rust 迁移！让 Claude Code 根据任务现场生成编排脚本，在单次会话里启动数十到数百个并行 subagent，并在结果交付前做独立验证。把原本需要多轮人工规划、分阶段推进的大型工程任务，压缩成可端到端自动跑完的长任务。 https://claude.com/blog/introducing-dynamic-workflows-in-claude-code Dynamic Workflows 解决什么问题？ · 上下文窗口有限：拆子任务，并行 fan-out · 单视角易漏检/误判：多 agent 独立探索 + 对抗性 refute · 长任务易中断丢失：进度持久化，断点续跑 · 对话上下文被协调信息污染：协调逻辑在对话外执行，主线程保持单一结论工作机制（技术逻辑）用户 prompt ↓ Claude 动态规划（非固定 pipeline） ↓ 拆分子任务 → 并行 subagents（数十~数百） ↓ 独立产出 → 验证/对抗审查 → 收敛迭代 ↓ 汇总为单一协调结果 → 交付用户几个值得注意的设计点： · 动态编排：脚本由 Claude 现场写，不是固定 workflow DSL；任务形态变化时更灵活，但也更难预测 token 消耗。 · 对抗式收敛：不只「多 agent 投票」，还有 agent 专门反驳其他 agent 的结论，迭代到答案稳定——类似 ensemble + red team。 · 长时运行：官方称可持续数小时到数天；协调在会话外，避免对话 token 被中间状态撑爆。 · 首次触发需确认：第一次启动 workflow 时会展示即将执行的内容，用户确认后才跑——成本与范围的可控闸门。和 Claude Code 现有能力的关系明确把它放在「单个 subagent」和「完整 agent team（需人工搭建）」之间： · 单个 subagent：轻量、快，但 scope 有限 · 完整 agent team：灵活、可见，但搭建成本高 · Dynamic Workflows：Claude 自动决定是否启用、如何编排，用户只需提需求或开 ultracode 这是 agent 编排层的 productization——把多 agent 协作从「高级用户自建」变成「模型自决策调用」。标杆案例：Bun Zig → Rust 迁移 Jarred Sumner 用 dynamic workflows 完成 Bun 从 Zig 到 Rust 的移植（尚未 production）： · ~75 万行 Rust · 99.8% 现有测试通过 · 首 commit 到 merge：11 天流程示意： · 一个 workflow：为 Zig 代码中每个 struct field 映射正确的 Rust lifetime · 下一个 workflow：并行 port 每个 .zig → .rs，每文件配 2 个 reviewer · Fix loop：驱动 build + test 直到全绿 · 后续 overnight workflow：优化不必要的数据拷贝，每个改动单独开 PR 这说明 workflow 不只用于「读/审」，也用于大规模写 + 验证 + 修复闭环——接近小型软件工厂的运作方式。

译Claude Code 推出 Dynamic Workflows 功能，将工作模式从单个 agent 执行升级为 agent 自主担任项目经理与调度层。该功能根据用户 prompt 动态生成编排脚本，在单次会话中启动数十至数百个并行 subagent，并对结果进行独立验证，从而将原本需要多轮人工规划的大型工程任务压缩为端到端自动化的长任务。它解决了上下文窗口有限、单视角易漏检、长任务易中断等问题。标杆案例是 Bun 从 Zig 迁移至约 75 万行 Rust 代码，99.8% 现有测试通过，从首次 commit 到 merge 仅用时 11 天。

小互@xiaohu · 5月29日62

Claude 4.8现在网页版也可以选择思考深度了和Claude code 一样，有5个思考等级...

swyx@swyx · 5月29日45

hear me out: 2016, but nobody pays anything because data

译AI服务商 shift 推出纽约免费清洁服务。用户预约后，经过审核的 shift 操作员将佩戴设备上门清洁，用户无需付费。作为交换，清洁过程会被记录，这些关于人类执行日常任务的行为数据将用于训练机器人技术，其价值资助了免费服务。录音中的个人信息会被匿名化处理。该模式旨在让AI变革具体化，未来计划扩展至水管工、维修和跑腿等全球服务。

Google AI@GoogleAI · 5月29日24

Some fun Gemini Omni use cases from the community 🧵👇

译一些来自社区的有趣Gemini Omni用例 🧵👇

Berryxia.AI@berryxia · 5月29日64

兄弟们，Cursor 也支持最新的Opus 4.8了。不用更新客户端，直接就可以切换使用！

ginobefun@hongming731 · 5月29日63

Claude Code 今天推出了一个叫「动态工作流」的新能力，专门解决单个智能体一次跑不完的大型任务问题。简单说就是，Claude 现在可以在一次会话里动态生成编排脚本，然后同时启动数十甚至数百个并行子智能体，每个子智能体独立完成一部分工作，最后由主流程汇总结果再交给用户。整个过程中 Claude 会自己检查中间产物，不需要用户全程盯着。这个功能最适合三类场景：全代码库的漏洞排查、需要大规模改动的代码迁移、以及必须经过独立交叉验证的关键任务。这些场景过去要么需要人工拆分成很多小任务逐个执行，要么干脆放弃用 AI。新版还加入了一个「ultracode」模式，可以让 Claude 自己判断什么时候该启动工作流，不需要用户手动触发。目前动态工作流以研究预览的形式上线，支持 Claude Code CLI、桌面版、VS Code 扩展，以及各主要云 AI 服务。需要注意的是，动态工作流消耗的 Token 量会比普通对话高很多，官方建议从范围比较明确的任务开始试，不要一上来就跑特别复杂的项目。最直观的案例是官方提到的 Bun 的工程团队，用动态工作流在 11 天内把 Bun 的大部分代码从 Zig 迁移到了 Rust，而且测试通过率达到 99.8%。这个数字说明并行子智能体在大型工程任务里已经开始产生真实价值。

译Claude Code 发布了名为「动态工作流」的研究预览功能，旨在解决单个智能体无法独立完成的复杂大型任务。该能力允许 Claude 在单次会话中动态生成编排脚本，同时启动数十至数百个并行子智能体协同工作，并由主流程汇总结果。它特别适用于全代码库漏洞排查、大规模代码迁移以及需独立交叉验证的关键任务。新版还包含「ultracode」模式，可由 Claude 自行判断是否启动工作流。案例显示，Bun 工程团队利用该功能在 11 天内完成了大部分代码从 Zig 到 Rust 的迁移，测试通过率达 99.8%。需要注意的是，动态工作流消耗的 Token 量会显著增加，官方建议从任务范围明确的项目开始试用。

OpenRouter@OpenRouter · 5月29日68

Don't rely on benchmarks; look at the full picture! Try our new Compare page, which also lets you visualize model performance: https://openrouter.ai/compare/openai/gpt-5.5/anthropic/claude-opus-4.7/anthropic/claude-opus-4.8

译不要只依赖基准测试；要看全面情况！试试我们的新比较页面，它还能让你可视化模型性能：https://openrouter.ai/compare/openai/gpt-5.5/anthropic/claude-opus-4.7/anthropic/claude-opus-4.8

Berryxia.AI@berryxia · 5月29日69

我最近在搭一个AI agent，专门盯一些生物类的最新论文和研究竞品，全球趋势等。以前的做法是每隔几小时就全量抓一次页面，然后把整页内容喂给LLM。 token像流水一样花出去，agent还经常被广告、时间戳这些噪声干扰，效率低得让人头疼。看到今天Firecrawl直接把这个痛点解决了。他们刚上线了/monitor功能。你只用输入一个URL，再用自然语言描述想跟踪的目标，比如“当有ADHD最新课题论文新增xxx时提醒我”。它就会按照你设定的频率去监测，页面一旦有实质变化，就通过webhook推送给你的agent。只摄取真正变动的部分，最多省下90%的LLM token。 diff里清晰列出新增、删除和修改的内容，还带permalink，方便直接分享给团队或者继续交给agent处理。支持API、CLI、MCP或者dashboard初始化，调度可以是5分钟一次、每小时、每天或者自定义。以前我们总觉得agent要保持实时，就得自己扛起监控的重担。现在Firecrawl把“聪明地感知web变化”做成了现成的基础设施，让agent真正把精力放在决策和执行上。

译Firecrawl推出/monitor监控功能，解决AI智能体追踪网页更新时消耗大量LLM token的问题。用户输入URL并用自然语言描述跟踪目标，功能即可按设定频率监测页面。一旦有实质变化，便通过webhook通知智能体，并仅推送变化部分的diff（清晰列出新增、删除和修改），最多可节省90%的LLM token，避免广告等噪声干扰。该功能支持通过API、CLI、MCP或dashboard初始化，调度频率可自定义。

Peter Steinberger 🦞@steipete · 5月29日65

Part of the work was rebuilding leaner and faster dependencies: - http://proxyline.dev - proxy layer - http://fs-safe.io - filesystem safety - http://rastermill.com - Image engine in WASM - http://libopus-wasm.dev - Opus in WASM - http://clawpdf.dev - PDF in WASM

译OpenClaw 通过重构更轻量、更快的依赖库（如 proxyline.dev、fs-safe.io 等）进行优化。根据官方数据，优化后冷启动速度快了 2.9 倍，热启动速度快了 2.5 倍，安装包体积减少了 59%，依赖项数量相比月度高点下降了 42%。核心理念是构建一个更小的核心、明确的依赖关系，并将可选功能以插件形式提供。

Rohan Paul@rohanpaul_ai · 5月29日64

Some truly massive inference numbers here. @Kog__AI just achieved 3,000 tokens/s on 8× AMD MI300X GPUs and 2,100 on 8× NVIDIA H200 (FP16, no speculative decoding) with a 2B model. For comparison, typical GPU decoding speed for 2B to 8B models on high-end GPUs is around 100 to 300 tokens/s per sec. They achieved it by treating LLM decoding as a memory-streaming problem: keep the whole token-generation loop inside one persistent GPU program, so kernel launches, CPU scheduling, intermediate memory writes, and sampling interruptions mostly disappear. Then they cut synchronization waste by making each compute unit wait only for the exact data it needs, while mapping memory access to the MI300X’s chiplet topology so the GPU stops paying avoidable cross-die latency. Finally, their model architecture delays tensor-parallel communication so all-reduce work happens in the background instead of blocking every layer, which is why the runtime, GPU code, and model design all have to be co-designed.

译Kog AI 在标准数据中心 GPU 上实现了惊人的推理速度：在 8× AMD MI300X 上达到 3,000 tokens/s，在 8× NVIDIA H200 上达到 2,100 tokens/s（FP16，无推测解码），而常规速度通常为 100-300 tokens/s。其技术核心是将大语言模型解码视为内存流问题，通过将整个 token 生成循环置于单一持久 GPU 程序内、优化内存访问拓扑以降低跨芯片延迟、并采用延迟张量并行技术来大幅减少开销。Kog 今日开放技术预览，提供 2B 编码模型，并计划后续支持大型前沿 MoE。

🚨 AI News | TestingCatalog@testingcatalog · 5月29日62

ElevenLabs introduced a new Dubbing v2 Alpha model that can translate speech across all languages while preserving the emotional tone of the original content. Big for creators 👀

译ElevenLabs推出了新的Dubbing v2 Alpha模型，该模型可以在所有语言之间翻译语音，同时保留原始内容的情感基调。对创作者来说意义重大 👀

OpenClaw🦞@openclaw · 5月29日62

OpenClaw’s latest sweep: cold agent turns 2.9x faster, warm turns 2.5x faster, tarball 59% smaller, deps down 42% from the monthly high. Small core, explicit deps, optional power in plugins. The claws are getting sharper 🦞 https://openclaw.ai/blog/lighter-core-sharper-claws/

译OpenClaw最新优化成果：冷启动智能体速度提升2.9倍，热启动提升2.5倍，压缩包体积减小59%，依赖项较月度峰值减少42%。核心精简，依赖显式，功能可选插件化。爪子更锋利了 🦞 https://openclaw.ai/blog/lighter-core-sharper-claws/