AIHOT
精选全部 AI 动态AI 日报Agent 接入关于更新日志反馈信源提报
登录
精选全部日报更多
全部动态X · 1966 条
全部一手资讯X论文
Kling AI@Kling_ai · 5月4日42

Classic films. Iconic moments. Now in stunning Kling 4K motion. The posters aren’t just hanging anymore. They’re playing. 🎬

译经典电影。标志性时刻。 现以惊艳的Kling 4K动态呈现。 海报不再只是悬挂着了。 它们在播放。🎬

Berryxia.AI@berryxia · 5月4日60

AI agent终于有专属的Slide框架了。 open-slide 直接把“prompt一下就出一整套精美幻灯片”变成了现实。 它不是简单生成Markdown,而是把每张幻灯片做成React组件,固定1920×1080画布,内置agent技能: - /create-slide:一句话prompt就能生成完整deck - /apply-comments:在浏览器里点元素留评论,agent一键应用所有修改 - 内置演示模式、演讲者笔记、定时器 - 一键导出HTML/PDF - 支持Claude Code、Cursor、Codex等任意编码agent 最重要的是,它把agent从“聊天生成文字”升级成了“真正能输出可呈现成品”的生产力工具。 GitHub:https://github.com/1weiho/open-slide Demo:https://demo.open-slide.dev/ 这波操作,直接填补了agent和真实产出之间的最后一公里。 你觉得agent时代,Slide生成会不会成为标配技能?

译open-slide是一款专为AI agent设计的幻灯片框架,能将自然语言提示直接转化为精美的完整演示文稿。其核心在于将每页幻灯片构建为React组件,并在固定画布上工作,而非简单生成Markdown。框架内置多项agent技能:通过/create-slide指令一句话生成整套幻灯片;支持在浏览器中对元素添加评论,并由agent通过/apply-comments一键应用所有修改;同时集成演示模式、演讲者笔记和定时器,并可一键导出HTML或PDF。它兼容Claude Code、Cursor等多种编码agent,其意义在于将AI agent的能力从“生成文字”升级为“输出可直接呈现的最终成品”,填补了AI代理与真实生产应用之间的关键空白。

meng shao@shao__meng · 5月4日70

OpenAI Codex 新模式 Auto-review:在"频繁打扰人类"和"完全放权"之间,引入第三种治理范式:用一个独立 AI Agent 替代人类,来审批越界行为。 https://alignment.openai.com/auto-review # 要解决的真实痛点 传统的两种模式都有缺陷: · 默认模式:每次越出沙箱(如发起网络请求、运行 python 脚本)都要人工点击批准。结果是:用户疲劳、长时间后台任务无法运行。 · Full Access 模式:彻底关闭审批。沙箱完全失效,恶意代码、数据外泄、凭据探测都不会被拦截。 更糟的是审批摩擦本身反向制造了安全漏洞: · 用户干脆切到 Full Access; · 用户写出过度宽松的前缀规则(文中提到"相当一部分用户允许任何以 python 开头的命令"); · 出于疲劳或不懂,用户盲目点同意。 # Auto-review 的核心设计 当主智能体试图越出沙箱时,请求被转给另一个独立的 Codex 智能体审批。它评估四个维度:用户意图、运行环境、安全策略、动作的可能影响。 为什么必须是"独立的"智能体? 文章给出了一个很重要的对齐理由: · 主智能体的优化目标是"完成任务",因此天然有动机把审批边界视为"待克服的障碍"; · 把审批决策抽离到独立模型调用中,让审批策略可被单独评估、监控、迭代。 这其实是把单智能体的目标冲突,重构成了多智能体的角色分工。 它使用 GPT-5.4 Thinking(low reasoning),并发现:模型越强,既更善于发现风险,也更善于理解用户合理意图。 # 关键运行机制 被拒绝时,审查者不是简单说"不",而是返回拒绝理由和上下文信号。结果: · 内部部署中,超过一半被拒绝的情况下,主智能体能自行找到更安全的替代路径继续执行,无需打扰用户; · 如果智能体反复尝试"绕过审查者"(gaming),系统会自动终止该轨迹。 # 效果数据 越界请求的自动批准率 | 99.1% 全部动作的整体批准率 | 99.93% 相比手动模式,打扰人类的频率 | 降低约 200 倍 智能体过度热心场景的拦截率 | 90.3% Prompt 注入攻击的拦截率 | 99.3% MonitoringBench(Hard)拦截率 | 96.1% 文档中举例的 1 万动作分布:9280 次留在沙箱内;720 次需审查;其中 713 次自动通过;7 次被拒,其中 4 次智能体自找替代方案,仅 3 次真正打扰用户。 目前 OpenAI 内部 Codex Desktop 的 Token 使用量多数已来自 Auto-review 模式。 # 团队坦诚的局限 OpenAI 罕见地用一整节明确边界,而不是只讲成绩: · 不是确定性安全保证。红队测试中确实发现可以骗过 Auto-review 的案例,正在修复,但"这类系统不太可能成为确定性保证的来源"。 · 不能防御模型 Scheming(策略性欺骗)。如果模型本身在策略性隐藏意图,它可能构造一个看起来无害的越界请求,或干脆只在沙箱内做坏事——审查者根本看不到。这类风险需要"思维链监控"等互补机制。 · 本质是一个折中:相比传统安全系统牺牲了确定性,相比 Full Access 牺牲了速度。

译OpenAI Codex推出Auto-review新模式,解决传统人工审批与完全放权两种治理范式的缺陷。该模式在智能体越界时,由独立AI代理审批,评估用户意图、运行环境、安全策略和动作影响。拒绝时提供理由,超一半情况主智能体能自行找到更安全替代方案。效果上,自动批准率达99.1%,将打扰人类频率降低约200倍,有效拦截多数攻击。但团队坦承局限:非确定性安全保证,不能防御策略性欺骗,是安全与速度的折中。

OpenClaw🦞@openclaw · 5月4日58

ClawSweeper 0.2.0 🦞 The OpenClaw maintenance bot now handles the loop: issue → @clawsweeper fix/build → guarded PR → review → repair → re-review → automerge Still conservative. Much less manual. https://clawsweeper.bot

译ClawSweeper 0.2.0 🦞 OpenClaw 维护机器人现已处理整个循环: 问题 → @clawsweeper 修复/构建 → 受保护的 PR → 审查 → 修复 → 重新审查 → 自动合并 依然保守。手动操作大幅减少。 https://clawsweeper.bot

Peter Steinberger 🦞@steipete · 5月4日74

This is the most useful tooling I built for OpenClaw to date. It's open source, runs on codex and you can fork and use it for any repo. For all the hard working oss folks that drown in issues and PRs, this is for you.

译这是我迄今为止为 OpenClaw 构建的最有用的工具。它是开源的,运行在 codex 上,你可以 fork 并将其用于任何代码库。 献给所有在 issue 和 PR 中辛勤工作的开源贡献者们,这是为你们准备的。

Peter Steinberger 🦞@steipete · 5月4日58

🦀📦Crabbox 0.4.0. Often I need to quickly recreate conditions on macOS, Linux and Windows and need fast empheral machines. Crabbox are machines for agents on the fly, using AWS spot instances, Hetzner or @useblacksmith. Infinite codex + tests! https://crabbox.sh/

译🦀📦Crabbox 0.4.0。 我经常需要快速在 macOS、Linux 和 Windows 上重建环境,并且需要快速的临时机器。 Crabbox 是为即时代理提供的机器,使用 AWS 竞价实例、Hetzner 或 @useblacksmith。 无限代码库 + 测试! https://crabbox.sh/

PixVerse@PixVerse_ · 5月4日11

🔥Those cannons slap so hard! Awesome job bringing this detailed art to life @UminekoStudio Love it🥰

译🔥这些炮火效果太震撼了!@UminekoStudio 将如此精细的艺术作品生动呈现,做得太棒了🥰

TestingCatalog News 🗞@testingcatalog · 5月4日52

Google is working on Figma and GitHub import options for AI Studio Build. h/t @Thomas16937378

译Google正在为AI Studio Build开发Figma和GitHub导入选项。 h/t @Thomas16937378

Tibo@thsottiaux · 5月4日75

Last week, we released *Auto-Review* mode in Codex! It is now the default within OpenAI and reduces amount of approvals needed by ~200X. Amazing work from our alignment team. Read the blog at https://alignment.openai.com/auto-review

译上周,我们在 Codex 中发布了 *Auto-Review* 模式!它现已成为 OpenAI 内部的默认设置,并将所需的批准数量减少了约 200 倍。我们的对齐团队完成了出色的工作。 阅读博客:https://alignment.openai.com/auto-review

TestingCatalog News 🗞@testingcatalog · 5月4日48

GOOGLE 🚨: A new design for Gemini on iOS has been spotted! Sleeeeeeeeeeeek! 👀

译GOOGLE 🚨: 在iOS上发现了Gemini的新设计! 丝滑流畅!👀

Rohan Paul@rohanpaul_ai · 5月3日54

Freshly assembled Figure's F.03 humanoid can now walk autonomously from the manufacturing line straight to headquarters. Navigates stairs using only its onboard camera feeds—no LiDAR, no pre-mapped floors. The full locomotion policy was trained end-to-end with reinforcement learning entirely in simulation, then transferred zero-shot to the physical robot. Watch its depth perception in action as it handles stair navigation. The colorful reconstruction is how neural networks infer geometry from cameras, though some jitter in scale and artifacts around windows are visible.

译Figure公司最新组装的F.03人形机器人已能实现自主行走,从生产线直接步行至总部。其核心突破在于仅依靠机载摄像头感知,无需LiDAR或预先地图,即可完成上下楼梯等复杂导航。完整的运动策略完全通过仿真环境中的端到端强化学习训练而成,并零样本迁移至实体机器人。演示中可见其通过神经网络从摄像头数据推断几何环境的深度感知能力,尽管在尺度稳定性和窗户等区域仍存在轻微抖动与伪影。

Rohan Paul@rohanpaul_ai · 5月3日63

World2Agent just open-sourced a protocol that standardizes how Al agents perceive the real world. Install a sensor, your agent gets structured, real-time data. Swap sensors freely — they all speak the same schema. It's trying to give AI agents a standard perception layer, so they can notice outside events before a human writes a prompt. Most agents can already act through tools, but they still need someone to tell them what changed. W2A changes that loop with World → Sensor → Agent, where a sensor watches sources like GitHub, X posts, logs, research drops, meetings, stock moves, or deals, then sends the agent a structured signal. A signal is basically a clean event packet: what happened, where it came from, why it may matter, and what context the agent should read before deciding what to do. That removes a lot of messy glue code, because builders no longer need to rebuild polling, webhooks, schemas, deduping, and delivery logic for every new data source. The useful part is that sensors are reusable, so 1 GitHub sensor or X sensor can feed different agents without each team rewriting the same connector. W2A feels similar in spirit to MCP, but MCP is mainly about what an agent can do, while W2A is about when an agent should wake up and care. W2A now works with any agent (e.g. OpenClaw, Hermes), Claude Code, and Codex. Like agent skills, anyone can build their own W2A sensors and reuse sensors built by others. They’ve also open-sourced the sensors they built, as reference implementations to help developers build more complex sensors for proactive AI agents. W2A Protocol & W2A Sensors are meant to serve as building blocks for the broader proactive AI ecosystem. Architecture World → Sensor → Agent Sensors watch data sources and emit structured data following W2A Protocol. Your agent receives signals and decides what to do.

译World2Agent开源了W2A协议,旨在为AI代理建立标准化的世界感知层。该协议采用“世界→传感器→代理”架构,传感器从GitHub、X帖子、日志等多种数据源中提取信息,并生成包含事件内容、来源及背景的结构化实时信号。这使得AI代理能主动感知外部变化并自主响应,无需等待人类提示。传感器可重复使用,避免了为每个新数据源重复开发轮询、去重等逻辑。与侧重代理能力的MCP不同,W2A主要解决代理“何时应被唤醒”的问题。目前该协议已支持多种主流代理,并邀请开发者共同构建传感器生态。

TestingCatalog News 🗞@testingcatalog · 5月3日45

Google is working on a new Flow app for Android. It is a native Flow experience optimised for mobile use. Beta testing is limited to 1000 testers for now.

译Google 正在开发一款新的 Android 版 Flow 应用。 这是针对移动使用优化的原生 Flow 体验。目前 Beta 测试仅限 1000 名测试者。

Tibo@thsottiaux · 5月3日68

/goal might be the most consequential thing we have shipped in codex The value of good instructions has never been higher.

译/goal 可能是我们在 codex 中推出的最重要的功能 优质指令的价值从未如此之高。

OpenClaw🦞@openclaw · 5月3日56

OpenClaw 2026.5.2 🦞 🧠 xAI Grok 4.3 🔌 Plugin installs/updates are sturdier ⚡ Gateway + agent hot paths are leaner 💬 Discord, Slack, Telegram, WhatsApp fixes 🎙️ TTS, Realtime, web search, voice-call polish Less drama. More uptime. https://github.com/openclaw/openclaw/releases/tag/v2026.5.2

译OpenClaw 2026.5.2 🦞 🧠 xAI Grok 4.3 🔌 插件安装/更新更稳定 ⚡ 网关 + 智能体关键路径更精简 💬 Discord、Slack、Telegram、WhatsApp 问题修复 🎙️ 文本转语音、实时功能、网页搜索、语音通话优化 减少戏剧性,增加运行时间。 https://github.com/openclaw/openclaw/releases/tag/v2026.5.2

Peter Steinberger 🦞@steipete · 5月3日45

This one fixes the depenency issues/slowness some had when installed via npm. Plugins are hard, worth it tho! Package is way leaner now, we moved [almost] everything into extensions! https://docs.openclaw.ai/plugins/manage-plugins

译OpenClaw 2026.5.2 版本核心解决了通过 npm 安装时的依赖问题和速度缓慢现象。本次更新通过将大部分功能移至扩展插件,显著精简了主软件包。主要更新内容包括:集成 xAI Grok 4.3 模型,增强插件安装与更新的稳定性,优化 Gateway 和 agent 关键路径的性能。此外,还修复了 Discord、Slack、Telegram、WhatsApp 等通讯工具的集成问题,并对 TTS、实时功能、网络搜索及语音通话进行了优化打磨。此次发布旨在减少系统故障,提升整体稳定性和运行时间。

PixVerse@PixVerse_ · 5月3日15

疲れちゃった時は、@Kawaiizice さんのクールな作品でリフレッシュ✨ 週末を最高に過ごすなら、PixVerseの高画質Seedanceで創作を楽しもう!😺🚀

译疲惫的时候,就用@Kawaiizice 的酷炫作品来refresh一下吧✨ 要想度过最棒的周末,就在PixVerse上用高画质Seedance享受创作的乐趣!😺🚀

Rohan Paul@rohanpaul_ai · 5月3日48

Chatly just announced Omni Agent. You give it a goal, and it's multi-agent routing sends different parts of the job to different specialist agents rather than making one model produce everything in one response. e.g. custom email campaigns, a presentation deck, landing page design, social media design, product demo video, and ad copy for Google and Meta. Has a strong memory layer. The agent can remember your brand, preferences, project rules, past files, tone, colors, names, and decisions, then reuse that context across future outputs. Native workspace integration makes the agent more useful as it can work inside the places where your files, tasks, and campaigns already live. The bigger idea is not chat, but workflow assembly, where the AI plans, designs, writes, and packages work across formats.

译Chatly近日发布Omni Agent,其核心理念是超越聊天,转向工作流组装。该产品采用多智能体路由机制,可将用户设定的目标自动分解,并分配给不同的专业智能体协同完成多元化任务,如邮件营销、演示文稿、落地页设计等。它具备强大的记忆层,能持续学习并复用用户的品牌信息、偏好、项目规则等上下文。通过原生工作空间集成,AI可直接在用户现有的文件、任务和活动环境中操作。产品提供Think、Pro、Ultra三个层级,旨在通过统一界面整合深度研究、多媒体生成与记忆功能,让用户从使用工具转向指挥智能体。

OpenAI Developers@OpenAIDevs · 5月3日29

Show us the Codex pets you hatched. Use /hatch to create your own Codex pet. We’ll pick 10 favorites to get 30 days of ChatGPT Pro.

译展示你们孵化的 Codex 宠物。 使用 /hatch 创建你自己的 Codex 宠物。 我们将选出 10 个最受欢迎的,赠送 30 天的 ChatGPT Pro。

OpenRouter@OpenRouter · 5月3日65

Introducing Response Caching: save tons of money and time on tests and agent retries. Blog post: https://openrouter.ai/announcements/response-caching Available for free. Learn more 👇

译推出响应缓存功能:在测试和智能体重试上节省大量资金与时间。 博客文章:https://openrouter.ai/announcements/response-caching 免费提供。了解更多 👇

OpenRouter@OpenRouter · 5月3日65

NEW: "-latest" model aliases 🔀 Route requests to "~anthropic/claude-opus-latest", "~openai/gpt-latest", etc to get the latest version of each major model. (Inspired by semver.) https://openrouter.ai/models?q=latest

译新功能:"-latest" 模型别名 🔀 将请求路由至 "~anthropic/claude-opus-latest"、"~openai/gpt-latest" 等,以获取各主要模型的最新版本。(灵感来自语义化版本。)https://openrouter.ai/models?q=latest

Replit ⠕@Replit · 5月2日21

3 things you can build for $0 on May 2nd: your website, your research, your internal systems. We’re celebrating 10 years of Replit by giving every user FREE access to Replit Agent for the day. Bring the ideas. We’ve got the build.

译5月2日,你可以零成本构建三样东西:你的网站、你的研究、你的内部系统。 为庆祝Replit成立十周年,我们将在当天为每位用户免费提供Replit Agent的使用权限。带来创意,我们负责构建。

Replit ⠕@Replit · 5月2日41

Countdown to Free Agent for 24 Hours + Buildathon Kickoff: $100K+ in Prizes https://x.com/i/broadcasts/1rxmqomNPNwxy

译自由选手24小时倒计时 + 编程马拉松启动:超过10万美元的奖金 https://x.com/i/broadcasts/1rxmqomNPNwxy

阿绎 AYi@AYi_AInotes · 5月2日55

卧槽这个开源金融Agent太狠了,直接帮你干完整份深度研报。 Dexter:开源的金融版 Claude Code, GitHub2万+ ⭐️,MIT 开源,TypeScript 支持 OpenAI / Claude / Gemini / Grok / Ollama 真正能干活的金融研究AI, 不是只会瞎编数据的聊天机器人, 它会自主规划、执行、自我验证 帮你做的事: → 自动拆解"这只股票被低估了吗"这类复杂问题 → 调实时数据(10,000+ 只股票) → 发现结论有问题,自己重来 → 通常 10-20 秒给出结果 你扔给它一个复杂问题,比如对比苹果和微软过去三年自由现金流,评估哪家估值更合理。 它会自动拆解成结构化研究步骤,调用实时财报数据, 自己验证每一个数字的准确性, 最后给你一份有数据支撑的完整分析。 多Agent架构也很香,规划执行验证合成全部分开,从根源上解决了金融领域最致命的幻觉问题。 最绝的是支持WhatsApp网关,扫码登录就能直接在手机上用,不用开电脑。 所有做投资的人都应该去试一下,这才是AI真正能帮你赚钱的地方。 #Dexter #AI金融 #开源Agent #投资工具 #大模型

译Dexter是一款开源金融AI助手,能像Claude Code一样自主处理复杂金融研究。它将“股票是否被低估”等问题自动拆解为步骤,调用超万只股票实时数据,并在发现问题时自我修正,通常10-20秒生成结果。其多Agent架构将规划、执行、验证与合成分离,从根源上缓解了大模型在金融领域的幻觉问题。该项目在GitHub获2万+星,MIT开源,支持多种大模型后端,并可通过WhatsApp网关在移动端便捷使用,为投资分析提供高效工具。

TestingCatalog News 🗞@testingcatalog · 5月2日45

Codex named him "Minty" 👀 Which Codex Pets did you make? Drop them below!

译Codex 给它起名叫“Minty”👀 你创造了哪些 Codex Pets?在下面分享!

TestingCatalog News 🗞@testingcatalog · 5月2日53

XAI 🚨: Voice cloning is now available on xAI Console in the US. > Create a custom voice in less than 2 minutes or select from our library of 80+ voices across 28 languages to personalize your voice agents, audiobooks, video game characters, and more. This also means we will see custom voices on Grok soon. I hope they won't be restricted to the US only.

译XAI 🚨:语音克隆功能现已在美国的xAI控制台上线。 > 在不到2分钟内创建自定义语音,或从我们的库中选择超过28种语言的80多种语音,为您的语音助手、有声读物、视频游戏角色等进行个性化设置。 这也意味着我们很快就能在Grok上看到自定义语音了。希望它们不会仅限于美国地区。

凡人小北@frxiaobei · 5月2日53

Stripe Treasury 的新方向很清晰,做多币种账户或稳定币只是一方面,把公司财务变成 AI 可调用的基础设施可能是终极态。 最关键一句是: Use Treasury from any AI app with the Stripe MCP. 以后 agent 可以查余额、付 invoice、创建卡、管理现金流,并通过 human-in-the-loop 控制风险。 AI-native finance ops 要来了。

译Stripe Treasury 的新方向致力于将公司财务转化为AI可调用的基础设施,超越多币种账户和稳定币等传统功能。通过Stripe MCP,AI应用可直接集成Treasury,使智能代理能执行查询余额、支付发票、创建卡片、管理现金流等操作,并借助人工介入循环机制控制风险,推动AI原生财务运营的发展。关键功能包括:支持多币种与稳定币持有、免费向美国企业转账、通过电子邮件向160个国家支付、赚取积分抵扣Stripe费用、使用Stripe卡消费并获得2%现金返还、在移动应用查看余额,以及从任何AI应用使用Treasury。

小互@xiaohu · 5月2日51

Codex 也发布了宠物功能 8个形态 三个状态提示:running(在跑)/waiting for input(等你接话)/ready for review(等你看 diff) 打开方法:输入框打 /pet 或者去 Settings → Appearance → Pets 内置宠物直接选,也能自己做一只,让它根据你最近写的代码生成。比如你这周一直写 Rust,可能孵出一只螃蟹。

译GitHub Copilot的Codex功能新增“宠物”特性。用户可通过输入“/pet”或在设置中启用该功能。宠物提供8种不同形态,并会实时显示三种状态:运行中、等待输入、等待代码审查。系统内置宠物可直接选择,也支持用户自定义生成。自定义宠物能根据用户近期编写的代码语言自动生成相应形象,例如频繁使用Rust可能生成螃蟹形态的宠物。

歸藏(guizang.ai)@op7418 · 5月2日44

Codex 也上了宠物功能 /pet 开启

Berryxia.AI@berryxia · 5月2日35

Gemini 中可以直接选择NotebookLM 也确实方便很多,学习笔记做个互动笔记网页什么的就挺好。

meng shao@shao__meng · 5月2日57

OpenAI Codex 也有陪伴宠物 (Pets) 了,内置了 8 种宠物,支持自定义 启用与切换 Pet 的三种方式 · 在 Settings → Pets 中选择内置宠物,或从本地 Codex home 目录刷新加载自定义宠物 · 在输入框中输入 /pet · 按 Cmd+K / Ctrl+K 调出命令面板,运行 Wake Pet 唤出,或 Tuck Away Pet 收起 真正的价值:状态可视化的"环境感知" Pets 区别于普通装饰组件的关键。当你切换到其他应用时,宠物悬浮层会持续呈现: · 当前活跃线程是哪个; · Codex 现在处于运行中 / 等待输入 / 等待审阅的哪种状态; · 与状态对应的简短进度提示,让你不打开线程也能扫一眼知道进展。 换句话说,宠物承担了一个异步任务的环境指示器角色,让长耗时 agent 任务在后台依然"可见"。 创建自定义宠物:通过 hatch-pet skill skill 化的创作链路: $ skill-installer hatch-pet 安装完后需要在命令面板(Cmd+K / Ctrl+K)中执行 Force Reload Skills 重新加载 skill,然后调用: $ hatch-pet create a new pet inspired by my recent projects skill 会基于你最近项目的语境生成专属宠物。这意味着 Pets 不只是皮肤,而是接入了 Codex skill 体系的可扩展产物。

译OpenAI Codex 推出Pets功能,提供8种内置宠物并支持自定义。用户可通过设置、输入/pet或命令面板启用。其核心价值在于“环境感知”:宠物悬浮层能持续显示当前活跃线程、Codex运行状态(如运行中或等待输入)及进度提示,充当异步任务的环境指示器,使后台长耗时任务保持可见。自定义宠物通过hatch-pet skill实现,该skill能基于用户项目语境生成专属宠物,表明Pets是接入Codex skill体系的可扩展功能,而非简单装饰。官方推文确认该功能已集成,用户可使用/pet指令唤醒宠物。

xAI@xai · 5月2日67

Voice Cloning is now live via the xAI API! Create a custom voice in less than 2 minutes or select from our library of 80+ voices across 28 languages to personalize your voice agents, audiobooks, video game characters, and more. http://x.ai/news/grok-custom-voices

译语音克隆功能现已通过 xAI API 上线! 不到2分钟即可创建自定义语音,或从我们涵盖28种语言的80多种语音库中选择,为您的语音助手、有声读物、视频游戏角色等注入个性化色彩。 http://x.ai/news/grok-custom-voices

Sam Altman@sama · 5月2日71

you can sign in to openclaw with your chatgpt account now and use your subscription there! happy lobstering.

译现在你可以用你的ChatGPT账户登录OpenClaw,并在那里使用你的订阅服务! 祝你捕龙虾愉快。

Elon Musk@elonmusk · 5月2日61

Try the Grok Imagine agent mode beta!

译试试 Grok Imagine 智能体模式测试版! 在 @imagine 智能体模式中,你可以在同一页面内进行头脑风暴、写作、生成和编辑图像,然后将它们转化为视频。 请在桌面端访问 http://grok.com/imagine 尝试。

Luma@LumaLabsAI · 5月2日19

Your buyers are sophisticated. Your visuals should be too. Set the brief. Define the audience. Luma Agents build every B2B campaign visual from there. Start winning deals → http://lumalabs.ai/app

译你的买家很专业。你的视觉内容也应如此。 设定简报。明确受众。Luma Agents 据此构建所有 B2B 营销活动视觉内容。 开始赢得交易 → http://lumalabs.ai/app

Sam Altman@sama · 5月2日30

ok its not the most important thing we've ever done but i find it more useful than it seems on the surface. check out pets in codex! (and try hatching one)

译好吧,这虽然不是我们做过最重要的事,但我发现它比表面看起来更有用。 去看看 Codex 里的宠物吧! (试试孵化一个)

TestingCatalog News 🗞@testingcatalog · 5月2日40

OpenAI is working on a Custom Dictionary feature for Codex and ChatGPT. Users will be able to add their common phrases and abbreviations so they are properly recognized during voice dictation. As a heavy voice-dictation user, this is the main feature that made me pay for a separate AI voice-dictation app. Everything app 👀

译OpenAI正在为Codex和ChatGPT开发自定义词典功能。 用户将能够添加自己的常用短语和缩写,以便在语音听写时正确识别。 作为重度语音听写用户,这是让我愿意付费购买独立AI语音听写应用的主要功能。 万能应用👀

TestingCatalog News 🗞@testingcatalog · 5月2日53

OpenAI made it easier to switch to Codex, as now you can import settings, plugins, agents, and project configuration from other tools. At launch, Codex will also automatically detect new configs and suggest importing them. ALLYOURCONFIGSBELONGTOUS 👀

译OpenAI 让切换到 Codex 变得更简单,因为现在你可以从其他工具导入设置、插件、代理和项目配置。 发布时,Codex 还会自动检测新配置并建议导入它们。 ALLYOURCONFIGSBELONGTOUS 👀

Replit ⠕@Replit · 5月2日52

Replit Agent is free tomorrow for everyone starting at 5am PST Show use what you can build in 24 hours And Replit is turning10! A trip down the memory lane on what got us here

译Replit Agent 将于明天太平洋标准时间上午5点起向所有人免费开放 向我们展示你能在24小时内构建什么 而 Replit 即将迎来十周年!回顾让我们走到今天的记忆长廊

OpenAI@OpenAI · 5月2日68

Bring your workflow to Codex in just a few clicks. Import settings, plugins, agents, project configuration, and more so you can keep working with fewer interruptions. Your move.

译只需点击几下,即可将您的工作流程带入Codex。 导入设置、插件、代理、项目配置等,以便您能更少中断地继续工作。 该您行动了。

全部 AI 动态
AI 相关资讯全量信息流
全部一手信源资讯推文
全部模型产品行业论文技巧
5月4日
11:19
Kling AI@Kling_ai
42
经典电影。标志性时刻。 现以惊艳的Kling 4K动态呈现。 海报不再只是悬挂着了。 它们在播放。🎬
产品更新图像生成多模态视频
09:13
Berryxia.AI@berryxia
60
AI agent专属幻灯片框架open-slide发布

open-slide是一款专为AI agent设计的幻灯片框架,能将自然语言提示直接转化为精美的完整演示文稿。其核心在于将每页幻灯片构建为React组件,并在固定画布上工作,而非简单生成Markdown。框架内置多项agent技能:通过/create-slide指令一句话生成整套幻灯片;支持在浏览器中对元素添加评论,并由agent通过/apply-comments一键应用所有修改;同时集成演示模式、演讲者笔记和定时器,并可一键导出HTML或PDF。它兼容Claude Code、Cursor等多种编码agent,其意义在于将AI agent的能力从“生成文字”升级为“输出可直接呈现的最终成品”,填补了AI代理与真实生产应用之间的关键空白。

Yiwei Ho: Introducing open-slide - The slide framework built for agents. Prompt your agent, get a polished deck. $ npx @open-slide...

智能体GitHubMCP/工具开源/仓库
08:19
meng shao@shao__meng
精选70
OpenAI Codex 新模式 Auto-review:在"频繁打扰人类"和"完全放权"之间,引入第三种治理范式:用一个独立 AI Agent 替代人类,来审批越界行为。

OpenAI Codex推出Auto-review新模式,解决传统人工审批与完全放权两种治理范式的缺陷。该模式在智能体越界时,由独立AI代理审批,评估用户意图、运行环境、安全策略和动作影响。拒绝时提供理由,超一半情况主智能体能自行找到更安全替代方案。效果上,自动批准率达99.1%,将打扰人类频率降低约200倍,有效拦截多数攻击。但团队坦承局限:非确定性安全保证,不能防御策略性欺骗,是安全与速度的折中。

Maja Trebacz: Clicking the "Approve permission" button is difficult. We show that agents can do that for you. Check out our alignment ...

智能体MCP/工具OpenAI产品更新
关联讨论 1 条OpenAI:Alignment 研究博客(RSS)
推荐理由:OpenAI 难得公开了 agent 安全机制的内部设计,不是靠人肉审批也不是完全撒手,用独立 Agent 审批越界行为,数据惊人(干扰降低 200 倍)。做 Agent 产品的该读,因为给出了治理范式的第三种选择。
03:51
OpenClaw🦞@openclaw
58
ClawSweeper 0.2.0 🦞 OpenClaw 维护机器人现已处理整个循环: 问题 → @clawsweeper 修复/构建 → 受保护的 PR → 审查 → 修复 → 重新审查 → 自动合并 依然保守。手动操作大幅减少。 https://clawsweeper.bot
产品更新编码部署/工程
03:50
Peter Steinberger 🦞@steipete
精选74
这是我迄今为止为 OpenClaw 构建的最有用的工具。它是开源的,运行在 codex 上,你可以 fork 并将其用于任何代码库。 献给所有在 issue 和 PR 中辛勤工作的开源贡献者们,这是为你们准备的。

OpenClaw🦞: ClawSweeper 0.2.0 🦞 The OpenClaw maintenance bot now handles the loop: issue → @clawsweeper fix/build → guarded PR → re...

智能体开源/仓库编码

推荐理由:开源维护者的救命稻草,把 issue 到 automerge 的冗长循环扔给 ClawSweeper 自动修复,保守但足够实用,fork 就能用在任何仓库。
03:50
Peter Steinberger 🦞@steipete
58
🦀📦Crabbox 0.4.0。 我经常需要快速在 macOS、Linux 和 Windows 上重建环境,并且需要快速的临时机器。 Crabbox 是为即时代理提供的机器,使用 AWS 竞价实例、Hetzner 或 @useblacksmith。 无限代码库 + 测试! https://crabbox.sh/
智能体开源/仓库编码部署/工程
03:47
PixVerse@PixVerse_
11
🔥这些炮火效果太震撼了!@UminekoStudio 将如此精细的艺术作品生动呈现,做得太棒了🥰

UMINEKO STUDIO: PixVerse経由のSeedance2.0の1080pサンプルです。 緻密なイラストをアニメーションさせてみました いかがでしょうか @PixVerse_

产品更新视频
02:51
TestingCatalog News 🗞@testingcatalog
52
Google正在为AI Studio Build开发Figma和GitHub导入选项。 h/t @Thomas16937378
Google产品更新编码
01:51
Tibo@thsottiaux
精选75
上周,我们在 Codex 中发布了 *Auto-Review* 模式!它现已成为 OpenAI 内部的默认设置,并将所需的批准数量减少了约 200 倍。我们的对齐团队完成了出色的工作。 阅读博客:https://alignment.openai.com/auto-review

Maja Trebacz: Clicking the "Approve permission" button is difficult. We show that agents can do that for you. Check out our alignment ...

智能体OpenAI产品更新编码
关联讨论 1 条OpenAI:Alignment 研究博客(RSS)
推荐理由:Codex 这个自动审查模式把审批量砍了 200 倍,而且已经成了 OpenAI 内部默认设置。这意味着 AI 编程 Agent 真正开始被信任,做 Agent 工作流的人可以认真研究一下。
00:51
TestingCatalog News 🗞@testingcatalog
48
GOOGLE 🚨: 在iOS上发现了Gemini的新设计! 丝滑流畅!👀
Google产品更新
5月3日
18:42
Rohan Paul@rohanpaul_ai
54
Figure F.03人形机器人实现自主行走与楼梯导航

Figure公司最新组装的F.03人形机器人已能实现自主行走,从生产线直接步行至总部。其核心突破在于仅依靠机载摄像头感知,无需LiDAR或预先地图,即可完成上下楼梯等复杂导航。完整的运动策略完全通过仿真环境中的端到端强化学习训练而成,并零样本迁移至实体机器人。演示中可见其通过神经网络从摄像头数据推断几何环境的深度感知能力,尽管在尺度稳定性和窗户等区域仍存在轻微抖动与伪影。

Brett Adcock: F.03 can now walk up/down stairs purely using it's onboard camera perception Our robots now walk from manufacturing when...

产品更新具身智能数据/训练
18:12
Rohan Paul@rohanpaul_ai
63
World2Agent开源W2A协议,为AI代理构建标准化感知层

World2Agent开源了W2A协议,旨在为AI代理建立标准化的世界感知层。该协议采用“世界→传感器→代理”架构,传感器从GitHub、X帖子、日志等多种数据源中提取信息,并生成包含事件内容、来源及背景的结构化实时信号。这使得AI代理能主动感知外部变化并自主响应,无需等待人类提示。传感器可重复使用,避免了为每个新数据源重复开发轮询、去重等逻辑。与侧重代理能力的MCP不同,W2A主要解决代理“何时应被唤醒”的问题。目前该协议已支持多种主流代理,并邀请开发者共同构建传感器生态。

LeahW: The future belongs to proactive agents. But without real-time perception, they're stuck reacting. "World2Agent" isn't a ...

智能体MCP/工具开源/仓库
17:21
TestingCatalog News 🗞@testingcatalog
45
Google 正在开发一款新的 Android 版 Flow 应用。 这是针对移动使用优化的原生 Flow 体验。目前 Beta 测试仅限 1000 名测试者。

Lance Adams X: @FlowbyGoogle dropped a beta for an Android app yesterday and I didn't see it anywhere Capped at 1000 (already full) rig...

Google产品更新
13:51
Tibo@thsottiaux
68
/goal 可能是我们在 codex 中推出的最重要的功能 优质指令的价值从未如此之高。
OpenAI产品更新编码
关联讨论 1 条X:宝玉 (@dotey)
08:51
OpenClaw🦞@openclaw
56
OpenClaw 2026.5.2 🦞 🧠 xAI Grok 4.3 🔌 插件安装/更新更稳定 ⚡ 网关 + 智能体关键路径更精简 💬 Discord、Slack、Telegram、WhatsApp 问题修复 🎙️ 文本转语音、实时功能、网页搜索、语音通话优化 减少戏剧性,增加运行时间。 https://github.com/openclaw/openclaw/releases/tag/v2026.5.2
智能体xAI产品更新语音
关联讨论 1 条X:OpenClaw (@openclaw)
08:49
Peter Steinberger 🦞@steipete
45
OpenClaw 2026.5.2 版本核心解决了通过 npm 安装时的依赖问题和速度缓慢现象。本次更新通过将大部分功能移至扩展插件,显著精简了主软件包。主要更新内容包括:集成 xAI Grok 4.3 模型,增强插件安装与更新的稳定性,优化 Gateway 和 agent 关键路径的性能。此外,还修复了 Discord、Slack、Telegram、WhatsApp 等通讯工具的集成问题,并对 TTS、实时功能、网络搜索及语音通话进行了优化打磨。此次发布旨在减少系统故障,提升整体稳定性和运行时间。

OpenClaw🦞: OpenClaw 2026.5.2 🦞 🧠 xAI Grok 4.3 🔌 Plugin installs/updates are sturdier ⚡ Gateway + agent hot paths are leaner 💬 D...

智能体GitHubxAI产品更新
05:16
PixVerse@PixVerse_
15
疲惫的时候,就用@Kawaiizice 的酷炫作品来refresh一下吧✨ 要想度过最棒的周末,就在PixVerse上用高画质Seedance享受创作的乐趣!😺🚀

Kawaiizice: Sem energia? Recarregue!! 😺⚡️ Quais seus planos para o fim de semana?'-' :: Seedance 1080p on PixVerse! @PixVerse_

其他视频
02:41
Rohan Paul@rohanpaul_ai
48
Chatly发布Omni Agent,从聊天转向工作流组装

Chatly近日发布Omni Agent,其核心理念是超越聊天,转向工作流组装。该产品采用多智能体路由机制,可将用户设定的目标自动分解,并分配给不同的专业智能体协同完成多元化任务,如邮件营销、演示文稿、落地页设计等。它具备强大的记忆层,能持续学习并复用用户的品牌信息、偏好、项目规则等上下文。通过原生工作空间集成,AI可直接在用户现有的文件、任务和活动环境中操作。产品提供Think、Pro、Ultra三个层级,旨在通过统一界面整合深度研究、多媒体生成与记忆功能,让用户从使用工具转向指挥智能体。

Chatly: Introducing "Omni Agent". The only AI you'll ever need. One ecosystem. Three tiers. Infinite possibilities. Think. Pro. ...

智能体产品更新多模态
01:16
OpenAI Developers@OpenAIDevs
29
展示你们孵化的 Codex 宠物。 使用 /hatch 创建你自己的 Codex 宠物。 我们将选出 10 个最受欢迎的,赠送 30 天的 ChatGPT Pro。

OpenAI Developers: Customize your Codex pet with /hatch

OpenAI图像生成行业动态
00:48
OpenRouter@OpenRouter
精选65
推出响应缓存功能:在测试和智能体重试上节省大量资金与时间。 博客文章:https://openrouter.ai/announcements/response-caching 免费提供。了解更多 👇
产品更新部署/工程
关联讨论 1 条OpenRouter:Announcements(RSS)
推荐理由:OpenRouter 的 Response Caching 直击测试和 agent 重试的浪费痛点,免费能用,做 API 集成的开发者可以立刻省下一笔预算。
00:18
OpenRouter@OpenRouter
精选65
新功能:"-latest" 模型别名 🔀 将请求路由至 "~anthropic/claude-opus-latest"、"~openai/gpt-latest" 等,以获取各主要模型的最新版本。(灵感来自语义化版本。)https://openrouter.ai/models?q=latest

Wes Winder: @levelsio openrouter has a cool "nitro" flag in the model names to use the fastest provider so like "gpt-5.5:nitro" woul...

产品更新部署/工程

推荐理由:OpenRouter 这个 -latest 别名很实用,不用每次都改模型版本号,对大量调用 API 的团队是个省心更新,痛点精准。
5月2日
21:19
Replit ⠕@Replit
21
5月2日,你可以零成本构建三样东西:你的网站、你的研究、你的内部系统。 为庆祝Replit成立十周年,我们将在当天为每位用户免费提供Replit Agent的使用权限。带来创意,我们负责构建。
智能体行业动态
19:49
Replit ⠕@Replit
41
自由选手24小时倒计时 + 编程马拉松启动:超过10万美元的奖金 https://x.com/i/broadcasts/1rxmqomNPNwxy
行业动态
17:11
阿绎 AYi@AYi_AInotes
55
开源金融AI助手Dexter:自动完成深度研报,10-20秒出结果

Dexter是一款开源金融AI助手,能像Claude Code一样自主处理复杂金融研究。它将“股票是否被低估”等问题自动拆解为步骤,调用超万只股票实时数据,并在发现问题时自我修正,通常10-20秒生成结果。其多Agent架构将规划、执行、验证与合成分离,从根源上缓解了大模型在金融领域的幻觉问题。该项目在GitHub获2万+星,MIT开源,支持多种大模型后端,并可通过WhatsApp网关在移动端便捷使用,为投资分析提供高效工具。

智能体GitHub开源/仓库
15:20
TestingCatalog News 🗞@testingcatalog
45
Codex 给它起名叫"Minty"👀 你创造了哪些 Codex Pets?在下面分享!

OpenAI Developers: Pets. Now in Codex. Use /pet to wake your pet.

OpenAI产品更新编码
15:20
TestingCatalog News 🗞@testingcatalog
53
XAI 🚨:语音克隆功能现已在美国的xAI控制台上线。 > 在不到2分钟内创建自定义语音,或从我们的库中选择超过28种语言的80多种语音,为您的语音助手、有声读物、视频游戏角色等进行个性化设置。 这也意味着我们很快就能在Grok上看到自定义语音了。希望它们不会仅限于美国地区。
xAI产品更新语音
12:18
凡人小北@frxiaobei
53
Stripe Treasury 的新方向很清晰,做多币种账户或稳定币只是一方面,把公司财务变成 AI 可调用的基础设施可能是终极态。

Stripe Treasury 的新方向致力于将公司财务转化为AI可调用的基础设施,超越多币种账户和稳定币等传统功能。通过Stripe MCP,AI应用可直接集成Treasury,使智能代理能执行查询余额、支付发票、创建卡片、管理现金流等操作,并借助人工介入循环机制控制风险,推动AI原生财务运营的发展。关键功能包括:支持多币种与稳定币持有、免费向美国企业转账、通过电子邮件向160个国家支付、赚取积分抵扣Stripe费用、使用Stripe卡消费并获得2%现金返还、在移动应用查看余额,以及从任何AI应用使用Treasury。

Stripe: Introducing the new Stripe Treasury: • Hold funds in multiple currencies and stablecoins. • Instantly transfer money to ...

智能体MCP/工具产品更新
10:19
小互@xiaohu
51
GitHub Copilot推出代码宠物功能,可自定义形态与状态

GitHub Copilot的Codex功能新增“宠物”特性。用户可通过输入“/pet”或在设置中启用该功能。宠物提供8种不同形态,并会实时显示三种状态:运行中、等待输入、等待代码审查。系统内置宠物可直接选择,也支持用户自定义生成。自定义宠物能根据用户近期编写的代码语言自动生成相应形象,例如频繁使用Rust可能生成螃蟹形态的宠物。

产品更新编码
10:13
歸藏(guizang.ai)@op7418
44
Codex 也上了宠物功能 /pet 开启
OpenAI产品更新
09:11
Berryxia.AI@berryxia
35
Gemini 中可以直接选择NotebookLM 也确实方便很多,学习笔记做个互动笔记网页什么的就挺好。
Google教程/实践
08:18
meng shao@shao__meng
57
OpenAI Codex 也有陪伴宠物 (Pets) 了,内置了 8 种宠物,支持自定义

OpenAI Codex 推出Pets功能,提供8种内置宠物并支持自定义。用户可通过设置、输入/pet或命令面板启用。其核心价值在于“环境感知”:宠物悬浮层能持续显示当前活跃线程、Codex运行状态(如运行中或等待输入)及进度提示,充当异步任务的环境指示器,使后台长耗时任务保持可见。自定义宠物通过hatch-pet skill实现,该skill能基于用户项目语境生成专属宠物,表明Pets是接入Codex skill体系的可扩展功能,而非简单装饰。官方推文确认该功能已集成,用户可使用/pet指令唤醒宠物。

OpenAI Developers: Pets. Now in Codex. Use /pet to wake your pet.

智能体OpenAI产品更新
07:49
xAI@xai
精选67
语音克隆功能现已通过 xAI API 上线! 不到2分钟即可创建自定义语音,或从我们涵盖28种语言的80多种语音库中选择,为您的语音助手、有声读物、视频游戏角色等注入个性化色彩。 http://x.ai/news/grok-custom-voices
xAI产品更新语音
关联讨论 1 条X:xAI (@xai)
推荐理由:xAI 正式下场语音克隆,2 分钟克隆加 80 多种声音库,API 直接可调,做语音 agent 和有声书的团队得多关注一下,这对 ElevenLabs 们是个不大不小的冲击。
07:48
Sam Altman@sama
精选71
现在你可以用你的ChatGPT账户登录OpenClaw,并在那里使用你的订阅服务! 祝你捕龙虾愉快。
OpenAI产品更新

推荐理由:Sam Altman用一条推文轻描淡写地扔出了OpenAI的新产品OpenClaw,ChatGPT用户可以直接登录用订阅,没发布会没博客,但既然是他亲自发的,大概率是个值得试试的新玩具。
07:40
Elon Musk@elonmusk
61
试试 Grok Imagine 智能体模式测试版! 在 @imagine 智能体模式中,你可以在同一页面内进行头脑风暴、写作、生成和编辑图像,然后将它们转化为视频。 请在桌面端访问 http://grok.com/imagine 尝试。

Grok Imagine: Your entire creative workflow just collapsed into one infinite canvas. In @imagine Agent Mode, you can brainstorm, write...

智能体xAI产品更新多模态
关联讨论 1 条X:Testing Catalog (@testingcatalog)
07:18
Luma@LumaLabsAI
19
你的买家很专业。你的视觉内容也应如此。 设定简报。明确受众。Luma Agents 据此构建所有 B2B 营销活动视觉内容。 开始赢得交易 → http://lumalabs.ai/app
其他图像生成
04:18
Sam Altman@sama
30
好吧,这虽然不是我们做过最重要的事,但我发现它比表面看起来更有用。 去看看 Codex 里的宠物吧! (试试孵化一个)
OpenAI产品更新
03:48
TestingCatalog News 🗞@testingcatalog
40
OpenAI正在为Codex和ChatGPT开发自定义词典功能。 用户将能够添加自己的常用短语和缩写,以便在语音听写时正确识别。 作为重度语音听写用户,这是让我愿意付费购买独立AI语音听写应用的主要功能。 万能应用👀

Tibor Blaho: Small but useful new feature in the works in ChatGPT web app - "Custom dictionary" ("Add names or terms you want dictati...

OpenAI产品更新语音
03:18
TestingCatalog News 🗞@testingcatalog
53
OpenAI 让切换到 Codex 变得更简单,因为现在你可以从其他工具导入设置、插件、代理和项目配置。 发布时,Codex 还会自动检测新配置并建议导入它们。 ALLYOURCONFIGSBELONGTOUS 👀

OpenAI: Bring your workflow to Codex in just a few clicks. Import settings, plugins, agents, project configuration, and more so ...

OpenAI产品更新编码
03:18
Replit ⠕@Replit
52
Replit Agent 将于明天太平洋标准时间上午5点起向所有人免费开放 向我们展示你能在24小时内构建什么 而 Replit 即将迎来十周年!回顾让我们走到今天的记忆长廊
智能体编码行业动态
03:18
OpenAI@OpenAI
精选68
只需点击几下,即可将您的工作流程带入Codex。 导入设置、插件、代理、项目配置等,以便您能更少中断地继续工作。 该您行动了。
OpenAI产品更新编码
关联讨论 14 条X:Testing Catalog (@testingcatalog)X:小互 (@xiaohu)X:Greg Brockman (@gdb)OpenAI:官网动态(RSS · 排除企业/客户案例)X:OpenAI Developers (@OpenAIDevs)X:宝玉 (@dotey)X:Tibo (@thsottiaux)IT之家(RSS)X:OpenAI (@OpenAI)X:邵猛 (@shao__meng)X:Vista (@vista8)X:歸藏 (@op7418)X:Sam Altman (@sama)X:Berry Xia (@berryxia)
推荐理由:Codex 这个导入功能,把迁移成本降到了最低,对已经在用其他 IDE 的开发者算是个贴心的零门槛入口,虽然不算重大更新,但够实用。
‹ 上一页
1…4041424344…50
下一页 ›