AIHOT

精选全部 AI 动态 AI 日报 Agent 接入关于更新日志反馈信源提报

精选全部日报更多

全部动态X · 1967 条

全部一手资讯 X 论文

TestingCatalog News 🗞@testingcatalog · 5月8日42

ICYMI: Codex will get Realtime Voice Mode soon 👀

译补充说明：Codex 很快将获得 Realtime Voice Mode 👀

宝玉@dotey · 5月8日80

Anthropic 把 Claude 全面塞进了 Microsoft 365。Excel、PowerPoint、Word 三个插件从 beta 转为正式版（GA），Outlook 插件同步进入公测。意味着不用再切到 http://claude.ai 网页端，可以在 Excel 表格里、PPT 幻灯片上、Word 文档中、Outlook 邮箱里直接喊 Claude 干活。真正的卖点是跨应用的上下文衔接。Anthropic 给的典型场景：先在 Outlook 里让 Claude 整理收件箱、起草回复，顺手打开邮件里附的 brief 到 Word；接着让它根据 Word 简报在 Excel 里搭财务模型，公式分布在多个 sheet；再做成 PowerPoint，最后回到 Outlook 起草评审邀请。整个流程里 Claude 带着前一步的上下文走，不需要重新喂材料。具体能力上，Excel 里 Claude 能改单元格和假设条件而不破坏现有公式；PowerPoint 里它按你的模板排版，生成原生图表而不是塞图片；Word 里改稿用 tracked changes（修订模式）呈现，让你逐条接受或拒绝；Outlook 里草稿会停在草稿箱等你点发送。定价方面，所有付费 Claude 套餐用户都能用，不需要额外掏钱。

译Anthropic宣布，Claude for Excel、PowerPoint和Word三款插件已结束测试转为正式版，Outlook插件同步进入公测。所有付费Claude用户均可免费使用。此次集成的核心突破在于Claude能在Microsoft 365套件中跨应用保持连续的对话上下文。例如，用户可在Outlook中处理邮件，随后在Word中编辑附件，再于Excel构建财务模型并最终生成PowerPoint演示文稿，全程无需重复提供材料。具体功能包括：在Excel中修改单元格而不破坏公式；按模板生成原生PowerPoint图表；在Word中以修订模式编辑文档；在Outlook中生成待发送的邮件草稿。

OpenAI Developers@OpenAIDevs · 5月8日72

Codex can now take on more of your browser dev work. With the new Chrome plugin in the Codex app, it can test web apps, gather context across tabs, use web DevTools efficiently in parallel, and keep results organized without taking over your browser.

译Codex 现在能承担更多浏览器开发工作。通过 Codex 应用中的新 Chrome 插件，它可以测试网络应用、跨标签页收集上下文、并行高效使用网页开发者工具，并保持结果井井有条而不占用你的浏览器。

Luma@LumaLabsAI · 5月8日63

You have the slogan. Now turn it into an ad. Drop in your slogan. Define the aesthetic. Luma Agents build the ad from there. Bring it to life → http://lumalabs.ai/app

译你已有标语。现在将其变为广告。输入你的标语。定义美学风格。Luma Agents 将据此构建广告。赋予它生命 → http://lumalabs.ai/app

Greg Brockman@gdb · 5月8日76

have been excited for realtime voice-to-voice translation as an AI application since we started OpenAI. extremely cool to see it now available in the API for anyone to build with:

译自OpenAI创立以来，我一直对实时语音翻译这一AI应用感到兴奋。现在看到它通过API向所有开发者开放，真是太酷了：

TestingCatalog News 🗞@testingcatalog · 5月8日46

OPENAI 🔥: Codex is getting a dedicated Chrome extension soon! > With the new extension for Chrome, Codex is even better at working with apps and websites in your browser. It works in parallel across tabs in the background without taking over your browser, and you stay in control of which websites Codex can use. * Not available yet 👀

译OpenAI宣布Codex即将推出专用的Chrome浏览器扩展，该扩展能显著提升在浏览器内与各类应用和网站的协作能力。其核心特性包括可在多个标签页后台并行工作，不会占用或接管浏览器界面，同时用户拥有完全控制权，能自主决定允许Codex访问哪些特定网站。此次更新通过Changelog发布，但目前该扩展尚未正式上线。

OpenAI@OpenAI · 5月8日75

Codex now works directly in Chrome on macOS and Windows. It’s even better at working with apps and sites in Chrome, and now works in parallel across tabs in the background without taking over your browser. To get started, install the Chrome plugin in the Codex app.

译Codex现可直接在macOS和Windows的Chrome中运行。它在处理Chrome中的应用和网站时表现更佳，并能在后台跨标签页并行工作，而不会占用浏览器控制权。要开始使用，请在Codex应用中安装Chrome插件。

TestingCatalog News 🗞@testingcatalog · 5月8日54

SPACEXAI 🚨: New signs of Grok Computer have been spotted on the Grok web. A new selector allows users to choose between Grok Computer and a "Folder on Google Drive." This feature became recently available to everyone and might not be intentional. Currently, it doesn't change anything, but it might signal as an early step in the rollout. Grok Computer soon? 👀

译SPACEXAI 🚨：Grok网站上出现Grok Computer的新迹象。新增选择器允许用户在Grok Computer和"Google Drive文件夹"之间切换。该功能近期已向所有用户开放，可能并非有意为之。目前选择后无实际变化，但这或许是功能推出的早期信号。 Grok Computer即将到来？👀

Satya Nadella@satyanadella · 5月8日67

Great to bring GPT 5.5 Instant to M365 Copilot today. With quicker, clearer, and more accurate responses, you can get to useful answers with less back and forth. Also rolling out to Copilot Studio and Foundry. All part of our focus on providing you more model choice across work, agents, and apps.

译很高兴今天将 GPT 5.5 Instant 引入 M365 Copilot。凭借更快、更清晰、更准确的响应，您可以用更少的来回交流获得有用的答案。同时也在向 Copilot Studio 和 Foundry 推出。这都是我们专注于为您在工作、智能体和应用程序中提供更多模型选择的一部分。

Perplexity@perplexity_ai · 5月8日68

Personal Computer is now available to all users in a new Perplexity Mac app. Personal Computer is an advanced version of Perplexity Computer. It operates on any Mac, running tasks across your local files, native Mac apps, the web, and Perplexity’s secure servers.

译Personal Computer现已通过全新的Perplexity Mac应用向所有用户开放。 Personal Computer是Perplexity Computer的进阶版本。它可在任何Mac设备上运行，能跨本地文件、原生Mac应用、网络以及Perplexity安全服务器执行任务。

Claude@claudeai · 5月8日80

Claude for Excel, PowerPoint, and Word are now generally available, and Claude for Outlook is in public beta. As Claude moves between your Microsoft apps, it carries the full context of your conversation.

译Claude for Excel、PowerPoint 和 Word 现已全面可用，Claude for Outlook 进入公开测试版。当 Claude 在您的微软应用间切换时，会完整携带对话的全部上下文。

Replit ⠕@Replit · 5月8日67

Next up in our commitment to security: Security Center 2.0. We’ve made it dramatically easier to understand your security posture across every Replit app you manage, and take action across all of them in bulk. With Security Center 2.0, you can: - Instantly identify risky apps - Fix critical vulnerabilities with Agent in seconds - Notify owners or un-publish apps with batch actions - Export software bill of materials (SBOM) to integrate with external tools

译我们安全承诺的下一步：安全中心2.0。我们极大地简化了理解您管理的每个Replit应用安全状况的流程，并支持批量对所有应用执行操作。通过安全中心2.0，您可以： - 即时识别高风险应用 - 数秒内通过Agent修复关键漏洞 - 通过批量操作通知所有者或下架应用 - 导出软件物料清单（SBOM）以集成外部工具

OpenRouter@OpenRouter · 5月8日68

Gemini 3.1 Flash Lite from @GoogleDeepMind is now GA on OpenRouter. Multimodal (text/image/video/audio/PDF → text), 1M context, selectable thinking levels, at $0.25/M in / $1.50/M out. Also works with our new service_tier param for cost/latency tradeoffs!

译Gemini 3.1 Flash Lite 来自 @GoogleDeepMind，现已在 OpenRouter 正式发布。多模态（文本/图像/视频/音频/PDF → 文本），100万上下文，可选的思考层级，输入每百万次$0.25，输出每百万次$1.50。还可配合我们新的 service_tier 参数使用，以权衡成本与延迟！

宝玉@dotey · 5月8日81

OpenAI 在 Realtime API 里上线了三款新语音模型：GPT-Realtime-2、GPT-Realtime-Translate 和 GPT-Realtime-Whisper，分别管对话、翻译和实时转录。【1】主角：GPT-Realtime-2 号称带 GPT-5 级别的推理能力。比上一代 GPT-Realtime-1.5，在 Big Bench Audio 智能测试上从 81.4% 涨到 96.6%，Audio MultiChallenge 多轮对话指令跟随从 34.7% 涨到 48.5%。几个实际变化：开口前会先垫一句。执行长任务前先说"我查一下""稍等一下"，避免用户对着空气以为它死机了。工具调用透明化。能同时调多个工具，过程会被念出来，比如"正在查你的日历""正在搜索"，让用户听到 agent 在干什么。上下文窗口从 32K 扩到 128K，能撑更长的对话和更复杂的任务编排。开发者可以在 minimal 到 xhigh 五档推理强度里选，默认 low。简单问答用低延迟，复杂任务挂高推理。出错时会说"这块我现在处理不了"，不再直接卡死或乱讲。【2】Translate 和 Whisper GPT-Realtime-Translate 支持 70 多种输入语言、13 种输出语言的实时语音翻译，主打跨境客服、教育、直播场景。德国电信已经在测；BolnaAI 在印地语、泰米尔语、泰卢固语等印度方言场景下报告错词率比其他模型低 12.5%。 GPT-Realtime-Whisper 是流式版 Whisper，边说边出字幕，主打会议、直播、客服转录。【3】价格 GPT-Realtime-2：每百万音频输入 token $32（缓存 $0.40），输出 token $64。 GPT-Realtime-Translate：每分钟 $0.034。 GPT-Realtime-Whisper：每分钟 $0.017。三款都已在 Realtime API 上线，Playground 可以直接试 GPT-Realtime-2。

译OpenAI在Realtime API中推出了三款新语音模型：GPT-Realtime-2用于对话，GPT-Realtime-Translate用于翻译，GPT-Realtime-Whisper用于实时转录。GPT-Realtime-2具备GPT-5级别推理能力，在音频测试中性能显著提升，改进了交互体验，如任务前语音提示、工具调用透明化和128K上下文窗口，并支持调节推理强度以平衡延迟。GPT-Realtime-Translate支持70多种输入和13种输出语言的实时翻译，GPT-Realtime-Whisper提供流式转录功能。三款模型均已上线，并公布了API价格。

TestingCatalog News 🗞@testingcatalog · 5月8日49

Scale AI published SWE Atlas Refactoring Leaderboard, a new benchmark that evaluates agent capabilities of restructuring the code. > It requires agents to produce twice as much lines of code than SWE Bench Pro. > Claude Code with Opus 4.7 tops the leaderboard followed by Codex with GPT-5.5, GPT-5.4 and GPT-5.3. > Refactoring is quite an important task for LLMs to handle as it often boils down to a quite boring engineering work.

译Scale AI发布了SWE Atlas重构排行榜，这是一个评估智能体重构代码能力的新基准。 > 它要求智能体生成的代码行数是SWE Bench Pro的两倍。 > Claude Code with Opus 4.7位居榜首，其次是Codex with GPT-5.5、GPT-5.4和GPT-5.3。 > 重构对大型语言模型而言是相当重要的任务，因为这通常归结为相当枯燥的工程工作。

Microsoft Research@MSFTResearch · 5月8日55

Tyger moves the most demanding MRI processing to the cloud, helping researchers turn raw signals into readable images – meaning results in hours rather than days or weeks. https://msft.it/6010vMCSa

译Tyger将最耗时的MRI处理工作转移到云端，帮助研究人员将原始信号转化为可读图像——这意味着几小时而非数天或数周即可获得结果。https://msft.it/6010vMCSa

Berryxia.AI@berryxia · 5月7日65

这一波！期待起来了～ Google Health + Gemini 直接把Apple Health的封闭优势干掉了。 Google正式推出全新Google Health，彻底取代Fitbit app，支持从任何追踪器导入数据（Apple Watch、Garmin、Whoop全都能导）！还内置Gemini AI coach，能给你智能健康推荐和个性化指导。 Google这次选择彻底开放生态，而Apple Health依然是封闭花园。这场健康数据+AI的战争，终于要真正开打了。你觉得Google Health能挑战Apple Health的统治地位吗？

译Google推出全新Google Health平台，取代Fitbit应用，采用开放生态策略，支持从Apple Watch、Garmin等多设备导入健康数据。平台内置Gemini AI教练，提供智能推荐与个性化指导，直接挑战Apple Health的封闭模式，标志着健康数据与AI竞争进入新阶段。

meng shao@shao__meng · 5月7日70

Apify mcpc 与 x402：给 AI Agent 装上"自动付款的钱包" mcpc 是 Apify 自家的通用 MCP 客户端 CLI，支持 x402 支付协议，"agentic payments" 也在支持范围内。传统 SaaS 计费(Stripe + API key + 配额)是为人类设计的：注册、绑卡、审批。agent 调用付费 API 时，这套流程要么靠人预先打通，要么需要 human-in-the-loop。x402 把"支付"压缩成一次 HTTP 往返加一个签名，真正具备了让程序自主交易的形态，mcpc 是这个想法目前最完整的端到端方案。

译Apify发布的通用MCP客户端CLI工具mcpc，集成了x402支付协议，旨在解决AI Agent调用付费API时的手动计费瓶颈。传统SaaS计费流程依赖人工注册、绑卡和审批，而x402协议将支付压缩为一次HTTP往返加签名，使程序能自主交易。mcpc为Agent提供加密钱包，当调用付费服务遭遇HTTP 402状态码时，可自动签名完成支付，无需人工干预。该工具支持Claude Code等MCP兼容的Agent，用户可使用USDC为钱包充值并连接x402兼容服务。

OpenRouter@OpenRouter · 5月7日72

1/ Audio is now first-class on OpenRouter. Two new endpoints live today: 📢 /api/v1/audio/speech — text-to-speech (TTS) 🎤 /api/v1/audio/transcriptions — speech-to-text (SST) Same routing, billing, and keys you already use for text, image, and video.

译1/ 音频现已成为OpenRouter的一等公民。今日上线两个新端点： 📢 /api/v1/audio/speech — 文本转语音（TTS） 🎤 /api/v1/audio/transcriptions — 语音转文本（SST）沿用您已在文本、图像和视频中使用的相同路由、计费和密钥。

Chubby♨️@kimmonismus · 5月7日53

Google releases the AI Coach in their new health app, beating Apple to the punch! Google has released an AI health coach that uses Gemini. So, essentially, a health coach that works with all (!) your health data. I think this is the first step towards a personal AI doctor and coach, and I believe we're finally getting to the personalized AI medicine I've always hoped for. tl;dr A 24/7 AI coach that combines fitness, sleep, nutrition, cycle tracking, weather, and even U.S. medical records. Google is turning the Fitbit app into Google Health, positioning it as a single hub for fitness, sleep, cycle tracking, vital signs, connected devices, and future Google Fit data transfers. Fitbit remains the hardware core, while the app becomes the home base for Gemini-powered coaching, Google Health Premium, and the new Fitbit Air ecosystem. And all this before Apple moves forward with its new Siri (also powered by Gemini) and releases a similar concept. An interesting move by Google!

译谷歌在新健康应用中发布了由Gemini驱动的AI健康教练，能整合用户的健身、睡眠、营养、周期追踪、天气乃至美国医疗记录等全方位健康数据。此举被视为迈向个人AI医生和个性化AI医疗的第一步。谷歌将Fitbit应用升级为Google Health，使其成为集健身、睡眠、体征监测、设备连接及未来Google Fit数据迁移于一体的中心平台。Fitbit继续作为硬件核心，而应用则成为Gemini驱动教练、Google Health Premium及新Fitbit Air生态的基地。这一发布领先于苹果即将推出的由Gemini赋能的新Siri及类似健康概念。

TestingCatalog News 🗞@testingcatalog · 5月7日45

GOOGLE 🚨: A new Agent Mode is being prepared on Flow to handle complete video production process! Users will be able to: - Plan out scenes - Discuss in-progress project changes - Trigger generation workflows - Manage both project-level and app-level creative tools - Update the state of a project directly from a chat surface Everything is an Agent now 👀

译GOOGLE 🚨: Flow平台正在准备全新的智能体模式，用于处理完整的视频制作流程！用户将能够： - 规划场景 - 讨论进行中的项目变更 - 触发生成工作流 - 管理项目级和应用级的创意工具 - 直接通过聊天界面更新项目状态万物皆可智能体 👀

TestingCatalog News 🗞@testingcatalog · 5月7日55

META 🚨: An upcoming always-on AI Agent called "Hatch" from Meta will be available on a waitlist and grounded in social data from Instagram and Facebook. > According to The Information, Meta is targeting internal testing of Hatch by the end of June, with mock environments built to resemble Reddit, Etsy, and DoorDash for training in tool use behavior. > The Financial Times points to Muse Spark, Meta's new assistant-tier model family, as the eventual backbone, with Anthropic's Claude Opus 4.6 and Sonnet 4.6 reportedly serving as a transitional layer in the meantime.

译Meta即将推出名为“Hatch”的常驻AI智能体，目前已开放候补名单。该智能体将基于Instagram和Facebook的社交数据进行训练与信息落地。据披露，内部测试计划于6月底启动，Meta为此构建了模拟Reddit、Etsy和DoorDash的环境，以训练其工具使用行为。技术架构方面，最终将由Meta自家的Muse Spark模型系列作为核心支撑，而在过渡阶段，将暂时采用Anthropic的Claude Opus 4.6和Sonnet 4.6模型作为中间层。

Chubby♨️@kimmonismus · 5月7日48

We’re taking Superintelligence to the next level. Over the past weeks, we’ve upgraded our video format, brought in editorial support, and started turning our interviews into a proper YouTube-first experience. Superintelligence is no longer just a newsletter or podcast. We’re building a media platform for conversations with the people shaping AI, cybersecurity, robotics, infrastructure, and the future of intelligence. Our latest episode features Roeland Delrue, co-founder of Aikido Security, one of Europe’s fastest-rising cybersecurity startups, on how AI-generated code is changing software security and why self-securing software may become one of the most important ideas of the AI era. More interviews are already in the pipeline. If you care about where AI is actually going, stay tuned.

译Superintelligence宣布提升至新水平，从新闻通讯和播客转型为媒体平台，专注于与塑造AI、网络安全、机器人、基础设施和智能未来的人进行对话。平台近期升级了视频格式和编辑支持，优化YouTube优先的体验。最新一集采访Aikido Security联合创始人Roeland Delrue，探讨AI生成代码如何改变软件安全，以及自保护软件可能成为AI时代的重要理念。更多采访已在筹备中，旨在追踪AI的实际发展方向。

PixVerse@PixVerse_ · 5月7日72

4K Upscale is live! Enhance your images and videos in one place. Get 3 free runs, then enjoy 35% off credits. Limited time: May 7-14, 08:00 UTC. RT+ Follow+ Reply = 300Creds in DMs (72H ONLY)

译4K超分功能现已上线！在一处增强您的图像和视频。获得3次免费使用机会，之后享受35%的积分折扣。限时活动：5月7日至14日，UTC时间08:00。转发+关注+回复=私信领取300积分（仅限72小时）。

TestingCatalog News 🗞@testingcatalog · 5月7日57

Anthropic is testing the Insights feature for its Managed Agents on Claude Console. > Up to 100 recent sessions are fetched. Each transcript is sent to the model (4 in parallel) with your agent's system prompt as context. The model writes a summary — task, actions, issues, assessment — and a 0–100 quality score. Token, cache, and tool-error counts are computed directly from the events alongside. > A single model call reads every summary and its stats, then produces cross-session findings (recurring errors, usage patterns, efficiency outliers, wins), error-category buckets, and use-case clusters. Every cited session ID is checked against the input, so findings only ever point at real sessions. > Summaries and findings are saved so the page loads instantly next time. Everything numeric you see — counts, percentages, token stats per cluster — is computed here from raw event data; only the prose and bucket membership come from the model.

译Anthropic正在为其Claude Console平台的托管代理测试Insights功能。该功能会获取最多100个近期会话，将每个会话记录与代理系统提示并行发送给模型，以生成包含任务、行动、问题和评估的摘要，并给出0-100的质量评分。同时，直接从事件数据中计算令牌、缓存和工具错误等统计数据。随后，另一个模型调用会读取所有摘要和统计信息，生成跨会话洞察，包括重复错误、使用模式、效率异常点和成功案例，并对错误类别与使用场景进行聚类。所有发现均关联真实的会话ID。摘要与洞察结果会被保存以实现页面即时加载，所有数值均基于原始事件数据计算，仅文本描述和分类来自模型生成。

Alibaba Cloud@alibaba_cloud · 5月7日34

Level up your AI workflow—don't miss our live premiere on YouTube of Alibaba Cloud ClawTalks EP3: From Local Automation to Teamwork! Set a reminder now! 👇 📅 May 8, 2026 | 5:00 PM (UTC+8) https://youtu.be/7_FL9_RbLMY Discover how HiClaw and QwenPaw are transforming the way we build AI agents: 🔹 QwenPaw: Run lightweight, low-memory AI automation directly on your device 🔹 HiClaw: Enable transparent, human-in-the-loop collaboration across multi-agent teams #AI #OpenSource #HiClaw #QwenPaw #AgentAI #Automation #Productivity #OnePersonCompany

译阿里云ClawTalks第三期将于2026年5月8日进行YouTube直播，重点介绍其开源AI智能体工具如何提升工作流。核心产品包括QwenPaw和HiClaw：QwenPaw支持在设备本地运行轻量级、低内存的AI自动化任务；HiClaw则致力于实现透明、人机协同的多智能体团队协作，旨在变革AI智能体的构建与应用方式。

Alibaba Cloud@alibaba_cloud · 5月7日56

Tired of chaotic AI Skill management? Skills Registry solves: 🔒 Secure external Skills with AI guards 📦 Centralize & version control assets 🚀 Zero-deploy private registry 🔄 Auto-rollback & fine-grained perms Stop ZIP-sharing. Start governing. ️ Learn more: https://int.alibabacloud.com/m/1000412751/

译厌倦了混乱的AI技能管理？技能注册中心解决： 🔒 通过AI防护保障外部技能安全 📦 集中化与版本控制资产 🚀 零部署私有注册中心 🔄 自动回滚与细粒度权限停止ZIP共享。开始治理。了解更多：https://int.alibabacloud.com/m/1000412751/

Elon Musk@elonmusk · 5月7日24

Grok continues to make progress

译Grok持续取得进展应用在网页端一次性连接后，即可即时同步至网页端、iOS和Android平台简单示例：我让Grok将航班值机信息添加到Google日历…它几秒内就完美完成了还提供了查看/编辑链接

Berryxia.AI@berryxia · 5月7日52

马斯克给其打Call的Neuralink 这次直接把“脑机接口”从“局部修复”升级成了“全脑通用解决方案”。他们正在研发一台手术机器人，能够精准抵达大脑任意区域。目标不再是治疗单一疾病，而是打造一个通用型神经接口，解决任何起源于大脑的病症：从瘫痪、癫痫、帕金森，到精神疾病、失明、失语… 全部纳入视野。工程师亲自演示这台机器人如何在复杂血管网络中穿行、在跳动的大脑组织里实现微米级精准植入，彻底把脑外科从“高风险艺术”变成“可重复工程”。这是直接把“脑机接口普惠化”的最后一道物理门槛直接拆掉。当手术机器人能安全触达大脑任意角落， Neuralink 就真正从“辅助工具”变成了“人类大脑的操作系统”。

译Neuralink研发手术机器人，可精准抵达大脑任意区域，将脑机接口从局部修复升级为全脑通用解决方案，旨在治疗瘫痪、癫痫等大脑疾病。机器人演示了在血管网络中穿行和微米级植入能力，使脑外科手术从高风险艺术变为可重复工程，拆除普惠化门槛，迈向人类大脑操作系统。

阿绎 AYi@AYi_AInotes · 5月7日63

卧槽，说个颠覆我认知的事，现在AI 把算命这件事，已经干到了全球大赛接近人类顶尖的水平，直接把通用大模型都甩开了一大截！说实话，我一开始看到这个消息，第一反应是又来个蹭玄学流量的 AI 噱头，直到翻完它的完整技术报告和大赛数据，才发现我完全想错了，这是 2025 年第十六届全球算命师大赛，足足 3069 名参赛者，全是行业里的真人从业者，不是什么野鸡比赛。之前很多人做 AI 命理，无非就是把排盘数据往 Prompt 里一塞，让通用大模型硬猜，结果全是结构性的硬伤。命理这东西，衍生数据组合爆炸，各种宫位的空间关系，序列化之后直接丢了关键信息，长链推理越跑越偏，再加上专业语料稀缺，幻觉满天飞，根本没法用。哪怕是Claude Opus 这种顶流通用模型，在这个赛道里，准确率也只做到了 40%。但这个叫 Tianfu Agent 的产品，直接干到了 50% 的截尾均值准确率，人类大赛 Top20 的平均水平，也才 53.5%，只差 3.5 个百分点就摸到了人类顶尖从业者的门槛，比通用模型的天花板，直接高出了 10 个百分点。我翻完它的架构设计才明白，它压根没走通用模型硬背规则的老路，它把传统命理这件事，彻底给工程化了，先做了 200 多个专用的原子工具，排盘，飞宫，用神推演这些需要精准计算的环节，全交给工具来做，模型根本不用记规则，也就不会出错。不止如此，它还把各个流派的专业技法，全封装成了带适用场景和优先级的可调用函数，模型按需触发，不会出现 Prompt 塞太多规则导致的遗忘和污染，甚至连命理师的直觉，它都做了量化，工具输出置信度，子 Agent 自评，再加上紫微八字奇门多流派交叉验证，模拟真人专家的隐性判断。我自己去它官网跑了一轮事业运的实测，细节全对，连我哪年换的赛道，哪年遇到的关键节点，都给我推得明明白白，但说实话，最让我震撼的还不是它算命算得有多准，它这套 Agent 范式给所有垂直专业领域的 AI 化，趟出了一条全新的路，命理这种规则密集，又带经验和直觉的模糊领域，它不强求 AI 懂命理，只让 AI 会用这套专业的命理工具箱，比 SFT 或者 RAG 的效率高太多，还可控可扩展，这套思路，完全能迁移到法律，中医，建筑这些规则密集的领域里。它还把这次大赛用的评测基准 MingLi-Bench，完整开源到了 GitHub 上，想研究的开发者直接就能用，产品也有网页版，国内国外都能访问，任务积分就能免费试用。当然它也不是完美的，目前还是在多选题的基准里跑，真实的开放咨询，还有人类的阅历和共情能力，它还是有差距，只能当参考工具，不能当绝对的预言。说白了，这就不是什么 AI 卷算命的噱头，本质上是 AI 系统性吃透一套古老复杂知识体系的里程碑式尝试，中国开发者在这种本土文化的垂直领域，真的有天然的优势了哈哈。想体验的可以去@DestinyLinker的官网http://tianfu-ai.com试试, Benchmark:https://github.com/DestinyLinker/MingLi-Bench

译Tianfu Agent在第十六届全球算命师大赛中取得50%的截尾均值准确率，接近人类顶尖选手的53.5%，显著超越通用大模型40%的基线。其突破在于采用工程化方案：开发200多个专用原子工具处理精确计算，将流派技法封装为可调用函数，并通过量化工具模拟人类直觉。该Agent范式为法律、中医等规则密集型领域的AI化提供了可迁移的新路径，相关评测基准已开源。

meng shao@shao__meng · 5月7日77

2026 年的 Coding Agent 应该是什么样？Amp 新版 CLI：Neo 发布 @AmpCode https://ampcode.com/news/neo 从"陪伴式 Agent"转向"长链路 Agent" 呼应 Amp 团队之前的宣言 The Coding Agent is Dead，新方向是： · longer leash —— 减少人工介入 · run everywhere —— 不再绑死在一个终端、一个窗口 · prompted from anywhere 终端不会消失，但只是"你想让 Agent 紧贴身边时"的一个入口。Neo 是这个新架构的第一块拼图。 # 关键能力变化 1. 远程控制本地 CLI 启动的 thread，可在 ampcode. com 上实时观看、发消息、入队/出队、取消任务。这是整次重写的核心动机——让 CLI 不再是孤立进程，而是可被远端编排的节点。 2. 自动 Compaction，告别手动上下文管理 · 上下文用到 90% 时，自动总结当前 thread → 开新窗口 → 继续工作。 · 之前的 handoff 功能直接砍掉。 · 理由：前沿模型已经能自己处理压缩，不需要再让用户盯着 token 百分比。 3. 插件系统（Plugin API 正式发布） .amp/plugins/ 下放一个 TS 文件即可扩展。能力涵盖： · 监听事件（tool call、生命周期） · 注册自定义工具 · 注册命令面板动作 · 调起 UI（notify / confirm / input / select） · 调用 AI 做 yes/no 分类（amp. ai.ask）示例是一个 ask_user_choice 工具，让 Agent 主动让用户选择路径——反向把"提问权"交给 Agent，体现 Agent 自主性增强的趋势。 4. 队列与 Steering（引导） · 默认行为变成排队：Agent 工作时发消息不再打断，而是入队。 · Steering：插队机制——下一次工具结果回传时立即注入消息，而不必等 Agent 真正空闲。 · Esc Esc 仍可硬中断。设计哲学：模型工作时间更长，少量打断比频繁中断更高效。 5. 权限模型的根本性反转最有争议、也最值得注意的一点： Amp 默认不再询问权限。原本的 --dangerously-allow-all 成了默认行为。理由具说服力： · 一年前，工具调用还能靠字符串匹配（如查 rm -rf）来拦。 · 现在模型并行写 5 个 20 行 Python 脚本完成任务，静态分析破坏性已不可行——表面安全实为虚假安全感。 · 加上 skills、自定义 scripts、组织级策略千差万别，与其内置一套劣质规则，不如把权限完全交给 Plugin API。老配置（amp.permissions、guardedFiles.allowlist 等）会被作为内置插件继续生效，向下兼容。 6. 性能改造（5000 条消息 thread 实测） · CPU 均值：84.1% -> 17.4%，下降 -79% · 内存空闲占用：1814 MB -> 540 MB，下降 -70%

译Amp发布CLI工具Neo，标志着Coding Agent从“陪伴式”转向“长链路”新方向，核心是减少人工介入、支持随处运行与触发。关键更新包括：实现本地线程的远程控制与编排；引入自动上下文压缩，淘汰手动管理；正式发布Plugin API，支持扩展工具与交互；采用队列与引导机制优化工作流；权限模型彻底反转，默认允许所有操作，将安全控制权移交插件系统；性能大幅提升，CPU与内存占用显著下降。此次更新旨在构建更自主、高效且可扩展的智能编程代理架构。

向阳乔木@vista8 · 5月7日67

Refero Styles：给AI Agent用的前端设计参考网站。 1. 输入网站名，或扔一个 URL ，自动提取网站的设计风格，形成DESIGN.md文件。 2. 收录ElevenLabs、Apple、Linear、Cursor、Stripe、Raycast等大量优质网站Design文档。 3. 提供了一个Refero MCP，收录了大量真实产品的截图和完整用户流程，让AI Agent 写代码前，先搜索、研究参考我觉得第三条有点牛，安装测试下先。网站见评论区

译Refero Styles是一个为AI Agent设计的前端参考网站，允许输入网站名或URL自动提取设计风格并生成DESIGN.md文件。它收录了ElevenLabs、Apple等优质网站的Design文档，并提供Refero MCP，包含真实产品截图和用户流程，让AI Agent在编码前参考以提升效率。

向阳乔木@vista8 · 5月7日59

字节速度够快，TRAE SOLO有了移动端后，能跟电脑端IDE打通，远程控制下发执行任务。还能配置第三方模型，用自己的API key，好评！尤其绑定飞书后，实用性大大提升，手机端也能做一些复杂任务了。

译TRAE SOLO推出移动端应用，可与电脑端IDE打通，实现远程控制与任务下发。该应用支持用户配置第三方模型并使用自己的API密钥，增强了灵活性与自主性。尤其在与飞书绑定后，其实用性显著提升，使得用户能够在手机端处理一些相对复杂的任务，扩展了移动办公与开发的场景。

xAI@xai · 5月7日76

Image Generation Quality Mode is now available on the xAI API. This model has already powered the generation of over 300 million images on Grok. It brings higher realism, stronger text rendering, and better creative control for business professionals. https://x.ai/news/grok-imagine-quality-mode

译图像生成质量模式现已在xAI API上线。该模型已为Grok平台生成超过3亿张图像。它为商业用户带来更高真实感、更强文本渲染能力和更优创意控制。 https://x.ai/news/grok-imagine-quality-mode

Berryxia.AI@berryxia · 5月7日72

前阵子Google 推出的“出国翻译神器” 最被低估的旅行黑科技来了！你以为出国最大的障碍是语言不通？ Google Translate直接把这个问题从“耳朵”里彻底解决。戴上任何一副耳机，打开Translate （翻译）App，点一下“Live translate（实时翻译）”， 70+语言实时同声传译直接塞进耳朵。 Gemini的高级语音模型不光翻译意思，还完整保留说话人的语气、强调、重音和节奏，让你听到的是“人”而不是机器。这已经不是简单的翻译工具，而是把跨语言对话的摩擦直接抹平，让你在任何国家都能像本地人一样自然交流。真正的全球化，从“听懂”开始。下次出国前，记得把这个功能存下来。

译Google Translate的Live translate功能通过耳机提供70多种语言的实时同声传译。用户只需佩戴耳机并启动应用，即可在耳中直接听到翻译。该功能基于Gemini高级语音模型，不仅能准确翻译语义，还能保留说话人的语气、重音和节奏等细微特征，使交流体验更接近真人对话。这项技术旨在消除跨语言沟通的障碍，让用户在海外能进行更自然的交流。

Replit ⠕@Replit · 5月7日62

Now all Replit builders can securely connect webhooks, GitHub, Slack and other external services to private apps So an internal tool can post Slack updates, or a business app can receive Stripe payments, while staying private to your org or team. To enable this, publish your app privately, and you'll see an External Access Tokens section under Security in the Publishing pane, where you can create and manage tokens for these external services

译现在所有Replit开发者都能安全地将webhooks、GitHub、Slack等外部服务连接到私有应用这样内部工具可以发布Slack更新，或商业应用可以接收Stripe付款，同时保持对组织或团队的私密性。要实现此功能，请将应用私有发布，您将在发布面板的"安全"部分看到外部访问令牌选项，可在此创建和管理这些外部服务的令牌

Luma@LumaLabsAI · 5月7日57

The right message to the right person at the right time. Now you can build every version of it. Define the audience. Set the variation. Luma Agents generate every targeted ad from there. Hit every audience → http://lumalabs.ai/app

译在正确的时间，将正确的信息传递给正确的人。现在你可以构建它的每个版本。定义受众。设置变量。Luma Agents 由此生成每个定向广告。触达所有受众 → http://lumalabs.ai/app

Artificial Analysis@ArtificialAnlys · 5月7日63

Artificial Analysis is partnering with Harvey on their new Legal Agent Benchmark! Harvey’s Legal Agent Benchmark (LAB) is an agent-native take on how AI should be contributing to legal work in 2026 - made up 1200 agentic tasks across 24 practice areas. It’s highly aligned with our vision for what exceptional agentic evals should look like, and we’re excited to be partnering with Harvey on it. We're excited to work with Harvey to track and understand agent performance on LAB.

译Artificial Analysis宣布与Harvey合作，共同推出法律AI代理评估基准（LAB）。该基准以“代理原生”理念设计，旨在定义2026年AI在法律领域的工作贡献，涵盖24个实践领域、共计1200项代理任务。LAB与Artificial Analysis对卓越代理评估的愿景高度一致，双方将通过此次合作持续追踪和分析代理在基准上的性能表现，以推动AI在法律应用中的进一步发展。

Luma@LumaLabsAI · 5月7日20

A brand refresh isn't about starting over. It's about showing up better. Define the evolution. Set the direction. Luma Agents build every element of the new identity from there. Build it now → http://lumalabs.ai/app

译品牌焕新并非从头开始，而是为了更好呈现。定义演进方向，确立发展路径。Luma Agents由此构建新品牌形象的每个元素。立即构建 → http://lumalabs.ai/app

OpenClaw🦞@openclaw · 5月7日48

OpenClaw 2026.5.6 🦞 🩺 doctor leaves Codex OAuth routes alone 🔌 plugin fetch handles odd headers 🌐 web_fetch cleans up timeouts Small maintenance release: https://github.com/openclaw/openclaw/releases/tag/v2026.5.6

译OpenClaw 2026.5.6 🦞 🩺 医生未改动Codex OAuth路由 🔌 插件获取处理异常标头 🌐 网络请求清理超时设置小型维护版本发布： https://github.com/openclaw/openclaw/releases/tag/v2026.5.6

全部 AI 动态

AI 相关资讯全量信息流

全部一手信源资讯推文

全部模型产品行业论文技巧

5月8日

04:42

TestingCatalog News 🗞@testingcatalog

42

补充说明：Codex 很快将获得 Realtime Voice Mode 👀

Sam Altman: @LexnLin yeah we need to

OpenAI产品更新语音

04:39

宝玉@dotey

80

Anthropic将Claude全面集成至Microsoft 365，多款插件结束测试

Anthropic宣布，Claude for Excel、PowerPoint和Word三款插件已结束测试转为正式版，Outlook插件同步进入公测。所有付费Claude用户均可免费使用。此次集成的核心突破在于Claude能在Microsoft 365套件中跨应用保持连续的对话上下文。例如，用户可在Outlook中处理邮件，随后在Word中编辑附件，再于Excel构建财务模型并最终生成PowerPoint演示文稿，全程无需重复提供材料。具体功能包括：在Excel中修改单元格而不破坏公式；按模板生成原生PowerPoint图表；在Word中以修订模式编辑文档；在Outlook中生成待发送的邮件草稿。

Claude: Claude for Excel, PowerPoint, and Word are now generally available, and Claude for Outlook is in public beta. As Claude ...

Anthropic产品更新

关联讨论 1 条Claude：Blog（网页）

04:36

OpenAI Developers@OpenAIDevs

72

Codex 现在能承担更多浏览器开发工作。通过 Codex 应用中的新 Chrome 插件，它可以测试网络应用、跨标签页收集上下文、并行高效使用网页开发者工具，并保持结果井井有条而不占用你的浏览器。

OpenAI产品更新编码

关联讨论 10 条X：邵猛 (@shao__meng)X：Tibo (@thsottiaux)X：Berry Xia (@berryxia)X：小互 (@xiaohu)X：Testing Catalog (@testingcatalog)X：宝玉 (@dotey)X：Greg Brockman (@gdb)X：歸藏 (@op7418)IT之家（RSS）X：Vista (@vista8)

04:36

Luma@LumaLabsAI

63

你已有标语。现在将其变为广告。输入你的标语。定义美学风格。Luma Agents 将据此构建广告。赋予它生命 → http：//lumalabs.ai/app

智能体产品更新视频

关联讨论 1 条X：Luma AI (@LumaLabsAI)

04:35

Greg Brockman@gdb

76

自OpenAI创立以来，我一直对实时语音翻译这一AI应用感到兴奋。现在看到它通过API向所有开发者开放，真是太酷了：

jason liu: 新しいリアルタイム翻訳モデルを発表できることをうれしく思います。ぜひ本日よりAPIでお試しください。

OpenAI产品更新语音

关联讨论 14 条X：OpenAI Developers (@OpenAIDevs)X：OpenAI (@OpenAI)X：Greg Brockman (@gdb)X：Artificial Analysis (@ArtificialAnlys)IT之家（RSS）X：Tibo (@thsottiaux)OpenAI：官网动态（RSS · 排除企业/客户案例）The Decoder：AI News（RSS）X：Testing Catalog (@testingcatalog)X：Kim (@kimmonismus)X：Sam Altman (@sama)X：Berry Xia (@berryxia)X：邵猛 (@shao__meng)X：Eric Mitchell (@ericmitchellai)

04:12

TestingCatalog News 🗞@testingcatalog

46

OpenAI宣布Codex即将推出专用的Chrome浏览器扩展，该扩展能显著提升在浏览器内与各类应用和网站的协作能力。其核心特性包括可在多个标签页后台并行工作，不会占用或接管浏览器界面，同时用户拥有完全控制权，能自主决定允许Codex访问哪些特定网站。此次更新通过Changelog发布，但目前该扩展尚未正式上线。

Codex Changelog: 🚀 Codex app update 🌐 Codex Chrome extension ⚡ Parallel background work across tabs, no browser takeover 🔒 Per-site ac...

智能体OpenAI产品更新编码

04:10

OpenAI@OpenAI

精选75

Codex现可直接在macOS和Windows的Chrome中运行。它在处理Chrome中的应用和网站时表现更佳，并能在后台跨标签页并行工作，而不会占用浏览器控制权。要开始使用，请在Codex应用中安装Chrome插件。

智能体OpenAI产品更新编码

关联讨论 10 条X：邵猛 (@shao__meng)X：Tibo (@thsottiaux)X：Berry Xia (@berryxia)X：小互 (@xiaohu)X：Testing Catalog (@testingcatalog)X：宝玉 (@dotey)X：Greg Brockman (@gdb)X：歸藏 (@op7418)IT之家（RSS）X：Vista (@vista8)

推荐理由：Codex 从终端跑进 Chrome，最大的变化不是平台迁移，而是能跨标签并行在后台干活不接管浏览器，这对前端开发和依赖网页工具的流程是实打实的效率提升。

03:42

TestingCatalog News 🗞@testingcatalog

54

SPACEXAI 🚨：Grok网站上出现Grok Computer的新迹象。新增选择器允许用户在Grok Computer和"Google Drive文件夹"之间切换。该功能近期已向所有用户开放，可能并非有意为之。目前选择后无实际变化，但这或许是功能推出的早期信号。 Grok Computer即将到来？👀

Blob Fish: Grok computer is here?!

智能体xAI产品更新

03:11

Satya Nadella@satyanadella

精选67

很高兴今天将 GPT 5.5 Instant 引入 M365 Copilot。凭借更快、更清晰、更准确的响应，您可以用更少的来回交流获得有用的答案。同时也在向 Copilot Studio 和 Foundry 推出。这都是我们专注于为您在工作、智能体和应用程序中提供更多模型选择的一部分。

智能体MicrosoftOpenAI产品更新

推荐理由：微软把 GPT 5.5 Instant 直接塞进 M365 Copilot，对每天用 PPT/Excel 的职场人来说，响应速度提升比任何 benchmark 都实在。

02:11

Perplexity@perplexity_ai

精选68

Personal Computer现已通过全新的Perplexity Mac应用向所有用户开放。 Personal Computer是Perplexity Computer的进阶版本。它可在任何Mac设备上运行，能跨本地文件、原生Mac应用、网络以及Perplexity安全服务器执行任务。

智能体产品更新

推荐理由：Perplexity 把计算机使用能力做进了 Mac 原生应用，能跨本地文件、桌面程序和网络运行任务，对 Mac 用户而言 AI 助手真正开始接管操作系统层级的工作。

02:11

Claude@claudeai

80

Claude for Excel、PowerPoint 和 Word 现已全面可用，Claude for Outlook 进入公开测试版。当 Claude 在您的微软应用间切换时，会完整携带对话的全部上下文。

AnthropicMicrosoft产品更新

关联讨论 1 条Claude：Blog（网页）

02:08

Replit ⠕@Replit

精选67

我们安全承诺的下一步：安全中心2.0。我们极大地简化了理解您管理的每个Replit应用安全状况的流程，并支持批量对所有应用执行操作。通过安全中心2.0，您可以： - 即时识别高风险应用 - 数秒内通过Agent修复关键漏洞 - 通过批量操作通知所有者或下架应用 - 导出软件物料清单（SBOM）以集成外部工具

产品更新部署/工程

推荐理由：如果你用Replit管理一堆应用，这个安全中心2.0的批量修复和SBOM导出是实打实的效率提升，但对个人开发者来说属于‘有比没有好’的更新。

02:05

OpenRouter@OpenRouter

精选68

Gemini 3.1 Flash Lite 来自 @GoogleDeepMind，现已在 OpenRouter 正式发布。多模态（文本/图像/视频/音频/PDF → 文本），100万上下文，可选的思考层级，输入每百万次$0.25，输出每百万次$1.50。还可配合我们新的 service_tier 参数使用，以权衡成本与延迟！

Google产品更新多模态

推荐理由：OpenRouter 把 Gemini 3.1 Flash Lite 的多模态 1M 上下文压到 $0.25/M token，这个定价让 Flash 系列不再是试验品，轻量级应用可以认真考虑它了。

01:38

宝玉@dotey

81

OpenAI在Realtime API上线三款新语音模型

OpenAI在Realtime API中推出了三款新语音模型：GPT-Realtime-2用于对话，GPT-Realtime-Translate用于翻译，GPT-Realtime-Whisper用于实时转录。GPT-Realtime-2具备GPT-5级别推理能力，在音频测试中性能显著提升，改进了交互体验，如任务前语音提示、工具调用透明化和128K上下文窗口，并支持调节推理强度以平衡延迟。GPT-Realtime-Translate支持70多种输入和13种输出语言的实时翻译，GPT-Realtime-Whisper提供流式转录功能。三款模型均已上线，并公布了API价格。

OpenAI: Introducing GPT-Realtime-2 in the API: our most intelligent voice model yet, bringing GPT-5-class reasoning to voice age...

OpenAI产品更新语音

关联讨论 14 条X：OpenAI Developers (@OpenAIDevs)X：OpenAI (@OpenAI)X：Greg Brockman (@gdb)X：Artificial Analysis (@ArtificialAnlys)IT之家（RSS）X：Tibo (@thsottiaux)OpenAI：官网动态（RSS · 排除企业/客户案例）The Decoder：AI News（RSS）X：Testing Catalog (@testingcatalog)X：Kim (@kimmonismus)X：Sam Altman (@sama)X：Berry Xia (@berryxia)X：邵猛 (@shao__meng)X：Eric Mitchell (@ericmitchellai)

00:41

TestingCatalog News 🗞@testingcatalog

49

Scale AI发布了SWE Atlas重构排行榜，这是一个评估智能体重构代码能力的新基准。 > 它要求智能体生成的代码行数是SWE Bench Pro的两倍。 > Claude Code with Opus 4.7位居榜首，其次是Codex with GPT-5.5、GPT-5.4和GPT-5.3。 > 重构对大型语言模型而言是相当重要的任务，因为这通常归结为相当枯燥的工程工作。

Anthropic编码评测/基准

00:36

Microsoft Research@MSFTResearch

55

Tyger将最耗时的MRI处理工作转移到云端，帮助研究人员将原始信号转化为可读图像--这意味着几小时而非数天或数周即可获得结果。https：//msft.it/6010vMCSa

Microsoft产品更新多模态部署/工程

5月7日

23:21

Berryxia.AI@berryxia

65

Google Health以开放生态挑战Apple Health

Google推出全新Google Health平台，取代Fitbit应用，采用开放生态策略，支持从Apple Watch、Garmin等多设备导入健康数据。平台内置Gemini AI教练，提供智能推荐与个性化指导，直接挑战Apple Health的封闭模式，标志着健康数据与AI竞争进入新阶段。

Google产品更新端侧

23:06

meng shao@shao__meng

70

Apify mcpc 与 x402：给 AI Agent 装上"自动付款的钱包"

Apify发布的通用MCP客户端CLI工具mcpc，集成了x402支付协议，旨在解决AI Agent调用付费API时的手动计费瓶颈。传统SaaS计费流程依赖人工注册、绑卡和审批，而x402协议将支付压缩为一次HTTP往返加签名，使程序能自主交易。mcpc为Agent提供加密钱包，当调用付费服务遭遇HTTP 402状态码时，可自动签名完成支付，无需人工干预。该工具支持Claude Code等MCP兼容的Agent，用户可使用USDC为钱包充值并连接x402兼容服务。

Sumanth: Give your AI agents a wallet! Apify just released mcpc with support for autonomous agentic payments. The problem: Your a...

智能体MCP/工具产品更新

23:04

OpenRouter@OpenRouter

精选72

1/ 音频现已成为OpenRouter的一等公民。今日上线两个新端点： 📢 /api/v1/audio/speech - 文本转语音（TTS） 🎤 /api/v1/audio/transcriptions - 语音转文本（SST）沿用您已在文本、图像和视频中使用的相同路由、计费和密钥。

产品更新语音部署/工程

关联讨论 1 条OpenRouter：Announcements（RSS）

推荐理由：OpenRouter 突然把 TTS 和 STT 拉进了统一路由，用同一把 Key 和账单，做多模态 App 的人可以少调一个 API。更新不大，但省事。

23:01

Chubby♨️@kimmonismus

53

谷歌推出AI健康教练，整合多维度健康数据

谷歌在新健康应用中发布了由Gemini驱动的AI健康教练，能整合用户的健身、睡眠、营养、周期追踪、天气乃至美国医疗记录等全方位健康数据。此举被视为迈向个人AI医生和个性化AI医疗的第一步。谷歌将Fitbit应用升级为Google Health，使其成为集健身、睡眠、体征监测、设备连接及未来Google Fit数据迁移于一体的中心平台。Fitbit继续作为硬件核心，而应用则成为Gemini驱动教练、Google Health Premium及新Fitbit Air生态的基地。这一发布领先于苹果即将推出的由Gemini赋能的新Siri及类似健康概念。

Google产品更新

22:41

TestingCatalog News 🗞@testingcatalog

45

GOOGLE 🚨： Flow平台正在准备全新的智能体模式，用于处理完整的视频制作流程！用户将能够： - 规划场景 - 讨论进行中的项目变更 - 触发生成工作流 - 管理项目级和应用级的创意工具 - 直接通过聊天界面更新项目状态万物皆可智能体 👀

智能体Google产品更新视频

22:41

TestingCatalog News 🗞@testingcatalog

55

Meta即将推出常驻AI智能体"Hatch"，基于社交数据训练

Meta即将推出名为“Hatch”的常驻AI智能体，目前已开放候补名单。该智能体将基于Instagram和Facebook的社交数据进行训练与信息落地。据披露，内部测试计划于6月底启动，Meta为此构建了模拟Reddit、Etsy和DoorDash的环境，以训练其工具使用行为。技术架构方面，最终将由Meta自家的Muse Spark模型系列作为核心支撑，而在过渡阶段，将暂时采用Anthropic的Claude Opus 4.6和Sonnet 4.6模型作为中间层。

智能体AnthropicMCP/工具Meta

22:31

Chubby♨️@kimmonismus

48

Superintelligence升级为AI与未来科技对话媒体平台

Superintelligence宣布提升至新水平，从新闻通讯和播客转型为媒体平台，专注于与塑造AI、网络安全、机器人、基础设施和智能未来的人进行对话。平台近期升级了视频格式和编辑支持，优化YouTube优先的体验。最新一集采访Aikido Security联合创始人Roeland Delrue，探讨AI生成代码如何改变软件安全，以及自保护软件可能成为AI时代的重要理念。更多采访已在筹备中，旨在追踪AI的实际发展方向。

产品更新安全/对齐

20:33

PixVerse@PixVerse_

72

4K超分功能现已上线！在一处增强您的图像和视频。获得3次免费使用机会，之后享受35%的积分折扣。限时活动：5月7日至14日，UTC时间08：00。转发+关注+回复=私信领取300积分（仅限72小时）。

产品更新图像生成视频

20:11

TestingCatalog News 🗞@testingcatalog

57

Anthropic测试Claude Console托管代理的Insights功能

Anthropic正在为其Claude Console平台的托管代理测试Insights功能。该功能会获取最多100个近期会话，将每个会话记录与代理系统提示并行发送给模型，以生成包含任务、行动、问题和评估的摘要，并给出0-100的质量评分。同时，直接从事件数据中计算令牌、缓存和工具错误等统计数据。随后，另一个模型调用会读取所有摘要和统计信息，生成跨会话洞察，包括重复错误、使用模式、效率异常点和成功案例，并对错误类别与使用场景进行聚类。所有发现均关联真实的会话ID。摘要与洞察结果会被保存以实现页面即时加载，所有数值均基于原始事件数据计算，仅文本描述和分类来自模型生成。

智能体Anthropic产品更新部署/工程

17:59

Alibaba Cloud@alibaba_cloud

34

阿里云ClawTalks EP3直播：从本地自动化到团队协作的AI工作流

阿里云ClawTalks第三期将于2026年5月8日进行YouTube直播，重点介绍其开源AI智能体工具如何提升工作流。核心产品包括QwenPaw和HiClaw：QwenPaw支持在设备本地运行轻量级、低内存的AI自动化任务；HiClaw则致力于实现透明、人机协同的多智能体团队协作，旨在变革AI智能体的构建与应用方式。

智能体产品更新

17:29

Alibaba Cloud@alibaba_cloud

56

厌倦了混乱的AI技能管理？技能注册中心解决： 🔒 通过AI防护保障外部技能安全 📦 集中化与版本控制资产 🚀 零部署私有注册中心 🔄 自动回滚与细粒度权限停止ZIP共享。开始治理。了解更多：https：//int.alibabacloud.com/m/1000412751/

智能体MCP/工具产品更新

14:03

Elon Musk@elonmusk

24

Grok持续取得进展应用在网页端一次性连接后，即可即时同步至网页端、iOS和Android平台简单示例：我让Grok将航班值机信息添加到Google日历…它几秒内就完美完成了还提供了查看/编辑链接

X Freeze: Grok connections work flawlessly You connect your apps once on the web → they instantly sync across web, iOS, and Androi...

xAI产品更新

12:20

Berryxia.AI@berryxia

52

马斯克给其打Call的Neuralink 这次直接把"脑机接口"从"局部修复"升级成了"全脑通用解决方案"

Neuralink研发手术机器人，可精准抵达大脑任意区域，将脑机接口从局部修复升级为全脑通用解决方案，旨在治疗瘫痪、癫痫等大脑疾病。机器人演示了在血管网络中穿行和微米级植入能力，使脑外科手术从高风险艺术变为可重复工程，拆除普惠化门槛，迈向人类大脑操作系统。

Neuralink: We're building a surgical robot capable of reaching any brain region. The goal: a generalized neural interface to help s...

产品更新其他

11:16

阿绎 AYi@AYi_AInotes

63

AI在专业命理大赛接近人类顶尖水平，技术路径可迁移至垂直领域

Tianfu Agent在第十六届全球算命师大赛中取得50%的截尾均值准确率，接近人类顶尖选手的53.5%，显著超越通用大模型40%的基线。其突破在于采用工程化方案：开发200多个专用原子工具处理精确计算，将流派技法封装为可调用函数，并通过量化工具模拟人类直觉。该Agent范式为法律、中医等规则密集型领域的AI化提供了可迁移的新路径，相关评测基准已开源。

DestinyLinker: Tianfu Agent 在全球算命师大赛上跑到 50% 截尾准确率(人类 Top-20 选手平均 53.5%) 比赛 3069 名参赛者人类 Top-20 选手平均 53.5% 最强通用大模型基线(Claude Opus 4.6)40%...

智能体产品更新开源生态推理

10:36

meng shao@shao__meng

精选77

Amp发布新版CLI工具Neo，引领Coding Agent向长链路转型

Amp发布CLI工具Neo，标志着Coding Agent从“陪伴式”转向“长链路”新方向，核心是减少人工介入、支持随处运行与触发。关键更新包括：实现本地线程的远程控制与编排；引入自动上下文压缩，淘汰手动管理；正式发布Plugin API，支持扩展工具与交互；采用队列与引导机制优化工作流；权限模型彻底反转，默认允许所有操作，将安全控制权移交插件系统；性能大幅提升，CPU与内存占用显著下降。此次更新旨在构建更自主、高效且可扩展的智能编程代理架构。

Thorsten Ball: The best coding agent in the world is back. https://ampcode.com/news/neo

智能体MCP/工具产品更新编码

推荐理由：Amp 这次重写把 Coding Agent 从「陪你写代码」变成了「替你干完活」，默认不询问权限这步走得够狠，但也确实是大模型能力上来的必然。

10:12

向阳乔木@vista8

67

Refero Styles：给AI Agent用的前端设计参考网站。

Refero Styles是一个为AI Agent设计的前端参考网站，允许输入网站名或URL自动提取设计风格并生成DESIGN.md文件。它收录了ElevenLabs、Apple等优质网站的Design文档，并提供Refero MCP，包含真实产品截图和用户流程，让AI Agent在编码前参考以提升效率。

智能体MCP/工具产品更新编码

09:12

向阳乔木@vista8

59

字节TRAE SOLO移动端打通IDE，支持第三方模型与飞书集成

TRAE SOLO推出移动端应用，可与电脑端IDE打通，实现远程控制与任务下发。该应用支持用户配置第三方模型并使用自己的API密钥，增强了灵活性与自主性。尤其在与飞书绑定后，其实用性显著提升，使得用户能够在手机端处理一些相对复杂的任务，扩展了移动办公与开发的场景。

向阳乔木: http://x.com/i/article/2052185467773202433

产品更新编码

09:09

xAI@xai

76

图像生成质量模式现已在xAI API上线。该模型已为Grok平台生成超过3亿张图像。它为商业用户带来更高真实感、更强文本渲染能力和更优创意控制。 https：//x.ai/news/grok-imagine-quality-mode

xAI产品更新图像生成多模态

关联讨论 1 条xAI：News（网页）

08:20

Berryxia.AI@berryxia

72

Google翻译推出实时耳机传译，支持70多种语言

Google Translate的Live translate功能通过耳机提供70多种语言的实时同声传译。用户只需佩戴耳机并启动应用，即可在耳中直接听到翻译。该功能基于Gemini高级语音模型，不仅能准确翻译语义，还能保留说话人的语气、重音和节奏等细微特征，使交流体验更接近真人对话。这项技术旨在消除跨语言沟通的障碍，让用户在海外能进行更自然的交流。

Google: Save this tip before your next big trip abroad ⬇️ With Google Translate's Live translate feature, you can get instant tr...

Google产品更新语音

08:06

Replit ⠕@Replit

62

现在所有Replit开发者都能安全地将webhooks、GitHub、Slack等外部服务连接到私有应用这样内部工具可以发布Slack更新，或商业应用可以接收Stripe付款，同时保持对组织或团队的私密性。要实现此功能，请将应用私有发布，您将在发布面板的"安全"部分看到外部访问令牌选项，可在此创建和管理这些外部服务的令牌

产品更新部署/工程

06:34

Luma@LumaLabsAI

57

在正确的时间，将正确的信息传递给正确的人。现在你可以构建它的每个版本。定义受众。设置变量。Luma Agents 由此生成每个定向广告。触达所有受众 → http：//lumalabs.ai/app

智能体产品更新视频

06:03

Artificial Analysis@ArtificialAnlys

63

Artificial Analysis宣布与Harvey合作，共同推出法律AI代理评估基准（LAB）。该基准以"代理原生"理念设计，旨在定义2026年AI在法律领域的工作贡献，涵盖24个实践领域、共计1200项代理任务。LAB与Artificial Analysis对卓越代理评估的愿景高度一致，双方将通过此次合作持续追踪和分析代理在基准上的性能表现，以推动AI在法律应用中的进一步发展。

Gabe Pereyra: http://x.com/i/article/2051782974098886656

智能体评测/基准

04:34

Luma@LumaLabsAI

20

品牌焕新并非从头开始，而是为了更好呈现。定义演进方向，确立发展路径。Luma Agents由此构建新品牌形象的每个元素。立即构建 → http：//lumalabs.ai/app

产品更新视频

03:08

OpenClaw🦞@openclaw

48

OpenClaw 2026.5.6 🦞 🩺 医生未改动Codex OAuth路由 🔌 插件获取处理异常标头 🌐 网络请求清理超时设置小型维护版本发布： https：//github.com/openclaw/openclaw/releases/tag/v2026.5.6

智能体产品更新开源/仓库

1…36 373839 40…50