AIHOT
内容
精选全部 AI 动态AI 日报主题收藏
接入
Agent 接入
更多
关于更新日志反馈
内部员工登录
精选全部日报更多
内部员工登录
全部动态X · 2611 条
全部一手资讯X论文
标签「产品更新」清除
Rohan Paul@rohanpaul_ai · 5月8日77

Frozen LLMs still carry readable behavior signals deep inside their hidden states. And Proprioceptive AI has created Cygnus, that lets LLMs sense their own internal thinking patterns and dramatically improve accuracy. This pushes Qwen-32B from 82.2% to 94.97% on ARC-Challenge using just one RTX 3090. So Cygnus equips frozen LLMs with self-sensing adapters that read their internal cognitive geometry. The adapters project hidden states into a mathematical space defined by gl(4,R) Lie algebra to isolate dark modes. Those dark modes hold the majority of accuracy-relevant signals erased by standard normalization. This design leads to substantial benchmark gains without any model retraining. Amazing how mathematical insights into activation geometry can improve reliability without full retraining. They currently host up to 50,000 users concurrently on their droplet.

译Proprioceptive AI开发的Cygnus技术,通过为冻结的大语言模型添加自感知适配器,使其能读取内部认知几何。该技术将模型的隐藏状态投影到由gl(4,R)李代数定义的数学空间,分离出包含主要精度信号的“暗模式”,从而无需重新训练即可显著提升模型性能。例如,仅用一张RTX 3090显卡,就将Qwen-32B在ARC-Challenge基准上的准确率从82.2%提升至94.97%。其适配器将覆盖从3B到405B的多款模型,服务节点可支持5万用户并发,预计本周末上线。相关设计论文已公开。

Satya Nadella@satyanadella · 5月8日67

Great to bring GPT 5.5 Instant to M365 Copilot today. With quicker, clearer, and more accurate responses, you can get to useful answers with less back and forth. Also rolling out to Copilot Studio and Foundry. All part of our focus on providing you more model choice across work, agents, and apps.

译很高兴今天将 GPT 5.5 Instant 引入 M365 Copilot。 凭借更快、更清晰、更准确的响应,您可以用更少的来回交流获得有用的答案。 同时也在向 Copilot Studio 和 Foundry 推出。这都是我们专注于为您在工作、智能体和应用程序中提供更多模型选择的一部分。

Perplexity@perplexity_ai · 5月8日68

Personal Computer is now available to all users in a new Perplexity Mac app. Personal Computer is an advanced version of Perplexity Computer. It operates on any Mac, running tasks across your local files, native Mac apps, the web, and Perplexity’s secure servers.

译Personal Computer现已通过全新的Perplexity Mac应用向所有用户开放。 Personal Computer是Perplexity Computer的进阶版本。 它可在任何Mac设备上运行,能跨本地文件、原生Mac应用、网络以及Perplexity安全服务器执行任务。

Claude@claudeai · 5月8日80

Claude for Excel, PowerPoint, and Word are now generally available, and Claude for Outlook is in public beta. As Claude moves between your Microsoft apps, it carries the full context of your conversation.

译Claude for Excel、PowerPoint 和 Word 现已全面可用,Claude for Outlook 进入公开测试版。 当 Claude 在您的微软应用间切换时,会完整携带对话的全部上下文。

Replit ⠕@Replit · 5月8日67

Next up in our commitment to security: Security Center 2.0. We’ve made it dramatically easier to understand your security posture across every Replit app you manage, and take action across all of them in bulk. With Security Center 2.0, you can: - Instantly identify risky apps - Fix critical vulnerabilities with Agent in seconds - Notify owners or un-publish apps with batch actions - Export software bill of materials (SBOM) to integrate with external tools

译我们安全承诺的下一步:安全中心2.0。 我们极大地简化了理解您管理的每个Replit应用安全状况的流程,并支持批量对所有应用执行操作。 通过安全中心2.0,您可以: - 即时识别高风险应用 - 数秒内通过Agent修复关键漏洞 - 通过批量操作通知所有者或下架应用 - 导出软件物料清单(SBOM)以集成外部工具

OpenRouter@OpenRouter · 5月8日68

Gemini 3.1 Flash Lite from @GoogleDeepMind is now GA on OpenRouter. Multimodal (text/image/video/audio/PDF → text), 1M context, selectable thinking levels, at $0.25/M in / $1.50/M out. Also works with our new service_tier param for cost/latency tradeoffs!

译Gemini 3.1 Flash Lite 来自 @GoogleDeepMind,现已在 OpenRouter 正式发布。 多模态(文本/图像/视频/音频/PDF → 文本),100万上下文,可选的思考层级,输入每百万次$0.25,输出每百万次$1.50。 还可配合我们新的 service_tier 参数使用,以权衡成本与延迟!

宝玉@dotey · 5月8日81

OpenAI 在 Realtime API 里上线了三款新语音模型:GPT-Realtime-2、GPT-Realtime-Translate 和 GPT-Realtime-Whisper,分别管对话、翻译和实时转录。 【1】主角:GPT-Realtime-2 号称带 GPT-5 级别的推理能力。比上一代 GPT-Realtime-1.5,在 Big Bench Audio 智能测试上从 81.4% 涨到 96.6%,Audio MultiChallenge 多轮对话指令跟随从 34.7% 涨到 48.5%。 几个实际变化: 开口前会先垫一句。执行长任务前先说"我查一下""稍等一下",避免用户对着空气以为它死机了。 工具调用透明化。能同时调多个工具,过程会被念出来,比如"正在查你的日历""正在搜索",让用户听到 agent 在干什么。 上下文窗口从 32K 扩到 128K,能撑更长的对话和更复杂的任务编排。 开发者可以在 minimal 到 xhigh 五档推理强度里选,默认 low。简单问答用低延迟,复杂任务挂高推理。 出错时会说"这块我现在处理不了",不再直接卡死或乱讲。 【2】Translate 和 Whisper GPT-Realtime-Translate 支持 70 多种输入语言、13 种输出语言的实时语音翻译,主打跨境客服、教育、直播场景。德国电信已经在测;BolnaAI 在印地语、泰米尔语、泰卢固语等印度方言场景下报告错词率比其他模型低 12.5%。 GPT-Realtime-Whisper 是流式版 Whisper,边说边出字幕,主打会议、直播、客服转录。 【3】价格 GPT-Realtime-2:每百万音频输入 token $32(缓存 $0.40),输出 token $64。 GPT-Realtime-Translate:每分钟 $0.034。 GPT-Realtime-Whisper:每分钟 $0.017。 三款都已在 Realtime API 上线,Playground 可以直接试 GPT-Realtime-2。

译OpenAI在Realtime API中推出了三款新语音模型:GPT-Realtime-2用于对话,GPT-Realtime-Translate用于翻译,GPT-Realtime-Whisper用于实时转录。GPT-Realtime-2具备GPT-5级别推理能力,在音频测试中性能显著提升,改进了交互体验,如任务前语音提示、工具调用透明化和128K上下文窗口,并支持调节推理强度以平衡延迟。GPT-Realtime-Translate支持70多种输入和13种输出语言的实时翻译,GPT-Realtime-Whisper提供流式转录功能。三款模型均已上线,并公布了API价格。

Microsoft Research@MSFTResearch · 5月8日55

Tyger moves the most demanding MRI processing to the cloud, helping researchers turn raw signals into readable images – meaning results in hours rather than days or weeks. https://msft.it/6010vMCSa

译Tyger将最耗时的MRI处理工作转移到云端,帮助研究人员将原始信号转化为可读图像——这意味着几小时而非数天或数周即可获得结果。https://msft.it/6010vMCSa

Berryxia.AI@berryxia · 5月7日65

这一波!期待起来了~ Google Health + Gemini 直接把Apple Health的封闭优势干掉了。 Google正式推出全新Google Health,彻底取代Fitbit app,支持从任何追踪器导入数据(Apple Watch、Garmin、Whoop全都能导)! 还内置Gemini AI coach,能给你智能健康推荐和个性化指导。 Google这次选择彻底开放生态,而Apple Health依然是封闭花园。 这场健康数据+AI的战争,终于要真正开打了。 你觉得Google Health能挑战Apple Health的统治地位吗?

译Google推出全新Google Health平台,取代Fitbit应用,采用开放生态策略,支持从Apple Watch、Garmin等多设备导入健康数据。平台内置Gemini AI教练,提供智能推荐与个性化指导,直接挑战Apple Health的封闭模式,标志着健康数据与AI竞争进入新阶段。

meng shao@shao__meng · 5月7日70

Apify mcpc 与 x402:给 AI Agent 装上"自动付款的钱包" mcpc 是 Apify 自家的通用 MCP 客户端 CLI,支持 x402 支付协议,"agentic payments" 也在支持范围内。 传统 SaaS 计费(Stripe + API key + 配额)是为人类设计的:注册、绑卡、审批。agent 调用付费 API 时,这套流程要么靠人预先打通,要么需要 human-in-the-loop。x402 把"支付"压缩成一次 HTTP 往返加一个签名,真正具备了让程序自主交易的形态,mcpc 是这个想法目前最完整的端到端方案。

译Apify发布的通用MCP客户端CLI工具mcpc,集成了x402支付协议,旨在解决AI Agent调用付费API时的手动计费瓶颈。传统SaaS计费流程依赖人工注册、绑卡和审批,而x402协议将支付压缩为一次HTTP往返加签名,使程序能自主交易。mcpc为Agent提供加密钱包,当调用付费服务遭遇HTTP 402状态码时,可自动签名完成支付,无需人工干预。该工具支持Claude Code等MCP兼容的Agent,用户可使用USDC为钱包充值并连接x402兼容服务。

OpenRouter@OpenRouter · 5月7日72

1/ Audio is now first-class on OpenRouter. Two new endpoints live today: 📢 /api/v1/audio/speech — text-to-speech (TTS) 🎤 /api/v1/audio/transcriptions — speech-to-text (SST) Same routing, billing, and keys you already use for text, image, and video.

译1/ 音频现已成为OpenRouter的一等公民。 今日上线两个新端点: 📢 /api/v1/audio/speech — 文本转语音(TTS) 🎤 /api/v1/audio/transcriptions — 语音转文本(SST) 沿用您已在文本、图像和视频中使用的相同路由、计费和密钥。

Chubby♨️@kimmonismus · 5月7日53

Google releases the AI ​​Coach in their new health app, beating Apple to the punch! Google has released an AI health coach that uses Gemini. So, essentially, a health coach that works with all (!) your health data. I think this is the first step towards a personal AI doctor and coach, and I believe we're finally getting to the personalized AI medicine I've always hoped for. tl;dr A 24/7 AI coach that combines fitness, sleep, nutrition, cycle tracking, weather, and even U.S. medical records. Google is turning the Fitbit app into Google Health, positioning it as a single hub for fitness, sleep, cycle tracking, vital signs, connected devices, and future Google Fit data transfers. Fitbit remains the hardware core, while the app becomes the home base for Gemini-powered coaching, Google Health Premium, and the new Fitbit Air ecosystem. And all this before Apple moves forward with its new Siri (also powered by Gemini) and releases a similar concept. An interesting move by Google!

译谷歌在新健康应用中发布了由Gemini驱动的AI健康教练,能整合用户的健身、睡眠、营养、周期追踪、天气乃至美国医疗记录等全方位健康数据。此举被视为迈向个人AI医生和个性化AI医疗的第一步。谷歌将Fitbit应用升级为Google Health,使其成为集健身、睡眠、体征监测、设备连接及未来Google Fit数据迁移于一体的中心平台。Fitbit继续作为硬件核心,而应用则成为Gemini驱动教练、Google Health Premium及新Fitbit Air生态的基地。这一发布领先于苹果即将推出的由Gemini赋能的新Siri及类似健康概念。

TestingCatalog News 🗞@testingcatalog · 5月7日45

GOOGLE 🚨: A new Agent Mode is being prepared on Flow to handle complete video production process! Users will be able to: - Plan out scenes - Discuss in-progress project changes - Trigger generation workflows - Manage both project-level and app-level creative tools - Update the state of a project directly from a chat surface Everything is an Agent now 👀

译GOOGLE 🚨: Flow平台正在准备全新的智能体模式,用于处理完整的视频制作流程! 用户将能够: - 规划场景 - 讨论进行中的项目变更 - 触发生成工作流 - 管理项目级和应用级的创意工具 - 直接通过聊天界面更新项目状态 万物皆可智能体 👀

TestingCatalog News 🗞@testingcatalog · 5月7日55

META 🚨: An upcoming always-on AI Agent called "Hatch" from Meta will be available on a waitlist and grounded in social data from Instagram and Facebook. > According to The Information, Meta is targeting internal testing of Hatch by the end of June, with mock environments built to resemble Reddit, Etsy, and DoorDash for training in tool use behavior. > The Financial Times points to Muse Spark, Meta's new assistant-tier model family, as the eventual backbone, with Anthropic's Claude Opus 4.6 and Sonnet 4.6 reportedly serving as a transitional layer in the meantime.

译Meta即将推出名为“Hatch”的常驻AI智能体,目前已开放候补名单。该智能体将基于Instagram和Facebook的社交数据进行训练与信息落地。据披露,内部测试计划于6月底启动,Meta为此构建了模拟Reddit、Etsy和DoorDash的环境,以训练其工具使用行为。技术架构方面,最终将由Meta自家的Muse Spark模型系列作为核心支撑,而在过渡阶段,将暂时采用Anthropic的Claude Opus 4.6和Sonnet 4.6模型作为中间层。

Chubby♨️@kimmonismus · 5月7日48

We’re taking Superintelligence to the next level. Over the past weeks, we’ve upgraded our video format, brought in editorial support, and started turning our interviews into a proper YouTube-first experience. Superintelligence is no longer just a newsletter or podcast. We’re building a media platform for conversations with the people shaping AI, cybersecurity, robotics, infrastructure, and the future of intelligence. Our latest episode features Roeland Delrue, co-founder of Aikido Security, one of Europe’s fastest-rising cybersecurity startups, on how AI-generated code is changing software security and why self-securing software may become one of the most important ideas of the AI era. More interviews are already in the pipeline. If you care about where AI is actually going, stay tuned.

译Superintelligence宣布提升至新水平,从新闻通讯和播客转型为媒体平台,专注于与塑造AI、网络安全、机器人、基础设施和智能未来的人进行对话。平台近期升级了视频格式和编辑支持,优化YouTube优先的体验。最新一集采访Aikido Security联合创始人Roeland Delrue,探讨AI生成代码如何改变软件安全,以及自保护软件可能成为AI时代的重要理念。更多采访已在筹备中,旨在追踪AI的实际发展方向。

PixVerse@PixVerse_ · 5月7日72

4K Upscale is live! Enhance your images and videos in one place. Get 3 free runs, then enjoy 35% off credits. Limited time: May 7-14, 08:00 UTC. RT+ Follow+ Reply = 300Creds in DMs (72H ONLY)

译4K超分功能现已上线!在一处增强您的图像和视频。 获得3次免费使用机会,之后享受35%的积分折扣。 限时活动:5月7日至14日,UTC时间08:00。 转发+关注+回复=私信领取300积分(仅限72小时)。

TestingCatalog News 🗞@testingcatalog · 5月7日57

Anthropic is testing the Insights feature for its Managed Agents on Claude Console. > Up to 100 recent sessions are fetched. Each transcript is sent to the model (4 in parallel) with your agent's system prompt as context. The model writes a summary — task, actions, issues, assessment — and a 0–100 quality score. Token, cache, and tool-error counts are computed directly from the events alongside. > A single model call reads every summary and its stats, then produces cross-session findings (recurring errors, usage patterns, efficiency outliers, wins), error-category buckets, and use-case clusters. Every cited session ID is checked against the input, so findings only ever point at real sessions. > Summaries and findings are saved so the page loads instantly next time. Everything numeric you see — counts, percentages, token stats per cluster — is computed here from raw event data; only the prose and bucket membership come from the model.

译Anthropic正在为其Claude Console平台的托管代理测试Insights功能。该功能会获取最多100个近期会话,将每个会话记录与代理系统提示并行发送给模型,以生成包含任务、行动、问题和评估的摘要,并给出0-100的质量评分。同时,直接从事件数据中计算令牌、缓存和工具错误等统计数据。随后,另一个模型调用会读取所有摘要和统计信息,生成跨会话洞察,包括重复错误、使用模式、效率异常点和成功案例,并对错误类别与使用场景进行聚类。所有发现均关联真实的会话ID。摘要与洞察结果会被保存以实现页面即时加载,所有数值均基于原始事件数据计算,仅文本描述和分类来自模型生成。

Alibaba Cloud@alibaba_cloud · 5月7日34

Level up your AI workflow—don't miss our live premiere on YouTube of Alibaba Cloud ClawTalks EP3: From Local Automation to Teamwork! Set a reminder now! 👇 📅 May 8, 2026 | 5:00 PM (UTC+8) https://youtu.be/7_FL9_RbLMY Discover how HiClaw and QwenPaw are transforming the way we build AI agents: 🔹 QwenPaw: Run lightweight, low-memory AI automation directly on your device 🔹 HiClaw: Enable transparent, human-in-the-loop collaboration across multi-agent teams #AI #OpenSource #HiClaw #QwenPaw #AgentAI #Automation #Productivity #OnePersonCompany

译阿里云ClawTalks第三期将于2026年5月8日进行YouTube直播,重点介绍其开源AI智能体工具如何提升工作流。核心产品包括QwenPaw和HiClaw:QwenPaw支持在设备本地运行轻量级、低内存的AI自动化任务;HiClaw则致力于实现透明、人机协同的多智能体团队协作,旨在变革AI智能体的构建与应用方式。

Alibaba Cloud@alibaba_cloud · 5月7日56

Tired of chaotic AI Skill management? Skills Registry solves: 🔒 Secure external Skills with AI guards 📦 Centralize & version control assets 🚀 Zero-deploy private registry 🔄 Auto-rollback & fine-grained perms Stop ZIP-sharing. Start governing. ️ Learn more: https://int.alibabacloud.com/m/1000412751/

译厌倦了混乱的AI技能管理? 技能注册中心解决: 🔒 通过AI防护保障外部技能安全 📦 集中化与版本控制资产 🚀 零部署私有注册中心 🔄 自动回滚与细粒度权限 停止ZIP共享。开始治理。 了解更多:https://int.alibabacloud.com/m/1000412751/

Elon Musk@elonmusk · 5月7日24

Grok continues to make progress

译Grok持续取得进展 应用在网页端一次性连接后,即可即时同步至网页端、iOS和Android平台 简单示例:我让Grok将航班值机信息添加到Google日历…它几秒内就完美完成了 还提供了查看/编辑链接

Berryxia.AI@berryxia · 5月7日52

马斯克给其打Call的Neuralink 这次直接把“脑机接口”从“局部修复”升级成了“全脑通用解决方案”。 他们正在研发一台手术机器人,能够精准抵达大脑任意区域。 目标不再是治疗单一疾病,而是打造一个通用型神经接口,解决任何起源于大脑的病症:从瘫痪、癫痫、帕金森,到精神疾病、失明、失语… 全部纳入视野。 工程师亲自演示这台机器人如何在复杂血管网络中穿行、在跳动的大脑组织里实现微米级精准植入,彻底把脑外科从“高风险艺术”变成“可重复工程”。 这是直接把“脑机接口普惠化”的最后一道物理门槛直接拆掉。 当手术机器人能安全触达大脑任意角落, Neuralink 就真正从“辅助工具”变成了“人类大脑的操作系统”。

译Neuralink研发手术机器人,可精准抵达大脑任意区域,将脑机接口从局部修复升级为全脑通用解决方案,旨在治疗瘫痪、癫痫等大脑疾病。机器人演示了在血管网络中穿行和微米级植入能力,使脑外科手术从高风险艺术变为可重复工程,拆除普惠化门槛,迈向人类大脑操作系统。

阿绎 AYi@AYi_AInotes · 5月7日63

卧槽,说个颠覆我认知的事, 现在AI 把算命这件事,已经干到了全球大赛接近人类顶尖的水平,直接把通用大模型都甩开了一大截! 说实话,我一开始看到这个消息, 第一反应是又来个蹭玄学流量的 AI 噱头, 直到翻完它的完整技术报告和大赛数据, 才发现我完全想错了, 这是 2025 年第十六届全球算命师大赛, 足足 3069 名参赛者,全是行业里的真人从业者, 不是什么野鸡比赛。 之前很多人做 AI 命理, 无非就是把排盘数据往 Prompt 里一塞, 让通用大模型硬猜, 结果全是结构性的硬伤。 命理这东西,衍生数据组合爆炸, 各种宫位的空间关系, 序列化之后直接丢了关键信息, 长链推理越跑越偏,再加上专业语料稀缺, 幻觉满天飞,根本没法用。 哪怕是Claude Opus 这种顶流通用模型, 在这个赛道里,准确率也只做到了 40%。 但这个叫 Tianfu Agent 的产品, 直接干到了 50% 的截尾均值准确率, 人类大赛 Top20 的平均水平,也才 53.5%, 只差 3.5 个百分点就摸到了人类顶尖从业者的门槛, 比通用模型的天花板,直接高出了 10 个百分点。 我翻完它的架构设计才明白, 它压根没走通用模型硬背规则的老路, 它把传统命理这件事,彻底给工程化了, 先做了 200 多个专用的原子工具,排盘,飞宫, 用神推演这些需要精准计算的环节, 全交给工具来做,模型根本不用记规则,也就不会出错。 不止如此,它还把各个流派的专业技法,全封装成了带适用场景和优先级的可调用函数,模型按需触发,不会出现 Prompt 塞太多规则导致的遗忘和污染,甚至连命理师的直觉,它都做了量化,工具输出置信度,子 Agent 自评,再加上紫微八字奇门多流派交叉验证,模拟真人专家的隐性判断。 我自己去它官网跑了一轮事业运的实测,细节全对,连我哪年换的赛道,哪年遇到的关键节点,都给我推得明明白白, 但说实话,最让我震撼的还不是它算命算得有多准,它这套 Agent 范式给所有垂直专业领域的 AI 化,趟出了一条全新的路, 命理这种规则密集,又带经验和直觉的模糊领域,它不强求 AI 懂命理,只让 AI 会用这套专业的命理工具箱, 比 SFT 或者 RAG 的效率高太多,还可控可扩展,这套思路,完全能迁移到法律,中医,建筑这些规则密集的领域里。 它还把这次大赛用的评测基准 MingLi-Bench,完整开源到了 GitHub 上,想研究的开发者直接就能用,产品也有网页版,国内国外都能访问,任务积分就能免费试用。 当然它也不是完美的,目前还是在多选题的基准里跑,真实的开放咨询,还有人类的阅历和共情能力,它还是有差距,只能当参考工具,不能当绝对的预言。 说白了,这就不是什么 AI 卷算命的噱头,本质上是 AI 系统性吃透一套古老复杂知识体系的里程碑式尝试,中国开发者在这种本土文化的垂直领域,真的有天然的优势了哈哈。 想体验的可以去@DestinyLinker的官网http://tianfu-ai.com试试, Benchmark:https://github.com/DestinyLinker/MingLi-Bench

译Tianfu Agent在第十六届全球算命师大赛中取得50%的截尾均值准确率,接近人类顶尖选手的53.5%,显著超越通用大模型40%的基线。其突破在于采用工程化方案:开发200多个专用原子工具处理精确计算,将流派技法封装为可调用函数,并通过量化工具模拟人类直觉。该Agent范式为法律、中医等规则密集型领域的AI化提供了可迁移的新路径,相关评测基准已开源。

meng shao@shao__meng · 5月7日77

2026 年的 Coding Agent 应该是什么样?Amp 新版 CLI:Neo 发布 @AmpCode https://ampcode.com/news/neo 从"陪伴式 Agent"转向"长链路 Agent" 呼应 Amp 团队之前的宣言 The Coding Agent is Dead,新方向是: · longer leash —— 减少人工介入 · run everywhere —— 不再绑死在一个终端、一个窗口 · prompted from anywhere 终端不会消失,但只是"你想让 Agent 紧贴身边时"的一个入口。Neo 是这个新架构的第一块拼图。 # 关键能力变化 1. 远程控制 本地 CLI 启动的 thread,可在 ampcode. com 上实时观看、发消息、入队/出队、取消任务。这是整次重写的核心动机——让 CLI 不再是孤立进程,而是可被远端编排的节点。 2. 自动 Compaction,告别手动上下文管理 · 上下文用到 90% 时,自动总结当前 thread → 开新窗口 → 继续工作。 · 之前的 handoff 功能直接砍掉。 · 理由:前沿模型已经能自己处理压缩,不需要再让用户盯着 token 百分比。 3. 插件系统(Plugin API 正式发布) .amp/plugins/ 下放一个 TS 文件即可扩展。能力涵盖: · 监听事件(tool call、生命周期) · 注册自定义工具 · 注册命令面板动作 · 调起 UI(notify / confirm / input / select) · 调用 AI 做 yes/no 分类(amp. ai.ask) 示例是一个 ask_user_choice 工具,让 Agent 主动让用户选择路径——反向把"提问权"交给 Agent,体现 Agent 自主性增强的趋势。 4. 队列与 Steering(引导) · 默认行为变成排队:Agent 工作时发消息不再打断,而是入队。 · Steering:插队机制——下一次工具结果回传时立即注入消息,而不必等 Agent 真正空闲。 · Esc Esc 仍可硬中断。 设计哲学:模型工作时间更长,少量打断比频繁中断更高效。 5. 权限模型的根本性反转 最有争议、也最值得注意的一点: Amp 默认不再询问权限。原本的 --dangerously-allow-all 成了默认行为。 理由具说服力: · 一年前,工具调用还能靠字符串匹配(如查 rm -rf)来拦。 · 现在模型并行写 5 个 20 行 Python 脚本完成任务,静态分析破坏性已不可行——表面安全实为虚假安全感。 · 加上 skills、自定义 scripts、组织级策略千差万别,与其内置一套劣质规则,不如把权限完全交给 Plugin API。 老配置(amp.permissions、guardedFiles.allowlist 等)会被作为内置插件继续生效,向下兼容。 6. 性能改造(5000 条消息 thread 实测) · CPU 均值:84.1% -> 17.4%,下降 -79% · 内存空闲占用:1814 MB -> 540 MB,下降 -70%

译Amp发布CLI工具Neo,标志着Coding Agent从“陪伴式”转向“长链路”新方向,核心是减少人工介入、支持随处运行与触发。关键更新包括:实现本地线程的远程控制与编排;引入自动上下文压缩,淘汰手动管理;正式发布Plugin API,支持扩展工具与交互;采用队列与引导机制优化工作流;权限模型彻底反转,默认允许所有操作,将安全控制权移交插件系统;性能大幅提升,CPU与内存占用显著下降。此次更新旨在构建更自主、高效且可扩展的智能编程代理架构。

向阳乔木@vista8 · 5月7日67

Refero Styles:给AI Agent用的前端设计参考网站。 1. 输入网站名,或扔一个 URL ,自动提取网站的设计风格,形成DESIGN.md文件。 2. 收录ElevenLabs、Apple、Linear、Cursor、Stripe、Raycast等大量优质网站Design文档。 3. 提供了一个Refero MCP,收录了大量真实产品的截图和完整用户流程,让AI Agent 写代码前,先搜索、研究参考 我觉得第三条有点牛,安装测试下先。 网站见评论区

译Refero Styles是一个为AI Agent设计的前端参考网站,允许输入网站名或URL自动提取设计风格并生成DESIGN.md文件。它收录了ElevenLabs、Apple等优质网站的Design文档,并提供Refero MCP,包含真实产品截图和用户流程,让AI Agent在编码前参考以提升效率。

向阳乔木@vista8 · 5月7日59

字节速度够快,TRAE SOLO有了移动端后,能跟电脑端IDE打通,远程控制下发执行任务。 还能配置第三方模型,用自己的API key,好评! 尤其绑定飞书后,实用性大大提升,手机端也能做一些复杂任务了。

译TRAE SOLO推出移动端应用,可与电脑端IDE打通,实现远程控制与任务下发。该应用支持用户配置第三方模型并使用自己的API密钥,增强了灵活性与自主性。尤其在与飞书绑定后,其实用性显著提升,使得用户能够在手机端处理一些相对复杂的任务,扩展了移动办公与开发的场景。

xAI@xai · 5月7日76

Image Generation Quality Mode is now available on the xAI API. This model has already powered the generation of over 300 million images on Grok. It brings higher realism, stronger text rendering, and better creative control for business professionals. https://x.ai/news/grok-imagine-quality-mode

译图像生成质量模式现已在xAI API上线。 该模型已为Grok平台生成超过3亿张图像。 它为商业用户带来更高真实感、更强文本渲染能力和更优创意控制。 https://x.ai/news/grok-imagine-quality-mode

Berryxia.AI@berryxia · 5月7日72

前阵子Google 推出的“出国翻译神器” 最被低估的旅行黑科技来了! 你以为出国最大的障碍是语言不通? Google Translate直接把这个问题从“耳朵”里彻底解决。 戴上任何一副耳机,打开Translate (翻译)App,点一下“Live translate(实时翻译)”, 70+语言实时同声传译直接塞进耳朵。 Gemini的高级语音模型不光翻译意思,还完整保留说话人的语气、强调、重音和节奏, 让你听到的是“人”而不是机器。 这已经不是简单的翻译工具, 而是把跨语言对话的摩擦直接抹平,让你在任何国家都能像本地人一样自然交流。 真正的全球化,从“听懂”开始。 下次出国前,记得把这个功能存下来。

译Google Translate的Live translate功能通过耳机提供70多种语言的实时同声传译。用户只需佩戴耳机并启动应用,即可在耳中直接听到翻译。该功能基于Gemini高级语音模型,不仅能准确翻译语义,还能保留说话人的语气、重音和节奏等细微特征,使交流体验更接近真人对话。这项技术旨在消除跨语言沟通的障碍,让用户在海外能进行更自然的交流。

Replit ⠕@Replit · 5月7日62

Now all Replit builders can securely connect webhooks, GitHub, Slack and other external services to private apps So an internal tool can post Slack updates, or a business app can receive Stripe payments, while staying private to your org or team. To enable this, publish your app privately, and you'll see an External Access Tokens section under Security in the Publishing pane, where you can create and manage tokens for these external services

译现在所有Replit开发者都能安全地将webhooks、GitHub、Slack等外部服务连接到私有应用 这样内部工具可以发布Slack更新,或商业应用可以接收Stripe付款,同时保持对组织或团队的私密性。 要实现此功能,请将应用私有发布,您将在发布面板的"安全"部分看到外部访问令牌选项,可在此创建和管理这些外部服务的令牌

Luma@LumaLabsAI · 5月7日57

The right message to the right person at the right time. Now you can build every version of it. Define the audience. Set the variation. Luma Agents generate every targeted ad from there. Hit every audience → http://lumalabs.ai/app

译在正确的时间,将正确的信息传递给正确的人。现在你可以构建它的每个版本。 定义受众。设置变量。Luma Agents 由此生成每个定向广告。 触达所有受众 → http://lumalabs.ai/app

Luma@LumaLabsAI · 5月7日20

A brand refresh isn't about starting over. It's about showing up better. Define the evolution. Set the direction. Luma Agents build every element of the new identity from there. Build it now → http://lumalabs.ai/app

译品牌焕新并非从头开始,而是为了更好呈现。 定义演进方向,确立发展路径。Luma Agents由此构建新品牌形象的每个元素。 立即构建 → http://lumalabs.ai/app

OpenClaw🦞@openclaw · 5月7日48

OpenClaw 2026.5.6 🦞 🩺 doctor leaves Codex OAuth routes alone 🔌 plugin fetch handles odd headers 🌐 web_fetch cleans up timeouts Small maintenance release: https://github.com/openclaw/openclaw/releases/tag/v2026.5.6

译OpenClaw 2026.5.6 🦞 🩺 医生未改动Codex OAuth路由 🔌 插件获取处理异常标头 🌐 网络请求清理超时设置 小型维护版本发布: https://github.com/openclaw/openclaw/releases/tag/v2026.5.6

TestingCatalog News 🗞@testingcatalog · 5月7日57

GOOGLE 🚨: Gemini Agent will arrive with support for Scheduled Actions and Skills. Most of the task examples are focused on working with connectors, research tasks, and more. > Declutter your inbox > Prepare for the meeting > News digest > Bill tracker > Ghost writer Gemini will automatically use relevant skills 👀

译GOOGLE 🚨: Gemini Agent 即将推出,支持定时任务和技能调用。 大部分任务示例聚焦于连接器协作、研究任务等功能。 > 整理收件箱 > 会议准备 > 新闻摘要 > 账单追踪 > 代笔写作 Gemini将自动调用相关技能 👀

Google Gemini@GeminiApp · 5月7日67

With Personal Intelligence and Nano Banana 2 working together, you can now turn your interests into imagery in Gemini. Don’t miss our next community event on Discord for a live demo and Q&A with the team behind this latest release. 👉Join us on Discord to watch live: http://discord.gg/gemini 📅 Today at 12:00 PM PT

译通过个人智能与Nano Banana 2的协同工作,您现在可以将兴趣转化为Gemini中的图像。 请勿错过我们在Discord上的下一次社区活动,届时将有最新版本团队的现场演示和问答环节。 👉加入我们的Discord观看直播:http://discord.gg/gemini 📅 今天太平洋时间中午12:00

宝玉@dotey · 5月7日54

Cursor 3.3 里面可以方便的看 Context 占用情况。看了下我的 Skills 有 6.8 K,有点多了

ClaudeDevs@ClaudeDevs · 5月7日64

In Claude Managed Agents, we’ve added multiagent orchestration, an outcomes loop for rubric-driven self-improvement, dreaming for self-learning, & webhooks.

译在Claude Managed Agents中,我们新增了多代理协同编排、基于评估标准的成果自改进循环、用于自学习的模拟训练以及网络钩子功能。

TestingCatalog News 🗞@testingcatalog · 5月7日51

ANTHROPIC 🚨: Managed Agents now have Dreams, a self-learningg solution that allows Agents to improve based on their past results. The feature will be available on Claude Console as a research preview under a waitlist. What are your agents dreaming about? 🔥

译ANTHROPIC 🚨:托管智能体现已具备Dreams功能,这是一种基于过往结果实现自我提升的自学习解决方案。 该功能将在Claude Console以研究预览形式开放,采用等候名单机制。 你的智能体正在梦想着什么?🔥

TestingCatalog News 🗞@testingcatalog · 5月7日66

Besides Dreams, Claude Managed Agents got multiagent orchestration, outcomes loop, and webhooks! Agents are new apps 👀

译除了Dreams功能,Claude托管智能体还获得了多智能体编排、结果循环和网络钩子! 智能体就是新应用 👀

Claude@claudeai · 5月7日75

Live from Code with Claude: we're launching dreaming in Claude Managed Agents as a research preview. Outcomes, multiagent orchestration, and webhooks are now in public beta.

译来自Code with Claude直播:我们正以研究预览版形式在Claude Managed Agents中推出梦想功能。 成果追踪、多智能体编排和网络钩子现已进入公开测试阶段。

Boris Cherny@bcherny · 5月7日29

Hello from Code with Claude!

译来自 Code with Claude 的问候!

ClaudeDevs@ClaudeDevs · 5月7日73

Usage limits are up, effective today we're: 1) Doubling Claude Code's 5-hour limits for Pro, Max, Team and seat-based Enterprise plans 2) Removing peak hours limit reduction on Claude Code for Pro and Max plans 3) Substantially raising our API rate limits for Opus models

译Anthropic今日宣布全面提升Claude系列产品的使用限制。具体措施包括:将Claude Code在Pro、Max、Team及按席位计费的企业版计划中的5小时使用时长限制提升一倍;取消Pro和Max计划在高峰时段对Claude Code的限制削减;并大幅提高Opus模型的API速率限制。公司表示,此次调整主要得益于与SpaceX达成的合作伙伴关系以及其他近期算力协议,这些合作显著增加了Anthropic的计算容量,从而使其能够提升Claude Code和Claude API的服务上限。

全部 AI 动态
AI 相关资讯全量信息流
全部一手信源资讯推文
全部模型产品行业论文技巧
5月8日
03:36
Rohan Paul@rohanpaul_ai
精选77
冻结大语言模型隐藏状态中仍存可读行为信号,新技术大幅提升准确性

Proprioceptive AI开发的Cygnus技术,通过为冻结的大语言模型添加自感知适配器,使其能读取内部认知几何。该技术将模型的隐藏状态投影到由gl(4,R)李代数定义的数学空间,分离出包含主要精度信号的“暗模式”,从而无需重新训练即可显著提升模型性能。例如,仅用一张RTX 3090显卡,就将Qwen-32B在ARC-Challenge基准上的准确率从82.2%提升至94.97%。其适配器将覆盖从3B到405B的多款模型,服务节点可支持5万用户并发,预计本周末上线。相关设计论文已公开。

Logan Matthew Napolitano: Final adverserial testing is wrapping up now on small models, GPU's arriving daily, 1TB ram so far, 128 VRAM and adding....

产品更新推理论文/研究

推荐理由:用Lie代数揪出模型内部的“黑暗模式”,在ARC上狂涨12个点还只要一张3090,如果真能泛化到其他任务,这或许是今年最巧妙的模型增强方案,但单基准提升仍需更多验证。
03:11
Satya Nadella@satyanadella
同事件精选67
很高兴今天将 GPT 5.5 Instant 引入 M365 Copilot。 凭借更快、更清晰、更准确的响应,您可以用更少的来回交流获得有用的答案。 同时也在向 Copilot Studio 和 Foundry 推出。这都是我们专注于为您在工作、智能体和应用程序中提供更多模型选择的一部分。
智能体MicrosoftOpenAI产品更新
同一事件,精选展示《ChatGPT今日迎来5.5即时版重大升级》
推荐理由:微软把 GPT 5.5 Instant 直接塞进 M365 Copilot,对每天用 PPT/Excel 的职场人来说,响应速度提升比任何 benchmark 都实在。
02:11
Perplexity@perplexity_ai
精选68
Personal Computer现已通过全新的Perplexity Mac应用向所有用户开放。 Personal Computer是Perplexity Computer的进阶版本。 它可在任何Mac设备上运行,能跨本地文件、原生Mac应用、网络以及Perplexity安全服务器执行任务。
智能体产品更新

推荐理由:Perplexity 把计算机使用能力做进了 Mac 原生应用,能跨本地文件、桌面程序和网络运行任务,对 Mac 用户而言 AI 助手真正开始接管操作系统层级的工作。
02:11
Claude@claudeai
80
Claude for Excel、PowerPoint 和 Word 现已全面可用,Claude for Outlook 进入公开测试版。 当 Claude 在您的微软应用间切换时,会完整携带对话的全部上下文。
AnthropicMicrosoft产品更新
02:08
Replit ⠕@Replit
精选67
我们安全承诺的下一步:安全中心2.0。 我们极大地简化了理解您管理的每个Replit应用安全状况的流程,并支持批量对所有应用执行操作。 通过安全中心2.0,您可以: - 即时识别高风险应用 - 数秒内通过Agent修复关键漏洞 - 通过批量操作通知所有者或下架应用 - 导出软件物料清单(SBOM)以集成外部工具
产品更新部署/工程

推荐理由:如果你用Replit管理一堆应用,这个安全中心2.0的批量修复和SBOM导出是实打实的效率提升,但对个人开发者来说属于‘有比没有好’的更新。
02:05
OpenRouter@OpenRouter
精选68
Gemini 3.1 Flash Lite 来自 @GoogleDeepMind,现已在 OpenRouter 正式发布。 多模态(文本/图像/视频/音频/PDF → 文本),100万上下文,可选的思考层级,输入每百万次$0.25,输出每百万次$1.50。 还可配合我们新的 service_tier 参数使用,以权衡成本与延迟!
Google产品更新多模态

推荐理由:OpenRouter 把 Gemini 3.1 Flash Lite 的多模态 1M 上下文压到 $0.25/M token,这个定价让 Flash 系列不再是试验品,轻量级应用可以认真考虑它了。
01:38
宝玉@dotey
81
OpenAI在Realtime API上线三款新语音模型

OpenAI在Realtime API中推出了三款新语音模型:GPT-Realtime-2用于对话,GPT-Realtime-Translate用于翻译,GPT-Realtime-Whisper用于实时转录。GPT-Realtime-2具备GPT-5级别推理能力,在音频测试中性能显著提升,改进了交互体验,如任务前语音提示、工具调用透明化和128K上下文窗口,并支持调节推理强度以平衡延迟。GPT-Realtime-Translate支持70多种输入和13种输出语言的实时翻译,GPT-Realtime-Whisper提供流式转录功能。三款模型均已上线,并公布了API价格。

OpenAI: Introducing GPT-Realtime-2 in the API: our most intelligent voice model yet, bringing GPT-5-class reasoning to voice age...

OpenAI产品更新语音
00:36
Microsoft Research@MSFTResearch
55
Tyger将最耗时的MRI处理工作转移到云端,帮助研究人员将原始信号转化为可读图像--这意味着几小时而非数天或数周即可获得结果。https://msft.it/6010vMCSa
Microsoft产品更新多模态部署/工程
5月7日
23:21
Berryxia.AI@berryxia
65
Google Health以开放生态挑战Apple Health

Google推出全新Google Health平台,取代Fitbit应用,采用开放生态策略,支持从Apple Watch、Garmin等多设备导入健康数据。平台内置Gemini AI教练,提供智能推荐与个性化指导,直接挑战Apple Health的封闭模式,标志着健康数据与AI竞争进入新阶段。

Google产品更新端侧
23:06
meng shao@shao__meng
70
Apify mcpc 与 x402:给 AI Agent 装上"自动付款的钱包"

Apify发布的通用MCP客户端CLI工具mcpc,集成了x402支付协议,旨在解决AI Agent调用付费API时的手动计费瓶颈。传统SaaS计费流程依赖人工注册、绑卡和审批,而x402协议将支付压缩为一次HTTP往返加签名,使程序能自主交易。mcpc为Agent提供加密钱包,当调用付费服务遭遇HTTP 402状态码时,可自动签名完成支付,无需人工干预。该工具支持Claude Code等MCP兼容的Agent,用户可使用USDC为钱包充值并连接x402兼容服务。

Sumanth: Give your AI agents a wallet! Apify just released mcpc with support for autonomous agentic payments. The problem: Your a...

智能体MCP/工具产品更新
23:04
OpenRouter@OpenRouter
精选72
1/ 音频现已成为OpenRouter的一等公民。 今日上线两个新端点: 📢 /api/v1/audio/speech - 文本转语音(TTS) 🎤 /api/v1/audio/transcriptions - 语音转文本(SST) 沿用您已在文本、图像和视频中使用的相同路由、计费和密钥。
产品更新语音部署/工程

推荐理由:OpenRouter 突然把 TTS 和 STT 拉进了统一路由,用同一把 Key 和账单,做多模态 App 的人可以少调一个 API。更新不大,但省事。
23:01
Chubby♨️@kimmonismus
53
谷歌推出AI健康教练,整合多维度健康数据

谷歌在新健康应用中发布了由Gemini驱动的AI健康教练,能整合用户的健身、睡眠、营养、周期追踪、天气乃至美国医疗记录等全方位健康数据。此举被视为迈向个人AI医生和个性化AI医疗的第一步。谷歌将Fitbit应用升级为Google Health,使其成为集健身、睡眠、体征监测、设备连接及未来Google Fit数据迁移于一体的中心平台。Fitbit继续作为硬件核心,而应用则成为Gemini驱动教练、Google Health Premium及新Fitbit Air生态的基地。这一发布领先于苹果即将推出的由Gemini赋能的新Siri及类似健康概念。

Google产品更新
22:41
TestingCatalog News 🗞@testingcatalog
45
GOOGLE 🚨: Flow平台正在准备全新的智能体模式,用于处理完整的视频制作流程! 用户将能够: - 规划场景 - 讨论进行中的项目变更 - 触发生成工作流 - 管理项目级和应用级的创意工具 - 直接通过聊天界面更新项目状态 万物皆可智能体 👀
智能体Google产品更新视频
22:41
TestingCatalog News 🗞@testingcatalog
55
Meta即将推出常驻AI智能体"Hatch",基于社交数据训练

Meta即将推出名为“Hatch”的常驻AI智能体,目前已开放候补名单。该智能体将基于Instagram和Facebook的社交数据进行训练与信息落地。据披露,内部测试计划于6月底启动,Meta为此构建了模拟Reddit、Etsy和DoorDash的环境,以训练其工具使用行为。技术架构方面,最终将由Meta自家的Muse Spark模型系列作为核心支撑,而在过渡阶段,将暂时采用Anthropic的Claude Opus 4.6和Sonnet 4.6模型作为中间层。

智能体AnthropicMCP/工具Meta
22:31
Chubby♨️@kimmonismus
48
Superintelligence升级为AI与未来科技对话媒体平台

Superintelligence宣布提升至新水平,从新闻通讯和播客转型为媒体平台,专注于与塑造AI、网络安全、机器人、基础设施和智能未来的人进行对话。平台近期升级了视频格式和编辑支持,优化YouTube优先的体验。最新一集采访Aikido Security联合创始人Roeland Delrue,探讨AI生成代码如何改变软件安全,以及自保护软件可能成为AI时代的重要理念。更多采访已在筹备中,旨在追踪AI的实际发展方向。

产品更新安全/对齐
20:33
PixVerse@PixVerse_
72
4K超分功能现已上线!在一处增强您的图像和视频。 获得3次免费使用机会,之后享受35%的积分折扣。 限时活动:5月7日至14日,UTC时间08:00。 转发+关注+回复=私信领取300积分(仅限72小时)。
产品更新图像生成视频
20:11
TestingCatalog News 🗞@testingcatalog
57
Anthropic测试Claude Console托管代理的Insights功能

Anthropic正在为其Claude Console平台的托管代理测试Insights功能。该功能会获取最多100个近期会话,将每个会话记录与代理系统提示并行发送给模型,以生成包含任务、行动、问题和评估的摘要,并给出0-100的质量评分。同时,直接从事件数据中计算令牌、缓存和工具错误等统计数据。随后,另一个模型调用会读取所有摘要和统计信息,生成跨会话洞察,包括重复错误、使用模式、效率异常点和成功案例,并对错误类别与使用场景进行聚类。所有发现均关联真实的会话ID。摘要与洞察结果会被保存以实现页面即时加载,所有数值均基于原始事件数据计算,仅文本描述和分类来自模型生成。

智能体Anthropic产品更新部署/工程
17:59
Alibaba Cloud@alibaba_cloud
34
阿里云ClawTalks EP3直播:从本地自动化到团队协作的AI工作流

阿里云ClawTalks第三期将于2026年5月8日进行YouTube直播,重点介绍其开源AI智能体工具如何提升工作流。核心产品包括QwenPaw和HiClaw:QwenPaw支持在设备本地运行轻量级、低内存的AI自动化任务;HiClaw则致力于实现透明、人机协同的多智能体团队协作,旨在变革AI智能体的构建与应用方式。

智能体产品更新
17:29
Alibaba Cloud@alibaba_cloud
56
厌倦了混乱的AI技能管理? 技能注册中心解决: 🔒 通过AI防护保障外部技能安全 📦 集中化与版本控制资产 🚀 零部署私有注册中心 🔄 自动回滚与细粒度权限 停止ZIP共享。开始治理。 了解更多:https://int.alibabacloud.com/m/1000412751/
智能体MCP/工具产品更新
14:03
Elon Musk@elonmusk
24
Grok持续取得进展 应用在网页端一次性连接后,即可即时同步至网页端、iOS和Android平台 简单示例:我让Grok将航班值机信息添加到Google日历…它几秒内就完美完成了 还提供了查看/编辑链接

X Freeze: Grok connections work flawlessly You connect your apps once on the web → they instantly sync across web, iOS, and Androi...

xAI产品更新
12:20
Berryxia.AI@berryxia
52
马斯克给其打Call的Neuralink 这次直接把"脑机接口"从"局部修复"升级成了"全脑通用解决方案"

Neuralink研发手术机器人,可精准抵达大脑任意区域,将脑机接口从局部修复升级为全脑通用解决方案,旨在治疗瘫痪、癫痫等大脑疾病。机器人演示了在血管网络中穿行和微米级植入能力,使脑外科手术从高风险艺术变为可重复工程,拆除普惠化门槛,迈向人类大脑操作系统。

Neuralink: We're building a surgical robot capable of reaching any brain region. The goal: a generalized neural interface to help s...

产品更新其他
11:16
阿绎 AYi@AYi_AInotes
63
AI在专业命理大赛接近人类顶尖水平,技术路径可迁移至垂直领域

Tianfu Agent在第十六届全球算命师大赛中取得50%的截尾均值准确率,接近人类顶尖选手的53.5%,显著超越通用大模型40%的基线。其突破在于采用工程化方案:开发200多个专用原子工具处理精确计算,将流派技法封装为可调用函数,并通过量化工具模拟人类直觉。该Agent范式为法律、中医等规则密集型领域的AI化提供了可迁移的新路径,相关评测基准已开源。

DestinyLinker: Tianfu Agent 在全球算命师大赛上跑到 50% 截尾准确率(人类 Top-20 选手平均 53.5%) 比赛 3069 名参赛者 人类 Top-20 选手平均 53.5% 最强通用大模型基线(Claude Opus 4.6)40%...

智能体产品更新开源生态推理
10:36
meng shao@shao__meng
精选77
Amp发布新版CLI工具Neo,引领Coding Agent向长链路转型

Amp发布CLI工具Neo,标志着Coding Agent从“陪伴式”转向“长链路”新方向,核心是减少人工介入、支持随处运行与触发。关键更新包括:实现本地线程的远程控制与编排;引入自动上下文压缩,淘汰手动管理;正式发布Plugin API,支持扩展工具与交互;采用队列与引导机制优化工作流;权限模型彻底反转,默认允许所有操作,将安全控制权移交插件系统;性能大幅提升,CPU与内存占用显著下降。此次更新旨在构建更自主、高效且可扩展的智能编程代理架构。

Thorsten Ball: The best coding agent in the world is back. https://ampcode.com/news/neo

智能体MCP/工具产品更新编码

推荐理由:Amp 这次重写把 Coding Agent 从「陪你写代码」变成了「替你干完活」,默认不询问权限这步走得够狠,但也确实是大模型能力上来的必然。
10:12
向阳乔木@vista8
67
Refero Styles:给AI Agent用的前端设计参考网站。

Refero Styles是一个为AI Agent设计的前端参考网站,允许输入网站名或URL自动提取设计风格并生成DESIGN.md文件。它收录了ElevenLabs、Apple等优质网站的Design文档,并提供Refero MCP,包含真实产品截图和用户流程,让AI Agent在编码前参考以提升效率。

智能体MCP/工具产品更新编码
09:12
向阳乔木@vista8
59
字节TRAE SOLO移动端打通IDE,支持第三方模型与飞书集成

TRAE SOLO推出移动端应用,可与电脑端IDE打通,实现远程控制与任务下发。该应用支持用户配置第三方模型并使用自己的API密钥,增强了灵活性与自主性。尤其在与飞书绑定后,其实用性显著提升,使得用户能够在手机端处理一些相对复杂的任务,扩展了移动办公与开发的场景。

向阳乔木: http://x.com/i/article/2052185467773202433

产品更新编码
09:09
xAI@xai
76
图像生成质量模式现已在xAI API上线。 该模型已为Grok平台生成超过3亿张图像。 它为商业用户带来更高真实感、更强文本渲染能力和更优创意控制。 https://x.ai/news/grok-imagine-quality-mode
xAI产品更新图像生成多模态
08:20
Berryxia.AI@berryxia
72
Google翻译推出实时耳机传译,支持70多种语言

Google Translate的Live translate功能通过耳机提供70多种语言的实时同声传译。用户只需佩戴耳机并启动应用,即可在耳中直接听到翻译。该功能基于Gemini高级语音模型,不仅能准确翻译语义,还能保留说话人的语气、重音和节奏等细微特征,使交流体验更接近真人对话。这项技术旨在消除跨语言沟通的障碍,让用户在海外能进行更自然的交流。

Google: Save this tip before your next big trip abroad ⬇️ With Google Translate's Live translate feature, you can get instant tr...

Google产品更新语音
08:06
Replit ⠕@Replit
62
现在所有Replit开发者都能安全地将webhooks、GitHub、Slack等外部服务连接到私有应用 这样内部工具可以发布Slack更新,或商业应用可以接收Stripe付款,同时保持对组织或团队的私密性。 要实现此功能,请将应用私有发布,您将在发布面板的"安全"部分看到外部访问令牌选项,可在此创建和管理这些外部服务的令牌
产品更新部署/工程
06:34
Luma@LumaLabsAI
57
在正确的时间,将正确的信息传递给正确的人。现在你可以构建它的每个版本。 定义受众。设置变量。Luma Agents 由此生成每个定向广告。 触达所有受众 → http://lumalabs.ai/app
智能体产品更新视频
04:34
Luma@LumaLabsAI
20
品牌焕新并非从头开始,而是为了更好呈现。 定义演进方向,确立发展路径。Luma Agents由此构建新品牌形象的每个元素。 立即构建 → http://lumalabs.ai/app
产品更新视频
03:08
OpenClaw🦞@openclaw
48
OpenClaw 2026.5.6 🦞 🩺 医生未改动Codex OAuth路由 🔌 插件获取处理异常标头 🌐 网络请求清理超时设置 小型维护版本发布: https://github.com/openclaw/openclaw/releases/tag/v2026.5.6
智能体产品更新开源/仓库
02:40
TestingCatalog News 🗞@testingcatalog
57
GOOGLE 🚨: Gemini Agent 即将推出,支持定时任务和技能调用。 大部分任务示例聚焦于连接器协作、研究任务等功能。 > 整理收件箱 > 会议准备 > 新闻摘要 > 账单追踪 > 代笔写作 Gemini将自动调用相关技能 👀

Luke Litowitz: New #gemini agent 👀👀👀

智能体GoogleMCP/工具产品更新
02:08
Google Gemini@GeminiApp
精选67
通过个人智能与Nano Banana 2的协同工作,您现在可以将兴趣转化为Gemini中的图像。 请勿错过我们在Discord上的下一次社区活动,届时将有最新版本团队的现场演示和问答环节。 👉加入我们的Discord观看直播:http://discord.gg/gemini 📅 今天太平洋时间中午12:00
Google产品更新图像生成多模态

推荐理由:Nano Banana 2 把 Gemini 的图像生成从写 prompt 变成了识别你的兴趣,不用费力描述也能出图,对普通用户可能是真痛点,看直播看看实际效果。
01:36
宝玉@dotey
54
Cursor 3.3 里面可以方便的看 Context 占用情况。看了下我的 Skills 有 6.8 K,有点多了

Cursor: You can now see a breakdown of your agent's context usage in Cursor 3.3. Use these stats to diagnose context issues and ...

产品更新编码
01:33
ClaudeDevs@ClaudeDevs
64
在Claude Managed Agents中,我们新增了多代理协同编排、基于评估标准的成果自改进循环、用于自学习的模拟训练以及网络钩子功能。
智能体AnthropicMCP/工具产品更新
01:10
TestingCatalog News 🗞@testingcatalog
51
ANTHROPIC 🚨:托管智能体现已具备Dreams功能,这是一种基于过往结果实现自我提升的自学习解决方案。 该功能将在Claude Console以研究预览形式开放,采用等候名单机制。 你的智能体正在梦想着什么?🔥
智能体Anthropic产品更新
01:10
TestingCatalog News 🗞@testingcatalog
66
除了Dreams功能,Claude托管智能体还获得了多智能体编排、结果循环和网络钩子! 智能体就是新应用 👀

TestingCatalog News 🗞: ANTHROPIC 🚨: Managed Agents now have Dreams, a self-learningg solution that allows Agents to improve based on their pas...

智能体AnthropicMCP/工具产品更新
01:08
Claude@claudeai
75
来自Code with Claude直播:我们正以研究预览版形式在Claude Managed Agents中推出梦想功能。 成果追踪、多智能体编排和网络钩子现已进入公开测试阶段。
智能体Anthropic产品更新
01:03
Boris Cherny@bcherny
29
来自 Code with Claude 的问候!
Anthropic产品更新编码
01:03
ClaudeDevs@ClaudeDevs
73
Anthropic今日宣布全面提升Claude系列产品的使用限制。具体措施包括:将Claude Code在Pro、Max、Team及按席位计费的企业版计划中的5小时使用时长限制提升一倍;取消Pro和Max计划在高峰时段对Claude Code的限制削减;并大幅提高Opus模型的API速率限制。公司表示,此次调整主要得益于与SpaceX达成的合作伙伴关系以及其他近期算力协议,这些合作显著增加了Anthropic的计算容量,从而使其能够提升Claude Code和Claude API的服务上限。

Claude: We've agreed to a partnership with @SpaceX that will substantially increase our compute capacity. This, along with our o...

智能体Anthropic产品更新编码
‹ 上一页
1…47484950
下一页 ›