AIHOT

精选全部 AI 动态 AI 日报 Agent 接入关于更新日志反馈信源提报

精选全部日报更多

全部动态X · 1974 条

全部一手资讯 X 论文

Perplexity@perplexity_ai · 5月14日54

Computer is secure by default. Every task runs in its own hardware-isolated sandbox with VPC-level storage and compute separation. Agents are authenticated with short-lived proxy tokens instead of raw API keys.

译计算机默认处于安全状态。每项任务都在其自身硬件隔离的沙箱中运行，并具备VPC级别的存储与计算分离。代理通过短期代理令牌进行身份验证，而非使用原始API密钥。

🚨 AI News | TestingCatalog@testingcatalog · 5月14日58

holaOS has shipped its beta 0.1 release, adding a management layer on top of its Agent Computer foundation: a Dashboard, Sub Agents, and Multi Workspaces. Each workstream gets its own isolated context, memory, and agent. No need to have a reset between sessions. The whole workflow shifts towards managing several ongoing workstreams in parallel.

译holaOS 已发布其 beta 0.1 版本，在其 Agent Computer 基础上新增管理层：仪表板、子代理与多工作区。每个工作流都拥有独立的上下文、记忆和代理。无需在会话之间重置。整个工作流程转向并行管理多个进行中的工作流。

Runway@runwayml · 5月14日65

Meet Runway Agent. Your new AI creative partner that helps you ideate and execute fully finished, sound designed and edited videos. All with just a simple conversation. From ads to shorts to content for social, Runway Agent makes it easy to make more of what you need. Get started on web at the link below.

译认识Runway Agent。您的新AI创意伙伴，帮助您构思并制作完整的、经过音效设计和剪辑的视频。一切只需简单的对话。从广告到短片再到社交媒体内容，Runway Agent让您轻松制作更多所需内容。点击下方链接在网页版开始体验。

Chubby♨️@kimmonismus · 5月13日42

what the heck, openai is cooking - ultrafast mode incoming probably this thursday - + an update to the new image model thats already freaking good openai has such a run lately, love it

译什么情况，OpenAI正在酝酿大动作 - 超高速模式可能本周四上线 - 外加对已足够惊艳的新图像模型的更新 OpenAI近期动作不断，太棒了

PixVerse@PixVerse_ · 5月13日57

Caught in 4K eating a hot dog at the baseball game The Korean baseball trend is now on Pixverse web Use the Pixverse K-Baseball Sprint template and make yours now!

译棒球比赛吃热狗被4K镜头捕捉韩国棒球热潮现已登陆Pixverse网页端使用Pixverse的K-Baseball Sprint模板，立即创作你的作品吧！

Perplexity@perplexity_ai · 5月13日36

PayPal runs 74,000 weekly tasks in Perplexity Enterprise. Teams use it for model validation, channel performance, market trend research, competitive intelligence, and product analysis. Read the customer story: https://www.perplexity.ai/enterprise/customers/paypal

译PayPal每周在Perplexity Enterprise平台运行74,000项任务。团队将其用于模型验证、渠道绩效、市场趋势研究、竞争情报和产品分析。阅读客户案例：https://www.perplexity.ai/enterprise/customers/paypal

🚨 AI News | TestingCatalog@testingcatalog · 5月13日49

Anthropic is testing a new model selector for Claude on mobile, moving it directly to the prompt area. > Bottom navigation tabs are being tested as well. > Connectors Discovery is coming to mobile too, where Claude will suggest the best connector for a given task.

译Anthropic正在移动端测试Claude的新模型选择器，将其直接移至提示区域。 > 底部导航标签页也在测试中。 > Connectors Discovery功能即将登陆移动端，Claude将根据任务推荐最佳连接器。

Suno@suno · 5月13日61

Suno is now on Apple CarPlay and Android Auto🚗 Stream your favorite creations in the car. Try it out on your morning commute with this playlist! https://suno.com/playlist/a255cf6d-bb99-4c1f-aedd-8d584579bddb

译Suno 现在可在 Apple CarPlay 和 Android Auto 上使用🚗 在车里流媒体播放您最喜欢的创作。在早晨通勤时用这个播放列表试试看！ https://suno.com/playlist/a255cf6d-bb99-4c1f-aedd-8d584579bddb

🚨 AI News | TestingCatalog@testingcatalog · 5月13日55

thehype radio is now live: a 24/7 AI-run news station built for founders and builders, with five AI hosts carrying real editorial judgment, memory, and distinct opinions. Not a headline reader on loop. Breaking news within minutes, roundups every 30 min, and a startup funding radar. > GitHub, OpenRouter, and HuggingFace trends on the hour > Community takes from X and HN > Music between segments 👀

译thehype radio是一个专为创业者和建设者设计的24/7全天候AI电台。它并非简单的新闻播报循环，而是由五位具备独立编辑判断力、记忆和鲜明个性的AI主播实时运作。电台内容涵盖分钟级的突发新闻、每半小时的新闻综述与AI工具趋势更新，并追踪初创公司融资动态。同时，它整合来自X和Hacker News的社区观点，并在节目间隙播放环境音乐。其核心在于AI主播能主动收集信息模式、发现矛盾、形成并论证观点，旨在从海量信息中提炼出具有洞察力的内容，帮助听众高效获取关键信息。

Rohan Paul@rohanpaul_ai · 5月13日60

The first fully AI-run radio station on X is now broadcasting AI news 24/7 for builders and founders. It tracks live signals from GitHub, HuggingFace, OpenRouter, X, HN, and YouTube, then turns those scattered updates into a 24/7 AI radio feed that tells builders what is actually moving in AI. Its AI hosts are not just voice wrappers over headlines, because they carry memory, editorial judgment, and distinct viewpoints. That makes the hard part signal ranking, not speech generation, since the system has to decide which GitHub repo, OpenRouter move, HuggingFace release, founder post, or HN debate actually deserves attention.

译X平台推出了首个完全由AI运营的电台，全天候为AI构建者和创始人播报新闻。该电台实时追踪GitHub、HuggingFace等多个平台的动态，将分散信息整合成连续音频流。其核心挑战在于信息排序而非语音生成，系统需判断哪些代码更新、模型发布或社区讨论值得关注。电台拥有五位具备编辑判断力、记忆和个性的AI主播，他们不仅能播报信息，还会识别模式、发现矛盾并论证观点。内容涵盖突发新闻、工具趋势、融资动态及社区观点，旨在帮助用户高效把握AI领域重要动向。

Chubby♨️@kimmonismus · 5月13日74

Online radio fully run by AI. Covers AI news 24/7, always on. Designed for builders and founders. Tune in - hit play - do your thing. Breaking news, data, analysis, opinions, community discussion — delivered nonstop. With non-distracting music between segments. What you'll hear any hour you tune in: → breaking news within minutes → roundups every 30 min — top stories with builder context → startup funding & traction radar → what's moving and trending in AI tooling — GitHub, OpenRouter, HuggingFace — every 30 min → community — what people actually say on X, HN, YouTube → editorial takes — and real opinions from founders, researchers, builders → patterns others miss, delivered as arguments with conclusions Five AI hosts. Each with their own editorial judgment, memory, and personality. They don't just read data — they collect patterns, find contradictions, form opinions, and argue their point. And they do it live, continuously, on air.

译全球首个完全由AI运营的在线广播电台在X平台正式开播，专为创业者、开发者和建设者提供全天候AI领域资讯。该电台由五名具备独立编辑判断、记忆和个性的AI主播主持，不仅能实时播报几分钟内的突发新闻，还提供每30分钟一次的新闻综述、初创公司融资追踪、GitHub等平台的工具趋势分析，并整合社区讨论与行业真实观点。AI主播会主动收集信息模式、发现矛盾并形成论点进行实时辩论，而非单纯播报数据。节目辅以非干扰性环境音乐，旨在让听众在背景收听中高效获取深度行业洞察。

Kling AI@Kling_ai · 5月13日17

The stadium broadcast view is taking over the football trend! Create your own stunning football moments effortlessly with Kling AI. If you’re interested, just comment 🙌🏻 below and we’ll share the full prompt in the comments.

译球场直播视角正在席卷足球潮流！用Kling AI轻松创造属于你自己的惊艳足球瞬间。感兴趣的话，只需在下方评论🙌🏻，我们将在评论区分享完整提示词。

Baidu Inc.@Baidu_Inc · 5月13日73

The Miaoda App and Miaoda Enterprise Edition are here, giving more builders and businesses access to our coding agent! And the most interesting detail? 90% of Miaoda App's code was generated by Miaoda itself. Coding agents are making on-demand, purpose-built software commercially viable. To date, Miaoda-generated apps have served 10M+ users, with total application value reaching RMB 5B.

译Miaoda应用和Miaoda企业版现已发布，让更多开发者和企业能够使用我们的编程助手！最有趣的细节是什么？Miaoda应用90%的代码由Miaoda自身生成。编程助手正使按需定制软件具备商业可行性。截至目前，Miaoda生成的应用已服务超1000万用户，应用总价值达50亿元人民币。

PixVerse@PixVerse_ · 5月13日38

This trend is so fun！You can make your own sports cam trend on PixVerse now

译这个趋势真有趣！现在你可以在PixVerse制作自己的运动镜头趋势了

PixVerse@PixVerse_ · 5月13日18

Meow is NOT missing a second of the game

译Meow 一秒都没有错过比赛

Kling AI@Kling_ai · 5月13日10

Broadcast trend made with Kling AI, now go make yours. 🔥

译用Kling AI制作的广播趋势，现在去创造你的吧。🔥

Alibaba Cloud@alibaba_cloud · 5月13日55

What if AI characters could remember, empathize & proactively engage? ✨ The future of interactive AI is here. Whether you're building for games, virtual AI companions, or adaptive learning, Qwen-Character powers immersive role-play experiences that drive 50%+ deeper engagement and boost user LTV 👉 See how it works in the full video: https://int.alibabacloud.com/m/1000412855/ #AlibabaCloud #Qwen #QwenCharacter #ModelStudio #AI

译如果AI角色能够记忆、共情并主动交互会怎样？✨ 互动AI的未来已来。无论您是为游戏、虚拟AI伴侣还是自适应学习进行开发，Qwen-Character都能提供沉浸式角色扮演体验，推动参与度加深50%以上并提升用户生命周期价值 👉 观看完整视频了解运作原理：https://int.alibabacloud.com/m/1000412855/ #AlibabaCloud #Qwen #QwenCharacter #ModelStudio #AI

Berryxia.AI@berryxia · 5月13日60

一起来看看大模型的IQ和EQ排名😂 大家还在疯狂卷参数、卷基准分数的时候，有人直接给AI模型打起了IQ分。 AIIQ. org 刚刚上线，把流行大模型全部拉出来，用真实基准数据智能估算IQ和EQ，还做了IQ vs 成本、IQ vs EQ、3D性价比对比图，清晰到离谱。它把12个硬核基准分成抽象、数学、编程、学术四个维度，保守填补缺失数据，最后给出标准正态分布上的IQ分数。 EQ也用EQ-Bench和Arena Elo加权计算，甚至对Anthropic模型做了200分惩罚。这已经不是简单的“谁更强”排行榜，而是真正开始用人类智力标准去衡量AI的时代。真正拉开差距的，从来不是谁的参数最大，而是谁先学会用更聪明的方式去评估和选择模型。网站👉 https://www.aiiq.org

译AIIQ.org网站上线，通过12个基准测试在抽象、数学、编程和学术四个维度评估流行大模型，智能估算其IQ分数。EQ由EQ-Bench和Arena Elo加权计算，并对Anthropic模型施加200分惩罚。网站提供IQ与成本、EQ的对比图及3D分析，以人类智力标准衡量AI综合能力。

歸藏(guizang.ai)@op7418 · 5月13日62

谷歌昨天安卓 I/O 大会最大的跟 AI 相关的发布，是发布了 Gemini Intelligence 会先在三星 Galaxy 和 Pixel 手机上推出，后面会拓展到其他所有类型的安卓设备。具体功能上，首先它可以帮你自动完成在多个 App 上操作的繁琐任务，而且可以跨多个软件去操作。比如你备忘录里有一堆购物清单，然后你可以让它直接把这些清单加到购物车里。安卓的 Chrome 浏览器可以自动帮你操作浏览器去检索内容和总结内容，也可以帮你填写表单之类的。他们在新推出了一个语音输入功能，叫 Rambler，它可以自动将你的口语转换成文本语言，去掉一些语气词并重新排版，而且支持多语言混用。最显眼的是它支持你通过自然语言去生成你想要的任何桌面小组件。比如说你可以让它生成一个每周推荐食谱的小组件，它就会自定义 AI 帮你生成，然后固定到你的桌面上。或者说你只关心某些天气的属性，比如说风速和降雨，然后它就会自动生成一个只有这些数据的桌面组件。这个功能我在去年六七月的时候跟一个 AI 创业者提过，结果到现在谷歌自己出了。而且他们这次还发布了 Material 3 Expressive 的设计语言，跟苹果的液态玻璃区别挺大的。它会在没有交互的时候是实体的边界，非常明显的分隔线，就是组件边界。在 AI 开始交互的时候，组件的边界会发生虚化和高斯模糊，非常的漂亮。

译谷歌在I/O大会上发布Gemini Intelligence，将AI深度集成至安卓系统。该功能将率先登陆三星Galaxy和Pixel手机，并逐步覆盖所有安卓设备。其核心能力包括跨应用自动执行复杂任务（如在备忘录与购物应用间同步清单），以及使Chrome浏览器能自动检索、总结内容及填写表单。新推出的Rambler语音输入功能可将口语转化为精炼文本，并支持多语言混用。用户还能通过自然语言指令生成个性化桌面小组件，如定制食谱或特定天气数据组件。此外，全新的Material 3 Expressive设计语言会在AI交互时使组件边界呈现虚化与模糊效果，提升视觉体验。

Tibo@thsottiaux · 5月13日76

In app browser improvements in Codex app. Different viewports, screenshots viewing, better annotations and more token efficient. Happy quality of life improvements Tuesday.

译Codex应用内浏览器功能迎来多项改进，支持在不同视口尺寸下测试应用，并能控制设备工具栏、在不同断点进行点击验证。长时测试中，Codex会在关键节点截图供用户核查。为加速测试，可隐藏应用内浏览器以禁用动画，使测试速度提升1-2倍。此外，标注功能现在发送更快且消耗更少tokens。

OpenRouter@OpenRouter · 5月13日65

Opus 4.7 fast mode is live on OpenRouter! Just set your model to `anthropic/claude-opus-4.7-fast` Full Opus 4.7 intelligence with ~2.5x faster throughput

译Opus 4.7 快速模式已在 OpenRouter 上线！只需将您的模型设置为 `anthropic/claude-opus-4.7-fast` 具备完整的 Opus 4.7 智能，吞吐量提升约 2.5 倍

Tibo@thsottiaux · 5月13日32

Thanks for all the input, what we'll do going forward for Codex updates - Tue: Quality and polish - Thu: Big launches (starting this Thu) - Fri: Fun stuff, little extra

译感谢所有反馈，以下是Codex未来的更新安排 - 周二：质量优化与完善 - 周四：重大发布（本周四开始） - 周五：趣味内容与小惊喜

ginobefun@hongming731 · 5月13日76

Codex 的 computer use 演示视频：OpenAI 展示新的 AI 队友能力 OpenAI 为 Codex 引入了 Computer Use 能力，让这个 Agent 从操作代码文件，扩展到操作本地 GUI 应用。这个挺值得关注的：AI Agent 的行动空间，延伸到了开发者日常使用的所有桌面软件。这次演示最突出的一个设计决策，是 Codex 拥有自己的独立光标。它在后台运行，不会接管用户的鼠标或键盘，用户可以继续自己的工作，同时 Codex 在旁边完成配置虚拟机、播放 Spotify、添加日历提醒等任务。过去的 GUI 自动化工具通常会独占整个显示器，这个设计让 AI 助手真正成为并行工作的「队友」而不是「接手者」。技术架构采用了两种模态的混合方案。视觉模态通过截图让模型「看见」界面，以坐标为单位点击；无障碍框架则通过系统 API 提取 UI 元素的文字描述，包括当前滚动出屏幕的内容。对速度敏感的任务，Spark 模型只依赖无障碍数据而不做图像处理，可以达到「超人速度」完成消息发送或调试操作。安全层面，Codex 采用了逐应用的权限授权机制。在用户明确允许之前，Codex 对任何应用都完全不可见，无法访问、无法操作。这个设计让敏感数据的隐私得到了结构性保护。目前 Computer Use for Codex 已在 Mac 上可用，Windows 支持即将推出。 https://youtu.be/D_FCYsshMI4

译OpenAI为Codex引入Computer Use能力，使其从操作代码扩展到本地GUI应用。Codex拥有独立光标，不接管用户输入，允许用户并行工作。技术架构混合视觉模态截图和无障碍框架API，Spark模型依赖无障碍数据加速任务执行。安全层面采用逐应用权限授权，在用户允许前无法访问任何应用，保护隐私。目前该功能已在Mac上可用，Windows支持即将推出。

Alibaba Cloud@alibaba_cloud · 5月13日65

The future of AI is agent-native. Excited to kick off this journey together with Hermes Agent and the @NousResearch community. Qwen 3.6 Plus is now FREE for a limited time on Nous Portal — give it a try. ⚡

译AI的未来是智能体原生的。很高兴能与Hermes Agent及@NousResearch社区共同开启这段旅程。 Qwen 3.6 Plus现于Nous Portal限时免费——快来尝试吧。⚡

Berryxia.AI@berryxia · 5月13日69

终于看到了点Google的新东西啊！就在昨晚👇🏻 Google DeepMind 把 50 年鼠标指针彻底 AI 化了实验演示：用户现在用手势 + 语音 + 自然简写，直接在屏幕任意位置指挥 Gemini，无需切换 App 或写长 prompt。体验入口：Google AI Studio ：（http://aistudio.google.com/apps/bundled/ai-pointer-create 和 ai-pointer-find），已集成 Chrome Gemini，未来或进 Googlebook。核心能力拆解： • 指向 PDF 说“生成邮件 bullet points” → 即时输出要点 • 悬停表格说“转成 pie chart” → 自动可视化 • 高亮食谱说“double these ingredients” → 食材翻倍 • 指向涂鸦笔记说“转成 to-do list” 或视频帧说“生成 booking link” 技术细节：Gemini 多模态驱动，指针实时“看见”光标下文字/图片/代码块语义内容，结合 gesture（point/hover）+ speech + shorthand 实现上下文理解。把 pixels 转成 actionable entities，无需精确指令，模型自动懂“This/That”意图。输出直接作用当前界面。对 Agent 开发者、UI 设计师和 Gemini 重度用户最友好，标志交互范式从“坐标”到“意图”的升级。

译Google DeepMind近日发布了一项创新功能，将传统鼠标指针AI化。用户可通过手势（如指向、悬停）、语音及自然简写，在屏幕任意位置直接指挥Gemini模型，无需切换应用或编写复杂指令。该功能已集成于Google AI Studio和Chrome Gemini，能实时识别光标下的文字、图片、代码等内容语义，结合上下文理解用户意图，实现如将PDF内容转为邮件要点、表格转为图表等智能操作。这标志着人机交互从基于“坐标”的操控向基于“意图”的理解迈出了重要一步，尤其便于Agent开发者、UI设计师等用户提升效率。

Berryxia.AI@berryxia · 5月13日18

A 社把这玩意会带火么，反正是我买的那家淘宝店已经下架说断货了。非常适合做活动和给中小学生做点编程有意思的东西玩，也不贵200块钱。 DIY 和可玩性也是非常高的~~！ 😄

Berryxia.AI@berryxia · 5月13日61

这不得个榨干CC的最后一滴血啊！何让 Claude 持续工作直到任务完成？ Claude Code 通过几种方式帮助实现这一点，包括最近推出的一个功能：/goal。一行命令即可让它把所有活干完，都不需要别的指令！

译Claude Code推出/goal功能，允许用户通过一行命令让Claude持续工作直至任务完成，无需额外指令。该功能旨在实现开发任务的自动化，减少人工干预，提高工作效率。

Berryxia.AI@berryxia · 5月13日56

兄弟们！ Meta 今天把实时语音 + 视觉 AI 直接干成了！ Muse Spark 驱动的 Meta AI Voice Conversations：！可以打断、换话题、边聊边生成图、拉内容，还支持实时看世界问问题（相机对准就行）。马上就要上 Ray-Ban Meta 眼镜了！

译Meta发布了由Muse Spark驱动的Meta AI Voice Conversations，实现实时语音与视觉交互。该功能支持打断对话、切换话题，在聊天过程中生成图像和拉取内容，并能通过相机对准现实世界进行实时视觉问答。这一技术即将集成到Ray-Ban Meta智能眼镜中，提升穿戴设备的AI体验。

Berryxia.AI@berryxia · 5月13日74

牛逼！Browser Use 今天把“AI agent 即用即走”做到了极致。 BuxFather：Telegram 里直接 Spin up agent，无需任何注册付费，24/7 自主运行 + 自改进，还带 stealth browser。几下点击就有完整电脑 + 浏览器环境。这波对重度 Telegram 用户来说真的爽了！ https://x.com/browser_use/status/2054330495249564094/video/1

meng shao@shao__meng · 5月13日65

Claude Opus 4.7 "Fast Mode" 在 Claude Code 和 Claude API 里都可用了另外在 Cursor、Emergent、Factory Droid、v0、Warp 和 Windsurf 也可以用 Fast Mode：2.5x 速度，速度更爽，用起来可能就回不到 1x 的慢速了；但是。。6x 价格，好吧，我还是用慢速吧慢即是快 😂

meng shao@shao__meng · 5月13日65

Gemini Intelligence 登陆 Android Google 不再把 Android 仅描述为承载 App 的平台，而是定位为主动型 AI 系统：自动化任务、智能浏览、智能填表、口语成稿、生成式 widget。设备会"先你一步"完成事务，而非被动等待指令。 https://blog.google/products-and-platforms/platforms/android/gemini-intelligence/ 新能力以软硬件深度绑定的方式发布： · 首发设备：今年夏季登陆最新 Samsung Galaxy 与 Google Pixel 手机。 · 后续扩展：年内陆续覆盖 Wear OS 手表、Android Auto、智能眼镜、笔记本。 # 五大核心能力 1. 跨 App 多步任务自动化（App Automation） · 已在 Galaxy S26 与 Pixel 10 上对外卖、打车类 App 做了数月调优。 · 典型场景：抢动感单车前排座位；从 Gmail 找出课程大纲后自动把教材加入购物车。 · 视觉上下文加成：长按电源键即可让 Gemini 读取屏幕内容（例如把笔记里的购物清单一键变成下单），或拍下酒店宣传册说"在 Expedia 找 6 人团类似行程"。 · 控制权设计：仅在用户指令下执行，任务完成即停止，最终下单需用户确认。 2. Chrome 内的 Gemini（6 月下旬上线） · 浏览器助手负责研究、摘要、跨页对比。 · Chrome auto browse 可代办预约、车位预订等流程化操作。 3. 升级版 Autofill（Personal Intelligence 驱动） · 自动填写从"基础便利"升级为"理解上下文"——可跨应用调用相关信息填表，覆盖 Chrome。 · 严格 opt-in：用户主动连接 Gemini，设置中随时可断开。 4. Rambler——语音转"成稿" · 解决 Gboard 语音输入的痛点：口语中的"嗯/啊/重复"。 · 用 Gemini 抓取重点，整理为简洁书面表达。 · 多语种混说：支持单条消息内英语+印地语等混合切换，理解语境。 · 隐私：开启时有明确指示，音频仅实时转写、不存储。 5. Create My Widget——生成式 UI 第一步 · 用自然语言描述即可生成自定义 widget，并可在主屏调整尺寸。 · 例：每周自动生成 3 道高蛋白备餐食谱的 dashboard；只显示风速和降雨的天气卡。 · 同步覆盖 Wear OS 手表。

译Google将Android重新定位为主动型AI系统，推出Gemini Intelligence。其核心在于深度软硬件结合，首发于三星Galaxy和Google Pixel手机，后续将扩展至手表、汽车等设备。五大核心能力包括：跨应用多步骤任务自动化、Chrome浏览器内的智能研究与代办、基于上下文理解的智能填表、将口语实时整理成书面稿的“Rambler”功能，以及用自然语言生成自定义主屏幕Widget。这些功能均在用户指令下执行，并注重隐私与控制权。

meng shao@shao__meng · 5月13日71

Google 正式发布 Googlebook，第一款专门为 Gemini Intelligence 设计的笔记本，还有朋友记得很多年前的 Chromebook 吗 😂 Googlebook 融合了 Android（Google Play 应用生态 + 面向 AI 设计的现代 OS）与 ChromeOS（Chrome 浏览器）。15 年前 Chromebook 是为"云优先"时代而生；Googlebook 则是为"AI 优先"时代而生。 https://blog.google/products-and-platforms/platforms/android/meet-googlebook # 三大产品支柱 1. Magic Pointer（与 Google DeepMind 合作）把"光标"——电脑上使用频率最高、却几十年未变（上次大变化是加入右键）的交互元素——重新设计为 AI 入口。 · 抖动光标即可唤出 Gemini 的上下文建议 · 指向邮件中的日期 → 直接创建会议 · 选中"客厅照片 + 新沙发图" → 立刻合成可视化效果这是把 AI 从"独立聊天框"下沉到系统级指针交互，降低使用门槛。 2. Create Your Widget 通过自然语言提示生成自定义小组件，Gemini 可接入 Gmail、Calendar 等 Google 应用并联网，把一类任务（如"柏林家庭聚会"的航班、酒店、餐厅、倒计时）聚合成单一仪表盘。将"桌面"从静态图标列表升级为任务驱动的动态信息中枢。 3. Android 生态深度互通 · 手机 App 直接在笔记本上调用（如下单外卖、完成 Duolingo 课程） · Quick Access：在文件浏览器中直接查看、搜索、插入手机文件，无需传输对标 Apple 的 Continuity 生态，弥补 Google 多年以来手机与笔电协同的短板。

译Google 正式推出首款为 Gemini Intelligence 设计的笔记本 Googlebook，标志着从“云优先”的 Chromebook 时代进入“AI 优先”新阶段。其核心创新包括：Magic Pointer 将系统光标变为 AI 交互入口，可直接触发上下文建议与任务；Create Your Widget 允许通过自然语言生成聚合多源信息的动态桌面小组件；深度整合 Android 生态，实现手机 App 无缝调用与文件跨设备快速访问。该产品以 Gemini 为核心，旨在将 AI 能力下沉至系统级交互，降低使用门槛，并强化跨设备协同体验。

小互@xiaohu · 5月13日59

Google发布 Gemini Intelligence 把 Gemini 从“聊天机器人”，彻底升级成 Android 的“系统级大脑” 它更像 Google 对下一代 Android 的总架构定义：过去 Android 是：“App + 系统” 现在开始变成：“AI 理解层 + 系统 + App” Gemini 开始主动理解： • 你正在做什么 • 你可能想做什么 • 哪些 App 可以协同 • 下一步应该自动完成什么 Google 官方甚至直接用了：“proactive AI features”。也就是：主动式 AI。以前的手机逻辑，本质上还是“人操作 App”。你需要自己打开软件、复制信息、切换页面、一步一步完成任务。现在 Google 想做的，是让 AI 直接理解你正在做什么，然后替你跨 App 执行。

译Google将Gemini从聊天机器人升级为Android的“系统级大脑”，重新定义了下一代Android的架构。新架构从过去的“App + 系统”转变为“AI理解层 + 系统 + App”。Gemini作为主动式AI，能主动理解用户当前行为、潜在意图、可协同的App，并自动执行下一步任务。其核心目标是改变“人操作App”的传统手机逻辑，让AI直接理解用户意图并实现跨App的自动执行。

Satya Nadella@satyanadella · 5月13日68

Our new multi-model agentic security system brings together more than 100 specialized agents across frontier and custom models to find exploitable bugs, delivering top performance on the CyberGym benchmark. We used it ahead of Patch Tuesday to help find and fix 16 vulnerabilities. Today we’re announcing that customers can sign up to test it in private preview. https://www.microsoft.com/en-us/security/blog/2026/05/12/defense-at-ai-speed-microsofts-new-multi-model-agentic-security-system-tops-leading-industry-benchmark/?v=1

译微软推出新型多模型智能体安全系统，整合了超过100个基于前沿和定制模型的专用智能体，用于发现可利用的安全漏洞。该系统在CyberGym基准测试中取得了顶级性能。在最近的Patch Tuesday之前，该系统已帮助发现并修复了16个漏洞。微软宣布客户现可申请加入该系统的私有预览测试。

Luma@LumaLabsAI · 5月13日46

Some moments only come once a year. Make sure your campaign is ready when they do. Define the season. Set the direction. Luma Agents build every campaign visual from there. Hero imagery, social assets, and everything in between. All consistent, all on time. Own the moment → http://lumalabs.ai/app

译有些时刻一年仅有一次。当它们来临时，请确保你的营销活动已准备就绪。定义营销季，设定方向。 Luma Agents 由此构建所有营销视觉素材。主视觉图、社交媒体素材，以及其间的一切。全部保持一致性，全部准时完成。把握关键时刻 → http://lumalabs.ai/app

ClaudeDevs@ClaudeDevs · 5月13日69

How do you keep Claude working until the job is done? Claude Code helps with this in a few ways, including one we shipped recently: /goal.

译如何让Claude持续工作直至任务完成？Claude Code通过几种方式提供帮助，包括我们最近推出的功能：/goal。

小互@xiaohu · 5月13日60

Google 刚刚发布了一个新东西：Googlebook 根据Google 自己的表述：他们想做的已经不再是传统意义上的“操作系统”，而是一个以 Gemini 为核心的 AI Laptop 平台。 Gemini 被塞进了“鼠标指针”：你晃一下光标，它会主动理解你当前屏幕内容，然后直接给动作建议。比如： • 指向邮件里的日期 → 自动创建会议 • 选两张图 → 自动生成搭配效果 • 指向内容 → 自动总结 / 改写 / 操作这其实已经不是传统 OS 思维了。以前电脑逻辑：人打开 App → 人操作功能。现在开始变成： AI 理解上下文 → AI 主动组织操作。

译Google推出新平台Googlebook，这是一个以Gemini AI为核心的笔记本电脑系统，旨在超越传统操作系统概念。Gemini被集成到鼠标指针中，能主动理解用户当前屏幕内容，并提供智能动作建议，如自动创建会议、生成图像搭配效果或总结改写内容。这标志着电脑操作逻辑的根本转变：从用户手动打开应用执行功能，变为AI基于上下文主动组织并执行操作，体现了向AI驱动平台的演进。

宝玉@dotey · 5月13日65

Anthropic 今天正式上线了一个叫做「Claude for Legal」的仓库，一口气放出了 12 个针对具体法律岗位的插件，以及超过 20 个连接行业常用软件的 MCP 连接器。无论你是公司法务、打并购战的律所、专注隐私和 AI 治理的法律顾问，还是每天苦熬到半夜的诉讼律师，甚至是法学院里摸爬滚打的学生，这个仓库都给你准备好了对应的 AI 工具，直接在 GitHub 上开源了：http://github.com/anthropics/claude-for-legal。这些插件用之前不是即插即用，你得花 10 到 20 分钟，带着 Claude 做个简单的“冷启动访谈”，把你团队的 playbook、模板和风格习惯都塞进一个叫 CLAUDE.md 的本地文件。这样，以后每个插件干活儿的时候，都自动按照你自家的风格和标准来。 Anthropic 这么搞，是为了彻底解决 AI 法律工具最常见的槽点：输出内容太通用，看起来不像哪家律所自己的东西。 Anthropic 还是挺懂律所的痛点的。比如 Vendor Agreement Reviewer 插件，它能自动对照你家合同模板改供应商协议，还贴心地输出一份 redline 备忘录；又比如 NDA Triager，帮你自动把涌进来的 NDA 文件按绿黄红分级，绿灯放行、红灯直接推律师处理； Claim Chart Builder 插件可以一键生成专利侵权对比表； Privilege Log Reviewer 自动帮你跑第一轮特权日志审查；而 Docket Watcher 插件则不知疲倦地盯着法院动静，帮你把最新动态实时扫进来。简单讲，就是把律所里最烦、最机械、最浪费人力的活，变成了一个个简单的 slash command。如果说插件解决的是律所内部效率问题，那么对行业系统的深度接入才真正体现 Anthropic 的野心。现在，Thomson Reuters 的 CoCounsel、Harvey，还有 iManage、NetDocuments、Ironclad、DocuSign、Everlaw、Relativity、Box、Datasite 等几乎所有你能叫得上名字的平台，全都接入了官方 MCP 连接器。日常办公的 Word、Excel、Outlook、PPT 也全线打通。合同改完后，Claude 甚至会直接输出成 Word 修订模式，律师一条条接受或拒绝就行。 Anthropic 不只是把目光停留在高端律所。他们还特意做了些更「接地气」的事儿，联合 Free Law Project 和 Justice Technology Association，给法律援助机构、公设辩护人、非营利法律组织推出特别折扣，连给普通当事人设计的 Courtroom5 工具也接进来了。这点挺让人感触的，因为美国大约八成民事诉讼里的原被告，根本请不起律师。 Claude for Legal 背后的大脑是刚升级的 Claude Opus 4.7 模型。Anthropic 很谨慎地强调：所有插件输出都是“仅供律师审阅的草稿”，绝对不能替代律师的专业判断。 README 文件里反复提醒：引用必须追踪来源，涉及特权和主观法律判断时，要默认保守处理。毕竟法律这件事，AI 还是不能完全代替专业律师。官方博客：https://claude.com/blog/claude-for-the-legal-industry

译Anthropic正式开源“Claude for Legal”项目，针对法律行业推出12个具体岗位的AI插件和超过20个连接行业常用软件的MCP连接器。用户通过简短的“冷启动访谈”定制本地CLAUDE.md文件，使插件能遵循团队特定的风格与标准，解决AI法律工具输出内容过于通用的问题。插件功能覆盖合同审阅、NDA分级、专利侵权对比表生成等重复性工作，并深度集成Thomson Reuters CoCounsel、iManage、DocuSign等主流平台。项目基于Claude Opus 4.7模型，但强调所有输出仅为律师审阅的草稿，不能替代专业法律判断。

Demis Hassabis@demishassabis · 5月13日81

Really cool work from the team reimagining the mouse pointer to be intelligent! Try the prototype in @GoogleAIStudio it's pretty magical.

译团队正在用AI重新构想鼠标指针，成果非常酷！在@GoogleAIStudio尝试原型版本，体验相当神奇。 [引用 @GoogleDeepMind]：我们正用AI重新构想这个存在50年的界面——鼠标指针。🖱️ 这些实验演示展示了人们如何通过动作、语音和自然简写，在屏幕上直观操控Gemini完成任务🧵

🚨 AI News | TestingCatalog@testingcatalog · 5月13日63

META 🔥: Muse Spark will be available within a new Voice Mode and a Live Camera view on the Meta AI app. There, it can generate images, show places on the map, pull data from Reels, and more. Additionally, new features were added to Shopping Mode, including the ability to search Facebook Marketplace. > Muse Spark is starting to gradually roll out on Ray-Ban Meta and Oakley Meta glasses in the US and Canada over the next few weeks, and on Meta Ray-Ban Display this summer. > Muse Spark is starting to bring the same intelligence to Meta AI across WhatsApp, Instagram, Facebook, Messenger, and Threads — in places like search bars, group chats, posts, and more.

译Meta宣布推出由Muse Spark驱动的AI语音对话功能，支持自然语言交流、实时生成图像及从Reels、地图等多源获取信息。该功能将整合至Meta AI应用的新语音模式和实时摄像头视图中，用户可通过摄像头对现实世界进行实时问答。购物模式新增了搜索Facebook Marketplace等能力。Muse Spark将逐步在Ray-Ban Meta等智能眼镜上于美加推出，并于今夏登陆Meta Ray-Ban Display，其智能能力也将扩展至WhatsApp、Instagram等全平台的多类场景中。

全部 AI 动态

AI 相关资讯全量信息流

全部一手信源资讯推文

全部模型产品行业论文技巧

5月14日

01:13

Perplexity@perplexity_ai

54

计算机默认处于安全状态。每项任务都在其自身硬件隔离的沙箱中运行，并具备VPC级别的存储与计算分离。代理通过短期代理令牌进行身份验证，而非使用原始API密钥。

智能体产品更新安全/对齐

00:36

🚨 AI News | TestingCatalog@testingcatalog

58

holaOS 已发布其 beta 0.1 版本，在其 Agent Computer 基础上新增管理层：仪表板、子代理与多工作区。每个工作流都拥有独立的上下文、记忆和代理。无需在会话之间重置。整个工作流程转向并行管理多个进行中的工作流。

智能体产品更新

00:25

Runway@runwayml

65

认识Runway Agent。您的新AI创意伙伴，帮助您构思并制作完整的、经过音效设计和剪辑的视频。一切只需简单的对话。从广告到短片再到社交媒体内容，Runway Agent让您轻松制作更多所需内容。点击下方链接在网页版开始体验。

智能体产品更新多模态视频

关联讨论 1 条Runway：News（网页）

5月13日

23:59

Chubby♨️@kimmonismus

42

什么情况，OpenAI正在酝酿大动作 - 超高速模式可能本周四上线 - 外加对已足够惊艳的新图像模型的更新 OpenAI近期动作不断，太棒了

Chetaslua: 🚨new openai update mmm...... ahh... am i audible. Two more scoops if you missed them : >one more thing dont forget abou...

OpenAI产品更新图像生成

23:27

PixVerse@PixVerse_

57

棒球比赛吃热狗被4K镜头捕捉韩国棒球热潮现已登陆Pixverse网页端使用Pixverse的K-Baseball Sprint模板，立即创作你的作品吧！

产品更新图像生成视频

23:13

Perplexity@perplexity_ai

36

PayPal每周在Perplexity Enterprise平台运行74，000项任务。团队将其用于模型验证、渠道绩效、市场趋势研究、竞争情报和产品分析。阅读客户案例：https：//www.perplexity.ai/enterprise/customers/paypal

行业动态

23:06

🚨 AI News | TestingCatalog@testingcatalog

49

Anthropic正在移动端测试Claude的新模型选择器，将其直接移至提示区域。 &gt；底部导航标签页也在测试中。 &gt； Connectors Discovery功能即将登陆移动端，Claude将根据任务推荐最佳连接器。

Anthropic产品更新

22:57

Suno@suno

61

Suno 现在可在 Apple CarPlay 和 Android Auto 上使用🚗 在车里流媒体播放您最喜欢的创作。在早晨通勤时用这个播放列表试试看！ https：//suno.com/playlist/a255cf6d-bb99-4c1f-aedd-8d584579bddb

产品更新语音

22:36

🚨 AI News | TestingCatalog@testingcatalog

55

thehype radio是一个专为创业者和建设者设计的24/7全天候AI电台。它并非简单的新闻播报循环，而是由五位具备独立编辑判断力、记忆和鲜明个性的AI主播实时运作。电台内容涵盖分钟级的突发新闻、每半小时的新闻综述与AI工具趋势更新，并追踪初创公司融资动态。同时，它整合来自X和Hacker News的社区观点，并在节目间隙播放环境音乐。其核心在于AI主播能主动收集信息模式、发现矛盾、形成并论证观点，旨在从海量信息中提炼出具有洞察力的内容，帮助听众高效获取关键信息。

thehype.: Meet the 1st radio on X fully run by AI. Covers AI news 24/7, always on. Designed for builders and founders. Live right ...

产品更新语音

22:34

Rohan Paul@rohanpaul_ai

60

X平台首开全AI运营电台，24小时播报AI动态

X平台推出了首个完全由AI运营的电台，全天候为AI构建者和创始人播报新闻。该电台实时追踪GitHub、HuggingFace等多个平台的动态，将分散信息整合成连续音频流。其核心挑战在于信息排序而非语音生成，系统需判断哪些代码更新、模型发布或社区讨论值得关注。电台拥有五位具备编辑判断力、记忆和个性的AI主播，他们不仅能播报信息，还会识别模式、发现矛盾并论证观点。内容涵盖突发新闻、工具趋势、融资动态及社区观点，旨在帮助用户高效把握AI领域重要动向。

thehype.: Meet the 1st radio on X fully run by AI. Covers AI news 24/7, always on. Designed for builders and founders. Live right ...

产品更新搜索语音

22:29

Chubby♨️@kimmonismus

74

全球首个全AI运营的在线广播电台上线，24小时不间断播报AI动态

全球首个完全由AI运营的在线广播电台在X平台正式开播，专为创业者、开发者和建设者提供全天候AI领域资讯。该电台由五名具备独立编辑判断、记忆和个性的AI主播主持，不仅能实时播报几分钟内的突发新闻，还提供每30分钟一次的新闻综述、初创公司融资追踪、GitHub等平台的工具趋势分析，并整合社区讨论与行业真实观点。AI主播会主动收集信息模式、发现矛盾并形成论点进行实时辩论，而非单纯播报数据。节目辅以非干扰性环境音乐，旨在让听众在背景收听中高效获取深度行业洞察。

thehype.: Meet the 1st radio on X fully run by AI. Covers AI news 24/7, always on. Designed for builders and founders. Live right ...

智能体产品更新语音

21:35

Kling AI@Kling_ai

17

球场直播视角正在席卷足球潮流！用Kling AI轻松创造属于你自己的惊艳足球瞬间。感兴趣的话，只需在下方评论🙌🏻，我们将在评论区分享完整提示词。

产品更新

18:58

Baidu Inc.@Baidu_Inc

73

Miaoda应用和Miaoda企业版现已发布，让更多开发者和企业能够使用我们的编程助手！最有趣的细节是什么？Miaoda应用90%的代码由Miaoda自身生成。编程助手正使按需定制软件具备商业可行性。截至目前，Miaoda生成的应用已服务超1000万用户，应用总价值达50亿元人民币。

智能体产品更新编码

17:57

PixVerse@PixVerse_

38

这个趋势真有趣！现在你可以在PixVerse制作自己的运动镜头趋势了

きゅにお@AI動画を楽しむ行けたら行くで来る率高い小学5年生は人造人間108号📦🚀⛑️: ちなみに、トレンドになってる観戦動画テンプレ⚾️⚽️ PixVerseにもあるからね? 好きな方でやってみて🙌 @PixVerse_ #PixVerse

产品更新视频

17:57

PixVerse@PixVerse_

18

Meow 一秒都没有错过比赛

Mr Das: Bro paid for the best seat in the stadium Created on @PixVerse_

其他视频

17:35

Kling AI@Kling_ai

10

用Kling AI制作的广播趋势，现在去创造你的吧。🔥

TRND: ترند " مقطع متداول " متداول: مشجعة مدريدية تلقى إعجابًا واسعًا بسبب جمالها 🤍🔥!

其他视频

16:00

Alibaba Cloud@alibaba_cloud

55

如果AI角色能够记忆、共情并主动交互会怎样？✨ 互动AI的未来已来。无论您是为游戏、虚拟AI伴侣还是自适应学习进行开发，Qwen-Character都能提供沉浸式角色扮演体验，推动参与度加深50%以上并提升用户生命周期价值 👉 观看完整视频了解运作原理：https：//int.alibabacloud.com/m/1000412855/ #AlibabaCloud #Qwen #QwenCharacter #ModelStudio #AI

智能体产品更新

14:50

Berryxia.AI@berryxia

60

大模型的IQ和EQ排名

AIIQ.org网站上线，通过12个基准测试在抽象、数学、编程和学术四个维度评估流行大模型，智能估算其IQ分数。EQ由EQ-Bench和Arena Elo加权计算，并对Anthropic模型施加200分惩罚。网站提供IQ与成本、EQ的对比图及3D分析，以人类智力标准衡量AI综合能力。

现象/趋势评测/基准

11:50

歸藏(guizang.ai)@op7418

62

谷歌发布Gemini Intelligence，深度整合AI于安卓系统

谷歌在I/O大会上发布Gemini Intelligence，将AI深度集成至安卓系统。该功能将率先登陆三星Galaxy和Pixel手机，并逐步覆盖所有安卓设备。其核心能力包括跨应用自动执行复杂任务（如在备忘录与购物应用间同步清单），以及使Chrome浏览器能自动检索、总结内容及填写表单。新推出的Rambler语音输入功能可将口语转化为精炼文本，并支持多语言混用。用户还能通过自然语言指令生成个性化桌面小组件，如定制食谱或特定天气数据组件。此外，全新的Material 3 Expressive设计语言会在AI交互时使组件边界呈现虚化与模糊效果，提升视觉体验。

Google: Today, we introduced Gemini Intelligence, which brings the best of Gemini to our most advanced devices. Gemini Intellige...

智能体Google产品更新多模态

11:13

Tibo@thsottiaux

精选76

Codex应用内浏览器功能迎来多项改进，支持在不同视口尺寸下测试应用，并能控制设备工具栏、在不同断点进行点击验证。长时测试中，Codex会在关键节点截图供用户核查。为加速测试，可隐藏应用内浏览器以禁用动画，使测试速度提升1-2倍。此外，标注功能现在发送更快且消耗更少tokens。

James Sun: Codex can now use the in-app browser to test your app at different viewport sizes! It will control the device tool bar a...

OpenAI产品更新编码

关联讨论 1 条X：OpenAI Developers (@OpenAIDevs)

推荐理由：Codex这个内测浏览器升级挺实用，不同视口尺寸下截图验证，做响应式布局的人能省下反复部署的时间，更新不大但痛点打得很准。

10:34

OpenRouter@OpenRouter

65

Opus 4.7 快速模式已在 OpenRouter 上线！只需将您的模型设置为 `anthropic/claude-opus-4.7-fast` 具备完整的 Opus 4.7 智能，吞吐量提升约 2.5 倍

Anthropic产品更新部署/工程

关联讨论 1 条X：Claude Devs (@ClaudeDevs)

10:13

Tibo@thsottiaux

32

感谢所有反馈，以下是Codex未来的更新安排 - 周二：质量优化与完善 - 周四：重大发布（本周四开始） - 周五：趣味内容与小惊喜

Tibo: For Codex, we've been thinking about keeping a stable release cadence and have a larger release each week on Thursday. T...

OpenAI产品更新编码

09:49

ginobefun@hongming731

76

OpenAI Codex新增Computer Use能力，AI助手操作桌面软件

OpenAI为Codex引入Computer Use能力，使其从操作代码扩展到本地GUI应用。Codex拥有独立光标，不接管用户输入，允许用户并行工作。技术架构混合视觉模态截图和无障碍框架API，Spark模型依赖无障碍数据加速任务执行。安全层面采用逐应用权限授权，在用户允许前无法访问任何应用，保护隐私。目前该功能已在Mac上可用，Windows支持即将推出。

智能体MCP/工具OpenAI产品更新

关联讨论 1 条X：OpenAI Developers (@OpenAIDevs)

09:30

Alibaba Cloud@alibaba_cloud

65

AI的未来是智能体原生的。很高兴能与Hermes Agent及@NousResearch社区共同开启这段旅程。 Qwen 3.6 Plus现于Nous Portal限时免费--快来尝试吧。⚡

Nous Research: Qwen 3.6 Plus by @Alibaba_Qwen is now FREE for a limited time on Nous Portal! Nous Portal is one easy subscription that ...

智能体产品更新

关联讨论 1 条X：通义千问 / Qwen (@Alibaba_Qwen)

08:49

Berryxia.AI@berryxia

69

Google DeepMind推出AI化鼠标指针，实现手势语音操控Gemini

Google DeepMind近日发布了一项创新功能，将传统鼠标指针AI化。用户可通过手势（如指向、悬停）、语音及自然简写，在屏幕任意位置直接指挥Gemini模型，无需切换应用或编写复杂指令。该功能已集成于Google AI Studio和Chrome Gemini，能实时识别光标下的文字、图片、代码等内容语义，结合上下文理解用户意图，实现如将PDF内容转为邮件要点、表格转为图表等智能操作。这标志着人机交互从基于“坐标”的操控向基于“意图”的理解迈出了重要一步，尤其便于Agent开发者、UI设计师等用户提升效率。

智能体Google产品更新多模态

08:49

Berryxia.AI@berryxia

18

A 社把这玩意会带火么，反正是我买的那家淘宝店已经下架说断货了。非常适合做活动和给中小学生做点编程有意思的东西玩，也不贵200块钱。 DIY 和可玩性也是非常高的~~！ 😄

Anthropic其他

08:49

Berryxia.AI@berryxia

61

Claude Code推出/goal功能，实现任务自动化

Claude Code推出/goal功能，允许用户通过一行命令让Claude持续工作直至任务完成，无需额外指令。该功能旨在实现开发任务的自动化，减少人工干预，提高工作效率。

AnthropicMCP/工具产品更新编码

08:49

Berryxia.AI@berryxia

56

Meta推出实时语音视觉AI，即将登陆Ray-Ban眼镜

Meta发布了由Muse Spark驱动的Meta AI Voice Conversations，实现实时语音与视觉交互。该功能支持打断对话、切换话题，在聊天过程中生成图像和拉取内容，并能通过相机对准现实世界进行实时视觉问答。这一技术即将集成到Ray-Ban Meta智能眼镜中，提升穿戴设备的AI体验。

Meta产品更新多模态语音

08:49

Berryxia.AI@berryxia

74

牛逼！Browser Use 今天把"AI agent 即用即走"做到了极致。 BuxFather：Telegram 里直接 Spin up agent，无需任何注册付费，24/7 自主运行 + 自改进，还带 stealth browser。几下点击就有完整电脑 + 浏览器环境。这波对重度 Telegram 用户来说真的爽了！ https：//x.com/browser_use/status/2054330495249564094/video/1

智能体产品更新

08:41

meng shao@shao__meng

65

Claude Opus 4.7 "Fast Mode" 在 Claude Code 和 Claude API 里都可用了另外在 Cursor、Emergent、Factory Droid、v0、Warp 和 Windsurf 也可以用 Fast Mode：2.5x 速度，速度更爽，用起来可能就回不到 1x 的慢速了；但是。。6x 价格，好吧，我还是用慢速吧慢即是快 😂

ClaudeDevs: Fast mode for Claude Opus 4.7 is now available in research preview on the API and in Claude Code.

Anthropic产品更新编码

08:41

meng shao@shao__meng

65

Gemini Intelligence 登陆 Android，系统升级为主动型AI平台

Google将Android重新定位为主动型AI系统，推出Gemini Intelligence。其核心在于深度软硬件结合，首发于三星Galaxy和Google Pixel手机，后续将扩展至手表、汽车等设备。五大核心能力包括：跨应用多步骤任务自动化、Chrome浏览器内的智能研究与代办、基于上下文理解的智能填表、将口语实时整理成书面稿的“Rambler”功能，以及用自然语言生成自定义主屏幕Widget。这些功能均在用户指令下执行，并注重隐私与控制权。

Sundar Pichai: Today at the @Android Show (I/O edition) we announced Gemini Intelligence - bringing the best of Gemini to our most adva...

智能体Google产品更新多模态

08:41

meng shao@shao__meng

71

Google 发布首款 AI 优先笔记本 Googlebook，集成 Gemini 智能

Google 正式推出首款为 Gemini Intelligence 设计的笔记本 Googlebook，标志着从“云优先”的 Chromebook 时代进入“AI 优先”新阶段。其核心创新包括：Magic Pointer 将系统光标变为 AI 交互入口，可直接触发上下文建议与任务；Create Your Widget 允许通过自然语言生成聚合多源信息的动态桌面小组件；深度整合 Android 生态，实现手机 App 无缝调用与文件跨设备快速访问。该产品以 Gemini 为核心，旨在将 AI 能力下沉至系统级交互，降低使用门槛，并强化跨设备协同体验。

Google: Introducing Googlebook, the first laptop designed for Gemini Intelligence. It's crafted for heavyweight performance, bui...

Google产品更新端侧

08:22

小互@xiaohu

59

Google将Gemini升级为Android系统级AI大脑

Google将Gemini从聊天机器人升级为Android的“系统级大脑”，重新定义了下一代Android的架构。新架构从过去的“App + 系统”转变为“AI理解层 + 系统 + App”。Gemini作为主动式AI，能主动理解用户当前行为、潜在意图、可协同的App，并自动执行下一步任务。其核心目标是改变“人操作App”的传统手机逻辑，让AI直接理解用户意图并实现跨App的自动执行。

Google产品更新多模态

08:13

Satya Nadella@satyanadella

精选68

微软推出多模型AI安全系统，集成超百智能体高效发现漏洞

微软推出新型多模型智能体安全系统，整合了超过100个基于前沿和定制模型的专用智能体，用于发现可利用的安全漏洞。该系统在CyberGym基准测试中取得了顶级性能。在最近的Patch Tuesday之前，该系统已帮助发现并修复了16个漏洞。微软宣布客户现可申请加入该系统的私有预览测试。

智能体Microsoft产品更新部署/工程

推荐理由：微软把多模型代理系统用到安全漏洞挖掘上，100多个专业代理协作，在CyberGym基准拿了第一，做安全的朋友值得看看实际效果。

08:02

Luma@LumaLabsAI

46

有些时刻一年仅有一次。当它们来临时，请确保你的营销活动已准备就绪。定义营销季，设定方向。 Luma Agents 由此构建所有营销视觉素材。主视觉图、社交媒体素材，以及其间的一切。全部保持一致性，全部准时完成。把握关键时刻 → http：//lumalabs.ai/app

智能体产品更新图像生成

08:00

ClaudeDevs@ClaudeDevs

精选69

如何让Claude持续工作直至任务完成？Claude Code通过几种方式提供帮助，包括我们最近推出的功能：/goal。

Anthropic产品更新编码

推荐理由：Claude Code 的 /goal 命令解决了一个长期痛点，让 AI 能自己持续拆解执行复杂任务，不用开发者反复盯着推送，做长任务自动化的人可以直接试。

07:52

小互@xiaohu

60

Google发布AI笔记本平台Googlebook，Gemini驱动智能操作

Google推出新平台Googlebook，这是一个以Gemini AI为核心的笔记本电脑系统，旨在超越传统操作系统概念。Gemini被集成到鼠标指针中，能主动理解用户当前屏幕内容，并提供智能动作建议，如自动创建会议、生成图像搭配效果或总结改写内容。这标志着电脑操作逻辑的根本转变：从用户手动打开应用执行功能，变为AI基于上下文主动组织并执行操作，体现了向AI驱动平台的演进。

智能体Google产品更新多模态

07:06

宝玉@dotey

65

Anthropic开源"Claude for Legal"项目，为法律行业推出定制化AI工具集

Anthropic正式开源“Claude for Legal”项目，针对法律行业推出12个具体岗位的AI插件和超过20个连接行业常用软件的MCP连接器。用户通过简短的“冷启动访谈”定制本地CLAUDE.md文件，使插件能遵循团队特定的风格与标准，解决AI法律工具输出内容过于通用的问题。插件功能覆盖合同审阅、NDA分级、专利侵权对比表生成等重复性工作，并深度集成Thomson Reuters CoCounsel、iManage、DocuSign等主流平台。项目基于Claude Opus 4.7模型，但强调所有输出仅为律师审阅的草稿，不能替代专业法律判断。

AnthropicMCP/工具产品更新

06:38

Demis Hassabis@demishassabis

精选81

团队正在用AI重新构想鼠标指针，成果非常酷！在@GoogleAIStudio尝试原型版本，体验相当神奇。【引用 @GoogleDeepMind】：我们正用AI重新构想这个存在50年的界面--鼠标指针。🖱️ 这些实验演示展示了人们如何通过动作、语音和自然简写，在屏幕上直观操控Gemini完成任务🧵

Google DeepMind: We're reimagining a 50-year-old interface - the mouse pointer - with AI. 🖱️ These experimental demos show how people ca...

Google产品更新多模态语音

推荐理由：用了50年的鼠标指针第一次被AI改造，这个原型让你在屏幕上随手画圈、说话、打缩写就能控制Gemini，产品经理和设计师都该去玩一下。

05:05

🚨 AI News | TestingCatalog@testingcatalog

63

Meta推出Muse Spark驱动的AI语音对话与实时视觉交互功能

Meta宣布推出由Muse Spark驱动的AI语音对话功能，支持自然语言交流、实时生成图像及从Reels、地图等多源获取信息。该功能将整合至Meta AI应用的新语音模式和实时摄像头视图中，用户可通过摄像头对现实世界进行实时问答。购物模式新增了搜索Facebook Marketplace等能力。Muse Spark将逐步在Ray-Ban Meta等智能眼镜上于美加推出，并于今夏登陆Meta Ray-Ban Display，其智能能力也将扩展至WhatsApp、Instagram等全平台的多类场景中。

Meta Newsroom: Today we're introducing Meta AI Voice Conversations powered by Muse Spark that let you talk naturally to Meta AI (interr...

Meta产品更新图像生成多模态

1…31 323334 35…50