AIHOT
内容
精选全部 AI 动态AI 日报主题收藏
接入
Agent 接入
更多
关于更新日志反馈
内部员工登录
精选全部日报更多
内部员工登录
全部动态X · 936 条
全部一手资讯X论文
标签「Google」清除
🚨 AI News | TestingCatalog@testingcatalog · 5月21日62

GOOGLE 🔥: AI Studio mobile app for iOS is now available for pre-registration and set to launch on July 1! Earlier this week, Android app became available on Google Play as well. > Build and prototype with AI Studio TestFlightPLZ 👀

译GOOGLE 🔥:AI Studio iOS移动应用现已开放预注册,将于7月1日正式发布!本周早些时候,Android应用也已在Google Play上线。 > 使用AI Studio进行构建与原型设计 TestFlightPLZ 👀

🚨 AI News | TestingCatalog@testingcatalog · 5月21日58

Google 🤝 CapCut Google partners with CapCut to bring its image and video editing features directly to Gemini! Will we see Seedance models coming to Gemini too? This is quite an interesting move 👀

译Google宣布与视频编辑应用CapCut达成合作,将后者的图像和视频编辑功能直接整合进其AI模型Gemini中。这意味着用户未来将能在一个对话式AI平台内完成更复杂的创意内容编辑。此次合作被视为AI工具与专业创意软件融合的重要一步,旨在打造更无缝、智能的创作工作流。双方均认为,这是未来创作工具走向一体化、对话式体验的开端。

Chubby♨️@kimmonismus · 5月21日53

Google I/O is coming to an end, and it has been nothing less than one of the most impressive moments of my life. Why? First, simply because I had the privilege of being there in person while some of the brightest minds in the world talked about the future of AI and the direction technology is taking. Google I/O may officially be Google’s annual developer conference, but this year it felt like everything revolved around one central theme: AI. There was almost no product, no category, no part of the Google ecosystem that was not being reshaped, extended, or reimagined through AI. More than that, AI felt like the gravitational center of nearly every release. I tried to attend as many sessions as possible. In humanoid robotics, people are now talking about "physical AGI." Demis Hassabis, CEO of Google DeepMind, spoke about the possibility that we may be on the cusp of a new golden age of scientific discovery, with AI helping us make progress toward solving some of the hardest problems in medicine and science. And agentic AI showed, once again, how AI is becoming more proactive, more capable, and more deeply integrated into the way we work, build, and create. But beyond the announcements, what affected me most was the feeling of being there. I have rarely felt such a strong sense of optimism, enthusiasm, and genuine excitement about what is coming next. There was this almost physical feeling of momentum: the sense that we are not just watching a technological revolution unfold, but that we have the opportunity to participate in it, shape it, and help explain it to the world. (Something im really missing in germany/europe) I cannot even count how many fascinating conversations I had, how many wonderful and incredibly intelligent people I was able to meet, and how much I learned in just two days. The atmosphere was full of joy, curiosity, and ambition - and somehow, it felt like everyone was welcome. What made it even more special for me were the conversations I had on camera with remarkable people from Google, including Robby Stein, VP of Product at Google Search, Paige Bailey and Omar Sanseviero from Google DeepMind, Logan Kilpatrick, Product Lead for Google AI Studio and the Gemini API, Lizzie Tao from the NotebookLM team, and, most personally meaningful to me, Demis Hassabis. I could never have imagined that one day I would meet him in person. These two days will stay with me for a very long time. Tomorrow, I am heading back to Germany. But honestly, not for long. From May 31, I will already be back in San Francisco for Microsoft Build, and hopefully I will get the chance to meet even more people I have not had the opportunity to meet yet. My journey is only just beginning. Thank you for being part of it.

译Google I/O 2025全面聚焦AI,几乎重塑了所有产品与生态。现场探讨了“物理AGI”与主动式AI等前沿方向,DeepMind CEO Demis Hassabis提出AI或将推动科学发现的黄金时代。活动洋溢着强烈的乐观与参与感,作者与多位Google高管深入交流,尤其与Hassabis的会面令人难忘。从美国到欧洲,作者正踏上科技探索的新旅程。

AYi@AYi_AInotes · 5月21日77

http://x.com/i/article/2057300084354670592 # 用我的神级Prompt测试了Gemini 3.5 Flash,确认了一件事:Google直接宣告AI 大模型纯聊天时代彻底终结了! 这篇文章跟大家只捞干货,核心三部分:Gemini 3.5 Flash 到底强在哪?怎么免费玩上?我自用的 Gemini 神级提示词开源,8大场景直接拿去用!文章最后放了宝藏彩蛋给大家! # 目录 ## 一、Gemini 3.5 Flash 到底强在哪? ## 核心数据:289 tokens/s 是什么概念 ## 二、战略判断:Google 为什么不再卷 benchmark ## 三、上手体验:Gemini 3.5 Flash免费入口 +玩法 ## 四、自用神级Gemini Prompt开源: 1. KERNEL-X 终极动态专家系统 1. HE COMPILER IDENTITY (全栈编译器人格) 1. 唯一需要的Vibe Coding提示词 1. Naval Ravikant分身(决策神器,哲学/人生Prompt) 1. AI工作流程专家系统提示词 1. 认知挖掘提示词 1. 深度研究报告Prompt 1. 神级反思Prompt ## 五、写在最后:这轮 AI 竞赛的终局是什么 # 一、核心数据 289 tokens/s 是什么概念 - 速度:289 tokens/s(3.1 Pro 的 2.1 倍,GPT-4o 的 4 倍) - 智能:AA Intelligence Index 55(3.1 Pro 是 57) - 幻觉:暴降 31 个百分点,可靠性质的飞跃 - Agent 能力:GDPval-AA Elo 1656(3.1 Pro 1314),MCP 多步工作流 83.6% - 一句话:Flash 首次同时把速度、智能、可靠性三个维度拉满 我尽量讲人话把这些数字意味着什么跟大家说明白讲清楚: 289 tokens/s 的输出速度:你按下回车,还没来得及切回微信看一眼消息,3000 字已经写完了,3.1 Pro 这时候还在思考人生,GPT-4o 和 Claude Opus 直接被甩开 4 倍。 智能指数 55:离四个月前还是旗舰的 3.1 Pro 只差 2 分。 幻觉率暴降 31 个百分点,这个数字最离谱,以前用 Flash 做 Agent 我心里始终有根弦,因为它会编。 现在我让它跑多步工作流,自己不确定的地方它会主动停下来问,跟以前硬编的路数完全不同,属于质的变化。 # 二、战略判断 ## Google 为什么不再卷 benchmark? 说实话,在 Flash 出之前,我每次开新对话都要纠结半天, 用 Pro,等它思考完够泡一杯咖啡, 用 Flash,又怕它在关键步骤上幻觉一下,前面跑的全白费, 三年了,快和准只能选一个,我们从 GPT-3.5 忍到现在。 Flash 这次第一次把这两件事同时解决了。 # 三、免费上手体验 我自己测 Flash 用的是 ZenMux,这也是我一直跑模型的聚合平台。 昨晚刷到它已经免费上线3.5 Flash,顺手就接着测了一天,打开就能用,不用 API、不用翻墙。 它有个多模型 PK 功能,同一个 prompt 能同时丢给 Flash、Claude、GPT 看谁出得好。 我后面那 8 个压箱底的 prompt,有几个就是在这种 PK 模式下磨出来的。 但我也得说一下边界,免得有人冲进去发现不对。 Flash 不是万能的,我让它写长文(3000+字以上)的时候,后半段质量肉眼可见地往下掉,逻辑会开始飘,真要写深度长文我还是会回 Pro,毕竟Flash 是速度型选手,不是耐力型选手。 我现在的分工是:Agent 跑流程、批量处理、即时对话——全交给 Flash,深度思考、长文创作、复杂推理这些还是 Pro。 这套搭配跑了一天,体感是: 聊天框时代的纠结,在这一天里消失了。 # 四、自用神级Gemini Prompt开源 ZenMux 上已经开放免费体验,不用折腾API不用翻墙,打开就能跑:https://zenmux.ai/invite/DIX0WC 用以下给大家开源的最顶的经过实战检验的提示词尽情体验Gemini 3.5 Flash的强大吧。 ## KERNEL-X 终极动态专家系统(我的王炸提示词,迭代了10版) ## 全栈现实编译器Prompt—把模糊的现实需求,编译为逻辑严密、概念独创、且极具透明度的“高维智力资产 ## 这是你唯一需要的Vibe Coding提示词: # 读懂纳瓦尔需要十年,我用 1 条提示词把它封装成了财富与清醒操作系统 ## 复杂问题分析Prompt 神级反思Prompt ## AI工作流程专家系统提示词 ## 深度研究报告Prompt ## 五、写在最后:这轮 AI 竞赛的终局是什么 写到这,我想聊一个更大的问题。 Gemini 3.5 Flash 这次发布,最让我在意的不是 289 tokens/s,也不是幻觉率暴降 31 个百分点,这些数字半年后就会被新的数字盖过去。 最让我在意的是 Google 这次出手的逻辑变了。 以前的逻辑是:我的模型比你聪明,所以你应该用我。 OpenAI 和 Anthropic 到现在还在玩这套——GPT-5 传闻、Claude 的推理深度、各种 benchmark 军备竞赛,比的是智商。 Google 这次的逻辑是:我不跟你比谁更聪明了,我比的是谁能让 AI 真正跑起来。 289 tokens/s 意味着什么?意味着 Agent 从一个“理论上有用”的东西,变成了“今天下午就能塞进工作流”的东西。一个人坐在电脑前,五分鐘跑完十几个步骤、调几次工具、回头修正自己的错误——这件事以前只存在于 Demo 视频里,现在变成真的了。 这才是终局的雏形。 聊天的终局是 Agent。Agent 的终局是基础设施。 什么意思?当 AI 快到一定程度、可靠到一定程度、便宜到一定程度——它就不再是一个“产品”了。 它是水电煤。你不会每天早上起来想“今天要不要用一点电”,你只是按下开关。 AI 的未来也是一样:你不会再纠结用哪个模型、切哪个窗口、等它思考几秒钟——你只需要一个动作,它已经把活干完了。 Google 这次干的,就是把“按下开关”这个动作往前推了一大步。 那 OpenAI 和 Anthropic 在干嘛? 说实话,他们不是没看到这个趋势,是他们船的惯性太大。 旗舰模型推理成本高、推理时间长、商业模式绑在“更聪明的模型”这条线上——转向的速度型产品,会动自己的旗舰定价体系,这不是技术问题,是商业枷锁。 所以 Flash 这次的对手,其实不是 GPT-4o 或者 Claude Opus,是 Google 自己的过去——那个只会在 benchmark 上跟人拼刺刀的 Google。 Google 终于不用“聪明”来证明自己了,它开始用“快”来定义游戏规则。 最后聊一句对你我的影响, Agent 这件事,门槛已经从“技术能力”转移到了“想象力”。 以前你得会搭 LangChain、会写工具调用链、会被各种框架的坑绊倒,才能跑起来一个勉强能用的 Agent。现在门槛降到了——你能不能想清楚一个任务,然后花五分钟跟模型说清楚。 说到底,AI 竞赛的终局不是谁赢了谁,是有一天你回头看,发现那些曾经需要半天的事情,现在你只需要一句话, 而这一天,比所有人以为的都要近。 ## 彩蛋时刻 分享一个宝藏提示词网站,跟强大的Gemini 3.5非常搭,绝对能解决你工作、生活、学习中的大部分问题和困惑! http://prompts.chat —— 目前最强开源免费 AI Prompt 社区! 上千条高质量提示词,按行业/场景直接分类: - AI Agents(目前我用的最多的让我直接起飞) - 商业分析、写作、代码、营销、图像生成…… 搜索关键词秒出最优模板,复制粘贴就能用! 特点: - 完全免费 + 开源 - 社区驱动,每天都有新神 prompt - 支持自建私有库(团队/隐私党福音) - GitHub 15.8万星,OpenAI、Hugging Face 大佬都点赞 再也不用自己瞎琢磨提示词了,效率直接拉满,强烈推荐呀

译Gemini 3.5 Flash实现了289 tokens/s的输出速度(约为GPT-4o的4倍),同时将幻觉率大幅降低31%,首次在速度、智能和可靠性上达成平衡。这标志着AI发展从单纯比拼模型“智商”的基准竞赛,转向追求“能用起来”的实用主义。高速与可靠性的结合,使得能够执行复杂多步任务的AI Agent从理论走向现实,可能重塑行业竞争格局,未来AI将如同基础设施一般无缝融入工作流。

Yuchen Jin@Yuchenj_UW · 5月21日64

Just tried Antigravity 2.0. It’s not an IDE anymore... I’m surprised! It’s basically the Codex/Claude desktop app with Gemini models. After spending $2.4B acquiring Windsurf, Google concluded that the future of AI coding is not IDE. We don’t need to read the code anymore.

译刚试了Antigravity 2.0。 它不再是IDE了...我挺惊讶的!它基本上就是用Gemini模型的Codex/Claude桌面应用。 在花费24亿美元收购Windsurf后,谷歌得出结论:AI编程的未来不在于IDE。我们不再需要阅读代码了。

宝玉@dotey · 5月21日63

这图还挺有意思,描述了 AI 时代的 T 型开发者需要的能力模型。 (一)生成式 AI 应用 (GenAI usage) 这块内容像一把大伞,横跨在整个 T字的最顶层。这意味着,无论你是做前端、后端还是算法,熟练使用生成式 AI 已经成为了所有开发者都必须掌握的通用底层能力。 (|)核心软件工程 (Core software engineering) 这是图中那根最粗壮的黑色竖线,也是开发者安身立命的看家本领。在这个核心阵地上,需要做到深度增加——也就是说,有了 AI 的辅助,专业技术基本功不仅不能丢,反而要更深、更牢固的专业技能。 (- )相邻工程领域 (Adjacent engineering) ( -)非工程领域 (Non-engineering) 这两大块分别构成了 T 字向左右延伸的横线。 左边代表与你专业相关的周边技术(比如前端懂一点后端) 右边则是完全非技术领域的能力(比如懂一点产品思维、业务逻辑或沟通技巧)。 在这两个方向上,需要做到广度增加。 在 AI 的加持下,现在可以比以往更容易地打破壁垒,快速拓宽自己的知识边界,成为一个懂技术的“全才”。

译该推文解析了AI时代的“T型开发者”能力模型。模型核心包含三个维度:顶层,生成式AI应用成为所有开发者必须掌握的通用基础能力;纵向,借助AI进一步深化核心软件工程的专业技能;横向,借助AI更高效地拓展至相邻工程领域及产品思维、沟通等非工程技能。此模型旨在帮助开发者构建兼具专业深度与跨界广度的知识结构。观点指出,该T型能力框架不仅适用于开发者,也适用于所有职业。

Josh Woodward@joshwoodward · 5月21日40

You found it! :)

译你找到了!:)

Berryxia.AI@berryxia · 5月21日64

科研狗大喜,对于搞科研的你记得看完! 就在刚刚Google I/O大会上DeepMind CEO Demis Hassabis直接扔出一句让我脊背发凉(😜)的话: “Scientific progress is becoming computable.” “科学进步正在变得被可量化计算了。” 他不仅仅把AI当生产力工具,更是直接把它定义成科学的基础设施层。 Gemini for Science一套新系统上线: 帮研究员读论文、写代码、快速生成假设。 真正的转折点是:科学研究本身开始像软件一样规模化迭代。 以前科研靠天才灵光一闪、靠漫长的实验试错,现在AI让“发现”这件事也能工程化、可编程、可加速。 AI真正要改变的,不只是我们怎么工作,而是我们怎么做科学本身。

译Google I/O大会上,DeepMind CEO Demis Hassabis提出“科学进步正在变得可量化计算”,将AI定位为科学的基础设施层。配套推出的Gemini for Science系统旨在协助科研人员处理论文、代码与假设生成。这一转变的核心在于,科学研究正逐渐摆脱对灵感与试错的依赖,转向像软件开发一样可规模化、可编程与加速的工程化模式,标志着AI对科研范式本身的重塑。

Josh Woodward@joshwoodward · 5月21日11

Glad you're liking it!

译很高兴你喜欢它!

SemiAnalysis@SemiAnalysis_ · 5月21日60

TPU ALERT: For OSS production Kubernetes distributed inferencing, Google just added nightly CI for llm-d. Great step by Google to start enabling the wider ML community for TPUs. TPU is catching up to NVIDIA for llm-d CI & code quality. In comparison, although AMD's official recommended production kubernetes inferencing solution is llm-d, @AnushElangovan has yet to add any AMD GPUs or AMD NICs into the CI.

译TPU警报:针对开源生产级Kubernetes分布式推理,Google刚为llm-d添加了夜间CI。这是Google推动更广泛ML社区使用TPU的重要一步。TPU在llm-d CI和代码质量方面正追赶NVIDIA。相比之下,尽管AMD官方推荐的生产级Kubernetes推理方案是llm-d,但@AnushElangovan尚未将任何AMD GPU或AMD网卡加入CI。

meng shao@shao__meng · 5月21日68

Chrome DevTools for Agents 1.0 正式发布 https://developer.chrome.com/blog/devtools-for-agents-v1 它在真实浏览器中观察行为、检查输出,让 Agent "能看见浏览器",有三种接入方式: 1. MCP server:将 LLM 连接到 DevTools 调试能力的标准协议 2. CLI:Token 更省的替代方案,支持 Agent 把动作打包成脚本批量执行 3. Agent skills:教 Agent 何时、如何调用具体工具的专家指令 (如无障碍、性能调试) 共开放了七个能力 1. 自动化质量审计:Agent 可直接跑 Lighthouse,覆盖无障碍、SEO、最佳实践、agentic browsing。可作为"质量门",拦截阻塞性问题进入生产。 2. 真实用户环境模拟:窗口尺寸、地理位置、网络/CPU 节流均可由 Agent 操控,无需手动调整浏览器即可测试响应式与移动端行为 (如汉堡菜单)。 3. Chrome 扩展开发与调试:安装、reload、触发扩展动作,介入 background script 与扩展页面,自动化"保存-刷新"循环。 4. WebMCP 工具调试:配合 WebMCP Origin Trial。让站点向 Agent 暴露结构化工具,Agent 不再靠 DOM 猜测意图,而是直接列出、调用、验证工具,显著降低集成门槛。 5. 内存泄漏检测:支持堆快照,识别 detached DOM 节点等典型泄漏。配合内存调试 skill,Agent 扮演性能专家角色。 6. Auto-connect 会话接管:可把当前已登录的浏览器上下文交给 Agent,而非让其打开沙箱实例。适合调试需要鉴权的页面 (如后台仪表板),省去重新登录。 7. 第三方开发者工具暴露内部状态:Web 应用可主动向 Agent 暴露内部状态与组件细节,使调试建议基于真实运行时数据,而非黑盒推断。

译Chrome DevTools for Agents 1.0 发布,旨在让 AI Agent 能在真实浏览器中“观察”并调试 Web 应用。该工具通过 MCP server、CLI 和 Agent skills 三种方式接入,提供了一系列核心能力。Agent 可执行自动化质量审计、模拟用户环境、调试 Chrome 扩展、接管已登录会话、检测内存泄漏,并能与 Web 应用暴露的内部状态深度集成。这显著提升了 Agent 在浏览器环境中的调试与测试能力,为自动化开发与运维提供了新的可能性。

宝玉@dotey · 5月21日68

这位博主做了系列 Google Omni vs Seedance 2.0的对比视频,看起来差距还是蛮明显

Google Gemini@GeminiApp · 5月21日66

Gemini 3.5 Flash understands complex topics and diagrams for your specific needs to visualize the results in a way that’s perfect for you. Watch Gemini take an advanced math paper, explore it visually, and generate the elements that matter most.

译Gemini 3.5 Flash 能理解复杂主题和图表,满足您的特定需求,以最适合您的方式可视化结果。 观看 Gemini 处理一篇高等数学论文,进行可视化探索,并生成最重要的元素。

Chubby♨️@kimmonismus · 5月21日15

I met a lot of really cool people at Google I/O, but the most exciting was @LizzieTao the genius behind the @notebooklm X account 🥰🤯

译在谷歌I/O大会上遇到了很多非常酷的人,但最令人兴奋的是@LizzieTao,她是@notebooklm X账号背后的天才🥰🤯

Google AI Developers@googleaidevs · 5月21日59

Using the new Managed Agents in the Gemini API, @RampLabs built their advanced finance agents without touching the backend infrastructure. Learn more ↓

译通过使用Gemini API中的新托管代理功能,@RampLabs构建了他们的高级财务代理,无需接触后端基础设施。 了解更多 ↓

karminski-牙医@karminski3 · 5月21日66

Midjourney 创始人自爆没有使用N卡导致落后一年? 刚刚在 X 上有个讨论 TPU(Google Tensor Processing Unit)的帖子, Midjourney 创始人 David Holz 不经意间爆了个大料:解释了为什么他们过去一年在产品迭代上显得如此疲软. (原帖已经删帖了, 毕竟用着TPU然后说TPU不好不太好哈哈哈, 而且今天 GoogleI/O 还在搞. 所以我给大家截图了评论) 简单来讲, Midjourney 之前为了搞底层基建, 把技术栈搞成了精分状态:在 TPU 上使用 JAX 框架训练模型, 又在 GPU 上使用 PyTorch 进行推理. 结果就是, 团队天天在这两套环境中来回横跳, 工具链断层, 调试极其困难(老黄的 N 卡从 IR 到算子再到驱动都能调试, 社区经验也很多, TPU 生态跟不上). 而且由于用 JAX (Google 搞的运行在 TPU上的魔改 NumPy), 导致开源社区里海量现成的 PyTorch 训练代码根本无法直接用, 全得自己移植. David 更是直接说 "如果可以回到过去, 我会从一开始就尝试使用纯英伟达的解决方案. " 所以如果说 DeepSeek 用国产卡, 搞各种极限优化是因为缺卡被逼出来的, 那 Midjourney 纯粹就是自己作(zuō, 一声)出来的了 要知道去年以来, 以 Google Nano-banana 为代表的修图大模型, 和各家能直接在图片里精准嵌入上千字的文生图大模型疯狂爆发. 对比之下, Midjourney 发布的 V7 和 V8 两个大版本在这些"平民化"功能上根本没法打. 我自己是 Midjourney 的订阅用户, 我现在基本只用它做前期的创意草稿和风格探索(毕竟 MJ 的风格连贯性和艺术感目前还是最强的), 然后精修和提升分辨率全都使用 nano-banana.而如果要排版做海报直出, 而做海报之类的直接用 OpenAI 的 ChatGPT Images 了. 帖子下面有个中国老哥评论得好:「亡羊补牢, 为时不晚」. 希望今年 Midjourney 赶紧跟上, 毕竟目前风格迁移这个领域还是 Midjourney 比较好, 基本盘还在的. #Midjourney #NVIDIA #TPU #文生图大模型

译Midjourney 创始人透露,团队因使用 TPU + JAX 训练、GPU + PyTorch 推理的混合技术栈,导致工具链断裂、调试困难,且无法利用开源社区丰富的 PyTorch 资源,严重拖慢了产品迭代速度。创始人反思,若重新开始会选择基于 NVIDIA 的统一方案。对比之下,其他文生图模型在功能上发展迅速,Midjourney 虽在风格艺术性上仍有优势,但在核心功能竞争上已显疲态。

NotebookLM@NotebookLM · 5月21日37

We're back in action! Back to your regularly programmed studying, learning, and research. (Thank you SO much for your patience and understanding 🙏)

译我们已恢复正常运行!请继续您的日常学习、研究和探索。 (非常感谢您的耐心与理解 🙏)

Google AI Developers@googleaidevs · 5月21日74

🪡 @stitchbygoogle is your agentic AI design partner. Move from an idea to a live mobile and web app UI in a single flow. Here’s what’s new for builders… 𓏵 Design with Stitch more naturally and intuitively. Stitch now streams the design build live so you can make edits, give interactive feedback, and watch the layout update in real-time without losing your flow. 𓏵 Skip the blank canvas and start from existing files. Import your codebase or Design.md directly, and let Stitch build from your actual production components so everything stays on brand. 𓏵 Start designing in motion. Stitch can now generate dynamic, moving interfaces so you get a kinetic UI that actually looks, feels, and functions like a finished product. 𓏵 Take designs directly to production. Skip complex deployment pipelines and export your projects to a live, shareable URL. These updates to Stitch are a step up for prototyping and deployment. Available globally today: http://stitch.withgoogle.com

译Google推出了其AI设计伙伴Stitch的多项重要更新。新功能支持实时流式构建设计,允许用户在不中断流程的情况下直接进行编辑和互动反馈。Stitch现已能够导入现有代码库或Design.md文件,基于实际生产组件进行设计以保持品牌一致性。同时,工具新增了动态界面生成功能,并可将设计项目直接导出为可分享的线上URL,简化了从原型到生产的部署流程。该工具现已面向全球用户开放。

Jeff Dean@JeffDean · 5月21日18

Four questions in under 2 minutes. Thanks to Google's social team for suggesting this little interlude at #googleio yesterday!

译两分钟内回答四个问题。感谢Google社交团队在昨天#GoogleIO上建议的这个小环节!

Google DeepMind@GoogleDeepMind · 5月21日84

Gemini 3.5 Flash has landed.

译Gemini 3.5 Flash 已正式发布。

小互@xiaohu · 5月21日39

由Gemma 4 驱动的 Open Duck 机器人 有视觉能力,还能对话

译由Gemma 4驱动的Open Duck机器人 具备视觉能力,还能对话

Artificial Analysis@ArtificialAnlys · 5月21日37

Artificial Analysis benchmarks were featured in yesterday’s Gemini 3.5 Flash launch Yesterday @GoogleDeepMind released Gemini 3.5 Flash at Google I/O '26 and our benchmarks were used by @sundarpichai to highlight the model’s leading position on the Intelligence vs. Speed Pareto frontier. We have full benchmarks across intelligence, speed, token usage and cost on the Artificial Analysis website

译Artificial Analysis基准测试被纳入昨日Gemini 3.5 Flash的发布 昨日@GoogleDeepMind在Google I/O '26上发布了Gemini 3.5 Flash,我们的基准测试被@sundarpichai用于展示该模型在智能与速度帕累托前沿的领先地位。我们在Artificial Analysis网站上提供了涵盖智能、速度、token使用量和成本的完整基准测试数据。

Google AI Developers@googleaidevs · 5月21日71

Build with Gemini to change the world 🌍 We’re launching a global hackathon with @xprize to solve real-world challenges with our new agentic tools. Join here: https://www.geminixprize.com/

译用Gemini构建,改变世界🌍 我们正与@xprize合作,发起一场全球黑客松,旨在利用我们全新的智能体工具解决现实世界的挑战。 点击加入:https://www.geminixprize.com/

Google AI@GoogleAI · 5月21日69

For centuries, the scientific method has been our best tool for progress. But today, there’s so much data out there that it’s impossible for any one researcher to connect all the dots. We want to fix that: Introducing Gemini for Science, a collection of science tools and experiments designed to accelerate the speed and scale of scientific exploration. Read on to learn more about each announcement in this inaugural set 🧵👇

译几个世纪以来,科学方法一直是我们取得进步的最佳工具。但如今,数据如此之多,任何单一研究者都无法将所有点连接起来。我们希望解决这个问题: 推出 Gemini for Science,这是一套旨在加速科学探索速度和规模的科学工具与实验集合。 请继续阅读,了解本次首批发布中各项公告的详情 🧵👇

Google Gemini@GeminiApp · 5月21日72

Creating, remixing, and editing a video is easier than ever with Gemini Omni. It offers a fluid, conversational way to create and edit. Just upload a video from your camera roll and ask Gemini to make changes.

译使用Gemini Omni创建、混剪和编辑视频比以往任何时候都更容易。 它提供了一种流畅的对话式创作和编辑方式。只需从相册上传视频,并让Gemini进行修改即可。

Google AI Developers@googleaidevs · 5月21日72

Jump in and start building with @GoogleAIStudio. -- @AndroidDev app building -- @GoogleWorkspace integrations -- 1-click deployment to @Antigravity Here’s what’s new from Google I/O ↓

译快速上手,开始使用 @GoogleAIStudio 进行构建。 -- @AndroidDev 应用构建 -- @GoogleWorkspace 集成 -- 一键部署至 @Antigravity 以下是来自 Google I/O 的最新动态 ↓

Google Gemini@GeminiApp · 5月21日74

Gemini 3.5 Flash quickly delivers organized results, no matter how messy the input is. Watch Gemini take chats and texts with clients and turn them into usable documents for your small business.

译Gemini 3.5 Flash能快速提供整理好的结果,无论输入多么混乱。 看看Gemini如何将与客户的聊天和文本,转化为您小企业可用的文档。

小互@xiaohu · 5月21日63

Mdjourney创始人暗示他们被Google的 TPU坑了 白白浪费了一年时间… 如果回到过去他会选择英伟达的GPU🤣 “这大概让我们的研究进度,比起一开始就完全采用 Nvidia 技术栈,落后了差不多一年。并不算特别理想。如果我能回到过去,我会从第一天开始就全部使用 Nvidia 的方案。”

译Midjourney创始人暗示他们被Google的 TPU坑了 白白浪费了一年时间… 如果回到过去他会选择英伟达的GPU🤣 “这大概让我们的研究进度,比起一开始就完全采用 Nvidia 技术栈,落后了差不多一年。并不算特别理想。如果我能回到过去,我会从第一天开始就全部使用 Nvidia 的方案。”

Google AI@GoogleAI · 5月21日69

We partnered with artists, designers, and builders to create new AI tools that solve real problems in their creative workflows. Here’s what’s new: — Introducing Google Pics in @GoogleWorkspace: A brand-new image creation & editing tool. Move and resize objects, add text, and translate just by hovering and clicking — Big updates to @GoogleFlow: 1) You can now create with Gemini Omni Flash in Google Flow 2) Google Flow Agent is a multi-step creative partner that reasons and plans complex tasks with you. 3) Google Flow tools are custom tools you can “vibe code” for animations, video effects, text layering & more — Design live with @StitchbyGoogle: Now, you can use text or voice prompts to edit layouts in real time then export those designs straight to code — More creative control in @GoogleFlowMusic: Edit songs section by section, remix the style of full songs, and create music videos with our new Gemini Omni Flash model

译谷歌与创作者合作推出系列AI工具更新。Google Workspace新增图像创作编辑工具Pics;Google Flow支持Gemini Omni Flash模型,并推出Flow Agent作为多步骤创作伙伴;设计工具StitchbyGoogle支持实时文字或语音编辑布局并导出代码;音乐工具Google FlowMusic增加分段编辑、风格混音及视频生成功能。

🚨 AI News | TestingCatalog@testingcatalog · 5月20日65

ICYMI 👀: Google AI Studio got a new "antigravity-preview-05-2026" Agent! > A general-purpose autonomous agent running in a remote, Google-hosted Linux environment. > This agent can execute code, take real actions, and use a large number of tokens.

译错过速看👀:Google AI Studio 新增“antigravity-preview-05-2026”代理! > 一个在远程Google托管Linux环境中运行的通用自主代理。 > 该代理可执行代码、执行实际操作,并使用大量token。

Chubby♨️@kimmonismus · 5月20日43

From this point on, I need to know: What magic does Seedance have that allows their Model 2.0 to remain so far ahead even after Google I/O? Seedance 2.0 was released in February (!). Model 3.0 can't be far off, and nothing has come close to 2.0 so far.

译从现在起,我需要知道: Seedance到底有什么魔力,能让他们的Model 2.0在Google I/O之后依然遥遥领先? Seedance 2.0是在二月发布的(!)。 Model 3.0应该快了,而目前还没有任何模型能接近2.0的水平。

Berryxia.AI@berryxia · 5月20日72

特么现在Flash ≠便宜了啊? 仅仅是快了吧~ Google把Gemini 3.5 Flash直接扔出来后,Artificial Analysis测完直接给出了最扎心的结论: 它在Intelligence vs Speed的Pareto前沿上,把整个行业又往前推了一大截。 Intelligence Index拿到55分,比Gemini 3 Flash高9分,直接超过Grok 4.3和Claude Sonnet 4.6。 Agentic任务(GDPval-AA)Elo评分飙到1656,远超前代。 幻觉率从92%暴降到61%。 输出速度超280 tokens/s,比上一代快70%。 多模态也继续领跑,MMMU-Pro 84%。 看起来几乎完美。 但代价是:跑一次Artificial Analysis Intelligence Index的成本,是Gemini 3 Flash的5.5倍,比Gemini 3.1 Pro贵75%。 定价直接3倍($1.5/$9 per 1M input/output)。 “Flash”这个名字,本来代表又快又便宜。 现在它代表:你终于可以用更快的速度,拿到真正旗舰级的智能,但你得为这个组合付更多钱。 Google这次是把顶级智能塞进了Flash系列,还是在用价格重新定义什么叫“轻量”? 完整基准在这里:https://artificialanalysis.ai/models/gemini-3-5-flash

译Google发布的Gemini 3.5 Flash在性能上实现飞跃,智能指数达55分,超越Grok 4.3等竞品,幻觉率大幅下降,输出速度超280 tokens/s。然而,其运行成本是前代的5.5倍,定价显著提高,引发对“Flash”是否仍代表“便宜”的讨论。该模型已在ZenMux平台开放免费体验,实际测试显示效果惊艳,在多项Agent和多模态榜单中表现顶尖,标志着顶级智能与极致速度的新结合。

🚨 AI News | TestingCatalog@testingcatalog · 5月20日67

ICYMI 👀: Google AI Studio can now build Android apps with a single click installation process to your device. Besides that, users can also build apps that interact with Google Suite applications. All this, powered by Gemini 3.5 Flash. And a mobile app is coming soon 👀

译ICYMI 👀:Google AI Studio 现在可以一键构建安卓应用,并直接安装到您的设备上。 此外,用户还可以构建与 Google Suite 应用程序交互的应用。 所有这些,都由 Gemini 3.5 Flash 提供支持。 移动应用即将推出 👀

Berryxia.AI@berryxia · 5月20日73

兄弟们!今天已经可以在ZenMux上免费体验Gemini 3.5 Flash 了! 我第一时间用它跑了那个经典的「AI模型递归二叉树生长测试」. 同一个 prompt,不同模型画出的树形态完全不一样。(见视频) Gemini 3.5 Flash 从输入提示词到生成完整 HTML 动画网页(树干慢慢长出、分支递归展开、最后随风摇摆),全程只用了 77.56 秒! 整体效果非常惊艳:树形态自然优雅、生长动画丝滑、视频和内容呈现都顶级! 熟悉的老朋友都知道,ZenMux 每次新模型都是 ZeroDelay 首发. Google I/O 2026 今天刚发布,现在立刻就能通过 API 调用! 还有免费额度可以白嫖~速度是真的没话说,还完美保留了旗舰级模型的能力。 专为 Agent 设计,在 MCP Atlas、Toolathlon、Finance Agent 等多项榜单直接拿下第一! 多模态理解也极强:MMMU-Pro 83.6%、CharXiv Reasoning 84.2%,全面超越上一代 Gemini 3.1 Pro。完全兼容主流 API 格式,无需改动现有工具链。 支持按量计费 + Builder 套餐。 👇 直接体验 正式版 → http://zenmux.ai/google/gemini-3.5-flash 免费试用 → http://zenmux.ai/google/gemini-3.5-flash-free

译Gemini 3.5 Flash现已在ZenMux平台免费开放试用。该模型在经典的递归二叉树生长测试中表现惊艳,仅用77.56秒便生成了完整的HTML动画网页,展现了顶级的响应速度与生成质量。其在MCP Atlas、Toolathlon等多项Agent榜单中位列第一,多模态理解能力(如MMMU-Pro得分83.6%)也全面超越上一代模型。模型完全兼容主流API格式,并提供按量计费和Builder套餐选择。

OpenCode@opencode · 5月20日66

Gemini 3.5 Flash now available in OpenCode - very fast - 1M context - priced similarly to GLM, Kimi, and DeepSeek Pro

译Gemini 3.5 Flash现已在OpenCode上线 - 速度极快 - 100万上下文 - 定价与GLM、Kimi和DeepSeek Pro相近

Rohan Paul@rohanpaul_ai · 5月20日49

Google's Android XR glasses demo showed real-time visual capture via the glasses' camera feeding into Gemini. The AI edited the image per voice instructions, with the result pushed directly to the paired smartwatch for viewing.

译谷歌的Android XR眼镜演示展示了通过眼镜摄像头进行实时视觉捕捉,并将画面输入Gemini。AI根据语音指令编辑图像,结果直接推送到配对的智能手表上查看。

Rohan Paul@rohanpaul_ai · 5月20日69

FT: Google DeepMind founder Demis Hassabis was an early angel investor in Anthropic. While Google later put billions into the same company through cloud and AI deals. DeepMind diaspora is actually super strong: former researchers have built more than a dozen AI companies and raised at least $14B since 2021. DeepMind has really become less like one company and more like an AI school whose graduates now compete with, supply, and pressure Google at the same time. --- ft. com/content/8f2a529e-7a1b-4d8e-95be-338d0c4c98f5

译据英国《金融时报》报道,Google DeepMind创始人德米斯·哈萨比斯曾是Anthropic的早期天使投资者,而Google随后也通过云服务与AI合作向该公司投入了数十亿美元。更值得关注的是DeepMind显著的“人才外溢”效应:自2021年以来,其前研究人员已创立超过十家AI公司,累计融资至少140亿美元。这表明DeepMind正逐渐从一个研究机构演变为一所顶尖的AI人才“学校”,其“毕业生”同时在与Google竞争、为其提供技术,并对整个市场施加压力。

Rohan Paul@rohanpaul_ai · 5月20日51

OpenClaw + Meta Ray-Ban glasses. This setup uses the Ray-Ban glasses' built-in camera for egocentric vision. Voice input triggers Gemini Live to interpret what the wearer sees, then routes tasks to OpenClaw, which then completed the purchase.

译OpenClaw + Meta Ray-Ban眼镜。 该设置利用Ray-Ban眼镜的内置摄像头实现第一人称视角。语音输入触发Gemini Live解读佩戴者所见,随后将任务路由至OpenClaw,最终完成购买。

凡人小北@frxiaobei · 5月20日15

给 Google 道个歉,他抄了。 我也向 Google 学习。

译推文讨论了 Google 被指抄袭的行为,作者为此道歉并承认自己也在向 Google 学习。引用推文批评 Google 常有出色想象力但产品执行力差,相比之下 Claude 和 Codex 等产品更受推崇,作者对此观点表示共鸣。同时,基于 Google 此前推出的创新产品,作者仍对其未来抱有期待,整体反映了对科技公司创新能力的复杂态度。

Berryxia.AI@berryxia · 5月20日57

兄弟们! 今天已经可以在ZenMux上免费体验Gemini 3.5 Flash 了! 我第一时间用它跑了那个经典的「AI模型递归二叉树生长测试」. 同一个 Prompt,不同模型画出的树形态完全不一样。(见视频) Gemini 3.5 Flash 从输入提示词到生成完整 HTML 动画网页(树干慢慢长出、分支递归展开、最后随风摇摆),全程只用了 77.56 秒! 整体效果非常惊艳:树形态自然优雅、生长动画丝滑、视频和内容呈现都顶级! 熟悉的老朋友都知道,ZenMux 每次新模型都是 ZeroDelay 首发. Google I/O 2026 今天刚发布,现在立刻就能通过 API 调用! 还有免费额度可以白嫖~ 速度是真的没话说,还完美保留了旗舰级模型的能力。 专为 Agent 设计,在 MCP Atlas、Toolathlon、Finance Agent 等多项榜单直接拿下第一! 多模态理解也极强:MMMU-Pro 83.6%、CharXiv Reasoning 84.2%,全面超越上一代 Gemini 3.1 Pro。 完全兼容主流 API 格式,无需改动现有工具链。 支持按量计费 + Builder 套餐。 👇 直接体验 正式版 → http://zenmux.ai/google/gemini-3.5-flash 免费试用 → http://zenmux.ai/google/gemini-3.5-flash-free

译Google I/O 2026 发布了新一代模型 Gemini 3.5 Flash,ZenMux 平台已第一时间提供 API 接入并开放免费试用。实测中,该模型仅用时 77.56 秒即完成一段复杂 HTML 递归二叉树生长动画,生成效果流畅自然。其性能全面升级,在多项 Agent 专属评测榜单中位列第一,多模态理解能力(MMMU-Pro 达 83.6%)也显著超越前代。模型完全兼容主流 API 格式,支持按量计费与套餐方案,便于开发者快速接入。

全部 AI 动态
AI 相关资讯全量信息流
全部一手信源资讯推文
全部模型产品行业论文技巧
5月21日
22:30
🚨 AI News | TestingCatalog@testingcatalog
62
GOOGLE 🔥:AI Studio iOS移动应用现已开放预注册,将于7月1日正式发布!本周早些时候,Android应用也已在Google Play上线。 > 使用AI Studio进行构建与原型设计 TestFlightPLZ 👀

Google AI Studio: ai studio mobile: build your ideas, wherever you are coming soon to an app store near you http://ai.studio/mobile

Google产品更新
20:59
🚨 AI News | TestingCatalog@testingcatalog
58
Google宣布与视频编辑应用CapCut达成合作,将后者的图像和视频编辑功能直接整合进其AI模型Gemini中。这意味着用户未来将能在一个对话式AI平台内完成更复杂的创意内容编辑。此次合作被视为AI工具与专业创意软件融合的重要一步,旨在打造更无缝、智能的创作工作流。双方均认为,这是未来创作工具走向一体化、对话式体验的开端。

CapCut: CapCut is partnering with @GeminiApp . Soon, users will be able to edit images and videos directly within the Gemini app...

Google产品更新多模态
13:14
Chubby♨️@kimmonismus
53
Google I/O亲历:AI浪潮中的震撼与希望

Google I/O 2025全面聚焦AI,几乎重塑了所有产品与生态。现场探讨了“物理AGI”与主动式AI等前沿方向,DeepMind CEO Demis Hassabis提出AI或将推动科学发现的黄金时代。活动洋溢着强烈的乐观与参与感,作者与多位Google高管深入交流,尤其与Hassabis的会面令人难忘。从美国到欧洲,作者正踏上科技探索的新旅程。

Google大佬观点
13:03
AYi@AYi_AInotes
77
Gemini 3.5 Flash:速度、智能与可靠性三重突破,开启AI实用主义新时代

Gemini 3.5 Flash实现了289 tokens/s的输出速度(约为GPT-4o的4倍),同时将幻觉率大幅降低31%,首次在速度、智能和可靠性上达成平衡。这标志着AI发展从单纯比拼模型“智商”的基准竞赛,转向追求“能用起来”的实用主义。高速与可靠性的结合,使得能够执行复杂多步任务的AI Agent从理论走向现实,可能重塑行业竞争格局,未来AI将如同基础设施一般无缝融入工作流。

智能体GoogleMCP/工具评测/基准
关联讨论 18 条X:Google AI (@GoogleAI)Google Blog:AI(RSS)X:Sundar Pichai (@sundarpichai)Google DeepMind:Blog(RSS)The Verge:AI(RSS)Google Developers Blog(RSS)The Decoder:AI News(RSS)IT之家(RSS)X:Berry Xia (@berryxia)X:Jeff Dean (@JeffDean)X:Gemini (@GeminiApp)Hacker News 热门(buzzing.cc 中文翻译)X:Google DeepMind (@GoogleDeepMind)X:Google AI for Developers (@googleaidevs)X:Rohan Paul (@rohanpaul_ai)X:Logan Kilpatrick (@OfficialLoganK)X:Ethan Mollick (@emollick)X:Kim (@kimmonismus)
12:39
Yuchen Jin@Yuchenj_UW
64
刚试了Antigravity 2.0。 它不再是IDE了…我挺惊讶的!它基本上就是用Gemini模型的Codex/Claude桌面应用。 在花费24亿美元收购Windsurf后,谷歌得出结论:AI编程的未来不在于IDE。我们不再需要阅读代码了。
Google产品更新编码
11:22
宝玉@dotey
63
AI时代T型开发者能力模型解析

该推文解析了AI时代的“T型开发者”能力模型。模型核心包含三个维度:顶层,生成式AI应用成为所有开发者必须掌握的通用基础能力;纵向,借助AI进一步深化核心软件工程的专业技能;横向,借助AI更高效地拓展至相邻工程领域及产品思维、沟通等非工程技能。此模型旨在帮助开发者构建兼具专业深度与跨界广度的知识结构。观点指出,该T型能力框架不仅适用于开发者,也适用于所有职业。

Zara Zhang: Great slide from the "How to thrive as an AI-era developer" session at Google I/O today I think this T-shape will apply ...

Google教程/实践编码
11:20
Josh Woodward@joshwoodward
40
你找到了!:)

Parker Ortolani: little Easter egg in the Gemini app, you can make the neural pulse animation happen again by tapping on the logo

Google其他
11:09
Berryxia.AI@berryxia
64
DeepMind定义AI为科学基础设施,科研迈向工程化时代

Google I/O大会上,DeepMind CEO Demis Hassabis提出“科学进步正在变得可量化计算”,将AI定位为科学的基础设施层。配套推出的Gemini for Science系统旨在协助科研人员处理论文、代码与假设生成。这一转变的核心在于,科学研究正逐渐摆脱对灵感与试错的依赖,转向像软件开发一样可规模化、可编程与加速的工程化模式,标志着AI对科研范式本身的重塑。

DeepMindGoogle产品更新
10:19
Josh Woodward@joshwoodward
11
很高兴你喜欢它!

Max Weinbach: Daily Brief in Gemini! I like this quite a bit

Google行业动态
10:11
SemiAnalysis@SemiAnalysis_
60
TPU警报:针对开源生产级Kubernetes分布式推理,Google刚为llm-d添加了夜间CI。这是Google推动更广泛ML社区使用TPU的重要一步。TPU在llm-d CI和代码质量方面正追赶NVIDIA。相比之下,尽管AMD官方推荐的生产级Kubernetes推理方案是llm-d,但@AnushElangovan尚未将任何AMD GPU或AMD网卡加入CI。
Google开源/仓库推理部署/工程
08:51
meng shao@shao__meng
68
Chrome DevTools for Agents 1.0正式发布

Chrome DevTools for Agents 1.0 发布,旨在让 AI Agent 能在真实浏览器中“观察”并调试 Web 应用。该工具通过 MCP server、CLI 和 Agent skills 三种方式接入,提供了一系列核心能力。Agent 可执行自动化质量审计、模拟用户环境、调试 Chrome 扩展、接管已登录会话、检测内存泄漏,并能与 Web 应用暴露的内部状态深度集成。这显著提升了 Agent 在浏览器环境中的调试与测试能力,为自动化开发与运维提供了新的可能性。

智能体GoogleMCP/工具产品更新
07:48
宝玉@dotey
68
这位博主做了系列 Google Omni vs Seedance 2.0的对比视频,看起来差距还是蛮明显

Ratul Ali: Google Omni vs Seedance 2.0 😳 Olympic Diving Test - Seedance 2.0 also wins this test!🔥 Prompt👇 Female Olympic diver f...

Google图像生成视频评测/基准
07:15
Google Gemini@GeminiApp
66
Gemini 3.5 Flash 能理解复杂主题和图表,满足您的特定需求,以最适合您的方式可视化结果。 观看 Gemini 处理一篇高等数学论文,进行可视化探索,并生成最重要的元素。
Google产品更新多模态
关联讨论 18 条X:Google AI (@GoogleAI)Google Blog:AI(RSS)X:Sundar Pichai (@sundarpichai)Google DeepMind:Blog(RSS)The Verge:AI(RSS)Google Developers Blog(RSS)The Decoder:AI News(RSS)IT之家(RSS)X:Berry Xia (@berryxia)X:Jeff Dean (@JeffDean)X:Gemini (@GeminiApp)Hacker News 热门(buzzing.cc 中文翻译)X:Google DeepMind (@GoogleDeepMind)X:Google AI for Developers (@googleaidevs)X:Rohan Paul (@rohanpaul_ai)X:Logan Kilpatrick (@OfficialLoganK)X:Ethan Mollick (@emollick)X:Kim (@kimmonismus)
07:05
Chubby♨️@kimmonismus
15
在谷歌I/O大会上遇到了很多非常酷的人,但最令人兴奋的是@LizzieTao,她是@notebooklm X账号背后的天才🥰🤯
Google其他
07:05
Google AI Developers@googleaidevs
59
通过使用Gemini API中的新托管代理功能,@RampLabs构建了他们的高级财务代理,无需接触后端基础设施。 了解更多 ↓
智能体Google教程/实践
06:17
karminski-牙医@karminski3
66
Midjourney 创始人自爆没有使用N卡导致落后一年?

Midjourney 创始人透露,团队因使用 TPU + JAX 训练、GPU + PyTorch 推理的混合技术栈,导致工具链断裂、调试困难,且无法利用开源社区丰富的 PyTorch 资源,严重拖慢了产品迭代速度。创始人反思,若重新开始会选择基于 NVIDIA 的统一方案。对比之下,其他文生图模型在功能上发展迅速,Midjourney 虽在风格艺术性上仍有优势,但在核心功能竞争上已显疲态。

Google图像生成大佬观点
05:43
NotebookLM@NotebookLM
37
我们已恢复正常运行!请继续您的日常学习、研究和探索。 (非常感谢您的耐心与理解 🙏)

NotebookLM: We're currently experiencing some system issues 🛠️ If you are on a paid plan, you might notice temporary restrictions o...

Google行业动态
05:35
Google AI Developers@googleaidevs
同事件精选74
Google Stitch更新:AI设计助手实现全流程构建

Google推出了其AI设计伙伴Stitch的多项重要更新。新功能支持实时流式构建设计,允许用户在不中断流程的情况下直接进行编辑和互动反馈。Stitch现已能够导入现有代码库或Design.md文件,基于实际生产组件进行设计以保持品牌一致性。同时,工具新增了动态界面生成功能,并可将设计项目直接导出为可分享的线上URL,简化了从原型到生产的部署流程。该工具现已面向全球用户开放。

智能体Google产品更新多模态
同一事件,精选展示《谷歌发布多款AI创意工具新功能》
推荐理由:Stitch 这次更新把设计到生产流水线打通了,实时流加运动 UI 让原型更接近真产品,做移动端和 Web 的可以直接试试,比自己搭环境快太多。
04:35
Jeff Dean@JeffDean
18
两分钟内回答四个问题。感谢Google社交团队在昨天#GoogleIO上建议的这个小环节!

Google: 4 questions with @JeffDean (Chief Scientist, Google and one of the authors of the famous "cat paper" about unsupervised ...

Google行业动态
04:17
Google DeepMind@GoogleDeepMind
同事件精选84
Gemini 3.5 Flash 已正式发布。
Google多模态模型发布
同一事件,精选展示《Gemini 3.5:具备行动能力的前沿智能》
推荐理由:Google 在 Gemini 3.5 上继续扩展 Flash 线,这种轻量模型对成本和延迟敏感场景很关键,如果你在等一个便宜的 Gemini API,该看了。
03:53
小互@xiaohu
39
由Gemma 4驱动的Open Duck机器人 具备视觉能力,还能对话
Google产品更新具身智能多模态
03:36
Artificial Analysis@ArtificialAnlys
37
Artificial Analysis基准测试被纳入昨日Gemini 3.5 Flash的发布 昨日@GoogleDeepMind在Google I/O '26上发布了Gemini 3.5 Flash,我们的基准测试被@sundarpichai用于展示该模型在智能与速度帕累托前沿的领先地位。我们在Artificial Analysis网站上提供了涵盖智能、速度、token使用量和成本的完整基准测试数据。
Google行业动态评测/基准
02:35
Google AI Developers@googleaidevs
精选71
用Gemini构建,改变世界🌍 我们正与@xprize合作,发起一场全球黑客松,旨在利用我们全新的智能体工具解决现实世界的挑战。 点击加入:https://www.geminixprize.com/
智能体Google行业动态

推荐理由:Google 拉着 XPrize 搞全球黑客松,重点是用他们的新 agentic 工具解决真问题,对有想法的开发者来说,是个正经的曝光和拿钱入口。
02:17
Google AI@GoogleAI
69
几个世纪以来,科学方法一直是我们取得进步的最佳工具。但如今,数据如此之多,任何单一研究者都无法将所有点连接起来。我们希望解决这个问题: 推出 Gemini for Science,这是一套旨在加速科学探索速度和规模的科学工具与实验集合。 请继续阅读,了解本次首批发布中各项公告的详情 🧵👇
Google产品更新数据/训练
关联讨论 3 条X:Google AI for Developers (@googleaidevs)X:Google DeepMind (@GoogleDeepMind)Google DeepMind:Blog(RSS)
02:14
Google Gemini@GeminiApp
同事件精选72
使用Gemini Omni创建、混剪和编辑视频比以往任何时候都更容易。 它提供了一种流畅的对话式创作和编辑方式。只需从相册上传视频,并让Gemini进行修改即可。
Google产品更新多模态视频
同一事件,精选展示《Gemini 3.5:具备行动能力的前沿智能》
推荐理由:Gemini Omni把视频编辑做成了对话,虽然不算革命性更新,但对随手剪片的普通人来说,不用学剪辑软件就是最大的可用性。
01:35
Google AI Developers@googleaidevs
72
快速上手,开始使用 @GoogleAIStudio 进行构建。 -- @AndroidDev 应用构建 -- @GoogleWorkspace 集成 -- 一键部署至 @Antigravity 以下是来自 Google I/O 的最新动态 ↓
Google产品更新部署/工程
关联讨论 18 条X:Google AI (@GoogleAI)Google Blog:AI(RSS)X:Sundar Pichai (@sundarpichai)Google DeepMind:Blog(RSS)The Verge:AI(RSS)Google Developers Blog(RSS)The Decoder:AI News(RSS)IT之家(RSS)X:Berry Xia (@berryxia)X:Jeff Dean (@JeffDean)X:Gemini (@GeminiApp)Hacker News 热门(buzzing.cc 中文翻译)X:Google DeepMind (@GoogleDeepMind)X:Google AI for Developers (@googleaidevs)X:Rohan Paul (@rohanpaul_ai)X:Logan Kilpatrick (@OfficialLoganK)X:Ethan Mollick (@emollick)X:Kim (@kimmonismus)
00:44
Google Gemini@GeminiApp
同事件精选74
Gemini 3.5 Flash能快速提供整理好的结果,无论输入多么混乱。 看看Gemini如何将与客户的聊天和文本,转化为您小企业可用的文档。
Google推理模型发布
同一事件,精选展示《Gemini 3.5:具备行动能力的前沿智能》
推荐理由:Gemini 3.5 Flash 的核心不是刷榜,而是解决现实中‘信息像一堆垃圾’的问题,这种从杂乱输入直接生成文档的能力,对小企业和自由职业者比 SOTA 更有用。
00:19
小互@xiaohu
63
Midjourney创始人称被Google TPU坑惨

Midjourney创始人暗示他们被Google的 TPU坑了 白白浪费了一年时间… 如果回到过去他会选择英伟达的GPU🤣 “这大概让我们的研究进度,比起一开始就完全采用 Nvidia 技术栈,落后了差不多一年。并不算特别理想。如果我能回到过去,我会从第一天开始就全部使用 Nvidia 的方案。”

David: @bubbleboi it probably put our research a year behind where it could have been if we were pure Nvidia stack, not totally...

Google图像生成大佬观点数据/训练
00:14
Google AI@GoogleAI
精选69
谷歌发布多款AI创意工具新功能

谷歌与创作者合作推出系列AI工具更新。Google Workspace新增图像创作编辑工具Pics;Google Flow支持Gemini Omni Flash模型,并推出Flow Agent作为多步骤创作伙伴;设计工具StitchbyGoogle支持实时文字或语音编辑布局并导出代码;音乐工具Google FlowMusic增加分段编辑、风格混音及视频生成功能。

智能体Google产品更新图像生成

推荐理由:Google这次更新的不是单点工具,而是把AI能力像乐高一样嵌入到创意工作流的每一步,Flow Agent的多步骤推理尤其值得做设计的人试试看。
5月20日
23:43
🚨 AI News | TestingCatalog@testingcatalog
65
错过速看👀:Google AI Studio 新增"antigravity-preview-05-2026"代理! > 一个在远程Google托管Linux环境中运行的通用自主代理。 > 该代理可执行代码、执行实际操作,并使用大量token。
智能体Google产品更新
22:35
Chubby♨️@kimmonismus
43
从现在起,我需要知道: Seedance到底有什么魔力,能让他们的Model 2.0在Google I/O之后依然遥遥领先? Seedance 2.0是在二月发布的(!)。 Model 3.0应该快了,而目前还没有任何模型能接近2.0的水平。

JSFILMZ: Google promised that Gemini Omni Flash would change the game, but when you put it side-by-side with Seedance 2.0... it's...

Google图像生成大佬观点视频
22:08
Berryxia.AI@berryxia
72
性能飞跃但成本激增,Gemini 3.5 Flash重新定义"轻量"?

Google发布的Gemini 3.5 Flash在性能上实现飞跃,智能指数达55分,超越Grok 4.3等竞品,幻觉率大幅下降,输出速度超280 tokens/s。然而,其运行成本是前代的5.5倍,定价显著提高,引发对“Flash”是否仍代表“便宜”的讨论。该模型已在ZenMux平台开放免费体验,实际测试显示效果惊艳,在多项Agent和多模态榜单中表现顶尖,标志着顶级智能与极致速度的新结合。

Berryxia.AI: 兄弟们! 今天已经可以在ZenMux上免费体验Gemini 3.5 Flash 了! 我第一时间用它跑了那个经典的「AI模型递归二叉树生长测试」. 同一个 Prompt ,不同模型画出的树形态完全不一样。(见视频-Prompt见评论区) G...

Google多模态推理评测/基准
19:13
🚨 AI News | TestingCatalog@testingcatalog
67
ICYMI 👀:Google AI Studio 现在可以一键构建安卓应用,并直接安装到您的设备上。 此外,用户还可以构建与 Google Suite 应用程序交互的应用。 所有这些,都由 Gemini 3.5 Flash 提供支持。 移动应用即将推出 👀

Google AI Studio: ai studio mobile: build your ideas, wherever you are coming soon to an app store near you http://ai.studio/mobile

Google产品更新编码
18:07
Berryxia.AI@berryxia
73
兄弟们!今天已经可以在ZenMux上免费体验Gemini 3.5 Flash 了!

Gemini 3.5 Flash现已在ZenMux平台免费开放试用。该模型在经典的递归二叉树生长测试中表现惊艳,仅用77.56秒便生成了完整的HTML动画网页,展现了顶级的响应速度与生成质量。其在MCP Atlas、Toolathlon等多项Agent榜单中位列第一,多模态理解能力(如MMMU-Pro得分83.6%)也全面超越上一代模型。模型完全兼容主流API格式,并提供按量计费和Builder套餐选择。

智能体Google多模态评测/基准
16:41
OpenCode@opencode
66
Gemini 3.5 Flash现已在OpenCode上线 - 速度极快 - 100万上下文 - 定价与GLM、Kimi和DeepSeek Pro相近
Google产品更新编码
16:05
Rohan Paul@rohanpaul_ai
49
谷歌的Android XR眼镜演示展示了通过眼镜摄像头进行实时视觉捕捉,并将画面输入Gemini。AI根据语音指令编辑图像,结果直接推送到配对的智能手表上查看。
Google产品更新多模态端侧
15:05
Rohan Paul@rohanpaul_ai
69
DeepMind创始人曾投资Anthropic,其"人才外溢"重塑AI格局

据英国《金融时报》报道,Google DeepMind创始人德米斯·哈萨比斯曾是Anthropic的早期天使投资者,而Google随后也通过云服务与AI合作向该公司投入了数十亿美元。更值得关注的是DeepMind显著的“人才外溢”效应:自2021年以来,其前研究人员已创立超过十家AI公司,累计融资至少140亿美元。这表明DeepMind正逐渐从一个研究机构演变为一所顶尖的AI人才“学校”,其“毕业生”同时在与Google竞争、为其提供技术,并对整个市场施加压力。

AnthropicGoogle现象/趋势行业动态
15:05
Rohan Paul@rohanpaul_ai
51
OpenClaw + Meta Ray-Ban眼镜。 该设置利用Ray-Ban眼镜的内置摄像头实现第一人称视角。语音输入触发Gemini Live解读佩戴者所见,随后将任务路由至OpenClaw,最终完成购买。
智能体GoogleMeta多模态
13:10
凡人小北@frxiaobei
15
推文讨论了 Google 被指抄袭的行为,作者为此道歉并承认自己也在向 Google 学习。引用推文批评 Google 常有出色想象力但产品执行力差,相比之下 Claude 和 Codex 等产品更受推崇,作者对此观点表示共鸣。同时,基于 Google 此前推出的创新产品,作者仍对其未来抱有期待,整体反映了对科技公司创新能力的复杂态度。

凡人小北: Google 每次都是想象力满分,产品力拉跨。就看看隔壁 Claude 和 Codex,抄都不屑于抄。 这一点倒是跟我很像😂 不管怎么样,还是再期待一次吧,毕竟之前也做过几个惊艳的产品。

Google大佬观点
13:05
Berryxia.AI@berryxia
57
Gemini 3.5 Flash 发布,已可在 ZenMux 免费体验

Google I/O 2026 发布了新一代模型 Gemini 3.5 Flash,ZenMux 平台已第一时间提供 API 接入并开放免费试用。实测中,该模型仅用时 77.56 秒即完成一段复杂 HTML 递归二叉树生长动画,生成效果流畅自然。其性能全面升级,在多项 Agent 专属评测榜单中位列第一,多模态理解能力(MMMU-Pro 达 83.6%)也显著超越前代。模型完全兼容主流 API 格式,支持按量计费与套餐方案,便于开发者快速接入。

Google多模态评测/基准
‹ 上一页
1…910111213…24
下一页 ›