AIHOT
内容
精选全部 AI 动态AI 日报主题收藏
接入
Agent 接入
更多
关于更新日志反馈
内部员工登录
精选全部日报更多
内部员工登录
全部动态X · 936 条
全部一手资讯X论文
标签「Google」清除
karminski-牙医@karminski3 · 5月20日61

Gemini-3.5-flash发布! 价格直接翻三倍? Google I/O 开始啦! 今天上来就是模型发布, Gemini-3.5-flash 直接全量上线了. 价格直接从 gemini-3-flash 的每百万 Token 输入/输出 $0.50 / $3 涨到了 $1.5 / $9, 那么性能有提示吗? 我简单测了几个例子, 目前来看体感处于 Genini-3.0-pro 和 Gemini-3.1-Pro 之间 (测试用的是 Thinking level: high) 不过稳定性就差很多了, 3D 渲染的 shader 它怎么都写不对, 我只能手动修了一下才能运行视频中这个火山喷发演示. 从目前 Gemini 系列模型迭代来看, Google 可能更想学 Anthropic, 搞三个档次. flash-lite 会取代之前 flash 的位置. 而 flash 更可能是主打一百万上下文内不设置阶梯定价, 承接 pro 这部分溢出的用户. 而本身编程性能上距离 pro 还有点差距. Pro 自然就是旗舰级别模型了. 不过现在这个定价来看, 可能这次 flash 更多是为了跟这次一起发布的 Antigravity CLI 一起搭配用的. 做 claude code 中 sonnet 模型的生态位置. #geminiflash35 #geminiflash #googleio

译在Google I/O大会上,Gemini-3.5-flash模型正式发布,其定价从上一代的$0.5/$3大幅上涨至$1.5/$9。实测显示,其性能介于Gemini-3.0-Pro与Gemini-3.1-Pro之间,但稳定性有所不足。此举被视为Google借鉴Anthropic的产品分层策略,计划用flash-lite、新flash和Pro形成梯队。其中新flash主打在百万级上下文内不设阶梯定价,以承接Pro模型溢出的用户。此次调价也可能旨在配合新发布的Antigravity CLI工具,定位类似Claude Code中的Sonnet模型,从而构建其开发生态。

Orange AI@oran_ge · 5月20日77

Gemini flash 3.5 昨晚发布,现已可用。 - 模型效果大幅超越 3.1 Pro,指标和 gpt 5.5 接近,比 gpt5.5 好的是 Agentic 和 多模态。 - 价格只要 gpt5.5 的三分之一,缓存价格只要六分之一。 - API 定价 $1.50 / $9.00 per 1M token(输入/输出),缓存 输入 $0.15。上下文窗口 1M token。 - 速度极快,是其他旗舰模型的4倍,非常适合 Agent 使用。 官方介绍地址: https://blog.google/innovation-and-ai/models-and-research/gemini-models/gemini-3-5/

Google AI Developers@googleaidevs · 5月20日66

Build powerful production-ready agents from a single API call! Learn more about managed agents in the Gemini API 🧵↓

译通过单次 API 调用构建强大的生产级智能体! 了解更多关于 Gemini API 中托管智能体的信息 🧵↓

Google AI@GoogleAI · 5月20日76

New upgrades to the @GeminiApp are you helping you get more done: ✨Gemini Spark is your 24/7 personal AI agent that can take action on your behalf, under your direction. It seamlessly integrates with @Gmail, @GoogleDocs, and Slides to automate your workflows and, best of all, it can keep working even when your laptop is closed. ☀ ️Daily Brief is our newest out-of-the-box agent that gives you a personalized digest based on your goals, and suggests next steps. Daily Brief is rolling out starting today to all Google AI subscribers (18+) in the Gemini app, starting in the US. Gemini Spark is starting to roll out next week.

译Gemini应用推出两项重要升级:Gemini Spark作为全天候个人AI代理,可在用户授权下自动操作,无缝整合Gmail、Google Docs和Slides等工作流,甚至在笔记本电脑关闭时也能持续运行。Daily Brief则提供基于个人目标的定制化摘要与下一步建议。Daily Brief已向美国18岁以上Google AI订阅用户推出,Gemini Spark将于下周开始上线。

Rohan Paul@rohanpaul_ai · 5月20日67

Google's new Gemini Omni, can generate "anything from any input" A video AI model that can create and edit clips from video, images, audio, text, and sketches. A user can record a normal video, then ask Omni to add a character, replace an object, change the action, alter the style, sync sound, or move the camera through plain language. Keeps the same scene stable after each edit. Video models often fail when they must preserve identity, motion, lighting, object position, and cause-and-effect across multiple changes. Gemini Omni Flash is meant to handle those edits inside the Gemini app, Google Flow, and YouTube Shorts. Omni has stronger world understanding, meaning it tries to model gravity, fluid motion, kinetic energy, and physical interaction more realistically. Ovearall, Omni makes AI video feel less like prompt-based generation and more like directing a scene through repeated instructions. Google is also attaching SynthID watermarking and C2PA Content Credentials to Omni outputs, so edited or generated media can be identified as AI-made.

译谷歌近日推出Gemini Omni,这是一款能处理视频、图像、音频、文本及草图等多种输入的全能型视频AI模型。用户可通过自然语言指令对已有视频进行添加角色、替换物体、调整动作、改变风格、同步音效及移动镜头等操作,且多次编辑后仍能保持场景一致性。该模型具备更强的世界理解能力,能更真实地模拟重力、流体等物理交互,使视频编辑更接近导演创作。输出内容将附带SynthID水印与C2PA内容凭证,以明确标识其AI生成属性。

Jeff Dean@JeffDean · 5月20日81

Highly capable models that are fast are super important. Our new Gemini 3.5 Flash model is a great mix of fast and capable.

译谷歌发布了新模型Gemini 3.5 Flash,该模型强调速度与性能的出色结合。与Gemini 3.1 Pro相比,3.5 Flash在几乎所有基准测试上表现更优,尤其在编程能力方面有巨大进步。其核心优势在于极快的推理速度,比其他前沿模型快4倍。在智能水平与输出速度的坐标图中,该模型凭借其卓越表现独占右上角优势区域,代表了速度与能力的新标杆。

Ethan Mollick@emollick · 5月20日67

The Odyssey and the Iliad get so many movie treatments but the sequel, the Roman Aeneid, is entirely ignored. Here is a teaser trailer from one prompt to Gemini Omni. The first pass made all the flags Danish(?) but Omni is capable of editing video, so I asked for their removal.

译《奥德赛》和《伊利亚特》被多次改编成电影,但其续作罗马史诗《埃涅阿斯纪》却完全被忽视。 这是用一段提示词为Gemini Omni制作的预告片。第一版把所有旗帜都做成了丹麦的(?),但Omni能够编辑视频,所以我要求移除了它们。

Google AI@GoogleAI · 5月20日83

Today, we launched a brand-new intelligent Search box. Here's what that means: An upgrade to the Search experience with our most advanced Gemini 3.5 models, bringing with them our latest agentic capabilities You can ask across modalities (text, images, files, and videos) and Search can reason across them all We're combining AI Overviews and AI Mode into one, seamless AI Search experience. So you can ask follow-up questions, build context, and received even more tailored and personalized responses This new AI Search experience is live today across desktop and mobile, worldwide.

译谷歌宣布推出基于Gemini 3.5模型的全新智能搜索框。该更新将AI Overviews与AI Mode整合为统一的AI搜索体验,支持对文本、图像、文件及视频进行跨模态推理查询。用户可进行多轮对话,搜索将结合上下文提供更个性化、定制化的回答。该新功能已在全球桌面和移动设备端同步上线。

Josh Woodward@joshwoodward · 5月20日20

Glad you like it!

译很高兴你喜欢! [引用 @mweinbach]:我认为 Google 在新的 Gemini 应用上做得非常出色。 他们同时采用了来自 Android(Material You)和 iOS(Liquid Glass)的自适应原生设计系统,并且仍然保持了 Google 整体设计的独特性。 他们现在做到了我所见过的所有应用中最好的。

Google AI@GoogleAI · 5月20日33

A few weeks ago, we asked our community to use @GoogleAIStudio or Canvas in @GeminiApp to help us create the Google I/O countdown. Thanks SO much to everyone who submitted, and special shoutout to the creators whose submissions helped us set the right ~vibes~ on the stage today: @thgie_8_eight @r_mevo @EdinsonNM @gunny_5 @xabila @GuyMosheTamam @mikkelhundborg @rajatxr Shahab Uddin Charles Zuo

译几周前,我们邀请社区使用 @GoogleAIStudio 或 @GeminiApp 中的 Canvas 功能,帮助我们创作 Google I/O 倒计时动画。 衷心感谢所有提交作品的用户,特别鸣谢以下创作者,他们的作品为今天的舞台营造了恰到好处的氛围: @thgie_8_eight @r_mevo @EdinsonNM @gunny_5 @xabila @GuyMosheTamam @mikkelhundborg @rajatxr Shahab Uddin Charles Zuo

SemiAnalysis@SemiAnalysis_ · 5月20日67

Warren Buffett's Berkshire Hathaway first invested in Google in Q3 2025, coincidentally the same time that SemiAnalysis called out a huge increase in TPU purchases from Anthropic. In Q1 Berkshire added more to their position. Buffett actually said this about his own diligence into Google's AI Infrastructure supremacy: "I don't buy what I can't understand. So Greg sat me down with the TPU v5p spec. 8,960 chips wired in a 3D torus, every chip talking to six neighbors over ICI links at 4.8 Tbps a pop, wraparound rails so no chip is ever at the end of the line, and optical circuit switches throwing the junctions mid-job to carve out whatever submesh your sharded matmul needs. Add in ring all-reduce running consists in both directions along each torus axis, collective permutes shuffling shards between sidings, and bandwidth-optimal SPMD partitioning across the data, model, and pipeline dimensions. Folks, it's just BNSF. Six neighbors, scheduled consists, a yardmaster throwing switches, trains that never stop. And I've been understanding railroads since 1942." Want to understand the TPU system architecture as deeply as Buffett? Read more here: https://newsletter.semianalysis.com/p/tpuv7-google-takes-a-swing-at-the

译巴菲特旗下伯克希尔·哈撒韦于2025年第三季度首次投资谷歌,并于2026年第一季度加仓。其投资决策基于对谷歌AI基础设施的深度理解。巴菲特将复杂的TPU v5p芯片集群——包括其3D环面互联、光电路交换与分布式训练算法——比作他熟悉的BNSF铁路网络:芯片互联如轨道连接,调度算法如列车编组,环形拓扑确保系统稳定。这一类比揭示了他并非盲目跟风,而是通过对底层系统运作原理的剖析做出的审慎投资。

Chubby♨️@kimmonismus · 5月20日24

Just sat down with @rmstein , Vice President of Product at @Google Search, to talk about AI Mode, the future of Search, and how generative AI is reshaping the way people discover information. Super insightful conversation. Video coming soon.

译刚刚与@Google Search产品副总裁@rmstein会面,探讨AI模式、搜索的未来,以及生成式AI如何重塑人们发现信息的方式。 对话非常有深度。 视频即将发布。

Josh Woodward@joshwoodward · 5月20日13

Glad you like it! We have more accents coming! :)

译很高兴你喜欢!我们即将推出更多口音!:)

Demis Hassabis@demishassabis · 5月20日79

Gemini Omni is a major leap in world understanding & multimodal editing! It can take photos, video & audio and build entirely new scenes. Over time it’ll be able to handle any input & any output - starting w/ video You can even give it your own videos & iterate on your ideas:

译Gemini Omni在世界理解与多模态编辑方面实现了重大飞跃!它能处理照片、视频和音频,并构建全新的场景。随着时间的推移,它将能够处理任何输入和任何输出——从视频开始。 你甚至可以提供自己的视频,并在此基础上迭代你的想法:

Google Gemini@GeminiApp · 5月20日72

Build your first game with Gemini 3.5 Flash. Translate everyday objects directly into interactive, digital experiences without complex 3D modeling. Start with a Nano Banana prompt, turn your image into a game in Canvas, and refine your vision for optimal gameplay.

译使用 Gemini 3.5 Flash 构建你的第一款游戏。 无需复杂的3D建模,即可将日常物品直接转化为互动的数字体验。从一个 Nano Banana 提示开始,在 Canvas 中将你的图像变成游戏,并优化你的愿景以获得最佳游戏体验。

Josh Woodward@joshwoodward · 5月20日32

Gemini Omni is so fun - insanely great at editing videos!

译Gemini Omni太有趣了——视频编辑能力简直逆天!

Josh Woodward@joshwoodward · 5月20日31

Gemini 3.5 Flash is an incredible model and super fast, try it out in Gemini today!

译Gemini 3.5 Flash是一款令人难以置信的模型,速度超快,今天就在Gemini中试试吧!

Google DeepMind@GoogleDeepMind · 5月20日53

Gemini 3.5 Flash 🤝 @Antigravity Watch how the model deploys multiple subagents to design and build an entire city.

译Gemini 3.5 Flash 🤝 @Antigravity 观看模型如何部署多个子代理来设计和构建整个城市。

Google AI@GoogleAI · 5月20日55

We were able to sit down with the @GoogleDeepmind team behind the new Gemini Omni Flash model to hear all of their behind-the-scenes stories, memorable moments, and many, many (occasionally embarrassing) video generations. Watch the full Release Notes episode here: http://goo.gle/49adTFp

译我们与@GoogleDeepmind团队坐下来,深入探讨了全新的Gemini Omni Flash模型背后的幕后故事、难忘时刻,以及许多许多(偶尔令人尴尬的)视频生成案例。 观看完整的发布说明节目请访问:http://goo.gle/49adTFp

Google AI@GoogleAI · 5月20日48

Some fun Gemini Omni use cases from the community👇🧵 (We’ll keep updating this thread throughout the day)

译一些来自社区的有趣Gemini Omni用例👇🧵 (我们将在全天持续更新此推文串)

Google AI Developers@googleaidevs · 5月20日71

The new @Antigravity ecosystem is your ultimate agent-first development platform. For anyone building or orchestrating agents, here’s a look at what landed at Google I/O 🚀↓

译全新的 @Antigravity 生态系统是您终极的智能体优先开发平台。 对于任何构建或编排智能体的开发者,以下是 Google I/O 上发布的内容 🚀↓

Google AI@GoogleAI · 5月20日74

By now, you've probably heard about Gemini Omni, our new model designed to create anything from any input, starting with video. But... what's the big deal? Let’s break it down 🧵👇

译到现在,你可能已经听说了 Gemini Omni,这是我们新推出的模型,旨在从任意输入(从视频开始)创造任何内容。 但……这有什么大不了的? 让我们来分解一下 🧵👇

Sundar Pichai@sundarpichai · 5月20日79

Gemini Omni doesn't just build scenes that look real, it reasons about what should happen next. It combines an intuitive understanding of physics with Gemini's knowledge of history, science, and cultural context. Rolling out today starting with video outputs to Google AI Plus, Pro and Ultra subscribers globally through the @Geminiapp + Google Flow, and @YouTube Shorts this week.

译Gemini Omni不仅能构建逼真的场景,还能推理接下来应该发生什么。它结合了对物理的直观理解与Gemini在历史、科学和文化背景方面的知识。 今日起,通过@Geminiapp + Google Flow和@YouTube Shorts,向全球Google AI Plus、Pro和Ultra订阅用户推出视频生成功能。

Google DeepMind@GoogleDeepMind · 5月20日61

We want to help scientists discover their next breakthrough with AI. Gemini for Science is our new suite of experimental tools to help them explore more hypotheses, validate work at scale, unpack literature with ease, and more 🧵

译我们希望借助AI帮助科学家发现下一个重大突破。 Gemini for Science是我们全新的实验性工具套件,旨在帮助他们探索更多假设、大规模验证工作、轻松解析文献等。🧵

Google Gemini@GeminiApp · 5月20日81

Meet Gemini Omni, our new model that can create anything from any input, starting with video. With Gemini Omni, you can combine images, videos and text as inputs and generate high-quality videos grounded in Gemini's real-world knowledge. #GoogleIO

译介绍Gemini Omni,我们的新模型,可以从任何输入创建任何内容,首先从视频开始。 借助Gemini Omni,您可以将图像、视频和文本作为输入组合,并生成基于Gemini现实世界知识的高质量视频。#GoogleIO

OpenRouter@OpenRouter · 5月20日82

Gemini 3.5 Flash from @GoogleDeepMind is live on OpenRouter! Beats Gemini 3.1 Pro on coding, agentic work, and tool use at Flash-tier price and speed. 1M context, 65K max output, multimodal. $1.50/M input, $9/M output.

译来自@GoogleDeepMind的Gemini 3.5 Flash现已登陆OpenRouter! 在编码、智能体任务和工具使用方面超越Gemini 3.1 Pro,同时保持Flash级别的价格和速度。 支持100万上下文、6.5万最大输出、多模态。输入$1.50/百万token,输出$9/百万token。

Chubby♨️@kimmonismus · 5月20日26

Thank you Sundar - first I/O and already feeling at home. Gemini 3.5 Flash is genuinely impressive for a model at this price point. The efficiency race is just getting started!

译感谢 Sundar - 第一次参加 I/O 就已感觉宾至如归。 Gemini 3.5 Flash 在这个价位上的表现确实令人印象深刻。效率竞赛才刚刚开始!

Chubby♨️@kimmonismus · 5月20日37

Demis Hassabis talks about how Gemini is helping science move towards a golden age of medicine, so that we will soon be able to cure all diseases. I have goosebumps; I couldn't be more excited.

译Demis Hassabis谈到Gemini如何助力科学迈向医学黄金时代,使我们很快能治愈所有疾病。我激动得起了鸡皮疙瘩,兴奋之情无以言表。

François Chollet@fchollet · 5月20日62

Gemini

译Gemini [引用 @arcprize]:Gemini 3.5 Flash ARC-AGI(已验证) ARC-AGI-2: - 高配:72.1%,$0.85 - 最低配:8.9%,$0.11 ARC-AGI-1: - 高配:92.5%,$0.42 - 最低配:48.8%,$0.06 Gemini 3.5 Flash在ARC-AGI测试中与GPT-5.5(中配)表现相当

Sundar Pichai@sundarpichai · 5月20日34

Workhorse model! (and hope you're enjoying your first I/O)

译主力模型!(希望你喜欢你的第一个 I/O)

Emad@EMostaque · 5月20日17

Can’t wait for Gemini Omni in @NotebookLM cinematic explainer videos 👀

译迫不及待想看到Gemini Omni在@NotebookLM的电影级解说视频中登场👀

AYi@AYi_AInotes · 5月20日80

Damn! Google has really gone absolutely wild this time. Gemini Omni is about to blow the roof off the ceiling of video generation 🤯 Making videos used to be like building with Lego blocks, piece by piece, slowly. Now it’s giving you a magic Lego factory that can actually think. You chat in natural language, and it understands real-world physics, history, biology, culture—then directly generates or edits any video. Five most mind-blowing abilities that you can use right now: 1Understands real physics—glass marbles colliding, turning, and bouncing in ways that match reality. 2Faces never get distorted—define a character once, put them in any scene, any action. 3Edit videos like you edit ChatGPT text—change backgrounds, swap people, add effects with a single sentence. 4Upload an image and apply any style—make claymation, visualize protein folding, whatever you imagine. 5Video isn’t a dead file anymore—change angles, lighting, objects, even storylines just by chatting. This isn’t a competitor to Sora. This is the first time a world model has truly entered a consumer-facing product. It’s not just generating pixels—it’s simulating a coherent physical and semantic world. Open the Gemini app right now and try Omni Flash. Go try it. You’ll thank me later.

译Google推出Gemini Omni,首个面向消费者的世界模型。它通过自然语言交互,将Gemini的智能与生成媒体系统结合,实现了对物理规律、历史、生物等世界的深刻理解。用户可以像编辑ChatGPT文本一样用单句指令编辑视频,实现人物一致性、风格迁移、角度调整等功能。它不是单纯生成像素,而是模拟连贯的物理与语义世界,标志着AI视频生成从拼接工具向智能创作系统的飞跃。

AYi@AYi_AInotes · 5月20日57

Damn,Google这次直接掀了桌子,AI的游戏规则彻底变了。 看到很多人都在吹Gemini Omni视频生成,但Google I/O真正的王炸好像没人看懂, 我觉得可能是AI行业从聊天机器人时代,正式进入Agent数字劳动力时代的宣战书。 过去一年大家都在卷谁的模型最聪明, 今天Google直接换了赛道。 它把智能乘以速度乘以可部署性,做成了新的胜负手。 Gemini 3.5 Flash,智能和顶级模型相当,输出速度却是别人的4倍。 在Agent工作流里,几十次模型调用的延迟会指数级爆炸。 4倍速度不是小优化,是质变。 它让24/7自主运行的复杂Agent,第一次真正变得可用。 更狠的是Antigravity平台,相当于一整套Agent基础设施。 桌面端,CLI,SDK,全栈开放, Google想做Agent时代的AWS, 开发者既能用它的能力,也能自己托管。 Spark个人Agent只是个示范,未来所有第三方Agent,都可能跑在这个底座上。 然后它把这一切,直接全量开放给所有人。 没有排队,没有限额,没有邀请制,相当于要把整个Agent生态的定价权,彻底打下来。 如果说OpenAI还在拼谁的模型更聪明, 那么Google已经建好了整个数字劳动力的工厂。 真正的战争,现在才刚刚开始。

译Google在I/O大会发布的Gemini 3.5 Flash与Antigravity平台,标志着AI竞争从模型性能转向构建Agent基础设施。Flash以4倍于顶级模型的速度解决了复杂Agent的延迟瓶颈,使24/7自主Agent成为可能;Antigravity则提供桌面端、CLI、SDK等全栈开放底座,目标成为“Agent时代的AWS”。Google将这些能力全量开放,意在降低Agent开发门槛,争夺生态定价权。这宣告了AI行业正从聊天机器人时代,迈入构建数字劳动力生态的新阶段。

Google DeepMind@GoogleDeepMind · 5月20日72

Google Flow 🤝 Gemini Omni Create more cinematic stories with our latest model, which brings batch editing, improved character consistency and more. Here’s what else is new for @FlowbyGoogle → https://goo.gle/42K2nge #GoogleIO

译Google Flow 🤝 Gemini Omni 使用我们的最新模型创作更具电影感的故事,它带来了批量编辑、改进的角色一致性等功能。以下是@FlowbyGoogle的其他新功能 → https://goo.gle/42K2nge #GoogleIO

Google Gemini@GeminiApp · 5月20日76

More than 900 million users are coming to the Gemini app every month. A big part of that growth is how fast we’re shipping. Here’s a look back at some of the biggest features we’ve launched this past year. 🧵 #GoogleIO

译每月有超过9亿用户使用Gemini应用。 这一增长的重要部分源于我们快速的发布节奏。以下是过去一年我们推出的一些最重要功能的回顾。🧵 #GoogleIO

Google Gemini@GeminiApp · 5月20日57

We've completely redesigned the Gemini experience from the ground up. From the moment you open the app or visit Gemini on the web, you’re greeted with a stunning new design language we call Neural Expressive. #GoogleIO

译我们从零开始彻底重新设计了 Gemini 体验。 从你打开应用或访问网页版 Gemini 的那一刻起,就会看到我们称之为“神经表达式”的全新惊艳设计语言。#GoogleIO

Google Gemini@GeminiApp · 5月20日57

Gemini Omni is coming to the Gemini app for paid subscribers today. It lets you bring your ideas to life using any combination of text, images, and video inputs. Just open up Gemini, attach a video from your camera roll, and change it around. It’s that simple. #GoogleIO

译Gemini Omni今日登陆Gemini应用,面向付费订阅用户开放。 它让你能通过文本、图像和视频的任意组合来实现创意。只需打开Gemini,从相册中附加一段视频,然后进行编辑。就这么简单。#GoogleIO

Google Gemini@GeminiApp · 5月20日72

Daily Brief is a new personalized digest that’s designed to be your first stop every morning. It gathers info from your inbox, calendar, and tasks to prioritize, organize, and suggest the next steps for you in a super concise morning digest that's built for skimming. #GoogleIO

译Daily Brief是一项新的个性化摘要功能,旨在成为您每天早晨的首选信息来源。 它从您的收件箱、日历和任务中收集信息,进行优先级排序、整理,并在专为快速浏览设计的超简洁晨间摘要中为您建议下一步行动。#GoogleIO

Google Gemini@GeminiApp · 5月20日76

Gemini Spark is your 24/7 personal AI agent that helps you navigate your digital life. It transforms Gemini from an assistant that answers your questions, to one that does the work on your behalf, under your direction. #GoogleIO

译Gemini Spark 是您的全天候个人AI代理,帮助您驾驭数字生活。 它将 Gemini 从一个回答您问题的助手,转变为一个在您的指导下、代表您完成工作的助手。#GoogleIO

Google Gemini@GeminiApp · 5月20日47

Last month we dropped the Gemini app for macOS. In the coming weeks, we’ll be bringing Gemini Spark to the Gemini desktop app so it can help with tasks like organizing your local files, or extracting PDF data directly into Google Sheets. #GoogleIO

译上个月我们推出了macOS版Gemini应用。 未来几周内,我们将把Gemini Spark引入Gemini桌面应用,使其能够协助处理本地文件整理、直接提取PDF数据至Google表格等任务。#GoogleIO

全部 AI 动态
AI 相关资讯全量信息流
全部一手信源资讯推文
全部模型产品行业论文技巧
5月20日
06:42
karminski-牙医@karminski3
61
Gemini-3.5-flash发布! 价格直接翻三倍?

在Google I/O大会上,Gemini-3.5-flash模型正式发布,其定价从上一代的$0.5/$3大幅上涨至$1.5/$9。实测显示,其性能介于Gemini-3.0-Pro与Gemini-3.1-Pro之间,但稳定性有所不足。此举被视为Google借鉴Anthropic的产品分层策略,计划用flash-lite、新flash和Pro形成梯队。其中新flash主打在百万级上下文内不设阶梯定价,以承接Pro模型溢出的用户。此次调价也可能旨在配合新发布的Antigravity CLI工具,定位类似Claude Code中的Sonnet模型,从而构建其开发生态。

Google推理模型发布编码
06:36
Orange AI@oran_ge
77
Gemini flash 3.5 昨晚发布,现已可用。 - 模型效果大幅超越 3.1 Pro,指标和 gpt 5.5 接近,比 gpt5.5 好的是 Agentic 和 多模态。 - 价格只要 gpt5.5 的三分之一,缓存价格只要六分之一。 - API 定价 $1.50 / $9.00 per 1M token(输入/输出),缓存 输入 $0.15。上下文窗口 1M token。 - 速度极快,是其他旗舰模型的4倍,非常适合 Agent 使用。 官方介绍地址: https://blog.google/innovation-and-ai/models-and-research/gemini-models/gemini-3-5/
智能体Google多模态模型发布
06:33
Google AI Developers@googleaidevs
66
通过单次 API 调用构建强大的生产级智能体! 了解更多关于 Gemini API 中托管智能体的信息 🧵↓
智能体GoogleMCP/工具产品更新
06:10
Google AI@GoogleAI
76
Gemini推个人AI代理与每日简报

Gemini应用推出两项重要升级:Gemini Spark作为全天候个人AI代理,可在用户授权下自动操作,无缝整合Gmail、Google Docs和Slides等工作流,甚至在笔记本电脑关闭时也能持续运行。Daily Brief则提供基于个人目标的定制化摘要与下一步建议。Daily Brief已向美国18岁以上Google AI订阅用户推出,Gemini Spark将于下周开始上线。

智能体GoogleMCP/工具产品更新
06:03
Rohan Paul@rohanpaul_ai
67
谷歌发布Gemini Omni全能AI模型,支持多模态输入与精准视频编辑

谷歌近日推出Gemini Omni,这是一款能处理视频、图像、音频、文本及草图等多种输入的全能型视频AI模型。用户可通过自然语言指令对已有视频进行添加角色、替换物体、调整动作、改变风格、同步音效及移动镜头等操作,且多次编辑后仍能保持场景一致性。该模型具备更强的世界理解能力,能更真实地模拟重力、流体等物理交互,使视频编辑更接近导演创作。输出内容将附带SynthID水印与C2PA内容凭证,以明确标识其AI生成属性。

Google模型发布视频
06:03
Jeff Dean@JeffDean
81
谷歌发布了新模型Gemini 3.5 Flash,该模型强调速度与性能的出色结合。与Gemini 3.1 Pro相比,3.5 Flash在几乎所有基准测试上表现更优,尤其在编程能力方面有巨大进步。其核心优势在于极快的推理速度,比其他前沿模型快4倍。在智能水平与输出速度的坐标图中,该模型凭借其卓越表现独占右上角优势区域,代表了速度与能力的新标杆。

Sundar Pichai: Just off stage at #GoogleIO, some highlights from this morning 🧵 Gemini 3.5 Flash is available today for everyone in @a...

Google模型发布编码
06:02
Ethan Mollick@emollick
67
《奥德赛》和《伊利亚特》被多次改编成电影,但其续作罗马史诗《埃涅阿斯纪》却完全被忽视。 这是用一段提示词为Gemini Omni制作的预告片。第一版把所有旗帜都做成了丹麦的(?),但Omni能够编辑视频,所以我要求移除了它们。
Google多模态教程/实践视频
05:40
Google AI@GoogleAI
精选83
谷歌推出全新AI智能搜索框,支持多模态交互

谷歌宣布推出基于Gemini 3.5模型的全新智能搜索框。该更新将AI Overviews与AI Mode整合为统一的AI搜索体验,支持对文本、图像、文件及视频进行跨模态推理查询。用户可进行多轮对话,搜索将结合上下文提供更个性化、定制化的回答。该新功能已在全球桌面和移动设备端同步上线。

Google产品更新多模态推理

推荐理由:Google搜索史上最大一次交互变革,Gemini 3.5加持的搜索框能理解文本、图片、视频,AI Overviews和对话模式彻底融合,搜索终于变成真正的对话助手。
05:11
Josh Woodward@joshwoodward
20
很高兴你喜欢! 【引用 @mweinbach】:我认为 Google 在新的 Gemini 应用上做得非常出色。 他们同时采用了来自 Android(Material You)和 iOS(Liquid Glass)的自适应原生设计系统,并且仍然保持了 Google 整体设计的独特性。 他们现在做到了我所见过的所有应用中最好的。

Max Weinbach: I think Google did an incredible job with the new Gemini app They use and adaptive native design systems from both Andro...

Google行业动态
05:10
Google AI@GoogleAI
33
几周前,我们邀请社区使用 @GoogleAIStudio 或 @GeminiApp 中的 Canvas 功能,帮助我们创作 Google I/O 倒计时动画。 衷心感谢所有提交作品的用户,特别鸣谢以下创作者,他们的作品为今天的舞台营造了恰到好处的氛围: @thgie_8_eight @r_mevo @EdinsonNM @gunny_5 @xabila @GuyMosheTamam @mikkelhundborg @rajatxr Shahab Uddin Charles Zuo
Google行业动态
05:03
SemiAnalysis@SemiAnalysis_
67
巴菲特借铁路类比解析谷歌TPU投资逻辑

巴菲特旗下伯克希尔·哈撒韦于2025年第三季度首次投资谷歌,并于2026年第一季度加仓。其投资决策基于对谷歌AI基础设施的深度理解。巴菲特将复杂的TPU v5p芯片集群——包括其3D环面互联、光电路交换与分布式训练算法——比作他熟悉的BNSF铁路网络:芯片互联如轨道连接,调度算法如列车编组,环形拓扑确保系统稳定。这一类比揭示了他并非盲目跟风,而是通过对底层系统运作原理的剖析做出的审慎投资。

AnthropicGoogle行业动态
05:02
Chubby♨️@kimmonismus
24
刚刚与@Google Search产品副总裁@rmstein会面,探讨AI模式、搜索的未来,以及生成式AI如何重塑人们发现信息的方式。 对话非常有深度。 视频即将发布。
Google搜索行业动态
04:41
Josh Woodward@joshwoodward
13
很高兴你喜欢!我们即将推出更多口音!:)

jorge: @joshwoodward The Rio accent is spot-on! I don't know of any other audio model that can do that.

Google行业动态语音
04:38
Demis Hassabis@demishassabis
79
Gemini Omni在世界理解与多模态编辑方面实现了重大飞跃!它能处理照片、视频和音频,并构建全新的场景。随着时间的推移,它将能够处理任何输入和任何输出--从视频开始。 你甚至可以提供自己的视频,并在此基础上迭代你的想法:
Google多模态模型发布视频
04:38
Google Gemini@GeminiApp
精选72
使用 Gemini 3.5 Flash 构建你的第一款游戏。 无需复杂的3D建模,即可将日常物品直接转化为互动的数字体验。从一个 Nano Banana 提示开始,在 Canvas 中将你的图像变成游戏,并优化你的愿景以获得最佳游戏体验。
Google多模态教程/实践

推荐理由:Google Gemini 官方教你把日常物品照片变成互动游戏,Nano Banana 到 Canvas 的链路很直接,想试 Gemini 多模态能力的人可以当入门案例跑一遍。
04:11
Josh Woodward@joshwoodward
32
Gemini Omni太有趣了--视频编辑能力简直逆天!
Google多模态大佬观点视频
04:11
Josh Woodward@joshwoodward
31
Gemini 3.5 Flash是一款令人难以置信的模型,速度超快,今天就在Gemini中试试吧!
Google大佬观点模型发布
04:11
Google DeepMind@GoogleDeepMind
53
Gemini 3.5 Flash 🤝 @Antigravity 观看模型如何部署多个子代理来设计和构建整个城市。
智能体Google教程/实践
04:10
Google AI@GoogleAI
55
我们与@GoogleDeepmind团队坐下来,深入探讨了全新的Gemini Omni Flash模型背后的幕后故事、难忘时刻,以及许多许多(偶尔令人尴尬的)视频生成案例。 观看完整的发布说明节目请访问:http://goo.gle/49adTFp
Google行业动态
04:10
Google AI@GoogleAI
48
一些来自社区的有趣Gemini Omni用例👇🧵 (我们将在全天持续更新此推文串)
Google多模态教程/实践
04:00
Google AI Developers@googleaidevs
71
全新的 @Antigravity 生态系统是您终极的智能体优先开发平台。 对于任何构建或编排智能体的开发者,以下是 Google I/O 上发布的内容 🚀↓
智能体Google产品更新
03:40
Google AI@GoogleAI
74
到现在,你可能已经听说了 Gemini Omni,这是我们新推出的模型,旨在从任意输入(从视频开始)创造任何内容。 但……这有什么大不了的? 让我们来分解一下 🧵👇
Google多模态模型发布视频
03:29
Sundar Pichai@sundarpichai
79
Gemini Omni不仅能构建逼真的场景,还能推理接下来应该发生什么。它结合了对物理的直观理解与Gemini在历史、科学和文化背景方面的知识。 今日起,通过@Geminiapp + Google Flow和@YouTube Shorts,向全球Google AI Plus、Pro和Ultra订阅用户推出视频生成功能。
Google多模态模型发布视频
03:11
Google DeepMind@GoogleDeepMind
61
我们希望借助AI帮助科学家发现下一个重大突破。 Gemini for Science是我们全新的实验性工具套件,旨在帮助他们探索更多假设、大规模验证工作、轻松解析文献等。🧵
DeepMindGoogle产品更新多模态
03:08
Google Gemini@GeminiApp
81
介绍Gemini Omni,我们的新模型,可以从任何输入创建任何内容,首先从视频开始。 借助Gemini Omni,您可以将图像、视频和文本作为输入组合,并生成基于Gemini现实世界知识的高质量视频。#GoogleIO
Google多模态模型发布视频
03:03
OpenRouter@OpenRouter
82
来自@GoogleDeepMind的Gemini 3.5 Flash现已登陆OpenRouter! 在编码、智能体任务和工具使用方面超越Gemini 3.1 Pro,同时保持Flash级别的价格和速度。 支持100万上下文、6.5万最大输出、多模态。输入$1.50/百万token,输出$9/百万token。
Google多模态模型发布
03:01
Chubby♨️@kimmonismus
26
感谢 Sundar - 第一次参加 I/O 就已感觉宾至如归。 Gemini 3.5 Flash 在这个价位上的表现确实令人印象深刻。效率竞赛才刚刚开始!

Sundar Pichai: Workhorse model! (and hope you're enjoying your first I/O)

Google大佬观点模型发布
03:01
Chubby♨️@kimmonismus
37
Demis Hassabis谈到Gemini如何助力科学迈向医学黄金时代,使我们很快能治愈所有疾病。我激动得起了鸡皮疙瘩,兴奋之情无以言表。

Chubby♨️: "Progress towards AGI": Gemini Omni - world models -Gemini Omni official!! It can create anything from any input!!!

Google模型发布行业动态
03:01
François Chollet@fchollet
62
Gemini 【引用 @arcprize】:Gemini 3.5 Flash ARC-AGI(已验证) ARC-AGI-2: - 高配:72.1%,$0.85 - 最低配:8.9%,$0.11 ARC-AGI-1: - 高配:92.5%,$0.42 - 最低配:48.8%,$0.06 Gemini 3.5 Flash在ARC-AGI测试中与GPT-5.5(中配)表现相当

ARC Prize: Gemini 3.5 Flash ARC-AGI (Verified) ARC-AGI-2: - High: 72.1%, $0.85 - Minimal: 8.9%, $0.11 ARC-AGI-1: - High: 92.5%, $0....

Google多模态推理评测/基准
02:59
Sundar Pichai@sundarpichai
34
主力模型!(希望你喜欢你的第一个 I/O)

Chubby♨️: Insane evals for a Flash model! Gemini 3.5 Flash is really good for its size!

Google大佬观点推理
02:59
Emad@EMostaque
17
迫不及待想看到Gemini Omni在@NotebookLM的电影级解说视频中登场👀
Google其他
02:55
AYi@AYi_AInotes
80
Google Gemini Omni重新定义视频生成

Google推出Gemini Omni,首个面向消费者的世界模型。它通过自然语言交互,将Gemini的智能与生成媒体系统结合,实现了对物理规律、历史、生物等世界的深刻理解。用户可以像编辑ChatGPT文本一样用单句指令编辑视频,实现人物一致性、风格迁移、角度调整等功能。它不是单纯生成像素,而是模拟连贯的物理与语义世界,标志着AI视频生成从拼接工具向智能创作系统的飞跃。

Google DeepMind: We're dropping Gemini Omni: our first step towards a model that can create anything from anything - starting with video....

DeepMindGoogle图像生成多模态
02:55
AYi@AYi_AInotes
57
Google掀桌子,AI游戏规则真的变了

Google在I/O大会发布的Gemini 3.5 Flash与Antigravity平台,标志着AI竞争从模型性能转向构建Agent基础设施。Flash以4倍于顶级模型的速度解决了复杂Agent的延迟瓶颈,使24/7自主Agent成为可能;Antigravity则提供桌面端、CLI、SDK等全栈开放底座,目标成为“Agent时代的AWS”。Google将这些能力全量开放,意在降低Agent开发门槛,争夺生态定价权。这宣告了AI行业正从聊天机器人时代,迈入构建数字劳动力生态的新阶段。

Sundar Pichai: Just off stage at #GoogleIO, some highlights from this morning 🧵 Gemini 3.5 Flash is available today for everyone in @a...

智能体Google大佬观点推理
02:41
Google DeepMind@GoogleDeepMind
精选72
Google Flow 🤝 Gemini Omni 使用我们的最新模型创作更具电影感的故事,它带来了批量编辑、改进的角色一致性等功能。以下是@FlowbyGoogle的其他新功能 → https://goo.gle/42K2nge #GoogleIO
Google产品更新视频

推荐理由:Google Flow 终于把批量编辑和角色一致性拉上来了,对做视频内容的人能省不少事,虽然不算颠覆性的代际更新,但实用度提升明显。
02:38
Google Gemini@GeminiApp
精选76
每月有超过9亿用户使用Gemini应用。 这一增长的重要部分源于我们快速的发布节奏。以下是过去一年我们推出的一些最重要功能的回顾。🧵 #GoogleIO
Google行业动态

推荐理由:Gemini 月活冲破 9 亿,这条线说明 AI 助手已不再是少数人的玩具,Google 的「快发版」策略正在把生成式 AI 塞进每一部安卓手机。产品经理应该看到这是从实验室到亿级设备的真实穿透率。
02:38
Google Gemini@GeminiApp
57
我们从零开始彻底重新设计了 Gemini 体验。 从你打开应用或访问网页版 Gemini 的那一刻起,就会看到我们称之为"神经表达式"的全新惊艳设计语言。#GoogleIO
Google产品更新
02:38
Google Gemini@GeminiApp
57
Gemini Omni今日登陆Gemini应用,面向付费订阅用户开放。 它让你能通过文本、图像和视频的任意组合来实现创意。只需打开Gemini,从相册中附加一段视频,然后进行编辑。就这么简单。#GoogleIO
Google产品更新多模态
02:38
Google Gemini@GeminiApp
精选72
Daily Brief是一项新的个性化摘要功能,旨在成为您每天早晨的首选信息来源。 它从您的收件箱、日历和任务中收集信息,进行优先级排序、整理,并在专为快速浏览设计的超简洁晨间摘要中为您建议下一步行动。#GoogleIO
智能体Google产品更新

推荐理由:Google 终于把 Gemini 往真正的个人助理方向推了一步,整合邮件、日历、任务的每日摘要,如果执行到位会抢掉很多人的早晨首页。
02:38
Google Gemini@GeminiApp
76
Gemini Spark 是您的全天候个人AI代理,帮助您驾驭数字生活。 它将 Gemini 从一个回答您问题的助手,转变为一个在您的指导下、代表您完成工作的助手。#GoogleIO
智能体Google产品更新
02:38
Google Gemini@GeminiApp
47
上个月我们推出了macOS版Gemini应用。 未来几周内,我们将把Gemini Spark引入Gemini桌面应用,使其能够协助处理本地文件整理、直接提取PDF数据至Google表格等任务。#GoogleIO
智能体Google产品更新
‹ 上一页
1…1112131415…24
下一页 ›