AIHOT
内容
精选全部 AI 动态AI 日报主题收藏
接入
Agent 接入
更多
关于更新日志反馈
内部员工登录
精选全部日报更多
内部员工登录
全部动态
全部一手资讯X论文
标签「Google」清除
5月20日周三
08:19小互60Google 智能眼镜 展示 让你"不用掏手机"就能完成日常的事情 让 Gemini 帮你 点咖啡,手机放兜里,眼镜只在最后一步确认时提示即可
08:10Simon Willison 博客62llm-gemini 0.32
08:05Berryxia.AI63Gemini Omni:不止于真实,更懂推理
08:05Berryxia.AI46Gemini 3.5 Flash 一句话驱动多智能体构建城市
08:05Berryxia.AI71Google DeepMind发布Gemini Omni,迈向"生成万物"愿景
08:05Berryxia.AI63Google I/O 2026大会总结:迈向Agentic Gemini时代
08:02Ethan Mollick62AI视频生成能力回溯:2025年7月的"最先进"水平
07:55IT之家(RSS)45谷歌酝酿 Gboard 输入法升级,能根据上下文提供高情商回复
07:49小互55Gemini Omni:视频版香蕉与世界模型雏形
07:33Google AI Developers73精选Ramp利用Gemini API构建高级财务代理
07:32Ethan Mollick64Gemini隐藏思考过程,摘要功能形同虚设
07:32Ethan Mollick59AI巨头路径分化:趋同与差异之争
07:12Josh Woodward71Gemini Spark:全天候个人AI助手发布
07:10Simon Willison 博客70Gemini 3.5 Flash:价格显著上涨,但谷歌计划将其全面应用
07:08Google Gemini61Gemini Omni支持用个人形象和声音创建视频
07:06Orange AI56Google IO观后感:前半段惊艳后半段混乱
06:42宝玉51Google新应用Antigravity 2.0界面似Codex
06:42karminski-牙医61Gemini-3.5-flash发布! 价格直接翻三倍?
06:36Orange AI77Gemini Flash 3.5发布,性能价格双优势
06:35公众号:数字生命卡兹克46帮大家总结了一下凌晨的Google I/O 2026开发者大会。
06:33Google AI Developers66Gemini API 托管智能体功能详解
06:29Hacker News 热门(buzzing.cc 中文翻译)72同事件精选OpenAI 采用谷歌的 SynthID 水印技术,并为 AI 生成的图像配备了验证工具同一事件,精选展示《SynthID水印技术扩展合作,覆盖超千亿内容》
06:10Google AI76Gemini推个人AI代理与每日简报
06:03Rohan Paul67谷歌发布Gemini Omni全能AI模型,支持多模态输入与精准视频编辑
06:03Jeff Dean81谷歌发布Gemini 3.5 Flash,速度快且性能强
06:02Ethan Mollick67奥德赛与伊利亚特常被改编,罗马史诗却鲜少问津
05:40Google AI83精选谷歌推出全新AI智能搜索框,支持多模态交互
05:33TechCrunch:AI(RSS)42Google 在 IO 2026 宣告入局 AI 设计
05:25Google Developers Blog(RSS)87Google I/O 2026:从辅助工具到独立智能体的战略转型
05:25Google Developers Blog(RSS)57精选创新一周年:庆祝Google Cloud x NVIDIA开发者社区达到10万会员
05:25TechCrunch:AI(RSS)47Gmail 新增对话式语音搜索功能,亮相 Google IO 2026
05:24The Verge:AI(RSS)67Google的未来:一个能做一切的搜索框
05:16TechCrunch:AI(RSS)55如何使用 Google 的新 AI 代理超越标准搜索
05:11Josh Woodward20Google Gemini应用设计获高度评价
05:10Google AI33感谢社区助力打造Google I/O倒计时
05:03SemiAnalysis67巴菲特借铁路类比解析谷歌TPU投资逻辑
05:02Chubby♨️24对话谷歌搜索副总裁谈AI模式未来
05:00The Verge:AI(RSS)58Google的AI未来需要信任--以及你的个人数据
04:55IT之家(RSS)68谷歌升级 AI Studio:文本直出原生安卓应用,打通测试全流程
04:41Josh Woodward13更多方言口音即将上线
全部 AI 动态
AI 相关资讯全量信息流
全部一手信源资讯推文
全部模型产品行业论文技巧
5月20日
08:19
小互@xiaohu
60
Google 智能眼镜 展示 让你"不用掏手机"就能完成日常的事情 让 Gemini 帮你 点咖啡,手机放兜里,眼镜只在最后一步确认时提示即可
Google产品更新多模态端侧
08:10
Simon Willison 博客
62
llm-gemini 0.32

项目 llm-gemini 发布了 0.32 版本,本次更新主要新增了对谷歌最新发布的模型 gemini-3.5-flash 的支持。发布信息同步提供了关于 Gemini 3.5 Flash 的技术笔记,以及作者使用升级后的插件绘制的图像示例,展示了该模型的实际应用效果。

Google产品更新开源/仓库
08:05
Berryxia.AI@berryxia
63
Gemini Omni:不止于真实,更懂推理

Google 发布的 Gemini Omni 模型核心能力升级,它不仅能生成高度真实的场景,更关键的是具备了对物理世界后续发展的推理能力。这一能力源于其对物理学的直观理解与广泛的背景知识结合。该模型现已向全球 Google AI Plus、Pro 和 Ultra 订阅用户推出,初期将优先支持视频内容的生成与输出。

Google产品更新多模态视频
08:05
Berryxia.AI@berryxia
46
Gemini 3.5 flash 使用反重力工具,一句话使用多个Agent同时写作构建整个城市的过程,还挺有意思的。
智能体Google教程/实践
08:05
Berryxia.AI@berryxia
71
Google DeepMind发布Gemini Omni,迈向"生成万物"愿景

Google DeepMind在I/O大会上发布了Gemini Omni模型,旨在迈出“从任何东西生成任何东西”的第一步。该模型将Gemini的智能与生成媒体系统深度融合,在世界理解、多模态和编辑能力上实现飞跃。其核心特点在于生成的视频能保持角色、光影等逻辑一致性,并支持通过自然语言进行实时编辑和风格调整,将视频转变为可动态演进的“世界素材”。该模型目前已在部分应用上线并即将开放API,不过其实际效果,尤其是在中文生成方面,仍存在一些讨论。

Google DeepMind: We're dropping Gemini Omni: our first step towards a model that can create anything from anything - starting with video....

Google多模态模型发布视频
08:05
Berryxia.AI@berryxia
63
Google I/O 2026大会总结:迈向Agentic Gemini时代

2026年Google I/O大会的主题为“Agentic Gemini时代”,旨在将AI从聊天工具进化为能自主思考、执行任务的“世界模型”。本次大会未发布Gemini 4.0,而是推出了更务实的Gemini 3.5系列,核心包括:速度极快且为智能体优化的Gemini 3.5 Flash;能理解物理世界、实现任意模态生成的全新“世界模型”Gemini Omni;以及可24/7自主工作的智能体Gemini Spark。同时,Android XR智能眼镜和AI集成的Googlebook笔记本等硬件亮相。整体上,Google正将Gemini深度整合至其全生态,巩固其在自主AI赛道上的领先地位。

智能体Google多模态现象/趋势
08:02
Ethan Mollick@emollick
62
该推文展示了2025年7月(两年前)AI视频生成模型所能达到的"最先进"技术水平,并以此作为当前讨论的参照。引用部分提供了关键上下文:早期Gemini Omni模型能根据包含多个角色、复杂场景与叙事逻辑的超现实文本提示(如飞行员海獭解释航空公司破产、莎士比亚与披萨机器人战斗等),生成相应的视频内容。推文作者通过展示这一历史技术状态,回应了关于生成内容细节真实性的讨论。

Ethan Mollick: I had early Gemini Omni access: "sea otter in a pilot's uniform explains why Spirit Airlines went bankrupt to a river ot...

Google多模态大佬观点视频
07:55
IT之家(RSS)
45
谷歌酝酿 Gboard 输入法升级,能根据上下文提供高情商回复

谷歌正在测试 Gboard 输入法的三项新 AI 功能,包括自定义提示词输入框、根据描述起草完整内容以及支持读取屏幕上下文或对话内容以提供更贴合语境的回复建议。此次升级标志着 Gboard 的 AI 能力从固定的润色、改写预设,转向更灵活的个性化写作辅助。新功能将允许用户以自然语言指令(如“让语气更幽默”)直接定制文本风格,并可能结合图库截图等屏幕信息自动组织回复。

Google产品更新多模态
07:49
小互@xiaohu
55
看看 Gemini Omni的实力 一句话就是:视频版的香蕉🍌 当然远不至于视频的编辑能力,它应该是世界模型的雏形… 通用AGI的初始形态…
Google多模态现象/趋势视频
07:33
Google AI Developers@googleaidevs
精选73
通过使用Gemini API中的新托管代理功能,@Ramp在无需接触后端基础设施的情况下构建了其高级财务代理。 了解更多 ↓
智能体Google产品更新

推荐理由:Google把agent构建的后端复杂度藏起来了,Ramp没碰基础设施就上了金融agent,这对所有想做agent的产品团队都是个明确信号,门槛降了不少。
07:32
Ethan Mollick@emollick
64
Google在Gemini网站上隐藏了思考痕迹。你必须使用三点菜单才能调出摘要,但这些摘要过于简略,几乎无法使用。 它是否进行了网络搜索?是否检查了结果?你无从得知。这使得Gemini不适合任何需要准确性的严肃工作。
Google大佬观点搜索
07:32
Ethan Mollick@emollick
59
ChatGPT/Codex 与 Claude/Code/Cowork 之间的能力差距正在缩小,因为 Anthropic 和 OpenAI 正在趋同于单一的体验。 Google 的体验则在分化:Studio、Gemini、Antigravity 及其他 Google AI 应用正变得越来越不同。 谁将胜出?
AnthropicGoogleOpenAI现象/趋势
07:12
Josh Woodward@joshwoodward
71
推出 Gemini Spark! 我们设计的全天候个人AI代理,旨在主动管理任务并帮助您驾驭数字生活,一切都在您的掌控之下。 本周将向受信任的测试人员推出,下周将作为Beta版面向美国 Google AI Ultra 订阅用户开放!
智能体Google产品更新
07:10
Simon Willison 博客
70
Gemini 3.5 Flash:价格显著上涨,但谷歌计划将其全面应用

谷歌在I/O大会上发布了Gemini 3.5 Flash模型,该模型跳过预览阶段直接正式发布,并已被集成到谷歌Gemini应用、搜索、开发者平台及企业解决方案等多项核心产品中。该模型价格显著上涨:输入价格为每百万令牌1.50美元,输出价格为9美元,分别是前代模型的3倍和6倍,已接近更高端的Gemini 3.1 Pro定价。技术上,它支持约100万输入令牌和约6.5万最大输出令牌。同时,谷歌推出了新的Interactions API测试版。这一价格上调趋势与OpenAI等公司近期策略相似,表明主要AI实验室正在试探API客户的价格承受能力。

Google模型发布
07:08
Google Gemini@GeminiApp
61
使用Gemini Omni,你可以用自己的声音和形象创建数字分身视频。 当你创建一个数字分身后,你就拥有了自己的AI数字版本,可以轻松生成外观和声音都像你的视频,无需每次都上传你的图像。
Google产品更新多模态视频
07:06
Orange AI@oran_ge
56
看 Google IO 的感受是这样的: 前半段,Google 太强了,真的什么都做了,从模型到应用,牛逼 后半段,Google 太乱了,怎么什么都做三遍,功能都一样,累了
Google大佬观点行业动态
06:42
宝玉@dotey
51
Antigravity 2.0 和 Codex 长一个样😂 Google 舍得拉下脸抄一下 UI/UX 也不是坏事,这样不会像 Gemini UI 那样难用了

Google Antigravity: Introducing Antigravity 2.0, a new standalone desktop application that delivers fully on that original glimpse of a trul...

智能体Google产品更新语音
06:42
karminski-牙医@karminski3
61
Gemini-3.5-flash发布! 价格直接翻三倍?

在Google I/O大会上,Gemini-3.5-flash模型正式发布,其定价从上一代的$0.5/$3大幅上涨至$1.5/$9。实测显示,其性能介于Gemini-3.0-Pro与Gemini-3.1-Pro之间,但稳定性有所不足。此举被视为Google借鉴Anthropic的产品分层策略,计划用flash-lite、新flash和Pro形成梯队。其中新flash主打在百万级上下文内不设阶梯定价,以承接Pro模型溢出的用户。此次调价也可能旨在配合新发布的Antigravity CLI工具,定位类似Claude Code中的Sonnet模型,从而构建其开发生态。

Google推理模型发布编码
06:36
Orange AI@oran_ge
77
Gemini flash 3.5 昨晚发布,现已可用。 - 模型效果大幅超越 3.1 Pro,指标和 gpt 5.5 接近,比 gpt5.5 好的是 Agentic 和 多模态。 - 价格只要 gpt5.5 的三分之一,缓存价格只要六分之一。 - API 定价 $1.50 / $9.00 per 1M token(输入/输出),缓存 输入 $0.15。上下文窗口 1M token。 - 速度极快,是其他旗舰模型的4倍,非常适合 Agent 使用。 官方介绍地址: https://blog.google/innovation-and-ai/models-and-research/gemini-models/gemini-3-5/
智能体Google多模态模型发布
06:35
公众号:数字生命卡兹克
46
帮大家总结了一下凌晨的Google I/O 2026开发者大会。
Google行业动态
06:33
Google AI Developers@googleaidevs
66
通过单次 API 调用构建强大的生产级智能体! 了解更多关于 Gemini API 中托管智能体的信息 🧵↓
智能体GoogleMCP/工具产品更新
06:29
Hacker News 热门(buzzing.cc 中文翻译)
同事件精选72
OpenAI 采用谷歌的 SynthID 水印技术,并为 AI 生成的图像配备了验证工具

OpenAI宣布在其AI生成的图像中集成谷歌的SynthID水印技术,并推出配套的验证工具。这一举措旨在增强AI生成内容的可追溯性,使用户能够识别图像是否由AI生成。该更新已于2026年5月19日生效。SynthID水印技术此前由谷歌开发,可嵌入难以察觉的数字标识,而新验证工具则允许用户检测这些标识。OpenAI表示这将帮助打击虚假信息传播。

GoogleOpenAI产品更新多模态
同一事件,精选展示《SynthID水印技术扩展合作,覆盖超千亿内容》
推荐理由:OpenAI与谷歌联手把内容溯源从单薄的水印升级为多层信号,还放了公开验证工具,记者和平台审核员现在有了更实在的抓手。
06:10
Google AI@GoogleAI
76
Gemini推个人AI代理与每日简报

Gemini应用推出两项重要升级:Gemini Spark作为全天候个人AI代理,可在用户授权下自动操作,无缝整合Gmail、Google Docs和Slides等工作流,甚至在笔记本电脑关闭时也能持续运行。Daily Brief则提供基于个人目标的定制化摘要与下一步建议。Daily Brief已向美国18岁以上Google AI订阅用户推出,Gemini Spark将于下周开始上线。

智能体GoogleMCP/工具产品更新
06:03
Rohan Paul@rohanpaul_ai
67
谷歌发布Gemini Omni全能AI模型,支持多模态输入与精准视频编辑

谷歌近日推出Gemini Omni,这是一款能处理视频、图像、音频、文本及草图等多种输入的全能型视频AI模型。用户可通过自然语言指令对已有视频进行添加角色、替换物体、调整动作、改变风格、同步音效及移动镜头等操作,且多次编辑后仍能保持场景一致性。该模型具备更强的世界理解能力,能更真实地模拟重力、流体等物理交互,使视频编辑更接近导演创作。输出内容将附带SynthID水印与C2PA内容凭证,以明确标识其AI生成属性。

Google模型发布视频
06:03
Jeff Dean@JeffDean
81
谷歌发布了新模型Gemini 3.5 Flash,该模型强调速度与性能的出色结合。与Gemini 3.1 Pro相比,3.5 Flash在几乎所有基准测试上表现更优,尤其在编程能力方面有巨大进步。其核心优势在于极快的推理速度,比其他前沿模型快4倍。在智能水平与输出速度的坐标图中,该模型凭借其卓越表现独占右上角优势区域,代表了速度与能力的新标杆。

Sundar Pichai: Just off stage at #GoogleIO, some highlights from this morning 🧵 Gemini 3.5 Flash is available today for everyone in @a...

Google模型发布编码
06:02
Ethan Mollick@emollick
67
《奥德赛》和《伊利亚特》被多次改编成电影,但其续作罗马史诗《埃涅阿斯纪》却完全被忽视。 这是用一段提示词为Gemini Omni制作的预告片。第一版把所有旗帜都做成了丹麦的(?),但Omni能够编辑视频,所以我要求移除了它们。
Google多模态教程/实践视频
05:40
Google AI@GoogleAI
精选83
谷歌推出全新AI智能搜索框,支持多模态交互

谷歌宣布推出基于Gemini 3.5模型的全新智能搜索框。该更新将AI Overviews与AI Mode整合为统一的AI搜索体验,支持对文本、图像、文件及视频进行跨模态推理查询。用户可进行多轮对话,搜索将结合上下文提供更个性化、定制化的回答。该新功能已在全球桌面和移动设备端同步上线。

Google产品更新多模态推理

推荐理由:Google搜索史上最大一次交互变革,Gemini 3.5加持的搜索框能理解文本、图片、视频,AI Overviews和对话模式彻底融合,搜索终于变成真正的对话助手。
05:33
TechCrunch:AI(RSS)
42
Google 在 IO 2026 宣告入局 AI 设计

Google 在 IO 2026 大会上正式展示了其在 AI 设计领域的能力。该公司推出了一款新应用,旨在让包括教师、小企业主在内的所有人都能轻松使用。这款应用的发布标志着 Google 进一步将 AI 技术下沉至日常创作工具中,强调其易用性与普惠性,试图降低专业设计的门槛。

Google产品更新图像生成
05:25
Google Developers Blog(RSS)
87
Google I/O 2026:从辅助工具到独立智能体的战略转型

在2026年开发者大会上,Google宣布其AI战略核心从辅助工具转向开发独立智能体。大会重点发布了Gemini 3.5系列模型,并对“反重力”智能体优先平台进行了重大更新。面向移动开发者,推出了Android CLI工具、评估排行榜及能将多种框架代码快速迁移至原生Kotlin的智能体。Web开发领域也迎来变革,包括专为智能体设计的Chrome DevTools、HTML-in-Canvas API,以及旨在让浏览器内AI智能体执行复杂任务的开放标准WebMCP提案。

智能体Google模型发布编码
05:25
Google Developers Blog(RSS)
精选57
创新一周年:庆祝Google Cloud x NVIDIA开发者社区达到10万会员

Google Cloud与NVIDIA开发者社区迎来成立一周年,会员规模突破10万。社区为开发者提供先进AI基础设施与资源支持,包括LLM优化、GPU加速数据分析等专项学习路径及专家网络研讨会。第二年计划将进一步扩展,推出实践实验室、工程活动及聚焦代理式AI增长的专项内容。

智能体Google行业动态

推荐理由:Google Cloud 和 NVIDIA 的开发者社区一年攒了 10 万人,不算大新闻,但官方放出的 agentic AI 课程和动手实验室对做 Agent 的工程师挺实在,可以关注一下。
05:25
TechCrunch:AI(RSS)
47
Gmail 新增对话式语音搜索功能,亮相 Google IO 2026

在 Google IO 2026 大会上,Google 宣布扩展 Gmail 的 AI 收件箱功能。用户现在可以通过对话式语音搜索,直接与收件箱交互,使用 Gemini 快速查找和提取被埋没的电子邮件细节。该功能旨在简化邮件检索流程,提升操作效率。

Google产品更新语音
05:24
The Verge:AI(RSS)
67
Google的未来:一个能做一切的搜索框

在2026年I/O大会上,Google

Google搜索现象/趋势
05:16
TechCrunch:AI(RSS)
55
如何使用 Google 的新 AI 代理超越标准搜索

Google 推出 AI 驱动的信息代理,这些代理能够在后台自动监控指定主题,并主动向用户推送更新和变化通知。此功能旨在帮助用户突破传统搜索的限制,提供更智能、实时的信息追踪体验,实现从被动搜索到主动获取的转变。

智能体Google搜索教程/实践
05:11
Josh Woodward@joshwoodward
20
很高兴你喜欢! 【引用 @mweinbach】:我认为 Google 在新的 Gemini 应用上做得非常出色。 他们同时采用了来自 Android(Material You)和 iOS(Liquid Glass)的自适应原生设计系统,并且仍然保持了 Google 整体设计的独特性。 他们现在做到了我所见过的所有应用中最好的。

Max Weinbach: I think Google did an incredible job with the new Gemini app They use and adaptive native design systems from both Andro...

Google行业动态
05:10
Google AI@GoogleAI
33
几周前,我们邀请社区使用 @GoogleAIStudio 或 @GeminiApp 中的 Canvas 功能,帮助我们创作 Google I/O 倒计时动画。 衷心感谢所有提交作品的用户,特别鸣谢以下创作者,他们的作品为今天的舞台营造了恰到好处的氛围: @thgie_8_eight @r_mevo @EdinsonNM @gunny_5 @xabila @GuyMosheTamam @mikkelhundborg @rajatxr Shahab Uddin Charles Zuo
Google行业动态
05:03
SemiAnalysis@SemiAnalysis_
67
巴菲特借铁路类比解析谷歌TPU投资逻辑

巴菲特旗下伯克希尔·哈撒韦于2025年第三季度首次投资谷歌,并于2026年第一季度加仓。其投资决策基于对谷歌AI基础设施的深度理解。巴菲特将复杂的TPU v5p芯片集群——包括其3D环面互联、光电路交换与分布式训练算法——比作他熟悉的BNSF铁路网络:芯片互联如轨道连接,调度算法如列车编组,环形拓扑确保系统稳定。这一类比揭示了他并非盲目跟风,而是通过对底层系统运作原理的剖析做出的审慎投资。

AnthropicGoogle行业动态
05:02
Chubby♨️@kimmonismus
24
刚刚与@Google Search产品副总裁@rmstein会面,探讨AI模式、搜索的未来,以及生成式AI如何重塑人们发现信息的方式。 对话非常有深度。 视频即将发布。
Google搜索行业动态
05:00
The Verge:AI(RSS)
58
Google的AI未来需要信任--以及你的个人数据

在I/O 2026大会上,Google发布了一系列AI驱动的新工具,旨在提升用户生活效率。其中包括始终在线的AI助手Gemini Spark,可协助组织活动;Daily Brief提供每日日程概览;以及扩大使用范围的Gmail AI收件箱,能基于邮件内容生成待办事项并起草个性化回复。这些功能的核心是一个处理海量个人信息的AI引擎,虽然便捷,但引发了用户信任和数据隐私的重大担忧,使隐私保护成为Google AI战略的关键挑战。

智能体Google安全/对齐现象/趋势
04:55
IT之家(RSS)
68
谷歌升级 AI Studio:文本直出原生安卓应用,打通测试全流程

谷歌在2026 I/O开发者大会上宣布,为Google AI Studio新增原生安卓应用生成功能。用户可通过浏览器输入文本提示,直接创建使用Kotlin与Jetpack Compose构建的完整、可安装安卓应用。该应用支持离线运行和硬件特性接入,并整合了开发、预览与测试发布流程。开发者能利用内置模拟器实时测试,也可一键发布至Google Play进行内部测试。当前版本主要适用于工具类、社交类应用及Gemini驱动项目。

Google产品更新端侧编码
04:41
Josh Woodward@joshwoodward
13
很高兴你喜欢!我们即将推出更多口音!:)

jorge: @joshwoodward The Rio accent is spot-on! I don't know of any other audio model that can do that.

Google行业动态语音
‹ 上一页
1…1920212223…40
下一页 ›