We've heard your feedback about hitting limits too quickly on @GeminiApp. We're rolling out several fixes to make your q...
We've heard your feedback about hitting limits too quickly on @GeminiApp. We're rolling out several fixes to make your q...
谷歌 DeepMind 首席执行官德米斯·哈萨比斯预测,AGI 研发速度远超预期,最快可能在 2029 年至 2030 年前后出现。作为 AlphaGo、AlphaFold 的主导者,他认为当前 AI 智能体是未来更强智能的预演,随着多模态和自主决策能力成熟,三年内迎来 AGI 关键突破已非科幻。但他同时警示,全球社会对 AGI 到来的准备严重不足,必须提前建立规则与防护机制。
Nano Banana 2 and Nano Banana Pro are now generally available via Gemini Enterprise Agent Platform. Backed by enterprise...
Google Research 在 I/O 2026 大会上展示了其在多个前沿领域的技术进展,包括应用AI、基础机器学习算法以及量子AI等。本次大会的核心主题是展示其在将科学发现与研究成果转化为现实世界影响方面的持续努力。
Gemini Omni seems to outperform everything. Crazy updates for Vibe Video Editing at #google Let's see when this update w...
Apple 正尝试将大型 Gemini 模型集成到 iPhone 中,以支持全新的 Siri 功能。由于模型规模庞大,本地处理可能无法完全实现,因此一个云端组件很可能是必然的选择。
Google 推出 Google Pay & Wallet Developer MCP server,这是一款开放标准工具,旨在将 AI 开发助手和 IDE 安全连接到实时的 API 与账户上下文。开发者无需离开开发环境,即可搜索官方文档、验证 Wallet pass 定义、检查集成状态以及管理商户账户。该集成旨在通过减少上下文切换并提供实时、可靠的 AI 支持来减少开发摩擦,从而加速开发工作流。
Google通过一部短片展示了如何利用AI工具将纸板、马克笔等简单物理材料“赋予生命”。该短片讲述了为Google I/O 2026舞台做准备的一群TPU的故事,创作中融合了木偶戏与3D动画。核心工具包括:Nano Banana(从原始木偶镜头和基础3D动画生成风格化首帧)、Google AI Studio(构建定制工具以大规模测试帧并确保一致性)、以及Gemini Omni和Google DeepMind的实验性模型(合并基础动画与风格化帧,提升至电影级画面)。整个AI流水线的设计旨在保护那些体现手工艺温度的细微细节,例如木偶戏的细微不完美感。
推文回应了关于Google Omni能力的争议,展示了其将普通人手转化为逼真活体解剖影像的演示效果。该演示清晰呈现肌肉、肌腱、骨骼等组织结构,被评价为生物医学教学的理想工具。文中提及的对比对象为seedance 2.0,强调了该技术在教育领域的独特应用价值。
Waymo开始向部分用户开放新款Ojai Robotaxi试乘服务,并在旧金山、洛杉矶和凤凰城率先部署第六代Waymo Driver硬件。Ojai是Waymo首款专为Robotaxi设计的车型,由极氪制造,注重乘客体验与无障碍功能。其搭载的第六代硬件传感器数量减少42%,但能力更强,单套硬件成本目标低于20000美元。Waymo目前在11座城市已完成超过2000万次全自动驾驶行程。
Google I/O 2026 发布会上披露了 12 个重要时刻,其中包括 Gemini Omni 和 Gemini 3.5 Flash 等产品的相关消息。
Google Cloud 推出“AI Threat Defense”平台,可自动发现、评估并修补企业系统中的安全漏洞。该平台整合了 Google 部分通过收购获得的技术,旨在快速响应由 AI 加速的网络攻击。
Google在Kaggle举办的Tunix黑客马拉松,挑战开发者利用TPU和有限算力,将小型基础模型转变为通用推理引擎。获胜团队通过多阶段后训练流程实现了这一目标,该流程结合了监督微调(SFT)与GRPO、SimPO等先进对齐技术。比赛结果表明,社区能够借助开源资源成功训练出高能力的结构化推理模型。
Google Pay 正在彻底改造其支付基础设施,以应对即将到来的 AI 智能体交易浪潮。最新更新引入了通用商务协议和新的服务器架构,旨在将 Google Pay 定位为自主智能体而非人类用户执行购买的中央清算所。
Google 在 I/O 大会上发布了新款 Coral Board,这是一款紧凑型单板计算机,专为设备端 AI 设计,可在本地运行 Gemma 3 模型。
Bloomberg泄露了苹果iOS 27中Siri的全面改版方案。核心架构是Siri将基于Google Gemini构建,界面新增下拉菜单,允许用户直接切换至ChatGPT或Claude。这表明苹果在重建Siri后,选择整合外部大模型。此外,苹果还将推出与Perplexity竞争的AI网络搜索功能、自然语言创建Shortcuts的能力以及AI照片编辑工具。此次更新是Siri历史上规模最大的一次。
BREAKING: A first look with renders at Apple's upcoming iOS 27, completely revamped Siri, major new AI features, enhance...
YouTube推出一项新的AI功能,用户可以通过输入文字提示词(如特定兴趣、心情或主题)来创建个性化的视频内容流。该功能目前面向美国的YouTube登录用户,支持英语,并可在移动端应用或桌面端使用。用户可以在YouTube主页顶部点击“Your custom feed”选项卡,在AI文本框中输入描述来生成并固定自己的定制内容流。
谷歌AI摘要(AI Overview)频繁出现基础拼写错误,如将“Google”字母数答错、拼错常见单词。谷歌称大语言模型在单词字母计数上存在难题。研究人员解释,因模型基于Transformer架构,将文本拆分为词元(token)处理而非逐字母识别,此属固有缺陷,难以彻底根治。这类错误提醒用户需核实AI生成内容的准确性。
YouTube 更新了 AI 视频标注功能。首先,标注标签位置将更显眼:长视频标签将出现在播放器下方、描述栏上方;Shorts 短视频标签将以覆盖层形式显示在视频上。其次,若系统检测到视频使用了写实类 AI 但创作者未手动声明,系统将自动为其添加 AI 使用标签。创作者可在 YouTube Studio 中更新披露状态。此外,使用 YouTube 自有 AI 工具(如 Veo 或 Dream Screen)创作的内容,以及包含表明其为完全生成式 AI 的 C2PA 元数据的内容,其披露标签将永久显示。
Google发布最新Coral开发板,搭载Gemma系列模型,实现高效的本地设备端AI。核心演示包括板载实时语音翻译、通过自然语言控制硬件,以及利用视觉与声音生成音乐。此次升级的关键在于无需云端联网,解决了传统本地AI在延迟、隐私和成本方面的痛点。通过硬件与模型的深度结合,Google将AI的应用场景从云端拉回设备本地,计划于今年夏天推出。
Introducing the newest Coral board, for efficient, on-device AI! Check out the demos in the video: - On-board speech tra...