AIHOT
内容
精选全部 AI 动态AI 日报主题收藏
接入
Agent 接入
更多
关于更新日志反馈
内部员工登录
精选全部日报更多
内部员工登录
全部动态
全部一手资讯X论文
标签「Google」清除
7月2日周四
23:59Chubby♨️25用户仍在等待Gemini 3.5 Pro发布
20:45The Decoder:AI News(RSS)42Google 为 NotebookLM 引入 TikTok 风格短视频
19:39Ars Technica:AI(RSS)70精选谷歌AI建设导致2025年用电量增长37%
17:06MarkTechPost(RSS)72精选Google Health API 推出 CLI:ghealth 是一款针对 Fitbit 数据的开源工具
13:04IT之家(RSS)48谷歌详解安卓Halo:状态栏专属席位充当AI智能体交互中枢
07:29ginobefun39今日早报:本地AI补齐工程栈、LongCat万亿模型落地国产算力、美图应用方法论
03:26Google Gemini35Gemini Spark 五新功能,打造更强个人 AI 智能体
02:56Google Gemini63Gemini Spark 五项新方式强化个人AI助手
02:32Google Blog:AI(RSS)43Google 2026年6月AI更新汇总
01:59Ethan Mollick61针对实际用例对模型做基准测试:Gemini 3.1 Pro vs GPT-5.5 咖啡馆案例
01:17Google Developers Blog(RSS)41我们为何构建ADK 2.0
01:17Google Developers Blog(RSS)68精选Google Cloud Workbench Notebooks 扩展发布:在 VS Code 中连接云端 Jupyter 环境
00:17Google Developers Blog(RSS)52用 Genkit 构建智能体全栈应用
00:02Google Blog:AI(RSS)42纽约市教育界和行业领袖齐聚Google AI教育峰会 共议AI课堂未来
7月1日周三
23:03IT之家(RSS)50谷歌 AI 智能体 Gemini Spark 登陆苹果 Mac,可实时追踪资讯动态
22:32TechCrunch:AI(RSS)57Gemini Spark,Google 智能体助手,现已登陆 Mac
22:30🚨 AI News | TestingCatalog37谷歌测试新Gemini Flash,候选3.6/4
22:25Google AI55Google DeepMind SynthID 水印技术进展
20:25The Verge:AI(RSS)53Google Home Speaker 评测:硬件出色但 Gemini 尚未成熟
16:02MarkTechPost(RSS)69Google Research 推出 TabFM:面向表格数据的零样本分类与回归基座模型
10:35SemiAnalysis57Google 下一代 TPU(Humufish)将改用 Intel EMIB-T 封装
08:37小互23Google与Claude新模型今晚发布预测命中
08:30Berryxia.AI55Google推出Nano Banana 2 Lite与Gemini Omni Flash,实现图像到视频快速闭环
08:28ginobefun50Sonnet 5发布,谷歌补齐媒体模型,吴恩达画出智能体开发三循环
08:03IT之家(RSS)50谷歌推出 AI 生图模型 Nano Banana 2 Lite:4 秒出图,比标准版更快更便宜
07:28🚨 AI News | TestingCatalog48NotebookLM 推出 Short Video Overviews 生成 60 秒竖版视频
07:19Simon Willison 博客54Gemini 3.1 Flash Lite Image(Nano Banana 2 Lite)发布
03:55The Verge:AI(RSS)50Google NotebookLM 新增 TikTok 风格竖屏视频摘要功能
03:55NotebookLM68精选NotebookLM Short Video Overviews 全量上线 Web 英文版
03:53Runway49Runway 推出 Gemini Omni Flash 视频生成编辑
03:30Logan Kilpatrick32Android总裁谈AI解放用户与OS智能化
03:29TechCrunch:AI(RSS)57Google 发布更快更便宜的图像生成器 Nano Banana 2 Lite
03:20AYi62卧槽,Google这回不拉胯了, 这才是短视频真正该有的打开方式啊, NotebookLM可以把复杂资料直接做成六十秒竖屏概览, 刷信息流的功夫就能啃完一个硬核概念了🤯
02:36Ars Technica:AI(RSS)69Google DeepMind 发布 Nano Banana 2 Lite 图像生成模型
01:58TechCrunch:AI(RSS)72精选Acti 将 AI 智能体直接放入手机键盘
01:38The Decoder:AI News(RSS)59Google 发布 Nano Banana 2 Lite 图像模型与 Gemini Omni Flash 视频模型
01:31Rohan Paul72Google发布Nano Banana 2 Lite与Gemini Omni Flash
01:17Google Developers Blog(RSS)67精选ADK Go 2.0 发布:构建可靠的多智能体应用,新增基于图的工作流引擎、人工参与循环与动态编排
01:17Google Developers Blog(RSS)52Google发布新技能:从你的编码智能体驱动智能体质量飞轮
00:50fofr73Google 发布 gemini-skills,基于 Omni API 快速搭建 AI 智能体
全部 AI 动态
AI 相关资讯全量信息流
全部一手信源资讯推文
全部模型产品行业论文技巧
7月2日
23:59
Chubby♨️@kimmonismus
25
我们还在等待Gemini 3.5 Pro,我原本预期六月底发布。

Chubby♨️: The only question remaining now is: will GPT-5.6 also have guardrails as strict as Fable 5's, or does OpenAI have better...

GoogleOpenAI大佬观点
20:45
The Decoder:AI News(RSS)
42
Google 为 NotebookLM 引入 TikTok 风格短视频

Google 为 NotebookLM 新增视频概览功能,可将上传的源文件转换为 60 秒竖屏短视频,分解特定主题。该功能目前正在移动端和网页端向 Google AI Ultra 和 Pro 订阅者推出,免费用户即将获得访问权限。NotebookLM 是 Google 的 AI 笔记工具,能分析多源内容并以不同格式重新打包。

Google产品更新视频
19:39
Ars Technica:AI(RSS)
精选70
谷歌AI建设导致2025年用电量增长37%

2025年,谷歌年度用电量同比上涨37%,创历史最大增幅。数据中心全年消耗超4200万兆瓦时,超过新西兰、丹麦、尼日利亚等国总用电量。自2019年以来,谷歌总用电量已增长超250%。用电激增主要来自Google Cloud、YouTube视频流及支撑AI产品和服务的数据中心建设与运营。公司表示,AI基础设施建设速度超过电网脱碳速度,但仍致力于扩大全球清洁电力规模,并通过技术创新降低运营排放。2024年谷歌用电量增幅为27%。

Google行业动态部署/工程

推荐理由:谷歌2025年电力消耗暴增37%创历史纪录,清洁能源购买未能完全掩盖新建天然气电厂的排放,AI扩张的环境代价正加速兑现。
17:06
MarkTechPost(RSS)
精选72
Google Health API 推出 CLI:ghealth 是一款针对 Fitbit 数据的开源工具

ghealth 是一款封装 Google Health API v4 的开源命令行工具,以单个 Go 二进制文件发布(Apache 2.0 协议)。它提供 40 种已验证的数据类型(包括步数、心率、睡眠、体重、血氧饱和度、心率变异性等)的结构化 JSON 输出。工具采用 Agent 优先设计,具备确定性退出码、--dry-run 和 --raw 标志,并附带两个 SKILL.md 文件供 AI 智能体使用。用户需自行创建 OAuth 凭据,通过 PKCE S256 认证。数据来源覆盖 Fitbit、Pixel Watch 及连接的第三方设备。

GoogleMCP/工具开源/仓库数据/训练

推荐理由:把 Google Health API 封装成终端和 AI 代理友好的 CLI,一次性解决了认证、JSON 输出和分页这些烦人细节,想用 Fitbit 数据做健康分析或喂给代理的人可以直接上手,但它的影响仅限于个人健康数据爱好者这个小圈层。
13:04
IT之家(RSS)
48
谷歌详解安卓Halo:状态栏专属席位充当AI智能体交互中枢

谷歌昨日发布视频,详细介绍安卓Halo功能。该功能于今年5月I/O大会亮相,旨在提升后台AI助手透明度。启用后,屏幕顶部状态栏拥有专属席位,实时显示AI智能体(如Gemini)状态。安卓总裁萨米尔·萨马特称,Halo为智能体提供专用沟通平台,用于报告更新、接受用户指示,在需要人工介入的后续提问、进度更新、结果展示时,用户无需重新打开AI应用即可交互。

智能体Google产品更新端侧
07:29
ginobefun@hongming731
39
今日早报:本地AI补齐工程栈、LongCat万亿模型落地国产算力、美图应用方法论

本地AI倡导者Ahmad Osman指出开源与闭源差距缩至4-8个月,但缺搜索、工具、Agent等基础设施。美团发布LongCat-2.0(1.6T参数/48B激活MoE,30T tokens预训练,原生1M上下文),五万卡国产算力集群训练,SWE-bench Pro 59.5领先Gemini 3.1 Pro等,预览版OpenRouter调用量前三。美图CEO吴欣鸿:2025年营收38.58亿元,净利润9.65亿元同比增64.7%,AI影像收入占比76.6%,海外MAU重回1亿。

智能体Google现象/趋势部署/工程
03:26
Google Gemini@GeminiApp
35
使用 Gemini Spark 的新方式,让您的生活更轻松。 从 macOS 版 Gemini 应用中的集成到智能触发器,我们正在通过五种方式让 Gemini Spark 成为更强大的个人 AI 智能体,帮助您全天候完成任务。
智能体Google产品更新
02:56
Google Gemini@GeminiApp
63
你可以使用 Gemini Spark 的新方式来让生活更轻松。 从 macOS 版 Gemini 应用中的集成到智能触发器,以下是我们让 Gemini Spark 成为更强大的个人 AI 智能体、帮助你全天候完成任务的五种方式。
智能体Google产品更新
02:32
Google Blog:AI(RSS)
43
Google 2026年6月AI更新汇总

Google在6月发布多项AI更新:推出Gemini 3.5 Live Translate实时语音翻译;

Google多模态模型发布端侧
01:59
Ethan Mollick@emollick
61
主推文强调必须针对实际用例做基准测试,因为决策层层叠加时模型差异会被放大,标准基准无法反映 Gemini 3.1 比 GPT-5.5 更不关心咖啡馆财务损失。引用案例:Andon Labs 的 AI 智能体用 Gemini 3.1 Pro 在斯德哥尔摩开咖啡馆,过度采购且易被欺骗,支出 $15k、收入仅 $9k,亏损 $6k,现已切换到 GPT-5.5。

Andon Labs: Gemini 3.1 Pro lost $6k running Andon Café. 2 months ago, our AI agent opened a café in Stockholm. It over-ordered and w...

智能体GoogleOpenAI现象/趋势
01:17
Google Developers Blog(RSS)
41
我们为何构建ADK 2.0

Google官方博客阐述了构建ADK 2.0的动机——包括核心特性与升级理由,并解释了开发者应考虑迁移的原因。该文章发布于ADK 2.0正式上线次日。

智能体Google产品更新
01:17
Google Developers Blog(RSS)
精选68
Google Cloud Workbench Notebooks 扩展发布:在 VS Code 中连接云端 Jupyter 环境

Google Cloud Workbench Notebooks 扩展正式上线,开发者可在 VS Code 中直接连接可扩展的云端 Jupyter 环境,无需切换上下文即可利用高性能 Google Cloud 基础设施完成机器学习全流程。该扩展已完全开源,可在 GitHub 和 VS Code Marketplace 获取。

Google产品更新部署/工程

推荐理由:这个扩展把Google Cloud的Jupyter环境直接嵌进VS Code,做ML的开发者不用再切换窗口,工作流会流畅不少,但对行业格局影响不大。
00:17
Google Developers Blog(RSS)
52
用 Genkit 构建智能体全栈应用

开源框架 Genkit 推出 Agents API,将消息历史、工具循环和流式传输封装为单一接口,简化对话 AI 开发。该 API 支持服务器或客户端管理的状态持久化,可实现历史分支、长时间运行的分离任务及多智能体协调等高级工作流,并通过统一线协议连接前后端。目前以 TypeScript 和 Go 预览版发布,集成 Genkit Developer UI,开发者无需编写客户端代码即可测试、调试和检查智能体快照。

智能体Google产品更新部署/工程
00:02
Google Blog:AI(RSS)
42
纽约市教育界和行业领袖齐聚Google AI教育峰会 共议AI课堂未来

Google与New York Jobs CEO Council、Urban Assembly联合举办AI教育峰会,150名教育及行业领袖参与。通过aiEDU的“Vibe Coding”和Google的“Meet LEA”实践环节,与会者探索了Google AI mode和NotebookLM如何激发好奇心、提升AI素养。行业领袖指出,AI的真正价值在于赋能问题解决,而适应性、协作、批判性判断等“人类技能”愈发关键。与会者一致同意,需坚守隐私和公平访问原则。最终共识:技术创新必须与学校合作,而非绕开学校。

Google行业动态
7月1日
23:03
IT之家(RSS)
50
谷歌 AI 智能体 Gemini Spark 登陆苹果 Mac,可实时追踪资讯动态

谷歌 AI 智能体 Gemini Spark 已登陆 macOS,整合进现有 Gemini 桌面客户端。Mac 版支持实时追踪赛事比分、股价、突发新闻等资讯,并可对接 Google Tasks、Google Keep、Canva、Dropbox、Instacart、OpenTable、Zillow 等应用,执行餐厅订位、生鲜采购、设计海报、预约看房等任务,还能读取本地文件分类整理或生成谷歌办公套件文档。macOS 测试版目前仅面向美国地区谷歌 AI Ultra 订阅会员开放,初期不支持跨设备联动,后续将支持手机端下达复合指令调用桌面端。谷歌同期推出对自定义 MCP 协议的支持。

智能体GoogleMCP/工具产品更新
22:32
TechCrunch:AI(RSS)
57
Gemini Spark,Google 智能体助手,现已登陆 Mac

Google 的 AI 智能体助手 Gemini Spark 本周三正式登陆 Mac 版 Gemini 桌面应用。新增实时追踪话题功能,可追踪体育比分、股票、突发新闻等动态。已集成 Google Tasks、Google Keep 以及 Canva、Dropbox、Instacart、OpenTable、Zillow Rentals 等第三方应用。用户可用 Spark 整理文件,将电脑文件作为 Google Workspace 文档的数据源。未来将在手机上支持指派多步骤任务。目前 Mac 版 Spark(beta)仅限美国地区 Google AI Ultra 订阅者使用,同时支持自定义 Model Context Protocol(MCP)连接更多应用。

智能体GoogleMCP/工具产品更新
22:30
🚨 AI News | TestingCatalog@testingcatalog
37
GOOGLE 🔥: 新的 Gemini Flash 检查点正在 LM Arena 上测试,可能会以不同的版本号发布。 Gemini 3.6 Flash 甚至 Gemini 4 Flash 都是可能的选项。 很快?👀
Google行业动态
22:25
Google AI@GoogleAI
55
Google DeepMind SynthID 水印技术进展

Google DeepMind 2023 年推出 SynthID 数字水印,已覆盖图像、视频、音频和文本,累计标记超 1000 亿图像视频及 6 万年音频。用户可在 Google 搜索、Chrome 内 Gemini 及 Gemini App 验证内容,使用超 5000 万次。同时采用 C2PA Content Credentials 标准,可查内容来源与修改历史。已开源文本水印技术,并与 OpenAI、NVIDIA、Apple 等合作推广。

Google产品更新多模态安全/对齐
20:25
The Verge:AI(RSS)
53
Google Home Speaker 评测:硬件出色但 Gemini 尚未成熟

Google 推出首款“为 Gemini 打造”的智能音箱 Home Speaker,售价 99.99 美元。硬件设计精巧,音质在体积相当的产品中表现良好,支持 360 度音效、立体声配对、Matter 控制及 Thread 边界路由器功能,可配合 Google TV Streamer 作为音频输出。然而,内置的 Gemini for Home 智能助手响应缓慢、不可靠,且部分功能需要付费才能使用。相比前代 Nest Audio,新款音箱尺寸更小但低频偏弱,在同价位竞品(Echo Dot Max、HomePod Mini)中音质排名第三。

Google评测/基准语音
16:02
MarkTechPost(RSS)
69
Google Research 推出 TabFM:面向表格数据的零样本分类与回归基座模型

Google Research 发布 TabFM v1.0.0,一种面向表格数据的零样本基座模型,无需针对特定数据集训练、调参或特征工程即可进行分类和回归。TabFM 将整个数据集作为统一提示,通过上下文学习在单次前向传播中生成预测。其架构融合 TabPFN 风格的行/列交替注意力与 TabICL 风格的行压缩和上下文学习。模型在数亿个由结构因果模型动态生成的合成数据集上训练。在 TabArena 基准(38 个分类、13 个回归数据集,样本量 700 至 15 万)上,TabFM 及添加交叉特征和 SVD 特征、采用 32 路集成的 TabFM-Ensemble 均优于经过深度调优的监督算法。模型已开源在 Hugging Face 和 GitHub,Google BigQuery 即将通过 AI.PREDICT SQL 命令集成。

Google开源生态数据/训练模型发布
10:35
SemiAnalysis@SemiAnalysis_
57
Google 下一代 TPU(Humufish)将改用 Intel EMIB-T 封装

Google 下一代 TPU(代号 Humufish)确认采用 Intel 的 EMIB-T 封装方案,而非行业默认的 TSMC CoWoS。目前几乎所有主流 AI 训练加速器都使用 TSMC 2.5D 流程,其中绝大部分是 CoWoS。CoWoS 技术将所有芯片放置在一块大型硅/重分布层(RDL)中介层上;而 Intel 的 EMIB 则仅在需要芯片间连接的位置嵌入小型硅桥,直接集成到有机基板中。这是旗舰级 AI 芯片首次脱离 CoWoS 生态,值得关注。

Google行业动态
08:37
小互@xiaohu
23
小互推文"再次双双命中",引用其此前预测:Google今晚将发布新的🍌模型和低配版Omini模型,同时Anthropic的Claude Sonnet 5也将在今晚登场,而OpenAI暂无动静。

小互: Google 今晚将会发布 新的🍌模型和 低配版的 Omini 模型 另外根据情报显示:Claude Sonnet 5 也将会在今晚登场 OpenAI 还没动静...

AnthropicGoogle行业动态
08:30
Berryxia.AI@berryxia
55
Google推出Nano Banana 2 Lite与Gemini Omni Flash,实现图像到视频快速闭环

Google推出超快图像模型Nano Banana 2 Lite(4秒出图)与多模态模型Gemini Omni Flash(支持视频生成与对话式编辑)。两者结合可先快速生成图像再转为动画,大幅降低成本。演示中室内设计照片可快速生成多个方案并动画化,将创意工作流从等待变为快速迭代。

Google图像生成多模态模型发布
08:28
ginobefun@hongming731
50
Sonnet 5发布,谷歌补齐媒体模型,吴恩达画出智能体开发三循环

Anthropic发布Claude Sonnet 5,定位最具agent能力的Sonnet,性能接近Opus 4.8,8月31日前入门价每百万输入token $2、输出$10。Google DeepMind推出Nano Banana 2 Lite(文生图延迟约4秒,每千张$0.034)和Gemini Omni Flash(多模态视频生成与会话式编辑,每秒$0.10,单次上限10秒)。吴恩达提出智能体开发三大核心循环:智能体编程循环、开发者反馈循环、外部反馈循环,强调人类在上下文判断上的优势。三条更新均围绕降低agent落地成本、完善媒体生成流水线及工程框架。

智能体AnthropicGoogle推理
08:03
IT之家(RSS)
50
谷歌推出 AI 生图模型 Nano Banana 2 Lite:4 秒出图,比标准版更快更便宜

谷歌发布新款 AI 图像与视频生成模型 Nano Banana 2 Lite,可在 4 秒内生成一张图像,延迟较此前明显下降。每生成 1000 张图像收费 0.034 美元(约合 0.23 元人民币),主打速度和批量处理能力,面向高频、大规模的内容生产流程。该模型现已登陆谷歌 AI Studio、Gemini API 和 Gemini Enterprise Agent Platform,并将取代初代 Nano Banana。

Google图像生成模型发布
07:28
🚨 AI News | TestingCatalog@testingcatalog
48
Google NotebookLM 新增 Short Video Overviews 功能,可将复杂资料自动转化为 60 秒竖版短视频(类似 Shorts),用于教育等场景的深度讲解。该功能正在向 Google AI Ultra 和 Pro 订阅用户推送(网页端和移动端),免费用户后续也会获得。

NotebookLM: Doom scrolling but make it educational 🤓 Introducing Short Video Overviews in NotebookLM! Turn your most complex source...

Google产品更新多模态
07:19
Simon Willison 博客
54
Gemini 3.1 Flash Lite Image(Nano Banana 2 Lite)发布

Gemini 3.1 Flash Lite Image(API 名 gemini-3.1-flash-lite-image,代号 Nano Banana 2 Lite)发布,被描述为“最快最便宜的 Gemini 图像模型”,专为速度和规模优化。作者在 AI Studio 中测试生成“寻找浣熊”风格的图像,效果优于此前 Nano Banana 模型,但存在拼写错误。

Google图像生成模型发布
03:55
The Verge:AI(RSS)
50
Google NotebookLM 新增 TikTok 风格竖屏视频摘要功能

Google NotebookLM 近日为 AI Ultra 和 Pro 订阅用户推出新功能:可基于用户上传的源文件自动生成 60 秒竖屏 AI 视频,并配上 AI 生成图像和旁白。官方示例以纸片剪贴画风格回顾澳大利亚对鸸鹋的战争。用户可在 NotebookLM 网页或 App 的 Studio 栏中选择“Video”→“Short”,指定或自定义主题后点击生成。此前 NotebookLM 已支持 AI 播客、电影风格视频和视觉解释器。该功能目前仅支持英语,免费用户将很快可用。

Google产品更新多模态
03:55
NotebookLM@NotebookLM
精选68
NotebookLM 正式向 Web 英文用户全量推出 Short Video Overviews(短视频概览)功能。该功能可将复杂资料自动转化为 60 秒竖屏视频,深入讲解任意概念。此前,这一功能已面向 Google AI Ultra 和 Pro 订阅者(移动端及 Web)推出,免费用户即将可用。

NotebookLM: Doom scrolling but make it educational 🤓 Introducing Short Video Overviews in NotebookLM! Turn your most complex source...

Google产品更新视频

推荐理由:NotebookLM 把资料源变成 60 秒竖屏视频,想法不新但落地很实用,学生和内容创作者可能会高频用上,只是颠覆性谈不上。
03:53
Runway@runwayml
49
使用 Gemini Omni Flash 生成和编辑视频,现在已在 Runway 中上线。从提示词、图片或视频开始,创建你能想象到的任何内容。点击下方链接开始使用,或让 Agent 调用 Omni。
Google产品更新视频
03:30
Logan Kilpatrick@OfficialLoganK
32
与 @ssamat(Android 总裁)的对话:AI 如何让我们摆脱对设备的微观管理,为什么以技术对真实用户的帮助来引领对 Android 至关重要,操作系统如何演变为智能系统,以及更多!
Google大佬观点
03:29
TechCrunch:AI(RSS)
57
Google 发布更快更便宜的图像生成器 Nano Banana 2 Lite

周二,Google 推出其自研 AI 图像和视频生成器最新版本 Nano Banana 2 Lite。该模型延迟大幅降低,可在4秒内生成图像,成本为每1000张图像0.034美元,针对高吞吐量工作流优化,现已通过 Google AI Studio、Gemini API 及 Gemini Enterprise Agent Platform 上线,并取代原 Nano Banana 成为“遗留模型”。同日,Google 还宣布扩大 Gemini Omni Flash 的发布范围,视频输出价格为每秒0.10美元,并展示了可将静态图像转为电商视频的演示应用 Omni Product Studio。

Google产品更新图像生成
03:20
AYi@AYi_AInotes
62
卧槽,Google这回不拉胯了, 这才是短视频真正该有的打开方式啊, NotebookLM可以把复杂资料直接做成六十秒竖屏概览, 刷信息流的功夫就能啃完一个硬核概念了🤯
Google产品更新视频
02:36
Ars Technica:AI(RSS)
69
Google DeepMind 发布 Nano Banana 2 Lite 图像生成模型

Google DeepMind 发布 Nano Banana 2 Lite(正式名 Gemini 3.1 Flash Lite Image),默认低思考模式下约4秒生成一张图像,标准 Nano Banana 需约20秒。API 价格为每1000张图像 $0.034,输入 token $0.25/1M,输出 token $1.50/1M,是 Nano Banana 2 的一半,输出成本为 Nano Banana Pro 的八分之一。用户 Arena.ai Elo 评分接近非 Lite 版本,但在文本处理、小字和角色一致性上较弱。所有输出图像均带有 SynthID 水印。即日起可通过 Google AI Studio、API 及 Gemini(选择 Flash-Lite 选项)使用。

DeepMindGoogle图像生成模型发布
01:58
TechCrunch:AI(RSS)
精选72
Acti 将 AI 智能体直接放入手机键盘

新加坡初创公司 Acti 发布基于 Google Gemini 的智能体键盘,可代替用户在应用中执行操作。核心功能 Skills 允许用自然语言创建快捷方式,如长按 T 键翻译消息、C 键发送会议链接。早期测试者两周内创建超 1000 个 Skills。采用本地优先架构,默认不访问私人消息。公司获 530 万美元种子轮融资,由 BITKRAFT Ventures 领投,现已开放下载。

智能体Google产品更新端侧

推荐理由:Acti 想用 AI 代理重塑手机键盘,把 Gemini 塞进输入法,离不离开 App 都能用 AI 的思路很讨巧,但换键盘的阻力不小,目前更像一个有趣的试验品。刚拿到 530 万美元种子轮,有试错空间。
01:38
The Decoder:AI News(RSS)
59
Google 发布 Nano Banana 2 Lite 图像模型与 Gemini Omni Flash 视频模型

Google 推出两款新生成式 AI 模型。Nano Banana 2 Lite 可在 4 秒内生成图像,每张成本 0.034 美元(1K 分辨率),API 名称为 gemini-3.1-flash-lite-image。Gemini Omni Flash 允许开发者通过文本提示在 API 中生成和编辑最长 10 秒的视频,每秒输出价格 0.10 美元。Google 推荐将两个模型链式使用:先用 Nano Banana 2 Lite 生成图像,再传递给 Gemini Omni Flash 转化为视频。两者均使用 SynthID 水印,已通过 Google AI Studio、Gemini API 和 Gemini Enterprise Agent Platform 提供。

Google图像生成多模态模型发布
01:31
Rohan Paul@rohanpaul_ai
72
Google发布Nano Banana 2 Lite与Gemini Omni Flash

Google推出快速图像模型Nano Banana 2 Lite(4秒生成,$0.034/1K分辨率图像)以及视频编辑模型Gemini Omni Flash(输出10秒片段,$0.10/秒,支持文本/图像/视频输入和对话式剪辑)。两者可链式使用:Nano生成参考图,Omni将其动画化,逐步替代gemini-2.5-flash-image。当前Omni Flash API不支持音频参考,视频参考最多3秒但未正确生效;Interactions API保留会话上下文,支持连续3次编辑。

Logan Kilpatrick: Introducing Nano Banana 2 Lite 🍌 and Gemini Omni Flash 🔮, our new generative media models in the Gemini API and AI Stu...

Google图像生成多模态模型发布
01:17
Google Developers Blog(RSS)
精选67
ADK Go 2.0 发布:构建可靠的多智能体应用,新增基于图的工作流引擎、人工参与循环与动态编排

Agent Development Kit (ADK) for Go 2.0 发布,引入了一类基于图的工作流引擎,用于组合复杂多智能体应用。新版本内置人工参与循环(HITL)编排、使用纯 Go 代码的动态执行、以及指数退避重试等自动弹性特性。统一执行模型后,单智能体应用与复杂图均运行在同一运行时上,简化了遥测与状态持久化。

智能体Google产品更新部署/工程

推荐理由:Google 给 Go 生态补上了多智能体编排的关键一环,图工作流引擎和人机协同直接内置,比之前拼积木的方式可靠很多,做 Agent 的 Go 开发者值得跟进。
01:17
Google Developers Blog(RSS)
52
Google发布新技能:从你的编码智能体驱动智能体质量飞轮

Google推出了一项面向编码智能体的新开发者技能,将评估过程自动化成五阶段飞轮:准备数据、运行推理、使用自适应AutoRaters评分、分析失败聚类、执行针对性优化。该工具可针对生产流量持续运行或通过合成场景按需触发,开发者用自然语言描述测试目标,独立评估服务安全验证并统计实际性能提升。

智能体Google产品更新编码
00:50
fofr@fofrAI
73
Google 通过 Gemini Omni API 发布 gemini-skills 技能包,支持视频编辑、文生视频、图片参考视频生成、首帧生成视频,并提供预处理输入视频为 10 秒 720p、音频剥离、视频检查等辅助工具。同作者展示 Omni Flash 模型编辑能力:输入"将桌子改成浅水池",模型输出湿手、水波、折射、阴影及音效。该 API 已开放,可用于构建视频编辑流水线。

fofr: Omni Flash is a smart model. The way the hand is wet, the water ripples, the refraction, the shadows, the sound effects ...

智能体Google教程/实践视频
‹ 上一页
123…40
下一页 ›