Omni Flash is a smart model. The way the hand is wet, the water ripples, the refraction, the shadows, the sound effects ...
Omni Flash is a smart model. The way the hand is wet, the water ripples, the refraction, the shadows, the sound effects ...
Introducing Nano Banana 2 Lite 🍌 and Gemini Omni Flash 🔮, our new generative media models in the Gemini API and AI Stu...
Introducing Nano Banana 2 Lite 🍌 and Gemini Omni Flash 🔮, our new generative media models in the Gemini API and AI Stu...
Google AI 推出两大模型更新:1)Nano Banana 2 Lite——最快、最经济的 Gemini 图像模型,文本生成图像不到 4 秒,已上线 Gemini API 和 AI Studio,即将登陆 NotebookLM、Google 搜索、Google Photos 等;2)Gemini Omni Flash 进入公开预览——原生多模态模型,支持低成本视频生成与对话式编辑,可通过 Gemini API、AI Studio 及 Gemini Enterprise Agent Platform 集成。两模型结合可快速实现空间设计重绘:上传照片、滑动选择设计方案,Omni 将细节以电影级动画呈现。演示应用已在 AI Studio 上架。
We're shipping 2 major releases: 🔘 Nano Banana 2 Lite: our fastest and cheapest Gemini Image model 🔘 Gemini Omni Flash...
Google DeepMind 推出 Nano Banana 2 Lite(gemini-3.1-flash-lite-image),为 Nano Banana 系列速度最快、成本最低的图像模型,文本到图像输出仅需 4 秒,每 1K 分辨率图像成本 $0.034,已上线 Google AI Studio、Gemini API 及消费者产品(AI Mode in Search、Gemini app 等)。同时推出 Gemini Omni Flash(gemini-omni-flash-preview),支持高画质视频生成与对话式编辑,视频输出定价 $0.10/秒,面向开发者开放 API。
人形机器人公司Apptronik在奥斯汀建成近9万平方英尺(约8361平方米)的机器人实训园,其Apollo机器人通过远程操控反复进行装箱、分拣等实操训练,数据用于优化AI模型。公司累计融资约10亿美元,估值超55亿美元。投资方梅赛德斯-奔驰已在工厂部署Apollo,谷歌DeepMind借助Apollo改进机器人AI模型Gemini Robotics。2023年推出的初代Apollo已迭代至二代,身高约1.8米,可举25公斤,续航4小时。公司同步开发双足与轮式机型,目标让机器人进入工厂、服务行业与家庭。
GOOGLE 🔥: A new Nano Banana 2 Lite image generation model is on the horizon! > "Introducing Nano Banana 2 Lite for ultr...
GOOGLE 🔥: A new Nano Banana 2 Lite image generation model is on the horizon! > "Introducing Nano Banana 2 Lite for ultr...
⚡️🍌🔮
Google UK与Public First研究发现,英国职场AI采用率一年内从34%升至73%,但呈不均衡曲线。仅15%的“AI Trailblazers”(深度用户)晋升概率高84%、绩效高88%、加薪概率高55%,每周节省近8小时。其余85%仍处于旁观、实验或实践阶段。阻碍因素包括:一次即弃的提示词习惯、搜索框思维、缺乏明确使用许可。Public First推出AI技能测验,Google的“AI Works for Britain”计划支持2030年前培训1000万工人AI技能的目标。
谷歌在 reCAPTCHA 中测试新的人机验证方式,要求用户对着摄像头完成挥手或张开手掌等动作,由 AI 提取 21 个手部关节坐标完成验证。系统仅收集手部地标数据,验证后删除视频/图片,不保留音频。网友 @Patrosi73 发现可用静态手部图片通过 OBS 虚拟摄像头输入绕过验证,Neowin 作者复现成功,调整通用挥手图片位置即可被识别为有效手势。
谷歌宣布,所有符合条件的美国 Gemini 免费用户均可使用由 Nano Banana 驱动的个性化图像生成功能,不再仅限 Plus、Pro 和 Ultra 订阅用户。该功能从用户授权的 Gmail、谷歌相册、YouTube 和谷歌搜索中获取信息,自动生成贴合个人兴趣的图像。用户需主动开启“个性化智能”,并自行选择 Gemini 可访问的应用,也可随时关闭。据悉,今年早些时候 Gemini 月活跃用户已突破 7.5 亿。
Google 新论文提出“验证债务”概念:AI 加快论文产出,但人工核查成为瓶颈。为此推出智能体验证(agentic verification)方案,并开发 Paper Assistant Tool 原型系统。该系统将论文拆解为多个部分,深入检查难点并汇总审稿意见,聚焦证明错误、实验漏洞、缺失对比等客观错误,而非直接给出接收/拒稿决策。在数学与计算机科学已知错误测试中,该工具比单次模型调用发现更多证明错误;在 STOC 和 ICML 的面向作者试点中,许多作者据此修复了严重理论缺陷或补充了实验。论文指出科学审稿可能需要独立 AI 栈以应对日益自动化的论文生成。
Anthropic 今日推出 Claude apps gateway,一个自托管控制平面,让企业能在 Amazon Bedrock 和 Google Cloud 上运行 Claude Code。它作为单个无状态容器部署于 Linux,后端使用 PostgreSQL,提供企业级 SSO 登录(通过 OIDC 对接 Google Workspace、Microsoft Entra ID、Okta 等)、集中策略管理、角色权限、路由(支持故障转移)以及按日/周/月、按组织/群组/用户的消费上限。遥测数据通过 OTLP 发送至用户配置的收集器。gateway 不会向 Anthropic 发送推理流量或使用数据(除非配置使用 Claude API)。即日起可用。
Google 宣布,Gemini 应用的 Nano Banana 驱动个性化图片生成功能向所有符合条件的美国用户免费开放,此前仅限 Plus、Pro 和 Ultra 订阅用户。该功能基于 Gemini 对用户喜好的理解生成图片,无需在提示词中指定具体内容,并可从 Google Photos 提取用户照片。数据来自 Gmail、Google Photos、YouTube 和 Search 等 Google 账户连接。Personal Intelligence 为可选功能,默认用于每个提示,用户可在 Tools 菜单中关闭。上个月 Google 预告了 Gemini 应用的后续更新,包括 Daily Brief、改版界面、AI 视频模型 Gemini Omni 和个人 AI 智能体 Gemini Spark。Gemini 月活跃用户已超 7.5 亿。
Personal Intelligence 🤝 Nano Banana 2 Personal Intelligence now gives Gemini an understanding of your preferences and i...
Want to host your own Gemma hackathon? We're sponsoring 1-day hackathons on Kaggle to help developers dive into open mod...
谷歌云将上线 SandboxAQ 的两款专业 AI 模型:AQCat 用于半导体制造、电池开发等场景,识别具有潜力的催化剂和材料候选物;AQPotency 用于药物发现,筛选最可能结合疾病靶点的分子。SandboxAQ 前身为 Alphabet 量子技术部门,已通过美国《芯片法案》获 5 亿美元拨款。CEO 表示生物制药是当前最大短期机遇,客户正利用该技术研究胶质母细胞瘤、前列腺癌、阿尔茨海默病、帕金森病和心血管疾病。
Android 平台最新版谷歌翻译应用(版本号 10.23.29.934758792.2-release)出现了名为“连续打卡天数”的桌面小组件,可显示当前连续练习天数。用户点击小组件即可直接进入练习模式,小组件支持自由调整大小。该功能基于谷歌翻译练习模式原有的“连续练习”机制——用户每天完成一次练习即可增加连续打卡天数,类似多邻国的“连续学习天数”,旨在鼓励语言学习习惯养成。
推文对三款Flash级模型(Gemini-3.5-Flash、Step-3.7-Flash、DeepSeek-V4-Flash)进行横评。这些模型定位为多智能体系统和RAG系统的驱动模型。评测维度包括Agent Loop迭代能力、Agent能力、前端/后端、空间理解、美学、性价比等。Gemini-3.5-Flash更适合前端页面、建模等“漂亮活”。Step-3.7-Flash极具性价比,在Agent测试中Token效率极高(用最少Token完成最多任务),适合作为OpenClaw、Hermes等Agent框架的驱动模型。DeepSeek-V4-Flash后端能力出色,适合写脚本或驱动ClaudeCode用于AI-Ops。
Google限制了Meta对Gemini模型的使用,原因是Meta要求的计算容量超出Google供应能力。Meta在安全自动化、客服、广告工具、编程及内部工作流中均依赖Gemini。Google面临自身云客户、Gemini产品与有限数据中心容量之间的资源竞争。Google Cloud 3月季度收入增至200亿美元,CEO Sundar Pichai表示计算容量短缺制约了增长,并导致未交付订单较前一季度近乎翻倍。
据英国《金融时报》报道,谷歌对Meta使用其Gemini AI模型设限。Meta寻求的计算容量超出谷歌所能提供,导致其部分内部AI项目受阻延迟。其他谷歌客户也受影响,程度较轻。Meta已鼓励员工提高AI token使用效率。
Meta 向谷歌申请的 Gemini 算力规模超出后者供给能力,谷歌现已对 Meta 调用其 Gemini 大模型实施使用限制。Alphabet 约在今年 3 月告知 Meta 无法满足所需算力,导致 Meta 多项内部 AI 项目受阻延期。Meta 已要求员工节约使用模型 token。谷歌一季度云营收达 200 亿美元,CEO 皮查伊表示算力供给瓶颈制约云业务增速,同时令云部门积压订单量环比近乎翻倍。
Google Research 于2024年开源时序预测基础模型TimesFM(ICML 2024),采用预训练+零样本预测范式。2025年9月发布的2.5版本参数从500M降至200M,上下文窗口扩展至16K,新增30M分位数预测头,可同时输出点预测及10%-90%置信区间。200M参数单GPU可运行,16K上下文支持五年日数据。模型已内置在BigQuery ML、Google Sheets、Vertex AI中,开源版本通过pip install即可使用。2026年4月通过HuggingFace Transformers和PEFT支持LoRA微调,便于领域适配。
美国AI基础设施建设最大瓶颈已从GPU变为许可。《The Information》地图显示2023年以来有300多项州级和地方数据中心禁令或暂停,今年通过275项,还有75项在审,中西部和南部抵制最强。但现实数据反超担忧:微软新一代AI数据中心采用芯片级闭环冷却,每站每年避免超1.25亿升水,全舰队用水效率自2021年提升39%至0.30升/kWh;谷歌86%淡水来自低中风险源,全球PUE 1.09(行业均值1.56)。2015–2024年研究表明数据中心通过分摊固定电网成本适度降低了居民平均电价。趋势已转为“自带电源”:谷歌500 MW核电、微软835 MW三哩岛、Meta 1121 MW核电协议。
谷歌今年 5 月宣布将 Play 商店集成至 Gemini 助手,现已逐步推送。用户可在 Gemini 聊天窗口中直接搜索、安装应用或进行内购,无需离开 Gemini。例如,询问“帮我找一款可以规划每周吃什么的 App”,Gemini 会搜索并跳转至 Play 商店详情页。该功能需年满 18 周岁,仅支持个人账号,且 Android 设备需安装 Play 商店。