AIHOT
内容
精选全部 AI 动态AI 日报主题收藏
接入
Agent 接入
更多
关于更新日志反馈
内部员工登录
精选全部日报更多
内部员工登录
全部动态X · 936 条
全部一手资讯X论文
标签「Google」清除
Sundar Pichai@sundarpichai · 5月7日25

Look what crossed my desk @StephenCurry30!

译看我桌上收到了什么 @StephenCurry30!

Berryxia.AI@berryxia · 5月7日65

这一波!期待起来了~ Google Health + Gemini 直接把Apple Health的封闭优势干掉了。 Google正式推出全新Google Health,彻底取代Fitbit app,支持从任何追踪器导入数据(Apple Watch、Garmin、Whoop全都能导)! 还内置Gemini AI coach,能给你智能健康推荐和个性化指导。 Google这次选择彻底开放生态,而Apple Health依然是封闭花园。 这场健康数据+AI的战争,终于要真正开打了。 你觉得Google Health能挑战Apple Health的统治地位吗?

译Google推出全新Google Health平台,取代Fitbit应用,采用开放生态策略,支持从Apple Watch、Garmin等多设备导入健康数据。平台内置Gemini AI教练,提供智能推荐与个性化指导,直接挑战Apple Health的封闭模式,标志着健康数据与AI竞争进入新阶段。

Google DeepMind@GoogleDeepMind · 5月7日48

Algorithms are part of nearly every aspect of life, from the physics of the natural world to planning shipping routes. Our Gemini-powered coding agent AlphaEvolve has been accelerating progress over the last year - from quantum and biotechnology to logistics and @Google’s AI infrastructure. ↓ https://goo.gle/4uzfe0C

译算法已成为生活几乎所有方面的一部分,从自然世界的物理规律到规划航运路线。 过去一年,我们由Gemini驱动的编码代理AlphaEvolve持续推动多个领域的进步——从量子计算、生物技术到物流及@Google的AI基础设施。↓ https://goo.gle/4uzfe0C

Chubby♨️@kimmonismus · 5月7日53

Google releases the AI ​​Coach in their new health app, beating Apple to the punch! Google has released an AI health coach that uses Gemini. So, essentially, a health coach that works with all (!) your health data. I think this is the first step towards a personal AI doctor and coach, and I believe we're finally getting to the personalized AI medicine I've always hoped for. tl;dr A 24/7 AI coach that combines fitness, sleep, nutrition, cycle tracking, weather, and even U.S. medical records. Google is turning the Fitbit app into Google Health, positioning it as a single hub for fitness, sleep, cycle tracking, vital signs, connected devices, and future Google Fit data transfers. Fitbit remains the hardware core, while the app becomes the home base for Gemini-powered coaching, Google Health Premium, and the new Fitbit Air ecosystem. And all this before Apple moves forward with its new Siri (also powered by Gemini) and releases a similar concept. An interesting move by Google!

译谷歌在新健康应用中发布了由Gemini驱动的AI健康教练,能整合用户的健身、睡眠、营养、周期追踪、天气乃至美国医疗记录等全方位健康数据。此举被视为迈向个人AI医生和个性化AI医疗的第一步。谷歌将Fitbit应用升级为Google Health,使其成为集健身、睡眠、体征监测、设备连接及未来Google Fit数据迁移于一体的中心平台。Fitbit继续作为硬件核心,而应用则成为Gemini驱动教练、Google Health Premium及新Fitbit Air生态的基地。这一发布领先于苹果即将推出的由Gemini赋能的新Siri及类似健康概念。

TestingCatalog News 🗞@testingcatalog · 5月7日45

GOOGLE 🚨: A new Agent Mode is being prepared on Flow to handle complete video production process! Users will be able to: - Plan out scenes - Discuss in-progress project changes - Trigger generation workflows - Manage both project-level and app-level creative tools - Update the state of a project directly from a chat surface Everything is an Agent now 👀

译GOOGLE 🚨: Flow平台正在准备全新的智能体模式,用于处理完整的视频制作流程! 用户将能够: - 规划场景 - 讨论进行中的项目变更 - 触发生成工作流 - 管理项目级和应用级的创意工具 - 直接通过聊天界面更新项目状态 万物皆可智能体 👀

meng shao@shao__meng · 5月7日61

用好 Google 开放标准 DESIGN.md + Agent Skills,1 小时把创业项目做出「亿元公司」的质感 我特别喜欢和关注的两位博主 @gregisenberg 和 @MengTo,一位在 AI Startup 方面有很多奇思妙想,一位在 AI Design 方面有很深的实践,今天他们用 50 分钟深入探讨了怎么让你的项目,做出「亿元公司」的质感,秘诀就在 Design.md! https://www.youtube.com/watch?v=oLu32YpiIJw --- 我自己也在做把各大知名公司的品牌和网站设计,吸收沉淀为 DESIGN.md 的 Agent Skills,厚着脸皮说一句:居然和两位大佬想到一起去了,小做一个广告 😄 Brand to DESIGN.md Skill https://github.com/shaom/brand-to-design-md-skill --- 给还不了解 DESIGN.md 的朋友们再介绍一遍: DESIGN.md 是 Google 最近开源的一个开放标准,起源于 Stitch:用一个 Markdown 文件描述一套设计系统的「灵魂」——字体、色彩、间距、圆角、阴影、动效原则等,全部写成结构化文本。 它的定位是 给 AI 看的设计规范。 · HTML / 组件 = 做好的菜 · design.md = 菜谱 · Skills = 食材与做法 为什么 DESIGN.md 重要? 过去用 AI 生成 UI 的真正痛点不只是「单页好不好看」,更主要的还是一致性: · 第一屏惊艳,第二屏崩塌 · 落地页一种风格、App 一种风格、Pitch Deck 又一种风格 · 每次 prompt 出来的视觉语言都在漂移 DESIGN.md 解决的正是风格的可复用性与可传染性。一个文件,跨页面、跨产品形态(Web / App / 视频 / PPT)保持同一套 DNA。这正是「看起来值一个亿」和「看起来是周末项目」的分界线。 两位博主讨论的可落地工作流 1. 不要从零造设计系统。 选一个你欣赏的品牌(Linear、Stripe、Vercel、Apple……),把它当作参考样本。 2. 用 AI 反向提炼设计语言,输出成你自己的 design.md:色板、字阶、间距尺度、圆角层级、动效曲线、语气(voice)。 3. 在 design.md 之上叠 Skills: Landing Page Skill Mobile App Skill Motion / Video Skill Slide Deck Skill 每个 Skill 都强制引用同一个 design.md 4. 统一应用于所有触点:官网、产品、Pitch Deck、宣传片、社交图——同一套基因。 5. 建立设计「第二大脑」:日常看到好的东西就存档(截图库、Figma 板、Notion)。审美是养出来的,不是下载来的。这是 design.md 之外,AI 替代不了的部分。

译Google开源的DESIGN.md是一个面向AI的结构化设计规范文件,能系统定义字体、色彩、间距等核心设计元素,解决AI生成UI时风格不一致的痛点。通过借鉴成熟品牌设计语言,并用AI将其提炼为DESIGN.md文件,开发者可在此基础上构建Landing Page、Mobile App等各类Agent Skills。这套工作流能确保创业项目的官网、应用、宣传材料等所有触点保持统一的视觉基因,快速呈现专业、一致的“亿元公司”质感。此外,建立日常设计灵感库是培养审美、AI无法替代的关键环节。

Berryxia.AI@berryxia · 5月7日72

前阵子Google 推出的“出国翻译神器” 最被低估的旅行黑科技来了! 你以为出国最大的障碍是语言不通? Google Translate直接把这个问题从“耳朵”里彻底解决。 戴上任何一副耳机,打开Translate (翻译)App,点一下“Live translate(实时翻译)”, 70+语言实时同声传译直接塞进耳朵。 Gemini的高级语音模型不光翻译意思,还完整保留说话人的语气、强调、重音和节奏, 让你听到的是“人”而不是机器。 这已经不是简单的翻译工具, 而是把跨语言对话的摩擦直接抹平,让你在任何国家都能像本地人一样自然交流。 真正的全球化,从“听懂”开始。 下次出国前,记得把这个功能存下来。

译Google Translate的Live translate功能通过耳机提供70多种语言的实时同声传译。用户只需佩戴耳机并启动应用,即可在耳中直接听到翻译。该功能基于Gemini高级语音模型,不仅能准确翻译语义,还能保留说话人的语气、重音和节奏等细微特征,使交流体验更接近真人对话。这项技术旨在消除跨语言沟通的障碍,让用户在海外能进行更自然的交流。

TestingCatalog News 🗞@testingcatalog · 5月7日57

GOOGLE 🚨: Gemini Agent will arrive with support for Scheduled Actions and Skills. Most of the task examples are focused on working with connectors, research tasks, and more. > Declutter your inbox > Prepare for the meeting > News digest > Bill tracker > Ghost writer Gemini will automatically use relevant skills 👀

译GOOGLE 🚨: Gemini Agent 即将推出,支持定时任务和技能调用。 大部分任务示例聚焦于连接器协作、研究任务等功能。 > 整理收件箱 > 会议准备 > 新闻摘要 > 账单追踪 > 代笔写作 Gemini将自动调用相关技能 👀

Google Gemini@GeminiApp · 5月7日67

With Personal Intelligence and Nano Banana 2 working together, you can now turn your interests into imagery in Gemini. Don’t miss our next community event on Discord for a live demo and Q&A with the team behind this latest release. 👉Join us on Discord to watch live: http://discord.gg/gemini 📅 Today at 12:00 PM PT

译通过个人智能与Nano Banana 2的协同工作,您现在可以将兴趣转化为Gemini中的图像。 请勿错过我们在Discord上的下一次社区活动,届时将有最新版本团队的现场演示和问答环节。 👉加入我们的Discord观看直播:http://discord.gg/gemini 📅 今天太平洋时间中午12:00

Josh Woodward@joshwoodward · 5月7日61

Excited to work with one of the world’s biggest music companies Artists will be able to experiment and explore new ways to craft melodies and instruments!

译谷歌旗下Flow Music与全球音乐公司Believe宣布建立合作伙伴关系。根据合作内容,Believe及其旗下音乐发行服务TuneCore的艺术家将能够使用Flow Music这一先进的AI工具来创作和制作原创曲目。此外,双方还将共同推出“Flow Music Sessions”艺术家驻留计划,让音乐人直接参与产品开发过程,共同塑造音乐创作工具的未来。这一合作旨在探索音乐创作的新方式,标志着AI辅助工具正进一步融入主流音乐产业生态。

NotebookLM@NotebookLM · 5月7日69

Friend of the pod @stevenbjohnson explains the magic behind our new source organization feature

译NotebookLM为高级用户推出“自动标注”新功能。当笔记本内来源超过五个时,点击该按钮,系统会自动分析所有内容并将其归类为高级别类别,每个来源可拥有多个标签。标签视图不仅便于查找特定来源,还能让用户选择特定标签来聚焦AI,使其回答仅基于该标签下的来源,从而提升响应速度与信息相关性。此功能也优化了“快速与深度研究”,新添加的来源会清晰显示在现有标签列表下方,方便用户审查和管理。用户可随时重新组织未标注来源或切换回传统列表视图。该功能将于近日向所有用户推送。

Berryxia.AI@berryxia · 5月6日74

我靠!高手果然在民间! 比Google 官方还快3 x,那真的要起飞了。

译一个名为dFlash的GitHub项目宣称,能将Gemma 4模型的推理速度提升至6倍。这一速度提升幅度超过了谷歌官方此前实现的3倍加速,并且据称在实现加速的同时没有损失模型输出的质量。该项目引发了社区关注,被认为展现了民间开发者在模型优化方面的强大能力。

TestingCatalog News 🗞@testingcatalog · 5月6日53

Google is working on Screen Recording support and custom Agents for Antigravity. If Screen Recording is powered by Gemini Live, this feature may mimic AI Studio's functionality, allowing Gemini to see what's happening on your screen in real time. Will we get a real-time voice assistant too? 👀

译Google 正在为 Antigravity 开发屏幕录制支持和自定义智能体。 如果屏幕录制功能由 Gemini Live 驱动,该特性可能会模仿 AI Studio 的功能,使 Gemini 能够实时查看您屏幕上的动态。 我们是否也能获得实时语音助手呢?👀

TestingCatalog News 🗞@testingcatalog · 5月6日52

Google has started rolling out Personal Intelligence for Gemini in EU. Gemini Live will get it soon as well. > Gemini remembers your past chats so that you don't have to repeat yourself. Coming soon to Live.

译谷歌已开始在欧盟推出Gemini的个人智能。 Gemini Live也将很快获得此功能。 > Gemini记住你的过去聊天,这样你就不必重复自己。即将在Live中推出。

Chubby♨️@kimmonismus · 5月6日68

Anthropic just committed to spending $200 billion with Google Cloud over five years. Combined with its $100 billion Amazon deal from April, the company is now making infrastructure commitments that dwarf most public tech companies' entire market caps, and it hasn't even IPO'd yet. Anthropic and OpenAI together now make up roughly half of the $2 trillion in revenue backlog across the four largest US cloud providers. The entire cloud growth story that Wall Street is currently pricing into big tech earnings is, at its core, a bet on two cash-burning startups hitting 20 to 30x revenue growth by 2029. While OpenAI is building its own data centers through Stargate, Anthropic is locking in capacity across Google, Amazon, and Microsoft simultaneously. No single point of failure, no hardware ownership risk. The tradeoff is deeper dependency: Google is running Anthropic on its own TPU chips, not just Nvidia hardware, which means better margins for Google but an increasingly asymmetric relationship for Anthropic.

译Anthropic与谷歌云达成五年2000亿美元云基础设施合同,加之四月与亚马逊的千亿美元协议,其未上市即承诺的云支出规模已超越多数科技公司市值。Anthropic与OpenAI共同占据美国四大云服务商约2万亿美元收入积压订单的一半,这实质上是市场对两家初创公司在2029年前实现20-30倍收入增长的豪赌。与OpenAI自建数据中心不同,Anthropic同时绑定谷歌、亚马逊和微软的云产能,虽避免了单点故障和硬件持有风险,却加深了对云巨头的依赖——谷歌正用自研TPU芯片运行其模型,这种不对称关系可能影响其长期议价能力。

TestingCatalog News 🗞@testingcatalog · 5月6日45

Google is hosting a separate "The Android Show | I/O Edition" event on May 12! > Android is glowing with upcoming Gemini colors, so we may expect loads of AI features to be announced there This means we are getting 2 AI events! 🔥

译Google将于5月12日单独举办一场"The Android Show | I/O Edition"活动! > Android正闪耀着即将推出的Gemini色彩,因此我们可以期待届时宣布大量AI功能 这意味着我们将迎来2场AI活动!🔥

karminski-牙医@karminski3 · 5月6日73

Google 刚刚发布了 Gemma 4系列模型的草稿专用模型! 31B Dense 搭配草稿模型速度竟然能提升3倍! 付出的代价仅仅是多花 1G 显存! 另外 Gemma4-26B 也能提升1.5x 速度, Gemma4-E4B 更是能提升3.1x 速度. 我之前给大家做过 Gemma 4 推测性解码的教程, 当时官方还没有专用草稿模型, 所以我给大家演示的是 gemma-4-31B-it-UD-Q4_K_XL 作为主模型, 然后使用 gemma-4-E2B-it-UD-Q4_K_XL 作为草稿模型, 速度可以提升 1.23x, 草稿接受率在62% 左右. 这次直接翻三倍原因很简单, 因为之前用的 gemma-4-E2B-it-UD-Q4_K_XL 即使已经是量化模型了, 大小也有3GB左右, 而这次的 gemma-4-31B-it-assistant 即使是原始精度也只有 939 MB! 而且是专门为了推测性解码优化的! 接受率也会高. 所以提速自然就明显了. 而代价也仅仅是显存中再多加载这个模型就可以了(大概1GB显存开销). 现在压力来到了 Qwen 这边, 建议 Qwen 赶紧推出 Qwen3.6-27B-assistant, 再不推出我的显卡可是要红温了, 我天天cue你们嗷! #gemma4 #qwen #gemma4assistant #推测性解码 #投机解码

译Google发布了Gemma 4系列模型的专用草稿模型,用于推测性解码优化。31B Dense模型搭配草稿模型速度提升3倍,仅增加1G显存开销;Gemma4-26B和Gemma4-E4B分别提升1.5倍和3.1倍速度。新草稿模型如gemma-4-31B-it-assistant体积仅939 MB,专门优化后接受率高,相比之前使用非专用草稿模型(如gemma-4-E2B-it-UD-Q4_K_XL)提速更明显。作者呼吁Qwen尽快推出类似优化模型(如Qwen3.6-27B-assistant),以应对高性能需求。

Berryxia.AI@berryxia · 5月6日64

Google NotebookLM思维导图正在迎来只重大升级: 这些新功能今天开始推出: 🚗 自定义:通过特定用户提示词来引导你的MindMap 📂 组织:立即重命名并分享你的MindMap 🗺️ 导航:节点之间丝滑顺畅的过渡 告诉我们你的想法!

译Google NotebookLM的思维导图功能正进行重大升级,新功能从今天起推出。核心更新包括自定义功能,用户可通过特定提示词引导MindMap的生成方向;组织功能支持立即重命名和分享MindMap,提升管理效率;导航功能优化了节点之间的过渡,实现更丝滑的交互体验。此次升级旨在增强工具的灵活性和用户体验,并邀请用户反馈意见。

Berryxia.AI@berryxia · 5月6日66

Gemma 4 现在最高能跑到 3倍速度,而且质量完全不变。 他们没有增加参数、没有换新架构,只是推出了一套 MTP drafters(多 token 预测草稿机),让模型一次预测多个 token,彻底绕过了传统 autoregressive 一个词接一个词的串行瓶颈。 GPU 不再傻等,它开始“预判”了。 这意味着: 本地部署实时性大幅提升 Agent、代码生成、实时翻译这些场景直接起飞 开源模型在性价比上的优势又被拉大一截 Google 这次玩的不是参数战,只是把硬件利用率直接压榨到极致。 当闭源模型还在拼“谁更聪明”的时候, 开源已经在拼“谁更快、更便宜、还能本地跑”了。 博客在这里👉 https://blog.google/innovation-and-ai/technology/developers-tools/multi-token-prediction-gemma-4/

译Google通过为Gemma 4引入MTP drafters(多token预测草稿机),在不增加参数、不改变架构和模型质量的前提下,实现了最高3倍的推理速度提升。该技术让模型能一次预测多个token,突破了传统自回归解码的串行瓶颈,极大提升了GPU利用率。这显著增强了本地部署的实时性,并使Agent、代码生成等场景受益,进一步放大了开源模型在性价比和本地运行方面的优势。

Berryxia.AI@berryxia · 5月6日75

Google昨天刚官宣Gemma 4用MTP实现3倍加速, vLLM今天就直接Day-0支持,零延迟把这个加速塞到了所有人手里。 一条Docker命令就能跑: 🚀 现成镜像 + 完整recipes ⚡️ 最高3倍解码速度 ✅ 质量零损失 vLLM recipes在这里👉 https://recipes.vllm.ai/Google/gemma-4-26B-A4B-it

译Google发布Gemma 4模型,采用创新的MTP drafters技术,实现最高3倍解码速度提升且质量无损。该技术让模型一次预测多个token,突破传统自回归生成的串行瓶颈,极大提升GPU利用率。vLLM项目在官方宣布后立即提供Day-0支持,用户可通过一条Docker命令快速部署。这一进步显著增强本地部署的实时性,使Agent、代码生成等场景受益,进一步放大开源模型在性价比和本地化运行方面的优势。

Rohan Paul@rohanpaul_ai · 5月6日71

Anthropic just committed $ 200B to Google Cloud and Google’s TPU chips - per The information, Reuters Turning Claude’s growth into one of the largest cloud infrastructure bets in AI. Anthropic is not just buying servers, but reserving future compute, the scarce mix of chips, power, networking, and data-center space needed to train and serve frontier models. The reported 5-year commitment may represent more than 40% of Google’s recently disclosed revenue backlog, which means a single AI lab could be a major piece of Google Cloud’s future contracted sales. The deeper story is dependency, because Anthropic now spreads Claude across Google TPUs, Amazon Trainium, and Nvidia GPUs to avoid being trapped by one chip supplier or one cloud. --- reuters .com/business/anthropic-commits-spending-200-billion-googles-cloud-chips-information-reports-2026-05-05/

译人工智能公司Anthropic与谷歌云达成一项价值约2000亿美元的多年期承诺,用于购买云计算服务和TPU芯片。此举不仅是购买服务器,更是对未来训练和部署前沿模型所必需的稀缺计算资源(包括芯片、电力、网络和数据中心空间)的长期储备。据报道,此项承诺可能占谷歌云近期披露收入积压的40%以上,意味着单一AI实验室已成为其未来合同销售的重要部分。其深层战略在于分散依赖,Anthropic将Claude的算力分布在谷歌TPU、亚马逊Trainium和英伟达GPU上,以避免受限于单一供应商。

DogeDesigner@cb_doge · 5月6日55

NEWS: xAI, Google and Microsoft have pledged to grant the U.S. government early access to their latest AI models for preliminary national security risk assessments. They are collaborating with CAISI on early evaluations of advanced models before public release. Over 40 assessments already completed focusing on capabilities and security risks.

译新闻:xAI、谷歌和微软已承诺向美国政府提供其最新AI模型的早期访问权限,用于初步的国家安全风险评估。 他们正与CAISI合作,在公开发布前对先进模型进行早期评估。已完成40多项评估,重点关注能力和安全风险。

NotebookLM@NotebookLM · 5月6日61

Source organization has officially ramped to 💯% of users!

译Source organization 已正式面向 💯% 用户全面升级! [引用 @NotebookLM]:资料越多越麻烦?现在不再如此: NotebookLM 现已推出自动标记与分类资料功能(当您拥有 5 个以上资料时),助您减少滚动时间,增加思考/学习/哲思等时间。 重命名、重组、个性化(表情符号!)随您心意定制。

TestingCatalog News 🗞@testingcatalog · 5月6日55

Google is rolling out customization feature for Mind Maps on NotebookLM, along with renaming & sharing options and updated animation. Users will be able to scope their Mind Maps to a specific topic or a source. Did you get it already? 👀

译Google正在为NotebookLM的思维导图功能推出重要更新。核心新增功能包括:用户可通过特定提示词定制思维导图,将其聚焦于特定主题或来源;支持即时重命名和分享导图;节点间切换的动画过渡更加流畅。这些更新旨在提升思维导图的个性化定制、组织管理和导航体验。

TestingCatalog News 🗞@testingcatalog · 5月6日66

Google released Pomelli Catalog, a new feature on Pomelli marketing agent experiment. Pomelli will generate a set of products based on your business DNA, so you can reuse them across your marketing campaigns. For TestingCatalog, it generated a Weekly Newsletter Subscription product and several others. I will package a new campaign soon 👀

译Google在其营销代理实验项目Pomelli中发布了新功能Pomelli Catalog。该功能允许企业添加产品或服务,随后Pomelli将基于企业的“商业DNA”自动生成一系列产品,例如周度通讯订阅产品,供用户在后续营销活动中复用。Pomelli Catalog能利用这些产品信息,为品牌生成个性化的营销活动和高质量宣传图片。目前该功能免费且全球可用。

TestingCatalog News 🗞@testingcatalog · 5月6日71

Google released Multi-Token Prediction (MTP) drafters for the Gemma 4 family. It comes with a 3x speed boost without losing performance. Looking forward to testing a quantized Gemma 4 with MTP drafters on a Mac Mini!

译Google为Gemma 4系列发布了多令牌预测(MTP)草稿模型。它在不损失性能的情况下带来了3倍的速度提升。 期待在Mac Mini上测试带有MTP草稿模型的量化版Gemma 4!

Google Gemini@GeminiApp · 5月6日25

The Gemini Paddock this past weekend was a blast. @McLarenF1 classic cars, custom helmets, the Gemini photobooth, and unrivaled energy. Thank you, Papaya Army. 🧡 #McLarenRacingLive

译上周末的Gemini Paddock真是精彩绝伦。@McLarenF1经典赛车、定制头盔、Gemini照相亭,还有无与伦比的热情。谢谢你们,Papaya Army。🧡 #McLarenRacingLive

Google AI Developers@googleaidevs · 5月6日68

We’re expanding the Gemini API File Search tool 🔍 with 3 new updates that enable developers to more easily build multimodal RAG systems with enhanced precision: + Multimodal Support: By leveraging our Gemini Embedding 2 model, File Search can now reason across image and text simultaneously. + Custom Metadata Filtering: Bring structure to unstructured data by tagging files with custom key-value labels. This pre-filters your data and boosts search speed. + Exact citations: File Search can now capture and return the exact source (down to the page number) for every piece of information indexed. See multimodal File Search in action with our example app in @GoogleAIStudio. Chat with your entire image and doc library, ask questions, and trace answers back to the source: http://goo.gle/4tKSz1k

译Gemini API 文件搜索工具近日扩展三项功能更新,旨在帮助开发者更轻松地构建高精度多模态检索增强生成系统。更新包括:多模态支持,通过Gemini Embedding 2模型实现对图像和文本的同步推理;自定义元数据过滤,允许为文件添加键值标签以结构化非结构化数据,从而提升搜索速度;精确引用功能,能够捕获并返回每条索引信息的精确来源,如页码。开发者可通过Google AI Studio的示例应用体验这些功能,与图像和文档库交互,提问并追溯答案来源。

宝玉@dotey · 5月6日75

Google 为自家开源模型 Gemma 4 发布了 MTP drafter(多 token 预测草稿模型),推理速度最高提升 3 倍,输出质量保持不变。https://x.com/googledevs/status/2051700599184629994/video/1 Gemma 4 是 Google 几周前发布的开源模型系列,从手机端的 E2B、E4B 一直到工作站的 26B MoE 和 31B Dense,官方称上线几周下载量已经突破 6000 万。MTP drafter 用的是 speculative decoding(推测解码):让一个轻量级的小模型先“猜”出接下来好几个 token,再让大模型一次性并行验证,验证通过的部分一口气全部输出。 这套机制对本地跑模型的场景特别有用。LLM 推理之所以慢,瓶颈往往不在算力,而在内存带宽,处理器大部分时间都在把几十亿参数从显存搬到计算单元,只为了挤出下一个 token。推测解码把闲置算力利用起来,让小模型一次预测多个 token,大模型只做验证,等于把流水线拉满。 实际效果上,在 Apple Silicon 跑 26B MoE 模型,批量大小开到 4 到 8 时本地能拿到约 2.2 倍提速。因为最终验证仍由大模型完成,输出和原版逐字一致,没有质量取舍。 drafter 沿用 Gemma 4 的 Apache 2.0 协议,权重已经上传到 Hugging Face 和 Kaggle,transformers、MLX、vLLM、SGLang、Ollama 都已支持。

译Google为其开源模型Gemma 4推出MTP drafter(多token预测草稿模型),采用推测解码技术,能在保持输出质量不变的前提下,将推理速度最高提升3倍。该技术利用轻量级小模型预先推测多个token,再由大模型并行验证,从而显著提高吞吐效率,尤其有利于缓解本地部署时的内存带宽瓶颈。例如,在Apple Silicon上运行26B MoE模型时,批量处理可获得约2.2倍加速。模型沿用Apache 2.0协议,权重已开源,并获主流推理框架支持。

NotebookLM@NotebookLM · 5月6日57

Mind Maps are getting a major glow up 💅 These new features are rolling out today: 🚗Customization: Steer your map with specific user prompts 📂Organization: Rename and Share your maps instantly 🗺️ Navigation: Silky smooth transitions between nodes Let us know what you think!

译思维导图正迎来一次重大升级💅 以下新功能今日上线: 🚗自定义:通过特定用户提示引导你的导图 📂整理:即时重命名并分享你的导图 🗺️导航:节点间丝滑流畅的过渡切换 欢迎告诉我们你的想法!

TestingCatalog News 🗞@testingcatalog · 5月5日60

AI Studio can now use Nano Banana for Image Generation to tweak images on apps generated via AI Studio Build.

译AI Studio 现已可使用 Nano Banana 进行图像生成,以调整通过 AI Studio Build 生成的应用中的图像。

TestingCatalog News 🗞@testingcatalog · 5月5日57

GOOGLE 👀: Gemini 3.2 Flash became available on the Gemini app for a short time for some users. So far we have: - Gemini 3.2 Flash flashing on Gemini - Updated Gemini 3 Flash models on LM Arena in testing - Deprecation notice for Gemini 2 Flash on Vertex AI, promising upcoming Flash GA update - Google I/O coming on May 19, rumored to arrive with a Gemini 3.5 announcement Flash is flashing! ⚡⚡⚡

译GOOGLE 👀:Gemini 3.2 Flash 曾短暂地在部分用户的 Gemini 应用中可用。 截至目前我们已有: - Gemini 3.2 Flash 在 Gemini 上闪现 - 测试中的 LM Arena 上已更新 Gemini 3 Flash 模型 - Vertex AI 上发布 Gemini 2 Flash 的弃用通知,承诺即将推出 Flash 正式发布更新 - Google I/O 将于 5 月 19 日举行,传闻将伴随 Gemini 3.5 的发布 Flash正在闪现!⚡⚡⚡

Berryxia.AI@berryxia · 5月5日75

Google 这一波操作,最让人意外的是 Google直接把LLM推理里最顽固的autoregressive瓶颈干掉了。 他们和UCSD合作推出的DFlash(Diffusion-Style Speculative Decoding),在Google Cloud TPU上实现了3.13倍的推理加速,而且是无损的。 这不是又一个“理论上更快”的小优化,而是真正从根子上改变了生成式解码的范式:用扩散式推测一次生成多个token,彻底绕过传统一个词接一个词的串行限制。 当推理速度突然提升3倍以上,意味着: - 云端成本曲线被重塑 - 实时Agent、长上下文、复杂工具调用都变得更现实 - 本地部署的门槛也被大幅拉低 过去我们总觉得“模型参数越大越强”, 现在硬件+解码策略的系统级突破,正在把“更快”变成真正的生产力杠杆。 Google这波操作,把LLM推理的下一代竞赛直接拉到了硬件+算法联合优化的赛道。 你觉得DFlash这种扩散式推测解码,会不会成为未来所有大模型推理的标准配置? 博客在这里👉 https://goo.gle/4naZ8Yv

译Google与UCSD合作推出扩散式推测解码技术DFlash,在Google Cloud TPU上实现了3.13倍的无损推理加速。该技术突破了传统自回归解码逐个生成token的串行瓶颈,通过一次推测生成多个token来改变生成范式。这一硬件与算法的联合优化,将重塑云端成本曲线,并使实时Agent、长上下文等应用更趋现实,同时大幅降低本地部署门槛。此举将大模型推理的竞争引向了系统级优化的新赛道。

Berryxia.AI@berryxia · 5月5日70

兄弟们!Google 刚刚更新了一个项目! Google 直接把开发者最头疼的“读代码”瓶颈,一键干掉了。 他们刚刚发布的 Code Wiki,让任何一个代码仓库Github都能瞬间拥有一个永远最新、结构化、 智能可聊的 Wiki。 核心三招狠活: - 自动扫描仓库,代码一改文档就实时更新,再也不用担心文档过时 - Gemini 驱动的智能聊天,直接把整个 Wiki 当知识库,回答问题还能超链接跳到具体代码行 - 自动生成架构图、类图、时序图,点一下就能从解释直达源码 新手第一天就能上手,老代码没人维护也能秒懂,大库小库通吃。 Google 自己都说:“读现有代码是软件开发里最大、最贵的瓶颈之一。” 现在,这个时代终于要结束了。 公共仓库已开放预览:http://codewiki.google 你觉得 Code Wiki 会不会成为下一代代码理解标配,把“读代码”从痛苦变成享受?

译Google推出Code Wiki项目,旨在解决“阅读现有代码”这一开发瓶颈。该工具能自动扫描代码仓库,实现文档随代码变更实时更新,避免过时。其核心功能包括由Gemini驱动的智能聊天,可将整个Wiki作为知识库进行问答,并支持超链接跳转至具体代码行;还能自动生成架构图、类图、时序图等可视化图表,并链接到源码。工具适用于各种规模的仓库,帮助新人快速上手或理解遗留代码。目前公共仓库已开放预览。

Rohan Paul@rohanpaul_ai · 5月5日70

Google, Microsoft and xAI just agreed to let the U.S. government test early frontier AI models before the public can use them. The testing will be run by CAISI, a Commerce Department group that checks what advanced models can do and where they may create security risk. The unusual part is that the companies will share versions with reduced or removed guardrails, which lets testers see the model’s raw ability instead of only its polished public behavior. Becasue, a national security test asks whether the model can help with cyber intrusion, malware planning, or other high-risk tasks when its filters are weakened. CAISI has already completed more than 40 evaluations, including tests on models that have not been released. OpenAI and Anthropic made similar agreements in 2024, so the new deal pulls Google, Microsoft and xAI into the same pre-release testing lane. --- wsj .com/tech/ai/google-microsoft-and-xai-agree-to-share-early-ai-models-with-u-s-f95a88d1

译谷歌、微软和xAI已同意在美国商务部机构CAISI的测试下,提前评估其前沿AI模型。测试的特殊之处在于,公司将提供降低或移除安全护栏的模型版本,以便评估其在协助网络入侵、恶意软件规划等高危任务上的原始能力与风险。此前,OpenAI和Anthropic已于2024年达成类似协议。此举背景是白宫正考虑建立针对主要AI模型的政府审查流程,审查重点是其网络能力——即发现和利用软件漏洞以改变现实安全风险的水平。政策转向的触发点是Anthropic的Mythos模型,该公司认为该模型在发现安全漏洞方面能力过强,广泛发布风险过高。

Chubby♨️@kimmonismus · 5月5日63

Google, Microsoft and xAI have agreed to give the U.S. Commerce Department early access to unreleased AI models so the government can evaluate their capabilities and security before public launch.

译Google、Microsoft和xAI已同意向美国商务部提前提供未发布的AI模型,以便政府在公开发布前评估其能力和安全性。

Chubby♨️@kimmonismus · 5月5日57

Gemini 3.2 spotted in Gemini! If we already receive Gemini 3.2 Flash now, the major release will probably be reserved for I/O. h/t @Waguri_Kaoruko8 for finding

译Gemini 中发现了 Gemini 3.2! 如果我们现在就能收到 Gemini 3.2 Flash,那么主要版本可能会留到 I/O 大会发布。 感谢 @Waguri_Kaoruko8 的发现。

Google AI Developers@googleaidevs · 5月5日72

Say goodbye to continuous polling! Eliminate wasted API traffic and simplify orchestration logic with Webhooks in the Gemini API while building complex, long-running agentic apps. 🙌

译告别持续轮询!在构建复杂、长期运行的智能体应用时,使用 Gemini API 中的 Webhooks 来消除 API 流量的浪费,并简化编排逻辑。🙌

Google Gemini@GeminiApp · 5月5日67

From idea to prototype, bring your specific product visions to life with the help of Nano Banana 2 in Gemini. 🪀

译从构想到原型,借助Gemini中的Nano Banana 2,将您独特的产品愿景变为现实。🪀

SemiAnalysis@SemiAnalysis_ · 5月5日55

A common misconception is that TPU v8i must be the training chip because it has two compute dies. Die count is not the relevant metric, what matters is the balance between compute throughput and memory capacity/bandwidth. Reason 1: Memory capacity and bandwidth TPU v8i has 8 stacks of HBM3E 12-Hi versus 6 on TPU v8t, giving it 288 GB of HBM and 8.6 TB/s of memory bandwidth versus 216 GB and 6.5 TB/s on the training chip. This matters because inference decode is memory-bandwidth-bound, not compute-bound. The 8i also carries 384 MB of on-chip SRAM versus 128 MB on the 8t, providing more buffer for KV cache and attention operations. Reason 2: The training chip achieves higher FP4 FLOPs from a single die Despite having two compute dies, TPU v8i achieves only 10.1 PFLOPs at FP4, while the single-die TPU v8t achieves 12.6 PFLOPs. Google designed the 8t's die to be extremely compute-dense, maximizing MXU throughput for training's sustained high arithmetic intensity. This also seems to highlight Google's broader direction, Google is attempting to train with FP4, a regime where the 8t's dense single die excels.

译针对TPU v8i因双计算芯片而被误认为是训练芯片的观点,关键在于计算吞吐与内存容量/带宽的平衡。TPU v8i拥有更高的HBM3E内存容量(288GB对216GB)和带宽(8.6TB/s对6.5TB/s),以及更大的片上SRAM(384MB对128MB),这使其更适合内存带宽受限的推理解码任务。而训练芯片TPU v8t虽为单芯片设计,但通过极致密集的计算单元实现了更高的FP4算力(12.6 PFLOPs对10.1 PFLOPs),以满足训练所需的高算术强度,这也体现了Google尝试使用FP4进行训练的技术方向。

全部 AI 动态
AI 相关资讯全量信息流
全部一手信源资讯推文
全部模型产品行业论文技巧
5月7日
23:40
Sundar Pichai@sundarpichai
25
看我桌上收到了什么 @StephenCurry30!
Google其他
23:21
Berryxia.AI@berryxia
65
Google Health以开放生态挑战Apple Health

Google推出全新Google Health平台,取代Fitbit应用,采用开放生态策略,支持从Apple Watch、Garmin等多设备导入健康数据。平台内置Gemini AI教练,提供智能推荐与个性化指导,直接挑战Apple Health的封闭模式,标志着健康数据与AI竞争进入新阶段。

Google产品更新端侧
23:11
Google DeepMind@GoogleDeepMind
48
算法已成为生活几乎所有方面的一部分,从自然世界的物理规律到规划航运路线。 过去一年,我们由Gemini驱动的编码代理AlphaEvolve持续推动多个领域的进步--从量子计算、生物技术到物流及@Google的AI基础设施。↓ https://goo.gle/4uzfe0C
智能体Google编码行业动态
23:01
Chubby♨️@kimmonismus
53
谷歌推出AI健康教练,整合多维度健康数据

谷歌在新健康应用中发布了由Gemini驱动的AI健康教练,能整合用户的健身、睡眠、营养、周期追踪、天气乃至美国医疗记录等全方位健康数据。此举被视为迈向个人AI医生和个性化AI医疗的第一步。谷歌将Fitbit应用升级为Google Health,使其成为集健身、睡眠、体征监测、设备连接及未来Google Fit数据迁移于一体的中心平台。Fitbit继续作为硬件核心,而应用则成为Gemini驱动教练、Google Health Premium及新Fitbit Air生态的基地。这一发布领先于苹果即将推出的由Gemini赋能的新Siri及类似健康概念。

Google产品更新
22:41
TestingCatalog News 🗞@testingcatalog
45
GOOGLE 🚨: Flow平台正在准备全新的智能体模式,用于处理完整的视频制作流程! 用户将能够: - 规划场景 - 讨论进行中的项目变更 - 触发生成工作流 - 管理项目级和应用级的创意工具 - 直接通过聊天界面更新项目状态 万物皆可智能体 👀
智能体Google产品更新视频
17:06
meng shao@shao__meng
61
用好 Google 开放标准 DESIGN.md + Agent Skills,1 小时把创业项目做出「亿元公司」的质感

Google开源的DESIGN.md是一个面向AI的结构化设计规范文件,能系统定义字体、色彩、间距等核心设计元素,解决AI生成UI时风格不一致的痛点。通过借鉴成熟品牌设计语言,并用AI将其提炼为DESIGN.md文件,开发者可在此基础上构建Landing Page、Mobile App等各类Agent Skills。这套工作流能确保创业项目的官网、应用、宣传材料等所有触点保持统一的视觉基因,快速呈现专业、一致的“亿元公司”质感。此外,建立日常设计灵感库是培养审美、AI无法替代的关键环节。

GREG ISENBERG: how to use Google's NEW open source Design.md + AI Skills to make your startup look like a $100 million company in 1 hou...

智能体Google开源生态教程/实践
08:20
Berryxia.AI@berryxia
72
Google翻译推出实时耳机传译,支持70多种语言

Google Translate的Live translate功能通过耳机提供70多种语言的实时同声传译。用户只需佩戴耳机并启动应用,即可在耳中直接听到翻译。该功能基于Gemini高级语音模型,不仅能准确翻译语义,还能保留说话人的语气、重音和节奏等细微特征,使交流体验更接近真人对话。这项技术旨在消除跨语言沟通的障碍,让用户在海外能进行更自然的交流。

Google: Save this tip before your next big trip abroad ⬇️ With Google Translate's Live translate feature, you can get instant tr...

Google产品更新语音
02:40
TestingCatalog News 🗞@testingcatalog
57
GOOGLE 🚨: Gemini Agent 即将推出,支持定时任务和技能调用。 大部分任务示例聚焦于连接器协作、研究任务等功能。 > 整理收件箱 > 会议准备 > 新闻摘要 > 账单追踪 > 代笔写作 Gemini将自动调用相关技能 👀

Luke Litowitz: New #gemini agent 👀👀👀

智能体GoogleMCP/工具产品更新
02:08
Google Gemini@GeminiApp
精选67
通过个人智能与Nano Banana 2的协同工作,您现在可以将兴趣转化为Gemini中的图像。 请勿错过我们在Discord上的下一次社区活动,届时将有最新版本团队的现场演示和问答环节。 👉加入我们的Discord观看直播:http://discord.gg/gemini 📅 今天太平洋时间中午12:00
Google产品更新图像生成多模态

推荐理由:Nano Banana 2 把 Gemini 的图像生成从写 prompt 变成了识别你的兴趣,不用费力描述也能出图,对普通用户可能是真痛点,看直播看看实际效果。
01:08
Josh Woodward@joshwoodward
61
谷歌旗下Flow Music与全球音乐公司Believe宣布建立合作伙伴关系。根据合作内容,Believe及其旗下音乐发行服务TuneCore的艺术家将能够使用Flow Music这一先进的AI工具来创作和制作原创曲目。此外,双方还将共同推出"Flow Music Sessions"艺术家驻留计划,让音乐人直接参与产品开发过程,共同塑造音乐创作工具的未来。这一合作旨在探索音乐创作的新方式,标志着AI辅助工具正进一步融入主流音乐产业生态。

Google Flow Music: Announcing a new partnership between Google Flow Music and global artist development company, Believe! 🤝 Here's what th...

Google行业动态
00:28
NotebookLM@NotebookLM
精选69
NotebookLM为高级用户推出"自动标注"新功能。当笔记本内来源超过五个时,点击该按钮,系统会自动分析所有内容并将其归类为高级别类别,每个来源可拥有多个标签。标签视图不仅便于查找特定来源,还能让用户选择特定标签来聚焦AI,使其回答仅基于该标签下的来源,从而提升响应速度与信息相关性。此功能也优化了"快速与深度研究",新添加的来源会清晰显示在现有标签列表下方,方便用户审查和管理。用户可随时重新组织未标注来源或切换回传统列表视图。该功能将于近日向所有用户推送。

Steven Johnson: Major new feature for @NotebookLM power users: in the tradition of Mind Maps, Notebook can now auto-label your sources, ...

Google产品更新

推荐理由:NotebookLM的自动标签让管理几十个来源的笔记本不再灾难,特别是和深度研究联动后,能快速聚焦感兴趣的分类直接生成播客,研究人员和深度用户应该会喜欢。
5月6日
23:20
Berryxia.AI@berryxia
74
一个名为dFlash的GitHub项目宣称,能将Gemma 4模型的推理速度提升至6倍。这一速度提升幅度超过了谷歌官方此前实现的3倍加速,并且据称在实现加速的同时没有损失模型输出的质量。该项目引发了社区关注,被认为展现了民间开发者在模型优化方面的强大能力。

铁锤人: 这个项目能让Gemma 4 推理提速到6倍 比谷歌的3倍还快,而且不损失质量 https://github.com/z-lab/dflash

Google开源/仓库开源生态推理
20:38
TestingCatalog News 🗞@testingcatalog
53
Google 正在为 Antigravity 开发屏幕录制支持和自定义智能体。 如果屏幕录制功能由 Gemini Live 驱动,该特性可能会模仿 AI Studio 的功能,使 Gemini 能够实时查看您屏幕上的动态。 我们是否也能获得实时语音助手呢?👀
智能体Google产品更新多模态
19:07
TestingCatalog News 🗞@testingcatalog
52
谷歌已开始在欧盟推出Gemini的个人智能。 Gemini Live也将很快获得此功能。 > Gemini记住你的过去聊天,这样你就不必重复自己。即将在Live中推出。

OG Gabi Bartok: @testingcatalog @btibor91 perosnal context in europe

Google产品更新
18:29
Chubby♨️@kimmonismus
68
Anthropic与谷歌云签2000亿美元大单,云巨头豪赌AI初创公司增长

Anthropic与谷歌云达成五年2000亿美元云基础设施合同,加之四月与亚马逊的千亿美元协议,其未上市即承诺的云支出规模已超越多数科技公司市值。Anthropic与OpenAI共同占据美国四大云服务商约2万亿美元收入积压订单的一半,这实质上是市场对两家初创公司在2029年前实现20-30倍收入增长的豪赌。与OpenAI自建数据中心不同,Anthropic同时绑定谷歌、亚马逊和微软的云产能,虽避免了单点故障和硬件持有风险,却加深了对云巨头的依赖——谷歌正用自研TPU芯片运行其模型,这种不对称关系可能影响其长期议价能力。

AnthropicGoogle行业动态
10:35
TestingCatalog News 🗞@testingcatalog
45
Google将于5月12日单独举办一场"The Android Show | I/O Edition"活动! > Android正闪耀着即将推出的Gemini色彩,因此我们可以期待届时宣布大量AI功能 这意味着我们将迎来2场AI活动!🔥
Google行业动态
09:34
karminski-牙医@karminski3
73
Google发布Gemma 4草稿专用模型,推理速度提升三倍

Google发布了Gemma 4系列模型的专用草稿模型,用于推测性解码优化。31B Dense模型搭配草稿模型速度提升3倍,仅增加1G显存开销;Gemma4-26B和Gemma4-E4B分别提升1.5倍和3.1倍速度。新草稿模型如gemma-4-31B-it-assistant体积仅939 MB,专门优化后接受率高,相比之前使用非专用草稿模型(如gemma-4-E2B-it-UD-Q4_K_XL)提速更明显。作者呼吁Qwen尽快推出类似优化模型(如Qwen3.6-27B-assistant),以应对高性能需求。

Google推理模型发布
08:17
Berryxia.AI@berryxia
64
Google NotebookLM思维导图新增自定义、组织与导航功能

Google NotebookLM的思维导图功能正进行重大升级,新功能从今天起推出。核心更新包括自定义功能,用户可通过特定提示词引导MindMap的生成方向;组织功能支持立即重命名和分享MindMap,提升管理效率;导航功能优化了节点之间的过渡,实现更丝滑的交互体验。此次升级旨在增强工具的灵活性和用户体验,并邀请用户反馈意见。

Google产品更新搜索
08:17
Berryxia.AI@berryxia
66
Gemma 4借助MTP草稿机实现3倍速推理

Google通过为Gemma 4引入MTP drafters(多token预测草稿机),在不增加参数、不改变架构和模型质量的前提下,实现了最高3倍的推理速度提升。该技术让模型能一次预测多个token,突破了传统自回归解码的串行瓶颈,极大提升了GPU利用率。这显著增强了本地部署的实时性,并使Agent、代码生成等场景受益,进一步放大了开源模型在性价比和本地运行方面的优势。

Google for Developers: Gemma 4: Now up to 3x Faster. ⚡ Same quality, way more speed. Our new MTP drafters allow Gemma 4 to predict multiple tok...

Google开源生态推理模型发布
08:17
Berryxia.AI@berryxia
精选75
Google Gemma 4凭MTP实现3倍加速,vLLM零延迟提供支持

Google发布Gemma 4模型,采用创新的MTP drafters技术,实现最高3倍解码速度提升且质量无损。该技术让模型一次预测多个token,突破传统自回归生成的串行瓶颈,极大提升GPU利用率。vLLM项目在官方宣布后立即提供Day-0支持,用户可通过一条Docker命令快速部署。这一进步显著增强本地部署的实时性,使Agent、代码生成等场景受益,进一步放大开源模型在性价比和本地化运行方面的优势。

Berryxia.AI: Gemma 4 现在最高能跑到 3倍速度,而且质量完全不变。 他们没有增加参数、没有换新架构,只是推出了一套 MTP drafters(多 token 预测草稿机),让模型一次预测多个 token,彻底绕过了传统 autoregressiv...

Google推理教程/实践

推荐理由:Google的MTP技术让Gemma 4提速3倍,vLLM当天就支持了,做本地Agent和实时应用的开发者现在一条Docker命令就能跑,开源模型性价比优势又拉大一截。
06:58
Rohan Paul@rohanpaul_ai
71
Anthropic与谷歌云达成巨额合作,斥资约2000亿美元锁定未来AI算力

人工智能公司Anthropic与谷歌云达成一项价值约2000亿美元的多年期承诺,用于购买云计算服务和TPU芯片。此举不仅是购买服务器,更是对未来训练和部署前沿模型所必需的稀缺计算资源(包括芯片、电力、网络和数据中心空间)的长期储备。据报道,此项承诺可能占谷歌云近期披露收入积压的40%以上,意味着单一AI实验室已成为其未来合同销售的重要部分。其深层战略在于分散依赖,Anthropic将Claude的算力分布在谷歌TPU、亚马逊Trainium和英伟达GPU上,以避免受限于单一供应商。

AnthropicGoogle行业动态
06:04
DogeDesigner@cb_doge
55
新闻:xAI、谷歌和微软已承诺向美国政府提供其最新AI模型的早期访问权限,用于初步的国家安全风险评估。 他们正与CAISI合作,在公开发布前对先进模型进行早期评估。已完成40多项评估,重点关注能力和安全风险。
GoogleMicrosoftxAI安全/对齐
04:26
NotebookLM@NotebookLM
61
Source organization 已正式面向 💯% 用户全面升级! 【引用 @NotebookLM】:资料越多越麻烦?现在不再如此: NotebookLM 现已推出自动标记与分类资料功能(当您拥有 5 个以上资料时),助您减少滚动时间,增加思考/学习/哲思等时间。 重命名、重组、个性化(表情符号!)随您心意定制。

NotebookLM: Mo sources mo problems? Not anymore: Rolling out now, NotebookLM can auto-label & categorize sources (when you have 5+),...

Google产品更新
04:02
TestingCatalog News 🗞@testingcatalog
55
Google正在为NotebookLM的思维导图功能推出重要更新。核心新增功能包括:用户可通过特定提示词定制思维导图,将其聚焦于特定主题或来源;支持即时重命名和分享导图;节点间切换的动画过渡更加流畅。这些更新旨在提升思维导图的个性化定制、组织管理和导航体验。

NotebookLM: Mind Maps are getting a major glow up 💅 These new features are rolling out today: 🚗Customization: Steer your map with ...

Google产品更新其他
03:32
TestingCatalog News 🗞@testingcatalog
66
Google在其营销代理实验项目Pomelli中发布了新功能Pomelli Catalog。该功能允许企业添加产品或服务,随后Pomelli将基于企业的"商业DNA"自动生成一系列产品,例如周度通讯订阅产品,供用户在后续营销活动中复用。Pomelli Catalog能利用这些产品信息,为品牌生成个性化的营销活动和高质量宣传图片。目前该功能免费且全球可用。

Pomelli By Google: Today, we're introducing Pomelli Catalog.📣✨ Add your products or services, and Pomelli will use them to generate person...

智能体Google产品更新
03:32
TestingCatalog News 🗞@testingcatalog
71
Google为Gemma 4系列发布了多令牌预测(MTP)草稿模型。它在不损失性能的情况下带来了3倍的速度提升。 期待在Mac Mini上测试带有MTP草稿模型的量化版Gemma 4!

Google for Developers: Gemma 4: Now up to 3x Faster. ⚡ Same quality, way more speed. Our new MTP drafters allow Gemma 4 to predict multiple tok...

Google推理模型发布
03:01
Google Gemini@GeminiApp
25
上周末的Gemini Paddock真是精彩绝伦。@McLarenF1经典赛车、定制头盔、Gemini照相亭,还有无与伦比的热情。谢谢你们,Papaya Army。🧡 #McLarenRacingLive
Google行业动态
02:56
Google AI Developers@googleaidevs
精选68
Gemini API 文件搜索工具推出三项新更新,助力多模态 RAG 系统开发

Gemini API 文件搜索工具近日扩展三项功能更新,旨在帮助开发者更轻松地构建高精度多模态检索增强生成系统。更新包括:多模态支持,通过Gemini Embedding 2模型实现对图像和文本的同步推理;自定义元数据过滤,允许为文件添加键值标签以结构化非结构化数据,从而提升搜索速度;精确引用功能,能够捕获并返回每条索引信息的精确来源,如页码。开发者可通过Google AI Studio的示例应用体验这些功能,与图像和文档库交互,提问并追溯答案来源。

GoogleMCP/工具检索增强产品更新

推荐理由:如果你在用 Gemini 搭 RAG 系统,这三项更新能直接改善搜索精度和可解释性,多模态搜索终于把图片和文档打通了,值得马上试试。
02:00
宝玉@dotey
精选75
Google为Gemma 4发布MTP草稿模型,推理速度最高提升3倍

Google为其开源模型Gemma 4推出MTP drafter(多token预测草稿模型),采用推测解码技术,能在保持输出质量不变的前提下,将推理速度最高提升3倍。该技术利用轻量级小模型预先推测多个token,再由大模型并行验证,从而显著提高吞吐效率,尤其有利于缓解本地部署时的内存带宽瓶颈。例如,在Apple Silicon上运行26B MoE模型时,批量处理可获得约2.2倍加速。模型沿用Apache 2.0协议,权重已开源,并获主流推理框架支持。

Google for Developers: Gemma 4: Now up to 3x Faster. ⚡ Same quality, way more speed. Our new MTP drafters allow Gemma 4 to predict multiple tok...

Google开源生态推理模型发布

推荐理由:Gemma 4 的 MTP drafter 不是噱头,在 Apple Silicon 上实测能翻倍,且完全无损,本地跑开源模型的可以直接上,权重和框架都备好了。
01:56
NotebookLM@NotebookLM
57
思维导图正迎来一次重大升级💅 以下新功能今日上线: 🚗自定义:通过特定用户提示引导你的导图 📂整理:即时重命名并分享你的导图 🗺️导航:节点间丝滑流畅的过渡切换 欢迎告诉我们你的想法!
Google产品更新
5月5日
23:29
TestingCatalog News 🗞@testingcatalog
60
AI Studio 现已可使用 Nano Banana 进行图像生成,以调整通过 AI Studio Build 生成的应用中的图像。

Google AI Studio: new in ai studio ⬇️ we've integrated @nanobanana to automatically create custom image assets for your app as it generate...

Google产品更新图像生成
23:29
TestingCatalog News 🗞@testingcatalog
57
GOOGLE 👀:Gemini 3.2 Flash 曾短暂地在部分用户的 Gemini 应用中可用。 截至目前我们已有: - Gemini 3.2 Flash 在 Gemini 上闪现 - 测试中的 LM Arena 上已更新 Gemini 3 Flash 模型 - Vertex AI 上发布 Gemini 2 Flash 的弃用通知,承诺即将推出 Flash 正式发布更新 - Google I/O 将于 5 月 19 日举行,传闻将伴随 Gemini 3.5 的发布 Flash正在闪现!⚡⚡⚡

Just a dragon: Gemini 3.2 Flash Spotted

Google模型发布行业动态
23:14
Berryxia.AI@berryxia
同事件精选75
Google联手UCSD推出DFlash,实现LLM无损推理3倍加速

Google与UCSD合作推出扩散式推测解码技术DFlash,在Google Cloud TPU上实现了3.13倍的无损推理加速。该技术突破了传统自回归解码逐个生成token的串行瓶颈,通过一次推测生成多个token来改变生成范式。这一硬件与算法的联合优化,将重塑云端成本曲线,并使实时Agent、长上下文等应用更趋现实,同时大幅降低本地部署门槛。此举将大模型推理的竞争引向了系统级优化的新赛道。

Google for Developers: Breaking LLM inference's autoregressive bottleneck 🛠️ We've teamed up with @haozhangml, @YimingBob, and @aaronzhfeng, a...

Google大佬观点推理部署/工程
同一事件,精选展示《在谷歌TPU上实现3倍加速:UCSD利用扩散式推测解码优化LLM推理》
推荐理由:Google 直接干掉自回归瓶颈,3.13 倍无损加速不是渐进优化,是推理范式的根变革,当「快三倍」成为新基线,所有实时 Agent 和长上下文应用都得重算一遍成本账。
23:14
Berryxia.AI@berryxia
70
Google发布Code Wiki,AI驱动实时代码文档与智能问答

Google推出Code Wiki项目,旨在解决“阅读现有代码”这一开发瓶颈。该工具能自动扫描代码仓库,实现文档随代码变更实时更新,避免过时。其核心功能包括由Gemini驱动的智能聊天,可将整个Wiki作为知识库进行问答,并支持超链接跳转至具体代码行;还能自动生成架构图、类图、时序图等可视化图表,并链接到源码。工具适用于各种规模的仓库,帮助新人快速上手或理解遗留代码。目前公共仓库已开放预览。

Google产品更新编码
22:19
Rohan Paul@rohanpaul_ai
70
谷歌、微软与xAI同意美国政府提前测试前沿AI模型

谷歌、微软和xAI已同意在美国商务部机构CAISI的测试下,提前评估其前沿AI模型。测试的特殊之处在于,公司将提供降低或移除安全护栏的模型版本,以便评估其在协助网络入侵、恶意软件规划等高危任务上的原始能力与风险。此前,OpenAI和Anthropic已于2024年达成类似协议。此举背景是白宫正考虑建立针对主要AI模型的政府审查流程,审查重点是其网络能力——即发现和利用软件漏洞以改变现实安全风险的水平。政策转向的触发点是Anthropic的Mythos模型,该公司认为该模型在发现安全漏洞方面能力过强,广泛发布风险过高。

Rohan Paul: Nytimes: The White House is considering a government review process for major AI models before public release. The propo...

GoogleMicrosoftxAI安全/对齐
21:19
Chubby♨️@kimmonismus
63
Google、Microsoft和xAI已同意向美国商务部提前提供未发布的AI模型,以便政府在公开发布前评估其能力和安全性。
GoogleMicrosoftxAI安全/对齐
20:18
Chubby♨️@kimmonismus
57
Gemini 中发现了 Gemini 3.2! 如果我们现在就能收到 Gemini 3.2 Flash,那么主要版本可能会留到 I/O 大会发布。 感谢 @Waguri_Kaoruko8 的发现。
Google多模态行业动态
06:45
Google AI Developers@googleaidevs
精选72
告别持续轮询!在构建复杂、长期运行的智能体应用时,使用 Gemini API 中的 Webhooks 来消除 API 流量的浪费,并简化编排逻辑。🙌
智能体Google产品更新部署/工程

推荐理由:长期轮询是agent开发的隐形税,Gemini API这次内置webhooks,把编排逻辑简化了一大截,做复杂agent的开发者今晚就能删掉一堆轮询代码。
02:58
Google Gemini@GeminiApp
精选67
从构想到原型,借助Gemini中的Nano Banana 2,将您独特的产品愿景变为现实。🪀
Google产品更新多模态

推荐理由:Google Gemini塞进一个Nano Banana 2创意工具,把想法转原型只需几句话,产品经理脑暴草案利器,算不上重磅但够实用。
01:25
SemiAnalysis@SemiAnalysis_
55
澄清TPU v8i因双芯片被误认为训练芯片的常见误解

针对TPU v8i因双计算芯片而被误认为是训练芯片的观点,关键在于计算吞吐与内存容量/带宽的平衡。TPU v8i拥有更高的HBM3E内存容量(288GB对216GB)和带宽(8.6TB/s对6.5TB/s),以及更大的片上SRAM(384MB对128MB),这使其更适合内存带宽受限的推理解码任务。而训练芯片TPU v8t虽为单芯片设计,但通过极致密集的计算单元实现了更高的FP4算力(12.6 PFLOPs对10.1 PFLOPs),以满足训练所需的高算术强度,这也体现了Google尝试使用FP4进行训练的技术方向。

Google推理现象/趋势
‹ 上一页
1…1617181920…24
下一页 ›