AIHOT
内容
精选全部 AI 动态AI 日报主题收藏
接入
Agent 接入
更多
关于更新日志反馈
内部员工登录
精选全部日报更多
内部员工登录
全部动态
全部一手资讯X论文
标签「Google」清除
6月11日周四
00:43fofr69DiffusionGemma:一次性选词提速4倍
00:40Google DeepMind:Blog(RSS)72精选DiffusionGemma:文本生成速度提升4倍的开源扩散模型
00:39Google Developers Blog(RSS)78DiffusionGemma 开发者指南
00:24elvis71Google DeepMind 推出 DiffusionGemma 开放模型
00:20Sundar Pichai75DiffusionGemma:整块文本生成提速4倍
00:19The Verge:AI(RSS)74精选Google将保存用户的Lens图片、Search Live录音和Translate音频用于AI训练
6月10日周三
22:28IT之家(RSS)65德国法院裁定:谷歌要为 AI 搜索概览内容承担直接责任
19:24Artificial Intelligence News(RSS)61Siri AI 带着 Google inside 来了,大部分世界被锁定
19:17The Decoder:AI News(RSS)63Google NotebookLM 重大升级:运行 Gemini 3.5 Flash,自带云计算机执行代码并支持自主搜索
18:24Artificial Intelligence News(RSS)49麦当劳测试Google支持的AI免下车点餐系统ArchIQ
17:28IT之家(RSS)70同事件精选谷歌 DeepMind 经济学家伊马斯:尚未发现 AI 造成岗位流失的证据,跟风裁员恐适得其反同一事件,精选展示《谷歌高级副总裁曼尼卡:AI短期内不会摧毁就业市场》
16:45小互67Google 发布实时翻译模型 Gemini 3.5 Live Translate
11:41Hacker News 热门(buzzing.cc 中文翻译)78同事件精选德国法院裁定谷歌应对AI概览中的错误答案承担责任同一事件,精选展示《突发:Google 因模型幻觉被判负有法律责任》
09:09Josh Woodward60Google AI Studio周应用量超120万
09:07Berryxia.AI41猴哥贺Fable 5,Google人呢?
08:44TechCrunch:AI(RSS)67Google大幅降低其预算AI订阅层级价格
08:07Berryxia.AI77Google Gemini 3.5 Live Translate 公开预览,支持70+种语言
07:07Berryxia.AI48Gemini 模型通过 Apple Foundation Models 框架及 Xcode 向 Apple 开发者开放
03:20Ars Technica:AI(RSS)63Google 发布 Gemini 3.5 Live Translate,实现即时语音到语音翻译
03:07Logan Kilpatrick72Google AI Studio 周创超 120 万应用
02:34NotebookLM67精选NotebookLM 笔记本功能在 Gemini App 欧洲全面上线
02:23🚨 AI News | TestingCatalog70谷歌发布 Gemini 3.5 Live Translate,支持70+语言低延迟翻译
01:51Jeff Dean81同事件精选Gemini 3.5 Live Translate 支持70+语言翻译同一事件,精选展示《Gemini 3.5:具备行动能力的前沿智能》
01:45The Decoder:AI News(RSS)70谷歌 Gemini 3.5 Live Translate 发布:支持70多种语言的实时语音翻译
01:44MarkTechPost(RSS)60Google 发布 Gemini 3.5 Live Translate:覆盖 70+ 语言的流式语音到语音翻译模型
01:05fofr70Gemini 3.5 Live translate 支持流式语音翻译
00:35Google Gemini51Gemini 3.5 Flash 可视化转交互代码
00:26IT之家(RSS)81谷歌发布实时语音互译模型 Gemini 3.5 Live Translate,谷歌翻译 App 即用
00:15Rohan Paul76Google 发布 Gemini 3.5 Live Translate 实时语音翻译模型
00:15The Decoder:AI News(RSS)77同事件精选里程碑式德国裁决:Google AI Overviews 被视为谷歌自身言论,需为错误回答承担责任同一事件,精选展示《突发:Google 因模型幻觉被判负有法律责任》
00:05Logan Kilpatrick79Gemini 3.5 Flash 实时语音翻译模型发布
00:05fofr63我用智能体加速Gemma,感觉像骄傲的家长
00:00OpenRouter:Announcements(RSS)60同事件精选Gemini 2.5 Flash API:定价、快速入门与提供商对比同一事件,精选展示《Gemini 2.5 Flash API - 定价、快速入门与提供商比较》
6月9日周二
23:47Google AI Developers76Google 发布 Gemini 3.5 Live Translate 实时语音翻译模型
23:37Google AI85Google AI 发布 Gemini 3.5 Live Translate 实时语音翻译模型
23:35Google DeepMind69同事件精选Gemini 3.5 Live Translate 发布同一事件,精选展示《Gemini 3.5:具备行动能力的前沿智能》
22:34Google DeepMind:Blog(RSS)80同事件精选Google DeepMind 发布 Gemma 4 12B:统一的无编码器多模态模型同一事件,精选展示《通过 Gemma 4 将 AI 推向边缘和设备端》
22:11小互46苹果Siri自研模型实为Gemini蒸馏产物
21:18Ars Technica:AI(RSS)57苹果称其 AI 在谷歌服务器上运行仍保持隐私
19:43The Decoder:AI News(RSS)64Apple Intelligence 借助 Google 和 Nvidia 再获新生
全部 AI 动态
AI 相关资讯全量信息流
全部一手信源资讯推文
全部模型产品行业论文技巧
6月11日
00:43
fofr@fofrAI
69
DiffusionGemma,大语言模型一次性选出所有词。速度快4倍。 你可以从这里获取权重和说明开始使用: https://huggingface.co/google/diffusiongemma-26B-A4B-it
GoogleHugging Face推理模型发布
00:40
Google DeepMind:Blog(RSS)
精选72
DiffusionGemma:文本生成速度提升4倍的开源扩散模型

Google DeepMind 发布开源实验模型 DiffusionGemma,采用文本扩散技术,突破自回归逐 token 生成方式,每次前向并行生成 256 个 token。该 26B MoE 模型推理时仅激活 3.8B 参数,量化后适配 18GB 显存消费级 GPU。在 H100 上达 1000+ tokens/s,RTX 5090 上 700+ tokens/s,速度提升 4 倍。具备双向注意力和自我修正能力,面向内联编辑、代码填充等本地交互工作流,以 Apache 2.0 许可证开放。

Google开源生态推理模型发布
关联讨论 5 条X:Google DeepMind (@GoogleDeepMind)X:Demis Hassabis (@demishassabis)X:Testing Catalog (@testingcatalog)X:Google AI for Developers (@googleaidevs)MarkTechPost(RSS)
推荐理由:DiffusionGemma 虽为实验性质,但它把文本生成从“串行打字机”变成了“并行印刷机”,本地推理速度 4 倍提升,对需要实时交互的开发者是个值得关注的方向。
00:39
Google Developers Blog(RSS)
78
DiffusionGemma 开发者指南

DiffusionGemma 是 Google 基于 Gemma 4 架构的实验性文本生成模型,采用扩散式并行生成替代逐 token 自回归,实现更快推理、双向上下文感知和实时自我修正,并可在消费级 GPU 上部署。模型通过迭代去噪并行生成并细化 256-token 块,在处理数独等复杂约束任务上优于传统语言模型,且微调效果显著。它已集成 vLLM 等推理框架,为开发者提供一种高性能、高效长上下文扩展且易于定制部署的非自回归新方法。

Google推理模型发布部署/工程
关联讨论 5 条X:Google DeepMind (@GoogleDeepMind)X:Demis Hassabis (@demishassabis)X:Testing Catalog (@testingcatalog)X:Google AI for Developers (@googleaidevs)MarkTechPost(RSS)
00:24
elvis@omarsar0
71
太棒了!我最近花了很多时间在研究扩散大语言模型上,所以这个时机恰到好处。我觉得文本扩散领域还有很多未被充分探索的研究问题。权重已在 HuggingFace 上可用。

Google DeepMind: DiffusionGemma is our new experimental open model with up to 4x faster output on dedicated GPUs. Instead of predicting w...

Google推理模型发布
00:20
Sundar Pichai@sundarpichai
75
DiffusionGemma 是一个开放的实验性模型,它将我们的文本扩散研究引入 Gemma 4。它是一匹赛马 🏇,通过同时生成整块文本(而非逐 token(逐词)预测输出)实现高达 4 倍更快的推理速度!
Google开源/仓库推理模型发布
00:19
The Verge:AI(RSS)
精选74
Google将保存用户的Lens图片、Search Live录音和Translate音频用于AI训练

Google更新搜索交互数据保存方式,新增“Search Services History”设置,用于保存用户搜索时使用的图片、文件、音频和视频,包括Google Lens搜索的图片、实时搜索工具Search Live的录音、语音搜索和Translate中的语音片段。这些数据将被用于“提供、改进和开发AI模型”。用户可关闭该设置并禁用“Save Media”选项以避免保存。

Google产品更新搜索数据/训练

推荐理由:Google这回悄悄把图片、录音存下来训练AI,默认开启,虽然可以关,但灰度操作值得每个用搜索的人看一眼。
6月10日
22:28
IT之家(RSS)
65
德国法院裁定:谷歌要为 AI 搜索概览内容承担直接责任

德国慕尼黑地方法院裁定谷歌须为AI搜索概览内容承担直接责任,对其发出临时禁令。法院认定AI概览是谷歌自身生成的内容,而非传统搜索结果列表,谷歌是直接侵权人。AI概览将原告与诈骗、订阅陷阱等不良商业行为错误关联,甚至提出了任何链接源中均未提及的指控。裁决指出,AI用自己的语言重写并评判结果,谷歌对算法及产品供应拥有控制权。

Google搜索政策/监管
19:24
Artificial Intelligence News(RSS)
61
Siri AI 带着 Google inside 来了,大部分世界被锁定

Apple 在 WWDC 2026 上正式推出 Siri AI,其内部集成了 Google 技术。然而,该 AI 服务的可用性受到严格限制,大部分地区的用户无法使用。Apple 操作系统项目管理副总裁 Stacey Ford 在介绍 Spotlight 时提及了搜索体验的痛点,这一发布标志着 Apple 在 AI 领域的重要进展,但全球覆盖的缺失成为显著争议点。

Google产品更新多模态
19:17
The Decoder:AI News(RSS)
63
Google NotebookLM 重大升级:运行 Gemini 3.5 Flash,自带云计算机执行代码并支持自主搜索

Google 为 NotebookLM 推出重大升级。该研究工具现基于 Gemini 3.5 Flash 运行,拥有自己的云计算机用于代码执行,并能通过 Google Search 自主查找来源。内部测试中,新系统在 78.2% 的情况下击败了上一版本。

智能体Google产品更新搜索
18:24
Artificial Intelligence News(RSS)
49
麦当劳测试Google支持的AI免下车点餐系统ArchIQ

麦当劳正在测试一款名为ArchIQ(昵称Archy)的AI系统,由Google支持,可处理免下车订单并协助餐厅运营。该测试目前在美国五家门店进行,具体地址尚未公布。

Google行业动态语音
17:28
IT之家(RSS)
同事件精选70
谷歌 DeepMind 经济学家伊马斯:尚未发现 AI 造成岗位流失的证据,跟风裁员恐适得其反

谷歌 DeepMind AGI 经济学负责人亚历克斯·伊马斯表示,目前没有看到白领岗位因 AI 大规模消失的证据。他强调,若企业因“不裁员就等于 AI 转型慢”的叙事而跟风裁员,可能适得其反。伊马斯认为,AI 更多是接手部分任务、提升生产力,让员工专注机器无法完成的工作,岗位冲击尚未真正出现。

DeepMindGoogle现象/趋势
同一事件,精选展示《谷歌高级副总裁曼尼卡:AI短期内不会摧毁就业市场》
推荐理由:来自AI核心阵营的经济学家说‘还没证据’,这本身就值得每个担心被AI替代的人看一眼,那种‘没裁员就是落后’的FOMO叙事可能更危险。
16:45
小互@xiaohu
67
Google 发布实时翻译模型 Gemini 3.5 Live Translate

Google 推出 Gemini 3.5 Live Translate,支持 70 多种语言的实时边听边译,保留说话人的语调、节奏和音高,延迟仅数秒。模型具备自动语言检测,无需预先指定源语言和目标语言。同时自动滤除噪音,嘈杂环境可用。Google Translate App 新增「听筒模式」,贴耳即可听翻译。开发者可通过 Gemini Live API 和 Google AI Studio 调用。

Google模型发布语音
11:41
Hacker News 热门(buzzing.cc 中文翻译)
同事件精选78
德国法院裁定谷歌应对AI概览中的错误答案承担责任

德国法院裁定谷歌需为其AI Overviews(AI概览)功能生成的错误答案承担法律责任。该裁定认定,AI概览中出现的虚假信息视为谷歌自身发布的内容,公司无法通过声称“AI自动生成”来推卸责任。这一判决对AI生成内容的责任界定产生重要影响。

Google搜索政策/监管
同一事件,精选展示《突发:Google 因模型幻觉被判负有法律责任》
推荐理由:德国法院将AI概览定性为谷歌自己的内容,推翻了传统搜索的免责逻辑,这个先例可能让所有提供搜索摘要的AI公司睡不着觉。
09:09
Josh Woodward@joshwoodward
60
在 @Google AI Studio 中,我们现在每周制作超过 1,200,000 个应用(还在增长),自 2 月下旬以来已创建超过 18,000,000 个 🤯 进展仍在继续!!!

Logan Kilpatrick: In @GoogleAIStudio we are now making more than 1,200,000 apps a week (and growing) with more than 18,000,000 created sin...

Google现象/趋势行业动态
09:07
Berryxia.AI@berryxia
41
猴哥都主动祝贺Anthropic 的Fable 5 了。 那么,问题来了。 Google 人呢? 虽然,Google 也是A社30 亿美金的大股东,但也要努力啊!

Logan Kilpatrick: congrats to the Anthropic team on Fable!!

AnthropicGoogle大佬观点模型发布
08:44
TechCrunch:AI(RSS)
67
Google大幅降低其预算AI订阅层级价格

Google降低了其预算AI订阅层级的价格,此举被视为在AI订阅价格战中发出警告信号。

AnthropicGoogleOpenAI行业动态
08:07
Berryxia.AI@berryxia
77
Google Gemini 3.5 Live Translate 公开预览,支持70+种语言

Google 推出 Gemini 3.5 Live Translate 实时翻译模型,已进入公开预览阶段,通过 Gemini API 提供低延迟语音到语音翻译,覆盖 70+ 种语言、2000 种语言对,包括大量冷门小语种。开发者可将该能力集成到实时对话、客服、直播、跨国会议等场景中。主推文指出该发布被 Anthropic Fable 5 刷屏抢了风头,并提及阿里 Qwen 系列小语种模型的可比性。

Google for Developers: Gemini 3.5 Live Translate is now in Public Preview via the Gemini API, delivering low-latency speech-to-speech translati...

Google模型发布语音
关联讨论 14 条X:Google AI (@GoogleAI)Google Blog:AI(RSS)X:Sundar Pichai (@sundarpichai)Google DeepMind:Blog(RSS)The Verge:AI(RSS)X:Google DeepMind (@GoogleDeepMind)Google Developers Blog(RSS)X:Gemini (@GeminiApp)Hacker News 热门(buzzing.cc 中文翻译)X:Google AI for Developers (@googleaidevs)X:Logan Kilpatrick (@OfficialLoganK)X:Ethan Mollick (@emollick)X:阿易 AI Notes (@AYi_AInotes)X:Kim (@kimmonismus)
07:07
Berryxia.AI@berryxia
48
Gemini 模型通过 Apple Foundation Models 框架及 Xcode 向 Apple 开发者开放

Google 宣布 Gemini 模型已通过 Apple Foundation Models 框架及 Xcode 原生支持,向数百万 Apple 开发者开放。开发者可在共享 API 接口上切换本地与云端推理,构建智能体式应用并提升开发速度;Xcode 内还提供 Gemini 智能体编码辅助,加速多步骤开发任务。

Google for Developers: Gemini models are now accessible to millions of Apple developers through Apple's Foundation Models framework and nativel...

Google行业动态
03:20
Ars Technica:AI(RSS)
63
Google 发布 Gemini 3.5 Live Translate,实现即时语音到语音翻译

Gemini 3.5 Live Translate 提供即时语音到语音翻译,能够保留说话者的语调、节奏和音高,并通过 SynthID 水印确保安全性。

Google多模态模型发布语音
03:07
Logan Kilpatrick@OfficialLoganK
72
在 @GoogleAIStudio 中,我们现在每周制作超过 120 万个应用(且还在增长),自 2 月底以来已创建超过 1800 万个 🤯 进步仍在继续!!!
Google行业动态
02:34
NotebookLM@NotebookLM
精选67
NotbookLM 宣布其笔记本功能已在欧洲的 Gemini App 中 100% 上线。此前用户只能上传笔记本作为 Gemini 的来源,现在可直接在 Gemini App 内访问所有个人未共享的笔记本,并将与 Gemini 的对话作为新笔记本或已有笔记本的来源。该功能先面向 Google AI Ultra、Pro 和 Plus 订阅者的网页端,未来几周将扩展到移动端、更多欧洲国家及免费用户。

NotebookLM: Last year, we integrated into the @GeminiApp by allowing you to upload your notebooks as sources. Now, we're taking our ...

Google产品更新
关联讨论 1 条X:Gemini (@GeminiApp)
推荐理由:这不是一个惊天动地的更新,对用NotebookLM做深度研究和写作的人,把笔记无缝塞进Gemini对话里是实实在在的效率提升。普通用户可能感觉不大。
02:23
🚨 AI News | TestingCatalog@testingcatalog
70
Google 推出 Gemini 3.5 Live Translate 模型,支持对 70 多种语言进行低延迟实时翻译,已在 AI Studio 和 API 上开放预览。该模型可边说话边连续翻译,生成自然流畅的语音。Google Meet 即将接入该模型实现实时语音翻译。本月起,面向部分 Google Workspace 企业客户启动私密预览,年内将更广泛推出。

Google: By translating continuously as you speak, Gemini 3.5 Live Translate generates smooth, natural-sounding speech without pa...

Google模型发布语音
01:51
Jeff Dean@JeffDean
同事件精选81
语音翻译一直是Google历时最久的机器学习项目之一,我们已经取得了长足进展。Gemini 3.5 Live Translate是我们最新的语音到语音模型,支持70多种语言。它能让日常产品和应用中跨语言的对话更加自然。 以下是一个示例,展示@InsideGrab的合作伙伴如何帮助旅客与司机建立联系。🚗 已在Google Translate和@GoogleAIStudio的Live API中推出。
Google模型发布语音
同一事件,精选展示《Gemini 3.5:具备行动能力的前沿智能》
推荐理由:Google把语音翻译做到70+语言,Gemini 3.5 Live Translate直接塞进Google Translate和API,普通人下载App就能用,做跨国生意的这下有福了。
01:45
The Decoder:AI News(RSS)
70
谷歌 Gemini 3.5 Live Translate 发布:支持70多种语言的实时语音翻译

谷歌发布 Gemini 3.5 Live Translate 音频模型,为超过70种语言提供实时语音翻译。系统无需等待句子结束即可持续翻译,并宣称能保留说话者的语调、语速和音高。在 Google Meet 中,语言支持从5种扩展至70多种。

Google产品更新语音
关联讨论 14 条X:Google AI (@GoogleAI)Google Blog:AI(RSS)X:Sundar Pichai (@sundarpichai)Google DeepMind:Blog(RSS)The Verge:AI(RSS)X:Google DeepMind (@GoogleDeepMind)Google Developers Blog(RSS)X:Gemini (@GeminiApp)Hacker News 热门(buzzing.cc 中文翻译)X:Google AI for Developers (@googleaidevs)X:Logan Kilpatrick (@OfficialLoganK)X:Ethan Mollick (@emollick)X:阿易 AI Notes (@AYi_AInotes)X:Kim (@kimmonismus)
01:44
MarkTechPost(RSS)
60
Google 发布 Gemini 3.5 Live Translate:覆盖 70+ 语言的流式语音到语音翻译模型

Gemini 3.5 Live Translate 是一款流式语音到语音翻译模型,支持 70 多种语言。它会持续生成音频,仅落后说话人几秒。该模型通过 Gemini Live API、Google Meet 和翻译应用向开发者开放。

Google多模态模型发布语音
01:05
fofr@fofrAI
70
Gemini 3.5 Live translate:流式输入语音,并流式输出口语翻译。 它还能神奇地支持多人说话。 它不支持克林贡语(我试过)。 在AI Studio上试试: https://aistudio.google.com/live?model=gemini-3.5-live-translate-preview
Google产品更新多模态语音
00:35
Google Gemini@GeminiApp
51
Gemini 3.5 Flash 能处理复杂视觉数据,并将其转化为功能性的交互式代码。 观看 Gemini 分析参考图像中的光照,并构建一个交互式 3D 可视化器来预览该设置。
Google产品更新多模态编码
00:26
IT之家(RSS)
81
谷歌发布实时语音互译模型 Gemini 3.5 Live Translate,谷歌翻译 App 即用

谷歌发布实时语音互译音频模型 Gemini 3.5 Live Translate,可自动识别 70 多种语言并保留说话者的语调、语速和音高。该模型连续生成语音,在提升翻译质量与跟上说话者节奏间取得平衡,全程仅慢几秒。开发者即日起可通过 Gemini Live API 和 Google AI Studio 使用公开预览版;企业客户本月起可在 Google Meet 中使用私有预览版;普通用户通过 Android 和 iOS 版谷歌翻译即可使用。Android 用户还将获得“聆听模式”,可将手机贴耳通过听筒收听翻译音频。

Google多模态模型发布语音
关联讨论 14 条X:Google AI (@GoogleAI)Google Blog:AI(RSS)X:Sundar Pichai (@sundarpichai)Google DeepMind:Blog(RSS)The Verge:AI(RSS)X:Google DeepMind (@GoogleDeepMind)Google Developers Blog(RSS)X:Gemini (@GeminiApp)Hacker News 热门(buzzing.cc 中文翻译)X:Google AI for Developers (@googleaidevs)X:Logan Kilpatrick (@OfficialLoganK)X:Ethan Mollick (@emollick)X:阿易 AI Notes (@AYi_AInotes)X:Kim (@kimmonismus)
00:15
Rohan Paul@rohanpaul_ai
76
Google 发布 Gemini 3.5 Live Translate 实时语音翻译模型

Google 推出 Gemini 3.5 Live Translate,一款实时语音转语音翻译模型。它在原说话者尚未说完时即开始翻译,无需等待完整句子。模型采用流式翻译,边听边更新结果,支持 70 多种语言,延迟仅数秒,并能保持语速、音高和语调。该功能通过 Gemini Live API、Google Meet 预览版以及 iOS/Android 版 Google Translate 应用推出。

Google AI: Today, we released Gemini 3.5 Live Translate, our latest audio model for live speech-to-speech translation. It supports ...

Google多模态模型发布语音
关联讨论 14 条X:Google AI (@GoogleAI)Google Blog:AI(RSS)X:Sundar Pichai (@sundarpichai)Google DeepMind:Blog(RSS)The Verge:AI(RSS)X:Google DeepMind (@GoogleDeepMind)Google Developers Blog(RSS)X:Gemini (@GeminiApp)Hacker News 热门(buzzing.cc 中文翻译)X:Google AI for Developers (@googleaidevs)X:Logan Kilpatrick (@OfficialLoganK)X:Ethan Mollick (@emollick)X:阿易 AI Notes (@AYi_AInotes)X:Kim (@kimmonismus)
00:15
The Decoder:AI News(RSS)
同事件精选77
里程碑式德国裁决:Google AI Overviews 被视为谷歌自身言论,需为错误回答承担责任

德国地方法院裁定,Google 对其 AI 概览生成的内容直接承担法律责任,不能援引搜索引擎运营商原有的有限责任保护。涉案 AI 概览错误地将两家出版商与欺诈行为关联,且相关声明未出现在任何链接来源中。该裁决可能为全球 AI 生成内容责任认定树立先例。

Google搜索政策/监管
同一事件,精选展示《突发:Google 因模型幻觉被判负有法律责任》
推荐理由:德国法院这一刀砍得精准,直接把 AI Overviews 定性为 Google 自己的话而非第三方内容,虚假回答就得自己扛。这对全球 AI 生成内容的责任认定都是个风向标。
00:05
Logan Kilpatrick@OfficialLoganK
79
Introducing Gemini 3.5 Flash Live Translate,我们的实时语音到语音翻译模型,支持超过 70 种语言(输入和输出),并且非常自然。 现在已在 Gemini API、AI Studio 和 Google 翻译中可用,并即将登陆 Google Meet!
Google多模态模型发布语音
关联讨论 14 条X:Google AI (@GoogleAI)Google Blog:AI(RSS)X:Sundar Pichai (@sundarpichai)Google DeepMind:Blog(RSS)The Verge:AI(RSS)X:Google DeepMind (@GoogleDeepMind)Google Developers Blog(RSS)X:Gemini (@GeminiApp)Hacker News 热门(buzzing.cc 中文翻译)X:Google AI for Developers (@googleaidevs)X:Logan Kilpatrick (@OfficialLoganK)X:Ethan Mollick (@emollick)X:阿易 AI Notes (@AYi_AInotes)X:Kim (@kimmonismus)
00:05
fofr@fofrAI
63
我让我的 foffee 智能体帮忙加速 Gemma。我感觉自己像个骄傲的家长。 https://huggingface.co/spaces/gemma-challenge/gemma-dashboard

Google Gemma: Introducing the Fast Gemma Challenge with Hugging Face Over the next few days, dozens of agents will collaborate to make...

智能体GoogleHugging Face开源生态
00:00
OpenRouter:Announcements(RSS)
同事件精选60
Gemini 2.5 Flash API:定价、快速入门与提供商对比

Gemini 2.5 Flash API 的定价与快速入门指南,指导用户配置 thinking budgets、比较不同提供商,并在 5 分钟内完成首次 API 调用。

Google推理教程/实践部署/工程
同一事件,精选展示《Gemini 2.5 Flash API - 定价、快速入门与提供商比较》
推荐理由:Gemini 2.5 Flash 最值得关注的是 thinking budget,这篇教程把怎么用、怎么省都讲清楚了,但对早已熟悉文档的开发者来说新东西有限。
6月9日
23:47
Google AI Developers@googleaidevs
76
Google 发布 Gemini 3.5 Live Translate 实时语音翻译模型

Google AI 推出音频模型 Gemini 3.5 Live Translate,为开发者提供低延迟实时语音翻译,支持 70+ 种语言。模型具备多语言输入(同会话无需切换)、自动语言检测、原生音频处理(保留说话者语调、语速和音高)以及噪声鲁棒性(过滤环境噪音),可直接处理流式语音。

Google多模态模型发布语音
关联讨论 14 条X:Google AI (@GoogleAI)Google Blog:AI(RSS)X:Sundar Pichai (@sundarpichai)Google DeepMind:Blog(RSS)The Verge:AI(RSS)X:Google DeepMind (@GoogleDeepMind)Google Developers Blog(RSS)X:Gemini (@GeminiApp)Hacker News 热门(buzzing.cc 中文翻译)X:Google AI for Developers (@googleaidevs)X:Logan Kilpatrick (@OfficialLoganK)X:Ethan Mollick (@emollick)X:阿易 AI Notes (@AYi_AInotes)X:Kim (@kimmonismus)
23:37
Google AI@GoogleAI
85
Google AI 发布 Gemini 3.5 Live Translate 实时语音翻译模型

Google AI 推出 Gemini 3.5 Live Translate,一款面向实时语音到语音翻译的音频模型。该模型支持 70 多种语言,可在用户说话的同时开始翻译并流式输出译文,避免尴尬停顿或断续。模型通过毫秒级决策平衡速度与翻译质量,使对话流畅自然。它可边接收输入边输出翻译语音,延迟仅比说话者慢几秒,并能在长对话中维持语速、音高和语调。目前已在 iOS 和 Android 版 Google Translate 应用中上线。

Google多模态模型发布语音
关联讨论 14 条X:Google AI (@GoogleAI)Google Blog:AI(RSS)X:Sundar Pichai (@sundarpichai)Google DeepMind:Blog(RSS)The Verge:AI(RSS)X:Google DeepMind (@GoogleDeepMind)Google Developers Blog(RSS)X:Gemini (@GeminiApp)Hacker News 热门(buzzing.cc 中文翻译)X:Google AI for Developers (@googleaidevs)X:Logan Kilpatrick (@OfficialLoganK)X:Ethan Mollick (@emollick)X:阿易 AI Notes (@AYi_AInotes)X:Kim (@kimmonismus)
23:35
Google DeepMind@GoogleDeepMind
同事件精选69
说 hello, hola, 你好--欢迎 Gemini 3.5 Live Translate:我们最新的音频模型,专为快速跨语言交流而构建。🌐
Google模型发布语音
同一事件,精选展示《Gemini 3.5:具备行动能力的前沿智能》
推荐理由:Google 这个实时翻译模型把语音+翻译+大模型拧成了一股绳,虽然具体怎么用还不清楚,但做跨境、做语音助手的同学可以把它当个方向标。
22:34
Google DeepMind:Blog(RSS)
同事件精选80
Google DeepMind 发布 Gemma 4 12B:统一的无编码器多模态模型

Gemma 4 12B 是 Google DeepMind 最新推出的中等规模多模态模型,采用无编码器统一架构,原生支持音频输入。其基准测试性能接近 26B MoE 模型,但内存占用不到一半,仅需 16GB 显存或统一内存即可在消费级笔记本上本地运行。模型内置多 token 预测(MTP)drafter 以降低延迟,基于 Apache 2.0 开源许可发布,已累计超过 1.5 亿次下载。

Google多模态开源/仓库推理
同一事件,精选展示《通过 Gemma 4 将 AI 推向边缘和设备端》
推荐理由:统一无编码器架构让 12B 模型在消费级笔记本上跑出接近 26B 的多模态 Agent 体验,开源 + Apache 2.0,本地部署门槛又压低了。
22:11
小互@xiaohu
46
苹果Siri自研模型实为Gemini蒸馏产物

苹果Siri由自研基础模型驱动,但该模型通过Google Gemini蒸馏训练而来。Gemini本身不直接驱动Siri,仅在Apple iCloud上提供额外定制支持,且不接入Google搜索,世界知识由苹果自有服务提供。

小互: http://x.com/i/article/2064329494736011265

Google数据/训练行业动态
21:18
Ars Technica:AI(RSS)
57
苹果称其 AI 在谷歌服务器上运行仍保持隐私

苹果表示,部分 AI 模型运行在谷歌云服务器上,但谷歌无法以任何方式访问数据,从而确保用户隐私不受影响。

Google产品更新推理部署/工程
19:43
The Decoder:AI News(RSS)
64
Apple Intelligence 借助 Google 和 Nvidia 再获新生

在 WWDC 2026 上,苹果展示了重建后的 Siri。该智能助手运行在苹果与 Google 共同开发的基础模型上,对于复杂查询则调用 Nvidia GPU 进行推理。

Google产品更新语音
‹ 上一页
1…7891011…40
下一页 ›