消息称,谷歌正与三星晶圆代工部门洽谈生产其自研 TPU 芯片。目前谷歌第七代 Ironwood TPU 超 60% HBM 由三星提供。内部人士透露,谷歌推进代号“冰鱼”的 TPU v10,其计算引擎仍由台积电代工,而内存 I/O Die 可能交由三星 2nm 工艺生产。TPU 性能与英伟达 H100 相当,成本降低约 80%。双方尚未签署正式协议。
消息称,谷歌正与三星晶圆代工部门洽谈生产其自研 TPU 芯片。目前谷歌第七代 Ironwood TPU 超 60% HBM 由三星提供。内部人士透露,谷歌推进代号“冰鱼”的 TPU v10,其计算引擎仍由台积电代工,而内存 I/O Die 可能交由三星 2nm 工艺生产。TPU 性能与英伟达 H100 相当,成本降低约 80%。双方尚未签署正式协议。
Anthropic 已签署十多份美国数据中心初步租约,总容量超 1GW,同时寻求谷歌母公司 Alphabet 提供财务担保,传闻谷歌将为其共同设计芯片。2026 年 4 月,谷歌决定向 Anthropic 投资 100 亿美元,承诺后续再投 300 亿美元。作为协议部分,Anthropic 承诺五年内向谷歌云支出高达 2000 亿美元。此外,亚马逊此前已投资 40 亿美元,Anthropic 将在十年内从 AWS 采购超 1000 亿美元算力。
单卡 700TPS! Diffusion Gemma 来了! Google 刚刚发布了 Gemma 小模型的 Diffusion 版本! 大小26B, 激活参数量4B, 最重要的是, 这次还跟 NVIDIA 合作针对4090和5090优化了...
Gemini Omni Flash is SOTA at image to video, text to video, and video editing : ) Excited to get this to developers in t...
Google 推出 Diffusion Gemma,大小 26B、激活参数量 4B,与 NVIDIA 合作针对 RTX 4090/5090 优化,5090 上速度达 700+ token/s。该扩散文本模型以“刮奖式”并行生成而非逐 token 生成,输出质量略逊但优于此前同类模型:AIME 2026(数学)达 Gemma4-26B-A4B 的 94%,tau2 bench(Agent)达 82%。4bit 量化版仅需 16G 显存即可运行。
一篇署名为 mayrhofer.eu.org 的文章在 Hacker News 上获得 107 个点赞。作者直言谷歌管理层的道德指南针已经失效,认为自己被迫离开。文章没有提供具体事件或数据,核心论点是谷歌在价值观层面出现严重偏离。
Give the topics you chat about most their own homes. 🗂️ Swipe to learn how you can stay organized with notebooks in Gem...
同一事件,精选展示《NotebookLM 笔记本功能在 Gemini App 欧洲全面上线》Btw, Anthropic is not the first company that keeps the good models to themselves. Google's internal coding models are tr...
Google DeepMind 与合作伙伴共同发起一项 1000 万美元的资金征集,专门用于多智能体 AI 安全方向的研究。
Xcode 27 Beta 新增原生谷歌 Gemini 集成,成为继 OpenAI Codex 和 Anthropic Claude Agent 之后第三个内置的 AI 编程智能体。开发者无需切换工具或窗口,即可在 Xcode 内完成构建新功能、审查代码和修复 Bug 等复杂多步骤任务。通过 Intelligence 设置面板配置 Gemini 后,Gemini 能理解项目上下文、辅助生成样板代码,并根据项目文档和文件结构更新整个项目。
Google 开源 DiffusionGemma,基于扩散架构,一次性生成大段文本再逐步优化。H100 上达 1000+ tokens/s,RTX 5090 上 700+ tokens/s。26B 参数仅需 18GB 显存,一次生成 256 tokens。多轮迭代自我纠错,可修改已生成内容。
德国一项新裁决启发了颠覆性思路:Section 230 可能无法再保护 AI 公司免于承担法律责任,或将彻底改变行业规则。
一群独立音乐人起诉谷歌,指控其未经许可用YouTube上传歌曲训练Lyria 3模型。谷歌提交驳回动议,辩称用户上传时已授予广泛许可,即便指控属实也不成立。谷歌拒绝评论是否用YouTube视频训练Lyria 3,但YouTube CEO 2024年4月称内容用于训练Gemini等模型,官方博文也确认用上传内容优化产品。谷歌还向CNBC证实使用YouTube内容训练Gemini和Veo,却始终未对Lyria明确表态,刻意保留辩解空间以应对诉讼。
Meet DiffusionGemma! An experimental open model that explores a fast approach to text generation, released under an Apac...
关联讨论 2 条X:Google DeepMind (@GoogleDeepMind)Google Developers Blog(RSS)mlx-vlm v0.6.3 is here 🚀 Day-0 support for TWO new models from our partners we work closely with: 🔥 @GoogleDeepMind Di...
谷歌6月11日发布开源文本扩散模型DiffusionGemma,本地推理速度较自回归模型提升4倍。采用Apache 2.0许可证,可从Hugging Face下载权重。采样速度1479 tokens/秒,开销0.84秒。代码生成HumanEval达89.6%,数学AIME 2025达23.3%超越对比模型。在H100 GPU上每秒生成1000 token,DGX Station上可达2000 token。
Google 发布实验性开源模型 DiffusionGemma(Apache 2.0),采用并行 diffusion 方式代替传统自回归“逐词预测”,可同时起草、纠错和精炼整块文本,生成速度达 4 倍提升(1000+ token/s)。模型在 18GB 消费级显卡即可本地运行,适用于代码、数学、复杂编辑等任务,已开源权重至 Hugging Face。
Meet DiffusionGemma ⚡ Our latest experimental open model (Apache 2.0) that generates text up to 4x faster. Instead of pr...
今天被很多人忽略的大新闻 Google 发布实时翻译模型 :Gemini 3.5 Live Translate - 能在70多种语言之间做到边听边译 - 同时保留说话人的语调、节奏和音高 - 不用等说完才翻,全程只比说话人慢几秒 - 自动滤...
Gemini 2.5 Flash API 支持配置思考预算(thinking budgets),用户可跨提供商进行比较,并在5分钟内完成首次API调用。
关联讨论 1 条OpenRouter:Announcements(RSS)Google 将去年 5 月短暂发布的 Gemini Diffusion 研究成果转化为开放权重的 Gemma 模型,模型名为 google/diffusiongemma-26B-A4B-it,采用 Apache 2 许可证开源。NVIDIA 正通过其 NIM 云 API 免费托管该模型。实测生成 2,409 个模型 token 仅需 4.4 秒,速度至少达到 500 token/s。
Google DeepMind 发布 DiffusionGemma,一款利用扩散模型加速文本输出的新模型,本地 AI 推理速度达到传统模型的 4 倍。
Google 发布 260 亿参数的 DiffusionGemma 模型,文本生成方式不再逐 token 预测,而是通过扩散过程从噪声直接生成,类似图像 AI 将噪声转化为图片。Nvidia 测试显示,该模型在单块 H100 GPU 上可达约每秒 1,000 tokens,速度约为可比自回归模型的四倍。代价是输出质量较低,因此 Google 目前将其定位为面向开发者的实验性工具。模型已开源。
Google DeepMind 发布实验性开源模型 DiffusionGemma,参数量 26B,采用混合专家(MoE)架构,通过文本扩散(text diffusion)技术实现在 GPU 上最高 4 倍生成速度提升。模型权重已开放。
关联讨论 2 条X:Google DeepMind (@GoogleDeepMind)Google Developers Blog(RSS)Google Research 在 AISTATS 2026 发表正则化 f-散度核检验,用于高效审计 LLM 等模型的机器遗忘。该方法通过统计两样本检验判断模型是否真正“忘记”特定训练数据,避免完全重训的巨大成本。相比最大均值差异等现有工具,新框架理论上可在任意样本量下自然控制假阳性,且假阴性风险随可用样本增加可靠收敛至零,解决了大规模模型审计中计算成本过高的问题。
DiffusionGemma 是 Google 推出的文本生成模型,其文本生成速度相比前代提升 4 倍。该模型详情已发布在 Google 官方博客。
Google 推出开源实验性模型 DiffusionGemma,基于 Gemma 4 的文本扩散研究。该模型为 26B MoE 架构,仅激活 3.8B 参数,量化后可适配 18GB VRAM。核心突破在于每轮前向传播并行生成 256 个 token,实现推理速度提升 4 倍:H100 上可达 1000+ tokens/s,RTX 5090 达 700+ tokens/s。DiffusionGemma 通过初始化随机占位符画布并运行多轮并行去噪,同时生成整段文本,许可证为 Apache 2.0。
DiffusionGemma is an open, experimental model that brings our text diffusion research to Gemma 4. It's a racehorse 🏇ach...
一群独立音乐人起诉谷歌,指控其未经许可使用他们上传至 YouTube 的歌曲训练 Lyria 3 音乐 AI 模型。谷歌提交驳回动议,称起诉基于“未经证实的假设”,即便原告指控属实,其已通过 YouTube 服务条款获得广泛授权。案件仍在审理中。
一项法律裁决判定 Google 对其 AI 模型产生的幻觉内容负有法律责任。该判决可能产生巨大影响,尤其若其他国家跟进做出类似裁定。
关联讨论 2 条The Decoder:AI News(RSS)Hacker News 热门(buzzing.cc 中文翻译)德国法院在一起针对 Google 的诉讼中作出裁决,认为用户不需要用 AI 来搜索互联网。该判决导致 Google AI Overview 败诉,并可能对 AI 搜索行业造成严重打击。
Meet DiffusionGemma! An experimental open model that explores a fast approach to text generation, released under an Apac...
关联讨论 2 条X:Google DeepMind (@GoogleDeepMind)Google Developers Blog(RSS)Google AI 发布实验性开源模型 DiffusionGemma,采用 Apache 2.0 许可证。该模型基于文本扩散方法,将生成瓶颈从内存带宽转向计算,在专用 GPU 上 token 输出速度最高提升 4 倍。推理时仅激活 3.8B 参数,量化后可适配 24GB VRAM 消费级 GPU。并行 token 生成支持自我纠错,适用于代码填充、行内编辑等非线性结构。DiffusionGemma 优先速度而非极致质量,生产场景仍推荐标准 Gemma 4。
关联讨论 2 条X:Google DeepMind (@GoogleDeepMind)Google Developers Blog(RSS)