Google推出全新Google Health平台,取代Fitbit应用,采用开放生态策略,支持从Apple Watch、Garmin等多设备导入健康数据。平台内置Gemini AI教练,提供智能推荐与个性化指导,直接挑战Apple Health的封闭模式,标志着健康数据与AI竞争进入新阶段。
谷歌在新健康应用中发布了由Gemini驱动的AI健康教练,能整合用户的健身、睡眠、营养、周期追踪、天气乃至美国医疗记录等全方位健康数据。此举被视为迈向个人AI医生和个性化AI医疗的第一步。谷歌将Fitbit应用升级为Google Health,使其成为集健身、睡眠、体征监测、设备连接及未来Google Fit数据迁移于一体的中心平台。Fitbit继续作为硬件核心,而应用则成为Gemini驱动教练、Google Health Premium及新Fitbit Air生态的基地。这一发布领先于苹果即将推出的由Gemini赋能的新Siri及类似健康概念。
Google开源的DESIGN.md是一个面向AI的结构化设计规范文件,能系统定义字体、色彩、间距等核心设计元素,解决AI生成UI时风格不一致的痛点。通过借鉴成熟品牌设计语言,并用AI将其提炼为DESIGN.md文件,开发者可在此基础上构建Landing Page、Mobile App等各类Agent Skills。这套工作流能确保创业项目的官网、应用、宣传材料等所有触点保持统一的视觉基因,快速呈现专业、一致的“亿元公司”质感。此外,建立日常设计灵感库是培养审美、AI无法替代的关键环节。
how to use Google's NEW open source Design.md + AI Skills to make your startup look like a $100 million company in 1 hou...
Google Translate的Live translate功能通过耳机提供70多种语言的实时同声传译。用户只需佩戴耳机并启动应用,即可在耳中直接听到翻译。该功能基于Gemini高级语音模型,不仅能准确翻译语义,还能保留说话人的语气、重音和节奏等细微特征,使交流体验更接近真人对话。这项技术旨在消除跨语言沟通的障碍,让用户在海外能进行更自然的交流。
Save this tip before your next big trip abroad ⬇️ With Google Translate's Live translate feature, you can get instant tr...
New #gemini agent 👀👀👀
Announcing a new partnership between Google Flow Music and global artist development company, Believe! 🤝 Here's what th...
Major new feature for @NotebookLM power users: in the tradition of Mind Maps, Notebook can now auto-label your sources, ...
这个项目能让Gemma 4 推理提速到6倍 比谷歌的3倍还快,而且不损失质量 https://github.com/z-lab/dflash
@testingcatalog @btibor91 perosnal context in europe
Anthropic与谷歌云达成五年2000亿美元云基础设施合同,加之四月与亚马逊的千亿美元协议,其未上市即承诺的云支出规模已超越多数科技公司市值。Anthropic与OpenAI共同占据美国四大云服务商约2万亿美元收入积压订单的一半,这实质上是市场对两家初创公司在2029年前实现20-30倍收入增长的豪赌。与OpenAI自建数据中心不同,Anthropic同时绑定谷歌、亚马逊和微软的云产能,虽避免了单点故障和硬件持有风险,却加深了对云巨头的依赖——谷歌正用自研TPU芯片运行其模型,这种不对称关系可能影响其长期议价能力。
Google发布了Gemma 4系列模型的专用草稿模型,用于推测性解码优化。31B Dense模型搭配草稿模型速度提升3倍,仅增加1G显存开销;Gemma4-26B和Gemma4-E4B分别提升1.5倍和3.1倍速度。新草稿模型如gemma-4-31B-it-assistant体积仅939 MB,专门优化后接受率高,相比之前使用非专用草稿模型(如gemma-4-E2B-it-UD-Q4_K_XL)提速更明显。作者呼吁Qwen尽快推出类似优化模型(如Qwen3.6-27B-assistant),以应对高性能需求。
Google NotebookLM的思维导图功能正进行重大升级,新功能从今天起推出。核心更新包括自定义功能,用户可通过特定提示词引导MindMap的生成方向;组织功能支持立即重命名和分享MindMap,提升管理效率;导航功能优化了节点之间的过渡,实现更丝滑的交互体验。此次升级旨在增强工具的灵活性和用户体验,并邀请用户反馈意见。
Google通过为Gemma 4引入MTP drafters(多token预测草稿机),在不增加参数、不改变架构和模型质量的前提下,实现了最高3倍的推理速度提升。该技术让模型能一次预测多个token,突破了传统自回归解码的串行瓶颈,极大提升了GPU利用率。这显著增强了本地部署的实时性,并使Agent、代码生成等场景受益,进一步放大了开源模型在性价比和本地运行方面的优势。
Gemma 4: Now up to 3x Faster. ⚡ Same quality, way more speed. Our new MTP drafters allow Gemma 4 to predict multiple tok...
Google发布Gemma 4模型,采用创新的MTP drafters技术,实现最高3倍解码速度提升且质量无损。该技术让模型一次预测多个token,突破传统自回归生成的串行瓶颈,极大提升GPU利用率。vLLM项目在官方宣布后立即提供Day-0支持,用户可通过一条Docker命令快速部署。这一进步显著增强本地部署的实时性,使Agent、代码生成等场景受益,进一步放大开源模型在性价比和本地化运行方面的优势。
Gemma 4 现在最高能跑到 3倍速度,而且质量完全不变。 他们没有增加参数、没有换新架构,只是推出了一套 MTP drafters(多 token 预测草稿机),让模型一次预测多个 token,彻底绕过了传统 autoregressiv...
人工智能公司Anthropic与谷歌云达成一项价值约2000亿美元的多年期承诺,用于购买云计算服务和TPU芯片。此举不仅是购买服务器,更是对未来训练和部署前沿模型所必需的稀缺计算资源(包括芯片、电力、网络和数据中心空间)的长期储备。据报道,此项承诺可能占谷歌云近期披露收入积压的40%以上,意味着单一AI实验室已成为其未来合同销售的重要部分。其深层战略在于分散依赖,Anthropic将Claude的算力分布在谷歌TPU、亚马逊Trainium和英伟达GPU上,以避免受限于单一供应商。
Mo sources mo problems? Not anymore: Rolling out now, NotebookLM can auto-label & categorize sources (when you have 5+),...
Mind Maps are getting a major glow up 💅 These new features are rolling out today: 🚗Customization: Steer your map with ...
Today, we're introducing Pomelli Catalog.📣✨ Add your products or services, and Pomelli will use them to generate person...
Gemma 4: Now up to 3x Faster. ⚡ Same quality, way more speed. Our new MTP drafters allow Gemma 4 to predict multiple tok...
Gemini API 文件搜索工具近日扩展三项功能更新,旨在帮助开发者更轻松地构建高精度多模态检索增强生成系统。更新包括:多模态支持,通过Gemini Embedding 2模型实现对图像和文本的同步推理;自定义元数据过滤,允许为文件添加键值标签以结构化非结构化数据,从而提升搜索速度;精确引用功能,能够捕获并返回每条索引信息的精确来源,如页码。开发者可通过Google AI Studio的示例应用体验这些功能,与图像和文档库交互,提问并追溯答案来源。
Google为其开源模型Gemma 4推出MTP drafter(多token预测草稿模型),采用推测解码技术,能在保持输出质量不变的前提下,将推理速度最高提升3倍。该技术利用轻量级小模型预先推测多个token,再由大模型并行验证,从而显著提高吞吐效率,尤其有利于缓解本地部署时的内存带宽瓶颈。例如,在Apple Silicon上运行26B MoE模型时,批量处理可获得约2.2倍加速。模型沿用Apache 2.0协议,权重已开源,并获主流推理框架支持。
Gemma 4: Now up to 3x Faster. ⚡ Same quality, way more speed. Our new MTP drafters allow Gemma 4 to predict multiple tok...
new in ai studio ⬇️ we've integrated @nanobanana to automatically create custom image assets for your app as it generate...
Gemini 3.2 Flash Spotted
Google与UCSD合作推出扩散式推测解码技术DFlash,在Google Cloud TPU上实现了3.13倍的无损推理加速。该技术突破了传统自回归解码逐个生成token的串行瓶颈,通过一次推测生成多个token来改变生成范式。这一硬件与算法的联合优化,将重塑云端成本曲线,并使实时Agent、长上下文等应用更趋现实,同时大幅降低本地部署门槛。此举将大模型推理的竞争引向了系统级优化的新赛道。
Breaking LLM inference's autoregressive bottleneck 🛠️ We've teamed up with @haozhangml, @YimingBob, and @aaronzhfeng, a...
同一事件,精选展示《在谷歌TPU上实现3倍加速:UCSD利用扩散式推测解码优化LLM推理》Google推出Code Wiki项目,旨在解决“阅读现有代码”这一开发瓶颈。该工具能自动扫描代码仓库,实现文档随代码变更实时更新,避免过时。其核心功能包括由Gemini驱动的智能聊天,可将整个Wiki作为知识库进行问答,并支持超链接跳转至具体代码行;还能自动生成架构图、类图、时序图等可视化图表,并链接到源码。工具适用于各种规模的仓库,帮助新人快速上手或理解遗留代码。目前公共仓库已开放预览。
谷歌、微软和xAI已同意在美国商务部机构CAISI的测试下,提前评估其前沿AI模型。测试的特殊之处在于,公司将提供降低或移除安全护栏的模型版本,以便评估其在协助网络入侵、恶意软件规划等高危任务上的原始能力与风险。此前,OpenAI和Anthropic已于2024年达成类似协议。此举背景是白宫正考虑建立针对主要AI模型的政府审查流程,审查重点是其网络能力——即发现和利用软件漏洞以改变现实安全风险的水平。政策转向的触发点是Anthropic的Mythos模型,该公司认为该模型在发现安全漏洞方面能力过强,广泛发布风险过高。
Nytimes: The White House is considering a government review process for major AI models before public release. The propo...
针对TPU v8i因双计算芯片而被误认为是训练芯片的观点,关键在于计算吞吐与内存容量/带宽的平衡。TPU v8i拥有更高的HBM3E内存容量(288GB对216GB)和带宽(8.6TB/s对6.5TB/s),以及更大的片上SRAM(384MB对128MB),这使其更适合内存带宽受限的推理解码任务。而训练芯片TPU v8t虽为单芯片设计,但通过极致密集的计算单元实现了更高的FP4算力(12.6 PFLOPs对10.1 PFLOPs),以满足训练所需的高算术强度,这也体现了Google尝试使用FP4进行训练的技术方向。