I'm excited to share that I'll be joining OpenAI and look forward to working with the exceptional team there. It was a d...
I'm excited to share that I'll be joining OpenAI and look forward to working with the exceptional team there. It was a d...
谷歌即将发布 Gemini 3.5 Pro,已在 Gemini 3.1 Pro 产品卡片上标注“3.5 Pro 即将推出”。相比 3.1 Pro,预计视觉能力更强、多模态推理更出色,SVG/前端生成功能升级。将搭载更严格的安全过滤器和内容审核机制,定价预计更高。最大期待是谷歌能在正式发布前修复早期版本在长复杂任务中的“偷懒”问题。
I'm excited to share that I'll be joining OpenAI and look forward to working with the exceptional team there. It was a d...
关联讨论 8 条IT之家(RSS)X:Kim (@kimmonismus)The Decoder:AI News(RSS)X:Jason Liu (@jxnlco)Hacker News 热门(buzzing.cc 中文翻译)X:歸藏 (@op7418)X:Sam Altman (@sama)TechCrunch:AI(RSS)I'm excited to share that I'll be joining OpenAI and look forward to working with the exceptional team there. It was a d...
Google 分享了三种集成 A2UI 与 MCP Apps 的架构模式,旨在结合两者优势。A2UI 采用声明式框架,通过 JSON payload 定义 UI,由宿主原生渲染,确保一致性与安全性,但受限于预定义组件库。MCP Apps 在 iframe 中使用标准 Web 技术提供自定义界面,但存在设计碎片化、性能与安全挑战。三种模式包括:通过 MCP 服务器提供 A2UI,利用 MCP Resources 或 Tool 调用传递 JSON,实现“一次编写,原生渲染”的跨平台能力;以及静态与动态交付方案。Google 正考虑扩展 MCP 以原生支持 A2UI。
At @GoogleLabs, our goal is to "build together" with industry experts. So, we handed Stitch to the team at Voltage to se...
由自动驾驶领域连续创业者Oliver Cameron(CEO)和Jeff Hawke(CTO)联合创立的世界模型AI公司Odyssey完成3.1亿美元B轮融资,估值14.5亿美元。本轮由Natural Capital领投,Amazon、AMD Ventures、GV等跟投。Odyssey成立于2023年,其世界模型通过人员背负相机采集物理世界数据并模拟真实物理效果。公司提供面向游戏制作和机器人等场景的多款世界模型,以从文本提示生成交互视频而知名。AWS成为首选云服务商,模型将针对AWS Trainium芯片优化。天使投资者包括Jeff Dean、Elad Gil等,累计融资3.37亿美元。
分享一个跨国小团队用 NotebookLM 高效沟通对齐的方法:将公司关键文档上传至 NotebookLM,生成播客,自己听无误后转成所需语种让对方收听;沟通不清晰时还可通过文本问答澄清。该方法在小团队中效果很好,但对内容安全要求不高时适用。
Google推出首款专为Gemini打造的智能音箱Google Home Speaker,售价99.99美元。支持自然语言请求和多步指令,可在说话中途纠正,并具备连续对话功能。内置10种新声音。高级AI功能需订阅Google Home Premium(月费10美元或年费100美元),包括Gemini Live自由对话、Nest摄像头活动摘要等。即日起预售,本月发货。
谷歌去年八月发布的新款智能音箱 Google Home Speaker 现已开启预售,售价 $99.99,6 月 25 日正式开售。扁球体织物外观有淡褐、瓷白、翠绿和浆果红四色。支持 360 度声场,底部环形灯带在语音交互时亮起,配备三个远场麦克风和静音开关。内部搭载四核 A55 处理器及专用 NPU,运行本地 AI 模型提升降噪。仅有一个 58mm 全频驱动单元,音质介于 Nest Audio 与 Nest Mini 之间。可与 Google TV Streamer 配对实现沉浸式音频,兼容其他 Nest 设备。购买附赠六个月 Google Home Premium,启用 Gemini Live 支持连续对话。
Agentic Resource Discovery(ARD)是一项开放规范,用于在Web上发布、发现和验证AI工具、技能与智能体。它基于两个原语:组织在其自有域名下托管catalog描述可用能力,registry作为搜索引擎索引catalog并响应发现请求。ARD支持加密验证,使客户端与端点连接前确认发布者身份,然后直接通过原生协议调用能力。Google Cloud的Gemini Enterprise Agent Platform通过Agent Registry提供企业级支持,包括URN命名、出站策略、工具固定和基于Agent Identity的信任验证。该规范现已发布,开发者可通过托管ai-catalog.json文件使其服务可发现。
今日发表在《自然》杂志上的研究展示了 Google 的医学推理 AI 系统 AMIE(Articulate Medical Intelligence Explorer)从单次诊断对话演进到长期疾病管理的能力。AMIE 利用 Gemini 模型的长上下文能力,整合共情对话智能体和深度思考管理推理智能体,可交叉引用数百页临床指南。在盲测中,AMIE 与 21 名初级保健医生相比,在整体管理推理上匹配临床医生,在计划精确性和指南一致性上得分显著更高。
谷歌发布新一代 Google Home 智能音箱,搭载 Gemini for Home AI 语音助手,支持自然语言交流与多步骤语音指令,用户中途改口也能正确理解。球形设计,360° 环绕音效,麦克风系统可自动调节拾音。硬件:1GB LPDDR4 内存、四核 Cortex-A55 2.0GHz 处理器、4GB 存储,顶部电容触控,3D 织物材质三种配色。可与 Google TV Streamer 组成立体声环绕系统。6 月 25 日上市,定价 100 美元(约 677 元)。
🚨 Google New Image Model > Instant-ramen (successor of nano-banana) Ramen is cooked time to serve soon , we will share ...
Google Home Speaker 于 6 月 17 日开启预购,6 月 29 日发货,售价 $99。该音箱专为 Gemini for Home 设计,内置本地模型用于降噪和回声抑制,支持 360 度音频,可配对立体声或配合 Google TV Streamer 实现空间环绕声。它还是 Matter 控制器和 Thread 1.3 边界路由器。Gemini for Home 延迟降低 40%,修复超 25,000 个问题,新增 50 余项功能。部分高级功能(如 Gemini Live)需订阅 Google Home Premium($10/月),购买前可获赠 6 个月。
英国住房社区和地方政府部与科学创新技术部部署了两款基于 Gemini 基础模型的生成式 AI 工具。Extract 应用将历史 PDF 中的非结构化数据转为结构化数据集,每年为每个议会节省约 255 小时人工录入。APD 原型自动完成文档整合、法规检查、公众总结和评估报告起草四项任务,但保留人类官员最终决策权。目标将规划申请决策时间缩短 50%。Extract 已扩展至英格兰所有议会,APD alpha 版在三个地方机构测试,计划 2027 年部署至 300 多个英格兰地方当局。
6月17日,谷歌向Pixel Watch 2、3、4正式推送Wear OS 7更新。系统功耗优化使续航比Wear OS 6提升10%。交互新增手机端“实时更新”功能,可追踪外卖、快递状态;无手机时可通过音频切换器管理音乐播放。智能方面,部分2026年发布的手表将获Gemini Intelligence支持,能理解指令、调用应用完成多步骤任务,支持语音创建定制化小部件,并可调用Google Docs、Gmail中的个人数据提供智能服务。
ChatGPT 月活用户达 11 亿,但其消费者 AI 助手市场份额首次降至 46.4%(Sensor Tower 数据)。Gemini 占 27.7%,受益于 Google 搜索、Android、Gmail 和 Workspace 分发;Claude 占 10.3%,工作场景增长且订阅转化率 13%。整体市场仍扩张:预计 AI 应用下载量 23 亿次、消费 42 亿美元、使用时长 360 亿小时。但增长放缓,竞争转向留存、付费转化及工作流嵌入。
6 月 17 日,谷歌正式推送 Android 17 正式版及 Wear OS 7,首发搭载 Pixel 设备。新系统集成音乐生成模型 Lyria 3、多模态大模型 Gemini Omni 及基于 AudioLM 的语音翻译工具(适配 Pixel 10a)。Pixel 专属更新:Gemini Omni 支持对话中剪辑视频,Lyria 3 可输入文字或图片生成曲目;老款 Pixel 8a、9a 快速分享兼容苹果 AirDrop。系统新增“气泡任务栏”多任务控件、同屏录摄、家长管控及折叠屏 50/50 游戏模式。手表新增车祸、摔倒、无脉搏自动呼救,续航提升 10%,夏季将上线 Gemini 桌面小组件。
Google Labs VP Josh Woodward宣布,Google AI Futures Fund正式扩展至巴西,与风投公司Monashees合作推出Gama Fund。该基金面向深度科技创始人,提供早期访问Google DeepMind模型、最高200万美元联合投资、35万美元Google Cloud与Gemini积分,以及Google工程师在IPT Open校区共同开发的直接支持。
Google DeepMind 与英国政府合作,基于 Gemini 构建 AI 规划原型,旨在将家庭规划申请处理时间减半。该工具可整合数据、识别本地政策、总结公众反馈并起草评估报告,但规划官员保留最终决策权。原型已在 Barnet、Camden 和 Dorset 试点,计划 2027 年向全英议会开放。此前推出的 Extract 工具(同样基于 Gemini)已向英格兰所有议会开放,能将非结构化 PDF 转为可用数据,预计为每个议会每年节省约 255 小时人工。家庭规划申请占每年规划申请的近 70%,AI 工具旨在让官员聚焦更复杂的公共利益申请。
Want a closer look at today's launch? Here is a breakdown of what's new and exciting 🧵: First up: An upgraded, more tho...
柏林法院近日裁定,Google的AI Overviews仅是一种“新的搜索结果格式”,用于汇总第三方内容,而非搜索引擎自身的原创陈述。法院认为普通用户能清楚识别AI是整合其他来源信息,Google对回答内容没有“决定性影响”。该判决源于一家香水公司因商标问题提起的诉讼——AI摘要中出现了其受保护品牌名及平价仿品链接。此前慕尼黑法院在另一起虚假事实案中得出相反结论,认定AI摘要为独立内容,Google须为算法错误负责。两起案件涉及不同法律基础(商标与竞争法 vs. 虚假陈述),上诉结果可能重塑AI搜索的责任边界。
美国国防部通过自建GenAI.mil平台向全军提供Google Cloud的Gemini for Government等生成式AI工具,用于撰写国会要求的年度报告。首席技术官Emil Michael称原本需200小时的工作可压缩至5小时。副助理部长Jacob Glassman也透露团队使用后称“这是五年来最好的报告”。平台用户数从2025年12月的8万激增至2026年6月的150万。但AI报告存在错误风险——KPMG曾因AI生成错误案例而撤回报告,而五角大楼的审查流程尚不透明。
Google 近日发布 Android 17 正式版及 Wear OS 7,率先登陆 Pixel 设备。Pixel Drop 新增 AI 模型支持:音乐生成模型 Lyria 3、多模态 Gemini Omni 及基于 AudioLM 的语音翻译工具(Pixel 10a)。Quick Share 文件分享兼容 Apple AirDrop。Android 17 引入“气泡栏”多任务界面、自拍屏幕录制、折叠游戏模式(50/50 布局与动态手柄)以及“标记为丢失”等安全与家长控制功能。Pixel Watch 新增车祸/跌落/无脉搏自动紧急呼叫。Wear OS 电池续航提升最高 10%,并将在夏季推出更多 Gemini 智能功能。
Google Research 发布 Vectorized Farmscapes 2020 向量化数据集,将英格兰超 130,000 km² 高分辨率栅格地图转化为树篱、石墙、小树林等精细生态特征量化清单。该数据集基于 RSF 的 Vision-Transformer Backbone(在超 3 亿张卫星图像上预训练)微调,融合亚米级影像与 1 米 LiDAR 数据实现双层标注。为突破 247 km² 标注数据限制,采用 Polsby–Popper 紧凑性评分对几何形状功能分类,区分林地、连接廊道与孤立树丛。旨在不侵占农业用地提升碳汇与生物多样性。
2026 年 5 月底,ChatGPT 市场份额降至 46.4%,为发布以来首次低于 50%。Gemini 以 27.7% 紧随其后,Claude 占 10.3%。ChatGPT 仍以超 11 亿月活跃用户领先,Gemini 和 Claude 分别拥有 6.62 亿和 2.45 亿用户。用户在不同助手间切换意愿增强,OpenAI 与美国国防部的合作曾引发卸载高峰。Claude 订阅转化率达 13%,领先行业。OpenAI 已在 ChatGPT 中试验广告,5 月日均 17% 用户看到广告,软件与购物为主要广告类别。ChatGPT 正向 Target、Walmart 等零售商导流,Amazon 因封锁爬虫错失流量。
Gemini 应用推出名为 Daily Brief 的新 AI 智能体,用户可在起床前用它规划一天。官方提供三条使用建议:1)通过点赞或踩直接反馈,训练 Gemini 了解偏好;2)直接与 Gemini 对话,对简报内容提问或调整;3)点击简报项下方的“更多”按钮,查看 Gemini 引用的具体邮件、聊天或 Google 日历事件来源。目前该功能已上线,官方持续收集用户反馈以改进体验。
谷歌今日推出 TPU Developer Hub,面向模型构建者与开发者提供端到端教育资源。内容覆盖预训练、后训练及推理工作负载,涵盖硬件架构、软件栈(XLA、PyTorch 零成本迁移)、追踪调试(XProf 工具)、并行优化(Pallas 内核、KV cache 卸载)及网络安全实践。资源形式包括交互式 Colab、开源代码配方与深度技术文档,支持 AI 智能体辅助集成,帮助用户充分发挥 Cloud TPU 性能。
2026年6月16日,vickiboykis.com 上发布了一篇题为“Running local models is good now”的文章,作者认为当前阶段在本地硬件上运行大语言模型已经能够取得不错的效果。该文章在 Hacker News 社区引发讨论,相关帖子获得 114 点热度,表明本地模型运行体验得到了社区的认可。
Google Cloud 发布 Open Knowledge Format (OKF) v0.1,一种供应商中立的 Markdown 规范,为 AI 智能体提供结构化上下文知识。OKF 将知识表示为带 YAML 前置元数据的 markdown 文件目录,每个概念对应一个文件,通过 type、title、description 等少量保留字段实现互操作。无需专有服务、SDK 或运行时,目录可托管在 GitHub、以 tarball 传输或挂载到任意文件系统。OKF 旨在解决组织内部知识碎片化问题——表结构、指标定义、runbook 等散落在不同 catalog 和 wiki 中,各厂商方案互不兼容。遵循最少意见原则,只强制 type 字段,生产者和消费者可独立实现。使用场景包括数据团队将 BigQuery 表定义导出为代码、为智能体存储 incident runbook、跨组织知识交换等。
谷歌更新Android Bench榜单,GPT-5.5以74分居首,GPT-5.4与Gemini 3.1 Pro Preview并列第二(72.4分),Claude Opus 4.7(68.7分)和Opus 4.6(66.6分)分列第四、第五。谷歌自家Gemini 3.5 Flash仅获63.7分排第六,平均Token消耗3.559亿,单次运行成本147.1美元,为榜单最贵模型。成本仅为其约1/3的Gemini 3.1 Pro Preview性价比更高。DeepSeek V4 Flash以52.7分排第12,单次运行成本仅8.4美元,后者成本仅为前者的1/17.5。
Want unreleased @GeminiApp features before anyone else? Love breaking, testing, and shaping new tech? We're opening a li...