WorldReasonBench新基准测试评估AI视频生成器的物理和逻辑合理性,而非图像质量。ByteDance的Seedance 2.0在该测试中领先,超过Veo 3.1和Sora 2。商业模型的得分大约是开源模型的两倍,逻辑推理是所有模型中最困难的类别,表现差距显著。这表明AI视频生成器虽能产生惊艳视觉效果,但尚未实现从像素生成器到真实世界模型的飞跃。
WorldReasonBench新基准测试评估AI视频生成器的物理和逻辑合理性,而非图像质量。ByteDance的Seedance 2.0在该测试中领先,超过Veo 3.1和Sora 2。商业模型的得分大约是开源模型的两倍,逻辑推理是所有模型中最困难的类别,表现差距显著。这表明AI视频生成器虽能产生惊艳视觉效果,但尚未实现从像素生成器到真实世界模型的飞跃。
新加坡与Google DeepMind达成战略合作,共同将前沿人工智能技术应用于解决该国在医疗健康、教育创新和可持续发展等领域的复杂挑战。双方旨在通过该国家级伙伴关系,推动AI技术在实际场景中的落地,以应对社会性难题,提升国家科技竞争力。
Google 在新发布的官方文档中明确指出,SEO 行业近期流行的“生成式引擎优化”和“答案引擎优化”只是传统 SEO 的另一种说法,并无实质区别。公司驳斥了 LLMS.txt 文件、内容分块等针对 AI 搜索的常见策略,强调其 AI 搜索与传统搜索采用相同的排名系统。这意味着网站无需为适应 AI 搜索而采取特殊优化措施,遵循既有的 SEO 最佳实践即可。
Calico Life Sciences 通过 Co-Scientist 平台,将零散的衰老研究发现进行连接与整合,从而生成新的研究线索与方向。该工具旨在加速衰老领域的科学探索,为后续研究提供创新思路。
研究者 Filippo Menolascina 使用 AI 工具 Co-Scientist,旨在寻找新的肝脏疾病治疗方法,并解释现有药物为何仅对部分患者有效。该研究聚焦于加速对疾病机制的理解,以推动更精准的治疗方案开发。
谷歌更新垃圾内容政策,正式将“AI投毒”行为纳入打击范围。新政策覆盖搜索引擎结果、AI概览和AI模式两大板块,明确将操纵生成式AI回答、通过非常规手段植入提示词以提升网站权重的行为定义为违规。例如,曾有记者通过此类方法让谷歌AI将其列为“最能吃热狗的记者”。谷歌表示,一旦发现此类操纵行为,将采取降低搜索排名或完全移除搜索结果等处罚措施。
谷歌为其即将推出的安卓AI助手Gemini Intelligence设定了明确的硬件与系统门槛。硬件上要求设备搭载旗舰芯片、至少12GB内存,并支持端侧AI模型Gemini Nano v3或更高版本。系统层面则需承诺至少5次安卓大版本升级和6年安全更新。符合这些条件的设备主要集中在2026年发布的新机型,如谷歌Pixel 10系列、三星Galaxy S26系列及Z Fold/Flip 8等。该助手旨在跨应用理解并执行用户任务,计划于今年夏季推出。
WeatherNext AI模型协助气象预报员为社区在飓风Melissa登陆前提供了前所未有的准备时间。该模型通过提升预测准确性与提前量,帮助牙买加等地成功应对了这场历史性的飓风事件,显著增强了灾害预警的时效性。
Google发布了Gemini 3.5模型,该模型专注于提升执行复杂任务的能力。其核心特点是支持“代理式工作流”,即能够像助手一样自主规划并执行一系列多步骤、复杂的操作,旨在将先进的语言理解与实际问题解决能力相结合。
关联讨论 19 条X:Google AI (@GoogleAI)Google Blog:AI(RSS)X:Sundar Pichai (@sundarpichai)Google DeepMind:Blog(RSS)The Verge:AI(RSS)X:Google DeepMind (@GoogleDeepMind)Google Developers Blog(RSS)The Decoder:AI News(RSS)IT之家(RSS)X:Berry Xia (@berryxia)X:Jeff Dean (@JeffDean)X:Gemini (@GeminiApp)Hacker News 热门(buzzing.cc 中文翻译)X:Google AI for Developers (@googleaidevs)X:Rohan Paul (@rohanpaul_ai)X:Logan Kilpatrick (@OfficialLoganK)X:Ethan Mollick (@emollick)X:阿易 AI Notes (@AYi_AInotes)X:Kim (@kimmonismus)谷歌 Gemini 被曝正在开发名为 Spark 的智能体功能。与仅回答问题的传统助手不同,Spark 能直接替用户执行任务,例如清理 Gmail 收件箱、整理会议笔记和生成新闻摘要。用户可创建特定技能处理重复性工作,并支持多步骤工作流。目前它主要集成谷歌 Workspace,未来可能扩展至第三方应用。此外,Spark 或将能控制 Chrome 浏览器和调用文件,但暂时无法像 OpenClaw 等工具那样控制整台电脑。
科技媒体9to5Google在评测Fitbit Air智能手环时,发现其内置的付费AI健康教练Health Coach出现幻觉,虚构了一段不存在的5.2英里(约8.4公里)跑步记录。该AI不仅承认捏造,还将责任推给用户,暗示可能是用户漏记。这项月费10美元的服务因此被指可靠性存疑,削弱了订阅价值。Fitbit Air手环重约12克,原定5月26日开售,而Google Health应用计划5月19日上线,谷歌仍有机会在发布前优化模型、减少幻觉。
Google开源框架Genkit近日推出其核心中间件系统,旨在提升智能体AI应用的可靠性与可控性。该系统允许开发者在生成调用、模型及工具层进行拦截,以注入自定义行为,如重试机制、模型回退以及人工介入的工具审批流程。通过创建并堆叠自定义中间件,开发者能够实现对模型输出的确定性控制。所有中间件的执行流程均可通过专用的开发者界面进行实时查看与调试,有效支持使用TypeScript、Go、Dart和Python构建生产就绪的智能体应用。
Arm第二代可扩展矩阵扩展(SME2)与Google AI Edge软件栈集成,将CPU转变为强大的矩阵计算加速器,从而实现高性能的设备端生成式AI。本文以Stability AI的“stable-audio-open-small”模型为例,阐述了利用LiteRT、XNNPACK和KleidiAI构建的“转换、优化、部署”自动化硬件加速流程。该方案在基于Arm架构的移动设备和笔记本电脑上,成功实现了音频生成速度提升2倍以上、内存使用减少4倍的显著效果,同时确保了高音频质量。这一集成方案为在资源受限的边缘设备上高效运行复杂AI模型提供了有效路径。
凯度发布2026年全球品牌百强榜,百强总价值达13.1万亿美元,同比增长22%。谷歌以1.5万亿美元品牌价值终结苹果四年榜首地位,苹果、微软、亚马逊紧随其后,首次出现四个品牌价值同时突破万亿美元。AI原生品牌加速崛起,Claude首次上榜,ChatGPT价值同比飙升285%成为增速最快品牌。中国品牌表现强劲,13个品牌上榜,平均价值增长32%高于全球水平。
Similarweb数据显示,过去一年ChatGPT在AI聊天机器人网页端流量份额从77.6%大幅下滑至53.7%。谷歌Gemini同期份额从7.3%飙升至26.7%,成为最大赢家;Anthropic的Claude也从1.4%增长至近8%。其他竞品份额变化较小或维持低位。需注意此统计仅涵盖网页端,未包含API、应用等重要渠道,且谷歌能通过安卓系统与搜索为Gemini导流,影响了当前流量格局。
根据 Similarweb 数据,ChatGPT 的网站流量份额在十二个月内从 77.6% 降至 53.7%。Google Gemini 成为最大赢家,份额从 7.3% 跃升至 26.7%,覆盖范围增长三倍。这些统计仅涵盖网络流量,不包括 API 使用或移动应用数据。
英特尔与高通已确认参与谷歌Googlebook笔记本项目。谷歌副总裁透露,该系列将同时搭载英特尔、高通及联发科的处理器,实现x86与ARM双架构并行。Googlebook定位为高端AI原生笔记本,深度集成Gemini大模型,并将设立统一硬件标准以确保高端体验。首批设备将于今年秋季上市,可原生运行安卓应用并支持与手机深度互联。此举标志着英特尔与谷歌的合作从云端AI基础设施扩展至消费级终端。
谷歌在Android活动中为Gboard输入法推出由Gemini驱动的AI语音听写功能Rambler。它能自动删除“呃”“啊”等填充词,并理解即时修正。其核心亮点是支持“代码切换”,可在同一句话中无缝识别多种语言且保持上下文连贯。谷歌强调,该功能不存储语音录音,结合设备端与云端处理以保障隐私。Rambler初期将于夏季在三星Galaxy和谷歌Pixel手机上推出,未来将扩展至更多Android设备。
Google 正在招聘数百名工程师,专门协助客户采用其人工智能技术。这一大规模招聘举措表明,人工智能的实际部署与应用过程仍然存在显著困难,企业客户在技术落地时面临挑战。公司正通过扩充专业服务团队来加速其AI解决方案(如Gemini)的市场渗透和客户集成。
谷歌DeepMind发布了名为Magic Pointer的AI光标交互功能,旨在重构桌面端安卓系统的鼠标使用体验。其核心理念是让AI无缝融入用户当前工作流,通过识别光标位置和语音指令理解上下文,无需复制内容或输入完整提示词。该功能遵循四项原则:保持工作连续性、支持“边指边说”交互、理解“这个/那个”等自然指代、将屏幕像素转化为可操作实体。目前,谷歌已在AI Studio上线演示,并正将相关能力逐步集成至Chrome浏览器的Gemini中。
谷歌在2026年The Android Show活动上预览了“Create My Widget”功能,计划于今年夏季上线。该功能允许用户通过自然语言描述(如“每周推荐3个高蛋白备餐食谱”)自动生成个性化主屏幕小部件,替代传统手动配置。它不仅能从网络抓取信息,还能整合Gmail、日历等谷歌应用数据,将航班、天气等分散信息聚合为单一仪表盘,强调按需筛选与个性化体验。其核心能力基于Gemini模型的知识处理与个人数据整理。
谷歌副总裁确认,集成Gemini AI的Googlebook笔记本电脑将采用英特尔、高通和联发科的处理器,延续了Chromebook的主要SoC供应商阵容。谷歌强调将避免硬件生态碎片化,确保所有Googlebook提供一致的高端体验,并正与合作伙伴对处理器、存储器及键盘布局等组件制定严格规范。目前AMD尚未就此生态表态。
据《华尔街日报》报道,谷歌正与SpaceX谈判火箭发射协议,以推进其名为“Project Suncatcher”的太空数据中心计划,目标是在2027年前发射原型卫星。谷歌是SpaceX的早期投资者,持有其6.1%股份。为支撑这一愿景,SpaceX已申请发射多达100万颗卫星,旨在解决地面数据中心面临的土地与能耗问题。此外,SpaceX在筹备大规模IPO的同时,近期还宣布收购xAI等多项重大投资与合作。
研究发现,现有顶尖的视频多模态大模型在理解声音时,常依赖视觉线索进行推断或“幻听”,而非真正处理音频,这种“视听聪明汉斯效应”普遍存在于主流模型中。为此,研究者提出了Thud干预探测框架,通过时间偏移、静音与替换三种反事实音频编辑来诊断该问题。他们进一步提出了一种仅需10K样本的两阶段对齐训练配方,能将模型在干预测试上的平均表现提升28个百分点,同时也能略微改善通用视频问答的性能。
Google 通过 Gemini Intelligence 为 Android 推出多项新 AI 功能。这些智能体可自动化多步骤任务,例如预订行程和填写表格。系统还能总结网页内容,并将口语化想法转化为精炼的文本信息,直接集成于 Chrome 自动填充和 Gboard 输入法等系统工具中,提升操作效率。
Google 威胁情报小组发现了首个已知案例,攻击者利用 AI 发现并武器化了一个零日漏洞。Google 表示已阻止了这场计划中的大规模攻击。来自中国、朝鲜和俄罗斯的国家支持行为体也在使用 AI 来寻找漏洞并伪装恶意软件代码。这标志着 AI 在网络攻击中的角色从辅助工具升级为主动发现关键漏洞的武器。
谷歌在2026年I/O活动上推出Gemini Intelligence系统方案,旨在将安卓生态中的Gemini从问答助手转型为能主动跨应用、跨网页执行任务的智能助手。其核心是任务自动化,例如通过Chrome浏览器代为填写复杂表单。方案还新增了通过文字描述生成小组件代码的“Create My Widget”工具,以及优化语音输入文本的Gboard“Rambler”模式。算力采用端侧Gemini Nano与云端结合的策略。功能将分阶段推送,Chrome自动浏览功能于6月启动,相关手机将从今年夏季开始陆续获得更新。
谷歌在2026年I/O活动中推出了基于安卓技术栈、内置Gemini的高端笔记本新品类Googlebooks。针对现有Chromebook用户,谷歌确认支持政策不变:2021年及之后发布的设备将获得10年自动更新,部分更早机型也符合条件。此外,官方确认部分现有Chromebook硬件“有资格过渡到新体验”,可能获得类似Googlebooks的功能。谷歌未明确未来是否发布新款Chromebook。产品定位上,Chromebook主打教育及日常市场,而Googlebooks则对标MacBook等高端设备。
谷歌在2026年The Android Show上正式推出Googlebooks高端安卓笔记本新品类,由宏碁、华硕、戴尔、惠普和联想首发,计划今年秋季上市。产品定位高端,采用优质材质和发光灯带设计。其软件基于安卓技术栈,深度整合Gemini AI,核心功能包括Magic Pointer智能光标交互、Create My Widget自然语言生成小组件,以及Cast My Apps和Quick Access跨设备协同。此举可能标志着谷歌笔记本战略正从ChromeOS转向以安卓和Gemini为核心的新阶段。
本文探讨了如何从无状态聊天机器人升级为生产级AI智能体,以管理长达数天或数周的企业工作流程(如HR入职)。通过引入Agent Development Kit(ADK),其架构核心采用持久状态机和持久化会话存储,确保智能体在“空闲时间”或服务器重启时永不丢失上下文。系统利用事件驱动的Webhook和多智能体委托机制,实现在暂停期间“休眠”,并在唤醒后以高推理准确性恢复复杂任务,从而构建出具备韧性和可靠性的长时运行智能体系统。
谷歌正与宏碁、华硕、戴尔、惠普和联想等多家OEM厂商合作,计划将Chromebook品牌升级为“Googlebook”。新产品将深度整合Gemini等AI服务,其中“魔术光标”功能可读取屏幕内容并利用Gemini理解上下文以提供信息说明。系统还支持Android手机跨平台协同操作。官方渲染图显示设备可能配备被称为“Glowbar”的RGB发光灯带。更多细节或将在近期活动中公布。
Co-Scientist 是一款由 Gemini 构建的协作式 AI 助手,旨在帮助科研人员加速科学突破。它通过多智能体(multi-agent)的架构设计,作为研究人员的智能伙伴参与工作流程,以提升研究效率并推动创新发现。
美国商务部官网已移除与谷歌、xAI和微软达成的AI模型安全测试协议细节。原公告链接失效,显示“抱歉,未找到该页面”,并重定向至人工智能标准与创新中心。此前,商务部于5月5日宣布这些企业需在新AI模型推出前提交政府检测,以排查网络攻击、军事滥用等潜在威胁。美国政府担忧如Anthropic的Mythos等强大AI系统的国家安全风险,但删除原因尚不清楚。
科技媒体发现,谷歌正测试将Pixel Screenshots应用从手机拓展至桌面设备。该应用目前仅支持Pixel 9和10系列,利用端侧AI自动整理截图内容,构建可搜索的资料库。代码中出现了桌面版版本号及2026年的更新时间,表明开发已在进行中。预计其将登陆传闻中的谷歌桌面系统Aluminum OS,但目前仅完成底层适配,完整界面与交互尚未就绪。
谷歌威胁情报团队首次确认一起由AI参与开发的零日漏洞利用事件。攻击针对一款开源Web管理工具,旨在绕过双因素认证,其利用代码中发现了大量教学性注释和“幻觉”生成的CVSS评分,风格符合AI生成特征。谷歌指出,此类高层语义与业务逻辑漏洞正是AI擅长发现的类型。这表明攻击者正更多借助AI来寻找和武器化漏洞,大幅降低了攻击的技术与时间门槛,导致面向互联网的管理后台安全风险加剧。
谷歌披露,犯罪黑客利用人工智能技术发现并利用了一个重大的软件漏洞。该漏洞存在于广泛使用的开源软件中,可能导致大规模数据泄露或系统入侵。谷歌威胁分析小组追踪到此次攻击,并确认黑客借助AI工具显著提升了漏洞挖掘的效率与精准度。目前漏洞细节尚未公开,但相关软件维护方已发布安全更新。这一事件凸显了AI技术被恶意用于网络攻击的现实风险,对全球网络安全防御体系提出了新的挑战。
谷歌母公司Alphabet计划首次发行规模达数千亿日元的日元债券,为人工智能基础设施融资,发行条款预计本月敲定。此举标志着科技巨头正转向债券市场,以支持耗资巨大的AI布局。行业预计,今年全球科技企业在AI基础设施上的投入将超过7000亿美元。此外,亚马逊也正筹备首次发行瑞士法郎债券。近期,Alphabet已通过发行欧元和加元债券募资近170亿美元,并将其年度资本支出预期上调至1800亿至1900亿美元区间。
三星在美国为Bespoke AI Family Hub冰箱系列推送重大更新,核心是接入谷歌Gemini模型。此举显著提升了AI视觉食材识别能力,可识别更多生鲜及包装食品。升级后的Bixby助手能理解复杂语音指令,如自动制冰或根据室外温度调节设置。新增即时简报功能可提供个性化资讯与菜谱推荐。冰箱还能通过声纹识别区分用户,提供纪念日提醒、健康报告等专属服务。配备32英寸屏的机型已可更新,9英寸机型将于年内推送。
Google Chrome 浏览器集成的 Gemini Nano 等最新 AI 功能,可能会在用户本地设备上占用高达 4GB 的存储空间。这些功能通过部署本地 AI 模型来提升浏览体验,但其模型文件是导致大量存储消耗的主要原因,可能影响存储空间有限设备的性能。此情况已引发科技社区的关注,在 Hacker News 等平台引发了广泛讨论。建议用户留意存储使用情况,并根据自身设备条件和需求,谨慎权衡是否启用这些 AI 特性。
谷歌在 Chrome 148 版本中,移除了此前版本关于设备端 AI 模型“无需将您的数据发送到谷歌服务器”的表述。此举引发了对数据处理方式是否改变的质疑。谷歌发言人澄清,此次仅为措辞修改,数据处理方式实际未变,相关数据仍在设备本地处理。公司解释称,修改是为了避免潜在混淆,因为在某些使用场景下,网站可能通过 Prompt API 看到模型的输入与输出,而这将由各网站自身的隐私政策管辖。