谷歌在 Canary 频道最新 Chrome 浏览器中引入实验性 Flag,启用后工具栏可嵌入 AI Mode 快捷方式。AI Mode 是谷歌搜索结果页的 AI 对话交互,支持自然语言提问、多轮对话及文件上传分析。用户启用“Contextual Tasks Pin Button In Toolbar”Flag 后,点击按钮将在当前页面右侧弹出侧边栏,可针对浏览内容提问并上传文件。谷歌正测试“Browse with AI”和“Google Search AI Mode”两个暂用名。
谷歌在 Canary 频道最新 Chrome 浏览器中引入实验性 Flag,启用后工具栏可嵌入 AI Mode 快捷方式。AI Mode 是谷歌搜索结果页的 AI 对话交互,支持自然语言提问、多轮对话及文件上传分析。用户启用“Contextual Tasks Pin Button In Toolbar”Flag 后,点击按钮将在当前页面右侧弹出侧边栏,可针对浏览内容提问并上传文件。谷歌正测试“Browse with AI”和“Google Search AI Mode”两个暂用名。
皮尤研究中心最新民调显示,49%的美国人至少偶尔使用聊天机器人,但63%认为该技术发展太快。自2024年以来,AI聊天机器人使用率从33%增至49%,其中ChatGPT使用量自2023年翻倍,44%受访者使用过。仅16%认为AI对社会有积极影响。年轻群体使用率更高且更悲观:18-29岁中66%使用,48%认为有负面影响。30-49岁使用频率最高,34%每天使用一次以上。约四成美国人用AI处理工作,30%认为提升了生产力,28%认为帮助更了解信息。皮尤2024年研究中,66%担忧AI传播不准确信息。
Meta在Facebook应用中推出AI Mode搜索,利用公开帖子回答复杂查询。实测显示基础推荐尚可,但存在严重幻觉:推荐奥斯汀的咖啡店给明尼阿波利斯行程,并错误引用社区泳池周末闭馆(实际周末开放)。AI曾就“1月6日国会骚乱者是否为爱国者”给出可疑答复。作为规划工具,AI Mode能发现用户未注意的活动,但地理错误和引用不实让结果大打折扣。
本周三,Pinterest 发布实验性应用 Ask Pinterest,通过对话式界面实现个性化购物推荐。该应用基于其 Taste Graph 数据映射用户兴趣与审美,支持多步查询(如规划晚宴),并能利用用户保存的 Pin 和 Board 进行个性化回答。初期仅限有限访问。同时,Pinterest 还推出了面向美国广告商的 AI 助手(Ads Manager 内测版)、全球上线的 Performance+ 创意模型,以及 Pinterest MCP,让广告商通过标准化第三方智能体工具管理广告活动。
Mozilla发布路线图,核心是推动2026年最大视觉功能重塑Project Nova落地。最新Firefox 152稳定版新增安卓标签页分组功能(iOS年内推出),重新设计设置界面,并加入“已拦截追踪器”小部件。未来规划包括自定义键盘快捷键、PDF拆分合并编辑、Multi-Account Containers原生集成、免费内置VPN(移动端)、AI驱动的Quick Answers语音问答、Smart Window隐私AI浏览体验,以及省电模式。
iPadOS 27 为妙控键盘添加自动化触发条件,连接或移开键盘可自动执行分屏、关闭应用等操作。快捷指令支持自然语言描述,系统自动生成流程并展示底层步骤。Safari 可根据网页主题自动整理标签页。系统整体提升窗口切换、文件传输等桌面化体验。Siri AI 搜索在索引完成后,用户可用自然语言跨应用查找文件、信息、邮件等内容,并给出带来源的上下文结果。
柏林法院近日裁定,Google的AI Overviews仅是一种“新的搜索结果格式”,用于汇总第三方内容,而非搜索引擎自身的原创陈述。法院认为普通用户能清楚识别AI是整合其他来源信息,Google对回答内容没有“决定性影响”。该判决源于一家香水公司因商标问题提起的诉讼——AI摘要中出现了其受保护品牌名及平价仿品链接。此前慕尼黑法院在另一起虚假事实案中得出相反结论,认定AI摘要为独立内容,Google须为算法错误负责。两起案件涉及不同法律基础(商标与竞争法 vs. 虚假陈述),上诉结果可能重塑AI搜索的责任边界。
WordPress VIP基于2000名受访者的调查显示,60%美国消费者认为品牌消息中出现“AI”会令人反感,86%不完全信任AI并仍想查看原始来源。42%表示缺乏明确归属的AI生成答案比航空公司费用、隐私政策和医疗账单更不可信。近四分之三受访者认为互联网比十年前更不人性化。33%将点击查看原始来源视为首要信任信号,80%认为网络信息应保持开放可访问。企业方面,60%受访企业称来自AI搜索引擎和答案平台的流量在过去一年增加,74%企业决策者将AI可发现性和归属列为主要或重要优先级。
Perplexity CEO 斯里尼瓦斯分享创业经验:从英伟达 CEO 黄仁勋学到保持危机感——英伟达市值 5 万亿美元、两年内营收预计 5000 亿美元,但黄仁勋经营公司像 30 天后就会倒闭;从马斯克学到工作不能仅由金钱驱动——SpaceX 薪酬围绕火星殖民地目标设计。他不认同卖掉公司退休,认为创始人应永远工作。Perplexity 正寻求新一轮融资,投后估值 200 亿美元,投资方包括软银、英伟达和贝索斯。
东京 AI 公司 Sakana AI 发布首个商业产品 Sakana Marlin,定位为虚拟首席战略官(Virtual CSO)的 B2B 自主研究智能体。输入主题后,Marlin 自主运行最多约8小时,输出数十至100页详细报告(含正文、参考文献和附录)及 AI 生成的幻灯片。核心算法是自适应分支蒙特卡洛树搜索(AB-MCTS),可动态选择“扩宽”或“加深”。产品经2026年4月封闭测试(约300名专业人士)优化,已与三菱 UFJ 金融集团合作,获花旗集团战略投资。定价按次付费(每次100积分,每积分98日元)及 Pro(月费15万日元,含2000积分)、Team(月费40万日元,含6000积分)套餐,AB-MCTS 已以 Apache 2.0 许可证开源。
Meta 今日起在 Facebook 推送新的 AI Mode 搜索功能,与“用户”“Marketplace”等常规模式并列。搜索结果并非“仅链接”,而是基于 Meta 旗下各平台公开帖子生成 AI 回复,用户还可追问。同步上线的还有照片预设(可将运动衫换到粉丝身上)和拼贴模板建议等 AI 功能。
Meta 宣布在 Facebook 推出“AI Mode”搜索功能,利用 Meta AI 从公开帖子(含群组和 Reels)提取信息并合成答案,用户可用自然语言提问获得摘要。同时新增视频拼贴剪辑、过渡效果及 AI 照片预设(可更换服装、发型和配饰),体育迷可在 Stories 中点击“AI Edit”虚拟穿上队服。这些更新延续了此前动态头像、Marketplace 自动回复和创作者 AI 助手的部署节奏。此外,Meta 近期启动了 Facebook、Instagram 和 WhatsApp 的全球订阅计划(每月 3.99 美元起),更多 AI 订阅层级正在规划中。
谷歌在AI模式中正式推出搜索智能体功能,首批上线信息智能体,可全天候自动监测博客、新闻、社交媒体及实时数据库,覆盖金融行情、商品库存、体育赛事等。用户只需输入“持续为我关注”等句式并补充条件即可设置。相比此前Gemini应用的定时任务(每日或每15分钟一次),新智能体实现即时推送。该功能目前仅面向谷歌AI Ultra订阅用户开放,月费99.99美元或199.99美元,计划今年夏季晚些时候下放至AI Pro订阅档位。
通过OpenRouter融合的一组预算模型,在100个复杂研究任务上得分超过GPT-5.5和Claude Opus 4.8。
同一事件,精选展示《OpenRouter融合预算模型性能超越GPT-5.5与Claude Opus 4.7》Visual-Seeker 是一种视觉原生多模态深度搜索智能体,通过主动视觉推理而非将视觉视为静态输入,动态收集细粒度视觉证据以完成多跳跨模态搜索。研究人员设计了主动视觉推理数据流水线,合成了 5K 高质量多模态轨迹用于模型训练。在五个具有挑战性的多模态搜索基准上,Visual-Seeker 达到最先进性能,甚至超越部分闭源模型。代码和数据集已开源。
研究团队推出XBCP基准测试,用于评估深度研究AI智能体在证据语言与用户查询不一致时的表现。XBCP保留BrowseComp-Plus的英文问答空间,将支持文档改为跨语言(单语言证据)和多语言(12种语言均匀分布)两种设置。评估四种AI智能体使用稀疏和密集多语言检索器。结果显示,证据翻译后准确率、证据召回率和引用可靠性显著下降,且即使直接提供所有黄金证据,准确率仍然较低。这表明跨语言深度研究不仅存在检索失败,智能体在整合语言不匹配的证据时还有独立困难。
Google Research 在《JAMA Dermatology》发表两项研究,探索 AI 帮助普通人理解自身皮肤问题。一项涉及 2345 名参与者的定量研究显示,AI 辅助显著提升了用户识别皮肤疾病名称的能力,并影响了其就医或自我护理的下一步决策。另一项混合方法研究对比了用户通过 AI 工具与医生对话获取的认知。这些工作基于此前开发的 AI 鉴别诊断模型和 SCIN 数据集,旨在通过高质量信息支持皮肤健康决策。
微软搜索部门负责人 Jordi Ribas 于 6 月 6 日在 X 平台宣布,推出浏览器扩展 Microsoft Bing AI Search Choice,已上架谷歌 Chrome 和微软 Edge 应用商店。用户安装启用后,可在 Bing 搜索结果中一键移除 Copilot 生成的 AI 回答。微软表示该功能为预览版,目的是让用户掌控搜索体验,并非所有用户都希望在所有场景默认使用 AI。
Dr-DCI 将检索作为智能体可调用的动作来扩展本地工作空间,动态拉取相关文档到演化中的工作空间内执行直接语料交互(DCI)操作。在 Browsecomp-Plus 上达到 71.2% 准确率,优于原始 DCI 最多 8.3 个百分点,并降低工具使用次数与成本。工作空间保留式上下文重置后准确率提升至 73.3%。在 10 万到 1000 万文档的语料扩展实验中保持有效,而原始 DCI 变得不稳定。在 2000 万级 Wiki-18 QA 设置下平均得分为 63.0,超越基于检索和搜索智能体的基线。消融分析表明,排序预览和文档间 DCI 是性能关键。
DoorDash 推出名为 Ask DoorDash 的 AI 聊天机器人,用户可以用自己的话搜索应用,或通过提示词和照片直接下单,无需逐页浏览餐厅和商店来构建购物车。
德国法院在一起针对 Google 的诉讼中作出裁决,认为用户不需要用 AI 来搜索互联网。该判决导致 Google AI Overview 败诉,并可能对 AI 搜索行业造成严重打击。
Google更新搜索交互数据保存方式,新增“Search Services History”设置,用于保存用户搜索时使用的图片、文件、音频和视频,包括Google Lens搜索的图片、实时搜索工具Search Live的录音、语音搜索和Translate中的语音片段。这些数据将被用于“提供、改进和开发AI模型”。用户可关闭该设置并禁用“Save Media”选项以避免保存。
德国慕尼黑地方法院裁定谷歌须为AI搜索概览内容承担直接责任,对其发出临时禁令。法院认定AI概览是谷歌自身生成的内容,而非传统搜索结果列表,谷歌是直接侵权人。AI概览将原告与诈骗、订阅陷阱等不良商业行为错误关联,甚至提出了任何链接源中均未提及的指控。裁决指出,AI用自己的语言重写并评判结果,谷歌对算法及产品供应拥有控制权。
Google 为 NotebookLM 推出重大升级。该研究工具现基于 Gemini 3.5 Flash 运行,拥有自己的云计算机用于代码执行,并能通过 Google Search 自主查找来源。内部测试中,新系统在 78.2% 的情况下击败了上一版本。
德国法院裁定谷歌需为其AI Overviews(AI概览)功能生成的错误答案承担法律责任。该裁定认定,AI概览中出现的虚假信息视为谷歌自身发布的内容,公司无法通过声称“AI自动生成”来推卸责任。这一判决对AI生成内容的责任界定产生重要影响。
同一事件,精选展示《突发:Google 因模型幻觉被判负有法律责任》FORT-Searcher 提出抗捷径训练数据合成框架 FORT,识别证据共覆盖、单线索选择性、暴露常数和先验知识绑定四种捷径风险,在实体选择、证据图构建、问题生成和对抗性精炼环节控制。实验表明,FORT 生成的数据比现有开源深度搜索数据集诱导更长的搜索路径和更少的捷径模式。仅用监督微调(SFT)训练的 FORT-Searcher 在多个深度搜索基准上达到同类开源搜索智能体的最佳整体性能。资源即将开放。
该研究质疑在基于代理的搜索(agentic search)中“grep 是否足够”这一假设,并分析代理框架(agent harnesses)如何重新定义智能体搜索的交互方式与能力边界,推动搜索范式从简单工具调用向结构化代理行为演进。
德国地方法院裁定,Google 对其 AI 概览生成的内容直接承担法律责任,不能援引搜索引擎运营商原有的有限责任保护。涉案 AI 概览错误地将两家出版商与欺诈行为关联,且相关声明未出现在任何链接来源中。该裁决可能为全球 AI 生成内容责任认定树立先例。
同一事件,精选展示《突发:Google 因模型幻觉被判负有法律责任》哈佛大学与 Perplexity 联合发表论文,采用匹配对会话方法对比自主 AI 智能体与搜索助手。结果显示,AI 智能体每会话可自主工作 26 分钟,而搜索助手仅能完成 33 秒的自主工作。智能体在自主性、时间效率与成本方面均实现大幅提升,并且尝试的工作范围更为广泛。
Flash-GMM 是一个基于 Triton 的融合内核,可在单次 GPU pass 中高效计算大规模高斯混合模型(GMM)。它无需在 GPU 内存中实例化完整责任矩阵,相比现有实现实现 20 倍加速,并支持在单设备上训练比之前大 100 倍以上的数据集。将 Flash-GMM 集成到 IVF 粗量化器中用于近似最近邻搜索(ANN)后,软 GMM 聚类可替代 k-means,利用 GMM 责任矩阵将边界向量分配到多个簇。该方法达到固定召回目标时所需距离计算减少 1.7 倍,或在同等计算成本下召回@10 提升 2–12。该内核已作为开源项目发布。
Anthropic 通过一个新 Swift 包,让 Apple 开发者能在 Foundation Models 框架中直接调用 Claude。开发者用 Apple 框架以原生 Swift 方式,仅需三行代码即可通过引导生成返回类型化 Swift 值。当请求涉及多步推理、代码生成、联网搜索或数据分析时,Claude 可接手处理,并将流式响应传回同一视图。该支持可在 iOS 27、iPadOS 27、macOS 27、visionOS 27 和 watchOS 27 上使用,开发者需添加包并配置 Anthropic API 密钥。
关联讨论 1 条X:Claude Devs (@ClaudeDevs)在 WWDC26 上,苹果宣布 macOS 27 将全新 Siri AI 整合进“聚焦”功能。用户按住 Control 键点选图像、文件和文本即可向 Siri 提问,还能随意拖放窗口调整界面大小。Siri 能够调用 Mac 本地文件回答问题,支持同时选中多个文件并通过关键菜单发起提问。
苹果在 2026 年全球开发者大会(WWDC)上宣布升级 iOS 27 版 Home 应用,利用 AI 精简智能家居配件的通知,减少对用户的干扰。Home 应用可识别已连接摄像头的视频片段并生成描述,还能将不同摄像头的相关视频拼接在一起,用户可通过自然语言搜索视频片段。
Google 为 AI 笔记应用 NotebookLM 推送全方位更新,底层模型升级为 Gemini 3.5,可提供更准确可靠的信息。新功能允许用户直接通过提问开始研究项目,无需事先导入笔记或 YouTube 视频;NotebookLM 将借助 Google Search 自动查找相关来源,基于其“discover”功能实现。
Google Research 在 Gemini Enterprise Agent Platform 中推出一个 Agentic RAG 框架。该框架中的 Sufficient Context Agent 会持续重新搜索,直到多跳、多源查询拥有足够的 grounding 来生成回答。相比标准 RAG,该框架将事实准确性最高提升 34%。
Perplexity 的 "Search as Code" 架构放弃固定搜索 API,改为让 AI 模型在 Python 沙箱中自主编写搜索例程,自行完成过滤和去重。该方案在关键基准测试中超越 OpenAI 和 Anthropic 的模型,并将 token 成本削减高达 85%。
UIUC与Chroma联合推出Harness-1,一个20B参数的检索子智能体。它通过强化学习在一个有状态搜索框架中训练,该框架维护候选池、重要性标注集、证据图和验证记录,由策略决定搜索、筛选、验证及停止的时机。Harness-1在8个基准测试上达到0.730平均curated recall,比下一个最佳开源子智能体高出11.4个百分点,仅落后于Opus-4.6。模型权重和框架代码均已公开。
科技媒体Android Authority 6月5日报道,谷歌否认将AI Mode设为Chrome默认搜索方式的说法。此前Chrome Canary频道新增"Fulfill Searchbox Queries in AI Mode"实验选项,启用后地址栏查询直接进入AI Mode,引发媒体猜测。谷歌搜索工程副总裁Rajan Patel回应称该发布属错误,目前无相关计划。媒体认为"错误"更指向该功能不应在本次Canary版本中出现,而非内部未测试。
苹果在 2026 年全球开发者大会(WWDC)开幕前夕汇总 iPadOS 27 新功能,聚焦 AI 体验升级。Safari 新增 Organize Tabs 功能,自动按主题整理标签页。Spotlight 搜索深度整合 Siri,支持提问、找文件、启动应用、查询天气等,并接入新 AI 搜索系统。快捷指令支持自然语言创建。系统级语法检查覆盖全系统,以半透明菜单展示原文和修改建议,可单独或批量接受修改。
Chrome Canary 中出现隐藏 flag“Fulfill Searchbox Queries in AI Mode”,启用后地址栏搜索直接进入 AI Mode,界面类似聊天机器人,跳过传统搜索结果页。该功能完成度已接近可发布状态,但谷歌尚未公开宣布。用户可通过 chrome://flags 开启,支持 Mac、Windows、Linux 和 ChromeOS,短期内不会上线。