GrepSeek是一种优化的直接语料库交互搜索智能体。它将大型文本语料库视为环境,通过执行可执行的shell命令来查找和组合证据,以解决传统检索系统的局限性。为应对在大语料库上直接应用强化学习导致的不稳定问题,研究提出了两阶段训练流程:首先使用答案感知的“导师”和答案盲目的“规划器”构建冷启动数据集;然后通过组相对策略优化进行训练,使智能体能在与语料库的直接交互中改进搜索行为。此外,引入的语义保持分片并行执行引擎在确保结果字节一致的前提下,显著提升了检索速度。实验表明,GrepSeek在多个开放域问答基准测试中表现优异。
智能搜索通过迭代推理和外部搜索使大语言模型解决复杂问题,但模型常因缺乏自我认知而导致过度搜索,引发延迟与成本。SAAS是一种强化学习框架,旨在培养动态自我感知以精准调控搜索行为。其核心包括搜索边界建模机制、边界感知奖励模块以及分阶段优化策略,通过序贯课程设计优先优化推理而非搜索正则化。实验证明,SAAS能在保持准确率的同时显著减少不必要的搜索行为。
Meta 推出SilverTorch推荐系统架构,统一了用户生成内容的所有检索组件。该架构吞吐量比现有技术高23.7倍,计算成本效率比CPU方案高20.9倍,同时提升了准确性。
Google I/O宣布AI生成答案现已成为搜索的核心内容,但大多数品牌几乎无法了解AI如何向客户描述他们。这改变了以往依赖10个蓝色链接的SEO策略规则。
谷歌声称用户喜爱其AI搜索模式后,搜索引擎DuckDuckGo的访问量在随后一周内增长了28%。
为解决大语言模型并行测试时缩放(TTS)中各分支信息隔离导致的重复探索问题,研究提出了协作并行思考(CPT)框架。该框架无需训练,可在推理时跨并行分支共享中间发现:它从各分支提取紧凑信息,维护一个去重的查询级信息池,并通过输入上下文广播信息,使后续分支能复用已有发现。在 HMMT 和 AIME 基准上的实验表明,CPT 在不同预算和模型规模下,均比强基线方法建立了更好的准确率-延迟帕累托前沿,验证了搜索时协作是实现高效并行 TTS 的有效方向。
AlphaTransit 是一个用于城市公交网络设计的搜索规划框架,旨在解决线路设计中因延迟反馈导致的路径交互欺骗性问题。该框架结合了蒙特卡洛树搜索(MCTS)与神经策略-价值网络:网络负责提出线路延伸方案并评估设计质量,搜索过程则利用这些预测进行决策,从而在构建线路时实现前瞻性。在 Bloomington TRNDP 基准测试中,AlphaTransit 在混合和全需求设置下分别达到了 54.6% 和 82.1% 的服务率。与不使用搜索的强化学习相比,服务率分别提升 9.9% 和 11.4%;与没有学习引导的 MCTS 相比,分别提升 2.5% 和 11.2%。该研究的代码与数据已开源。
Google 在 I/O 2026 大会上用 AI 智能体彻底重构了其搜索服务,取消了传统的蓝色链接。此举引发强烈用户反弹,数据显示 DuckDuckGo 应用下载量因此暴涨了 30%,反映出用户正积极寻求替代方案。
Google 与 Alphabet CEO Sundar Pichai 在 Google I/O 后受访,回顾了公司为应对 ChatGPT 而进行的战略重组与高管调整。访谈聚焦于新的 Gemini 模型及其在产品中的整合,包括全新的智能搜索框与 Gemini Spark 智能体平台,旨在让搜索从提供结果转向启动任务。Pichai 讨论了这些变化对开放网络的持续冲击,回应了主持人此前提出的“Google Zero”概念(即来自 Google 的网站流量可能归零),并提及 Google 正利用 YouTube 视频训练模型以改变视频搜索与索引方式。最后,他对 Google DeepMind CEO Demis Hassabis 关于“处于智能奇点起步阶段”的言论表示认同,并分享了对 AGI 时间线的看法。
同一事件,精选展示《Gemini 3.5:具备行动能力的前沿智能》当谷歌搜索引擎功能发生转变后,TechCrunch 文章推荐了可供用户尝试的替代性搜索引擎选项。
NVIDIA推出了改进的线性注意力模型Gated DeltaNet-2。其核心创新在于将Delta规则中控制记忆擦除与写入的单一门控机制,解耦为两个独立的通道级门控。该模型参数规模为1.3B,在100B个FineWeb-Edu令牌数据上训练。实验表明,它在语言建模、常识推理和长上下文检索等任务中全面超越了Mamba-2、Gated DeltaNet、KDA及Mamba-3等现有模型,尤其在RULER S-NIAH和多关键针检索任务中取得了最显著的性能提升。
SMART是一个框架,旨在解锁标准单向量嵌入模型的潜在多向量能力。它通过在推理时对标准对比训练后冻结的隐藏状态应用直接后期交互,实现即插即用的性能提升。研究表明,SMART能提升包括最先进模型在内的多模态检索性能,在MMEB-V2上进一步改善了效果。简单的轻量级后训练不仅节省时间和算力,还能在视觉文档检索任务上使单向量模型超越当前最强大的多向量模型。该项目代码和权重已在GitHub开源。
Google CEO Sundar Pichai 近期将链接和来源重新描述为搜索的“一部分”,而非其赖以生存的基础。这一措辞的转变具有策略性,反映出 Google 通过新功能将用户留在其生态系统内的趋势。Google 正从互联网流量分发者转变为 AI 内容发布者,而其内容源的选择正日益成为一种编辑权力问题。
近期发布了开源数据库Models.dev,专门收录人工智能模型的各项规格、定价及功能信息。该项目在GitHub公开,便于开发者查询和比较不同AI模型。其在Hacker News社区获得101点关注度,显示出技术社区对这类集中化、透明化的模型信息资源的较大兴趣。
谷歌在2026年I/O开发者大会上推出的AI Overview(AI概览)功能近日出现逻辑故障。用户在搜索“disregard”等特定词汇时,系统错误地将其识别为执行指令,导致AI概览区域显示空白并遮挡正常搜索结果。测试发现,“ignore”、“stop”、“remember”等多个具有指令含义的词汇均存在同类问题,移动端同样受到影响。
论文建立了针对遥感组合图像检索(RSCIR)的统一基准评测框架。研究在PatternCom数据集上,系统评估了六种视觉语言骨干网络支持的代表性组合图像检索方法。同时,引入了一个名为xView2-CIR、以灾害和损毁监测为中心的新数据集。结果表明,无需训练的组合方法可作为遥感图像检索强健且可扩展的基线;而以变化为中心的检索任务,因需保持场景身份不变,带来了与基于属性检索不同的挑战。
Google搜索在近期推出AI功能更新后出现了一个新问题:当用户尝试搜索“disregard”一词时,搜索界面会完全失效无法正常使用。这个技术故障表明AI集成可能对原有搜索引擎的稳定性产生了未预期的干扰,具体原因和修复时间尚未公布。
谷歌AI搜索近期出现显著故障,当用户搜索“disregard”一词时,AI概览功能并未返回常规的AI生成摘要,而是弹出类似传统聊天机器人的无关回复,例如“Got it! Let me know if you need help with anything else.”,完全忽略了用户的实际搜索需求。该现象在社交平台被曝光后,进一步引发了公众对AI搜索功能可靠性的担忧。
为了解决现有时尚图像检索方法难以支持多样化查询与意图的问题,研究提出了统一框架FashionLens。首先构建了综合性基准数据集U-FIRE,整合并增强了现有数据以支持跨场景评估与泛化测试。在此基础上,基于多模态大语言模型,提出了两大核心模块:一是通过自适应球面插值将查询动态映射到任务对齐空间的查询校准器;二是根据学习难度与数据规模自动调整任务权重的自适应采样策略。实验表明,该方法在U-FIRE上取得了最先进性能,并能稳健泛化至未见任务。相关代码与数据已开源。
国家互联网应急中心近日发布风险提示,指出黑产团伙通过批量搭建高仿真钓鱼网站大规模传播银狐木马。监测数据显示,2月至5月间出现439个钓鱼域名,主要仿冒WPS和Chrome等办公与浏览器软件,二者占比合计达77.4%。攻击手法显著升级,黑产疑似借助AI工具高效生成钓鱼页面,并结合SEO投递、域名批量注册(高峰期一分钟注册15个域名)等技术,形成从网络钓鱼、木马下载到远控主机的完整攻击链,对网络安全构成严重威胁。
针对现有模型搜索系统结果同质化的问题,本文提出 StructuredSemanticSearch 框架。该框架将语义基线与结构化表发现相结合,通过表格发现算子检索相关模型卡片表格,并控制预算以公平比较文本与表格检索效果。创新性地采用方向感知的表格集成技术,生成紧凑的集成视图。评估采用基于“要点”的可审计协议,在597个查询上的实验表明,该结构化感知方法相比纯语义基线,能显著提升证据覆盖率和结果多样性,为动态模型库的评估提供了可扩展的路径。
QUEST是一个参数规模从2B到35B的开源模型家族,旨在作为通用深度研究智能体,处理广泛的长期搜索任务,在事实查询、引用定位和报告合成方面能力突出。其训练方案结合了中期训练、监督微调与强化学习,核心是基于统一评分树的合成数据流水线,能为多样任务类型自动生成带可验证奖励的训练数据,无需人工标注。模型还内置上下文管理机制以支持长期推理。仅用8K个合成任务,QUEST在八个深度研究基准上接近或超越前沿闭源智能体,并在近期开源智能体中综合性能最佳。项目已开源所有模型、数据与训练脚本。
Google即将全面引入AI概览功能,这将显著改变其搜索结果呈现方式。这一变化可能引发部分用户不满,尤其针对过度依赖AI生成的摘要式回答。与此同时,多家搜索引擎如DuckDuckGo、Brave Search等凭借隐私保护、去广告化或传统列表式结果等差异化特性,正吸引寻求替代方案的用户。市场动态显示,搜索引擎竞争正从技术功能向用户体验维度拓展。
谷歌在其Lighthouse网站分析工具中新增了名为“代理浏览”的实验类别,用于评估网站处理AI代理的能力。该新功能会检查网站是否提供了llms.txt文件,这是一个旨在供大型语言模型使用的元数据标准文件,旨在帮助AI更高效地理解和访问网站内容。此举标志着搜索引擎开始正式评估和适配AI代理,可能对未来网站的搜索优化方向产生影响。
文章来自百度智能云,探讨2026年AI技术对普通人能力与职业边界的影响。文中未提及具体模型、版本或benchmark数据,仅从宏观视角讨论AI重构带来的机遇与挑战。
谷歌宣布其AI模式的搜索结果中将包含广告。这意味着用户在使用AI驱动的搜索功能时,可能会看到付费推广内容。此举是谷歌搜索广告业务的最新扩展,将广告整合进由人工智能生成的直接回答或交互界面中,标志着搜索引擎商业化模式的进一步演进。
谷歌正为AI搜索重塑广告形态。用户在谷歌搜索商品时,旗下Gemini人工智能模型将推送相关产品并生成专属选购解读,说明推荐理由。谷歌还推出内置聊天机器人的广告,用户可与Gemini对话咨询商品信息。在人工智能搜索模式中,谷歌测试多种新广告形式,例如依据用户具体问题推送对应赞助商品,或在好物推荐列表中醒目植入赞助内容。这些广告旨在自然融入对话场景,打通从提问到下单的链路,并帮助用户发现更多新品牌。
谷歌近期采取了一系列举措,被外界形容为“向网络宣战”。该公司正大力推行基于AI的搜索结果呈现方式,导致传统网页链接的流量大幅下降,引发了出版商和网站所有者的强烈不满。此举被指责破坏了互联网原有的开放生态与流量分配机制,可能从根本上改变用户获取信息的方式以及网站的生存模式。
谷歌在2026年I/O开发者大会上宣布,其搜索功能的AI进化将显著加速。公司计划引入一种“代理式AI”技术,从根本上重构搜索体验。这意味着搜索引擎将从被动回答问题转向能够主动理解意图、规划并执行复杂任务的智能代理。此举标志着谷歌搜索战略的重大转向,旨在应对AI驱动的新一轮技术竞争。
Google正将AI技术深度整合到其搜索广告业务中。当用户搜索产品时,Gemini AI模型会自动推荐相关商品,并生成定制化说明,解释为何应购买该产品。这一更新紧随Google推出支持长对话式查询的新搜索框之后,后者也强调AI生成结果。例如,搜索“紧凑型咖啡胶囊机”的用户可能看到带“赞助产品”标签的商品,旁附AI生成的详细描述。这标志着搜索广告从静态展示转向AI驱动的、更具互动性和解释性的新形态,部分广告还将内置聊天机器人功能。
AI搜索领域已悄然成为消费级AI中最具吸引力的赛道之一。多家AI搜索初创公司近期获得显著增长与资本关注,行业竞争态势加速。这类应用通过对话式交互与实时信息整合,正在重塑传统搜索体验,并可能改变用户获取信息的核心方式。
该研究提出了一种基于大语言模型的通用文本优化系统,将优化问题统一表述为通过评分函数改进文本产物。在六项任务中达到最优结果:智能体架构使Gemini Flash在ARC-AGI上的准确率从32.5%提升至89.5%;调度算法降低40%云成本;87%的CUDA内核匹配或超越PyTorch表现;圆包装问题超越AlphaEvolve。实验表明,可操作的附加信息比仅使用分数反馈收敛更快、得分更高;多任务搜索通过跨任务迁移学习,在同等预算下优于独立优化,且任务数量越多收益越大。该工作首次证明基于LLM的文本优化是通用问题解决范式,能统一传统领域特定算法。系统已开源,支持多种后端。
交通安分析依赖整合事故记录、道路属性等地理空间数据,但许多机构和社区利益相关者因技术门槛难以使用。该论文提出了一个基于数据模式的自然语言接口,利用大语言模型(LLM)解释用户查询意图,同时通过结构化语义帧、规则验证层等设计,将查询转化为确定性的空间操作图并在PostGIS数据库上执行,确保了结果的可重复性与可审查性。该框架在马萨诸塞州全州数据库上进行评估,所有查询均成功执行,且验证层修正了29%的查询错误。
SciAtlas 是一个大规模、多学科、异构的学术资源知识图谱,旨在为自动化科学研究提供“认知地图”。它整合了26个学科的超过4300万篇论文,包含1.57亿实体和30亿三元组,构建了可打破学科壁垒的结构化拓扑认知底座。为克服现有检索工具缺乏拓扑推理能力的问题,其开发了具备三路协同召回和图重排序功能的神经符号检索算法,实现从语义匹配到确定性关联发现的过渡。应用方向包括文献综述、研究趋势综合、想法定位与学术轨迹探索,旨在以结构化方式赋能科研全流程并显著降低推理成本。相关接口已在GitHub开源。
Google 推出 AI 驱动的信息代理,这些代理能够在后台自动监控指定主题,并主动向用户推送更新和变化通知。此功能旨在帮助用户突破传统搜索的限制,提供更智能、实时的信息追踪体验,实现从被动搜索到主动获取的转变。