7月3日

01:08

Apple Machine Learning Research（RSS）

苹果机器学习研究团队提出摊销MIPS方法，训练神经网络直接预测最大内积搜索（MIPS）的解。核心思路是将MIPS值函数建模为键集的凸支撑函数，其梯度指向最优键。据此设计两种互补模型：SupportNet（输入凸神经网络拟合支撑函数，用作聚类路由）和KeyNet（向量值网络直接回归最优键，可替换原始查询输入索引流水线）。在BEIR基准文档嵌入实验中，两种模型在FLOPs、探测次数或时钟时间等计算开销指标下均显著提升IVF匹配率。代码已开源。

搜索论文/研究

7月1日

22:20

Cloudflare Blog

精选58

Cloudflare 推出全新AI流量管理选项：区分搜索、智能体与训练爬虫，保护广告页面

Cloudflare 为所有网站所有者提供更精细的AI流量管控选项，取代一刀切的屏蔽方式。用户可轻松区分并管理搜索爬虫、AI智能体爬虫和训练爬虫，同时新增保护广告变现页面的能力。

智能体产品更新搜索

关联讨论 1 条

推荐理由：Cloudflare 把 AI 流量管理拆成了搜索、Agent 和训练三类，对依赖广告收入的站长是个实用功能，早期控制 bot 访问可能影响 SEO，值得测试。

22:20

Cloudflare Blog

Cloudflare 推出两项新举措，让 AI 搜索更智能

Cloudflare 宣布推出两项新举措，以应对 AI 搜索重构网络生态带来的创作困境。在智能体时代，创作者既需要保持可发现性，又要确保作品获得合理报酬，这两项举措旨在帮助平衡二者的关系。具体细节尚未公布。

智能体产品更新搜索

22:20

Cloudflare Blog

内容独立日一周年：构建智能体互联网的商业模型

内容独立日宣布一年后，一个付费内容的动态市场已正式形成。自主AI智能体的兴起正在颠覆传统搜索推荐模式，构建可持续的网络经济需要一套全新基础设施来支撑。

智能体搜索现象/趋势

6月23日

22:24

Mistral AI：News（网页）

精选68

Mistral OCR 4

Mistral AI 发布 OCR 4，新增边界框、块分类（标题、表格、方程式、签名等）及逐页逐词置信度分数。支持 170 种语言、10 个语系，可单容器全自托管部署。在 OlmOCRBench 上得分 85.20，独立标注者偏好率平均 72%。定价每 1000 页 $4，Batch API 享 50% 折扣。可通过 API 或 Mistral Studio 的 Document AI 调用。

多模态搜索模型发布

关联讨论 2 条

推荐理由：Mistral OCR 4 把 bounding box 和置信度输出做进了产品，自托管部署和多语言能力很务实，做文档 RAG 和智能体的团队可以认真看看。

16:06

OpenAI：官网动态（RSS · 排除企业/客户案例）

Omio 携手 OpenAI 打造对话式旅行未来

多式联运旅行平台 Omio 与 OpenAI 合作，在 ChatGPT 上构建了最早一批对话式旅行体验，连接超 3,000 家交通提供商、覆盖 47 国。用户可通过自然语言查询实时票价和路线，获取可预订的行程。内部方面，Omio 为全员部署 ChatGPT 并将 Codex 嵌入研发全流程，产品开发工作量降至原来的约 20%，项目周期从多人一季缩短至一人一月。Omio 的目标是成为 AI 原生公司，由员工对结果负责，AI 加速执行但决策权在人。

OpenAI 搜索行业动态

6月19日

03:26

xAI：News（网页）

精选61

xAI 发布 Grok for Word 插件

xAI 将 Grok 引入 Microsoft Word，推出免费 365 插件。用户可将笔记转为结构化文档、重写文本以提升清晰度与简洁性，也能通过插件搜索网页、X 平台或生成图表。插件支持连接 SharePoint 和 Google Drive 等外部来源，还可用于 PowerPoint 和 Excel。

xAI 产品更新搜索

关联讨论 3 条

推荐理由：Grok 正式进入 Office 生态，在 Word 里能直接整理笔记、搜索网页和生成图表，对日常办公用户是个顺手工具，但和微软 Copilot 的边界很模糊。

6月18日

12:00

公众号：龙猫LongCat（美团）

美团搜推ASX团队六篇论文被ACL/ICML/KDD 2026收录

美团业务研发平台/搜推ASX团队六篇论文被ACL/ICML/KDD 2026接收。CBS将样本选择建模为上下文多臂老虎机，提升数学推理性能效率；ResRL通过负样本投影残差强化学习，数学超NSR 9.4%、代码刷新CodeForces SOTA、ALFWorld超PPO 7.8%；CDRRM仅用3千样本让未微调模型超越全量微调基线；LocalSearchBench覆盖国内9城6品类超134万商户与900道多跳问答，最优DeepSeek-V3.2正确率仅35.60%；DiningBench含3021道菜品多视角图像，29个VLM模型细粒度识别与营养推理不足；Mem²Evolve双记忆自进化框架在6类任务8个基准上优于单一进化策略。

智能体搜索行业动态

6月14日

00:17

OpenRouter：Announcements（RSS）

同事件精选73

OpenRouter融合预算模型面板超越GPT-5.5和Claude Opus 4.8

通过OpenRouter融合的一组预算模型，在100个复杂研究任务上得分超过GPT-5.5和Claude Opus 4.8。

Anthropic DeepSeek OpenAI 产品更新

同一事件，精选展示《OpenRouter融合预算模型性能超越GPT-5.5与Claude Opus 4.7》

推荐理由：OpenRouter 的 Fusion API 用多个模型合成输出，基准测试里预算模型组合能接近前沿，这个思路对有质量要求又在意成本的开发者挺实用。

6月13日

01:48

Google Research：Blog（网页）

Google Research研究：AI如何帮助用户理解皮肤问题

Google Research 在《JAMA Dermatology》发表两项研究，探索 AI 帮助普通人理解自身皮肤问题。一项涉及 2345 名参与者的定量研究显示，AI 辅助显著提升了用户识别皮肤疾病名称的能力，并影响了其就医或自我护理的下一步决策。另一项混合方法研究对比了用户通过 AI 工具与医生对话获取的认知。这些工作基于此前开发的 AI 鉴别诊断模型和 SCIN 数据集，旨在通过高质量信息支持皮肤健康决策。

Google 搜索论文/研究

6月9日

06:24

Claude：Blog（网页）

精选63

Claude 支持 Apple Foundation Models 框架，推出新 Swift 包

Anthropic 通过一个新 Swift 包，让 Apple 开发者能在 Foundation Models 框架中直接调用 Claude。开发者用 Apple 框架以原生 Swift 方式，仅需三行代码即可通过引导生成返回类型化 Swift 值。当请求涉及多步推理、代码生成、联网搜索或数据分析时，Claude 可接手处理，并将流式响应传回同一视图。该支持可在 iOS 27、iPadOS 27、macOS 27、visionOS 27 和 watchOS 27 上使用，开发者需添加包并配置 Anthropic API 密钥。

Anthropic 产品更新搜索编码

关联讨论 1 条

推荐理由：Apple开发者福音，现在能用Swift原生调用Claude了。端侧模型处理简单任务，复杂推理交给Claude，这才是苹果AI的正确打开方式。

6月5日

18:52

公众号：百度智能云（文心）

百度伐谋走进北工大实验室：从制氢安全到空间站监测，加速科研探索

百度伐谋进入北京工业大学苗扬团队实验室，辅助解决PEM电解槽制氢故障诊断、空间站空气监测和液体表面波可视化等难题。在制氢安全中，模型准确率从92.26%提升至95.04%，探索周期从“周级”缩短至“小时级”；在空间站色谱柱优化中，72小时内生成方案，体积缩小40%、分离效率提升3倍、误差降低8.17%；海外运维场景预计节省70%–80%维修等待时间。伐谋不替科研人员“写答案”，而是围绕目标、变量和评价标准进行大规模搜索试错。

推理搜索行业动态

6月3日

21:34

Google Blog：AI（RSS）

Google Search 提升二手和复古购物体验的5种方式

Google Search 和 Google Shopping 中的 AI 工具帮助用户在二手和复古购物中发现好物。

Google 多模态搜索教程/实践

5月30日

02:00

OpenRouter：Announcements（RSS）

精选77

OpenRouter融合预算模型性能超越GPT-5.5与Claude Opus 4.7

一组预算模型通过OpenRouter平台进行模型融合，在包含100个复杂研究任务的评估中，得分超过了GPT-5.5与Claude Opus 4.7。

智能体产品更新推理搜索

推荐理由：OpenRouter 的 Fusion 功能把模型融合做成了 API 调用，实测用便宜模型组合就能逼近 Fable 5 的性能，成本却只有一半，这对做复杂推理和深度研究的开发者来说是个很实用的新工具。

5月29日

15:43

公众号：腾讯元宝

元宝助手正式入驻QQ浏览器，底层模型升级至Hy3 preview

元宝助手正式入驻QQ浏览器，搜索栏、划词等AI入口全面升级为元宝助手，底层模型同步升级至Hy3 preview。新功能包括搜索栏唤起提问、跨标签读取多个网页与文件、拍照搜题分步解析、长网页一键转音频，以及写作、改文章、出图等。元宝助手已同步嵌入微信、腾讯会议、QQ音乐等腾讯系应用，Mac版本已更新，其他版本逐步放量。

产品更新多模态搜索

5月28日

20:47

Mistral AI：News（网页）

精选77

发布 Search Toolkit

Mistral AI 发布了 Search Toolkit 的公共预览版。这是一个用于构建 AI 应用生产级搜索管道的可组合框架。该框架旨在解决团队在搭建搜索基础设施时，因数据摄取、检索和评估工具分散而耗费过多工程时间的问题。Search Toolkit 将这三者整合到单一框架与共享接口中，使团队能更专注于提升搜索质量。该工具开源，可部署在云端、本地或边缘环境，并支持企业搜索、RAG 等多种检索场景。

MCP/工具检索增强产品更新搜索

推荐理由：做 RAG 的团队都该看一眼，它把 ingestion、retrieval、evaluation 揉进一个开源框架，省下的大把集成时间够你调几次检索策略了。

04:19

Meta Engineering Blog（RSS）

精选69

SilverTorch：索引即模型--推荐系统的新检索范式

Meta 推出SilverTorch推荐系统架构，统一了用户生成内容的所有检索组件。该架构吞吐量比现有技术高23.7倍，计算成本效率比CPU方案高20.9倍，同时提升了准确性。

Meta 搜索论文/研究

推荐理由：SilverTorch 把索引本身变成模型，在推荐检索上拿到 23 倍吞吐提升，这个思路对搜索和推荐工程师都有启发，虽然离普通人有点远。

5月21日

21:57

公众号：百度智能云（文心）

AI重构的2026年，普通人的边界在哪里？

文章来自百度智能云，探讨2026年AI技术对普通人能力与职业边界的影响。文中未提及具体模型、版本或benchmark数据，仅从宏观视角讨论AI重构带来的机遇与挑战。

搜索现象/趋势

5月20日

02:18

Google Blog：AI（RSS）

精选70

AI搜索的新时代

谷歌宣布了其搜索引擎与AI技术融合的最新进展，标志着AI搜索进入新阶段。此次更新旨在将搜索引擎的广度与AI的深度理解能力相结合，目标是提供更智能、更直观的搜索体验，推动搜索技术的下一代演进。

Google 产品更新搜索

推荐理由：Google搜索宣称开启AI新纪元，但这次官宣只放了张图没给干货，搜索入口的任何变动都牵动流量，值得跟踪但别急着判断。

02:18

Google Blog：AI（RSS）

精选71

AI Mode 如何改变美国人的搜索方式

AI Mode 上线一周年，美国用户搜索行为呈现关键转变。数据显示，用户正从传统的关键词输入模式逐渐转向自然语言查询，这一变化反映了AI搜索技术的普及和用户交互方式的优化。自然语言查询的使用率显著提升，体现了AI搜索在日常信息获取中的影响力增强，预示着未来搜索体验的革新方向。

Google 搜索现象/趋势

推荐理由：AI Mode 上线一周年，Google 第一次拿出用户行为数据，从关键词到自然语言的转向比想象中快，做搜索和 SEO 的可以重新理解用户意图了。

5月19日

23:01

Hugging Face：Blog（RSS）

精选60

引入 Ettin Reranker 系列

Hugging Face 发布六个 Ettin Reranker 重排序模型（17m、32m、68m、150m、400m、1b），基于 Ettin ModernBERT 编码器，蒸馏 self-mxbai-rerank-large-v2 分数训练，在 MTEB(eng, v2) Retrieval 达各自规模 SOTA。模型以 Sentence Transformers CrossEncoder 接口提供，三行代码可调用。同时发布 train-sentence-transformers Agent Skill（v5.5.0），允许 AI 编码智能体在用户数据上微调模型。训练配方、数据集和脚本已全部开源。

Hugging Face 检索增强开源/仓库搜索

推荐理由：从17M到1B的全尺寸reranker家族，每个量级都是SOTA，而且训练数据和代码全开放，做搜索和RAG的开发者可以无痛替换旧模型。

5月18日

18:00

公众号：小红书技术（dots.llm）

小红书引擎架构团队ICDE 2026新成果：CCD感知编排突破多核CPU向量搜索性能天花板

小红书引擎架构团队在ICDE 2026提出一种面向多核CPU的CCD级负载感知和线程编排向量检索框架，通过感知CCD（Core Complex Die）层级负载并优化线程编排，突破多核CPU向量搜索的性能天花板。

搜索论文/研究部署/工程

5月17日

21:50

Google DeepMind：Blog（RSS）

精选55

Gemini for Science：面向科学的AI实验与工具，开启发现新时代

Google 推出 Gemini for Science 项目，发布一系列基于 Gemini 模型的科学工具与实验性应用。该项目旨在扩展科学探索的规模与精度，通过人工智能辅助研究人员处理复杂计算、模拟实验系统并加速数据分析流程。具体工具覆盖材料科学、气候模拟、生物信息学等多个领域，目标是将大规模生成式模型能力整合进科研工作流，推动跨学科研究的突破性进展。

智能体 DeepMind Google 产品更新

关联讨论 3 条

推荐理由：Google DeepMind把Co-Scientist和AlphaEvolve打包成实验工具集，试图用AI智能体加速假设生成、计算实验和文献综述。虽然还只是原型，但这是科学AI走向产品化的信号，科研人员可以试试。

5月15日

03:45

Hugging Face：Blog（RSS）

精选60

IBM 发布 Granite Embedding Multilingual R2 开源多语言嵌入模型

IBM 发布两个 Apache 2.0 开源多语言嵌入模型：97M 参数的紧凑型（granite-embedding-97m-multilingual-r2）在 MTEB Multilingual Retrieval 上得 60.3 分，超越所有开放子 1 亿参数模型；311M 全尺寸模型（granite-embedding-311m-multilingual-r2）得 65.2 分，在 500M 以下开放模型中排第二，并支持 Matryoshka 维度。两者均基于 ModernBERT 架构，支持 200+ 种语言，针对 52 种语言和 9 种编程代码检索训练，上下文窗口达 32,768 tokens。可直接替换 sentence-transformers、LangChain、LlamaIndex 等框架中的默认模型，预置 ONNX 和 OpenVINO 权重以优化 CPU 推理。

检索增强开源生态搜索模型发布

推荐理由：97M小模型在跨语言检索上打败很多300M级选手，32K上下文让长文档处理不再鸡肋，Apache 2.0开源意味着做多语言RAG的可以直接拿来当默认嵌入模型了。

5月7日

20:00

OpenRouter：Announcements（RSS）

同事件精选56

OpenRouter 为每个模型提供一致网络搜索与抓取功能

OpenRouter 向所有支持工具调用的模型开放自主网络搜索与页面内容抓取能力，并允许用户从多个搜索引擎和抓取引擎中自行选择。

智能体 MCP/工具产品更新搜索

同一事件，精选展示《OpenRouter 通过 API 引入网页搜索功能》

推荐理由：OpenRouter把网络搜索和抓取做成统一的工具接口，任何工具调用模型都能用，做agent的开发者不用再自己拼搜索层了。

20:00

OpenRouter：Announcements（RSS）

同事件精选55

OpenRouter 为所有工具调用模型提供统一的网页搜索与抓取功能

OpenRouter 推出新功能，允许任何工具调用模型自主进行网页搜索并抓取页面内容，支持多种搜索引擎和抓取引擎供选择。

MCP/工具产品更新搜索

同一事件，精选展示《OpenRouter 通过 API 引入网页搜索功能》

推荐理由：OpenRouter 给所有工具调用模型配上了统一的网络搜索和抓取能力，开发者不用再为每个模型单独对接搜索 API，适配成本直线下降。

4月30日