7月3日

01:08

Apple Machine Learning Research（RSS）

苹果机器学习研究团队提出摊销MIPS方法，训练神经网络直接预测最大内积搜索（MIPS）的解。核心思路是将MIPS值函数建模为键集的凸支撑函数，其梯度指向最优键。据此设计两种互补模型：SupportNet（输入凸神经网络拟合支撑函数，用作聚类路由）和KeyNet（向量值网络直接回归最优键，可替换原始查询输入索引流水线）。在BEIR基准文档嵌入实验中，两种模型在FLOPs、探测次数或时钟时间等计算开销指标下均显著提升IVF匹配率。代码已开源。

搜索论文/研究

7月2日

15:04

IT之家（RSS）

微软通报假冒 Perplexity 第三方 Chrome 扩展，可劫持和监控用户搜索流量

微软安全研究团队于 6 月 30 日通报，名为 Search for perplexity ai 的 Chrome 扩展冒用 Perplexity AI 品牌，监控用户搜索记录。该扩展已从 Chrome Web Store 移除，已安装用户需手动卸载。合法域名为 perplexity.ai，假冒扩展将搜索流量跳转到 perplexity-ai.online。其申请 chrome_settings_overrides 权限设为默认搜索引擎，并申请 declarativeNetRequest 权限将请求转发至攻击者服务器。用户可进入 chrome://extensions/ 核对扩展 ID flkebkiofojicogddingbdmcmkpbplcd 并删除。

安全/对齐搜索

09:28

HuggingFace Daily Papers（社区热门论文）

VideoSearch-R1：通过软查询优化实现迭代视频检索与推理

现有视频检索方法常将检索视为预处理步骤，失败后无法优化查询，且智能体框架多假设已提供相关视频。VideoSearch-R1提出一种智能体框架，通过与视频搜索引擎多轮交互实现迭代检索与推理。其核心是软查询优化（SQR），在连续潜在空间中优化搜索查询token，而非在离散文本空间重写。SQR及推理过程使用组相对策略优化（GRPO）训练，由检索和下游任务的任务级奖励信号引导。该方法在三个视频语料库时刻检索（VCMR）数据集上达到最先进性能，且生成的token远少于显式文本级查询优化。

多模态搜索论文/研究

09:03

IT之家（RSS）

微软 Teams 将于 2026 年 8 月推出 AI 会议助手 Facilitator

微软计划 2026 年 8 月为 Teams 推出 Facilitator 会议协调助手。该 AI 功能在会议中实时分析对话，识别提问、未解答问题或不确定表达，并在会议聊天中给出相关答案。默认禁用且不直接发言，管理员可控制显示范围，用户可自行启用。触发频率通常低于每场 1 次。仅支持标准 Teams 会议，不支持通话、网络研讨会或 Town Hall。系统会实时处理对话，必要时执行网络搜索。功能将于 8 月上旬向 Targeted Release 用户推送，8 月下旬全面上线。

Microsoft 产品更新搜索

02:02

TechCrunch：AI（RSS）

同事件精选72

Cloudflare新政策：默认屏蔽混合爬虫，推动AI公司付费

Cloudflare宣布，自2026年9月15日起，其默认设置将屏蔽同时用于搜索、AI智能体及训练的“混合用途”爬虫访问托管广告的页面，除非站点所有者手动调整。此举旨在保护出版商内容不被无偿使用。同时将原有的“Pay Per Crawl”模式升级为“Pay Per Use”，允许出版商在内容创造价值时向AI公司收费，初期合作方为Ceramic.ai和You.com。Cloudflare数据显示，AI爬虫超过50%的抓取流量浪费在重复获取未变更页面上。新政策适用于新客户、现有客户的新站点及所有现有免费客户。

搜索数据/训练行业动态

同一事件，精选展示《Cloudflare 推出全新AI流量管理选项：区分搜索、智能体与训练爬虫，保护广告页面》

推荐理由：Cloudflare用基础设施商的话语权重新划定了AI内容付费线，默认屏蔽混合爬虫这一刀切下去，从Google到创业公司都躲不开，出版商到底该分多少钱的讨论终于有了一个落地的支点。

7月1日

23:21

AYi@AYi_AInotes

Lev8：营销领域的 Codex，一人顶一个商务团队

Lev8 被定位为营销领域的 Codex，专门解决找客户、写破冰信等脏活。Benchmark 显示：海外找客户场景有效结果量 Lev8 90 个（Exa 58.2，Codex 20），匹配精度 83.3%（Exa 76.5%，Codex 71.8%），单条成本 $0.052（Exa $0.061）。产品聚合 50+ 实时数据源（LinkedIn、X、YouTube 等），覆盖 10 亿+ 职场人脉，自动监控融资、招聘、网站改版等信号，生成定制破冰话术，通过邮件、LinkedIn、WhatsApp、Instagram、X 五个渠道批量发送并统一管理回复。适用于独立开发者、一人公司、猎头、中介等需要精准找人的场景。

AYi: 真的有点兴奋,终于等来营销圈的 Codex 了,不管你是独立开发还是OPC一人公司,找客户扒联系方式写破冰信这些破事,直接给你干得明明白白! 甚至你用来做副业搞钱都是一个超级神器! 我们都知道,AI现在已经把写代码的门槛拉平了,Codex能...

智能体搜索教程/实践

22:20

Cloudflare Blog

精选58

Cloudflare 推出全新AI流量管理选项：区分搜索、智能体与训练爬虫，保护广告页面

Cloudflare 为所有网站所有者提供更精细的AI流量管控选项，取代一刀切的屏蔽方式。用户可轻松区分并管理搜索爬虫、AI智能体爬虫和训练爬虫，同时新增保护广告变现页面的能力。

智能体产品更新搜索

推荐理由：Cloudflare 把 AI 流量管理拆成了搜索、Agent 和训练三类，对依赖广告收入的站长是个实用功能，早期控制 bot 访问可能影响 SEO，值得测试。

22:20

Cloudflare Blog

Cloudflare 推出两项新举措，让 AI 搜索更智能

Cloudflare 宣布推出两项新举措，以应对 AI 搜索重构网络生态带来的创作困境。在智能体时代，创作者既需要保持可发现性，又要确保作品获得合理报酬，这两项举措旨在帮助平衡二者的关系。具体细节尚未公布。

智能体产品更新搜索

22:20

Cloudflare Blog

内容独立日一周年：构建智能体互联网的商业模型

内容独立日宣布一年后，一个付费内容的动态市场已正式形成。自主AI智能体的兴起正在颠覆传统搜索推荐模式，构建可持续的网络经济需要一套全新基础设施来支撑。

智能体搜索现象/趋势

20:20

AYi@AYi_AInotes

Lev8：营销领域的Codex，找客户全流程自动化

Lev8聚合50+实时数据源（LinkedIn、X、YouTube、Instagram、GitHub），覆盖10亿+职场人脉，实时追踪融资、招聘、改版等信号，自动生成定制破冰开场白，并通过邮件、LinkedIn、WhatsApp、Instagram、X五渠道一键发送统一回复。在找海外客户场景中：有效结果量Lev8 90个，Exa 58.2个，Codex仅20个；匹配精度83.3% vs 76.5% vs 71.8%；单条匹配成本$0.052 vs $0.061。三项指标全面超越。

智能体产品更新搜索

05:20

AYi@AYi_AInotes

Claude 官方宣布推出 Claude Science，一款为科研全阶段设计的新应用。支持代码溯源、按需环境管理，并可连接 60+ 科学数据库，现已开放 beta 测试。有评论称此消息可能冲击众多科研 AI 初创公司。

Claude: Introducing Claude Science, a new app designed with every stage of research in mind. Artifacts traced to their code, env...

Anthropic 产品更新搜索

02:58

Perplexity@perplexity_ai

Claude Sonnet 5 现在可以在 Perplexity 上供 Pro 和 Max 订阅用户使用。你还可以在 Computer 中选择它作为编排模型。

Anthropic 产品更新搜索

6月30日

23:28

TechCrunch：AI（RSS）

X推出托管MCP服务器，简化AI工具接入平台

X本周一推出托管MCP服务器，允许Claude、Cursor、Grok Build等MCP兼容AI助手通过用户自己的账户权限直接连接X API。MCP是开放标准，用于AI模型连接外部工具。此前开发者需自建托管MCP服务器，现在由X托管，简化集成。该服务器不新增API能力，仅使已有功能更易被AI调用。X借此定位为实时数据检索网络。X还更新了API v2以应对AI生成垃圾内容，并提高发帖价格至$0.015、发链接至$0.20。

MCP/工具产品更新搜索

19:02

IT之家（RSS）

谷歌前工程负责人用Claude Code开发维基百科搜索引擎Zettair，未手动写一行代码

谷歌前工程负责人休·威廉姆斯借助Anthropic的编程助手Claude Code，开发出可正常运行的搜索引擎Zettair，为150万个维基百科条目建立索引。该引擎支持搜索自动补全、关键词摘要片段、相关搜索推荐、热门话题榜单以及AI生成的内容摘要。威廉姆斯未手动编写一行代码，但底层检索框架源自其21世纪初参与研发的信息检索系统。他认为，Claude Code只有在深厚专业技术功底的配合下才能发挥最佳效果，经验丰富的工程师永远是最出色的“指导者”。

Anthropic 大佬观点搜索编码

15:19

AYi@AYi_AInotes

X 官方推出托管 MCP，支持 Grok、Cursor、Claude 等工具零部署调用 X API

X 官方推出托管 MCP，使 Grok、Cursor、Claude 等 MCP 兼容 AI 工具无需部署即可直接调用 X API，获取搜索、时间线、书签、发文等实时数据，全程走用户权限。该服务并非免费，采用 X Developer App 按量计费模式，读帖和发帖各有单价，重度 Agent 使用容易导致账单失控；写操作限流比读操作更严格，易触发 429 错误。建议开发者先在后台设定消费上限，从小流量测试后再放量。

Developers: Announcing the hosted X MCP. Agents now have access to the best real-time information source in the world. Connect Grok,...

MCP/工具产品更新搜索

02:58

Rohan Paul@rohanpaul_ai

CLODO AI推出自然语言人物搜索，覆盖12亿档案

AI人物搜索工具CLODO上线，支持用自然语言描述目标人物，在12亿（1.2B）索引档案中实时搜索、匹配、丰富联系人信息并生成触达方式。与输出静态CSV的传统搜索不同，CLODO检索实时网络信号，判断匹配度并解释推荐原因。该工具已获得Mercor、US News、Corgi以及美国情报界等机构的信任，并获得Y Combinator、CRV等投资。

Sid Rajaram: Introducing CLODO, trusted by @mercor_ai, @usnews, @UseCorgi, the U.S. Intelligence Community, and more. Describe exactl...

产品更新搜索

02:35

elvis@omarsar0

DAIR.AI 的 Elvis Saravia 称赞 CLODO 是真正有效的人搜索工具：不同于传统工具提供固化列表，CLODO 搜索实时网络、读取信号并解释为何找到此人。CLODO 由 @sixtensor 推出，用户描述目标即可每次准确找到，覆盖 12 亿个人资料，并提供资料丰富及主动联系服务。已被 Mercor、US News、UseCorgi、美国情报界等采用，获得 Y Combinator、CRV、Dalton Caldwell、Paul Thiel 等投资。

Sid Rajaram: Introducing CLODO, trusted by @mercor_ai, @usnews, @UseCorgi, the U.S. Intelligence Community, and more. Describe exactl...

搜索行业动态

02:17

Chubby♨️@kimmonismus

传统LinkedIn搜索只能匹配职位和公司，忽略自然语言中的关键信号。Clodo（CLODO）则能直接理解一段完整的描述，在13亿个实时网上个人资料中搜索，找到匹配对象，并返回验证过的邮箱及匹配证据链。该工具已获@mercor_ai、@usnews、@UseCorgi及美国情报界等机构使用，由Y Combinator、CRV等投资方支持。

Sid Rajaram: Introducing CLODO, trusted by @mercor_ai, @usnews, @UseCorgi, the U.S. Intelligence Community, and more. Describe exactl...

产品更新搜索

6月29日

17:17

Artificial Intelligence News（RSS）

自然语言处理正在改变专业社交网络

自然语言处理技术正重塑专业社交网络的沟通方式，提升个性化与关联性。核心功能包括消息意图检测、语气风格适配、长篇资料摘要及多语言支持。语义匹配取代关键词匹配，基于共同目标与项目推荐更精准的连接。但AI生成消息可能引发隐私担忧，模型幻觉和语言偏见威胁信任。未来方向包括设备端小型语言模型、隐私保护推理及更严格评估指标，以在透明安全前提下维护真实人际关系。

搜索现象/趋势

12:34

Hacker News 热门（buzzing.cc 中文翻译）

我们需要不涉及 AI 的科技新闻来源

Hacker News 用户发帖呼吁科技新闻平台应提供排除 AI 内容的筛选功能或替代来源，认为 Techmeme 等站点已被 AI 新闻淹没。评论中有人支持这一需求，认为应保留非 AI 科技讨论空间；也有人指出 AI 技术本身具有颠覆性价值，应区分商业炒作与真正的工具创新，并观察到 AI 帮助无编程经验者开发出实用应用。另有资深程序员表示期待接手清理“vibe code”的咨询业务。

搜索现象/趋势

04:27

Rohan Paul@rohanpaul_ai

新论文提出Web需为AI智能体制定新规则

一篇新论文指出，当前Web假设人类浏览页面、观看广告、点击链接，但AI智能体可收集并总结内容而不回访原站，损害出版商利益并导致网站封锁。作者提议将AI智能体视为人类代理，在Web请求中添加“agent metadata”，标明身份、所代表的人类、目的、限制和支付规则。网站通过新策略文件agents.txt决定允许、限速、收费、继承用户订阅、提供代理友好内容或屏蔽。内容还需附带provenance标签，让智能体识别来源是人类、AI还是两者。缺乏新机制将导致Web更难访问、出版商更难盈利、AI内容循环降低可靠性。

智能体 arXiv 搜索论文/研究

00:23

Berryxia.AI@berryxia

Berry Xia称赞@yaojingang（姚老师）将本可卖到上万元的GEO内容工程课程资料全部免费开源。资源包括：3份核心文档（操作手册、研究报告、实操教程）、2本推荐书籍、3篇学术论文；GEO改写提示词、改写Skill、单篇内容GEO特征标注演示；以及3个GitHub开源仓库（GEO Skills、GEOFlow、Meta skill）。所有资源通过链接直接获取，无需付费或陪跑课程。

姚金刚: 这是今晚直播的相关资料、资源及系统,分享给大家相关资料: 1、《GEO内容工程操作手册与评估标准》https://doc.laoyao.cn/9fl0bc 2、《GEO内容工程系统研究报告》https://doc.laoyao.cn/t7...

开源/仓库搜索教程/实践

6月28日

10:00

IT之家（RSS）

Naver 上线 AI 对话搜索服务 AI Tab，整合电商与本地生活功能挑战谷歌

Naver 于 6 月 26 日正式上线 AI 对话搜索服务“AI Tab”，定位为 AI 智能体搜索，旨在引导用户完成购买与预约。该服务整合 Naver 自家电商、地图、Cafe 社区、博客和本地生活服务，挑战谷歌 AI Mode。AI Tab 在回答深度和推理能力上不及 ChatGPT/Gemini，但在韩国本地餐厅推荐、商品发现及信息整理方面体验优于传统搜索。Naver 计划后续推出个性化房地产推荐和健康智能体服务。

智能体产品更新搜索

6月27日

22:40

向阳乔木@vista8

第二次GEO公开课：GEO内容工程直播资料汇总

本周六晚8点，姚老师在WaytoAGI进行第二次GEO公开课，主题为“GEO内容工程”。直播资料包括三份核心文档（操作手册、研究报告、实操教程）、两本推荐图书（《系统之美》《人人都该懂的工程学》）及三篇GEO相关论文。相关资源有GEO改写提示词、改写Skill及单篇内容GEO特征标注演示。开源项目包括GEO Skills、GEOFlow、Meta skill的GitHub仓库及课程PPT。

向阳乔木: 本周六(明天)晚上8点, 姚老师 @yaojingang 和我会在WaytoAGI给大家分享第二次GEO公开课。主题是:GEO内容工程链接:https://vc.feishu.cn/j/108720872 明天直播前5分钟进入就行。

开源/仓库搜索教程/实践

11:59

IT之家（RSS）

谷歌 Gemini 助手新功能：直接帮用户安装 Play 商店内的应用

谷歌今年 5 月宣布将 Play 商店集成至 Gemini 助手，现已逐步推送。用户可在 Gemini 聊天窗口中直接搜索、安装应用或进行内购，无需离开 Gemini。例如，询问“帮我找一款可以规划每周吃什么的 App”，Gemini 会搜索并跳转至 Play 商店详情页。该功能需年满 18 周岁，仅支持个人账号，且 Android 设备需安装 Play 商店。

智能体 Google 产品更新搜索

10:59

IT之家（RSS）

苹果 iOS 27 Beta 2 固件曝光：百度视觉搜索组件现身

iOS 27 Beta 2 固件代码显示新增 SearchPartnerInferenceProvider 组件，其本地化字符串明确提及“Baidu Visual Search”。该组件为第三方视觉搜索及 AI 服务商的基础设施，目前唯一指名的合作方为百度，未来可能按地区提供不同合作伙伴。本次更新还新增 SystemVoiceAssistant 应用，将 Polaris 音频框架独立为守护进程 polarisd，并新增 bluetoothaudiod 进程。固件包含超 4200 个 dylibs 更新、732 个 Mach-O 可执行文件更新及近 300 个 Kernel Extension 更新。

多模态搜索行业动态

6月26日

22:59

IT之家（RSS）

用户不买账，微软宣布放弃 Edge 浏览器的 AI 历史搜索功能

微软于2026年5月13日宣布取消Edge浏览器中独立的Copilot模式，同时放弃一年前随Edge 138版本分阶段推送的AI历史记录搜索功能。该功能用自然语言、同义词或带拼写错误的短语搜索浏览历史，由本地AI模型驱动，数据不上传云端，IT管理员可通过策略控制。用户因隐私担忧及认为功能冗余而不买账。微软转而将AI能力整合进Edge本身，包括Copilot跨标签页分析、手机端Journeys按主题归类历史，以及Copilot Voice和Copilot Vision等功能。

Microsoft 搜索行业动态

17:59

IT之家（RSS）

AI购物匹配精准度仅16%，上海消保委呼吁电商平台"算法向善"

上海市消保委发布2026年618网购体验报告，基于4308份有效问卷。AI辅助消费决策精准度仅16.06%，84.56%尝试过AI选购但负面反馈主导（38.79%认为不贴合低价需求，29.71%表示高低价混杂）。算法推荐方面，仅24.21%认为高度匹配，38.51%发现同款商品在不同账号优惠不同。超85%消费者期待AI一站式购物。消保委呼吁平台校准算法，强化需求导向。

智能体搜索政策/监管

02:14

AYi@AYi_AInotes

Apodex 免费内测 6 月 29 日结束，早鸟可延 2 周

AI 工具 Apodex 发布收费通知：免费内测将于 6 月 29 日结束，之后开始正式收费。所有在 6 月 28 日及以前注册的早期用户将额外获得 2 周免费试用。该工具此前被博主深度拆解推荐，适合需要深度研究场景的用户，建议趁免费期尽快体验。

AYi: http://x.com/i/article/2069024565901119488

产品更新搜索

6月25日

16:21

DogeDesigner@cb_doge

BREAKING： Grokipedia 刚刚突破约 5000 万次访问。 • 超过 42 万条反向链接 • 超过 1 万个引用域名越来越多人转向 @Grokipedia 继续在你的网站和博客上分享 Grokipedia 链接。这就是我们击败 Wokipedia 的方法。

xAI 搜索行业动态

13:58

IT之家（RSS）

谷歌 Chrome 149 升级 AI 交互，引入"Select from screen"功能

谷歌升级 Gemini 3.5 Flash 模型，原生引入“Computer Use”工具，并搭配 Chrome 149 浏览器增强 AI 交互。Chrome 新增“Select from screen”功能，用户可框选屏幕上的图片或文字，直接送入 Gemini 提示词，获得针对性 AI 交互，例如在鞋类网站选中多双运动鞋询问适合的跑步风格。该功能类似 Google Lens，但由对话式 AI 处理。Computer Use 工具使 AI 智能体能在网页、桌面、移动端执行访问网站、填写表单、点击按钮等复杂任务。

Google 产品更新多模态搜索

09:58

IT之家（RSS）

苹果 iOS 27 Beta 2 收紧 Siri AI：拒绝摘要 URL 链接内容

6 月 24 日，科技媒体报道苹果在 iOS 27 Beta 2 更新中收紧 Siri AI 规则，禁止其对用户提供的 URL 链接进行总结、阅读或提取信息。Siri AI 系统提示词新增指令，明确无法跳转访问网页，且不提供后续建议或变通方案。该调整可能关联苹果网页生态策略，防止 AI 直接抓取内容冲击网站流量。不过，在 iOS 27 版 Safari 浏览器中打开网页后，仍可通过 Apple Intelligence 摘要页面内容。

产品更新搜索

08:00

HuggingFace Daily Papers（社区热门论文）

Ko-WideSearch：韩语广度搜索基准

现有网页智能体基准主要测深度搜索，缺乏广度枚举能力评估。Ko-WideSearch 是韩语广度搜索基准，通过自动化合成-验证流程构建。任务要求从集合父实体（如电视剧季、王朝）中完整列举成员并填充属性表，采用 Item-F1、Column-F1、Row-F1 评分。基准含 228 张表格，覆盖 190 个实体、16 个类别，设三个难度层级，通过表宽和二维复合键控制成员覆盖率。对 20 个智能体的测试显示，智能体能恢复集合但无法填充行（Item-F1 92.8，Row-F1 53.7），难度提升准确率下降，增加搜索或花费无法缩小差距；难点在找到正确值而非格式化，自由文本单元格失败率最高。

智能体 arXiv 搜索论文/研究

03:44

Perplexity@perplexity_ai

精选65

推出 Computer for Counsel。 Computer 现在连接了律师日常使用的研究数据库、文档工具和案件管理系统。可从中提取可引用来源：@midpageAI、@LegalZoom、@Docusign、@netdocuments 等。所有 Pro 和 Max 订阅用户均可使用。

产品更新搜索

推荐理由：Perplexity 发布了面向法律行业的 Computer for Counsel，将研究数据库、文档工具和事务管理系统集成进 AI 搜索，律师可以一试。

6月24日

11:20

公众号：卡尔的AI沃茨

实测Codex Record & Replay：把RPA自动化工作流重做了一遍

Codex新功能Record & Replay可将浏览器操作录制成可复用的Skill。实测解决两个痛点：定向信息搜索时自动打开X搜热点、统计高赞帖子、提取关键词重新查询，输出带互动指标的表格和短关键词库，满足60%-70%图文素材需求；视频剪辑上传能完成静音检测、加速、导出GIF等固定流程，但上传可能被网站安全策略拦截，建议先让Codex出Plan判断可行性。Codex能理解意图，例如自动在输入Grok前增加中文关键词组合。目前依赖Computer Use和图片理解，操作慢且偶有误判，但已能将人的操作转化为Agent下次可执行的上下文，替代传统RPA和Replay。

智能体 OpenAI 搜索教程/实践

10:10

公众号：数字生命卡兹克

同事件精选63

微信上线AI智能体"小微"内测

微信近日内测AI智能体“小微”，常驻左上角，支持语音或文本输入，调用WeLM-V4-80B（MoE激活3B）与DeepSeek模型。可向个人/群聊发消息、发起视频通话、发红包或转账，需用户逐项确认；可查询朋友圈（限最近2天）、公众号、视频号，支持创建提醒、笔记、小工具，并能操作奶茶咖啡、打车、电影票等小程序至最后一步后交给用户。小微具备记忆功能，可记录地址等。聊天记录上下文仅在特定入口可用且限最近2天。整体策略“只读不动”，禁止批量发送、定时、删除联系人等操作。微信以谨慎节奏接入AI，是国民级应用全面拥抱AI的重要信号。

智能体搜索教程/实践

同一事件，精选展示《微信Agent小微灰度内测：主入口发消息红包，子入口可读聊天记录》

推荐理由：微信Agent内测体验一手展示，功能上打通通讯录、朋友圈和小程序，却处处需确认且只读不动，是微信在AI时代极其谨慎的第一步。不过一句话生成小工具的能力，已经为小程序生态打开了AI分发的新可能。

08:18

MarkTechPost（RSS）

同事件精选72

Mistral AI 发布 OCR 4 模型

Mistral AI 今日发布 OCR 4，支持 170 种语言，可单容器自托管部署。新版本除提取文本外，还返回边界框、块类型（标题/表格/方程等）和逐字置信度分数。独立标注者在 600+ 文档、12+ 语言的测试中平均胜率 72%。价格 $4/千页，批量 $2/千页，Document AI 模式 $5/千页。企业客户可自托管。Rogo 报告等效精度下成本低约 8 倍、延迟低 17 倍；Anaqua 测得每页快约 4 倍。OCR 4 同时作为 Mistral Search Toolkit（公开预览）的接入组件。

检索增强产品更新多模态搜索

同一事件，精选展示《Mistral OCR 4》

推荐理由：Mistral OCR 4 不只是提取文本，而是输出带定位框和置信度的结构，这对需要引用和溯源的企业搜索很有价值，不过按页计费对小团队是门槛。

08:00

HuggingFace Daily Papers（社区热门论文）

TheoremGraph：连接非形式化与形式化数学的统一语句级依赖图

TheoremGraph 是覆盖非形式化与形式化数学的语句级依赖图。非形式化侧从 arXiv 解析 1170 万定理环境，提取 1830 万条有向依赖；形式化侧 LeanGraph 从 25 个 Lean 项目提取 388,105 声明节点和 1130 万类型化边。通过嵌入自然语言 slogan 将两类图映射到同一语义空间，LLM judge 在余弦阈值 ≥0.8 时确认 47,952 个匹配，阈值 ≥0.9 时接受率升至 87%。形式化概念检索中，name-and-signature 加图扩展的 Recall@10 达 0.775，接近 LeanSearch v2 的 0.780（无需 LM 重排序）。相关数据集、提取器、HTTP API 及 MCP 接口已开源。

搜索数据/训练论文/研究

6月23日

22:24

Mistral AI：News（网页）

精选68

Mistral OCR 4

Mistral AI 发布 OCR 4，新增边界框、块分类（标题、表格、方程式、签名等）及逐页逐词置信度分数。支持 170 种语言、10 个语系，可单容器全自托管部署。在 OlmOCRBench 上得分 85.20，独立标注者偏好率平均 72%。定价每 1000 页 $4，Batch API 享 50% 折扣。可通过 API 或 Mistral Studio 的 Document AI 调用。

多模态搜索模型发布

关联讨论 1 条

推荐理由：Mistral OCR 4 把 bounding box 和置信度输出做进了产品，自托管部署和多语言能力很务实，做文档 RAG 和智能体的团队可以认真看看。

18:07

IT之家（RSS）

微信上线高考 AI 志愿助手，可在搜一搜直接语音提问

微信搜一搜今日上线“AI 志愿助手”，为考生和家长提供志愿填报参考。用户输入分数、大学名称或志愿相关问题，系统结合合作方“掌上高考”的全国高校多年录取分数、位次、计划等结构化数据，给出冲、稳、保三个梯度的建议。支持继续追问以优化推荐，还可直接语音提问并多轮对话。

产品更新搜索