AIHOT
内容
精选全部 AI 动态AI 日报主题收藏
接入
Agent 接入
更多
关于更新日志反馈
内部员工登录
精选全部日报更多
内部员工登录
全部动态
全部一手资讯X论文
标签「搜索」清除
5月20日周三
02:55IT之家(RSS)73谷歌搜索迎 25 年来最大改版,AI 重塑搜索体验与交互方式
02:55IT之家(RSS)63谷歌发布 Ask YouTube,搜索视频支持完整句子与连续追问
02:18Google Blog:AI(RSS)70精选AI搜索的新时代
02:18Google Blog:AI(RSS)71精选AI Mode 如何改变美国人的搜索方式
02:11VentureBeat:AI(RSS)69Google 25年来首次重塑搜索框:AI驱动对话时代来临
02:06🚨 AI News | TestingCatalog65Google I/O宣布Generative UI全面开放,搜索体验重塑
00:32凡人小北67AI技能与工具助力独立站SEO优化
5月19日周二
23:31OpenRouter68精选OpenRouter工具调用模型现可自主进行网络搜索
23:01Hugging Face:Blog(RSS)60精选引入 Ettin Reranker 系列
08:00HuggingFace Daily Papers(社区热门论文)54ClinSeekAgent:实现多模态证据主动检索的临床推理代理框架
5月18日周一
18:00公众号:小红书技术(dots.llm)49小红书引擎架构团队ICDE 2026新成果:CCD感知编排突破多核CPU向量搜索性能天花板
07:44IT之家(RSS)59前微软高管痛批公司 AI 战略失误:重蹈互联网、移动设备时代覆辙,投资与回报严重失衡
07:33Hacker News 热门(buzzing.cc 中文翻译)67Show HN: Semble--一款面向代理的代码搜索工具,其使用的令牌数量比 grep 少 98%
01:42SemiAnalysis55公司测试多种AI工具,Perplexity AI的Slack集成表现突出
5月17日周日
21:50Google DeepMind:Blog(RSS)55精选Gemini for Science:面向科学的AI实验与工具,开启发现新时代
21:10Rohan Paul63智能体设计中,精确搜索(grep)是否优于向量检索?
19:40Rohan Paul62超越语义相似性:通过直接语料交互重新思考代理搜索的检索
07:54Berryxia.AI55Hermes Agent集成X Premium与搜索功能
05:13🚨 AI News | TestingCatalog64X Premium+用户现可在Hermes中使用Grok
04:21xAI65精选Hermes Agent 现支持 X Premium 订阅与帖子搜索
5月16日周六
19:00Ars Technica:AI(RSS)65美国押注AI在预测市场中抓内幕交易
16:25The Decoder:AI News(RSS)54Google 宣称 GEO 与 AEO 是迷思,传统 SEO 仍是应对 AI 搜索的全部所需
15:42IT之家(RSS)55谷歌更新垃圾内容政策,将"AI 投毒"行为纳入打击范围
02:54The Decoder:AI News(RSS)60Google 打破"AI搜索需要专属SEO策略"的迷思
02:32Chubby♨️70AI助手Sai化身虚拟同事,自主完成深度研究
01:37Rohan Paul70X平台开源最新"For You"信息流推荐算法
00:42AYi72马斯克开源了最新的X 算法(2026.5.15)
5月15日周五
22:39DogeDesigner46算法目标:零粉丝用户优质内容也能广泛传播
17:42IT之家(RSS)38腾讯地图上线外卖"骑手模式":智能推荐少红灯高效路线、提前查看终点实景图 / 门禁区域
16:42IT之家(RSS)65阿里千问与国家药监局信息中心达成合作,接入数百万份药品、化妆品、医疗器械数据
08:00HuggingFace Daily Papers(社区热门论文)59主动学习器作为高效的PRP重排序器
03:45Hugging Face:Blog(RSS)60精选IBM 发布 Granite Embedding Multilingual R2 开源多语言嵌入模型
5月14日周四
23:15Perplexity68精选计算机直连Snowflake实现实时数据洞察
20:51ginobefun66BestBlogs 2.3.0 发布
20:15The Decoder:AI News(RSS)60ChatGPT 的网络流量份额一年内从 78% 跌至 54%,Gemini 悄然将覆盖范围扩大三倍
14:46HuggingFace Daily Papers(社区热门论文)55F-GRPO:用于统一候选生成与排序的因子化组相对策略优化
11:51Berryxia.AI66Exa实验揭示:提升LLM搜索能力,工具效率或比堆算力更重要
10:45HuggingFace Daily Papers(社区热门论文)63基于主动信息搜索的上下文训练
10:40IT之家(RSS)56微软调整 Edge 浏览器:取消独立 Copilot 模式,支持 AI 跨标签页分析内容
5月13日周三
22:34Rohan Paul60X平台首开全AI运营电台,24小时播报AI动态
全部 AI 动态
AI 相关资讯全量信息流
全部一手信源资讯推文
全部模型产品行业论文技巧
5月20日
02:55
IT之家(RSS)
73
谷歌搜索迎 25 年来最大改版,AI 重塑搜索体验与交互方式

谷歌在2026年I/O开发者大会上宣布,旗下搜索业务迎来25年来最大改版,核心是用AI重塑搜索入口与交互方式,由最新Gemini 3.5 Flash模型提供支撑。主要变化包括:用户交互从输入关键词转向描述完整需求,搜索框将动态扩展并支持文本、图片、视频等多模态输入。用户可从AI概览中连续追问,形成聊天式对话。新版引入搜索智能体,可在后台24小时运行并追踪用户设定的目标。此外,谷歌将生成式界面功能引入搜索,并将个人智能扩展至98种语言、近200个国家。据悉,AI Mode月活用户已突破10亿,查询量每季度翻倍。

智能体Google产品更新多模态
02:55
IT之家(RSS)
63
谷歌发布 Ask YouTube,搜索视频支持完整句子与连续追问

谷歌在2026年I/O大会上发布了“Ask YouTube”功能,将视频搜索从关键词匹配升级为对话式搜索。用户可使用完整句子描述复杂需求,系统将理解真实意图并提供更精准的结果。该功能支持连续追问,以逐步缩小搜索范围,并从YouTube整个平台的视频库(含长短视频)中整理出最相关的互动式回应。目前,此功能已向美国18岁及以上的YouTube Premium会员开放,未来将扩展至所有用户。

Google产品更新搜索
02:18
Google Blog:AI(RSS)
精选70
AI搜索的新时代

谷歌宣布了其搜索引擎与AI技术融合的最新进展,标志着AI搜索进入新阶段。此次更新旨在将搜索引擎的广度与AI的深度理解能力相结合,目标是提供更智能、更直观的搜索体验,推动搜索技术的下一代演进。

Google产品更新搜索

推荐理由:Google搜索宣称开启AI新纪元,但这次官宣只放了张图没给干货,搜索入口的任何变动都牵动流量,值得跟踪但别急着判断。
02:18
Google Blog:AI(RSS)
精选71
AI Mode 如何改变美国人的搜索方式

AI Mode 上线一周年,美国用户搜索行为呈现关键转变。数据显示,用户正从传统的关键词输入模式逐渐转向自然语言查询,这一变化反映了AI搜索技术的普及和用户交互方式的优化。自然语言查询的使用率显著提升,体现了AI搜索在日常信息获取中的影响力增强,预示着未来搜索体验的革新方向。

Google搜索现象/趋势

推荐理由:AI Mode 上线一周年,Google 第一次拿出用户行为数据,从关键词到自然语言的转向比想象中快,做搜索和 SEO 的可以重新理解用户意图了。
02:11
VentureBeat:AI(RSS)
69
Google 25年来首次重塑搜索框:AI驱动对话时代来临

在2026年I/O大会上,Google宣布对其标志性搜索框进行25年来最大升级。搜索框从简单的关键词输入,演变为支持文本、图像、PDF、视频及网页标签等多模态输入的AI对话起点。同时,AI概览与AI模式合并为统一体验,用户无需在传统结果与AI生成答案间切换。此次升级标志着Google核心产品正从关键词检索工具,彻底转向以AI和全网知识为基础的开放式对话界面。

智能体Google产品更新多模态
02:06
🚨 AI News | TestingCatalog@testingcatalog
65
Google在I/O大会上宣布,基于Antigravity技术和Gemini 3.5 Flash的智能编程能力,Generative UI将面向所有用户免费开放。谷歌搜索将能实时理解用户查询,并动态构建定制的可视化工具与模拟界面来呈现交互式视觉结果,从而提供独一无二的个性化响应。这一更新预示着AI将全面包裹并重塑互联网的交互方式。

Google: We're bringing generative UI to everyone, free of charge, thanks to Google @Antigravity and the agentic coding capabilit...

Google产品更新搜索
00:32
凡人小北@frxiaobei
67
AI技能与工具助力独立站SEO优化

本文推荐了一套针对独立站的便捷SEO优化方案。核心是名为“seo-audit”的AI技能,可安装在Codex或Claude Code等编程助手环境中,自动抓取网站并生成初步诊断报告,高效识别Sitemap、301重定向、noindex与canonical标签等常见配置问题。此外,文章还推荐了两项关键辅助工具:使用PageSpeed Insights测试并提升移动端访问速度(建议90分以上),以及利用在线工具检测网站中的404错误与死链。这套组合方案为独立站运营者提供了从技术审计到体验优化的实用入口。

向阳乔木: 如果你的网站SEO收录不好,可安装这个Skill:seo-audit 让 AI 抓取网站做一个初步分析,能发现不少基础问题。 安装指令:npx skills add https://github.com/coreyhaines31/mark...

搜索教程/实践
5月19日
23:31
OpenRouter@OpenRouter
精选68
OpenRouter上的任何工具调用模型现在都可以自主调用网络搜索和网页抓取功能。 模型可以自行决定何时搜索、搜索什么以及搜索次数。 我们新增了@p0作为新的网络搜索提供商。了解更多:https://openrouter.ai/announcements/agentic-web-tools
智能体产品更新搜索

推荐理由:OpenRouter 把 agentic web search 变成了开关,模型决定何时搜索。对于还在自己搭搜索管道的开发者,这是官方偷懒答案。
23:01
Hugging Face:Blog(RSS)
精选60
引入 Ettin Reranker 系列

Hugging Face 发布六个 Ettin Reranker 重排序模型(17m、32m、68m、150m、400m、1b),基于 Ettin ModernBERT 编码器,蒸馏 self-mxbai-rerank-large-v2 分数训练,在 MTEB(eng, v2) Retrieval 达各自规模 SOTA。模型以 Sentence Transformers CrossEncoder 接口提供,三行代码可调用。同时发布 train-sentence-transformers Agent Skill(v5.5.0),允许 AI 编码智能体在用户数据上微调模型。训练配方、数据集和脚本已全部开源。

Hugging Face检索增强开源/仓库搜索

推荐理由:从17M到1B的全尺寸reranker家族,每个量级都是SOTA,而且训练数据和代码全开放,做搜索和RAG的开发者可以无痛替换旧模型。
08:00
HuggingFace Daily Papers(社区热门论文)
54
ClinSeekAgent:实现多模态证据主动检索的临床推理代理框架

ClinSeekAgent 是一个自动化代理框架,旨在将临床推理范式从被动接收预设证据转变为主动从异构源中检索与整合多模态证据。该框架仅需临床查询和原始数据源访问权限,即可通过查询知识库、导航电子病历及调用影像工具动态收集证据,并随着新信息不断精炼假设以支持临床决策。研究通过构建ClinSeek-Bench基准测试验证其有效性,在多模态任务中将Claude Opus 4.6的F1值从47.5显著提升至62.6。此外,ClinSeekAgent 作为训练管道,可将高质量代理轨迹蒸馏为开源模型ClinSeek-35B-A3B,使其在基准测试中F1平均达到34.0,较基线提升11.9分,性能接近Claude Opus 4.6。

多模态搜索论文/研究
5月18日
18:00
公众号:小红书技术(dots.llm)
49
小红书引擎架构团队ICDE 2026新成果:CCD感知编排突破多核CPU向量搜索性能天花板

小红书引擎架构团队在ICDE 2026提出一种面向多核CPU的CCD级负载感知和线程编排向量检索框架,通过感知CCD(Core Complex Die)层级负载并优化线程编排,突破多核CPU向量搜索的性能天花板。

搜索论文/研究部署/工程
07:44
IT之家(RSS)
59
前微软高管痛批公司 AI 战略失误:重蹈互联网、移动设备时代覆辙,投资与回报严重失衡

前微软高管Mat Velloso批评公司AI战略存在严重失误。尽管微软每季度投入高达375亿美元,但其王牌产品必应未能从谷歌手中夺取市场份额,Windows和Office中强推的AI功能付费用户活跃度也不足3%。由于未能创造高价值新场景,用户反应冷淡,导致投资回报严重失衡。面临成本与股东压力,微软被迫开始倾听用户反馈。Velloso指出,微软重复了错过互联网与移动浪潮的错误,再次陷入战略被动。

Microsoft大佬观点搜索
07:33
Hacker News 热门(buzzing.cc 中文翻译)
67
Show HN: Semble--一款面向代理的代码搜索工具,其使用的令牌数量比 grep 少 98%

Semble是一款面向AI代理的代码搜索工具,其核心优势在于比传统工具grep节省98%的令牌使用量。该工具已在GitHub开源,并在Hacker News上获得106点热度。这一效率提升旨在降低AI代理处理代码搜索时的计算资源消耗与成本。

智能体GitHub开源/仓库搜索
01:42
SemiAnalysis@SemiAnalysis_
55
公司测试多种AI工具,Perplexity AI的Slack集成表现突出

本周,公司尝试了包括Devin、Mistral、Grok、Perplexity在内的多种AI工具,大多数因价值有限将被快速淘汰。但Perplexity AI的企业Slack集成表现惊人,优于Claude,能直接在Slack中发送图像并返回详细研究报告与可视化内容。目前,公司96%的token预算仍流向Anthropic(Claude提供商),但基于使用模式,部分预算可能转向Perplexity。作者希望Claude的Slack集成也能添加类似功能,以提升效率。

Anthropic搜索评测/基准
5月17日
21:50
Google DeepMind:Blog(RSS)
精选55
Gemini for Science:面向科学的AI实验与工具,开启发现新时代

Google 推出 Gemini for Science 项目,发布一系列基于 Gemini 模型的科学工具与实验性应用。该项目旨在扩展科学探索的规模与精度,通过人工智能辅助研究人员处理复杂计算、模拟实验系统并加速数据分析流程。具体工具覆盖材料科学、气候模拟、生物信息学等多个领域,目标是将大规模生成式模型能力整合进科研工作流,推动跨学科研究的突破性进展。

智能体DeepMindGoogle产品更新
关联讨论 3 条X:Google AI (@GoogleAI)X:Google AI for Developers (@googleaidevs)X:Google DeepMind (@GoogleDeepMind)
推荐理由:Google DeepMind把Co-Scientist和AlphaEvolve打包成实验工具集,试图用AI智能体加速假设生成、计算实验和文献综述。虽然还只是原型,但这是科学AI走向产品化的信号,科研人员可以试试。
21:10
Rohan Paul@rohanpaul_ai
63
智能体设计中,精确搜索(grep)是否优于向量检索?

研究指出,在编码智能体需精确定位证据(如符号、函数名、错误信息)的任务中,基于grep的精确字符串搜索比向量检索更具优势。关键在于,检索性能高度依赖智能体的设计框架——结果呈现方式(内联、文件或CLI)会极大影响搜索效果。论文挑战了“智能体栈必须始于嵌入”的默认假设,强调应区分任务类型:是语义发现问题,还是证据定位问题。对于后者,为模型提供原始工具、清晰上下文和精确搜索的框架,往往比构建复杂索引更有效。向量数据库在模糊语义搜索和大规模场景中仍有价值。

智能体arXiv大佬观点搜索
19:40
Rohan Paul@rohanpaul_ai
62
超越语义相似性:通过直接语料交互重新思考代理搜索的检索

研究表明,AI代理使用grep、文件读取等基础终端工具直接搜索原始数据,在多项基准测试中表现远超传统语义检索系统。例如,在BrowseComp-Plus基准上,终端搜索将准确率从69%提升至80%,同时降低成本。核心观点在于,检索不仅是模型问题,更是交互界面问题。直接语料交互允许代理进行精确字符串搜索、检查上下文并持续验证假设,从而从已定位文档中提取更多有效证据,其增益主要来自更充分地利用已发现文档,而非找到更多相关文档。局限性在于,随着语料库规模扩大,定位初始锚点的成本迅速增加,因此终端搜索无法完全替代大型索引。但对于强大AI代理,性能瓶颈可能在于工具允许其“触及”数据的深度。

智能体MCP/工具大佬观点搜索
07:54
Berryxia.AI@berryxia
55
喜大普奔啊,兄弟们! 不要浪费X的订阅了! 大家现在可以在 Hermes Agent 中使用 X Premium 订阅,并且 Hermes Agent 现在可以搜索 X 帖子。 https://x.ai/news/grok-hermes

xAI: You can now use X Premium subscriptions in Hermes Agent, and Hermes Agent can now search X posts. https://x.ai/news/grok...

智能体产品更新搜索
05:13
🚨 AI News | TestingCatalog@testingcatalog
64
HERMES 🔥: X Premium+ 用户现可在 Hermes Agent 中使用其订阅权益访问 Grok! 此外,他们还能使用 X 搜索工具,这使 Hermes 目前处于相当独特的位置。 现在已不仅是 OpenClaw 与 Hermes 的较量。 这再次成为 OpenAI 与 xAI 的对决 👀

Nous Research: xAI has expanded access to X Premium+ subscribers in Hermes Agent. Enjoy!

智能体xAI产品更新搜索
04:21
xAI@xai
精选65
你现在可以在 Hermes Agent 中使用 X Premium 订阅,并且 Hermes Agent 现在可以搜索 X 帖子。 https://x.ai/news/grok-hermes 【引用 @xai】:You can now use your @grok subscription inside @NousResearch Hermes Agent. http://x.ai/news/grok-hermes

xAI: You can now use your @grok subscription inside @NousResearch Hermes Agent. http://x.ai/news/grok-hermes

智能体xAI产品更新搜索

推荐理由:xAI 把 Grok 和 X 搜索带到 Hermes Agent,看着是功能更新,其实在把自家数据和模型能力向第三方 agent 开放,这一步比新模型更值得追踪,做 agent 的该看看。
5月16日
19:00
Ars Technica:AI(RSS)
65
美国押注AI在预测市场中抓内幕交易

美国商品期货交易委员会正通过部署人工智能技术来加强监管,旨在有效识别和阻止预测市场中的内幕交易活动。此举反映了监管机构应对新兴市场挑战的新策略,强调技术在金融监管中的关键作用。文章指出,美国通过投资AI工具来提升监管能力,以防范市场操纵风险,维护交易公正性。

搜索政策/监管行业动态
16:25
The Decoder:AI News(RSS)
54
Google 宣称 GEO 与 AEO 是迷思,传统 SEO 仍是应对 AI 搜索的全部所需

Google 在新发布的官方文档中明确指出,SEO 行业近期流行的“生成式引擎优化”和“答案引擎优化”只是传统 SEO 的另一种说法,并无实质区别。公司驳斥了 LLMS.txt 文件、内容分块等针对 AI 搜索的常见策略,强调其 AI 搜索与传统搜索采用相同的排名系统。这意味着网站无需为适应 AI 搜索而采取特殊优化措施,遵循既有的 SEO 最佳实践即可。

Google搜索行业动态
15:42
IT之家(RSS)
55
谷歌更新垃圾内容政策,将"AI 投毒"行为纳入打击范围

谷歌更新垃圾内容政策,正式将“AI投毒”行为纳入打击范围。新政策覆盖搜索引擎结果、AI概览和AI模式两大板块,明确将操纵生成式AI回答、通过非常规手段植入提示词以提升网站权重的行为定义为违规。例如,曾有记者通过此类方法让谷歌AI将其列为“最能吃热狗的记者”。谷歌表示,一旦发现此类操纵行为,将采取降低搜索排名或完全移除搜索结果等处罚措施。

Google搜索政策/监管
02:54
The Decoder:AI News(RSS)
60
Google 打破"AI搜索需要专属SEO策略"的迷思

Google在新发布的官方文档中明确指出,SEO行业热炒的“生成式引擎优化”和“答案引擎优化”只是传统SEO的另一种说法。公司驳斥了为AI搜索设立LLMS.txt文件或进行内容分块等特定策略的必要性,强调AI搜索与传统搜索运行于相同的排名系统之上。这表明针对Google搜索的优化原则依然统一,无需为AI搜索单独制定策略手册。

搜索现象/趋势
02:32
Chubby♨️@kimmonismus
70
AI助手Sai化身虚拟同事,自主完成深度研究

AI工具Sai被设计为拥有独立桌面的“虚拟同事”,而非仅提供聊天窗口。用户可向其下达“深度研究某主题”等指令后离线,Sai会在安全的工作空间内自主操作:打开标签页、点击应用、阅读并交叉引用资料、做笔记,其工作方式类似人类研究员。任务完成后,它会整理好引用来源,并在执行任何潜在风险操作前请求用户批准。这展示了“始终在线”的计算机使用代理的实际形态。

智能体搜索教程/实践
01:37
Rohan Paul@rohanpaul_ai
70
X平台开源最新"For You"信息流推荐算法

X平台(原推特)已将其最新的“For You”信息流推荐算法在GitHub上开源。新算法从依赖点赞、转发等硬性规则排序,转向更接近Grok风格的AI智能排名系统。该系统通过Thunder实时获取用户关注账号的帖子,再通过Phoenix从全平台检索相关的外部内容进行补充。其核心排名模型不再单一判断帖子质量,而是像Transformer模型一样,将用户、帖子和历史行为作为一个整体进行预测,评估用户可能进行回复、点赞、转发、观看或跳过等多种互动可能性,从而实现更个性化的内容推荐。

Elon Musk: The latest X algorithm has been published to GitHub https://github.com/xai-org/x-algorithm

GitHubxAI开源/仓库开源生态
00:42
AYi@AYi_AInotes
72
马斯克开源了最新的X 算法(2026.5.15)

马斯克将X平台“For You”推荐算法开源。其核心是使用Grok Transformer端到端预测用户对帖子各项互动动作的概率,并通过加权求和得出最终得分以决定推荐。推荐流水线包含用户画像、候选池检索、元数据补全、硬过滤、打分及最终选择六个步骤。对创作者的启示包括:必带媒体内容提升点击与停留时长、设计高互动钩子、避免同一主题连发以防被惩罚、警惕引发负向互动信号。值得注意的是,本次开源了流程代码与架构,但未公开具体的模型权重、训练数据及生产环境参数。

Elon Musk: The latest X algorithm has been published to GitHub https://github.com/xai-org/x-algorithm

xAI开源生态搜索教程/实践
5月15日
22:39
DogeDesigner@cb_doge
46
埃隆·马斯克分享了他对由Grok驱动的新X算法的目标。 "即使是一个零粉丝的新用户发布内容,只要内容本身足够优质,就应当能被大量用户看到。这是我们的目标。"
xAI大佬观点搜索
17:42
IT之家(RSS)
38
腾讯地图上线外卖"骑手模式":智能推荐少红灯高效路线、提前查看终点实景图 / 门禁区域

腾讯地图推出专为外卖、快递骑手设计的“骑手模式”,宣称可提升配送效率20%。该模式基于大数据和AI模型,智能规划少红灯、少转弯的骑行路线,并提前展示150-300米路况。导航可精确定位至具体楼栋单元,在大型商场等复杂场景会提示具体入口、电梯及店铺位置。骑手出发前还能查看终点实景图与门禁信息,便于提前识别目的地并联系用户,减少现场寻找与等待时间。用户更新至最新版腾讯地图即可使用。

产品更新推理搜索
16:42
IT之家(RSS)
65
阿里千问与国家药监局信息中心达成合作,接入数百万份药品、化妆品、医疗器械数据

阿里旗下千问App与国家药监局信息中心达成合作,接入了数百万份药品、化妆品及医疗器械的权威数据。此次合作使千问在回答用药咨询时能依据可靠的官方指导数据,提供详细的用药细节、核对药品审批信息、辨别真伪并智能提示不良反应与用药禁忌。对于化妆品,千问也能支持用户查询产品备案或注册信息,鉴别真伪、了解成分及适用性。双方将持续加强合作,确保数据同步更新。

搜索行业动态
08:00
HuggingFace Daily Papers(社区热门论文)
59
主动学习器作为高效的PRP重排序器

本文针对成对排序提示(PRP)框架中LLM生成成对偏好判断时存在的噪声、顺序敏感性和不可传递性问题,指出传统排序算法在这些条件下性能受限。作者将PRP重排问题重构为从噪声成对比较中主动学习的过程,提出主动排序器作为即插即用的替代方案,在调用次数受限场景下显著提升NDCG@10指标。此外,引入随机方向预言机机制,每次比较仅需一次LLM调用,将系统位置偏差转化为零均值噪声,实现无偏聚合排序并降低计算成本。

arXiv检索增强搜索论文/研究
03:45
Hugging Face:Blog(RSS)
精选60
IBM 发布 Granite Embedding Multilingual R2 开源多语言嵌入模型

IBM 发布两个 Apache 2.0 开源多语言嵌入模型:97M 参数的紧凑型(granite-embedding-97m-multilingual-r2)在 MTEB Multilingual Retrieval 上得 60.3 分,超越所有开放子 1 亿参数模型;311M 全尺寸模型(granite-embedding-311m-multilingual-r2)得 65.2 分,在 500M 以下开放模型中排第二,并支持 Matryoshka 维度。两者均基于 ModernBERT 架构,支持 200+ 种语言,针对 52 种语言和 9 种编程代码检索训练,上下文窗口达 32,768 tokens。可直接替换 sentence-transformers、LangChain、LlamaIndex 等框架中的默认模型,预置 ONNX 和 OpenVINO 权重以优化 CPU 推理。

检索增强开源生态搜索模型发布

推荐理由:97M小模型在跨语言检索上打败很多300M级选手,32K上下文让长文档处理不再鸡肋,Apache 2.0开源意味着做多语言RAG的可以直接拿来当默认嵌入模型了。
5月14日
23:15
Perplexity@perplexity_ai
精选68
计算机现已连接至Snowflake。 可基于实时仓库数据开展端到端工作,通过SQL、源表、筛选器和指标获取答案。 这就像一支随时待命的个人数据科学团队,从公司实时数据中提供精准答案。
产品更新搜索

推荐理由:Computer 接入 Snowflake,等于给公司内部数据分析配了个可对话的 SQL 助手,做报表的人可以试试,但暂时只是便利性提升,不算根本性的变化。
20:51
ginobefun@hongming731
66
BestBlogs 2.3.0 发布

BestBlogs 2.3.0 推出,主要更新包括新用户完成引导可免费体验7天Pro服务;文章、播客等详情页向所有人开放,无需登录;Pro中心重新设计,整合本周阅读、AI用量等功能于一屏。同时开放老用户14天Pro福利和邀请体验入口。该版本旨在从内容聚合站转向个人化阅读工作流,帮助用户筛选有价值信息,减轻阅读焦虑。

产品更新搜索
20:15
The Decoder:AI News(RSS)
60
ChatGPT 的网络流量份额一年内从 78% 跌至 54%,Gemini 悄然将覆盖范围扩大三倍

根据 Similarweb 数据,ChatGPT 的网站流量份额在十二个月内从 77.6% 降至 53.7%。Google Gemini 成为最大赢家,份额从 7.3% 跃升至 26.7%,覆盖范围增长三倍。这些统计仅涵盖网络流量,不包括 API 使用或移动应用数据。

GoogleOpenAI搜索现象/趋势
14:46
HuggingFace Daily Papers(社区热门论文)
55
F-GRPO:用于统一候选生成与排序的因子化组相对策略优化

传统检索流程将候选生成与重排序分阶段优化,存在效用不对齐问题。大语言模型虽能单步完成两者,但其组合输出空间面临反馈模糊的优化难题。为此,本研究提出F-GRPO统一框架,在单一自回归过程中执行生成与排序,并通过因子化组相对策略优化进行端到端训练。该方法将策略分解为生成与排序两部分,共享同一LLM主干,并联合使用顺序无关的覆盖度奖励和位置感知的效用奖励进行训练。在序列推荐和多跳问答基准测试中,F-GRPO在Top排名性能上超越了相关基线及监督学习方案,并与强大的零样本重排序模型保持竞争力,且无需改变推理架构。

检索增强搜索论文/研究
11:51
Berryxia.AI@berryxia
66
Exa实验揭示:提升LLM搜索能力,工具效率或比堆算力更重要

ExaAILabs的一项关键实验表明,在强化学习阶段训练大语言模型的搜索能力时,使用其Exa搜索API替代Google数据,不仅能使模型达到更高性能,还可节省高达70%的训练算力。这一结果直接挑战了“提升AI搜索能力主要依赖增加算力”的普遍观点,揭示了搜索工具本身的质量与效率可能更具决定性影响。该发现为从事AI Agent、RAG以及训练具备搜索能力大模型的团队提供了重要启示,意味着未来LLM训练的效率竞争可能始于对底层工具的选择。

Exa: How does Exa compare to Google for training LLMs to search? In this blog post, we find that LLMs using Exa during reinfo...

检索增强搜索数据/训练论文/研究
10:45
HuggingFace Daily Papers(社区热门论文)
63
基于主动信息搜索的上下文训练

研究为大型语言模型的上下文优化器引入维基百科搜索与浏览器工具,使其能够主动获取外部信息。单纯在标准流程中添加工具会降低性能,但配合基于搜索的训练流程——维护并修剪多个候选上下文——后,模型在多个领域实现显著提升。该方法在低资源翻译、健康场景以及强推理任务上均表现一致且高效,同时具备数据利用率高、超参数鲁棒性强等特点,所生成的文本上下文能很好地迁移至不同模型。

检索增强搜索论文/研究
10:40
IT之家(RSS)
56
微软调整 Edge 浏览器:取消独立 Copilot 模式,支持 AI 跨标签页分析内容

微软宣布调整Edge浏览器,取消独立Copilot模式,转而强化AI在桌面和移动端的整合体验。核心新功能是AI在获得授权后,可跨多个已打开的标签页收集、比较和分析内容,帮助用户快速摘要和比对信息。移动端引入“Journeys”工具,能按主题自动归类浏览历史。其他新功能还包括Copilot Voice和Vision(支持语音追问屏幕内容)、利用浏览历史和聊天上下文的长期记忆能力、将网页转为英文音频播客、教育模式(可生成测验和速记卡)以及在任意网站文本框内起草和改写文本的助手。部分功能如音频播客目前仅支持英文。

Microsoft产品更新搜索
5月13日
22:34
Rohan Paul@rohanpaul_ai
60
X平台首开全AI运营电台,24小时播报AI动态

X平台推出了首个完全由AI运营的电台,全天候为AI构建者和创始人播报新闻。该电台实时追踪GitHub、HuggingFace等多个平台的动态,将分散信息整合成连续音频流。其核心挑战在于信息排序而非语音生成,系统需判断哪些代码更新、模型发布或社区讨论值得关注。电台拥有五位具备编辑判断力、记忆和个性的AI主播,他们不仅能播报信息,还会识别模式、发现矛盾并论证观点。内容涵盖突发新闻、工具趋势、融资动态及社区观点,旨在帮助用户高效把握AI领域重要动向。

thehype.: Meet the 1st radio on X fully run by AI. Covers AI news 24/7, always on. Designed for builders and founders. Live right ...

产品更新搜索语音
‹ 上一页
1…5678910
下一页 ›