AIHOT
内容
精选全部 AI 动态AI 日报主题收藏
接入
Agent 接入
更多
关于更新日志反馈
内部员工登录
精选全部日报更多
内部员工登录
全部动态
全部一手资讯X论文
标签「RAG」清除
今天7月3日 周五
06:08MarkTechPost(RSS)63RAG-Anything 教程:在 Colab 中构建文本、表格、公式和图像的多模态检索管道
03:34jason10Jason Liu 将发布改进版幻灯片并分享
02:10elvis48Elvis Saravia 推出 PaperWiki:LLM 智能体自动维护的论文知识库
6月29日周一
08:00HuggingFace Daily Papers(社区热门论文)51紧凑型语言模型在RAG系统中实现设备端推理,无需GPU
6月28日周日
20:56meng shao45LoanLens:基于LandingAI的AI审贷初筛系统
6月26日周五
03:01Hacker News 热门(buzzing.cc 中文翻译)38《圣经》作为RAG数据库
01:23Rohan Paul62172B token研究:LLM文档问答幻觉率实测
6月24日周三
11:55HuggingFace Daily Papers(社区热门论文)52DREAM: 通过自回归建模实现密集检索嵌入
08:18MarkTechPost(RSS)72同事件精选Mistral AI 发布 OCR 4 模型同一事件,精选展示《Mistral OCR 4》
6月23日周二
15:13HuggingFace Daily Papers(社区热门论文)75精选HAKARI-Bench:统一条件下比较检索架构与效率设置的轻量级基准
11:13HuggingFace Daily Papers(社区热门论文)48KaLM-Reranker-V1:快速但非延迟交互的压缩文档重排序器
08:00HuggingFace Daily Papers(社区热门论文)45我们准备好迎接智能体原生记忆系统了吗?
6月22日周一
08:00HuggingFace Daily Papers(社区热门论文)36ChartWalker:面向跨图表RAG任务的基准框架
6月21日周日
18:06Hacker News 热门(buzzing.cc 中文翻译)53PRINCE:拜耳与Thoughtworks联合开发的智能体式AI临床前数据平台
6月19日周五
18:51MarkTechPost(RSS)62Liquid AI 发布 LFM2.5-Embedding-350M 与 LFM2.5-ColBERT-350M 双向编码检索模型
13:19AYi79精选阿里开源向量数据库Zvec,UCSD黄碧薇教授提出因果AI第四代范式
08:00HuggingFace Daily Papers(社区热门论文)58EvoEmbedding:用于长上下文检索和智能体记忆的可演化表征
6月17日周三
18:00公众号:小红书技术(dots.llm)55小红书联合浙大推出 RedParrot:基于语义缓存的 NL-to-DSL 加速框架(ICDE 2026)
08:00HuggingFace Daily Papers(社区热门论文)49ACIE:基于智能体RAG的可配置临床信息提取--什么有效、什么失效及原因
08:00HuggingFace Daily Papers(社区热门论文)50FAPO:多步LLM管道的全自主提示优化框架
02:28HuggingFace Daily Papers(社区热门论文)50SproutRAG:基于注意力引导的树搜索与渐进式嵌入的长文档RAG
6月16日周二
15:38MarkTechPost(RSS)68使用 Docling Parse 构建布局感知文档智能解析管道教程
08:00HuggingFace Daily Papers(社区热门论文)42MCompassRAG:主题元数据作为段落级检索的语义指南针
6月15日周一
21:43OpenBMB43面壁智能 OpenBMB 联合发布 FactNet:十亿级开源多语言知识图谱
16:43IT之家(RSS)63腾讯AI生态进一步打通:ima知识库作为信源接入元宝
08:00HuggingFace Daily Papers(社区热门论文)41RL-Index:面向检索索引推理的强化学习方法
08:00HuggingFace Daily Papers(社区热门论文)36理解环境感知信息检索的行为:强化学习如何为不同检索器定制查询策略
6月14日周日
11:46AYi63OpenDataLoader PDF:开源RAG PDF解析器,比Marker快116倍
6月12日周五
08:00HuggingFace Daily Papers(社区热门论文)48Dr-DCI:检索器引导的动态工作空间扩展框架
01:37AYi70QuantMind:量化金融知识处理框架开源(MIT协议)
6月11日周四
08:00HuggingFace Daily Papers(社区热门论文)38研究团队提出V-RAGBench基准与CARVE方法以改进长视频RAG
6月10日周三
11:56HuggingFace Daily Papers(社区热门论文)61每项多模态证据仅用一个token:面向资源受限问答的Latent Memory
07:19ginobefun64BestBlogs 早报 · 06-10
05:40Hacker News 热门(buzzing.cc 中文翻译)45Grep 真的就够了吗?代理框架如何重塑基于代理的搜索
01:32AYi74headroom:开源token压缩工具,可省60%-95% token
6月8日周一
16:38MarkTechPost(RSS)52Google Research 为 Gemini Enterprise Agent Platform 引入 Agentic RAG 与 Sufficient Context Agent 支持多跳查询
15:35小互57Google 发布 Agentic RAG:"质检 Agent"让系统知道没搜全,准确率提升 34%
03:27AYi62Google向量存储压缩:31GB→4GB,速度超FAISS
6月7日周日
14:34MarkTechPost(RSS)73精选Harness-1:基于强化学习训练的有状态搜索20B检索子智能体
6月6日周六
04:30Google Research:Blog(网页)64精选谷歌推出基于 Gemini Enterprise Agent Platform 的 Agentic RAG 框架
全部 AI 动态
AI 相关资讯全量信息流
全部一手信源资讯推文
全部模型产品行业论文技巧
7月3日
06:08
MarkTechPost(RSS)
63
RAG-Anything 教程:在 Colab 中构建文本、表格、公式和图像的多模态检索管道

本教程使用 RAG-Anything 搭建多模态检索工作流,可检索文本、表格、公式和图像。首先在 Colab 中安装依赖并修复 Pillow 版本,通过 OpenAI API key 配置对话、视觉和嵌入函数。接着生成包含图表和 PDF 的合成多模态报告,将其转为 content_list 格式并插入检索系统。最后配置并测试 naive、local、global 和 hybrid 四种检索模式。环境变量包括 CHUNK_SIZE=900、CHUNK_OVERLAP_SIZE=120,便于在笔记本中复现。

检索增强多模态教程/实践
03:34
jason@jxnlco
10
我将发布更高质量的幻灯片并与大家分享。

George Guimarães: Happy to meet @jxnlco in person! My RAG mentor who broke the record on @aiDotEngineer's World Fair on longest line for h...

检索增强行业动态
02:10
elvis@omarsar0
48
Elvis Saravia(DAIR.AI)分享了其构建的 PaperWiki--一个由 LLM 和代码智能体自动维护的知识库,用于研究工作流、社区论文策展及通讯。PaperWiki 从多源摄取论文,存储于 Obsidian 并用 qmd 索引,支持全文和语义搜索。设有每日更新自动化,结合 Opus-4.8 和 DeepSeek-V4-Flash 等模型维护。作者认为 LLM Wikis 是 AI 最有价值的应用之一,可帮助去噪、发现高质量论文,并计划开源相关组件(含 HTML artifact)。

elvis: LLM Wikis are being slept on. I argue that creating knowledge bases with LLMs or coding agents is one of the most valuab...

智能体检索增强教程/实践
6月29日
08:00
HuggingFace Daily Papers(社区热门论文)
51
紧凑型语言模型在RAG系统中实现设备端推理,无需GPU

一项研究评估了小型语言模型在检索增强生成(RAG)系统中的生成性能。实验采用开源与专有数据集,覆盖多种学科与问题类型。结果表明,配备小语言模型的RAG系统可在设备端直接运行,且无需任何GPU硬件,在合理时间内完成推理。实验代码及补充材料已通过GitHub仓库公开。

检索增强端侧论文/研究
6月28日
20:56
meng shao@shao__meng
45
LoanLens:基于LandingAI的AI审贷初筛系统

LoanLens从六类借款人文档抽取结构化字段,进行欺诈检测与可解释评分,并附带案件RAG问答。采用Schema驱动抽取,可追溯字段来源;欺诈检测包括姓名TF-IDF比对和护照篡改检测;评分透明(信用23%、DTI 23%等),≥60批准,40–59复核,<40拒绝。

LandingAI: http://x.com/i/article/2070766331306332160

检索增强数据/训练行业动态
6月26日
03:01
Hacker News 热门(buzzing.cc 中文翻译)
38
《圣经》作为RAG数据库

一个将《圣经》文本作为RAG(检索增强生成)数据库的网站,提供基于圣经内容的问答检索功能,项目地址为crosscanon.com。

检索增强产品更新
01:23
Rohan Paul@rohanpaul_ai
62
172B token研究:LLM文档问答幻觉率实测

一项基于172B token的研究测试了LLM在文档问答场景中的虚构答案频率。关键发现:最佳模型在32K上下文下虚构率1.19%;强模型通常为5%-7%;中等模型对不存在事实的虚构率达25%。当上下文扩展至200K时,所有模型至少虚构10%。更长上下文显著加剧幻觉。研究表明,幻觉不仅是检索失败,模型即便能正确找到事实,也易在事实缺失时过度作答。

arXiv检索增强安全/对齐论文/研究
6月24日
11:55
HuggingFace Daily Papers(社区热门论文)
52
DREAM: 通过自回归建模实现密集检索嵌入

DREAM是一种利用大语言模型(LLM)自回归下一token预测目标为密集检索嵌入模型提供监督训练的方法。它将检索器生成的查询-文档相似度分数注入冻结LLM的选定注意力头,使预测损失通过注意力机制为检索器提供梯度。在BEIR和RTEB检索基准上,使用0.5B至3B参数的嵌入骨干,DREAM均持续优于现有基线。

arXiv检索增强数据/训练论文/研究
08:18
MarkTechPost(RSS)
同事件精选72
Mistral AI 发布 OCR 4 模型

Mistral AI 今日发布 OCR 4,支持 170 种语言,可单容器自托管部署。新版本除提取文本外,还返回边界框、块类型(标题/表格/方程等)和逐字置信度分数。独立标注者在 600+ 文档、12+ 语言的测试中平均胜率 72%。价格 $4/千页,批量 $2/千页,Document AI 模式 $5/千页。企业客户可自托管。Rogo 报告等效精度下成本低约 8 倍、延迟低 17 倍;Anaqua 测得每页快约 4 倍。OCR 4 同时作为 Mistral Search Toolkit(公开预览)的接入组件。

检索增强产品更新多模态搜索
同一事件,精选展示《Mistral OCR 4》
推荐理由:Mistral OCR 4 不只是提取文本,而是输出带定位框和置信度的结构,这对需要引用和溯源的企业搜索很有价值,不过按页计费对小团队是门槛。
6月23日
15:13
HuggingFace Daily Papers(社区热门论文)
精选75
HAKARI-Bench:统一条件下比较检索架构与效率设置的轻量级基准

HAKARI-Bench 是一个轻量级检索基准,将现有检索套件重建为小型数据集(Nano-sets),涵盖 35 个基准、551 个任务和 43 种语言,采用统一格式实现模型无关比较。它支持 BM25、稠密、稀疏、晚交互和重排序五种检索家族及其效率变体(降维、量化等)在同一条件下对比。在 55 个模型上,整体排名与 MTEB retrieval v2、MMTEB v2 retrieval 及 English BEIR(完整版)的 Spearman 相关系数均高于 0.97。HAKARI-Bench 不取代全面评测,而是用于快速模型选择、回归检测和探索质量-效率帕累托前沿。代码、数据和排行榜以 MIT 许可证开源。

Hugging Face检索增强论文/研究

推荐理由:有了这个轻量级基准,做检索的开发者不用再跑整套 MTEB 就能快速筛选嵌入模型和效率配置,而且排名与完整评测高度一致,是工程选型的高性价比工具。
11:13
HuggingFace Daily Papers(社区热门论文)
48
KaLM-Reranker-V1:快速但非延迟交互的压缩文档重排序器

KaLM-Reranker-V1 是一种快速但非延迟交互(FBNL)重排序器,采用编码器-解码器架构。编码器使用 Matryoshka 嵌入池化预编码段落,解码器建模系统指令、用户指令和查询意图,再通过交叉注意力捕获查询与段落间的相关性,实现解耦计算并保持高效。模型提供 Nano(0.27B)、Small(1B)和 Large(4B)三种激活参数尺寸。在 BEIR 上达到 SOTA,与 Qwen3-Reranker 系列持平;在 MIRACL 上未经大量多语言训练仍表现优异;在 LMEB 上,0.27B Nano 模型可与 7-12B 嵌入模型竞争。

arXiv检索增强搜索论文/研究
08:00
HuggingFace Daily Papers(社区热门论文)
45
我们准备好迎接智能体原生记忆系统了吗?

从数据管理视角对LLM智能体记忆系统进行系统性实验研究,将其分解为表示与存储、提取、检索与路由、维护四个核心模块。评估了12个代表性记忆系统和两个参考基线,覆盖5个基准工作负载共11个数据集。端到端结果显示无单一架构占优,效果取决于记忆结构与工作负载瓶颈的对齐。细粒度消融实验量化了各模块对表示保真度、检索精度、更新正确性和长期稳定性的影响。实际工作负载下局部维护比全局重组更具成本效益。代码已公开。

智能体检索增强论文/研究
6月22日
08:00
HuggingFace Daily Papers(社区热门论文)
36
ChartWalker:面向跨图表RAG任务的基准框架

ChartWalker是一个面向跨图表检索增强生成(RAG)任务的新框架。它采用层次知识图谱构建方法,按粒度组织实体与关系,并设计结构感知采样算法生成语义一致的多跳推理路径,显式控制查询难度与粒度,以解决现有基准中查询与证据词汇重合度高、推理链逻辑不一致的问题。基于该框架发布ChartWalker-Bench基准,覆盖多领域与多类型跨图表查询。主流RAG范式评估显示显著性能差距,同时提供ChartWalker-Agent基线辅助分析。

检索增强多模态论文/研究
6月21日
18:06
Hacker News 热门(buzzing.cc 中文翻译)
53
PRINCE:拜耳与Thoughtworks联合开发的智能体式AI临床前数据平台

拜耳与Thoughtworks合作开发了云端平台PRINCE,利用Agentic RAG和Text-to-SQL整合数十年临床前安全研究报告。该系统从关键词搜索演进为能回答复杂问题并起草监管文档的智能研究助手。架构通过上下文工程控制信息路由,通过驾驭工程实现编排、错误恢复与可观测性。系统以透明度、可解释性和人工参与为核心信任机制,显著提升数据可访问性与研究效率,同时确保治理与合规。

智能体检索增强教程/实践部署/工程
6月19日
18:51
MarkTechPost(RSS)
62
Liquid AI 发布 LFM2.5-Embedding-350M 与 LFM2.5-ColBERT-350M 双向编码检索模型

Liquid AI 本周发布两款 350M 参数检索模型:稠密双编码器 LFM2.5-Embedding-350M 和后期交互模型 LFM2.5-ColBERT-350M。二者基于 LFM2.5-350M-Base,通过将因果注意力改为双向注意力实现双向编码,支持阿拉伯语、德语、英语等 11 种语言的单语与跨语言搜索。在 NanoBEIR 多语言检索上,ColBERT 版 NDCG@10 为 0.605,Embedding 版为 0.577,均优于 Qwen3-Embedding-0.6B。在 MKQA-11 问答 Recall@20 上分别为 0.694 和 0.691。上下文窗口 32,768 tokens,文档调优至 512 tokens。提供 GGUF 格式,MacBook Pro M4 Max 上查询延迟低于 10 ms。模型以 LFM Open License v1.0 发布在 Hugging Face。

Hugging Face检索增强搜索模型发布
13:19
AYi@AYi_AInotes
精选79
阿里开源向量数据库Zvec,UCSD黄碧薇教授提出因果AI第四代范式

阿里开源内部向量数据库Zvec,pip install zvec免费使用,对标Pinecone每月70美元能力。支持十亿向量毫秒级检索,无需单独起服务,全平台兼容;v0.5.0新增原生全文混合搜索。UCSD黄碧薇教授(causal-learn作者)提出AI四代范式:相关性小模型→因果小模型→相关性大模型(LLM)→因果大模型,认为当前正站在第四代门口。其创立的Aether AI完成首轮融资,致力于从视频中自动抽取物理规律,探索下一代因果AI范式。

AYi: 人类到今天都写不出一颗煎蛋的物理方程, 一颗鸡蛋打进热油锅,它怎么凝固、怎么摊开、边缘怎么变焦, 没有任何一个公式能描述清楚,这种例子在物理世界里多到数不过来。 而这恰恰是当下通用 AI 范式的天花板,视频生成、VLA 学的都是像素层面的统...

检索增强产品更新开源生态搜索

推荐理由:阿里把内部跑了多年的向量数据库开源了,pip一行直接跑,十亿级毫秒检索还不占额外服务,做RAG和搜索的不用再每月给Pinecone交钱,虽然刚起步,但免费生产级轮子值得一试。
08:00
HuggingFace Daily Papers(社区热门论文)
58
EvoEmbedding:用于长上下文检索和智能体记忆的可演化表征

现有嵌入模型是静态的,孤立编码文本片段,忽略上下文与时间顺序。EvoEmbedding 生成可演化表征,专为信息动态、序列化的长上下文场景设计。模型顺序处理输入时维护连续更新的隐记忆,并与原始内容共同生成演化嵌入,使同一查询能根据上下文检索不同目标。为联合优化隐记忆与检索,构建了训练数据集 EvoTrain‑180K,并引入记忆队列防止表征崩塌,结合分段批处理加速训练 3.8 倍。实验表明,该模型在长上下文检索基准上超越更大规模专用模型,并可泛化至上下文长 10 倍的下游任务;集成至简单 RAG 管线即可超越专用智能体记忆系统。

智能体检索增强论文/研究
6月17日
18:00
公众号:小红书技术(dots.llm)
55
小红书联合浙大推出 RedParrot:基于语义缓存的 NL-to-DSL 加速框架(ICDE 2026)

RedParrot 是一种面向企业级商业分析的 NL-to-DSL 加速框架,通过查询语义缓存、骨架匹配、实体无关表示学习和多源异构 RAG,将多阶段 LLM 工作流压缩为短链路生成。在小红书真实业务数据集上,平均实现 3.6x 推理加速,执行准确率提升 8.26%,表选择准确率达 85.99%;在开放基准 Spider-DSL 和 BIRD-DSL 上,准确率分别提升 29.9 和 39.7 个百分点。P90 延迟降低至约 21 秒。框架采用短链路与长链路双路径兜底,支持增量缓存更新。

检索增强数据/训练论文/研究
08:00
HuggingFace Daily Papers(社区热门论文)
49
ACIE:基于智能体RAG的可配置临床信息提取--什么有效、什么失效及原因

患者上下文涉及数百份异构文档与数千个结构化数据点,但文档级元数据缺失,标准RAG在处理时间推理、跨文档依赖等任务时表现不佳。为此,研究者在埃森大学医学中心部署了ACIE——一个本地部署的智能体RAG流水线,它可推理完整患者上下文并将每个回答锚定在源段落中供临床医生验证。在一项独立的回顾性淋巴瘤登记研究中,核医学医生对每个提取值与其引用来源进行核对,在7326次判断中接受了96.5%的提取结果,各类型接受率介于80%至99%之间。

智能体Hugging Face检索增强论文/研究
08:00
HuggingFace Daily Papers(社区热门论文)
50
FAPO:多步LLM管道的全自主提示优化框架

FAPO是一个让Claude Code在标准化代码库内自动优化多步LLM管道的框架。它评估管道、检查中间步骤、诊断失败、提出范围性更改并反复验证,优先尝试提示编辑,仅当提示优化不足且归因识别出结构瓶颈时才调整链结构。在6个基准和3个任务模型上,FAPO在18个模型-基准比较中15次击败基线GEPA,平均增益+14.1pp;其中11次比较中均值±标准差范围不重叠。在HoVer和IFBench上,提示优先搜索升级为结构变化的6次比较中FAPO全胜,平均增益+33.8pp。安全任务上,仅提示版FAPO在CTIBench-RCM上将GPT-5测试准确率提升+4.0pp,Foundation-Sec-8B-Instruct提升+7.1pp,Foundation-Sec-8B-Reasoning提升+2.0pp。

检索增强推理论文/研究部署/工程
02:28
HuggingFace Daily Papers(社区热门论文)
50
SproutRAG:基于注意力引导的树搜索与渐进式嵌入的长文档RAG

SproutRAG是一个注意力引导的层次化RAG框架,通过学习句子间注意力构建二分块树,将句子级块组织成语义连贯的渐增单元。检索时使用层次化波束搜索获取多粒度候选,无需额外LLM调用或压缩摘要。框架端到端联合训练,优化嵌入和树结构。在科学、法律和开放域四个基准上,平均信息效率(IE)提升6.1%。代码已开源。

GitHub检索增强论文/研究
6月16日
15:38
MarkTechPost(RSS)
68
使用 Docling Parse 构建布局感知文档智能解析管道教程

本教程演示了利用 Docling Parse 对 PDF 文档进行结构化解析的流程。先搭建稳定 Python 环境并生成含文本、列、表格、矢量图形和嵌入图像的多页 PDF。再通过 Docling Parse 提取词、字符和行级文本及页面坐标,渲染可视化叠加图层,最后输出为 JSON 与 CSV 文件。该流程展示了底层 PDF 解析如何支持布局分析、阅读顺序还原、表格感知处理及检索就绪的文档预处理等文档 AI 任务。

检索增强教程/实践部署/工程
08:00
HuggingFace Daily Papers(社区热门论文)
42
MCompassRAG:主题元数据作为段落级检索的语义指南针

MCompassRAG是一个元数据引导的检索框架,利用主题级信号作为语义指南针,通过LLM教师蒸馏训练轻量检索器,在不额外调用LLM的情况下实现主题感知检索。在6个复杂检索基准上,MCompassRAG的信息效率(IE)平均提升8.24%,延迟比最强高效RAG基线低5倍以上。代码已开源。

arXiv检索增强论文/研究
6月15日
21:43
OpenBMB@OpenBMB
43
面壁智能 OpenBMB 联合发布 FactNet:十亿级开源多语言知识图谱

面壁智能 OpenBMB 联合清华NLP、慕尼黑工业大学等发布 FactNet,构建十亿级开源多语言知识图谱。它将 1.7B 原子断言统一为 1.55B FactSynsets,附带 3.01B 来自 316 种语言维基百科的字节级可追溯证据(页面ID、修订版ID、Unicode偏移),99.63% 精确重定位。人工审计 4,200 项,设计加权精度 92.1%(低资源语言 88.5%)。FactNet-Bench 包含 KGC、MKQA、MFC 三项任务,显式惩罚信息泄露,为可验证 AI 提供结构化事实基础。

检索增强数据/训练论文/研究
16:43
IT之家(RSS)
63
腾讯AI生态进一步打通:ima知识库作为信源接入元宝

腾讯今日宣布,ima知识库作为信源接入元宝,元宝在解答提问时可将ima知识库相关内容作为信源之一,提供更精准、个性化的智能问答体验。目前ima知识号覆盖金融、法律、医疗、教育等20余个行业,知识内容被应用超1.4亿次。用户可点击信源引用卡片跳转ima原文,并一键加入个人知识库继续提问。此外,WorkBuddy与ima结合可实现AI全包资料查找,腾讯文档支持文档秒进知识库,微信读书实现读书笔记自动归纳与随时提问。

检索增强产品更新
08:00
HuggingFace Daily Papers(社区热门论文)
41
RL-Index:面向检索索引推理的强化学习方法

RL-Index 是一种智能体索引框架,将检索索引推理形式化为强化学习问题。它在索引阶段利用 LLM 生成的推理(rationales)增强文档,并采用 Group Relative Policy Optimization(GRPO)与检索相似度作为可验证奖励信号,直接优化索引决策以提升检索效果。在 BRIGHT 基准上,RL-Index 持续提升检索与下游问答性能,显著降低在线推理延迟,且所学的推理增强可跨不同检索器与生成器泛化,作为一种即插即用的索引策略。

检索增强推理论文/研究
08:00
HuggingFace Daily Papers(社区热门论文)
36
理解环境感知信息检索的行为:强化学习如何为不同检索器定制查询策略

基于检索增强生成(RAG)的方法在处理复杂查询时表现出色,但不同检索器需要截然不同的查询构建策略。该工作首次系统分析大语言模型(LLM)如何通过强化学习(RL)学习为不同检索器定制查询策略。实验表明,RL能有效指导LLM根据检索器特性调整查询风格,且不同检索器对描述型或疑问型查询的偏好显著不同。引入分支式rollout技术提升了多步检索轨迹下的训练稳定性。研究为构建真正检索器感知的RAG系统提供了实证证据和可操作洞见。代码与资源已公开。

检索增强论文/研究
6月14日
11:46
AYi@AYi_AInotes
63
OpenDataLoader PDF:开源RAG PDF解析器,比Marker快116倍

OpenDataLoader PDF是专为RAG管道设计的开源PDF解析器,在200份真实文档(含多栏、学术论文、财报)测试中综合基准得分0.907排名第一,GitHub 2.4万星。本地CPU运行,无需GPU,每页处理仅0.46秒,比Marker快116倍且准确率更高。支持表格、公式、图片、图表解析及OCR(80+语言),输出Markdown、JSON(含坐标边界框)、HTML。原生集成LangChain(pip install langchain-opendataloader-pdf)。采用Apache 2.0许可,可商用。

AYi: Claude Code、OpenClaw、Hermes、Codex,一个比一个能干, 但 2026 年了,这批最先进的 Agent 还集体卡在同一件小事上: 上不了网,查推特要付费 API,读小红书卡登录,上 Reddit 动不动被封 IP...

检索增强开源/仓库数据/训练
6月12日
08:00
HuggingFace Daily Papers(社区热门论文)
48
Dr-DCI:检索器引导的动态工作空间扩展框架

Dr-DCI 将检索作为智能体可调用的动作来扩展本地工作空间,动态拉取相关文档到演化中的工作空间内执行直接语料交互(DCI)操作。在 Browsecomp-Plus 上达到 71.2% 准确率,优于原始 DCI 最多 8.3 个百分点,并降低工具使用次数与成本。工作空间保留式上下文重置后准确率提升至 73.3%。在 10 万到 1000 万文档的语料扩展实验中保持有效,而原始 DCI 变得不稳定。在 2000 万级 Wiki-18 QA 设置下平均得分为 63.0,超越基于检索和搜索智能体的基线。消融分析表明,排序预览和文档间 DCI 是性能关键。

智能体检索增强搜索论文/研究
01:37
AYi@AYi_AInotes
70
QuantMind:量化金融知识处理框架开源(MIT协议)

一群AI研究员开源了量化金融知识处理框架QuantMind(MIT协议)。它能将arXiv论文、SEC文件、研报等非结构化内容批量解析为可查询的语义知识图谱,支持多模态解析(表格、公式、图表)及自然语言多跳推理,可替代初级分析师读论文、整理观点等工作。但真正的alpha仍取决于提问质量与验证严谨度。

AYi: http://x.com/i/article/2064536412670562304

GitHub检索增强多模态开源/仓库
6月11日
08:00
HuggingFace Daily Papers(社区热门论文)
38
研究团队提出V-RAGBench基准与CARVE方法以改进长视频RAG

针对现有视频RAG基准中查询无需视频即可回答、且采用单一模态-粒度配置的局限,研究者提出V-RAGBench基准,包含(query, evidence chunk, answer)三元组,支持检索与生成的解耦评估;同时提出CARVE方法,通过并行运行多配置检索器并对每个chunk进行自适应重排序,为每个chunk选择最优配置,使生成阶段交织不同配置的证据块。在长视频场景下,CARVE在八个近期VideoRAG基线方法中取得最优结果。

检索增强多模态论文/研究
6月10日
11:56
HuggingFace Daily Papers(社区热门论文)
61
每项多模态证据仅用一个token:面向资源受限问答的Latent Memory

Latent Memory提出一种潜在空间记忆范式,由小型压缩器LLM/VLM将每个原始文本或图像证据压缩为单个高维潜在token。查询时,将查询嵌入同一空间检索相关token并直接输入预训练LLM/VLM生成答案。通过统一端到端训练,结合重建、对比和蒸馏目标,使单个token同时携带重建、检索和生成信息。在HotpotQA等七个纯文本QA基准和多项多模态QA基准上,Latent Memory取得与先进RAG基线相当的问答性能,同时生成器token消耗减少3至10倍,并在WebQA上达到图像问答最强性能。代码已公开。

arXiv检索增强多模态论文/研究
07:19
ginobefun@hongming731
64
BestBlogs 早报 · 06-10

Anthropic发布Claude Fable 5与Mythos 5,输入$10/M、输出$50/M,5%高风险请求降级到Opus 4.8,药物设计加速10倍。ServiceNow发布语码转换ASR基准,覆盖4组语言对、7个ASR系统,Scribe V2、Gemini 3 Flash和AssemblyAI表现最稳。Salesforce从20,000个Agentforce企业客户总结:支持Agent处理3百万次对话,上线后运营是难点。

ginobefun: http://x.com/i/article/2064485562875260928

智能体Anthropic检索增强模型发布
05:40
Hacker News 热门(buzzing.cc 中文翻译)
45
Grep 真的就够了吗?代理框架如何重塑基于代理的搜索

该研究质疑在基于代理的搜索(agentic search)中“grep 是否足够”这一假设,并分析代理框架(agent harnesses)如何重新定义智能体搜索的交互方式与能力边界,推动搜索范式从简单工具调用向结构化代理行为演进。

智能体检索增强搜索论文/研究
01:32
AYi@AYi_AInotes
74
headroom:开源token压缩工具,可省60%-95% token

开源免费的 token 压缩工具 headroom 本周增速最快,已获 17k star。它专为所有 AI API 调用(输出、日志、文件、RAG 块)设计,压缩 60%-95% 的 token,将账单直接砍到原来的 1/5,且回答质量不变。无需修改一行现有代码,可作为库、代理或 MCP 服务器无缝对接所有大模型。开发者无需再绞尽脑汁凑提示词,一行配置即可大幅降低 API 成本。

GitHubMCP/工具检索增强开源/仓库
6月8日
16:38
MarkTechPost(RSS)
52
Google Research 为 Gemini Enterprise Agent Platform 引入 Agentic RAG 与 Sufficient Context Agent 支持多跳查询

Google Research 在 Gemini Enterprise Agent Platform 中推出一个 Agentic RAG 框架。该框架中的 Sufficient Context Agent 会持续重新搜索,直到多跳、多源查询拥有足够的 grounding 来生成回答。相比标准 RAG,该框架将事实准确性最高提升 34%。

智能体Google检索增强产品更新
15:35
小互@xiaohu
57
Google 发布 Agentic RAG:"质检 Agent"让系统知道没搜全,准确率提升 34%

Google 发布 Agentic RAG 框架,核心新增 Sufficient Context Agent,负责在生成答案前检查检索材料是否充分,若不充分则生成缺失分析并引导系统迭代搜索。在 FramesQA 多跳测试中准确率最高提升 34%,从 4 个数据库检索时正确率达 90.1%,速度仅慢 3% 以内。该设计基于前作发现:Gemini 1.5 Pro 判断“上下文充分性”准确率达 93%,且“相关≠够用”是幻觉关键原因。目前以公开预览在 Gemini Enterprise Agent Platform 开放。

智能体Google检索增强产品更新
03:27
AYi@AYi_AInotes
62
Google向量存储压缩:31GB→4GB,速度超FAISS

Google提出一种AI记忆压缩技术,可将1000万个文档的向量存储从31GB内存压缩至仅4GB,且搜索速度超过目前最常用的FAISS方法。该技术使本地运行大语言模型并结合个人数据变得更加可行。

AYi: http://x.com/i/article/2060717603987791878

Google检索增强数据/训练论文/研究
6月7日
14:34
MarkTechPost(RSS)
精选73
Harness-1:基于强化学习训练的有状态搜索20B检索子智能体

UIUC与Chroma联合推出Harness-1,一个20B参数的检索子智能体。它通过强化学习在一个有状态搜索框架中训练,该框架维护候选池、重要性标注集、证据图和验证记录,由策略决定搜索、筛选、验证及停止的时机。Harness-1在8个基准测试上达到0.730平均curated recall,比下一个最佳开源子智能体高出11.4个百分点,仅落后于Opus-4.6。模型权重和框架代码均已公开。

检索增强搜索模型发布

推荐理由:UIUC和Chroma放出的这个20B检索子代理,用RL训练出了0.73的平均召回,把开源竞品甩开11.4分,只比Opus-4.6低一点。权重、Harness全开源,搞RAG的可以真刀真枪试试了。
6月6日
04:30
Google Research:Blog(网页)
精选64
谷歌推出基于 Gemini Enterprise Agent Platform 的 Agentic RAG 框架

Google Research 与 Google Cloud 合作推出跨语料库检索(Cross-Corpus Retrieval)框架,作为 Gemini Enterprise Agent Platform 的 Agentic RAG。该多智能体工作流将复杂企业查询分解为子任务,通过规划、重写和路由,迭代搜索多个数据源直至获得充分上下文,再生成可靠回答。与标准 RAG 相比,在事实性数据集上准确率最高提升 34%;在多个领域特定内部数据集上也实现了更好的接地与推理准确性。

Google检索增强产品更新

推荐理由:企业级 RAG 的新标杆,多 agent 架构加上‘足够上下文’检查,准确度提升 34%。做知识库问答的产品经理和架构师都应该认真看。
‹ 上一页
12345
下一页 ›