4月24日

08:00

HuggingFace Daily Papers（社区热门论文）

SLIDERS框架通过结构化方法解决长文档集问答的扩展性难题。它将文档关键信息提取至关系数据库，利用SQL进行高效推理，避免了传统文本拼接法的瓶颈。其核心创新是数据协调阶段，通过来源、依据和元数据检测并修复重复、不一致或不完整的记录，确保信息全局一致性。该框架在三个现有长上下文基准测试中均超越所有基线模型，平均领先GPT-4.1达6.6分；在包含390万和3600万token的两个新基准上，相较次优模型的优势分别扩大至约19分和32分，展现出卓越的大规模文档处理能力。

检索增强论文/研究部署/工程

08:00

HuggingFace Daily Papers（社区热门论文）

dWorldEval：基于离散扩散世界模型的可扩展机器人策略评估方法

研究团队提出dWorldEval，一种基于离散扩散世界模型的可扩展机器人策略评估框架。该方法将视觉、语言和机器人动作等多模态数据映射到统一的令牌空间，通过单一Transformer去噪网络进行建模，并引入稀疏关键帧记忆以保持时空一致性。模型在推理时联合预测未来观测和任务进度令牌，当进度值达到1时自动判定任务成功。实验表明，dWorldEval在LIBERO、RoboTwin及多项真实机器人任务上显著优于WorldEval、Ctrl-World和WorldGym等现有方法，为构建大规模机器人评估的世界模拟器提供了新的架构范式。

具身智能论文/研究部署/工程

4月23日

08:00

HuggingFace Daily Papers（社区热门论文）

Memanto：面向长周期智能体的类型化语义记忆与信息论检索系统

本文提出Memanto，一种用于智能体AI的通用记忆层，挑战了实现高保真记忆必须依赖复杂知识图的传统假设。该系统集成了包含13个预定义类别的类型化语义记忆架构、自动冲突解决与时间版本管理，其核心由无需索引的Moorcheh信息论搜索引擎驱动，可在低于90毫秒延迟内实现确定性检索，且完全无数据摄入延迟。在LongMemEval和LoCoMo基准测试中，Memanto分别以89.8%和87.1%的准确率取得最优结果，超越所有基于混合图与向量检索的系统，仅需单次查询、无摄入成本并显著降低运行复杂度。

智能体 Hugging Face 论文/研究部署/工程

08:00

HuggingFace Daily Papers（社区热门论文）

DiffNR：面向稀疏视图三维断层扫描重建的扩散增强神经表示优化

神经表示在计算机断层扫描中能有效建模三维体数据，但在稀疏视图条件下会产生严重伪影。DiffNR 提出一种融合扩散先验增强神经表示优化的新框架，其核心是用于修正退化切片伪影的单步扩散模型 SliceFixer。该框架引入了专用条件层与数据策展策略以支持模型微调，并在重建过程中周期性地生成伪参考体数据，为欠约束区域提供辅助的三维感知监督。相比以往将 CT 求解器嵌入耗时迭代去噪过程的方法，DiffNR 采用的修复‑增强策略避免了频繁查询扩散模型，从而提升了运行效率。大量实验表明，DiffNR 平均将 PSNR 提升 3.99 dB，具有良好的跨领域泛化能力，并保持了高效的优化过程。

图像生成论文/研究部署/工程

08:00

Google Developers Blog（RSS）

精选59

使用 LiteRT 与 NPU 构建现实世界中的设备端人工智能

LiteRT 是一个生产就绪的框架，旨在帮助移动开发者充分发挥神经处理单元（NPU）的效能，以突破传统 CPU 或 GPU 在性能与电池续航上的瓶颈。该框架通过提供统一的 API 来屏蔽底层硬件复杂性，已成功助力 Google Meet、Epic Games 等行业领先者高效部署复杂的 AI 模型，实现实时视频处理、动画生成与语音识别等高级功能。此外，平台还提供基准测试工具并具备跨平台兼容性，能够支持 AI 应用无缝部署于移动设备、AI PC 及工业物联网硬件等多种终端。

Google 产品更新端侧部署/工程

推荐理由：Google 把 LiteRT 从实验品推到生产级，统一 NPU 调用 API，做端侧 AI 的开发者终于不用逐家适配芯片了。虽然不是新概念，但 Google Meet 和 Epic Games 已经在用，说明不是 PPT。

08:00

蚂蚁百灵：Developer Blog（网页）

精选67

Ling-2.6-flash 发布：更快响应、更强执行、更高 Token Efficiency

针对智能体任务中Token消耗快速增长的问题，Ling-2.6-flash模型正式发布。该模型采用混合线性架构等技术进行系统性优化，旨在实现更高推理效率和更低使用成本。其推理速度在4卡H20条件下最快可达340 tokens/s，在Artificial Analysis评测中仅消耗约对比模型1/10的Tokens。模型在多个Agent相关基准测试中达到同尺寸SOTA水平，保持了强大的任务执行与工具调用能力。

智能体模型发布部署/工程

推荐理由：蚂蚁百灵这次打的是「省 token」这张牌，104B 总参但只激活 7.4B，Agent 场景评测对齐同尺寸 SOTA，输出 token 消耗只有竞品的 1/10。做 Agent 产品、被推理成本卡脖子的团队值得认真看看这个路线。

4月22日