5月26日

11:11

IT之家（RSS）

Perplexity 开源内部安全扫描工具 Bumblebee，助力行业应对软件供应链投毒

开源/仓库部署/工程

08:00

HuggingFace Daily Papers（社区热门论文）

GradSentry：用于大语言模型微调中后门样本过滤的梯度谱熵方法

GradSentry是一种基于单样本梯度谱熵的后门样本过滤方法，用于防御大语言模型微调中的数据投毒攻击。其核心发现是中毒样本产生的梯度谱熵高于干净样本。该方法通过分析单样本的梯度谱来捕获后门特征，避免了成对比较或聚类，且具有训练无关性，适用于LoRA等参数高效微调及全参数微调。GradSentry在1%到90%的投毒比例下均有效，为7B模型引入的计算开销仅为每样本20-50毫秒。在四个问答数据集和四种攻击类型上的评估验证了其有效性。

安全/对齐开源/仓库数据/训练论文/研究

05:36

MarkTechPost（RSS）

Together AI开源OSCAR：面向长上下文大语言模型服务的注意力感知2位KV缓存量化系统

Together AI开源OSCAR，一种用于长上下文大语言模型服务的注意力感知2位KV缓存量化方法。该方法在离线状态下，从注意力感知的协方差结构中为键和值推导出独立的旋转。在2.28 bits per KV element的量化精度下，OSCAR将通义千问（Qwen3-4B-Thinking-2507）和通义千问（Qwen3-8B）的BF16精度差距分别缩小至3.78点和1.42点，同时实现约8倍的KV内存缩减，并在100K上下文长度下带来高达3倍的解码速度提升。

开源/仓库推理部署/工程

5月25日

18:48

蚂蚁 inclusionAI：HuggingFace 新模型

同事件精选69

蚂蚁 inclusionAI 发布策略自适应多模态安全护栏模型 Sing-Guard-8b

SingGuard 是蚂蚁 inclusionAI 推出的策略自适应多模态大语言模型安全护栏模型族（版本 Sing-Guard-8b），支持纯文本、纯图像、图文混合、多语言查询与回复的安全评估。其核心设计将安全策略作为运行时输入，部署团队可基于默认分类或自定义自然语言规则评估内容，无需重新训练模型。模型内置 fast-slow 动态推理流程：首 token 路由快速输出安全信号，需深度推理时继续生成更精确的最终判断。在涵盖多模态安全、纯图像安全、文本查询与回复安全、多语言查询与回复安全的六大基准测试上取得平均 SOTA 性能，并已开源至 HuggingFace 与 ModelScope。

Hugging Face 多模态安全/对齐开源/仓库

同一事件，精选展示《蚂蚁 inclusionAI 开源多模态安全护栏模型 SingGuard》

推荐理由：蚂蚁集团开源的多模态内容审核模型，最大亮点是运行时动态注入安全策略而不需重训，对需要灵活定制审核规则的团队是低门槛的高分工程实现。

16:06

MarkTechPost（RSS）

WorkOS 发布 auth.md：一种基于 OAuth 标准的开放智能体注册协议

WorkOS 推出 auth.md 协议，为 AI 智能体提供标准化注册流程。这是一个部署在应用域名的 Markdown 文件，告知智能体支持哪些注册流程、请求哪些权限范围以及如何获取绑定真实用户的凭证，无需人工填写表单。该协议建立在现有 OAuth 标准之上。

智能体开源/仓库部署/工程

12:28

Hacker News 热门（buzzing.cc 中文翻译）

精选70

感知图像编解码器：实用学习型图像压缩中的关键因素

苹果公司的研究探讨了感知图像编解码器，分析其在实用学习型图像压缩中的关键作用。该研究聚焦于提升压缩效率与视觉质量平衡的实际需求。

开源/仓库论文/研究部署/工程

推荐理由：苹果官方把学习型图像压缩落地时真正重要的几个因素讲透了，附带代码，做视频编码和图像传输的同行值得看。