# 基于点互信息的推理强化学习反自蒸馏方法

- 来源：AK (@_akhaliq)
- 发布时间：2026-05-20 23:51
- AIHOT 分数：67
- AIHOT 链接：https://aihot.virxact.com/items/cmpe96j2x0ajkslk1pgo274no
- 原文链接：https://x.com/_akhaliq/status/2057127004214882534

## AI 摘要

基于点互信息的推理强化学习反自蒸馏方法

## 正文

Anti-Self-Distillation for Reasoning RL via Pointwise Mutual Information
