# 强化学习引导大语言模型推理能力提升

- 来源：AK (@_akhaliq)
- 发布时间：2026-04-15 23:50
- AIHOT 分数：39
- AIHOT 链接：https://aihot.virxact.com/items/cmo08u6az008zsli2pqctm577
- 原文链接：https://x.com/_akhaliq/status/2044443270114115608

## AI 摘要

KnowRL

通过强化学习与最小充分知识指导来提升大语言模型的推理能力

论文: https://huggingface.co/papers/2604.12627 https://t.co/vnNFqXJ8hY

## 正文

KnowRL

Boosting LLM Reasoning via Reinforcement Learning with Minimal-Sufficient Knowledge Guidance

paper： https://huggingface.co/papers/2604.12627
