AK@_akhaliq

39

2026-04-15 23:50·78天前

AI 摘要

KnowRL 通过强化学习与最小充分知识指导来提升大语言模型的推理能力论文: https://huggingface.co/papers/2604.12627 https://t.co/vnNFqXJ8hY

KnowRL

Boosting LLM Reasoning via Reinforcement Learning with Minimal-Sufficient Knowledge Guidance

paper： https://huggingface.co/papers/2604.12627

AK@_akhaliq · X

2026-04-15 23:50·78天前

AI 摘要

KnowRL 通过强化学习与最小充分知识指导来提升大语言模型的推理能力论文: https://huggingface.co/papers/2604.12627 https://t.co/vnNFqXJ8hY

KnowRL

Boosting LLM Reasoning via Reinforcement Learning with Minimal-Sufficient Knowledge Guidance

paper： https://huggingface.co/papers/2604.12627

x.com