# ProRL：基于修正策略梯度的主动强化学习推荐

- 来源：AK (@_akhaliq)
- 发布时间：2026-05-28 23:21
- AIHOT 分数：48
- AIHOT 链接：https://aihot.virxact.com/items/cmppnwvke01ufslvy7makw1qf
- 原文链接：https://x.com/_akhaliq/status/2060018606608359909

## AI 摘要

ProRL

通过修正策略梯度估计实现主动推荐的有效强化学习

## 正文

ProRL

Effective Reinforcement Learning for Proactive Recommendation via Rectified Policy Gradient Estimation