# 多模态智能体推理的探索性策略优化

- 来源：AK (@_akhaliq)
- 发布时间：2026-05-28 23:29
- AIHOT 分数：55
- AIHOT 链接：https://aihot.virxact.com/items/cmppnwvke01ueslvy775uwg6s
- 原文链接：https://x.com/_akhaliq/status/2060020565906235710

## AI 摘要

多模态智能体推理的探索性策略优化

## 正文

Agent Explorative Policy Optimization for Multimodal Agentic Reasoning
