吕雪广-清华大学交叉信息研究院

强化学习，多智能体系统

吕雪广目前在清华大学任博士后研究员。其研究聚焦于强化学习与机器人大模型，关注智能体的记忆结构、泛化能力及长时序推理机制。研究目标是将强化学习的理论框架拓展至多模态与开放环境中，推动具备稳健认知与推理能力的智能系统发展。