吕雪广

强化学习,多智能体系统

研究兴趣

吕雪广目前在清华大学任博士后研究员。其研究聚焦于强化学习与机器人大模型,关注智能体的记忆结构、泛化能力及长时序推理机制。研究目标是将强化学习的理论框架拓展至多模态与开放环境中,推动具备稳健认知与推理能力的智能系统发展。

Email

TOP