清华大学2023年特等奖学金评选结果于今日公布。交叉信息院姚班本科生戴言凭借丰硕的科研成果、优秀的综合素质,荣获2023年清华大学特等奖学金。让我们一起走近戴言同学,聆听他的成长故事。
当卢旺达基加利国际会议中心从晨光中苏醒,清华大学交叉信息院本科生戴言已抵达会场,展示自己强化学习理论的最新科研成果,这篇成果首次在稀疏线性老虎机问题中实现了最优常数级别的遗憾值保证,而这只是他科研经历中的冰山一角。
本科期间,他不仅平均学分绩达3.99/4.00,还在国际顶尖学术会议中发表六篇第一作者、共同一作论文。当问及他的动力源泉,戴言说:“解决困难问题总是吸引着我,而科研更令我兴奋。因为,在科研中,我不仅可以做一名解题人,更可以做自己的出题人。”
图:戴言在卢旺达ICLR会议展示论文成果
科研初探
但对于这位曾经的亚太信息学奥赛(APIO)满分、全国信息学奥赛(NOI)金牌得主来说,“解题”和“出题”并非一帆风顺,曲折有之,艰辛有之,所幸急湍险滩让步于不懈泅渡。他的导师黄隆波老师介绍说:“戴言在大一年级加入了我的课题组,两个多月后就开始撰写论文了。”戴言忆起当初,坦诚地说:“大一刚进组时,组内分享的很多专业论文我很难全看懂。课程上,我也曾感到有一些课难以理解,课后大作业有时也无从下手。
图:戴言竞赛获奖证书
对算法的兴趣令戴言顾不上焦虑沮丧,而是越挫越勇,尽情吸收着可以触及的知识。导师黄隆波老师回忆说:“我们组会上讨论的议题很宽泛,但无论是与理论还是实践相关的内容,戴言都会认真听,并能提出有意义的问题,这是难能可贵的。”同组的博士生李卓然对戴言印象深刻,补充说:“他成长得很快,没过多久就在讨论中展现出对问题具体条件、具体设定的深刻理解。”
戴言表示:“科研和课业上的挑战让我很兴奋,总想着如何攻克它们。为了攻关,科研上我找各种机会与师兄交流,课业上我利用每个课间与任课老师交流。靠着‘蚂蚁啃骨头’式的积累,我逐渐形成了自己的知识体系、找到了自己的节奏,并着手探索第一篇论文。”
图:黄隆波老师与戴言在特奖答辩现场
没想到,这次探究未能如想象中那样顺利。戴言笑着说:“这篇论文历经波折,将近一年半才中稿,是我发稿用时最长的一篇。”这篇文章聚焦强化学习中反馈延迟问题,给出了一个能够在几乎任何强化学习问题中处理反馈延迟的通用算法框架。导师黄隆波老师说:“这一篇的工作量相当大,戴言从头到尾都扮演了很重要的角色。”戴言回想这篇文章的投稿过程,表示:“我觉得当时的技术和结果都很有趣,主要原因是写作不够成熟。好的论文写作应该能让读者看到意义、获得启发。”
图:戴言的“第一篇论文”在ICML会议展示
学术遨游
初尝科研的魅力后,戴言迅速进入科研状态。他在黄隆波老师的指导下,完成了两篇与多臂老虎机鲁棒性问题相关的研究。同时,他主动联系了校外导师美国南加州大学罗海鹏老师,并对马氏决策过程进行了探索——这是多臂老虎机的“带状态”版本,是一个更复杂、但也更实用的问题模型。
图:戴言与罗海鹏老师在ICML 2023合影
戴言回忆说:“我曾经读过多篇罗老师组里的论文,感到他们做的工作很扎实、很有挑战性,我就很想参与其中。于是我发了邮件表达合作意向,没想到罗老师欣然接受。合作期间,我们几乎每天都通过邮件交流。因为有时差,我往往睡一觉起来就能读到罗老师的回复,这是科研中很温暖、快乐的事情。”
进入大三,戴言通过交叉信息院的春研计划,赴麻省理工学院、华盛顿大学进行了为期共7个月的学术访问。交流期间,他联系了Suvrit Sra教授,尝试了深度学习理论的科研领域。也与Simon Du教授对稀疏线性老虎机问题进行优化。这两篇论文分别发表于计算机领域顶级国际会议ICLR和NeurIPS。
图:戴言拜访Suvrit Sra和Simon Du
科研对戴言来说是快乐的源泉,他说:“计算机理论研究让我感到很有趣。一次做项目时,我突然感到,做科研就像搭积木,我所掌握的技术就是一块块积木,而这些积木的拼接过程没有说明书,创造性的探索让人乐趣无穷。”
通过学术交流他也拓展着自己的认知边界,戴言回忆说:“春研时,我的一位合作者来自韩国,他不仅科研做得好,还拿了全美体操奖项。科研组里也有一位师兄擅长健美和钢琴。这让我觉得做科研的同时,也要多看看不同的人在做什么,总能从中获得很多启发。”
图:戴言与春研研究组合影
张弛自如
对于如何平衡科研、学业和生活,戴言的锦囊妙计是“自律”。他说:“我会按照重要性将任务排列,一件一件解决。不管我有什么事情没做完,到了晚上十一点半左右,我都准时睡觉。规律的作息让我精力更集中,做事也更高效。”
熟识戴言的徐艺浈同学对他的自律程度记忆犹新,她说:“我们都是南京人,在每次从北京南到南京南将近三个半小时车程的高铁上,戴言能够用至少3个小时专心地看论文,这点我真的很佩服。”
图: 戴言在北京环球影城
戴言也一直践行着“无体育,不清华”的理念,在体育项目上屡创佳绩。他不仅是校游泳队的首批非体特成员,曾在清华马约翰杯比赛中获得100米蝶泳冠军,也是院里游泳俱乐部的创始人。与戴言同班的梁敬勋同学说:“戴言在任游泳俱乐部负责人时,会很频繁地组织活动,也会考虑到不同基础同学的需求。”梁敬勋翻出了当年的活动记录,上面详细写着面向零基础、提高区、深水区同学的学习计划和安排。
图:戴言游泳照片及其奖项
而体育对戴言来说也是一个与世界产生联结的方式。他作为清华大学学生水球协会骨干,曾与队友一起在全国大学生水球锦标赛中夺得亚军,也在麻省理工的校内水球比赛中获得冠军。戴言说:“我在春研时参加了麻省理工的校内水球比赛。最终,我们队伍惊险战胜了两支硬实力和我们差不多,甚至比我们强的队伍,获得了 MIT 校内水球比赛(IM League)第一名。”
图:戴言与MIT水球队队员合影
这些佳绩的背后是持之以恒、坚持不懈的训练。徐艺浈同学说:“他每周四的下午都会失联3-4小时,前2个小时是游泳队的训练,后2个小时是水球队的训练,强度还是相当大的。结束训练后,他会指着运动手表上的数据告诉我:‘我一共游了多久、多长距离,你看这个数据是平的,就是在打腿。’这是他的分享方式,我也很乐于聆听。”
在科研和游泳之外,大家感到戴言在生活中还是个很暖心的人。他的舍友刘文瑄同学说:“戴言总会主动了解我们遇到的问题。一次我写的代码在评测系统中输出不稳定,很久都找不出原因。戴言发现后就和我一起研究、推理,最后成功解决了困扰我很久的难题。”徐艺浈同学补充说:“戴言做事总是很细心、考虑周全。他的背包里大到水杯、雨伞,小到充电宝、创可贴,什么都有。和戴言出去玩,我几乎只需要带手机就可以了,他的书包就是一个小百宝箱。”
行向未来
图:戴言摄于午后荷塘
走出清华特奖答辩现场的聚光灯,戴言从中央主楼望向远方蔚蓝色的天际。他感到,特奖、毕业都只是开始,期待未来崭新的题目。导师黄隆波对戴言充满信心,他笑着说:“这个家伙没问题,他一直都很成熟。”研究组里的学长学姐真诚地说:“他未来会做出更多高质量的工作。”
一切过往,皆为序章。这位卓越的出题人、解题人、生活达人即将踏上新的旅程,去实现自己“智”存高远,“言”必行之的诺言,用坚持与热爱扬起踏实、严谨、无私、拼搏的风帆,找寻“更好的自己”,力图实现“真正的智能”。
“言”语
"我更愿意用“探索”来形容在清华姚班的本科阶段。专业必修与选修课,帮我们探索学科内的大方向,初探各领域的发展历程。讲座、科研、实习,助我们探索未来发展,找到令自己心动的事业。课余的文体活动,让我们探索业余兴趣,尝试平衡工作与生活。祝愿各位学弟学妹们,能在本科阶段自由探索,发现自己的热爱,追随自己的兴趣,走出属于自己的路。"
—— 戴言
人物简介
戴言,清华大学交叉信息院姚班本科生。曾获清华大学特等奖学金、国家奖学金、“一二·九”奖学金、清华大学综合优秀奖学金、Yao Award(姚奖学金)金奖、商汤人工智能奖学金等。因科研成果突出,曾入选“星火计划”十六期,入选国家自然科学基金“青年学生基础研究项目”资助名单。曾任计科02班学习委员、交叉信息院游泳俱乐部创始人、泳队队长,获清华“马杯”游泳比赛乙组100米蝶泳冠军、全国大学生水球锦标赛甲组亚军(团体)。
清华大学特等奖学金设立于1989年,是在校本科生和研究生的最高荣誉。自2005年开班以来,姚班先后已有7名同学获得清华大学本科生特等奖学金,包括鬲融(2007)、贾志豪(2012)、吴佳俊(2013)、陈立杰(2016)、乔明达(2017)、徐海珂(2021)、戴言(2023)。
采编 | 姜月亮
审核 | 吕厦敏