第七期《从茶园走向世界》之楼天城——兴趣是个多臂老虎机

2021年05月21日

嘉宾简介:楼天城,2008届姚班校友,清华大学交叉信息院计算机科学博士。多次获得各种国际编程大赛冠军。现为Pony.ai联合创始人兼首席技术官和交叉信息研究院兼课教师。

01 兴趣探索犹如多臂老虎机

       从一个算法竞赛选手,到一名理论计算机科学家,再走向业界。从社交网络做到自动驾驶,是什么促使了此番转变?楼天城给我们的答案是,“要学习认识你自己,了解什么样的事情会让自己开心,爱好就像一个多臂老虎机,要每个臂多拉几下才能知道自己的兴趣所在。”

      楼天城在本科毕业后,选择继续留在交叉信息院读博,师从姚期智先生。“当时交叉信息院正在招博士生,我觉得这个机会不错,所以就没有考虑过出国了。”在博士阶段,楼天城前期做的偏向theoretical computer science(理论计算机科学),后期偏向Social Network, 最后他选择进入业界。

      楼天城说姚先生一直强调“搞研究兴趣很重要”,楼天城曾经试过量子计算,理论计算机科学,在姚先生的推荐下,他有机会和康奈尔大学的教授接触,开始进行Social Network的研究。楼天城认为Social Network这个方向跟现实生活的联系更紧密一些,“当年关于Social Network这样的顶会论文都是例如Facebook这样的大公司发出来的”,这也是楼天城选择去业界的重要原因。

     “我当时非常坚定要去工业界。我想姚先生说的兴趣的重要性的真正意思是,你要做真正有意义的、能做有贡献的事情,不局限方式。能在学术界做贡献是个非常好的事情,但是如果你看到了自己在工业界做贡献的想法和空间,这个其实也是很好的事情。”楼天城这样总结自己的选择。

       楼天城在这个问题上又谈了更多的内容,他认为除了学习知识以外,同样重要的还有发现自己的兴趣,只有有了兴趣,发展才会顺利。“比如说,在我们公司有做感知、深度学习这块的人,天天刷(训练、测试)这些模型;也有一些人做决策的,天天测试车的行为;有些人做系统、做架构,每天测系统的性能是怎样的。这三组的本质区别,是大家因为什么事情而开心。有些人可能会说模型准确率挺升了2%,感到特别开心,那么这样的人就应该去模型组,寻找一些有同样想法的人,学术界也有很多这样的人;另一些人可能因为行为改变带来正向影响,感到很开心;后来我到工业界做系统,做的系统的性能提升了很多倍,我感到非常开心。这些提升和改变在大众来看都是很有意义的工作。但是,我自己和周围的人会不会为此感到开心,是会影响自己的。”

       对于兴趣,楼天城给我们举例 “所以方向的选择,根本上是一个学习自己对什么很开心。我的做法就类似于多臂老虎机,我会每个杆子都拉一下,来学习自己。我觉得对于姚班同学来说,学习自己可能是大家可以做得更好的点,在高中时代可能大家是没空学自己的,而在高中之后大家对自己的学习可能还是做得不够。”

(注:多臂老虎机问题是概率论中一个经典问题,也属于强化学习的范畴。设想,一个赌徒面前有N个老虎机,事先他不知道每台老虎机的真实盈利情况,他如何根据每次玩老虎机的结果来选择下次拉哪台或者是否停止赌博,来最大化自己的从头到尾的收益。)

02 披荆斩棘的行业领袖

       楼天城毕业后曾在Google总部工作,从事社交网络和机器学习相关问题的研究。2016年4月,楼天城加入百度,参与无人车的技术研发。2016年底,楼天城从百度离职,与离职百度的首席架构师彭军一起创立了自动驾驶创业公司小马智行(Pony.ai)

      楼天城认为自动驾驶处于“第一个产品还没出来”的阶段,但是自动驾驶现在技术上还有很多瓶颈,“对世界理解的能力缺失,数据已经不是问题,而是建模的挑战。开车是个你需要处理好最差情况的事情,不是一个average case,我们现在对worst case的建模能力是很缺失的”。楼天城认为,自动驾驶的难点不在于控制与算法技术,真正的难点是对世界的建模能力,也就是“理解他人是怎么做事的”。

       楼天城也探讨到了关于无人驾驶的舆论与法律法规等相关事宜,他相信随着自动驾驶技术的发展,相关的法律法规也会跟进完善,而他们的成果也会让舆论相信自动驾驶技术。作为走在全国前列的自动驾驶公司,楼天城说Pony.ai会参与一些行业标准的制订和舆论的引导,“当一个公司大的时候其实也有一些责任去引导相关讨论的发展,这个也是我觉得最近需要做的事情。”

03 茶园回忆

      楼天城作为第一届姚班学生,聊起了许多在姚班的往事。楼天城告诉我们,他们是唯一一届大二招进姚班的,大家当时是先上姚先生的课,他们所有人都是因为姚先生的号召力去报名姚班。

       楼天城回忆了许多极具挑战性与乐趣的课程,“偏向编程方面的,我觉得04那一届的操作系统课程算是绝唱,04年的操作系统整个用的是MIT的对应课程的作业,当时没有前人的积累(笑),我们都是第一次做,全都是靠自己摸索,这是对编程要求非常高的一门课程。要说理论上的课的话,就得说当时的分布式系统。” 楼天城告诉我们,在这些课上他收获到了很多知识,也感到了解决困难问题的乐趣。

       除了学习生活之外,楼天城的休闲生活也很丰富多彩。他跑马拉松、玩《三国杀》、把算法竞赛当成电子游戏来打。楼天城是《三国杀》创始协会成员之一,“当时我们的桌游玩得挺多的,当年网游不像现在这么流行,也根本没有手游,所以大家往往通过桌游这样的方式来社交”。楼天城笑着说,三国杀的发展其实已经超乎了他的想象,早期三国杀其实是个交流游戏,而不是一个竞技游戏。“当时我们玩三国杀是「面杀」,也就是大家坐在一起打,有一些比较著名的行为,比如说「结怨」,就是说上一把你杀了我,那这一把首先跟你私了一遍,然后再看是什么角色。”

       楼天城说他见到学术研究中也有很多人很聪明,竞赛中也是,在天赋上大家不会有太大的差别。楼天城表示自己并不天赋异禀,相反他说,当在一个群体中发现自己并没有天赋,那只有勤奋这条路。

        楼天城最后想告诉学弟学妹 ”无论做学术还是做一些真正有意义的事情,人生发展是个积累的过程,积累这个词是很简单一个词,但其实蕴含很深意义。人生发展中不能期待任何所谓的峰回路转,所谓的奇遇,这些都是很难期许的。基本上99%的成功,都是通过日日夜夜的积累来完成,无论是学术能力,还是工业上的能力。”

 

《从茶园走向世界》校友访谈组成员:朱追,温凯越,严彬玮,刘鹏宇,郑鈜壬、谢琴