来源时间为:2024-11-12
您正在使用IE低版浏览器,为了您的雷峰网账号安全和更好的产品体验,强烈建议使用更快更安全的浏览器
此为临时链接,仅用于文章预览,将在时失效
发私信给李雨晨
地平线余凯,站在中国智驾的历史路口
本文作者:
2024-11-1211:39
导语:地平线的背后,不仅承载了余凯作为“科学家”的理想,而是一批深度学习学者与工程师的共同历史使命。
过去十年的创业者中,既有“书本智慧”又有“街头智慧”的人很少,地平线的余凯是其中一个。
100多篇学术论文、NECLab主任和百度IDL常务副院长的经历塑造了多维的余凯。他跟雷峰网(公众号:雷峰网)说,2015年决定创业时,自己就觉得计算机视觉这门学科是个过渡形态,最终会转换成Robotics(机器人)。
“干汽车的原因是想干机器人,汽车是机器人的一种形态。但现在汽车是最大的根据地,有了这个才能谈未来。”
在很多人的眼里,余凯仗义、能扛事、情商高、格局大,是一个终极目标明确的人——做智能机器人时代的大脑,让每一辆汽车、每一个电器都具有环境感知、人机交互决策规划的能力,让机器服务人类。
这是余凯个人长期主义中的底层支撑,让他在创业危机来临时能壮士断腕、保留生机,也能在机遇来临时大胆押注、不留退路。
每一代企业家的成功,离不开那个时代年轻人的最大追求。地平线的背后,不仅承载了余凯作为“科学家”的理想,而是一批深度学习学者与工程师的共同历史使命:靠自己的双手,做出一家像Wintel那样底层科技创新的中国企业。
余凯的硅谷往事在决定创业之前,余凯最广为人知的是其学术成就。
在学术界,余凯担任了多个顶级国际会议如NIPS、ICML、SIGIR、KDD、IJCAI等的程序委员会成员,并在JMLR、TPAMI、MLJ、TNN、TKDE等知名杂志以及美国国家自然基金NSF担任专家评委。
作为为数不多的华人学者,他还是ICML和NIPS两大机器学习国际会议的领域主席(AreaChair),可见他在国际学术界的地位和影响。
余凯是江西南昌人,在南京大学完成本硕学位,2004年7月获得了慕尼黑大学计算机系的博士学位,毕业后在德国西门子中央研究院工作。
2006年,余凯来到NECLab,那时的NECLab相当于是神经网络研究的大本营。
余凯加入时,深度学习还没有重新火起来,支持向量机(supportvectormachine)才是当时的主流。除了支持向量机领域,NECLab同样有一批做神经网络的大牛。因此,这里有很强的深度神经网络的积累。
YannLecun曾经有一段时间也是NECLab机器学习部门的负责人。2002-2014年一直在NECLab工作的VladimirVapnik在支持向量机领域的地位与今天的GeoffreyHinton之于深度学习不相伯仲。
2010年,已经成为NECLab主任的余凯与黄煦涛合作,把林元庆、朱胜火、杨铭、吕凤军等人,UIUC的实习生杨建朝、周曦、曹亮亮、王孝宇以及罗格斯大学的教授张潼集中到一起,参加了全球顶级图像识别大赛ImageNet。
那段时间,在加州大学伯克利分校的计算机视觉教授TrevorDarrell的推荐下,贾扬清也加入NECLab作为实习生,在余凯和黄畅的指导下开始从事深度学习研究。
一些年以后,周曦创办了云从科技,王孝宇联合创办了云天励飞,曹亮亮后来成为苹果VisionPro机器学习负责人,杨建朝成为字节跳动硅谷AILab的负责人,贾扬清因为深度学习框架Caffe而名扬天下。
(2017年,贾扬清、余凯与李沐,从左往右)
ImageNet挑战赛由斯坦福大学、Princeton大学和VisualGeometryGroup(VGG)联合主办,被看作计算机视觉研究和人工智能进步的关键标志。
2010年,来自世界各地的学术界和工业界计算机视觉研究者的35个程序参加了比赛。每个参赛者收到了被标注过的120万张训练图像和其可能分属的类别列表,参赛程序的任务是对每张图像输出正确的类别。
后来余凯自评,他进入工业界之后的第一件漂亮事儿,就是成为ImageNet挑战赛的首届冠军。
能从35只竞赛团队中脱颖而出来之不易,因为此时的NECLab正处于心猿意马、团队动荡的关键时刻,2009年金融危机的影响仍在持续。
即使是在学术界名望很高的黄煦涛,也忧于筹不到足够经费来培养博士,只能无奈催促学生们尽量早点毕业。NEC找到团队里颇有号召力的余凯,希望找到一个实验室的接棒人。
余凯是一个天生的领导者和组织者。他经常在家里组织聚会,大家甚至怀疑每周末全硅谷的华人科学家都聚在了他家。
2009年末,余凯觉得自己有责任把NEC的力量重新凝聚起来。他设下两个目标:向业界证明能够吸引最顶级的人才,做出世界上最优秀的成果。
余凯亲自面试,招进来两个大神。一位是黄畅,清华本硕博毕业。他本科时就对图像识别很有热情,但直到博士毕业时,他还没想清楚图像识别如何在工业界大规模应用,就先去了南加州大学做博士后。后来,黄畅重燃对工业界的兴趣,经朋友引荐找到了余凯。
在余凯眼里,黄畅是个天才,在人脸识别领域的研究是世界一流。另一位是印度人ManmohanChandraker,包揽多个最佳论文奖,余凯评价他是“3D视觉做得最好的一个”。
余凯作为NECLab的“家长”,为实验室创造了很好的研究条件。他揽下大部分杂活,经常出差、跑项目,把实验室与总部的关系维系得相当好,经费很充裕。余凯还与学界和业界建立了广泛合作,对外交流很活跃,比如与吴恩达等学界研究者合作论文,受邀去斯坦福大学授课。
所以,从这点来看,余凯从一开始就不是一个典型的科学家。他的内心柔软但意志坚定,愿意并且善于处理人际关系。如果没有他,NECLab的荣光可能在2009年就要黯淡下去。
(2016年时,余凯和NECLab旧友们的聚会)
时间到了2012年春节前夕。
这个时候,李彦宏在北京约见了余凯,邀请他回国。余凯毅然结束了硅谷六年生涯,回国加入百度,成立多媒体部,开始研究语音识别和图像识别。
此前,百度在AI方面的研究积累几乎为零,余凯加入后,百度才率先注入深度学习的基因。余凯在短短几个月里,为李彦宏布道了深度学习的潜力。
李彦宏一次次受到震撼,甚至给全公司的产品经理发信,要求他们必须重视深度学习这门技术。深度学习的另一代名词神经网络也开始在国内传开,百度首先养活了国内最早一批做数据标注的公司。
不过,真正让李彦宏下定决心重仓深度学习的,是2012年12月余凯代表百度参加的一场竞拍失利。
2012年,GeoffreyHinton团队研发出的神经网络AlexNet在ImageNet上一举夺冠,在世界范围内引起轰动,余凯向雷峰网说到,“全世界没有人比我更震惊,因为我是第一届的冠军,我知道准确率从75提升到85意味着什么。于是,他立即给Hinton发去一封邮件,表达想要合作的迫切期待。
这封邮件启发了Hinton在当年NIPS大会上发起一场秘密竞拍,吸引了全球四家也是如今在AI领域大名鼎鼎的领头羊:谷歌、微软、百度与DeepMind。竞拍中,DeepMind和微软先出局了;后来百度和谷歌一直出价到最后4400万美金,Hinton觉得再拿更多的钱,自己良心就过不去了,喊停了竞拍。
(余凯和GeoffreyHinton的“同框”,图源:Wired)
余凯判断,只要谷歌一直和百度出价一样,Hinton肯定去谷歌。因为Hinton来中国的话,就只认识自己一个人。
不过,这次竞拍让李彦宏亲自看到了世界级公司愿意为三个人(Hinton团队,包括Hinton和其两位学生)出这么多钱,意识到深度学习的前景与落后的危机。
次年1月,李彦宏即筹备成立了全球第一家以深度学习命名的AI实验室——百度深度学习研究院(IDL)。李彦宏亲任院长,余凯担任常务副院长,这也拉开了中国深度学习的序幕。
(余凯在IDL早期的照片)
余凯是百度IDL早期的实际运作者。在他的影响下,百度吸引了一大批杰出AI科学家,如飞桨平台的创始人徐伟、黄畅以及后来百度研究院院长林元庆。
百度的“少帅计划”最初由李彦宏提出,目的是吸引年轻人才,余凯主力游说了李沐(后亚马逊AI首席科学家,现大模型创业公司Boson.ai创始人)、李磊(后字节跳动AILab总监)、顾嘉唯(现物灵科技CEO)加入。
中国最早的自动驾驶项目诞生在IDL。陶吉、倪凯等自动驾驶创业者,都是余凯当时为该项目招进去的第一批员工。
余凯邀请吴恩达加入百度是一个机缘巧合。
2014年2月余凯去美国出差,入住靠近斯坦福的PaloAlto的Sheraton酒店,当天正巧吴恩达也来该酒店,两人两年时间没见面,就在游泳池边聊了许久,意犹未尽,晚上又约在酒店的餐厅聊了一次。
当时吴恩达在做coursea,余凯隐约感到吴恩达不是很顺利,就跟他说,你与其搞教育,还不如回到真正打动你的、你的passion所在的地方,就是AI。这句话吴恩达听到了心里,就聊开了,余凯说百度愿意为他敞开大门。
后来3月份,余凯就安排吴恩达在北京与李彦宏见面,5月份吴恩达入职。
李沐在百度时,余凯还跟李沐讨论过一个项目,余凯认为百度的语音、图像、视频等都是整体关联的,可以训练出一个大的模型,肯定会很有用。这个想法其实就是今天类似ChatGPT这样的大模型,只可惜当时他们没有真正去做。
原因一是资源投入太大,二是当时余凯看到百度没有开源PaddlePaddle的意愿,就建议李沐在外面搞一个开源的深度学习平台。——这正是MXNet的源头之一。
在一个周末,余凯把李沐约到清华科技园的一个咖啡馆,跟李沐说,开源深度学习平台是一个很值得尝试的方向,后来李沐跟陈天奇等人就开始了合作。
实际上,在关键的职业选择上,不少同事都愿意听听余凯的意见。
比如,原来字节跳动的AIlab总监李磊。
2015年,余凯从百度离职后,李磊给余凯打了个电话,让他出出主意。李磊是一位出色的学者,获得美国计算机学会数据挖掘委员会SIGKDD最佳博士论文之一(第二名)。此外,李磊也是ACL2021最佳论文的合作著作者之一。
余凯对李磊说,”你选择推荐算法,应该去字节。”
2015年,字节还不是什么重要的大公司,但余凯敏锐地预判到字节日后的潜力。当时,余凯正在去跟投资人开会的路上,他用了两个小时的时间,把李磊劝到了字节。
在李磊之前,余凯还将陈雨强引荐给了张一鸣。陈雨强师从人工智能领域的顶尖学者杨强教授,专注于迁移学习领域的研究,在百度,陈雨强是跟余凯配合最紧密的人。
传闻孙剑要离开微软亚研时,余凯找孙剑吃了个饭,问孙剑愿不愿加入地平线。孙剑觉得地平线干硬件,就不太想去。
孙剑开玩笑说,“我在西安交大读本科时,寝室有个人搞硬件。我们每天都是晚上睡得很香了,他半夜才回来。”
从NEC到百度IDL的经历能看出,余凯已经具备对未来技术演化的预判能力,当然,他对于干硬件的“苦逼”这件事,已经有了充分的心理预期。
(一个有趣的现象是:74-76年与84年左右出身的学者,是中国深度学习浪潮的两波重要推动力量。余凯在NEC、百度两段“带头”的产研经历,与后继者们衍生了很多历史轶事。感兴趣的读者,可