李飞飞,现在是AI圈内外一个人尽皆知的名字。
她是斯坦福大学终身教授,HAI(以人为本AI研究院)院长,新晋独角兽World Labs创办者,具身智能、空间智能多项前沿AI技术引领者,以及改变深度学习命运的ImageNet的创造者。
她(可能)也是AI领域地位最高的华人,不论是从学术,还是产业影响力,她的门生桃李,正在全面影响着AI的进程,包括她没那么正面评价的“AGI”……很多人关注李飞飞的过去,更多人则期望这个从成都走出的华人女性未来有更大的成功,甚至给了她“AI教母”的称谓。
即便她跟Hinton一样,不是AI“科班出身”。
被物理学迷妹改写的AI进程
李飞飞最开始学习的专业是物理学,她的偶像是爱因斯坦。
在2024年诺奖影响下,物理学和AI之间的关系变得奇妙,但在1995年不是如此。
1990年代,Hinton的反向传播算法为神经网络补全最后一块拼图,LeCun在卷积神经网络上的突破证实演算法能在现实世界中运作。
但是人工智能依旧处于寒冬时代。在计算、数据等方面的制约下,神经网络的能力无法完全释放。
李飞飞与人工智能的第一次直接接触,是大二暑假去UC伯克利分校担任一项实验的项目助理。
这是一项探索大脑运作机制的实验。在去之前,李飞飞一直担心自己没有生物学背景,不能被研究团队所接纳。
但意料之外,这是一项要从计算角度研究大脑的实验。希望通过截取猫大脑的信号,来重建猫看到的影片。最终这项研究被发表在了《神经科学期刊》上。
这为李飞飞人生中几乎最重要的选择埋下伏笔。
1999年,当李飞飞从普林斯顿大学物理系毕业后,面对来自华尔街诸多诱人的offer,在家人的支持下李飞飞遵循本心,选择做科学家。
但是做什么样的科学家?
在UC伯克利的实验让她看到了智能的奥秘,也让她意识到,钻研视觉或许是解开智能奥秘的关键。
因此在硕士阶段,李飞飞奔赴加州理工学院,师从计算机视觉专家Pietro Perona教授和Christof Koch教授,并行研究神经科学和计算机科学。
如果一定要计算,2001年,李飞飞才正式开始学习人工智能。
这时距离她人生中影响力最大的工作——ImageNet被提出,只有5年。
2009年6月,至今仍是世界上最大的图像标记数据集ImageNet发布,让李飞飞和她的团队一跃成为CV领域最耀眼的明星。
简单理解,这是一个精选的互联网图像数据集,共计1500张图片,涵盖22000个概念、对象类别概念。
如此规模与形式,放在当下不足为奇。但是在演算法占据AI领域主导地位的2006年,ImageNet更像是一个怪想法。
一方面,当时的人工智能领域尚处于寒冬之中。演算法是主流方向,大家都在做一些复杂的网络,数据被认为不过是一种训练工具。
如果把机器智能比作生物智能,演算法就像是突触,或者说是大脑里错综复杂的线路。因此,最重要的莫过于使这种线路变得更好、更快、更强大。
另一方面,ImageNet从被提出开始,就是冲着大规模去的。李飞飞从WordNet上找到灵感,参考这个大型词汇数据库,她希望从图像维度建立起一个“人类意义地图”,那么ImageNet将拥有几万个类别。
这个规模放在当时是不可思议的。彼时,一个模型能辨认一、两个类别就已经很了不起了。
这么做有必要吗?用这么多图像训练一个模型要花费多少时间?会有人用吗?以及背后巨大的工作量,给每一张图像加上标注又需要多少时间?
因此,当李飞飞带着ImageNet的想法与同事讨论时,往往孤掌难鸣。
以及这个计划对李飞飞自己的前途也将产生颇多影响。被她尊称为“学术祖父”的Jitendra Malik就曾劝导她,尽管ImageNet是电脑视觉所需要的,但是科学的窍门是跟着领域一起成长,而不是跑在领域的前头。
他说如果我这样做,可能很难获得终身教职。
但从最纯粹的学术角度来看。李飞飞意识到,当时的机器学习有些停滞不前,大家都在做更复杂的模型,却没有足够的数据来驱动机器学习。用更行业内的话来说,泛化上存在问题。
她在自传中写道:生物智能不像演算法那样是被设计出来的,而是演化的结果。而演化不就是环境对生物的影响?现代人类的认知,不是承载了无数代祖先生活、死亡与不断适应的印记?
现在人类能够立刻辨认出一种物体,得益于此前的感官刺激。对应来看,自然图像就是数据。
所幸,这种认知还是有人认同。
在普林斯顿,李飞飞遇到了“第一位知音”——李凯教授。
李凯教授是1980年代的留美高材生,拿到了耶鲁大学全奖录取通知书。师从世界上第一位图灵奖获得者Alan·Perlis,博士毕业后来到普林斯顿大学任教并成为计算机系终身教授,也是当时普林斯顿计算机系教职员工中仅有的华人面孔。
遇见李飞飞时,李凯已是微处理器架构的顶级专家,他擅长把数百万个纳米级电晶体组成全世界最精密的装置,是高效廉洁微处理器与大容量存储装置的先驱。也曾在硅谷创业,研制出世界上首款商用重复数据删除产品,并在后来被易安信收购。
李飞飞自述中说,李凯教授即像她的母亲,很知性;又像她的父亲,很会自我解嘲。是个看上去不苟言笑、衣着朴素,但实则又温暖慷慨的人。
他成为了当时极少数看好李飞飞的人之一。
李教授比大多数人都了解指数思维的威力。他相信我正在追求某个重要目标。
由于所在领域的交集不多等因素,李凯没有直接参与ImageNet计划。但他为李飞飞提供了两项重要帮助:捐赠一组初始工作站;引荐得意门生邓嘉,后来他更为人熟知的身份是ImageNet第一作者。
由此,在2007年的普林斯顿,ImageNet正式启动了。
此后大约3年时间里,李飞飞师徒二人都投身于此。其中面临的困难自不必说,工作量巨大、鲜有人看好、烧钱……
2009年,李飞飞已经带着邓嘉和绝大部分学生来到了西海岸的斯坦福后,ImageNet才终于完成第一版,并在CVPR上正式亮相。
之后为了进一步推广ImageNet,李飞飞开始举办ImageNet挑战赛。这个比赛邀请全球学者通过ImageNet进行对象识别,让不同的算法能够在同一基准下进行比较。
即便如此,ImageNet产生的影响也还很有限。
直到2012年,时间线开始收紧,Hinton与李飞飞的故事终于发生交集。
有一天夜里,邓嘉突然给李飞飞打来电话。一向内敛冷静的学生,语气激动:我们看到了一份与众不同的作品。
这就是AlexNet。
后面的故事开始变得更为人熟知。凭借着惊人的准确率,AlexNet重新证明了神经网络,也开启了人工智能第二轮浪潮。
再后来,Hinton带着Ilya、Alex完成拍卖,自己加入谷歌;Ilya加入OpenAI担任首席科学家,推动了GPT早期版本、DALL·E系列、CodeX、ChatGPT等技术诞生。
变革的齿轮加速转动。
那么,李飞飞呢?
在ImageNet大获成功后,李飞飞的AI之路变得顺畅。
2012年,她拿到斯坦福终身教职,晋升为副教授。于2013年开始领导斯坦福人工智能实验室。
期间,她还利用学术假期加入谷歌云人工智能暨机器学习的中国中心团队。这时是2016年,深度学习革命开启之年。
之后,2017年1月-2018年9月,她出任谷歌副总裁,并兼任谷歌云AI/ML首席科学家。
2018年9月,李飞飞宣布返回斯坦福任教,并任斯坦福以人为本人工智能研究院(HAI)院长,同年晋升为终身教授。
2020年,李飞飞当选为美国国家工程院院士、美国国家医学院院士;2021年当选为美国文理科学院(艺术与科学院)院士;2021年11月当选为IEEE Fellow。
与此同时,从李飞飞实验室走出了数十位学生弟子。他们中诸多人物,亦为AI发展带来深刻影响。
高徒群星闪耀
执教快20年,李飞飞带出了一大批高徒,宛如群星闪耀——
其中我们熟知的,有OpenAI创始成员Andrej Karpathy、英伟达科学家Jim Fan和朱玉可,以及上海交大教授卢策吾、前Google AI中国中心总裁李佳、前阿里自动驾驶掌舵人王刚……
带卡帕西时,当时他正读研二,李飞飞对这位身材欣长、说话速度颇快的学生评价是:
他有工程师般的勇气和毅力,不论是在白板上写满方程式,还是拆解电晶体收音机,对他来说都轻轻松松。
如果说爱因斯坦、波尔是宇宙的梦想家,那么卡帕西属于爱迪生或莱特兄弟一类的人。
她给团队和卡帕西布置的任务是:输入一张图片,最终能自动输出文字说明。
卡帕西第一次交的作业,看起来确实完成了。但是她指出,这项作业主要靠“匹配”已有数据来完成,无法应对新情况,也就是不具备泛化能力。
遭受挫折的卡帕西,整个人瘫倒在座位上。看到他如此,李飞飞还插空提醒:
卡帕西和许多学生都有种常见的问题:一心在意自己的模型是否有效,却忘了去问它为什么有效。
不过好在沮丧过后,卡帕西身上的“工程师特质”开始发挥作用。
虽然这时候没人知道他实际应该如何达成目标,但我知道,他心里那个工程师跟我一样会坚持下去。
他肯定做得到。
果然,他最后成功了……
读博期间,他还亲自设计并主讲了一门名为「CS231n:用于视觉识别的卷积神经网络」的课程,成为斯坦福授课深度学习的讲师。
这门课一直广受好评,非常火爆。
拿到博士后,卡帕西面对多种职业选择(当时普林斯顿大学愿意直接给他一个位子),最终却选择跳出学术界,毅然加入当时还名不见经传的OpenAI。
对此李飞飞还劝了一番,不过卡帕西一心认准了OpenAI:
这真的跟其他地方都不一样。
后来的事大家都很熟悉了,他曾二进二出OpenAI,看起来颇有量子纠缠内味儿了(doge)。
2016年,他作为研究员加入OpenAI(也是联合创始人),领导早期GPT系列、Dall·E系列以及ChatGPT等模型开发。工作1年零6个月后,被马斯克挖去了特斯拉,领导自动驾驶的计算机视觉团队。
而特斯拉也在卡帕西和另一位负责硬件的Pete Bannon领导下,最终推出了FSD。
直到2023年2月,他再次回归OpenAI,当时Sam Altman还发推表示欢迎。在近1年时间里,他建立了一个小团队,负责改进GPT-4,然后就又离职了……
而他的下一站,也是创业。
今年7月,他宣布创办Eureka Labs,一家AI原生的新型学校。
其首个产品,也是首门课程LLM101n(老本行了)。
手把手带你构建一个类似ChatGPT的故事生成大模型,以及配套的Web应用程序。
除了卡帕西,李飞飞的自传新书中,斯隆奖得主邓嘉更是被多次提及。
邓嘉于2006年本科毕业于清华大学计算机系,随后赴美国普林斯顿大学师从李凯教授攻读博士学位。
2007年,他被导师李凯推荐给李飞飞,辅助ImageNet的研究。
2009年,当ImageNet发表时,邓嘉为第一作者。
对于邓嘉,李飞飞评价他含蓄内敛:
从来没有见过头脑这么好,却完全不露锋芒的人。
直到2017年李飞飞宣布停办ImageNet之前,邓嘉一直在帮忙运营ImageNet项目。
博士毕业后(2012年毕业),他于2014年开始担任密歇根大学计算机科学与工程系助理教授。
仅干了4年,他又回到了普林斯顿大学。目前是该校计算机科学副教授,领导普林斯顿视觉与学习实验室。
值得一提的是,他还获得过2018年斯隆研究奖 (Sloan Research Fellowships)。
该奖代表了当今(美国和加拿大地区)最有前途的科学研究人员,自1955年设立以来诞生过众多诺贝尔、菲尔兹奖获得者。
当然了,在李飞飞执教早期,还有两位学生不得不提:前Google AI中国中心总裁李佳、前阿里自动驾驶掌舵人王刚。
李佳,1998年进入中国科大自动化系学习,曾获得新加坡南洋理工大学硕士学位。
2016-2010年,李佳师从李飞飞攻读博士,在此期间还有一段师徒佳话。
因为李飞飞先后在UIUC、普林斯顿和斯坦福任教,所以李佳也跟着3换学校、3考博士(每一次都成功了),是李飞飞最自豪的学生。
毕业后,她于2011年加入雅虎,两三年后成为资深研究员,开始领导雅虎实验室的视觉计算和机器学习部门。在此期间,她获得LEAP、Master Inventor等公司内部奖项,并获得雅虎公司最高奖Super Star奖。
2015年2月,她新加入了Snapchat,成为公司研发负责人,职责是开发核心CV/AI技术并为产品提供创新支持。
此时的Snapchat,已明确了IPO计划,一旦成功,将是Facebook上市以来,美国科技公司最大的一桩。
按理说没有人会在此时选择离开。
但导师李飞飞一召唤,李佳就在2016年9月离职了,师徒二人前后脚加盟谷歌。
谷歌期间,她们发布了多个AutoML新产品和Contact Center AI集虚拟助理,并推动谷歌AI中国中心建立。李佳也出任谷歌AI中国中心总裁,帮助提升谷歌在中国的影响力。
结束在谷歌的使命后,师徒二人再次前后脚离职,中间仅相隔50天。
这一边,李飞飞重返斯坦福,而李佳则考虑在AI方向上创业。
她先是在StartX担任联创