日报标题:人工智能界的大牛李飞飞加入谷歌,巨头们正在争抢人才
本周二,谷歌宣布斯坦福大学教授 李飞飞加入其云团队。作为第一代中国移民,这位图像识别领域的杰出学者是如何从普林斯顿进入斯坦福,最后成为谷歌人工智能团队新任领导者的?让我们来了解一下这名华裔学者的传奇经历吧。
实现美国梦
李飞飞出生于北京,后来在四川长大
如果你真想做一件事,全世界都会来帮你。16 岁刚来美国的那两年,李飞飞却只能从依靠自己开始。在帕西悉尼的白人圈子中,这位亚裔姑娘显得有点孤独,她像所有极客一样过着简单的生活。那个时候打工与学习几乎占据了她所有的时间。李飞飞明白,这就是普通新移民的生活,需要点牺牲和决心。幸运的是她的同学和高中数学老师在这时给了她莫大鼓励和帮助。
1995 年,李飞飞进入普林斯顿大学攻读物理学,生活的大门终于渐渐为她打开。在周一到周五,她是普林斯顿物理系拿着高额奖学金的高材生,周末则必须回到 Parsippany 的洗衣房,置身于成堆的衣服中。她说「我爱普林斯顿。」因为这里有全世界最优秀的年轻天才。
然而生活的艰辛也在随着年龄增长,她见过斯坦福的优秀博士毕业生为一张绿卡四处奔波,那时的她不明白也无法想象一张绿卡,一个留在美国的机会能难倒全世界那么多优秀的人才。
有过移民经历的人对平等有着更加深刻的体会,李飞飞也如此,她坚持主张高科技产业性别平等,支持种族多样化,还有反对特朗普。她曾在 Twitter 上调侃特朗普是个不懂科学没有眼界的人。
李飞飞说:「多样化的危机,也正是我们的社会正在应对的危机。『科技是没有灵魂的吗?』」她坦承自己对 AI 研究界的失望,因为这一领域不太欢迎不具代表性的少数群体。在她工作的部门里一共有 15 名全职人员,她是唯一的女性。
梦想与责任
并不是每个美国移民都能实现自己的梦想,但李飞飞做到了。当初她随父母举家搬到大洋彼岸。「他们来到这个国家是为了追求梦想。」李飞飞认为她也「应该能够追求自己的梦想。」这个「应该与能够」的选择做起来并不轻松。
1999 年,李飞飞从普林斯顿大学毕业,那时的华尔街一片辉煌,互联网泡沫的热潮接近顶峰,李飞飞接到了多家金融公司的工作邀请。然而她却没有从中选择任何一份工作来减轻家庭经济负担。她的父母支持她做出了最后选择,去西藏研究藏医。
虽然李飞飞知道自己终将回到学校,回到科研工作中来,读博士也是她的梦想,但西藏之行并非人生插曲。
在科学界藏医与中医一样存在很多争议,但这并不妨碍李飞飞对它的兴趣。她在媒体采访中提到,作为一个科学家,藏医可以在哲学和方法论层面上给她给多的理解。她非常看重具体科研项目在更大领域范围内的意义,每一项研究开始之前都要经过深思熟虑。
她曾经放弃高盛的 offer,追随梦想来到西藏
在李飞飞后来写给博士生们的信中可以看到她对科学探索的态度:
每个领域的每一篇论文都应该以独特的新视角进行研究。所以当你在机械地开展你们的工作前,请扪心自问——『我的研究会重新定义这一领域的未来吗?』这意味着发表论文的意义不是『这个方向没有人写过』,或者『让我来解决这个小问题,它的成果会很容易展示』;研究意味着『如果我做了,这一重大问题就有了更好的解决方案』,『如果我做了,我就真正开拓了这一领域』。你的研究成果应该能被很多人和行业直接使用,换句话说,你的选题应该有很多『客户』,你的解决方案应该是他们想要的。
西藏归来之后,李飞飞开始了加州理工的博士学业。博士期间母亲接连患上了癌症与中风,那是一段艰苦的日子,李飞飞说,「我们经历了很多困难,然后一起挺过来了。既要担起生活的责任,又要对得起自己的梦想」。
改变图像识别方向的人
是什么吸引谷歌一次性将李飞飞和她的门生李佳一齐请进公司,并委以重任的?显然是她的学术成就和影响力。
自 2009 年以来,李飞飞一直担任斯坦福人工智能实验室和斯坦福视觉实验室的负责人,并成为了终身副教授。在她 2014 年的简历上,有 95 篇在 Nature、PNAS、Journal of Neuroscience、CVPR、ICCV、NIPS 等顶级期刊与会议上发表的文章;联合发表的文章有 32 篇。从 2015 年到 2016 年,李飞飞署名发表的论文有 33 篇(斯坦福视觉实验室),还有一篇将在 2017 年发表在 CSCW 会议上。
在不就之前,艾伦人工智能研究所推出了以人工智能为基础的免费学术搜索引擎 Semantic Scholar。我们使用该引擎生成了李飞飞的论文引用量图解(注:搜索时请注意名字输入格式,Feifei Li 为另一位作者。),如下:
过去 3 年,李飞飞论文的平均引用量为 6738。
基于可用数据,Semantic Scholar 估计李飞飞的引用量在 33215 到 44773 之间
回溯过去,李飞飞在计算机视觉上的研究已经花费了 15 年。
在 2007 年,李飞飞和一位同事着手开始一项庞大的任务,为来自互联网的十亿张图片进行分类、打标签,从而为计算机提供样本。其中理论基础是如果机器观察到足够的事物,它们就能够在现实世界进行识别。
他们使用亚马逊 Mechanical Turk 这样的众包平台,邀请了来自 167 个国家的 5 万人帮助为其中的数百万张图像打标签。
最终,他们建立了 ImageNet 数据集。今天,这个数据集包含了使用日常英语标记的超过 1400 万张图像,跨越 21,800 个类别。
在我们用 Semantic Scholar 生成的图解中发现,李飞飞被引用最多的论文就是她于 2009 年在 CVPR 上发表的《ImageNet: A large-scale hierarchical image database》。
李飞飞 TED 演讲李飞飞在 Ted 中的演讲
瓜分学界人才的科技巨头们
谷歌的云业务负责人 Diane Greene 在新闻发布会上说,李飞飞和李佳的加入是谷歌正式将人工智能集团业务正式化的一部分。此后,该团队不会只专注于人工智能研究,而是致力于将尖端技术融入各种 Google Cloud 产品,例如让公司预测销售情况的软件。
而在宣布成立人工智能集团之前,谷歌还围绕着云服务部门产品路线图发布了一系列产品,介绍了他们如何扩大机器学习的使用。对于云计算来说,机器学习是一项关键的技术,它能训练大规模的 AI 网络,不断自我学习和提升。
Google Cloud 及其机器学习团队的产品经理 Rob Craft 也表示,这两名研究者将帮助谷歌「将机器学习的力量带入其他行业」,他们也将成为谷歌整合其研究单位及核心业务努力的一部分。
Google Cloud 数据中心
但是,雇用具有机器学习和相关任务专业知识的人才并不便宜。这一行业内的激烈竞争导致谷歌这样的大公司经常会支付「NFL 球员签字费」级别的巨额资金,而越来越多的顶级学界研究人员也陆续加入了大公司的怀抱。
近年来,学界内重所周知的大牛们基本被科技巨头筛了个遍,方式也是各种各样。
最初,谷歌先是收购了多伦多大学的一家初创公司 DNNResearch。但实际上,这家公司只有三个成员,Geoffrey Hinton 和他的两个刚毕业的、曾经赢得 2012 年的 ImageNet 大赛的学生——Alex Krizhevsky 和 Ilya Sutskever(现在加入了 OpenAI)。
如今被称为谷歌最成功一笔收购的 DeepMind 也是竭尽全力的在挖空英国的人工智能人才。前几日 Business Insider 的一篇文章指出,牛津大学与剑桥大学最优秀的人工智能人才一直在被科技巨头收拢。
而且在文章中重点提到,虽然微软和 Facebook 这样的美国科技巨头也正在招募牛津大学的研究生和教授,但是 DeepMind 似乎比其他的公司挖到的人才更多。DeepMind 从被谷歌收购了之后就已经把它的团队规模从在国王十字路时的 100 人扩大到了大约 250 人。
不只是谷歌,以美国、中国为主力的科技巨头们正如同「风暴之眼」一般吸纳着一切尽可能的能量推动着公司在人工智能道路上的快速发展。
微软在人工智能研究中一直处于第一梯队,在 9 月底宣布组建 5000 人规模的专注人工智能的工程和研发团队 Microsoft AI and Research Group。
之前我们觉得已然落后了的苹果,在 10 月份拉拢到了 CMU 机器学习教授 Russ Salakhutdinov 作为该公司人工智能研究的负责人,开始招聘人才、组建团队。
中国的 BAT 三巨头。百度因为有吴恩达,「声音」是最大的,我们对他们的人工智能研究也是了解最多的(开源深度学习框架 Paddle、硬件基准测算工具 DeepBench 等)。
阿里在今年的云栖大会上也「秀」了一把人工智能。
腾讯也在最近成立了腾讯 AI Lab,新一轮的招兵买马不可避免。虽然在机器之心的专访中他们对腾讯 AI Lab 没谈到太多内容,但隐隐可察觉出腾讯也要像谷歌一样在人工智能与自己的平台和产品结合上打通一条道路。
在接近尾声的 2016 年,我们已经明显感觉到人工智能、机器学习、深度学习等字眼成为了科技界的主流。从害怕 AlphaGo 之后因过度炒作而经历新一轮寒冬,到语音识别、神经机器翻译等的一个又一个的技术突破,再到越来越激烈的人才竞争,一个新的时代即将到来。