来源|The Robot Brains Podcast
(相关资料图)
翻译|沈佳丽、胡燕君、贾川
一次技术蓬勃的背后,必然需要长时间的酝酿,更离不开决定这一爆发瞬间的少数关键人物。正因有了那些特立独行的天才,他们的出现必将影响这一领域的发展方向,甚至决定未来科技发展的历史进程。
回望深度学习领域,过去的黄金十年群星闪耀。
自1956年提出人工智能概念之后,在其发展的大约60年时间里,经历了三起三落。其中,2012年,以AlexNet为代表的深度神经网络所带来的震撼性“ImageNet时刻”,让AI发展彻底突飞猛进。
(从左到右依次为Ilya Sutskever、Alex Krizhevsky和Geoffrey Hinton)
当时,经过50年的刻苦研究,时任多伦多大学教授的Geoffrey Hinton和他的两名博士生Ilya Sutskever、Alex Krizhevsky终于发现,只要借助两样东西就能让神经网络成功识别出图片中的物体:一是数据,也就是海量的图片,因此数据集对他们的研究至关重要;二是强大的计算处理能力。
2012年,他们终于集齐了这两大“利器”:斯坦福大学教授李飞飞创建的ImageNet数据集,初衷就是为了帮助人们研发出可识别图片中物体的技术,并且每一年都会举办公开比赛;另一方面,Alex发现,他写的GPU代码可以训练一个小型卷积网络,并在60秒内输出很不错的结果。
既有Hinton和Ilya、Alex这样愿意潜心做研究的人,再加上海量数据和强大处理能力的加持,可以说,神经网络技术已拥有天时地利人和。然而,当时大多数人并不相信神经网络,并质疑深度学习的原理,认为这只是一个美好的畅想,实际上毫无用处。
不过,在那一年的ImageNet竞赛上,神经网络AlexNet识别物体的准确率远超其他方法,在比赛中一举夺魁,人们由此真正认识并承认神经网络的强大。
除了展示神经网络的强大能量,Hinton和他的团队还积极地将其推广到工业领域。2013年初,以Google、微软、DeepMind、百度等为代表的科技公司纷纷加入了“收购”Hinton三人组公司DNN Research的竞拍战中,最终Google以4400万美元的“天价”将其收入囊中。
由此,AI在业界的声量愈响。在这个领域默默耕耘多年的更多守望者和开拓者走入舞台中央,尽享赞誉,更多才华横溢的新人不断涌现,为AI的发展推波助澜。
可以说,如果没有这些脚踏实地的独行侠,没有他们的坚守,就没有新一轮AI的盛宴,我们现在所从事的AI事业将无从谈起,当然,一个叫OneFlow的开源深度学习框架也不复存在。
站在深度学习崛起十年的节点上,相信依然很多人存在依然对这些问题好奇:究竟是什么让他们如此笃信神经网络和AI技术的潜力?又是什么铸就了深度学习发展的黄金十年?
在Pieter Abbeel主持的The Robot Brains Podcast节目中,以科技作者Cade Metz的《天才制造者:那些为Google、Facebook和这个世界带来人工智能的独行侠们》一书为背景,Pieter Abbeel与Cade Metz分享了Geoffrey Hinton、Yann LeCun、IIya Sutskever、李飞飞、马斯克等重要人物,以及Google、DeepMind和OpenAI等机构之间发生的鲜为人知的故事,并探讨了科技巨头和中美之间的AI人才“军备竞赛”。
从中,我们将一窥见AI浪潮崛起的脉络,以及技术创新从诞生到爆发的跌宕起伏的过程。希望身处AI领域的我们也能追随前人脚步,成就伟大。
以下是对话内容,OneFlow社区做了不改变原意的编译。
1
吴恩达:神经网络将改写Google的命运
Pieter Abbeel:过去十年,AI行业发生了转变。2012年以前,语音识别、图像识别、机器翻译、自然语言处理和机器人技术等不同领域几乎都是孤军奋战。直到深度学习开始训练大型神经网络之后,一些领域才转而开始合作,尽管仍有少数领域仍对神经网络技术存疑,但总的来说,协作态势基本形成。比如,视觉研究人员开始阅读语言类论文,语言研究人员也开始读机器人技术类论文,以从其他领域获取灵感。那时,吴恩达(Andrew Ng)在研究如何将人工智能和人脑研究相结合。
Cade Metz:这要追溯到20世纪50年代,我们想模拟大脑中的神经元网络来建立一个系统,这也是神经网络名字的由来。有意思的是,我们要告诉那些不了解深度学习的人,其实我们并不清楚人脑是如何运作的,也不知道如何根据大脑来构建系统。
人工神经网络模拟大脑,这只是一个类比,但某些人的眼光的确比一般人更加长远。Hinton等人这些年来一直相信这个类比,吴恩达也是如此。
神经网络研究在21世纪初刚刚复兴时,吴恩达在斯坦福大学就给学生说过,世界上一定有人知道怎样开展神经网络工作,那个人就是Yann LeCun。几年后,吴恩达加入了Hinton在加拿大组建的研究团队,是少数真正参与到神经网络研究的人。他和LeCun也是团队中为数不多的美国人。
随后,吴恩达将这一想法分享给了时任Google CEO兼联合创始人Larry Page,他告诉后者,神经网络技术将不仅推动语音识别和图像识别的进展,甚至将彻底改写Google的命运。他还说,神经网络技术就是在重建大脑,并且他提到了AGI(通用人工智能)的概念,即只要是大脑能够做的工作,AGI都能胜任。其实,我很好奇AGI究竟是如何运作的。
Pieter Abbeel:任何与吴恩达共事的人都会发现他很出色,他也是一位优秀的博士生导师。
2
图灵奖得主Hinton和LeCun的信念
Pieter Abbeel:Hinton也非常优秀,他能取得成功,其实不足为奇。他待人处事很好,回想我第一次见到他,他就很热情地攀谈我的研究。他居然还做过一年木匠,但又回到了伦敦转学心理学。虽然他是计算机科学教授,但并没有取得相关学位,而是只有心理学学位。
Cade Metz:Hinton在很多方面的表现都让我们感到不可思议。他在1971年提出了神经网络这个惊人的想法,那时几乎没人相信他,但他还是对神经网络有着不可动摇的信念。
Pieter Abbeel:他是在1950年代第一个提出要研究神经网络的人。当时,大家都认为神经网络不值得再去研究,但他还是毅然决定投身到这项伟大的事业。
Cade Metz:接下来的50年里,他一直潜心研究神经网络从未动摇,并且一直努力朝着新的方向前进,即使身边的人都不相信。这简直是个传奇故事。
后来,他想找一些志同道合的人一起研究神经网络,所以最终来到位于匹兹堡的卡内基梅隆大学。在那里,他和合作者取得了重大突破,至此神经网络研究迈上了新台阶。他们还提出了反向传播(back-propagation)的想法,奠定了当下神经网络的运作方式。
不过,Hinton还是离开了美国,因为他发现在美国和卡耐基梅隆大学做人工智能研究,就必须从时任总统里根管理下的国防部获取资金。但他和妻子都不想那样做,于是他们决定前往加拿大,这改变了我们今天所说的“地缘政治”。
Pieter Abbeel : 他“逃离”美国的决定为后续的发展埋下了种子,也解释了为什么我们说现代AI发展始于加拿大。
Cade Metz:我们也在思考Hinton和妻子当年离开美国的这个决定是如何影响了此后AI发展的几十年。究其原因,还是因为美国当时几乎没人研究神经网络,从事这项工作的研究人员都在加拿大或欧洲。实际上,他们夫妻俩离开美国的决定也导致“ImageNet时刻”出现后,科技巨头必须去其他地方才能搜罗到自己想要的人才。
Pieter Abbeel:你还在书中提到,当他看到人工智能能够使机器人实现分拣功能时,他将其描述为机器人技术的“AlphaGo时刻”,他说机器人已经跨越了重复式运动,实现了与实时场景的交互。
Cade Metz:确实。有趣的是,你会发现关于我们对如何步入AI时代有如此多不同的看法,甚至是相反的观点。一些人认为会通过强化学习来实现,当然,是他们将其称为“强化学习”,也就是通过不断试错来实现,这一点确实可以做到,无论是在虚拟世界还是在现实世界,通过不断的分拣练习,尝试、失败、再尝试,这种极端的强化学习方法是有用的,但在过去,系统无法实现。所以现在的系统对Hinton来说难以置信,看到他接受了这个现实,并且乐意谈论此事,真是让人高兴。
Pieter Abbeel:还记得我跟你在我的伯克利办公室见过面,当时你在为《天才制造者》这本书做一些背景调查,已经决定把Geoffrey Hinton作为新书中的主要人物了。尤其令我记忆犹新的是,你说他特别幽默。你问他,“Geoffrey和Jeff这两个名字,你想用哪一个?”,然后他回复邮件的正文是“我喜欢Geoffrey,谢谢”,落款“Jeff”。
Cade Metz:他就是这样回复我的。我一直认为像工程师、计算机科学家、人工智能研究人员这些人都很有趣,也很招人喜欢。我的父亲是一名电气工程师,同时也是IBM的程序员,是我见过最有趣的人之一。但是,人们对工程师和程序员的刻板印象是他们有些无聊和令人讨厌。
Hinton这个人非常有趣,他的话往往暗藏“深意”。当我和他交流时,我常常遗憾于没能捕捉到他言语中那些有趣的东西。我们可以讲很多关于他的技术贡献和那些曲折离奇的经历。
(从左到右依次为Yann LeCun、Geoffrey Hinton和Yoshua Bengio)
2019年,当他与LeCun和Yoshua Bengio共同获得图灵奖(2018年)时,在获奖的那天晚上,我有幸与他们交谈,当Hinton得知自己获奖时,他的反应真的很有意思。
虽然我们探讨了关于这类人的创意想法和幽默感,但同时也要明白,他们也经历了很多其他事情。Hinton身上的其它特质也让人印象深刻。
比如他的背部有疾病,但真正令人震惊的是,他平时真的不坐,也就是说,他连车都开不了,而且也不能坐飞机。这也对他应用研究成果产生了影响,要想将相关研究成果在各大公司中得到应用,他就必须要漂洋过海,但他将这一切都克服过来了,接下来才有了他获奖的场景。
此外,要知道他的妻子得了癌症,病得很重。他经历了所有的一切,他不仅会有挣扎,也会伤心和失望,这些事和他的其他成就一样令人瞩目。
Pieter Abbeel:说到Hinton,就离不开他的那些同事以及他们的工作,他们都有各自的愿景,然后为之不懈奋斗。比如Yann LeCun,在1980年代末到1990年代初,他就在神经网络研究方面取得了辉煌的成就。
Cade Metz:LeCun也极具魅力。他出生于巴黎,拥有工程师学位,在圣地亚哥西海岸做博士后,之后又在美国的卡内基梅隆大学工作。
远在法国的LeCun和Hinton有着类似的想法,他们都在神经网络领域积极探索。在两人首次见面的伟大时刻,他们一起去一家摩洛哥餐厅品尝美食。当时,LeCun会一点英语,而Hinton则完全不会法语,但他们还是成功地进行了交流,就像LeCun说的,他们之间并没有语言障碍,因为他们所说的全是关于神经网络的想法以及对这一想法的坚定信念。
另一段佳话就是,Hinton后来还担任了LeCun的博士论文导师,而LeCun最终也决定和前者一起去加拿大做他的博士后研究,之后他还加入了号称全球顶级研究实验室之一的贝尔实验室。
贝尔实验室位于新泽西州,他在那里建立了图像识别系统,这预示着20年后的“ImageNet时刻”,同时也真正彰显了图像识别技术的走向。很大程度上,Hinton及其学生在2012年使用的算法是对LeCun的算法进行了调整。
几年后,神经网络技术又一次遭遇瓶颈,导致人们再次对这项技术丧失信心。但LeCun有着和Hinton那样可贵的品质,他也坚信神经网络技术是可行的,所以周遭的质疑并不足以动摇他的坚定信念。
Pieter Abbeel:LeCun的相关论文还被学术会议给拒了,其他人并不相信神经网络的可行性。实际上,他也很难将自己的想法分享给更多人。
Cade Metz:的确如此。甚至连LeCun自己都担心是否要在论文中使用“神经网络”这个名称。考虑到大家对神经网络的敌意,最终他还是决定改名为卷积网络。
2012年,当Hinton和他的两名学生Ilya、Alex宣布研究成果AlexNet后,尽管当时仍有质疑声,但LeCun力挺他们并回击了这些质疑。
Pieter Abbeel:他最终还是证明了自己的研究方向是对的。事实上,虽然有人质疑神经网络研究意义不大,但相关研究一直在继续。并且,神经网络最终以绝对的优势击败了以往的图像识别系统。这真的很神奇。
3
IIya Sutskever与机器翻译
Pieter Abbeel:IIya Sutskever是和其导师Hinton一起加入Google的两名学生之一(译者注:2013年,Hinton与IIya、Alex三人组建的公司卖给了Google)。我觉得他的理念和对未来的远见与他的老师Hinton一脉相承。
他刚踏入Google,就已经坚信AI基本上可以做任何事情。IIya成功研发了Google构建很多年都没成功的机器翻译,这是一个非常专门化的研究。
在机器翻译之前,深度学习研究的都是语音和图像,它们都是连续的信号,比如色彩明暗和音量高低都是连续的。但文字是独立的,一个字不同于另一个字,是一些非常分散的tokens。于是很多人会说,文字是符号,需要符号化的推理,属于AI的另外一个领域,但IIya恰恰根据神经网络做出了全世界最好的机器翻译系统,在一次全球规模最大的人工智能大会上,他对听众说,成功是必然的。
用辩证的眼光看待事物,尽管没有什么是必然的,但我想他要表达的是,神经网络的应用空间非常大,相信人们也意识到这一点了。
Cade Metz:他表达的是自己的信念,相信成功是必然的,这句话也火了起来,并成为名场面。IIya的事业轨迹和吴恩达一样,都很特别。他的信心部分来源于在Google的见闻,他看到了Google求贤若渴的精神、强大的算力和雄厚的财力,所以他相信,这么庞大的团队要研发AI技术并非难事。
我也很赞同你提到的Google机器翻译这件事,主流媒体对它谈得不多。《纽约时报》报道过Google的机器翻译研究,其中甚至没有提到IIya,因为当时他已经离开Google了。没办法,世道就是这样,他主动离开了Google,于是Google就把他的名字从官方历史中抹除了。但他确实是Google机器翻译研究成功的主力。
神经网络技术在2010年、2012年相继应用到了语音识别和图像识别领域,然后人们又试图用神经网络来解决翻译问题。尽管AI已有成功应用,但大家还是怀疑神经网络是否能用于自然语言处理,结果它真的能够用于翻译。即便如此,大家也不相信除了翻译以外,神经网络还能用于别的自然语言处理。然而,2021年,神经网络真的做到了,而且它还在不断进步。
Pieter Abbeel:IIya的确对AI的未来很有信心,除此之外,实际上我认为大家开始产生这样一种认识:如果有足够的“有监督数据”,就可以将神经网络训练达到你需要的准确度。
4
李飞飞的创举
Pieter Abbeel:越来越多人也后知后觉地意识到,当初斯坦福的李飞飞教授创办ImageNet挑战赛是多么具有前瞻性,她在深度学习还没有显露曙光的时候就创办了这个比赛。某种程度上,ImageNet比赛是深度学习开始成熟的契机。
Cade Metz:李飞飞的故事也是一个顶住质疑和反对、逆流而上的故事。一开始,李飞飞的导师不支持她建立大型图像数据集,并且认为这是一个糟糕的想法。到了2012年,多伦多大学的Hinton等人在参加ImageNet挑战赛时,将错误率从25%降到了16%。如果没有李飞飞创建的ImageNet数据集,我们就不能看到这一可喜成果的诞生。她和Ilya、Hinton一样都有着坚定的决心。
Pieter Abbeel:没错,我想为不了解学术界的人介绍一点背景。通常而言,在你当上教授后的头6年,你需要先取得一些研究成果,让自己获得声望、站稳脚跟,否则就会面临被辞退的风险。如果你在这6年做得不错,就可以晋升为终身教授,拥有学术自由,想做什么研究都可以。所以,很多人会在头6年先做一些比较有确定性的事,比如研究公认的重大课题,6年后再去做风险更大的研究。
但在李飞飞做教授的那6年里,哪怕周围的人都告诉她,创建数据集是在浪费时间,还不如好好写其他热门方向的论文,她还是坚持自己的想法,认为自己的研究很有价值。她很了不起,行业内的很多了不起的人都是不惧质疑、坚持自我,他们是对的。
Cade Metz:完全同意。像李飞飞这样有勇气对导师说“我明白你的意思,但我还是想这么做”的人,这类故事很值得被报道传扬。各行各业都需要这种精神,作为记者我也深有体会:随大流去报道那些所有人竞相报道的事件很容易,但报道那些没人追踪的、让同行倍感犹豫甚至质疑的事件却很难。在任何领域,坚持自我都是一个宝贵的品质。
5
DeepMind的征途
Pieter Abbeel:2016年,研发出AlphaGo的DeepMind公司非常亮眼。
Cade Metz:我经常被问到有关AlphaGo的问题,因为DeepMind带着AlphaGo在韩国对战李世石的时候,我作为旁观者很荣幸也在现场,那是我人生中最难忘的几个星期,非常不可思议。有些人可能不知道,计算机科学和AI领域的研究者一直想要构建一个可以破解围棋游戏的系统。
在这之前,1990年代末,IBM开发的“深蓝”计算机打败了国际象棋世界冠军Gary Kasparov,当时我也在纽约见证了这一刻。但之后过了十多年,我们还没有研发出可以打败人类顶尖选手的围棋AI。2015年,DeepMind提出研究围棋AI的时候,业内的普遍看法是,这还得再花几十年才能成功,因为围棋的复杂性比国际象棋要高出好几个量级。
但DeepMind还是决定这么做,Ilya Sutskever也参与了,但这是另外一个故事。DeepMind面临巨大的质疑,但当他们在Nature杂志上发表文章称,他们的系统在一场非公开比赛中打败了一位非常优秀的围棋手,那可以说是一个历史性时刻。
Pieter Abbeel:那是一个巨大的惊喜。但还是有很多人提出质疑,“哦,那不过是欧洲的棋手”。
Cade Metz:有人觉得那名棋手的世界排名不够高,“如果再往上挑战世界顶尖棋手,这个系统肯定就赢不了”。
这些质疑有一定道理,当时的系统的确不够出色,还不能打败世界顶尖棋手。但是他们忘记了一点,这个系统是从数据中学习围棋技术的,从它打败那位欧洲冠军樊麾(法籍华裔围棋手),到他去往韩国挑战统治世界棋坛近十年的李世石,中间只隔了短短三个月。期间,DeepMind在不断地训练这个系统,它还在不断进步。
在韩国,距离那场人机大战开始还有几个小时的时候,我和DeepMind的创始人之一Demis Hassabis坐在首尔四季酒店的餐厅里,Eric Schmidt(Google前CEO)也在场。我问Demis,很多人都不看好你们,你觉得你们会赢吗?他回答说,这个系统会不断地学习,终有一天,它会超越人类。从这场谈话开始,接下来在首尔度过的一整周让我毕生难忘,不仅仅是因为DeepMind研发的这个了不起的系统,还因为当时整个韩国都高度关注这场对战。
Pieter Abbeel:当时我们也都聚在伯克利的AI实验室,边吃披萨边看这场比赛的直播。所有人都十分期待,其实我们对围棋一窍不通,得听解说才知道谁占上风,但我们就是聚精会神、紧张又激动地盯着比赛。
Cade Metz:不仅是实验室的你们感到激动不已,韩国所有人的状态都和你们一样,因为围棋是韩国的国民级项目,他们的国宝级选手和机器之间的对战想必也是举国瞩目。这就是当时的盛况。
作为人类,在面对有可能会超越人类选手的机器时,我们都会自然而然地站在我们的同类李世石这一边,如果你是韩国人的话更是如此。当看到AlphaGo赢下第一局,大家都震惊了,到它连赢两局时,整个韩国都弥漫着压抑的气氛,那是一种作为人类体会到的深深的挫败感。后来,李世石在第四局以“神之一手”扳回一城,令所有人为之一振。
Pieter Abbeel:AI在机器翻译、语音识别和图像识别方面的能力很强,可以高效地帮助人类。这些任务难度都很大,但AI却不觉得难。可是围棋就不一样了,AI和人类都觉得下围棋很难,可AI还是打败了人类,这就有趣了。
Cade Metz:围棋不但难,它同时也是一个大家都能理解的事物。假如是机器翻译的话,可能并非所有人都能理解AI取得了什么进展,因为不是所有人都懂翻译,也就无法判断AI做得好不好。但围棋有一个简单直观的结果,那就是输赢。
所有韩国国民,还有中国的6000万直播观众,都能直接从AI的胜利结果更直观地感受到AI的强大,美国民众对AI的态度也出现了转变,因为这个里程碑式的比赛结果就摆在眼前。
除了AlphaGo,AlphaFold也是DeepMind的一项成果,本质上是生物科学中的一项药物开发技术,它将人工智能运用于蛋白质折叠研究,这也再次印证了AlphaGo的成果,他们成功研发出这个领域的人们认为在几十年后才会出现的成果。
6
OpenAI的诞生
Pieter Abbeel:加州门洛帕克市瑰丽酒店是很多风险投资人以及创业者聚集的地方。你在书中写到了马斯克和Sam Aldman(创投机构Y Combinator前总裁)在一次晚宴上(译者注:时间应为2015年7月)的谈话,他们都说了什么?
Cade Metz:那天的晚宴上,马斯克迟到了一小时左右才到场,Ilya Sutskever也在,当时还有不少公司想挖他。在听过一些演讲后,在座的人都清楚地看到了AI行业的趋势,他们都在思考怎样利用这种趋势,比如,他们相信AI可以实现很多东西,也想发展AI,那么在Google和Facebook等大公司已经大力押注AI,斥巨资吸引人才的情况下,其他公司还能把自己的AI实验室做起来吗?有人认为做不起来。
那天,当Greg Brockman(现任OpenAI总裁)和Sam Altman离开晚宴后,便驱车回到了旧金山,与马斯克一举创办了非营利性人工智能组织OpenAI,希望与DeepMind一较高低。这也是一件好事。
Pieter Abbeel:OpenAI和DeepMind的初衷不一样吧?
Cade Metz:是的。OpenAI宣布成立时,声称要向全世界公开分享他们的研究成果,这一点是Google旗下的DeepMind做不到的。
Pieter Abbeel:从很多方面来看,OpenAI的成立都实属不易,因为已经有不少公司在这条赛道上投入了大量的人力和物力。但是,Greg Brockman和Sam Altman还是这么做了。
不过从另一个角度讲,OpenAI也可能杀出重围,因为在此之前没有任何一家公司愿意分享他们的技术和成果,从而让AI公平地惠及所有人,毕竟其他公司都是以盈利为目的。正因如此,Greg和Sam可以吸引到志同道合的人才,还聘请了Ilya Sutskever担任他们的首席研究员。于是OpenAI异军突起,成为可以制衡那些大公司的力量。它似乎很快就取得了成功,虽然不是一夕成名,但成长速度令人惊叹。
Cade Metz:Ilya是OpenAI的一大核心人物。当我看到他加入时,我就意识到OpenAI是认真的。但有没有他的加入,OpenAI能否成功,这在当时都是个未知数。
Pieter Abbeel:他真的是行业里的香饽饽。他在Google已经很成功了,设想一下,如果是你的话,大家都想挖你,你就会面临艰难的抉择。
Cade Metz:有了Ilya的加入,OpenAI就可以吸引更多的人才,OpenAI需要人才,所以它也算是求“人”得“人”了。一开始,它大概只有9个研究员,但Ilya起到定海神针一样的作用。这个行业里不断有类似的故事发生:一群信念坚定的专业人才,最终成为众多公司争相竞逐的对象。
Pieter Abbeel:AI是一个非常新兴的领域,但很多公司还是沿用传统的方法开发AI。很多抢手的AI人才都是博士生。当然,Ilya是一个例外,他已经在Google任职过一段时间,还是OpenAI的首席研究员,但其他人才都还需要完成博士学业。而OpenAI找到了这些还没有和任何公司建立就职意向的在读博士,并且聘用了他们。太不可思议了。
Cade Metz:在科技界的人才军备竞赛中,通常只有那些赫赫有名的大牛才可以赚到大钱,比如Hinton和LeCun这些经验丰富的专家。但在AI领域,刚毕业甚至还没毕业的博士生也容易引起企业的关注,并且拿到高额薪资。
Pieter Abbeel:他们不仅仅只是拿大钱,他们也能办实事。很多那些人人向往的突破性成果都是由这些博士生取得的。虽然是学生,但他们站在研究的最前沿,推动着行业在创新方向上前进。
我记得有一次这些AI博士生在我位于伯克利的实验室开讲座,有不少人对他们的研究感兴趣,所以我特别想请他们来我们实验室当教员或是博士后研究员。然后OpenAI宣布已经聘请了他们,当时我就想,完了,被捷足先登了,他们都去了OpenAI,跟马斯克、Sam Altman、Ilya Sutskever、 Greg Brockman这些牛人共事,肯定不会来我们这儿了。说实话,我自己甚至都想去OpenAI工作。
Cade Metz:这些博士生人才里有Ian Goodfellow(译者注:刚刚从Apple跳槽去了DeepMind)。
Pieter Abbeel:Goodfellow在酒吧获得生成对抗网络(GAN)灵感故事可太传奇了。
Cade Metz:GAN让机器可以生成以假乱真的图像。可以说给神经网络增加了一个颠覆性功能,以前只能识别图像,现在还可以生成图像。他想出的实现方法也很巧妙:需要两个神经网络,一个负责生成图像,另一个负责评估图像并将错误报告反馈给第一个神经网络,如此往复,直至生成的图像可以“以假乱真”,非常有趣。这是他在蒙特利尔的酒吧里喝到醉醺醺时的灵光一闪,然后回家继续思考怎么实现。
Pieter Abbeel:他在OpenAI刚成立几个月时就加入了。
Cade Metz:扎克伯格还曾亲自邀请他加入Facebook,不过当时他还没完成博士学业,还在等LeCun抽空当他的毕业论文委员会成员。
7
AI寒冬和神经网络坚守者
Pieter Abbeel:尽管AI技术在不断发展,但为什么我们还是会如此恐惧AI冬天的到来?以及为什么人们不喜欢用“神经网络”这个术语?
Cade Metz:这又需要回到1950年代。当人工智能这个词在50年代末被创造出来时,那群人确信自己会重建大脑或者至少重建大脑可以做的任务,而且大众也普遍相信他们的说辞。当时,《纽约时报》的新闻称,Frank Rosenblatt正在研发第一个神经网络——感知器(Perceptron),他告诉《纽约时报》自己将建立一个系统,该系统可以识别图像、识别语音并自动生成语音。此外,未来该系统能够在装配线上自行组装,甚至它将进入太空。《纽约时报》反复报道了这件事。
这种情况在过去几十年里反复出现,在硅谷也屡见不鲜。当一些技术研究和技术发展出现并做出一些美好的承诺时,人们都乐于相信它们,媒体也会大肆宣扬,这时就到了炒作的地步。
但当大家发现这项技术并未实现它的承诺,炒作热度就会退去。紧接着,众多相关实验室都会遭遇撤资困境,这意味着大家对这项技术彻底丧失信心,所谓的“寒冬”便真正降临了。但是,万事万物都是一个循环,技术炒作会再次来袭,之后大家又会开始抨击,就这样周而复始。很多时候,我们都在一遍又一遍重复着过去发生的事。
Pieter Abbeel:这也解释了为什么当时有些人对神经网络反应平平。因为一些技术曾经过度承诺,至少在当时那些承诺难以实现。如果这种情况再次出现,我们的资金或将再次枯竭,那时我们将无法继续任何人工智能研究,因为大众对人工智能的憧憬已然消耗殆尽。
Cade Metz:我同意你的观点。但这不仅仅是过度承诺的问题,其实“人工智能”这个名字也有误导性,会让外行人对技术产生一种虚幻的假象。当人们听到人工智能,就会联想到可以像人一样做任务的系统,神经网络则会让人们认为大脑已经被重新创造出来了,但事实并非如此。
我们所说的只是狭义的人工智能和神经网络。当我们谈论图像识别、语音识别、自然语言处理时,我们指的都是狭义的概念。所以,如果把它们称作神经网络其实会误导大众。这也就是为什么我理解大众在2012年会对神经网络持怀疑态度。作为一名记者,我的工作是勇于质疑和发问;作为学者,我们也应该而且必须这样做。所以,这并不是为了贬低那些不相信神经网络的人,他们有理由不相信,毕竟神经网络在很多方面仍不奏效。
Pieter Abbeel:只有真正的天才方能让神经网络运作起来。虽然神经网络当时并不可行,但它的背后始终有一群坚守者,尽管疑声滔天,缺乏实证,但他们摒除周遭质疑,砥砺前行,坚信这项技术在不久的将来终会实现。终于,有一天他们真的做出了一番成绩,这时众人才吹捧他们是如此具有前瞻性。这就是故事的精彩之处。
我认知里的人工智能是极其复杂的,尽管其他人可能有不同看法。我认为,人工智能研究需要研究人员秉持强大的进取心,即他们立志于实现真正的人工智能。当你研究人工智能时,并不意味着你已经建立了完善的人工智能系统,而是需要你努力将其完善,但这项工作绝非易事。
Cade Metz:你说得对,尤其那些并非从事人工智能领域的人需要明白这一点。人工智能工作也需要研究人员拥有强大的进取心。
8
马斯克与Larry Page的分歧
Pieter Abbeel: 你在书中提到了一个小趣闻:马斯克曾睡在Larry Page(Google联合创始人)家的沙发上,这是真的吗?
Cade Metz: 我确定这是真的。这个消息来自Ashley Vance写的马斯克的传记(译者注:书名《硅谷钢铁侠》),他是我的好朋友和前同事。在我们行业,新闻报道对象都会谨慎地选择自己信任的记者,所以Ashley是获得马斯克信赖的人。我很敬佩他能挖到这么有意思的故事。Larry和马斯克的关系很好。
(马斯克与Larry Page)
Pieter Abbeel:但Larry和马斯克对AI的看法很不一样,他们的分歧不在于是否同意“成功是必然的”,也不在于狭义的AI系统本身,而在于AI的长期发展。
Cade Metz:Larry很乐观,但马斯克却觉得AI可以产生威胁。这两种态度基本上代表了行业里的两种声音,也可以折射出硅谷的总体现状。
毫无疑问,保持乐观没什么不对。如果你要创业,一定要乐观,要相信自己的理念,这样才能吸引人才和投资,这也是硅谷创业界的基本法则。关于你的创业想法,你不应该过多谈论它的失败后果和局限性。随着你的公司发展壮大,公开上市后,就会有公关团队来帮你营销。慢慢地,你的公司就会变成只对外展示光鲜的一面。
Pieter Abbeel:Google用AI做了很多很好的事情,也在不断改进他们的AI系统。
Cade Metz:我们聊过很多AI取得的成就,但AI技术存疑的地方太多了。所以Hinton等人的理想主义和这些公司乐观的目标和愿望是相抵触的,这些问题我们也要好好考虑。
9
AI界人才的“军备竞赛”
Pieter Abbeel:吴恩达为Google带去了神经网络的火种,然后他们启动了大量的研究工作。当然,神经网络最大的突破还是来自Hinton和他的学生,之后,Google、Facebook、微软都意识到AI已经成熟了,Hinton带来的是真正划时代的成果,他们纷纷参与竞拍Hinton师生三人成立的初创公司,并将他们收入麾下。然后,Facebook聘请了LeCun。可以说,这扣响了AI人才“军备竞赛”的发令枪。
Cade Metz:人才就是武器。2012年,数据和算力都不再是问题,可唯独缺少深度学习人才。即便经过我这么多年的调查,至今仍觉得这些科技巨头入场深度学习的过程很不可思议,他们不但从理念上接受了这个概念,而且投入了大量财力,真的是押上了全部身家。
Hinton竞拍自己公司的时候,基本上已经为深度学习人才奠定了一个基准价格,这类人才的价格真是天文数字,但即便如此,你还是觉得他要价再高也不为过。因为当时全世界也没有多少人真正相信深度学习,所以人才极度短缺,供不应求,因此任何深度学习从业者都可以在薪资、股票、签约费上随意开价。
Pieter Abbeel:深度学习人才真的太少了,所有公司都在争夺他们。有意思的是,Facebook聘请了LeCun后,他又招募了一些人才,而Google聘请了Hinton师生之后,整个业内就没剩下多少人才了。但突然间一个刚成立不久的新公司冒了出来,DeepMind的CEO和联合创始人Demis Hassabis竟然在人才紧缺的情况下招募到大批AI研究员,我记得有70个左右,这真是太让人惊讶了。
Cade Metz:即便是很关注这个行业的人大概也没想到,当时DeepMind只是一家名不见经传的小型初创公司,它的成立时间跟Hinton公布研究成果的时间差不多。要知道,当时AI界没人看好深度学习,但DeepMind这家来自伦敦的小公司却以迅雷不及掩耳之速招揽了所有的深度学习人才,甚至没有一个巨头及时反应过来。
结果也很有意思,Google和Facebook等科技巨头也开始对深度学习感兴趣了,这就让DeepMind的处境非常尴尬。毕竟大公司财力雄厚,DeepMind要怎么留住这些人才?DeepMind要么把自己卖给Google或其他巨头,不然就要面临被“挖墙脚”的风险。2014年,Google就以6500万美元的价格收购了DeepMind。
Pieter Abbeel: 那时DeepMind没有营收、没有产品、没有发展蓝图,唯一有价值的资产就是人才。
Cade Metz:DeepMind一开始在做一个产品,后来放弃了。DeepMind研发的AI甚至还能玩Atari游戏,尽管实际效用不大,但这是一个了不起的成果。不过归根到底,Google看中的还是DeepMind的人才,而不是产品。
Pieter Abbeel: 入场的不止有Google,DeepMind的早期投资人是Peter Thiel(PayPal创始人&著名风险投资人)和马斯克等人,当时基本上还没人意识到深度学习的重要性。当然,马斯克当时就已经是科技界的大人物了,但他那么早就注意到并且参与了深度学习,这一点还是令人惊讶的。
Cade Metz:这也是一个很有意思的线索。的确,Peter Thiel的资金奠定了DeepMind的发展基础。后来马斯克也加入了,他拥有无可比拟的宣传影响力。他相信DeepMind所说的AGI(通用人工智能)理念,也就是建立和人脑功能一样的机器系统。以DeepMind联合创始人Shane Legg为首的一群人开始担心AGI拥有这种能力之后可能会毁灭宇宙。
马斯克抓住这个争议,开始告诉全世界说DeepMind马上要造出这种“可怕”的AGI了。就像20世纪50年代在Frank Rosenblatt身上发生过的故事一样,媒体开始大肆宣扬这一点,极大程度地宣传了AGI,我把这种做派称为“反向炒作”。
Pieter Abbeel:没错,马斯克将AGI比喻成终结者,这是一种高效的宣传方式。七年前他开始这样说,当然我们现在知道了,以七年前的AI技术谈“AI威胁论”简直是天方夜谭,但与此同时,在更狭窄的应用层次,AI开始在语音识别、图像识别等领域发挥作用。我个人认为,AI技术真正趋于成熟的标志是可以应用到多个专业领域。
有人认为,目前全世界最强的围棋选手出在中国。现在DeepMind已被Google收购,Google的AI做得很好,很多产品在美国备受追捧,但却不能卖到中国。Google曾经有一项战略,希望以新兴的AI技术浪潮为切入点,先在中国办一场围棋人机大赛,以此在中国市场扩大知名度,但后来的结果似乎不尽如它所愿。
Cade Metz:Google没有获得它希望得到的结果,这是我采访他们的最高层获得的信息。韩国人机大战的第二年,我又去了中国,虽然中国也很关注AlphaGo,但情况却很不一样。Google认为,AlphaGo在韩国的胜利大大地宣传了Google,所以他们希望在中国“故技重施”,从而进一步开拓中国市场,但结果却不尽如人意。因为中国政府反应过来了,开始思考要不要支持Google这家美国公司,允许它在中国进行公关宣传。
Pieter Abbeel:虽然Google没有在中国市场获得成功,但许多中国公司实际上很擅长独立开发AI技术。中国人现在能体验所有Google所能提供的AI技术,而这些技术的研发者是中国公司,而非Google。至少现在看起来是这样。
Cade Metz:确实。我比较感兴趣的是,当前媒体上很多人对此都理解错了。实际上,中国并不是对当前的发展情景一无所知。当Hinton带领的队伍在ImageNet挑战赛将错误率从25%降到16%时,百度就已经嗅到苗头。我们一般认为,美国是人工智能领域的领头羊,但实际情况却很复杂,中国和百度从一开始就参与到了人工智能当中。
这是一场全球性的革命,并非只有美国科技公司参与其中。人才不止在美国,还在其他地方,中国从一开始就有AI领域的相关人才,比如陆奇(前百度总裁、微软全球执行副总裁)等等。人工智能领域的主角绝不止美国一个,真是太有趣了。
(本文已获得编译授权,原视频:https://www.youtube.com/watch?v=vvy_jcArbhY)
其他人都在看
CUDA优化之PReLU性能调优
Jeff Dean:深度学习的黄金十年
25倍性能加速,OneFlow“超速”了
一个GitHub史上增长最快的AI项目
DeepMind爆发史:决定AI高峰的“游戏玩家”
解读Pathways(二):向前一步是OneFlow
OneFlow v0.7.0发布:全新分布式接口,LiBai、Serving等一应俱全
欢迎体验OneFlow v0.7.0:OneFlow · GitHubOneFlow has 87 repositories available. Follow their code on GitHub.https://github.com/Oneflow-Inc/oneflow