余凯:百度研究院副院长,深度学习实验室主任

从无到有,

创建百度深度学习实验室;

从零到一,

践行中国自动驾驶实用论。

对话余凯:百度自动驾驶原型车年内路测

2015.03.26
记者王珺

余凯说,并不是每个人都能像他那么幸运,从事的工作领域与自己的兴趣100%吻合。所以他愿意将自己的精力都投入到人工智能之上。

谈起技术发展,他逻辑分明,条理清晰;说到行业趋势,则会提出一些很有意思的观点。务实的人就可爱在这里,身处局中而不迷,清楚地知道想要什么,要做什么,还缺什么。

——编者按

Q=创客记者

A=余凯

中国的自有原生性创新正在崛起

——“我们基本上是最早进入机器学习领域的几个中国人之一。”

Q

您为什么选择了深度学习这个研究方向?    

A

最开始完全来自于我的兴趣,让机器具有智能,人工神经网络可以识别、思考,这个是很酷的事情。这些事情从本科一直开始做,博士论文方向是做了机器学习。那个时候参加国际会议没有几个中国人,我们基本上是最早进入机器学习领域的几个中国人之一,到今天从大趋势来看机器学习可能是计算机行业最热门的学科,从学术界到工业界都有巨大的影响,无论大小公司,机器学习的人才炙手可热,但那个时候不是这样的。      

Q

在美国的时候是在NEC研究院工作,后来为什么会选择百度?    

A

在美国的时候百度猎头打电话给我,然后到北京面试了一次,跟李彦宏聊了半个多小时就敲定了。那个时候我觉得是一个转折点,百度是中国公司里面最有技术基因的一个公司,对技术本身显得比其他公司更加的重视,到今天为止。百度在那个时候,因为他本身是一个大数据公司,数据怎么转化成价值?在两年前的时候,特别是面临移动互联网这么一个转型,对技术更加的重视,百度从上到下这么一个战略决策。    

Q

大家的普遍认知是,中国科技公司都是在学习美国,技术也是别人先做我们跟风,怎么去理解中国企业的创新?    

A

没错。这个事情,本来是无可厚非,它是一个必然阶段,但是我们也看到,自有的原生的创新,这个趋势正在慢慢起来,无论是说在商业模式上,还是技术上,中国都越来越多。比如说在技术这一块,百度对于深度学习人工智能都很重视和投入。在很多其他公司没有认识到这个事情重要的事情,我们自己投了很多资源。    

2013年1月份,我回国8个月的时候,宣布要成立深度学习研究院,在那个时候国际上面没有几个公司做这方面的事情,在中国无论从公司还是从学术界没有一家做这个。到了今天,我们能看到已经遍地开花了。      

Q

您之前的学习工作经历,对您到百度最大的影响是什么?    

A

第一是视野。什么叫视野?视野就是在大家都不看好、都没有看到的时候,你跟你的几个朋友看到了。在2006、2007年,即使在美国也没有很多人认为深度学习是一个很大的方向。

第二是资源。比如说我们刚到百度的时候,要在国内招聘深度学习的人才,但是大学、高校都没有培养这方面的人才,我们只能去靠自己的圈子影响力,到国外去把认为比较好的人招回来。    

Q

靠什么打动这些人才,让他们加入百度?    

A

这个我觉得是一个格局和诚意问题。比如说吴恩达,我跟他是很多年的朋友,在美国合作过项目,当时我也没有想到能够说服他,这对我来说是一个惊喜。我们经常在一起谈,关于我们最近做了一些什么事情,有什么看法,他并不是完全不知道我们这边的情况。    

吴恩达很多的访谈,讲到他加入百度的原因,他总会提到两点,一个是我邀请他,第二个是百度在这方面的资源投入,进展的速度是非常快的。      

Q

您认为百度的竞争对手都有谁?谷歌算么?    

A

我们没有把谷歌作为竞争对手,因为现在我们面临的这些事情都是一个很广阔的前提,大家都在开垦,最重要的是如何抓住机会。所以我觉得更多的是自己跟自己竞争,怎么去超越自己,与别的公司根本没有到竞争的程度。非要说竞争的话,人才的竞争是一个。  


技术的门槛与进阶

——“现在日本做人工智能就是非常错误的路径”

Q

百度其实也是从2012年才开始有深度学习方面的研究,突然说很快就能把成果拿出来,意味着门槛已经降低了么?    

A

不是门槛降低了,是大家更重视了,所以会投入更多的资源和精力在上面。有的时候一个领域,进展有多快,一个很重要的因素是需求有多大。“两弹一星”你觉得难吗?当然难,但那个时候决心这么大,就能把这个事情给做出来。人的能力有时候是超乎你自己想象的。关键你做什么事情、选哪个跑道、你要解决什么问题、这个问题是不是跟整个社会的趋势和大发展息息相关,这个我觉得非常重要。    

Q

以语音识别为例,有一种说法是,业界做语音技术的水平都差不多,关键在于数据的量级,以及对数据的提取、分析、采集能力,您怎么看?    

A

这个说法没错,但不是很全面。这是在基础能力一样的前提下,数据源多的可能会更有优势。但是技术本身也在不断地变化,如果能够在基础技术的提升方面做一些前沿性工作,也能够带来很大的提升。    

以前深度学习用来提升语音,主要用在声学模型上面。一段语音信号,把它分成很多小段,每个小段分到大概一万个类的三元音素空间里面,然后变成文字的序列。这两部分,声学模型和上面的部分,以前都是分开的,只有下面用到了深度学习。去年百度做的工作就是全部用深度学习模型,整个训练是端到端的训练,技术框架跟以前不一样了,就带来一个很大的提升。    

Q

关于深度学习的模型,全部用和只有一部分用,技术的门槛在哪里?    

A

这里门槛有好几个:建模的门槛(机器学习专家、统计学家对问题的理解如何,怎么去建更好的模型);工程的门槛(如何高效地实现更复杂的模型,能够高效地处理大量的数据,并且线上实时的解码,用有限的资源来实现,而用无限的计算资源来做这个事儿);系统集成的门槛(把整个系统放在一起的能力)。    

Q

自动驾驶涉及的领域有很多是您熟悉的,把这些整合在一起,不仅是软件的问题,还是硬件的问题,对您个人来讲,以后需要提升的有哪些方面?    

A

从不同的角度来看自动驾驶,从车企或者传统的自动控制会觉得这是一个控制的事情,而我们搞计算机的则认为这个是计算的问题。所以我觉得,相比车企,我们离自动驾驶的距离更近一点,因为自动驾驶的门槛在硬件后面的控制算法上。如果人没有大脑,比猩猩还差一点。    

现在日本做人工智能就是非常错误的路径,追求外型,很漂亮,但是在福岛海啸发生的时候,找不到有任何机器人能够进入核电站去关掉它,最后是一个美国军方的机器人把这件事情做到了。美国人做的机器人从来没有长的像人一样。所以人工智能在于算法的智能、能力的智能,而不是长得像人。机器人不一定要纠结在最后一个人字上,它只要是能够智能的思考就行。美国在机械各方面不是走在世界最前面,但是他的信息技术走在世界最前面。    

自动驾驶上,车企与互联网企业,应该说各有优势,但需要互补。我觉得我们需要弥补的,是硬件方面的能力一个短板。如果没有跟宝马合作,我们自动驾驶项目不容易开展。    

Q

所以在自动驾驶上,车企的进度会落后互联网企业么?    

A

车企对于这个行业与我们有不同的理解。车企自动迭代更新的周期都是很长的,他们把安全是放在第一位的,成本也看得很重要,智能这件事情,他们不一定看那么重要。互联网公司更加超前大胆一点,这是一个整体的差别。    

还有一点因为互联网公司本身是传播效应比较强,所以搞出来的动静比较大。车企相对低调一点,他从任何的技术研发到进入产品中间周期都是很长。    

Q

百度在技术储备上比较多,会不会考虑造车?    

A

还是贴着我们目前的产品去往外做,百度自动驾驶的实现路径还是紧贴着地图产品、导航产品。每个公司路径不一样,必须结合自己的优势资源做事情,去想什么是你应该抓住的机会。造车这件事情要慎重,可能会贸然进入一个你并不擅长的领域,但是谁知道呢?就像几年前苹果也没有造车的打算,所以我觉得很难说。    

Q

您在百度负责的都是比较长远的项目,未来百度可能会发展成为一家什么样的公司,会不会和现在有非常大的不同?    

A

对于百度研究院来讲,我们的定位一定是长短结合。技术研发要超前,落地点一定要结合百度自身自有的资源优势去落地。光有超前的研发不是一个很好的模式。技术的研发一定要很快地找到着力点,进入正反馈的阶段,方向把握比较准。    

Q

百度会考虑做硬件吗?    

A

做硬件我们会比较审慎,要看是不是跟核心战略有比较密切的关系。  


自动驾驶,我们在哪儿?

——“我们的原型车今年会实现在高速上自动行驶

Q

您曾经解读过百度的自动驾驶项目,说百度不是想让车来完全取代人,而是达到人车一体的自动驾驶。怎么去描述这种人车一体的自动驾驶?    

A

真正要实现完全的无人驾驶有很长很长的一段路要走,之前必须要解决怎么样做高度的自动化驾驶。百度的看法跟车厂的看法是一致的,我们的项目不叫无人驾驶项目,我们叫高度自动驾驶项目,叫Highly Automated Driving,就是车能够在很智能的程度上辅助驾驶,与现在客机的驾驶状态接近,在起飞跟降落的时候一定是人操作的,但是巡航的时候完全可以去喝杯咖啡。    

Q

所以目的是减轻开车人的的压力,不需要花那么多精力去关注路况,让开车变得轻松?    

A

特别微观琐碎的控制不需要人来参与,但是人如果想参与它是可以的。我认为人跟车的关系就和人跟马的关系一样。你骑马的时候,你睡着了马也会把你送回家,如果你骑着一匹马在万马奔腾的环境里面,马跟马之间的间距是特别地小的,这个距离不需要你去管,马之间会互相协调,但是不论在大方向还是小方向,你都可以控制马,它会听你的话。比如说北京堵车堵得特别严重的时候,车一点一点挪,自动驾驶比人更适合处理这个情况。    

Q

现在自动驾驶的算法都是百度自己在做吗?宝马方面主要负责什么?    

A

百度主要在控制方面要依靠他们,宝马提供接口跟协议。不过怎么实现自动驾驶我们是分开的,互相之间定期会有交流。我们做的东西知识产权属于我们,他们做的技术产权属于他们。    

Q

那也就是说这并不代表百度未来会成为宝马的供应商?    

A

不代表,只是一块合作做一个技术的研发?    

Q

您怎么看国内做自动驾驶的其它企业和机构?        

A

国内目前高校有一些投入,车企的投入很小,他们目前还没有真正对这块重视起来,有的刚刚开始重视。    

Q

高精度地图的商业化需要多长时间?会是什么样的呈现形式?            

A

高精度地图方面,今年我们会开始在某一个城市大规模地部署,研发目前差不多完成。大概在一两年之内,就可以投入使用了。首先可能会是基于手机APP做一些尝试,手机会有更好的服务体验,也许会有腕式的。车载系统百度也会不断加大力度去推广,不过车企会比较保守。            

Q

自动驾驶也会是百度语音识别一个很重要的应用场景?            

A

当然了。关于这个,我们有一整套很强大的解决方案,包括车内的人机交互、地图基础导航的中间承载形态和车外的感知能力。总体来讲,我们是希望能够把出行这件事情做好。            

Q

语音识别有在车里进行测试过吗?            

A

目前产品还在研发阶段,还没有产品。            

Q

你估计百度一整套的自动驾驶方案会在哪一年出来?                

A

这个很难估计,我们只能说今年要做的事情今年知道,我们不太爱做长远的计划,传统企业一定要你做五年的规划,我们不怎么做五年的规划。我认为高速公路上的智能自动巡航,2-3年内在发达国家的一些公路上会实现。但在中国我觉得还会慢一点,因为公路基础实施需要一些改造。但是我们的原型车今年会实现在高速上自动行驶。                

人物介绍

余凯 百度研究院副院长,深度学习实验室主任

余凯博士,负责百度自动驾驶、BaiduEye、百度大脑等项目,带领团队将深度学习技术成功应用于广告、搜索、图像、语音方面,相继三次获得“百度最高奖”。中组部第九批"千人计划“国家特聘专家,国际知名机器学习专家。他曾担任斯坦福大学计算机系Adjunct Faculty,现任南京大学、北京邮电大学和北京航空航天大学兼职教授,以及中科院计算所客座研究员。

创客特质

从无到有,

创建百度深度学习实验室;

从零到一,

践行中国自动驾驶实用论。

关于创客

《创客》是由车云网打造的深度人物王牌栏目,以“创新者的领地”为口号,每年于车云网周年庆期间推出。2015年第二季《创客》以“未竟之境”为主题,聚焦交通领域的新生代产业新锐,他们隐苍穹、破鸿蒙、露峥嵘,引领人类交通的未来变革。 详细>

往期回顾

策划