【七人谈】高德副总董振宁:地图众包,从数据到决策

  • 发表于: 2014/09/29 22:11:16 来源:车云网

高德如何获得海量数据,又是如何进行数据分析与决策?阿里体系下的高德有着怎样的未来?

车云按:国庆小长假,车云菌邀请七位来自咨询、科研、投资、移动互联网等行业的代表,一起探讨汽车前沿科技的市场观、投资观和学术观。作为我们春节“七人谈”系列策划的延续,我们试图通过一个人以及他背后的群体和机构,为变革中的汽车产业图景提供某种个人化表达。希望这七篇文章能让你度过一个极富深意、远瞻未来的小长假。

国庆七人谈的第二篇,来自高德副总裁董振宁先生。他要和我们聊聊地图的海量众包与交通大数据挖掘。


高德在正式成为阿里集团的一员后,究竟会发生什么变化,这是外界非常关心的。在不久前,包括马云在内的阿里高层,来到了高德着重分享了阿里对未来战略的看法。对于阿里而言,未来十年最重要的就是数据和数据技术,这也是被马云认为是阿里最宝贵的资产。

阿里未来的战略,是希望能够打通云和端的联系,通过端带动云,通过云丰富端,通过云到端整个数据流动来创造价值。马云对高德的期待,不是高德为阿里创造多少价值,而是为阿里未来十年发展非电商产业,如车载领域和无线互联网领域,高德能够做出什么样的模式、能够解决什么样的问题。对于阿里这样体量的公司而言,这才是最重要的。

高德的本质是地图供应商,而地图的本质就是出行。高德的未来发展,会更注重基础的数据服务,把出行做好。

高德副总裁董振宁

用众包解决出行问题

出行,现在成为了一个大问题。在今年5月1日,北京八达岭高速拥堵程度达到了创纪录的55公里,时间超过4个小时。端午节和中秋节前夕,北京的城市交通基本陷入瘫痪状态。更重要的是,拥堵不再是北京上海这些特大城市的问题,高德的大数据分析显示,全国有超过50个城市面临着不同程度的拥堵问题,出行延时系数超过了30%,前25个城市出行延时超过了50%。

根据国际标准,出行延时系数是指在拥堵状态下,我们从A点到B点花费的时间,是自由流动状态下的多少倍。例如,晚上十点左右,从家到公司只需要15分钟,而在早高峰或者晚高峰的情况下,可能需要30-40分钟,拥堵延时系数是2倍多。对于北京、上海、杭州这样的大城市而言,拥堵延时系数超过了20倍,超过1.5亿人口面临拥堵问题,整个社会为拥堵付出了巨大的代价。

14416083422671.jpg

导航有着两种含义。导航早期解决的是目的地引导问题,就是一个陌生目的地,通过导航的引导顺利到达。而对于经常前往的熟悉目的地时,在交通拥堵的情况下,如何更快到达,也需要导航去解决这样的问题。

导航解决拥堵路况快速到达的模式,就是实时交通信息。早先实时交通信息的来源,是通过采购各出租车公司的数据,然后制作成交通信息发布到市场。但是,这个模式存在很大问题,因为这个信息的准确性与城市的基础设施相关,北京、上海这些基础设施完善的地方,可以通过出租车公司的数据提供实时交通信。但是,很多拥堵城市的出租车并不一定带有数据设备,或者出租车非常稀少,该怎么去解决交通信息问题呢?

在移动互联网时代,高德找到了一种新的模式——众包模式。从2010年开始,高德开始转型移动互联网,并开始坚持众包模式。截止今天,高德在车联网和移动互联网领域拥有了超过3亿用户,每天定位平台超过51亿次,每天超过2亿公里。

通过海量的数据,高德可以完成两件事情:

  1. 一是自动对整个路网进行大数据分析,帮助发现新增道路。例如有用户使用高德导航通过一条地图上没有的道路,后台系统会自动发现并判断这可能是一条新增道路,当有足够多的用户走过这条道路的时候,就可以发现这条新增道路。通过大数据分析对数据库进行增补,已经成为了最主要的功能,每月有超过10万公里的道路更新和15万次的地图数据更新都是通过海量数据来完成。

  2. 二是交通信息的运用。高德通过众包模式获取的数据,已经远远超过了行业数据的获取,通过众包模式,每月可以分享超过70万件的交通信息和交通事件,这样就迅速解决了交通信息运用的数据质量的瓶颈和数据源的瓶颈问题。现在,交通信息覆盖了全国所有的高速公路,发布交通信息的里程超过了178万公里,带有交通信息覆盖的公路超过40%。

14416084319394.jpg

这样就构建了一个良好的商业应用模式,当用户在使用高德交通信息服务的时候,既是交通信息的使用者、享受者,又是交通信息的分享者。通过交通信息的分享和再分享,有了更好质量的交通信息,更好质量的交通信息自然会吸引更多的用户,形成一个良性循环。通过众包的模式,就把交通信息的问题巧妙地解决了。

城市内的交通状况,高德的众包数据超过了50%。在任何一条道路上,拥有五辆甚至超过五辆以上的公众信息,让高德有了非常好的数据质量。但高德并不满足于此,众包只是解决数据源,只有解决数据质量以及应用问题才能完全解决出行问题。

数据分析与决策

如何对这些数据进行数据挖掘,并形成最终的数据决策。对于阿里而言,数据分成三个层面。第一是大数据的建立,如何有效地用最低的成本获得高质量的数据;第二是基于大数据的分析,大数据能分析出很多不为人知的信息;第三是基于大数据的决策,能否用这种分析的原因和问题应用,反馈到社会当中,改善交通信息的运用和发展。

整个数据基础分为三个层次:第一是建立出行轨迹,高德建立一套海量出行库,存储了每个用户的轨迹;第二是基于这些数据进行相关的挖掘和计算,计算ETA和出行时间;第三是基于所有计算的多维度分析。

这样,用户可以基于高德发布的交通信息和在线导航技术,更快地到达目的地,同时,基于用户轨迹的交通拥堵情况的分析,可以通过网站进行实时查询。

对于高德而言,最重要的是数据决策。当发现一条道路出现拥堵,那么产生拥堵的原因是什么?是交通流问题,车流量过大的问题,交通实时管制的问题,还是路边停车问题等等,通过分析,把决策反映给管理部门,管理部门进行调优,再通过大数据监控调优的效果,这样真正建立一个闭环模式。

大数据分析可以发现问题,通过已有的数据预计未来的变化,例如北京在五一高峰已经面临非常严重的拥堵状态,那么十一会怎么样呢?通过历史数据分析以后,可以得到一些预测的结果,那就是十一高峰,北京还是面临非常严重的拥堵状态,这是好毫无疑问的。而且向北的高速拥堵程度要高于向东和向南的高速,京藏高速、大广高速还是非常拥堵的,京沪、京港澳高速拥堵程度比北面的高速要好一些。通过数据分析可以看出,即使在拥堵的时候并不是所有的地方都堵,可以通过数据分析来引导公众进行相应的分流,对拥堵进行平衡。

大数据就是专门发现很多不为人知的内容,通过无线互联网构建一个在线系统,每月过亿的活跃用户使用高德产品,每个产品的应用数据都反馈到后台,通过运营的不断改进应用的系统。

目前,对ETA的应用有两个:

一是帮助用户准确预计到达时间。这个需要交通信息预测技术;

二是大数据决策作用。在交通信息的应用场景中,如上下班的场景,高德地图能够定制交通线路,在预定的时间内给用户出行建议,如什么时候出发、走哪条线路等等。

对于高德,最核心的应用价值就是动态导航技术,基于海量的数据,通过云端数据分析,帮助用户节省出行的时间。高德内部,拥有一个庞大的测试队伍,甚至阿里也有很多员工加入到测试队伍中来。在不同的城市,高德还通过云端的技术进行不断的调整。

1441608463841.png

未来和车厂的合作、和互联网的合作,是高德最需要解决的问题。根据马云的要求,高德要在五年内成为中国真正的基础位置服务的提供商,让高德的基础位置服务渗透到社会的每一个角落。因此,高德将专注于用户的出行,为用户出行提供解决方案。

(注:本文来自于董振宁在T行神州武汉站的演讲)


相关阅读:

【七人谈】SA李建宇:车联网的商业未来

【七人谈】IHS刘凌青:导航的下一站

【七人谈】航盛副总郭正光:商用车联网的大数据

【七人谈】联想之星执行董事刘维:我所知道的汽车创业

【七人谈】盈开投资合伙人蔡华:从聊到做,如何走到创业这一天?

【七人谈】工程院院士李德毅:三十问自动驾驶

相关标签:
七人谈
地图
大数据
高德
  • 车云星
  • 空间站
  • 福特星球
  • 虫洞

加料 /

人评论 | 人参与 登录
查看更多评论