特斯拉:数据驱动浃沦肌髓

  • 发表于: 2021/09/30 18:51:00 来源:车云网

作者 I Chris

编辑 I Chris

9 月 25 日,特斯拉在美国本土同时推送 Tesla OS v2021.32.22 和特斯拉 App v4.1 版本更新,更新了「FSD 完全自动驾驶 Beta 版申请按钮」和「安全评分 Beta 版」两个功能。基于这两个功能,特斯拉在数据驱动业务的维度向前跨越了一大步。 

简单来说,美国地区选装了 FSD 的特斯拉车主可以在系统更新至 2020.32.22 后点击「申请完全自动驾驶能力 Beta 版」,系统内置的「特斯拉保险计算器」会运行「安全评分 Beta 版」,待系统连续 7 天认定驾驶员驾驶习惯安全可靠后,该车即可收到 FSD Beta 的推送更新。 

从 FSD 的全栈算法、公测用户的运营扩张乃至衍生的特斯拉 UBI(Usage-based insurance)车险,这一整个闭环的业务,特斯拉全部转向了基于数据驱动的机器学习。由此,特斯拉开启了全面升维的竞争。 

安全评分 Beta 版

之所以将「安全评分 Beta 版」放在开头介绍,是因为无论是「FSD 完全自动驾驶 Beta 版申请按钮」还是「特斯拉保险」,都是以「安全评分」为根基的业务。那么,什么是「安全评分」?

 据特斯拉的介绍,「安全评分」根据 5 个与安全相关的指标对特斯拉车主的驾驶行为进行评估,特斯拉将基于这些数据预测当事车主的驾驶习惯在未来驾驶车辆发生碰撞的可能性。 

「安全评分」的目的是为驾驶员提供透明度和对其驾驶行为的反馈。「安全评分」介于 0 和100 之间,分数越高表明驾驶越安全,特斯拉认为绝大多数司机的评分应当 ≥ 80 分。 

那 5 个「安全相关的指标」分别是什么呢? 

驾驶员对车辆的操作控制无外乎横向和纵向控制两大维度,其中横向控制主要通过往左右打方向盘来实现,纵向控制通过加速和制动踏板实现。特斯拉「安全评分」的 5 个指标也逃不出这三大执行操作: 

每千英里前方碰撞预警触发率(下记为 A) 

一个冗长但并不难理解的名词,每驾驶 1000 英里,驾驶员未介入而特斯拉 Autopilot 系统认为可能发生碰撞,从而触发「前方碰撞预警」的次数。 

急刹车(下记为 B)

一个比值。特斯拉的定义是在驾驶行程中,刹车减速度超过 0.3 g(相当每过一秒钟车速下降超过 6.7 mph(10.78 km/h)),除以刹车减速度超过 0.1 g(相当于每过一秒钟车速下降超过 2.2 mph(3.54 km/h))的比值。

猛转向(下记为 C)

同样是一个比值。特斯拉的定义是在驾驶行程中,车辆左/右加速度超过 0.4 g(相当于每过一秒钟车辆向左/右的速度增加超过 8.9 mph(14.32 km/h)),除以车辆左/右加速度超过 0.2 g(相当于每过一秒钟车辆向左/右的速度增加超过 4.5 mph(7.24km/h))的比值。

 不安全跟车(下记为 D)

D 是一个动态值。Autopilot 根据本车速度、前车速度和两车间的距离判断。计算方法为当前车突然刹停,驾驶员做出反应并刹停所需的时间长度。D 的定义为反应时间低于 1 秒除以反应时间低于 3 秒的比值。此外,D 只有车速在 50 mph(80.47 km/h)才会被记录。 

强制退出 Autopilot(下记为 E) 

特斯拉车主都知道,Autopilot 会在连续警告三次均得不到驾驶员的响应后退出,当驾驶员双手脱离方向盘或分心驾驶后,系统将发出警告。E 的定义是 5 个指标中最为简单的一个:如果驾驶行程中 Autopilot 出现强制退出,记为 1,否则记 0。 特斯拉有一个 PCF(Predicted Collision Frequency,预测碰撞频率)计算公式,将上述 A、B、C、D、E 五个数值计入如下公式,即可得出 PCF 值。 

安全评分 = 115.382324 - 22.526504 × PCF 

你一定想问,这 8 个精确到小数点后 6 位的数都是怎么来的。特斯拉表示,当前公式都是基于 60 亿英里车队数据的统计模型得出的。

 到这里,其实你已经能看出,这个「安全评分」并不简单。基于已有的 60 亿英里车队数据,准确地分辨出哪些车主的驾驶习惯良好,听上去就不是个轻松的事情,事实上,从首批车主的体验反馈看,连特斯拉也低估了 Ta 的难度。 

FSD 内测规模如何有序扩张

自 2020 年 10 月 21 日特斯拉首次公测 FSD Beta 至今,围绕特斯拉 FSD 一个相当广泛的质疑是,FSD Beta 公测的车队规模一直保持在 2000 辆上下。没有进入美国更多的州,也没运行在更多的 FSD 车型上。 

这和大众对特斯拉 FSD 的预期相去甚远,世界不需要另一个可扩展性严重受限的自动驾驶系统。过去 5 年来,Waymo、Cruise 们都没能带给我们惊喜,而特斯拉几乎是唯一一家直到 2021 年仍然「逢自动驾驶必谈 Scalability」的主流自动驾驶玩家。 

但在质疑背后,特斯拉一直在以近乎疯狂的效率迭代着 FSD Beta 的全栈算法,不夸张地说,从 2020 年 10 月至今,超 20 个大小版本迭代后的 FSD Beta 10.1 已经发生了脱胎换骨的变化。这一点从 8 月 19 日的特斯拉 AI Day 大会亦可看出端倪。 

今天,FSD Beta 进阶到了一个尴尬的境地:一方面,特斯拉需要更多、更丰富的场景,以加快加速算法的迭代,这意味着更大规模的公测车队;另一方面,FSD Beta 虽然已经取得了巨大的改进,但 Ta 还不够好,至少不足以放心地让特斯拉将之推送到每一辆 FSD 车上。

 在这片技术的无人区中,包括美国在内的全球各地监管机构,对自动驾驶技术多是抱以支持和鼓励发展的宽松监管态度,却并没有就自动驾驶系统如何有序、安全、可控地扩展到每一辆车上给出详细的管理办法。 

这是技术跑在监管前的窘境,首批 2000 名公测车主易选(实际上也不是那么容易),20000 名呢?200000 名呢?今天,特斯拉在全球的保有量已经超过了 2000000 辆。这是一个非常棘手的问题。

 于是特斯拉基于 60 亿英里的车队数据得出的统计模型做出了安全评分 Beta。 

然后特斯拉的 Autopilot、座舱和 App 团队协作,面向美国的 FSD 车主同时推送 Tesla OS v2021.32.22 和特斯拉 App v4.1 版本更新。 

不过,和特斯拉的第一版智能召唤 Beta、第一版自动辅助导航驾驶(NoA)Beta 甚至第一版 FSD Beta 一样,第一版的安全评分体验之差,开发之 Beta 超出了不少车主的预期。 

例如,知名特斯拉博主 @TeslaJoy 和 @Scott Wainner 都表示,驾驶员并没有违反上述 5 个指标,仅仅是基于 Autopilot 或 NoA 驾驶了一段行程,就会被「安全评分」判定为存在「急刹车」、「猛转向」或「不安全跟车」行为,将分数扣掉。两位博主暴露的问题在于,由于版本过于 Beta,特斯拉开发的自动驾驶算法甚至不能通过特斯拉「安全评分」的考验。

由于安全评分的标准过于苛刻,大量车主选择谨慎驾驶以避免被扣分。外媒 Electrek 甚至给出了这样的标题:到处都是慢吞吞的特斯拉(Slow Teslas everywhere)。 


知名赛道爱好者、Model S Plaid 车主 Dragtimes 在零接管的情况下被打出了 5 分的低分。

另一位特斯拉车主、通用旗下自动驾驶公司 Cruise 产品副总裁 Oliver Cameron 表示,如果一个致力于实现从 A 到 B 的自动驾驶产品,运行时给你的压力要比你自己开车压力还大,那 Ta 可能不是个好产品。

「安全评分」的想象力

「安全评分」的想象力不止于此。「安全评分」的本质,在于通过对驾驶员驾驶行为尽可能细颗粒度的拆解与统计,有效地预测车辆在未来的事故率。

 驾驶数据越丰富、驾驶场景越细致、「安全评分」的预测准确性就越高。Elon 曾经说过,与传统汽车保险公司竞争的核心在于信息的准确性。得益于特斯拉全球第一大智能电动汽车制造商的地位,特斯拉坐拥业内最丰富也最详细的车队数据。从业务角度看,特斯拉对汽车保险公司的打击是降维的。

 特斯拉进入汽车保险领域,这是比有序扩张 FSD 内测规模重要得多的新业务,这也是为什么,运行「安全评分」的主体名叫特斯拉保险计算器。

此外,特斯拉保险的全面推开还会有反向教育驾驶员,从而进一步降低事故率的潜力。Elon 认为,人们会为了更低的保费学习更谨慎的驾驶车辆。「这就像……如果你想为保险支付更多费用,你可以(高风险驾驶),但如果你想少付费,那请不要那么疯狂。人们会做出选择」。

当然,这一切的前提是特斯拉做得足够好,以当前铺天盖地的针对「安全评分」的吐槽来看,现有的汽车保险公司不仅没有感到压力,甚至差点笑出了声。 

但特斯拉一点不慌。不仅不慌,特斯拉很可能在推送前就预知了这样的反馈。 因为特斯拉除了在博客中提到「随着我们获得更多的用户和数据洞察,我们希望在未来对公式进行迭代」,在上线当天,Elon 也特别提到目前还是一个非常 Beta 的版本,「安全评分」将随着时间的推移而进化,以更准确地预测事故率。

事实上,特斯拉对「安全评分」的布局甚至早于 FSD Beta 公测。在 2020 年 7 月 22 日的特斯拉 Q2 财报会议上,Elon 公开招聘「革命性精算师」: 

我特别欣赏一些精力充沛的精算师,我非常尊重精算师这个职业。你们的数学很好,请加入特斯拉,特别是如果你对保险行业的缓慢节奏感到恼火并想做出改变,这儿就是你要去的地方,我们需要革命性的精算师。

Elon 没开玩笑。今天,特斯拉建立起了一支精算师团队,Title 真的就叫革命性精算师(Revolutionary Actuary)。在特斯拉「革命性精算师」的职位描述中,有两条要求让人印象深刻,一是和「数据科学家」协作,二是熟练掌握Python,拥有开源机器学习库和框架,例如 Scikit-learn、PyTorch 和 Tensorflow 的应用经验。

特斯拉「数据科学家」隶属于车队分析(Fleet Analytics)团队,特斯拉称这是一支规模虽小但发展迅速的中央团队,赋能其他业务团队以改进产品,使特斯拉车主更安全。 

特斯拉要求「数据科学家」要具有强大的机器学习和软件工程基础,拥有多种机器学习模型的开发经验,基于开源技术处理 PB(Petabyte,千万亿字节)级的时间序列数据。 

特斯拉在中国也放出了「数据科学家」的职位,但对于特斯拉中国而言,相比算法,更重要的也许是先解决「数据原料」的问题。

Elon 在 2021 年世界互联网大会乌镇峰会上表态,特斯拉已经在中国建立了数据中心,用来存储中国业务产生的所有数据。包含生产数据、销售数据、服务数据和充电数据,所有个人身份信息都安全的存储在中国国内,不会转移到海外。

在展台背景板上,特斯拉更详细地向中国政府和消费者解释了「如何处理客户个人信息和车辆数据」:

收集:合法合规、最小必要、公开透明原则

存储:完全存储在中国境内,通过数据加密、鉴权、访问控制等技术确保存储安全

传输:通过数据加密,专用证书体系确保传输过程安全

删除:用户有权撤销自己的数据及数据使用授权

跨境:个人身份信息不出境。需要出境的重要数据均经主管部门批准后进行

随着车队规模的持续增长,数据驱动开始越来越多的植入特斯拉的产品与工程。

2016 年 10 月,特斯拉开始基于车队数据,用机器学习算法驱动 Autopilot 辅助驾驶系统,逐步提高越来越多的场景下的驾驶自动化率。 

2019 年 10 月,特斯拉基于车队数据中的 100 万张照片,训练出了机器学习算法 Deep Rain 神经网络,用以识别不同强度的雨量工况并匹配自动雨刮频率。 

2020 年 5 月,特斯拉基于储能电池 Powerwall、Powerpacks 和 Megapacks 的集群数据,推出了机器学习能源交易平台 Autobidder 和机器学习能源优化引擎 Opticaster,到 2021 年 5 月,Autobidder 平台上管理着超过 1.2 GWh 的电池资产,Opticaster 积累了超 1 亿小时的运营经验,为全球数千名特斯拉客户提供了数千万美元的价值。

2021 年 9 月,特斯拉基于 60 亿英里的车队数据推出了驾驶安全性评估软件「安全评分」,根据 Elon 的说法,在特斯拉保险之前,「安全评分」将首先评估和指引 FSD Beta 公测规模的扩张,从下周起,FSD Beta 公测车队将以 1000 辆/天的速度快速扩张。 

2021 年 9 月,Elon 接受特斯拉车主的提议,决定基于车队数据训练一个新的深度神经网络,用以自动化控制各种工况下的特斯拉汽车空调,例如在堵车、山火烟雾、土路和暴雨时启动空气循环。

 在过去,无论是辅助驾驶、自动雨刮还是能源交易&场景优化、汽车保险软件,无一例外是「由软件工程师手动编写规则」(软件 1.0)运行,在特斯拉,「数据驱动的机器学习」(软件 2.0)正在变得无孔不入。

通过定义所需行为的数据集和深度神经网络架构和不同的权重,特斯拉相信第一版奇差无比的机器学习性能会变得更强,最终全面超越人类工程师编写的规则。 

「越来越多的软件 1.0 被软件 2.0 取代,软件 1.0 吞噬世界,软件 2.0 吞噬软件 1.0。从长远来看,这种范式的前景是光明的,因为越来越清晰的是,当我们开发通用人工智能的时候,Ta 肯定会基于软件 2.0。」

 这是一种全新的研发哲学,特斯拉高级 AI 总监 Andrej Karpathy 于 2017 年在一篇博客中提出,博客的标题就叫,软件 2.0。


相关标签:
星云号
  • 车云星
  • 空间站
  • 福特星球
  • 虫洞

加料 /

人评论 | 人参与 登录
查看更多评论