机器学习之争,就是数据之争
最近两年,所有自动驾驶公司的技术路线,都在往机器学习靠拢。特斯拉与英伟达合作的高性能车载电脑,大幅提升了浮点运算能力,这就是在为机器学习算法搭建硬件平台。
而软件方面,各家都在探索与开发中。而建立机器学习算法的第一要素,就是要用海量的数据去训练。训练数据可以在采集后进行室内处理,但对于瞬息万变的交通状况来说,路测无疑是非常重要的。
而加州的相关法规,对全自动驾驶的汽车,仅限制在两个测试点进行。这就将使得测试数据非常单一,训练的算法也很难应付真实路况。
如果打擦边球,违法采集数据,将会在根源上领先对手一大步,这或许是对于自动驾驶企业最大的一个诱惑。
Car and Driver爆出的文件来自于公开的文档库。而该文件的来源,恰恰是Otto的一线测试人员,这个文档类似日志形式,披露了非常多测试中的细节。
如上图所示,Otto的测试路线绵延覆盖了湾区的整段高速路,图内黑色标记点指的是自动驾驶模式“脱离”(驾驶员介入)的记录。
而按照加州法规,如果想测试一个完全自主驾驶的汽车,必须局限在加州东北部康特拉科斯塔县的两处全自动驾驶汽车测试点。
更遭的是,加州限制自动驾驶汽车的重量,不得超过10001磅(约5吨),对于卡车来说,中型及重型卡车都不得进行测试。
这个角度而言,特斯拉在数据收集方面有很大的先天优势,每一辆跑在路上的特斯拉Model S,都可以成为特斯拉的数据源。
从美国车辆管理局的数据看,特斯拉2016年10-11月的测试车运行里程,仅仅885公里,显然特斯拉对路测并没有依赖性,更重要的工作在后端。
逃避监管,避免公开数据
其实,加州称得上是对于自动驾驶最为开放的州府。因为加州第一个允许自动驾驶汽车上路测试,并且第一个允许自动驾驶汽车在没有驾驶人员的情况下上路。
如果按照规程,Otto完全可以进行相同的测试,但是前提是申请一系列的许可。而且,道路测试的数据必须受到监管,每一次自动驾驶程序的“脱离”(Disengagement),都会被记录在案。
上图是美国加州车辆管理局公开的数据。
3