特斯拉(TSLA.US)放弃激光雷达,押注纯视觉自动驾驶,靠谱吗?

  原标题:特斯拉(TSLA.US)放弃激光雷达,押注纯视觉自动驾驶,靠谱吗? 

  本文来自微信公众号“半导体行业观察”

  近来,特斯拉(TSLA.US)大胆押注视觉技术,仅使用摄像头提供自动驾驶汽车。但是,尽管基于视觉的自动驾驶的能力有所提高,但专家表示,它面临着根本性的障碍。

  近期,特斯拉推出了延迟已久的“全自动驾驶”(FSD)软件第 9 版,这使得特斯拉汽车的自主导航能力有了提升。该软件包已作为 10,000 美元的附加组件出售,自去年 10 月以来,他们一直在与选定的驱动程序组进行 Beta 测试。但是最新的更新标志着一个重大转变,它放弃了雷达传感器的输入,完全依赖汽车的摄像头。

  此前 ,特斯拉在 5 月份宣布将从其在美国制造的 Model 3 和 Model Y 汽车中完全移除雷达,并暗示该公司正在加倍努力制定与大多数其他自动驾驶项目不一致的战略。由Alphabet 子公司 Waymo和通用汽车旗下的 Cruise制造的自动驾驶汽车融合了来自摄像头、雷达和超精密激光雷达的输入,并且仅使用高分辨率 3D 激光扫描预先绘制了街道。

  特斯拉首席执行官埃隆·马斯克 (Elon Musk) 一直 直言不讳地批评 激光雷达成本高昂,而是提倡采用“纯视觉”方法。由于依赖单个传感器而缺乏冗余,这种观点带来了巨大争议。但研究自动驾驶汽车计算机视觉的康奈尔大学副教授 Kilian Weinberger 说,理由很明确。

  “与激光雷达相比,摄像头非常便宜,”Weinberger 说。“通过这样做,他们可以将这项技术应用到他们销售的所有汽车中。如果他们售出 50 万辆汽车,那么所有这些汽车都会为他们收集数据。”

  数据是自动驾驶技术核心的机器学习系统的命脉。Weinberger 说,特斯拉最大的赌注是,与其竞争对手依赖少量配备传感器的汽车相比,公司车队积累的大量视频将帮助其更快地实现完全自主驾驶。

  在上个月的一场视觉会议上,特斯拉的首席AI官Andrej Karpathy透露,该公司已建立了一个超级计算机。他声称这是世界第五强的设备,能帮助公司处理这些数据。他还解释了放弃雷达的决定,称在对超过 1.5 PB 的视频进行训练后,增加了雷达数据和人工标记,现在仅视觉系统的性能明显优于他们以前的方法。

  Weinberger 说,放弃雷达的理由确实有道理,他补充说,近年来激光雷达和相机之间的差距已经缩小。激光雷达的一大卖点是通过从物体上反射激光来实现令人难以置信的准确深度感测——但基于视觉的系统也可以估计深度,并且它们的能力得到了显着提高。

  Weinberger 及其同事在 2019 年取得了突破,将基于相机的深度估计转换为激光雷达使用的同类 3D 点云,显着提高了准确性。Karpathy 在去年的 Scaled Machine Learning Conference 上透露,该公司正在 使用这种“伪激光雷达”技术。

  不过,如何估计深度很重要。一种方法比较来自两个相距足够远的相机的图像,以三角测量到物体的距离。另一种方法是在大量图像上训练 AI,直到它学会获取深度线索。Weinberger 说,后者可能是特斯拉使用的方法,因为它的前置摄像头对于第一种技术来说太近了。

  基于三角测量技术的好处是测量基于物理学,就像激光雷达一样,初创公司 NODAR 的首席执行官 Leaf Jiang 说,该公司基于这种方法开发了基于相机的 3D 视觉技术。他说,推断距离本质上更容易在模棱两可的情况下出错,例如,区分 50 米处的成人和 25 米处的儿童。“它试图根据透视提示或阴影提示等来计算距离,但这并不总是可靠的,”他说。

  然而,你如何感知深度只是问题的一部分。最先进的机器学习只是识别模式,这意味着它会在新情况下挣扎。与人类司机不同的是,如果它没有遇到场景,它就无法推理该做什么。“任何人工智能系统都不了解实际发生的事情,”Weinberger 说。

  收集更多数据背后的逻辑是,您将捕获更多可能使您的 AI 陷入困境的罕见场景,但这种方法有一个基本的限制。“最终你会有独特的案例。以及您无法训练的独特案例,”温伯格说。“在某些时候,添加越来越多数据的好处正在减弱。”

  这就是所谓的“长尾问题” ,苏黎世联邦理工学院 (ETH Zurich) 教授Marc Pollefeys说,他曾从事基于摄像头的自动驾驶研究,它为摆脱已经很常见的驾驶辅助系统带来了主要障碍。现代汽车到真正的自动驾驶汽车。他说,底层技术是相似的。但是,虽然旨在增强驾驶员反应能力的自动制动系统可以偶尔错过行人,但完全控制汽车时的误差幅度仅为百分之几。

  其他自动驾驶公司试图通过减少不确定性的范围来解决这个问题。

  Pollefeys 说,如果你预先绘制道路,你只需要关注少量不匹配的输入。同样,三个不同的传感器同时犯同样错误的可能性也很小。

  这种方法的可扩展性当然值得怀疑。但是,Pollefeys 说,试图通过简单地通过机器学习管道推送更多数据来从一个主要工作的系统转变为一个几乎不会出错的系统“注定要失败”。

  “当我们看到某样东西 99% 都有效时,我们认为让它 100% 有效并不难,”他说。“而事实并非如此。少犯 10 倍的错误是一项巨大的努力。”

  特斯拉车主在 FSD 更新后发布的视频显示他们的车辆 突然驶入高速公路 或 对路中间的混凝土柱子视而不见,这表明仍然需要弥合的鸿沟,并表明马斯克对今年年底实现完全自动驾驶的预测 可能过于乐观了。

  但Pollefeys 认为特斯拉不太可能放弃完全自动驾驶近在咫尺的说法。“很多人已经为此买单了(特斯拉的 FSD 套餐),所以他们必须保持希望,”他说。“他们被困在那个故事里。”

牛市来了?如何快速上车,金牌投顾服务免费送>>
海量资讯、精准解读,尽在新浪财经APP