2022年1月14日整理发布:对于自动驾驶汽车初创公司来说,这不是最好的时代。过去一年,大型科技公司收购了资金不足的初创公司,网约车公司关闭了成本高昂的自动驾驶汽车项目,而且短期内看不到投入生产的希望。
然而,在这场低迷时期,总部位于多伦多的自动驾驶汽车初创公司 Waabi 刚刚在 Khosla Ventures 领投的 A 轮融资中以 8350 万美元的疯狂金额脱颖而出,Uber 也参与了该轮融资。 、8VC、Radical Ventures、OMERS Ventures、BDC 和 Aurora Innovation。该公司的财务支持者还包括Geoffrey Hinton、李飞飞、Peter Abbeel 和 Sanja Fidler,他们是在学术界和应用 AI 社区具有重大影响的人工智能科学家。
是什么让 Waabi 有资格获得这种支持?根据该公司的新闻稿,Waabi 旨在解决自动驾驶汽车研究的“规模”挑战,并“为社会带来商业上可行的自动驾驶技术”。这是自动驾驶汽车行业面临的两个关键挑战,在新闻稿中多次提到。
Waabi 所描述的“下一代自动驾驶技术”尚未通过时间的考验。但它的执行计划暗示了自动驾驶汽车行业的发展方向。
更好的机器学习算法和模拟
概率机器学习
根据 Waabi 的新闻稿:“设计自动驾驶汽车的传统方法导致软件堆栈无法充分利用 AI 的力量,并且需要复杂且耗时的手动调整。这使得扩展成本高昂且在技术上具有挑战性,尤其是在解决不太频繁和更不可预测的驾驶场景时。”
领先的自动驾驶汽车公司已经在真实道路上驾驶他们的汽车数百万英里来训练他们的深度学习模型。实战培训在物流和人力资源方面都是昂贵的。它也充满了法律挑战,因为围绕自动驾驶汽车测试的法律在不同的司法管辖区各不相同。然而,尽管进行了所有培训,自动驾驶汽车技术仍难以处理极端情况,这是培训数据中未包含的罕见情况。这些不断增加的挑战说明了当前自动驾驶汽车技术的局限性。
以下是 Waabi 声称解决这些挑战的方式(重点是我的):“该公司的突破性、人工智能优先方法由世界领先的技术专家团队开发,利用深度学习、概率推理和复杂优化来创建端到端的软件最终可训练、可解释并且能够进行非常复杂的推理。这与具有前所未有的保真度的革命性闭环模拟器一起,可以对常见的驾驶场景和安全关键的边缘案例进行大规模测试。这种方法显着减少了在现实世界中驾驶测试里程的需求,并产生了更安全、更实惠的解决方案。”
里面有很多行话(其中很多可能是营销术语)需要澄清。我联系了 Waabi 了解更多详细信息,如果我收到他们的回复,我会更新这篇文章。
通过“人工智能优先方法”,我想他们的意思是他们将更多地强调创建更好的机器学习模型,而不是激光雷达、雷达和地图数据等互补技术。拥有大量软件堆栈的好处是更新技术的成本非常低。随着科学家们继续寻找绕过自动驾驶人工智能限制的方法,未来几年将会有很多更新。
“深度学习、概率推理和复杂优化”的结合很有趣,尽管不是突破。大多数深度学习系统使用非概率推理。它们提供了一个输出,比如一个类别或一个预测值,而不给出结果的不确定性水平。另一方面,概率深度学习也提供了其推理的可靠性,这在驾驶等关键应用中非常有用。
“端到端可训练”机器学习模型不需要人工设计的功能。这意味着一旦您开发了架构并确定了损失和优化函数,您需要做的就是为机器学习模型提供训练示例。大多数深度学习模型都是端到端可训练的。一些更复杂的架构需要结合手工设计的功能和知识以及可训练的组件。
最后,“可解释性”和“推理”是深度学习的两个关键挑战。深度神经网络由数以百万计的参数组成。这使得在出现问题时很难对它们进行故障排除(或在发生坏事之前发现问题),这在驾驶汽车等关键场景中可能是一个真正的挑战。另一方面,缺乏推理能力和因果理解使得深度学习模型很难处理它们以前从未见过的情况。
根据TechCrunch对 Waabi 发布的报道,该公司首席执行官 Raquel Urtasun 将公司使用的 AI 系统描述为“算法家族”。
“结合起来,开发人员可以追溯人工智能系统的决策过程并结合先验知识,这样他们就不必从头开始教人工智能系统一切,”TechCrunch 写道。
闭环模拟环境是在真实道路上发送真实汽车的替代品。Urtasun在接受 The Verge 采访时表示,Waabi 可以在模拟中“测试整个系统”。“我们可以训练整个系统在模拟中学习,我们可以产生具有令人难以置信的保真度的模拟,这样我们就可以真正将模拟中发生的事情与现实世界中发生的事情联系起来。”
我对模拟组件有点犹豫。大多数自动驾驶汽车公司都在使用模拟作为其深度学习模型训练机制的一部分。但是创建精确复制现实世界的模拟环境几乎是不可能的,这就是自动驾驶汽车公司继续使用重型道路测试的原因。
Waymo 拥有至少 200 亿英里的模拟驾驶,其 2000 万英里的实际道路测试,这在行业中是一个记录。而且我不确定一家拥有 8350 万美元资金的初创公司如何在人才、数据、计算和财务资源方面超过一家拥有十多年历史并得到最富有公司之一 Alphabet 支持的自动驾驶公司在世界上。
在多伦多大学计算机科学系教授 Urtasun 在学术研究中所做的工作中可以找到更多关于该系统的提示。 Urtasun 的名字出现在许多关于自动驾驶的论文中。但是,特别是一月份上传到 arXiv 预印本服务器上的一个,很有趣。
题为“ MP3:映射、感知、预测和计划的统一模型”的论文讨论了一种与 Waabi 发布新闻稿中的描述非常接近的自动驾驶方法。
研究人员将 MP3 描述为“一种可解释的端到端无地图驾驶方法,不会导致任何信息丢失,并且可以解释中间表示的不确定性。” 在论文中,研究人员还讨论了使用“概率空间层来模拟环境的静态和动态部分”。
MP3 是端到端可训练的,并使用激光雷达输入来创建场景表示、预测未来状态和规划轨迹。机器学习模型无需像 Waymo 这样的公司在其自动驾驶汽车中使用的精细地图数据。
Urtasun 在她的 YouTube 上发布了一段视频,简要解释了 MP3 的工作原理。这是一项引人入胜的工作,尽管许多研究人员会指出,与其说它是一项突破,不如说是对现有技术的巧妙组合。
学术人工智能研究和应用人工智能之间也存在相当大的差距。MP3 或其变体是否是 Waabi 正在使用的模型以及它在实际环境中的表现还有待观察。
更保守的商业化方法
Waabi 的第一个应用程序不会是您可以通过 Lyft 或 Uber 应用程序订购的乘用车。
“该团队最初将专注于在物流中部署 Waabi 的软件,特别是长途货运,由于长期的司机短缺和普遍的安全问题,自动驾驶技术将在这个行业产生最大和最迅速的影响,”Waabi 的新闻稿称.
然而,该版本没有提到的是,高速公路设置是一个更容易解决的问题,因为它们比城市地区更容易预测。这使得它们不太容易出现边缘情况(例如在车前奔跑的行人)并且更容易模拟。自动驾驶卡车可以在城市之间运输货物,而人类司机则负责城市内的送货。
由于 Lyft 和 Uber 未能推出自己的自动驾驶出租车服务,而且 Waymo 仍无法将其完全无人驾驶的叫车服务 One 转变为可扩展且有利可图的业务,Waabi 的方法似乎是经过深思熟虑的。
由于仍然无法实现更复杂的应用,我们可以期待自动驾驶技术进入更专业的环境,例如卡车运输、工业综合体和工厂。
Waabi 也没有在新闻稿中提及时间表。这似乎也反映了过去几年自动驾驶汽车行业的失败。汽车和自动驾驶汽车公司的高管不断发表大胆的声明,并给出完全无人驾驶技术交付的最后期限。这些最后期限都没有得到满足。
无论 Waabi 是独立成功还是最终加入其中一家科技巨头的收购组合,其计划似乎都是对自动驾驶汽车行业的现实检验。该行业需要能够开发和测试新技术而不大张旗鼓的公司,在从错误中吸取教训时拥抱变化,进行渐进式改进,并为长期比赛节省资金。