首页 生活 > 内容

增强自动驾驶汽车匝道合并能力的强化学习框架

时间:2022-12-27 17:09:33 来源:
导读 虽然现在许多汽车公司都在投资开发自动驾驶汽车,但迄今为止所创造的车辆尚未达到大规模部署所需的安全水平。为此,车辆需要能够安全有效地

虽然现在许多汽车公司都在投资开发自动驾驶汽车,但迄今为止所创造的车辆尚未达到大规模部署所需的安全水平。为此,车辆需要能够安全有效地应对道路上的各种挑战。

卡内基梅隆大学的研究人员最近开发了一种基于强化学习(RL)的框架,可以帮助提高自动驾驶汽车在匝道合并场景中的性能,即匝道上的车辆偏离主干道的情况。他们的框架在arXiv上预发表的一篇论文中提出,可能有助于在这些特别重要的时期提高自动驾驶汽车的安全性,降低事故风险。

“约翰·多兰教授在卡内基梅隆大学的实验室研究各种自动驾驶应用已经有一段时间了,”开发该模型的研究人员之一SoumithUdatha告诉TechXplore。“我们在本文中关注的应用是高速公路合并,因为涉及高速车辆、不同风格的司机以及涉及的不确定性。”

Udatha和他的同事们研究工作的远大目标是提高自动驾驶汽车的安全性。在他们最近的论文中,他们特别尝试设计一个框架,该框架可以有效地捕捉匝道合并场景,并根据对任何不确定性和可能风险的分析来规划车辆的行动。

“RL模型与环境交互并收集数据以优化它们的奖励,但这种数据探索在部署到现实环境中时会遇到一些问题,”Udatha解释说。“这部分是因为并非智能体遇到的所有状态都是安全的。我们用控制屏障功能(CBF)来约束我们的RL策略,以确保在指定距离内的安全。因此,在环境约束下,我们忽略不安全状态并增强系统学习如何导航的能力。”

CBF是一类相当新的计算方法,旨在增强自治系统的安全控制。CBF可以直接应用于不同的优化问题,包括斜坡合并。尽管它们的质量很有前途,但它们执行的优化并没有考虑系统在探索环境时收集的数据。RL方法可以帮助填补这一空白。

“我们发现我们的算法可以扩展到离线和在线RL环境,”Udatha说。“由于我们现在拥有大量用于离线RL的数据,因此对离线数据集的训练最终可以产生更好的模型。根据我们的指标,我们还发现将概率CBF作为约束包含在内可以提供更好的安全性,因为它考虑了驾驶员的不确定性在一定程度上。”

Udatha和他的同事在一系列测试中测试了他们的框架,使用由英特尔实验室和巴塞罗那计算机视觉中心的一组研究人员开发的在线版CARLA模拟器。在这些模拟中,他们的方法取得了显著成果,凸显了其在匝道合并期间提高自动驾驶车辆安全性的可能价值。

“我们现在计划通过训练我们的模型来扩展我们的研究,以在驾驶员不确定的场景中将自动驾驶汽车与多辆汽车合并,”Udatha补充道。“我们还发现目前缺少用于比较各种匝道合并方法的标准基准,因此我们正在同时尝试为NGSIM建立匝道合并基准,NGSIM是NHTSA在美国I-80和US101上发布的高速公路数据集高速公路。”

标签:
最新文章