盖世汽车讯 据外媒报道,加州大学伯克利分校的AI研究人员表示,他们开发了一种AI技术,可帮助自动驾驶汽车在陌生的现实世界中行驶,并且其性能优于送货机器采用的导航方法。该导航系统名为LaND(Learning to Navigate from Disengagements),学习脱离(Disengagement)事件的导航系统,然后预测何时会发生系统脱离情形。
(图片来源:https://venturebeat.com)
脱离是指自动系统遇到具有挑战性的条件,必须将控制权交还给人工操作员的情形。在衡量自动驾驶汽车系统的能力方面,脱离事件是一个备受争议的指标,有人称其已经过时。AI研究人员通常将脱离视为故障排除或导航系统调试的信号,但LaND却将其作为训练数据的一部分。
工程师们表示,通过此种方式,可以让机器人从测试过程中收集的数据集中学习。虽然其他系统直接从机载传感器收集的训练数据中学习,但研究人员表示,这可能需要大量的标注数据,而且成本更高。
研究人员表示,“研究结果表明,LaND可以成功地在各种真实的人行道环境中学习导航,其表现优于模仿学习和强化学习方法。如果机器人能够成功地学习执行动作,避免出现脱离情形,将能成功地完成预期任务。重要的是,传统的强化学习算法使用特定任务奖励功能,与传统的强化学习算法不同,我们的方法根据脱离信号,推断任务,甚至不需要知道任务是什么。然而,与标准的强化学习算法类似,我们的方法也在不断改进,会强化避免解除的行为。”LaND利用强化学习,而非寻求奖励,将系统脱离事件作为直接从输入传感器学习的方式,同时考虑方向盘角度,以及是否启用自动模式等因素。
该团队通过在人行道上驾驶机器人,收集训练数据,来打造LaND。当机器人驶入街道、车道或其他布满障碍物的环境时,由人类安全驾驶员陪同机器人重新设定路线,或在短时间内接管驾驶。在这一训练期间,研究人员共收集了近35000个数据点,生成了近2000个系统脱离场景。
初步实验表明,与深度强化学习算法和模仿学习的常用方法之一行为克隆相比,系统脱离之前,LaND在人行道上行驶的距离更长。研究人员称,未来,LaND可与现有导航系统,尤其是导航模仿学习方法相结合。研究如何让机器人在需要人工干预时,提醒操作人员,可以降低成本。