盖世汽车讯 估算移动摄像头的运动是计算机视觉领域中的常见问题。随着自动驾驶汽车和无人机等技术越来越受欢迎,需要快速、高效的车载视频处理算法,以较低的计算成本及时、准确地返回信息。此种摄像头运动的估计,或姿态估计,也是车载目标追踪系统的重要组成部分。
(图片来源:techxplore.com)
据外媒报道,杨百翰大学(Brigham Young University)研究人员开发了一种方法,为已用于计算机视觉的算法提供基础,大幅减少计算时间,并降低姿态估计的复杂性。
姿态估计算法利用来自移动摄像头的视频源的帧,生成关于摄像头在每个连续帧的过程中如何移动的假设。目前,用于姿态估计的算法需要根据视频中的数据生成5到10个假设,从而判断摄像头是如何移动的。然后根据这些假设与数据的契合程度,对其进行打分,得分最高的假设被选为最佳姿势估计。然而,生成多个假设的计算成本很高,并且导致姿态估计返回时间较慢。
研究人员找到了一种方法,在每一帧之间输入信息,为已用于计算机视觉的算法提供基础,或给予提示,从而大大减少生成假设的数量。研究人员称,“在每次迭代中,我们都使用当前的最佳假设为算法提供基础,所需假设减少直接降低了计算时间和复杂程度。我们的研究表明,此种方法大大减少了姿态估计需要生成和被打分的假设数量,允许实时执行算法。”
随后,研究小组将此种方法与其他最先进的姿态估计算法进行比较,以区分减少假设数量对计算精度的影响。尽管每次迭代只生成一个假设,在100次迭代之后,此种方法的误差与OpenCV五点多项式求解器相当。此外,当对两种算法进行及时检查时,该算法明显优于其他先进的方法,大多数情况下,新算法要快10倍。
该小组随后修改了该算法,以便进行目标追踪,并在多旋翼无人机上进行了测试。该算法成功以640 x 480的分辨率追踪了多个目标。结果与此前的分析一致。整个算法每帧运行需要29毫秒,意味着其能以每秒34帧的速度实时运行。接下来,该团队计划将该算法用于3D场景重建和更复杂的追踪方法。