视觉定位技术是视觉导航和自动驾驶领域的重要组成部分。提出一种基于几何约束孪生卷积网络的相机六自由度(6 degree of freedom, 6DOF)定位方法,采用卷积网络、以学习查询图像与参考图像之间相对位姿关系的几何约束方式,获得查询图像...视觉定位技术是视觉导航和自动驾驶领域的重要组成部分。提出一种基于几何约束孪生卷积网络的相机六自由度(6 degree of freedom, 6DOF)定位方法,采用卷积网络、以学习查询图像与参考图像之间相对位姿关系的几何约束方式,获得查询图像的绝对位姿;并使用性能优异的主干特征提取网络,以及多任务联合损失函数同时训练的策略,进一步提高方法的定位精度、稳定性以及泛化能力。同时,设计了特征距离度量损失函数,增强了对于相似图像的区分性。在室内及室外公开数据集上的验证数据表明,与同类型方法相比,所提方法更具竞争力。展开更多
在已知三维信息的场景中估计相机位姿,是自主驾驶、增强现实、虚拟现实等领域的重要环节。已有方法从输入图像中直接回归相机的位姿,或者通过回归像素的三维坐标方式计算相机位姿,这些方法存在的问题是与训练场景耦合严重,在新环境中缺...在已知三维信息的场景中估计相机位姿,是自主驾驶、增强现实、虚拟现实等领域的重要环节。已有方法从输入图像中直接回归相机的位姿,或者通过回归像素的三维坐标方式计算相机位姿,这些方法存在的问题是与训练场景耦合严重,在新环境中缺少泛化能力。认为深度学习网络应该专注于学习鲁棒和不变的图像特征,因此介绍了一种基于多尺度图像特征对齐的优化方法,将图像特征相似性作为度量形式,将相机位姿作为优化量,通过从像素到位姿的端到端的训练,来估计相机精确的六自由度(6 degree of freedom,6DOF)位姿。该模型参数和场景分离,对新场景有较强的泛化能力,并且具有较好的定位精度。展开更多
文摘视觉定位技术是视觉导航和自动驾驶领域的重要组成部分。提出一种基于几何约束孪生卷积网络的相机六自由度(6 degree of freedom, 6DOF)定位方法,采用卷积网络、以学习查询图像与参考图像之间相对位姿关系的几何约束方式,获得查询图像的绝对位姿;并使用性能优异的主干特征提取网络,以及多任务联合损失函数同时训练的策略,进一步提高方法的定位精度、稳定性以及泛化能力。同时,设计了特征距离度量损失函数,增强了对于相似图像的区分性。在室内及室外公开数据集上的验证数据表明,与同类型方法相比,所提方法更具竞争力。
文摘在已知三维信息的场景中估计相机位姿,是自主驾驶、增强现实、虚拟现实等领域的重要环节。已有方法从输入图像中直接回归相机的位姿,或者通过回归像素的三维坐标方式计算相机位姿,这些方法存在的问题是与训练场景耦合严重,在新环境中缺少泛化能力。认为深度学习网络应该专注于学习鲁棒和不变的图像特征,因此介绍了一种基于多尺度图像特征对齐的优化方法,将图像特征相似性作为度量形式,将相机位姿作为优化量,通过从像素到位姿的端到端的训练,来估计相机精确的六自由度(6 degree of freedom,6DOF)位姿。该模型参数和场景分离,对新场景有较强的泛化能力,并且具有较好的定位精度。