期刊文献+
共找到83篇文章
< 1 2 5 >
每页显示 20 50 100
基于多尺度深度图自适应融合的单目深度估计 被引量:1
1
作者 郑游 王磊 杨紫文 《武汉工程大学学报》 CAS 2024年第1期85-90,共6页
深度估计网络通常具有较多的网络层数,图像特征在网络编码和解码过程中会丢失大量信息,因此预测的深度图缺乏对象结构细节且边缘轮廓不清晰。本文提出了一种基于多尺度深度图自适应融合的单目深度估计方法,可有效保留对象的细节和几何... 深度估计网络通常具有较多的网络层数,图像特征在网络编码和解码过程中会丢失大量信息,因此预测的深度图缺乏对象结构细节且边缘轮廓不清晰。本文提出了一种基于多尺度深度图自适应融合的单目深度估计方法,可有效保留对象的细节和几何轮廓。首先,引入压缩与激励残差网络(SE-ResNet),利用注意力机制对不同通道的特征进行编码,从而保留远距离平面深度图的更多细节信息。然后,利用多尺度特征融合网络,融合不同尺度的特征图,得到具有丰富几何特征和语义信息的特征图。最后,利用多尺度自适应深度融合网络为不同尺度特征图生成的深度图添加可学习的权重参数,对不同尺度的深度图进行自适应融合,增加了预测深度图中的目标信息。本文方法在NYU Depth V2数据集上预测的深度图具有更高的准确度和丰富的物体信息,绝对相对误差为0.115,均方根误差为0.525,精确度最高达到99.3%。 展开更多
关键词 单目深度估计 注意力机制 多尺度特征融合网络 多尺度深度自适应融合网络
下载PDF
基于语义辅助和深度时序一致性约束的自监督单目深度估计
2
作者 凌传武 陈华 +1 位作者 徐大勇 张小刚 《湖南大学学报(自然科学版)》 EI CAS CSCD 北大核心 2024年第8期1-12,共12页
通过使用相邻帧之间的光度一致性损失代替深度标签作为网络训练的监督信号,基于图像序列训练的自监督单目深度估计方法近年来受到了广泛的关注.光度一致性约束遵循了静态世界假设,而单目图像序列中存在的运动目标违反该假设,进而影响自... 通过使用相邻帧之间的光度一致性损失代替深度标签作为网络训练的监督信号,基于图像序列训练的自监督单目深度估计方法近年来受到了广泛的关注.光度一致性约束遵循了静态世界假设,而单目图像序列中存在的运动目标违反该假设,进而影响自监督训练过程中相机位姿估计精度和光度损失函数的计算精度.通过检测并移除运动目标区域,可在得到与目标运动解耦的相机位姿的同时,消除运动目标区域对光度损失计算精度的影响.为此,本文提出了一种基于语义辅助和深度时序一致性约束的自监督单目深度估计网络.首先,使用离线的实例分割网络检测可能违反静态世界假设的动态类别目标,并移除对应区域输入位姿网络从而得到与物体运动解耦的相机位姿.其次,基于语义一致性和光度一致性约束,检测动态类别目标的运动状态,使得运动区域的光度损失不影响网络参数的迭代更新.最后,在非运动区域施加深度时序一致性约束,显式对齐当前帧的估计深度值与相邻帧的投影深度值,进一步细化深度预测结果.在KITTI、DDAD以及KITTI Odometry数据集上的实验验证了所提方法与以往的自监督单目深度估计方法相比具有更出色的性能表现. 展开更多
关键词 单目深度估计 自监督学习 运动目标 时序一致性
下载PDF
基于Shuffle-ZoeDepth单目深度估计的苗期玉米株高测量方法
3
作者 赵永杰 蒲六如 +2 位作者 宋磊 刘佳辉 宋怀波 《农业机械学报》 EI CAS CSCD 北大核心 2024年第5期235-243,253,共10页
株高是鉴别玉米种质性状及作物活力的重要表型指标,苗期玉米遗传特性表现明显,准确测量苗期玉米植株高度对玉米遗传特性鉴别与田间管理具有重要意义。针对传统植株高度获取方法依赖人工测量,费时费力且存在主观误差的问题,提出了一种融... 株高是鉴别玉米种质性状及作物活力的重要表型指标,苗期玉米遗传特性表现明显,准确测量苗期玉米植株高度对玉米遗传特性鉴别与田间管理具有重要意义。针对传统植株高度获取方法依赖人工测量,费时费力且存在主观误差的问题,提出了一种融合混合注意力信息的改进ZoeDepth单目深度估计模型。改进后的模型将Shuffle Attention模块加入Decoder模块的4个阶段,使Decoder模块在对低分辨率特征图信息提取过程中能更关注特征图中的有效信息,提升了模型关键信息的提取能力,可生成更精确的深度图。为验证本研究方法的有效性,在NYU-V2深度数据集上进行了验证。结果表明,改进的Shuffle-ZoeDepth模型在NYU-V2深度数据集上绝对相对差、均方根误差、对数均方根误差为0.083、0.301 mm、0.036,不同阈值下准确率分别为93.9%、99.1%、99.8%,均优于ZoeDepth模型。同时,利用Shuffle-ZoeDepth单目深度估计模型结合玉米植株高度测量模型实现了苗期玉米植株高度的测量,采集不同距离下苗期玉米图像进行植株高度测量试验。当玉米高度在15~25 cm、25~35 cm、35~45 cm 3个区间时,平均测量绝对误差分别为1.41、2.21、2.08 cm,平均测量百分比误差分别为8.41%、7.54%、4.98%。试验结果表明该方法可仅使用单个RGB相机完成复杂室外环境下苗期玉米植株高度的精确测量。 展开更多
关键词 苗期玉米 株高 单目深度估计 测量方法 混合注意力机制
下载PDF
无监督单目深度估计研究综述
4
作者 蔡嘉诚 董方敏 +1 位作者 孙水发 汤永恒 《计算机科学》 CSCD 北大核心 2024年第2期117-134,共18页
深度估计作为三维重建、自动驾驶和视觉SLAM等领域中的关键环节,一直是计算机视觉领域研究的热点方向,其中无监督学习的单目深度估计技术由于具有方便部署、计算成本低等优点,受到了学术界和工业界的广泛关注。首先梳理了深度估计的基... 深度估计作为三维重建、自动驾驶和视觉SLAM等领域中的关键环节,一直是计算机视觉领域研究的热点方向,其中无监督学习的单目深度估计技术由于具有方便部署、计算成本低等优点,受到了学术界和工业界的广泛关注。首先梳理了深度估计的基本知识及研究现状,简要介绍了基于参数学习、基于非参数学习、基于有监督学习、基于半监督学习和基于无监督学习的深度估计的优势与不足;其次全面总结了基于无监督学习的单目深度估计研究进展,按照结合可解释性掩膜、结合视觉里程计、结合先验辅助信息、结合生成式对抗网络和实时轻量级网络这五大类对无监督学习的单目深度估计进行归纳和总结,对典型的框架模型进行了介绍和分析;然后,介绍了基于无监督学习的单目深度估计在医学、自动驾驶、农业、军事等领域的应用;最后,简单介绍了用于无监督深度估计的常用数据集,提出了基于无监督学习的单目深度估计未来研究方向,并对这个快速发展领域中的各方向研究进行了展望。 展开更多
关键词 计算机视觉 深度学习 无监督学习 单目深度估计
下载PDF
面向全局特征Transformer架构的单目深度估计
5
作者 吴冰源 王永雄 《控制工程》 CSCD 北大核心 2024年第9期1619-1625,共7页
针对卷积神经网络(convolutional neural networks,CNN)全局特征提取不足导致深度估计错误的问题,提出了一种面向全局特征的深度学习网络用于单目深度估计。该网络采用编码器-解码器的端到端架构,其中,编码器为具有多阶段输出的Transfor... 针对卷积神经网络(convolutional neural networks,CNN)全局特征提取不足导致深度估计错误的问题,提出了一种面向全局特征的深度学习网络用于单目深度估计。该网络采用编码器-解码器的端到端架构,其中,编码器为具有多阶段输出的Transformer网络,可提取多尺度的全局特征;解码器由CNN构成。此外,为抑制深度无关的细节信息影响,解码器末端采用了大卷积核注意力(large kernel attention,LKA)模块提升全局特征的提取能力。在室外场景数据集KITTI和室内场景数据集NYU Depth v2上的实验结果表明,面向全局特征的网络有助于生成高精度的、细节特征完整的深度图。与近期提出的同样基于CNN-Transformer的方法 AdaBins相比,所提出网络的参数量减少了42.31%,均方根误差减小了约2%。 展开更多
关键词 单目深度估计 TRANSFORMER 大卷积核注意力 全局特征
原文传递
图像与稀疏激光点融合的单目深度估计
6
作者 蔡文靖 刘鑫 +1 位作者 王礼贺 纪宇航 《激光与红外》 CAS CSCD 北大核心 2024年第9期1373-1379,共7页
近年来,随着深度学习的快速发展,涌现出大量单目深度估计算法。但由于缺乏视差等几何约束,限制了算法深度预测精度的进一步提升,无法满足实际应用的需求。因此本文提出了一个二维图像与稀疏激光点融合的深度估计网络,通过实时输入少量... 近年来,随着深度学习的快速发展,涌现出大量单目深度估计算法。但由于缺乏视差等几何约束,限制了算法深度预测精度的进一步提升,无法满足实际应用的需求。因此本文提出了一个二维图像与稀疏激光点融合的深度估计网络,通过实时输入少量激光点的高精度测距结果,提高深度预测精度;其次,为解决自采集数据激光雷达点分布不均匀问题,在有监督网络基础上,加入相对位姿估计网络与深度估计网络联合训练,同时增加光度一致性、深度重投影两个损失函数;最终,利用自采集数据进行实验分析,实验结果表明,当使用160个激光点时,即可将深度预测绝对相对误差由10.1%降至7.6%,当使用1280个激光点时,深度预测绝对相对误差变化趋于平稳,降至4.1%。 展开更多
关键词 单目深度估计 稀疏激光点 残差神经网络
下载PDF
基于转置注意力的多尺度深度融合单目深度估计
7
作者 程亚子 雷亮 +1 位作者 陈瀚 赵毅然 《计算机与现代化》 2024年第9期121-126,共6页
单目深度估计是计算机视觉领域中一项基础任务,其目标是通过单张图像预测深度图,并获取每个像素位置的深度信息。本文提出一种新的单目深度估计网络结构,旨在进一步提高网络的预测准确性。转置注意力机制在降低参数量和计算量的同时引... 单目深度估计是计算机视觉领域中一项基础任务,其目标是通过单张图像预测深度图,并获取每个像素位置的深度信息。本文提出一种新的单目深度估计网络结构,旨在进一步提高网络的预测准确性。转置注意力机制在降低参数量和计算量的同时引入了自注意力机制,以关注图像中的特定区域,并结合不同通道之间的信息。这种机制能够有效地关注到图像中的细小区域和边缘信息,并进行学习。本文还提出一种改进的转置注意力机制,以更少的参数量保留语义信息。多尺度深度融合根据不同通道提取不同深度特征的特点,计算每个通道的平均深度,以增强模型的深度感知能力。此外,它能够建模垂直距离的长距离关系,有效地分离物体之间的边缘,有助于减少细粒度信息的损失。最后,本文在NYU Depth V2数据集和KITTI数据集上进行实验,验证了所提出模块的有效性,并取得了出色的性能表现。 展开更多
关键词 深度学习 单目深度估计 转置注意力 多尺度深度融合 通道平均深度
下载PDF
面向交通场景基于双注意力机制和自适应代价卷的自监督单目深度估计
8
作者 武港 刘威 +3 位作者 胡骏 程帅 杨文兴 孙令岿 《电子学报》 EI CAS CSCD 北大核心 2024年第5期1670-1678,共9页
针对当前交通场景下自监督单目深度估计存在特征表达能力弱、深度图局部细节模糊、深度估计精度低的问题,提出一种基于双注意力机制和自适应代价卷的自监督单目深度估计方法.该方法首先利用双注意力机制的特征提取网络,结合通道注意力... 针对当前交通场景下自监督单目深度估计存在特征表达能力弱、深度图局部细节模糊、深度估计精度低的问题,提出一种基于双注意力机制和自适应代价卷的自监督单目深度估计方法.该方法首先利用双注意力机制的特征提取网络,结合通道注意力和空间注意力,对提取的场景特征进行自适应加权,增强特征表达能力.其次,根据提取的全局特征自适应的构建代价卷,引导网络学习精细的深度特征,提升网络模型对深度图局部细节的学习能力,解决现有方法深度估计精度低的问题.在自动驾驶公开数据集KITTI、Cityscapes上的实验结果表明,本文方法优于目前主流方法. 展开更多
关键词 单目深度估计 自监督 注意力机制 自适应 代价卷
下载PDF
基于边缘强化的无监督单目深度估计
9
作者 曲熠 陈莹 《系统工程与电子技术》 EI CSCD 北大核心 2024年第1期71-79,共9页
为解决无监督单目深度估计边缘深度估计不准确的问题,提出了一种基于边缘强化的无监督单目深度估计网络模型。该模型由单视图深度网络和姿态网络两部分构成,均采用编解码结构,其中单视图深度网络编码器使用高分辨率网络(high-resolution... 为解决无监督单目深度估计边缘深度估计不准确的问题,提出了一种基于边缘强化的无监督单目深度估计网络模型。该模型由单视图深度网络和姿态网络两部分构成,均采用编解码结构,其中单视图深度网络编码器使用高分辨率网络(high-resolution net,HRNet)作为骨干网络,在整个过程中保持高分辨率表示,有利于提取精确空间特征;单视图深度网络解码器引入条状卷积,细化深度边缘附近的深度变化,同时利用经典的高斯拉普拉斯算子增强边缘细节,最终充分利用深度边缘信息提高深度估计质量。在KITTI数据集中进行的实验结果表明:所提模型具有较好的深度估计性能,能够使深度图中的目标边缘更加清晰,细节更加丰富。 展开更多
关键词 单目深度估计 无监督学习 条状卷积 边缘增强
下载PDF
基于尺度线索增强的无监督单目深度估计
10
作者 曲熠 陈莹 《电子学报》 EI CAS CSCD 北大核心 2024年第9期3217-3227,共11页
由于单目深度估计中图像与深度图存在一对多的对应关系,单目深度估计本身就存在着尺度歧义的问题.因此,本文引入基于多视图立体匹配(Multi-View Stereo,MVS)的单目多帧深度估计方法,构造移动深度,挖掘尺度线索,将传统单目深度估计与MVS... 由于单目深度估计中图像与深度图存在一对多的对应关系,单目深度估计本身就存在着尺度歧义的问题.因此,本文引入基于多视图立体匹配(Multi-View Stereo,MVS)的单目多帧深度估计方法,构造移动深度,挖掘尺度线索,将传统单目深度估计与MVS深度估计有机结合,以改善单目深度估计几何建模中固有的模糊性问题.在此基础上,设计两个通道注意力模块,分别提高网络的场景结构感知能力和对局部信息的处理能力,从而更充分地融合不同尺度的特征,产生更精确、更清晰的深度预测.在KITTI数据集的测试结果中,本文方法的平均相对误差和平方相对误差相较基准网络分别最高提升4.7%和8.0%,所有误差和准确率指标均超越其他主流的无监督单目深度估计方法. 展开更多
关键词 单目深度估计 无监督学习 深度学习 多尺度 通道注意力
下载PDF
结合金字塔结构和注意力机制的单目深度估计
11
作者 李滔 胡婷 武丹丹 《图学学报》 CSCD 北大核心 2024年第3期454-463,共10页
单目深度估计是由单幅彩色图像预测出一幅稠密的深度图像。针对目前单目深度估计算法存在边界模糊、上下文信息捕捉能力不足等问题,提出了一种结合金字塔结构和注意力机制的单目深度估计算法。算法采用编码器-解码器的总体框架,其中编... 单目深度估计是由单幅彩色图像预测出一幅稠密的深度图像。针对目前单目深度估计算法存在边界模糊、上下文信息捕捉能力不足等问题,提出了一种结合金字塔结构和注意力机制的单目深度估计算法。算法采用编码器-解码器的总体框架,其中编码器选用PVTv2网络,目的是利用Transformer网络在建模全局信息方面的优势以获取更充分的全局语义信息;解码器由深度估计主分支和2个金字塔子分支组成。深度估计主分支通过空间和通道注意力机制来自适应地关注编码器和解码器特征间重要的特征区域和特征通道;拉普拉斯金字塔子分支和深度残差金字塔子分支旨在从彩色图像和深度估计主分支深度特征中学习到丰富的局部信息并传递到深度估计主分支,进一步解决单目深度估计中细节缺失、结构混乱等问题。实验结果表明,与先进的算法P3Depth相比,在室内公开数据集NYU Depth V2上,该算法的δ_(1.25)阈值精度提升了1.22%,绝对误差和根均方误差分别降低了5.8%和2.8%;而在室外公开数据集KITTI上,该算法的绝对误差、根均方对数误差和根均方误差分别降低了8.5%,3.9%和0.4%。该算法提升了深度估计精度并得到了良好的视觉呈现效果。 展开更多
关键词 深度学习 单目深度估计 金字塔结构 注意力机制 TRANSFORMER
下载PDF
面向软体机械臂抓取的单目深度估计方法
12
作者 张竞豪 邓礼楠 沈逸 《控制工程》 CSCD 北大核心 2024年第2期352-358,共7页
软体机械臂在非结构化环境中执行物体抓取任务时,具有柔顺性和安全性的优势。但由于传统的立体视觉系统难以安装在软体机械臂上,软体机械臂获取目标物体的三维位置仍存在挑战。首先,建立了描述软体机械臂运动状态和目标物体位置的协作... 软体机械臂在非结构化环境中执行物体抓取任务时,具有柔顺性和安全性的优势。但由于传统的立体视觉系统难以安装在软体机械臂上,软体机械臂获取目标物体的三维位置仍存在挑战。首先,建立了描述软体机械臂运动状态和目标物体位置的协作坐标系模型。随后,提出了一种改进运动恢复结构的单目深度估计方法:①针对深度估计的实时性要求,提出采用主成分分析-尺度不变特征变换(principal component analysis-scale invariant feature transform,PCA-SIFT)方法对特征描述符降维;②将机械臂末端的移动距离作为约束恢复深度估计的真实尺度。最后,通过实验验证了所提出的协作坐标系和深度估计方法的有效性。实验结果表明,所提深度估计方法在多种光照和遮挡环境中,特征匹配时间缩短了16.02%,平均误差控制在5 mm以内。 展开更多
关键词 软体机器人 单目深度估计 机器人抓取
原文传递
基于局部区域强化的单目深度估计算法
13
作者 王乐刚 陈程立诏 《青岛大学学报(自然科学版)》 CAS 2024年第1期39-44,51,共7页
针对深度估计场景中复杂纹理和复杂几何结构造成的物体边界扭曲、局部细节信息丢失等问题,提出基于局部区域强化的单目深度估计方法。首先,利用基于卷积神经网络的深度估计模型,得到低分辨率的图像;然后,引入显著目标检测模型,得到高分... 针对深度估计场景中复杂纹理和复杂几何结构造成的物体边界扭曲、局部细节信息丢失等问题,提出基于局部区域强化的单目深度估计方法。首先,利用基于卷积神经网络的深度估计模型,得到低分辨率的图像;然后,引入显著目标检测模型,得到高分辨率的显著图像,监督生成深度图;最后将显著图与深度图融合,以此提高整个图像的深度估计精度。公共数据集上的实验结果表明,该方法可以显著提高单目深度估计的精度。 展开更多
关键词 单目深度估计 局部区域强化 卷积神经网络 深度学习
下载PDF
基于单目深度估计变电站场景的语义分割模型
14
作者 张娜 王大伟 《电力系统装备》 2024年第5期179-181,共3页
针对现有语义分割方法缺乏三维深度几何信息的有效学习,导致复杂变电站场景下对物体语义分割精度低的问题,文章提出了基于单目深度估计变电站场景的语义分割模型。该模型由DeepLab v3+辅图像语义分割模型与AdaBinsModule单目深度估计模... 针对现有语义分割方法缺乏三维深度几何信息的有效学习,导致复杂变电站场景下对物体语义分割精度低的问题,文章提出了基于单目深度估计变电站场景的语义分割模型。该模型由DeepLab v3+辅图像语义分割模型与AdaBinsModule单目深度估计模型两部分组成。首先,AdaBinsModule根据可见光图像生成对应深度图,从而提取到图像中目标物体在三维空间中的深度信息。其次,采用矩阵相乘的方式将深度图中深度信息作为权重与可见光图像融合,并根据既定深度阈值弱化图像中远距离无效背景像素,以减少其在后续图像分割阶段对目标物体分割精度的影响。最后,将融合后的图像输入DeepLab v3+辅图像语义分割模型中进行语义分割。试验表明,相比基准模型,文章所提方法能更好地提取分割目标的深度轮廓特征,语义分割精度提升明显。 展开更多
关键词 单目深度估计 语义分割 图像融合 深度 变电站
下载PDF
基于多尺度特征融合的单目深度估计算法
15
作者 周晓吉 《智能计算机与应用》 2024年第9期34-40,共7页
在当前的单目深度算法中,堆叠的卷积层和过度的下采样操作会造成特征图分辨率和高层信息的损失,影响了深度图整体的精度。针对这一问题,本文提出了一个基于多尺度特征融合的单目深度估计算法。采用了递进式的编-解码结构,由浅到深逐级... 在当前的单目深度算法中,堆叠的卷积层和过度的下采样操作会造成特征图分辨率和高层信息的损失,影响了深度图整体的精度。针对这一问题,本文提出了一个基于多尺度特征融合的单目深度估计算法。采用了递进式的编-解码结构,由浅到深逐级提取不同尺度的信息,不同层级不同分辨率的特征连接在一起,形成了多尺度特征融合结构;编码器采用U^(2)-Net的设计架构,内部通过Vision Transformer模块,使得模型能够在编码过程中拥有全局的感受野,并且避免了下采样操作,从而减少了特征图分辨率和高层信息的损失;解码器中设计了U型残差块,能更好地融合不同阶段内的多尺度特征。在KITTI和NYU-Depth V2数据集上进行了实验,实验结果表明本文所提算法在各项指标上优于大部分同类型算法。 展开更多
关键词 单目深度估计 编-解码器结构 Vision Transformer U^(2)-Net
下载PDF
轻量化自监督单目深度估计
16
作者 刘佳 林潇 +2 位作者 陈大鹏 徐闯 石豪 《计算机系统应用》 2023年第8期116-125,共10页
目前,大多数的增强现实和自动驾驶应用不仅会使用到深度网络估计的深度信息,还会使用到位姿网络估计的位姿信息.将位姿网络和深度网络同时集成到嵌入式设备上,会极大地消耗内存.为解决这一问题,提出一种深度网络和位姿网络共用特征提取... 目前,大多数的增强现实和自动驾驶应用不仅会使用到深度网络估计的深度信息,还会使用到位姿网络估计的位姿信息.将位姿网络和深度网络同时集成到嵌入式设备上,会极大地消耗内存.为解决这一问题,提出一种深度网络和位姿网络共用特征提取器的方法,使模型保持在一个轻量级的尺寸.此外,通过带有线性结构的深度可分离卷积轻量化深度网络,使网络在不丢失过多细节信息前提下还可获得更少的参数量.最后,通过在KITTI数据集上的实验表明,与同类算法相比,该位姿网络和深度网络参数量只有的35.33 MB.同时,恢复深度图的平均绝对误差也保持在0.129. 展开更多
关键词 深度学习 单目深度估计 自监督学习 轻量化 计算机视觉
下载PDF
基于高分辨率网络的自监督单目深度估计方法 被引量:2
17
作者 蒲正东 陈姝 +1 位作者 邹北骥 蒲保兴 《计算机辅助设计与图形学学报》 EI CSCD 北大核心 2023年第1期118-127,共10页
使用深度学习方法进行单目深度估计时,由于使用多级下采样会出现重建结果细节信息缺失、边缘轮廓模糊等问题.为此,提出一种基于高分辨率网络的自监督单目深度估计方法.首先,通过并行连接使得特征图在编码过程中始终保持高分辨率表示,以... 使用深度学习方法进行单目深度估计时,由于使用多级下采样会出现重建结果细节信息缺失、边缘轮廓模糊等问题.为此,提出一种基于高分辨率网络的自监督单目深度估计方法.首先,通过并行连接使得特征图在编码过程中始终保持高分辨率表示,以充分地保留细节信息;其次,为了提高编码器的学习能力,在编码部分引入注意力模块,对图像特征进行筛选和提炼;最后,针对深度估计的多义性问题,利用非相邻帧图像之间的一致性,设计了一种有效的损失函数,并使用可靠性掩膜来消除动点和遮挡点的干扰.在TensorFlow框架下采用KITTI和Cityscapes数据集进行实验,实验结果表明,与已有深度估计方法相比,该方法不仅能够保留预测深度的边缘信息,而且能够提高预测深度的准确性,可达到0.119的平均相对误差. 展开更多
关键词 单目深度估计 卷积神经网络 自监督 编码器 深度估计
下载PDF
基于层级特征融合的室内自监督单目深度估计 被引量:3
18
作者 程德强 张华强 +2 位作者 寇旗旗 吕晨 钱建生 《光学精密工程》 EI CAS CSCD 北大核心 2023年第20期2993-3009,共17页
针对目前自监督单目深度估计网络在充斥着大量低纹理、低光照区域的室内复杂场景中存在预测深度信息不精确、物体边缘模糊以及细节丢失严重等问题,本文提出一种基于层级特征融合的室内自监督单目深度估计网络模型。首先,通过映射一致性... 针对目前自监督单目深度估计网络在充斥着大量低纹理、低光照区域的室内复杂场景中存在预测深度信息不精确、物体边缘模糊以及细节丢失严重等问题,本文提出一种基于层级特征融合的室内自监督单目深度估计网络模型。首先,通过映射一致性图像增强模块来处理室内图像,提升低光照区域可见性并且保持亮度一致性,丰富纹理细节,一定程度上解决了训练网络时出现模糊假平面恶化模型的问题。然后,设计结合基于注意力机制的跨层级特征调整模块的深度估计网络,充分融合编码器以及编-解码器多层级特征信息,提升网络的特征利用能力,缩小预测深度与真实深度的语义差距。最后,设计基于图像风格特征的格拉姆矩阵相似性损失函数作为额外的自监督信号约束网络模型,提升网络预测深度的能力,进一步提高了预测深度的精度。在NYU Depth V2和ScanNet室内数据集上进行训练与测试,正确预测深度像素的比例能够分别达到81.9%和76.0%。实验结果表明,相比现有主要的室内自监督单目深度估计网络,本文网络模型很好地保持了物体边缘和细节信息,有效地提高了预测深度的精度。 展开更多
关键词 自监督 单目深度估计 图像增强 层级特征融合 格拉姆矩阵
下载PDF
基于单目深度估计的智能驾驶路径规划方法
19
作者 张银胜 崔志强 +3 位作者 王兴涛 孙佳琪 胡宇翔 单慧琳 《国外电子测量技术》 北大核心 2023年第8期71-79,共9页
为了提高信息处理的速度和智能驾驶的安全性,提出一种基于单目深度估计的智能驾驶路径规划方法。首先利用单目摄像头采集车辆前、后方道路视频流数据并进行抽帧,然后构建改进的深度残差网络进行深度估计运算,从而形成道路的3D云图,即道... 为了提高信息处理的速度和智能驾驶的安全性,提出一种基于单目深度估计的智能驾驶路径规划方法。首先利用单目摄像头采集车辆前、后方道路视频流数据并进行抽帧,然后构建改进的深度残差网络进行深度估计运算,从而形成道路的3D云图,即道路上车辆、行人的分布情况及距离等实时信息,最后结合多目标跟踪算法合理规划驾驶路径。相较于其他方法,将拉普拉斯金字塔结构引入解码器,并将编码特征输入到不同的视频流中解码深度残差运算,在事物识别和分割过程中使用简单的特征基线计算分割轮廓,提高了距离估计和速度估算等的准确性。实验结果表明,单目深度估计模型的平方相对误差为0.551,均方根误差为3.669,对数均方根误差为0.158,阈值精度分别为0.912、0.968、0.989,实现了较好的评测结果。速度误差和距离误差均小于5%,角度误差约为0.6%,误差较小,性能良好。由此可见,所提出的方法具有更强的路况感知能力与更准确的路径决策能力。 展开更多
关键词 单目深度估计 智能驾驶 路径规划 距离估计 速度估计
原文传递
融合全景分割的单目深度估计网络 被引量:1
20
作者 任克宇 仝明磊 《计算机应用与软件》 北大核心 2023年第7期215-221,共7页
针对遮挡和杂乱光线导致的不同区域深度边缘模糊、边界伪影等问题,提出一种结合多任务轻量型卷积神经网络的单目深度图像估计方法。利用全景分割网络来辅助单幅图片的深度估计,选择MobileNetv2作为特征提取网络,解码器端融合以上两类任... 针对遮挡和杂乱光线导致的不同区域深度边缘模糊、边界伪影等问题,提出一种结合多任务轻量型卷积神经网络的单目深度图像估计方法。利用全景分割网络来辅助单幅图片的深度估计,选择MobileNetv2作为特征提取网络,解码器端融合以上两类任务进行相似性辅助决策。提出一种多任务融合模块,包括多尺度映射单元和多任务融合单元两部分,利用深度空洞卷积扩大不同感受野,融合多任务来优化深度图像的估计。此外编解码器结构之间添加跳跃连接实现不同层次的知识传递。在NYUdepth-v2数据集上的对比实验结果表明,该方法深度图估计结果更加清晰,并能有效去除深度图中的边界模糊,同时该网络在参数数量上相较大多数估计方法大幅度减少,准确率明显提升。 展开更多
关键词 单目深度估计 多任务学习 物体遮挡 边界模糊 全景分割 参数融合
下载PDF
上一页 1 2 5 下一页 到第
使用帮助 返回顶部