随着深度学习在国内目标检测的不断应用,常规的大、中目标检测已经取得惊人的进步,但由于卷积网络本身的局限性,针对小目标检测依然会出现漏检、误检的问题,以数据集Visdrone2019和数据集FloW-Img为例,对YOLOv7模型进行研究,在网络结构...随着深度学习在国内目标检测的不断应用,常规的大、中目标检测已经取得惊人的进步,但由于卷积网络本身的局限性,针对小目标检测依然会出现漏检、误检的问题,以数据集Visdrone2019和数据集FloW-Img为例,对YOLOv7模型进行研究,在网络结构上对骨干网的ELAN模块进行改进,将Focal NeXt block加入到ELAN模块的长短梯度路径中融合来强化输出小目标的特征质量和提高输出特征包含的上下文信息含量,在头部网络引入RepLKDeXt模块,该模块不仅可以取代SPPCSPC模块来简化模型整体结构还可以利用多通道、大卷积核和Cat操作来优化ELAN-H结构,最后引入SIOU损失函数取代CIOU函数以此提高该模型的鲁棒性。结果表明改进后的YOLOv7模型参数量减少计算复杂性降低并在小目标密度高的Visdrone 2019数据集上的检测性能近似不变,在小目标稀疏的FloW-Img数据集上涨幅9.05个百分点,进一步简化了模型并增加了模型的适用范围。展开更多
针对无人机图像中由于目标微小且相互遮挡、特征信息少导致检测精度低的问题,提出一种基于改进YOLOv7的无人机图像目标检测算法。在颈部和检测头中加入了坐标卷积,能更好地感受特征图中目标的位置信息;增加P2检测层,减少小目标特征丢失...针对无人机图像中由于目标微小且相互遮挡、特征信息少导致检测精度低的问题,提出一种基于改进YOLOv7的无人机图像目标检测算法。在颈部和检测头中加入了坐标卷积,能更好地感受特征图中目标的位置信息;增加P2检测层,减少小目标特征丢失、提高小目标检测能力;提出多信息流融合注意力机制——Spatial and Channel Attention Mechanism(SCA),动态调整注意力对空间信息流和语义信息流的关注,获得更丰富的特征信息以提高捕获目标的能力;更换损失函数为SIoU,加快模型收敛速度。在公开数据集VisDrone2019上进行对比实验,改进后算法的mAP50值相比YOLOv7提高了4%,达到了52.4%,FPS为37,消融实验验证了每个模块均提升了检测精度。实验表明,改进后的算法能较好地检测无人机图像中的目标。展开更多
文摘随着深度学习在国内目标检测的不断应用,常规的大、中目标检测已经取得惊人的进步,但由于卷积网络本身的局限性,针对小目标检测依然会出现漏检、误检的问题,以数据集Visdrone2019和数据集FloW-Img为例,对YOLOv7模型进行研究,在网络结构上对骨干网的ELAN模块进行改进,将Focal NeXt block加入到ELAN模块的长短梯度路径中融合来强化输出小目标的特征质量和提高输出特征包含的上下文信息含量,在头部网络引入RepLKDeXt模块,该模块不仅可以取代SPPCSPC模块来简化模型整体结构还可以利用多通道、大卷积核和Cat操作来优化ELAN-H结构,最后引入SIOU损失函数取代CIOU函数以此提高该模型的鲁棒性。结果表明改进后的YOLOv7模型参数量减少计算复杂性降低并在小目标密度高的Visdrone 2019数据集上的检测性能近似不变,在小目标稀疏的FloW-Img数据集上涨幅9.05个百分点,进一步简化了模型并增加了模型的适用范围。
文摘针对无人机图像中由于目标微小且相互遮挡、特征信息少导致检测精度低的问题,提出一种基于改进YOLOv7的无人机图像目标检测算法。在颈部和检测头中加入了坐标卷积,能更好地感受特征图中目标的位置信息;增加P2检测层,减少小目标特征丢失、提高小目标检测能力;提出多信息流融合注意力机制——Spatial and Channel Attention Mechanism(SCA),动态调整注意力对空间信息流和语义信息流的关注,获得更丰富的特征信息以提高捕获目标的能力;更换损失函数为SIoU,加快模型收敛速度。在公开数据集VisDrone2019上进行对比实验,改进后算法的mAP50值相比YOLOv7提高了4%,达到了52.4%,FPS为37,消融实验验证了每个模块均提升了检测精度。实验表明,改进后的算法能较好地检测无人机图像中的目标。