期刊文献+
共找到3篇文章
< 1 >
每页显示 20 50 100
Automatic road extraction framework based on codec network
1
作者 WANG Lin SHEN Yu +2 位作者 ZHANG Hongguo LIANG Dong NIU Dongxing 《Journal of Measurement Science and Instrumentation》 CAS CSCD 2024年第3期318-327,共10页
Road extraction based on deep learning is one of hot spots of semantic segmentation in the past decade.In this work,we proposed a framework based on codec network for automatic road extraction from remote sensing imag... Road extraction based on deep learning is one of hot spots of semantic segmentation in the past decade.In this work,we proposed a framework based on codec network for automatic road extraction from remote sensing images.Firstly,a pre-trained ResNet34 was migrated to U-Net and its encoding structure was replaced to deepen the number of network layers,which reduces the error rate of road segmentation and the loss of details.Secondly,dilated convolution was used to connect the encoder and the decoder of network to expand the receptive field and retain more low-dimensional information of the image.Afterwards,the channel attention mechanism was used to select the information of the feature image obtained by up-sampling of the encoder,the weights of target features were optimized to enhance the features of target region and suppress the features of background and noise regions,and thus the feature extraction effect of the remote sensing image with complex background was optimized.Finally,an adaptive sigmoid loss function was proposed,which optimizes the imbalance between the road and the background,and makes the model reach the optimal solution.Experimental results show that compared with several semantic segmentation networks,the proposed method can greatly reduce the error rate of road segmentation and effectively improve the accuracy of road extraction from remote sensing images. 展开更多
关键词 remote sensing image road extraction ResNet34 u-Net channel attention mechanism sigmoid loss function
下载PDF
基于YOLO-Pose的城市街景小目标行人姿态估计算法
2
作者 马明旭 马宏 宋华伟 《计算机工程》 CAS CSCD 北大核心 2024年第4期177-186,共10页
现有的姿态估计算法在城市街景中对小目标行人的检测效果不佳。针对该问题,提出一种基于YOLO-Pose的小目标行人姿态估计算法YOLO-Pose-CBAM。通过引入CBAM注意力机制模块,在不增加过多计算量的前提下,增强网络聚焦小目标行人区域的能力... 现有的姿态估计算法在城市街景中对小目标行人的检测效果不佳。针对该问题,提出一种基于YOLO-Pose的小目标行人姿态估计算法YOLO-Pose-CBAM。通过引入CBAM注意力机制模块,在不增加过多计算量的前提下,增强网络聚焦小目标行人区域的能力,提升算法对小目标行人的敏感度,同时在主干网络中使用4个不同尺寸的检测头,丰富算法对图片中不同大小行人的检测手段;在骨干网络和颈部之间架设2条跨层级联通道,提升浅层网络与深层网络之间的特征融合能力,进一步增强信息交流,降低小目标行人漏检率;引入SIoU重新定义边界框回归的定位损失函数,加快训练的收敛速度,提高检测精度;采用k-means++算法代替k-means算法对数据集中标注的锚框进行聚类,避免聚类中心初始化时导致的局部最优解问题,从而选择出更适合检测小目标行人的锚框。对比实验结果表明,在小目标行人Wider Keypoints数据集上,所提算法相较于YOLO-Pose和YOLOv7-Pose在平均精度上分别提升了4.6和6.5个百分比。 展开更多
关键词 YOLO-Pose算法 姿态估计 跨层级联 CBAM注意力机制 SIo u损失函数 k-means%PLuS%%PLuS%算法
下载PDF
基于自注意力机制和改进YOLOv5s的小目标生物检测
3
作者 戚学通 袁红春 《湖南农业大学学报(自然科学版)》 CAS CSCD 北大核心 2024年第3期108-114,共7页
为了快速准确地检测出小目标生物(海参、扇贝、海星和海胆)在复杂水下环境的位置及所属种类,提出一种基于改进YOLOv5s的小目标生物检测算法。在特征提取阶段,引入基于多头自注意力设计的自注意力残差模块,强化网络全局建模能力的同时,... 为了快速准确地检测出小目标生物(海参、扇贝、海星和海胆)在复杂水下环境的位置及所属种类,提出一种基于改进YOLOv5s的小目标生物检测算法。在特征提取阶段,引入基于多头自注意力设计的自注意力残差模块,强化网络全局建模能力的同时,强化目标特征信息;在特征融合阶段,将特征融合网络调整为添加横向连接的双向特征金字塔结构,增强网络融合不同阶段特征信息的能力;在检测阶段,舍弃大目标检测尺度并添加小目标的检测尺度,提升小目标生物的检测精度;最后,引入α–CIo U损失函数作为模型边界框回归损失函数,提高边界框回归精度,进而提高算法检测准确率。定性试验中,几乎所有肉眼可见的水产品目标都被改进模型检出,并正确标记,体现了改进算法的有效性。α值选取试验中,α值为2.0时效果最佳,平均精度均值(mAP)均优于其他值的,达到0.857,较α值为1.0时的提升了0.016。消融试验中,添加任一优化方法均会提升改进模型的检测精度,最终改进模型的m AP达0.873,较原模型的提升了0.032,模型参数量减少了26.8%,仅有5 M。对比试验中,改进模型的m AP较Faster RCNN、YOLOv3、YOLOv4、YOLOv5s、YOLOvX、SSD、NAS–FCOS、改进YOLOv5等的提升了0.020以上;改进模型在本地服务器的检测速度达139帧/s,较YOLOv5s的提升了14帧/s,略逊于以检测速度著称的SSD模型的。可见,改进模型能满足轻量和实时性要求。改进模型也成功部署到安卓移动设备中。 展开更多
关键词 小目标生物检测 YOLOv5s 自注意力机制 α–CIo u损失 双向特征金字塔 移动设备部署
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部