基于改进HRNet架构的图像语义分割算法应用研究被引量：1

Application Study of Image Semantic Segmentation Algorithm Based on Improved HRNet Architecture

下载PDF

导出

摘要针对当前主流图像语义分割算法提取的特征图分辨率过低,上采样过程中有效语义信息损失过大,易丢失像素点和目标物体区域相关性的问题,提出了一种基于HRNet-OCR联合交叉注意力机制的图像语义分割算法。该法先采用HRNet替代ResNet作为特征提取骨干网络,保留特征提取过程中的高分辨率信息;然后融合OCR算法对图像进行初步的粗略分割,确定目标对象的大致区域;最后,引入交叉注意力机制模块对像素和对象区域的关联程度加权计算,实现像素的精准分类,保留分割区域的边缘细节。实验结果表明,与常见的分割算法FCN、PSPNet、DeepLabv3+等相比,所提算法在ADE20K、Cityscapes、PASCAL VOC 2012数据集上的mIoU分别提升5.37%、3.09%和2.71%,且可以有效保留细节信息,大幅度改善分割精度。 Aiming at the problems of low resolution of feature maps extracted by current mainstream image semantic segmentation algorithms, excessive loss of effective semantic information during the upsampling process, and easy loss of pixels and object region correlation, an image semantic segmentation algorithm based on the joint HRNet-OCR criss-cross attention mechanism is proposed. The method first adopts HRNet instead of ResNet as the feature extraction backbone network to retain the highresolution information in the feature extraction process;then fuses the OCR algorithm to perform initial rough segmentation of the image to determine the approximate region of the target object;finally, the criss-cross attention mechanism module is introduced to weight the degree of correlation between pixels and object regions to achieve accurate classification of pixels and retain the segmented regio’s edge details. The experimental results show that compared with the common segmentation algorithms FCN, PSPNet,DeepLabv3+, etc., the proposed algorithm can improve the mIoU by 5.37%, 3.09%, and 2.71% on ADE20K, Cityscapes, and PASCAL VOC 2012 datasets, respectively, and can effectively retain the detail information and significantly improve the segmentation accuracy.

作者胡航牛晓伟左昊金重阳 Hu Hang;Niu Xiaowei;Zuo Hao;Jin Chongyang(School of Electronic and Information Engineering,Chongqing Three Gorges University,Chongqing 404100)

机构地区重庆三峡学院电子与信息工程学院

出处《现代计算机》 2022年第18期23-29,共7页 Modern Computer

基金国家重点研发计划(2021YFB3901405) 科技部专项课题(2021YFB3901400) 重庆市科技局面上项目(cstc2019jcyj-msxm1328) 重庆市教委科技项目(KJQN202101215、KJQN202101226) 三峡库区地质环境监测与灾害预警—重庆市重点实验室开放基金(ZD2020A0301)。

关键词语义分割 HRNet OCR 交叉注意力机制 semantic segmentation HRNet OCR criss-cross attention mechanism

分类号 TP391.41 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

同被引文献11

1赵晋陵,詹媛媛,王娟,黄林生.基于SE-UNet的冬小麦种植区域提取方法[J].农业机械学报,2022,53(9):189-196. 被引量：11
2田野,张清,李希灿,武彬,郑玉彬.基于多时相影像的棉花种植信息提取方法研究[J].干旱区研究,2017,34(2):423-430. 被引量：14
3黄双燕,杨辽,陈曦,姚远.机器学习法的干旱区典型农作物分类[J].光谱学与光谱分析,2018,38(10):3169-3176. 被引量：35
4董金玮,吴文斌,黄健熙,尤南山,何盈利,闫慧敏.农业土地利用遥感信息提取的研究进展与展望[J].地球信息科学学报,2020,22(4):772-783. 被引量：41
5樊湘鹏,周建平,许燕,李开敬,温德圣.基于优化Faster R-CNN的棉花苗期杂草识别与定位[J].农业机械学报,2021,52(5):26-34. 被引量：43
6刘传迹,金晓斌,徐伟义,乔郭亮,杨绪红,周寅康.2000-2020年南疆地区棉花种植空间格局及其变化特征分析[J].农业工程学报,2021,37(16):223-232. 被引量：16
7伊尔潘·艾尼瓦尔,买买提·沙吾提,买合木提·巴拉提.基于GF-2影像和Unet模型的棉花分布识别[J].自然资源遥感,2022,34(2):242-250. 被引量：10
8Jiantao Liu,Quanlong Feng,Jianhua Gong,Jieping Zhou,Jianming Liang,Yi Li.Winter wheat mapping using a random forest classifier combined with multi-temporal and multi-sensor data[J].International Journal of Digital Earth,2018,11(8):783-802. 被引量：5
9王汇涵,张泽,康孝岩,林皎,印彩霞,马露露,黄长平,吕新.基于Sentinel-2A的棉花种植面积提取及产量预测[J].农业工程学报,2022,38(9):205-214. 被引量：10
10吕绍伦,赵阳,陈万基,张灿然,穆耶赛尔•赛达合麦提,卢吉瑞.基于遥感云计算的阿拉尔市棉花种植面积提取[J].棉花科学,2022,44(4):19-25. 被引量：4

引证文献1

1靳宁,孙林,张东彦,张选,李毅,姚宁.基于CBAM-U-HRNet模型和Sentinel-2数据的棉花种植地块提取[J].农业机械学报,2023,54(11):159-168. 被引量：1

二级引证文献1

1李恒凯,王洁,周艳兵,龙北平.融合时序Sentinel数据多特征优选的南方丘陵区油茶种植区提取[J].农业机械学报,2024,55(7):241-251.

1支宇,王冰滢.基于符号修辞学的平面设计方法研究[J].包装工程,2021,42(6):226-231. 被引量：10
2曹路洋,李建微.面向深度学习的胰腺医学图像分割方法研究进展[J].小型微型计算机系统,2022,43(12):2591-2604. 被引量：6
3周永进,高瑞杰,江春燕,邓晶晶,夏水伟,沈少博,王祖飞,纪建松.基于CT影像组学列线图鉴别非功能性神经内分泌肿瘤与实性假乳头状瘤[J].温州医科大学学报,2022,52(8):645-651.
4石育越,宁芊.基于对比约束的轻量图像去雾网络[J].现代计算机,2022,28(17):36-41.
5陈雷.雾计算网络中基于移动感知的任务卸载和资源分配[J].武汉大学学报（理学版）,2022,68(3):335-346. 被引量：3
6严振,张新鹏,冯国瑞.基于结构引导的图像边缘修复网络[J].工业控制计算机,2022,35(11):96-99. 被引量：1
7仉新,郑飂默,谭振华,李锁.基于特征编码和动态路由优化的视觉定位方法[J].中国惯性技术学报,2022,30(4):451-460. 被引量：5
8余泽禹,袁洪强,卫小龙,杜国锋.基于深度学习的管道焊缝超声检测缺陷识别方法[J].科学技术与工程,2022,22(30):13288-13292. 被引量：11
9邓露,香超,王维,曹然.基于改进编解码网络的钢箱梁疲劳裂纹分割[J].华中科技大学学报（自然科学版）,2022,50(8):66-72. 被引量：3
10唐伟,贾方秀,王晓鸣.基于双边滤波的可见光与红外图像自适应融合[J].兵工学报,2022,43(11):2836-2845. 被引量：7

现代计算机

2022年第18期

浏览历史

内容加载中请稍等...

基于改进HRNet架构的图像语义分割算法应用研究被引量：1

同被引文献11

引证文献1

二级引证文献1

相关作者

相关机构

相关主题

浏览历史

基于改进HRNet架构的图像语义分割算法应用研究 被引量：1

同被引文献11

引证文献1

二级引证文献1

相关作者

相关机构

相关主题

浏览历史

基于改进HRNet架构的图像语义分割算法应用研究被引量：1