期刊文献+
共找到201,096篇文章
< 1 2 250 >
每页显示 20 50 100
大直径盾构隧道成型质量巡检方法研究 被引量:1
1
作者 赵先琼 邓凯 +2 位作者 张亚洲 马英博 夏毅敏 《工程科学学报》 EI CSCD 北大核心 2024年第2期365-375,共11页
针对因工业应用成本限制,中、小盾构隧道成型质量无损检测技术迁移至大直径盾构隧道时精度、速度折损严重的问题,以巡检车为载体,集成二维激光扫描仪、编码器和计算机等设备,研制了大盾构隧道成型质量巡检车,并提出一种基于数字图像的... 针对因工业应用成本限制,中、小盾构隧道成型质量无损检测技术迁移至大直径盾构隧道时精度、速度折损严重的问题,以巡检车为载体,集成二维激光扫描仪、编码器和计算机等设备,研制了大盾构隧道成型质量巡检车,并提出一种基于数字图像的盾构质量非对称巡检方法.分析大直径盾构的施工环境,滤除地面、车体点云,并采用邻域向量法提取中轴线,建立隧道中心坐标系.偏心布置巡检路线,按照点云密度将采样点云分为稠密侧和稀疏侧点云,通过不同方法实现对管片接缝特征的拾取:将稠密侧点云绕中轴线展开为二维灰度图像,并通过缩放、归一化、梯度阈值分割等方法实现接缝图像分割;基于直线方程对接缝进行分类,结合管片结构、布置点位,推导出稀疏侧接缝与稠密侧接缝的线性分布公式,间接拾取稀疏侧接缝.根据接缝特征点计算两侧管片边缘点云簇,计算管片错台量;剔除接缝点云簇,使用最小二乘法拟合隧道点云,计算隧道椭圆度.最后在某大直径盾构隧道进行巡检试验,试验结果表明:成型质量巡检车在十四米盾构隧道中巡检速度为3 km·h-1,与传统方法的错台量检测偏差小于2 mm,椭圆度检测偏差小于0.1%,可以满足大直径盾构隧道成型质量巡检的高速度、高精度、低成本需求. 展开更多
关键词 大直径盾构隧道 激光扫描 阈值分割 错台检测 变形检测
下载PDF
改进YOLOv7的复杂道路场景目标检测算法 被引量:1
2
作者 杜娟 崔少华 +1 位作者 晋美娟 茹琛 《计算机工程与应用》 CSCD 北大核心 2024年第1期96-103,共8页
虽然基于深度学习的目标检测算法在道路场景中的目标检测方面已经取得了很好的效果,但是对于复杂道路场景中的密集目标,远处的小尺度目标检测精度低,容易出现漏检误检的问题,提出一种改进YOLOv7的复杂道路场景目标检测算法。增加小目标... 虽然基于深度学习的目标检测算法在道路场景中的目标检测方面已经取得了很好的效果,但是对于复杂道路场景中的密集目标,远处的小尺度目标检测精度低,容易出现漏检误检的问题,提出一种改进YOLOv7的复杂道路场景目标检测算法。增加小目标检测层,增加对小目标的特征学习能力;采用K-means++重聚类先验框,使得先验框更贴合目标,增加网络对目标的定位精度;采用WIoU(Wise-IoU)损失函数,增加网络对普通质量锚框的关注度,提高网络对目标的定位能力;在颈部和检测头引入协调坐标卷积(CoordConv),使网络能够更好地感受特征图中的位置信息;提出P-ELAN结构对骨干网络进行轻量化处理,降低算法参数量和运算量。实验结果表明,该改进算法在华为SODA10M数据集下的mAP达到64.8%,比原算法提高2.6个百分点,模型参数量和运算量分别降低12%和7%,达到检测精度和检测速度的平衡。 展开更多
关键词 YOLOv7 道路目标检测 CoordConv K-means++ 轻量化
下载PDF
融合尺度与信心指数的三维表面重建算法
3
作者 李亚兰 陆汝华 +2 位作者 黄健全 蒋纯志 李翔 《计算机集成制造系统》 EI CSCD 北大核心 2024年第1期42-52,共11页
针对包含细小结构场景的三维表面重建精度和完整度难以提高的问题,提出一种融合三维点云尺度与信心指数的三维表面重建算法。构建了一个表面隐函数,采用高斯函数为其基函数,三阶贝塞尔函数为其权重函数,并根据点云尺度与信心指数大小自... 针对包含细小结构场景的三维表面重建精度和完整度难以提高的问题,提出一种融合三维点云尺度与信心指数的三维表面重建算法。构建了一个表面隐函数,采用高斯函数为其基函数,三阶贝塞尔函数为其权重函数,并根据点云尺度与信心指数大小自适应调整基函数覆盖范围与权重函数取值。采用八叉树存储与处理数据,根据点云尺度大小自适应划分八叉树结构,从而自适应调整表面隐函数三维采样密度。通过无约束等值面提取方法,提取隐函数等值面,从而得到三维表面。与几种典型表面重建算法对比实验,结果表明所提算法重建三维表面细节清晰,整体重建精度与完整度均有提高。 展开更多
关键词 三维重建 八叉树 连续隐函数 尺度 信心指数
下载PDF
基于自适应融合的实时车辆检测
4
作者 陈婷 朱熟康 +3 位作者 高涛 李浩 涂辉招 李子琦 《同济大学学报(自然科学版)》 EI CAS CSCD 北大核心 2024年第4期532-540,共9页
针对传统的车辆检测技术检测速度慢和精度低的问题,提出了一种融合注意力的自适应金字塔网络的交通目标检测算法(fusion attentiont adaptive pyramid network,FAAP-Net),可以显著降低交通事故的发生率。为了降低计算复杂度,设计了一种... 针对传统的车辆检测技术检测速度慢和精度低的问题,提出了一种融合注意力的自适应金字塔网络的交通目标检测算法(fusion attentiont adaptive pyramid network,FAAP-Net),可以显著降低交通事故的发生率。为了降低计算复杂度,设计了一种轻量级的互补池化结构(CPS),该结构在宽度和高度上采用了两组不同的池化组合,在保持高精度的同时,显著降低了网络的浮点运算数(GFLOPs)和参数量。为了解决智能交通系统特征图生成过程中的信息损失问题,通过将自适应注意力模块(AAM)和特征增强模块(FEM)引入自适应融合特征金字塔网络(AF-FPN),以融入车辆检测的形状特征。针对车辆细节特征表征弱的问题,引入了一种按通道维度分组的注意力(SA)机制,以增强主干网络对不同车辆检测细节特征的关注,有效提取车辆细节的显著特征。在BDD100K数据集上的实验结果表明,FAAP-Net算法相比于传统算法,平均精度从30.3%提升到43.7%。 展开更多
关键词 目标检测 车辆检测 互补池化 自适应融合 通道维度分组注意力
下载PDF
基于SwinT-YOLOX模型的自动扶梯行人安全检测算法
5
作者 侯颖 杨林 +3 位作者 胡鑫 贺顺 宋婉莹 赵谦 《计算机工程》 CAS CSCD 北大核心 2024年第3期277-289,共13页
自动扶梯被广泛应用在公共场合,乘客摔倒事故如果不能被及时发现并处理,会造成严重的人身伤害,因此实现自动扶梯智能化监控管理势在必行。受自动扶梯运行环境复杂、行人多以及局部遮挡情况的影响,传统的人体姿态特征摔倒检测模型效果不... 自动扶梯被广泛应用在公共场合,乘客摔倒事故如果不能被及时发现并处理,会造成严重的人身伤害,因此实现自动扶梯智能化监控管理势在必行。受自动扶梯运行环境复杂、行人多以及局部遮挡情况的影响,传统的人体姿态特征摔倒检测模型效果不佳且检测速度减慢。融合Swin Transformer和YOLOX目标检测算法的优秀策略,提出一种基于SwinT-YOLOX网络模型的自动扶梯行人摔倒检测算法。采用Swin Transformer模型作为骨干网络,颈部网络使用添加注意力机制的YOLOX模型,进一步提升特征图的多样性和表达能力。此外,利用漏斗修正线性单元视觉激活函数构建CBF模块,改进颈部网络和Head网络结构,从而获得更优的特征检测性能。实验结果表明,针对自建扶梯行人摔倒数据库和网络采集实际扶梯行人摔倒事故,与AlphaPose、OpenPose、YOLOv5等算法相比,该算法检测性能明显提高,行人摔倒平均检测精度可以达到95.92%,检测帧率为24.08帧/s,能够快速、精准地检测到乘客摔倒事故发生,监控管理平台立刻采取安全急停措施以保证乘客安全。 展开更多
关键词 自动扶梯 摔倒检测 深度学习 YOLOX模型 Swin Transformer模型 漏斗修正线性单元视觉激活函数
下载PDF
新一代通用视频编码标准H.266/VVC:现状与发展
6
作者 万帅 霍俊彦 +1 位作者 马彦卓 杨付正 《西安交通大学学报》 EI CAS CSCD 北大核心 2024年第4期1-17,共17页
相比于上一代标准,新一代通用视频编码标准(H.266/VVC)在同等质量下能够节省大约50%的码率,且适用于多种多样的视频应用场景。论文从H.266/VVC的关键技术出发,对标准的现状、实现和应用发展进行深入探讨。H.266/VVC沿用既往标准中的双... 相比于上一代标准,新一代通用视频编码标准(H.266/VVC)在同等质量下能够节省大约50%的码率,且适用于多种多样的视频应用场景。论文从H.266/VVC的关键技术出发,对标准的现状、实现和应用发展进行深入探讨。H.266/VVC沿用既往标准中的双层码流体系和混合编码框架,针对帧内预测、帧间预测、变换、量化、环路滤波等所有主要编码模块进行了技术革新,并为屏幕内容视频等应用提供了高效的专用编码工具。H.266/VVC标准目前已处于实用化阶段,官方参考软件VTM和开源编解码器VVenC/VVdeC是目前最具代表性的软件编解码实现。对H.266/VVC的性能分析可以看出:H.266/VVC针对高分辨率视频取得的编码增益更为突出;主要编码工具对性能的贡献通常以复杂度为代价,但也有部分编码工具在提升编码性能的同时可降低整体编码复杂度。H.266/VVC的硬件实现面临诸多挑战,发展明显滞后于软件实现,现有研究主要集中在对具体编码模块的硬件加速方面。H.266/VVC标准发布之后,下一代视频编码标准的发展目前仍围绕混合编码框架进行探索,聚焦在两大方向:超越VVC的增强压缩关注更为先进的、非神经网络的编码工具,基于神经网络的视频编码则探索采用神经网络的编码工具。除此之外,部分或完全跳出现有混合编码框架的端到端视频编码也在飞速发展,未来视频编码标准与神经网络结合成为趋势,但面临着计算资源依赖和稳定结构两方面的考验。 展开更多
关键词 H.266/VVC标准 视频编码标准 编码模块 编解码器 神经网络
下载PDF
基于多特征SAD-Census变换的立体匹配算法
7
作者 吴福培 黄耿楠 +2 位作者 刘宇豪 叶玮琳 李昇平 《中国光学(中英文)》 EI CAS CSCD 北大核心 2024年第2期278-290,共13页
视差不连续区域和重复纹理区域的误匹配率高一直是影响双目立体匹配测量精度的主要问题,为此,本文提出一种基于多特征融合的立体匹配算法。首先,在代价计算阶段,通过高斯加权法赋予邻域像素点的权值,从而优化绝对差之和(Sum of Absolute... 视差不连续区域和重复纹理区域的误匹配率高一直是影响双目立体匹配测量精度的主要问题,为此,本文提出一种基于多特征融合的立体匹配算法。首先,在代价计算阶段,通过高斯加权法赋予邻域像素点的权值,从而优化绝对差之和(Sum of Absolute Differences,SAD)算法的计算精度。接着,基于Census变换改进二进制链码方式,将邻域内像素的平均灰度值与梯度图像的灰度均值相融合,进而建立左右图像对应点的判断依据并优化其编码长度。然后,构建基于十字交叉法与改进的引导滤波器相融合的聚合方法,从而实现视差值再分配,以降低误匹配率。最后,通过赢家通吃(Winner Take All,WTA)算法获取初始视差,并采用左右一致性检测方法及亚像素法提高匹配精度,从而获取最终的视差结果。实验结果表明,在Middlebury数据集的测试中,所提SAD-Census算法的平均非遮挡区域和全部区域的误匹配率为分别为2.67%和5.69%,测量200~900 mm距离的平均误差小于2%;而实际三维测量的最大误差为1.5%。实验结果检验了所提算法的有效性和可靠性。 展开更多
关键词 机器视觉 立体匹配 SAD-Census变换 十字交叉法 引导滤波
下载PDF
融合视觉特征的光伏组件语义分割模型研究
8
作者 王银 沈灵鑫 +2 位作者 李茂环 王健安 李小松 《太阳能学报》 EI CAS CSCD 北大核心 2024年第4期500-511,共12页
针对光伏组件红外图像的分割问题,使用MobileNetv2作为DeepLabv3+的主干特征提取网络并使用位置通道注意力模块减少背景干扰,引入混合条带池化对ASPP模块进行优化,帮助模型进一步捕获全局和上下文信息。针对检测困难的屋顶光伏组件设计D... 针对光伏组件红外图像的分割问题,使用MobileNetv2作为DeepLabv3+的主干特征提取网络并使用位置通道注意力模块减少背景干扰,引入混合条带池化对ASPP模块进行优化,帮助模型进一步捕获全局和上下文信息。针对检测困难的屋顶光伏组件设计DeepLabv3-T网络,在上述改进的基础上融入纹理信息进行选择性背景抑制,实现光伏组件的精确分割。在PV_large和PV_roof数据集上进行实验证明该文方法优于现有技术,DeepLabv3-T相较于DeepLabv3+,mIoU值分别提高了2.74%和10.53%。此外,设计消融实验表明各个改进模块的有效性。 展开更多
关键词 光伏组件 语义分割 深度学习 图像纹理 deeplab 注意力机制
原文传递
融合片段对比学习的弱监督动作定位方法
9
作者 党伟超 张磊 +1 位作者 高改梅 刘春霞 《计算机应用》 CSCD 北大核心 2024年第2期548-555,共8页
针对现有基于注意力机制的弱监督动作定位方法对动作边界处的片段容易错误分类的问题,提出一种融合片段对比学习的弱监督动作定位方法。首先,引入三个分支的注意力机制,分别测量每个视频帧是动作实例、上下文以及背景的可能性;其次,基... 针对现有基于注意力机制的弱监督动作定位方法对动作边界处的片段容易错误分类的问题,提出一种融合片段对比学习的弱监督动作定位方法。首先,引入三个分支的注意力机制,分别测量每个视频帧是动作实例、上下文以及背景的可能性;其次,基于得到的注意力值构建对应分支的类激活序列;然后,通过片段挖掘算法构造正负样本对;最后,利用片段对比学习引导网络将模糊片段正确归类。实验结果表明,当交并比(IoU)取值0.5时,在THUMOS14与ActivityNet1.3两个公共数据集上,所提方法的平均检测精度(mAP)分别达到了33.9%和40.1%,相较于DGCNN(Dynamic Graph modeling for weakly-supervised temporal action localization Convolutional Neural Network)弱监督动作定位模型在上述两个数据集上分别提升1.1和2.9个百分点,验证了所提方法的有效性。 展开更多
关键词 弱监督 对比学习 时序动作定位 注意力机制 类激活序列
下载PDF
边缘信息增强的显著性目标检测网络
10
作者 赵卫东 王辉 柳先辉 《同济大学学报(自然科学版)》 EI CAS CSCD 北大核心 2024年第2期293-302,共10页
针对显著性目标检测任务中识别结果边缘模糊的问题,提出了一种能够充分利用边缘信息增强边缘像素置信度的新模型。该网络主要有两个创新点:设计三重注意力模块,利用预测图的特点直接生成前景、背景和边缘注意力,并且生成注意力权重的过... 针对显著性目标检测任务中识别结果边缘模糊的问题,提出了一种能够充分利用边缘信息增强边缘像素置信度的新模型。该网络主要有两个创新点:设计三重注意力模块,利用预测图的特点直接生成前景、背景和边缘注意力,并且生成注意力权重的过程不增加任何参数;设计边缘预测模块,在分辨率较高的网络浅层进行有监督的边缘预测,并与网络深层的显著图预测融合,细化了边缘。在6种常用公开数据集上用定性和定量的方法评估了该模型,并且与其他模型进行充分对比,证明设计的新模型能够取得最优的效果。此外,该模型参数量为30.28 M,可以在GTX 1080 Ti显卡上达到31帧·s^(-1)的预测速度。 展开更多
关键词 显著性目标检测 注意力机制 边缘检测 深度卷积神经网络
下载PDF
基于深度学习的鱼类识别相关技术研究现状及展望
11
作者 汤永华 张志鹏 +2 位作者 林森 刘兴通 张志佳 《海洋渔业》 CSCD 北大核心 2024年第2期246-256,共11页
为促进渔业生产智能化、现代化发展,综述了基于深度学习的鱼类识别相关技术。首先,从数据集构建、数据预处理、神经网络模型设计以及模型训练等4个方面阐述了基于深度学习的鱼类识别工作流程。然后,从图像分类、目标检测、图像分割3个... 为促进渔业生产智能化、现代化发展,综述了基于深度学习的鱼类识别相关技术。首先,从数据集构建、数据预处理、神经网络模型设计以及模型训练等4个方面阐述了基于深度学习的鱼类识别工作流程。然后,从图像分类、目标检测、图像分割3个角度总结了近几年鱼类识别相关技术的研究进展及应用成果。其中,图像分类主要用于识别个体鱼的色泽与种类,目标检测侧重于估计鱼群的数量和体型,而图像分割则在推断鱼类的状态和行为方面发挥着重要作用。同时,分析了不同方法所具备的优势,比较了各方法在数据集中的性能指标。最后,对深度学习在鱼类识别领域的下一步发展方向和研究重点进行了展望。综上,深度学习方法效率普遍较高、泛化能力普遍较强,深度学习技术在鱼类识别中的广泛应用能够为渔业科研人员提供有效的技术支撑。 展开更多
关键词 鱼类识别 深度学习 卷积神经网络 目标检测 图像分割 研究进展
下载PDF
基于改进YOLOv5s的无人机图像识别
12
作者 李杰 王峰 +3 位作者 马晨 吴国瑞 赵伟 康智强 《电光与控制》 CSCD 北大核心 2024年第4期22-27,91,共7页
无人机在军事情报、航拍检测等领域能够提供目标相关的图像信息,为处理任务提供目标信息。针对无人机图像背景复杂、检测目标小、可提取特征少等问题,提出基于YOLOv5s的改进无人机图像识别算法。首先,结合CotNet模块对网络结构进行优化... 无人机在军事情报、航拍检测等领域能够提供目标相关的图像信息,为处理任务提供目标信息。针对无人机图像背景复杂、检测目标小、可提取特征少等问题,提出基于YOLOv5s的改进无人机图像识别算法。首先,结合CotNet模块对网络结构进行优化,提升模型自学习能力并增强识别精度;其次,对颈部网络进行改进,通过跨层链接和提高特征图分辨率更好地利用浅层特征图中包含的丰富信息来定位目标,并且在检测头部分采用解耦检测头,减少预测过程中定位与分类任务对于特征信息的冲突;最后,为了提高收敛速度和模型精度,在CIoU和EIoU损失函数的基础上对损失函数的宽高纵横比进行优化。在公开数据集VisDrone测试集上进行测试,所提算法相比原始YOLOv5s算法的mAP_(50)与mAP_(50∶95)分别提升了6.1与2.9个百分点,实验结果表明,所提模型能够有效提升无人机图像识别的准确率。 展开更多
关键词 目标检测 无人机图像 颈部网络 CotNet 解耦头 损失函数
下载PDF
混凝土坝面作业场景智能识别ResNet50-SEMSF方法
13
作者 陈述 孙孟文 +3 位作者 陈云 曹坤煜 李智 聂本武 《水力发电学报》 CSCD 北大核心 2024年第1期99-108,共10页
为提高混凝土坝面作业场景识别工作效率,提出了一种混凝土坝面作业场景智能识别方法(ResNet50-SEMSF)。将采集的坝面施工现场监控视频分割为图像,分析混凝土坝面作业人、机、料、环境等实体要素图像特征,界定坝面作业典型场景;以残差网... 为提高混凝土坝面作业场景识别工作效率,提出了一种混凝土坝面作业场景智能识别方法(ResNet50-SEMSF)。将采集的坝面施工现场监控视频分割为图像,分析混凝土坝面作业人、机、料、环境等实体要素图像特征,界定坝面作业典型场景;以残差网络(ResNet50)为骨干网络结构,引入挤压激励(SE)注意力机制,关注不同通道间特征关系,提升坝面作业场景图像中多目标实体要素关键特征表达能力;融合下采样多尺度特征,保留坝面作业场景图像低级特征和高级语义信息,增强模型对图像不同层次特征的理解能力,克服尺度变化、目标变形等问题。对比分析其他3种卷积神经网络模型试验结果,使用梯度类激活映射(Grad-CAM)可视化方法,解释ResNet50-SEMSF模型对场景类别中实体要素信息的关注程度。结果表明:ResNet50-SEMSF识别效果明显优于ResNet50、MobileNetV2、VGG16等经典网络模型,表明ResNet50-SEMSF模型用于混凝土坝面作业场景智能识别的可行性,为混凝土坝面施工安全管理工作提供参考。 展开更多
关键词 混凝土坝 坝面作业 深度学习 注意力机制 场景智能识别
下载PDF
基于语义分割的车位检测算法研究
14
作者 李伟东 李冰 +1 位作者 朱旭浩 李乐 《大连理工大学学报》 CAS CSCD 北大核心 2024年第1期96-103,共8页
作为自动泊车系统中至关重要的一环,车位检测算法的精度直接决定自动泊车系统的好坏.目前,基于语义分割的车位检测算法主要有两个问题:一是分割网络参数量较大,难以满足移动端部署;二是后处理提取算法复杂,难以满足实时检测要求.针对这... 作为自动泊车系统中至关重要的一环,车位检测算法的精度直接决定自动泊车系统的好坏.目前,基于语义分割的车位检测算法主要有两个问题:一是分割网络参数量较大,难以满足移动端部署;二是后处理提取算法复杂,难以满足实时检测要求.针对这两个问题,设计一种通过检测车位线来获取停车位的车位检测算法.采用深度可分离卷积和非对称卷积相结合的方式设计车位线分割网络UFAC-Net,并提出一种更为简洁的车位线提取算法.实验结果表明:UFAC-Net模型(UFAC-Net2)分割的平均像素精度为83.07%,平均交并比为73.05%,模型参数量为3.1 MB,达到目前PSV datasets上最好的分割精度;车位检测算法可检测复杂情况下的平行、垂直、倾斜3种类型的车位,在自定义测试集中精准率为99.23%,召回率为99.12%,单张图像检测时间为32.2 ms,具有良好的检测性能. 展开更多
关键词 车位检测 语义分割 深度可分离卷积 非对称卷积
下载PDF
视觉SLAM方法综述
15
作者 王朋 郝伟龙 +2 位作者 倪翠 张广渊 巩慧 《北京航空航天大学学报》 EI CAS CSCD 北大核心 2024年第2期359-367,共9页
实时定位与建图(SLAM)技术搭载特定传感器,使移动机器人在无任何环境先验条件下,在运动过程中自主建立环境模型来计算自身位姿,大幅提高其自主导航能力,以及对不同应用环境的适应性。视觉SLAM方法以相机作为外部传感器,通过采集周围环... 实时定位与建图(SLAM)技术搭载特定传感器,使移动机器人在无任何环境先验条件下,在运动过程中自主建立环境模型来计算自身位姿,大幅提高其自主导航能力,以及对不同应用环境的适应性。视觉SLAM方法以相机作为外部传感器,通过采集周围环境信息来创建地图并实时估计机器人自身位姿。为此,介绍了具有代表性的经典视觉SLAM方法及与深度学习相结合的视觉SLAM方法,分析了视觉SLAM方法中采用的不同特征检测方法、后端优化、闭环检测,以及动态环境下视觉SLAM方法的应用,总结了视觉SLAM方法的问题,并探讨了视觉SLAM方法在未来的热点研究方向和发展前景。 展开更多
关键词 视觉实时定位与建图 深度学习 特征检测 位姿估计 闭环检测
原文传递
复杂战场环境下改进YOLOv5军事目标识别算法研究
16
作者 宋晓茹 刘康 +2 位作者 高嵩 陈超波 阎坤 《兵工学报》 EI CAS CSCD 北大核心 2024年第3期934-947,共14页
复杂战场环境下军事目标识别技术是提升战场情报获取能力的基础和关键。针对当前军事目标识别技术在复杂战场环境下漏检误检率高、实时性差等问题,提出一种基于改进YOLOv5模型的PB-YOLO军事目标识别算法。将改进的目标识别算法对于陆战... 复杂战场环境下军事目标识别技术是提升战场情报获取能力的基础和关键。针对当前军事目标识别技术在复杂战场环境下漏检误检率高、实时性差等问题,提出一种基于改进YOLOv5模型的PB-YOLO军事目标识别算法。将改进的目标识别算法对于陆战场军事单元的识别锚框进行重新聚类,以提升模型对于目标大小适应度,加速模型收敛;采用通道-空间并行注意力机制,增加模型对复杂战场环境下目标特征信息与位置信息关注度;在特征融合网络部分使用BiFPN以提升模型对于特征的融合能力与速度;采用Alpha_IoU损失函数加速模型收敛,解决当真实框与预测框重合时IoU计算退化问题。实验结果表明,在自建军事目标数据集下,改进算法与主流目标识别算法相比,在保证模型空间复杂度的同时,mAP值达到了90.17%。消融实验对比结果表明,改进后网络较原模型精度提升11.57%,具有较好的识别性能,能够为战场情报获取提供有效的技术支撑。 展开更多
关键词 军事目标识别 通道-空间并行注意力机制 特征融合 损失函数
下载PDF
基于Transformer和CNN交错混合的肺结节分割网络
17
作者 吴骏 侯宪哲 +2 位作者 王健 肖志涛 王雯 《天津工业大学学报》 CAS 北大核心 2024年第1期74-81,共8页
针对肺结节尺寸多样、形状异质化高等问题,提出基于Transformer和卷积神经网络(CNN)交错混合(IMTC)的肺结节分割网络,该网络是一个对称的层次连接网络,具有很强的多尺度特征提取能力。该网络通过集成2种方案分别解决肺结节多尺寸与形状... 针对肺结节尺寸多样、形状异质化高等问题,提出基于Transformer和卷积神经网络(CNN)交错混合(IMTC)的肺结节分割网络,该网络是一个对称的层次连接网络,具有很强的多尺度特征提取能力。该网络通过集成2种方案分别解决肺结节多尺寸与形状异质化问题:(1)采用感知注意力模块(inception attention module,IAM),通过并联多个不同大小的卷积核来增加浅层网络的感受野组合,以此捕获更为丰富的浅层特征;(2)为获取更具表示能力的高级语义特征,利用由Transformer和CNN组成的基本骨干网络交错提取结节特征,使得全局特征与局部特征充分融合,从而提高结节特征表示的泛化能力和鲁棒性。实验结果表明:本文模型可以准确分割直径较小以及边缘复杂的肺结节,在LUNA16公开数据集上分割性能良好,Dice和IOU分别达到86.15%和76.10%。 展开更多
关键词 肺结节 TRANSFORMER 卷积神经网络(CNN) 感知注意力模块(IAM) 交错混合
下载PDF
基于牛脸和躯干综合信息的奶牛个体识别研究
18
作者 赵玲 周桂红 任力生 《河北农业大学学报》 CAS CSCD 北大核心 2024年第2期112-118,共7页
针对基于单一信息对奶牛个体身份识别精度低的问题,本文提出1种基于牛脸和躯干综合信息对奶牛个体身份识别的方法。在Mask R-CNN目标检测模型的基础上进行改进,将注意力机制模块引入到Mask R-CNN的ResNet50特征提取网络的输出阶段,能够... 针对基于单一信息对奶牛个体身份识别精度低的问题,本文提出1种基于牛脸和躯干综合信息对奶牛个体身份识别的方法。在Mask R-CNN目标检测模型的基础上进行改进,将注意力机制模块引入到Mask R-CNN的ResNet50特征提取网络的输出阶段,能够在图像通道和空间上增强奶牛身份信息。针对奶牛不同部位,本文对改进前后的Mask R-CNN模型分别基于牛脸、基于躯干以及基于牛脸和躯干综合信息进行了相关实验。实验结果表明,原始Mask R-CNN模型基于牛脸和躯干综合信息进行奶牛个体识别,比单独基于牛脸或躯干的识别精度提高2.3%~3.7%。改进后的Mask R-CNN模型在自建奶牛图像数据集上的准确率达到了93.63%,mAP值达到92.16%,相较于原始Mask R-CNN,准确率提高了2.92%,mAP值提高了2.63%。本文方法能够实现对养殖场环境下奶牛个体身份的识别,可为奶牛的精准养殖提供技术支持。 展开更多
关键词 奶牛 牛脸和躯干 个体识别 Mask R-CNN 注意力机制
下载PDF
改进YOLOv7算法的钢材表面缺陷检测研究
19
作者 高春艳 秦燊 +1 位作者 李满宏 吕晓玲 《计算机工程与应用》 CSCD 北大核心 2024年第7期282-291,共10页
当前,基于深度学习的智能检测技术逐步应用于钢材表面缺陷检测领域,针对钢材表面缺陷检测精度低的问题,提出一种高精度实时的缺陷检测算法CDN-YOLOv7。加入CARAFE轻量化上采样算子来改善网络特征融合能力,融合级联注意力机制和解耦头重... 当前,基于深度学习的智能检测技术逐步应用于钢材表面缺陷检测领域,针对钢材表面缺陷检测精度低的问题,提出一种高精度实时的缺陷检测算法CDN-YOLOv7。加入CARAFE轻量化上采样算子来改善网络特征融合能力,融合级联注意力机制和解耦头重新设计YOLOv7检测头网络,旨在解决原始头网络特征利用效率不高的问题,使其充分利用各尺度、通道、空间的多维度信息,提升复杂场景下模型表征能力。引入归一化Wasserstein距离重新设计Focal-EIoU损失函数,提出NF-EIoU替换CIoU损失,平衡各尺度缺陷样本对Loss的贡献,降低各尺度缺陷的漏检率。实验结果表明,CDN-YOLOv7的检测精度可达80.3%,较于原YOLOv7精度提升了6.0个百分点,模型推理速度可达60.8帧/s,满足实时性需求,CDN-YOLOv7在提升各尺度缺陷检测精度的同时显著降低了缺陷的漏检率。 展开更多
关键词 机器视觉 钢材表面 缺陷检测 CDN-YOLOv7
下载PDF
属性偏序形式结构的数学形式化
20
作者 任蕴丽 宋佳霖 +1 位作者 郑存芳 洪文学 《燕山大学学报》 CAS 北大核心 2024年第2期129-137,共9页
属性偏序形式结构,作为一种基于人类认知原理和粒计算思想的知识发现和知识表示新理论,目前已有广泛的应用,但其理论基础缺乏抽象化数学化,这势必影响该理论的系统发展。针对上述问题,研究了属性偏序形式结构的数学形式化描述问题。首先... 属性偏序形式结构,作为一种基于人类认知原理和粒计算思想的知识发现和知识表示新理论,目前已有广泛的应用,但其理论基础缺乏抽象化数学化,这势必影响该理论的系统发展。针对上述问题,研究了属性偏序形式结构的数学形式化描述问题。首先,基于粒计算的思想提出了知识表示的形式化框架。在此基础上,通过定义对象集合的覆盖和最简覆盖,给出属性偏序形式结构的粒和粒群的概念,进而通过对粒衍生出粒群的充要条件的讨论,给出了属性偏序形式结构中的知识结构,从而完成属性偏序形式结构的数学形式化描述。最后,通过具体实例展示了利用数学形式化描述构造属性偏序形式结构的过程,并揭示了该过程所体现的人类认知规律。 展开更多
关键词 形式背景 数学形式化 属性偏序形式结构 粒计算 概念认知学习
下载PDF
上一页 1 2 250 下一页 到第
使用帮助 返回顶部