期刊文献+
共找到206,394篇文章
< 1 2 250 >
每页显示 20 50 100
视觉SLAM方法综述 被引量:4
1
作者 王朋 郝伟龙 +2 位作者 倪翠 张广渊 巩慧 《北京航空航天大学学报》 EI CAS CSCD 北大核心 2024年第2期359-367,共9页
实时定位与建图(SLAM)技术搭载特定传感器,使移动机器人在无任何环境先验条件下,在运动过程中自主建立环境模型来计算自身位姿,大幅提高其自主导航能力,以及对不同应用环境的适应性。视觉SLAM方法以相机作为外部传感器,通过采集周围环... 实时定位与建图(SLAM)技术搭载特定传感器,使移动机器人在无任何环境先验条件下,在运动过程中自主建立环境模型来计算自身位姿,大幅提高其自主导航能力,以及对不同应用环境的适应性。视觉SLAM方法以相机作为外部传感器,通过采集周围环境信息来创建地图并实时估计机器人自身位姿。为此,介绍了具有代表性的经典视觉SLAM方法及与深度学习相结合的视觉SLAM方法,分析了视觉SLAM方法中采用的不同特征检测方法、后端优化、闭环检测,以及动态环境下视觉SLAM方法的应用,总结了视觉SLAM方法的问题,并探讨了视觉SLAM方法在未来的热点研究方向和发展前景。 展开更多
关键词 视觉实时定位与建图 深度学习 特征检测 位姿估计 闭环检测
原文传递
改进YOLOv7算法的钢材表面缺陷检测研究 被引量:3
2
作者 高春艳 秦燊 +1 位作者 李满宏 吕晓玲 《计算机工程与应用》 CSCD 北大核心 2024年第7期282-291,共10页
当前,基于深度学习的智能检测技术逐步应用于钢材表面缺陷检测领域,针对钢材表面缺陷检测精度低的问题,提出一种高精度实时的缺陷检测算法CDN-YOLOv7。加入CARAFE轻量化上采样算子来改善网络特征融合能力,融合级联注意力机制和解耦头重... 当前,基于深度学习的智能检测技术逐步应用于钢材表面缺陷检测领域,针对钢材表面缺陷检测精度低的问题,提出一种高精度实时的缺陷检测算法CDN-YOLOv7。加入CARAFE轻量化上采样算子来改善网络特征融合能力,融合级联注意力机制和解耦头重新设计YOLOv7检测头网络,旨在解决原始头网络特征利用效率不高的问题,使其充分利用各尺度、通道、空间的多维度信息,提升复杂场景下模型表征能力。引入归一化Wasserstein距离重新设计Focal-EIoU损失函数,提出NF-EIoU替换CIoU损失,平衡各尺度缺陷样本对Loss的贡献,降低各尺度缺陷的漏检率。实验结果表明,CDN-YOLOv7的检测精度可达80.3%,较于原YOLOv7精度提升了6.0个百分点,模型推理速度可达60.8帧/s,满足实时性需求,CDN-YOLOv7在提升各尺度缺陷检测精度的同时显著降低了缺陷的漏检率。 展开更多
关键词 机器视觉 钢材表面 缺陷检测 CDN-YOLOv7
下载PDF
基于改进YOLOv5s的小目标检测算法 被引量:6
3
作者 贵向泉 秦庆松 孔令旺 《计算机工程与设计》 北大核心 2024年第4期1134-1140,共7页
针对当前主流目标检测算法对图像中远距离小目标产生的漏检、误检等问题,提出一种改进YOLOv5s的小目标检测算法。在模型训练过程中,通过引入Focal-EIOU定位损失函数,加强边界框的定位精度;在骨干网络中,通过添加小目标检测层,提高小目... 针对当前主流目标检测算法对图像中远距离小目标产生的漏检、误检等问题,提出一种改进YOLOv5s的小目标检测算法。在模型训练过程中,通过引入Focal-EIOU定位损失函数,加强边界框的定位精度;在骨干网络中,通过添加小目标检测层,提高小目标的检测精度;在Neck结构中,通过优化上采样算子和添加注意力机制,加强小目标的特征信息。实验结果表明,改进后的算法在VisDrone数据集上与YOLOv5s算法相比,mAP@small提高了3.2%,且检测速度满足实时性的要求,能够很好地应用于小目标检测任务中。 展开更多
关键词 YOLOv5s算法 小目标检测 损失函数 上采样算子 骨干网络 注意力机制 特征信息
下载PDF
边缘信息增强的显著性目标检测网络 被引量:2
4
作者 赵卫东 王辉 柳先辉 《同济大学学报(自然科学版)》 EI CAS CSCD 北大核心 2024年第2期293-302,共10页
针对显著性目标检测任务中识别结果边缘模糊的问题,提出了一种能够充分利用边缘信息增强边缘像素置信度的新模型。该网络主要有两个创新点:设计三重注意力模块,利用预测图的特点直接生成前景、背景和边缘注意力,并且生成注意力权重的过... 针对显著性目标检测任务中识别结果边缘模糊的问题,提出了一种能够充分利用边缘信息增强边缘像素置信度的新模型。该网络主要有两个创新点:设计三重注意力模块,利用预测图的特点直接生成前景、背景和边缘注意力,并且生成注意力权重的过程不增加任何参数;设计边缘预测模块,在分辨率较高的网络浅层进行有监督的边缘预测,并与网络深层的显著图预测融合,细化了边缘。在6种常用公开数据集上用定性和定量的方法评估了该模型,并且与其他模型进行充分对比,证明设计的新模型能够取得最优的效果。此外,该模型参数量为30.28 M,可以在GTX 1080 Ti显卡上达到31帧·s^(-1)的预测速度。 展开更多
关键词 显著性目标检测 注意力机制 边缘检测 深度卷积神经网络
下载PDF
混凝土坝面作业场景智能识别ResNet50-SEMSF方法 被引量:2
5
作者 陈述 孙孟文 +3 位作者 陈云 曹坤煜 李智 聂本武 《水力发电学报》 CSCD 北大核心 2024年第1期99-108,共10页
为提高混凝土坝面作业场景识别工作效率,提出了一种混凝土坝面作业场景智能识别方法(ResNet50-SEMSF)。将采集的坝面施工现场监控视频分割为图像,分析混凝土坝面作业人、机、料、环境等实体要素图像特征,界定坝面作业典型场景;以残差网... 为提高混凝土坝面作业场景识别工作效率,提出了一种混凝土坝面作业场景智能识别方法(ResNet50-SEMSF)。将采集的坝面施工现场监控视频分割为图像,分析混凝土坝面作业人、机、料、环境等实体要素图像特征,界定坝面作业典型场景;以残差网络(ResNet50)为骨干网络结构,引入挤压激励(SE)注意力机制,关注不同通道间特征关系,提升坝面作业场景图像中多目标实体要素关键特征表达能力;融合下采样多尺度特征,保留坝面作业场景图像低级特征和高级语义信息,增强模型对图像不同层次特征的理解能力,克服尺度变化、目标变形等问题。对比分析其他3种卷积神经网络模型试验结果,使用梯度类激活映射(Grad-CAM)可视化方法,解释ResNet50-SEMSF模型对场景类别中实体要素信息的关注程度。结果表明:ResNet50-SEMSF识别效果明显优于ResNet50、MobileNetV2、VGG16等经典网络模型,表明ResNet50-SEMSF模型用于混凝土坝面作业场景智能识别的可行性,为混凝土坝面施工安全管理工作提供参考。 展开更多
关键词 混凝土坝 坝面作业 深度学习 注意力机制 场景智能识别
下载PDF
复杂战场环境下改进YOLOv5军事目标识别算法研究 被引量:2
6
作者 宋晓茹 刘康 +2 位作者 高嵩 陈超波 阎坤 《兵工学报》 EI CAS CSCD 北大核心 2024年第3期934-947,共14页
复杂战场环境下军事目标识别技术是提升战场情报获取能力的基础和关键。针对当前军事目标识别技术在复杂战场环境下漏检误检率高、实时性差等问题,提出一种基于改进YOLOv5模型的PB-YOLO军事目标识别算法。将改进的目标识别算法对于陆战... 复杂战场环境下军事目标识别技术是提升战场情报获取能力的基础和关键。针对当前军事目标识别技术在复杂战场环境下漏检误检率高、实时性差等问题,提出一种基于改进YOLOv5模型的PB-YOLO军事目标识别算法。将改进的目标识别算法对于陆战场军事单元的识别锚框进行重新聚类,以提升模型对于目标大小适应度,加速模型收敛;采用通道-空间并行注意力机制,增加模型对复杂战场环境下目标特征信息与位置信息关注度;在特征融合网络部分使用BiFPN以提升模型对于特征的融合能力与速度;采用Alpha_IoU损失函数加速模型收敛,解决当真实框与预测框重合时IoU计算退化问题。实验结果表明,在自建军事目标数据集下,改进算法与主流目标识别算法相比,在保证模型空间复杂度的同时,mAP值达到了90.17%。消融实验对比结果表明,改进后网络较原模型精度提升11.57%,具有较好的识别性能,能够为战场情报获取提供有效的技术支撑。 展开更多
关键词 军事目标识别 通道-空间并行注意力机制 特征融合 损失函数
下载PDF
基于改进YOLOv5的安全帽检测算法 被引量:3
7
作者 侯公羽 陈钦煌 +3 位作者 杨振华 张又文 张丹阳 李昊翔 《工程科学学报》 EI CSCD 北大核心 2024年第2期329-342,共14页
为了解决建筑工地、隧道、煤矿等施工场景中现有安全帽检测算法对于小目标、密集目标以及复杂环境下的检测精度低的问题,设计实现了一种基于YOLOv5的改进目标检测算法,记为YOLOv5-GBCW.首先使用Ghost卷积对骨干网络进行重构,使得模型的... 为了解决建筑工地、隧道、煤矿等施工场景中现有安全帽检测算法对于小目标、密集目标以及复杂环境下的检测精度低的问题,设计实现了一种基于YOLOv5的改进目标检测算法,记为YOLOv5-GBCW.首先使用Ghost卷积对骨干网络进行重构,使得模型的复杂度有了显著降低;其次使用双向特征金字塔网络(BiFPN)加强特征融合,使得算法对小目标准确率提升;引入坐标注意力(Coordinate attention)模块,能够将注意力资源分配给关键区域,从而在复杂环境中降低背景的干扰;最后提出了Beta-WIoU作为边框损失函数,采用动态非单调聚焦机制并引入对锚框特征的计算,提升预测框的准确率,同时加速模型收敛.为了验证算法的可行性,以课题组收集的安全帽数据集为基础,选用了多种经典算法进行对比,并且进行了消融实验,探究各个改进模块的提升效果.实验结果表明:改进算法YOLOv5-GBCW相较于YOLOv5s算法,算法平均精确率(IOU=0.5)提升了5.8%,达到了94.5%,检测速度达到了124.6 FPS(每秒处理帧数),模型更加轻量化,在复杂环境、密集场景和小目标场景下检测能力提升显著,并且同时满足安全帽检测精度和实时性的要求,给复杂施工环境下安全帽检测提供了一种新的方法. 展开更多
关键词 安全帽 目标检测 YOLOv5 注意力机制 双向特征金字塔网络
下载PDF
基于改进YOLO v7轻量化模型的自然果园环境下苹果识别方法 被引量:3
8
作者 张震 周俊 +1 位作者 江自真 韩宏琪 《农业机械学报》 EI CAS CSCD 北大核心 2024年第3期231-242,262,共13页
针对自然果园环境下苹果果实识别中,传统的目标检测算法往往很难在检测模型的检测精度、速度和轻量化方面实现平衡,提出了一种基于改进YOLO v7的轻量化苹果检测模型。首先,引入部分卷积(Partial convolution, PConv)替换多分支堆叠模块... 针对自然果园环境下苹果果实识别中,传统的目标检测算法往往很难在检测模型的检测精度、速度和轻量化方面实现平衡,提出了一种基于改进YOLO v7的轻量化苹果检测模型。首先,引入部分卷积(Partial convolution, PConv)替换多分支堆叠模块中的部分常规卷积进行轻量化改进,以降低模型的参数量和计算量;其次,添加轻量化的高效通道注意力(Efficient channel attention, ECA)模块以提高网络的特征提取能力,改善复杂环境下遮挡目标的错检漏检问题;在模型训练过程中采用基于麻雀搜索算法(Sparrow search algorithm, SSA)的学习率优化策略来进一步提高模型的检测精度。试验结果显示:相比于YOLO v7原始模型,改进后模型的精确率、召回率和平均精度分别提高4.15、0.38、1.39个百分点,其参数量和计算量分别降低22.93%和27.41%,在GPU和CPU上检测单幅图像的平均用时分别减少0.003 s和0.014 s。结果表明,改进后的模型可以实时准确地识别复杂果园环境中的苹果,模型参数量和计算量较小,适合部署于苹果采摘机器人的嵌入式设备上,为实现苹果的无人化智能采摘奠定了基础。 展开更多
关键词 苹果识别 自然果园环境 YOLO v7 PConv 高效通道注意力机制 麻雀搜索算法
下载PDF
基于自适应融合的实时车辆检测 被引量:1
9
作者 陈婷 朱熟康 +3 位作者 高涛 李浩 涂辉招 李子琦 《同济大学学报(自然科学版)》 EI CAS CSCD 北大核心 2024年第4期532-540,共9页
针对传统的车辆检测技术检测速度慢和精度低的问题,提出了一种融合注意力的自适应金字塔网络的交通目标检测算法(fusion attentiont adaptive pyramid network,FAAP-Net),可以显著降低交通事故的发生率。为了降低计算复杂度,设计了一种... 针对传统的车辆检测技术检测速度慢和精度低的问题,提出了一种融合注意力的自适应金字塔网络的交通目标检测算法(fusion attentiont adaptive pyramid network,FAAP-Net),可以显著降低交通事故的发生率。为了降低计算复杂度,设计了一种轻量级的互补池化结构(CPS),该结构在宽度和高度上采用了两组不同的池化组合,在保持高精度的同时,显著降低了网络的浮点运算数(GFLOPs)和参数量。为了解决智能交通系统特征图生成过程中的信息损失问题,通过将自适应注意力模块(AAM)和特征增强模块(FEM)引入自适应融合特征金字塔网络(AF-FPN),以融入车辆检测的形状特征。针对车辆细节特征表征弱的问题,引入了一种按通道维度分组的注意力(SA)机制,以增强主干网络对不同车辆检测细节特征的关注,有效提取车辆细节的显著特征。在BDD100K数据集上的实验结果表明,FAAP-Net算法相比于传统算法,平均精度从30.3%提升到43.7%。 展开更多
关键词 目标检测 车辆检测 互补池化 自适应融合 通道维度分组注意力
下载PDF
基于多元数据的夏季鸡舍环境质量评价及其对产蛋性能的影响 被引量:2
10
作者 谢苗苗 李华龙 詹凯 《农业工程学报》 EI CAS CSCD 北大核心 2024年第8期188-197,共10页
蛋鸡舍环境质量直接影响蛋鸡产蛋性能。为探究夏季蛋鸡舍环境质量及其对产蛋性能的影响,研究提出基于多元数据的分析方法,首先采集鸡舍内7类关键环境因子数据,按照热环境、光环境和气体环境分组,再根据改进D-S证据理论规则进行迭代融合... 蛋鸡舍环境质量直接影响蛋鸡产蛋性能。为探究夏季蛋鸡舍环境质量及其对产蛋性能的影响,研究提出基于多元数据的分析方法,首先采集鸡舍内7类关键环境因子数据,按照热环境、光环境和气体环境分组,再根据改进D-S证据理论规则进行迭代融合,得到蛋鸡舍各检测点环境质量的综合评价结果,进而分析其对产蛋性能的影响。以夏季八层层叠式蛋鸡舍为试验鸡舍开展试验。结果显示:八层层叠式蛋鸡舍下四层的环境质量和平均产蛋率的最优位置均处于鸡舍前端;平均产蛋率最差的位置处于鸡舍中端,该位置环境质量综合评价结果为一般;上四层平均产蛋率最优位置为鸡舍中端,该位置环境质量综合评价结果为适宜;平均产蛋率最差位置和环境质量最差位置均为鸡舍后端(靠近风机端)。在试验鸡舍所有检测点中,平均产蛋率高于86%的检测点,环境质量综合评价结果大都为适宜,平均产蛋率低于86%的检测点,环境质量综合评价结果为一般或差,鸡舍内各检测点环境质量综合评价结果与平均产蛋率的变化趋势高度一致。该研究为准确评价蛋鸡舍环境质量,揭示蛋鸡舍环境质量对产蛋性能的影响提供了一种行之有效的方法。 展开更多
关键词 多元数据 数据融合 改进D-S证据理论 层叠式蛋鸡舍 环境质量 产蛋性能
下载PDF
修复缺陷嫌疑区域的无监督磁瓦表面缺陷检测 被引量:2
11
作者 唐善成 逯建辉 +2 位作者 张莹 金子成 赵安新 《浙江大学学报(工学版)》 EI CAS CSCD 北大核心 2024年第4期718-728,共11页
磁瓦表面缺陷样本数量少,异常视觉特征分布发散,现有依赖目标特征的有监督检测方法不能有效检测未定义缺陷;磁瓦表面正常纹理呈非均匀且非周期性分布,使得经典重构网络难以准确地重构磁瓦表面正常特征,导致相关无监督检测方法性能低下.... 磁瓦表面缺陷样本数量少,异常视觉特征分布发散,现有依赖目标特征的有监督检测方法不能有效检测未定义缺陷;磁瓦表面正常纹理呈非均匀且非周期性分布,使得经典重构网络难以准确地重构磁瓦表面正常特征,导致相关无监督检测方法性能低下.为此,采用多头注意力增强的掩码图像修复网络(MIINet),长距离提取图像特征,捕捉全局信息,增强图像修复的能力;引入视觉显著性算法抑制磁瓦表面纹理信息和突显缺陷区域,以便二值化算法精准分割缺陷嫌疑区域;利用MIINet修复待检测图像缺陷嫌疑区域,选用修复前后图像的残差图像和结构相似性实现缺陷检测与缺陷判定.与经典无监督方法相比,修复缺陷嫌疑区域的表面缺陷检测方法的准确率提升了2.36%,F1值提升了1.62%. 展开更多
关键词 多头注意力 磁瓦表面缺陷检测 无监督学习 图像修复 视觉显著性
下载PDF
新一代通用视频编码标准H.266/VVC:现状与发展 被引量:1
12
作者 万帅 霍俊彦 +1 位作者 马彦卓 杨付正 《西安交通大学学报》 EI CAS CSCD 北大核心 2024年第4期1-17,共17页
相比于上一代标准,新一代通用视频编码标准(H.266/VVC)在同等质量下能够节省大约50%的码率,且适用于多种多样的视频应用场景。论文从H.266/VVC的关键技术出发,对标准的现状、实现和应用发展进行深入探讨。H.266/VVC沿用既往标准中的双... 相比于上一代标准,新一代通用视频编码标准(H.266/VVC)在同等质量下能够节省大约50%的码率,且适用于多种多样的视频应用场景。论文从H.266/VVC的关键技术出发,对标准的现状、实现和应用发展进行深入探讨。H.266/VVC沿用既往标准中的双层码流体系和混合编码框架,针对帧内预测、帧间预测、变换、量化、环路滤波等所有主要编码模块进行了技术革新,并为屏幕内容视频等应用提供了高效的专用编码工具。H.266/VVC标准目前已处于实用化阶段,官方参考软件VTM和开源编解码器VVenC/VVdeC是目前最具代表性的软件编解码实现。对H.266/VVC的性能分析可以看出:H.266/VVC针对高分辨率视频取得的编码增益更为突出;主要编码工具对性能的贡献通常以复杂度为代价,但也有部分编码工具在提升编码性能的同时可降低整体编码复杂度。H.266/VVC的硬件实现面临诸多挑战,发展明显滞后于软件实现,现有研究主要集中在对具体编码模块的硬件加速方面。H.266/VVC标准发布之后,下一代视频编码标准的发展目前仍围绕混合编码框架进行探索,聚焦在两大方向:超越VVC的增强压缩关注更为先进的、非神经网络的编码工具,基于神经网络的视频编码则探索采用神经网络的编码工具。除此之外,部分或完全跳出现有混合编码框架的端到端视频编码也在飞速发展,未来视频编码标准与神经网络结合成为趋势,但面临着计算资源依赖和稳定结构两方面的考验。 展开更多
关键词 H.266/VVC标准 视频编码标准 编码模块 编解码器 神经网络
下载PDF
基于改进YOLOv5s的无人机图像识别 被引量:1
13
作者 李杰 王峰 +3 位作者 马晨 吴国瑞 赵伟 康智强 《电光与控制》 CSCD 北大核心 2024年第4期22-27,91,共7页
无人机在军事情报、航拍检测等领域能够提供目标相关的图像信息,为处理任务提供目标信息。针对无人机图像背景复杂、检测目标小、可提取特征少等问题,提出基于YOLOv5s的改进无人机图像识别算法。首先,结合CotNet模块对网络结构进行优化... 无人机在军事情报、航拍检测等领域能够提供目标相关的图像信息,为处理任务提供目标信息。针对无人机图像背景复杂、检测目标小、可提取特征少等问题,提出基于YOLOv5s的改进无人机图像识别算法。首先,结合CotNet模块对网络结构进行优化,提升模型自学习能力并增强识别精度;其次,对颈部网络进行改进,通过跨层链接和提高特征图分辨率更好地利用浅层特征图中包含的丰富信息来定位目标,并且在检测头部分采用解耦检测头,减少预测过程中定位与分类任务对于特征信息的冲突;最后,为了提高收敛速度和模型精度,在CIoU和EIoU损失函数的基础上对损失函数的宽高纵横比进行优化。在公开数据集VisDrone测试集上进行测试,所提算法相比原始YOLOv5s算法的mAP_(50)与mAP_(50∶95)分别提升了6.1与2.9个百分点,实验结果表明,所提模型能够有效提升无人机图像识别的准确率。 展开更多
关键词 目标检测 无人机图像 颈部网络 CotNet 解耦头 损失函数
下载PDF
改进YOLOv8s与DeepSORT的矿工帽带检测及人员跟踪 被引量:2
14
作者 丁玲 缪小然 +2 位作者 胡建峰 赵作鹏 张新建 《计算机工程与应用》 CSCD 北大核心 2024年第5期328-335,共8页
不系帽带,安全帽等于没戴。然而现有的安全帽检测方法,缺乏对帽带异常佩戴的检测研究。针对此问题,结合煤矿井下特殊的作业环境,以人员安全帽帽带检测及人员跟踪为研究对象,提出了CM-YOLOv8s算法检测安全帽及其帽带,利用DeepSORT算法对... 不系帽带,安全帽等于没戴。然而现有的安全帽检测方法,缺乏对帽带异常佩戴的检测研究。针对此问题,结合煤矿井下特殊的作业环境,以人员安全帽帽带检测及人员跟踪为研究对象,提出了CM-YOLOv8s算法检测安全帽及其帽带,利用DeepSORT算法对未系帽带的作业人员进行跟踪。利用井下监控视频制作数据集,使用CM-YOLOv8s对井下人员安全帽帽带进行检测:在YOLOv8s的基础上引入更高分辨率的特征图并新增了一种级联查询机制,在不提高计算成本的前提下能完成对小物体更精准的检测。利用改进DeepSORT对人员进行编码追踪:采用更深层卷积替换DeepSORT中小型残差网络来强化外观信息提取能力。通过自制井下安全帽帽带检测及跟踪数据集对改进算法进行验证,实验结果表明:CM-YOLOv8s的安全帽帽带识别算法平均精度均值达到92.3%,较YOLOv8s提高4.2个百分点。此外,基于CM-YOLOv8s与DeepSORT的安全帽规范佩戴识别系统的平均准确率为85.37%,检测速度达到59 FPS。提出的安全帽帽带检测算法,通过检测帽带是否在人员下颚附近来鉴别安全帽是否规范佩戴,能较好地平衡检测速度与精度,并能适应复杂的井下环境。通过在陈四楼煤矿数月的应用表明,实现了对安全帽佩戴异常的监测预警,加强了对矿工规范佩戴安全帽的有效监管。 展开更多
关键词 安全帽 帽带检测 实时监测 YOLOv8 DeepSORT
下载PDF
改进YOLOv7的复杂道路场景目标检测算法 被引量:5
15
作者 杜娟 崔少华 +1 位作者 晋美娟 茹琛 《计算机工程与应用》 CSCD 北大核心 2024年第1期96-103,共8页
虽然基于深度学习的目标检测算法在道路场景中的目标检测方面已经取得了很好的效果,但是对于复杂道路场景中的密集目标,远处的小尺度目标检测精度低,容易出现漏检误检的问题,提出一种改进YOLOv7的复杂道路场景目标检测算法。增加小目标... 虽然基于深度学习的目标检测算法在道路场景中的目标检测方面已经取得了很好的效果,但是对于复杂道路场景中的密集目标,远处的小尺度目标检测精度低,容易出现漏检误检的问题,提出一种改进YOLOv7的复杂道路场景目标检测算法。增加小目标检测层,增加对小目标的特征学习能力;采用K-means++重聚类先验框,使得先验框更贴合目标,增加网络对目标的定位精度;采用WIoU(Wise-IoU)损失函数,增加网络对普通质量锚框的关注度,提高网络对目标的定位能力;在颈部和检测头引入协调坐标卷积(CoordConv),使网络能够更好地感受特征图中的位置信息;提出P-ELAN结构对骨干网络进行轻量化处理,降低算法参数量和运算量。实验结果表明,该改进算法在华为SODA10M数据集下的mAP达到64.8%,比原算法提高2.6个百分点,模型参数量和运算量分别降低12%和7%,达到检测精度和检测速度的平衡。 展开更多
关键词 YOLOv7 道路目标检测 CoordConv K-means++ 轻量化
下载PDF
基于YOLO v5的农田杂草识别轻量化方法研究 被引量:1
16
作者 冀汶莉 刘洲 邢海花 《农业机械学报》 EI CAS CSCD 北大核心 2024年第1期212-222,293,共12页
针对已有杂草识别模型对复杂农田环境下多种目标杂草的识别率低、模型内存占用量大、参数多、识别速度慢等问题,提出了基于YOLO v5的轻量化杂草识别方法。利用带色彩恢复的多尺度视网膜(Multi-scale retinex with color restoration, MS... 针对已有杂草识别模型对复杂农田环境下多种目标杂草的识别率低、模型内存占用量大、参数多、识别速度慢等问题,提出了基于YOLO v5的轻量化杂草识别方法。利用带色彩恢复的多尺度视网膜(Multi-scale retinex with color restoration, MSRCR)增强算法对部分图像数据进行预处理,提高边缘细节模糊的图像清晰度,降低图像中的阴影干扰。使用轻量级网络PP-LCNet重置了识别模型中的特征提取网络,减少模型参数量。采用Ghost卷积模块轻量化特征融合网络,进一步降低计算量。为了弥补轻量化造成的模型性能损耗,在特征融合网络末端添加基于标准化的注意力模块(Normalization-based attention module, NAM),增强模型对杂草和玉米幼苗的特征提取能力。此外,通过优化主干网络注意力机制的激活函数来提高模型的非线性拟合能力。在自建数据集上进行实验,实验结果显示,与当前主流目标检测算法YOLO v5s以及成熟的轻量化目标检测算法MobileNet v3-YOLO v5s、ShuffleNet v2-YOLO v5s比较,轻量化后杂草识别模型内存占用量为6.23 MB,分别缩小54.5%、12%和18%;平均精度均值(Mean average precision, mAP)为97.8%,分别提高1.3、5.1、4.4个百分点。单幅图像检测时间为118.1 ms,达到了轻量化要求。在保持较高模型识别精度的同时大幅降低了模型复杂度,可为采用资源有限的移动端设备进行农田杂草识别提供技术支持。 展开更多
关键词 杂草识别 目标检测 YOLO v5s 轻量化特征提取网络 Ghost卷积模块 注意力机制
下载PDF
大直径盾构隧道成型质量巡检方法研究 被引量:1
17
作者 赵先琼 邓凯 +2 位作者 张亚洲 马英博 夏毅敏 《工程科学学报》 EI CSCD 北大核心 2024年第2期365-375,共11页
针对因工业应用成本限制,中、小盾构隧道成型质量无损检测技术迁移至大直径盾构隧道时精度、速度折损严重的问题,以巡检车为载体,集成二维激光扫描仪、编码器和计算机等设备,研制了大盾构隧道成型质量巡检车,并提出一种基于数字图像的... 针对因工业应用成本限制,中、小盾构隧道成型质量无损检测技术迁移至大直径盾构隧道时精度、速度折损严重的问题,以巡检车为载体,集成二维激光扫描仪、编码器和计算机等设备,研制了大盾构隧道成型质量巡检车,并提出一种基于数字图像的盾构质量非对称巡检方法.分析大直径盾构的施工环境,滤除地面、车体点云,并采用邻域向量法提取中轴线,建立隧道中心坐标系.偏心布置巡检路线,按照点云密度将采样点云分为稠密侧和稀疏侧点云,通过不同方法实现对管片接缝特征的拾取:将稠密侧点云绕中轴线展开为二维灰度图像,并通过缩放、归一化、梯度阈值分割等方法实现接缝图像分割;基于直线方程对接缝进行分类,结合管片结构、布置点位,推导出稀疏侧接缝与稠密侧接缝的线性分布公式,间接拾取稀疏侧接缝.根据接缝特征点计算两侧管片边缘点云簇,计算管片错台量;剔除接缝点云簇,使用最小二乘法拟合隧道点云,计算隧道椭圆度.最后在某大直径盾构隧道进行巡检试验,试验结果表明:成型质量巡检车在十四米盾构隧道中巡检速度为3 km·h-1,与传统方法的错台量检测偏差小于2 mm,椭圆度检测偏差小于0.1%,可以满足大直径盾构隧道成型质量巡检的高速度、高精度、低成本需求. 展开更多
关键词 大直径盾构隧道 激光扫描 阈值分割 错台检测 变形检测
下载PDF
基于NVAE和OB-Mix的小样本数据增强方法 被引量:1
18
作者 杨玮 钟名锋 +3 位作者 杨根 侯至丞 王卫军 袁海 《计算机工程与应用》 CSCD 北大核心 2024年第2期103-112,共10页
由于深度学习模型对海量标注数据的依赖性较高,导致目前许多前沿性目标检测理论难以适用于工业检测领域。为此,提出一种基于NVAE图像生成和OB-Mix数据增强的小样本数据扩充方法。具体方法是通过NVAE构建检测目标的数据分布模型,再通过... 由于深度学习模型对海量标注数据的依赖性较高,导致目前许多前沿性目标检测理论难以适用于工业检测领域。为此,提出一种基于NVAE图像生成和OB-Mix数据增强的小样本数据扩充方法。具体方法是通过NVAE构建检测目标的数据分布模型,再通过采样潜变量的方式生成与真实目标图像属于同一分布的全新目标图像。在得到生成目标图像后,提出了OB-Mix数据增强策略,将生成目标图像与背景图像进行随机位置融合以构建出新的图像数据,从而提高网络的定位能力及泛化能力。方法在仅使用474张标注图像以及400张无检测目标的背景图像情况下,使YOLOv5的检测精确率达到95.86%,相比于不使用该方法的结果提高了17.60个百分点。 展开更多
关键词 数据增强 小样本 数据生成 新派变分自编码器(NVAE) 表面缺陷检测 深度学习
下载PDF
注意力引导的多尺度红外行人车辆实时检测 被引量:1
19
作者 张印辉 计凯 +1 位作者 何自芬 陈光晨 《红外与激光工程》 EI CSCD 北大核心 2024年第5期229-239,共11页
红外成像技术通过捕捉目标热辐射特征进行成像,能实现复杂道路场景下的目标监测和道路冗杂信息滤除。针对红外行人和车辆目标检测模型参数量大、依赖高性能GPU资源和检测速度慢等问题,提出了一种注意力引导的多尺度红外行人车辆实时检... 红外成像技术通过捕捉目标热辐射特征进行成像,能实现复杂道路场景下的目标监测和道路冗杂信息滤除。针对红外行人和车辆目标检测模型参数量大、依赖高性能GPU资源和检测速度慢等问题,提出了一种注意力引导的多尺度红外行人车辆实时检测模型。首先,为精确匹配校准红外行人和车辆目标尺度与锚框尺寸,利用K-Means++算法对红外行人和车辆目标尺度进行先验框预置参数重聚类生成,并设计128×128精细尺度检测层;其次,设计注意力引导广域特征提取模块增强模型特征提取能力和空间及通道信息聚焦能力;随后,构建跨空间感知模块引入空间信息感知,强化不同尺度空间下的目标的特征表达能力;最后,针对资源受限设备,通过4倍通道剪枝方法降低模型参数量,增强移动端算法部署适应性。实验结果表明:所提IRDet算法与基准方法相比,模型平均检测精度提升4.3%,达到87.4%,模型权重值压缩60.4%,降至5.7 MB。 展开更多
关键词 红外交通检测 先验框匹配 注意力引导 跨空间感知 模型剪枝
原文传递
基于改进DBNet和SVTR算法的连铸板坯号检测与识别 被引量:1
20
作者 刘乐 张晓松 +1 位作者 黄锋 方一鸣 《电子测量与仪器学报》 CSCD 北大核心 2024年第2期67-75,共9页
针对钢铁连铸产线板坯号识别字符区域小、光照变化复杂、板坯号图像质量差等问题,提出了一种基于深度学习的连铸板坯号检测与识别两阶段算法。首先,基于采集的连铸产线板坯图像,制备用于板坯号检测与识别的数据集;其次,在板坯号检测阶段... 针对钢铁连铸产线板坯号识别字符区域小、光照变化复杂、板坯号图像质量差等问题,提出了一种基于深度学习的连铸板坯号检测与识别两阶段算法。首先,基于采集的连铸产线板坯图像,制备用于板坯号检测与识别的数据集;其次,在板坯号检测阶段,基于DBNet算法设计一种AD-PAN特征融合结构,以增强检测算法的多尺度特征融合能力和扩大感受野,提高板坯号定位精度;再次,在板坯号识别阶段,引入SPIN矫正网络和SVTR板坯号识别网络进行端到端训练,使其能够主动转换输入亮度,并改善字符间以及字符与背景间色彩失真的问题。最后,在自制的板坯号检测与识别数据集上进行了对比实验。实验结果表明,本研究提出的算法能够有效定位辊道上不同位置的板坯,并且在复杂背景下对板坯号进行鲁棒识别。其中,板坯号检测Hmean数值为97.92%,板坯号识别的准确率为97.33%,验证了本文所提算法具有较高的板坯号检测与识别精度。 展开更多
关键词 板坯号识别 DBNet 特征金字塔融合 端到端网络 SPIN矫正 SVTR
原文传递
上一页 1 2 250 下一页 到第
使用帮助 返回顶部