期刊文献+
共找到13篇文章
< 1 >
每页显示 20 50 100
InternDiffuseDet:结合可变形卷积和扩散模型的目标检测方法 被引量:1
1
作者 袁志祥 高永奇 《计算机工程与应用》 CSCD 北大核心 2024年第12期203-215,共13页
针对现有目标检测中存在的漏检和误检、特征提取能力有限、处理复杂场景时检测精度不高等问题,基于DiffusionDet进行改进,提出了一种结合可变形卷积和扩散模型的目标检测方法。以模型在进入检测头之前需要更多且优质的特征图为核心思想... 针对现有目标检测中存在的漏检和误检、特征提取能力有限、处理复杂场景时检测精度不高等问题,基于DiffusionDet进行改进,提出了一种结合可变形卷积和扩散模型的目标检测方法。以模型在进入检测头之前需要更多且优质的特征图为核心思想,在主干网络中引入InternImage和DCNv3可变形卷积算子提升模型的感受野和非线性建模能力。对中间层的FPN特征金字塔进行改进,设计了一种基于选择性加权的特征金字塔CS-FPN;利用深度可分离卷积实现通道和区域的分离,同时采用CARAFE算子替代传统的上采样操作,提高分辨率和语义信息的传递;随后利用SGE注意力机制对特征图进行重组,以确保特征图在扩散的过程中保留更多的层次化信息。在特征图进入检测头之前,进行DDIM的扩散操作,获得不同时刻的特征图,以扩充检测特征图的数量。最后在目标框匹配和损失函数方面采用EIOU算法以处理目标框之间的位置偏移和尺度差异。实验数据显示,在COCO数据集和道路检测数据集上,改进后的模型在相同的实验环境下比原有模型分别提升了3.8和3.6个百分点。实验结果表明该方法在提高目标检测的准确性和鲁棒性方面具有一定的潜力,并为解决现实场景中的目标检测问题提供了新的思路和方法。 展开更多
关键词 DiffusionDet 可变形卷积 扩散模型 特征金字塔 损失函数
下载PDF
基于卷积神经网络的微地震事件识别方法研究
2
作者 李思远 訾乾龙 《计算机与数字工程》 2024年第7期1993-1997,共5页
近些年来,科学技术的发展为社会带来了可观的收益。利用深度学习进行微地震事件识别也成为了一个研究热点。非常规油气勘探开发成为当前油气资源的主要途径,非常规勘探开发又需要微地震事件识别,针对微地震事件识别,主要解决的是快速、... 近些年来,科学技术的发展为社会带来了可观的收益。利用深度学习进行微地震事件识别也成为了一个研究热点。非常规油气勘探开发成为当前油气资源的主要途径,非常规勘探开发又需要微地震事件识别,针对微地震事件识别,主要解决的是快速、准确地检测微地震事件,这对石油勘探工作有着重大意义。为解决提取特征引入不确定性等缺点,论文利用雷克子波正演生成微地震信号数据再添加高斯嗓声进行模型研究。通过对构建数据集、搭建网络模型、评价模型输出结果等步骤,实现识别方法。经过反复试验与仿真实验,用卷积神经网络的方法可以对微地震有效信号快速准确地检测以及去掉冗余信息,提高微地震有效数据传输。 展开更多
关键词 卷积神经网络 空间金字塔池化 微地震正演模拟
下载PDF
基于改进Faster R-CNN的铝型材表面缺陷检测研究
3
作者 吴吉灵 金玉珍 《计算机时代》 2023年第11期52-57,共6页
针对传统目标检测算法在铝型材表面缺陷检测中检测精度低、微小缺陷难以识别等问题,提出一种改进的Faster R-CNN算法。该算法对特征提取网络、感兴趣区域池化和锚框尺寸进行了优化,并在此基础上引入了特征金字塔和可变形卷积,以提升检... 针对传统目标检测算法在铝型材表面缺陷检测中检测精度低、微小缺陷难以识别等问题,提出一种改进的Faster R-CNN算法。该算法对特征提取网络、感兴趣区域池化和锚框尺寸进行了优化,并在此基础上引入了特征金字塔和可变形卷积,以提升检测精度。实验表明,改进算法的平均精确度均值可达到86.73%,相较于原算法提升了8.70%,其对微小缺陷识别效果好,满足了工业上对缺陷检测的需求。 展开更多
关键词 表面缺陷检测 Faster R-CNN 特征金字塔 可变形卷积 感兴趣区域池化
下载PDF
一种多尺度的图像动态场景盲去模糊网络 被引量:3
4
作者 唐述 万盛道 +4 位作者 谢显中 杨书丽 黄容 顾佳 郑万鹏 《软件学报》 EI CSCD 北大核心 2022年第9期3498-3511,共14页
近几年,基于卷积神经网络(convolutional neural network, CNN)的单幅图像动态场景盲去模糊(single image dynamic scene blind deblurring, SIDSBD)方法已经取得了巨大的进步.其成功主要是源于多尺度模型或者多块模型、编解码器架构的... 近几年,基于卷积神经网络(convolutional neural network, CNN)的单幅图像动态场景盲去模糊(single image dynamic scene blind deblurring, SIDSBD)方法已经取得了巨大的进步.其成功主要是源于多尺度模型或者多块模型、编解码器架构的设计和残差块结构的设计3个方面.基于此,提出了一种新的多尺度卷积神经网络(multiscale convolutional neural network, MSCNN)来进一步开发多尺度模型、编解码器架构和残差块结构的优势,以实现更高质量的动态场景盲去模糊.首先,受到空间金字塔池化(spatial pyramid pooling, SPP)和多块模型的启发,提出了一种分等级的多块通道注意力机制(hierarchical multi-patch channel attention, HMPCA).提出的HMPCA通过利用特征图的全局特征统计量和局部特征统计量来自适应地对特征图进行逐通道的权重赋值.因为利用了局部信息,因此HMPCA可以被认为是增加了通道方向的感受野,也正因如此,提出的HMPCA能够进一步增强网络的表达能力.其次,不同于现有的多尺度模型,发展出了一种新的多尺度模型,该模型中的每个尺度是由多个编码器和多个解码器构成的.因为HMPCA,使得同一尺度内的编码器和解码器并不完全相同,因此提出的多尺度模型可以被看作是增加了编解码器的深度,因此能够提升每一个尺度的去模糊性能,最终实现更高质量的动态场景盲去模糊.大量的实验结果表明:提出的方法较近几年的一些成功的SIDSBD方法相比,能够复原出更高质量的去模糊图像,在客观的评价指标和主观的视觉效果上均有显著的改进. 展开更多
关键词 卷积神经网络 动态场景盲去模糊 多尺度模型 通道注意力机制 空间金字塔池化
下载PDF
遥感影像船舶检测的特征金字塔网络建模方法 被引量:14
5
作者 邓睿哲 陈启浩 +1 位作者 陈奇 刘修国 《测绘学报》 EI CSCD 北大核心 2020年第6期787-797,共11页
船舶作为海上运输载体,其准确检测在海洋环境保护、海上渔业生产管理、海上交通与应急处置及国防安全应用中都具有重要意义和价值。目前基于目标检测网络的遥感船舶检测方法因末层特征分辨率不足和卷积固定的几何结构,导致网络难以适应... 船舶作为海上运输载体,其准确检测在海洋环境保护、海上渔业生产管理、海上交通与应急处置及国防安全应用中都具有重要意义和价值。目前基于目标检测网络的遥感船舶检测方法因末层特征分辨率不足和卷积固定的几何结构,导致网络难以适应小尺度且具有随机朝向、形态多变特征的船舶目标,进而限制船舶检测精度。针对该问题,本文提出一种用于遥感影像船舶检测的特征金字塔网络建模方法。首先引入形变卷积/RoI池化模块,以适应朝向和形态多变的船舶目标;其次借鉴在小目标检测中性能出色的特征金字塔网络的建模思想,采用对称式网络和多尺度特征融合的方式进一步融合高级语义和低级空间信息,提升小尺度目标特征分辨率。在40000幅、船舶目标67280余个的遥感影像数据集上的试验结果表明,本文方法能够有效集成形变卷积/RoI池化和多尺度特征融合方法,相较传统CNN船舶检测方法取得明显提升,在准确率、召回率及F1指标上分别达到85.8%、97.9%和91.5%。 展开更多
关键词 船舶检测 特征金字塔网络 形变卷积模块 形变RoI池化模块
下载PDF
融合特征金字塔与可变形卷积的高密度群养猪计数方法 被引量:5
6
作者 王荣 高荣华 +3 位作者 李奇峰 冯璐 白强 马为红 《农业机械学报》 EI CAS CSCD 北大核心 2022年第10期252-260,共9页
针对猪只人工计数方法消耗时间和劳动力,育肥猪较为活跃且喜好聚集,图像中存在大量的高密度区域,导致猪只之间互相粘连、遮挡等问题,基于SOLO v2实例分割算法,提出了一种自然养殖场景下融合多尺度特征金字塔与二代可变形卷积的高密度群... 针对猪只人工计数方法消耗时间和劳动力,育肥猪较为活跃且喜好聚集,图像中存在大量的高密度区域,导致猪只之间互相粘连、遮挡等问题,基于SOLO v2实例分割算法,提出了一种自然养殖场景下融合多尺度特征金字塔与二代可变形卷积的高密度群养猪计数模型。通过优化模型结构来减少计算资源的消耗与占用。将科大讯飞给出的猪只计数的公开数据集划分为猪只分割数据集和猪只盘点测试集,利用猪只分割数据集获得较好的分割模型,然后在猪只盘点测试集中测试盘点准确率,实现猪群分割和猪只计数。实验结果表明,本文提出的高密度猪只计数模型的分割准确率达到96.7%,且模型内存占用量为256 MB,为改进前的2/3,实现了遮挡、粘连和重叠情况下的猪只个体高准确率分割。在含有500幅猪只图像计数测试集中,模型计算猪只数量误差为0时的图像数量为207幅,较改进前提高26%。模型计算猪只数量误差小于2头猪的图像数量占测试图像总数量的97.2%。模型计算猪只数量误差大于3头猪的图像数量占总体图像数量比例仅为1%。最后,对比基于YOLO v5的群养猪计数方法,本文模型具有更优的分割效果和计数准确率,验证了本文方法对群养猪只计数的有效性。因此,本文模型既实现了高密度猪群的精准计数,还通过优化模型结构大大降低了模型对计算设备的依赖,使其适用于养殖场内猪群在线计数。 展开更多
关键词 高密度群养猪 计数模型 实例分割 SOLO v2 多尺度特征金字塔网络 可变形卷积
下载PDF
基于CNN深度模型的小麦不完善粒识别 被引量:19
7
作者 曹婷翠 何小海 +2 位作者 董德良 石恒 熊淑华 《现代计算机》 2017年第24期9-14,共6页
针对小麦不完善粒识别中传统图像处理方法需要复杂的特征提取且识别效果不佳的问题,设计并实现基于CNN深度模型的小麦不完善粒识别方法。建立图像数据库Wheat Image,并结合空间金字塔池化理论构建CNN网络模型,接着对样本集进行扩展,以... 针对小麦不完善粒识别中传统图像处理方法需要复杂的特征提取且识别效果不佳的问题,设计并实现基于CNN深度模型的小麦不完善粒识别方法。建立图像数据库Wheat Image,并结合空间金字塔池化理论构建CNN网络模型,接着对样本集进行扩展,以提高模型泛化能力,设计双面识别方案并完成对小麦完善粒、破碎粒和病斑粒的识别。所提出的方法相对于传统的图像处理识别方法,识别率提高15个百分点;相对于常规CNN模型,识别率提高5%;对于引入噪声以及亮度改变的图像,识别率也达到90%以上;设计的双面识别方案有效地降低了识别的错误率。提出的方法不仅避免复杂的特征提取步骤,而且有效地提升麦粒识别率,对小麦的智能检测识别具有重要意义。 展开更多
关键词 卷积神经网络(CNN) 小麦不完善粒 空间金字塔池化 模型
下载PDF
基于可变形卷积神经网络的人体动作识别 被引量:6
8
作者 王雪娇 智敏 《计算机工程与科学》 CSCD 北大核心 2021年第1期105-111,共7页
针对复杂场景中人体动作识别准确率不高的问题,构建了一种基于可变形卷积网络(DCN)与可变形部件模型(DPM)融合改进的人体动作识别系统。首先将DPM的部件滤波器由5个增加到8个,并结合分支定界算法共同将准确率提高约11个百分点,速度提高... 针对复杂场景中人体动作识别准确率不高的问题,构建了一种基于可变形卷积网络(DCN)与可变形部件模型(DPM)融合改进的人体动作识别系统。首先将DPM的部件滤波器由5个增加到8个,并结合分支定界算法共同将准确率提高约11个百分点,速度提高3倍左右;其次利用DCN根据人体动作进行感兴趣点采样;然后将改进的DPM与DCN在可变形池化前进行融合;最后通过全连接层对输入数据进行动作的识别。实验结果表明,此系统能够在人体动作数据集上更快、更准确地得到识别结果。 展开更多
关键词 人体动作识别 可变形卷积 可变形感兴趣池化 可变形部件模型算法 卷积神经网络 分支定界算法
下载PDF
Norm-DP模型行人检测优化算法
9
作者 柴恩惠 马占飞 智敏 《计算机科学与探索》 CSCD 北大核心 2021年第3期545-552,共8页
传统深度金字塔模型作为一种有效的行人检测算法备受关注,融合可变形部件模型和卷积神经网络模型,但特征提取部分使用的算法像素区域的大小不同,导致模型之间不能完全融合,在行人数量多、姿势复杂和有遮挡情况时的检测效果不理想。因此... 传统深度金字塔模型作为一种有效的行人检测算法备受关注,融合可变形部件模型和卷积神经网络模型,但特征提取部分使用的算法像素区域的大小不同,导致模型之间不能完全融合,在行人数量多、姿势复杂和有遮挡情况时的检测效果不理想。因此,提出一种基于规范化函数的深度金字塔模型(Norm-DP)算法,使用规范化函数融合可变形部件模型和卷积神经网络模型,直接从金字塔特征中提取正负样本,使用隐变量支持向量机进行模型训练,结合柔性非最大抑制(soft-NMS)算法和边界框回归(BBR)算法对定位框进行优化。分别使用INRIA和MS COCO数据集进行实验验证,在行人数量多、姿势复杂和有遮挡情况时,检测精度高于最优的可变形部件模型算法、卷积神经网络算法、深度金字塔模型算法和结合区域选择的卷积神经网络算法。 展开更多
关键词 卷积神经网络(CNN) 可变形部件模型算法 规范化深度金字塔(Norm-DP) 柔性非最大抑制(Soft-NMS) 边界框回归(BBR)
下载PDF
基于改进HRNet的眼底视网膜血管分割算法
10
作者 梁礼明 曾嵩 +1 位作者 冯骏 盛校棋 《计算机系统应用》 2021年第9期219-225,共7页
针对现有眼底视网膜血管分割算法普遍存在的微小血管细节丢失和病灶信息误判等问题,提出一种基于改进HRNet的血管分割算法.在预处理阶段,利用限制对比度自适应直方图均衡化和自适应的Gamma矫正提高血管与背景对比度;在编码阶段,将HRNet... 针对现有眼底视网膜血管分割算法普遍存在的微小血管细节丢失和病灶信息误判等问题,提出一种基于改进HRNet的血管分割算法.在预处理阶段,利用限制对比度自适应直方图均衡化和自适应的Gamma矫正提高血管与背景对比度;在编码阶段,将HRNet原始卷积替换为可变形卷积,提升卷积对复杂血管形态结构的适应能力;在多尺度特征融合阶段,引入空间金字塔池化和多尺度卷积,扩大感受野同时增强对目标局部特征关注度,改善血管伪影和细微信息丢失的问题.该算法在DRIVE数据库上仿真实验,其准确率、灵敏度和特异性分别为95.79%、80.33%和98.12%. 展开更多
关键词 视网膜血管分割 HRNet 可变形卷积 空间金字塔池化 多尺度
下载PDF
基于双支路特征融合的MRI颅脑肿瘤图像分割研究 被引量:2
11
作者 熊炜 周蕾 +2 位作者 乐玲 张开 李利荣 《光电子.激光》 CAS CSCD 北大核心 2022年第4期383-392,共10页
针对磁共振成像(magnetic resonance imaging, MRI)颅脑肿瘤区域误识别与分割网络空间信息丢失问题,提出一种基于双支路特征融合的MRI脑肿瘤图像分割方法。首先通过主支路的重构VGG与注意力模型(re-parameterization visual geometry gr... 针对磁共振成像(magnetic resonance imaging, MRI)颅脑肿瘤区域误识别与分割网络空间信息丢失问题,提出一种基于双支路特征融合的MRI脑肿瘤图像分割方法。首先通过主支路的重构VGG与注意力模型(re-parameterization visual geometry group and attention model, RVAM)提取网络的上下文信息,然后使用可变形卷积与金字塔池化模型(deformable convolution and pyramid pooling model, DCPM)在副支路获取丰富的空间信息,之后使用特征融合模块对两支路的特征信息进行融合。最后引入注意力模型,在上采样过程中加强分割目标在解码时的权重。提出的方法在Kaggle_3m数据集和BraTS2019数据集上进行了实验验证,实验结果表明该方法具有良好的脑肿瘤分割性能,其中在Kaggle_3m上,Dice相似系数、杰卡德系数分别达到了91.45%和85.19%。 展开更多
关键词 磁共振成像(magnetic resonance imaging MRI)颅脑肿瘤图像分割 双支路特征融合 重构VGG与注意力模型(re-parameterization visual geometry group and attention model RVAM) 可变形卷积与金字塔池化模型(deformable convolution and pyramid pooling model dcpm)
原文传递
基于改进FPN的复杂场景下SAR图像船舶目标检测 被引量:2
12
作者 周慧 李迎秋 +2 位作者 陈澎 沈宇军 朱煜锋 《大连海事大学学报》 CAS CSCD 北大核心 2022年第4期76-83,共8页
针对合成孔径雷达(SAR)图像近岸船舶目标受背景杂波影响,导致SAR图像船舶目标检测率低和小尺度舰船目标漏检率高的问题,提出一种适用于复杂背景下SAR图像近岸舰船目标检测的改进FPN模型。该模型基于FPN目标检测算法,在特征提取网络中利... 针对合成孔径雷达(SAR)图像近岸船舶目标受背景杂波影响,导致SAR图像船舶目标检测率低和小尺度舰船目标漏检率高的问题,提出一种适用于复杂背景下SAR图像近岸舰船目标检测的改进FPN模型。该模型基于FPN目标检测算法,在特征提取网络中利用可变形卷积更加精确地确定目标采样点位置,以增强目标的特征提取能力,提高复杂背景下SAR图像舰船标的检测率;同时,采用通道注意力机制来捕获特征提取网络中不同通道图之间的特征依赖关系,降低漏检率。在公开的SAR图像舰船数据集上的测试结果表明,该模型在复杂场景下的检测精度为87.95%,相比原始FPN提升了8.46%,其中,针对小尺度舰船目标检测精度为95.14%,相比原始FPN检测精度提升了5.28%;对比Yolo5和mask RCNN,改进FPN模型平均检测精度分别提升了11.21%、2.98%。 展开更多
关键词 合成孔径雷达(SAR)图像 船舶目标检测 改进FPN模型 可变卷积 通道注意力
原文传递
轻量级注意力约束对齐网络的视频超分重建
13
作者 靳雨桐 宋慧慧 刘青山 《中国图象图形学报》 CSCD 北大核心 2022年第10期2984-2993,共10页
目的深度学习在视频超分辨率重建领域表现出优异的性能,本文提出了一种轻量级注意力约束的可变形对齐网络,旨在用一个模型参数少的网络重建出逼真的高分辨率视频帧。方法本文网络由特征提取模块、注意力约束对齐子网络和动态融合分支3... 目的深度学习在视频超分辨率重建领域表现出优异的性能,本文提出了一种轻量级注意力约束的可变形对齐网络,旨在用一个模型参数少的网络重建出逼真的高分辨率视频帧。方法本文网络由特征提取模块、注意力约束对齐子网络和动态融合分支3部分组成。1)共享权重的特征提取模块在不增加参数量的前提下充分提取输入帧的多尺度语义信息。2)将提取到的特征送入注意力约束对齐子网络中生成具有精准匹配关系的对齐特征。3)将拼接好的对齐特征作为共享条件输入动态融合分支,融合前向神经网络中参考帧的时域对齐特征和原始低分辨率(low-resolution,LR)帧在不同阶段的空间特征。4)通过上采样重建高分辨率(high-resolution,HR)帧。结果实验在两个基准测试数据集(Vid4(Vimeo-90k)和REDS4(realistic and diverse scenes dataset))上进行了定量评估,与较先进的视频超分辨率网络相比,本文方法在图像质量指标峰值信噪比(peak signal to noise ratio,PSNR)和结构相似性(structural similarity,SSIM)方面获得了更好的结果,进一步提高了超分辨率的细节特征。本文网络在获得相同的PSNR指标的情况下,模型参数减少了近50%。结论通过极轴约束使得注意力对齐网络模型参数量大大减少,并能够充分捕获远距离信息来进行特征对齐,产生高效的时空特征,还通过设计动态融合机制,实现了高质量的重建结果。 展开更多
关键词 视频超分辨率(VSR) 轻量网络 可变形卷积 注意力约束 动态融合机制 残差空洞空间金字塔池化
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部