期刊文献+
共找到202篇文章
< 1 2 11 >
每页显示 20 50 100
基于SwinT-YOLOX模型的自动扶梯行人安全检测算法
1
作者 侯颖 杨林 +3 位作者 胡鑫 贺顺 宋婉莹 赵谦 《计算机工程》 CAS CSCD 北大核心 2024年第3期277-289,共13页
自动扶梯被广泛应用在公共场合,乘客摔倒事故如果不能被及时发现并处理,会造成严重的人身伤害,因此实现自动扶梯智能化监控管理势在必行。受自动扶梯运行环境复杂、行人多以及局部遮挡情况的影响,传统的人体姿态特征摔倒检测模型效果不... 自动扶梯被广泛应用在公共场合,乘客摔倒事故如果不能被及时发现并处理,会造成严重的人身伤害,因此实现自动扶梯智能化监控管理势在必行。受自动扶梯运行环境复杂、行人多以及局部遮挡情况的影响,传统的人体姿态特征摔倒检测模型效果不佳且检测速度减慢。融合Swin Transformer和YOLOX目标检测算法的优秀策略,提出一种基于SwinT-YOLOX网络模型的自动扶梯行人摔倒检测算法。采用Swin Transformer模型作为骨干网络,颈部网络使用添加注意力机制的YOLOX模型,进一步提升特征图的多样性和表达能力。此外,利用漏斗修正线性单元视觉激活函数构建CBF模块,改进颈部网络和Head网络结构,从而获得更优的特征检测性能。实验结果表明,针对自建扶梯行人摔倒数据库和网络采集实际扶梯行人摔倒事故,与AlphaPose、OpenPose、YOLOv5等算法相比,该算法检测性能明显提高,行人摔倒平均检测精度可以达到95.92%,检测帧率为24.08帧/s,能够快速、精准地检测到乘客摔倒事故发生,监控管理平台立刻采取安全急停措施以保证乘客安全。 展开更多
关键词 自动扶梯 摔倒检测 深度学习 YOLOX模型 swin Transformer模型 漏斗修正线性单元视觉激活函数
下载PDF
基于Swin Transformer与GRU的低温贮藏番茄成熟度识别与时序预测研究
2
作者 杨信廷 刘彤 +2 位作者 韩佳伟 郭向阳 杨霖 《农业机械学报》 EI CAS CSCD 北大核心 2024年第3期213-220,共8页
面向绿熟番茄采后持续转熟特征,适时调温是满足不同成熟度番茄适宜贮运温度需求的关键,而果实成熟度自动识别与动态预测则是实现温度适时调控的基础条件。本文基于Swin Transformer与改进GRU提出了一种番茄成熟度识别与时序动态预测模型... 面向绿熟番茄采后持续转熟特征,适时调温是满足不同成熟度番茄适宜贮运温度需求的关键,而果实成熟度自动识别与动态预测则是实现温度适时调控的基础条件。本文基于Swin Transformer与改进GRU提出了一种番茄成熟度识别与时序动态预测模型,首先通过融合番茄两侧图像获取番茄表观全局红色总占比,构建不同成熟番茄图像数据集,并基于迁移学习优化Swin Transformer模型初始权重配置,实现番茄成熟度分类识别;其次,周期性采集不同储藏温度(4、9、14℃)下番茄图像数据,结合番茄初始颜色特征与贮藏环境信息,构建基于Swin Transformer与GRU的番茄成熟度时序预测模型,并融合时间注意力模块优化模型预测精度;最后,对比分析不同模型预测结果,验证本研究所提模型的准确性与优越性。结果表明,番茄成熟度正确识别率为95.783%,相比VGG16、AlexNet、ResNet50模型,模型正确识别率分别提升2.83%、3.35%、12.34%。番茄成熟度时序预测均方误差(MSE)为0.225,相比原始GRU、LSTM、BiGRU模型MSE最高降低29.46%。本研究为兼顾番茄成熟度实现贮藏温度柔性适时调控提供了关键理论基础。 展开更多
关键词 番茄 低温贮藏 成熟度识别 时序预测模型 swin Transformer GRU
下载PDF
基于混合裁剪失衡数据增强与SwinNet网络的滚动轴承故障诊断
3
作者 火久元 李宇峰 +2 位作者 常琛 李超杰 许继豪 《振动与冲击》 EI CSCD 北大核心 2024年第6期64-74,共11页
针对在滚动轴承故障诊断领域中存在的故障样本较少,健康样本丰富所导致的故障类别失衡问题以及环境中存在噪声与人为噪声标签干扰等问题,提出了一种基于混合裁剪失衡数据增强与SwinNet网络相结合的故障诊断模型(fault diagnosis model c... 针对在滚动轴承故障诊断领域中存在的故障样本较少,健康样本丰富所导致的故障类别失衡问题以及环境中存在噪声与人为噪声标签干扰等问题,提出了一种基于混合裁剪失衡数据增强与SwinNet网络相结合的故障诊断模型(fault diagnosis model combining mixed-cutout imbalance data augmentation and SwinNet,SwinNet-MCIDA)。首先,借鉴图像分类数据增强方法,利用混合裁剪失衡数据增强算法对失衡类别的数据进行裁剪、混合处理生成新的故障样本来增加样本量,构造出增强数据集,然后对增强数据集进行小波变换转换成时频图像,将所得图像输入到卷积神经网络与Swin Transformer编码器相结合的SwinNet网络模型中,进行特征提取和故障分类,从而实现滚动轴承故障的高效诊断。试验结果表明,该文所提出的SwinNet-MCIDA故障诊断方法不仅可以很好地解决滚动轴承故障诊断领域故障类别失衡问题,而且也可以很好地应对故障数据中存在环境噪声问题与人为噪声标签干扰问题。 展开更多
关键词 滚动轴承 故障诊断 数据增强 卷积神经网络 swin Transformer
下载PDF
基于Swin Transformer的沥青路面病害分类检测研究
4
作者 郭晨 杨玉龙 +1 位作者 左琛 杨冰鑫 《计算机测量与控制》 2024年第2期114-121,共8页
针对传统卷积神经网络模型在沥青路面病害检测中识别长距离裂缝结构能力不足以及面临的精度局限问题,引入Swin Transformer模型进行沥青路面病害分类研究;首先对于路面检测车采集到的沥青路面扫描图像对比度低的问题,使用直方图均衡技... 针对传统卷积神经网络模型在沥青路面病害检测中识别长距离裂缝结构能力不足以及面临的精度局限问题,引入Swin Transformer模型进行沥青路面病害分类研究;首先对于路面检测车采集到的沥青路面扫描图像对比度低的问题,使用直方图均衡技术处理图像,增加图像可视化效果;其次,选取3种经典卷积神经网络模型作为对比模型,并在训练过程中采用更换损失函数,调整预训练模型等手段解决过拟合问题;并选用准确率、查全率、F1-score作为评价指标;在最终实验结果中Swin Transformer识别准确率达到了80.6%,F1-score达到了0.776,不仅在整体分类准确率上超越了传统CNN模型,并且对具有长距离特征结构的病害方面具有更高的识别准确率,同时具有良好的可靠性。 展开更多
关键词 swin Transformer 路面病害检测 卷积神经网络 图像分类 图像处理
下载PDF
localswin:基于swin-transformer的高效胃癌病理图像分割
5
作者 毛松仁 刘杰 《信息技术与信息化》 2024年第1期212-216,共5页
医学图像分割技术在疾病诊断中发挥着重要作用,但是CNN在处理图像时缺乏全局上下文信息,而transformer对于局部信息处理能力相对较弱,这都影响分割任务的准确性。针对这一问题,提出名为localswin的高性能分割网络,在U-Net架构的基础上,... 医学图像分割技术在疾病诊断中发挥着重要作用,但是CNN在处理图像时缺乏全局上下文信息,而transformer对于局部信息处理能力相对较弱,这都影响分割任务的准确性。针对这一问题,提出名为localswin的高性能分割网络,在U-Net架构的基础上,编码部分使用swin transformer模块,将反向残差块中所使用的深度卷积引入前馈网络中,增强了对局部特征的提取能力。利用所提出的策略来融合全局和局部特征,提高了模型的性能和效果。在公开的BOT胃切片数据集上评估了所提出的网络。实验结果表明,localswin与其他深度分割模型相比,在分割任务上有更好的效果,对基于切片的分割的准确率达到86.27%。 展开更多
关键词 医学图像分割 swin transformer localswin U型架构
下载PDF
基于改进YOLOv5s的CNN-Swin Transformer森林野生动物图像目标检测算法
6
作者 杨文翰 刘天宇 +2 位作者 周俊池 胡文武 蒋蘋 《林业科学》 EI CAS CSCD 北大核心 2024年第3期121-130,共10页
【目的】为提高野生动物在复杂森林环境中的检测精度,促进森林野生动物保护技术发展,提出一种基于YOLOv5s网络模型、针对陷阱相机所摄取森林野生动物图像的改进检测算法。【方法】以包含湖南壶瓶山国家级自然保护区几种典型森林野生动... 【目的】为提高野生动物在复杂森林环境中的检测精度,促进森林野生动物保护技术发展,提出一种基于YOLOv5s网络模型、针对陷阱相机所摄取森林野生动物图像的改进检测算法。【方法】以包含湖南壶瓶山国家级自然保护区几种典型森林野生动物在内的数据集为研究对象,首先,对真实标注框图像进行裁剪、归一化和缩放处理,随机将2~4张裁剪图像拼贴组成新的数据集元素,以丰富和增强数据集图像信息;其次,使用一种基于通道注意力思想的加权通道拼接方法,在通道拼接时引入权重改变通道数量,通过反向传播训练方法不断更新权重以增加重要特征信息的通道层数;接着,引入Swin Transformer模块与CNN网络相结合,为卷积神经网络特征提取加入自注意力机制,融合2种网络特征提取层的优势,提高特征提取的感受野;最后,选择更优的α-DIoU损失函数替代GIoU损失函数,针对边界框重叠面积和中心点距离造成的损失,引入新的几何因素惩罚项。【结果】在相同试验条件和数据集下,相比原YOLOv5s网络模型,改进算法极大提高检测的平均准确率和平均回归率,均值平均精度由74.1%提升至88.4%,获得14.3%的精度提升,同时也超过YOLOv3、YOLOXs、RetinaNet、Faster R-CNN等其他流行目标检测算法。【结论】针对陷阱相机所摄取森林野生动物图像背景与目标对比度低、遮挡重叠严重,致使检测误检率、漏检率高等问题,在检测算法中提出一系列改进措施,为我国森林野生动物的保护和数据获取提供一种新的可行性方案和思路。 展开更多
关键词 森林野生动物 检测算法 YOLOv5s swin Transformer 网络融合
下载PDF
基于CNN-Swin Transformer Network的LPI雷达信号识别
7
作者 苏琮智 杨承志 +2 位作者 邴雨晨 吴宏超 邓力洪 《现代雷达》 CSCD 北大核心 2024年第3期59-65,共7页
针对在低信噪比(SNR)条件下,低截获概率雷达信号调制方式识别准确率低的问题,提出一种基于Transformer和卷积神经网络(CNN)的雷达信号识别方法。首先,引入Swin Transformer模型并在模型前端设计CNN特征提取层构建了CNN+Swin Transforme... 针对在低信噪比(SNR)条件下,低截获概率雷达信号调制方式识别准确率低的问题,提出一种基于Transformer和卷积神经网络(CNN)的雷达信号识别方法。首先,引入Swin Transformer模型并在模型前端设计CNN特征提取层构建了CNN+Swin Transformer网络(CSTN),然后利用时频分析获取雷达信号的时频特征,对图像进行预处理后输入CSTN模型进行训练,由网络的底部到顶部不断提取图像更丰富的语义信息,最后通过Softmax分类器对六类不同调制方式信号进行分类识别。仿真实验表明:在SNR为-18 dB时,该方法对六类典型雷达信号的平均识别率达到了94.26%,证明了所提方法的可行性。 展开更多
关键词 低截获概率雷达 信号调制方式识别 swin Transformer网络 卷积神经网络 时频分析
原文传递
基于改进Swin-Transformer的柑橘病叶分类模型
8
作者 方俊泽 郭正 +2 位作者 李歌 邢素霞 王瑜 《中国农机化学报》 北大核心 2024年第1期252-258,共7页
针对柑橘病害人工检测效率低、成本高、准确度低等问题,结合人工智能技术对柑橘病叶进行分类识别。首先,建立模拟复杂环境下的柑橘病叶数据集。其次,提出一种改进的Swin-Trasnformer柑橘病叶分类模型,包含局部感知通道增强注意力模块(LP... 针对柑橘病害人工检测效率低、成本高、准确度低等问题,结合人工智能技术对柑橘病叶进行分类识别。首先,建立模拟复杂环境下的柑橘病叶数据集。其次,提出一种改进的Swin-Trasnformer柑橘病叶分类模型,包含局部感知通道增强注意力模块(LPCE),以提升模型的感受野和特征表达能力,通过通道之间的相关性进行加权,使模型更容易提取关键特征。试验证明本文模型的分类识别准确率达到98.52%,精确率、召回率和F 1-score分别达到98.17%、98.24%、98.28%,均超过基线模型。该模型为柑橘病害的检测提供技术支撑。 展开更多
关键词 柑橘病叶 深度学习 分类识别 swin-Transformer 注意力模块
下载PDF
基于感知增强Swin Transformer的遥感图像检测
9
作者 祝冰艳 陈志华 盛斌 《计算机工程》 CSCD 北大核心 2024年第1期216-223,共8页
随着遥感技术的快速发展,遥感图像检测被广泛应用于农业、军事、国防安全等众多领域。遥感图像相较于传统图像检测存在诸多难点,如何实现高效精准的遥感图像检测成为该领域的研究热点。针对遥感图像检测中存在的计算复杂度高、正负样本... 随着遥感技术的快速发展,遥感图像检测被广泛应用于农业、军事、国防安全等众多领域。遥感图像相较于传统图像检测存在诸多难点,如何实现高效精准的遥感图像检测成为该领域的研究热点。针对遥感图像检测中存在的计算复杂度高、正负样本不平衡、目标尺度小等问题,提出一种基于感知增强Swin Transformer的遥感图像检测网络,以提升遥感图像检测性能。在主干网络设计过程中,利用Swin Transformer分层设计和移动窗口的优点有效减小计算复杂度,同时插入空间局部感知块,加强网络对局部相关性和结构信息的提取能力。设计区域分布回归损失为小目标分配更大的权重,解决了正负样本不平衡的问题,同时结合改进的IoU-aware分类损失消除不同分支之间的差距,降低分类和回归损失。在公共遥感数据集DOTA上的多组实验结果表明,该网络获得了78.47%的平均精度均值和10.8帧/s的检测速度,检测性能优于经典的目标检测网络Faster R-CNN、Mask R-CNN以及现有优秀的遥感图像检测网络,并且在各类不同尺度的目标上均具有较好的性能表现。 展开更多
关键词 遥感图像 目标检测 swin Transformer 多尺度特征 深度学习
下载PDF
基于Swin Transformer的嵌入式零样本学习算法
10
作者 郜佳琪 魏巍 岳琴 《小型微型计算机系统》 CSCD 北大核心 2024年第4期784-791,共8页
零样本学习旨在解决样本缺失情况下的分类问题.以往嵌入式零样本学习算法通常只利用可见类构建嵌入空间,在测试时不可避免会出现过拟合可见类的问题.基于此本文提出了一种基于类别语义相似度的多标签分类损失,该损失可在构建嵌入空间的... 零样本学习旨在解决样本缺失情况下的分类问题.以往嵌入式零样本学习算法通常只利用可见类构建嵌入空间,在测试时不可避免会出现过拟合可见类的问题.基于此本文提出了一种基于类别语义相似度的多标签分类损失,该损失可在构建嵌入空间的过程中引导模型同时考虑与当前可见类语义上相似的未见类,进而将语义空间的相似性迁移到最终执行分类的嵌入空间.同时现有零样本学习算法大部分直接使用图像深度特征作为输入,特征提取过程没有考虑语义信息,基于此本文采用Swin Transformer作为骨干网络,输入原始图片利用自注意力机制得到基于语义信息的视觉特征.本文在3个零样本学习基准数据集上进行了大量实验,与目前最先进的算法相比取得了最佳的调和平均精度. 展开更多
关键词 零样本学习 深度学习 图像分类 注意力 swin Transformer
下载PDF
基于DH-Swin Unet的医学图像分割算法
11
作者 王艺妮 时宏伟 《计算机系统应用》 2024年第3期206-212,共7页
骨关节疾病自古以来是人类最高发的疾病之一,随着老龄化的不断加快,这类疾病日趋广泛,关节外科医师面临着巨大挑战.对人体关节的图像分割方法研究可以帮助医生进行临床诊断和治疗,然而,由于存在噪声、模糊、对比度低等问题,医学图像的... 骨关节疾病自古以来是人类最高发的疾病之一,随着老龄化的不断加快,这类疾病日趋广泛,关节外科医师面临着巨大挑战.对人体关节的图像分割方法研究可以帮助医生进行临床诊断和治疗,然而,由于存在噪声、模糊、对比度低等问题,医学图像的特征提取比普通图像更具挑战性,而且目前大多数分割模型在编码器和解码器之间都采用了普通的跳跃连接,没有注重解决跳跃连接过程中的信息间隙和损失问题.为解决这些问题,提出一种基于DH-Swin Unet的医学图像分割算法,该模型在Swin-Unet模型的基础上,在跳跃连接中引入密集连接的Swin Transformer块,并加入混合注意力机制,来强化网络的特征信息传递.通过在某三甲医院提供的真实临床数据对所提方法的性能进行评价,结果表明,所提出的方法取得了DSC为86.79%、HD为32.05 mm的分割结果,在关节疾病的临床诊断中具有一定的实用价值. 展开更多
关键词 U-Net 跳跃连接 医学图像分割 swin Transformer 注意力机制
下载PDF
基于Swin-Transformer与生成对抗网络的地震随机噪声压制方法
12
作者 周鸿帅 程冰洁 徐天吉 《石油物探》 CSCD 北大核心 2024年第1期116-128,共13页
目前深度学习类地震数据去噪方法大多基于卷积神经网络,而此类方法受限于卷积核的局部操作,缺少对地震数据全局特征的分析,因而降低了去噪效果。另外,以L 1,L 2损失函数为指标的网络模型容易出现过度平滑效应,产生虚假同相轴以及虚高的... 目前深度学习类地震数据去噪方法大多基于卷积神经网络,而此类方法受限于卷积核的局部操作,缺少对地震数据全局特征的分析,因而降低了去噪效果。另外,以L 1,L 2损失函数为指标的网络模型容易出现过度平滑效应,产生虚假同相轴以及虚高的峰值信噪比(PSNR)与结构相似性(SSIM)值。为此,提出一种基于Swin-Transformer(Swin-T)和生成对抗网络的去噪方法(ST-GAN)。该方法以Swin-Transformer作为生成对抗网络中的生成网络对地震数据去噪,判别网络基于卷积神经网络。Transformer的自注意力机制是全局操作,可以有效提取地震数据的全局特征,并能与卷积神经网络的局部操作互补,提升网络模型的特征提取能力。而对抗损失则提升了网络模型的细节恢复能力,有效避免因过度平滑效应产生的同相轴假象。将该方法应用于地震数据去噪,并与现有去噪方法进行对比分析,实验结果表明,该方法具有更加优异的特征提取能力,能在有效压制随机噪声的同时,恢复和保留更多的细节信息,提高了地震信号的信噪比。 展开更多
关键词 深度学习 噪声压制 swin-Transformer 自注意力机制 生成对抗网络 卷积神经网络 损失函数
下载PDF
基于随机增强Swin-Tiny Transformer的玉米病害识别及应用
13
作者 吴叶辉 李汝嘉 +4 位作者 季荣彪 李亚东 孙晓海 陈娇娇 杨建平 《吉林大学学报(理学版)》 CAS 北大核心 2024年第2期381-390,共10页
针对图像识别中获取全局特征的局限性及难以提升识别准确性的问题,提出一种基于随机增强Swin-Tiny Transformer轻量级模型的图像识别方法.该方法在预处理阶段结合基于随机数据增强(random data augmentation based enhancement,RDABE)... 针对图像识别中获取全局特征的局限性及难以提升识别准确性的问题,提出一种基于随机增强Swin-Tiny Transformer轻量级模型的图像识别方法.该方法在预处理阶段结合基于随机数据增强(random data augmentation based enhancement,RDABE)算法对图像特征进行增强,并采用Transformer的自注意力机制,以获得更全面的高层视觉语义信息.通过在玉米病害数据集上优化Swin-Tiny Transformer模型并进行参数微调,在农业领域的玉米病害上验证了该算法的适用性,实现了更精确的病害检测.实验结果表明,基于随机增强的轻量级Swin-Tiny+RDABE模型对玉米病害图像识别准确率达93.5867%.在参数权重一致,与性能优秀的轻量级Transformer、卷积神经网络(CNN)系列模型对比的实验结果表明,改进的模型准确率比Swin-Tiny Transformer,Deit3_Small,Vit_Small,Mobilenet_V3_Small,ShufflenetV2和Efficientnet_B1_Pruned模型提高了1.1877%~4.9881%,且能迅速收敛. 展开更多
关键词 swin-Tiny Transformer模型 数据增强 迁移学习 玉米病害识别 图像分类
下载PDF
基于Swin Transformer和UNet的肺结节分割方法
14
作者 裔馥华 张在房 《计量与测试技术》 2024年第1期44-48,共5页
肺结节的准确分割是后续良恶性分析和诊断的关键。由于基于卷积神经网络的分割模型受限于局部特征提取特性,忽略了全局特征。因此,本文提出了一种新的肺结节语义分割框架ST-UNet网络,将Swin Transformer嵌入UNet中,构成一种新颖的Swin T... 肺结节的准确分割是后续良恶性分析和诊断的关键。由于基于卷积神经网络的分割模型受限于局部特征提取特性,忽略了全局特征。因此,本文提出了一种新的肺结节语义分割框架ST-UNet网络,将Swin Transformer嵌入UNet中,构成一种新颖的Swin Transformer和CNN并行的双编码器结构。结果表明:该模型不仅对肺结节的分割具有较好的性能,而且对医生进行肺结节的早期诊断具有重要的临床意义和应用价值。 展开更多
关键词 肺结节分割 swin Transformer UNet
下载PDF
基于Swin Transformer和图形推理的结直肠息肉分割方法
15
作者 梁礼明 何安军 +1 位作者 阳渊 吴健 《工程科学学报》 EI CSCD 北大核心 2024年第5期897-907,共11页
针对结直肠息肉图像分割中病灶区域尺度变化大、边缘模糊以及息肉与正常组织对比度低等问题,导致病变区域分割精度低和分割边界存在伪影,提出一种基于Swin Transformer和图形推理的自适应网络.该网络一是利用Swin Transformer编码器逐... 针对结直肠息肉图像分割中病灶区域尺度变化大、边缘模糊以及息肉与正常组织对比度低等问题,导致病变区域分割精度低和分割边界存在伪影,提出一种基于Swin Transformer和图形推理的自适应网络.该网络一是利用Swin Transformer编码器逐层提取输入图像的全局上下文信息,弱化背景信息干扰,多尺度分析病变区域的显著性特点.二是提出全局与局部特征交互模块增强网络对复杂病灶的空间感知能力,突出待分割目标的关键位置信息,精准定位目标.三是通过区域引导图推理模块以图循环递推的方式挖掘先验信息之间的高阶显性关系,促进图间信息传递.四是设计面向边缘细节的边缘约束图推理模块,整合边缘细节,改善分割效果,提高分割精度.在CVC-ClinicDB、Kvasir、CVC-ColonDB和ETIS数据集上进行实验,其Dice系数分别为0.939,0.926,0.810和0.788,平均交并比分别为0.889,0.879,0.731和0.710,分割性能优于现有方法.仿真实验结果表明,对于形态结构复杂、对比度低和边缘模糊的结直肠息肉图像均有较高的分割精度. 展开更多
关键词 结直肠息肉 swin Transformer 全局与局部特征交互 区域引导图推理 边缘约束图推理
下载PDF
基于Swin Transformer生成对抗网络的图像生成算法
16
作者 王军 高放 +1 位作者 省海先 张宇 《小型微型计算机系统》 CSCD 北大核心 2024年第1期241-248,共8页
针对图像生成算法中生成对抗网络训练效率低且不稳定的问题,本文提出了一种改进生成对抗网络的图像生成算法(STGAN),该算法首先在判别器中引入Swin Transformer机制,来增强网络的判别能力;其次改进了生成器,使用自注意力代替卷积神经并... 针对图像生成算法中生成对抗网络训练效率低且不稳定的问题,本文提出了一种改进生成对抗网络的图像生成算法(STGAN),该算法首先在判别器中引入Swin Transformer机制,来增强网络的判别能力;其次改进了生成器,使用自注意力代替卷积神经并且加入谱范数规范化,来达到平衡生成器和判别器的效果;最后使用Wasserstein距离作为损失函数,以提高网络的训练稳定性.实验数据表明,在CelebA和LSUN两种不同数据集上STGAN比自注意力生成对抗网络所生成图像的FID值分别降低了2.5266和5.4476,IS值分别提高了0.0941和0.0343.从实验结果可以看出,STGAN模型生成的图片具有非常高的自然度和逼真度,有效地提升了生成图像的质量和真实性. 展开更多
关键词 生成对抗网络 swin Transformer 自注意力 图像生成
下载PDF
基于UNet+Swin-Transformer的西瓜叶片病害识别的研究
17
作者 向宇杰 向元平 《软件工程》 2024年第1期55-57,73,共4页
诊断与识别植物叶片的病虫害是农业生产中的一大难题。为了解决西瓜叶片病虫害的诊断与识别问题,方便瓜农评估西瓜叶片的健康状况,提出了一种先分割、后识别的西瓜叶片病害识别算法。该算法首先采用UNet模型对叶片进行分割,其次使用Swin... 诊断与识别植物叶片的病虫害是农业生产中的一大难题。为了解决西瓜叶片病虫害的诊断与识别问题,方便瓜农评估西瓜叶片的健康状况,提出了一种先分割、后识别的西瓜叶片病害识别算法。该算法首先采用UNet模型对叶片进行分割,其次使用Swin-Transformer模型进行病虫害识别。通过在自建的西瓜叶片数据集上进行对比实验,文章所提算法识别准确率达到92.9%,相比直接在原始图像上使用Swin-Transformer模型进行病虫害识别,准确率提高了3.2%。实验结果表明,使用分割后的图像进行病虫害分类可以显著提高识别准确率。 展开更多
关键词 UNet swin-Transformer 语义分割 病虫害识别
下载PDF
基于改进Swin-Unet的遥感图像分割方法
18
作者 张越 王逊 《无线电工程》 2024年第5期1217-1225,共9页
针对遥感图像数据本身存在分辨率高、背景复杂和光照不均等特性导致边界分割不连续、目标错分漏分以及存在孔洞等问题,提出了一种基于改进Swin-Unet的遥感图像分割方法。在编码器末端引入空洞空间金字塔池化(Atrous Spatial Pyramid Poo... 针对遥感图像数据本身存在分辨率高、背景复杂和光照不均等特性导致边界分割不连续、目标错分漏分以及存在孔洞等问题,提出了一种基于改进Swin-Unet的遥感图像分割方法。在编码器末端引入空洞空间金字塔池化(Atrous Spatial Pyramid Pooling,ASPP)模块,用于捕获多尺度特征,增强网络获取不同尺度的能力,充分提取上下文信息;将解码器端的Swin Transformer Block替换为残差Swin Transformer Block,不仅保留了原始信息,又能够缓解模型出现梯度弥散现象;在跳跃连接中引入残差注意力机制,可以让模型更加关注特征图中的重要特征信息,抑制无效信息,从而提高模型分割的准确率。在自建数据集上进行实验,结果表明,改进后的网络平均交并比(mean Intersection over Union,mIoU)达到了80.55%,提高了4.13个百分点,证明改进后的网络可以有效提高遥感图像分割的精度。 展开更多
关键词 遥感图像 语义分割 swin-Unet 空洞空间金字塔池化 残差注意力机制
下载PDF
基于Swin Transformer和注意力机制的红外无人机检测算法
19
作者 王思宇 卢瑞涛 +4 位作者 黄攀 杨小冈 夏文新 李清格 张震宇 《航空科学技术》 2024年第2期39-46,共8页
红外无人机目标检测在军民领域的应用前景广阔。由于无人机目标尺度较小,空中环境复杂多变,目前普遍存在检测率低和误报率高的现象。针对复杂场景下红外无人机目标检测不良等问题,本文提出ST-YOLOA目标检测模型。首先,使用Swin Transfor... 红外无人机目标检测在军民领域的应用前景广阔。由于无人机目标尺度较小,空中环境复杂多变,目前普遍存在检测率低和误报率高的现象。针对复杂场景下红外无人机目标检测不良等问题,本文提出ST-YOLOA目标检测模型。首先,使用Swin Transformer网络架构和协调注意力(CA)机制搭建STCNet骨干特征提取网络;其次,特征融合部分采用带残差结构的PANet路径聚合网络构建特征金字塔提升整体特征提取能力,同时改进了上下采样方式以增强检测能力;最后,使用解耦检测头预测无人机目标的位置。试验结果表明,本文提出的模型检测精度为92.8%,检测速度达到了22帧/s,这表明该模型与其他模型相比具有较好的检测效果,且基本满足实时性检测要求,对于多无人机目标场景下的检测具有现实意义。 展开更多
关键词 红外无人机 目标检测 swin Transformer 协调注意力机制 STCNet
下载PDF
SwinEA:融合边缘感知的医学图像分割网络
20
作者 叶晋豫 李娇 +2 位作者 邓红霞 张瑞欣 李海芳 《计算机工程与设计》 北大核心 2024年第4期1149-1156,共8页
基于卷积神经网络的方法在医学图像分割任务中取得了显著成果,但该方法固有的归纳偏置使其不能很好地学习全局和长距离的语义信息交互,而Transformer的优势是关注全局信息,两者可以优势互补。因此提出一种针对分割边缘利用Swin Transfor... 基于卷积神经网络的方法在医学图像分割任务中取得了显著成果,但该方法固有的归纳偏置使其不能很好地学习全局和长距离的语义信息交互,而Transformer的优势是关注全局信息,两者可以优势互补。因此提出一种针对分割边缘利用Swin Transformer融合边缘感知的医学图像分割网络。设计基于上下文金字塔的边缘感知模块,用于融合全局的多尺度的上下文信息,针对边缘和角落等局部特征,利用浅层深度主干的特征产生丰富的边缘特征,因此提出的边缘感知模块可以尽可能多地产生边缘特征。在腹部多器官分割任务和心脏分割数据集的实验结果表明,该方法在各项指标中都有所提高。 展开更多
关键词 医学图像分割 移动窗口变形器 多头自注意力 边缘感知模块 上下文金字塔 多尺度特征 深度学习网络
下载PDF
上一页 1 2 11 下一页 到第
使用帮助 返回顶部