期刊文献+
共找到1,726篇文章
< 1 2 87 >
每页显示 20 50 100
基于Transformer的陶瓷轴承表面缺陷检测方法 被引量:1
1
作者 安冬 胡荣华 +3 位作者 王丽艳 邵萌 李新然 刘则通 《组合机床与自动化加工技术》 北大核心 2024年第2期160-163,168,共5页
针对传统机器视觉检测方法中,由于陶瓷轴承滚动体表面曲率大、对比度低,表面成像模糊导致后续缺陷检测精度低的问题,提出一种基于Transformer的超分辨率残差网络。首先,网络使用残差学习策略,通过预测模糊图像与清晰图像之间的差值,实... 针对传统机器视觉检测方法中,由于陶瓷轴承滚动体表面曲率大、对比度低,表面成像模糊导致后续缺陷检测精度低的问题,提出一种基于Transformer的超分辨率残差网络。首先,网络使用残差学习策略,通过预测模糊图像与清晰图像之间的差值,实现超分辨率任务;其次,在网络上前端插入通道注意力模块和空间注意力模块并改进L2多头自注意力模块,以增强图像纹理、改善梯度爆炸问题;最后,针对超分辨率重建任务,提出一种两阶段训练策略优化训练过程。自建陶瓷轴承表面缺陷数据集上的大量实验结果表明,所提出网络模型在客观指标与主观评价上均优于MSESRGAN、VSDR等超分辨率算法,重建图像SSIM为0.939,PSNR为36.51 dB。 展开更多
关键词 Si_(3)N_(4)陶瓷轴承 超分辨率重建 transformER 图像恢复 图像增强
下载PDF
基于Contextual Transformer的自动驾驶单目3D目标检测
2
作者 厍向阳 颜唯佳 董立红 《计算机工程与应用》 CSCD 北大核心 2024年第19期178-189,共12页
针对当前单目3D目标检测中存在的漏检和多尺度目标检测效果不佳的问题,提出了一种基于Contextual Transformer的自动驾驶单目3D目标检测算法(CM-RTM3D)。在ResNet-50网络中引入Contextual Transformer(CoT),构建ResNet-Transformer架构... 针对当前单目3D目标检测中存在的漏检和多尺度目标检测效果不佳的问题,提出了一种基于Contextual Transformer的自动驾驶单目3D目标检测算法(CM-RTM3D)。在ResNet-50网络中引入Contextual Transformer(CoT),构建ResNet-Transformer架构以提取特征。设计多尺度空间感知模块(MSP),通过尺度空间响应操作改善浅层特征的丢失情况,嵌入沿水平和竖直两个空间方向的坐标注意力机制(CA),使用softmax函数生成各尺度的重要性软权重。在偏移损失中采用Huber损失函数代替L1损失函数。实验结果表明:在KITTI自动驾驶数据集上,相较于RTM3D算法,该算法在简单、中等、困难三个难度级别下,AP3D分别提升了4.84、3.82、5.36个百分点,APBEV分别提升了4.75、6.26、3.56个百分点。 展开更多
关键词 自动驾驶 单目3D目标检测 Contextual transformer 多尺度感知 坐标注意力机制
下载PDF
基于Vision Transformer的时空卷积网络设计
3
作者 谢英红 郝岩 +3 位作者 韩晓微 高强 阴彪 王朝辉 《计算机与网络》 2024年第4期283-288,共6页
目前主流人体动作识别大部分都是基于卷积神经网络(Convolutional Neural Network,CNN)实现,而CNN容易忽略视频中的空间位置信息,从而降低了视频空间频域中动作识别能力。同时传统CNN不能快速定位到关键的特征位置,并且在训练过程中不... 目前主流人体动作识别大部分都是基于卷积神经网络(Convolutional Neural Network,CNN)实现,而CNN容易忽略视频中的空间位置信息,从而降低了视频空间频域中动作识别能力。同时传统CNN不能快速定位到关键的特征位置,并且在训练过程中不能并行计算导致效率低。为了解决传统CNN在处理时间频域和多并行计算问题,提出了基于视觉Transformer(Vision Transformer,ViT)和3D卷积网络学习时空特征(Learning Spatiotemporal Features with 3D Convolutional Network,C3D)的人体动作识别算法。使用C3D提取视频的多维特征图、ViT的特征切片窗口对多维特征进行全局特征分割;使用Transformer的编码-解码模块对视频中人体动作进行预测。实验结果表明,所提的人体动作识别算法在UCF-101、HMDB51数据集上提高了动作识别的准确率。 展开更多
关键词 动作识别 视觉transformer 卷积神经网络 3D卷积网络学习时空特征 注意力机制
下载PDF
多级Transformer特征融合的三维点云目标跟踪
4
作者 李志杰 梁卜文 +1 位作者 丁昕苗 郭文 《计算机科学与探索》 CSCD 北大核心 2024年第11期3006-3014,共9页
三维点云目标跟踪的过程中时常会出现遮挡、稀疏性和随机噪声等问题。为了解决这些问题,提出了一种新颖的多级Transformer特征融合的三维点云目标跟踪方法。该方法主要由点注意嵌入模块和点注意力增强模块组成,且这两个模块分别用于特... 三维点云目标跟踪的过程中时常会出现遮挡、稀疏性和随机噪声等问题。为了解决这些问题,提出了一种新颖的多级Transformer特征融合的三维点云目标跟踪方法。该方法主要由点注意嵌入模块和点注意力增强模块组成,且这两个模块分别用于特征提取和特征匹配的过程中。通过将两个注意力机制相互嵌入构成点注意力嵌入模块,并将其和PTTR所提出的关系感知采样法融合,实现充分提取特征的目的。将提取到的特征信息输入点注意力增强模块中,通过交叉注意力机制对不同层次的特征依次匹配,达到全局特征和局部特征深度融合的目标。为了获取判别性特征融合图,利用残差网络的方式对不同层的融合结果进行连接。将特征融合图输入目标预测的模块中,实现对最终3D目标对象的精准预测。在KITTI数据集、nuScenes数据集和Waymo数据集上的实验验证了该方法的有效性。若不计小样本数据,在目标跟踪的成功值中该方法平均提高了1.4个百分点,在跟踪的精确值上也提高了1.4个百分点。 展开更多
关键词 3D点云 孪生网络 目标跟踪 transformER 特征融合
下载PDF
融合Transformer和DeepLabv3+的电力线语义分割网络
5
作者 秦伦明 王朝举 +2 位作者 边后琴 崔昊杨 王悉 《现代电子技术》 北大核心 2024年第17期109-116,共8页
为解决目前语义分割算法在电力线分割领域存在预测速度缓慢和分割精度不高的双重问题,提出一种电力线分割网络STDC-DeepLabv3+。首先,为提升网络预测速度,在编码器部分采用Swin Transformer V2设计轻量化的主干特征提取网络;其次,为提... 为解决目前语义分割算法在电力线分割领域存在预测速度缓慢和分割精度不高的双重问题,提出一种电力线分割网络STDC-DeepLabv3+。首先,为提升网络预测速度,在编码器部分采用Swin Transformer V2设计轻量化的主干特征提取网络;其次,为提高分割精度,针对电力线的细长结构以及贯穿整幅图片的特点,提出动态蛇形空间金字塔池化(DSASPP)模块,同时,在解码器部分设计多尺度特征融合模块,使网络更好地利用不同层次的语义信息提取电力线特征,减少网络对电力线的漏分割现象;最后,引入坐标注意力(CA)机制减少背景干扰,进一步提升分割的准确率。实验结果表明,改进后的算法平均交并比(MIoU)和平均像素精度(MPA)分别达到了84.18%和92.85%,与现有分割算法相比,分割精度和预测速度均有所提升,预测速度与DeepLabv3+相比提升了93.92%。 展开更多
关键词 电力线分割 transformER DeepLabv3+ 多尺度特征融合 编码器 解码器 坐标注意力机制
下载PDF
Efficient single-pixel imaging encrypted transmission based on 3D Arnold transformation
6
作者 梁振宇 王朝瑾 +4 位作者 王阳阳 高皓琪 朱东涛 许颢砾 杨星 《Chinese Physics B》 SCIE EI CAS CSCD 2024年第3期378-386,共9页
Single-pixel imaging(SPI)can transform 2D or 3D image data into 1D light signals,which offers promising prospects for image compression and transmission.However,during data communication these light signals in public ... Single-pixel imaging(SPI)can transform 2D or 3D image data into 1D light signals,which offers promising prospects for image compression and transmission.However,during data communication these light signals in public channels will easily draw the attention of eavesdroppers.Here,we introduce an efficient encryption method for SPI data transmission that uses the 3D Arnold transformation to directly disrupt 1D single-pixel light signals and utilizes the elliptic curve encryption algorithm for key transmission.This encryption scheme immediately employs Hadamard patterns to illuminate the scene and then utilizes the 3D Arnold transformation to permutate the 1D light signal of single-pixel detection.Then the transformation parameters serve as the secret key,while the security of key exchange is guaranteed by an elliptic curve-based key exchange mechanism.Compared with existing encryption schemes,both computer simulations and optical experiments have been conducted to demonstrate that the proposed technique not only enhances the security of encryption but also eliminates the need for complicated pattern scrambling rules.Additionally,this approach solves the problem of secure key transmission,thus ensuring the security of information and the quality of the decrypted images. 展开更多
关键词 single-pixel imaging 3D Arnold transformation elliptic curve encryption image encryption
原文传递
Depth-Guided Vision Transformer With Normalizing Flows for Monocular 3D Object Detection
7
作者 Cong Pan Junran Peng Zhaoxiang Zhang 《IEEE/CAA Journal of Automatica Sinica》 SCIE EI CSCD 2024年第3期673-689,共17页
Monocular 3D object detection is challenging due to the lack of accurate depth information.Some methods estimate the pixel-wise depth maps from off-the-shelf depth estimators and then use them as an additional input t... Monocular 3D object detection is challenging due to the lack of accurate depth information.Some methods estimate the pixel-wise depth maps from off-the-shelf depth estimators and then use them as an additional input to augment the RGB images.Depth-based methods attempt to convert estimated depth maps to pseudo-LiDAR and then use LiDAR-based object detectors or focus on the perspective of image and depth fusion learning.However,they demonstrate limited performance and efficiency as a result of depth inaccuracy and complex fusion mode with convolutions.Different from these approaches,our proposed depth-guided vision transformer with a normalizing flows(NF-DVT)network uses normalizing flows to build priors in depth maps to achieve more accurate depth information.Then we develop a novel Swin-Transformer-based backbone with a fusion module to process RGB image patches and depth map patches with two separate branches and fuse them using cross-attention to exchange information with each other.Furthermore,with the help of pixel-wise relative depth values in depth maps,we develop new relative position embeddings in the cross-attention mechanism to capture more accurate sequence ordering of input tokens.Our method is the first Swin-Transformer-based backbone architecture for monocular 3D object detection.The experimental results on the KITTI and the challenging Waymo Open datasets show the effectiveness of our proposed method and superior performance over previous counterparts. 展开更多
关键词 Monocular 3D object detection normalizing flows Swin transformer
下载PDF
Transformer与CNN并行引导的水下图像增强
8
作者 常戬 陈洪福 王冰冰 《计算机工程与应用》 CSCD 北大核心 2024年第4期280-288,共9页
为克服水下图像对比度低和色偏的问题,提出了基于Transformer与CNN并行引导的水下图像增强算法。利用3D位置嵌入模型为Transformer提供相对位置信息、色偏信息和特征图的全局特征,利用CNN编码器提取图像局部特征,将Transformer提取的全... 为克服水下图像对比度低和色偏的问题,提出了基于Transformer与CNN并行引导的水下图像增强算法。利用3D位置嵌入模型为Transformer提供相对位置信息、色偏信息和特征图的全局特征,利用CNN编码器提取图像局部特征,将Transformer提取的全局特征和CNN提取的局部特征通过特征调制矩阵整合在一起,通过CNN解码器提高图像的分辨率,将解码器输出的特征图输入到特征加强网络中,由特征加强网络输出最终结果。采用现有的EUVP配对数据集进行训练,为验证该算法的优越性,选取具有不同程度色偏的水下图像进行定性比较和定量实验,结果显示,该算法增强后的水下图像峰值信噪比指标(peak signal-to-noise ratio,PSNR)和结构相似性指标(structural similarity index measure,SSIM)均高于其他对比算法,主观质量也得到显著提高,能够产生颜色丰富且清晰度较高的增强图像。 展开更多
关键词 水下图像增强 transformER 卷积神经网络(CNN) 3D位置嵌入模型 特征调制矩阵
下载PDF
形状补全引导的Transformer点云目标检测方法
9
作者 周静 胡怡宇 黄心汉 《智能系统学报》 CSCD 北大核心 2023年第4期731-742,共12页
针对雷达传感器采集到的场景点云中存在大量远距离或位于遮挡视角的形状缺失的低质量目标,其几何信息不足难以被识别,影响检测精度的问题,本文提出一种基于形状补全引导的Transformer点云目标检测方法(shape completion-guided transfor... 针对雷达传感器采集到的场景点云中存在大量远距离或位于遮挡视角的形状缺失的低质量目标,其几何信息不足难以被识别,影响检测精度的问题,本文提出一种基于形状补全引导的Transformer点云目标检测方法(shape completion-guided transformer point cloud object detection method,STDet),通过增强低质量目标形状特征来有效提升目标检测精度,利用Pointformer主干网络提取场景点云特征以生成初始候选框,基于特征分离预测的形状补全模块重构候选框中残缺目标的完整形状点云;构建Transformer几何特征增强模型,融合目标完整形状信息及空间位置信息至各目标点特征中,并感知各目标点不同邻域掩码范围内的局部结构信息与全局几何特征的注意力相关性,以获取关键几何信息增强的目标全局几何特征;基于该特征引导生成精细化的目标检测框。在KITTI数据集上的实验结果表明,该方法在存在大量形状残缺低质量目标的困难场景中检测精度较基准算法提升了4.96%,大量消融实验证明了该方法所构建的形状补全算法和Transformer几何特征增强模型的有效性。 展开更多
关键词 3D目标检测 低质量目标 特征分离 形状补全 transformER 多尺度 邻域掩码 特征增强
下载PDF
基于Transformer的融合信息增强3D目标检测算法 被引量:2
10
作者 金宇锋 陶重犇 《仪器仪表学报》 EI CAS CSCD 北大核心 2023年第12期297-306,共10页
针对当前3D目标检测算法将不同模态数据融合时会产生错位现象,从而破坏数据之间的关联性并造成数据损失的问题,提出了一种基于Transformer的融合信息增强3D目标检测算法。首先设计了Transformer双域融合特征区域建议模块,利用变形注意... 针对当前3D目标检测算法将不同模态数据融合时会产生错位现象,从而破坏数据之间的关联性并造成数据损失的问题,提出了一种基于Transformer的融合信息增强3D目标检测算法。首先设计了Transformer双域融合特征区域建议模块,利用变形注意力机制,将提取到的雷达点云特征和图像特征进行双域特征融合,用于生成3D预选框;其次,通过设计的深度补全机制的特征信息增强模块,补全密集的深度和特征语义信息来完成框的细化;最后,设计了多模态特征交叉注意力模块,采用动态交叉注意力机制来获得不同模态间的相关性,从而将特征信息有效对齐融合。在Kitti、Nuscences和Waymo数据集上的实验结果证明了该算法的有效性和通用性。大量的消融实验证明了该算法各个模块的有效性。在实车平台上的实验结果表明,该算法在复杂的实际环境中具有优秀的鲁棒性。 展开更多
关键词 3D目标检测 transformER 深度补全 多模态融合 自动驾驶
原文传递
一种改进Swin Transformer网络的资源三号水体提取方法 被引量:3
11
作者 刘彦德 王竞雪 《遥感信息》 CSCD 北大核心 2023年第2期96-103,共8页
针对传统的水体指数法和监督分类法在对卫星影像进行水体提取时经常出现错分的问题,提出一种改进Swin Transformer网络的资源三号影像水体提取方法,并对其特征金字塔的构建进行优化。其中,结合PANet算法原理快速融合特征金字塔顶层信息... 针对传统的水体指数法和监督分类法在对卫星影像进行水体提取时经常出现错分的问题,提出一种改进Swin Transformer网络的资源三号影像水体提取方法,并对其特征金字塔的构建进行优化。其中,结合PANet算法原理快速融合特征金字塔顶层信息和底层信息,通过融合不同尺度的信息提高对水体特征提取的效果;利用Swin Transformer网络包含的滑动窗口分割和循环位移操作来减少训练时的计算复杂度。通过混淆矩阵计算得到该方法对城区、郊区和山区水体提取结果的总体精度、Kappa系数、F1-score指数,分别在90.14%~96.52%之间、0.80~0.88之间、0.81~0.87之间,证明该方法对资源三号卫星影像进行水体提取的有效性与可靠性。 展开更多
关键词 Swin transformer PANet 资源三号卫星 水体提取 Kappa系数
下载PDF
Diffusionless-Like Transformation Unlocks Pseudocapacitance with Bulk Utilization: Reinventing Fe_(2)O_(3) in Alkaline Electrolyte 被引量:2
12
作者 Taowen Dong Wencai Yi +10 位作者 Ting Deng Tingting Qin Xianyu Chu He Yang Lirong Zheng Seung Jo Yoo Jin-Gyu Kim Zizhun Wang Yan Wang Wei Zhang Weitao Zheng 《Energy & Environmental Materials》 SCIE EI CAS CSCD 2023年第1期145-154,共10页
Energy density can be substantially raised and even maximized if the bulk of an electrode material is fully utilized.Transition metal oxides based on conversion reaction mechanism are the imperative choice due to eith... Energy density can be substantially raised and even maximized if the bulk of an electrode material is fully utilized.Transition metal oxides based on conversion reaction mechanism are the imperative choice due to either constructing nanostructure or intercalation pseudocapacitance with their intrinsic limitations.However,the fully bulk utilization of transition metal oxides is hindered by the poor understanding of atomic-level conversion reaction mechanism,particularly it is largely missing at clarifying how the phase transformation(conversion reaction)determines the electrochemical performance such as power density and cyclic stability.Herein,α-Fe_(2)O_(3) is a case provided to claim how the diffusional and diffusionless transformation determine the electrochemical behaviors,as of its conversion reaction mechanism with fully bulk utilization in alkaline electrolyte.Specifically,the discharge productα-FeOOH diffusional from Fe(OH)2 is structurally identified as the atomic-level arch criminal for its cyclic stability deterioration,whereas the counterpartδ-FeOOH is theoretically diffusionless-like,unlocking the full potential of the pseudocapacitance with fully bulk utilization.Thus,such pseudocapacitance,in proof-of-concept and termed as conversion pseudocapacitance,is achieved via diffusionless-like transformation.This work not only provides an atomic-level perspective to reassess the potential electrochemical performance of the transition metal oxides electrode materials based on conversion reaction mechanism but also debuts a new paradigm for pseudocapacitance. 展开更多
关键词 bulk utilization conversion pseudocapacitance diffusionless transformation Fe_(2)O_(3) phase transformation
下载PDF
融合MobileNetv3与Transformer的钢板缺陷实时检测算法 被引量:1
13
作者 张林 谢刚 +1 位作者 谢新林 张涛源 《计算机集成制造系统》 EI CSCD 北大核心 2023年第12期3951-3963,共13页
钢板表面的缺陷检测是分析和判断钢板质量的基础和关键。针对钢板表面龟裂等小缺陷检测效率低、精度差的问题,提出一种融合Transformer的钢板表面缺陷实时检测算法。首先,融合协调注意力(CA)模块以及最大动态转移(DY)激活函数构建CA-Bn... 钢板表面的缺陷检测是分析和判断钢板质量的基础和关键。针对钢板表面龟裂等小缺陷检测效率低、精度差的问题,提出一种融合Transformer的钢板表面缺陷实时检测算法。首先,融合协调注意力(CA)模块以及最大动态转移(DY)激活函数构建CA-Bneck模块,提高缺陷特征的表示能力;其次,将MobileNetV3、CA-Bneck以及Transformer编码模块相融合,构建一种新的主干特征提取网络MobileNetV3-CATr,用于减轻模型的复杂度;最后,提出一种BiFPN-Lite模块,使得模型复杂度不增加的条件下融合更多缺陷特征;并通过YOLO Head输出缺陷的信息。在热轧钢公开数据集NEU-DET上实验结果表明,所提算法在性能和速度之间取得了平衡,mAP值相较于YOLOv4提升了5.96%,速度达到了20.1FPS,能够有效地完成钢板表面缺陷的实时和高精度检测。 展开更多
关键词 机器视觉 缺陷检测 MobileNetv3网络 transformer模块
下载PDF
Structural plane recognition from three-dimensional laser scanning points using an improved region-growing algorithm based on the robust randomized Hough transform 被引量:1
14
作者 XU Zhi-hua GUO Ge +3 位作者 SUN Qian-cheng WANG Quan ZHANG Guo-dong YE Run-qing 《Journal of Mountain Science》 SCIE CSCD 2023年第11期3376-3391,共16页
The staggered distribution of joints and fissures in space constitutes the weak part of any rock mass.The identification of rock mass structural planes and the extraction of characteristic parameters are the basis of ... The staggered distribution of joints and fissures in space constitutes the weak part of any rock mass.The identification of rock mass structural planes and the extraction of characteristic parameters are the basis of rock-mass integrity evaluation,which is very important for analysis of slope stability.The laser scanning technique can be used to acquire the coordinate information pertaining to each point of the structural plane,but large amount of point cloud data,uneven density distribution,and noise point interference make the identification efficiency and accuracy of different types of structural planes limited by point cloud data analysis technology.A new point cloud identification and segmentation algorithm for rock mass structural surfaces is proposed.Based on the distribution states of the original point cloud in different neighborhoods in space,the point clouds are characterized by multi-dimensional eigenvalues and calculated by the robust randomized Hough transform(RRHT).The normal vector difference and the final eigenvalue are proposed for characteristic distinction,and the identification of rock mass structural surfaces is completed through regional growth,which strengthens the difference expression of point clouds.In addition,nearest Voxel downsampling is also introduced in the RRHT calculation,which further reduces the number of sources of neighborhood noises,thereby improving the accuracy and stability of the calculation.The advantages of the method have been verified by laboratory models.The results showed that the proposed method can better achieve the segmentation and statistics of structural planes with interfaces and sharp boundaries.The method works well in the identification of joints,fissures,and other structural planes on Mangshezhai slope in the Three Gorges Reservoir area,China.It can provide a stable and effective technique for the identification and segmentation of rock mass structural planes,which is beneficial in engineering practice. 展开更多
关键词 3D laser scanning Rock discontinuity structural plane Intelligent recognition Robust randomized Hough transform Improved region growing algorithm
原文传递
融合CNN与时序Transformer的动态手势识别
15
作者 王丰平 张云 《陕西理工大学学报(自然科学版)》 2023年第4期35-43,共9页
针对传统手势识别方法没有综合考虑手势的全局空间、局部空间、时序等特征信息,提取的特征通常很难全面表征手势之间的区别,提出了一种卷积神经网络(CNN)和Transformer网络相结合的网络结构。首先对输入视频序列的每一帧使用轻量化Mobil... 针对传统手势识别方法没有综合考虑手势的全局空间、局部空间、时序等特征信息,提取的特征通常很难全面表征手势之间的区别,提出了一种卷积神经网络(CNN)和Transformer网络相结合的网络结构。首先对输入视频序列的每一帧使用轻量化MobileNet V3卷积神经网络来提取空间特征信息,再将输出经过pathch embedding后加上时序嵌入序列,输入到Transformer模型中利用注意力机制来提取手势的全局注意力特征和时序特征。并在两个公开数据集DHG-14/28和VIVA上进行了实验,与经典方法相比,平均识别精度分别提升了2.38%、1.87%和3.74%。实验结果表明,提出的方法能够准确地提取动态手势序列的特征并表征手势类别。 展开更多
关键词 手势识别 MobileNet V3 transformER 时序特征
下载PDF
基于3D UNet结合Transformer的肝脏及肝肿瘤自动分割 被引量:1
16
作者 戴振晖 简婉薇 +5 位作者 朱琳 张白霖 靳怀志 杨耕 谭翔 王学涛 《中国医疗设备》 2023年第1期42-47,共6页
目的肝脏和肝肿瘤分割是肝癌放疗计划设计的重要步骤,本文提出新型自动分割模型,以实现肝脏和肝肿瘤的精确分割。方法在3D UNet深度神经网络中加入了残差模块和Swim Transformer模块,提出一个新型的卷积和Transformer结合的Res-Swim-UNe... 目的肝脏和肝肿瘤分割是肝癌放疗计划设计的重要步骤,本文提出新型自动分割模型,以实现肝脏和肝肿瘤的精确分割。方法在3D UNet深度神经网络中加入了残差模块和Swim Transformer模块,提出一个新型的卷积和Transformer结合的Res-Swim-UNet模型。在LiTS公共数据集上对比了所提出方法与先前方法的性能,并在本地数据集上验证了Res-Swim-UNet模型的泛化能力。结果Res-Swim-UNet模型在LiTS公共数据集上肝脏分割结果的Dice相似性系数(Dice Similarity Coefficient,DSC)、体积重叠误差(Volumetric Overlap Error,VOE)分别是0.957、0.522,相对于UNet模型DSC提高了1.6%,VOE降低了1.3%;肝肿瘤分割结果的DSC、VOE分别是0.672、0.617,相对于UNet模型DSC提高了13.5%,VOE降低了5.9%。在本地数据集上肝脏分割结果的DSC、VOE分别是0.895、0.552,肝肿瘤分割结果的DSC、VOE分别是0.589、0.706。结论本文提出的Res-Swim-UNet模型可以有效提高CT图像中肝脏和肝肿瘤的分割效果,且该模型在迁移到本地数据时仍具有较高的分割精度。该模型可以用于提高医生勾画靶区的效率。 展开更多
关键词 肝脏 肝肿瘤 自动分割 3D UNet深度神经网络 Swim transformer模块
下载PDF
基于稀疏Transformer的长短时序关联动作识别算法
17
作者 廖健文 杨盈昀 卢玥 《中国传媒大学学报(自然科学版)》 2023年第6期56-63,共8页
针对主流的视频动作识别算法对时序信息的挖掘不充分,而Transformer能够更好地处理长序列和全局依赖性问题,本文将3DCNN和Transformer结合起来,提出了基于稀疏Transformer的长短时序关联动作识别算法,从而实现对视频的全局时序信息进行... 针对主流的视频动作识别算法对时序信息的挖掘不充分,而Transformer能够更好地处理长序列和全局依赖性问题,本文将3DCNN和Transformer结合起来,提出了基于稀疏Transformer的长短时序关联动作识别算法,从而实现对视频的全局时序信息进行建模。该算法提取预训练视频模型各个片段特征,嵌入视频特征聚类模块降低输入特征的潜在噪声,并利用基于稀疏自注意力的Transformer长短时序关联模块,引入稀疏掩码矩阵,对相似度矩阵进行掩码操作,抑制较小的注意力权重,选择性地保留重要的长短时序信息,提高模型对全局上下文信息的注意力集中程度。本文在UCF101和HMDB51数据集上进行了大量的实验,验证了本文算法的有效性,在参数量和计算复杂度较小的情况下准确率高于同类权威算法。 展开更多
关键词 深度学习 动作识别 稀疏transformer R3D-18
下载PDF
Organic matter transformation ratio, hydrocarbon expulsion efficiency and shale oil enrichment type in Chang 7_(3) shale of Upper Triassic Yanchang Formation in Ordos Basin, NW China 被引量:1
18
作者 ZHAO Wenzhi BIAN Congsheng +4 位作者 LI Yongxin LIU Wei DONG Jin WANG Kun ZENG Xu 《Petroleum Exploration and Development》 2023年第1期14-26,共13页
The major enrichment type of shale oil in the Chang 7_(3) shale of Upper Triassic Yanchang Formation in the Ordos Basin is unknown.This paper analyzes the organic matter transformation ratio,hydrocarbon expulsion effi... The major enrichment type of shale oil in the Chang 7_(3) shale of Upper Triassic Yanchang Formation in the Ordos Basin is unknown.This paper analyzes the organic matter transformation ratio,hydrocarbon expulsion efficiency and roof/floor sealing conditions of the Chang 7_(3) shale,and evaluates the major enrichment type of shale oil in this interval.The average organic matter transformation ratio of the Chang 7_(3) shale is about 45%;in other words,more than 50%of the organic matters have not transformed to hydrocarbons,and the lower the maturity,the greater the proportion of untransformed organic matters.The cumulative hydrocarbon expulsion efficiency of the transformed hydrocarbon is 27.5% on average,and the total proportion of untransformed organic matters plus retained hydrocarbons is greater than 70%.The relative hydrocarbon expulsion efficiency of the Chang 7_(3) shale is 60%on average,that is,about 40% of hydrocarbons retain in the shale.The Chang 7_(3) shale corresponds to Chang 7_(1+2) and Chang 8 sandstones as the roof and floor,respectively,and is further overlaid by Chang 6 shale,where extensive low porosity and low permeability–tight oil reservoirs have formed in the parts with relatively good porosity and permeability.Moreover,the Chang 7_(3) shale is tested to be in a negative pressure system(the pressure coefficient of 0.80–0.85).Therefore,the roof/floor sealing conditions of the Chang 7_(3) shale are poor.The retained hydrocarbons appear mostly in absorbed status,with low mobility.It is concluded that the medium–high mature shale oil is not the major enrichment type of shale oil in the Chang 7_(3) shale,but there may be enrichment opportunity for shale oil with good mobility in the areas where the sealing conditions are good without faults and fractures and oil reservoirs are formed off Chang 7_(1+2),Chang 6 and Chang 8.Furthermore,low–medium mature shale oil is believed to have great potential and is the major enrichment type of shale oil in the Chang 7_(3) shale.It is recommended to prepare relevant in-situ conversion technologies by pilot test and figure out the resource availability and distribution. 展开更多
关键词 organic matter transformation ratio hydrocarbon expulsion efficiency sealing condition continental shale oil major enrichment type Chang 7_(3)shale Triassic Ordos Basin
下载PDF
A New Image Watermarking Scheme Using Genetic Algorithm and Residual Numbers with Discrete Wavelet Transform
19
作者 Peter Awonnatemi Agbedemnab Mohammed Akolgo Moses Apambila Agebure 《Journal of Information Security》 2023年第4期422-436,共15页
Transmission of data over the internet has become a critical issue as a result of the advancement in technology, since it is possible for pirates to steal the intellectual property of content owners. This paper presen... Transmission of data over the internet has become a critical issue as a result of the advancement in technology, since it is possible for pirates to steal the intellectual property of content owners. This paper presents a new digital watermarking scheme that combines some operators of the Genetic Algorithm (GA) and the Residue Number (RN) System (RNS) to perform encryption on an image, which is embedded into a cover image for the purposes of watermarking. Thus, an image watermarking scheme uses an encrypted image. The secret image is embedded in decomposed frames of the cover image achieved by applying a three-level Discrete Wavelet Transform (DWT). This is to ensure that the secret information is not exposed even when there is a successful attack on the cover information. Content creators can prove ownership of the multimedia content by unveiling the secret information in a court of law. The proposed scheme was tested with sample data using MATLAB2022 and the results of the simulation show a great deal of imperceptibility and robustness as compared to similar existing schemes. 展开更多
关键词 Discrete Wavelet transform (DWT) Digital Watermarking Encryption Genetic Algorithm (GA) Residue Number System (RNS) GARN
下载PDF
基于图像小波域自适应干扰的GAN生成人脸反取证
20
作者 陈北京 李玉茹 舒华忠 《东南大学学报(自然科学版)》 EI CAS CSCD 北大核心 2024年第5期1330-1338,共9页
针对现有生成对抗网络(GAN)生成人脸反取证方法攻击迁移性不强的问题,提出了一个基于图像小波域自适应干扰的GAN生成人脸反取证方法以提升攻击迁移性.该方法通过对GAN生成人脸图像的小波域信息(即图像经过小波分解后的频率分量)施加扰... 针对现有生成对抗网络(GAN)生成人脸反取证方法攻击迁移性不强的问题,提出了一个基于图像小波域自适应干扰的GAN生成人脸反取证方法以提升攻击迁移性.该方法通过对GAN生成人脸图像的小波域信息(即图像经过小波分解后的频率分量)施加扰动以实现其对取证模型的抵抗,并且分别在空域和频域上基于最小可觉察误差(JND)设计自适应扰动阈值,对图像不同像素点位置设置不同的扰动强度,从而增强扰动的人眼不可感知性.此外,还设计了一种数据增强方式对反取证人脸进行数据分布多样性扩充,以进一步提升攻击迁移性.实验结果表明,与6种基线方法相比,所提方法生成的反取证人脸在保证扰动对人眼不可感知前提下具有更强的攻击迁移性. 展开更多
关键词 对抗扰动 GAN生成人脸 反取证 离散小波变换(DWT) 最小可觉察误差
下载PDF
上一页 1 2 87 下一页 到第
使用帮助 返回顶部