期刊文献+
共找到13,170篇文章
< 1 2 250 >
每页显示 20 50 100
基于双阶段元学习的小样本中医舌色域自适应分类方法
1
作者 卓力 张雷 +2 位作者 贾童瑶 李晓光 张辉 《电子与信息学报》 EI CAS CSCD 北大核心 2024年第3期986-994,共9页
舌色是中医(TCM)望诊最关注的诊察特征之一。在实际应用中,通过一台设备采集到的舌象数据训练得到的舌色分类模型应用于另一台设备时,由于舌象数据分布特性不一致,分类性能往往急剧下降。为此,该文提出一种基于双阶段元学习的小样本中... 舌色是中医(TCM)望诊最关注的诊察特征之一。在实际应用中,通过一台设备采集到的舌象数据训练得到的舌色分类模型应用于另一台设备时,由于舌象数据分布特性不一致,分类性能往往急剧下降。为此,该文提出一种基于双阶段元学习的小样本中医舌色域自适应分类方法。首先,设计了一种双阶段元学习训练策略,从源域有标注样本中提取域不变特征,并利用目标域的少量有标注数据对网络模型进行微调,使得模型可以快速适应目标域的新样本特性,提高舌色分类模型的泛化能力并克服过拟合。接下来,提出了一种渐进高质量伪标签生成方法,利用训练好的模型对目标域的未标注样本进行预测,从中挑选出置信度高的预测结果作为伪标签,逐步生成高质量的伪标签。最后,利用这些高质量的伪标签,结合目标域的有标注数据对模型进行训练,得到舌色分类模型。考虑到伪标签中含有噪声问题,采用了对比正则化函数,可以有效抑制噪声样本在训练过程中产生的负面影响,提升目标域舌色分类准确率。在两个自建中医舌色分类数据集上的实验结果表明,在目标域仅提供20张有标注样本的情况下,舌色分类准确率达到了91.3%,与目标域有监督的分类性能仅差2.05%。 展开更多
关键词 中医舌色分类 小样本 域自适应 双阶段元学习
下载PDF
Dual-Path Vision Transformer用于急性缺血性脑卒中辅助诊断
2
作者 张桃红 郭学强 +4 位作者 郑瀚 罗继昌 王韬 焦力群 唐安莹 《电子科技大学学报》 EI CAS CSCD 北大核心 2024年第2期307-314,共8页
急性缺血性脑卒中是由于脑组织血液供应障碍导致的脑功能障碍,数字减影脑血管造影(DSA)是诊断脑血管疾病的金标准。基于患者的正面和侧面DSA图像,对急性缺血性脑卒中的治疗效果进行分级评估,构建基于Vision Transformer的双路径图像分... 急性缺血性脑卒中是由于脑组织血液供应障碍导致的脑功能障碍,数字减影脑血管造影(DSA)是诊断脑血管疾病的金标准。基于患者的正面和侧面DSA图像,对急性缺血性脑卒中的治疗效果进行分级评估,构建基于Vision Transformer的双路径图像分类智能模型DPVF。为了提高辅助诊断速度,基于EdgeViT的轻量化设计思想进行了模型的构建;为了使模型保持轻量化的同时具有较高的精度,提出空间-通道自注意力模块,促进Transformer模型捕获更全面的特征信息,提高模型的表达能力;此外,对于DPVF的两分支的特征融合,构建交叉注意力模块对两分支输出进行交叉融合,促使模型提取更丰富的特征,从而提高模型表现。实验结果显示DPVF在测试集上的准确率达98.5%,满足实际需求。 展开更多
关键词 急性缺血性脑卒中 视觉Transformer 双分支网络 特征融合
下载PDF
一种基于多尺度的目标检测锚点构造方法
3
作者 邵延华 黄琦梦 +3 位作者 梅艳莹 张晓强 楚红雨 吴亚东 《红外技术》 CSCD 北大核心 2024年第2期162-167,共6页
目标检测是计算机视觉领域的研究热点和基础任务,其中基于锚点(Anchor)的目标检测已在众多领域得到广泛应用。当前锚点选取方法主要面临两个问题:基于特定数据集的先验取值尺寸固定、面对不同场景泛化能力弱。计算锚框的无监督K-means算... 目标检测是计算机视觉领域的研究热点和基础任务,其中基于锚点(Anchor)的目标检测已在众多领域得到广泛应用。当前锚点选取方法主要面临两个问题:基于特定数据集的先验取值尺寸固定、面对不同场景泛化能力弱。计算锚框的无监督K-means算法,受初始值影响较大,对目标尺寸较单一的数据集聚类产生的锚点差异较小,无法充分体现网络多尺度输出的特点。针对上述问题,本文提出一种基于多尺度的目标检测锚点构造方法(multi-scale-anchor,MSA),将聚类产生的锚点根据数据集本身的特性进行尺度的缩放和拉伸,优化的锚点即保留原数据集的特点也体现了模型多尺度的优势。另外,本方法应用在训练的预处理阶段,不增加模型推理时间。最后,选取单阶段主流算法YOLO(You Only Look Once),在多个不同场景的红外或工业场景数据集上进行丰富的实验。结果表明,多尺度锚点优化方法MSA能显著提高小样本场景的检测精度。 展开更多
关键词 目标检测 锚点 红外 YOLO(You Only Look Once) 多尺度分析
下载PDF
基于内外混合图像先验与图像融合的DIP改进降噪模型
4
作者 徐少平 陈晓军 +2 位作者 罗洁 程晓慧 肖楠 《电子与信息学报》 EI CAS CSCD 北大核心 2024年第1期299-307,共9页
为提高无监督深度图像先验(DIP)降噪模型的降噪性能,该文提出了一种基于内外混合图像先验与图像融合的DIP改进降噪模型(IDIP),该模型由样本生成和样本融合两个相继执行的模块组成。在样本生成阶段,首先利用2个分别来自内部和外部先验且... 为提高无监督深度图像先验(DIP)降噪模型的降噪性能,该文提出了一种基于内外混合图像先验与图像融合的DIP改进降噪模型(IDIP),该模型由样本生成和样本融合两个相继执行的模块组成。在样本生成阶段,首先利用2个分别来自内部和外部先验且有代表性的降噪算法(模型)处理噪声图像以产生2张初始降噪图像。基于这2张初始降噪图像,使用空间随机混合器按照各自50%混合比例随机生成足够多的混合图像作为DIP降噪模型的第2目标图像并与第1目标图像(即噪声图像)构成双目标图像。然后,每次使用不同的随机输入和双目标图像,多次执行标准DIP降噪流程生成多张具有互补性的样本图像;在样本融合阶段,首先为了获得更好的随机性和稳定性,随机丢弃50%的样本图像。然后,采用无监督融合网络在样本图像上完成自适应融合,获得的融合图像的图像质量相对参与融合的样本图像得到再次提升,作为最终降噪图像。在人工合成噪声图像上实验表明:IDIP降噪模型较原DIP降噪模型在峰值信噪比评价指标上有约2 dB的提升,且较大幅度超过了其他无监督降噪模型,逼近了有监督降噪模型。而在实际真实噪声图像上,其降噪性能较各对比方法更具鲁棒性。 展开更多
关键词 图像降噪 深度图像先验 性能提升 内外图像先验 无监督融合
下载PDF
结合特征融合与增强注意力的少样本目标检测
5
作者 李新叶 侯晔凝 +1 位作者 孔英会 燕志旗 《计算机应用》 CSCD 北大核心 2024年第3期745-751,共7页
为了更充分地利用支持特征和查询特征中的关键信息,提出一种基于特征融合和增强注意力的少样本目标检测方法FFA-FSOD(Feature Fusion and enhanced Attention Few-Shot Object Detection)。首先引入迭代注意力特征融合(iAFF)模块,以有... 为了更充分地利用支持特征和查询特征中的关键信息,提出一种基于特征融合和增强注意力的少样本目标检测方法FFA-FSOD(Feature Fusion and enhanced Attention Few-Shot Object Detection)。首先引入迭代注意力特征融合(iAFF)模块,以有效融合支持图像和查询图像的关键特征;其次在iAFF模块后添加特征增强操作,充分利用支持特征信息对查询图像中的目标特征进行增强。为避免上述两次处理可能导致的查询图像特征部分细节信息的丢失,对iAFF模块中的多尺度通道注意力模块(MS-CAM)进行改进,以捕获更多的上下文信息。在MS COCO数据集上的实验结果表明,在2-way 10-shot条件下,与小样本目标检测(FSOD)方法相比,加入iAFF模块、特征增强操作并改进MS-CAM后,FFA-FSOD的平均精度均值(mAP)提升了8.0%。实验结果验证了所提特征融合增强方法充分关注到了特征中的细节信息,从而实现了更好的少样本目标检测效果。 展开更多
关键词 目标检测 少样本 特征融合 特征增强 Faster R-CNN
下载PDF
改进U_Net网络的钢结构表面锈蚀图像分割方法
6
作者 陈法法 董海飞 +1 位作者 何向阳 陈保家 《电子测量与仪器学报》 CSCD 北大核心 2024年第2期49-57,共9页
为实现锈蚀图像分割网络模型轻量化,同时消除非单一特征背景和锈液等类似特征背景干扰,本文将U_Net网络模型的编码部分替换为MobilenetV3_Large网络,导入基于ImageNet数据集的MobilenetV3_Large网络预训练权重,将U_Net网络模型解码部分... 为实现锈蚀图像分割网络模型轻量化,同时消除非单一特征背景和锈液等类似特征背景干扰,本文将U_Net网络模型的编码部分替换为MobilenetV3_Large网络,导入基于ImageNet数据集的MobilenetV3_Large网络预训练权重,将U_Net网络模型解码部分的普通卷积替换为深度可分离残差卷积,并在上采样的过程中添加注意力导向AG模块和Dropout机制。经实验验证表明,本文设计的改进U_Net网络模型在非单一特征背景和锈液等类似特征背景干扰下,具有明显的锈蚀图像分割优势,相比于原U_Net网络模型,模型大小减少了81.18%,浮点计算量减少了98.34%,检测效率提升了3.27倍,即从原来不足6 fps,提升至19 fps。网络模型实现轻量化的同时,网络模型的准确率达95.54%,相比于原U_Net网络模型提升了5.04%。 展开更多
关键词 锈蚀区域分割 MobilenetV3 U_Net 注意力导向 深度可分离残差卷积
原文传递
二阶逐层特征融合网络的图像超分辨重建
7
作者 于蕾 邓秋月 +1 位作者 郑丽颖 吴昊宇 《系统工程与电子技术》 EI CSCD 北大核心 2024年第2期391-400,共10页
针对一些超分辨网络忽略了对网络各层次特征的复用以及融合的问题,构建了具有较强特征复用和融合能力的二阶逐层特征融合超分辨网络,以获得具有高分辨率、高保真度的重建图像。网络的核心是逐层特征融合模块,该模块通过特征融合操作增... 针对一些超分辨网络忽略了对网络各层次特征的复用以及融合的问题,构建了具有较强特征复用和融合能力的二阶逐层特征融合超分辨网络,以获得具有高分辨率、高保真度的重建图像。网络的核心是逐层特征融合模块,该模块通过特征融合操作增强特征的重用。此外,还提出了二阶特征融合机制,该机制在网络的局部和全局层次上采用逐层特征融合方法进行特征融合。实验结果表明该网络的重建图像在线条和轮廓上更清晰,并且在峰值信噪比和结构相似度上也取得了更好的结果。例如当缩放尺度因子为2时,各测试集上的峰值信噪比/结构相似度依次为38.20 dB/0.9612、33.81 dB/0.9195、32.28 dB/0.9010、32.65 dB/0.9324、39.11 dB/0.9779,相比其他模型有一定提升,从客观标准和主观角度证明了二阶逐层特征融合超分辨网络具有一定的优越性。 展开更多
关键词 超分辨重建 卷积神经网络 特征融合 二阶特征融合机制
下载PDF
沉浸式视频编码技术综述
8
作者 曾焕强 孔庆玮 +3 位作者 陈婧 朱建清 施一帆 侯军辉 《电子与信息学报》 EI CAS CSCD 北大核心 2024年第2期602-614,共13页
随着虚拟现实、增强现实等沉浸式媒体技术的发展,沉浸式视频的表示、存储、传输和显示等各个环节都受到了科研及产业界的广泛关注。沉浸式视频更复杂的视频特性和庞大的数据量,对传统视频编码技术提出了挑战,新的编码技术应运而生。该... 随着虚拟现实、增强现实等沉浸式媒体技术的发展,沉浸式视频的表示、存储、传输和显示等各个环节都受到了科研及产业界的广泛关注。沉浸式视频更复杂的视频特性和庞大的数据量,对传统视频编码技术提出了挑战,新的编码技术应运而生。该文从视频自由度(DoF)出发,分别从3DoF和6DoF两个方面介绍沉浸式视频编码技术的最新成果。3DoF视频相关编码技术包括投影模型、运动估计模型和3DoF视频编码标准。6DoF视频相关编码技术包括视频表示形式、虚拟视点合成技术、6DoF视频编码技术及运动图像专家组沉浸式视频(MPEG,MIV)编码标准。最后,对沉浸式视频及其编码技术的发展进行总结和展望。 展开更多
关键词 视频编码 沉浸式视频 全景视频 自由视点视频
下载PDF
特征反馈机制优化的超声图像病灶检测算法
9
作者 丁建睿 王凌涛 +1 位作者 汤丰赫 宁春平 《电子与信息学报》 EI CAS CSCD 北大核心 2024年第3期1013-1021,共9页
该文提出一种基于特征反馈机制的超声图像病灶检测方法,以实现超声病灶的实时精确定位与检测。所提方法由基于特征反馈机制的特征提取网络和基于分治策略的自适应检测头两部分组成。特征反馈网络通过反馈特征选取和加权融合计算,充分学... 该文提出一种基于特征反馈机制的超声图像病灶检测方法,以实现超声病灶的实时精确定位与检测。所提方法由基于特征反馈机制的特征提取网络和基于分治策略的自适应检测头两部分组成。特征反馈网络通过反馈特征选取和加权融合计算,充分学习超声图像的全局上下文信息和局部低级语义细节以提高局部病灶特征的识别能力。自适应检测头对特征反馈网络所提取的多级特征进行分治预处理,通过将生理先验知识与特征卷积相结合的方式对各级特征分别进行病灶形状和尺度特征的自适应建模,增强检测头对不同大小病灶在多级特征下的检测效果。所提方法在甲状腺超声图像数据集上进行了测试,得到了70.3%的AP,99.0%的AP50和88.4%的AP75,实验结果表明,相较于主流检测算法,所提算法能实现更精准的实时超声图像病灶检测和定位。 展开更多
关键词 病灶检测 特征反馈 自适应检测头
下载PDF
利用自适应光照初始化的弱光图像增强方法
10
作者 刘波 田广粮 +2 位作者 肖斌 马建峰 毕秀丽 《电子与信息学报》 EI CAS CSCD 北大核心 2024年第2期643-651,共9页
由于光照分量分解估计的高度不确定性,如何准确估计图像的光照分量一直是基于Retinex模型的图像增强方法需要解决的难题。该文提出一个简单有效的方法,准确估计图像的初始光照分量,进而实现弱光图像增强。具体地,首先根据输入图像得到... 由于光照分量分解估计的高度不确定性,如何准确估计图像的光照分量一直是基于Retinex模型的图像增强方法需要解决的难题。该文提出一个简单有效的方法,准确估计图像的初始光照分量,进而实现弱光图像增强。具体地,首先根据输入图像得到其对应的光照权重矩阵,以指导光照分量的自适应初始化估计;随后在光照结构约束下,对初始光照分量优化估计,并进一步执行非线性光照调整;最终结合Retinex模型得到增强结果。实验表明,该方法不仅能够实现准确的图像分解估计,而且与现有的弱光图像增强方法相比,该文所提方法在多个数据集上的主观视觉效果和客观评价指标都有更好的表现,同时也保持着良好的运行效率。 展开更多
关键词 弱光图像增强 Retinex模型 光照自适应估计
下载PDF
基于特征复用机制的航拍图像小目标检测算法
11
作者 邓天民 程鑫鑫 +1 位作者 刘金凤 张曦月 《浙江大学学报(工学版)》 EI CAS CSCD 北大核心 2024年第3期437-448,共12页
针对无人机(UAV)航拍图像检测存在的小目标检测精度低和模型参数量大的问题,提出轻量高效的航拍图像检测算法FS-YOLO.该算法以YOLOv8s为基准网络,通过降低通道维数和改进网络架构提出轻量的特征提取网络,实现对冗余特征信息的高效复用,... 针对无人机(UAV)航拍图像检测存在的小目标检测精度低和模型参数量大的问题,提出轻量高效的航拍图像检测算法FS-YOLO.该算法以YOLOv8s为基准网络,通过降低通道维数和改进网络架构提出轻量的特征提取网络,实现对冗余特征信息的高效复用,在较少的参数量下产生更多特征图,提高模型对特征信息的提取和表达能力,同时显著减小模型大小.在特征融合阶段引入内容感知特征重组模块,加强对小目标显著语义信息的关注,提升网络对航拍图像的检测性能.使用无人机航拍数据集VisDrone进行实验验证,结果表明,所提算法以仅5.48 M的参数量实现了mAP0.5=47.0%的检测精度,比基准算法YOLOv8s的参数量降低了50.7%,精度提升了6.1%.在DIOR数据集上的实验表明,FS-YOLO的泛化能力较强,较其他先进算法更具竞争力. 展开更多
关键词 无人机(UVA)图像 目标检测 YOLOv8 轻量化主干 CARAFE
下载PDF
基于任务感知关系网络的少样本图像分类
12
作者 郭礼华 王广飞 《电子与信息学报》 EI CAS CSCD 北大核心 2024年第3期977-985,共9页
针对关系网络(RN)模型缺乏对分类任务整体相关信息的感知能力的问题,该文提出基于任务感知关系网络(TARN)的小样本学习(FSL)算法。引入模糊C均值(FCM)聚类生成基于任务全局分布的类别原型,同时设计任务相关注意力机制(TCA),改进RN中的1... 针对关系网络(RN)模型缺乏对分类任务整体相关信息的感知能力的问题,该文提出基于任务感知关系网络(TARN)的小样本学习(FSL)算法。引入模糊C均值(FCM)聚类生成基于任务全局分布的类别原型,同时设计任务相关注意力机制(TCA),改进RN中的1对1度量方式,使得在与类别原型对比时,局部特征聚合了任务全局信息。和RN比,在数据集Mini-ImageNet上,5-way 1-shot和5-way 5-shot设置中的分类准确率分别提高了8.15%和7.0%,在数据集Tiered-ImageNet上,5-way 1-shot和5-way 5-shot设置中的分类准确率分别提高了7.81%和6.7%。与位置感知的关系网络模型比,在数据集Mini-ImageNet上,5-way 1-shot设置中分类准确率也提高了1.24%。与其他小样本图像分类算法性能比较,TARN模型在两个数据集上都获得了最佳的识别精度。该方法将任务相关信息和度量网络模型进行结合可以有效提高小样本图像分类准确率。 展开更多
关键词 小样本学习 图像分类 度量学习 任务感知 关系网络
下载PDF
基于多尺度非对称密集网络的高光谱图像分类
13
作者 蔡轶珩 谭美伶 +1 位作者 潘建军 何楷祺 《电子与信息学报》 EI CAS CSCD 北大核心 2024年第4期1448-1457,共10页
近年来,基于有限标记样本的高光谱图像(HSI)分类方法取得了重大进展。然而,由于高光谱图像的特殊性,冗余的信息和有限的标记样本给提取强判别特征带来了巨大挑战。此外,由于各类别像素分布不均,如何强化中心像素的作用,减弱不同类别的... 近年来,基于有限标记样本的高光谱图像(HSI)分类方法取得了重大进展。然而,由于高光谱图像的特殊性,冗余的信息和有限的标记样本给提取强判别特征带来了巨大挑战。此外,由于各类别像素分布不均,如何强化中心像素的作用,减弱不同类别的周围像素的负面影响也是提高分类性能的关键。为了克服上述局限性,该文提出一种基于多尺度非对称密集网络(MS-ADNet)的高光谱图像分类方法。首先,提出一个多尺度样本构建模块,通过在每个像素周围提取多个尺度的图像块,并进行反卷积和拼接以构建输入样本,使其既包含详细的结构区域,又包含较大的同质区域;然后,提出一个非对称密集连接结构,在空间和光谱特征联合提取中实现核骨架增强,即增强了方形卷积核的中心十字区域部分提取的特征,有效地促进了特征重用。此外,为了提高光谱特征的鉴别性,提出一种精简的元素光谱注意力机制,并将其置于密集连接网络的前端和后端。在每类仅采用5个样本进行网络训练的情况下,该方法在Indiana Pines, Pavia University和Salinas数据集上的总体准确率分别达到了77.66%, 84.54%和92.39%,取得了极具竞争力的分类结果。 展开更多
关键词 高光谱图像分类 多尺度 非对称卷积 光谱注意力机制
下载PDF
小样本学习驱动的无线频谱状态感知
14
作者 申滨 李月 +1 位作者 王欣 王紫昕 《电子与信息学报》 EI CAS CSCD 北大核心 2024年第4期1231-1239,共9页
无线频谱状态感知是实现无线频谱资源高效利用及各种用频系统和谐共存的先决条件之一。针对复杂无线传播环境下获取的频谱观测往往存在数据稀疏性、数据类别分布不稳定、标记数据严重不足的情况,该文提出基于插值和小样本学习(FSL)分类... 无线频谱状态感知是实现无线频谱资源高效利用及各种用频系统和谐共存的先决条件之一。针对复杂无线传播环境下获取的频谱观测往往存在数据稀疏性、数据类别分布不稳定、标记数据严重不足的情况,该文提出基于插值和小样本学习(FSL)分类的无线频谱状态感知方法。首先,对捕获的稀疏频谱观测数据插值,构建频谱状态地图,作为频谱状态分类器的输入数据。其次,针对频谱数据类别分布不稳定、数据量严重不足的问题,基于小样本学习方法,利用嵌入模块和度量模块协同工作,以实现快速精确的频谱状态分类。具体地,利用嵌入模块将频谱数据映射到嵌入空间,提取频谱数据中的隐含特征;在度量模块的设计中,分别提出基于原型和基于样例的两种类别表示方式,通过计算待分类样本与类别之间的相似度判断待分类样本类别。最后,为了确保分类模型克服测试样本数量少导致过拟合问题,设置A-way B-shot任务训练模型。仿真结果表明,与传统机器学习方法相比,本文模型可以在低信噪比条件下进行精准分类;同时,在测试集样本数很少的情况下,或者在测试集中出现在训练集从未见到的新类时,所训练的模型也可以精准快速判别无线频谱的场景类别。 展开更多
关键词 频谱状态感知 频谱状态地图 插值 小样本学习
下载PDF
结合上下文特征融合的虚拟视点图像空洞填充
15
作者 周洋 蔡毛毛 +1 位作者 黄晓峰 殷海兵 《电子与信息学报》 EI CAS CSCD 北大核心 2024年第4期1479-1487,共9页
由于参考纹理视图的前景遮挡和不同视点间的视角差异,基于深度图的虚拟视点合成会产生大量空洞,先前的空洞填充方法耗时较长且填充区域与合成图像缺乏纹理一致性。该文首先对深度图进行预处理来减少空洞填充时的前景渗透;然后,针对经3D-... 由于参考纹理视图的前景遮挡和不同视点间的视角差异,基于深度图的虚拟视点合成会产生大量空洞,先前的空洞填充方法耗时较长且填充区域与合成图像缺乏纹理一致性。该文首先对深度图进行预处理来减少空洞填充时的前景渗透;然后,针对经3D-warping后输出合成图像中的空洞,设计了一种基于生成对抗网络(GAN)架构的图像生成网络来填充空洞。该网络模型由2级子网络构成,第1级网络生成空洞区域的纹理结构信息,第2级网络采用了一种结合上下文特征融合的注意力模块来提升空洞填充质量。提出的网络模型能有效解决当虚拟视点图像中的前景对象存在快速运动时,空洞填充区易产生伪影的问题。在多视点深度序列上的实验结果表明,提出方法在主客观质量上均优于已有的虚拟视点图像空洞填充方法。 展开更多
关键词 虚拟视点绘制 空洞填充 特征融合 上下文特征
下载PDF
双鉴别器盲超分重建方法研究
16
作者 卢迪 于国梁 《电子与信息学报》 EI CAS CSCD 北大核心 2024年第1期277-286,共10页
图像超分变率重建方法在公共安全检测、卫星成像、医学和照片恢复等方面有着十分重要的用途。该文对基于生成对抗网络的超分辨率重建方法进行研究,提出一种基于纯合成数据训练的真实世界盲超分算法(RealESRGAN)的UNet3+双鉴别器Real-ESR... 图像超分变率重建方法在公共安全检测、卫星成像、医学和照片恢复等方面有着十分重要的用途。该文对基于生成对抗网络的超分辨率重建方法进行研究,提出一种基于纯合成数据训练的真实世界盲超分算法(RealESRGAN)的UNet3+双鉴别器Real-ESRGAN方法(Double Unet3+Real-ESRGAN, DU3-Real-ESRGAN)。首先,在鉴别器中引入UNet3+结构,从全尺度捕捉细粒度的细节和粗粒度的语义。其次,采用双鉴别器结构,一个鉴别器学习图像纹理细节,另一个鉴别器关注图像边缘,实现图像信息互补。在Set5, Set14, BSD100和Urban100数据集上,与多种基于生成对抗网络的超分重建方法相比,除Set5数据集外,DU3-Real-ESRGAN方法在峰值信噪比(PSNR)、结构相似性(SSIM)和无参图像考评价指标(NIQE)都优于其他方法,产生了更直观逼真的高分辨率图像。 展开更多
关键词 超分辨率重建 纯合成数据训练的真实世界盲超分算法 UNet3+ 双鉴别器
下载PDF
基于聚类与稀疏字典学习的近似消息传递
17
作者 司菁菁 王亚茹 +1 位作者 王爱婷 程银波 《燕山大学学报》 CAS 北大核心 2024年第2期157-164,共8页
基于传统字典学习的近似消息传递(approximate message passing,AMP)算法对训练样本数量的需求较高,且运算成本较高。本文引入双稀疏模型,构建基于稀疏字典学习的AMP框架,降低迭代过程中字典学习对训练样本数量的需求,提高压缩感知图像... 基于传统字典学习的近似消息传递(approximate message passing,AMP)算法对训练样本数量的需求较高,且运算成本较高。本文引入双稀疏模型,构建基于稀疏字典学习的AMP框架,降低迭代过程中字典学习对训练样本数量的需求,提高压缩感知图像重建的质量与效率。进一步,提出基于聚类与稀疏字典学习的AMP算法,在迭代过程中依据图像块特征进行分类,并为各类图像块分别学习稀疏字典,实现自适应去噪。与基于传统字典学习的AMP算法相比,基于聚类与稀疏字典学习的AMP算法能够将重建图像的峰值信噪比提高0.20~1.75 dB,并且能够将运算效率平均提高89%。 展开更多
关键词 图像重构 近似消息传递 字典学习 稀疏字典 聚类
下载PDF
基于视觉图像与激光点云融合的交通标志快速识别方法
18
作者 王坤 倪娟 陈印 《计算机测量与控制》 2024年第1期226-231,共6页
交通标志对车辆交通起到重要作用和意义,而智能交通中交通标志识别由于标志特征提取效果差,导致识别率低、识别时间长,因此,提出一种新的基于视觉图像与激光点云融合的交通标志快速识别方法。采用双边滤波方法预处理原始激光点云数据;... 交通标志对车辆交通起到重要作用和意义,而智能交通中交通标志识别由于标志特征提取效果差,导致识别率低、识别时间长,因此,提出一种新的基于视觉图像与激光点云融合的交通标志快速识别方法。采用双边滤波方法预处理原始激光点云数据;通过归一化处理得到视觉图像激光点云融合的目标空间激光点云位置测距数值;通过测距值获取目标图像位置,归一化处理交通标志视觉图像,引入k均值聚类算法二聚类处理图像,采用制作的切割模板切割图像感兴趣区域,提取交通标志图像的深度特征,结合卷积神经网络二次过滤特征,重新标定二次过滤后的特征,最终利用卷积神经网络模型实现交通标志快速识别;经实验对比证明,采用所提方法提取各个类型交通标志特征的提取效果较好,并且识别率达到89.74%,识别时间仅为13.1 s,干扰下识别时间最高仅为15.1 s,验证了该方法可以快速且准确识别各个类型的交通标志。 展开更多
关键词 视觉图像 激光点云 交通标志 快速识别 K均值聚类算法 卷积神经网络
下载PDF
基于嵌入式设备的低功耗工业读码器系统设计
19
作者 何涛 陈文重 +1 位作者 王正家 吴春林 《电子器件》 CAS 2024年第1期55-61,共7页
针对目前国内读码器产品种类稀少、成本过高,功耗和热量过高、识别率低等问题,提出了一种结构紧凑、性价比高、功耗低、稳定性强的智能读码器系统设计方案。该系统方案主要基于ARM平台和Linux系统开发,硬件方面采用NXP MX8Mini作为主控... 针对目前国内读码器产品种类稀少、成本过高,功耗和热量过高、识别率低等问题,提出了一种结构紧凑、性价比高、功耗低、稳定性强的智能读码器系统设计方案。该系统方案主要基于ARM平台和Linux系统开发,硬件方面采用NXP MX8Mini作为主控芯片,搭载XILINX的XC7A50T FPGA器件,配置2G容量的LDDR4内存用来做图像预处理工作,采用AR0144CS芯片作为图像传感器,并支持多种通讯协议和扩展。软件方面,主要介绍了系统FPGA图像预处理及高斯滤波具体实现、ARM与FPGA的通讯、上位机功能设计。经过测试,该读码器系统运行稳定、体积小、功耗低,一维码8mil Code128识别率达到99.99%,为当前国产读码器市场提供了一种新的解决方案。 展开更多
关键词 读码器 低功耗 识别率 图像预处理 高斯滤波
下载PDF
基于信息分形的行人轨迹预测方法
20
作者 杨田 王钢 +1 位作者 赖健 汪洋 《电子与信息学报》 EI CAS CSCD 北大核心 2024年第2期527-537,共11页
行人轨迹预测应用十分广泛,比如自动驾驶、机器人导航等。在轨迹预测中,一些不确定信息给轨迹预测任务带来了挑战,比如判别器中对轨迹信息判别的不确定,复杂的交互信息。在不确定信息处理科学领域,信息分形能有效处理不确定信息的不确... 行人轨迹预测应用十分广泛,比如自动驾驶、机器人导航等。在轨迹预测中,一些不确定信息给轨迹预测任务带来了挑战,比如判别器中对轨迹信息判别的不确定,复杂的交互信息。在不确定信息处理科学领域,信息分形能有效处理不确定信息的不确定性和复杂性。受此启发,为了充分处理判别器中轨迹信息判别的不确定性,提升预测精度,该文提出了基于信息分形的轨迹预测方法。首先,场景信息和历史轨迹信息被特征提取模块提取。然后,通过注意力模块获取到场景-行人之间的交互信息与行人-行人之间的交互信息。最后基于生成对抗网络和信息分形生成合理的轨迹。在两个公共数据集ETH/UCY上实验表明,该方法能有效处理轨迹信息的不确定性,提高轨迹预测的精度。比如突然转弯、从后方超越前人、避让等行为的轨迹都能有效预测。在平均位移误差(ADE)和终点位移误差(FDE)上相比基准模型误差平均降低了11.11%和23.48%。 展开更多
关键词 行人轨迹预测 不确定信息处理 信息分形 生成对抗网络
下载PDF
上一页 1 2 250 下一页 到第
使用帮助 返回顶部