期刊文献+

《中国图象图形学报》 CSCD 北大核心

作品数4919被引量26641H指数50
《中国图象图形学报》是由中国科学院空天信息创新研究院;中国图象图形学学会;北京应用物理与计算数学研究所创办,是集计算机图像图形高科技理论、技术方法与应用研究成果产业化于一体的综合性学术期刊。 ...查看详情>>
  • 曾用名 中国图象图形学报:A辑
  • 主办单位中国科学院空天信息创新研究院;中国图象图形学学会;北京应用物理与计算数学研究所
  • 国际标准连续出版物号1006-8961
  • 国内统一连续出版物号11-3758/TB
  • 出版周期月刊
共找到4,919篇文章
< 1 2 250 >
每页显示 20 50 100
相似度感知蒸馏的统一弱监督个性化联邦图像分割
1
作者 潘建珊 林立 +5 位作者 吴洁伟 刘翼翔 陈孝华 林其友 黄建业 唐晓颖 《中国图象图形学报》 CSCD 北大核心 2024年第3期620-636,共17页
目的 联邦学习允许多个机构在不侵犯数据隐私、安全的前提下协作训练强大的深度模型。现有多数联邦范式在处理多中心不同数据分布时性能通常会下降,且弱监督条件下的联邦范式鲜有研究,特别是各站点数据采用不同形式稀疏标注的情况。针... 目的 联邦学习允许多个机构在不侵犯数据隐私、安全的前提下协作训练强大的深度模型。现有多数联邦范式在处理多中心不同数据分布时性能通常会下降,且弱监督条件下的联邦范式鲜有研究,特别是各站点数据采用不同形式稀疏标注的情况。针对该问题,提出一种站点分布相似度感知知识蒸馏的统一弱监督个性化联邦学习框架(unified weakly supervised personalized federated image segmentation via similarity-aware distillation,pFedWSD),以应对多中心数据分布和标注上的差异。方法 所提出的pFedWSD通过循环知识蒸馏为每个站点训练个性化模型,包含动态循环公共知识积累及个性化两个阶段。第1阶段以不确定度感知方式动态地排序每轮训练中各站点模型性能,并以循环知识蒸馏的形式积累公共知识;第2阶段通过批标准化层的统计信息来度量各站点间相似性并聚合得到各站点教师模型并进行知识蒸馏。在弱监督方面,引入门控条件随机场损失和树能量损失相结合的训练目标,以产生更为精确的伪标注监督信号。结果 在眼底视杯视盘分割和视网膜中心凹无血管区分割两项任务中,pFedWSD的Dice系数和HD95(95%Hausdorff distance)指标均优于多种中心式联邦和个性化联邦方法,在两项任务中,Dice系数分别为90.38%和93.12%,相比于较先进的方法FedAP(federated learning with adaptive batchnorm for personalized healthcare)和FedALA(adaptive local aggregation for personalized federated learning)分别提升了1.67%和6.56%,性能接近于全监督集中式训练所得的模型。结论 本文提出的弱监督个性化联邦学习框架能有效统一不同形式稀疏标注数据并对不同分布的各站点数据训练得到个性化模型,使各站点分割性能均得到显著提升。 展开更多
关键词 相似度感知 知识蒸馏 弱监督学习 个性化联邦学习 医学图像分割
原文传递
结合部首字形和层级结构的手写汉字纠错方法
2
作者 李云青 杜俊 +1 位作者 胡鹏飞 张建树 《中国图象图形学报》 CSCD 北大核心 2023年第8期2382-2395,共14页
目的手写汉字纠错(handwritten Chinese character error correction,HCCEC)任务具有两重性,即判断汉字正确性和对错字进行纠正,该任务在教育场景下应用广泛,可以帮助学生学习汉字、纠正书写错误。由于手写汉字具有复杂的空间结构、多... 目的手写汉字纠错(handwritten Chinese character error correction,HCCEC)任务具有两重性,即判断汉字正确性和对错字进行纠正,该任务在教育场景下应用广泛,可以帮助学生学习汉字、纠正书写错误。由于手写汉字具有复杂的空间结构、多样的书写风格以及巨大的数量,且错字与正确字之间具有高度的相似性,因此,手写汉字纠错的关键是如何精确地建模一个汉字。为此,提出一种层级部首网络(hierarchical radical network,HRN)。方法从部首字形的角度出发,挖掘部首形状结构上的相似性,通过注意力模块捕获包含部首信息的细粒度图像特征,增大相似字之间的区分性。另外,结合汉字本身的层级结构特性,采用基于概率解码的思路,对部首的层级位置进行建模。结果在手写汉字数据集上进行实验,与现有方案相比,HRN在正确字测试集与错字测试集上,精确率分别提升了0.5%和9.8%,修正率在错字测试集上提升了15.3%。此外,通过注意力机制的可视化分析,验证了HRN可以捕捉包含部首信息的细粒度图像特征。部首表征之间的欧氏距离证明了HRN学习到的部首表征向量中包含了部首的字形结构信息。结论本文提出的HRN能够更好地对相似部首进行区分,进而精确地区分正确字与错字,具有很强的鲁棒性和泛化性。 展开更多
关键词 手写汉字纠错(HCCEC) 汉字识别 部首分析 广义零样本学习(GZSL) 注意力机制 卷积神经网络(CNN)
原文传递
面向全景智齿检测的内卷解耦轻量化网络
3
作者 曾怡峰 姚潇 +2 位作者 华飞 王佩佩 顾敏 《中国图象图形学报》 CSCD 北大核心 2023年第8期2491-2504,共14页
目的全口曲面断层片(全景片)需要病人的正确摆位辅以仪器的合理配置而取得合格的成像:以面中线为界,双侧上下颌骨等结构呈左右对称;牙齿的咬合面连线呈缓慢的微笑曲线,各牙齿在全景片上的生理位置是基本固定的。因此,以全景片为代表的... 目的全口曲面断层片(全景片)需要病人的正确摆位辅以仪器的合理配置而取得合格的成像:以面中线为界,双侧上下颌骨等结构呈左右对称;牙齿的咬合面连线呈缓慢的微笑曲线,各牙齿在全景片上的生理位置是基本固定的。因此,以全景片为代表的口腔医学图像具备固定的前、背景关系和稳定的空间结构,但基于常规卷积的网络因其卷积的空间无关性而对上述空间域的结构信息并不敏感。虽然一些特殊的注意力模块能够引导模型关注特定信息并给予加权,但是它关注的信息常常背离人们的期望,反而降低模型性能;另一方面,注意力作为嵌入式的模块往往会提高计算量和参数量。针对口腔医学图像的结构特性,提出适用于全景智齿检测的基于内卷解耦的YOLO(you only look once)模型。方法在主干网络中,通过重塑跨阶段分部(cross stage partial,CSP)结构并引入一种具备空间特异性的内卷积方式,使模型优先关注空间域中信息量最大的视觉元素,以此强化模型对空间信息的建模能力;在检测头结构中,提出采用多支路解耦结构克服任务耦合的负面影响,解决内卷算子与YOLO模型的适配性问题,并对各支路的损失函数进行针对性优化。结果在全景片数据集上的智齿检测的实验结果表明,本文方法的检测性能和模型参数大幅优于近年优秀的单阶段目标检测模型,相较于本文的基线模型,参数量缩减了42.5%,平均精确率提升了6.3%,充分验证了本文模型结构的合理性及对于智齿检测任务的有效性。结论本文针对口腔医学图像的空间结构性质提出的基于内卷解耦的全景智齿检测方案,具有更强的空间信息建模能力,且降低了参数量成本。 展开更多
关键词 全景片 智齿 目标检测 YOLO 解耦 内卷
原文传递
小股人群重识别研究进展
4
作者 张权 赖剑煌 +1 位作者 谢晓华 陈泓栩 《中国图象图形学报》 CSCD 北大核心 2023年第5期1225-1241,共17页
小股人群重识别旨在将非重叠视域的摄像头网络下具有相同成员的群组图像进行正确的关联。小股人群重识别是传统行人重识别任务的一个重要拓展,在安防监控场景下有着重要的研究意义和应用前景。小股人群重识别所面临的独特挑战在于如何... 小股人群重识别旨在将非重叠视域的摄像头网络下具有相同成员的群组图像进行正确的关联。小股人群重识别是传统行人重识别任务的一个重要拓展,在安防监控场景下有着重要的研究意义和应用前景。小股人群重识别所面临的独特挑战在于如何针对群内成员的数量变化和布局变化进行建模,并提取稳定、鲁棒的特征表达。近年来,小股人群重识别引发了研究人员的广泛关注,并获得了快速的发展。本文对小股人群重识别技术的研究进展进行了全面的梳理回顾。首先简要介绍本领域的研究背景,对基本概念、数据集和相关技术进行了简要总结。在此基础上,对多种小股人群重识别算法进行了详细的介绍,并在多个数据集上对前沿算法进行性能对比。最后,对该任务进行展望。整体而言,与行人重识别相比,小股人群重识别的现有方法在具体场景下的特定挑战性能表现欠佳,还需要从数据收集和方法设计两方面进一步探讨。此外,现有的小股人群重识别研究与其他视觉任务的关联性不够紧密,如何协同多任务作业以解决更多业界需求、加速产业落地,需要学术界和工业界共同思考和推动。 展开更多
关键词 小股人群重识别(GReID) 行人重识别 虚拟数据 深度学习 特征学习 度量学习 TRANSFORMER
原文传递
基于深度学习的图像融合方法综述 被引量:6
5
作者 唐霖峰 张浩 +1 位作者 徐涵 马佳义 《中国图象图形学报》 CSCD 北大核心 2023年第1期3-36,共34页
图像融合技术旨在将不同源图像中的互补信息整合到单幅融合图像中以全面表征成像场景,并促进后续的视觉任务。随着深度学习的兴起,基于深度学习的图像融合算法如雨后春笋般涌现,特别是自编码器、生成对抗网络以及Transformer等技术的出... 图像融合技术旨在将不同源图像中的互补信息整合到单幅融合图像中以全面表征成像场景,并促进后续的视觉任务。随着深度学习的兴起,基于深度学习的图像融合算法如雨后春笋般涌现,特别是自编码器、生成对抗网络以及Transformer等技术的出现使图像融合性能产生了质的飞跃。本文对不同融合任务场景下的前沿深度融合算法进行全面论述和分析。首先,介绍图像融合的基本概念以及不同融合场景的定义。针对多模图像融合、数字摄影图像融合以及遥感影像融合等不同的融合场景,从网络架构和监督范式等角度全面阐述各类方法的基本思想,并讨论各类方法的特点。其次,总结各类算法的局限性,并给出进一步的改进方向。再次,简要介绍不同融合场景中常用的数据集,并给出各种评估指标的具体定义。对于每一种融合任务,从定性评估、定量评估和运行效率等多角度全面比较其中代表性算法的性能。本文提及的算法、数据集和评估指标已汇总至https://github.com/Linfeng-Tang/Image-Fusion。最后,给出了本文结论以及图像融合研究中存在的一些严峻挑战,并对未来可能的研究方向进行了展望。 展开更多
关键词 图像融合 深度学习 多模图像 数字摄影 遥感影像
原文传递
双视图三维卷积网络的工业装箱行为识别
6
作者 胡海洋 潘健 李忠金 《中国图象图形学报》 CSCD 北大核心 2022年第8期2368-2379,共12页
目的 在自动化、智能化的现代生产制造过程中,行为识别技术扮演着越来越重要的角色,但实际生产制造环境的复杂性,使其成为一项具有挑战性的任务。目前,基于3D卷积网络结合光流的方法在行为识别方面表现出良好的性能,但还是不能很好地解... 目的 在自动化、智能化的现代生产制造过程中,行为识别技术扮演着越来越重要的角色,但实际生产制造环境的复杂性,使其成为一项具有挑战性的任务。目前,基于3D卷积网络结合光流的方法在行为识别方面表现出良好的性能,但还是不能很好地解决人体被遮挡的问题,而且光流的计算成本很高,无法在实时场景中应用。针对实际工业装箱场景中存在的人体被遮挡问题和光流计算成本问题,本文提出一种结合双视图3D卷积网络的装箱行为识别方法。方法 首先,通过使用堆叠的差分图像(residual frames, RF)作为模型的输入来更好地提取运动特征,替代实时场景中无法使用的光流。原始RGB图像和差分图像分别输入到两个并行的3D ResNeXt101中。其次,采用双视图结构来解决人体被遮挡的问题,将3D ResNeXt101优化为双视图模型,使用一个可学习权重的双视图池化层对不同角度的视图做特征融合,然后使用该双视图3D ResNeXt101模型进行行为识别。最后,为进一步提高检测结果的真负率(true negative rate, TNR),本文在模型中加入降噪自编码器和two-class支持向量机(support vector machine, SVM)。结果 本文在实际生产环境下装箱场景进行了实验,采用准确率和真负率两个指标进行评估,得到的装箱行为识别准确率为94.2%、真负率为98.9%。同时在公共数据集UCF(University of Central Florida)101上进行了评估,以准确率为评估指标,得到的装箱行为识别准确率为97.9%。进一步验证了本文方法的有效性和准确性。结论 本文提出的人体行为识别方法能够有效利用多个视图中的人体行为信息,结合传统模型和深度学习模型,显著提高了行为识别准确率和真负率。 展开更多
关键词 行为识别 双视图 三维卷积神经网络 降噪自编码器 支持向量机(SVM)
原文传递
融合跨阶段深度学习的脑肿瘤MRI图像分割 被引量:5
7
作者 夏峰 邵海见 邓星 《中国图象图形学报》 CSCD 北大核心 2022年第3期873-884,共12页
目的磁共振成像(magnetic resonance imaging,MRI)作为一种非侵入性的软组织对比成像方式,可以提供有关脑肿瘤的形状、大小和位置等有价值的信息,是用于脑肿瘤患者检查的主要方法,在脑肿瘤分割任务中发挥着重要作用。由于脑肿瘤本身复... 目的磁共振成像(magnetic resonance imaging,MRI)作为一种非侵入性的软组织对比成像方式,可以提供有关脑肿瘤的形状、大小和位置等有价值的信息,是用于脑肿瘤患者检查的主要方法,在脑肿瘤分割任务中发挥着重要作用。由于脑肿瘤本身复杂多变的形态、模糊的边界、低对比度以及样本梯度复杂等问题,导致高精度脑肿瘤MRI图像分割非常具有挑战性,目前主要依靠专业医师手动分割,费时且可重复性差。对此,本文提出一种基于U-Net的改进模型,即CSPU-Net(cross stage partial U-Net)脑肿瘤分割网络,以实现高精度的脑肿瘤MRI图像分割。方法CSPU-Net在U-Net结构的上下采样中分别加入两种跨阶段局部网络结构(cross stage partial module,CSP)提取图像特征,结合GDL(general Dice loss)和WCE(weighted cross entropy)两种损失函数解决训练样本类别不平衡问题。结果在BraTS(brain tumor segmentation)2018和BraTS 2019两个数据集上进行实验,在BraTS 2018数据集中的整体肿瘤分割精度、核心肿瘤分割精度和增强肿瘤分割精度分别为87.9%、80.6%和77.3%,相比于传统U-Net的改进模型(ResU-Net)分别提升了0.80%、1.60%和2.20%。在BraTS 2019数据集中的整体肿瘤分割精度、核心肿瘤分割精度和增强肿瘤分割精度分别为87.8%、77.9%和70.7%,相比于ResU-Net模型提升了0.70%、1.30%和1.40%。结论本文提出的跨阶段局部网络结构,通过增加梯度路径、减少信息损失,可以有效提高脑肿瘤分割精度,实验结果证明了该模块对脑肿瘤分割任务的有效性。 展开更多
关键词 脑肿瘤分割 深度学习 U-Net 跨阶段局部网络结构 残差模块
原文传递
用于单幅模糊图像超分辨的Transformer融合网络 被引量:3
8
作者 刘花成 任文琦 +1 位作者 王蕊 操晓春 《中国图象图形学报》 CSCD 北大核心 2022年第5期1616-1631,共16页
目的以卷积神经网络为代表的深度学习方法已经在单帧图像超分辨领域取得了丰硕成果,这些方法大多假设低分辨图像不存在模糊效应。然而,由于相机抖动、物体运动等原因,真实场景下的低分辨率图像通常会伴随着模糊现象。因此,为了解决模糊... 目的以卷积神经网络为代表的深度学习方法已经在单帧图像超分辨领域取得了丰硕成果,这些方法大多假设低分辨图像不存在模糊效应。然而,由于相机抖动、物体运动等原因,真实场景下的低分辨率图像通常会伴随着模糊现象。因此,为了解决模糊图像的超分辨问题,提出了一种新颖的Transformer融合网络。方法首先使用去模糊模块和细节纹理特征提取模块分别提取清晰边缘轮廓特征和细节纹理特征。然后,通过多头自注意力机制计算特征图任一局部信息对于全局信息的响应,从而使Transformer融合模块对边缘特征和纹理特征进行全局语义级的特征融合。最后,通过一个高清图像重建模块将融合特征恢复成高分辨率图像。结果实验在2个公开数据集上与最新的9种方法进行了比较,在GOPRO数据集上进行2倍、4倍、8倍超分辨重建,相比于性能第2的模型GFN(gated fusion network),峰值信噪比(peak signal-to-noive ratio,PSNR)分别提高了0.12 d B、0.18 d B、0.07 d B;在Kohler数据集上进行2倍、4倍、8倍超分辨重建,相比于性能第2的模型GFN,PSNR值分别提高了0.17 d B、0.28 d B、0.16 d B。同时也在GOPRO数据集上进行了对比实验以验证Transformer融合网络的有效性。对比实验结果表明,提出的网络明显提升了对模糊图像超分辨重建的效果。结论本文所提出的用于模糊图像超分辨的Transformer融合网络,具有优异的长程依赖关系和全局信息捕捉能力,其通过多头自注意力层计算特征图任一局部信息在全局信息上的响应,实现了对去模糊特征和细节纹理特征在全局语义层次的深度融合,从而提升了对模糊图像进行超分辨重建的效果。 展开更多
关键词 超分辨 单帧图像超分辨 模糊图像 融合网络 TRANSFORMER
原文传递
网络监督数据下的细粒度图像识别综述 被引量:6
9
作者 魏秀参 许玉燕 杨健 《中国图象图形学报》 CSCD 北大核心 2022年第7期2057-2077,共21页
细粒度图像识别旨在对某一传统语义类别下细粒度级别的不同子类类别进行视觉识别,在智慧新经济和工业物联网等领域(如智慧城市、公共安全、生态保护、农业生产与安全保障)具有重要的科学意义和应用价值。细粒度图像识别在深度学习的助... 细粒度图像识别旨在对某一传统语义类别下细粒度级别的不同子类类别进行视觉识别,在智慧新经济和工业物联网等领域(如智慧城市、公共安全、生态保护、农业生产与安全保障)具有重要的科学意义和应用价值。细粒度图像识别在深度学习的助力下取得了长足进步,但其对大规模优质细粒度图像数据的依赖成为制约细粒度图像识别推广和普及的瓶颈。随着互联网和大数据的快速发展,网络监督图像数据作为免费的数据来源成为缓解深度学习对大数据依赖的可行解决方案,如何有效利用网络监督数据成为提升细粒度图像识别推广性和泛化性的热门课题。本文围绕细粒度图像识别主题,以网络监督数据下的细粒度识别为重点,先后对细粒度识别数据集、传统细粒度识别方法、网络监督下细粒度识别特点与方法进行介绍,并回顾了全球首届网络监督下的细粒度图像识别竞赛的相关情况及冠军解决方案。最后,在上述内容基础上总结和讨论了该领域的未来发展趋势。 展开更多
关键词 网络监督 细粒度图像识别 噪声数据 长尾分布 类间差异小 综述
原文传递
3D卷积自编码器高光谱图像分类模型 被引量:3
10
作者 石延新 何进荣 +1 位作者 李照奎 曾志高 《中国图象图形学报》 CSCD 北大核心 2021年第8期2021-2036,共16页
目的高光谱图像分类是遥感领域的基础问题,高光谱图像同时包含丰富的光谱信息和空间信息,传统模型难以充分利用两种信息之间的关联性,而以卷积神经网络为主的有监督深度学习模型需要大量标注数据,但标注数据难度大且成本高。针对现有模... 目的高光谱图像分类是遥感领域的基础问题,高光谱图像同时包含丰富的光谱信息和空间信息,传统模型难以充分利用两种信息之间的关联性,而以卷积神经网络为主的有监督深度学习模型需要大量标注数据,但标注数据难度大且成本高。针对现有模型的不足,本文提出了一种无监督范式下的高光谱图像空谱融合方法,建立了3D卷积自编码器(3D convolutional auto-encoder,3D-CAE)高光谱图像分类模型。方法3D卷积自编码器由编码器、解码器和分类器构成。将高光谱数据预处理后,输入到编码器中进行无监督特征提取,得到一组特征图。编码器的网络结构为3个卷积块构成的3D卷积神经网络,卷积块中加入批归一化技术防止过拟合。解码器为逆向的编码器,将提取到的特征图重构为原始数据,用均方误差函数作为损失函数判断重构误差并使用Adam算法进行参数优化。分类器由3层全连接层组成,用于判别编码器提取到的特征。以3D-CNN(three dimensional convolutional neural network)为自编码器的主干网络可以充分利用高光谱图像的空间信息和光谱信息,做到空谱融合。以端到端的方式对模型进行训练可以省去复杂的特征工程和数据预处理,模型的鲁棒性和稳定性更强。结果在Indian Pines、Salinas、Pavia University和Botswana等4个数据集上与7种传统单特征方法及深度学习方法进行了比较,本文方法均取得最优结果,总体分类精度分别为0.9487、0.9866、0.9862和0.9649。对比实验结果表明了空谱融合和无监督学习对于高光谱遥感图像分类的有效性。结论本文模型充分利用了高光谱图像的光谱特征和空间特征,可以做到无监督特征提取,无需大量标注数据的同时分类精度高,是一种有效的高光谱图像分类方法。 展开更多
关键词 遥感图像分类 空谱特征融合 3D-CNN 自编码器 卷积神经网络(CNN) 深度学习
原文传递
一尺窗 一世界 2020年封面图片
11
《中国图象图形学报》 CSCD 北大核心 2021年第5期F0004-F0004,共1页
原文传递
结合多尺度条件生成对抗网络的井下轨道检测 被引量:2
12
作者 卫星 杨国强 +2 位作者 李佳 陆阳 石雷 《中国图象图形学报》 CSCD 北大核心 2020年第2期282-293,共12页
目的传统的轨道检测算法受环境干扰因素大导致检测效率低,基于卷积神经网络(CNN)算法的轨道检测结果缺乏对于对象的细腻、独特刻画且过多依赖可视化后处理技术,因此本文提出一种结合多尺度信息的条件生成对抗网络(CGAN)轨道线检测算法... 目的传统的轨道检测算法受环境干扰因素大导致检测效率低,基于卷积神经网络(CNN)算法的轨道检测结果缺乏对于对象的细腻、独特刻画且过多依赖可视化后处理技术,因此本文提出一种结合多尺度信息的条件生成对抗网络(CGAN)轨道线检测算法。方法在生成器网络中采用多粒度结构将生成器分解为全局和局部两个部分;在判别器网络中采用多尺度共享卷积结构,进一步监督生成器的训练;引入蒙特卡罗搜索技术通过对生成器的中间状态进行搜索,并将结果再送入到判别器中进行对比。结果在井下巷道场景测试集中,本文方法取得了82.43%像素精度和0.6218的平均交并比,并且对轨道的检测可以达到95.01%的准确率;与现有的语义分割的算法相比,表现出了优越性。结论本文方法能够有效应用于井下复杂环境,一定程度上解决了传统的图像处理算法和卷积神经网络算法存在的问题,从而有效服务于井下自动驾驶。 展开更多
关键词 轨道检测 条件生成对抗网络 多尺度信息 蒙特卡洛搜索 井下自动驾驶
原文传递
多视角神经网络非接触式脉搏信号提取
13
作者 赵昶辰 居峰 冯远静 《中国图象图形学报》 CSCD 北大核心 2020年第11期2428-2438,共11页
目的远程光体积描记(remote photoplethysmography,r PPG)是一种基于视频的非接触式心率测量技术,受到学者的广泛关注。从视频数据中提取脉搏信号需要同时考虑时间和空间信息,然而现有方法往往将空间处理与时间处理割裂开,从而造成建模... 目的远程光体积描记(remote photoplethysmography,r PPG)是一种基于视频的非接触式心率测量技术,受到学者的广泛关注。从视频数据中提取脉搏信号需要同时考虑时间和空间信息,然而现有方法往往将空间处理与时间处理割裂开,从而造成建模不准确、测量精度不高等问题。本文提出一种基于多视角2维卷积的神经网络模型,对帧内和帧间相关性进行建模,从而提高测量精度。方法所提网络包括普通2维卷积块和多视角卷积块。普通2维卷积块将输入数据在空间维度做初步抽象。多视角卷积块包括3个通道,分别从输入数据的高—宽、高—时间、宽—时间3个视角进行2维卷积操作,再将3个视角的互补时空特征进行融合得到最终的脉搏信号。所提多视角2维卷积是对传统单视角2维卷积网络在时间维度的扩展。该方法不破坏视频原有结构,通过3个视角的卷积操作挖掘时空互补特征,从而提高脉搏测量精度。结果在公共数据集PURE(pulse rate detection dataset)和自建数据集Self-rPPG(self-built r PPG dataset)上的实验结果表明,所提网络提取脉搏信号的信噪比相比于传统方法在两个数据集上分别提高了3.92 d B和1.92 d B,平均绝对误差分别降低了3.81 bpm和2.91 bpm;信噪比相比于单视角网络分别提高了2.93 d B和3.20 d B,平均绝对误差分别降低了2.20 bpm和3.61 bpm。结论所提网络能够在复杂环境中以较高精度估计出受试者的脉搏信号,表明了多视角2维卷积在r PPG脉搏提取的有效性。与基于单视角2维神经网络的r PPG算法相比,本文方法提取的脉搏信号噪声、低频分量更少,泛化能力更强。 展开更多
关键词 心率测量 神经网络 远程光体积描记(r PPG) 多视角卷积 时空特征
原文传递
突变策略下多通路Metropolis光照传播
14
作者 贺怀清 赵煜桢 +1 位作者 刘浩翰 王旭 《中国图象图形学报》 CSCD 北大核心 2020年第8期1658-1673,共16页
目的针对多通路Metropolis光照传播(multiplexed Metropolis light transport,MMLT)算法在亮度不均匀区域接受概率低、采样数量与光照分布不对称以及亮度均匀区域样本流动性差的问题,提出一种兼顾整体和局部处理的融合突变策略。方法整... 目的针对多通路Metropolis光照传播(multiplexed Metropolis light transport,MMLT)算法在亮度不均匀区域接受概率低、采样数量与光照分布不对称以及亮度均匀区域样本流动性差的问题,提出一种兼顾整体和局部处理的融合突变策略。方法整体上,以方差动态度量像素平面亮度均匀度,并自适应调整采样步长,记录每个像素位置的采样数量,当采样进行到当前采样像素的样本数量达到阈值,且当前样本是马尔可夫链起始样本或大突变后首个样本时,以方差度量当前采样像素及其8邻域范围内亮度均匀程度,并以方差的计算结果调整当前马尔可夫链的采样步长。若当前采样像素的样本数量达到阈值,且当前样本是马尔可夫链小突变时,则兼顾采样数量和光照强度计算当前像素8邻域内的采样权重。结果实验将改进算法和MMLT算法在不同光照和材质的场景下进行对比,改进算法在保证高光区域渲染效果外,使亮度不均匀区域的渲染结果更加细腻,亮度均匀区域样本更为分散。结论本文提出以方差动态度量图像亮度均匀度,自适应调整采样步长与加强高光区域采样相结合的融合突变策略,可以使样本在亮度不均匀区域聚集进行精细采样,在亮度变化剧烈处改善局部采样数量与光照分布不对称现象,在亮度均匀区域增强样本的遍历性。 展开更多
关键词 融合突变策略 多通路Metropolis 采样步长 接受概率 方差 亮度均匀度
原文传递
多级卷积特征金字塔的细粒度食物图片识别 被引量:7
15
作者 梁华刚 温晓倩 +2 位作者 梁丹丹 李怀德 茹锋 《中国图象图形学报》 CSCD 北大核心 2019年第6期870-881,共12页
目的食物图片具有结构多变、背景干扰大、类间差异小、类内差异大等特点,比普通细粒度图片的识别难度更大。目前在食物图片识别领域,食物图片的识别与分类仍存在精度低、泛化性差等问题。为了提高食物图片的识别与分类精度,充分利用食... 目的食物图片具有结构多变、背景干扰大、类间差异小、类内差异大等特点,比普通细粒度图片的识别难度更大。目前在食物图片识别领域,食物图片的识别与分类仍存在精度低、泛化性差等问题。为了提高食物图片的识别与分类精度,充分利用食物图片的全局与局部细节信息,本文提出了一个多级卷积特征金字塔的细粒度食物图片识别模型。方法本文模型从整体到局部逐级提取特征,将干扰较大的背景信息丢弃,仅针对食物目标区域提取特征。模型主要由食物特征提取网络、注意力区域定位网络和特征融合网格3部分组成,并采用3级食物特征提取网络的级联结构来实现特征由全局到局部的转移。此外,针对食物图片尺度变化大的特点,本文模型在每级食物特征提取网络中加入了特征金字塔结构,提高了模型对目标大小的鲁棒性。结果本文模型在目前主流公开的食物图片数据集Food-101、Chinese Food Net和Food-172上进行实验,分别获得了91.4%、82.8%、90.3%的Top-1正确率,与现有方法相比提高了1%~8%。结论本文提出了一种多级卷积神经网络食物图片识别模型,可以自动定位食物图片区分度较大的区域,融合食物图片的全局与局部特征,实现了食物图片的细粒度识别,有效提高了食物图片的识别精度。实验结果表明,该模型在目前主流食物图片数据集上取得了最好的结果。 展开更多
关键词 食物图片识别 卷积神经网络 注意力网络 细粒度识别 特征金字塔
原文传递
圆形标志投影偏心差补偿算法 被引量:3
16
作者 吴建霖 蒋理兴 +2 位作者 王安成 谷友艺 于彭 《中国图象图形学报》 CSCD 北大核心 2018年第10期1549-1557,共9页
目的圆形标志目前正广泛地应用于各类视觉测量系统,其圆心定位精度决定了测量系统的测量精度。当相机主光轴与标志表面不平行时,圆被映射为椭圆,圆心位置计算产生偏差。光轴与标志表面夹角较大或标志较大等情况下会产生较大的偏心差进... 目的圆形标志目前正广泛地应用于各类视觉测量系统,其圆心定位精度决定了测量系统的测量精度。当相机主光轴与标志表面不平行时,圆被映射为椭圆,圆心位置计算产生偏差。光轴与标志表面夹角较大或标志较大等情况下会产生较大的偏心差进而严重影响系统测量精度。为此,提出一种基于三同心圆圆形标志的投影偏心差补偿算法。方法算法基于三同心圆的圆形标志设计,根据3组椭圆拟合中心坐标解算偏心差模型进行计算补偿。结果针对圆形标志偏心差问题,同心圆补偿算法取得良好效果,有效提升了圆形标志定位精度。仿真结果表明,在拍摄角度、拍摄距离、圆形标志大小不同的情况下,偏心差在像素量级,补偿后偏心差在10-11像素量级。实物实验结果表明,若设计有直径分别为6 cm,12 cm,18 cm的三同心圆标志,经解算补偿结果较以往两同心圆算法精度提高一倍,偏心差值减小80%,测量误差在0. 1 mm左右。结论本文提出了一种新的偏心差补偿算法,利用三同心圆标志增加约束解算偏心差。与以往偏心差补偿算法相比,此方法精度更高,且无需预先平差解算相机与目标的距离、拍摄角等参数,仅需要知道标志圆形半径比例及椭圆中心坐标即可计算补偿,具有很高的实用性,可用于改善基于非编码标志点的深度像匹配、基于圆形标志点的全自动相机标定方法、视觉导航定位等应用中。 展开更多
关键词 偏心差 三同心圆 椭圆拟合 像点误差 视觉定位
原文传递
热带气旋客观定位的红外亮温方差方法 被引量:4
17
作者 张长江 薛利成 +1 位作者 马雷鸣 鲁小琴 《中国图象图形学报》 CSCD 北大核心 2018年第3期450-457,共8页
目的热带气旋(TC)是生成于热带或副热带洋面上的强烈天气系统。在TC的监测分析和预报工作中,准确地确定其中心实时地理位置至关重要。此外,TC的精确位置也是TC强度估计的重要参数。对此,提出一种利用偏差角方差定位TC中心的方法。方法首... 目的热带气旋(TC)是生成于热带或副热带洋面上的强烈天气系统。在TC的监测分析和预报工作中,准确地确定其中心实时地理位置至关重要。此外,TC的精确位置也是TC强度估计的重要参数。对此,提出一种利用偏差角方差定位TC中心的方法。方法首先,从红外卫星云图中截取热带气旋主体云系区域,并分别利用Bezier直方图和K均值聚类方法分割得到主体云系二值图像和红外亮温变化剧烈位置二值图像。其中,主体云系二值图像可将TC的主体云系从卫星红外云图中分割提取出来,用割提取出来的图像进行定位可以剔除掉外散环流的小云块对定位结果的影响;而红外亮温变化剧烈位置二值图像则可分别将TC中心密闭云区,螺旋云带和外散环流的边缘及梯度较大区域分割出来,这些区域是最后TC中心定位的主要依据。将上述两幅二值图像相与得到气旋主体云系红外亮温变化剧烈位置的二值图像,这一步剔除了TC的外散环流,而得到的二值图像便可分别将TC中心密闭云区和螺旋云带的边缘及梯度较大的区域分割出来。然后,对得到的气旋主体云系红外亮温变化剧烈位置二值图像进行Hough变换检测以减小气旋中心的搜索范围。最后,以检测区域内每个像素点为参考中心计算得到偏差角矩阵,并计算偏差角矩阵的方差填入对应检测区域内作为参考中心像素点的位置得到方差矩阵,将方差矩阵中值最小的位置作为气旋中心。因为TC除了少数特别强的时候大多数可以用圆形描述,而绝大多数时候TC要用螺旋线描述,但是具体是几度螺旋线来描述合适很难确定,本文用偏差角的方差就可以衡量这些云带、边缘的偏离状况是否集中,方差越小就表示偏离状况越集中。结果运用该方法对400幅无眼TC红外图像和197幅有眼TC红外图像进行中心定位,分别与中国气象局(CMA)、日本气象厅(JMA)和美国台风预警中心(JTWC)的主观定位结果进行比较并取平均偏差,本文方法对有眼TC定位平均偏差约为27 km,无眼TC平均偏差约为45 km。具体到分别与CMA、JMA和JTWC的比较,对于有眼TC定位偏差分别为26.82 km,26.05 km和27.84 km,无眼TC定位偏差为45.84 km,44.84 km和47.15 km。结论就结果而言,本文方法定位与CMA、JMA的偏差比较接近,与JTWC的偏差较大。就西北太平洋的TC而言,CMA和JMA的定位精度较高,JTWC精度稍低,这是与认知相符合,并且也证明了本文方法具有较高的可信度。此外,本文方法为TC定位提供了新的参考依据。 展开更多
关键词 偏差角方差 Bezier直方图分割 K均值聚类分割 HOUGH变换
原文传递
面向人脸图像发布的差分隐私保护 被引量:5
18
作者 张啸剑 付聪聪 孟小峰 《中国图象图形学报》 CSCD 北大核心 2018年第9期1305-1315,共11页
目的由于人脸图像蕴含着丰富的个人敏感信息,直接发布出来可能会造成个人的隐私泄露。为了保护人脸图像中的隐私信息,本文提出了一种基于傅里叶变换与差分隐私技术相结合的人脸图像发布方法 FIP(facial image publication)。方法将人脸... 目的由于人脸图像蕴含着丰富的个人敏感信息,直接发布出来可能会造成个人的隐私泄露。为了保护人脸图像中的隐私信息,本文提出了一种基于傅里叶变换与差分隐私技术相结合的人脸图像发布方法 FIP(facial image publication)。方法将人脸图像作为实数域2维矩阵,充分利用离散傅里叶变换技术压缩图像。为了有效均衡由拉普拉斯机制引起的噪音误差以及由傅里叶变换导致的重构误差,引入一种基于指数机制的傅里叶系数选择方法 EMK(exponential mechanism-based k coefficients sampling),它能够在不同的系数空间中挑选出合理的傅里叶系数来压缩人脸图像,然后利用拉普拉斯机制对所挑选出的系数添加噪音,进而使整个处理过程满足ε-差分隐私。此外,为了避免较大的傅里叶系数空间导致指数机制挑选系数不准确问题,基于离散实数傅里叶变换的共轭对称特性,提出了一种增强的指数机制挑选傅里叶系数方法 BEMK(boosted exponential mechanism-based k coefficients sampling),该方法不仅进一步压缩离散傅里叶系数空间,而且还能够提高人脸图像发布的精度。结果基于4种真实人脸图像数据集采用支持向量机分类与采用主成分分析技术验证方法的正确性。从算法的准确率、召回率,以及F1-Score度量结果显示,提出的基于离散傅里叶变换技术的人脸图像发布方法均优于直接采用拉普拉斯机制的发布方法 LAP(Laplace mechanism-based publication)。结论实验结果表明,本文方法能够实现满足ε-差分隐私的敏感人脸图像发布,图像分类验证其具有较高的可用性。特别是BEMK方法具有较好的鲁棒性,是一种有效的隐私人脸图像发布方法。 展开更多
关键词 人脸图像处理 隐私保护 差分隐私 傅里叶变换
原文传递
面向水下图像的质量评价方法 被引量:11
19
作者 郭继昌 李重仪 +1 位作者 张艳 顾翔元 《中国图象图形学报》 CSCD 北大核心 2017年第1期1-8,共8页
目的针对目前水下图像质量评价方法少和现有方法存在局限性等问题,提出一种无参考并且无需手工设计特征的水下图像质量评价方法。方法提出的水下图像质量评价方法将深度学习网络框架与随机森林回归模型相结合,首先采用深度神经网络提取... 目的针对目前水下图像质量评价方法少和现有方法存在局限性等问题,提出一种无参考并且无需手工设计特征的水下图像质量评价方法。方法提出的水下图像质量评价方法将深度学习网络框架与随机森林回归模型相结合,首先采用深度神经网络提取水下图像的特征;然后使用提取的特征和标定的水下图像质量分数训练回归模型;最终,利用训练好的回归模型预测水下图像的质量。结果在本文收集的水下图像数据集和水下图像清晰化算法处理结果上评测本文方法,并与多种质量评价方法进行比较,其中包括预测结果与主观质量分数比较、水下图像清晰化结果评测比较、预测结果与主观质量分数相关性比较、鲁棒性比较等。主观实验结果表明本文的评价方法可以相对准确地给出符合人类视觉感知的水下图像质量分数,并且具有更好的鲁棒性。定量实验结果表明本文方法与其他方法相比,预测的图像质量分数与主观分数具有更高的相关性。结论提出的水下图像质量评价方法无需参考图像,省去了手工设计的特征,充分利用了深度学习网络的学习和表征能力。本文方法的准确性较好,普适性和鲁棒性较高,预测的质量分数与人类视觉感知具有较高的一致性。本方法适用于原始的水下图像和水下图像清晰化算法的处理结果。 展开更多
关键词 水下图像 无参考图像质量评价 深度学习 人类视觉感知 水下图像清晰化
原文传递
构建近邻上下文的拷贝图像检索 被引量:2
20
作者 杨醒龙 姚金良 +1 位作者 王小华 方小飞 《中国图象图形学报》 CSCD 北大核心 2017年第8期1098-1105,共8页
目的以词袋模型为基础的拷贝图像检索方法是当前最有效的方法。然而,由于局部特征量化存在信息损失,导致视觉词汇区别能力不足和视觉词汇误匹配增加,从而影响了拷贝图像检索效果。针对视觉词汇的误匹配问题,提出一种基于近邻上下文的拷... 目的以词袋模型为基础的拷贝图像检索方法是当前最有效的方法。然而,由于局部特征量化存在信息损失,导致视觉词汇区别能力不足和视觉词汇误匹配增加,从而影响了拷贝图像检索效果。针对视觉词汇的误匹配问题,提出一种基于近邻上下文的拷贝图像检索方法。该方法通过局部特征的上下文关系消除视觉词汇歧义,提高视觉词汇的区分度,进而提高拷贝图像的检索效果。方法首先,以距离和尺度关系选择图像中某局部特征点周围的特征点作为该特征点的上下文,选取的上下文中的局部特征点称为近邻特征点;再以近邻特征点的信息以及与该局部特征的关系为该局部特征构建上下文描述子;然后,通过计算上下文描述子的相似性对局部特征匹配对进行验证;最后,以正确匹配特征点的个数衡量图像间的相似性,并以此相似性选取若干候选图像作为返回结果。结果在Copydays图像库进行实验,与Baseline方法进行比较。在干扰图像规模为100 k时,相对于Baseline方法,m AP提高了63%。当干扰图像规模从100 k增加到1 M时,Baseline的m AP值下降9%,而本文方法下降3%。结论本文拷贝图像检索方法对图像编辑操作,如旋转、图像叠加、尺度变换以及裁剪有较高的鲁棒性。该方法可以有效地应用到图像防伪、图像去重等领域。 展开更多
关键词 局部特征 视觉词汇 拷贝图像检索 词袋模型 图像检索
原文传递
上一页 1 2 250 下一页 到第
使用帮助 返回顶部