期刊文献+
共找到2,529篇文章
< 1 2 127 >
每页显示 20 50 100
基于包装材料数字图像的RGB颜色空间色差评价方法研究
1
作者 吴桂兵 丁碧军 +5 位作者 程晓地 张钦 陈阳 陈畑 罗红兵 王岩 《包装工程》 CAS 北大核心 2024年第15期169-179,共11页
目的解决包装材料复杂颜色区域色差评价,目测检验方法存在判定标准复杂、结果一致性差等问题。方法提出一种基于包装材料高清数字图像的RGB颜色空间色差评价方法。通过搭建高清数字图像采集装置,获取包装材料标准样(上限、中限、下限)... 目的解决包装材料复杂颜色区域色差评价,目测检验方法存在判定标准复杂、结果一致性差等问题。方法提出一种基于包装材料高清数字图像的RGB颜色空间色差评价方法。通过搭建高清数字图像采集装置,获取包装材料标准样(上限、中限、下限)的全幅数字图像。通过采用RGB颜色空间降维的方法,对标准样测试区域的颜色空间进行离散边界拟合,构建标准样品测试区域的三限样RGB色差模型,与测试样对应测试区域的颜色空间进行对比;根据颜色空间模型的一致性判定测试样色差是否合格。结果对比多种离散边界拟合模型,采用滚球法边缘拟合模型的包含率和多出率分别达到100%、78.9%,模型拟合效果最佳。通过对包装材料色差缺陷样验证测试,采用上述色差评价方法准确率达到100%。结论本文提出的滚球法颜色空间边缘拟合模型和色差评价方法,可实现对包装材料复杂颜色区域的色差合格性判定,有利于提高企业生产的智能化检测水平。 展开更多
关键词 包装材料 数字图像 rgb颜色空间 三限样rgb色差模型 离散边界拟合 色差评价
下载PDF
基于神经辐射场的RGB图像点云重建多肉植物及尺寸测量研究
2
作者 尹令 陈招达 +3 位作者 蓝善贵 杨杰 张素敏 黄琼 《农业机械学报》 EI CAS CSCD 北大核心 2024年第9期316-326,共11页
以多肉植物盆栽为研究对象,使用手持式RGB相机采集11个多肉植物盆栽的视频数据,通过将视频转换为图像帧、选取优质清晰图像帧、计算相机位姿得到含丰富信息的RGB图像数据。提出一种改进神经辐射场的多肉植物三维重建方法,根据实际场景... 以多肉植物盆栽为研究对象,使用手持式RGB相机采集11个多肉植物盆栽的视频数据,通过将视频转换为图像帧、选取优质清晰图像帧、计算相机位姿得到含丰富信息的RGB图像数据。提出一种改进神经辐射场的多肉植物三维重建方法,根据实际场景提出新的射线采样策略,同时引入改进的图像修复模块与隐式模型重建点云方法,并根据点云重建结果提取多肉植株的叶片数、株高、冠围、凸包体积、叶长、叶宽和叶色共7个表型参数。最后选取具有代表性、易测量的叶片数、株高、冠围、叶长和叶宽5个表型参数进行精度评估与误差原因分析,平均绝对百分比误差(MAPE)分别为2.32%、3.95%、4.95%、5.59%和9.55%,均方根误差(RMSE)分别为0.86片和1.95、17.54、1.87、1.27 mm,决定系数(R^(2))分别为0.99、0.99、0.86、0.91和0.89。精度评估结果表明,所提取的表型参数能够准确、高效地反映多肉植株生长状态,充分发挥RGB图像新视角合成技术、图像处理技术与三维点云重建技术的优势,实现多肉植株盆栽的表型参数高精度、非破坏性提取,能够为多肉植物的种植和养育以及为非固定、多视角的RGB数据获取研究提供重要的技术支持。 展开更多
关键词 神经辐射场 三维重建 多肉植物 尺寸测量 植物表型 rgb图像
下载PDF
基于激光雷达与RGB相机融合的玉米作物行检测算法研究
3
作者 江庆 安东 +4 位作者 韩华宇 刘京辉 郭延超 陈黎卿 杨洋 《农业机械学报》 EI CAS CSCD 北大核心 2024年第10期263-274,共12页
针对单一传感器在面对复杂田间环境适应性差的问题,本文提出了一种基于固态激光雷达(LiDAR)与RGB相机融合的玉米作物行检测方法。首先,研究了固态激光雷达和RGB相机联合标定方法,同步获取玉米作物行图像和点云数据并进行数据预处理。然... 针对单一传感器在面对复杂田间环境适应性差的问题,本文提出了一种基于固态激光雷达(LiDAR)与RGB相机融合的玉米作物行检测方法。首先,研究了固态激光雷达和RGB相机联合标定方法,同步获取玉米作物行图像和点云数据并进行数据预处理。然后,将预处理后的图像数据和点云数据融合,实现点云“着色”,基于点云“着色”提出聚类感兴趣密度区域算法。利用“着色”点云完成聚类,并结合作物种植农艺标准(行距),分别验证点云信息和颜色信息的可用性,能够选择最优信息完成作物行感兴趣区域聚类。最后,通过划分点云水平条带的方式确定目标点云的特征点聚类区域,取作物行特征点,并利用最小二乘法拟合作物行检测线。仅需调整行距参数,算法可实现全生命周期的作物行检测,利用正常工况下玉米苗期、前期、中期和后期数据开展算法验证,作物行中心线平均误差不大于1.781°,准确率不小于92.69%,平均耗时不超过102.7 ms。此外,为验证算法鲁棒性,开展了复杂农田背景环境,如高杂草背景、断行、苗期杂草高度与玉米高度相近以及玉米完全封行4种工况作物行检测,算法平均误差不大于1.935°,准确率不小于91.94%,平均耗时不超过108.3 ms。通过讨论阐述了基于点云“着色”开展作物行中心线提取的优越性,本文算法可为作物行中心线可靠检测提供参考。 展开更多
关键词 玉米作物行识别 激光雷达 rgb相机 联合标定 点云“着色”
下载PDF
基于RGB模型的草莓叶片光合作用指标估测
4
作者 樊小雪 李德翠 +1 位作者 李远 任妮 《江苏农业学报》 CSCD 北大核心 2024年第4期675-681,共7页
为了研究基于图像红(R)、绿(G)、蓝(B)颜色参数和叶片SPAD值预测光合作用指标的可行性,以草莓叶片为试验材料,构建多元线性回归模型和反向传播(BP)神经网络模型,对叶片蒸腾速率、气孔导度、净光合速率、胞间CO_(2)浓度进行估测,并对其... 为了研究基于图像红(R)、绿(G)、蓝(B)颜色参数和叶片SPAD值预测光合作用指标的可行性,以草莓叶片为试验材料,构建多元线性回归模型和反向传播(BP)神经网络模型,对叶片蒸腾速率、气孔导度、净光合速率、胞间CO_(2)浓度进行估测,并对其精度进行评价和验证。结果表明,基于BP神经网络模型,使用图像RGB颜色参数和SPAD值对叶片蒸腾速率进行预测的效果较好,其次是气孔导度。BP神经网络模型的估测精度高于多元线性回归模型,蒸腾速率、气孔导度、净光合速率和胞间CO_(2)浓度的模型预测准确率分别达到91.5%、83.3%、74.4%和71.5%。BP神经网络的蒸腾速率模型、气孔导度模型的决定系数(R2)分别为0.9222、0.8423,均方根误差(RMSE)分别为0.0002、0.0259,平均绝对误差(MAE)分别为0.0001、0.0006。由结果可知,通过数码相机采集图像,并构建RGB模型,可简易快速估测草莓叶片蒸腾速率、气孔导度,能用于生产中草莓光合指标的估测。 展开更多
关键词 草莓叶片 rgb模型 光合指标 反向传播(BP)神经网络模型
下载PDF
OLED屏下RGB图像优化算法
5
作者 葛晨阳 李慧 +1 位作者 虎天亮 周艳辉 《微电子学与计算机》 2024年第3期12-20,共9页
全面屏的流行对智能手机前置摄像头提出了屏下高质量拍摄的要求。目前用于屏下拍摄方案的有机发光二极管(Organic Light-Emitting Diode,OLED)透明屏存在光衍射、折射等现象,导致拍摄的RGB图像易产生模糊和细节丢失等问题。针对上述问题... 全面屏的流行对智能手机前置摄像头提出了屏下高质量拍摄的要求。目前用于屏下拍摄方案的有机发光二极管(Organic Light-Emitting Diode,OLED)透明屏存在光衍射、折射等现象,导致拍摄的RGB图像易产生模糊和细节丢失等问题。针对上述问题,提出了一种OLED屏下RGB图像优化算法。针对目前屏下RGB图像优化数据集较少的问题,设计实现了一种基于智能手机的OLED透明屏屏下图像数据采集装置,采集并制作了由10000多组典型场景构成的屏下图像数据集。其次,提出了一种基于生成对抗网络(Generative Adversarial Nets,GAN)的屏下RGB图像优化算法,其中生成器采用残差网络学习屏下图像细节信息,所设计的感知损失函数是颜色损失、对抗损失和内容损失三者的结合。实验结果表明,基于主观视觉和峰值信噪比(Peak Signal-to-Noise Ratio,PSNR)、结构相似性(Structural Similarity,SSIM)等定量评价指标,本文算法在自建数据集上的图像优化效果优于当前的DPED等方法的效果。 展开更多
关键词 OLED透明屏 图像优化 屏下rgb图像 生成对抗网络
下载PDF
用于RGBT跟踪的孪生混合信息融合算法
6
作者 黄颖 杨佳宇 +1 位作者 金家昊 万邦睿 《计算机应用》 CSCD 北大核心 2024年第9期2878-2885,共8页
可见光与热红外跟踪(又称RGBT(RGB-Thermal)跟踪)的核心是有效地利用不同模态的信息,针对决策级融合中单分支产生低质结果影响算法判定目标的问题,提出一个用于RGBT跟踪的孪生混合信息融合算法SiamMIF。首先,使用孪生主干网络(SBN)进行... 可见光与热红外跟踪(又称RGBT(RGB-Thermal)跟踪)的核心是有效地利用不同模态的信息,针对决策级融合中单分支产生低质结果影响算法判定目标的问题,提出一个用于RGBT跟踪的孪生混合信息融合算法SiamMIF。首先,使用孪生主干网络(SBN)进行多模态特征提取;其次,从信噪比的角度分析低质图像对双分支并行决策产生的影响,进而设计了一个信噪比驱动的信息交互模块(IIM)对低信噪比特征进行信息互补;再次,利用双流无锚跟踪头(ADH)对补偿后的特征进行分类回归;最后,采用自适应轻量决策模块(ALDM)对跟踪结果进行融合,并快速判定目标位置。在4个RGBT基准数据集GTOT、RGBT234、VOT-RGBT2019和LasHeR上的实验结果表明,所提算法在LasHeR数据集上的成功率和精确度分别为0.396和0.518,相较于APFNet(Attribute-based Progressive Fusion Network)提升9.4%和3.6%,在其他3个数据集上也能取得较好结果,且在GPU上的帧率能达到40 frame/s。 展开更多
关键词 rgbT跟踪 孪生神经网络 多模态融合策略 信息交互 无锚跟踪头
下载PDF
基于RGB模型的汽车指针仪表示数的识别
7
作者 姜绍君 惠渊博 +1 位作者 欧李庭 高士博 《计量与测试技术》 2024年第1期13-15,共3页
本文对汽车指针仪表示数的识别,提出了一种基于RGB彩色空间图像处理的识别方案。首先,根据仪表盘图像的R、G、B分量的直方图,利用该分量的欧几里德距离法分割仪表盘的圆心和指针;然后,提取圆心的骨架和圆心的坐标,建立新的坐标系;最后,... 本文对汽车指针仪表示数的识别,提出了一种基于RGB彩色空间图像处理的识别方案。首先,根据仪表盘图像的R、G、B分量的直方图,利用该分量的欧几里德距离法分割仪表盘的圆心和指针;然后,提取圆心的骨架和圆心的坐标,建立新的坐标系;最后,将指针的质心和仪表盘的圆心连成一条直线,通过直线位置识别指针读数。实验证明:该方法可用于指针式汽车仪表的自动化测试。 展开更多
关键词 rgb分量 图像分割 指针仪表 示数识别
下载PDF
液晶显示器sRGB特性文件精度分析研究
8
作者 洪亮 《广东印刷》 2024年第1期16-18,共3页
当把一幅彩色图像的RGB值分别输入到不同的颜色设备上时,所输出彩色图像的Lab值将有很大的不同,使彩色图像失真。由于不同设备系统表征颜色的特性不同,所以同一组RGB数据在不同显示器上所呈现出的颜色不同,不同显示器所能表现的颜色范... 当把一幅彩色图像的RGB值分别输入到不同的颜色设备上时,所输出彩色图像的Lab值将有很大的不同,使彩色图像失真。由于不同设备系统表征颜色的特性不同,所以同一组RGB数据在不同显示器上所呈现出的颜色不同,不同显示器所能表现的颜色范围也不同。 展开更多
关键词 彩色图像 rgb 液晶显示器 特性文件 精度分析 Lab值 系统表征 颜色
下载PDF
结合视锥变换和RGB体素图的半监督三维目标检测
9
作者 汪岩 袁甜甜 +1 位作者 胡彬 李尧 《红外与激光工程》 EI CSCD 北大核心 2024年第8期250-261,共12页
基于LiDAR、可见光等多模态传感器的高精度三维目标检测是自动驾驶领域的关键技术。为了提高目标检测的精度和方位感知能力,降低模型对于标注数据的依赖,结合视锥变换方法优化了三维点云方向特征提取策略,提出了一种基于视锥变换和半监... 基于LiDAR、可见光等多模态传感器的高精度三维目标检测是自动驾驶领域的关键技术。为了提高目标检测的精度和方位感知能力,降低模型对于标注数据的依赖,结合视锥变换方法优化了三维点云方向特征提取策略,提出了一种基于视锥变换和半监督学习架构的三维目标检测技术。具体而言,基于通道注意力模块优化视锥体对远距离目标的感知能力,提出了RGB体素模块提升遮挡目标的识别精度。首先通过深度网络从RGB图像中提取纹理信息,将其与激光雷达的距离信息融合,以保持三维空间特征的完整性。其次,通过特征融合模块提取体素空间特征的权重。最后,采用自适应伪标签方法降低对标注样本的依赖,并基于群体投票方法进一步降低误报率。实验结果表明,该方法在KITTI数据集上取得了令人满意的成果,行人和车辆目标检测的准确率分别达到了56.30%和75.88%。该研究为未来在复杂的场景中实现高效的三维目标检测提供了思路,并为进一步优化自动驾驶的多模态数据融合技术奠定了基础。 展开更多
关键词 三维目标检测 rgb体素特征 视锥变换 半监督学习 KITTI数据集
原文传递
基于RGB图像的设施番茄冠层覆盖度估算方法研究
10
作者 邹伟杰 华珊 +3 位作者 徐志福 许敏界 李双伟 鲍文娜 《北方园艺》 CAS 北大核心 2024年第3期41-50,共10页
以番茄为试材,采用设施实验箱育苗的方式,通过设施环境下桁架搭载可见光(RGB)相机系统获取图像数据,研究了不同植被指数算法分割番茄冠层图像的精度,并实现设施番茄冠层覆盖度提取方法的评估,以期为其他设施作物的冠层覆盖度估算提供方... 以番茄为试材,采用设施实验箱育苗的方式,通过设施环境下桁架搭载可见光(RGB)相机系统获取图像数据,研究了不同植被指数算法分割番茄冠层图像的精度,并实现设施番茄冠层覆盖度提取方法的评估,以期为其他设施作物的冠层覆盖度估算提供方法指导。结果表明:EXG算法、EXGR算法和CIVE算法均可用于估算设施番茄的冠层覆盖度,与真值之间的均方根误差(RMSE)分别为0.049、0.078、0.088,决定系数(R^(2))分别为0.911、0.845、0.841,不同植被指数分割算法估算的设施番茄冠层覆盖度之间存在差异,与真值图像相比,EXGR算法在定植10 d的图像分割时,分割精度较低,冠层覆盖度估算值偏大,CIVE算法在定植66 d的图像分割时,由于分割过度,导致冠层覆盖度估算值偏小,而EXG算法在各时期的分割精度较高,冠层覆盖度的估算值与真值之间的吻合度最好。这表明EXG算法能够更有效的实现设施番茄的植土分割且估算精度更高。 展开更多
关键词 设施番茄 rgb图像 植被指数 冠层覆盖度 图像分割
原文传递
基于轻量化目标检测网络的RGB-D视觉SLAM系统
11
作者 戴康佳 徐慧英 +7 位作者 朱信忠 黄晓 李琛 刘巍 曹雨淇 王拔龙 刘子洋 陈国强 《计算机工程与科学》 CSCD 北大核心 2024年第11期2017-2026,共10页
RGB-D SLAM是一种利用深度相机实现同时定位和地图构建的技术。传统的视觉SLAM系统基于对静态环境的假设,然而实际环境中往往存在动态物体,这可能导致SLAM系统的位姿估计出现显著的偏差。针对这一问题,提出了基于轻量化的YOLOv8s目标检... RGB-D SLAM是一种利用深度相机实现同时定位和地图构建的技术。传统的视觉SLAM系统基于对静态环境的假设,然而实际环境中往往存在动态物体,这可能导致SLAM系统的位姿估计出现显著的偏差。针对这一问题,提出了基于轻量化的YOLOv8s目标检测的RGB-D视觉SLAM系统,采用Socket通信方式,将目标检测结果传给SLAM,然后利用Depth Value-RANSAC几何算法剔除检测框内的动态特征点,提高了SLAM系统在动态环境中的定位精度。实验使用TUM数据集进行验证,结果表明,本文系统精度相比ORB-SLAM2有明显提高。与其他SLAM系统相比,本文系统在精度和实时性上有不同程度的改进。 展开更多
关键词 rgb-D SLAM 动态场景 目标检测 几何约束
下载PDF
Converting TREx-RGB green-channel data to 557.7 nm auroral intensity:Methodology and initial results 被引量:2
12
作者 Jun Liang D.M.Gillies +1 位作者 E.Spanswick E.F.Donovan 《Earth and Planetary Physics》 EI CSCD 2024年第1期258-274,共17页
The recently deployed Transition Region Explorer(TREx)-RGB(red-green-blue)all-sky imager(ASI)is designed to capture“true color”images of the aurora and airglow.Because the 557.7 nm green line is usually the brightes... The recently deployed Transition Region Explorer(TREx)-RGB(red-green-blue)all-sky imager(ASI)is designed to capture“true color”images of the aurora and airglow.Because the 557.7 nm green line is usually the brightest emission line in visible auroras,the green channel of a TREx-RGB camera is usually dominated by the 557.7 nm emission.Under this rationale,the TREx mission does not include a specific 557.7 nm imager and is designed to use the RGB green-channel data as a proxy for the 557.7 nm aurora.In this study,we present an initial effort to establish the conversion ratio or formula linking the RGB green-channel data to the absolute intensity of 557.7 nm auroras,which is crucial for quantitative uses of the RGB data.We illustrate two approaches:(1)through a comparison with the collocated measurement of green-line auroras from the TREx spectrograph,and(2)through a comparison with the modeled green-line intensity according to realistic electron precipitation flux measurements from low-Earth-orbit satellites,with the aid of an auroral transport model.We demonstrate the procedures and provide initial results for the TREx-RGB ASIs at the Rabbit Lake and Lucky Lake stations.The RGB response is found to be nonlinear.Empirical conversion ratios or formulas between RGB green-channel data and the green-line auroral intensity are given and can be applied immediately by TREx-RGB data users.The methodology established in this study will also be applicable to the upcoming SMILE ASI mission,which will adopt a similar RGB camera system in its deployment. 展开更多
关键词 TREx rgb green-line aurora auroral transport model
下载PDF
基于RGB图像的三维人手姿态估计技术综述
13
作者 肖一 刘越 《计算机辅助设计与图形学学报》 EI CSCD 北大核心 2024年第2期161-172,共12页
鉴于RGB相机在虚拟现实头盔等移动计算设备中的普遍性,基于RGB图像的三维人手姿态估计技术具有广阔的应用前景和研究价值,近年来已成为计算机视觉领域的一个研究热点.得益于深度学习技术的快速发展,与之相关的三维人手姿态估计算法层出... 鉴于RGB相机在虚拟现实头盔等移动计算设备中的普遍性,基于RGB图像的三维人手姿态估计技术具有广阔的应用前景和研究价值,近年来已成为计算机视觉领域的一个研究热点.得益于深度学习技术的快速发展,与之相关的三维人手姿态估计算法层出不穷.文中回顾和总结了三维人手姿态估计技术.首先简述了三维人手姿态估计的相关工作,指出了其当前面临的挑战;然后梳理了基于RGB图像的三维人手姿态估计算法,对现有的基于参数模型方法和非参数模型方法进行了讨论,分析了每类算法包含的技术方法以及优缺点;之后总结了相关的三维手数据集与评价标准,并比较了每类算法在常用数据集上的表现;最后探讨了该技术的发展前景. 展开更多
关键词 三维人手姿态估计 深度学习 计算机视觉 rgb图像
下载PDF
基于RGB-NIR滤波阵列的引入权重系数的加权引导滤波去马赛克方法
14
作者 吴鑫 徐宝腾 +2 位作者 刘家林 周伟 杨西斌 《光子学报》 EI CAS CSCD 北大核心 2024年第9期40-50,共11页
针对RGB-NIR传感器多光谱成像技术中的去马赛克问题,提出了一种引入权重系数的加权引导滤波去马赛克算法。算法以残差插值为框架,引入加权引导滤波代替引导滤波,通过边缘感知权重因子实现对边缘的检测,提高引导滤波在边缘处的性能。算... 针对RGB-NIR传感器多光谱成像技术中的去马赛克问题,提出了一种引入权重系数的加权引导滤波去马赛克算法。算法以残差插值为框架,引入加权引导滤波代替引导滤波,通过边缘感知权重因子实现对边缘的检测,提高引导滤波在边缘处的性能。算法使用G通道图像作为引导图,首先进行G通道图像的插值,然后通过加权引导滤波的方法插值出R、B、NIR通道的图像。此外,为了解决在引导滤波中计算线性系数时采用简单的平均值的问题,引入权重系数,并通过加权平均的方式计算得到更准确的线性系数。在TokyoTech数据集以及实际器件上测试了该算法。在数据集的实验上,提出的算法比现有的高性能算法在彩色图像和红外图像上峰值信噪比分别高0.38 dB和0.88 dB;在实际器件实验中,不论是在红外光源打开还是关闭的情况下,所提出的算法在多个场景下表现出最低的平均NIQE指标。此外,在红外光源变动前后,提出的算法所得到的图像的平均NIQE变化也是最小的。实验结果表明,该算法的性能优于对比的算法,并且拥有更好的鲁棒性。 展开更多
关键词 rgb-NIR 去马赛克 加权引导滤波 权重系数 鲁棒性
下载PDF
基于RGB-D视觉信息融合的带式输送机煤流量检测方法研究
15
作者 赵鑫 乔铁柱 +2 位作者 冀杰 刘亮亮 武宏旺 《煤炭技术》 CAS 2024年第7期225-229,共5页
在煤矿中,精确测量带式输送机煤流量对于煤矿生产和管理至关重要。为了进一步提高通过机器视觉方式检测带式输送机煤流量的精度,提出一种基于RGB-D视觉信息融合的煤流量检测方法,使用RGB-D相机采集煤流信息后,利用RGB图像对深度图像从... 在煤矿中,精确测量带式输送机煤流量对于煤矿生产和管理至关重要。为了进一步提高通过机器视觉方式检测带式输送机煤流量的精度,提出一种基于RGB-D视觉信息融合的煤流量检测方法,使用RGB-D相机采集煤流信息后,利用RGB图像对深度图像从不同尺度进行增强,运用K-means聚类算法,结合RGB图像对预分割的煤料区域深度图像进一步分割,基于微元法建立煤堆体积计算模型计算煤流量。实验结果表明,该方法的平均检测误差为1.57%,平均耗时263.77 ms,满足实际生产要求,为带式输送机煤流量检测提出了一种新的有效途径。 展开更多
关键词 rgb-D 视觉信息融合 联合双边滤波 K-MEANS算法 煤流量
原文传递
基于多模态RGB-T的显著性目标检测算法
16
作者 刘东 毕洪波 +2 位作者 任思琪 于鑫 张丛 《吉林大学学报(信息科学版)》 CAS 2024年第3期573-578,共6页
针对RGB(Red Green Blue)模态与热度模态信息表征形式不一致,特征信息无法有效挖掘、融合问题,提出了一种新的联合注意力强化网络-FCNet(Feature Sharpening and Cross-modal Feature Fusion Net)。首先,通过双维度注意力机制提升图像... 针对RGB(Red Green Blue)模态与热度模态信息表征形式不一致,特征信息无法有效挖掘、融合问题,提出了一种新的联合注意力强化网络-FCNet(Feature Sharpening and Cross-modal Feature Fusion Net)。首先,通过双维度注意力机制提升图像特征映射能力;然后,利用跨模态特征融合机制捕获目标区域;最后,利用逐层解码结构消除背景干扰,优化检测目标。实验结果表明,该优化改进算法运算参数更少、运算时间更短,且模型整体检测性能均优于现有多模态检测模型性能。 展开更多
关键词 多模态 rgb-热 特征锐化模块 跨模态融合机制
下载PDF
基于特征调节器和双路径引导的RGB-D室内语义分割
17
作者 张帅 雷景生 +2 位作者 靳伍银 俞云祥 杨胜英 《计算机应用研究》 CSCD 北大核心 2024年第5期1594-1600,共7页
针对室内场景图像语义分割结果不精确、显著图粗糙的问题,提出一种基于多模态特征优化提取和双路径引导解码的网络架构(feature regulator and dual-path guidance,FG-Net)。具体来说,设计的特征调节器对每个阶段的多模态特征依次进行... 针对室内场景图像语义分割结果不精确、显著图粗糙的问题,提出一种基于多模态特征优化提取和双路径引导解码的网络架构(feature regulator and dual-path guidance,FG-Net)。具体来说,设计的特征调节器对每个阶段的多模态特征依次进行噪声过滤、重加权表示、差异性互补和交互融合,通过强化RGB和深度特征聚合,优化特征提取过程中的多模态特征表示。然后,在解码阶段引入特征交互融合后丰富的跨模态线索,进一步发挥多模态特征的优势。结合双路径协同引导结构,在解码阶段融合多尺度、多层次的特征信息,从而输出更细致的显著图。实验在公开数据集NYUD-v2和SUN RGB-D上进行,在主要评价指标mIoU上达到48.5%,优于其他先进算法。结果表明,该算法实现了更精细的室内场景图像语义分割,表现出了较好的泛化性和鲁棒性。 展开更多
关键词 室内语义分割 特征调节器 双路径协同引导 rgb-D特征
下载PDF
跨模态交互融合与全局感知的RGB-D显著性目标检测 被引量:1
18
作者 孙福明 胡锡航 +2 位作者 武景宇 孙静 王法胜 《软件学报》 EI CSCD 北大核心 2024年第4期1899-1913,共15页
近年来,RGB-D显著性检测方法凭借深度图中丰富的几何结构和空间位置信息,取得了比RGB显著性检测模型更好的性能,受到学术界的高度关注.然而,现有的RGB-D检测模型仍面临着持续提升检测性能的需求.最近兴起的Transformer擅长建模全局信息... 近年来,RGB-D显著性检测方法凭借深度图中丰富的几何结构和空间位置信息,取得了比RGB显著性检测模型更好的性能,受到学术界的高度关注.然而,现有的RGB-D检测模型仍面临着持续提升检测性能的需求.最近兴起的Transformer擅长建模全局信息,而卷积神经网络(CNN)擅长提取局部细节.因此,如何有效结合CNN和Transformer两者的优势,挖掘全局和局部信息,将有助于提升显著性目标检测的精度.为此,提出一种基于跨模态交互融合与全局感知的RGB-D显著性目标检测方法,通过将Transformer网络嵌入U-Net中,从而将全局注意力机制与局部卷积结合在一起,能够更好地对特征进行提取.首先借助U-Net编码-解码结构,高效地提取多层次互补特征并逐级解码生成显著特征图.然后,使用Transformer模块学习高级特征间的全局依赖关系增强特征表示,并针对输入采用渐进上采样融合策略以减少噪声信息的引入.其次,为了减轻低质量深度图带来的负面影响,设计一个跨模态交互融合模块以实现跨模态特征融合.最后,5个基准数据集上的实验结果表明,所提算法与其他最新的算法相比具有显著优势. 展开更多
关键词 显著性目标检测 跨模态 全局注意力机制 rgb-D检测模型
下载PDF
基于多模态特征交互的RGB-D显著性目标检测 被引量:1
19
作者 高悦 戴蒙 张晴 《计算机工程与应用》 CSCD 北大核心 2024年第2期211-220,共10页
现有的大多数RGB-D显著性目标检测方法利用深度图来提高检测效果,而忽视了其质量的影响。低质量的深度图会对最终显著目标预测结果造成污染,影响显著性检测的性能。为了消除低质量深度图带来的干扰,并准确突出RGB图像中的显著目标,提出... 现有的大多数RGB-D显著性目标检测方法利用深度图来提高检测效果,而忽视了其质量的影响。低质量的深度图会对最终显著目标预测结果造成污染,影响显著性检测的性能。为了消除低质量深度图带来的干扰,并准确突出RGB图像中的显著目标,提出了一个用于多模态特征交互的RGB-D显著性目标检测模型。在编码阶段,设计了一个特征交互模块,其包含三个子模块:用于增强特征表述能力的全局特征采集子模块、用于过滤低质量深度信息的深度特征精炼子模块和用于实现特征融合的多模态特征交互子模块。在解码阶段,逐层融合经过特征交互后的多模态特征,实现多层次特征融合。通过在五个基准数据集上与十二种先进方法进行的综合实验表明,该模型在NLPR、SIP和NJU2K数据集上的指标上均优于其他对比方法,其中在NJU2K数据集上,该模型的性能比第二名在平均F值上提升了0.008,加权F值上提升了0.014,E-measure上提升了0.007,表现出了较好的检测效果。 展开更多
关键词 rgb-D显著性检测 多模态特征 特征交互 特征融合
下载PDF
基于RGB⁃D数据耦合误差处理的CEP⁃SLAM
20
作者 李林其 常敏 +2 位作者 侯晓煜 贾彩琴 庞敏 《中北大学学报(自然科学版)》 CAS 2024年第5期614-627,共14页
针对使用RGB-D相机的VSLAM中RGB-D数据存在耦合误差的问题、现有特征提取方法存在的边点误提取问题及恒速运动模型跟踪稳定性差的问题,基于ORB-SLAM2框架提出了CEP-SLAM算法。算法使用恒加速运动模型来设置待跟踪帧的初始位姿;使用优化... 针对使用RGB-D相机的VSLAM中RGB-D数据存在耦合误差的问题、现有特征提取方法存在的边点误提取问题及恒速运动模型跟踪稳定性差的问题,基于ORB-SLAM2框架提出了CEP-SLAM算法。算法使用恒加速运动模型来设置待跟踪帧的初始位姿;使用优化后的位姿计算帧间视觉里程计并更新恒加速运动模型,结合RGB图与深度图的采集时间差估算位姿偏移,基于该位姿偏移构建对极几何约束,使用二分法查找特征点在深度图对应像素点的位置,对特征点深度进行调整,缓解了RGB-D数据耦合误差对VSLAM的影响;提出一种基于联合方法的关键帧边点剔除算法,通过利用特征点在深度图的邻域信息对待插入关键帧中存在的不良边点进行判断和剔除。使用本文提出的CEP-SLAM算法在TUM公共数据集上进行实验,结果表明本文算法较好地剔除了不良边点,与经典算法相比有更好的鲁棒性、跟踪稳定性和更高的定位精度。 展开更多
关键词 rgb-D相机 VSLAM 恒加速运动模型 视觉里程计 耦合误差
下载PDF
上一页 1 2 127 下一页 到第
使用帮助 返回顶部