期刊文献+
共找到211,404篇文章
< 1 2 250 >
每页显示 20 50 100
局部特征增强的磁共振图像Transformer重构 被引量:1
1
作者 熊承义 陈文旗 +2 位作者 高志荣 马帅 李帆 《中南民族大学学报(自然科学版)》 CAS 2025年第1期50-57,共8页
研究了一种基于多头自注意力与卷积特征融合的磁共振图像Transformer重构方法.采用U型网络结构,通过学习图像的多尺度特征以提升重构性能.采用深度分离卷积与多头自注意力融合的Swin Transformer结构,改善网络的特征学习能力.在CC359-Br... 研究了一种基于多头自注意力与卷积特征融合的磁共振图像Transformer重构方法.采用U型网络结构,通过学习图像的多尺度特征以提升重构性能.采用深度分离卷积与多头自注意力融合的Swin Transformer结构,改善网络的特征学习能力.在CC359-Brain数据集下基于多种采样模式进行仿真实验,结果证明了该方法在提升磁共振图像重构质量与降低系统复杂度方面的有效性. 展开更多
关键词 磁共振成像 卷积神经网络 变换器 深度学习
下载PDF
基于计算机视觉的藏式古建筑石砌体壁画墙裂缝生长变形监测 被引量:1
2
作者 杨娜 王烁 汪德佳 《工程力学》 北大核心 2025年第1期129-142,共14页
对单一背景下裂缝的定期检测研究已取得一定成果,但对复杂背景下裂缝预防性长期生长变形监测的研究尚处于起步阶段。该文综合古建筑壁画墙变形微量和不宜扰动的特点,基于计算机视觉研究了传统图像分割处理技术和裂缝图像智能语义分割神... 对单一背景下裂缝的定期检测研究已取得一定成果,但对复杂背景下裂缝预防性长期生长变形监测的研究尚处于起步阶段。该文综合古建筑壁画墙变形微量和不宜扰动的特点,基于计算机视觉研究了传统图像分割处理技术和裂缝图像智能语义分割神经网络模型,建立了一套非接触式、预防性生长变形监测系统。为降低壁画墙裂缝特有的彩绘壁画、环境光照及噪声等干扰,有效地将裂缝从复杂背景中分离出来,在传统阈值分割算法系统中,通过SIFT特征匹配和单应性矩阵的求解,解决图像视角差异问题,通过对比不同滤波算法,选择更适用于壁画墙裂缝分割的双边滤波算法与阈值分割相结合的监测算法;在智能语义分割系统中,采用多层卷积、采样和拼接等操作,去除多余特征,重构裂缝高级语义特征图,选择多步优化策略改进原U-Net模型网络架构,提升模型测试平均准确率至0.9899。监测12天典型藏式古建筑石砌体壁画墙裂缝,提取裂缝轮廓及裂缝骨架线等相关特征参数作为关键指标定量描述裂缝生长变化信息,发现:传统阈值分割算法二维特征指标(如裂缝面积、密度、宽度)的变异系数COV值处于4.50%~6.52%,改进的U-Net模型将传统方案中数据波动最大的裂缝面积COV由6.52%降至3.53%,提高了监测系统对壁画色彩、光照和阴影干扰的鲁棒性;系统中两类算法分别处理了不同视角下的同一裂缝的12张图像,输出的数据具备均匀一致性,COV不超过7%,证明了该监测系统为壁画墙裂缝的生长变形提供实时无损监测的技术可行性。 展开更多
关键词 藏式古建筑壁画墙 裂缝 阈值分割算法 神经网络模型 特征参数
下载PDF
基于通道注意力机制增强DGNN的外骨骼机器人步态相位预测 被引量:1
3
作者 颜建军 许赢家 +2 位作者 林越 金理 江金林 《华东理工大学学报(自然科学版)》 北大核心 2025年第1期110-118,共9页
利用一种基于通道注意力机制增强的有向图神经网络(Channel Attention Enhanced Directed Graph Neural Network,CA-DGNN)的外骨骼机器人步态相位预测方法,提高了步态相位预测的准确性和可靠性。首先,研制了人体下肢姿态信息采集装置,... 利用一种基于通道注意力机制增强的有向图神经网络(Channel Attention Enhanced Directed Graph Neural Network,CA-DGNN)的外骨骼机器人步态相位预测方法,提高了步态相位预测的准确性和可靠性。首先,研制了人体下肢姿态信息采集装置,采集人体下肢的行走步态数据并构建人体下肢的骨架模型;之后,建立了基于CA-DGNN步态相位的预测模型,提取人体步态相位的运动特征,并基于当前时刻数据预测未来时刻的步态相位;最后,探讨了滑动窗口大小对算法性能的影响。本文提高了外骨骼机器人步态相位预测的准确性和鲁棒性,为此方向研究提供了一种新的思路和方法。 展开更多
关键词 步态相位预测 惯性传感器 骨架 时空图卷积网络 通道注意力机制
下载PDF
基于ViT-CNN特征增强的图像超分辨率 被引量:1
4
作者 高志荣 孙清清 +2 位作者 熊承义 李帆 郑瑞华 《中南民族大学学报(自然科学版)》 2025年第2期253-259,共7页
卷积神经网络(CNN)可以提取图像的局部相关特征,视觉Transformer(ViT)则侧重于捕获图像的远距离依赖关系,二者有效结合能够改进图像的重构质量.研究了一种基于ViT-CNN特征增强的图像超分辨率(SR)网络.具体来说,网络包含了基于ViT的SR分... 卷积神经网络(CNN)可以提取图像的局部相关特征,视觉Transformer(ViT)则侧重于捕获图像的远距离依赖关系,二者有效结合能够改进图像的重构质量.研究了一种基于ViT-CNN特征增强的图像超分辨率(SR)网络.具体来说,网络包含了基于ViT的SR分支与基于CNN的梯度分支,SR分支主要用于提取图像特征域中的全局相关性,而梯度分支则专注于图像梯度域中的局部依赖关系.通过对两种信息的融合与渐进增强,获得高倍放大的重构图像.此外,在网络的学习阶段引入了梯度损失及渐进训练策略,有效降低了网络的训练难度并增强了训练的稳定性.在多个公开数据集上的大量实验结果验证了所提方法在改善重构系统性能方面的有效性. 展开更多
关键词 图像超分辨率 卷积神经网络 视觉Transformer 特征融合
下载PDF
基于改进DGCNN的树木点云分割方法
5
作者 刘超 卜鑫荣 +3 位作者 刘慧 杨官学 沈跃 徐婕 《南京农业大学学报》 CAS 北大核心 2025年第1期240-248,共9页
[目的]通过目标分割为果园喷雾机提供树木的表征信息,使喷雾机能够实现精准喷雾。在分割过程中,对苗圃中的树冠、树干等不同部位进行分割,可以帮助喷雾机对喷雾部分对靶,在果园或苗圃景观中实现自动导航以及精准喷药等操作。与图片相比... [目的]通过目标分割为果园喷雾机提供树木的表征信息,使喷雾机能够实现精准喷雾。在分割过程中,对苗圃中的树冠、树干等不同部位进行分割,可以帮助喷雾机对喷雾部分对靶,在果园或苗圃景观中实现自动导航以及精准喷药等操作。与图片相比,点云能够更好地表征树木的三维结构并且受照明条件影响小,因此针对点云树木设计分割算法更适合应用在果园、苗圃等室外环境作业的农业机械。[方法]本文基于DGCNN提出了一种分割精度准确、参数量小的树木点云分割网络——TSNet,它可以很容易被部署在果园喷雾机上。该网络主要具有以下特点:1)该网络是基于DGCNN改进的,可以更好实现点云分割任务;2)网络引入了连续递归门控卷积模块(g^(n)Conv),可以提高树木分割的准确率;3)为避免全局信息损失并增加信息传递效率,我们设计了权重通道用于特征传递。[结果]TSNet分割树木的mIoU达到90.08%,模型大小为0.72 M,优于PointNet、PointNet++、DGCNN、CurveNet、PointMLP和D-PointNet++等常用的点云分割算法。[结论]TSNet能够为苗圃树木检测识别和农业机器人作业提供更准确的感知信息。 展开更多
关键词 点云 树木分割 深度学习 精准喷雾 果园喷雾机
下载PDF
文化遗产数字化保护与应用研究综述
6
作者 耿国华 高健 +7 位作者 汤汶 张敏 曾升 高宏娟 王小凤 许阳 张雨禾 周明全 《西北大学学报(自然科学版)》 北大核心 2025年第1期1-22,共22页
中国拥有丰富多样的物质与非物质文化遗产,利用数字化技术进行文化遗产的建模、保护与展示,已成为文化遗产保护领域以及计算机图形学、计算机视觉等相关领域的研究热点。西北大学文化遗产数字化国家地方联合工程研究中心主要在三代文物... 中国拥有丰富多样的物质与非物质文化遗产,利用数字化技术进行文化遗产的建模、保护与展示,已成为文化遗产保护领域以及计算机图形学、计算机视觉等相关领域的研究热点。西北大学文化遗产数字化国家地方联合工程研究中心主要在三代文物采集建模设备、智慧博物馆建设、陶瓷器文物虚拟复原、古代人物面貌复原以及秦腔的智能媒体融合全息展演5个方面展开研究。然而,由于物质文化遗产与非物质文化遗产的本质不同,在建模方法、修复保护技术以及展示形式方面遇到诸多挑战:①现有文物数字化建模设备效率不高,且需要大量人工干预;②文物种类繁多、特征复杂、形态各异、语义丰富,需要开发适合中国文物的知识抽取和知识图谱构建方法,以实现高效的文物组织与展示;③对破损文物碎片的形状表示、描述方法以及自动重组的研究;④古代人物面貌的虚拟复原及性别和种族的识别;⑤全息展演技术面临高计算性能需求、艺术与技术融合的精准度、硬件兼容性、实时性、沉浸感和互动性等挑战。针对这5个方面的需求和挑战,首先,对近些年的相关领域的研究进行综述;然后,总结西北大学文化遗产数字化国家地方联合工程研究中心的系列成果;最后,对文化遗产数字化领域的未来研究方向进行展望。 展开更多
关键词 文化遗产数字化 智慧博物馆 文物虚拟复原 知识图谱 全息展演技术
下载PDF
基于驾驶上下文感知的驾驶员识别模型
7
作者 杨林 张磊 +2 位作者 刘佰龙 梁志贞 张雪飞 《计算机工程与科学》 北大核心 2025年第3期548-560,共13页
随着隐私保护意识的提升,利用车辆轨迹识别汽车驾驶员已成为车辆数据分析热点。然而,现有模型难以准确捕捉驾驶风格与驾驶上下文之间的关系,导致识别准确率不高。因此,提出基于驾驶上下文感知的驾驶员识别模型CDIM。CDIM利用轨迹数据计... 随着隐私保护意识的提升,利用车辆轨迹识别汽车驾驶员已成为车辆数据分析热点。然而,现有模型难以准确捕捉驾驶风格与驾驶上下文之间的关系,导致识别准确率不高。因此,提出基于驾驶上下文感知的驾驶员识别模型CDIM。CDIM利用轨迹数据计算车辆运动特征,同时通过路网匹配获取出行路线,并设计基于双向Transformer的路段信息嵌入模块,为出行路线中每一段路段生成融合邻接路段特征的嵌入。然后,通过卷积跨模态注意力融合模块结合路段特征与运动特征,实现二者的高效融合。此外,结合外部因素特征,全面捕捉驾驶上下文对驾驶风格的影响。在公开数据集上的实验结果表明,CDIM的识别准确率为68.54%,相较于RM-Driver与Doufu分别提高了8.14%和4.81%,具有更高的驾驶员识别准确率。 展开更多
关键词 驾驶员识别 表示学习 上下文感知 特征融合
下载PDF
基于机器视觉的海鲜花螺分类研究
8
作者 陈林涛 陈睿 +2 位作者 蓝莹 梁国健 牟向伟 《水生生物学报》 北大核心 2025年第2期138-145,共8页
针对目前人工分选海鲜花螺劳动强度大、人工成本高的问题,研究提出一种DPO-SVM海鲜花螺公母分类模型。通过灰度共生矩阵分析提取海鲜花螺外壳间隔纹理特征量,采用SVM作为公母分类模型基体,对不同纹理特征量组合进行分类效果对比,得出使... 针对目前人工分选海鲜花螺劳动强度大、人工成本高的问题,研究提出一种DPO-SVM海鲜花螺公母分类模型。通过灰度共生矩阵分析提取海鲜花螺外壳间隔纹理特征量,采用SVM作为公母分类模型基体,对不同纹理特征量组合进行分类效果对比,得出使用能量、熵、对比度3种特征量分类效果最好的结论。针对SVM优化问题,以PSO和WOA算法为基础提出DPO算法对SVM的重要参数c、g进行优化;对DPO-SVM性能进行测试,将测试结果与SVM、PSO-SVM、WOA-SVM测试结果对比。相比于其他3种SVM模型,DPOSVM分类准确率大幅度提升,相比于SVM,分类总准确率由85%上升至100%,上升了15%;DPO算法提高了单种群优化算法的寻优性能,相比于PSO算法,DPO算法将最佳适应度从95.26提升至98.68,提升幅度为3.47%。此外,达到最佳适应度的迭代次数由14次减少至6次,下降57.14%,显著优化了收敛速度。研究结果可为自动分拣装置中海鲜花螺公母分类提供技术参考。 展开更多
关键词 机器视觉 花螺分选 外壳 纹理特征 支持向量机 算法
下载PDF
基于卷积和Transformer的矿物拉曼光谱分类方法
9
作者 耿磊 仇怀志 +2 位作者 肖志涛 张芳 吴骏 《天津工业大学学报》 北大核心 2025年第1期53-61,共9页
针对矿物类别众多、存在环境杂质等干扰信息以及部分拉曼光谱存在相似性等问题,结合拉曼光谱时域和频域上多尺度特征信息,提出一种基于卷积结构和自注意力结构的双分支分类网络RT-Net(Residual-Transformer Net)。该网络利用卷积块搭建... 针对矿物类别众多、存在环境杂质等干扰信息以及部分拉曼光谱存在相似性等问题,结合拉曼光谱时域和频域上多尺度特征信息,提出一种基于卷积结构和自注意力结构的双分支分类网络RT-Net(Residual-Transformer Net)。该网络利用卷积块搭建局部特征提取模块,引入通道注意力增强局部特征提取能力;利用自注意力结构学习拉曼光谱频域中的双向依赖关系来提取全局特征信息,由注意力融合模块进行多尺度特征融合用以分类。实验结果表明:RT-Net实现了对于1321类矿物拉曼光谱快速准确的分类,分类准确率达到90.31%;此外,在精准率、召回率和F1得分3个评估指标上分别达到了0.8781、0.9066和0.8972,进一步验证了RT-Net的有效性。 展开更多
关键词 矿物分类 拉曼光谱 频域 注意力机制 多尺度融合
下载PDF
基于改进Res2Net与迁移学习的水果图像分类
10
作者 吴迪 肖衍 +2 位作者 沈学军 万琴 陈子涵 《电子科技大学学报》 北大核心 2025年第1期62-71,共10页
针对传统水果图像分类算法特征学习能力弱和细粒度特征信息表示不强的缺点,提出一种基于改进Res2Net与迁移学习的水果图像分类算法。首先,针对网络结构,在Res2Net的残差单元中引入动态多尺度融合注意力模块,对各种尺寸的图像动态地生成... 针对传统水果图像分类算法特征学习能力弱和细粒度特征信息表示不强的缺点,提出一种基于改进Res2Net与迁移学习的水果图像分类算法。首先,针对网络结构,在Res2Net的残差单元中引入动态多尺度融合注意力模块,对各种尺寸的图像动态地生成卷积核,利用meta-ACON激活函数优化ReLU激活函数,动态学习激活函数的线性和非线性,自适应选择是否激活神经元;其次,采用基于模型迁移的训练方式进一步提升分类的效率与鲁棒性。实验结果表明,该算法在Fruit-Dataset和Fruits-360数据集上的测试准确率相比Res2Net提升了1.2%和1.0%,召回率相比Res2Net提升了1.13%和0.89%,有效提升了水果图像分类性能。 展开更多
关键词 图像分类 Res2Net 动态多尺度融合注意力 激活函数 迁移学习
下载PDF
基于TLF-YOLOv8的堆叠垃圾实例分割算法
11
作者 李利 梁晶 +2 位作者 陈旭东 潘红光 寇发荣 《科学技术与工程》 北大核心 2025年第5期2009-2018,共10页
相较于一般场景下的图像实例分割,复杂堆叠场景下的实例分割受到严重遮挡、同类别待测物体堆叠等复杂情况的影响,使得其实例分割具有更大的难度。针对具有复杂堆叠场景下的垃圾实例分割问题,提出了一种融合YOLOv8与双层特征网络策略的... 相较于一般场景下的图像实例分割,复杂堆叠场景下的实例分割受到严重遮挡、同类别待测物体堆叠等复杂情况的影响,使得其实例分割具有更大的难度。针对具有复杂堆叠场景下的垃圾实例分割问题,提出了一种融合YOLOv8与双层特征网络策略的实例分割算法。首先,在数据预处理部分进行特征数据分层,并通过双层图卷积网络(graph convolutions network,GCN)实现双分支特征融合,减弱堆叠情况对被遮挡物体特征的影响,从而解决复杂堆叠遮挡下的实例分割问题。同时,为了解决同类待测物体易混淆的问题,融入了软阈值化非极大值抑制算法和新的交并比算法。最后,根据应用场景和数据集的复杂性,优化了主干网络部分的特征提取模块,并在主干网络部分引入了多尺度注意力机制,有效提高了模型的检测性能。实验使用遮挡垃圾分类实例分割数据集,实验结果表明该方法的平均准确率、交并比阈值为0.5时的平均准确率(AP_(50))、交并比为0.5~0.95时的平均准确率(AP_(50~95))等指标较之前的其他方法更优。相较于原YOLOv8算法,检测AP_(50)提高了7.9%,分割AP_(50)提高了5.4%,具有更好的检测和分割效果。 展开更多
关键词 垃圾堆叠 双层特征解耦融合 YOLOv8算法 软阈值化非极大值抑制 动态非单调聚焦机制 期望最大化注意力
下载PDF
融合时序与全局上下文特征增强的弱监督动作定位
12
作者 党伟超 范英豪 +1 位作者 高改梅 刘春霞 《计算机应用》 北大核心 2025年第3期963-971,共9页
针对现有的弱监督动作定位研究中将视频片段视为单独动作实例独立处理带来的动作分类及定位不准确问题,提出一种融合时序与全局上下文特征增强的弱监督动作定位方法。首先,构建时序特征增强分支以利用膨胀卷积扩大感受野,并引入注意力... 针对现有的弱监督动作定位研究中将视频片段视为单独动作实例独立处理带来的动作分类及定位不准确问题,提出一种融合时序与全局上下文特征增强的弱监督动作定位方法。首先,构建时序特征增强分支以利用膨胀卷积扩大感受野,并引入注意力机制捕获视频片段间的时序依赖性;其次,设计基于高斯混合模型(GMM)的期望最大化(EM)算法捕获视频的上下文信息,同时利用二分游走传播进行全局上下文特征增强,生成高质量的时序类激活图(TCAM)作为伪标签在线监督时序特征增强分支;再次,通过动量更新网络得到体现视频间动作特征的跨视频字典;最后,利用跨视频对比学习提高动作分类的准确性。实验结果表明,交并比(IoU)取0.5时,所提方法在THUMOS'14和ActivityNet v1.3数据集上分别取得了42.0%和42.2%的平均精度均值(mAP),相较于CCKEE(Cross-video Contextual Knowledge Exploration and Exploitation)方法,在mAP分别提升了2.6与0.6个百分点,验证了所提方法的有效性。 展开更多
关键词 弱监督动作定位 时序类激活图 动量更新 伪标签监督 特征增强
下载PDF
基于视觉触觉双重迁移学习的番茄成熟度检测方法
13
作者 张鹏 杜东峰 +2 位作者 李爽 单东日 陈振学 《农业机械学报》 北大核心 2025年第1期74-83,共10页
针对当前自动化采摘过程中仅依赖视觉技术无法准确识别番茄成熟度的问题,提出了一种基于视觉触觉双重迁移学习的番茄成熟度检测方法。该方法首先采用视觉触觉双重迁移学习融合算法作为特征提取融合模块,解决无法有效提取番茄特征信息的... 针对当前自动化采摘过程中仅依赖视觉技术无法准确识别番茄成熟度的问题,提出了一种基于视觉触觉双重迁移学习的番茄成熟度检测方法。该方法首先采用视觉触觉双重迁移学习融合算法作为特征提取融合模块,解决无法有效提取番茄特征信息的问题。其次,将软参数共享-多标签分类方法作为分类模块,通过增加不同分类任务之间的关联性,避免出现过拟合的现象。本文主要针对成熟后为红、黄果等单一颜色的番茄品种,并在新开发的视觉触觉数据集进行实验研究。实验表明,软参数共享-多标签检测模型参数量为1.882×10^(7),成熟度AUC分值达到0.9773,对比不确定性加权损失、自适应硬参数共享、十字绣网络和软参数共享等检测模型,参数量分别下降3.08×10^(6)、6.16×10^(6)、3.08×10^(6)和3.08×10^(6),成熟度AUC分值分别提高0.0175、0.0179、0.0267和0.0089。这表明该方法在一定程度上提高了自动化采摘过程中对番茄成熟度的检测能力,为番茄成熟度检测问题提供了一种有效的解决方法。 展开更多
关键词 番茄成熟度 机器视觉 机器触觉 双重迁移学习 软参数共享-多标签
下载PDF
融合深度残差网络与注意力机制的驾驶人行为检测方法研究
14
作者 陈运星 崔军华 +2 位作者 吴钊 吴华伟 袁星宇 《重庆理工大学学报(自然科学)》 北大核心 2025年第3期34-42,共9页
为提高驾驶人行为检测的准确性及模型的可解释性,提出了一种融合深度残差网络与注意力机制的驾驶人行为检测模型。利用深度残差网络提取特征模块的优势,对比不同层数的网络模型结果,选取合适的网络模型作为基础网络;为剔除无用信息对驾... 为提高驾驶人行为检测的准确性及模型的可解释性,提出了一种融合深度残差网络与注意力机制的驾驶人行为检测模型。利用深度残差网络提取特征模块的优势,对比不同层数的网络模型结果,选取合适的网络模型作为基础网络;为剔除无用信息对驾驶行为的干扰,引入SE Block注意力机制并对图像进行特征提取和分类预测;通过与其他模型的对比试验、消融试验和特征可视化试验验证所提出模型的性能。结果表明:与其他检测模型相比,所提出模型的平均分类准确率为99.89%,其展现出更优的性能;采用Grad-CAM可视化方法解释模型的关注区域,所提出模型更精准地关注对驾驶行为判定的关键特征,进一步增强了本模型的可解释性,提高了人们对驾驶行为检测模型的信任性。 展开更多
关键词 深度学习 驾驶人行为检测 深度残差网络 注意力机制 神经网络可视化
下载PDF
改进YOLOv8n的选通图像目标检测算法
15
作者 田青 王颖 +1 位作者 张正 羊强 《计算机工程与应用》 北大核心 2025年第2期124-134,共11页
激光选通成像技术在复杂环境下表现出色,但选通图像为灰度图像无法提供颜色信息,并且对比度较低,所以在进行小目标和遮挡目标检测时更加困难。为解决以上问题提出了一种改进YOLOv8n的选通图像目标检测算法。在特征提取的主干网络部分,... 激光选通成像技术在复杂环境下表现出色,但选通图像为灰度图像无法提供颜色信息,并且对比度较低,所以在进行小目标和遮挡目标检测时更加困难。为解决以上问题提出了一种改进YOLOv8n的选通图像目标检测算法。在特征提取的主干网络部分,使用大核卷积C2f-DSF更有效地捕获输入数据的全局信息。添加了多头注意力检测头Detect-SEAM模块,增强了特征提取和目标识别的能力。为了获取不同感受野的上下文信息,增强特征提取能力,使用了SPPF-M模块。采用上采样算子Dysample,减少特征信息的损失,从而提高小目标的检测精度。改进的YOLOv8n算法在选通图像数据集上mAP@0.5提高了2.4个百分点,mAP@0.5:0.95提高了1.8个百分点。为了验证改进的YOLOv8n算法的泛化性,选取KITTI数据集实验,相比于YOLOv8n算法改进YOLOv8n的mAP@0.5提高了4.3个百分点,mAP@0.5:0.95提高了3.5个百分点。 展开更多
关键词 选通图像 YOLOv8n 遮挡目标 小目标 大卷积核
下载PDF
融合人体感知和多模态手势的人机交互方法和系统设计
16
作者 禹鑫燚 张鑫 +1 位作者 许成军 欧林林 《高技术通讯》 北大核心 2025年第2期183-197,共15页
针对现有受限于预编码形式的人机交互(human-robot interaction,HRI)无法感知人员交互意图而缺乏灵活性和不同任务场景的泛化性问题,提出融合人体感知和多模态手势的人机交互方法。首先,设计融合人体感知的多模态手部检测方法,以人体姿... 针对现有受限于预编码形式的人机交互(human-robot interaction,HRI)无法感知人员交互意图而缺乏灵活性和不同任务场景的泛化性问题,提出融合人体感知和多模态手势的人机交互方法。首先,设计融合人体感知的多模态手部检测方法,以人体姿态为先验得到多模态手部特征,动态适应不同检测距离,实现多人交互手势的在线检测并建立交互指令与人员身份的对应关系;其次,基于手部检测结果采集多模态交互手势数据集并构建通用手势交互指令集;然后,设计多模态手势交互指令融合识别方法,通过数据增强和手势旋转映射减少复杂场景对识别的影响;最后,构建人机交互方法框架。实验结果表明,本文提出的手部检测方法具有实际可用性;融合识别方法准确率达到99%以上,性能优于单一模态,与其他方法相比具有较好性能。通过人机协作拼装、人机协作搬运以及任务点记录和复现等典型人机交互任务,验证了所提人机交互方法的可行性和有效性。 展开更多
关键词 人机交互 人体感知 多模态手势识别 交互任务
下载PDF
多尺度注意力网络的水下图像增强算法
17
作者 陈海秀 陆康 +2 位作者 何珊珊 刘磊 颜秋叙 《机械科学与技术》 北大核心 2025年第3期505-512,共8页
针对水下环境中的图像存在严重的偏色、模糊等问题,该文提出了一种新型的生成对抗网络。采用U-Net作为生成网络的基础模型并对其进行了改进,首先将注意力机制引入到网络中,并设计多尺度特征提取模块,来提取不同层次的特征。其次通过预... 针对水下环境中的图像存在严重的偏色、模糊等问题,该文提出了一种新型的生成对抗网络。采用U-Net作为生成网络的基础模型并对其进行了改进,首先将注意力机制引入到网络中,并设计多尺度特征提取模块,来提取不同层次的特征。其次通过预处理操作输入白平衡图像提升模型的鲁棒性。为解决单一损失造成图像细节恢复不均匀的问题,在传统的对抗损失函数中联合L1损失与内容损失。实验结果表明:此方法在水下图像的颜色恢复和提高清晰度方面具有很好的效果,其中结构相似度、峰值信噪比、水下彩色质量评估和水下图像质量度量的平均值分别为0.8906、29.0761、0.4454和3.1810。在主观评价和客观评价指标上,综合来说该文算法实验结果均优于对比算法。 展开更多
关键词 水下图像增强 生成对抗网络 注意力机制 多尺度
下载PDF
探索非零位置约束:算法-硬件协同设计的DNN稀疏训练方法
18
作者 王淼 张盛兵 张萌 《西北工业大学学报》 北大核心 2025年第1期119-127,共9页
设备上的学习使得边缘设备能连续适应人工智能应用的新数据。利用稀疏性消除训练过程中的冗余计算和存储占用是提高边缘深度神经网络(deep neural network,DNN)学习效率的关键途径。然而由于缺乏对非零位置的假设,往往需要昂贵的代价用... 设备上的学习使得边缘设备能连续适应人工智能应用的新数据。利用稀疏性消除训练过程中的冗余计算和存储占用是提高边缘深度神经网络(deep neural network,DNN)学习效率的关键途径。然而由于缺乏对非零位置的假设,往往需要昂贵的代价用于实时地识别和分配零的位置以及对不规则计算的负载均衡,这使得现有稀疏训练工作难以接近理想加速比。如果能提前预知训练过程中操作数的非零位置约束规则,就可以跳过这些处理开销,从而提升稀疏训练性能和能效比。针对稀疏训练过程,面向边缘场景中典型的3类激活函数探索操作数之间的位置约束规则,提出:①一个硬件友好的稀疏训练算法以减少3个阶段的计算量和存储压力;②一个高能效的稀疏训练加速器,能预估非零位置使得实时处理代价被并行执行掩盖。实验表明所提出的方法比密集加速器和2个其他稀疏训练工作的能效比分别提升了2.2倍,1.38倍和1.46倍。 展开更多
关键词 稀疏训练 非零位置约束 DNN 稀疏加速器
下载PDF
基于管件结构点云配准的激光SLAM算法
19
作者 朱江 游泽炀 +2 位作者 宋伟 朱世强 郑涛 《中国惯性技术学报》 北大核心 2025年第1期10-17,共8页
管道巡检机器人执行天然气管道内部任务的重要前提是具备定位建图能力。主流激光同步定位与地图构建(SLAM)技术在管道环境中面临两大问题:显著特征点数量不足和点云难以配准。这些问题导致SLAM算法定位精度降低,稳定性差。为了解决该问... 管道巡检机器人执行天然气管道内部任务的重要前提是具备定位建图能力。主流激光同步定位与地图构建(SLAM)技术在管道环境中面临两大问题:显著特征点数量不足和点云难以配准。这些问题导致SLAM算法定位精度降低,稳定性差。为了解决该问题,在FAST-LIO2的基础上提出了一种基于管件结构点云配准的激光SLAM算法。首先,针对特征点数量不足的问题,通过融合管件形状的几何先验,优化了特征提取算法。其次,针对管道中点云的几何特征配准退化问题,提出一种基于管件结构信息的配准优化方法,提取出管件的结构信息并根据管件类型进行配准。最后,通过实验结果证明所提算法较FAST-LIO2算法在管道环境下具有更好的定位精度和鲁棒性,定位精度(均方根误差)提升了30%,为管道机器人定位建图提供了一种可行的方案。 展开更多
关键词 激光SLAM 管件 退化环境 点云配准
下载PDF
基于I_CBAM-DenseNet模型的小麦发育期识别研究
20
作者 付景枝 马悦 +4 位作者 宏观 刘云平 吴文宇 丁明明 尹泽凡 《南京信息工程大学学报》 北大核心 2025年第1期42-52,共11页
针对我国农作物发育期人工观测效率低、识别准确率不高等问题,提出一种基于I_CBAM-DenseNet模型的小麦发育期识别方法.该方法以密集连接卷积网络(DenseNet)为主干提取网络,融入卷积块注意模块CBAM.先将CBAM中的空间注意力模块(SAM)与通... 针对我国农作物发育期人工观测效率低、识别准确率不高等问题,提出一种基于I_CBAM-DenseNet模型的小麦发育期识别方法.该方法以密集连接卷积网络(DenseNet)为主干提取网络,融入卷积块注意模块CBAM.先将CBAM中的空间注意力模块(SAM)与通道注意力模块(CAM)由传统的串联连接改为并行连接,并将改进的CBAM(I_CBAM)插入到DenseNet最后一个密集网络中,构建一种I_CBAM-DenseNet模型,再选取小麦7个重要发育时期进行自动识别.为最大化提取小麦的特征信息,将超绿特征(ExG)因子和最大类间方差法(Otsu)相结合对采集到的小麦图像进行分割处理.对比分析了I_CBAM-DenseNet、AlexNet、ResNet、DenseNet、CBAM-DenseNet以及VGG等模型的准确率和损失值的变化.结果表明,采取基于I_CBAM-DenseNet的卷积神经网络建立的模型,准确率达到99.64%,高于对比模型. 展开更多
关键词 小麦 发育期 DenseNet 卷积块注意模块(CBAM)
下载PDF
上一页 1 2 250 下一页 到第
使用帮助 返回顶部