期刊文献+
共找到9篇文章
< 1 >
每页显示 20 50 100
离散制造智能工厂场景的AGV路径规划方法 被引量:4
1
作者 郭心德 丁宏强 《广东工业大学学报》 CAS 2021年第6期70-76,共7页
自动导引车(Automated Guided Vehicle,AGV)的自主路径规划是离散制造智能工厂中物流系统的重要组成部分,AGV可以大大提高离散智能制造的智能化和自动化能力,而传统的AGV导航方式自由度较低。本文研究面向离散制造智能工厂场景下的AGV... 自动导引车(Automated Guided Vehicle,AGV)的自主路径规划是离散制造智能工厂中物流系统的重要组成部分,AGV可以大大提高离散智能制造的智能化和自动化能力,而传统的AGV导航方式自由度较低。本文研究面向离散制造智能工厂场景下的AGV自主路径规划问题,应用深度强化学习方法提高自主路径规划的自由度。设计了一种多模态环境信息感知的神经网络结构,并将AGV在全局障碍下的路径规划预训练策略引入到复杂的离散制造智能工厂场景下的路径规划,实现了AGV从环境感知到动作决策的端到端路径规划。实验结果表明,采用本文提出算法的AGV能够在复杂的离散制造智能工厂环境进行自主规划路径,并具有较高的成功率和避障能力。 展开更多
关键词 自动导引车(AGV) 路径规划 深度强化学习 神经网络结构
下载PDF
用于治疗和诊断的核磁共振兼容手术机器人系统的发展现状
2
作者 吴迪 周兵 +3 位作者 肖霄 肖博 郭靖 何昭水 《机器人外科学杂志(中英文)》 2023年第4期299-319,共21页
核磁共振成像(Magnetic Resonance Imaging,MRI)通过高分辨率目标组织扫描,可以使医生和患者在免于电离辐射的情况下实现实时成像。近年来,科学家和工程师们一直尝试将机器人技术与MRI结合在一起,实现机器人辅助和图像引导相结合的诊断... 核磁共振成像(Magnetic Resonance Imaging,MRI)通过高分辨率目标组织扫描,可以使医生和患者在免于电离辐射的情况下实现实时成像。近年来,科学家和工程师们一直尝试将机器人技术与MRI结合在一起,实现机器人辅助和图像引导相结合的诊断及治疗。本文介绍了可用于术中MRI的医疗机器人系统,具体包括它们的成像兼容性、驱动方式、传感方式、运动学以及机械和电气设计,这些技术使得机器人在MRI引导下的介入诊疗成为可能,此外,基于不同的医学场景,本文对各种MR兼容机器人系统做了分类和比较研究,最后对MR兼容机器人领域的未来发展方向进行了展望。 展开更多
关键词 MRI引导下介入 MR兼容 医疗机器人
下载PDF
结合MGCC特征与多尺度通道注意力的环境声深度学习分类方法
3
作者 杨俊杰 丁家辉 +2 位作者 杨柳 冯丽 杨超 《应用声学》 CSCD 北大核心 2024年第3期513-524,共12页
环境声分类技术在家居安全监测、人机语声交互等领域具有关键作用。然而,声源的多样性与混合性给环境声分类方法设计带来了重大挑战。为提高分类准确率与节约计算资源,该文提出一种基于多尺度通道注意力机制的深度学习分类模型。所提模... 环境声分类技术在家居安全监测、人机语声交互等领域具有关键作用。然而,声源的多样性与混合性给环境声分类方法设计带来了重大挑战。为提高分类准确率与节约计算资源,该文提出一种基于多尺度通道注意力机制的深度学习分类模型。所提模型由特征提取模块、多尺度卷积模块、高效通道注意力模块、输出层四部分组成。首先,通过引入加权型梅尔Gammatone频率倒谱系数(MGCC)挖掘环境声频谱幅值与相位结构信息;其次,融合多尺度卷积核与高效通道注意力机制优选出声频关键局部细节和通道特征;最后,在全连接层采用softmax函数映射特征并输出环境声类型的概率值。所提模型在6种环境声的iFLYTEK、10种环境声的Urbansound8k数据集上开展测试验证,分别取得了94%、76.52%、79.24%(iFLYTEK+Urbansound8k)的分类准确率。消融实验结果进一步表明:引入的多尺度卷积模块、通道注意力机制模块对分类准确率的提升贡献率分别接近于3.77%和1.89%。实验还详细对比了7种现有的深度学习分类方法,所提算法在分类准确率上排名第二;另外,在同级别算法中如ResNet18、GoogLeNet,所提算法在模型参数量和计算复杂度方面上实现了进一步的约减。 展开更多
关键词 环境声分类 梅尔Gammatone频率倒谱 多尺度核卷积 高效通道注意力 卷积神经网络
下载PDF
基于混合混响模型的多通道语音增强算法
4
作者 解元 邹涛 +1 位作者 孙为军 谢胜利 《通信学报》 EI CSCD 北大核心 2024年第11期15-26,共12页
为了解决带混响和噪声场景下的语音增强问题,构建了一个集成多通道线性预测模型和空间相干模型的语音增强模型,设计了一种基于混合混响模型的多通道语音增强算法。该算法将后期混响分为2个分量,分别用多通道线性预测模型和空间相干模型... 为了解决带混响和噪声场景下的语音增强问题,构建了一个集成多通道线性预测模型和空间相干模型的语音增强模型,设计了一种基于混合混响模型的多通道语音增强算法。该算法将后期混响分为2个分量,分别用多通道线性预测模型和空间相干模型来建模,为优化模型参数,利用卡尔曼滤波器实施更新模型参数,并用多项式矩阵特征值分解进行空间、时间和频率解相关,实现去混响去噪声。实验结果表明,所提算法可以实现高低混响带噪声环境下的语音增强,相比于流行的语音增强算法,其增强效果更优越,其中语音质量客观评价(PESQ)值和短时客观可懂度(STOI)值最高分别提高了30%和20%。 展开更多
关键词 多通道语音增强 卡尔曼滤波器 多项式矩阵特征值分解
下载PDF
面向高混响环境的欠定卷积盲源分离算法 被引量:6
5
作者 解元 邹涛 +1 位作者 孙为军 谢胜利 《通信学报》 EI CSCD 北大核心 2023年第2期82-93,共12页
为了解决高混响环境下欠定卷积混叠信号的分离问题,提出一种新的欠定卷积盲源分离算法。针对高混响环境的影响,设计全局脉冲响应网络削弱混响回声,提高信号质量。基于全局脉冲响应网络建立新的时频域混叠信号数学模型,采用全局脉冲响应... 为了解决高混响环境下欠定卷积混叠信号的分离问题,提出一种新的欠定卷积盲源分离算法。针对高混响环境的影响,设计全局脉冲响应网络削弱混响回声,提高信号质量。基于全局脉冲响应网络建立新的时频域混叠信号数学模型,采用全局脉冲响应矩阵缩短了传统脉冲响应的长度,降低了高混响带来的模型变换近似误差。基于非负矩阵分解理论设计模型参数的实时更新学习规则,将源信号分离问题转换为模型参数优化问题,实现混叠信号的盲源分离。实验结果表明,所提算法可以有效地实现中英文语音、音乐混叠信号的盲源分离,与现有比较流行的盲源分离算法的对比验证了所提算法的优越性。 展开更多
关键词 盲源分离 欠定卷积混叠 高混响环境 全局脉冲响应网络 非负矩阵分解
下载PDF
面向卷积混叠环境下的盲源分离新方法 被引量:7
6
作者 解元 邹涛 +1 位作者 孙为军 谢胜利 《自动化学报》 EI CAS CSCD 北大核心 2023年第5期1062-1072,共11页
卷积混叠环境下的盲源分离(Blind source separation, BSS)是一个极具挑战性和实际意义的问题.本文在独立分量分析框架下,建立非负矩阵分解(Nonnegative matrix factorization, NMF)模型,设计新的优化目标函数,通过严格的数学理论推导,... 卷积混叠环境下的盲源分离(Blind source separation, BSS)是一个极具挑战性和实际意义的问题.本文在独立分量分析框架下,建立非负矩阵分解(Nonnegative matrix factorization, NMF)模型,设计新的优化目标函数,通过严格的数学理论推导,得到新的模型参数更新规则;并对解混叠矩阵进行标准化处理,避免幅度歧义性问题;在源信号的重构阶段,通过实时更新非负矩阵分解模型参数,避免源信号的排序歧义性问题.实验结果验证了所提算法在分离中英文语音混叠信号、音乐混叠信号时的有效性和优越性. 展开更多
关键词 盲源分离 卷积混叠 独立分量分析 非负矩阵分解
下载PDF
结合脉冲响应重塑和期望最大化的盲信号分离 被引量:1
7
作者 解元 张旭 +3 位作者 邹涛 马鸽 余锦视 孙为军 《电子学报》 EI CAS CSCD 北大核心 2023年第11期3343-3353,共11页
多通道欠定卷积语音混合信号的分离问题是盲信号分离领域的难点.由于混合信号中常伴随声学回声和混响,真实的源信号很难完全被清晰地分离出来.传统的盲信号分离算法多数适用于低混响,而在高混响场景下,算法的分离性能极速下降甚至是失效... 多通道欠定卷积语音混合信号的分离问题是盲信号分离领域的难点.由于混合信号中常伴随声学回声和混响,真实的源信号很难完全被清晰地分离出来.传统的盲信号分离算法多数适用于低混响,而在高混响场景下,算法的分离性能极速下降甚至是失效的.本文针对具有声学回声和混响环境下的多通道欠定卷积语音混合信号的分离问题,提出一种结合脉冲响应重塑和期望最大化的盲信号分离算法,该算法在低混响和高混响下都表现出很好的分离性能.首先,利用基于无穷范数和p-范数的脉冲响应重塑技术设计预滤波器消除可听回声,完成对混合信号的重塑,提高混合信号的质量.然后,对重塑后的混合信号利用分层聚类方法估计混合矩阵,基于期望最大化算法框架,设计新的模型参数实时更新规则,通过结合脉冲响应重塑和期望最大化重构源信号.实验结果表明,所提算法可以有效地分离不同混响环境下带声学回声的欠定卷积混合信号,其分离性能优越,同时对噪声具有很好的鲁棒性. 展开更多
关键词 盲源分离 脉冲响应重塑 多通道卷积混合 期望最大化
下载PDF
深度学习驱动的大深度二值聚焦投影三维测量
8
作者 刘嘉 谈季 +2 位作者 王旭 苏文青 何昭水 《激光与光电子学进展》 CSCD 北大核心 2024年第10期111-118,共8页
二值离焦技术在高速动态三维测量中展现出巨大优势。然而,离焦投影模式决定了其仅能在合适离焦程度才可得到高质量测量结果,导致测量深度十分受限。为扩大测量深度,提出一种深度学习驱动的二值聚焦投影三维测量方法。利用聚焦投影策略,... 二值离焦技术在高速动态三维测量中展现出巨大优势。然而,离焦投影模式决定了其仅能在合适离焦程度才可得到高质量测量结果,导致测量深度十分受限。为扩大测量深度,提出一种深度学习驱动的二值聚焦投影三维测量方法。利用聚焦投影策略,无须考虑图像离焦带来的条纹成像影响,从根本上克服二值离焦技术的局限性。其次,设计了两阶段深度学习框架对二值条纹进行处理:其中对抗式学习实现全测量深度内的高质量正弦条纹生成;分支残差学习输出条纹级数辅助相位展开,减小传统离焦投影引起的级数边缘误差。实验结果表明,所提方法可显著扩大测量深度范围,且保证全范围高质量三维重建结果。 展开更多
关键词 三维测量 二值投影 结构光 深度学习
原文传递
无偏稀疏正则化的双策略结构神经网络压缩
9
作者 林泽建 王骏逵 +2 位作者 谢俊明 李珍妮 谢胜利 《信息与控制》 CSCD 北大核心 2023年第3期313-325,共13页
虽然深度神经网络模型的性能十分出色,但目前网络存在规模庞大、权重冗余度高的问题。同时,现有对网络权重剪枝的正则子估测偏差大。因此,本文提出无偏稀疏正则化的双策略结构神经网络压缩。首先,本文将神经网络所连接权重视为一组,提... 虽然深度神经网络模型的性能十分出色,但目前网络存在规模庞大、权重冗余度高的问题。同时,现有对网络权重剪枝的正则子估测偏差大。因此,本文提出无偏稀疏正则化的双策略结构神经网络压缩。首先,本文将神经网络所连接权重视为一组,提出采用估测值偏差小的非线性拉普拉斯函数,构建组间无偏结构稀疏正则子和组内无偏结构稀疏正则子,对冗余神经元和剩余神经元的冗余权重分别进行稀疏约束,构建无偏稀疏正则化的双策略结构神经网络压缩模型。其次,针对所设计的无偏稀疏正则化的网络压缩优化难题,本文采用近端算子技术获得无偏稀疏正则子的闭式解,进而设计基于近端梯度下降法的反向传播算法,实现神经网络准确的结构压缩。最后,通过在数据集MNIST、FashionMNIST和Cifar-10进行实验验证,本文所提出的无偏稀疏正则子的双策略结构神经网络压缩不仅收敛速度快于目前主流正则子。而且在压缩率保持一致的情况下,相比已有的方法识别精度平均提升2.3%,在识别保持精度基本一致的情况下,相对已有方法平均提升11.5%的压缩率。 展开更多
关键词 神经网络 压缩 结构剪枝 无偏稀疏正则子
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部