期刊文献+
共找到4,189篇文章
< 1 2 210 >
每页显示 20 50 100
基于STM32的辨音识别系统的设计与应用
1
作者 李棚 孔健 +2 位作者 叶飞 张明存 刘明明 《科学技术创新》 2024年第3期64-67,共4页
声音识别技术能够用于多种环境参数检测,本文采用STM32的DSP技术,对全向拾音器采集到环境声音进行快速傅里叶变换(FFT),获取待测声音的主频率和次频率,通过液晶屏显示采集信号的强度和主要频率分量。该设备能够有效对环境声音的主要参... 声音识别技术能够用于多种环境参数检测,本文采用STM32的DSP技术,对全向拾音器采集到环境声音进行快速傅里叶变换(FFT),获取待测声音的主频率和次频率,通过液晶屏显示采集信号的强度和主要频率分量。该设备能够有效对环境声音的主要参赛进行检测,在噪声检测和一般设备运行故障检测具有较高的适用性。 展开更多
关键词 STM32F103主控 快速傅里叶变换(FFT) 数字信号处理(DSP)
下载PDF
规则压缩模型和灵活架构的Transformer加速器设计
2
作者 姜小波 邓晗珂 +1 位作者 莫志杰 黎红源 《电子与信息学报》 EI CAS CSCD 2024年第3期1079-1088,共10页
基于注意力机制的Transformer模型具有优越的性能,设计专用的Transformer加速器能大幅提高推理性能以及降低推理功耗。Transformer模型复杂性包括数量上和结构上的复杂性,其中结构上的复杂性导致不规则模型和规则硬件之间的失配,降低了... 基于注意力机制的Transformer模型具有优越的性能,设计专用的Transformer加速器能大幅提高推理性能以及降低推理功耗。Transformer模型复杂性包括数量上和结构上的复杂性,其中结构上的复杂性导致不规则模型和规则硬件之间的失配,降低了模型映射到硬件的效率。目前的加速器研究主要聚焦在解决模型数量上的复杂性,但对如何解决模型结构上的复杂性研究得不多。该文首先提出规则压缩模型,降低模型的结构复杂度,提高模型和硬件的匹配度,提高模型映射到硬件的效率。接着提出一种硬件友好的模型压缩方法,采用规则的偏移对角权重剪枝方案和简化硬件量化推理逻辑。此外,提出一个高效灵活的硬件架构,包括一种以块为单元的权重固定脉动运算阵列,同时包括一种准分布的存储架构。该架构可以高效实现算法到运算阵列的映射,同时实现高效的数据存储效率和降低数据移动。实验结果表明,该文工作在性能损失极小的情况下实现93.75%的压缩率,在FPGA上实现的加速器可以高效处理压缩后的Transformer模型,相比于中央处理器(CPU)和图形处理器(GPU)能效分别提高了12.45倍和4.17倍。 展开更多
关键词 自然语音处理 TRANSFORMER 模型压缩 硬件加速器 机器翻译
下载PDF
基于深度学习的水下目标识别技术
3
作者 丁元明 徐利华 侯孟珂 《舰船科学技术》 2024年第1期143-147,共5页
在水下复杂场景下,目标对象具有姿态不同、遮挡和背景复杂等特点,这对卷积网络的特征提取能力提出巨大挑战。Mask R-CNN算法在水下目标特征提取过程中也存在特征提取能力欠佳的问题,导致算法在水下目标检测准确性较差。因此,提出一种基... 在水下复杂场景下,目标对象具有姿态不同、遮挡和背景复杂等特点,这对卷积网络的特征提取能力提出巨大挑战。Mask R-CNN算法在水下目标特征提取过程中也存在特征提取能力欠佳的问题,导致算法在水下目标检测准确性较差。因此,提出一种基于Mask R-CNN的改进水下目标目标识别方法。首先可采用金字塔切分的通道注意力模块PAS代替采用了ResNet50的3×3卷积模块,该模块可通过对每个通道进行金字塔的切分,针对通道切分完成后所得出来的通道特征图上的空间信息来进行不用的尺度特征层提取;同时通过采用另一种更加安全稳定和高效的ECANEt通道注意力模块代替PAS模块中的SENet通道注意力模,对多维度的通道注意力权重进行特征重标定;最后对特征金字塔FPN的网络结构进行改进,加强不同特征层之间的信息融合。根据不同场景下进行的实验对比,改进后的网络能够提高水下目标识别的准确率,平均检测精度可达91.3%。本文所提出的改进Mask RCNN网络模型,能够适应水下复杂多变的场景,为水下目标的识别提供理论依据与技术方案。 展开更多
关键词 水下目标识别 Mask R-CNN 深度学习
下载PDF
语音识别在空中交通管制中的应用挑战与发展
4
作者 孔建国 李煜琨 +1 位作者 蒋培元 梁海军 《航空计算技术》 2024年第1期124-129,共6页
研究一种安全可靠的管制语音识别系统对于推进空管自动化进程、降低管制人员负荷、提升安全效能至关重要。对管制语音识别技术发展所面临的挑战进行了详细介绍,测试科大讯飞、腾讯云、阿里云、上海麦图这4家公司的商用语音识别系统。结... 研究一种安全可靠的管制语音识别系统对于推进空管自动化进程、降低管制人员负荷、提升安全效能至关重要。对管制语音识别技术发展所面临的挑战进行了详细介绍,测试科大讯飞、腾讯云、阿里云、上海麦图这4家公司的商用语音识别系统。结果表明,在前3家通用领域的商用ASR系统中,科大讯飞识别效果最好,CER为25.36%。相比之下,由于麦图的产品是基于ATC数据训练,具有最佳性能,其CER为15.02%。此外,设计了实验来探究人工设计的语音特征和基于自监督预训练策略提取的特征之间的优缺点。结果表明,后者有利于提升识别系统识别准确率和鲁棒性,但存在推理速度慢和部署难度大的问题。最后,总结了研究进展并进行了未来展望。 展开更多
关键词 ATC ASR 多任务学习 自监督学习 知识蒸馏
下载PDF
基于分治方法的声纹识别系统模型反演
5
作者 张骏飞 张雄伟 孙蒙 《信息安全研究》 CSCD 2024年第2期130-138,共9页
模型反演越来越引起人们对隐私的关注,它可以从模型中重构私有隐私数据,从而引发更加严重的信息安全问题.针对语音信息安全,首次尝试了一个新的模型反演应用:从声纹识别系统中提取说话人语音的语谱图特征.为了减少反演过程中的复杂度及... 模型反演越来越引起人们对隐私的关注,它可以从模型中重构私有隐私数据,从而引发更加严重的信息安全问题.针对语音信息安全,首次尝试了一个新的模型反演应用:从声纹识别系统中提取说话人语音的语谱图特征.为了减少反演过程中的复杂度及误差,采用分治法的思想逐层反演,并通过循环一致性的有效监督,成功重构与说话人身份一致的反演样本;另外,由于语音的特殊性,模型特征层已包含丰富的说话人信息,进一步减弱语义信息相似后,改进的方法显著提高了反演样本的识别准确率,表明反演所得语谱图中已含有有效表示说话人身份的信息.实验结果证明了模型反演在语谱图上的可行性,突出了提取此类语音特征信息的深度网络模型所带来的隐私信息泄露风险. 展开更多
关键词 模型反演 神经网络 声纹识别 语谱图 信息安全
下载PDF
基于Transformer的多编码器端到端语音识别
6
作者 庞江飞 孙占全 《电子科技》 2024年第4期1-7,共7页
当前广泛使用的Transformer模型具有良好的全局依赖关系捕捉能力,但其在浅层时容易忽略局部特征信息。针对该问题,文中提出了一种使用多个编码器来改善语音特征信息提取能力的方法。通过附加一个额外的卷积编码器分支来强化对局部特征... 当前广泛使用的Transformer模型具有良好的全局依赖关系捕捉能力,但其在浅层时容易忽略局部特征信息。针对该问题,文中提出了一种使用多个编码器来改善语音特征信息提取能力的方法。通过附加一个额外的卷积编码器分支来强化对局部特征信息的捕捉,弥补浅层Transformer对局部特征信息的忽视,有效实现音频特征序列全局和局部依赖关系的融合,即提出了基于Transformer的多编码器模型。在开源中文普通话数据集Aishell-1上的实验表明,在没有外部语言模型的情况下,相比于Transformer模型,基于Transformer的多编码器模型的字符错误率降低了4.00%。在内部非公开的上海话方言数据集上,文中所提模型的性能提升更加明显,其字符错误率从19.92%降低至10.31%,降低了48.24%。 展开更多
关键词 TRANSFORMER 语音识别 端到端 深度神经网络 多编码器 多头注意力 特征融合 卷积分支网络
下载PDF
基于域泛化的工业设备无监督异常声音检测算法
7
作者 毕忠勤 李欢峰 +1 位作者 张伟娜 董真 《科学技术与工程》 2024年第3期1091-1099,共9页
在工业场景中,因为设备异常现象的罕见性和高度多样化,以及机器的操作条件或环境噪声在训练和测试阶段的不同,会改变训练和测试数据之间的声学特性。为解决上述问题,提出一种基于联合深度学习和变分贝叶斯高斯混合模型的无监督异常声音... 在工业场景中,因为设备异常现象的罕见性和高度多样化,以及机器的操作条件或环境噪声在训练和测试阶段的不同,会改变训练和测试数据之间的声学特性。为解决上述问题,提出一种基于联合深度学习和变分贝叶斯高斯混合模型的无监督异常声音检测算法。通过两种神经网络联合训练进行信息提取,并利用变分贝叶斯高斯混合模型对其所获得的嵌入进行聚类分析;引入一种新的混合示例数据增强方法,用多种方式相结合的替代方法来生成示例,以对齐不同域之间的分布;应用了一种改进的子集群AdaCos损失函数,以排除潜在的异常值。实验结果表明,该方法在三种工业机器类型的数据集上目标域的平均曲线下面积达到了79.03%,平均F 1分数达到了67.23%;对比基线模型,谐波平均值提升约20%,在工业设备无监督异常声音检测中表现良好。 展开更多
关键词 异常声音检测 工业设备 域泛化 深度学习 数据增强
下载PDF
低资源青岛方言语音识别方法研究
8
作者 相紫涵 谷潇 +1 位作者 饶崇郅 渐令 《计算机技术与发展》 2024年第4期146-152,共7页
方言识别是语音识别的重要研究方向,常见的语音识别系统是基于标准语言训练的,导致其方言识别效果不佳。鉴于此,该文选择青岛方言作为应用案例开展方言语音识别研究。为解决方言语料匮乏、训练深度网络模型困难导致识别准确率受限等问题... 方言识别是语音识别的重要研究方向,常见的语音识别系统是基于标准语言训练的,导致其方言识别效果不佳。鉴于此,该文选择青岛方言作为应用案例开展方言语音识别研究。为解决方言语料匮乏、训练深度网络模型困难导致识别准确率受限等问题,提出应用数据增强方法,搭建基于改进Conformer的方言语音识别模型。首先,收集多源语音数据构建方言小型语料库;其次,采用数据增强技术扩充训练数据,以解决语料匮乏问题;最后,为了更好地提取信息,改进Conformer模型的降采样结构,引入膨胀卷积和Mish激活函数,实现语音到文本的直接映射。实验结果表明,提出的改进降采样模块的端到端模型结合数据增强方法后字错率可达25.96%,能有效实现低资源条件下的方言识别。 展开更多
关键词 语音识别 端到端 低资源 数据增强 青岛方言
下载PDF
语音数据特征聚类分析
9
作者 丰天韵 阮俊豪 王卓琛 《电子设计工程》 2024年第6期52-56,共5页
由于语音的复杂与多变,传统声学方法并不能很好地提取出语音的公共特征,容易受到训练数据中说话人发声特点差异的影响,造成模型的不稳定并影响其精度。针对这一问题,文章提出利用语音特征的聚类中心替代原语音特征进行BERT模型预训练的... 由于语音的复杂与多变,传统声学方法并不能很好地提取出语音的公共特征,容易受到训练数据中说话人发声特点差异的影响,造成模型的不稳定并影响其精度。针对这一问题,文章提出利用语音特征的聚类中心替代原语音特征进行BERT模型预训练的方法,通过与普通BERT模型对比在自动语音识别(Automatic Speech Recognition,ASR)下游任务的表现,证明了对语音特征进行的聚类操作在聚类中心数量合适的情况下,聚类后的BERT模型拥有更好地下游任务契合度,聚类中心数量为100的预训练模型错词率比普通预训练模型降低了2.32%。 展开更多
关键词 预训练 BERT 特征聚类 表征学习 无监督训练
下载PDF
基于时频联合和加权决策的水声目标识别方法
10
作者 潘晓英 冯天浩 +2 位作者 孙乃葳 张无瑕 郑为 《舰船科学技术》 2024年第1期137-142,共6页
由于水下环境的复杂性水声目标的识别一直是水声领域研究的热点。目前,基于深度学习的水声目标识别方法大多是基于单一的时域或者频域信号提取水声特征,而忽略了两者之间的时频互补信息,而时频互补信息有助于提高水声目标识别的精度。因... 由于水下环境的复杂性水声目标的识别一直是水声领域研究的热点。目前,基于深度学习的水声目标识别方法大多是基于单一的时域或者频域信号提取水声特征,而忽略了两者之间的时频互补信息,而时频互补信息有助于提高水声目标识别的精度。因此,本文同时从时域和频域角度出发,提出一种基于时频联合和加权决策的水声目标识别方法。该方法首先采用长短时记忆网络(LSTM)提取水声信号的时域特征进行识别,然后采用二维卷积神经网络(2D-CNN)提取水声信号的频域特征进行识别,最后将二者的识别结果进行加权决策融合。该方法的有效性在ShipEar数据集上进行验证,其识别精度达94.13%,高于其他现有方法。该方法为基于深度学习的水声目标识别方法的发展提供了新思路。 展开更多
关键词 水声目标识别 深度学习 加权决策 时频联合
下载PDF
基于机器视觉的智能垃圾分类车开发与设计
11
作者 王富城 蔡鑫 +2 位作者 邱波 王诚 廖娟 《科技与创新》 2024年第3期42-45,共4页
垃圾分类是减少垃圾积累、有效进行环境治理的重要前提。然而,当前中国主要依靠小规模资源回收的个体户和垃圾处理单位的工作人员进行二次分类,仅依靠人力完成高重复性的垃圾分类任务,分类准确率和效率都难以得到保证,甚至可能导致人体... 垃圾分类是减少垃圾积累、有效进行环境治理的重要前提。然而,当前中国主要依靠小规模资源回收的个体户和垃圾处理单位的工作人员进行二次分类,仅依靠人力完成高重复性的垃圾分类任务,分类准确率和效率都难以得到保证,甚至可能导致人体受伤。研究可以代替人工进行垃圾分类的机械设备具有重要的社会意义和实用价值。为此,结合垃圾分类设计了一种基于机器视觉的自动化垃圾分类车,该机械设备经过学习算法后不仅实现了移动化、高效化、智能化处理生活垃圾,还有助于降低回收成本、提高回收效率,对生态文明建设和可持续发展战略具有重要意义。 展开更多
关键词 垃圾分类 机器视觉 高效化 智能化
下载PDF
基于嵌入式的垃圾信息自动采集系统设计
12
作者 钟维 廖先莉 《南方农机》 2024年第3期127-130,共4页
【目的】设计一种垃圾信息自动采集系统,实现垃圾信息智能化自动采集。【方法】拟定一种基于嵌入式的垃圾信息自动采集系统设计方案,系统设计方案包括硬件和软件两部分,其中系统硬件包括人体感应模块、箱门控制模块、重量检测模块、图... 【目的】设计一种垃圾信息自动采集系统,实现垃圾信息智能化自动采集。【方法】拟定一种基于嵌入式的垃圾信息自动采集系统设计方案,系统设计方案包括硬件和软件两部分,其中系统硬件包括人体感应模块、箱门控制模块、重量检测模块、图像采集模块等,系统软件包括箱门自动控制功能、垃圾图像信息自动采集和传输功能。根据设计方案,将各个模块进行调试,测试系统的稳定性。【结果】系统可实现连续工作72 h,当物体靠近人体感应模块,距离小于5 cm,箱门控制模块舵机正转,10 s后舵机反转回到初始位置,模拟垃圾投入垃圾箱,箱门自动打开和自动关闭功能;将物体放到重量检测模块,模拟垃圾放入垃圾箱入口检测单元,几秒后图像采集模块将垃圾图片通过串口传输到上位机串口调试助手显示,实现垃圾进箱后的图像自动采集功能。【结论】各个模块经过调试安装,相互作用,实现了预期的箱门自动开闭功能和图像自动上传功能,该系统运行稳定、可靠。 展开更多
关键词 嵌入式 垃圾信息 自动采集
下载PDF
融合记忆功能的身份识别系统
13
作者 钟小玉 廖海余 +3 位作者 卓佳佳 苏莹香 许媛媛 吴伟 《数字技术与应用》 2024年第1期202-204,共3页
在面临疾病传染的特殊时期,对人员身份识别及测温非常有必要,因此我们设计了一款能够测温并与该测温人员进行口罩识别且身份配对的系统。系统基于自动测温、身份识别以及口罩识别技术的原理,寻找对温度信号、人脸信号进行采集和处理的方... 在面临疾病传染的特殊时期,对人员身份识别及测温非常有必要,因此我们设计了一款能够测温并与该测温人员进行口罩识别且身份配对的系统。系统基于自动测温、身份识别以及口罩识别技术的原理,寻找对温度信号、人脸信号进行采集和处理的方法,采用微控制器STM32为主控芯片,配合K210视觉模块与MLX90614测温模块等实现,经过测试,本系统能够成功实现[1]。 展开更多
关键词 身份识别 疾病传染 记忆功能 自动测温 温度信号 测温模块 识别技术 主控芯片
下载PDF
双模态跨语料库语音情感识别
14
作者 刘云翔 张可欣 《应用技术学报》 2024年第1期77-84,共8页
语音情感识别(SER)在双模态的跨数据库语音情感识别研究较少,跨数据库情感识别过度减少数据集之间差异的同时,会忽视情感判别能力的特征的问题。YouTube数据集为源数据,互动情感二元动作捕捉数据库(IEMOCAP)为目标数据。在源数据和目标... 语音情感识别(SER)在双模态的跨数据库语音情感识别研究较少,跨数据库情感识别过度减少数据集之间差异的同时,会忽视情感判别能力的特征的问题。YouTube数据集为源数据,互动情感二元动作捕捉数据库(IEMOCAP)为目标数据。在源数据和目标数据中,Opensmile工具箱用来提取语音特征,将提取的语音特征输入到CNN和双向长短期记忆网络(BLSTM),来提取更高层次的特征,文本模态为语音信号的翻译稿。首先双向编码器表示转换器(Bert)把文本信息向量化,BLSTM提取文本特征,然后设计模态不变损失来形成2种模态的公共表示空间。为了解决跨语料库的SER问题,通过联合优化线性判别分析(LDA)、最大平均差异(MMD)、图嵌入(GE)和标签回归(LSR),学习源数据和目标数据的公共子空间。为了保留情绪辨别特征,情感判别损失与MMD+GE+LDA+LSR相结合。SVM分类器作为迁移公共子空间的最终情感分类,IEMOCAP上的实验结果表明,此方法优于其他先进的跨语料库和双模态SER. 展开更多
关键词 跨语料库 情感识别 双模态语音情感识别 迁移子空间学习 循环神经网络
下载PDF
MFCC特征训练技术在声纹识别中的应用
15
作者 陶雨昂 《集成电路应用》 2024年第2期386-387,共2页
阐述MFCC声纹特征提取的原理、MFCC特征提取模式和基于MFCC声纹识别的实现。提取模式包括MFCC提取流程、短时傅立叶变换STFT、梅尔滤波器组的构造、离散余弦变换(DCT)与MFCC特征值的提取。针对融合特征提取方案可分性与鲁棒性的缺陷提... 阐述MFCC声纹特征提取的原理、MFCC特征提取模式和基于MFCC声纹识别的实现。提取模式包括MFCC提取流程、短时傅立叶变换STFT、梅尔滤波器组的构造、离散余弦变换(DCT)与MFCC特征值的提取。针对融合特征提取方案可分性与鲁棒性的缺陷提出改进方案。 展开更多
关键词 模式识别 频率倒谱 特征提取 音频信息
下载PDF
改进MFCC特征和MLA模型的语音情感识别
16
作者 张晓莉 《福建电脑》 2024年第1期52-56,共5页
MFCC及其一阶差分特征表征了语音的静态和动态信息,常作为SER的情感特征。在传统的MFCC特征提取过程中,通过人工调参实现语音信噪比的平衡,容易造成过度补偿的情况。本文提出两种改进方法,分别获得EMFCC和AMFCC特征。为了获得最佳的分... MFCC及其一阶差分特征表征了语音的静态和动态信息,常作为SER的情感特征。在传统的MFCC特征提取过程中,通过人工调参实现语音信噪比的平衡,容易造成过度补偿的情况。本文提出两种改进方法,分别获得EMFCC和AMFCC特征。为了获得最佳的分类准确率,基于池化层、LSTM和注意力机制构建了MLA模型,能够有效捕捉特征中的情感信息。采用由MFCC及其一阶差分特征和两个改进MFCC特征组成的混合特征,在CASIA语料库上取得了81.79%的未加权准确率。消融实验的结果表明,与SER领域其他较为先进的识别方法进行对比,改进的MFCC特征具有较好的性能优势。 展开更多
关键词 语音情感识别 梅尔频率倒谱系数 长短时记忆 注意力机制
下载PDF
一种基于异质信息网络的多维度语义融合推荐算法研究
17
作者 甘宏 王华武 《江西科学》 2024年第1期169-176,共8页
为解决目前互联网信息过载问题,推荐系统已经广泛应用于电子商务、新闻资讯和影视音乐网站等。推荐算法目标就是挖掘用户的潜在兴趣,为他们提供个性化的信息推送,最终解决信息过载的问题,从而为用户解决该分类问题,选择合适推荐算法就... 为解决目前互联网信息过载问题,推荐系统已经广泛应用于电子商务、新闻资讯和影视音乐网站等。推荐算法目标就是挖掘用户的潜在兴趣,为他们提供个性化的信息推送,最终解决信息过载的问题,从而为用户解决该分类问题,选择合适推荐算法就显得尤为重要,同时也是解决数据挖掘领域的重要方法。但当前推荐模型缺乏对多源头异质数据的有效利用,同时在聚合语义信息的过程中存在信息损失问题。为解决上述问题,提出了一种基于异质信息网络的多维度语义融合推荐算法模型。首先,通过元路径和异质图描述推荐任务内复杂的语义结构,然后,对于元路径所引导的邻域进行划分,并通过基于多层邻域交互捕获多尺度语义信息,最后,通过在低阶、高阶维度下引导多尺度语义信息融合。实验结果表明,该方法具有较高的准确度。 展开更多
关键词 人工智能技术 异质信息网络 元路径 语义融合
下载PDF
考虑特征向量约束的低频声信号声源定位系统
18
作者 许敬成 陈长征 《现代电子技术》 2024年第2期44-48,共5页
低频信号在传输过程中,容易受到环境噪声的干扰,导致信号强度降低,从而影响声源定位的精度。为了提升低频声信号声源定位能力,提出一种考虑特征向量约束的低频声信号声源定位系统。通过MEMS声传感器采集低频声信号,对其进行去噪处理,并... 低频信号在传输过程中,容易受到环境噪声的干扰,导致信号强度降低,从而影响声源定位的精度。为了提升低频声信号声源定位能力,提出一种考虑特征向量约束的低频声信号声源定位系统。通过MEMS声传感器采集低频声信号,对其进行去噪处理,并传输至低频声信号声源定位模块;采用考虑特征向量约束的低频声信号声源定位方法实现对低频声信号声源定位。实验结果表明:所提系统的低频声信号声源定位与实际位置坐标的误差小,说明该系统的定位方法性能优良,定位精度较高,能够提升低频声信号声源定位能力。 展开更多
关键词 低频声信号 声源定位系统 特征向量约束 信号采集 信号定位 信号传输模块 应用模块
下载PDF
一种基于仿鸟叫声的隐蔽通信方法
19
作者 蒋佳佳 陆茵 +4 位作者 徐俊宇 段发阶 王宪全 刘伟 傅骁 《Journal of Measurement Science and Instrumentation》 CAS CSCD 2023年第4期387-397,共11页
当无线电通信受到干扰或要求无线电静默时,在森林作战的武装队伍之间将无法进行命令和情报传递。因此,亟需一种可以代替无线电通信的通信方式用于传输重要信息。针对这一需求,提出了一种新型的隐蔽声通信方法,该方法通过模仿动物的叫声... 当无线电通信受到干扰或要求无线电静默时,在森林作战的武装队伍之间将无法进行命令和情报传递。因此,亟需一种可以代替无线电通信的通信方式用于传输重要信息。针对这一需求,提出了一种新型的隐蔽声通信方法,该方法通过模仿动物的叫声来编码通信信息,并以绣眼鸟的叫声为例,利用绣眼鸟的叫声音节和音节之间的时间间隔来编码通信信息。为了减少译码计算量并提高编码效率,设计了一种基于时频特征的音节分组方法。同时,采用多种策略使得编码后的通信脉冲序列与真实铜蓝鹟叫声尽可能相似,以提高隐蔽性能,并通过实验验证在距离不超过60 m时,通信误码率不超过2%。最后,介绍了该通信方法的模型,并分析了在实际应用中可能遇到的问题,以及解决方案和未来的发展方向。研究结果表明,本方法可实现无线电不可用情况下的信息隐蔽传递。 展开更多
关键词 仿鸟叫声 声学隐蔽通信 绣眼鸟叫声 时频特性 无线电通信
下载PDF
低资源少样本连续语音识别最新进展
20
作者 屈丹 杨绪魁 +2 位作者 闫红刚 陈雅淇 牛铜 《郑州大学学报(工学版)》 CAS 北大核心 2023年第4期1-9,共9页
低资源少样本语音识别是目前语音识别行业面临的迫切技术需求。首先,总结了低资源连续语音识别技术的框架技术,重点介绍了低资源语音在特征提取、声学建模和资源扩展等方面的若干关键技术研究进展。其次,在连续语音识别框架技术发展的... 低资源少样本语音识别是目前语音识别行业面临的迫切技术需求。首先,总结了低资源连续语音识别技术的框架技术,重点介绍了低资源语音在特征提取、声学建模和资源扩展等方面的若干关键技术研究进展。其次,在连续语音识别框架技术发展的基础上,重点阐述了生成对抗网络、自监督表示学习、深度强化学习和元学习等高级深度学习技术在解决少样本语音识别方面的最新发展,如FGSM、wav2vec、AMS等代表性方法。在此基础上,分析了目前该技术面临的互补有限、数据和任务不均衡与模型轻量化部署问题。最后,对低资源少样本连续语音识别进行了总结,提出未来少样本训练识别的研究方向可以朝着先验信息引入、假设空间约束条件设定等方向进一步研究。 展开更多
关键词 低资源少样本 连续语音识别 生成对抗网络 自监督表示学习 深度强化学习 元学习
下载PDF
上一页 1 2 210 下一页 到第
使用帮助 返回顶部