期刊文献+
共找到4篇文章
< 1 >
每页显示 20 50 100
基于BN-SGMM-HMM模型的低资源语音识别系统 被引量:8
1
作者 雷杰 赵宏亮 +2 位作者 艾宁智 邹万冰 詹毅 《合肥工业大学学报(自然科学版)》 CAS 北大核心 2021年第12期1627-1632,共6页
针对语音识别系统在低资源条件下,采用传统的高斯混合-隐马尔可夫声学模型(GMM-HMM)会带来识别精度低、参数规模过大等问题,文章提出基于BN-SGMM-HMM的声学模型来解决GMM-HMM模型的不足。该模型在声学特征方面,通过基于瓶颈(bottleneck,... 针对语音识别系统在低资源条件下,采用传统的高斯混合-隐马尔可夫声学模型(GMM-HMM)会带来识别精度低、参数规模过大等问题,文章提出基于BN-SGMM-HMM的声学模型来解决GMM-HMM模型的不足。该模型在声学特征方面,通过基于瓶颈(bottleneck,BN)层的神经网络来进行提取,从而提高声学特征的可区分性与鲁棒性,同时在训练过程中引入Dropout策略来防止过拟合问题;在声学模型方面,采用子空间高斯混合模型(subspace Gaussian mixture model,SGMM),使得模型参数规模显著降低56.5%。同时,这两方面的改进也提升了低资源语音识别系统的识别率,TIMIT语音数据库实验表明,采用该模型,与GMM-HMM模型相比提高8.0%,与BN-GMM-HMM模型相比提高3.6%。这些优点对该模型在低功耗需求的硬件平台上实现部署有极大的帮助。 展开更多
关键词 语音识别 瓶颈特征 子空间高斯混合模型(SGMM) Dropout策略 低资源
下载PDF
采用词图相交融合的语音关键词检测方法 被引量:4
2
作者 李鹏 屈丹 《信号处理》 CSCD 北大核心 2015年第6期702-709,共8页
针对词图合并方法产生的词图冗余信息过多,规模较大,导致检索速度较慢的问题,本文提出了一种基于词图相交融合的语音关键词检测方法。首先,将不同语音识别系统产生的词图取交集,并对相同路径上的声学模型、语言模型得分进行得分融合;然... 针对词图合并方法产生的词图冗余信息过多,规模较大,导致检索速度较慢的问题,本文提出了一种基于词图相交融合的语音关键词检测方法。首先,将不同语音识别系统产生的词图取交集,并对相同路径上的声学模型、语言模型得分进行得分融合;然后,对于融合后词图中存在的间断路径,直接利用性能最优的语音识别系统产生的词图进行补充,得到完整的融合词图;最后,在相交融合后的词图上进行关键词检测。实验表明,相交融合后的词图综合利用了各词图的得分信息,在基本不损失词图对正确内容覆盖率基础上,减少了冗余信息,有效降低了索引规模;并且在关键词检测性能ATWV指标下,基于词图相交融合的关键词检测方法相比词图合并方法相对提升5.3%。 展开更多
关键词 子空间高斯混合模型 深层神经网络 相交词图 关键词检测
下载PDF
基于多核卷积融合网络的BLSTM-CTC语音识别 被引量:13
3
作者 刘晓峰 宋文爱 +2 位作者 陈小东 郇晋侠 李志媛 《计算机应用与软件》 北大核心 2021年第11期167-173,共7页
语音信号在传播过程中会产生持续时长不等的音素特征,这些特征会影响语音识别的正确率。针对这一问题,提出一种多核卷积融合网络(Multi-core Convolution Fusion Network, MCFN),用于对不同长度的音素特征进行标准化,用标准化后的特征... 语音信号在传播过程中会产生持续时长不等的音素特征,这些特征会影响语音识别的正确率。针对这一问题,提出一种多核卷积融合网络(Multi-core Convolution Fusion Network, MCFN),用于对不同长度的音素特征进行标准化,用标准化后的特征训练语音识别模型。此外,还利用子空间高斯混合模型(Subspace Gaussian Mixture Model, SGMM)将一般说话者的语音和信息加入到模型中,减小语料稀疏性对模型的影响。通过在Thchs30和ST-CMDS数据集对模型进行评估,结果显示,基于MCFN的BLSTM-CTC语音识别模型的识别字错误率(WER)较传统的语音识别模型有所降低。 展开更多
关键词 语音识别 多核卷积融合网络 端到端 子空间高斯混合模型
下载PDF
基于SGMM和DNN结合提高音素识别率的研究 被引量:1
4
作者 贾兵兵 曹辉 秦驰杰 《计算机工程与应用》 CSCD 北大核心 2019年第24期117-121,127,共6页
为降低声学特征在语音识别系统中的音素识别错误率,提高系统性能,提出一种子空间高斯混合模型和深度神经网络结合提取特征的方法,分析了子空间高斯混合模型的参数规模并在减少计算复杂度后将其与深度神经网络串联进一步提高音素识别率... 为降低声学特征在语音识别系统中的音素识别错误率,提高系统性能,提出一种子空间高斯混合模型和深度神经网络结合提取特征的方法,分析了子空间高斯混合模型的参数规模并在减少计算复杂度后将其与深度神经网络串联进一步提高音素识别率。把经过非线性特征变换的语音数据输入模型,找到深度神经网络结构的最佳配置,建立学习与训练更可靠的网络模型进行特征提取,通过比较音素识别错误率来判断系统性能。实验仿真结果证明,基于该系统提取的特征明显优于传统声学模型。 展开更多
关键词 声学特征 音素识别 子空间高斯混合模型 深度神经网络
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部