期刊导航
期刊开放获取
重庆大学
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
4
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
基于BN-SGMM-HMM模型的低资源语音识别系统
被引量:
8
1
作者
雷杰
赵宏亮
+2 位作者
艾宁智
邹万冰
詹毅
《合肥工业大学学报(自然科学版)》
CAS
北大核心
2021年第12期1627-1632,共6页
针对语音识别系统在低资源条件下,采用传统的高斯混合-隐马尔可夫声学模型(GMM-HMM)会带来识别精度低、参数规模过大等问题,文章提出基于BN-SGMM-HMM的声学模型来解决GMM-HMM模型的不足。该模型在声学特征方面,通过基于瓶颈(bottleneck,...
针对语音识别系统在低资源条件下,采用传统的高斯混合-隐马尔可夫声学模型(GMM-HMM)会带来识别精度低、参数规模过大等问题,文章提出基于BN-SGMM-HMM的声学模型来解决GMM-HMM模型的不足。该模型在声学特征方面,通过基于瓶颈(bottleneck,BN)层的神经网络来进行提取,从而提高声学特征的可区分性与鲁棒性,同时在训练过程中引入Dropout策略来防止过拟合问题;在声学模型方面,采用子空间高斯混合模型(subspace Gaussian mixture model,SGMM),使得模型参数规模显著降低56.5%。同时,这两方面的改进也提升了低资源语音识别系统的识别率,TIMIT语音数据库实验表明,采用该模型,与GMM-HMM模型相比提高8.0%,与BN-GMM-HMM模型相比提高3.6%。这些优点对该模型在低功耗需求的硬件平台上实现部署有极大的帮助。
展开更多
关键词
语音识别
瓶颈特征
子空间高斯混合模型
(SGMM)
Dropout策略
低资源
下载PDF
职称材料
采用词图相交融合的语音关键词检测方法
被引量:
4
2
作者
李鹏
屈丹
《信号处理》
CSCD
北大核心
2015年第6期702-709,共8页
针对词图合并方法产生的词图冗余信息过多,规模较大,导致检索速度较慢的问题,本文提出了一种基于词图相交融合的语音关键词检测方法。首先,将不同语音识别系统产生的词图取交集,并对相同路径上的声学模型、语言模型得分进行得分融合;然...
针对词图合并方法产生的词图冗余信息过多,规模较大,导致检索速度较慢的问题,本文提出了一种基于词图相交融合的语音关键词检测方法。首先,将不同语音识别系统产生的词图取交集,并对相同路径上的声学模型、语言模型得分进行得分融合;然后,对于融合后词图中存在的间断路径,直接利用性能最优的语音识别系统产生的词图进行补充,得到完整的融合词图;最后,在相交融合后的词图上进行关键词检测。实验表明,相交融合后的词图综合利用了各词图的得分信息,在基本不损失词图对正确内容覆盖率基础上,减少了冗余信息,有效降低了索引规模;并且在关键词检测性能ATWV指标下,基于词图相交融合的关键词检测方法相比词图合并方法相对提升5.3%。
展开更多
关键词
子空间高斯混合模型
深层神经网络
相交词图
关键词检测
下载PDF
职称材料
基于多核卷积融合网络的BLSTM-CTC语音识别
被引量:
13
3
作者
刘晓峰
宋文爱
+2 位作者
陈小东
郇晋侠
李志媛
《计算机应用与软件》
北大核心
2021年第11期167-173,共7页
语音信号在传播过程中会产生持续时长不等的音素特征,这些特征会影响语音识别的正确率。针对这一问题,提出一种多核卷积融合网络(Multi-core Convolution Fusion Network, MCFN),用于对不同长度的音素特征进行标准化,用标准化后的特征...
语音信号在传播过程中会产生持续时长不等的音素特征,这些特征会影响语音识别的正确率。针对这一问题,提出一种多核卷积融合网络(Multi-core Convolution Fusion Network, MCFN),用于对不同长度的音素特征进行标准化,用标准化后的特征训练语音识别模型。此外,还利用子空间高斯混合模型(Subspace Gaussian Mixture Model, SGMM)将一般说话者的语音和信息加入到模型中,减小语料稀疏性对模型的影响。通过在Thchs30和ST-CMDS数据集对模型进行评估,结果显示,基于MCFN的BLSTM-CTC语音识别模型的识别字错误率(WER)较传统的语音识别模型有所降低。
展开更多
关键词
语音识别
多核卷积融合网络
端到端
子空间高斯混合模型
下载PDF
职称材料
基于SGMM和DNN结合提高音素识别率的研究
被引量:
1
4
作者
贾兵兵
曹辉
秦驰杰
《计算机工程与应用》
CSCD
北大核心
2019年第24期117-121,127,共6页
为降低声学特征在语音识别系统中的音素识别错误率,提高系统性能,提出一种子空间高斯混合模型和深度神经网络结合提取特征的方法,分析了子空间高斯混合模型的参数规模并在减少计算复杂度后将其与深度神经网络串联进一步提高音素识别率...
为降低声学特征在语音识别系统中的音素识别错误率,提高系统性能,提出一种子空间高斯混合模型和深度神经网络结合提取特征的方法,分析了子空间高斯混合模型的参数规模并在减少计算复杂度后将其与深度神经网络串联进一步提高音素识别率。把经过非线性特征变换的语音数据输入模型,找到深度神经网络结构的最佳配置,建立学习与训练更可靠的网络模型进行特征提取,通过比较音素识别错误率来判断系统性能。实验仿真结果证明,基于该系统提取的特征明显优于传统声学模型。
展开更多
关键词
声学特征
音素识别
子空间高斯混合模型
深度神经网络
下载PDF
职称材料
题名
基于BN-SGMM-HMM模型的低资源语音识别系统
被引量:
8
1
作者
雷杰
赵宏亮
艾宁智
邹万冰
詹毅
机构
辽宁大学物理学院
吉林大学电子科学与工程学院
中国科学院微电子研究所
出处
《合肥工业大学学报(自然科学版)》
CAS
北大核心
2021年第12期1627-1632,共6页
基金
国家重点研发计划资助项目(2019YFB2204601)。
文摘
针对语音识别系统在低资源条件下,采用传统的高斯混合-隐马尔可夫声学模型(GMM-HMM)会带来识别精度低、参数规模过大等问题,文章提出基于BN-SGMM-HMM的声学模型来解决GMM-HMM模型的不足。该模型在声学特征方面,通过基于瓶颈(bottleneck,BN)层的神经网络来进行提取,从而提高声学特征的可区分性与鲁棒性,同时在训练过程中引入Dropout策略来防止过拟合问题;在声学模型方面,采用子空间高斯混合模型(subspace Gaussian mixture model,SGMM),使得模型参数规模显著降低56.5%。同时,这两方面的改进也提升了低资源语音识别系统的识别率,TIMIT语音数据库实验表明,采用该模型,与GMM-HMM模型相比提高8.0%,与BN-GMM-HMM模型相比提高3.6%。这些优点对该模型在低功耗需求的硬件平台上实现部署有极大的帮助。
关键词
语音识别
瓶颈特征
子空间高斯混合模型
(SGMM)
Dropout策略
低资源
Keywords
speech recognition
bottleneck(BN)feature
subspace Gaussian mixture model(SGMM)
Dropout strategy
low resource
分类号
TP183 [自动化与计算机技术—控制理论与控制工程]
TN912 [电子电信—通信与信息系统]
下载PDF
职称材料
题名
采用词图相交融合的语音关键词检测方法
被引量:
4
2
作者
李鹏
屈丹
机构
解放军信息工程大学信息系统工程学院
出处
《信号处理》
CSCD
北大核心
2015年第6期702-709,共8页
基金
国家自然科学基金(61175017)
文摘
针对词图合并方法产生的词图冗余信息过多,规模较大,导致检索速度较慢的问题,本文提出了一种基于词图相交融合的语音关键词检测方法。首先,将不同语音识别系统产生的词图取交集,并对相同路径上的声学模型、语言模型得分进行得分融合;然后,对于融合后词图中存在的间断路径,直接利用性能最优的语音识别系统产生的词图进行补充,得到完整的融合词图;最后,在相交融合后的词图上进行关键词检测。实验表明,相交融合后的词图综合利用了各词图的得分信息,在基本不损失词图对正确内容覆盖率基础上,减少了冗余信息,有效降低了索引规模;并且在关键词检测性能ATWV指标下,基于词图相交融合的关键词检测方法相比词图合并方法相对提升5.3%。
关键词
子空间高斯混合模型
深层神经网络
相交词图
关键词检测
Keywords
subspace Gaussian mixture model
deep neural network
intersection lattice
keyword spotting
分类号
TN911.7 [电子电信—通信与信息系统]
下载PDF
职称材料
题名
基于多核卷积融合网络的BLSTM-CTC语音识别
被引量:
13
3
作者
刘晓峰
宋文爱
陈小东
郇晋侠
李志媛
机构
中北大学软件学院
出处
《计算机应用与软件》
北大核心
2021年第11期167-173,共7页
基金
国家自然科学基金项目(61602427)。
文摘
语音信号在传播过程中会产生持续时长不等的音素特征,这些特征会影响语音识别的正确率。针对这一问题,提出一种多核卷积融合网络(Multi-core Convolution Fusion Network, MCFN),用于对不同长度的音素特征进行标准化,用标准化后的特征训练语音识别模型。此外,还利用子空间高斯混合模型(Subspace Gaussian Mixture Model, SGMM)将一般说话者的语音和信息加入到模型中,减小语料稀疏性对模型的影响。通过在Thchs30和ST-CMDS数据集对模型进行评估,结果显示,基于MCFN的BLSTM-CTC语音识别模型的识别字错误率(WER)较传统的语音识别模型有所降低。
关键词
语音识别
多核卷积融合网络
端到端
子空间高斯混合模型
Keywords
Speech recognition
MCFN
End-to-End
SGMM
分类号
TP183 [自动化与计算机技术—控制理论与控制工程]
下载PDF
职称材料
题名
基于SGMM和DNN结合提高音素识别率的研究
被引量:
1
4
作者
贾兵兵
曹辉
秦驰杰
机构
陕西师范大学物理学与信息技术学院
出处
《计算机工程与应用》
CSCD
北大核心
2019年第24期117-121,127,共6页
基金
国家自然科学基金(No.1202020368,No.11074159,No.11374199)
文摘
为降低声学特征在语音识别系统中的音素识别错误率,提高系统性能,提出一种子空间高斯混合模型和深度神经网络结合提取特征的方法,分析了子空间高斯混合模型的参数规模并在减少计算复杂度后将其与深度神经网络串联进一步提高音素识别率。把经过非线性特征变换的语音数据输入模型,找到深度神经网络结构的最佳配置,建立学习与训练更可靠的网络模型进行特征提取,通过比较音素识别错误率来判断系统性能。实验仿真结果证明,基于该系统提取的特征明显优于传统声学模型。
关键词
声学特征
音素识别
子空间高斯混合模型
深度神经网络
Keywords
acoustic feature
phoneme recognition
subspace Gaussian mixture model
deep neural network
分类号
TN912.3 [电子电信—通信与信息系统]
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
基于BN-SGMM-HMM模型的低资源语音识别系统
雷杰
赵宏亮
艾宁智
邹万冰
詹毅
《合肥工业大学学报(自然科学版)》
CAS
北大核心
2021
8
下载PDF
职称材料
2
采用词图相交融合的语音关键词检测方法
李鹏
屈丹
《信号处理》
CSCD
北大核心
2015
4
下载PDF
职称材料
3
基于多核卷积融合网络的BLSTM-CTC语音识别
刘晓峰
宋文爱
陈小东
郇晋侠
李志媛
《计算机应用与软件》
北大核心
2021
13
下载PDF
职称材料
4
基于SGMM和DNN结合提高音素识别率的研究
贾兵兵
曹辉
秦驰杰
《计算机工程与应用》
CSCD
北大核心
2019
1
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部