采用深度神经网络的说话人特征提取方法被引量：8

Novel Method for Speaker Feature Extraction Using Deep Neural Network

下载PDF

导出

摘要在说话人确认中,通常采用的声学特征(如MFCC,PLP特征等)包含的主要是文本信息和信道信息,说话人信息属于其中的弱信息,极易受到语音信号中的文本信息及信道、噪声等干扰的影响.针对这个问题,提出一种基于深度神经网络提取语音信号中说话人特征的方法,该方法用语音识别深度神经网络各个隐层非线性输出值来提取说话人特征.在RSR2015数据库上开展了GMM-UBM文本无关和文本相关说话人确认实验,实验结果表明本文方法提取的特征相对于传统的MFCC特征,系统等错误率(Equal Error Rate,EER)有了明显的下降. In speaker verification, Acoustic features （ e. g. MFCC, PLP, etc. ） that are frequently used contain speech content and chan- nel information mainly, speaker information is a kind of weak information contained in speech signal, which may be affected easily by other information and disturbance contained in speech signal such as speech content, channel variation, and noise. To address this prob- lem,this paper proposes a new way of speaker feature extraction based on deep neural network for ASR, which uses nonlinear output of hidden layers in DNN. Text-independent and text-dependent GMM-UBM experiments on RSR2015 database showed that the pro- posed method can achieve a valid performance gain over the MFCC feature on EER.

作者张涛涛陈丽萍蒋兵戴礼荣

机构地区中国科学技术大学语音及语言信息处理国家工程实验室百度在线网络技术有限公司

出处《小型微型计算机系统》 CSCD 北大核心 2017年第1期142-146,共5页 Journal of Chinese Computer Systems

基金国家自然科学基金项目(61273264)资助

关键词说话人确认深度神经网络 DN特征 speaker verification deep neural network DN feature

分类号 TP391 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

同被引文献54

1刘敬伟,徐美芝,郑忠国,程乾生.基于DTW的语音识别和说话人识别的特征选择[J].模式识别与人工智能,2005,18(1):50-54. 被引量：13
2高慧,苏广川,陈善广.基于Teager能量算子(TEO)非线性特征的语音情绪识别[J].航天医学与医学工程,2005,18(6):427-431. 被引量：8
3于明,袁玉倩,董浩,王哲.一种基于MFCC和LPCC的文本相关说话人识别方法[J].计算机应用,2006,26(4):883-885. 被引量：14
4刘庆华.基于声门闭合瞬间检测的时延算法研究[J].电声技术,2006,30(9):45-49. 被引量：1
5张喜宁.说话人识别技术——语音特征参数提取及组合[J].科技资讯,2009,7(34):231-232. 被引量：2
6蒋晔,唐振民.GMM文本无关的说话人识别系统研究[J].计算机工程与应用,2010,46(11):179-182. 被引量：27
7李燕萍,唐振民,丁辉,张燕.一种适于说话人辨认的自适应频率尺度变换[J].南京理工大学学报,2010,34(2):182-186. 被引量：2
8胡玉良,王海滨,陈健,江钟伟,乔军选.心音时域分析的新方法研究[J].生物医学工程学杂志,2010,27(2):425-428. 被引量：8
9张飞云,张鹏,高建生.噪声环境中基于DTW的说话人识别[J].许昌学院学报,2011,30(5):68-72. 被引量：1
10檀蕊莲,柏鹏,李哲,姚战宏,栾前进.基于小波变换的说话人识别技术[J].空军工程大学学报（自然科学版）,2013,14(1):85-89. 被引量：3

引证文献8

1茅正冲,王俊俊.基于耳蜗倒谱系数和Teager能量算子相位融合的说话人识别系统[J].南京理工大学学报,2018,42(1):82-88. 被引量：4
2侯慧玲,王崇霞.高能量无线传感网络隐藏异常结构数据识别[J].计算机仿真,2018,35(10):309-312. 被引量：2
3甄倩倩,张庭亮.说话人识别综述[J].科技资讯,2017,15(25):241-243. 被引量：1
4赵雪章,席运江,黄雄波.动作识别中基于深度神经网络和GA合并算法的分类决策方法[J].计算机应用研究,2019,36(7):2232-2236. 被引量：4
5王铮,傅山.基于改进身份向量提取的短语音说话人确认[J].小型微型计算机系统,2019,40(11):2264-2268. 被引量：3
6南兆营.基于参数迁移和C-LSTM的说话人识别研究[J].电声技术,2020,44(11):37-41. 被引量：1
7南兆营.基于声纹图和网络迁移的说话人识别[J].网络安全技术与应用,2021(6):35-38. 被引量：1
8陈伟,孙强,齐月月,徐晨.深度卷积神经网络在心音分类方法中的应用[J].计算机工程与应用,2021,57(16):182-189. 被引量：3

二级引证文献19

1张俊,李昌.基于LSTM多传感器数据融合人体行为识别方法[J].芜湖职业技术学院学报,2021,23(2):32-35. 被引量：4
2贾艳洁,陈曦,于洁琼,王连明.基于特征语谱图和自适应聚类SOM的快速说话人识别[J].科学技术与工程,2019,19(15):211-218. 被引量：6
3欧阳柏成,王俊炀.基于多重加权树的无线传感网络数据库查询系统设计[J].信息通信,2019,0(6):10-11. 被引量：1
4朱祥.基于隐马尔可夫模型和聚类的英语语音识别混合算法[J].计算机测量与控制,2020,28(5):175-179. 被引量：15
5张辉,王杨,李昌,张鑫,赵传信.基于深度神经决策森林的体域网数据融合方法[J].计算机应用研究,2020,37(8):2329-2332. 被引量：3
6肖鑫鑫.复杂噪声环境下的普通话测试系统设计[J].信息技术,2020,44(11):78-82. 被引量：1
7唐文秀,李长宇.三相风力发电机低电压穿越控制方法仿真[J].计算机仿真,2021,38(1):71-75. 被引量：2
8王家盛,郭其威,吴松,马建敏.基于特征相对贡献度对加权Mel倒谱的改进[J].声学技术,2021,40(3):408-414. 被引量：4
9瞿于荃,龙华,段荧,邵玉斌,杜庆治.联合总变率空间和时延神经网络的说话人识别[J].计算机科学与探索,2021,15(7):1255-1264. 被引量：1
10龙华,瞿于荃,段荧.一种基于核典型关联分析的短语音说话人嵌入向量算法[J].小型微型计算机系统,2021,42(11):2269-2275. 被引量：2

1俞振利,张礼和.从任意连续语音中实时提取说话人特征及三维显示[J].杭州大学学报（自然科学版）,1992,19(4):390-397.
2宋凌.基于主成分分析的说话人特征变换研究[J].电子技术与软件工程,2013(17):241-243. 被引量：1
3田秀华,刘红光.基于类内类间距离的说话人特征优化[J].计算机应用与软件,2015,32(11):151-153.
4张晶,范明,冯文全,董金明.基于MFCC参数的说话人特征提取算法的改进[J].电声技术,2009,33(9):61-64. 被引量：16
5罗旭.基于粒子群优化的球杆系统的离散化输出调节[J].数字技术与应用,2013,31(11):74-75. 被引量：1
6项要杰,杨俊安,李晋徽,杨瑞国.关联小波神经网络与高斯混合模型说话人识别[J].探测与控制学报,2013,35(6):65-70. 被引量：1
7何朝霞,潘平,罗辉.基于非线性共振的说话人特征提取研究与仿真[J].科学技术与工程,2012,20(25):6507-6510. 被引量：4
8杨江,陆源,李治.仿真模型预测能力的度量方法研究[J].仪器仪表学报,2002,23(z2):465-466.
9陈健,靳浡.PCI Express技术分析[J].高性能计算技术,2004,0(5):19-22. 被引量：3
10潘平,何朝霞.基于duffing随机共振的说话人特征提取方法[J].计算机工程与应用,2012,48(35):123-125. 被引量：4

小型微型计算机系统

2017年第1期

浏览历史

内容加载中请稍等...

采用深度神经网络的说话人特征提取方法被引量：8

同被引文献54

引证文献8

二级引证文献19

相关作者

相关机构

相关主题

浏览历史

采用深度神经网络的说话人特征提取方法 被引量：8

同被引文献54

引证文献8

二级引证文献19

相关作者

相关机构

相关主题

浏览历史

采用深度神经网络的说话人特征提取方法被引量：8