基于改进身份向量提取的短语音说话人确认被引量：3

Short Utterance Speaker Verification Based on Improved I-vector Extraction

下载PDF

导出

摘要针对现有i-vector说话人确认系统在测试语音为短语音时性能下降的问题,对短语音i-vector估计的不确定性进行分析,改进了i-vector提取中Baum-Welch统计量的计算.该方法利用赋予权重的历史测试信息以及通用背景模型中的参数信息来增加用于短语音Baum-Welch统计量计算的说话人个性信息.将改进统计量用于i-vector提取,针对不同时长短语音的实验表明,新系统的性能优于当前i-vector系统,等错误率(EER)和检测代价函数最小值(min DCF)分别下降了13~19%和8~23%. Aiming at the problem of the performance degradation of the existing i-vector system in the short utterance speaker verification task,an improved Baum-Welch statistic is proposed by analyzing the source of the i-vector estimation uncertainty. The pre-estimated background model parameter information as well as the weighted historical test speech information encountered by the system is included in improved Baum-Welch statistic. The improved statistic is applied to the extraction of the current test speech i-vector. Experiments on different duration test speech show that the performance of the improved i-vector based system is superior to the existing i-vector system,such as the equal error rate( EER) and the minimum detection cost function( min DCF) decreased by 13 ~ 19% and 8 ~ 23%,respectively.

作者王铮傅山 WANG Zheng;FU Shan(School of Electronic Information and Electrical Engineering,Shanghai Jiao Tong University,Shanghai 200240,China)

机构地区上海交通大学电子信息与电气工程学院

出处《小型微型计算机系统》 CSCD 北大核心 2019年第11期2264-2268,共5页 Journal of Chinese Computer Systems

基金国家电网公司华东分部科技项目(SA0301503)资助

关键词说话人确认短语音高斯混合模型身份向量模型自适应 speaker verification short utterance Gaussian mixture model i-vector model adaptation

分类号 TP391 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献3

1李琳,万丽虹,洪青阳,张君,李明.基于概率修正PLDA的说话人识别系统[J].天津大学学报（自然科学与工程技术版）,2015,48(8):692-696. 被引量：4
2屈召贵,鲁顺昌.说话人识别的不确定性i-vector分析[J].计算机工程与设计,2017,38(6):1647-1650. 被引量：5
3张涛涛,陈丽萍,蒋兵,戴礼荣.采用深度神经网络的说话人特征提取方法[J].小型微型计算机系统,2017,38(1):142-146. 被引量：8

二级参考文献16

1Reynolds D, Quatieri T, Dunn R. Speaker verification using adapted Gaussian mixture models [J]. Digital Sig- nalProcess, 2000, 10(1/2/3): 19-41.
2Kenny P, Boulianne G, Dumouchel P. Eigenvoice modeling with sparse training data[J]. IEEE Trans Speech andAudio Process, 2005, 13 (3) : 345-354.
3Kenny P, Boulianne G, Ouellet P, et al. Joint factor analysis versus eigenchannels in speaker recognition [J]. IEEE Trans on Audio Speech Lang Process, 2007,15(4) : 1435-1447.
4Dehak N, Kenny P, Dehak R, et al. Front-end factor analysis for speaker verification[J]. IEEE Trans on Au- dio Speech LangProcess, 2011, 19 (4) : 788-798.
5Prince S, Elder J. Probabilistic linear discriminant analysis for inferences about identity [C]//Proc Computer Nsion. Rio de Janeiro, Brazil, 2007 : 1-8.
6Cumani S, Plchot O, Laface P. On the use of i-vector posterior distributions in probabilistic linear discriminant analysis [J]. IEEE Tran on Audio Speech Lang Process, 2014, 22(4): 846-857.
7Sarkar A, Matrouf D, Bousquet P, et al. Study of the effect of i-vector modeling on short and mismatch utter- ance duration for speaker verification[C]// Proc Inter- Speech. Portland, USA, 2012: 2661-2664.
8Kenny P, Stafylakis T, Quellet P, et al. PLDA for speaker verification with utterances of arbitrary duration [C]// Proc Acoustics, Speech and Signal Processing. Vancouver, Canada, 2013: 7649-7653.
9Hasan T, Saeidi R, Hansen J, et al. Duration mis- match compensation for i-vector based speaker recognition systems[C]// Proc Acoustics, Speech and Signal Processing. Vancouver, Canada, 2013: 7663-7667.
10Kanagasundaram A, Dean D, Sridharan S, et al. Im- proving short utterance i-vector speaker verification using utterance variance modeling and compensation tech- niques[J]. IEEE Trans Speech Communication, 2014, 59 : 69-82.

共引文献13

1李湾湾,范承志,祁才君.基于改进MFD的I-Vector说话人识别[J].电声技术,2016,40(12):43-48. 被引量：1
2缑新科,王跃.基于T矩阵归一化PLDA的说话人确认[J].计算机与现代化,2017(10):53-56.
3茅正冲,王俊俊.基于耳蜗倒谱系数和Teager能量算子相位融合的说话人识别系统[J].南京理工大学学报,2018,42(1):82-88. 被引量：4
4侯慧玲,王崇霞.高能量无线传感网络隐藏异常结构数据识别[J].计算机仿真,2018,35(10):309-312. 被引量：2
5甄倩倩,张庭亮.说话人识别综述[J].科技资讯,2017,15(25):241-243. 被引量：1
6赵雪章,席运江,黄雄波.动作识别中基于深度神经网络和GA合并算法的分类决策方法[J].计算机应用研究,2019,36(7):2232-2236. 被引量：4
7屈召贵.基于窗函数法的FIR数字滤波器设计[J].信息技术与网络安全,2019,38(9):85-89. 被引量：7
8茅正冲,王俊俊,黄舒伟.基于PLDA信道补偿的说话人识别算法[J].计算机与数字工程,2019,47(11):2757-2762. 被引量：2
9董元菲,王康.基于频域卷积和三元组损失的端到端声纹识别[J].电子设计工程,2020,28(13):154-159. 被引量：2
10南兆营.基于参数迁移和C-LSTM的说话人识别研究[J].电声技术,2020,44(11):37-41. 被引量：1

同被引文献21

1徐晓娜,穆志纯,潘秀琴,赵悦.基于KCCA的特征融合方法及人耳人脸多模态识别[J].华南理工大学学报（自然科学版）,2008,36(9):117-121. 被引量：3
2林琳,陈虹,陈建,金焕梅.基于多核SVM-GMM的短语音说话人识别[J].吉林大学学报（工学版）,2013,43(2):504-509. 被引量：11
3酆勇,熊庆宇,石为人,曹俊华.一种基于受限玻尔兹曼机的说话人特征提取算法[J].仪器仪表学报,2016,37(2):256-262. 被引量：19
4田垚,蔡猛,何亮,刘加.基于深度神经网络和Bottleneck特征的说话人识别系统[J].清华大学学报（自然科学版）,2016,56(11):1143-1148. 被引量：13
5吴礼福,申浩.掩蔽法减少谱减法去混响中的音乐噪声[J].电子测量与仪器学报,2017,31(11):1855-1859. 被引量：4
6孙念,张毅,林海波,黄超.基于多特征i-vector的短语音说话人识别算法[J].计算机应用,2018,38(10):2839-2843. 被引量：6
7王昕,张洪冉.基于DNN处理的鲁棒性I-Vector说话人识别算法[J].计算机工程与应用,2018,54(22):167-172. 被引量：11
8陈楠,鲍长春.基于双耳线索编码原理的语音增强方法[J].电子学报,2019,47(1):227-233. 被引量：3
9周萍,沈昊,郑凯鹏.基于MFCC与GFCC混合特征参数的说话人识别[J].应用科学学报,2019,37(1):24-32. 被引量：44
10田广,徐庆安,杨宇,吕志强,李慧.不同偏压下红外探测器噪声测试系统的设计[J].红外与激光工程,2019,48(3):54-60. 被引量：3

引证文献3

1肖鑫鑫.复杂噪声环境下的普通话测试系统设计[J].信息技术,2020,44(11):78-82. 被引量：1
2瞿于荃,龙华,段荧,邵玉斌,杜庆治.联合总变率空间和时延神经网络的说话人识别[J].计算机科学与探索,2021,15(7):1255-1264. 被引量：1
3龙华,瞿于荃,段荧.一种基于核典型关联分析的短语音说话人嵌入向量算法[J].小型微型计算机系统,2021,42(11):2269-2275. 被引量：2

二级引证文献4

1王瑶,龙华,邵玉斌,杜庆治.可变时长的短时广播语音多语种识别[J].云南大学学报（自然科学版）,2022,44(3):490-496. 被引量：2
2王莉莉.郴州市普通话测试站公共服务能力提升研究[J].产业与科技论坛,2022,21(17):219-220. 被引量：2
3张霞,刘乾,郭倩,梁新彦,钱宇华,畅江.强调信息传播和特征分布的说话人验证模型:EIPFD-ResNet[J].小型微型计算机系统,2023,44(3):463-470. 被引量：1
4蒋世炜,钱宇华,原之安,梁新彦.生成式与对比式耦合的声纹识别自监督预训练方法[J].小型微型计算机系统,2024,45(8):1847-1853. 被引量：1

1本刊对文稿中统计结果解释和表达的要求[J].广西医学,2019,41(20):2675-2675.
2范镇宁.高中物理解题过程中学生自我监控能力的培养[J].知识窗（教师版）,2019(10):49-49.
3刘艳红.高速公路路面病害成因及解决措施[J].四川建材,2019,45(11):218-218.
4陈华明,曾春山.“低差错率”哪里来?——瑞金市加强第三次全国国土调查工作的做法[J].自然资源通讯,2019,0(19):45-46.
5张平亮.新型食品过滤与分离装置的特性及其应用[J].食品工业,2019,40(10):237-238. 被引量：1
6杜永峰,崔旺,李虎.铅芯橡胶隔震支座火灾中温度场及其火灾后力学性能的数值模拟[J].兰州理工大学学报,2019,45(5):115-119. 被引量：2
7黄寅.初中物理解题方法指导的有效方法[J].数理化解题研究,2019,0(32):42-43. 被引量：3
8本刊编辑部.关于投稿的统计学要求[J].军事医学,2019,43(5):329-329.
9张仕平.输电线路的冰灾预警与应急响应系统[J].集成电路应用,2019,36(11):64-65.
10周正康.城市隧道入口交通信号灯的动态控制与优化[J].现代城市研究,2019,34(10). 被引量：3

小型微型计算机系统

2019年第11期

浏览历史

内容加载中请稍等...

基于改进身份向量提取的短语音说话人确认被引量：3

参考文献3

二级参考文献16

共引文献13

同被引文献21

引证文献3

二级引证文献4

相关作者

相关机构

相关主题

浏览历史

基于改进身份向量提取的短语音说话人确认 被引量：3

参考文献3

二级参考文献16

共引文献13

同被引文献21

引证文献3

二级引证文献4

相关作者

相关机构

相关主题

浏览历史

基于改进身份向量提取的短语音说话人确认被引量：3