基于改进MFD的I-Vector说话人识别被引量：1

Improving MFD technique for I-Vector based speaker recognition

下载PDF

导出

摘要基于I-Vector的说话人识别系统通常采用LDA进行信道补偿和特征降维,在开发集样本有限的情况下,LDA的区分性不强。基于此,提出一种改进I-Vector说话人确认算法。在话者样本数较少的情况下,以中值i向量代替均值i向量作为集中统计量可以减少区分信息的丢失。随着样本数量增加,改进中值分类器,采用去最大最小值后求均值的方法作为i向量的集中趋势。用此方法计算类间与类内离散度矩阵后,对i向量进行信道补偿和降维。结合高斯PLDA模型,以LDA和WCCN为基线系统进行仿真对比。实验结果表明,提出的算法具有良好的区分性能,在有限的话者语音样本数量范围内,与基线相比能提升总和约3%的性能。 I-Vector based speaker recognition system usually uses LDA technique for channel compensation and feature di- mension reduction, in the case of limited session development data, the separation ability of LDA is not obvious. Aiming at this problem, an improving I-Vector speaker verification algorithm is proposed using MFD technique. By taking the median as the estimator for the central tendency, instead of the mean, the MFD approach helps to attenuate the loss. And then get rid of the maximum and minimum values for average in the case of more samples. This improved MFD estimation is performed by calculating the between-and within-class scatter estimations for channel compensation and dimension reduction. Combining PLDA model, the experiments on different session development data using the techniques mentioned above are conducted compared with that of LDA method. The results show obvious improvement in separating different speakers, and the EER has a 3% reduction within the overall development data.

作者李湾湾范承志祁才君

机构地区浙江大学电气工程学院

出处《电声技术》 2016年第12期43-48,共6页 Audio Engineering

关键词说话人识别 i向量 PLDA模型线性区分性分析改进中值分类器信道补偿 speaker recognition I-Vector PLDA model LDA improved MFD channel compensation

分类号 TN912.3 [电子电信—通信与信息系统]

引文网络
相关文献

参考文献8

1杨阳,陈永明.声纹识别技术及其应用[J].电声技术,2007,31(2):45-46. 被引量：22
2周国鑫,高勇.基于GMM-UBM模型的说话人辨识研究[J].无线电工程,2014,44(12):14-17. 被引量：5
3郭武,李轶杰,戴礼荣,王仁华.说话人识别中的因子分析以及空间拼接[J].自动化学报,2009,35(9):1193-1198. 被引量：14
4邢玉娟,潘颖,曹晓丽.改进i-向量说话人识别算法研究[J].科学技术与工程,2014,22(34):224-228. 被引量：2
5许云飞,周若华,颜永红.基于PLDA的多信道多语音说话人确认研究[J].网络新媒体技术,2014,3(1):13-19. 被引量：3
6李琳,万丽虹,洪青阳,张君,李明.基于概率修正PLDA的说话人识别系统[J].天津大学学报（自然科学与工程技术版）,2015,48(8):692-696. 被引量：4
7王明合,唐振民,张二华.基于i-vector局部加权线性判别分析的说话人识别[J].仪器仪表学报,2015,36(12):2842-2848. 被引量：6
8栗志意,何亮,张卫强,刘加.基于鉴别性i-vector局部距离保持映射的说话人识别[J].清华大学学报（自然科学版）,2012,52(5):598-601. 被引量：11

二级参考文献83

1宋淼,李敬阳.浅谈声纹检验鉴定技术[J].北京人民警察学院学报,2005(2):35-36. 被引量：6
2李晔,张仁智,崔慧娟,唐昆.低信噪比下基于谱熵的语音端点检测算法[J].清华大学学报（自然科学版）,2005,45(10):1397-1400. 被引量：37
3林奕琳,韦岗,杨康才.语音情感识别的研究进展[J].电路与系统学报,2007,12(1):90-98. 被引量：33
4Reynolds D A, Quatieri T F, Dunn R B. Speaker verification using adapted Gaussian mixture models. Digital Signal Processing, 2000, 10(1-3): 19-41.
5Campbell W M, Sturim D E, Reynolds D A. Support vector machines using GMM supervectors for speaker verification. IEEE Signal Processing; Letters, 2006, 13(5): 308-311.
6Kenny P, Boulianne G, Ouellet P, Dumouchel P. Speaker and session variability in GMM-based speaker verification. IEEE Transactions on Audio, Speech, and Language Processing, 2007, 15(4): 1448-1460.
7Vogt R, Sridharan S. Experiments in session variability modeling for speaker verification. In: Proceedings of International Conference on Acoustics, Speech, and Signal Processing. Toulouse, France: IEEE, 2006. 897-900.
8Castaldo F, Colibro D, Dalmasso E, Laface P, Vair C. Compensation of nuisance factors for speaker and language recognition. IEEE Transactions on Audio, Speech, and Language Processing, 2007, 15(7): 1969-1978.
9Kenny P, Ouellet P, Dehak N, Gupta V, Dumouchel P. A study of inter-speaker variability in speaker verification. IEEE Transactions on Audio, Speech, and Language Processing, 2008, 16(5): 980-988.
10Kenny P, Boulianne G, Dumouchel P. Eigenvoice modeling with sparse training data. IEEE Transactions on Audio, Speech, and Lnnguage Processing, 2005, 13(3): 345-354.

共引文献55

1郭慧娟.声纹识别的特征参数提取[J].太原师范学院学报（自然科学版）,2008,7(1):70-73. 被引量：7
2单进.说话人识别技术研究[J].科技资讯,2010,8(21):3-3. 被引量：1
3董桂官,沈勇.基于耳语频谱比较的话者识别方法[J].电声技术,2011,35(4):51-52. 被引量：1
4何亮,史永哲,刘加.联合因子分析中的本征信道空间拼接方法[J].自动化学报,2011,37(7):849-856. 被引量：8
5沈巍.声纹识别技术在社保生存验证中的应用[J].中国科技博览,2011(36):632-633.
6姜涛,韩纪庆,郑铁然.基于高斯混合模型移动因子补偿的说话人识别方法[J].声学学报,2011,36(6):658-664. 被引量：3
7唐夫乾,汪亚明,郑俊褒.基于LabVIEW的语音身份认证系统[J].工业控制计算机,2011,24(12):22-23. 被引量：1
8顾晓江,赵鹤鸣,吕岗.模型与特征混合补偿法及其在耳语说话人识别中的应用[J].声学学报,2012,37(2):198-203. 被引量：4
9刘建,闫仁武.基于遗传优化RBF神经网络的声纹识别研究[J].信息技术,2012,36(5):168-170. 被引量：4
10杨海,张翔,梁春燕,索宏彬,颜永红.联合因子分析和稀疏表示在稳健性说话人确认中的应用[J].声学学报,2012,37(5):548-552. 被引量：7

同被引文献11

1邢玉娟,潘颖,曹晓丽.改进i-向量说话人识别算法研究[J].科学技术与工程,2014,22(34):224-228. 被引量：2
2李琳,万丽虹,洪青阳,张君,李明.基于概率修正PLDA的说话人识别系统[J].天津大学学报（自然科学与工程技术版）,2015,48(8):692-696. 被引量：4
3陈建涛,陈维娜.基于文本无关的话者识别技术综述[J].电脑知识与技术,2016,0(1):189-191. 被引量：1
4申铉京,翟玉杰,卢禹彤,王玉,陈海鹏.基于信道补偿的说话人识别算法[J].吉林大学学报（工学版）,2016,46(3):870-875. 被引量：3
5林舒都,邵曦.基于i-vector和深度学习的说话人识别[J].计算机技术与发展,2017,27(6):66-71. 被引量：10
6屈召贵,鲁顺昌.说话人识别的不确定性i-vector分析[J].计算机工程与设计,2017,38(6):1647-1650. 被引量：5
7茅正冲,王俊俊,黄舒伟.基于PLDA信道补偿的说话人识别算法[J].计算机与数字工程,2019,47(11):2757-2762. 被引量：2
8周玥媛,孔钦.基于GMM-UBM的声纹识别技术的特征参数研究[J].计算机技术与发展,2020,30(5):76-83. 被引量：16
9张笑宇,汤汶,万韬阮,朱耀麟,武桐.混合现实系统中标志物识别的改进ORB算法[J].西安工程大学学报,2020,34(4):57-63. 被引量：4
10范军,巩杰,吴茜凤,何虎.基于FPGA的RNN加速SoC设计与实现[J].微电子学与计算机,2020,37(11):1-5. 被引量：5

引证文献1

1罗家诚.基于改进信道补偿的I-vector说话人识别[J].电子设计工程,2021,29(20):96-100. 被引量：1

二级引证文献1

1景维鹏,肖庆欣,罗辉.基于概率球面判别分析的说话人识别信道补偿算法[J].计算机应用,2024,44(2):556-562.

1李琳,万丽虹,洪青阳,张君,李明.基于概率修正PLDA的说话人识别系统[J].天津大学学报（自然科学与工程技术版）,2015,48(8):692-696. 被引量：4
2张银龙,楼建东,杜峰,欧阳凯.利用加载技术设计对数周期天线及其结果分析[J].信息工程大学学报,2010,11(4):411-414. 被引量：2
3张美敦.模场直径[J].光通信,2003(3):67-67.
4王炜,王波,王炳锡.一个新的基于融合的说话人确认系统及DSP的实时实现[J].信号处理,2004,20(6):586-589.
5胡群威,吴明辉,李辉.利用时长信息提高说话人确认系统的鲁棒性[J].微型机与应用,2016,35(11):51-55.
6张卫平,吴兆麟,赵徐森,龚绍文.功率因数校正器的三频分析法[J].电子学报,1997,25(11):46-48. 被引量：1
7王品,黄焱,王超,杨华.基于自相关的宽范围高精度频偏估计算法[J].计算机工程,2011,37(4):102-103. 被引量：4
8林延东,李平,李熙.连续变孔径法单模光纤模场直径(MFD)测量的数据处理[J].现代计量测试,1999,7(5):29-31. 被引量：1
9李国成,梁桂香.单模光纤连接损耗研究[J].光通信技术,1992,16(3):216-219. 被引量：1
10谢毅.单模色散位移光纤的高斯近似理论[J].通信学报,1997,18(10):26-30.

电声技术

2016年第12期

浏览历史

内容加载中请稍等...

基于改进MFD的I-Vector说话人识别被引量：1

参考文献8

二级参考文献83

共引文献55

同被引文献11

引证文献1

二级引证文献1

相关作者

相关机构

相关主题

浏览历史

基于改进MFD的I-Vector说话人识别 被引量：1

参考文献8

二级参考文献83

共引文献55

同被引文献11

引证文献1

二级引证文献1

相关作者

相关机构

相关主题

浏览历史

基于改进MFD的I-Vector说话人识别被引量：1