距离加权矢量量化文本无关的说话人识别被引量：15

Text independent speaker recognition based on VQ and modified by the weighted distance

导出

摘要本文在研究说话人识别的矢量量化方法时，分析了用矢量量化建立说话人识别模型的可行性。针对量化码本描述的不完全性，提出了一种经距离加权的矢量量化方法，能更好地刻划出说话人语音特征空间的精细结构，从而提高正识率。本文还对特征参数ＬＰＣＣＥＰ的选取进行了理论分析和实验研究，提出了平均互—自差异比的概念，给出了一种对特征矢量的每一维分量识别能力进行定量化估算的公式。实验结果表明，距离加权矢量量化是一种具有很高正识率的与文本无关的说话人识别方法。 This paper analyses the feasibility of building the model based on vector quantization (VQ) in speaker recognition.We propose a weighted modification VQ to overcome the incompleteness of the description of the code book.By this method we can give a better description of the fine structure of the Speech Feature Space of the speaker and improve the recognition rate.We also theoretically discuss the selection of LPCCEP feature parameters and have verified it by experiments.Then we present a conception of the average mutuality self variance proportion and a formula for quantitatively estimating the recognition capability for each heft of feature vectors.The result of experiments indicates that the weighted modification VQ is a kind of highly efficient method with high performance for the Text |Independent Speaker Recognition.

作者张炜胡起秀吴文虎

机构地区清华大学计算机科学与技术系智能技术与系统国家重点实验室

出处《清华大学学报（自然科学版）》 EI CAS CSCD 北大核心 1997年第3期20-23,共4页 Journal of Tsinghua University(Science and Technology)

基金国家"八六三"高科技项目

关键词说话人识别文本无关矢量量化声音识别 speaker recognition independent text vector quantization

分类号 TP391.42 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献1

1陈永彬，语言信号处理，1990年

同被引文献57

1余良俊,张友纯.基于LPCC的话者识别系统[J].科技资讯,2007,5(31):1-2. 被引量：2
2闫友彪,陈元琰.机器学习的主要策略综述[J].计算机应用研究,2004,21(7):4-10. 被引量：56
3韩雁,陈利华.说话人计算机识别系统的设计与实现[J].浙江大学学报（工学版）,2001,35(2):165-169. 被引量：3
4汪峥,连翰,王建军.说话人识别中特征参数提取的一种新方法[J].复旦学报（自然科学版）,2005,44(1):197-200. 被引量：16
5张万里,刘桥.Mel频率倒谱系数提取及其在声纹识别中的作用[J].贵州大学学报（自然科学版）,2005,22(2):207-210. 被引量：20
6李财莲,赵小阳,王丽娟,岳振军.说话人识别中关键技术的现状与发展[J].军事通信技术,2005,26(2):62-65. 被引量：3
7张庆芳,赵鹤鸣.基于改进VQ算法的文本无关的说话人识别[J].计算机工程与应用,2006,42(10):65-68. 被引量：7
8白莹,赵振东,戚银城,王斌,郭建勇.基于小波神经网络的与文本无关说话人识别方法研究[J].电子与信息学报,2006,28(6):1036-1039. 被引量：7
9陈若珠,李战明,王贞.基于组合神经网络的与文本无关的说话人识别[J].兰州理工大学学报,2006,32(3):78-81. 被引量：2
10王金明,张雄伟.一种模糊高斯混合说话人识别模型[J].解放军理工大学学报（自然科学版）,2006,7(3):214-219. 被引量：5

引证文献15

1于哲舟,周春光,李佳慧,杨佳东.一种简单有效的说话人身份认证方法[J].吉林大学学报（信息科学版）,2003,21(S1):29-33. 被引量：1
2张歆奕.基于模拟退火算法的最优码本设计[J].五邑大学学报（自然科学版）,2004,18(4):21-26. 被引量：3
3许雯,董林,田家斌.一种改进的高斯混合模型算法[J].信息工程大学学报,2005,6(2):65-67. 被引量：7
4王永琦,邓琛,李世超,杨洋.噪声环境中基于GMM汉语说话人识别[J].微计算机信息,2005,21(11Z):177-178. 被引量：7
5张歆奕,吴今培,张有为,张其善.基于遗传算法的最优码本设计[J].信号处理,2006,22(3):412-416. 被引量：3
6朱浩冰,郭东辉.声纹识别系统原理及其关键技术[J].计算机安全,2007(9):14-17. 被引量：15
7徐利敏,唐振民,何可可,钱博.说话人识别中基于聚类特征的矢量量化技术[J].计算机工程与应用,2007,43(27):196-198. 被引量：2
8刘晓燕,傅鹂,周元.基于群模型改进的说话人确认系统[J].计算机应用与软件,2007,24(11):150-151.
9张鹏,王成儒.改进的基于VQ+WNN的说话人识别研究[J].无线电通信技术,2008,34(4):30-32.
10吕晶晶,陈娟,张培,马艳娥.基于VQ的语音识别技术研究[J].伺服控制,2011(4):68-69. 被引量：1

二级引证文献41

1于哲舟,杨佳东,周春光,王纲巧.智能仪器嵌入式声纹识别技术方法[J].仪器仪表学报,2004,25(z3):447-450. 被引量：4
2张超琼,苗夺谦,岳晓冬.基于高斯混合模型的语音性别识别[J].计算机应用,2008,28(S2):360-362. 被引量：1
3于哲舟,杨佳东,蒲东兵,周春光,王纲巧.多门限声纹识别方法[J].吉林大学学报（信息科学版）,2005,23(2):216-220. 被引量：1
4黄海斌,刘晓然.螺旋桨空泡与激光空泡的比较研究[J].微计算机信息,2006,22(07S):269-270.
5邹大勇,赵建军,薛长松.语音矢量量化全局最优问题的研究[J].河南大学学报（自然科学版）,2006,36(2):105-108.
6邱政权,尹俊勋.用于说话人辨认的基于重叠子帧的有效KLT[J].微计算机信息,2006,22(08Z):8-10.
7黄海斌,刘晓然.激光噪声与螺旋桨噪声的比较研究[J].舰船科学技术,2006,28(6):64-67.
8杨录.基于EMD法的语音信号特征提取[J].微计算机信息,2007(05X):228-229. 被引量：4
9韩春光,胡剑英,李华.改善含噪语音说话人辨认系统性能的方法[J].宁波大学学报（理工版）,2007,20(3):297-300.
10阮柏尧,张歆奕.人工免疫算法对遗传算法改进的仿真研究[J].五邑大学学报（自然科学版）,2007,21(4):30-34. 被引量：1

1杨采坚,吴敏金,张良仪.一种基于小波变换的矢量量化方法[J].华东师范大学学报（自然科学版）,1999(4):38-41.
2倪林,边肇祺,王文渊.基于小波变换的级间相关并行矢量量化方法[J].模式识别与人工智能,1995,8(1):57-63. 被引量：2
3张割,问建.基于BP网络的武器装备参数估算[J].航空计算技术,2005,35(1):20-22.
4林昌,康泰兆.基于自组织特征映射的矢量量化方法[J].南京理工大学学报,1999,23(5):393-396. 被引量：5
5李万臣,王炼.基于混合神经网络的图像分类矢量量化方法[J].应用科技,2006,33(6):21-23.
6郭立,王宁,朱嘉.图象的自适应遗传算法矢量量化方法[J].电脑与信息技术,1998,6(3):6-8.
7潘梅森,颜君彪.图像块动态调整的自适应差值补偿矢量量化[J].计算机工程与应用,2007,43(7):71-74. 被引量：1
8倪林,王文渊,边肇祺.小波变换域的尺度自适应矢量量化方法[J].模式识别与人工智能,1995,8(3):188-194.
9苏令华,万建伟.基于小波变换和形状-增益矢量量化的3维图像压缩[J].中国图象图形学报,2006,11(11):1610-1613. 被引量：1
10徐义春,沈沆瑜,周敦广,陈炼.一种改进的基于角度检测的实时指尖检测算法[J].三峡大学学报（自然科学版）,2014,36(6):103-107.

清华大学学报（自然科学版）

1997年第3期

浏览历史

内容加载中请稍等...

距离加权矢量量化文本无关的说话人识别被引量：15

参考文献1

同被引文献57

引证文献15

二级引证文献41

相关作者

相关机构

相关主题

浏览历史

距离加权矢量量化文本无关的说话人识别 被引量：15

参考文献1

同被引文献57

引证文献15

二级引证文献41

相关作者

相关机构

相关主题

浏览历史

距离加权矢量量化文本无关的说话人识别被引量：15