基于可区分性加权的模糊核说话人识别被引量：2

A Fuzzy Kernel with Discriminative Weighted Method for Speaker Recognition

下载PDF

导出

摘要针对训练和识别语音数据较少的情况,本文提出了一种新的说话人识别算法.通过核映射,在高维特征空间对说话人的语音特征进行模糊矢量量化.为了增加说话人之间的可区分性,提出了一种基于高维特征空间的码字矢量的权值分配方法,对具有较强区分性的码字矢量分配较大的权值,并将产生的权值和说话人的码书一起形成说话人数据库.识别时,提出一种模糊核加权最近邻近分类器,在高维特征空间中对说话人进行匹配.实验表明,该算法在训练语音少于8s,识别语音为1s时,能够得到较好的识别结果. As to small amounts of training and test speech data, it proposed a new speaker recognition algorithm. By the kernel mapping,it used the fuzzy vector quantization to quantize the speakers＇ speech features in the high dimensional feature space.in order to improve the discriminations of different speakers, it presented a novel weights assignment method. It assigned the lager weight to the code vector with higher discriminative power. Then, it used the codebooks and weights to form the speakers＇ database. In the matching phase, it proposed a fuzzy kernel weighted nearest prototype classifier, which can identify different speakers in the high dimensional space.Experimental results show that when the Iraining speech data is less than 8s,and test speech data is 1 s, this algorithm can get good performance.

作者林琳王树勋陈建

机构地区吉林大学通信工程学院

出处《电子学报》 EI CAS CSCD 北大核心 2008年第7期1446-1450,共5页 Acta Electronica Sinica

关键词说话人识别少量语音数据可区分性权值模糊核加权最近邻近分类器模糊核矢量量化 speaker recognition small amounts of speech data discriminative weighted value fuzzy kernel weighted nearest prototype classifier fuzzy kernel vector qnantization.

分类号 TN912.3 [电子电信—通信与信息系统]

引文网络
相关文献

参考文献13

1Tomi Kinnunen, Evgeny Karpov, Pasi Franti. Real-Time speaker identification and verification[ J]. IEEE Transactions on Audio, Speech,and Language Processing, 2006,14( 1 ) :277 - 288.
2Yang Yao-yuan, Chen Wei, Lu Yu-dong,. etc. Research of speaker identification based on little training data[ A]. Proceeding of the 3rd International Conference on Machine Learning and Cybernetics[ C]. shanghai: IEEE Press, 2004.26 - 29.
3Matsui T, Furui S. Comparison of text-independent speaker recognition methods using VQ-distortion and discrete/continuous HMMs[ A ]. Proceeding of IEEE International Conference on Acoustic, Speech, Signal Processing [C]. San Francisco: IEEE Press, 1991. Ⅱ -157 - 160.
4Tran D, Wagner M, Van Le T. A proposed decision rule for speaker recognition based on fuzzy c-means clustering[A ] .5th International Conference on Spoken Language Processing, ICSLP'98[C]. Sydney Australia: Australian Speech Science and Technology Association, Incorporated (ASSTA), 1998. 755 - 758.
5吴晓娟,韩先花,聂开宝.模糊C-均值(FCM)聚类法与矢量量化法相结合用于说话人识别[J].电子与信息学报,2002,24(6):845-849. 被引量：7
6王成儒,王金甲.模糊C-均值聚类新算法在说话人辨认中的应用[J].计算机工程与应用,2003,39(27):94-95. 被引量：2
7董国华.一种改进的聚类算法及其在说话人识别上的应用[J].微计算机信息,2004,20(9):134-135. 被引量：10
8林琳,王树勋.基于遗传-模糊聚类的说话人识别方法及其仿真研究[J].系统仿真学报,2006,18(8):2338-2341. 被引量：13
9张玲华,杨震,郑宝玉.基于模糊分类器及多层前馈神经网络混合结构的说话人辨认[J].通信学报,2005,26(11):68-75. 被引量：4
10Lin Lin, Wang Shu-xun.A kernel method for speaker recognition with little data[ A ]. The 8th International Conference on Signal Processing(ICSP' 06) [C]. Beijing: IEEE Press, 2006. 1:716-719.

二级参考文献31

1刘静,钟伟才,刘芳,焦李成.免疫进化聚类算法[J].电子学报,2001,29(z1):1868-1872. 被引量：43
2刘健庄,谢维信,黄建军,李文化.聚类分析的遗传算法方法[J].电子学报,1995,23(11):81-83. 被引量：27
3朱民维.计算机语音技术[M].北京:北京航空航天大学出版社,1991.39-86.
4马卡尔娄乃英（译）.语音信号线性预测（第一章）[M].北京:中国铁道出版社,1997..
5刘增良.模糊技术与神经网络技术选编[M].北京:北京航天航空大学出版社,1995.120-157.
6F Soong et al.A vector quantization approach to speaker recognition[J]. IEEE ICASSP, 1985:387-390.
7K S Asultan,S Selim.A global algorithm for the fuzzy clustering problem[J].Pattem Recognition, 1993 ;26(9) : 1357-1361.
8CAMPBELL J P. Speaker recognition: a tutorial[J]. Proceedings of the IEEE, 1997,85(9): 1437-1462.
9PETRY A, BARONE D A C. Speaker identification using nonlinear dynamical feature[J]. Chaos, Solitons & Fractals, 2002, 13(2):221-231.
10WAN V, CAMPBELL W M. Support vector machines for speaker verification and identification[A]. Proceedings of the 2000 IEEE Signal Processing Society Workshop[C]. 2000. 775-784.

共引文献30

1张耿,苗丽,孙振伟.阳极焙烧中温度的软测量[J].微计算机信息,2008,24(4):292-293.
2李晓波,闫道儒,顾煜炯.数据均值聚类在故障模式识别中的应用[J].中国电力教育,2005(z1):249-251.
3张吉稳,何汉武,胡兆勇.基于虚拟环境的汽车驾驶安全预警方法[J].系统仿真学报,2009,21(S1):234-237. 被引量：1
4石硕,杨林根,张蒲生.基于稀松密度的多目标优化演化算法[J].微计算机信息,2006,22(07X):186-188.
5林琳,王树勋.基于遗传-模糊聚类的说话人识别方法及其仿真研究[J].系统仿真学报,2006,18(8):2338-2341. 被引量：13
6林琳,王树勋.基于自适应小生境混合遗传算法的说话人识别[J].电子学报,2007,35(1):8-12. 被引量：9
7贾振超,赵耀,朱振峰.应用对象语义进行图像检索的新方法[J].铁道学报,2007,29(4):111-114. 被引量：4
8杨升,常胜,侯丽.机器学习在计算机免疫中的应用[J].微计算机信息,2007,23(30):193-194.
9李炜,苗丽,张耿.Bootstrap与模糊聚类在管道泄漏检测中研究[J].微计算机信息,2007,23(31):292-294.
10周顺先,林亚平,王耀南,易叶青.基于聚簇隐马尔可夫模型的文本信息抽取[J].系统仿真学报,2007,19(21):4926-4931. 被引量：2

同被引文献16

1安冬,王守觉.基于仿生模式识别和PCA/ICA的DOA估计方法[J].电子学报,2004,32(9):1448-1451. 被引量：14
2张庆芳,赵鹤鸣.基于改进VQ算法的文本无关的说话人识别[J].计算机工程与应用,2006,42(10):65-68. 被引量：7
3P Joseph, JR Campbell. Speaker recognition: A tutorial[ J]. Proceedings of the IEEF,, 1997,85(9) : 1437 - 1462.
4Tomi Kinntmen, Li Haizhou. An overview of text-independent speaker recognition: From feature to super vectors [J]. Speech Communication, 2009,52(2) : 12 - 40.
5I T Jolliffe. Principal Component Analysis [ M ]. Springer: Berlin, 1986.
6N Kambhatla. Dimension reduction by local PCA [J]. Neural Computing, 1997,9 (7) : 1493 - 1516.
7C W Seo, K Y lee. GMM based on local PCA for speaker identification [ J ]. Electronics Letters, 2001,37 ( 24 ) : 1486 - 1488.
8S Molau, M Pitz, R Schluter. Computing Mel-frequency cepstral coefficients on the power spectrum [ A ]. Proceedings of the 2001 IEEE International Conference on Acoustics, Speech and Signal Processing[ C]. USA: IEEE Press, 2001.73 - 76.
9S Furui. Cepstral analysis technique for automatic speaker verification[ J]. IEEE Transactions on Acoustics, Speech and Signal Processing, 1981,29 (2) : 254 - 271.
10J C Bezdek. Pattem Recognition with Fuzzy Objective Function Algorithm[ M]. New York: Plenum Press, 1981.

引证文献2

1李邵梅,郭云飞,卫红权.基于分布特征统计的说话人识别[J].计算机工程与应用,2009,45(34):118-120. 被引量：2
2蒋晔,唐振民.短语音说话人辨认的研究[J].电子学报,2011,39(4):953-957. 被引量：7

二级引证文献9

1王水平,唐振民,陈北京,蒋晔.复杂环境下语音增强的复平面谱减法[J].南京理工大学学报,2013,37(6):857-862. 被引量：6
2曹洁,潘鹏.基于GMM的说话人识别技术研究[J].计算机工程与应用,2011,47(11):114-117. 被引量：6
3姚红,谭敏,郭武.音素层特征超矢量的说话人识别性能及优化[J].计算机工程与应用,2011,47(26):140-142.
4张晓俊,陶智,吴迪,肖仲喆,赵鹤鸣.采用多特征组合优化的语音特征参数研究[J].通信技术,2012,45(12):98-100. 被引量：4
5周国鑫,高勇.基于GMM-UBM模型的说话人辨识研究[J].无线电工程,2014,44(12):14-17. 被引量：5
6吴伟,李艳雄,王梓里,陈祝允.基于语速差异的新闻发布会中首要说话人检测[J].计算机工程与应用,2015,51(4):222-225.
7张二华,王明合,唐振民.加性噪声条件下鲁棒说话人确认[J].电子学报,2019,47(6):1244-1250. 被引量：3
8肜娅峰,陈晨,陈德运,何勇军.基于贝叶斯主成分分析的i-vector说话人确认方法[J].电子学报,2021,49(11):2186-2194. 被引量：2
9毛海全,冯海泓,洪峰,马皓天,徐楚林,郑立通.面向中文短语音的文本无关说话人确认新框架[J].声学技术,2024,43(4):503-510.

1林琳,王树勋,郭纲.短语音说话人识别新方法的研究[J].系统仿真学报,2007,19(10):2272-2275. 被引量：10
2林琳,王树勋,陈建.基于模糊核熵的短语音说话人识别[J].系统仿真学报,2008,20(16):4368-4372. 被引量：1
3李继国,曹珍富,李建中,张亦辰.代理签名的现状与进展[J].通信学报,2003,24(10):114-124. 被引量：56
4陈天麒.特征子空间分解法测向中的有关概念、理论及关键技术[J].电子对抗,2004(2):1-7. 被引量：3
5刘春刚,周廷显,强蔚.一种身份基代理签名方案的研究[J].哈尔滨工业大学学报,2008,40(7):1052-1054. 被引量：3
6吴宪,刘民航,范琨,陈牧原.基于模糊矢量量化的语音转换方法[J].信息化研究,2012,38(2):48-51. 被引量：1
7赵泽茂,刘凤玉.代理盲签名方案的构造方法及其推广(英文)[J].应用科学学报,2005,23(3):230-234. 被引量：8
8张基宏,何振亚.一种指数型模糊学习矢量量化图像编码算法[J].通信学报,1998,19(10):1-6. 被引量：6
9刘航,凌震华,郭武,戴礼荣.改进的跨语种语音合成模型自适应方法[J].模式识别与人工智能,2011,24(4):457-463. 被引量：2
10李继国,曹珍富.一个门限代理签名方案的改进[J].计算机研究与发展,2002,39(11):1513-1518. 被引量：26

电子学报

2008年第7期

浏览历史

内容加载中请稍等...

基于可区分性加权的模糊核说话人识别被引量：2

参考文献13

二级参考文献31

共引文献30

同被引文献16

引证文献2

二级引证文献9

相关作者

相关机构

相关主题

浏览历史

基于可区分性加权的模糊核说话人识别 被引量：2

参考文献13

二级参考文献31

共引文献30

同被引文献16

引证文献2

二级引证文献9

相关作者

相关机构

相关主题

浏览历史

基于可区分性加权的模糊核说话人识别被引量：2