Research on Voiceprint Recognition of Camouflage Voice Based on Deep Belief Network 被引量：4

导出

摘要 The problem of disguised voice recognition based on deep belief networks is studied. A hybrid feature extraction algorithm based on formants, Gammatone frequency cepstrum coefficients(GFCC) and their different coefficients is proposed to extract more discriminative speaker features from the original voice data. Using mixed features as the input of the model, a masquerade voice library is constructed. A masquerade voice recognition model based on a depth belief network is proposed. A dropout strategy is introduced to prevent overfitting, which effectively solves the problems of traditional Gaussian mixture models, such as insufficient modeling ability and low discrimination. Experimental results show that the proposed disguised voice recognition method can better fit the feature distribution, and significantly improve the classification effect and recognition rate.

作者 Nan Jiang Ting Liu

机构地区 College of Public Security Information Technology and Intelligence College of Light Industry

出处《International Journal of Automation and computing》 EI CSCD 2021年第6期947-962,共16页 国际自动化与计算杂志（英文版）

基金 supported by Natural Science Foundation of Liaoning Province (Nos. 2019-ZD-0168 and 2020-KF-12-11) Major Training Program of Criminal Investigation Police University of China (No. 3242019010) Key Research and Development Projects of Ministry of Science and Technology (No. 2017YFC0821005) Second Batch of New Engineering Research and Practice Projects(No. E-AQGABQ20202710)。

关键词 Disguised voice recognition deep belief network feature extraction Gammatone frequency cepstrum coefficients(GFCC) DROPOUT

分类号 TN912.34 [电子电信—通信与信息系统] TP183 [自动化与计算机技术—控制理论与控制工程]

引文网络
相关文献

参考文献8

1Zheng Lian,Ya Li,Jian-Hua Tao,Jian Huang,Ming-Yue Niu.Expression Analysis Based on Face Regions in Real-world Conditions[J].International Journal of Automation and computing,2020,17(1):96-107. 被引量：3
2Jian-Hua Tao,Jian Huang,Ya Li,Zheng Lian,Ming-Yue Niu.Semi-supervised Ladder Networks for Speech Emotion Recognition[J].International Journal of Automation and computing,2019,16(4):437-448. 被引量：9
3申小虎,金恬,张长珍,万荣春.假声伪装语音同一认定的可行性分析[J].中国刑警学院学报,2018(2):124-128. 被引量：4
4李燕萍,林乐,陶定元.基于GMM统计特性的电子伪装语音鉴定研究[J].计算机技术与发展,2017,27(1):103-106. 被引量：6
5周萍,沈昊,郑凯鹏.基于MFCC与GFCC混合特征参数的说话人识别[J].应用科学学报,2019,37(1):24-32. 被引量：44
6曹洁,潘鹏.基于GMM的说话人识别技术研究[J].计算机工程与应用,2011,47(11):114-117. 被引量：6
7于娴,贺松,彭亚雄,周晚.基于GMM模型的声纹识别模式匹配研究[J].通信技术,2015,48(1):97-101. 被引量：13
8邢益搏,张雄伟,郑昌艳,曹铁勇.骨导语音库的建立与骨气导语音的互信息分析[J].声学技术,2019,38(3):312-316. 被引量：4

二级参考文献34

1王伟,邓辉文.基于MFCC参数和VQ的说话人识别系统[J].仪器仪表学报,2006,27(z3):2253-2255. 被引量：30
2冷自强,王金明,林大会.一种GMM-SVM混合说话人辨认模型[J].军事通信技术,2009,30(1):86-89. 被引量：1
3林玮,杨莉莉,徐柏龄.基于修正MFCC参数汉语耳语音的话者识别[J].南京大学学报（自然科学版）,2006,42(1):54-62. 被引量：23
4于明,袁玉倩,董浩,王哲.一种基于MFCC和LPCC的文本相关说话人识别方法[J].计算机应用,2006,26(4):883-885. 被引量：14
5贺志阳,张玲华.基于GMM统计参数和SVM的说话人辨认研究[J].南京邮电大学学报（自然科学版）,2006,26(3):78-82. 被引量：2
6张翠玲,谭铁军,刘昇.伪装语音的自动话者识别研究[J].刑事技术,2007,32(2):18-21. 被引量：4
7Wooters C, Ftmg J, Peskin B, et al.Towards robust speaker seg- mentation: The ICSI-SRI fall 2004 diarization system[C]//Proc of Fall 2004 Rich Transcription Workshop,New York,Palisades, 2004:315-320.
8Anguera X, Wooters C, Peskin B, et al.Robust speaker segmentation for meetings: The ICSI-SRI spring 2005 diarization system[J].Machine Learning for Multimodal Interaction,2006,3869:402-414.
9Anguera X, Wooters C, Pardo J M.Robust speaker diarization for meetings:ICSI RT06s evaluation system[J].Lecture Notes in Computer Science,2006,4299 : 346-358.
10Wooters C, Huijbregts M.The ICSI RT07s speaker diarization system[J].Multimodal Technologies for Perception of Humans, 2008,4625 : 509-519.

共引文献79

1艾佳琪,左毅,刘君霞,贺培超,李铁山,陈俊龙.基于余弦相似度的动态语音特征提取算法[J].计算机应用研究,2020,37(S02):147-149. 被引量：11
2崔琳,王芷悦.基于LFBank与FBank混合特征的声纹识别研究[J].计算机科学,2022,49(S02):621-625. 被引量：4
3马学明.50%苯·苄可湿性粉剂的研究[J].湖南化工,2000,30(1):22-23.
4李强,彭益武.基于FPGA的GMM说话人辨认系统[J].广东交通职业技术学院学报,2014,13(2):42-46.
5冉国敬,夏秀渝,张凤仪.信道失配环境下鲁棒说话人识别[J].计算机系统应用,2015,24(3):235-240. 被引量：2
6张凤仪,夏秀渝,冉国敬,何礼,叶于林.多声源环境下的鲁棒说话人识别[J].计算机系统应用,2015,24(4):32-37. 被引量：1
7陈赟,林峰.基于同一性的健壮CS分类算法[J].通信技术,2015,48(6):687-691.
8佘堃,潘松松,田文洪.基于虚拟化的声纹识别系统性能研究[J].成都信息工程学院学报,2015,30(2):107-112. 被引量：1
9王波,钟映春,陈俊彬.融合AP和GMM的说话人识别方法研究[J].广东工业大学学报,2015,32(4):145-149. 被引量：1
10田秀丽,黄永平.关于语音个人身份优化识别建模仿真研究[J].计算机仿真,2016,33(10):403-407. 被引量：3

同被引文献39

1林琳,王树勋,王秀丽.基于DSP开集说话人识别系统的实时实现[J].吉林大学学报（信息科学版）,2006,24(3):252-258. 被引量：2
2许雪琼,余小清,李昌莲,万旺根.改进波形相似叠加算法的音频时长调整[J].应用科学学报,2009,27(5):514-519. 被引量：2
3陈黎,徐东平.基于SVM-GMM的开集说话人识别方法[J].计算机工程,2011,37(14):172-174. 被引量：5
4陈联武,郭武,戴礼荣.声纹识别中合成语音的鲁棒性[J].模式识别与人工智能,2011,24(6):743-747. 被引量：3
5靳玉红.声纹识别中的语言属性映射[J].重庆邮电大学学报（自然科学版）,2012,24(4):507-511. 被引量：1
6韩文静,李海峰,阮华斌,马琳.语音情感识别研究进展综述[J].软件学报,2014,25(1):37-50. 被引量：169
7陈祝允,李艳雄,杜佳媛.基于矢量量化的时序说话人聚类方法[J].科学技术与工程,2014,22(2):41-44. 被引量：5
8李威,贺前华,李艳雄.一种多说话人角色聚类方法[J].华南理工大学学报（自然科学版）,2015,43(1):21-27. 被引量：2
9酆勇,熊庆宇,石为人,曹俊华.一种基于受限玻尔兹曼机的说话人特征提取算法[J].仪器仪表学报,2016,37(2):256-262. 被引量：19
10王丰华,王邵菁,陈颂,袁国刚,张君.基于改进MFCC和VQ的变压器声纹识别模型[J].中国电机工程学报,2017,37(5):1535-1542. 被引量：84

引证文献4

1江楠,陈洁,肖潘,唐文强,林志泉.基于声纹识别的电力会议多角色语音的分离和识别研究[J].高电压技术,2023,49(S01):40-46. 被引量：2
2李旭东,周林华.基于大津算法和深度学习的开集声纹识别自适应阈值计算方法[J].吉林大学学报（理学版）,2021,59(4):909-914. 被引量：7
3崔晨露,崔琳.面向数据增强的轻量化语音情感识别[J].计算机与现代化,2023(4):83-89. 被引量：4
4周宇,杨国平.注意力机制和DenseNet在声纹识别中的应用研究[J].计算机与数字工程,2023,51(11):2591-2596. 被引量：1

二级引证文献14

1江楠,陈洁,肖潘,唐文强,林志泉.基于声纹识别的电力会议多角色语音的分离和识别研究[J].高电压技术,2023,49(S01):40-46. 被引量：2
2张鹏.遗传优化RBF神经网络背景下的声纹识别研究[J].信息与电脑,2022,34(1):159-161. 被引量：1
3杨波,张立娜,韩霄松.基于LBP和GLCM的肠道肿瘤图像特征提取方法[J].吉林大学学报（理学版）,2022,60(4):911-918. 被引量：3
4霍鑫,何长春,张华,赵辉.基于模型挖掘机的实践平台设计与教学应用[J].实验技术与管理,2023,40(5):176-179.
5许萌,韩鹏.面向学前教育对话机器人的多模态情感识别实现关键技术[J].自动化与仪器仪表,2023(9):137-141.
6宋玉,钱晓松,彭凌钰,叶紫寒,覃京燕.AIGC中式美学文创设计研究[J].包装工程,2023,44(24):1-8. 被引量：7
7陶雨昂.MFCC特征训练技术在声纹识别中的应用[J].集成电路应用,2024,41(2):386-387. 被引量：1
8白燕燕,白帆,张少哲,韩宗祥.基于语谱图滤波去噪的语音增强技术研究[J].电声技术,2024,48(2):45-47.
9李珂嘉,张璐薇,马跃洋,尹昱东,杨帆,张璐.基于机器视觉的钢轨表面面型缺陷分类实验设计[J].实验室研究与探索,2024,43(3):122-127. 被引量：1
10周琳.声纹识别技术在广播电视内容监测中的应用[J].电声技术,2024,48(8):51-53.

1陈文浩,宋胜利,钟浩杰.基于DBN的下肢康复外骨骼关节角位移预测方法研究[J].医疗卫生装备,2021,42(12):7-11. 被引量：3
2赫尔曼·麦尔,陆源(译).骗子的化装表演(长篇节选)[J].作品,2021(3):124-130.
3邹瑛珂,李祖明,刘晓宏,贾云飞.基于VMD分解的MFCC+GFCC无人机噪音混合特征提取方法[J].中国测试,2021,47(11):141-146. 被引量：6
4Liang CHANG,Chenglong LI,Zhaomin ZHANG,Jianbiao XIAO,Qingsong LIU,Zhen ZHU,Weihang LI,Zixuan ZHU,Siqi YANG,Jun ZHOU.Energy-efficient computing-in-memory architecture for AI processor: device, circuit, architecture perspective[J].Science China(Information Sciences),2021,64(6):41-55. 被引量：3
5倪旻,曲金帅,范菁,刘译文,李鸿,邱阳.基于特征提取的工业控制系统入侵检测研究[J].云南民族大学学报（自然科学版）,2021,30(6):592-600. 被引量：4
6李玉峰,明拓思宇,魏鹏.基于DBN的入侵检测分类模型构建和优化方法[J].计算机仿真,2021,38(11):266-274. 被引量：1
7谢道平,于帅珍,武岳.基于GFCC特征提取机器人仿生声呐SLAM算法研究[J].阜阳师范大学学报（自然科学版）,2021,38(3):67-72.
8许文杰,杨淇善.基于特征参数LPCC与AMDF的异常声音检测[J].长江信息通信,2021,34(10):110-113. 被引量：2
9王卫东,徐金慧,张志峰,杨习贝.基于密度峰值聚类的高斯混合模型算法[J].计算机科学,2021,48(10):191-196. 被引量：11
10朱文博,王谋,张晓雷,Susanto Rahardja.基于语音分离的人工设计特征、参数化特征和可学习特征的比较[J].中国传媒大学学报（自然科学版）,2021,28(3):52-57.

International Journal of Automation and computing

2021年第6期

浏览历史

内容加载中请稍等...