基于卷积神经网络的说话人识别方法

A Speaker Recognition Method Based on Convolutional Neural Network

下载PDF

导出

摘要为进一步提高说话人识别的准确率,提出一种新的基于卷积神经网络的说话人识别方法。利用卷积神经网络强大的处理图像能力可有效提高说话人识别的准确率。卷积神经网络相对于其他网络结构简单,训练时间较短且准确率较高。该方法首先对语音信号进行了预处理,包括重采样、分帧、加窗等操作,然后提取梅尔频率倒谱系数,之后送入卷积神经网络进行训练。通过LibriSpeech标准库和中文数据库测试表明,本算法识别率达到95%,可有效进行说话人识别。

作者楚宪腾王华朋杨海涛林暖辉

机构地区中国刑事警察学院广州市刑事科学技术研究所

出处《警察技术》 2022年第1期46-50,共5页 Police Technology

基金 2017国家重点研发计划项目(编号:2017YFC0821000) 辽宁网络安全执法协同创新中心、广州市科技计划项目(编号:2019030004) 司法部司法鉴定重点实验室(司法鉴定科学研究院)开放基金。

关键词卷积神经网络说话人识别梅尔频率倒谱系数

分类号 TN912.34 [电子电信—通信与信息系统] TP183 [自动化与计算机技术—控制理论与控制工程]

引文网络
相关文献

参考文献3

1余玲飞,刘强.基于深度循环网络的声纹识别方法研究及应用[J].计算机应用研究,2019,36(1):153-158. 被引量：27
2刘娟宏,胡彧,黄鹤宇.端到端的深度卷积神经网络语音识别[J].计算机应用与软件,2020,37(4):192-196. 被引量：31
3曾春艳,马超峰,王志锋,朱栋梁,赵楠,王娟,刘聪.深度学习框架下说话人识别研究综述[J].计算机工程与应用,2020,56(7):8-16. 被引量：9

二级参考文献24

1曹洁,余丽珍.基于MFCC和运动强度聚类初始化的多说话人识别[J].计算机应用研究,2012,29(9):3295-3298. 被引量：10
2林琳,陈虹,陈建.基于鲁棒听觉特征的说话人识别[J].电子学报,2013,41(3):619-624. 被引量：10
3戴礼荣,张仕良.深度语音信号与信息处理:研究进展与展望[J].数据采集与处理,2014,29(2):171-179. 被引量：33
4Weiwei Jiang,Lin Zhang.Geospatial Data to Images: A Deep-Learning Framework for Traffic Forecasting[J].Tsinghua Science and Technology,2019,24(1):52-64. 被引量：17
5酆勇,熊庆宇,石为人,曹俊华.一种基于受限玻尔兹曼机的说话人特征提取算法[J].仪器仪表学报,2016,37(2):256-262. 被引量：19
6刘长征,张磊.语音识别中卷积神经网络优化算法[J].哈尔滨理工大学学报,2016,21(3):34-38. 被引量：20
7郑方,李蓝天,张慧,艾斯卡尔.肉孜.声纹识别技术及其应用现状[J].信息安全研究,2016,2(1):44-57. 被引量：51
8田垚,蔡猛,何亮,刘加.基于深度神经网络和Bottleneck特征的说话人识别系统[J].清华大学学报（自然科学版）,2016,56(11):1143-1148. 被引量：13
9黄光许,田垚,康健,刘加,夏善红.低资源条件下基于i-vector特征的LSTM递归神经网络语音识别系统[J].计算机应用研究,2017,34(2):392-396. 被引量：22
10梁玉龙,屈丹,李真,张文林.基于卷积神经网络的维吾尔语语音识别[J].信息工程大学学报,2017,18(1):44-50. 被引量：11

共引文献63

1何成兵,王润泽,张霄翔.基于改进一维卷积神经网络的汽轮发电机组轴系扭振模态参数辨识[J].中国电机工程学报,2020,40(S01):195-203. 被引量：17
2艾佳琪,左毅,刘君霞,贺培超,李铁山,陈俊龙.基于余弦相似度的动态语音特征提取算法[J].计算机应用研究,2020,37(S02):147-149. 被引量：11
3崔琳,王芷悦.基于LFBank与FBank混合特征的声纹识别研究[J].计算机科学,2022,49(S02):621-625. 被引量：4
4缪飞,神户忠,荻野浩雄,长谷一史.电子束CT检测冠状动脉钙化指数价值的评价[J].上海医学,2000,23(5):317-319.
5林麟,贾虹.达力士搽剂治疗头部银屑病35例疗效观察[J].临床皮肤科杂志,2000,29(2):105-106. 被引量：10
6闫河,董莺艳,王鹏,罗成,李焕.基于CNN-LSTM网络的声纹识别研究[J].计算机应用与软件,2019,36(4):166-170. 被引量：19
7吴俊杰.基于非单调共轭梯度算法的声纹识别机器人控制系统设计[J].计算机测量与控制,2020,28(1):116-119.
8曾霞,李霜.语音信号声纹识别的研究和仿真[J].新一代信息技术,2019,2(16):61-65. 被引量：1
9曾春艳,马超峰,王志锋,朱栋梁,赵楠,王娟,刘聪.深度学习框架下说话人识别研究综述[J].计算机工程与应用,2020,56(7):8-16. 被引量：9
10李蜜.基于语谱图和神经网络的声纹识别研究[J].高师理科学刊,2020,40(4):39-42. 被引量：2

1房玉杰,张松,刘晋,冯磊.基于高斯混合模型的脚步声身份识别方法[J].计算机应用,2021,41(S02):221-225. 被引量：2

警察技术

2022年第1期

浏览历史

内容加载中请稍等...

基于卷积神经网络的说话人识别方法

参考文献3

二级参考文献24

共引文献63

相关作者

相关机构

相关主题

浏览历史