摘要
为进一步提高说话人识别的准确率,提出一种新的基于卷积神经网络的说话人识别方法。利用卷积神经网络强大的处理图像能力可有效提高说话人识别的准确率。卷积神经网络相对于其他网络结构简单,训练时间较短且准确率较高。该方法首先对语音信号进行了预处理,包括重采样、分帧、加窗等操作,然后提取梅尔频率倒谱系数,之后送入卷积神经网络进行训练。通过LibriSpeech标准库和中文数据库测试表明,本算法识别率达到95%,可有效进行说话人识别。
出处
《警察技术》
2022年第1期46-50,共5页
Police Technology
基金
2017国家重点研发计划项目(编号:2017YFC0821000)
辽宁网络安全执法协同创新中心、广州市科技计划项目(编号:2019030004)
司法部司法鉴定重点实验室(司法鉴定科学研究院)开放基金。