期刊导航
期刊开放获取
重庆大学
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
16
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
普通话发音错误自动检测技术
被引量:
3
1
作者
张峰
黄超
戴礼荣
《中文信息学报》
CSCD
北大核心
2010年第2期110-115,共6页
统计语音识别框架是现在发音错误检测系统的主流框架,而声学模型则是统计语音识别的基础。该文一方面为了获得对于发音错误检测更好的声学模型,引入了说话人自适应训练(SAT)和选择性最大似然线性回归(SMLLR)技术;另一方面,由于字发音检...
统计语音识别框架是现在发音错误检测系统的主流框架,而声学模型则是统计语音识别的基础。该文一方面为了获得对于发音错误检测更好的声学模型,引入了说话人自适应训练(SAT)和选择性最大似然线性回归(SMLLR)技术;另一方面,由于字发音检错中存在严重的信息量不足问题和专家对于不同水平说话人的评价标注不一样,在后端上加入了话者得分归一化技术。在包含40个不同水平说话人的8 000个字的数据库上的实验结果表明,文中提出的方法有效的提高了系统性能,召回率为30%时,正确率从45.8%升到了53.6%,召回率为10%时,正确率从64.6%升到了79.9%。
展开更多
关键词
计算机应用
中文信息处理
发音错误自动检错
说话人自适应训练
选择性最大似然线性回归
话者归
一化
下载PDF
职称材料
倒谱形状规整在噪声鲁棒性语音识别中的应用
被引量:
2
2
作者
杜俊
戴礼荣
王仁华
《中文信息学报》
CSCD
北大核心
2010年第2期104-109,共6页
该文提出了一种新的用于鲁棒性语音识别的特征规整方法。我们观察到在噪声环境下语音特征分布的形状相比于干净环境变化很大,因此提出了一种称为倒谱形状规整的新方法,它是利用引入一个指数因子来达到对倒谱分布形状进行规整的目的。这...
该文提出了一种新的用于鲁棒性语音识别的特征规整方法。我们观察到在噪声环境下语音特征分布的形状相比于干净环境变化很大,因此提出了一种称为倒谱形状规整的新方法,它是利用引入一个指数因子来达到对倒谱分布形状进行规整的目的。这种方法被证明在噪声环境下非常有效,特别是在低信噪比情况下。实验结果表明此新方法在au-rora2和aurora3两个标准数据库上比经典的均值方差规整算法在词错误率方面分别有38%和25%的相对降低,并且倒谱形状规整也好于其它传统方法,比如直方图均衡和高阶倒谱矩规整方法。
展开更多
关键词
计算机应用
中文信息处理
鲁棒性语音识别
形状规整
下载PDF
职称材料
一种新的基于频域独立成分分析的语音信号盲分离方法
被引量:
2
3
作者
吴奇昌
马峰
戴礼荣
《电路与系统学报》
北大核心
2013年第2期405-412,共8页
在频域利用传统的ICA进行分离时,如果分离矩阵没有经过良好的初始化,算法的收敛与分离性能都不够理想。本文提出了一种新的基于频域独立成分分析(ICA)的语音信号盲分离方法。首先通过分析混合信号的时频域特性对各个频带的分离矩阵进行...
在频域利用传统的ICA进行分离时,如果分离矩阵没有经过良好的初始化,算法的收敛与分离性能都不够理想。本文提出了一种新的基于频域独立成分分析(ICA)的语音信号盲分离方法。首先通过分析混合信号的时频域特性对各个频带的分离矩阵进行初始化,使算法的收敛速度更快,并很好的解决了输出信号的次序不确定性问题;进一步根据以初始化的分离矩阵分离出的源信号间的幅度相关性,仅挑选出一部分频带进行ICA的迭代,最终达到在追求良好分离性能的同时极大提升运算效率的目的。仿真的无回声环境和几种实际的回声环境下所得到的实验结果表明,该方法在分离性能和算法效率上均优于传统的频域ICA方法。
展开更多
关键词
盲信号分离
独立成分分析
时频分析
卷积混合
频带挑选
下载PDF
职称材料
话者识别中结合模型和能量的语音激活检测算法
被引量:
1
4
作者
章钊
郭武
《小型微型计算机系统》
CSCD
北大核心
2010年第9期1914-1917,共4页
语音激活检测是检测语音起始终止端点的一种算法,合适地选择语音来进行说话人模型的注册和测试对话者识别系统的性能有很大影响.本文将基于能量的语音激活检测算法与基于模型的算法相结合来检测语音,在N IST2006核心测试数据集上,采用...
语音激活检测是检测语音起始终止端点的一种算法,合适地选择语音来进行说话人模型的注册和测试对话者识别系统的性能有很大影响.本文将基于能量的语音激活检测算法与基于模型的算法相结合来检测语音,在N IST2006核心测试数据集上,采用本文算法的系统相对于传统基于能量的方法性能最多有19%的提升.
展开更多
关键词
语音激活检测
说话人识别
支持向量机
扰属性投影
下载PDF
职称材料
采用主成分分析的特征映射
被引量:
8
5
作者
郭武
戴礼荣
王仁华
《自动化学报》
EI
CSCD
北大核心
2008年第8期876-879,共4页
在与文本无关的说话人识别研究中,特征映射的方法可以有效减少信道的影响.本文首先通过主成分分析的方法在模型域中估计出信道因子所在的空间,然后通过映射的方法在特征参数域中减去信道因子的影响.采用这种方法需要有信道信息标记的数...
在与文本无关的说话人识别研究中,特征映射的方法可以有效减少信道的影响.本文首先通过主成分分析的方法在模型域中估计出信道因子所在的空间,然后通过映射的方法在特征参数域中减去信道因子的影响.采用这种方法需要有信道信息标记的数据,但是在特征映射时不需要对信道进行判决.在NIST 2006年SRE lconv4w-lconv4w数据库上,采用本文推荐方法的系统相对基线系统在等错误率上降低了19%.
展开更多
关键词
说话人确认
混合高斯模型
超矢量
梅尔刻度式倒谱参数
下载PDF
职称材料
因子分析在基于GMM的自动语种识别中的应用
被引量:
4
6
作者
付强
宋彦
戴礼荣
《中文信息学报》
CSCD
北大核心
2009年第4期77-81,共5页
在自动语种识别中,测试语音中说话人和信道的差异,会对系统性能产生很大的影响。针对于此,该文通过引入因子分析技术,根据语种识别的特点,建立了描述该差异(说话人差异和信道差异)的子空间的数学模型,并分别从特征域和模型域两个方面尝...
在自动语种识别中,测试语音中说话人和信道的差异,会对系统性能产生很大的影响。针对于此,该文通过引入因子分析技术,根据语种识别的特点,建立了描述该差异(说话人差异和信道差异)的子空间的数学模型,并分别从特征域和模型域两个方面尝试消除该差异的影响。在最新的NIST LRE2007的测试任务中,相对于GMM-UBM基线系统,该文方法有效地提高了系统识别性能。在30s时长的测试中,等错误率(EER)相对降低36.5%。
展开更多
关键词
计算机应用
中文信息处理
自动语种识别
高斯混合模型
因子分析
下载PDF
职称材料
基于多视觉码本的图像表示
被引量:
1
7
作者
宋彦
蒋兵
戴礼荣
《模式识别与人工智能》
EI
CSCD
北大核心
2013年第10期909-915,共7页
基于词袋模型的图像表示方法的有效性主要受限于局部特征的量化误差.文中提出一种基于多视觉码本的图像表示方法,通过综合考虑码本构建和编码方法这两个方面的因素加以改进.具体包括:1)多视觉码本构建,以迭代方式构建多个紧凑且具有互...
基于词袋模型的图像表示方法的有效性主要受限于局部特征的量化误差.文中提出一种基于多视觉码本的图像表示方法,通过综合考虑码本构建和编码方法这两个方面的因素加以改进.具体包括:1)多视觉码本构建,以迭代方式构建多个紧凑且具有互补性的视觉码本;2)图像表示,首先针对多码本的情况,依次从各码本中选择相应的视觉单词并采用线性回归估计编码系数,然后结合图像的空间金字塔结构形成最终的图像表示.在一些标准测试集合的图像分类结果验证文中方法的有效性.
展开更多
关键词
图像分类
视觉码本
聚类分析
图像表示
下载PDF
职称材料
采用支持向量机的说话者确认中的样本平衡
被引量:
1
8
作者
龙艳花
郭武
戴礼荣
《中文信息学报》
CSCD
北大核心
2008年第3期99-104,共6页
支持向量机在与文本无关的话者确认系统中已经取得了广泛的应用,但是在实际应用系统中获得的目标说话人样本与冒认者样本数量比一般在几千分之一,因此存在很严重的样本非平衡问题,冒认者样本选择的好坏直接影响到整个系统的性能。本文...
支持向量机在与文本无关的话者确认系统中已经取得了广泛的应用,但是在实际应用系统中获得的目标说话人样本与冒认者样本数量比一般在几千分之一,因此存在很严重的样本非平衡问题,冒认者样本选择的好坏直接影响到整个系统的性能。本文提出了两种挑选冒认者样本的方法。实验证明这些方法能有效地解决上述问题,性能比随机挑选冒认者样本的方法有了提升,经过在2004年NIST说话人识别数据库上进行测试,等错误率由9.3%降低到6.8%,错误率相对下降了26.9%。
展开更多
关键词
计算机应用
中文信息处理
支持向量机
冒认者
下载PDF
职称材料
采用模型和得分非监督自适应的说话人识别
被引量:
1
9
作者
王尔玉
郭武
+2 位作者
李轶杰
戴礼荣
王仁华
《自动化学报》
EI
CSCD
北大核心
2009年第3期267-271,共5页
在说话人识别的研究中,使用以前的测试语句信息对模型参数或者测试得分进行动态更新,使模型可以更精确地反映测试语句和说话人模型之间的关系,这种更新策略称为非监督模式,这方面的研究对实际的说话人识别系统具有非常重要的意义.本文...
在说话人识别的研究中,使用以前的测试语句信息对模型参数或者测试得分进行动态更新,使模型可以更精确地反映测试语句和说话人模型之间的关系,这种更新策略称为非监督模式,这方面的研究对实际的说话人识别系统具有非常重要的意义.本文除了采用非监督的说话人模型自适应更新方法之外,还提出了非监督的得分域自适应算法:首先采用双高斯函数对得分建立一个先验的得分模型,利用最大后验概率准则对得分规整的模型进行调整.在测试过程中,采用得分域和模型域的非监督算法可以互相补充,提高识别率,在NISTSRE2006年1训练语段-1测试语段数据库上,使用模型域和得分域非监督自适应的系统能够取得等错误率4.3%和检测代价函数0.021的结果.
展开更多
关键词
说话人确认
混合高斯模型
非监督模式
得分规整
下载PDF
职称材料
用于SVM说话者确认系统的序列核
被引量:
1
10
作者
龙艳花
郭武
戴礼荣
《清华大学学报(自然科学版)》
EI
CAS
CSCD
北大核心
2008年第S1期688-692,共5页
为了更好的将区分式分类方法应用于说话者确认系统中,该文提出了一种应用于支持向量机(supportvector machine,SVM)说话者确认系统的新型序列核,通过Gauss混合模型训练出每个说话人模型超向量作为支持向量机的输入样本,然后根据Gauss混...
为了更好的将区分式分类方法应用于说话者确认系统中,该文提出了一种应用于支持向量机(supportvector machine,SVM)说话者确认系统的新型序列核,通过Gauss混合模型训练出每个说话人模型超向量作为支持向量机的输入样本,然后根据Gauss混合模型之间的Kullback-Leibler距离度量构造的SVM序列核函数对超向量进行训练和判决。在美国国家标准与技术研究所(NIST)2004和2006年说话人识别数据库上的实验证明了该核函数能在一定程度上提升整个说话者确认系统的识别精度和鲁棒性。结果表明,本文提出的应用于说话者确认系统中的核函数不仅具有明确的物理意义,而且改善了识别系统的性能。
展开更多
关键词
说话者确认
Kullback-Leibler距离(KLD)序列核
支持向量机(SVM)
超向量
原文传递
声纹识别中合成语音的鲁棒性
被引量:
3
11
作者
陈联武
郭武
戴礼荣
《模式识别与人工智能》
EI
CSCD
北大核心
2011年第6期743-747,共5页
随着以隐马尔科夫模型为基础的语音合成技术的发展,冒认者很容易利用该技术生成具有目标说话人特性的合成语音,这对现有的声纹识别系统构成巨大威胁.针对此问题,文中从统计学的角度分析自然语音与合成语音在实倒谱上的区别,并提出对合...
随着以隐马尔科夫模型为基础的语音合成技术的发展,冒认者很容易利用该技术生成具有目标说话人特性的合成语音,这对现有的声纹识别系统构成巨大威胁.针对此问题,文中从统计学的角度分析自然语音与合成语音在实倒谱上的区别,并提出对合成语音具有鲁棒性的声纹识别系统.实验结果初步表明,相比于传统的声纹识别系统,在对自然语音的等错误率不变的情况下,该系统对合成语音的错误接受率由99.2%降为0.
展开更多
关键词
声纹识别
合成语音
实倒谱
原文传递
说话人识别中的串行因子分析
被引量:
2
12
作者
郭武
戴礼荣
王仁华
《模式识别与人工智能》
EI
CSCD
北大核心
2009年第4期514-518,共5页
在基于因子分析的说话人识别中,提出串行训练载荷矩阵的方法.在载荷矩阵训练中,采用串行的方式训练得到说话人因子矩阵、对角阵(残差矩阵)和信道空间矩阵.在说话人注册中,将以上3个载荷矩阵拼接,采用联合估计的方法得到每个说话人的因子...
在基于因子分析的说话人识别中,提出串行训练载荷矩阵的方法.在载荷矩阵训练中,采用串行的方式训练得到说话人因子矩阵、对角阵(残差矩阵)和信道空间矩阵.在说话人注册中,将以上3个载荷矩阵拼接,采用联合估计的方法得到每个说话人的因子.采用这种策略可有效解决因子分析中的饱和问题.在NISTSRE2006年核心测试数据库上等错误率能达到3.65%.
展开更多
关键词
说话人识别
联合因子分析
本征音因子
等错误率(EER)
原文传递
采用高斯概率分布和支持向量机的说话人确认
被引量:
2
13
作者
郭武
戴礼荣
王仁华
《模式识别与人工智能》
EI
CSCD
北大核心
2008年第6期794-798,共5页
在采用支持向量机的说话人确认中,将语音特征参数相对于通用背景模型各高斯分量的概率分布作为支持向量机输入,在线性核函数的情况下,系统能取得与广义线性判别式序列核函数(GLDS)几乎相同的识别率,同时该高斯概率分布算法能够与混合高...
在采用支持向量机的说话人确认中,将语音特征参数相对于通用背景模型各高斯分量的概率分布作为支持向量机输入,在线性核函数的情况下,系统能取得与广义线性判别式序列核函数(GLDS)几乎相同的识别率,同时该高斯概率分布算法能够与混合高斯背景模型、广义线性判别式序列核函数的得分进行融合,进一步提高识别性能.在2006年 NIST SRE 1conv4w-1conv4w 数据库上,融合后的系统相对于基线的混合高斯模型最多有25%的等错误率下降.
展开更多
关键词
广义线性判别式序列(GLDS)
梅尔刻度式倒谱参数(MFCC)
线性预测倒谱参数(LPCC)
原文传递
一种基于说话者话路变化的主成分分析方法
14
作者
龙艳花
郭武
戴礼荣
《模式识别与人工智能》
EI
CSCD
北大核心
2009年第2期270-274,共5页
在文本无关的说话人确认中,训练与测试语音中信道环境的不匹配是一种说话者话路变化问题.这种不匹配会严重降低说话人确认系统的性能.为了有效解决该问题,本文提出一种基于说话者话路变化的主成分分析方法,将其应用在说话者确认中,我们...
在文本无关的说话人确认中,训练与测试语音中信道环境的不匹配是一种说话者话路变化问题.这种不匹配会严重降低说话人确认系统的性能.为了有效解决该问题,本文提出一种基于说话者话路变化的主成分分析方法,将其应用在说话者确认中,我们将这种方法称为面向话路变化的主成分分析方法.这种方法能够与类内协方差归一化结合,进一步提高识别效果.在NIST2006年说话者识别数据库上进行实验,证明该方法不仅在系统识别等错误率上比基线系统有了24.2%的降低,而且在计算复杂度上相对于目前传统的方法也有很大的优势.
展开更多
关键词
面向话路变化的主成分分析(SVPCA)
类内协方差归一化(WCCN)
广义线性序列超向量
说话者确认
原文传递
基于HMM-UBM的声纹密码识别
被引量:
1
15
作者
章钊
郭武
戴礼荣
《模式识别与人工智能》
EI
CSCD
北大核心
2012年第4期664-668,共5页
声纹识别中,提出基于隐马尔可夫-通用背景模型的识别算法.针对声纹密码中每个人的注册语音数据量很少的问题,提出使用大量其他人数据先建立话者无关的声韵母隐马尔可夫模型作为通用背景模型,再根据最大后验概率准则,以通用背景模型为基...
声纹识别中,提出基于隐马尔可夫-通用背景模型的识别算法.针对声纹密码中每个人的注册语音数据量很少的问题,提出使用大量其他人数据先建立话者无关的声韵母隐马尔可夫模型作为通用背景模型,再根据最大后验概率准则,以通用背景模型为基础使用训练语音自适应获得说话人模型.该方法解决在声纹密码识别中训练数据不足的问题.在讯飞桌面数据库Ⅱ上,采用该算法的系统的等错误率为6.8%.
展开更多
关键词
隐马尔可夫模型(HMM)
通用背景模型(UBM)
声纹密码
高斯混合模型
原文传递
基于音素识别的语种辨识方法中的因子分析
被引量:
1
16
作者
仲海兵
宋彦
戴礼荣
《模式识别与人工智能》
EI
CSCD
北大核心
2012年第1期105-110,共6页
在基于音素识别的语种辨识系统中,特定的一段语音,音素识别的结果会受到说话人和信道等干扰因素的影响.对此,文中基于音素搭配关系对每段语音构建相应的特征向量表示.在向量空间中,利用因子分析建立噪声子空间的数学描述模型,并在语言...
在基于音素识别的语种辨识系统中,特定的一段语音,音素识别的结果会受到说话人和信道等干扰因素的影响.对此,文中基于音素搭配关系对每段语音构建相应的特征向量表示.在向量空间中,利用因子分析建立噪声子空间的数学描述模型,并在语言模型的训练和识别过程加以消除.在NISTLRE2007的测试任务中,相对于基于音素识别的语种辨识基线系统,该方法可有效提高系统性能.在30s时长测试中,基于音素识别的语言模型和基于音素识别的支持向量机模型的等错误率分别相对降低14.4%和12.9%.
展开更多
关键词
自动语种识别
因子分析
音素识别器
原文传递
题名
普通话发音错误自动检测技术
被引量:
3
1
作者
张峰
黄超
戴礼荣
机构
中国科学技术大学电子工程与信息科学系科大讯飞语音实验室
微软亚洲研究院
出处
《中文信息学报》
CSCD
北大核心
2010年第2期110-115,共6页
文摘
统计语音识别框架是现在发音错误检测系统的主流框架,而声学模型则是统计语音识别的基础。该文一方面为了获得对于发音错误检测更好的声学模型,引入了说话人自适应训练(SAT)和选择性最大似然线性回归(SMLLR)技术;另一方面,由于字发音检错中存在严重的信息量不足问题和专家对于不同水平说话人的评价标注不一样,在后端上加入了话者得分归一化技术。在包含40个不同水平说话人的8 000个字的数据库上的实验结果表明,文中提出的方法有效的提高了系统性能,召回率为30%时,正确率从45.8%升到了53.6%,召回率为10%时,正确率从64.6%升到了79.9%。
关键词
计算机应用
中文信息处理
发音错误自动检错
说话人自适应训练
选择性最大似然线性回归
话者归
一化
Keywords
computer application
Chinese information processing
Automatic mispronunciation detection
Speaker Adaptive Training (SAT)
Selective Maximum Likelihood Linear Regression (SMLLR)
speaker normalization
分类号
TP391 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
倒谱形状规整在噪声鲁棒性语音识别中的应用
被引量:
2
2
作者
杜俊
戴礼荣
王仁华
机构
中国科学技术大学电子工程与信息科学系科大讯飞语音实验室
出处
《中文信息学报》
CSCD
北大核心
2010年第2期104-109,共6页
文摘
该文提出了一种新的用于鲁棒性语音识别的特征规整方法。我们观察到在噪声环境下语音特征分布的形状相比于干净环境变化很大,因此提出了一种称为倒谱形状规整的新方法,它是利用引入一个指数因子来达到对倒谱分布形状进行规整的目的。这种方法被证明在噪声环境下非常有效,特别是在低信噪比情况下。实验结果表明此新方法在au-rora2和aurora3两个标准数据库上比经典的均值方差规整算法在词错误率方面分别有38%和25%的相对降低,并且倒谱形状规整也好于其它传统方法,比如直方图均衡和高阶倒谱矩规整方法。
关键词
计算机应用
中文信息处理
鲁棒性语音识别
形状规整
Keywords
computer application
Chinese information processing
robust speech recognition
shape normalization
分类号
TP391 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
一种新的基于频域独立成分分析的语音信号盲分离方法
被引量:
2
3
作者
吴奇昌
马峰
戴礼荣
机构
中国科学技术大学电子工程与信息科学系科大讯飞语音实验室
出处
《电路与系统学报》
北大核心
2013年第2期405-412,共8页
文摘
在频域利用传统的ICA进行分离时,如果分离矩阵没有经过良好的初始化,算法的收敛与分离性能都不够理想。本文提出了一种新的基于频域独立成分分析(ICA)的语音信号盲分离方法。首先通过分析混合信号的时频域特性对各个频带的分离矩阵进行初始化,使算法的收敛速度更快,并很好的解决了输出信号的次序不确定性问题;进一步根据以初始化的分离矩阵分离出的源信号间的幅度相关性,仅挑选出一部分频带进行ICA的迭代,最终达到在追求良好分离性能的同时极大提升运算效率的目的。仿真的无回声环境和几种实际的回声环境下所得到的实验结果表明,该方法在分离性能和算法效率上均优于传统的频域ICA方法。
关键词
盲信号分离
独立成分分析
时频分析
卷积混合
频带挑选
Keywords
blind signal separation
ICA
time-frequency analysis
convolutive mixing
band selection
分类号
TN912.3 [电子电信—通信与信息系统]
下载PDF
职称材料
题名
话者识别中结合模型和能量的语音激活检测算法
被引量:
1
4
作者
章钊
郭武
机构
中国科学技术大学电子工程与信息科学系科大讯飞语音实验室
出处
《小型微型计算机系统》
CSCD
北大核心
2010年第9期1914-1917,共4页
基金
国家自然科学基金项目(60970161)资助
文摘
语音激活检测是检测语音起始终止端点的一种算法,合适地选择语音来进行说话人模型的注册和测试对话者识别系统的性能有很大影响.本文将基于能量的语音激活检测算法与基于模型的算法相结合来检测语音,在N IST2006核心测试数据集上,采用本文算法的系统相对于传统基于能量的方法性能最多有19%的提升.
关键词
语音激活检测
说话人识别
支持向量机
扰属性投影
Keywords
voice activity detection
speaker recognition
support vector machine
nuance attribute projection
分类号
TP391 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
采用主成分分析的特征映射
被引量:
8
5
作者
郭武
戴礼荣
王仁华
机构
中国科学技术大学电子工程与信息科学系科大讯飞语音实验室
出处
《自动化学报》
EI
CSCD
北大核心
2008年第8期876-879,共4页
基金
国家高技术研究发展计划(863计划)(2006AA010104)
中国科学技术大学青年教师基金资助~~
文摘
在与文本无关的说话人识别研究中,特征映射的方法可以有效减少信道的影响.本文首先通过主成分分析的方法在模型域中估计出信道因子所在的空间,然后通过映射的方法在特征参数域中减去信道因子的影响.采用这种方法需要有信道信息标记的数据,但是在特征映射时不需要对信道进行判决.在NIST 2006年SRE lconv4w-lconv4w数据库上,采用本文推荐方法的系统相对基线系统在等错误率上降低了19%.
关键词
说话人确认
混合高斯模型
超矢量
梅尔刻度式倒谱参数
Keywords
Speaker verification, Gaussian mixture model (GMM), supervector, Mel frequency cepstral coefficients (MFCC)
分类号
TN912.3 [电子电信—通信与信息系统]
下载PDF
职称材料
题名
因子分析在基于GMM的自动语种识别中的应用
被引量:
4
6
作者
付强
宋彦
戴礼荣
机构
中国科学技术大学电子工程与信息科学系科大讯飞语音实验室
出处
《中文信息学报》
CSCD
北大核心
2009年第4期77-81,共5页
文摘
在自动语种识别中,测试语音中说话人和信道的差异,会对系统性能产生很大的影响。针对于此,该文通过引入因子分析技术,根据语种识别的特点,建立了描述该差异(说话人差异和信道差异)的子空间的数学模型,并分别从特征域和模型域两个方面尝试消除该差异的影响。在最新的NIST LRE2007的测试任务中,相对于GMM-UBM基线系统,该文方法有效地提高了系统识别性能。在30s时长的测试中,等错误率(EER)相对降低36.5%。
关键词
计算机应用
中文信息处理
自动语种识别
高斯混合模型
因子分析
Keywords
computer application
Chinese information processing
language identification
GMM model
factor analysis
分类号
TP391 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
基于多视觉码本的图像表示
被引量:
1
7
作者
宋彦
蒋兵
戴礼荣
机构
中国科学技术大学电子工程与信息科学系科大讯飞语音实验室
出处
《模式识别与人工智能》
EI
CSCD
北大核心
2013年第10期909-915,共7页
基金
国家自然科学基金资助项目(No.61172158)
文摘
基于词袋模型的图像表示方法的有效性主要受限于局部特征的量化误差.文中提出一种基于多视觉码本的图像表示方法,通过综合考虑码本构建和编码方法这两个方面的因素加以改进.具体包括:1)多视觉码本构建,以迭代方式构建多个紧凑且具有互补性的视觉码本;2)图像表示,首先针对多码本的情况,依次从各码本中选择相应的视觉单词并采用线性回归估计编码系数,然后结合图像的空间金字塔结构形成最终的图像表示.在一些标准测试集合的图像分类结果验证文中方法的有效性.
关键词
图像分类
视觉码本
聚类分析
图像表示
Keywords
Image Classification, Visual Codebook, Clustering Analysis, Image Representation
分类号
TP391.41 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
采用支持向量机的说话者确认中的样本平衡
被引量:
1
8
作者
龙艳花
郭武
戴礼荣
机构
中国科学技术大学电子工程与信息科学系科大讯飞语音实验室
出处
《中文信息学报》
CSCD
北大核心
2008年第3期99-104,共6页
文摘
支持向量机在与文本无关的话者确认系统中已经取得了广泛的应用,但是在实际应用系统中获得的目标说话人样本与冒认者样本数量比一般在几千分之一,因此存在很严重的样本非平衡问题,冒认者样本选择的好坏直接影响到整个系统的性能。本文提出了两种挑选冒认者样本的方法。实验证明这些方法能有效地解决上述问题,性能比随机挑选冒认者样本的方法有了提升,经过在2004年NIST说话人识别数据库上进行测试,等错误率由9.3%降低到6.8%,错误率相对下降了26.9%。
关键词
计算机应用
中文信息处理
支持向量机
冒认者
Keywords
computer application
Chinese information processing
support vector machine
speaker verification
分类号
TN912.34 [电子电信—通信与信息系统]
下载PDF
职称材料
题名
采用模型和得分非监督自适应的说话人识别
被引量:
1
9
作者
王尔玉
郭武
李轶杰
戴礼荣
王仁华
机构
中国科学技术大学电子工程与信息科学系科大讯飞语音实验室
出处
《自动化学报》
EI
CSCD
北大核心
2009年第3期267-271,共5页
基金
国家高技术研究发展计划(863计划)(2006AA010104)资助~~
文摘
在说话人识别的研究中,使用以前的测试语句信息对模型参数或者测试得分进行动态更新,使模型可以更精确地反映测试语句和说话人模型之间的关系,这种更新策略称为非监督模式,这方面的研究对实际的说话人识别系统具有非常重要的意义.本文除了采用非监督的说话人模型自适应更新方法之外,还提出了非监督的得分域自适应算法:首先采用双高斯函数对得分建立一个先验的得分模型,利用最大后验概率准则对得分规整的模型进行调整.在测试过程中,采用得分域和模型域的非监督算法可以互相补充,提高识别率,在NISTSRE2006年1训练语段-1测试语段数据库上,使用模型域和得分域非监督自适应的系统能够取得等错误率4.3%和检测代价函数0.021的结果.
关键词
说话人确认
混合高斯模型
非监督模式
得分规整
Keywords
Speaker verification, Gaussian mixture model (GMM), unsupervised mode, score normalization
分类号
TP391.41 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
用于SVM说话者确认系统的序列核
被引量:
1
10
作者
龙艳花
郭武
戴礼荣
机构
中国科学技术大学电子工程与信息科学系科大讯飞语音实验室
出处
《清华大学学报(自然科学版)》
EI
CAS
CSCD
北大核心
2008年第S1期688-692,共5页
文摘
为了更好的将区分式分类方法应用于说话者确认系统中,该文提出了一种应用于支持向量机(supportvector machine,SVM)说话者确认系统的新型序列核,通过Gauss混合模型训练出每个说话人模型超向量作为支持向量机的输入样本,然后根据Gauss混合模型之间的Kullback-Leibler距离度量构造的SVM序列核函数对超向量进行训练和判决。在美国国家标准与技术研究所(NIST)2004和2006年说话人识别数据库上的实验证明了该核函数能在一定程度上提升整个说话者确认系统的识别精度和鲁棒性。结果表明,本文提出的应用于说话者确认系统中的核函数不仅具有明确的物理意义,而且改善了识别系统的性能。
关键词
说话者确认
Kullback-Leibler距离(KLD)序列核
支持向量机(SVM)
超向量
Keywords
speaker verification
Kullback-Leibler distance(KLD) sequence kernel
SVM (support vector machine)
supervector
分类号
TN912.34 [电子电信—通信与信息系统]
原文传递
题名
声纹识别中合成语音的鲁棒性
被引量:
3
11
作者
陈联武
郭武
戴礼荣
机构
中国科学技术大学电子工程与信息科学系科大讯飞语音实验室
出处
《模式识别与人工智能》
EI
CSCD
北大核心
2011年第6期743-747,共5页
基金
国家自然科学基金项目(No.60970161)
中央高校基本科研业务费专项项目(No.XD2100060001)资助
文摘
随着以隐马尔科夫模型为基础的语音合成技术的发展,冒认者很容易利用该技术生成具有目标说话人特性的合成语音,这对现有的声纹识别系统构成巨大威胁.针对此问题,文中从统计学的角度分析自然语音与合成语音在实倒谱上的区别,并提出对合成语音具有鲁棒性的声纹识别系统.实验结果初步表明,相比于传统的声纹识别系统,在对自然语音的等错误率不变的情况下,该系统对合成语音的错误接受率由99.2%降为0.
关键词
声纹识别
合成语音
实倒谱
Keywords
Speaker Recognition, Synthetic Speech, Real Part of Cepstrum
分类号
TN912.34 [电子电信—通信与信息系统]
原文传递
题名
说话人识别中的串行因子分析
被引量:
2
12
作者
郭武
戴礼荣
王仁华
机构
中国科学技术大学电子工程与信息科学系科大讯飞语音实验室
出处
《模式识别与人工智能》
EI
CSCD
北大核心
2009年第4期514-518,共5页
基金
国家863计划资助项目(No.2006AA010104)
文摘
在基于因子分析的说话人识别中,提出串行训练载荷矩阵的方法.在载荷矩阵训练中,采用串行的方式训练得到说话人因子矩阵、对角阵(残差矩阵)和信道空间矩阵.在说话人注册中,将以上3个载荷矩阵拼接,采用联合估计的方法得到每个说话人的因子.采用这种策略可有效解决因子分析中的饱和问题.在NISTSRE2006年核心测试数据库上等错误率能达到3.65%.
关键词
说话人识别
联合因子分析
本征音因子
等错误率(EER)
Keywords
Speaker Recognition, Joint Factor Analysis, Eigenvoice, Equal Error Rate (EER)
分类号
TN912.34 [电子电信—通信与信息系统]
原文传递
题名
采用高斯概率分布和支持向量机的说话人确认
被引量:
2
13
作者
郭武
戴礼荣
王仁华
机构
中国科学技术大学电子工程与信息科学系科大讯飞语音实验室
出处
《模式识别与人工智能》
EI
CSCD
北大核心
2008年第6期794-798,共5页
基金
国家863计划资助项目(No.2006AA010104)
文摘
在采用支持向量机的说话人确认中,将语音特征参数相对于通用背景模型各高斯分量的概率分布作为支持向量机输入,在线性核函数的情况下,系统能取得与广义线性判别式序列核函数(GLDS)几乎相同的识别率,同时该高斯概率分布算法能够与混合高斯背景模型、广义线性判别式序列核函数的得分进行融合,进一步提高识别性能.在2006年 NIST SRE 1conv4w-1conv4w 数据库上,融合后的系统相对于基线的混合高斯模型最多有25%的等错误率下降.
关键词
广义线性判别式序列(GLDS)
梅尔刻度式倒谱参数(MFCC)
线性预测倒谱参数(LPCC)
Keywords
Generalized Linear Discriminant Sequence (GLDS), Mel Frequency Cepstrum Coefficient ( MFCC), Linear Prediction Cepstrum Coefficient (LPCC)
分类号
TN912.34 [电子电信—通信与信息系统]
原文传递
题名
一种基于说话者话路变化的主成分分析方法
14
作者
龙艳花
郭武
戴礼荣
机构
中国科学技术大学电子工程与信息科学系科大讯飞语音实验室
出处
《模式识别与人工智能》
EI
CSCD
北大核心
2009年第2期270-274,共5页
文摘
在文本无关的说话人确认中,训练与测试语音中信道环境的不匹配是一种说话者话路变化问题.这种不匹配会严重降低说话人确认系统的性能.为了有效解决该问题,本文提出一种基于说话者话路变化的主成分分析方法,将其应用在说话者确认中,我们将这种方法称为面向话路变化的主成分分析方法.这种方法能够与类内协方差归一化结合,进一步提高识别效果.在NIST2006年说话者识别数据库上进行实验,证明该方法不仅在系统识别等错误率上比基线系统有了24.2%的降低,而且在计算复杂度上相对于目前传统的方法也有很大的优势.
关键词
面向话路变化的主成分分析(SVPCA)
类内协方差归一化(WCCN)
广义线性序列超向量
说话者确认
Keywords
Session Variation Principal Component Analysis (SVPCA), Within Class Covariance Normalization (WCCN), General Linear Discriminative Sequence Supervector, Speaker Verification
分类号
TN912.34 [电子电信—通信与信息系统]
原文传递
题名
基于HMM-UBM的声纹密码识别
被引量:
1
15
作者
章钊
郭武
戴礼荣
机构
中国科学技术大学电子工程与信息科学系科大讯飞语音实验室
出处
《模式识别与人工智能》
EI
CSCD
北大核心
2012年第4期664-668,共5页
基金
国家自然科学基金项目(No.60970161)
中央高校基本科研业务费专项项目资助
文摘
声纹识别中,提出基于隐马尔可夫-通用背景模型的识别算法.针对声纹密码中每个人的注册语音数据量很少的问题,提出使用大量其他人数据先建立话者无关的声韵母隐马尔可夫模型作为通用背景模型,再根据最大后验概率准则,以通用背景模型为基础使用训练语音自适应获得说话人模型.该方法解决在声纹密码识别中训练数据不足的问题.在讯飞桌面数据库Ⅱ上,采用该算法的系统的等错误率为6.8%.
关键词
隐马尔可夫模型(HMM)
通用背景模型(UBM)
声纹密码
高斯混合模型
Keywords
Hidden Markov Model (HMM), Universal Background Model (UBM), Voiceprint Password, Gaussian Mixture Models
分类号
TN912.34 [电子电信—通信与信息系统]
原文传递
题名
基于音素识别的语种辨识方法中的因子分析
被引量:
1
16
作者
仲海兵
宋彦
戴礼荣
机构
中国科学技术大学电子工程与信息科学系科大讯飞语音实验室
出处
《模式识别与人工智能》
EI
CSCD
北大核心
2012年第1期105-110,共6页
文摘
在基于音素识别的语种辨识系统中,特定的一段语音,音素识别的结果会受到说话人和信道等干扰因素的影响.对此,文中基于音素搭配关系对每段语音构建相应的特征向量表示.在向量空间中,利用因子分析建立噪声子空间的数学描述模型,并在语言模型的训练和识别过程加以消除.在NISTLRE2007的测试任务中,相对于基于音素识别的语种辨识基线系统,该方法可有效提高系统性能.在30s时长测试中,基于音素识别的语言模型和基于音素识别的支持向量机模型的等错误率分别相对降低14.4%和12.9%.
关键词
自动语种识别
因子分析
音素识别器
Keywords
Automatic Language Identification
Factor Analysis
Phone Recognizer
分类号
TN912.34 [电子电信—通信与信息系统]
原文传递
题名
作者
出处
发文年
被引量
操作
1
普通话发音错误自动检测技术
张峰
黄超
戴礼荣
《中文信息学报》
CSCD
北大核心
2010
3
下载PDF
职称材料
2
倒谱形状规整在噪声鲁棒性语音识别中的应用
杜俊
戴礼荣
王仁华
《中文信息学报》
CSCD
北大核心
2010
2
下载PDF
职称材料
3
一种新的基于频域独立成分分析的语音信号盲分离方法
吴奇昌
马峰
戴礼荣
《电路与系统学报》
北大核心
2013
2
下载PDF
职称材料
4
话者识别中结合模型和能量的语音激活检测算法
章钊
郭武
《小型微型计算机系统》
CSCD
北大核心
2010
1
下载PDF
职称材料
5
采用主成分分析的特征映射
郭武
戴礼荣
王仁华
《自动化学报》
EI
CSCD
北大核心
2008
8
下载PDF
职称材料
6
因子分析在基于GMM的自动语种识别中的应用
付强
宋彦
戴礼荣
《中文信息学报》
CSCD
北大核心
2009
4
下载PDF
职称材料
7
基于多视觉码本的图像表示
宋彦
蒋兵
戴礼荣
《模式识别与人工智能》
EI
CSCD
北大核心
2013
1
下载PDF
职称材料
8
采用支持向量机的说话者确认中的样本平衡
龙艳花
郭武
戴礼荣
《中文信息学报》
CSCD
北大核心
2008
1
下载PDF
职称材料
9
采用模型和得分非监督自适应的说话人识别
王尔玉
郭武
李轶杰
戴礼荣
王仁华
《自动化学报》
EI
CSCD
北大核心
2009
1
下载PDF
职称材料
10
用于SVM说话者确认系统的序列核
龙艳花
郭武
戴礼荣
《清华大学学报(自然科学版)》
EI
CAS
CSCD
北大核心
2008
1
原文传递
11
声纹识别中合成语音的鲁棒性
陈联武
郭武
戴礼荣
《模式识别与人工智能》
EI
CSCD
北大核心
2011
3
原文传递
12
说话人识别中的串行因子分析
郭武
戴礼荣
王仁华
《模式识别与人工智能》
EI
CSCD
北大核心
2009
2
原文传递
13
采用高斯概率分布和支持向量机的说话人确认
郭武
戴礼荣
王仁华
《模式识别与人工智能》
EI
CSCD
北大核心
2008
2
原文传递
14
一种基于说话者话路变化的主成分分析方法
龙艳花
郭武
戴礼荣
《模式识别与人工智能》
EI
CSCD
北大核心
2009
0
原文传递
15
基于HMM-UBM的声纹密码识别
章钊
郭武
戴礼荣
《模式识别与人工智能》
EI
CSCD
北大核心
2012
1
原文传递
16
基于音素识别的语种辨识方法中的因子分析
仲海兵
宋彦
戴礼荣
《模式识别与人工智能》
EI
CSCD
北大核心
2012
1
原文传递
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部