期刊文献+
共找到42篇文章
< 1 2 3 >
每页显示 20 50 100
基于多尺度距离矩阵的语音关键词检测与细粒度定位方法
1
作者 李祥瑞 毛启容 《计算机应用研究》 CSCD 北大核心 2024年第11期3370-3375,共6页
针对现有语音关键词检测方法定位精度低的问题,提出了一种基于多尺度距离矩阵的语音关键词检测与细粒度定位方法(spoken term detection and fine-grained localization method based on multi-scale distance matrices,MF-STD)。该方... 针对现有语音关键词检测方法定位精度低的问题,提出了一种基于多尺度距离矩阵的语音关键词检测与细粒度定位方法(spoken term detection and fine-grained localization method based on multi-scale distance matrices,MF-STD)。该方法首先利用残差卷积网络提取特征并构建距离矩阵以建模输入之间的相关性;其次通过多尺度分割和解耦头学习不同尺度下的定位信息;最后根据多尺度加权定位损失、置信度损失和分类损失优化模型,实现对关键词存在性和时域边界的细粒度预测。在LibriSpeech数据集上的实验结果表明,MF-STD在集内词的检测中,精准率和交并比分别达到97.1%和88.6%;在集外词的检测中,精准率和交并比分别达到96.7%和88.2%。与现有的语音关键词检测与定位方法相比,MF-STD的检测准确率和定位精度显著提升,充分证明该方法的先进性,也证明了多尺度特征建模与细粒度定位约束在语音关键词检测任务中的有效性。 展开更多
关键词 语音关键词检测 语音细粒度定位 多尺度检测 残差卷积网络
下载PDF
基于特征空间轨迹信息的语音关键词检测方法 被引量:1
2
作者 田颖慧 贺前华 +2 位作者 郑若伟 危卓 李艳雄 《电子学报》 EI CAS CSCD 北大核心 2023年第10期2915-2924,共10页
当前语音关键词检测的主流技术为深度学习,需要大规模标注样本进行训练,难以应用于更普遍的低资源场景.本文提出一种基于音频特征空间轨迹信息的低资源语音关键词检测方法,该方法基于“词是由更小语言单元(音节、音素)的结构化组成,以... 当前语音关键词检测的主流技术为深度学习,需要大规模标注样本进行训练,难以应用于更普遍的低资源场景.本文提出一种基于音频特征空间轨迹信息的低资源语音关键词检测方法,该方法基于“词是由更小语言单元(音节、音素)的结构化组成,以及语言单元声学特征具有稳定性(统计意义)”的事实,结合物理几何空间定位的原理,构建语音关键词的特征空间表达、时序信息表达和局部区分信息知识.语音关键词检测时,依据语音段的特征空间轨迹信息分层次进行判决,实现了模式信息与统计信息的综合应用.其中语音特征空间是利用丰富的无标注语音样本构建音频特征空间的标识子表达,而语音关键词的特征空间轨迹信息利用少量关键词语音样本构建.多个实验结果表明,本文算法在低资源时(100个样本以下),相比HMM和CRNN有显著优势,10个训练样本时,相比HMM,FRR绝对下降了20.5%,FAR绝对下降了8.7 FP/h;而在训练样本量较充分(300个样本及以上)时,与CRNN有大致相当的性能. 展开更多
关键词 语音关键词检测 音频特征空间 特征空间轨迹信息 低资源
下载PDF
关键词检测系统中基于音素网格的置信度计算 被引量:3
3
作者 张鹏远 韩疆 颜永红 《电子与信息学报》 EI CSCD 北大核心 2007年第9期2063-2066,共4页
该文提出了一种基于音素网格的置信度计算方法。与传统的基于整个声学模型的置信度不同的是,这种方法在解码器生成的音素网格上计算关键词的置信度,从而具有更好的拒识能力。另外,针对两种置信度取值范围的不同,该文采用权重因子的方法... 该文提出了一种基于音素网格的置信度计算方法。与传统的基于整个声学模型的置信度不同的是,这种方法在解码器生成的音素网格上计算关键词的置信度,从而具有更好的拒识能力。另外,针对两种置信度取值范围的不同,该文采用权重因子的方法综合利用两种置信度,取得了较好的效果。在自然对话的电话数据测试中,与传统的置信度计算方式相比,混和置信度的FOM(Figure Of Merit)值相对提高了17.0%。 展开更多
关键词 语音识别 关键词检测 置信度 后验概率 网格
下载PDF
一种基于互补声学模型的多系统融合语音关键词检测方法 被引量:3
4
作者 孟猛 王晓瑞 +1 位作者 梁家恩 徐波 《自动化学报》 EI CSCD 北大核心 2009年第1期39-45,共7页
采用一种基于互补声学模型的多系统融合方法来获得高性能的语音关键词检测系统:1)在基线系统的基础上,使用不同的音素集进行声学建模,并引入基于神经网络的声学建模方法,获得另外两套具有建模差异性的声学系统;2)在多套关键词检测系统... 采用一种基于互补声学模型的多系统融合方法来获得高性能的语音关键词检测系统:1)在基线系统的基础上,使用不同的音素集进行声学建模,并引入基于神经网络的声学建模方法,获得另外两套具有建模差异性的声学系统;2)在多套关键词检测系统的基础上,通过选择有效的系统融合准则,将多个系统的输出进行整合,获得更好的语音关键词检测结果.该方法充分利用了差异性声学建模系统之间的互补性,在不增加训练数据的情况下,显著地提升了最终系统的性能.和基线系统相比,该方法在2005年国家863电话语音关键词检测技术评测集上,在等错误率(Equal error rate,EER)指标下,获得相对21.6%的显著性能提升. 展开更多
关键词 关键词检测 高斯混合模型 神经网络
下载PDF
基于音素后验概率的样例语音关键词检测方法 被引量:3
5
作者 张卫强 宋贝利 +1 位作者 蔡猛 刘加 《天津大学学报(自然科学与工程技术版)》 EI CAS CSCD 北大核心 2015年第9期757-760,共4页
低资源条件下的语音关键词检测是一个具有挑战性的问题,因为传统的基于大词汇量连续语音识别(LVCSR)的语音关键词检测方法不再适用.针对此问题提出了一种基于深度神经网络(DNN)输出层后验概率特征和改进的动态时间规整(DTW)算法的语音... 低资源条件下的语音关键词检测是一个具有挑战性的问题,因为传统的基于大词汇量连续语音识别(LVCSR)的语音关键词检测方法不再适用.针对此问题提出了一种基于深度神经网络(DNN)输出层后验概率特征和改进的动态时间规整(DTW)算法的语音关键词检测方法.采用无监督高斯混合模型(GMM)和中、英文DNN音素模型得出的输入特征构建互补的子系统,并在SWS2013多语种数据集上进行实验.结果表明:相对于基线系统,分数层面的多语种、多系统融合能够有效地提升语音关键词检测系统的性能. 展开更多
关键词 样例查询 语音关键词检测 DNN输出层特征 动态时间规整
下载PDF
采用词图相交融合的语音关键词检测方法 被引量:4
6
作者 李鹏 屈丹 《信号处理》 CSCD 北大核心 2015年第6期702-709,共8页
针对词图合并方法产生的词图冗余信息过多,规模较大,导致检索速度较慢的问题,本文提出了一种基于词图相交融合的语音关键词检测方法。首先,将不同语音识别系统产生的词图取交集,并对相同路径上的声学模型、语言模型得分进行得分融合;然... 针对词图合并方法产生的词图冗余信息过多,规模较大,导致检索速度较慢的问题,本文提出了一种基于词图相交融合的语音关键词检测方法。首先,将不同语音识别系统产生的词图取交集,并对相同路径上的声学模型、语言模型得分进行得分融合;然后,对于融合后词图中存在的间断路径,直接利用性能最优的语音识别系统产生的词图进行补充,得到完整的融合词图;最后,在相交融合后的词图上进行关键词检测。实验表明,相交融合后的词图综合利用了各词图的得分信息,在基本不损失词图对正确内容覆盖率基础上,减少了冗余信息,有效降低了索引规模;并且在关键词检测性能ATWV指标下,基于词图相交融合的关键词检测方法相比词图合并方法相对提升5.3%。 展开更多
关键词 子空间高斯混合模型 深层神经网络 相交词图 关键词检测
下载PDF
广播新闻语音的关键词检测系统 被引量:1
7
作者 张鹏远 邵健 +1 位作者 赵庆卫 颜永红 《通信学报》 EI CSCD 北大核心 2007年第12期131-135,共5页
提出了一种两阶段的关键词检测策略,关键词表可即时配置、即时使用。与以往不同的是,解码是在整个声学空间上进行的,而不仅仅是关键词所构成的声学空间。首先,利用维特比解码得到最优候选的音素序列。然后,通过关键词列表,可以产生候选... 提出了一种两阶段的关键词检测策略,关键词表可即时配置、即时使用。与以往不同的是,解码是在整个声学空间上进行的,而不仅仅是关键词所构成的声学空间。首先,利用维特比解码得到最优候选的音素序列。然后,通过关键词列表,可以产生候选的关键词。最后,采用了基于声学模型的置信度与基于网格的置信度相结合的方法来降低虚警。实验证明,新的框架下关键词检测的性能得到了显著的提高。 展开更多
关键词 关键词检测 音节识别器 置信度计算
下载PDF
基于得分归一化和系统融合的语音关键词检测方法 被引量:2
8
作者 李鹏 屈丹 《数据采集与处理》 CSCD 北大核心 2017年第2期346-353,共8页
为了有效利用不同关键词检测系统的互补性,解决不同系统检测结果置信度得分不在同一范围的问题,提出了一种基于得分规整和系统融合的语音关键词检测方法。首先,为了克服连续语音识别系统中因剪枝错误而引起的关键词丢失问题,应用了关键... 为了有效利用不同关键词检测系统的互补性,解决不同系统检测结果置信度得分不在同一范围的问题,提出了一种基于得分规整和系统融合的语音关键词检测方法。首先,为了克服连续语音识别系统中因剪枝错误而引起的关键词丢失问题,应用了关键词相关的软Beam宽度剪枝策略裁剪词图;其次,在系统融合前采用得分归一化方法,使得不同系统关键词检测结果置信度得分在同一范围;最后,通过系统融合处理将不同系统的关键词输出进行整合,得到最终的关键词检测结果。实验结果表明,经过得分归一化处理后,关键词检测性能的实际查询词权重代价(Actual term-weighted value,ATWV)平均相对提升30%;系统融合后关键词的检测性能,相比于得分归一化处理后的最佳单一系统,得到了10%的提升。 展开更多
关键词 关键词检测 得分归一化 系统融合 软Beam剪枝
下载PDF
关键词检测系统中声学置信度的应用 被引量:2
9
作者 刘鑫 陆林生 《计算机工程》 CAS CSCD 北大核心 2004年第8期28-30,共3页
从假设检验和模式识别的角度分别介绍了置信度的概念及其在实际关键词检测系统中的应用,并提出3种新的基于识别结果本身信息的声学置信度:基于状态长度归一化的置信度、基于特征矢量信息的置信度和基于状态驻留的声学置信度。与传统... 从假设检验和模式识别的角度分别介绍了置信度的概念及其在实际关键词检测系统中的应用,并提出3种新的基于识别结果本身信息的声学置信度:基于状态长度归一化的置信度、基于特征矢量信息的置信度和基于状态驻留的声学置信度。与传统的基于似然比的声学置信度相比,这3种置信度几乎不需额外的训练和建模,计算简单,且均较易设置统一的拒识门限。实验结果表明基于状态驻留和基于特征矢量信息的置信度的性能较好,能够有效降低基线系统的虚警率。 展开更多
关键词 关键词检测 确认 置信度 置信区间
下载PDF
基于HMM的连续语音中的关键词检测 被引量:1
10
作者 马晓梅 李雪耀 王洋 《黑龙江科技信息》 2008年第32期91-91,共1页
关键词检测是语音识别中一个重要的研究方向。本文针对说话人的连续语音提出了一种基于HMM模型的关键词检测方法,并针对关键词模型、垃圾模型及关键词的检测策略进行了研究。实验表明,该方法具有一定的可行性,大大提高了系统的实用性。
关键词 关键词检测 隐马尔可夫模型 垃圾模型 音节格
下载PDF
离散变换算法在关键词检测系统中的研究
11
作者 马晓梅 王国权 +1 位作者 高辉 王伟 《哈尔滨师范大学自然科学学报》 CAS 2013年第4期44-47,共4页
(黑龙江科技大学)【摘要】阐述了一个在较强噪声环境下针对汉语非特定说话人的连续无限制语音流中检测出其中关键词语音的公交车路线查询系统.为增强其关键词语音信号提出了建立一种新的基于离散变换的语音增强算法.并对同一噪声环境下... (黑龙江科技大学)【摘要】阐述了一个在较强噪声环境下针对汉语非特定说话人的连续无限制语音流中检测出其中关键词语音的公交车路线查询系统.为增强其关键词语音信号提出了建立一种新的基于离散变换的语音增强算法.并对同一噪声环境下增强关键词语音信号的模型与未增强关键词语音信号的模型进行了比较,结果显示,采用增强语音信号强度的算法在提高关键词的检测率同时,有效地降低了误报率,系统的整体性能较好,具有一定的实用性. 展开更多
关键词 关键词检测 离散变换 语音增强 误报率
下载PDF
基于词表树结构填料模型的关键词检测技术
12
作者 马晓梅 王洋 《科学技术与工程》 2011年第13期2967-2970,2976,共5页
关键词检测技术是语音识别领域中一个重要的研究方向。对于关键词检测系统来讲,若要求达到高检测率的同时希望虚报率较低,仅仅建立关键词模型是不够的。填料模型的结构和类型对整个系统的性能相对会有更大的影响。对于非特定说话人的连... 关键词检测技术是语音识别领域中一个重要的研究方向。对于关键词检测系统来讲,若要求达到高检测率的同时希望虚报率较低,仅仅建立关键词模型是不够的。填料模型的结构和类型对整个系统的性能相对会有更大的影响。对于非特定说话人的连续语音中出现的非关键词语音提出建立一种新的有效的基于词表树结构的填料模型。实验结果表明,与传统的基于音节格和音节聚类的填料模型相比,关键词的检测率有了很大的提高,系统的综合性能较好,具有一定的可行性和实用性。 展开更多
关键词 关键词检测 填料模型 词表树 音节格 音节聚类
下载PDF
语音增强技术在关键词检测系统中仿真研究
13
作者 马晓梅 韩娜 《哈尔滨师范大学自然科学学报》 CAS 2011年第3期52-54,62,共4页
描述了一个机票定制系统,在强噪声环境的公共场所针对汉语小词汇量非特定说话人的连续无限制语音流中检测出其中的关键词语音.为增强其关键词语音信号提出建立一种新的基于行为模式分解的语音增强算法.对同一噪声环境下增强关键词语音... 描述了一个机票定制系统,在强噪声环境的公共场所针对汉语小词汇量非特定说话人的连续无限制语音流中检测出其中的关键词语音.为增强其关键词语音信号提出建立一种新的基于行为模式分解的语音增强算法.对同一噪声环境下增强关键词语音信号的HMM与未增强关键词语音的HMM进行了比较,结果显示,采用增强语音信号强度的算法在提高关键词的检测率同时,有效地降低了虚报率,系统的整体性能较好,具有一定的可行性与实用性. 展开更多
关键词 关键词检测 模式分解 语音增强 虚报率
下载PDF
垃圾模型技术在关键词检测系统中的应用
14
作者 马晓梅 沈洁 《信息技术》 2009年第6期142-144,共3页
对于关键词检测系统来讲,垃圾模型的结构和类型对整个系统的性能有很大的影响。文中针对中文关键词检测系统提出了一种与上下文相关的垃圾模型。通过实验验证,关键词的检测率有了很大的提高,实验结果表明了该模型的有效性。
关键词 关键词检测 隐马尔可夫模型 垃圾模型 拼音格 上下文相关
下载PDF
基于分割识别的蒙古语语音关键词检测方法的研究 被引量:2
15
作者 飞龙 高光来 +1 位作者 闫学亮 王炜华 《计算机科学》 CSCD 北大核心 2013年第9期208-211,共4页
蒙古文属于黏着语,词根和后缀能够组合成近百万的蒙古文单词。现有的蒙古语大词汇量连续语音识别(LVCSR)系统的发音词典无法包含所有蒙古文单词。同时发音词典较大时,训练语料的稀疏将导致LVCSR系统的性能明显下降。为了解决LVCSR系统... 蒙古文属于黏着语,词根和后缀能够组合成近百万的蒙古文单词。现有的蒙古语大词汇量连续语音识别(LVCSR)系统的发音词典无法包含所有蒙古文单词。同时发音词典较大时,训练语料的稀疏将导致LVCSR系统的性能明显下降。为了解决LVCSR系统中大多数蒙古文单词的识别问题和蒙古语语音关键词检测系统中大量集外词的检测问题,结合蒙古文的构词特点,提出了基于分割识别的蒙古语LVCSR方法,并建立了对应的声学模型和语言模型。最后,将此方法应用到了蒙古语语音关键词检测系统中并在蒙古语语音语料上进行了测试。实验结果表明,基于分割识别的蒙古语LVCSR方法能解决大部分蒙古文单词的识别问题,并将蒙古语语音关键词检测系统的大量集外词转化成了集内词,大幅度提高了检测系统的查准率和召回率。 展开更多
关键词 蒙古语 词干 结尾后缀 关键词检测 集外词 混淆网络
下载PDF
基于词级DPPM的连续语音关键词检测 被引量:3
16
作者 王勇 张连海 《计算机工程》 CAS CSCD 2014年第5期247-251,共5页
提出一种基于词级区分性点过程模型的连续语音关键词检测方法。利用时间模式结构和多层感知器计算每个音素帧级后验概率,使用区分性点过程模型将一段时间内多个音素事件形成的点过程作为整体,把关键词检测看作二元分类问题,经分段和拼... 提出一种基于词级区分性点过程模型的连续语音关键词检测方法。利用时间模式结构和多层感知器计算每个音素帧级后验概率,使用区分性点过程模型将一段时间内多个音素事件形成的点过程作为整体,把关键词检测看作二元分类问题,经分段和拼接构成超矢量,输入支持向量机分类器,判断该段语音是否为待检测关键词。该方法充分考虑语音信号上下文相关性,直接以词作为基本单元建模,提高了系统检测的准确性和鲁棒性。实验结果表明,对采样的语音,其关键词平均召回率和准确率分别可达71.5%和84.6%以上,并且结合相关语言模型知识,系统性能将会进一步提高。 展开更多
关键词 点过程模型 音素后验概率 时间模式 关键词检测 支持向量机 区分性点过程模型
下载PDF
几何信息与SIFT特征相结合的特定人手写关键词检测 被引量:1
17
作者 张文超 吕岳 +1 位作者 文颖 黄志敏 《智能系统学报》 CSCD 北大核心 2014年第5期544-550,共7页
中文汉字类别繁多,书写随意性大,使得中文的手写体关键词检测具有很大的挑战性。提出一种基于文字几何信息和SIFT特征相结合的手写体关键词检测方法,通过计算文本图像特征的匹配度来检测特定书写人的手写关键词。尺度不变特征转换(scale... 中文汉字类别繁多,书写随意性大,使得中文的手写体关键词检测具有很大的挑战性。提出一种基于文字几何信息和SIFT特征相结合的手写体关键词检测方法,通过计算文本图像特征的匹配度来检测特定书写人的手写关键词。尺度不变特征转换(scale invariance feature transform,SIFT)局部特征具有良好的稳定性和独特性,既能适应同一书写人手写汉字的差异,又能区分不同书写人的书写笔迹。结合文字的几何信息,通过滑动窗口和最大团查找方法可以有效地删除误匹配点,极大地提高关键词检测的成功率。对大量手写体文本图像的实验结果表明,该方法能够有效检测同一书写人的相同关键词,具有较高的召回率和准确率。 展开更多
关键词 关键词检测 SIFT 滑动窗口 最大团查找
下载PDF
基于动态匹配词格检索的关键词检测 被引量:2
18
作者 郑永军 张连海 《应用科学学报》 CAS CSCD 北大核心 2014年第2期149-155,共7页
对生活中涌现的海量语音数据需要进行快速而准确的检索.提出一种基于动态匹配词格检索的关键词检测方法,应用TRAP特征和多层感知器创建更为精准的音素Lattice.在索引阶段执行一个改进的维特比算法遍历Lattice来创建一个固定长度的音素... 对生活中涌现的海量语音数据需要进行快速而准确的检索.提出一种基于动态匹配词格检索的关键词检测方法,应用TRAP特征和多层感知器创建更为精准的音素Lattice.在索引阶段执行一个改进的维特比算法遍历Lattice来创建一个固定长度的音素序列数据库,在检索阶段应用最小编辑距离作为置信度来实现关键词的检出.实验结果表明,该方法相比应用MFCC和PLP特征的基线系统具有一定的优势,召回率可提升5%左右. 展开更多
关键词 关键词检测 动态匹配词格检索 TRAP特征 最小编辑距离
下载PDF
基于点过程模型连续语音关键词检测 被引量:2
19
作者 王勇 张连海 《太赫兹科学与电子信息学报》 2013年第6期958-963,共6页
提出了基于点过程模型(PPM)的连续语音关键词检测方法。该方法首先利用时态模式(TRAP)特征和多层感知器(MLP)计算每个音素的帧级后验概率,在此基础上,将语音可看作多个相互独立的事件(音素),利用泊松过程对事件建立点过程模型,最后通过... 提出了基于点过程模型(PPM)的连续语音关键词检测方法。该方法首先利用时态模式(TRAP)特征和多层感知器(MLP)计算每个音素的帧级后验概率,在此基础上,将语音可看作多个相互独立的事件(音素),利用泊松过程对事件建立点过程模型,最后通过计算似然比达到关键词检测目的。实验结果表明,对8 kHz采样语音,关键词平均召回率和准确率分别可达69.5%和82%以上。 展开更多
关键词 关键词检测 音素后验概率 泊松过程 点过程
下载PDF
基于特征空间轨迹匹配方式的语音关键词检测法 被引量:2
20
作者 吴旭辉 吴亚栋 《计算机工程与应用》 CSCD 北大核心 2003年第36期83-86,共4页
语音关键词识别是近年来颇受重视的一个研究领域,文章基于特征空间轨迹的时间规整化原理,提出了一种高性能的关键词检测法,并探讨了轨迹等分长度对该算法检测性能的影响。实验结果表明,基于特征空间轨迹匹配方式的关键词检测法的检测性... 语音关键词识别是近年来颇受重视的一个研究领域,文章基于特征空间轨迹的时间规整化原理,提出了一种高性能的关键词检测法,并探讨了轨迹等分长度对该算法检测性能的影响。实验结果表明,基于特征空间轨迹匹配方式的关键词检测法的检测性能接近于人工检测,具有一定的实用性。 展开更多
关键词 动态匹配 语音识别 模式匹配 特征空间轨迹 语音关键词检测 匹配方式
下载PDF
上一页 1 2 3 下一页 到第
使用帮助 返回顶部