期刊文献+
共找到293篇文章
< 1 2 15 >
每页显示 20 50 100
基于改进DFSMN的非特定人语音识别模型
1
作者 王世刚 严瑾 《电声技术》 2023年第12期111-114,共4页
深度前馈序列记忆网络(Deep Feedforward Sequential Memory Network,DFSMN)是一种识别准确率较高且在非特定人语音识别领域得到良好应用的声学模型,但存在参数冗余、模型训练困难的情况。针对此问题,提出一种基于改进DFSMN的非特定人... 深度前馈序列记忆网络(Deep Feedforward Sequential Memory Network,DFSMN)是一种识别准确率较高且在非特定人语音识别领域得到良好应用的声学模型,但存在参数冗余、模型训练困难的情况。针对此问题,提出一种基于改进DFSMN的非特定人语音识别模型。该模型改进了DFSMN记忆模块大小和模块之间的连接方式,并结合连接时序分类(Connectionist Temporal Classification,CTC)端到端语音识别框架。实验结果表明,在相同条件下,该改进模型的参数量较之前减少了约1/10,在不同数据集上与几种常见语音识别模型相比,其语音识别字符错误率均最低,在识别准确率和模型训练效率方面具有一定的优越性。 展开更多
关键词 语音识别 深度前馈序列记忆网络(DFSMN) 特定人 连接时序分类(CTC)
下载PDF
基于2DPCA补空间的特定人与非特定人的表情识别
2
作者 李春芝 陈晓华 《湖州师范学院学报》 2009年第1期61-64,共4页
研究表明,对一种识别有利的信息有可能反而对其他识别任务造成干扰,表情识别需要利用表示各种表情之间差异的信息.针对特定人及非特定人的7种基本表情,提出基于二维主元分析(Two-Dimensional Principle Analysis,2DPCA)补空间的表情识... 研究表明,对一种识别有利的信息有可能反而对其他识别任务造成干扰,表情识别需要利用表示各种表情之间差异的信息.针对特定人及非特定人的7种基本表情,提出基于二维主元分析(Two-Dimensional Principle Analysis,2DPCA)补空间的表情识别算法.基于CED-WYU(1.0)及JAFFE两个表情数据库的实验结果表明,2DPCA补空间算法针对特定人与非特定人的表情识别率可达100%,高于2DPCA算法. 展开更多
关键词 特定人 特定人 二维主元分析 补空间 表情识别
下载PDF
基于SRN/HMM的非特定人连续手语识别系统 被引量:8
3
作者 方高林 高文 +2 位作者 陈熙霖 王春立 马继勇 《软件学报》 EI CSCD 北大核心 2002年第11期2169-2175,共7页
手语识别是通过计算机提供一种有效而准确的机制将手语翻译成文本或语音.目前最新发展水平的手语识别系统在实际应用中应解决非特定人连续手语问题.提出一种将连续手语识别分解成各孤立词识别的分治方法,用于非特定人连续手语识别.把精... 手语识别是通过计算机提供一种有效而准确的机制将手语翻译成文本或语音.目前最新发展水平的手语识别系统在实际应用中应解决非特定人连续手语问题.提出一种将连续手语识别分解成各孤立词识别的分治方法,用于非特定人连续手语识别.把精简循环网(simple recurrent network,简称SRN)作为连续手语的段边界检测器,把SRN分段结果作为隐马可夫模型(hidden Markov models,简称HMM)框架中的状态输入,在HMM框架里使用网格Viterbi算法搜索出一条最佳手语词路径.实验结果表明,该方法的识别效果比单纯使用HMM要好. 展开更多
关键词 SRN HMM 特定人连续手语识别系统 神经网络 精简循环网络 隐马可夫规模 连续手语识别 计算机 模式识别
下载PDF
特定人脸的快速定制和肌肉驱动的表情动画 被引量:19
4
作者 梅丽 鲍虎军 彭群生 《计算机辅助设计与图形学学报》 EI CSCD 北大核心 2001年第12期1077-1082,共6页
为解决特定人脸的真实模拟问题提供了一个简单而行之有效的方法 .首先 ,给出特定人脸的正侧面正交图像 ,并提供了一个内嵌肌肉向量的一般人脸三维多边形网格模型 ,采用 Snake技术自动适配人脸特征线 ,基于特定人脸的特征线相对于一般人... 为解决特定人脸的真实模拟问题提供了一个简单而行之有效的方法 .首先 ,给出特定人脸的正侧面正交图像 ,并提供了一个内嵌肌肉向量的一般人脸三维多边形网格模型 ,采用 Snake技术自动适配人脸特征线 ,基于特定人脸的特征线相对于一般人脸模型上的特征线的位移 ,变分插值一般人脸网格 ,适配特定人脸几何 ;然后 ,用多分辨率样条技术产生无缝的人脸纹理镶嵌图 ,纹理映射后生成高度真实感的能以任意视线方向观察的特定人脸 ;进而 ,通过组合特定人脸的肌肉向量的运动 ,变形模型 ,组合出特定人脸的各种表情 .该方法能在廉价的 PC平台上实现 ,快速、简单 ,而且具有真实感 . 展开更多
关键词 特征线 变分插值 纹理映射 肌肉向量 表情动画 特定人 计算机模拟
下载PDF
非特定人手语识别问题中的合成数据驱动方法 被引量:5
5
作者 姜峰 高文 +2 位作者 姚鸿勋 赵德斌 陈熙霖 《计算机研究与发展》 EI CSCD 北大核心 2007年第5期873-881,共9页
针对手语识别研究中训练样本缺乏,提出了一种衍生数据的方法,有效地解决了动态多数据流手语训练用样本合成问题.利用mean-shift算法可以方便、快捷地得到密度函数梯度的变化方向,从而控制衍生的方向和强度.算法同时考虑到合成样本尽可... 针对手语识别研究中训练样本缺乏,提出了一种衍生数据的方法,有效地解决了动态多数据流手语训练用样本合成问题.利用mean-shift算法可以方便、快捷地得到密度函数梯度的变化方向,从而控制衍生的方向和强度.算法同时考虑到合成样本尽可能包含非特定人的信息及其有效性,对数据所实现的变形不会被识别系统的初始化过程逆转.合成数据驱动的效果受模型的容量、合成的强度与方向影响.在多种实验环境下对驱动效果进行评估,识别率有所提高,在某些例子中提高明显. 展开更多
关键词 合成数据 手语识别 训练 mean—shift算法 特定人 识别率
下载PDF
一种基于高维空间覆盖动态搜索方法的非特定人连续数字语音识别的研究 被引量:7
6
作者 王守觉 潘晓霞 +3 位作者 徐春燕 陈旭 安冬 曹文明 《电子学报》 EI CAS CSCD 北大核心 2005年第10期1790-1793,共4页
本文使用高维空间点分布分析原理,在仿生模式识别高维空间点覆盖原理的基础上,提出了一种基于高维空间点覆盖动态搜索理论的非特定人连续数字语音识别的新算法,这种算法可以不经过端点检测和分割,通过对被识别连续数字语音直接进行动态... 本文使用高维空间点分布分析原理,在仿生模式识别高维空间点覆盖原理的基础上,提出了一种基于高维空间点覆盖动态搜索理论的非特定人连续数字语音识别的新算法,这种算法可以不经过端点检测和分割,通过对被识别连续数字语音直接进行动态搜索,得到被识别语音到各类高维空间覆盖范围的距离随时间变化曲线,通过距离曲线上的极小值点进行识别. 展开更多
关键词 连续语音识别 高维空间点覆盖 特定人语音识别
下载PDF
基于快速神经网络算法的非特定人语音识别 被引量:10
7
作者 田岚 陆小珊 白树忠 《控制与决策》 EI CSCD 北大核心 2002年第1期65-68,共4页
提出一种用于语音识别的改进的快速神经网络算法 ,即动态不等步长的误差分段学习算法。将步长看作误差和网络节点输出的函数 ,对各权值按不同步长进行动态调整 ,并将其应用于一个基于前馈神经网络模型的非特定人语音识别系统。实验表明 ... 提出一种用于语音识别的改进的快速神经网络算法 ,即动态不等步长的误差分段学习算法。将步长看作误差和网络节点输出的函数 ,对各权值按不同步长进行动态调整 ,并将其应用于一个基于前馈神经网络模型的非特定人语音识别系统。实验表明 ,该算法比传统 BP算法在训练速度上可提高十几倍 。 展开更多
关键词 特定人语音识别 神经网络 学习算法
下载PDF
基于SOFM/HMM模型的非特定人手语识别系统 被引量:4
8
作者 方高林 高文 +1 位作者 王春立 陈益强 《计算机学报》 EI CSCD 北大核心 2002年第1期16-21,共6页
手语识别是通过计算机提供一种有效而准确的机制将手语翻译成文本或语音 .目前最新发展水平的手语识别系统在实际应用中应该解决非特定人手语识别问题 .该文在分析非特定人手语识别特点——数据多且差异大、模型训练难收敛、对不同人数... 手语识别是通过计算机提供一种有效而准确的机制将手语翻译成文本或语音 .目前最新发展水平的手语识别系统在实际应用中应该解决非特定人手语识别问题 .该文在分析非特定人手语识别特点——数据多且差异大、模型训练难收敛、对不同人数据的特征提取需求更迫切——的基础上 ,提出了 SOFM/ HMM模型 ,将自组织特征映射 (SOFM)很强的特征提取功能和隐马可夫模型 (HMM)良好的处理时间序列属性结合在一个新颖的框架下 ,并把该模型应用到非特定人中国手语识别中 .实验结果表明 ,SOFM/ HMM模型手语识别率比传统的 HMM模型提高近 5 % . 展开更多
关键词 自组织特征映射 隐马可夫模型 EM算法 特定人手语识别系统 SOFM模型 HMM模型 计算机
下载PDF
小词汇量非特定人语音识别在嵌入式系统中的应用 被引量:5
9
作者 刘振安 孙捷 王晋军 《计算机工程》 CAS CSCD 北大核心 2006年第11期213-215,共3页
给出了一个嵌入式小词汇量非特定人语音识别系统的方案,它基于单片微控制器加数字信号处理器(MCU+DSP)架构,用离散隐马尔可夫模型方法实现语音识别系统。该系统适应性强,可扩展性好,具有一定的实时性和语言无关性。当在算法上针对汉语... 给出了一个嵌入式小词汇量非特定人语音识别系统的方案,它基于单片微控制器加数字信号处理器(MCU+DSP)架构,用离散隐马尔可夫模型方法实现语音识别系统。该系统适应性强,可扩展性好,具有一定的实时性和语言无关性。当在算法上针对汉语普通话进行优化后,则能进一步提高识别汉语的准确性和实时性。 展开更多
关键词 语音识别 特定人 隐马尔可夫模型 MEL倒谱系数 汉语普通话识别
下载PDF
改进MFCC参数在非特定人语音识别中的研究 被引量:15
10
作者 田莎莎 唐菀 佘纬 《科技通报》 北大核心 2013年第3期139-142,146,共5页
随着信息时代的高速发展,人们越来越关注计算机的便携使用方式,以语音输入代替手动输入成为计算机未来发展的一个必然趋势。本文在MFCC特征参数的基础上,提出了一种改进MFCC特征参数--BMFCC特征参数,以提高原MFCC特征参数在语音识别时... 随着信息时代的高速发展,人们越来越关注计算机的便携使用方式,以语音输入代替手动输入成为计算机未来发展的一个必然趋势。本文在MFCC特征参数的基础上,提出了一种改进MFCC特征参数--BMFCC特征参数,以提高原MFCC特征参数在语音识别时的识别率和运算速度。BMFCC特征参数在进行参数的提取时,分为特征分量加权、特征分量求差分、主成分分析三个步骤。仿真实验结果表明,本文提出的BMFCC特征参数在识别率和有运算速度上均优于MFCC特征参数,且更具鲁棒性。 展开更多
关键词 MFCC参数 BMFCC参数 语音识别 特定人
下载PDF
基于LD3320的非特定人识别声控灯系统设计 被引量:11
11
作者 姜杰文 姜彦吉 +1 位作者 邴晓环 王洋 《现代电子技术》 北大核心 2015年第11期27-30,共4页
计算机技术的飞速发展带动语音识别技术不断取得突破,功能日渐强大的语音控制系统正逐渐应用于实际生活中。LD3320是一款语音识别专用芯片,响应快,识别率高,系统结合STC11L08XE单片机及外围电路和n RF24L01无线传输芯片进行了声控灯系... 计算机技术的飞速发展带动语音识别技术不断取得突破,功能日渐强大的语音控制系统正逐渐应用于实际生活中。LD3320是一款语音识别专用芯片,响应快,识别率高,系统结合STC11L08XE单片机及外围电路和n RF24L01无线传输芯片进行了声控灯系统总体结构及各个模块的硬件选型和程序编写,并基于非特定人完成了对声控灯系统功能的静态测试,识别率接近95%,实验效果理想。该嵌入式系统体积小、功耗低、性能稳定、实时性好,在生产和生活中具有较高实用价值。 展开更多
关键词 语音识别 声控灯 特定人 LD3320
下载PDF
基于表情子空间多分类器集成的非特定人人脸表情识别 被引量:4
12
作者 胡步发 陈炳兴 黄银成 《计算机应用》 CSCD 北大核心 2011年第3期736-740,共5页
针对非特定人人脸表情平均识别率普遍不高(约65%)的问题,提出了一种基于表情子空间和多分类器集成的人脸表情识别新方法。通过局部二进制模式(LBP)与高阶奇异值分解(HOSVD)方法对训练集1中的人脸图像的全脸、眼睛(包括眉毛)和嘴巴三个... 针对非特定人人脸表情平均识别率普遍不高(约65%)的问题,提出了一种基于表情子空间和多分类器集成的人脸表情识别新方法。通过局部二进制模式(LBP)与高阶奇异值分解(HOSVD)方法对训练集1中的人脸图像的全脸、眼睛(包括眉毛)和嘴巴三个区域进行特征提取与分解,建立相应的表情子空间;利用支持向量机(SVM)方法对训练集2中的人脸图像在表情子空间训练,得到模糊系统参数;最后结合表情子空间与多分类器集成,对测试集中的图像进行表情分类识别。在JAFFE人脸表情库中实验,获得了71.43%的平均识别率。实验结果表明,该方法有效地减少了人脸外观特征和表情表现方式所带来的影响,具有更好的识别效果。 展开更多
关键词 人脸表情 特定人 多分类器集成 高阶奇异值分解 模糊规则
下载PDF
非特定人手语识别进展及关键问题研究思路 被引量:2
13
作者 姜峰 高文 +2 位作者 王春立 姚鸿勋 赵德斌 《软件学报》 EI CSCD 北大核心 2007年第3期477-489,共13页
非特定人手语识别是推动手语系统实用化所必须解决的问题.在非特定人手语识别研究中,训练数据的缺乏和非特定人手语数据的差异性矛盾给原有研究框架的有效性带来了挑战.提出了非特定人手语识别新的研究框架,并给出了解决问题的策略与思... 非特定人手语识别是推动手语系统实用化所必须解决的问题.在非特定人手语识别研究中,训练数据的缺乏和非特定人手语数据的差异性矛盾给原有研究框架的有效性带来了挑战.提出了非特定人手语识别新的研究框架,并给出了解决问题的策略与思路.这些问题的解决将对中国手语识别及其他相关领域具有非常重要的意义. 展开更多
关键词 手语识别 特定人 数据生成 力效分析
下载PDF
非特定人语音控制机器人的课程设计与实现 被引量:4
14
作者 许超 吴新杰 王倩 《实验室研究与探索》 CAS 北大核心 2016年第6期178-180,共3页
提高大学生的创新能力是当今社会的迫切需求,而机器人实践平台是高校学生工程教育的最佳载体,因此,单片机课程设计的题目选择"非特定人语音控制机器人",让学生利用指定的实验模块和可选添的实验模块,以小组为单位按照各自设... 提高大学生的创新能力是当今社会的迫切需求,而机器人实践平台是高校学生工程教育的最佳载体,因此,单片机课程设计的题目选择"非特定人语音控制机器人",让学生利用指定的实验模块和可选添的实验模块,以小组为单位按照各自设计通过工程实践实现非特定人对机器人的语音控制,这符合创新性教学理念,代表着科研与教学的有机结合。以学号121003224小组的实践为例,证明"非特定人语音控制机器人"创新性课程设计,既夯实了学生的理论知识,提升了学生的实践应用能力,又奠定了学校机器人创新实践平台的实验基础。 展开更多
关键词 机器人 特定人 语音识别 课程设计
下载PDF
基于STM32和SD卡文件系统的非特定人语音识别系统设计 被引量:8
15
作者 龙顺宇 郑泽龙 谭冬凤 《现代电子技术》 2013年第21期62-66,共5页
介绍了一种采用ARM处理器作为控制核心的非特定人语音识别系统的设计与实现,系统利用IC Route公司的非特定语音识别芯片LD3320与ARM Cortex M3内核ST公司的32位高性能单片机STM32F103C8T6组成功能主体,在系统中实现SD卡文件系统,在不更... 介绍了一种采用ARM处理器作为控制核心的非特定人语音识别系统的设计与实现,系统利用IC Route公司的非特定语音识别芯片LD3320与ARM Cortex M3内核ST公司的32位高性能单片机STM32F103C8T6组成功能主体,在系统中实现SD卡文件系统,在不更改单片机源程序的前提下,可更改SD卡中内容,达到识别列表关键词动态编辑,经过大量实践证明该设计适合嵌入式组件开发中需要灵活更改识别内容和返回参数的应用,设计具有高性价比、交互简易、识别率高、扩展性强等特点,便于嵌入式应用。 展开更多
关键词 ARM CORTEX M3 特定人语音识别 SD卡文件系统 LD3320
下载PDF
一种改进的基于小波去噪HMM非特定人语音识别算法 被引量:12
16
作者 李锦 何培宇 《四川大学学报(自然科学版)》 CAS CSCD 北大核心 2007年第1期69-72,共4页
在HMM算法的基础上引入了小波去噪理论,从而提高了原始语音的信噪比和最终识别率.由于分别对每段语音去噪并进行端点检测,大大降低了运算量,因而减少了训练时间,达到了较好的识别效果.通过与DTW算法的对比,证明了改进的HMM算法在非特定... 在HMM算法的基础上引入了小波去噪理论,从而提高了原始语音的信噪比和最终识别率.由于分别对每段语音去噪并进行端点检测,大大降低了运算量,因而减少了训练时间,达到了较好的识别效果.通过与DTW算法的对比,证明了改进的HMM算法在非特定人语音识别中的良好效果. 展开更多
关键词 HMM 特定人语音识别 小波去噪
下载PDF
基于人脸相似度加权距离的非特定人表情识别 被引量:8
17
作者 谭华春 章毓晋 《电子与信息学报》 EI CSCD 北大核心 2007年第2期455-459,共5页
该文提出了一种用于非特定人表情识别的方法。首先,对测试人的初始表情特征进行高阶奇异值分解,得到测试人与训练集中所有人相关的表情特征。然后,根据“相似的人有相似的表情”的假设,计算人脸相似度加权距离,作为测试人的表情特征与... 该文提出了一种用于非特定人表情识别的方法。首先,对测试人的初始表情特征进行高阶奇异值分解,得到测试人与训练集中所有人相关的表情特征。然后,根据“相似的人有相似的表情”的假设,计算人脸相似度加权距离,作为测试人的表情特征与标准的表情特征之间的相似性测度。通过加权的过程,可以有效地去除由于个体差异而造成的表情特征的差异,提高非特定人表情识别的鲁棒性。该文提出的方法在JAFFE数据库上进行了测试。对非特定人的表情识别实验表明,该文方法比传统的方法在识别率上有了提高。 展开更多
关键词 人脸表情识别 特定人 人脸相似度加权距离 高阶奇异值分解
下载PDF
基于SPCE061A单片机的非特定人语音识别设计 被引量:18
18
作者 黄涛 胡宾 《微计算机信息》 北大核心 2006年第03Z期19-20,226,共3页
提出了一种基于台湾凌阳公司的SPCE061A的非特定人语音识别系统,主要介绍其系统组成,重点论述了非特定语音识别的相关算法及其在单片机上的实现,该命令识别系统成功应用于现场网关的控制。
关键词 SPCE061A 特定人识别 DHMM
下载PDF
一种适于非特定人语音识别的并行隐马尔可夫模型 被引量:1
19
作者 陈雁翔 戴蓓蒨 +1 位作者 周曦 刘鸣 《电子与信息学报》 EI CSCD 北大核心 2004年第10期1601-1606,共6页
为了适合非特定人语音识别,提出了一种由多条并行马尔可夫链组成的并行HMM(Parallel Hidden Markov Model,PHMM),从而融合了基于分类的语音识别中为各个类别建立的模板,提高了识别性能,各条链之间允许有交叉,使得融合的多模板之间存在... 为了适合非特定人语音识别,提出了一种由多条并行马尔可夫链组成的并行HMM(Parallel Hidden Markov Model,PHMM),从而融合了基于分类的语音识别中为各个类别建立的模板,提高了识别性能,各条链之间允许有交叉,使得融合的多模板之间存在状态共享,同时PHMM可以在训练过程中自动完成聚类,且测试语音的输出结果来自所有类别,无需聚类分析和类别判断,这些都减少了存储量和计算量,汉语非特定人孤立数字的识别实验表明,PHMM较之传统CHMM使识别性能及噪声鲁棒性都得到了改善。 展开更多
关键词 特定人语音识别 连续隐马尔可夫模型 并行马尔可夫链
下载PDF
基于BP神经网络的非特定人语音识别算法 被引量:12
20
作者 戚龙 赵丹 《科学技术与工程》 北大核心 2017年第31期277-282,共6页
当前非特定人语音识别算法大多只适于连续语音,且识别精度和速度均较低。为此,提出一种新的基于BP神经网络的非特定人语音识别算法。介绍了标准BP神经网络,针对其收敛速度慢的弊端,通过变化的自适应学习速率,令网络训练针对各种阶段自... 当前非特定人语音识别算法大多只适于连续语音,且识别精度和速度均较低。为此,提出一种新的基于BP神经网络的非特定人语音识别算法。介绍了标准BP神经网络,针对其收敛速度慢的弊端,通过变化的自适应学习速率,令网络训练针对各种阶段自行设置学习速率值;利用变学习速率构建对应的改进BP神经网络模型。将改进的BP神经网络模型看作识别非特定语音的识别器,输入待识别语音,令累计预测残差达到最小,实现非特定人语音识别。将改进模型应用于非特定人语音识别中进行验证。结果表明所提算法识别率更高、识别速度更快,不仅适于连续语音的识别,也适于不连续语音的识别。 展开更多
关键词 BP神经网络 特定人 语音 识别
下载PDF
上一页 1 2 15 下一页 到第
使用帮助 返回顶部