期刊文献+
共找到14篇文章
< 1 >
每页显示 20 50 100
STATISTICAL FEATURE OF PITCH FREQUENCY DISTRIBUTIONS FOR OBUST SPEAKER IDENTIFICATION
1
作者 ZhangLinghua ZhengBaoyu YangZhen 《Journal of Electronics(China)》 2005年第4期437-442,共6页
This letter proposes an effective and robust speech feature extraction method based on statistical analysis of Pitch Frequency Distributions (PFD) for speaker identification. Compared with the conventional cepstrum, P... This letter proposes an effective and robust speech feature extraction method based on statistical analysis of Pitch Frequency Distributions (PFD) for speaker identification. Compared with the conventional cepstrum, PFD is relatively insensitive to Additive White Gaussian Noise (AWGN), but it does not show good performance for speaker identification, even if under clean environments. To compensate this shortcoming, PFD and conventional cepstrum are combined to make the ultimate decision, instead of simply taking one kind of features into account.Experimental results indicate that the hybrid approach can give outstanding improvement for text-independent speaker identification under noisy environments corrupted by AWGN. 展开更多
关键词 Speaker identification Feature extraction pitch frequency Gaussian Mixture model (GMM)
下载PDF
听觉模型鲁棒性特征研究及应用 被引量:1
2
作者 王文华 夏秀渝 《成都信息工程大学学报》 2024年第3期275-282,共8页
人类的听觉系统具有非常精细而巧妙的结构,即使在嘈杂的环境中,也能准确地理解语音。采用精细的耳蜗模型作为前端处理可以实现更好的语音处理。利用快速压缩的非对称谐振器级联(CARFAC)作为人耳外周模型,结合听觉稳定图像得到精确的皮... 人类的听觉系统具有非常精细而巧妙的结构,即使在嘈杂的环境中,也能准确地理解语音。采用精细的耳蜗模型作为前端处理可以实现更好的语音处理。利用快速压缩的非对称谐振器级联(CARFAC)作为人耳外周模型,结合听觉稳定图像得到精确的皮层前听觉模型。在听觉模型的基础上提取较准确的基音轮廓,利用基音信息进行声场景分析,合成鲁棒性语音特征,并将其送入神经网络进行监督训练,以实现语音增强。实验结果表明,噪声条件下,由听觉模型提取的特征在各语音评价指标下都有较好的体现,可以更好表征语音信号,具有一定的鲁棒性。 展开更多
关键词 CARFAC模型 听觉稳定图像 语音增强系统 基音提取
下载PDF
强噪声下基于听觉模型的汉语声调提取 被引量:2
3
作者 戴明扬 余凯 +1 位作者 徐柏龄 余崇智 《应用科学学报》 CAS CSCD 2001年第2期121-126,共6页
基于人耳听觉模型和汉语语音的短时平稳特性 ,提出一种鲁棒性的汉语普通话声调提取方法 .采用基于人耳听觉模型的相关图来提取语音信号的基频 ,运用无监督的侧抑制神经网络来模拟人耳侧抑制属性进行基频检测 ,为了克服在低信噪比情况下... 基于人耳听觉模型和汉语语音的短时平稳特性 ,提出一种鲁棒性的汉语普通话声调提取方法 .采用基于人耳听觉模型的相关图来提取语音信号的基频 ,运用无监督的侧抑制神经网络来模拟人耳侧抑制属性进行基频检测 ,为了克服在低信噪比情况下侧抑制神经网络的误判问题 ,引入了相邻语音帧的语音基频的帧间约束 .试验表明 ,该方法在信噪比很低的条件下 ,仍能较准确地识别出目标语音声调 。 展开更多
关键词 听觉模型 基音周期 声调提取 侧抑制神经网络 语音基频 语音识别 强噪声
下载PDF
基于听觉模型的特征在英语重音检测中的应用 被引量:3
4
作者 陈楠 贺前华 李韬 《计算机工程》 CAS CSCD 北大核心 2009年第8期26-27,30,共3页
对于英语等"重音节拍语言",重音是一个非常重要的韵律学特征。从听觉模型的角度出发,利用基音同步幅度峰值特征能同时表征瞬时频率和强度信息的特点进行重音检测。使用基音同步幅度峰值特征以及与传统特征的组合对英语连续语... 对于英语等"重音节拍语言",重音是一个非常重要的韵律学特征。从听觉模型的角度出发,利用基音同步幅度峰值特征能同时表征瞬时频率和强度信息的特点进行重音检测。使用基音同步幅度峰值特征以及与传统特征的组合对英语连续语音的试验结果表明,新特征能使系统误识率降低1.5%。 展开更多
关键词 重音检测 听觉模型 基音同步幅度峰值
下载PDF
基于听觉感知的电子耳蜗共振峰提取方案 被引量:1
5
作者 施晓敏 顾济华 +2 位作者 陶智 赵鹤鸣 张晓俊 《计算机工程与应用》 CSCD 北大核心 2007年第29期232-234,共3页
使用听觉感知的小波变换来提取电子耳蜗中的共振峰参数。首先用听觉感知的小波变换对原始语音信号进行分解重构,然后分别用自相关和格型法对合成语音信号和原始语音信号进行共振峰提取。实验结果表明:使用听觉感知的小波变换进行共振峰... 使用听觉感知的小波变换来提取电子耳蜗中的共振峰参数。首先用听觉感知的小波变换对原始语音信号进行分解重构,然后分别用自相关和格型法对合成语音信号和原始语音信号进行共振峰提取。实验结果表明:使用听觉感知的小波变换进行共振峰参数提取的可行性,合成语音信号能更好地表征原始语音信号的特征;同时也证实了电子耳蜗语音处理器中使用由格型法提取共振峰参数比自相关法更精确。 展开更多
关键词 共振峰提取 听觉感知 电子耳蜗 格型法
下载PDF
基于定性映射的哼唱音乐旋律提取 被引量:2
6
作者 冯嘉礼 刘文娟 《计算机工程》 CAS CSCD 2012年第18期251-254,共4页
根据哼唱旋律提取的特点和定性映射的相关知识,结合基本乐理,提出哼唱片段旋律提取的定性映射模型和算法,包括哼唱旋律音符切分阈值的动态定性判定,以及音符音高确定的动态赋权的定性映射。实验结果表明,该算法不仅能灵活合理地确定音... 根据哼唱旋律提取的特点和定性映射的相关知识,结合基本乐理,提出哼唱片段旋律提取的定性映射模型和算法,包括哼唱旋律音符切分阈值的动态定性判定,以及音符音高确定的动态赋权的定性映射。实验结果表明,该算法不仅能灵活合理地确定音符切分的定性判定基准,同时能够较准确地提取音符音高,并得到哼唱片段的旋律轮廓线。 展开更多
关键词 定性映射 属性计算网格 重心剖分模型 音符切分 基音提取 旋律编码
下载PDF
人耳音高感知的心理声学基本理论 被引量:1
7
作者 陈小平 陈静 《电声技术》 2011年第5期64-68,共5页
在简述人耳听觉构造和基底膜选频特性的基础上,详细介绍了解释人耳音高感知现象的两个心理声学基本理论,即"部位学说"和"时间论",同时介绍了部位学说和时间论在解释人耳音高感知存在的不足,以及人耳音高感知的心理... 在简述人耳听觉构造和基底膜选频特性的基础上,详细介绍了解释人耳音高感知现象的两个心理声学基本理论,即"部位学说"和"时间论",同时介绍了部位学说和时间论在解释人耳音高感知存在的不足,以及人耳音高感知的心理声学模型。 展开更多
关键词 听觉构造 基底膜 部位学说 时间论 音高感知模型
下载PDF
基于时域模型分析谐波复合音的音高感知机制
8
作者 王健 关添 叶大田 《北京大学学报(自然科学版)》 CAS CSCD 北大核心 2012年第4期559-564,共6页
为了探讨中等次数的谐波复合音是否依赖于时间精细结构信息进行音高感知,测量了谐波复合音的基频辨别阈。目标复合音可以单独存在,或者和掩蔽复合音同时存在。二者经过相同的带通滤波区域,具有不同的相位组合和基频差异。结果表明:相位... 为了探讨中等次数的谐波复合音是否依赖于时间精细结构信息进行音高感知,测量了谐波复合音的基频辨别阈。目标复合音可以单独存在,或者和掩蔽复合音同时存在。二者经过相同的带通滤波区域,具有不同的相位组合和基频差异。结果表明:相位组合对音高感知没有显著影响;滤波区域和基频差异对音高感知具有显著影响。采用时域模型分析发现,中等次数的谐波复合音可能依赖于时间精细结构信息获得较好的音高感知结果。研究结果能帮助建立复杂声音场景下的音高感知机制。 展开更多
关键词 谐波复合音 音高感知 时域模型 时间精细结构信息
下载PDF
基于听觉模型的基音提取
9
作者 夏德瑜 傅前杰 《生物物理学报》 CAS CSCD 北大核心 1993年第1期113-118,共6页
本文提出了一种新型有效的基于听觉模型的基音提取方法.它主要是模拟人类听觉系统音调感知功能,在跨通道累加自相关处理方法的基础上,增加了神经系统在感知时的时间连续性模拟,由于对空间和时间分布的信息的综合累加作用,使所提的方法... 本文提出了一种新型有效的基于听觉模型的基音提取方法.它主要是模拟人类听觉系统音调感知功能,在跨通道累加自相关处理方法的基础上,增加了神经系统在感知时的时间连续性模拟,由于对空间和时间分布的信息的综合累加作用,使所提的方法不仅能提取出淹没在各种噪音下的语言信号的基音信息,而且能够判断所处理信号是否由重叠语言信号构成,并进一步提取出叠在一起的独立的基音信息.初步的实验结果证明了所提模型的有效性. 展开更多
关键词 听觉模型 基音提取
下载PDF
扩展基音周期曲线在动态HMM模型中的应用
10
作者 陈斐利 朱杰 宋文涛 《电子测量与仪器学报》 CSCD 2004年第1期23-28,共6页
动态HMM模型通过描述语音特征与动态特性之间的关系来改善语音识别的性能 ,本文提出以扩展的基音周期曲线作为动态特性的描述 ,以及在识别过程中采用动态特性自动提取算法以改善识别性能。实验结果表明 ,采用扩展基音周期曲线作为动态... 动态HMM模型通过描述语音特征与动态特性之间的关系来改善语音识别的性能 ,本文提出以扩展的基音周期曲线作为动态特性的描述 ,以及在识别过程中采用动态特性自动提取算法以改善识别性能。实验结果表明 ,采用扩展基音周期曲线作为动态特性的动态HMM模型 。 展开更多
关键词 扩展基音周期曲线 动态特性 自动提取 动态HMM模型 语音识别
下载PDF
不同外绕盘管结构热泵热水器蓄能与用能性能分析 被引量:1
11
作者 刘恒 谭建明 +2 位作者 李舒宏 杜明浩 叶强 《化工进展》 EI CAS CSCD 北大核心 2021年第10期5459-5467,共9页
家用空气源热泵热水器能够高效制取生活热水,优化其冷凝盘管外绕结构设计,可以进一步提高系统运行性能。本文提出了外绕变间距盘管结构形式,通过建立MATLAB热泵模型与水箱CFD模型,联立形成耦合模拟模型,经实验验证耦合模型的准确性后,... 家用空气源热泵热水器能够高效制取生活热水,优化其冷凝盘管外绕结构设计,可以进一步提高系统运行性能。本文提出了外绕变间距盘管结构形式,通过建立MATLAB热泵模型与水箱CFD模型,联立形成耦合模拟模型,经实验验证耦合模型的准确性后,模拟研究了外绕等/变间距盘管结构对热泵热水器蓄能与用能性能的影响。结果显示,与外绕等间距盘管结构相比,变间距盘管结构蓄能过程中的平均传热系数、性能系数(COP)分别提高了21.91%、10.75%,热水温度分布更加均匀,用能过程中的平均传热系数和COP比等间距盘管稍高,热水输出率、释能效率分别提高了7.69%、8.53%,水箱输出的热水温度品质得到改善。本文为对冷凝盘管外绕形式的优化设计提供了方向和指导。 展开更多
关键词 热泵热水器 耦合模拟 热水输出率 等/变间距盘管 蓄能/用能
下载PDF
Robust Speech Recognition Using a Harmonic Model
12
作者 许超 曹志刚 《Tsinghua Science and Technology》 SCIE EI CAS 2004年第2期202-206,共5页
Automatic speech recognition under conditions of a noisy environment remains a challenging problem. Traditionally, methods focused on noise structure, such as spectral subtraction, have been em-ployed to address this ... Automatic speech recognition under conditions of a noisy environment remains a challenging problem. Traditionally, methods focused on noise structure, such as spectral subtraction, have been em-ployed to address this problem, and thus the performance of such methods depends on the accuracy in noise estimation. In this paper, an alternative method, using a harmonic-based spectral reconstruction algo-rithm, is proposed for the enhancement of robust automatic speech recognition. Neither noise estimation nor noise-model training are required in the proposed approach. A spectral subtraction integrated autocorrela-tion function is proposed to determine the pitch for the harmonic model. Recognition results show that the harmonic-based spectral reconstruction approach outperforms spectral subtraction in the middle- and low-signal noise ratio (SNR) ranges. The advantage of the proposed method is more manifest for non-stationary noise, as the algorithm does not require an assumption of stationary noise. 展开更多
关键词 robust speech recognition speech enhancement pitch extraction harmonic model
原文传递
检测语音端点及基音的概率模型及方法 被引量:4
13
作者 胡波 肖熙 《清华大学学报(自然科学版)》 EI CAS CSCD 北大核心 2013年第6期749-752,共4页
在传统的语音识别系统中,语音端点检测和基音提取是2个分开的步骤。将2个步骤合二为一将有助于提高误别准确性、降低系统复杂度。该文使用了一种语音时域分析方法,它使用概率模型描述语音幅度分布规律,并使用隐Markov模型(hidden Markov... 在传统的语音识别系统中,语音端点检测和基音提取是2个分开的步骤。将2个步骤合二为一将有助于提高误别准确性、降低系统复杂度。该文使用了一种语音时域分析方法,它使用概率模型描述语音幅度分布规律,并使用隐Markov模型(hidden Markov model,HMM)描述语音中的状态转换。使用新方法可以同时完成对语音端点的检测、清浊音的判断与基音频率计算。实验表明:这种算法在10dB以上信噪比的条件下可以得到准确的基音频率和端点位置。 展开更多
关键词 端点检测 基音提取 概率模型 统计方法 隐Markov模型(HMM)
原文传递
听觉皮层信号处理 被引量:2
14
作者 王晓勤 《生命科学》 CSCD 北大核心 2009年第2期216-221,共6页
听觉系统和视觉系统的不同之处在于:听觉系统在外周感受器和听皮层间具有更长的皮层下通路和更多的突触联系。该特殊结构反应了听觉系统从复杂听觉环境中提取与行为相关信号的机制与其他感觉系统不同。听皮层神经信号处理包括两种重要... 听觉系统和视觉系统的不同之处在于:听觉系统在外周感受器和听皮层间具有更长的皮层下通路和更多的突触联系。该特殊结构反应了听觉系统从复杂听觉环境中提取与行为相关信号的机制与其他感觉系统不同。听皮层神经信号处理包括两种重要的转换机制,声音信号的非同构转换以及从声音感受到知觉层面的转换。听觉皮层神经编码机制同时也受到听觉反馈和语言或发声过程中发声信号的调控。听觉神经科学家和生物医学工程师所面临的挑战便是如何去理解大脑中这些转换的编码机制。我将会用我实验室最近的一些发现来阐述听觉信号是如何在原听皮层中进行处理的,并讨论其对于言语和音乐在大脑中的处理机制以及设计神经替代装置诸如电子耳蜗的意义。我们使用了结合神经电生理技术和量化工程学的方法来研究这些问题。 展开更多
关键词 生物医学工程 系统神经生物学 听觉皮层 声调 发声 感受 狨猴
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部