期刊文献+
共找到36篇文章
< 1 2 >
每页显示 20 50 100
少样本情感可控语音合成研究与应用
1
作者 张梦姣 杨捍 马军 《通信技术》 2024年第9期897-904,共8页
在深度合成技术快速发展的背景下,基于现有语音合成技术,特定人物的语音合成需要在专业的录音棚收集大量的数据,同时,合成语音情感仅限于录制的数据。在VITS2方法的基础上提出了新的情感可控语音合成模型,新增了预训练的说话人特征提取... 在深度合成技术快速发展的背景下,基于现有语音合成技术,特定人物的语音合成需要在专业的录音棚收集大量的数据,同时,合成语音情感仅限于录制的数据。在VITS2方法的基础上提出了新的情感可控语音合成模型,新增了预训练的说话人特征提取模块、情感特征提取模块、双向流网络损失计算模块和混合训练技巧,实现了少样本情况下情感可控语音合成。在AISHELL3数据集进行实验,结果表明,所提模型在少样本情况下具有更高的合成自然度和合成相似度。在EDS数据集上进行实验表明,所提模型在少样本情况下具有更高的情感相似度,相比于基线方法,在客观指标上合成字错误率也更低,进一步验证了所提方法的有效性。 展开更多
关键词 语音合成 少样本 情感可控 双向流网络 情感特征提取
下载PDF
轻量且基频可预测的端到端语音合成系统
2
作者 梁婷 艾斯卡尔·艾木都拉 +1 位作者 刘煌 徐颖 《南京师范大学学报(工程技术版)》 CAS 2023年第4期37-42,共6页
提出了一种轻量级的基频可控的完全端到端的语音合成模型.该模型基于目前最流行的完全的端到端的语音合成模型VITS做出了三处改进,使得合成的语音韵律感更强,从而提高语音合成的自然度和表现力,同时提高发音的准确性和推理速度.首先,引... 提出了一种轻量级的基频可控的完全端到端的语音合成模型.该模型基于目前最流行的完全的端到端的语音合成模型VITS做出了三处改进,使得合成的语音韵律感更强,从而提高语音合成的自然度和表现力,同时提高发音的准确性和推理速度.首先,引入帧先验网络得到细粒度的均值方差表示,且引入音素预测器和CTC loss以提高发音的稳定性.其次,在模型中使用音素真实时长对齐文本和音频帧,并且加入F0预测器,增强语音的韵律感.另外,用多频带和短时傅立叶变换替换原始模型中的Decoder,有效提高了模型的推理速度.最后,使用MOS测试和RTF作为实验主观和客观的评判标准.实验证明,模型在音频自然度和表现力方面提高了至少5%,且相比原始VITS推理速度提高了3倍. 展开更多
关键词 端到端语音合成 韵律预测 逆快速傅立叶变换 变分字编码器 多频带
下载PDF
结合光流算法与注意力机制的U-Net网络跨模态视听语音分离 被引量:1
3
作者 兰朝凤 蒋朋威 +2 位作者 陈欢 韩闯 郭小霞 《电子与信息学报》 EI CSCD 北大核心 2023年第10期3538-3546,共9页
目前多数的视听分离模型,大多是基于视频特征和音频特征简单拼接,没有充分考虑各个模态的相互关系,导致视觉信息未被充分利用,该文针对此问题提出了新的模型。该文充分考虑视觉特征、音频特征之间的相互联系,采用多头注意力机制,结合稠... 目前多数的视听分离模型,大多是基于视频特征和音频特征简单拼接,没有充分考虑各个模态的相互关系,导致视觉信息未被充分利用,该文针对此问题提出了新的模型。该文充分考虑视觉特征、音频特征之间的相互联系,采用多头注意力机制,结合稠密光流(Farneback)算法和U-Net网络,提出跨模态融合的光流-视听语音分离(Flow-AVSS)模型。该模型通过Farneback算法和轻量级网络ShuffleNet v2分别提取运动特征和唇部特征,然后将运动特征与唇部特征进行仿射变换,经过时间卷积模块(TCN)得到视觉特征。为充分利用到视觉信息,在进行特征融合时采用多头注意力机制,将视觉特征与音频特征进行跨模态融合,得到融合视听特征,最后融合视听特征经过U-Net分离网络得到分离语音。利用客观语音质量评估(PESQ)、短时客观可懂度(STOI)及源失真比(SDR)评价指标,在AVspeech数据集进行实验测试。研究表明,该文所提方法与纯语音分离网络和仅采用特征拼接的视听分离网络相比,性能上分别提高了2.23 dB和1.68 dB。由此表明,采用跨模态注意力进行特征融合,能更加充分利用各个模态相关性,增加的唇部运动特征,能有效提高视频特征的鲁棒性,提高分离效果。 展开更多
关键词 视听语音分离 视听融合 跨模态注意力 光流算法
下载PDF
一种基于奇偶相关性网络的基音周期隐写分析方法
4
作者 王嘉伟 楼芊驿 +1 位作者 戴望宇 杨洁 《现代信息科技》 2023年第20期92-95,99,共5页
由于基音周期参数在语音编码过程中具有不可预测性,因此,很多隐写算法都将隐藏信息嵌入到基音周期中。目前已有多种基于基音周期的检测方法,但是如何准确的做到信息隐藏检测仍是一项挑战。文章提出了一种基于奇偶相关性网络的基因周期... 由于基音周期参数在语音编码过程中具有不可预测性,因此,很多隐写算法都将隐藏信息嵌入到基音周期中。目前已有多种基于基音周期的检测方法,但是如何准确的做到信息隐藏检测仍是一项挑战。文章提出了一种基于奇偶相关性网络的基因周期隐写分析方法。实验结果表明,该方法可以有效地检测基于基音周期的隐写术。实验结果表明,提出的方法可以有效地检测基于基音周期的隐写术,具有良好的实时性和健壮性。 展开更多
关键词 信息隐藏检测 SVM 语音码流
下载PDF
基于流特性和真值程度的VoIP语音质量单端客观评价 被引量:7
5
作者 成卫青 龚俭 丁伟 《通信学报》 EI CSCD 北大核心 2008年第4期30-39,共10页
提出了一种仅利用IP流特性预测VoIP感知服务质量(PQoS)的非侵入单端客观评价方法——FSPAV,其关键是定义了3个与用户感知相关的流特性测度。不需要同步时钟或解析应用协议,仅需要监测用户主机接收到的包含对端用户语音数据的IP分组计算... 提出了一种仅利用IP流特性预测VoIP感知服务质量(PQoS)的非侵入单端客观评价方法——FSPAV,其关键是定义了3个与用户感知相关的流特性测度。不需要同步时钟或解析应用协议,仅需要监测用户主机接收到的包含对端用户语音数据的IP分组计算测度。使用个体真值程度度量,将通话片段的3个测度测量值映射成一个通话质量客观评价值,计算过程中还能得出每个特性的优劣程度。在互联网上利用VoIP软件QQ和Skype进行多次语音通话实验,实验结果显示主、客观评价值之间具有相当高的相关性,表明了本方法的有效性。 展开更多
关键词 VOIP 语音质量客观评价 流特性 真值程度度量
下载PDF
基于即时文语转换技术的IVR流程编辑器的设计 被引量:2
6
作者 姚仲敏 吴丹 +1 位作者 李丽 侯彬 《计算机工程与设计》 CSCD 北大核心 2010年第22期4916-4919,共4页
针对传统交互式语音应答(IVR)系统在开发期间需要录制大量的语音文件供程序调用,并都是基于某种特定业务,流程被固定化,用户无法随时根据需要进行更改等问题,在IVR流程树基本原理的基础上,设计了一种基于即时文语转换技术(TTS)的新型IV... 针对传统交互式语音应答(IVR)系统在开发期间需要录制大量的语音文件供程序调用,并都是基于某种特定业务,流程被固定化,用户无法随时根据需要进行更改等问题,在IVR流程树基本原理的基础上,设计了一种基于即时文语转换技术(TTS)的新型IVR流程编辑器。系统省略了传统语音文件的录制过程,使用即时文语转化技术实现数据的实时朗读,无须事先人工录音,节省了大量的人力及计算机空间。同时具有业务无关性和可定制的流程编辑,用户可根据自身需要,定义自己的指令流程节点、节点属性以及方法,随时定制、修改自己的IVR系统。 展开更多
关键词 交互式语音应答系统 流程树 文语转换技术 流程编辑器 节点
下载PDF
基于心流理论的教育游戏设计框架要素研究——以特殊儿童言语学习游戏为案例 被引量:37
7
作者 王永固 张婷 +1 位作者 李玮 黄碧玉 《远程教育杂志》 CSSCI 2014年第3期97-104,共8页
构建有效的教育游戏设计模型是当前亟待研究的课题。在国内外心流理论和教育游戏设计相关成果的基础上,使用基于设计的研究方法,构建了基于心流理论的教育游戏设计框架。继而分析了该设计框架的构成要素及其设计方法,并基于该研究框架... 构建有效的教育游戏设计模型是当前亟待研究的课题。在国内外心流理论和教育游戏设计相关成果的基础上,使用基于设计的研究方法,构建了基于心流理论的教育游戏设计框架。继而分析了该设计框架的构成要素及其设计方法,并基于该研究框架研发了特殊儿童言语学习游戏案例且进行了实证研究。研究发现,学习者在教育游戏中产生心流体验的前提条件有三个:清晰的任务目标、及时的反馈和任务与技能的平衡。为生成以上前提条件,教育游戏设计应分为四个阶段:游戏目标分析、游戏情境创设、游戏玩法设计和游戏元素设计,每个阶段应采取对应的设计任务使阶段性设计成果具备心流体验产生的条件。 展开更多
关键词 心流理论 教育游戏 言语学习 游戏设计
下载PDF
基于WiFi的无线语音接收终端设计 被引量:1
8
作者 刘虎 沈元元 《工矿自动化》 北大核心 2012年第12期37-40,共4页
针对目前的语音调度系统存在实时性差、需要布设大量电缆等问题,设计了一种基于WiFi的无线语音接收终端。该语音接收终端工作时,无线收发模块GS1011接收来自无线网络的数据帧,STM32微控制器以中断方式将接收到的数据放入环形缓存区中,... 针对目前的语音调度系统存在实时性差、需要布设大量电缆等问题,设计了一种基于WiFi的无线语音接收终端。该语音接收终端工作时,无线收发模块GS1011接收来自无线网络的数据帧,STM32微控制器以中断方式将接收到的数据放入环形缓存区中,当环形缓存区数据大于播放阈值,STM32微控制器从环形缓存区中读取语音数据并通过音频编解码模块VS1053解码播放。同时,该语音接收终端采用RTP协议结合环形缓存及动态调整语音回放速率的措施来消除网络抖动现象。测试结果表明,该语音接收终端响应时间不到1s,语音信号稳定,消除了网络抖动带来的影响。 展开更多
关键词 WiFi无线通信 语音通信 语音接收终端 网络延时 网络抖动 数据包排序 语音流式设计
下载PDF
基于言语感知模型的英语语流信息听辨研究 被引量:4
9
作者 杨学云 《外国语文》 北大核心 2014年第1期136-139,共4页
通过对言语感知模型理论的回顾,分析言语听辨研究领域取得的成果和尚存的不足,探讨了影响语流信息听辨的基本因子及其对言语听辨的促进作用,为英语听力教学提供了以下启示:第一,语音教学应突出英语音位系统与母语音位系统的差异,让学生... 通过对言语感知模型理论的回顾,分析言语听辨研究领域取得的成果和尚存的不足,探讨了影响语流信息听辨的基本因子及其对言语听辨的促进作用,为英语听力教学提供了以下启示:第一,语音教学应突出英语音位系统与母语音位系统的差异,让学生熟悉英汉两种语言的音节节拍特征,以此消除语流切分过程中所产生的母语负迁移;第二,将听辨策略作为听力教学的一个重要内容,强化学生的听辨策略运用意识;第三,鼓励背诵,强化语言知识积累,提高学习者的语块识别敏感度;第四,寓话语标记语教学于听、说、读、写各教学环节,帮组学生熟悉标记语的语用属性,促进话语标记语的自然习得,从而达到为言语听辨服务的目的。 展开更多
关键词 言语感知模型 英语 语流 信息 听辨
下载PDF
语流音变和语音教学——针对英语学习者语音教学的思考 被引量:8
10
作者 马佳盈 刘浩 许亚明 《黄山学院学报》 2008年第3期117-120,共4页
英语是一种语调语言(intonation language),同作为声调语言(tone language)的汉语在语流特征上存在很大的差异,具体表现在同化,连音和增音,以及弱化和脱落等语流音变现象上。所以在对英语学习者的语音教学中应该注意英汉两种语言在语流... 英语是一种语调语言(intonation language),同作为声调语言(tone language)的汉语在语流特征上存在很大的差异,具体表现在同化,连音和增音,以及弱化和脱落等语流音变现象上。所以在对英语学习者的语音教学中应该注意英汉两种语言在语流特征的区别,减少语言学习者在英语学习过程中由于母语影响而产生的负迁移,在语流中学习语音,真正提高英语学习者的语言能力,达到用英语熟练交际的最终目标。 展开更多
关键词 语流 语流音变 语音教学
下载PDF
韩国语语流中送气音与紧音的音变现象探析 被引量:1
11
作者 文钟哲 文慧 《辽东学院学报(社会科学版)》 2013年第1期72-75,共4页
学术界对韩国语语流中音节之间的送气音与紧音的变音现象似乎还没有足够的重视,研究不够深入,有待于进一步探究。韩国语语流中音节之间的送气音与紧音的音变现象,主要表现在以下两个方面:一是以元音结尾的音节因为受后面送气音或紧音为... 学术界对韩国语语流中音节之间的送气音与紧音的变音现象似乎还没有足够的重视,研究不够深入,有待于进一步探究。韩国语语流中音节之间的送气音与紧音的音变现象,主要表现在以下两个方面:一是以元音结尾的音节因为受后面送气音或紧音为首发音音节的影响,自然而然地添加韵尾;二是后面的元音音节因为受前音节的送气音或紧音韵尾的影响而产生连音变音现象。音节之间的送气音与紧音犹如连接两个或两个以上音节的桥梁,使发音音节形成比较稳定的发音单位。如果把音节之间的送气音长度分为三等分,那么在前音节韵尾发音长度为一等分,在后音节的首发音发音长度为二等分;如果把音节之间的紧音长度分成二等分,那么前音节的韵尾发音长度和后音节首发音发音长度各为一等分。当然,声音的长短轻重因人而异,但这种分析方法基本上符合现实生活中一般韩国人的发音习惯,具有一定的科学性和实用性。 展开更多
关键词 韩国语语流 送气音与紧音 音变现象
下载PDF
基于MFCC和HMM的气固流型辨识 被引量:2
12
作者 胡红利 闫洁冰 +1 位作者 邢文奇 张炜 《沈阳工业大学学报》 EI CAS 北大核心 2013年第5期555-560,共6页
针对气力输送管道中测控装置后常见的三种过渡流型,即中心流、环状流和层状流,采用静电传感器作为测量装置获得静电流动噪声信号,借鉴语音信号处理方法,提取静电流动噪声信号的梅尔频率倒谱系数(MFCC)及其一阶差分作为特征参数,用特征... 针对气力输送管道中测控装置后常见的三种过渡流型,即中心流、环状流和层状流,采用静电传感器作为测量装置获得静电流动噪声信号,借鉴语音信号处理方法,提取静电流动噪声信号的梅尔频率倒谱系数(MFCC)及其一阶差分作为特征参数,用特征参数训练连续高斯混合密度隐马尔科夫模型(CGHMM),建立不同流型的模型库,再用训练好的CGHMM模型对提取的特征参数进行分类,进而实现流型识别.实验结果表明,该方法识别率达到98%,为气固流流型识别及气力输送测控装置提供了新的研究方法. 展开更多
关键词 气固两相流 测控装置 语音信号处理 流型识别 梅尔频率倒谱系数 静电传感器 流动噪声信号 连续高斯混合密度隐马尔科夫模型
下载PDF
面向电力系统潮流仿真的语音交互研究 被引量:3
13
作者 黄淼 陈仁 +2 位作者 钟浩 王强钢 文旭 《电工电能新技术》 CSCD 北大核心 2021年第12期40-47,共8页
以深度学习为代表的人工智能技术不断发展,正逐步渗透并融入电力系统等传统领域。为增强潮流仿真中人机交互的智能化程度,减少仿真技术人员在输入数据、计算分析等过程中的重复劳动,本文从语音识别理论和工程应用相结合的角度开展研究,... 以深度学习为代表的人工智能技术不断发展,正逐步渗透并融入电力系统等传统领域。为增强潮流仿真中人机交互的智能化程度,减少仿真技术人员在输入数据、计算分析等过程中的重复劳动,本文从语音识别理论和工程应用相结合的角度开展研究,提出了一种在潮流仿真中嵌入语音识别技术的方法。首先,对现有潮流仿真软件融入语音识别技术的可行性进行了探讨;其次,利用基于开源的电力系统分析工具Pandapower,设计了潮流仿真的语音识别流程,提出了相应的实现方法;最后,在建立的语音识别系统上,对1个仿真算例进行了测试。测试结果表明,本文提出在潮流仿真中嵌入语音识别技术的方法,能有效地实现潮流数据的语音编辑以及潮流计算的语音控制等功能。 展开更多
关键词 电力系统 语音识别 人机交互 潮流仿真 Pandapower
下载PDF
计算机辅助普通话水平测试评分问题的研究——以二级甲等“机测”成绩为中心的调查分析 被引量:3
14
作者 童效杰 《韩山师范学院学报》 2017年第2期65-72,共8页
计算机辅助普通话水平测试将测试环境形式由人工转变为计算机,其突出作用是减少了人为因素干扰、增强了测试的客观性和公正性,进而提高了测试的规范性和权威性。然而通过对测试最终成绩进行分析和比较发现:计算机辅助普通话水平测试评判... 计算机辅助普通话水平测试将测试环境形式由人工转变为计算机,其突出作用是减少了人为因素干扰、增强了测试的客观性和公正性,进而提高了测试的规范性和权威性。然而通过对测试最终成绩进行分析和比较发现:计算机辅助普通话水平测试评判中,存在对应试者的"特殊发音错误"和发音缺陷"测不准"、对连读和语流"不评测"等问题。这一现象必须引起重视并加以纠正,否则不仅会失去普通话水平测试的严肃性、科学性和权威性,而且也会对普通话学习和训练带来错误的导向,进而严重偏离推广普通话工作的目标。要进一步加强对计算机辅助普通话水平测试的研究,扩大语音样本数据库语音样本类型和数量,以提高计算机网上评分的分辨识别能力,并通过加强人工复评来纠正部分计算机网上评分的偏差。 展开更多
关键词 “机测” 特殊发音错误 发音缺陷 连读 语流 “测不准” “不评测”
下载PDF
英汉语流音变对比分析 被引量:3
15
作者 刘恩祥 《深圳信息职业技术学院学报》 2008年第1期85-89,共5页
音变是语言变化的一个重要内容,音变在英语和汉语中都普遍存在。从语言类型学来看,英汉语属差异较大的语言系统,他们的语音系统也相差甚远,然而两种语言的音变现象却有许多相似之处或松散的对应关系。本文拟就英汉语音变中的语流音变作... 音变是语言变化的一个重要内容,音变在英语和汉语中都普遍存在。从语言类型学来看,英汉语属差异较大的语言系统,他们的语音系统也相差甚远,然而两种语言的音变现象却有许多相似之处或松散的对应关系。本文拟就英汉语音变中的语流音变作一对比分析,进而指出音变发生的原因和特点,最后说明音变研究给我们的启示。 展开更多
关键词 音变 英语 汉语 语流音变
下载PDF
低频rTMS配合言语训练对脑出血伴运动性失语患者神经功能、语言功能及大脑前动脉Vm的影响
16
作者 杨秀芝 《反射疗法与康复医学》 2023年第23期62-64,80,共4页
目的探究低频重复经颅磁刺激(rTMS)配合言语训练对脑出血伴运动性失语患者神经功能、语言功能及大脑前动脉平均血流速度(Vm)的影响。方法选择2021年3月—2023年4月本院收治的80例脑出血伴运动性失语患者为研究对象,按随机数表法将其分... 目的探究低频重复经颅磁刺激(rTMS)配合言语训练对脑出血伴运动性失语患者神经功能、语言功能及大脑前动脉平均血流速度(Vm)的影响。方法选择2021年3月—2023年4月本院收治的80例脑出血伴运动性失语患者为研究对象,按随机数表法将其分为对照组和观察组。对照组(n=40)采用言语训练,观察组(n=40)在对照组基础上采用低频rTMS配合言语训练,两组均干预12周。对比两组的神经功能、语言功能、大脑前动脉Vm及生活质量。结果干预后,观察组神经功能评分为(5.11±1.16)分,低于对照组的(8.35±1.51)分,差异有统计学意义(P<0.05);干预后,观察组听理解、复述、说、朗读、阅读分值均高于对照组,组间差异有统计学意义(P<0.05);干预后,观察组大脑前动脉Vm快于对照组,差异有统计学意义(P<0.05);干预后,观察组生活质量综合评定问卷评分高于对照组,差异有统计学意义(P<0.05)。结论低频rTMS配合言语训练能够有效改善脑出血伴运动性失语患者的神经功能、语言功能,可调节大脑前动脉Vm,提高生活质量。 展开更多
关键词 脑出血伴运动性失语 低频重复经颅磁刺激 言语训练 神经功能 语言功能 大脑前动脉平均血流速度
原文传递
基于感知评价的Internet语音终端流量控制
17
作者 张军 张德运 赵东平 《计算机工程》 EI CAS CSCD 北大核心 2006年第5期23-25,共3页
分析了影响因特网语音通信质量的主要因素,根据实时传输控制协议计算延迟、丢包率等网络参数,并利用RBF神经网络将参数映射为语音质量评分,根据评分值的变化动态地调整语音终端的编码速率,在保证一定语音质量的同时,缓解网络拥塞。实验... 分析了影响因特网语音通信质量的主要因素,根据实时传输控制协议计算延迟、丢包率等网络参数,并利用RBF神经网络将参数映射为语音质量评分,根据评分值的变化动态地调整语音终端的编码速率,在保证一定语音质量的同时,缓解网络拥塞。实验证明了该方法的有效性。 展开更多
关键词 实时传输控制协议 流量控制 语音质量评价 RBF神经网络
下载PDF
基于DSP/BIOS的语音信号处理系统设计
18
作者 郑展恒 曾庆宁 韦照川 《桂林电子科技大学学报》 2015年第6期454-458,共5页
针对当前语音信号处理大多在Matlab仿真,为了实现其在硬件系统的实时处理,设计了一个基于DSP/BIOS的语音信号处理系统。以SEED-DTK-VPM642构成硬件平台,采用DSP/BIOS实时操作系统为基础,将语音信号通过AIC23处理后,传到TMS320DM642实现... 针对当前语音信号处理大多在Matlab仿真,为了实现其在硬件系统的实时处理,设计了一个基于DSP/BIOS的语音信号处理系统。以SEED-DTK-VPM642构成硬件平台,采用DSP/BIOS实时操作系统为基础,将语音信号通过AIC23处理后,传到TMS320DM642实现语音信号的回声处理。实验结果表明,该系统通过改变相应参数,能实现语音信号的不同回声效果,实时性较好。 展开更多
关键词 DSP/BIOS 流模型 回声 语音信号
下载PDF
一种基于联合源-滤波器模型优化的语音声门源模型估计方法 被引量:3
19
作者 付强 Peter Murphy 颜永红 《电子学报》 EI CAS CSCD 北大核心 2007年第5期982-986,共5页
本文论述了一种基于联合源-滤波器分离的稳健声门源模型估计方法.此方法利用LF(Liljencrants-Fant)模型对声门波导数(glottal flow derivative)进行建模,而声道被描述为一个时变的ARX模型.由于联合估计问题是一个多变量非线性优化过程,... 本文论述了一种基于联合源-滤波器分离的稳健声门源模型估计方法.此方法利用LF(Liljencrants-Fant)模型对声门波导数(glottal flow derivative)进行建模,而声道被描述为一个时变的ARX模型.由于联合估计问题是一个多变量非线性优化过程,本文采用了一个两阶段(two-pass)的实现策略来解决这一问题.第一阶段初始化声门源和声道模型,并为其后的联合优化过程提供稳健的初始参数.第二阶段的联合估计则最终决定模型估计的精度,由信任域下降优化算法实现.通过分别对合成和真实语音的实验,表明该方法是一种具有一定精度和较好的稳健性的声门源模型估计算法. 展开更多
关键词 语音产生模型 源-滤波器 声门波导数 ARX 声门波估计 联合优化
下载PDF
基于Matlab仿真的语音信号增强算法研究 被引量:1
20
作者 杨国荣 靳丽君 《科学技术与工程》 2010年第31期7652-7655,共4页
语音增强技术是语音信号处理的一个重要分支,也是语音识别系统的重要组成部分。简单介绍了现有的各种语音增强算法,并对目前应用最为普遍的谱相减法作了系统的描述。对传统型、增强型、改进型的谱相减法进行了探讨验证,提出了一种基于C... 语音增强技术是语音信号处理的一个重要分支,也是语音识别系统的重要组成部分。简单介绍了现有的各种语音增强算法,并对目前应用最为普遍的谱相减法作了系统的描述。对传统型、增强型、改进型的谱相减法进行了探讨验证,提出了一种基于C语言环境的算法程序,详细地介绍了该程序并画出了它的算法流程图,而且进行了算法仿真,通过分析它在-5dB,0dB,5dB的信噪比下的输入输出波形,证明了该程序可以较好地实现语音增强。 展开更多
关键词 语音增强 谱相减法 Martin算法 N-S流程图
下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部