期刊文献+
共找到43篇文章
< 1 2 3 >
每页显示 20 50 100
基于递归神经网络的藏语语音转文本应用研究
1
作者 彭杨 徐健 +2 位作者 卓嘎 付好 邢立佳 《互联网周刊》 2024年第17期23-25,共3页
本文针对藏语中的卫藏方言,探讨了自动语音识别(automatic speech recognition,ASR)技术在语音识别模型构建方面的应用。利用时间递归神经网络(recurrent neural network,RNN)及其变体来提升ASR系统的性能。通过引入LAS(listen,attend a... 本文针对藏语中的卫藏方言,探讨了自动语音识别(automatic speech recognition,ASR)技术在语音识别模型构建方面的应用。利用时间递归神经网络(recurrent neural network,RNN)及其变体来提升ASR系统的性能。通过引入LAS(listen,attend and spell)模型,并结合多任务学习框架、深度卷积神经网络和改进的注意力机制,显著提升了ASR系统的性能。在实验中,改进后的LAS模型在测试集和训练集上的词错误率分别达到了12.40%和16.23%,实验结果验证了方法的有效性。 展开更多
关键词 时间递归神经网络 自动语音识别 藏语语音
下载PDF
一种基于WaveNet的藏语语音合成方法 被引量:4
2
作者 丁云涛 才让卓玛 +1 位作者 贡保加 才智杰 《计算机仿真》 北大核心 2023年第1期295-299,538,共6页
针对Griffin-Lim声码器合成语音保真度低、人工合成痕迹明显的问题,提出了一种基于WaveNet神经网络声码器的藏语语音合成方法。方法基于藏文文本特征及藏语Mel频谱,运用WaveNet的相位恢复能力实现了藏语的语音合成。先将藏文文本经字符... 针对Griffin-Lim声码器合成语音保真度低、人工合成痕迹明显的问题,提出了一种基于WaveNet神经网络声码器的藏语语音合成方法。方法基于藏文文本特征及藏语Mel频谱,运用WaveNet的相位恢复能力实现了藏语的语音合成。先将藏文文本经字符编码转换为相应词向量,并通过卷积运算和注意力权重赋值完成文本特征提取;利用非线性变换和线性投影预测Mel频谱;利用WaveNet声码器合成藏语语音波形。实验数据表明,相对于Griffin-Lim算法合成的语音,所提方法所合成的语音效果更好。 展开更多
关键词 藏语语音合成 梅尔频谱 神经网络声码器
下载PDF
基于双向GRU模型的藏语语音情感识别 被引量:1
3
作者 蔡优新 边巴旺堆 《信息技术与信息化》 2023年第10期209-213,共5页
语音情感识别(speech emotion recognition,SER)是人机交互的重要组成部分,具有着非常广泛的研究和应用价值,可是在藏语语音情感识别领域的研究成果却不多。为了研究藏语SER领域,在构建了一个有着六千条拉萨话方言的藏语情感语音数据库T... 语音情感识别(speech emotion recognition,SER)是人机交互的重要组成部分,具有着非常广泛的研究和应用价值,可是在藏语语音情感识别领域的研究成果却不多。为了研究藏语SER领域,在构建了一个有着六千条拉萨话方言的藏语情感语音数据库TSED基础上,提出一种以MFCC特征和谱对比度特征相结合的双向GRU情感识别模型,通过对比不同实验的识别效果,用于判断模型的可行性。最后的实验结果表明,所提出的模型在藏语语音情感识别中可以达到87.22%的识别效果。 展开更多
关键词 藏语语音情感识别 门控循环单元 Mel频谱图 梅尔倒频谱系数 多特征融合
下载PDF
基于深度特征学习的藏语语音识别 被引量:8
4
作者 王辉 赵悦 +3 位作者 刘晓凤 徐晓娜 周楠 许彦敏 《东北师大学报(自然科学版)》 CAS CSCD 北大核心 2015年第4期69-73,共5页
根据听觉语音学的知识,提出使用稀疏自动编码器在MFCC特征基础上进行深度学习,提取了深度特征模仿听觉神经的稀疏触动信号,有利于HMM模型语音识别精度的提高.实验结果显示,学习到的深度特征较MFCC特征在藏语语音识别正确率方面有明显提高.
关键词 深度特征学习 稀疏自动编码器 藏语语音识别 MFCC特征
下载PDF
基于循环神经网络的藏语语音识别声学模型 被引量:16
5
作者 黄晓辉 李京 《中文信息学报》 CSCD 北大核心 2018年第5期49-55,共7页
探索将循环神经网络和连接时序分类算法应用于藏语语音识别声学建模,实现端到端的模型训练。同时根据声学模型输入与输出的关系,通过在隐含层输出序列上引入时域卷积操作来对网络隐含层时域展开步数进行约简,从而有效提升模型的训练与... 探索将循环神经网络和连接时序分类算法应用于藏语语音识别声学建模,实现端到端的模型训练。同时根据声学模型输入与输出的关系,通过在隐含层输出序列上引入时域卷积操作来对网络隐含层时域展开步数进行约简,从而有效提升模型的训练与解码效率。实验结果显示,与传统基于隐马尔可夫模型的声学建模方法相比,循环神经网络模型在藏语拉萨话音素识别任务上具有更好的识别性能,而引入时域卷积操作的循环神经网络声学模型在保持同等识别性能的情况下,拥有更高的训练和解码效率。 展开更多
关键词 循环神经网络 藏语语音识别 声学建模 时域卷积
下载PDF
基于Matlab的藏语语音基音检测算法研究 被引量:7
6
作者 卓嘎 边巴旺堆 《现代电子技术》 北大核心 2015年第10期20-22,共3页
目前藏语语音基音检测算法相关研究较少,藏语语音基音检测是藏语语音处理过程中的重要环节,其准确性直接影响到系统的性能。介绍中心消波和自相关函数的算法原理及基音检测算法,设计藏语语音基音检测流程,利用Matlab进行编程和仿真。通... 目前藏语语音基音检测算法相关研究较少,藏语语音基音检测是藏语语音处理过程中的重要环节,其准确性直接影响到系统的性能。介绍中心消波和自相关函数的算法原理及基音检测算法,设计藏语语音基音检测流程,利用Matlab进行编程和仿真。通过实验表明该算法结构简单、运算量小,结果较准确,可用于信噪比较低环境下藏语语音辅音的基音估值检测。 展开更多
关键词 基音检测 藏语语音 自相关算法 MATLAB
下载PDF
藏语语音合成中语料数据标注规则的设计 被引量:5
7
作者 曲珍 春燕 《西藏大学学报(社会科学版)》 CSSCI 2012年第2期62-66,共5页
基于隐马尔可夫模型(HMM)的藏语语音合成系统中,语料数据的标注是训练声学模型的基础和关键。文章结合藏语独有的语音特点对语料数据设计套标注规则,并以Praat为标注环境实现语料的标注。
关键词 藏语语音合成 语料数据 标注规则
下载PDF
基于Matlab的藏语语音MFCC参数提取研究 被引量:1
8
作者 卓嘎 姜军 边巴旺堆 《西藏大学学报(社会科学版)》 CSSCI 2017年第2期58-62,共5页
MFCC(Mel Frequency Cepstrum Coefficient)是语音处理过程中需要提取的重要频率参数之一,因其很好地模仿人耳的听觉感知,在各种语音识别和合成过程中得到广泛的应用。文章在分析标准的MFCC参数提取算法基础上,通过合并参数算法提取了... MFCC(Mel Frequency Cepstrum Coefficient)是语音处理过程中需要提取的重要频率参数之一,因其很好地模仿人耳的听觉感知,在各种语音识别和合成过程中得到广泛的应用。文章在分析标准的MFCC参数提取算法基础上,通过合并参数算法提取了藏语语音的MFCC,并给出了在Matlab里进行仿真实验的详细步骤。 展开更多
关键词 藏语语音 MFCC 参数提取 语音信号
下载PDF
基于LPC的藏语语音基音周期的检测分析 被引量:1
9
作者 马英 陈超 贾国庆 《现代电子技术》 北大核心 2015年第16期13-15,19,共4页
基音周期是语音信号的重要参数,提取藏语语音基音周期为藏语语音识别和藏语语音合成奠定很重要的基础。这里在分析藏语发音特点的基础上进行基于LPC的藏语语音基音周期提取算法的分析,实践表明,该方法更加符合小信噪比藏语音信号基音周... 基音周期是语音信号的重要参数,提取藏语语音基音周期为藏语语音识别和藏语语音合成奠定很重要的基础。这里在分析藏语发音特点的基础上进行基于LPC的藏语语音基音周期提取算法的分析,实践表明,该方法更加符合小信噪比藏语音信号基音周期和提取。在传统LPC分析方法的基础上结合自相关法和倒谱法,分析计算平均相对误差,总结出了符合藏语语音特点的特征提取算法。 展开更多
关键词 LPC 藏语语音 基音周期 倒谱法
下载PDF
藏语语音信号降噪算法研究 被引量:5
10
作者 顿珠次仁 《西藏大学学报(社会科学版)》 CSSCI 2010年第5期61-65,共5页
藏语语音在识别过程中会受到各种信号的干扰,从而影响语音识别的质量。在进行语音识别预处理过程中,语音信号的降噪技术是一个关键的环节。文章通过分析各种降噪手段,重点研究了藏语语音信号降噪方法,提出了符合藏语语音信号降噪的小波... 藏语语音在识别过程中会受到各种信号的干扰,从而影响语音识别的质量。在进行语音识别预处理过程中,语音信号的降噪技术是一个关键的环节。文章通过分析各种降噪手段,重点研究了藏语语音信号降噪方法,提出了符合藏语语音信号降噪的小波包降噪算法。其研究结果为进一步的藏语语音识别技术的研究提供了基础。 展开更多
关键词 小波包 降噪 藏语语音 算法
下载PDF
基于短时平均能量和短时过零率的藏语语音端点检测研究 被引量:6
11
作者 卓嘎 边巴旺堆 姜军 《电脑知识与技术》 2014年第11期7466-7469,共4页
语音端点检测是语音处理分析过程中的重要环节之一,该文介绍了语音端点检测的两个传统算法即短时平均能量和短时过零率,并将这两种算法结合起来进行藏语语音进行端点检测。运用Matlab编程和仿真验证了双门限判断法在藏语语音端点检测中... 语音端点检测是语音处理分析过程中的重要环节之一,该文介绍了语音端点检测的两个传统算法即短时平均能量和短时过零率,并将这两种算法结合起来进行藏语语音进行端点检测。运用Matlab编程和仿真验证了双门限判断法在藏语语音端点检测中的准确性。这种方法降低了藏语语音处理的时间、提高了处理的质量、可用来进行一些藏语语音识别的特征参数的提取。 展开更多
关键词 藏语语音 短时平均能量 短时过零率 双门限 端点检测
下载PDF
安多藏语语音合成语料库的设计 被引量:16
12
作者 李永宏 于洪志 《西北民族大学学报(自然科学版)》 2006年第1期36-39,共4页
藏语语音合成语料数据库的优劣对合成语音质量有很大的影响,语料的设计考虑了音段和韵律,语料库中包含藏语的音节、词语、独白语句和情景对话语等.
关键词 语音合成 语音 藏语语音
下载PDF
藏语语音时域参数提取关键技术研究 被引量:2
13
作者 卓嘎 姜军 董志诚 《电脑知识与技术》 2018年第3Z期186-188,共3页
语音特征参数是语音信号分析的重要参数依据,藏语语音特征参数的精确度直接影响藏语语音合成、语音识别及语音压缩等处理的效果。介绍了藏语时域语音信号处理过程中的语音特征参数及其提取关键技术:包括短时平均能量,短时平均幅度,短时... 语音特征参数是语音信号分析的重要参数依据,藏语语音特征参数的精确度直接影响藏语语音合成、语音识别及语音压缩等处理的效果。介绍了藏语时域语音信号处理过程中的语音特征参数及其提取关键技术:包括短时平均能量,短时平均幅度,短时过零率,短时自相关函数和端点检测等算法.分析了语音的时域特征参数在藏语语音分析中的实际应用。 展开更多
关键词 藏语语音 特征参数 短时平均能量 短时平均过零率 自相关函数
下载PDF
带噪藏语语音增强算法研究 被引量:1
14
作者 冯炎 安宝坤 《重庆科技学院学报(自然科学版)》 CAS 2013年第6期136-139,共4页
藏语语音增强方法能够用于提高噪声环境中语音处理设备的性能,并且能够在不同的噪声环境下使用而不影响其性能。根据藏语语音特点,提出藏语语音增强算法。实验显示,该算法具备良好的分段信噪比增益。
关键词 藏语语音 语音增强 噪声功率谱估计
下载PDF
基于隐马尔可夫过程的藏语语音预测初探 被引量:3
15
作者 马明 刘华 《西北民族大学学报(自然科学版)》 2008年第2期17-18,共2页
针对藏语言的特点,提出基于隐马尔可夫过程(HMM)的概率统计模型,用可观测的藏语文本信息预测重音标注,提出了初步设想.
关键词 隐马尔可夫过程 藏语语音 重音标注
下载PDF
面向藏语语音合成的语音基元自动标注方法 被引量:6
16
作者 徐世鹏 杨鸿武 王海燕 《计算机工程与应用》 CSCD 北大核心 2015年第6期199-203,共5页
在基于隐Markov模型(Hidden Markov Model,HMM)的统计参数藏语语音合成中引入了DAEM(Deterministic Annealing EM)算法,对没有时间标注的藏语训练语音进行自动时间标注。以声母和韵母为合成基元,在声母和韵母的声学模型的训练过程中,利... 在基于隐Markov模型(Hidden Markov Model,HMM)的统计参数藏语语音合成中引入了DAEM(Deterministic Annealing EM)算法,对没有时间标注的藏语训练语音进行自动时间标注。以声母和韵母为合成基元,在声母和韵母的声学模型的训练过程中,利用DAEM算法确定HMM模型的嵌入式重估的最佳参数。训练好声学模型后,再利用强制对齐自动获得声母和韵母的时间标注。实验结果表明,该方法对声母和韵母的时间标注接近手工标注的结果。对合成的藏语语音进行主观评测表明,该方法合成的藏语语音和手工标注声、韵母时间的方法合成的藏语语音的音质接近。因此,利用该方法可以在不需要声、韵母的时间标注的情况下建立合成基元的声学模型。 展开更多
关键词 藏语语音合成 确定性退火期望值最大化(DAEM)算法 自动标注 时间标注
下载PDF
基于神经网络的藏语语音合成 被引量:11
17
作者 都格草 才让卓玛 +1 位作者 南措吉 算太本 《中文信息学报》 CSCD 北大核心 2019年第2期75-80,共6页
语音合成是人机交互的核心技术之一,也是中文信息处理领域的一项前沿技术。随着神经网络理论的不断深入,基于神经网络的语音合成技术越来越引起人们的关注。该文通过分析藏文字结构与藏语拼读规则,融合Sequence to Sequence模型和注意... 语音合成是人机交互的核心技术之一,也是中文信息处理领域的一项前沿技术。随着神经网络理论的不断深入,基于神经网络的语音合成技术越来越引起人们的关注。该文通过分析藏文字结构与藏语拼读规则,融合Sequence to Sequence模型和注意力机制,研究了基于神经网络的藏语语音合成技术。实验数据表明,该文方法在藏语语音合成上具有良好的性能表现。 展开更多
关键词 藏语语音合成 神经网络 SEQUENCE to Sequence模型 注意力机制
下载PDF
藏语语音识别研究综述 被引量:5
18
作者 德庆卓玛 《西藏大学学报(社会科学版)》 CSSCI 2010年第S1期192-195,共4页
文章介绍了语音识别的技术、应用领域和藏语语音识别技术的现状,以及语音识别的基本原理及识别的过程分析,探讨了藏语语音识别技术中的难点问题,并展望藏文语音识别技术的发展方向和前景。
关键词 语音识别技术 藏语语音识别 难点 发展前景
下载PDF
一种藏语语音识别中数字文本规范方法 被引量:1
19
作者 贡保加 才智杰 +1 位作者 才让卓玛 彭毛扎西 《高原科学研究》 CSCD 2022年第3期117-124,共8页
语料库是语音识别技术的基础资源,藏语语料中数字的规范对藏语语音识别准确率有极大的影响。文章通过分析藏语语料库中的数字文本,提出了一种藏语语音识别中数字文本的规范方法,能有效规范藏语语料中数字文本,为后续藏语语音库构建及语... 语料库是语音识别技术的基础资源,藏语语料中数字的规范对藏语语音识别准确率有极大的影响。文章通过分析藏语语料库中的数字文本,提出了一种藏语语音识别中数字文本的规范方法,能有效规范藏语语料中数字文本,为后续藏语语音库构建及语音识别工作奠定基础。该方法根据藏文数字文本的特征符号和上下文文本对藏文数字文本进行了分类,并对不同藏文数字文本类型设计了规范化规则及算法,经实验验证,对藏文数字文本规范的准确率达到了99.28%。 展开更多
关键词 藏语语音识别 语料库 数字文本 规范
下载PDF
浅谈实验语音学对藏语语音研究的贡献 被引量:1
20
作者 索南楞智 《西藏研究》 北大核心 2016年第1期93-99,共7页
语音是语言的载体和本质,语音学是语言研究者的入门学科,对语言的研究分析提供了理论依据和方法指导。目前,藏语语音研究还停留在耳听手记的"口耳之学"之传统语音学,即生理语音学阶段。实验语音学的理论和方法还没有能在藏语... 语音是语言的载体和本质,语音学是语言研究者的入门学科,对语言的研究分析提供了理论依据和方法指导。目前,藏语语音研究还停留在耳听手记的"口耳之学"之传统语音学,即生理语音学阶段。实验语音学的理论和方法还没有能在藏语语音研究中得到应用和推广。这充分体现现代藏语语音的理论研究和研究手段尚需要更新和发展。 展开更多
关键词 实验语音 藏语语音 声学特征 语图
下载PDF
上一页 1 2 3 下一页 到第
使用帮助 返回顶部