期刊文献+
共找到37篇文章
< 1 2 >
每页显示 20 50 100
基于对抗训练策略的语言模型数据增强技术 被引量:19
1
作者 张一珂 张鹏远 颜永红 《自动化学报》 EI CSCD 北大核心 2018年第5期891-900,共10页
基于最大似然估计(Maximum likelihood estimation,MLE)的语言模型(Language model,LM)数据增强方法由于存在暴露偏差问题而无法生成具有长时语义信息的采样数据.本文提出了一种基于对抗训练策略的语言模型数据增强的方法,通过一个辅助... 基于最大似然估计(Maximum likelihood estimation,MLE)的语言模型(Language model,LM)数据增强方法由于存在暴露偏差问题而无法生成具有长时语义信息的采样数据.本文提出了一种基于对抗训练策略的语言模型数据增强的方法,通过一个辅助的卷积神经网络判别模型判断生成数据的真伪,从而引导递归神经网络生成模型学习真实数据的分布.语言模型的数据增强问题实质上是离散序列的生成问题.当生成模型的输出为离散值时,来自判别模型的误差无法通过反向传播算法回传到生成模型.为了解决此问题,本文将离散序列生成问题表示为强化学习问题,利用判别模型的输出作为奖励对生成模型进行优化,此外,由于判别模型只能对完整的生成序列进行评价,本文采用蒙特卡洛搜索算法对生成序列的中间状态进行评价.语音识别多候选重估实验表明,在有限文本数据条件下,随着训练数据量的增加,本文提出的方法可以进一步降低识别字错误率(Character error rate,CER),且始终优于基于MLE的数据增强方法.当训练数据达到6 M词规模时,本文提出的方法使THCHS 30数据集的CER相对基线系统下降5.0%,AISHELL数据集的CER相对下降7.1%. 展开更多
关键词 数据增强 语言模型 生成对抗网络 强化学习 语音识别
下载PDF
基于区块链技术及应用的可视化研究综述 被引量:2
2
作者 邵怡敏 赵凡 +1 位作者 王轶 王保全 《计算机应用》 CSCD 北大核心 2023年第10期3038-3046,共9页
区块链技术源自比特币,是一项颠覆性的创新技术,具有十分广阔的发展前景。面对区块链平台及应用领域不断扩展的需求,引进可视化技术能够增强用户的认知能力,帮助用户从海量复杂数据中高效发现有用信息,并辅助用户的理解与决策,是区块链... 区块链技术源自比特币,是一项颠覆性的创新技术,具有十分广阔的发展前景。面对区块链平台及应用领域不断扩展的需求,引进可视化技术能够增强用户的认知能力,帮助用户从海量复杂数据中高效发现有用信息,并辅助用户的理解与决策,是区块链技术的研究前沿之一。为了深入了解基于区块链技术及应用的可视化研究,首先,介绍了区块链和可视化基础理论,并从多个维度分析了现有区块链可视化研究文献;其次,从共性关键技术出发,介绍了区块链交易处理、共识机制、智能合约和网络安全方面的可视化研究方法;同时,概述了虚拟货币、社会民生和融合创新等多个领域中区块链可视化的应用现状;最后,总结和展望了基于区块链技术及应用的可视化研究的发展趋势。 展开更多
关键词 区块链 可视化 可视分析 区块链应用 联盟链 元宇宙
下载PDF
智能合约安全漏洞检测技术综述
3
作者 任虹 赵凡 《计算机应用》 CSCD 北大核心 2024年第S2期95-100,共6页
智能合约是区块链技术的核心组成部分。随着区块链应用在国内外的快速普及,智能合约漏洞引发的安全事件频频发生,导致了巨大的经济损失。针对上述问题,基于多种理论和技术,人们提出了适用于不同场景的智能合约漏洞检测方案。为了系统了... 智能合约是区块链技术的核心组成部分。随着区块链应用在国内外的快速普及,智能合约漏洞引发的安全事件频频发生,导致了巨大的经济损失。针对上述问题,基于多种理论和技术,人们提出了适用于不同场景的智能合约漏洞检测方案。为了系统了解智能合约的安全漏洞检测技术,调研和梳理了智能合约安全漏洞检测技术相关研究文献。首先,从逻辑和交互这2个方面系统性阐述和分析智能合约漏洞类型;其次,总结包括静态分析、符号执行、模糊检测和深度学习等现有智能合约漏洞检测方法的特点和局限性,并且归纳和比对30种漏洞检测工具;最后,探讨当前智能合约漏洞检测技术发展中面临的机遇和挑战,并结合深度学习技术展望了该领域未来的研究方向。 展开更多
关键词 智能合约 漏洞检测 区块链 合约安全 区块链安全
下载PDF
采用性别相关的深度神经网络及非负矩阵分解模型用于单通道语音增强 被引量:14
4
作者 李煦 王子腾 +2 位作者 王晓飞 付强 颜永红 《声学学报》 EI CSCD 北大核心 2019年第2期221-230,共10页
为了从带噪信号中得到纯净的语音信号,提出了一种采用性别相关模型的单通道语音增强算法。具体而言,在训练阶段,分别训练了与性别相关的深度神经网络-非负矩阵分解模型用于估计非负矩阵分解中的权重参数;在测试阶段,提出了一种基于非负... 为了从带噪信号中得到纯净的语音信号,提出了一种采用性别相关模型的单通道语音增强算法。具体而言,在训练阶段,分别训练了与性别相关的深度神经网络-非负矩阵分解模型用于估计非负矩阵分解中的权重参数;在测试阶段,提出了一种基于非负矩阵分解和组稀疏惩罚的算法用于判断测试语音中说话人的性别信息,然后再采用对应的模型估计权重,并结合已训练好的字典进行语音增强。实验结果表明所提算法在噪声抑制量及语音质量上,均优于一些基于非负矩阵分解的算法和基于深度神经网络的算法。 展开更多
关键词 语音增强 NMF 非负矩阵 增强算法 DNN 单通道 幅度谱 权重矩阵 分解模型
原文传递
基于递归神经网络的语音识别快速解码算法 被引量:17
5
作者 张舸 张鹏远 +1 位作者 潘接林 颜永红 《电子与信息学报》 EI CSCD 北大核心 2017年第4期930-937,共8页
递归神经网络(Recurrent Neural Network,RNN)如今已经广泛用于自动语音识别(Automatic Speech Recognition,ASR)的声学建模。虽然其较传统的声学建模方法有很大优势,但相对较高的计算复杂度限制了这种神经网络的应用,特别是在实时应用... 递归神经网络(Recurrent Neural Network,RNN)如今已经广泛用于自动语音识别(Automatic Speech Recognition,ASR)的声学建模。虽然其较传统的声学建模方法有很大优势,但相对较高的计算复杂度限制了这种神经网络的应用,特别是在实时应用场景中。由于递归神经网络采用的输入特征通常有较长的上下文,因此利用重叠信息来同时降低声学后验和令牌传递的时间复杂度成为可能。该文介绍了一种新的解码器结构,通过有规律抛弃存在重叠的帧来获得解码过程中的计算开销降低。特别地,这种方法可以直接用于原始的递归神经网络模型,只需对隐马尔可夫模型(Hidden Markov Model,HMM)结构做小的变动,这使得这种方法具有很高的灵活性。该文以时延神经网络为例验证了所提出的方法,证明该方法能够在精度损失相对较小的情况下取得2~4倍的加速比。 展开更多
关键词 语音识别 递归神经网络 解码器 跳帧计算
下载PDF
基于去中心化索引的区块链时空数据查询方法
6
作者 李俊杰 周喜 +2 位作者 马玉鹏 王保全 王轶 《计算机工程与设计》 北大核心 2025年第3期641-647,共7页
为提高区块链上时空数据查询效率,结合布谷鸟过滤器思想,提出一种基于去中心化索引的区块链时空数据查询方法。采用Geohash算法为链上时空数据建立聚集性空间数据编码,通过计算编码前缀和分布式哈希表间距离构建去中心化索引网络,设计... 为提高区块链上时空数据查询效率,结合布谷鸟过滤器思想,提出一种基于去中心化索引的区块链时空数据查询方法。采用Geohash算法为链上时空数据建立聚集性空间数据编码,通过计算编码前缀和分布式哈希表间距离构建去中心化索引网络,设计共轭布谷鸟时空索引结构实现对区块链时空数据的高效索引查询。实验通过搭建Hyperledger Fabric区块链网络,使用公开数据集验证方法的有效性,相较于已有代表性方案取得了查询效率的提升。 展开更多
关键词 区块链 区块链数据管理 时空数据 时空索引 超级账本 去中心化网络 布谷鸟过滤器
下载PDF
基于改进主题分布特征的神经网络语言模型 被引量:10
7
作者 刘畅 张一珂 +1 位作者 张鹏远 颜永红 《电子与信息学报》 EI CSCD 北大核心 2018年第1期219-225,共7页
在递归神经网络(RNN)语言模型输入中增加表示当前词所对应主题的特征向量是一种有效利用长时间跨度历史信息的方法。由于在不同文档中各主题的概率分布通常差别很大,该文提出一种使用文档主题概率改进当前词主题特征的方法,并将改进后... 在递归神经网络(RNN)语言模型输入中增加表示当前词所对应主题的特征向量是一种有效利用长时间跨度历史信息的方法。由于在不同文档中各主题的概率分布通常差别很大,该文提出一种使用文档主题概率改进当前词主题特征的方法,并将改进后的特征应用于基于长短时记忆(LSTM)单元的递归神经网络语言模型中。实验表明,在PTB数据集上该文提出的方法使语言模型的困惑度相对于基线系统下降11.8%。在SWBD数据集多候选重估实验中,该文提出的特征使LSTM模型相对于基线模型词错误率(WER)相对下降6.0%;在WSJ数据集上的实验中,该特征使LSTM模型相对于基线模型词错误率(WER)相对下降6.8%,并且在eval92测试集上,改进隐含狄利克雷分布(LDA)特征使RNN效果与LSTM相当。 展开更多
关键词 语音识别 语言模型 隐含狄利克雷分布 长短时记忆
下载PDF
Echo:以语音交互为入口的软件定义音箱 被引量:2
8
作者 颜永红 《网络新媒体技术》 2018年第2期12-15,共4页
亚马逊Echo,作为智能音箱的鼻祖,自上市以来取得了举世瞩目的成功。Echo涉及了语音交互的完整生态链,是第一款严格意义上以语音交互技术为核心的成功产品,同时它也标志了软件定义家电时代的到来。本文试图对Echo的成功原因进行分析,希... 亚马逊Echo,作为智能音箱的鼻祖,自上市以来取得了举世瞩目的成功。Echo涉及了语音交互的完整生态链,是第一款严格意义上以语音交互技术为核心的成功产品,同时它也标志了软件定义家电时代的到来。本文试图对Echo的成功原因进行分析,希望对从事语音产品的研发人员有所启发。 展开更多
关键词 亚马逊Echo 智能音箱 语音交互 软件定义家电
下载PDF
面向汉维机器翻译的神经网络语言模型 被引量:3
9
作者 李毓 杨雅婷 +2 位作者 李晓 米成刚 董瑞 《厦门大学学报(自然科学版)》 CAS CSCD 北大核心 2019年第2期189-194,共6页
针对传统神经网络语言模型方法只关注词语之间关系或者词语内部信息而导致维吾尔语语言模型困惑度(PPL)过高的问题,提出了融入词素信息的维吾尔语神经网络语言模型.该方法在传统神经网络语言模型的基础上添加了词内结构建模层及合并层,... 针对传统神经网络语言模型方法只关注词语之间关系或者词语内部信息而导致维吾尔语语言模型困惑度(PPL)过高的问题,提出了融入词素信息的维吾尔语神经网络语言模型.该方法在传统神经网络语言模型的基础上添加了词内结构建模层及合并层,利用双向长短时序记忆网络来捕捉词内结构信息,并与word2vec训练好的词向量相结合作为神经网络语言模型的输入;同时还采用重构N元语法(N-gram)语言模型的方式将神经网络模型应用到汉维统计机器翻译中.实验表明该模型的PPL降低了19.93,在汉维统计机器翻译任务中机器双语互译评估(BLEU)值提升了0.28个百分点. 展开更多
关键词 维吾尔语 机器翻译 语言模型 词向量 长短时序记忆网络
下载PDF
基于区块链技术的公益时间银行系统 被引量:18
10
作者 肖凯 王蒙 +1 位作者 唐新余 蒋同海 《计算机应用》 CSCD 北大核心 2019年第7期2156-2161,共6页
在现有的时间银行系统中,时间币的发行功能和结算功能完全集中到一个中心节点上。这种极度中心化的功能结构,不仅存在容易发生中心节点单点失效、数据容易被篡改等信息安全问题,还存在着时间币的发行和流通缺乏透明度以及时间币的结算... 在现有的时间银行系统中,时间币的发行功能和结算功能完全集中到一个中心节点上。这种极度中心化的功能结构,不仅存在容易发生中心节点单点失效、数据容易被篡改等信息安全问题,还存在着时间币的发行和流通缺乏透明度以及时间币的结算依赖中心化的结算机构等问题。针对这些问题,提出了一种基于区块链技术的解决方法。首先,将时间币的发行功能和结算功能从中心节点上分离出来;然后,利用具有分布式去中心化、集体维护和不可篡改等特性的区块链技术,将分离出来的发行功能逐步去中心化,将分离出来的结算功能去中心化,形成公益时间链(PWTB);最终,PWTB利用区块链技术以去中心化的方式将时间银行系统由单个节点维护账本变成由集体维护一个分布式的共享账本,使时间币的发行和流通公开透明,时间币的结算不依赖某个中心化的节点。安全分析表明所设计的PWTB能够实现安全的信息传输与存储,以及数据的共享。 展开更多
关键词 区块链 时间银行 时间币 去中心化 信息安全
下载PDF
早晚期混响划分对理想比值掩蔽在语音识别性能上的影响 被引量:6
11
作者 高飞 黄哲莹 +2 位作者 王子腾 李军锋 颜永红 《声学学报》 EI CSCD 北大核心 2019年第4期788-795,共8页
真实环境中存在的噪声和混响会降低语音识别系统的性能。封闭空间中的混响包括直达声、早期反射和后期混响3部分,它们对语音识别系统具有不同的影响.我们研究了早期反射和后期混响的不同划分方法,以其中的早期反射为目标语音,计算出了... 真实环境中存在的噪声和混响会降低语音识别系统的性能。封闭空间中的混响包括直达声、早期反射和后期混响3部分,它们对语音识别系统具有不同的影响.我们研究了早期反射和后期混响的不同划分方法,以其中的早期反射为目标语音,计算出了不同的理想比值掩蔽并研究了它们对语音识别系统性能的影响;在此基础上,利用双向长短时记忆网络(BLSTM)估计理想比值掩蔽,测试它们对语音识别系统性能的影响.实验结果表明,基于Abel早期反射和后期混响的划分方法,理想比值掩蔽能够降低词错误率约2.8%;基于BLSTM的估计方法过低估计了理想比值掩蔽,未能有效提高语音识别系统的性能。 展开更多
关键词 语音识别系统 识别性能 混响 掩蔽 比值 理想 划分 晚期
原文传递
基于预训练语言模型的维吾尔语事件抽取 被引量:4
12
作者 张朋捷 王磊 +3 位作者 马博 杨雅婷 董瑞 艾孜麦提·艾瓦尼尔 《计算机工程与设计》 北大核心 2023年第5期1487-1494,共8页
以往的维吾尔语事件抽取研究多采用静态词向量加长短时记忆神经网络的分析方式,无法有效处理一词多义和上下文语义表示问题。针对目标语言,训练两种维吾尔语预训练语言模型,提出一种结合BiGRU的联合问答模型事件抽取方法。利用预训练语... 以往的维吾尔语事件抽取研究多采用静态词向量加长短时记忆神经网络的分析方式,无法有效处理一词多义和上下文语义表示问题。针对目标语言,训练两种维吾尔语预训练语言模型,提出一种结合BiGRU的联合问答模型事件抽取方法。利用预训练语言模型获取文本的动态语义向量,融合类别表征信息,运用BiGRU进一步提取文本特征。实验结果表明,在事件识别任务上F1值达到77.96%,在事件主体抽取任务上F1值达到74.89%。相比基线模型NER方法,所提方法的F1值提高了14.08%。 展开更多
关键词 预训练语言模型 维吾尔语 事件抽取 联合问答模型 双向门控循环单元 类型识别 主体抽取
下载PDF
基于去中心化索引的IPFS数据获取方法研究 被引量:7
13
作者 石秋娥 周喜 王轶 《计算机工程与应用》 CSCD 北大核心 2022年第3期83-90,共8页
星际文件系统(interplanetary file system,IPFS)实现了去中心化存储,可以满足日益增长的数据存储需求,然而IPFS仅提供一种精确的数据获取方式,在缺乏数据唯一标识时无法查找数据。现有的IPFS数据获取方法削弱了IPFS的去中心化,仅实现... 星际文件系统(interplanetary file system,IPFS)实现了去中心化存储,可以满足日益增长的数据存储需求,然而IPFS仅提供一种精确的数据获取方式,在缺乏数据唯一标识时无法查找数据。现有的IPFS数据获取方法削弱了IPFS的去中心化,仅实现了关键字搜索,对长查询语句进行关键词搜索加重了网络负担。为此,提出了一种去中心化混合索引的IPFS数据获取方法--IPFS-DDAM。提取数据的关键词及中心语句以建立关键词索引及句子索引;使用分布式哈希表(distributed Hash table,DHT)存储索引,数据内容相似的句子索引存储相邻,实现了句子索引的邻近范围搜索及关键词索引的精确搜索;改进缓存存储机制,减少冗余存储;通过在公开数据集上的仿真实验证明了该方法的有效性,并且减少了网络负担。 展开更多
关键词 星际文件系统 分布式哈希表 去中心化 关键词索引 句子索引 缓存
下载PDF
双向长短时记忆模型训练中的空间平滑正则化方法研究 被引量:3
14
作者 李文洁 葛凤培 +1 位作者 张鹏远 颜永红 《电子与信息学报》 EI CSCD 北大核心 2019年第3期544-550,共7页
双向长短时记忆模型(BLSTM)由于其强大的时间序列建模能力,以及良好的训练稳定性,已经成为语音识别领域主流的声学模型结构。但是该模型结构拥有更大计算量以及参数数量,因此在神经网络训练的过程当中很容易过拟合,进而无法获得理想的... 双向长短时记忆模型(BLSTM)由于其强大的时间序列建模能力,以及良好的训练稳定性,已经成为语音识别领域主流的声学模型结构。但是该模型结构拥有更大计算量以及参数数量,因此在神经网络训练的过程当中很容易过拟合,进而无法获得理想的识别效果。在实际应用中,通常会使用一些技巧来缓解过拟合问题,例如在待优化的目标函数中加入L2正则项就是常用的方法之一。该文提出一种空间平滑的方法,把BLSTM模型激活值的向量重组成一个2维图,通过滤波变换得到它的空间信息,并将平滑该空间信息作为辅助优化目标,与传统的损失函数一起,作为优化神经网络参数的学习准则。实验表明,在电话交谈语音识别任务上,这种方法相比于基线模型取得了相对4%的词错误率(WER)下降。进一步探索了L2范数正则技术和空间平滑方法的互补性,实验结果表明,同时应用这2种算法,能够取得相对8.6%的WER下降。 展开更多
关键词 语音信号处理 空间平滑 双向长短时记忆模型(LSTM) 正则化 过拟合
下载PDF
基于注意力机制多特征融合的虚假信息检测 被引量:3
15
作者 地力夏提·阿布都热依木 马博 +1 位作者 杨雅婷 王磊 《厦门大学学报(自然科学版)》 CAS CSCD 北大核心 2022年第4期608-616,共9页
在虚假信息识别任务中,面对图文结合的虚假内容,基于单模态的模型难以进行准确识别.社交媒体中的虚假信息为吸引关注和迅速传播的目的,会使用夸张的词汇煽动读者的情绪.如何将情感特征引入多模态虚假信息检测模型进行多特征融合,并准确... 在虚假信息识别任务中,面对图文结合的虚假内容,基于单模态的模型难以进行准确识别.社交媒体中的虚假信息为吸引关注和迅速传播的目的,会使用夸张的词汇煽动读者的情绪.如何将情感特征引入多模态虚假信息检测模型进行多特征融合,并准确地识别虚假信息是一个挑战.为此,本文提出了基于注意力机制多特征融合的虚假信息检测方法(att-MFNN).该模型中先将文本特征和情感特征基于注意力机制融合,再与视觉特征组成多模态特征送入虚假信息识别器和事件分类器中.通过引入事件分类器学习不同事件中的共同特征,提高新事件的识别性能.att-MFNN在微博和推特(Twitter)数据集的准确率达到了89.22%和87.51%,并且F_(1)、准确率、召回率指标均优于现有的模型. 展开更多
关键词 虚假信息检测 多特征融合 注意力机制 情感提取
下载PDF
基于时域和时频域联合优化的语音增强算法 被引量:6
16
作者 杨帆 李军锋 颜永红 《网络新媒体技术》 2021年第5期37-42,共6页
基于深度学习的语音增强算法从带噪语音信号的时域或者时频域中恢复出干净的语音信号。然而,时域和时频域的增强算法都有自己的优点和不足。针对这一问题,本文提出了一种基于时域和时频域联合优化的语音增强算法。在生成对抗网络框架下... 基于深度学习的语音增强算法从带噪语音信号的时域或者时频域中恢复出干净的语音信号。然而,时域和时频域的增强算法都有自己的优点和不足。针对这一问题,本文提出了一种基于时域和时频域联合优化的语音增强算法。在生成对抗网络框架下,分别构建了时域和时频域的学习目标。在训练过程中,利用跳跃连接搭建了深层次的网络结构,通过对不同领域学习目标的联合优化,获得了语音增强性能的改善。实验结果表明:相比基线模型,本文提出的算法在多个客观评价指标上都具有更好的表现。 展开更多
关键词 生成对抗网络 神经网络 语音增强
下载PDF
基于深度学习的两阶段联合声学回波和混响抑制技术 被引量:1
17
作者 栾书明 程龙彪 +2 位作者 孙兴伟 李军锋 颜永红 《信号处理》 CSCD 北大核心 2020年第6期948-957,共10页
在现代通信系统中,回波与混响常损害通信语音的质量和可懂度。为克服回波与混响的负面影响,本文提出了一种基于深度学习的两阶段联合声学回波和混响抑制系统。系统先用基于理想比值掩蔽的模型去除与目标信号不相关的声学回波;然后用一... 在现代通信系统中,回波与混响常损害通信语音的质量和可懂度。为克服回波与混响的负面影响,本文提出了一种基于深度学习的两阶段联合声学回波和混响抑制系统。系统先用基于理想比值掩蔽的模型去除与目标信号不相关的声学回波;然后用一个基于"隐掩蔽"的谱映射模型去除与目标信号强相关的混响干扰;最后联合训练两阶段模型以获得更好的系统性能。一系列不同声学环境下的实验结果表明,本文所提出的系统可显著地消除回波与混响干扰,从而极大地增强了目标语音的语音质量与可懂度。 展开更多
关键词 回波消除 去混响 双向长短时记忆网络 理想比率掩蔽 联合训练 谱映射
下载PDF
基于子词信息的维吾尔语词项规范化
18
作者 张新路 王磊 +1 位作者 杨雅婷 米成刚 《厦门大学学报(自然科学版)》 CAS CSCD 北大核心 2019年第2期217-224,共8页
拉丁化的维吾尔语在使用过程中具有文本不规范的特点,这种不规范是造成歧义等现象的最主要原因,严重制约着与维吾尔语相关的自然语言处理应用.由此提出了一种无监督的基于子词信息的文本规范化方法,该方法在词向量构建过程中将词的内部... 拉丁化的维吾尔语在使用过程中具有文本不规范的特点,这种不规范是造成歧义等现象的最主要原因,严重制约着与维吾尔语相关的自然语言处理应用.由此提出了一种无监督的基于子词信息的文本规范化方法,该方法在词向量构建过程中将词的内部信息考虑进去.这种方法可以对罕见词进行向量表示,也可以将词内部的形态信息融入词的表示,丰富词向量的表达,进而用于改进无监督学习中规范化词候选集生成质量的不足.实验表明,相比于传统词向量构建方法,该方法在文本规范化任务中可以提高规范化词的召回率. 展开更多
关键词 维吾尔语 自然语言处理 文本规范化 词嵌入
下载PDF
基于多尺度风格自适应的手写维文识别模型
19
作者 闫林 王磊 +2 位作者 艾孜麦提·艾尼瓦尔 杨雅婷 李晓 《计算机工程与设计》 北大核心 2024年第9期2749-2756,共8页
基于字符形态与书写风格的强关联性,提出一种多尺度风格自适应的手写维文识别模型,模型从浅层笔划到深层序列建模多尺度风格特征,提高对手写风格的自适应能力。针对手写维文特点改进Transformer提取多尺度笔划特征;构建多尺度风格自适... 基于字符形态与书写风格的强关联性,提出一种多尺度风格自适应的手写维文识别模型,模型从浅层笔划到深层序列建模多尺度风格特征,提高对手写风格的自适应能力。针对手写维文特点改进Transformer提取多尺度笔划特征;构建多尺度风格自适应模块提取序列特征;构建特征泛化融合模块对笔划特征和序列特征进行深度融合,提升识别效果。实验结果表明,该模型在真实手写维文测试集WER、CER分别下降3.75%、0.19%,在IAM数据集中验证了模型迁移性。 展开更多
关键词 手写维文识别 手写风格 多尺度 特征金字塔网络 视觉自注意力模型 长短期记忆网络 特征融合
下载PDF
使用深度学习的多通道水下目标识别 被引量:18
20
作者 李琛 黄兆琼 +3 位作者 徐及 郭新毅 宫在晓 颜永红 《声学学报》 EI CSCD 北大核心 2020年第4期506-514,共9页
为解决低信噪比条件下水下目标识别率低的问题,提出一种适用于多通道水听器阵列的深度学习水下目标识别方法。首先是采用子通道特征级联的方法利用多通道信息;在特征提取方面,采用对信号的不同频率区间进行加权的特征提取器,并对提取的... 为解决低信噪比条件下水下目标识别率低的问题,提出一种适用于多通道水听器阵列的深度学习水下目标识别方法。首先是采用子通道特征级联的方法利用多通道信息;在特征提取方面,采用对信号的不同频率区间进行加权的特征提取器,并对提取的特征进行正则规整;最后采用深度神经网络(Deep Neural Network,DNN)实现目标识别。实验首先在仿真条件下对所提出方法的有效性进行验证,结果表明在-15 dB信噪比条件下的五目标识别任务中,使用多通道级联特征的深度神经网络的识别正确率达到96.7%,显著高于基于支持向量机(Support Vector Machine,SVM)的方法。在后续的湖上试验中,深度神经网络的平均正确率达到96.0%,进一步验证了所提出方法的有效性。 展开更多
关键词 深度神经网络 深度学习 水下目标识别 通道特征 特征提取 平均正确率 水听器阵列 频率区间
原文传递
上一页 1 2 下一页 到第
使用帮助 返回顶部