期刊文献+
共找到3,696篇文章
< 1 2 185 >
每页显示 20 50 100
基于双目图像深度学习的农作物择优采摘仿真
1
作者 白维维 李俊杰 陈烽 《计算机仿真》 2024年第2期187-191,共5页
面对复杂的农作物生长环境,利用传统机器视觉技术采摘易受到未成熟果实以及周围叶片影响,获取的农作物果实图像存在较多的不可用信息,无法完成择优采摘。为了确保采摘的果蔬品质,提出基于双目图像深度学习的农作物择优采摘方法。利用直... 面对复杂的农作物生长环境,利用传统机器视觉技术采摘易受到未成熟果实以及周围叶片影响,获取的农作物果实图像存在较多的不可用信息,无法完成择优采摘。为了确保采摘的果蔬品质,提出基于双目图像深度学习的农作物择优采摘方法。利用直方图均衡化变换视觉图像区域,明确农作物图像内像素灰度值,均衡化色块不均位置。通过色彩分量调节全局图像颜色,以颜色差异分割双目图像,剔除局部RGB色彩关联性。在提取农作物形状特征前,将深度信息再次归一化,获得作物形态描述符。选择卷积神经网络对图像实行卷积运算,将择优特征结果输入到卷积层内,输出图像分类结果,实现农作物择优采摘。实验结果表明,所提方法的择优采摘精准度达到0.98,果实形状特征识别为0.96。说明所提方法能够准确识别出品质佳的农作物,实现了择优采摘。 展开更多
关键词 双目图像 深度学习 农作物择优采摘 图像预处理 特征提取
下载PDF
基于差异化学习的Transformer改进方法研究
2
作者 丁义 《软件》 2024年第7期91-94,共4页
以Transformer为代表的神经机器翻译模型是目前机器翻译领域中的研究热点。多头注意力机制是Transformer的重要组成部分,其作用是增强模型提取不同信息的能力,提高模型的泛化性。但是多头注意力机制中存在部分自注意力头失效的问题。针... 以Transformer为代表的神经机器翻译模型是目前机器翻译领域中的研究热点。多头注意力机制是Transformer的重要组成部分,其作用是增强模型提取不同信息的能力,提高模型的泛化性。但是多头注意力机制中存在部分自注意力头失效的问题。针对此问题,本文提出了基于差异化学习的Transformer改进方法,通过在Transformer的训练过程中使用新颖的差异化学习方法充分提高自注意力头的有效性。在多项机器翻译任务中的实验结果表明,相比原始的Transformer,基于差异化学习方法改进的Transformer可以取得更高的BLEU值。 展开更多
关键词 机器翻译 TRANSFORMER 多头注意力 差异化学习
下载PDF
Storm分布式计算框架下基于知识图谱的快速学习资源推荐 被引量:2
3
作者 刘莹 杨淑萍 张治国 《南京邮电大学学报(自然科学版)》 北大核心 2024年第3期93-99,共7页
针对在线学习资源推荐存在精度较低或实时性较差的问题,采用知识图谱进行用户及资源的知识表示,并采用长短时间记忆网络对用户资源特征差进行优化,从而将与用户特征差最小的资源推送给用户。首先,在获得在线学习记录样本后,利用知识图... 针对在线学习资源推荐存在精度较低或实时性较差的问题,采用知识图谱进行用户及资源的知识表示,并采用长短时间记忆网络对用户资源特征差进行优化,从而将与用户特征差最小的资源推送给用户。首先,在获得在线学习记录样本后,利用知识图谱进行实体特征关系的知识表示,并借助Storm分布式框架生成知识图谱中头尾实体及关系特征向量。接着,建立用户-资源实体的最小特征差目标函数,并采用长短时间记忆网络对最小特征差目标函数进行优化。最后,通过Storm分布式平台进行长短时间记忆网络的参数求解,从而快速生成稳定的相关资源推荐模型。实验结果表明,在Storm分布式框架下采用知识图谱和长短时间记忆网络实现在线资源推荐,可获得较高准确率及运行效率,在应对大规模资源的实时推荐方面具有较强的适应度。 展开更多
关键词 资源推荐 知识图谱 Storm框架 长短时间记忆 TransD模型
下载PDF
基于时序对齐的风格控制语音合成算法
4
作者 郭傲 许柏炎 +1 位作者 蔡瑞初 郝志峰 《广东工业大学学报》 CAS 2024年第2期84-92,共9页
语音合成风格控制的目标是将自然语言转化为对应富有表现力的音频输出。基于Transformer的风格控制语音合成算法能在保持质量的情况下提高了合成速度,但仍存在不足:第一,在风格参考音频和文本长度差异大的情况下,存在合成音频部分风格... 语音合成风格控制的目标是将自然语言转化为对应富有表现力的音频输出。基于Transformer的风格控制语音合成算法能在保持质量的情况下提高了合成速度,但仍存在不足:第一,在风格参考音频和文本长度差异大的情况下,存在合成音频部分风格缺失的问题;第二,基于普通注意力的解码过程容易出现复读、漏读以及跳读的问题。针对以上问题,提出了一种基于时间对齐的风格控制语音合成算法(Temporal Alignment Text-to-Speech,TATTS)分别在编码和解码过程中有效利用时序信息。在编码过程中,TATTS提出了时序对齐的交叉注意力模块联合训练风格音频与文本表示,解决了不等长音频文本的对齐问题;在解码过程中,TATTS考虑了音频时序单调性,在Transformer解码器中引入了逐步单调的多头注意力机制,解决了合成音频中出现的错读问题。与基准模型相比,TATTS在LJSpeech和VCTK数据集上音频结果自然度分别提升了3.8%和4.8%,在VCTK数据集上风格相似度提升了10%,验证了该语音合成算法的有效性,并且体现出风格控制与迁移能力。 展开更多
关键词 语音合成 时序对齐 风格控制 TRANSFORMER 风格迁移
下载PDF
说话人感知的交叉注意力说话人提取网络
5
作者 李卓璋 许柏炎 +1 位作者 蔡瑞初 郝志峰 《广东工业大学学报》 CAS 2024年第3期91-101,共11页
目标说话人提取任务的目标是在一段混合音频中提取特定说话人的语音,任务设置上一般会给一段目标说话人注册音频作为辅助信息。现有的研究工作主要有以下不足:(1)说话人识别的辅助网络无法捕获学习注册音频中的关键信息;(2)缺乏混合音... 目标说话人提取任务的目标是在一段混合音频中提取特定说话人的语音,任务设置上一般会给一段目标说话人注册音频作为辅助信息。现有的研究工作主要有以下不足:(1)说话人识别的辅助网络无法捕获学习注册音频中的关键信息;(2)缺乏混合音频嵌入和注册音频嵌入的交互学习机制。以上不足导致了现有研究工作在注册音频和目标音频之间存在较大差异时有说话人混淆问题。为了解决该问题,提出说话人感知的交叉注意力说话人提取网络(Speaker-aware Cross Attention Speaker Extraction Network,SACAN)。SACAN在说话人识别辅助网络引入基于注意力的说话人聚合模块,有效聚合目标说话人声音特性的关键信息和利用混合音频增强目标说话人嵌入。进一步地,SACAN通过交叉注意力构建交互学习机制促进说话人嵌入与混合音频嵌入融合学习,增强了模型的说话人感知能力。实验结果表明,SACAN相比基准方法在STOI和SI-SDRi分别提高了0.013 3、1.069 5 d B,并在说话人混淆相关评估和消融实验中验证了不同模块的有效性。 展开更多
关键词 语音分离 目标说话人提取 说话人嵌入 交叉注意力 多任务学习
下载PDF
神经机器翻译综述 被引量:2
6
作者 章钧津 田永红 +1 位作者 宋哲煜 郝宇峰 《计算机工程与应用》 CSCD 北大核心 2024年第4期57-74,共18页
机器翻译主要研究如何将源语言翻译为目标语言,对于促进民族之间的交流具有重要意义。目前神经机器翻译凭借翻译速度和译文质量成为主流的机器翻译方法。为更好地进行脉络梳理,首先对机器翻译的历史和方法进行研究,并对基于规则的机器... 机器翻译主要研究如何将源语言翻译为目标语言,对于促进民族之间的交流具有重要意义。目前神经机器翻译凭借翻译速度和译文质量成为主流的机器翻译方法。为更好地进行脉络梳理,首先对机器翻译的历史和方法进行研究,并对基于规则的机器翻译、基于统计的机器翻译和基于深度学习的机器翻译三种方法进行对比总结;然后引出神经机器翻译,并对其常见的类型进行讲解;接着选取多模态机器翻译、非自回归机器翻译、篇章级机器翻译、多语言机器翻译、数据增强技术和预训练模型六个主要的神经机器翻译研究领域进行重点介绍;最后从低资源语言、上下文相关翻译、未登录词和大模型四个方面对神经机器翻译的未来进行了展望。通过系统性的介绍以更好地理解神经机器翻译的发展现状。 展开更多
关键词 机器翻译 神经机器翻译 篇章级机器翻译 数据增强 预处理技术
下载PDF
融入上下文特征提取的非自回归神经机器翻译
7
作者 赵光耀 王剑 +1 位作者 高盛祥 余正涛 《陕西理工大学学报(自然科学版)》 2024年第3期44-51,83,共9页
非自回归翻译(NAT)模型是一种消除目标句子中的顺序依赖关系的翻译模型,在推理速度上取得了显著的突破。然而该模型在翻译质量方面存在一些局限,为探究原因,主要对注意机制进行了细致而全面的初步研究,研究结果揭示了NAT模型在捕捉局部... 非自回归翻译(NAT)模型是一种消除目标句子中的顺序依赖关系的翻译模型,在推理速度上取得了显著的突破。然而该模型在翻译质量方面存在一些局限,为探究原因,主要对注意机制进行了细致而全面的初步研究,研究结果揭示了NAT模型在捕捉局部性特征方面存在明显不足。为此提出了一种通过明确引入周围词汇信息而改进NAT模型局部性能力的方法。具体而言,在编码器和解码器两个方向上引入了混合分组线性变换,以获得更具局部感知性的表示。通过在WMT14英德与WMT16英罗两个数据集上进行实验,结果表明该方法以微弱的速度代价分别提高了0.7与1.03个BLEU分数,这表明该研究方法在改善NAT模型的局部性特征提取方面具有显著的效果和潜力。 展开更多
关键词 非自回归 局部性特征 混合分组线性变换 自回归
下载PDF
基于领域术语词典和句式框架的藏汉机器翻译领域数据增强方法研究
8
作者 格桑加措 尼玛扎西 +2 位作者 嘎玛扎西 次仁白玛 步寅硕 《高原科学研究》 CSCD 2024年第3期92-101,132,共11页
藏汉机器翻译系统在新闻、时政等领域已经取得了显著的翻译效果,这主要归功于建立了相对充足的双语句对。然而,现有藏汉双语语料中存在较大的领域偏差问题,藏医、佛学等领域的数据极度稀缺,导致藏汉翻译模型在处理这些低资源领域句对时... 藏汉机器翻译系统在新闻、时政等领域已经取得了显著的翻译效果,这主要归功于建立了相对充足的双语句对。然而,现有藏汉双语语料中存在较大的领域偏差问题,藏医、佛学等领域的数据极度稀缺,导致藏汉翻译模型在处理这些低资源领域句对时面临着领域词汇稀缺和翻译困难的挑战。为了解决这一问题,充分利用现有领域术语双语词典,提出了一种基于词典结合特定领域上下文语义关系的翻译质量提升方法,并应用于传统藏医药领域。首先,收集并建立了包含9166对词条的藏医领域术语双语词典,并利用该词典扩充低资源领域的数据,以提高翻译系统对于特定领域术语的覆盖率;其次,将词典中的词对直接添加到已有句对中、领域词典中的词来替换原有句对中的词两种方式进行数据扩充,以验证词典扩充的领域翻译性能;最后,考虑到领域特定句式信息对于翻译的重要性,通过分析特定领域的语境和语义关系,提出引入特定领域上下文句式框架来优化特殊领域的翻译性能,在传统藏医药领域进行测试。实验结果表明,在利用词典进行数据扩充后,传统藏医药领域的BLEU值从0提升到4.59,且文章提出的领域句式框架方法,仅构造5条句式框架,就能使BLEU值最高提升至6.32,这为解决低资源领域翻译问题提供了新的思路和方法。 展开更多
关键词 藏汉机器翻译 领域数据不平衡 领域句式框架 术语双语词典
下载PDF
基于CNN算法的海量数据库相似数据融合方法
9
作者 陶婧 方向 《长沙大学学报》 2024年第5期26-30,69,共6页
海量语料数据库由于融合质量指数低,应用效果不佳。因此,提出基于CNN算法的海量数据库相似数据融合方法(CNN-MDSF)。深入分析海量数据库数据类型与检索性能,应用Word2vec算法提取在线海量数据库数据特征,结合核函数度量数据之间的相似性... 海量语料数据库由于融合质量指数低,应用效果不佳。因此,提出基于CNN算法的海量数据库相似数据融合方法(CNN-MDSF)。深入分析海量数据库数据类型与检索性能,应用Word2vec算法提取在线海量数据库数据特征,结合核函数度量数据之间的相似性,改进卷积神经网络,构建相似数据融合模型,训练相似数据融合模型,分解相似数据集合,实现海量数据库相似数据融合。实验数据表明,CNN-MDSF的最高度量精度为95.00%,最高熵值为19,融合质量指数更接近于1,充分证实了CNN-MDSF的应用效果更佳。 展开更多
关键词 卷积神经网络 海量数据库 相似数据 数据融合 相似性度量
下载PDF
基于卷积神经网络的图像分割方法研究
10
作者 戚伟 葛斌 桑冬青 《长春工程学院学报(自然科学版)》 2024年第1期85-89,共5页
针对传统卷积神经网络存在的参数多、过度拟合导致图像分割精度不高、算法运行效率低的问题,采用最大池化处理取代下采样层,构建改进的CNN结构,获得U-Net卷积神经网络,并进行进一步改进。将改进的U-Net卷积神经网络应用于高分辨率的遥... 针对传统卷积神经网络存在的参数多、过度拟合导致图像分割精度不高、算法运行效率低的问题,采用最大池化处理取代下采样层,构建改进的CNN结构,获得U-Net卷积神经网络,并进行进一步改进。将改进的U-Net卷积神经网络应用于高分辨率的遥感图像中,结果表明其可以对遥感图像中的小建筑物进行精细、完整分割。另外,通过和FCN32s、SegNet、FCN8s的对比,指出改进的U-Net卷积神经网络在遥感图像分割中具有更加良好的性能。 展开更多
关键词 卷积神经网络 图像分割 遥感图像
下载PDF
基于稀疏连接和多通道LSTM的NL2SQL研究
11
作者 周康 阳爱民 +1 位作者 周栋 林楠铠 《信息技术》 2024年第8期169-173,180,共6页
Natural Language To SQL(NL2SQL)任务的目标是将自然语言查询转化为结构化查询语言。现有的大多数模型所使用的方法是将NL2SQL任务分解为多个子任务,为每个子任务构建一个专用的全连接神经网络解码器。这些方法存在一些问题,如模型设... Natural Language To SQL(NL2SQL)任务的目标是将自然语言查询转化为结构化查询语言。现有的大多数模型所使用的方法是将NL2SQL任务分解为多个子任务,为每个子任务构建一个专用的全连接神经网络解码器。这些方法存在一些问题,如模型设计与模型结构较为简单,在学习不同子任务之间的依赖关系的能力有限。为了解决这些问题,将多通道并行LSTM模型引入到NL2SQL任务中,并采用稀疏连接层联合不同的子任务解码器,提升神经网络表现能力和计算资源的使用效率。在WikiSQL数据集上的评估结果表明,与基线模型相比,文中提出的模型计算精度较好。 展开更多
关键词 自然语言转SQL 自然语言接口 预训练模型 多通道LSTM 稀疏连接
下载PDF
基于混合模型的开放式创新社区用户生成内容质量预测
12
作者 杨汶静 汪明艳 《智能计算机与应用》 2024年第5期179-185,共7页
为解决开放式创新社区内容冗余导致高质量用户生成内容无法充分发挥其价值的问题,挖掘高质量UGC深层价值。首先采用随机过采样、SMOTE、ADASYN解决UGC数据不平衡问题,然后构建支持向量机、朴素贝叶斯、决策树、随机森林、GBDT分类模型... 为解决开放式创新社区内容冗余导致高质量用户生成内容无法充分发挥其价值的问题,挖掘高质量UGC深层价值。首先采用随机过采样、SMOTE、ADASYN解决UGC数据不平衡问题,然后构建支持向量机、朴素贝叶斯、决策树、随机森林、GBDT分类模型并生成多种混合预测模型,进一步使用基于Hard-voting、Soft-voting、Stacking的采样方法和分类模型组合优化预测方法,比较选取最优的开放式创新社区UGC质量预测模型。采用随机过采样和Stacking的混合模型Accuracy、F1值和AUC分别平均提升了3.85%、28.18%、12.30%。该方法能够精准识别创新社区高质量用户生成内容,帮助企业多维度管理社区、提高创新力。 展开更多
关键词 开放式创新社区 用户生成内容 过采样 机器学习 混合模型预测
下载PDF
融合局部感知Transformer模型的微积分方程求解
13
作者 卢林 朱兆旻 吴宁 《广西大学学报(自然科学版)》 CAS 北大核心 2024年第3期606-619,共14页
针对局部信息在数学表达式的符号计算中非常重要,而Transformer模型通常存在局部缺失从而忽略字符间的语义信息的问题,提出一种将一维卷积(Conv1d)和Transformer模型相结合的符号计算模型Convld_Transformer。该模型通过在嵌入层中引入... 针对局部信息在数学表达式的符号计算中非常重要,而Transformer模型通常存在局部缺失从而忽略字符间的语义信息的问题,提出一种将一维卷积(Conv1d)和Transformer模型相结合的符号计算模型Convld_Transformer。该模型通过在嵌入层中引入卷积网络提取局部特征信息,可有效增强局部感知。此外,还提出了一种生成一类偏微分方程数据集的算法,该算法结合特征线法和常微分方程变换,可实现对常系数一阶线性(pde1_cc)、变系数一阶线性(pde1_vc)以及满足一定条件的二阶抛物线偏微分方程(parapde2_cc)的求解。实验结果表明:Conv1d_Transformer模型在函数积分任务中相比Transformer模型精度更高,在解决pde1_cc、pde1_vc和parapde2_cc问题时准确率分别达到了96.00%、77.18%和86.18%,其性能要优于Mathematica和SymPy数学求解器。 展开更多
关键词 符号计算 一维卷积 函数积分 微分方程 特征线法
下载PDF
基于知识蒸馏的神经机器翻译综述
14
作者 马畅 田永红 +1 位作者 郑晓莉 孙康康 《计算机科学与探索》 CSCD 北大核心 2024年第7期1725-1747,共23页
机器翻译(MT)是利用计算机将一种语言转换为与其同语义的另一种语言的过程。随着神经网络的提出,神经机器翻译(NMT)作为一种强大的机器翻译技术,在自动翻译领域和人工智能方向上取得了显著成功。由于传统神经翻译模型存在参数、结构冗... 机器翻译(MT)是利用计算机将一种语言转换为与其同语义的另一种语言的过程。随着神经网络的提出,神经机器翻译(NMT)作为一种强大的机器翻译技术,在自动翻译领域和人工智能方向上取得了显著成功。由于传统神经翻译模型存在参数、结构冗余的问题,提出了使用知识蒸馏(KD)技术手段对神经机器翻译进行模型压缩和加速推理,该方法在机器学习和自然语言处理领域引起了广泛的关注。主要从评价指标、技术创新等角度对各种引入知识蒸馏的翻译模型进行了系统的考察和比较。首先简要回顾了机器翻译的发展历程、主流框架和评价指标;接着详细介绍了知识蒸馏技术;然后分别从多语言模型、多模态翻译、低资源语言以及自回归和非自回归四个角度详述了基于知识蒸馏的神经机器翻译发展方向,并简要介绍其他领域的研究现状;最后针对现有的大语言模型、零资源语言及多模态机器翻译所存在的问题进行分析,展望神经机器翻译发展趋势。 展开更多
关键词 机器翻译 神经机器翻译 知识蒸馏 模型压缩
下载PDF
用于文本验证码生成的随机扰动优化网络
15
作者 曾嘉琪 吴焯婷 +2 位作者 吴泽楷 杨振国 刘文印 《广东工业大学学报》 CAS 2024年第3期81-90,共10页
文本验证码具有友好和易于理解的特点,被广泛应用于众多互联网应用的安全防御机制中。传统的文本验证码通过将字符扭曲变形或者增加背景噪声来提高安全性,但随着深度学习技术的发展,其安全性难以为继且过度变形的字符会对人类用户识别... 文本验证码具有友好和易于理解的特点,被广泛应用于众多互联网应用的安全防御机制中。传统的文本验证码通过将字符扭曲变形或者增加背景噪声来提高安全性,但随着深度学习技术的发展,其安全性难以为继且过度变形的字符会对人类用户识别带来新的难题。为了解决上述问题,本文提出了一种带有随机化策略的扰动优化框架(Perturbation Optimization Network with Randomization for Text-based CAPTCHAs Generation,PORG),用于生成对人类友好但机器难以破解的文本验证码图像。该框架基于先进的扰动方法设计出扰动生成网络(Perturbation Generation Network,PGN),构建丰富的图像扰动因子并应用随机化策略生成多样化的验证码图像。现有方法所生成的扰动因子容易破坏验证码图像传递的视觉信息,对人类用户的识别造成负面影响,违背了验证码设计的初衷,因此本文提出了一种扰动优化网络(Perturbation Optimization Network,PON)对生成的扰动因子进行优化,通过在图像特征层面上扩展距离并在全局层面上缩小差距,使得所生成的验证码在保持人类友好性的同时有效地对抗攻击者模型。本研究在8个真实世界数据集上进行的大量实验,证明了所提出框架模型的优越性,例如在CNKI数据集上,攻击模型的准确率从90.03%降至0.12%。 展开更多
关键词 文本类验证码 验证码生成 扰动优化 信息安全 图像加密
下载PDF
基于机器辅助的高校英语专有名词自动翻译研究
16
作者 刘洛浩 《自动化技术与应用》 2024年第6期129-132,共4页
为提高英语专有名词自动翻译效率,设计基于机器辅助的高校英语专有名词自动翻译方法。首先对源语言调序,采用机器辅助进行翻译,然后利用统计知识在目标语言中寻找最佳译文,最后对译文重排序,实现基于机器辅助的高校英语专有名词自动翻... 为提高英语专有名词自动翻译效率,设计基于机器辅助的高校英语专有名词自动翻译方法。首先对源语言调序,采用机器辅助进行翻译,然后利用统计知识在目标语言中寻找最佳译文,最后对译文重排序,实现基于机器辅助的高校英语专有名词自动翻译。实验以翻译效率与翻译准确性为对比指标,实验结果表明,所研究的基于机器辅助的高校英语专有名词自动翻译方法在一定程度上缩短了翻译的时间,同时翻译也更加准确了。 展开更多
关键词 机器辅助 高校英语 专有名词 自动翻译
下载PDF
基于Trados采煤机双语库建设的可行性探索
17
作者 陶嵘 《煤矿机械》 2024年第12期76-78,共3页
在全球化的大背景下,跨国技术交流与合作日益频繁,采煤机械的国际合作项目越来越多。为了提高沟通效率、确保技术文档的准确性和专业性,建立一个专业的采煤机双语库显得尤为重要。Trados作为最好的专业翻译软件之一,被视为专业翻译领域... 在全球化的大背景下,跨国技术交流与合作日益频繁,采煤机械的国际合作项目越来越多。为了提高沟通效率、确保技术文档的准确性和专业性,建立一个专业的采煤机双语库显得尤为重要。Trados作为最好的专业翻译软件之一,被视为专业翻译领域的标准,是许多企业、专业翻译人员的首选。探讨利用Trados来构建矿业领域采煤机双语库的可行性,为矿业设备翻译工作提供新的视角和解决方案。 展开更多
关键词 TRADOS 采煤机双语库 可行性
原文传递
我国古代典籍时代特征视角下的机器翻译研究
18
作者 吴梦成 林立涛 +4 位作者 胡蝶 刘畅 黄水清 孟凯 王东波 《图书馆论坛》 CSSCI 北大核心 2024年第10期93-102,共10页
中国存世典籍成书于不同时代,典籍文本的语体风格及内容均具有时代性。文章以古代汉语到现代汉语的机器翻译为切入点,探究典籍文本的时代特征及其对中国古代典籍机器翻译的影响,提出针对不同历史时期训练翻译模型的策略,以提高古文翻译... 中国存世典籍成书于不同时代,典籍文本的语体风格及内容均具有时代性。文章以古代汉语到现代汉语的机器翻译为切入点,探究典籍文本的时代特征及其对中国古代典籍机器翻译的影响,提出针对不同历史时期训练翻译模型的策略,以提高古文翻译质量。以《二十四史全译》为研究语料,将语料划分为远古、中古、近古三个时期,从计算人文视角利用统计计量的方法对不同历史时期典籍文本的词频、词性、依存关系进行比较分析;在数据增强的基础上,利用每个时期的语料分别训练多种机器翻译模型并比较翻译效果。研究发现:典籍文本存在时代特征差异,并会对机器翻译效果产生显著影响;针对不同时期典籍文本分别训练机器翻译模型,能够提高古文翻译的准确性和流畅性。 展开更多
关键词 计算人文 二十四史 典籍时代特征 数据增强 机器翻译
下载PDF
基于GRU的特征融合在机器翻译中的应用
19
作者 高帅 周红志 康卫 《阜阳师范大学学报(自然科学版)》 2024年第2期38-43,共6页
神经机器翻译模型基本都是编码器和解码器结构,在进行编码之前都需要把文字抽象成数学符号,以词向量的形式传入编码器。大多数对词向量内部信息进行处理的方法都需要用到大量的资源进行训练,并不能够简单而快速的提升机器翻译性能。针... 神经机器翻译模型基本都是编码器和解码器结构,在进行编码之前都需要把文字抽象成数学符号,以词向量的形式传入编码器。大多数对词向量内部信息进行处理的方法都需要用到大量的资源进行训练,并不能够简单而快速的提升机器翻译性能。针对此问题,基于Transformer模型,提出了一种利用门控循环单元(gated recurrent unit,GRU)对词向量过滤的技术,直接用训练数据进行操作。首先将词向量和位置向量相加后传入GRU,把GRU对词向量过滤后的输出与词向量进行拼接,然后把拼接后的特征向量经过线性层深度融合在一起,这样得到的词向量就是经过门控单元过滤后的词向量表征,最后再传入编码器和解码器。实验结果表明:在Multi30k和IWSLT2016这2个数据集和不同的模型中,提出的方法都能够使机器翻译的BLEU值得到提升,取得较好的翻译性能。 展开更多
关键词 机器翻译 TRANSFORMER 门控循环单元 词向量
下载PDF
数据驱动模式下基于深度学习的个性化课程推荐模型
20
作者 宋艳艳 宋艳 《贵阳学院学报(自然科学版)》 2024年第1期36-41,共6页
为了有效提升课程推荐覆盖度及精准度,采用深度学习算法用于学习用户和在线课程的多维度特征训练,并借助并行计算优化推荐效率。首先,获得在线课程及学习用户行为记录,并借助主成分分析进行关键特征提取;然后根据关键特征构建课程评分函... 为了有效提升课程推荐覆盖度及精准度,采用深度学习算法用于学习用户和在线课程的多维度特征训练,并借助并行计算优化推荐效率。首先,获得在线课程及学习用户行为记录,并借助主成分分析进行关键特征提取;然后根据关键特征构建课程评分函数,并引入正则项提高课程推荐覆盖度;接着采用循环神经网络(Recurrent Neural Network,RNN)算法用于学习者—课程特征训练,通过历史时间序列的隐藏层循环叠加,融入历史时间序列样本对当前时刻的作用影响,提高个性化课程推荐的准确性。通过差异化设置RNN规模及参与运算的特征量,对五个不同在线学习平台的个性化课程推荐仿真,结果表明:RNN个性化课程推荐模型对五个在线学习平台的TOP10推荐覆盖度及准确度均达到了80%以上,且稳定性高。 展开更多
关键词 课程推荐 深度学习 数据驱动 循环神经网络
下载PDF
上一页 1 2 185 下一页 到第
使用帮助 返回顶部