期刊文献+
共找到451篇文章
< 1 2 23 >
每页显示 20 50 100
基于多头注意力机制字词联合的中文命名实体识别
1
作者 王进 王猛旗 +2 位作者 张昕跃 孙开伟 朴昌浩 《江苏大学学报(自然科学版)》 CAS 北大核心 2024年第1期77-84,共8页
针对现有基于字词联合的中文命名实体识别方法会引入冗余词汇干扰、模型网络结构复杂、难以迁移的问题,提出一种基于多头注意力机制字词联合的中文命名实体识别算法.算法采用多头注意力机制融合词汇边界信息,并通过分类融合BIE词集降低... 针对现有基于字词联合的中文命名实体识别方法会引入冗余词汇干扰、模型网络结构复杂、难以迁移的问题,提出一种基于多头注意力机制字词联合的中文命名实体识别算法.算法采用多头注意力机制融合词汇边界信息,并通过分类融合BIE词集降低冗余词汇干扰.建立了多头注意力字词联合模型,包含字词匹配、多头注意力、融合等模块.与现有中文命名实体识别方法相比,本算法避免了设计复杂的序列模型,方便与现有基于字的中文命名实体识别模型结合.采用召回率、精确率以及F 1值作为评价指标,通过消融试验验证模型各个部分的效果.结果表明,本算法在MSRA和Weibo数据集上F 1值分别提升0.28、0.69,在Resume数据集上精确率提升0.07. 展开更多
关键词 中文命名实体识别 词汇冗余 词汇边界信息 字词联合 多头注意力机制 BIE词集
下载PDF
融合多窗口特征的词对标记情感三元组抽取
2
作者 林杰 刘建华 +2 位作者 陈林颖 郑智雄 孙水华 《计算机工程与应用》 CSCD 北大核心 2024年第16期159-167,共9页
方面情感三元组抽取旨在从句子中抽取方面词、意见词和对应的情感极性。针对目前研究未充分挖掘局部上下文语义信息,缺乏对局部范围内的方面意见词对关联学习,以及遭受错误传播等问题,提出一种融合多窗口特征的词对标记情感三元组抽取... 方面情感三元组抽取旨在从句子中抽取方面词、意见词和对应的情感极性。针对目前研究未充分挖掘局部上下文语义信息,缺乏对局部范围内的方面意见词对关联学习,以及遭受错误传播等问题,提出一种融合多窗口特征的词对标记情感三元组抽取模型。该模型利用BERT对句子信息进行处理,获取句子编码特征,采用多窗口特征学习机制学习局部范围内的情感特征关联,并挖掘句子包含的潜在语义信息,使用多头注意力图转换模块将所学习到的特征聚合成标记分布概率,利用改进的词对标记方案标记句子并解码得到三元组。在SemEval-ASTE的四个基准数据集上进行实验分析,相比GTS-BERT模型,所提模型在三元组抽取任务上F1分值分别提高了2.33、6.57、2.97、4.84个百分点。实验结果表明,所提模型可以有效学习局部语义信息,准确标记方面意见跨度,较为精确地提取情感三元组。 展开更多
关键词 方面情感三元组 情感极性 特征学习 多头注意力 词对标记方案
下载PDF
国内智慧教育领域研究热点与趋势 被引量:2
3
作者 吴军其 张逵 《长春师范大学学报》 2024年第1期121-128,共8页
近年来,智慧教育的兴起引起人们的广泛关注。本文以2013—2022年CSSCI数据库中关于智慧教育的572篇文献的高频关键词为原始数据,运用Bibexcel、Ucinet和SPSS软件对高频关键词数据进行共词分析、社会网络分析、多维尺度分析和聚类分析,... 近年来,智慧教育的兴起引起人们的广泛关注。本文以2013—2022年CSSCI数据库中关于智慧教育的572篇文献的高频关键词为原始数据,运用Bibexcel、Ucinet和SPSS软件对高频关键词数据进行共词分析、社会网络分析、多维尺度分析和聚类分析,揭示智慧教育领域的研究热点和发展趋势。研究结果显示智慧教育研究的热点主要体现在:教育信息化、教育现代化等政策、战略;智慧教育的内涵、特征、功能等;智慧教育的体系架构与智慧环境建设等;智慧教育的技术支撑及实践。本文还基于智慧教育研究现状,提出未来发展需要关注的四个方向。 展开更多
关键词 智慧教育 共词分析 社会网络分析 聚类分析 多维尺度分析
下载PDF
基于深度学习的中文短文本多标签分类模型
4
作者 曹珍 郭攀峰 《计算机与数字工程》 2024年第6期1809-1814,共6页
目前,中文短文本因其长度短、结构多样和缺乏上下文等特点,常规多标签分类算法无法对其有效区分。针对以上问题,论文提出一种基于深度学习的中文短文本多标签分类模型CRC-MHA。CRC-MHA模型在文本表示层摒弃常规使用Word2vec进行静态词... 目前,中文短文本因其长度短、结构多样和缺乏上下文等特点,常规多标签分类算法无法对其有效区分。针对以上问题,论文提出一种基于深度学习的中文短文本多标签分类模型CRC-MHA。CRC-MHA模型在文本表示层摒弃常规使用Word2vec进行静态词嵌入的方式,采用BERT对输入句子进行动态词嵌入,借助海量预训练文本的优势更好地表征文本的上下文语义,同时在特征提取层设计了一种结合CNN、RCNN和多头自注意力机制的并行特征提取策略,加强捕捉文本内部的关键特征来提升多标签分类效果。实验结果表明,CRC-MHA模型在评价指标加权平均F1值上较BERT模型提高1.95%,较BERT-CNN模型提高0.42%,较BERT-RCNN模型提高0.34%,验证了模型的有效性。 展开更多
关键词 多标签分类 中文短文本 动态词嵌入 特征提取
下载PDF
基于多头指针的司法事件检测方法
5
作者 张小丽 黄辉 +2 位作者 黄瑞章 秦永彬 陈艳平 《广西科学》 CAS 北大核心 2024年第2期335-345,共11页
针对如何解决中文司法事件检测中触发词与上下文关系不足以判定事件实例、案件触发词表述相似以及同一个案件中多个触发词识别和分类模糊的问题,本研究提出一种基于多头指针的司法事件检测方法。首先,该方法将上下文信息和罪名特征融合... 针对如何解决中文司法事件检测中触发词与上下文关系不足以判定事件实例、案件触发词表述相似以及同一个案件中多个触发词识别和分类模糊的问题,本研究提出一种基于多头指针的司法事件检测方法。首先,该方法将上下文信息和罪名特征融合作为输入,使用双向长短期记忆(Bi-directional Long Short-Term Memory,BiLSTM)网络捕获数据依赖关系,深入提取特征;然后,使用多头指针网络对字符间的依赖关系进行建模,有效捕捉句子中的触发词;最后,利用指针标注技术抽取触发词,实现司法事件的有效检测。在公开司法数据集LEVEN上实验验证该方法的有效性,其中微平均和宏平均的F1指标达到了87.53%和78.05%,优于现有模型。该方法不仅显著提高了事件触发词的识别精度,而且也增强了对复杂司法文本中事件上下文关系的把握能力。 展开更多
关键词 司法事件检测 触发词 上下文关系 罪名特征 多头指针
下载PDF
深层差异特征增强的机器翻译自动评价
6
作者 支思威 李茂西 +1 位作者 吴水秀 陈有德 《中文信息学报》 CSCD 北大核心 2024年第10期46-53,共8页
机器翻译自动评价任务将机器翻译系统输出译文与人工参考译文进行对比定量计算翻译质量,在机器翻译的研究和应用中发挥着重要作用。当前主流的方法是使用预训练上下文语言模型表征机器翻译和人工参考译文,将两者的表征向量直接拼接输入... 机器翻译自动评价任务将机器翻译系统输出译文与人工参考译文进行对比定量计算翻译质量,在机器翻译的研究和应用中发挥着重要作用。当前主流的方法是使用预训练上下文语言模型表征机器翻译和人工参考译文,将两者的表征向量直接拼接输入前馈神经网络层以预测翻译质量;它没有在统一语义空间对两者之间的差异进行显式建模。该文提出基于深层差异特征增强的机器翻译自动评价方法,使用多头注意力机制深层抽象机器翻译和人工参考译文,利用两者在统一语义空间的差异特征增强当前最先进的自动评价方法UniTE_UP,将它们抽取的特征进行深层交互,以对机器翻译和人工参考译文之间的差异进行直接显式建模。在WMT'21机器翻译自动评价基准数据集上的实验结果表明,深层差异特征增强的自动评价方法能有效提高机器翻译自动评价与人工评价的相关性,消融实验和深入的实验分析进一步揭示了深层差异特征的有效性。 展开更多
关键词 机器翻译 自动评价 多头注意力 预训练上下文词向量 差异特征
下载PDF
我国人工智能政策新词发现与演化研究——一个多特征融合的算法 被引量:1
7
作者 刘清民 王芳 黄梅银 《现代情报》 CSSCI 北大核心 2024年第6期18-32,58,共16页
[目的/意义]作为中文分词的基础研究,新词发现是研究政策创新和扩散的重要技术方法。本文通过改进新词发现算法优化了政策文本分词不准确的问题,并构建词库以支持人工智能政策的演化研究。[方法/过程]提出多特征融合新词发现算法MFF,实... [目的/意义]作为中文分词的基础研究,新词发现是研究政策创新和扩散的重要技术方法。本文通过改进新词发现算法优化了政策文本分词不准确的问题,并构建词库以支持人工智能政策的演化研究。[方法/过程]提出多特征融合新词发现算法MFF,实现了对人工智能政策新词的挖掘,从新词角度对人工智能政策的创新、延续和扩散进行演化分析。[结果/结论]实验结果证明,本文提出的多特征融合新词发现算法MFF能够有效提升分词效果,丰富领域词库;人工智能政策新词出现的时序变化反映了不同阶段政策关注的重点发展领域,揭示了中央和地方政府在政策创新、延续、扩散和演化方面的特点。 展开更多
关键词 新词发现 人工智能 政策分析 政策演化 多特征融合算法
下载PDF
基于PDW多特征融合的辐射源信号分选方法
8
作者 罗佳奕 李煊鹏 +3 位作者 李江浩 薛启凡 杨凤 张为公 《系统工程与电子技术》 EI CSCD 北大核心 2024年第1期80-87,共8页
针对现有辐射源信号分选技术混叠信号处理困难、分选精度不高的问题,提出了一种针对脉冲信号描述字的多特征融合分选方法,采用分治思想,具备两级分选架构。第一步通过构建时空密度聚类模型,分离出在时频域上混叠的辐射源信号;第二步通... 针对现有辐射源信号分选技术混叠信号处理困难、分选精度不高的问题,提出了一种针对脉冲信号描述字的多特征融合分选方法,采用分治思想,具备两级分选架构。第一步通过构建时空密度聚类模型,分离出在时频域上混叠的辐射源信号;第二步通过多参数交并比方法,进一步提升算法精度。与传统方法相比,所提方法能够有效分选出时频域混叠脉冲序列,受辐射源脉冲重复间隔变化造成的影响较小,相比传统方法具有更高的准确性。 展开更多
关键词 辐射源信号分选 时空密度聚类 交并比 多特征融合 脉冲描述字
下载PDF
融合行为词的罪名预测多任务学习模型
9
作者 郭晓 陈艳平 +2 位作者 唐瑞雪 黄瑞章 秦永彬 《计算机应用》 CSCD 北大核心 2024年第1期159-166,共8页
随着人工智能技术在司法领域的应用,依据案情描述预测所属罪名成为一项重要研究内容。案情内容术语专业,描述言简意赅,而现有方法却往往依赖文本特征,忽略了不同案件相关要素的差异性,缺乏对案情行为词要素的有效利用。为了解决此类问题... 随着人工智能技术在司法领域的应用,依据案情描述预测所属罪名成为一项重要研究内容。案情内容术语专业,描述言简意赅,而现有方法却往往依赖文本特征,忽略了不同案件相关要素的差异性,缺乏对案情行为词要素的有效利用。为了解决此类问题,提出一种融合行为词的罪名预测多任务学习模型。首先,由边界识别器生成行为词跨度,提炼出案情核心内容;其次,通过构建行为词的结构特征预测所属罪名;最后,将行为词识别和罪名预测进行统一建模,通过共享参数的方式增强模型的泛化能力。通过构建行为词识别和罪名预测的多任务数据集进行验证,实验结果表明该模型识别行为词任务的F值达到了83.27%,罪名预测任务的F值达到了84.29%,与BERT-CNN模型相比,分别提高了0.57%和2.61%,验证了该模型对行为词识别和罪名预测的优势。 展开更多
关键词 罪名预测 行为词 边界识别 图卷积神经网络 多任务学习
下载PDF
多特征融合的专利功效短语抽取
10
作者 游新冬 赵颖 +1 位作者 刘佳琦 吕学强 《计算机工程与设计》 北大核心 2024年第5期1413-1419,共7页
为提高专利功效短语抽取的准确率和召回率,保障专利布局等研究工作的高质量进行,提出一种融合多特征的专利功效短语抽取模型。基于Bert-BiLSTM-CRF的整体框架,利用Bert模型对文本进行向量化,融合偏旁部首、五笔、词长+词性等特征输入到B... 为提高专利功效短语抽取的准确率和召回率,保障专利布局等研究工作的高质量进行,提出一种融合多特征的专利功效短语抽取模型。基于Bert-BiLSTM-CRF的整体框架,利用Bert模型对文本进行向量化,融合偏旁部首、五笔、词长+词性等特征输入到BiLSTM或Transformer进行编码,使用CRF解码得到对应输入的标签序列,得到专利功效短语。实验采用新能源汽车领域的专利文本作为训练数据,尝试组合不同的特征进行实验,实验结果表明,所提模型在准确率、召回率、F1值上均取得了明显提升,验证了多特征融合在功效短语抽取任务上的有效性。 展开更多
关键词 多特征融合 专利功效短语 深度学习 词语抽取 双向长短期记忆模型 条件随机场模型 词向量模型
下载PDF
基于多任务学习的同行评审细粒度情感分析模型 被引量:1
11
作者 朱金秋 檀健 +1 位作者 韩斌彬 殷秀秀 《中北大学学报(自然科学版)》 CAS 2024年第1期105-113,共9页
学术论文同行评审能够直接反映审稿人对论文的主观评价,对审稿文本进行情感分析有利于挖掘审稿人对论文多维度的评价信息。现有的情感分析模型仅能挖掘专家单一的评审维度和相应的情感倾向,本文提出了一种基于多任务学习的同行评审细粒... 学术论文同行评审能够直接反映审稿人对论文的主观评价,对审稿文本进行情感分析有利于挖掘审稿人对论文多维度的评价信息。现有的情感分析模型仅能挖掘专家单一的评审维度和相应的情感倾向,本文提出了一种基于多任务学习的同行评审细粒度情感分析模型。该模型在多任务学习框架下,通过在BERT-LCF模型的基础上增加BiLSTM-CRF模块,使其具备了同时完成属性词抽取和细粒度情感分析任务的能力。与传统的基于Pipeline模式的单任务细粒度情感分析模型相比,本模型在保证精度的情况下可以同时完成评审属性提取和情感分析任务。在这两项任务中,所提出模型的F1分数分别达到了89.01%和90.71%。对比实验证明,在多任务场景下,引入BiLSTM-CRF模块对评审文本属性词提取任务有一定的提升作用。 展开更多
关键词 同行评审 多任务学习 属性词抽取 细粒度情感分析 BiLSTM-CRF
下载PDF
基于多模型加权组合的文本相似度计算模型 被引量:3
12
作者 刘栋 杨辉 +1 位作者 姬少培 曹扬 《计算机工程》 CAS CSCD 北大核心 2023年第10期97-104,共8页
针对传统文本相似度计算模型存在的未考虑语义及结构信息、容易忽略文本特征细节信息等问题,建立一种基于多模型加权组合的文本相似度计算模型。在考虑次序、主题、语义等内容的基础上,对句子的每个单词进行嵌入表示,利用最大池化操作和... 针对传统文本相似度计算模型存在的未考虑语义及结构信息、容易忽略文本特征细节信息等问题,建立一种基于多模型加权组合的文本相似度计算模型。在考虑次序、主题、语义等内容的基础上,对句子的每个单词进行嵌入表示,利用最大池化操作和Bi-GRU神经网络作为编码器生成关于句子的嵌入表示,通过多层次的比较来学习句子嵌入之间的相似性关系。对文本转换进行结构化表示,提取基于短语的浅层语法树结构化特征作为Tree-GRU的输入进行文本相似度计算。将上述2个计算结果进行加权处理,获取文本相似度的最终计算结果。实验结果表明:当权重参数C1和C2分别取值0.6和0.4时该模型具有最优的相似度计算结果;在STSB数据集上模型的精确率、召回率和F1值分别达到90.32%、90.89%和90.52%;在SICK数据集上精确率、召回率和F1值分别达到85.41%、85.95%和85.61%;在MRPC数据集上精确率、召回率和F1值分别达到90.32%、90.89%和90.52%。该模型可以充分利用文本的多层次内容信息及结构化信息,适用于处理复杂的长文本,相对于DT-TEAM、ECNU等模型能取得更好的文本相似度计算结果。 展开更多
关键词 文本特征 多词嵌入 多层次比较 浅层语法树 线性加权 文本相似度
下载PDF
基于N-gram模型的多层融合气象灾害预警文本检验方法 被引量:1
13
作者 兰海波 宋瑛瑛 +3 位作者 曹之玉 朱小祥 沈晨笛 王然 《武汉理工大学学报(信息与管理工程版)》 CAS 2023年第6期961-966,共6页
气象灾害预警信息是直接对政府部门和公众进行发布的重要内容,是综合防灾减灾的第一道防线。为提升气象预警信息发布的质量,提出了气象预警文本质量检验模型。通过对全国气象历史预警信息内容进行特征分析,设计了适合气象预警信息特征... 气象灾害预警信息是直接对政府部门和公众进行发布的重要内容,是综合防灾减灾的第一道防线。为提升气象预警信息发布的质量,提出了气象预警文本质量检验模型。通过对全国气象历史预警信息内容进行特征分析,设计了适合气象预警信息特征的多模式融合分词方法,进而建立了预警专业语料库;研发了以归一化N-gram检验模型为主,以字序列组合检验模型为辅的多级检验模型。该模型已在国家突发事件预警信息发布系统中应用,辅助提高了人工预警审核效率,获得了较好的应用效果。 展开更多
关键词 气象灾害预警文本 融合分词 多级检验模型 N-GRAM模型 多模式融合
下载PDF
基于图文多模态融合的文档片段语义相似度判定算法
14
作者 潘媛 梁国迪 +1 位作者 邵馨叶 李芹 《电子设计工程》 2024年第3期106-109,114,共5页
为使网络主机的差异性赋值能力得到保障,实现对相似性文档片段语义信息的准确判别,提出基于图文多模态融合的文档片段语义相似度判定算法。在多模态融合条件的基础上,联合图像区域检测结果、文本区域检测结果,建立完整的词袋模型,实现... 为使网络主机的差异性赋值能力得到保障,实现对相似性文档片段语义信息的准确判别,提出基于图文多模态融合的文档片段语义相似度判定算法。在多模态融合条件的基础上,联合图像区域检测结果、文本区域检测结果,建立完整的词袋模型,实现基于图文多模态融合的文档片段标注。根据文本数据预处理条件,确定关键词权值指标,联合已知文档片段语义信息,求取相似性度量值的准确计算结果,完成文档片段语义相似度判定算法的设计。对比实验结果可知,在图文多模态融合技术的支持下,差异性赋值指标的平均值达到了1.0,对于网络主机而言,其在准确判别相似性文档片段语义信息方面的应用能力得到了保障。 展开更多
关键词 图文多模态融合 文档片段 语义相似度 词袋模型 关键词权值 差异性赋值
下载PDF
一种融合字词信息的中文情感分析模型 被引量:3
15
作者 杨春霞 姚思诚 宋金剑 《计算机工程与科学》 CSCD 北大核心 2023年第3期512-519,共8页
中文情感分析模型的文本表示通常只采用词粒度信息,这会导致模型在特征提取时丧失字粒度的特性,同时常用的分词方法的分词结果过于精简,也一定程度上限制了文本表示的丰富度。对此,提出了一种融合字粒度特征与词粒度特征的中文情感分析... 中文情感分析模型的文本表示通常只采用词粒度信息,这会导致模型在特征提取时丧失字粒度的特性,同时常用的分词方法的分词结果过于精简,也一定程度上限制了文本表示的丰富度。对此,提出了一种融合字粒度特征与词粒度特征的中文情感分析模型,采用全模式分词得到更丰富的词序列,经词嵌入后将词向量输入Bi-LSTM中提取全文的语义信息,并将隐层语义表示与对应字向量进行初步融合,增强词级信息的鲁棒性;另一方面将字向量输入多窗口卷积,捕捉更细粒度的字级特征信息。最后将字词粒度特征进一步融合后输入分类器得到情感分类结果,在2个公开数据集上的性能测试结果表明,该模型相比同类模型有更好的分类性能。 展开更多
关键词 中文情感分析 全模式分词 多粒度融合
下载PDF
多民族文化交流与交融视野下的蒙古族《格斯尔》名物词汇研究——以北京木刻本《十方圣主格斯尔可汗传》为中心
16
作者 董晓荣 《西北民族大学学报(哲学社会科学版)》 CSSCI 北大核心 2023年第6期166-174,共9页
清代北京木刻本《十方圣主格斯尔可汗传》中出现了很多门类的物质文化词汇,如器具、服饰、建筑、家具、饮食、宗教等。这些物质文化词汇充分反映了藏族史诗《格萨尔》流传到蒙古族地区后的地方化现象,这将为格萨尔学研究提供可贵的文献... 清代北京木刻本《十方圣主格斯尔可汗传》中出现了很多门类的物质文化词汇,如器具、服饰、建筑、家具、饮食、宗教等。这些物质文化词汇充分反映了藏族史诗《格萨尔》流传到蒙古族地区后的地方化现象,这将为格萨尔学研究提供可贵的文献依据。本文通过对蒙古族清代北京木刻本《十方圣主格斯尔可汗传》中蒙古族、藏族及西域文化特色的名物词汇进行分析,认为藏族史诗《格萨尔》在蒙古族地区流传发展过程中,其在保留一部分原有文化的基础上不断吸纳外来文化,从中可以清晰地显现出多种文化的交流与交融现象。 展开更多
关键词 《十方圣主格斯尔可汗传》 名物词汇 多民族文化交流与融合
下载PDF
基于RCNN模型的英语文本摘要自适应分类方法 被引量:1
17
作者 齐迹 《信息技术》 2023年第10期23-28,共6页
采用目前方法分类英语文本摘要时,存在精确度低、召回率低及文本分类时间较长的问题,为此,提出了基于RCNN模型的英语文本摘要自适应分类方法。利用期望交叉熵ECE和ECE′求值函数式计算词频权重并提取文本数据全部特征词融合组成特征词... 采用目前方法分类英语文本摘要时,存在精确度低、召回率低及文本分类时间较长的问题,为此,提出了基于RCNN模型的英语文本摘要自适应分类方法。利用期望交叉熵ECE和ECE′求值函数式计算词频权重并提取文本数据全部特征词融合组成特征词典。采用朴素贝叶斯方法选择最优主题,并通过Gibbs采样获取新文本特征,将新文本特征投入双循环神经网络中进行嵌入向量训练,通过词表示学习和多头注意池化两种结构实现英语文本摘要自适应分类。实验结果表明,所提方法精确度较高、召回率较高、文本分类时间较短。 展开更多
关键词 RCNN模型 自适应分类 特征词典 词表示学习 多头注意力池化
下载PDF
基于词融合与跨度检测的中文嵌套命名实体识别 被引量:1
18
作者 陈淑振 窦全胜 +1 位作者 唐焕玲 姜平 《计算机应用研究》 CSCD 北大核心 2023年第8期2382-2386,2392,共6页
目前中文命名实体识别模型在识别具有嵌套结构的实体时存在误差,无法准确识别。基于跨度的方法能够找出嵌套实体,但在识别过程中经常生成不包含实体的跨度,无法明确划分跨度边界,增加模型负担。针对此问题,提出了基于词汇融合与跨度边... 目前中文命名实体识别模型在识别具有嵌套结构的实体时存在误差,无法准确识别。基于跨度的方法能够找出嵌套实体,但在识别过程中经常生成不包含实体的跨度,无法明确划分跨度边界,增加模型负担。针对此问题,提出了基于词汇融合与跨度边界检测的中文嵌套命名实体识别模型。该模型使用多词融合方法达到文本特征增强的目的,在设计的注入模块中将目标语句中字符相关的多个词汇信息进行合并,之后融入到BERT中,以此获得更全面的上下文信息,提供更好的跨度表示;其次添加跨度边界检测模块,通过感知分类器预测跨度的首尾字符来划分跨度边界。在公共数据集上的实验表明,该模型可有效提升识别准确率。 展开更多
关键词 中文嵌套命名实体识别 BERT模型 多词融合 跨度边界检测
下载PDF
基于情感词和多任务卷积神经网络的文本情感分布学习 被引量:3
19
作者 江晨琳 曾雪强 +3 位作者 郭小奉 东雨畅 左家莉 王明文 《中文信息学报》 CSCD 北大核心 2023年第4期126-136,共11页
不同于传统的情感分析范式,情感分布学习采用与示例关联的情感分布对多种情绪进行定量建模,可以较好地处理具有情绪模糊性的情感分析任务。针对现有情感分布学习方法缺乏考虑文本分析任务特有的情感词语言学先验知识的问题,该文提出一... 不同于传统的情感分析范式,情感分布学习采用与示例关联的情感分布对多种情绪进行定量建模,可以较好地处理具有情绪模糊性的情感分析任务。针对现有情感分布学习方法缺乏考虑文本分析任务特有的情感词语言学先验知识的问题,该文提出一种基于情感词和多任务卷积神经网络(Lexicon enhanced Multi-Task Convolutional Neural Network,LMT-CNN)的文本情感分布学习模型,用于预测文本的情感分布和情绪标签。LMT-CNN模型的网络结构由文本语义信息模块、情感词的情感知识模块和多任务预测模块组成,采用端到端方式进行模型训练和预测。在7个常用的文本情感数据集上的对比实验结果表明,LMT-CNN模型具有比已有的情感分布学习方法更优的情感分布预测和情绪分类性能。 展开更多
关键词 情感分布学习 文本情绪分析 情感词 多任务卷积神经网络
下载PDF
基于字词融合和多头注意力的专利实体识别 被引量:2
20
作者 王腾科 朱广丽 +2 位作者 李瀚臣 刘云朵 张顺香 《计算机工程与设计》 北大核心 2023年第12期3778-3783,共6页
为解决面向专利文本的命名实体识别因难以利用技术词信息导致识别准确率偏低的问题,提出一种基于字词融合和多头注意力的专利实体识别模型CWMA。依据字符在词中位置进行字词融合,获得文本特征向量;通过双向门控循环单元BiGRU从特征向量... 为解决面向专利文本的命名实体识别因难以利用技术词信息导致识别准确率偏低的问题,提出一种基于字词融合和多头注意力的专利实体识别模型CWMA。依据字符在词中位置进行字词融合,获得文本特征向量;通过双向门控循环单元BiGRU从特征向量中学习上下文信息,使用多头注意力增强字符之间的依赖关系;应用条件随机场CRF进行实体识别。在Resume和专利数据集上的实验结果表明,提出模型能够显著提高专利实体识别的准确率。 展开更多
关键词 命名实体识别 专利文本 技术词 字词融合 多头注意力 双向门控循环单元 专利数据集
下载PDF
上一页 1 2 23 下一页 到第
使用帮助 返回顶部