期刊文献+
共找到57篇文章
< 1 2 3 >
每页显示 20 50 100
基于注意力机制和CNN的多标签文本分类模型
1
作者 杨春霞 吴佳君 +1 位作者 瞿涛 姚思诚 《计算机应用与软件》 北大核心 2024年第3期156-162,共7页
针对目前多标签文本分类模型存在无法充分提取文本语义与标签的相互关系,提出一种基于注意力机制和卷积神经网络(CNN)的多标签文本分类模型。通过多头注意力机制和CNN对文本进行建模表示,充分挖掘文本全局和局部的语义特征;结合标签与... 针对目前多标签文本分类模型存在无法充分提取文本语义与标签的相互关系,提出一种基于注意力机制和卷积神经网络(CNN)的多标签文本分类模型。通过多头注意力机制和CNN对文本进行建模表示,充分挖掘文本全局和局部的语义特征;结合标签与文本信息进行交互注意力计算,捕捉结合文本内容后标签间的相互关系;使用一种自适应融合策略进一步提取两者语义信息。实验结果表明,该模型相比于其他主流模型能有效提升多标签文本分类效果。 展开更多
关键词 多标签文本分类 注意力机制 卷积神经网络 文本表示
下载PDF
一种融合标签信息的多标签文本分类方法
2
作者 任彦凝 陈俊霖 刘群 《小型微型计算机系统》 CSCD 北大核心 2024年第3期584-590,共7页
多标签文本分类旨在从若干标签中选取最相关的标签子集来标记一个样本点.传统的研究倾向于探讨标签间关系而忽略标签语义,造成信息提取不完整,因此如何利用标签元数据有效提取样本中的关键信息是需要解决的一个重要问题.为解决上述问题... 多标签文本分类旨在从若干标签中选取最相关的标签子集来标记一个样本点.传统的研究倾向于探讨标签间关系而忽略标签语义,造成信息提取不完整,因此如何利用标签元数据有效提取样本中的关键信息是需要解决的一个重要问题.为解决上述问题,本文首先提出从现有数据集中生成标签语义元数据的方法,利用注意力模型对样本中混杂的语义进行筛选和清洗,生成标签的语义信息,解决了标签语义获取困难的问题.其次提出combined-attention模型用以提取样本中的关键信息,此模型将标签语义和标签关系结合起来共同提取样本中的信息,并且其内部设置了自适应融合单元,将以上两种关键信息根据其在分类结果中的关键程度自适应分配权重,进一步提升了模型的分类能力.3个英文数据集上的实验结果表明本模型优于最先进的基线方法,在分类精度上最高提升了5.68%,在真实的中文法律数据集上也实现了优异的分类效果. 展开更多
关键词 多标签文本分类 注意力 注意力头 语义生成
下载PDF
基于标签概念的多标签文本分类方法
3
作者 汪乐乐 张贤坤 《天津科技大学学报》 CAS 2024年第1期73-80,共8页
多标签文本分类是自然语言处理中重要且具有挑战性的任务之一。现有的方法注重文本表示学习,关注文本内部信息预测所属标签,忽略了属于某一标签的全体实例中共享的关键信息。鉴于此,本文提出一种基于标签概念的多标签文本分类方法:利用... 多标签文本分类是自然语言处理中重要且具有挑战性的任务之一。现有的方法注重文本表示学习,关注文本内部信息预测所属标签,忽略了属于某一标签的全体实例中共享的关键信息。鉴于此,本文提出一种基于标签概念的多标签文本分类方法:利用词频和潜在狄利克雷分布(latent Dirichlet allocation,LDA)方法从训练集全体实例中抽取各标签所对应的关键词,接着采取与文本编码相同方式对关键词编码,获得标签概念表示。在训练和预测过程中,检索与文本表示最相似的标签概念辅助分类,增加标签概念表示与文本表示的对比损失,使文本编码过程中能充分学习全局的标签概念信息。将本文方法嵌套在常用的多标签文本分类模型上进行实验,结果表明该方法有效提高了相应模型的性能。 展开更多
关键词 标签概念 全局关键信息 对比损失 多标签文本分类
下载PDF
基于层级图标签表示网络的多标签文本分类
4
作者 徐江玲 陈兴荣 《计算机应用研究》 CSCD 北大核心 2024年第2期388-392,407,共6页
多标签文本分类是一项基础而实用的任务,其目的是为文本分配多个可能的标签。近年来,人们提出了许多基于深度学习的标签关联模型,以结合标签的信息来学习文本的语义表示,取得了良好的分类性能。通过改进标签关联的建模和文本语义表示来... 多标签文本分类是一项基础而实用的任务,其目的是为文本分配多个可能的标签。近年来,人们提出了许多基于深度学习的标签关联模型,以结合标签的信息来学习文本的语义表示,取得了良好的分类性能。通过改进标签关联的建模和文本语义表示来推进这一研究方向。一方面,构建的层级图标签表示,除了学习每个标签的局部语义外,还进一步研究多个标签共享的全局语义;另一方面,为了捕捉标签和文本内容间的联系并加以利用,使用标签文本注意机制来引导文本特征的学习过程。在三个多标签基准数据集上的实验表明,该模型与其他方法相比具有更好的分类性能。 展开更多
关键词 多标签文本分类 标签相关性 层级图表示 标签组嵌入 标签文本注意力
下载PDF
采用平衡函数的大规模多标签文本分类
5
作者 陈钊鸿 洪智勇 +1 位作者 余文华 张昕 《计算机工程与应用》 CSCD 北大核心 2024年第4期163-172,共10页
大规模多标签文本分类是自然语言处理领域的一项挑战性任务。该任务存在标签数据长尾分布的情况,在这种情况下,模型学习尾部标签分类能力不佳,导致模型的整体分类效果不理想。为解决以上问题,提出采用平衡函数的大规模多标签文本分类方... 大规模多标签文本分类是自然语言处理领域的一项挑战性任务。该任务存在标签数据长尾分布的情况,在这种情况下,模型学习尾部标签分类能力不佳,导致模型的整体分类效果不理想。为解决以上问题,提出采用平衡函数的大规模多标签文本分类方法。该方法使用BERT预训练模型对文本进行词嵌入处理,进一步使用预训练模型中多层编码器的拼接输出作为文本向量表示,获取了丰富的文本语义信息,提高了模型收敛速度。最后采用平衡函数针对预测标签的训练损失赋予不同的衰减权重,提高了方法在尾部标签分类上的学习能力。在Eurlex-4K和Wiki10-31K数据集上的实验结果表明,评价指标P@1、P@3和P@5上分别达到86.95%、74.12%、61.43%和88.57%、77.46%、67.90%。 展开更多
关键词 自然语言处理 大规模多标签文本分类 BERT 平衡函数 深度学习
下载PDF
融合CNN-SAM与GAT的多标签文本分类模型 被引量:1
6
作者 杨春霞 马文文 +1 位作者 陈启岗 桂强 《计算机工程与应用》 CSCD 北大核心 2023年第5期106-114,共9页
现有基于神经网络的多标签文本分类研究方法存在两方面不足,一是不能全面提取文本信息特征,二是很少从图结构数据中挖掘全局标签之间的关联性。针对以上两个问题,提出融合卷积神经网络-自注意力机制(CNNSAM)与图注意力网络(GAT)的多标... 现有基于神经网络的多标签文本分类研究方法存在两方面不足,一是不能全面提取文本信息特征,二是很少从图结构数据中挖掘全局标签之间的关联性。针对以上两个问题,提出融合卷积神经网络-自注意力机制(CNNSAM)与图注意力网络(GAT)的多标签文本分类模型(CS-GAT)。该模型利用多层卷积神经网络与自注意力机制充分提取文本局部与全局信息并进行融合,得到更为全面的特征向量表示;同时将不同文本标签之间的关联性转变为具有全局信息的边加权图,利用多层图注意力机制自动学习不同标签之间的关联程度,将其与文本上下文语义信息进行交互,获取具有文本语义联系的全局标签信息表示;使用自适应融合策略进一步提取两者特征信息,提高模型的泛化能力。在AAPD、RCV1-V2与EUR-Lex三个公开英文数据集上的实验结果表明,该模型所达到的多标签分类效果明显优于其他主流基线模型。 展开更多
关键词 多标签文本分类 多层卷积神经网络 自注意力机制 多头图注意力机制
下载PDF
基于词-标签概率的多标签文本分类研究 被引量:1
7
作者 赵宏 郑厚泽 郭岚 《兰州理工大学学报》 CAS 北大核心 2023年第1期103-109,共7页
针对多标签文本分类任务中如何有效地提取文本特征和获取标签之间潜在的相关性问题,提出一种CNN(convolutional neural networks)结合Bi-LSTM(bi-directional long short-term memory)的模型.首先,通过CNN网络和最大池化提取文本的特征... 针对多标签文本分类任务中如何有效地提取文本特征和获取标签之间潜在的相关性问题,提出一种CNN(convolutional neural networks)结合Bi-LSTM(bi-directional long short-term memory)的模型.首先,通过CNN网络和最大池化提取文本的特征;然后,利用训练的Labeled-LDA(labeled latent dirichlet allocation)模型获取所有词与标签之间的词-标签概率信息;接着,使用Bi-LSTM网络和CNN网络提取当前预测文本中每个词的词-标签信息特征;最后,结合提取的文本特征,预测与当前文本相关联的标签集.实验结果表明,使用词-标签概率获取文本中词与标签之间的相关性信息,能够有效提升模型的F1值. 展开更多
关键词 多标签文本分类 卷积神经网络 双向长短期记忆网络 标签的隐狄利克雷分布
下载PDF
融合注意力机制的多标签文本分类
8
作者 刘杰 唐宏 +2 位作者 杨浩澜 甘陈敏 彭金枝 《微电子学与计算机》 2023年第12期26-34,共9页
多标签文本分类的结果很大程度上受到标签相关性的影响.为了更加细致地处理标签相关性问题,提出一种融合注意力机制的多标签文本分类方法.首先,将文本和标签预处理后,对标签输入采用两种不同的嵌入方式提取特征;其次,运用注意力机制处... 多标签文本分类的结果很大程度上受到标签相关性的影响.为了更加细致地处理标签相关性问题,提出一种融合注意力机制的多标签文本分类方法.首先,将文本和标签预处理后,对标签输入采用两种不同的嵌入方式提取特征;其次,运用注意力机制处理信息,针对文本和标签信息,自注意力机制进行特征处理,标签注意力机制和交互注意力机制进行依赖关系处理,进而得到两种不同状态下的表示方式;最后,通过两次融合,充分表示文本标签信息,得到较好的标签分类结果.实验结果显示,较之于基线方法,在精度和归一化折损累计增益上,该方法数据总体有所提高.由此,该方法可以有效地融合文本和标签信息,缓解标签相关性问题,有利于提升多标签文本分类任务性能. 展开更多
关键词 多标签文本分类 自注意力机制 标签注意力机制 交互注意力机制 标签相关性
下载PDF
基于Bi-LSTM和图注意力网络的多标签文本分类算法
9
作者 杨茜 《计算机应用与软件》 北大核心 2023年第9期145-150,183,共7页
针对当前大多数分类算法忽略标签之间相关性的问题,提出一种基于双向长短时记忆(Bi-LSTM)网络和图注意力网络(Graph Attention Network,GAT)的多标签文本分类算法。使用词嵌入工具对文本序列和标签中的词向量进行预处理后的文本序列和... 针对当前大多数分类算法忽略标签之间相关性的问题,提出一种基于双向长短时记忆(Bi-LSTM)网络和图注意力网络(Graph Attention Network,GAT)的多标签文本分类算法。使用词嵌入工具对文本序列和标签中的词向量进行预处理后的文本序列和标签分别输入到Bi-LSTM网络和GAT网络中;提取文本序列的上下文信息和全局特征,以及GAT网络捕获标签之间的相关性;将特征向量和标签相关性进行组合对标签文本分类任务进行预测。实验结果表明,所提算法通过有效关注标签之间的相关性使得文本分类任务的精度得以明显提高,在多个评估指标的测试结果优于其他对比方法。 展开更多
关键词 多标签文本分类 双向长短时记忆网络 图注意力网络 深度学习
下载PDF
多粒度信息关系增强的多标签文本分类 被引量:2
10
作者 李芳芳 苏朴真 +2 位作者 段俊文 张师超 毛星亮 《软件学报》 EI CSCD 北大核心 2023年第12期5686-5703,共18页
基于深度学习的多标签文本分类方法存在两个主要缺陷:缺乏对文本信息多粒度的学习,以及对标签间约束性关系的利用.针对这些问题,提出一种多粒度信息关系增强的多标签文本分类方法.首先,通过联合嵌入的方式将文本与标签嵌入到同一空间,... 基于深度学习的多标签文本分类方法存在两个主要缺陷:缺乏对文本信息多粒度的学习,以及对标签间约束性关系的利用.针对这些问题,提出一种多粒度信息关系增强的多标签文本分类方法.首先,通过联合嵌入的方式将文本与标签嵌入到同一空间,并利用BERT预训练模型获得文本和标签的隐向量特征表示.然后,构建3个多粒度信息关系增强模块:文档级信息浅层标签注意力分类模块、词级信息深层标签注意力分类模块和标签约束性关系匹配辅助模块.其中,前两个模块针对共享特征表示进行多粒度学习:文档级文本信息与标签信息浅层交互学习,以及词级文本信息与标签信息深层交互学习.辅助模块通过学习标签间关系来提升分类性能.最后,所提方法在3个代表性数据集上,与当前主流的多标签文本分类算法进行了比较.结果表明,在主要指标Micro-F1、Macro-F1、nDCG@k、P@k上均达到了最佳效果. 展开更多
关键词 注意力机制 多标签文本分类 标签关系 多粒度信息
下载PDF
SemFA:基于语义特征与关联注意力的大规模多标签文本分类模型
11
作者 王振东 董开坤 +1 位作者 黄俊恒 王佰玲 《计算机科学》 CSCD 北大核心 2023年第12期270-278,共9页
大规模多标签文本分类(XMTC)是从一个庞大且复杂的标签集合中查找与文本样本最相关标签的一项具有挑战性的任务。目前,基于Transformer模型的深度学习方法在XMTC上取得了巨大的成功。然而,现有方法都没能充分利用Transformer模型的优势... 大规模多标签文本分类(XMTC)是从一个庞大且复杂的标签集合中查找与文本样本最相关标签的一项具有挑战性的任务。目前,基于Transformer模型的深度学习方法在XMTC上取得了巨大的成功。然而,现有方法都没能充分利用Transformer模型的优势,忽略了文本不同粒度下细微的局部语义信息,同时标签与文本之间的潜在关联尚未得到稳健的建立与利用。对此,提出了一种基于语义特征与关联注意力的大规模多标签文本分类模型SemFA(An Extreme Multi-Label Text Classification Model Based on Semantic Features and Association-Attention)。在SemFA中,首先拼接多层编码器顶层输出作为全局特征。其次,结合卷积神经网络从多层编码器浅层向量中获取局部特征。综合丰富的全局信息和不同粒度下细微的局部信息获得更丰富、更准确的语义特征。最后,通过关联注意力机制建立标签特征与文本特征之间的潜在关联,引入关联损失作为潜在关联不断优化模型。在Eurlex-4K和Wiki10-31K两个公开数据集上的实验结果表明,SemFA优于大多数现有的XMTC模型,能有效地融合语义特征与关联注意力,提升整体的分类性能。 展开更多
关键词 自然语言处理 大规模多标签文本分类 语义特征 预训练模型 注意力机制
下载PDF
融合标签语义知识的价值观多标签文本分类
12
作者 韩泓霖 单丽莉 +1 位作者 孙承杰 刘秉权 《中文信息学报》 CSCD 北大核心 2023年第10期64-75,共12页
为了准确识别网络文本中的价值观倾向,该文提出了一种融合标签语义知识实现价值观多标签文本分类的策略。首先基于价值观理论体系,构建了价值观知识图谱;然后构建了价值观多标签文本分类数据集;最后提出了融合标签语义知识的价值观多标... 为了准确识别网络文本中的价值观倾向,该文提出了一种融合标签语义知识实现价值观多标签文本分类的策略。首先基于价值观理论体系,构建了价值观知识图谱;然后构建了价值观多标签文本分类数据集;最后提出了融合标签语义知识的价值观多标签文本分类模型,通过两种方式融合价值观标签的语义知识。其一,利用标签语义信息进行文本表示学习,获得每个标签对于文本中不同词的重要程度;其二,利用标签的语义知识,计算标签与文本的语义相似度,并与分类模型结果融合。实验表明,该方法可以较好地解决价值观多标签分类问题,尤其可以缓解“尾标签”问题,最终在top@1结果上达到62.44%的精确率,在top@3上达到66.92%的召回率。 展开更多
关键词 价值观 标签语义 知识图谱 多标签文本分类
下载PDF
基于共享语义空间的多标签文本分类
13
作者 孙坤 秦博文 +1 位作者 桑基韬 于剑 《计算机工程与应用》 CSCD 北大核心 2023年第12期100-105,共6页
在多标签文本分类任务中,每个给定的文档都对应一组相关标签。目前主要面临以下三方面问题:(1)对标签-文本和标签-标签关系的联合建模不充分;(2)对标签本身语义的挖掘不足;(3)忽略了对标签内部结构信息的利用。对于以上问题,提出了一种... 在多标签文本分类任务中,每个给定的文档都对应一组相关标签。目前主要面临以下三方面问题:(1)对标签-文本和标签-标签关系的联合建模不充分;(2)对标签本身语义的挖掘不足;(3)忽略了对标签内部结构信息的利用。对于以上问题,提出了一种基于联合注意力和共享语义空间的多标签文本分类方法。提出了融合多头注意力机制,该方法旨在同步地对标签与文档的关系和标签之间的关系进行建模,利用两者交互信息的同时避免误差传递。提出了解耦的共享语义空间嵌入方法,改进了利用标签语义信息的方法,使用共享参数的编码器提取标签和文档的语义表示,减少其在建模相关性阶段的偏差。提出了一种基于先验知识的层次提示方法,利用预训练模型中的先验知识增强标签层次结构信息。实验结果表明,该方法在公开数据集上优于目前最先进的多标签文本分类模型。 展开更多
关键词 多标签文本分类 注意力机制 标签表示 预训练模型 语义嵌入
下载PDF
基于并行卷积网络信息融合的层级多标签文本分类算法
14
作者 易流 耿新宇 白静 《计算机科学》 CSCD 北大核心 2023年第9期278-286,共9页
自然语言处理是人工智能与机器学习领域的重要方向,它的目标是利用计算机技术来分析、理解和处理自然语言。自然语言处理的一个重点研究方向是从文本内容中获取信息,并且按照一定的标签体系或标准将文本内容进行自动分类标记。相比于单... 自然语言处理是人工智能与机器学习领域的重要方向,它的目标是利用计算机技术来分析、理解和处理自然语言。自然语言处理的一个重点研究方向是从文本内容中获取信息,并且按照一定的标签体系或标准将文本内容进行自动分类标记。相比于单一标签文本分类而言,多标签文本分类具有一条数据属于多个标签的特点,使得更难从文本信息中获得多类别的数据特征。层级多标签文本分类又是其中的一个特别的类别,它将文本中的信息对应划分到不同的类别标签体系中,各个类别标签体系又具有互相依赖的层级关系。因此,如何利用其内部标签体系中的层级关系更准确地将文本分类到对应的标签中,也就成了解决问题的关键。为此,提出了一种基于并行卷积网络信息融合的层级多标签文本分类算法。首先,该算法利用BERT模型对文本信息进行词嵌入,接着利用自注意力机制增强文本信息的语义特征,然后利用不同卷积核对文本数据特征进行抽取。通过使用阈值控制树形结构建立上下位的节点间关系,更有效地利用了文本的多方位语义信息实现层级多标签文本分类任务。在公开数据集Kanshan-Cup和CI企业信息数据集上的结果表明,该算法在宏准确率、宏召回率与微F1值3种评价指标上均优于主流的TextCNN,TextRNN,FastText等对比模型,具有较好的层级多标签文本分类效果。 展开更多
关键词 层级多标签文本分类 预训练模型 注意力机制 卷积神经网络 树形结构
下载PDF
基于胶囊组的低秩重建多标签文本分类
15
作者 罗顺茺 何军 陈贵强 《计算机工程与设计》 北大核心 2023年第5期1359-1367,共9页
为解决胶囊注意力网络在特征提取无法关注胶囊代表属性之间关系的问题,提出一种基于胶囊组低秩重建的3D上下文表示建模的胶囊网络多标签文本分类方法。设计多层次卷积残差结构构建初始胶囊组,整合全文的语义信息;设计可学习的权重矩阵... 为解决胶囊注意力网络在特征提取无法关注胶囊代表属性之间关系的问题,提出一种基于胶囊组低秩重建的3D上下文表示建模的胶囊网络多标签文本分类方法。设计多层次卷积残差结构构建初始胶囊组,整合全文的语义信息;设计可学习的权重矩阵在张量矩阵化的3个维度上生成一阶低秩胶囊组,以低秩胶囊组为基础构建完整的上下文特征。将注意力集中到重要词语上的同时,关注胶囊中不同属性之间的关系。实验结果表明,该方法可有效提高多标签文本分类的效果。 展开更多
关键词 多标签文本分类 胶囊网络 多层次卷积 张量矩阵化 低秩重建 残差结构 低秩胶囊组
下载PDF
融合标签关联的隐空间数据增强多标签文本分类方法
16
作者 苗育华 李格格 线岩团 《现代电子技术》 2023年第24期159-164,共6页
多标签文本分类是自然语言处理中文本分类任务的一个分支。目前单标签的文本分类算法已经较为成熟,但是多标签文本分类仍是一项重要而且有挑战的任务。在多标签文本分类任务中,标签之间往往存在关联,但各类标签在样本数量上存在较为严... 多标签文本分类是自然语言处理中文本分类任务的一个分支。目前单标签的文本分类算法已经较为成熟,但是多标签文本分类仍是一项重要而且有挑战的任务。在多标签文本分类任务中,标签之间往往存在关联,但各类标签在样本数量上存在较为严重的不平衡问题。为此,文中提出一种利用标签之间的先验知识,在隐空间中进行数据增强的方法,缓解多标签文本分类数据不平衡造成的模型过拟合及泛化能力差的问题。所提方法可适用于不同的神经网络模型,在多个开放数据集上的实验结果表明,该方法可以有效提升多标签文本分类的性能,对少样本类别的预测性能提升显著,对于多样本类别的预测性能也可以达到很好的效果。 展开更多
关键词 多标签文本分类 标签关联 数据增强 隐空间 自然语言处理 神经网络模型 消融实验
下载PDF
融合BERT和AM的胶囊网络多标签文本分类
17
作者 汤正清 王国明 《湖北民族大学学报(自然科学版)》 CAS 2023年第1期90-95,共6页
针对目前胶囊网络对特征的提取忽视特征信息在文档中的位置和远距离依赖的问题,提出1种新型融合来自变换器的双向编码器表征量(bidirectional encoder representations from transformers,BERT)和注意力机制(attention mechanism,AM)的... 针对目前胶囊网络对特征的提取忽视特征信息在文档中的位置和远距离依赖的问题,提出1种新型融合来自变换器的双向编码器表征量(bidirectional encoder representations from transformers,BERT)和注意力机制(attention mechanism,AM)的胶囊网络模型(BA-CapsNet)。首先,通过BERT预训练模型获得全局特征词向量;然后使用多头注意力机制,对重要单词进行权重优化;最后通过胶囊网络提取局部特征,形成特征向量。同时,对动态路由算法进行改进,较好地减少低层胶囊与高层胶囊之间的信息冗余。结果表明,相比传统的胶囊网络、序列生成模型(sequence generation model,SGM)和结合卷积神经网络(convolutional neural network,CNN)的大规模多元标签文本分类(extreme multi-label text classification,XML-CNN)模型,提出的改进模型在多标签文本分类中准确率有所提升;并且相比原胶囊网络,改进的动态路由算法在模型效率上提升了约37%。 展开更多
关键词 自然语言处理 深度学习 多标签文本分类 BERT 注意力机制 胶囊网络
下载PDF
基于A-Capsule的多标签文本分类研究
18
作者 王善秋 狄巨星 《河北建筑工程学院学报》 CAS 2023年第4期214-218,共5页
目前在进行多标签文本分类任务中,大部分算法忽视了句子中词语的关键程度以及句子中词与词之间的相互联系。提出一种A-Capsule(Attention-Capsule,注意力胶囊网络)模型,由Capsule网络和Attention机制结合而得到。使文本数据转换成机器... 目前在进行多标签文本分类任务中,大部分算法忽视了句子中词语的关键程度以及句子中词与词之间的相互联系。提出一种A-Capsule(Attention-Capsule,注意力胶囊网络)模型,由Capsule网络和Attention机制结合而得到。使文本数据转换成机器可以识别的向量化形式,然后使Multi-Head-Attention机制对不同单词进行学习,以此来确定词语的重要程度,利用Capsule网络的动态路由算法提取文本中的局部空间特征信息,使用分类器进行分类。实验使用的数据集来自今日头条下的数据集,使用其中的新闻标题多标签数据集进行多组对比实验,依据实验结果得出,提出的组合模型在分类任务中,有较好的性能。 展开更多
关键词 多标签文本分类 注意力机制 胶囊网络
下载PDF
多标签文本分类研究回顾与展望
19
作者 张文峰 奚雪峰 +2 位作者 崔志明 邹逸晨 栾进权 《计算机工程与应用》 CSCD 北大核心 2023年第18期28-48,共21页
文本分类(TC)是自然语言处理(NLP)领域的重要基础任务,多标签文本分类(MLTC)是TC的重要分支。为了对多标签文本分类领域进行深入了解,介绍了多标签文本分类的概念和流程。将近年来多标签文本分类方法划分为基于传统机器学习方法和基于... 文本分类(TC)是自然语言处理(NLP)领域的重要基础任务,多标签文本分类(MLTC)是TC的重要分支。为了对多标签文本分类领域进行深入了解,介绍了多标签文本分类的概念和流程。将近年来多标签文本分类方法划分为基于传统机器学习方法和基于深度学习方法,梳理了多标签文本分类领域常用的数据集和评价指标,分析了部分多标签文本分类模型的优势和存在问题。介绍了多标签文本分类的研究方向:标签相关性、特定标签特性、类别不平衡、标签丢失和标签压缩。对多标签文本分类的难点和未来的发展方向进行了总结展望。 展开更多
关键词 多标签文本分类 深度学习 标签相关性 特定标签特性 类别不平衡
下载PDF
融合标签嵌入和知识感知的多标签文本分类方法
20
作者 冯海 马甲林 +2 位作者 许林杰 杨宇 谢乾 《南京大学学报(自然科学版)》 CAS CSCD 北大核心 2023年第2期273-281,共9页
多标签文本分类是自然语言处理领域的重要任务之一.文本的标签语义信息与文本的文档内容有紧密的联系,而传统的多标签文本分类方法存在忽略标签的语义信息以及标签的语义信息不足等问题.针对以上问题,提出一种融合标签嵌入和知识感知的... 多标签文本分类是自然语言处理领域的重要任务之一.文本的标签语义信息与文本的文档内容有紧密的联系,而传统的多标签文本分类方法存在忽略标签的语义信息以及标签的语义信息不足等问题.针对以上问题,提出一种融合标签嵌入和知识感知的多标签文本分类方法 LEKA (Label Embedding and Knowledge-Aware).该方法依赖于文档文本以及相应的多个标签,通过标签嵌入来获取与标签相关的注意力.考虑标签的语义信息,建立标签与文档内容的联系,将标签应用到文本分类中.另外,为了增强标签的语义信息,通过知识图谱嵌入引入外部感知知识,对标签文本进行语义扩展.在AAPD和RCV1-V2公开数据集上与其他分类模型进行了对比,实验结果表明,与LCFA (Label Combination and Fusion of Attentions)模型相比,LEKA的F1分别提高了3.5%和2.1%. 展开更多
关键词 多标签文本分类 标签嵌入 知识图谱 注意力机制
下载PDF
上一页 1 2 3 下一页 到第
使用帮助 返回顶部