期刊文献+
共找到323篇文章
< 1 2 17 >
每页显示 20 50 100
中文科技政策文本分类:增强的TextCNN视角 被引量:5
1
作者 李牧南 王良 赖华鹏 《科技管理研究》 CSSCI 北大核心 2023年第2期160-166,共7页
近年尽管针对中文本文分类的研究成果不少,但基于深度学习对中文政策等长文本进行自动分类的研究还不多见。为此,借鉴和拓展传统的数据增强方法,提出集成新时代人民日报分词语料库(NEPD)、简单数据增强(EDA)算法、word2vec和文本卷积神... 近年尽管针对中文本文分类的研究成果不少,但基于深度学习对中文政策等长文本进行自动分类的研究还不多见。为此,借鉴和拓展传统的数据增强方法,提出集成新时代人民日报分词语料库(NEPD)、简单数据增强(EDA)算法、word2vec和文本卷积神经网络(TextCNN)的NEWT新型计算框架;实证部分,基于中国地方政府发布的科技政策文本进行算法校验。实验结果显示,在取词长度分别为500、750和1000词的情况下,应用NEWT算法对中文科技政策文本进行分类的效果优于RCNN、Bi-LSTM和CapsNet等传统深度学习模型,F1值的平均提升比例超过13%;同时,NEWT在较短取词长度下能够实现全文输入的近似效果,可以部分改善传统深度学习模型在中文长文本自动分类任务中的计算效率。 展开更多
关键词 NEWT 深度学习 数据增强 卷积神经网络 政策文本分类 中文长文本
下载PDF
Long Text Classification Algorithm Using a Hybrid Model of Bidirectional Encoder Representation from Transformers-Hierarchical Attention Networks-Dilated Convolutions Network 被引量:1
2
作者 ZHAO Yuanyuan GAO Shining +1 位作者 LIU Yang GONG Xiaohui 《Journal of Donghua University(English Edition)》 CAS 2021年第4期341-350,共10页
Text format information is full of most of the resources of Internet,which puts forward higher and higher requirements for the accuracy of text classification.Therefore,in this manuscript,firstly,we design a hybrid mo... Text format information is full of most of the resources of Internet,which puts forward higher and higher requirements for the accuracy of text classification.Therefore,in this manuscript,firstly,we design a hybrid model of bidirectional encoder representation from transformers-hierarchical attention networks-dilated convolutions networks(BERT_HAN_DCN)which based on BERT pre-trained model with superior ability of extracting characteristic.The advantages of HAN model and DCN model are taken into account which can help gain abundant semantic information,fusing context semantic features and hierarchical characteristics.Secondly,the traditional softmax algorithm increases the learning difficulty of the same kind of samples,making it more difficult to distinguish similar features.Based on this,AM-softmax is introduced to replace the traditional softmax.Finally,the fused model is validated,which shows superior performance in the accuracy rate and F1-score of this hybrid model on two datasets and the experimental analysis shows the general single models such as HAN,DCN,based on BERT pre-trained model.Besides,the improved AM-softmax network model is superior to the general softmax network model. 展开更多
关键词 long text classification dilated convolution BERT fusing context semantic features hierarchical characteristics BERT_HAN_DCN AM-softmax
下载PDF
Text Extraction with Optimal Bi-LSTM
3
作者 Bahera H.Nayef Siti Norul Huda Sheikh Abdullah +1 位作者 Rossilawati Sulaiman Ashwaq Mukred Saeed 《Computers, Materials & Continua》 SCIE EI 2023年第9期3549-3567,共19页
Text extraction from images using the traditional techniques of image collecting,and pattern recognition using machine learning consume time due to the amount of extracted features from the images.Deep Neural Networks... Text extraction from images using the traditional techniques of image collecting,and pattern recognition using machine learning consume time due to the amount of extracted features from the images.Deep Neural Networks introduce effective solutions to extract text features from images using a few techniques and the ability to train large datasets of images with significant results.This study proposes using Dual Maxpooling and concatenating convolution Neural Networks(CNN)layers with the activation functions Relu and the Optimized Leaky Relu(OLRelu).The proposed method works by dividing the word image into slices that contain characters.Then pass them to deep learning layers to extract feature maps and reform the predicted words.Bidirectional Short Memory(BiLSTM)layers extractmore compelling features and link the time sequence fromforward and backward directions during the training phase.The Connectionist Temporal Classification(CTC)function calcifies the training and validation loss rates.In addition to decoding the extracted feature to reform characters again and linking them according to their time sequence.The proposed model performance is evaluated using training and validation loss errors on the Mjsynth and Integrated Argument Mining Tasks(IAM)datasets.The result of IAM was 2.09%for the average loss errors with the proposed dualMaxpooling and OLRelu.In the Mjsynth dataset,the best validation loss rate shrunk to 2.2%by applying concatenating CNN layers,and Relu. 展开更多
关键词 Deep neural network text features dual max-pooling concatenating convolution neural networks bidirectional long short memory text connector characteristics
下载PDF
基于字词向量融合的民航智慧监管短文本分类 被引量:1
4
作者 王欣 干镞锐 +2 位作者 许雅玺 史珂 郑涛 《中国安全科学学报》 CAS CSCD 北大核心 2024年第2期37-44,共8页
为解决民航监管事项所产生的检查记录仅依靠人工进行分类分析导致效率低的问题,提出一种基于数据增强与字词向量融合的双通道特征提取的短文本分类模型,探讨民航监管事项的分类,包括与人、设备设施环境、制度程序和机构职责等相关问题... 为解决民航监管事项所产生的检查记录仅依靠人工进行分类分析导致效率低的问题,提出一种基于数据增强与字词向量融合的双通道特征提取的短文本分类模型,探讨民航监管事项的分类,包括与人、设备设施环境、制度程序和机构职责等相关问题。为解决类别不平衡问题,采用数据增强算法在原始文本上进行变换,生成新的样本,使各个类别的样本数量更加均衡。将字向量和词向量按字融合拼接,得到具有词特征信息的字向量。将字词融合的向量分别送入到文本卷积神经网络(TextCNN)和双向长短期记忆(BiLSTM)模型中进行不同维度的特征提取,从局部的角度和全局的角度分别提取特征,并在民航监管事项检查记录数据集上进行试验。结果表明:该模型准确率为0.9837,F 1值为0.9836。与一些字嵌入模型和词嵌入模型相对比,准确率提升0.4%。和一些常用的单通道模型相比,准确率提升3%,验证了双通道模型提取的特征具有全面性和有效性。 展开更多
关键词 字词向量融合 民航监管 短文本 文本卷积神经网络(textCNN) 双向长短期记忆(BiLSTM)
原文传递
基于BERT-BiLSTM-CRF模型的畜禽疫病文本分词研究 被引量:2
5
作者 余礼根 郭晓利 +3 位作者 赵红涛 杨淦 张俊 李奇峰 《农业机械学报》 EI CAS CSCD 北大核心 2024年第2期287-294,共8页
针对畜禽疫病文本语料匮乏、文本内包含大量疫病名称及短语等未登录词问题,提出了一种结合词典匹配的BERT-BiLSTM-CRF畜禽疫病文本分词模型。以羊疫病为研究对象,构建了常见疫病文本数据集,将其与通用语料PKU结合,利用BERT(Bidirectiona... 针对畜禽疫病文本语料匮乏、文本内包含大量疫病名称及短语等未登录词问题,提出了一种结合词典匹配的BERT-BiLSTM-CRF畜禽疫病文本分词模型。以羊疫病为研究对象,构建了常见疫病文本数据集,将其与通用语料PKU结合,利用BERT(Bidirectional encoder representation from transformers)预训练语言模型进行文本向量化表示;通过双向长短时记忆网络(Bidirectional long short-term memory network,BiLSTM)获取上下文语义特征;由条件随机场(Conditional random field,CRF)输出全局最优标签序列。基于此,在CRF层后加入畜禽疫病领域词典进行分词匹配修正,减少在分词过程中出现的疫病名称及短语等造成的歧义切分,进一步提高了分词准确率。实验结果表明,结合词典匹配的BERT-BiLSTM-CRF模型在羊常见疫病文本数据集上的F1值为96.38%,与jieba分词器、BiLSTM-Softmax模型、BiLSTM-CRF模型、未结合词典匹配的本文模型相比,分别提升11.01、10.62、8.3、0.72个百分点,验证了方法的有效性。与单一语料相比,通用语料PKU和羊常见疫病文本数据集结合的混合语料,能够同时对畜禽疫病专业术语及疫病文本中常用词进行准确切分,在通用语料及疫病文本数据集上F1值都达到95%以上,具有较好的模型泛化能力。该方法可用于畜禽疫病文本分词。 展开更多
关键词 畜禽疫病 文本分词 预训练语言模型 双向长短时记忆网络 条件随机场
下载PDF
基于关键特征增强的金融长文本事件分类
6
作者 王洁 李旭晖 《情报工程》 2024年第3期104-113,共10页
[目的/意义]为了解决长文本模型输入长度限制问题,通过抽取事件关键句和事件关键词,对长文本进行关键特征增强,以提高模型的特征表示能力。[方法/过程]基于关键特征增强的模型,在原文的基础上利用TextRank算法抽取事件关键句,并利用TF-... [目的/意义]为了解决长文本模型输入长度限制问题,通过抽取事件关键句和事件关键词,对长文本进行关键特征增强,以提高模型的特征表示能力。[方法/过程]基于关键特征增强的模型,在原文的基础上利用TextRank算法抽取事件关键句,并利用TF-IDF算法抽取事件关键词,将二者作为关键特征对长文本进行特征增强,再利用BERT和Self-Attention模型进行特征的进一步提取,最后进行事件分类。[局限]模型仅在金融领域事件分类上进行实验,可以考虑在其他领域内也进行实验并进一步验证模型效果。[结果/结论]在金融长新闻事件分类数据集上,提出的模型准确率达到88.40%,比基准模型提升了2个以上的百分点,表明了模型的有效性。 展开更多
关键词 事件分类 长文本分类 关键特征 特征增强 自注意力机制
下载PDF
基于互信息解决多标签文本分类中的长尾问题
7
作者 潘理虎 李小华 +3 位作者 张睿 谢斌红 杨楠 张林梁 《计算机应用研究》 CSCD 北大核心 2024年第9期2664-2669,共6页
针对当前解决多标签文本分类中长尾问题的方法多以破坏原本数据分布为代价,在真实数据上的泛化性能下降,无法有效地缓解样本的长尾分布的问题,提出了基于互信息解决长尾问题的多标签文本分类方法(MLTC-LD)。首先,创建关于标签样本的关... 针对当前解决多标签文本分类中长尾问题的方法多以破坏原本数据分布为代价,在真实数据上的泛化性能下降,无法有效地缓解样本的长尾分布的问题,提出了基于互信息解决长尾问题的多标签文本分类方法(MLTC-LD)。首先,创建关于标签样本的关系矩阵,计算标签样本间的依赖关系;其次,考虑标签样本间关系程度的强弱构造邻居选择器,将拥有强关系的邻居信息作为主要语义特征并作为先验信息;最后,通过图注意力神经网络将先验信息引入分类器,实现了借助分布头部数据丰富类的知识来提高尾部数据贫乏类性能的目标。在三个不同的数据集上将MLTC-LD与八个基线模型进行了广泛的比较分析。实验结果表明,MLTC-LD与最优的HGLRN相比精确度分别提高了3.5%、0.3%、1.5%,证明了该方法的有效性。 展开更多
关键词 多标签文本分类 长尾问题 互信息 先验信息
下载PDF
融合多尺度CNN与双向LSTM的唐卡问句分类模型
8
作者 王铁君 闫悦 +2 位作者 郭晓然 王铠杰 饶强 《科学技术与工程》 北大核心 2024年第22期9490-9497,共8页
当前大语言模型的兴起为自然语言处理、搜索引擎、生命科学研究等领域的研究者提供了新思路,但大语言模型存在资源消耗高、推理速度慢,难以在工业场景尤其是垂直领域应用等方面的缺点。针对这一问题,提出了一种多尺度卷积神经网络(convo... 当前大语言模型的兴起为自然语言处理、搜索引擎、生命科学研究等领域的研究者提供了新思路,但大语言模型存在资源消耗高、推理速度慢,难以在工业场景尤其是垂直领域应用等方面的缺点。针对这一问题,提出了一种多尺度卷积神经网络(convolutional neural network,CNN)与双向长短期记忆神经网络(long short term memory,LSTM)融合的唐卡问句分类模型,本文模型将数据的全局特征与局部特征进行融合实现唐卡问句分类任务,全局特征反映数据的本质特点,局部特征关注数据中易被忽视的部分,将二者以拼接的方式融合以丰富句子的特征表示。通过在Thangka数据集与THUCNews数据集上进行实验,结果表明,本文模型相较于Bert模型在精确度上略优,在训练时间上缩短了1/20,运算推理时间缩短了1/3。在公开数据集上的实验表明,本文模型在文本分类任务上也表现出了较好的适用性和有效性。 展开更多
关键词 文本分类 长短期记忆 多尺度卷积神经网络 唐卡
下载PDF
基于链接关系预测的弯曲密集型商品文本检测
9
作者 耿磊 李嘉琛 +2 位作者 刘彦北 李月龙 李晓捷 《天津工业大学学报》 CAS 北大核心 2024年第4期50-59,74,共11页
针对商品包装文本检测任务中弯曲密集型文本导致的错检、漏检问题,提出了一种由2个子网络组成的基于链接关系预测的文本检测框架(text detection network based on relational prediction,RPTNet)。在文本组件检测网络中,下采样采用卷... 针对商品包装文本检测任务中弯曲密集型文本导致的错检、漏检问题,提出了一种由2个子网络组成的基于链接关系预测的文本检测框架(text detection network based on relational prediction,RPTNet)。在文本组件检测网络中,下采样采用卷积神经网络和自注意力并行的双分支结构提取局部和全局特征,并加入空洞特征增强模块(DFM)减少深层特征图在降维过程中信息的丢失;上采样采用特征金字塔与多级注意力融合模块(MAFM)相结合的方式进行多级特征融合以增强文本特征间的潜在联系,通过文本检测器从上采样输出的特征图中检测文本组件;在链接关系预测网络中,采用基于图卷积网络的关系推理框架预测文本组件间的深层相似度,采用双向长短时记忆网络将文本组件聚合为文本实例。为验证RRNet的检测性能,构建了一个由商品包装图片组成的文本检测数据集(text detection dataset composed of commodity packaging,CPTD1500)。实验结果表明:RPTNet不仅在公开文本数据集CTW-1500和Total-Text上取得了优异的性能,而且在CPTD1500数据集上的召回率和F值分别达到了85.4%和87.5%,均优于当前主流算法。 展开更多
关键词 文本检测 卷积神经网络 自注意力 特征融合 图卷积网络 双向长短时记忆网络
下载PDF
长镜头呈现:革命传统进语文教材的一种新方式
10
作者 曾晓洁 鄢波 易可 《湖南师范大学教育科学学报》 CSSCI 北大核心 2024年第6期98-105,共8页
调研发现,作为革命传统进语文教材的主要载体,革命文化课文的教学难点集中于学生对革命人物崇高言行举止不理解甚至不相信,而“理解”恰恰是文化传承的关键。溯源获得统编小学语文所有革命文化课文的原文后,发现课文与原文的最大差异是... 调研发现,作为革命传统进语文教材的主要载体,革命文化课文的教学难点集中于学生对革命人物崇高言行举止不理解甚至不相信,而“理解”恰恰是文化传承的关键。溯源获得统编小学语文所有革命文化课文的原文后,发现课文与原文的最大差异是情境虚化。这种虚化主要缘于文质兼美、篇幅适度的改编常规要求,但革命文化课文的“教材位”在于文化传承,深入理解是焦点任务。“长镜头”因其能够呈现更真实而连续的情境,并形塑出更可信可亲的英雄形象,成为实现该焦点任务的首要路径。为此,革命文化课文改编应更多关切指向革命传统主题理解的难易度要求,针对革命文化文本的现象历史性、情感崇高性和内涵抽象性,保留充盈的相关情境并基于教材容量以相应形式合理呈现。 展开更多
关键词 革命传统 课文改编 革命文化 长镜头 小学教材
下载PDF
面向语法加权图文本的方面情感三元组抽取
11
作者 韩虎 孟甜甜 《北京航空航天大学学报》 EI CAS CSCD 北大核心 2024年第2期409-418,共10页
方面情感三元组抽取包括方面抽取、意见抽取和方面情感分类3项任务,以管道方式解决该任务的研究方法无法利用元素之间的交互信息,同时也会造成错误传播和冗余训练。基于此,提出一种基于门控注意力和加权图文本的方面情感三元组抽取方法... 方面情感三元组抽取包括方面抽取、意见抽取和方面情感分类3项任务,以管道方式解决该任务的研究方法无法利用元素之间的交互信息,同时也会造成错误传播和冗余训练。基于此,提出一种基于门控注意力和加权图文本的方面情感三元组抽取方法。采用双向长短时记忆网络学习句子的序列特征表示;利用门控注意力单元学习单词之间的线性联系;利用语法距离加权图卷积网络增强三元组元素之间的交互;利用网格标记推理策略预测三元组。在4个公开数据集上进行实验,结果表明:所提方法可以有效增强三元组元素之间的交互,提高三元组抽取的准确率;同时,所提方法的F1值分别为57.94%、70.54%、61.95%和67.66%,与基准模型相比均有所提高。 展开更多
关键词 三元组抽取 门控注意力 加权图文本 双向长短时记忆网络 网格标记
原文传递
基于RBBLA混合模型的文本相似度计算方法
12
作者 任喜伟 杜丰怡 +2 位作者 向启怀 李兆允 赵杉 《陕西科技大学学报》 北大核心 2024年第4期184-190,198,共8页
文本相似度计算是两个或多个文本之间相似程度的度量,它被广泛用于多个场景.针对现有研究存在的缺乏上下文交互特征捕获、语义结构信息表示不足等问题,提出一种基于RBBLA(RoBERTa-BiLSTM-Attention)混合模型的文本相似度计算方法,该模... 文本相似度计算是两个或多个文本之间相似程度的度量,它被广泛用于多个场景.针对现有研究存在的缺乏上下文交互特征捕获、语义结构信息表示不足等问题,提出一种基于RBBLA(RoBERTa-BiLSTM-Attention)混合模型的文本相似度计算方法,该模型基于RoBERTa模型预训练,获得词语的向量化表示,并提取句子中的语义特征;接着使用双向长短期记忆网络及注意力机制提取上下文依赖关系;最后将两句子的文本特征经聚合操作后由Softmax函数处理得到相似度评分结果.将RBBLA模型与RoBERTa等基准模型在LCQMC数据集上进行对比实验,结果表明,与最优模型相比,RBBLA模型在准确率、精确率等指标上分别提升了2.9、2.1个百分点. 展开更多
关键词 文本相似度 RoBERTa 双向长短期记忆网络(BiLSTM) 注意力机制
下载PDF
基于深度对比学习的文本聚类
13
作者 胥桂仙 李晓荣 《中央民族大学学报(自然科学版)》 2024年第3期62-72,共11页
无监督聚类的目的是根据表示空间中的距离将数据划分为有意义或有用的簇,但往往不同类别在表示空间中是相互重叠的,为了实现不同类别的良好分离,使用实例对比学习模型,修改模型的激活函数为Tanh,并将单层感知机修改为多层感知机,提出了... 无监督聚类的目的是根据表示空间中的距离将数据划分为有意义或有用的簇,但往往不同类别在表示空间中是相互重叠的,为了实现不同类别的良好分离,使用实例对比学习模型,修改模型的激活函数为Tanh,并将单层感知机修改为多层感知机,提出了深度对比学习聚类模型。模型首先将原始中文长文本数据集输入神经网络特征提取层BERT中,然后将提取到的全部特征输入实例对比学习层中,对特征进行优化,最终使用K⁃means进行聚类。深度对比学习聚类模型在中文长文本聚类方面的性能相比于无监督聚类,在THUCNews数据集上的准确度提高了10%~25%。能够更好地促进不同类别相互重叠的数据的有效分离,实验效果显著优于现有的其他相关模型。 展开更多
关键词 实例对比学习模型 深度对比学习聚类模型 长文本聚类 K⁃means 实例对比学习层
下载PDF
基于交互式特征与多尺度特征的文本相似度研究
14
作者 尹春勇 沈子宁 《计算机技术与发展》 2024年第8期86-92,共7页
针对文本相似度分析过程中缺乏信息传递和忽略多元语义信息而导致相似度计算结果准确率低的问题,结合双向长短期记忆网络(BiLSTM),提出一种新颖的交互式特征与多尺度特征的文本相似度模型(IF-MSF)。首先,利用BiLSTM对句子进行编码提取... 针对文本相似度分析过程中缺乏信息传递和忽略多元语义信息而导致相似度计算结果准确率低的问题,结合双向长短期记忆网络(BiLSTM),提出一种新颖的交互式特征与多尺度特征的文本相似度模型(IF-MSF)。首先,利用BiLSTM对句子进行编码提取全局特征矩阵,分别用软注意力机制和余弦相似度对特征矩阵进行交互,以相互传递两组特征矩阵内部的语义信息。其次,加权两组交互式特征以综合所有交互信息,并利用BiLSTM对加权交互式特征和初始编码特征再编码以捕获特征之间的差异信息。再次,使用多尺度卷积提取差异信息的多元语义特征并结合通道注意力机制增强重要特征信息。最后,融合两组增强特征判断文本对是否相似。实验选取2个数据集来验证该方法,该模型F1值分别取得最高值88.15%和85.03%,优于其他方法。 展开更多
关键词 文本相似度 双向长短期记忆 交互式特征 多尺度特征 通道注意力
下载PDF
基于长短期记忆网络的英语标题自动生成
15
作者 千颖利 《自动化技术与应用》 2024年第4期71-73,共3页
为实现英文文本标题的自动化生成,研究一套基于长短期记忆网络的句子级LSTM编码策略,并在标题生成模型中引入注意力机制来获取英文文本的上下文向量,保留文本中的重要信息。在此基础上,通过负对数似然函数来对模型加以训练。最后通过Byt... 为实现英文文本标题的自动化生成,研究一套基于长短期记忆网络的句子级LSTM编码策略,并在标题生成模型中引入注意力机制来获取英文文本的上下文向量,保留文本中的重要信息。在此基础上,通过负对数似然函数来对模型加以训练。最后通过Byte Cup 2018数据集对本文提出的英语标题自动生成算法进行实验,并通过过ROUGE-N指标对标题生成质量加以评价。实验研究发现,所提出的句子级LSTM编码方案在英文文本标题生成准确性方面相比于其他常规摘要生成模型来说具有显著优势。 展开更多
关键词 长短期记忆网络 英语文本 标题自动生成 句子级LSTM编码
下载PDF
基于深度学习的文本分类研究综述 被引量:2
16
作者 汪家伟 余晓 《电子科技》 2024年第1期81-86,共6页
与传统的机器学习模型相比,深度学习模型试图模仿人的学习思路,通过计算机自动进行海量数据的特征提取工作。文本分类是自然语言处理中的一个重要应用,在文本信息处理过程中具有关键作用。过去几年,使用深度学习方法进行文本分类的研究... 与传统的机器学习模型相比,深度学习模型试图模仿人的学习思路,通过计算机自动进行海量数据的特征提取工作。文本分类是自然语言处理中的一个重要应用,在文本信息处理过程中具有关键作用。过去几年,使用深度学习方法进行文本分类的研究激增并取得了较好效果。文中简要介绍了基于传统模型的文本分类方法和基于深度学习的文本分类方法,回顾了先进文本分类方法并重点关注了其中基于深度学习的模型,对近年来用于文本分类的深度学习模型的研究进展以及成果进行介绍和总结,并对深度学习在文本分类领域的发展趋势和研究的难点进行了总结和展望。 展开更多
关键词 深度学习 自然语言处理 文本分类 机器学习 神经网络 预训练模型 注意力机制 长短期记忆网络
下载PDF
结合混合特征提取与深度学习的长文本语义相似度计算
17
作者 徐捷 邵玉斌 +2 位作者 杜庆治 龙华 马迪南 《计算机工程与科学》 CSCD 北大核心 2024年第8期1513-1520,共8页
文本语义相似度计算是自然语言处理中一项非常重要的任务,但是目前对于文本语义相似度的研究多集中在短文本领域,而不是长文本。相较于短文本,长文本语义信息丰富,但同时语义信息容易分散。针对长文本语义信息分散的问题,提出一种特征... 文本语义相似度计算是自然语言处理中一项非常重要的任务,但是目前对于文本语义相似度的研究多集中在短文本领域,而不是长文本。相较于短文本,长文本语义信息丰富,但同时语义信息容易分散。针对长文本语义信息分散的问题,提出一种特征提取模型,提取出长文本的主要语义信息;对提取的语义信息使用滑窗重叠的方法输入BERT预训练模型得到文本向量表示;然后,通过双向长短期记忆网络建模长文本的前后语义联系,将其映射到语义空间内;再通过线性层增加模型表示能力;最后,通过相似语义向量内积最大化和交叉熵损失函数进行微调。实验结果表明,该模型在CNSE和CNSS数据集上F1分数分别为0.84和0.91,性能优于基线模型。 展开更多
关键词 长文本语义相似度 特征提取 BERT预训练模型 语义空间
下载PDF
可控文本生成技术研究综述
18
作者 王舰 孙宇清 《中文信息学报》 CSCD 北大核心 2024年第10期1-23,共23页
可控文本生成任务是指生成符合语法规则和语义需求,且满足给定约束的自然语言文本,具有重要应用价值。如何将约束嵌入到隐空间,从而有效控制离散的词汇生成过程是十分困难的,特别是在复杂应用场景中:不仅需要控制文本内容,还要求生成的... 可控文本生成任务是指生成符合语法规则和语义需求,且满足给定约束的自然语言文本,具有重要应用价值。如何将约束嵌入到隐空间,从而有效控制离散的词汇生成过程是十分困难的,特别是在复杂应用场景中:不仅需要控制文本内容,还要求生成的长文本形式多样、语言灵活以及逻辑合理等,这使得可控文本生成任务更具挑战性且难以评估。近年来,数据驱动的神经方法得到了广泛应用,特别是大规模预训练语言模型大幅度提升了生成文本质量。该文综述这些生成方法中的代表性技术架构和模型,讨论文本生成领域定性和定量评价指标,以及相关数据集;针对可控文本生成任务的文本多样性和句子间语义一致性等高层次需求,重点讨论相关技术前沿进展,分析其理论依据和技术优势;最后总结可控文本生成任务仍然面临的挑战和未来发展方向。 展开更多
关键词 可控文本生成 文本评估 文本多样性 长文本生成
下载PDF
基于阅读理解的汉越跨语言新闻事件要素抽取方法
19
作者 朱恩昌 余正涛 +2 位作者 高盛祥 黄于欣 郭军军 《中文信息学报》 CSCD 北大核心 2024年第6期86-95,共10页
新闻事件要素抽取旨在抽取新闻文本中描述主题事件的事件要素,如时间、地点、人物和组织机构名等。传统的事件要素抽取方法在资源稀缺型语言上性能欠佳,且对长文本语义建模困难。对此,该文提出了基于阅读理解的汉越跨语言新闻事件要素... 新闻事件要素抽取旨在抽取新闻文本中描述主题事件的事件要素,如时间、地点、人物和组织机构名等。传统的事件要素抽取方法在资源稀缺型语言上性能欠佳,且对长文本语义建模困难。对此,该文提出了基于阅读理解的汉越跨语言新闻事件要素抽取方法。该方法首先利用新闻长文本关键句检索模块过滤含噪声的句子。然后利用跨语言阅读理解模型将富资源语言知识迁移到越南语,提高越南语新闻事件要素抽取的性能。在自建的汉越双语新闻事件要素抽取数据集上的实验验证了该文方法的有效性。 展开更多
关键词 新闻事件要素抽取 长文本语义建模 跨语言知识迁移 阅读理解
下载PDF
改进CapsNet的文本自杀风险检测模型
20
作者 陈彬 李鸿燕 梁卓 《现代电子技术》 北大核心 2024年第14期9-14,共6页
针对现有模型未充分利用社交媒体中文本历史动态信息进行自杀风险检测的问题,引入CapsNet模型。在CapsNet模型中,层与层之间传递的是有向神经元组,能够更好地感知长文本中的空间信息,发现社交媒体用户的情感趋势,为自杀风险检测提供依... 针对现有模型未充分利用社交媒体中文本历史动态信息进行自杀风险检测的问题,引入CapsNet模型。在CapsNet模型中,层与层之间传递的是有向神经元组,能够更好地感知长文本中的空间信息,发现社交媒体用户的情感趋势,为自杀风险检测提供依据。文中对CapsNet模型进行改进,首先改变尺度空间,增加网络宽度,充分提取隐藏在句子中的特征信息;其次,使用指数函数对Squash函数进行优化,放大胶囊输出,充分利用胶囊提取用户历史动态中的特征信息;最后,在动态路由中采用优化算法对耦合系数进行初始化,去除噪声胶囊的干扰。使用预训练的SBERT模型对社交媒体文本数据进行特征提取,得到改进CapsNet文本自杀风险检测模型二分类的准确率达到95.93%,F1分数达到95.86%,优于自杀风险检测的其他模型。 展开更多
关键词 CapsNet模型 自杀风险检测 社交媒体 长文本信息 特征提取 SBERT模型
下载PDF
上一页 1 2 17 下一页 到第
使用帮助 返回顶部