期刊文献+
共找到34,795篇文章
< 1 2 250 >
每页显示 20 50 100
基于向量叉乘标签分配的遥感图像目标检测算法 被引量:1
1
作者 禹鑫燚 林密 +1 位作者 卢江平 欧林林 《高技术通讯》 CAS 北大核心 2024年第2期132-142,共11页
近年来遥感图像目标检测受到了广泛的关注,主流的遥感图像目标检测器通过预设锚框与真实框之间的交并比(IoU)进行正负样本的划分。为了解决基于IoU的标签分配方法在遥感图像小而密集目标中存在复检和漏检的问题,本文提出了一种基于向量... 近年来遥感图像目标检测受到了广泛的关注,主流的遥感图像目标检测器通过预设锚框与真实框之间的交并比(IoU)进行正负样本的划分。为了解决基于IoU的标签分配方法在遥感图像小而密集目标中存在复检和漏检的问题,本文提出了一种基于向量叉乘标签分配的遥感图像目标检测算法YOLOXR。首先,提出了一种标签粗分配策略,通过向量叉乘的方法判断特征图的像素点是否在旋转目标内或者目标中心点附近的旋转正方形框内,从而确定其是否为候选正样本。其次,为了降低边缘低质量候选正样本对标签分配的影响,提出了旋转中心度量方法,通过向量叉乘判断像素点距离中心点的远近程度进而赋予不同的权重。最后,基于最优传输的方法(sim OTA)选取真实框和样本点的最优匹配对,使得总体代价最小,进而为旋转目标分配合适的标签。此外,为了解决旋转IoU损失不可导以及Smooth L1损失难以权衡旋转框各个参数的问题,通过计算真实框和预测框二维高斯分布的Kullback-Leibler散度(KLD)来替代IoU。在公开的遥感图像目标检测数据DOTA、HRSC 2016和UCAS-AOD上的大量实验表明,所提方法优于目前绝大多数旋转目标检测算法。 展开更多
关键词 遥感图像 目标检测 标签分配 向量叉乘
下载PDF
基于RoBERTa-Span-Attack的标签指针网络军事命名实体识别 被引量:1
2
作者 罗兵 张显峰 +1 位作者 段立 陈琳 《海军工程大学学报》 CAS 北大核心 2024年第1期76-82,93,共8页
军事领域文本中存在大量军事实体信息,准确识别这些信息是军事文本信息提取和构建军事知识图谱的基础性任务。首先,提出了一种基于RoBERTa预训练模型、跨度和对抗训练的标签指针网络的融合深度模型(RoBERTa-Span-Attack),用于中文军事... 军事领域文本中存在大量军事实体信息,准确识别这些信息是军事文本信息提取和构建军事知识图谱的基础性任务。首先,提出了一种基于RoBERTa预训练模型、跨度和对抗训练的标签指针网络的融合深度模型(RoBERTa-Span-Attack),用于中文军事命名实体识别;然后,采用了一种基于Span的标签指针网络,同时完成实体的起止位置和类别的识别任务;最后,在模型训练过程中加入对抗训练策略,通过添加一些扰动来生成对抗样本进行训练。在军事领域数据集上的实验结果表明:所提出的军事领域命名实体识别模型相较于BERT-CRF、BERT-Softmax和BERT-Span,在识别准确度上具有更优的效果。 展开更多
关键词 军事命名实体识别 预训练模型 跨度 标签指针网络 对抗训练
下载PDF
基于卷烟消费大数据标签体系的六大画像系统 被引量:1
3
作者 邓超 梁雪霞 +7 位作者 陈志 许良本 莫玉华 朱博文 谭茜 廖国彬 李安 张欣 《中国烟草学报》 CAS CSCD 北大核心 2024年第1期108-114,共7页
为解决卷烟消费者数据采集与分析难问题,提出了一种全新的基于时空网格技术的消费人群大数据采集分析方法。通过商圈网格划分和数据标签特征工程,实现企业消费者大数据资源的高效融合,建立卷烟消费大数据标签体系,提高了数据的使用价值... 为解决卷烟消费者数据采集与分析难问题,提出了一种全新的基于时空网格技术的消费人群大数据采集分析方法。通过商圈网格划分和数据标签特征工程,实现企业消费者大数据资源的高效融合,建立卷烟消费大数据标签体系,提高了数据的使用价值和复用性。基于大数据、时空网格、可视化技术构建卷烟市场数字孪生体,设计实现了六大画像系统。以玉林市场为例,实现了5237个商圈画像、19544个终端画像、42个品牌画像、169个产品画像以及12种商圈类别画像、24种卷烟分类画像。基于系统对某卷烟品牌实施精准投放实验,该产品的货源利用率从35%提升至59%。 展开更多
关键词 消费者 数字画像 大数据 标签体系 商圈 可视化
下载PDF
选择置信伪标签的迁移学习
4
作者 滕少华 周德根 +1 位作者 滕璐瑶 张巍 《江西师范大学学报(自然科学版)》 CAS 北大核心 2024年第1期31-44,共14页
域适应旨在将标签丰富的源域知识迁移到无标签的目标域.选择性伪标签和标签传播都是域适应的常用方法.然而传统的选择性伪标签以最大类的预测概率标记样本,忽视了其他概率;而且传统的标签传播同等对待不同置信度的标签,这可能导致错误标... 域适应旨在将标签丰富的源域知识迁移到无标签的目标域.选择性伪标签和标签传播都是域适应的常用方法.然而传统的选择性伪标签以最大类的预测概率标记样本,忽视了其他概率;而且传统的标签传播同等对待不同置信度的标签,这可能导致错误标签.因此,该文提出了一种选择置信伪标签(TL-SCP)的迁移学习.首先,在评估伪标签的置信度时兼顾了最大类的预测概率和其他类预测概率;其次,在标签传播过程中尽量保留高置信度标签,并据此指导低置信度标签的更新,借此减少错误标签传播;最后,在4个基准数据集上进行的大量实验验证了提出的模型(TL-SCP)优于现有的模型. 展开更多
关键词 置信伪标签 域适应 标签 迁移学习 标签传播
下载PDF
基于特征集重构与多标签分类模型的谐波源定位方法 被引量:1
5
作者 邵振国 林潇 +2 位作者 张嫣 陈飞雄 林洪洲 《电力自动化设备》 EI CSCD 北大核心 2024年第2期147-154,共8页
传统基于谐波状态估计的谐波源定位方法需要专门的同步相量量测装置,工程应用受到限制。为此,基于电能质量监测装置所采集的非同步量测数据,提出了基于特征集重构与多标签分类模型的谐波源定位方法。利用监测数据的充分统计量来挖掘量... 传统基于谐波状态估计的谐波源定位方法需要专门的同步相量量测装置,工程应用受到限制。为此,基于电能质量监测装置所采集的非同步量测数据,提出了基于特征集重构与多标签分类模型的谐波源定位方法。利用监测数据的充分统计量来挖掘量测时段的谐波信息,同时利用标签特定特征学习算法重构特征集,从而消除冗余特征以及无关特征对于谐波源定位精度的影响;提出基于邻接矩阵以及灵敏度分析的测点配置方法,结合电路网络拓扑信息实现测点的优化配置;提出基于改进极限学习机的谐波源定位方法,该方法以重构特征集为输入,建立多标签分类模型,实现谐波源定位。通过仿真与算例分析,验证了所提方法的可行性及有效性。 展开更多
关键词 电能质量 谐波源定位 非同步谐波监测数据 极限学习机 标签特定特征学习算法
下载PDF
增强学习标签相关性的多标签特征选择方法
6
作者 滕少华 卢建磊 +1 位作者 滕璐瑶 张巍 《计算机应用研究》 CSCD 北大核心 2024年第7期2079-2086,共8页
针对现有多标签特征选择方法存在的两个问题:第一,忽略了学习标签相关性过程中噪声信息的影响;第二,忽略探索每个簇的综合标签信息,提出一种增强学习标签相关性的多标签特征选择方法。首先,对样本进行聚类,并将每个簇中心视为一个综合... 针对现有多标签特征选择方法存在的两个问题:第一,忽略了学习标签相关性过程中噪声信息的影响;第二,忽略探索每个簇的综合标签信息,提出一种增强学习标签相关性的多标签特征选择方法。首先,对样本进行聚类,并将每个簇中心视为一个综合样本语义信息的代表性实例,同时计算其对应的标签向量,而这些标签向量体现了每个簇包含不同标签的重要程度;其次,通过原始样本和每个簇中心的标签级自表示,既捕获了原始标签空间中的标签相关性,又探索了每一个簇内的标签相关性;最后,对自表示系数矩阵进行稀疏处理,以减少噪声的影响,并将原始样本和每个簇代表性实例分别从特征空间映射到重构标签空间进行特征选择。在9个多标签数据集上的实验结果表明,所提算法与其他方法相比具有更好的性能。 展开更多
关键词 标签学习 特征选择 标签相关性 聚类
下载PDF
饲料标签常见问题及管理建议
7
作者 张娜 王荃 +2 位作者 单丽燕 刘晓露 杨洁 《中国饲料》 北大核心 2024年第13期197-200,共4页
文章对当前饲料和饲料添加剂产品标签的常见问题进行了系统梳理,从标签标识的管理要求和反面示例两个角度对市场上发现的主要问题进行了阐述和举例,包括产品名称和商品名称、原料组成、功能声称、成分分析保证值、产品使用说明、卫生要... 文章对当前饲料和饲料添加剂产品标签的常见问题进行了系统梳理,从标签标识的管理要求和反面示例两个角度对市场上发现的主要问题进行了阐述和举例,包括产品名称和商品名称、原料组成、功能声称、成分分析保证值、产品使用说明、卫生要求、净含量和保质期、生产者、经营者名称和地址以及抗球虫和中药类药物添加标识等,并通过对各类问题产生的原因进行分析和讨论,提出饲料质量安全管理方面相关的建议。 展开更多
关键词 饲料标签 问题 分析
下载PDF
基于自监督的主动标签清洗
8
作者 林晓 张秋阳 +1 位作者 郑晓妹 杨启哲 《图学学报》 CSCD 北大核心 2024年第3期495-504,共10页
主动标签清洗利用主动学习来进行标签噪声处理,以降低人工标注成本。现有的主动标签清洗方法仍然存在人工额外标注成本较高的问题,即挑选出的可疑样本中正确样本所占比例较高。为了缓解这一问题,提出了一种基于核心集的自监督主动标签... 主动标签清洗利用主动学习来进行标签噪声处理,以降低人工标注成本。现有的主动标签清洗方法仍然存在人工额外标注成本较高的问题,即挑选出的可疑样本中正确样本所占比例较高。为了缓解这一问题,提出了一种基于核心集的自监督主动标签清洗方法。首先利用自监督任务进行表征学习,随后将数据映射到特征空间中,并利用贪婪的K-Center集合覆盖方法挑选出可疑样本,最后根据不确定性筛选出标签噪声样本进行重标注。并同时考虑到了样本的代表性与不确定性,能够有效降低可疑样本中正确样本的比例。在含有不同比例标签噪声的公开数据集上的实验结果表明,在各迭代轮次中明显地降低了人工额外标注成本,同时也在一定程度上缓解了冷启动问题。此外,还通过消融实验证明了方法中自监督核心集采样模块和不确定性预测模块的有效性。 展开更多
关键词 主动学习 自监督学习 标签噪声 标签清洗 人工额外标注成本
下载PDF
基于注意力机制和CNN的多标签文本分类模型 被引量:1
9
作者 杨春霞 吴佳君 +1 位作者 瞿涛 姚思诚 《计算机应用与软件》 北大核心 2024年第3期156-162,共7页
针对目前多标签文本分类模型存在无法充分提取文本语义与标签的相互关系,提出一种基于注意力机制和卷积神经网络(CNN)的多标签文本分类模型。通过多头注意力机制和CNN对文本进行建模表示,充分挖掘文本全局和局部的语义特征;结合标签与... 针对目前多标签文本分类模型存在无法充分提取文本语义与标签的相互关系,提出一种基于注意力机制和卷积神经网络(CNN)的多标签文本分类模型。通过多头注意力机制和CNN对文本进行建模表示,充分挖掘文本全局和局部的语义特征;结合标签与文本信息进行交互注意力计算,捕捉结合文本内容后标签间的相互关系;使用一种自适应融合策略进一步提取两者语义信息。实验结果表明,该模型相比于其他主流模型能有效提升多标签文本分类效果。 展开更多
关键词 标签文本分类 注意力机制 卷积神经网络 文本表示
下载PDF
基于单阶段全卷积检测器的遥感图像形状自适应椭圆标签分配方法
10
作者 禹鑫燚 卢江平 +2 位作者 林密 周利波 欧林林 《高技术通讯》 CAS 北大核心 2024年第8期875-884,共10页
基于无锚框的检测方法在目标检测领域中发展迅速。然而在遥感图像中,目标存在角度任意、密集排列以及形状差异大等难点,使得遥感图像的检测仍是一项挑战。为此,本文提出了基于单阶段全卷积检测器(FCOS)改进的无锚框检测方法。首先,为了... 基于无锚框的检测方法在目标检测领域中发展迅速。然而在遥感图像中,目标存在角度任意、密集排列以及形状差异大等难点,使得遥感图像的检测仍是一项挑战。为此,本文提出了基于单阶段全卷积检测器(FCOS)改进的无锚框检测方法。首先,为了挖掘更多潜在的高质量锚点,提出基于椭圆方程的形状自适应特征点采样方法。然后,为进一步降低边界低质量样本点的影响,提出椭圆中心度量方法,相较原有的中心度量方法提供更合理的权重。此外,针对分类与回归的不一致问题,提出交并比(IoU)联合指导策略,将椭圆中心度量与IoU得分相结合作为质量分数监督分类分支,进一步提升检测精度。在DOTA 1.0数据集上的平均精度达到了79.17%,优于现有多数无锚框检测算法。 展开更多
关键词 遥感图像 深度学习 目标检测 标签分配
下载PDF
基于模糊偏好标签向量的推荐算法
11
作者 苏湛 杨昊川 艾均 《应用科学学报》 CAS CSCD 北大核心 2024年第3期525-539,共15页
传统的协同过滤算法存在因评分预测误差导致的准确性不足,以及需要缓存大量相似性结果导致的算法可扩展性受限等缺点。为此提出了一种基于物品标签向量下的用户模糊偏好相似性度量方法,该方法使用模糊逻辑度量了不同用户对不同物品内容... 传统的协同过滤算法存在因评分预测误差导致的准确性不足,以及需要缓存大量相似性结果导致的算法可扩展性受限等缺点。为此提出了一种基于物品标签向量下的用户模糊偏好相似性度量方法,该方法使用模糊逻辑度量了不同用户对不同物品内容标签喜欢、不喜欢的程度,将用户间的相似性表示为物品内容标签上的一个向量。随后依据该向量与预测目标物品内容标签之间的关系,设计了相应的相似性计算和评分预测公式。在两个常用数据集上的实验结果表明,相较于其他算法该文在体现评分预测准确性指标平均绝对误差上提升了12.38%;在体现偏好预测准确性的F1值上提升了7.85%;在体现排序准确性的半衰期效用指标上提升了17.47%。同时,该文提出的算法减少了各指标的最优预测时需要的邻居数,缩短了算法运行时间,有效提升了可扩展性。 展开更多
关键词 推荐系统 协同过滤 相似性 模糊逻辑 标签向量
下载PDF
基于大语言模型辅助的防洪调度规则标签设计方法
12
作者 冯钧 吕志鹏 +3 位作者 范振东 孔旭 陆佳民 周思源 《水利学报》 EI CSCD 北大核心 2024年第8期920-930,共11页
防洪调度规则的信息抽取对于防洪调度自动化具有重要意义,而标签体系设计在信息抽取任务中至关重要。一般的设计方式经常由于理解偏差和疏漏,导致设计出来的标签体系存在过度概括、不全面和不易区分等问题,这些问题被称为标签体系的非... 防洪调度规则的信息抽取对于防洪调度自动化具有重要意义,而标签体系设计在信息抽取任务中至关重要。一般的设计方式经常由于理解偏差和疏漏,导致设计出来的标签体系存在过度概括、不全面和不易区分等问题,这些问题被称为标签体系的非完美性。针对这一问题,本研究重点面向防洪调度文本中的规则抽取,提出了一种创新性的非完美标签优化方法,旨在改进文本信息抽取的标签设计方法。方法利用大语言模型进行辅助,通过标签细化、标签生成和标签更名等措施,来提高标签的准确性和表达能力。此外,本文还提出了一种针对数据集标签较多的实体关系三元组分组抽取方法。通过对实体关系三元组进行分组,并按照分组训练模型与识别结果,有效改善了数据集标签较多情况下模型的信息抽取效果。最终,研究利用Neo4j形成了可视化的防洪调度知识图谱。本文研究成果为后续的防洪调度工作以及相关的知识抽取工作提供了基础资源,对防洪调度领域的知识抽取进行了探索。 展开更多
关键词 知识抽取 标签设计 防洪调度 知识图谱 自然语言处理
下载PDF
基于标签增强的细粒度文本分类
13
作者 郭瑞强 杨世龙 +1 位作者 贾晓文 魏谦强 《计算机工程与应用》 CSCD 北大核心 2024年第21期134-141,共8页
文本分类是自然语言处理的一个重要分支,旨在通过训练给数据标注标签。但现有的方法仅仅考虑了标签和文本之间最浅显的语义关系,并没有考虑标签本身的额外语义信息,导致文本分类的准确率难以提升。针对此问题,提出一种基于标签增强的细... 文本分类是自然语言处理的一个重要分支,旨在通过训练给数据标注标签。但现有的方法仅仅考虑了标签和文本之间最浅显的语义关系,并没有考虑标签本身的额外语义信息,导致文本分类的准确率难以提升。针对此问题,提出一种基于标签增强的细粒度文本分类模型(FGTC),它根据已知信息对标签进行解释,丰富了标签和文档之间的语义联系。此外,FGTC进一步建模标签中短语的序列关系,并采用单词级别的细粒度标签注意力方法,充分挖掘了标签的有效信息。在四个基准数据集上进行了对比实验,结果表明,该模型在文本分类任务上的准确率得到有效提升。 展开更多
关键词 文本分类 标签增强 细粒度标签注意力
下载PDF
基于计划行为理论的冠心病患者营养标签使用行为现状及影响因素分析
14
作者 潘露 刘梦姣 朱立辉 《中国护理管理》 CSCD 北大核心 2024年第7期1008-1013,共6页
目的:调查冠状动脉粥样硬化性心脏病(简称冠心病)患者营养标签使用现状,并基于计划行为理论分析其影响因素,以期为后续开展营养标签的干预性研究提供理论依据。方法:采用便利抽样法,于2021年4月—11月选取长沙市2家综合性三级甲等医院的... 目的:调查冠状动脉粥样硬化性心脏病(简称冠心病)患者营养标签使用现状,并基于计划行为理论分析其影响因素,以期为后续开展营养标签的干预性研究提供理论依据。方法:采用便利抽样法,于2021年4月—11月选取长沙市2家综合性三级甲等医院的998名冠心病住院患者,采用一般资料调查表、基于计划行为理论自行编制的营养标签使用意向量表、营养标签使用行为问卷进行调查,采用多元线性回归分析影响因素。结果:冠心病患者营养标签使用得分为(1.79±0.93)分。行为态度、主观规范、知觉行为控制和行为意向得分分别为(32.24±8.60)、(14.91±4.93)、(34.79±10.28)、(14.17±5.29)分。多元线性回归分析显示,性别、受教育水平、是否合并糖尿病、行为态度、知觉行为控制和行为意向是营养标签使用的影响因素(P均<0.05),可解释总变异的53.8%。结论:冠心病患者营养标签使用水平低,可以基于计划行为理论设计干预措施增强患者的行为态度、知觉行为控制和行为意向,从而提高营养标签的使用。建议对男性、教育水平低、未合并糖尿病的患者给予重点关注。 展开更多
关键词 计划行为理论 营养标签 冠心病 影响因素
原文传递
基于互信息解决多标签文本分类中的长尾问题
15
作者 潘理虎 李小华 +3 位作者 张睿 谢斌红 杨楠 张林梁 《计算机应用研究》 CSCD 北大核心 2024年第9期2664-2669,共6页
针对当前解决多标签文本分类中长尾问题的方法多以破坏原本数据分布为代价,在真实数据上的泛化性能下降,无法有效地缓解样本的长尾分布的问题,提出了基于互信息解决长尾问题的多标签文本分类方法(MLTC-LD)。首先,创建关于标签样本的关... 针对当前解决多标签文本分类中长尾问题的方法多以破坏原本数据分布为代价,在真实数据上的泛化性能下降,无法有效地缓解样本的长尾分布的问题,提出了基于互信息解决长尾问题的多标签文本分类方法(MLTC-LD)。首先,创建关于标签样本的关系矩阵,计算标签样本间的依赖关系;其次,考虑标签样本间关系程度的强弱构造邻居选择器,将拥有强关系的邻居信息作为主要语义特征并作为先验信息;最后,通过图注意力神经网络将先验信息引入分类器,实现了借助分布头部数据丰富类的知识来提高尾部数据贫乏类性能的目标。在三个不同的数据集上将MLTC-LD与八个基线模型进行了广泛的比较分析。实验结果表明,MLTC-LD与最优的HGLRN相比精确度分别提高了3.5%、0.3%、1.5%,证明了该方法的有效性。 展开更多
关键词 标签文本分类 长尾问题 互信息 先验信息
下载PDF
基于K-means聚类和特征空间增强的噪声标签深度学习算法 被引量:1
16
作者 吕佳 邱小龙 《智能系统学报》 CSCD 北大核心 2024年第2期267-277,共11页
深度学习中神经网络的性能依赖于高质量的样本,然而噪声标签会降低网络的分类准确率。为降低噪声标签对网络性能的影响,噪声标签学习算法被提出。该算法首先将训练样本集划分成干净样本集和噪声样本集,然后使用半监督学习算法对噪声样... 深度学习中神经网络的性能依赖于高质量的样本,然而噪声标签会降低网络的分类准确率。为降低噪声标签对网络性能的影响,噪声标签学习算法被提出。该算法首先将训练样本集划分成干净样本集和噪声样本集,然后使用半监督学习算法对噪声样本集赋予伪标签。然而,错误的伪标签以及训练样本数量不足的问题仍然限制着噪声标签学习算法性能的提升。为解决上述问题,提出基于K-means聚类和特征空间增强的噪声标签深度学习算法。首先,该算法利用K-means聚类算法对干净样本集进行标签聚类,并根据噪声样本集与聚类中心的距离大小筛选出难以分类的噪声样本,以提高训练样本的质量;其次,使用mixup算法扩充干净样本集和噪声样本集,以增加训练样本的数量;最后,采用特征空间增强算法抑制mixup算法新生成的噪声样本,从而提高网络的分类准确率。并在CIFAR10、CIFAR100、MNIST和ANIMAL-10共4个数据集上试验验证了该算法的有效性。 展开更多
关键词 噪声标签学习 深度学习 半监督学习 机器学习 神经网络 K-MEANS聚类 特征空间增强 mixup算法
下载PDF
融合知识图谱的影视视频标签分类算法研究
17
作者 蒋洪迅 张琳 孙彩虹 《计算机科学与探索》 CSCD 北大核心 2024年第1期161-174,共14页
鉴于视频感知方式的多样性,视频标签层级分类算法均从视觉和文本模态入手,训练联合模型共同推断视频内容。但现有研究通常只适用于粗粒度的分类,针对影视剧名的分类,则需要更加细粒度的识别。提出了一个融合知识图谱的影视视频标签分类... 鉴于视频感知方式的多样性,视频标签层级分类算法均从视觉和文本模态入手,训练联合模型共同推断视频内容。但现有研究通常只适用于粗粒度的分类,针对影视剧名的分类,则需要更加细粒度的识别。提出了一个融合知识图谱的影视视频标签分类算法。首先,使用了基于大规模通用数据训练的多模态预训练模型提取了视觉和文本的特征,训练了一个多任务的视频标签预测模型,得到视频的类型、题材和实体三级标签;通过在多任务学习网络中引入相似性任务提高分类模型训练的难度,使得同类样本特征更加紧密,且更好地表达样本差异。其次,对于最细粒度的实体标签,提出了一个局部注意力头扩展的实体纠错模型,引入外部知识图谱的共现信息对前置模型的预测结果做修正,得到更准确的实体标签预测结果。采集豆瓣的半结构化数据构建了影视知识图谱并对影视视频标签分类模型进行了实证研究。视频标签分类的实验结果表明,首先,基于多任务网络结构,在训练分类任务时加入交叉熵损失函数和相似性损失函数对模型进行共同约束优化了特征表达,在类型、题材、实体标签的Top-1分类准确率上分别提升了3.70%、3.35%和16.57%;其次,针对前置模型的困难样本提出的全局-局部注意力机制模型,在引入了知识图谱信息之后,实体标签的Top-1分类准确率从38.7%提升到45.6%。该研究是使用图片-文本对数据在多模态视频标签分类问题上新的尝试,为少量数据样本情况下的短视频标签分类提供了新的研究思路。 展开更多
关键词 知识图谱 视频标签分类 多模态内容理解 实体纠错
下载PDF
面向小样本命名实体识别的标签语义增强原型网络
18
作者 黄伟光 宁佐廷 +1 位作者 段俊文 安莹 《中文信息学报》 CSCD 北大核心 2024年第10期95-105,共11页
小样本命名实体识别任务旨在通过有限数量的标注样本来识别并分类文本中的实体。目前,基于两阶段的小样本命名实体识别方法存在泛化能力差和原型类别混淆等问题。为了解决这些问题,该文提出了一种利用标签语义增强实体表示的两阶段方法... 小样本命名实体识别任务旨在通过有限数量的标注样本来识别并分类文本中的实体。目前,基于两阶段的小样本命名实体识别方法存在泛化能力差和原型类别混淆等问题。为了解决这些问题,该文提出了一种利用标签语义增强实体表示的两阶段方法。具体来说,该文使用蕴含语义信息的标签名称增强实体表示,并将其应用于跨度检测和实体分类模型。在跨度检测模型中,采用注意力机制将标签语义融入到文本表示,以减少跨度检测模型泛化能力不足的问题。同时,利用增强后的实体表示构建类别原型,使得原型可以获得更丰富的特征,从而降低了原型间的混淆。实验结果表明,该文方法可以充分利用标签语义信息,并在多个基准数据集上取得了良好的性能表现。 展开更多
关键词 小样本命名实体识别 原型网络 标签语义
下载PDF
融合GAT与头尾标签的多标签文本分类模型
19
作者 杨春霞 黄昱锟 +1 位作者 闫晗 吴亚雷 《计算机工程与应用》 CSCD 北大核心 2024年第15期150-160,共11页
现有基于神经网络的多标签文本分类主要存在两方面的不足,一是现有的数据中标签-文本频率存在长尾分布,二是很少从图结构中获取全局标签之间的关联性,针对以上问题,提出了一种融合GAT与头尾标签分类器的多标签文本分类模型(GATTN),该模... 现有基于神经网络的多标签文本分类主要存在两方面的不足,一是现有的数据中标签-文本频率存在长尾分布,二是很少从图结构中获取全局标签之间的关联性,针对以上问题,提出了一种融合GAT与头尾标签分类器的多标签文本分类模型(GATTN),该模型利用带有注意力机制的Bi-LSTM得到文本的特征向量表示;同时把不同标签之间的关联性转换为包含了全局信息的边加权图,利用多层的图注意力网络来学习头标签之间的关联性。然后将其与文本上下文语义信息进行点积交互,得到具有文本语义和头标签信息的特征表示提高模型的泛化能力。在AAPD、RCV1-V2和EUR-Lex三个公开英文数据集上的实验结果证明,该模型针对数据长尾分布的多标签文本分类效果优于其他基线模型。 展开更多
关键词 标签文本分类 图注意力网络 头尾标签 多样本学习
下载PDF
基于预训练模型与BiLSTM-CNN的多标签代码坏味检测方法
20
作者 刘海洋 张杨 +1 位作者 田泉泉 王晓红 《河北工业科技》 CAS 2024年第5期330-335,共6页
为了提高多标签代码坏味检测的准确率,提出一种基于预训练模型与BiLSTM-CNN的多标签代码坏味检测方法DMSmell(deep multi-smell)。首先,利用静态分析工具获取源代码中的文本信息和结构度量信息,并采用2种检测规则对代码坏味实例进行标记... 为了提高多标签代码坏味检测的准确率,提出一种基于预训练模型与BiLSTM-CNN的多标签代码坏味检测方法DMSmell(deep multi-smell)。首先,利用静态分析工具获取源代码中的文本信息和结构度量信息,并采用2种检测规则对代码坏味实例进行标记;其次,利用CodeBERT预训练模型生成文本信息对应的词向量,并分别采用BiLSTM和CNN对词向量和结构度量信息进行深度特征提取;最后,结合注意力机制和多层感知机,完成多标签代码坏味的检测,并对DMSmell方法进行了性能评估。结果表明:DMSmell方法在一定程度上提高了多标签代码坏味检测的准确率,与基于分类器链的方法相比,精确匹配率提高了1.36个百分点,微查全率提高了2.45个百分点,微F1提高了1.1个百分点。这表明,将文本信息与结构度量信息相结合,并利用深度学习技术进行特征提取和分类,可以有效提高代码坏味检测的准确性,为多标签代码坏味检测的研究和应用提供重要的参考。 展开更多
关键词 软件工程 代码坏味 预训练模型 标签分类 深度学习
下载PDF
上一页 1 2 250 下一页 到第
使用帮助 返回顶部