期刊文献+
共找到12篇文章
< 1 >
每页显示 20 50 100
基于政策法规数据的嵌套命名实体识别研究
1
作者 徐晗 梁曌 梁小林 《湖南文理学院学报(自然科学版)》 CAS 2024年第3期19-23,29,共6页
针对政策法规文本数据中常常出现的嵌套实体问题进行了分析,构建了一个融合双仿射变换的指针网络模型。该模型使用指针网络替代传统的条件随机场模型来降低计算复杂度,配合双仿射变换模块解决嵌套实体问题,同时定义了一个新的损失函数... 针对政策法规文本数据中常常出现的嵌套实体问题进行了分析,构建了一个融合双仿射变换的指针网络模型。该模型使用指针网络替代传统的条件随机场模型来降低计算复杂度,配合双仿射变换模块解决嵌套实体问题,同时定义了一个新的损失函数解决命名实体的稀疏性问题。实验结果表明,该模型改善了传统组合模型在政策法规数据上出现的过拟合及实际预测效果欠佳的问题,在自建政策法规数据中取得了较好的结果,F1得分达到了78.41%,相对传统方法提升明显。 展开更多
关键词 命名实体识别 政策文本挖掘 嵌套实体 自然语言处理 Bert-BiLSTM-Biaffine-span模型
下载PDF
结合依存图卷积与文本片段搜索的方面情感三元组抽取 被引量:4
2
作者 徐康 李霏 姬东鸿 《计算机工程》 CAS CSCD 北大核心 2023年第4期61-67,共7页
现有基于序列标注或文本生成的三元组抽取模型通常未考虑完整文本片段级别的交互,且忽略了句法知识的应用。为解决上述问题,提出一种基于依存图卷积与文本片段搜索的深度学习模型来联合抽取方面情感三元组。通过预训练语言模型BERT编码... 现有基于序列标注或文本生成的三元组抽取模型通常未考虑完整文本片段级别的交互,且忽略了句法知识的应用。为解决上述问题,提出一种基于依存图卷积与文本片段搜索的深度学习模型来联合抽取方面情感三元组。通过预训练语言模型BERT编码层学习句子中每个单词的上下文表达,同时利用图卷积神经网络学习句子单词之间的依存关系和句法标签信息,以捕获远距离的方面词与观点词之间的语义关联关系,并采用文本片段搜索构造候选方面词与观点词及其特征表示,最终使用多个分类器同时进行方面词与观点词抽取及情感极性判断。在ASTE-Data-V2数据集上的实验结果表明,该模型在14res、14lap、15res和16res子集上的F1值相比于JET模型提升了10.61、10.54、4.91和8.48个百分点,具有较高的方面情感三元组抽取效率。 展开更多
关键词 方面情感三元组抽取 图卷积神经网络 深度学习 依存句法分析 文本片段搜索
下载PDF
基于上下文语义增强的实体关系联合抽取 被引量:1
3
作者 雷景生 剌凯俊 +1 位作者 杨胜英 吴怡 《计算机应用》 CSCD 北大核心 2023年第5期1438-1444,共7页
基于span的联合抽取模型在实体和关系抽取(RE)任务中共享实体span的语义表示,能有效降低流水线模型带来的级联误差,但现有模型无法充分地将上下文信息融入实体和关系的表示中。针对上述问题,提出一个基于上下文语义增强的实体关系联合抽... 基于span的联合抽取模型在实体和关系抽取(RE)任务中共享实体span的语义表示,能有效降低流水线模型带来的级联误差,但现有模型无法充分地将上下文信息融入实体和关系的表示中。针对上述问题,提出一个基于上下文语义增强的实体关系联合抽取(JERCE)模型。首先通过对比学习的方法获取句子级文本和实体间文本的语义特征表示;然后,将该表示加入实体和关系的表示中,对实体关系进行联合预测;最后,动态调整两个任务的损失以使联合模型的整体性能最优化。在公共数据集CoNLL04、ADE和ACE05上进行实验,结果显示JERCE模型与触发器感知记忆流框架(TriMF)相比,实体识别F1值分别提升了1.04、0.13和2.12个百分点,RE的F1值则分别提升了1.19、1.14和0.44个百分点。实验结果表明,JERCE模型可以充分获取上下文中的语义信息。 展开更多
关键词 命名实体识别 关系抽取 对比学习 文本span 加权损失
下载PDF
语篇关系的语言实现 被引量:1
4
作者 彭静 《外语与外语教学》 CSSCI 北大核心 2008年第10期21-25,共5页
基于语料库方法,本文在修辞结构理论框架下利用RST工具标注了小型封闭语篇树库,设计标注模式,着重研究了四级作文语篇中语篇关系的语言实现形式问题:研究发现,语篇关系在不同分数等级的作文中关于语篇关系结构段顺序的安排,关鹾... 基于语料库方法,本文在修辞结构理论框架下利用RST工具标注了小型封闭语篇树库,设计标注模式,着重研究了四级作文语篇中语篇关系的语言实现形式问题:研究发现,语篇关系在不同分数等级的作文中关于语篇关系结构段顺序的安排,关鹾触发语位置的选择,标点符号的使用及垃置安排,以及语篇关系结构段的长短等方面均呈现相应的特征。本文为这些特征提供了量化袄据,对于作文语篇中语篇关系的谋篇风格有一定的揭示意义。 展开更多
关键词 语篇关系 语言实现 结构段 触发语
下载PDF
学术文本被引片段的自动识别研究 被引量:7
5
作者 章成志 徐津 马舒天 《情报理论与实践》 CSSCI 北大核心 2019年第9期139-145,共7页
[目的/意义]目前学术文献被引片段识别研究存在两个问题:对于给定的一个引文上下文,其所对应的被引片段句子数量并没有明确的定义;构建特征中很少考虑句子中词语的语义相似度特征。文章基于以上两个角度,对已有的实验方案进行改进,旨在... [目的/意义]目前学术文献被引片段识别研究存在两个问题:对于给定的一个引文上下文,其所对应的被引片段句子数量并没有明确的定义;构建特征中很少考虑句子中词语的语义相似度特征。文章基于以上两个角度,对已有的实验方案进行改进,旨在提高被引片段的识别效果。[方法/过程]首先,按照不同的粒度对被引文献进行句子切分,以考察不同粒度切分下被引片段的识别效果,从而确定被引片段的最佳句子数量。随后,在被引片段识别模型中加入词语语义相似度特征,即通过词嵌入进行分布式词向量表示,并依据词汇语义网络本体,度量不同句子中词语间的语义相似度。[结果/结论]实验结果表明,随着句子切分粒度的逐渐增加,被引片段识别效果呈下降趋势;另外,所增加的词语语义相似度特征能够有效地在句子间建立细粒度的语义关联,提高了模型的稳定性,从而提升了被引片段的识别效果。[局限]仅从特征构建的角度对被引片段的识别工作进行优化,提升效果较为有限。模型选择方面,仍局限于使用传统的机器学习算法,未考虑现有的深度学习算法对本工作进行改进。 展开更多
关键词 学术文献 被引片段 引文分析 文本分类 语义相似度
原文传递
基于对话内容的交互型文本会话主题挖掘 被引量:1
6
作者 彭杰 石永革 高胜保 《电信科学》 北大核心 2016年第9期139-145,共7页
传统的主题挖掘模型一般仅从交互型文本中挖掘出文档主题,为了能够从中挖掘出会话主题并提高挖掘模型的普适性,提出了一种基于对话内容的交互型文本会话主题生成模型。首先通过分析交互型文本的特征,基于主题树的概念,定义了一个5层结... 传统的主题挖掘模型一般仅从交互型文本中挖掘出文档主题,为了能够从中挖掘出会话主题并提高挖掘模型的普适性,提出了一种基于对话内容的交互型文本会话主题生成模型。首先通过分析交互型文本的特征,基于主题树的概念,定义了一个5层结构的对话生成树。以此为基础,再基于LDA构建会话主题生成模型(ST-LDA)。最后采用吉布斯抽样法对ST-LDA进行推导,得到会话主题及其分布概率。使用实际数据进行验证,结果表明,ST-LDA模型可以从交互型文本中有效地挖掘出会话主题。此外,成果可以降低分类算法的复杂度,回溯主题—参与者关联关系,具有较好的普适性。 展开更多
关键词 交互型文本 对话内容 会话主题挖掘 对话生成树 LDA
下载PDF
莫言获“诺”奖与当代传媒文化创新
7
作者 廖奔 《艺术百家》 CSSCI 北大核心 2013年第2期1-10,共10页
电影《红高梁》的世界性影响力和它对莫言的助力,促成了莫言获得"诺贝尔"文学奖。中国当代传媒文化的兴盛,使一批作家乐于与影视剧合作。文学从单纯文本形式的传播,跨越到现代传媒时代的结果,是为创新的艺术样式服务的社会需... 电影《红高梁》的世界性影响力和它对莫言的助力,促成了莫言获得"诺贝尔"文学奖。中国当代传媒文化的兴盛,使一批作家乐于与影视剧合作。文学从单纯文本形式的传播,跨越到现代传媒时代的结果,是为创新的艺术样式服务的社会需求剧增。这种需求带来小说与影视剧创作转换的大量实践,也给编剧理论提出新的命题。不同艺术门类之间有不同的规律,我们必须敬畏这些规律,学习掌握和驾驭这些规律,然后才有可能获得成功。 展开更多
关键词 当代中国 影视艺术 影像传播 意象转换 改编语汇 文体跨越 传媒文化 文化 创新
下载PDF
基于贝叶斯扩张树的文本分类算法
8
作者 史会峰 谷根代 卢艳霞 《华北电力大学学报(自然科学版)》 CAS 北大核心 2004年第5期105-107,共3页
将文本的特征作为贝叶斯网络的节点,根据样本数据计算节点之间的互信息,并且将它们作为网络中边的权。利用 Kruskal 算法构造了一种简单的贝叶斯网络—贝叶斯扩张树,使它具有最大对数似然值。利用贝叶斯条件概率公式,将贝叶斯扩张树作... 将文本的特征作为贝叶斯网络的节点,根据样本数据计算节点之间的互信息,并且将它们作为网络中边的权。利用 Kruskal 算法构造了一种简单的贝叶斯网络—贝叶斯扩张树,使它具有最大对数似然值。利用贝叶斯条件概率公式,将贝叶斯扩张树作为分类器对文档集中的文档进行分类。 展开更多
关键词 文本分类 贝叶斯网络 分类器 文档 KRUSKAL算法 互信息 节点 扩张 样本数据 最大
下载PDF
基于笔画识别的视频图片文字提取方法
9
作者 王萍 徐鹏 张艺凡 《天津大学学报(自然科学与工程技术版)》 EI CAS CSCD 北大核心 2014年第3期200-204,共5页
通过对笔画的对称边缘特点与文字几何特征的认识,根据二阶边缘检测算子捕捉边缘点亮暗变化趋势的能力,使用高斯型拉普拉斯算子寻找'边缘点对',并构建来自笔画等窄带区域的'对称边缘点对'样本集.从样本集的分布规律中自... 通过对笔画的对称边缘特点与文字几何特征的认识,根据二阶边缘检测算子捕捉边缘点亮暗变化趋势的能力,使用高斯型拉普拉斯算子寻找'边缘点对',并构建来自笔画等窄带区域的'对称边缘点对'样本集.从样本集的分布规律中自适应地定出文字笔画搜索窗的尺度及方向.利用最小生成树算法实现由系列搜索窗得到的所有笔画子区域的关联聚类,通过剪枝、伪区域鉴别和阈值分割,将文字以行(含非水平行)或列的形式提取出来.实验表明,该方法对复杂背景下不同的语言类型、亮暗类型、文字行方向及文字尺度具有适应性,在ICDAR数据集上的查准率和查全率分别达到76%和75%. 展开更多
关键词 基于内容图像检索 文字笔画提取 高斯型拉普拉斯变换 最小生成树
下载PDF
比喻性成语对文章段落回忆的影响
10
作者 王才康 曾祥炎 霍凯明 《应用心理学》 CSSCI 2001年第2期23-27,共5页
本研究采用随意学习的实验范式 ,探讨了结句中是否包含比喻性成语以及被试的工作记忆容量大小对文章段落回忆成绩的影响。实验中所有被试被要求阅读 6个说明体的文章段落 ,然后接受一个有提示的回忆测验。研究发现 :( 1 )所有被试对结... 本研究采用随意学习的实验范式 ,探讨了结句中是否包含比喻性成语以及被试的工作记忆容量大小对文章段落回忆成绩的影响。实验中所有被试被要求阅读 6个说明体的文章段落 ,然后接受一个有提示的回忆测验。研究发现 :( 1 )所有被试对结句中包含比喻性成语的段落回忆成绩比结句中没有比喻性成语的段落好。 ( 2 )结句中是否包含比喻性成语和被试工作记忆容量之间存在着交互作用。若结句中包含比喻性成语 ,段落的回忆成绩不受被试工作记忆容量的制约 ,反之则会。这些结果可能表明 ,比喻性成语的某些特点 ,如形象性或易记性 ,作为一种辅助手段促进了被试对文章内容的记忆。 展开更多
关键词 比喻性成语 工作记忆容量 段落回忆
下载PDF
基于图聚类的脱机手写文档图像文本行分割 被引量:3
11
作者 黄亮 殷飞 陈庆虎 《华中科技大学学报(自然科学版)》 EI CAS CSCD 北大核心 2014年第3期33-36,共4页
提出了一种基于自适应游程平滑算法和基于改进的最小张树聚类的文本行分割算法,该算法基于图的集成聚类的框架用以进一步解决文本行分割的问题,该框架可以很容易地推广到对更多的单一算法进行融合.在该融合框架中,由对应于连通部件的顶... 提出了一种基于自适应游程平滑算法和基于改进的最小张树聚类的文本行分割算法,该算法基于图的集成聚类的框架用以进一步解决文本行分割的问题,该框架可以很容易地推广到对更多的单一算法进行融合.在该融合框架中,由对应于连通部件的顶点以及顶点对之间的边构成文档图,边上的权值由两个单一文本行分割算法的结果决定.于是,文本行分割的任务就转化为如何以最小代价对文档图进行划分的问题.该融合算法在哈尔滨工业大学多人手写数据库上取得了较好的效果,召回率为99.31%,错误率为0.94%. 展开更多
关键词 文本行分割 自适应游程平滑 最小生成树 距离测度学习 图聚类的集成
原文传递
面向长时跨度自由叙事文本的少儿情感挖掘方法
12
作者 王一凡 张冰冰 +1 位作者 刘梦君 潘利琴 《情报科学》 CSSCI 北大核心 2022年第3期109-116,135,共9页
【目的/意义】少儿情感的发展规律一直是各方关注的问题,现有研究在长期、准确和高效地收集、处理、分析情感数据上存在不足,本研究尝试采用自由叙事文本进行情感分析。【方法/过程】研究通过收集少儿从小学1年级持续到6年级的自由叙事... 【目的/意义】少儿情感的发展规律一直是各方关注的问题,现有研究在长期、准确和高效地收集、处理、分析情感数据上存在不足,本研究尝试采用自由叙事文本进行情感分析。【方法/过程】研究通过收集少儿从小学1年级持续到6年级的自由叙事文本数据,使用文本情感分析对叙事文本情感状态进行判别,最后使用多项式回归来研究情感发展的线性和非线性趋势。【结果/结论】结果表明,随着年级的增长,积极情感大体上呈现曲线下降趋势,消极情感呈曲线上升趋势,中性情感在整个发展过程中呈正弦型。在整体情感趋势上,女童比男童更为积极。【创新/局限】尽管存在学生本身能力限制、无法从文本中确定直接因果关系等局限,自由叙事文本情感分析依然为研究人员提供了利用“大数据+AI”技术,来便捷、准确、高效探索少儿长时跨度情感发展规律的机会。 展开更多
关键词 少儿情感 长时跨度 情感发展 情感分析 自由叙事文本
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部