期刊文献+
共找到26篇文章
< 1 2 >
每页显示 20 50 100
基于共现潜在语义向量空间模型的语义核构建 被引量:10
1
作者 牛奉高 张亚宇 《情报学报》 CSSCI CSCD 北大核心 2017年第8期834-842,共9页
实现数字图书馆资源聚合的知识发现离不开对知识的有效表示。作为经典的文本表示模型,向量空间模型(VSM)及其衍生模型在信息检索以及知识发现等研究中都有着重要的地位,但依然存在不足。共现潜在语义向量空间模型(CLSVSM)作为新的文本... 实现数字图书馆资源聚合的知识发现离不开对知识的有效表示。作为经典的文本表示模型,向量空间模型(VSM)及其衍生模型在信息检索以及知识发现等研究中都有着重要的地位,但依然存在不足。共现潜在语义向量空间模型(CLSVSM)作为新的文本表示模型,与VSM相比明显提高了文本聚类的精度。然而,面对文本大数据的应用,共现矩阵维度往往较高,致使模型的计算复杂度也较大。因此,本文在CLSVSM基础上构建了语义核(CLSVSM_K),构建的原理是基于潜在语义分析(LSA)的思想。CLSVSM_K不仅降低了共现矩阵的维度,而且实现了文本特征词之间同义信息的合并。本文将该语义核模型应用于文献的主题聚类中,实验结果表明,该方法的确有效降低了特征词空间的维度和计算的复杂度,提高了聚类算法的性能,且提高了文献主题聚类的精确度。该模型的应用将有助于数字图书馆信息资源组织、知识发现和知识优化。 展开更多
关键词 共现潜在语义向量空间模型 语义核 共现潜在语义向量空间模型语义核 文本聚类
下载PDF
基于语义核的中文实体关系抽取 被引量:1
2
作者 刘建舟 邵雄凯 《信息系统工程》 2011年第3期94-95,共2页
本文提出一种新的基于语义核的中文实体关系抽取方法,在通常的序列核中嵌入语义信息,然后用改进后的k均值算法进行聚类。实验结果证明我们的方法是比较有潜力的。
关键词 关系抽取 K均值 语义核
下载PDF
语义核及其他 被引量:1
3
作者 施建平 《常熟高专学报》 2003年第3期84-87,共4页
语义核是言语表达的重点,或是句子的关键信息所在。文章对语义核的位置、语义核的成因、语义核的界定作了诠释,同时指出语义核这一概念的局限性。
关键词 现代汉语 语义核 句子位置 形成原因 界定 局限性 言语表达
下载PDF
问答系统中基于语义核函数的问题分类算法 被引量:1
4
作者 江龙泉 张波 +2 位作者 胡志鹏 丁峻宏 刘波 《上海师范大学学报(自然科学版)》 2018年第1期53-56,共4页
提出一种基于语义核函数的问题分类算法,该算法基于问题的语法结构构建支持向量机(SVM)核函数.首先,将给定的问题解析为语法树结构,用语法树的子树表示该问题;然后,从词法、语法、语义三个层面提取问题的特征,构成更加丰富的特征空间;接... 提出一种基于语义核函数的问题分类算法,该算法基于问题的语法结构构建支持向量机(SVM)核函数.首先,将给定的问题解析为语法树结构,用语法树的子树表示该问题;然后,从词法、语法、语义三个层面提取问题的特征,构成更加丰富的特征空间;接着,基于问题的语法树构建核函数;最后,使用潜在语义索引方法并结合问题的词法、语法以及语义特征,通过语义核函数将特征空间映射到更有效的空间中进行问题分类.TREC数据集上的实验结果表明,通过词法、语法以及语义增强的问题特征空间可以提高分类准确率. 展开更多
关键词 问答系统 监督学习 支持向量机 问题分类 语义核函数 特征空间
下载PDF
语义核SVM结合改进EMD跨越语义鸿沟 被引量:1
5
作者 徐炎 曹春萍 《轻工学报》 CAS 2019年第3期77-83,共7页
针对跨越语义鸿沟方法中未考虑文本间语义相关性和样本数量增加时计算量过大的问题,提出了一种语义核SVM结合改进EMD跨越语义鸿沟方法.该方法首先考虑到文本特征间的语义关系,提取与图像共生的文本关键词,结合HowNet通用本体库和内部统... 针对跨越语义鸿沟方法中未考虑文本间语义相关性和样本数量增加时计算量过大的问题,提出了一种语义核SVM结合改进EMD跨越语义鸿沟方法.该方法首先考虑到文本特征间的语义关系,提取与图像共生的文本关键词,结合HowNet通用本体库和内部统计特征构造语义核函数,然后将语义核函数嵌入SVM进行关键词分类,得到最佳候选关键词,从而解决文本间语义相关性问题;再通过最佳减小矩阵对EMD算法进行改进,从而减小计算量.对比实验结果表明,该方法充分利用了与图像共生的文本特征间的语义关系,标注准确率明显高于其他3种方法,且标注时间缩短为其他方法的1/5左右. 展开更多
关键词 语义鸿沟 语义核 支持向量机 改进EMD
下载PDF
文本分类中的语义核函数研究 被引量:8
6
作者 张玉峰 王志芳 《情报科学》 CSSCI 北大核心 2010年第7期970-975,979,共7页
传统的很多文本分类算法都是基于文本特征的数值统计信息来进行分类,只考虑特征在文本中的出现频率,而忽略了文本特征之间的语义相关性。针对文本分类任务,本文提出一种基于本体的语义核函数的构造方法,设计和实现了基于WordNet的语义... 传统的很多文本分类算法都是基于文本特征的数值统计信息来进行分类,只考虑特征在文本中的出现频率,而忽略了文本特征之间的语义相关性。针对文本分类任务,本文提出一种基于本体的语义核函数的构造方法,设计和实现了基于WordNet的语义核函数算法,并将该语义核函数嵌入支持向量机分类器中进行文本分类实验,在20NewsGroups数据集上的分类结果表明,基于语义核函数的支持向量机的分类效果明显优于基于线性核的支持向量机的分类效果。 展开更多
关键词 文本分类 语义核函数 本体 支持向量机
原文传递
基于特征族群语义扩散核的半监督农业文本分类 被引量:2
7
作者 李伟 汪廷华 郑惠宁 《赣南师范大学学报》 2018年第3期66-71,共6页
农业文本分类旨在对主流的农业信息网抽取的文本数据集进行分类.在样本充足的情形下,经典的支持向量机方法能取得较好的效果,然而在样本较少或者样本矩阵很稀疏的情形下效果较差.提出了一种基于特征族群语义扩散核(它是语义扩散核的一种... 农业文本分类旨在对主流的农业信息网抽取的文本数据集进行分类.在样本充足的情形下,经典的支持向量机方法能取得较好的效果,然而在样本较少或者样本矩阵很稀疏的情形下效果较差.提出了一种基于特征族群语义扩散核(它是语义扩散核的一种)和支持向量机的半监督农业文本分类方法.该方法在经典的支持向量机方法基础上结合特征族群语义扩散核,使得农业文本分类准确率得到一个显著的提升,在训练集样本数量只有原来一半的数量情况下预测原来的测试样本,预测准确率几乎与原来的相同. 展开更多
关键词 文本分类 支持向量机 语义扩散 半监督学习 农业文本
下载PDF
用于文本相似度计算的新核函数 被引量:4
8
作者 王秀红 鞠时光 《通信学报》 EI CSCD 北大核心 2012年第12期43-48,共6页
为了提高文本相似检测的综合表现,在文本文档相似特征的基础上构造了新的核函数S_Wang核函数。结合文本相似计算过程中的实际情况,将待比对的文本表示成向量,考虑通过2个向量间的乘积和欧氏距离来描述向量之间的相似程度,从而构造了适... 为了提高文本相似检测的综合表现,在文本文档相似特征的基础上构造了新的核函数S_Wang核函数。结合文本相似计算过程中的实际情况,将待比对的文本表示成向量,考虑通过2个向量间的乘积和欧氏距离来描述向量之间的相似程度,从而构造了适合文本相似度计算的新核函数,并根据Mercer定理证明了所构造函数可以作为核函数。实验验证了新构造的核函数在文本文档相似度计算中的表现,实验结果表明S_Wang核其相似度计算精度和综合指标均分别优于Cauchy核、潜在语义核(LSK)以及CLA复合核。S_Wang核适用于文本相似度计算。 展开更多
关键词 信息检索 文本相似度 函数 S_Wang 潜在语义核 CAUCHY CLA复合
下载PDF
基于混合核函数的分布式信息检索结果融合 被引量:3
9
作者 王秀红 鞠时光 《通信学报》 EI CSCD 北大核心 2011年第4期112-118,125,共8页
为了提高分布式信息检索(DIR)的结果融合表现,基于改进的潜在语义核(LSK)和复合方差(ANOVA)核构建了新的复合(CLA)核,通过直接计算检索结果和提问之间相关度来对检索结果进行融合研究。实验结果表明:CLA核的融合精度和招回率分别仅略次... 为了提高分布式信息检索(DIR)的结果融合表现,基于改进的潜在语义核(LSK)和复合方差(ANOVA)核构建了新的复合(CLA)核,通过直接计算检索结果和提问之间相关度来对检索结果进行融合研究。实验结果表明:CLA核的融合精度和招回率分别仅略次于LSK和ANOVA核,但其综合评价指标F1优于其他核;其融合精度比Round-robin、ComMNZ、Bayesian、Borda、SDM、MEM和regression SVM等分别提高了16.79%、30.73%、20.37%、24.17%、14.25%、13.50%和7.53%。CLA核具有较好的融合表现,适用于DIR结果融合。 展开更多
关键词 分布式信息检索 结果融合 潜在语义核 ANOVA 复合
下载PDF
基于语言无关性语义Kernel学习的短文本分类 被引量:1
10
作者 易欣 郭武士 《计算机应用与软件》 CSCD 2015年第7期314-318,共5页
针对传统的短文本分类方法大量使用语法标签和词库导致产生语言依赖的问题,提出一种基于语言无关性语义核学习的短文本分类方法。首先,利用短文本的语义信息从文档中提取模式;然后,以三个标注层(词、文档和类别)标注提取出的每个模式;最... 针对传统的短文本分类方法大量使用语法标签和词库导致产生语言依赖的问题,提出一种基于语言无关性语义核学习的短文本分类方法。首先,利用短文本的语义信息从文档中提取模式;然后,以三个标注层(词、文档和类别)标注提取出的每个模式;最后,根据三个标注层次计算文档之间的相似度,并根据相似度完成分类。在英语和汉语数据集上的实验验证了该方法的有效性。实验结果表明,相比其他几种核方法,该方法取得了更好的分类性能。 展开更多
关键词 短文本分类 语义核学习 相似性度量 语言无关性 标注层 模式语义标注
下载PDF
读《汉语词汇核心义研究》
11
作者 张春雷 《励耘语言学刊》 CSSCI 2016年第1期342-348,共7页
王云路、王诚的新作《汉语词汇核心义研究》以汉语词汇核心义为研究对象,充分借鉴传统的语言学成果,通过语言事实说话,旨在探讨汉语词义发展演变的制约机制和词语内部意义之间的深层联系,初步建构核心义研究模式,具有重要的理论意义和... 王云路、王诚的新作《汉语词汇核心义研究》以汉语词汇核心义为研究对象,充分借鉴传统的语言学成果,通过语言事实说话,旨在探讨汉语词义发展演变的制约机制和词语内部意义之间的深层联系,初步建构核心义研究模式,具有重要的理论意义和应用价值。 展开更多
关键词 《汉语词汇心义研究》 心义 书评
下载PDF
一种改进的中文实体关系抽取方法 被引量:2
12
作者 刘建舟 邵雄凯 《软件导刊》 2011年第4期27-29,共3页
实体关系抽取是指从文本中发现两个实体之间的关系。提出一种新的基于语义核的中文实体关系抽取方法,在通常的序列核中嵌入语义信息,然后用改进后的k均值算法进行聚类。实验结果证明我们的方法是比较有潜力的。
关键词 关系抽取 K均值 语义核
下载PDF
基于CLSVSM的惩罚性矩阵分解及其在文本主题聚类中的应用 被引量:1
13
作者 牛奉高 冯世佳 黄琛 《计算机与现代化》 2021年第5期66-72,共7页
文本信息的合理表示对文本主题聚类及检索有重要作用。针对文本表示模型维度较高的问题,基于共现潜在语义向量空间模型(CLSVSM)研究惩罚性矩阵分解(PMD),利用PMD对向量进行稀疏约束,提取核心特征词,进而实现原始数据的重建;通过共现分... 文本信息的合理表示对文本主题聚类及检索有重要作用。针对文本表示模型维度较高的问题,基于共现潜在语义向量空间模型(CLSVSM)研究惩罚性矩阵分解(PMD),利用PMD对向量进行稀疏约束,提取核心特征词,进而实现原始数据的重建;通过共现分析理论及PMD方法,深度挖掘特征词之间的语义信息,构建语义核函数(PMD_K)。将本文方法应用于文本主题聚类中,实验结果显示,PMD和PMD_K这2种方法的聚类效果均明显优于其他方法,以F值为例,PMD_K方法较以往的95%CLSVSM_K方法,F值提高了21.9%。将PMD与文本表示模型相结合,在提高了文本主题聚类的效率和精度的同时,还避免了对高维矩阵的复杂运算。 展开更多
关键词 CLSVSM 惩罚性矩阵分解 语义核函数 文本主题聚类
下载PDF
浅谈“论元结构”习得理论对外语教学的启示
14
作者 尹富林 《外语教学》 CSSCI 北大核心 1996年第2期30-33,共4页
浅谈“论元结构”习得理论对外语教学的启示尹富林(华东冶金学院)1.引言论元结构(argumentstructure)的研究兴起于本世纪60年代(Fillmore,1968),发展于80年代(Pinker,1984)。... 浅谈“论元结构”习得理论对外语教学的启示尹富林(华东冶金学院)1.引言论元结构(argumentstructure)的研究兴起于本世纪60年代(Fillmore,1968),发展于80年代(Pinker,1984)。它是现代语言学在语义研究中出现的新... 展开更多
关键词 论元结构 习得理论 外语教学 词的语义结构 学习者 句法结构 语义特征 语义核 区别性特征 连接规则
下载PDF
基于协同训练的文本蕴含识别 被引量:1
15
作者 任函 万菁 +1 位作者 吴泓缈 冯文贺 《中文信息学报》 CSCD 北大核心 2014年第6期114-119,共6页
针对文本蕴含的训练数据不足的问题,该文提出了基于协同训练的文本蕴含识别方法。该方法利用少量已标注的蕴含数据和大量未标注数据进行协同训练。为此,该文利用改写视图和评估视图,从结构和非结构两个角度考察蕴含关系,并将语义树核分... 针对文本蕴含的训练数据不足的问题,该文提出了基于协同训练的文本蕴含识别方法。该方法利用少量已标注的蕴含数据和大量未标注数据进行协同训练。为此,该文利用改写视图和评估视图,从结构和非结构两个角度考察蕴含关系,并将语义树核分类器和基于统计特征的分类器应用于两个视图,同时利用协同训练的结果训练一个综合分类器,用于对新数据进行预测。实验表明,基于协同训练的蕴含识别方法能在少量训练数据的情况下获得较好的识别性能。 展开更多
关键词 文本蕴含识别 协同训练 语义
下载PDF
英语“hand”和汉语“手”之一词多义对比 被引量:5
16
作者 严爽 《浙江科技学院学报》 CAS 2006年第4期298-302,共5页
通过对英语之“hand”和汉语之“手”的一词多义结构的这一个案的分析对比,发现该词的义项分布在两种语言中基本一致,其词义拓展方式呈辐射和连锁相结合的趋势;且各义项以转喻或隐喻方式为主要纽带,组成了一张多核的相关语义网。该基本... 通过对英语之“hand”和汉语之“手”的一词多义结构的这一个案的分析对比,发现该词的义项分布在两种语言中基本一致,其词义拓展方式呈辐射和连锁相结合的趋势;且各义项以转喻或隐喻方式为主要纽带,组成了一张多核的相关语义网。该基本人体词的多项语义分布现状反映了人类在不同语言背景下认知和语义发展中共有的思维方式,从而为多义词的外语教学提供了新的思路。 展开更多
关键词 一词多义 隐喻 转喻 语义
下载PDF
古文词义教学论要
17
作者 罗荣汉 《西华师范大学学报(哲学社会科学版)》 1982年第1期97-103,共7页
人离开了语言便无法思维和交际。语言是由语音外壳和语义内核凝聚起来的整体。但语音(和后起的文字)只是思维和交际所凭藉的信号系统而已,它所代表的实质内容还是语义。如果离开了语义核心,语言就会失去其作为思维和交际工具的实际意义... 人离开了语言便无法思维和交际。语言是由语音外壳和语义内核凝聚起来的整体。但语音(和后起的文字)只是思维和交际所凭藉的信号系统而已,它所代表的实质内容还是语义。如果离开了语义核心,语言就会失去其作为思维和交际工具的实际意义。汉字正是从语义出发创制出来的以表意为主的符号体系,它寓形、音、义于一体,以喻义为重心,具体代表着构成汉语基本原料的词汇。 展开更多
关键词 词义演变 语音知识 语义核 近义词 符号体系 双音 一词多义 形符 解释句 通假字
下载PDF
主位和主位突出
18
作者 李红伟 《临沂师专学报》 1990年第1期95-98,共4页
韩礼德教授(M.A.K.Halliday)在其著作《功能语法导论》(An Introduction toFunctional Grammar)中提出句子有三种功能——传达信息,交流思想和表现事物。他认为每种语言的语句都携带着信息,也就是说每个语句都有一种组合形式,表达某种... 韩礼德教授(M.A.K.Halliday)在其著作《功能语法导论》(An Introduction toFunctional Grammar)中提出句子有三种功能——传达信息,交流思想和表现事物。他认为每种语言的语句都携带着信息,也就是说每个语句都有一种组合形式,表达某种要交流的思想,但达到这种目的的途径各异。英语通过赋予句子某个成分特定的作用而表达某种信息,这一句子成分称为主位(Theme)。 展开更多
关键词 主位 功能语法 倒装句 述位 主谓结构 sentence 语义核 间句 语言艺术 句子意义
下载PDF
怎样才能保证句子的一致性
19
作者 张黎明 《郧阳师范高等专科学校学报》 1990年第2期90-92,共3页
英语的句子强调一致性(unity),也就是说每一句话只能有一个语义核心(focus),这个语义核心就是这句话出发点,也是句子叙述和描写的对象。英语句子有了一致性,就能使句中各成分之间关系协调,句子的意义明确,一目了然。反之,如果句子没有... 英语的句子强调一致性(unity),也就是说每一句话只能有一个语义核心(focus),这个语义核心就是这句话出发点,也是句子叙述和描写的对象。英语句子有了一致性,就能使句中各成分之间关系协调,句子的意义明确,一目了然。反之,如果句子没有一致性,在同一个句子里,时而说东,时而又去说西,语义混淆,层次颠倒,这样的句子就是病句,念起来诘屈聱牙,听起来让人不知所云。因此,我们说,造出清楚明了的句子是写好文章的前提和基础,而一致性则是清楚明了的句子应具备的一个基本要素。要保证句子的一致性,除要求句子有正确的语法形式外,还应努力做到以下几点: 展开更多
关键词 语义核 语法形式 宾语从句 子里 CLASSROOM quickly 并列复合句 逻辑谬误 PROFESSOR 纽科姆
下载PDF
复杂中文文本的实体关系抽取研究 被引量:1
20
作者 王苑 徐德智 陈建二 《计算机科学》 CSCD 北大核心 2009年第8期208-211,共4页
实体关系抽取是信息抽取研究领域中的重要研究课题之一。针对已有方法在处理复杂文本上的不足,提出了复杂中文文本的实体关系抽取方法。结合中文文本的语法特征,提出了7条抽取关系特征序列的启发式规则,并采用语义序列核和KNN机器学习... 实体关系抽取是信息抽取研究领域中的重要研究课题之一。针对已有方法在处理复杂文本上的不足,提出了复杂中文文本的实体关系抽取方法。结合中文文本的语法特征,提出了7条抽取关系特征序列的启发式规则,并采用语义序列核和KNN机器学习算法结合的方法来分类和标注关系的类型。通过对ACE评测定义下的两个子类的实体关系抽取,关系抽取的平均F值达到了76%,明显高于传统的基于特征向量和最短依存路径核的方法。 展开更多
关键词 实体关系抽取 语法特征 启发式规则 语义序列
下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部