期刊文献+
共找到5篇文章
< 1 >
每页显示 20 50 100
基于跨语言广义向量空间模型的跨语言文档聚类方法 被引量:6
1
作者 唐国瑜 夏云庆 +1 位作者 张民 郑方 《中文信息学报》 CSCD 北大核心 2012年第2期116-120,共5页
跨语言文档聚类主要是将跨语言文档按照内容或者话题组织为不同的类簇。该文通过采用跨语言词相似度计算将单语广义向量空间模型(Generalized Vector Space Model,GVSM)拓展到跨语言文档表示中,即跨语言广义空间向量模型(Cross-Lingual ... 跨语言文档聚类主要是将跨语言文档按照内容或者话题组织为不同的类簇。该文通过采用跨语言词相似度计算将单语广义向量空间模型(Generalized Vector Space Model,GVSM)拓展到跨语言文档表示中,即跨语言广义空间向量模型(Cross-Lingual Generalized Vector Space Model,CLGVSM),并且比较了不同相似度在文档聚类下的性能。同时提出了适用于GVSM的特征选择算法。实验证明,采用SOCPMI词汇相似度度量算法构造GVSM时,跨语言文档聚类的性能优于LSA。 展开更多
关键词 跨语言文档聚类 跨语言广义向量空间模型 文档聚类 跨语言信息检索
下载PDF
基于《知网》义原空间的文本相似度计算 被引量:9
2
作者 肖志军 冯广丽 《科学技术与工程》 北大核心 2013年第29期8651-8656,共6页
针对向量空间模型特征项正交的假设和缺乏语义的缺点,在广义向量空间模型的基础上,提出了一种基于《知网》义原的向量空间模型,利用义原的相似度实现文本相似度的计算。通过文本特征项的TF-IDF权重将文本表示为《知网》义原空间中的向量... 针对向量空间模型特征项正交的假设和缺乏语义的缺点,在广义向量空间模型的基础上,提出了一种基于《知网》义原的向量空间模型,利用义原的相似度实现文本相似度的计算。通过文本特征项的TF-IDF权重将文本表示为《知网》义原空间中的向量,并利用义原向量之间的夹角实现对文本相似度的计算。通过文本聚类实验对比了本文提出的方法与VSM和GVSM模型,实验结果表明本文提出的方法在语义相似度计算方面相比GVSM和VSM有所提高。 展开更多
关键词 向量空间模型 广义向量空间模型 正交特征项 《知网》 文本语义相似度
下载PDF
基于代数理论的信息检索模型及其推广 被引量:1
3
作者 王知津 郑红军 《现代图书情报技术》 CSSCI 北大核心 2005年第7期30-33,共4页
在信息检索中,代数理论是构建检索模型的重要手段之一,以代数理论为基础的检索模型克服了布尔模型不能进行部分匹配的缺点而广为采用。本文分析了代数理论的向量空间模型,并对该模型进行了扩展:用最小项标引词以反映词与词之间的关系,... 在信息检索中,代数理论是构建检索模型的重要手段之一,以代数理论为基础的检索模型克服了布尔模型不能进行部分匹配的缺点而广为采用。本文分析了代数理论的向量空间模型,并对该模型进行了扩展:用最小项标引词以反映词与词之间的关系,用奇异值分解来捕捉文献的语义结构;最后对这三种模型进行了比较。 展开更多
关键词 信息检索 数学模型 向量空间模型 广义向量空间模型 潜语义标引
下载PDF
基于先验性指标的试卷等价方法
4
作者 陶南 《现代计算机》 2007年第5期70-72,75,共4页
随着网络化考试这一新型考试方式的逐步流行,如何在节约成本的同时保证考试的公平合理已成为人们日益关注的重点。在研究广义向量空间模型的基础上,综合考虑试卷难度和知识点,提出了一种试卷等价性的计算方法。
关键词 试卷等价性 广义向量空间模型 相似度
下载PDF
基于GVSM的文本相似度算法研究 被引量:4
5
作者 郑小波 郑诚 尹莉莉 《微型机与应用》 2011年第3期9-11,共3页
提出了一种基于WordNet和GVSM的文本相似度算法,通过语义的路径长度和路径深度计算两个词的语义相似度,结合改进的GVSM模型计算文本相似度,并对基于TFIDF-VSM模型和本文方法进行了比较。实验结果表明,该算法取得了更好的准确率和效率。
关键词 文本相似度 语义相似度 词网 广义向量空间模型
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部