期刊文献+

基于词向量距离的相关词变迁研究——以《情报探索》杂志摘要为例 被引量:3

Word Embedding Distance-based Study on Changes of Related Words:Case Study of Abstracts in Journal Information Research
下载PDF
导出
摘要 通过对《情报探索》杂志的摘要文本数据集进行训练,得到不同时间段上的词向量库,然后在不同时段上对词向量间的距离进行计算,得到主题词的相关词列表,从中发现相关词的变迁情况,并由此进行进一步文本挖掘。 The paper trains abstract text datasets in journal Information Research, and obtains word embedding database of different periods. Then it gets the lists of related words by calculating vector distance of the words embedding in different periods, finds the changes of related words, and does further text mining.
作者 方延风 陈健
出处 《情报探索》 2015年第4期5-7,10,共4页 Information Research
基金 福建省科技计划重点项目"基于云存储技术的科技项目数据挖掘研究"(项目编号:2012H0052)成果之一
关键词 词向量 向量距离 相关词 文本挖掘 word2vec word embedding vector distance related word text mining word2vec
  • 相关文献

参考文献6

二级参考文献41

  • 1包金龙.基于向量空间模型的信息检索系统的设计[J].情报杂志,2005,24(7):44-45. 被引量:16
  • 2贺卫红,曹毅.基于向量空间模型文本过滤算法[J].系统工程,2005,23(10):122-125. 被引量:3
  • 3张选平,马琮,蒋宇,袁明轩,梁平.一种基于概念抽取的相关词推荐模型[J].微电子学与计算机,2006,23(5):163-165. 被引量:2
  • 4章成志,苏兰芳,苏新宁.基于多语境的相关词自动提取系统的设计与实现[J].现代图书情报技术,2006(9):23-28. 被引量:6
  • 5袁方,周志勇,宋鑫.初始聚类中心优化的k-means算法[J].计算机工程,2007,33(3):65-66. 被引量:153
  • 6Possas B, Ziviani N, Meira W, Ribeiro-Neto B. Set- based vector model: An efficient approach for correlation based ranking [J]. ACM Transactions on Information Systems, 2005, 23(4) : 397-429.
  • 7Hammouda K M, KamelMS. Efficient phras-based document indexing for Web document clustering [J]. IEEE Transactions on Knowledge and Data Engineering, 2004, 16(10):1279-1296.
  • 8Saraiva, P. C., Moura, E. S., Ziviani, N. Rank-Preserving two-level caching for scalable search engines [C]//Proceedings of the 24th Annual international ACM SIGIR Conference on Research and Development in information Retrieval (New Orleans, Louisiana, United States). SIGIR'01. ACM Press, New York, NY, 2008, 51-58.
  • 9Jansen B. J., Spink, A., Bateman, J., and Saracevic, T. Real life information retrieval: A study of user queries on the web[C]//ACM SIGIR Forum. SIGIR'98. New York, NY, 1998, 32(1): 5-17.
  • 10Leacock C, Chodorow wordnet similarity for Fellbaum C. Wordnet Princeton: MIT Press, M. Combining local context and word sense identification [C] // An Electronic Lexical Database. 1998:265 -283.

共引文献60

同被引文献28

引证文献3

二级引证文献21

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部