期刊文献+

自组织映射在专利文本聚类中的应用研究 被引量:8

A Research on Patent Document Clustering-analysis Using Self-Organizing Map
下载PDF
导出
摘要 自组织映射(SOM)是一种基于人工神经网络的聚类方法,通过将相似的输入数据映射到相同或者相近神经元达到相似相聚的目的,有着不需要先验知识、保持拓扑结构不变、无监督自我学习和易于可视化的优点。由于专利文献有着数量大、文字晦涩冗长、专业性强等特点,分析难度较大,自动聚类分析能挖掘专利文献内在相似性,作为基础性处理用于后期应用,例如专利数据清洗、专利检索、主题分析和专利地图生成等众多领域。基于SOM的专利文本聚类与传统聚类方法相比效率和准确率较高,并且易于可视化展示。本文使用了SOM、k-means和TwoStep算法分别在专利文本聚类中作了对比,得出SOM较优的结论。 Self-Organizing Map (SOM) is a method for clustering based on ANN, which maps the similar data to the same or close neurons in order to categorize the inputs. SOM has several advantages: requidng no prior knowledge, topological structure mapping, unsupervised, visualization, etc. Using SOM, the patent document clustering is easier, more automatic and efficient.
出处 《数字图书馆论坛》 2010年第9期13-19,共7页 Digital Library Forum
基金 本文得到国家科技部“十一五”科技支撑计划(项目编号:2006BWH03B03)、中国科学技术信息研究所重点工作项目(项目编号:2009KP01-7-1),中国科学技术信息研究所2009年度预研基金项目(项目编号:YY-200906)等项目的资助.
关键词 自组织映射 专利聚类 文本挖掘 可视化 SOM, Patent clustering, Text mining, Visualization
  • 相关文献

参考文献4

二级参考文献28

共引文献116

同被引文献177

引证文献8

二级引证文献121

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部