-
题名基于摘要的web内容挖掘研究
被引量:1
- 1
-
-
作者
常浩
陈莉
-
机构
西北大学信息科学与技术学院
-
出处
《微计算机信息》
北大核心
2006年第08X期302-304,共3页
-
基金
陕西省自然科学基金(98X11)
陕西省教育厅重点科研计划项目(00JK015)
-
文摘
Internet是一个巨大的,分步广泛的,动态性强的全球信息服务中心,人们想在它上面找到想要的相关信息是很困难的,一般用户通过给搜索引擎提供简短的关键词来检索信息,但是通过搜索引擎返回的相关结果太多,这使得处理相关结果太耗时,本文提出了一种语义虚拟文档(SVD)来表示web文档,在此基础上实现了凝聚层次聚类算法,以自动聚类内容相似的web文档。结果:一方面使网络用户增强了相关结果的判断处理,同时使用户快速、高效的从Internet上发现想要的信息,另一方面返回的结果在知识表示上增强了web内容挖掘。
-
关键词
语义虚拟文档
锚文本
摘要
文本聚类
单链接凝聚层次聚类算法
-
Keywords
SVD, Anchortext, Summarization, Document clustering, HAC Single-Linkage
-
分类号
TP311
[自动化与计算机技术—计算机软件与理论]
-