Trawling算法在Web结构挖掘中的应用
摘要
在Web信息检索中,如何能够提取出与某个主题信息相关的网页变得异常重要,web结构挖掘作为web数据挖掘的一个重要方面,主要挖掘web潜在的链接结构模式,通过分析一个网页链接和被链接数量以及对象来建立web自身的链接结构模式,可以用于网页归类,本文探讨了Trawling算法在Web结构挖掘中的应用。
出处
《中小企业管理与科技》
2009年第4期234-235,共2页
Management & Technology of SME
二级参考文献29
-
1Michelangelo Diligenti, Marco Gori, Marco Maggini. Web page scoring systems for horizontal and vertical search. The 11th Int'l World Wide Web Conference, Honolulu, Hawaii, USA, 2002
-
2S. Brin, L. Page. The anatomy of a large-scale hypertextual Web search engine. Computer Networks and ISDN Systems, 1998,30:107-117
-
3L. Wood. Programming the Web: The W3C DOM specification,Internet Computing, 1999, 3(1): 48-54
-
4Soumen Chakrabarti, Mukul Joshi, Vivek Tawde, et al.Enhanced topic distillation using text, markup tags, and hyperlinks. The 24th Annual Int'l ACM SIGIR Conf. Research and Development in Information Retrieval, New Orleans,Louisiana, USA, 2001
-
5P. Srinivasan, G, Pant, F, Menczer. Target seeking crawlers and their topical performance. In: Proc, 25th Annual Int'l ACM SIGIR Conf, Research and Development in Information Retrieval,New York: ACM Press, 2002
-
6M. Diligenti, F. M. Coetzee, S. Lawrence, et al. Focused crawling using context graphs. The 26th Int'l Conf. Very Large Databases (VLDB 2000), Cairo, Egypt, 2000
-
7Junghoo Cho, Hector Garcia-Molina, Lawrence Page. Efficient crawling through URL ordering. In: Proc. 7th Int'l World Wide Web Conference. Oxford, UK: Elsevier Science, 1998. 161-172
-
8P. Chirita, D. Olmedilla, W. Nejdl. Finding related pages using the link structure of the WWW. In: Proc. IEEE/WIC/ACM International Conf. Web Intelligence (WI' 04). New York : ACM Press, 2004. 632-635
-
9P. Ingongngam, A, Rungsawang. Topic-centrie algorithm: A novel approach to Web link analysis, In: Proc. 18th Int'l Conf.Advanced Information Networking and Applications (AINA 2004). Fukuoka, Japan: FIT Press, 2004. 299-301
-
10B. L, Narayan, C, A, Murthy, Sankar K. Pal. Topic continuity for Web document categorization and ranking. In: Proc. IEEE/WIC Int'l Conf. Web Intelligence. New Jersey: IEEE Press,2003. 310-315
共引文献27
-
1杨茹,陶晓鹏.社团挖掘和话题监控的互动模型研究[J].计算机应用,2009,29(3):908-911.
-
2赵卓翔,王轶彤,田家堂,周泽学.社会网络中基于标签传播的社区发现新算法[J].计算机研究与发展,2011,48(S3):8-15. 被引量:37
-
3翟晓娟,许鑫.浅论评价系统的发展及其在互联网上的应用[J].现代情报,2008,28(2):16-20.
-
4邱均平,李晔君,李江.共链分析的缺陷及其解决方案研究[J].情报理论与实践,2008,31(2):170-174. 被引量:18
-
5李江,殷之明.链接分析研究综述[J].大学图书馆学报,2008,26(2):51-58. 被引量:14
-
6汤亚玲,秦锋.Web使用挖掘下的Web页面层次分类技术研究[J].情报学报,2008,27(3):351-356. 被引量:2
-
7白似雪,刘华斌.基于页面分块模型的PageRank算法研究[J].南昌大学学报(工科版),2008,30(2):179-183. 被引量:4
-
8吴炜,梁昆,李瑞轩,辜希武,卢正鼎.一种基于主题相关度的网页排序算法[J].微电子学与计算机,2008,25(9):221-224. 被引量:3
-
9张金增,范明.一种改进的基于最大流的Web社区挖掘算法[J].计算机应用,2009,29(1):213-216. 被引量:2
-
10郭希娟,刘静.PH-MaxFlow算法发现Web社区[J].计算机工程与应用,2009,45(5):113-116. 被引量:1
-
1谢娟文,秦淑娟,焦爱胜.人工智能在搜索引擎资源获取中的应用[J].机械研究与应用,2009,22(2):121-122. 被引量:1
-
2Blog:谁的地盘谁做主?[J].数字商业时代,2005(2):65-65.
-
3魏群,赵骥,刘保相.网页模糊归类算法的应用与实现[J].微计算机信息,2006,22(05X):223-224.
-
4王瑞琴,孔繁胜.利用Wikipedia的结构化信息计算语义相关性[J].浙江大学学报(工学版),2009,43(2):315-320. 被引量:2
-
5马东星.网页模糊归类的应用与实现[J].实验科学与技术,2006,4(B12):72-74.
-
6梁溪.灭火救援最优路径算法探究[J].电子测试,2013,24(10X):58-59. 被引量:1
-
7李宗景.创新是活的源泉[J].创新科技,2008(9):46-46.
-
8美国技术授权办公室(OTL):技术转移的直通车[J].中国科技信息,2006(10):77-78. 被引量:6
-
9邱继远,岳振军,荣传振,马娅娅.基于AHP的改进PageRank算法及Hadoop实现[J].军事通信技术,2016,37(1):74-79.