用信息-摘要算法提高Web信息检索效率的研究被引量：3

Using Message-Digest Algorithm for Improving Efficiency of Web Information Searching

下载PDF

导出

摘要针对常用搜索引擎返回给用户的信息中包含大量重复网页的缺陷,提出了一种基于信息-摘要算法的去除重复网页算法。由于算法的成熟,该算法易实现,可移植性强。实验证明该算法能有效地去除常用搜索引擎返回的重复网页,从而为Internet用户提高信息检索效率,具有较强的实用价值。 The returning information of the usual search engines often includes massive repeated pages. Aims at it, an inspecting algorithm of approximate mirror pages is proposed in this paper. Because of the mature of MD5, this algorithm can be implemented easily and is portable. The experiment shows that it can remove the repeated pages from usual search engines effectively and can improve the searching efficiency of Internet users. It has good application foreground.

作者杨文忠章兢

机构地区湖南大学电气与信息工程学院

出处《计算机技术与发展》 2006年第6期222-223,226,共3页 Computer Technology and Development

基金教育部科学与技术研究重点项目(教技司2001224号)

关键词信息-摘要算法近似镜像网页信息检索 message-digest algorithm approximate mirror pages information searching

分类号 TP301.6 [自动化与计算机技术—计算机系统结构]

引文网络
相关文献

参考文献5

1李增智,李平均,王广荣.计算机网络管理系统的若干重要问题[J].微机发展,2000,10(2):7-9. 被引量：13
2葛新红.数据挖掘软件应用分析[J].微计算机应用,2005,26(3):374-374. 被引量：4
3Shivakumar N,Garcia-Molina H.Finding near-replicas of documents on the Web[A].In proceedings of the Workshop on Web Databases[C].[s.l.]:[s.n.],1998.204-212.
4Shivakumar N.SCAM:A copy detection mechanism for digital documents[A].In proceedings of 2nd International Conference in Theory and Practice of Digital Libraries[C].Austin,Texas:[s.n.],1995.
5王贵竹,李津生,洪佩琳.MD5报文摘要算法与IPv6认证[J].小型微型计算机系统,2001,22(1):126-128. 被引量：6

二级参考文献9

1[1]Scott Bradner: The Recommendation for the IP Next Generation Protocol.[S]RFC1752, Jan. 1995
2[2]Rivest, R.: The MD5 Message Digest Algorithm. [S] RFC 1321, April 1992
3[3]Stephen E.: Internet Protocol. Version 6 (IPv6) Specification.[S]RFC2460, Dec. 1998
4[4]Stephen Kent: IP Authentication Header. [S]RFC2402, BBN Corporation. Nov. 1998
5[5]P. Metzger, W. Simpson: IP Authentication using Keyed MD5.RFC1828. Piermont Information Systems Inc. , August, 1995
6[6]Joe Touch: Report on MD5 Performance. [S]RFC1810, University of Southern California. June, 1995
7[7]Bruce Schneier. E-mail Security. How to keep your electronic messages private
8王文燕.乡村文化振兴方式初探——谈“互联网+民间艺术”[J].经济研究导刊,2019,0(33):31-33. 被引量：3
9周敏.构建新时代农村公共文化服务有效供给模式的实践路径研究[J].湖北文理学院学报,2019,40(12):38-42. 被引量：7

共引文献20

1顾虹.计算机网络管理系统的应用与展望[J].电子技术（上海）,2021,50(9):266-267. 被引量：2
2巩军全.数据挖掘及其软件选择应用[J].消费导刊,2009,0(11):200-200.
3李美满.网络考试系统题库与成绩安全性研究[J].计算机应用,2005,25(B12):133-134. 被引量：10
4马俊杰,郑军,田斌.MD5算法在双机热备份信息同步中的应用[J].飞行器测控学报,2006,25(2):75-78. 被引量：1
5邓金国.计算机网络化与青少年社会化的关系[J].中国组织工程研究与临床康复,2007,11(52):10651-10653.
6林克正,李东勤,李绍华.基于Hash函数的脆弱图像水印算法[J].哈尔滨工程大学学报,2008,29(1):61-64. 被引量：5
7杨永峰,王经洲.计算机网络管理在管理运用中的不足与防范[J].经济研究导刊,2009(29):195-196. 被引量：17
8亢峰,任晓蕾.网络化的测绘生产[J].测绘与空间地理信息,2011,34(1):258-260. 被引量：4
9吴杨,矫文成,赵新杰,王韬,吴克辉.引入Hash函数的抗差分故障分析模型研究[J].计算机技术与发展,2011,21(5):166-170.
10孙淑惠.计算机网络管理维护[J].山东省农业管理干部学院学报,2011,28(3):163-163. 被引量：1

同被引文献19

1姚新波,马治坤.基于特征串的网页去重算法[J].科技信息,2008(28). 被引量：3
2曹传东,郭理.一种基于文本抽取的网页正文去重算法[J].科技信息,2009(1):102-103. 被引量：1
3王哲.基于特征码的网页去重算法研究[J].山东电大学报,2009(1):14-16. 被引量：4
4王建勇,谢正茂,雷鸣,李晓明.近似镜像网页检测算法的研究与评价[J].电子学报,2000,28(z1):130-132. 被引量：21
5王翠华.浅谈档案开发与利用的作用及建议[J].广东水利电力职业技术学院学报,2008,6(2):11-13. 被引量：2
6孙莹,王占平,宋天源.信息数字化时代的档案利用工作[J].黄河水利职业技术学院学报,2005,17(4):101-102. 被引量：2
7高凯,王永成,肖君.网页去重策略[J].上海交通大学学报,2006,40(5):775-777. 被引量：13
8姜爱蓉.数字资源整合系统的技术发展与应用趋势[J].图书馆杂志,2006,25(12):14-18. 被引量：38
9魏丽霞,郑家恒.基于网页文本结构的网页去重[J].计算机应用,2007,27(11):2854-2856. 被引量：13
10谢蕙,秦杰,胡双双.基于用户查询关键词的网页去重方法研究[J].现代图书情报技术,2008(7):43-46. 被引量：6

引证文献3

1余海萍,梁征.B/S结构网络设备运行管理系统的设计与实现[J].广西科学院学报,2007,23(1):33-35. 被引量：4
2林萍.提高档案信息利用效率研究[J].福建电脑,2009,25(5):41-41. 被引量：1
3闫俊伢.基于MD5的网页去重算法的设计与研究[J].实验室研究与探索,2013,32(12):105-108. 被引量：1

二级引证文献6

1曹金山.大规模网络终端远程监测系统[J].现代电子技术,2011,34(4):68-69.
2冯启.网络设备维护档案管理系统的设计与实现[J].无线互联科技,2012,9(6):62-62.
3朱仙芝.Agent技术在网络远程监控系统中的应用[J].现代电子技术,2013,36(18):59-61.
4张素霞,袁梅.档案利用效率的因素分析与对策[J].世界最新医学信息文摘,2013,13(28):155-155.
5刘驰,闫宏飞.基于元信息的云盘资源检索结果去重[J].山东大学学报（理学版）,2016,51(7):11-17.
6陈峰标.基于B/S架构的高速公路机电设备检维修系统设计[J].粘接,2022,49(4):154-159. 被引量：2

1王波涛,韩国栋,张效军.基于FPGA的MD5算法设计与实现[J].通信技术,2010,43(1):69-71. 被引量：6
2谢平华.MD5算法在重复邮件识别方面的研究和实现[J].科技传播,2011,3(24):185-186. 被引量：1
3苏磊,黄伟志.MD5算法研究[J].才智,2010,0(4):64-64.
4周庆.浅谈六种加密算法之三——MD5算法[J].网上俱乐部（电脑安全专家）,2005(1):87-87.
5猛犸.误判容易,过滤很难[J].新世纪周刊,2009(18):106-106.
6王华志.网络信息检索中常用搜索引擎的使用[J].内蒙古科技与经济,2013(9):82-83.
7谭敏清.国外常用搜索引擎[J].湖北商检科技,1999(3):25-29.
8张国喜.Internet检索工具的使用研究[J].津图学刊,2004(1):37-41.
9孙掌印.搜索引擎Yahoo与Google的比较分析[J].科技情报开发与经济,2011,21(17):160-162.
10韩娜,沈西挺,刘岩.基于用户兴趣的个性化搜索系统研究[J].软件导刊,2010,9(1):38-39. 被引量：2

计算机技术与发展

2006年第6期

浏览历史

内容加载中请稍等...

用信息-摘要算法提高Web信息检索效率的研究被引量：3

参考文献5

二级参考文献9

共引文献20

同被引文献19

引证文献3

二级引证文献6

相关作者

相关机构

相关主题

浏览历史

用信息-摘要算法提高Web信息检索效率的研究 被引量：3

参考文献5

二级参考文献9

共引文献20

同被引文献19

引证文献3

二级引证文献6

相关作者

相关机构

相关主题

浏览历史

用信息-摘要算法提高Web信息检索效率的研究被引量：3