基于网络安全的网页过滤模型及其关键算法被引量：1

Webpagefilteralgorithmmodelanditskeyalgorithmsbasedonnetworksecurity

下载PDF

导出

摘要识别存在于大量的WEB网页中的不良信息的非法文本,并将其有效屏蔽,是未来信息过滤研究的新领域。在传统方法的基础上,在对抓取到的网页进行预处理后,设置加权的关键字词典;应用汉语语料库里同类词的概念,从词汇关联的角度出发,最终提出了基于同类词权重均值的关联过滤算法。最后,从两个角度进行算法评估,该过滤算法更为高效,并且能够很好的应对不良网站的反关键字过滤策略。 As the World Wide Web continues to grow at an exponential rate,the Webpage Information Filtering used for identify the illegitimate text includes ill information,and then delete them.Result from the ever-increasing of the ill information in webpage,in the future it is a new field in the research of information filtering.Based on the traditional way of keywords,the webpage grasped was per-treated and then the key word dictionary was set up with weight;by applying the concepts of the same category words in Chinese corpus,from an angle of lexical relevance,the relevance filtering algorithm based on same category words weight was put forward.Finally,an algorithm evaluation from two angles consideration was carried out.The filter algorithm is more effective and copes with the strategy to the anti-keyword filtering of eroticism website.

作者季秀兰熊拥军

机构地区江苏食品职业技术学院计算机应用技术系中南大学信息科学与工程学院

出处《中南林业科技大学学报》 CAS CSCD 北大核心 2011年第12期197-201,共5页 Journal of Central South University of Forestry & Technology

关键词网页过滤矩阵词典权重均值 webpage filtering matrix dictionary weight equal value

分类号 TP309 [自动化与计算机技术—计算机系统结构]

引文网络
相关文献

参考文献4

1Knuth D E,Morris J H,Pratt V R.Fast pattern matching instrings[J].SIAM Journal on Computing,1977,6(2):323-350.
2Boyer R S,Moore J S.A Fast String Searching Algorithm[J].Communication ACM,1977,20(10):762-772.
3Aho A V,Corasick M J.Efficient String Matching:an aid tobibliographic search[J].Communication.ACM,1975,18(6):333-340.
4韩客松,王永成,滕伟.Web页面中文文本主题的自动提取研究[J].情报学报,2001,20(2):217-223. 被引量：12

二级参考文献3

1陈桂林,王永成.Internet网络信息自动摘要的研究[J].高技术通讯,1999,9(2):33-36. 被引量：18
2陈桂林,王永成,韩客松,王刚.一种高效的中文电子词表数据结构[J].计算机研究与发展,2000,37(1):109-116. 被引量：26
3陈桂林,王永成,韩客松,王刚.一种改进的快速分词算法[J].计算机研究与发展,2000,37(4):418-424. 被引量：56

共引文献11

1刘海峰,王倩,王元元.基于Web的文本检索位置加权模型研究[J].情报科学,2007,25(3):451-455. 被引量：5
2顾辉,李翔,薛质,李建华.邻近类别分类在电子邮件过滤系统中的运用[J].计算机技术与发展,2008,18(4):202-205. 被引量：2
3孙翔,潘廷勇,李祥秋,赵永超,崔曙光.基于规范文本的特征词提取技术研究[J].科技创新与生产力,2012(3):61-63.
4刘敬培,李江,季文平,潘鹏辉.面向文本的事件信息抽取方法的研究[J].计算机与现代化,2012(7):198-201. 被引量：2
5彭浩,蔡美玲,陈继锋,刘炽,余炳锐.面向导航型网页关键词自动抽取的视觉模型与算法[J].计算机应用,2012,32(8):2360-2363.
6彭浩,蔡美玲,王瑞龙,余炳锐.面向Web文本关键词自动抽取的DON模型研究[J].计算机工程与应用,2012,48(31):115-119.
7金更达.基于信息获取的用户Agent[J].图书馆杂志,2002,21(3):44-48. 被引量：5
8刘建培.河西走廊甜叶菊膜下滴灌技术[J].计算机时代,2016,0(3):50-52. 被引量：1
9王知津,张桂玲.网络情报学初探[J].情报科学,2002,20(11):1121-1125. 被引量：6
10向桂林.复合型Web信息检索系统[J].情报学报,2003,22(5):545-549. 被引量：6

同被引文献9

1彭昱忠,元昌安,王艳,覃晓.基于内容理解的不良信息过滤技术研究[J].计算机应用研究,2009,26(2):433-438. 被引量：19
2邬贺铨.物联网的应用与挑战综述[J].重庆邮电大学学报（自然科学版）,2010,22(5):526-531. 被引量：148
3袁鼎荣,钟宁,张师超.文本信息处理研究述评[J].计算机科学,2011,38(2):9-13. 被引量：11
4耿红琴,张冠宇,史开泉.F-信息伪装与伪装-还原辨识[J].计算机科学,2011,38(2):241-245. 被引量：31
5唐云,罗俊松.基于粗糙集和BP神经网络的文本分类研究[J].计算机仿真,2011,28(6):219-222. 被引量：7
6邵忻,徐倩漪.网络伪装不良信息检测方法的研究与仿真[J].计算机仿真,2012,29(2):135-138. 被引量：6
7李连,朱爱红,苏涛.一种改进的基于向量空间文本相似度算法的研究与实现[J].计算机应用与软件,2012,29(2):282-284. 被引量：36
8丁文军,薛安荣.基于SVM的Web文本快速增量分类算法[J].计算机应用研究,2012,29(4):1275-1278. 被引量：6
9牟琦,陈艺坤,毕孝儒,厍向阳.一种基于快速增量SVM的入侵检测方法[J].计算机工程,2012,38(12):92-94. 被引量：7

引证文献1

1贾长云,梁海军.基于B-ISVM算法的物联网云存储数据伪装不良信息检测[J].计算机科学,2013,40(2):95-97. 被引量：3

二级引证文献3

1王谦,陈放.智能场域下网络社会治理的新问题及其对策[J].湖北行政学院学报,2021(5):75-81. 被引量：3
2王谦.智能在线空间下网络社会治理路径初探[J].长江论坛,2022(6):38-44.
3王谦.智能在线场域空间视阈下的网络社会治理演进研究[J].湖北第二师范学院学报,2023,40(5):60-65. 被引量：1

1唐坚刚,魏然.基于权重均值的不良网页过滤算法研究[J].计算机工程与设计,2008,29(5):1088-1089. 被引量：3
2刘冬彦,李婷,李岩.基于互联网信息过滤技术的研究与设计[J].科技创新与应用,2013,3(14):70-70.
3张亮,谢富强,陈立.一种改进的均值粒子群算法[J].计算机系统应用,2014,23(5):134-138.
4唐坚刚,熊国萍.基于语义的关键词过滤权重算法[J].微计算机信息,2007,23(27):261-262. 被引量：2
5王轩,李巍,王晓龙,赵淑香.大标记集汉语字(词)Markov 语言模型的建立[J].哈尔滨工业大学学报,1997,29(5):23-27. 被引量：3
6张辉,武亚红,黄润才.基于规则和统计的汉语多输出切分系统[J].微电子学与计算机,2007,24(7):56-58. 被引量：1
7张永奎,李东艳.互联网中非法文本特征分析及其属性预选取新方法[J].计算机应用,2004,24(4):113-115. 被引量：7
8沈亚敏,赵晖,张权,唐朝京.面向语音转换的汉语语料自动选取算法[J].计算机工程,2011,37(5):256-257.
9王忠振.领域词义关联实验数据获取的一些方法[J].电脑知识与技术,2015,0(7):7-10.
10徐菁,张辉,陆汝占.汉语语料的切分标注加工系统[J].计算机工程,2003,29(9):66-68. 被引量：4

中南林业科技大学学报

2011年第12期

浏览历史

内容加载中请稍等...

基于网络安全的网页过滤模型及其关键算法被引量：1

参考文献4

二级参考文献3

共引文献11

同被引文献9

引证文献1

二级引证文献3

相关作者

相关机构

相关主题

浏览历史

基于网络安全的网页过滤模型及其关键算法 被引量：1

参考文献4

二级参考文献3

共引文献11

同被引文献9

引证文献1

二级引证文献3

相关作者

相关机构

相关主题

浏览历史

基于网络安全的网页过滤模型及其关键算法被引量：1