面向维吾尔文的敏感信息过滤方法研究被引量：6

Sensitive information filtering algorithm based on Uyghur text information network research

下载PDF

导出

摘要在这个信息量爆炸性增长的时代,网络不良信息充斥在日常生活当中。为了构建洁净的网络环境,实现对网络维吾尔文中敏感信息的检测与过滤,通过分析维吾尔文的特点,将维吾尔文进行词干提取和编码化处理,再结合DFA和决策树提出了针对维吾尔文敏感信息过滤的相应方法。维吾尔文经过词干提取、编码化处理解决了维吾尔文书写顺序和形式多样、存储易出现乱码等问题。再结合决策树的特点,将转码后的维吾尔文信息存储于决策树节点上,将决策树的子节点按照特定编码进行顺序排列。这样维吾尔文文本信息进行敏感信息过滤时可以缩小检测范围,提高算法效率。 In this era of information explosion, bad information of the network is full of daily life. In order to build a clean network environment and realize the Uyghur web page detection and filtering of sensitive information, by analyzing the characteristics of the Uyghur, the Uyghur is done stemming and encoding processing. Combining the DFA and the decision tree, it puts forward the corresponding method for Uyghur sensitive information filtering. After stemming and encoding processing, it solves the Uyghur writing sequence, form of diversity, and storage with garbled words easily problems, etc.And then combining the characteristics of the decision tree, the transcoding Uyghur is stored on the decision tree node,and the child nodes of the decision tree are arranged in order in accordance with the specific code. So the information of Uyghur text can narrow the detection range when the information is filtered, and improve the efficiency of algorithm.

作者薛朋强鲜英努尔布力吾守尔.斯拉木

机构地区新疆大学信息科学与工程学院

出处《计算机工程与应用》 CSCD 北大核心 2018年第5期236-241,246,共7页 Computer Engineering and Applications

基金国家自然科学基金(No.61163052 No.61303231 No.61433012)

关键词敏感信息过滤确定性自动机维吾尔文过滤决策树 sensitive information filtering deterministic finite automaton Uyghur filter decision tree

分类号 TP391.1 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献9

1薛朋强,努尔布力,吾守尔.斯拉木.基于网络文本信息的敏感信息过滤算法[J].计算机工程与设计,2016,37(9):2447-2452. 被引量：32
2古丽拉.阿东别克,米吉提.阿布力米提.维吾尔语词切分方法初探[J].中文信息学报,2004,18(6):61-65. 被引量：39
3蔡李,单艳,薛化建,苏国平.维吾尔文网页正文抽取系统的研究与实现[J].计算机工程与设计,2012,33(2):551-555. 被引量：3
4麦热哈巴·艾力,姜文斌,王志洋,吐尔根·依布拉音,刘群.维吾尔语词法分析的有向图模型[J].软件学报,2012,23(12):3115-3129. 被引量：22
5早克热.卡德尔,艾山.吾买尔,吐尔根.依布拉音,帕里旦.吐尔逊,吴小川.混合策略的维吾尔语名词词干提取系统[J].计算机工程与应用,2013,49(1):171-175. 被引量：11
6邓一贵,伍玉英.基于文本内容的敏感词决策树信息过滤算法[J].计算机工程,2014,40(9):300-304. 被引量：32
7刘小虎,李生.决策树的优化算法[J].软件学报,1998,9(10):797-800. 被引量：130
8周毅敏,李光耀.一种根据决策树结合信息论的经典算法复杂度可能下界分析[J].计算机科学,2013,40(11A):238-241. 被引量：3
9易中梅.应用检索实例谈谈信息检索的查全率和查准率[J].科技信息,2008(24):363-364. 被引量：8

二级参考文献53

1李育嫦.文献检索中提高查全率与查准率的方法探讨[J].图书馆学研究,2002(11):92-93. 被引量：26
2乔登科,柳厅文,孙永,郭莉.一种获得有限自动机状态间关系的高效算法[J].计算机研究与发展,2012,49(S2):138-144. 被引量：2
3力提甫.托乎提.电脑处理维吾尔语语音和谐律的可能性[J].中央民族大学学报（哲学社会科学版）,2004,31(5):108-113. 被引量：14
4郑家恒,卢娇丽.关键词抽取方法的研究[J].计算机工程,2005,31(18):194-196. 被引量：41
5易斌.现代维吾尔语元音格局分析[J].新疆大学学报（哲学社会科学版）,2006,34(1):141-144. 被引量：8
6王敬普,林亚平,周顺先,岳文.基于包装器模型的文本信息抽取[J].计算机应用,2006,26(3):655-658. 被引量：8
7阿依克孜.卡德尔,开沙尔.卡德尔,吐尔根.依布拉音.面向自然语言信息处理的维吾尔语名词形态分析研究[J].中文信息学报,2006,20(3):43-48. 被引量：23
8孙君,陈陶.提高文献查全率和查准率的有效途径——逻辑运算符、位置算符和通配符的灵活运用[J].现代情报,2006,26(10):167-169. 被引量：12
9索红光,刘玉树,曹淑英.一种基于词汇链的关键词抽取方法[J].中文信息学报,2006,20(6):25-30. 被引量：88
10沈艳红.信息检索中检索词的选择对查全率的影响[J].情报探索,2006(11):73-74. 被引量：11

共引文献251

1俞佳熠,钱卫东,徐永军.一种自动生成炼钢专家规则算法图的方法[J].冶金自动化,2023,47(S01):368-372. 被引量：1
2郭玉滨.决策树ID3算法研究及其改进[J].菏泽学院学报,2005,27(5):44-46. 被引量：2
3吴宣为,史斌宁.一种新的简化ID3决策树的算法[J].合肥工业大学学报（自然科学版）,2004,27(12):1565-1569. 被引量：3
4张伟.数据挖掘中的ID3算法研究与实现[J].软件导刊,2010,9(5):176-178. 被引量：2
5张仁伟,王洪斌.一种基于行为检测的垃圾邮件过滤技术[J].哈尔滨职业技术学院学报,2008(4):123-125. 被引量：1
6徐远纯,盛昭瀚,柳炳祥.一种基于决策树的客户流失危机分析方法[J].计算机与现代化,2004(8):1-4. 被引量：10
7丁华,张少中,王秀坤.基于改进ID3算法的轨迹化决策研究[J].计算机工程与设计,2004,25(10):1721-1723. 被引量：8
8何宝群.数学教学要渗透人文精神[J].教学与管理（小学版）,2005(1):49-50. 被引量：1
9李艺明,张应利.数据挖掘在移动通信业客户流失管理中的应用[J].广东通信技术,2005,25(3):31-35. 被引量：1
10盛昭瀚,柳炳祥.客户流失危机分析的决策树方法[J].管理科学学报,2005,8(2):20-25. 被引量：49

同被引文献68

1杨小龙,刘坚.C/C++源程序缓冲区溢出漏洞的静态检测[J].计算机工程与应用,2004,40(20):108-110. 被引量：10
2李鑫,王甜甜,苏小红,马培军.消除GCC抽象语法树文本中冗余信息的算法研究[J].计算机科学,2008,35(10):170-172. 被引量：8
3亚森.伊明.基于国际标准编码系统的维吾尔文拉丁文转写规则研究[J].信息技术与标准化,2011(6):49-51. 被引量：4
4刘利俊.一种关键字过滤系统下的DFA分词算法设计与优化[J].计算机应用与软件,2012,29(1):284-287. 被引量：4
5蔡李,单艳,薛化建,苏国平.维吾尔文网页正文抽取系统的研究与实现[J].计算机工程与设计,2012,33(2):551-555. 被引量：3
6艾孜尔古丽,齐向卫,玉素甫.艾白都拉.基于网站用词调查的现代维吾尔语词干提取和应用研究[J].计算机应用与软件,2012,29(3):32-34. 被引量：11
7早克热.卡德尔,艾山.吾买尔,吐尔根.依布拉音,帕里旦.吐尔逊,吴小川.混合策略的维吾尔语名词词干提取系统[J].计算机工程与应用,2013,49(1):171-175. 被引量：11
8吐尔地.托合提,艾克白尔.帕塔尔,艾斯卡尔.艾木都拉.基于互信息的维吾尔文自适应组词算法[J].计算机应用研究,2013,30(2):429-431. 被引量：6
9木尼拉.塔里甫,安尼瓦尔.加马力,亚森.艾则孜,帕力旦.吐尔逊.基于简易密写架构的维文反过滤技术研究[J].信息网络安全,2013(7):56-60. 被引量：1
10图尔妮萨古丽.赛麦提,吾守尔.斯拉木,安尼瓦尔.托合提.现代维吾尔文与斯拉夫维吾尔文转换规则研究[J].信息技术与标准化,2013(9):56-59. 被引量：5

引证文献6

1依不拉音·吾斯曼,郭文强,于凯.面向多形式维文的敏感信息过滤算法研究[J].计算机工程与应用,2020,56(10):127-133. 被引量：3
2瞿霞,华建祥.物联网环境下大数据流中有效信息过滤算法研究[J].软件导刊,2020,19(6):214-217. 被引量：5
3韩磊,胡建鹏.基于关键词Trie树的GCC抽象语法树消除冗余算法[J].计算机科学,2020,47(9):47-51. 被引量：6
4朴承哲.基于改进深度学习的网络敏感信息快速过滤研究[J].宁夏师范学院学报,2021,42(1):85-90. 被引量：2
5吕静贤,孙林檀,邓志东,唐振营,王海龙.数据交互中用户敏感信息脱敏及格式限制研究[J].信息技术,2021,45(7):119-125. 被引量：1
6王艺皓,丁洪伟,王丽清,李波,李浩.基于决策树和DFA的老挝文敏感信息过滤算法[J].计算机应用与软件,2022,39(7):241-246. 被引量：4

二级引证文献20

1刘丰年.基于Mahout框架的社交网络服务数据过滤算法[J].安阳工学院学报,2021,20(2):46-48.
2童瀛,周宇,姚焕章,梁剑,薛虎.深度神经网络的网络高敏感信息预警算法[J].西安工程大学学报,2021,35(1):69-74. 被引量：6
3薛斌,胡建鹏.基于动态检测与静态分析的自动评分方法研究[J].智能计算机与应用,2021,11(8):177-182.
4张维,蒋颖,楼斐,王庆娟,陈齐瑞.基于机器学习的生活号敏感内容感知与预警系统设计[J].微型电脑应用,2021,37(11):104-107.
5李菲,梁振宇.多线程电子通信网络数据流冗余量消除方法[J].计算机仿真,2021,38(11):158-161. 被引量：2
6梁中阁,陈孝如.基于关键词分级检索的Web信息访问监控算法[J].计算机仿真,2021,38(11):433-437. 被引量：2
7鲁强宇,陈迎阳,柯方圆,马伟伟.浅谈大数据脱敏技术在电力用户隐私信息保护中的运用[J].电力系统装备,2022(1):144-147. 被引量：1
8杨晖.基于皮尔森相关算法的云存储层次化去冗优化[J].吉林大学学报（信息科学版）,2022,40(1):71-76. 被引量：2
9贾文钢,高锦涛.基于HDFS的海量日志数据冗余点过滤算法仿真[J].计算机仿真,2021,38(12):241-244. 被引量：2
10姚璐.主题相似性聚类下时政新闻敏感信息过滤方法[J].信息技术,2022,46(4):107-111. 被引量：1

1谭宏.高职会计专业校企合作中的知识转移机制探析——以浙江金融职业学院会计专业为例[J].知识经济,2017(19):160-161. 被引量：4
2李洪昌,申潞娟,王禹栋.浅议“互联网+”形势下高校思政教育的新方式[J].淮阴师范学院学报（自然科学版）,2017,16(4):352-353. 被引量：4
3邹永潘,李伟,王儒敬.基于多特征的垃圾微博检测方法[J].计算机系统应用,2017,26(10):184-189. 被引量：3
4谭欣欣.地理信息的安全特征综述[J].城市地理,2017,0(9X):89-89. 被引量：1
5王伟.浅谈职业院校体育教学现状及教学改革[J].高考,2017,0(27):292-292. 被引量：2
6滕加文.膝关节镜辅助微创手术治疗老年胫骨内侧平台骨折的疗效[J].世界最新医学信息文摘,2017,17(61):37-37. 被引量：1
7夏欣欣.进展期胃癌术后联合卡培他滨化疗的疗效[J].国际医药卫生导报,2018,24(2):225-227. 被引量：1
8陶杨洋.论城市污水处理在环境保护工程中的重要性[J].锋绘,2017,0(12):48-48.
9王彤,林岩,张烽.广播电视大数据终端系统解决方案[J].电子测试,2018,29(1):79-80.
10关于DFA亚洲最具影响力设计奖[J].世界建筑导报,2017,32(5):34-36.

计算机工程与应用

2018年第5期

浏览历史

内容加载中请稍等...

面向维吾尔文的敏感信息过滤方法研究被引量：6

参考文献9

二级参考文献53

共引文献251

同被引文献68

引证文献6

二级引证文献20

相关作者

相关机构

相关主题

浏览历史

面向维吾尔文的敏感信息过滤方法研究 被引量：6

参考文献9

二级参考文献53

共引文献251

同被引文献68

引证文献6

二级引证文献20

相关作者

相关机构

相关主题

浏览历史

面向维吾尔文的敏感信息过滤方法研究被引量：6