基于Nesterov平滑的高阶路径朴素贝叶斯文本隐式分类研究被引量：2

On High Order Path Naive Bayes Text Classification Based on Nesterov Smoothing

下载PDF

导出

摘要为提高电子文本分类效果,解决独立同分布模型在标记数据不足时存在的参数估计问题,提出了一种基于Nesterov平滑的高阶路径朴素贝叶斯文本分类算法.首先,利用传统意义的朴素贝叶斯事件模型构建高阶路径形式的文本分类模型,利用高阶路径中的隐式链接信息来提高文本分类模型的性能;其次,针对朴素贝叶斯事件模型中采用拉普拉斯平滑的二阶差分过程容易产生信息丢失、噪声增强的问题,提出基于Nesterov平滑的高阶路径朴素贝叶斯文本分类改进算法;最后,通过基准数据集和图书馆电子文本分类实验,验证了所提算法的有效性. In order to improve the classification effect of electronic text,and to solve the problem of parameter estimation in insufficient labeled data,a new method of text classification based on Nesterov smoothing has been proposed.Firstly,the text classification model based on the traditional meaning of naive Bayesian event model is constructed,which can improve the performance of text classification model with implicit link information in higher order path;Secondly,according to the naive Bayes model for events in the Laplacian smoothing of second order difference process tends to result in information loss and noise generated on the strengthening of the role of the problem,the Nesterov smooth high order path naive Bayes text classification algorithm has been put forward;Finally,the effectiveness of the proposed algorithm is verified by the benchmark data set and the electronic text classification experiment of the library.

作者邓广彪黄振功岳晓光 DENG Guang-biao;HUANG Zheng-gong;YUE Xiao-guang(School of Mathematics and Computer Sciences,Guangxi Normal University for Nationalities,Chongzuo guangxi 532200,China;Department of Engineering Management,Wuhan University,Wuhan 430070,China)

机构地区广西民族师范学院数学与计算机科学学院武汉大学工程管理系

出处《西南师范大学学报（自然科学版）》 CAS 北大核心 2018年第7期107-112,共6页 Journal of Southwest China Normal University(Natural Science Edition)

基金 2015年度广西高校科学技术研究项目(KY2015LX539)

关键词文本分类 Nesterov平滑高阶路径朴素贝叶斯图书馆文本 text categorization Nesterov smoothing higher order path plain Bias library text

分类号 TP391 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献7

1贺鸣,孙建军,成颖.基于朴素贝叶斯的文本分类研究综述[J].情报科学,2016,34(7):147-154. 被引量：70
2刘鼎甲,刘国华,刘泽权,王伟.面向文本语料库的数据模型及其查询问题[J].小型微型计算机系统,2015,36(8):1711-1716. 被引量：2
3徐光美,刘宏哲,张敬尊,王金华.用平滑方法改进多关系朴素贝叶斯分类[J].计算机工程与应用,2017,53(5):69-72. 被引量：9
4黄少滨,杨欣欣,吕天阳,郑纬民.基于理想点的星型高阶联合聚类一致融合策略[J].计算机学报,2015,38(7):1460-1472. 被引量：2
5卢玲,杨武,刘恒洋.差错网络的文本分类反馈校正方法[J].重庆邮电大学学报（自然科学版）,2014,26(6):790-795. 被引量：1
6张鹏,唐世渭.朴素贝叶斯分类中的隐私保护方法研究[J].计算机学报,2007,30(8):1267-1276. 被引量：19
7杨月华,杜军平,平源.基于本体的智能信息检索系统[J].软件学报,2015,26(7):1675-1687. 被引量：52

二级参考文献122

1宋枫溪,高秀梅,刘树海,杨静宇.统计模式识别中的维数削减与低损降维[J].计算机学报,2005,28(11):1915-1922. 被引量：44
2张鹏,童云海,唐世渭,杨冬青,马秀莉.一种有效的隐私保护关联规则挖掘方法[J].软件学报,2006,17(8):1764-1774. 被引量：53
3廖述梅.基于本体的语义标注原型评述[J].计算机工程与科学,2006,28(9):123-125. 被引量：16
4刘华.基于关键短语的文本分类研究[J].中文信息学报,2007,21(4):34-41. 被引量：14
5Verykios V S,Bertino E,Fowno I N,Provenza L P,Saygin Y,Theodoridis Y.State-of-the-art in privacy preserving data mining.SIGMOD Record,2004,33(1):50-57
6Agrawal R,Srikant R.Privacy-preserving data mining//Proceedings of the 2000 ACM SIGMOD Conference on Management of Data.Dallas,Texas,USA,2000:439-450
7Evfimievski A.Randomization in privacy preserving data mining.SIGKDD Explorations,2002,4(2):43-48
8Agrawal D,Aggarwal C C.On the design and quantification of privacy preserving data mining algorithms//Proceedings of the 20th ACM Symposium on Principles of Database Systems.Santa Barbara,California,USA,2001:247-255
9Du W L,Zhan Z J.Using randomized response techniques for privacy-preserving data mining//Proceedings of the 9th ACM SIGKDD International Conference on Knowledge Discovery and Data Mining.Washington DC,USA,2003:505-510
10Rizvi S J,Haritsa J R.Maintaining data privacy in association rule mining//Proceedings of the 28th International Conference on Very Large Data Bases.Hong Kong,China,2002:682-693

共引文献148

1余本功,曹雨蒙,陈杨楠,杨颖.基于nLD-SVM-RF的短文本分类研究[J].数据分析与知识发现,2020,4(1):111-120. 被引量：10
2李宗福,李阳,李昂,陈康.基于Hadoop与机器学习的舆情分析与应用[J].计算机应用研究,2020,37(S01):43-46. 被引量：1
3鲁芳,仲伟俊,张玉林.基于数值转换的隐私保护线性回归方法[J].系统工程学报,2010,25(4):444-450.
4杨震,范科峰,雷建军.隐私保护的自适应垃圾邮件过滤方法研究[J].通信学报,2009,30(S1):145-149. 被引量：2
5张雯,张化祥.属性加权的朴素贝叶斯集成分类器[J].计算机工程与应用,2010,46(29):144-146. 被引量：10
6方炜炜,杨炳儒,杨君,周长胜.基于隐私保护的决策树模型[J].模式识别与人工智能,2010,23(6):766-771. 被引量：2
7方炜炜,任江,夏红科.异构分布的多元线性回归隐私保护模型[J].计算机研究与发展,2011,48(9):1685-1692. 被引量：11
8王关嵩,钱桂生,杨晓静.一氧化碳对大鼠肺动脉平滑肌细胞[Ca^(2+)]、cAMP、cGMP的作用[J].第三军医大学学报,2000,22(5):417-419. 被引量：6
9方炜炜,杨炳儒,夏红科.基于SMC的隐私保护聚类模型[J].系统工程与电子技术,2012,34(7):1505-1510. 被引量：11
10钱萍,吴蒙.物联网隐私保护研究与方法综述[J].计算机应用研究,2013,30(1):13-20. 被引量：37

同被引文献26

1李凯,李昆仑,崔丽娟.模型聚类及在集成学习中的应用研究[J].计算机研究与发展,2007,44(z2):203-207. 被引量：7
2李亚君,朱淑南,高源,宋进英.采编业务深加工外包中出现的问题与解决对策——以河北理工大学图书馆汇文系统为例[J].图书馆建设,2010(7):65-68. 被引量：3
3黄玮.高校图书馆编目业务外包质量控制研究[J].图书馆工作与研究,2010(8):70-72. 被引量：22
4过仕明,李晓辉.图书馆图书批量验收系统的设计与实现[J].情报科学,2010,28(10):1513-1516. 被引量：3
5王晓丹,郑朔,曾家琳.高校图书馆外包图书编目数据审校及验收[J].中华医学图书情报杂志,2010,19(11):45-46. 被引量：7
6蒋鸿标.新形势下高校图书馆服务功能定位研究——对编目业务外包的反思[J].图书馆,2012(1):136-138. 被引量：15
7杨敏,谷俊.基于SVM的中文书目自动分类及应用研究[J].图书情报工作,2012,56(9):114-119. 被引量：17
8周莉.图书馆编目外包未来走向探析[J].图书馆建设,2012(6):81-84. 被引量：19
9卢章平,袁润,王正兴.发现服务:大学与研究机构图书馆的趋势[J].中国图书馆学报,2014,40(3):20-26. 被引量：46
10武烨.多书商环境下编目外包组织协调与质量控制[J].医学信息学杂志,2014,35(7):83-85. 被引量：3

引证文献2

1周聪,张德林.基于机器学习的图书智能采编模式的构建[J].中华医学图书情报杂志,2018,27(12):43-49. 被引量：6
2钟熙,孙祥娥.基于Kmeans++聚类的朴素贝叶斯集成方法研究[J].计算机科学,2019,46(B06):439-441. 被引量：26

二级引证文献32

1贾犇,钟建伟,戴小剑,田波,龙玉雪,解国伦.基于K-means聚类与支持向量机相结合的短期负荷预测[J].数字技术与应用,2019,37(8):72-74. 被引量：1
2唐啸虎,刘志锋.基于改进的k-means算法的新闻聚类的研究[J].电脑知识与技术,2020,16(10):201-203. 被引量：1
3刘路.基于机器学习的数字图书馆智能化服务模式研究[J].河南图书馆学刊,2020,40(4):99-101. 被引量：4
4杨霖,刘博文,王松,田丰,范莹,陶诗洋.GIS金属突出物缺陷局部放电发展全过程的严重程度评估[J].高压电器,2020,56(6):100-106. 被引量：7
5李欣,张童,厚佳琪,张子昊.基于深度学习的多角度人脸检测方法研究[J].计算机技术与发展,2020,30(9):12-17. 被引量：3
6陈鹏,郭小燕.基于LSTM-Attention的农业短文本信息分类研究[J].软件导刊,2020,19(9):21-26. 被引量：2
7黄亚峰,何威,吴光琴,李丹.基于K-means++和LSTM网络的光伏功率预测研究[J].电气自动化,2020,42(5):25-27. 被引量：9
8李明.基于朴素贝叶斯的重力感应电子秤定载荷点选择[J].机械与电子,2020,38(10):43-47. 被引量：2
9黄勃,陈欢,方志军,王明胜,刘文竹.基于微博的COVID-19热点话题分析[J].武汉大学学报（理学版）,2020,66(5):425-432. 被引量：7
10热依汗古丽·卡森木,木特力铺·马木提,吾尔尼沙·买买提,阿力木江·艾沙,库尔班·吾布力.基于Ridgelet变换的多文种文档图像文种识别[J].计算机工程与设计,2020,41(11):3137-3142.

1覃幸新,王荣波,黄孝喜,谌志群.基于多权值的SlopeOne协同过滤算法[J].数据分析与知识发现,2017,1(6):65-71. 被引量：4
2赵彩迪,朱有产,符佳慧.基于MapReduce的朴素贝叶斯垃圾短信过滤研究[J].计算机科学与应用,2016,6(7):443-450.
3张月,王睿.光电探测器脉冲相关噪声增强效应研究[J].光电技术应用,2018,33(1):24-29. 被引量：5
4漆原,乔宇.针对朴素贝叶斯文本分类方法的改进[J].电子科学技术,2017,4(5):114-116. 被引量：3
5邢飞,李浪,刘明,段鑫,龙也,项舟.帕金森病合并髋部骨折的围手术期治疗进展[J].中国修复重建外科杂志,2018,32(8):1032-1037. 被引量：2
6杜少波.基于Hadoop平台的并行kNN网络舆情分类算法[J].电视技术,2018,42(3):58-62. 被引量：3
7王思俭.老师，我为什么懂而不会——推理与证明篇[J].新高考（高三数学）,2018,0(4):13-15.
8彭子成.噪声作用对链霉素在内耳不同结构含量的影响[J].国际耳鼻咽喉头颈外科杂志,1986,26(6):366-367.
9周兴旺,钟吉玉.加性脉冲噪声驱动的线性分数阶调和振子的扩散（英文）[J].四川大学学报（自然科学版）,2017,54(5):929-934.
10姜培华.两参数逆威布尔分布顺序统计量的矩及渐近分布[J].南通大学学报（自然科学版）,2018,17(1):75-80. 被引量：1

西南师范大学学报（自然科学版）

2018年第7期

浏览历史

内容加载中请稍等...

基于Nesterov平滑的高阶路径朴素贝叶斯文本隐式分类研究被引量：2

参考文献7

二级参考文献122

共引文献148

同被引文献26

引证文献2

二级引证文献32

相关作者

相关机构

相关主题

浏览历史

基于Nesterov平滑的高阶路径朴素贝叶斯文本隐式分类研究 被引量：2

参考文献7

二级参考文献122

共引文献148

同被引文献26

引证文献2

二级引证文献32

相关作者

相关机构

相关主题

浏览历史

基于Nesterov平滑的高阶路径朴素贝叶斯文本隐式分类研究被引量：2