样本-属性加权的朴素贝叶斯改进算法

Sample-attribute weighted improved naive Bayesian algorithm

下载PDF

导出

摘要朴素贝叶斯算法是一种简单、高效且有着广泛应用的分类方法,但在现实中,条件独立性假设影响了其分类性能。为克服该问题,给出一种改进算法——样本-属性加权的朴素贝叶斯算法。首先,对属性计算相关系数得到属性权值;其次,利用属性权结合信息熵获得样本熵权,并据此加权样本以提高泛化能力;然后,给出了样本-属性加权的朴素贝叶斯算法;最后,在UCI数据集上的实验结果验证了改进算法比原算法具有更好的分类性能。 Naive Bayesian algorithm is a simple , efficient and widely used classification method , but the conditional indepen-dence assumption affects it ’ s classification performance in reality . The paper gives an improved algorithm---sample-attribute weighted naive Bayesian algorithm in order to overcome this problem . Firstly , the correlation coefficients of all attributes have been calculated to obtain attribute-weight . Secondly , attribute-weight and information entropy have been combined to get sample-en-tropy-weight , the samples have been weighted according it to enhance the generalization ability . Then , sample-attribute weighted naive Bayesian algorithm has been proposed . Finally , the experimental results on UCI data sets prove that the improved algorithm has got better classification performance than the original algorithm .

作者曾文赋

机构地区福建省福州第一中学

出处《微型机与应用》 2014年第6期62-63,67,共3页 Microcomputer & Its Applications

关键词朴素贝叶斯样本-属性加权条件独立性假设 naive Bayesian sample-attribute weighted conditional independence assumption

分类号 TP391 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献5

1宫秀军,刘少辉,史忠植.一种增量贝叶斯分类模型[J].计算机学报,2002,25(6):645-650. 被引量：55
2张继国,朱永忠.模糊性的信息熵度量[J].河海大学常州分校学报,2001,15(4):16-21. 被引量：8
3张丽伟,段禅伦,熊志伟,吴昊.朴素贝叶斯方法在中医证候分类识别中的应用研究[J].内蒙古大学学报（自然科学版）,2007,38(5):568-571. 被引量：13
4潘志方.基于朴素贝叶斯学习的电子商务网站客户兴趣分类的应用研究[J].计算机科学,2007,34(6):214-215. 被引量：4
5刘青,何政.结合EM算法的朴素贝叶斯方法在中文网页分类上的应用[J].计算机工程与科学,2005,27(7):65-66. 被引量：4

二级参考文献21

1吴昊,段禅伦,熊志伟,张利伟.粗糙集理论在中医诊断学中的应用研究[J].内蒙古大学学报（自然科学版）,2006,37(3):351-355. 被引量：4
2曹渝昆,李云峰,汪成亮,周明强.改进型模糊神经网络在顾客分类中的应用研究[J].计算机工程与应用,2006,42(19):218-221. 被引量：2
3张继国,张文修.模糊随机变量及其概率分布[J].模糊系统与数学,1996,10(4):76-82. 被引量：5
4龚燕冰,倪青,王永炎.中医证候研究的现代方法学述评(一)——中医证候数据挖掘技术[J].北京中医药大学学报,2006,29(12):797-801. 被引量：96
5宫秀军史忠植.基于贝叶斯潜在语义模型的半监督Web挖掘[J].软件学报，已录用,.
6ChengXiang Zhai .A Note on the Expectation-Maximization (EM) Algorithm[A] .10th Int'l Conf on Information and Knowledge Management (CIKM 2001)[C].2001.403-410.
7B Shahshahani,D Landgrebe.The Elect of Unlabeled Samples in Reducing the Small Sample Size Problem and Mitigrating the Hughes Pheonomenon[J].IEEE Trans on Geoscience and Remote Sensing,1994 ,32(5):1087-1095.
8T Zhang,F Oles.A Probability Analysis on the Value of Unlabeled Data for Classification Problems[A].Proc of the 17th Int'l Conf on Machine Learning(ICML 2000)[C].2000.1191-1198.
9Kamal Nigamy,Andrew Kachites Mccallumzy,Sebastian Thruny,et al.Text Classification from Labeled and Unlabeled Documents Using EM [M].Boston:Kluwer Academic Publishers,2000.
10Seong-Bae Park,Byoung-Tak Zhang .Automatic Webpage Classification Enhanced by Unlabeled Data[A].IDEAL 2003.LNCS 2690[C].2003.821-825.

共引文献78

1田少磊,朱玲,王映辉,张竹绿,于琦,于彤,吴恙,郑婉婷,李敬华.面向基层医疗的云端智慧中医门诊系统构建与应用[J].世界科学技术-中医药现代化,2023,25(7):2287-2296. 被引量：2
2姜卯生,王浩,姚宏亮.朴素贝叶斯分类器增量学习序列算法研究[J].计算机工程与应用,2004,40(14):57-59. 被引量：10
3杨森,徐海涛,柴乔林.应用支持向量机实现增量入侵检测[J].计算机工程与应用,2004,40(27):142-143. 被引量：1
4张晓辉,李莹,常桂然,赵宏.适于Internet新闻文本实时分类的动态向量空间模型DVSM[J].计算机科学,2004,31(6):64-67. 被引量：1
5李家春,李之棠.分布式入侵告警关联分析[J].计算机研究与发展,2004,41(11):1919-1923. 被引量：6
6彭昭,王文辉,周东华.混杂系统元件故障的半定性辨识[J].清华大学学报（自然科学版）,2005,45(1):111-114. 被引量：1
7王利民,苑森淼.具有抗噪音能力的增量式混合贝叶斯网络[J].仪器仪表学报,2005,26(3):221-225. 被引量：1
8钱玲飞,刘玉树,李侃.朴素贝叶斯分类器在地形评估中的应用方法[J].计算机工程与应用,2005,41(12):189-191. 被引量：6
9王小英,赵海,林涛,张文波,尹震宇.基于信任的普适计算服务选择模型[J].通信学报,2005,26(5):1-8. 被引量：17
10胡学钢,郭亚光.一种基于粗糙集的朴素贝叶斯分类算法[J].合肥工业大学学报（自然科学版）,2006,29(2):169-172. 被引量：11

1邓桂骞,赵跃龙,刘霖,王元华.一种优化的贝叶斯分类算法[J].计算机测量与控制,2012,20(1):199-201. 被引量：14
2杨忠强,秦亮曦.一种基于属性加权的朴素贝叶斯改进算法[J].广西大学学报（自然科学版）,2013,38(5):1157-1161. 被引量：2
3张春,郭明亮.大数据环境下朴素贝叶斯分类算法的改进与实现[J].北京交通大学学报,2015,39(2):35-41. 被引量：13
4杨忠强,秦亮曦.一种基于维规约的属性加权朴素贝叶斯算法[J].信息技术,2013,37(12):31-33.
5黄宇达,王迤冉.基于朴素贝叶斯与ID3算法的决策树分类[J].计算机工程,2012,38(14):41-43. 被引量：19
6王峻.一种基于强属性限定的贝叶斯分类模型[J].计算机技术与发展,2007,17(2):205-207. 被引量：1
7俞杰,丁晓剑,崔鹏.关联规则挖掘以改进朴素贝叶斯[J].舰船电子工程,2016,36(5):112-117. 被引量：1
8顾元祥.二级属性文法与二级属性计算[J].计算机应用与软件,1990,7(2):23-31.
9陈凯星,陈建英.一种改进的基于朴素贝叶斯算法的垃圾短信过滤技术[J].福建电脑,2014,30(3):42-43. 被引量：1
10陈朝大,梁柱勋,郑士基.一种利用关联规则的改进朴素贝叶斯分类算法[J].计算机系统应用,2010,19(11):106-109. 被引量：7

微型机与应用

2014年第6期

浏览历史

内容加载中请稍等...

样本-属性加权的朴素贝叶斯改进算法

参考文献5

二级参考文献21

共引文献78

相关作者

相关机构

相关主题

浏览历史