优化的覆盖算法在文本挖掘中的应用研究被引量：3

Study of the Optimized Covering Algorithm and Its Application in Text Mining

下载PDF

导出

摘要文章首先分析了覆盖算法中存在的两个主要缺点,即由于分类边界的粗糙而造成的测试样本拒识的概率较大以及当所得的覆盖存在交叉时,测试样本的类别确定问题,在此基础上应用基于商空间的粒度计算理论针对覆盖算法中的第二个缺点进行优化,即对覆盖算法中的由于覆盖交叉而误判的样本进行二次识别。通过减小识别样本的粒度,使覆盖粒度在由粗到细的变化过程中,实现对误判样本的渐进识别,在更小的空间上实现对误判样本的二次识别,从而提高了识别率。最后在已进行过预处理的中文文本数据库中使用优化后的覆盖算法,实验结果表明,优化后的方法减少了误判样本的数量,降低了识别样本时的出错率,有效地提高了分类的精度。 The authors analysis two shortcomings of Covering Algorithm, that is, the high rate of refused samples because of the rough boundary of classification and the class which are in the cross of coverage belong to. Based on this, the author apply the granular computing theory based on quotient into the improvement and optimization of the second shortcoming of covering algorithm, that is, classify the misclassified samples because of the cross of coverage again. In the course of decreasing granular from big to small by using the different granular of classifying the samples, the authors classify the misclassified samples gradually and improve the classified correct rate by reduced the misclassified samples in the smaller granular. The authors apply the optimized Covering Algorithm in Chinese Text Database which has been cut into words. The computer experiments show that this method reduce the number of misclassified samples and enhance the accuracy of test samples by decreasing the error rate in the test.

作者周瑛牛浏

机构地区安徽大学管理学院

出处《电脑知识与技术》 2014年第11X期8065-8069,共5页 Computer Knowledge and Technology

基金教育部人文社科基金项目"基于粒度计算理论的文本挖掘技术的研究"(项目编号:11YJA870032)的中期研究成果之一

关键词覆盖交叉粒度计算理论文本挖掘 cross of coverage granular computing theory text mining

分类号 TP391.1 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献4

1周瑛,牛浏.基于粒度计算的覆盖算法在文本挖掘中的应用研究[J].电脑知识与技术（过刊）,2014,20(4X):2548-2552. 被引量：2
2周瑛,张铃.有限混合模型在文本分类中的应用研究[J].计算机技术与发展,2010,20(6):18-20. 被引量：2
3周瑛,刘政怡.覆盖算法在文本分类中的应用[J].情报理论与实践,2006,29(1):115-117. 被引量：7
4李道国,苗夺谦,张东星,张红云.粒度计算研究综述[J].计算机科学,2005,32(9):1-12. 被引量：54

二级参考文献51

1钱铁云,王元珍,冯小年.结合类频率的关联中文文本分类[J].中文信息学报,2004,18(6):30-36. 被引量：12
2李道国,苗夺谦,张东星,张红云.粒度计算研究综述[J].计算机科学,2005,32(9):1-12. 被引量：54
3周瑛,刘政怡.覆盖算法在文本分类中的应用[J].情报理论与实践,2006,29(1):115-117. 被引量：7
4周瑛,张铃.基于概率的覆盖算法的研究[J].计算机技术与发展,2006,16(3):29-30. 被引量：3
5Zhang Ling.A Geometrical Representation of McCullochPitts Neural Model and Its Applications[J].IEEE Trans,on Neural Networks,1999,10(4):925-929.
6Dempster A P,Laird N M,Rubin D B.Maximum likelibood from incomplete data using the EM algorithm(with discus-sion)[J].J.R.Stat.Soc.Sex.B,1977,39:1-38.
7Yao Y Y. Granular computing: basic issues and possible solutions. In: Proc. of the 5th Joint Conf. on Information Sciences,Volume Ⅰ, Atlantic City, New Jersey, USA, February 27-March 3, 2000, P.P. Wang Ed. , Association for Intelligent Machinery, 2000. 186～189
8Zadeh L A. Fuzzy Logic = Computing with Words. IEEE Trans. on Fuzzy Systems, 1996,2: 103～ 111
9Thiele H. On Semantic Models for Investigating Computing with words. In: Second Intl. Conf. on Knowledge Based Intelligent Electronic Systems, Adelaide, No. CL-32-98. 1998
10Pawlak Z. Rough sets. Intl. Journal of Computer and InformationSeience, 1982,11 : 341～356

共引文献59

1尹一麒,苗夺谦,李道国.分体策略在差别矩阵优化中的应用[J].小型微型计算机系统,2007,28(2):292-296. 被引量：3
2刘慧婷,倪志伟,李建洋,刘政怡.基于交叉覆盖算法的时间序列模式匹配[J].计算机应用,2007,27(2):425-427. 被引量：8
3王文军.基于模糊商空间理论的文本聚类研究[J].科技情报开发与经济,2007,17(6):181-182.
4王树锋,吴耿锋,潘建国.基于粗糙集的知识粒度及粒度关系研究[J].计算机工程与应用,2007,43(14):38-41. 被引量：5
5修保新,张维明,刘忠,阳东升.基于粒度计算和面向使命的组织适应性设计方法[J].计算机科学,2007,34(5):166-170. 被引量：2
6修保新,张维明,刘忠,阳东升.基于粒度计算和遗传算法的C2组织结构设计方法[J].自然科学进展,2007,17(5):662-671. 被引量：15
7程昳,苗夺谦,冯琴荣.基于模糊粗糙集的粒度计算[J].计算机科学,2007,34(7):142-145. 被引量：4
8修保新,张维明,刘忠,阳东升.C2组织结构的适应性设计方法[J].系统工程与电子技术,2007,29(7):1102-1108. 被引量：16
9蒙祖强,史忠植.粒度世界拓扑结构的理论研究[J].控制与决策,2007,22(9):1017-1021. 被引量：1
10王文军.基于商空间理论的高校教师综合素质评价模型[J].上海工程技术大学学报,2007,21(1):61-64. 被引量：4

同被引文献23

1张旻,张铃,程家兴.一种加权的构造型神经网络覆盖算法设计与实现[J].计算机工程,2005,31(2):36-38. 被引量：3
2吕敬祥,彭敏放,曹铁军.遗传BP网络在模拟电路故障诊断的应用[J].自动化与仪表,2005,20(1):4-6. 被引量：10
3张铃,张钹.神经网络中BP算法的分析[J].模式识别与人工智能,1994,7(3):191-195. 被引量：58
4宋杰,程家兴,许中卫,周瑛.一种改进的贪婪式覆盖算法[J].计算机技术与发展,2006,16(8):113-115. 被引量：6
5杭秋丽.模拟电路故障诊断的BP神经网络实现[J].科技创新导报,2009,6(6):9-10. 被引量：4
6张铃,张钹.M-P神经元模型的几何意义及其应用[J].软件学报,1998,9(5):334-338. 被引量：135
7叶笠,王厚军,叶芃.基于节点电压增量向量和模糊数学的模拟电路故障诊断方法[J].电子测量与仪器学报,2009,23(8):14-19. 被引量：5
8祝文姬,何怡刚.基于遗传BP网络的模拟电路故障诊断方法及其应用[J].计算机辅助设计与图形学学报,2009,21(9):1283-1289. 被引量：19
9张月琴,段霄鹏.基于商空间的构造性数据挖掘方法的应用研究[J].微计算机信息,2010,26(33):131-133. 被引量：1
10吴涛,张方方.基于特征选择的多侧面覆盖算法[J].计算机应用,2011,31(5):1318-1320. 被引量：4

引证文献3

1丁伟聪,李志华,裴杰才.基于覆盖算法的模拟电路故障诊断方法[J].计算机与现代化,2017(1):36-40. 被引量：3
2陈博文,李志华,黄颖.点对主分量分析算法的模拟电路故障诊断研究[J].电子设计工程,2017,25(7):126-129. 被引量：2
3陈欣,李志华,刘自鹏.基于重复覆盖算法的模拟电路故障诊断研究[J].信息技术,2018,42(2):11-14.

二级引证文献4

1苗俊,袁齐坤,刘立文,尤志鹏,王璋.基于动态贝叶斯网络的机器人巡检线路故障方法研究[J].电子设计工程,2020,28(9):184-188. 被引量：4
2董晶.模拟电路优化设计理论与关键技术研究[J].电子测试,2022(4):116-118.
3江奕君.模拟电路优化设计关键技术探讨[J].通信电源技术,2023,40(3):246-248.
4张少瑶,孙建红,宋柄翰.融合小波包分解和CSA的电路故障诊断方法[J].电路与系统,2018,7(2):50-57.

1周瑛,牛浏.基于粒度计算的覆盖算法在文本挖掘中的应用研究[J].电脑知识与技术（过刊）,2014,20(4X):2548-2552. 被引量：2
2高平安,蒙祖强,蔡自兴.基于粒度计算的数据分类建模研究[J].计算机应用研究,2007,24(3):37-40. 被引量：2
3汪建,方洪鹰.粒度计算与图像匹配技术改进[J].电脑知识与技术,2013,9(11X):7571-7574. 被引量：1
4周正国.一种新的覆盖粗糙集度量方法[J].计算机工程,2012,38(6):78-79. 被引量：1
5王文剑,郭虎升.粒度支持向量机学习模型[J].山西大学学报（自然科学版）,2009,32(4):535-540. 被引量：9
6高平安,蔡自兴,蒙祖强.数据分类中的粒度计算[J].计算机工程,2007,33(14):41-42. 被引量：1
7蒋黎黎,梁坤,叶爽.基于粒度计算理论的知识融合模型研究[J].计算机应用研究,2012,29(10):3697-3700. 被引量：10
8庞继芳,梁吉业.不完备决策表中的粒度思想[J].电脑开发与应用,2006,19(2):9-11. 被引量：2
9计算机科学技术——计算机科学技术基础学科[J].中国学术期刊文摘,2007,13(4):176-181.
10高平安,蔡自兴,蒙祖强.基于粒度计算理论的数据分类建模[J].计算机工程与应用,2006,42(19):14-16. 被引量：1

电脑知识与技术

2014年第11X期

浏览历史

内容加载中请稍等...

优化的覆盖算法在文本挖掘中的应用研究被引量：3

参考文献4

二级参考文献51

共引文献59

同被引文献23

引证文献3

二级引证文献4

相关作者

相关机构

相关主题

浏览历史

优化的覆盖算法在文本挖掘中的应用研究 被引量：3

参考文献4

二级参考文献51

共引文献59

同被引文献23

引证文献3

二级引证文献4

相关作者

相关机构

相关主题

浏览历史

优化的覆盖算法在文本挖掘中的应用研究被引量：3