A formal study of feature selection in text categorization
被引量:15
A formal study of feature selection in text categorization
出处
《通讯和计算机(中英文版)》
2009年第4期32-41,共10页
Journal of Communication and Computer
关键词
特征分类
约束
文本分类
信息
feature selection
text categorization
constraints
同被引文献86
-
1杨志恒.基于Ward法的区域空间聚类分析[J].中国人口·资源与环境,2010,20(S1):382-386. 被引量:49
-
2陈曦,李翔晨,李炜,楼宗元.基于信息熵的谣言信息度量方法[J].华中科技大学学报(自然科学版),2013,41(S1):413-417. 被引量:5
-
3蒋芸,李战怀,张强,刘扬.一种基于粗糙集构造决策树的新方法[J].计算机应用,2004,24(8):21-23. 被引量:30
-
4王静红,王熙照,邵艳华,王伍伶.决策树算法的研究及优化[J].微机发展,2004,14(9):30-32. 被引量:31
-
5倪春鹏,王正欧.一种新型决策树属性选择标准[J].武汉科技大学学报,2004,27(4):437-440. 被引量:10
-
6刘涛,吴功宜,陈正.一种高效的用于文本聚类的无监督特征选择算法[J].计算机研究与发展,2005,42(3):381-386. 被引量:37
-
7朱六兵,唐德波,杨斌.基于粗糙集信息观的决策表属性约简方法[J].信息技术,2006,30(1):46-49. 被引量:6
-
8楚扬杰,王先甲,方德斌,吴秀君.基于粗糙集相关矩阵的属性约简算法[J].武汉理工大学学报,2006,28(2):81-83. 被引量:10
-
9陈晓云,李荣陆,胡运发.基于最小词频阈值的文档特征选择[J].模式识别与人工智能,2006,19(4):531-537. 被引量:7
-
10CUI Zifeng,XU Baowen,ZHANG Weifeng,XU Junling.A New Approach of Feature Selection for Text Categorization[J].Wuhan University Journal of Natural Sciences,2006,11(5):1335-1339. 被引量:6
引证文献15
-
1朱颢东,李红婵,钟勇.新颖的无监督特征选择方法[J].电子科技大学学报,2010,39(3):412-415. 被引量:4
-
2朱颢东,陈宁,李红婵.优化的互信息特征选择方法[J].计算机工程与应用,2010,46(26):122-124. 被引量:10
-
3胡强.优化的互信息特征选择方法[J].湖南师范大学自然科学学报,2010,33(3):28-31. 被引量:1
-
4周瑞琼,朱颢东,吴洪丽.基于两种特征贡献度的特征选择[J].河南科技大学学报(自然科学版),2010,31(5):44-47.
-
5史岳鹏,朱颢东.基于类别相关性和优化的ID3特征选择[J].数据采集与处理,2011,26(2):230-234. 被引量:3
-
6朱颢东,李红婵.基于互信息和粗糙集理论的特征选择[J].计算机工程,2011,37(15):181-183. 被引量:9
-
7张文鹏,李红婵,王兴.结合类内集中度和最小集合覆盖的特征选择[J].计算机工程与应用,2011,47(28):124-127.
-
8王兴,张文鹏.基于特征辨别能力和元信息的特征选择[J].计算机工程与应用,2012,48(7):128-131.
-
9董元元,陈基漓,唐小侠.基于潜在狄利克雷分配模型和互信息的无监督特征选取法[J].计算机应用,2012,32(8):2250-2252. 被引量:3
-
10邬开俊,鲁怀伟.采用并行协同进化遗传算法的文本特征选择[J].系统工程理论与实践,2012,32(10):2215-2220. 被引量:11
二级引证文献56
-
1王义,戴月明.基于混合互信息算法的文本情感分析[J].计算机应用研究,2020,37(2):337-341.
-
2范会联,仲元昌,胡江坤,贾年龙.带信息熵反馈机制的免疫克隆文本聚类算法[J].郑州大学学报(理学版),2011,43(1):46-49. 被引量:1
-
3杨杨,刘会东.一种基于成对约束的特征选择改进算法[J].南京师范大学学报(工程技术版),2011,11(1):56-61.
-
4陈炎龙,段红玉.基于类间分散度和类内集中度的文本特征选择[J].计算机与数字工程,2012,40(7):6-8.
-
5徐立萍,姜志旺.基于粗糙集及信息增益的数据挖掘预测算法[J].中国科技论文,2012,7(7):552-555. 被引量:5
-
6刘海峰,陈琦,张以皓.一种基于互信息的改进文本特征选择[J].计算机工程与应用,2012,48(25):1-4. 被引量:15
-
7闫巧,冷成朝.基于信息增益的混合垃圾邮件特征选择方法[J].计算机工程与应用,2012,48(27):90-93. 被引量:1
-
8郭晓冬,姜昱明,费非.文本特征选择方法的改进算法[J].吉林大学学报(信息科学版),2012,30(5):544-548. 被引量:3
-
9符红霞,黄成兵.采用特征分辨率和等价类相关矩阵的特征选择[J].科学技术与工程,2012,20(34):9234-9237. 被引量:1
-
10郑麟.基于贡献因子的改进决策树属性选择方法[J].汕头大学学报(自然科学版),2013,28(1):64-70.
-
1安艳辉,董五洲,游自英.基于改进的朴素贝叶斯文本分类研究[J].河北省科学院学报,2007,24(1):22-25. 被引量:7
-
2Yan Peng,Zheng Xuefeng,Zhu Jianyong,Xiao Yunhong.Lazy learner text categorization algorithm based on embedded feature selection[J].Journal of Systems Engineering and Electronics,2009,20(3):651-659. 被引量:1
-
3CUI Zifeng,XU Baowen,ZHANG Weifeng,XU Junling.A New Approach of Feature Selection for Text Categorization[J].Wuhan University Journal of Natural Sciences,2006,11(5):1335-1339. 被引量:6
-
4SHIYong-feng ZHAOYan-ping.Comparison of Text Categorization Algorithms[J].Wuhan University Journal of Natural Sciences,2004,9(5):798-804. 被引量:4
-
5李雪岩,孙济庆.一个结合信息相关性分析的快速文本分类模型[J].计算机应用与软件,2004,21(11):12-13.
-
6WANG Hua-yong CHEN Yu DAI Yi-qi.A Text Categorization System with Soft Real-Time Guarantee[J].Wuhan University Journal of Natural Sciences,2006,11(1):226-229. 被引量:1
-
7程学旗,谭松波,Lilian Tang.Using DragPushing to Refine Concept Index for Text Categorization[J].Journal of Computer Science & Technology,2006,21(4):592-596.
-
8Pei Zhili,Shi Xiaohu,Maurizio Marchese,Liang Yanchun.An enhanced text categorization method based on improved text frequency approach and mutual information algorithm[J].Progress in Natural Science:Materials International,2007,17(12):1494-1500. 被引量:2
-
9Min DU,Xing-shu CHEN.Accelerated k-nearest neighbors algorithm based on principal component analysis for text categorization[J].Journal of Zhejiang University-Science C(Computers and Electronics),2013,14(6):407-416. 被引量:3
-
10王飞,李彩虹,王景山,徐娇,李廉.A Two-Stage Feature Selection Method for Text Categorization by Using Category Correlation Degree and Latent Semantic Indexing[J].Journal of Shanghai Jiaotong university(Science),2015,20(1):44-50. 被引量:2
;