-
题名抗干扰词攻击的免疫垃圾邮件过滤模型
- 1
-
-
作者
王小伟
郭红涛
王中锋
-
机构
郑州大学体育学院现代教育技术中心
华北水利水电学院软件学院
北京市劳动保护科学研究所安全与应急管理研究室
-
出处
《计算机工程与科学》
CSCD
北大核心
2013年第12期173-177,共5页
-
基金
河南省教育厅科学技术研究重点项目(12B520056
13B520253)
郑州大学体育学院青年基金项目(2011C3003)
-
文摘
针对当前基于人工免疫技术的垃圾邮件过滤算法中很少考虑干扰词攻击的情况,提出了一种抗干扰词攻击的免疫垃圾邮件过滤模型训练算法ANWAIS。该算法在基因库生成阶段,采用互信息差值作为评估函数,可以过滤掉垃圾邮件中的好词和正常邮件中的垃圾词,从而使基因库更能反映垃圾邮件的特征;同时,在抗体更新阶段,通过维护丢弃词表,可保证基因库的纯洁性。仿真实验表明,该算法能够比未考虑干扰词攻击的垃圾邮件过滤算法获得更好的抗体质量和更优的分类性能。
-
关键词
人工免疫
干扰词攻击
垃圾邮件过滤
互信息差值
基因库
-
Keywords
artificial immune
noise word attack
spam filter
mutual information difference
gene library
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名中文文本分类的特征选取研究
被引量:2
- 2
-
-
作者
胡鑫
-
机构
西北师范大学数学与信息科学学院
-
出处
《甘肃科技》
2006年第5期119-120,共2页
-
文摘
在自动文本分类系统中,特征选择是有效降低文本向量维数的一种方法。在分析了常用的一些特征选择评价函数的基础上,提出了一个新的评价函数,即互信息差值。实验证明这一方法简单可行,有助于提高所选特征子集的有效性。
-
关键词
计算机应用
文本分类
特征选择
评价函数
互信息差值
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名对贝叶斯文本分类模型的改进
被引量:1
- 3
-
-
作者
王潇
-
机构
仲恺农业技术学院计算机科学与工程学院
-
出处
《现代计算机》
2008年第1期21-23,共3页
-
文摘
在自动文本分类系统中,特征选择是有效降低文本向量维数的一种方法。朴素贝叶斯文本分类模型是一种简单而高效的文本分类模型。提出一个新的评价函数,即互信息差值,将其用于改进的贝叶斯文本分类模型"树桩网络"。结果表明,在大多数数据集上该方法具有良好的分类效果。
-
关键词
文本分类
特征选择
互信息差值
树桩网络
朴素贝叶斯
-
Keywords
Text Categorization
Naive Bayes
Feature Selection
Dispersion of Mutual Information Stump Network
-
分类号
TP391.1
[自动化与计算机技术—计算机应用技术]
-