针对特征权重难以准确量化的问题,提出一种基于灰狼优化(grey wolf optimizer, GWO)算法和鸟群算法(bird swarm algorithm, BSA)的混合算法,用于特征权重的寻优。首先,将Chebyshev映射、反向学习与精英策略用于混合算法的初始种群生成;...针对特征权重难以准确量化的问题,提出一种基于灰狼优化(grey wolf optimizer, GWO)算法和鸟群算法(bird swarm algorithm, BSA)的混合算法,用于特征权重的寻优。首先,将Chebyshev映射、反向学习与精英策略用于混合算法的初始种群生成;其次,将改进后的GWO算法位置更新策略融入BSA的觅食行为中,得到一种新的局部搜索策略;然后,将BSA的警觉行为与飞行行为用作混合算法的全局搜索平衡策略,从而得到一种收敛的灰狼-鸟群算法(grey wolf and bird swarm algorithm, GWBSA),通过GWBSA的迭代寻优可获得各特征的权重值。利用标准测试函数和标准分类数据集进行了对比实验,与遗传算法、蚁狮算法等方法相比,GWBSA具有较快的收敛速度且不易陷入局部最优,可以提高模式分类问题的求解质量。展开更多
文本表示是使用分类算法处理文本时必不可少的环节,文本表示方法的选择对最终的分类精度起着至关重要的作用。针对经典的特征权重计算方法TFIDF(Term Frequency and Inverted Document Frequency)中存在的不足,提出了一种基于信息熵理...文本表示是使用分类算法处理文本时必不可少的环节,文本表示方法的选择对最终的分类精度起着至关重要的作用。针对经典的特征权重计算方法TFIDF(Term Frequency and Inverted Document Frequency)中存在的不足,提出了一种基于信息熵理论的特征权重算法ETFIDF(Entropy based TFIDF)。ETFIDF不仅考虑特征项在文档中出现的频率及该特征项在训练集中的集中度,而且还考虑该特征项在各个类别中的分散度。实验结果表明,采用ETFIDF计算特征权重可以有效地提高文本分类性能,对ETFIDF与特征选择的关系进行了较详细的理论分析和实验研究。实验结果表明,在文本表示阶段考虑特征与类别的关系可以更为准确地表示文本;如果综合考虑精度与效率两个方面因素,ETFIDF算法与特征选择算法一起采用能够得到更好的分类效果。展开更多
文摘针对特征权重难以准确量化的问题,提出一种基于灰狼优化(grey wolf optimizer, GWO)算法和鸟群算法(bird swarm algorithm, BSA)的混合算法,用于特征权重的寻优。首先,将Chebyshev映射、反向学习与精英策略用于混合算法的初始种群生成;其次,将改进后的GWO算法位置更新策略融入BSA的觅食行为中,得到一种新的局部搜索策略;然后,将BSA的警觉行为与飞行行为用作混合算法的全局搜索平衡策略,从而得到一种收敛的灰狼-鸟群算法(grey wolf and bird swarm algorithm, GWBSA),通过GWBSA的迭代寻优可获得各特征的权重值。利用标准测试函数和标准分类数据集进行了对比实验,与遗传算法、蚁狮算法等方法相比,GWBSA具有较快的收敛速度且不易陷入局部最优,可以提高模式分类问题的求解质量。
文摘文本表示是使用分类算法处理文本时必不可少的环节,文本表示方法的选择对最终的分类精度起着至关重要的作用。针对经典的特征权重计算方法TFIDF(Term Frequency and Inverted Document Frequency)中存在的不足,提出了一种基于信息熵理论的特征权重算法ETFIDF(Entropy based TFIDF)。ETFIDF不仅考虑特征项在文档中出现的频率及该特征项在训练集中的集中度,而且还考虑该特征项在各个类别中的分散度。实验结果表明,采用ETFIDF计算特征权重可以有效地提高文本分类性能,对ETFIDF与特征选择的关系进行了较详细的理论分析和实验研究。实验结果表明,在文本表示阶段考虑特征与类别的关系可以更为准确地表示文本;如果综合考虑精度与效率两个方面因素,ETFIDF算法与特征选择算法一起采用能够得到更好的分类效果。