期刊文献+
共找到217篇文章
< 1 2 11 >
每页显示 20 50 100
融合特征权重与改进粒子群优化的特征选择算法
1
作者 刘振超 苑迎春 +1 位作者 王克俭 何晨 《计算机工程与科学》 CSCD 北大核心 2024年第2期282-291,共10页
随着教育信息化的发展,教育数据呈现特征数量高、冗余度高等特点,这使目前的分类算法在教育数据上分类准确率不理想。提出一种将特征权重算法与改进粒子群优化算法融合的混合式特征选择算法(RF-ATPSO)。该算法首先使用RELIEF-F算法计算... 随着教育信息化的发展,教育数据呈现特征数量高、冗余度高等特点,这使目前的分类算法在教育数据上分类准确率不理想。提出一种将特征权重算法与改进粒子群优化算法融合的混合式特征选择算法(RF-ATPSO)。该算法首先使用RELIEF-F算法计算各个特征的权重,筛除冗余特征,然后在筛选后的特征集合中利用改进粒子群算法搜索最优特征子集。实验结果表明,在6个UCI公共数据集上,经RF-ATPSO算法进行特征选择后,平均准确率提升了10.04%,且平均特征子集规模最小、收敛速度最快;在学生学业成绩画像特征数据集上,该算法以较小的特征子集规模达到较高的分类准确率,平均准确率为94.77%,明显优于其它特征选择算法,实验充分证明了该算法具有实际应用意义。 展开更多
关键词 特征选择 特征权重 改进粒子群优化 T-分布
下载PDF
基于灰狼-鸟群算法的特征权重优化方法
2
作者 严爱军 严晶 《北京工业大学学报》 CAS CSCD 北大核心 2023年第10期1088-1098,共11页
针对特征权重难以准确量化的问题,提出一种基于灰狼优化(grey wolf optimizer, GWO)算法和鸟群算法(bird swarm algorithm, BSA)的混合算法,用于特征权重的寻优。首先,将Chebyshev映射、反向学习与精英策略用于混合算法的初始种群生成;... 针对特征权重难以准确量化的问题,提出一种基于灰狼优化(grey wolf optimizer, GWO)算法和鸟群算法(bird swarm algorithm, BSA)的混合算法,用于特征权重的寻优。首先,将Chebyshev映射、反向学习与精英策略用于混合算法的初始种群生成;其次,将改进后的GWO算法位置更新策略融入BSA的觅食行为中,得到一种新的局部搜索策略;然后,将BSA的警觉行为与飞行行为用作混合算法的全局搜索平衡策略,从而得到一种收敛的灰狼-鸟群算法(grey wolf and bird swarm algorithm, GWBSA),通过GWBSA的迭代寻优可获得各特征的权重值。利用标准测试函数和标准分类数据集进行了对比实验,与遗传算法、蚁狮算法等方法相比,GWBSA具有较快的收敛速度且不易陷入局部最优,可以提高模式分类问题的求解质量。 展开更多
关键词 特征权重 灰狼优化(grey wolf optimizer GWO)算法 鸟群算法(bird swarm algorithm BSA) 混合算法 问题求解 模式分类
下载PDF
基于特征权重与K-Medoids算法结合的非均衡数据处理方法
3
作者 杨栋 程科 +1 位作者 张晨 张瑞祥 《计算机与数字工程》 2023年第6期1338-1342,共5页
目前处理非均衡数据的方法多是以重采样方法来延伸的,传统的方法在解决非均衡数据分类问题时会使样本数据分类的精确度偏向于多数类样本,而且没有解决好类内不均衡的问题,未将样本数据的特征权重考虑到分类算法或者采样方法中。因此论... 目前处理非均衡数据的方法多是以重采样方法来延伸的,传统的方法在解决非均衡数据分类问题时会使样本数据分类的精确度偏向于多数类样本,而且没有解决好类内不均衡的问题,未将样本数据的特征权重考虑到分类算法或者采样方法中。因此论文提出了一种基于特征权重值与K-Medoids算法相结合的欠采样方法,这种方法解决了之前提出的问题,抽样得到的数据更有利于决策处理,从而使得分类器对不平衡数据的分类性能有所提高。通过实验表明,论文提出的方法与传统的随机欠采样方法相比,在处理相同标准数据集时具有更好分类效果,显著提高了数据集中各类的分类精度。 展开更多
关键词 非均衡数据集 特征权重 K-Medoids 欠采样
下载PDF
基于特征权重量化的相似度计算方法 被引量:8
4
作者 刘铭 吴冲 +1 位作者 刘远超 孙承杰 《计算机学报》 EI CSCD 北大核心 2015年第7期1420-1433,共14页
随着信息产业的迅猛发展,聚类的无监督特性使其成为一种极为有效的分析工具.而为获得良好的聚类结果,有效及准确的相似度计算方法是其必备的前提条件.事实上,在描述数据相似度时,不同的特征显然具有不同的作用,因此有必要借助一些先验知... 随着信息产业的迅猛发展,聚类的无监督特性使其成为一种极为有效的分析工具.而为获得良好的聚类结果,有效及准确的相似度计算方法是其必备的前提条件.事实上,在描述数据相似度时,不同的特征显然具有不同的作用,因此有必要借助一些先验知识,例如用户提供的限制数据,来衡量特征的重要性,并将其应用于相似度计算中以获取更加准确的计算结果.传统的特征权值量化方法均忽视了两点问题:(1)限制数据在特征空间中极有可能为非均匀分布;(2)限制数据可能包含不一致性.上述问题的存在使得传统的权值量化方法无法获得准确的结果甚至无法运行.基于此,文中提出了一种新颖的特征权值量化方法用以处理上述两点问题:(1)将限制数据划分为若干个等价类,进而通过计算参数"分布系数"来均匀化数据的分布;(2)将限制数据连接为无向图,进而通过计算参数"置信度"来衡量及弱化限制数据的不一致性.之后将这两个参数结合到特征权值量化函数中以获得准确的相似度计算结果.实验结果显示:该特征权值量化方法能够结合限制数据来获取不同特征对相似度计算的贡献能力,并能应用于任何聚类算法中以提高聚类的准确度. 展开更多
关键词 限制数据 特征权重量化 分布系数 置信度
下载PDF
文本分类特征权重改进算法 被引量:26
5
作者 台德艺 王俊 《计算机工程》 CAS CSCD 北大核心 2010年第9期197-199,202,共4页
TF-IDF是一种在文本分类领域获得广泛应用的特征词权重算法,着重考虑了词频与逆文档频等因素,但无法把握特征词在类间与类内的分布情况。为提高在同类中频繁出现、类内均匀分布的具有代表性的特征词权重,引入特征词分布集中度系数改进ID... TF-IDF是一种在文本分类领域获得广泛应用的特征词权重算法,着重考虑了词频与逆文档频等因素,但无法把握特征词在类间与类内的分布情况。为提高在同类中频繁出现、类内均匀分布的具有代表性的特征词权重,引入特征词分布集中度系数改进IDF函数、用分散度系数进行加权,提出TF-IIDF-DIC权重函数。实验结果表明,基于TF-IIDF-DIC权重算法的K-NN文本分类宏平均F1值比TF-IDF算法提高了6.79%。 展开更多
关键词 向量空间模型 文本分类 特征权重 特征分布
下载PDF
一种有效的特征权重计算方法 被引量:9
6
作者 孙挺 耿国华 周明全 《郑州大学学报(理学版)》 CAS 2008年第4期48-51,共4页
研究了典型的特征加权方法,分析了词频权重以及tf*idf权重等特征加权方法在表现特征重要性上的不足,提出了一种新的特征权重计算方法tf*idf*cf.该方法综合考虑了特征频率、文档频率以及特征类别信息,更为全面准确地描述了特征在文本中... 研究了典型的特征加权方法,分析了词频权重以及tf*idf权重等特征加权方法在表现特征重要性上的不足,提出了一种新的特征权重计算方法tf*idf*cf.该方法综合考虑了特征频率、文档频率以及特征类别信息,更为全面准确地描述了特征在文本中的重要程度.实验结果表明,该方法可以有效地改善分类性能. 展开更多
关键词 文本分类 向量空间模型 特征权重
下载PDF
一种改进的特征权重算法 被引量:20
7
作者 张瑜 张德贤 《计算机工程》 CAS CSCD 北大核心 2011年第5期210-212,共3页
特征权重算法对文本分类系统的精确度有很大影响,传统的TFIDF算法未能考虑特征项在类间和类内的分布情况。为此,在对传统算法和相关改进算法进行分析的基础上,引入类间偏斜度、类内离散度和权重调整因子的改进思路,提出一种基于WA-DI-S... 特征权重算法对文本分类系统的精确度有很大影响,传统的TFIDF算法未能考虑特征项在类间和类内的分布情况。为此,在对传统算法和相关改进算法进行分析的基础上,引入类间偏斜度、类内离散度和权重调整因子的改进思路,提出一种基于WA-DI-SI的特征权重改进算法,分别采用支持向量机和朴素贝叶斯2种分类算法进行测试。测试结果表明,与其他改进算法相比,该算法能够获得更好的分类效果。 展开更多
关键词 文本分类 特征权重 类间偏斜度 类内离散度 调整因子
下载PDF
动态自适应特征权重的多类文本分类算法研究 被引量:9
8
作者 裴颂文 吴百锋 《计算机应用研究》 CSCD 北大核心 2011年第11期4092-4096,共5页
文本分类是研究文本数据挖掘、信息检索的重要手段,文本特征项权重值的计算是文本分类算法的关键。针对经典的特征权重计算方法 TF-IDF中存在的不足,提出了一种动态自适应特征权重计算方法(DATW)。该算法不仅考虑了特征项在文本中出现... 文本分类是研究文本数据挖掘、信息检索的重要手段,文本特征项权重值的计算是文本分类算法的关键。针对经典的特征权重计算方法 TF-IDF中存在的不足,提出了一种动态自适应特征权重计算方法(DATW)。该算法不仅考虑了特征项在文本中出现的频率及该特征项所属文本在训练集中的数量,而且通过考查特征项的分散度和特征向量梯度差以自适应动态文本的分类。实验结果表明,采用DATW方法计算特征权重可以有效提高文本分类的性能。 展开更多
关键词 文本分类 特征权重 TF-IDF 分散度 梯度差
下载PDF
新的短文本特征权重计算方法 被引量:8
9
作者 马雯雯 邓一贵 《计算机应用》 CSCD 北大核心 2013年第8期2280-2282,2292,共4页
短文本固有的特征稀疏和样本高度不均衡等特点,使得传统长文本的加权方法难以直接套用。针对此问题,提出一种针对短文本的特征权重计算方法——综合类别法。该方法引入反文档频和相关性频率的概念,综合考虑了样本在正类和负类中的分布... 短文本固有的特征稀疏和样本高度不均衡等特点,使得传统长文本的加权方法难以直接套用。针对此问题,提出一种针对短文本的特征权重计算方法——综合类别法。该方法引入反文档频和相关性频率的概念,综合考虑了样本在正类和负类中的分布情况。实验结果表明,相对于其他特征权重方法,该方法的微平均和宏平均值均在90%以上,能增强样本在负类中的类别区分能力,改善短文本分类的查准率和查全率。 展开更多
关键词 短文本 特征权重 不均衡样本 文本分类
下载PDF
文本分类中特征权重算法的改进 被引量:14
10
作者 沈志斌 白清源 《南京师范大学学报(工程技术版)》 CAS 2008年第4期95-98,149,共5页
TFIDF是文档特征权重表示常用方法.该方法简单易行,但忽略了特征词在各个类别中的分布情况,不能真正地反映特征词对区分每个类的贡献.针对这个不足,本文提出了BOR-TFIDF,来重新调整每个特征词对各个类别的区分度,即修正各个特征词的权重... TFIDF是文档特征权重表示常用方法.该方法简单易行,但忽略了特征词在各个类别中的分布情况,不能真正地反映特征词对区分每个类的贡献.针对这个不足,本文提出了BOR-TFIDF,来重新调整每个特征词对各个类别的区分度,即修正各个特征词的权重,并用分类器来验证其有效性.该方法优于原来的TFIDF算法,实验表明了改进的策略是可行的. 展开更多
关键词 文本分类 特征权重 TFIDF 类别区分 BOR-TFIDF
下载PDF
基于遗传算法的图像检索中特征权重自动调整 被引量:8
11
作者 崔文成 邵虹 《计算机工程与应用》 CSCD 北大核心 2008年第2期106-108,共3页
综合多种特征的图像检索可以克服使用单一特征带来的问题,如何组织这些特征使其发挥最佳作用是基于内容图像检索中的一个难点。提出了一种基于遗传算法的多特征权重自动赋值方法,首先将图像检索中特征权重调整问题转换为优化问题,进一... 综合多种特征的图像检索可以克服使用单一特征带来的问题,如何组织这些特征使其发挥最佳作用是基于内容图像检索中的一个难点。提出了一种基于遗传算法的多特征权重自动赋值方法,首先将图像检索中特征权重调整问题转换为优化问题,进一步利用遗传算法求取权重的最优解,使检索效果达到最好。实验表明,该方法查全率和查准率较高,并且具有较强的鲁棒性和推广能力,对于各种特征和特征表示方法,都能够提供最佳的组合。 展开更多
关键词 基于内容的图像检索 遗传算法 特征权重
下载PDF
负投影梯度的特征权重Leader聚类算法 被引量:2
12
作者 隋玉敏 孙秀芳 +1 位作者 武优西 任志考 《小型微型计算机系统》 CSCD 北大核心 2014年第9期2147-2150,共4页
Leader算法是一种基于粗糙集的层次聚类算法,其聚类过程中各维特征贡献作用均等,这样的处理方法降低了主要特征在聚类中的贡献作用,从而影响聚类的效果.采用负投影梯度法对各维特征的权重进行自适应学习,从而优化地获得各维特征的权值,... Leader算法是一种基于粗糙集的层次聚类算法,其聚类过程中各维特征贡献作用均等,这样的处理方法降低了主要特征在聚类中的贡献作用,从而影响聚类的效果.采用负投影梯度法对各维特征的权重进行自适应学习,从而优化地获得各维特征的权值,进而建立了基于负投影梯度法的特征权重Leader聚类算法.该算法强化了重要特征在聚类过程中的作用.聚类结果用"熵"和"精度"来评价,实验结果证明,改进后的聚类算法能够改善聚类的效果,验证了本文方法的可行性与有效性. 展开更多
关键词 聚类算法 负投影梯度 特征权重 Leader算法
下载PDF
一种可靠信任推荐文本分类特征权重算法 被引量:6
13
作者 焦庆争 蔚承建 《计算机应用研究》 CSCD 北大核心 2010年第2期472-474,共3页
从可信计算角度,提出一种可靠信任推荐文本分类特征权重算法,分析了特征在文档中的特性,基于Beta分布函数研究了特征与文档类之间的信任关系,建立特征权重计算模型,并实现简单高效的线性文本分类器。在比较实验中采用20newsgroup和复旦... 从可信计算角度,提出一种可靠信任推荐文本分类特征权重算法,分析了特征在文档中的特性,基于Beta分布函数研究了特征与文档类之间的信任关系,建立特征权重计算模型,并实现简单高效的线性文本分类器。在比较实验中采用20newsgroup和复旦中文语料集。与TFIDF算法进行性能比较,实验结果显示该算法性能较TFIDF显著提高,并对非平衡语料具有良好的适应性。 展开更多
关键词 文本分类 特征权重 可信计算 概率确定性密度 自然语言处理
下载PDF
自适应特征权重的K-means聚类算法 被引量:10
14
作者 李四海 满自斌 《计算机技术与发展》 2013年第6期98-101,105,共5页
为提高传统K-means聚类算法在医学数据聚类中的准确率和稳定性,提出了一种自适应特征权重的K-means聚类算法AFW-K-means。该算法首先通过计算属性的均方差选取初始聚类中心,然后根据当前的迭代结果,按照类内紧密、类间远离的原则调整属... 为提高传统K-means聚类算法在医学数据聚类中的准确率和稳定性,提出了一种自适应特征权重的K-means聚类算法AFW-K-means。该算法首先通过计算属性的均方差选取初始聚类中心,然后根据当前的迭代结果,按照类内紧密、类间远离的原则调整属性在距离公式中的特征权重,以便更准确地反映数据点在欧氏空间中的真实距离,最后选取UCI上的BCW乳腺肿瘤等数据集对算法的有效性进行验证。结果表明:算法的准确率和稳定性均明显好于传统K-means算法。 展开更多
关键词 K—means 医学数据聚类 自适应特征权重 聚类评价 混淆矩阵
下载PDF
基于多维特征权重的虚假评论识别方法 被引量:2
15
作者 皇苏斌 修宇 +1 位作者 赵森严 汪千松 《长江大学学报(自科版)(上旬)》 CAS 2015年第6期34-38,4,共5页
在线商品评论是消费者网购决策的重要依据,利益的驱动使得越来越多的网络虚假评论呈现在消费者面前。针对此问题,提出一种多维特征权重的在线虚假评论识别方法。首先,从网购信息有用性角度出发,在商品、评论者和评论内容3个维度中选取9... 在线商品评论是消费者网购决策的重要依据,利益的驱动使得越来越多的网络虚假评论呈现在消费者面前。针对此问题,提出一种多维特征权重的在线虚假评论识别方法。首先,从网购信息有用性角度出发,在商品、评论者和评论内容3个维度中选取9个对评论属类语义贡献大的特征。然后,基于Fisher准则,运用赋予权重的特征构建用于识别虚假评论的方法。试验结果验证了基于多维特征权重的虚假评论识别方法的有效性:多维特征权重方法的准确率。 展开更多
关键词 虚假评论 特征选择 特征权重 FISHER准则
下载PDF
基于信息熵理论的特征权重算法研究 被引量:22
16
作者 郭红钰 《计算机工程与应用》 CSCD 2013年第10期140-146,共7页
文本表示是使用分类算法处理文本时必不可少的环节,文本表示方法的选择对最终的分类精度起着至关重要的作用。针对经典的特征权重计算方法TFIDF(Term Frequency and Inverted Document Frequency)中存在的不足,提出了一种基于信息熵理... 文本表示是使用分类算法处理文本时必不可少的环节,文本表示方法的选择对最终的分类精度起着至关重要的作用。针对经典的特征权重计算方法TFIDF(Term Frequency and Inverted Document Frequency)中存在的不足,提出了一种基于信息熵理论的特征权重算法ETFIDF(Entropy based TFIDF)。ETFIDF不仅考虑特征项在文档中出现的频率及该特征项在训练集中的集中度,而且还考虑该特征项在各个类别中的分散度。实验结果表明,采用ETFIDF计算特征权重可以有效地提高文本分类性能,对ETFIDF与特征选择的关系进行了较详细的理论分析和实验研究。实验结果表明,在文本表示阶段考虑特征与类别的关系可以更为准确地表示文本;如果综合考虑精度与效率两个方面因素,ETFIDF算法与特征选择算法一起采用能够得到更好的分类效果。 展开更多
关键词 信息熵 特征权重 特征选择 文本分类
下载PDF
利用遗传算法和特征权重调整的图像检索 被引量:2
17
作者 於时才 张永权 《计算机工程与应用》 CSCD 北大核心 2010年第32期168-170,共3页
综合多种特征的图像检索可以克服使用单一特征带来的问题,如何组织这些特征使其发挥最佳作用是基于内容图像检索中的一个难点。提出了一种基于遗传算法相关反馈的图像特征权重调整方法,利用遗传算法和特征权重的调整,缩小低层特征和高... 综合多种特征的图像检索可以克服使用单一特征带来的问题,如何组织这些特征使其发挥最佳作用是基于内容图像检索中的一个难点。提出了一种基于遗传算法相关反馈的图像特征权重调整方法,利用遗传算法和特征权重的调整,缩小低层特征和高层语义之间的语义鸿沟,使检索效果在很短的时间内达到最好。实验表明,该方法查全率和查准率较高,对于各种特征的组合,都能达到最佳的检索效果。 展开更多
关键词 特征 图像检索 遗传算法 特征权重调整
下载PDF
改进型特征权重自调节K-均值聚类算法 被引量:3
18
作者 支晓斌 许朝晖 《西安邮电大学学报》 2014年第6期26-31,共6页
针对特征权重自调节K-均值聚类(FWSA-KM)算法对噪声敏感的问题,提出一种改进型特征权重自调节K-均值聚类(IFWSA-KM)算法。用一种非欧氏距离代替FWSA-KM算法中的欧氏距离,以增加聚类算法的抗噪声性能。通过用人工数据和真实数据的对比性... 针对特征权重自调节K-均值聚类(FWSA-KM)算法对噪声敏感的问题,提出一种改进型特征权重自调节K-均值聚类(IFWSA-KM)算法。用一种非欧氏距离代替FWSA-KM算法中的欧氏距离,以增加聚类算法的抗噪声性能。通过用人工数据和真实数据的对比性实验,可验证IFWSA-KM算法的有效性。 展开更多
关键词 聚类算法 特征权重 鲁棒性 非欧氏距离
下载PDF
基于改进的TF-IDF特征权重算法的网页自动分类 被引量:2
19
作者 蔡银珊 黄英铭 《绵阳师范学院学报》 2010年第8期106-109,共4页
TF-IDF是文档特征权重表示常用方法,但不能真正地反映特征词对区分每个类的贡献。故针对网页分类中特征选择方法存在的问题,加入网页标签特征权重改进TF-IDF公式,提出了一种比较有效的网页分类算法,实验结果表明该方法具有较好的特征选... TF-IDF是文档特征权重表示常用方法,但不能真正地反映特征词对区分每个类的贡献。故针对网页分类中特征选择方法存在的问题,加入网页标签特征权重改进TF-IDF公式,提出了一种比较有效的网页分类算法,实验结果表明该方法具有较好的特征选择效果,能够有效地提高分类精度。 展开更多
关键词 网页分类 TF-IDF 特征权重
下载PDF
基于特征权重的遗传聚类方法 被引量:1
20
作者 刘开第 庞彦军 曹庆奎 《河北建筑科技学院学报》 2004年第2期79-81,共3页
本文提出的聚类方法与通常的分区聚类方法区别在于 :( 1 )从遗传算法角度考虑聚类问题 ;( 2 )在特征权重基础上构造个体适应度函数 ,通常的聚类方法没有考虑特征对分类的不同影响 ;( 3)用基于罚函数的小生境遗传算法处理聚类问题 ,最大... 本文提出的聚类方法与通常的分区聚类方法区别在于 :( 1 )从遗传算法角度考虑聚类问题 ;( 2 )在特征权重基础上构造个体适应度函数 ,通常的聚类方法没有考虑特征对分类的不同影响 ;( 3)用基于罚函数的小生境遗传算法处理聚类问题 ,最大限度地保证搜索到全局最优解和所有局部最优解。 展开更多
关键词 分区聚类 常规聚类 遗传算法 小生境 特征权重
下载PDF
上一页 1 2 11 下一页 到第
使用帮助 返回顶部