期刊文献+
共找到5,410篇文章
< 1 2 250 >
每页显示 20 50 100
基于不一致近邻的模糊粗糙集特征选择
1
作者 赵洁 叶文浩 +2 位作者 梁周扬 陈建新 董振宁 《计算机工程》 CSCD 2024年第1期110-119,共10页
模糊粗糙集可突破经典粗糙集仅能处理离散数据的局限,有效对连续型数值进行特征选择。然而,模糊粗糙集以对象为中心计算,时间复杂度高,难以处理高维和大规模数据。为此,基于水平截集提出一种不一致近邻加速策略。该策略跟踪论域中每个... 模糊粗糙集可突破经典粗糙集仅能处理离散数据的局限,有效对连续型数值进行特征选择。然而,模糊粗糙集以对象为中心计算,时间复杂度高,难以处理高维和大规模数据。为此,基于水平截集提出一种不一致近邻加速策略。该策略跟踪论域中每个对象的模糊近邻集,持续删减其中不影响计算的近邻,若对象的不一致近邻删减至空,则删减该对象,从而提高算法效率。同时,设计一种基于不一致近邻递减的属性重要度,可有效抑制冗余特征入选,提升效率及分类精度。通过理论证明,所提的加速策略及属性重要度不影响属性入选的次序。在此基础上,提出新的模糊粗糙集特征选择算法。在9个UCI和scikit数据集上进行验证,实验结果表明,该算法不仅有效缩短运行时间,并可取得较高的分类精度,相比FA-FSCE、AVDP和IV-FS-FRS-2算法,运行时间至少可缩短9.44%,尤其在高维和大规模数据上可缩短61.01%~99.54%,在支持向量机和K-近邻算法的分类精度上最高可分别提高11.20%和19.95%。 展开更多
关键词 模糊粗糙集 特征选择 水平截集 不一致近邻 属性重要度
下载PDF
基于LightGBM-VIF-MIC-SFS的风电机组故障诊断输入特征选择方法
2
作者 马良玉 程东炎 +2 位作者 梁书源 耿妍竹 段新会 《热力发电》 CAS CSCD 2024年第1期154-164,共11页
针对风电机组数据采集与监视控制(SCADA)系统数据维数较高、特征冗余、特征相关性高导致风电机组的故障诊断过程存在误差大、分类正确率低的问题,提出一种基于LightGBM-VIF-MIC-SFS的三段式特征选择方法。首先,根据LightGBM实现对所有... 针对风电机组数据采集与监视控制(SCADA)系统数据维数较高、特征冗余、特征相关性高导致风电机组的故障诊断过程存在误差大、分类正确率低的问题,提出一种基于LightGBM-VIF-MIC-SFS的三段式特征选择方法。首先,根据LightGBM实现对所有特征的重要性计算,确定初步特征空间;其次,根据方差膨胀因子(VIF)和最大信息系数(MIC)构建相关性判别阵,据此评估一次筛选中重要性相近的特征,舍弃相似性高的输入特征;最后,使用序列前向搜索法对特征进行第3次处理,逐个输入前2次特征选择获得的特征,保留能提升系统性能的特征,从而实现最终特征的选取。在完成了模型的建立后,使用风电场真实SCADA系统数据进行性能评估,将所提方法与2种对比算法在6个数据集上进行对比,结果显示所提出的LightGBM-VIF-MIC-SFS相较2种对比特征选择算法有显著优势。对所提方法内部的3个模块进行了消融实验,有效验证了所提特征选取方法内部各个模块的有效性以及基于所提方法得到的最优特征空间的合理性及准确性。 展开更多
关键词 风电机组 特征选择 LightGBM 方差膨胀因子 最大信息系数 序列前向搜索
下载PDF
基于特征选择的LightGBM算法预测钠离子电池剩余寿命
3
作者 史永胜 翟欣然 +1 位作者 栾飞 胡玙珺 《陕西科技大学学报》 2024年第2期174-181,共8页
钠离子电池剩余使用寿命(RUL)的准确预测对于可再生能源系统中的大规模储能设备具有重要意义.提出了一种基于特征选择的LightGBM方法来预测钠离子电池的剩余使用寿命.通过结合Pearson相关系数和灰色关联度,选择了四个与电池寿命高度相... 钠离子电池剩余使用寿命(RUL)的准确预测对于可再生能源系统中的大规模储能设备具有重要意义.提出了一种基于特征选择的LightGBM方法来预测钠离子电池的剩余使用寿命.通过结合Pearson相关系数和灰色关联度,选择了四个与电池寿命高度相关且不同特征之间自相关程度较低的最佳特征.采用LightGBM模型,并结合网格搜索(GridSearchCV)算法对其超参数进行优化,以达到最佳的预测性能.通过钠离子电池数据验证了预测模型的优越性,并与使用GridSearchCV算法的GBRD和RF模型在相同条件下进行比较.结果表明,该方法能够显著加快模型运算速度,并相比传统算法具有更高的可靠性和更好的预测性能,预测的最大MAE、MSE、RMSE分别不超过3.0、17.7、4.2. 展开更多
关键词 钠离子电池 剩余使用寿命 LightGBM 特征选择
下载PDF
采用动态相关度权重的特征选择算法
4
作者 许华杰 刘冠霆 +1 位作者 张品 秦远卓 《计算机工程与应用》 CSCD 2024年第4期89-98,共10页
基于互信息的特征选择算法在考虑候选特征提供的新分类信息时,通常忽略了候选特征的加入会使得已选特征和类标签的相关性发生变化而带来额外的新增信息量,以及在计算冗余信息时采用累加求和的形式可能导致低估候选特征的冗余程度。针对... 基于互信息的特征选择算法在考虑候选特征提供的新分类信息时,通常忽略了候选特征的加入会使得已选特征和类标签的相关性发生变化而带来额外的新增信息量,以及在计算冗余信息时采用累加求和的形式可能导致低估候选特征的冗余程度。针对以上问题,提出动态相关度权重的定义,以更全面地考虑候选特征带来的新信息量成分;提出改进冗余项的定义,采用取最大值和归一化策略,以解决传统算法存在的低估冗余问题;在此基础上提出一种采用动态相关度权重的特征选择算法(feature selection using dynamic relevance weight,FSDRW)。选取五种当前主流的基于互信息的过滤式特征选择算法进行对比实验,在来自加州大学尔湾分校UCI和亚利桑那州立大学ASU的机器学习测试数据集上的实验表明,所提出的算法在分类准确率及综合性能方面具有较好的表现。最后将所提出算法应用于广西某水库工程的微震、爆破信号识别中,算法选取出的特征用于微震信号识别可达到98.86%的分类准确率,验证了算法在实际应用中的有效性。 展开更多
关键词 特征选择 互信息 信息熵 动态相关度权重
下载PDF
融合对比学习和特征选择的入侵检测模型
5
作者 陈虹 程明佳 +2 位作者 金海波 武聪 姜朝议 《信息安全研究》 CSCD 2024年第5期453-461,共9页
入侵检测系统可以主动识别恶意流量,是保护网络安全的重要工具.针对网络流量中存在的冗余特征以及现有的入侵检测算法在特征选择过程中存在的不足,提出一种融合对比学习和特征选择的入侵检测模型(contrastive learning and feature sele... 入侵检测系统可以主动识别恶意流量,是保护网络安全的重要工具.针对网络流量中存在的冗余特征以及现有的入侵检测算法在特征选择过程中存在的不足,提出一种融合对比学习和特征选择的入侵检测模型(contrastive learning and feature selection,CL-FS).利用皮尔逊相关系数(Pearson correlation coefficient,PCCs)对预处理后的网络流量进行相关性分析,过滤掉相似特征;使用自编码器(autoencoder,AE)进行深度特征提取,在提取阶段融入对比学习,减少类间相似性,将提取的新特征和过滤后的特征融合,得到表征能力更强的特征集;利用改进的鸽群算法进行包裹特征选择,根据贝叶斯分类器的性能选择最优特征子集,提高分类精度.在NSL-KDD,UNSW-NB15这2个数据集的实验结果表明,CL-FS模型可以提升分类精度并减少处理时间,在2个数据集上的2分类实验准确率分别为90.45%和88.52%,分类处理时间大约减少为原来的一半. 展开更多
关键词 对比学习 皮尔逊相关系数 鸽群算法 特征提取 特征选择
下载PDF
面向特征选择任务的改进蜣螂优化算法
6
作者 李珺 徐秦 《电子测量技术》 2024年第1期79-86,共8页
蜣螂优化算法是一种基于蜣螂不同行为模式的新型启发式算法,与其他算法相比的收敛速度更快,逃脱局部最优的能力更强。针对蜣螂优化算法不能进行特征选择的问题,在蜣螂优化算法的基础上提出了蜣螂灰狼融合算法。该算法基于3种改进策略:... 蜣螂优化算法是一种基于蜣螂不同行为模式的新型启发式算法,与其他算法相比的收敛速度更快,逃脱局部最优的能力更强。针对蜣螂优化算法不能进行特征选择的问题,在蜣螂优化算法的基础上提出了蜣螂灰狼融合算法。该算法基于3种改进策略:精英初始化种群策略、灰狼蜣螂融合策略、运行加速策略,进一步提高蜣螂优化算法在特征选择任务上的性能,并给出了算法整体的伪代码。实验结果表明,比较其他改进型启发式算法,蜣螂灰狼融合优化算法在12个分类数据集中能够得到更高精度、更低维度的特征子集,同时兼备收敛速度、运行速度更快的优点。 展开更多
关键词 特征选择 蜣螂优化算法 分类
原文传递
改进麻雀搜索算法的入侵检测特征选择
7
作者 刘涛 蒙学强 《计算机工程与设计》 2024年第4期989-996,共8页
针对网络入侵检测所处理数据存在特征维数高、检测效率低、准确率不高的问题,提出一种改进麻雀搜索算法的特征选择方法,旨在减少特征冗余的同时提高分类准确率。利用改进Circle映射初始化种群;结合秃鹰搜索算法中的螺旋搜索方式更新发... 针对网络入侵检测所处理数据存在特征维数高、检测效率低、准确率不高的问题,提出一种改进麻雀搜索算法的特征选择方法,旨在减少特征冗余的同时提高分类准确率。利用改进Circle映射初始化种群;结合秃鹰搜索算法中的螺旋搜索方式更新发现者位置;采用单纯形法和小孔成像法优化适应度较差和最优麻雀的位置,提升算法的寻优能力。将该算法与其它算法在6个经典基准函数上进行对比测试,其在收敛速度、精度等方面均有提升。使用数据集CIC-IDS2017进行特征选择实验,平均保留了7.6个特征,准确率达到了99.5%,结果表明,该算法可以在保证准确率的同时有效降低特征维度。 展开更多
关键词 麻雀搜索算法 Circle映射 螺旋搜索 单纯形法 小孔成像 入侵检测 特征选择
下载PDF
基于互信息与萤火虫算法的网络入侵特征选择
8
作者 王新胜 杨锐 《计算机应用与软件》 2024年第4期306-312,320,共8页
为减少网络入侵检测数据中的冗余特征,提出一种结合互信息和萤火虫算法的特征选择方法。针对互信息不能精确计算特征间冗余度,提出类内特征冗余互信息特征选择方法。针对萤火虫算法步长因子固定易使算法陷入局部最优等问题,提出自适应... 为减少网络入侵检测数据中的冗余特征,提出一种结合互信息和萤火虫算法的特征选择方法。针对互信息不能精确计算特征间冗余度,提出类内特征冗余互信息特征选择方法。针对萤火虫算法步长因子固定易使算法陷入局部最优等问题,提出自适应步长萤火虫算法特征选择。以上方法分别选取特征子集后利用投票策略选取最优子集,对该子集基于C4.5和贝叶斯网络分类器分类。实验结果表明,使用10个特征检测能有效提高入侵检测率、误报率和F-measure,同时还缩短训练和检测时间。此外,与现有的几种方法相比,该方法在准确率、检测率和F-measure都获得不错效果。 展开更多
关键词 网络入侵检测 特征选择 投票策略 互信息 萤火虫算法
下载PDF
基于模糊邻域判别指数的在线流组特征选择
9
作者 徐久成 孙元豪 韩子钦 《计算机工程与设计》 2024年第3期806-813,共8页
在线流组特征选择可以充分利用特征流中原始的组结构信息,以在线的方式处理特征选择问题。然而,现有方法大多无法处理具有模糊性和不确定性的数据。为此,提出一种基于模糊邻域判别指数的在线流组特征选择算法。设计一种模糊邻域判别指数... 在线流组特征选择可以充分利用特征流中原始的组结构信息,以在线的方式处理特征选择问题。然而,现有方法大多无法处理具有模糊性和不确定性的数据。为此,提出一种基于模糊邻域判别指数的在线流组特征选择算法。设计一种模糊邻域判别指数,用于描述模糊邻域粒的判别信息,扩展相关的不确定性度量方法。在此基础上,用组内特征选择和组间特征选择两种策略选择具有强近似能力且非冗余的特征。在8个公共数据集上进行对比实验,验证了该算法具有更优且稳定的分类性能。 展开更多
关键词 特征选择 特征选择 流组 模糊粗糙集 模糊邻域熵 邻域判别指数 不确定性度量
下载PDF
基于自适应特征选择k子凸包的滚动轴承故障诊断
10
作者 胡爱孺 吴占涛 +1 位作者 杨宇 程军圣 《机械强度》 CAS CSCD 2024年第2期255-263,共9页
滚动轴承故障诊断中往往将特征选择和分类器的设计分别进行研究,从而难以获得满意的分类精度。将特征选择和分类器寻优结合起来,提出了一种自适应特征选择k子凸包(Adaptive Feature Selection K-sub Convex Hull, AFSKCH)的分类模型,从... 滚动轴承故障诊断中往往将特征选择和分类器的设计分别进行研究,从而难以获得满意的分类精度。将特征选择和分类器寻优结合起来,提出了一种自适应特征选择k子凸包(Adaptive Feature Selection K-sub Convex Hull, AFSKCH)的分类模型,从而实现了故障特征自适应选择和分类的一体化。首先,利用凸包距离函数保持数据流形上的局部邻域结构,通过交替构造k子凸包得到特征权值矩阵;其次,采用线性规划接近度方法求解k子凸包距离,利用乘子交替方向法得到自适应特征空间;最后,根据测试点到k子凸包的最小重构距离进行分类。滚动轴承故障振动信号分析结果表明,该方法特征选择性能优于其他特征选择方法,且具有较高的分类精度。 展开更多
关键词 自适应特征选择 邻域嵌入 k子凸包 滚动轴承 故障诊断
下载PDF
基于聚类特征选择的热轧过程带钢头部厚度预测
11
作者 武凯 武文腾 +3 位作者 谢松雨 孙彦广 彭文 孙杰 《中国冶金》 CAS CSCD 2024年第3期131-138,共8页
厚度是热轧产品关键质量指标之一,带钢头部厚度预测精度直接影响自动厚度控制(AGC)的控制效果,进而影响产品质量和成材率。热轧生产过程复杂多变,大量冗余工艺特征严重影响厚度预测建模效果。为提高预测模型精度,采用层次聚类和互信息... 厚度是热轧产品关键质量指标之一,带钢头部厚度预测精度直接影响自动厚度控制(AGC)的控制效果,进而影响产品质量和成材率。热轧生产过程复杂多变,大量冗余工艺特征严重影响厚度预测建模效果。为提高预测模型精度,采用层次聚类和互信息相结合的方法进行特征选择,分别基于深度神经网络(DNN)、极端梯度提升(XGBoost)、支持向量机回归(SVR)以及梯度提升决策树(GBDT)建立带钢头部厚度预测模型,通过平均绝对误差(E_(MA))、均方误差(E_(MS))、最大百分比误差(E_(MAP))以及决定系数(R^(2))对模型的泛化能力进行评估。结果表明,在所建的预测模型中,DNN预测模型具有比其他模型更优的预测精度,测试集数据的E_(MA)、E_(MS)、E_(MAP)和R^(2)分别为0.015 4、0.000 3、0.004 4、0.992 1,并有97.15%的数据预测偏差小于0.03 mm,最大偏差小于0.04 mm。最后采用机器学习模型解释方法SHAP进行特征分析,得到相关工艺参数对带钢头部厚度的影响程度,实现了热轧带钢头部厚度的高精度预测。 展开更多
关键词 热轧 精轧机 聚类特征选择 深度学习 头部厚度预测
下载PDF
基于稀疏矩阵结构的特征选择算法现状研究
12
作者 钟静 方冰 朱江 《信息网络安全》 CSCD 2024年第3期352-362,共11页
在信息时代,数据获取方式简单快捷,使得数据量呈指数型增长。然而这些数据往往是多源高维的,增加了模型的复杂度,容易造成模型过拟合,并且数据中存在的冗余特征会降低模型分类精度。特征选择算法旨在通过去除不相关、冗余或嘈杂的特征,... 在信息时代,数据获取方式简单快捷,使得数据量呈指数型增长。然而这些数据往往是多源高维的,增加了模型的复杂度,容易造成模型过拟合,并且数据中存在的冗余特征会降低模型分类精度。特征选择算法旨在通过去除不相关、冗余或嘈杂的特征,从原始特征中选择一小部分最有效特征,达到降维的效果。目前特征选择算法种类繁多,其中,基于稀疏矩阵结构的特征选择算法由于具有模型简单易懂和易求解的特点而被学者们广泛关注。本文归纳总结了基于稀疏矩阵结构的特征选择算法分类,重点介绍了鲁棒特征选择模型和多视图特征选择模型。首先,介绍了基于稀疏矩阵结构的特征选择算法基本框架;然后,介绍了基于稀疏矩阵结构的一般模型、鲁棒特征选择模型、多视图的特征选择模型,比较了它们在解决目前特征选择算法研究难点中存在的优势和不足;最后,对基于稀疏矩阵结构的特征选择算法进行了总结。文章阐明了理论研究中存在的问题和难点,探讨了基于稀疏矩阵结构的特征选择算法发展思路。 展开更多
关键词 稀疏矩阵结构 特征选择 降维 分类
下载PDF
融合Lasso的近似马尔科夫毯特征选择方法
13
作者 刘明 杜建强 +3 位作者 李郅琴 罗计根 聂斌 张梦婷 《计算机工程与应用》 CSCD 2024年第8期121-130,共10页
在特征选择问题中,近似马尔科夫毯常用于判断冗余特征,但所得到的冗余特征并不完全相同,因此,在直接使用近似马尔科夫毯删除冗余特征时,存在可能导致信息丢失的情况,影响模型精度。为此,提出一种用于中药代谢组学高维小样本数据的融合La... 在特征选择问题中,近似马尔科夫毯常用于判断冗余特征,但所得到的冗余特征并不完全相同,因此,在直接使用近似马尔科夫毯删除冗余特征时,存在可能导致信息丢失的情况,影响模型精度。为此,提出一种用于中药代谢组学高维小样本数据的融合Lasso的近似马尔科夫毯特征选择方法。方法分为两个阶段,第一阶段,通过最大信息系数对特征的相关度分析过滤无关特征;第二阶段,采用近似马尔科夫毯构建相似特征组,使用Lasso评估相似特征组中特征影响力,迭代去除冗余特征。通过实验对比表明,该算法可以在一定程度上减少有用信息丢失,去除无关特征和冗余特征,提高模型精度和稳定性。 展开更多
关键词 近似马尔科夫毯 Lasso 特征选择 高维小样本 中医药信息
下载PDF
求解函数优化和特征选择的改进金豺狼优化算法
14
作者 邹睿 焦慧 龙文 《信阳师范学院学报(自然科学版)》 CAS 2024年第1期113-119,共7页
针对基本金豺狼优化算法(Golden Jackal Optimization,GJO)在解决高维优化问题时存在计算精度低、开发能力弱、容易陷入局部最优的缺点,提出一种改进GJO算法(I-GJO)。在改进算法中,设计一种基于正弦函数的非线性能量因子替代原随机递减... 针对基本金豺狼优化算法(Golden Jackal Optimization,GJO)在解决高维优化问题时存在计算精度低、开发能力弱、容易陷入局部最优的缺点,提出一种改进GJO算法(I-GJO)。在改进算法中,设计一种基于正弦函数的非线性能量因子替代原随机递减能量因子,以平衡算法在搜索过程中的全局探索和局部开发能力。在算法迭代后期引入翻筋斗学习策略,从而扩大群体搜索范围和改善解的精度。为了验证I-GJO算法的有效性,选取6个基准函数优化问题进行数值实验,并与灰狼优化、海鸥优化算法和基本GJO算法比较。结果表明,I-GJO获得较高的精度和较快的收敛速度。最后利用I-GJO算法求解特征选择问题,对16个基准数据集的数值结果显示,改进算法能有效去除冗余特征和提高分类精度。 展开更多
关键词 金豺狼优化算法 翻筋斗学习策略 函数优化 特征选择
下载PDF
融合特征权重与改进粒子群优化的特征选择算法
15
作者 刘振超 苑迎春 +1 位作者 王克俭 何晨 《计算机工程与科学》 CSCD 2024年第2期282-291,共10页
随着教育信息化的发展,教育数据呈现特征数量高、冗余度高等特点,这使目前的分类算法在教育数据上分类准确率不理想。提出一种将特征权重算法与改进粒子群优化算法融合的混合式特征选择算法(RF-ATPSO)。该算法首先使用RELIEF-F算法计算... 随着教育信息化的发展,教育数据呈现特征数量高、冗余度高等特点,这使目前的分类算法在教育数据上分类准确率不理想。提出一种将特征权重算法与改进粒子群优化算法融合的混合式特征选择算法(RF-ATPSO)。该算法首先使用RELIEF-F算法计算各个特征的权重,筛除冗余特征,然后在筛选后的特征集合中利用改进粒子群算法搜索最优特征子集。实验结果表明,在6个UCI公共数据集上,经RF-ATPSO算法进行特征选择后,平均准确率提升了10.04%,且平均特征子集规模最小、收敛速度最快;在学生学业成绩画像特征数据集上,该算法以较小的特征子集规模达到较高的分类准确率,平均准确率为94.77%,明显优于其它特征选择算法,实验充分证明了该算法具有实际应用意义。 展开更多
关键词 特征选择 特征权重 改进粒子群优化 T-分布
下载PDF
基于混合式特征选择的滚动轴承故障诊断方法
16
作者 司宇 章翔峰 +1 位作者 张罡铭 姜宏 《现代电子技术》 2024年第1期171-176,共6页
为降低滚动轴承故障特征集的维数,提升诊断精度,提出一种混合式特征选择方法。该方法由两个阶段构成,首先通过费舍尔分值法对原始特征集进行预排序,根据特征的费舍尔得分按照降序排序,利用得分曲线的拐点确定预选子集的范围,去除原始特... 为降低滚动轴承故障特征集的维数,提升诊断精度,提出一种混合式特征选择方法。该方法由两个阶段构成,首先通过费舍尔分值法对原始特征集进行预排序,根据特征的费舍尔得分按照降序排序,利用得分曲线的拐点确定预选子集的范围,去除原始特征集中的无关特征;然后将遗传算法嵌入Wrapper阶段中,利用分类器的识别精度作为评价标准,从预选子集中去除冗余特征,确定最优子集。通过实验证明,该方法可以有效地用于滚动轴承不同故障类型和不同故障程度的诊断,最优子集在仅保留了关键特征的同时,识别精度得到提升。 展开更多
关键词 滚动轴承 混合式特征选择 费舍尔分值 遗传算法 冗余特征 故障诊断
下载PDF
基于自适应密度邻域关系的多标签在线流特征选择
17
作者 张海翔 李培培 胡学钢 《计算机技术与发展》 2024年第1期23-29,共7页
流特征选择指从以流形式到来的特征数据中选出最优特征子集,现有方法大多在模型训练中需要事先学习领域信息并预设给定参数值。实际应用中,由于不同的数据集数据结构和来源不同,在模型学习过程中研究人员无法提前获取相关领域知识且针... 流特征选择指从以流形式到来的特征数据中选出最优特征子集,现有方法大多在模型训练中需要事先学习领域信息并预设给定参数值。实际应用中,由于不同的数据集数据结构和来源不同,在模型学习过程中研究人员无法提前获取相关领域知识且针对不同类型数据集指定一个统一参数存在巨大挑战。基于此,提出一种基于自适应密度邻域关系的多标签在线流特征选择方法(multi-label online stream feature selection based on adaptive density neighborhood relation,ML-OFS-ADNR),基于邻域粗糙集理论,所提方法在特征依赖计算时无需任何先验领域信息。此外,提出了一种新的自适应密度邻域关系,使用周围实例的密度信息,可以在流特征选择过程中自动选择适当数量的邻域,不需要事先指定任何参数。通过模糊等价约束,ML-OFS-ADNR可以选择高依赖低冗余度的特征。实验表明在10种不同类型的数据集上,所提方法在特征数量相同的情况下优于传统特征选择方法和先进的在线流特征选择方法。 展开更多
关键词 多标签分类 特征 邻域粗糙集 自适应密度邻域 在线流特征选择
下载PDF
基于特征选择下机器学习的活动性结核病辅助诊断
18
作者 肖敬达 黄玉麟 +4 位作者 刘博闻 刘伟 黄辉彬 张东旭 夏宁邵 《厦门大学学报(自然科学版)》 CAS CSCD 2024年第1期134-141,共8页
[目的]对疑似结核病患者进行细胞因子联合检测,并通过多种结合特征选择的机器学习算法对细胞因子水平进行分析,以实现活动性结核病的辅助诊断.[方法]基于42位活动性结核患者和38位非活动性结核患者的血清细胞因子水平数据,采用改进的多... [目的]对疑似结核病患者进行细胞因子联合检测,并通过多种结合特征选择的机器学习算法对细胞因子水平进行分析,以实现活动性结核病的辅助诊断.[方法]基于42位活动性结核患者和38位非活动性结核患者的血清细胞因子水平数据,采用改进的多种群遗传算法(IMPGA)、多种群遗传算法(MPGA)、粒子群优化算法(PSO)和皮尔逊相关系数(PCC)筛选4种特征选择方法,结合逻辑回归(LR)、支持向量机(SVM)和极端梯度提升(XGBoost)3种分类器,探究活动性结核病分类效果并甄选关键特征.[结果]结合特征选择的机器学习方法相对于无特征选择的机器学习方法直接应用有明显提升,所有方法中IMPGA-SVM分类效果最佳,筛选结果平均特征个数为4.4,受试者工作特征曲线下面积为0.880.分析最佳算法特征选择结果,发现使用结核抗原ESAT6/CFP10融合蛋白刺激后的γ-干扰素诱导单核细胞因子T(MIG-T)出现的次数较其他特征更频繁.[结论]综上,结合特征选择的机器学习方法可辅助诊断活动性结核病. 展开更多
关键词 细胞因子 活动性结核 特征选择 机器学习
下载PDF
结合人工蜂群与K-means聚类的特征选择
19
作者 孙林 刘梦含 薛占熬 《计算机科学与探索》 CSCD 2024年第1期93-110,共18页
K-means聚类是一种简捷高效、收敛速度快且易于实现的统计分析方法,但是传统的K-means聚类算法对初始聚类中心的选取敏感且易陷入局部最优,同时多数无监督特征选择算法容易忽视特征之间的联系。为此,提出了一种结合人工蜂群与K-means聚... K-means聚类是一种简捷高效、收敛速度快且易于实现的统计分析方法,但是传统的K-means聚类算法对初始聚类中心的选取敏感且易陷入局部最优,同时多数无监督特征选择算法容易忽视特征之间的联系。为此,提出了一种结合人工蜂群与K-means聚类的特征选择方法。首先,为了使同一簇中样本的相似度高而不同簇中样本的相似度低,基于簇内聚集度和簇间离散度构建了新的适应度函数,更好地反映各样本的特性,进而构建了蜜源被选择新的概率表达式;其次,设计了随着迭代次数的增加而数值逐渐减小的权重,提出了使蜂群搜索范围动态缩进的蜜源位置更新表达式;然后,为了弥补传统的欧氏距离在计算距离时仅考虑向量之间的累积差异而表现出的局限性,构造了同时考虑样本影响程度不同以及样本的相似性的加权欧氏距离表达式;最后,引入标准差和距离相关系数,定义了特征区分度与特征代表性,以二者之积度量特征重要性。实验结果表明,所提算法加快了人工蜂群算法的收敛速度并提高了K-means算法的聚类效果,同时也有效地提升了特征选择的分类效果。 展开更多
关键词 特征选择 人工蜂群 K-MEANS聚类 特征重要度
下载PDF
基于网络结构设计的图神经网络特征选择方法
20
作者 徐大鹏 侯新民 《计算机应用》 CSCD 2024年第3期663-670,共8页
近年来,研究人员针对图神经网络(GNN)提出了许多改进的模型架构设计,推动了各种预测任务的性能提升。但大多数GNN变体在开始都认为节点的特征同等重要,而实际情况并非如此。针对这个问题,提出一种特征选择方法来改进现有模型,并为数据... 近年来,研究人员针对图神经网络(GNN)提出了许多改进的模型架构设计,推动了各种预测任务的性能提升。但大多数GNN变体在开始都认为节点的特征同等重要,而实际情况并非如此。针对这个问题,提出一种特征选择方法来改进现有模型,并为数据集选择出重要特征子集。所提方法由特征选择层和标签-特征单独映射两个组件构成。在特征选择层中使用Softmax归一化器和特征“软选择器”进行特征选择,在标签-特征单独映射思想下设计模型结构,为不同的标签选择对应的相关特征子集,并将多个相关特征子集作集合并运算得到最终数据集的重要特征子集。选取图注意力网络(GAT)和GATv2模型为基准模型,将算法应用到基准模型中得到新模型。实验结果表明,所提模型在6个数据集上执行节点分类任务时,准确率相较于基准模型提升了0.83%~8.79%;新模型也为6个数据集选择了对应的重要特征子集,这些重要特征子集的特征数量占各自数据集总特征数的3.94%~12.86%,将重要特征子集作为基准模型的新输入后仍然获得了95%以上的准确率(使用了所有特征),即在保证准确率的基础上减小了模型的规模。可见,所提方法能够提高节点分类准确率,并有效地为数据集选择对应的重要特征子集。 展开更多
关键词 图神经网络 图注意力网络 特征选择 节点分类 深度学习
下载PDF
上一页 1 2 250 下一页 到第
使用帮助 返回顶部