期刊文献+
共找到10篇文章
< 1 >
每页显示 20 50 100
一种基于改进差分进化的K-Means聚类算法研究
1
作者 刘红达 王福顺 +3 位作者 孙小华 张广辉 王斌 何振学 《现代电子技术》 北大核心 2024年第18期156-162,共7页
为改进传统K-Means聚类算法中因随机选取初始聚类中心而导致聚类结果不稳定且效率低的缺点,提出一种基于改进差分进化的K-Means聚类算法(AGDE-KM)。首先,设计自适应操作算子来提升算法前期的全局搜索能力和后期的收敛速度;其次,设计多... 为改进传统K-Means聚类算法中因随机选取初始聚类中心而导致聚类结果不稳定且效率低的缺点,提出一种基于改进差分进化的K-Means聚类算法(AGDE-KM)。首先,设计自适应操作算子来提升算法前期的全局搜索能力和后期的收敛速度;其次,设计多变异策略并引入权重系数,在算法的不同进化阶段发挥不同变异策略的优势,平衡算法的全局和局部搜索能力,加快算法的收敛速度;最后,提出一种基于当前种群最佳个体的高斯扰动交叉操作,为个体提供更优进化方向的同时保持种群在“维”上的多样性,避免算法陷入局部最优。将算法停止执行时输出的最优解作为初始聚类中心替代传统K-Means随机选取的聚类中心。将提出算法在UCI公共数据库中的Vowel、Iris、Glass数据集和合成数据集Jcdx上进行对比实验,误差平方和(SSE)相对于传统K-Means分别减小5.65%、19.59%、13.31%、6.1%,聚类时间分别减少83.03%、81.33%、77.47%、92.63%。实验结果表明,提出的改进算法具有更快的收敛速度和更好的寻优能力,显著提升了聚类的效果、效率和稳定性。 展开更多
关键词 K-MEANS聚类算法 差分进化算法 多变异策略 高斯扰动 uci数据库 聚类中心优化
下载PDF
一种基于极限学习机的缺失数据填充方法 被引量:9
2
作者 杨毅 卢诚波 《计算机应用与软件》 CSCD 2016年第10期243-246,共4页
数据处理过程中经常会遇到不完备数据需要填充的问题,寻求简单有效的缺失数据填充方法非常重要。针对该情况,提出一种基于极限学习机ELM(Extreme Learning Machine)的缺失数据填充方法,通过极限学习机网络建模,建立需要填充的缺失属性... 数据处理过程中经常会遇到不完备数据需要填充的问题,寻求简单有效的缺失数据填充方法非常重要。针对该情况,提出一种基于极限学习机ELM(Extreme Learning Machine)的缺失数据填充方法,通过极限学习机网络建模,建立需要填充的缺失属性与其他属性的非线性映射模型。实验结果表明:该方法具有非常好的填充效果。 展开更多
关键词 极限学习机 缺失数据填充 uci机器学习数据库
下载PDF
基于属性差异与相似关系的知识约简方法 被引量:1
3
作者 李文翔 夏德麟 《计算机工程与设计》 CSCD 北大核心 2005年第12期3389-3391,3412,共4页
在数据挖掘系统的研究设计中,知识的获取和表示是一个备受关注的问题。提出的知识约简方法——差异相似矩阵算法,根据信息系统中各个样本的属性取值的差异性和相似性,构建矩阵模型,求取各决策类的最佳约简属性集,得出用于指导分类的规... 在数据挖掘系统的研究设计中,知识的获取和表示是一个备受关注的问题。提出的知识约简方法——差异相似矩阵算法,根据信息系统中各个样本的属性取值的差异性和相似性,构建矩阵模型,求取各决策类的最佳约简属性集,得出用于指导分类的规则知识。基于该算法开发的知识约简系统,能够有效地应用于大规模数据集的分析处理中。 展开更多
关键词 差异相似矩阵算法 知识约简 数据挖掘 uci数据库 粗集理论
下载PDF
基于FCM与KKT条件的增量学习方法 被引量:2
4
作者 张国兵 郎荣玲 《电子设计工程》 2014年第10期25-27,31,共4页
增量学习方法的思想是仅利用部分相关的样本集参与训练,即能够保留历史样本知识,又能够不断地吸收新的知识,提高机器学习效率和精度,解决了大量样本训练时间长和存储空间不足的问题。因此,如何有效地丢弃大量无效的样本点是增量学习算... 增量学习方法的思想是仅利用部分相关的样本集参与训练,即能够保留历史样本知识,又能够不断地吸收新的知识,提高机器学习效率和精度,解决了大量样本训练时间长和存储空间不足的问题。因此,如何有效地丢弃大量无效的样本点是增量学习算法研究的重点。文中提出了一种FCM(Fuzzy C-Means)和KKT(Karush-KuhnTucker)条件结合的增量学习方法,分别从历史样本集和新增样本集两个阶段对无效样本进行过滤,利用余下的样本进行训练。最后,利用UCI数据库中的4组数据进行实验分析,结果证明训练精度与全数据样本的训练精度几乎完全拟合。 展开更多
关键词 FCM KKT 训练精度 支持向量 uci数据库
下载PDF
距离度量学习算法的精确性研究
5
作者 许小媛 黄黎 《现代电子技术》 北大核心 2019年第21期150-153,共4页
距离度量学习是机器学习领域较为活跃的研究课题之一,文中利用UCI(加州大学欧文分校)数据库的数据对度量学习算法进行比较研究。为了寻找一种可靠的没有明确定义标志的算法,选择四种算法在UCI的六个数据集上对距离矩阵进行比较。每个样... 距离度量学习是机器学习领域较为活跃的研究课题之一,文中利用UCI(加州大学欧文分校)数据库的数据对度量学习算法进行比较研究。为了寻找一种可靠的没有明确定义标志的算法,选择四种算法在UCI的六个数据集上对距离矩阵进行比较。每个样本数据集的性质(尺寸和维度)是不同的,因此算法的结果也不同。编码相似度算法在大多数情况下表现良好。在未来的实际应用领域,对于提高无标记数据和相似集的距离度量学习算法的精确性提供了研究基础。 展开更多
关键词 距离度量学习 机器学习 距离矩阵 马氏距离 uci数据库 比较研究
下载PDF
模式分类方法比较研究 被引量:3
6
作者 檀何凤 刘政怡 《计算机技术与发展》 2015年第2期99-102,共4页
模式分类方法是模式识别的关键。文中重点研究了支持向量机、BP神经网络、K近邻、朴素贝叶斯、线性判别分析和二次判别分析共六种模式分类方法,并利用MATLAB对UCI上的数据集进行了分类测试,根据测试结果分析了数据集的样本数、特征数、... 模式分类方法是模式识别的关键。文中重点研究了支持向量机、BP神经网络、K近邻、朴素贝叶斯、线性判别分析和二次判别分析共六种模式分类方法,并利用MATLAB对UCI上的数据集进行了分类测试,根据测试结果分析了数据集的样本数、特征数、类别数对每一种模式分类方法的准确率和运行时间的影响。结果表明,在对一些小数据进行分类时,可以采用朴素贝叶斯、K近邻、线性判别分析方法,而对于大的数据集,支持向量机、BP神经网络、二次判别分析分类方法则比较适合,但对运行时间要求严格的分类不能采用BP神经网络方法。 展开更多
关键词 模式分类 uci数据库 数据分类 模式识别
下载PDF
基于混合身份搜索黏菌优化的模糊C-均值聚类算法 被引量:7
7
作者 贾鹤鸣 张棕淇 +1 位作者 姜子超 冯榆淇 《智能系统学报》 CSCD 北大核心 2022年第5期999-1011,共13页
针对模糊C-均值聚类算法(fuzzy C-means clustering,FCM)对于初始化聚类中心敏感、收敛速度慢,聚类效果不稳定且容易陷入局部最优等问题,提出了一种将黏菌(SMA)与青少年身份搜索(AISA)相融合的自适应优化模糊C-均值算法(AISA-SMA-FCM)... 针对模糊C-均值聚类算法(fuzzy C-means clustering,FCM)对于初始化聚类中心敏感、收敛速度慢,聚类效果不稳定且容易陷入局部最优等问题,提出了一种将黏菌(SMA)与青少年身份搜索(AISA)相融合的自适应优化模糊C-均值算法(AISA-SMA-FCM)。该算法首先通过引入AISA算法中的青少年社会机制,改善SMA算法中的全局搜索和局部开发性能。克服了SMA对于高维数据及部分混峰数据不敏感的缺陷,通过标准测试函数验证改进后的混合AISA-SMA算法寻优求解性能更为优秀;其次此算法用于FCM聚类算法的迭代机制中,通过将AISA-SMA聚类环节加入FCM算法聚类中心迭代过程中,使FCM算法获得自适应优化算法相同的特性,即算法在每次迭代中都将具有探索和开发两个过程,并依据循环迭代次数调节比重,求解聚类结果;最后通过UCI标准数据集仿真测试,利用适应度平均值与聚类正确率评价所提算法的稳定性与有效性,结果表明,AISA-SMA算法用于FCM聚类问题效果较好,AISA-SMA-FCM算法较其他聚类方式和相应的优化技术具有收敛速度快、求解精度高的优点。 展开更多
关键词 模糊C-均值聚类 启发式优化 黏菌算法 青少年身份算法 社会机制 模糊策略 uci数据库 融合算法
下载PDF
基于DSM的知识约简方法研究 被引量:1
8
作者 江昊 晏蒲柳 《武汉大学学报(理学版)》 CAS CSCD 北大核心 2003年第3期378-382,共5页
根据对象属性的差异性与相似性 ,以及对DSM(difference similitudematrix)矩阵元素mdij,msij的特性分析 ,定义了属性的重要度和合并度 ,给出了最佳属性约简集的修正子集的求解方法 ,从而提出了基于DSM的知识约简方法 ,该方法能在保证规... 根据对象属性的差异性与相似性 ,以及对DSM(difference similitudematrix)矩阵元素mdij,msij的特性分析 ,定义了属性的重要度和合并度 ,给出了最佳属性约简集的修正子集的求解方法 ,从而提出了基于DSM的知识约简方法 ,该方法能在保证规则相容的情况下生成少量规则 ,同时只使用部分条件属性 .通过约简UCI机器学习数据库 ,并与粗集理论约简的结果比较 ,表明了该方法的合理性和有效性 ,并在约简效率和规则的正确率上都要好于粗集理论 . 展开更多
关键词 DSM 知识约简 差异-相似性矩阵 数据约简 粗集理论 uci机器学习数据库 属性约简集
下载PDF
基于信息熵理论的动态规划特征选取算法 被引量:6
9
作者 孟洋 赵方 《计算机工程与设计》 CSCD 北大核心 2010年第17期3879-3881,3894,共4页
为了解决小样本多特征数据进行分析和处理的复杂性问题,改善数据挖掘和分析的复杂度,提高挖掘算法处理速度,提出了一种基于信息熵理论的动态规划特征提取算法。该方法利用动态规划算法,并通过基于信息熵概念的可分性判据函数来衡量所选... 为了解决小样本多特征数据进行分析和处理的复杂性问题,改善数据挖掘和分析的复杂度,提高挖掘算法处理速度,提出了一种基于信息熵理论的动态规划特征提取算法。该方法利用动态规划算法,并通过基于信息熵概念的可分性判据函数来衡量所选特征空间的性能,从而进行特征提取和选择,对特征空间进行降维处理。最后采用UCI标准数据库中部分数据对算法进行检验并与其它算法进行比较,比较结果表明,对于小样本多特征的数据采用该算法进行降维处理可以有效降低维度,并且与其它全局最优解的搜索算法相比较能节省计算的开销。 展开更多
关键词 动态规划 特征选取 特征降维 信息熵 uci标准数据库
下载PDF
模式分类在病理诊断中的应用
10
作者 付承彩 马凤英 《齐鲁工业大学学报》 2017年第5期58-61,共4页
模式分类是模式识别及故障诊断中的关键技术,应用于医学领域是一项大胆的尝试。重点采用BP神经网络模式分类方法,利用MATLAB对UCI数据库里的Pima Indians Diabetes数据集进行分类测试。根据测试结果分析BP神经网络模式分类方法用于糖尿... 模式分类是模式识别及故障诊断中的关键技术,应用于医学领域是一项大胆的尝试。重点采用BP神经网络模式分类方法,利用MATLAB对UCI数据库里的Pima Indians Diabetes数据集进行分类测试。根据测试结果分析BP神经网络模式分类方法用于糖尿病诊断的准确率及运行时间。结果显示BP神经网络对于大数据集的分类准确率高,在医疗诊断方向发展具有广阔的应用前景。由于网络隐含层中层数的选择尚无理论上的指导,一般是根据经验或者通过反复实验确定。因此,在一定程度上也增加了网络学习的负担。 展开更多
关键词 模式分类 病理诊断 uci数据库 BP神经网络
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部