期刊文献+
共找到9篇文章
< 1 >
每页显示 20 50 100
基于粒子群优化的模糊C-均值聚类算法研究 被引量:23
1
作者 王纵虎 刘志镜 陈东辉 《计算机科学》 CSCD 北大核心 2012年第9期166-169,共4页
针对用模糊C-均值聚类算法选择初始聚类中心敏感及模糊加权指数m对模糊C-均值聚类算法的聚类性能影响较大等问题,利用粒子群优化算法的全局寻优能力强及收敛速度较快的特点,结合模糊C-均值算法提出一种新的模糊聚类算法;采用了一种简单... 针对用模糊C-均值聚类算法选择初始聚类中心敏感及模糊加权指数m对模糊C-均值聚类算法的聚类性能影响较大等问题,利用粒子群优化算法的全局寻优能力强及收敛速度较快的特点,结合模糊C-均值算法提出一种新的模糊聚类算法;采用了一种简单有效的粒子编码方法,将初始聚类中心和模糊加权指数m同时进行粒子群优化搜索,在得到最优适应度的同时,m也收敛到一个稳定的最优解,从而有效地解决了上述问题。算法在人工合成数据集和多个UCI数据集上都取得了较好的效果。 展开更多
关键词 聚类 模糊C-均值聚类 粒子群优化 粒子编码 初始聚类中心
下载PDF
一种改进的粒子群优化快速聚类算法 被引量:15
2
作者 王纵虎 刘志镜 陈东辉 《西安电子科技大学学报》 EI CAS CSCD 北大核心 2012年第5期61-65,78,共6页
提出了一种改进的基于粒子群优化的快速K均值算法,有效克服了K均值算法对初始聚类中心敏感和容易陷入局部最优从而影响聚类效果等缺点.与已有的粒子群优化聚类算法相比,该算法通过对样本各维属性进行规范化,预先计算样本的相异度矩阵,... 提出了一种改进的基于粒子群优化的快速K均值算法,有效克服了K均值算法对初始聚类中心敏感和容易陷入局部最优从而影响聚类效果等缺点.与已有的粒子群优化聚类算法相比,该算法通过对样本各维属性进行规范化,预先计算样本的相异度矩阵,提出了一种简化的粒子的编码规则,基于相异度矩阵进行粒子群优化K均值聚类,在保证聚类效果的基础上,有效降低了计算的复杂度.在多个UCI数据集上的实验结果表明,该算法是有效的。 展开更多
关键词 粒子群优化 聚类 K均值 相异度 适应度
下载PDF
两阶段混合粒子群优化聚类 被引量:4
3
作者 王纵虎 刘志镜 陈东辉 《西南交通大学学报》 EI CSCD 北大核心 2012年第6期1034-1040,1063,共8页
为解决数据集样本维数较高时已有粒子群优化K均值算法计算速度较慢且聚类结果不稳定的问题,利用第1阶段聚类层次凝聚聚类获得准确率较高的子簇集合,作为粒子群优化K均值聚类算法初始聚类中心的搜索空间,进行第2阶段聚类.提出了一种简化... 为解决数据集样本维数较高时已有粒子群优化K均值算法计算速度较慢且聚类结果不稳定的问题,利用第1阶段聚类层次凝聚聚类获得准确率较高的子簇集合,作为粒子群优化K均值聚类算法初始聚类中心的搜索空间,进行第2阶段聚类.提出了一种简化的粒子编码方法,以减小样本维数对计算复杂度的影响;引入混沌的思想,以保持粒子种群的多样性,从而避免粒子群优化算法可能出现的早熟现象.通过两阶段聚类,有效地融合了粒子群优化、层次聚类与划分聚类算法的优点.在多个UCI数据集上的聚类结果表明,与几种对比算法聚类结果的最优值相比,其纯度分别提高了1%~8%,且耗时减少50%以上. 展开更多
关键词 聚类 相异度 粒子群优化 粒子编码 初始聚类中心
下载PDF
一种成对约束限制的半监督文本聚类算法 被引量:5
4
作者 王纵虎 刘速 《计算机科学》 CSCD 北大核心 2016年第12期183-188,共6页
半监督聚类能利用少量标记数据来提高聚类算法性能,但大部分文本聚类算法无法直接应用成对约束等先验信息。针对文本数据高维稀疏的特点,提出了一种半监督文本聚类算法。将成对约束信息扩展后嵌入文档相似度矩阵,在此基础上根据已划分... 半监督聚类能利用少量标记数据来提高聚类算法性能,但大部分文本聚类算法无法直接应用成对约束等先验信息。针对文本数据高维稀疏的特点,提出了一种半监督文本聚类算法。将成对约束信息扩展后嵌入文档相似度矩阵,在此基础上根据已划分与未划分文档之间的统计信息逐步找出剩余未划分文本集合中密集的且与已划分聚类中心集合相似度较小的K个初始聚类中心集合,然后将剩余的相对较难区分的文档结合成对约束限制信息划分到K个初始聚类中心集合,最后通过融合成对约束违反惩罚的收敛准则函数对聚类结果进行进一步优化。算法在聚类过程中自动确定初始聚类中心集合,避免了K均值算法对初始聚类中心选择的敏感性。在几个中英文数据集上的实验结果表明,所提算法能有效地利用少量的成对约束先验信息提高聚类效果。 展开更多
关键词 聚类 半监督 向量空间模型 成对约束 文本
下载PDF
基于统计学习的自适应文本聚类 被引量:2
5
作者 王纵虎 刘志镜 陈东辉 《四川大学学报(工程科学版)》 EI CAS CSCD 北大核心 2012年第1期106-111,117,共7页
针对文本数据的高维性和稀疏性从而使传统的聚类算法在文本聚类应用中的表现不能让人满意的问题,通过计算文档相似度矩阵,在聚类过程中动态地统计学习已划分和未划分文本集合的相关信息,探测剩余未划分的数据集中的与已划分类簇覆盖度... 针对文本数据的高维性和稀疏性从而使传统的聚类算法在文本聚类应用中的表现不能让人满意的问题,通过计算文档相似度矩阵,在聚类过程中动态地统计学习已划分和未划分文本集合的相关信息,探测剩余未划分的数据集中的与已划分类簇覆盖度较小的最大密集区域,逐步生成预定数目的初始聚类中心集合,最后将剩余文档划分到最相似的初始聚类中心集合完成聚类,从而有效地减小了划分聚类算法对初始聚类中心的敏感性。算法中的一些阈值参数均通过在聚类过程中动态地对数据集进行统计学习得到,避免了多数聚类算法通过经验或实验设定阈值参数的盲目性,在不同数据集上的鲁棒性更强。在几个中英文数据集上的实验结果表明本文算法在不同数据集上表现良好,优于CLUTO聚类器中的聚类算法。 展开更多
关键词 聚类 向量空间模型 相似度 划分 阈值
下载PDF
数据挖掘在客户全生命周期管理中的应用研究 被引量:1
6
作者 王纵虎 刘速 杨文军 《微型电脑应用》 2016年第6期73-76,共4页
随着企业客户信息和交易数据不断积累,如何从这海量的数据中发现隐藏背后的有价值的客户特征、消费行为特征、客户价值等知识,从而更好地识别、获取、发展、保持客户,改进对客户的服务水平,提高客户的价值、满意度和忠诚度,为客户提供... 随着企业客户信息和交易数据不断积累,如何从这海量的数据中发现隐藏背后的有价值的客户特征、消费行为特征、客户价值等知识,从而更好地识别、获取、发展、保持客户,改进对客户的服务水平,提高客户的价值、满意度和忠诚度,为客户提供更好的服务的同时为企业带来更多的利润是每个企业都迫切关注的问题。介绍了客户全生命周期各个阶段的特点,总结了常用的客户关系管理相关的典型分析场景,提出了数据挖掘如何切入客户全生命周期各个阶段,并对企业中进行数据挖掘需要注意的问题进行了思考。 展开更多
关键词 客户全生命周期 客户细分 客户价值
下载PDF
融合客户群体特征的商品关联分析
7
作者 王纵虎 刘速 杨文军 《石油规划设计》 2016年第3期1-5,56,共5页
传统的商品关联分析大多通过统计商品共现的频繁项集,发现商品之间的关联关系,缺少对商品与客户群体特征之间关联性分析的应用。提出了通过将客户群体进行RFM(近因、频率、金额)分群,将客户分群及客户特征信息与商品事务融合。结合关联... 传统的商品关联分析大多通过统计商品共现的频繁项集,发现商品之间的关联关系,缺少对商品与客户群体特征之间关联性分析的应用。提出了通过将客户群体进行RFM(近因、频率、金额)分群,将客户分群及客户特征信息与商品事务融合。结合关联分析算法自动发现商品与商品、商品与客户群、商品与客户特征、客户群与客户特征、客户特征与客户特征之间的关联关系,通过兴趣度评估度量发现其中的有意义的规则。针对加油站个人记名卡客户交易数据进行了关联分析,实现了商品与客户群、客户特征之间强关联关系的自动发现,从而为商品组合推荐、优惠促销组合、客户群体精准营销与交叉销售、统计分析等提供决策支持。 展开更多
关键词 关联规则 购物篮分析 置信度 支持度 客户特征 客户群 RFM
下载PDF
一种基于粒子群优化的可能性C均值聚类改进方法 被引量:7
8
作者 陈东辉 刘志镜 王纵虎 《计算机科学》 CSCD 北大核心 2012年第11期122-126,共5页
提出了一种基于粒子群优化的可能性C均值(Possibilistic C-means,PCM)聚类改进方法。该方法首先通过改进PCM算法的目标函数来计算数据模式的隶属度矩阵和聚类中心完成粒子编码,从而降低算法对初始中心的敏感,提高聚类的精度;其次,通过... 提出了一种基于粒子群优化的可能性C均值(Possibilistic C-means,PCM)聚类改进方法。该方法首先通过改进PCM算法的目标函数来计算数据模式的隶属度矩阵和聚类中心完成粒子编码,从而降低算法对初始中心的敏感,提高聚类的精度;其次,通过粒子群优化(Particle Swarm Optimization,PSO)算法对编码进行优化,以有效地克服PCM聚类算法容易导致聚类一致性和陷入局部最优解的缺点,减少算法的迭代次数。通过人造数据集和UCI数据集上的实验,表明该算法在计算复杂度、聚类精度和全局寻优能力方面表现得较为突出。 展开更多
关键词 模糊聚类 粒子群优化 模糊C均值 可能性C均值
下载PDF
决策树算法在成品油零售客户流失预测中的应用 被引量:1
9
作者 刘速 王纵虎 杨文军 《石油规划设计》 2016年第2期26-31,48,共6页
企业竞争加剧了,客户对企业来说就成了最重要的资源,如何在客户即将流失之前有效地发现他们,并对其特征进行刻画,从而帮助营销部门确定客户挽留市场活动的目标客户群以及合适的营销方案这是企业分析部门的重要工作。利用IBM SPSS Modele... 企业竞争加剧了,客户对企业来说就成了最重要的资源,如何在客户即将流失之前有效地发现他们,并对其特征进行刻画,从而帮助营销部门确定客户挽留市场活动的目标客户群以及合适的营销方案这是企业分析部门的重要工作。利用IBM SPSS Modeler数据挖掘软件构建石油零售企业的客户流失预测模型,采用CRISP-DM标准,将C5.0决策树模型用于客户流失分析,对每个月濒临流失的客户进行预测,并回访以协助客户营销人员做出合适的营销策略。流失分析的实验结果,表明该模型的计算准确率超过80%。 展开更多
关键词 决策树 数据挖掘 客户流失 分析预测
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部