基于混沌关联维特征提取的大数据聚类算法被引量：6

Big Data Clustering Algorithm Based on Chaotic Correlation Dimensions Feature Extraction

下载PDF

导出

摘要大数据聚类过程是一个随机的非线性处理过程,具有很高的不确定性。由于传统方法需要先验知识进行学习,不能很好地适应大数据的实时变化情况,无法有效实现大数据聚类,因此提出一种基于混沌关联特征提取的大数据聚类算法。分析了传统方法的弊端,通过重构相空间建立了一个多维的状态空间向量与混沌轨迹,使原系统中很多几何特征量保持不变,为分析原系统的混沌特征提供有效依据。将平均互信息量取第一个最小值时的横坐标所指的时间延迟作为重构相空间的最佳时间延迟,采用虚假最近邻点算法对最佳嵌入维数进行选择。将提取的关联维数这一特征量作为大数据聚类的混沌特征量,依据提取的混沌关联维特征对大数据进行聚类。仿真实验表明,所提算法能够有效提高数据的聚类效率,减少能耗,是一种有效的数据聚类方法。 Big data clustering process is a kind of stochastic nonlinear processing and has very high uncertainty. Because the traditional methods need prior knowledge to learn, are not good to adapt to the real-time change situation of big data and unable to effectively implement large data clustering, we put forward a kind of big data clustering method based on chaotic correlation feature extraction. We analyzed the disadvantages of the traditional methods, established a multidi- mensional state space vector and the chaotic trajectory by phase space reconstruction. Much of the geometry characte- ristic information in the original system remains same, which provides the effective basis for the analysis of chaotic cha- racteristics of the original system. Time delay referred by the abscissa when the average mutual information obtains the first minimum is as the best time delay of reconstructing phase space, and the false nearest neighbor algorithm is used to select the best embedding dimension. The extracted correlation dimension is used as the haotic correlation characteristics of bige data clustering, and big data is clustered based on the extracted chaos correlation dimension feature. The simulation results show that the proposed algorithm can effectively improve the efficiency of the clustering of data, reduce energy consumption,and is an effective method of data clustering.

作者谢川

机构地区空军工程大学航空航天工程学院

出处《计算机科学》 CSCD 北大核心 2016年第6期229-232,共4页 Computer Science

基金陕西自然科学基金:无铅焊点在多场耦合作用下的失效行为及寿命预测方法(2015JM6345)资助

关键词混沌关联维特征大数据聚类 Chaos correlation dimension feature,Big data,Clustering

分类号 TP399 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献12

1孙挺,张锦华,耿国华.基于局部特征概率密度估计的三维模型特征提取方法[J].计算机科学,2015,42(6):293-295. 被引量：4
2李亢,刘东.面向海量数据处理的数据密集型计算发展研究[J].四川兵工学报,2015,36(7):93-96. 被引量：4
3韩岩,李晓.加速大数据聚类K-means算法的改进[J].计算机工程与设计,2015,36(5):1317-1320. 被引量：14
4杨玲,郑思仪.基于混沌理论的舰船辐射噪声特征提取[J].海军工程大学学报,2014,26(4):50-54. 被引量：3
5杨震,徐敏捷,刘璋峰,秦达,姚晓辉.语音大数据信息处理架构及关键技术研究[J].电信科学,2013,29(11):1-5. 被引量：6
6孙海军.基于云计算的大数据处理技术[J].信息安全与技术,2014,5(11):61-63. 被引量：8
7王斌,王超,李晶.大差异网络异常数据特征检测算法的仿真分析[J].计算机仿真,2013,30(8):277-280. 被引量：6
8肖飞,齐立磊.大数据处理技术与探索[J].计算机与现代化,2013(9):75-77. 被引量：16
9管天云,侯春华.大数据技术在智能管道海量数据分析与挖掘中的应用[J].现代电信科技,2014,44(1):71-79. 被引量：15
10常勇智,邱亚泽,郑振,涂毫杰.基于非线性关联维特征提取的机械自动化监测系统[J].计算机与数字工程,2014,42(12):2311-2315. 被引量：3

二级参考文献139

1赵经纬.智能管道建设进入务实阶段中国电信部署三阶段试点方案[J].通信世界,2011(29):30-30. 被引量：1
2颜永红.语言声学与内容理解研究进展[J].应用声学,2012,31(1):35-41. 被引量：1
3吴广君,王树鹏,陈明,李超.海量结构化数据存储检索系统[J].计算机研究与发展,2012,49(S1):1-5. 被引量：31
4崔杰,李陶深,兰红星.基于Hadoop的海量数据存储平台设计与开发[J].计算机研究与发展,2012,49(S1):12-18. 被引量：141
5洪时中,洪时明.用Grassberger－Procaccia方法计算吸引子维数的基本限制[J].物理学报,1994,43(8):1228-1233. 被引量：3
6王文,许武成.对水文时间序列混沌特征参数估计问题的讨论[J].水科学进展,2005,16(4):609-616. 被引量：21
7周涓,熊忠阳,张玉芳,任芳.基于最大最小距离法的多中心聚类算法[J].计算机应用,2006,26(6):1425-1427. 被引量：72
8ZHENG SiYi,GUO HongXia,LI YaAn,WANG BingHe,ZHANG PengYi.A new method for detecting line spectrum of ship-radiated noise using Duffing oscillator[J].Chinese Science Bulletin,2007,52(14):1906-1912. 被引量：22
9韩家炜,坎伯.数据挖掘概念与技术[M].北京:机械工业出版社.2008.
10黄云清.数值计算方法[M].北京:科学出版社,2010:50-55.

共引文献92

1郭涛,李宗南,姚延栋,黄平,王思,翁岩青.超融合时序数据库在果园大数据中存储策略分析[J].中国农业信息,2022,34(6):49-58.
2张方敏,刘芳.大数据视野下湖南花鼓戏影像的网络传播创新[J].传播力研究,2020,4(5):184-185. 被引量：3
3陈龙,万定生,顾昕辰.基于Hive的水利普查数据仓库[J].计算机与现代化,2014(5):127-130. 被引量：9
4于俊婷,刘伍颖,易绵竹,李雪,李娜.国内语音识别研究综述[J].计算机光盘软件与应用,2014,17(10):76-78. 被引量：27
5童光华,李宁,杨晨,徐一晨,桓露,叶新青.面向非技术性损失的用电异常检测方法分析[J].自动化与仪器仪表,2019(2):122-124. 被引量：7
6李静.改进的递归神经网络在网络安全态势监测中的应用[J].西南师范大学学报（自然科学版）,2014,39(7):62-66. 被引量：3
7孙赵旭,谢晓兰,周国清,倪金生,胡莘.基于 Hadoop的Apriori算法与实现[J].桂林理工大学学报,2014,34(3):584-588. 被引量：10
8郭敏杰.大数据和云计算平台应用研究[J].现代电信科技,2014,44(8):7-11. 被引量：20
9魏矿荣,刘慎超,魏东霖,梁智恒,陈万青.大数据对肿瘤登记发展的影响[J].科学通报,2015,60(5):491-498. 被引量：11
10王维斌.长输油气管道大数据管理架构及应用[J].油气储运,2015,34(3):229-232. 被引量：32

同被引文献74

1于杰,李川勇,贾林壮.基于LabVIEW的心电信号采集系统的设计[J].生物医学工程与临床,2001,5(3):131-133. 被引量：15
2温晓通,孟丽艳,朱劲松,姚力.一种非线性时间序列的关联维快速算法[J].北京师范大学学报（自然科学版）,2005,41(4):358-361. 被引量：5
3宁新宝,卞春华,王俊,陈颖.心脏电活动过程的非线性分析[J].科学通报,2006,51(7):764-771. 被引量：20
4李涛,刘延武.基于labview的心电信号采集和分析[J].医疗设备信息,2007,22(6):15-17. 被引量：12
5行鸿彦,黄敏松.基于LabVIEW虚拟仪器的心电信号采集系统的设计[J].电子测量与仪器学报,2008,22(5):107-111. 被引量：28
6吴旭辉,卞春华,范虎伟,宁新宝.HRV信号关联维计算中参数选取的研究[J].北京生物医学工程,2009,28(4):358-362. 被引量：2
7韦高.基于小波变换的心电信号去噪法[J].中国医学装备,2010,7(8):9-11. 被引量：13
8王宗刚,潘峥嵘,祝燎.基于LabVIEW的心电信号采集系统的设计与实现[J].工业仪表与自动化装置,2011(3):40-42. 被引量：11
9白建军,山方,郭盟,李学伟.心电模型中的混沌特性研究[J].电脑知识与技术,2012,8(3):1644-1647. 被引量：2
10王芳,季忠,彭承琳.基于双树复小波变换的心电信号去噪研究[J].仪器仪表学报,2013,34(5):1160-1166. 被引量：43

引证文献6

1张晓婷,李茵,唐晶磊.基于优化聚类算法的大数据分流系统设计仿真[J].计算机仿真,2018,35(12):204-207. 被引量：6
2石芳.中医临床数据中亚健康信息症状检测仿真[J].计算机仿真,2018,35(2):350-353. 被引量：4
3侯莉莎.大数据集合中冗余特征排除的聚类算法设计[J].现代电子技术,2018,41(14):48-50. 被引量：9
4刁爱芹.基于Labview的心电信号关联维数的快速实现[J].中国医学装备,2017,14(12):23-26. 被引量：2
5遇炳杰,张志,刘汝坤.基于云计算的大数据关键特征高效提取方法[J].科学技术与工程,2018,18(19):244-249. 被引量：4
6王雪蓉,万年红.云模式事件混沌关联特征提取的物联网大数据聚类算法[J].计算机应用研究,2021,38(2):391-397. 被引量：9

二级引证文献34

1黄汉威.琴韵音响数码影音中心——AVR9928[J].实用影音技术,2000(3):18-19.
2杨妮,尚宇.基于LabVIEW的心电信号分析系统设计[J].电子设计工程,2019,27(3):36-39. 被引量：8
3李蓉蓉.加密环境下大数据特征集并行存储方法研究[J].现代电子技术,2019,42(18):69-72. 被引量：1
4张昊,赵洋,赵晓红.基于小波分析的网络通信大数据谱聚类算法研究[J].自动化与仪器仪表,2020,0(1):36-39. 被引量：2
5赵云强,韩翼,崔慧茹,郑琳.聚类目标函数下混合属性大数据集分析系统[J].电子设计工程,2020,28(4):73-76. 被引量：3
6郑倩倩.大数据背景下智能网络信息管理系统优化设计[J].信息通信,2020,0(1):175-177. 被引量：7
7刘睿,吴军平.PTN中LAG技术研究与实现[J].电子设计工程,2020,28(7):113-117.
8许汪歆,袁天辰,杨俭.基于密度聚类算法的轨道结构故障诊断研究[J].上海工程技术大学学报,2020,34(1):1-8. 被引量：1
9龙虎,梁丽香.基于大数据分析的混合属性图像冗余特征聚类系统设计[J].现代电子技术,2020,43(13):49-52. 被引量：1
10霍延军.基于大数据的RFID物联网聚类分析原型系统研究[J].单片机与嵌入式系统应用,2020,20(11):17-20. 被引量：2

1吕琛,蔡云龙.基于混沌关联维数的滚动轴承故障诊断[J].数据采集与处理,2010,25(S1):144-148. 被引量：5
2尹长青,许邵斌.利用四叉树解决激光表演系统的布点优化问题[J].计算机光盘软件与应用,2011(20):124-124.
3王艳娜,刘君艺.基于平均互信息与知识图谱的产品预测[J].电子技术（上海）,2017,46(1):51-52. 被引量：1
4李刚,刘华明,王新龙.CAD/CAM中曲面求交技术的研究[J].高技术通讯,2000,10(6):57-58. 被引量：1
5张震,胡学钢.基于互信息量的分类模型[J].计算机应用,2011,31(6):1678-1680. 被引量：5
6郭远华,曾振柄,毕忠勤,郭远刚.基于动态几何技术的平面几何资源库检索[J].计算机应用,2008,28(1):239-241. 被引量：1
7胡汉平,刘双红,王祖喜,吴晓刚.一种混沌多相伪随机序列[J].数学物理学报（A辑）,2004,24(2):251-256. 被引量：3
8Mamoru Minami Akira Yanou Yuya Ito Takashi Tomono.Multiple Chaos Generator by Neural-Network-Differential-Equation for Intelligent Fish-Catching[J].通讯和计算机（中英文版）,2013,10(6):823-831.
9周华.基于混沌理论的滚动轴承故障诊断研究[J].机械工程师,2006(3):144-146. 被引量：1
10徐大宏,王润生.一种实时精确的数字识别方法[J].计算机工程与应用,2005,41(2):87-89. 被引量：7

计算机科学

2016年第6期

浏览历史

内容加载中请稍等...

基于混沌关联维特征提取的大数据聚类算法被引量：6

参考文献12

二级参考文献139

共引文献92

同被引文献74

引证文献6

二级引证文献34

相关作者

相关机构

相关主题

浏览历史

基于混沌关联维特征提取的大数据聚类算法 被引量：6

参考文献12

二级参考文献139

共引文献92

同被引文献74

引证文献6

二级引证文献34

相关作者

相关机构

相关主题

浏览历史

基于混沌关联维特征提取的大数据聚类算法被引量：6