基于区域极值点的时间序列聚类算法被引量：6

Clustering Algorithm for Time Series Based on Locally Extreme Point

下载PDF

导出

摘要相异性或相似性度量是数据挖掘领域中的2个基本问题。针对时间序列的相异性度量问题,给出时间序列的区域半径、区域极值点、区域等定义,提出一种区域极值点提取策略。通过提取有代表性的极值点以起到对时间序列数据约简和压缩的作用,进一步定义时间序列的动态时间弯曲距离度量其相异性。以此为基础提出一种新的时间序列层次聚类算法。仿真实验结果表明,与时间序列趋势特征提取等算法相比,该算法在数据的压缩效果和聚类准确率方面均有明显提高。 Dissimilarity or similarity is the key issue in data mining. data is hard to measure because of its original structure. Aiming at the problem of time series similarity measure,this paper proposes a re-description method based on locally extreme point of time series. In which,the original time series is described by extracting the locally extreme points from time series,reflecting the main features of the time series effectively and achieving the compression of time series data. Measuring the extreme series after equal-length treatment enhances the flexibility of the algorithm,and reduces its limitations. Based on the above,it is applied to hierarchical clustering of the time series. Simulation experimental results show that the clustering effect and data compression is obvious,and the clustering accuracy greatly improves compared with other algorithms based on time series trend features extraction.

作者孙雅李志华

机构地区江南大学物联网工程学院轻工过程先进控制教育部重点实验室江南大学物联网工程学院计算机科学与技术系江南大学物联网技术应用教育部工程研究中心

出处《计算机工程》 CAS CSCD 北大核心 2015年第5期33-37,共5页 Computer Engineering

基金中央高校基本科研业务费专项基金资助项目(JUSRP211A41) 江苏省产学研前瞻基金资助项目(BY2013015-23)

关键词时间序列区域极值点重描述数据压缩相似性度量层次聚类 time series locally extreme point re-description data compression similarity measure hierarchical clustering

分类号 TP391 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献17

1Fu Tak Chung.A Review on Time Series Data Mining[J].Engineering Application of Artificial Intelligence,2011,24(1):164-181.
2Krawczak M,Szkatua G.Time Series Envelopes for Classification[C]//Proceedings of IEEE International Conference on Intelligent Systems.London,UK:IEEE Press,2010:156-161.
3Deepa V K,Geetha J R R.Rapid Development of Applications in Data Mining[C]//Proceedings of 20131nternational Conference on Green High Performance Computing.New Delhi,India:[s.n.],2013:145-152.
4国宏伟,高学东,王宏.基于异时间窗划分的时间序列聚类[J].计算机工程,2007,33(21):3-5. 被引量：6
5闫相斌,李一军,崔广斌.事件预测的时间序列数据挖掘方法[J].计算机工程,2006,32(5):29-31. 被引量：4
6Chan K,Fu A W.Efficient Time Series Matching by WAEPlets[C]//Proceedings of the 15th IEEE International Conference on Data Engineering.Sydney,Australia:IEEE Press,1999:117-126.
7余璟明,何希琼,程冬爱.基于离散小波变换的时间序列数据挖掘[J].计算机应用,2005,25(3):652-653. 被引量：3
8Shen Jun,Bao Shudi.The PLR-DTW Method for ECG Based Biometric Identification[C]//Proceedings of the33rd Annual International Conference.Boston,USA:IEEE Press,2011:541-555.
9Lin J,Keogh E,Lonardi S,et al.A Symbolic Represent-ation of Time Series with Implications for Streaming Algorithms[C]//Proceedings of the 8th ACM SIGMOD Workshop on Research Issues in Data Mining and Knowledge Discovery.San Diego,USA:IEEE Press,2003:2-11.
10Kengh E,Chakrabarti K,Pazzani M,et al.Dimensionality Reduction for Fast Similarity Search in Time Series Databases[J].Journal of Knowledge and Information System,2001,3(3):263-286.

二级参考文献56

1肖辉,胡运发.基于分段时间弯曲距离的时间序列挖掘[J].计算机研究与发展,2005,42(1):72-78. 被引量：59
2张旻,张燕平,程家兴.时间序列相似模式的分层匹配[J].计算机辅助设计与图形学学报,2005,17(7):1480-1485. 被引量：6
3张军,陈汉武,马志民.一种时间序列相似性的快速搜索算法[J].南京师范大学学报（工程技术版）,2005,5(3):50-53. 被引量：7
4李洁,高新波,焦李成.基于特征加权的模糊聚类新算法[J].电子学报,2006,34(1):89-92. 被引量：114
5杜奕,卢德唐,李道伦,赵亦朋.一种快速的时间序列线性拟合算法[J].中国科学技术大学学报,2007,37(3):310-314. 被引量：16
6董晓莉,顾成奎,王正欧.基于形态的时间序列相似性度量研究[J].电子与信息学报,2007,29(5):1228-1231. 被引量：34
7刘懿,鲍德沛,杨泽红,赵雁南,贾培发,王家钦.新型时间序列相似性度量方法研究[J].计算机应用研究,2007,24(5):112-114. 被引量：24
8Kim S W, Park D H, Lee H G. Efficient Processing of Subsequence Matching with the Euclidean Metric in Time-Series Databases. Information Processing Letters, 2004, 90 (5) : 253 - 260.
9Kontaki M, Papadopoulos A N, Manolopoulos Y. Adaptive Similarity Search in Streaming Time Series with Sliding Windows. Data & Knowledge Engineering, 2007, 63 (2): 478- 502.
10Peng Z K, Tse P W, Chu F L. An Improved Hilbert-Huang Transform and Its Application in Vibration Signal Analysis. Journal of Sound and Vibration, 2005, 286(1/2) : 187 -205.

共引文献1121

1丁小军,陈杰,李霖,徐碧通,朱晓姝.一种基于聚类结果稳定性来确定聚类数的方法[J].玉林师范学院学报,2020(3):43-47. 被引量：1
2王玥,李文权,梁爽,余静财.基于改进聚类算法的共享汽车网点选址研究[J].武汉理工大学学报,2021,43(2):79-85.
3林耿堃,盛积良.乡村振兴时代背景下农民消费结构变迁研究[J].农业农村部管理干部学院学报,2021(2):76-81. 被引量：3
4高显义,林欣晖.基于文本聚类的变电工程变更特征识别研究[J].建筑经济,2020,41(S02):200-203. 被引量：2
5毛颖颖,杨新凯.融合拓扑势的自适应层次聚类算法研究[J].计算机应用研究,2020,37(S01):37-39.
6张睿恺,吴克河.基于优化特征集的LeNet-5攻击检测模型的态势感知技术[J].计算机应用研究,2020,37(S01):287-289. 被引量：4
7李对红,王裴岩 ,张桂平,张少阳.基于字簇的多模型中文分词方法研究[J].计算机应用研究,2020,37(2):355-359. 被引量：2
8尧少波,蒋励剑,赵文文,卢铮,吴昌聚,陈伟芳.耦合聚类的数据驱动稀薄流非线性本构计算方法[J].航空学报,2022,43(S02):43-56.
9段桂芹.基于改进密度的簇内均值最小距离聚类算法[J].智能计算机与应用,2021,11(12):82-86. 被引量：1
10何睿,余娜,李淼,张峻巍,王浩杰,赵玉茗.基于单细胞RNA测序数据的细胞类型聚类算法[J].智能计算机与应用,2020,10(7):104-108. 被引量：2

同被引文献51

1周黔,吴铁军.基于重要点的时间序列趋势特征提取方法[J].浙江大学学报（工学版）,2007,41(11):1782-1787. 被引量：20
2秦亮曦,史忠植.多时间序列跨事务关联分析研究[J].计算机工程与应用,2005,41(27):10-12. 被引量：4
3喻高瞻,彭宏,胡劲松,郑启伦.时间序列的相似性的分层查询[J].计算机工程与应用,2006,42(23):152-153. 被引量：4
4马慧,汤庸,潘炎.一种基于FP-树的时态关联规则的分区挖掘方法[J].计算机工程,2006,32(17):132-134. 被引量：2
5陈立奇.21世纪的极地科学探索——面临的机遇和挑战[J].自然杂志,2009,31(2):81-87. 被引量：4
6吴铭杰.CAD矢量曲线抽稀的算法和实现[J].测绘与空间地理信息,2010,33(3):207-208. 被引量：1
7王祥涛,赵强.从第25次南极科考论穿越西风带航线选择[J].极地研究,2010,22(2):199-210. 被引量：2
8廖俊,于雷,罗寰,穆中林.基于趋势转折点的时间序列分段线性表示[J].计算机工程与应用,2010,46(30):50-53. 被引量：20
9秦茂芬,李珂.矢量曲线简化方法在多波束测深数据中的应用[J].科技创新导报,2011,8(15):79-79. 被引量：2
10李海林,郭崇慧.基于云模型的时间序列分段聚合近似方法[J].控制与决策,2011,26(10):1525-1529. 被引量：34

引证文献6

1王燕,安云杰.时间序列相似性度量方法[J].计算机工程与设计,2016,37(9):2520-2525. 被引量：4
2黄冬梅,韦躐晟,王振华,何盛琪,苏诚,黄雅馨.TSEA:极地科考在线系统中海量走航数据的剔除算法[J].计算机应用与软件,2017,34(2):53-57. 被引量：1
3王玲,孟建瑶,徐培培,彭开香.基于多维时间序列形态特征的相似性动态聚类算法[J].工程科学学报,2017,39(7):1114-1122. 被引量：13
4王玲,李树林,徐培培,孟建瑶,彭开香.基于频繁项集树的时态关联规则挖掘算法[J].控制与决策,2018,33(4):591-599. 被引量：12
5陈皓,冀敏杰,郭紫园,夏雨.一种时间序列数据的动态密度聚类算法[J].控制理论与应用,2019,36(8):1304-1314. 被引量：7
6卢民荣,郑建宁.基于极值点特征识别的大规模时序数据压缩分析[J].统计与决策,2021,37(20):39-43. 被引量：3

二级引证文献40

1刘春贵,赵筱蓉.PLC控制在高压系统中的应用[J].四川冶金,2000,22(2):57-59.
2宋晓,梁建峰,李维禄,苗庆生,韩璐遥,韦广昊.基于多架构混搭模式的极地海洋数据库建模技术研究[J].极地研究,2018,30(4):411-418. 被引量：5
3夏磊.基于行为识别匹配的用户日常运动检测[J].计算机测量与控制,2018,26(2):264-267. 被引量：2
4王艺霏,彭柏.基于数据双重优化聚类的协同过滤推荐算法[J].信息技术,2018,42(6):115-120. 被引量：1
5王玲,孟建瑶,李俊飞,彭开香.基于多维时态关联规则的演化模糊推理预测算法[J].自动化学报,2018,44(8):1446-1459. 被引量：10
6周冰钰,刘博,王丹,兰宇,马喜然,孙冬冬,霍秋屹.基于自组织中心K-means算法的用户互动用电行为聚类分析[J].电力建设,2019,40(1):68-76. 被引量：29
7李海林,叶益,杨丽彬.基于关联挖掘的图情类主要期刊参考文献分析[J].情报科学,2019,37(6):87-95. 被引量：6
8姜廷慈,李敬有,吕洪柱.基于学习行为时间序列相似性模型的研究[J].齐齐哈尔大学学报（自然科学版）,2019,35(6):1-3. 被引量：1
9陈皓,冀敏杰,郭紫园,夏雨.一种时间序列数据的动态密度聚类算法[J].控制理论与应用,2019,36(8):1304-1314. 被引量：7
10王晓鹏.区间值属性数据集关联规则挖掘算法仿真[J].计算机仿真,2020,37(1):234-238. 被引量：4

1赵军,高满屯,王三民.求平面多边形集凸壳的方法[J].计算机工程与应用,2011,47(1):205-207. 被引量：1
2邹伟锋,朱兆达.空间距离变换的彩色图像目标识别方法[J].南京航空航天大学学报,2007,39(5):601-606.
3陆克中,黄刘生,万颍渝,徐宏力.无线传感器网络中传感器节点的布置[J].小型微型计算机系统,2006,27(11):2003-2006. 被引量：23
4徐玲.根据轮廓特征识别手写体字符的方法[J].图象识别与自动化,1999(1):24-26. 被引量：3
5吕玉增,彭启民,黎湘.基于极值特征的不变性形状识别[J].电子学报,2008,36(4):679-684. 被引量：10
6谢亚楠,佟威,和箫.基于改进人工势场算法的移动机器人路径规划[J].工业控制计算机,2016,29(6):45-46. 被引量：3
7范文婕,王命延,杨文姬.基于深度图像的指尖和掌心特征提取方法[J].计算机应用,2015,35(6):1791-1794. 被引量：6
8杨明.原料辅料堆料机与胶带输送机连锁方式的改进[J].水泥,2013(4):63-63.
9沈亮光,汪学明.基于速度自适应的新型ZRP路由协议[J].计算机工程与设计,2014,35(12):4083-4087. 被引量：2
10张维,丁恩杰,赵亮.无线Mesh网络中基于负载平衡的自适应拥塞控制路由策略[J].煤炭技术,2012,31(8):177-178. 被引量：1

计算机工程

2015年第5期

浏览历史

内容加载中请稍等...

基于区域极值点的时间序列聚类算法被引量：6

参考文献17

二级参考文献56

共引文献1121

同被引文献51

引证文献6

二级引证文献40

相关作者

相关机构

相关主题

浏览历史

基于区域极值点的时间序列聚类算法 被引量：6

参考文献17

二级参考文献56

共引文献1121

同被引文献51

引证文献6

二级引证文献40

相关作者

相关机构

相关主题

浏览历史

基于区域极值点的时间序列聚类算法被引量：6