一种时间序列表示算法及其在聚类中的应用被引量：2

Efficient representation for time series with applications in clustering

下载PDF

导出

摘要时间序列数据量远远大于普通数据库的特点,导致一些通用的数据挖掘工具直接应用于时间序列效果很不理想。为此提出了一种时间序列分段线性化表示算法,这种表示方法将大大提高相似性测量的计算速度。在分段线性化表示的基础上提出了一种相似性计算方法,该方法对于时间序列的多种变形都不敏感。将k-平均(k-mean)聚类算法应用于分段线性化表示的时间序列,聚类结果表明算法非常有效。 The time series database is the great database, generally. Therefore, a new representation of time series is presented, which allows efficient computation of the similar measure. And a method of the similar measure is presented, which is designed to be insensitive to the majority transformation. The k-mean cluster is used for the clustering of the time series. The results show the efficiency of the algorithm.

作者王晓晔孙济洲

机构地区天津大学电子信息工程学院

出处《系统工程与电子技术》 EI CSCD 北大核心 2006年第8期1266-1269,共4页 Systems Engineering and Electronics

关键词时间序列相似性数据挖掘 time series similarity data mining

分类号 TP399 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献6

1康卓,黄竞伟,李艳,康立山.复杂系统数据挖掘的多尺度混合算法[J].软件学报,2003,14(7):1229-1237. 被引量：18
2Wu Y,Agrawal D,El Abbadi A.A comparison of DFT and DWT based similarity search in time series databases[C]∥ Proc.of the 9th ACM CIKM Int'l Conf.on Information and Knowledge Management,2000:488-495.
3郑斌祥,杜秀华,席裕庚.时序数据相似性挖掘算法研究[J].信息与控制,2002,31(3):264-267. 被引量：5
4Keogh E,Pazzani M.An enhanced representation of time series which allows fast and accurate classification,clustering and relevance feedback[C]∥ Proc.of the 4th Int'l Conference on Knowledge Discovery and Data Mining.New York,NY,1998:239-241.
5C Perng,H Wang,S Zhang,et al.Landmarks:a new model for similarity-based pattern querying in time series databases[J] IEEE Conf.on Data Engineering,2000:33-44.
6姜宁,史忠植.文本聚类中的贝叶斯后验模型选择方法[J].计算机研究与发展,2002,39(5):580-587. 被引量：21

二级参考文献26

1[1]H H Bock.Probabilistic models in cluster analysis.Computational Statistics & Data Analysis,1996,23:5～28
2[2]Chris Fraley,Adrian E Raftery.Model-based clustering,discriminate analysis,and density estimation.Department of Statistics,University of Washington,Tech Rep:380,2000
3[3]Petri T Kontkanen,Petri J Myllymaki,Henry R Tirri.Comparing Bayesian model class selection criteria by discrete finite mixtures.In:D L Dowl,K B Korb,J J Oliver eds.Information,Statistics and Induction in Science (Proc of the ISIS'96 Conf in Melbourne.Australia,1996).Singapore:World Scientific,1996.364～374
4[4]An Introduction to Cluster Analysis for Data Mining.http://www.cs.umn.edu/classes/Spring-2000/csci5980-dm/cluster-survey.pdf
5[5]高等数理统计.超星数字图书馆.http://www.ssreader.com.cn.442～444(Advanced Mathematical Statistics (in Chinese),Superstar Digital Library.http://www.ssreader.com.cn.442～444)
6[6]Jeff A Bilmes.A gentle tutorial of the EM algorithm and its application to parameter estimation for Gaussian mixture and hidden Markov models.Computer Science Division Department of Electrical Engineering and Computer Science,U C Berkeley,Tech Rep:TR-97-021,1998
7[7]R E Kass,A E Raftery.Bayesian factors and model uncertainly.Department of Statistics,Carnegie-Mellon University,Tech Rep:571,1993
8[8]I J Good.Weight of evidence:A brief survey.In:J M Bernade ed.Bayesian Statistics 2.New York:Elsevier,1985.249～269
9[9]贝叶斯统计推断.超星数字图书馆.http://www.ssreader.com.cn(Bayesian Inferential Statistics (in Chinese).Superstar Digital Library.http://www.ssreader.com.cn)
10[10]P Cheeseman,J Stutz.Bayesian Classification (AutoClass):Theory and results.In:U M Tayyad ed.Knowledge Discovery in Data Bases II.AAAI Press /The MIT Press,1995.153～180

共引文献41

1况夯,罗军.基于遗传FCM算法的文本聚类[J].计算机应用,2009,29(2):558-560. 被引量：5
2戴林超,吴琳丽,赵海娜,李训铭.基于最小二乘支持向量机的故障预测法[J].中南大学学报（自然科学版）,2009,40(S1):253-257. 被引量：18
3徐建锁,王正欧.基于LSI和自组织神经网络的高效文本聚类方法[J].天津大学学报（自然科学与工程技术版）,2004,37(11):1026-1030. 被引量：7
4文琪,彭宏.小波变换的离群时序数据挖掘分析[J].电子科技大学学报,2005,34(4):556-558. 被引量：7
5谭小野.数据挖掘在电网安全中的应用[J].东北电力技术,2005,26(8):40-44. 被引量：10
6方新,穆志纯,陈静,杜大鹏.基于汉字与部件聚类的计算机模拟研究[J].计算机应用,2005,25(12):2951-2953.
7曲文龙,樊广佺,杨炳儒.基于支持向量机的复杂时间序列预测研究[J].计算机工程,2005,31(23):1-3. 被引量：32
8林春梅,何跃,汤兵勇,刘兴华.模糊认知图在股票市场预测中的应用研究[J].计算机应用,2006,26(1):195-197. 被引量：8
9俞康庆,周月华,杨荆安,康卓.气象要素时间序列的演化建模分析与短期气候预测[J].干旱气象,2005,23(4):1-6. 被引量：9
10赵亚琴,周献中.一种基于小生境遗传算法的中文文本聚类新方法[J].计算机工程,2006,32(6):206-208. 被引量：4

同被引文献40

1周黔,吴铁军.基于重要点的时间序列趋势特征提取方法[J].浙江大学学报（工学版）,2007,41(11):1782-1787. 被引量：20
2肖辉,胡运发.基于分段时间弯曲距离的时间序列挖掘[J].计算机研究与发展,2005,42(1):72-78. 被引量：59
3余璟明,何希琼,程冬爱.基于离散小波变换的时间序列数据挖掘[J].计算机应用,2005,25(3):652-653. 被引量：3
4黄超,朱扬勇.基于回归系数的时间序列维约简与相似性查找[J].模式识别与人工智能,2006,19(1):52-57. 被引量：3
5闫相斌,李一军,崔广斌.事件预测的时间序列数据挖掘方法[J].计算机工程,2006,32(5):29-31. 被引量：4
6[1]D Hand,H Mannila,P Smyth.Principles of data mining[M].Massachusetts Institute of Technology,2001.
7[2]E Keogh,S Kasetty.On the need for time series data mining Benchmarks:A survey and empirical demonstration[C]//Proceedings of the 8th international conference on knowledge discovery and data Mining.2002:102-111.
8[3]G Das,K Lin,H Mannila,G Renganathan,P Smyth.Rule discovery from time series[C].KDD 1998:16-22.
9[6]Faloutsos C,Ranganathan M,Manolopoulos Y.Fast subsequence matching in time-series databases[C]//Proceedings of the Conference on Management of Data.1994:419-429.
10[7]Chan K,Fu W.Efficient Time Series Matching by Wavelets[C]//Proceedings of the 15th IEEE international conference on data engineering.Sydney,1999:126-133.

引证文献2

1黄超,龚惠群.金融领域时间序列挖掘技术研究[J].东南大学学报（哲学社会科学版）,2007,9(5):36-39. 被引量：5
2孙雅,李志华.基于区域极值点的时间序列聚类算法[J].计算机工程,2015,41(5):33-37. 被引量：6

二级引证文献11

1何典,梁英.金融时间序列数据挖掘的研究与应用[J].世界科技研究与发展,2008,30(1):104-106. 被引量：2
2柴尚蕾,郭崇慧,张震.国际股指波动性的非对称效应异方差模型及聚类分析[J].系统管理学报,2011,20(2):136-142. 被引量：2
3王智钢,王池社,李广水,王蓁蓁.基于SVC的证券行情周K线涨跌预测[J].金陵科技学院学报,2013,29(1):15-19. 被引量：1
4朱一辰,王智钢,李秋玉,陈泽民,徐阳.金融数据分析构件的设计与开发[J].软件工程师,2015(10):18-19. 被引量：1
5王燕,安云杰.时间序列相似性度量方法[J].计算机工程与设计,2016,37(9):2520-2525. 被引量：4
6黄冬梅,韦躐晟,王振华,何盛琪,苏诚,黄雅馨.TSEA:极地科考在线系统中海量走航数据的剔除算法[J].计算机应用与软件,2017,34(2):53-57. 被引量：1
7王玲,孟建瑶,徐培培,彭开香.基于多维时间序列形态特征的相似性动态聚类算法[J].工程科学学报,2017,39(7):1114-1122. 被引量：13
8王玲,李树林,徐培培,孟建瑶,彭开香.基于频繁项集树的时态关联规则挖掘算法[J].控制与决策,2018,33(4):591-599. 被引量：12
9陈皓,冀敏杰,郭紫园,夏雨.一种时间序列数据的动态密度聚类算法[J].控制理论与应用,2019,36(8):1304-1314. 被引量：7
10张巧灵,高淑萍,何迪,程孟菲.基于时间序列的混合神经网络数据融合算法[J].应用数学和力学,2021,42(1):82-91. 被引量：13

1谭锦华,邝献涛.基于ART2神经网络与动态聚类的分类器[J].控制工程,2005,12(S1):68-70. 被引量：5
2胡思康,王翰虎.多媒体数据的聚类分析及其决策树搜索[J].计算机应用,1999,19(S1):154-155.
3刘倩,侯建华,牟海军,赵巍,笪邦友.联合生成与判别模型的目标检测与跟踪[J].中国图象图形学报,2013,18(10):1293-1301. 被引量：8
4贾克斌.信息系统设计中聚类分析方法的研究[J].北京工业大学学报,1999,25(3):31-36. 被引量：5
5易华容.聚类分析中相似性测量方法的研究[J].株洲师范高等专科学校学报,2002,7(2):43-46. 被引量：1
6张娜,李莉娟.时间序列分段线性表示的几种算法比较[J].中国西部科技,2009,8(14):80-81. 被引量：4
7赵建秀,王洪国,邵增珍,张岳,丁艳辉.一种基于信息熵的时间序列分段线性表示方法[J].计算机应用研究,2013,30(8):2391-2394. 被引量：13
8李智霞,李元臣.基于特征的图像视频信息检索研究[J].情报杂志,2007,26(9):117-119. 被引量：2
9姜园,张朝阳,仇佩亮,戚玉鹏.对聚类算法普遍存在问题的解决办法[J].电路与系统学报,2004,9(3):92-99. 被引量：10
10刘祥明,石为人,范敏.一种时间序列连续分段多项式模式表示方法[J].仪器仪表学报,2014,35(5):1052-1056. 被引量：6

系统工程与电子技术

2006年第8期

浏览历史

内容加载中请稍等...

一种时间序列表示算法及其在聚类中的应用被引量：2

参考文献6

二级参考文献26

共引文献41

同被引文献40

引证文献2

二级引证文献11

相关作者

相关机构

相关主题

浏览历史

一种时间序列表示算法及其在聚类中的应用 被引量：2

参考文献6

二级参考文献26

共引文献41

同被引文献40

引证文献2

二级引证文献11

相关作者

相关机构

相关主题

浏览历史

一种时间序列表示算法及其在聚类中的应用被引量：2