摘要
时间序列数据量远远大于普通数据库的特点,导致一些通用的数据挖掘工具直接应用于时间序列效果很不理想。为此提出了一种时间序列分段线性化表示算法,这种表示方法将大大提高相似性测量的计算速度。在分段线性化表示的基础上提出了一种相似性计算方法,该方法对于时间序列的多种变形都不敏感。将k-平均(k-mean)聚类算法应用于分段线性化表示的时间序列,聚类结果表明算法非常有效。
The time series database is the great database, generally. Therefore, a new representation of time series is presented, which allows efficient computation of the similar measure. And a method of the similar measure is presented, which is designed to be insensitive to the majority transformation. The k-mean cluster is used for the clustering of the time series. The results show the efficiency of the algorithm.
出处
《系统工程与电子技术》
EI
CSCD
北大核心
2006年第8期1266-1269,共4页
Systems Engineering and Electronics