期刊文献+

基于Sas的时间序列缺失值处理方法比较 被引量:11

Comparison of Methods on Time Series' Missing Value Based on Sas
下载PDF
导出
摘要 对于时间序列挖掘过程中的缺失值处理,目前有许多方法。在处理数据变量成一定的相关的数据集时,回归模型不失为较好的插补方法。利用均值插补、一元线性回归、多元线性回归、迭代回归方法对水文时间序列数据集的缺失数据进行处理,比较不同的皮氏相关系数下各方法的优劣及适用性。文中研究表明当数据集中存在与缺值变量相关度较大的变量时,一元线性回归的插补简单直观,且有较高的精度,结果接近真实;当数据集中不存在与缺值变量显著相关的自变量时,一元线性回归的结果变差,多元线性回归与多元迭代回归具有较好的结果,但多元迭代回归迭代次数难以确定,插补代价较大,多元线性回归为最佳选择;当缺值变量与其他自变量相关系数均较小时,回归插补的结果不理想,此时可考虑其他插补方法。 There are many methods for dealing with missing value on time series data. When the variables of the data are correlative, the regression model is better than other methods. Handles missing value of hydrological by using mean interpolation, single linear regression, multiple linear regression and interative regression method. Shows that when the data set exists the variable which relates with given variable elosely, the single linear regression is better than other methods. If the data set doesn't,multiple linear regression is best. If the pearson correlation between the given variable and other variables is small, may consider other interpolation method.
出处 《计算机技术与发展》 2008年第10期43-45,共3页 Computer Technology and Development
基金 福建省自然科学基金资助项目(A031008)
关键词 时间序列 皮氏相关系数 回归模型 迭代回归模型 time series pearson correlation one - stepregression model iterative regression model
  • 相关文献

参考文献7

  • 1BROCKWELL P J, DAVIS R J.时间序列的理论与方法[M].田铮,译.北京;高等教育出版社,2001.
  • 2Little R J A,Rubin D B.缺失数据统计与分析[M].孙山译.北京:中国统计出版社,2004.
  • 3金勇进.缺失数据的插补调整[J].数理统计与管理,2001,20(6):47-53. 被引量:68
  • 4刘鹏,雷蕾,张雪凤.缺失数据处理方法的比较研究[J].计算机科学,2004,31(10):155-156. 被引量:24
  • 5Han Jiawei,Kamber M.数据挖掘:概念与技术[M].第2版.范明等译.北京:机械工业出版社,2007.
  • 6Albrecht G H. Multivariate morphometrics with missing data: techniques for canonical variates and generalized distances[J]. Am J phys. Anthropol, 1992,14(S14) .42 - 48.
  • 7Jackson E C. Missing values in linear multiple discrminant analysis[ J ]. Biometrics, 1968,23: 835 - 844.

二级参考文献7

  • 1Cios K J,Kurgan L A. Trends in Data Mining and Knowledge Discovery. In: Knowledge discovery in advanced information systems, Pal, N. R. , Jain, L. C. , Teoderesku N. eds. Springer,2002
  • 2H Liu,Motoda H. Feature Extraction, Construction and Selection: A Data Mining Perspective, Kluwer Academic, Boston:MA, 1998
  • 3Troyanskaya O, et al. Missing value estimation methods for DNA, Bioinformatics,2001. 520-525
  • 4Kantardzic M. Data Mining Concepts, Models, Methods and Algorithms, Wiley-IEEE Computer Society Pr, 2003
  • 5Ian H. Witten and Eibe Frank, Data Mining Practical Machine Learning Tools and Techniques with Java Implementations, Morgan Kaufmann Publishers, 2000
  • 6Marshel A H. Bayesian Belief Network Using Conditional Phasetype Distributions: [PhD Thesis]. University of Ulster, 2001
  • 7金勇进,朱琳.不同差补方法的比较[J].数理统计与管理,2000,19(4):50-54. 被引量:20

共引文献91

同被引文献103

引证文献11

二级引证文献46

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部