简述多元线性回归模型中存在高度多重共线性的后果,常用的检验方法以及补救办法。
当回归模型中两个或两个以上的自变量彼此相关时,则称回归模型中存在多重共线性。
(1) 多元线性回归模型中存在高度多重共线性产生的后果
① 变量之间高度相关时,可能会使回归的结果混乱,甚至会把分析引入歧途。
② 多重共线性可能对参数估计值的正负号产生影响,特别是βi的正负号有可能同预期 的正负号相反。
(2) 多重共线性常用的检验方法
① 计算模型中各对自变量之间的相关系数,并对各相关系数进行显著性检验。如果有一个或 多个相关系数是显著的,就表示模型中所使用的自变量之间相关,因而存在多重共线性问题。
② 经验判别。具体来说,如果出现下列情况,暗示存在多重共线性:
a. 模型中各对自变量之间显著相关。
b. 当模型的线性关系检验(F检验)显著时,几乎所有回归系数βi的t检验却不显著。
c. 回归系数的正负号与预期的相反。
d. 容忍度与方差扩大因子(VIF)。某个自变量的容忍度等于1减去该自变量为因变量 而其他k-1个自变量为预测变量时所得到的线性回归模型的判定系数,即1-Ri2。容忍度 越小,多重共线性越严重。通常认为容忍度小于0.1时,存在严重的多重共线性。方差扩大因子等于容忍度的倒数,即