研究人员试图通过随机调查取得60名从业人员的性别、月收入和月消费支出数据, 来建立居民消费支出的预测模型。分析中性别变量的取值为男性等于1,女性等于0。
(1)在调查的实施过程中发现,有6名随机选中的被调查者拒绝提供数据;4名随机选 中的被调查者由于出差等原因没有访问到,因此最后只得到了 50组数据。试分析由此造成 的调查误差类型。对此类误差有哪些补救措施?
这种误差属于无回答误差。无回答误差包括调查者拒绝接受调查,调查人员得 到的是一份空白的答卷,也包括那些调查进行时被访者不在家的情况。无回答误差有时是随 机的,有时是系统性的。
如果无回答误差是随机的,可以通过增大样本量的方式解决;如果无回答误差是系统性 的,解决的途径主要有两个方面,一个是预防,即在调查进行前做好各方面的准备工作,尽 量把无回答误差降到最低程度;另一方面是,当无回答出现后,分析无回答产生的原因,采 取一些补救措施。例如,在无回答单位中再抽取一个样本,实施更有力的调查,并以此作为 无回答层的代表,和回答层的数据结合起来对总体进行估计。
(2)根据得到的50组数据,用Excel进行回归分析(支出为因变量,性别和收入为自变 量),部分结果如表12-7所示。已知居民的平均支出为2188元,计算模型预测误差的离散 系数。
模型预测误差的离散系数为:

(3)Excel输出的方差分析表如表12 -8所示,计算缺少的ABCD四个项目(计算结果取整数)。
方差分析表中,缺少的ABCD四个项目分别为:

(4)写出上表中F检验的零假设和备假设, 根据Excel的计算结果,如果α=0.01, 检验的结论如何?
零假设为:
H0:β1=β2=0,即性别和月收入联合起来对月消费支出没有显著影响
备择假设为:
H1:β1和β2不全为0,即性别和月收入联合起来对月消费支出有显著影响 由于SignificanceF=0.0000 <«=0.01,因此拒绝原假设,即认为性别和月收人联合起 来对月消费支出有显著影响。
(5)根据表12 -9中的结果数据写出回归方程的表达式,说明回归系数的含义, 并计算月收入为3000元的女性的平均支出。
令X1表示月收人,X2表示性别,则回归方程为:

表示,在性别相同的从业人员中,月收人每增加1元,月支出将平均增加0.64元;
表示,在收人相同的从业人员中,女性比男性每个月平均多支出 413. 86 元。
月收入为3000元的女性的平均支出是:

(6)在回归分析中,我们通常需要对回归方程同时做t检验和F检验。这两种检验的目的有何区别?可以相互替代吗?
在一元线性回归中,自变量只有一个,这时F检验和t检验是等价的,即H0:β1=0如果被t检验拒绝,它也将被F检验拒绝。
但是在多元回归分析中,这两种检验的意义是不同的。F检验是用来检验总体线性关系 的显著性,而t检验则是检验各个回归系数的显著性,两者是不等价的,不可以相互替代。