一个中国民航客运量的回归模型中, 以民航客运量(万人)为因变量Y, 国民收入(亿元) 为自变量X, 进行了回归, 使用的数据为年度数据。部分结果如下, 根据结果回答问题。
| 模型 | 平方和 | df |
| 1 回归 残差 总计 |
13553299.73 - 13843371.75 |
- - 15 |
系数a
| 模型 | 非标准化系数 | 标准系数 | t | Sig. | |
| B | 标准误差 | 试用版 | |||
| 1 (常量) X |
-216.110 .143 |
64.701 .006 |
.989 | -3.340 25.576 |
.005 .000 |
根据表中的信息, 回归中共使用了多少年的数据?
由第一张表可知SST的自由度为n-1=15, 故n=16, 即回归中共使用了16年的数据。
计算模型的判定系数R 2 以及两个变量的相关系数。 (计算过程和结果保留3位有效数字)
模型的判定系数为: R2 =SSR/SST=13553299.73/13843371.75=0.979, 因为在一元线性回归中, 模型的判定系数R2 与相关系数的关系为R2 =r2 , 因变量与自变量正相关, 所以两个变量的相关系数为:

计算方差分析表中F统计量的值。
在一元线性回归中, SST=SSE+SSA, 因此由第一张表可求得残差平方和为:
SSE=SST-SSA=13843371.75-13553299.73=290072.02
所以F统计量的值为:

写出回归方程, 并分析t检验的结果。
由第二张表可知, 常数项及回归系数的t统计量对应的p值均小于0.05, 故系数的显著性检验通过, 即常数项与回归系数均显著不为0, 所以回归方程为: Y(∧)=0.143X-216.110。
在根据回归方程进行预测时, 预测值的置信区间有“均值预测”和“个值预测”的区分, 说明这两种置信区间的含义。 哪个置信区间更宽一些?
(1) 均值置信区间估计: 均值置信区间估计是对x的一个给定值x0 , 求出y的平均值的区间估计。 设x0 为自变量x的一个特定值或给定值; E(y0) 为给定x0 时因变量y的平均值或期望值。 当x=x0 时, y(∧)0 =β(∧) 0 +β(∧) 1 x0为E(y0 ) 的估计值。 均值置信区间为:

(2) 个别值预测区间估计: 个别值预测区间估计是对x的一个给定值x0 , 求出y的一个个别值的区间估计。 个别值预测区间为:

对比两个置信区间可知
