某地区五月 份的降雨量y与四月 份的平均气温x(℃) 有关, 假设此关系是线性的。 用Excel对气象站连续12年的统计资料进行回归分析, 得到的部分结果如下:
| 回归统计 | |
| R2 修正的R2 标准误差 观测值 |
0.5413 0.3964 3.5577 12 |
| 系数 | 标准误差 | t统计量 | P-value | |
| 截距 | 12.8435 | 5.8412 | 2.1988 | 0.0525 |
| 气温X | 1.0306 | 0.3594 | 2.8677 | 0.0167 |
| 自由度 | 平方和 | 均方 | F统计量 | Significance F | |
| 归回分析 | a | d | f | h | 0.016 |
| 残差 | b | e | g | ||
| 总计 | c | 230.666 |
假设总体回归模型为Y=β0 +β1X+ε, 请推导β0 和β1 的最小二乘估计量。
解:最小二乘法即估计参数使得: Q=∑(yi -y(∧) i )2 =∑(yi-β 0 -β1 xi)2 最小
令Q=∑(yi -y(∧)i )2 , 在给定样本数据后, Q是β(∧)0, β(∧)1 的函数, 且最小值总是存在。 根据微积分的极值定理, 对Q求相应于β(∧)0 , β(∧)1 的偏导数,并令其等于0, 便可求出β(∧)0 , β(∧)1 :

解上述方程组得:

根据上述结果, 计算五月 份的降雨量y与四月 份的平均气温x的相关系数。(保留2位小数)
由表中数据可得:
由于在回归结果中平均气温x的回归系数符号为正, 故降雨量y与平均气温x的相关系数r为正数。 对于一元线性回归方程来说, 因变量y与自变量x的相关系数

故降雨量y与平均气温x的相关系数:

写出估计的回归方程的表达式, 并说明回归系数的含义。 (保留4位小数)
由回归分析表结果可得回归方程为: Y(∧)=12.8435+1.0306x, 其中回归系数1.0306表示四月 份的平均气温每上升1℃, 五月 份的降雨量增加1.0306个单位。
分别在1%和5%的显著性水平下, 使用F检验结果评价估计方程的显著性。
F检验P值为0.0167, 由于0.1<0.0167<0.5, 故在5%的显著性水平下拒绝原假设, 认为估计方程的整体线性关系显著; 在1%的显著性水平下不能拒绝原假设,即在当前样本下不能认为估计方程的整体线性关系显著。
填出方差分析表中缺少的项目(a~h) 。 (保留2位小数) 。
方差分析表如下:
| 自由度 | 平方和 | 均方 | F统计量 | Significance F | |
| 回归分析 | 1 | 104.10 | 104.10 | 8.22 | 0.0167 |
| 残差 | 10 | 126.57 | 12.66 | ||
| 总计 | 11 | 230.6667 |
附计算过程: 检验统计量:
