【答案解析】1.电子工业工人劳动生产率的高低与设备能力的大小有着密切的关系。因此,设劳动生产率为y,设备能力为x,绘制散点图,如图2-1所示。
2.从图中可以看出,这些点大致落在一条直线附近,因此,可以采用直线模型y=a+bx作为这些观察值散布状态的反映式。
3.建立回归方程
(1)列表计算需要的数据
∑x=61.8,∑y=132.9,∑x
2
=296.8;
∑xy=621.41,∑y
2
=1313.95;
(2)计算参数的估计值
(3)回归方程显著性检验
计算相关系数的估计值
当显著性水平α=0.05,自由度n-2=14-2=12时,查相关系数临界值表得R
0.05
=0.532。
令

,所以回归方程线性关系显著。
即回归方程可以反映观察值间的线性相关关系。
(4)预测
先计算估计标准差
α=0.05,n-2=12时,查t分布表得 t
0.025
(12)=2.179;
x
0
=5.8时,代入回归方程得y的点估计值为:
预测区间为:
即(10.5,12.5)。
即:当第15个企业年设备能力为5.8千瓦/人时,其劳动生产率的预测范围在10.5千元/人至12.5千元/人之间(概率为0.95)。
[解析]
本题主要考查一元线性回归预测流程。
第一步:输入历史统计数据,建立一元线性回归模型
y=a+bx;
第二步:计算回归参数&和b
第三步:回归检验
(1)基本公式:
偏差平方和=残差平方和+回归平方和
总变差=未解释变差+可解释变差
在进行检验时,通常先进行方差分析,主要有两方面原因:
一方面可以检验在计算上有无错误;另一方面,也可以提供其他检验所需要的基本数据。
(2)可决系数R
2
定义可决系数R
2
:R
2
=RSS/TSS
R
2
的大小表明了y的变化中可以用x来解释的百分比,因此,R
2
是评价两个变量之间线性关系强弱
R
2
≤1,越接近1,x对y的线性影响就越强,拟合方程的误差就越小。
(1)计算相关系数R
(2)将计算得出的R值与R(α,n-2)进行比较
R(α,n-2)是自由度(n-2)和显著性水平α(一般取α=0.05)的临界值,可以查相关系数检验表得到:
R>R(α,n-2);则变量x和y之间的线性关系成立;
R≤R(α,n-2);变量x和y之间的线性关系不成立。模型的特点,y=a+bx+e,a是常数,通常只检验参数b。
(1)计算t
b
(2)将计算得出的t
b
值与t(α/2,n-2)进行比较
t(α/2,n-2)是显著性水平为α,自由度为n-2的t值,可通过t分布表查得。
|t
b
|>t(α/2,n-2);回归系数显著性不为0,t检验通过,变量x和y之间线性假设合理。
|t
b
|≤t(α/2,n-2);回归系数为。的可能性较大,未通过t检验,回归系数不显著,说明变量x和y之间
第四步:计算——点预测和区间预测
y"
0
=a+bx。
2.区间预测
①当样本量n小于30,置信水平为100(1-α)%的预测区间为:
y"
0
±t(α/2,n-2)s。
其中:t(α/2,n-2)可以查t检验表得出。通常取显著性水平d=0.05。
