问答题 某市电子工业公司有15个所属企业,其中14个企业2011年的设备能力和劳动生产率的资料如下表2-1中(2)、(3)两栏所示。第15个企业的年设备能力为5.8kW/人。试预测其劳动生产率。

表2-1 某市电子工业公司劳动生产率回归系数数据计算表

企业
设备x/(千瓦/人)
劳动生产率y/(千元/人)
xy
x 2
y 2
(1)
(2)
(3)
(4)
(5)
(6)
1
2.8
6.7
18.76
7.84
44.89
2
2.8
6.9
19.32
7.84
47.61
3
3.0
7.2
21.60
9.00
51.84
4
2.9
7.3
21.17
8.41
53.29
0
3.4
8.4
28.56
11.58
70.56
6
3.9
8.8
34.32
15.21
77.44
7
4.0
9.1
36.40
16.00
82.81
8
4.8
9.8
47.04
23.04
96.04
9
4.9
10.6
51.94
24.01
112.36
10
5.2
10.7
55.64
27.04
114.49
11
5.4
11.1
59.94
29.16
123.21
12
5.5
11.8
64.90
30.25
139.24
13
6.2
12.1
75.02
38.44
146.41
14
7.0
124
86.80
49.00
153.76
61.8
132.9
621.41
296.80
1313.95
【正确答案】
【答案解析】1.电子工业工人劳动生产率的高低与设备能力的大小有着密切的关系。因此,设劳动生产率为y,设备能力为x,绘制散点图,如图2-1所示。

2.从图中可以看出,这些点大致落在一条直线附近,因此,可以采用直线模型y=a+bx作为这些观察值散布状态的反映式。
3.建立回归方程
(1)列表计算需要的数据
∑x=61.8,∑y=132.9,∑x 2 =296.8;
∑xy=621.41,∑y 2 =1313.95;
(2)计算参数的估计值


(3)回归方程显著性检验
计算相关系数的估计值

当显著性水平α=0.05,自由度n-2=14-2=12时,查相关系数临界值表得R 0.05 =0.532。
,所以回归方程线性关系显著。
即回归方程可以反映观察值间的线性相关关系。
(4)预测
先计算估计标准差

α=0.05,n-2=12时,查t分布表得 t 0.025 (12)=2.179;
x 0 =5.8时,代入回归方程得y的点估计值为:

预测区间为:

即(10.5,12.5)。
即:当第15个企业年设备能力为5.8千瓦/人时,其劳动生产率的预测范围在10.5千元/人至12.5千元/人之间(概率为0.95)。 [解析]
本题主要考查一元线性回归预测流程。
第一步:输入历史统计数据,建立一元线性回归模型
y=a+bx;
第二步:计算回归参数&和b

第三步:回归检验
(1)基本公式:

偏差平方和=残差平方和+回归平方和
总变差=未解释变差+可解释变差
在进行检验时,通常先进行方差分析,主要有两方面原因:
一方面可以检验在计算上有无错误;另一方面,也可以提供其他检验所需要的基本数据。
(2)可决系数R 2
定义可决系数R 2 :R 2 =RSS/TSS
R 2 的大小表明了y的变化中可以用x来解释的百分比,因此,R 2 是评价两个变量之间线性关系强弱
R 2 ≤1,越接近1,x对y的线性影响就越强,拟合方程的误差就越小。
(1)计算相关系数R
(2)将计算得出的R值与R(α,n-2)进行比较
R(α,n-2)是自由度(n-2)和显著性水平α(一般取α=0.05)的临界值,可以查相关系数检验表得到:
R>R(α,n-2);则变量x和y之间的线性关系成立;
R≤R(α,n-2);变量x和y之间的线性关系不成立。模型的特点,y=a+bx+e,a是常数,通常只检验参数b。
(1)计算t b

(2)将计算得出的t b 值与t(α/2,n-2)进行比较
t(α/2,n-2)是显著性水平为α,自由度为n-2的t值,可通过t分布表查得。
|t b |>t(α/2,n-2);回归系数显著性不为0,t检验通过,变量x和y之间线性假设合理。
|t b |≤t(α/2,n-2);回归系数为。的可能性较大,未通过t检验,回归系数不显著,说明变量x和y之间
第四步:计算——点预测和区间预测
y" 0 =a+bx。
2.区间预测
①当样本量n小于30,置信水平为100(1-α)%的预测区间为:
y" 0 ±t(α/2,n-2)s。
其中:t(α/2,n-2)可以查t检验表得出。通常取显著性水平d=0.05。