问答题 统计中用以描述数据频数分布集中趋势的统计量主要有哪些?各自有何特点?无
【正确答案】

(1)集中趋势(central tendency)是指一组数据向某一中心值靠拢的程度,它反映了一组数据中心点的位置所在。描述数据频数分布集中趋势的统计量主要有两大类:一类是数值平均数,它们是根据全部数据计算得到的代表值,主要包括算数平均数、调和平均数及几何平均数。

①算术平均数也称为均值,是一组数据相加后除以数据的个数得到的结果,包括简单算数平均数和加权算数平均数。算术平均数是对数值型数据计算的,而且利用了全部数据信息,是实际中应用最广泛的集中趋势测度值。其主要缺点是易受数据极端值的影响,对于偏态分布的数据,代表性较差。

②调和平均数也称为倒数平均数,是总体各单位标志值倒数的算术平均数的倒数。社会经济统计中使用的调和平均数往往具有特定(经济)意义,通常是加权算术平均数的变形。主要是用来解决在无法掌握总体单位数(频数)的情况下,只有每组的变量值和相应的标志总量,而需要求得平均数的实际问题。

③几何平均数。几何平均数是指n个观察值连乘积的n次方根。计算几何平均数要求各观察值之间存在连乘积关系,主要适用于对比率、指数等进行平均,计算平均发展速度等。

(2)另一类是位置代表值,是根据数据所处位置直接观测或根据与特定位置有关的部分数据来确定的代表值,主要有众数和中位数等。

①众数(mode)是一组数据中出现次数最多的变量值,用Mo表示。众数是一组数据分布的峰值,不受极端值的影响。其缺点是具有不惟一性,一组数据可能有一个众数,也可能有两个或多个众数,也可能没有众数。众数只有在数据量较多时才有意义,当数据量较少时,不宜使用众数。众数主要适合作为分类数据的集中趋势测度值。

②中位数(median)是一组数据排序后处于中间位置上的变量值,用Me表示。中位数是一组数据中间位置上的代表值,不受数据极端值的影响。当一组数据的分布偏斜程度较大时,使用中位数也许是一个好的选择。中位数主要适合作为顺序数据的集中趋势测度值。

【答案解析】