简答题 简述衡量数据离散程度的统计量有哪些,并说明各自的适用范围。
【正确答案】离散程度是在统计学上描述观测值偏离中心位置的程度,反映了所有观测值偏离中 心的分布情况。数据的离散程度越大,集中趋势的测度值对该组数据的代表性就越差;离散 程度越小,其代表性就越好。离散程度的指标主要有:
(1)    异众比率
异众比率是指总体中非众数频数与总体全部频数之比,即非众数组的频数占总频数的比 例,用Vr表示。异众比率主要用于衡量众数对一组数据的代表程度。异众比率越大,说明非众数组的频 数占总频数的比重越大,众数的代表性越差;异众比率越小,说明非众数组的频数占总频数 的比重越小,众数的代表性越好。异众比率主要适合测度分类数据的离散程度。
(2)    四分位差
四分位差,也称为内距或四分间距,它是上四分位数与下四分位数之差,用(Qd表示。四分位差反映了中间50%数据的离散程度,其数值越小,说明中间的数据越集中;其数值越大,说明中间的数据越分散。四分位差不受极值的影响。四分位差主要用于测度顺序 数据的离散程度。
(3)    极差
极差又称全距,是指一组数据的观察值中最大值与最小值之差,用表示。用公式表 示为:极差=最大观察值-最小观察值。极差是描述数据离散程度的最简单的测度值,计算简单,易于理解,但它容易受极端值 的影响。由于极差只是利用了一组数据两端的信息,不能反映出中间数据的分散状况,因而 不能准确描述出数据的分散程度。
(4)    平均差
平均差是指一组数据中的各数据对平均数的离差绝对值的平均数,用Md表示。
平均差以平均数为中心,反映了每个数据与平均数的平均差异程度,它能全面准确地反 映一组数据的离散状况。为了避免离差之和等于零而无法计算平均差这一问题,平均差在计 算时对离差取了绝对值,以离差的绝对值来表示总离差,这就给计算带来了不便,因而在实 际中应用较少。
(5)    方差S2与标准差s
统计中的方差(样本方差)是各个数据分别与其平均数之差的平方和的平均数,它在数学 处理上是通过平方的办法消去离差的正负号,然后再进行平均。标准差为方差的平方根。
方差(或标准差)能较好地反映出数据的离散程度,是实际中应用最广的离散程度测度值。
(6)    离散系数
离散系数又称变异系数,它是一组数据的标准差与其相应的平均数之比。
当进行两个或多个资料变异程度的比较时,如果各样本的度量单位、平均数相同,可以 直接利用标准差来比较。当各样本的单位或平均数不同时,比较其变异程度就不能采用标准 差,而需采用标准差与平均数的比值(相对值)来比较。离散系数大,说明数据的离散程度 也大;离散系数小,说明数据的离散程度也小。
 
【答案解析】