
描述集中趋势的量数,在统计学上称集中量数。集中量数是一组观测值的代表值,能够描述其典型情况;集中量数也可用于对象之间的比较,以对象之间的差异。集中量数主要有平均数、中位数、众数。
1.算术平均数


算术平均数具有以下两个重要特性:
①样本所有观察值与其平均数的差数(简称离均差,deviation from mean)的总和等于0。即:

②样本所有观察值与其平均数的差数平方的总和,较各个观察值与任意其他数值的差数平方的总和为小,亦即离均差平方的总和最小。这个问题可作这样的说明,设Q为各个观察值与任意数值a的差数平方的总和,即:
对此Q求最小值,可得使Q最小的a值为平均数
。
算术平均数具有原理简单,便于掌握和运用的优点。但由于不考虑各个观察值的相对重性,而把不重要程度不同的值相加,反而有时不能充分反映数据的集中程度。
算术平均数的优点:
a.反应灵敏。一组数据中任何一个数值发生或大或小的变化,所计算出来的算术平均数也会随之变大变小,能灵敏地反应出来。
b.严密确定。由同一组数据计算出来的算术平均数是同一个值。
c.简明易懂,计算简便。算术平均数的意义简单明了,容易理解。计算时,只需用简单的四则运算。
d.适合代数运算,例如,可以通过几个平均数求它们的总平均数等。
e.受抽样变动的影响较小,从同一个总体中随机抽取的容量相同的样本,所计算出的算术平均数与其它集中量指标相比,抽样误差较小。
算术平均数的缺点:容易受极端数值(极大或极小)的影响,如果一组数据中绝大多数数值都较高(或较低),而其中只有一个数值极低(或极高),由于每个数据都参加运算的结果,使所计算出来的算术平均数大大下降(或上升),这时,算术平均数就不足以代表这组数据的典型水平。一组数据中某个数值的大小不够确切或缺失,这时就无法计算其算术平均数。根据上述对算术平均数的特性及其优缺点的分析,可以看出,它所适用的条件是:一组数据
中每个数据都比较准确、可靠,无极端数值的影响。
式中
是第i个观察值的权重。
加权平均数是算术平均数的改进,不仅考虑了各个测量值,同时还考虑了各个观察值的权重。反过来说,加权平均数会削峰填沟,拉平不同特性的测量值,仅从加权平均数的大小上很难判断测量对象之间的差异。
(3)几何平均数几何平均数是n个测量值连乘积的n次方根,常用

在科学研究中,当需要处理的数具有以下两种特点时,一般都是用几何平均数来表示数据的集中趋势。
①一组数据中任何两个相邻数据之比接近于常数,即数据按一定比例关系变化。在科学研究中,求平均变化率或对等距与等比量表实验的数据处理,均应使用几何平均数。
②当一组数据中存在极端数据,分布呈偏态时,算术平均数不能很好地反映数据的典型情况,此时应使用几何平均数或其它集中量数(如中数、众数)来反映数据的典型情况。
(4)调和平均数(倒数平均数)调和平均数是一组测量值倒数的算术平均数的倒数,常用

调和平均数一般用于求平均速率等测量值可能表现为正逆两种指标的场合。在教育心理测量方面主要是用来描述学习的速度,如阅读速度、解题速度、识字速度等。
2.中数(中位数)
中数是按一定顺序排列的一组观测值中,位于中央位置的数值,在这一数值上下各有一半数目的数据,常用Md表示。
中数的计算方法是:若观测值的个数为偶数,则以中间的两个观测值的算术平均数为中数;若观测值的个数为奇数,则以位居中央的观测值为中数。一般在一组观测值有特大或特小的极端值时,可用中数粗略地描述观测值的趋中程度。
对于分组数据(即已经做成次数分布表)计算公式为:

式中:
表示中位数所在组的精确下限;
n为总次数;i为组距;f为中位数所在组的次数。
3.众数
众数是一组观测值中次数出现最多的那个观测值,它对应频数分布曲线最高点所在位置的横坐标,常用MO表示。
众数在数据个数较少时一般用直接观察法寻找,但在数据个数比较多时众数的求法比较麻烦,可用统计数学家皮尔逊(K.Pearson)计算众数的经验公式求之:

众数只能大略地估计一组观测值的集中趋势。对已经分组的数据可用插入法求众数,其计算公式为:

式中:
为众数所在组的下限;
为众数组上限相邻一组的次数;
为众数组下限相邻一组的次数;


