描述所搜集到的资料里各分数之集中情形的最佳代表值也是描述一个团体中心位置的一个数值。
、中数、众数、加权平均数、几何平均数、调和平均数等
教育学:一組数据中大量数据集中在某一点或其上下的情况说明了该组数据的集中趋势,描述集中趋势的统计指标叫做集中量数
算术平均数是全部数据的算术平均,又称均值符号为M(Mean)。算术平均数是
中具有重要地位 是进行统计分析和统计推断的基础。它主要适用于
但不适用品质数据。根据表现形式的不同算术平均数有不同的计算形式和计算公式。其中算术平均数是
的一种特殊形式(它特殊在各项全相等),在实际问题中当各项权不相等时,计算平均数时就要采用加权平均数当各项权相等时,计算平均数就偠采用算数平均数两者不可混淆。
简单算术平均数主要用于未分组的原始数据设一组数据为X1,X2...,Xn简单的算术平均数的计算公式为:
例如,某销售小组有5名销售员元旦一天的销售额分别为520元、600元、480元、750元和500元,求该日平均销售额
计算结果表明,元旦一天5名销售员嘚平均营业额为570元
拓展:一组数据X1,x2...Xn在数a上下波动,则原数据分别减掉a,得到一组新数据
算数平均数具备了良好集中量数应具备的一些條件:
7、较小受抽样变化的影响等优点
同时也存在一定的缺点,限制了它的使用:
1、算术平均数易受极端数据的影响这是因为平均数反应灵敏,每个数据的或大或小的变化都会影响到最终结果
2、若出现模糊不清的数据时,无法计算平均数
2、平均数与个体数值相结合栲虑
3、平均数于方差、标准差相结合考虑
中数(Median),又名简述众数,中位数,均值的关系 对一
进行排序后,正中间的一个数(数字个数为奇數);或者中间两个数的
中数是按顺序排列在一起的一组数据中居于中间位置的数即在这组数据中,有一半的数据比它大有一半的数據比它小。这个数可能是数据中的某一个也可能根本不是原有的数。
3、中数乘以总次数于总数不相等
4、不能进一步代数运算
1、需要快速估算集中值时
3、有模糊不清楚的数据时
众数(Mode)一组数据中出现次数最多的数值,叫众数用M表示。
(一)、根据单项数列求众数不需要任何计算,可以直接从分配数列中找出出现次数或频率最大的一组标志值就是所求的众数。
(二)、对组距数列求众数对
f表示众數所在组次数;
f-1表示众数所在组前一组的次数;
f+1表示众数所在组后一组的次数;
L表示众数所在组组距的下限;
U表示众数所在组组距的上限;
1、不稳定,受分组和样本变动影响
3、不能进一步做代数运算
1、需要快速估算一组数据集中值时
4、快速估计分布形体时
在一个正态分布Φ,平均数、中数、众数三者相等因此在数轴上三个
集中量数完全重合,在描述这种次数分布时只需报告平均数即可。
M即平均数Md即Φ数,Mo即众数
偏态分布是与“正态分布”相对分布曲线左右不对称的数据次数分布,是连续随机变量概率分布的一种可以通过
的计算,衡量偏态的程度可分为
,前者曲线右侧偏長左侧偏短;后者曲线左侧偏长,右侧偏短
偏态分布(skewness distribution)指频数分布的高峰位于一侧尾部向另一侧延伸的分布。咜分为正偏态和负偏态偏态分布的资料有时取对数后可以转化为
,反映偏态分布的集中趋势往往用简述众数,中位数,均值的关系
偏态分咘分为正偏态分布和负偏态分布。
而言的当用累加次数曲线法检验数据是否为正态分布时,若M>M
则数据的分布是属于正偏态分布。正偏態分布的特征是曲线的最高点偏向X轴的左边位于左半部分的曲线比正态分布的曲线更陡,而右半部分的曲线比较平缓并且其尾线比起咗半部分的曲线更长,无限延伸直到接近X轴
也是相对正态分布而言的。当用累加次数曲线法检验数据是否为正态分布时若M<M
时,即平均數小于中数中数又小于众数,则数据的分布是属于负偏态分布负偏态分布的特征是曲线的最高点偏向X轴的右边,位于右半部分的曲线仳正态分布的曲线更陡而左半部分的曲线比较平缓,并且其尾线比起右半部分的曲线更长无限延伸直到接近X轴
;当均值小于众数时称為
的计算要考虑最大频数所在组相邻组的分布,其计算公式如下:
式中L=最大频数所在组的下限值,d=最大频数所在组的组距
=最大频数所茬组的频数与上组频数之差,
=最大频数所在组的频数与下组频数之差
的计算要考虑频数的全部排序,其计算公式如下:
式中L=频数累积箌50%(
)所在组的下限值,d=频数累积到50%所在组的组距S
=频数累积到50%所在组上组的累积频数,f
=频数累积到50%所在组的频数
偏态分布(skew distribution)又称歪分布,指偏离对称的变量值的频数分布偏离程度可用
为样本均数,n为频数“
”为归并校正数,如计算过程中用组距时则须经校正若用原始数據直接计算,可不必经“
为正值时曲线呈正偏态,此时曲线较长的尾部在右侧所以也称为向右偏态;
为负值时,曲线呈负偏态此时曲线较长的尾部在左侧,所以也称为
的绝对值越大表示偏离越甚。检验样本偏度量数是否显著需进行u检验。呈偏态分布的资料有些鈳通过变量代换变为正态
偏度系数反映数据分布偏移中心位置的程度,记为SK则有
SK= (均值一简述众数,中位数,均值的关系)/标准差.
在正态分布条件下,由于均值等于简述众数,中位数,均值的关系所以偏度系数等于0。当偏度系数大于0时则为正偏态;当偏度系数小于0时,则为负偏态