数据分布特征的测度—使用Excel方法
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
某中学初二(一)班数据分布特征的测度
使用excel 方法
数据特征的测度
众数 中位数 四分位数
平均数
亠、集中趋势
1、众数(mode )— 一组数据中出现次数最多的变 量值.
分类数据众数
偏态 峰态
异众比率 极差 方差 离散系数
制作:用frequency 函数求出语文成绩的频数一求 出各个分数段的比例一各个分数段的百分比
.
原始数据:原始数据一众数・xls
2、中位数(median )-排序后处于中间位置上的值
解:这里的变量为“成绩 分数段”,这是个分类变 量,
不同的分数段就是变 量值。
所调查的初二一班 60人 中,60-69这个分数段的人 数最多,为23人,占全班 人数的38.33%,因此众数 为“ 60-69这一分数段”。
即:M=60-69这一分数段
制作:对语文成绩进行降序排列一根据计算公式求得中位数/插入median函数求得中位数
要求得这60名学生语文成绩的中位数有2种方法:
方法一:
1、首先对学生的语文成绩进行降序排列。
2、由于学生人数为偶数,所以位置计算公式二错误!
位置=错误!—错误!= 30。
5
语文成绩中位数=错误!= 68
方法二:插入median函数一求得语文成绩中位数。
原始数据-中位数:原始数据一中位数。
XlS
3、四分位数(quartile)—排序后处于25%和75%
位置上的值.
要求得这60名学生语文成绩的中位数有2种方法: 方法一:
1、首先对学生的语文成绩进行升序排列。
2、由于学生人数为偶数,所以位置计算公式为:
Q 位置二错误!=错误!= 15.25
Q位置二错误!=错误!= 45。
75
Q= 61+0.75 X( 62-61 ) =61。
75
Q= 78+0。
25 X( 78—78) =78
方法二:使用函数QUARTILE求出语文成绩的四分位数
xls 原始数据一四分位数:原始数据-四分位数。
4、平均数(mean)
加权平均数一初二(一)班语文总评成绩
总评成绩=错误!
原始数据一平均数:原始数据一平均数。
Xis
二、离散程度
1异众比率(variation ratio)-除了众数以外的数
异众比率
初二一班语文成绩频数分布
解:
Vr =错误!
=1—错误!= 0.62 = 62% 在调查的初二(一)班中,除了60-69 这个分数段以外,取得其他分数段的成绩的学生占62%,异众比率较大。
因此用“ 60-69 ”这个分数段来代表
整个班的语文考试状况,其代表性不是很好
制作:使用frequency函数求出各个分数段的频数,
根据频数得到异众比率。
原始数据-异众比率:原始数据一异众比率.xls
2、极差(range——组数据的最大值与最小值之
差。
计算公式为:R = max(xj - min (x i)
以数学考试成绩为例:R=98—33=65
原始数据-极差:
3、平均差(mean deviation)—各变量值与其均值离
差绝对值的平均数。
以数学考试成绩为例:
计算公式=工卜―丘|
N
=错误!=67.77
平均差(M d )=错误!=11。
5
解:由于平均差越小,平均值越有代表性,这里数学成绩的平均差为11.5,因此均值为67。
77 是很具有代表性的。
原始数据:原始数据-平均差.Xis
5、方差和标准差(varianee and standard deviation
方差:反映了各变量值与均值的平均差异。
标准差:方差的平方根,是一组数据平均值分散 程度的一种度量.
未分组数据的方差和标准差
解:通过公式求得方差为 214.71。
1、 求得数学成绩的均值.
2、 求得数学成绩单个变量值与均值的 差。
(使用abc 函数)
3、 求得数学成绩单个变量值与均值的差 的平方.(使用power 函数)
4、 最后求得方差。
总结:我们通常用样本的波动大小去估计 总体的波动大小的方法,方差越小则波动 越小,稳定性也越好•方差
越大说明数据 波动越大,越不稳定。
即方差越大离散程度 越大.
由此可知数学成绩波动性较大,不稳定。
数学成绩的离散程度较大。
标准差: (J —
原始数据:
原始数据-方差和标准差.Xis
解:一个较大的标准差,代表大部分数值 和
其平均值之间差异较大 ;一个较小的标
准差,代表这些数值较接近平均值。
而在本 次测验中的标准差值较大,即标准差越高, 表示实验数据越离散,[也就是说越不精确。
学生的差异程度也越大 .本班学生的差异 程度较大。
6、离散系数(coefficient of variation)-标准差与其
相应的均值之比。