4差异量数

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

N
z 1
•标准分数(Z分数)
标准分数的优点
(1)可比性; (2)可加性; (3)明确性; (4)稳定性。
标准分数的应用
(1)用于比较分属性质不同的观测值在各自数据分布中相对位置的高低; (2)计算不同质的观测值的总和或平均值,以表示在团体中的相对位置; (3)表示标准测验分数。
例: 假定甲、乙两生高考入学考试成绩如下表所示,试问根
(2)一组原始分数转换得到的Z 分数可以是正值,也可以是负值。
(3)一组原始分数中,各个Z 分数的标准差为1,即 sZ 1
(4)若原始分数呈正态分布,则转换得到的所有Z 分数值的均值为0, 标准差为1的标准正态分布。即将原始分数标准化后不改变原来数据的分布。
• 证明 Z 0, z 1
解: Z X X σ
与最小值而求得,易受两极端数值影响。不考虑中间数值的 差异,它反应不灵敏,因此,它只是一种低效的差异量数。 它的用处一般只用于研究的预备阶段,用它检查数据的大概 散布范围,以便确定如何进行统计分组。
•二、百分位数 百分等级 百分位差
百分位数的概念
百分位数是位于依一定顺序排列的一组数据中某一百分位 置的数值。百分位数一般用 表示。 百分位数的计算方法
则有 Z
X
σ
X
N
1 σ
(X X)
N
1 Nσ
(X
X)
1 Nσ
[(X1
X)
(X2
X) ......
(Xn
X)]
1 Nσ
[(X1
X2
...
Xn)
NX]
1 Nσ
0
0
Z 0
解: ( X X )2 N
则有 z
(Z Z )2 N
又 Z 0 z
Z2
N
( X X )2
N
1 (X X )2 1 1
•差异量与集中量的关系
1.单用平均数尚有不足的,须用差异量数辅助说明。 2.平均数是一种代表性指标,它的代表性随差异量数的大小而不同。
差异量数小,代表性大。差异量数大,则代表性小。所以差异量数是 测量平均数所能代表总体的程度。对平均数的描述起辅助作用。如 果差异数与平均数结合,能使我们对问题的认识更深入更全面了。
4.d1 x1 x t
•4.方差与标准差的性质和意义
方差与标准差的意义
方差与标准差是表示一组数据离散程度的最好的指标。 标难差的值越大,表明这组数据的离散程度越大,数据越参差不齐,分 布范围越广,标准差的值越小,表明这组数据的离散程度越小,即数据越集 中、整齐,分布范围越小。
稍微思考下:在教育统计中,标准差是大一些好,还是小一些好呢?
百分位差的概念和计算 百分位差是指两个百分位数之差。
P93 P7
百分位差的意义与应用 百分位差与全距相比,虽然少受两极端数值的影响,但仍然
不能很好地反映中间数据的散布情况,因此只作为主要差异量的 补助量数,在实践中很少使用。
•三、平均差
平均差的概念
平均差是指次数分布中所有原始数据与平均数绝对离差的 平均值。平均差用A.D.表示。 平均差的计算方法
思考题
在某幼儿园大班中,随机抽取21名幼儿,分成甲、乙、 丙三 组,每组7人,进行看图讲述比赛,他们的成绩分别为:
甲组:9、9、10、11、 12、13、13 乙组:6、7、 9、 11、 13、15、16 丙组:2、3、 6、 11、 16、19、20
试问三组幼儿看图讲述成绩的标准差各是多少?
思考题
请问“中位数”是不是百分位数?
•百分等级
百分等级的概念 百分等级是指表示某一分数在整个分数分布中所处的百
分位置。百分等级用 PR 表示。 百分等级的计算方法
公式中: Lb为百分位数所在组的精确下限 fb为百分位数所在组下限以下的累积频数 n为数据总和 fp为百分位数所在组的频数 i为组距
•百分位差
24
•六、标准分数(Z分数)
标准分数的概念 标准分数是以标准差作为单位表示一个分数在团体中所处位
置的相对位置量数。 Z 分数准确地刻划了一个分数在一批分数中(按照相同单位/
标准)的相对位置。 标准分数的计算方法
•标准分数(Z分数)
标准分数的性质
(1)Z 分数无实际单位,是以平均数为参照点,以标准差为单位的一 个相对量。
(二)偏态系数
1、偏态:衡量分布偏斜方向和程度的测度的指标。 2、计算公式:
SK X MO
Ⅰ(SK=0)
若SK=0,则分布呈正态分布; II(SK>0) 若SK>0,则分布呈正偏态分布; 若SK<0,则分布呈负偏态分布;
Ⅲ(SK<
0)
23
(三)峰度系数(kurtosis)
• 1、峰度:用以衡量频数分配的集中程度,即分布曲线的尖峭程
(1)未分组数据(原始数据)计算法 基本公式:
变式公式:
• 3标准差的合成
• 例4.4 某年级四个班学生人数分别为50人,52人,48人,51人。期末数学考试各班 的平均成绩分别是90分,85分,88分,92分,标准差分别为6分、5.5分、7分、8.2 分。求年级成绩的标准差。
t
Ni ( i 2 di 2 )
据考试成绩应该优先录取哪名考生?
全体考生 考试科目 平均分数( ) 标准差(
X
X
语文
70
10
政治
65
5
外语
69
8
数学
50
6
理化
75
8
原始分数
)甲 乙
85 89 70 62 68 72 53 40 72 87
解:
就原始分数而言,应该优先录取乙生(甲生总成绩(348)低 于乙生总绩(350)),这一结论是不科学的。因为单位不同,不 能比较,也不能合并。但把原始分数转换成标准分数后,就可以合 并成总成绩进行比较。就标准分数而言,应该优先录取甲生(甲生 的总成绩(2.5)高于乙生的总成绩(1.505))。
•各种差异量数优缺点比较
标准差计算最严密,它根据全部数据求得,考虑到每一个样本数据,
测量具有代表性,适合代数法处理,受抽样变动的影响较小,反应灵敏。缺 点是较难理解,运算较繁琐,易受极端值的影响。
方差的描述作用不大,但由于它具有可加性,是对一组数据中造成各
种变异的总和的测量,通常采用方差的可加性分解并确定属于不同来源的变 异性,并进一步说明各种变异对总结果的影响。因此,方差是推论统计中最 常用的统计量数。
三组幼儿成绩的平均数: X 1=11; X=2 11; X 3=11
三组幼儿成绩的标准差。 甲组:S=(9-11)2+(9-11〕2 (1311)2 =1.7
7 1
乙组:S=3.9 丙组:S=7.5 答:甲、乙、丙三组幼儿园看图讲故事成绩的标准 差分别为1.7、3.9、和7.5
思考题
X
甲组
11
例1:比较单位不同的数据资料的差异程度
6岁男童体重与身高数据:
体重 身高
平均数 19.39千克 115.87厘米
标准差 2.16千克 4.86厘米
差异系数 11.14% 4.19%
例2:比较单位相同而平均数相差较大的两组资料的差异程度。
两组女童体重的数据:
平均数 标准差 差异系数 2个月组 5.45千克 0.62千克 11.38% 6岁组 19.02千克 2.12千克 11.15%
乙组
11
丙组
11
离散程度(S)
说明
1.7 集中(小)
3.9 (居中)
数据都集中在 X 附近 代表性好
一般
7.5
各数据分布广
最分散(大) 代表性较差
练习题
下列度量数据分散程度的统计量是( ) • A、 M • B、 Md • C、 r • D、 S2
• 参考答案D。
当用M描述一组数据集中情况时,描述差异 程度的统计量为。
(1)未分组数据(原始数据)计算法
(2)数据分组后(次数分布表)计算法
•平均差
平均差意义
平均差意义明确,计算容易,反应灵敏,较好地代表了数 据分布的离散程度。但它计算要用绝对值,不利于进一步做统 计分析,应用受到了限制,属于一种低效差异量数。
•四、方差与标准差的概念(重要掌握)
•2方差与标准差的计算方法
•各种差异量数优缺点比较
全距计算简便,容易理解,适合所有量也太粗造,只能反映分布两极端值的差值。不 能显示全部数据的差异情况,仅作为辅助量数使用。
平均差容易理解,容易计算,能说明分布中全部数值的差异情况,缺
点是会受两极数值的影响,但当数据较多时,这种影响较小,因有绝对值也 不适合代数方法处理。
• 标准差具有可加性。
•4.方差与标准差的性质和意义
五、相对差异量
• 全距、平均差、标准差都是带有单位的差 异量,称为绝对差异量。
• 当比较数据的差异量时,如果单位不同、
或单位相同而平均数差异较大,就不能比
较两组数据的绝对差异量,而只能比较没
有单位的相对差异量。
(一)差异系数 1.概念及计算公式
•各种差异量数优缺点比较
通过比较,可以发现标准差、方差价值较大,它们的应用 也比较广泛,因此,一般称标准差、方差为高效差异量。相比 较,其他差异量数缺点比较明显,应用也受到限制,故他们为 低效差异量数。
•如何选用差异量数
在选用差异量数时,可以考虑下面这些因素:
(1)当样本是随机取样时,S、Q、R,这几个差异量数的可靠性依次降低; (2)当要求计算要容易、快捷时,R、Q、S 依次变得繁杂; (3)当要求统计量进一步使用时, S 远远胜过其他差异量数;
第四讲 差异量数
全距与百分位差 平均差、方差与标准差 标准差的应用 差异量数的选用
差异量数的概念
差异量数就是对一组数据的变异性(离中趋势) 特点进行度量和描述的统计量。它反映了次数分布 中数据彼此分散的程度。
常用的差异量数有全距、四分位差、百分位 差、平均差、标准差与方差等等。
为什么要引入差异量数来描述一组数据的特征?
• A、Md • B、M0 • C、S2 • D、S • (参考答案) D。
Nt
di X i X t
Xt
N1 X 1 N 2 X 2 N3 X 3 ... N k X k N1 N 2 ... N k
• 解: 1.1 =6; 2 =5.5; 3 =7; 4 =8.2;
2.x1 90; x2 85; x3 88; x4 92;
3.x t
50 * x1 52 * x2 ...* 50 52 ...
• 差异系数也称变差系数、离散系数、变异系数, 是指标准差与其算术平均
数的百分比,它是没有单位的相对数。常以CV表示,其计算公式为
CV S 100% X
• 2.差异系数的作用
• 比较不同单位数据的差异程度 • 比较单位相同而平均数相差较大的两组数据的差异程度。 • 差异系数大,代表其数据的离散程度大,其平均数的代表性就差,反之亦然
•一、全距
全距的概念 全距是一组数据中最大值与最小值之差。全距用R表示。
全距的计算方法 原始数据的全距是最大值与最小值之差。
次数分布表的全距一般是最大一组与最小一组的组中值 之差,或者是最大一组上限与最小一组下限之差。
•全距
全距的意义与应用 全距概念清楚,意义明确,计算简单,但它仅由最大值
注意:应用方差和标准差表示一组数据的离散程度,必须是同一类数据
(即同一种测量工具的测量结果)。
•4.方差与标准差的性质和意义
0 •
意味着什么?
• 标准差不可能是负数。
• 原始数据每个数均加上或减去一个常数后求的标准差与原数据 求得的标准差是相同的。
• 标准差是有单位的,单位与原始测量数据相同。
度的指标。
k
• 2、计算公式: ( xi x)4 fi
K i 1 n
fi .s 4
i 1
Ⅱ(K>0)
• 峰度指标K=0,分布为正态分布,
Ⅰ(K=0)
当峰度指标K>0时,表示频数分布
比正态分布更集中,分布呈尖峰状 态,K<0时表示频数分布比正态分
Ⅲ (K<0)
布更分散,分布呈平坦峰。
峰度示意图
相关文档
最新文档