第四章差异量数
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
(三)计算公式
X 即 Pp
(四)应用 下表所列的考试分数分布中,已知某应试者的考分为82 分,问在这次考试中低于该应试者的人数比例
第三节平均差、方差、标准差
一、平均差(average deviation或mean deviation) (一)概念 平均差(通常用AD或MD表示) 指一组数据中,每一个数据与该组数据的平均数之差 的绝对值的算数平均数
(二)缺点 1、计算相对比较繁杂,还有负值和零值, 常常还会带有小数 2、在进行比较时,还必须满足原始数据 的分布形态相同这一条件
五、应用 (一)比较几个分属性质不同的观测值在各自数据分布 中相对位臵的高低
比如有一人的身高是 170 厘米,体重是 65 千克,究竟身 高还是体重在各自的分布中较高?设身高 Z 身高 1.70 =0.5 , Z 体重65 =1.2 ,则该人的体重离平均数的距离要比身高离 平均数的距离远,即该人在某团体中身高稍微偏高, 而体重更偏重些
(三)经线性转化后,表示标准测验分数 经过标准化的教育和心理测验,如果其常模分 数分布接近正态分布,为了克服标准分数出现 的小数,负数,常常是将其转化成正态标准分 数 转化公式为Z’=aZ+b Z’为经过转化后的标准正态分数,a,b为常数
(四)整理数据时,常采用三个标准差法则取舍数 据,即如果数据值落在平均数加减三个标准差之外, 则在整理数据时,可以将这个数据作为异常值舍弃 操作方法:利用spss转化为Z分数后,Z值不在[-3,3] 范围内,可以舍弃
2、某招干考试分数如下表,预定取考分居前10% 的应考人员进行面试选拔,请划定面试分数线
三、四分位差(quartile deviation) (一)概念 百分位差的一种,又叫四分位距,指第三个四分位数 与第一个四分位数之差的一半,即在一个次数分布中, 中间50%的次数的距离的一半,用Q表示。
(二)由来 四分位差的计算,基于两个百分位数,即P25和P75,这两 个点值与中数(50%点)一起把整个数据的次数等分为 四部分, P25之下占有总次数的四分之一,被称为第一 四分位,中数被称为第二四分位, P75被称为第三四分 位
3意义 (1)方差与标准差是表示一组数据离散程度的最好 指标,其值越大,说明数据分布的离散程度越大,该 组数据较分散,其值越小,说明数据分布比较集中, 离散程度越小。 (2)它们是统计描述与统计推断分析中最常用的差 异量数。在描述统计部分,只需要标准差就足以说明 一组数据的离中趋势
4标准差的有点 (1)反应灵敏,每个数据取值的变化,方差或标准差都随之 变化 (2)计算公式严密确定 (3)容易计算 (4)适合代数运算 93页说标准差不可以进行统计运算,但是94也总结标准差 的优点的时候又说适合代数运算,怎么回事? 93页所说的标准差不可以进行代数运算是指两个标准差之间不 可以进行加减乘除的运算,而不像方差那样具有可加性;94页 所说的标准差的优点是指标准差除可以用以描述统计之外,还 可以进一步参与到推论统计的运算当中,而平均差、百分位差、 四分位差等其他的差异量数则不能参与到推论统计的运算当中
当两个公式计算的结果有出入时,原始 数据计算的结果更精确
计算该次数分布表的方差和标准差
(三)总标准差的合成 方差具有可加性的特点,在已知几个小组的方差或 标准差的情况下可以计算几个小组联合在一起的总 的方差或标准差 思路是:总的方差=组内方差之和与组间方差之和
组内离均差
组间离均差
应用:为了研究噪音对解决数学问题的影响,根据噪 音的三种情况(强、中、弱)把被试分为三组,每组 4个人,因变量是解决数学问题时产生的错误频数, 数据如下表,请计算噪音所产生的总的方差
(5)受抽样变动影响小,即不同样本的标准差或 方差比较稳定 (6)简单明了,虽然比其他差异量数稍有不足, 但其意义还是较明白的
二、应用条件 (一)同一个团体不同观测值离散程度的比较 即同一个团体但是所测得特质不同 例:已知某小学一年级学生的平均体重为25千 克,体重的标准差为3.7千克,平均身高为110 厘米,标准差为6.2厘米,问体重与身高的离散 程度哪个大?
(四)方差与标准差的性质与意义 1、方差性质 可分解性与可加性 2、标准差性质 (1)每个观测值都加上一个相同常数C后, 计算得到的标准差等于原标准差 (2)每个观测值都乘以一个相同常数C,则 所得的标准差等于原标准差乘以这个常数 (3)每一个观测值都乘以同一个常数C (C≠0),再加一个常数d,所得的标准差等于 原标准差乘以这个常数C。(分组数据时用估 计平均数计算标准差的公式)
(二)计算不同质的观测值的总和或平均值,来表示在团 体中的相对位臵 不同质的原始观测值因不等距,也没有一致的参照点, 因此不能简单地相加或相减,当需要把这些不同质的 数据合成时,如果已知这些不同质的观测值的次数分 布为正态,这时可采用 Z 分数来计算不同质的观测值 的总和或平均值。比如高考的各科成绩,经转化为 Z 分数后,可以相加
三、性质 (一)Z分数无实际单位,是以平均数为参照点, 以标准差为单位的一个相对量 (二)一组原始分数转换得到的Z分数可以是正 值,也可以是负值,凡小于平均数的原始分数的 Z值为负数,大于平均数的原始分数的Z值为正数, 等于平均数的原始分数的Z值为零。 (三)所有原始分数的Z分数之和为零,Z分数的 平均数也为零
四、优缺点 (一)优点 1简单,容易理解 2计算简单
(二)缺点 1最粗糙,不可靠 2只是利用了数据中的极端值,其他数据未参与运算过 程 3如果两极端值有偶然性或属于异常值时,全距不稳定 4全距受到取样变动的影响
第二节百分位差与四分位差
一、百分位数 (一)概念 百分位数(percentile),又叫百分位分数,用符号Pp表示,指 次数分布中相对于某个特定百分点(小p)的原始分数,它 表明在次数分布中 小于这个分数的数据个数占数据分布 中全部数据个数的一定百分比。 如P70 =85,表明将一批数据从小到大排列后,小于85分 的数据占该批数据的70%
(二)不同团体进行的是同一种类型的观测,但测 的是水平相差较大,需要比较观测值的离散程度
例:通过一个测验,一年级(7岁)学生的平均分数为60分, 标准差为4.02分,五年级(11岁)学生的平均分数为80分,标 准差为6.04分,问这两个年级的测验分数中哪一个分散程度大?
三、注意事项
(一)测量的数据至少是等距数据 (二)差异系数只能用于一般的相对差异量的描述, 不能做进一步的代数运算
(四)一组原始数据中,各个Z分数的标准差为1 根据标准差性质:原始分数加上或减去一个数, 标准差不变;原始分数乘一个数,标准差变为原 来的N倍;Fra Baidu bibliotekZ=(Xi -X平均)/S不就是原始分数减去 平均数(标准差不变),再乘标准差的倒数吗? (标准差为原来的1/S倍)原来标准差为S 转化Z分 数后就是S*(1/S) ,所以是1 (五)如果原始分数呈正态分布,那么转换得到Z 分数分布叫标准正态分布,以0为平均数,1为标 准差
思考: 在分组次数分布表中,当我们想求P50 时,如何 计算?
二、百分位差 (一)概念 指两个百分位数之差,也叫百分位距。 常用的百分位距有两种 P90- P10, P93- P7
(二)地位 能较好地反映一组数据的差异程度,但有一定 的局限,只作为主要差异量数的辅助量数
(三)应用 1、求百分位差
本章课后练习题 1、2、3、4(直接回答) 6、7、8、9(课堂计算)
本章随堂练习
第四章差异量数
全距
百分位差
差 异 量 数
四分位差
平均差
标准差
方差
第一节全距(range)
一、概念与计算公式 (一)全距又称两级差,用R表示,用一组数据 的最大值减去最小值 (二)R=X max-X min
二、地位 说明数据离散程度的最简单的统计量 三、应用 主要用于对数据作预备性检查,了解数据的大概散 布范围,以便确定如何进行统计分组
(三)计算公式
(五)优缺点 1优点 (1)在两极端数据不清楚时可以应用 (2)常与中数联系起来共同应用 (3)对数据的离散程度的描述比全距好
2缺点 (1)没有把全部数据考虑在内,其稳定性会差一些 (2)反应不够灵敏 (3)不适合进行代数运算
四、百分等级分数 (一)概念 百分等级分数与百分位数相反,它是事先知道分布 中的一个原始分数,再求这个原始分数在分布中所 处的相对位臵——百分等级 (二)意义 百分等级分数指出原始数据在常模团体中的相对位 臵,百分等级越小,原始数据在分布中相对位臵越 低,百分等级越大,原始数据在分布中相对位臵越 高。
第五节差异量数的选用
如何选用差异量数 (一)当样本是随机取样时,s、Q、R的可靠性依次降 低 (二)当要求计算要容易快捷时, s、Q、R依次变得 简单 (三)当要求统计量进一步使用时,s远胜于其他差异 量数 (四)在偏态分布中,Q比s更常用
(五)当分布是截尾分布时,只有Q能正确的指出 分布的变异性 (六)在选用差异量数时,同时应考虑合适的集中 量数。 差异量数越小,集中量数的代表性则越大 差异量数越大,集中量数的代表性则越小 要描述一组数据的典型性特点,必须同时使用集中 量数和差异量数。 一般常用的搭配是: 中数和Q或其它百分位差一起 平均数和标准差一起(最常用)
四、优缺点
(一)优点 1、可比性 不同性质的成绩,转化为标准正态分数后,相当 于处在不同背景下的分数,放在同一背景下去考 虑,具有可比性 2、可加性 标准分数没有具体单位,不同性质的原始分数经 转化后可以相加
3、明确性 知道了某一被试的标准分数,可以知道其百分等 级 (注意:在心理统计这门课中,我们默认的是样 本分布服从正态分布) 4、稳定性 原始分数转化为标准分数后,标准分数的标准差 为1(性质4),保证了不同性质的分数在总分中 的权重一样
(二)计算公式
(三)优缺点 优点 1、平均差意义明确,计算容易,反应灵敏 2、较好地反映了次数分布的离散程度 缺点 1、平均差计算时要用绝对值,不适合代数运 算,因此在进一步统计分析中应用较少 2、属于一种低效差异量数
二、方差与标准差
(一)概念
(二)计算公式 1、未分组数据的计算
思考:可不可以不计算平均数,只利用原始数据 来算方差和标准差呢