第四章 离中趋势与差异量数
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第五节 标准差与方差
一、 概念
标准差是度量离中趋势的最常用的差异量数。作为 样本统计量的标准差一般用符号S或者SD表示,而 作为总体参数的标准则用希腊字母α。标准差的平方 即为方差,分别用符号S2(样本统计量)和α2(总体 参数)来表示。
二、标准差与方差的求法 下面就从未分组数据(原始数据)、次数分布数 据和分组次数分布数据三个方面讨论一下标准差 和方差的计算方法。
第二节
两极差
一、概念 两极差也称全距,用符号R表示。所谓两极差就是一组数 据中最高值与最低值之差。 二、两极差的求法 R=最大数值-最小数值 三、小结: 1.两极差是简单而粗略的差异量数 2.不能反映中间数值的差异情况,也受两极 端异常数值的影响。 3.可以作为数据分布的初步统计,在一定程度上反映 数据的差异情况(前提是分布比较对称、没有极端数值)
第六节 标准差的应用——数据的标准化
标准差的重要应用之一是对数值型数据进 行标准化。在语言和语言教学研究中,标 准化处理的主要用途是便于对考试分数的 比较。 一、考分比较 考分在各自分数组中所处的相对位置是可 以进行比较的。虽然这同样无法保证百分 之百的可比性,但这至少为比较不同考试 的分数找到了一个较为可靠的途径。
1.未分组数据标准差和方差的求法 第一步:计算个数值与平均数之差(离均差) 第二步:求离均差的平方 第三步:把平方离均差相加,求”平方和“; 第四步:把平方和除以数值的个数,求得方差; 第五步:方差的平方根即为标准差。用公式表示:
显然,由于涉及到平均数,上述公式使用 起来很不方便;我们可以在上述的公式的 基础上得出一个不涉及平均数的求标准差 的公式:
三.主要的差异量数分类: 1.;两极差 2.四分差 3.平均差 4.标注差与方差
举个例子: 我们两组假设的分数来举个例子:
第一组:60 75 78 80 82 85 100 第二组:74 77 80 80 80 83 86 两组分数段饿平均差都是80,然而其离散程度却 差别很大,如果每组数据中的最大值与最小值之 差来表示离散程度,那么第一组为(100-60) =40,第二组为(86-74)=12。两者离散程度 的不同表明其分数分布的差异;
1
二. 四分差的求法
要求四分差,首先要求Q1和Q3的值。对于分组数据,用下列公式求之(方法 同中数的求法,其实中数就是第二个四分点)
式中Lb----该四分点所在组的精确下限;
fQ1,fQ3----该四分点所在组的次数; fb----该四分点所在以下的累积次数; N----数据中的数值个数; i----组距
四、标准分与正态分布和百分位的关系
百分位是指把一组分数从高到低排列并分为100 等分,以百分位等级表示某个分数在全部分数中 所在的位置,即在全部考分仲有百分之几的分数 是低于该分数的或有百分之几的分数是高于该分 数的。 百分位表是在累计次数分布表的基础上编制的
标准分就是通过标准化把一个成呈正态分 布的变量转换成标准正态分布。在正态分 布的情况下,分布曲线下任意两个标准之 间的面积、任一标准以上的买年纪或任一 标准差以下的面积在总面积中的百分比都 是一样的。
下面我们仍用上例中的数据说明公式的用法
三个公式计算结果一样,但计算过程要简 便得多。
2.次数分布数据标准差和方差的求法:
如果已有次数分布表,那么标准差和方差的计算 将更加简便。计算公式为:
3.分组次数分布数据标准差和方差的求法
从分组次数分布数据标准差和方差的公式如下:
三、小结 标准差与方差的概念易于理解,适于代数 运算,能反映所有数据的差异情况,不易 受抽样变动的影响。
3 b
三、小结
分差不受两极端值的影响,故两极差稳定 可靠 不能反映全部数据的差异情况,而且不适 于代数运算 适用于两极端数据不清,无法计算其他差 异量数; 四分差常与中数结合适用
第四节
平均差
一、概念
平均差:是指一组数据中各个数值与平均数之差的平 均(实质上是用数值离开平均数的距离来表示离散程 度),一般用符号AD表示。
第一节
离中趋势与差异量数
一、离中趋势的概念:
离中趋势指的是一组数据的变异或离散程度。对离中趋势进行度 量的统计量称作差异量数。离中趋势的度量是描述统计的一个重要方 面。 二、差异量数的作用: 1.能从另一个角度了解数据的性质。 2.有助于检验或说明集中量数的代表性 ①差异量数越大,集中量数的代表性就越小; ②差异量数越小,集中量数的代表性就越大; ③差异量数为零,则说明数据中各个数值之间没有任何差异, 都等于平均数,平均数的代表性最大
第三节
四分差
一、概念 四分差指一个分布中,中间50%的次数的 全距之半,用符号Q表示。 正如中数把一个次数分布分成两半那样, 有一些点把一个次数分布分成四等份,这 些点称作四分点或四分位数。第一个四分 点(或称下25分点)用Q 表示,其下有全 部数值的1/4或25%,其上则有全部数值 的3/4或75%,其上则有全部数值的1/4或 25%。
二、标准化与标准分 我们可以用公式表示这一标准化过程:
该式表示:先从一个分数中减去平均分, 求出该分数离开平均分的距离(分数低于 平均数时,差为负数;反之为正数),然 后再除以标准差,即得标准分。
标准分具有以下几个特点:
三、标准分的应用
通过把原始分数转换为标准分,原分数不 见了,而代之以一个抽象的相对位置(标 准分无实际单位),这样就可以用同一把 尺子来衡量和比较不同考试(因而不同质) 的分数。 利用标准分,可以把不同质的考试分数合 成(求和或平均数),然后再加以比较。
二、平均差的求法: 平均差是基于算术平均数上的一个差异量数, 而根据算术平均数的一个重要性质,一组数据中 每个数值与算术平均数的差(即离均差)之和等 于零即( ),因此求平均差时,要取离均 差的绝对值。
对于未分组数据,首先要计算每个数值 的离均差,取其绝对值,然后把所有离均 差相加,再除以数值的个数。公式表示如 下:
我们下面以表4.1的分组数据未说明四分差的计算过程:
已知:N=100,i=5; Q 的位置为N/4=25,即在10~14组,该组的精确下 限为9.5/,该组以下的累积次数(F )为8;
1 b
Q 的位置为3N/4=75,即在25~29组,改组的精确 下为24.5。该组以下的累积次数(F )为72;
第四章 离中趋势与差异量数
第一节 离中趋势与差异量数 一、离中趋势的概念 二、差异量数的作用 三.主要的差异量数分类 第二节 两极差 一、两极差的概念 二、两极差的求法 第三节 四分差 一、四分差的概念 二、四分差的求法 第四节 平均差 一、平均差的概念 二、平均差的求法 第五节 标准差与方差 一、标准差与方差的概念 二、标准差与方差的求法 第六节 标准差的应用—数据的标准化 一、考分比较 二、标准化与标准分 三、标准分的应用 四、标准分与正态分布和百分位的关系
总结
离中趋势指的是一组数据的变异或离散程度。对 离中趋势进行度量的统计量称作差异量数。离中 趋势的度量是描述统计的一个重要方面。 本章首先介绍了差异量数的作用:1.能从另一个 角度了解数据的性质。2.有Hale Waihona Puke Baidu于检验或说明集中 量数的代表性。 其次重点介绍了差异量数的四种分类以及各种分 类的求法,这四种分类分别是:1.两极差;2.四 分差;3.平均差;4.标注差与方差。 最后论述了标准差的应用——数据的标准化。而 数据的标准化主要是指对考试分数的比较。
例如10学生在一次完型填空练习中的得分为(满分20分)
9,11,12,12,15,15,16,16,17,18
即以每组组中点代表该组各数值。首先计算组中点与平均数之差,取 其绝对值,再乘以该组次数,然后把各组的计算结果累加,最后除以 总次数N.以表4.2中的数据为例.
三、小结 1.平均差的优点 平均差优于两极差和四分差 用数值离开平均数数的平均距离来表示数据的分 散程度,符合人们的常识,易于理解和接受。 它的计算考虑了每一个数值,因而稳定可靠,不 易受极端数值的影响也不易受样本变化的影响。 2.缺点 计算过程中需要取绝对值等原因,它不适合代数 方法的运算,因而在进一步的统计分析中很少使 用。