3教育统计学第三章
教育统计学课件 (3)
直方图的制作方法于教材第27页。
20.00 18.00 16.00 14.00
频 数
12.00 10.00 8.00 6.00 4.00 2.00 0.00 115 118 121 124 127 130 133 136 139 142 145
身
高(CM)
图2.6a二年级80个学生身高的频数分布直方图
4% 25%
26%
¼ × Ò ± û ¶ ¡
乙 (45.00%)
45%
图2.3
某年级操行评定圆形图
三、表示连续变量的统计图
1.线形图。它能表示两个变量之间的函数关系;
一种事物随另一种事物变化的情况;某种事物随时
间推移的发展趋势等。(第26页)
制作方法于教材第26页。
2.频数分布图 (1)直方图用面积表示频数分布,用各组上下 限上的矩形面积表示各组频数。 (第27页)
直方图与直条图的异同 同:都是用矩形来表示数据; 异:直条图表示间断变量,而直方图来表示连 续变量;直条图各直条之间有间距,直方图各直条 之间没有间隔;直条图是以直条的长短高低来表示 数量关系,而直方图是以面积来表示频数分布。
(2)多边图。多边图是以纵轴上的高度表示 频数的多少的图形。 制图方法大体与直方图相同,其不同之处在于: 以各组中点为横坐标,以各组的频数为纵坐标描点,
等级源自文库图2.1a某年级操行评定结果
《教育统计学》名词解释重点
第一章绪论
1,教育统计学是运用数理统计学的原理来研究教育问题的一门应用科学。
2,教育统计学分为描述统计、推断统计和实验设计三类。
(1)描述统计:计算集中量(算术平均数、中位数、众数、加权算术平均数、几何平均数、调和平均数)来反映集中趋势;计算差异量(全距、四分位距、百分位距、平均差、标准差、差异系数)反映离散程度;计算偏态量及峰态量反映分布形态;计算相关量(积差相关系数、等级、点二列、二列、四分、C相关系数、肯德尔和谐系数、多系列相关系数)反映一致性程度。
(2)推断统计包括总体参数估计和假设检验两部分。
3,随机现象三个特性:一,一次试验有多种可能的结果,其所有结果是已知的;二,试验之前不能预料那一种结果会出现;三,在相同条件下可以重复试验。
随机事件:随机现象的每一种结果。
随机变量:把能表示随机现象各种结果的变量称之
4,总体:是我们研究的具有某种共同特性的个体的总和。
样本数目大于30称为大样本,小于等于30称为小样本。
第二章数据的初步整理
1,教统资料来源有经常性资料和专题性资料。
专题性资料包括(1)教育调查。按调查方法分为现情调查、回顾调查和追踪调查;按调查范围分全面调查和非全面调查(抽样调查和典型调查)。(2)教育实验。分为单组实验(指对同一实验对象先后实施两种实验处理)、等组实验(指在甲乙两组条件基本相同的情况下,对之实行不同的实验处理)和轮组实验(指在实验组和对照组分别进行两种实验处理,并且每种处理各重复一次,也即每个或多个单组实验的联合)
2,数据的分类。按来源分为点计数据和度量数据;按随机变量取值情况分为间断型随机变量(取值个数有限、独立的、两个单位之间不能再划分细小单位、一般用整数表示,如优劣程度、品德爱好打分)和连续性随机变量(个数无限、单位之间可以再划分、可以用小数表示如身高体重、完成作业的时间等)。
心理与教育统计学课后题答案
张厚粲现代心理与教育统计学第一章答案
1名词概念
(1)随机变量
答:在统计学上把取值之前,不能准确预料取到什么值的变量,称为随机变量。
(2)总体
答:总体(population)又称为母全体或全域,是具有某种特征的一类事物的总体,是研究对象的全体。
(3)样本
答:样本是从总体中抽取的一部分个体。
(4)个体
答:构成总体的每个基本单元。
(5)次数
是指某一事件在某一类别中出现的数目,又称作频数,用f表示。
(6)频率
答:又称相对次数,即某一事件发生的次数除以总的事件数目,通常用比例或百分数来表示。(7)概率
答:概率(probability),概率论术语,指随机事件发生的可能性大小度量指标。其描述性定义。随机事件A在所有试验中发生的可能性大小的量值,称为事件A的概率,记为P(A)。(8)统计量
答:样本的特征值叫做统计量,又称作特征值。
(9)参数
答:又称总体参数,是描述一个总体情况的统计指标。
(10)观测值
答:随机变量的取值,一个随机变量可以有多个观测值。
2何谓心理与教育统计学?学习它有何意义?
答:(1)心理与教育统计学是专门研究如何运用统计学原理和方法,搜集、整理、分析心理与教育科学研究中获得的随机性数据资料,并根据这些数据资料传递的信息,进行科学推论找出心理与教育统计活动规律的一门学科。具体讲,就是在心理与教育研究中,通过调查、实验、测量等手段有意地获取一些数据,并将得到的数据按统计学原理和步骤加以整理、计算、绘制图表、分析、判断、推理,最后得出结论的一种研究方法。
(2)学习心理与教育统计学有重要的意义。
心理与教育统计学第三章 同步练习与思考题
第三章同步练习与思考题
1.解释下列名词
集中量数集中趋势平均数中数众数几何平均数倒数平均数百分位数四分位数2.平均数、中数、众数三者之间有何关系?如何选用?
3.中数与百分位数、四分位数的关系如何?
4.为什么说平均数是最具代表性、最好的集中量指标?作为一种优良集中量的指标应具备哪些条件?集中量的各项指标各有什么特殊用途?
5.分析平均速度时应如何选择计算方法?
6.某校2001级心理班学生的普通心理学的考试成绩如下表。试问
①平均数、中数、众数分别是多少?
②百分之40和百分之86位置上的分数是多少?
③四分位数分别是多少?
表3-11 学生普通心理学考试成绩分布表
组别93- 90- 87- 84- 81- 78- 75- 72- 69- 66- 63- 60- 57- 54- 人数 1 2 4 5 7 11 8 7 5 3 2 3 1 1 7.请就下列各组数据选择最佳的集中量指标,并计算出结果。
① 7,10,4,8,9,10,6,8
② 8,5,9,10,11,14,11,12,40
③ 17,19,12,16,18,10,22,18,17
8.某一团体成员的年龄分布如下表所示。试问表示它们集中趋势的恰当指标是什么?为什么?并计算出你所选定的指标。
表3-12 年龄分布表
25岁以下25-34岁35-44岁45-54岁55-64岁64岁以上f
45 40 30 55 28 15
9.某院1995年至2004年研究生招生情况如表3-12所示。
①求平均发展速度和平均增长速度。
②估计2010年其研究生招生人数会达到多少?
心理与教育统计学课后题答案心理统计学试题及答案
心理与教育统计学课后题答案心理统
计学试题及答案
张厚粲现代心理与教育统计学第一章答案张厚粲现代心理与教育统计学第一章答案第一章
1 名词概念(1)随机变量)答:在统计学上把取值之前,不能准确预料取到什么值的变量,称为随机变量。(2)总体)答:总体(population)又称为母全体或全域,是具有某种特征的一类事物的总体,是研究对象的全体。(3)样本)答:样本是从总体中抽取的一部分个体。(4)个体)答:构成总体的每个基本单元。(5)次数)是指某一事件在某一类别中出现的数目,又称作频数,用 f 表示。(6)频率)答:又称相对次数,即某一事件发生的次数除以总的事件数目,通常用比例或百分数来表示。(7)概率)答:概率(probability),概率论术语,指随机事件发生的可能性大小度量指标。其描述性定义。随机事件 A 在所有试验中发生的可能性大小的量值,称为事件 A 的概率,记为P(A)。(8)统计量)答:样本的特征值叫做统计量,又称作特征值。(9)参数)答:又称总体参数,是描述一个总体情况的统计指标。(10)观测值)答:随机变量的取值,一个随机变量可以有多个观测值。
2 何谓心理与教育统计
学?学习它有何意义?何谓心理与教育统计学?学习它有何意义?答:(1)心理与教育统计学是专门研究如何运用统计学原理和方法,搜集、整理、分析心理与教育科学研究中获得的随机性数据资料,并根据这些数据资料传递的信息,进行科学推论找出心理与教育统计活动规律的一门学科。具体讲,就是在心理与教育研究中,通过调查、实验、测量等手段有意地获取一些数据,并将得到的数据按统计学原理和步骤加以整理、计算、绘制图表、分析、判断、推理,最后得出结论的一种研究方法。(2)学习心理与教育统计学有重要的意义。①统计学为科学研究提供了一种科学方法。科学是一种知识体系。它的研究对象存在于现实世界各个领域的客观事实之中。它的主要任务是对客观事实进行预测和分类,从而揭示蕴藏于其中的种种因果关系。要提高对客观事实观测及分析研究的能力,就必须运用科学的方法。统计学正是提供了这样一种科学方法。统计方法是从事科学研究的一种必不可少的工具。②心理与教育统计学是心理与教育科研定量分析的重要工具。凡是客观存在事物,都有数量的表现。凡是有数量表现的事物,都可以进行测量。心理与教育现象是一种客观存在的事物,它也有数量的表现。虽然心理与教育测量具有多变性而且旨起它发生变化的因素很多,难以准确测量。但是它毕竟还是可以测量的
教育统计学第三章 概率分布_OK
• 一、随机事件及概率的一般概念 • 二、二项分布 • 三、正态分布 • 四、正态分布练习题
cqqh
1
随机事件
返
• 了解下列概念: • 1、随机试验 • 2、随机事件
• 基本事件、不可能事件、必然事件
3、事件的和与事件的积 4、互不相容事件与独立事件
2
随机试验
返
• 为了探索随机现象的规律性,往往需要对随机现 象反复进行观测,而每一次观测被看作是一次试 验。如果一次试验满足以下条件,我们就称这样 的试验是一个随机试验,简称试验。即:
• 例1。 • 例2。
18
• 例1:有10道选择题,每题有5个答案,其中只有一个是正确的。
• (1)试分别计算,如果仅凭猜测,猜对1题、2题、3题、4题、5题、 6题、7题、8题、9题、10题的概率。
• (2)答对几题才能说不是猜的结果?
• (2)解:
C P( X 10) 10 0.210 0.80 0.000000102 10
返回
19
• 例2:有正误判断题10题,问答题者答对几题才能认为他是真的会,或者说答对 几题,才能认为不是出于猜测因素?
• 解:此题p=q=1/2, 即猜对猜错的概率各为0.5。np≥5,故此二项分布接近正
态分布: np 10 1 5
2
npq 10 0.5 0.5 1.58
心理与教育统计学03 集中量_OK
14Fra Baidu bibliotek
30
125~130
10
40
130~135
6
46
135~140
4
50
合计
50
—
M0
120
14 8
5
(14 8) (14 10)
123(个)
32
三、众数的特点与应用
优点:简单、容易理解。 缺点:不稳定、受分组影响;计算时不用所
有数据;总数乘以众数不等于数据的总和; 不能作进一步代数运算。 应用:一般用在下列情形:需要快速确定一 组数据的代表值;数据不同质;当数据有 极端值;
Mg N 1 X N 61 97 ;
X1
40
lg Mg 1 lg 97 ; 5 40
Mg 1.1938.
40
几何平均数的应用
——人数、经费增加率
【例3.11】 某校连续四年的毕业人数为:980、1100、1200、 1300人,问毕业生平均增长率是多少?若该校毕业生一 直按此增长率变化,问再过五年后的毕业人数是多少?
缺点:易受极端数据的影响;出现模糊不清得数据 时,无法计算。
应用:数据同质性原则; 一组数据中每个数据都比 较准确、可靠;无极端值的影响;而且还要通过 它计算其他统计量。
13
第二节 中位数
一、中位数的概念:
心理与教育统计学课后题答案
张厚粲现代心理与教育统计学第一章答案
1名词概念
(1)随机变量
答:在统计学上把取值之前,不能准确预料取到什么值的变量,称为随机变量。
(2)总体
答:总体(population)又称为母全体或全域,是具有某种特征的一类事物的总体,是研究对象的全体。
(3)样本
答:样本是从总体中抽取的一部分个体。
(4)个体
答:构成总体的每个基本单元。
(5)次数
是指某一事件在某一类别中出现的数目,又称作频数,用f表示。
(6)频率
答:又称相对次数,即某一事件发生的次数除以总的事件数目,通常用比例或百分数来表示。(7)概率
答:概率(probability),概率论术语,指随机事件发生的可能性大小度量指标。其描述性定义。随机事件A在所有试验中发生的可能性大小的量值,称为事件A的概率,记为P(A)。(8)统计量
答:样本的特征值叫做统计量,又称作特征值。
(9)参数
答:又称总体参数,是描述一个总体情况的统计指标。
(10)观测值
答:随机变量的取值,一个随机变量可以有多个观测值。
2何谓心理与教育统计学?学习它有何意义?
答:(1)心理与教育统计学是专门研究如何运用统计学原理和方法,搜集、整理、分析心理与教育科学研究中获得的随机性数据资料,并根据这些数据资料传递的信息,进行科学推论找出心理与教育统计活动规律的一门学科。具体讲,就是在心理与教育研究中,通过调查、实验、测量等手段有意地获取一些数据,并将得到的数据按统计学原理和步骤加以整理、计算、绘制图表、分析、判断、推理,最后得出结论的一种研究方法。
(2)学习心理与教育统计学有重要的意义。
教育统计学第三章 概率分布
性质
二项分布
在n次试验中,成功事件A出现X次的概率分布,其函数为:
b(x.n. p)C
x n
p xqn x
二项分布的性质
返回
1、二项分布是离散型分布。
(1)当p=q时,分布图是对称的。 (2)当p≠q时,分布图呈偏态。当n很大时,二项分布的极限分 布是正态分布。一般规定: 当p<q且np≥5,或p>q且nq≥5,这时的n就被认为很大,可以 用正态分布的概率作为近似值了。
例。
例
难度分数的计算
答对者% 99 95 85 80 70 50 20 5 1 查表时的P值 Z Z+5
测验题号 1 3 5 7 9 10 11 13 25
例
返回
难度分数的计算
答对者% 99 95 85 80 70 50 20 5 1 查表时的P值 Z 0.49 0.45 0.35 0.30 0.20 0 0.30 0.45 0.49 -2.331 -1.645 -1.035 -0.84 -0.525 0 0.84 1.645 2.33 Z+5 2.670 3.355 3.965 4.160 4.475 5.000 5.840 6.645 7.330
1、后验概率 (1)随机事件A在n次试验中出现 m次,m与n的比值,就是 事件A出现的频率。 (2)随着试验次数n的无限增大,当n趋向于无穷大时,随机 事件A的频率稳定于一个常数P,这个常数P就是随机事件A出现 的概率。 2、先验概率(古典概率) (1)古典概率模型要求满足两个条件:其一,试验的所有可 能结果是有限的;其二,每一种结果出现的可能性相等。 (2)若所有可能的结果的总数为n,随机事件A包括m个可能 结果,则事件A的概率为 P(A)=m/n
心理与教育统计学课后题答案
张厚粲现代心理与教育统计学第一章答案
1名词概念
(1)随机变量
答:在统计学上把取值之前,不能准确预料取到什么值的变量,称为随机变量。
(2)总体
答:总体(population)又称为母全体或全域,是具有某种特征的一类事物的总体,是研究对象的全体。
(3)样本
答:样本是从总体中抽取的一部分个体。
(4)个体
答:构成总体的每个基本单元。
(5)次数
是指某一事件在某一类别中出现的数目,又称作频数,用f表示。
(6)频率
答:又称相对次数,即某一事件发生的次数除以总的事件数目,通常用比例或百分数来表示。(7)概率
答:概率(probability),概率论术语,指随机事件发生的可能性大小度量指标。其描述性定义。随机事件A在所有试验中发生的可能性大小的量值,称为事件A的概率,记为P(A)。(8)统计量
答:样本的特征值叫做统计量,又称作特征值。
(9)参数
答:又称总体参数,是描述一个总体情况的统计指标。
(10)观测值
答:随机变量的取值,一个随机变量可以有多个观测值。
2何谓心理与教育统计学?学习它有何意义?
答:(1)心理与教育统计学是专门研究如何运用统计学原理和方法,搜集、整理、分析心理与教育科学研究中获得的随机性数据资料,并根据这些数据资料传递的信息,进行科学推论找出心理与教育统计活动规律的一门学科。具体讲,就是在心理与教育研究中,通过调查、实验、测量等手段有意地获取一些数据,并将得到的数据按统计学原理和步骤加以整理、计算、绘制图表、分析、判断、推理,最后得出结论的一种研究方法。
(2)学习心理与教育统计学有重要的意义。
教育统计学
第一章:概述
一、教育统计学的含义
(一)什么是统计学
A统计学是研究随机现象的数量规律性的一门数学分支。自然界中有两类现象:a.确定现象b.随机现象。随机现象的规律性可用概率论来描述,起源于(法)帕斯卡对赌博现象的研究。
B数理统计学:以概率论为基础
C应用统计学:是数理统计学理论在各个学科领域中的应用。
(二)什么是教育统计学
探讨如何将统计学的原理和方法应用于研究教育现象中数量关系的科学。根据不同功能可划分为:
1.统计设计:研究如何科学全面地搜集统计数据以确保统计结论的可靠性。如:如何进行随机抽样,如何设计实验等。
2.描述统计:研究如何对搜集到的统计数据进行分析整理,以显示数量关系,如:计算数据的集中度、离散度等。
3.推断统计:研究如何利用样本数据来推测和判断未知的总体特征,如总体参数估计、假设检验等。
二、几个基本概念
(一)变量与变量值
A变量:可以定量并能取不同数值的事物的某种特征。
B变量值:变量具体的数值如考试的分数、智力水平
C变量的类型:
①类别变量:只是用数字来代表事物或对事物进行分类,数字没有任何数值意义。不能做量化分析,无大小意义,只表明类别。如性别男1 女2
②顺序变量:表明类别的大小或某种属性的多少。主要用于分等论级和分类。仅表示等级,不表示某种属性的真正量和绝对值。无参照点(没有绝对零度)和相等单位。如:五点评分:ABCDE
③等距变量:存在大小关系,无绝对零点,但存在相对零点。可进行数学运算、有相等单位。如IQ
④比率变量:有相等单位和绝对零点,可以知道事物之间的某种特点上相差多少及他们之间的倍数关系。如长度
3教育统计学第三章
例6 求2,8,32,125,502的几何平均 数。 解:由于这组数属于近似等比数列,直接 利用公式,得
Mg
n
X 1 X 2 X n
5 2 8 32 125 502
=31.72
例7 已知某校四年中各年度的学生人数分别为上一年
的1.12倍,1.09倍,1.08倍和1.06倍,求每年的平均增长
Md U md
U md
n i ( n2 ) 2 f md
(由大向小计算)
(3.4)
—中位数所在组的上限 —总频数 —大于中位数所在组上限的频数总和 —频数分布表上的组距
n n2
i
f md —中位数所在组的频数
以表3-2为例,说明中位数的计算.
表3-2 48个学生数学成绩频数分布表
分数 45-
二、算术平均数的计算方法
1.原始数据计算法
例1 某班选八名同学参加年级数学竞赛,成
绩分别为82,90,95,88,90,94,80,93。
求其平均成绩。
解:把n=8,X1=82,…,X8=93代入公式 (3.1),得
X 82 90 95 88 90 94 80 93 89 X
i i
i
例2:P26
例3 某年级四个班的学生人数分别为50人,
52人,48人,51人,期末数学考试各班的平均
高等职业教育“十一五”规划教材《统计学》第三章课后习题及答案
高等职业教育“十一五”规划教材《统计学》第三章课后习题及答案
一.判断题
1.对于连续型变量,其组限是按照“上限不包括在内”的原则进行汇总的。
对。所谓“上组限不在内”的原则,是对连续变量分组采用重合组限时,习惯上规定一般
只包括本组下限变量值的单位,而当个体的变量值恰为组的上限是时,不包括在本组。
2.统计资料的整理不仅是对原始资料的整理,而且还包括对次级资料的整理。
对。
3.在确定组限时,最大组上限必须大于最大变量值,最小组下限必须小于最小变量值。
错,等于也可在闭口组中试用。
4.对统计总体进行分组是由于总体各单位的“同质性”所决定的。
错,将原始数据按照某种标准化分成不同的组别。
5.连续型变量在进行分组时,其组限可以采取“不重叠”式表示。
对。
二.单项选择题
1.某连续型变量的组距数列,其末组为开口凯旋而归,下限为600,其邻组的组中值为550,则末组的组中值为(B)
A.550
B.650
C.700
D. 750
由于是连续型变量,变量值之间是连续的。又因为末组的开口下限比邻组中值要大,注意
它是一个递减变量数列。而一个组的最小值,称为下限。。。所以这里的下限,实际才是
邻组的上限。所以末组的下限=邻组的上限,因此邻组的上限也是600。又有邻组的组中值
是550,所以可以确定邻组的组距为100。再利用公式:缺上限开口组组中值=下限+邻组组
距/2可得末组组中值为650。
2.对一个总体选择三个标志做复合分组,按各个标志所分的组数分别为3、4、5,则所分
的全部组数为(A)
A.60
B.12
C.30
D.6
3.某小区居民人均月收入最高为5500元,最低为2500元,据此分为6组,形成等距数列,其组距应为(A)
复旦大学统计学课件--第3章_数据的描述性整理
②强度相对数大多数为有名数(且为复名数),有些 也用百分数或千分数等无名数形式表示
如外贸依存度、人口死亡率(报告期死亡人数除以报告期 平均人数)。
③强度相对数常常带有“平均”意义,但统计理论上 倾向于把它作为一种相对数而不是平均数。
国内生产总值 第一产业 第二产业 第三产业
209407 24700 102019 82703
100 11.8 48.7 39.5
3-39
二、变பைடு நூலகம்数列的类型
统计整理中,根据分组标志的不同,分 布数列分为品质分布数列(按品质标志分组 所编制的分布数列)和变量分布数列(按数 量标志分组所编制的分布数列)。
内发展变化的总量。时期指标和时期有着直 接的关系。
时点指标反应现象在某一时刻(瞬间或 者时点)状态上的水平。时点指标与时间长 短没有直接的关系,且不具有可加性。
3-9
时期性指标和时点性指标的区别
时期性总量指标和时点性总量指标的特 点是:
1.从指标数值的大小当中是否包含有时间 过程因素来看,时期性总量指标数值的大小 与它所反映的时间过程的长短直接有关,它 所反映的时间越长,指标数值就越大。时点 性总量指标所反映的是事物在时点上停留量, 其中不含有时间过程因素。
3-42
(一)单项式数列 按每个变量值分别列组,依次分组编制
3教育统计学
∑(X − X )2 < ∑(X − a)2, 其中(a ≠ X )
Email : liuwenlw@sina.com
例如
4、5、3、8、6、4
X =5 Σ( X − X ) = −1 + 0 + (−2) + 3 + 1 + (−1) = 0
Σ( X − X )2 = 12 + 02 + (−2)2 + 32 + 12 +Βιβλιοθήκη Baidu(−1)2 = 16
第一节 算术平均数
Email : liuwenlw@sina.com
一、算术平均数的概念及适用条件
算术平均数是一组同质数据值的总和除以
数据总个数所得的商。
求权值相等且较为整齐的数据。*
样本均数用符号 X (读作X杠或x-bar)表
示。X = n个观测值的和
n
n
总体均数用符号μ表示*
X
=
X1
∑ ∑ X = f1 X1 + f 2 X 2 + L + f k X k = ∑ f1 + f2 + L + fk
fX c = fX c = 3915 = 78.3
f
n
50
Email : liuwenlw@sina.com
教育统计学考试复习资料
第一章:1、何谓心理与教育统计学?学习它有何意义?
教育统计学是专门研究如何运用统计学原理和方法,搜集、整理、分析教育科学研究中获得的随机性数据资料,并根据这些数据资料所传递的信息,进行科学推论找出教育活动规律的一门科学。具体讲,就是在教育研究中,通过调查、实验、测量等手段有意获取一些数据,并将得到的数据按统计学原理和步骤加以整理、计算、绘制图表、分析、判断、推理,最后得出结论的一种研究方法。
意义:(1)统计学为科学研究提供了一种科学方法。(2)教育统计学是教育科学研究定量分析的重要重要工具。(3)广大教育工作者学习教育统计学既可以顺利地阅读国内外先进的研究成果,又可以提高工作的科学性和效率,同时也为学习教育测量打下基础。
2、教育科学研究数据的特点
(1)教育科学研究数据与结果多用数字形式呈现;(2)教育科学研究数据具有随机性和变异性;(3)教育科学研究数据具有规律性;(4)教育科学研究的目的是通过部分数据来推测总体特征。总之,在教育科学实验或调查中,所获得的数据都具有变异性与规律性的特点。
3、思考题:选用统计方法有哪几个步骤?
①要分析一下实验设计是否合理,即所获得的数据是否适合用统计方法去处理,正确的数量化是应用统计方
法的起步,如果对数量化的过程及其意义没有了解,将一些不着边际的数据加以统计处理是毫无意义的。②要分析实验数据的类型。不同数据类型所使用的统计方法有很大差别,了解实验数据的类型和水平,对选用恰当的统计方法至关重要。③要分析数据的分布规律,如总体方差的情况,确定其是否满足所选用的统计方法的前提条件。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
总和
50
3915
解:将表中数据代入公式(3.2),得
fXc 3915 X 78.3 N 50
说明:利用次数分布求得的算术平均数是 一个近似值。因为我们先假设组内的数据是均
匀分布的,利用各组中值分别代表各组数据,
这显然与实际不符,把这一误差叫分组误差
(P26)。
三、算数平均数的应用及其优缺点
2.频数分布表计算法
用下列公式计算:
X1 f1 X 2 f 2 X f1 f 2
X k fk 1 X i fi fk n
(3.2)
X1 , X 2 ,
i i
, X k 为第一组到第K组的组中值
X f 各组组中值与频数乘积之和 f n 为频数总和
i
例2:P26
2. 百分位数的计算方法
在频数分布表上用内插法计算百分位数,计算公式为
i Pp Lp ( pn n1 ) fp
Pp p
(3.5)
——百分位数 ——与百分位数相对应的比数 n ——总频数 Lp ——百分位数所在组的下限 n1 ——小于百分位数所在组下限的频数总和 f p ——百分位数所在组的频数 i ——组距 例如表3—2资料的第30百分位数Pp=P30
反应不灵敏,不适合代数运算,受抽样的影响较大等。因此, 在一般情况下,众数应用也不广泛,但在一些特殊情况下也
常有应用。
众数适用的情况 (1)当需要快速而粗略地寻求一组数据的代表值时; (2)当一组数据出现不同质的情况时; (3)当次数分布中有两极端的数目时;
(4)当粗略估计次数分布的形态时。
四、算术平均数、中位数、众数三者的关系
表3.4 66个学生作文分数的频数分布表
分 数
323538414447505356总和
频 数
4 9 20 14 7 5 4 2 1 66
14 M o 38 3 39.83 14 9
二、众数的应用及其优缺点
众数虽然简明易懂,较少受两极端数值的影响,但它并
不具备一个良好集中量数的基本条件。如极不准确、稳定,
n i Md Lmd ( n1 ) 2 f md
Lmd
(由小向大计算) (3.3)
n —总频数 n1 —小于中位数所在组下限的频数总和
—中位数所在组的下限
i
f md —中位数所在组的频数
—频数分布表上的组距
Md U md
Umd
n i ( n2 ) 2 f md
(由大向小计算)
二、算术平均数的计算方法
1.原始数据计算法
例1 某班选八名同学参加年级数学竞赛,成
绩分别为82,90,95,88,90,94,80,93。
求其平均成绩。
解:把n=8,X1=82,…,X8=93代入公式 (3.1),得
X 82 90 95 88 90 94 80 93 X 89 N 8
例如求80,93,90,81,85,88,92, 84的中位数。 先排序: 80,81,84,85,88,90,92,93 再求(N+1)/2=4.5,这说明中位数的位 置在第四个和第五个数的中间,即 Md=(85+88)/2=86.5
(二)频数分布表计算法 对分组数据常将n/2位置对应的数据看成中位数。 计算公式为:
率。 解:先求出平均发展速度
X g 4 1.12 1.09 1.08 1.06 1.09
然后用公式:平均增长率=平均发展速度-1,
求出年平均增长率。
平均增长率=1.09-1=0.09 故所求的年平均增长率为9%。
只用首末项求几何平均数 设a0,a1,…,an是n个年度中各年度某种数量
值,其中a0是初期量, an是末期量。
X1,X2,…,Xn为各年度发展速度,即
当测量所得的数据,其单位权重并不相等时,要用加
权平均数来求平均数。 加权平均数的计算方法一
W1 X1 W2 X 2 Wn X n Wi X i Xw W1 W2 Wn Wi
式中W i 为权数
例如,一个学生某门学科期中测验成绩为72分,期末
测验成绩为86分,而期中与期末分数之比为4:6,求此门
例3 某年级四个班的学生人数分别为50人,
52人,48人,51人,期末数学考试各班的平均
成绩分别为90分,85分,88分,92分,求年级
的平均成绩。
解:由公式(3.2)得
Xf X f 88.74
90 50 85 52 88 48 92 51 50 52 48 51
级英语测验总平均分数。
72.6 32 80.2 40 75 36 Xt 76.21 32 40 36
二、几何平均数
(一)概念
它是n个数值连乘积的n次方根,用符号 X g 表示,计 算公式为 M g n X1 X 2 Xn
(二)应用时机
1、求一组等比或近似等比数据的平均数时。 2、一组数据中,有少数偏大或偏小的数据,数据分布 呈现偏态,求平均数时。 3、在教育上,主要应用几何平均数求平均发展速度或 对某项目标进行预测估计。
例6 求2,8,32,125,502的几何平均 数。 解:由于这组数属于近似等比数列,直接 利用公式,得
Mg
n
X1 X 2
Xn
5 2 8 32 125 502
=31.72
例7 已知某校四年中各年度的学生人数分别为上一年
的1.12倍,1.09倍,1.08倍和1.06倍,求每年的平均增长
对称分布:平均数
非对称分布:中位数、众数
2.从计算的精确性看 平均数最精确、中位数次之、众数最差 3.从对统计分析的适用性看 平均数既可作描述统计量,又可作推论统计量。 中位数与众数常用作描述统计量。
算术平均数 1. 优 2. 点 3. 4.
中
位
数
众
数
1.比较严密确定 1.简明易懂 2.简单易懂 2不易受两极端数据的 3.计算简便 影响 4.受抽样变动影响较小 1.有极端数值时 2.数据不同质时 3.粗略估计数据的集 1.有极端数值时 中 2.模糊数据时 量时 3.快速估计集中量数时 4.粗略估计次数分布 时 5.双峰分布时 1.反应不够灵敏 2.易受抽样变动影响 3.不适合代数运算 4.计算不严密 1.反应不够灵敏 2.易受抽样变动影响 3.不适合代数运算 4.计算不严密
1 3 4 6 19 7 5 3 2
50
2.用公式求理论众数的近似值 (1)皮尔逊的经验法
只有当频数分布呈正态或接近正态时,才能使用。
Mo 3Md 2 X
表3.3 50个学生语文分数的频数分布表 频 数 1 3 4 6 19 7 5 3 2 分 数 556065707580859095-
M o 3 77.89 2 78.20 77.27
1.当次数分布呈正态时: M
Md M 0
2.当次数分布呈正偏态时:
M Md
M Md 1 M0 且 M M 3 0
3.当次数分布呈负偏态时:
M Md
M Md 1 M 0且 M M 3 0
补充:平均数、中位数与众数的比较
1.从对数据次数分布形态的适用性来看
二、众数的计算方法
1.用观察法直接寻找粗略众数 在一组原始数据中,频数出现最多的那个数值 就是众数。
例如:2、4、3、6、4、5、4 在频数分布表中,频数最多一组的组中值就是 粗略众数。例如下表的数据的粗略众数为Mo=77.5。
表3.3 50个学生语文分数的频数分布表 频 数 分 数
556065707580859095总和
第三章 集中量
第一节 算术平均数 第二节 中位数 第三节 众数 第四节 加权平均数 几何平均数 调和平均数
第一节 算术平均数
一、算术平均数的概念
算术平均数是一组同质数据值的总和除以数 据总个数所得的商。简称平均数、均数或均值, 用 X (读X杠)表示。 X1 X 2 Xn Xi (3.1) X n n
1、算术平均数具备一个良好的集中量所应具备 的一些条件
Baidu Nhomakorabea
(1)反应灵敏 (2)严密确定 (3)简明易懂,计算方便 (4)适合代数运算 (5)受抽样变动的影响较小
2、算术平均数的优点
(1)只知一组观测值的总和及总频数即可求出; (2)用加权法可以求出几个平均数的总平均数; (3)用样本数据推断总体集中量时,算术平均数最接近 总体集中量的真值,它是总体平均数的最好估计值; (4)在计算方差、标准差、相关系数以及进行统计推断 时,都要用到它。
课程学期总平均成绩。
XW
72 4 86 6 80.4 46
加权平均数的计算方法二
n1 X 1 n2 X 2 nK X K Xt n1 n2 nK
n X n
i i
i
例如,小学三年级英语测验,甲班32人平均分72.6, 乙班40人平均分为80.2,丙班36人平均分为75,求全年
总和
50
(1)金氏插补法 当频数分布呈偏态,即众数所在组以上各组频数 总和相差较多时,可以使用金氏插补法。 fa M o Lmo i f a fb
Lmo ——众数所在组的下限 f a ——大于众数所在组上限那个相邻组的频数
f b ——小于众数所在组下限那个相邻组的频数
i ——组距
例如:下表数据
1.加权平均数 应 2.离差、相关计算 用 3.统计推断
1.易受极端值的影响 2.数据模糊不清、缺 不 失时无法计算 足 3.数据不同质时无法 计算。
第四节 加权平均数、几何平均数、调和平均数
一、加权平均数
加权平均数的概念 加权平均数是不同比重数据(或平均数)的平均数, 用 X W 或 X t 表示。 加权平均数的应用
(3.4)
n —总频数 n2 —大于中位数所在组上限的频数总和
—中位数所在组的上限
i
f md —中位数所在组的频数
—频数分布表上的组距
以表3-2为例,说明中位数的计算.
表3-2 48个学生数学成绩频数分布表
分数 45-
频数 1
累积频数 1
505560-
2
0 2
3
3 5
6570758085-
3
8 7 7 7
例4 某班50人外语期末考试成绩的次数分布 如下,求全班学生的平均成绩。
表3-1 某班50人外语成绩次数分布表
分数
组中值Xc
频数f
fXc
9085807570-
92
87 82 77 72
3
10 15 8 5
276
870 1230 616 360
656055-
67
62 57
3
4 2
201
248 114
8
16 23 30 37
9095总和
5
6 48
42
48
48 5 Md 80 ( 23) 80.71 2 7
三、百分位数的概念及其计算方法
1. 百分位数的概念
百分位数是位于依一定顺序排列的一组数据中某一百 分位置的数值一般用Pp表示。 如第70百分位数(P70)就是依从小到大排列的一组 数据中小于此数值有70%个频数,大于此数值有30%个 频数的那个数值。 中位数就是第50百分位数。
3、算术平均数的缺点
(1)易受两极端数值的影响; (2)有个别数据模糊不清时,无法计算
算术平均数的适用条件是:一组数据中所有数据都 比较准确、可靠;无两极端数值的影响。
第二节 中位数
一、中位数的概念及适用条件
1. 概念 中位数是位于一组有序数据中间位置的量数。 也称中数,用Md表示。 它是将一组有序数据的个数分为相等两部分的那 个数据,它可能是原始数据中的一个,也可能是 通过计算得到的一个数。
表3-2 48个学生数学成绩频数分布表
分数 45-
频数 1
累积频数 1
505560-
2
0 2
3
3 5
6570758085-
3
8 7 7 7
8
16 23 30 37
9095总和
5
6 48
42
48
第三节 众 数
一、众数的概念(用Mo表示)
1.理论众数:与频率分布曲线最高点相对应的横 坐标上的一点。 2.粗略众数:一组数据中频数出现最多的那个数。
2. 适用条件
(1) 当一组数据有极端值出现时。
(2) 当一组有序数据两端有个别数据模糊不清
或分组资料有不确定组限时。
(3) 当需要快速估计一组数据的代表值时。
二、中位数的计算方法
1. 原始数据计算法 一组数据未分组,先排序,中位数取决于数 据的个数是奇数还是偶数。 当数据的个数为奇数时,则以第(N+1)/2 个位置上的数据作为中位数。当数据的个数为偶 数时,则取居中间的两个数据的平均数为中位数。