教育与心理统计学第六章:概率分布
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
生活中有很多这样的事例
举例:
1、我们队将可能赢得今晚的这场比赛。 2、今天下午下雨的机会有40%。 3、这个冬天的周末我很可能有个约会。 4、我有50比50的机会通过今年的英语四
级考试。
概率的分类
1、后验概率(empirical definition of Probability)
以随机事件A在大量重复试验中出现的稳定频率值作 为随机事件A的概率估计值,这样求得的概率称为 后验概率。
进行推论,从而确定推论正确或错误的概率。
一、正态分布及渐近正态分布
(一)样本平均数的分布
1、总体分布为正态, δ2已知,样本平均数 的分布为正 态分布
标准误,即样本均数的标准差,是描述均数抽样分布的 离散程度及衡量均数抽样误差大小的尺度,反映的是 样本均数之间的变异。
标准误用来衡量抽样误差。标准误越小,表明样本统计 量与总体参数的值越接近,样本对总体越有代表性, 用样本统计量推断总体参数的可靠度越大。
第六章 概率分布
第一节 概率的基本概念 第二节 正态分布 第三节 二项分布 第四节 样本分布
第一节 概率的基本概念
一、什么是概率 随机现象(或随机事件)——在心理学研究中,通过实
验、问卷调查所获得的数据,常因主试、被试、施测 条件等因素的随机变化而呈现出不确定性,即使是相 同的被试在相同的观测条件下,多次重复测量结果也 还是上下波动,我们一般都无法事先确定每一次测量 的结果。 概率(probability):随机事件出现可能性大小的客观 指标
2、计算概率时 ,每一个正态分布都需要有自己 的正态概率分布表,这种表格是无穷多的
3、若能将一般的正态分布转化为标准正态分布, 计算概率时只需要查一张表
(三)标准正态分布表的编制与使用
1、编制原则
从Z=0开始,逐渐变化Z分数,计算从Z=0至某一定值 之间的概率。因为正态分布是对称分布,且对称轴为 过μ=0,即Z=0点的纵线,故当Z<0时,其概率与Z>0 时的相对应的Z分数下的概率值相等。
分布的一种,是在数理统计的理论与实际应 用中占有最重要地位的一种理论分布
(二)正态分布曲线函数
y
1
e1 2
2
x
2
2
, x
(三)正态分布的特征
1、正态分布的形式是对称的(但对称的不一定是正态的) ,在正态分布中,均数、中数、众数合一,y值最大为 0.3989
2、正态分布的中央点最高,然后逐渐向两侧下降,曲线的 形式是先内后外。
① 求某Z分数值与平均数(Z=0)之间的概率。如求 Z=1到平均数之间的概率
② 求某Z分数以上或以下的概率,如求Z=1以上的概率 是多少
③ 求两个Z分数之间的概率,如果Z分数为同号则相减, 如果为异号则相加
(2)从概率(p)求Z分数
① 已知从平均数开始的概率值求Z值。如已知 平均数以上0.25的概率,求Z值
3、正态曲线下的面积为1,垂线将其划分为相等的两部分。 4、正态分布式一族分布,它随随机变量的平均数、标准
差的大小与单位不同而有不同的分布形态。
5、正态分布中各差异量数值相互间有固定比率。 6、在正态分布中,标准差与概率有一定的数量关系。
标准差相等、均数不等的正态分布图
均数相等、标准差不等的正态分布图
正态分布表一般包括3栏:第一栏是Z分数单位,一般 标为Z,在平均数这一点上Z=0,在平均数以上分数为 正值,在平均数以下分数为负值。第二栏为密度函数 或比率数值,即某一Z分数点上的曲线纵坐标的高度。 第三栏为概率值(p),即不同Z分数点与平均数之间 的面积与总面积之比
2、正态分布表的使用
(1)依据Z分数求概率(p)
在正态分布曲线下,标准差与概率有一定的关系 。在正态分布中,平均数上下各延伸一个标准差 ,包括总面积的68.26%,意即正态分布中,从1s到1s包括了68.26%的个案。
正负1.96个标准差之间,包括了总面积的95%。 正负2.58个标准差包含总面积的99%
34.13% 34.13%
13.59%
正态分布的实际应用
确定正态分布下的录取分数线
例:某区拟对参加数学竞赛的2000人中前500人予以奖 励,考试的平均分数为75,标准差为9,问授奖的分数 线是多少?
三、次数分布是否为正态分布的检验方法
(一)皮尔逊偏态量数法 正偏态中M>Md>Mo,负偏态中M<Md<Mo 在偏态分布中,平均数距中数较近,而离众数较远
负值,右侧t为正值,峰态比较高狭。 3、变量取值范围- ∞ —+ ∞ 4、当样本容量趋于∞,t分布为正态分布
,方差为1
(二)t分布表的应用 t值、自由度、显著性水平
要求:学会区别t值的单侧概率与双侧概率
(三)样本平均数的分布 1、总体分布正态,方差未知时,样本平均数的分为为t
分布
2、当总体分布为非正态而方差又未知时,若满足n >30 这一条件,样本平均数的分布近似为t分布
② 已知位于正态分布两端的概率值求该概率值 分界点的Z值。如求上端0.01概率分界点的 Z值
③ 若已知正态曲线下中央部分的概率,求Z分 数是多少。如求正态曲线中间部分0.95概率 两处分界点的Z值
(3)已知概率或Z值,求概率密度函数
正态分布的实际应用
确定正态分布下特定分数界限内人数
例:某区3600个学生数学测验分数接近正态分布,其平 均分为80分,标准差为11.5分,问在70~90分之间应当有 多少人?
【例】设有1000中产品,其中 850件是正品,150件是次品, 从中依次抽取2件,两件都是次 品的概率是多少?
P( A1 A2 ) P( A1 )P( A2 | A1 ) 150 149 0.0224 1000 999
第二节正态分布
一、正态分布及其特征 (一)定义 正态分布又叫常态分布,是连续随机变量概率
第三节 二项分布(贝努里分布)
二项分布(binomi distribution)——用于离散型随机变量 的概率分布
投掷一枚相同的硬币5次,每次正面向上的概率为 0.5
某同学玩射击气球游戏,每次射击击破气球的概 率为0.7,现有气球10个
某篮球队员罚球命中率为0.8,罚球6次
比较上面案例,找到其相似点
2、总体分布非正态,但δ2已知,这时样本足够大时(n > 30),其样本平均数的分布为渐近正态分布
样本n越大,接近布 从正态分布的总体中抽取容量为n的样本,当n足够大时
( n > 30 ),样本方差及标准差的分布渐趋正态分 布。
二、 t分布 (一)特点
1、平均数为0 2、以平均值0左右对称的分布,左侧t为
互不相容事件:在一次实验或调查中,若事件A发生则 事件B就不一定发生,否则二者为相容事件
互不相容事件特点:无论互不相容事件有多少,其总 和的概率永远不会大于1
例如:对学生进行考核成绩评定(优,良,中,差)
小概率事件
P <0.05 P <0.01
例题
① 某学生从5个试题中任意抽选一题,如果抽到 每一题的概率为1/5,则抽到试题1或试题2的概 率为多少?
四 、F分布 (一)特点
1、正偏态 2、总为正值 3、当分子的自由度为1,分母的自由度为任意值时,F值
与分母自由度相同概率的t值的平方相等。
(二)二项分布
二项分布——试验仅有两种不同性质结果的概 率分布,两个观测值是对立的。例如:考试的 及格与不及格,产品试验中的成功与失败
(三)二项分布的应用 【例题6-6】
例题:今有四选一选择测验100题,问答 对多少题才能说是真的回答而不是猜测?
第四节 样本分布
样本分布是通过一个样本进行分析,依据样本对总体
一、二项试验与二项分布 (一)符合下述条件的试验叫二项试验
●1、包含了n个相同的试验,n是预先给定的任一整数
●2、每次试验相互独立
●3、每次试验只有两种可能的结果:“成功”或“失败”
●4、每次出现的概率p在任何一次实验中都是固定的
●5、试验“成功”或“失败”可以计数,即试验结果对 应于一个离散型随机变量
13.59%
.13% 2.15%
.13% 2.15%
原始分 标准差
70 80 -3 -2
90 100 110 120 130 (平均数)
-1 0 1 2 3
正态曲线下人数的分布情况
二、标准正态分布 (一)概念
Z X
一般正态分布
x
标准正态分布
1
Z
20
(二)标准正态分布的重要性
1、一般的正态分布取决于均值和标准差
(2)将Z分数转化成T分数 T=10Z+50
(三)确定题目难易度
作用:比较不同难易度题目之间的难度相差多少
原理:假设一个测验中不同难易题目的分布是正态 的,即一个测验中通过率较大和较小的题目很少, 而通过率居中的题目较多
(四)在能力分组或等级评定时确定人数
假定能力是正态分布,这时若将能力分组,各 组人数应是多少? 评定不同等级,各等级人数应是多少才能使分 组或评定等级构成等距的尺度?
② 某大学有50%的学生喜欢看足球比赛,40%的 喜欢看篮球比赛,30%两者都喜欢。问,从该 校任意抽取一名学生,他爱看足球比赛或篮球 比赛的概率是多少?
(三)概率的乘法定理 乘法定理:两个独立事件同时出现的概率等
于该两个事件概率的乘积
独立事件:一个事件的出现对另一个事件的 出现不发生影响
例如:有放回的抽取扑克牌
特点: ①当观测次数无限增大时,计算出的概率估 计值越趋近真实的概率值
②当进行多次观测时,按观测结果计算的概 率基本接近先验概率 (3)举例:一年中下雨天
2、先验概率(classical definition of Probability) (1)定义:随机事件的概率按古典概率模型推算而
得
(2)条件:①实验的每一种可能结果是有限的(结 果类别有多少种确定)
(二)峰度、偏度检验法(N≥200)(SPSS操作) 在偏度分析中,g1>0,分布为正偏态,g1<0,分布呈 负偏态,g1=0分布是对称的
在峰度分析中,峰度>0,比正态分布的峰度低阔,峰 度<0,比正态分布的峰度高狭,峰度=0,正态分布
四、正态分布理论在测验中的应用
(一)化等级评定为测量数据(如喜爱程度、能力 大小等) 前提条件——数据是否为正态分布
②每一个基本事件出现的可能性相等( 等可能性)
(3)举例:抛硬币,抽扑克
二、概率的基本性质
(一)概率的公理系统 1、任何一个随机事件A的概率都是非负的 2、在一定条件下必然发生的必然事件的概率为1 3、在一定条件下必然不发生的事件,即不可能事件
的概率为0
(0≤P(A)≤1)
(二)概率的加法定理
加法定理:指两个互不相容事件A、B之和的概率,等 于两个事件概率之和,写作P(A+B)=P(A)+P(B)
下面表格是三位学生获得的等级评定,请问谁的水平更高一些?
(二)测验分数的正态化 从理论上研究对象服从正态分布,但由于抽
样误差或测试题目难度等偶然因素,实测分数分 布不是正态分布,这时可采用一定的统计方法将 非正态的原始分数转化成正态分数
通俗的讲:没转化成Z分数前,以平均数为中心左右非常不对称, 转化成Z分数后,尽管还是不对称,但是两边差异已经大大减小 。 步骤(1)将次数分布表的各组中值转化成Z分数
举例:
1、我们队将可能赢得今晚的这场比赛。 2、今天下午下雨的机会有40%。 3、这个冬天的周末我很可能有个约会。 4、我有50比50的机会通过今年的英语四
级考试。
概率的分类
1、后验概率(empirical definition of Probability)
以随机事件A在大量重复试验中出现的稳定频率值作 为随机事件A的概率估计值,这样求得的概率称为 后验概率。
进行推论,从而确定推论正确或错误的概率。
一、正态分布及渐近正态分布
(一)样本平均数的分布
1、总体分布为正态, δ2已知,样本平均数 的分布为正 态分布
标准误,即样本均数的标准差,是描述均数抽样分布的 离散程度及衡量均数抽样误差大小的尺度,反映的是 样本均数之间的变异。
标准误用来衡量抽样误差。标准误越小,表明样本统计 量与总体参数的值越接近,样本对总体越有代表性, 用样本统计量推断总体参数的可靠度越大。
第六章 概率分布
第一节 概率的基本概念 第二节 正态分布 第三节 二项分布 第四节 样本分布
第一节 概率的基本概念
一、什么是概率 随机现象(或随机事件)——在心理学研究中,通过实
验、问卷调查所获得的数据,常因主试、被试、施测 条件等因素的随机变化而呈现出不确定性,即使是相 同的被试在相同的观测条件下,多次重复测量结果也 还是上下波动,我们一般都无法事先确定每一次测量 的结果。 概率(probability):随机事件出现可能性大小的客观 指标
2、计算概率时 ,每一个正态分布都需要有自己 的正态概率分布表,这种表格是无穷多的
3、若能将一般的正态分布转化为标准正态分布, 计算概率时只需要查一张表
(三)标准正态分布表的编制与使用
1、编制原则
从Z=0开始,逐渐变化Z分数,计算从Z=0至某一定值 之间的概率。因为正态分布是对称分布,且对称轴为 过μ=0,即Z=0点的纵线,故当Z<0时,其概率与Z>0 时的相对应的Z分数下的概率值相等。
分布的一种,是在数理统计的理论与实际应 用中占有最重要地位的一种理论分布
(二)正态分布曲线函数
y
1
e1 2
2
x
2
2
, x
(三)正态分布的特征
1、正态分布的形式是对称的(但对称的不一定是正态的) ,在正态分布中,均数、中数、众数合一,y值最大为 0.3989
2、正态分布的中央点最高,然后逐渐向两侧下降,曲线的 形式是先内后外。
① 求某Z分数值与平均数(Z=0)之间的概率。如求 Z=1到平均数之间的概率
② 求某Z分数以上或以下的概率,如求Z=1以上的概率 是多少
③ 求两个Z分数之间的概率,如果Z分数为同号则相减, 如果为异号则相加
(2)从概率(p)求Z分数
① 已知从平均数开始的概率值求Z值。如已知 平均数以上0.25的概率,求Z值
3、正态曲线下的面积为1,垂线将其划分为相等的两部分。 4、正态分布式一族分布,它随随机变量的平均数、标准
差的大小与单位不同而有不同的分布形态。
5、正态分布中各差异量数值相互间有固定比率。 6、在正态分布中,标准差与概率有一定的数量关系。
标准差相等、均数不等的正态分布图
均数相等、标准差不等的正态分布图
正态分布表一般包括3栏:第一栏是Z分数单位,一般 标为Z,在平均数这一点上Z=0,在平均数以上分数为 正值,在平均数以下分数为负值。第二栏为密度函数 或比率数值,即某一Z分数点上的曲线纵坐标的高度。 第三栏为概率值(p),即不同Z分数点与平均数之间 的面积与总面积之比
2、正态分布表的使用
(1)依据Z分数求概率(p)
在正态分布曲线下,标准差与概率有一定的关系 。在正态分布中,平均数上下各延伸一个标准差 ,包括总面积的68.26%,意即正态分布中,从1s到1s包括了68.26%的个案。
正负1.96个标准差之间,包括了总面积的95%。 正负2.58个标准差包含总面积的99%
34.13% 34.13%
13.59%
正态分布的实际应用
确定正态分布下的录取分数线
例:某区拟对参加数学竞赛的2000人中前500人予以奖 励,考试的平均分数为75,标准差为9,问授奖的分数 线是多少?
三、次数分布是否为正态分布的检验方法
(一)皮尔逊偏态量数法 正偏态中M>Md>Mo,负偏态中M<Md<Mo 在偏态分布中,平均数距中数较近,而离众数较远
负值,右侧t为正值,峰态比较高狭。 3、变量取值范围- ∞ —+ ∞ 4、当样本容量趋于∞,t分布为正态分布
,方差为1
(二)t分布表的应用 t值、自由度、显著性水平
要求:学会区别t值的单侧概率与双侧概率
(三)样本平均数的分布 1、总体分布正态,方差未知时,样本平均数的分为为t
分布
2、当总体分布为非正态而方差又未知时,若满足n >30 这一条件,样本平均数的分布近似为t分布
② 已知位于正态分布两端的概率值求该概率值 分界点的Z值。如求上端0.01概率分界点的 Z值
③ 若已知正态曲线下中央部分的概率,求Z分 数是多少。如求正态曲线中间部分0.95概率 两处分界点的Z值
(3)已知概率或Z值,求概率密度函数
正态分布的实际应用
确定正态分布下特定分数界限内人数
例:某区3600个学生数学测验分数接近正态分布,其平 均分为80分,标准差为11.5分,问在70~90分之间应当有 多少人?
【例】设有1000中产品,其中 850件是正品,150件是次品, 从中依次抽取2件,两件都是次 品的概率是多少?
P( A1 A2 ) P( A1 )P( A2 | A1 ) 150 149 0.0224 1000 999
第二节正态分布
一、正态分布及其特征 (一)定义 正态分布又叫常态分布,是连续随机变量概率
第三节 二项分布(贝努里分布)
二项分布(binomi distribution)——用于离散型随机变量 的概率分布
投掷一枚相同的硬币5次,每次正面向上的概率为 0.5
某同学玩射击气球游戏,每次射击击破气球的概 率为0.7,现有气球10个
某篮球队员罚球命中率为0.8,罚球6次
比较上面案例,找到其相似点
2、总体分布非正态,但δ2已知,这时样本足够大时(n > 30),其样本平均数的分布为渐近正态分布
样本n越大,接近布 从正态分布的总体中抽取容量为n的样本,当n足够大时
( n > 30 ),样本方差及标准差的分布渐趋正态分 布。
二、 t分布 (一)特点
1、平均数为0 2、以平均值0左右对称的分布,左侧t为
互不相容事件:在一次实验或调查中,若事件A发生则 事件B就不一定发生,否则二者为相容事件
互不相容事件特点:无论互不相容事件有多少,其总 和的概率永远不会大于1
例如:对学生进行考核成绩评定(优,良,中,差)
小概率事件
P <0.05 P <0.01
例题
① 某学生从5个试题中任意抽选一题,如果抽到 每一题的概率为1/5,则抽到试题1或试题2的概 率为多少?
四 、F分布 (一)特点
1、正偏态 2、总为正值 3、当分子的自由度为1,分母的自由度为任意值时,F值
与分母自由度相同概率的t值的平方相等。
(二)二项分布
二项分布——试验仅有两种不同性质结果的概 率分布,两个观测值是对立的。例如:考试的 及格与不及格,产品试验中的成功与失败
(三)二项分布的应用 【例题6-6】
例题:今有四选一选择测验100题,问答 对多少题才能说是真的回答而不是猜测?
第四节 样本分布
样本分布是通过一个样本进行分析,依据样本对总体
一、二项试验与二项分布 (一)符合下述条件的试验叫二项试验
●1、包含了n个相同的试验,n是预先给定的任一整数
●2、每次试验相互独立
●3、每次试验只有两种可能的结果:“成功”或“失败”
●4、每次出现的概率p在任何一次实验中都是固定的
●5、试验“成功”或“失败”可以计数,即试验结果对 应于一个离散型随机变量
13.59%
.13% 2.15%
.13% 2.15%
原始分 标准差
70 80 -3 -2
90 100 110 120 130 (平均数)
-1 0 1 2 3
正态曲线下人数的分布情况
二、标准正态分布 (一)概念
Z X
一般正态分布
x
标准正态分布
1
Z
20
(二)标准正态分布的重要性
1、一般的正态分布取决于均值和标准差
(2)将Z分数转化成T分数 T=10Z+50
(三)确定题目难易度
作用:比较不同难易度题目之间的难度相差多少
原理:假设一个测验中不同难易题目的分布是正态 的,即一个测验中通过率较大和较小的题目很少, 而通过率居中的题目较多
(四)在能力分组或等级评定时确定人数
假定能力是正态分布,这时若将能力分组,各 组人数应是多少? 评定不同等级,各等级人数应是多少才能使分 组或评定等级构成等距的尺度?
② 某大学有50%的学生喜欢看足球比赛,40%的 喜欢看篮球比赛,30%两者都喜欢。问,从该 校任意抽取一名学生,他爱看足球比赛或篮球 比赛的概率是多少?
(三)概率的乘法定理 乘法定理:两个独立事件同时出现的概率等
于该两个事件概率的乘积
独立事件:一个事件的出现对另一个事件的 出现不发生影响
例如:有放回的抽取扑克牌
特点: ①当观测次数无限增大时,计算出的概率估 计值越趋近真实的概率值
②当进行多次观测时,按观测结果计算的概 率基本接近先验概率 (3)举例:一年中下雨天
2、先验概率(classical definition of Probability) (1)定义:随机事件的概率按古典概率模型推算而
得
(2)条件:①实验的每一种可能结果是有限的(结 果类别有多少种确定)
(二)峰度、偏度检验法(N≥200)(SPSS操作) 在偏度分析中,g1>0,分布为正偏态,g1<0,分布呈 负偏态,g1=0分布是对称的
在峰度分析中,峰度>0,比正态分布的峰度低阔,峰 度<0,比正态分布的峰度高狭,峰度=0,正态分布
四、正态分布理论在测验中的应用
(一)化等级评定为测量数据(如喜爱程度、能力 大小等) 前提条件——数据是否为正态分布
②每一个基本事件出现的可能性相等( 等可能性)
(3)举例:抛硬币,抽扑克
二、概率的基本性质
(一)概率的公理系统 1、任何一个随机事件A的概率都是非负的 2、在一定条件下必然发生的必然事件的概率为1 3、在一定条件下必然不发生的事件,即不可能事件
的概率为0
(0≤P(A)≤1)
(二)概率的加法定理
加法定理:指两个互不相容事件A、B之和的概率,等 于两个事件概率之和,写作P(A+B)=P(A)+P(B)
下面表格是三位学生获得的等级评定,请问谁的水平更高一些?
(二)测验分数的正态化 从理论上研究对象服从正态分布,但由于抽
样误差或测试题目难度等偶然因素,实测分数分 布不是正态分布,这时可采用一定的统计方法将 非正态的原始分数转化成正态分数
通俗的讲:没转化成Z分数前,以平均数为中心左右非常不对称, 转化成Z分数后,尽管还是不对称,但是两边差异已经大大减小 。 步骤(1)将次数分布表的各组中值转化成Z分数