第六章 概率分布
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第六章 概率分布
李金德
第一节 第二节 第三节 第四节
概率的基本概念 正态分布 二项分布 样本分布
第一节 概率的基本概念
一、什么是概率
试验、事件:在相同条件下,对某事物或现象所 进行的观察或实验叫试验,把观察或实验的结果 叫做事件。
试验 抛掷一枚硬币 对某一零件进行检验 试验结果(事件) 正面,反面 合格,不合格
行比较
(三)在能力分组或等级评定时确定人 数
适用问题:总共有n个被试,要将他们按某指标 (能力)分成K个组,问每个组应各分多少个, 才能使不同组在能力上的差异等距。 计算方法:假设6个标准差(99.73%)覆盖了全
二、标准正态分布
所有正态分布都可以通过Z分数公式转换成标准 正态分布。 标准正态分布是标准差()为1,平均数( )
为0的正态分布,其函数为:
Y 1 e 2
z2 2
标准正态分布的特征:
曲线以z=0为中心,双侧对称。 曲线在z=0处为最高点。
Y 当z=0时, 1 2 e 0=0.39894,这是y的最大值。
p2 0.5000 0.3849 0.1151
2.已知p值求Z值.
1)查表法——求近似的值
例如,求p=0.30时,Z的面积。
正态曲线表中并无p=0.30的Z面积,只有与其接近的两个 p 值, 1 0.29955 p2 0.30234 , 前者与0.30相差0.00045,后者与0.30相差0.00234。可见, 0.29955与0.30更接近,其对应的值0.84,即为p=0.30时Z
概率密度函数演示
(二)经验分布与理论分布
1、经验分布
定义:经验分布是根据观察或实验所获得的数据
而编制的次数分布或相对频率分布。
特点:反映的是一个样本的概率分布。
2、理论分布 定义:理论分布是指根据理论推演出来的随机变 量的概率分布模型。 特点:反映的是总体的概率分布。
(三)基本随机变量分布与抽样分布
四、正态分布理论在测验中的应用
(一)化等级评定为连续数据
(二)确定测验题目的难易程度 (三)在能力分组或等级评定时确定人数 (四)T分数或次数分布的正态化
(一)化等级评定为连续数据
1、处理等级评价时面临的问题及其解决思路
问题:
①不同评价者由于各自的标准不同,在对同一个心理
量进行评定时可能给出不同的等级分数,如何综合
P(A+B+C+D)= P(A) +P(B) +P(C)+ P(D) = 1111 1
8 8 8 8 2
答:一枚硬币掷三次,或三枚硬币各掷一次,出现 两次或两次以上H的概率是1/2。
三、概率分布
概率分布是用来描述随机变量取某些值时的概率的 数学模型。 性质:将100%的可能性在各随机事件上进行分配 表示方式:统计图表、公式 概率分布的分类:
解:这样掷硬币可能出现地情况有:HHH、HHT、HTH、THH、 TTH、THT、HTT、TTT共八种。 每种结果可能出现的概率,依概率乘法规则计算: 各为1/8。
1 1 1 1 2 2 2 8
设:P(A)—“HHH”,P(B)—“HHT”,P(C)—
“HTH”,P(D)—“THH”,故:
评价各评价者的结果。
②如何比较不同被评者的心理量的差异。
2、转化的前提条件
被评定的心理量是测量数据;
服从正态分布(凭常识),只是人为地在评定时
划分为等级。
3、转化方法——用各等级中点对应的Z分数 代表该等级分数
①根据各等级被评者的数目求出各等级的人数比率。 ②求各等级中点以下的累加比率。
③用累加比率查正态表求Z分数,用Z分数代表各等 级的测量值。 ④求各被评者所得评价等级的测量分数的算术平均 数,即为综合评定分数。
为随机变量X的均值; 为随机变量X的标准差; 为圆周率3.14159…; e为自然对数的底2.71828….
正态分布的概率密度曲线
在正态分布中:
平均数决定着曲线在轴上的位置;
标准差决定着曲线的形状。
当标准差相同而平均数不同时,曲线形状相同,位
置各异。
当平均数相同而标准差不同时,正态曲线有不同的
曲线以最高点向左右两侧缓慢下降,且无限延伸, 但永远不与基线相交。
标准正态曲线只有一条。
三、正态分布表的编制与使用
标准正态分布函数的数值表;将一般正态分布 化为标准正态分布,通过查表可解决正态分布的 概率计算问题。
(一)正态分布曲线的面积,高度与标准分数
在正态分布中,总次数N 的几何意义是曲线与轴间 所包含的总面积,用 p 表示,且 p 1 。以曲线 中线为界,每边为分布 50%的面积。垂线为曲线 的纵线高度,以 y 表示。 基线是Z分数。 本教材上的标准正态概率 表的编制方法是从 Z=0 开始,逐渐变化Z值,计 算从 Z=0 至某一定值之 间的概率。
乙教师和丙教师的评定等级转换过程 以此类推
3)确定查表的p值
p p 值直接查正态曲线表,确定Z值。 Z值的正 4)由
负号以中点以下累积比例决定,若 Fp >0.5, Z 值为正;若 Fp <0.5,Z值为负。 5)学生学习能力的比较。用Z值比较三名学生社交 能力的高低,需根据各位教师评定等级的Z值及 教师人数(k)求其平均数,即 Z Z k ,结 果见表6-3。
(二)标准正态分布曲线相应内容的求解方 法 1、已知Z值,求面积值p
1)求均数(Z=0)与某个Z值之间p的值,可直接 查正态曲线表。
例如:求至Z=0~ Z=-1之间的面积。 查表可知Z =1时,p=0.3413; 因为正态分布为具有对称性, 所以有Z=-1时,p=0.3413 。
2)求任何两个Z值之间的p
,即 p Fp 0.5 。
表6-3 三位学生获得的等级评定结果
(二)确定测验题目的难易程度
1、计算各题目的通过率p
2、用0.5减去通过率p得到 p' ,根据 p'查正态表求
Z值
通过率大于50%,Z值计为负值,通过率小于50%,Z
值为正
3、将Z值加上5,便得到0~10分的难度分数值,进
投掷一颗骰子
进行一场足球比赛
1,2,3,4,5,6
获胜,失利,平局
基本事件:如果某一随机实验可以分成有限的n种 可能结果,这n种结果之间是互不交叉的,而且
这些结果出现的可能性相等,我们把这n种可能
结果称为基本事件。 概率(Probability):事件在试验中出现的可能 性大小。事件A的概率用P(A)表示。
例如:求Z=1~Z=2之间的面积。
首先,查出Z=0至每个Z 值间的面积, 即有Z=1, p=0.3413; Z=2 ,p=0.475
其次,求两个Z值之间的面积,
即有p(1<z<2)=0.475-0.3413=0.1337
规律:Z值符号相反,用加法求 p; Z值符号相同,用减法求 p。
3)求某个 Z 值以下或以上的面积
例如:求 Z 0.85 以下和 Z 1.76 以上的面积。
首先,查出 Z 0 至每个 Z 值间的面积,
即有 Z 0.85 , 0.3023 Z 1.76 ,p 0.4608 , p
其次,用正态分布一半的面积(0.50)减去所查出的面积, 即有:
p1 0.5000 0.4918 0.0082
比如说对于一个容量为50的有限总体,其容量为 5的不同样本一共有: 505 = 312,500,000个(允许重复的合),这里的 每一个样本可以计算一个平均数。 故一共有312,500,000个平均数,这些平均数的 分布情况(或分布规律)就是从容量为50的有限
总体中抽取容量为5的样本平均数的抽样分布。
③用图形来表示:
2、连续分布
定义:如果随机变量可以取连续的数值,则这种 随机变量取值的概率规律称为连续分布。连续分 布的表示方法一般采用概率密度函数来表示。 概率密度函数:当样本的容量及分组逐渐增加时, 次数分布图将趋近于一条稳定而连续的曲线。一 般记为f(x)。 特点:通常用概率密度函数描述随机变量在一段 区间上取值的P。
第二节 正态分布
一、正态分布
(一)正态分布定义
正态分布也称常态分布,是连续随机变量概率 分布的一种,中间量数次数分布多,两端量数次 数分布少,呈对称型的概率分布。
正态分布的概率密度函数:
x 2 1 2 f ( x) e 2 2 x 1
则称X服从正态分布,记作X~N(,2)
1、基本随机变量分布
基本随机变量是一个与随机变量的函数相对应 的。随机变量的函数仍然是随机变量。
2、抽样分布 抽样分布是样本统计量的理论分布,又称随机变 量函数的分布。 抽样是从总体中随机地选取一个样本的过程,每 一个样本都可以计算平均数、方差、标准差、相 关系数等指标,这些指标的概率分布就是抽样分 布。
的近似值。
2)内插法——求精确的值,其公式为
3.已知p值求y值
查表法——求近似的y值
例如,求当p=0.30的y值。
查表得,与0.30接近的p值为0.29955,其值为0.28034,
所以y值为0.28034。
练习
1、求P(0<z<2.53)=? P(z>-1.14)=? P(-1.28<z<1.83)=? P(-2.54<z<-.42)=? X~N(100, 152), 求P(x < 115)=?
离散分布与连续分布
ຫໍສະໝຸດ Baidu
经验分布与理论分布
基本随机变量分布与抽样分布
(一)离散分布与连续分布
1、离散分布 定义:如果随机变量只能取有限的或无限但可以 数下去的数值,则这种随机变量的概率分布称为
离散分布。
特点:通常用概率分布描述其取值和相应取值的
P
例1:抛置硬币这一随机试验可以用如下一些方式 来表示其分布规律: ①记A={正面向上},B={反面向上}, 则P(A)=0.5,P(B)=0.5。 ②令出现正面向上用1表示,反面向上用0表示, 则P(ξ =1)=0.5,P(ξ =0)=0.5
2 、 X~N(5,102) 求概率
(1) P(5<X<6.2)
(2) P(3.8<X<5)
(3) P(2.9<X<7.1)
(4) P(X>8) (5) P(7.1<X<8)
(三)正态分布中的几个常用值
在 1 , 2 , 3 及其 1.96 , 2.58 范围 内的面积值。(p163) ± 1s:68.26% ± 2s:95.44% ± 3s:99.73% ±1.96s:95% ±2.58s:99%
概率的计算方法: (一)古典概率(先验概率) (二)统计概率(后验概率)
(一)古典概率(先验概率) 在只含有有限个基本事件的试验中,任意事件A 发生的概率定义为:
(二)统计概率(后验概率)
在相同条件下进行n次试验,事件A出现了m次, 如果试验次数n充分大,且事件A出现的频率稳定 在某一数值p附近,则称p为事件A的概率。由于p 也是一抽象的值,常常用n在充分大时的代替。即:
A: p 0.05 2 0.95 0.975 F
B:Fp 0.25 2 0.70 0.825 C:Fp 0.40 2 0.30 0.50 F D: p 0.25 2 0.05 0.175
F E: p .05 2 0 0.025
形状,越大,曲线越是“低阔”,越小曲线越是
“高窄”,
不同均值(μ)的正态分布
不同标准差(σ)的正态分布
(二)正态分布的特征
1、正态分布的形式是对称的,对称轴是经过平均 数的垂线; 2、正态分布的中央点最高,然后逐渐向两侧下降, 曲线先向内弯,后向外弯,两端靠近基线处无限 延伸; 3、正态曲线下的面积为1,故对称轴将正态曲线下 的面积划分为相等的两部分; 4、正态分布是一族分布。
例6-2:甲、乙、丙三位教师对100名学生
的学习能力进行等级评定见表6-2。表6-3
是三名同学所获得的评定等级。
试比较三个学生学习能力的高低。
表6-2 3位教师对100名学生学习能力的评定
1)求各等级人数分布的比例值见上表。
2)求比例中点以下的累积比例,即将每一等级值除以2再加上其以下的所 有面积。
二、概率的基本性质
1、概率的加法定理
两个互不相容事件A、B之和的概率,等于两个事
件概率 之和, P(A+B)=P(A)+P(B) 2、概率的乘法定理 两个独立事件同时出现的概率等于该两事件概率 的乘积, P(AB)=P(A)×P(B)
例3-1:一枚硬币掷三次,或三枚硬币各掷一次, 问出现两次或两次以上H的概率是多少?
李金德
第一节 第二节 第三节 第四节
概率的基本概念 正态分布 二项分布 样本分布
第一节 概率的基本概念
一、什么是概率
试验、事件:在相同条件下,对某事物或现象所 进行的观察或实验叫试验,把观察或实验的结果 叫做事件。
试验 抛掷一枚硬币 对某一零件进行检验 试验结果(事件) 正面,反面 合格,不合格
行比较
(三)在能力分组或等级评定时确定人 数
适用问题:总共有n个被试,要将他们按某指标 (能力)分成K个组,问每个组应各分多少个, 才能使不同组在能力上的差异等距。 计算方法:假设6个标准差(99.73%)覆盖了全
二、标准正态分布
所有正态分布都可以通过Z分数公式转换成标准 正态分布。 标准正态分布是标准差()为1,平均数( )
为0的正态分布,其函数为:
Y 1 e 2
z2 2
标准正态分布的特征:
曲线以z=0为中心,双侧对称。 曲线在z=0处为最高点。
Y 当z=0时, 1 2 e 0=0.39894,这是y的最大值。
p2 0.5000 0.3849 0.1151
2.已知p值求Z值.
1)查表法——求近似的值
例如,求p=0.30时,Z的面积。
正态曲线表中并无p=0.30的Z面积,只有与其接近的两个 p 值, 1 0.29955 p2 0.30234 , 前者与0.30相差0.00045,后者与0.30相差0.00234。可见, 0.29955与0.30更接近,其对应的值0.84,即为p=0.30时Z
概率密度函数演示
(二)经验分布与理论分布
1、经验分布
定义:经验分布是根据观察或实验所获得的数据
而编制的次数分布或相对频率分布。
特点:反映的是一个样本的概率分布。
2、理论分布 定义:理论分布是指根据理论推演出来的随机变 量的概率分布模型。 特点:反映的是总体的概率分布。
(三)基本随机变量分布与抽样分布
四、正态分布理论在测验中的应用
(一)化等级评定为连续数据
(二)确定测验题目的难易程度 (三)在能力分组或等级评定时确定人数 (四)T分数或次数分布的正态化
(一)化等级评定为连续数据
1、处理等级评价时面临的问题及其解决思路
问题:
①不同评价者由于各自的标准不同,在对同一个心理
量进行评定时可能给出不同的等级分数,如何综合
P(A+B+C+D)= P(A) +P(B) +P(C)+ P(D) = 1111 1
8 8 8 8 2
答:一枚硬币掷三次,或三枚硬币各掷一次,出现 两次或两次以上H的概率是1/2。
三、概率分布
概率分布是用来描述随机变量取某些值时的概率的 数学模型。 性质:将100%的可能性在各随机事件上进行分配 表示方式:统计图表、公式 概率分布的分类:
解:这样掷硬币可能出现地情况有:HHH、HHT、HTH、THH、 TTH、THT、HTT、TTT共八种。 每种结果可能出现的概率,依概率乘法规则计算: 各为1/8。
1 1 1 1 2 2 2 8
设:P(A)—“HHH”,P(B)—“HHT”,P(C)—
“HTH”,P(D)—“THH”,故:
评价各评价者的结果。
②如何比较不同被评者的心理量的差异。
2、转化的前提条件
被评定的心理量是测量数据;
服从正态分布(凭常识),只是人为地在评定时
划分为等级。
3、转化方法——用各等级中点对应的Z分数 代表该等级分数
①根据各等级被评者的数目求出各等级的人数比率。 ②求各等级中点以下的累加比率。
③用累加比率查正态表求Z分数,用Z分数代表各等 级的测量值。 ④求各被评者所得评价等级的测量分数的算术平均 数,即为综合评定分数。
为随机变量X的均值; 为随机变量X的标准差; 为圆周率3.14159…; e为自然对数的底2.71828….
正态分布的概率密度曲线
在正态分布中:
平均数决定着曲线在轴上的位置;
标准差决定着曲线的形状。
当标准差相同而平均数不同时,曲线形状相同,位
置各异。
当平均数相同而标准差不同时,正态曲线有不同的
曲线以最高点向左右两侧缓慢下降,且无限延伸, 但永远不与基线相交。
标准正态曲线只有一条。
三、正态分布表的编制与使用
标准正态分布函数的数值表;将一般正态分布 化为标准正态分布,通过查表可解决正态分布的 概率计算问题。
(一)正态分布曲线的面积,高度与标准分数
在正态分布中,总次数N 的几何意义是曲线与轴间 所包含的总面积,用 p 表示,且 p 1 。以曲线 中线为界,每边为分布 50%的面积。垂线为曲线 的纵线高度,以 y 表示。 基线是Z分数。 本教材上的标准正态概率 表的编制方法是从 Z=0 开始,逐渐变化Z值,计 算从 Z=0 至某一定值之 间的概率。
乙教师和丙教师的评定等级转换过程 以此类推
3)确定查表的p值
p p 值直接查正态曲线表,确定Z值。 Z值的正 4)由
负号以中点以下累积比例决定,若 Fp >0.5, Z 值为正;若 Fp <0.5,Z值为负。 5)学生学习能力的比较。用Z值比较三名学生社交 能力的高低,需根据各位教师评定等级的Z值及 教师人数(k)求其平均数,即 Z Z k ,结 果见表6-3。
(二)标准正态分布曲线相应内容的求解方 法 1、已知Z值,求面积值p
1)求均数(Z=0)与某个Z值之间p的值,可直接 查正态曲线表。
例如:求至Z=0~ Z=-1之间的面积。 查表可知Z =1时,p=0.3413; 因为正态分布为具有对称性, 所以有Z=-1时,p=0.3413 。
2)求任何两个Z值之间的p
,即 p Fp 0.5 。
表6-3 三位学生获得的等级评定结果
(二)确定测验题目的难易程度
1、计算各题目的通过率p
2、用0.5减去通过率p得到 p' ,根据 p'查正态表求
Z值
通过率大于50%,Z值计为负值,通过率小于50%,Z
值为正
3、将Z值加上5,便得到0~10分的难度分数值,进
投掷一颗骰子
进行一场足球比赛
1,2,3,4,5,6
获胜,失利,平局
基本事件:如果某一随机实验可以分成有限的n种 可能结果,这n种结果之间是互不交叉的,而且
这些结果出现的可能性相等,我们把这n种可能
结果称为基本事件。 概率(Probability):事件在试验中出现的可能 性大小。事件A的概率用P(A)表示。
例如:求Z=1~Z=2之间的面积。
首先,查出Z=0至每个Z 值间的面积, 即有Z=1, p=0.3413; Z=2 ,p=0.475
其次,求两个Z值之间的面积,
即有p(1<z<2)=0.475-0.3413=0.1337
规律:Z值符号相反,用加法求 p; Z值符号相同,用减法求 p。
3)求某个 Z 值以下或以上的面积
例如:求 Z 0.85 以下和 Z 1.76 以上的面积。
首先,查出 Z 0 至每个 Z 值间的面积,
即有 Z 0.85 , 0.3023 Z 1.76 ,p 0.4608 , p
其次,用正态分布一半的面积(0.50)减去所查出的面积, 即有:
p1 0.5000 0.4918 0.0082
比如说对于一个容量为50的有限总体,其容量为 5的不同样本一共有: 505 = 312,500,000个(允许重复的合),这里的 每一个样本可以计算一个平均数。 故一共有312,500,000个平均数,这些平均数的 分布情况(或分布规律)就是从容量为50的有限
总体中抽取容量为5的样本平均数的抽样分布。
③用图形来表示:
2、连续分布
定义:如果随机变量可以取连续的数值,则这种 随机变量取值的概率规律称为连续分布。连续分 布的表示方法一般采用概率密度函数来表示。 概率密度函数:当样本的容量及分组逐渐增加时, 次数分布图将趋近于一条稳定而连续的曲线。一 般记为f(x)。 特点:通常用概率密度函数描述随机变量在一段 区间上取值的P。
第二节 正态分布
一、正态分布
(一)正态分布定义
正态分布也称常态分布,是连续随机变量概率 分布的一种,中间量数次数分布多,两端量数次 数分布少,呈对称型的概率分布。
正态分布的概率密度函数:
x 2 1 2 f ( x) e 2 2 x 1
则称X服从正态分布,记作X~N(,2)
1、基本随机变量分布
基本随机变量是一个与随机变量的函数相对应 的。随机变量的函数仍然是随机变量。
2、抽样分布 抽样分布是样本统计量的理论分布,又称随机变 量函数的分布。 抽样是从总体中随机地选取一个样本的过程,每 一个样本都可以计算平均数、方差、标准差、相 关系数等指标,这些指标的概率分布就是抽样分 布。
的近似值。
2)内插法——求精确的值,其公式为
3.已知p值求y值
查表法——求近似的y值
例如,求当p=0.30的y值。
查表得,与0.30接近的p值为0.29955,其值为0.28034,
所以y值为0.28034。
练习
1、求P(0<z<2.53)=? P(z>-1.14)=? P(-1.28<z<1.83)=? P(-2.54<z<-.42)=? X~N(100, 152), 求P(x < 115)=?
离散分布与连续分布
ຫໍສະໝຸດ Baidu
经验分布与理论分布
基本随机变量分布与抽样分布
(一)离散分布与连续分布
1、离散分布 定义:如果随机变量只能取有限的或无限但可以 数下去的数值,则这种随机变量的概率分布称为
离散分布。
特点:通常用概率分布描述其取值和相应取值的
P
例1:抛置硬币这一随机试验可以用如下一些方式 来表示其分布规律: ①记A={正面向上},B={反面向上}, 则P(A)=0.5,P(B)=0.5。 ②令出现正面向上用1表示,反面向上用0表示, 则P(ξ =1)=0.5,P(ξ =0)=0.5
2 、 X~N(5,102) 求概率
(1) P(5<X<6.2)
(2) P(3.8<X<5)
(3) P(2.9<X<7.1)
(4) P(X>8) (5) P(7.1<X<8)
(三)正态分布中的几个常用值
在 1 , 2 , 3 及其 1.96 , 2.58 范围 内的面积值。(p163) ± 1s:68.26% ± 2s:95.44% ± 3s:99.73% ±1.96s:95% ±2.58s:99%
概率的计算方法: (一)古典概率(先验概率) (二)统计概率(后验概率)
(一)古典概率(先验概率) 在只含有有限个基本事件的试验中,任意事件A 发生的概率定义为:
(二)统计概率(后验概率)
在相同条件下进行n次试验,事件A出现了m次, 如果试验次数n充分大,且事件A出现的频率稳定 在某一数值p附近,则称p为事件A的概率。由于p 也是一抽象的值,常常用n在充分大时的代替。即:
A: p 0.05 2 0.95 0.975 F
B:Fp 0.25 2 0.70 0.825 C:Fp 0.40 2 0.30 0.50 F D: p 0.25 2 0.05 0.175
F E: p .05 2 0 0.025
形状,越大,曲线越是“低阔”,越小曲线越是
“高窄”,
不同均值(μ)的正态分布
不同标准差(σ)的正态分布
(二)正态分布的特征
1、正态分布的形式是对称的,对称轴是经过平均 数的垂线; 2、正态分布的中央点最高,然后逐渐向两侧下降, 曲线先向内弯,后向外弯,两端靠近基线处无限 延伸; 3、正态曲线下的面积为1,故对称轴将正态曲线下 的面积划分为相等的两部分; 4、正态分布是一族分布。
例6-2:甲、乙、丙三位教师对100名学生
的学习能力进行等级评定见表6-2。表6-3
是三名同学所获得的评定等级。
试比较三个学生学习能力的高低。
表6-2 3位教师对100名学生学习能力的评定
1)求各等级人数分布的比例值见上表。
2)求比例中点以下的累积比例,即将每一等级值除以2再加上其以下的所 有面积。
二、概率的基本性质
1、概率的加法定理
两个互不相容事件A、B之和的概率,等于两个事
件概率 之和, P(A+B)=P(A)+P(B) 2、概率的乘法定理 两个独立事件同时出现的概率等于该两事件概率 的乘积, P(AB)=P(A)×P(B)
例3-1:一枚硬币掷三次,或三枚硬币各掷一次, 问出现两次或两次以上H的概率是多少?