03第五章_概论及概论分布
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
用于比较几个分属性质不同的观测值在各
自数据分布中相对位置的高低。
计算不同质的观测值的总和或平均值,以
表示在团体中的相对位置。
当研究需要合成不同质的数据时,如果已知这 些不同质的观测值的次数分布为正态,这时可采用 Z分数来计算不同质的观测值的总和或平均值。
表示标准测验分数
经过标准化的心理和教育测验,常常
种数学模型计算出的概率分布。
3、基本随机变量分布与抽样分布
依所描述的数据的样本特性,可将概率分
布分为基本随机变量分布与抽样分布 (sampling distribution)。
基本随机变量分布是随机变量各种不同取
值情况的概率分布,抽样分布是从同一总体 内抽取的不同样本的统计量的概率分布。
二、二项分布
抽到第一题或第二题的概率应为抽到第一题的概率和抽到第二题的概率之和即四个学生都抽到第一题即四个学生同时抽到第一题其概率应为抽到第一题的概率的乘积即20个黑球共50个球中随机抽取两次放回抽样问抽出一个黑球和一个白球的概率是多少
第五章
概率及概论分布
一、概率的一般概念
1.概论的定义
后验概率(或统计概率)
率之和,即
0 0 6 1 5 2 2 4 P P P C p q C p q C p q ( 0) 1 2 6 6 6
3 2 3 2 6 15 5 5 5 5
6
m n
(5.2)
2.概率的公理系统
(1)任何随机事件A的概率都是在0与1之间 的正数,即 0 ≤ P(A)≤1 (2)不可能事件的概率等于零,即 P(A)= 0 (3)必然事件的概率等于1,即 P (A )= 1
三.概率的加法定理和乘法定理
概率的加法定理
若事件A发生,则事件B就一定不发生, 两互不相容事件和的概率,等于这两个
5 3
4
4
P ( 5)
8! 1 2 5 5 3 C8 p q 0.0617 5! 3! 3 3
P(0) 0.0406
P(0) P(1) 0.2022
P ( 0) P (1) P ( 2) 0.4838
P(0) P(1) P( 2) P(3) P ( 4) 0.9188
常用的离散型分布是二项分布,最
常用的连续型分布是正态分布。
2、经验分布与理论分布
依分布函数的来源,可将概率分布分为经验
分布与理论分布。
经验分布(empirical distribution)是指根据
观察或实验所获得的数据而编制的次数分布或相 对频率分布。
理论分布(theoretical distribution)是按某
X n X
n X
2 0 0 8 8 P(0) C8 p q q 0.0406 3 7 8 ! 1 2 1 P(1) C8 p1 q 7 0.1616 7! 3 3
P( 2) C82 p 2 q 6 8! 1 2 0.2816 2!6! 3 3
W( A) 随机事件的频率 当n无限增大时,随机事件A的频率会稳定在
m P A Lim n n
m n
一个常数P,这个常数就是随机事件A的概率。
(5.1)
先验概率(古典概率)
古典概率模型要求满足两个条件:
⑴
⑵
试验的所有可能结果是有限的;
每一种可能结果出现的可能性相等。
P( A )
试题1的概率是多少?
计 算
抽到第一题或第二题的概率应为抽到第一题
的概率和抽到第二题的概率之和,即
1 1 2 P A B P A P B 5 5 5
四个学生都抽到第一题即四个学生同时抽到第
一题,其概率应为抽到第一题的概率的乘积,即
1 1 1 1 1 P A1 A2 A3 A4 5 5 5 5 625
2.正态分布
正态分布(normal distribution)也称
与p<q时的偏斜方向相反。
4.二项分布的平均数和标准差
如果二项分布满足p>q且 nq≥5(或者p<q
且 np≥5时,二项分布接近于正态分布。可用下
面的方法计算二项分布的平均数和标准差。
二项分布的平均数为
np
(6.8) (6.9)
二项分布的标准差为
npq
5.二项分布的应用
二项分布函数除了用
二项分布(bionimal
distribution)是一种具有广泛 用途的离散型随机变量的概率 分布,它是由贝努里创始的,
因此又称为贝努里分布。
1.二项试验
满足以下条件的试验称为二项试验:
一次试验只有两种可能的结果,即成功
各次试验相互独立,即各次试验之间互 各次试验中成功的概率相等,失败的概
两个互相独立事件积的概率,等于这两个
事件概率的乘积,即
P( AB) P A PB
(9.5) (9.6)
P( A1 A2 An ) P A1 P A2 P An
例1:某一学生从5个试题中任意抽取
一题,进行口试。如果抽到每一题的概率 为1/5,则抽到试题1或试题2的概率是 多少? 如果前一个学生把抽过的试题还回 后,后一个学生再抽,则4个学生都抽到
用标准分数表示测验结果。如果其常模分 数分布接近正态分布,为了克服标准分数 出现的小数、负数和不易为人们所接受等 缺点,常常是将其转换成正态标准分数。 转换公式为:
Z aZ b
(7.2)
例如:早期智力测验中运用智力商数表 示智力测查的指标
MA(智力年龄) IQ 100 CA(实际年龄)
3 5
8
2
6
8! 1 2 3 P(3) C8 p3 q5 0.2800 3!5! 3 3
4 4 4 P ( 4 ) C8 p q
8! 1 2 0.1550 4!4! 3 3
(3)标准分数的优点
可比性:标准分数以团体的平均数为基准,以标
准差为单位,因而具有可比性。
可加性:标准分数使不同的原始分数具有相同的
参照点,因而具有可加性。
明确性:标准分数较原始分数的意义更为明确。
合理性:标准分数保证了不同性质的分数在总分
数中的权重相同,使分数更合理地反映事实。
(4)标准分数的应用
表6-1 一个学生做10个正误题做对不同题数的概率分布 做对题目数 0 1 2 3 4 5 6 7 8 9 10 总和 出现方式数 1 10 45 120 210 252 210 120 45 10 1 1024 概率P(X) 0.001 0.010 0.044 0.117 0.205 0.246 0.205 0.117 0.044 0.010 0.001 1.000 累积概率 0.001 0.011 0.055 0.172 0.377 0.623 0.828 0.945 0.989 0.999 1.000
解:将n=6,p=2/5,q=3/5,X=4代入 (6.7)式,则恰好抽到4个男生的概率为
6! 2 3 P( 4) C p q 0.1382 4!2! 5 5
4 6 4 2
4
2
最多抽到2个男生的概率,等于1个也
没有抽到、抽到1个和抽到两个男生的概
这种表示智力的方法后来被离差智商取代:
X X Z S
IQ 15Z 100
异常值的取舍
在一个正态分布中,平均数上下一定的
标准差处,包含有确定百分数的数据个数。 ±1σ P=68.26%
±2σ P=95.45%
±3σ P=99.73%
可以看到,在平均数上
下各三个标准差的范围内, 分布着全部数据的99.73%, 反言之,在三个标准差之外 的数据不足0.27%,因此常把 “三个标准差”做为判断可 疑值取舍的依据。
P ( 0) P (1) P ( 2) P (3) P ( 4) P (5) 0.9805
练习与思考
观察我们的生活,看看哪些现象是服
从二项分布规律的?
三、正态分布
1.标准分数
标准分数(standard score),又称为
基分数或Z分数(Z-score),是以标准差
n! X n X p q X !n X !
(6.7)
二项展开式的要点:
项数:二项展开式中共有n+1项。 方次:p的方次,从n→0为降幂;q的方次
从0→n为升幂。每项p与q方次之和等于n。
系数:各项系数是成功事件次数的组合数。
例3:从男生占2/5的学校中随机抽取6 个学生,问正好抽到4个男生的概率是多 少?最多抽到2个男生的概率是多少?
来求成功事件恰好出现X次 的概率之外,在教育中主
要用来判断试验结果的机
遇性与真实性的界限。
例如,一个学生凭猜测做10个是非题,
平均可以猜对5题。什么情况下可以说他是 真会而不是猜测呢?
这种问题需要用累积概率来算。当做对
8题或8题以上时,累积概率为0.989,也
就是说,猜对9题或10题的概率不足0.05。
和失败;
不影响;
率也相等。
2.二项分布函数
二项分布是一种离散型随机变量的概率
分布。
用 n 次方的二项展开式来表达在 n 次
二项试验中成功事件出现的不同次数(X=0, 1„)的概率分布,叫做二项分布函数。
二项展开式的通式(即二项分布函数):
P X C p q
X n X
n X
等距的和缺乏明确参照点的分数转换成以标
准差为单位、以平均数为参照点的分数。
(2)标准分数的性质
Z分数无实际单位,是以平均数为参照点、以
标准差为单位的相对量。
一组原始分数得到的Z分数既有正值,也有负
值,所有原始分数的Z分数之和为零。
一组原始数据中,各个Z分数的标准差为1。
标准正态分布的平均值为0,标准差为1。
例题:一个教师对8个学生的作业成绩
进行猜测,如果教师猜对的可能性为1/3, 问:
⑴.平均能猜对几个学生的成绩? ⑵.假如规定猜对95%,才算这个教师
有一定的评判能力,那么这个教师至少要猜
对几个学生?
解:⑴.
1 np 8 2.67 3
⑵.
P (X) C p q
为单位表示一个原始分数在团体中所处位置
的相对位置量数。
标准分数从分数对平均数的相对地位、
该组分数的离中趋势两个方面来表示原始分
数的地位。
(1)标准分数的计算
标准分数的计算公式为
或
X X Z S
(7.1)
Z
X
Z分数可以表明原始分数在团体中的相
对位置,因此称为相对位置量数。
把原始分数转换成Z分数,就把单位不
5
2
3 0.5443 5
4
3.二项分布图
以成功事件出现的次数为横坐标,以
成功事件出现不同次数的概率为纵坐标, 绘制直方图或多边图,即为二项分布图。
二项分布是离散型分布,其概率直方
图是跃阶式。
二项分布的性质
从概率直方图可以看到,二项分布有
如下性质:
①.当p=q时,图形是对称的。 ②.当p≠q时,直方图呈偏态。p>q
四、概率分布类型
概率分布(probability distribution)
是指对随机变量取不同值时的概率的描述,一 般用概率分布函数进行描述。
依不同的标准,对概率分布可作不同的分
类。
1、离散型分布与连续型分布
依随机变量的类型,可将概率
分布分为离散型概率分布与连续型 概率分布。心理与教育统计学中最
这样的两个事件为互不相容事件。
事件概率之和,即
P( A B) P A PB
P ( A1 A2 An ) P A1 P A2 P An
(6.3) (6.4)
概率的乘法定理
若事件A发生不影响事件B是否发生,这
样的两个事件为互相独立事件。
例2:从30个白球和
20个黑球共50个球中随机
抽取两次(放回抽样),
问抽出一个黑球和一个白 球的概率是多少?
抽出一个白球的概率为3/5,抽出一个黑
球的概率为2/5。
抽出一个黑球和一个白球的情况应包括先
抽出一个黑球、后抽出一个白球和先抽出一 个白球、后抽出一个黑球两种情况。因此:
3 2 2 3 P 0.48 5 5 5 5
自数据分布中相对位置的高低。
计算不同质的观测值的总和或平均值,以
表示在团体中的相对位置。
当研究需要合成不同质的数据时,如果已知这 些不同质的观测值的次数分布为正态,这时可采用 Z分数来计算不同质的观测值的总和或平均值。
表示标准测验分数
经过标准化的心理和教育测验,常常
种数学模型计算出的概率分布。
3、基本随机变量分布与抽样分布
依所描述的数据的样本特性,可将概率分
布分为基本随机变量分布与抽样分布 (sampling distribution)。
基本随机变量分布是随机变量各种不同取
值情况的概率分布,抽样分布是从同一总体 内抽取的不同样本的统计量的概率分布。
二、二项分布
抽到第一题或第二题的概率应为抽到第一题的概率和抽到第二题的概率之和即四个学生都抽到第一题即四个学生同时抽到第一题其概率应为抽到第一题的概率的乘积即20个黑球共50个球中随机抽取两次放回抽样问抽出一个黑球和一个白球的概率是多少
第五章
概率及概论分布
一、概率的一般概念
1.概论的定义
后验概率(或统计概率)
率之和,即
0 0 6 1 5 2 2 4 P P P C p q C p q C p q ( 0) 1 2 6 6 6
3 2 3 2 6 15 5 5 5 5
6
m n
(5.2)
2.概率的公理系统
(1)任何随机事件A的概率都是在0与1之间 的正数,即 0 ≤ P(A)≤1 (2)不可能事件的概率等于零,即 P(A)= 0 (3)必然事件的概率等于1,即 P (A )= 1
三.概率的加法定理和乘法定理
概率的加法定理
若事件A发生,则事件B就一定不发生, 两互不相容事件和的概率,等于这两个
5 3
4
4
P ( 5)
8! 1 2 5 5 3 C8 p q 0.0617 5! 3! 3 3
P(0) 0.0406
P(0) P(1) 0.2022
P ( 0) P (1) P ( 2) 0.4838
P(0) P(1) P( 2) P(3) P ( 4) 0.9188
常用的离散型分布是二项分布,最
常用的连续型分布是正态分布。
2、经验分布与理论分布
依分布函数的来源,可将概率分布分为经验
分布与理论分布。
经验分布(empirical distribution)是指根据
观察或实验所获得的数据而编制的次数分布或相 对频率分布。
理论分布(theoretical distribution)是按某
X n X
n X
2 0 0 8 8 P(0) C8 p q q 0.0406 3 7 8 ! 1 2 1 P(1) C8 p1 q 7 0.1616 7! 3 3
P( 2) C82 p 2 q 6 8! 1 2 0.2816 2!6! 3 3
W( A) 随机事件的频率 当n无限增大时,随机事件A的频率会稳定在
m P A Lim n n
m n
一个常数P,这个常数就是随机事件A的概率。
(5.1)
先验概率(古典概率)
古典概率模型要求满足两个条件:
⑴
⑵
试验的所有可能结果是有限的;
每一种可能结果出现的可能性相等。
P( A )
试题1的概率是多少?
计 算
抽到第一题或第二题的概率应为抽到第一题
的概率和抽到第二题的概率之和,即
1 1 2 P A B P A P B 5 5 5
四个学生都抽到第一题即四个学生同时抽到第
一题,其概率应为抽到第一题的概率的乘积,即
1 1 1 1 1 P A1 A2 A3 A4 5 5 5 5 625
2.正态分布
正态分布(normal distribution)也称
与p<q时的偏斜方向相反。
4.二项分布的平均数和标准差
如果二项分布满足p>q且 nq≥5(或者p<q
且 np≥5时,二项分布接近于正态分布。可用下
面的方法计算二项分布的平均数和标准差。
二项分布的平均数为
np
(6.8) (6.9)
二项分布的标准差为
npq
5.二项分布的应用
二项分布函数除了用
二项分布(bionimal
distribution)是一种具有广泛 用途的离散型随机变量的概率 分布,它是由贝努里创始的,
因此又称为贝努里分布。
1.二项试验
满足以下条件的试验称为二项试验:
一次试验只有两种可能的结果,即成功
各次试验相互独立,即各次试验之间互 各次试验中成功的概率相等,失败的概
两个互相独立事件积的概率,等于这两个
事件概率的乘积,即
P( AB) P A PB
(9.5) (9.6)
P( A1 A2 An ) P A1 P A2 P An
例1:某一学生从5个试题中任意抽取
一题,进行口试。如果抽到每一题的概率 为1/5,则抽到试题1或试题2的概率是 多少? 如果前一个学生把抽过的试题还回 后,后一个学生再抽,则4个学生都抽到
用标准分数表示测验结果。如果其常模分 数分布接近正态分布,为了克服标准分数 出现的小数、负数和不易为人们所接受等 缺点,常常是将其转换成正态标准分数。 转换公式为:
Z aZ b
(7.2)
例如:早期智力测验中运用智力商数表 示智力测查的指标
MA(智力年龄) IQ 100 CA(实际年龄)
3 5
8
2
6
8! 1 2 3 P(3) C8 p3 q5 0.2800 3!5! 3 3
4 4 4 P ( 4 ) C8 p q
8! 1 2 0.1550 4!4! 3 3
(3)标准分数的优点
可比性:标准分数以团体的平均数为基准,以标
准差为单位,因而具有可比性。
可加性:标准分数使不同的原始分数具有相同的
参照点,因而具有可加性。
明确性:标准分数较原始分数的意义更为明确。
合理性:标准分数保证了不同性质的分数在总分
数中的权重相同,使分数更合理地反映事实。
(4)标准分数的应用
表6-1 一个学生做10个正误题做对不同题数的概率分布 做对题目数 0 1 2 3 4 5 6 7 8 9 10 总和 出现方式数 1 10 45 120 210 252 210 120 45 10 1 1024 概率P(X) 0.001 0.010 0.044 0.117 0.205 0.246 0.205 0.117 0.044 0.010 0.001 1.000 累积概率 0.001 0.011 0.055 0.172 0.377 0.623 0.828 0.945 0.989 0.999 1.000
解:将n=6,p=2/5,q=3/5,X=4代入 (6.7)式,则恰好抽到4个男生的概率为
6! 2 3 P( 4) C p q 0.1382 4!2! 5 5
4 6 4 2
4
2
最多抽到2个男生的概率,等于1个也
没有抽到、抽到1个和抽到两个男生的概
这种表示智力的方法后来被离差智商取代:
X X Z S
IQ 15Z 100
异常值的取舍
在一个正态分布中,平均数上下一定的
标准差处,包含有确定百分数的数据个数。 ±1σ P=68.26%
±2σ P=95.45%
±3σ P=99.73%
可以看到,在平均数上
下各三个标准差的范围内, 分布着全部数据的99.73%, 反言之,在三个标准差之外 的数据不足0.27%,因此常把 “三个标准差”做为判断可 疑值取舍的依据。
P ( 0) P (1) P ( 2) P (3) P ( 4) P (5) 0.9805
练习与思考
观察我们的生活,看看哪些现象是服
从二项分布规律的?
三、正态分布
1.标准分数
标准分数(standard score),又称为
基分数或Z分数(Z-score),是以标准差
n! X n X p q X !n X !
(6.7)
二项展开式的要点:
项数:二项展开式中共有n+1项。 方次:p的方次,从n→0为降幂;q的方次
从0→n为升幂。每项p与q方次之和等于n。
系数:各项系数是成功事件次数的组合数。
例3:从男生占2/5的学校中随机抽取6 个学生,问正好抽到4个男生的概率是多 少?最多抽到2个男生的概率是多少?
来求成功事件恰好出现X次 的概率之外,在教育中主
要用来判断试验结果的机
遇性与真实性的界限。
例如,一个学生凭猜测做10个是非题,
平均可以猜对5题。什么情况下可以说他是 真会而不是猜测呢?
这种问题需要用累积概率来算。当做对
8题或8题以上时,累积概率为0.989,也
就是说,猜对9题或10题的概率不足0.05。
和失败;
不影响;
率也相等。
2.二项分布函数
二项分布是一种离散型随机变量的概率
分布。
用 n 次方的二项展开式来表达在 n 次
二项试验中成功事件出现的不同次数(X=0, 1„)的概率分布,叫做二项分布函数。
二项展开式的通式(即二项分布函数):
P X C p q
X n X
n X
等距的和缺乏明确参照点的分数转换成以标
准差为单位、以平均数为参照点的分数。
(2)标准分数的性质
Z分数无实际单位,是以平均数为参照点、以
标准差为单位的相对量。
一组原始分数得到的Z分数既有正值,也有负
值,所有原始分数的Z分数之和为零。
一组原始数据中,各个Z分数的标准差为1。
标准正态分布的平均值为0,标准差为1。
例题:一个教师对8个学生的作业成绩
进行猜测,如果教师猜对的可能性为1/3, 问:
⑴.平均能猜对几个学生的成绩? ⑵.假如规定猜对95%,才算这个教师
有一定的评判能力,那么这个教师至少要猜
对几个学生?
解:⑴.
1 np 8 2.67 3
⑵.
P (X) C p q
为单位表示一个原始分数在团体中所处位置
的相对位置量数。
标准分数从分数对平均数的相对地位、
该组分数的离中趋势两个方面来表示原始分
数的地位。
(1)标准分数的计算
标准分数的计算公式为
或
X X Z S
(7.1)
Z
X
Z分数可以表明原始分数在团体中的相
对位置,因此称为相对位置量数。
把原始分数转换成Z分数,就把单位不
5
2
3 0.5443 5
4
3.二项分布图
以成功事件出现的次数为横坐标,以
成功事件出现不同次数的概率为纵坐标, 绘制直方图或多边图,即为二项分布图。
二项分布是离散型分布,其概率直方
图是跃阶式。
二项分布的性质
从概率直方图可以看到,二项分布有
如下性质:
①.当p=q时,图形是对称的。 ②.当p≠q时,直方图呈偏态。p>q
四、概率分布类型
概率分布(probability distribution)
是指对随机变量取不同值时的概率的描述,一 般用概率分布函数进行描述。
依不同的标准,对概率分布可作不同的分
类。
1、离散型分布与连续型分布
依随机变量的类型,可将概率
分布分为离散型概率分布与连续型 概率分布。心理与教育统计学中最
这样的两个事件为互不相容事件。
事件概率之和,即
P( A B) P A PB
P ( A1 A2 An ) P A1 P A2 P An
(6.3) (6.4)
概率的乘法定理
若事件A发生不影响事件B是否发生,这
样的两个事件为互相独立事件。
例2:从30个白球和
20个黑球共50个球中随机
抽取两次(放回抽样),
问抽出一个黑球和一个白 球的概率是多少?
抽出一个白球的概率为3/5,抽出一个黑
球的概率为2/5。
抽出一个黑球和一个白球的情况应包括先
抽出一个黑球、后抽出一个白球和先抽出一 个白球、后抽出一个黑球两种情况。因此:
3 2 2 3 P 0.48 5 5 5 5