教育统计学第六章 概率及概率分布
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
( 0, )
标准正态分布
如果把总频数看成是1,随机变量的分布密度是
f ( x)
1 2
( x )2 2 2
e
( 0 , )
二者相比:
f ( x)
N e 2
x 2
2 2
( 0, )
92 P( A) 0.514 179
87 P( B) 0.486 179
7 P (C / A) 0.076, 92 12 P (C / B ) 0.137, 87
P( AC ) P( A) P(C / A) 0.514 0.076 0.039
P( BC ) P( B) P(C / B) 0.486 0.137 0.067
由于F值是两个总体方差的比值,所以F值均为正 值,故F的图象处于正半轴的上方 ,其最小值为0,最 大值为无穷大。
F值可通过查值表求得
左右两侧临界值之间的关系为:
1 F1 / 2 df1 , df2 F / 2 df2 , df1
例如:查表得 则
F0.05 / 2 8,9 4.10
1 2 c5 c35 p( A1 ) 3 c40
0.301
2 1 c5 c35 p( A2 ) 3 0.035 c40
3 c5 p( A3 ) 3 c40
0.001
p( A) p( A1 A2 A3 ) p( A1 ) P( A2 ) P( A3 )
例3 某班共有40名学生,如果其中只有5人没 有完成作业,而其它学生都较好地完成了作业。若 从该班中随机抽出3人检查作业完成情况,问至少 抽到一人未完成作业的概率是多少?
解 :设事件“3人中至少有一个未完成作业”为A;则事 件可以看成如下三个不相容事件的和:
A1:“3人中恰有1人未完成作业”; A2:“3人中恰有2人未完成作业”; A3:“3人中恰有3人未完成作业”。 A=A1+A2+A3
条件概率计算公式
P( AB) P( A / B) P( B) ( P( B) 0)
概率的乘法定理:两个事件之积的概率等于其中 一个事件(其概率必须不为零)的概率乘另一个事件 在已知前一事件发生条件下的条件概率,即
P( AB) P( B) P( A / B)
或
P( AB) P( A) P( B / A)
连续性随机变量概率分布
连续性随机变量概率分布,如果要罗列的话, 我们只能将随机变量的取值分段,然后有序罗列 在各段的概率,一般采用连续函数来描述 设 是一个随机变量,如果对任意的实 数 x ,都有
F ( x) P( x)
f ( x)dx
x
则称 f (x)为连续性随机变量 的分布密度(或 密度函数)。
1 F10.05 / 2 9,8 0.24 4.10
y
1 2
(4)曲线有两个拐点,分别在 x ( Z 1 )处;
(5)
p( x1 x x2 ) f ( x)dx
x2
x1
x1
x2
1 e 2
( x )2 2 2
dx
如果
x N ( , ,令 )
2
Z
x
x N (1, 0)
例2 假设某次测验分数服从正态分布,其平均分μ=80,标 准差=7,问在平均分上下多少分中间包括99%的学生?问 成绩落在80分至90分之间的考生占多大比例?
解 由例1
p 2.58 z 2.58 0.99
0.99 p 2.58 z 2.58 x- p 2.58 2.58 p 2.58 x 2.58 + p 2.58 7 80 x 2.58 7 80 p 61.94 x 98.06 ,
例如,df=6,
=0.05,双侧检验, t(6)0服 从自由度为6的 t分布t 的 绝对值大于 等于2.447的概率为0.05。
又如当df=28, 0.01 时,单侧临界 t ( 28)0.01 2.467 。 这表示:自由度为28,显著性水平为0.01,t的单侧临界值 为2.467(见图6-6,图中阴影部分面积为0.01),即服从t 分布的值大于等于2.467的概率为0.01。
=0.337
2、 概率的乘法定理 独立事件:当事件 A发生与否同事件B发生与 否无关,则称事件A与事件B是相互独立的。 事件的乘积:事件A与事件B的乘积事件指的是 “事件A与事件B同时发生”,事件A与事件B的积用 AB表示。
条件概率:在事件B已经发生的条件下事件A发 生的概率,称这种概率为事件B发生的条件下事件A 发生的条件概率,记为 p( A B) 。
一个连续性随机变量的概率分布是指这个 随机变量在所有取值区间上概率取值的分布情 况。 连续性随机变量的分布函数性质:
1、 F ( x) 是非降函数,即当
≤
x1 x2
时,有
F ( x1 ) F ( x2 )
2、 F () 0 ; F () 1
;
3、当
x1 x 2
时,
x2
三、F分布
若从两个相互独立的正态总体中随机抽取两个独立 样本,以此为基础,分别求出两个相应总体方差的 估计值,这两个总体方差估计值的比值称为F比值, 即
2 1 2 2
S F S
F比值的抽样分布称为F分布, F比值称为F统计量 F统计量有两个自由度,分子自由度 df1 n1 1 为第一自由度,分母的自由度 df 2 n2 1 称为第二 自由度。因此,F分而与t分布类似,其曲线也是一簇 曲线,其形态随两自由度的不同组合而形成一簇大致 为正偏态分布曲线。
第六章 概率及概率分布
第一节 概率的一般概念
反映事件在实验中发生的可能性大小的数量化 指标叫做概率 一、概率的定义 1、概率的古典定义
假设一次试验所有可能出现的结果是有限的(设为n 个),且每一个结果出现的可能性相等,若事件A包含m个 可能结果,则事件A的概率为:
m p ( A) n
例1 某班50名学生在数学考试中有45人合格,5 人不合格,从中随机抽取1名学生,则抽到的学生数 学考试成绩不合格的概率是多少? 2、 概率的统计定义
概率的性质:
任何事件的概率值总是在数0与1之间。即事件A的概率满 足:0≤P(A) ≤1。
当概率值为1(P(A)=1)的事件称为必然事 件:即在一次试验中必然发生的事件
概率值为0(P(A)=0)的事件称为不可能事 件:即在试验中,不可能发生的事件
小概率事件原理
所谓“小概率事件原理”,是指“在一次试验 中,小概率事件是不可能发生的”。在实际工作中, 人们常常按照小概率事件原理对随机现象作决策判 断,这是一种科学的思维方式。
F ( x1 ) F ( x2 ) P( x1 x x2 )
f ( x)dx
x1
第三节 几种常用的概率分布
一、正态分布 在概率论和数理统计中,起着非常重要作用的是 所谓正态分布,也叫高斯分布。 正态分布的密度函数为
f ( x)
N e 2
x 2
2 2
第二节 概率分布
随机变量分布是描述随机变量所有可能取值及 相应概率变化规律的函数,也称随机变量分布,简 称分布。 概率分布就是一个随机变量取某个定值的可能 性大小,是一个随机变量取某个值的概率的规律性 离散性随机变量概率分布 离散性随机变量的概率分布,我们可以有序罗 列这个随机变量每一个取值的概率。
如果事件A与事件B是相互独立的两个事件,那 么事件A的发生并不影响事件B的发生, 即:
P( B / A) P( B)
也就是说,当两个事件独立时,这两个事件乘积 的概率等于这两个事件概率的乘积:
p( AB) p( A) p( B)
例4 某中学初一学生参加课外小组的情况如下表:
例4 某中学初一学生参加课外小组的情况如下表:
二、概率的运算 1、概率的加法定理 不相容事件:在一次实验中不可能同时发生的事 件称为不相容事件,也称为互斥事件
事件的和:两个事件A与B的和指的是事件“A与 B中至少有一个发生”,这个和事件用“A+B”表示。
概率的加法定理:两个不相容事件之和的概率 等于两个事件各自概率的和。即
p( A B) p( A) p( B)
二、t分布
t分布与标准正态分布的形状有些相似,都以0为 均值,左右对称。标准正态分布均值为零,方差为1, 只有一条曲线;而t分布虽然均值为零,方差却随着 样本容量变化而变化:
自由度是指可自由变化的变量的个数
T分布曲线特点:
t分布的形态随自由度的变化呈一簇分布形态 自由度越小,t分布的峰狭窄尖峭,尾长而翅高, 分布范围越广。当自由度逐渐增大时,t分布逐渐接 近正态分布。 当自由度趋于无限大时,t分布曲线与标准正态 分布曲线重合。
性别 男 女 总和 外语 7 12 19 数学 27 15 42 天文 18 5 23 未参加任何组 40 55 95 总和 92 87 179
若从该年级任取一名学生,则该生是男生的概率、是外 语小组成员的概率、是男生且为外语小组成员的概率、是女 生且为外语小组成员的概率分别是多少?
解: 设 A为事件“该生是男生”, B为事件“该生是女生”, C为事件“该生是外语组成员”, “该生是男生且为外语组成员” 事件为 “该生是女年且为外语组成员” 事件为 由古典概率计算法则: AC BC
故平均分数在 [61.94,98.06) 内的学生占参考人数的99%。 因为,当x=80分时,Z=0;当x=90分时,Z=1.43,查附 表1,
p 0 z 1.43 0.42364
p 80 z 90 0.42364 42%
故考试成绩落在80分至90分之间的考生约占42%的比例。
m A发生的次数m。 叫做事件A发生的频率 n
在一定的条件下,对同一试验重复进行n次,事件
随着试验次数的增多,频率值会越来越稳定地趋 向于一个固定的数值,这个数值就是事件A发生的概 率,记作 p( A)。
当试验次数n很大时,一般即以事件 A 发生的
m 频率 去估计其概率值 p ( A) n
例2 为检验一种新的教学方法的教学效果,检查了864名 参加实验的学生,其中556人有效果。现有一名学生欲接受 此方法学习,试估计效果如何。
,则
我们就把正态分布化为标准正态分布。 标准正态分布的平均数为0,标准差为1,其曲 线
如果随机变量
Z 服从标准正态分布,那么
z2
p(z1
≤ Z z2 )
1 2
e
z2 2
dz
z1
例1 查表求标准正态分布的概率值
p ( z ) 1, p (0 z ) 0.5, p ( z 0) 0.5 , p (0 z 0) 0.5, p (0 z 1) 0.34134, p (1 z 1) p ( 1 z 0) p (0 z 1) 2 p (0 z 1) 2 0.34134 0.68268, p (1.96 z 1.96) 0.95, p (2.58 z 2.58) 0.99, p ( z 0.65) 0.5 p (0 z 0.56) 0.5 0.24215 0.25785,
0 , 2 1时,分布密度为 当
f (Z )
其中 Z
1 2
e
Z2 2
x
称随机变量服从标准正态分布,记作
Z N (0 , 1)
正态分布曲线特点
(1)曲线呈钟形,以x轴为渐近线; (2)曲线以直线 x (标准正态曲线以直线 Z=0 )为对称轴,左右对称,且向左、向右无限延伸, 但永不与x轴相交,整个图形在轴的上方。 (3)当(Z=0)时,曲线达到最高点,其最大值 是