第六章 两种常用的概率分布
教育与心理统计学第六章:概率分布
举例:
1、我们队将可能赢得今晚的这场比赛。 2、今天下午下雨的机会有40%。 3、这个冬天的周末我很可能有个约会。 4、我有50比50的机会通过今年的英语四
级考试。
概率的分类
1、后验概率(empirical definition of Probability)
以随机事件A在大量重复试验中出现的稳定频率值作 为随机事件A的概率估计值,这样求得的概率称为 后验概率。
进行推论,从而确定推论正确或错误的概率。
一、正态分布及渐近正态分布
(一)样本平均数的分布
1、总体分布为正态, δ2已知,样本平均数 的分布为正 态分布
标准误,即样本均数的标准差,是描述均数抽样分布的 离散程度及衡量均数抽样误差大小的尺度,反映的是 样本均数之间的变异。
标准误用来衡量抽样误差。标准误越小,表明样本统计 量与总体参数的值越接近,样本对总体越有代表性, 用样本统计量推断总体参数的可靠度越大。
第六章 概率分布
第一节 概率的基本概念 第二节 正态分布 第三节 二项分布 第四节 样本分布
第一节 概率的基本概念
一、什么是概率 随机现象(或随机事件)——在心理学研究中,通过实
验、问卷调查所获得的数据,常因主试、被试、施测 条件等因素的随机变化而呈现出不确定性,即使是相 同的被试在相同的观测条件下,多次重复测量结果也 还是上下波动,我们一般都无法事先确定每一次测量 的结果。 概率(probability):随机事件出现可能性大小的客观 指标
2、计算概率时 ,每一个正态分布都需要有自己 的正态概率分布表,这种表格是无穷多的
3、若能将一般的正态分布转化为标准正态分布, 计算概率时只需要查一张表
(三)标准正态分布表的编制与使用
第六章概率分析
T 70 65 60 56
正态分布表的应用
①将原始数据整理为次数 分布表; ②计算各组上限以下累加 次数; ③计算各组中点以下累加 次数; ④计算各组中点以下累积 比率; ⑤查正态分布表,将概率 转化为Z分数; ⑥将正态化以后的Z值进行 线性转换:T=10Z+50
140135130125-
120115110105100959085807570-
122
117 112 107 102 97 92 87 82 77 72
28
16 16 8 9 8 7 6 6 5 5
0.14
-0.17 -0.40 -0.59 -0.73 -0.90 -1.06 -1.25 -1.46 -1.70 -2.12
51
48 46 44 43 41 39 38 35 33 29
分析:包括两种情况:先抽一黑球、后抽一白球;
先抽一白球、后抽一黑球。
3 2 2 3 P 0.48 5 5 5 5
例4
一枚硬币掷3次,或三枚硬币各掷一次,问出现两
次或两次以上H的概率是多少?
解:可能出现的情况有:HHH HHT HTH THH TTH
THT HTT TTT共8种。每种情况出现的概率,为
根据随机变量的取值是否连续,可将随机变量分为
离散型随机变量与连续型随机变量。
当随机变量只取孤立的数值,这种随机变量称为离
散型随机变量。如投掷一枚硬币4次,几次正面朝上?因 取值只能为0、1、2、3、4,故为离散型随机变量。
离散分布与连续分布
离散型随机变量的概率分布称作离散分布。连续分
布是指连续型随机变量的概率分布,即测量数据的概率 分布。心理统计学中最常用的连续型分布是正态分布。
第六章 6.2 马尔可夫链的概率分布
如果个体当前收入等级为3,试分析经过三代后个体收 入等级转变为2的可能性,进一步分析经过n代后个体 收入等级的概率分布,并具体计算n=10时,个体收入 等级的概率分布。
i
= ∑ P ( X 0 = i, X n = j )
i
= ∑ P( X 0 = i) ⋅ P( X n = j X 0 = i)
i
= ∑ q p (0)
(0) i (n) ij i
n ≥ 0, i, j ∈ S
对于齐次马尔可夫链,上述结论可表示为
q
(n)
=q P , n≥0
(0) n
有限维分布 定理6.2.2 马尔可夫链X的有限维分布由其初始分 布和一步转移概率所完全确定. 证明 对∀n ≥ 1, ∀0 ≤ t1 < t2 < ⋯ < tn , i1 , i2 , ⋯, in , i ∈ S
i
= ∑ P ( X 0 = i, X t1 = i1 , X t2 = i2 ,⋯ , X tn = in )
i
= ∑ P ( X 0 = i ) ⋅ P( X t1 = i1 X 0 = i ) ⋅ P ( X t2 = i2 X 0 = i, X t1 = i1 )
i
⋅⋯ ⋅ P ( X tn = in X 0 = i , X t1 = i1 ,⋯ , X tn−1 = in −1 )
(2) 其中p02 为两步转移概率,是两步转移概率
矩阵中第一行第三列元素.
(2) 而P = P2
= 5 9 3 9 1 6 3 9 7 18 5 12 1 9 5 18 5 12
概率论与数理统计-第六章
这200人的年龄数据。
总体:北京市民的年龄 随机变量:年龄X
个体:张三28岁;李四5岁;
样本:{ 28;5;14;56;23;2;39;…;69} 样本容量:200
抽样:随机抽取200人进行调查的过程
6
例2:为了确定工厂生产的电池电量分布情况,在
产品中随机抽取500个,测量其电量。记录了
x
0
F n1 , n2
F分布的分位数
x
F分布的上α分位点
对于给定的 , 0 1, 称满足条件
F n1 , n2
f x; n1 , n2 dx 的点F n1 , n2
为F n1 , n2 分布的上 分位数。F n1 , n2 的值可查F 分布表
17
不易计算!
18
抽样分布 —— 任意统计量 Q = g (X1, X2, …, Xn ) 的分布函数 抽样分布的计算: 多维随机变量(独立、同分布)的函数的分布 函数的计算问题。
得到统计量 Q 的抽样分布,就可以用来解决
关于总体 X 的统计推断问题。
19
关于随机变量独立性的两个定理
解:(1)作变换 Yi
显然Y1 , Y2 ,
2 n i 1
Xi
, Yn相互独立,且Yi N 0,1 i 1, 2,
Xi
i 1, 2,
,n
,n
于是 (
) Yi 2 2 n
2 i 1
28
n
(2)
2 ( X X ) X1 X 2 ~ N (0, 2 2 ), 1 2 2 ~ 2 (1) 2
管理统计学(李金林版教材)课后习题答案~~~第六章
管理统计学(李金林版教材)课后习题答案~~~第六章基础习题1. 解释总体分布、样本分布和抽样分布的含义。
答:总体分布:整体取值的概率分布规律,即随机变量X 服从的分布;样本分布:从总体中按照一定的抽样规则抽取的部分个体的分布,若从总体中简单随机抽取容量为n 的样本,则样本分布为(X 1,X 2,...,X n );抽样分布:样本统计量的分布。
2. 简述卡方分布、t 分布、F 分布及正态分布之间的关系,它们的概率密度曲线各有什么特征?答:若随机变量X 服从N(μ,σ2),则Z =X−μσ服从N(0,1);若随机变量X 服从N(0,1),则Y =∑(X i )2n i=1服从自由度为n 的χ2分布;若随机变量X~N(0,1),随机变量Y~χ2(n),且X 与Y 相互独立,则称随机变量T =√Y n⁄服从自由度为n 的t 分布;若随机变量X~χ2(n),若随机变量Y~χ2(m),且X 与Y 相互独立,则称随机变量F n,m =X n ⁄Y m ⁄服从第一自由度为n ,第二自由度为m 的F 分布,记为F n,m ~F(n,m)。
χ2分布的概率密度曲线分布在第一象限内,随着自由度n 的增大,曲线向正无穷方向延伸,并越来越低阔,越来越趋近于正态分布的曲线形态。
t 分布的概率密度曲线以0为中心,左右对称,随着自由度n 的增大,t 分布的概率密度曲线逐渐接近标准正态分布的概率密度曲线。
F 分布的概率密度曲线分布在第一象限内,当第一个自由度不变,第二个自由度增大时,曲线越来越向右聚拢,当两个自由度都增加时,F 分布概率密度曲线逐渐接近正态分布的概率密度曲线。
3. 解释中心极限定理的含义。
从均值为μ,方差为σ2的任意一个总体中抽取样本容量为n 的随机样本,则当n 充分大时,样本均值x̅的抽样分布近似服从均值为μ,方差为σ2n ⁄的正态分布,即x̅~N(μ, σ2n ⁄)。
4. 某公司有20名销售员,以下是他们每个人的销售量:3,2,2,3,4,3,2,5,3,2,7,3,4,5,3,3,2,3,3,4。
常用概率分布
有拐点,表现为钟形 靠近 x 处曲线下面积较为集中,两边减少,意味
着正态分布变量取值靠近 x处 的概率较大,两 边逐渐减少 正态分布的总体偏度系数和峰度系数均为0
8
正态分布曲线下面积
正态分布变量X的取值为(-∞,∞)
23
四、二项分布的图形
24
图形特点:两个轴意义,对称、偏态、与 正态分布的关系
决定图形的两个参数:n,
25
五、样本率的均数和标准差
样本率的总体均数p:
p
1 n
x
1 n
(n )
样本率的总体标准差p:
p
1 n
x
(1 )
n
样本率的标准差(标准误)Sp:
Sp
p(1 p) n
26
根据中心极限定理,在n较大,n(1- )均大于5时,二项分 布接近于正态分布。当n → ∞ , 二项分布B(n,)的极限分布 是总体均数为X = n、总体方差 X2 = n(1-)的正态分布 N(n, n(1-))。这个时候可以用正态分布N(n, n(1-)) 作近似计算。
16
确定医学参考值范围
例 估计某地健康成年女子的血红蛋白的95% 医学参考值范围
具体步骤如下: 1. 根据研究背景确定研究对象的入选标准和排
除标准。这类研究一般要求参加体检并且要 求除研究指标血红蛋白指标外,其他指标均 正常的对象。 2. 根据研究背景,确定血红蛋白过高或过低均 属于不正常(双侧范围)。
6. 如果受检指标血红蛋白呈偏态分布,则可 以用百分位数P2.5~P97.5确定95%参考值 范围,但样本量要充分大。
7. 样本量充分大是相对与指标的变异程度, 指标变异大,要求样本量大;指标变异程 度小,要求样本量可以相对小一些。
第六章__概率分布
二、正态分布表的编制与使用
• (一)正态分布表的编制与结构
• 正态分布表的结构一般包括三栏
• 第一栏:Z分数单位;
• 第二栏:密度函数或比率数值(y);
• 第三栏:概率值(p)。
• (二)正态分布表的使用
2
3
• 当g2=0时,正态分布的峰度;g2>0时,分布的峰度 比正态分布的峰度低阔;g2<0时,表明分布的峰度比 正态分布的峰度高狭。当N>1000时,g2值才比较可 靠。
• (三)累加次数曲线法
• 正态分布概率曲线和样本的累加频率曲线完全重
合说明样本分布为正态;若偏离,则不符合。
• 四、正态分布理论在测验中的应用
-0.84 -0.525 0 0.84 1.645 2.33
4.160 4.475 5.000 5.840 6.645 7.330
• (三)在能力分组或等级评定时确定人数
• ①将6个标准差除以分组的或等级的数目,做到Z
分数等距;
• ②查正态分布表,从Z求p,即各等级或各组在等
距的情况下应有的比率; • ③将比率乘以欲分组的人数,便得到各等级或分 组该有的人数。
• (二)二项分布
• 二项分布:试验仅有两种不同性质结果的概率分布。也称 两个对立事件的概率分布。
• 二项分布同二项定理有着密切的关系:
n 1 n1 n1 n1 n n (p+q)n =C0 p +C p q + +C pq +C n n n nq
x x n x (p +q)n = Cn pq n
心理统计学课件第六章 概率分布
(三)正态分布的特征
正态分布的形式是对称的,它的对称轴是 经过平均数点的垂线。
正态分布的中央点(即平均数点)最高, 然后逐渐向两侧下降。
正态曲线下的面积为1,平均数点的垂线 将面积划分为相等的两部分0.50。
正态分布曲线,标准差与概率有一定的数 量关系。
二、正态分布表的结构与使用
2、已知P值,求Z分数
已知从平均数开始的概率值,求Z值 已知位于两端的概率值,求该概率分界点
上的Z值 已知正态曲线中间部分的概率,特定区间的人数 求考试成绩中某一特定人数比率的分数界
限 按能力分组或等级评定时确定人数 将等级评定结果转化为测量数据
按能力分组或等级评定时确定人数
要把100人在某一能力上分成5个等级, 各等级应该有多少人?
将等级评定结果转化为测量数据
某教师评价全班50人的作文,有8人优, 17人良,20人中,5人及格,求各等级的 标准分数
求考试成绩中特定区间的人数
已知某年级200名学生考试呈正态分布, 平均分为85分,标准差为10分,学生甲 的成绩为70分,问全年级成绩比学生甲低 的学生人数是多少?
求考试成绩中某一特定人数比率的分数界限
某次招生考试,学生成绩符合正态分布, 学生成绩的平均分为80分,标准差为10 分,要择优录取25%的学生进入高一级学 校学习,问最低分数线应是多少?
第六章 概率分布 第三节 正态分布
一、正态分布特征
(一)正态分布的概念 与二项概率分布对比 变量类型 图形
正态分布:
在一个概率分布中,中间频数多,两 端频数对称地减少,成为一种“钟”形对 称的理论概率分布。
(二)正态分布曲线
标准正态分布的密度函数:
6第六章二项分布22
S p = p (1 p ) / n
率的标准误与样本率和样本大小的关系如何? 率的标准误与样本率和样本大小的关系如何? 率的标准误的用途: 率的标准误的用途: ①衡量率的抽样误差 ②衡量样本率的可靠性 ③估计数总体率的可信区间 率的假设检验. ④率的假设检验.
2.二项分布的图形 2.二项分布的图形 (1)π=0.5,对称分布; 0.5,对称分布;
一,二项分布的适用条件和性质 (一)二项分布的适用条件 1.两种结果相互对立; 1.两种结果相互对立 两种结果相互对立; 2.已知固定的π和 n; 2.已知固定的 已知固定的π 3.各次试验相互独立. 3.各次试验相互独立 各次试验相互独立.
(二)二项分布的性质 1.二项分布的均数和标准差 二项分布的均数和标准差 1.绝对数形式: 均数 绝对数形式: 绝对数形式
所有可能结果 生 生 生 生 生 死 生 死 生 死 生 生 生 死 死 死 生 死 死 死 生 死 死 死 合计 每组小白鼠的死亡和生存只数及其概率 每种结果的概率 死亡数 不同死亡数的概率 0.008 0 0.008 0.032 0.032 1 0.096 0.032 0.128 0.128 2 0.384 0.128 0.512 3 0.512 1.000 1.000 -
例6-1 某种药物治疗某种非传染性疾病的 有效率为0.70,无效率为 有效率为 ,无效率为0.30.今用该药治疗该疾 . 病患者10人 试分别计算这10人中有 人中有6人 病患者 人,试分别计算这 人中有 人,7人,8 人 人有效的概率. 人有效的概率.
10! 6 10 6 P (6) = 0.70 (1 0.70) = 0.20012 6!(10 6)! 10! 7 10 7 P (7) = 0.70 (1 0.70) = 0.26683 7!(10 7)! 10! 8 10 8 P (8) = 0.70 (1 0.70) = 0.23347 8!(10 8)!
教育统计学第六章 概率及概率分布
( 0, )
标准正态分布
如果把总频数看成是1,随机变量的分布密度是
f ( x)
1 2
( x )2 2 2
e
( 0 , )
二者相比:
f ( x)
N e 2
x 2
2 2
( 0, )
92 P( A) 0.514 179
87 P( B) 0.486 179
7 P (C / A) 0.076, 92 12 P (C / B ) 0.137, 87
P( AC ) P( A) P(C / A) 0.514 0.076 0.039
P( BC ) P( B) P(C / B) 0.486 0.137 0.067
由于F值是两个总体方差的比值,所以F值均为正 值,故F的图象处于正半轴的上方 ,其最小值为0,最 大值为无穷大。
F值可通过查值表求得
左右两侧临界值之间的关系为:
1 F1 / 2 df1 , df2 F / 2 df2 , df1
例如:查表得 则
F0.05 / 2 8,9 4.10
1 2 c5 c35 p( A1 ) 3 c40
0.301
2 1 c5 c35 p( A2 ) 3 0.035 c40
3 c5 p( A3 ) 3 c40
0.001
p( A) p( A1 A2 A3 ) p( A1 ) P( A2 ) P( A3 )
例3 某班共有40名学生,如果其中只有5人没 有完成作业,而其它学生都较好地完成了作业。若 从该班中随机抽出3人检查作业完成情况,问至少 抽到一人未完成作业的概率是多少?
第六章.ppt数理统计
例:从鱼塘里捞一条鱼,这条鱼为鲤鱼的概率?
重复捞取鱼1000次,每次捞一条,有100次左右是鲤鱼,
近似认为再捞一次鱼是鲤鱼的概率为10%。
用频率近似概率
3、主观定义 人们根据经验和所掌握的信息对事件发 生的可能性给以主观的估计。
例:本拉登活着的概率;估计自己能考上大学 的概率;上一个新项目能否赚钱的概率。
(3)不可能事件:每次试验必然不会发生的事件 称为不可能事件。
上例中,观察正反面正面出现的次数为3次——这一事件为不可
能事件
二、事件的关系和运算
(1)包含——事件A发生必然导致B发生, A包含于B
例:抛两个硬币,观察正反面情况:可能结果:①1正2 反,②1反2正,③12全正,④12全反四个基本事件。
解:P(A)=40%,P(B)=50%,P(AB)=30%, P(A+B)=40%+50%-30%=60%; P(A/B)(抽一个公司,已知它进行销售预测,那么它研究 广告效果的概率)=P(AB)/P(B)=30%/50%=60%。 P(B/A)(已知这个公司研究广告效果,那么它进行销售 预测的概率是多少)=P(AB)/P(A)=30%/40%=75%。
(二)概率的运算法则
1、加法公式
两个互斥事件A、B,P(A+B)=P(A)+P(B) A、B互斥(A、B没有交集),P(A+B)(A、B至少 一个发生的概率)=P(A)+P(B)
2、乘法公式
(1)条件概率(事件B已经发生的条件下 事件A发生的概率)。 P(A/B)=P(AB)/P(B)
例:将一枚硬币掷两次,观察出现正反面的情况,设事件 A为“至少一次为正面”,事件B为“两次掷出同一面”, 现在来求已知事件A已经发生的条件下事件B发生的概率 P(B/A)。 解:S={正正、正反、反正、反反}, A={正正、正反、反正}, B={正正,反反}, A已经发生(抛两次硬币后,知道至少有一次正面), 那么掷出同一面的概率是1/3。
概率论第六章
对有限总体,采用放回抽样所得到的样本为简单随 机样本。
当样本容量 n 与总体容量N 相比很小时, 可将无放 回抽样近似地看作放回抽样.(n/N<1/10)
对于无限总体,因抽取一个个体不影响它的分布, 所以总是用不放回抽样。
(X 1,X 2, ,X n)是 来 自 总 体 的 样 本 ,求 样 本 (X 1,X 2, ,X n)的 分 布 律 .
解 总体X的分布律P 为 {X x}px(1p )1 (x x 0, 1)
因 X 1 ,为 X 2 , ,X n 相互 ,且与X独 有相立 同的分 , 布
所 (X 以 1,X 2, ,X n)的分布律为
X 1 k ,X 2 k , ,X n k 独立 X k 同 且 分 与 布
E ( X 1 k ) E ( X 2 k ) E ( X n k ) k
由辛钦定理
A
k
1 n
n i 1
X
k i
P k , k
1, 2,
,
说明2
依概率收敛的序列性质知道 g为连续函数
g( A1, A2 ,, Ak ) P g(1, 2 ,, k )
10 i 1
( xi
x )2
390.0
9 10
s2
21
3. 经验分布函数(与总体分布函数F(x)相对应的统计量)
设 X 1 ,X 2 , ,X n 是 总 体 X 的 一 个 样 本 , 用 s (x ) , x 表 示 X 1 ,X 2 , ,X n 中 不 大 于 x 的 随 机 变 量 的 个 数 ,
基本概念: 个体 总体无有限限总总体体 样本 样本值 总体的分布 样本的分布
管理统计学6 第六章 概率及其分布
星蓝海学习网
6.4 二项分布和泊松分布
6.4.1 二项分布
由于概率P的取值不同,二项分布的形状有差异。当P=0.25时,均值偏向 中心值以下的小值一方;当P=0.5时,均值处于中心位置;当P=0.75时,均 值偏向中心值以上的大值一方。所以,二项分布图形随着不合格率P的变 化而变化,当P=0.5时基本对称。
式中,Cnx
n!
x!n
x!
表示n个产品取x个不合格品的组合数。
星蓝海学习网
6.4 二项分布和泊松分布
6.4.1 二项分布
例题: 已知产品合格率为0.9,对产品检验100次,出现2次不合格品的概 率。 解:
C1200 0.120.91002 4950 0.01 0.00003279 0.0016231
星蓝海学习网
6.3 正态分布
6.3.1 正态分布的特点
总体落在总体平均数1倍标准差周围的概率为68.26%。即 当t=1时,则有
P X P X 1 68.26%
总体落在总体平均数2倍标准差周围的概率为95.45%。即 当t=2时,则有
二项分布的均值为 标准差为
np
npq
由于概率P的取值不同,二项分布的形状有差异。当P=0.25时,均值偏向 中心值以下的小值一方;当P=0.5时,均值处于中心位置;当P=0.75时, 均值偏向中心值以上的大值一方。所以,二项分布图形随着不合格率P的 变化而变化,当P=0.5时基本对称。
3 星蓝海学习网
学习目标
本章要掌握: 1. 数据与概率的关系; 2. 从概率分布上把握统计的特点; 3. 正态分布及其概率计算方法(学习的重点)。
4 星蓝海学习网
第六章概率分布2-二项分布、样本分布
抽样图示
抽样图示
回顾直方图、正态分布、近似正态
概率直方图——正态曲线
把一枚硬币抛100次,可能的型式有多少种?出现其中一种型 式的先验概率是多少?怎么计算?
正态近似:每个人都相信【正态近似】,试验者想这 是一个数学定理,数学家想这是一个试验事实。—— G.Lippman法国物理学家(1845-1921)
χ2分布为正偏态分布,自由度越小,偏 斜度越大,当自由度无限增大时,χ2分 布趋于正态分布
在统计检验中,χ2是计数资料分析常用 的统计检验方法。
189页, χ2的和服从自由度的和的χ2分 布
样本分布之四——F分布
F分布是由美国统计学家斯纳德克 (G.W.Snedecor)提出的一种分布。
概率P(A)的数学定义
P(A) Lim n N N
概率的运算规则
概率运算(n个事件同时发生) 加法:互不相容事件
乘法:互相独立的事件
互不相容事件和互斥事件
正态分布
概率密度函数式 正态分布图形态、构成、概率分布特点 正态分布的应用
总体——样本——样本点 正态分布——标准量尺 统一度量衡目的是什么——公平与效率
频率:FN(A)=n/N 概率:当观测次数N趋近于无穷大+∞时,
FN(A)趋近于一个稳定的数值,我们把它叫做 事件A发生的概率P(A)。
显然,如果对于事件A,经过无穷大+∞的观察, 果然存在一个P(A)值,那么这个值是由随机事 件本身客观的属性决定的。
在事件A发生的条件稳定的话,它的发生只有唯一 一个P(A)值与它对应。
正态分布曲线下,标准差和概率有一定的数量关系。
正态分布表包括三个部分内容:Z分数、y值和p值。
第六章概率与概率分布-社会统计学
第六章概率与概率分布-社会统计学第六章概率与概率分布第⼀节概率论随机现象与随机事件·事件之间的关系(事件和、事件积、事件的包含与相等、互斥事件、对⽴事件、互相独⽴事件)·先验概率与古典法·经验概率与频率法第⼆节概率的数学性质概率的数学性质(⾮负性、加法规则、乘法规则)·排列与样本点的计数·运⽤概率⽅法进⾏统计推断的前提第三节概率分布、期望值与变异数概率分布的定义·离散型随机变量及其概率分布·连续型随机变量及其概率分布·分布函数·数学期望与变异数⼀、填空1.⽤古典法求算概率.在应⽤上有两个缺点:①它只适⽤于有限样本点的情况;②它假设()。
2.分布函数)(x F 和)(x P 或)(x 的关系,就像向上累计频数和频率的关系⼀样。
所不同的是,)(x F 累计的是()。
3.如果A 和B (),总合有P(A/B)=P 〔B/A 〕=0。
4.()和()为抽样推断提供了主要理论依据。
5.抽样推断中,判断⼀个样本估计量是否优良的标准是()、()、()。
6.抽样设计的主要标准有()和()。
7.在抽样中,遵守()是计算抽样误差的先决条件。
8.抽样平均误差和总体标志变动的⼤⼩成(),与样本容量的平⽅根成()。
如果其他条件不变,抽样平均误差要减⼩到原来的1/4,则样本容量应()。
9.若事件A 和事件B 不能同时发⽣,则称A 和B 是()事件。
10.在⼀副扑克牌中单独抽取⼀次,抽到⼀张红桃或爱司的概率是();在⼀副扑克牌中单独抽取⼀次,抽到⼀张红桃且爱司的概率是()。
⼆、单项选择1.古典概率的特点应为()。
A 基本事件是有限个,并且是等可能的;B 基本事件是⽆限个,并且是等可能的;C 基本事件是有限个,但可以是具有不同的可能性;D 基本事件是⽆限的,但可以是具有不同的可能性。
2.随机试验所有可能出现的结果,称为()。
A 基本事件;B 样本;C 全部事件;D 样本空间。
常用的概率分布类型及其特征
常用的概率分布类型与其特征3.1 二点分布和均匀分布1、两点分布许多随机事件只有两个结果.如抽检产品的结果合格或不合格;产品或者可靠的工作,或者失效.描述这类随机事件变量只有两个取值,一般取0和1.它服从的分布称两点分布.其概率分布为:其中 Pk=P〔X=Xk〕,表示X取Xk值的概率:0≤P≤1.X的期望 E〔X〕=PX的方差 D〔X〕=P〔1—P〕2、均匀分布如果连续随机变量X的概率密度函数f〔x〕在有限的区间[a,b]上等于一个常数,则X服从的分布为均匀分布.其概率分布为:X的期望 E〔X〕=〔a+b〕/2X的方差 D〔X〕=〔b-a〕2/123.2 抽样检验中应用的分布3.2.1 超几何分布假设有一批产品,总数为N,其中不合格数为d,从这批产品中随机地抽出n 件作为被检样品,样品中的不合格数X服从的分布称超几何分布.X的分布概率为:X=0,1,……X的期望 E〔X〕=nd/NX的方差 D〔X〕=〔〔nd/N〕〔〔N-d〕/N〕〔〔N-n〕/N〕〕〔1/2〕3.2.2 二项分布超几何分布的概率公式可以写成阶乘的形式,共有9个阶乘,因而计算起来十分繁琐.二项分布就可以看成是超几何分布的一个简化.假设有一批产品,不合格品率为P,从这批产品中随机地抽出n件作为被检样品,其中不合格品数X服从的分布为二项分布.X的概率分布为:0<p<1x=0,1,……,nX的期望 E〔X〕=npX的方差 D〔X〕=np〔1-p〕3.2.3 泊松分布泊松分布比二项分布更重要.我们从产品受冲击〔指瞬时高电压、高环境应力、高负载应力等〕而失效的事实引入泊松分布.假设产品只有经过一定的冲击次数后,产品才失效,又设这些冲击满足三个条件:〔1〕、两个不相重叠的时间间隔内产品所受冲击次数相互独立;〔2〕、在充分小的时间间隔内发生两次或更多次冲击的机会可忽略不计;〔3〕、在单位时间内发生冲击的平均次数λ〔λ>0〕不随时间变化,即在时间间隔Δt内平均发生λΔt次冲击,它和Δt 的起点无关.则在[0,t]时间内发生冲击的次数X服从泊松分布,其分布概率为:X的期望 E〔X〕=λtX的方差 D〔X〕=λt假设仪表受到n次冲击即发生故障,则仪表在[0,t]时间内的可靠度为:其中:x =0,1,2,……,λ>0,t>0.3.2.4 x2分布本分布是可靠性工程中最常用的分布之一,虽然其概率密度形式较复杂,但可由标准正态分布推出.设有v个相互独立的随机变量X1,X2,…… Xv,它们服从于标准正态分布N 〔0,1〕.记x2 =X12 + X22 +…Xv2 ,x2读作"卡方"则x2服从的分布称为x2分布.它的概率密度函数为:该式称为随机变量x2服从自由度为V的x分布.式中:V—为自由度,是个自然数x2分布最重要的性质是:当m为整数时:3.3 产品的寿命分布3.3.1 指数分布指数分布是电子产品在可靠性工程学中最重要的分布.通常情况下,电子产品在剔除了早期故障后,到发生元器件或材料的老化变质之前的随机失效阶段其寿命服从指数分布规律.指数分布是唯一的失效率不随时间变化而变化的连续随机变量的概率分布.容易推出:指数分布有如下三个特点:1.平均寿命和失效率互为倒数;MTBF=1/λ2.特征寿命就是平均寿命;3.指数分布具有无记忆性.〔即产品以前的工作时间对以后的可能工作时间没有影响〕3.3.2 威布尔分布从上面的描述可知,指数分布只适用于浴盆曲线的底部,但任何产品都有早期故障,也总有耗损失效期.在可靠性工程学中用威布尔分布来描述产品在整个寿命期的分布情况.将指数分布中的〔-λt〕替换为〔-〔t/η〕m〕,就得到威布尔分布.容易得到:3.3.3 正态分布与对数正态分布正态分布又称为常态分布或高斯分布.它的概率密度函数为:式中:-∞<x<∞分布函数记为:对数正态分布是指:若寿命T的对数lnT服从正态分布N〔u,σ〕,则T服从对数正态分布.它的概率密度函数为:式中:t,σ为正数,μ和σ分别称为对数正态分布的"对数均值"和"对数标准差".3.4 为进行统计推断所构造的分布3.4.1 t分布〔学生氏分布〕t—分布常用于区间估计、正态总体的假设检验以与机械概率设计之中.服从t—分布的随机变量记住t.它是服从标准正态分布N〔0,1〕的随机变量U和服从自由度为v的x2分布的随机变量x2〔v〕的函数.它的概率密度函数f〔t〕为:3.4.2 F—分布F分布主要用于两个总体的假设检验与方差分析.服从F分布的随机变量F是两个相互独立的x2分布随机变量x2〔v1〕和x2〔v2〕的函数:式中:F只能取正值.F分布的概率密度函数为:另外还有β—分布等.中位秩是β—分布的中位数,一般用下式求出:中位秩值≈〔i-0.3〕/<n+0.4> 式中:n为样本总数.。
概率论与数理统计 --- 第六章{样本及抽样分布} 第四节:抽样分布
P T 1.059
0.15.
例2:
从正态总体N ( , 0.5 )中抽取样本X 1 , , X 10 .
2
数理统计
10 2 (1)已知 0,求概率P X i 4 ; i 1 10 2 (2)未知,求概率P ( X i X ) 2.85 . i 1
S1 和S2 分别是这两个样本的样本方差, 则有:
2 2
(1)
S1
2 2
S2
~ F ( n1 1, n2 1);
2 2
若两方差 1 2,则
S1 1
2 2
2 2
S2 2
~ F ( n1 1, n2 1);
(2)
X Y ( 1 2 ) ( n1 1) S1 ( n2 1) S2
n取不同值时
( n 1) S
2
2
的分布
定理3 (样本均值的分布) 数理统计 设X1, X2, …, Xn是取自正态总体 N(μ, σ2)的样本, 2 X和S 分别为样本均值和样本方差, 则有:
X S n ~ t ( n 1)
证:由定理1、和t分布的定义可得: 2
X ~ N (0,1), ( n 1) S
2) F分布的分位点:
对于给定的, 1, 称满足条件: 0
P F F ( n1 , n2 )
( y )dy
F ( n1 , n2 )
的点F ( n1 , n2 )为F ( n1 , n2 )分布的上 分位点.
F分布的上分位点的性质:
F1 ( n1 , n2 ) 1 F ( n2 , n1 )
概率论与数理统计6.第六章:样本及抽样分布
),
,
,
,
是来
Z=
(
-
证明统计量 Z 服从自由度为 2 的 t 分布。
14
),
,
,
,
是来 , .ຫໍສະໝຸດ 自 总 体 X 的 样 本 , E( ) 则 ,D( )=
是来自总体 X ,D(X)= . ,
,D( )=
11
3. 设 , 本 ,E(X)=
, , 为来自总体 X 的样 ,D(X)=9, 为样本均值 , 试用 < ≥ ,
切比雪夫不等式估计 P{ P{ 4.设 , 则当 K= > ≤ , , . 是总体 X
lim f (t ) (t )
n
1 e 2
t2 2
, x
3.分位点 设 T~t(n), 若对 :0<<1,存在 t(n)>0,
4
满足 P{Tt(n)}=, 则称 t(n)为 t(n)的上侧分位点 注: t1 (n) t (n) 三、F—分布 1.构造 若 1 ~2(n1), 2~2(n2),1, 2 独立,则
y0
2. F—分布的分位点 对于 :0<<1,若存在 F(n1, n2)>0, 满足 P{FF(n1, n2)}=, 则称 F(n1, n2)
5
为 F(n1, n2)的上侧 分位点; 注: F1 (n1 , n2 )
1 F (n2 , n1 )
§ 6.3 正态总体的抽样分布定理
X Y /n ~ t ( n)
t(n)称为自由度为 n 的 t—分布。 t(n) 的概率密度为
n 1 ) 1 t 2 n2 2 f (t ) (1 ) , t n n n ( ) 2 (
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
答对5题的概 率1/32
答对3题的概 率10/32
答对4题的概 率5/32
答对0题的概 率1/32
• 5题中答对各种可能结果的概率之和为1。
所以在二项分布中,n+1项的概率之和为1。 若p=q,则概率分布呈对称性,与两端等距 的项的概率相等。若p≠q,n较小时,概率分 布不对称,当n较大时(大于等于30或50), 概率分布逐步对称。
2、已知P值,求Z值。
• 例7 利用正态分布表,求: • (1)求中央50%的面积操作的下限Z值和 上限Z值。 • (2)求正态曲线下右尾20%的面积的下限 Z值。 • (3)求正态曲线下左侧30%的面积的上限 Z值。
解:(1)由于正态曲线的对称性,中央
50%的面积为对称轴左右两侧各25%的面
积的和。所以P=0.25,查附表,表中没有
σ =1
图6-3(a)
标准差的大小决定图形的陡峭平缓程度,即决定纵线高度 的最大值。当标准差较大时,概率分布的离中趋势较大, 观测值分散在较大范围内,纵线高度的最大值较小,正态 分布曲线形状较平缓;当标准差较小时,概率分布的离中 趋势较小,观测值分散在较小范围内,纵线高度的最大值 较大,正态分布曲线形状较陡峭。如图6-3(b)
是有限的,并且每种结果发生的可能性是不变时,
则某事件发生的概率等于该事件包含的基本事件
数(K)除以试验中可能发生的基本事件总件数
(N)之商。
P A K N
6.2
• 经验概率是由计算事件发生的频率而得, 先验概率是在实践之前利用有关事实确定的。 前者给出了概率的操作性定义,后者提供了 概率的理论上的基本定义。 • 4、概率的性质
(1)对任一事件A,有0≤P(A)≤1。 (2)不可能事件的概率等于零。 (3)必然事件的概率等于1。
•
5、小概率事件 在统计推断中,将一次试验中发生的概 率小于0.05的事件,称为小概率事件。认为 它是一次试验中同乎不可能发生的事件。
二、概率的两个基本法则
• (一)概率的加法法则
• 两个互不相容(或互斥)事件A、B之和的概率等于 两个事件分别发生的概率,即
•
在每次试验中一定发生的事件,称为必
然事件;而一定不会发生的事件,称为不可
能事件。如纯水在标准大气压下零度结冰等。
• (二)事件的概率
•
1、频率:对于随机事件A,如果在N
次试验中出现a次,则A发生的频率记作
F
A
a N
(6.1)
频率满足不等式0≤F(A)≤1。若A是必然事
件,则F(A)=1,若A是不可能事件,则F(A)
P(20)=0.000000095
三者之和为0.000201,即凭猜测得18分以上的概 率只有万分之二,可以断定,他得18分以上不是凭猜 测得到的。
第三节 正态分布
• 一、正态分布的概念 • 正态分布是指在一个 概率分布中,中间频数多, 两端频数相对称地减少,
形成一种“钟”形对称的
理论概率分布。 •
出的为是非或选择题”意思是无论抽得两
种题中的哪一种都表示该事件发生了,因
此是求两个事件之和的概率P(A+B)。
• P(A)=2/9, P(B)=6/9
• 所以P(A+B)=P(A)+P(B)=8/9
(二)概率的乘法法则
• 两个相互独立事件A、B之积的概率等于两个事件分 别发生的概率的积,即 • P(A•B)=P(A)• P(B)
•
从式6.9可看出,Y的值与离差|X-µ|的绝 对值有关,它是以X=µ这一点的纵线为对称 轴的轴对称图形。它的位置和形状由平均 数µ和标准差σ 决定。在同一直角坐标系中, 平均数的大小决定图形的位置左移或右移, 当µ较小时,图形向左移;当µ较大时,图 形向右移。见图6-3(a)
µ=0
µ=5
σ =1
B
)+ P( A B )=P(A)P( B )+
P( A )P(B)
=1/4*3/4+3/4*1/4=3/8
第二节 二项分布
• (一)二项分布的概念 • 所谓分布的指随机变量的概率分布。
•
如果一次试验中只会发生两种结果,非A
即B,A和B就是对立事件。发生A和B的概 率分别为p和q,显然P(A)+P(B) =p+q=1。而且 重复多次试验时,各次试验
(3)查表得,Z=1.64时,P=0.44950,所以 Z=-1.64时,P=0.44950,即它与Z=0所夹面积 为P=0.44950,故所求面积为:0.5-P=0.0505. (4) 当Z=1.5时,P=0.43319,所以当Z=1.5时,P=0.43319,故所求面积为: 0.5+P=0.93319.
• (二)二项分布的平均数与标准差 • (对随机变量k进行计算) • 平均数: • µ=np
• 标准差: • σ=
npq
二、二项分布的应用
• 例4 某个学生一次测验回答20道是非
题,每题1分,他得了18分,问(1)凭猜 测得18分的概率是多少?(2)他的成绩若 在18分以上,是否是凭猜测得到的? • 解:(1)p=0.5,q=0.5,n=20,k=18,代 入公式(6.6)得
P18 C p q 190 0.5 0.5 0.000181
18 20 18 2 18 2
即凭猜测得18分的可能性只有十万分之十八。 (2)依题意应首先求该学生得18分,19分、20分三种 分数的概率之和是多少,然后从这个概率的大小判断他 是否是凭猜测得到这个分数。 同样P(19)=0.000019
σ =0.5
σ =1 σ =1.6
图6-3(b)
在无数条正态分布曲线中有一条曲线 µ=0,σ =1,这条曲线称为标准正态曲线,
见图6-3(a)中左侧的一条曲线。其方程
简化为
Y
1 2
e
1 2 Z 2
二、标准正态分布曲线的特点
1、曲线最高点为Z=0,Y=0.3989,曲 线下的总面积即概率总和为1,对称轴左右 各0.5。 2、曲线是以过Z=0的纵线为对称轴呈 钟形的轴对称图形。 3、标准正态分布的平均数、中数、众 数三点重合在Z=0这一点上。
• P(A+B)=P(A)+P(B)
• 在一次试验中不可能同时出现的事件称为互不相容 事件。 • 例1 在9道题中,有6道选择题,2道是非题,1道填 空题,随机抽出一题,求抽出的为是非或选择题的 概率是多少?
• 解:高抽出是非题为事件A,抽出选择题为 事件B,随机抽一题,只能是抽取三类题中 的一题,所以A,B为互不相容事件。“抽
4、曲线与对称轴交点处Y值最大,即
此处观测值的相对次数最大,概率最大;
曲线向两侧先快后慢地下降,在Z=±1处
有两个拐点;横轴是标准正态曲线的水平
渐近线,曲线向两侧逐渐接近横轴,但永
不相交。
三、正态分布表
• (一)正态分布表的结构(P240) • 它是通过公式(6.10)计算得到的。
•
表中第一列给出了从0到3.99的Z值,
• 两个相互独立事件就是指一个事件发生的概率与另
一个事件的发生无关,两个事件的积就是指两个事 件同时发生的事件。
• 例2
少?
两道四选一题,凭猜测做对一题的概率是多
• 解:设第一题做对为事件A,做错为事件 A ,第 二题做对为事件B,做错为事件 B ,做对第一题 的概率为P(A B ),做对第二题的概率为P (A B ),所以做对任意一题的概率为 P(A
第二列给出了与Z对应的过点Z的纵线的高
度Y值,第三列给出了曲线下面积P值是过
Z=0人纵线与过表中某Z点人纵线所夹图形
的面积比率,即相应区间的随机变量的概
率。
(二)正态分布表的使用
•
• • • •
已知Z值查出对应的P值和Y值;已知P 值查出对应的Z值和Y值。 1、已知Z值,求P值。 例5 在正态分布表中: (1)求Z=-1与Z=1之间的面积比率。 解:查表,当Z=1时,P1=0.34134,由它的 对称性,当Z=-1时,P2=0.34134,所以所 求的面积比率为:P1+P2=0.68268。
四、正态曲线下面积的应用
• (一)推求考试成绩中特定区间的人数
• 例8 已知某年级200名学生考试成绩呈正
态分布,平均分为85分,标准差为10分,
学生甲的成绩为70分,问全年级成绩比学
生甲低的学生人数是多少?
• 解:属于已知Z值求P值问题。
一般分3步完成:
a)计算甲生成绩的标准分数; b)根据Z值查表求得对称轴与过Z值纵线所夹的面积; 再计算出Z值左侧的曲线面积; c)将面积比率乘以总人数,即可得比甲生分数低的学 生的实际人数。
第六章 两种常用的概率分布
第一节 概率 第二节 二项分布 第三节 正态分布
第一节 概率
• 一、事件及其概率 • (一)随机事件 • 概率论:是从量的方面研究随机现象的 统计规律的科学。 • 随机现象:是指在相同条件下反复进行 观察或实验,其结果无法事先预定的现象。 • 如:掷硬币,其结果有两个,正面或反 面。在随机现象中出现的各种可能结果, 称为随机事件,简称事件。
图6-1 正态分布
•
在二项分布中,当p=q,当均数
np>=5,n>=10时,二项分布可看作正态 分布的近似形。
图6-2 平均数、标准差相同的二项分布直条图和正态分布图
(二)正态分布曲线
• 图6-1为正态分布曲线,其方程为
Y
1 2
e
X 2
2 2
(6.9)
其中,Y为正态分布曲线的高度,表示 随机变量的概率的大小或观测值出现的相 对次数,X为观测值,即随机变量的可能 取值;µ、σ 分别为X的平均数和标准差, e=2.71828,П =3.1416。