第五章 概率与概率分布基础
高中数学概率及概率分布教案
高中数学概率及概率分布教案
一、概率的基本概念
1. 概率的定义及性质
2. 事件与样本空间
3. 事件的互斥与独立
二、概率的计算方法
1. 古典概率
2. 频率概率
3. 几何概率
4. 条件概率
三、概率分布
1. 随机变量及其概率分布
2. 离散随机变量的分布
- 二项分布
- 泊松分布
- 几何分布
3. 连续随机变量的分布
- 正态分布
- 均匀分布
- 指数分布
四、概率在实际问题中的应用
1. 生活中的概率问题
2. 统计学中的概率应用
五、综合练习及实例分析
1. 案例分析
2. 任务练习
3. 试题讲解及解析
以上为高中数学概率及概率分布教案的基本内容,教师可根据学生的实际情况进行调整和修改,以更好地适应课堂教学的需要。
概率与概率分布
掌握概率的概念、性质和法则 明确概率分布的含义,了解二项试验和分布
的基础知识。
概率与概率分布
第一节 概率的一般概念
概率论起源于17世纪,当时在人口统计、人 寿保险等工作中,要整理和研究大量的随机数据资 料,这就需要一种专门研究大量随机现象的规律性 的数学。
参赌者就想:如果同时掷两颗骰子 ,则点数 之和为9 和点数之和为10 ,哪种情况出现的可能 性较大?
概率与概率分布
一、频率和概率的定义
1. 频率 对随机现象进行观测时,若事件A在n次观测中出 现了m次,则m与n的比值,就是事件A出现的频 率(也称为相对频数)。用 W(A)表示事件A 的频率。 公式为:W(A)=m/n
概率与概率分布
2. 概率
概率是对随机事件出现可能性大小的客观量度。
事件A发生的概率记为P(A)。
概率与概率分布
二、概率的性质
1. 对于任何事件A,均有0≤P(A)≤1 2. 不可能事件的概率为零,P(V)=0 3. 必然事件的概率为1,P(U)=1
概率与概率分布
三、概率的加法和乘法
1. 概率的加法
互不相容事件:在一次试验中不可能同时出现的 事件。
事件之和:有限个互不相容事件中任意一个发生。 如:A+B=A或B发生。
假设把两枚硬币投1000次,得到的结果为下表:
正面的数量 0 1 2
总计
频数(f) 253 499 248 1000
百分比(%) 25.3 49.9 24.8 100.0
概率分布实质上是无限次抛掷的频数分布。尽 管我们永远不能观察到这个无限次抛掷的频数 分布,但我们知道这是的频数分布会无限接近 概率分布。
概率与概Байду номын сангаас分布
第5章概率与概率分布
第5章 概率与概率分布一、思考题、频率与概率有什么关系 、独立性与互斥性有什么关系、根据自己的经验体会举几个服从泊松分布的随机变量的实例。
、根据自己的经验体会举几个服从正态分布的随机变量的实例。
二、练习题、写出下列随机试验的样本空间:(1)记录某班一次统计学测试的平均分数。
(2)某人在公路上骑自行车,观察该骑车人在遇到第一个红灯停下来以前遇到的绿灯次数。
(3)生产产品,直到有10件正品为止,记录生产产品的总件数。
、某市有50%的住户订阅日报,有65%的住户订阅晚报,有85%的住户至少订两种报纸中的一种,求同时订这两种报纸的住户的百分比。
、设A 与B 是两个随机事件,已知A 与B 至少有个发生的概率是31,A 发生且B 不发生的概率是91,求B 发现的概率。
、设A 与B 是两个随机事件,已知P(A)=P(B)=31,P(A |B)= 61,求P(A |B ) 、有甲、乙两批种子,发芽率分别是和。
在两批种子中各随机取一粒,试求: (1)两粒都发芽的概率。
(2)至少有一粒发芽的概率。
(3)恰有一粒发芽的概率。
、某厂产品的合格率为96%,合格品中一级品率为75%,从产品中任取一件为一级品的概率是多少、某种品牌的电视机用到5000小时未坏的概率为43,用到10000小时未坏的概率为21。
现在有一台这种品牌的电视机已经用了5000小时未坏,它能用到10000小时的概率是多少、某厂职工中,小学文化程度的有10%,初中文化程度的有50%,高中及高中以上文化程度的有40%,25岁以下青年在小学、初中、高中及高中以上文化程度各组中的比例分别为20%,50%,70%。
从该厂随机抽取一名职工,发现年龄不到25岁,他具有小学、初中、高中及高中以上文化程度的概率各为多少、某厂有A ,B ,C ,D 四个车间生产同种产品,日产量分别占全厂产量的30%,27%,25%,18%。
已知这四个车间产品的次品率分别为,,和,从该厂任意抽取一件产品,发现为次品,且这件产品是由A ,B 车间生产的分布。
第五章概率与概率分布
P( A)
事件A发生的次数m 重复试验次数n
m n
英语字母出现频率
space 0.2 ; I 0.055 ; C 0.023 ; G 0.011 ; Q 0.001 ; E R U B Z 0.105 ; T 0.072 ; 0.054 ; S 0.052 ; 0.0225 ; M 0.021 ; 0.0105 ; V 0.008 ; 0.001 O H P K 0.0654 ; 0.047 ; 0.0175 ; 0.003 ; A D Y X 0.063 ; 0.035 ; 0.012 ; 0.002 ; N 0.059 L 0.029 W 0.012 J 0.001
一、概率(Probability)的定义
概率:0-1之间的数,衡量事件A发生可能 性(机会)的数值度量。记P(A) •Probability: A value between 0 and 1, inclusive, describing the relative possibility (chance or likelihood) an event will occur.
P ( A) A包 含 的 可 能 结 果 (偶 数 ) 全部可能结果 3 6
实际与理论分析不符时,实际中可能作弊。
如:河北银行人员为买奖券,盗2000万并没中大奖。
西安彩票中心人员中奖率极高,结果是作弊。
例:已知有148名学生统计表
专业
性别
男 女
金融学院 工商学院 经济学院 会计学院 15 15 22 14 30 12 25 15
摘自:概率论与数理统计简明教程1988》李贤平 卞国瑞 立鹏,高等教育出版社
吴
大量统计的结果,用于破解密码
美国正常人血型分布
概率论与数理统计第5章
p( x1 , x2 ,
, xn ) = p(x1 )p(x2 )
p(xn ) = ∏ p( xi )
i =1
n
14 September 2009
1.
若连续型总体 X 的密度函数为 p(x ), , X n )是取自总体 X 的样本, iid
(X 1 , X 2 ,
X1, X2, … , Xn
n 则 (X 1 , X 2 , , X n )的密度函数为 p( x1 , x2 , , xn ) = p(x1 )p(x2 ) p(xn ) = ∏ p( xi ) i =1
数理统计
学习基础:1、高等数学 2、概率论
前面的学习已知:随机变量及其所伴随的概率分布全面描述了 随机现象的统计规律性,所以要研究一个随机现象首先要 知道它的概率分布. 概率论中:许多问题的概率分布通常是已知的或假设为已知的然后 在此基础上进行一切计算与推理. 实际中:一个随机现象的概率分布可能完全不知道 或知道分布类型却不知道其中的参数.例如正态分布
则 (X 1 , X 2 ,
, X n )的密度函数为
p( x1 , x2 ,
, xn ) = p(x1 )p(x2 )
n
p(xn )
⎧n −λ ∑ xi ⎪ Π λe −λxi = λ ne i=1 = ⎨ i =1 ⎪ 0 ⎩
xi > 0, i = 1, 2, 其它
,n
例如 设某批产品共有N 个,其中的次品 数为M, 其次品率为 p = M / N 若 p 是未知的,则可用抽样方法来估计它. 从这批产品中任取一个产品,用随机变量 X来描述它是否是次品: 所取的产品是次品 ⎧ 1, X =⎨ ⎩ 0, 所取的产品不是次品 X 服从参数为p 的0-1分布,可用如下表示 方法: P(x) = p (1− p) ,
第五章 概率及概率分布
P A B P ( A) P ( B)
16
第一节 概率的一般概念
三、概率的加法和乘法 1、概率的加法 例如:抛掷一枚硬币,正面朝上和正面朝下的概率各为0.50, 问在实验中,硬币正面朝上或朝下的概率是多少? 答:硬币正面朝上或朝下的概率是1。 获得一、二、三等奖的概率分别为:0.002、0.005和0.993, 获奖的概率是多少? 答:获奖的概率为1。
17
第一节 概率的一般概念
三、概率的加法和乘法 2、概率的乘法 A事件出现的概率不影响B事件出现的概率,这两个事件为独 立事件。 两个独立事件积的概率,等于这两个事件概率的乘积。表示 两个事件同时出现的概率。 用公式可表示为:
P ( A B ) P ( A) P ( B)
18
第一节 概率的一般概念
npq 101/ 2 1/ 2 1.58
31
第二节 二项分布
四、二项分布的平均数和标准差 例如:有一份试卷,共有50道选择题,并且都为四选一,假 定一个学生一点都不会,只能凭猜测来回答。问凭猜测来回 答,平均能猜对几道题,猜对题目数的标准差为多少。 分析:因为完全不会做而只是靠猜测,因此属于二项分布的 运用条件。
8
第一节 概率的一般概念
一、概率的定义 (2)后验概率——
表5.1 抛掷硬币试验中正面朝上的频率 试验者 德摩根 蒲丰 皮尔逊 皮尔逊 抛硬币次数 2048 4040 12000 24000 正面朝上次数 1061 2048 6019 12012 正面朝上频率 0.5181 0.5069 0.5016 0.5005
职教学院 刘春雷 E-mail:lcl2156@
1
第五章
概率及概率分布
第一节 概率的一般概念 第二节 二项分布
概率论数理统计基础知识第五章
C
]
(A)Y ~ 2 (n). (B)Y ~ 2 (n 1). (C)Y ~ F (n,1). (D)Y ~ F (1, n).
【例】设 随机变量X和Y都服从标准正态分布,则[ C ]
(A)X+Y服从正态分布.
2 2 2
(B)X2 +Y2服从 2分布. Y
2
2 X (C)X 和Y 都服从 分布. (D)
(X ) ~ t ( n 1) S n
客、考点 10,正态总体的抽样分布
33/33
34/33
35/33
【例】设总体 X ~ N (0,1),X 1 , X 2 , X1 X 2
2 2 X3 X4
, X n 是简单随机
2 X i. i 4 n
样本 , 试问下列统计量服从什么分布? (1 ) ; (2 ) n 1X1
记:F分布是两个卡方分布的商
2. F 分布的上侧分位数
设 F ~ F (k1 , k2 ) ,对于给定的 a (0,1) ,称满足条件
P{F Fa (k1 , k2 )}
Fa ( k1 ,k2 )
f F ( x)dx a
的数 Fa (k1 , k2 ) 为F 分布的上侧a 分位数。
服从F分布.
§5.5 正态总体统计量的分布
一、单个正态总体情形 总体
X ~ N ( , 2 ) ,样本 X1 , X 2 , , Xn ,
1 n 样本均值 X X i n i 1
n 1 2 样本方差 S 2 ( X X ) i n 1 i 1
1. 定理1 若设总体X~N(μ,σ2), 则统计量
有一约束条件
(X
i 1
第五章 常见概率分布(Npoisson分布)
流 统 志 胡
Poisson分布的特点
• Poisson分布的均数和方差相等。 λ=σ2 • Poisson分布的可加性
流 统 志 胡
坚
流 统 志 胡 坚
坚
流 统 志 胡
Poisson分布的可加性
• 观察某一现象的发生数时,如果它呈Poisson分布,那么 把若干个小单位合并为一个大单位后,其总计数亦呈 Poisson分布。 • 如果X1∼P(λ1), X2∼P(λ2),… XK∼P(λK),那么
流 统
胡志坚
统 志 胡 坚
第五章
流
常见概率分布
志 胡
坚
流
统
志 胡
坚
流 统 志 胡
Poisson分布的意义
• 盒子中装有999个黑棋子,一个白棋子,在 一次抽样中,抽中白棋子的概率1/1000 • 在100次抽样中,抽中1,2,…10个白棋子 的概率分别是……
流
统
坚
志 胡
流
统 志 胡 坚
坚
流 统 志 胡
流
统
坚
志 胡
流 统 志 胡 坚
坚
流 统
统
志 胡
坚
流
谢谢!
志 胡
坚
流
统
志 胡
坚
菌落数大于1个的概率:
P(X
1 )
= 1 − p ( x = 0 ) − p ( x = 1) e
(−
6
流
统
坚
志 胡
流
= 1 −
)
6
0
0!
−
e
(−
6
)
6
1
统
1!
坚
志 胡
概率论与数理统计 第五章
贝努里定理. 它的叙述如下:设是n次重复独立 对于任意给定的ε>0,有
lim P{| nA p | } 1
n
n
lim P{| nA p | } 1
n
n
其中nA/n是频率,p是概率,即次数多
时事件发生的频率收敛于概率.表示频率的稳定性.
定理3
lim P{|
n
1 n
n i 1
Xi
| } 1
数理统计的方法属于归纳法,由大量的资料作依据,而不
是从根据某种事实进行假设,按一定的逻辑推理得到的.例
如统计学家通过大量观察资料得出吸烟和肺癌有关,吸烟
者得肺癌的人比不吸烟的多好几倍.因此得到这个结论.
数理统计的应用范围很广泛.在政府部门要求有关的资
料给政府制定政策提供参考.由局部推断整体,学生的假期
第五章 大 数 定 律 与 中 心 极 限 定 律
§ 5.1大 数 定 律
定理1(切比雪夫定理) 设X1,X2,...,Xn,...是相互独立的随机变
量序列若存在常数C,使得D(Xi)≤C. (i=1,2,...n),则对任意给
定的ε>0,有
lim P{|
n
1 n
n i 1
[Xi
E( X i )] |
7200 6800 2
200 1
D 2
1
2100 2002
0.95
可见虽有10000盏灯,只要电力供应7200盏灯即有相当大的保 证率切贝谢夫不等式对这类问题的计算有较大价值,但它的精度 不高.为此我们研究下面的内容.
2021/9/5
10
§ 5.2 中 心 极 限 定 理
在随机变量的一切可能性的分布律中,正态分布占有特殊的
第五章概率分布
32
T分数优点: 1.没有负数,若出现小数时可以四舍五入,误差不
会很大。 2.它的取值范围比较符合百分制的记分习惯,易于
被人们接受。 3.由于偶然因素导致原始分数偏态,运用T分数可转
化为正态。
2019/12/11
33
例:某研究中随机抽取了180名学生的某一能 力测验分数,由于这些分数不是正态,需 要正态化。已有研究表明学生的总体能力 分布为正态,所以可以用正态化原理和T分 数公式将其正态化。
2.当总体分布为非正态而其方差又未知时, 若满足n>30这一条件,样本平均数的分布 近似为t分布。
2019/12/11
40
2. 2 值都是正值。 3. 2 分布的和也是 2 分布。 4. 如果df> 2,这时 2 分布的平均数:
2 d,f方差 22= 2df
5. 2 是连续型分布,但有些离散型的分布也 近似 2分布。
2019/12/11
42
• 2 分布为在统计分析中应用于计数数据的
假设检验以及样本方差与总体方差差异是 否显著的检验等。
2019/12/11
43
四、F分布
• 来自两个正态总体的独立样本,其方差之 比的样本分布为:
F
s / 22源自n1 11 s / 2
2
n2 1
2
• 来自同一总体,12 22 ,F比率:
2019/12/11
36
样本平均数的分布
2.总体分布非正态,但方差已知,当n大于30 时,其样本平均数的分布为渐进正态分布。
2019/12/11
37
(一)t分布的特点
1.平均数为0。 2.以平均值0左右对称的分布,左侧t为负值,右侧
为正值。 3.变量取值在-∞~+∞之间。 4.当样本容量趋于∞时,t分布为正态分布,方差为1;
第5章 常用概率分布2
正态分布的参数
1
2
3
图9 标准差相同、均数不同的正态分布曲线
正态分布的参数
σ1 σ2 σ3 σ1<σ2<σ3
图10 均数相同、标准差不同的正态分布曲线
正态分布
二、正态概率密度曲线下的面积规律
正态曲线下面积总和为1;
正态曲线关于均数对称;对称的区域内面积相等; 对任意正态曲线,按标准差为单位,对应的面积相 等;
计算z值:
z1 x1
( 1.96 )
1.96
z2
x2
( 1.96 )
1.96
0.025 1.96
查附表1:确定概率 结论:95%
0.025 -1.96
正态分布
例 已知X服从均数为 、标准差 为的正态分布, 1 .96 试估计:(1)X取值在区间 上的概率; (2)X 取值在区间 上的概率。 2.58
记为N(0,1)。 标准正态分布是一条曲线。
标准正态分布曲线下的面积
μ±1范围内的面积为68.27% μ±1.96范围内的面积为95%
μ±2.58范围内的面积占99%
图12 正态曲线下的面积分布示意
标准正态分布曲线下的面积的计算
求z值,用z值查表,得到所求区间面积占总面
积的比例。 曲线下对称于0的区间,面积相等。 曲线下总面积为100%或1。
计算z值:
Z 130 123 .02 1.46 4.79
查附表1:确定概率
0.0721 0.0721 1.46
结论:7.21%
-1.46
人大《统计学》第五章 概率和概率分布
3.乘法的一般定理
• 更多的时候,事件并不是独立的,概率的计算是有条件的。一般
意义上,两个事件之积(同时发生)的概率,为: AB P A P B | A P • 上式也可以写作 P AB P B P A | B
§1.2 概率
• 求两个以上事件之积(同时发生)的概率与之相似。
当离散型随机变量X的只有两个可能的取值,并且其中一个赋值为1,另 一个赋值为0,则X服从0-1分布。 设取1的概率为 p ,则取0的概率 q 1 p 对于服从0-1分布的离散型随机变量X,有:
E X 1 p 0 1 p p
V X 1 p p 0 p 1 p p 1 p
P • 若 P Ai 0 i 1, 2,, n ,则对任意事件B,有: B P B | Ai P Ai
n i 1
§1.2 概率
【例5.1】 某厂生产甲、乙、丙三种产品,各种产品的次品率分别为4%
、6%、7%,各种产品的数量分别占总数量的30%、20%、50%,将三种产品
对连续变量,可计算某段(区间)取值的概率(或概率密度),相应地
便构成了连续变量的概率分布。
§2 离散变量的概率分布
首先看离散型随机变量的概率分布。 为得到离散型随机变量X的概率分布,通常需要列出X的所有可能取值, 以及X取这些值的概率。用下面的表格来表示:
§2 离散变量的概率分布
P X xi pi 称为离散型随机变量的概率函数。并有:
§1.2 概率
2.贝叶斯公式 • 贝叶斯公式与全概率公式要解决的问题正好相反。 • 它是在条件概率的基础上寻找事件发生的原因(或事件是在什么 条件下发生的)。 • 贝叶斯公式也称作逆概公式。
统计学课件(贾俊平)人大课件
概率的古典定义
(实例)
统计学
【例】某钢铁公司所属三个工厂的职工人数如下表。从
该公司中随机抽取1人,问: (1)该职工为男性的概率 (2)该职工为炼钢厂职工的概率
某钢铁公司所属企业职工人数
工厂 炼钢厂 炼铁厂 轧钢厂 合计 5 - 20 男职工 4000 3200 900 8500 女职工 1800 1600 600 4000 合计 6200 4800 1500 12500
可以在相同的条件下重复进行 每次试验的可能结果可能不止一个,但试验的所 有可能结果在试验之前是确切知道的 在试验结束之前,不能确定该次试验的确切结果
5-6
经济、管理类 基础课程
统计学
1. 2. 3.
事件的概念
事件:随机试验的每一个可能结果(任何样本点集合)
例如:掷一枚骰子出现的点数为3 例如:掷一枚骰子可能出现的点数 例如:掷一枚骰子出现的点数小于7 例如:掷一枚骰子出现的点数大于6
经济、管理类 基础课程
统计学
事件的概率
例如,投掷一枚硬币,出现正面和反面的频率, 随着投掷次数 n 的增大,出现正面和反面的频率 稳定在1/2左右
正面 /试验次数
1.00
0.75 0.50
0.25
0.00 0 5 - 18 25 50 75 试验的次数 100 125
经济、管理类 基础课程
统计学
解:设 A1,A2,A3为甲、乙、丙三台机床不需要看管的事 件, A3 为丙机床需要看管的事件,依题意有 (1) P(A1A2A3)= P(A1) P(A2) P(A3)=0.90.80.85=0.612 (2) P(A1A2A3)= P(A1) P(A2) P(A3)
概率论与数理统计第五章
第 ×× 次课 2学时本次课教学重点:常用的统计量 本次课教学难点:总体,简单随机样本,统计量的概念。
本次课教学内容:第五章 数理统计的基础知识 第一节 数理统计的基本概念 教学组织: 一、引言在前五章中我们学习了概率论的基本内容,因为随机变量及其所伴随的概率分布全面描述了随机现象的统计规律性,所以在概率论的许多问题中,概率分布通常都是已知的,或者假设是已知的,而一切计算与推理都是在此基础上得出来的。
然而,实际情况往往并非如此。
一个随机现象所服从的分布概型可能完全不知道,或者只知道其概型而不知其分布函数中所含的参数。
例如,某工厂生产的灯泡的寿命服从什么分布是不知道的。
再如,某厂生产的一件产品是合格品还是不合格品,我们知道它服从两点分布,但其参数p 却不知道。
那么怎样才能知道一个随机现象的分布或其参数呢?这就是数理统计所要解决的一个首要问题。
为了获得灯泡的寿命分布,我们从所有的灯泡中抽出一部分进行观察与测试以取得相关信息,从而做出推断。
由于观察和测试是随机现象,依据有限个观察与测试对整体所做出的推断不可能绝对准确,这个不确定性我们用概率来表达。
数理统计学的基本问题就是依据观测或试验所取得的有限信息对整体做出推断,每个推断必须伴有一定的概率来表明其可靠程度。
这种伴有一定概率的推断称为统计推断。
二、总体与随机样本 1、总体在数理统计中,我们往往研究有关对象的某一数量指标(如灯泡的寿命这一数量指标)。
为此,考虑与这一数量指标相联系的随机试验,对这一数量指标进行试验或观察。
我们把研究对象的全体所构成的一个集合称为总体,总体中的每个对象称为个体。
总体中所包含的个体的个数称为总体的容量。
容量有限的总体称为有限总体,容量无限的总体称为无限总体。
例如,考察某批灯泡的质量,如这一批灯泡共有5000只,每个灯泡的寿命是一个可能的观察值,是一个个体。
所有5000只灯泡的寿命是一个有限总体。
《统计学》(贾俊平第七版)课后题及答案-统计学 贾俊平第七版
第一章导论1.什么是统计学?统计学是搜集、处理、分析、解释数据并从中得出结论的科学。
2.解释描述统计与推断统计。
描述统计研究的是数据搜集、处理、汇总、图表描述、概括与分析等统计方法。
推断统计研究的是如何利用样本数据来推断总体特征的统计方法。
3.统计数据可分为哪几种类型?不同类型的数据各有什么特点?按照计量尺度可分为分类数据、顺序数据和数值型数据;按照数据的搜集方法,可以分为观测数据和试验数据;按照被描述的现象与实践的关系,可以分为截面数据和时间序列数据。
4.解释分类数据、顺序数据和数值型数据的含义。
分类数据是只能归于某一类别的非数字型数据;顺序数据是只能归于某一有序类别的非数字型数据;数值型数据是按照数字尺度测量的观测值,其结果表现为具体的数值。
5.举例说明总体、样本、参数、统计量、变量这几个概念。
总体是包含所研究的全部个体的集合,样本是从总体中抽取的一部分元素的集合,参数是用来描述总体特征的概括性数字度量,统计量是用来描述样本特征的概括性数字度量,变量是用来说明现象某种特征的概念。
6.变量可分为哪几类?变量可分为分类变量、顺序变量和数值型变量。
分类变量是说明书屋类别的一个名称,其取值为分类数据;顺序变量是说明十五有序类别的一个名称,其取值是顺序数据;数值型变量是说明事物数字特征的一个名称,其取值是数值型数据。
7.举例说明离散型变量和连续型变量。
离散型变量是只能去可数值的变量,它只能取有限个值,而且其取值都以整位数断开,如“产品数量”;连续性变量是可以在一个或多个区间中取任何值的变量,它的取值是连续不断的,不能一一列举,如“温度”等。
第二章数据的搜集1.什么是二手资料?使用二手资料需要注意些什么?与研究内容有关、由别人调查和试验而来、已经存在并会被我们所利用的资料为二手资料。
使用时要评估资料的原始搜集人、搜集目的、搜集途径、搜集时间且使用时要注明数据来源。
2.比较概率抽样和非概率抽样的特点。
举例说明什么情况下适合采用概率抽样,什么情况下适合采用非概率抽样。
第5讲:概率及正态分布
模型推导出的总体的次数分布 ➢ 基本随机变量分布: ➢ 抽样分布:样本统计量的分布
概率分布的分类结构图
分布
经验分布——频次分布
理论分布——概率分布
总体分布
抽样分布
离散分布——二项分布
连续分布——正态分布
第二节 正态分布
数学情景
从 某 中 学 男 生 中 随 机 抽 取 出 8 4 名 , 测 量 身 高 , 数 据 如 下 ( 单 位 : cm ):
出正面次数 出正面频率
1
0.25
23
0.46
51
0.51
1061 2048 6019 12012
0.518 0.5069 0.5016 0.5005
试验者
蒲丰 Pearson
概率的统计定义
在一定条件下,进行n次重复试验,当n 充分大时,随机事件A出现的频率稳定在某一 数值P附近摆动。随着试验次数的增多,这种 摆动的幅度越小。我们则定义事件A的概率为 P(A)=P。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第五章概率与概率分布基础第一节什么是概率第二节概率分布第三节常用离散型随机变量分布举例第四节常用连续型随机变量分布举例为什么学习概率?概率是公共和非盈利性事业管理中最有用的数量分析方法之一.利用概率及相关知识,公共和非盈利事业的管理者可以判断和解决各种各样的问题.比如,维修机构的负责人可以运用概率来决定公共设施发生故障的频率,并依此部署维护力量.公共交通部门可以用概率来分析某一站点某一时段内可能候车人数,从而决定公共交通的车次间隔.本章内容包括一些基本的概率法则和假定.最常用的适于作定量研究的方法--抽样调查就是通过概率的理论使我们掌握一种媒介,它可以做我们推断和分析的平台.第一节什么是概率一、随机事件与概率(一)随机试验与随机事件随机现象的特点是:在条件不变的情况下,一系列的试验或观测会得到不同的结果,并且在试验或观测前不能预见何种结果将出现。
对随机现象的试验或观测称为随机试验,它必须满足以下的性质:(1)每次试验的可能结果不是唯一的;(2)每次试验之前不能确定何种结果会出现;(3)试验可在相同条件下重复进行。
比如:标准大气压下,水沸腾的温度是100度. 必然事件扔100次硬币,正面朝上的次数.随机事件.历史上曾有人做过试验,试图证明抛掷匀质硬币时,出现正反面的机会均等。
实验者n nH fn(H)De Morgan 2048 1061 0.5181Buffon 4040 2048 0.5069K. Pearson 12000 6019 0.5016K. Pearson 24000 12012 0.5005在经济与社会领域,随机命题是常见的,而必然命题是十分少见的.任何一种社会现象,社会行为其产生的原因都是复杂的,事物单个出现的时候难免有偶然性和非确定性,但是对于大量事物的研究,由于平衡与排除了单个孤立事件所具有的偶然性,从而可以发现其内部的规律性.在随机试验中(对随机现象的观察)可能出现也可能不出现,而在大量重复试验中却具有某种规律性的事件,称之为随机事件。
试验的结果可能是一个简单事件,也可能是一个复杂事件。
简单事件就是不可以再分解的事件,又称为基本事件。
复杂事件是由简单事件组合而成的事件。
基本事件还可称为样本点,设试验有n个基本事件,分别记为(i=1,2,…,n)。
集合Ω={ω1 ,ω2 , …,ωn}称为样本空间,Ω中的元素就是样本点。
例:投掷一粒均匀的六面体骰子,出现的点数有可能是1、2、3、4、5、6共六种。
这六种结果是基本结果,不可以再分解成更简单的结果了,所以Ω={1,2,3,4,5,6}为该试验的样本空间。
“出现点数是奇数”这一事件就不是简单事件,它是由基本事件{1},{3}和{5}组合而成的。
我们通常用大写字母A,B,C,…来表示随机事件,例如,设A表示“出现点数是奇数”,则A={1,3,5};设B表示“出现点数是偶数”,则B={2,4,6}。
(二)概率1. 概率的定义概率就是指随机事件发生的可能性.是对随机事件发生可能性的度量。
进行n次重复试验,随机事件A发生的次数是m次,发生的频率是m/n,当试验的次数n很大时,如果频率在某一数值p附近摆动,而且随着试验次数n的不断增加,频率的摆动幅度越来越小,则称p为事件A发生的概率,记为:P(A)=p。
在古典概型场合, 即基本事件发生的概率都一样的场合:抽球问题设合中有3个白球,2个红球,现从合中任抽2个球,求取到一红一白的概率。
解:设A-----取到一红一白答:取到一红一白的概率为3/5例:设一个袋子中装有白球2个,黑球3个。
(1) 从中随机摸出1只球,问刚好是白球的概率有多大?(2) 从中随机摸出2只球,一问2只球都是白球的概率有多大? 二问2只球一白一黑的概率有多大? 三问2只球都是黑球的概率有多大?解:(1) 由于摸出的任何1只球都形成一个基本事件,所以样本点总数为n=5。
用A表示摸出的是白球事件,则A由两个基本点组成,即A={白球,白球},m=2。
因此,刚好摸出白球的概率为P(A)=m/n=2/5=0.4(2) 由于摸出2只球才成一个基本事件,所以样本点总数为故P(A)=P(2只球都是白球)=1/ =1/10P(B)=P(2只球一白一黑)=2×3/10=6/10P(C)=P(2只球都是黑球)=3/10NOTE: P(A+B+C)=12. 概率的基本性质性质1 1≥P(A)≥0。
性质2 P(Ω)=1。
性质3 若事件A与事件B互不相容,即AB=Ф,则P(A∪B)=P(A)+P(B)。
推论1 不可能事件的概率为0,即:P(Ф)=0。
推论2 P( )=1-P(A), 表示A的对立事件,即它们二者必有一事件发生但又不能同时发生。
二、随机变量随机变量X是定义在样本空间Ω={ω1,ω2,…,ωn}上的一个函数,这个函数的取值随试验的结果不同而变化。
这个函数还要求满足条件:对任意的实数x,X<x是随机事件。
形象地理解随机地从人群中抽出3个人,观察他们的婚姻状态.这是随机试验. 随机试验结果无外乎出现这4种情况:0人单身,3人已婚1人单身,2人已婚2人单身,1人已婚3人单身,0人已婚随机事件A: “随机抽取的3人中,单身者人数”我们把用语言陈述的这4种情况,如果用随机事件A的取值情况表示就是:X1=0 (0人单身,3人已婚)X2=1 (1人单身,2人已婚)X3=2 (2人单身,1人已婚)X4=3 (3人单身,0人已婚)如果我们把“随机抽取的3人中,单身人数”看作一个变量X,那么x1,x2,x3,x4就是这个变量的各种取值.这里的变量,是与随机现象联系在一起的,因此称其为随机变量.对于一种随机试验,x1,x2,….,xn是该试验所有可能取值,并且x1,x2,…,xn之间必须满足完备性与互不相容性.如果随机变量所有可能的取值是有限的,或可排成一列的,这种随机变量称为离散型随机变量;另一种情况是随机变量的取值范围是一个区间或整个数轴,这种随机变量称为连续型随机变量。
第二节离散型随机变量的概率分布和连续型随机变量的概率密度定义若随机变量X取值x1, x2, …, xn, …且取这些值的概率依次为p1, p2, …, pn, …, 则称X为离散型随机变量,而称P{X=xk}=pk, (k=1, 2, … )为X的分布律或概率分布。
可表为X~P{X=xk}=pk, (k=1, 2, …),或…X x1 x2 …xK …Pk p1 p2 …pk …性质:(1) 0≤p(xi)≤1 (i=1,2, …);(2)定义: 离散型随机变量X的期望值为“均值”数学期望的应用:让人激动的彩票概率不仅是决策理论的出发点,它也构成了大多数机会博弈的基础。
让我们构造一个简单的博弈游戏。
参加的人花1元钱就可以玩。
扔1个硬币,如果正面朝上,这个人就赢2元,反面朝上则什么也得不到。
你会参加这个游戏吗?你作为一个地区的行政决策者会制定这样一个博弈游戏来为公共募集福利资金吗?让我们来看看 (单位元)结果概率报偿期望值正面0.5 2 1反面0.5 0 0随机变量的数学期望=0.5*2+0.5*0=1+0=1作为管理者需要做的事情,就是评估在一项博弈中,本行政区是否有利可图.也就是这次博弈的期望值.博弈的期望值就是当这项博弈进行很多次时,平均每局的期望报偿.期望值等于1说明平均来说,每人每次博弈都将得到1元.这样的彩票对于募集资金是无意义的有两种方式可以使彩票的发行者获利改变每种可能结果出现的概率结果概率报偿期望值赢0.4 2 0.8输0.6 0 0博弈的期望值=0.8改变每种选择的报偿额结果概率报偿期望值赢0.5 1.5 0.75输0.5 0 0博弈的期望值=0.75这样2种方法就可以募集资金了.但是,玩法过于简单,人们很容易看出不玩它将是更好的选择.为了克服这个困难,需要构造更复杂的博弈游戏.博弈的期望值0.1+0.5=0.6结果概率报偿期望值一等奖0.001 100 0.1二等奖0.25 2 0.5损失0.749 0 0“六合彩”就是依靠少数巨奖吸引参与结果概率报偿期望值一等0.0000003 100 万0.3元二等0.0001 1000 元0.01元三等0.10 2 元0.20元损失0.8999897 0 0整个博弈的期望值=0.51元这样的博弈游戏对玩家是否有利可图?即使期望值12元,理性的人还是不会参与一项概率图中的选择或博弈必须玩许多次,期望值才有意义,这对于政府来说不是问题,因为有数百万人买彩票.然而对于个人就成了问题.结果概率报偿期望值赢0.000001 1200万12元输0.999999 0 0为了每次得到这12元期望值,(玩几百万次,平均每次中12元),个人必须数百万次玩这种游戏,以通过参与博弈把期望值变成金钱.离散型随机变量X的方差定义: 离散型随机变量X的方差为方差的平方根σ称为标准差。
方差σ2或标准差σ反映随机变量X相对其期望值的离散程度,σ2或σ越小, 说明期望值的代表性越好;σ2或σ越大,说明期望值的代表性越差。
关于离散型随机变量分布的思考题:假想这样一个试验,某射手在一定距离上的中靶概率为p(0<p<1),他前后连续射击,直到中靶为止,用x表示他实际射击的次数,试求x的概率分布.提示:1、x的值域是1,2,3,…,k,…2、x=k就意味着前k-1次皆未中靶,而在第k枪中靶,随后停止射击,此时实际射击次数是k3、前后射击是独立事件,满足P(AB)=P(A)P(B)由于概率取值的完备性与互斥性,计算是否符合P + (1-p)p+ (1-p)2p + (1-p)3p …+….(1-p)k-1p=?p/1-(1-p)=1概率与人生哲理联系的典型案例二、连续型随机变量的概率密度性质(1) p(x)≥0(2)(3)定义: 连续型随机变量X的期望值为方差为性质:D(αX)=α2 D(X)第3节常用离散型随机变量分布举例一、(0-1)分布若以X表示进行一次试验事件A发生的次数,则称X服从(0-1)分布(两点分布)X~P{X=k}=pk(1-p)1-k, (0<p<1) k=0,1或二、贝努里试验与二项分布有时我们只对试验中某事件A是否出现感兴趣,如果A发生,我们称“成功”,否则称“失败”。
像这样只有两种结果的试验称为贝努里试验。
设A出现的概率为p,我们独立地重复进行n次贝努里试验,称为n重贝努里试验.以Bk表示n重贝努里试验中事件A正好出现k 次这一事件,则(k=0,1,2,…,n)该分布称为二项分布( q= 1- p ).NOTE:例3.从某大学到火车站途中有6个交通岗,假设在各个交通岗是否遇到红灯相互独立,并且遇到红灯的概率都是1/3.(1)设X为汽车行驶途中遇到的红灯数,求X的分布律.(2)求汽车行驶途中至少遇到5次红灯的概率.解:(1)由题意,X B(6,1/3),于是,X的分布律为:第4节常用连续型随机变量分布举例正态分布如果连续型随机变量X的密度函数为则称随机变量X服从均值为μ,方差为σ2的正态分布,记为X~N(μ,σ2)。