概率统计课件讲义2.1

合集下载

概率统计ppt

2021/8/2
10
1.1.1 随机事件及其运算
事件的运算规律 1、交换律：AB＝BA，AB＝BA 2、结合律：(AB)C＝A(BC)，(AB)C＝A(BC) 3、分配律：(AB)C＝(AC)(BC)， (AB)C＝(AC)(BC) 4、对偶(De Morgan)律：
A B A B, AB A B
第一部分概率统计基础知识
随机事件及其概率随机变量及其分布随机变量的数字特征数理统计的基本概念参数估计假设检验方差分析
2021/8/2
1
1.1 随机事件及其概率
随机事件及其运算概率的定义及其运算条件概率全概率公式与贝叶斯公式事件的独立性
2021/8/2
2
1
3 33
2 9
2 3
2021/8/2
18
1.1.2 概率的定义及其运算
一般地，把n个球随机地分配到m个盒子中去(nm) ，则每盒至多有一球的概率是：
p
Pmn mn
某班级有n 个人(n365)，问至少有两个人的生日在同一天的概率有多大？
2021/8/2
19
1.1.2 概率的定义及其运算
概率的统计定义
＝{x:1000<x<∞ (小时）}
2021/8/2
8
1.1.1 随机事件及其运算
事件之间的关系
1.包含关系 “ A发生必导致B发生”记为AB
A＝B AB且BA.
2.和事件： “事件A与B至少有一个发生”，记作
n
AB
Ai
n个事件A1, A2,…, An至少有一个发生，记作 i1
3.积事件:A与B同时发生，记作 AB＝AB
A3 :“恰有两人命中目标”:

2概率统计第二讲PPT课件

称X服从参数为(N, M, n)的超几何分布.
7. 泊松(Poisson)分布P()
X～P{X＝k}＝ k e , k＝0, 1, 2, … (0) k!
7
四、常用分布律之间的关系
1. (0－1)分布和二项分布的关系 (0－1)分布是二项分布B(n, p)中n＝1时的特款； 2. 几何分布和负二项分布的关系几何分布是负二项分布NB(r, p)中r＝1时的特款； 3. 超几何分布和二项分布的关系定理1 设在超几何分布中，n是一个取定的正整数，而 lim M ＝p, 则
N N
N l i m Ck M C Cn N n NkM＝ Ck Npk(1p)nk, k＝0, 1, 2, …, n
8
4. 二项分布和泊松分布的关系
定理2 设随机变量Xn~b(n, pn), (n＝0, 1, 2, …), 且
ln i m npn0, 为常数，则
ln i m Ck npk n(1pn)nk＝ kk !e, k＝ 0, 1, 2, …
5
三、一维离散型r.v的几个常用分布
1. 退化分布(单点分布)
X～P{X＝a}＝1，其中a为常数。
2. (0－1)分布(两点分布) X～P{X＝k}＝pk(1－p)1－k, (0<p<1) k＝0，1
3. 几何分布 X～P{X＝k}＝ (1－p)k－1 p, (0<p<1) k＝1, 2, …
4. 二项分布B(n, p)
13
七、二维离散型随机变量
1. 定义若二维随机变量(X, Y)只能取至多可列个值 (xi, yj), (i, j＝1, 2, … )，则称(X, Y)为二维离散型随机变量。
二维离散型随机变量(X, Y)的分布律，或随机变量X 与Y的联合分布律.可记为

概率统计各章节知识点总结.ppt

概率统计各章节总结
第一章
概率的计算
1）统计定义： fn ( A) n 稳定值 P( A)
2）概率的性质：1~5
3）等可能概型：P(
A)
m n
4）条件概率：P(B
A)
k m
P( AB) P( A)
独立
5）乘法定理： P( AB) P( A)P(B A) P(A)P(B)
1 P(A B)
A AB1 U AB2
1 n
n k 1
Xk
P
p
X1, X 2 , , X n , 相互独立
E( Xk ) 同分布
1
n
n k 1
Xk
P
n
X1 , X 2 , , X n , 相互独立
X k n 近似
同分布E( X k ) D( X k ) 2 k1 n
~ N (0,1)
Xn ~ B(n, p)
Xn np
X ~ N (, 2 ) Th1 X ~ N (, 2 n),
Th2
X1, X 2 , , X n (n 1)S 2 2 ~ 2(n 1) 独立
X , S 2
1n X n i1 X i
S 2
1 n1
n i 1
(Xi
X )2
X ~ t(n 1)
Sn
第六章
常用统计量及抽样分布
2统计量
6）全概率公式：P( A) P(B1 )P( A B1 ) P(B2 )P( A B2 )
7）贝叶斯公式：P(B1
A)
P(B1 )P( A B1 ) P( A)
A
B1
互斥
B2
第二章
随机变量概率分布
离散型随机变量
连续型随机变量

概率论与数理统计（茆诗松）第二章讲义（PDF）

第二章随机变量及其分布上一章研究内容：事件（集合A ）→ 概率（数）．本章将用函数研究概率，函数是数与数的关系，即需要用数反映事件——随机变量．事件（数）→ 概率（数）．§2.1 随机变量及其分布2.1.1.随机变量的概念随机试验的样本点有些是定量的：如掷骰子掷出的点数，电子元件使用寿命的小时数．有些是定性的：如掷硬币正面或反面，检查产品合格或不合格．对于定性的结果也可以规定其数量性质：如掷硬币，正面记为1，反面记为0；检查产品，合格记为1，不合格记为0．随机试验中，可将每一个样本点ω 都对应于一个实数X (ω)，称为随机变量（Random Variable ），常用大写英文字母X , Y , Z 等表示随机变量，而随机变量的具体取值通常记为小写英文字母x , y , z ．对于随机变量首先应掌握它的全部可能取值：如掷硬币，⎩⎨⎧=反面正面,0,1X ，X 的全部可能取值为0, 1；掷两枚骰子，X 表示掷出的点数之和，X 的全部可能取值为2, 3, 4, … , 12 ；观察某商店一小时内的进店人数X ，X 的全部可能取值为0, 1, 2, … ；电子元件使用寿命，用X 表示使用的小时数，X 的全部可能取值为 ),0[∞+；一场足球比赛（90分钟），用X 表示首次进球时间（分钟），若为0:0，记X = 100，X 的全部可能取值为 (0, 90 )∪{100}；注意：1. 每个样本点都必须对应于一个实数，2．不同样本点可以对应于同一个实数，3．随机变量的每一取值或取值范围都表示一个事件．应掌握将随机变量的取值或取值范围描述为事件，又能将事件用随机变量表达的方法．例掷一枚骰子，用X 表示出现的点数，则 X = 1表示出现1点；X > 4表示点数大于4，即出现5点或6点；X ≤ 0为不可能事件．又出现奇数点，即X = 1, 3, 5；点数不超过3，即X ≤ 3．例 X 表示商店一天中某商品的销售件数（顾客的需求件数），则 X = 0表示没有销售；X ≤ 10表示销售不超过10件．又销售5件以上（不含5件）即X > 5；若该商店准备了a 件该商品，事件“能满足顾客需要”，即X ≤ a ．例 X 表示一只电子元件的使用寿命（小时），则 X = 1000表示该元件恰好使用了1000小时，X ≥ 800表示该元件使用寿命在800小时以上．例 90分钟足球比赛，X 表示首次进球时间（分钟），且0:0时，记X = 100，则 X = 10表示上半场第10分钟首次进球．又上半场不进球即X > 45；开场1分钟内进球即X ≤ 1．如果随机变量X 的全部可能取值是有限个或可列个，则称为离散型随机变量．（注：可列个即可以排成一列，一个一个往下数，如非负整数0, 1, 2, 3, … ）离散型随机变量的全部可能取值是实数轴上一些离散的点，而连续型随机变量的全部可能取值是实数轴上一个区间或多个区间的并，如电子元件使用寿命X （小时），全部可能取值是),0[∞+．下面按离散型和连续型分别进行讨论．2.1.2. 离散随机变量的概率分布列对于随机变量还应该掌握它的每一取值或取值范围表示事件的概率．定义如果随机变量X 的全部可能取值是有限个或可列个，则称为离散型随机变量．设离散型随机变量X 的全部可能取值为x 1, x 2, …, x k , …，则X 取值x k 的概率p k = p (x k ) = P {X = x k }, k = 1, 2, …… 称为离散型随机变量的概率分布函数（Probability Distribution Function ，PDF ），简称概率分布或概率函数．直观上，又写为L LLL)()()(2121k kx p x p x p Px x x X 或 ⎟⎟⎠⎞⎜⎜⎝⎛L L L L)()()(~2121k k x p x p x p x x x X ，称为X 的概率分布列．如掷一枚骰子，X 表示出现的点数，X 的分布列为616161616161654321PX ．概率函数基本性质：（1）非负性 p (x k ) ≥ 0 , k = 1, 2, ……；（2）正则性1)(1=∑∞=k kxp ．这是因为事件X = x 1 , X = x 2 , … , X = x k , … 是一个完备事件组，故P {X = x 1} + P {X = x 2} + … + P {X = x k } + … = P (Ω) = 1，即p (x 1) + p (x 2) + … + p (x k ) + … = 1．例设盒中有2个红球3个白球，从中任取3球，以X 表示取得的红球数．求X 的分布列．解：X 的全部可能取值0, 1, 2 ，样本点总数为1035=⎟⎟⎠⎞⎜⎜⎝⎛=n ，X = 0表示“取到3个白球”，所含样本点个数为1330=⎟⎟⎠⎞⎜⎜⎝⎛=k ，有1.0101)0(==p ， X = 1表示“取到1个红球2个白球”，所含样本点个数为612231=⎟⎟⎠⎞⎜⎜⎝⎛⎟⎟⎠⎞⎜⎜⎝⎛=k ，有6.0106)1(==p ， X = 2表示“取到2个红球1个白球”，所含样本点个数为322132=⎟⎟⎠⎞⎜⎜⎝⎛⎟⎟⎠⎞⎜⎜⎝⎛=k ，有3.0103)2(==p ．故X 的分布列为3.06.01.0210P X．求离散型随机变量X 的概率分布步骤：（1）找出X 的全部可能取值，（2）将X 的每一取值表示为事件，（3）求出X 的每一取值的概率．例现有10件产品，其中有3件不合格．若不放回抽取，每次取一件，直到取得合格品为止．用X 表示抽取次数，求X 的概率分布．解：X 的全部可能取值1, 2, 3, 4 ，X = 1表示“第1次就取得合格品”，有107)1(=p ， X = 2表示“第2次取得合格品且第1次是不合格品”，有30797103)2(=⋅=p ， X = 3表示“第3次取得合格品且前两次是不合格品”，有12078792103)3(=⋅⋅=p ， X = 4表示“第4次取得合格品且前三次是不合格品”，有1201778192103)4(=⋅⋅⋅=p ，故X 的分布列为120112073071074321PX ．例上例若改为有放回地抽取，又如何？解：X 的全部可能取值1 , 2 , … , n , … ，7.0107)1(==p ，21.0107103)2(=⋅=p ，7.03.0)3(2×=p ，…，7.03.0)(1×=−k k p ，…，故X 的概率函数为L ,2,1,7.03.0)(1=×=−k k p k ；X 的分布列为LL L L 7.03.07.03.021.07.032112××−k PkX ．例若离散型随机变量的概率函数为kCk p =)(，k = 1, 2, 3, 4，且C 为常数．求：（1）C 的值，（2）P {X = 3}，（3）P {X < 3}．解：（1）由正则性知：1432)4()3()2()1(=+++=+++CC C C p p p p ，即11225=C ，故2512=C ．（2）254)3(}3{===p X P ，（3）25182562512)2()1(}3{=+=+=<p p X P ． 2.1.3.随机变量的分布函数连续型随机变量在单个点取值概率为零，如电子元件使用寿命恰好为1000小时这个事件的概率就等于零，因此连续型随机变量不能考虑概率函数．为了用单独一个变量表示一个区间，特别地取区间 (−∞, x ]．定义随机变量X 与任意实数x ，称F (x ) = P {X ≤ x }，−∞ < x < +∞为X 的累积分布函数（Cumulative Distribution Function ，CDF ），简称分布函数．P {a < X ≤ b } = P {X ≤ b } − P {X ≤ a } = F (b ) − F (a )，P {X > a } = 1 − P {X ≤ a } = 1 − F (a )，由概率的连续性知)0()(lim }{lim }{−==≤=<−−→→a F x F x X P a X P ax ax ，且P {X = a } = P {X ≤ a } − P {X < a } = F (a ) − F (a – 0)，可见X 在任一区间上或任一点取值的概率都可用分布函数表示．例已知随机变量X 的分布列为3.05.02.0210PX ，求X 的分布函数．解：X 的全部可能取值为0, 1, 2，当x < 0时，F (x ) = P {X ≤ x } = P (∅) = 0，当0 ≤ x < 1时，F (x ) = P {X ≤ x } = p (0) = 0.2，当1 ≤ x < 2时，F (x ) = P {X ≤ x } = p (0) + p (1) = 0.7，当x ≥ 2时，F (x ) = P {X ≤ x } = P (Ω ) = 1，故⎪⎪⎩⎪⎪⎨⎧≥<≤<≤<=.2,1,21,7.0,10,2.0,0,0)(x x x x x F若离散型随机变量的全部可能取值为x 1, x 2, ……，概率函数p (x k ) = p k ，k = 1, 2, ……，则分布函数∑≤=≤=xx kk xp x X P x F )(}{)(．且离散型随机变量的分布函数F (x )是单调不减的阶梯形函数，X 的每一可能取值x k 是F (x )的跳跃点，跳跃高度是相应概率p (x k )．例已知某离散型随机变量X 的分布函数为⎪⎪⎪⎩⎪⎪⎪⎨⎧≥<≤<≤<≤−−<=,5,1,52,6.0,20,4.0,01,3.01,0)(x x x x x x F 求X 的分布列．解：X 的全部可能取值是F (x )的跳跃点，即 −1, 0, 2, 5，跳跃高度依次为：p (−1) = 0.3 − 0 = 0.3； p (0) = 0.4 − 0.3 = 0.1； p (2) = 0.6 − 0.4 = 0.2； p (5) = 1 − 0.6 = 0.4．故X 的分布列为4.02.01.03.05201PX −．分布函数的基本性质：（1）单调性，F (x ) 单调不减，即x 1 < x 2时，F (x 1) ≤ F (x 2)；（2）正则性，F (−∞) = 0，F (+∞) = 1；（3）连续性，F (x ) 右连续，即)()(lim 00x F x F x x =+→．证：（1）当x 1 < x 2时，{X ≤ x 1} ⊂ {X ≤ x 2}，有F (x 1) ≤ F (x 2)；（2）F (−∞) = P {X < −∞} = P (∅) = 0，F (+∞) = P {X < +∞} = P (Ω ) = 1；（3）任取单调下降且趋于x 0的数列{x n }，有}{}{}{lim 01x X x X x X n n n n ≤=≤=≤∞=∞→I ，根据概率的连续性知}{}{}{lim 01x X P x X P x X P n n n n ≤=⎟⎟⎠⎞⎜⎜⎝⎛≤=≤∞=∞→I ，即)()(lim 00x F x F x x =+→．但F (x )不一定左连续，任取单调增加且趋于x 0的数列{x n }，有}{}{}{lim 01x X x X x X n n n n <=≤=≤∞=∞→U ，得}{}{}{lim 01x X P x X P x X P n n n n <=⎟⎟⎠⎞⎜⎜⎝⎛≤=≤∞=∞→U ，故}{)(}{)(lim 0000x X P x F x X P x F x x =−=<=−→．2.1.4. 连续随机变量的概率密度函数离散型随机变量的全部可能取值是有限或可列个点，连续型随机变量的全部可能取值是实数区间．但连续型随机变量在单独一个点取值的概率为0，其概率函数无实际意义，对于连续随机变量通常考虑其在某个区间上取值的概率，这就需要讨论分布函数．连续型随机变量的分布函数是连续函数．注意：概率为0的事件不一定是不可能事件．定义随机变量X 的分布函数F (x )，若存在函数p (x )，使 ∫∞−=xdu u p x F )()(，则称X 为连续型随机变量，p(x )为X 的概率密度函数（可以理解为：p (u )为概率密度，p (u )du 为X 在该小区间内取值的概率，∫∞−x 为从−∞ 到x 无限求和．几何意义：在平面上作出密度函数p (x )的图形，则阴影部分的面积即为F (x )的值．密度函数基本性质：（1）非负性 p (x ) ≥ 0；（2）正则性 1)(=∫∞+∞−dx x p ．因)()(x F du u p x =∫∞−，有1)()(=+∞=∫∞+∞−F dx x p ．连续型随机变量的性质：设连续型随机变量X 的概率密度函数为p (x )，分布函数为F (x )，则有（1）∫=−=≤<21)()()(}{1221x x dx x p x F x F x X x P ；（2）当p (x ) 连续时，p (x ) = F ′(x )；因∫∞−=x du u p x F )()(，当p (x ) 连续时，有)(])([)(x p du u p x F x=′=′∫∞−（3）X 在单独一个点取值的概率为0，其分布函数为连续函数；（4）P {x 1 < X ≤ x 2} = P {x 1 ≤ X ≤ x 2} = P {x 1 < X < x 2} = P {x 1 ≤ X < x 2}，即连续型．．．随机变量在某区间内的概率与区间开闭无关，离散型则不成立；（5）只在有限个点上取值不相同的密度函数对应于同一个分布函数，一般，只在概率为0的数集上取值不相同的密度函数都对应于同一个分布函数．例设F (x ) = A + B arctan x 为某连续型随机变量X 的分布函数．求：（1）A , B ；（2）}31{≤≤−X P ；（3）密度函数p (x )．解：（1）由正则性 F (−∞) = 0，F (+∞) = 1，得：02π)arctan (lim =−=+−∞→B A x B A x ，12π)arctan (lim =+=++∞→B A x B A x ，故21=A ，π1=B ；（2）x x F arctan π121)(+=，得1274ππ1213ππ121)1()3(}31{=⎥⎦⎤⎢⎣⎡⎟⎠⎞⎜⎝⎛−⋅+−⎟⎠⎞⎜⎝⎛⋅+=−−=≤≤−F F X P ．（3）密度函数)1π(1)()(2x x F x p +=′=．例已知⎩⎨⎧<<−=,,0,10),()(32其它x x x C x p是某连续型随机变量X 的密度函数，求：（1）C ，（2）}211{<<−X P ，（3）分布函数F (x )．解：（1）由正则性：1)(=∫∞+∞−dx x p ，得1120)4131()43()(10431032==−−=−=−∫C C x x C dx x x C ，故C = 12；（2）165)641241(12)43(12)(12)(}211{2104321032211=−=−=−==<<−∫∫−x x dx x x dx x p X P ；（3）X 的全部可能取值为 [0, 1]，分段点0, 1，当x < 0时，0)()(==∫∞−xdu u p x F ，当0 ≤ x < 1时，4304303234)43(12)(12)()(x x u u du u u du u p x F xxx−=−=−==∫∫∞−，当x ≥ 1时， 1)(12)()(132=−==∫∫∞−du u u du u p x F x，故⎪⎩⎪⎨⎧≥<≤−<=.1,1,10,34,0,0)(43x x x x x x F例已知⎩⎨⎧<<−=,,0,11|,|)(其它x x x p是某连续型随机变量X 的密度函数，求分布函数F (x )．解：分段点−1, 0, 1，当x < −1时，0)()(==∫∞−xdu u p x F ；当−1 ≤ x < 0时， 212122)()()(22121x x u du u du u p x F xxx−=+−=−=−==−−∞−∫∫；当0 ≤ x < 1时，21221022)()()(220212001x x u u udu du u du u p x F xxx+=++=+−=+−==−−∞−∫∫∫；当x ≥ 1时， 1)()()(101=+−==∫∫∫−∞−udu du u du u p x F x．故⎪⎪⎪⎩⎪⎪⎪⎨⎧≥<≤+<≤−−<=.1,1,10,21,01,21,0,0)(22x x x x xx x F§2.2 随机变量的数学期望对于随机变量，还应当掌握反映其平均值、分散程度等的指标，这就需要引入数学期望和方差等概念． 2.2.1.数学期望的概念例甲、乙两个射击选手，在射击训练中甲射了10次，其中3次10环，1次9环，4次8环，2次7环；乙射了15次，其中2次10环，9次9环，2次8环，2次7环．问谁的表现更好？分析：比较他们射中的平均环数甲共射中3 × 10 + 1 × 9 + 4 × 8 + 2 × 7 = 85环，平均每次射中5.81085=环；乙共射中2 × 10 + 9 × 9 + 2 × 8 + 2 × 7 = 131环，平均每次射中73.815131=&环．故乙的表现更好．一般地，若在n 次试验中，出现了m 1次x 1，m 2次x 2，…，m k 次x k ，（其中m 1 + m 2 + … + m k = n ），则平均值为∑==+++ki i i k k n mx n x m x m x m 12211L ，即平均值等于取值与频率乘积之和．因n 很大时，频率稳定在概率附近，即平均值将稳定在取值与概率乘积之和附近． 2.2.2.数学期望的定义定义设离散型随机变量X 的分布列是⎟⎟⎠⎞⎜⎜⎝⎛L L L L )()()(~2121k kx p x p x p x x x X ，如果级数∑∞=1)(k k k x p x 绝对收敛，则称之为X 的数学期望（Expectation ），记为E (X )．数学期望的实际意义是反映随机变量的平均取值，是其全部可能取值以相应概率为权数的加权平均．如X 的分布列为⎟⎟⎠⎞⎜⎜⎝⎛−2.04.01.03.04102，则E (X) = (−2) × 0.3 + 0 × 0.1 + 1 × 0.4 + 4 × 0.2 = 0.6．例某人有4发子弹，现在他向某一目标射击，若命中目标就停止射击，否则直到子弹用完为止．设每发子弹命中率为0.4，以X 表示射击次数，求E (X )．解：先求X 的分布列，X 的全部可能取值为1, 2, 3, 4，X = 1，第一枪就命中， p (1) = 0.4；X = 2，第一枪没有命中，第二枪命中，p (2) = 0.6 × 0.4 = 0.24； X = 3，前两枪没有命中，第三枪命中，p (3) = 0.6 2 × 0.4 = 0.144； X = 4，前三枪没有命中， p (4) = 0.6 3 = 0.216．则X 的分布列为⎟⎟⎠⎞⎜⎜⎝⎛216.0144.024.04.04321，故E (X ) = 1 × 0.4 + 2 × 0.24 + 3 × 0.144 + 4 × 0.216 = 2.176．例若X 的概率函数为L ,2,1,21)2(==⎟⎟⎠⎞⎜⎜⎝⎛−k kp k k，求E (X )．解：因∑∑∞=∞=−=⋅−11)1(21)2(k kk k k k k 收敛但不是绝对收敛，故E (X ) 不存在．离散型随机变量的数学期望是取值乘概率求和：∑∞=1)(k k k x p x ，类似可定义连续型随机变量的数学期望是取值乘密度积分：∫+∞∞−dx x xp )(．定义设连续型随机变量X 的密度函数为p (x )．如果广义积分∫+∞∞−dx x xp )(绝对收敛，则称之为X 的数学期望，记为E (X )．例已知连续型随机变量X 的密度函数为⎩⎨⎧<<=.,0,10,2)(其它x x x p 求E (X )．解：32322)()(1310=⋅=⋅==∫∫∞+∞−x xdx x dx x xp X E ．例已知X 的密度函数为⎩⎨⎧<<+=.,0,20,)(其它x bx a x p 且32)(=X E ，求a , b ．解：由正则性得122)2()()(2220=+=⋅+=+=∫∫∞+∞−b a x b ax dx bx a dx x p ，又32382)32()()()(20322=+=⋅+⋅=+==∫∫∞+∞−b a x b x a dx bx a x dx x xp X E ，故21,1−==b a ．例已知X 的密度函数为+∞<<∞−+=x x x p ,)1π(1)(2，求E (X )．解：因+∞∞−+∞∞−+∞∞−+∞∞−+=⋅+=+=∫∫∫)1ln(π21)(21)1π(1)1π()(2222x x d x dx x x dx x xp 发散，故E (X )不存在． 2.2.3.数学期望的性质设X 为随机变量，g (x ) 为函数，则称Y = g (X ) 为随机变量函数，Y 也是一个随机变量．下面不加证明地给出随机变量函数的数学期望计算公式．定理设X 为随机变量，Y = g (X ) 为随机变量函数，则（1）若X 为离散型随机变量，概率函数为p(x k ), k = 1, 2, …，则∑∞===1)()()]([)(k k k x p x g X g E Y E ；（2）若X 为连续型随机变量，密度函数为p (x )，则∫+∞∞−==dx x p x g X g E Y E )()()]([)(．数学期望具有以下性质：（1）常数的期望等于其自身，即E (c ) = c ；（2）常数因子可移到期望符号外，即E (aX ) = a E (X )；（3）随机变量和的期望等于期望的和，即E [g 1 (X ) + g 2 (X )] = E [g 1 (X )] + E [g 2 (X )]．证明：（1）将常数c 看作是单点分布p (c ) = 1，故E (c ) = c p (c ) = c ；（2）以连续型为例加以证明，)()()()(X aE dx x xp a dx x axp aX E ===∫∫+∞∞−+∞∞−；（3）以连续型为例加以证明，∫∫∫+∞∞−+∞∞−+∞∞−+=+=+dx x p x g dx x p x g dx x p x g x g X g X g E )()()()()()]()([)]()([212121= E [g 1 (X )] + E [g 2 (X )]．由性质（2）、（3）知随机变量线性组合的期望等于期望的线性组合，可见数学期望具有线性性质．例设X 的分布列为⎟⎟⎠⎞⎜⎜⎝⎛−3.04.01.02.02101，求E (2X +1)，E (X 2)．解：E (2X +1) = −1 × 0.2 + 1 × 0.1 + 3 × 0.4 + 5 × 0.3 = 2.6；E (X 2) = 1 × 0.2 + 0 × 0.1 + 1 × 0.4 + 4 × 0.3 = 1.8．例已知圆的半径X 是一个随机变量，密度函数为⎪⎩⎪⎨⎧<<=.,0,31,21)(其他x x p 求圆面积Y 的数学期望．解：圆面积Y = π X 2，故3π1332π21π)(π)(3133122=⋅=⋅==∫∫∞+∞−xdx x dx x p x Y E ．例设国际市场对我国某种出口商品的需求量X （吨）的密度函数为⎪⎩⎪⎨⎧<<=.,0,40002000,20001)(其他x x p 设每售出一吨，可获利3万美元，但若销售不出，每积压一吨将亏损1万美元，问如何计划年出口量，能使国家获利的期望最大．解：设计划年出口量为a 吨，每年获利Y 万美元．当X ≥ a 时，销售a 吨，获利3a 万美元；当X < a 时，销售X 吨，积压a − X 吨，获利3X − (a − X ) = 4X − a 万美元；即⎩⎨⎧<≤−≤≤==.2000,4,4000,3)(a X a X X a a X g Y则4000200024000200020003)2(2000120001320001)4()()()(aa a a x a ax x dx a dx a x dx x p x g Y E +−=⋅+⋅−==∫∫∫+∞∞− 8250)3500(10001400071000122+−−=−+−=a a a ，故计划年出口量为3500吨时，使国家获利的期望最大．§2.3 随机变量的方差与标准差数学期望反映平均值，方差反映波动程度．如甲、乙两台包装机，要求包装重量为每袋500克，现各取5袋，重量为甲：498，499，500，501，502；乙：490，495，500，505，510．二者平均值相同都是500克，但显然甲比乙好．此时比较的是它们的偏差（即取值与平均值之差）．偏差：甲：−2，−1，0，1，2；乙：−10，−5，0，5，10． 2.3.1.方差的定义定义随机变量X 与其数学期望E (X ) 之差X − E (X ) 称为偏差．偏差有大有小，可正可负，比较时需要去掉符号，但绝对值函数进行微积分处理不方便，因此考虑偏差平方的数学期望．定义随机变量X ，若E [X − E (X )]2存在，则称之为X 的方差（Variance ），记为Var (X ) 或D (X )．即Var (X ) = E [X − E (X )]2．显然方差Var (X ) ≥ 0，称)Var(X 为X 的标准差（Standard Deviation ）．在实际问题中，标准差与随机变量有相同的量纲．方差与标准差反映波动程度．方差越大，取值越分散；方差越小，取值越集中．例设X 的分布列为⎟⎟⎠⎞⎜⎜⎝⎛4.04.02.0321，求E (X ), Var (X )．解：E (X ) = 1 × 0.2 + 2 × 0.4 + 3 × 0.4 = 2.2；Var (X ) = (−1.2)2 × 0.2 + (−0.2)2 × 0.4 + 0.82 × 0.4 = 0.56．例已知X 的密度函数为⎩⎨⎧<<=.,0,10,2)(其他x x x p求E (X ), Var (X )．解：32322)()(1310=⋅=⋅==∫∫∞+∞−x xdx x dx x xf X E ； 181949821949842)98382()()32()Var(1023410232=+−=⎟⎠⎞⎜⎝⎛+−=+−=−=∫∫∞+∞−x x x dx x x x dx x p x X ．例已知X 的全部可能取值为0, 1, 2，且E (X ) = 1.3，Var (X ) = 0.81．求X 的分布列．解：设X 的分布列为⎟⎟⎠⎞⎜⎜⎝⎛c b a 210，由正则性得：a + b + c = 1，且E (X ) = 0 × a + 1 × b + 2 × c = b + 2c = 1.3，Var (X ) = (−1.3)2 × a + (−0.3)2 × b + 0.72 × c = 1.69a + 0.09b + 0.49c = 0.81，解得a = 0.3，b = 0.1，c = 0.6，故X 的分布列为⎟⎟⎠⎞⎜⎜⎝⎛6.01.03.0210．2.3.2. 方差的性质方差具有以下性质：（1）方差计算公式：Var (X ) = E (X 2) − [E (X )]2；（2）常数的方差等于零，即Var (c ) = 0；（3）设a , b 为常数，则Var (a X + b ) = a 2 Var (X )．证：（1）Var (X ) = E [X − E (X )]2 = E [X 2 − 2X ⋅ E (X ) + E (X )2] = E (X 2 ) − 2E (X ) ⋅ E (X ) + [E (X )]2．= E (X 2) − [E (X )]2；（2）Var (c ) = E [c − E (c )]2 = E (c − c )2 = E (0) = 0；（3）Var (a X + b ) = E [(a X + b ) − E (a X + b )]2 = E [a X + b − a E (X ) − b ]2 = a 2 E [X − E (X )]2 = a 2 Var (X )．由性质（1），显然有以下推论：推论对于随机变量X ，如果E (X 2) 存在，则E (X 2) ≥ [E (X )]2．以后常利用方差计算公式Var (X ) = E (X 2) − [E (X )]2计算随机变量的方差．通常用公式计算比直接用定义计算方差要方便．例设X 的分布列为⎟⎟⎠⎞⎜⎜⎝⎛4.04.02.0321，求Var (X )．解：前面已求得E (X ) = 2.2，因E (X 2) = 1 2 × 0.2 + 2 2 × 0.4 + 3 2 × 0.4 = 5.4，故Var (X ) = E (X 2) − [E (X )]2 = 5.4 − 2.22 = 0.56．例已知X 的密度函数为⎩⎨⎧<<=.,0,10,2)(其他x x x p 求Var (X )．解：前面已求得32)(=X E ，因21422)(141022=⋅=⋅=∫x xdx x X E ，故1813221)]([)()Var(222=⎟⎠⎞⎜⎝⎛−=−=X E X E X ．对于随机变量X ，若方差Var (X ) 存在，且Var (X ) > 0．令)Var()(*X X E X X −=，有0)]()([)Var(1)]([)Var(1)Var()(*)(=−=−=⎟⎟⎠⎞⎜⎜⎝⎛−=X E X E X X E X E X X X E X E X E ； 1)Var()Var(1)](Var[)Var(1)Var()(Var *)Var(==−=⎟⎟⎠⎞⎜⎜⎝⎛−=X X X E X X X X E X X ．称X *为X 的标准化随机变量．2.3.3. 切比雪夫不等式方差反映随机变量的分散程度，切比雪夫不等式给出其定量标准．切比雪夫不等式表明大偏差概率的上限与方差成正比．定理设X 为随机变量，且方差Var (X ) 存在，则对于任何正数ε ，都有2)Var(}|)({|εεX X E X P ≤≥−．证明：以连续型随机变量为例证明，设X 的密度函数为p (x )，有∫≥−=≥−εε|)(|)(}|)({|X E x dx x p X E X P ，且∫∞+∞−−=−=dx x p X E x X E X E X )()]([)]([1)Var(22222εεε，故222|)(|22)Var()()]([)()]([}|)({|εεεεεX dx x p X E x dx x p X E x X E X P X E x =−≤−≤≥−∫∫∞+∞−≥−，得证．注：切比雪夫不等式的等价形式2)Var(1}|)({|εεX X E X P −≥<−．如随机变量X 的数学期望为E (X ) = 10，方差Var (X ) = 1，则由切比雪夫不等式可得43211}2|10{|}128{2=−≥<−=<<X P X P ．例设随机变量X 的全部可能取值为),0[∞+，且数学期望E (X ) 存在，试证：对任何正数a ，都有)(1}{X E aa X P ≤≥．证明：以连续型随机变量为例证明，设X 的密度函数为p (x )，有∫+∞=≥a dx x p a X P )(}{，且∫∫+∞+∞∞−==0)()(1)(1dx x p a x dx x xp a X E a ，故)(1)()(}{0X E adx x p a x dx x p a x a X P a =≤≤≥∫∫+∞+∞，得证．定理设随机变量X 的方差存在，则Var (X ) = 0的充分必要条件是存在常数b ，使得X 几乎处处收敛于b ，即P {X = b } = 1．证：充分性，设存在常数b ，使得P {X = b } = 1，有P {X ≠ b } = 0，即E (X ) = b P {X = b } = b ，故Var (X ) = E [X − E (X )]2 = E (X − b )2 = 0 × P {X = b } = 0；必要性，设X 的方差Var (X ) = 0，因事件U +∞=+∞→⎭⎫⎩⎨⎧≥−=⎭⎬⎫⎩⎨⎧≥−=>−11|)(|lim 1|)(|}0|)({|n n n X E X n X E X X E X ，则01)Var(lim 1|)(|lim 1|)(|}0|)({|21=⎟⎠⎞⎜⎝⎛≤⎭⎬⎫⎩⎨⎧≥−=⎟⎟⎠⎞⎜⎜⎝⎛⎭⎬⎫⎩⎨⎧≥−=>−+∞→+∞→+∞=n X n X E X P n X E X P X E X P n n n U ，可得P {| X − E (X )| > 0} = 0，即P {| X − E (X )| = 0} = 1，取b = E (X )，有b 为常数，故P {X = b } = 1．注：如果P {X = b } = 1，记为X = b , a.e.（或a.s.），称为X = b 几乎处处成立（或几乎必然成立）．这里，a.e.就是almost everywhere 的缩写，a.s.就是almost surely 的缩写．意味着不成立的情况是一个测度（或概率）等于零的集合（或事件）．§2.4 常用离散分布对于一个给定的函数，只要满足概率函数的两条基本性质：非负性、正则性，都可以成为某个离散随机变量的概率函数．但绝大多数在实际工作中并不常见，下面是几种常用的概率函数． 2.4.1.两点分布与二项分布一．两点分布两点分布只可能在两个点取值，通常就是0或1．定义随机变量的可能取值只有两个：0或1，且概率函数为p (0) = 1 − p ，p (1) = p ，其中0 0，p (1) = p > 0；正则性：(1 − p ) + p = 1．两点分布的数学期望为E (X ) = 0 × (1 − p ) + 1 × p = p ．又因E (X 2 ) = 02 × (1 − p ) + 12 × p = p ，故方差为Var (X ) = E (X 2 ) − [E (X )]2 = p − p 2 = p (1 − p )．二．二项分布在n 重伯努利试验中，以X 表示事件A 的发生次数，则X 的全部可能取值为0, 1, 2, …, n ，且kn k p p k n k X P −−⎟⎟⎠⎞⎜⎜⎝⎛==)1(}{．定义若离散型随机变量X 的概率函数为kn k p p k n k p −−⎟⎟⎠⎞⎜⎜⎝⎛=)1()(， k = 0, 1, 2, …, n ；0 −⎟⎟⎠⎞⎜⎜⎝⎛=−kn k p p k n k p ；正则性：1)]1([)1()(11=−+=−⎟⎟⎠⎞⎜⎜⎝⎛=∑∑=−=nnk k n k nk p p p p k n k p ．例掷三枚硬币，X 表示正面朝上的次数，求X 的概率分布．解：X 的全部可能取值为0, 1, 2, 3 ，将掷每一枚硬币看作一次试验．每次试验两种结果：正面A ，反面A ；每次试验相互独立；每次试验概率5.0)(=A P ．即n 重伯努利试验，n = 3，5.0=p ，有X ~ b (3, 0.5)，p (0) = 0.5 3 = 0.125，375.05.05.013)1(21=××⎟⎟⎠⎞⎜⎜⎝⎛=p ， 375.05.05.023)2(12=××⎟⎟⎠⎞⎜⎜⎝⎛=p ， p (3) = 0.5 3 = 0.125．例现有5台机床，每台机床一小时内平均开动18分钟，且是否开动相互独立，以X 表示同一时刻开动的机床数，求X 的概率分布．解：X 的全部可能取值为0, 1, 2, 3, 4, 5 ，将每台机床是否开动看作一次试验．每次试验两种结果：开动A ，不开动A ；每次试验相互独立；每次试验概率P (A ) = 0.3．即n 重伯努利试验，n = 5，p = 0.3，有X ~ b (5, 0.3)．p (0) = 0.7 5 = 0.16807，36015.07.03.015)1(41=××⎟⎟⎠⎞⎜⎜⎝⎛=p ， 3087.07.03.025)2(32=××⎟⎟⎠⎞⎜⎜⎝⎛=p ， 1323.07.03.035)3(23=××⎟⎟⎠⎞⎜⎜⎝⎛=p ， 02835.07.03.045)4(14=××⎟⎟⎠⎞⎜⎜⎝⎛=p ， p (5) = 0.3 5 = 0.00243 ．一般地，如果随机变量X 服从二项分布，概率函数值p (k ) 将随着k 的增加，先逐渐增加，达到最大值后，又逐渐减少．通常，一个随机变量X 的概率函数或密度函数的最大值点称为X 的最可能值．二项分布b (n , p )的最可能值为⎩⎨⎧+−++++=.)1(,1)1()1(,)1(],)1[(0是正整数时当或不是正整数时当p n p n p n p n p n k 这里[x ]表示不超过x 的最大整数．如[2.3] = 2，[3.14] = 3，[−1.2] = −2．证：若X ~ b (n , p )，有n k p p k n k n p p k n k p k n k kn k ≤≤−−=−⎟⎟⎠⎞⎜⎜⎝⎛=−−0,)1()!(!!)1()(，则11)1()!1()!1(!)1()!(!!)1()(+−−−−+−−−−−=−−k n k k n k p p k n k n p p k n k n k p k p ⎟⎠⎞⎜⎝⎛+−−−⋅−−−=−−11)1()!()!1(!1k n p k pp p k n k n k n k)1()1()1()!()!1(!1+−−+⋅−−−=−−k n k k p n p p k n k n k n k ，当k < (n + 1) p 时，有p (k ) > p (k − 1)；当k > (n + 1) p 时，有p (k ) p (k 0 − 1)；且k 0 + 1 > (n + 1) p ，即p (k 0 + 1) < p (k 0)．故p (k 0) 为最大值．如果(n + 1) p 是正整数，取k 0 = (n + 1) p ，即p (k 0) = p (k 0 − 1)，故p (k 0) 和p (k 0 − 1) 都是最大值．如X ~ B (3, 0.5)，有(n + 1) p = 4 × 0.5 = 2是正整数，最可能值k 0 = 2或1；X ~ B (5, 0.3)，有(n + 1) p = 6 × 0.3 = 1.8不是正整数，最可能值k 0 = [1.8] = 1．三．二项分布的数学期望和方差组合数公式⎟⎟⎠⎞⎜⎜⎝⎛−−⋅=−⋅−−⋅=−⋅=⎟⎟⎠⎞⎜⎜⎝⎛11)!()!1()!1()!(!!k n k n k n k n k n k n k n k n ，（n ≥ k > 0）．二项分布b (n , p )的数学期望为∑∑∑=−−=−=−−⎟⎟⎠⎞⎜⎜⎝⎛−−=−⎟⎟⎠⎞⎜⎜⎝⎛−−⋅⋅=−⎟⎟⎠⎞⎜⎜⎝⎛⋅=nk k n k n k kn k nk k n k p p k n np p p k n k n k p p k n k X E 1110)1(11)1(11)1()( = np [ p + (1 − p )]n − 1 = np ．又因∑∑∑=−=−=−−⎟⎟⎠⎞⎜⎜⎝⎛⋅+−⎟⎟⎠⎞⎜⎜⎝⎛−−⋅−=−⎟⎟⎠⎞⎜⎜⎝⎛⋅=nk k n k n k k n k nk k n k p p k n k p p k n k k p p k n k X E 002022)1()1(11)()1()( )()1(22)1()1()(22X E p p k n k k n n k k nk k n k+−⎟⎟⎠⎞⎜⎜⎝⎛−−−−⋅−=∑=− np p p k n pn n nk kn k +−⎟⎟⎠⎞⎜⎜⎝⎛−−−=∑=−−222)1(22)1( = n (n − 1) p 2 [ p + (1 − p )]n − 2 + np = (n 2 − n ) p 2 + np ，故方差为Var (X ) = E (X 2 ) − [E (X )]2 = (n 2 − n ) p 2 + np − (np )2 = − np 2 + np = np (1 − p )．2.4.2.泊松分布一．泊松分布泊松分布是一种理论推导的极限分布（成立的条件和推导过程见附录）．定义若随机变量X 的概率函数为λλ−=e !)(k k p k， k = 0, 1, 2, …… ；λ > 0，则称X 服从参数为 λ 的泊松分布（Poisson’s Distribution ），记为X ~ P (λ)．泊松分布的实际背景是已知平均发生次数为常数λ ，实际发生次数的概率分布．如足球比赛进球数，商店进店人数，电话接听次数等．非负性：λ > 0时，0e !>−λλk k；正则性：1e e e !=⋅=⋅−∞=−∑λλλλk kk ．例已知一场足球比赛的进球数X 服从参数λ = 2.3的泊松分布，求比分为0:0, 1:0以及总进球数超过5个的概率．解：因X ~ P(2.5)，则3.2e !3.2)(−=k k p k ， k = 0, 1, 2, ……．比分0:0，即X = 0，100.0e e !03.2)0(3.23.20===−−p （查表）；比分1:0，即X = 1，231.0100.0331.0e 3.2e !13.2)1(3.23.21=−===−−p （查表）；总进球数超过5个，即X > 5，030.0970.01e !3.21e!3.2}5{53.263.2=−=−==>∑∑=−∞=−k k k k k k X P （查表）．例已知某公用电话每小时内打电话的人数X 服从参数为λ = 8的泊松分布．求某一小时内无人打电话的概率，恰有10人打电话的概率，至少有10人打电话的概率．解：因X ~ P(8)，有8e !8}{−==k k X P k ．无人打电话的概率0003.0e e !08}0{880====−−X P ，恰有10人打电话的概率099.0717.0816.0e !108}10{810=−===−X P （查表），至少有10人打电话的概率283.0717.01}9{1e !8}10{108=−=≤−==≥∑∞=−X P k X P k k （查表）．例已知某商店一天中某种贵重商品的销售件数X 服从泊松分布P (7)，问该商店每天应该准备多少件该商品才能以99.9%以上的概率满足顾客需要？解：设准备了a 件该商品，X ~ P(7)，则7e !7)(−=k k p k ．事件“满足顾客需要”，即X ≤ a ，有P {X ≤ a } ≥ 0.999，故查表可得a = 16．泊松分布P (λ )的最可能值为⎩⎨⎧−=.,1,],[0是正整数时当或不是正整数时当λλλλλk 证：若X ~ P(λ)，有L ,2,1,0,e !)(==−k k k p kλλ，故k k k k k k k k p k p k k k k−⋅−=⎟⎠⎞⎜⎝⎛−⋅−=−−=−−−−−−−−−λλλλλλλλλλe )!1(1e )!1(e)!1(e !)1()(111，当k < λ 时，有p (k ) > p (k − 1)；当k > λ 时，有p (k ) p (k 0 − 1)；且k 0 + 1 > λ ，即p (k 0 + 1) < p (k 0)．故p (k 0) 为最大值．如果λ 是正整数，取k 0 = λ ，即p (k 0) = p (k 0 − 1)，故p (k 0) 和p (k 0 − 1) 都是最大值．二．泊松分布的数学期望和方差泊松分布P (λ )的数学期望为λλλλλλλλλλλ=⋅=−⋅=−=⋅=−∞=−−∞=−∞=−∑∑∑e e )!1(e e)!1(e!)(111k k k kk kk k k k X E ，即泊松分布的参数 λ 反映平均发生次数．又因)()!2(e e!e!)(e!)(222222X E k k k k k k k k X E k k k kk kk k+−⋅=⋅+⋅−=⋅=∑∑∑∑∞=−−∞=−∞=−∞=−λλλλλλλλλ= λ 2 e −λ ⋅ e λ + λ = λ 2 + λ ，故方差为Var (X ) = E (X 2 ) − [E (X )]2 = λ 2 + λ − (λ )2 = λ ．三．二项分布的泊松近似二项分布与泊松分布的实际背景都是反映发生次数问题．下面的定理说明了二者之间的联系，泊松分布是二项分布的一种极限分布．定理（泊松定理）在n 重伯努利试验中，记事件A 在每次试验中发生的概率为与试验次数n 有关的数p n ，如果当n → +∞ 时，有n p n → λ ，则λλ−−+∞→=−⎟⎟⎠⎞⎜⎜⎝⎛e !)1(lim k p p k n k k n n k n n ．证：记λ n = n p n ，有λλ=+∞→n n lim ，因nk n n n kn n k n n n n n n p )(11)1(−−⋅−−−⎟⎠⎞⎜⎝⎛−+=⎟⎠⎞⎜⎝⎛−=−λλλλ，且e 1lim =⎟⎠⎞⎜⎝⎛−+−+∞→nnn n n λλ，λλ−=−−+∞→n k n n n )(lim ，则λλλλ−−−⋅−+∞→−+∞→=⎟⎠⎞⎜⎝⎛−+=−e 1lim )1(lim )(n k n n n n k n n n n n n p ，又因⎟⎠⎞⎜⎝⎛−−⎟⎠⎞⎜⎝⎛−=+−−=⎟⎟⎠⎞⎜⎜⎝⎛n k n k n k k n n n k n k 1111!!)1()1(L L ，且11111lim =⎟⎠⎞⎜⎝⎛−−⎟⎠⎞⎜⎝⎛−+∞→n k n n L ，故⎟⎠⎞⎜⎝⎛−−⎟⎠⎞⎜⎝⎛−−=−⎟⎟⎠⎞⎜⎜⎝⎛−+∞→−+∞→n k n p p k n p p k n k n nk n k n k n n k n n 1111)1(!lim )1(lim L λλ−+∞→−+∞→+∞→=⎟⎠⎞⎜⎝⎛−−⎟⎠⎞⎜⎝⎛−⋅−⋅=e !1111lim )1(lim !)(lim k n k n p k np k n k n n n k n n L ．此定理表明对于二项分布b (n , p )，当n 很大，p 很小时，可用泊松分布P (λ ) 近似，其中λ = n p ．例某地区每年人口意外死亡率为0.0001，现有60000人投保人身意外保险，求一年内因投保人意外死亡恰好赔付8人的概率以及赔付不超过5人的概率．解：设X 表示“一年内因投保人意外死亡而赔付的人数”，X ~ B (60000, 0.0001)．则5999289999.00001.0860000}8{××⎟⎟⎠⎞⎜⎜⎝⎛==X P ，∑=−××⎟⎟⎠⎞⎜⎜⎝⎛=≤50600009999.00001.060000}5{k kk k X P ，但显然计算很繁琐，为便于计算，用泊松分布近似．因n = 60000很大，p = 0.0001很小，λ = np = 6，有)6(~P X &，故103.0744.0847.0e !86}8{68=−=≈=−X P ，446.0e !6}5{506=≈≤∑=−k k k X P ．2.4.3. 超几何分布一．超几何分布在N 件产品中，有M 件次品，从中不放回地取n 件，以X 表示取得的次品数．设X 取值为k ，一方面，显然有k ≤ n 且k ≤ M ，即k ≤ min{n , M }，另一方面，有k ≥ 0且n − k ≤ N − M ，可得k ≥ M + n − N ，即k ≥ max{0, M + n − N }．这样X 的全部可能取值为l , l + 1, …, L ，其中l = max{0, M + n − N }，L = min{n , M }，且⎟⎟⎠⎞⎜⎜⎝⎛⎟⎟⎠⎞⎜⎜⎝⎛−−⎟⎟⎠⎞⎜⎜⎝⎛==n N k n M N k M k X P }{．定义若随机变量X 的概率函数为⎟⎟⎠⎞⎜⎜⎝⎛⎟⎟⎠⎞⎜⎜⎝⎛−−⎟⎟⎠⎞⎜⎜⎝⎛=n N k n M N k M k p )(，k = l , l + 1, …, L ，l = max(0, n + M − N )，L = min(M , n )，M < N ，n < N ，则称X 服从超几何分布（Hypergeometric Distribution ），记为X ~ h (n , N , M )．超几何分布的实际背景是古典概型中的不放回抽样检验问题．注：有放回检验抽样问题对应的是二项分布．非负性：0>⎟⎟⎠⎞⎜⎜⎝⎛⎟⎟⎠⎞⎜⎜⎝⎛−−⎟⎟⎠⎞⎜⎜⎝⎛n N k n M N k M ；正则性：10=⎟⎟⎠⎞⎜⎜⎝⎛⎟⎟⎠⎞⎜⎜⎝⎛=⎟⎟⎠⎞⎜⎜⎝⎛⎟⎟⎠⎞⎜⎜⎝⎛−−⎟⎟⎠⎞⎜⎜⎝⎛=⎟⎟⎠⎞⎜⎜⎝⎛⎟⎟⎠⎞⎜⎜⎝⎛−−⎟⎟⎠⎞⎜⎜⎝⎛∑∑==n N n N n N k n M N k M n N k n M N k M Ll k L k ．注：比较(1 + x )M(1 + x )N − M与(1 + x )N中x n的系数可以证明⎟⎟⎠⎞⎜⎜⎝⎛=⎟⎟⎠⎞⎜⎜⎝⎛−−⎟⎟⎠⎞⎜⎜⎝⎛∑=n N k n M N k M Ll k ．例一袋中有3个红球，2个白球，不放回地取出3个球，X 表示取得的红球数．求X 的概率分布．解：不放回抽样，N = 3，M = 2，n = 3，则X ~ h (3, 5, 3)．故X 的全部可能取值为1, 2, 3， (l = max (0, n + M − N ) = 1，L = min(n , M ) = 3)，3.0352213}1{=⎟⎟⎠⎞⎜⎜⎝⎛⎟⎟⎠⎞⎜⎜⎝⎛⎟⎟⎠⎞⎜⎜⎝⎛==X P ，6.0351223}2{=⎟⎟⎠⎞⎜⎜⎝⎛⎟⎟⎠⎞⎜⎜⎝⎛⎟⎟⎠⎞⎜⎜⎝⎛==X P ，1.0350233}3{=⎟⎟⎠⎞⎜⎜⎝⎛⎟⎟⎠⎞⎜⎜⎝⎛⎟⎟⎠⎞⎜⎜⎝⎛==X P ．超几何分布h (n , N , M )的最可能值为⎪⎩⎪⎨⎧+++−++++++++++++=.21)1(,121)1(21)1(,21)1(],21)1[(0是正整数时当或不是正整数时当N M n N M n N M n N M n N M n k证：若X ~ h (n , N , M)，有)!()!()!()!(!!1)(k n M N k n M N k M k M n N n N k n M N k M k p +−−−−⋅−⋅⎟⎟⎠⎞⎜⎜⎝⎛=⎟⎟⎠⎞⎜⎜⎝⎛⎟⎟⎠⎞⎜⎜⎝⎛−−⎟⎟⎠⎞⎜⎜⎝⎛=，故p (k ) − p (k − 1))!1()!1()!1()!1()!(!)!()!()!(!)!(!−+−−+−+−−⎟⎟⎠⎞⎜⎜⎝⎛−−+−−−−⎟⎟⎠⎞⎜⎜⎝⎛−=k n M N k n k M k n N M N M k n M N k n k M k n N M N M)]()1)(1[()!()!1()!1(!)!(!k n M N k k n k M k n M N k n k M k n N M N M +−−−+−+−+−−+−+−⎟⎟⎠⎞⎜⎜⎝⎛−=)]2()1)(1[()!()!1()!1(!)!(!+−+++−−+−+−⎟⎟⎠⎞⎜⎜⎝⎛−=N k n M k n M N k n k M k n N M N M ．当21)1(+++<N M n k 时，有p (k ) > p (k − 1)；当21)1(+++>N M n k 时，有p (k ) p (k 0 − 1)；且21)1(10+++>+N M n k ，即p (k 0 + 1) < p (k 0)．故p (k 0) 为最大值．如果21)1(+++N M n 是正整数，取21)1(0+++=N M n k ，即p (k 0) = p (k 0 − 1)，故p (k 0) 和p (k 0 − 1) 都是最大值．二．超几何分布的数学期望和方差超几何分布h (n , N , M )的数学期望为N nM n N k n M N k M N nM n N n N k n M N k M k M k n N k n M N k M k X E Ll k L lk L l k =⎟⎟⎠⎞⎜⎜⎝⎛−−⎟⎟⎠⎞⎜⎜⎝⎛−−⎟⎟⎠⎞⎜⎜⎝⎛−−⋅=⎟⎟⎠⎞⎜⎜⎝⎛−−⎟⎟⎠⎞⎜⎜⎝⎛−−⎟⎟⎠⎞⎜⎜⎝⎛−−⋅=⎟⎟⎠⎞⎜⎜⎝⎛⎟⎟⎠⎞⎜⎜⎝⎛−−⎟⎟⎠⎞⎜⎜⎝⎛⋅=∑∑∑===11111111)(，又因∑∑∑===⎟⎟⎠⎞⎜⎜⎝⎛⎟⎟⎠⎞⎜⎜⎝⎛−−⎟⎟⎠⎞⎜⎜⎝⎛⋅+⎟⎟⎠⎞⎜⎜⎝⎛⎟⎟⎠⎞⎜⎜⎝⎛−−⎟⎟⎠⎞⎜⎜⎝⎛⋅−=⎟⎟⎠⎞⎜⎜⎝⎛⎟⎟⎠⎞⎜⎜⎝⎛−−⎟⎟⎠⎞⎜⎜⎝⎛⋅=L lk L l k Ll k n N k n M N k M k n N k n M N k M k k n N k n M N k M k X E )()(222 ∑=+⎟⎟⎠⎞⎜⎜⎝⎛−−−−⎟⎟⎠⎞⎜⎜⎝⎛−−⎟⎟⎠⎞⎜⎜⎝⎛−−−−⋅−=Llk X E n N n n N N k n M N k M k k M M k k )(22)1()1(22)1()1()(2N nM N N M M n n N nM n N k n M N k M N N M M n n Ll k +−−−=+⎟⎟⎠⎞⎜⎜⎝⎛−−⎟⎟⎠⎞⎜⎜⎝⎛−−⎟⎟⎠⎞⎜⎜⎝⎛−−⋅−−−=∑=)1()1()1(2222)1()1()1(，故方差为)1())(()1()1)(1()]([)()Var(222222−−−=−+−−−=−=N N n N M N nM N M n N nM N N M n nM X E X E X ．为了便于记忆，可将超几何分布与二项分布的数学期望和方差进行比较．二项分布b (n , p )：数学期望E (X ) = np ，方差Var (X ) = np (1 − p )；超几何分布h (n , N , M )：数学期望N M nX E =)(，方差11)Var(−−⎟⎠⎞⎜⎝⎛−=N n N N M N M n X ；可见分布h (n , N , M )中的N M 相当于二项分布b (n , p )中的p ，方差修正因子为1−−N nN ．三．超几何分布的二项近似直观上，当抽样个数n 远小于M 及N − M 时，不放回抽样问题可近似看作有放回抽样问题，也就是此时超几何分布可用二项分布近似．定理如果当N → +∞ 时，p NM→， (0 < p < 1)，则k n k N p p k n n N k n M N k M −+∞→−⎟⎟⎠⎞⎜⎜⎝⎛=⎟⎟⎠⎞⎜⎜⎝⎛⎟⎟⎠⎞⎜⎜⎝⎛−−⎟⎟⎠⎞⎜⎜⎝⎛)1(lim ．证：因⎟⎠⎞⎜⎝⎛−−⎟⎠⎞⎜⎝⎛−=+−−=⎟⎟⎠⎞⎜⎜⎝⎛N n N n N n n N N N n N n 1111!!)1()1(L L ，且⎟⎠⎞⎜⎝⎛−−⎟⎠⎞⎜⎝⎛−=⎟⎟⎠⎞⎜⎜⎝⎛M k M k M k M k 1111!L ，⎟⎠⎞⎜⎝⎛−−−−⎟⎠⎞⎜⎝⎛−−−−=⎟⎟⎠⎞⎜⎜⎝⎛−−−M N k n M N k n M N k n M N kn 1111)!()(L ，故⎟⎠⎞⎜⎝⎛−−⎟⎠⎞⎜⎝⎛−⎟⎠⎞⎜⎝⎛−−−−⎟⎠⎞⎜⎝⎛−−−−⋅⎟⎠⎞⎜⎝⎛−−⎟⎠⎞⎜⎝⎛−=⎟⎟⎠⎞⎜⎜⎝⎛⎟⎟⎠⎞⎜⎜⎝⎛−−⎟⎟⎠⎞⎜⎜⎝⎛−+∞→+∞→N n N n N M N k n M N k n M N M k M k M n N k n M N k M n k n k N N 1111!1111)!()(1111!lim lim L L L ⎟⎠⎞⎜⎝⎛−−⎟⎠⎞⎜⎝⎛−⎟⎠⎞⎜⎝⎛−−−−⎟⎠⎞⎜⎝⎛−−⋅⎟⎠⎞⎜⎝⎛−−⎟⎠⎞⎜⎝⎛−⋅−⋅−=−+∞→N n N M N k n M N M k M N M N M k n k n nk n k N 111111111111)()!(!!lim L L L ⎟⎠⎞⎜⎝⎛−−⎟⎠⎞⎜⎝⎛−⎟⎠⎞⎜⎝⎛−−−−⎟⎠⎞⎜⎝⎛−−⋅⎟⎠⎞⎜⎝⎛−−⎟⎠⎞⎜⎝⎛−⋅⎟⎠⎞⎜⎝⎛−⎟⎠⎞⎜⎝⎛⋅⎟⎟⎠⎞⎜⎜⎝⎛=+∞→−+∞→N n N M N k n M N M k M N M N M k n N kn k N 111111111111lim 1lim L L L。

(完整版)《概率论与数理统计》讲义

第一章随机事件和概率第一节基本概念1、排列组合初步（1）排列组合公式)!(!n m m P n m -= 从m 个人中挑出n 个人进行排列的可能数。

)!(!!n m n m C n m -=从m 个人中挑出n 个人进行组合的可能数。

例1．1：方程xx x C C C 76510711=-的解是 A ． 4 B ． 3 C ． 2 D ． 1例1．2：有5个队伍参加了甲A 联赛，两两之间进行循环赛两场，试问总共的场次是多少？(2)加法原理（两种方法均能完成此事）：m+n某件事由两种方法来完成，第一种方法可由m 种方法完成，第二种方法可由n 种方法来完成，则这件事可由m+n 种方法来完成。

(3)乘法原理（两个步骤分别不能完成这件事）：m ×n某件事由两个步骤来完成，第一个步骤可由m 种方法完成，第二个步骤可由n 种方法来完成，则这件事可由m ×n 种方法来完成。

例1．3：从5位男同学和4位女同学中选出4位参加一个座谈会，要求与会成员中既有男同学又有女同学，有几种不同的选法？例1．4：6张同排连号的电影票，分给3名男生和3名女生，如欲男女相间而坐，则不同的分法数为多少？例1．5：用五种不同的颜色涂在右图中四个区域里，每一区域涂上一种颜色，且相邻区域的颜色必须不同，则共有不同的涂法A．120种B．140种 C．160种D．180种(4)一些常见排列①特殊排列②相邻③彼此隔开④顺序一定和不可分辨例1．6：晚会上有5个不同的唱歌节目和3个不同的舞蹈节目，问：分别按以下要求各可排出几种不同的节目单？①3个舞蹈节目排在一起；②3个舞蹈节目彼此隔开；③3个舞蹈节目先后顺序一定。

例1．7：4幅大小不同的画，要求两幅最大的排在一起，问有多少种排法？例1．8：5辆车排成1排，1辆黄色，1辆蓝色，3辆红色，且3辆红车不可分辨，问有多少种排法？①重复排列和非重复排列（有序）例1．9：5封不同的信，有6个信箱可供投递，共有多少种投信的方法？②对立事件例1．10：七人并坐，甲不坐首位，乙不坐末位，有几种不同的坐法？例1．11：15人中取5人，有3个不能都取，有多少种取法？例1．12：有4对人，组成一个3人小组，不能从任意一对中取2个，问有多少种可能性？③ 顺序问题例1．13：3白球，2黑球，先后取2球，放回，2白的种数？（有序）例1．14：3白球，2黑球，先后取2球，不放回，2白的种数？（有序）例1．15：3白球，2黑球，任取2球，2白的种数？（无序）2、随机试验、随机事件及其运算（1）随机试验和随机事件如果一个试验在相同条件下可以重复进行，而每次试验的可能结果不止一个，但在进行一次试验之前却不能断言它出现哪个结果，则称这种试验为随机试验。

《概率论讲义》课件

线性回归
介绍线性回归模型的基本原理和应用案例。
多元非线性回归
探讨多元非线性回归分析的方法和实际应用。
蒙特卡罗方法
1
简介和基本概念
介绍蒙特卡罗方法的基本思想和使用领域。
2
模拟方法
说明蒙特卡罗方法的模拟过程和实际应用。
3
抽样方法
讨论蒙特卡罗方法中的抽样技术和抽样步骤。
应用案例
金融风险管理
探讨概率论在金融风险管理中的应用和重要性。
2
弱大数定律
探讨具体的弱大数定律和其适用性。
3

中心极限定理
详细解释中心极限定理及其在概率论中的重要性。
统计推断
1 点估计
介绍点估计的概念和方法，以及其在概率论中的应用。
2 区间估计
说明区间估计的原理和步骤，并讨论其实际应用。
3 假设检验
讲解假设检验的基本思想和步骤，以及其在统计学中的作用。
回归分析
《概率论讲义》PPT课件
概率论讲义PPT课件大纲
简介
介绍概率论的基本概念和应用领域，初步了解概率论的历史和发展。
随机变量
定义随机变量，离散型和连续型随机变量及其概率分布。
概率分布
二项分布，泊松分布和正态分布。
大数定律与中心极限定理
1
定义大数定律和中心极限定理
深入了解大数定律和中心极限定理的概念和应用。
人口统计学
展示概率论如何应用于人口统计学数据的分析和预测。
物理学和天文学
介绍概率论在物理学和天文学研究中的关键作用。
结论
总结所学内容，展望概率论的未来发展和应用前景。
参考文献
推荐阅读经典著作和相关文献
提供经典著作和相关文献，供学习和研究参考。

概率论和统计学基础知识PPT课件

学习总结
经常不断地学习,你就什么都知道。你知道得越多,你就越有力量 Study Constantly, And You Will Know Everything. The More
You Know, The More Powerful You Will Be
结束语
当你尽了自己的最大努力时，失败也是伟大的，所以不要放弃，坚持就是正确的。
• 本着目的性、联系性、简明性三大原则，统计整理可以分为3类，分别是定期统计报表数据的整理、专题性统计数据的整理和历史统计数据的整理。
• 数据整理的一般过程有以下5部组成： • （1）对搜集到的资料进行全面审核，以确保统计资料符合统计研究目的的要求，
资料准确无误，这是数据整理的起点、也是数据分析的重要环节。 • （2）根据研究目和统计分析的需要，选择整理的标志，并进行划类分组，这部
2.4.2 数据的整理
• 统计整理：就是对搜集得到的初始数据进行审核、分组、汇总，使之条理化、系统化，变成能反映总体特征的综合数据的工作过程，而且，对已整理过的资料（包括历史资料）进行再加工也属于统计整理。统计整理是整个统计工作和研究过程的中间环节，起着承前启后的作用，同时也是统计调查的继续，又是统计分析的基础，还是积累历史资料的必要手段。
决于事物本身的特点。对于有些事物构成比较复杂，组数可多可少的情况，就需要考虑统计研究任务的具体要求。人口统计时，性别比例的统计就属于属性分组方法。 • 变量分组的方法：是按数量标志分组的方法，分组时各组数量界限的确定必须能反映事物质的差别，而且，应根据被研究的现象总体的数量特征，采用适当的分组形式，确定相宜的组距、组限。人口统计中的年龄结构计算应属于变量分组方法的应用范畴。
面运用最多的有分布、t分布和F 3个比较重要的

概率统计经典讲义

§2 中心极限定理
一、中心极限定理的客观背景在实际问题中，常常需要考虑许多随
机因素所产生的总的影响.
例如：炮弹射击的落点与目标的偏差，就受着许多随机因素的影响.
如瞄准时的误差，空气阻力所产生的误差，炮弹或炮身结构所引起的误差等等. 对我们来说重要的是这些随机因素的总影响.
自从高斯指出测量误差服从正态分布之后，人们发现，正态分布在自然界中极为常见.
则
n
Xi n
lim P{ i1
x}
x
1 e-t2 2dt(x)
n
n
- 2
定理1表明，当n充分大时，n个具有期望和方差的独立同分布r.v.之和近似服从正态分布.
n
Xi n 近似
i1
~ N(0,1)
n
1 n
ni1
Xi
X
近似~/ n / nN(0,1)近似
X ~ N(,2/n)
定理2（Liapunov中心极限定理）
0.2
0.2
1 P{ X 14 0} 1 (0) 0.2
1 0.5 0.5
例２某单位有200部电话分机,每部电话约有5% 的时间要使用外线通话.设每部电话是否使用外线通话是相互独立的.求该单位总机至少需要安装多少条外线才能以90%以上的概率保证每部电话需要使用外线时可以打通?
1 n
每箱产品的平均强度为 n i1 X i X
X =
X14=X14
2
0.2
近似
~ N(0,1)
n 100
(1) P{X 14.5} P{X 14 14.514}
0.2
0.2
P{X 14 2.5}1 P{X 14 2.5}
0.2

《概率论讲义》PPT课件

(2) 规范性 : Fn 1;
(3) 可加性：对互斥事件A, B，有 Fn (A B) Fn (A) Fn (B)
推广有限可加性：若A1，A2，, Ak 两两互不相容, 则
k
F n( Ai ) Fn ( A1) Fn ( A2 ) Fn ( Ak ). i 1
E2:将一枚硬币抛三次,观察正反面出现的情况. 2={HHH, THH，
HTH, HHT,HTT,THT,TTH,TTT }
E3:掷一颗骰子,观察点数.则 3={1,2,3,4,5,6}
1=1 2=2 6=6
E4:电话交换台一分钟内接到的呼唤次数.
4={0，1，2， }
1=0, 2=1, 3=2
0.5069
皮尔逊 12000
6019
0.5016
皮尔逊 24000
12012
0.5005
(二) 概率
1 统计定义：频率的稳定值P(A)反映了事件A在一次试验中发生的可能性大小，称P(A)为事件A 的概率。
2 公理化定义：设为样本空间，A为事件，对每一事件A赋予一实数P(A)，如果P(A)满足如下三条公理：
故有
P(i )

1 n
(n 1,2,, n)
若A {i1,i2 ,,ik }, 则有
P( A)

P(i1 )

P(i2 )

P(ik
)

k n
于是，P
( A)

k n

A包含的样本点数样本点总数
例１. 设一袋中有编号为1,2,…,9的球共9只,
现从中任取3只,试求:
n1
且Ai Aj . 由概率的可列可加性得

《概率统计2章》课件

应用场景
非线性回归在许多领域都有应用，例如化学、物理学和生物学等，用于探索非线性关系和预测。
详细描述
非线性回归分析通过建立非线性方程来描述因变量与自变量之间的关系。这种关系不是线性的，而是以其他形式存在，例如二次方、指数、对数等。
贝叶斯统计
贝叶斯定理
贝叶斯定理是概率论中的一个基本定理，它提供了在给定一些新的信息下，更新我们对某个事件发生的概率的估计的方法。
单侧检验与双侧检验
假设检验的步骤
根据假设方向的不同，分为单侧检验和双侧检验。
显著性水平是判断假设是否成立的依据，临界值是判断数据是否显著的依据。
通过提出假设并检验假设是否成立来判断总体参数是否显著。
提出假设、构造检验统计量、确定临界值、做出决策。
回归分析
总结词
详细描述
公式解释
应用场景
一元线性回归是回归分析中最基础的形式，它探Leabharlann 一个因变量与一个自变量之间的关系。
总结词
条件概率是指在某个已知条件下，随机事件发生的概率。独立性是指两个随机事件的发生互不影响。
详细描述
条件概率表示为P(A|B)，即在事件B发生的条件下，事件A发生的概率。独立性则是指两个随机事件A和B，如果P(A|B) = P(A)，则称A与B独立。条件概率与独立性是概率论中的重要概念，它们在概率模型建立和推断中有着广泛的应用。
在统计学中的应用
在金融领域的应用
在社会学中的应用
THANK YOU
感谢聆听
随机变量是用来描述随机实验结果的变量，其取值具有随机性。随机变量的分布描述了随机变量取值的概率规律。
总结词
随机变量是定义在样本空间上的函数，其取值具有随机性。常见的随机变量有离散型和连续型两种类型。离散型随机变量可以取有限或可数无穷多个值，而连续型随机变量则可以取实数域上的任意值。随机变量的分布描述了随机变量取值的概率规律，常见的分布有二项分布、泊松分布、正态分布等。理解随机变量的分布对于进行统计推断和决策具有重要的意义。

第一章概率统计基础知识PPT课件

42
例题
从20件产品中抽取5件，有2件不合格品的概率，其中20件中有3件不合格品
从一批产品中抽取100件，抽到3件不合格品的概率，其中不合格品率为5%
p17
43
概率的性质
P（ ø）=0 P（ Ω）=1 P（A）在0和1之间对立事件的概率独立事件的概率全概率公式条件概率
20
例题
随机抽取3件产品，至少一件合格品随机抽取3件产品，3件全是废品
21
例题
随机抽取3件产品，至少一件合格品随机抽取3件产品，3件全是废品互不相容
22
例题
A抽10件产品不合格品不多于5件 B抽10件产品不合格品多于7件
AB AB= BA 互不相容
23
例题
A抽10件产品不合格品不多于5件 B抽10件产品不合格品多于7件
样本空间的最大子集样本空间的最小子集
11
随机事件的特点
为Ω的一个子集 ω1属于A， ω1发生， A发生 ω2不属于A ω2发生，A不发生可用集合表示，也可以用语言表示
A
ω2
Ω
12
例题
抽取2件产品，至少有1件不合格品的事件
13
例题
抽取2件产品，至少有1件不合格品的样本点 Ω （0，0）（0，1）（1，0）（1，1） A （0，1）（1，0）（1，1）
31
排列（放回取样）
从6个产品中取2个 6ⅹ6=36
32
排列（不放回取样）
从6个产品中取2个排队 6ⅹ5=30
33
取样
从100个产品中取5个 100ⅹ99ⅹ98ⅹ97ⅹ96 nⅹ（n-1) ⅹ(n-2) ⅹ(n-3) ⅹ(n-4)
ⅹ(n-5+1)