《概率论与数理统计》讲义#(精选.)

合集下载

概率论与数理统计ppt课件

概率论与数理统计ppt课件

04
理解基本概念和原理
做大量练习题,培养解题能力
05
06
阅读相关书籍和论文,拓宽知识面
02
概率论基础
概率的基本概念
试验
一个具有有限个或无限个 可能结果的随机试验。
事件
试验中的某些结果的总称 。
概率
衡量事件发生可能性的数 值,通常表示为0到1之间 的实数。
必然事件
概率等于1的事件。
不可能事件
概率等于0的事件。
01 点估计
用样本统计量估计总体参数,如用样本均值估计 总体均值。
02 区间估计
给出总体参数的估计区间,如95%置信区间。
03 估计量的性质
无偏性、有效性和一致性。
假设检验
假设检验的基本思想
先假设总体参数具有某种 特性,然后通过样本信息 来判断这个假设是否合理 。
双侧检验
当需要判断两个假设是否 相等时,如总体均值是否 等于某个值。
连续型随机变量
取值无限的随机变 量。
方差
衡量随机变量取值 分散程度的数值。
03
数理统计基础
总体与样本
总体
研究对象的全体。
抽样方法
简单随机抽样、分层抽样、系统抽样等。
样本
从总体中随机抽取的一部分个体,用于估 计和推断总体的特性。
样本大小
样本中包含的个体数量,需要根据研究目 的和资源来确定。
参数估计
单因素方差分析
单因素方差分析的定义
单因素方差分析是方差分析的一种形式,它只涉及一个实验因素。通过对不同组的均值进行比 较,可以确定这个因素对实验结果的影响是否显著。
单因素方差分析的步骤
单因素方差分析通常包括以下步骤:首先,对实验数据进行分组;其次,计算每组的均值;接 着,计算总的均值和总的变异性;然后,计算组间变异性和组内变异性;最后,通过比较这两 种变异,得出因素的显著性。

概率论与数理统计讲义

概率论与数理统计讲义

概率论与数理统计讲义概率论与数理统计知识体系结构第一章概率论的基本概念 1.随机试验2.样本空间、样本点、事件、基本事件、必然事件、不可能事件3.事件间的关系4.事件的运算5.事件运算的规律6.概率的定义7.概率的运算性质 8.等可能概型(古典概型) 9.几何概型 10.条件概率 11.事件的独立性 12.全概率公式 13.贝叶斯公式第二章随机变量及其分布一.随机变量1.随机变量的定义2.离散型随机变量3.随机变量的分布函数 (1)分布函数的定义(2)分布函数的性质(3)离散型随机变量的分布函数 4.连续型随机变量及其概率密度 (1)连续型随机变量的定义 (2)概率密度函数的性质(3)连续型随机变量分布函数的性质 (4)几种常见的连续型随机变量 5.随机变量的函数的分布 (1)随机变量的函数的定义(2)离散型随机变量的函数的分布律 (3)连续型随机变量的函数的分布①连续型随机变量的函数的分布函数②连续型随机变量的函数的概率密度函数4 45 5 5 5 56 67 789 9 11 12 13 13 13 13 16 16 16 16 17 17 17 17 17 18 18 19 19 19 191第三章多维随机变量及其分布一.二维随机变量1.二维随机变量的定义2.二维随机变量的联合分布函数3.二维随机变量联合分布函数的几条性质4.二维离散型随机变量5.二维连续型随机变量二.边缘分布1.边缘分布函数的定义2.边缘分布函数的计算3.二维离散型随机变量的边缘分布律 3.二维连续型随机变量的边缘概率密度三.二维随机变量的条件分布1.二维离散型随机变量的条件分布律2.二维连续型随机变量的条件概率密度四.相互独立的随机变量1.随机变量独立的定义2.离散型随机变量相互独立的充分必要条件3.连续型随机变量相互独立的充要条件五.两个随机变量函数的分布1.随机变量和的分布2.随机变量差的分布3.随机变量积的分布4.随机变量商的分布5.随机变量的最值的分布第四章随机变量的数字特征一.期望1.离散型随机变量期望的定义2.连续型随机变量的数学期望的定义3.随机变量的函数的数学期望的求法4.多维随机变量的函数的数学期望的求法5.随机变量的数学期望的性质二.随机变量的方差1.方差的定义2.标准差(均方差)的定义3.方差的计算 5.方差的性质 6.切比雪夫不等式三.随机变量的协方差1.协方差、相关系数的定义20 20 20 20 21 21 22 22 22 22 23 23 24 24 24 25 25 25 25 25 25 26 26 28 28 30 30 30 30 30 30 31 31 31 31 32 32 33 34 3422.协方差的计算3.协方差的性质4.相关四.矩与协方差矩阵1.原点矩定义2.中心矩定义3.混合矩定义4.混合中心矩第五章大数定律和中心极限定理一.大数定律1.辛钦大数定律(弱大数定律)2.依概率收敛3.伯努利大数定律4.切比雪夫大数定律二.中心极限定理1.独立同分布的中心极限定理(林德伯格-列维定理)2.棣莫弗-拉普拉斯中心极限定理3.李雅普诺夫中心极限定理34 34 36 36 36 36 36 36 38 38 38 38 39 39 40 40 40 413概率论与数理统计知识体系结构第一章概率论的基本概念第二章一维随机变量及其概率分布第三章二维随机变量及其概率分布第四章随机变量的数字特征第五章大数定律和中心极限定理第六章样本及其抽象分布第七章参数估计第八章假设检验4第一章概率论的基本概念1.随机试验满足以下三大条件的试验叫做随机试验: (1) 可以在相同的条件下重复地进行;(2) 每次试验的可能结果不止一个,并且能事先明确试验的所有可能结果; (3) 在进行一次试验之前不能确定哪一个结果会出现.2.样本空间、样本点、事件、基本事件、必然事件、不可能事件(1) 将试验E的所有可能结果组成的集合成为样本空间,记为S. (2) 样本空间的元素,即试验E的每个结果,称为样本点. (3) 试验E的样本空间S的子集,称为随机事件,简称事件. (4) 由一个样本点组成的单点集,称为基本事件.(5) 样本空间S包含其所有样本点,是其自身的子集,在每次试验时它总会发生,S称为必然事件.(6) 空集?不包含任何样本点,它也作为样本空间的子集,在每次试验时它总不会发生,?称为不可能事件.3.事件间的关系(1) 若事件A发生,事件B就发生,则称事件B包含A,记为A?B. (2) 若事件A、B满足A?B,且B?A,则称事件A与B相等.4.事件的运算(1) 事件A?B?xx?A?or?x?B称为事件A,B的和事件。

概率论与数理统计讲义 (27)

概率论与数理统计讲义 (27)

原点矩
由矩法,
0
X 1
2
总体矩
样本矩
2
从中解得 ˆ 2X 1 , 即为 的矩估计.
1 X
例2 设X1,X2,…Xn是取自总体X的一个样本
X
~
f
(
x)
1
e( x
)
,
x
, 为未知参数
0,
其它
其中 >0,求 , 的矩估计.
解: 由密度函数知
X 具有均值为 的指数分布
故 E(X- )= 即 E(X)=
缺点是,当总体类型已知时,没有 充分利用分布提供的信息 . 一般场合下, 矩估计量不具有唯一性 .
其主要原因在于建立矩法方程时, 选取那些总体矩用相应样本矩代替带 有一定的随意性 .
第 七 章第一节 矩估计
矩是基于一种简单的“替换” 思想建立起来的一种估计方法 .
是英国统计学家K.皮尔逊最早提出的 .
其基本思想是用样本矩估计总体矩 . 理论依据: 大数定律
记总体k阶矩为 k E( X k )
样本k阶矩为
Ak
1 n
n i 1
X
k i
记总体k阶中心矩为 k E[ X E( X )]k
参数估计问题的一般提法
设有一个统计总体,总体的分布函数
为 F(x, ),其中为未知参数 ( 可以是
向量) . 现从该总体抽样,得样本 X1, X2 , … , Xn
要依据该样本对参数 作出估计,或估计 的某个已知函数 g( ) .
这类问题称为参数估计.
点估计
参数估计
区间估计
假如我们要估计某队男生的平均身高.
1
n
n i 1
X
m i

概率论与数理统计完整ppt课件

概率论与数理统计完整ppt课件
化学
在化学领域,概率论与数理统计被用于研究化学反应的速率和化 学物质的分布,如化学反应动力学、量子化学计算等。
生物
在生物学中,概率论与数理统计用于研究生物现象的变异和分布, 如遗传学、生态学、流行病学等。
在工程中的应用
通信工程
01
概率论与数理统计在通信工程中用于信道容量、误码率、调制
解调等方面的研究。
边缘分布
对于n维随机变量(X_1,...,X_n),在概 率论中,分别定义了X_1的边缘分布 、...、X_n的边缘分布。
04
数理统计基础
样本与抽样分布
01
02
03
总体与样本
总体是包含所有可能数据 的数据集合,样本是总体 的一个随机子集。
抽样方法
包括简单随机抽样、分层 抽样、系统抽样等。
样本分布
描述样本数据的分布情况 ,如均值、中位数、标准 差等。
参数估计与置信区间
参数估计
利用样本数据估计总体的 未知参数,如均值、方差 等。
点估计
用样本统计量作为总体参 数的估计值。
置信区间
给出总体参数的一个估计 区间,表示对总体的参数 有一个可信的估计范围。
假设检验与方差分析
假设检验
通过样本数据对总体参数提出 假设,然后根据假设进行检验
01
定义
设E是一个随机试验,X,Y是定义在E上,取值分别为实数的随机变量
。称有序实数对(X,Y)为一个二维随机变量。
02
分布函数
设(X,Y)是一个二维随机变量,对于任意实数x,y,二元函数
F(x,y)=P({X<=x,Y<=y})称为二维随机变量(X,Y)的分布函数。
03
边缘分布
对于二维随机变量(X,Y),在概率论中,分别定义了X的边缘分布和Y的

(完整版)《概率论与数理统计》讲义

(完整版)《概率论与数理统计》讲义

第一章 随机事件和概率 第一节 基本概念1、排列组合初步(1)排列组合公式)!(!n m m P n m -= 从m 个人中挑出n 个人进行排列的可能数。

)!(!!n m n m C n m -=从m 个人中挑出n 个人进行组合的可能数。

例1.1:方程xx x C C C 76510711=-的解是 A . 4 B . 3 C . 2 D . 1例1.2:有5个队伍参加了甲A 联赛,两两之间进行循环赛两场,试问总共的场次是多少?(2)加法原理(两种方法均能完成此事):m+n某件事由两种方法来完成,第一种方法可由m 种方法完成,第二种方法可由n 种方法来完成,则这件事可由m+n 种方法来完成。

(3)乘法原理(两个步骤分别不能完成这件事):m ×n某件事由两个步骤来完成,第一个步骤可由m 种方法完成,第二个步骤可由n 种方法来完成,则这件事可由m ×n 种方法来完成。

例1.3:从5位男同学和4位女同学中选出4位参加一个座谈会,要求与会成员中既有男同学又有女同学,有几种不同的选法?例1.4:6张同排连号的电影票,分给3名男生和3名女生,如欲男女相间而坐,则不同的分法数为多少?例1.5:用五种不同的颜色涂在右图中四个区域里,每一区域涂上一种颜色,且相邻区域的颜色必须不同,则共有不同的涂法A.120种B.140种 C.160种D.180种(4)一些常见排列①特殊排列②相邻③彼此隔开④顺序一定和不可分辨例1.6:晚会上有5个不同的唱歌节目和3个不同的舞蹈节目,问:分别按以下要求各可排出几种不同的节目单?①3个舞蹈节目排在一起;②3个舞蹈节目彼此隔开;③3个舞蹈节目先后顺序一定。

例1.7:4幅大小不同的画,要求两幅最大的排在一起,问有多少种排法?例1.8:5辆车排成1排,1辆黄色,1辆蓝色,3辆红色,且3辆红车不可分辨,问有多少种排法?①重复排列和非重复排列(有序)例1.9:5封不同的信,有6个信箱可供投递,共有多少种投信的方法?②对立事件例1.10:七人并坐,甲不坐首位,乙不坐末位,有几种不同的坐法?例1.11:15人中取5人,有3个不能都取,有多少种取法?例1.12:有4对人,组成一个3人小组,不能从任意一对中取2个,问有多少种可能性?③ 顺序问题例1.13:3白球,2黑球,先后取2球,放回,2白的种数?(有序) 例1.14:3白球,2黑球,先后取2球,不放回,2白的种数?(有序) 例1.15:3白球,2黑球,任取2球,2白的种数?(无序)2、随机试验、随机事件及其运算(1)随机试验和随机事件如果一个试验在相同条件下可以重复进行,而每次试验的可能结果不止一个,但在进行一次试验之前却不能断言它出现哪个结果,则称这种试验为随机试验。

概率论与数理统计讲义

概率论与数理统计讲义

概率论与数理统计讲义一、概率论1.1 引言概率论是研究随机现象的理论,广泛应用于自然科学、社会科学以及工程技术等领域。

它通过量化随机事件发生的可能性,帮助我们理解事件之间的关系和规律。

1.2 随机变量与概率分布随机变量是描述随机事件的事物,可以分为离散型随机变量和连续型随机变量。

概率分布则是描述随机变量取值的概率情况,包括离散型随机变量的概率质量函数和连续型随机变量的概率密度函数。

1.3 期望与方差期望是随机变量取值的平均值,用来描述随机变量的集中程度。

方差则是随机变量与其期望之间的差异程度,用来描述随机变量的离散程度。

1.4 概率分布函数的性质概率分布函数有许多重要的性质,包括非负性、归一性、单调性、可加性等。

这些性质能够帮助我们更好地理解随机事件的规律和特征。

二、数理统计2.1 统计学概述统计学是研究数据收集、分析和解释的学科,通过对样本数据的研究,推断出总体的一些特征和规律。

统计学广泛应用于社会调查、市场研究以及科学实验等领域。

2.2 描述统计学描述统计学是对数据进行总结和描述的统计学方法。

它包括数据的集中趋势度量、离散程度度量以及数据分布特征等内容。

2.3 参数估计参数估计是根据样本数据推断总体参数的一种统计学方法。

点估计通过寻找最优参数估计量来描述总体参数的真实值,区间估计则给出了参数估计的置信区间。

2.4 假设检验假设检验是用来判断总体参数是否满足某种假设的统计学方法。

它将原假设和备择假设相比较,通过计算统计量的值来判断是否拒绝原假设。

2.5 方差分析与回归分析方差分析和回归分析是用来研究多个变量之间关系的统计学方法。

方差分析用于比较多个总体均值是否相等,而回归分析则用于建立变量之间的数学模型。

三、应用案例3.1 金融风险管理概率论与数理统计在金融风险管理中发挥着重要作用。

通过对金融市场的随机波动性进行建模和分析,可以帮助投资者制定更合理的投资策略,降低风险。

3.2 医学研究数理统计在医学研究中具有广泛的应用。

概率论与数理统计讲义稿

概率论与数理统计讲义稿

第一章随机事件与概率§1.1 随机事件1.1.1 随机试验与样本空间概率论约定为研究随机现象所作的随机试验应具备以下三个特征:(1)在相同条件下试验是可重复的;(2)试验的全部可能结果不只一个,且都是事先可以知道的;(3)每一次试验都会出现上述可能结果中的某一个结果,至于是哪一个结果则事前无法预知。

为简单计,今后凡是随机试验皆简称试验,并记之以英文字母E。

称试验的每个可能结果为样本点,并称全体样本点的集合为试验的样本空间,分别用希腊字母ω和Ω表示样本点及样本空间。

必须指出的是这个样本空间并不完全由试验所决定,它部分地取决于实验的目的。

假设抛掷一枚硬币两次,出于某些目的,也许只需要考虑三种可能的结果就足够了,两次都是正面,两次都是反面,一次是正面一次是反面。

于是这三个结果就构成了样本空间Ω。

但是,如果要知道硬币出现正反面的精确次序,那么样本空间Ω就必须由四个可能的结果组成,正面-正面、反面-反面、正面-反面、反面-正面。

如果还考虑硬币降落的精确位置,它们在空中旋转的次数等事项,则可以获得其它可能的样本空间。

经常使用比绝对必要的样本空间较大的样本空间,因为它便于使用。

比如,在前面的例子中,由四个可能结果组成的样本空间便于问题的讨论,因为对于一个“均匀”的硬币这四个结果是“等可能”的。

尽管这在有3种结果的样本空间内是不对的。

例 1.1.1 1E :从最简单的试验开始,这些试验只有两种结果。

在抛掷硬币这一试验中出现“正面”或“反面”;在检查零件质量时,可能是“合格”或“不合格”;当用来模拟电子产品旋转的方向时,结果是“左边”或者“右边”;在这些情况下样本空间Ω简化为:Ω={正面,反面}。

2E :更复杂一些,有的随机试验会产生多种可能的结果,比如掷一颗骰子,观察出现的点数。

样本空间为:{1,2,3,4,5,6}Ω=。

3E : 掷两枚硬币(或者观察两个零件或两个电子产品),可以得到Ω={(正面,正面)、(反面,反面)、(正面,反面)、(反面,正面) } 读者可以将其推广到掷n 个硬币,样本空间里有多少样本点呢?4E :再复杂一些,一名射手向某目标射击,直至命中目标为止,观察其命中目标所进行的射击次数。

概率论与数理统计(茆诗松)第四章讲义

概率论与数理统计(茆诗松)第四章讲义

⎡ T eit ( X − x1 ) − eit ( X − x2 ) ⎤ e − itx1 − e − itx2 ( ) ϕ t dt E dt ⎥ = ⎢ ∫−T ∫−T it it ⎦ ⎣
T
⎡ T cos t ( X − x1 ) + i sin t ( X − x1 ) − cos t ( X − x2 ) − i sin t ( X − x2 ) ⎤ dt ⎥ = E ⎢∫ it ⎦ ⎣ −T cos t ( X − x1 ) − cos t ( X − x2 ) ⎤ ⎡ T sin t ( X − x1 ) − sin t ( X − x2 ) dt ⎥ = E ⎢∫ −i −T t t ⎦ ⎣ ⎡ T sin t ( X − x1 ) − sin t ( X − x2 ) ⎤ dt ⎥ , = E ⎢2∫ t ⎦ ⎣ 0
itx 0
+∞
−λ x
dx = ∫ λ e
0
+∞
−( λ −it ) x
e −( λ −it ) x λ ; dx = λ ⋅ = − (λ − it ) 0 λ − it
x2
+∞
1 −2 (6)标准正态分布 N (0, 1):密度函数 p ( x) = e , − ∞ < x < +∞ ,特征函数为 2π
1 1 e itx dx = ⋅ ϕ (t ) = ∫ e ⋅ a b−a b − a it
b itx b
=
a
e ibt − e iat ; it (b − a )
⎧λ e − λx , (5)指数分布 Exp(λ):密度函数 p ( x) = ⎨ ⎩0,
x > 0; x ≤ 0.

概率论与数理统计讲解

概率论与数理统计讲解

概率论第一章随机事件及其概率一。

随机试验1.在相同情况下可以重复进行2.每次试验出现不同的结果,但是究竟出现那种结果并不确定3.事先知道实验出现的全部结果二。

必然现象和随机现象1.一旦某种条件实现,某种现象必然发生或者必然不发生,我们称这种时间为必然现象2.在一定条件实现后,可能发生也可能不发生的现象称为随机现象三。

随机事件1.随机试验E2.3.随机事件E四.1.包含与相等2.作3.事件的交或积4.事件的差5.6.补充:n个时件,A1 , A2 , A3 , ...An 中至少有一个发生称为事件A1 , A2 , A3 , ...An 的并,记作nA1∪A2∪A3...∪An=A i∪i=100可列个事件A i∪i=1n个事件同时发生,称为这n个时间的交或者积,记为:nA1∩A2∩A3∩...∩An=A i∩i=100可列个事件:A i∩i=1例题:1,一批产品中有合格品也有废品,每次抽取一个,又放回的抽取三个产品,用Ai 标示第 i 次抽的废品,试用Ai 标示下列各个事件:①第一次,第二次至少有一次抽到废品: A1∪A2②只有第一次抽的废品: A1∩A2差∩A3差 ③三次都抽到废品: A1∩A2∩A3④至少有一次抽到合格品: A1差∪A2差∪A3差 2,三个目标A,B,C.①目标被击中 A ∪B ∪C②三个人最多了两个人击中(看他的逆命题为三个人都击中) 故而(A ∩B ∩C)的差 ③三个人恰好一个人击中 A 交B 差交C 差+A 差交B 交C 差+A 差B 差交CA 的概率为: ②渠道的五个数字号码依次构成五位偶数的概率是多大①解:由于抽取后放回,故五次收取所得 的基本事件的总数为 105,设A={抽到5个不同的数},则A 包含的基本事件的总数为,故:P (A )= =②设B={五个号码依次组成五位偶数},则B 包含的基本事件总数为9*103*5故而:P(B)= =0.45P51010510*9*8*7*61059*105*51052.设有R个人,R<=365,而且每个人,生日在365田中的可能性是相等的。

概率论与数理统计课件:数理统计基础知识

概率论与数理统计课件:数理统计基础知识

数理统计基础知识
首页 返回 退出
6.1.1 总体
§6.1 总体和随机样本
总体:研究对象的全部可能观察值叫做总体. 个体:组成全体的每个观察值叫做个体.
如:考察某校学生的身高
总体:该校的所有学生的身高 个体:每个学生的身高
数理统计基础知识
首页 返回 退出
实际问题中,要研究的是有关对象的各种数量指标. 总体可以用一个随机变量及其分布来描述.
首页 返回 退出
由于抽样的目的是为了对总体进行统计推断, 为了使抽取的样本能很好地反映总体的信息,必 须考虑抽样方法.
最常用的一种抽样方法叫作“简单随机抽样” 它要求抽取的样本满足下面两点: 1. 代表性: X1,X2,…,Xn中每一个与所考察 的总体有相同的分布.
2. 独立性: X1,X2,…,Xn是相互独立的随机变量.
从一批产品中抽5件,检验产品是否合格.
数理统计基础知识
样本容量为5
首页 返回 退出
样本是随机变量.
抽到哪5辆是随机的
容量为n的样本可以看作n维随机变量(X1,X2,…,Xn).
但是,一旦取定一组样本,得到的是n个具体的数 (x1,x2,…,xn),称为样本的一次观察值,简称样本值 .
数理统计基础知识
总体的指标 如体重、身高、寿命等 是随机变量X 个体的指标 如体重、身高、寿命等 是随机变量X 的一个取值
常用随机变量的记号或用其分布函数表示总体.
如:总体X或总体F X
数理统计基础知识
首页 返回 退出
有限总体 总体
无限总体
1.考察某校大一新生(共2000人)的身高. 有限总体
2.观测某地每天最高气温. 无限总体 3.某厂生产的所有电视显像管的寿命. 无限总体

(完整版)《概率论与数理统计》讲义

(完整版)《概率论与数理统计》讲义

第一章 随机事件和概率 第一节 基本概念1、排列组合初步(1)排列组合公式)!(!n m m P n m -= 从m 个人中挑出n 个人进行排列的可能数。

)!(!!n m n m C n m -=从m 个人中挑出n 个人进行组合的可能数。

例1.1:方程xx x C C C 76510711=-的解是 A . 4 B . 3 C . 2 D . 1例1.2:有5个队伍参加了甲A 联赛,两两之间进行循环赛两场,试问总共的场次是多少?(2)加法原理(两种方法均能完成此事):m+n某件事由两种方法来完成,第一种方法可由m 种方法完成,第二种方法可由n 种方法来完成,则这件事可由m+n 种方法来完成。

(3)乘法原理(两个步骤分别不能完成这件事):m ×n某件事由两个步骤来完成,第一个步骤可由m 种方法完成,第二个步骤可由n 种方法来完成,则这件事可由m ×n 种方法来完成。

例1.3:从5位男同学和4位女同学中选出4位参加一个座谈会,要求与会成员中既有男同学又有女同学,有几种不同的选法?例1.4:6张同排连号的电影票,分给3名男生和3名女生,如欲男女相间而坐,则不同的分法数为多少?例1.5:用五种不同的颜色涂在右图中四个区域里,每一区域涂上一种颜色,且相邻区域的颜色必须不同,则共有不同的涂法A.120种B.140种 C.160种D.180种(4)一些常见排列①特殊排列②相邻③彼此隔开④顺序一定和不可分辨例1.6:晚会上有5个不同的唱歌节目和3个不同的舞蹈节目,问:分别按以下要求各可排出几种不同的节目单?①3个舞蹈节目排在一起;②3个舞蹈节目彼此隔开;③3个舞蹈节目先后顺序一定。

例1.7:4幅大小不同的画,要求两幅最大的排在一起,问有多少种排法?例1.8:5辆车排成1排,1辆黄色,1辆蓝色,3辆红色,且3辆红车不可分辨,问有多少种排法?①重复排列和非重复排列(有序)例1.9:5封不同的信,有6个信箱可供投递,共有多少种投信的方法?②对立事件例1.10:七人并坐,甲不坐首位,乙不坐末位,有几种不同的坐法?例1.11:15人中取5人,有3个不能都取,有多少种取法?例1.12:有4对人,组成一个3人小组,不能从任意一对中取2个,问有多少种可能性?③ 顺序问题例1.13:3白球,2黑球,先后取2球,放回,2白的种数?(有序) 例1.14:3白球,2黑球,先后取2球,不放回,2白的种数?(有序) 例1.15:3白球,2黑球,任取2球,2白的种数?(无序)2、随机试验、随机事件及其运算(1)随机试验和随机事件如果一个试验在相同条件下可以重复进行,而每次试验的可能结果不止一个,但在进行一次试验之前却不能断言它出现哪个结果,则称这种试验为随机试验。

概率论与数理统计书ppt课件

概率论与数理统计书ppt课件

条件概率与独立性
CHAPTER
随机变量及其分布
02
随机变量的概念与性质
定义随机变量为在样本空间中的实值函数,其取值依赖于随机试验的结果。
随机变量
讨论随机变量的可数性、可加性、正态性等性质。
随机变量的性质
离散型随机变量的概念
定义离散型随机变量为只能取可数个值的随机变量。
离散型随机变量的分布
讨论离散型随机变量的概率分布,如二项分布、泊松分布等。
应用
中心极限定理及其应用
CHAPTER
贝叶斯推断与决策分析
07
贝叶斯推断的基本原理
金融风险管理
贝叶斯推断在金融风险管理领域有着广泛的应用,如信用风险评估、投资组合优化等。
医疗诊断
贝叶斯推断在医疗诊断方面也有着重要的应用,如疾病诊断、预后评估等。
机器学习与人工智能
贝叶斯推断在机器学习算法和人工智能领域中也有着广泛的应用,如朴素贝叶斯分类器、高斯混合模型等。
参数估计与置信区间
01
点估计
用单一的数值估计参数的值。
02
区间估计
给出参数的一个估计区间,通常包括一个置信水平。
比较两个或多个组的均值差异,确定因素对结果的影响。
方差分析
检验两个或多个组的方差是否相等。
方差齐性检验
研究变量之间的关系,并预测结果。
回归分析
假设检验与方差分析
CHAPTER
回归分析与线性模型
应用
在现实生活中,大数定律被广泛应用于保险、赌博、金融等领域,通过统计数据来预测未来的趋势和风险。
大数定律及其应用
在独立随机变量序列中,它们的和的分布近似于正态分布,即中心极限定理。这意味着,当样本量足够大时,样本均值近似于正态分布。

概率论与数理统计ppt课件

概率论与数理统计ppt课件

称这种试验为等可能概型(或古典概型)。
*
例1:一袋中有8个球,其中3个为红球,5个为黄球,设摸到每一球的可能性相等,从袋中不放回摸两球, 记A={恰是一红一黄},求P(A). 解:
(注:当L>m或L<0时,记 )
例2:有N件产品,其中D件是次品,从中不放 回的取n件, 记Ak={恰有k件次品},求P(Ak). 解:
*
第四章 随机变量的数字特征 4.1 数学期望 4.2 方差 4.3 协方差及相关系数 4.4 矩、协方差矩阵 第五章 大数定律和中心极限定理 5.1 大数定律 5.2 中心极限定理 第六章 数理统计的基本概念 6.1 总体和样本 6.2 常用的分布
*
第七章 参数估计 7.1 参数的点估计 7.2 估计量的评选标准 7.3 区间估计 第八章 假设检验 8.1 假设检验 8.2 正态总体均值的假设检验 8.3 正态总体方差的假设检验 8.4 置信区间与假设检验之间的关系 8.5 样本容量的选取 8.6 分布拟合检验 8.7 秩和检验 第九章 方差分析及回归分析 9.1 单因素试验的方差分析 9.2 双因素试验的方差分析 9.3 一元线性回归 9.4 多元线性回归
解: 设 Ai={ 这人第i次通过考核 },i=1,2,3 A={ 这人通过考核 },
亦可:
*
例:从52张牌中任取2张,采用(1)放回抽样,(2)不放 回抽样,求恰是“一红一黑”的概率。
利用乘法公式
与 不相容
(1)若为放回抽样:
(2)若为不放回抽样:
解: 设 Ai={第i次取到红牌},i=1,2 B={取2张恰是一红一黑}



1 2 N


1 2 N
……

概率论与数理统计完整版课件全套ppt教学教程-最全电子讲义(最新)

概率论与数理统计完整版课件全套ppt教学教程-最全电子讲义(最新)
点”或“6 点”3 个基本事件,即 A {2 ,4 ,6} 。
四、事件的关系与运算
在一个样本空间中显然可以定义不止一个事件。概率论的重要研究课 题之一是希望从简单事件的概率推算出复杂事件的概率。为此,需要研究 事件间的关系与运算。
事件是一个集合,因此事件间的关系和运算自然按照集合之间的关系 和运算来处理。
1 事件的包含与相等
若 A B ,则称事件 B 包含事件 A ,这里指的是事件 A 发生必然导致事件 B 发生, 即属于 A 的样本点都属于 B ,如图1-2所示。显然,对任何事件A,必有 A 。
若 A B 且 B A ,则称事件 A 与 B 相等,记为 A B。
图1-2 A B
事件 A B {x | x A或x B},称为事件A与事件B的和事件,即当且仅当事件 A 或 事件 B 至少有一个发生时,和事件 A B 发生。它由属于 A 或 B 的所有公共样本点构 成,如图 1-4 所示。
图 1-4 A B
4 事件的差
事件 A B {x | x A且x B}称为事件 A 与事件 B 的差事件,即当且仅当事件 A 发 生但事件 B 不发生时,积事件A B发生。它是由属于 A 但不属于 B 的样本点构成的集 合,如图1-5所示。差事件 A B 也可写作 AB 。
定义1 在相同的条件下重复进行了 n 次试验,如果事件 A 在这 n 次试验中出现
了 nA
次,则称比值
nA n
为事件 A
发生的频率,记为fn ( 源自) ,即fn( A)
nA n
显然,频率 fn ( A) 的大小表示了在 n 次试验中事件 A 发生的频繁程度。频率 大,事件 A 发生就频繁,在一次试验中 A 发生的可能性就大,也就是事件 A 发

概率论与数理统计15讲

概率论与数理统计15讲
5
例如 一个人的身高和体重是非常有关系的, 但 是又并不完全是严格的函数关系, 那么关 系程度究竟有多大呢? 一个人的吸烟量和他的平均寿命是有关系 的, 这个关系量又有多大呢?
6
一种化肥的施用量和农作物的产量是有关 系的, 这个关系的大小又是如何呢? 这样一些问题都希望能够用一个数字就表 示出来, 这就是人们想到要用协方差和相 关系数的原因.
...
...
k0-2 k0-1 k0 k0+1 k0+2 由上图可知P(X=k0)P(X=k0+1)
且P(X=k0)P(X=k0-1)
46
Cnk C k -1
n
n! k!(n -
k)!
(k
-1)!(n n!
k
1)!
n
-k k
1

C p q k0 k0 n-k0 n
C p q k0 -1 k0 -1 n-k0 1 n
(n - k0 1) p k0q
1
(n 1) p k0, 得np p k0
47
k0 1 k0 1 n-k0 -1
再由C p q n C p q k0 k0 n-k0
n
(n - k0) p (k0 1)q
1
np p -1 k0,
即np p -1 k0 np p
48
分析np+p-1k0np+p 知道np+p比np+p-1大了1, 因此挤在这两 个数中间的整数有1个还是2个取决于 np+p是否正好是整数.
yi ,
cov( X ,Y )
1 n
n i1
( xi
-
x )( yi
-
y)
1 n

概率论与数理统计茆诗松讲义_百度文库

概率论与数理统计茆诗松讲义_百度文库

第二章随机变量及其分布上一章研究内容:事件(集合A)→ 概率(数).本章将用函数研究概率,函数是数与数的关系,即需要用数反映事件——随机变量.事件(数)→ 概率(数).§2.1 随机变量及其分布2.1.1. 随机变量的概念随机试验的样本点有些是定量的:如掷骰子掷出的点数,电子元件使用寿命的小时数.有些是定性的:如掷硬币正面或反面,检查产品合格或不合格.对于定性的结果也可以规定其数量性质:如掷硬币,正面记为1,反面记为0;检查产品,合格记为1,不合格记为0.随机试验中,可将每一个样本点ω 都对应于一个实数X (ω),称为随机变量(Random Variable),常用大写英文字母X, Y, Z 等表示随机变量,而随机变量的具体取值通常记为小写英文字母x, y, z.对于随机变量首先应掌握它的全部可能取值:⎧1,正面如掷硬币,X=⎨,X的全部可能取值为0, 1; 0,反面⎩掷两枚骰子,X表示掷出的点数之和,X的全部可能取值为2, 3, 4, … , 12 ;观察某商店一小时内的进店人数X,X的全部可能取值为0, 1, 2, … ;电子元件使用寿命,用X表示使用的小时数,X的全部可能取值为[0,+∞);一场足球比赛(90分钟),用X表示首次进球时间(分钟),若为0:0,记X = 100,X的全部可能取值为 (0, 90 )∪{100};注意:1. 每个样本点都必须对应于一个实数,2.不同样本点可以对应于同一个实数,3.随机变量的每一取值或取值范围都表示一个事件.应掌握将随机变量的取值或取值范围描述为事件,又能将事件用随机变量表达的方法.例掷一枚骰子,用X表示出现的点数,则 X = 1表示出现1点;X > 4表示点数大于4,即出现5点或6点;X ≤ 0为不可能事件.又出现奇数点,即X = 1, 3, 5;点数不超过3,即X ≤ 3.例 X 表示商店一天中某商品的销售件数(顾客的需求件数),则 X = 0表示没有销售;X ≤ 10表示销售不超过10件.又销售5件以上(不含5件)即X > 5;若该商店准备了a件该商品,事件“能满足顾客需要”,即X ≤ a.例 X 表示一只电子元件的使用寿命(小时),则 X = 1000表示该元件恰好使用了1000小时,X ≥ 800表示该元件使用寿命在800小时以上.例 90分钟足球比赛,X 表示首次进球时间(分钟),且0:0时,记X = 100,则 X = 10表示上半场第10分钟首次进球.又上半场不进球即X > 45;开场1分钟内进球即X ≤ 1.如果随机变量X的全部可能取值是有限个或可列个,则称为离散型随机变量.(注:可列个即可以排成一列,一个一个往下数,如非负整数0, 1, 2,3, … )离散型随机变量的全部可能取值是实数轴上一些离散的点,而连续型随机变量的全部可能取值是实数轴上一个区间或多个区间的并,如电子元件使用寿命X(小时),全部可能取值是[0,+∞).下面按离散型和连续型分别进行讨论.2.1.2. 离散随机变量的概率分布列对于随机变量还应该掌握它的每一取值或取值范围表示事件的概率.定义如果随机变量X的全部可能取值是有限个或可列个,则称为离散型随机变量.设离散型随机变量X的全部可能取值为x1, x2, …, x k , …,则X取值x k的概率pk = p (xk) = P{X = xk }, k = 1, 2, …… 称为离散型随机变量的概率分布函数(Probability Distribution Function,PDF),简称概率分布或概率函数.直观上,又写为XPx1p(x1)x2Lp(x2)L⎛x1 或 X~⎜⎜p(x)p(xk)L1⎝xkLx2Lp(x2)LxkL⎞⎟,⎟p(xk)L⎠称为X的概率分布列.如掷一枚骰子,X表示出现的点数,X的分布列为P66666. 6概率函数基本性质:(1)非负性p(xk) ≥ 0 , k = 1, 2, ……;(2)正则性∑p(xk=1∞k)=1.这是因为事件X = x1 , X = x2 , … , X = x k , … 是一个完备事件组,故P{X = x1} + P{X = x2} + … + P{X = x k} + … = P (Ω) = 1,即p (x1) + p (x2) + … + p (xk) + … = 1.例设盒中有2个红球3个白球,从中任取3球,以X表示取得的红球数.求X的分布列.解:X 的全部可能取值0, 1, 2 ,样本点总数为n=⎜⎜⎟⎟=10,⎛5⎞⎝3⎠⎛3⎞1⎟X = 0表示“取到3个白球”,所含样本点个数为k0=⎜=1,有p(0)==0.1,⎜3⎟10⎝⎠⎛3⎞⎛2⎞6⎟⎜⎟X = 1表示“取到1个红球2个白球”,所含样本点个数为k1=⎜=6,有p(1)==0.6,⎜2⎟⎜1⎟10⎝⎠⎝⎠⎛3⎞⎛2⎞3⎟⎜⎟X = 2表示“取到2个红球1个白球”,所含样本点个数为k2=⎜=3,有p(2)==0.3.⎜1⎟⎜2⎟10⎝⎠⎝⎠故X的分布列为XP012. 0.10.60.3求离散型随机变量X的概率分布步骤:(1)找出X的全部可能取值,(2)将X的每一取值表示为事件,(3)求出X的每一取值的概率.例现有10件产品,其中有3件不合格.若不放回抽取,每次取一件,直到取得合格品为止.用X表示抽取次数,求X的概率分布.解:X的全部可能取值1, 2, 3, 4 ,X = 1表示“第1次就取得合格品”,有p(1)=7, 10377,⋅=109303277X = 3表示“第3次取得合格品且前两次是不合格品”,有p(3)=,⋅⋅=109812032171X = 4表示“第4次取得合格品且前三次是不合格品”,有p(4)=,⋅⋅⋅=10987120故X 的分布列为 X = 2表示“第2次取得合格品且第1次是不合格品”,有p(2)= P1030120. 120例上例若改为有放回地抽取,又如何?解:X的全部可能取值1 , 2 , … , n , … ,p(1)=737=0.7,p(2)=⋅=0.21,p(3)=0.32×0.7,…,p(k)=0.3k−1×0.7,…, 101010 k=1,2,L;故X的概率函数为p(k)=0.3k−1×0.7,X的分布列为XPk.0.70.210.32×0.7L0.3k−1×0.7L123C,k = 1, 2, 3, 4,且C为常数. k求:(1)C的值,(2)P{X = 3},(3)P{X < 3}.CCC解:(1)由正则性知:p(1)+p(2)+p(3)+p(4)=C+++=1,即C=1,故C=. 1225234例若离散型随机变量的概率函数为p(k)=(2)P{X=3}=p(3)=4, 2512618+=. 252525(3)P{X<3}=p(1)+p(2)=2.1.3. 随机变量的分布函数连续型随机变量在单个点取值概率为零,如电子元件使用寿命恰好为1000小时这个事件的概率就等于零,因此连续型随机变量不能考虑概率函数.为了用单独一个变量表示一个区间,特别地取区间(−∞, x].定义随机变量X与任意实数x,称F(x) = P{X ≤ x},−∞< x < +∞为X的累积分布函数(Cumulative Distribution Function,CDF),简称分布函数.P{a < X ≤ b} = P{X ≤ b} − P{X ≤ a} = F(b) − F(a),P{X > a} = 1 − P{X ≤ a} = 1 −F(a),由概率的连续性知P{X<a}=lim−P{X≤x}=lim−F(x)=F(a−0),且P{X = a} = P{X ≤ a} − P{X < a} = F(a) − F(a – 0),x→ax→a可见X在任一区间上或任一点取值的概率都可用分布函数表示.例已知随机变量X的分布列为XP0120.20.50.3,求X的分布函数.解:X的全部可能取值为0, 1, 2,当x < 0时,F(x) = P{X ≤ x} = P (∅) = 0,当0 ≤ x < 1时,F(x) = P{X ≤ x} = p(0) = 0.2,当1 ≤ x < 2时,F(x) = P{X ≤ x} = p(0) + p(1) = 0.7,当x ≥ 2时,F(x) = P{X ≤ x} = P (Ω ) = 1,⎧0,⎪0.2,⎪故F(x)=⎨⎪0.7,⎪⎩1,F(x)=P{X≤x}=x<0,0≤x<1,1≤x<2,x≥2.若离散型随机变量的全部可能取值为x1, x2, ……,概率函数p (xk ) = pk,k = 1, 2, ……,则分布函数xk≤x∑p(xk).且离散型随机变量的分布函数F(x)是单调不减的阶梯形函数,X的每一可能取值xk 是F(x)的跳跃点,跳跃高度是相应概率p (xk ).⎧0,⎪0.3,⎪⎪例已知某离散型随机变量X的分布函数为F(x)=⎨0.4,⎪0.6,⎪⎪⎩1,x<−1−1≤x<0,0≤x<2, 求X的分布列.2≤x<5,x≥5,解:X的全部可能取值是F(x)的跳跃点,即−1, 0, 2, 5,跳跃高度依次为:p(−1) = 0.3 − 0 = 0.3;p(0) = 0.4 − 0.3 = 0.1;p(2) = 0.6 − 0.4 = 0.2;p(5) = 1 − 0.6 = 0.4.故X的分布列为XP−10250.30.10.20.4.分布函数的基本性质:(1)单调性,F(x) 单调不减,即x1 < x2时,F(x1) ≤ F(x2);(2)正则性,F(−∞) = 0,F(+∞) = 1;(3)连续性,F(x) 右连续,即limF(x)=F(x0). +x→x0证:(1)当x1 < x2时,{X ≤ x1} ⊂ {X ≤ x2},有F(x1) ≤ F(x2);(2)F(−∞) = P{X < −∞} = P (∅) = 0,F(+∞) = P{X < +∞} = P (Ω ) = 1;(3)任取单调下降且趋于x0的数列{xn},有lim{X≤xn}=I{X≤xn}={X≤x0},n→∞n=1∞⎛∞⎞根据概率的连续性知limP{X≤xn}=P⎜{X≤x}F(x)=F(x0). n⎟⎜I⎟=P{X≤x0},即xlim+n→∞→x0⎝n=1⎠但F(x)不一定左连续,任取单调增加且趋于x0的数列{xn},⎛∞⎞⎟有lim{X≤xn}=U{X≤xn}={X<x0},得limP{X≤xn}=P⎜{X≤x}Un⎜⎟=P{X<x0},n→∞n→∞n=1⎝n=1⎠故lim−F(x)=P{X<x0}=F(x0)−P{X=x0}.x→x0∞2.1.4. 连续随机变量的概率密度函数离散型随机变量的全部可能取值是有限或可列个点,连续型随机变量的全部可能取值是实数区间.但连续型随机变量在单独一个点取值的概率为0,其概率函数无实际意义,对于连续随机变量通常考虑其在某个区间上取值的概率,这就需要讨论分布函数.连续型随机变量的分布函数是连续函数.注意:概率为0的事件不一定是不可能事件.定义随机变量X的分布函数F(x),若存在函数p(x),使F(x)=∫x−∞p(u)du,则称X为连续型随机变量,p(x)为X的概率密度函数(可以理解为:p(u)为概率密度,p(u)du为X在该小区间内取值的概率,∫x−∞为从−∞到x无限求和.几何意义:在平面上作出密度函数p(x)的图形,则阴影部分的面积即为F(x)的值.密度函数基本性质:(1)非负性p(x) ≥ 0;+∞(2)正则性∫p(x)dx=1.−∞因∫x−∞p(u)du=F(x),有∫+∞−∞p(x)dx=F(+∞)=1.连续型随机变量的性质:设连续型随机变量X的概率密度函数为p (x),分布函数为F(x),则有(1)P{x1<X≤x2}=F(x2)−F(x1)=∫(2)当p(x) 连续时,p(x) = F ′(x);因F(x)=∫x−∞x2x1p(x)dx;p(u)du,当p(x) 连续时,有F′(x)=[∫x−∞p(u)du]′=p(x)(3)X在单独一个点取值的概率为0,其分布函数为连续函数;随机变量在某区间内的(4)P{x1 < X ≤ x2} = P{x1 ≤ X ≤ x2} = P{x1 < X < x2} = P{x1 ≤ X < x2},即连续型...概率与区间开闭无关,离散型则不成立;(5)只在有限个点上取值不相同的密度函数对应于同一个分布函数,一般,只在概率为0的数集上取值不相同的密度函数都对应于同一个分布函数.例设F (x) = A + B arctan x为某连续型随机变量X的分布函数.求:(1)A, B;(2)P{−1≤X≤};(3)密度函数p (x).解:(1)由正则性F (−∞) = 0,F (+∞) = 1,得:lim(A+Barctanx)=A−x→−∞ππB=0,lim(A+Barctanx)=A+B=1,x→+∞221故A=1,B=;π(2)F(x)=11⎛11π⎞⎡11⎛π⎞⎤7+arctanx,得P{−1≤X≤}=F(3)−F(−1)=⎜+⋅⎟−⎢+⋅⎜−⎟⎥=.2π⎝2π3⎠⎣2π⎝4⎠⎦121.π(1+x2)(3)密度函数p(x)=F′(x)=例已知⎧C(x2−x3),0<x<1,p(x)=⎨其它,⎩0,是某连续型随机变量X的密度函数,1求:(1)C,(2)P{−1<X<,(3)分布函数F (x).2解:(1)由正则性:∫1+∞−∞p(x)dx=1,111x3x4C23得∫C(x−x)dx=C(−=C(−−0==1,03403412故C = 12;12xx1115(2)P{−1<X<=∫p(x)dx=∫12(x2−x3)dx=12(−=12(−)=;2340246416(3)X的全部可能取值为 [0, 1],分段点0, 1,当x < 0时,F(x)=∫x12−112034−∞p(u)du=0,xxxu3u423当0 ≤ x < 1时,F(x)=∫p(u)du=∫12(u−u)du=12(−=4x3−3x4,0−∞340当x ≥ 1时,F(x)=∫x−∞p(u)du=∫12(u2−u3)du=1,1x<0,⎧0,⎪故F(x)=⎨4x3−3x4,0≤x<1,⎪1,x≥1.⎩例已知⎧|x|,−1<x<1,p(x)=⎨0,,其它⎩是某连续型随机变量X的密度函数,求分布函数F (x).解:分段点−1, 0, 1,当x < −1时,F(x)=∫x−∞p(u)du=0;xxx当−1 ≤ x < 0时,F(x)=∫x−∞u2p(u)du=∫(−u)du=−−12x−1x211−x2;=−+=222u2当0 ≤ x < 1时,F(x)=∫p(u)du=∫(−u)du+∫udu=−0−∞−12当x ≥ 1时,F(x)=∫x−1u2+2x1x21+x2=0++=;222−∞p(u)du=∫(−u)du+∫udu=1.−101x<0,⎧0,2⎪1−x,−1≤x<0,⎪⎪2故F(x)=⎨ 2+1x⎪,0≤x<1,⎪2⎪x≥1.⎩1,§2.2 随机变量的数学期望对于随机变量,还应当掌握反映其平均值、分散程度等的指标,这就需要引入数学期望和方差等概念.2.2.1. 数学期望的概念例甲、乙两个射击选手,在射击训练中甲射了10次,其中3次10环,1次9环,4次8环,2次7环;乙射了15次,其中2次10环,9次9环,2次8环,2次7环.问谁的表现更好?分析:比较他们射中的平均环数85=8.5环; 10131乙共射中2 × 10 + 9 × 9 + 2 × 8 + 2 × 7 = 131环,平均每次射中=&8.73环.故乙的表现更好. 15一般地,若在n次试验中,出现了m1次x1,m2次x2,…,mk次xk ,(其中m1 + m2 + … + mk = n),甲共射中3 × 10 + 1 × 9 + 4 × 8 + 2 × 7 = 85环,平均每次射中km1x1+m2x2++mkxkm则平均值为=∑xii,即平均值等于取值与频率乘积之和. nni=1因n很大时,频率稳定在概率附近,即平均值将稳定在取值与概率乘积之和附近.2.2.2. 数学期望的定义定义设离散型随机变量X的分布列是⎛x1X~⎜⎜p(x)1⎝∞Lx2p(x2)LL⎞xk⎟, p(xk)L⎟⎠,记为E (X ).如果级数∑xkp(xk)绝对收敛,则称之为X的数学期望(Expectation)k=1数学期望的实际意义是反映随机变量的平均取值,是其全部可能取值以相应概率为权数的加权平均.14⎞⎛−20 如X的分布列为⎜⎟,则E(X) = (−2) × 0.3 + 0 × 0.1 + 1 × 0.4 + 4 × 0.2 = 0.6.⎜0.30.10.40.2⎟⎠⎝例某人有4发子弹,现在他向某一目标射击,若命中目标就停止射击,否则直到子弹用完为止.设每发子弹命中率为0.4,以X表示射击次数,求E (X ).解:先求X的分布列,X的全部可能取值为1, 2, 3, 4,X = 1,第一枪就命中, p (1) = 0.4;X = 2,第一枪没有命中,第二枪命中,p (2) = 0.6 × 0.4 = 0.24;X = 3,前两枪没有命中,第三枪命中,p (3) = 0.6 2 × 0.4 = 0.144;X = 4,前三枪没有命中, p (4) = 0.6 3 = 0.216.234⎞⎛1则X的分布列为⎜⎜0.40.240.1440.216⎟⎟,⎝⎠故E (X ) = 1 × 0.4 + 2 × 0.24 + 3 × 0.144 + 4 × 0.216 = 2.176.⎛(−2)k例若X的概率函数为p⎜⎜k⎝∞⎞1 ⎟⎟=2k,k=1,2,L,求E(X).⎠∞(−2)k1(−1)k收敛但不是绝对收敛,故E (X ) 不存在.解:因∑⋅k=∑kk2k=1k=1离散型随机变量的数学期望是取值乘概率求和:∑xkp(xk),类似可定义连续型随机变量的数学期望k=1∞是取值乘密度积分:∫xp(x)dx.−∞+∞定义设连续型随机变量X的密度函数为p(x).如果广义积分∫xp(x)dx绝对收敛,则称之为X的数学期−∞+∞望,记为E (X ).例已知连续型随机变量X 的密度函数为⎧2x,0<x<1, p(x)=⎨0,其它.⎩求E (X ). x3解:E(X)=∫xp(x)dx=∫x⋅2xdx=2⋅−∞03+∞11=02. 3例已知X 的密度函数为⎧a+bx,0<x<2, p(x)=⎨0,其它.⎩且E(X)=2,求a, b. 3+∞x2解:由正则性得∫p(x)dx=∫(a+bx)dx=(ax+b⋅=2a+2b=1,−∞02022又E(X)=∫xp(x)dx=∫−∞+∞2082x2x3x(a+bx)dx=(a⋅+b⋅)=2a+b=, 2303321. 2例已知X 的密度函数为故a=1,b=−p(x)=求E (X ).1,−∞<x<+∞,π(1+x2)解:因∫xp(x)dx=∫−∞+∞+∞+∞x11122dx=⋅d(x)=ln(1+x)发散,∫−∞π(1+x2)2−∞−∞π(1+x2)2π+∞故E (X )不存在.2.2.3. 数学期望的性质设X为随机变量,g (x) 为函数,则称Y = g (X ) 为随机变量函数,Y也是一个随机变量.下面不加证明地给出随机变量函数的数学期望计算公式.定理设X为随机变量,Y = g (X ) 为随机变量函数,则(1)若X为离散型随机变量,概率函数为p(xk ), k = 1, 2, …,则E(Y)=E[g(X)]=∑g(xk)p(xk);k=1∞(2)若X为连续型随机变量,密度函数为p (x),则E(Y)=E[g(X)]=∫g(x)p(x)dx.−∞+∞数学期望具有以下性质:(1)常数的期望等于其自身,即E (c) = c;(2)常数因子可移到期望符号外,即E (aX ) = a E (X );(3)随机变量和的期望等于期望的和,即E [g1 (X ) + g2 (X )] = E [g1 (X )] + E [g2 (X )].证明:(1)将常数c看作是单点分布p (c) = 1,故E (c) = c p (c) = c;(2)以连续型为例加以证明,E(aX)=∫axp(x)dx=a∫xp(x)dx=aE(X);−∞−∞+∞+∞(3)以连续型为例加以证明,E[g1(X)+g2(X)]=∫[g1(x)+g2(x)]p(x)dx=∫g1(x)p(x)dx+∫g2(x)p(x)dx −∞−∞−∞+∞+∞+∞= E [g1 (X )] + E [g2 (X )].由性质(2)、(3)知随机变量线性组合的期望等于期望的线性组合,可见数学期望具有线性性质.例设X的分布列为12⎞⎛−10⎜⎜0.20.10.40.3⎟⎟,⎝⎠求E (2X +1),E (X 2).解:E (2X +1) = −1 × 0.2 + 1 × 0.1 + 3 × 0.4 + 5 × 0.3 = 2.6;E (X 2) = 1 × 0.2 + 0 ×0.1 + 1 × 0.4 + 4 × 0.3 = 1.8.例已知圆的半径X是一个随机变量,密度函数为⎧1⎪,1<x<3, p(x)=⎨2⎪⎩0,其他.求圆面积Y的数学期望.解:圆面积Y = π X 2,1πx故E(Y)=∫πx2p(x)dx=∫πx2⋅=⋅−∞1223+∞333=113π. 3例设国际市场对我国某种出口商品的需求量X(吨)的密度函数为⎧1⎪,2000<x<4000, p(x)=⎨2000⎪其他.⎩0,设每售出一吨,可获利3万美元,但若销售不出,每积压一吨将亏损1万美元,问如何计划年出口量,能使国家获利的期望最大.解:设计划年出口量为a吨,每年获利Y万美元.当X ≥ a时,销售a吨,获利3a万美元;当X < a时,销售X吨,积压a − X吨,获利3X − (a − X) = 4X − a万美元;a≤X≤4000,⎧3a,即Y=g(X)=⎨ 4X−a,2000≤X<a.⎩则E(Y)=∫g(x)p(x)dx=∫−∞+∞a2000(4x−a)⋅a40001113a4000dx+∫3a⋅dx=+x(2x2−ax)a20002000200020002000a11a2+7a−4000=−(a−3500)2+8250, 10001000故计划年出口量为3500吨时,使国家获利的期望最大.=−§2.3 随机变量的方差与标准差数学期望反映平均值,方差反映波动程度.如甲、乙两台包装机,要求包装重量为每袋500克,现各取5袋,重量为甲:498,499,500,501,502;乙:490,495,500,505,510.二者平均值相同都是500克,但显然甲比乙好.此时比较的是它们的偏差(即取值与平均值之差).偏差:甲:−2,−1,0,1,2;乙:−10,−5,0,5,10.2.3.1. 方差的定义定义随机变量X与其数学期望E (X ) 之差X − E (X ) 称为偏差.偏差有大有小,可正可负,比较时需要去掉符号,但绝对值函数进行微积分处理不方便,因此考虑偏差平方的数学期望.定义随机变量X,若E [X − E (X )]2存在,则称之为X的方差(Variance),记为Var (X ) 或D (X ).即Var (X ) = E [X − E (X )]2.显然方差Var (X ) ≥ 0,称X)为X的标准差(Standard Deviation).在实际问题中,标准差与随机变量有相同的量纲.方差与标准差反映波动程度.方差越大,取值越分散;方差越小,取值越集中.例设X的分布列为23⎞⎛1⎜⎜0.20.40.4⎟⎟,⎝⎠求E (X ), Var (X ).解:E (X ) = 1 × 0.2 + 2 × 0.4 + 3 × 0.4 = 2.2;Var (X ) = (−1.2)2 × 0.2 + (−0.2)2 × 0.4 + 0.82 × 0.4 = 0.56.例已知X 的密度函数为⎧2x,0<x<1,p(x)=⎨ 0,其他.⎩求E (X ), Var (X ). x3解:E(X)=∫xf(x)dx=∫x⋅2xdx=2⋅−∞03+∞11=02; 31128884⎞1841⎛2Var(X)=∫(x−2p(x)dx=∫(2x3−x2+x)dx=⎜x4−x3+x2⎟=−+=.0−∞33 999⎠029918⎝4+∞例已知X的全部可能取值为0, 1, 2,且E (X ) = 1.3,Var (X ) = 0.81.求X的分布列.⎛012⎞解:设X的分布列为⎜⎜abc⎟⎟,⎝⎠由正则性得:a + b + c = 1,且E (X ) = 0 × a + 1 × b + 2 × c = b + 2c = 1.3,Var (X ) = (−1.3)2 × a + (−0.3)2 × b + 0.72 × c = 1.69a + 0.09b + 0.49c = 0.81,解得a = 0.3,b = 0.1,c = 0.6,12⎞⎛0故X的分布列为⎜⎜0.30.10.6⎟⎟.⎝⎠2.3.2. 方差的性质方差具有以下性质:(1)方差计算公式:Var (X ) = E (X 2) − [E (X )]2;(2)常数的方差等于零,即Var (c) = 0;(3)设a, b为常数,则Var (a X + b) = a 2 Var (X ).证:(1)Var (X ) = E [X − E (X )]2 = E [X 2 − 2X ⋅ E (X ) + E (X )2] = E (X 2 ) − 2E (X ) ⋅ E (X ) + [E (X )]2.= E (X 2) − [E (X )]2;(2)Var (c) = E [c − E (c)]2 = E (c − c)2 = E (0) = 0;(3)Var (a X + b) = E [(a X + b) − E (a X + b)]2 = E [a X + b − a E (X ) − b]2 = a 2 E [X − E (X )]2 = a 2 Var (X ).由性质(1),显然有以下推论:推论对于随机变量X,如果E (X 2) 存在,则E (X 2) ≥ [E (X )]2.以后常利用方差计算公式Var (X ) = E (X 2) − [E (X )]2计算随机变量的方差.通常用公式计算比直接用定义计算方差要方便.例设X的分布列为23⎞⎛1⎜⎜0.20.40.4⎟⎟,⎝⎠求Var (X ).解:前面已求得E (X ) = 2.2,因E (X 2) = 1 2 × 0.2 + 2 2 × 0.4 + 3 2 × 0.4 = 5.4,故Var (X ) = E (X 2) − [E (X )]2 = 5.4 − 2.22 = 0.56.例已知X 的密度函数为⎧2x,0<x<1, p(x)=⎨其他0,.⎩求Var (X ).解:前面已求得E(X)=12, 31x422因E(X)=∫x⋅2xdx=2⋅0422=01, 221⎛2⎞1.故Var(X)=E(X)−[E(X)]=−⎜⎟=2⎝3⎠18对于随机变量X,若方差Var (X ) 存在,且Var (X ) > 0.令X*=有X−E(X)Var(X),⎛X−E(X)⎞11⎟=E(X*)=E⎜E[X−E(X)]=[E(X)−E(X)]=0;⎜⎟⎝⎠⎛X−E(X)⎞11⎟=Var(X*)=Var⎜Var[X−E(X)]=Var(X)=1.⎜Var(X)⎟Var(X)Var(X)⎝⎠称X *为X的标准化随机变量.2.3.3. 切比雪夫不等式方差反映随机变量的分散程度,切比雪夫不等式给出其定量标准.切比雪夫不等式表明大偏差概率的上限与方差成正比.定理设X为随机变量,且方差Var (X ) 存在,则对于任何正数ε ,都有P{|X−E(X)|≥ε}≤Var(X)ε2.证明:以连续型随机变量为例证明,设X的密度函数为p (x),有P{|X−E(X)|≥ε}=|x−E(X)|≥∫p(εx)dx,且ε2Var(X)ε2=1ε2E[X−E(X)]=∫+∞2+∞[x−E(X)]2−∞ε2Var(X)p(x)dx,故P{|X−E(X)|≥ε}≤注:切比雪夫不等式的等价形式|x−E(X)|≥ε∫[x−E(X)]2p(x)dx≤∫[x−E(X)]2−∞ε2p(x)dx=ε2,得证.P{|X−E(X)|<ε}≥1−Var(X)ε2.如随机变量X的数学期望为E (X ) = 10,方差Var (X ) = 1,则由切比雪夫不等式可得13=. 224例设随机变量X的全部可能取值为[0,+∞),且数学期望E (X ) 存在,试证:对任何正数a,都有P{8<X<12}=P{|X−10|<2}≥1−1E(X). a证明:以连续型随机变量为例证明,设X的密度函数为p (x),+∞+∞x11+∞有P{X≥a}=∫p(x)dx,且E(X)=∫xp(x)dx=∫p(x)dx,0aaaa−∞+∞x+∞x1故P{X≥a}≤∫p(x)dx≤∫p(x)dx=E(X),得证.aa0aa定理设随机变量X的方差存在,则Var (X ) = 0的充分必要条件是存在常数b,使得X几乎处处收敛于b,即P{X = b} = 1.证:充分性,设存在常数b,使得P{X = b} = 1,有P{X ≠ b} = 0,即E (X ) = b P{X = b} = b,故Var (X ) = E [X − E (X )]2 =E (X − b)2 = 0 × P{X = b} = 0;必要性,设X的方差Var (X ) = 0,P{X≥a}≤1⎫1⎫⎧⎧因事件{|X−E(X)|>0}=U⎨|X−E(X)|≥⎬=lim⎨|X−E(X)|≥,n⎭n→+∞⎩n⎭n=1⎩⎛+∞⎧则P{|X−E(X)|>0}=P⎜⎜U⎨|X−E(X)|≥⎝n=1⎩1⎫⎞⎧limP=⎨|X−E(X)|≥⎬⎟n→+∞n⎭⎟⎩⎠1⎫Var(X)lim≤=0,⎬n⎭n→+∞⎛1⎞2⎜⎟⎝n⎠+∞可得P{| X − E (X )| > 0} = 0,即P{| X − E (X )| = 0} = 1,取b = E (X ),有b为常数,故P{X = b} = 1.注:如果P{X = b} = 1,记为X = b, a.e.(或a.s.),称为X = b几乎处处成立(或几乎必然成立).这里,a.e.就是almost everywhere的缩写,a.s.就是almost surely 的缩写.意味着不成立的情况是一个测度(或概率)等于零的集合(或事件).§2.4 常用离散分布对于一个给定的函数,只要满足概率函数的两条基本性质:非负性、正则性,都可以成为某个离散随机变量的概率函数.但绝大多数在实际工作中并不常见,下面是几种常用的概率函数.2.4.1. 两点分布与二项分布一.两点分布两点分布只可能在两个点取值,通常就是0或1.定义随机变量的可能取值只有两个:0或1,且概率函数为p (0) = 1 − p,p (1) = p,其中0 < p < 1,⎛0称X服从两点分布(Two-point Distribution)或0-1分布,记为X ~ (0-1).分布列为⎜⎜1−p⎝1⎞⎟. p⎟⎠两点分布实际背景是一次伯努利试验.通常描述为:X表示一次伯努利试验中事件A发生的次数.非负性:p (0) = 1 − p > 0,p (1) = p > 0;正则性:(1 − p) + p = 1.两点分布的数学期望为E (X ) = 0 × (1 − p) + 1 × p = p.又因E (X 2 ) = 02 × (1 − p) + 12 × p = p,故方差为Var (X ) = E (X 2 ) − [E (X )]2 = p − p2 = p(1 − p).二.二项分布在n重伯努利试验中,以X表示事件A的发生次数,则X的全部可能取值为0, 1, 2, …, n ,且⎛n⎞kn−k⎟P{X=k}=⎜p−p. (1)⎜k⎟⎝⎠定义若离散型随机变量X的概率函数为⎛n⎞kn−kp(k)=⎜⎟p(1−p),k = 0, 1, 2, …, n ;0 < p < 1,⎜k⎟⎝⎠则称X 服从二项分布(Binomial Distribution),记为X ~ b (n, p).二项分布的实际背景是n重伯努利试验.当n = 1时,二项分布就是两点分布.⎛n⎞kn−k非负性:p(k)=⎜⎟p(1−p)>0;⎜k⎟⎝⎠⎛n⎞kn−kn⎟正则性:∑p(k)=∑⎜p(1−p)=[p+(1−p)]=1.⎜k⎟k=1k=1⎝⎠nn例掷三枚硬币,X表示正面朝上的次数,求X的概率分布.解:X的全部可能取值为0, 1, 2, 3 ,将掷每一枚硬币看作一次试验.每次试验两种结果:正面A,反面;每次试验相互独立;每次试验概率P(A)=0.5.即n重伯努利试验,n = 3,p=0.5,有X ~ b (3, 0.5),p (0) = 0.5 3 = 0.125,⎛3⎞12p(1)=⎜⎟×0.5×0.5=0.375,⎜1⎟⎝⎠⎛3⎞21⎟p(2)=⎜×0.5×0.5=0.375,⎜2⎟⎝⎠p (3) = 0.5 3 = 0.125.例现有5台机床,每台机床一小时内平均开动18分钟,且是否开动相互独立,以X表示同一时刻开动的机床数,求X的概率分布.解:X的全部可能取值为0, 1, 2, 3, 4, 5 ,将每台机床是否开动看作一次试验.每次试验两种结果:开动A,不开动;每次试验相互独立;每次试验概率P (A) = 0.3.即n重伯努利试验,n = 5,p = 0.3,有X ~ b (5, 0.3).p (0) = 0.7 5 = 0.16807,⎛5⎞14p(1)=⎜⎟×0.3×0.7=0.36015,⎜1⎟⎝⎠⎛5⎞23⎟×0.3×0.7=0.3087, p(2)=⎜⎜2⎟⎝⎠⎛5⎞32p(3)=⎜⎟×0.3×0.7=0.1323,⎜3⎟⎝⎠⎛5⎞41p(4)=⎜⎟×0.3×0.7=0.02835,⎜4⎟⎝⎠p (5) = 0.3 5 = 0.00243 .一般地,如果随机变量X服从二项分布,概率函数值p (k) 将随着k的增加,先逐渐增加,达到最大值后,又逐渐减少.通常,一个随机变量X的概率函数或密度函数的最大值点称为X的最可能值.二项分布b (n, p)的最可能值为当(n+1)p不是正整数时,⎧[(n+1)p], k0=⎨np或np当np是正整数时(+1)(+1)−1,(+1).⎩这里[x]表示不超过x的最大整数.如[2.3] = 2,[3.14] = 3,[−1.2] = −2.⎛n⎞kn!n−k⎟p(1p)−=pk(1−p)n−k,0≤k≤n,证:若X ~ b (n, p),有p(k)=⎜⎜k⎟k!(n−k)!⎝⎠则p(k)−p(k−1)=n!n!pk−1(1−p)n−k+1 pk(1−p)n−k−(k−1)!(n−k+1)!k!(n−k)!=1−p⎞n!⎛ppk−1(1−p)n−k⋅⎜−⎟ (k−1)!(n−k)!⎝kn−k+1⎠(n+1)p−kn!,pk−1(1−p)n−k⋅(k−1)!(n−k)!k(n−k+1)=当k < (n + 1) p时,有p (k) > p (k − 1);当k > (n + 1) p时,有p (k) < p (k − 1).如果(n + 1) p不是正整数,取k0 = [(n + 1) p],有k0 < (n + 1) p,即p (k0) > p (k0 − 1);且k0 + 1 > (n + 1) p,即p (k0 + 1) < p (k0).故p (k0) 为最大值.如果(n + 1) p是正整数,取k0 = (n + 1) p,即p (k0) = p (k0 − 1),故p (k0) 和p (k0 − 1) 都是最大值.如X ~ B (3, 0.5),有(n + 1) p = 4 × 0.5 = 2是正整数,最可能值k0 = 2或1;X ~ B (5, 0.3),有(n + 1) p = 6 × 0.3 = 1.8不是正整数,最可能值k0 = [1.8] = 1.三.二项分布的数学期望和方差⎛n⎞(n−1)!n!nn⎛n−1⎞⎟.组合数公式⎜==⋅=⎟,(n ≥ k > 0)⎜k−1⎟⎜k⎟k!⋅(n−k)!k(k−1)!⋅(n−k)!k⋅⎜⎠⎝⎝⎠二项分布b (n, p)的数学期望为nn⎛n−1⎞k−1⎛n⎞kn⎛n−1⎞kn−kn−k⎟⎟⎜⎟⎜E(X)=∑k⋅⎜(1)ppkp(1p)npp(1−p)n−k −=−=⋅⋅∑∑⎟⎟⎜⎜⎜k⎟k⎝k−1⎠k=0k=1k=1⎝k−1⎠⎝⎠n= np [ p + (1 − p)]n − 1 = np.又因nn⎛n⎞k⎛n−1⎞k⎛n⎞kn−kn−kn−k2⎟⎜⎟⎟⎜E(X)=∑k⋅⎜ppkk(1)()ppk(1)p(1−p)−+⋅−=−⋅∑∑⎜k⎟⎜k−1⎟⎜k⎟k=0k=0k=0⎝⎠⎠⎝⎝⎠2n2=∑(k2−k)⋅k=2nnn(n−1)⎛n−2⎞k⎟⎜p(1−p)n−k+E(X) ⎟⎜k(k−1)⎝k−2⎠=n(n−1)p2⎛n−2⎞k−2n−k⎟⎜p(1−p)+np ∑⎜k−2⎟k=2⎝⎠= n(n − 1) p2 [ p + (1 − p)]n − 2 + np = (n2 − n) p2 + np,故方差为Var (X ) = E (X 2 ) − [E (X )]2 = (n2 − n) p2 + np − (np)2 = − np2 + np = np (1 − p).2.4.2. 泊松分布一.泊松分布泊松分布是一种理论推导的极限分布(成立的条件和推导过程见附录).定义若随机变量X 的概率函数为k!则称X服从参数为λ 的泊松分布(Poisson’s Distribution),记为X ~ P (λ).泊松分布的实际背景是已知平均发生次数为常数λ ,实际发生次数的概率分布.如足球比赛进球数,商店进店人数,电话接听次数等.非负性:λ > 0时,正则性:∑∞p(k)=λke−λ,k = 0, 1, 2, …… ;λ > 0,λkk!e−λ>0;λkk!⋅e−λ=eλ⋅e−λ=1.k=0例已知一场足球比赛的进球数X 服从参数λ = 2.3的泊松分布,求比分为0:0, 1:0以及总进球数超过5个的概率.2.3k−2.3解:因X ~ P(2.5),则p(k)=e,k = 0, 1, 2, ……. k!2.30−2.3比分0:0,即X = 0,p(0)=e=e−2.3=0.100(查表); 0!2.31−2.3比分1:0,即X = 1,p(1)=e=2.3e−2.3=0.331−0.100=0.231(查表); 1!52.3k−2.32.3k−2.3总进球数超过5个,即X > 5,P{X>5}=∑.=1−∑e=1−0.970=0.030(查表)ekk!!k=6k=0∞例已知某公用电话每小时内打电话的人数X服从参数为λ = 8的泊松分布.求某一小时内无人打电话的概率,恰有10人打电话的概率,至少有10人打电话的概率.8k−8e.解:因X ~ P(8),有P{X=k}=k!80−8无人打电话的概率P{X=0}=e=e−8=0.0003, 0!810−8恰有10人打电话的概率P{X=10}=e=0.816−0.717=0.099(查表), 10!8k−8至少有10人打电话的概率P{X≥10}=∑.e=1−P{X≤9}=1−0.717=0.283(查表)k!k=10∞例已知某商店一天中某种贵重商品的销售件数X服从泊松分布P (7),问该商店每天应该准备多少件该商品才能以99.9%以上的概率满足顾客需要?7k−7解:设准备了a件该商品,X ~ P(7),则p(k)=e. k!事件“满足顾客需要”,即X ≤ a,有P{X ≤ a} ≥ 0.999,故查表可得a = 16.泊松分布P (λ )的最可能值为当λ不是正整数时,⎧[λ], k0=⎨⎩λ或λ−1,当λ是正整数时.证:若X ~ P(λ),有p(k)=故p(k)−p(k−1)= λkk!−λe−λ,k=0,1,2,L,λkk!e−λk−1(k−1)!e−λλλ−k⎛λ⎞=e⋅⎜−1⎟=e−λ⋅,k(k−1)!⎝k⎠(k−1)!−λλk−1k−1当k < λ 时,有p (k) > p (k − 1);当k > λ 时,有p (k) < p (k − 1).如果λ 不是正整数,取k0 = [λ ] ,有k0 < λ ,即p (k0) > p (k0 − 1);且k0 + 1 > λ ,即p (k0 + 1) < p (k0).故p (k0) 为最大值.如果λ 是正整数,取k0 = λ ,即p (k0) = p (k0 − 1),故p (k0) 和p (k0 − 1) 都是最大值.二.泊松分布的数学期望和方差泊松分布P (λ )的数学期望为E(X)=∑k⋅k=0∞λkk!e−λ=∑k=1∞λk(k−1)!e−λ=λe⋅∑−λk=1∞λk−1(k−1)!=λe−λ⋅eλ=λ,即泊松分布的参数λ 反映平均发生次数.又因E(X)=∑k⋅22k=0∞λkk!e−λ=∑(k−k)⋅2k=0∞λkk!e−λ+∑k⋅k=0∞λkk!e−λ=λe⋅∑2−λk=2∞λk−2(k−2)!+E(X)= λ 2 e −λ ⋅ e λ + λ = λ 2 + λ ,故方差为Var (X ) = E (X 2 ) − [E (X )]2 = λ 2 + λ − (λ )2 = λ .三.二项分布的泊松近似二项分布与泊松分布的实际背景都是反映发生次数问题.下面的定理说明了二者之间的联系,泊松分布是二项分布的一种极限分布.定理(泊松定理)在n重伯努利试验中,记事件A在每次试验中发生的概率为与试验次数n有关的数pn ,如果当n → +∞ 时,有n pn → λ ,则⎛n⎞kλk−λn−klim⎜⎟pn(1−pn)=e.n→+∞⎜k⎟k!⎝⎠证:记λ n = n pn ,有limλn=λ,n→+∞因(1−pn)n−k=⎜1−⎛⎝λn⎞⎟n⎠n−k⎛−λn⎞=⎜1+⎟n⎠⎝n−λn(n−k)−λnn,−λn(n−k)⎛−λn⎞−λn=−λ,且lim⎜1+=e,lim⎟n→+∞n→+∞nn⎠⎝n−λn⎞⎛则lim(1−pn)n−k=lim⎜1+⎟n→+∞n→+∞n⎠⎝−λn(n−k)−λnnn=e−λ,⎛n⎞n(n−1)(n−k+1)nk⎛又因⎜=⎜1−⎜k⎟⎟=!!kk⎝⎝⎠1⎞⎛1⎞⎛k−1⎞k−1⎞⎛⎟,且lim⎜1−⎟L⎜1−⎟=1,⎟L⎜1−n→+∞nnn⎠⎝n⎠⎠⎠⎝⎝⎛n⎞knkkk−1⎞1⎞⎛n−kn−k⎛⎟故lim⎜ppppL(1)lim(1)11−=−−−⎜⎟⎜⎟nnnnn→+∞⎜k⎟n→+∞k!n⎠⎝n⎠⎝⎝⎠(npn)k⎛=lim⋅lim(1−pn)n−k⋅lim⎜1−n→+∞n→+∞n→+∞k!⎝1⎞⎛k−1⎞λk−λe.⎟=⎟L⎜1−n⎠⎝n⎠k!此定理表明对于二项分布b (n, p),当n很大,p很小时,可用泊松分布P (λ ) 近似,其中λ = n p.例某地区每年人口意外死亡率为0.0001,现有60000人投保人身意外保险,求一年内因投保人意外死亡恰好赔付8人的概率以及赔付不超过5人的概率.解:设X表示“一年内因投保人意外死亡而赔付的人数”,X ~ B (60000, 0.0001).5⎛60000⎞⎛60000⎞859992k60000−k⎟⎜PX则P{X=8}=⎜×0.0001×0.9999,{≤5}=,∑⎜8⎟⎜k⎟⎟×0.0001×0.9999k=0⎝⎝⎠⎠但显然计算很繁琐,为便于计算,用泊松分布近似.因n = 60000很大,p = 0.0001很小,λ = np = 6,有X~&P(6),568−66k−6e=0.847−0.744=0.103,P{X≤5}≈∑e=0.446.故P{X=8}≈8!k=0k!2.4.3. 超几何分布一.超几何分布在N件产品中,有M件次品,从中不放回地取n件,以X表示取得的次品数.设X取值为k,一方面,显然有k ≤ n且k ≤ M,即k ≤ min{n, M},另一方面,有k ≥ 0且n − k ≤ N − M,可得k ≥ M + n − N,即k ≥ max{0, M + n − N }.这样X的全部可能取值为l, l + 1, …, L,其中l = max{0, M + n − N },L = min{n, M},且⎛M⎞⎛N−M⎞⎜⎜k⎟⎟⎜⎜n−k⎟⎟⎝⎠⎝⎠. P{X=k}=⎛N⎞⎜⎜n⎟⎟⎝⎠定义若随机变量X的概率函数为⎛M⎞⎛N−M⎞⎜⎜k⎟⎟⎜⎜n−k⎟⎟⎝⎠⎝⎠,k = l, l + 1, …, L,l = max(0, n + M − N ),L = min(M, n),M < N,n < N, p(k)= ⎛N⎞⎜⎜n⎟⎟⎝⎠则称X服从超几何分布(Hypergeometric Distribution),记为X ~ h (n, N, M).超几何分布的实际背景是古典概型中的不放回抽样检验问题.注:有放回检验抽样问题对应的是二项分布.⎛M⎞⎛N−M⎞⎜⎜k⎟⎟⎜⎜n−k⎟⎟⎝⎠⎝⎠>0;非负性:⎛N⎞⎜⎜n⎟⎟⎝⎠⎛M⎞⎛N−M⎞⎜⎟⎜⎟L⎜k⎟⎜n−k⎟⎝⎠⎝⎠=正则性:∑⎛N⎞k=0⎜⎜n⎟⎟⎝⎠注:比较(1 + x)(1 + x) M N −M⎛M⎞⎛N−M⎞⎛N⎞⎜∑⎜k⎟⎟⎜⎜n−k⎟⎟⎜⎜n⎟⎟k=l⎝⎠⎝⎠=⎝⎠=1.⎛N⎞⎛N ⎞⎜⎟⎜⎜n⎟⎜n⎟⎟⎝⎠⎝⎠L⎛M⎞⎛N−M⎞⎛N⎞与(1 + x)中x的系数可以证明∑⎜⎜k⎟⎟⎜⎜n−k⎟⎟=⎜⎜n⎟⎟.k=l⎝⎠⎝⎠⎝⎠NnL例一袋中有3个红球,2个白球,不放回地取出3个球,X表示取得的红球数.求X的概率分布.解:不放回抽样,N = 3,M = 2,n = 3,则X ~ h (3, 5, 3).故X的全部可能取值为1, 2, 3,(l = max (0, n + M − N ) = 1,L = min(n, M) = 3),⎛3⎞⎛2⎞⎛3⎞⎛2⎞⎛3⎞⎛2⎞⎜⎟⎜⎟⎜⎜⎟⎜⎟⎜2⎟⎜1⎟⎜3⎟⎟⎜⎜0⎟⎟⎜1⎟⎜2⎟⎝⎠⎝⎠⎝⎠⎝⎠=0.1.⎝⎠⎝⎠P{X=1}==0.3,P{X=2}==0.6,P{X=3}=⎛5⎞⎛5⎞⎛5⎞⎜⎟⎜⎟⎜⎜3⎟⎜3⎟⎜3⎟⎟⎝⎠⎝⎠⎝⎠超几何分布h (n, N, M )的最可能值为M+1M+1⎧[(1)(1)+n+当不是正整数时,n⎪N+2N+2k0=⎨ M+1M+1M+1⎪(n+1)−1,当(n+1)或(n+1)是正整数时.N+2N+2N+2⎩⎛M⎞⎛N−M⎞⎜⎜k⎟⎟⎜⎜n−k⎟⎟(N−M)!M!⎝⎠⎝⎠=1⋅证:若X ~ h(n, N, M),有p(k)=,⋅⎛N⎞⎛N⎞k!(M−k)!(n−k)!(N−M−n+k)!⎜⎟⎜⎜n⎟⎜n⎟⎟⎝⎠⎝⎠故p (k ) − p (k − 1)=M!(N−M)!⎛N⎞⎜⎟k!(M−k)!(n−k)!(N−M−n+k)!⎜n⎟⎝⎠M!(N−M)!−M!(N−M)!⎛N⎞⎜⎟(k−1)!(M−k+1)!(n−k+1)!(N−M−n+k−1)!⎜n⎟⎝⎠[(M −k+1)(n−k+1)−k(N−M−n+k)] =⎛N⎞⎜⎟k!(M−k+1)!(n−k+1)!(N−M−n+k)!⎜n⎟⎝⎠M!(N−M)!⎛N⎞⎜⎟k!(M−k+1)!(n−k+1)!(N−M−n+k)!⎜n⎟⎝⎠=[(M+1)(n+1)−k(N+2)]. M+1M +1时,有p (k) > p (k − 1);当k>(n+1)时,有p (k) < p (k − 1). N+2N+2M+1M+1如果(n+1)不是正整数,取k0=[(n+1), N+2N+2M+1M+1有k0<(n+1),即p (k0) > p (k0 − 1);且k0+1>(n+1),即p (k0 + 1) < p (k0). N+2N+2故p (k0) 为最大值. M+1M+1如果(n+1)是正整数,取k0=(n+1),即p (k0) = p (k0 − 1), N+2N+2故p (k0) 和p (k0 − 1) 都是最大值.二.超几何分布的数学期望和方差超几何分布h (n, N, M )的数学期望为当k<(n+1)L⎛M−1⎞⎛N−M⎞⎛M⎞⎛N−M⎞M⎛M−1⎞⎛N−M⎞⎟⎜⎜⎟⎟⎜⎜⎟⎜∑⎟⎜n−k⎟⎟⎜⎜k−1⎟⎜k−1⎟⎜n−k⎟⎜k⎟⎜n−k⎟LLknMk=l⎝⎠=nM,⎝⎠⎠⎝⎠⎠⎝⎝⎠⎝E(X)=∑k⋅=⋅=∑k⋅NN⎛N−1⎞⎛N⎞N⎛N−1⎞k=lk=l⎜⎟⎜⎟⎜⎟⎜n−1⎟⎟⎜n⎟n⎜⎝⎠⎝n−1⎠⎝⎠又因⎛M⎞⎛N−M⎞⎛M⎞⎛N−M⎞⎛M⎞⎛N−M⎞⎟⎜⎜⎟⎟⎜⎜⎟⎜⎟⎜n−k⎟⎟⎜⎜k⎟⎜k⎟⎜n−k⎟L⎜k⎟⎜n−k⎟LL⎠⎝⎠⎠⎝⎝⎠⎠⎝⎝⎠22⎝2E(X)=∑k⋅+∑k⋅=∑(k−k)⋅⎛N⎞⎛N⎞⎛N⎞k=lk=lk=l⎜⎜⎟⎜⎟⎜n⎟⎟⎜n⎟⎜n⎟⎝⎠⎝⎠⎝⎠M(M−1)⎛M−2⎞⎛N−M⎞⎟⎜⎟⎜n−k⎟⎟⎜k2−k(k−1)⎜⎠⎠⎝⎝N(N−1)⎛N−2⎞⎜⎟⎜n(n−1)⎝n−2⎟⎠19=∑(k2−k)⋅k=lL+E(X)⎛M−2⎞⎛N−M⎞⎟⎜⎟⎜∑⎟⎜⎟⎜k2nk−−n(n−1)M(M−1)k=l⎝⎠+nM=n(n−1)M(M−1) +nM,⎝⎠⋅=N(N−1)NN(N−1)N⎛N−2⎞⎜⎟⎜n−2⎟⎝⎠L故方差为nM(n−1)(M−1)nMn2M2nM(N−M)(N−n).Var(X)=E(X)−[E(X)]=+−=N(N−1)NN2N2 (N−1)22为了便于记忆,可将超几何分布与二项分布的数学期望和方差进行比较.二项分布b (n, p):数学期望E (X ) = np,方差Var (X ) = np (1 − p);超几何分布h (n, N, M ):数学期望E(X)=n可见分布h (n, N, M )中的MM⎛M⎞N−n,方差Var(X)=n;⎟⎜1−NN⎝N⎠N−1MN−n相当于二项分布b (n, p)中的p,方差修正因子为.NN−1三.超几何分布的二项近似直观上,当抽样个数n远小于M及N − M时,不放回抽样问题可近似看作有放回抽样问题,也就是此时超几何分布可用二项分布近似.M定理如果当N → +∞ 时,→p, (0 < p < 1),则 N⎛M⎞⎛N−M⎞⎜⎟⎛n⎞⎜n−k⎟⎟⎜⎜k⎟⎠=⎜⎟pk(1−p)n−k.⎝⎠⎝lim⎜k⎟N→+∞⎛N⎞⎝⎠⎜⎜n⎟⎟⎝⎠⎛N⎞N(N−1)(N−n+1)Nn⎛1⎞⎛n−1⎞⎟11L证:因⎜−==−⎟,⎜⎟⎜⎜n⎟!!nnNN⎠⎠⎝⎝⎝⎠⎛M⎞Mk⎛1⎞⎛k−1⎞⎛N−M⎞(N−M)n−k且⎜⎜n−k⎟⎟=(n−k)!⎜k⎟⎟=k!⎜1−M⎟L⎜1−M⎟,⎜⎠⎝⎠⎝⎝⎠⎝⎠1⎛⎜1−N−M⎝n−k−1⎞⎞⎛⎟,⎟L⎜1−N−M⎠⎠⎝⎛M⎞⎛N−M⎞1⎞⎛1⎞⎛Mk⎛k−1⎞(N−M)n−k⎛n−k−1⎞⎟⎜⎟⎜−−−⋅−1111LL⎜⎟⎜⎟⎜⎟⎜⎟⎜k⎟⎜n−k⎟−−−!()!kMMnkNMNM⎝⎠⎝⎝⎠⎝⎠⎠⎠=lim⎝⎠⎝故limnN→+∞N→+∞1⎞⎛N⎛n−1⎞⎛N⎞⎜⎜1−⎟L⎜1−⎟⎜n⎟⎟!nNN⎝⎠⎝⎠⎝⎠1⎞⎛1⎞⎛k−1⎞⎛n−k−1⎞⎛⎟⎟L⎜1−⎟⋅⎜1−⎜1−⎟L⎜1−MMNMNM−−⎠⎠⎝⎠⎝⎠⎝⋅⎝1⎞⎛n−1⎞⎛⎜1−⎟L⎜1−⎟N⎠⎝N⎠⎝Mk(N−M)n−kn!=lim⋅N→+∞k!(n−k)!Nn⎛n⎞M⎞⎛M⎞⎛⎟lim1=⎜⋅−⎜⎟⎜⎟⎜k⎟N→+∞NN⎝⎠⎝⎠⎝⎠kn−k1⎞⎛1⎞⎛k−1⎞⎛n−k−1⎞⎛⎟⎟L⎜1−⎟⋅⎜1−⎜1−⎟L⎜1−MMNMNM−−⎠⎠⎝⎠⎝⎠⎝⋅lim⎝N→+∞1⎞⎛n−1⎞⎛⎜1−⎟L⎜1−⎟NN⎝⎠⎝⎠20⎛n⎞kn−k=⎜⎜k⎟⎟p(1−p).⎝⎠此定理表明对于超几何分布h (n, N, M ),当抽样个数n远小于M及N − M时,可用二项分布b (n, p) 近似,其中p=M. N例某校有20000名学生,其中男生8000人,女生12000人,从中任选6人.求取到2个男生与4个女生的概率.⎛8000⎞⎛12000⎞⎜⎟⎜4⎟⎟⎜⎜2⎟⎠.⎝⎠⎝解:设X表示“选到的男生数”,有X ~ H (6, 20000, 8000),可得p(2)=⎛20000⎞⎜⎜6⎟⎟⎝⎠但显然计算很繁琐,为便于计算,用二项分布近似.因n = 6较小,远小于M = 8000与N − M = 12000,且p=M=0.4,有X~&B(6,0.4), N⎛6⎞24⎟×0.4×0.6=0.31104.故p(2)≈⎜⎜2⎟⎝⎠2.4.4. 几何分布与负二项分布一.几何分布在伯努利试验中,以X表示事件A首次发生时的试验次数,则X的全部可能取值为1, 2, …,且P{X = k} = (1 − p)k − 1 p.定义若随机变量X的概率函数为p (k) = (1 − p)k − 1 p,k = 1, 2, …;0 < p < 1,则称X 服从几何分布(Geometric Distribution),记为X ~ Ge ( p).几何分布的实际背景是首次发生时的试验次数.非负性:(1 − p)k − 1 p > 0;正则性:∑(1−p)k−1p=k=1+∞p=1.1−(1−p)几何分布Ge ( p) 的最可能值显然是k0 = 1.二.几何分布的数学期望和方差令q = 1 − p,有p (k) = q k − 1 p.几何分布Ge ( p) 的数学期望为E(X)=∑kqk=1+∞k−1d(qk)d⎛+∞k⎞d⎛1⎞11⎟⎜⎜⎟,p=p⋅∑qpp=p⋅=⋅==⋅⎜∑⎟2⎜1−q⎟dqdqdqp(1)q−k=0⎝k=0⎠⎠⎝+∞又因E(X)=∑kq22k=1+∞k−1p=∑(k+k)q2k=1+∞k−1p−∑kqk=1+∞k−1d2(qk+1)p=p⋅∑−E(X) 2dqk=0+∞d2=p⋅2dq⎛+∞k+1⎞1212−pd2⎛q⎞1⎟⎜⎜⎟,−=⋅−=pqp−=⋅⎜∑⎟p⎟p2⎜32qp1−(1−)dqqp⎝k=0⎠⎠⎝21故方差为2−p⎛1⎞1−p⎜⎟−.Var(X)=E(X2)−[E(X)]2==2⎜p⎟p2p⎝⎠三.几何分布的无记忆性定理设X服从几何分布Ge ( p),则对任意正整数m与n有P{X > m + n | X > m} = P{X > n}.证:因对于正整数k,有P{X>k}=2i=k+1∑(1−p)+∞i−1(1−p)kpp==(1−p)k,1−(1−p)P{X>m+n}(1−p)m+nn故P{X>m+n|X>m}===(1−p)=P{X>n}.P{X>m}(1−p)m此定理在已经试验m次事件A没有发生的条件下,继续试验n次仍没有发生的条件概率,等于试验n次A没有发生的概率.这称之为几何分布的无记忆性.四.负二项分布在伯努利试验中,以X表示事件A第r次发生时的试验次数,则X的全部可能取值为r, r + 1, …,且⎛k−1⎞k−rr⎟P{X=k}=⎜−pp. (1)⎜r−1⎟⎝⎠定义若随机变量X的概率函数为⎛k−1⎞k−rr p(k)=⎜⎜r−1⎟⎟(1−p)p,k = r, r + 1, …;0 < p < 1,⎝⎠则称X 服从负二项分布(Negative Binomial Distribution),记为X ~ Nb (r, p).实际背景是第r次发生时的试验次数.当r = 1时,负二项分布Nb (1, p)就是几何分布Ge ( p).注:二项分布是已知实验次数时,发生次数的分布;负二项分布是已知发生次数时,试验次数的分布.⎛k−1⎞k−rr非负性:⎜⎜r−1⎟⎟(1−p)p>0;⎝⎠⎛k−1⎞pr+∞dr−1(qk−1)pr+∞k−rrk−r正则性:∑⎜⎜r−1⎟⎟(1−p)p=(r−1)!∑(k−1)L(k−r+1)q=(r−1)!∑dqr−1 k=r⎝k=rk=1⎠+∞prdr−1=⋅r−1(r−1)!dq负二项分布Nb (r, p)的最可能值为∑qk=1+∞k−1prdr−1=⋅r−1(r−1)!dq⎛1⎞pr(r−1)!⎟⎜=⋅⎜1−q⎟(r−1)!(1−q)r=1.⎠⎝⎧⎡r−1⎤r−1,当不是正整数时,⎪1+⎢⎪⎣p⎥p⎦ k0=⎨rrr−1−1−1⎪1+,当或是正整数时.⎪ppp⎩⎛k−1⎞(k−1)!k−rrk−rr⎟(1−p)p=(1−p)p,证:若X ~ Nb (r, p),有p(k)=⎜⎜r−1⎟(r−1)!⋅(k−r)!⎝⎠故p(k)−p(k−1)=(k−1)!(k−2)!(1−p)k−rpr−(1−p)k−r−1pr (r−1)!⋅(k−r)!(r−1)!⋅(k−r−1)! =(k−2)!(1−p)k−r−1pr[(k−1)(1−p)−(k−r)] (r−1)!⋅(k−r)!(k−2)!(1−p)k−r−1pr[(r−1)−(k−1)p],(r−1)!⋅(k−r)!=当k<1+r−1r−1时,有p (k) > p (k − 1);当k>1+时,有p (k) < p (k − 1). pp如果⎡r−1⎤r−1不是正整数,取k0=1+⎢⎥, pp⎣⎦r−1r−1,即p (k0) > p (k0 − 1);且k0+1>1+,即p (k0 + 1) < p (k0). pp有k0<1+ 故p (k0) 为最大值.如果r−1r−1是正整数,取k0=1+,即p (k0) = p (k0 − 1), pp故p (k0) 和p (k0 − 1) 都是最大值.负二项分布Nb (r, p) 的数学期望为⎛k−1⎞pr+∞pr+∞dr(qk)k−rrk−rE(X)=∑k⋅⎜⎜r−1⎟⎟(1−p)p=(r−1)!∑k(k−1)L(k−r+1) q=(r−1)!∑dqr k=rk=rk=0⎝⎠+∞prdr=⋅r(r−1)!dq又因 prdrq=⋅r∑(r−1)!dqk=0+∞k⎛1⎞prr!r⎟⎜=⋅=⎜1−q⎟(r−1)!(1−q)r+1p.⎠⎝+∞+∞⎛k−1⎞⎛k−1⎞⎛k−1⎞k−rrk−rrk−rr2⎟⎜⎟⎜⎟−=+⋅−−⋅−ppppkppkkE(X)=∑k⋅⎜(1)(1)(1)()∑∑⎜r−1⎟⎜r−1⎟⎜r−1⎟k=rk=rk=r⎝⎠⎝⎠⎝⎠2+∞2 pr+∞pr+∞dr+1(qk+1)rk−r=−(k+1)k(k−1)L(k−r+1)q−E(X)=∑∑r+1p(r−1)!k=r(r−1)!k=0dqprdr+1=⋅(r−1)!dqr+1∑qk=0+∞k+1prrdr+1−=⋅p(r−1)!dqr+1⎛q⎞rpr(r+1)!r⎟⎜−−=⋅⎜1−q⎟p(r−1)!(1−q)r+2p ⎠⎝=故方差为r(r+1)−rp, 2pr2+r−rp⎛r⎞r(1−p)⎜⎟−.Var(X)=E(X)−[E(X)]==⎜22⎟pp⎝p⎠222§2.5 常用连续分布2.5.1.均匀分布一.均匀分布的密度函数和分布函数某些随机变量分布在一个区间内,且其中处处都是等可能的.定义若连续型随机变量X的密度函数为⎧1⎪,a<x<b,(a < b),p(x)=⎨b−a⎪其它.⎩0,则称X服从区间 (a, b) 上的均匀分布(Uniform Distribution),记为X ~ U (a, b).其分布函数为。

概率论与数理统计讲义第六章 样本与抽样分布

概率论与数理统计讲义第六章 样本与抽样分布

第六章样本与抽样分布§6.1 数理统计的基本概念一.数理统计研究的对象例:有一批灯泡,要从使用寿命这个数量指标来看其质量,设寿命用X表示。

(1)若规定寿命低于1000小时的产品为次品。

此问题是求P(X 1000)=F(10000),求F(x)? (2)从平均寿命、使用时数长短差异来看其质量,即求E(x)?、D(x)?。

要解决二个问题1.试验设计抽样方法。

2.数据处理或统计推断。

方法具有“从局部推断总体”的特点。

二.总体(母体)和个体1.所研究对象的全体称为总体,把组成总体的每一个对象成员(基本单元)称为个体。

说明:(1)对总体我们关心的是研究对象的某一项或某几项数量指标(或属性指标)以及他们在整体中的分布。

所以总体是个体的数量指标的全体。

(2)为研究方便将总体与一个R.V X对应(等同)。

a.总体中不同的数量指标的全体,即是R.V.X的全部取值。

b.R.V X的分布即是总体的分布情况。

例:一批产品是100个灯泡,经测试其寿命是:1000小时1100小时1200小时20个30个50个X 1000 1100 1200P 20/100 30/10050/100(设X表示灯泡的寿命)可知R.V.X的分布律,就是总体寿命的分布,反之亦然。

常称总体X,若R.VX~F(x),有时也用F(x)表示一个总体。

(3)我们对每一个研究对象可能要观测两个或多个数量指标,则可用多维随机向量(X,Y,Z, …)去描述总体。

2.总体的分类有限总体无限总体三.简单随机样本.1.定义6.1 :从总体中抽得的一部分个体组成的集合称为子样(样本),取得的个体叫样品,样本中样品的个数称为样本容量(也叫样本量)。

每个样品的测试值叫观察值。

取得子样的过程叫抽样。

样本的双重含义:(1)随机性:用(X1,X2,……X n) n维随机向量表示。

X i表示第i个被抽到的个体,是随机变量。

(i=1,2,…n)(2)确定性:(x1,x2,……x n)表示n个实数,即是每个样品Xi观测值x i(i=1,2,…n)。

《概率论与数理统计》课件

《概率论与数理统计》课件

条件概率与独立性
条件概率
在某个事件B已经发生的条件下,另 一事件A发生的概率,记为P(A|B)。
独立性
两个事件A和B如果满足 P(A∩B)=P(A)P(B),则称事件A和B是 独立的。
随机变量及其分布
01
随机变量
随机变量是定义在样本空间上的 一个实值函数,表示随机试验的 结果。
02
离散型随机变量
03
连续型随机变量
离散型随机变量的取值可以一一 列举出来,其概率分布可以用概 率质量函数或概率函数表示。
连续型随机变量的取值范围是一 个区间或半开区间,其概率分布 可以用概率密度函数表示。
数理统计初步
02
统计数据的描述
01
统计数据的收集
描述如何通过调查、试验或观测 等方法,获取用于统计分析的数
据。
03
夫链
随机过程的基本概念
随机过程
随机过程是一组随机变量,每个随机 变量对应于时间或空间的一个点。
有限维分布
描述随机过程在有限个时间点上的联 合分布。
独立性
如果随机过程在不相交的时间区间上 的随机变量是独立的,则该随机过程
是独立的。
马尔科夫链及其性质
马尔科夫性
在已知现在状态下,未来与过去独立,即“未来 只取决于现在”。
03
数据的可视化
介绍如何使用图表(如直方图、 散点图等)将数据可视化,以便 更直观地理解数据分布和关系。
02
数据的整理
介绍如何对数据进行分类、排序 和分组,以便更好地理解和分析

04
数据的数字特征
介绍如何使用均值、中位数、众 数、方差等统计量来描述数据的
中心趋势和离散程度。
参数估计与置信区间
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

第一章 随机事件和概率 第一节 基本概念1、排列组合初步(1)排列组合公式)!(!n m m P n m -= 从m 个人中挑出n 个人进行排列的可能数。

)!(!!n m n m C n m -=从m 个人中挑出n 个人进行组合的可能数。

例1.1:方程xx x C C C 76510711=-的解是 A . 4 B . 3 C . 2 D . 1例1.2:有5个队伍参加了甲A 联赛,两两之间进行循环赛两场,试问总共的场次是多少?(2)加法原理(两种方法均能完成此事):m+n某件事由两种方法来完成,第一种方法可由m 种方法完成,第二种方法可由n 种方法来完成,则这件事可由m+n 种方法来完成。

(3)乘法原理(两个步骤分别不能完成这件事):m ×n某件事由两个步骤来完成,第一个步骤可由m 种方法完成,第二个步骤可由n 种方法来完成,则这件事可由m ×n 种方法来完成。

例1.3:从5位男同学和4位女同学中选出4位参加一个座谈会,要求与会成员中既有男同学又有女同学,有几种不同的选法?例1.4:6张同排连号的电影票,分给3名男生和3名女生,如欲男女相间而坐,则不同的分法数为多少?例1.5:用五种不同的颜色涂在右图中四个区域里,每一区域涂上一种颜色,且相邻区域的颜色必须不同,则共有不同的涂法A.120种B.140种 C.160种D.180种(4)一些常见排列①特殊排列②相邻③彼此隔开④顺序一定和不可分辨例1.6:晚会上有5个不同的唱歌节目和3个不同的舞蹈节目,问:分别按以下要求各可排出几种不同的节目单?①3个舞蹈节目排在一起;②3个舞蹈节目彼此隔开;③3个舞蹈节目先后顺序一定。

例1.7:4幅大小不同的画,要求两幅最大的排在一起,问有多少种排法?例1.8:5辆车排成1排,1辆黄色,1辆蓝色,3辆红色,且3辆红车不可分辨,问有多少种排法?①重复排列和非重复排列(有序)例1.9:5封不同的信,有6个信箱可供投递,共有多少种投信的方法?②对立事件例1.10:七人并坐,甲不坐首位,乙不坐末位,有几种不同的坐法?例1.11:15人中取5人,有3个不能都取,有多少种取法?例1.12:有4对人,组成一个3人小组,不能从任意一对中取2个,问有多少种可能性?③ 顺序问题例1.13:3白球,2黑球,先后取2球,放回,2白的种数?(有序) 例1.14:3白球,2黑球,先后取2球,不放回,2白的种数?(有序) 例1.15:3白球,2黑球,任取2球,2白的种数?(无序)2、随机试验、随机事件及其运算(1)随机试验和随机事件如果一个试验在相同条件下可以重复进行,而每次试验的可能结果不止一个,但在进行一次试验之前却不能断言它出现哪个结果,则称这种试验为随机试验。

试验的可能结果称为随机事件。

例如:掷一枚硬币,出现正面及出现反面;掷一颗骰子,出现“1”点、“5”点和出现偶数点都是随机事件;电话接线员在上午9时到10时接到的电话呼唤次数(泊松分布);对某一目标发射一发炮弹,弹着点到目标的距离为0.1米、0.5米及1米到3米之间都是随机事件(正态分布)。

在一个试验下,不管事件有多少个,总可以从其中找出这样一组事件,它具有如下性质:(1) 每进行一次试验,必须发生且只能发生这一组中的一个事件;(2) 任何事件,都是由这一组中的部分事件组成的。

这样一组事件中的每一个事件称为基本事件,用ω来表示,例如n ωωω ,,21(离散)。

基本事件的全体,称为试验的样本空间,用Ω表示。

一个事件就是由Ω中的部分点(基本事件ω)组成的集合。

通常用大写字母A ,B ,C ,…表示事件,它们是Ω的子集。

如果某个ω是事件A 的组成部分,即这个ω在事件A 中出现,记为A ∈ω。

如果在一次试验中所出现的ω有A ∈ω,则称在这次试验中事件A 发生。

如果ω不是事件A 的组成部分,就记为A ∈ω。

在一次试验中,所出现的ω有A ∈ω,则称此次试验A 没有发生。

Ω为必然事件,Ø为不可能事件。

(2)事件的关系与运算①关系:如果事件A的组成部分也是事件B的组成部分,(A发生必有事件B发生):BA⊂如果同时有BA⊂,AB⊃,则称事件A与事件B等价,或称A等于B:A=B。

A、B中至少有一个发生的事件:A B,或者A+B。

属于A而不属于B的部分所构成的事件,称为A与B的差,记为A-B,也可表示为A-AB或者BA,它表示A发生而B不发生的事件。

A、B同时发生:A B,或者AB。

A B=Ø,则表示A与B不可能同时发生,称事件A与事件B互不相容或者互斥。

基本事件是互不相容的。

Ω-A称为事件A的逆事件,或称A的对立事件,记为A。

它表示A不发生的事件。

互斥未必对立。

②运算:结合率:A(BC)=(AB)C A∪(B∪C)=(A∪B)∪C分配率:(AB)∪C=(A∪C)∩(B∪C) (A∪B)∩C=(AC)∪(BC)德摩根率:∞=∞==11iiii AABABA=,BABA=例1.16:一口袋中装有五只乒乓球,其中三只是白色的,两只是红色的。

现从袋中取球两次,每次一只,取出后不再放回。

写出该试验的样本空间Ω。

若A表示取到的两只球是白色的事件,B表示取到的两只球是红色的事件,试用A、B表示下列事件:(1)两只球是颜色相同的事件C,(2)两只球是颜色不同的事件D,(3)两只球中至少有一只白球的事件E。

例1.17:硬币有正反两面,连续抛三次,若Ai表示第i次正面朝上,用A i 表示下列事件:(1)前两次正面朝上,第三次正面朝下的事件C ,(2)至少有一次正面朝上的事件D ,(3)前两次正面朝上的事件E 。

3、概率的定义和性质(1)概率的公理化定义设Ω为样本空间,A 为事件,对每一个事件A 都有一个实数P(A),若满足下列三个条件:1° 0≤P(A)≤1,2° P(Ω) =13° 对于两两互不相容的事件1A ,2A ,…有∑∞=∞==⎪⎪⎭⎫ ⎝⎛11)(i i i i A P A P常称为可列(完全)可加性。

则称P(A)为事件A 的概率。

(2)古典概型(等可能概型)1° {}n ωωω 21,=Ω, 2° nP P P n 1)()()(21===ωωω 。

设任一事件A ,它是由m ωωω 21,组成的,则有P(A)={})()()(21m ωωω =)()()(21m P P P ωωω+++nm =基本事件总数所包含的基本事件数A = 例1.18:集合A 中有100个数,B 中有50个数,并且满足A 中元素与B 中元素关系a+b=10的有20对。

问任意分别从A 和B 中各抽取一个,抽到满足a+b=10的a,b 的概率。

例1.19:5双不同颜色的袜子,从中任取两只,是一对的概率为多少? 例1.20:在共有10个座位的小会议室内随机地坐上6名与会者,则指定的4个座位被坐满的概率是A .141B .131C .121D . 111 例1.21:3白球,2黑球,先后取2球,放回,2白的概率?(有序) 例1.22:3白球,2黑球,先后取2球,不放回,2白的概率?(有序) 例1.23:3白球,2黑球,任取2球,2白的概率?(无序)注意:事件的分解;放回与不放回;顺序问题。

4、五大公式(加法、减法、乘法、全概、贝叶斯)(1)加法公式P(A+B)=P(A)+P(B)-P(AB)当P(AB)=0时,P(A+B)=P(A)+P(B)例1.24:从0,1,…,9这十个数字中任意选出三个不同的数字,试求下列事件的概率:A =“三个数字中不含0或者不含5”。

(2)减法公式P(A-B)=P(A)-P(AB)当B ⊂A 时,P(A-B)=P(A)-P(B)当A=Ω时,P(B )=1- P(B)例1.25:若P(A)=0.5,P(B)=0.4,P(A-B)=0.3,求P(A+B)和P(A +B ). 例1.26:对于任意两个互不相容的事件A 与B , 以下等式中只有一个不正确,它是: (A) P(A-B)=P(A) (B) P(A-B)=P(A) +P(A ∪B )-1 (C) P(A -B)= P(A )-P(B) (D)P[(A∪B)∩(A -B)]=P(A) (E)p[B A -]=P(A) -P(A ∪B )(3)条件概率和乘法公式定义 设A 、B 是两个事件,且P(A)>0,则称)()(A P AB P 为事件A 发生条件下,事件B 发生的条件概率,记为=)/(A B P )()(A P AB P 。

条件概率是概率的一种,所有概率的性质都适合于条件概率。

例如P(Ω/B)=1⇒P(B /A)=1-P(B/A)乘法公式:)/()()(A B P A P AB P =更一般地,对事件A 1,A 2,…A n ,若P(A 1A 2…A n-1)>0,则有21(A A P …)n A )|()|()(213121A A A P A A P A P =……21|(A A A P n …)1-n A 。

例1.27:甲乙两班共有70名同学,其中女同学40名,设甲班有30名同学,而女生15名,问在碰到甲班同学时,正好碰到一名女同学的概率。

例1.28:5把钥匙,只有一把能打开,如果某次打不开就扔掉,问以下事件的概率?①第一次打开;②第二次打开;③第三次打开。

(4)全概公式设事件n B B B ,,,21 满足1°n B B B ,,,21 两两互不相容,),,2,1(0)(n i B P i =>,2° n i iB A 1=⊂,则有)|()()|()()|()()(2211n n B A P B P B A P B P B A P B P A P +++= 。

此公式即为全概率公式。

例1.29:播种小麦时所用的种子中二等种子占2%,三等种子占1.5%,四等种子占1%,其他为一等种子。

用一等、二等、三等、四等种子播种长出的穗含50颗以上麦粒的概率分别为0.5,0.15,0.1,0.05,试求种子所结的穗含有50颗以上麦粒的概率。

例1.30:甲盒内有红球4只,黑球2只,白球2只;乙盒内有红球5只,黑球3只;丙盒内有黑球2只,白球2只。

从这三只盒子的任意一只中任取出一只球,它是红球的概率是:A .0.5625B .0.5C .0.45D .0.375E . 0.225例1.31:100个球,40个白球,60个红球,不放回先后取2次,第2次取出白球的概率?第20次取出白球的概率?(5)贝叶斯公式设事件1B ,2B ,…,n B 及A 满足1° 1B ,2B ,…,n B 两两互不相容,)(Bi P >0,=i 1,2,…,n ,2°n i iB A 1=⊂,0)(>A P ,则 ∑==n j jj i i i B A P B P B A P B P A B P 1)/()()/()()/(,i=1,2,…n 。

相关文档
最新文档