概率论与数理统计知识点总结(详细)
概率论与数理统计总复习知识点归纳
概率论与数理统计总复习知识点归纳1.概率论的基础概念-随机事件、样本空间和事件的关系。
-频率和概率的关系,概率的基本性质。
-古典概型和几何概型的概念。
-条件概率和乘法定理。
-全概率公式和贝叶斯公式。
-随机变量和概率分布函数的概念。
-离散型随机变量和连续型随机变量的定义、概率质量函数和概率密度函数的性质。
2.随机变量的数字特征-随机变量的数学期望、方差、标准差和切比雪夫不等式。
-协方差、相关系数和线性变换的数学期望和方差公式。
-两个随机变量的和、差、积的数学期望和方差公式。
3.大数定律和中心极限定理-大数定律的概念和三级强大数定律。
-中心极限定理的概念和中心极限定理的两种形式。
4.数理统计的基本概念和方法-总体、样本和抽样方法的概念。
-样本统计量和抽样分布的概念。
-点估计和区间估计的概念。
-假设检验的基本思想和步骤。
-正态总体的参数的假设检验和区间估计。
5.参数估计和假设检验的方法和推广-极大似然估计的原理和方法。
-矩估计的原理和方法。
-最小二乘估计的原理和方法。
-一般参数的假设检验和区间估计。
6.相关分析和回归分析-相关系数和线性相关的概念和性质。
-回归分析的一般原理。
-简单线性回归的估计和检验。
7.非参数统计方法-秩和检验和符号检验的基本思想和应用。
-秩相关系数的计算和检验。
8.分布拟合检验和贝叶斯统计-卡方拟合检验的原理和方法。
-正态总体参数的拟合优度检验。
-贝叶斯估计的基本思想和方法。
9.时间序列分析和质量控制-时间序列的基本性质和分析方法。
-时间序列预测的方法和模型。
-质量控制的基本概念和控制图的应用。
以上是概率论与数理统计总复习知识点的归纳,希望对你的复习有所帮助。
概率论与数理统计知识点总结
概率论与数理统计知识点总结一、概率论知识点总结:1.随机事件:随机事件是指在一次试验中,可能发生也可能不发生的事件。
例如:掷硬币的结果、抽取扑克牌的花色等。
2.概率:概率是描述随机事件发生可能性大小的数值。
概率的取值范围是[0,1],表示事件发生的可能性大小,0表示不可能发生,1表示一定会发生。
3.古典概型:古典概型是指每种可能的结果发生的概率相等的情形。
例如:掷骰子的结果、抽取彩色球的颜色等。
4.随机变量:随机变量是用来描述试验结果的数值,它的取值是根据随机事件的结果确定的。
例如:掷骰子的点数、抽取扑克牌的点数等。
5.概率分布:随机变量的概率分布描述了每个取值发生的概率。
常见的概率分布有离散概率分布和连续概率分布,如二项分布、正态分布等。
6. 期望值:期望值是衡量随机变量取值的平均值。
对于离散型随机变量,期望值=E[X]=∑[xP(X=x)];对于连续型随机变量,期望值=E[X]=∫[x f(x)dx],其中f(x)为概率密度函数。
7. 方差:方差是衡量随机变量取值与期望值之间的偏离程度。
方差=Var(X)=E[(X-E[X])^2]。
8.独立性:两个随机事件或随机变量之间的独立性表示它们的发生与否或取值无关联。
独立性的判定通常通过联合概率、条件概率等来进行推导。
二、数理统计知识点总结:1.样本与总体:在统计学中,样本是指从总体中选取的具体观测数据。
总体是指要研究的对象的全部个体或事物的集合。
2.参数与统计量:参数是描述总体特征的数值,如总体均值、总体方差等。
统计量是根据样本计算得到的参数估计值,用来估计总体参数。
3.抽样方法:抽样方法是从总体中选取样本的方法,常见的抽样方法有简单随机抽样、系统抽样、整群抽样等。
4.统计分布:统计分布是指样本统计量的分布。
常见的统计分布有t分布、F分布、x^2分布等,其中t分布适用于小样本、F分布适用于方差比较、x^2分布适用于拟合优度检验等。
5.点估计与区间估计:点估计是以样本统计量为基础,估计总体参数的数值。
概率论与数理统计知识点总结(免费超详细版)
《概率论与数理统计》第一章概率论的基本概念§2.样本空间、随机事件1.事件间的关系 A B 则称事件 B 包含事件 A ,指事件 A 发生必然导致事件 B 发生A B {x x A或x B} 称为事件 A 与事件 B 的和事件,指当且仅当 A ,B 中至少有一个发生时,事件 A B 发生A B {x x A且x B} 称为事件 A 与事件 B 的积事件,指当A,B 同时发生时,事件A B 发生A—B {x x A且x B} 称为事件A 与事件 B 的差事件,指当且仅当 A 发生、B 不发生时,事件 A — B 发生A B ,则称事件 A 与B 是互不相容的,或互斥的,指事件 A 与事件 B 不能同时发生,基本事件是两两互不相容的A B S A B ,则称事件 A 与事件 B 互为逆事件,又称事件 A 与事件 B 互为且对立事件2.运算规则交换律 A B B A A B B A结合律(A B) C A (B C) ( A B)C A(B C)分配律 A (B C)(A B) ( A C)A (B C)(A B)( A C)—徳摩根律 A B A B A B A B§3.频率与概率定义在相同的条件下,进行了n 次试验,在这n 次试验中,事件 A 发生的次数n称为事件AA 发生的频数,比值n nA 称为事件 A 发生的频率概率:设E是随机试验,S 是它的样本空间,对于E 的每一事件A赋予一个实数,记为P(A),称为事件的概率1.概率P( A)满足下列条件:(1)非负性:对于每一个事件 A 0 P( A) 1(2)规范性:对于必然事件S P (S) 11(3)可列可加性:设A1, A2 , ,A是两两互不相容的事件,有nn nP A k ) P( A) ( (n可kk 1 k 1以取)2.概率的一些重要性质:(i )P( ) 0(ii )若A1, A2 , ,A是两两互不相容的事件,则有n Pn n( (n可以取)A k ) P( A )kk 1 k 1(iii )设A,B 是两个事件若 A B ,则P(B A) P( B) P( A) ,P( B) P(A) (iv)对于任意事件A,P(A) 1(v)P( A) 1 P(A) (逆事件的概率)(vi)对于任意事件A,B 有P(A B) P( A) P( B) P( A B)§4等可能概型(古典概型)等可能概型:试验的样本空间只包含有限个元素,试验中每个事件发生的可能性相同若事件 A 包含k 个基本事件,即{e i } {e } {e }A ,里1 i i k] 2,k是,中某个不同的数,则有i1 i 2, ,i k 1,2 nP( A)j k1P { eij}knA包含的基本事件数S中基本事件的总数§5.条件概率(1)定义:设A,B 是两个事件,且P( A) 0 ,称P( A B)P(B | A) 为事件 A 发生的条P(A)件下事件 B 发生的条件概率(2)条件概率符合概率定义中的三个条件。
概率论与数理统计知识点总结
概率论与数理统计知识点一、概率论知识点1.1 概率基本概念概率是研究事物变化规律的一门学科。
在概率学中,我们需要掌握一些基本概念:•随机试验:一种在相同条件下重复的可以观察到不同结果的试验。
•样本空间:随机试验所有可能结果的集合。
•事件:样本空间的子集。
•频率和概率:在大量重复实验中,某个事件出现的频率称为频率,其极限称为概率。
1.2 概率计算公式•加法公式:P(A∪B) = P(A) + P(B) - P(A∩B)•乘法公式:P(A∩B) = P(A|B)P(B) = P(B|A)P(A)•条件概率公式:P(A|B) = P(A∩B)/P(B)•全概率公式:P(B) = Σi=1nP(Ai)P(B|Ai)•贝叶斯公式:P(Ai|B) = P(Ai)P(B|Ai)/Σj=1nP(Aj)P(B|Aj)1.3 随机变量和分布随机变量是用来描述随机试验结果的数学量。
离散型随机变量和连续型随机变量是概率论中两个重要的概念。
•离散型随机变量:在一个范围内,只有有限个或无限个可能值的随机变量。
•连续型随机变量:在一个范围内,有无限个可能值的随机变量。
概率分布是反映随机变量取值情况的概率规律,可分为离散型概率分布和连续型概率分布。
•离散型概率分布:包括伯努利分布、二项分布、泊松分布等。
•连续型概率分布:包括正态分布、指数分布、卡方分布等。
1.4 常用概率分布概率论涉及到很多的分布,其中一些常用的分布如下:•二项分布•泊松分布•正态分布•均匀分布•指数分布1.5 统计推断在概率论中,统计推断是指根据样本数据来对总体进行参数估计和假设检验的方法。
统计推断主要涉及以下两个方面:•点估计:使用样本数据来推断总体参数的值。
•区间估计:使用样本数据来推断总体参数的一个区间。
二、数理统计知识点2.1 统计数据的描述为了更准确地描述数据,我们需要使用以下几个参数:•平均数:所有数据的和除以数据个数。
•中位数:将数据按大小排序,位于中间位置的数。
概率论与数理统计知识点总结
概率论与数理统计知识点总结概率论与数理统计是数学的一个重要分支,主要研究各种随机现象的规律性及其数值描述。
下面将对概率论与数理统计的一些重要知识点进行总结。
一、概率论知识点总结1. 随机事件与概率- 随机事件:指在一定条件下具有不确定性的事件。
- 概率:用来描述随机事件发生的可能性大小的数值。
2. 古典概型与几何概型- 古典概型:指随机试验中,所有基本事件的可能性相等的情况。
- 几何概型:指随机试验中,基本事件的可能性不完全相等,与图形的属性有关的情况。
3. 随机变量与概率分布- 随机变量:定义在样本空间上的函数,用来描述试验结果与数值之间的对应关系。
- 离散随机变量:取有限个或可列个数值的随机变量。
- 连续随机变量:取无限个数值的随机变量。
4. 期望与方差- 期望:反映随机变量平均取值的数值。
- 方差:反映随机变量取值偏离期望值的程度。
5. 大数定律与中心极限定理- 大数定律:指在独立重复试验中,随着试验次数增加,事件发生的频率趋近于其概率。
- 中心极限定理:指在独立随机变量之和的情况下,当随机变量数目趋于无穷时,这些随机变量之和的分布趋近于正态分布。
二、数理统计知识点总结1. 抽样与抽样分布- 抽样:指对总体进行有规则地选择一部分样本进行观察和研究的过程。
- 抽样分布:指用统计量对不同样本进行计算所得到的分布。
2. 参数估计与置信区间- 参数估计:根据样本推断总体的未知参数。
- 置信区间:对于总体参数估计的一个区间估计,用来表示这个参数的可能取值范围。
3. 假设检验与统计显著性- 假设检验:用来判断统计推断是否与已知事实相符。
- 统计显著性:基于样本数据,对总体或总体参数进行判断的一种方法。
4. 方差分析与回归分析- 方差分析:用来研究因素对于某一变量均值的影响程度。
- 回归分析:通过观察变量之间的关系,建立数学模型来描述两个或多个变量间的依赖关系。
5. 交叉表与卡方检验- 交叉表:将两个或多个变量的数据按照某种方式交叉排列而形成的表格。
概率论与数理统计知识点总结免费超详细版
概率论与数理统计知识点总结免费超详细版概率论与数理统计是一门研究随机现象数量规律的学科,它在众多领域都有着广泛的应用,如统计学、物理学、工程学、经济学等。
以下是对概率论与数理统计知识点的超详细总结。
一、随机事件与概率(一)随机事件随机事件是指在一定条件下,可能出现也可能不出现的事件。
随机事件通常用大写字母 A、B、C 等来表示。
(二)样本空间样本空间是指随机试验的所有可能结果组成的集合,通常用Ω表示。
(三)事件的关系与运算1、包含关系:若事件 A 发生必然导致事件 B 发生,则称事件 B 包含事件 A,记作 A⊂B。
2、相等关系:若 A⊂B 且 B⊂A,则称事件 A 与事件 B 相等,记作A = B。
3、并事件:事件 A 与事件 B 至少有一个发生的事件称为 A 与 B的并事件,记作 A∪B。
4、交事件:事件 A 与事件 B 同时发生的事件称为 A 与 B 的交事件,记作A∩B 或 AB。
5、互斥事件:若事件 A 与事件 B 不能同时发生,则称 A 与 B 为互斥事件,即 AB =∅。
6、对立事件:若事件 A 与事件 B 满足 A∪B =Ω 且 AB =∅,则称 A 与 B 为对立事件,记作 B =A。
(四)概率的定义与性质1、概率的古典定义:若随机试验的样本空间Ω只包含有限个基本事件,且每个基本事件发生的可能性相等,则事件 A 的概率为 P(A) =n(A) /n(Ω) ,其中 n(A) 为事件 A 包含的基本事件个数,n(Ω) 为样本空间Ω包含的基本事件个数。
2、概率的统计定义:在大量重复试验中,事件 A 发生的频率稳定在某个常数 p 附近,则称 p 为事件 A 的概率,即 P(A) = p 。
3、概率的公理化定义:设随机试验的样本空间为Ω,对于Ω中的每一个事件 A,都赋予一个实数 P(A),如果满足以下三个条件:(1)非负性:0 ≤ P(A) ≤ 1 ;(2)规范性:P(Ω) = 1 ;(3)可列可加性:对于两两互斥的事件 A1,A2,,有P(A1∪A2∪)= P(A1) + P(A2) +,则称 P(A) 为事件 A 的概率。
概率论与数理统计知识点总结
当Y=g(X)严格单调并且可导时:
其中h’(y)是g(x)的反函数
第三章 二维随机变量及其分布
(1)联合分布
离散型
如果二维随机向量 (X,Y)的所有可能取值为至多可列个有序对(x,y),则称 为离散型随机量。
设 =(X,Y)的所有可能取值为 ,且事件{ = }的概率为pij,,称
为 =(X,Y)的分布律或称为X和Y的联合分布律。联合分布有时也用下面的概率分布表来表示:
设离散型随机变量 的可能取值为Xk(k=1,2,…)且取各个值的概率,即事件(X=Xk)的概率为
P(X=xk)=pk,k=1,2,…,
则称上式为离散型随机变量 的概率分布或分布律。有时也用分布列的形式给出:
。
显然分布律应满足下列条件:
(1) , ,(2) 。
(2)连续型随机变量的分布密度
设 是随机变量 的分布函数,若存在非负函数 ,对任意实数 ,有
-A称为事件A的逆事件,或称A的对立事件,记为 。它表示A不发生的事件。互斥未必对立。
②运算:
结合率:A(BC)=(AB)C A∪(B∪C)=(A∪B)∪C
分配率:(AB)∪C=(A∪C)∩(B∪C) (A∪B)∩C=(AC)∪(BC)
德摩根率: ,
(7)概率的公理化定义
设 为样本空间, 为事件,对每一个事件 都有一个实数P(A),若满足下列三个条件:
泊松分布
设随机变量 的分布律为
, , ,
则称随机变量 服从参数为 的泊松分布,记为 或者P( )。
泊松分布为二项分布的极限分布(np=λ,n→∞)。
几何分布
,其中p≥0,q=1-p。
随机变量X服从参数为p的几何分布,记为G(p)。
概率论与数理统计各章重点知识整理
概率论与数理统计各章重点知识整理 第一章 概率论的基本概念一.基本概念随机试验E:(1)可以在相同的条件下重复地进行;(2)每次试验的可能结果不止一个,并且能事先明确试验的所有可能结果;(3)进行一次试验之前不能确定哪一个结果会出现. 样本空间S: E 的所有可能结果组成的集合. 样本点(基本事件):E 的每个结果. 随机事件(事件):样本空间S 的子集.必然事件(S):每次试验中一定发生的事件. 不可能事件(Φ):每次试验中一定不会发生的事件. 二. 事件间的关系和运算1.A ⊂B(事件B 包含事件A )事件A 发生必然导致事件B 发生.2.A ∪B(和事件)事件A 与B 至少有一个发生.3. A ∩B=AB(积事件)事件A 与B 同时发生.4. A -B(差事件)事件A 发生而B 不发生.5. AB=Φ (A 与B 互不相容或互斥)事件A 与B 不能同时发生.6. AB=Φ且A ∪B=S (A 与B 互为逆事件或对立事件)表示一次试验中A 与B 必有一个且仅有一个发生. B=A, A=B .运算规则 交换律 结合律 分配律 德•摩根律 B A B A = B A B A = 三. 概率的定义与性质1.定义 对于E 的每一事件A 赋予一个实数,记为P(A),称为事件A 的概率. (1)非负性 P(A)≥0 ; (2)归一性或规范性 P(S)=1 ;(3)可列可加性 对于两两互不相容的事件A 1,A 2,…(A i A j =φ, i ≠j, i,j=1,2,…),P(A 1∪A 2∪…)=P( A 1)+P(A 2)+… 2.性质(1) P(Φ) = 0 , 注意: A 为不可能事件P(A)=0 .(2)有限可加性 对于n 个两两互不相容的事件A 1,A 2,…,A n ,P(A 1∪A 2∪…∪A n )=P(A 1)+P(A 2)+…+P(A n ) (有限可加性与可列可加性合称加法定理) (3)若A ⊂B, 则P(A)≤P(B), P(B -A)=P(B)-P(A) . (4)对于任一事件A, P(A)≤1, P(A)=1-P(A) .(5)广义加法定理 对于任意二事件A,B ,P(A ∪B)=P(A)+P(B)-P(AB) . 对于任意n 个事件A 1,A 2,…,A n()()()()+∑+∑-∑=≤<<≤≤<≤=nk j i k j i nj i j i ni i n A A A P A A P A P A A A P 11121…+(-1)n-1P(A 1A 2…A n )四.等可能(古典)概型1.定义 如果试验E 满足:(1)样本空间的元素只有有限个,即S={e 1,e 2,…,e n };(2)每一个基本事件的概率相等,即P(e 1)=P(e 2)=…= P(e n ).则称试验E 所对应的概率模型为等可能(古典)概型.2.计算公式 P(A)=k / n 其中k 是A 中包含的基本事件数, n 是S 中包含的基本事件总数. 五.条件概率1.定义 事件A 发生的条件下事件B 发生的条件概率P(B|A)=P(AB) / P(A) ( P(A)>0).2.乘法定理 P(AB)=P(A) P (B|A) (P(A)>0); P(AB)=P(B) P (A|B) (P(B)>0).P(A 1A 2…A n )=P(A 1)P(A 2|A 1)P(A 3|A 1A 2)…P(A n |A 1A 2…A n-1) (n ≥2, P(A 1A 2…A n-1) > 0) 3. B 1,B 2,…,B n 是样本空间S 的一个划分(B i B j =φ,i ≠j,i,j=1,2,…,n, B 1∪B 2∪…∪B n =S) ,则 当P(B i )>0时,当P(A)>0, P(B i )>0时,.六.事件的独立性1.两个事件A,B,满足P(AB) = P(A) P(B)时,称A,B 为相互独立的事件. (1)两个事件A,B 相互独立⇔ P(B)= P (B|A) .2.三个事件A,B,C 满足P(AB) =P(A) P(B), P(AC)= P(A) P(C), P(BC)= P(B) P(C),称A,B,C 三事件两两相互独立. 若再满足P(ABC) =P(A) P(B) P(C),则称A,B,C 三事件相互独立.3.n 个事件A 1,A 2,…,A n ,如果对任意k (1<k ≤n),任意1≤i 1<i 2<…<i k ≤n.有()()()()kki i i i i i A P A P A P A A A P 2121=,则称这n 个事件A 1,A 2,…,A n 相互独立.第二章 随机变量及其概率分布一.随机变量及其分布函数1.在随机试验E 的样本空间S={e}上定义的单值实值函数X=X (e)称为随机变量.2.随机变量X 的分布函数F(x)=P{X ≤x} , x 是任意实数. 其性质为:(1)0≤F(x)≤1 ,F(-∞)=0,F(∞)=1. (2)F(x)单调不减,即若x 1<x 2 ,则 F(x 1)≤F(x 2). (3)F(x)右连续,即F(x+0)=F(x). (4)P{x 1<X≤x 2}=F(x 2)-F(x 1). 二.离散型随机变量 (只能取有限个或可列无限多个值的随机变量)1.离散型随机变量的分布律 P{X= x k }= p k (k=1,2,…) 也可以列表表示. 其性质为: (1)非负性 0≤P k ≤1 ; (2)归一性 11=∑∞=k k p .2.离散型随机变量的分布函数 F(x)=∑≤xX k k P 为阶梯函数,它在x=x k (k=1,2,…)处具有跳跃点,其跳跃值为p k =P{X=x k } .3.三种重要的离散型随机变量的分布(1)X~(0-1)分布 P{X=1}= p ,P{X=0}=1–p (0<p<1) .(2)X~b(n,p)参数为n,p 的二项分布P{X=k}=()kn k p p k n --⎪⎪⎭⎫ ⎝⎛1(k=0,1,2,…,n) (0<p<1)(3))X~π(λ)参数为λ的泊松分布 P{X=k}=λλ-e k k !(k=0,1,2,…) (λ>0)三.连续型随机变量1.定义 如果随机变量X 的分布函数F(x)可以表示成某一非负函数f(x)的积分F(x)=()dt t f x⎰∞-,-∞< x <∞,则称X 为连续型随机变量,其中f (x)称为X 的概率密度(函数).2.概率密度的性质(1)非负性 f(x)≥0 ; (2)归一性 ⎰∞∞-dx x f )(=1 ;(3) P{x 1<X ≤x 2}=⎰21)(x x dx x f ; (4)若f (x)在点x 处连续,则f (x)=F / (x) .注意:连续型随机变量X 取任一指定实数值a 的概率为零,即P{X= a}=0 . 3.三种重要的连续型随机变量的分布(1)X ~U (a,b) 区间(a,b)上的均匀分布 ⎩⎨⎧=-0)(1a b x f 其它b x a << .(2)X 服从参数为θ的指数分布.()⎩⎨⎧=-0/1θθx ex f 00≤>x x 若若 (θ>0).(3)X~N (μ,σ2 )参数为μ,σ的正态分布 222)(21)(σμσπ--=x e x f -∞<x<∞, σ>0.特别, μ=0, σ2 =1时,称X 服从标准正态分布,记为X~N (0,1),其概率密度2221)(x e x -=πϕ , 标准正态分布函数 ⎰=Φ∞--xt dt e x 2221)(π, Φ(-x)=1-Φ(x) .若X ~N ((μ,σ2), 则Z=σμ-X ~N (0,1), P{x 1<X ≤x 2}=Φ(σμ-2x )-Φ(σμ-1x ).若P{Z>z α}= P{Z<-z α}= P{|Z|>z α/2}= α,则点z α,-z α, ±z α/ 2分别称为标准正态分布的上,下,双侧α分位点. 注意:Φ(z α)=1-α , z 1- α= -z α. 四.随机变量X 的函数Y= g (X)的分布 1.离散型随机变量的函数若g(x k ) (k=1,2,…)的值全不相等,则由上表立得Y=g(X)的分布律.若g(x k ) (k=1,2,…)的值有相等的,则应将相等的值的概率相加,才能得到Y=g(X)的分布律. 2.连续型随机变量的函数若X 的概率密度为f X (x),则求其函数Y=g(X)的概率密度f Y (y)常用两种方法: (1)分布函数法 先求Y 的分布函数F Y (y)=P{Y ≤y}=P{g(X)≤y}=()()dx x f ky X k∑⎰∆其中Δk (y)是与g(X)≤y 对应的X 的可能值x 所在的区间(可能不只一个),然后对y 求导即得f Y (y)=F Y /(y) .(2)公式法 若g(x)处处可导,且恒有g /(x)>0 (或g / (x)<0 ),则Y=g (X)是连续型随机变量,其概率密度为 ()()()()⎩⎨⎧'=0y h y h f y f X Y 其它βα<<y其中h(y)是g(x)的反函数 , α= min (g (-∞),g (∞)) β= max (g (-∞),g (∞)) .如果f (x)在有限区间[a,b]以外等于零,则 α= min (g (a),g (b)) β= max (g (a),g (b)) .第三章 二维随机变量及其概率分布一.二维随机变量与联合分布函数1.定义 若X 和Y 是定义在样本空间S 上的两个随机变量,则由它们所组成的向量(X,Y)称为二维随机向量或二维随机变量.对任意实数x,y,二元函数F(x,y)=P{X ≤x,Y ≤y}称为(X,Y)的(X 和Y 的联合)分布函数. 2.分布函数的性质(1)F(x,y)分别关于x 和y 单调不减.(2)0≤F(x,y)≤1 , F(x,- ∞)=0, F(-∞,y)=0, F(-∞,-∞)=0, F(∞,∞)=1 .(3) F(x,y)关于每个变量都是右连续的,即 F(x+0,y)= F(x,y), F(x,y+0)= F(x,y) . (4)对于任意实数x 1<x 2 , y 1<y 2P{x 1<X ≤x 2 , y 1<Y ≤y 2}= F(x 2,y 2)- F(x 2,y 1)- F(x 1,y 2)+ F(x 1,y 1)二.二维离散型随机变量及其联合分布律1.定义 若随机变量(X,Y)只能取有限对或可列无限多对值(x i ,y j ) (i ,j =1,2,… )称(X,Y)为二维离散型随机变量.并称P{X= x i ,Y= y j }= p i j 为(X,Y)的联合分布律.也可列表表示.2.性质 (1)非负性 0≤p i j ≤1 .(2)归一性 ∑∑=i jij p 1 .3. (X,Y)的(X 和Y 的联合)分布函数F(x,y)=∑∑≤≤x x yy ij i j p三.二维连续型随机变量及其联合概率密度1.定义 如果存在非负的函数f (x,y),使对任意的x 和y,有F(x,y)=⎰⎰∞-∞-y xdudv v u f ),( 则称(X,Y)为二维连续型随机变量,称f(x,y)为(X,Y)的(X 和Y 的联合)概率密度.2.性质 (1)非负性 f (x,y)≥0 . (2)归一性 1),(=⎰⎰∞∞-∞∞-d x d y y x f . (3)若f (x,y)在点(x,y)连续,则yx y x F y x f ∂∂∂=),(),(2(4)若G 为xoy 平面上一个区域,则⎰⎰=∈Gdxdy y x f G y x P ),(}),{(.四.边缘分布1. (X,Y)关于X 的边缘分布函数 F X (x) = P{X ≤x , Y<∞}= F (x , ∞) . (X,Y)关于Y 的边缘分布函数 F Y (y) = P{X<∞, Y ≤y}= F (∞,y)2.二维离散型随机变量(X,Y)关于X 的边缘分布律 P{X= x i }= ∑∞=1j ij p = p i · ( i =1,2,…) 归一性 11=∑∞=∙i i p .关于Y 的边缘分布律 P{Y= y j }= ∑∞=1i ij p = p ·j ( j =1,2,…) 归一性 11=∑∞=∙j j p .3.二维连续型随机变量(X,Y)关于X 的边缘概率密度f X (x)=⎰∞∞-dy y x f ),( 归一性1)(=⎰∞∞-dx x f X 关于Y 的边缘概率密度f Y (y)=x d y x f ⎰∞∞-),( 归一性1)(=⎰∞∞-dy y f Y五.相互独立的随机变量1.定义 若对一切实数x,y,均有F(x,y)= F X (x) F Y (y) ,则称X 和Y 相互独立.2.离散型随机变量X 和Y 相互独立⇔p i j = p i ··p ·j ( i ,j =1,2,…)对一切x i ,y j 成立.3.连续型随机变量X 和Y 相互独立⇔f (x,y)=f X (x)f Y (y)对(X,Y)所有可能取值(x,y)都成立. 六.条件分布1.二维离散型随机变量的条件分布定义 设(X,Y)是二维离散型随机变量,对于固定的j,若P{Y=y j }>0,则称P{X=x i |Y=y j } 为在Y= y j 条件下随机变量X 的条件分布律.同样,对于固定的i,若P{X=x i }>0,则称 P{Y=y j |X=x i }为在X=x i 条件下随机变量Y 的条件分布律.第四章 随机变量的数字特征一.数学期望和方差的定义随机变量X 离散型随机变量连续型随机变量分布律P{X=x i }= p i ( i =1,2,…) 概率密度f (x)数学期望(均值)E(X) ∑∞=1i i i p x (级数绝对收敛)⎰∞∞-dx x xf )((积分绝对收敛)方差D(X)=E{[X-E(X)]2} []∑-∞=12)(i i i p X E x ⎰-∞∞-dx x f X E x )()]([2=E(X 2)-[E(X)]2 (级数绝对收敛) (积分绝对收敛),}{},{jji j j i p p y Y P y Y x X P ∙=====,}{},{∙=====i j i i j i p p x X P y Y x X P函数数学期望E(Y)=E[g(X)] i i i p x g ∑∞=1)((级数绝对收敛) ⎰∞∞-dx x f x g )()((积分绝对收敛)标准差σ(X)=√D(X) . 二.数学期望与方差的性质1. c 为为任意常数时, E(c) = c , E(cX) = cE(X) , D(c) = 0 , D (cX) = c 2 D(X) .2.X,Y 为任意随机变量时, E (X ±Y)=E(X)±E(Y) .3. X 与Y 相互独立时, E(XY)=E(X)E(Y) , D(X ±Y)=D(X)+D(Y) .4. D(X) = 0⇔ P{X = C}=1 ,C 为常数.三.六种重要分布的数学期望和方差 E(X) D(X) 1.X~ (0-1)分布P{X=1}= p (0<p<1) p p (1- p) 2.X~ b (n,p) (0<p<1) n pn p (1- p)3.X~ π(λ) λ λ4.X~ U(a,b) (a+b)/2 (b-a) 2/125.X 服从参数为θ的指数分布 θ θ26.X~ N (μ,σ2) μ σ2 四.矩的概念随机变量X 的k 阶(原点)矩E(X k ) k=1,2,… 随机变量X 的k 阶中心矩E{[X-E(X)] k }随机变量X 和Y 的k+l 阶混合矩E(X k Y l ) l=1,2,…随机变量X 和Y 的k+l 阶混合中心矩E{[X-E(X)] k [Y-E(Y)] l }第六章 样本和抽样分布一.基本概念总体X 即随机变量X ; 样本X 1 ,X 2 ,…,X n 是与总体同分布且相互独立的随机变量;样本值x 1 ,x 2 ,…,x n 为实数;n 是样本容量.统计量是指样本的不含任何未知参数的连续函数.如:样本均值∑==n i i X n X 11 样本方差()∑--==n i i X X n S 12211 样本标准差S样本k 阶矩∑==n i k i k X n A 11( k=1,2,…) 样本k 阶中心矩∑-==ni k i k X X n B 1)(1( k=1,2,…)二.抽样分布 即统计量的分布1.X 的分布 不论总体X 服从什么分布, E (X ) = E(X) , D (X ) = D(X) / n . 特别,若X~ N (μ,σ2 ) ,则X ~ N (μ, σ2 /n) .2.χ2分布 (1)定义 若X ~N (0,1) ,则Y =∑=ni i X 12~ χ2(n)自由度为n 的χ2分布.(2)性质 ①若Y~ χ2(n),则E(Y) = n , D(Y) = 2n .②若Y 1~ χ2(n 1) Y 2~ χ2(n 2) ,则Y 1+Y 2~ χ2(n 1 + n 2). ③若X~ N (μ,σ2 ), 则22)1(σS n -~ χ2(n-1),且X 与S 2相互独立.(3)分位点 若Y~ χ2(n),0< α <1 ,则满足αχχχχαααα=<>=<=>--))}(())({()}({)}({22/122/212n Y n Y P n Y P n Y P 的点)()(),(),(22/122/212n n n n ααααχχχχ--和分别称为χ2分布的上、下、双侧α分位点. 3. t 分布(1)定义 若X~N (0,1),Y~ χ2(n),且X,Y 相互独立,则t=nY X ~t(n)自由度为n 的t 分布.(2)性质①n →∞时,t 分布的极限为标准正态分布.②X ~N (μ,σ2 )时, nS X μ-~ t (n-1) . ③两个正态总体相互独立的样本 样本均值 样本方差X~ N (μ1,σ12 ) 且σ12=σ22=σ2 X 1 ,X 2 ,…,X n1X S 12Y~ N (μ2,σ22 ) Y 1 ,Y 2 ,…,Y n2 Y S 22则 212111)()(n n S Y X w +---μμ~ t (n 1+n 2-2) , 其中 2)1()1(212222112-+-+-=n n S n S n S w(3)分位点 若t ~ t (n) ,0 < α<1 , 则满足αααα=>=-<=>)}({)}({)}({2/n t t P n t t P n t t P的点)(),(),(2/n t n t n t ααα±-分别称t 分布的上、下、双侧α分位点. 注意: t 1- α (n) = - t α (n).4.F 分布 (1)定义 若U~χ2(n 1), V~ χ2(n 2), 且U,V 相互独立,则F =21n V n U ~F(n 1,n 2)自由度为(n 1,n 2)的F 分布.(2)性质(条件同3.(2)③)22212221σσS S ~F(n 1-1,n 2-1)(3)分位点 若F~ F(n 1,n 2) ,0< α <1,则满足)},({)},({21121n n F F P n n F F P αα-<=>ααα=<>=-))},(()),({(212/1212/n n F F n n F F P的点),(),(),,(),,(212/1212/21121n n F n n F n n F n n F αααα--和分别称为F 分布的上、下、双侧α分位点. 注意: .).(1),(12211n n F n n F αα=-第七章 参数估计一.点估计 总体X 的分布中有k 个待估参数θ1, θ2,…, θk .X 1 ,X 2 ,…,X n 是X 的一个样本, x 1 ,x 2 ,…,x n 是样本值.1.矩估计法先求总体矩⎪⎩⎪⎨⎧===),,,(),,,(),,,(2121222111k k k k k θθθμμθθθμμθθθμμ 解此方程组,得到⎪⎩⎪⎨⎧===),,,(),,,(),,,(2121222111k k k k k μμμθθμμμθθμμμθθ ,以样本矩A l 取代总体矩μ l ( l=1,2,…,k)得到矩估计量⎪⎪⎩⎪⎪⎨⎧===∧∧∧),,,(),,,(),,,(2121222111k k k k k A A A A A A A A A θθθθθθ,若代入样本值则得到矩估计值. 2.最大似然估计法若总体分布形式(可以是分布律或概率密度)为p(x, θ1, θ2,…, θk ),称样本X 1 ,X 2 ,…,X n 的联合分布∏==ni k i k x p L 12121),,,,(),,,(θθθθθθ 为似然函数.取使似然函数达到最大值的∧∧∧k θθθ,,,21 ,称为参数θ1, θ2,…,θk 的最大似然估计值,代入样本得到最大似然估计量.若L(θ1, θ2,…, θk )关于θ1, θ2,…, θk 可微,则一般可由 似然方程组0=∂∂i L θ 或 对数似然方程组 0ln =∂∂iLθ (i =1,2,…,k) 求出最大似然估计. 3.估计量的标准(1) 无偏性 若E(∧θ)=θ,则估计量∧θ称为参数θ的无偏估计量.不论总体X 服从什么分布, E (X )= E(X) , E(S 2)=D(X), E(A k )=μk =E(X k ),即样本均值X , 样本方差S 2,样本k 阶矩A k 分别是总体均值E(X),方差D(X),总体k 阶矩μk 的无偏估计,(2)有效性 若E(∧θ1 )=E(∧θ2)= θ, 而D(∧θ1)< D(∧θ2), 则称估计量∧θ1比∧θ2有效. (3)一致性(相合性) 若n →∞时,θθP →∧,则称估计量∧θ是参数θ的相合估计量. 二.区间估计1.求参数θ的置信水平为1-α的双侧置信区间的步骤(1)寻找样本函数W=W(X 1 ,X 2 ,…,X n ,θ),其中只有一个待估参数θ未知,且其分布完全确定. (2)利用双侧α分位点找出W 的区间(a,b),使P{a<W <b}=1-α.(3)由不等式a<W<b 解出θθθ<<则区间(θθ,)为所求. 2.单个正态总体待估参数 其它参数 W 及其分布 置信区间μ σ2已知nX σμ-~N (0,1) (2/ασz n X ±) μ σ2未知 nS X μ-~ t (n-1) )1((2/-±n t n S X α σ2 μ未知 22)1(σS n -~ χ2(n-1) ))1()1(,)1()1((22/1222/2-----n Sn n S n ααχχ 3.两个正态总体 (1)均值差μ 1-μ 2其它参数 W 及其分布 置信区间已知2221,σσ22212121)(n n Y X σσμμ+--- ~ N(0,1) )(2221212n n z Y X σσα+±-未知22221σσσ== 212111)(n n S Y X w+---μμ~t(n 1+n 2-2) )11)2((21212n n S n n t Y X w +-+±-α其中S w 等符号的意义见第六章二. 3 (2)③.(2) μ 1,μ 2未知, W=22212221σσS S ~ F(n 1-1,n 2-1),方差比σ12/σ22的置信区间为))1,1(1,)1,1(1(212/12221212/2221----⋅-n n F S S n n F S S αα注意:对于单侧置信区间,只需将以上所列的双侧置信区间中的上(下)限中的下标α/2改为α,另外的下(上)限取为-∞ (∞)即可.。
概率论与数理统计知识点总结
(3)一些常见排列
重复排列和非重复排列(有序)
对立事件(至少有一个)
顺序问题
(4)随机试验和随机事件
如果一个试验在相同条件下可以重复进行,而每次试验的可能结果不止一个,但在进行一次试验之前却不能断言它出现哪个结果,则称这种试验为随机试验。
乘法公式:
更一般地,对事件A1,A2,…An,若P(A1A2…An-1)>0,则有
… …… … 。
(14)独立性
①两个事件的独立性
设事件 、 满足 ,则称事件 、 是相互独立的。
若事件 、 相互独立,且 ,则有
若事件 、 相互独立,则可得到 与 、 与 、 与 也都相互独立。
必然事件 和不可能事件?与任何事件都相互独立。
设离散型随机变量 的可能取值为Xk(k=1,2,…)且取各个值的概率,即事件(X=Xk)的概率为
P(X=xk)=pk,k=1,2,…,
则称上式为离散型随机变量 的概率分布或分布律。有时也用分布列的形式给出:
。
显然分布律应满足下列条件:
(1) , , (2) 。
(2)连续型随机变量的分布密度
设 是随机变量 的分布函数,若存在非负函数 ,对任意实数 ,有
, ,
其中 、 为常数,则称随机变量 服从参数为 、 的正态分布或高斯(Gauss)分布,记为 。
具有如下性质:
1° 的图形是关于 对称的;
2°当 时, 为最大值;
若 ,则 的分布函数为
参数 、 时的正态分布称为标准正态分布,记为 ,其密度函数记为
, ,
分布函数为
。
概率论与数理统计知识点总结
概率论与数理统计知识点总结一、概率论1.随机试验和样本空间:随机试验是具有不确定性的试验,其结果有多个可能的取值。
样本空间是随机试验所有可能结果的集合。
2.事件及其运算:事件是样本空间中满足一定条件的结果的集合。
事件之间可以进行并、交、补等运算。
3.概率的定义和性质:概率是描述随机事件发生可能性的数值。
概率具有非负性、规范性和可列可加性等性质。
4.条件概率和独立性:条件概率是在已知一事件发生的条件下,另一事件发生的概率。
事件独立表示两个事件之间的发生没有相互关系。
5.全概率公式和贝叶斯公式:全概率公式是一种计算事件概率的方法,将事件分解成互斥的多个事件的概率之和。
贝叶斯公式是一种用于更新事件概率的方法。
6.随机变量和分布函数:随机变量是样本空间到实数集的映射,用来描述试验结果的数值特征。
分布函数是随机变量取值在一点及其左侧的概率。
7.常用概率分布:常见的概率分布包括离散型分布(如二项分布、泊松分布)和连续型分布(如正态分布、指数分布)。
8.数学期望和方差:数学期望是随机变量的平均值,用于描述随机变量的中心位置。
方差是随机变量离均值的平均距离,用于描述随机变量的分散程度。
二、数理统计1.统计量和抽样分布:统计量是对样本数据进行总结和分析的函数。
抽样分布是统计量的概率分布,用于推断总体参数。
2.估计和点估计:估计是利用样本数据对总体参数进行推断。
点估计是利用样本数据得到总体参数的一个具体数值。
3.估计量的性质和评估方法:估计量的性质包括无偏性、有效性和一致性等。
评估方法包括最大似然估计、矩估计等。
4.区间估计:区间估计是对总体参数进行估计的区间范围。
置信区间是对总体参数真值的一个区间估计。
5.假设检验和检验方法:假设检验是在已知总体参数的条件下,对总体分布做出的统计推断。
检验方法包括参数检验和非参数检验。
6.正态总体的推断:当总体近似服从正态分布时,可以利用正态分布的性质进行推断。
7.方差分析和回归分析:方差分析用于比较两个或多个总体均值是否相等。
(完整版)概率论与数理统计知识点总结(免费超详细版)
《概率论与数理统计》第一章 概率论的基本概念§2.样本空间、随机事件1.事件间的关系 B A ⊂则称事件B 包含事件A ,指事件A 发生必然导致事件B 发生B }x x x { ∈∈=⋃或A B A 称为事件A 与事件B 的和事件,指当且仅当A ,B 中至少有一个发生时,事件B A ⋃发生B }x x x { ∈∈=⋂且A B A 称为事件A 与事件B 的积事件,指当A ,B 同时发生时,事件B A ⋂发生B }x x x { ∉∈=且—A B A 称为事件A 与事件B 的差事件,指当且仅当A 发生、B 不发生时,事件B A —发生φ=⋂B A ,则称事件A 与B 是互不相容的,或互斥的,指事件A 与事件B 不能同时发生,基本事件是两两互不相容的且S =⋃B A φ=⋂B A ,则称事件A 与事件B 互为逆事件,又称事件A 与事件B 互为对立事件2.运算规则 交换律A B B A A B B A ⋂=⋂⋃=⋃结合律)()( )()(C B A C B A C B A C B A ⋂=⋂⋃⋃=⋃⋃ 分配律 )()B (C A A C B A ⋃⋂⋃=⋂⋃)( ))(()( C A B A C B A ⋂⋂=⋃⋂ 徳摩根律B A B A A B A ⋃=⋂⋂=⋃ B —§3.频率与概率定义 在相同的条件下,进行了n 次试验,在这n 次试验中,事件A 发生的次数A n 称为事件A 发生的频数,比值n n A 称为事件A 发生的频率概率:设E 是随机试验,S 是它的样本空间,对于E 的每一事件A 赋予一个实数,记为P (A ),称为事件的概率 1.概率)(A P 满足下列条件:(1)非负性:对于每一个事件A 1)(0≤≤A P (2)规范性:对于必然事件S 1)S (=P(3)可列可加性:设n A A A ,,,21 是两两互不相容的事件,有∑===nk kn k kA P A P 11)()( (n 可以取∞)2.概率的一些重要性质: (i ) 0)(=φP(ii )若n A A A ,,,21 是两两互不相容的事件,则有∑===nk kn k kA P A P 11)()((n 可以取∞)(iii )设A ,B 是两个事件若B A ⊂,则)()()(A P B P A B P -=-,)A ()B (P P ≥ (iv )对于任意事件A ,1)(≤A P(v ))(1)(A P A P -= (逆事件的概率)(vi )对于任意事件A ,B 有)()()()(AB P B P A P B A P -+=⋃§4等可能概型(古典概型)等可能概型:试验的样本空间只包含有限个元素,试验中每个事件发生的可能性相同 若事件A包含k个基本事件,即}{}{}{2]1k i i i e e e A =,里个不同的数,则有中某,是,,k k n 2,1i i i ,21 ()中基本事件的总数包含的基本事件数S }{)(1j A n k e P A P kj i ===∑= §5.条件概率(1) 定义:设A,B 是两个事件,且0)(>A P ,称)()()|(A P AB P A B P =为事件A 发生的条件下事件B 发生的条件概率(2) 条件概率符合概率定义中的三个条件1。
(完整版)概率论与数理统计知识点总结
p k q nk
其中 q 1 p,0 p 1, k 0,1,2,, n ,
则称随机变量 X 服从参数为 n , p 的二项分布。记为
X ~ B(n, p) .
当 n 1时, P(X k) pk q1k , k 0.1,这就是(0—1)分布,
所以(0-1)分布是二项分布的特例。
泊 松 设随机变量 X 的分布律为
1
(完整版)概率论与数理统计知识点总结
A—B,也可表示为 A—AB 或者 AB ,它表示 A 发生而 B 不发生的事
件.
A、B 同时发生:A B,或者 AB。A B=Ø ,则表示 A 与 B 不可能 同时发生,称事件 A 与事件 B 互不相容或者互斥。基本事件是
互不相容的.
—A 称为事件 A 的逆事件,或称 A 的对立事件,记为 A .它表 示 A 不发生的事件。互斥未必对立。
P(A)= (1) (2 ) (m ) = P(1) P(2 ) P(m )
m n
A所包含的基本事件数 基本事件总数
(6)几 若随机试验的结果为无限不可数并且每个结果出现的可能性均
1
(完整版)概率论与数理统计知识点总结
何概型 匀,同时样本空间中的每一个基本事件可以使用一个有界区域 来描述,则称此随机试验为几何概型。对任一事件 A,
3° F() lim F(x) 0, F() lim F(x) 1;
x
x
4° F(x 0) F(x) ,即 F(x) 是右连续的;
5° P(X x) F(x) F(x 0) .
对于离散型随机变量, F(x) pk ; xk x x
对于连续型随机变量, F(x) f (x)dx .
概型 用 p 表示每次试验 A 发生的概率,则 A 发生的概率为1 p q ,用
概率论与数理统计知识点总结(PDF)
概率论与数理统计 知识点总结一、随机事件与概率1.随机事件(1)事件间的关系与运算● 事件的差:A B A AB AB -=-= ● 对立事件:,AA A A =∅⋃=Ω ● 完备事件组:设12,,,,n A A A 是有限或可数个事件,如果其满足:① ,,,1,2,i j A A i j i j =∅≠=; ②i iA =Ω,则称12,,,,n A A A 是一个完备事件组.(2)随机事件的运算律 ● 求和运算:①A B B A +=+(交换律)②()()A B C A B C A B C ++=++=++(结合律) ● 求交运算:①AB BA =(交换律)②()()AB C A BC ABC ==(结合律) ● 求和运算与求交运算的混合:①()()()A B C AB AC +=+(第一分配律) ②()()()A BC A B A C +=++(第二分配律) ● 求对立事件的运算:()A A =(自反律) ● 和及交事件的对立事件:①A B AB +=(第一对偶律) ②AB A B =+(第二对偶律)2.随机事件的概率(1)概率的公理化定义● 公理1:()1P Ω=;公理2:对任意事件A ,有()0P A ≥;公理3:对任意可数个两两不相容的事件12,,,,n A A A ,有11()()i i i i P A P A ∞∞===∑.(2)概率测度的其他性质 ● 性质1:()0P ∅=性质2(有限可加性):12,,,n A A A 是两两互不相容的,则有11()()nni i i i P A P A ===∑性质3:()1()P A P A =-性质4:()()()P A B P A P AB -=-特别地,若A B ⊃,则①()()()P A B P A P B -=-;②()()P A P B ≥ 性质5:0()1P A ≤≤性质6:()()()()P A B P A P B P AB +=+-推论:()()()()()()()()P A B C P A P B P C P AB P AC P BC P ABC ++=++---+3.古典概型与几何概型(1)古典概型● 古典概型的概率测度:()==A A P A Ω中元素个数使发生的基本事件数中元素个数基本事件总数(2)几何概型● 几何概型的概率测度:()()()S A P A S =Ω 4.条件概率(1)条件概率的数学定义 ●()()(()0)()P AB P B A P A P A =>● ()1()P B A P B A =- ●()1()P B A P B A =-● 条件概率测度满足概率的三条公理:公理1:()1P A Ω=;公理2:对任意事件B ,有()0P B A ≥;公理3:对任意可数个两两不相容的事件12,,,,n A A A ,有11()()i i i i P A A P A A ∞∞===∑.(2)乘法公式 ● ()()(),()0P AB P A P B A P A => ● ()()(),()0P AB P B P A B P B => ● ()()()()P ABC P A P B A P C AB = ●12121312121()()()()()n n n P A A A P A P A A P A A A P A A A A -=(3)全概率公式● 设{}i A 是一列有限或可数无穷个两两不相容的非零概率事件,且i iA =Ω,则对任意事件B ,有()()()i i iP B P A P B A =∑.(4)贝叶斯公式● 设{}i A 是一列有限或可数无穷个两两不相容的非零概率事件,且1i i A ∞==Ω,则对任意事件B , ()0P B >,有()()()()()()()i i i i j j jP A P B A P A B P A B P B P A P B A ==∑. 5.事件的独立性(1)两个事件的独立性 ●()()()P AB P A P B =(2)有限个事件的独立性● 两两独立:()()()i j i j P A A P A P A = ● 相互独立:1212()()()()k k i i i i i i P A A A P A P A P A =(3)相互独立性的性质 ● 性质1:如果n 个事件12,,,n A A A 相互独立,则将其中任何(1)m m n ≤≤个事件改为相应的对立事件,形成的新的n 个事件仍然相互独立. 性质2:如果n 个事件12,,,n A A A 相互独立,则有1111()1(1())n n ni i i i i i P A P A P A ===⎛⎫=-=-- ⎪⎝⎭∏∏(4)伯努利概型● 伯努利定理:在一次试验中,事件A 发生的概率为(01)p p <<,则在n 重伯努利试验中,事件A 恰好发生k 次的概率为:(;,)C k k n kn b k n p p q-=,其中1q p =-. ● 在伯努利试验序列中,设每次试验中事件A 发生的概率为p ,“事件A 在第k 次试验中才首次发生”(1)k ≥,这一事件的概率为1(,)k g k p q p -=.二、随机变量的分布与数字特征1.随机变量及其分布(1)离散型随机变量的概率分布● 离散型随机变量的概率分布满足性质:①()0,1,2,i p x i ≥=②()1iip x =∑● 一旦知道一个离散型随机变量X 的概率分布{}i p x (),便可求得X 所生成的任何事件的概率.特别地,对任意a b ≤,有{}({}){}()i i i i i i a x ba x ba x bP a X b P X x P X x p x ≤≤≤≤≤≤≤≤=====∑∑.一般地,若I 是一个区间,则{}=()i ix IP X I p x ∈∈∑.(2)分布函数● 随机变量的分布函数性质:①单调性,若12x x <,则12()()F x F x ≤; ②()lim ()0x F F x →-∞-∞==,()lim ()1x F F x →+∞+∞==;③右连续性,(0)()F x F x +=. (3)连续型随机变量及其概率密度 ●(){}()xF x P X x f t dt -∞=≤=⎰,()f x 为X 的概率密度函数.● 密度函数性质:①()0,(,)f x x ≥∈-∞+∞; ②()1f x dx +∞-∞=⎰.● {}()()()b aP a X b F b F a f x dx <≤=-=⎰● {}0P X x ==(连续型)●'()()F x f x =2.随机变量的数字特征(1)离散型随机变量的数学期望 ●1=i i i EX x p ∞=∑(2)连续型随机变量的数学期望 ●()EX xf x dx +∞-∞=⎰(3)随机变量函数的数学期望● 设X 是一个随机变量,()g x 是一个实函数.①若X 为离散型随机变量,概率分布为{},1,2,i i P X x p i ===.且1()iii g x p∞=<∞∑,则()Eg X 存在,且1()()i i i Eg X g x p ∞==∑.②若X 为连续型随机变量,()f x 是其密度函数,且()()g x f x dx +∞-∞<∞⎰,则()Eg X 存在,且()()()Eg X g x f x dx +∞-∞=⎰.(4)数学期望的性质● ①对任意常数a ,有Ea a =;②设12,αα为任意实数,12(),()g x g x 为任意实函数,如果12(),()Eg X Eg X 均存在,则11221122[()()]()()E g X g X Eg X Eg X αααα+=+;③如果EX 存在,则对任意实数a ,有()E X a EX a +=+. (5)随机变量的方差 ● 离差:X EX -● 方差:2()DX E X EX =-● ● ①若X 为离散型随机变量,其概率分布为{},1,2,i i P X x p i ===,则22()()i i iDX E X EX x EX p =-=-∑②若X 为连续型随机变量,()f x 为其密度函数,则22()()()DX E X EX x EX f x dx +∞-∞=-=-⎰③22()DX EX EX =-● 方差的基本性质:设X 的方差DX 存在,a 为任意常数,则 ①0Da =;②()D X a DX +=; ③2()D aX a DX =.(6)随机变量的矩与切比雪夫不等式● 矩定义:X 为一个随机变量,k 为正整数,如果kEX 存在(即kE X<∞),则称kEX 为X的k 阶原点矩,称kE X 为X 的k 阶绝对矩.定理:随机变量X 的t 阶矩存在,则其s 阶矩(s t <为正整数)也存在. 推论:设k 为正整数,C 为常数,如果kEX 存在,则()kE X C +存在,特别地,)k E X EX -(存在.● 中心矩定义:X 为一个随机变量,k 为正整数,如果k EX 存在,则称()kE X EX -为X 的k阶中心矩,称kE X EX -为X 的k 阶绝对中心矩.● 定理:设()h x 是x 的一个非负函数,X 是一个随机变量,且()Eh X 存在,则对任意0ε>,有(){()}Eh X P h X εε≥≤.推论1(马尔可夫不等式):设X 的k 阶矩存在(k 为正整数),即kE X <∞,则对任意0ε>有{}kkE XP X εε≥≤.推论2(切比雪夫不等式):设X 的方差存在,则对任意0ε>有2{}DXP X EX εε-≥≤.推论3:随机变量X 的方差为0当且仅当存在一个常数a ,使得{}=1P X a =.3.常用的离散型分布,n),n kp -,ndef(,),g k p k =几何分布的无记忆性:设{P X二项分布可作为超几何分布的近似,即1212C C Ck n kk n kN N k n nNN N C N N --⎛⎫⎛⎫≈ ⎪ ⎪⎝⎭⎝⎭.这一近似关系的严格数学表述是:当N →∞时,1N →∞,2N →∞,且1N p N →,21Np N→-,则对任意给定的n 和k ,有()12C C lim1Ck n kn kN N k kn nN NC p p --→∞=-.泊松定理:在n 重伯努利试验中,事件A 在每次试验中发生的概率为n p (注意这与试验的次数n 有关),如果n →∞时,n np λ→(0λ>为常数),则对任意给定的k ,有lim (;,)e !kn n b k n p k λλ-→∞=.当二项分布(,)b n p 的参数n 很大,而p 很小时,可以将它用参数为np λ=的泊松分布来近似,即有()(;,)e !k npnp b k n p k -≈.4.常用的连续型分布正态分布● 定理:设2~(,),,,X N Y aX b a b μσ=+为常数,且0a ≠,则22~(,)Y N a b aμσ+.推论1:如果2~(,)X N μσ,则~(0,1)X N μξσ-=.ξ通常称为X 的标准化.推论2:2~(,)X N μσ的充要条件是存在一个随机变量~(0,1)N ξ,使得X σξμ=+. 推论3:设2~(,),(),()X N x x μσϕΦ分别为其分布函数与密度函数,00(),()x x ϕΦ是标准正态分布的分布函数和密度函数,则有00()(),1()().x x x x μσμϕϕσσ-Φ=Φ-=● 一般正态分布的概率计算:【例】已知2~(,)X N μσ,求()a Φ. 解 0(){}{}{}()X a X a P X a P P b b μμμσσσ---Φ=≤=≤=≤=Φ5.随机变量函数的分布(1)离散型随机变量函数的分布● 离散型随机变量函数的概率分布的一般方法:先根据自变量X 的可能取值确定因变量Y 的所有可能取值,然后对Y 的每一个可能取值(1,2,)i y i =确定相应的{()}i j j i C x g x y ==,则有{}{()}{},{}{}{},j ii i i i i jx C Y y g X y X C P Y y P X C P X x ∈====∈==∈==∑从而求得Y 的概率分布. (2)连续型随机变量函数的分布● 连续型随机变量函数的概率分布的一般方法:一般地,已知X 的分布函数()X F x 或密度函数()X f x ,为求()Y g X =的分布函数,有()(){()}{},Y x F x P Y x P g X x P X C =≤=≤=∈其中{()}x C t g t x =≤.而{}x P X C ∈往往可由X 的分布函数()X F x 来表达或用其密度函数()X f x 的积分来表达:{}()xx X C P X C f t dt ∈=⎰.进而,Y 的密度函数,可直接从()Y F x 导出.三、随机向量1.随机向量的分布(1)随机向量及其分布函数 ●1212{,}P x X x y Y y <≤<≤22122111(,)(,)(,)(,)F x y F x y F x y F x y =--+● 由(联合)分布函数的定义得出性质:①0(,)1F x y ≤≤;②(,)F x y 关于x 和y 均单调非降、右连续; ③(,)lim (,)0,x F y F x y →-∞-∞==(,)lim (,)0,y F x F x y →-∞-∞==(,)(,)(,)lim (,)0,x y F F x y →-∞-∞-∞-∞== (,)(,)(+,+)lim(,) 1.x y F F x y →+∞+∞∞∞==●(,)F x y 的边缘分布函数:(){}{,}(,)X F x P X x P X x Y F x =≤=≤<+∞=+∞, (){}{,}(,)Y F y P Y y P X Y y F y =≤=<+∞≤=+∞.(2)离散型随机向量的概率分布● 离散型随机向量的概率分布{,},,1,2,i i ij P X x Y y p i j ====,ij p 满足性质:①0,,1,2,ij p i j ≥=;②1ijijp=∑∑.● 边缘概率分布:{},1,2,X i i ij jp P X x p i ====∑ {},1,2,Y j j ij ip P Y y p j ====∑(3)连续型随机向量的概率密度函数 ● 二维连续型随机向量(,)(,)x yF x y f s t dsdt -∞-∞=⎰⎰,(,)f x y 为(),X Y 的概率密度函数或X 与Y 的联合密度函数. (,)f x y 具有性质:①(,)0f x y ≥; ②(,)1f x y dxdy +∞+∞-∞-∞=⎰⎰;③若D 是平面上的一个区域,则(){,}(,)DP X Y D f x y dxdy ∈=⎰⎰● 边缘密度函数:()(,)()(,)X Y f x f x y dyf y f x y dx+∞-∞+∞-∞==⎰⎰● 均匀分布的密度函数:1,(,)()(,)0,x y G S G f x y ⎧∈⎪=⎨⎪⎩其他,若(),X Y 服从G 上的均匀分布,则对任何平面区域D ,有()1(){,}(,)=()()DD GS D G P X Y D f x y dxdy dxdy S G S G ⋂⋂∈==⎰⎰⎰⎰. (4)二元正态分布 ● 密度函数:()2211222221212()()()()122(1),x x y y x y μμμμρσσρσσϕ⎡⎤------+⎢⎥-⎢⎥⎣⎦=,记作()221212,~(,;,;)X Y N μμσσρ.● 边缘密度函数分布:()2121()2()=,x X x x y dy μσϕϕ--+∞-∞⎰,()2222()2()=,y Y y x y dx μσϕϕ--+∞-∞⎰.注意:比较联合密度函数(),x y ϕ和边缘密度函数()X x ϕ,()Y y ϕ,当且仅当0ρ=时,对一切(),x y ,有(),()()X Y x y x y ϕϕϕ=.2.条件分布与随机变量的独立性(1)条件分布与独立性的一般概念● 随机变量X 和Y 相互独立:(,)()()X Y F x y F x F y =● 定理1:随机变量X 和Y 相互独立的充要条件是X 所生成的任何事件与Y 生成的任何事件独立,即对任意实数集A 和B ,有{,}{}{}P X A Y B P X A P Y B ∈∈=∈∈.定理2:如果随机变量X 和Y 相互独立,则对任意函数12(),()g x g y ,均有1()g X 与2()g Y 相互独立. ● 相互独立:12,,,n X X X 相互独立,()121122,,,()()()n n n F x x x F x F x F x =.(2)离散型随机变量的条件概率分布与独立性 ● 概率分布:{,},,1,2,i j ij P X x Y y p i j ====●i j p (当{}0i P Y y =>时):{,}{}{}iji i i j Y i jP P X x Y y P X x Y y P Y y P =======性质:①0i j p ≥;②1i jip=∑.● 已知j Y y =的条件下X 的条件概率分布:{},1,2,i i i j P X x Y y p i ====; 已知i X x =的条件下Y 的条件概率分布:{},1,2,i i j i P Y y X x p j ====.●X Y ij i j j i i j p p p p p =⋅=⋅● 定理:设,X Y 是离散型随机变量,其联合概率分布为{,}(,1,2,)i j ij P X x Y y p i j ====,边缘概率分布分别为X i p 和Yj p (,1,2,)i j =,则X 与Y 相互独立的充要条件是,,1,2,X Y ij i j p p p i j ==.(3)连续型随机变量的条件密度函数与独立性● 在Y y =的条件下X 的条件分布:0(,){,}{}lim {}()xy Y f u y du P X x y y Y y P X x Y y P y y Y y f y -∞∆→≤-∆<≤≤===-∆<≤⎰● 条件分布和条件密度函数● (,)()()()()X Y Y X X Y f x y f x f y x f y f x y ==● 定理:设连续型随机向量(),X Y 的密度函数为(,)f x y ,边缘密度函数分别为()X f x 和()Y f y ,则X 与Y 相互独立的充要条件是(,)()()X Y f x y f x f y =.3.随机向量的函数的分布与数学期望(1)离散型随机向量的函数分布 ●(,){}{(,)}{,},1,2,i j kk k i j g x y z P Z z P g X Y z P X x Y y k ========∑● 设,X Y 是两个相互独立的随机变量,分别服从参数为1λ和2λ的泊松分布,则X Y ξ=+的分布为()()1212e ,0,1,2,!kk k λλλλ-++=,可见X Y ξ=+服从参数为()12λλ+的泊松分布.结论:泊松分布具有独立可加性.2,(2)连续型随机向量的函数分布● 分布函数:(){}{(,)}{(,)}(,)zZ z D F z P Z z P g X Y z P X Y D f x y dxdy =≤=≤=∈=⎰⎰,其中z D ={(,)(,)}x y g x y z ≤. ● 密度函数:'()=()Z Z f z F z .● 随机变量的和:设(,)X Y 的联合密度函数为(,)f x y ,则X Y +的密度函数为()=(,)Z f z f z y y dy +∞-∞-⎰或 ()=(,)Z f z f x z x dx +∞-∞-⎰特别地,如果X 和Y 是相互独立的随机变量,则有(卷积公式)()=()()Z X Y f z f x f z x dx +∞-∞-⎰或 ()=()()Z X Y f z f z y f y dy +∞-∞-⎰即,()=*()*()Z X Y Y X f z f f z f f z =.● 独立正态随机变量之和:设随机变量221122~(,),~(,)X N Y N μσμσ,且X 与Y 独立,则221212~(,)X Y N μμσσ+++,即2122212()2()()z X Y f z μμσσ⎡⎤---⎢⎥+⎢⎥⎣⎦+=,结论:独立正态分布的和服从正态分布.推论:X 与Y 相互独立且分别服从正态分布211(,)N μσ和222(,)N μσ,则其任意非零线性组合仍服从正态分布,且22221212~(,)aX bY N a b a b μμσσ+++.进一步地,12,,n X X X 相互独立,2~(,)i i iX N μσ,则22111~(,)n n ni i i i i i i i i a X N a a μσ===∑∑∑.● 随机变量的商:设二维随机向量(,)X Y 的密度函数为(,)f x y ,则XZ Y=的密度函数为'()=()(,)Z Z f z F z y f zy y dy +∞-∞=⎰.● 最大值与最小值:设,X Y 的分布函数分别为(),()F x G x ,密度函数分别为(),()f x g x ,且X与Y 相互独立,令max{,},min{,}M X Y N X Y ==,则有(3)随机向量函数的数学期望● 二维离散型随机向量的数学期望:,(,)(,)ijiji jEZ Eg X Y g x y p==∑.● 二维连续型随机向量的数学期望:(,)(,)(,)EZ Eg X Y g x y f x y dxdy +∞+∞-∞-∞==⎰⎰.●(,)g X Y XY =型:()(),,,(,),,i j ij i jx y p X Y EXY xyf x y dxdy X Y +∞+∞-∞-∞⎧⎪=⎨⎪⎩∑⎰⎰若为离散型若为连续型 (4)数学期望的进一步性质● (1)对任意两个随机变量,X Y ,如果其数学期望均存在,则()E X Y +存在,且()=E X Y EX EY ++(2)设,X Y 为任意两个相互独立的随机变量,数学期望均存在,则EXY 存在,且=EXY EXEY推广: (1)12,,,n X X X 是任意n 个随机变量,数学期望均存在,则()12n E X X X +++存在,且()1212n n E X X X EX EX EX +++=+++(2)设12,,,n X X X 是个相互独立的随机变量,且数学期望均存在,则()12n E X X X 存在,且()1212n n E X X X EX EX EX =.4.随机变量的数字特征(1)协方差● 协方差:()()()cov ,X Y E X EX Y EY =--⎡⎤⎣⎦1,2,)●()cov ,X Y EXY EXEY =-● 定理:(1)()cov ,X X DX = (2)()()cov ,cov ,X Y Y X =(3)()()cov ,cov ,,,aX bY ab X Y a b =为任意常数 (4)()cov ,0,C X C =为任意常数(5)()()()1212cov ,cov ,cov ,X X Y X Y X Y +=+ (6)如果X 与Y 相互独立,则()cov ,0X Y =推论:设,X Y 为任意两个随机变量,如果其方差均存在,则X Y +的方差也存在,且()()2cov ,D X Y DX DY X Y +=++.()()2cov ,D X Y DX DY X Y -=+-特别地,如果X 与Y 相互独立,则()D X Y DX DY +=+.● 定理:设()12,,,n X X X 是n 维随机向量,如果()1,2,,i X i n =的方差均存在,则对任意实向量()12,,,n λλλ,1ni i i X λ=∑的方差必存在,且()21112cov ,n n i i i i i j i j i i i j n D X DX X X λλλλ==≤<≤⎛⎫=+ ⎪⎝⎭∑∑∑.特别地,如果12,,,n X X X 两两独立,则211n n i i i i i i D X DX λλ==⎛⎫= ⎪⎝⎭∑∑. (2)协方差矩阵 ● 记()T 12,,,n X X X =X ,其协差阵通常记作D X .对任意实向量()T12,,,n λλλ=λ,有()T T D D =λX λX λ.对任意实向量()T12,,,n λλλ=λ,()T T 0D D =≥λX λλX .(3)相关系数 ●,cov ,X Y X Y ρ,,1X Y ρ≤● 定理:设(),X Y 是一个二维随机向量,,DX DY 均存在且为正,则,1X Y ρ=的充要条件是X 与Y 具有线性关系,即存在常数0a ≠及常数b ,使得{}1P Y ax b =+=.而且,当0a >时,,1X Y ρ=;当0a <时,,1X Y ρ=-.● 如果,DX DY 均存在且为正,那么X 与Y 不相关等价以下条件:①()cov ,0X Y =; ②EXY EXEY =;③()D X Y DX DY +=+; ④,0X Y ρ=.5.大数定律与中心极限定理(1)依概率收敛 ● 定义:设12,,,,,n X X X X 是一列随机变量,如果对任意0ε>,恒有{}lim 0n n P X X ε→∞->=,则称{}n X 依概率收敛到X ,记作Pn X X −−→或lim n n P X X →∞-=.(2)大数定律 ● 定理:①伯努利大数定律:设n μ是n 重伯努利试验中事件A 发生的次数,已知在每次试验中A 发生的概率为()01p p <<,则对任意0ε>,有lim 0n n P p n με→∞⎧⎫->=⎨⎬⎩⎭, 即Pnp nμ−−→或limnn P p nμ→∞-=.②切比雪夫大数定律:设12,,,n ξξξ是一列两两不相关的随机变量,它们的数学期望iE ξ和方差i D ξ均存在,且方差有界,即存在常数C ,使得()1,2,i D C i ξ≤=,则对任意0ε>,有1111lim 1n ni i n i i P E n n ξξε→∞==⎧⎫-<=⎨⎬⎩⎭∑∑. 推论:设12,,,nξξξ是一列独立同分布的随机变量,其数学期望和方差均存在,记=i E ξμ,则对任意0ε>,有11lim 1n i n i P n ξμε→∞=⎧⎫-<=⎨⎬⎩⎭∑. 即11n Pi i n ξμ=−−→∑.③辛钦大数定律:设12,,,nξξξ是一列相互独立同分布的随机变量,且数学期望存在,记=i E ξμ,则有11lim 1n i n i P n ξμε→∞=⎧⎫-<=⎨⎬⎩⎭∑. (3)中心极限定理● 定理:林德伯格-列维 设12,,,n ξξξ是一列相互独立同分布的随机变量,且=i E ξμ,2=0,1,2,,i D i ξσ>=则有22lim en t i xn n P x dt ξμ--∞→∞⎧⎫-⎪⎪⎪≤=⎬⎪⎪⎪⎩⎭∑.● 定理:设()~,,01,n X b n p p <<则22lim et xn P x dt --∞→∞⎧⎫⎪≤=⎬⎪⎭.四、数理统计的基础知识1.总体与样本样本与样本分布● 总体X 的分布函数为()F x ,则样本()12,,,n X X X 的分布函数为:()()121,,,nn n i i F x x x F x ==∏,称之为样本分布.特别地,若总体X 为连续型随机变量,其密度函数为()f x ,则样本的密度函数为()()121,,,nn n i i f x x x f x ==∏.若总体X 为离散型随机变量,概率分布为(){}p x P X x ==,x 取遍X 所有可能取值,则样本的概率分布为()()()1211221,,,,,,nn n n n i i p x x x P X x X x X x p x ======∏.),n i x =∏为伯努利总体,如果它服从以}{,p P X =)12,,,n X X X 的概率分布为,n n X i =取1或0,而n i +,它恰等于样本中取值为服从参数为λ的泊松分布,)12,,,n X X 为其样本,则样本的概率分布为)21,,ee !!!!kinn n n k k k n i X i X i i i i i λλλλ--======∏,其中取非负整数,而n i ++.2.统计量常用的统计量)n X +2)X -1(ni i X X =-∑3.常用的统计分布(1)分位数● 上侧分位数:设随机变量X 的分布函数为()F x ,对给定的实数(01)αα<<,如果实数F α满足{}P X F αα>=,即()1F F αα-=或()1F F αα=-,则称F α为随机变量X 的分布的水平α上的上侧分位数. ● 有关等式:{}1P X F αα-≤= 1221P F X F ααα-⎧⎫<≤=-⎨⎬⎩⎭推论:()()122,,P X F m n X F m n ααα-⎛⎫⎧⎫⎧⎫<⋃>= ⎪⎨⎬⎨⎬ ⎪⎩⎭⎩⎭⎝⎭或()()122,,1P F m n X F m n ααα-⎧⎫<<-⎨⎬⎩⎭. ● 双侧分位数:设X 是对称分布的连续型随机变量,其分布函数为()F x ,对给定的实数(01)αα<<,如果正实数T α满足{}P X T αα>=,即()()1F T F T ααα--=-.则称T α为随机变量X 的分布的水平α的双侧分位数. 注意:由于对称性,上式可改写为:()12F T αα=-或{}()12P X T F T ααα>=-=.对于具有对称密度函数的分布函数的上侧分位数,恒有1F F αα-=-. (2)2χ分布 ● 命题:设()12,,,n X X X 是n 个相互独立的随机变量,且()~0,1,1,2,,i X N i n =,则22212n X X X X=+++的密度函数为()1122221;e,022n x n x n xx n χ--=>⎛⎫Γ ⎪⎝⎭.● Γ函数:()()10e 0a x a x dx a +∞--Γ=>⎰.●2χ分布:一个随机变量X 称为服从以n 为自由度的2χ分布,如果其密度函数由()1122221;e,022n x n x n xx n χ--=>⎛⎫Γ ⎪⎝⎭给出,记作()2~X n χ.● 命题:①若()()22~,~X m Y n χχ,且X 与Y 相互独立,则()2~X Y m n χ++. ②若()2~X n χ,则,2EX n DX n ==.(3)F 分布 ● 命题:设Z 由/=/X m n X Z Y n m Y=(设()()22~,~X m Y n χχ,且X 与Y 相互独立.)所定义,则Z 的密度函数为()()11221;,1,0,22m m n m m m f x m n x x x m n n n n --+⎛⎫⎛⎫⎛⎫=+> ⎪⎪ ⎪⎛⎫⎝⎭⎝⎭⎝⎭B ⎪⎝⎭.● B 函数:()()()1110,=10,0q p p q x x dx p q --B ->>⎰.●F 分布:如果一个随机变量X 的密度函数由()()11221;,1,0,22m m n m m m f x m n x x x m n n n n --+⎛⎫⎛⎫⎛⎫=+> ⎪⎪ ⎪⎛⎫⎝⎭⎝⎭⎝⎭B ⎪⎝⎭给出,则称其服从第一自由度为m ,第二自由度为n 的F 分布,记作()~,X F m n . ● 若()~,X F m n ,则()1~,XF n m -.● 当α接近1时,可利用()()11,=,F m n F n m αα-求出所需上侧分位数.(3)t 分布● 定义式:设()()2~0,1,~X N Y n χ,且X 与Y相互独立,记T =,则()2~1,/X T F n Y n=.● 命题:T 的密度函数为()122;1,n x t x n x n +-⎫=+-∞<<+∞⎪⎭⎝⎭.●t 分布:如果一个随机变量X 的密度函数由()122;1,n x t x n x n +-⎫=+-∞<<+∞⎪⎭⎝⎭给出,则称其为服从自由度为n 的t 分布,记作()~X t n .注意:当自由度n 很大时,t 分布接近于标准正态分布,因为2+11222lim 1=en x n x n --→∞⎛⎫+ ⎪⎝⎭.●当α接近1时,()()1t n t n αα-=-.4.抽样分布(1)正态总体的抽样分布● 定理:设总体()()212~,,,,,n X N X X X μσ是其容量为n 的一个样本,X 与2S 分别为此样本的样本均值与样本方差,则有①2~,X N n σμ⎛⎫⎪⎝⎭;②()2221~1n S n χσ--;③X 与2S 相互独立. ● 单正态总体的抽样分布定理:设()12,,,n X X X 为正态总体()2~,X N μσ的样本,X 与2S 分别为该样本的样本均值与样本方差,则有①()~0,1X U N =;②()2221~1n S n χσ--;③()~1X T t n =-.● 双正态总体的抽样分布定理:设()211~,X N μσ与()222~,Y N μσ是两个相互独立的正态总体.又设()112,,n X X X是总体X 的容量为1n 的样本,X 与21S 分别为该样本的样本均值与样本方差.再设()212,,n Y Y Y 是总体Y 的容量为2n 的样本,Y 与22S 分别为此样本的样本均值与样本方差.记2S 是21S 与22S 的加权平均:222121212121122n n S S S n n n n --=++-+-,则有 ①()()~0,1X Y U N μμ---=;②()222112212~1,1S F F n n S σσ⎛⎫=-- ⎪⎝⎭;③当22212==σσσ时,()12~2X Y T t n n μμ---=+-.(2)一般总体抽样分布的极限分布 ● 定理:设()12,,,n X X X 为总体X 的样本,并设总体X 的数学期望与方差均存在,分别记为2,EX DXμσ==.再记n n X X U T ==X 与S 分别表示上述样本的样本均值与样本方差,则有①()()0n dU F x x −−→Φ; ②()()0n dT F x x =−−→Φ.以上()n U F x ,n T F 与()0x Φ分别表示n U ,n T 及标准正态分布的分布函数.五、参数估计与假设检验1.点估计概述评价估计量的标准 ),n X 为参数的有偏估计量.若),n X 为未知参数}-<=θε),n X 为取自总体①样本均值X 是μ的无偏估计量;②样本方差2S 是σ③未修正的样本方差,即样本二阶中心矩),n X 是取自总体,n .则1n 的相合估计量,,n .(~,X N μ),n X 为其样本,则样本方差2S 是2σ的相合估计2.参数的最大似然估计与矩估计(1)最大似然估计 ● ),n x ,存在),n x ,使()*1,,n x x θ为θ的最大似然估计值,称相应的统),n X 为的最大似然估计量.它们统称为θ的最大似然估计,可MLE . 如果未知参数为12,,,r θθθ,那么似然函数是多元函数(,,)r L θθ.若对任意),n x 存在),,,1,2,=n x i r ,使1*1(,,),,)max (,,)∈Θ=r r r L θθθθθ,则称*i θ为i θ的,1,2,,=MLE i r .当似然函数关于未知参数可微时,一般可通过求导数得到MLE ,其主要步骤①写出似然函数1(,,)r L θθ;0∂=∂L θ或ln 0,1,,∂==∂L i r θ,从中求得驻点注意,函数L 与ln L有相同的最值点,而使用后者往往更方便;③判断驻点为最大值点; MLE .● 最大似然估计的不变性:如果ˆθ为θ的最大似然估计,()=u g θ是θ的函数且存在单值反函数()=h u θ.那么()ˆg θ是()g θ的最大似然估计. (2)矩估计 ● 1,2,,ˆ2,3,=k B β.这种求点估计的方用矩法确定的估计量称为矩估计量,相应的估计值为矩估计值,矩估计量. 表示为总体矩的函数,即)2,;,l s αββ; k B 分别替换g 中的k α,)()1212ˆˆˆˆ,,;,,;,,=l s l sg A A B B ααββ即为θ的3.置信区间(1)寻求置信区间的方法● ①选取θ的一个较优的点估计ˆθ; ②围绕ˆθ寻找一个依赖于样本与θ的函数()1,,;=n u u X X θ.u 的分布为已知分布.像u 这样的函数,称为枢轴量;③对给定的置信水平1-α,确定1λ与2λ,使{}121<<=-P u λλα,一般可选取满足{}{}122≤=≥=P u P u αλλ的1λ与2λ;④利用不等式变形导出套住θ的置信区间(),θθ. (2)正态总体参数的置信区间4.假设检验概述假设检验的一般步骤 ①建立零假设0H ;②构造一个含待检验参数θ(不含其他未知参数)且分布已知的枢轴量()12,,,;n u X X X θ,并确定其分布;③对给定的显著性水平α,由上述枢轴量及其分布,结合零假设0H ,确定拒绝域C ,使得(){}120,,,∈≤n P X X X C H α;④根据样本值()12,,,n x x x 是否落在C 中做出是否拒绝0H 的统计决断:如果()12,,,∈n x x x C ,则拒绝0H ,如果()12,,,∉n x x x C ,则不能拒绝0H .5.单正态总体的参数假设检验编辑:李雪伟 2013年5月25日。
概率论与数理统计知识点总结
概率论与数理统计知识点总结一、概率的基本概念1.概率的定义:概率是描述事件发生可能性的数字,表示为一个介于0和1之间的数。
2.事件与样本空间:事件是可能发生的结果的集合,样本空间是所有可能结果的集合。
3.事件的运算:事件的运算包括并、交、差等,分别表示两个事件同时发生、至少一个事件发生、一个事件发生而另一个事件不发生等。
4.概率的性质:概率具有非负性、规范性、可列可加性等性质。
二、随机变量与概率分布1.随机变量的定义:随机变量是一个变量,它的值由随机事件决定。
2.离散随机变量:离散随机变量只能取有限或可数个值,其概率表示为离散概率分布函数。
3.连续随机变量:连续随机变量可以取任意实数值,其概率表示为概率密度函数。
4.分布函数:分布函数描述随机变量的概率分布情况,包括累积分布函数和概率质量函数。
三、常见概率分布1.离散分布:包括伯努利分布、二项分布、泊松分布等。
2.连续分布:包括均匀分布、正态分布、指数分布、伽玛分布等。
正态分布在自然界和社会现象中广泛存在。
3.其他分布:包括卡方分布、指数分布、F分布、t分布等。
四、抽样与统计推断1.抽样:抽样是从总体中选择一部分个体进行实验或调查的方法,常用的抽样方法包括随机抽样、分层抽样、整群抽样等。
2.统计推断:通过从样本中获得的数据,对总体做出有关参数的推断。
包括点估计和区间估计两种方法。
3.假设检验:通过对样本数据的统计量进行计算,判断总体参数是否满足其中一种假设。
包括单样本假设检验、两样本假设检验、方差分析等。
五、回归分析与相关分析1.回归分析:研究两个或多个变量之间关系的统计方法,包括一元线性回归分析、多元线性回归分析等。
2.相关分析:研究两个变量之间相关性的统计方法,常用的相关系数包括皮尔逊相关系数和斯皮尔曼相关系数。
六、贝叶斯统计学1.贝叶斯定理:根据先验概率和条件概率,计算后验概率的统计方法。
2.贝叶斯推断:根据贝叶斯定理以及样本数据,推断参数的后验分布。
概率论与数理统计知识点总结
在已知Y=yj的条件下,X取值的条件分布为
连续型
在已知Y=y的条件下,X的条件分布密度为
;
在已知X=x的条件下,Y的条件分布密度为
(7)独立性
一般型
F(X,Y)=FX(x)FY(y)
离散型
有零不独立
连续型
f(x,y)=fX(x)fY(y)
直接判断,充要条件:
若 ,则 的分布函数为
。。
参数 、 时的正态分布称为标准正态分布,记为 ,其密度函数记为
, ,
分布函数为
。
是不可求积函数,其函数值,已编制成表可供查用。
Φ(-x)=1-Φ(x)且Φ(0)= 。
如果 ~ ,则 ~ 。
。
(6)分位数
下分位表: ;
上分位表: 。
(7)函数分布
离散型
已知 的分布列为
,
的分布列( 互不相等)如下:
若事件 、 相互独立,且 ,则有
若事件 、 相互独立,则可得到 与 、 与 、 与 也都相互独立。
必然事件 和不可能事件Ø与任何事件都相互独立。
Ø与任何事件都互斥。
②多个事件的独立性
设ABC是三个事件,如果满足两两独立的条件,
P(AB)=P(A)P(B);P(BC)=P(B)P(C);P(CA)=P(C)P(A)
当x2>x1时,有F(x2,y)≥F(x1,y);当y2>y1时,有F(x,y2)≥F(x,y1);
(3)F(x,y)分别对x和y是右连续的,即
(4)
(5)对于
.
(4)离散型与连续型的关系
(5)边缘分布
离散型
X的边缘分布为
;
Y的边缘分布为
概率论与数理统计知识点
概率论与数理统计知识点1.概率的定义与性质:概率是描述随机事件发生可能性的度量,它的取值范围在0到1之间。
事件发生的概率可以通过频率、几何概率和主观概率等方法进行估计。
2.随机变量与概率分布:随机变量是对随机现象进行量化的数学模型,可以是离散型的或连续型的。
它们的概率分布可以通过概率质量函数或概率密度函数来描述。
3.期望与方差:期望是随机变量的平均值,它衡量了随机变量的平均水平。
方差是随机变量离其期望值的平均偏离程度,它表征了随机变量的变异性。
4.大数定律与中心极限定理:大数定律指出,当样本容量足够大时,样本均值的频率分布趋近于总体均值。
中心极限定理则说明,样本均值的分布随着样本容量的增大趋向于正态分布。
5.参数估计与假设检验:参数估计是利用样本数据来估计总体参数的值,主要有点估计和区间估计两种方法。
假设检验则是利用样本数据来检验关于总体参数的其中一种假设。
6.回归分析与方差分析:回归分析研究一组自变量与因变量之间的函数关系,在线性回归中,回归方程是一个线性函数。
方差分析用于比较两个或多个总体均值之间的差异。
7.相关与回归分析:相关分析用于度量两个变量之间的关联程度,它可以通过皮尔逊相关系数或斯皮尔曼等级相关系数来衡量。
回归分析则用于预测或解释一个变量对另一个变量的影响。
8.参数检验与非参数检验:参数检验假设总体参数的一些值,然后利用样本数据判断是否接受该假设。
常见的参数检验有t检验、F检验、卡方检验等。
非参数检验不对总体分布进行假设,常用于样本容量较小、总体分布未知的情况。
以上只是概率论与数理统计的一些基本知识点,实际上,概率论与数理统计还包括二项分布、泊松分布、正态分布、贝叶斯统计、时间序列分析等更细分的内容。
掌握这些知识点,能够帮助我们对数据进行合理的分析和推断,以便作出正确的决策。
概率论与数理统计知识点
概率论与数理统计知识点概率论和数理统计是数学中的两个重要分支,研究随机现象的规律性和推断问题的方法。
概率论主要研究随机事件的概率及其计算方法,数理统计则是利用概率论的理论和方法,通过对数据进行收集、处理和分析,从中得到有关总体的参数估计和假设检验结果。
本文将介绍一些常见的概率论与数理统计的知识点。
一、随机事件与概率1. 随机事件的定义:随机事件指在一次试验中可能发生也可能不发生的事件。
2. 必然事件与不可能事件:必然事件是指在每次试验中一定发生的事件,而不可能事件则是指在每次试验中一定不会发生的事件。
3. 事件的运算:事件的运算包括并、交、补三种基本运算,分别表示两个事件的并集、交集以及一个事件的补集。
4. 概率的定义与性质:概率是度量随机事件发生可能性的数值,其范围介于0和1之间。
对于任意一个事件,其概率不小于0且不大于1,且必然事件的概率为1,不可能事件的概率为0。
二、概率分布1. 离散型随机变量及其概率分布:离散型随机变量的取值是可以数出来的,其概率分布由概率质量函数(Probability Mass Function,简称PMF)给出。
2. 连续型随机变量及其概率分布:连续型随机变量的取值是连续的,其概率分布由概率密度函数(Probability Density Function,简称PDF)给出。
3. 常见概率分布:- 二项分布:描述了一系列独立的伯努利试验中成功次数的概率分布。
- 正态分布:也称为高斯分布,是最重要的概率分布之一,常用于自然科学和社会科学的统计分析。
- 泊松分布:用于描述在一段固定时间或空间内事件发生的次数的概率分布。
- 指数分布:用于描述连续时间上事件发生的间隔时间的概率分布。
- t分布:用于小样本情况下对总体均值的推断。
三、参数估计1. 点估计与区间估计:参数估计分为点估计和区间估计两种方法。
点估计是通过样本数据直接估计出总体参数的取值,而区间估计是通过样本数据给出总体参数的一个区间估计范围。
概率论与数理统计知识点总结
概率论与数理统计知识点总结1. 概率论基础- 随机事件:一个事件是随机的,如果它可能发生也可能不发生。
- 样本空间:所有可能事件发生的集合。
- 事件的概率:事件发生的可能性的度量,满足0≤P(A)≤1。
- 条件概率:在另一个事件发生的条件下,一个事件发生的概率。
- 贝叶斯定理:描述了随机事件A和B的条件概率和边缘概率之间的关系。
- 独立事件:两个事件A和B是独立的,如果P(A∩B) = P(A)P(B)。
- 互斥事件:两个事件A和B是互斥的,如果它们不能同时发生,即P(A∩B) = 0。
2. 随机变量及其分布- 随机变量:将随机事件映射到实数的函数。
- 离散随机变量:取值为有限或可数无限的随机变量。
- 连续随机变量:可以在某个区间内取任意值的随机变量。
- 概率分布函数:描述随机变量取值的概率。
- 概率密度函数:连续随机变量的概率分布函数的导数。
- 累积分布函数:随机变量取小于或等于某个值的概率。
- 期望值:随机变量的长期平均值。
- 方差:衡量随机变量取值的离散程度。
3. 多维随机变量及其分布- 联合分布:描述两个或多个随机变量同时取特定值的概率。
- 边缘分布:通过联合分布求得的单个随机变量的分布。
- 条件分布:给定一个随机变量的值时,另一个随机变量的分布。
- 协方差:衡量两个随机变量之间的线性关系。
- 相关系数:协方差标准化后的值,表示变量间的线性相关程度。
4. 大数定律和中心极限定理- 大数定律:随着试验次数的增加,样本均值以概率1收敛于总体均值。
- 中心极限定理:独立同分布的随机变量之和,在适当的标准化后,其分布趋近于正态分布。
5. 数理统计基础- 样本:从总体中抽取的一部分个体。
- 总体:研究对象的全体。
- 参数估计:用样本统计量来估计总体参数。
- 点估计:给出总体参数的一个具体估计值。
- 区间估计:给出一个包含总体参数可能值的区间。
- 假设检验:对总体分布的某些假设进行检验。
- 显著性水平:拒绝正确假设的最大概率。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
《概率论与数理统计》第一章概率论的基本概念 (2)§2.样本空间、随机事件 (2)§4等可能概型(古典概型) (3)§5.条件概率 (4)§6.独立性 (4)第二章随机变量及其分布 (5)§1随机变量 (5)§2离散性随机变量及其分布律 (5)§3随机变量的分布函数 (6)§4连续性随机变量及其概率密度 (6)§5随机变量的函数的分布 (7)第三章多维随机变量 (7)§1二维随机变量 (7)§2边缘分布 (8)§3条件分布 (8)§4相互独立的随机变量 (9)§5两个随机变量的函数的分布 (9)第四章随机变量的数字特征 (10)§1.数学期望 (10)§2方差 (11)§3协方差及相关系数 (11)第五章 大数定律与中心极限定理 (13)§1. 大数定律 ...................................................................................... 13 §2中心极限定理 . (13)第一章 概率论的基本概念§2.样本空间、随机事件1.事件间的关系 B A ⊂则称事件B 包含事件A ,指事件A 发生必然导致事件B 发生 B }x x x { ∈∈=⋃或A B A 称为事件A 与事件B 的和事件,指当且仅当A ,B 中至少有一个发生时,事件B A ⋃发生B }x x x { ∈∈=⋂且A B A 称为事件A 与事件B 的积事件,指当A ,B 同时发生时,事件B A ⋂发生B }x x x { ∉∈=且—A B A 称为事件A 与事件B 的差事件,指当且仅当A 发生、B 不发生时,事件B A —发生φ=⋂B A ,则称事件A 与B 是互不相容的,或互斥的,指事件A 与事件B 不能同时发生,基本事件是两两互不相容的且S =⋃B A φ=⋂B A ,则称事件A 与事件B 互为逆事件,又称事件A 与事件B 互为对立事件2.运算规则 交换律A B B A A B B A ⋂=⋂⋃=⋃结合律)()( )()(C B A C B A C B A C B A ⋂=⋂⋃⋃=⋃⋃分配律 )()B (C A A C B A ⋃⋂⋃=⋂⋃)( ))(()( C A B A C B A ⋂⋂=⋃⋂ 徳摩根律B A B A A B A ⋃=⋂⋂=⋃ B —§3.频率与概率定义 在相同的条件下,进行了n 次试验,在这n 次试验中,事件A 发生的次数A n 称为事件A 发生的频数,比值n n A 称为事件A 发生的频率概率:设E 是随机试验,S 是它的样本空间,对于E 的每一事件A 赋予一个实数,记为P (A ),称为事件的概率1.概率)(A P 满足下列条件:(1)非负性:对于每一个事件A 1)(0≤≤A P (2)规范性:对于必然事件S 1)S (=P(3)可列可加性:设n A A A ,,,21 是两两互不相容的事件,有∑===nk kn k kA P A P 11)()( (n 可以取∞)2.概率的一些重要性质: (i ) 0)(=φP(ii )若n A A A ,,,21 是两两互不相容的事件,则有∑===nk kn k kA P A P 11)()((n 可以取∞)(iii )设A ,B 是两个事件若B A ⊂,则)()()(A P B P A B P -=-,)A ()B (P P ≥ (iv )对于任意事件A ,1)(≤A P(v ))(1)(A P A P -= (逆事件的概率)(vi )对于任意事件A ,B 有)()()()(AB P B P A P B A P -+=⋃§4等可能概型(古典概型)等可能概型:试验的样本空间只包含有限个元素,试验中每个事件发生的可能性相同 若事件A包含k个基本事件,即}{}{}{2]1k i i i e e e A =,里个不同的数,则有中某,是,,k k n 2,1i i i ,21 ()中基本事件的总数包含的基本事件数S }{)(1j A n k e P A P kj i ===∑= §5.条件概率(1) 定义:设A,B 是两个事件,且0)(>A P ,称)()()|(A P AB P A B P =为事件A 发生的条件下事件B 发生的条件概率(2) 条件概率符合概率定义中的三个条件1。
非负性:对于某一事件B ,有0)|(≥A B P2。
规范性:对于必然事件S ,1)|(=A S P3可列可加性:设 ,,21B B 是两两互不相容的事件,则有∑∞=∞==11)()(i i i i A B P A B P(3) 乘法定理 设0)(>A P ,则有)|()()(B A P B P AB P =称为乘法公式(4) 全概率公式: ∑==ni iiB A P B P A P 1)|()()(贝叶斯公式: ∑==ni iik k k B A P B P B A P B P A B P 1)|()()|()()|(§6.独立性定义 设A ,B 是两事件,如果满足等式)()()(B P A P AB P =,则称事件A,B 相互独立 定理一 设A ,B 是两事件,且0)(>A P ,若A ,B 相互独立,则()B P A B P =)|( 定理二 若事件A 和B 相互独立,则下列各对事件也相互独立:A 与————与,与,B A B A B第二章 随机变量及其分布§1随机变量定义 设随机试验的样本空间为X(e)X {e}.S ==是定义在样本空间S 上的实值单值函数,称X(e)X =为随机变量§2离散性随机变量及其分布律1. 离散随机变量:有些随机变量,它全部可能取到的值是有限个或可列无限多个,这种随机变量称为离散型随机变量k k )(p x X P ==满足如下两个条件(1)0k ≥p ,(2)∑∞=1k k P =12. 三种重要的离散型随机变量(1)分布设随机变量X只能取与1两个值,它的分布律是)101,0k p -1p )k (k-1k <<===p X P (,)(,则称X 服从以p 为参数的分布或两点分布。
(2)伯努利实验、二项分布设实验E 只有两个可能结果:A 与—A ,则称E 为伯努利实验.设1)p 0p P(A)<<=(,此时p -1)A P(=—.将E 独立重复的进行n 次,则称这一串重复的独立实验为n 重伯努利实验。
n 2,1,0k q p k n )k X (k-n k ,,=⎪⎪⎭⎫ ⎝⎛==P 满足条件(1)0k ≥p ,(2)∑∞=1k k P =1注意到k -n k q p k n ⎪⎪⎭⎫ ⎝⎛是二项式nq p )(+的展开式中出现k p 的那一项,我们称随机变量X 服从参数为n ,p 的二项分布。
(3)泊松分布设随机变量X 所有可能取的值为0,1,2…,而取各个值的概率为,2,1,0,k!e )k X (-k ===k P λλ其中0>λ是常数,则称X 服从参数为λ的泊松分布记为)(λπ~X §3随机变量的分布函数定义 设X 是一个随机变量,x 是任意实数,函数∞<<∞≤=x -x},P{X )x (F 称为X 的分布函数分布函数)()(x X P x F ≤=,具有以下性质(1) )(x F 是一个不减函数 (2)1)(,0)(1)(0=∞=-∞≤≤F F x F ,且 (3)是右连续的即)(),()0(x F x F x F =+§4连续性随机变量及其概率密度连续随机变量:如果对于随机变量X 的分布函数F (x ),存在非负可积函数)(x f ,使对于任意函数x 有,dt t f )x (F x-⎰∞=)(则称x 为连续性随机变量,其中函数f(x)称为X的概率密度函数,简称概率密度1 概率密度)(x f 具有以下性质,满足(1)1)((2) ,0)(-=≥⎰+∞∞dx x f x f ;(3)⎰=≤≤21)()(21x x dx x f x X x P ;(4)若)(x f 在点x 处连续,则有=)(F x ,)(x f 2,三种重要的连续型随机变量(1)均匀分布若连续性随机变量X 具有概率密度⎪⎩⎪⎨⎧<<=,其他,0a a -b 1)(bx x f ,则成X 在区间(a,b)上服从均匀分布.记为),(b a U ~X(2)指数分布若连续性随机变量X 的概率密度为⎪⎩⎪⎨⎧>=,其他,00.e1)(x -x x f θθ其中0>θ为常数,则称X服从参数为θ的指数分布。
(3)正态分布 若连续型随机变量X 的概率密度为,,)∞<<∞=--x ex f x -21)(222(σμσπσμσσμ,服从参数为为常数,则称(,其中X )0>的正态分布或高斯分布,记为),(2N ~X σμ 特别,当10==σμ,时称随机变量X 服从标准正态分布§5随机变量的函数的分布定理 设随机变量X 具有概率密度,-)(x ∞<<∞x x f ,又设函数)(x g 处处可导且恒有0)(,>x g ,则Y=)(X g 是连续型随机变量,其概率密度为[]⎩⎨⎧<<=其他,0,)()()(,βαy y h y h f y f X Y 第三章 多维随机变量§1二维随机变量定义 设E 是一个随机试验,它的样本空间是X(e)X {e}.S ==和Y(e)Y =是定义在S 上的随机变量,称X(e)X =为随机变量,由它们构成的一个向量(X ,Y )叫做二维随机变量设(X ,Y )是二维随机变量,对于任意实数x ,y ,二元函数y}Y x P{X y)}(Y x)P{(X y x F ≤≤≤⋂≤=,记成),(称为二维随机变量(X ,Y )的分布函数如果二维随机变量(X ,Y )全部可能取到的值是有限对或可列无限多对,则称(X ,Y )是离散型的随机变量。
我们称 ,,,,2,1j i )y Y (ij j i ====p x X P 为二维离散型随机变量(X ,Y )的分布律。
对于二维随机变量(X ,Y )的分布函数),(y x F ,如果存在非负可积函数f (x ,y ),使对于任意x ,y 有,),(),(⎰⎰∞∞=y -x-dudv v u f y x F 则称(X ,Y )是连续性的随机变量,函数f (x ,y )称为随机变量(X ,Y )的概率密度,或称为随机变量X 和Y 的联合概率密度。