概率论与数理统计5-1 基本概念

合集下载

概率论与数理统计目录

概率论与数理统计目录

概率论与数理统计目录一、随机事件及其概率1.1 随机事件的基本概念定义与分类事件的运算1.2 概率的定义与性质概率的公理化定义概率的基本性质1.3 古典概型与几何概型古典概型的计算几何概型的计算1.4 条件概率与独立性条件概率事件的独立性1.5 全概率公式与贝叶斯公式全概率公式贝叶斯公式及其应用二、随机变量及其分布2.1 随机变量的概念随机变量的定义随机变量的分类2.2 离散型随机变量及其分布常见的离散型分布分布律与分布函数2.3 连续型随机变量及其分布常见的连续型分布概率密度函数与分布函数2.4 随机变量函数的分布离散型随机变量函数的分布连续型随机变量函数的分布三、多维随机变量及其分布3.1 多维随机变量的概念联合分布函数边缘分布3.2 多维离散型随机变量联合分布律边缘分布律3.3 多维连续型随机变量联合概率密度函数边缘概率密度函数3.4 条件分布离散型条件分布连续型条件分布3.5 随机变量的独立性独立性的定义独立性的判定与性质四、数字特征4.1 数学期望数学期望的定义与性质数学期望的计算4.2 方差方差的定义与性质方差的计算4.3 协方差与相关系数协方差的定义与性质相关系数的定义与性质4.4 矩与协矩阵矩的定义与计算协矩阵的定义与计算五、大数定律与中心极限定理5.1 大数定律切比雪夫大数定律伯努利大数定律5.2 中心极限定理林德贝格-莱维中心极限定理德莫佛尔-拉普拉斯中心极限定理六、数理统计的基本概念6.1 总体与样本总体的定义与性质样本的定义与性质6.2 统计量与抽样分布统计量的定义与性质常见的抽样分布七、参数估计与假设检验7.1 参数估计点估计区间估计7.2 假设检验假设检验的基本概念单侧检验与双侧检验正态总体的假设检验八、回归分析与方差分析8.1 回归分析一元线性回归多元线性回归回归模型的检验与预测8.2 方差分析单因素方差分析双因素方差分析方差分析的应用。

概率论与数理统计各章重点知识整理

概率论与数理统计各章重点知识整理

概率论与数理统计各章重点知识整理 第一章 概率论的基本概念一.基本概念随机试验E:(1)可以在相同的条件下重复地进行;(2)每次试验的可能结果不止一个,并且能事先明确试验的所有可能结果;(3)进行一次试验之前不能确定哪一个结果会出现. 样本空间S: E 的所有可能结果组成的集合. 样本点(基本事件):E 的每个结果. 随机事件(事件):样本空间S 的子集.必然事件(S):每次试验中一定发生的事件. 不可能事件(Φ):每次试验中一定不会发生的事件. 二. 事件间的关系和运算1.A ⊂B(事件B 包含事件A )事件A 发生必然导致事件B 发生.2.A ∪B(和事件)事件A 与B 至少有一个发生.3. A ∩B=AB(积事件)事件A 与B 同时发生.4. A -B(差事件)事件A 发生而B 不发生.5. AB=Φ (A 与B 互不相容或互斥)事件A 与B 不能同时发生.6. AB=Φ且A ∪B=S (A 与B 互为逆事件或对立事件)表示一次试验中A 与B 必有一个且仅有一个发生. B=A, A=B .运算规则 交换律 结合律 分配律 德•摩根律 B A B A I Y = B A B A Y I = 三. 概率的定义与性质1.定义 对于E 的每一事件A 赋予一个实数,记为P(A),称为事件A 的概率. (1)非负性 P(A)≥0 ; (2)归一性或规范性 P(S)=1 ;(3)可列可加性 对于两两互不相容的事件A 1,A 2,…(A i A j =φ, i ≠j, i,j=1,2,…),P(A 1∪A 2∪…)=P( A 1)+P(A 2)+… 2.性质(1) P(Φ) = 0 , 注意: A 为不可能事件P(A)=0 .(2)有限可加性 对于n 个两两互不相容的事件A 1,A 2,…,A n ,P(A 1∪A 2∪…∪A n )=P(A 1)+P(A 2)+…+P(A n ) (有限可加性与可列可加性合称加法定理) (3)若A ⊂B, 则P(A)≤P(B), P(B -A)=P(B)-P(A) . (4)对于任一事件A, P(A)≤1, P(A)=1-P(A) .(5)广义加法定理 对于任意二事件A,B ,P(A ∪B)=P(A)+P(B)-P(AB) . 对于任意n 个事件A 1,A 2,…,A n()()()()+∑+∑-∑=≤<<≤≤<≤=nk j i k j i nj i j i ni i n A A A P A A P A P A A A P 11121Y ΛY Y…+(-1)n-1P(A 1A 2…A n )四.等可能(古典)概型1.定义 如果试验E 满足:(1)样本空间的元素只有有限个,即S={e 1,e 2,…,e n };(2)每一个基本事件的概率相等,即P(e 1)=P(e 2)=…= P(e n ).则称试验E 所对应的概率模型为等可能(古典)概型.2.计算公式 P(A)=k / n 其中k 是A 中包含的基本事件数, n 是S 中包含的基本事件总数. 五.条件概率1.定义 事件A 发生的条件下事件B 发生的条件概率P(B|A)=P(AB) / P(A) ( P(A)>0).2.乘法定理 P(AB)=P(A) P (B|A) (P(A)>0); P(AB)=P(B) P (A|B) (P(B)>0).P(A 1A 2…A n )=P(A 1)P(A 2|A 1)P(A 3|A 1A 2)…P(A n |A 1A 2…A n-1) (n ≥2, P(A 1A 2…A n-1) > 0) 3. B 1,B 2,…,B n 是样本空间S 的一个划分(B i B j =φ,i ≠j,i,j=1,2,…,n, B 1∪B 2∪…∪B n =S) ,则 当P(B i )>0时,当P(A)>0, P(B i )>0时,. 六.事件的独立性1.两个事件A,B,满足P(AB) = P(A) P(B)时,称A,B 为相互独立的事件. (1)两个事件A,B 相互独立⇔ P(B)= P (B|A) .2.三个事件A,B,C 满足P(AB) =P(A) P(B), P(AC)= P(A) P(C), P(BC)= P(B) P(C),称A,B,C 三事件两两相互独立. 若再满足P(ABC) =P(A) P(B) P(C),则称A,B,C 三事件相互独立.3.n 个事件A 1,A 2,…,A n ,如果对任意k (1<k ≤n),任意1≤i 1<i 2<…<i k ≤n.有()()()()kki i i i i i A P A P A P A A A P ΛΛ2121=,则称这n 个事件A 1,A 2,…,A n 相互独立.第二章 随机变量及其概率分布一.随机变量及其分布函数1.在随机试验E 的样本空间S={e}上定义的单值实值函数X=X (e)称为随机变量.2.随机变量X 的分布函数F(x)=P{X ≤x} , x 是任意实数. 其性质为:(1)0≤F(x)≤1 ,F(-∞)=0,F(∞)=1. (2)F(x)单调不减,即若x 1<x 2 ,则 F(x 1)≤F(x 2). (3)F(x)右连续,即F(x+0)=F(x). (4)P{x 1<X≤x 2}=F(x 2)-F(x 1). 二.离散型随机变量 (只能取有限个或可列无限多个值的随机变量)1.离散型随机变量的分布律 P{X= x k }= p k (k=1,2,…) 也可以列表表示. 其性质为: (1)非负性 0≤P k ≤1 ; (2)归一性 11=∑∞=k k p .2.离散型随机变量的分布函数 F(x)=∑≤xX k k P 为阶梯函数,它在x=x k (k=1,2,…)处具有跳跃点,其跳跃值为p k =P{X=x k } .3.三种重要的离散型随机变量的分布(1)X~(0-1)分布 P{X=1}= p ,P{X=0}=1–p (0<p<1) .(2)X~b(n,p)参数为n,p 的二项分布P{X=k}=()kn k p p k n --⎪⎪⎭⎫ ⎝⎛1(k=0,1,2,…,n) (0<p<1)(3))X~π(λ)参数为λ的泊松分布 P{X=k}=λλ-e k k !(k=0,1,2,…) (λ>0)三.连续型随机变量1.定义 如果随机变量X 的分布函数F(x)可以表示成某一非负函数f(x)的积分F(x)=()dt t f x⎰∞-,-∞< x <∞,则称X 为连续型随机变量,其中f (x)称为X 的概率密度(函数).2.概率密度的性质(1)非负性 f(x)≥0 ; (2)归一性 ⎰∞∞-dx x f )(=1 ;(3) P{x 1<X ≤x 2}=⎰21)(x x dx x f ; (4)若f (x)在点x 处连续,则f (x)=F / (x) .注意:连续型随机变量X 取任一指定实数值a 的概率为零,即P{X= a}=0 . 3.三种重要的连续型随机变量的分布(1)X ~U (a,b) 区间(a,b)上的均匀分布 ⎩⎨⎧=-0)(1a b x f 其它b x a << .(2)X 服从参数为θ的指数分布.()⎩⎨⎧=-0/1θθx ex f 00≤>x x 若若 (θ>0).(3)X~N (μ,σ2 )参数为μ,σ的正态分布 222)(21)(σμσπ--=x e x f -∞<x<∞, σ>0.特别, μ=0, σ2 =1时,称X 服从标准正态分布,记为X~N (0,1),其概率密度2221)(x e x -=πϕ , 标准正态分布函数 ⎰=Φ∞--xt dt e x 2221)(π, Φ(-x)=1-Φ(x) .若X ~N ((μ,σ2), 则Z=σμ-X ~N (0,1), P{x 1<X ≤x 2}=Φ(σμ-2x )-Φ(σμ-1x ).若P{Z>z α}= P{Z<-z α}= P{|Z|>z α/2}= α,则点z α,-z α, ±z α/ 2分别称为标准正态分布的上,下,双侧α分位点. 注意:Φ(z α)=1-α , z 1- α= -z α. 四.随机变量X 的函数Y= g (X)的分布 1.离散型随机变量的函数若g(x k ) (k=1,2,…)的值全不相等,则由上表立得Y=g(X)的分布律.若g(x k ) (k=1,2,…)的值有相等的,则应将相等的值的概率相加,才能得到Y=g(X)的分布律. 2.连续型随机变量的函数若X 的概率密度为f X (x),则求其函数Y=g(X)的概率密度f Y (y)常用两种方法: (1)分布函数法 先求Y 的分布函数F Y (y)=P{Y ≤y}=P{g(X)≤y}=()()dx x f ky X k∑⎰∆其中Δk (y)是与g(X)≤y 对应的X 的可能值x 所在的区间(可能不只一个),然后对y 求导即得f Y (y)=F Y /(y) .(2)公式法 若g(x)处处可导,且恒有g /(x)>0 (或g / (x)<0 ),则Y=g (X)是连续型随机变量,其概率密度为 ()()()()⎩⎨⎧'=0y h y h f y f X Y 其它βα<<y其中h(y)是g(x)的反函数 , α= min (g (-∞),g (∞)) β= max (g (-∞),g (∞)) .如果f (x)在有限区间[a,b]以外等于零,则 α= min (g (a),g (b)) β= max (g (a),g (b)) .第三章 二维随机变量及其概率分布一.二维随机变量与联合分布函数1.定义 若X 和Y 是定义在样本空间S 上的两个随机变量,则由它们所组成的向量(X,Y)称为二维随机向量或二维随机变量.对任意实数x,y,二元函数F(x,y)=P{X ≤x,Y ≤y}称为(X,Y)的(X 和Y 的联合)分布函数. 2.分布函数的性质(1)F(x,y)分别关于x 和y 单调不减.(2)0≤F(x,y)≤1 , F(x,- ∞)=0, F(-∞,y)=0, F(-∞,-∞)=0, F(∞,∞)=1 .(3) F(x,y)关于每个变量都是右连续的,即 F(x+0,y)= F(x,y), F(x,y+0)= F(x,y) . (4)对于任意实数x 1<x 2 , y 1<y 2P{x 1<X ≤x 2 , y 1<Y ≤y 2}= F(x 2,y 2)- F(x 2,y 1)- F(x 1,y 2)+ F(x 1,y 1)二.二维离散型随机变量及其联合分布律1.定义 若随机变量(X,Y)只能取有限对或可列无限多对值(x i ,y j ) (i ,j =1,2,… )称(X,Y)为二维离散型随机变量.并称P{X= x i ,Y= y j }= p i j 为(X,Y)的联合分布律.也可列表表示.2.性质 (1)非负性 0≤p i j ≤1 .(2)归一性 ∑∑=i jij p 1 .3. (X,Y)的(X 和Y 的联合)分布函数F(x,y)=∑∑≤≤x x yy ij i j p三.二维连续型随机变量及其联合概率密度1.定义 如果存在非负的函数f (x,y),使对任意的x 和y,有F(x,y)=⎰⎰∞-∞-y xdudv v u f ),( 则称(X,Y)为二维连续型随机变量,称f(x,y)为(X,Y)的(X 和Y 的联合)概率密度. 2.性质 (1)非负性 f (x,y)≥0 . (2)归一性 1),(=⎰⎰∞∞-∞∞-dxdy y x f .(3)若f (x,y)在点(x,y)连续,则yx y x F y x f ∂∂∂=),(),(2(4)若G 为xoy 平面上一个区域,则⎰⎰=∈Gdxdy y x f G y x P ),(}),{(.四.边缘分布1. (X,Y)关于X 的边缘分布函数 F X (x) = P{X ≤x , Y<∞}= F (x , ∞) . (X,Y)关于Y 的边缘分布函数 F Y (y) = P{X<∞, Y ≤y}= F (∞,y)2.二维离散型随机变量(X,Y)关于X 的边缘分布律 P{X= x i }= ∑∞=1j ij p = p i · ( i =1,2,…) 归一性 11=∑∞=•i i p .关于Y 的边缘分布律 P{Y= y j }= ∑∞=1i ij p = p ·j ( j =1,2,…) 归一性 11=∑∞=•j j p .3.二维连续型随机变量(X,Y)关于X 的边缘概率密度f X (x)=⎰∞∞-dy y x f ),( 归一性1)(=⎰∞∞-dx x f X 关于Y 的边缘概率密度f Y (y)=x d y x f ⎰∞∞-),( 归一性1)(=⎰∞∞-dy y f Y五.相互独立的随机变量1.定义 若对一切实数x,y,均有F(x,y)= F X (x) F Y (y) ,则称X 和Y 相互独立.2.离散型随机变量X 和Y 相互独立⇔p i j = p i ··p ·j ( i ,j =1,2,…)对一切x i ,y j 成立.3.连续型随机变量X 和Y 相互独立⇔f (x,y)=f X (x)f Y (y)对(X,Y)所有可能取值(x,y)都成立. 六.条件分布1.二维离散型随机变量的条件分布定义 设(X,Y)是二维离散型随机变量,对于固定的j,若P{Y=y j }>0,则称P{X=x i |Y=y j } 为在Y= y j 条件下随机变量X 的条件分布律. 同样,对于固定的i,若P{X=x i }>0,则称 P{Y=y j |X=x i }为在X=x i 条件下随机变量Y 的条件分布律.第四章 随机变量的数字特征一.数学期望和方差的定义随机变量X 离散型随机变量连续型随机变量分布律P{X=x i }= p i ( i =1,2,…) 概率密度f (x)数学期望(均值)E(X) ∑∞=1i i i p x (级数绝对收敛)⎰∞∞-dx x xf )((积分绝对收敛)方差D(X)=E{[X-E(X)]2} []∑-∞=12)(i i i p X E x ⎰-∞∞-dx x f X E x )()]([2=E(X 2)-[E(X)]2 (级数绝对收敛) (积分绝对收敛),}{},{jji j j i p p y Y P y Y x X P •=====,}{},{•=====i j i i j i p p x X P y Y x X P函数数学期望E(Y)=E[g(X)] i i i p x g ∑∞=1)((级数绝对收敛) ⎰∞∞-dx x f x g )()((积分绝对收敛)标准差σ(X)=√D(X) . 二.数学期望与方差的性质1. c 为为任意常数时, E(c) = c , E(cX) = cE(X) , D(c) = 0 , D (cX) = c 2 D(X) .2.X,Y 为任意随机变量时, E (X ±Y)=E(X)±E(Y) .3. X 与Y 相互独立时, E(XY)=E(X)E(Y) , D(X ±Y)=D(X)+D(Y) .4. D(X) = 0⇔ P{X = C}=1 ,C 为常数.三.六种重要分布的数学期望和方差 E(X) D(X) 1.X~ (0-1)分布P{X=1}= p (0<p<1) p p (1- p) 2.X~ b (n,p) (0<p<1) n pn p (1- p)3.X~ π(λ) λ λ4.X~ U(a,b) (a+b)/2 (b-a) 2/125.X 服从参数为θ的指数分布 θ θ26.X~ N (μ,σ2) μ σ2 四.矩的概念随机变量X 的k 阶(原点)矩E(X k ) k=1,2,… 随机变量X 的k 阶中心矩E{[X-E(X)] k }随机变量X 和Y 的k+l 阶混合矩E(X k Y l ) l=1,2,…随机变量X 和Y 的k+l 阶混合中心矩E{[X-E(X)] k [Y-E(Y)] l }第六章 样本和抽样分布一.基本概念总体X 即随机变量X ; 样本X 1 ,X 2 ,…,X n 是与总体同分布且相互独立的随机变量;样本值x 1 ,x 2 ,…,x n 为实数;n 是样本容量.统计量是指样本的不含任何未知参数的连续函数.如:样本均值∑==n i i X n X 11 样本方差()∑--==n i iX X n S 12211 样本标准差S 样本k 阶矩∑==n i k i k X n A 11( k=1,2,…) 样本k 阶中心矩∑-==ni k i k X X n B 1)(1( k=1,2,…)二.抽样分布 即统计量的分布1.X 的分布 不论总体X 服从什么分布, E (X ) = E(X) , D (X ) = D(X) / n . 特别,若X~ N (μ,σ2 ) ,则X ~ N (μ, σ2 /n) .2.χ2分布 (1)定义 若X ~N (0,1) ,则Y =∑=ni i X 12~ χ2(n)自由度为n 的χ2分布.(2)性质 ①若Y~ χ2(n),则E(Y) = n , D(Y) = 2n .②若Y 1~ χ2(n 1) Y 2~ χ2(n 2) ,则Y 1+Y 2~ χ2(n 1 + n 2). ③若X~ N (μ,σ2 ), 则22)1(σS n -~ χ2(n-1),且X 与S 2相互独立.(3)分位点 若Y~ χ2(n),0< α <1 ,则满足αχχχχαααα=<>=<=>--))}(())({()}({)}({22/122/212n Y n Y P n Y P n Y P Y 的点)()(),(),(22/122/212n n n n ααααχχχχ--和分别称为χ2分布的上、下、双侧α分位点.3. t 分布(1)定义 若X~N (0,1),Y~ χ2(n),且X,Y 相互独立,则t=nY X ~t(n)自由度为n 的t 分布.(2)性质①n →∞时,t 分布的极限为标准正态分布.②X ~N (μ,σ2)时, nS X μ-~ t (n-1) .③两个正态总体 相互独立的样本 样本均值 样本方差X~ N (μ1,σ12 ) 且σ12=σ22=σ2 X 1 ,X 2 ,…,X n1X S 12Y~ N (μ2,σ22 ) Y 1 ,Y 2 ,…,Y n2 Y S 22则 212111)()(n n S Y X w +---μμ~ t (n 1+n 2-2) , 其中 2)1()1(212222112-+-+-=n n S n S n S w (3)分位点 若t ~ t (n) ,0 < α<1 , 则满足αααα=>=-<=>)}({)}({)}({2/n t t P n t t P n t t P的点)(),(),(2/n t n t n t ααα±-分别称t 分布的上、下、双侧α分位点. 注意: t 1- α (n) = - t α (n).4.F 分布 (1)定义 若U~χ2(n 1), V~ χ2(n 2), 且U,V 相互独立,则F =21n V n U ~F(n 1,n 2)自由度为(n 1,n 2)的F 分布.(2)性质(条件同3.(2)③)22212221σσS S ~F(n 1-1,n 2-1)(3)分位点 若F~ F(n 1,n 2) ,0< α <1,则满足)},({)},({21121n n F F P n n F F P αα-<=>ααα=<>=-))},(()),({(212/1212/n n F F n n F F P Y的点),(),(),,(),,(212/1212/21121n n F n n F n n F n n F αααα--和分别称为F 分布的上、下、双侧α分位点. 注意: .).(1),(12211n n F n n F αα=-第七章 参数估计一.点估计 总体X 的分布中有k 个待估参数θ1, θ2,…, θk .X 1 ,X 2 ,…,X n 是X 的一个样本, x 1 ,x 2 ,…,x n 是样本值.1.矩估计法先求总体矩⎪⎩⎪⎨⎧===),,,(),,,(),,,(2121222111k k k k k θθθμμθθθμμθθθμμΛΛΛ解此方程组,得到⎪⎩⎪⎨⎧===),,,(),,,(),,,(2121222111kk k k k μμμθθμμμθθμμμθθΛΛΛ,以样本矩A l 取代总体矩μ l ( l=1,2,…,k)得到矩估计量⎪⎪⎩⎪⎪⎨⎧===∧∧∧),,,(),,,(),,,(2121222111k k k k k A A A A A A A A A ΛΛΛθθθθθθ,若代入样本值则得到矩估计值. 2.最大似然估计法若总体分布形式(可以是分布律或概率密度)为p(x, θ1, θ2,…, θk ),称样本X 1 ,X 2 ,…,X n 的联合分布∏==ni k i k x p L 12121),,,,(),,,(θθθθθθΛΛ为似然函数.取使似然函数达到最大值的∧∧∧k θθθ,,,21Λ,称为参数θ1, θ2,…,θk 的最大似然估计值,代入样本得到最大似然估计量.若L(θ1, θ2,…, θk )关于θ1, θ2,…, θk 可微,则一般可由似然方程组 0=∂∂i L θ 或 对数似然方程组 0ln =∂∂iLθ (i =1,2,…,k) 求出最大似然估计. 3.估计量的标准(1) 无偏性 若E(∧θ)=θ,则估计量∧θ称为参数θ的无偏估计量.不论总体X 服从什么分布, E (X )= E(X) , E(S 2)=D(X), E(A k )=μk =E(X k ),即样本均值X , 样本方差S 2,样本k 阶矩A k 分别是总体均值E(X),方差D(X),总体k 阶矩μk 的无偏估计,(2)有效性 若E(∧θ1 )=E(∧θ2)= θ, 而D(∧θ1)< D(∧θ2), 则称估计量∧θ1比∧θ2有效. (3)一致性(相合性) 若n →∞时,θθP →∧,则称估计量∧θ是参数θ的相合估计量. 二.区间估计1.求参数θ的置信水平为1-α的双侧置信区间的步骤(1)寻找样本函数W=W(X 1 ,X 2 ,…,X n ,θ),其中只有一个待估参数θ未知,且其分布完全确定. (2)利用双侧α分位点找出W 的区间(a,b),使P{a<W <b}=1-α. (3)由不等式a<W<b 解出θθθ<<则区间(θθ,)为所求. 2.单个正态总体待估参数 其它参数 W 及其分布 置信区间μ σ2已知 nX σμ-~N (0,1) (2/ασz n X ±) μ σ2未知 nS X μ-~ t (n-1) )1((2/-±n t n S X α σ2 μ未知 22)1(σS n -~ χ2(n-1) ))1()1(,)1()1((22/1222/2-----n Sn n S n ααχχ 3.两个正态总体 (1)均值差μ 1-μ 2其它参数 W 及其分布 置信区间已知2221,σσ22212121)(n n Y X σσμμ+--- ~ N(0,1) )(2221212n n z Y X σσα+±-未知22221σσσ== 212111)(n n S Y X w +---μμ~t(n 1+n 2-2) )11)2((21212n n S n n t Y X w+-+±-α 其中S w 等符号的意义见第六章二. 3 (2)③.(2) μ 1,μ 2未知, W=22212221σσS S ~ F(n 1-1,n 2-1),方差比σ12/σ22的置信区间为))1,1(1,)1,1(1(212/12221212/2221----⋅-n n F S S n n F S S αα注意:对于单侧置信区间,只需将以上所列的双侧置信区间中的上(下)限中的下标α/2改为α,另外的下(上)限取为-∞ (∞)即可.。

概率论与统计5-1 基本概念

概率论与统计5-1 基本概念

n
它反映了总体方差 的信息
1 n 2 2 X i nX . n i 1
可用于推断:D(X). 其观察值
1 n 2 sn ( xi x )2 n i 1
3)样本标准差
Sn
2 Sn
1 n X i X 2 ; n i 1
其观察值
第一节
基本概念
一、总体与个体 二、随机样本的定义 三、统计量
下 回

一、总体与个体
总体: 在数理统计中,把研究对象的 全体称为总体(或母体). 个体: 总体中每个成员称为个体. 例如 , 在考察我校某届本科生学习质 量时,该届本科生的全体称为一个总体, 每一个本科生称为一个个体。
在实际中,我们并不关心总体的各个方面, 而往往关心它的某项或几项数量指标。 例如, 考察灯泡质量时,只研究灯泡的 寿命、亮度等数量指标。
k 1 k 2 k n
k 1
k 2
k n
k
再根据第四章辛钦定理知,
1 P k Ak X i k , n i 1
n
( n ), k 1, 2, ;
由第四章关于依概率收敛的序列的性质知
g ( A1 , A2 ,, Ak ) P g ( 1 , 2 ,, k ),
*2 E ( Sn )
2.
证 (1) E ( X )
1 1 1 E ( X ) E ( X i ) E ( X i ) n i 1 n i 1 n i 1
1 2 ( 2 ) D( X ) n 1 n D( X ) D( X i ) n i 1
解 总体 X 的分布律为
P{ X i } p (1 p)

考研数学一大纲重点梳理概率论与数理统计部分

考研数学一大纲重点梳理概率论与数理统计部分

考研数学一大纲重点梳理概率论与数理统计部分概率论和数理统计是考研数学一科目中的重要部分,本文将针对概率论与数理统计这一大纲进行重点梳理。

首先,我们将介绍概率论的基本概念和理论,然后详细讨论数理统计的相关内容。

一、概率论的基本概念和理论1. 概率的基本概念概率是研究随机现象的定量描述,用来描述事件发生的可能性大小。

概率可以用数值表示,范围在0到1之间,其中0代表不可能事件,1代表必然事件。

2. 概率的运算规则概率的运算规则包括加法规则和乘法规则。

加法规则适用于互斥事件,乘法规则适用于独立事件。

3. 随机变量和概率分布随机变量是用来描述随机现象的变量,可以分为离散随机变量和连续随机变量。

概率分布描述了随机变量的取值与概率之间的关系,常见的概率分布包括二项分布、泊松分布和正态分布等。

4. 期望和方差期望是随机变量的平均值,用来描述随机变量的集中趋势;方差是随机变量与期望之间的差异程度,用来描述随机变量的离散程度。

二、数理统计的相关内容1. 抽样与抽样分布抽样是指从总体中选取一部分个体进行观察和研究的过程,抽样分布是指样本统计量的概率分布。

常见的抽样分布包括正态分布、t分布和F分布等。

2. 参数估计参数估计是利用样本数据来估计总体参数的值,常见的参数估计方法包括点估计和区间估计。

点估计是用单个数值来估计参数的值,区间估计是用一个区间来估计参数的值。

3. 假设检验假设检验是根据样本提供的信息,对总体的某个参数是否满足某种假设进行判断。

假设检验可以分为单侧检验和双侧检验,常见的假设检验方法包括z检验和t检验等。

4. 方差分析方差分析是用来比较两个或多个总体间均值差异是否显著的统计方法。

方差分析可以分为单因素方差分析和多因素方差分析,常用的方法包括单因素方差分析和双因素方差分析等。

5. 回归分析回归分析是用来研究自变量与因变量之间的关系的方法。

简单线性回归是一种自变量和因变量之间存在线性关系的回归分析方法,多元线性回归是多个自变量和一个因变量之间的回归分析方法。

概率论与数理统计课件(共199张PPT)

概率论与数理统计课件(共199张PPT)
P(An|A1A2…An-1).
33
例3. r只红球○ t只白球○
每次任取一只球观 察颜色后, 放回, 再 放回a只同色球
在袋中连续取球4次, 试求第一、二次取到红球且 第三、四次取到白球的概率.
34
(三) 全概率公式和贝叶斯公式:
1. 样本空间的划分

定:义 若 B 1,B 2, ,B n一组事 : 件
计算条件概率有两种方法:
1. 公式法:
先计P算(A)P, (AB然 ), 后按公式计算
P(B| A) P(AB.) P(A)
31
2. 缩减样本空间法:
在A发生的前提下, 确定B的缩减样本空间, 并在其 中计算B发生的概率, 从而得到P(B|A). 例2. 在1, 2, 3, 4, 5这5个数码中, 每次取一个数码, 取 后不放回, 连取两次, 求在第1次取到偶数的条件下, 第2
B
A S
(1) AB
8
2.和事件:
AB{x|xA或xB}称 为 A与B的 和 事 . 件
即AB,中 至 少 有 一 ,称个 为 A与 发 B的生,和 记AB.
可 列 个A1事 , A2,件 的 和 事 件 记 Ak. 为
k1
3.积事件: 事件A B={x|x A 且 x B}称A与B的积,
即事件A与B同时发A生. A B 可简记为AB.
i1
1i jn
P(A i A j Ak )
1i jkn
(1)n1 P(A1 A 2 A n ).
27
例4. 设P(A)=p, P(B)=q, P(AB)=r, 用p, q, r表示下列事 件的概率:
( 1 ) P ( A B ) (; P ( 2 A B ) ( ) ; P ( 3 A B ) ) (; ( 4 A B )

概率论与数理统计 第5章

概率论与数理统计 第5章
i 1 4 i 2 2 i i 1
n
n
性质2.(分布可加性):若X~2(n1),Y~2(n2),X与 Y独立,则
X + Y~2(n1+n2 )
3、2分布表及有关计算
(1)构成 P{2(n)>λ}=α,已知n, α可查表求得λ; (2)有关计算P 2 (n) 2 (n) 称为上侧α分位数
例5.1 设 X ~ N ( , 2 ) (X1,X2,…,Xn)为X的一个样本,
求(X1,X2,…,Xn)的密度。 解 (X1,X2,…,Xn)为X的一个样本,故
X i ~ N ( , 2 )
n
i 1,2,, n
f ( x1 , x2 ,, xn ) f ( xi )
16 2

i 1,2,,16
2 1 16 2 2 P ( X i ) P 8 2 (16) 16 2 16 i 1
2—分布的密度函数f(y)曲线
n/2 1 f ( y) 2 ( n / 2) y 0,
n y 1 2 2
e , y0 y0
2 例5.4 X ~ N ( , ) (X1,X2,X3)为X的一个样本
X 1 X 2 X 3 的分布。 求


(n)为整体记号
2
2 (n) 2 2 查表得 0 ( 25 ) 34 . 382 10) 18.307 .1 0.05 (
1 当n充分大时,近似有 (n ) (u 2n - 1) 2 2
2
练习1. P(2(n)<s)=1-p ∵P(2(n) < s)=1- P(2(n) s )=1-p ∴ P(2(n) s )=p 2 s p (n) 练习2. P(2(11)>s)=0.05,求s

概率论与数理统计基本概念

概率论与数理统计基本概念

概率论与数理统计基本概念
概率论与数理统计是研究事件发生的可能性,以及由此衍生的结果
的一门学科。

它可以帮助人们提高分析和预测能力。

可以帮助我们了
解自然界及其客观原理,以及把握当代社会经济实体及其活动。

一、概率概念:
1. 随机事件:指事件发生以来,在所有结果中,用概率值去衡量其发
生的可能性,及其各个单一结果的概率分布情况;
2. 概率:是用来衡量某一随机事件发生的可能性的数值,可以给出这
个事件发生的可能性大小;
3. 概率分布:是某一随机变量及其可能取值之间发生关系的一种描述;
二、数理统计概念:
1、统计:是指对数据进行定量描述,尝试从数据中获得解释性的统计
特征;
2、变量:是指以数值形式表示的某类事物,是研究目标内容分析的一
种实际基础;
3、统计分布:是给定一组数据,通过统计手段,计算出变量的概率分
布情况,及其可能的变化规律;
4、极限定理:是一种概率论的定理,旨在探讨一个系统在重复抽样下,抽样结果的收敛情况;
5、数据描述:是指对数据的描述,可以让人简单明了地理解数据,及
其特征和趋势;
6、统计推断:是指根据统计样本信息,以概率结果作为有效依据,做
出关于总体参数情况的推断;
7、回归分析:是指建立一条回归函数模型,以描述解释变量对被解释
变量的影响;
8、判别分析:是指构建一个准确的模型,能够根据输入的观测值来准
确地判断属于哪一类人或物;
9、聚类分析:是指将一组数据进行分类,从而揭示内部数据间的关系,辅助决策;
10、卡方检验:是指判断某一种统计判断是否证实对某一总体分布结
果的检验,从而决定是否接受或拒绝假设。

概率论与数理统计知识点总结(超详细版)

概率论与数理统计知识点总结(超详细版)

《概率论与数理统计》第一章概率论的基本概念§2.样本空间、随机事件1.事件间的关系 B A ⊂则称事件B 包含事件A ,指事件A 发生必然导致事件B 发生B }x x x { ∈∈=⋃或A B A 称为事件A 与事件B 的和事件,指当且仅当A ,B 中至少有一个发生时,事件B A ⋃发生B }x x x { ∈∈=⋂且A B A 称为事件A 与事件B 的积事件,指当A ,B 同时发生时,事件B A ⋂发生B }x x x { ∉∈=且—A B A 称为事件A 与事件B 的差事件,指当且仅当A 发生、B 不发生时,事件B A —发生φ=⋂B A ,则称事件A 与B 是互不相容的,或互斥的,指事件A 与事件B 不能同时发生,基本事件是两两互不相容的且S =⋃B A φ=⋂B A ,则称事件A 与事件B 互为逆事件,又称事件A 与事件B 互为对立事件2.运算规则交换律A B B A A B B A ⋂=⋂⋃=⋃结合律)()( )()(C B A C B A C B A C B A ⋂=⋂⋃⋃=⋃⋃ 分配律 )()B (C A A C B A ⋃⋂⋃=⋂⋃)())(()( C A B A C B A ⋂⋂=⋃⋂徳摩根律B A B A A B A ⋃=⋂⋂=⋃ B —§3.频率与概率定义在相同的条件下,进行了n 次试验,在这n 次试验中,事件A 发生的次数A n 称为事件A 发生的频数,比值n n A 称为事件A 发生的频率概率:设E 是随机试验,S 是它的样本空间,对于E 的每一事件A 赋予一个实数,记为P (A ),称为事件的概率 1.概率)(A P 满足下列条件:(1)非负性:对于每一个事件A 1)(0≤≤A P (2)规范性:对于必然事件S 1)S (=P(3)可列可加性:设n A A A ,,,21 是两两互不相容的事件,有∑===nk knk kA P A P 11)()( (n 可以取∞)2.概率的一些重要性质: (i ) 0)(=φP(ii )若n A A A ,,,21 是两两互不相容的事件,则有∑===nk kn k kA P A P 11)()((n 可以取∞)(iii )设A ,B 是两个事件若B A ⊂,则)()()(A P B P A B P -=-,)A ()B (P P ≥ (iv )对于任意事件A ,1)(≤A P (v ))(1)(A P A P -=(逆事件的概率)(vi )对于任意事件A ,B 有)()()()(AB P B P A P B A P -+=⋃§4等可能概型(古典概型)等可能概型:试验的样本空间只包含有限个元素,试验中每个事件发生的可能性相同 若事件A包含k个基本事件,即}{}{}{2]1k i i i e e e A =,里个不同的数,则有中某,是,,k k n 2,1i i i ,21 ()中基本事件的总数包含的基本事件数S }{)(1j A n k e P A P kj i ===∑= §5.条件概率(1) 定义:设A,B 是两个事件,且0)(>A P ,称)()()|(A P AB P A B P =为事件A 发生的条件下事件B 发生的条件概率(2) 条件概率符合概率定义中的三个条件1。

《概率论与数理统计》知识点整理

《概率论与数理统计》知识点整理

《概率论与数理统计》知识点整理概率论与数理统计是数学中的一个重要分支,它研究随机现象发生的规律以及对这些规律的推断和决策问题。

在现代科学、金融、医学、工程等领域中都有广泛的应用。

下面是《概率论与数理统计》的一些重要知识点:一、概率论:1.概率的基本概念:随机试验、样本空间、事件、概率公理化定义等。

2.条件概率与概率的乘法定理:条件概率的定义、条件概率的乘法定理、独立事件的定义与性质等。

3.全概率公式与贝叶斯公式:全概率公式的推导与应用、贝叶斯公式的推导与应用等。

4.随机变量与概率分布:随机变量的定义与分类、概率分布的基本性质、离散型随机变量与连续型随机变量的概率分布等。

5.两随机变量函数的概率分布:随机变量的函数、数学期望的定义与性质、方差的定义与性质等。

6.多维随机变量及其分布:二维随机变量的概率分布、联合分布函数与边缘分布、条件分布等。

二、数理统计:1.统计数据的描述:数据的集中趋势度量(均值、中位数、众数)、数据的离散程度度量(极差、方差、标准差)、数据的分布形态度量(偏度、峰度)等。

2.参数估计:点估计的概念与方法、矩估计法、极大似然估计法、最小二乘估计法等。

3.假设检验:假设检验的基本概念、显著性水平与拒绝域、假设检验的步骤、单侧检验与双侧检验等。

4.统计分布:正态分布的性质与应用、t分布与χ²分布的概念与性质、F分布的概念与性质等。

5.方差分析与回归分析:方差分析的基本原理与应用、单因素方差分析、回归分析的基本原理与应用、简单线性回归分析等。

三、随机过程:1.随机过程的基本概念与性质:随机过程的定义、状态与状态转移概率、齐次性与非齐次性等。

2.马尔可夫链:马尔可夫链的定义与性质、状态空间的分类、平稳分布与极限等。

3.随机过程的描述:概率密度函数、概率生成函数、随机过程的矩、协方差函数等。

4.随机过程的分类:齐次与非齐次、连续与间断、宽离散与窄离散等。

(完整版)概率论与数理统计知识点总结(免费超详细版)

(完整版)概率论与数理统计知识点总结(免费超详细版)

《概率论与数理统计》第一章 概率论的基本概念§2.样本空间、随机事件1.事件间的关系 B A ⊂则称事件B 包含事件A ,指事件A 发生必然导致事件B 发生B }x x x { ∈∈=⋃或A B A 称为事件A 与事件B 的和事件,指当且仅当A ,B 中至少有一个发生时,事件B A ⋃发生B }x x x { ∈∈=⋂且A B A 称为事件A 与事件B 的积事件,指当A ,B 同时发生时,事件B A ⋂发生B }x x x { ∉∈=且—A B A 称为事件A 与事件B 的差事件,指当且仅当A 发生、B 不发生时,事件B A —发生φ=⋂B A ,则称事件A 与B 是互不相容的,或互斥的,指事件A 与事件B 不能同时发生,基本事件是两两互不相容的且S =⋃B A φ=⋂B A ,则称事件A 与事件B 互为逆事件,又称事件A 与事件B 互为对立事件2.运算规则 交换律A B B A A B B A ⋂=⋂⋃=⋃结合律)()( )()(C B A C B A C B A C B A ⋂=⋂⋃⋃=⋃⋃ 分配律 )()B (C A A C B A ⋃⋂⋃=⋂⋃)( ))(()( C A B A C B A ⋂⋂=⋃⋂ 徳摩根律B A B A A B A ⋃=⋂⋂=⋃ B —§3.频率与概率定义 在相同的条件下,进行了n 次试验,在这n 次试验中,事件A 发生的次数A n 称为事件A 发生的频数,比值n n A 称为事件A 发生的频率概率:设E 是随机试验,S 是它的样本空间,对于E 的每一事件A 赋予一个实数,记为P (A ),称为事件的概率 1.概率)(A P 满足下列条件:(1)非负性:对于每一个事件A 1)(0≤≤A P (2)规范性:对于必然事件S 1)S (=P(3)可列可加性:设n A A A ,,,21 是两两互不相容的事件,有∑===nk kn k kA P A P 11)()( (n 可以取∞)2.概率的一些重要性质: (i ) 0)(=φP(ii )若n A A A ,,,21 是两两互不相容的事件,则有∑===nk kn k kA P A P 11)()((n 可以取∞)(iii )设A ,B 是两个事件若B A ⊂,则)()()(A P B P A B P -=-,)A ()B (P P ≥ (iv )对于任意事件A ,1)(≤A P(v ))(1)(A P A P -= (逆事件的概率)(vi )对于任意事件A ,B 有)()()()(AB P B P A P B A P -+=⋃§4等可能概型(古典概型)等可能概型:试验的样本空间只包含有限个元素,试验中每个事件发生的可能性相同 若事件A包含k个基本事件,即}{}{}{2]1k i i i e e e A =,里个不同的数,则有中某,是,,k k n 2,1i i i ,21 ()中基本事件的总数包含的基本事件数S }{)(1j A n k e P A P kj i ===∑= §5.条件概率(1) 定义:设A,B 是两个事件,且0)(>A P ,称)()()|(A P AB P A B P =为事件A 发生的条件下事件B 发生的条件概率(2) 条件概率符合概率定义中的三个条件1。

概率论与数理统计(第3版)(谢永钦)第1章 概率论的基本概念

概率论与数理统计(第3版)(谢永钦)第1章  概率论的基本概念
(3)分配律:A ∩ (B∪C)= (A∩B)∪( A ∩ C )
(4)
A∪(B ∩ C)=(A∪B)∩(A∪C)
(5)
概率论与数理统计
02
第2节 概率、古典概率
概率论与数理统计
1. 概率 定义1.1
在相同条件下,进行了n次试验.若随机事件A在这n次试验中发 生了k次,则比值 称为事件A在n次实验中发生的频率,记为
并按其出现的先后排成一行.试求下列事件的概率
概率论与数理统计
P(A2 )
C19 103 104

0.9
P(A3 )
C24 92 104
0.0486
概率论与数理统计
例题
(一个古老的问题)一对骰子连掷25次.问出现双 6与不出现双6的概率哪个大?
概率论与数理统计
4. 几何概型
若试验具有如下特征:
频率具有下列性质:
(1)对于任一事件A,有 (2)
概率论与数理统计
概率论与数理统计
定义1.2 设事件A在n次重复试验中发生了k次, n很大时,频率 k/n稳定在某一数值p的附近波动,而随着试验次数n的增 加,波动的幅度越来越小,则称p为事件A发生的概率, 记为:P(A)=p.
概率论与数理统计
历史上著名的统计学家德·摩根(De Morgan)蒲丰(Buffon)和皮尔逊
对于任意的事件A,B只有如下分解:
概率论与数理统计
AB

A B
AB

AB
A B

AB
A B

AB
A B

概率论与数理统计
A
AB
B

A
A

概率论与数理统计

概率论 高等院校概率论课件JXHD5-1

概率论 高等院校概率论课件JXHD5-1

数理统计初步数理统计的基本概念参数估计假设检验§5.1数理统计的基本概念一.总体、样品、样本二.的联合分布四.统计量n X X X ,,21五.抽样分布返回三.频率分布表与直方图一.总体、样品、样本样品:从总体中随机抽取的一个个体;总体:要研究对象的全体;样本:由若干个样品构成,样本中包含样品的个 数称为样本长度。

(1)总体是一个v r ⋅,记为X ,其分布函数F x ()称为总体分布函数;(2)样品也是一个v r ⋅,它与总体同分布; (3)样本是由若干独立同分布的r v ⋅所构成,样品的个数称为样本长度。

Population SampleSample size设X 为一个总体,n X X X ,,, 21为来自总体的一个长度为n 的样本,它的观察值为n x x x ,,,21 。

由n X X X ,,, 21的独立性知,若X 的分布函数为)(x F ,则n X X X ,,, 21的联合分布函数为二.n X X X ,,, 21的联合分布 *F (n x x x ,,,21 )=∏=n i i x F 1)( (5-1)Allied Distribution若X 的分布密度为)(x f ,则n X X X ,,, 21的联合分布密度为*f (n x x x ,,,21 )=f x i i n()=∏1 (5-2)若X 是离散型随机变量,其概率分布为 ,,2,1),( ===k x X P p k k 则X X X n 12,,, 的联合概率分布为n n i i i i n i i p p p x X x X x X P 2121},,,{21====,2,1,,,21=n i i i三、频率分布表与直方图设x x x n 12,,, 是总体X 的一组样本值,可用频率分布表与直方图粗略地描述总体X 的分布。

设总体X 是离散型随机变量,x x x n 12,,, 是总体X 的一组样本值。

概率论与数理统计-第五章

概率论与数理统计-第五章

【数理统计简史】
1. 近代统计学时期
18 世纪末到 19 世纪,是近代统计学时期.这一 时期的重大成就是大数定律和概率论被引入统计 学.之后最小二乘法、误差理论和正态分布理论 等相继成为统计学的重要内容.这一时期有两大 学派:数理统计学派和社会统计学派.
【数理统计简史】 数理统计学派始于19世纪中叶,代表人物是比 利时的凯特莱( A.Quetelet , 1796-1874 ),著有 《概率论书简》《社会物理学》等,他主张用研 究自然科学的方法研究社会现象,正式把概率论 引入统计学,并最先用大数定律证明了社会生活 中随机现象的规律性,提出了误差理论.凯特莱 的贡献,使统计学的发展进入个了一个新的阶 段.
i =1 36
1 2 2 3 2 2 2 2 D( X ) = E ( X ) − E ( X ) = ( 0 + 1 + 2 + 3 ) − 4 2 5 = 4
2
二、样本与抽样 由于X1,X2,...,X36均与总体X同分布,且相互独 立,所以,Y的均值和方差分别为
E (Y ) = E ( ∑ X i ) = 36 E ( X ) = 54,
【数理统计简史】 18世纪到 19世纪初期,高斯从描述天文观测的 误差而引进正态分布,并使用最小二乘法作为估 计方法,是近代数理统计学发展初期的重大事件, 对社会发展有很大的影响.
【数理统计简史】 用正态分布描述观测数据的应用是如此普遍,以 至 在 19 世 纪 相 当 长 的 时 期 内 , 包 括 高 尔 顿 ( Galton )在内的一些学者,认为这个分布可用 于描述几乎是一切常见的数据.直到现在,有关 正态分布的统计方法,仍占据着常用统计方法中 很重要的一部分.最小二乘法方面的工作,在 20 世纪初以来,经过一些学者的发展,如今成了数 理统计学中的主要方法.

考研数学《概率论与数理统计》知识点总结

考研数学《概率论与数理统计》知识点总结

第一章 概率论的基本概念定义: 随机试验E 的每个结果样本点组成样本空间S ,S 的子集为E 的随机事件,单个样本点为基本事件.事件关系: 1.A ⊂B ,A 发生必导致B 发生. 2.A B 和事件,A ,B 至少一个发生,A B 发生. 3.A B 记AB 积事件,A ,B 同时发生,AB 发生. 4.A -B 差事件,A 发生,B 不发生,A -B 发生.5.A B=Ø,A 与B 互不相容(互斥),A 与B 不能同时发生,基本事件两两互不相容.6.A B=S 且A B=Ø,A 与B 互为逆事件或对立事件,A 与B 中必有且仅有一个发生,记B=A S A -=.事件运算: 交换律、结合律、分配率略.德摩根律:B A B A =,B A B A =.概率: 概率就是n 趋向无穷时的频率,记P(A).概率性质:1.P (Ø)=0.2.(有限可加性)P (A 1 A 2 … A n )=P (A 1)+P (A 2)+…+P (A n ),A i 互不相容. 3.若A ⊂B ,则P (B -A)=P (B)-P (A).4.对任意事件A ,有)A (1)A (P P -=.5.P (A B)=P (A)+P (B)-P (AB).古典概型: 即等可能概型,满足:1.S 包含有限个元素.2.每个基本事件发生的可能性相同. 等概公式: 中样本点总数中样本点数S A )A (==n k P . 超几何分布:⎪⎪⎭⎫ ⎝⎛⎪⎪⎭⎫⎝⎛--⎪⎪⎭⎫ ⎝⎛=n N k n D N k D p ,其中ra C r a =⎪⎪⎭⎫ ⎝⎛. 条件概率: )A ()AB ()A B (P P P =. 乘法定理:)A ()A B ()AB C ()ABC ()A ()AB ()AB (P P P P P P P ==.全概率公式: )B ()B A ()B ()B A ()B ()B A ()A (2211n n P P P P P P P +++= ,其中i B 为S 的划分. 贝叶斯公式: )A ()B ()B A ()A B (P P P P i i i =,∑==nj j j B P B A P A P 1)()()(或)()()()()()()(B P B A P B P B A P B P B A P A B P +=.独立性: 满足P (AB)=P (A)P (B),则A ,B 相互独立,简称A ,B 独立.定理一: A ,B 独立,则.P (B |A)=P (B). 定理二: A ,B 独立,则A 与B ,A 与B ,A 与B 也相互独立.第二章 随机变量及其分布(0—1)分布: k k p p k X P --==1)1(}{,k =0,1 (0<p <1).伯努利实验:实验只有两个可能的结果:A 及A .二项式分布: 记X~b (n ,p ),k n kk n p p C k X P --==)1(}{. n 重伯努利实验:独立且每次试验概率保持不变.其中A 发生k 次,即二项式分布.泊松分布: 记X~π(λ),!}{k e k X P k λλ-==, ,2,1,0=k .泊松定理: !)1(lim k e p p C k kn k knn λλ--∞→=-,其中λ=np .当20≥n ,05.0≤p 应用泊松定理近似效果颇佳.随机变量分布函数: }{)(x X P x F ≤=,+∞<<∞-x .)()(}{1221x F x F x X x P -=≤<.连续型随机变量: ⎰∞-=xt t f x F d )()(,X 为连续型随机变量,)(x f 为X 的概率密度函数,简称概率密度.概率密度性质:1.0)(≥x f ;2.1d )(=⎰+∞∞-x x f ;3.⎰=-=≤<21d )()()(}{1221x x x x f x F x F x X x P ;4.)()(x f x F =',f (x )在x 点连续;5.P {X=a }=0.均匀分布: 记X~U(a ,b );⎪⎩⎪⎨⎧<<-=其它,,01)(bx a a b x f ;⎪⎩⎪⎨⎧≥<≤--<=b x b x a a b a x a x x F ,,,10)(. 性质:对a ≤c <c +l ≤b ,有 a b ll c X c P -=+≤<}{指数分布:⎪⎩⎪⎨⎧>=-其它,,001)(x e x f x θθ;⎩⎨⎧>-=-其它,,001)(x e x F x θ. 无记忆性: }{}{t X P s X t s X P >=>+>. 正态分布: 记),(~2σμN X ;]2)(exp[21)(22σμσπ--=x x f ;t t x F xd ]2)(exp[21)(22⎰∞---=σμσπ.性质: 1.f (x )关于x =μ对称,且P {μ-h <X ≤μ}=P {μ<X ≤μ+h };2.有最大值f (μ)=(σπ2)-1. 标准正态分布:]2exp[21)(2x x -=πϕ;⎰∞--=Φxt t x d ]2exp[21)(2π.即μ=0,ζ=1时的正态分布X ~N(0,1)性质:)(1)(x x Φ-=-Φ.正态分布的线性转化: 对),(~2σμN X 有)1,0(~N X Z σμ-=;且有)(}{}{)(σμσμσμ-Φ=-≤-=≤=x x X P x X P x F . 正态分布概率转化: )()(}{1221σμσμ-Φ--Φ=≤<x x x X x P ;1)(2)()(}{-Φ=-Φ-Φ=+<<-t t t t X t P σμσμ.3ζ法则: P =Φ(1)-Φ(-1)=68.26%;P =Φ(2)-Φ(-2)=95.44%;P =Φ(3)-Φ(-3)=99.74%,P 多落在(μ-3ζ,μ+3ζ)内. 上ɑ分位点: 对X~N(0,1),若z α满足条件P {X>z α}=α,0<α<1,则称点z α为标准正态分布的上α分位点. 常用 上ɑ分位点: 0.001 0.005 0.01 0.025 0.05 0.10 3.0902.5762.3261.9601.6451.282Y 服从自由度为1的χ2分布:设X 密度函数f X (x ),+∞<<∞-x ,若Y=X 2,则⎪⎩⎪⎨⎧≤>-+=000)]()([21)(y y y f y f y y f X XY ,,若设X ~N(0,1),则有⎪⎩⎪⎨⎧≤>=--00021)(221y y e y y f y Y ,,π定理:设X 密度函数f X (x ),设g (x )处处可导且恒有g ′(x )>0(或g ′(x )<0),则Y=g (X)是连续型随机变量,且有⎩⎨⎧<<'=其他,,0)()]([)(βαy y h y h f y f X Y h (y )是g (x )的反函数;①若+∞<<∞-x ,则α=min{g (−∞),g (+∞)},β=max{g (−∞),g (+∞)};②若f X (x )在[a ,b ]外等于零,g (x )在[a ,b ]上单调,则α=min{g (a ),g (b )},β=max{g (a ),g (b )}.应用: Y=aX +b ~N(a μ+b ,(|a |ζ)2).第三章 多维随机变量及其分布二维随机变量的分布函数: 分布函数(联合分布函数):)}(){(),(y Y x X P y x F ≤≤= ,记作:},{y Y x X P ≤≤.),(),(),(),(},{112112222121y x F y x F y x F y x F y Y y x X x P +--=≤<≤<.F (x ,y )性质: 1.F (x ,y )是x 和y 的不减函数,即x 2>x 1时,F (x 2,y )≥F (x 1,y );y 2>y 1时,F (x ,y 2)≥F (x ,y 1).2.0≤F (x ,y )≤1且F (−∞,y )=0,F (x ,−∞)=0,F (−∞,−∞)=0,F (+∞,+∞)=1.3.F (x +0,y )=F (x ,y ),F (x ,y +0)=F (x ,y ),即F (x ,y )关于x 右连续,关于y 也右连续.4.对于任意的(x 1,y 1),(x 2,y 2),x 2>x 1,y 2>y 1,有P {x 1<X ≤x 2,y 1<Y ≤y 2}≥0.离散型(X ,Y ):0≥ij p ,111=∑∑∞=∞=ij j i p ,ij yy x x p y x F i i ∑∑=≤≤),(.连续型(X ,Y ):v u v u f y x F y xd d ),(),(⎰⎰∞-∞-=.f (x ,y )性质: 1.f (x ,y )≥0.2.1),(d d ),(=∞∞=⎰⎰∞∞-∞∞-F y x y x f .3.y x y x f G Y X P G⎰⎰=∈d d ),(}),{(. 4.若f (x ,y )在点(x ,y )连续,则有),(),(2y x f yx y x F =∂∂∂. n 维: n 维随机变量及其分布函数是在二维基础上的拓展,性质与二维类似. 边缘分布:F x (x ),F y (y )依次称为二维随机变量(X ,Y )关于X 和Y 的边缘分布函数,F X (x )=F (x ,∞),F Y (y )=F (∞,y ).离散型: *i p 和j p *分别为(X ,Y )关于X 和Y 的边缘分布律,记}{1i ij j i x X P p p ==∑=∞=*,}{1j ij i j y Y P p p ==∑=∞=*.连续型:)(x f X ,)(y f Y 为(X ,Y )关于X 和Y 的边缘密度函数,记⎰∞∞-=y y x f x f X d ),()(,⎰∞∞-=x y x f y f Y d ),()(.二维正态分布:]})())((2)([)1(21exp{121),(2222212121212221σμσσμμρσμρρσπσ-+-------=y y x x y x f . 记(X ,Y )~N (μ1,μ2,ζ12,ζ22,ρ)]2)(exp[21)(21211σμσπ--=x x f X ,∞<<∞-x .]2)(exp[21)(22222σμσπ--=y y f Y ,∞<<∞-y . 离散型条件分布律: jij j j i j i p p y Y P y Y x X P y Y x X P *=======}{},{}{. *=======i ij i j i i j p p x X P y Y x X P x X y Y P }{},{}{.连续型条件分布:条件概率密度:)(),()(y f y x f y x f Y Y X =||条件分布函数:x y f y x f y Y x X P y x F xY Y X d )(),(}{)(⎰∞-==≤=||| )(),()(x f y x f x y f X X Y =||y x f y x f x X y Y P x y F yX X Y d )(),(}{)(⎰∞-==≤=||| 含义:当0→ε时,)|(d )|(}|{||y x F x y x f y Y y x X P Y X xY X =≈+≤<≤⎰∞-ε.均匀分布: 若⎪⎩⎪⎨⎧∈=其他,0),(,1),(Gy x Ay x f ,则称(X ,Y)在G 上服从均匀分布. 独立定义:若P {X ≤x ,Y ≤y }=P {X ≤x }P {Y ≤y },即F (x ,y )=F x (x )F y (y ),则称随机变量X 和Y 是相互独立的. 独立条件或可等价为:连续型:f (x ,y )=f x (x )f y (y );离散型:P {X =x i ,Y =y j }=P {X =x i }P {Y =y j }.正态独立: 对于二维正态随机变量(X ,Y ),X 和Y 相互对立的充要条件是:参数ρ=0.n 维延伸: 上述概念可推广至n 维随机变量,要注意的是边缘函数或边缘密度也是多元(1~n -1元)的.定理:设(X 1,X 2,…,X m )和(Y 1,Y 2,…,Y n )相互独立,则X i 和Y j 相互独立.又若h ,g 是连续函数,则h (X 1,X 2,…,X m )和g (Y 1,Y 2,…,Y n )相互独立.Z=X+Y 分布: 若连续型(X ,Y )概率密度为f (x ,y ),则Z=X+Y 为连续型且其概率密度为⎰∞∞-+-=y y y z f z f Y X d ),()(或⎰∞∞-+-=x x z x f z f Y X d ),()(.f X 和f Y 的卷积公式:记⎰∞∞-+-==y y f y z f z f f f Y X Y X Y X d )()()(*⎰∞∞--=x x z f x f Y X d )()(,其中除继上述条件,且X 和Y相互独立,边缘密度分别为f X (x )和f Y (y ). 正态卷积:若X 和Y 相互独立且X ~N (μ1,ζ12),记Y ~N (μ2,ζ22),则对Z=X+Y 有Z ~N (μ1+μ2,ζ12+ζ22).1.上述结论可推广至n 个独立正态随机变量.2.有限个独立正态随机变量的线性组合仍服从正态分布. 伽马分布:记),(~θαΓX ,0>α,0>θ.⎪⎩⎪⎨⎧>Γ=--其他,,00)(1)(1x e x x f x θαααθ,其中⎰+∞--=Γ01d )(t e t tαα.若X 和Y 独立且X ~Γ(α,θ),记Y ~Γ(β,θ),则有X+Y~Γ(α+β,θ).可推广到n 个独立Γ分布变量之和.XYZ =:⎰∞∞-=x xz x f x z f X Y d ),()(,若X 和Y 相互独立,则有⎰∞∞-=x xz f x f x z f Y X X Y d )()()(.XYZ =分布: ⎰∞∞-=x x zx f x z f XY d ),(1)(,若X 和Y 相互独立,则有⎰∞∞-=xxz f x f x z f Y X XY d )()(1)(. 大小分布:若X 和Y 相互独立,且有M =max{X ,Y }及N =min{X ,Y },则M 的分布函数:F max (z )=F X (z )F Y (z ),N 的分布函数:F min (z )=1-[1-F X (z )][1-F Y (z )],以上结果可推广到n 个独立随机变量的情况.第四章 随机变量的数字特征数学期望: 简称期望或均值,记为E (X );离散型:k k k p x X E ∑=∞=1)(.连续型:⎰∞∞-=x x xf X E d )()(.定理: 设Y 是随机变量X 的函数:Y =g (X )(g 是连续函数).1.若X 是离散型,且分布律为P {X =x k }=p k ,则: k k k p x g Y E )()(1∑=∞=.2.若X 是连续型,概率密度为f (x ),则:⎰∞∞-=x x f x g Y E d )()()(.定理推广: 设Z 是随机变量X ,Y 的函数:Z =g (X ,Y )(g 是连续函数).1.离散型:分布律为P {X =x i ,Y =y j }=p ij ,则: ij j i i j p y x g Z E ),()(11∑∑=∞=∞=. 2.连续型:⎰⎰∞∞-∞∞-=y x y x f y x g Z E d d ),(),()(期望性质:设C 是常数,X 和Y 是随机变量,则:1.E (C )=C .2.E (CX )=CE (X ).3.E (X +Y )=E (X )+E (Y ). 4.又若X 和Y 相互独立的,则E (XY )=E (X )E (Y ).方差:记D (X )或Var(X ),D (X )=V ar(X )=E {[X -E (X )]2}.标准差(均方差): 记为ζ(X ),ζ(X )= . 通式:22)]([)()(X E X E X D -=. k k k p X E x X D 21)]([)(-∑=∞=,⎰∞∞--=x x f x E x X D d )()]([)(2.标准化变量: 记σμ-=x X *,其中μ=)(X E ,2)(σ=X D ,*X 称为X 的标准化变量. 0)(*=X E ,1)(*=X D .方差性质: 设C 是常数,X 和Y 是随机变量,则: 1.D (C )=0. 2.D (CX )=C 2D (X ),D (X +C )=D (X ).3.D (X +Y )=D (X )+D (Y )+2E {(X -E (X ))(Y -E (Y ))},若X ,Y 相互独立D (X +Y )=D (X )+D (Y ).4.D (X )=0的充要条件是P {X =E (X )}=1. 正态线性变换: 若),(~2i i i N X σμ,i C 是不全为0的常数,则),(~22112211i i n i i i n i n n C C N X C X C X C σμ∑∑+++== .切比雪夫不等式: 22}{εσεμ≤≥-X P 或221}{εσεμ-≥<-X P ,其中)(X E =μ,)(2X D =σ,ε为任意正数.协方差:记)]}()][({[),Cov(Y E Y X E X E Y X --=.X 与Y的相关系数:)()(),Cov(Y D X D Y X XY =ρ.D (X +Y )=D (X )+D (Y )+2Cov(X ,Y ),Cov(X ,Y )=E (XY )-E (X )E (Y ).性质: 1.Cov(aX ,bY )=ab Cov(X ,Y ),a ,b 是常数.2.Cov(X 1+X 2,Y )=Cov(X 1,Y )+Cov(X 2,Y ). 系数性质:令e =E [(Y -(a +bX ))2],则e 取最小值时有)()1(]))([(2200min Y D X b a Y E e XY ρ-=+-=,其中)()(00X E b Y E a -=,)(),Cov(0X D Y X b =.1.|ρXY |≤1.2.|ρXY |=1的充要条件是:存在常数a ,b 使P {Y =a +bX }=1.|ρXY |越大e 越小X 和Y 线性关系越明显,当|ρXY |=1时,Y =a +bX ;反之亦然,当ρXY =0时,X 和Y 不相关. X 和Y 相互对立,则X 和Y 不相关;但X 和Y 不相关,X 和Y 不一定相互独立. 定义: k 阶矩(k 阶原点矩):E (X k ). n 维随机变量X i 的协方差矩阵:⎪⎪⎪⎪⎪⎭⎫⎝⎛=nn n n n n c c c c c cc c c212222111211C ,),Cov(j i ij X X c ==E {[X i -E (X i )][X j -E (X j )]}. k +l 阶混合矩:E (X k Y l).k 阶中心矩:E {[X -E (X )] k }.k +l 阶混合中心矩:E {[X -E (X )]k [Y -E (Y )]l }.n 维正态分布:)}()(21exp{det )2(1),,,(1T 221μX C μX C ---=-n n x x x f π ,T21T 21),,,(),,,(n nx x x μμμ ==μX . 性质:1.n 维正态随机变量(X 1,X 2,…,X n )的每一个分量X i (i =1,2,…,n )都是正态随机变量,反之,亦成立. 2.n 维随机变量(X 1,X 2,…,X n )服从n 维正态分布的充要条件是X 1,X 2,…,X n 的任意线性组合l 1X 1+l 2X 2+…+l n X n 服从一维正态分布(其中l 1,l 2,…,l n 不全为零).3.若(X 1,X 2,…,X n )服从n 维正态分布,且Y 1,Y 2,…,Y k 是X j (j =1,2,…,n )的线性函数,则(Y 1,Y 2,…,Y k )也服从多维正态分布.4.若(X 1,X 2,…,X n )服从n 维正态分布,则“X i 相互独立”与“X i 两两不相关”等价.)(x D第五章大数定律及中心极限定理弱大数定理:若X1,X2,…是相互独立并服从同一分布的随机变量序列,且E(X k)=μ,则对任意ε>0有11lim1=⎭⎬⎫⎩⎨⎧<-∑=∞→εμknknXnP或→μPX,knkXnX11=∑=.定义:Y1,Y2,…,Y n ,…是一个随机变量序列,a是一个常数.若对任意ε>0,有1}|{|lim=<-∞→εaYPnn则称序列Y1,Y2,…,Yn,…依概率收敛于a.记aY Pn−→−伯努利大数定理:对任意ε>0有1lim=⎭⎬⎫⎩⎨⎧<-∞→εpnfP An或0lim=⎭⎬⎫⎩⎨⎧≥-∞→εpnfP An.其中f A是n次独立重复实验中事件A发生的次数,p是事件A在每次试验中发生的概率.中心极限定理定理一:设X1,X2,…,X n ,…相互独立并服从同一分布,且E(X k)=μ,D(X k)=ζ2 >0,则n→∞时有σμnnXknk)(1-∑=N(0,1)或nXσμ-~N(0,1)或X~N(μ,n2σ).定理二:设X1,X2,…,X n ,…相互独立且E(X k)=μk,D(X k)=ζk2 >0,若存在δ>0使n→∞时,}|{|1212→-∑+=+δδμkknknXEB,则nknkknkBX)(11μ==∑-∑~N(0,1),记212knknBσ=∑=.定理三:设),(~pnbnη,则n→∞时,Npnpnpn~)1()(--η(0,1),knknX1=∑=η.第六章样本及抽样分布定义:总体:全部值;个体:一个值;容量:个体数;有限总体:容量有限;无限总体:容量无限.定义:样本:X1,X2,…,X n 相互独立并服从同一分布F的随机变量,称从F得到的容量为n的简单随机样本.频率直方图:图形:以横坐标小区间为宽,纵坐标为高的跨越横轴的几个小矩形.横坐标:数据区间(大区间下限比最小数据值稍小,上限比最大数据值稍大;小区间:均分大区间,组距Δ=大区间/小区间个数;小区间界限:精度比数据高一位).图形特点:外轮廓接近于总体的概率密度曲线.纵坐标:频率/组距(总长度:<1/Δ;小区间长度:频率/组距).定义:样本p分位数:记x p,有1.样本x i中有np个值≤x p.2.样本中有n(1-p)个值≥x p.箱线图:x p选择:记⎪⎩⎪⎨⎧∈+∉=++NnpxxNnpxxnpnpnpp当,当,][211)()()1]([.分位数x0.5,记为Q2或M,称为样本中位数.分位数x0.25,记为Q1,称为第一四分位数.分位数x0.75,记为Q3,称为第三四分位数.图形:图形特点:M为数据中心,区间[min,Q1],[Q1,M],[M,Q3],[Q3,max]数据个数各占1/4,区间越短数据密集.四分位数间距:记IQR=Q3-Q1;若数据X<Q1-1.5IQR或X>Q3+1.5IQR,就认为X是疑似异常值.抽样分布:样本平均值:iniXnX11=∑=样本方差:)(11)(11221212XnXnXXnSiniini-∑-=-∑-===样本标准差:2SS=样本k阶(原点)矩:kinikXnA11=∑=,k≥1 样本k阶中心矩:kinikXXnB)(11-∑==,k≥2经验分布函数:)(1)(xSnxFn=,∞<<∞-x.)(xS表示F的一个样本X1,X2,…,X n 中不大于x的随机变量的个数.自由度为n的χ2分布:记χ2~χ2(n),222212nXXX+++=χ,其中X1,X2,…,X n是来自总体N(0,1)的样本.E(χ2 )=n,D(χ2 )=2n.χ12+χ22~χ2(n1+n2).⎪⎩⎪⎨⎧>Γ=--其他,,)2(21)(2122yexnyfynn.χ2分布的分位点:对于0<α<1,满足αχχαχα==>⎰∞yyfnPn)(222d)()}({,则称)(2nαχ为)(2nχ的上α分位点.~ 近似的min Q1 M Q3 max当n 充分大时(n >40),22)12(21)(-+≈n z n ααχ,其中αz 是标准正态分布的上α分位点. 自由度为n 的t 分布:记t ~t (n ),nY Xt /=, 其中X~N (0,1),Y~χ2(n ),X ,Y 相互独立.2)1(2)1(]2[]2)1([)(+-+Γ+Γ=n n t n n n t h π h (t )图形关于t =0对称;当n 充分大时,t 分布近似于N (0,1)分布.t 分布的分位点:对于0<α<1,满足ααα==>⎰∞t t h n t t P n t )(d )()}({,则称)(n t α为)(n t 的上α分位点. 由h (t )对称性可知t 1-α(n )=-t α(n ).当n >45时,t α(n )≈z α,z α是标准正态分布的上α分位点.自由度为(n 1,n 2)的F分布:记F ~F (n 1,n 2),21n V n U F =,其中U~χ2(n 1),V~χ2(n 2),X ,Y 相互独立.1/F ~F (n 2,n 1)⎪⎩⎪⎨⎧>+ΓΓ+Γ=+-其他,,00]1)[2()2()](2)([)(2)(21211)2(221212111x n y n n n y n n n n y n n n n ψF 分布的分位点:对于0<α<1,满足αψαα==>⎰∞y y n n F F P n n F ),(2121d )()},({,则称),(21n n F α为),(21n n F 的上α分位点.重要性质:F 1-α(n 1,n 2)=1/F α(n 1,n 2).定理一: 设X 1,X 2,…,X n 是来自N (μ,ζ2)的样本,则有),(~2n N X σμ,其中X 是样本均值. 定理二:设X 1,X 2,…,X n 是来自N (μ,ζ2)的样本,样本均值和样本方差分别记为 X ,2S ,则有1.)1(~)1(222--n S n χσ;2.X 与2S 相互独立.定理三:设X 1,X 2,…,X n 是来自N (μ,ζ2)的样本,样本均值和样本方差分别记为X ,2S ,则有)1(~--n t nS X μ.定理四:设X 1,X 2,…,X n 1 与Y 1,Y 2,…,Y n 2分别是来自N (μ1,ζ12)和N (μ2,ζ22)的样本,且相互独立.设这两个样本的样本均值和样本方差分别记为 X ,Y ,21S ,22S ,则有1.)1,1(~2122212221--n n F S S σσ.2.当ζ12=ζ22=ζ2时,)2(~)()(21121121-++-----n n t n n S Y X w μμ,其中2)1()1(212222112-+-+-=n n S n S n S w,2w w S S =. 第七章 参数估计定义: 估计量:),,,(ˆ21n X X X θ,估计值:),,,(ˆ21nx x x θ,统称为估计. 矩估计法:令)(ll X E =μ=li n i l X n A 11=∑=(k l ,,2,1 =)(k 为未知数个数)联立方程组,求出估计θˆ.设总体X 均值μ及方差ζ2都存在,则有 X A ==1ˆμ,212212122)(11ˆX X n X X n A A i n i i n i -∑=-∑=-===σ. 最大似然估计法: 似然函数:离散:);()(1θθi n i x p L =∏=或连续:);()(1θθi ni x f L =∏=,)(θL 化简可去掉与θ无关的因式项.θˆ即为)(θL 最大值,可由方程0)(d d =θθL 或0)(ln d d =θθL 求得. 当多个未知参数θ1,θ1,…,θk 时:可由方程组 0d d =L i θ或0ln d d =L i θ(k i ,,2,1 =)求得. 最大似然估计的不变性:若u =u (θ)有单值反函数θ=θ(u ),则有)ˆ(ˆθu u=,其中θˆ为最大似然估计. 截尾样本取样: 定时截尾样本:抽样n 件产品,固定时间段t 0内记录产品个体失效时间(0≤t 1≤t 2≤…≤t m ≤t 0)和失效产品数量. 定数截尾样本:抽样n 件产品,固定失效产品数量数量m 记录产品个体失效时间(0≤t 1≤t 2≤…≤t m ). 结尾样本最大似然估计:定数截尾样本:设产品寿命服从指数分布X~e (θ),θ即产品平均寿命.产品t i 时失效概率P {t =t i }≈f (t i )d t i ,寿命超过t m 的概率θm t m e t t F -=>}{,则)(}){()(1i m i m n m m n t P t t F C L =-∏>=θ,化简得)(1)(m t s m e L ---=θθθ,由0)(ln d d =θθL 得:mt s m )(ˆ=θ,其中s (t m )=t 1+t 2+…+t m +(n -m )t m ,称为实验总时间. 定时截尾样本:与定数结尾样本讨论类似有s (t 0)=t 1+t 2+…+t m +(n -m )t 0,)(01)(t s m e L ---=θθθ,mt s )(ˆ0=θ,. 无偏性: 估计量),,,(ˆ21nX X X θ的)ˆ(θE 存在且θθ=)ˆ(E ,则称θˆ是θ的无偏估计量. 有效性:),,,(ˆ211n X X X θ与),,,(ˆ212n X X X θ都是θ的无偏估计量,若)ˆ()ˆ(21θθD D ≤,则1ˆθ较2ˆθ有效. 相合性: 设),,,(ˆ21n X X X θθ的估计量,若对于任意0>ε有1}|ˆ{|lim =<-∞→εθθP n ,则称θˆ是θ的相合估计量. 置信区间:αθθθ-≥<<1)},,,(),,,({2121n n X X X X X X P ,θ和θ分别为置信下限和置信上限,则),(θθ是θ的一个置信水平为α-1置信区间,α-1称为置信水平,10<<α.正态样本置信区间: 设X 1,X 2,…,X n 是来自总体X ~N (μ,ζ2)的样本,则有μ的置信区间:枢轴量W W 分布 a ,b 不等式 置信水平 置信区间)1,0(~N n X σμ-⇒ασμα-=⎪⎭⎪⎬⎫⎪⎩⎪⎨⎧<-12z n X P ⇒)(2ασz n X ± 其中z α/2为上α分位点θ置信区间的求解: 1.先求枢轴量:即函数W =W (X 1,X 2,…,X n ;θ),且函数W 的分布不依赖未知参数. 如上讨论标注2.对于给定置信水平α-1,定出两常数a ,b 使P {a <W <b }=α-1,从而得到置信区间. (0-1)分布p 的区间估计:样本容量n >50时,⇒--∞→)1,0(~)1()(lim N p np np X n n {}⇒-≈<--αα1)1()(2z p np np X n P0)2()(222222<++-+X n p z X n p z n αα⇒若令22αz n a +=,)2(22αz X n b +-=,2X n c =,则有置信区间(a ac b b 2)4(2---,a ac b b 2)4(2-+-).单侧置信区间:若αθθ-≥>1}{P 或αθθ-≥<1}{P ,称(θ,∞)或(∞-,θ)是θ的置信水平为α-1的单侧置信区间.正态总体均值、方差的置信区间与单侧置信限(置信水平为α-1)待估 其他 枢轴量W 的分布置信区间单侧置信限一个正态总体μζ2已知 )1,0(~N nX Z σμ-=)(2ασz nX ±ασμz nX +=,ασμz nX -=μζ2未知 )1(~--=n t nS X t μ⎪⎭⎫ ⎝⎛±2αt n S X αμt n S X +=,αμt nSX -= ζ2μ未知)1(~)1(2222--=n S n χσχ⎪⎪⎭⎫⎝⎛---2212222)1(,)1(ααχχS n S n 2122)1(αχσ--=S n ,222)1(αχσS n -=两个正态总体μ1-μ2ζ12,ζ22已知 )1,0(~)(22212121N n n Y X Z σσμμ+---=⎪⎪⎭⎫ ⎝⎛+±-2221212n n z Y X σσα2221212122212121n n z Y X n n z Y X σσμμσσμμαα+--=-++-=-μ1-μ2ζ12=ζ22=ζ2 未知)2(~)()(21121121-++---=--n n t n n S Y X t w μμ()12112--+±-n n S tY X w α2w w S S =121121121121----+--=-++-=-n n S t Y X n n S t Y X w w ααμμμμ2)1()1(2122 22112-+-+-=nnS nSnSwζ12/ζ22μ1,μ2未知)1,1(~2122212221--=nnFSSFσσ⎪⎪⎭⎫⎝⎛-212221222211,1ααFSSFSSασσ-=1222122211FSS,ασσFSS122212221=单个总体X~N(μ,ζ2),两个总体X~N(μ1,ζ12),Y~N(μ2,ζ22).第八章假设实验定义:H0:原假设或零假设,为理想结果假设;H1:备择假设,原假设被拒绝后可供选择的假设.第Ⅰ类错误:H0实际为真时,却拒绝H0.第Ⅱ类错误:H0实际为假时,却接受H0.显著性检验:只对犯第第Ⅰ类错误的概率加以控制,而不考虑第Ⅱ类错误的概率的检验.P{当H0为真拒绝H0}≤α,α称为显著水平.拒绝域:取值拒绝H0.临界点:拒绝域边界.双边假设检验:H0:θ=θ0,H1:θ≠θ0.右边检验:H0:θ≤θ0,H1:θ>θ0.左边检验:H0:θ≥θ0,H1:θ<θ0.正态总体均值、方差的检验法(显著性水平为α)原假设H0备择假设H1检验统计量拒绝域1 ζ2已知μ≤μ0μ>μ0nXZσμ-=z≥zαμ≥μ0μ<μ0z≤-zαμ=μ0μ≠μ0|z|≥zα/22 ζ2未知μ≤μ0μ>μ0nSXt0μ-=t≥tα(n-1) μ≥μ0μ<μ0t≤-tα(n-1) μ=μ0μ≠μ0|t|≥tα/2(n-1)3 ζ1,ζ2已知μ1-μ2≤δμ1-μ2>δ222121nnYXZσσδ+--=z≥zαμ1-μ2≥δμ1-μ2<δz≤-zαμ1-μ2=δμ1-μ2≠δ|z|≥zα/24 ζ12=ζ22=ζ2未知μ1-μ2≤δμ1-μ2>δ1211--+--=nnSYXtwδ2)1()1(212222112-+-+-=nnSnSnSwt≥tα(n1+n2-2) μ1-μ2≥δμ1-μ2<δt≤-tα(n1+n2-2)μ1-μ2=δμ1-μ2≠δ|t|≥tα/2(n1+n2-2)5 μ未知ζ2≤ζ02ζ2>ζ02222)1(σχSn-=χ2≥χα2(n-1)ζ2≥ζ02ζ2<ζ02χ2≤χ21-α(n-1)ζ2=ζ02ζ2≠ζ02χ2≥χ2α/2(n-1)或χ2≤χ21-α/2(n-1)6 μ1,μ2未知ζ12≤ζ22ζ12>ζ222221SSF=F≥Fα(n1-1,n2-1) ζ12≥ζ22ζ12<ζ22F≤F1-α(n1-1,n2-1)ζ12=ζ22ζ12≠ζ22F≥Fα/2(n1-1,n2-1)或F≤F1-α/2(n1-1,n2-1)7 成对数据μD≤0 μD>0nSDtD-=t≥tα(n-1) μD≥0 μD<0 t≤-tα(n-1)μD=0 μD≠0 |t|≥tα-2(n-1)检验方法选择:主要是逐对比较法(成对数据)跟两个正态总体均值差的检验的区别,如上表即7跟3、4的区别,成对数据指两样本X和Y之间存在一一对应关系,而3和4一般指X和Y相互对立,但针对同一实体.关系:置信区间与假设检验之间的关系:未知参数的置信水平为1-α的置信区间与显著水平为α的接受域相同.定义:施行特征函数(OC函数):β(θ)=Pθ(接受H0).功效函数:1-β(θ).功效:当θ*∈H1时,1-β(θ*)的值.。

概率论与数理统计知识点简述

概率论与数理统计知识点简述

概率论与数理统计知识点简述
概率论与数理统计是数学中重要的分支,其主要研究内容包括随机事件的发生概率、随机变量的数字特征、大数定律和中心极限定理、统计推断等。

以下是关于概率论与数理统计的基本知识简述:
1. 概率论的基本概念:随机事件、样本空间、事件之间的关系、概率的定义和计算等。

2. 随机变量及其数字特征:随机变量的定义、表示方法、离散型和连续型随机变量的数字特征 (如均值、方差、协方差等) 的定义和计算。

3. 大数定律和中心极限定理:大数定律描述了频率的稳定性,中心极限定理则证明了在一定条件下,样本平均值的分布趋近于正态分布。

4. 统计推断:统计推断是通过对样本数据的分析来推断总体的数据特征,包括假设检验、置信区间、假设检验的拒绝域等。

5. 随机变量的相互转换:随机变量的相互转换包括变量的乘积、变量的和、变量的乘积和等,其概率分布可以通过数学计算或特性推断得到。

6. 协方差、方差和协方差矩阵:协方差描述了两个或多个随机变量之间的线性关系,方差则是随机变量的平均值的平方,协方差矩阵描述了两个随机变量之间的线性关系和分布。

这些基本知识是概率论和数理统计的基础,掌握它们可以帮助更好地理解和应用统计学的基本概念和技术。

概率论与数理统计重点笔记

概率论与数理统计重点笔记

概率论与数理统计复习第一章 概率论的基本概念一.基本概念随机试验E:(1)可以在相同的条件下重复地进行;(2)每次试验的可能结果不止一个,并且能事先明确试验的所有可能结果;(3)进行一次试验之前不能确定哪一个结果会出现.样本空间S: E 的所有可能结果组成的集合. 样本点(基本事件):E 的每个结果.随机事件(事件):样本空间S 的子集.必然事件(S):每次试验中一定发生的事件. 不可能事件(Φ):每次试验中一定不会发生的事件.二. 事件间的关系和运算1.A ⊂B(事件B 包含事件A )事件A 发生必然导致事件B 发生.2.A ∪B(和事件)事件A 与B 至少有一个发生.3. A ∩B=AB(积事件)事件A 与B 同时发生.4. A -B(差事件)事件A 发生而B 不发生.5. AB=Φ (A 与B 互不相容或互斥)事件A 与B 不能同时发生.6. AB=Φ且A ∪B=S (A 与B 互为逆事件或对立事件)表示一次试验中A 与B 必有一个且仅有一个发生. B=A, A=B .运算规则 交换律 结合律 分配律 德•摩根律 B A B A = B A B A =三. 概率的定义与性质1.定义 对于E 的每一事件A 赋予一个实数,记为P(A),称为事件A 的概率.(1)非负性 P(A)≥0 ; (2)归一性或规范性 P(S)=1 ;(3)可列可加性 对于两两互不相容的事件A 1,A 2,…(A i A j =φ, i ≠j, i,j=1,2,…),P(A 1∪A 2∪…)=P( A 1)+P(A 2)+…2.性质(1) P(Φ) = 0 , 注意: A P(A)=0 .(2)有限可加性 对于n 个两两互不相容的事件A 1,A 2,…,A n ,P(A 1∪A 2∪…∪A n )=P(A 1)+P(A 2)+…+P(A n ) (有限可加性与可列可加性合称加法定理)(3)若A ⊂B, 则P(A)≤P(B), P(B -A)=P(B)-P(A) .(4)对于任一事件A, P(A)≤1, P(A)=1-P(A) .(5)广义加法定理 对于任意二事件A,B ,P(A ∪B)=P(A)+P(B)-P(AB) .对于任意n 个事件A 1,A 2,…,A n()()()()+∑+∑-∑=≤<<≤≤<≤=n k j i k j i n j i j i n i i n A A A P A A P A P A A A P 11121 …+(-1)n-1P(A 1A 2…A n )四.等可能(古典)概型1.定义 如果试验E 满足:(1)样本空间的元素只有有限个,即S={e 1,e 2,…,e n };(2)每一个基本事件的概率相等,即P(e 1)=P(e 2)=…= P(e n ).则称试验E 所对应的概率模型为等可能(古典)概型.2.计算公式 P(A)=k / n 其中k 是A 中包含的基本事件数, n 是S 中包含的基本事件总数.五.条件概率1.定义 事件A 发生的条件下事件B 发生的条件概率P(B|A)=P(AB) / P(A) ( P(A)>0).2.乘法定理 P(AB)=P(A) P (B|A) (P(A)>0); P(AB)=P(B) P (A|B) (P(B)>0).P(A 1A 2…A n )=P(A 1)P(A 2|A 1)P(A 3|A 1A 2)…P(A n |A 1A 2…A n-1) (n ≥2, P(A 1A 2…A n-1) > 0)3. B 1,B 2,…,B n 是样本空间S 的一个划分(B i B j =φ,i ≠j,i,j=1,2,…,n, B 1∪B 2∪…∪B n =S) ,则当P(B i )>0时,有全概率公式 P(A)=()()i ni i B A P B P ∑=1当P(A)>0, P(B i )>0时,有贝叶斯公式P (B i |A)=()()()()()()∑==n i i i i i i B A P B P B A P B P A P AB P 1. 六.事件的独立性1.两个事件A,B,满足P(AB) = P(A) P(B)时,称A,B 为相互独立的事件.(1)两个事件A,B 相互独立⇔ P(B)= P (B|A) .(2)若A 与B ,A 与B ,A 与B, ,A 与B 中有一对相互独立,则另外三对也相互独立.2.三个事件A,B,C 满足P(AB) =P(A) P(B), P(AC)= P(A) P(C), P(BC)= P(B) P(C),称A,B,C 三事件两两相互独立. 若再满足P(ABC) =P(A) P(B) P(C),则称A,B,C 三事件相互独立.3.n 个事件A 1,A 2,…,A n ,如果对任意k (1<k ≤n),任意1≤i 1<i 2<…<i k ≤n.有()()()()k k i i i i i i A P A P A P A A A P 2121=,则称这n 个事件A 1,A 2,…,A n 相互独立.第二章 随机变量及其概率分布一.随机变量及其分布函数1.在随机试验E 的样本空间S={e}上定义的单值实值函数X=X (e)称为随机变量.2.随机变量X 的分布函数F(x)=P{X ≤x} , x 是任意实数. 其性质为:(1)0≤F(x)≤1 ,F(-∞)=0,F(∞)=1. (2)F(x)单调不减,即若x 1<x 2 ,则 F(x 1)≤F(x 2).(3)F(x)右连续,即F(x+0)=F(x). (4)P{x 1<X≤x 2}=F(x 2)-F(x 1).二.离散型随机变量 (只能取有限个或可列无限多个值的随机变量)1.离散型随机变量的分布律 P{X= x k }= p k (k=1,2,…) 也可以列表表示. 其性质为:(1)非负性 0≤P k ≤1 ; (2)归一性 11=∑∞=k k p .2.离散型随机变量的分布函数 F(x)=∑≤xX k k P 为阶梯函数,它在x=x k (k=1,2,…)处具有跳跃点,其跳跃值为p k =P{X=x k } .3.三种重要的离散型随机变量的分布(1)X~(0-1)分布 P{X=1}= p ,P{X=0}=1–p (0<p<1) .(2)X~b(n,p)参数为n,p 的二项分布P{X=k}=()k n k p p k n --⎪⎪⎭⎫ ⎝⎛1(k=0,1,2,…,n) (0<p<1) (3))X~π(λ)参数为λ的泊松分布 P{X=k}=λλ-e k k !(k=0,1,2,…) (λ>0) 三.连续型随机变量1.定义 如果随机变量X 的分布函数F(x)可以表示成某一非负函数f(x)的积分F(x)=()dt t f x⎰∞-,-∞< x <∞,则称X 为连续型随机变量,其中f (x)称为X 的概率密度(函数).2.概率密度的性质(1)非负性 f(x)≥0 ; (2)归一性 ⎰∞∞-dx x f )(=1 ;(3) P{x 1<X ≤x 2}=⎰21)(x x dx x f ; (4)若f (x)在点x 处连续,则f (x)=F / (x) .注意:连续型随机变量X 取任一指定实数值a 的概率为零,即P{X= a}=0 .3.三种重要的连续型随机变量的分布(1)X ~U (a,b) 区间(a,b)上的均匀分布 ⎩⎨⎧=-0)(1a b x f 其它b x a << . (2)X 服从参数为θ的指数分布.()⎩⎨⎧=-0/1θθx e x f 00≤>x x 若若 (θ>0). (3)X~N (μ,σ2 )参数为μ,σ的正态分布 222)(21)(σμσπ--=x e x f -∞<x<∞, σ>0.特别, μ=0, σ2 =1时,称X 服从标准正态分布,记为X~N (0,1),其概率密度2221)(x e x -=πϕ , 标准正态分布函数 ⎰=Φ∞--x t dt e x 2221)(π , Φ(-x)=1-Φ(x) .若X ~N ((μ,σ2), 则Z=σμ-X ~N (0,1), P{x 1<X ≤x 2}=Φ(σμ-2x )-Φ(σμ-1x ).若P{Z>z α}= P{Z<-z α}= P{|Z|>z α/2}= α,则点z α,-z α, ±z α/ 2分别称为标准正态分布的上,下,双侧α分位点. 注意:Φ(z α)=1-α , z 1- α= -z α.四.随机变量X 的函数Y= g (X)的分布1.离散型随机变量的函数若g(x k ) (k=1,2,…)的值全不相等,则由上表立得Y=g(X)的分布律.若g(x k ) (k=1,2,…)的值有相等的,则应将相等的值的概率相加,才能得到Y=g(X)的分布律.2.连续型随机变量的函数若X 的概率密度为f X (x),则求其函数Y=g(X)的概率密度f Y (y)常用两种方法:(1)分布函数法 先求Y 的分布函数F Y (y)=P{Y ≤y}=P{g(X)≤y}=()()dx x f k y X k∑⎰∆其中Δk (y)是与g(X)≤y 对应的X 的可能值x 所在的区间(可能不只一个),然后对y 求导即得f Y (y)=F Y /(y) .(2)公式法 若g(x)处处可导,且恒有g /(x)>0 (或g / (x)<0 ),则Y=g (X)是连续型随机变量,其概率密度为 ()()()()⎩⎨⎧'=0y h y h f y f X Y 其它βα<<y 其中h(y)是g(x)的反函数 , α= min (g (-∞),g (∞)) β= max (g (-∞),g (∞)) .如果f (x)在有限区间[a,b]以外等于零,则 α= min (g (a),g (b)) β= max (g (a),g (b)) .第三章 二维随机变量及其概率分布一.二维随机变量与联合分布函数1.定义 若X 和Y 是定义在样本空间S 上的两个随机变量,则由它们所组成的向量(X,Y)称为二维随机向量或二维随机变量.对任意实数x,y,二元函数F(x,y)=P{X ≤x,Y ≤y}称为(X,Y)的(X 和Y 的联合)分布函数.2.分布函数的性质(1)F(x,y)分别关于x 和y 单调不减.(2)0≤F(x,y)≤1 , F(x,- ∞)=0, F(-∞,y)=0, F(-∞,-∞)=0, F(∞,∞)=1 .(3) F(x,y)关于每个变量都是右连续的,即 F(x+0,y)= F(x,y), F(x,y+0)= F(x,y) .(4)对于任意实数x 1<x 2 , y 1<y 2P{x 1<X ≤x 2 , y 1<Y ≤y 2}= F(x 2,y 2)- F(x 2,y 1)- F(x 1,y 2)+ F(x 1,y 1)二.二维离散型随机变量及其联合分布律1.定义 若随机变量(X,Y)只能取有限对或可列无限多对值(x i ,y j ) (i ,j =1,2,… )称(X,Y)为二维离散型随机变量.并称P{X= x i ,Y= y j }= p i j 为(X,Y)的联合分布律.也可列表表示.2.性质 (1)非负性 0≤p i j ≤1 .(2)归一性 ∑∑=i j ij p 1 .3. (X,Y)的(X 和Y 的联合)分布函数F(x,y)=∑∑≤≤x x y y ij i j p三.二维连续型随机变量及其联合概率密度1.定义 如果存在非负的函数f (x,y),使对任意的x 和y,有F(x,y)=⎰⎰∞-∞-y xdudv v u f ),( 则称(X,Y)为二维连续型随机变量,称f(x,y)为(X,Y)的(X 和Y 的联合)概率密度.2.性质 (1)非负性 f (x,y)≥0 . (2)归一性 1),(=⎰⎰∞∞-∞∞-dxdy y x f . (3)若f (x,y)在点(x,y)连续,则yx y x F y x f ∂∂∂=),(),(2 (4)若G 为xoy 平面上一个区域,则⎰⎰=∈Gdxdy y x f G y x P ),(}),{(.四.边缘分布1. (X,Y)关于X 的边缘分布函数 F X (x) = P{X ≤x , Y<∞}= F (x , ∞) .(X,Y)关于Y 的边缘分布函数 F Y (y) = P{X<∞, Y ≤y}= F (∞,y)2.二维离散型随机变量(X,Y)关于X 的边缘分布律 P{X= x i }= ∑∞=1j ij p = p i · ( i =1,2,…) 归一性 11=∑∞=•i i p .关于Y 的边缘分布律 P{Y= y j }= ∑∞=1i ij p = p ·j ( j =1,2,…) 归一性 11=∑∞=•j j p .3.二维连续型随机变量(X,Y)关于X 的边缘概率密度f X (x)=⎰∞∞-dy y x f ),( 归一性1)(=⎰∞∞-dx x f X关于Y 的边缘概率密度f Y (y)=x d y x f ⎰∞∞-),( 归一性1)(=⎰∞∞-dyy f Y五.相互独立的随机变量1.定义 若对一切实数x,y,均有F(x,y)= F X (x) F Y (y) ,则称X 和Y 相互独立.2.离散型随机变量X 和Y 相互独立⇔p i j = p i ··p ·j ( i ,j =1,2,…)对一切x i ,y j 成立.3.连续型随机变量X 和Y 相互独立⇔f (x,y)=f X (x)f Y (y)对(X,Y)所有可能取值(x,y)都成立.六.条件分布1.二维离散型随机变量的条件分布定义 设(X,Y)是二维离散型随机变量,对于固定的j,若P{Y=y j }>0,则称 },{j i j i p y Y x X P ==P{X=x i |Y=y j }为在Y= y j 条件下随机变量X 的条件分布律.同样,对于固定的i,若P{X=x i }>0,则称P{Y=y j |X=x i } 为在X=x i 条件下随机变量Y 的条件分布律.第四章 随机变量的数字特征一.数学期望和方差的定义随机变量X离散型随机变量 连续型随机变量 分布律P{X=x i }= p i ( i =1,2,…) 概率密度f (x)数学期望(均值)E(X) ∑∞=1i i i p x (级数绝对收敛)⎰∞∞-dx x xf )((积分绝对收敛) 方差D(X)=E{[X-E(X)]2} []∑-∞=12)(i i i p X E x ⎰-∞∞-dx x f X E x )()]([2 =E(X 2)-[E(X)]2 (级数绝对收敛) (积分绝对收敛) 函数数学期望E(Y)=E[g(X)] i i i p x g ∑∞=1)((级数绝对收敛) ⎰∞∞-dx x f x g )()((积分绝对收敛)标准差σ(X)=√D(X) .二.数学期望与方差的性质1. c 为为任意常数时, E(c) = c , E(cX) = cE(X) , D(c) = 0 , D (cX) = c 2 D(X) .2.X,Y 为任意随机变量时, E (X ±Y)=E(X)±E(Y) .3. X 与Y 相互独立时, E(XY)=E(X)E(Y) , D(X ±Y)=D(X)+D(Y) .4. D(X) = 0 ⇔ P{X = C}=1 ,C 为常数.三.六种重要分布的数学期望和方差 E(X) D(X)1.X~ (0-1)分布P{X=1}= p (0<p<1) p p (1- p),}{},{•=====i j i i j i p p x X P y Y x X P2.X~ b (n,p) (0<p<1) n p n p (1- p)3.X~ π(λ) λ λ4.X~ U(a,b) (a+b)/2 (b-a) 2/125.X 服从参数为θ的指数分布 θ θ26.X~ N (μ,σ2) μ σ2四.矩的概念随机变量X 的k 阶(原点)矩E(X k ) k=1,2,…随机变量X 的k 阶中心矩E{[X-E(X)] k }随机变量X 和Y 的k+l 阶混合矩E(X k Y l ) l=1,2,…随机变量X 和Y 的k+l 阶混合中心矩E{[X-E(X)] k [Y-E(Y)] l }第六章 样本和抽样分布一.基本概念总体X 即随机变量X ; 样本X 1 ,X 2 ,…,X n 是与总体同分布且相互独立的随机变量;样本值x 1 ,x 2 ,…,x n 为实数;n 是样本容量.统计量是指样本的不含任何未知参数的连续函数.如: 样本均值∑==n i i X n X 11 样本方差()∑--==n i i X X n S 12211 样本标准差S 样本k 阶矩∑==n i k i k X n A 11( k=1,2,…) 样本k 阶中心矩∑-==n i k i k X X n B 1)(1( k=1,2,…) 二.抽样分布 即统计量的分布 1.X 的分布 不论总体X 服从什么分布, E (X ) = E(X) , D (X ) = D(X) / n .特别,若X~ N (μ,σ2 ) ,则X ~ N (μ, σ2 /n) . 2.χ2分布 (1)定义 若X ~N (0,1 ) ,则Y =∑=ni i X 12~ χ2(n)自由度为n 的χ2分布.(2)性质 ①若Y~ χ2(n),则E(Y) = n , D(Y) = 2n .②若Y 1~ χ2(n 1) Y 2~ χ2(n 2) ,则Y 1+Y 2~ χ2(n 1 + n 2).③若X~ N (μ,σ2 ), 则22)1(σS n -~ χ2(n-1),且X 与S 2相互独立.(3)分位点 若Y~ χ2(n),0< α <1 ,则满足αχχχχαααα=<>=<=>--))}(())({()}({)}({22/122/212n Y n Y P n Y P n Y P的点)()(),(),(22/122/212n n n n ααααχχχχ--和分别称为χ2分布的上、下、双侧α分位点.3. t 分布(1)定义 若X~N (0,1 ),Y~ χ2(n),且X,Y 相互独立,则t=n Y X ~t(n)自由度为n 的t 分布. (2)性质①n →∞时,t 分布的极限为标准正态分布.②X ~N (μ,σ2 )时,n S X μ-~ t (n-1) . ③两个正态总体 相互独立的样本 样本均值 样本方差X~ N (μ1,σ12 ) 且σ12=σ22=σ2 X 1 ,X 2 ,…,X n1 X S 12Y~ N (μ2,σ22 ) Y 1 ,Y 2 ,…,Y n2 Y S 22则 212111)()(n n S Y X w +---μμ~ t (n 1+n 2-2) , 其中 2)1()1(212222112-+-+-=n n S n S n S w (3)分位点 若t ~ t (n) ,0 < α<1 , 则满足αααα=>=-<=>)}({)}({)}({2/n t t P n t t P n t t P的点)(),(),(2/n t n t n t ααα±-分别称t 分布的上、下、双侧α分位点.注意: t 1- α (n) = - t α (n).4.F 分布 (1)定义 若U~χ2(n 1), V~ χ2(n 2), 且U,V 相互独立,则F =21n V n U ~F(n 1,n 2)自由度为(n 1,n 2)的F 分布.(2)性质(条件同3.(2)③) 22212221σσS S ~F(n 1-1,n 2-1)(3)分位点 若F~ F(n 1,n 2) ,0< α <1,则满足)},({)},({21121n n F F P n n F F P αα-<=>ααα=<>=-))},(()),({(212/1212/n n F F n n F F P的点),(),(),,(),,(212/1212/21121n n F n n F n n F n n F αααα--和分别称为F 分布的上、下、双侧α分位点. 注意: .).(1),(12211n n F n n F αα=-第七章 参数估计一.点估计 总体X 的分布中有k 个待估参数θ1, θ2,…, θk .X 1 ,X 2 ,…,X n 是X 的一个样本, x 1 ,x 2 ,…,x n 是样本值.1.矩估计法先求总体矩⎪⎩⎪⎨⎧===),,,(),,,(),,,(2121222111k k k k k θθθμμθθθμμθθθμμ 解此方程组,得到⎪⎩⎪⎨⎧===),,,(),,,(),,,(2121222111kk k k k μμμθθμμμθθμμμθθ ,以样本矩A l 取代总体矩μ l ( l=1,2,…,k)得到矩估计量⎪⎪⎩⎪⎪⎨⎧===∧∧∧),,,(),,,(),,,(2121222111k k k k k A A A A A A A A A θθθθθθ,若代入样本值则得到矩估计值.2.最大似然估计法若总体分布形式(可以是分布律或概率密度)为p(x, θ1, θ2,…, θk ),称样本X 1 ,X 2 ,…,X n 的联合分布∏==ni k i k x p L 12121),,,,(),,,(θθθθθθ 为似然函数.取使似然函数达到最大值的∧∧∧k θθθ,,,21 ,称为参数θ1, θ2,…,θk 的最大似然估计值,代入样本得到最大似然估计量.若L(θ1, θ2,…, θk )关于θ1, θ2,…, θk 可微,则一般可由似然方程组 0=∂∂i L θ 或 对数似然方程组 0ln =∂∂iL θ (i =1,2,…,k) 求出最大似然估计. 3.估计量的标准(1) 无偏性 若E(∧θ)=θ,则估计量∧θ称为参数θ的无偏估计量.不论总体X 服从什么分布, E (X )= E(X) , E(S 2)=D(X), E(A k )=μk =E(X k ),即样本均值X , 样本方差S 2,样本k 阶矩A k 分别是总体均值E(X),方差D(X),总体k 阶矩μk 的无偏估计,(2)有效性 若E(∧θ1 )=E(∧θ2)= θ, 而D(∧θ1)< D(∧θ2), 则称估计量∧θ1比∧θ2有效.(3)一致性(相合性) 若n →∞时,θθP →∧,则称估计量∧θ是参数θ的相合估计量.二.区间估计1.求参数θ的置信水平为1-α的双侧置信区间的步骤(1)寻找样本函数W=W(X 1 ,X 2 ,…,X n ,θ),其中只有一个待估参数θ未知,且其分布完全确定.(2)利用双侧α分位点找出W 的区间(a,b),使P{a<W <b}=1-α.(3)由不等式a<W<b 解出θθθ<<则区间(θθ,)为所求.2.单个正态总体待估参数 其它参数 W 及其分布 置信区间 μ σ2已知 n X σμ-~N (0,1) (2/ασz n X ±) μ σ2未知n S X μ-~ t (n-1) )1((2/-±n t n S X α σ2 μ未知22)1(σS n -~ χ2(n-1) ))1()1(,)1()1((22/1222/2-----n S n n S n ααχχ 3.两个正态总体(1)均值差μ 1-μ 2 其它参数 W 及其分布 置信区间已知2221,σσ 22212121)(n n Y X σσμμ+--- ~ N(0,1) )(2221212n n z Y X σσα+±-未知22221σσσ== 212111)(n n S Y X w +---μμ~t(n 1+n 2-2) )11)2((21212n n S n n t Y X w +-+±-α 其中S w 等符号的意义见第六章二. 3 (2)③. (2) μ 1,μ 2未知, W=22212221σσS S ~ F(n 1-1,n 2-1),方差比σ12/σ22的置信区间为 ))1,1(1,)1,1(1(212/12221212/2221----⋅-n n F S S n n F S S αα 注意:对于单侧置信区间,只需将以上所列的双侧置信区间中的上(下)限中的下标α/2改为α,另外的下(上)限取为-∞ (∞)即可.。

概率论与数理统计:5_1大数定律

概率论与数理统计:5_1大数定律
则对于任意实数 > 0,
P(X ) E(X )
证 仅证连续型 r.v.的情形
P( X
)
f
(x)dx
x
f
(x)dx
1
0
xf
(x)dx
E(X
)
推论 1 ——马尔可夫 ( Markov ) 不等式
设随机变量 X 的k阶绝对原点矩 E( |X |k)
存在,则对于任意实数 > 0,
P(|
X
|
由 Chebyshev 不等式, = 0.01n ,故
P|

X
0.75n
|
0.01n
1
0.1875n (0.01n)2
1
0.1875n (0.01n)2
0.90
解得 n 18750
大数定律
贝努里(Bernoulli) 大数定律
设 nA 是 n 次独立重复试验中事件 A 发生 的次数, p 是每次试验中 A 发生的概率, 则 0 有
lim P
n
1 n
n k 1
Xk
0

lim P
n
1 n
n k 1
Xk
1
定理的意义
具有相同数学期望和方差的独立 r.v.序列的 算术平均值依概率收敛于数学期望.
当 n 足够大时, 算术平均值几乎是一常数.
数学 期望
可被
算术 均值
近似代替
注1 X1, X 2,, X n , 不一定有相同的数学 期望与方差,可设
P940
X
1060
1059
Ck 6000
k 941
1 6
k
5 6
6000k

概率论与数理统计第五章

概率论与数理统计第五章

第 ×× 次课 2学时本次课教学重点:常用的统计量 本次课教学难点:总体,简单随机样本,统计量的概念。

本次课教学内容:第五章 数理统计的基础知识 第一节 数理统计的基本概念 教学组织: 一、引言在前五章中我们学习了概率论的基本内容,因为随机变量及其所伴随的概率分布全面描述了随机现象的统计规律性,所以在概率论的许多问题中,概率分布通常都是已知的,或者假设是已知的,而一切计算与推理都是在此基础上得出来的。

然而,实际情况往往并非如此。

一个随机现象所服从的分布概型可能完全不知道,或者只知道其概型而不知其分布函数中所含的参数。

例如,某工厂生产的灯泡的寿命服从什么分布是不知道的。

再如,某厂生产的一件产品是合格品还是不合格品,我们知道它服从两点分布,但其参数p 却不知道。

那么怎样才能知道一个随机现象的分布或其参数呢?这就是数理统计所要解决的一个首要问题。

为了获得灯泡的寿命分布,我们从所有的灯泡中抽出一部分进行观察与测试以取得相关信息,从而做出推断。

由于观察和测试是随机现象,依据有限个观察与测试对整体所做出的推断不可能绝对准确,这个不确定性我们用概率来表达。

数理统计学的基本问题就是依据观测或试验所取得的有限信息对整体做出推断,每个推断必须伴有一定的概率来表明其可靠程度。

这种伴有一定概率的推断称为统计推断。

二、总体与随机样本 1、总体在数理统计中,我们往往研究有关对象的某一数量指标(如灯泡的寿命这一数量指标)。

为此,考虑与这一数量指标相联系的随机试验,对这一数量指标进行试验或观察。

我们把研究对象的全体所构成的一个集合称为总体,总体中的每个对象称为个体。

总体中所包含的个体的个数称为总体的容量。

容量有限的总体称为有限总体,容量无限的总体称为无限总体。

例如,考察某批灯泡的质量,如这一批灯泡共有5000只,每个灯泡的寿命是一个可能的观察值,是一个个体。

所有5000只灯泡的寿命是一个有限总体。

概率论与数理统计PPT课件

概率论与数理统计PPT课件
24
例6: (抽签问题)一袋中有a个红球,b个白球,记a+b=n. 设每次摸到各球的概率相等,每次从袋中摸一球, 不放回地摸n次。 设 { 第k次摸到红球 },k=1,2,…,n.求 解1:
号球为红球,将n个人也编号为1,2,…,n.
----------与k无关
可设想将n个球进行编号: 其中
18
性质:
19
§4 等可能概型(古典概型)
定义:若试验E满足:S中样本点有限(有限性)出现每一样本点的概率相等(等可能性)
称这种试验为等可能概型(或古典概型)。
20
例1:一袋中有8个球,编号为1-8,其中1-3 号为红球,4-8号为黄球,设摸到每一 球的可能性相等,从中随机摸一球, 记A={ 摸到红球 },求P(A).
31
三、全概率公式与Bayes公式
定义:设S为试验E的样本空间,B1,B2,…,Bn 为E的一组事件。若: 则称B1,B2,…,Bn为S的一个划分,或称为一组完备事件组。
即:B1,B2,…,Bn至少有一发生是必然的,两两同时发生又是不可能的。
32
定理:设试验E的样本空间为S,A为E的事件。B1,B2,…,Bn为S的一个划分,P(Bi)>0,i=1,2,…,n; 则称:
试验序号
n =5
n =50
n =500
nH
fn(H)
nH
fn(H)
nH
fn(H)
12345678910
2315124233
0.40.60.21.00.20.40.80.40.60.6
22252125242118242731
0.440.500.420.500.480.420.360.480.540.62
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第 五章
数理统计的基本概念 与 抽样分布
5.1 基本概念
一、总体与个体 二、随机样本的定义 三、统计量 四、小结
一、总体与个体
一个统计问题总有它明确的研究对象.
研究对象的全体称为总体(母体),
总体中每个成员称为个体.
总体
研究某批灯泡的质量
总体 …
考察国产 轿车的质量
然而在统计研究中,人们往往关心每个 个体的一项(或几项)数量指标和该数量指标 在总体中的分布情况. 这时,每个个体具有 的数量指标的全体就是总体.
例1 设总体 服从参数为 ( 0) 的指数分
布, (1,2 ,L ,n ) 是来自总体的样本, 求样本
(1,

2 ,L ,n ) 的概率密度.
总体 的概率密度为p(
x)

e

x
,
x0
0,
x0
因为1,2,L ,n 相互独立, 且与 有相同的分布,
所以 (
灯泡的寿命
国产轿车每公里 的耗油量
该批灯泡寿命的 全体就是总体
所有国产轿车每公里耗 油量的全体就是总体
由于每个个体的出现带有随机性,即相应的 数量指标值的出现带有随机性。从而可把此种 数量指标看作随机变量,我们用一个随机变量 或其分布来描述总体。为此常用随机变量的符 号或分布的符号来表示总体。
通常,我们用随机变量 ,,,…, 等表示总 体。当我们说到总体,就是指一个具有确定概 率分布的随机变量。
D

D(
1 n
i )

1 n2
Di

1 n2

2

1 n

2
i 1
i 1
i 1
(3)
E ( S n2
)

E[
1 n
n
i2
2]

1 n
n
E(i2 ) E 2
i 1
i 1
n
1n (Di (Ei )2 ) (D (E )2 )
i 1
n

pn (x1,
1,2
x2 ,
,L
, xn
,
)
n

)的概率密度为
n
p(xi )


ne

n

i 1
xi
,
i 1
0,
xi 0 其它
例2 设总体 服从两点分布 B(1, p), 其中0 p 1, (1,2 ,L ,n )是来自总体的样本, 求样本 (1,2,L ,n )
容量为n的样本可以看作n维随机变量.但 是,一旦取定一组样本,得到的是n个具体的数
(x1, x2 , , xn ) ,称此为样本的一次观察值,源自 称样本值.2. 简单随机样本
抽取样本的目的是为 了利用样本对总体进行统 计推断,这就要求样本能很 好的反映总体的特性且便 于处理.为此,需对抽样提 出一些要求,通常有两条:
称函数
0,
Fn
(
x
)


k n
,
1,
x x(1) , x(k ) x x(k1) , x x(n) .
为总体的经验分布函数.换句话说, 对任何
实数x, 经验分布函数 Fn (x) 为样本值中不超 过x的个数再除以n, 即
Fn ( x)

1 n
S (x),
( x )
1 n
(
2

2)

(
1 n

2

2)

n1 n
2
i 1
(4)
E(Sn*2 )

E(
n n1
Sn2 )

n n1
E(Sn2 )

2
性质5.2
若总体 的k 阶矩 E( k ) 记成 k存在, 则当n 时, Ak Pk , k 1, 2,L .
证明 因为 1,2,L ,n 独立且与 同分布,
个统计量,统计量的分布称为抽样分布。
设 x1, x2 ,L , xn 是相应于样本1,2 ,L ,n
的样本值, 则称 f (x1, x2 ,L , xn ) 是 f (1,2 ,L ,n )
的观察值.
例1

X
1
,
X
2
,
X
是来自总体
3
N
(

,
2
)的


样本, 其中 为已知, 2 为未知, 判断下列各式哪
E[Fn (x)] F(x), D[Fn (x)]
n
(3) Fn (x)依概率收敛于F(x).即
的分布律.
解 总体 的分布律为
P{ i} pi (1 p)1i (i 0, 1)
因为 1,2 ,L ,n相互独立, 且与 有相同的分布,
所以 (1,2,L ,n ) 的分布律为
P{1 x1, 2 x2 , L , n xn }
P{1 x1}P{ 2 x2}L P{n xn }
所以 1k ,2k ,L ,nk 独立且与 k 同分布,
故有
E (1k
)

E
(
k 2
)

L

E
(
k n
)

E(
k
)


k
.
再根据第四章辛钦定理知
1
n
n
ik
i 1
Pk
,
k 1, 2, L ;
由第四章关于依概率收敛的序列的性质知
g( A1, A2, , Ak ) P g(1,2, ,k ),
1. 代表性:母体的每一个体有同等机会被选入 子样.
2. 独立性:子样的分样 是相互独立的随机变量.
满足上述两条性质的样本称为简单随机样本.
获得简单随机样本的抽样方法称为简单随机抽 样.
为了使大家对总体和样本有一个明确的 概念,我们给出如下定义:
定义5.1 一个随机变量 或其相应的分布 函数F(x)称为一个总体.
(1,2,L ,n )为来自总体X的样本,则有 :
(1) E ;
(2)
D

1 n

2;
(3)
E(Sn2 )

n1
n
2;
(4) E(Sn*2 ) 2.
证明
n
n
n
(1)
E

E
(
1 n
i )

1 n
Ei

1 n

i 1
i 1
i 1
n
n
n
(2)
n
n
xi
n xi
pi1 (1 p) i1
其中 x1, x2, , xn 在集合{0,1}中取值.
三、统计量
由样本推断总体特征,需要对样本值进行 “加工”,“提炼”.这就需要构造一些样本的 函数,它把样本中所含的信息集中起来.
定义5.3. 统计量
设1,2 ,L ,n 是来自总体 的一个样本, f (1,2 ,L ,n ) 是1,2 ,L ,n 的函数, 若 f 不依 赖于任何未知参数 , 则称 f (1,2 ,L ,n ) 是一
x1, x2,L , xn 是这一样本的观察值.
它反映了总体均值
(1)子样均值


1 n
n
i ;
i 1
的信息
其观察值
1n x n i1 xi .
它反映了总体方差 的信息
(2)子样方差
S
2 n

1 n
n i 1
(i
)2

1 n

n i1
i2

n
2

p(n) ( x)

n
n
x n 1 ,
0,
0 x
其他
4. 经验分布函数
定义5.5
设 1,2 ,L
,

是总体
n

的一个样本,
((1) ,(2) ,L ,(n) ) 是(1,2 ,L ,n ).的次序统计量
( x(1) , x(2) , x(n) )为其观测值, 设x是任一实数,
.
(3) 子样的k 阶(原点)矩
k
1 n
n
ik , k 1, 2, L
i 1
;
(4)子样的 k 阶中心矩
mk
1 n
n
(i )k
i 1
,k
2, 3, L
;
其观察值
bk
1n n i1 ( xi

x)k
,k
2, 3,
.
样本矩具有下列性质:
性质5.1设总体的期望E ,方差D 2,
定义5.2 设是具有分布函数 F (x)的随机变量,
若1,2, L , n 是具有同一分布函数 F (x)、 相互独立的随机变量, 则称 1, 2,L , n 为 从总体 (或总体 F (x)) 中抽取的容量为 n
的简单随机样本, 简称样本.
它们的观察值 x1, x2, L , xn 称为样本值,
如:研究某批灯泡的寿命时,我们关心的数 量指标就是寿命,那么,此总体就可以用随 机变量X表示,或用其分布函数F(x)表示.
总体
寿命 可用一概 F(x) 率分布来刻划
某批 灯泡的寿命
因此, 在统计学中,总体这 个概念的要旨是:
总体就是一个概率分布.
有限总体和无限总体
实例 某工厂10月份生产的灯泡寿命所组成的 总体中, 个体的总数就是10月份生产的灯泡数, 这是一个有限总体; 而该工厂生产的所有灯泡寿 命所组成的总体可近似地看成一个无限总体, 它 包括以往生产和今后生产的灯泡寿命.
相关文档
最新文档