《概率论与数理统计》笔记
概率论与数理统计复习笔记
概率论与数理统计复习第一章概率论的基本概念一.基本概念随机试验E:(1)可以在相同的条件下重复地进行;(2)每次试验的可能结果不止一个,并且能事先明确试验的所有可能结果;(3)进行一次试验之前不能确定哪一个结果会出现.样本空间S: E的所有可能结果组成的集合. 样本点(基本事件):E的每个结果.随机事件(事件):样本空间S的子集.必然事件(S):每次试验中一定发生的事件. 不可能事件():每次试验中一定不会发生的事件.二. 事件间的关系和运算(事件B包含事件A )事件A发生必然导致事件B发生.∪B(和事件)事件A与B至少有一个发生.3. A∩B=AB(积事件)事件A与B同时发生.4. A-B(差事件)事件A 发生而B 不发生.5. AB= (A 与B 互不相容或互斥)事件A 与B 不能同时发生.6. AB=且A ∪B=S (A 与B 互为逆事件或对立事件)表示一次试验中A 与B 必有一个且仅有一个发生. B=A, A=B .运算规则 交换律 结合律 分配律 德摩根律 B A B A = B A B A =三. 概率的定义与性质1.定义 对于E 的每一事件A 赋予一个实数,记为P(A),称为事件A 的概率.(1)非负性 P(A)≥0 ; (2)归一性或规范性 P(S)=1 ;(3)可列可加性 对于两两互不相容的事件A 1,A 2,…(A i A j =φ, i ≠j, i,j=1,2,…),P(A 1∪A 2∪…)=P( A 1)+P(A 2)+…2.性质(1) P() = 0 , 注意: A 为不可能事件(2)有限可加性对于n个两两互不相容的事件A1,A2,…,An,P(A1∪A2∪…∪An)=P(A1)+P(A2)+…+P(An) (有限可加性与可列可加性合称加法定理)(3)若A B, 则P(A)≤P(B), P(B-A)=P(B)-P(A) .(4)对于任一事件A, P(A)≤1, P(A)=1-P(A) .(5)广义加法定理对于任意二事件A,B ,P(A∪B)=P(A)+P(B)-P(AB) .对于任意n个事件A1,A2,…,An…+(-1)n-1P(A1A2…An)四.等可能(古典)概型1.定义如果试验E满足:(1)样本空间的元素只有有限个,即S={e1,e2,…,en};(2)每一个基本事件的概率相等,即P(e1)=P(e2)=…= P(en).则称试验E所对应的概率模型为等可能(古典)概型.2.计算公式 P(A)=k / n 其中k是A中包含的基本事件数, n是S中包含的基本事件总数.五.条件概率1.定义 事件A 发生的条件下事件B 发生的条件概率P(B|A)=P(AB) / P(A) ( P(A)>0).2.乘法定理 P(AB)=P(A) P (B|A) (P(A)>0); P(AB)=P(B) P (A|B) (P(B)>0).P(A 1A 2…A n )=P(A 1)P(A 2|A 1)P(A 3|A 1A 2)…P(A n |A 1A 2…A n-1) (n ≥2, P(A 1A 2…A n-1) > 0)3. B 1,B 2,…,B n 是样本空间S 的一个划分(B i B j =φ,i ≠j,i,j=1,2,…,n, B 1∪B 2∪…∪Bn=S) ,则当P(B i )>0时,有全概率公式 P(A)=()()i ni i B A P B P ∑=1当P(A)>0, P(B i)>0时,有贝叶斯公式P (B i|A)=()()()()()()∑==ni i i i i i B A P B P B A P B P A P AB P 1. 六.事件的独立性1.两个事件A,B,满足P(AB) = P(A) P(B)时,称A,B 为相互独立的事件.(1)两个事件A,B 相互独立 P(B)= P (B|A) .(2)若A 与B,A 与B ,A 与B, ,A 与B 中有一对相互独立,则另外三对也相互独立.2.三个事件A,B,C 满足P(AB) =P(A) P(B), P(AC)= P(A) P(C), P(BC)= P(B) P(C),称A,B,C 三事件两两相互独立. 若再满足P(ABC) =P(A) P(B) P(C),则称A,B,C 三事件相互独立.个事件A 1,A 2,…,A n ,如果对任意k (1<k ≤n),任意1≤i 1<i 2<…<i k ≤n.有()()()()kki i i i i i A P A P A P A A A P 2121=,则称这n 个事件A 1,A 2,…,A n 相互独立.第二章 随机变量及其概率分布一.随机变量及其分布函数1.在随机试验E 的样本空间S={e}上定义的单值实值函数X=X (e)称为随机变量.2.随机变量X 的分布函数F(x)=P{X ≤x} , x 是任意实数. 其性质为:(1)0≤F(x)≤1 ,F(-∞)=0,F(∞)=1. (2)F(x)单调不减,即若x 1<x 2 ,则 F(x 1)≤F(x2).(3)F(x)右连续,即F(x+0)=F(x). (4)P{x 1<X≤x 2}=F(x 2)-F(x 1).二.离散型随机变量 (只能取有限个或可列无限多个值的随机变量)1.离散型随机变量的分布律 P{X= x k }= p k (k=1,2,…) 也可以列表表示. 其性质为:(1)非负性 0≤P k ≤1 ; (2)归一性11=∑∞=k k p .2.离散型随机变量的分布函数 F(x)=∑≤xX k k P 为阶梯函数,它在x=x k(k=1,2,…)处具有跳跃点,其跳跃值为p k =P{X=x k } .3.三种重要的离散型随机变量的分布(1)X~(0-1)分布 P{X=1}= p ,P{X=0}=1–p (0<p<1) .(2)X~b(n,p)参数为n,p 的二项分布P{X=k}=()kn k p p k n --⎪⎪⎭⎫ ⎝⎛1(k=0,1,2,…,n) (0<p<1)(3))X~()参数为的泊松分布 P{X=k}=λλ-e k k !(k=0,1,2,…) (>0) 三.连续型随机变量1.定义 如果随机变量X 的分布函数F(x)可以表示成某一非负函数f(x)的积分F(x)=()dt t f x⎰∞-,-∞< x <∞,则称X 为连续型随机变量,其中f (x)称为X 的概率密度(函数).2.概率密度的性质(1)非负性 f(x)≥0 ; (2)归一性 ⎰∞∞-dx x f )(=1 ;(3) P{x 1<X ≤x 2}=⎰21)(xx dx x f ; (4)若f (x)在点x 处连续,则f (x)=F /(x) .注意:连续型随机变量X 取任一指定实数值a 的概率为零,即P{X= a}=0 .3.三种重要的连续型随机变量的分布(1)X ~U (a,b) 区间(a,b)上的均匀分布⎩⎨⎧=-)(1a b x f其它b x a << . (2)X 服从参数为的指数分布.()⎩⎨⎧=-0/1θθx ex f 00≤>x x 若若 (>0).(3)X~N (,2)参数为,的正态分布222)(21)(σμσπ--=x e x f -<x<, >0.特别, =0, 2=1时,称X 服从标准正态分布,记为X~N (0,1),其概率密度2221)(x e x -=πϕ , 标准正态分布函数 ⎰=Φ∞--xt dt e x 2221)(π, (-x)=1-Φ(x) .若X~N ((,2), 则Z=σμ-X~N (0,1), P{x1<X≤x2}=Φ(σμ-2x)-Φ(σμ-1x).若P{Z>z }= P{Z<-z }= P{|Z|>z/2}= ,则点z ,-z , z/ 2分别称为标准正态分布的上,下,双侧分位点. 注意:(z )=1- , z1-= -z .四.随机变量X的函数Y= g (X)的分布1.离散型随机变量的函数若g(xk) (k=1,2,…)的值全不相等,则由上表立得Y=g(X)的分布律.若g(xk) (k=1,2,…)的值有相等的,则应将相等的值的概率相加,才能得到Y=g(X)的分布律.2.连续型随机变量的函数若X的概率密度为fX (x),则求其函数Y=g(X)的概率密度fY(y)常用两种方法:(1)分布函数法先求Y的分布函数FY (y)=P{Y≤y}=P{g(X)≤y}=()()dxxfky Xk∑⎰∆其中Δk(y)是与g(X)≤y对应的X的可能值x所在的区间(可能不只一个),然后对y求导即得fY (y)=FY/(y) .(2)公式法若g(x)处处可导,且恒有g /(x)>0 (或g / (x)<0 ),则Y=g (X)是连续型随机变量,其概率密度为()()()()⎩⎨⎧'=yhyhfyf XY其它βα<<y其中h(y)是g(x)的反函数 , = min (g (-),g ()) = max (g (-),g ()) .如果 f (x)在有限区间[a,b]以外等于零,则 = min (g (a),g (b)) = max (g (a),g (b)) .第三章二维随机变量及其概率分布一.二维随机变量与联合分布函数1.定义若X和Y是定义在样本空间S上的两个随机变量,则由它们所组成的向量(X,Y)称为二维随机向量或二维随机变量.对任意实数x,y,二元函数F(x,y)=P{X≤x,Y≤y}称为(X,Y)的(X和Y的联合)分布函数.2.分布函数的性质(1)F(x,y)分别关于x 和y 单调不减.(2)0≤F(x,y)≤1 , F(x,- )=0, F(-,y)=0, F(-,-)=0, F(,)=1 .(3) F(x,y)关于每个变量都是右连续的,即 F(x+0,y)= F(x,y), F(x,y+0)= F(x,y) .(4)对于任意实数x 1<x 2 , y 1<y 2P{x 1<X ≤x 2 , y 1<Y ≤y 2}= F(x 2,y 2)- F(x 2,y 1)- F(x 1,y 2)+ F(x 1,y 1)二.二维离散型随机变量及其联合分布律1.定义 若随机变量(X,Y)只能取有限对或可列无限多对值(x i ,y j ) (i ,j =1,2,… )称(X,Y)为二维离散型随机变量.并称P{X= x i ,Y= y j }= p i j 为(X,Y)的联合分布律.也可列表表示.2.性质 (1)非负性 0≤p i j ≤1 .(2)归一性 ∑∑=i jijp 1 .3. (X,Y)的(X 和Y 的联合)分布函数F(x,y)=∑∑≤≤x x yy ij i j p三.二维连续型随机变量及其联合概率密度1.定义 如果存在非负的函数 f (x,y),使对任意的x 和y,有F(x,y)=⎰⎰∞-∞-y xdudv v u f ),(则称(X,Y)为二维连续型随机变量,称f(x,y)为(X,Y)的(X 和Y 的联合)概率密度.2.性质 (1)非负性 f (x,y)≥0 . (2)归一性 1),(=⎰⎰∞∞-∞∞-dxdy y x f .(3)若f (x,y)在点(x,y)连续,则yx y x F y x f ∂∂∂=),(),(2 (4)若G 为xoy 平面上一个区域,则⎰⎰=∈Gdxdy y x f G y x P ),(}),{(.四.边缘分布1. (X,Y)关于X 的边缘分布函数 F X (x) = P{X ≤x , Y<}= F (x , ) .(X,Y)关于Y 的边缘分布函数 F Y (y) = P{X<, Y ≤y}= F (,y)2.二维离散型随机变量(X,Y)关于X 的边缘分布律 P{X= x i }=∑∞=1j ij p = p i · ( i =1,2,…) 归一性 11=∑∞=•i i p .关于Y 的边缘分布律 P{Y= y j }=∑∞=1i ij p = p·j( j =1,2,…) 归一性11=∑∞=•j j p .3.二维连续型随机变量(X,Y)关于X的边缘概率密度fX (x)=⎰∞∞-dyyxf),(归一性1)(=⎰∞∞-dxxf X关于Y的边缘概率密度fY (y)=xdyxf⎰∞∞-),(归一性1)(=⎰∞∞-dyyf Y五.相互独立的随机变量1.定义若对一切实数x,y,均有F(x,y)= FX (x) FY(y) ,则称X和Y相互独立.2.离散型随机变量X和Y相互独立⇔p i j= p i··p·j( i ,j =1,2,…)对一切x i,y j成立.3.连续型随机变量X和Y相互独立⇔f (x,y)=f X (x)f Y (y)对(X,Y)所有可能取值(x,y)都成立.六.条件分布1.二维离散型随机变量的条件分布定义设(X,Y)是二维离散型随机变量,对于固定的j,若P{Y=yj}>0,则称P{X=xi |Y=yj},}{},{jj ijjippyYPyYxXP•=====为在Y= y j 条件下随机变量X 的条件分布律.同样,对于固定的i,若P{X=x i }>0,则称P{Y=y j|X=x i} 为在X=x i 条件下随机变量Y 的条件分布律.第四章 随机变量的数字特征一.数学期望和方差的定义随机变量X 离散型随机变量连续型随机变量分布律P{X=x i }= p i ( i =1,2,…) 概率密度f (x)数学期望(均值)E(X) ∑∞=1i i i p x (级数绝对收敛) ⎰∞∞-dx x xf )((积分绝对收敛)方差D(X)=E{[X-E(X)]2}[]∑-∞=12)(i i i p X E x⎰-∞∞-dx x f X E x)()]([2,}{},{•=====i j i i j i p p x X P y Y x X P=E(X 2)-[E(X)]2(级数绝对收敛) (积分绝对收敛)函数数学期望E(Y)=E[g(X)] i i i p x g ∑∞=1)((级数绝对收敛) ⎰∞∞-dx x f x g )()((积分绝对收敛)标准差(X)=√D(X) .二.数学期望与方差的性质1. c 为为任意常数时, E(c) = c , E(cX) = cE(X) , D(c) = 0 , D (cX) = c 2 D(X) .,Y 为任意随机变量时, E (X ±Y)=E(X)±E(Y) .3. X 与Y 相互独立时, E(XY)=E(X)E(Y) , D(X ±Y)=D(X)+D(Y) .4. D(X) = 0 ⇔ P{X = C}=1 ,C 为常数.三.六种重要分布的数学期望和方差 E(X) D(X)~ (0-1)分布P{X=1}= p (0<p<1)p p (1- p)~ b (n,p) (0<p<1) n pn p (1- p)~ ()~ U(a,b) (a+b)/2 (b-a) 2/12服从参数为的指数分布 2~ N (,2)2四.矩的概念随机变量X 的k 阶(原点)矩E(X k ) k=1,2,…随机变量X 的k 阶中心矩E{[X-E(X)] k}随机变量X 和Y 的k+l 阶混合矩E(X k Y l ) l=1,2,…随机变量X 和Y 的k+l 阶混合中心矩E{[X-E(X)] k [Y-E(Y)] l }第六章 样本和抽样分布一.基本概念总体X 即随机变量X ; 样本X 1 ,X 2 ,…,X n 是与总体同分布且相互独立的随机变量;样本值x 1 ,x 2 ,…,x n 为实数;n 是样本容量.统计量是指样本的不含任何未知参数的连续函数.如:样本均值∑==n i i X n X 11 样本方差()∑--==n i i X X n S 12211 样本标准差S样本k 阶矩∑==n i ki k X n A 11( k=1,2,…) 样本k 阶中心矩∑-==ni k i k X X n B 1)(1( k=1,2,…)二.抽样分布 即统计量的分布1.X 的分布 不论总体X 服从什么分布, E (X ) = E(X) , D (X ) = D(X) / n .特别,若X~ N (,2 ) ,则 X ~ N (, 2 /n) .2.2分布 (1)定义 若X ~N (0,1) ,则Y =∑=ni i X 12~ 2(n)自由度为n 的2分布.(2)性质 ①若Y~ 2(n),则E(Y) = n , D(Y) = 2n .②若Y 1~ 2(n 1) Y 2~ 2(n 2) ,则Y 1+Y 2~ 2(n 1 + n 2).③若X~ N (,2 ), 则22)1(σS n -~ 2(n-1),且X 与S 2相互独立.(3)分位点 若Y~ 2(n),0< <1 ,则满足的点)()(),(),(22/122/212n n n n ααααχχχχ--和分别称为2分布的上、下、双侧分位点.3. t 分布(1)定义 若X~N (0,1 ),Y~ 2 (n),且X,Y 相互独立,则t=nY X~t(n)自由度为n 的t 分布.(2)性质①n →∞时,t 分布的极限为标准正态分布.②X ~N (,2)时, nS X μ-~ t (n-1) .③两个正态总体相互独立的样本 样本均值 样本方差X~ N (1,12 ) 且12=22=2 X 1 ,X 2 ,…,X n1 X S 12Y~ N (2,22 ) Y 1 ,Y 2 ,…,Y n2 Y S 22则 212111)()(n n S Y X w +---μμ~ t (n 1+n 2-2) , 其中 2)1()1(212222112-+-+-=n n S n S n S w(3)分位点 若t ~ t (n) ,0 < <1 , 则满足的点)(),(),(2/n t n t n t ααα±-分别称t 分布的上、下、双侧分位点.注意: t 1- (n) = - t (n).分布 (1)定义 若U~2(n 1), V~ 2(n 2), 且U,V 相互独立,则F =21n V n U ~F(n 1,n 2)自由度为(n 1,n 2)的F 分布.(2)性质(条件同3.(2)③)22212221σσS S ~F(n 1-1,n 2-1)(3)分位点 若F~ F(n 1,n 2) ,0< <1,则满足的点),(),(),,(),,(212/1212/21121n n F n n F n n F n n F αααα--和分别称为F 分布的上、下、双侧分位点. 注意: .).(1),(12211n n F n n F αα=-第七章 参数估计一.点估计 总体X 的分布中有k 个待估参数1, 2,…, k .X 1 ,X 2 ,…,X n 是X 的一个样本, x 1 ,x 2 ,…,x n 是样本值.1.矩估计法先求总体矩⎪⎩⎪⎨⎧===),,,(),,,(),,,(2121222111k k k k k θθθμμθθθμμθθθμμ 解此方程组,得到⎪⎩⎪⎨⎧===),,,(),,,(),,,(2121222111kk k k k μμμθθμμμθθμμμθθ ,以样本矩A l 取代总体矩 l( l=1,2,…,k)得到矩估计量⎪⎪⎩⎪⎪⎨⎧===∧∧∧),,,(),,,(),,,(2121222111k k k k k A A A A A A A A A θθθθθθ,若代入样本值则得到矩估计值.2.最大似然估计法若总体分布形式(可以是分布律或概率密度)为p(x, 1, 2,…, k ),称样本X 1 ,X 2 ,…,X n的联合分布∏==ni k i k x p L 12121),,,,(),,,(θθθθθθ 为似然函数.取使似然函数达到最大值的∧∧∧k θθθ,,,21 ,称为参数1, 2,…,k 的最大似然估计值,代入样本得到最大似然估计量.若L(1, 2,…, k )关于1, 2,…, k 可微,则一般可由似然方程组 0=∂∂i L θ 或 对数似然方程组 0ln =∂∂iLθ (i =1,2,…,k) 求出最大似然估计.3.估计量的标准(1)无偏性 若E(∧θ)=,则估计量∧θ称为参数的无偏估计量.不论总体X 服从什么分布, E (X )= E(X) , E(S 2)=D(X), E(A k )=k =E(X k ),即样本均值X ,样本方差S 2,样本k 阶矩A k 分别是总体均值E(X),方差D(X),总体k 阶矩k 的无偏估计,(2)有效性 若E(∧θ1 )=E(∧θ2)= , 而D(∧θ1)< D(∧θ2), 则称估计量∧θ1比∧θ2有效.(3)一致性(相合性) 若n →∞时,θθP →∧,则称估计量∧θ是参数的相合估计量.二.区间估计1.求参数的置信水平为1-的双侧置信区间的步骤(1)寻找样本函数W=W(X 1 ,X 2 ,…,X n ,),其中只有一个待估参数未知,且其分布完全确定.(2)利用双侧分位点找出W 的区间(a,b),使P{a<W <b}=1-.(3)由不等式a<W<b 解出θθθ<<则区间(θθ,)为所求.2.单个正态总体待估参数 其它参数 W 及其分布 置信区间2已知nX σμ-~N (0,1) (2/ασz n X ±) 2未知nS X μ-~ t (n-1) )1((2/-±n t n S X α 2未知22)1(σS n -~ 2(n-1) ))1()1(,)1()1((22/1222/2-----n S n n S n ααχχ 3.两个正态总体(1)均值差 1- 2其它参数 W 及其分布 置信区间已知2221,σσ22212121)(n n Y X σσμμ+--- ~ N(0,1) )(2221212n n z Y Xσσα+±-未知22221σσσ==212111)(n n S Y X w +---μμ~t(n 1+n 2-2))11)2((21212n n S n n t Y X w+-+±-α 其中S w 等符号的意义见第六章二. 3 (2)③.(2) 1, 2未知, W=22212221σσS S ~ F(n 1-1,n 2-1),方差比12/22的置信区间为注意:对于单侧置信区间,只需将以上所列的双侧置信区间中的上(下)限中的下标/2改为,另外的下(上)限取为- ()即可.。
概率论与数理统计复习笔记
概率论与数理统计复习第一章概率论的基本概念一.基本概念随机试验E:1可以在相同的条件下重复地进行;2每次试验的可能结果不止一个,并且能事先明确试验的所有可能结果;3进行一次试验之前不能确定哪一个结果会出现.样本空间S: E的所有可能结果组成的集合. 样本点基本事件:E的每个结果.随机事件事件:样本空间S的子集.必然事件S:每次试验中一定发生的事件. 不可能事件:每次试验中一定不会发生的事件.二. 事件间的关系和运算事件B包含事件A 事件A发生必然导致事件B发生.∪B和事件事件A与B至少有一个发生.3. A∩B=AB积事件事件A与B同时发生.4. A-B 差事件事件A 发生而B 不发生.5. AB= A 与B 互不相容或互斥事件A 与B 不能同时发生.6. AB=且A ∪B=S A 与B 互为逆事件或对立事件表示一次试验中A 与B 必有一个且仅有一个发生. B=A, A=B .运算规则 交换律 结合律 分配律 德摩根律 B A B A = B A B A =三. 概率的定义与性质1.定义 对于E 的每一事件A 赋予一个实数,记为PA,称为事件A 的概率.1非负性 PA ≥0 ; 2归一性或规范性 PS=1 ;3可列可加性 对于两两互不相容的事件A 1,A 2,…A i A j =φ, i ≠j, i,j=1,2,…,PA 1∪A 2∪…=P A 1+PA 2+…2.性质1 P = 0 , 注意: A 为不可能事件2有限可加性对于n个两两互不相容的事件A1,A2,…,An,PA1∪A2∪…∪An=PA1+PA2+…+PAn有限可加性与可列可加性合称加法定理3若A B, 则PA≤PB, PB-A=PB-PA .4对于任一事件A, PA≤1, PA=1-PA .5广义加法定理对于任意二事件A,B ,PA∪B=PA+PB-PAB .对于任意n个事件A1,A2,…,An…+-1n-1PA1A2…An四.等可能古典概型1.定义如果试验E满足:1样本空间的元素只有有限个,即S={e1,e2,…,en};2每一个基本事件的概率相等,即Pe1=Pe2=…= Pen.则称试验E所对应的概率模型为等可能古典概型.2.计算公式 PA=k / n 其中k是A中包含的基本事件数, n是S中包含的基本事件总数.五.条件概率1.定义 事件A 发生的条件下事件B 发生的条件概率PB|A=PAB / PA PA>0.2.乘法定理 PAB=PA P B|A PA>0; PAB=PB P A|B PB>0.PA 1A 2…A n =PA 1PA 2|A 1PA 3|A 1A 2…PA n |A 1A 2…A n-1 n ≥2, PA 1A 2…A n-1 > 03. B 1,B 2,…,B n 是样本空间S 的一个划分B i B j =φ,i ≠j,i,j=1,2,…,n, B 1∪B 2∪…∪B n =S ,则当PB i >0时,有全概率公式 PA=()()i ni i B A P B P ∑=1当PA>0, PB i>0时,有贝叶斯公式P B i|A=()()()()()()∑==ni i i i i i B A P B P B A P B P A P AB P 1. 六.事件的独立性1.两个事件A,B,满足PAB = PA PB 时,称A,B 为相互独立的事件.1两个事件A,B 相互独立 PB= P B|A .2若A 与B,A 与B ,A 与B, ,A 与B 中有一对相互独立,则另外三对也相互独立.2.三个事件A,B,C 满足PAB =PA PB, PAC= PA PC, PBC= PB PC,称A,B,C 三事件两两相互独立. 若再满足PABC =PA PB PC,则称A,B,C 三事件相互独立.个事件A 1,A 2,…,A n ,如果对任意k 1<k ≤n,任意1≤i 1<i 2<…<i k ≤n.有()()()()kki i i i i i A P A P A P A A A P 2121=,则称这n 个事件A 1,A 2,…,A n 相互独立.第二章 随机变量及其概率分布一.随机变量及其分布函数1.在随机试验E 的样本空间S={e}上定义的单值实值函数X=X e 称为随机变量.2.随机变量X 的分布函数Fx=P{X ≤x} , x 是任意实数. 其性质为:10≤Fx≤1 ,F -∞=0,F∞=1. 2Fx 单调不减,即若x 1<x 2 ,则 Fx 1≤Fx 2.3Fx 右连续,即Fx+0=Fx. 4P{x 1<X≤x 2}=Fx 2-Fx 1.二.离散型随机变量 只能取有限个或可列无限多个值的随机变量1.离散型随机变量的分布律 P{X= x k }= p k k=1,2,… 也可以列表表示. 其性质为:1非负性 0≤P k ≤1 ; 2归一性11=∑∞=k k p .2.离散型随机变量的分布函数 Fx=∑≤xX k k P 为阶梯函数,它在x=x kk=1,2,…处具有跳跃点,其跳跃值为p k =P{X=x k } .3.三种重要的离散型随机变量的分布1X~0-1分布 P{X=1}= p ,P{X=0}=1–p 0<p<1 .2X~bn,p 参数为n,p 的二项分布P{X=k}=()kn k p p k n --⎪⎪⎭⎫ ⎝⎛1k=0,1,2,…,n 0<p<1 3X~参数为的泊松分布 P{X=k}=λλ-e k k !k=0,1,2,… >0 三.连续型随机变量1.定义 如果随机变量X 的分布函数Fx 可以表示成某一非负函数fx 的积分Fx=()dt t f x⎰∞-,-∞< x <∞,则称X 为连续型随机变量,其中f x 称为X 的概率密度函数.2.概率密度的性质1非负性 fx ≥0 ; 2归一性 ⎰∞∞-dx x f )(=1 ;3 P{x 1<X ≤x 2}=⎰21)(xx dx x f ; 4若f x 在点x 处连续,则f x=F/x .注意:连续型随机变量X 取任一指定实数值a 的概率为零,即P{X= a}=0 .3.三种重要的连续型随机变量的分布1X ~U a,b 区间a,b 上的均匀分布⎩⎨⎧=-0)(1a b x f其它b x a << . 2X 服从参数为的指数分布.()⎩⎨⎧=-0/1θθx ex f 00≤>x x 若若 >0.3X~N ,2参数为,的正态分布222)(21)(σμσπ--=x e x f -<x<, >0.特别, =0, 2=1时,称X 服从标准正态分布,记为X~N 0,1,其概率密度2221)(x e x -=πϕ , 标准正态分布函数 ⎰=Φ∞--xt dt e x 2221)(π, -x=1-Φx .若X ~N ,2, 则Z=σμ-X ~N 0,1, P{x 1<X ≤x 2}=Φσμ-2x-Φσμ-1x .若P{Z>z }= P{Z<-z }= P{|Z|>z /2}= ,则点z ,-z , z / 2分别称为标准正态分布的上,下,双侧分位点. 注意:z =1- , z 1- = -z .四.随机变量X 的函数Y= g X 的分布1.离散型随机变量的函数若gx k k=1,2,…的值全不相等,则由上表立得Y=gX 的分布律.若gx k k=1,2,…的值有相等的,则应将相等的值的概率相加,才能得到Y=gX 的分布律.2.连续型随机变量的函数若X 的概率密度为f X x,则求其函数Y=gX 的概率密度f Y y 常用两种方法:1分布函数法 先求Y 的分布函数F Y y=P{Y ≤y}=P{gX ≤y}=()()dx x f ky Xk∑⎰∆其中Δk y 是与gX ≤y 对应的X 的可能值x 所在的区间可能不只一个,然后对y 求导即得f Y y=F Y/y .2公式法 若gx 处处可导,且恒有g /x>0 或g / x<0 ,则Y=g X 是连续型随机变量,其概率密度为()()()()⎩⎨⎧'=yhyhfyf XY其它βα<<y其中hy是gx的反函数 , = min g -,g = max g -,g .如果f x在有限区间a,b以外等于零,则 = min g a,g b = max g a,g b .第三章二维随机变量及其概率分布一.二维随机变量与联合分布函数1.定义若X和Y是定义在样本空间S上的两个随机变量,则由它们所组成的向量X,Y称为二维随机向量或二维随机变量.对任意实数x,y,二元函数Fx,y=P{X≤x,Y≤y}称为X,Y的X和Y的联合分布函数.2.分布函数的性质1Fx,y分别关于x和y单调不减.20≤Fx,y≤1 , Fx,- =0, F-,y=0, F-,-=0, F,=1 .3 Fx,y关于每个变量都是右连续的,即 Fx+0,y= Fx,y, Fx,y+0= Fx,y .4对于任意实数x 1<x 2 , y 1<y 2P{x 1<X ≤x 2 , y 1<Y ≤y 2}= Fx 2,y 2- Fx 2,y 1- Fx 1,y 2+ Fx 1,y 1二.二维离散型随机变量及其联合分布律1.定义 若随机变量X,Y 只能取有限对或可列无限多对值x i ,y j i ,j =1,2,… 称X,Y 为二维离散型随机变量.并称P{X= x i ,Y= y j }= p i j 为X,Y 的联合分布律.也可列表表示.2.性质 1非负性 0≤p i j ≤1 .2归一性 ∑∑=i jijp 1 .3. X,Y 的X 和Y 的联合分布函数Fx,y=∑∑≤≤x x yy ij i j p三.二维连续型随机变量及其联合概率密度1.定义 如果存在非负的函数f x,y,使对任意的x 和y,有Fx,y=⎰⎰∞-∞-y xdudv v u f ),(则称X,Y 为二维连续型随机变量,称fx,y 为X,Y 的X 和Y 的联合概率密度.2.性质 1非负性 f x,y ≥0 . 2归一性 1),(=⎰⎰∞∞-∞∞-dxdy y x f .3若f x,y 在点x,y 连续,则yx y x F y x f ∂∂∂=),(),(2 4若G 为xoy 平面上一个区域,则⎰⎰=∈Gdxdy y x f G y x P ),(}),{(.四.边缘分布1. X,Y 关于X 的边缘分布函数 F X x = P{X ≤x , Y<}= F x , .X,Y 关于Y 的边缘分布函数 F Y y = P{X<, Y ≤y}= F ,y2.二维离散型随机变量X,Y关于X 的边缘分布律 P{X= x i }=∑∞=1j ij p = p i · i =1,2,… 归一性 11=∑∞=•i i p .关于Y 的边缘分布律 P{Y= y j }=∑∞=1i ij p = p·jj =1,2,… 归一性11=∑∞=•j j p .3.二维连续型随机变量X,Y关于X 的边缘概率密度f X x=⎰∞∞-dy y x f ),( 归一性1)(=⎰∞∞-dx x f X关于Y 的边缘概率密度f Y y=x d y x f ⎰∞∞-),( 归一性1)(=⎰∞∞-dyy f Y五.相互独立的随机变量1.定义若对一切实数x,y,均有Fx,y= FX x FYy ,则称X和Y相互独立.2.离散型随机变量X和Y相互独立⇔p i j= p i··p·j i ,j =1,2,…对一切x i,y j成立.3.连续型随机变量X和Y相互独立⇔f x,y=f X xf Y y对X,Y所有可能取值x,y都成立.六.条件分布1.二维离散型随机变量的条件分布定义设X,Y是二维离散型随机变量,对于固定的j,若P{Y=yj}>0,则称P{X=xi |Y=yj}为在Y= yj条件下随机变量X的条件分布律.同样,对于固定的i,若P{X=xi}>0,则称P{Y=yj |X=xi}为在X=xi 条件下随机变量Y 的条件分布律.,}{},{jj ijjippyYPyYxXP•=====,}{},{•=====ij iijippxXPyYxXP第四章 随机变量的数字特征一.数学期望和方差的定义随机变量X 离散型随机变量连续型随机变量分布律P{X=x i }= p i i =1,2,… 概率密度f x数学期望均值EX∑∞=1i i i p x 级数绝对收敛⎰∞∞-dx x xf )(积分绝对收敛方差DX=E{X-EX 2}[]∑-∞=12)(i i i p X E x ⎰-∞∞-dx x f X E x )()]([2=EX 2-EX 2 级数绝对收敛 积分绝对收敛函数数学期望EY=EgXi i i p x g ∑∞=1)(级数绝对收敛 ⎰∞∞-dx x f x g )()(积分绝对收敛标准差X=√DX .二.数学期望与方差的性质1. c 为为任意常数时, Ec = c , EcX = cEX , Dc = 0 , D cX = c 2 DX .,Y为任意随机变量时, E X±Y=EX±EY .3. X与Y相互独立时, EXY=EXEY , DX±Y=DX+DY .4. DX = 0 P{X = C}=1 ,C为常数.三.六种重要分布的数学期望和方差 EX DX~ 0-1分布P{X=1}= p 0<p<1 p p 1- p ~ b n,p 0<p<1 n p n p 1- p ~~ Ua,b a+b/2 b-a 2/12服从参数为的指数分布2~ N ,22四.矩的概念随机变量X的k阶原点矩EX k k=1,2,…随机变量X 的k 阶中心矩E{X-EX k}随机变量X 和Y 的k+l 阶混合矩EX k Y l l=1,2,…随机变量X 和Y 的k+l 阶混合中心矩E{X-EX k Y-EY l }第六章 样本和抽样分布一.基本概念总体X 即随机变量X ; 样本X 1 ,X 2 ,…,X n 是与总体同分布且相互独立的随机变量;样本值x 1 ,x 2 ,…,x n 为实数;n 是样本容量.统计量是指样本的不含任何未知参数的连续函数.如:样本均值∑==n i i X n X 11 样本方差()∑--==n i i X X n S 12211 样本标准差S样本k 阶矩∑==n i k i k X n A 11 k=1,2,… 样本k 阶中心矩∑-==n i ki k X X n B 1)(1k=1,2,…二.抽样分布 即统计量的分布1.X 的分布 不论总体X 服从什么分布, E X = EX , D X = DX / n .特别,若X~ N ,2 ,则 X ~ N , 2 /n .分布 1定义 若X ~N 0,1,则Y =∑=ni i X 12~ 2n 自由度为n 的2分布.2性质 ①若Y~ 2n,则EY = n , DY = 2n .②若Y 1~ 2n 1 Y 2~ 2n 2 ,则Y 1+Y 2~ 2n 1 + n 2.③若X~ N ,2 , 则22)1(σS n -~ 2n-1,且X 与S 2相互独立.3分位点 若Y~ 2n,0< <1 ,则满足的点)()(),(),(22/122/212n n n n ααααχχχχ--和分别称为2分布的上、下、双侧分位点.3. t 分布1定义 若X~N 0,1 ,Y~ 2 n,且X,Y 相互独立,则t=nY X~tn 自由度为n 的t 分布. 2性质①n →∞时,t 分布的极限为标准正态分布.②X ~N ,2 时,nS X μ-~ t n-1 . ③两个正态总体相互独立的样本 样本均值 样本方差X~ N 1,12 且12=22=2 X 1 ,X 2 ,…,X n1 X S 12Y~ N 2,22 Y 1 ,Y 2 ,…,Y n2 Y S 22则 212111)()(n n S Y X w +---μμ~ t n 1+n 2-2 , 其中 2)1()1(212222112-+-+-=n n S n S n S w3分位点 若t ~ t n ,0 < <1 , 则满足的点)(),(),(2/n t n t n t ααα±-分别称t 分布的上、下、双侧分位点.注意: t 1- n = - t n.分布 1定义 若U~2n 1, V~ 2n 2, 且U,V 相互独立,则F =21n V n U ~Fn 1,n 2自由度为n 1,n 2的F 分布.2性质条件同3.2③22212221σσS S ~Fn 1-1,n 2-13分位点 若F~ Fn 1,n 2 ,0< <1,则满足的点),(),(),,(),,(212/1212/21121n n F n n F n n F n n F αααα--和分别称为F 分布的上、下、双侧分位点. 注意: .).(1),(12211n n F n n F αα=- 第七章 参数估计一.点估计 总体X 的分布中有k 个待估参数1, 2,…, k .X 1 ,X 2 ,…,X n 是X 的一个样本, x 1 ,x 2 ,…,x n 是样本值.1.矩估计法先求总体矩⎪⎩⎪⎨⎧===),,,(),,,(),,,(2121222111k k k k k θθθμμθθθμμθθθμμ 解此方程组,得到⎪⎩⎪⎨⎧===),,,(),,,(),,,(2121222111kk k k k μμμθθμμμθθμμμθθ ,以样本矩A l 取代总体矩 ll=1,2,…,k 得到矩估计量⎪⎪⎩⎪⎪⎨⎧===∧∧∧),,,(),,,(),,,(2121222111k k k k k A A A A A A A A A θθθθθθ,若代入样本值则得到矩估计值.2.最大似然估计法若总体分布形式可以是分布律或概率密度为px, 1, 2,…, k ,称样本X 1 ,X 2 ,…,X n 的联合分布∏==ni k i k x p L 12121),,,,(),,,(θθθθθθ 为似然函数.取使似然函数达到最大值的∧∧∧k θθθ,,,21 ,称为参数1, 2,…,k 的最大似然估计值,代入样本得到最大似然估计量.若L 1, 2,…, k 关于1, 2,…, k 可微,则一般可由似然方程组 0=∂∂i L θ 或 对数似然方程组 0ln =∂∂iLθ i =1,2,…,k 求出最大似然估计. 3.估计量的标准(1)无偏性 若E ∧θ=,则估计量∧θ称为参数的无偏估计量.不论总体X 服从什么分布, E X = EX , ES 2=DX, EA k =k =EX k ,即样本均值X , 样本方差S 2,样本k 阶矩A k 分别是总体均值EX,方差DX,总体k 阶矩k 的无偏估计,2有效性 若E ∧θ1 =E ∧θ2= , 而D ∧θ1< D ∧θ2, 则称估计量∧θ1比∧θ2有效.3一致性相合性 若n →∞时,θθP →∧,则称估计量∧θ是参数的相合估计量.二.区间估计1.求参数的置信水平为1-的双侧置信区间的步骤1寻找样本函数W=WX 1 ,X 2 ,…,X n ,,其中只有一个待估参数未知,且其分布完全确定.2利用双侧分位点找出W 的区间a,b,使P{a<W <b}=1-.3由不等式a<W<b 解出θθθ<<则区间θθ,为所求.2.单个正态总体待估参数 其它参数 W 及其分布 置信区间2已知 nX σμ-~N 0,1 2/ασz n X ±2未知 nS X μ-~ t n-1 )1((2/-±n t n S X α 2未知22)1(σS n -~ 2n-1 ))1()1(,)1()1((22/1222/2-----n S n n S n ααχχ 3.两个正态总体1均值差 1- 2其它参数 W 及其分布 置信区间已知2221,σσ22212121)(n n Y X σσμμ+--- ~ N0,1 )(2221212n n z Y Xσσα+±-未知22221σσσ==212111)(n n S Y X w +---μμ~tn 1+n 2-2)11)2((21212n n S n n t Y X w+-+±-α 其中S w 等符号的意义见第六章二. 3 2③.2 1, 2未知, W=22212221σσS S ~ Fn 1-1,n 2-1,方差比12/22的置信区间为注意:对于单侧置信区间,只需将以上所列的双侧置信区间中的上下限中的下标/2改为,另外的下上限取为- 即可.。
概率论与数理统计笔记(重要公式)
r = A 中样本点数 / Ω 中样本点总数 n
= A 所包含的基本事件数 / 基本事件总数 条件概率:
对偶律: A B = A B , P ( AB ) 设 A, B 是两个事件, 且 P(B)>0, 称 P(A|B)= 为 贝叶斯公式: P( B) 在事件 B 发生条件下事件 A 发生的条件概率。显然, 当 P(A)>0 时,P(B|A)=
二项分布 X ~ B(n, p): 指数分布 X ~ E(λ) 若随机变量 X 只取两个可能值 0, 1, …, n, 而 X 的分布律为 e x x 0 若随机变量 X 的概率密度为 f ( x) k k nk pk =P {X= xk }= Cn p q , k=0, 1, 2, …, n, x0 0
设 X 为离散型随机变量, 可能取值为 x1, x2, …, xk, … 且 P 概率密度的性质: (1) f(x)≥0 {X= xk }= pk, k=1, 2, …, 则称{pk}为 X 的分布律 表格形式: f ( x)dx =1 (2) X x1, x2, …, xk, … b P p1, p2, …, pk, … (3) P{a<X≤b}= F(b)-F(a)= f ( x)dx , a≤b a {pk}性质: (4) 设 x 为 f(x)的连续点,则 F’(x)存在,且 (1) pk≥0, k=1, 2, … F’(x)= f(x) (2) pk =1 均匀分布 X ~ U (a, b) k 1 若随机变量 X 的概率密度为 在求离散型随机变量的分布律时,首先要找出其所有可能 1 , a≤x≤b 的取值,然后再求出每个值相应的概率 ba f(x) = 在实际应用中,有时还要求“X 满足某一条件”这样事件的 概率, 求法就是把满足条件的 xk 所对应的概率 pk 相加可得 0, 其他 则称 X 服从区间[a,b]上的均匀分布,其分布函数为 其分布函数 F(x) = pk xk x 0, x≤a 0-1 分布: xa F(x) = , a<x<b 若随机变量 X 只取两个可能值 0, 1,且 ba P {X=1}=p, P{X=0}=q 1, x≥b 其中 0<p<1, q=1-p, 则称 X 服从 0-1 分布. X 的分布律为 设 X ~ U (a, b), a≤c<d≤b,即[a,b] [c,d],则 X 0 1 d c P{c≤X≤d}= P q p ba
《概率论与数理统计》笔记
《概率论与数理统计》笔记
概率论与数理统计是一门关注数学中模型与统计学之间关系的学科,它广泛应用于多
学科,如金融、制造业、社会研究、生物学等。
该学科通过训练统计学家,使他们能够正
确地估算、模拟、识别实际问题。
概率论的基本思维是发现或认识事件可能发生的概率。
它的概念源自古典概率论,尤
其是科学家蒙特马克的研究,利用统计抽样了解不完全知识的情况。
概率论用来描述不同
事件之间相互作用的关系和支配这些事件的规律。
概率论不仅涉及单个事件的概率,也包
括有关许多独立事件及其相关概率的多事件概率论。
数理统计主要用来收集、组织、分析数据,推断一般情况下的规律和趋势,其中使用
了广泛的数理方法。
它可以帮助人们做出有意义的结论,从而帮助他们把控不确定性的环境。
数理统计从双重意义上来看,既是一门理论学科,又是一门实践性学科,它融合了数学、统计学和计算机的优势,把这些优势应用于许多实际问题,如质量控制、流行病模型、社会研究等。
概率论与数理统计并不是一门独立的学科,它们是两个相互渗透和紧密相关的学科。
概率论提供了统计学家用来描述系统未来行为的模型,而数理统计则可以用来理解和控制
数据的变化和潜力。
这两门学科的知识和技术能够实现精确测量、预测和决策,进而实现
有效的事实分析。
概率论与数理统计复习笔记
概率论与数理统计复习第一章概率论的基本概念一.基本概念随机试验E:(1)可以在相同的条件下重复地进行;(2)每次试验的可能结果不止一个,并且能事先明确试验的所有可能结果;(3)进行一次试验之前不能确定哪一个结果会出现.样本空间S: E的所有可能结果组成的集合. 样本点(基本事件):E的每个结果.随机事件(事件):样本空间S的子集.必然事件(S):每次试验中一定发生的事件. 不可能事件():每次试验中一定不会发生的事件.二. 事件间的关系和运算(事件B包含事件A )事件A发生必然导致事件B发生.∪B(和事件)事件A与B至少有一个发生.3. A∩B=AB(积事件)事件A与B同时发生.4. A-B(差事件)事件A发生而B不发生.5. AB= (A与B互不相容或互斥)事件A与B不能同时发生.6. AB=且A∪B=S (A与B互为逆事件或对立事件)表示一次试验中A与B必有一个且仅有一个发生. B=A, A=B .运算规则 交换律 结合律 分配律 德摩根律 B A B A = B A B A =三. 概率的定义与性质1.定义 对于E 的每一事件A 赋予一个实数,记为P(A),称为事件A 的概率. (1)非负性 P(A)≥0 ; (2)归一性或规范性 P(S)=1 ;(3)可列可加性 对于两两互不相容的事件A 1,A 2,…(A i A j =φ, i ≠j, i,j=1,2,…),P(A 1∪A 2∪…)=P( A 1)+P(A 2)+… 2.性质(1) P() = 0 , 注意: A 为不可能事件 P(A)=0 . (2)有限可加性 对于n 个两两互不相容的事件A 1,A 2,…,A n ,P(A 1∪A 2∪…∪A n )=P(A 1)+P(A 2)+…+P(A n ) (有限可加性与可列可加性合称加法定理) (3)若A ⊂B, 则P(A)≤P(B), P(B-A)=P(B)-P(A) . (4)对于任一事件A, P(A)≤1, P(A)=1-P(A) .(5)广义加法定理 对于任意二事件A,B ,P(A ∪B)=P(A)+P(B)-P(AB) .对于任意n 个事件A 1,A 2,…,A n…+(-1)n-1P(A 1A 2…A n )四.等可能(古典)概型1.定义 如果试验E 满足:(1)样本空间的元素只有有限个,即S={e 1,e 2,…,e n };(2)每一个基本事件的概率相等,即P(e 1)=P(e 2)=…= P(e n ).则称试验E 所对应的概率模型为等可能(古典)概型.2.计算公式 P(A)=k / n 其中k 是A 中包含的基本事件数, n 是S 中包含的基本事件总数. 五.条件概率1.定义 事件A 发生的条件下事件B 发生的条件概率P(B|A)=P(AB) / P(A) ( P(A)>0).2.乘法定理 P(AB)=P(A) P (B|A) (P(A)>0); P(AB)=P(B) P (A|B) (P(B)>0). P(A 1A 2…A n )=P(A 1)P(A 2|A 1)P(A 3|A 1A 2)…P(A n |A 1A 2…A n-1) (n ≥2, P(A 1A 2…A n-1) > 0)3. B 1,B 2,…,B n 是样本空间S 的一个划分(B i B j =φ,i ≠j,i,j=1,2,…,n, B 1∪B 2∪…∪Bn=S) ,则当P(B i )>0时,有全概率公式 P(A)=()()i ni i B A P B P ∑=1当P(A)>0, P(B i)>0时,有贝叶斯公式P (B i|A)=()()()()()()∑==ni i i i i i B A P B P B A P B P A P AB P 1. 六.事件的独立性1.两个事件A,B,满足P(AB) = P(A) P(B)时,称A,B 为相互独立的事件. (1)两个事件A,B 相互独立 P(B)= P (B|A) .(2)若A 与B,A 与B ,A 与B, ,A 与B 中有一对相互独立,则另外三对也相互独立.2.三个事件A,B,C 满足P(AB) =P(A) P(B), P(AC)= P(A) P(C), P(BC)= P(B) P(C),称A,B,C 三事件两两相互独立. 若再满足P(ABC) =P(A) P(B) P(C),则称A,B,C 三事件相互独立.个事件A 1,A 2,…,A n ,如果对任意k (1<k ≤n),任意1≤i 1<i 2<…<i k ≤n.有()()()()kki i i i i i A P A P A P A A A P 2121=,则称这n 个事件A 1,A 2,…,A n 相互独立.第二章 随机变量及其概率分布一.随机变量及其分布函数1.在随机试验E 的样本空间S={e}上定义的单值实值函数X=X (e)称为随机变量.2.随机变量X 的分布函数F(x)=P{X ≤x} , x 是任意实数. 其性质为:(1)0≤F(x)≤1 ,F(-∞)=0,F(∞)=1. (2)F(x)单调不减,即若x 1<x 2 ,则 F(x 1)≤F(x2).(3)F(x)右连续,即F(x+0)=F(x). (4)P{x 1<X≤x 2}=F(x 2)-F(x 1).二.离散型随机变量 (只能取有限个或可列无限多个值的随机变量)1.离散型随机变量的分布律 P{X= x k }= p k (k=1,2,…) 也可以列表表示. 其性质为:(1)非负性 0≤P k ≤1 ; (2)归一性11=∑∞=k k p .2.离散型随机变量的分布函数 F(x)=∑≤xX k k P 为阶梯函数,它在x=xk(k=1,2,…)处具有跳跃点,其跳跃值为p k =P{X=x k } . 3.三种重要的离散型随机变量的分布(1)X~(0-1)分布 P{X=1}= p ,P{X=0}=1–p (0<p<1) .(2)X~b(n,p)参数为n,p 的二项分布P{X=k}=()kn k p p k n --⎪⎪⎭⎫ ⎝⎛1(k=0,1,2,…,n) (0<p<1)(3))X~()参数为的泊松分布 P{X=k}=λλ-e k k !(k=0,1,2,…) (>0) 三.连续型随机变量1.定义 如果随机变量X 的分布函数F(x)可以表示成某一非负函数f(x)的积分F(x)=()dt t f x⎰∞-,-∞< x <∞,则称X 为连续型随机变量,其中f (x)称为X 的概率密度(函数).2.概率密度的性质(1)非负性 f(x)≥0 ; (2)归一性 ⎰∞∞-dx x f )(=1 ;(3) P{x 1<X ≤x 2}=⎰21)(xx dx x f ; (4)若f (x)在点x 处连续,则f (x)=F /(x) .注意:连续型随机变量X 取任一指定实数值a 的概率为零,即P{X= a}=0 . 3.三种重要的连续型随机变量的分布(1)X ~U (a,b) 区间(a,b)上的均匀分布⎩⎨⎧=-)(1a b x f 其它b x a << .(2)X 服从参数为的指数分布.()⎩⎨⎧=-0/1θθx ex f 00≤>x x 若若 (>0).(3)X~N (,2 )参数为,的正态分布222)(21)(σμσπ--=x e x f -<x<, >0.特别, =0, 2 =1时,称X 服从标准正态分布,记为X~N (0,1),其概率密度2221)(x e x -=πϕ , 标准正态分布函数 ⎰=Φ∞--xt dt e x 2221)(π, (-x)=1-Φ(x) .若X ~N ((,2), 则Z=σμ-X ~N (0,1), P{x 1<X ≤x 2}=Φ(σμ-2x )-Φ(σμ-1x ).若P{Z>z }= P{Z<-z }= P{|Z|>z /2}= ,则点z ,-z , z / 2分别称为标准正态分布的上,下,双侧分位点. 注意:(z )=1- , z 1- = -z . 四.随机变量X 的函数Y= g (X)的分布 1.离散型随机变量的函数若g(x k ) (k=1,2,…)的值全不相等,则由上表立得Y=g(X)的分布律.若g(x k ) (k=1,2,…)的值有相等的,则应将相等的值的概率相加,才能得到Y=g(X)的分布律.2.连续型随机变量的函数若X的概率密度为fX (x),则求其函数Y=g(X)的概率密度fY(y)常用两种方法:(1)分布函数法先求Y的分布函数FY (y)=P{Y≤y}=P{g(X)≤y}=()()dxxfky Xk∑⎰∆其中Δk(y)是与g(X)≤y对应的X的可能值x所在的区间(可能不只一个),然后对y求导即得fY (y)=FY/(y) .(2)公式法若g(x)处处可导,且恒有g /(x)>0 (或g / (x)<0 ),则Y=g (X)是连续型随机变量,其概率密度为()()()()⎩⎨⎧'=yhyhfyf XY其它βα<<y其中h(y)是g(x)的反函数 , = min (g (-),g ()) = max (g (-),g ()) .如果 f (x)在有限区间[a,b]以外等于零,则 = min (g (a),g (b)) = max (g (a),g (b)) .第三章二维随机变量及其概率分布一.二维随机变量与联合分布函数1.定义若X和Y是定义在样本空间S上的两个随机变量,则由它们所组成的向量(X,Y)称为二维随机向量或二维随机变量.对任意实数x,y,二元函数F(x,y)=P{X≤x,Y≤y}称为(X,Y)的(X和Y的联合)分布函数.2.分布函数的性质(1)F(x,y)分别关于x和y单调不减.(2)0≤F(x,y)≤1 , F(x,- )=0, F(-,y)=0, F(-,-)=0, F(,)=1 .(3) F(x,y)关于每个变量都是右连续的,即 F(x+0,y)= F(x,y), F(x,y+0)= F(x,y) .(4)对于任意实数x 1<x 2 , y 1<y 2P{x 1<X ≤x 2 , y 1<Y ≤y 2}= F(x 2,y 2)- F(x 2,y 1)- F(x 1,y 2)+ F(x 1,y 1)二.二维离散型随机变量及其联合分布律1.定义 若随机变量(X,Y)只能取有限对或可列无限多对值(x i ,y j ) (i ,j =1,2,… )称(X,Y)为二维离散型随机变量.并称P{X= x i ,Y= y j }= p i j 为(X,Y)的联合分布律.也可列表表示.2.性质 (1)非负性 0≤p i j ≤1 .(2)归一性 ∑∑=i jijp 1 .3. (X,Y)的(X 和Y 的联合)分布函数F(x,y)=∑∑≤≤x x yy ij i j p三.二维连续型随机变量及其联合概率密度1.定义 如果存在非负的函数 f (x,y),使对任意的x 和y,有F(x,y)=⎰⎰∞-∞-yxdudv v u f ),(则称(X,Y)为二维连续型随机变量,称f(x,y)为(X,Y)的(X 和Y 的联合)概率密度.2.性质 (1)非负性 f (x,y)≥0 . (2)归一性 1),(=⎰⎰∞∞-∞∞-dxdy y x f .(3)若f (x,y)在点(x,y)连续,则yx y x F y x f ∂∂∂=),(),(2(4)若G 为xoy 平面上一个区域,则⎰⎰=∈Gdxdy y x f G y x P ),(}),{(.四.边缘分布1. (X,Y)关于X 的边缘分布函数 F X (x) = P{X ≤x , Y<}= F (x , ) . (X,Y)关于Y 的边缘分布函数 F Y (y) = P{X<, Y ≤y}= F (,y)2.二维离散型随机变量(X,Y)关于X 的边缘分布律 P{X= x i }=∑∞=1j ij p = p i · ( i =1,2,…) 归一性 11=∑∞=•i i p .关于Y 的边缘分布律 P{Y= y j }=∑∞=1i ij p = p·j( j =1,2,…) 归一性11=∑∞=•j j p .3.二维连续型随机变量(X,Y)关于X 的边缘概率密度f X (x)=⎰∞∞-dy y x f ),( 归一性1)(=⎰∞∞-dx x f X关于Y 的边缘概率密度f Y (y)=x d y x f ⎰∞∞-),( 归一性1)(=⎰∞∞-dyy f Y五.相互独立的随机变量1.定义 若对一切实数x,y,均有F(x,y)= F X (x) F Y (y) ,则称X 和Y 相互独立.2.离散型随机变量X 和Y 相互独立⇔p i j = p i ··p ·j ( i ,j =1,2,…)对一切x i ,y j 成立.3.连续型随机变量X 和Y 相互独立⇔f (x,y)=f X (x)f Y (y)对(X,Y)所有可能取值(x,y)都成立. 六.条件分布1.二维离散型随机变量的条件分布定义 设(X,Y)是二维离散型随机变量,对于固定的j,若P{Y=y j }>0,则称P{X=x i|Y=y j} 为在Y= y j 条件下随机变量X 的条件分布律. 同样,对于固定的i,若P{X=x i }>0,则称 P{Y=y j |X=x i }为在X=x i 条件下随机变量Y 的条件分布律.第四章 随机变量的数字特征一.数学期望和方差的定义随机变量X 离散型随机变量连续型随机变量分布律P{X=x i }= p i ( i =1,2,…) 概率密度f (x)数学期望(均值)E(X) ∑∞=1i i i p x (级数绝对收敛) ⎰∞∞-dx x xf )((积分绝对收敛)方差D(X)=E{[X-E(X)]2}[]∑-∞=12)(i i i p X E x⎰-∞∞-dx x f X E x)()]([2=E(X 2)-[E(X)]2 (级数绝对收敛) (积分绝对收敛),}{},{jj i j j i p p y Y P y Y x X P •=====,}{},{•=====i ji i j i p p x X P y Y x X P函数数学期望E(Y)=E[g(X)] i i i p x g ∑∞=1)((级数绝对收敛) ⎰∞∞-dx x f x g )()((积分绝对收敛)标准差(X)=√D(X) . 二.数学期望与方差的性质1. c 为为任意常数时, E(c) = c , E(cX) = cE(X) , D(c) = 0 , D (cX) = c 2 D(X) . ,Y 为任意随机变量时, E (X ±Y)=E(X)±E(Y) .3. X 与Y 相互独立时, E(XY)=E(X)E(Y) , D(X ±Y)=D(X)+D(Y) .4. D(X) = 0 ⇔ P{X = C}=1 ,C 为常数.三.六种重要分布的数学期望和方差 E(X) D(X)~ (0-1)分布P{X=1}= p (0<p<1)p p (1- p)~ b (n,p) (0<p<1) n pn p (1- p)~ ()~ U(a,b) (a+b)/2 (b-a) 2/12 服从参数为的指数分布 2~ N (,2) 2四.矩的概念随机变量X 的k 阶(原点)矩E(X k) k=1,2,…随机变量X 的k 阶中心矩E{[X-E(X)] k }随机变量X 和Y 的k+l 阶混合矩E(X k Y l ) l=1,2,… 随机变量X 和Y 的k+l 阶混合中心矩E{[X-E(X)] k [Y-E(Y)] l }第六章 样本和抽样分布一.基本概念总体X 即随机变量X ; 样本X 1 ,X 2 ,…,X n 是与总体同分布且相互独立的随机变量;样本值x 1 ,x 2 ,…,x n 为实数;n 是样本容量.统计量是指样本的不含任何未知参数的连续函数.如:样本均值∑==n i i X n X 11 样本方差()∑--==n i iX X n S 12211 样本标准差S 样本k 阶矩∑==n i ki k X n A 11( k=1,2,…) 样本k 阶中心矩∑-==ni k i k X X n B 1)(1( k=1,2,…)二.抽样分布 即统计量的分布1.X 的分布 不论总体X 服从什么分布, E (X ) = E(X) , D (X ) = D(X) / n . 特别,若X~ N (,2 ) ,则 X ~ N (, 2 /n) .2.2分布 (1)定义 若X ~N (0,1) ,则Y =∑=ni i X 12~ 2(n)自由度为n 的2分布.(2)性质 ①若Y~ 2(n),则E(Y) = n , D(Y) = 2n .②若Y 1~ 2(n 1) Y 2~ 2(n 2) ,则Y 1+Y 2~ 2(n 1 + n 2).③若X~ N (,2 ), 则22)1(σS n -~ 2(n-1),且X 与S 2相互独立.(3)分位点 若Y~ 2(n),0< <1 ,则满足的点)()(),(),(22/122/212n n n n ααααχχχχ--和分别称为2分布的上、下、双侧分位点. 3. t 分布(1)定义 若X~N (0,1 ),Y~ 2 (n),且X,Y 相互独立,则t=nY X~t(n)自由度为n 的t 分布.(2)性质①n →∞时,t 分布的极限为标准正态分布.②X ~N (,2 )时,nS X μ-~ t (n-1) . ③两个正态总体相互独立的样本 样本均值 样本方差X~ N (1,12 ) 且12=22=2 X 1 ,X 2 ,…,X n1 X S 12Y~ N (2,22 ) Y 1 ,Y 2 ,…,Y n2 Y S 22则 212111)()(n n S Y X w +---μμ~ t (n 1+n 2-2) , 其中 2)1()1(212222112-+-+-=n n S n S n S w(3)分位点 若t ~ t (n) ,0 < <1 , 则满足的点)(),(),(2/n t n t n t ααα±-分别称t 分布的上、下、双侧分位点. 注意: t 1- (n) = - t (n).分布 (1)定义 若U~2(n 1), V~ 2(n 2), 且U,V 相互独立,则F =21n V n U ~F(n 1,n 2)自由度为(n 1,n 2)的F 分布.(2)性质(条件同3.(2)③)22212221σσS S ~F(n 1-1,n 2-1)(3)分位点 若F~ F(n 1,n 2) ,0< <1,则满足的点),(),(),,(),,(212/1212/21121n n F n n F n n F n n F αααα--和分别称为F 分布的上、下、双侧分位点. 注意: .).(1),(12211n n F n n F αα=-第七章 参数估计一.点估计 总体X 的分布中有k 个待估参数1, 2,…, k .X 1 ,X 2 ,…,X n 是X 的一个样本, x 1 ,x 2 ,…,x n 是样本值.1.矩估计法先求总体矩⎪⎩⎪⎨⎧===),,,(),,,(),,,(2121222111k k k k k θθθμμθθθμμθθθμμ 解此方程组,得到⎪⎩⎪⎨⎧===),,,(),,,(),,,(2121222111kk k k k μμμθθμμμθθμμμθθ ,以样本矩A l 取代总体矩 l( l=1,2,…,k)得到矩估计量⎪⎪⎩⎪⎪⎨⎧===∧∧∧),,,(),,,(),,,(2121222111k k k k k A A A A A A A A A θθθθθθ,若代入样本值则得到矩估计值. 2.最大似然估计法若总体分布形式(可以是分布律或概率密度)为p(x, 1, 2,…, k ),称样本X 1 ,X 2 ,…,X n的联合分布∏==ni k i k x p L 12121),,,,(),,,(θθθθθθ 为似然函数.取使似然函数达到最大值的∧∧∧k θθθ,,,21 ,称为参数1, 2,…,k 的最大似然估计值,代入样本得到最大似然估计量.若L(1, 2,…, k )关于1, 2,…, k 可微,则一般可由似然方程组 0=∂∂i L θ 或 对数似然方程组 0ln =∂∂iLθ (i =1,2,…,k) 求出最大似然估计.3.估计量的标准(1) 无偏性 若E(∧θ)=,则估计量∧θ称为参数的无偏估计量.不论总体X 服从什么分布, E (X )= E(X) , E(S 2)=D(X), E(A k )=k =E(X k ),即样本均值X ,样本方差S 2,样本k 阶矩A k 分别是总体均值E(X),方差D(X),总体k 阶矩k 的无偏估计,(2)有效性 若E(∧θ1 )=E(∧θ2)= , 而D(∧θ1)< D(∧θ2), 则称估计量∧θ1比∧θ2有效. (3)一致性(相合性) 若n →∞时,θθP→∧,则称估计量∧θ是参数的相合估计量. 二.区间估计1.求参数的置信水平为1-的双侧置信区间的步骤(1)寻找样本函数W=W(X 1 ,X 2 ,…,X n ,),其中只有一个待估参数未知,且其分布完全确定.(2)利用双侧分位点找出W 的区间(a,b),使P{a<W <b}=1-. (3)由不等式a<W<b 解出θθθ<<则区间(θθ,)为所求.2.单个正态总体待估参数 其它参数 W 及其分布 置信区间2已知 nX σμ-~N (0,1) (2/ασz n X ±)2未知 nS X μ-~ t (n-1) )1((2/-±n t n S X α 2未知22)1(σS n -~ 2(n-1) ))1()1(,)1()1((22/1222/2-----n S n n S n ααχχ 3.两个正态总体(1)均值差 1- 2其它参数 W 及其分布 置信区间已知2221,σσ22212121)(n n Y X σσμμ+--- ~ N(0,1) )(2221212n n z Y Xσσα+±-未知22221σσσ==212111)(n n S Y X w +---μμ~t(n 1+n 2-2))11)2((21212n n S n n t Y X w+-+±-α 其中S w 等符号的意义见第六章二. 3 (2)③.(2) 1, 2未知, W=22212221σσS S ~ F(n 1-1,n 2-1),方差比12/22的置信区间为注意:对于单侧置信区间,只需将以上所列的双侧置信区间中的上(下)限中的下标/2改为,另外的下(上)限取为- ()即可.。
概率论与数理统计复习笔记
概率论与数理统计复习第一章 概率论的基本概念一.基本概念随机试验E:(1)可以在相同的条件下重复地进行;(2)每次试验的可能结果不止一个,并且能事先明确试验的所有可能结果;(3)进行一次试验之前不能确定哪一个结果会出现.样本空间S: E 的所有可能结果组成的集合. 样本点(基本事件):E 的每个结果.随机事件(事件):样本空间S 的子集.必然事件(S):每次试验中一定发生的事件. 不可能事件(?):每次试验中一定不会发生的事件.二. 事件间的关系和运算1.A ⊂B(事件B 包含事件A )事件A 发生必然导致事件B 发生.2.A ∪B(和事件)事件A 与B 至少有一个发生.3. A ∩B=AB(积事件)事件A 与B 同时发生.4. A -B(差事件)事件A 发生而B 不发生.5. AB=? (A 与B 互不相容或互斥)事件A 与B 不能同时发生.6. AB=?且A ∪B=S (A 与B 互为逆事件或对立事件)表示一次试验中A 与B 必有一个且仅有一个发生. B=A, A=B .运算规则 交换律 结合律 分配律 德?摩根律 B A B A =B A B A =三. 概率的定义与性质1.定义对于E的每一事件A赋予一个实数,记为P(A),称为事件A的概率.(1)非负性P(A)≥0 ; (2)归一性或规范性P(S)=1 ;(3)可列可加性对于两两互不相容的事件A1,A2,…(A i A j=φ, i≠j,i,j=1,2,…),P(A1∪A2∪…)=P( A1)+P(A2)+…2.性质(1) P(?) = 0 , 注意: A为不可能事件P(A)=0 .(2)有限可加性对于n个两两互不相容的事件A1,A2,…,A n ,P(A1∪A2∪…∪A n)=P(A1)+P(A2)+…+P(A n) (有限可加性与可列可加性合称加法定理)(3)若A⊂B, 则P(A)≤P(B), P(B-A)=P(B)-P(A) .(4)对于任一事件A, P(A)≤1, P(A)=1-P(A) .(5)广义加法定理对于任意二事件A,B ,P(A∪B)=P(A)+P(B)-P(AB) .对于任意n个事件A1,A2,…,A n…+(-1)n-1P(A1A2…A n)四.等可能(古典)概型1.定义如果试验E满足:(1)样本空间的元素只有有限个,即S={e1,e2,…,e};(2)每一个基本事件的概率相等,即P(e1)=P(e2)=…= P(e n ).则称试验E所对应n的概率模型为等可能(古典)概型.2.计算公式P(A)=k / n 其中k是A中包含的基本事件数, n是S中包含的基本事件总数.五.条件概率1.定义 事件A 发生的条件下事件B 发生的条件概率P(B|A)=P(AB) / P(A) ( P(A)>0).2.乘法定理 P(AB)=P(A) P (B|A) (P(A)>0); P(AB)=P(B) P (A|B) (P(B)>0).P(A 1A 2…A n )=P(A 1)P(A 2|A 1)P(A 3|A 1A 2)…P(A n |A 1A 2…A n-1) (n ≥2, P(A 1A 2…A n-1) > 0)3. B 1,B 2,…,B n 是样本空间S 的一个划分(B i B j =φ,i ≠j,i,j=1,2,…,n, B 1∪B 2∪…∪B n =S) ,则当P(B i )>0时,有全概率公式 P(A)=()()i ni i B A P B P ∑=1当P(A)>0, P(B i )>0时,有贝叶斯公式P(B i |A)=()()()()()()∑==ni i i i i i B A P B P B A P B P A P AB P 1. 六.事件的独立性1.两个事件A,B,满足P(AB) = P(A) P(B)时,称A,B 为相互独立的事件. (1)两个事件A,B 相互独立? P(B)= P (B|A) .(2)若A 与B ,A 与B ,A 与B, ,A 与B 中有一对相互独立,则另外三对也相互独立.2.三个事件A,B,C 满足P(AB) =P(A) P(B), P(AC)= P(A) P(C), P(BC)= P(B) P(C),称A,B,C 三事件两两相互独立. 若再满足P(ABC) =P(A) P(B) P(C),则称A,B,C 三事件相互独立.3.n 个事件A 1,A 2,…,A n ,如果对任意k (1<k ≤n),任意1≤i 1<i 2<…<i k ≤n.有()()()()kki i i i i i A P A P A P A A A P 2121=,则称这n 个事件A 1,A 2,…,A n 相互独立.第二章 随机变量及其概率分布一.随机变量及其分布函数1.在随机试验E 的样本空间S={e}上定义的单值实值函数X=X (e)称为随机变量.2.随机变量X 的分布函数F(x)=P{X ≤x} , x 是任意实数. 其性质为: (1)0≤F(x)≤1 ,F(-∞)=0,F(∞)=1. (2)F(x)单调不减,即若x 1<x 2 ,则 F(x 1)≤F(x 2).(3)F(x)右连续,即F(x+0)=F(x). (4)P{x 1<X≤x 2}=F(x 2)-F(x 1). 二.离散型随机变量 (只能取有限个或可列无限多个值的随机变量) 1.离散型随机变量的分布律 P{X= x k }= p k (k=1,2,…) 也可以列表表示. 其性质为:(1)非负性 0≤P k ≤1 ; (2)归一性 11=∑∞=k k p .2.离散型随机变量的分布函数 F(x)=∑≤xX k k P 为阶梯函数,它在x=x k (k=1,2,…)处具有跳跃点,其跳跃值为p k =P{X=x k } . 3.三种重要的离散型随机变量的分布(1)X~(0-1)分布 P{X=1}= p ,P{X=0}=1–p (0<p<1) . (2)X~b(n,p)参数为n,p 的二项分布P{X=k}=()kn k p p k n --⎪⎪⎭⎫ ⎝⎛1(k=0,1,2,…,n) (0<p<1) (3))X~?(?)参数为?的泊松分布 P{X=k}=λλ-e k k !(k=0,1,2,…) (?>0)三.连续型随机变量1.定义 如果随机变量X 的分布函数F(x)可以表示成某一非负函数f(x)的积分F(x)=()dt t f x⎰∞-,-∞< x <∞,则称X 为连续型随机变量,其中f (x)称为X的概率密度(函数). 2.概率密度的性质(1)非负性 f(x)≥0 ; (2)归一性 ⎰∞∞-dx x f )(=1 ; (3) P{x 1<X ≤x 2}=⎰21)(x x dx x f ; (4)若f (x)在点x 处连续,则f(x)=F / (x) .注意:连续型随机变量X 取任一指定实数值a 的概率为零,即P{X= a}=0 . 3.三种重要的连续型随机变量的分布(1)X ~U (a,b) 区间(a,b)上的均匀分布 ⎩⎨⎧=-)(1a b x f 其它b x a << .(2)X 服从参数为?的指数分布.()⎩⎨⎧=-0/1θθx ex f 00≤>x x 若若 (?>0).(3)X~N (?,?2 )参数为?,?的正态分布 222)(21)(σμσπ--=x e x f -?<x<?,?>0.特别, ?=0, ?2 =1时,称X 服从标准正态分布,记为X~N (0,1),其概率密度2221)(x e x -=πϕ , 标准正态分布函数 ⎰=Φ∞--xt dt e x 2221)(π,?(-x)=1-Φ(x) .若X ~N ((?,?2), 则Z=σμ-X ~N (0,1), P{x 1<X ≤x 2}=Φ(σμ-2x )-Φ(σμ-1x ).若P{Z>z ?}= P{Z<-z ?}= P{|Z|>z ?/2}= ?,则点z ?,-z ?, ?z ?/ 2分别称为标准正态分布的上,下,双侧?分位点. 注意:?(z ?)=1-? , z 1- ?= -z ?. 四.随机变量X 的函数Y= g (X)的分布 1.离散型随机变量的函数若g(x k ) (k=1,2,…)的值全不相等,则由上表立得Y=g(X)的分布律. 若g(x k ) (k=1,2,…)的值有相等的,则应将相等的值的概率相加,才能得到Y=g(X)的分布律.2.连续型随机变量的函数若X 的概率密度为f X (x),则求其函数Y=g(X)的概率密度f Y (y)常用两种方法:(1)分布函数法 先求Y 的分布函数F Y (y)=P{Y ≤y}=P{g(X)≤y}=()()dx x f ky X k∑⎰∆其中Δk (y)是与g(X)≤y 对应的X 的可能值x 所在的区间(可能不只一个),然后对y 求导即得f Y (y)=F Y /(y) .(2)公式法 若g(x)处处可导,且恒有g /(x)>0 (或g / (x)<0 ),则Y=g (X)是连续型随机变量,其概率密度为 ()()()()⎩⎨⎧'=0y h y h f y f X Y 其它βα<<y其中h(y)是g(x)的反函数 , ?= min (g (-?),g (?)) ?= max (g (-?),g (?)) .如果f (x)在有限区间[a,b]以外等于零,则 ?= min (g (a),g (b)) ?= max (g (a),g (b)) .第三章 二维随机变量及其概率分布一.二维随机变量与联合分布函数1.定义 若X 和Y 是定义在样本空间S 上的两个随机变量,则由它们所组成的向量(X,Y)称为二维随机向量或二维随机变量.对任意实数x,y,二元函数F(x,y)=P{X ≤x,Y ≤y}称为(X,Y)的(X 和Y 的联合)分布函数. 2.分布函数的性质(1)F(x,y)分别关于x 和y 单调不减.(2)0≤F(x,y)≤1 , F(x,- ?)=0, F(-?,y)=0, F(-?,-?)=0, F(?,?)=1 . (3) F(x,y)关于每个变量都是右连续的,即 F(x+0,y)= F(x,y), F(x,y+0)= F(x,y) .(4)对于任意实数x 1<x 2 , y 1<y 2P{x 1<X ≤x 2 , y 1<Y ≤y 2}= F(x 2,y 2)- F(x 2,y 1)- F(x 1,y 2)+ F(x 1,y 1)二.二维离散型随机变量及其联合分布律1.定义 若随机变量(X,Y)只能取有限对或可列无限多对值(x i ,y j ) (i ,j =1,2,… )称(X,Y)为二维离散型随机变量.并称P{X= x i ,Y= y j }= p i j 为(X,Y)的联合分布律.也可列表表示.2.性质 (1)非负性 0≤p i j ≤1 .(2)归一性 ∑∑=i jij p 1 .3. (X,Y)的(X 和Y 的联合)分布函数F(x,y)=∑∑≤≤x x yy ij i j p三.二维连续型随机变量及其联合概率密度1.定义 如果存在非负的函数f (x,y),使对任意的x 和y,有F(x,y)=⎰⎰∞-∞-yxdudv v u f ),(则称(X,Y)为二维连续型随机变量,称f(x,y)为(X,Y)的(X 和Y 的联合)概率密度.2.性质 (1)非负性 f (x,y)≥0 . (2)归一性 1),(=⎰⎰∞∞-∞∞-dxdy y x f .(3)若f (x,y)在点(x,y)连续,则yx y x F y x f ∂∂∂=),(),(2(4)若G 为xoy 平面上一个区域,则⎰⎰=∈Gdxdy y x f G y x P ),(}),{(.四.边缘分布1. (X,Y)关于X 的边缘分布函数 F X (x) = P{X ≤x , Y<?}= F (x , ?) . (X,Y)关于Y 的边缘分布函数 F Y (y) = P{X<?, Y ≤y}= F (?,y)2.二维离散型随机变量(X,Y)关于X 的边缘分布律 P{X= x i }= ∑∞=1j ij p = p i · ( i =1,2,…) 归一性11=∑∞=•i i p .关于Y 的边缘分布律 P{Y= y j }= ∑∞=1i ij p = p ·j ( j =1,2,…) 归一性11=∑∞=•j j p .3.二维连续型随机变量(X,Y)关于X 的边缘概率密度f X (x)=⎰∞∞-dy y x f ),( 归一性1)(=⎰∞∞-dx x f X关于Y 的边缘概率密度f Y (y)=x d y x f ⎰∞∞-),( 归一性1)(=⎰∞∞-dy y f Y五.相互独立的随机变量1.定义 若对一切实数x,y,均有F(x,y)= F X (x) F Y (y) ,则称X 和Y 相互独立.2.离散型随机变量X 和Y 相互独立⇔p i j = p i ··p ·j ( i ,j =1,2,…)对一切x i ,y j 成立.3.连续型随机变量X 和Y 相互独立⇔f (x,y)=f X (x)f Y (y)对(X,Y)所有可能取值(x,y)都成立. 六.条件分布1.二维离散型随机变量的条件分布定义 设(X,Y)是二维离散型随机变量,对于固定的j,若P{Y=y j }>0,则称P{X=x i |Y=y j }为在Y= y j 条件下随机变量X 的条件分布律. 同样,对于固定的i,若P{X=x i }>0,则称 P{Y=y j |X=x i } 为在X=x i 条件下随机变量Y 的条件分布律.第四章 随机变量的数字特征一.数学期望和方差的定义随机变量X 离散型随机变量 连续型随机变量 分布律P{X=x i }= p i ( i =1,2,…) 概率密度f (x)数学期望(均值)E(X) ∑∞=1i i i p x (级数绝对收敛)⎰∞∞-dx x xf )((积分绝对收敛)方差D(X)=E{[X-E(X)]2} []∑-∞=12)(i i i p X E x⎰-∞∞-dx x f X E x)()]([2,}{},{jj i j j i p p y Y P y Y x X P •=====,}{},{•=====i j i i j i p p x X P y Y x X P=E(X 2)-[E(X)]2 (级数绝对收敛) (积分绝对收敛)函数数学期望E(Y)=E[g(X)] i i i p x g ∑∞=1)((级数绝对收敛)⎰∞∞-dx x f x g )()((积分绝对收敛)标准差?(X)=√D(X) . 二.数学期望与方差的性质1. c 为为任意常数时, E(c) = c , E(cX) = cE(X) , D(c) = 0 , D (cX) = c 2 D(X) .2.X,Y 为任意随机变量时, E (X ±Y)=E(X)±E(Y) .3. X 与Y 相互独立时, E(XY)=E(X)E(Y) , D(X ±Y)=D(X)+D(Y) .4. D(X) = 0⇔ P{X = C}=1 ,C 为常数.三.六种重要分布的数学期望和方差 E(X) D(X) 1.X~ (0-1)分布P{X=1}= p (0<p<1) p p (1- p) 2.X~ b (n,p) (0<p<1) n pn p (1- p)3.X~ ?(?) ? ?4.X~ U(a,b) (a+b)/2 (b-a) 2/125.X 服从参数为?的指数分布 ? ?26.X~ N (?,?2) ? ?2 四.矩的概念随机变量X 的k 阶(原点)矩E(X k ) k=1,2,… 随机变量X 的k 阶中心矩E{[X-E(X)] k }随机变量X 和Y 的k+l 阶混合矩E(X k Y l ) l=1,2,…随机变量X 和Y 的k+l 阶混合中心矩E{[X-E(X)] k [Y-E(Y)] l }第六章 样本和抽样分布一.基本概念总体X 即随机变量X ; 样本X 1 ,X 2 ,…,X n 是与总体同分布且相互独立的随机变量;样本值x 1 ,x 2 ,…,x n 为实数;n 是样本容量.统计量是指样本的不含任何未知参数的连续函数.如:样本均值∑==n i i X n X 11 样本方差()∑--==n i i X X n S 12211 样本标准差S样本k 阶矩∑==n i ki k X n A 11( k=1,2,…) 样本k 阶中心矩∑-==ni k i k X X n B 1)(1( k=1,2,…)二.抽样分布 即统计量的分布1.X 的分布 不论总体X 服从什么分布, E (X ) = E(X) , D (X ) = D(X) / n .特别,若X~ N (?,?2 ) ,则X ~ N (?, ?2 /n) .2.?2分布 (1)定义 若X ~N (0,1) ,则Y =∑=ni i X 12~ ?2(n)自由度为n 的?2分布.(2)性质 ①若Y~ ?2(n),则E(Y) = n , D(Y) = 2n .②若Y 1~ ?2(n 1) Y 2~ ?2(n 2) ,则Y 1+Y 2~ ?2(n 1 + n 2). ③若X~ N (?,?2 ), 则22)1(σS n -~ ?2(n-1),且X 与S 2相互独立.(3)分位点 若Y~ ?2(n),0< ? <1 ,则满足的点)()(),(),(22/122/212n n n n ααααχχχχ--和分别称为?2分布的上、下、双侧?分位点. 3. t 分布(1)定义 若X~N (0,1),Y~ ?2(n),且X,Y 相互独立,则t=nY X ~t(n)自由度为n 的t 分布.(2)性质①n →∞时,t 分布的极限为标准正态分布.②X ~N (?,?2 )时, nS X μ-~ t (n-1) . ③两个正态总体相互独立的样本 样本均值 样本方差X~ N (?1,?12 ) 且?12=?22=?2 X 1 ,X 2 ,…,X n1XS 12Y~ N (?2,?22 ) Y 1 ,Y 2 ,…,Y n2 YS 22则 212111)()(n n S Y X w +---μμ~ t (n 1+n 2-2) , 其中 2)1()1(212222112-+-+-=n n S n S n S w(3)分位点 若t ~ t (n) ,0 < ?<1 , 则满足的点)(),(),(2/n t n t n t ααα±-分别称t 分布的上、下、双侧?分位点. 注意: t 1- ? (n) = - t ? (n).4.F 分布 (1)定义 若U~?2(n 1), V~ ?2(n 2), 且U,V 相互独立,则F=21n V n U ~F(n 1,n 2)自由度为(n 1,n 2)的F 分布.(2)性质(条件同3.(2)③)22212221σσS S ~F(n 1-1,n 2-1)(3)分位点 若F~ F(n 1,n 2) ,0< ? <1,则满足的点),(),(),,(),,(212/1212/21121n n F n n F n n F n n F αααα--和分别称为F 分布的上、下、双侧?分位点. 注意: .).(1),(12211n n F n n F αα=- 第七章 参数估计一.点估计 总体X 的分布中有k 个待估参数?1, ?2,…, ?k .X 1 ,X 2 ,…,X n 是X 的一个样本, x 1 ,x 2 ,…,x n 是样本值.1.矩估计法先求总体矩⎪⎩⎪⎨⎧===),,,(),,,(),,,(2121222111k k k k k θθθμμθθθμμθθθμμ 解此方程组,得到⎪⎩⎪⎨⎧===),,,(),,,(),,,(2121222111kk k k k μμμθθμμμθθμμμθθ , 以样本矩A l 取代总体矩? l ( l=1,2,…,k)得到矩估计量⎪⎪⎩⎪⎪⎨⎧===∧∧∧),,,(),,,(),,,(2121222111k k k k k A A A A A A A A A θθθθθθ,若代入样本值则得到矩估计值. 2.最大似然估计法若总体分布形式(可以是分布律或概率密度)为p(x, ?1, ?2,…, ?k ),称样本X 1 ,X 2 ,…,X n 的联合分布∏==ni k i k x p L 12121),,,,(),,,(θθθθθθ 为似然函数.取使似然函数达到最大值的∧∧∧k θθθ,,,21 ,称为参数?1, ?2,…,?k 的最大似然估计值,代入样本得到最大似然估计量.若L(?1, ?2,…, ?k )关于?1, ?2,…, ?k 可微,则一般可由似然方程组 0=∂∂i L θ 或 对数似然方程组 0ln =∂∂iLθ (i =1,2,…,k) 求出最大似然估计. 3.估计量的标准(1) 无偏性 若E(∧θ)=?,则估计量∧θ称为参数?的无偏估计量.不论总体X 服从什么分布, E (X )= E(X) , E(S 2)=D(X), E(A k )=?k =E(X k ),即样本均值X , 样本方差S 2,样本k 阶矩A k 分别是总体均值E(X),方差D(X),总体k 阶矩?k 的无偏估计,(2)有效性 若E(∧θ1 )=E(∧θ2)= ?, 而D(∧θ1)< D(∧θ2), 则称估计量∧θ1比∧θ2有效.(3)一致性(相合性) 若n →∞时,θθP→∧,则称估计量∧θ是参数?的相合估计量. 二.区间估计1.求参数?的置信水平为1-?的双侧置信区间的步骤(1)寻找样本函数W=W(X 1 ,X 2 ,…,X n ,?),其中只有一个待估参数?未知,且其分布完全确定.(2)利用双侧?分位点找出W 的区间(a,b),使P{a<W <b}=1-?. (3)由不等式a<W<b 解出θθθ<<则区间(θθ,)为所求. 2.单个正态总体待估参数 其它参数 W 及其分布 置信区间? ?2已知nX σμ-~N (0,1) (2/ασz n X ±) ? ?2未知 nS X μ-~ t (n-1) )1((2/-±n t n S X α ?2 ?未知22)1(σS n -~ ?2(n-1)))1()1(,)1()1((22/1222/2-----n S n n S n ααχχ 3.两个正态总体 (1)均值差? 1-? 2其它参数 W 及其分布 置信区间已知2221,σσ22212121)(n n Y X σσμμ+--- ~ N(0,1) )(2221212n n z Y X σσα+±-未知22221σσσ== 212111)(n n S Y X w+---μμ~t(n 1+n 2-2))11)2((21212n n S n n t Y X w+-+±-α 其中S w 等符号的意义见第六章二. 3 (2)③.(2) ? 1,? 2未知, W=22212221σσS S ~ F(n 1-1,n 2-1),方差比?12/?22的置信区间为注意:对于单侧置信区间,只需将以上所列的双侧置信区间中的上(下)限中的下标?/2改为?,另外的下(上)限取为-? (?)即可.。
概率论与数理统计笔记
生命是永恒不断的创造,因为在它内部蕴含着过剩的精力,它不断流溢,越出时间和空间的界限,它不停地追求,以形形色色的自我表现的形式表现出来。
--泰戈尔新东方考研数学冲刺·概率论与数理统计一、基本概念总结1、概念网络图⎪⎪⎪⎪⎩⎪⎪⎪⎪⎨⎧⎪⎩⎪⎨⎧→假设检验参数估计数分布))(多维随机变量的函四大统计分布(正态数理统计理大数定律和中心极限定F t ,,,2χ2、最重要的5个概念(1)古典概型(由比例引入概率)例1:3男生,3女生,从中挑出4个,问男女相等的概率?例2:有5个白色珠子和4个黑色珠子,从中任取3个,问其中至少有1个是黑色的概率?(2)随机变量与随机事件的等价(将事件数字化))()(A P x X P ==⎪⎪⎪⎪⎭⎪⎪⎪⎪⎬⎫→→≤≤=→−−→−→-→≤=→−−→−、协方差、相关系数)数字特征(期望、方差)两大分布(均匀、正态二维随机变量随机事件)数字特征(期望、方差正态)、几何、均匀、指数、、二项、泊松、超几何八大分布(一维随机变量随机事件数字化数字化),(),(),()(10)()()()(y Y x X P y x F Y X AB P x X P x F X A P ω)(),(AB P y Y x X P ===例3:已知甲、乙两箱中装有两种产品,其中甲箱中装有3件合格品和3件次品,乙箱中仅装有3件合格品。
从甲箱中任取3件产品放入乙箱后,求:(1) 乙箱中次品件数X 的数学期望。
(2) 从乙箱中任取一件产品是次品的概率。
例4:将一枚均匀硬币连掷三次,以X 表示三次试验中出现正面的次数,Y 表示出现正面的次数与出现反面的次数的差的绝对值,求(X ,Y )的联合分布律。
(3)分布函数(将概率与函数联系起来) )()(x X P x F ≤=(4)离散与连续的关系dx x f x X P )()(==dxdy y x f y Y x X P ),(),(===例5:见“数字特征”的公式。
《概率论与数理统计》笔记
《概率论和数理统计》笔记一、课程导读“概率论和数理统计”是研究随机现象的规律性的一门学科在自然界,在人们的实践活动中,所遇到的现象一般可以分为两类:确定性现象随机现象确定性现象在一定的条件下,必然会出现某种确定的结果.例如,向上抛一枚硬币,由于受到地心引力的作用,硬币上升到某一高度后必定会下落.我们把这类现象称为确定性现象(或必然现象).同样,任何物体没有受到外力作用时,必定保持其原有的静止或等速运动状态;导线通电后,必定会发热;等等也都是确定性现象.随机现象在一定的条件下,可能会出现各种不同的结果,也就是说,在完全相同的条件下,进行一系列观测或实验,却未必出现相同的结果.例如,抛掷一枚硬币,当硬币落在地面上时,可能是正面(有国徽的一面)朝上,也可能是反面朝上,在硬币落地前我们不能预知究竟哪一面朝上.我们把这类现象称为随机现象(或偶然现象).同样,自动机床加工制造一个零件,可能是合格品,也可能是不合格品;射击运动员一次射击,可能击中10环,也可能击中9环8环……甚至脱靶;等等也都是随机现象.统计规律性对随机现象,从表面上看,由于人们事先不能知道会出现哪一种结果,似乎是不可捉摸的;其实不然.人们通过实践观察到并且证明了,在相同的条件下,对随机现象进行大量的重复试验(观测),其结果总能呈现出某种规律性.例如,多次重复抛一枚硬币,正面朝上和反面朝上的次数几乎相等;对某个靶进行多次射击,虽然各次弹着点不完全相同,但这些点却按一定的规律分布;等等.我们把随机现象的这种规律性称为统计规律性.●使用例子摸球游戏中谁是真正的赢家在街头巷尾常见一类“摸球游戏”.游戏是这样的:一袋中装有16个大小、形状相同,光滑程度一致的玻璃球.其中8个红色、8个白色.游戏者从中一次摸出8个,8个球中.当红白两种颜色出现以下比数时.摸球者可得到相应的“奖励”或“处罚”:结果(比数) A(8:0)B(7:1)C(6:2)D(5:3)E(4:4)奖金(元)10 1 0.5 0.2 -2 注:表中“-2”表示受罚2元解: 此游戏(实为赌博),从表面上看非常有吸引力,5种可能出现的结果.有4种可得奖.且最高奖达10元.而只有一种情况受罚.罚金只是2元.因此就吸引了许多人特别是好奇的青少年参加.结果却是受罚的多,何以如此呢?其实.这就是概率知识的具体使用:现在是从16个球中任取8个.所有可能的取法为816C 种.即基本事件总数有限.又因为是任意抽取.保证了等可能性.是典型的古典概型问题.由古典概率计算公式.很容易得到上述5种结果.其对应的概率分别是:3807048730121800099460000155404848385828681878.C C C P(E);.C C 2C P(D);.C C 2C P(C);.C C 2C P(B);.C 2P(A)816816816816816==========假设进行了1000次摸球试验, 5种情况平均出现的次数分别为:0、10、122、487、381次,经营游戏者预期可得2×381-(10×0+1×10+0.5×122+0.2×487) =593.6(元). 这个例子的结论可能会使我们大吃一惊,然而正是在这一惊之中.获得了对古典概率更具体、更生动的知识.戏院设座问题乙两戏院在竞争500名观众,假设每个观众完全随意地选择一个戏院,且观众之间选择戏院是彼此独立的,问每个戏院至少应该设多少个座位才能保证观众因缺少座位而离开的概率小于5%?解 由于两个戏院的情况相同,故只需考虑甲戏院即可。
考研数学概率论与数理统计笔记知识点(全)
三 二二维连续型随机变量量(积分积出来的就是连续的)
1.定义:概率密度积分(二二重积分)
2.联合概率密度
1)性质:1.非非负性;2.规范性
2)应用用:求P,就是求二二重积分
在f(x,y)的连续点上,分布求二二阶倒数就是概率密度
步骤:1)画图(为了了解不不等式)
2)讨论
3)代入入(注意端点)
第三章 多维随机变量量及其分布
知识点:一一 二二维随机变量量及其分布函数 二二 二二维离散型随机变量量 三 二二维连续型随机变量量 四 二二维随 机变量量函数的分布
一一 二二维随机变量量及其分布函数
1.二二维随机变量量就是一一个(X,Y)向量量
要注意是一一维的(是用用一一个变量量表示)
4.离散+连续(一一定是使用用全概率公式的)
定义:X为离散型,Y为连续型,且相互独立立
六 全概率公式与⻉贝叶斯公式(关键在于完备事件组)
1.完备事件组:互斥是对立立的前提条件
2.全概率公式:由因到果(推导,画图)(全部路路径)
3.⻉贝叶斯公式:由果到因(推导,画图)(所占的比比例例)
Note:关键是1.完备事件组必须完备;2.要画图3注意抽签原理理
题型一一:概率的基本计算
1.事件决定概率,但是概率推不不出事件
3.边缘概率密度
1)具体就是边缘分布函数求导(详⻅见笔记)
Note:注意边缘的公式,在求时,注意取值范围,以及上下限(一一根直线传过去)(类似于 二二重积分的先积部分——后积先定限,限内画条线)
2)G是从几几何看出来的,不不要死记公式,要结合图像(G为非非零区域)
Note:1.在写公式之前要先保证分⺟母不不为0,即要先确定范围
概率论与数理统计重点笔记
概率论与数理统计复习第一章 概率论的基本概念一.基本概念随机试验E:(1)可以在相同的条件下重复地进行;(2)每次试验的可能结果不止一个,并且能事先明确试验的所有可能结果;(3)进行一次试验之前不能确定哪一个结果会出现.样本空间S: E 的所有可能结果组成的集合. 样本点(基本事件):E 的每个结果.随机事件(事件):样本空间S 的子集.必然事件(S):每次试验中一定发生的事件. 不可能事件(Φ):每次试验中一定不会发生的事件.二. 事件间的关系和运算1.A ⊂B(事件B 包含事件A )事件A 发生必然导致事件B 发生.2.A ∪B(和事件)事件A 与B 至少有一个发生.3. A ∩B=AB(积事件)事件A 与B 同时发生.4. A -B(差事件)事件A 发生而B 不发生.5. AB=Φ (A 与B 互不相容或互斥)事件A 与B 不能同时发生.6. AB=Φ且A ∪B=S (A 与B 互为逆事件或对立事件)表示一次试验中A 与B 必有一个且仅有一个发生. B=A, A=B .运算规则 交换律 结合律 分配律 德•摩根律 B A B A = B A B A =三. 概率的定义与性质1.定义 对于E 的每一事件A 赋予一个实数,记为P(A),称为事件A 的概率.(1)非负性 P(A)≥0 ; (2)归一性或规范性 P(S)=1 ;(3)可列可加性 对于两两互不相容的事件A 1,A 2,…(A i A j =φ, i ≠j, i,j=1,2,…),P(A 1∪A 2∪…)=P( A 1)+P(A 2)+…2.性质(1) P(Φ) = 0 , 注意: A P(A)=0 .(2)有限可加性 对于n 个两两互不相容的事件A 1,A 2,…,A n ,P(A 1∪A 2∪…∪A n )=P(A 1)+P(A 2)+…+P(A n ) (有限可加性与可列可加性合称加法定理)(3)若A ⊂B, 则P(A)≤P(B), P(B -A)=P(B)-P(A) .(4)对于任一事件A, P(A)≤1, P(A)=1-P(A) .(5)广义加法定理 对于任意二事件A,B ,P(A ∪B)=P(A)+P(B)-P(AB) .对于任意n 个事件A 1,A 2,…,A n()()()()+∑+∑-∑=≤<<≤≤<≤=n k j i k j i n j i j i n i i n A A A P A A P A P A A A P 11121 …+(-1)n-1P(A 1A 2…A n )四.等可能(古典)概型1.定义 如果试验E 满足:(1)样本空间的元素只有有限个,即S={e 1,e 2,…,e n };(2)每一个基本事件的概率相等,即P(e 1)=P(e 2)=…= P(e n ).则称试验E 所对应的概率模型为等可能(古典)概型.2.计算公式 P(A)=k / n 其中k 是A 中包含的基本事件数, n 是S 中包含的基本事件总数.五.条件概率1.定义 事件A 发生的条件下事件B 发生的条件概率P(B|A)=P(AB) / P(A) ( P(A)>0).2.乘法定理 P(AB)=P(A) P (B|A) (P(A)>0); P(AB)=P(B) P (A|B) (P(B)>0).P(A 1A 2…A n )=P(A 1)P(A 2|A 1)P(A 3|A 1A 2)…P(A n |A 1A 2…A n-1) (n ≥2, P(A 1A 2…A n-1) > 0)3. B 1,B 2,…,B n 是样本空间S 的一个划分(B i B j =φ,i ≠j,i,j=1,2,…,n, B 1∪B 2∪…∪B n =S) ,则当P(B i )>0时,有全概率公式 P(A)=()()i ni i B A P B P ∑=1当P(A)>0, P(B i )>0时,有贝叶斯公式P (B i |A)=()()()()()()∑==n i i i i i i B A P B P B A P B P A P AB P 1. 六.事件的独立性1.两个事件A,B,满足P(AB) = P(A) P(B)时,称A,B 为相互独立的事件.(1)两个事件A,B 相互独立⇔ P(B)= P (B|A) .(2)若A 与B ,A 与B ,A 与B, ,A 与B 中有一对相互独立,则另外三对也相互独立.2.三个事件A,B,C 满足P(AB) =P(A) P(B), P(AC)= P(A) P(C), P(BC)= P(B) P(C),称A,B,C 三事件两两相互独立. 若再满足P(ABC) =P(A) P(B) P(C),则称A,B,C 三事件相互独立.3.n 个事件A 1,A 2,…,A n ,如果对任意k (1<k ≤n),任意1≤i 1<i 2<…<i k ≤n.有()()()()k k i i i i i i A P A P A P A A A P 2121=,则称这n 个事件A 1,A 2,…,A n 相互独立.第二章 随机变量及其概率分布一.随机变量及其分布函数1.在随机试验E 的样本空间S={e}上定义的单值实值函数X=X (e)称为随机变量.2.随机变量X 的分布函数F(x)=P{X ≤x} , x 是任意实数. 其性质为:(1)0≤F(x)≤1 ,F(-∞)=0,F(∞)=1. (2)F(x)单调不减,即若x 1<x 2 ,则 F(x 1)≤F(x 2).(3)F(x)右连续,即F(x+0)=F(x). (4)P{x 1<X≤x 2}=F(x 2)-F(x 1).二.离散型随机变量 (只能取有限个或可列无限多个值的随机变量)1.离散型随机变量的分布律 P{X= x k }= p k (k=1,2,…) 也可以列表表示. 其性质为:(1)非负性 0≤P k ≤1 ; (2)归一性 11=∑∞=k k p .2.离散型随机变量的分布函数 F(x)=∑≤xX k k P 为阶梯函数,它在x=x k (k=1,2,…)处具有跳跃点,其跳跃值为p k =P{X=x k } .3.三种重要的离散型随机变量的分布(1)X~(0-1)分布 P{X=1}= p ,P{X=0}=1–p (0<p<1) .(2)X~b(n,p)参数为n,p 的二项分布P{X=k}=()k n k p p k n --⎪⎪⎭⎫ ⎝⎛1(k=0,1,2,…,n) (0<p<1) (3))X~π(λ)参数为λ的泊松分布 P{X=k}=λλ-e k k !(k=0,1,2,…) (λ>0) 三.连续型随机变量1.定义 如果随机变量X 的分布函数F(x)可以表示成某一非负函数f(x)的积分F(x)=()dt t f x⎰∞-,-∞< x <∞,则称X 为连续型随机变量,其中f (x)称为X 的概率密度(函数).2.概率密度的性质(1)非负性 f(x)≥0 ; (2)归一性 ⎰∞∞-dx x f )(=1 ;(3) P{x 1<X ≤x 2}=⎰21)(x x dx x f ; (4)若f (x)在点x 处连续,则f (x)=F / (x) .注意:连续型随机变量X 取任一指定实数值a 的概率为零,即P{X= a}=0 .3.三种重要的连续型随机变量的分布(1)X ~U (a,b) 区间(a,b)上的均匀分布 ⎩⎨⎧=-0)(1a b x f 其它b x a << . (2)X 服从参数为θ的指数分布.()⎩⎨⎧=-0/1θθx e x f 00≤>x x 若若 (θ>0). (3)X~N (μ,σ2 )参数为μ,σ的正态分布 222)(21)(σμσπ--=x e x f -∞<x<∞, σ>0.特别, μ=0, σ2 =1时,称X 服从标准正态分布,记为X~N (0,1),其概率密度2221)(x e x -=πϕ , 标准正态分布函数 ⎰=Φ∞--x t dt e x 2221)(π , Φ(-x)=1-Φ(x) .若X ~N ((μ,σ2), 则Z=σμ-X ~N (0,1), P{x 1<X ≤x 2}=Φ(σμ-2x )-Φ(σμ-1x ).若P{Z>z α}= P{Z<-z α}= P{|Z|>z α/2}= α,则点z α,-z α, ±z α/ 2分别称为标准正态分布的上,下,双侧α分位点. 注意:Φ(z α)=1-α , z 1- α= -z α.四.随机变量X 的函数Y= g (X)的分布1.离散型随机变量的函数若g(x k ) (k=1,2,…)的值全不相等,则由上表立得Y=g(X)的分布律.若g(x k ) (k=1,2,…)的值有相等的,则应将相等的值的概率相加,才能得到Y=g(X)的分布律.2.连续型随机变量的函数若X 的概率密度为f X (x),则求其函数Y=g(X)的概率密度f Y (y)常用两种方法:(1)分布函数法 先求Y 的分布函数F Y (y)=P{Y ≤y}=P{g(X)≤y}=()()dx x f k y X k∑⎰∆其中Δk (y)是与g(X)≤y 对应的X 的可能值x 所在的区间(可能不只一个),然后对y 求导即得f Y (y)=F Y /(y) .(2)公式法 若g(x)处处可导,且恒有g /(x)>0 (或g / (x)<0 ),则Y=g (X)是连续型随机变量,其概率密度为 ()()()()⎩⎨⎧'=0y h y h f y f X Y 其它βα<<y 其中h(y)是g(x)的反函数 , α= min (g (-∞),g (∞)) β= max (g (-∞),g (∞)) .如果f (x)在有限区间[a,b]以外等于零,则 α= min (g (a),g (b)) β= max (g (a),g (b)) .第三章 二维随机变量及其概率分布一.二维随机变量与联合分布函数1.定义 若X 和Y 是定义在样本空间S 上的两个随机变量,则由它们所组成的向量(X,Y)称为二维随机向量或二维随机变量.对任意实数x,y,二元函数F(x,y)=P{X ≤x,Y ≤y}称为(X,Y)的(X 和Y 的联合)分布函数.2.分布函数的性质(1)F(x,y)分别关于x 和y 单调不减.(2)0≤F(x,y)≤1 , F(x,- ∞)=0, F(-∞,y)=0, F(-∞,-∞)=0, F(∞,∞)=1 .(3) F(x,y)关于每个变量都是右连续的,即 F(x+0,y)= F(x,y), F(x,y+0)= F(x,y) .(4)对于任意实数x 1<x 2 , y 1<y 2P{x 1<X ≤x 2 , y 1<Y ≤y 2}= F(x 2,y 2)- F(x 2,y 1)- F(x 1,y 2)+ F(x 1,y 1)二.二维离散型随机变量及其联合分布律1.定义 若随机变量(X,Y)只能取有限对或可列无限多对值(x i ,y j ) (i ,j =1,2,… )称(X,Y)为二维离散型随机变量.并称P{X= x i ,Y= y j }= p i j 为(X,Y)的联合分布律.也可列表表示.2.性质 (1)非负性 0≤p i j ≤1 .(2)归一性 ∑∑=i j ij p 1 .3. (X,Y)的(X 和Y 的联合)分布函数F(x,y)=∑∑≤≤x x y y ij i j p三.二维连续型随机变量及其联合概率密度1.定义 如果存在非负的函数f (x,y),使对任意的x 和y,有F(x,y)=⎰⎰∞-∞-y xdudv v u f ),( 则称(X,Y)为二维连续型随机变量,称f(x,y)为(X,Y)的(X 和Y 的联合)概率密度.2.性质 (1)非负性 f (x,y)≥0 . (2)归一性 1),(=⎰⎰∞∞-∞∞-dxdy y x f . (3)若f (x,y)在点(x,y)连续,则yx y x F y x f ∂∂∂=),(),(2 (4)若G 为xoy 平面上一个区域,则⎰⎰=∈Gdxdy y x f G y x P ),(}),{(.四.边缘分布1. (X,Y)关于X 的边缘分布函数 F X (x) = P{X ≤x , Y<∞}= F (x , ∞) .(X,Y)关于Y 的边缘分布函数 F Y (y) = P{X<∞, Y ≤y}= F (∞,y)2.二维离散型随机变量(X,Y)关于X 的边缘分布律 P{X= x i }= ∑∞=1j ij p = p i · ( i =1,2,…) 归一性 11=∑∞=•i i p .关于Y 的边缘分布律 P{Y= y j }= ∑∞=1i ij p = p ·j ( j =1,2,…) 归一性 11=∑∞=•j j p .3.二维连续型随机变量(X,Y)关于X 的边缘概率密度f X (x)=⎰∞∞-dy y x f ),( 归一性1)(=⎰∞∞-dx x f X关于Y 的边缘概率密度f Y (y)=x d y x f ⎰∞∞-),( 归一性1)(=⎰∞∞-dyy f Y五.相互独立的随机变量1.定义 若对一切实数x,y,均有F(x,y)= F X (x) F Y (y) ,则称X 和Y 相互独立.2.离散型随机变量X 和Y 相互独立⇔p i j = p i ··p ·j ( i ,j =1,2,…)对一切x i ,y j 成立.3.连续型随机变量X 和Y 相互独立⇔f (x,y)=f X (x)f Y (y)对(X,Y)所有可能取值(x,y)都成立.六.条件分布1.二维离散型随机变量的条件分布定义 设(X,Y)是二维离散型随机变量,对于固定的j,若P{Y=y j }>0,则称 },{j i j i p y Y x X P ==P{X=x i |Y=y j }为在Y= y j 条件下随机变量X 的条件分布律.同样,对于固定的i,若P{X=x i }>0,则称P{Y=y j |X=x i } 为在X=x i 条件下随机变量Y 的条件分布律.第四章 随机变量的数字特征一.数学期望和方差的定义随机变量X离散型随机变量 连续型随机变量 分布律P{X=x i }= p i ( i =1,2,…) 概率密度f (x)数学期望(均值)E(X) ∑∞=1i i i p x (级数绝对收敛)⎰∞∞-dx x xf )((积分绝对收敛) 方差D(X)=E{[X-E(X)]2} []∑-∞=12)(i i i p X E x ⎰-∞∞-dx x f X E x )()]([2 =E(X 2)-[E(X)]2 (级数绝对收敛) (积分绝对收敛) 函数数学期望E(Y)=E[g(X)] i i i p x g ∑∞=1)((级数绝对收敛) ⎰∞∞-dx x f x g )()((积分绝对收敛)标准差σ(X)=√D(X) .二.数学期望与方差的性质1. c 为为任意常数时, E(c) = c , E(cX) = cE(X) , D(c) = 0 , D (cX) = c 2 D(X) .2.X,Y 为任意随机变量时, E (X ±Y)=E(X)±E(Y) .3. X 与Y 相互独立时, E(XY)=E(X)E(Y) , D(X ±Y)=D(X)+D(Y) .4. D(X) = 0 ⇔ P{X = C}=1 ,C 为常数.三.六种重要分布的数学期望和方差 E(X) D(X)1.X~ (0-1)分布P{X=1}= p (0<p<1) p p (1- p),}{},{•=====i j i i j i p p x X P y Y x X P2.X~ b (n,p) (0<p<1) n p n p (1- p)3.X~ π(λ) λ λ4.X~ U(a,b) (a+b)/2 (b-a) 2/125.X 服从参数为θ的指数分布 θ θ26.X~ N (μ,σ2) μ σ2四.矩的概念随机变量X 的k 阶(原点)矩E(X k ) k=1,2,…随机变量X 的k 阶中心矩E{[X-E(X)] k }随机变量X 和Y 的k+l 阶混合矩E(X k Y l ) l=1,2,…随机变量X 和Y 的k+l 阶混合中心矩E{[X-E(X)] k [Y-E(Y)] l }第六章 样本和抽样分布一.基本概念总体X 即随机变量X ; 样本X 1 ,X 2 ,…,X n 是与总体同分布且相互独立的随机变量;样本值x 1 ,x 2 ,…,x n 为实数;n 是样本容量.统计量是指样本的不含任何未知参数的连续函数.如: 样本均值∑==n i i X n X 11 样本方差()∑--==n i i X X n S 12211 样本标准差S 样本k 阶矩∑==n i k i k X n A 11( k=1,2,…) 样本k 阶中心矩∑-==n i k i k X X n B 1)(1( k=1,2,…) 二.抽样分布 即统计量的分布 1.X 的分布 不论总体X 服从什么分布, E (X ) = E(X) , D (X ) = D(X) / n .特别,若X~ N (μ,σ2 ) ,则X ~ N (μ, σ2 /n) . 2.χ2分布 (1)定义 若X ~N (0,1 ) ,则Y =∑=ni i X 12~ χ2(n)自由度为n 的χ2分布.(2)性质 ①若Y~ χ2(n),则E(Y) = n , D(Y) = 2n .②若Y 1~ χ2(n 1) Y 2~ χ2(n 2) ,则Y 1+Y 2~ χ2(n 1 + n 2).③若X~ N (μ,σ2 ), 则22)1(σS n -~ χ2(n-1),且X 与S 2相互独立.(3)分位点 若Y~ χ2(n),0< α <1 ,则满足αχχχχαααα=<>=<=>--))}(())({()}({)}({22/122/212n Y n Y P n Y P n Y P的点)()(),(),(22/122/212n n n n ααααχχχχ--和分别称为χ2分布的上、下、双侧α分位点.3. t 分布(1)定义 若X~N (0,1 ),Y~ χ2(n),且X,Y 相互独立,则t=n Y X ~t(n)自由度为n 的t 分布. (2)性质①n →∞时,t 分布的极限为标准正态分布.②X ~N (μ,σ2 )时,n S X μ-~ t (n-1) . ③两个正态总体 相互独立的样本 样本均值 样本方差X~ N (μ1,σ12 ) 且σ12=σ22=σ2 X 1 ,X 2 ,…,X n1 X S 12Y~ N (μ2,σ22 ) Y 1 ,Y 2 ,…,Y n2 Y S 22则 212111)()(n n S Y X w +---μμ~ t (n 1+n 2-2) , 其中 2)1()1(212222112-+-+-=n n S n S n S w (3)分位点 若t ~ t (n) ,0 < α<1 , 则满足αααα=>=-<=>)}({)}({)}({2/n t t P n t t P n t t P的点)(),(),(2/n t n t n t ααα±-分别称t 分布的上、下、双侧α分位点.注意: t 1- α (n) = - t α (n).4.F 分布 (1)定义 若U~χ2(n 1), V~ χ2(n 2), 且U,V 相互独立,则F =21n V n U ~F(n 1,n 2)自由度为(n 1,n 2)的F 分布.(2)性质(条件同3.(2)③) 22212221σσS S ~F(n 1-1,n 2-1)(3)分位点 若F~ F(n 1,n 2) ,0< α <1,则满足)},({)},({21121n n F F P n n F F P αα-<=>ααα=<>=-))},(()),({(212/1212/n n F F n n F F P的点),(),(),,(),,(212/1212/21121n n F n n F n n F n n F αααα--和分别称为F 分布的上、下、双侧α分位点. 注意: .).(1),(12211n n F n n F αα=-第七章 参数估计一.点估计 总体X 的分布中有k 个待估参数θ1, θ2,…, θk .X 1 ,X 2 ,…,X n 是X 的一个样本, x 1 ,x 2 ,…,x n 是样本值.1.矩估计法先求总体矩⎪⎩⎪⎨⎧===),,,(),,,(),,,(2121222111k k k k k θθθμμθθθμμθθθμμ 解此方程组,得到⎪⎩⎪⎨⎧===),,,(),,,(),,,(2121222111kk k k k μμμθθμμμθθμμμθθ ,以样本矩A l 取代总体矩μ l ( l=1,2,…,k)得到矩估计量⎪⎪⎩⎪⎪⎨⎧===∧∧∧),,,(),,,(),,,(2121222111k k k k k A A A A A A A A A θθθθθθ,若代入样本值则得到矩估计值.2.最大似然估计法若总体分布形式(可以是分布律或概率密度)为p(x, θ1, θ2,…, θk ),称样本X 1 ,X 2 ,…,X n 的联合分布∏==ni k i k x p L 12121),,,,(),,,(θθθθθθ 为似然函数.取使似然函数达到最大值的∧∧∧k θθθ,,,21 ,称为参数θ1, θ2,…,θk 的最大似然估计值,代入样本得到最大似然估计量.若L(θ1, θ2,…, θk )关于θ1, θ2,…, θk 可微,则一般可由似然方程组 0=∂∂i L θ 或 对数似然方程组 0ln =∂∂iL θ (i =1,2,…,k) 求出最大似然估计. 3.估计量的标准(1) 无偏性 若E(∧θ)=θ,则估计量∧θ称为参数θ的无偏估计量.不论总体X 服从什么分布, E (X )= E(X) , E(S 2)=D(X), E(A k )=μk =E(X k ),即样本均值X , 样本方差S 2,样本k 阶矩A k 分别是总体均值E(X),方差D(X),总体k 阶矩μk 的无偏估计,(2)有效性 若E(∧θ1 )=E(∧θ2)= θ, 而D(∧θ1)< D(∧θ2), 则称估计量∧θ1比∧θ2有效.(3)一致性(相合性) 若n →∞时,θθP →∧,则称估计量∧θ是参数θ的相合估计量.二.区间估计1.求参数θ的置信水平为1-α的双侧置信区间的步骤(1)寻找样本函数W=W(X 1 ,X 2 ,…,X n ,θ),其中只有一个待估参数θ未知,且其分布完全确定.(2)利用双侧α分位点找出W 的区间(a,b),使P{a<W <b}=1-α.(3)由不等式a<W<b 解出θθθ<<则区间(θθ,)为所求.2.单个正态总体待估参数 其它参数 W 及其分布 置信区间 μ σ2已知 n X σμ-~N (0,1) (2/ασz n X ±) μ σ2未知n S X μ-~ t (n-1) )1((2/-±n t n S X α σ2 μ未知22)1(σS n -~ χ2(n-1) ))1()1(,)1()1((22/1222/2-----n S n n S n ααχχ 3.两个正态总体(1)均值差μ 1-μ 2 其它参数 W 及其分布 置信区间已知2221,σσ 22212121)(n n Y X σσμμ+--- ~ N(0,1) )(2221212n n z Y X σσα+±-未知22221σσσ== 212111)(n n S Y X w +---μμ~t(n 1+n 2-2) )11)2((21212n n S n n t Y X w +-+±-α 其中S w 等符号的意义见第六章二. 3 (2)③. (2) μ 1,μ 2未知, W=22212221σσS S ~ F(n 1-1,n 2-1),方差比σ12/σ22的置信区间为 ))1,1(1,)1,1(1(212/12221212/2221----⋅-n n F S S n n F S S αα 注意:对于单侧置信区间,只需将以上所列的双侧置信区间中的上(下)限中的下标α/2改为α,另外的下(上)限取为-∞ (∞)即可.。
概率论与数理统计 笔记
概率论与数理统计笔记概率论的公理化定义1. 相关基本概念:我们首先定义以下概念:至此,我们将试验、事件等概念与集合的概念相联系,显然,我们会有以下的运算性质:2. 事件之间的关系以及运算(本质为集合运算)经过简单的推导可以得出以下运算性质:3. 事件的运算性质经过以上铺垫,我们可以引出频率、概率的定义:4. 频率 (frequency)定义:设随机事件a在n次重复试验中发生了m次,则称比值为事件a在n次重复试验中发生的「频率」。
频率越大,事件a发生就越频繁,可以用频率来预测事件a的发生的可能性大小。
当重复试验次数越多,n越大时,频率越逐渐趋于稳定于某个常数。
5. 概率的公理化定义(前苏联柯尔莫哥洛夫首次提出)设是随机试验的样本空间,对于每个事件,赋予一个实数,记为,称为事件a的「概率」,如果集合函数满足一下三个条件:理解:概率的本质一种映射,是一种将每个事件映射给一个实数的映射。
并且满足以上三个性质。
另外,注意一个常记的技巧:由以上概率的公理化定义推导出的性质:1.不可能事件的概率为02.有限可加性3.逆事件有4.减法公式5.单调性6.容斥原理,可推广至多个事件古典概型与几何概型古典概型是概率论的经典研究内容。
古典概型是指,如果一个随机试验,其中包含有限个样本点,并且所有样本点的概率都相等,那么我们就称该随机试验为古典概型。
而几何概型与以上定义基本相同,只不过包含了无限个样本点(对于几何图形来说,一块区域也包含了无穷个点)我们很容易就能够得到古典概型的计算公式(由可列可加性)关于古典概型的具体例题与技巧在此不再赘述。
如何定性认识古典概型的概率?我们可以认为,这种概率代表了一个试验中事件发生的可能性,可以认为是“ 进行无穷次试验之后事件发生频率的趋近值”。
利用这种可能性,我们可以最优化实际的决策。
条件概率与乘法公式条件概率的引入,是为了解决在某事件已经发生(或者指定某条件)的情况下具体事件的概率。
《概率论与数理统计》学习笔记
《概率论与数理统计》(19)电子科技大学应用数学学院,徐全智吕恕主编。
2004版第6章数理统计的基本概念概率论与数理统计是两个紧密联系的姊妹学科,概率论是数理统计学的理论基础,而数理统计学则是概率论的重要应用.数理统计学是使用概率论和数学的方法,研究如何用有效的方式收集带有随机误差的数据,并在设定的模型下,对收集的数据进行分析,提取数据中的有用信息,形成统计结论,为决策提供依据. 这就不难理解,数理统计应用的广泛性,几乎渗透到人类活动的一切领域! 如:农业、生物和医学领域的“生物统计”,教育心理学领域的“教育统计”,管理领域的“计量经济”,金融领域的“保险统计”等等,这些统计方法的共同基础都是数理统计.数理统计学的内容十分丰富,概括起来可以分为两大类:其一是研究如何用有效的方式去收集随机数据,即抽样理论和试验设计;其二是研究如何有效地使用随机数据对所关心的问题做出合理的、尽可能精确和可靠的结论,即统计推断.本书主要介绍统计推断的基本内容和基本方法. 在这一章中先给出数理统计中一些必要的基本概念,然后给出正态总体抽样分布的一些重要结论.6.1总体、样本与统计量一、总体在数理统计中,我们将研究对象的全体称为总体或母体,而把组成总体的每个基本元素称为个体.二、样本样本是按一定的规定从总体中抽出的一部分个体" 这里的“按一定的规定”,是指为保证总体中的每一个个体有同等的被抽出的机会而采取的一些措施" 取得样本的过程,称为抽样.三、统计量6.2抽样分布统计量是我们对总体的分布规律或数字特征进行推断的基础. 由于统计量是随机变量,所以在使用统计量进行统计推断时必须要知道它的分布. 统计量的分布称为抽样分布.一、三个重要分布二、抽样分布定理6.3应用一、顺序统计量及其应用二、极值的分布及其应用。
概率论与数理统计读书笔记
概率论与数理统计读书笔记概率论与数理统计是一门基础而重要的学科,涵盖了很多实际问题的分析和解决方法。
在本次阅读中,我对概率论与数理统计的相关知识有了更深刻的理解。
一、概率论部分1.概率论的基本概念概率论是研究事件发生的可能性的学科,与我们日常生活息息相关。
在概率论的基本概念中,概率是其核心之一,它是一个在0和1之间的数值,反映出某个事件发生的可能性大小。
2.随机变量与概率分布随机变量是一个将事件映射到实数上的函数,一般表示为X,通过它可以对事件空间进行量化和分析。
概率分布是随机变量的取值和对应概率的对应关系,定义了随机变量的所有可能取值以及它们发生的概率大小。
3.常见概率分布常见的概率分布包括离散型概率分布和连续型概率分布。
离散型概率分布例如二项分布、泊松分布等,而连续型概率分布则包括正态分布、指数分布等等。
二、数理统计部分1.统计学的基本概念统计学是一个非常广泛的学科,主要研究如何通过搜集数据和样本,来推导总体特征和情况,推断出总体的性质和规律。
在统计学的基本概念中,总体和样本是其中两个重要的概念,总体是由我们想要分析的所有对象组成的集合,样本则是总体的一个部分。
2.描述统计与推论统计在统计学中,描述统计和推论统计都是非常重要的概念,它们的作用不同。
描述统计是通过对样本数据的统计描述,来探究数据的均值、方差、标准差等参数,来描述数据集的总体情况;而推论统计则是根据样本数据推论总体特征,来确定整体情况的分析方法。
3.假设检验和置信区间在推论统计中,假设检验和置信区间是两个非常重要的工具。
假设检验是一种能够根据样本得到的研究结果,来推论总体特征的方法。
而置信区间则是关于一个参数值的一定程度置信的一个区间,也称为置信水平区间。
综上所述,概率论与数理统计对于我们理解概率与统计的基本功能、场景及一些相关知识做出了详细的阐述与分析,非常实用。
对于学术研究、工程领域及相关行业人员而言,掌握概率论与数理统计的核心概念与方法是非常必要的。
概率论与数理统计同济笔记
概率论与数理统计同济笔记以下是概率论与数理统计的同济大学笔记,供您参考:
1. 概率论的基本概念
样本空间与随机事件
概率的公理化定义与性质
条件概率与独立性
2. 随机变量及其分布
随机变量的定义与性质
离散型随机变量及其分布
连续型随机变量及其分布
随机变量的函数的分布
3. 多维随机变量及其分布
二维随机变量及其分布
边缘分布与条件分布
随机变量的独立性
多维随机变量的函数的分布
4. 随机变量的数字特征
数学期望与方差
协方差与相关系数
大数定律与中心极限定理
5. 数理统计基础
统计量与抽样分布
点估计与估计量的评价标准
区间估计与假设检验
方差分析与回归分析
6. 概率论在金融中的应用
期望、方差与风险度量
资本资产定价模型(CAPM)与套利定价理论(APT)风险管理与保险精算
期权定价与风险管理
7. 概率论在信息科学中的应用
信息论基础与熵的概念
贝叶斯推断与决策分析
马尔可夫链蒙特卡洛方法(MCMC)在信息科学中的应用数据挖掘与机器学习中的概率论方法
8. 概率论在其他领域的应用
在物理、化学和生物中的概率论应用
在社会科学中的概率论应用
在工程技术和人工智能中的概率论应用。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
《概率论和数理统计》笔记一、课程导读“概率论和数理统计”是研究随机现象的规律性的一门学科在自然界,在人们的实践活动中,所遇到的现象一般可以分为两类:确定性现象随机现象确定性现象在一定的条件下,必然会出现某种确定的结果.例如,向上抛一枚硬币,由于受到地心引力的作用,硬币上升到某一高度后必定会下落.我们把这类现象称为确定性现象(或必然现象).同样,任何物体没有受到外力作用时,必定保持其原有的静止或等速运动状态;导线通电后,必定会发热;等等也都是确定性现象.随机现象在一定的条件下,可能会出现各种不同的结果,也就是说,在完全相同的条件下,进行一系列观测或实验,却未必出现相同的结果.例如,抛掷一枚硬币,当硬币落在地面上时,可能是正面(有国徽的一面)朝上,也可能是反面朝上,在硬币落地前我们不能预知究竟哪一面朝上.我们把这类现象称为随机现象(或偶然现象).同样,自动机床加工制造一个零件,可能是合格品,也可能是不合格品;射击运动员一次射击,可能击中10环,也可能击中9环8环……甚至脱靶;等等也都是随机现象.统计规律性对随机现象,从表面上看,由于人们事先不能知道会出现哪一种结果,似乎是不可捉摸的;其实不然.人们通过实践观察到并且证明了,在相同的条件下,对随机现象进行大量的重复试验(观测),其结果总能呈现出某种规律性.例如,多次重复抛一枚硬币,正面朝上和反面朝上的次数几乎相等;对某个靶进行多次射击,虽然各次弹着点不完全相同,但这些点却按一定的规律分布;等等.我们把随机现象的这种规律性称为统计规律性.●使用例子摸球游戏中谁是真正的赢家在街头巷尾常见一类“摸球游戏”.游戏是这样的:一袋中装有16个大小、形状相同,光滑程度一致的玻璃球.其中8个红色、8个白色.游戏者从中一次摸出8个,8个球中.当红白两种颜色出现以下比数时.摸球者可得到相应的“奖励”或“处罚”:结果(比数) A(8:0)B(7:1)C(6:2)D(5:3)E(4:4)奖金(元)10 1 0.5 0.2 -2 注:表中“-2”表示受罚2元解: 此游戏(实为赌博),从表面上看非常有吸引力,5种可能出现的结果.有4种可得奖.且最高奖达10元.而只有一种情况受罚.罚金只是2元.因此就吸引了许多人特别是好奇的青少年参加.结果却是受罚的多,何以如此呢?其实.这就是概率知识的具体使用:现在是从16个球中任取8个.所有可能的取法为816C 种.即基本事件总数有限.又因为是任意抽取.保证了等可能性.是典型的古典概型问题.由古典概率计算公式.很容易得到上述5种结果.其对应的概率分别是:3807048730121800099460000155404848385828681878.C C C P(E);.C C 2C P(D);.C C 2C P(C);.C C 2C P(B);.C 2P(A)816816816816816==========假设进行了1000次摸球试验, 5种情况平均出现的次数分别为:0、10、122、487、381次,经营游戏者预期可得2×381-(10×0+1×10+0.5×122+0.2×487) =593.6(元). 这个例子的结论可能会使我们大吃一惊,然而正是在这一惊之中.获得了对古典概率更具体、更生动的知识.戏院设座问题乙两戏院在竞争500名观众,假设每个观众完全随意地选择一个戏院,且观众之间选择戏院是彼此独立的,问每个戏院至少应该设多少个座位才能保证观众因缺少座位而离开的概率小于5%?解 由于两个戏院的情况相同,故只需考虑甲戏院即可。
设甲戏院需设m 个座位,定义⎝⎛=否则个观众选甲戏院,第,i x i 01 ,i =1,2,…,500依题意,50021 5001,,,i ,.)x (P )x (P i i =====若用x 表示选择甲戏院的观众总数,则∑==5001i ix x ,问题化为求m 使950050.)m x (P ,.)m x (P ≤≤≤≥即因为E(x i )=D(x i )=0.5 ,由中心极限定理近似地),(N ~..x 1025050050500⨯⨯- 故 95055250.)m ()m x (P ≥-Φ=≤, 查标准正态分布表知65155250.m ≥-,从而解得 269≥m ,即每个戏院至少应该设多少269个座位。
各章的重点难点第一章 事件和概率● 古典概率● 全概率公式和贝叶斯公式(*)●独立试验序列第二章离散型随机变量●离散随机变量的概率分布●分布函数●常用分布:超几何分布H(n,M,N)、二项分布B(n,p)、泊松分布P(λ)●随机变量的数学期望和方差的概念及性质第三章连续型随机变量●连续随机变量的概率密度、均匀分布U[a,b]、指数分布e(λ)、正态分布N(μ,σ2)●分布函数●二维随机变量的分布(联合分布)●边际分布●随机变量函数的数学期望●常用分布的数学期望和方差●相关矩和相关系数●随机变量的和的分布●切比雪夫不等式第四章大数定律和中心极限定理●大数定律(辛钦定理、伯努里定理)●中心极限定理(列维定理、德莫威尔-拉普拉斯定理)第五章数理统计的基本知识●总体和样本的概念●常用统计量:样本均值、样本方差、修正样本方差●数理统计中的常用分布:χ2分布、t分布、F分布(*)●正态总体的统计量分布:定理1~定理4第六章点估计●参数的矩估计:●极大似然法●无偏估计第七章假设检验●正态总体均值的假设检验●正态总体标准差的假设检验●正态总体均值的区间估计●正态总体方差的区间估计(未知μ)二、学习方法指导本课程是研究随机现象的统计规律性的数学学科。
因为研究对象,所以在学习方法上和分析数学、线性代数等其它课程有很大不同。
在学习过程中,会遇到较多的、独特的概念和分析方法,初学者可能会感到很不习惯,入门会有一定困难,但是只要肯于钻研并掌握较好的学习方法,多数学生不仅能达到考核的基本要求,而且还会产生较大的学习兴趣。
这是因为概率论和数理统计和社会生活实际的联系十分紧密,使用特别广泛,因而容易激发人们的兴趣。
下面,结合本课程的特点,介绍某些行之有效的学习方法供学生参考。
1.学习概率论的基本概念时,首先要注意这些概念的统计背景。
概率论部分的基本概念比较多,特别从第二章“随机变量及其分布”开始,似乎“高难动作”一个接着一个来。
如果对基本概不能很好理解,势必影响自学的信心。
实际上,概率论的许多基本概念来源于统计实践,因此弄清其统计背景乃是入门的向导。
例如,概率来源于频率,它是大量独立重复试验时频率的稳定值。
因此,频率是概率的先导。
而概率又是频率的抽象和发展。
进而可理解概率的某些基本特性也是相应的频率特性的高度概括和抽象。
又如,连续随机变量的概率密度的统计背景是统计直方图;随机变量的分布函数实质上是一种“累计概率”,它来源于统计中的经验分布函数;而随机变量的期望概念则是样本均值的抽象,在提供了频率分布的前提下,样本均值实际上是一种加权平均值(“权”就是频数),而离散随机变量的期望恰恰是这种加权平均值概念的提升和推广,即将频率提升为概率,将有限推广到无限等等。
2.重视概念的甄别,即弄清某些容易混淆的概念之间的区别。
在概率论中存在许多容易混淆的概念,如果不能认真区分,仔细加以甄别,就不能正确理解这些重要概念,在使用时就会产生各种各样的错误。
互不相容事件和相互独立事件是最容易混淆的一对概念“互不相容”是指两个事件不能同时发生。
而“相互独立”则是指一个事件发生和否对另一事件发生的概率没有影响。
随机变量的独立性和不相关性是两个既有区别又有联系的概念。
两个随机变量 相互独立⇒不相关条件概率P(A|B)和乘积概率P(AB) 也是容易混淆的一对概念条件概率是已知某事件发生条件下,另一事件发生的概率,而 乘积概率中所涉及的事件都没有“已经发生”的假定。
两者的关系为P(AB)=P(B)P(A|B)3.善于识别一些重要的概率模型并能正确进行计算是提高分析和解决概率实际问题能力的关键。
在概率论中有许多经长期实践概括出的重要概率模型(简称“概型”),学生必须了解其背景、特点和适用范围,要熟记计算公式,以便能正确使用。
例如:(1)古典概型:一类具有有限个“等可能”发生的基本事件的概率模型。
(2)完备事件组模型:若干个两两互不相容的事件在一次试验中有且仅有一个发生的一类概率模型。
它主要用于某些复杂事件的计算——全概率公式,以及某些条件概率的计算——贝叶斯公式。
(3)贝努利概型和二项分布模型:贝努利概型是关于独立重复试验序列的一类重要的概率模型,其特点是各个重复试验是独立进行的,且每次试验中仅有两个对立的结果:事件A 发生或不发生,则在n 次独立重复试验中,事件A 恰好发生m 次的概率为m n m m n n p p C m P --=)1()( ,其中p=P(A).(4)泊松分布:物理上存在一种质点流,称为泊松流,它是由源源不断的随机出现的许多质点构成的一种随机质点流。
例如,电话交换台所接到的呼唤形成一呼唤流,到某商店去购物的顾客形成一顾客流,经过某块天空的流星形成流星流,放射性物质不断放出的质点形成质点流等等。
泊松流的主要特征之一就是在任意两个不相交的时间区间内各自出现的质点个数是相互独立的。
加上另一些特征,即可导出泊松流的概率模型.(5)正态分布——最重要的概率模型:根据中心极限定理的意义可知:无数微小的,又相互独立作用的随机因素,如果它们同分布,则它们累加起来的总效应必定服从正态分布。
这是正态分布使用最为广泛的根本原因。
例如人体的身高、体重,测量的误差等都服从正态分布。
(6)均匀分布——“等可能”取值的连续化模型:如果连续随机变量ξ仅在某有限区间[a ,b]内取值,且具有概率密度⎪⎩⎪⎨⎧≤≤-=其它 ,0 ,1)(b x a a b x ϕ则称ξ服从区间[a ,b]上的均匀分布。
除以上6种常见的概率模型外,还有指数分布,随机变量的函数等模型,不再—一列举,可参看教材有关内容。
4.对于某些难度较大的特殊算法要在理解的基础上进行“典例复算”学生普遍反映本课程自学较难,除概念抽象外,恐怕一些特殊的计算方法也会带来不少学习上的困难。
要突破这一点,最好的方法是将有关的典型例题读完后,合上书,认真复算一遍,边算边加深理解。
例如,关于已知随机变量的分布列或概率密度,求分布函数的方法。
从分布函数的定义}{)(x P x F <=ξ出发,可得出关于离散随机变量和连续随机变量分布函数的计算公式,分别为∑∑<<=<=x x ix x i i i p x P x F }{)(ξ和⎰∞-=x dt t x F )()(ϕ困难在于这两个公式的具体使用。
5.学习数理统计部分,最重要的是要领会各种统计方法内在的统计思想,其次是要熟练掌握操作步骤。