数理统计 第1章 基础知识

合集下载

概率论与数理统计各章重点知识整理

概率论与数理统计各章重点知识整理

概率论与数理统计各章重点知识整理 第一章 概率论的基本概念一.基本概念随机试验E:(1)可以在相同的条件下重复地进行;(2)每次试验的可能结果不止一个,并且能事先明确试验的所有可能结果;(3)进行一次试验之前不能确定哪一个结果会出现. 样本空间S: E 的所有可能结果组成的集合. 样本点(基本事件):E 的每个结果. 随机事件(事件):样本空间S 的子集.必然事件(S):每次试验中一定发生的事件. 不可能事件(Φ):每次试验中一定不会发生的事件. 二. 事件间的关系和运算1.A ⊂B(事件B 包含事件A )事件A 发生必然导致事件B 发生.2.A ∪B(和事件)事件A 与B 至少有一个发生.3. A ∩B=AB(积事件)事件A 与B 同时发生.4. A -B(差事件)事件A 发生而B 不发生.5. AB=Φ (A 与B 互不相容或互斥)事件A 与B 不能同时发生.6. AB=Φ且A ∪B=S (A 与B 互为逆事件或对立事件)表示一次试验中A 与B 必有一个且仅有一个发生. B=A, A=B .运算规则 交换律 结合律 分配律 德•摩根律 B A B A I Y = B A B A Y I = 三. 概率的定义与性质1.定义 对于E 的每一事件A 赋予一个实数,记为P(A),称为事件A 的概率. (1)非负性 P(A)≥0 ; (2)归一性或规范性 P(S)=1 ;(3)可列可加性 对于两两互不相容的事件A 1,A 2,…(A i A j =φ, i ≠j, i,j=1,2,…),P(A 1∪A 2∪…)=P( A 1)+P(A 2)+… 2.性质(1) P(Φ) = 0 , 注意: A 为不可能事件P(A)=0 .(2)有限可加性 对于n 个两两互不相容的事件A 1,A 2,…,A n ,P(A 1∪A 2∪…∪A n )=P(A 1)+P(A 2)+…+P(A n ) (有限可加性与可列可加性合称加法定理) (3)若A ⊂B, 则P(A)≤P(B), P(B -A)=P(B)-P(A) . (4)对于任一事件A, P(A)≤1, P(A)=1-P(A) .(5)广义加法定理 对于任意二事件A,B ,P(A ∪B)=P(A)+P(B)-P(AB) . 对于任意n 个事件A 1,A 2,…,A n()()()()+∑+∑-∑=≤<<≤≤<≤=nk j i k j i nj i j i ni i n A A A P A A P A P A A A P 11121Y ΛY Y…+(-1)n-1P(A 1A 2…A n )四.等可能(古典)概型1.定义 如果试验E 满足:(1)样本空间的元素只有有限个,即S={e 1,e 2,…,e n };(2)每一个基本事件的概率相等,即P(e 1)=P(e 2)=…= P(e n ).则称试验E 所对应的概率模型为等可能(古典)概型.2.计算公式 P(A)=k / n 其中k 是A 中包含的基本事件数, n 是S 中包含的基本事件总数. 五.条件概率1.定义 事件A 发生的条件下事件B 发生的条件概率P(B|A)=P(AB) / P(A) ( P(A)>0).2.乘法定理 P(AB)=P(A) P (B|A) (P(A)>0); P(AB)=P(B) P (A|B) (P(B)>0).P(A 1A 2…A n )=P(A 1)P(A 2|A 1)P(A 3|A 1A 2)…P(A n |A 1A 2…A n-1) (n ≥2, P(A 1A 2…A n-1) > 0) 3. B 1,B 2,…,B n 是样本空间S 的一个划分(B i B j =φ,i ≠j,i,j=1,2,…,n, B 1∪B 2∪…∪B n =S) ,则 当P(B i )>0时,当P(A)>0, P(B i )>0时,. 六.事件的独立性1.两个事件A,B,满足P(AB) = P(A) P(B)时,称A,B 为相互独立的事件. (1)两个事件A,B 相互独立⇔ P(B)= P (B|A) .2.三个事件A,B,C 满足P(AB) =P(A) P(B), P(AC)= P(A) P(C), P(BC)= P(B) P(C),称A,B,C 三事件两两相互独立. 若再满足P(ABC) =P(A) P(B) P(C),则称A,B,C 三事件相互独立.3.n 个事件A 1,A 2,…,A n ,如果对任意k (1<k ≤n),任意1≤i 1<i 2<…<i k ≤n.有()()()()kki i i i i i A P A P A P A A A P ΛΛ2121=,则称这n 个事件A 1,A 2,…,A n 相互独立.第二章 随机变量及其概率分布一.随机变量及其分布函数1.在随机试验E 的样本空间S={e}上定义的单值实值函数X=X (e)称为随机变量.2.随机变量X 的分布函数F(x)=P{X ≤x} , x 是任意实数. 其性质为:(1)0≤F(x)≤1 ,F(-∞)=0,F(∞)=1. (2)F(x)单调不减,即若x 1<x 2 ,则 F(x 1)≤F(x 2). (3)F(x)右连续,即F(x+0)=F(x). (4)P{x 1<X≤x 2}=F(x 2)-F(x 1). 二.离散型随机变量 (只能取有限个或可列无限多个值的随机变量)1.离散型随机变量的分布律 P{X= x k }= p k (k=1,2,…) 也可以列表表示. 其性质为: (1)非负性 0≤P k ≤1 ; (2)归一性 11=∑∞=k k p .2.离散型随机变量的分布函数 F(x)=∑≤xX k k P 为阶梯函数,它在x=x k (k=1,2,…)处具有跳跃点,其跳跃值为p k =P{X=x k } .3.三种重要的离散型随机变量的分布(1)X~(0-1)分布 P{X=1}= p ,P{X=0}=1–p (0<p<1) .(2)X~b(n,p)参数为n,p 的二项分布P{X=k}=()kn k p p k n --⎪⎪⎭⎫ ⎝⎛1(k=0,1,2,…,n) (0<p<1)(3))X~π(λ)参数为λ的泊松分布 P{X=k}=λλ-e k k !(k=0,1,2,…) (λ>0)三.连续型随机变量1.定义 如果随机变量X 的分布函数F(x)可以表示成某一非负函数f(x)的积分F(x)=()dt t f x⎰∞-,-∞< x <∞,则称X 为连续型随机变量,其中f (x)称为X 的概率密度(函数).2.概率密度的性质(1)非负性 f(x)≥0 ; (2)归一性 ⎰∞∞-dx x f )(=1 ;(3) P{x 1<X ≤x 2}=⎰21)(x x dx x f ; (4)若f (x)在点x 处连续,则f (x)=F / (x) .注意:连续型随机变量X 取任一指定实数值a 的概率为零,即P{X= a}=0 . 3.三种重要的连续型随机变量的分布(1)X ~U (a,b) 区间(a,b)上的均匀分布 ⎩⎨⎧=-0)(1a b x f 其它b x a << .(2)X 服从参数为θ的指数分布.()⎩⎨⎧=-0/1θθx ex f 00≤>x x 若若 (θ>0).(3)X~N (μ,σ2 )参数为μ,σ的正态分布 222)(21)(σμσπ--=x e x f -∞<x<∞, σ>0.特别, μ=0, σ2 =1时,称X 服从标准正态分布,记为X~N (0,1),其概率密度2221)(x e x -=πϕ , 标准正态分布函数 ⎰=Φ∞--xt dt e x 2221)(π, Φ(-x)=1-Φ(x) .若X ~N ((μ,σ2), 则Z=σμ-X ~N (0,1), P{x 1<X ≤x 2}=Φ(σμ-2x )-Φ(σμ-1x ).若P{Z>z α}= P{Z<-z α}= P{|Z|>z α/2}= α,则点z α,-z α, ±z α/ 2分别称为标准正态分布的上,下,双侧α分位点. 注意:Φ(z α)=1-α , z 1- α= -z α. 四.随机变量X 的函数Y= g (X)的分布 1.离散型随机变量的函数若g(x k ) (k=1,2,…)的值全不相等,则由上表立得Y=g(X)的分布律.若g(x k ) (k=1,2,…)的值有相等的,则应将相等的值的概率相加,才能得到Y=g(X)的分布律. 2.连续型随机变量的函数若X 的概率密度为f X (x),则求其函数Y=g(X)的概率密度f Y (y)常用两种方法: (1)分布函数法 先求Y 的分布函数F Y (y)=P{Y ≤y}=P{g(X)≤y}=()()dx x f ky X k∑⎰∆其中Δk (y)是与g(X)≤y 对应的X 的可能值x 所在的区间(可能不只一个),然后对y 求导即得f Y (y)=F Y /(y) .(2)公式法 若g(x)处处可导,且恒有g /(x)>0 (或g / (x)<0 ),则Y=g (X)是连续型随机变量,其概率密度为 ()()()()⎩⎨⎧'=0y h y h f y f X Y 其它βα<<y其中h(y)是g(x)的反函数 , α= min (g (-∞),g (∞)) β= max (g (-∞),g (∞)) .如果f (x)在有限区间[a,b]以外等于零,则 α= min (g (a),g (b)) β= max (g (a),g (b)) .第三章 二维随机变量及其概率分布一.二维随机变量与联合分布函数1.定义 若X 和Y 是定义在样本空间S 上的两个随机变量,则由它们所组成的向量(X,Y)称为二维随机向量或二维随机变量.对任意实数x,y,二元函数F(x,y)=P{X ≤x,Y ≤y}称为(X,Y)的(X 和Y 的联合)分布函数. 2.分布函数的性质(1)F(x,y)分别关于x 和y 单调不减.(2)0≤F(x,y)≤1 , F(x,- ∞)=0, F(-∞,y)=0, F(-∞,-∞)=0, F(∞,∞)=1 .(3) F(x,y)关于每个变量都是右连续的,即 F(x+0,y)= F(x,y), F(x,y+0)= F(x,y) . (4)对于任意实数x 1<x 2 , y 1<y 2P{x 1<X ≤x 2 , y 1<Y ≤y 2}= F(x 2,y 2)- F(x 2,y 1)- F(x 1,y 2)+ F(x 1,y 1)二.二维离散型随机变量及其联合分布律1.定义 若随机变量(X,Y)只能取有限对或可列无限多对值(x i ,y j ) (i ,j =1,2,… )称(X,Y)为二维离散型随机变量.并称P{X= x i ,Y= y j }= p i j 为(X,Y)的联合分布律.也可列表表示.2.性质 (1)非负性 0≤p i j ≤1 .(2)归一性 ∑∑=i jij p 1 .3. (X,Y)的(X 和Y 的联合)分布函数F(x,y)=∑∑≤≤x x yy ij i j p三.二维连续型随机变量及其联合概率密度1.定义 如果存在非负的函数f (x,y),使对任意的x 和y,有F(x,y)=⎰⎰∞-∞-y xdudv v u f ),( 则称(X,Y)为二维连续型随机变量,称f(x,y)为(X,Y)的(X 和Y 的联合)概率密度. 2.性质 (1)非负性 f (x,y)≥0 . (2)归一性 1),(=⎰⎰∞∞-∞∞-dxdy y x f .(3)若f (x,y)在点(x,y)连续,则yx y x F y x f ∂∂∂=),(),(2(4)若G 为xoy 平面上一个区域,则⎰⎰=∈Gdxdy y x f G y x P ),(}),{(.四.边缘分布1. (X,Y)关于X 的边缘分布函数 F X (x) = P{X ≤x , Y<∞}= F (x , ∞) . (X,Y)关于Y 的边缘分布函数 F Y (y) = P{X<∞, Y ≤y}= F (∞,y)2.二维离散型随机变量(X,Y)关于X 的边缘分布律 P{X= x i }= ∑∞=1j ij p = p i · ( i =1,2,…) 归一性 11=∑∞=•i i p .关于Y 的边缘分布律 P{Y= y j }= ∑∞=1i ij p = p ·j ( j =1,2,…) 归一性 11=∑∞=•j j p .3.二维连续型随机变量(X,Y)关于X 的边缘概率密度f X (x)=⎰∞∞-dy y x f ),( 归一性1)(=⎰∞∞-dx x f X 关于Y 的边缘概率密度f Y (y)=x d y x f ⎰∞∞-),( 归一性1)(=⎰∞∞-dy y f Y五.相互独立的随机变量1.定义 若对一切实数x,y,均有F(x,y)= F X (x) F Y (y) ,则称X 和Y 相互独立.2.离散型随机变量X 和Y 相互独立⇔p i j = p i ··p ·j ( i ,j =1,2,…)对一切x i ,y j 成立.3.连续型随机变量X 和Y 相互独立⇔f (x,y)=f X (x)f Y (y)对(X,Y)所有可能取值(x,y)都成立. 六.条件分布1.二维离散型随机变量的条件分布定义 设(X,Y)是二维离散型随机变量,对于固定的j,若P{Y=y j }>0,则称P{X=x i |Y=y j } 为在Y= y j 条件下随机变量X 的条件分布律. 同样,对于固定的i,若P{X=x i }>0,则称 P{Y=y j |X=x i }为在X=x i 条件下随机变量Y 的条件分布律.第四章 随机变量的数字特征一.数学期望和方差的定义随机变量X 离散型随机变量连续型随机变量分布律P{X=x i }= p i ( i =1,2,…) 概率密度f (x)数学期望(均值)E(X) ∑∞=1i i i p x (级数绝对收敛)⎰∞∞-dx x xf )((积分绝对收敛)方差D(X)=E{[X-E(X)]2} []∑-∞=12)(i i i p X E x ⎰-∞∞-dx x f X E x )()]([2=E(X 2)-[E(X)]2 (级数绝对收敛) (积分绝对收敛),}{},{jji j j i p p y Y P y Y x X P •=====,}{},{•=====i j i i j i p p x X P y Y x X P函数数学期望E(Y)=E[g(X)] i i i p x g ∑∞=1)((级数绝对收敛) ⎰∞∞-dx x f x g )()((积分绝对收敛)标准差σ(X)=√D(X) . 二.数学期望与方差的性质1. c 为为任意常数时, E(c) = c , E(cX) = cE(X) , D(c) = 0 , D (cX) = c 2 D(X) .2.X,Y 为任意随机变量时, E (X ±Y)=E(X)±E(Y) .3. X 与Y 相互独立时, E(XY)=E(X)E(Y) , D(X ±Y)=D(X)+D(Y) .4. D(X) = 0⇔ P{X = C}=1 ,C 为常数.三.六种重要分布的数学期望和方差 E(X) D(X) 1.X~ (0-1)分布P{X=1}= p (0<p<1) p p (1- p) 2.X~ b (n,p) (0<p<1) n pn p (1- p)3.X~ π(λ) λ λ4.X~ U(a,b) (a+b)/2 (b-a) 2/125.X 服从参数为θ的指数分布 θ θ26.X~ N (μ,σ2) μ σ2 四.矩的概念随机变量X 的k 阶(原点)矩E(X k ) k=1,2,… 随机变量X 的k 阶中心矩E{[X-E(X)] k }随机变量X 和Y 的k+l 阶混合矩E(X k Y l ) l=1,2,…随机变量X 和Y 的k+l 阶混合中心矩E{[X-E(X)] k [Y-E(Y)] l }第六章 样本和抽样分布一.基本概念总体X 即随机变量X ; 样本X 1 ,X 2 ,…,X n 是与总体同分布且相互独立的随机变量;样本值x 1 ,x 2 ,…,x n 为实数;n 是样本容量.统计量是指样本的不含任何未知参数的连续函数.如:样本均值∑==n i i X n X 11 样本方差()∑--==n i iX X n S 12211 样本标准差S 样本k 阶矩∑==n i k i k X n A 11( k=1,2,…) 样本k 阶中心矩∑-==ni k i k X X n B 1)(1( k=1,2,…)二.抽样分布 即统计量的分布1.X 的分布 不论总体X 服从什么分布, E (X ) = E(X) , D (X ) = D(X) / n . 特别,若X~ N (μ,σ2 ) ,则X ~ N (μ, σ2 /n) .2.χ2分布 (1)定义 若X ~N (0,1) ,则Y =∑=ni i X 12~ χ2(n)自由度为n 的χ2分布.(2)性质 ①若Y~ χ2(n),则E(Y) = n , D(Y) = 2n .②若Y 1~ χ2(n 1) Y 2~ χ2(n 2) ,则Y 1+Y 2~ χ2(n 1 + n 2). ③若X~ N (μ,σ2 ), 则22)1(σS n -~ χ2(n-1),且X 与S 2相互独立.(3)分位点 若Y~ χ2(n),0< α <1 ,则满足αχχχχαααα=<>=<=>--))}(())({()}({)}({22/122/212n Y n Y P n Y P n Y P Y 的点)()(),(),(22/122/212n n n n ααααχχχχ--和分别称为χ2分布的上、下、双侧α分位点.3. t 分布(1)定义 若X~N (0,1),Y~ χ2(n),且X,Y 相互独立,则t=nY X ~t(n)自由度为n 的t 分布.(2)性质①n →∞时,t 分布的极限为标准正态分布.②X ~N (μ,σ2)时, nS X μ-~ t (n-1) .③两个正态总体 相互独立的样本 样本均值 样本方差X~ N (μ1,σ12 ) 且σ12=σ22=σ2 X 1 ,X 2 ,…,X n1X S 12Y~ N (μ2,σ22 ) Y 1 ,Y 2 ,…,Y n2 Y S 22则 212111)()(n n S Y X w +---μμ~ t (n 1+n 2-2) , 其中 2)1()1(212222112-+-+-=n n S n S n S w (3)分位点 若t ~ t (n) ,0 < α<1 , 则满足αααα=>=-<=>)}({)}({)}({2/n t t P n t t P n t t P的点)(),(),(2/n t n t n t ααα±-分别称t 分布的上、下、双侧α分位点. 注意: t 1- α (n) = - t α (n).4.F 分布 (1)定义 若U~χ2(n 1), V~ χ2(n 2), 且U,V 相互独立,则F =21n V n U ~F(n 1,n 2)自由度为(n 1,n 2)的F 分布.(2)性质(条件同3.(2)③)22212221σσS S ~F(n 1-1,n 2-1)(3)分位点 若F~ F(n 1,n 2) ,0< α <1,则满足)},({)},({21121n n F F P n n F F P αα-<=>ααα=<>=-))},(()),({(212/1212/n n F F n n F F P Y的点),(),(),,(),,(212/1212/21121n n F n n F n n F n n F αααα--和分别称为F 分布的上、下、双侧α分位点. 注意: .).(1),(12211n n F n n F αα=-第七章 参数估计一.点估计 总体X 的分布中有k 个待估参数θ1, θ2,…, θk .X 1 ,X 2 ,…,X n 是X 的一个样本, x 1 ,x 2 ,…,x n 是样本值.1.矩估计法先求总体矩⎪⎩⎪⎨⎧===),,,(),,,(),,,(2121222111k k k k k θθθμμθθθμμθθθμμΛΛΛ解此方程组,得到⎪⎩⎪⎨⎧===),,,(),,,(),,,(2121222111kk k k k μμμθθμμμθθμμμθθΛΛΛ,以样本矩A l 取代总体矩μ l ( l=1,2,…,k)得到矩估计量⎪⎪⎩⎪⎪⎨⎧===∧∧∧),,,(),,,(),,,(2121222111k k k k k A A A A A A A A A ΛΛΛθθθθθθ,若代入样本值则得到矩估计值. 2.最大似然估计法若总体分布形式(可以是分布律或概率密度)为p(x, θ1, θ2,…, θk ),称样本X 1 ,X 2 ,…,X n 的联合分布∏==ni k i k x p L 12121),,,,(),,,(θθθθθθΛΛ为似然函数.取使似然函数达到最大值的∧∧∧k θθθ,,,21Λ,称为参数θ1, θ2,…,θk 的最大似然估计值,代入样本得到最大似然估计量.若L(θ1, θ2,…, θk )关于θ1, θ2,…, θk 可微,则一般可由似然方程组 0=∂∂i L θ 或 对数似然方程组 0ln =∂∂iLθ (i =1,2,…,k) 求出最大似然估计. 3.估计量的标准(1) 无偏性 若E(∧θ)=θ,则估计量∧θ称为参数θ的无偏估计量.不论总体X 服从什么分布, E (X )= E(X) , E(S 2)=D(X), E(A k )=μk =E(X k ),即样本均值X , 样本方差S 2,样本k 阶矩A k 分别是总体均值E(X),方差D(X),总体k 阶矩μk 的无偏估计,(2)有效性 若E(∧θ1 )=E(∧θ2)= θ, 而D(∧θ1)< D(∧θ2), 则称估计量∧θ1比∧θ2有效. (3)一致性(相合性) 若n →∞时,θθP →∧,则称估计量∧θ是参数θ的相合估计量. 二.区间估计1.求参数θ的置信水平为1-α的双侧置信区间的步骤(1)寻找样本函数W=W(X 1 ,X 2 ,…,X n ,θ),其中只有一个待估参数θ未知,且其分布完全确定. (2)利用双侧α分位点找出W 的区间(a,b),使P{a<W <b}=1-α. (3)由不等式a<W<b 解出θθθ<<则区间(θθ,)为所求. 2.单个正态总体待估参数 其它参数 W 及其分布 置信区间μ σ2已知 nX σμ-~N (0,1) (2/ασz n X ±) μ σ2未知 nS X μ-~ t (n-1) )1((2/-±n t n S X α σ2 μ未知 22)1(σS n -~ χ2(n-1) ))1()1(,)1()1((22/1222/2-----n Sn n S n ααχχ 3.两个正态总体 (1)均值差μ 1-μ 2其它参数 W 及其分布 置信区间已知2221,σσ22212121)(n n Y X σσμμ+--- ~ N(0,1) )(2221212n n z Y X σσα+±-未知22221σσσ== 212111)(n n S Y X w +---μμ~t(n 1+n 2-2) )11)2((21212n n S n n t Y X w+-+±-α 其中S w 等符号的意义见第六章二. 3 (2)③.(2) μ 1,μ 2未知, W=22212221σσS S ~ F(n 1-1,n 2-1),方差比σ12/σ22的置信区间为))1,1(1,)1,1(1(212/12221212/2221----⋅-n n F S S n n F S S αα注意:对于单侧置信区间,只需将以上所列的双侧置信区间中的上(下)限中的下标α/2改为α,另外的下(上)限取为-∞ (∞)即可.。

概率论与数理统计(1-3章重点梳理)

概率论与数理统计(1-3章重点梳理)

公理 3(可列可加性)
两两互斥,则 P (
)=
(2)条件概率——P(B∣A)=
P(AB)=P(A) P(B∣A) P(B) P(A∣B)
2、概率基本性质 (1) P(Φ)=0,P(Ω)=1
(2) 有限可加性 P(
)=
(3) 求逆公式 P( )=1-P(A) ※补充:对于固定事件 A,P(B∣A)具有概率一切性质 ① P(Φ∣A)=0,P(A∣A)=1
1、定义 F(X)=
, <x< ,其中 f(x)为 X 的概率密度函数
【连续型:求分布函数就是求概率,哪儿求概率哪儿求积分】
(※利用 2、概率密度 f(x)性质
可简化求解)
(1)f(x) 0(非负可积性) (2)
3、连续型性质【重要】 ① F(x)为连续函数 ②对于 f(x)连续点 x,有 =f(x) ③对于任何实数 C,P(X=C)=0
①包含 A B 事件 A 发生一定导致 B 发生 【小推大】
②相等 A B 且 B A A=B 【等价=相等】
③互斥 AB=Φ A、B 不能同时发生
④对立
A、B 在一次试验中必然发生且只能发生一个
⑤完全事件组

(1≤i≠j≤n),称
(2)事件间运算(三种):并(和),交(积),逆(差) ①A、B 和事件 A∪B 或 A+B A、B 至少有一个发生
几何分布的无记忆性:设 X G(p),即
,k=1 2 (0 p 1)则对于
任何正整数 m,k 有 P(X=m+k∣X 6、均匀分布 U(a,b)
)=P(X=k)
密度 f(x)=
分布函数 F(x)=
例:设随机变量 在(1,b)上服从均匀分布,则方程

概率论与数理统计第1章随机事件及其概率

概率论与数理统计第1章随机事件及其概率
骰子朝上的点数为 i ,第二颗骰子朝上的点数为 j . (3) (i) S1 {( 正品,次品 ),( 正品,正品 ),( 次品,正品 )} ;
(ii) S2 {( 正品,次品 ),( 正品,正品 )} .
若用“1 ”表示“正品”,“ 0 ”表示“次品”,这里的两个样本空
间又可表示为
(i) S1 {(1,0),(1,1),(0,1)} ;(ii) S2 {(1,0),(1,1)}. (4) (i) S1 {t t 0};(ii) S2 { 合格品, 不合格品} . 若用“1 ”表示“合格品”,“ 0 ”表示“不合格品”, S2 又可表示为 S2 {1,0} . (5) S5 {(x, y) x2 y2 100}.
字母 E T A O I N S R H
使用频率 0.126 8 0.097 8 0.078 8 0.077 6 0.070 7 0.070 6 0.063 4 0.059 4 0.057 3
字母 L D U C F M W Y G
使用频率 0.039 4 0.038 9 0.028 0 0.026 8 0.025 6 0.024 4 0.021 4 0.020 2 0.018 7
第1章 随机事件及其概率
§1.1 随机事件
1.1.1 随机现象
在自然界以及生产实践和科学实验中普遍存在着两类现象.一类是 在一定条件下,重复进行试验,某一结果必然发生或必然不发生,即是可 以事前预言的,称为确定性现象.
除去确定性现象,人们发现还存在另一类现象,它是事前不可预言 的,即在相同条件下重复进行试验,每次的结果不一定相同,这一类现象 我们称之为偶然性现象或随机现象.
在一定条件下,随机现象有多种可能的结果发生,事前不能预知 将出现哪种结果,但通过大量的重复观察,出现的结果会呈现出某种 规律,称为随机现象的统计规律性.

应用数理统计(基于MATLAB实现)第1章 数理统计的基本概念

应用数理统计(基于MATLAB实现)第1章  数理统计的基本概念
应用数理统计
第1章 数理统计的基本概念
数理统计的基本概念
目录 contents
1 总体与样本 2 样本经验分布函数 3 统计量与估计量 4 抽样分布
2024/4/19
PART 1
总体与样本
前言 数理统计学是探讨随机现象 统计规律性 的一门学科,它以概率论为理论基础, 研究如何以有效的方式收集、整理和分析 随机数据 ,从而对所研究对象进行 统计推断。
2024/4/19
1.2 从样本认识总体的方法 1 频数表
2 直方图
2024/4/19
1.2 从样本认识总体的方法
例3. 由于随机因素的影响,某铅球运动员的铅球出手高度可看成一个随机变量,现有一组出手高度的 统计数据(单位:cm)如下:
200
195
210
211
201
205
185
197
183
177
2024/4/19
引例
引例1:研究一批灯泡的寿命分布,需明确该批灯泡中每个灯泡的寿命长短。 引例2:研究某一湖泊的深度,需测量湖面上每处到湖底的深度。 总体:在数理统计中,我们把研究对象的全体所构成的集合称为总体,而把组成总体的每个元素称为个
体,总体中所包含个体的个数称为总体的容量.
这两张图是大家再熟悉不过的两个成语了:一叶知秋、盲人摸象。
参数
分布的数 字特征
某事件的 概率等
参数
2024/4/19
PART 3
样本的经验分布函数
3 样本经验分布函数 1 经验分布函数的定义
2024/4/19
3 样本经验分布函数 2 例题 例1.2.5
某食品厂生产午餐肉罐头,从生产线上随机抽取5只罐头,称其净重(单位:g)为: 351, 347, 355, 344, 351

第一章 统计学基础知识-1

第一章 统计学基础知识-1

直 图 方
30 25 20 15 10 5 0 120% 100% 80% 60% 40% 20% 0%
频 率 累 % 积
频率
5.55 7.05 8.55 10.05 11.55 13.05 14.55 16.05 17.55 其 他
蔗 含 % 糖 量
第三节 统计特征数
反映数据资料的集中性趋势或分散程度的一些特 征数字,统称为统计特征数。 平均数,方差。 征数字,统称为统计特征数。如,平均数,方差 。 平均数: 一、集中性趋势的度量--平均数: 集中性趋势的度量 平均数 描述数据资料的集中性趋势, 描述数据资料的集中性趋势 , 反映资料的一般水 平及中心位置, 平及中心位置,并可作为资料的代表跟其它资料 比较。 比较。
(2)随机误差(偶然误差): )随机误差(偶然误差) 由很多不可避免且无法控制的偶然因素引起的误差。 由很多不可避免且无法控制的偶然因素引起的误差 。 分析测试中: 分析测试中: 分析方法本身的不完善性、仪器、环境、 分析方法本身的不完善性 、仪器、 环境、操作等各个 方面的偶然变化。 方面的偶然变化。 生物试验中: 生物试验中:产生随机误差的原因 供试材料的不均一性如种子质量、 供试材料的不均一性如种子质量、秧苗素质不可能完 全一致; 全一致; 光照、温度、湿度等影响生长的环境因子也可能随时 光照、温度、 随地发生的变化; 随地发生的变化; 农时操作的不一致性; 农时操作的不一致性; 其它不可预测的自然或人为因素的干扰。 其它不可预测的自然或人为因素的干扰。
编号 0 1 2 3 4 5 6 7 8 9 0 11.8 14.1 12.8 14.6 14.9 10.1 11.6 11.0 15.1 13.4 1 13.1 11.9 15.3 10.4 15.0 12.4 12.2 13.0 14.9 10.6 2 9.2 16.7 12.6 13.4 12.1 10.8 7.5 9.2 12.6 6.5 3 8.7 7.4 16.1 14.6 12.6 11.3 13.4 7.0 14.1 11.0 4 12.9 10.0 17.2 10.5 13.0 6.3 14.7 13.2 11.4 11.9 5 13.7 4.4 13.5 8.6 14.1 15.7 14.2 9.0 9.4 11.8 6 9.6 13.2 11.9 15.2 14.4 14.3 14.0 14.0 12.4 12.6 7 13.7 13.8 16.7 11.1 13.1 15.0 15.1 13.2 15.0 9.5 8 8.5 9.1 9.6 14.5 13.3 12.5 6.5 15.0 9.4 12.2 9 15.7 11.9 15.1 12.1 15.0 11.8 8.7 13.8 12.9 8.2

01第一章 数理统计的基础知识

01第一章 数理统计的基础知识

为推断总体分布及其各种特征,一般方法是按一定规则从总体中抽取若干 个体进行观察,称为抽样。
2
第一章 数理统计的基础知识
第一节 总体与样本
一 . 总体与样本
定义1:研究的对象称为总体,总体往往以某一项数量指标为其特征。实 际上总体就是一个随机变量 X 。
为推断总体分布及其各种特征,一般方法是按一定规则从总体中抽取若干 个体进行观察,称为抽样。 定义2:从总体中抽取的 n 个个体 (X1,X2,…,Xn) 称为样本,实际上样本就 是一个 n 维随机变量(或向量)。
简单随机样本: (X1,X2,…,Xn) 是相互独立的随机变量(独立性);且 Xi ~ X (同分布) 。 样本容量 n:样本中所含个体数目,为已知的一个自然数。 样本观察值: (X1,X2,…,Xn) = (x1,x2,…,xn)
上例中,若某次抽样得: (X1,X2,X3,X4,X5) = (0,0,1,0,1)
P(Y 15) f ( y)dy
15
10 0 15 20 y y 1 3 7 dy dy 10 100 100 2 8 8
例3:设总体 X ~ b(1,p)。现从中抽取容量为 2 的样本,得到样本 (X1, X2),求样本的函数 Y = X12 + X22 的概率分布,并求出事件 P(Y < 15) 的概率。
i 1 n
如上例:总体 X ~ b(1,p),概率分布为:P(X = x) = (1 – p)1 – x p x (x = 0,1) 则样本 (X1,X2,…,Xn) 的联合分布为:
P( X 1 x1 , X n xn ) p x1 (1 p)1 x1 p xn (1 p)1 xn p i1 (1 p)

概率论与数理统计 第一章 随机事件与概率

概率论与数理统计 第一章 随机事件与概率
S AB
推广:
(1)n个事件A1,A2, An至少有一个发生
所构成的事件,称为 A1, A2, An的和或并,
记为
n
A1 A2 An Ai
i1
当A1, A2, An互斥时
n
n
Ai Ai
i1
i1
(2)可列无限多个事件 A1, A2, 至少有一个
(1kn)的不同排列总数为:
n n n nk
例如:从装有4张卡片的盒中 有放回地摸取3张
第1张 第2张 第3张
1 2 34
n=4,k =3
1
1
1
2
2
2 共有4.4.4=43种可能取法
3
3
3
4
4
4
2、组合: 从n个不同元素取 k个
(1kn)的不同组合总数为:
C
k n

Ank k!

n! (n k)!k!

Ai
i1
三.互不相容事件(互斥事件)
若A与B不能同时发生,即 AB 则称A与B
互不相容(或互斥)。S与 互斥。
S
A
B
推广:n个事件 A1,A2, An互斥
A1, A2, An 中任两个互斥,即,
i≠j, i, j=1,2,3 ,……n.
四.事件的和(并) 事件A与B至少有一个发生所构成的事件, 称为A与B的和(并)记为A∪B。当A与B 互斥时,A∪B =A+B。
六. 对立事件(逆事件) 由A不发生所构成的事件,称为A的对立事件
(逆事件)。记为 A
A
A
AA ,A A S,A A.
例1.掷一质地均匀的骰子,A=“出现奇数点”= {1,3,5},B=“出现偶数点”= {2,4,6},C=“出现4或6”={4,6}, D=“出现3或5”={3,5},E=“出现的点 数大于2”={3,4,5,6}, 求 A B,C D,AE,E.

数理统计第一章基本概念

数理统计第一章基本概念

(x
i 1
n
i
x ) 0.
定理2数据观测值与均值的偏差平方和 最小,即在形如 (xic)2 的函数中,
2 ( x x ) 最小,其中c为任意给定常数。 i
定理3 设总体 X 具有二阶矩,即 E(x)= , Var(x)=2 , x1, x2, …, xn 为从该总体得到的样本,
P T t (n)
t ( n )
f (t ) dt
的点 t(n)为 t(n) 分布上 分位数。
t(n) 分布上
分位点示意图
t 分布的上 分位数有表可查,见附表2。
3 . F 分布
且 X 与Y 定义3: 设 X ~ (m) ,Y ~ (n) ,
2 2
相互独立, 则称 F =(X/m)/(Y/n)服从第一自由
xi 与总体X有相同的分布。 x1, x2, …, xn 相互独立。
独立性: 样本中每一样品的取值不影响其
它样品的取值 --
于是,样本 x1, x2, …, xn 可以看成是独立同分布 ( iid ) 的随机变量,其共同分布即为总体分布。 设总体X具有分布函数F(x), x1, x2, …, xn 为取自该总
某电子产品的使用寿命 某天的最高气温 加工出来的某零件的长度等数量指标。 因此,将总体理解为那些研究对象的某项数量指标的 全体。
总体的三层含义:
• 研究对象的全体; • 数据; • 分布
样本具有两重性
• 一方面,由于样本是从总体中随机抽取的,抽 取前无法预知它们的数值,因此,样本是随机 变量,用大写字母 X1, X2, …, Xn 表示;
该密度函数 的图象也是 一只取非负
值的偏态分

概率论与数理统计课件:数理统计基础知识

概率论与数理统计课件:数理统计基础知识

数理统计基础知识
首页 返回 退出
6.1.1 总体
§6.1 总体和随机样本
总体:研究对象的全部可能观察值叫做总体. 个体:组成全体的每个观察值叫做个体.
如:考察某校学生的身高
总体:该校的所有学生的身高 个体:每个学生的身高
数理统计基础知识
首页 返回 退出
实际问题中,要研究的是有关对象的各种数量指标. 总体可以用一个随机变量及其分布来描述.
首页 返回 退出
由于抽样的目的是为了对总体进行统计推断, 为了使抽取的样本能很好地反映总体的信息,必 须考虑抽样方法.
最常用的一种抽样方法叫作“简单随机抽样” 它要求抽取的样本满足下面两点: 1. 代表性: X1,X2,…,Xn中每一个与所考察 的总体有相同的分布.
2. 独立性: X1,X2,…,Xn是相互独立的随机变量.
从一批产品中抽5件,检验产品是否合格.
数理统计基础知识
样本容量为5
首页 返回 退出
样本是随机变量.
抽到哪5辆是随机的
容量为n的样本可以看作n维随机变量(X1,X2,…,Xn).
但是,一旦取定一组样本,得到的是n个具体的数 (x1,x2,…,xn),称为样本的一次观察值,简称样本值 .
数理统计基础知识
总体的指标 如体重、身高、寿命等 是随机变量X 个体的指标 如体重、身高、寿命等 是随机变量X 的一个取值
常用随机变量的记号或用其分布函数表示总体.
如:总体X或总体F X
数理统计基础知识
首页 返回 退出
有限总体 总体
无限总体
1.考察某校大一新生(共2000人)的身高. 有限总体
2.观测某地每天最高气温. 无限总体 3.某厂生产的所有电视显像管的寿命. 无限总体

数理统计第一章

数理统计第一章

n
例1.4 总体X~B(1,p),0<p<1,写出其样本的联合概率函数
总体
样品
X ~ P ( X x ) p ( 1 p ) ( x 0 ,1 )
x 1 x
X ~ P ( X x ) p ( 1 p ) , ( x 0 ,1. i 1,2 , , n )
xi 1 x i i i i
全部信息。 一个好的统计方法,是使由局部推断出的有关整体的信 息尽可能地准确。
第一章
数理统计的基本概念
第一节 随机样本
一.总体与个体
1.总体 在一个统计问题中,把所研究对象的全体称为总体。
构成总体的每个成员称为个体。
如:例一中的一大批灯泡叫总体。而每个灯泡叫做个体。 把含有有限个个体的总体称为有限总体 把含有无限个个体的总体称为无限总体
在数理统计学中,我们总是对随机现象进行有限 次的观察或试验,以获取数据。通过对数据的分析与 推断去寻找隐藏在数据中的统计规律性。 由于是对随机现象进行观察或试验,因此,观察或 试验数据是带有随机性的。为此需要我们从中尽可能地 排除随机性的干扰,以作出合理的推断。 数理统计是研究怎样以有效的方式收集、 整理和分 析带有随机性的数据,在此基础上,对所研究的问题作 出统计推断,直至对可能作出的决策提供依据和建议。
则其简单随机样本的联合分布函数为
F ( x )F ( x )F ( x ) F ( x )
1 2 n
n
(2)若总体X为连续随机变量,概率密度函数为f(x), 样品X i 的概率密度函数为 f ( xi ), (i 1,2,, n)
i 1
i
则样本 ( X1, X 2 , X n ) 的联合概率密度函数为

第一章 数理统计的基本概念

第一章  数理统计的基本概念

第一章 数理统计的基本概念数理统计与概率论一样,也是研究随机现象统计规律性的一门数学学科.概率论主要研究在已知随机变量服从某种分布的情况下,讨论随机变量的性质、数字特征、随机变量序列的极限等.但是,对实际问题中的一个随机变量来说,如何判断它服从某种分布,如果知道它服从某种分布,又该如何确定其中的参数,这些问题概率论都没有涉及,它们都是数理统计研究的内容.并且这些问题的研究都直接或间接建立在试验的基础上.数理统计学就是利用概率论的理论,对要研究的随机现象进行多次独立重复的观察或试验,研究如何合理地获得数据,如何对所获得的数据进行整理、分析,如何对关心的问题进行估计或推断的一门数学学科.数理统计由基本原理和应用方法两大内容组成.本章介绍数理统计的基本概念和抽样分布.§1.1 基本概念一、总体与样本用数理统计研究某个问题时,把研究对象的全体称为总体(或母体),而把每一个研究对象称为个体.例如,一批灯泡的全体就组成一个总体,其中每一个灯泡是一个个体.再例如,一群人(一个班或一个年级)的全体就组成一个总体,其中每一个人是一个个体.在数理统计中,我们关心的并不是组成总体的各个个体本身,而是与它们的性能相联系的某个数量指标或者多个数量指标.例如,在研究一批灯泡组成的总体时,可能关心的是灯泡的使用寿命这个数量指标.再例如,在研究一群组成的总体时,可能关心的是人的身高和体重等多个数量指标.因此,总体可以认为是研究对象的全体的一个或多个数量指标.在研究一批灯泡组成的总体时,可能关心的是灯泡的使用寿命的分布情况.由于任何一个灯泡的寿命事先是不能确定的.而每一个灯泡都确实对应着一个寿命值,所以我们可认为灯泡寿命是一个随机变量.也就是说,我们把总体与一个随机变量(如灯泡寿命)联系起来.因此,对总体的研究就转化为对表示总体的随机变量的统计规律的研究,所以,今后我们说到总体,指的是一个具有确定概率分布的随机变量(但它的分布又是未知的或至少分布的某些参数是未知的),而每个个体则是随机变量可能取的每一个数值.为了推断出这批灯泡的使用寿命的分布(或这批灯泡的次品率),最精确的办法就是把每个灯泡的使用寿命都测试出来.然而,寿命试验是破坏性试验,即使是非破坏性试验,考虑到试验要花费时间、人力和钱,我们只能从总体中抽取一部分(个个体)进行试验(称这个个体为容量是的样本),试验结果可得一组数值,其中是第i 个个体的试验结果,我们要根据这组数值对总体n n n ),,,(21n x x x L i x ξ进行推断,这样对试验的抽取方式就有一定的要求.首先,要求抽取必须是随机的,即每次每个个体被抽到的机会是等可能的,这样被抽到的个体才具有代表性,即每每次抽取的都具有总体的特征.其次,抽取必须是独立的、即每次抽取互不影响.也就是每次抽取后不能改变总的成分,这就要求.如果试验是非破坏性的,那么抽取时应该是有放回的;如果试验是破坏性的,那么总体应该是无限的.或是很大的.满足以上两个条件的抽取方式称为简单随机抽样.用简单随机抽样方法对—次抽取个个体的试验结果而言是一组数值,但是它又随着每次抽样的不同而变化,因此,实际上是维随机变量n ),,,(21n x x x L n ),,,(21n x x x L ),,,(21n ξξξL 的一次观察值.即在抽样试验之前,将要抽取的样本可以认为是维维随机变量n ),,,(21n ξξξL n ξξξ,,,21L .又因抽样具有代表性和独立性,所以是相互独立同分布随机变量,每个都与总体ξ同分布的.我们称),,,(21n ξξξL 为总体ξ的容量为的简单随机样本,简称为样本.抽样试验后的结果称为样本n ),,,(21n x x x L ),,,(21n ξξξL 的观察值.由所有样本值组成的集合ℵ称为样本空间.),,,(21n ξξξL 设总体ξ的分布函数,则)(x F ξ的联合分布函数为的样本,1x ),,,(),,(22112n n n x x x P x x F =ξ<ξ<ξ<L L .∏∏===<=ni i ni i ix F x P 11)()(ξ),,,(21n ξξξL )(x ϕξ为连续型随机变量,且有密度函数为.则其样本如果总体为n 维连续型随机变量,且联合密度函数为:∏==ni i n x x x x 121)(),,,(ϕϕL .i i p a P ==)(ξL ,2,1=i ξ为离散型随机变量,且分布律为,,则其样本如果总体),,,(21n ξξξL 为维离散型随机变量,且联合概率函数为:n ∏======ni i n n x P x x x P 12211)(),,,(ξξξξL ,其中,.L ,,21a a x i =n i ,,2,1L = 例1 设总体,求样本),(~2σμξN ),,,(21n ξξξL 的联合密度函数.),,,(21n ξξξL 解: 样本的联合密度函数为∏=−−=ni x i e12)(2221σμσπ∏==ni i n x x x x 121)(),,,(ϕϕL∑⎟⎠⎞⎜⎝⎛==−−ni i x n e122)(2121μσσπ. 例2 设总体),(~p N B ξ,即,,.求总体k N kk N p p C k P −−==)1()(ξN k ,,1,0L =),,,(21n ξξξL 10<<p ξ的联合分布律.的样本),,,(21n ξξξL 的联合分布律为解: 样本∏===ni i x P 1)(ξ),,,(2211n n x x x P ===ξξξL. ∏=−∑−∑===ni x N x nN x i ni ini iC p p111)1(∏=−−=ni x N x x Niii p p C 1)1(二、统计量从总体中抽出样本的观测值后,只是得到了一组静态的数据.对于这些数据要进行处理,才能解决我们所关心的问题.有时候我们可能只想估计出总体的期望或者方差,有时候我们可能想了解总体的分布,对于不同的问题,必须对数据进行不同的处理,这就需要构造样本的不同函数.样本的函数常称为统计量.),,,(21n T ξξξL n ξξξ,,,21L n ξξξ,,,21L ξ定义: 设为取自总体的一个样本,样本的函数,且不含未知参数,则称),,,(21n T ξξξL 为统计量.如果是样本),,,(21n x x x L ),,,(21n x x x T L ),,,(21n ξξξL 的一个观测值(观察值),则称是统计量),,,(21n T ξξξL 的一个观测值(观察值).例3 设总体,),(~2σμξN μ未知,为已知,2σ),,,(21n ξξξL ξ为的一个样本,则∑=n i i 121ξσ是统计量.而∑不是统计量.=−ni i12)(μξn ξξξ,,,21L 根据统计量的定义,它是随机变量的函数,因此统计量也是一个随机变量,它也有概率分布.统计量的分布称为抽样分布.但要注意,尽管一个统计量不合任何未知参数,但它的分布却可能含有未知参数.例4 设621,,,ξξξL 是来自),0(θ上的均匀分布的样本,0>θ未知.指出下列样本函数中哪些是统计量,哪些不是?为什么?66211ξξξ+++=L T θξ−=62T 163EX T −=ξ},,,max{6214ξξξL =T ,,,.解:和是,和不是.因为和中不含总体中的未知参数1T 4T 2T 1T 4T 3T θ,而和中含有未知参数2T 3T θ.常用统计量n ξξξ,,,21L ξ设为取自总体的一个样本,∑==+++=ni i n n n 1211)(1ξξξξξL (1)样本均值:;[]∑∑==−=−=−++−=n i i n i i n n n n S 1221222121)(1)()(1ξξξξξξξξL (2)样本方差:;∑∑==−−−=−−=n i i n i i n n n n S 122122*111)(11ξξξξ(3)修正样本方差:;∑=−=ni i n S 12)(1ξξ; (4)样本标准差:∑=−−=ni i n S 12*)(11ξξ(5)修正样本标准差:; ∑===n i ki kk n A 11ξξL ,2,1=k (6)样本k 阶原点矩: , ;∑=−=n i ki k n B 1(1ξξL ,3,2=k (7)样本k 阶中心矩: .,若是样本),,,(21n x x x L ),,,(21n ξξξL 的一组观测值,则∑=−=n i i x x n s 12)(1∑=−=n i i x x n s 122(1∑=−−=n i i x x n s 122*(11∑==n i i x n x 11、、、、∑=−−=n i i x x n s 12*)(11∑===n i k i kk x n x a 11∑=−=n i k i k x x n b 1)(1、、 分别是样本均值、样本方差、修正样本方差、样本标准差、修正样本标准差、样本k 阶原点矩、样本k 阶中心矩的.例5 从—批机器零件毛坯中随机招取8件,测得其重量(单位:kg)为230,243,185,240, 228,196,246,200.求样本均值、样本方差和样本二阶原点矩的观测值.221)200246196228240185243230(8111=+++++++==∑=n i i x n x 解:;[]25.495)221200()221243()221230(81)(1222122=−++−+−=−=∑=L n i i x x n s ;25.49336)200243230(811222122=+++==∑=L n i i x n x 。

概率论与数理统计知识点总结(超详细版)

概率论与数理统计知识点总结(超详细版)

《概率论与数理统计》第一章概率论的基本概念§2.样本空间、随机事件1.事件间的关系 B A ⊂则称事件B 包含事件A ,指事件A 发生必然导致事件B 发生B }x x x { ∈∈=⋃或A B A 称为事件A 与事件B 的和事件,指当且仅当A ,B 中至少有一个发生时,事件B A ⋃发生B }x x x { ∈∈=⋂且A B A 称为事件A 与事件B 的积事件,指当A ,B 同时发生时,事件B A ⋂发生B }x x x { ∉∈=且—A B A 称为事件A 与事件B 的差事件,指当且仅当A 发生、B 不发生时,事件B A —发生φ=⋂B A ,则称事件A 与B 是互不相容的,或互斥的,指事件A 与事件B 不能同时发生,基本事件是两两互不相容的且S =⋃B A φ=⋂B A ,则称事件A 与事件B 互为逆事件,又称事件A 与事件B 互为对立事件2.运算规则交换律A B B A A B B A ⋂=⋂⋃=⋃结合律)()( )()(C B A C B A C B A C B A ⋂=⋂⋃⋃=⋃⋃ 分配律 )()B (C A A C B A ⋃⋂⋃=⋂⋃)())(()( C A B A C B A ⋂⋂=⋃⋂徳摩根律B A B A A B A ⋃=⋂⋂=⋃ B —§3.频率与概率定义在相同的条件下,进行了n 次试验,在这n 次试验中,事件A 发生的次数A n 称为事件A 发生的频数,比值n n A 称为事件A 发生的频率概率:设E 是随机试验,S 是它的样本空间,对于E 的每一事件A 赋予一个实数,记为P (A ),称为事件的概率 1.概率)(A P 满足下列条件:(1)非负性:对于每一个事件A 1)(0≤≤A P (2)规范性:对于必然事件S 1)S (=P(3)可列可加性:设n A A A ,,,21 是两两互不相容的事件,有∑===nk knk kA P A P 11)()( (n 可以取∞)2.概率的一些重要性质: (i ) 0)(=φP(ii )若n A A A ,,,21 是两两互不相容的事件,则有∑===nk kn k kA P A P 11)()((n 可以取∞)(iii )设A ,B 是两个事件若B A ⊂,则)()()(A P B P A B P -=-,)A ()B (P P ≥ (iv )对于任意事件A ,1)(≤A P (v ))(1)(A P A P -=(逆事件的概率)(vi )对于任意事件A ,B 有)()()()(AB P B P A P B A P -+=⋃§4等可能概型(古典概型)等可能概型:试验的样本空间只包含有限个元素,试验中每个事件发生的可能性相同 若事件A包含k个基本事件,即}{}{}{2]1k i i i e e e A =,里个不同的数,则有中某,是,,k k n 2,1i i i ,21 ()中基本事件的总数包含的基本事件数S }{)(1j A n k e P A P kj i ===∑= §5.条件概率(1) 定义:设A,B 是两个事件,且0)(>A P ,称)()()|(A P AB P A B P =为事件A 发生的条件下事件B 发生的条件概率(2) 条件概率符合概率定义中的三个条件1。

数理统计-第一章 统计量及其分布

数理统计-第一章 统计量及其分布

太原理工大学 景英川
第一章 统计量及其分布
太原理工大学 景英川
第一章 统计量及其分布
但在实际中,在样本量特别大时 (如 n≥100 ),又常用分组样本来代替完 全样本,这时需要对样本进行分组整理, 它能简明扼要地表示样本,使人们能更 好地认识总体,这是分组样本的优点。
太原理工大学 景英川
第一章 统计量及其分布
则 Fn (x)是一非减右连续函数,且满足 Fn (-∞) =0, Fn (+ ∞)=1 由此可见, Fn (x)是一个分布函数,称 Fn (x)为经验分 布函数。 太原理工大学 景英川
第一章 统计量及其分布
1.6 某食品厂生产听装饮料,现从生产线上随机 抽取 5 听饮料,称得其净重为(单 位:克) 351 347 355 344 351 这是一个容量为 5 的样本,经排序可得有序样本:
而若第一次抽到的是合格品,则第二次抽到不合格品 的概率为
太原理工大学 景英川
第一章 统计量及其分布
显然,如此得到的样本不是简单随 机样本。但是,当 N 很大时,我们可 以看到上述二种情 形的概率都近似等 于 p。所以当 N 很大,而 n不大(一个 经验法则是 )时可以把 该样本近似地 看成简单随机样本。
从总体中抽取样本可以有不同的抽法,为了能 由样本对总体作出较可靠的推断,就希望 样本能很 好的代表总体。这就需要对抽样方法提出一些要 求,最常用的"简单随机抽样”有 如下二个要求: (1)样本具有随机性,即要求总体中每一个个体 都有同等机会被选入样本,这便意味着每一样品xi 与总体X有相同的分布。 (2)样本要有独立性,即要求样本中每一样品的 取值不影响其它样品的取值,这意 味着x1, x2, …,xn 相互独立。
第一章 统计量及其分布

概率论与数理统计第1-3章复习资料

概率论与数理统计第1-3章复习资料

其中λ = n P 例2:在例1的试验中,求: (1)A=“点数和为奇数的概率”; (2)B=“点数不同的概率” 例3:某产品40件,其中有次品3件。现从其中任取3件, 求下列事件的概率: (1)A=“3件中恰有2件次品”;(111/9880) (2)B=“ 3件中至少有1件次品”(633/2964)
xi R , i 1 , , n , n 元函数
F ( x1 ,, xn ) P( X 1 x1 ,, X n xn ) ( 是 X 1 ,, X n ) 的分布函数。
(1)’
注:r, v 取值的规律称 r, v 的分布,分布函数是描 述 r, v 的概分布的主要方法之一。 (二)分布函数的性质: 一维:1、有界性:0 F ( X ) 1
m 4、由公式 P( A) 进行计算 n
(二)几何概型 所求概率为: P(A)=[A所包含的区域度量] / [样本空间的度量] (三)条件概率及其全概率公式 1、条件概率:若P(B) >0,则
P( A B) P( AB) P( B)
2、全概率公式 如果B1,…,Bn为一完备事件组,即满足: (1) B1,…,Bn两两不相容i=1, …,n;
例4:一盒装有10只晶体管,其中有4只次品,6只正品,随 机地抽取 1只测试,直到4只次品晶体管都找到。求最后 一只次品晶体管在下列情况发现的概率: (1)A=“在第 5 次测试发现”。(2/105) (2)B=“在第10次测试发现”。(2/5) 例5:将编号1,2,3的三本书任意地排列在书架上,求事件 A=“至少有一本书自左到右的排列顺序号与它的编号相同” 的概率。 例6:五个乒乓球,其中三个旧球,二个新球,每次取一个, 共取两次,以有放回和无放回两种方式求下列事件的概率: (1)A=“两次都取到新球”; (2)B=“第一次取到新球,第二次取到旧球”; (3)C=“至少有一次取到新球”。

《概率论与数理统计》复习-知识归纳整理

《概率论与数理统计》复习-知识归纳整理

《概率论与数理统计》复习大纲第一章 随机事件与概率基本概念随机试验E----指试验可在相同条件下重复举行,试验的结果具有多种可能性(每次试验有且仅有一个结果闪现,且事先知道试验可能闪现的一切结果,但不能预知每次试验确实切结果。

样本点ω ---随机试验E的每一具可能闪现的结果样本空间Ω----随机试验E的样本点的全体随机事件-----由样本空间中的若干个样本点组成的集合,即随机事件是样本空间的一具子集。

必然事件---每次试验中必然发生的事件。

不可能事件∅--每次试验中一定不发生的事件。

事件之间的关系包含A⊂B相等A=B对立事件,也称A的逆事件互斥事件AB=∅也称不相容事件A,B相互独立P(AB)=P(A)P(B)例1事件A,B互为对立事件等价于( D )A、A,B互不相容B、A,B相互独立C、A∪B=ΩD、A,B构成对样本空间的一具剖分例2设P(A)=0,B为任一事件,则(C )A、A=∅B、A⊂BC、A与B相互独立D、A与B互不相容事件之间的运算事件的交AB或A ∩B 例1设事件A、B满足A B¯=∅,由此推导不出(D)A、A⊂BB、A¯⊃B¯C、A B=BD、A B=B例2若事件B与A满足B – A=B,则一定有(B)A、A=∅B、AB=∅C、AB¯=∅D、B=A¯事件的并A∪B事件的差A-B 注意:A-B= A B= A-AB = (A∪B)-BA1,A2,…,An构成Ω的一具完备事件组(或分斥)−−指A1,A2,…,An两两互不相容,且∪i=1nAi=Ω运算法则交换律A∪B=B∪A A∩B=B∩A结合律(A∪B)∪C=A∪(B∪C) (A∩B)∩C=A∩(B∩C)分配律(A∪B)∩C=(AC)∪(BC) (A∩B)∪C=(A∪C)∩(B∪C) 对偶律A∪B=A∩B A∩B=A∪B文氏图事件与集合论的对应关系表记号概率论集合论Ω样本空间,必然事件全集∅不可能事件空集ω基本事件元素A 事件全集中的一具子集A A的对立事件A的补集A⊂B 事件A发生导致事件B发生A是B的子集A=B 事件A与事件B相等A与B相等A∪B 事件A与事件B至少有一具发生A与B的并集AB 事件A与事件B并且发生A与B的交集知识归纳整理A-B事件A 发生但事件B 不发生A 与B 的差集 AB=∅ 事件A 与事件B 互不相容(互斥) A 与B 没有相同的元素古典概型 古典概型的前提是Ω={ω1,ω2, ω3,…, ωn ,}, n 为有限正整数,且每个样本点ωi 出现的可能性相等。

《概率论与数理统计》第一章知识小结

《概率论与数理统计》第一章知识小结

附加知识: 排列组合知识小结: 一、计数原理1.加法原理:分类计数。

2.乘法原理:分步计数。

二、排列组合1.排列数(与顺序有关):)(),1()2)(1(n m m n n n n A m n ≤+---= !n A nn =,n A A n n==10,1 如:25203456757=⨯⨯⨯⨯=A ,12012345!5=⨯⨯⨯⨯= 2.组合数(与顺序无关):!m A C mn m n=,mn n m n C C -=如:3512344567!44747=⨯⨯⨯⨯⨯⨯==A C ,2112672757757=⨯⨯===-C C C3.例题:(1)从1,2,3,4,5这五个数字中,任取3个数字,组成一个没有重复的3位数,共有___6034535=⨯⨯=A ____种取法。

(2)从0,1,2,3,4这五个数字中,任取3个数字,组成一个没有重复的3位数,共有___483442414=⨯⨯=A A ____种取法。

(3)有5名同学照毕业照,共有__1201234555=⨯⨯⨯⨯=A _种排法。

(4)有5名同学照毕业照,其中有两人要排在一起,那么共有_48)1234()12(4422=⨯⨯⨯⨯⨯=A A ___种排法。

(5)袋子里有8个球,从中任意取出3个,共有___38C ____种取法。

(6)袋子里有8个球,5个白球,3个红球。

从中任意取出3个,取到2个白球1个红球的方法有___1325C C ____种。

3887656321C ⨯⨯==⨯⨯第一章、基础知识小结一、随机事件的关系与运算 1.事件的包含设A ,B 为两个事件,若A 发生必然导致B 发生,则称事件B 包含于A ,记作B A ⊂。

2.和事件事件“A,B 中至少有一个发生”为事件A 与B 的和事件,记作B A 或B A +。

性质:(1)B A B B A A ⊂⊂, ;(2)若B A ⊂,则B B A =3.积事件:事件A,B 同时发生,为事件A 与事件B 的积事件,记作B A 或AB 。

《概率论与数理统计》第一章知识点

《概率论与数理统计》第一章知识点

第一章随机事件及概率1.1随机事件1.1.1随机试验一、人在实际生活中会遇到两类现象:1.确定性现象:在一定条件下实现与之其结果。

2.随机现象(偶然现象):在一定条件下事先无法预知其结果的现象。

二、随机试验满足条件:1.实验可以在相同条件写可以重复进行;(可重复性)2.事先的所有可能结果是事先明确可知的;(可观察性)3.每次实验之前不能确定哪一个结果一定会出现。

(不确定性)1.1.2样本空间1.样本点:每次随机试验E 的每一个可能的结果,称为随机试验的一个样本点,用w 表示。

2.样本空间:随机试验E 的所有样本点组成的集合成为试验E 的样本空间。

1.1.3随机事件1.随机事件:一随机事件中可能发生也可能不发生的事件称为试验的随机事件。

2.基本事件:试验的每一可能的结果称为基本事件。

一个样本点w 组成的单点集{w}就是随机试验的基本事件。

3.必然事件:每次实验中必然发生的事件称为必然事件。

用Ω表示。

样本空间是必然事件。

4.不可能事件:每次试验中不可能发生的事件称为不可能事件,用空集符号表示。

1.1.4事件之间的关系和运算1.事件的包含及相等“如果事件A 发生必然导致事件B 发生”,则称事件B 包含事件A ,也称事件A 是B 的子事件,记作A B B A ⊃⊂或。

2.事件的和(并⋃)“事件A 与B 中至少有一个事件发生”,这样的事件称为事件A 与B 的和事件,记作B A 。

3.事件的积(交⋂)“事件A 与B 同时发生”,这样的事件称作事件A 与B 的积(或交)事件,记作AB B A 或 。

4.事件的差“事件A 发生而事件B 不发生”,这样的事件称为事件A 与B 的差事件,记作A-B 。

5.事件互不相容(互斥事件)“事件A 与事件B 不能同时发生”,也就是说,AB 是一个不可能事件,即=AB 空集,即此时称事件A 与事件B 是互不相容的(或互斥的)6.对立事件“若A 是一个事件,令A A -Ω=,称A 是A 的对立事件,或称为事件A 的逆事件”事件A 与事件A 满足关系:=A A 空集,Ω=A A 对立事件一定是互斥事件;互斥事件不一定是对立事件。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
38
特别当时 p 1,便可得到随机向量 X ( X1, X 2 , , X n )
的数学期望为
E(X) ( E( X1 ), E( X 2 ), , E( X n ))
2、性质 1) 设a为常数,则 E(aX) aE(X) ; 2)设 A, B, C 分别为常数矩阵,则
E(AXB C) AE(X)B C
计和判别函数等许多方面都有突出的贡献,他的 许多研究成果都达到了世界先进水平。
12
第一章 基础知识
经典的数理统计是以概率统计为基础的,概率论与
数理统计的关系极为密切,为以后学习的方便,这里对
概率论做一个简单的回顾。
1、 概率论的回顾 2、 数理统计简介
13机现象 概率论:研究和揭示随机现象的统计规律性的一个数 学分支 随机事件的定义、运算及运算律 古典概型、几何概型、统计概型的定义及性质
42
若 X ( X1, X 2 , , X p )
的分量相互独立, 则协方
差矩阵,除主对角线上的元素外均为零,即
0 var( X 1 ) 0 var( X 2 ) var( X) 0 0
0 var( X p ) 0
43
2)随机向量X的协方差矩阵是非负定矩阵。
设a为任意与X有相同维数的常数向量,则
aΣa a[ E ( X μ)( X μ)]a E[a( X μ)( X μ)a] E[a( X μ)]2 0
证:
3)设A是常数矩阵,b为常数向量,则
var( AX b) E[( AX b) ( Aμ b)][( AX b) ( Aμ b)] AE[( X μ)( X μ)]A AΣA
描述性统计方法: 全部资料 数理统计方法: 部分资料 抽样统计方法
4
数理统计学是数学的一个分支,它研究怎样用有 效的方法去收集、整理、分析带随机影响的数据,并
在此基础上对所讨论的问题给出统计性的估计和推断。
数理统计学的内容:概括为两大类
用有效的方法去收集数据。 抽样理论和试验设计 有效地使用数据。中心内容—统计推断
E ( X | Y y ) xi P ( X xi | Y y ) (离散情形)
i
E ( X | Y y)
称E(X|Y=y)为已知Y=y时X的条件期望.


xf
X |Y
( x | y )dx (连续情形)
定义 设g(y)= E(X|Y=y),随机变量g(Y)就可记作E(X|Y),
41
cov( X 1 , X 2 ) var( X 1 ) cov( X 2 , X 1 ) var( X 2 ) var( X) cov( X , X ) cov( X , X ) p 1 p 2
2、性质
1)若 X ( X1, X 2 , , X p ) 和 Y (Y1, Y2 , , Yq相互独立。 ) 则



概率的公理化定义
条件概率,乘法公式,全概率公式,贝叶斯公式(逆概率公 式、后验公式),独立性
14

随机变量、分布函数及其性质 随机变量函数的分布 多维随机变量及其分布 随机变量的数字特征:期望、方差、协方差、 相关系数及其性质
15
条件数学期望

定义 设 X是一个r.v.,且EX存在. 则记
3)设 X1 , X2 , , Xn为n个同阶矩阵,则
E(X1 X2 Xn ) EX1 EX2 EXn
39
二、协方差矩阵
1、定义:设 X ( X1, X 2 , , X p ) 和 Y (Y1, Y2 , , Yq ) 分别
为p维和q维随机向量,则其协方差矩阵为
44
4)
若 X ( X1, X 2 , , X p ) 和 Y (Y1, Y2 , , Yq ) 分别
是p和q维随机向量,A和B为常数矩阵,则
它包括参数估计,假设检验,回归分析,方差分析,多元
统计分析等等。
5
有效性的含义
上述有效性有两个含义:

可以建立一个在数学上便于处理的模型来描述所 得的数据,

数据中要包含尽可能多的与所研究的问题有关的 信息。
6
关于统计推断

由于统计推断中使用的仅仅是部分数据,且带有随机性,
故所得结论只能做到尽可能而非绝对的精确可靠,而结
但在研究问题的方法上有很大区别: 概率论 —— 已知随机变量服从某分布,寻求分布 的性质、数字特征、及其应用; 数理统计 —— 通过对实验数据的统计分析, 寻找 所服从的分布和数字特征, 从而推断整体的规律性。
数理统计的核心问题——由样本推断总体
3
统计学从方法上讲有两大类:描述性统计 方法和数理统计方法(即抽样统计方法).

(5) 设X N ( , 2 ), 则其特征函数为 (t ) e
1 i t 2t 2 2
;
21
§4 随机矩阵
一、数学期望
1、定义
X 11 X 21 X X n1 X 12 X 22 X n2 X1 p X2p X np
X 1 E ( X 1 ) X E ( X ) 2 2 E Y1 E (Y1 ) Y2 E (Y2 ) X E( X ) p p Yq E (Yq )
40
cov( X 1 , Y1 ) cov( X 1 , Y2 ) cov( X 2 , Y1 ) cov( X 2 , Y2 ) cov( X , Y ) cov( X , Y ) p 1 p 2
(t )非负定,连续且 (0) 1;
(8)设随机变量X 的n阶矩存在,则X 的特征 函数 (t )的k阶导数 ( k ) (t )存在,且 E ( X k ) i (- k ) ( k ) (0), (k n)
20
几个常见随机变量的特征函数
(1) 设X 服从两点分布,则其特征函数为 (t ) q peit ; (2) 设X 服从二项分布B(n, p ),则其特征函数为 (t ) (q peit ) n ; sin at (3) 设X U [-a, a], 则其特征函数为 (t ) ; at (4) 设X 服从参数为的指数分布,则其特征函数为 it 1 (t ) (1- ) ;
且称为已知Y时X的条件数学期望。
16
条件数学期望的性质

如果 X 和 Y 独立,且EX存在,则 E(X|Y)=EX E(h(Y)|Y)=h(Y)


E(q(X,Y)|Y=y)=E(q(X,y)|Y=y)
E(E(X|Y))=E(X) 重期望定理
17
§2、随机变量的特征函数

定义 称随机变量eitX的数学期望(t)=EeitX为X的

统计学的起源:统计学起源于古代,早在公元前3050年
的古埃及就为建造金字塔进行过全国国力统计。到了16
世纪,西欧各国政府对收集公民有关资料发生兴趣。 Statistics(统计学)源于State.

数理统计的正式诞生。在数学家建立了概率论后,才奠 定了数理统计发展的理论基础。一般认为,它诞生于19
cov( X 1 , Yq ) cov( X 2 , Yq ) cov( X, Y) cov( X p , Yq )
X ( X1, X 2 ,
, X p )的协方差矩阵为
cov( X 1 , X p ) cov( X 2 , X p ) var( X p )

在生物遗传学、气象预报、地震研究、地质探矿等方面的研
究中,数理统计方法是必备工具之一。
数理统计方法在社会科学方面的应用也愈来愈广泛,教育学, 人口学,社会保险业,各种社会问题的抽样调查,市场预测, 民意测验等都有数理统计方法涉足。 总之,只要安排试验和处理数据,就可以用数理统计方
法。
9
数理统计学发展简史
cov( X 1 , Y1 ) cov( X 1 , Y2 ) cov( X 2 , Y1 ) cov( X 2 , Y2 ) cov( X , Y ) cov( X , Y ) p 1 p 2 cov( X 1 , Yq ) cov( X 2 , Yq ) 0 cov( X p , Yq )
《Mathematical Methods of Statistics》
11
二战后。这时期的一个突出特点是计算机的发明
和使用。它使人们能够处理大量的数据及其运算,
把数理统计的研究引入到宏观世界和微观世界,
又出现了一些新的分支。
最后,特别提一下我国的许宝禄教授在极限
理论、马氏过程、多元分析、正交设计、过程设
(4) 两个相互独立的随机变量之和的特征函数 等于各个特征函数之积; (5) 两个分布函数相等当且仅当它们所对应的 特征函数相等;
19
(6) 在F ( x)的连续点a, b上,有 1 T e iat e ibt F (b) - F (a ) lim (t )dt ; T 2 T it (7)函数 (t )为特征函数的充要条件是:
论的正确性程度显然可以用概率来度量,因此概率论是 数理统计的基础。

统计方法的具体使用并不需要很高深的数学知识,但不 具备较多较深的数学知识,这些方法的理论依据就说不
清楚。本课主要介绍数理统计方法,也给出一些必要的
数学推导,但不追求其严密性和完整性。
7
数理统计方法的应用
几乎在人类活动的一切领域中都能够不同程度地
特征函数。

随机变量的特征函数(t)是实变量t的复值函数,
相关文档
最新文档