概率论与数理统计基本概念及抽样分布

合集下载

概率论与数理统计 第六章 样本及抽样分布

概率论与数理统计 第六章 样本及抽样分布

x0 o.w.
n 1
n5
n 15
15
(2)t-分布(学生分布)
设 X ~ N ( 0 ,1), Y ~ 2 ( n ) 且X、Y为独立随 机变量,则称随机变量
t
X Y /n

X
1 n 2 ( X 12 ...... X n )
为自由度为n的t-分布。记为: t ~ t ( n ) 。
3
§1 随机样本
总体: 研究对象在某项数量指标的全体. 记为X。通常称总体X。 个体: 总体X中的每一个元素(实数)xi。 根据总体所含的个体数分为: 有限总体和无限总体。
4
总体与取样
X1
X
X2 X3 Xn
取样模型
X
X2 X1
X3
X4
X5
河流污染取样
5
总体、样本、统计量
总体 样本 统计量
X1 X2
2 ( n ) 分布:
具有可加性
2 X X 12 ...... X n , X i ~ N (0,1)
3. 4.
t ( n ) 分布:
X ~ N (0,1), Y ~ 2 ( n )
t(n) X Y /n
F ( n1 , n 2 ) 分布: U ~ 2 ( n1 ), V ~ 2 ( n 2 )



F (n1 , n2 )
19
分位点及性质:
定义: Pr[ X z ]

z
(1)标准正态分布分位点

(x)
( x)dx 1 ( x)dx


z
z1
( x)
Pr[ X z ]

概率论与数理统计各章重点知识点汇总--最新版

概率论与数理统计各章重点知识点汇总--最新版

第一章 概率论的基本概念一.基本概念随机试验E:(1)可以在相同的条件下重复地进行;(2)每次试验的可能结果不止一个,并且能事先明确试验的所有可能结果;(3)进行一次试验之前不能确定哪一个结果会出现. 样本空间S: E 的所有可能结果组成的集合. 样本点(基本事件):E 的每个结果. 随机事件(事件):样本空间S 的子集.必然事件(S):每次试验中一定发生的事件. 不可能事件(Φ):每次试验中一定不会发生的事件. 二. 事件间的关系和运算1.A ⊂B(事件B 包含事件A )事件A 发生必然导致事件B 发生.2.A ∪B(和事件)事件A 与B 至少有一个发生.3. A ∩B=AB(积事件)事件A 与B 同时发生.4. A -B(差事件)事件A 发生而B 不发生.5. AB=Φ (A 与B 互不相容或互斥)事件A 与B 不能同时发生.6. AB=Φ且A ∪B=S (A 与B 互为逆事件或对立事件)表示一次试验中A 与B 必有一个且仅有一个发生. B=A, A=B .运算规则 交换律 结合律 分配律 德•摩根律 B A B A = B A B A = 三. 概率的定义与性质1.定义 对于E 的每一事件A 赋予一个实数,记为P(A),称为事件A 的概率. (1)非负性 P(A)≥0 ; (2)归一性或规范性 P(S)=1 ;(3)可列可加性 对于两两互不相容的事件A 1,A 2,…(A i A j =φ, i ≠j, i,j=1,2,…),P(A 1∪A 2∪…)=P( A 1)+P(A 2)+… 2.性质(1) P(Φ) = 0 , 注意: A 为不可能事件 P(A)=0 .(2)有限可加性 对于n 个两两互不相容的事件A 1,A 2,…,A n ,P(A 1∪A 2∪…∪A n )=P(A 1)+P(A 2)+…+P(A n ) (有限可加性与可列可加性合称加法定理) (3)若A ⊂B, 则P(A)≤P(B), P(B -A)=P(B)-P(A) . (4)对于任一事件A, P(A)≤1, P(A)=1-P(A) .(5)广义加法定理 对于任意二事件A,B ,P(A ∪B)=P(A)+P(B)-P(AB) . 对于任意n 个事件A 1,A 2,…,A n()()()()+∑+∑-∑=≤<<≤≤<≤=nk j i k j i nj i j i ni i n A A A P A A P A P A A A P 11121…+(-1)n-1P(A 1A 2…A n )四.等可能(古典)概型1.定义 如果试验E 满足:(1)样本空间的元素只有有限个,即S={e 1,e 2,…,e n };(2)每一个基本事件的概率相等,即P(e 1)=P(e 2)=…= P(e n ).则称试验E 所对应的概率模型为等可能(古典)概型.2.计算公式 P(A)=k / n 其中k 是A 中包含的基本事件数, n 是S 中包含的基本事件总数. 五.条件概率1.定义 事件A 发生的条件下事件B 发生的条件概率P(B|A)=P(AB) / P(A) ( P(A)>0).2.乘法定理 P(AB)=P(A) P (B|A) (P(A)>0); P(AB)=P(B) P (A|B) (P(B)>0).P(A 1A 2…A n )=P(A 1)P(A 2|A 1)P(A 3|A 1A 2)…P(A n |A 1A 2…A n-1) (n ≥2, P(A 1A 2…A n-1) > 0) 3. B 1,B 2,…,B n 是样本空间S 的一个划分(B i B j =φ,i ≠j,i,j=1,2,…,n, B 1∪B 2∪…∪B n =S) ,则 当P(B i )>0时,当P(A)>0, P(B i )>0时,. 六.事件的独立性1.两个事件A,B,满足P(AB) = P(A) P(B)时,称A,B 为相互独立的事件. (1)两个事件A,B 相互独立⇔ P(B)= P (B|A) .2.三个事件A,B,C 满足P(AB) =P(A) P(B), P(AC)= P(A) P(C), P(BC)= P(B) P(C),称A,B,C 三事件两两相互独立. 若再满足P(ABC) =P(A) P(B) P(C),则称A,B,C 三事件相互独立.3.n 个事件A 1,A 2,…,A n ,如果对任意k (1<k ≤n),任意1≤i 1<i 2<…<i k ≤n.有()()()()kki i i i i i A P A P A P A A A P 2121=,则称这n 个事件A 1,A 2,…,A n 相互独立.第二章 随机变量及其概率分布一.随机变量及其分布函数1.在随机试验E 的样本空间S={e}上定义的单值实值函数X=X (e)称为随机变量.2.随机变量X 的分布函数F(x)=P{X ≤x} , x 是任意实数. 其性质为:(1)0≤F(x)≤1 ,F(-∞)=0,F(∞)=1. (2)F(x)单调不减,即若x 1<x 2 ,则 F(x 1)≤F(x 2). (3)F(x)右连续,即F(x+0)=F(x). (4)P{x 1<X≤x 2}=F(x 2)-F(x 1). 二.离散型随机变量 (只能取有限个或可列无限多个值的随机变量)1.离散型随机变量的分布律 P{X= x k }= p k (k=1,2,…) 也可以列表表示. 其性质为: (1)非负性 0≤P k ≤1 ; (2)归一性 11=∑∞=k k p .2.离散型随机变量的分布函数 F(x)=∑≤xX k k P 为阶梯函数,它在x=x k (k=1,2,…)处具有跳跃点,其跳跃值为p k =P{X=x k } .3.三种重要的离散型随机变量的分布(1)X~(0-1)分布 P{X=1}= p ,P{X=0}=1–p (0<p<1) .(2)X~b(n,p)参数为n,p 的二项分布P{X=k}=()kn k p p k n --⎪⎪⎭⎫ ⎝⎛1(k=0,1,2,…,n) (0<p<1) (3))X~π(λ)参数为λ的泊松分布 P{X=k}=λλ-e k k !(k=0,1,2,…) (λ>0)三.连续型随机变量1.定义 如果随机变量X 的分布函数F(x)可以表示成某一非负函数f(x)的积分F(x)=()dt t f x⎰∞-,-∞< x <∞,则称X 为连续型随机变量,其中f (x)称为X 的概率密度(函数).2.概率密度的性质(1)非负性 f(x)≥0 ; (2)归一性 ⎰∞∞-dx x f )(=1 ;(3) P{x 1<X ≤x 2}=⎰21)(x x dx x f ; (4)若f (x)在点x 处连续,则f (x)=F / (x) .注意:连续型随机变量X 取任一指定实数值a 的概率为零,即P{X= a}=0 . 3.三种重要的连续型随机变量的分布(1)X ~U (a,b) 区间(a,b)上的均匀分布 ⎩⎨⎧=-0)(1a b x f 其它b x a << .(2)X 服从参数为θ的指数分布.()⎩⎨⎧=-0/1θθx ex f 00≤>x x 若若 (θ>0).(3)X~N (μ,σ2)参数为μ,σ的正态分布 222)(21)(σμσπ--=x e x f -∞<x<∞, σ>0.特别, μ=0, σ2 =1时,称X 服从标准正态分布,记为X~N (0,1),其概率密度2221)(x e x -=πϕ , 标准正态分布函数 ⎰=Φ∞--xt dt e x 2221)(π, Φ(-x)=1-Φ(x) .若X ~N ((μ,σ2), 则Z=σμ-X ~N (0,1), P{x 1<X ≤x 2}=Φ(σμ-2x )-Φ(σμ-1x ).若P{Z>z α}= P{Z<-z α}= P{|Z|>z α/2}= α,则点z α,-z α, ±z α/ 2分别称为标准正态分布的上,下,双侧α分位点. 注意:Φ(z α)=1-α , z 1- α= -z α. 四.随机变量X 的函数Y= g (X)的分布 1.离散型随机变量的函数若g(x k ) (k=1,2,…)的值全不相等,则由上表立得Y=g(X)的分布律.若g(x k ) (k=1,2,…)的值有相等的,则应将相等的值的概率相加,才能得到Y=g(X)的分布律. 2.连续型随机变量的函数若X 的概率密度为f X (x),则求其函数Y=g(X)的概率密度f Y (y)常用两种方法: (1)分布函数法 先求Y 的分布函数F Y (y)=P{Y ≤y}=P{g(X)≤y}=()()dx x f ky X k∑⎰∆其中Δk (y)是与g(X)≤y 对应的X 的可能值x 所在的区间(可能不只一个),然后对y 求导即得f Y (y)=F Y /(y) .(2)公式法 若g(x)处处可导,且恒有g /(x)>0 (或g / (x)<0 ),则Y=g (X)是连续型随机变量,其概率密度为 ()()()()⎩⎨⎧'=0y h y h f y f X Y 其它βα<<y其中h(y)是g(x)的反函数 , α= min (g (-∞),g (∞)) β= max (g (-∞),g (∞)) .如果f (x)在有限区间[a,b]以外等于零,则 α= min (g (a),g (b)) β= max (g (a),g (b)) .第三章 二维随机变量及其概率分布一.二维随机变量与联合分布函数1.定义 若X 和Y 是定义在样本空间S 上的两个随机变量,则由它们所组成的向量(X,Y)称为二维随机向量或二维随机变量.对任意实数x,y,二元函数F(x,y)=P{X ≤x,Y ≤y}称为(X,Y)的(X 和Y 的联合)分布函数. 2.分布函数的性质(1)F(x,y)分别关于x 和y 单调不减.(2)0≤F(x,y)≤1 , F(x,- ∞)=0, F(-∞,y)=0, F(-∞,-∞)=0, F(∞,∞)=1 . (3) F(x,y)关于每个变量都是右连续的,即 F(x+0,y)= F(x,y), F(x,y+0)= F(x,y) . (4)对于任意实数x 1<x 2 , y 1<y 2P{x 1<X ≤x 2 , y 1<Y ≤y 2}= F(x 2,y 2)- F(x 2,y 1)- F(x 1,y 2)+ F(x 1,y 1)二.二维离散型随机变量及其联合分布律1.定义 若随机变量(X,Y)只能取有限对或可列无限多对值(x i ,y j ) (i ,j =1,2,… )称(X,Y)为二维离散型随机变量.并称P{X= x i ,Y= y j }= p i j 为(X,Y)的联合分布律.也可列表表示.2.性质 (1)非负性 0≤p i j ≤1 .(2)归一性 ∑∑=i jij p 1 .3. (X,Y)的(X 和Y 的联合)分布函数F(x,y)=∑∑≤≤x x yy ij i j p三.二维连续型随机变量及其联合概率密度1.定义 如果存在非负的函数f (x,y),使对任意的x 和y,有F(x,y)=⎰⎰∞-∞-y xdudv v u f ),( 则称(X,Y)为二维连续型随机变量,称f(x,y)为(X,Y)的(X 和Y 的联合)概率密度. 2.性质 (1)非负性 f (x,y)≥0 . (2)归一性 1),(=⎰⎰∞∞-∞∞-dxdy y x f .(3)若f (x,y)在点(x,y)连续,则yx y x F y x f ∂∂∂=),(),(2(4)若G 为xoy 平面上一个区域,则⎰⎰=∈Gdxdy y x f G y x P ),(}),{(.四.边缘分布1. (X,Y)关于X 的边缘分布函数 F X (x) = P{X ≤x , Y<∞}= F (x , ∞) . (X,Y)关于Y 的边缘分布函数 F Y (y) = P{X<∞, Y ≤y}= F (∞,y)2.二维离散型随机变量(X,Y)关于X 的边缘分布律 P{X= x i }= ∑∞=1j ij p = p i · ( i =1,2,…) 归一性 11=∑∞=•i i p .关于Y 的边缘分布律 P{Y= y j }= ∑∞=1i ij p = p ·j ( j =1,2,…) 归一性 11=∑∞=•j j p .3.二维连续型随机变量(X,Y)关于X 的边缘概率密度f X (x)=⎰∞∞-dy y x f ),( 归一性1)(=⎰∞∞-dx x f X 关于Y 的边缘概率密度f Y (y)=x d y x f ⎰∞∞-),( 归一性1)(=⎰∞∞-dy y f Y五.相互独立的随机变量1.定义 若对一切实数x,y,均有F(x,y)= F X (x) F Y (y) ,则称X 和Y 相互独立.2.离散型随机变量X 和Y 相互独立⇔p i j = p i ··p ·j ( i ,j =1,2,…)对一切x i ,y j 成立.3.连续型随机变量X 和Y 相互独立⇔f (x,y)=f X (x)f Y (y)对(X,Y)所有可能取值(x,y)都成立. 六.条件分布1.二维离散型随机变量的条件分布定义 设(X,Y)是二维离散型随机变量,对于固定的j,若P{Y=y j }>0,则称P{X=x i |Y=y j } 为在Y= y j 条件下随机变量X 的条件分布律. 同样,对于固定的i,若P{X=x i }>0,则称 P{Y=y j |X=x i }为在X=x i 条件下随机变量Y 的条件分布律.第四章 随机变量的数字特征一.数学期望和方差的定义随机变量X 离散型随机变量连续型随机变量分布律P{X=x i }= p i ( i =1,2,…) 概率密度f (x)数学期望(均值)E(X) ∑∞=1i i i p x (级数绝对收敛)⎰∞∞-dx x xf )((积分绝对收敛)方差D(X)=E{[X-E(X)]2} []∑-∞=12)(i i i p X E x ⎰-∞∞-dx x f X E x )()]([2=E(X 2)-[E(X)]2 (级数绝对收敛) (积分绝对收敛) 函数数学期望E(Y)=E[g(X)] i i i p x g ∑∞=1)((级数绝对收敛) ⎰∞∞-dx x f x g )()((积分绝对收敛)标准差σ(X)=√D(X) .,}{},{jji j j i p p y Y P y Y x X P •=====,}{},{•=====i j i i j i p p x X P y Y x X P二.数学期望与方差的性质1. c 为为任意常数时, E(c) = c , E(cX) = cE(X) , D(c) = 0 , D (cX) = c 2 D(X) .2.X,Y 为任意随机变量时, E (X ±Y)=E(X)±E(Y) .3. X 与Y 相互独立时, E(XY)=E(X)E(Y) , D(X ±Y)=D(X)+D(Y) .4. D(X) = 0⇔ P{X = C}=1 ,C 为常数.三.六种重要分布的数学期望和方差 E(X) D(X) 1.X~ (0-1)分布P{X=1}= p (0<p<1) p p (1- p) 2.X~ b (n,p) (0<p<1) n pn p (1- p)3.X~ π(λ) λ λ4.X~ U(a,b) (a+b)/2 (b-a) 2/125.X 服从参数为θ的指数分布 θ θ26.X~ N (μ,σ2) μ σ2 四.矩的概念随机变量X 的k 阶(原点)矩E(X k ) k=1,2,… 随机变量X 的k 阶中心矩E{[X-E(X)] k }随机变量X 和Y 的k+l 阶混合矩E(X k Y l ) l=1,2,…随机变量X 和Y 的k+l 阶混合中心矩E{[X-E(X)] k [Y-E(Y)] l }第六章 样本和抽样分布一.基本概念总体X 即随机变量X ; 样本X 1 ,X 2 ,…,X n 是与总体同分布且相互独立的随机变量;样本值x 1 ,x 2 ,…,x n 为实数;n 是样本容量.统计量是指样本的不含任何未知参数的连续函数.如:样本均值∑==n i i X n X 11 样本方差()∑--==n i i X X n S 12211 样本标准差S样本k 阶矩∑==n i k i k X n A 11( k=1,2,…) 样本k 阶中心矩∑-==ni k i k X X n B 1)(1( k=1,2,…)二.抽样分布 即统计量的分布1.X 的分布 不论总体X 服从什么分布, E (X ) = E(X) , D (X ) = D(X) / n . 特别,若X~ N (μ,σ2 ) ,则X ~ N (μ, σ2 /n) .2.χ2分布 (1)定义 若X ~N (0,1) ,则Y =∑=ni i X 12~ χ2(n)自由度为n 的χ2分布.(2)性质 ①若Y~ χ2(n),则E(Y) = n , D(Y) = 2n .②若Y 1~ χ2(n 1) Y 2~ χ2(n 2) ,则Y 1+Y 2~ χ2(n 1 + n 2). ③若X~ N (μ,σ2 ), 则22)1(σS n -~ χ2(n-1),且X 与S 2相互独立.(3)分位点 若Y~ χ2(n),0< α <1 ,则满足αχχχχαααα=<>=<=>--))}(())({()}({)}({22/122/212n Y n Y P n Y P n Y P 的点)()(),(),(22/122/212n n n n ααααχχχχ--和分别称为χ2分布的上、下、双侧α分位点.3. t 分布(1)定义 若X~N (0,1 ),Y~ χ2 (n),且X,Y 相互独立,则t=nY X~t(n)自由度为n 的t 分布. (2)性质①n →∞时,t 分布的极限为标准正态分布.②X ~N (μ,σ2 )时, nS X μ-~ t (n-1) . ③两个正态总体相互独立的样本 样本均值 样本方差X~ N (μ1,σ12 ) 且σ12=σ22=σ2 X 1 ,X 2 ,…,X n1X S 12Y~ N (μ2,σ22 ) Y 1 ,Y 2 ,…,Y n2 Y S 22则 212111)()(n n S Y X w +---μμ~ t (n 1+n 2-2) , 其中 2)1()1(212222112-+-+-=n n S n S n S w(3)分位点 若t ~ t (n) ,0 < α<1 , 则满足αααα=>=-<=>)}({)}({)}({2/n t t P n t t P n t t P的点)(),(),(2/n t n t n t ααα±-分别称t 分布的上、下、双侧α分位点. 注意: t 1- α (n) = - t α (n).4.F 分布 (1)定义 若U~χ2(n 1), V~ χ2(n 2), 且U,V 相互独立,则F =21n V n U ~F(n 1,n 2)自由度为(n 1,n 2)的F 分布.(2)性质(条件同3.(2)③)22212221σσS S ~F(n 1-1,n 2-1)(3)分位点 若F~ F(n 1,n 2) ,0< α <1,则满足)},({)},({21121n n F F P n n F F P αα-<=>ααα=<>=-))},(()),({(212/1212/n n F F n n F F P的点),(),(),,(),,(212/1212/21121n n F n n F n n F n n F αααα--和分别称为F 分布的上、下、双侧α分位点. 注意: .).(1),(12211n n F n n F αα=-第七章 参数估计一.点估计 总体X 的分布中有k 个待估参数θ1, θ2,…, θk .X 1 ,X 2 ,…,X n 是X 的一个样本, x 1 ,x 2 ,…,x n 是样本值.1.矩估计法先求总体矩⎪⎩⎪⎨⎧===),,,(),,,(),,,(2121222111k k k k k θθθμμθθθμμθθθμμ 解此方程组,得到⎪⎩⎪⎨⎧===),,,(),,,(),,,(2121222111kk k k k μμμθθμμμθθμμμθθ ,以样本矩A l 取代总体矩μ l ( l=1,2,…,k)得到矩估计量⎪⎪⎩⎪⎪⎨⎧===∧∧∧),,,(),,,(),,,(2121222111k k k k k A A A A A A A A A θθθθθθ,若代入样本值则得到矩估计值. 2.最大似然估计法若总体分布形式(可以是分布律或概率密度)为p(x, θ1, θ2,…, θk ),称样本X 1 ,X 2 ,…,X n 的联合分布∏==ni k i k x p L 12121),,,,(),,,(θθθθθθ 为似然函数.取使似然函数达到最大值的∧∧∧k θθθ,,,21 ,称为参数θ1, θ2,…,θk 的最大似然估计值,代入样本得到最大似然估计量.若L(θ1, θ2,…, θk )关于θ1, θ2,…, θk 可微,则一般可由似然方程组 0=∂∂i L θ 或 对数似然方程组 0ln =∂∂iLθ (i =1,2,…,k) 求出最大似然估计. 3.估计量的标准(1) 无偏性 若E(∧θ)=θ,则估计量∧θ称为参数θ的无偏估计量.不论总体X 服从什么分布, E (X )= E(X) , E(S 2)=D(X), E(A k )=μk =E(X k ),即样本均值X , 样本方差S 2,样本k 阶矩A k 分别是总体均值E(X),方差D(X),总体k 阶矩μk 的无偏估计,(2)有效性 若E(∧θ1 )=E(∧θ2)= θ, 而D(∧θ1)< D(∧θ2), 则称估计量∧θ1比∧θ2有效. (3)一致性(相合性) 若n →∞时,θθP →∧,则称估计量∧θ是参数θ的相合估计量. 二.区间估计1.求参数θ的置信水平为1-α的双侧置信区间的步骤(1)寻找样本函数W=W(X 1 ,X 2 ,…,X n ,θ),其中只有一个待估参数θ未知,且其分布完全确定. (2)利用双侧α分位点找出W 的区间(a,b),使P{a<W <b}=1-α. (3)由不等式a<W<b 解出θθθ<<则区间(θθ,)为所求. 2.单个正态总体待估参数 其它参数 W 及其分布 置信区间μ σ2已知 nX σμ-~N (0,1) (2/ασz n X ±) μ σ2未知 nS X μ-~ t (n-1) )1((2/-±n t n S X α σ2 μ未知 22)1(σS n -~ χ2(n-1) ))1()1(,)1()1((22/1222/2-----n Sn n S n ααχχ 3.两个正态总体 (1)均值差μ 1-μ 2其它参数 W 及其分布 置信区间已知2221,σσ22212121)(n n Y X σσμμ+--- ~ N(0,1) )(2221212n n z Y X σσα+±-未知22221σσσ== 212111)(n n S Y X w +---μμ~t(n 1+n 2-2) )11)2((21212n n S n n t Y X w+-+±-α 其中S w 等符号的意义见第六章二. 3 (2)③.(2) μ 1,μ 2未知, W=22212221σσS S ~ F(n 1-1,n 2-1),方差比σ12/σ22的置信区间为))1,1(1,)1,1(1(212/12221212/2221----⋅-n n F S S n n F S S αα注意:对于单侧置信区间,只需将以上所列的双侧置信区间中的上(下)限中的下标α/2改为α,另外的下(上)限取为-∞ (∞)即可.。

【2024版】概率论与数理统计(数理统计的基本概念)

【2024版】概率论与数理统计(数理统计的基本概念)

X
2 n
)
D(
X
2 1
)
D(
X
2 2
)
D(
X
2 n
)
nD (
X
2 i
)
n{ E (
X
4 i
)
[E(
X
2 i
)]2
}
n
x4
1
2
e
x2 2
dx
12
n3
1
2n
23
若 2 ~ 2(n) 分布函数为F ( x)
,0 1 若F ( x) P{ 2 x}
则其解称为 2 分布 的 分位数(临界值)
0.15 00.1.155
000.1..11
N(0,1)
n=10 n=10 nn==33
n增大
000.0..00555
nnn===111
000
-5--55
-4--44
-3-3
-2-2
-1-1
00
11
22
33
444
555
t 分布的密度曲线关于y轴对称 随着n的增大, t 分布的密度曲线越陡
n 时,t 分布趋于标准正态分布N (0,1)
后,还要对数据进行加工和提炼,将样本的有关 信息,利用数学的工具进行加工.
引入统计量的概念
12
定义 设( X1, X 2 ,, X n )为来自总体X的一个样本,
若n元函数f ( X1, X 2 ,, X n )不含任何未知参数,

称f
(
X
1
,
X
2
,,
X
n
)为X
1
,
X
2

数理统计中的随机抽样和抽样分布——概率论知识要点

数理统计中的随机抽样和抽样分布——概率论知识要点

数理统计中的随机抽样和抽样分布——概率论知识要点概率论作为数理统计的基础,是研究随机现象及其规律的数学分支。

在数理统计中,随机抽样和抽样分布是非常重要的概念,本文将对这两个概念进行详细介绍和解释。

一、随机抽样随机抽样是指从总体中以随机的方式选择样本的过程。

在进行随机抽样时,每个个体被选中的概率应该是相等的,这样才能保证样本的代表性和可靠性。

随机抽样的方法有很多种,常用的包括简单随机抽样、分层抽样和系统抽样等。

1. 简单随机抽样简单随机抽样是最基本的抽样方法,它的特点是每个个体被选中的概率相等且相互独立。

简单随机抽样可以通过随机数表、随机数发生器等工具来实现。

在实际应用中,简单随机抽样常用于总体规模较小的情况。

2. 分层抽样分层抽样是将总体划分为若干个层次,然后从每个层次中随机选择样本。

这种抽样方法可以保证不同层次的个体在样本中的比例与总体中的比例相同,从而提高样本的代表性。

3. 系统抽样系统抽样是按照一定的规则从总体中选取样本的方法。

例如,可以按照一定的间隔从总体中选择样本,这个间隔称为抽样间隔。

系统抽样的优点是操作简便,但也存在可能引入系统误差的风险。

二、抽样分布抽样分布是指在随机抽样的基础上,通过大量重复抽样得到的统计量的分布情况。

在数理统计中,常用的抽样分布包括正态分布、t分布和F分布等。

1. 正态分布正态分布是一种重要的抽样分布,它具有对称、单峰和钟形曲线的特点。

在大样本情况下,根据中心极限定理,样本均值的分布接近于正态分布。

正态分布在数理统计中的应用非常广泛,例如用于估计总体均值和总体方差等。

2. t分布t分布是用于小样本情况下的抽样分布。

它相比于正态分布来说,具有更宽的尾部和更矮的峰值。

t分布的形状取决于自由度,自由度越大,t分布越接近于正态分布。

t分布在小样本情况下的参数估计和假设检验中经常被使用。

3. F分布F分布是用于比较两个样本方差是否显著不同的抽样分布。

F分布的形状取决于两个样本的自由度,它具有右偏和非对称的特点。

概率论与数理统计 第5章

概率论与数理统计 第5章
i 1 4 i 2 2 i i 1
n
n
性质2.(分布可加性):若X~2(n1),Y~2(n2),X与 Y独立,则
X + Y~2(n1+n2 )
3、2分布表及有关计算
(1)构成 P{2(n)>λ}=α,已知n, α可查表求得λ; (2)有关计算P 2 (n) 2 (n) 称为上侧α分位数
例5.1 设 X ~ N ( , 2 ) (X1,X2,…,Xn)为X的一个样本,
求(X1,X2,…,Xn)的密度。 解 (X1,X2,…,Xn)为X的一个样本,故
X i ~ N ( , 2 )
n
i 1,2,, n
f ( x1 , x2 ,, xn ) f ( xi )
16 2

i 1,2,,16
2 1 16 2 2 P ( X i ) P 8 2 (16) 16 2 16 i 1
2—分布的密度函数f(y)曲线
n/2 1 f ( y) 2 ( n / 2) y 0,
n y 1 2 2
e , y0 y0
2 例5.4 X ~ N ( , ) (X1,X2,X3)为X的一个样本
X 1 X 2 X 3 的分布。 求


(n)为整体记号
2
2 (n) 2 2 查表得 0 ( 25 ) 34 . 382 10) 18.307 .1 0.05 (
1 当n充分大时,近似有 (n ) (u 2n - 1) 2 2
2
练习1. P(2(n)<s)=1-p ∵P(2(n) < s)=1- P(2(n) s )=1-p ∴ P(2(n) s )=p 2 s p (n) 练习2. P(2(11)>s)=0.05,求s

概率论与数理统计知识点总结

概率论与数理统计知识点总结

概率论与数理统计知识点总结概率论与数理统计是数学的一个重要分支,主要研究各种随机现象的规律性及其数值描述。

下面将对概率论与数理统计的一些重要知识点进行总结。

一、概率论知识点总结1. 随机事件与概率- 随机事件:指在一定条件下具有不确定性的事件。

- 概率:用来描述随机事件发生的可能性大小的数值。

2. 古典概型与几何概型- 古典概型:指随机试验中,所有基本事件的可能性相等的情况。

- 几何概型:指随机试验中,基本事件的可能性不完全相等,与图形的属性有关的情况。

3. 随机变量与概率分布- 随机变量:定义在样本空间上的函数,用来描述试验结果与数值之间的对应关系。

- 离散随机变量:取有限个或可列个数值的随机变量。

- 连续随机变量:取无限个数值的随机变量。

4. 期望与方差- 期望:反映随机变量平均取值的数值。

- 方差:反映随机变量取值偏离期望值的程度。

5. 大数定律与中心极限定理- 大数定律:指在独立重复试验中,随着试验次数增加,事件发生的频率趋近于其概率。

- 中心极限定理:指在独立随机变量之和的情况下,当随机变量数目趋于无穷时,这些随机变量之和的分布趋近于正态分布。

二、数理统计知识点总结1. 抽样与抽样分布- 抽样:指对总体进行有规则地选择一部分样本进行观察和研究的过程。

- 抽样分布:指用统计量对不同样本进行计算所得到的分布。

2. 参数估计与置信区间- 参数估计:根据样本推断总体的未知参数。

- 置信区间:对于总体参数估计的一个区间估计,用来表示这个参数的可能取值范围。

3. 假设检验与统计显著性- 假设检验:用来判断统计推断是否与已知事实相符。

- 统计显著性:基于样本数据,对总体或总体参数进行判断的一种方法。

4. 方差分析与回归分析- 方差分析:用来研究因素对于某一变量均值的影响程度。

- 回归分析:通过观察变量之间的关系,建立数学模型来描述两个或多个变量间的依赖关系。

5. 交叉表与卡方检验- 交叉表:将两个或多个变量的数据按照某种方式交叉排列而形成的表格。

《概率论与数理统计》第六章

《概率论与数理统计》第六章
所以,X是一个随机变量!
既然总体是随机变量X,自然就有其概率分布。
我们把X的分布称为总体分布。
总体的特性是由总体分布来刻画的。因此,常 把总体和总体分布视为同义语。
第六章 样本及抽样分布 ‹#›
例2
在例1中,假定物体真实长度为(未知)。一般 说来,测量值X就是总体,取 附近值的概率要大一 些,而离 越远的值被取到的概率就越小。
k=1,2,…
第六章 样本及抽样分布 ‹#›
它反映了总体k 阶矩的信息
样本k阶中心矩
Bk
1 n
n i 1
(Xi
X )k
它反映了总体k 阶 中心矩的信息
第六章 样本及抽样分布 ‹#›
统计量的观察值
1 n
x n i1 xi;
s2
1 n 1
n i1
(xi
x )2
s
1 n 1
n i1
(xi
x
)2
第六章 样本及抽样分布 ‹#›
实际上,我们真正关心的并不一定是总体或个
体本身,而真正关心的是总体或个体的某项数量指 标。
如:某电子产品的使用寿命,某天的最高气温, 加工出来的某零件的长度等数量指标。因此,有时也
将总体理解为那些研究对象的某项数量指标的全
体。
第六章 样本及抽样分布 ‹#›
为评价某种产品质量的好坏,通常的做法是: 从全部产品中随机(任意)地抽取一些样品进行观测(检
样本X1,X2,…,Xn 既被看成数值,又被看成随机变量, 这就是所谓的样本的二重性。
随机样本
例 4 (例2续) 在前面测量物体长度的例子中,如果我们 在完全相同的条件下,独立地测量了n 次,把这 n 次测 量结果,即样本记为
X1,X2,…,Xn .

概率论与数理统计第6章

概率论与数理统计第6章

以分组区间为底,以
Yj
Wj X j1 X j
Wj 5
为高
作频率直方图
23
从频率直方图可看到:靠近两个极端的数据出现比 较少,而中间附近的数据比较多,即中间大两头小的分 布趋势,——随机变量分布状况的最粗略的信息。
在频率直方图中, 每个矩形面积恰好等于样本值 落在该矩形对应的分组区间内的频率,即
S j
Wj X j1
Xj
X j1 X j
Wj
频率直方图中的小矩形的面积近似地反映了样本数
据落在某个区间内的可能性大小,故它可近似描述X的
分布状况。
24
12
第二.计算样本特征数
1.反映集中趋势的特征数:样本均值、中位数、众数等 样本均值MEAN 中位数MEDIAN 众数
X 90.3
91
91, 94
代表性——即子样( X1, X2 ,
,
X
)的每个分量
n
X

i
总体 X 具有相同的概率分布。
独立性——即 X1, X2, , Xn 是相互独立的随机变量。
满足上述两点要求的子样称为简单随机子样.获得简 单随机子样的抽样方法叫简单随机抽样.
从简单随机子样的含义可知,样本 X1, X2 , , Xn 是来自总体 X、与总体 X具有相同分布的随机变量.
2分布 t 分布 数理统计的三大分布(都是连续型). F分布 它们都与正态分布有密切的联系.
在本章中特别要求掌握对正态分布、 2分布、 t分布、F分布的一些结论的熟练运用. 它们
是后面各章的基础.
31
一、 2分布
定义 设总体 X ~ N 0,1 , X1, X2,..., Xn 是 X

概率论与数理统计第6章

概率论与数理统计第6章

不含未知参数的样本的函数称为统计量 不含未知参数的样本的函数称为统计量. 统计量 2. 几个常见统计量
1 n 样本均值 X = ∑Xi n i=1
反映总体 均值的信息 反映总 体方差 的信息
1 n 2 2 样本方差 S = ∑( Xi − X) n −1 i=1
样本2阶中心矩 样本 阶中心矩
反映总体2 反映总体 阶 中心矩的信息
(
)

n1 +n2 2
x≥0
例1 设X、Y相互独立均服从正态分布 、 相互独立均服从正态分布 N(0,3), X1,X2,…,X9和Y1,Y2,…,Y9分别为来 的样本。 自X、Y的样本。求 、 的样本
U=
X1 + X 2 + L + X 9 Y +Y +L+Y
2 1 2 2
的分布。 的分布。
2 9
小样本问题中使用) 精确抽样分布(小样本问题中使用) 抽样分布 大样本问题中使用) 渐近分布 (大样本问题中使用
{
三. 统计三大分布
1 . χ 分布
2
定义: 相互独立, 定义 设 X1 , X2 ,L, Xn相互独立 都服从正态 分布N(0,1), 则称随机变量: 则称随机变量: 分布 2 2 2 2 χ = X 1 + X 2 + …+X n 所服从的分布为自由度为 n 的 χ 分布. 分布
3. F分布 分布 与 X ~ χ (n1),Y ~ χ (n2 ), X与Y X / n1 相互独立, 相互独立,则称统计量 F = Y / n2 定义: 定义 设
2 2
服从自由度为n 分布, 服从自由度为 1及 n2 的F分布,n1称为第 分布 一自由度, 称为第二自由度, 一自由度,n2称为第二自由度,记作 F~F(n1,n2) .

概率论与数理统计知识点总结

概率论与数理统计知识点总结

概率论与数理统计知识点总结一、概率论1.随机试验和样本空间:随机试验是具有不确定性的试验,其结果有多个可能的取值。

样本空间是随机试验所有可能结果的集合。

2.事件及其运算:事件是样本空间中满足一定条件的结果的集合。

事件之间可以进行并、交、补等运算。

3.概率的定义和性质:概率是描述随机事件发生可能性的数值。

概率具有非负性、规范性和可列可加性等性质。

4.条件概率和独立性:条件概率是在已知一事件发生的条件下,另一事件发生的概率。

事件独立表示两个事件之间的发生没有相互关系。

5.全概率公式和贝叶斯公式:全概率公式是一种计算事件概率的方法,将事件分解成互斥的多个事件的概率之和。

贝叶斯公式是一种用于更新事件概率的方法。

6.随机变量和分布函数:随机变量是样本空间到实数集的映射,用来描述试验结果的数值特征。

分布函数是随机变量取值在一点及其左侧的概率。

7.常用概率分布:常见的概率分布包括离散型分布(如二项分布、泊松分布)和连续型分布(如正态分布、指数分布)。

8.数学期望和方差:数学期望是随机变量的平均值,用于描述随机变量的中心位置。

方差是随机变量离均值的平均距离,用于描述随机变量的分散程度。

二、数理统计1.统计量和抽样分布:统计量是对样本数据进行总结和分析的函数。

抽样分布是统计量的概率分布,用于推断总体参数。

2.估计和点估计:估计是利用样本数据对总体参数进行推断。

点估计是利用样本数据得到总体参数的一个具体数值。

3.估计量的性质和评估方法:估计量的性质包括无偏性、有效性和一致性等。

评估方法包括最大似然估计、矩估计等。

4.区间估计:区间估计是对总体参数进行估计的区间范围。

置信区间是对总体参数真值的一个区间估计。

5.假设检验和检验方法:假设检验是在已知总体参数的条件下,对总体分布做出的统计推断。

检验方法包括参数检验和非参数检验。

6.正态总体的推断:当总体近似服从正态分布时,可以利用正态分布的性质进行推断。

7.方差分析和回归分析:方差分析用于比较两个或多个总体均值是否相等。

概率论与数理统计基本概念及抽样分布PPT课件

概率论与数理统计基本概念及抽样分布PPT课件

~
2 (n1 ),
2 2
~
2 (n2 ), 且它们相互独立,

2 1
2 2
~
2 (n1
n2 )
《概率统计》
返回
下页
结束
4. 2分布的百分位点
对给定的α(0<α<1)
(1)称满足
P{ 2
2
(n)}
,即
f ( y)dy
x2 ( n)
的点为 2分布的上100α百分位点。
f(y)
(2)称满足
注:在研究中,往往关心每个个体的一个(或几个)数量指标和 该数量指标在总体中的分布情况. 这时,每个个体具有的数量 指标的全体就是总体.
或,总体:研究对象的某项数量指标的值的全体.
《概率统计》
某批 灯泡的 寿命
该批灯泡寿命的 全体就是总体
返回
下页
结束
为推断总体分布及各种特征,按一定规则从总体中抽取若 干个体进行观察试验,以获得有关总体的信息,这一抽取过程 为 “抽样”.
( x)
(1)称满足条件 P{X>Xα} =α,
α

( x)dx
X
的点Xα为N(0,1)分布的上100α百分位点.
X1-α
0
由于 P{X X } 1 记 -Xα= X1-α
(2)称满足条件 P {| X | X }
2
2
的点 X 为N(0,1)分布的双侧100α百分位点.
X
2

E(X )
E(1 n
n i 1
Xi)
1 n
n i 1
E(Xi )
1 n
n
D(X ) D(1 n
n i1
Xi)

概率论与数理统计课件:数理统计基础知识

概率论与数理统计课件:数理统计基础知识

数理统计基础知识
首页 返回 退出
6.1.1 总体
§6.1 总体和随机样本
总体:研究对象的全部可能观察值叫做总体. 个体:组成全体的每个观察值叫做个体.
如:考察某校学生的身高
总体:该校的所有学生的身高 个体:每个学生的身高
数理统计基础知识
首页 返回 退出
实际问题中,要研究的是有关对象的各种数量指标. 总体可以用一个随机变量及其分布来描述.
首页 返回 退出
由于抽样的目的是为了对总体进行统计推断, 为了使抽取的样本能很好地反映总体的信息,必 须考虑抽样方法.
最常用的一种抽样方法叫作“简单随机抽样” 它要求抽取的样本满足下面两点: 1. 代表性: X1,X2,…,Xn中每一个与所考察 的总体有相同的分布.
2. 独立性: X1,X2,…,Xn是相互独立的随机变量.
从一批产品中抽5件,检验产品是否合格.
数理统计基础知识
样本容量为5
首页 返回 退出
样本是随机变量.
抽到哪5辆是随机的
容量为n的样本可以看作n维随机变量(X1,X2,…,Xn).
但是,一旦取定一组样本,得到的是n个具体的数 (x1,x2,…,xn),称为样本的一次观察值,简称样本值 .
数理统计基础知识
总体的指标 如体重、身高、寿命等 是随机变量X 个体的指标 如体重、身高、寿命等 是随机变量X 的一个取值
常用随机变量的记号或用其分布函数表示总体.
如:总体X或总体F X
数理统计基础知识
首页 返回 退出
有限总体 总体
无限总体
1.考察某校大一新生(共2000人)的身高. 有限总体
2.观测某地每天最高气温. 无限总体 3.某厂生产的所有电视显像管的寿命. 无限总体

概率论与数理统计知识点总结

概率论与数理统计知识点总结

概率论与数理统计知识点总结一、概率的基本概念1.概率的定义:概率是描述事件发生可能性的数字,表示为一个介于0和1之间的数。

2.事件与样本空间:事件是可能发生的结果的集合,样本空间是所有可能结果的集合。

3.事件的运算:事件的运算包括并、交、差等,分别表示两个事件同时发生、至少一个事件发生、一个事件发生而另一个事件不发生等。

4.概率的性质:概率具有非负性、规范性、可列可加性等性质。

二、随机变量与概率分布1.随机变量的定义:随机变量是一个变量,它的值由随机事件决定。

2.离散随机变量:离散随机变量只能取有限或可数个值,其概率表示为离散概率分布函数。

3.连续随机变量:连续随机变量可以取任意实数值,其概率表示为概率密度函数。

4.分布函数:分布函数描述随机变量的概率分布情况,包括累积分布函数和概率质量函数。

三、常见概率分布1.离散分布:包括伯努利分布、二项分布、泊松分布等。

2.连续分布:包括均匀分布、正态分布、指数分布、伽玛分布等。

正态分布在自然界和社会现象中广泛存在。

3.其他分布:包括卡方分布、指数分布、F分布、t分布等。

四、抽样与统计推断1.抽样:抽样是从总体中选择一部分个体进行实验或调查的方法,常用的抽样方法包括随机抽样、分层抽样、整群抽样等。

2.统计推断:通过从样本中获得的数据,对总体做出有关参数的推断。

包括点估计和区间估计两种方法。

3.假设检验:通过对样本数据的统计量进行计算,判断总体参数是否满足其中一种假设。

包括单样本假设检验、两样本假设检验、方差分析等。

五、回归分析与相关分析1.回归分析:研究两个或多个变量之间关系的统计方法,包括一元线性回归分析、多元线性回归分析等。

2.相关分析:研究两个变量之间相关性的统计方法,常用的相关系数包括皮尔逊相关系数和斯皮尔曼相关系数。

六、贝叶斯统计学1.贝叶斯定理:根据先验概率和条件概率,计算后验概率的统计方法。

2.贝叶斯推断:根据贝叶斯定理以及样本数据,推断参数的后验分布。

概率论与数理统计6-8

概率论与数理统计6-8

无关的样本的连续函数,则称g(X1,X2,…,Xn)为
统计量。 统计量是样本的函数,它是一个随机变量, 如果x1, x2, …, xn是样本观察值, 则g(x1, x2, …, xn)是统计量g(X1, X2, …, Xn)的一个观察值.X i ; n i 1 2 n 1 2 2. 样本方差 S (X i X ) ; n - 1 i 1 1 n k 3. 样本k阶原点矩 A k X i , k 1, 2, ; n i 1 1 n 4. 样本k阶中心矩 Bk (X i X ) k , k 2, 3, . n i 1
§7.1 点估计 一. 问题的提法:
设总体X的分布函数F ( x; θ )的形式为已知 ,
是待估参数, 1 , X 2 , , X n 是X的一个样本, X
x1, x2 , , xn 是相应的一个样本值。
点估计问题就是要构造 一个适当的统计量 ˆ ( X , X , X ),用它的观察值 ˆ( x , x , , x )
2
分布具有可加性,定义 X 1 ,X 2 , ,X n 独立 中 n 1 同服从N (0,1),所以 = X ~ ( , ) 2 2 i 1
2 2 i n
β α α-1 -x x e , x 0, 分布的概率密度为 f ( x) Γ (α ) : 0 , 其它. n 1 2 2 比较 (n)的密度可知: (n) 分布就是 , 2 2 2 的分布, 即 (n) (n / 2, 1/2).
N (0, 2 ) ,X1,X2,X3 为取自总体的一个样本, 2.设总体 X~
试求:(1)3X1-2X2+X3 的分布;(2)
2 X1 X 22 X 32
的分布。

概率论与数理统计第六章

概率论与数理统计第六章

Ch 6 数理统计的基本概念§6.1 基本概念 一、总体与样本1、总体——研究对象的全体,记为X 。

2、个体——构成总体的每一个对象,记为i X 。

3、总体容量——总体中包含的个体的个数。

有限总体——容量有限;无限总体——容量无限。

为推断总体X 的分布,从总体中抽取n 个个体,则对应n 个r.v.n X X X .....2,1——来自于总体X 的一个样本。

n X X X ......,21的取值((n x x x ,.....,21)--观测结果)称为样本的观测值,简称为样本值,整个抽取过程称之为抽样。

抽取的目的是根据样本的取值情况推断总体情况,因此应尽可能的使抽取的样本能反映总体的状况,故要求抽取的样本具有以下性质:文档收集自网络,仅用于个人学习⑴ 代表性:样本中每个r.v.i X 与总体X 具有相同的分布。

文档收集自网络,仅用于个人学习⑵ 独立性:n X X X ......,21相互独立。

——简单的随机抽样所得的样本称为简单的随机样本;若总体X 的分布函数为F (x ),则样本n X X X .....2,1的联合分布函数)().....,(121*i ni n x F x x x F =∏=。

文档收集自网络,仅用于个人学习若X 为连续型,且d.f 为f(x),且联合p.d.f 为:)()....,(121*i ni n x f x x x f =∏= 若X 为离散型,且分布律为:....2,1,)(===k p x X P k k 则联合分布律:in i i in n i i p p p x X x X x X P ....).....,(212211⋅⋅====。

...2,1.....3,2,1=in i i i 二、统计量Def:不含有任何未知数的关于样本空本空间的函数称为统计量。

e.g.1 设总体X~),(2σμN ,其中2,σμ未知,(n X X X .....2,1)为取自总体X 的一个样本,则:∑∑==--==n i i n i i X X n S X n X 1221)(11,1均为统计量。

概率论与数理统计 第6章

概率论与数理统计  第6章
第 6 章 数理统计的基本概念
6.1 基本概念 6.2 抽样分布 习题 6
数理统计是具有广泛应用的一个数学分支,它以概率论 为基础,根据试验或观察得到的数据来研究随机现象,对研 究对象的客观规律性作出种种合理的估计和判断。数理统计 的内容包括:如何收集、整理数据资料;如何对所得的数据
资料进行分析、研究,从而对所研究的对象的性质、特点作
设总体 X 的分布律为 P ( X = x ) = p ( x ), X 1 , X
2
,…, X n为来自总体 X 的一个样本,则 X 1 , X 2 ,…, , X 2 ,…, X n)的联合分布律为
X n的分布律都是 P ( X i = x ) = p ( x ),从而 n 维随机变量(X
1
设总体 X 的概率密度为 f ( x ), X 1 , X 2 ,…, X n为 来自总体 X 的一个样本,则 X 1 , X 2 ,…, X n的概率密度 都是 f ( x ),从而 n 维随机变量(X 1 , X 2 ,…, X n)的联合 概率密度为
( n ) ,则称函数
为总体 X 的经验分布函数。
需要指出的是,若在 F n (x )的定义中将样本值换成对 应的样本,则当 n 固定时,它是一个随机变量,此时仍称之 为总体 X 的经验分布函数。所以用样本值定义的 F n (x )其 实是经验分布函数的观察值,在不致混淆的情况下统称为总 体 X 的经验分布函数。
出推断。数理统计的重要分支有统计推断、试验设计、多元 分析等,其具体方法甚多,应用相当广泛,已成为各学科从
事科学研究及生产、经济等部门进行有效工作的必不可少的
数学工具。

本章从数理统计的基本概念开始,讨论抽样分布及其重 要定理,这些抽样分布及其重要定理在概率论中尚未提到,

概率论与数理统计教案统计量和抽样分布

概率论与数理统计教案统计量和抽样分布

一、统计量和抽样分布的概念介绍1.1 统计量的定义讲解统计量的概念,即根据样本数据所定义的量,用来描述样本的某些特征。

例如,样本均值、样本方差等。

1.2 抽样分布的定义解释抽样分布是指在一定的抽样方法下,统计量的概率分布。

例如,正态分布、t分布等。

二、统计量的估计方法2.1 点估计介绍点估计的概念,即用一个具体的数值来估计总体参数。

例如,用样本均值来估计总体均值。

2.2 区间估计讲解区间估计的方法,即根据样本数据,给出总体参数估计的一个区间,该区间以一定的概率包含总体参数。

例如,置信区间。

三、抽样分布的性质及应用3.1 抽样分布的性质讲解抽样分布的一些基本性质,如独立性、对称性、无偏性等。

3.2 抽样分布的应用介绍抽样分布在实际问题中的应用,如利用抽样分布来判断总体均值的假设检验问题。

四、假设检验的基本概念和方法4.1 假设检验的定义解释假设检验是一种统计推断方法,通过观察样本数据,对总体参数的某个假设进行判断。

4.2 假设检验的方法讲解常见的假设检验方法,如单样本t检验、双样本t检验、卡方检验等。

4.3 假设检验的判断准则介绍假设检验的判断准则,如P值、显著性水平等,并解释其含义和作用。

六、正态分布及其应用6.1 正态分布的定义与性质详细介绍正态分布的概念、概率密度函数、累积分布函数以及其性质,如对称性、钟形曲线等。

6.2 标准正态分布解释标准正态分布的概念,即均值为0,标准差为1的正态分布。

讲解标准正态分布表的使用方法。

6.3 正态分布的应用介绍正态分布在实际问题中的应用,如利用正态分布来分析和估计总体均值、方差等参数。

七、t 分布及其应用7.1 t 分布的定义与性质讲解t 分布的概念、概率密度函数、累积分布函数以及其性质。

解释t 分布与正态分布的关系。

7.2 t 分布的自由度介绍t 分布的自由度概念,即样本量。

讲解自由度对t 分布形状的影响。

7.3 t 分布的应用介绍t 分布在实际问题中的应用,如利用t 分布进行小样本推断、假设检验等。

概率论与数理统计6.第六章:样本及抽样分布

概率论与数理统计6.第六章:样本及抽样分布

),
,
,
,
是来
Z=
(

证明统计量 Z 服从自由度为 2 的 t 分布。
14
),
,
,
,
是来 , .ຫໍສະໝຸດ 自 总 体 X 的 样 本 , E( ) 则 ,D( )=
是来自总体 X ,D(X)= . ,
,D( )=
11
3. 设 , 本 ,E(X)=
, , 为来自总体 X 的样 ,D(X)=9, 为样本均值 , 试用 < ≥ ,
切比雪夫不等式估计 P{ P{ 4.设 , 则当 K= > ≤ , , . 是总体 X
lim f (t ) (t )
n
1 e 2
t2 2
, x
3.分位点 设 T~t(n), 若对 :0<<1,存在 t(n)>0,
4
满足 P{Tt(n)}=, 则称 t(n)为 t(n)的上侧分位点 注: t1 (n) t (n) 三、F—分布 1.构造 若 1 ~2(n1), 2~2(n2),1, 2 独立,则
y0
2. F—分布的分位点 对于 :0<<1,若存在 F(n1, n2)>0, 满足 P{FF(n1, n2)}=, 则称 F(n1, n2)
5
为 F(n1, n2)的上侧 分位点; 注: F1 (n1 , n2 )
1 F (n2 , n1 )
§ 6.3 正态总体的抽样分布定理
X Y /n ~ t ( n)
t(n)称为自由度为 n 的 t—分布。 t(n) 的概率密度为
n 1 ) 1 t 2 n2 2 f (t ) (1 ) , t n n n ( ) 2 (
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
《概率统计》 返回 下页 结束
第六章 样本及抽样分布
数理统计的核心问题是由样本推断总体,即统计推断问题. §6.1 随机样本与统计量 由于个体的出现是 随机的,所以总体 一 、 总体、个体与样本 总体: 研究对象的全体称为总体(母体). 是一个随机变量. 用X表示. 总体分为有限总体和无限总体. 个体: 组成总体的每个研究对象称为个体. 注:在研究中,往往关心每个个体的一个(或几个)数量指标和 该数量指标在总体中的分布情况. 这时,每个个体具有的数量 指标的全体就是总体. 或,总体:研究对象的某项数量指标的值的全体.
《概率统计》
返回
下页
结束
数理统计研究方法流程图:
采集数据 加工处理
总体X
样本
统计量
对总体X 作出推断
对统计量分析
数理统计以概率论为基础,研究如何搜集资料,并对统计资料 进行整理和分析,对整体的某些性质作出推断. 数理统计内容丰富,应用广泛.本书介绍了数理统计初步知识: 参数估计;假设检验 [;方差分析;回归分析].
X >13}
0.5 X 12 0.5 1 P{| X 12 | 0.5} 1 P{ } 2 2 2 5 5 5
=1-[Φ(0.56)-Φ(-0.56)]=2-2Φ(0.56)=0.5754
《概率统计》 返回 下页 结束
二、标准正态分布的百分位点 设X~N(0,1),对给定的α (0<α <1) (1)称满足条件 P{X>Xα} =α, 即
一、 X 的分布 设 总体X的分布形式未知,E(X)=μ,D(X)=σ2, ( X1,X2,…,Xn )为X的一样本. 则X1,X2,…,Xn独立同分布且 E(Xi)=μ, D(Xi)= σ2 (i =1, 2, …, n) 1 n 1 n 1 E ( X ) E ( X ) E ( X ) n 则 i i n i 1 n i 1 n
第六章 样本及抽样分布
绪言: 概率论与数理统计的关系 概率论是数理统计的理论基础;数理统计是概率论的应用. 数理统计概论 概率论是在(总体)X分布已知的情况下,研究X的性质及 统计规律性. 数理统计是在(总体)X分布未已知(或部分未知)的情况 下,对总体X的分布作出推断和预测. 数理统计的研究方法 通过从总体抽取部分个体(样本),通过对样本的研究, 对总体作出推断或预测.是一种由部分推测整体的方法.
简单随机样本: 由简单随机抽样抽得的样本 X1,X2,…,Xn称为简 单随机样本. (简称样本). 显然,样本就是来自总体X的 n 个相互独立的且与总体同分布 的随机变量X1,X2,…,Xn . 可看成 n 维随机向量( X1,X2,…,Xn ).
《概率统计》
返回
下页
结束
二、样本的数字特征 设( X1,X2,…,Xn )为来自总体X的简单随机样本. 1.样本均值: 2.样本方差:


1 D( X ) D( n

1 Xi ) 2 n i 1
n

2 1 D( X i ) 2 n 2 n n i 1 n
特别,若总体X~N(μ,σ2),则
X ~ N ( , ) n 1 若总体X~N (0,1), 则 X ~ N (0 , ) n
返回 下页 结束
2
《概率统计》
1 X n

i 1
n
Xi
常用于估计总体分布的均值,或 检验有关总体分布均值的假设.
n 1 S2 ( X i X )2 n 1 i 1

用于估计总体分布的方差. 式中的n-1称为S2的自由度(式中含有独 立变量的个数),S称为样本标准差,又称为标准误.
3.样本矩:
1 n k (k 1,2,) X K 阶原点矩: nk X i n1 n i 1 1 n K 阶中心矩: mnk ( X i X ) k (k 1,2,) m n 1 s 2 s 2 n i 1 n2
n
《概率统计》
返回
下页
结束
三、统计量 设X1,X2,…,Xn为来自总体X的一个样本,g(X1,X2,…,Xn)
是一个不含任何未知参数的连续函数,称 g(X1,X2,…,Xn) 为
统计量. 统计量是样本的函数,也是随机变量,具有概率分布. 把 统计量的概率分布称为抽样分布.
《概率统计》
返回
下页
结束
§6.2 抽样分布(几个重要分布)
( x)


X
( x)dx
α
X1-α
0
α

某批 灯泡的 寿命
《概率统计》 返回
该批灯泡寿命的 全体就是总体
下页 结束
为推断总体分布及各种特征,按一定规则从总体中抽取若 干个体进行观察试验,以获得有关总体的信息,这一抽取过程 为 “抽样”. 样本: 从总体X中按一定的规则抽出的个体的全部称为样本, 用 X1,X2,…,Xn 表示. 样本容量:样本中所含个体的个数称为样本容量,用 n 表示. 根据 n 的大小样本有大样本、小样本之分.
例1.设总体X~N(12,4),抽取一个样本(X1,X2,…,X5).
求(1)P{
X >13};(2)P{| X -12| >0.5} X ~N(12,4/5)
解: ∵X~N(12,4),∴
(1)P{
(2)P{| X -12| >0.5}
X 12 13 12 1 P{ X 13} 1 P{ } 1 (1.12) 0.1314 2 2 5 5
返回
下页
结束
2. 简单随机抽样:要求抽取的样本满足下面两点
1. 代表性: X1,X2,…,Xn中每一个与总体X有相同的分布. 2. 独立性: X1,X2,…,Xn是相互独立的随机变ቤተ መጻሕፍቲ ባይዱ.
简单随机抽样即为随机地独立地抽取,如:有放回抽样;无放回 抽样当总体很大,样本容量较小时,认为是近似的简单随机抽样.
从国产轿车中抽5辆 进行耗油量试验, 样本容量为5.
《概率统计》 返回 下页
结束
样本是随机变量.
抽到哪5辆是随机的!
容量为n的样本可以看作n维随机变量(X1, X2, …, Xn). 一旦取定一组样本,得到的是n个具体的数 (x1,x2,…,xn),称为样本的一次观察值,简称样本值 .
《概率统计》
相关文档
最新文档