概率论与数理统计 区间估计
概率论与数理统计复习笔记

概率论与数理统计复习第一章概率论的基本概念一.基本概念随机试验E:1可以在相同的条件下重复地进行;2每次试验的可能结果不止一个,并且能事先明确试验的所有可能结果;3进行一次试验之前不能确定哪一个结果会出现.样本空间S: E的所有可能结果组成的集合. 样本点基本事件:E的每个结果.随机事件事件:样本空间S的子集.必然事件S:每次试验中一定发生的事件. 不可能事件:每次试验中一定不会发生的事件.二. 事件间的关系和运算事件B包含事件A 事件A发生必然导致事件B发生.∪B和事件事件A与B至少有一个发生.3. A∩B=AB积事件事件A与B同时发生.4. A-B 差事件事件A 发生而B 不发生.5. AB= A 与B 互不相容或互斥事件A 与B 不能同时发生.6. AB=且A ∪B=S A 与B 互为逆事件或对立事件表示一次试验中A 与B 必有一个且仅有一个发生. B=A, A=B .运算规则 交换律 结合律 分配律 德摩根律 B A B A = B A B A =三. 概率的定义与性质1.定义 对于E 的每一事件A 赋予一个实数,记为PA,称为事件A 的概率.1非负性 PA ≥0 ; 2归一性或规范性 PS=1 ;3可列可加性 对于两两互不相容的事件A 1,A 2,…A i A j =φ, i ≠j, i,j=1,2,…,PA 1∪A 2∪…=P A 1+PA 2+…2.性质1 P = 0 , 注意: A 为不可能事件2有限可加性对于n个两两互不相容的事件A1,A2,…,An,PA1∪A2∪…∪An=PA1+PA2+…+PAn有限可加性与可列可加性合称加法定理3若A B, 则PA≤PB, PB-A=PB-PA .4对于任一事件A, PA≤1, PA=1-PA .5广义加法定理对于任意二事件A,B ,PA∪B=PA+PB-PAB .对于任意n个事件A1,A2,…,An…+-1n-1PA1A2…An四.等可能古典概型1.定义如果试验E满足:1样本空间的元素只有有限个,即S={e1,e2,…,en};2每一个基本事件的概率相等,即Pe1=Pe2=…= Pen.则称试验E所对应的概率模型为等可能古典概型.2.计算公式 PA=k / n 其中k是A中包含的基本事件数, n是S中包含的基本事件总数.五.条件概率1.定义 事件A 发生的条件下事件B 发生的条件概率PB|A=PAB / PA PA>0.2.乘法定理 PAB=PA P B|A PA>0; PAB=PB P A|B PB>0.PA 1A 2…A n =PA 1PA 2|A 1PA 3|A 1A 2…PA n |A 1A 2…A n-1 n ≥2, PA 1A 2…A n-1 > 03. B 1,B 2,…,B n 是样本空间S 的一个划分B i B j =φ,i ≠j,i,j=1,2,…,n, B 1∪B 2∪…∪B n =S ,则当PB i >0时,有全概率公式 PA=()()i ni i B A P B P ∑=1当PA>0, PB i>0时,有贝叶斯公式P B i|A=()()()()()()∑==ni i i i i i B A P B P B A P B P A P AB P 1. 六.事件的独立性1.两个事件A,B,满足PAB = PA PB 时,称A,B 为相互独立的事件.1两个事件A,B 相互独立 PB= P B|A .2若A 与B,A 与B ,A 与B, ,A 与B 中有一对相互独立,则另外三对也相互独立.2.三个事件A,B,C 满足PAB =PA PB, PAC= PA PC, PBC= PB PC,称A,B,C 三事件两两相互独立. 若再满足PABC =PA PB PC,则称A,B,C 三事件相互独立.个事件A 1,A 2,…,A n ,如果对任意k 1<k ≤n,任意1≤i 1<i 2<…<i k ≤n.有()()()()kki i i i i i A P A P A P A A A P 2121=,则称这n 个事件A 1,A 2,…,A n 相互独立.第二章 随机变量及其概率分布一.随机变量及其分布函数1.在随机试验E 的样本空间S={e}上定义的单值实值函数X=X e 称为随机变量.2.随机变量X 的分布函数Fx=P{X ≤x} , x 是任意实数. 其性质为:10≤Fx≤1 ,F -∞=0,F∞=1. 2Fx 单调不减,即若x 1<x 2 ,则 Fx 1≤Fx 2.3Fx 右连续,即Fx+0=Fx. 4P{x 1<X≤x 2}=Fx 2-Fx 1.二.离散型随机变量 只能取有限个或可列无限多个值的随机变量1.离散型随机变量的分布律 P{X= x k }= p k k=1,2,… 也可以列表表示. 其性质为:1非负性 0≤P k ≤1 ; 2归一性11=∑∞=k k p .2.离散型随机变量的分布函数 Fx=∑≤xX k k P 为阶梯函数,它在x=x kk=1,2,…处具有跳跃点,其跳跃值为p k =P{X=x k } .3.三种重要的离散型随机变量的分布1X~0-1分布 P{X=1}= p ,P{X=0}=1–p 0<p<1 .2X~bn,p 参数为n,p 的二项分布P{X=k}=()kn k p p k n --⎪⎪⎭⎫ ⎝⎛1k=0,1,2,…,n 0<p<1 3X~参数为的泊松分布 P{X=k}=λλ-e k k !k=0,1,2,… >0 三.连续型随机变量1.定义 如果随机变量X 的分布函数Fx 可以表示成某一非负函数fx 的积分Fx=()dt t f x⎰∞-,-∞< x <∞,则称X 为连续型随机变量,其中f x 称为X 的概率密度函数.2.概率密度的性质1非负性 fx ≥0 ; 2归一性 ⎰∞∞-dx x f )(=1 ;3 P{x 1<X ≤x 2}=⎰21)(xx dx x f ; 4若f x 在点x 处连续,则f x=F/x .注意:连续型随机变量X 取任一指定实数值a 的概率为零,即P{X= a}=0 .3.三种重要的连续型随机变量的分布1X ~U a,b 区间a,b 上的均匀分布⎩⎨⎧=-0)(1a b x f其它b x a << . 2X 服从参数为的指数分布.()⎩⎨⎧=-0/1θθx ex f 00≤>x x 若若 >0.3X~N ,2参数为,的正态分布222)(21)(σμσπ--=x e x f -<x<, >0.特别, =0, 2=1时,称X 服从标准正态分布,记为X~N 0,1,其概率密度2221)(x e x -=πϕ , 标准正态分布函数 ⎰=Φ∞--xt dt e x 2221)(π, -x=1-Φx .若X ~N ,2, 则Z=σμ-X ~N 0,1, P{x 1<X ≤x 2}=Φσμ-2x-Φσμ-1x .若P{Z>z }= P{Z<-z }= P{|Z|>z /2}= ,则点z ,-z , z / 2分别称为标准正态分布的上,下,双侧分位点. 注意:z =1- , z 1- = -z .四.随机变量X 的函数Y= g X 的分布1.离散型随机变量的函数若gx k k=1,2,…的值全不相等,则由上表立得Y=gX 的分布律.若gx k k=1,2,…的值有相等的,则应将相等的值的概率相加,才能得到Y=gX 的分布律.2.连续型随机变量的函数若X 的概率密度为f X x,则求其函数Y=gX 的概率密度f Y y 常用两种方法:1分布函数法 先求Y 的分布函数F Y y=P{Y ≤y}=P{gX ≤y}=()()dx x f ky Xk∑⎰∆其中Δk y 是与gX ≤y 对应的X 的可能值x 所在的区间可能不只一个,然后对y 求导即得f Y y=F Y/y .2公式法 若gx 处处可导,且恒有g /x>0 或g / x<0 ,则Y=g X 是连续型随机变量,其概率密度为()()()()⎩⎨⎧'=yhyhfyf XY其它βα<<y其中hy是gx的反函数 , = min g -,g = max g -,g .如果f x在有限区间a,b以外等于零,则 = min g a,g b = max g a,g b .第三章二维随机变量及其概率分布一.二维随机变量与联合分布函数1.定义若X和Y是定义在样本空间S上的两个随机变量,则由它们所组成的向量X,Y称为二维随机向量或二维随机变量.对任意实数x,y,二元函数Fx,y=P{X≤x,Y≤y}称为X,Y的X和Y的联合分布函数.2.分布函数的性质1Fx,y分别关于x和y单调不减.20≤Fx,y≤1 , Fx,- =0, F-,y=0, F-,-=0, F,=1 .3 Fx,y关于每个变量都是右连续的,即 Fx+0,y= Fx,y, Fx,y+0= Fx,y .4对于任意实数x 1<x 2 , y 1<y 2P{x 1<X ≤x 2 , y 1<Y ≤y 2}= Fx 2,y 2- Fx 2,y 1- Fx 1,y 2+ Fx 1,y 1二.二维离散型随机变量及其联合分布律1.定义 若随机变量X,Y 只能取有限对或可列无限多对值x i ,y j i ,j =1,2,… 称X,Y 为二维离散型随机变量.并称P{X= x i ,Y= y j }= p i j 为X,Y 的联合分布律.也可列表表示.2.性质 1非负性 0≤p i j ≤1 .2归一性 ∑∑=i jijp 1 .3. X,Y 的X 和Y 的联合分布函数Fx,y=∑∑≤≤x x yy ij i j p三.二维连续型随机变量及其联合概率密度1.定义 如果存在非负的函数f x,y,使对任意的x 和y,有Fx,y=⎰⎰∞-∞-y xdudv v u f ),(则称X,Y 为二维连续型随机变量,称fx,y 为X,Y 的X 和Y 的联合概率密度.2.性质 1非负性 f x,y ≥0 . 2归一性 1),(=⎰⎰∞∞-∞∞-dxdy y x f .3若f x,y 在点x,y 连续,则yx y x F y x f ∂∂∂=),(),(2 4若G 为xoy 平面上一个区域,则⎰⎰=∈Gdxdy y x f G y x P ),(}),{(.四.边缘分布1. X,Y 关于X 的边缘分布函数 F X x = P{X ≤x , Y<}= F x , .X,Y 关于Y 的边缘分布函数 F Y y = P{X<, Y ≤y}= F ,y2.二维离散型随机变量X,Y关于X 的边缘分布律 P{X= x i }=∑∞=1j ij p = p i · i =1,2,… 归一性 11=∑∞=•i i p .关于Y 的边缘分布律 P{Y= y j }=∑∞=1i ij p = p·jj =1,2,… 归一性11=∑∞=•j j p .3.二维连续型随机变量X,Y关于X 的边缘概率密度f X x=⎰∞∞-dy y x f ),( 归一性1)(=⎰∞∞-dx x f X关于Y 的边缘概率密度f Y y=x d y x f ⎰∞∞-),( 归一性1)(=⎰∞∞-dyy f Y五.相互独立的随机变量1.定义若对一切实数x,y,均有Fx,y= FX x FYy ,则称X和Y相互独立.2.离散型随机变量X和Y相互独立⇔p i j= p i··p·j i ,j =1,2,…对一切x i,y j成立.3.连续型随机变量X和Y相互独立⇔f x,y=f X xf Y y对X,Y所有可能取值x,y都成立.六.条件分布1.二维离散型随机变量的条件分布定义设X,Y是二维离散型随机变量,对于固定的j,若P{Y=yj}>0,则称P{X=xi |Y=yj}为在Y= yj条件下随机变量X的条件分布律.同样,对于固定的i,若P{X=xi}>0,则称P{Y=yj |X=xi}为在X=xi 条件下随机变量Y 的条件分布律.,}{},{jj ijjippyYPyYxXP•=====,}{},{•=====ij iijippxXPyYxXP第四章 随机变量的数字特征一.数学期望和方差的定义随机变量X 离散型随机变量连续型随机变量分布律P{X=x i }= p i i =1,2,… 概率密度f x数学期望均值EX∑∞=1i i i p x 级数绝对收敛⎰∞∞-dx x xf )(积分绝对收敛方差DX=E{X-EX 2}[]∑-∞=12)(i i i p X E x ⎰-∞∞-dx x f X E x )()]([2=EX 2-EX 2 级数绝对收敛 积分绝对收敛函数数学期望EY=EgXi i i p x g ∑∞=1)(级数绝对收敛 ⎰∞∞-dx x f x g )()(积分绝对收敛标准差X=√DX .二.数学期望与方差的性质1. c 为为任意常数时, Ec = c , EcX = cEX , Dc = 0 , D cX = c 2 DX .,Y为任意随机变量时, E X±Y=EX±EY .3. X与Y相互独立时, EXY=EXEY , DX±Y=DX+DY .4. DX = 0 P{X = C}=1 ,C为常数.三.六种重要分布的数学期望和方差 EX DX~ 0-1分布P{X=1}= p 0<p<1 p p 1- p ~ b n,p 0<p<1 n p n p 1- p ~~ Ua,b a+b/2 b-a 2/12服从参数为的指数分布2~ N ,22四.矩的概念随机变量X的k阶原点矩EX k k=1,2,…随机变量X 的k 阶中心矩E{X-EX k}随机变量X 和Y 的k+l 阶混合矩EX k Y l l=1,2,…随机变量X 和Y 的k+l 阶混合中心矩E{X-EX k Y-EY l }第六章 样本和抽样分布一.基本概念总体X 即随机变量X ; 样本X 1 ,X 2 ,…,X n 是与总体同分布且相互独立的随机变量;样本值x 1 ,x 2 ,…,x n 为实数;n 是样本容量.统计量是指样本的不含任何未知参数的连续函数.如:样本均值∑==n i i X n X 11 样本方差()∑--==n i i X X n S 12211 样本标准差S样本k 阶矩∑==n i k i k X n A 11 k=1,2,… 样本k 阶中心矩∑-==n i ki k X X n B 1)(1k=1,2,…二.抽样分布 即统计量的分布1.X 的分布 不论总体X 服从什么分布, E X = EX , D X = DX / n .特别,若X~ N ,2 ,则 X ~ N , 2 /n .分布 1定义 若X ~N 0,1,则Y =∑=ni i X 12~ 2n 自由度为n 的2分布.2性质 ①若Y~ 2n,则EY = n , DY = 2n .②若Y 1~ 2n 1 Y 2~ 2n 2 ,则Y 1+Y 2~ 2n 1 + n 2.③若X~ N ,2 , 则22)1(σS n -~ 2n-1,且X 与S 2相互独立.3分位点 若Y~ 2n,0< <1 ,则满足的点)()(),(),(22/122/212n n n n ααααχχχχ--和分别称为2分布的上、下、双侧分位点.3. t 分布1定义 若X~N 0,1 ,Y~ 2 n,且X,Y 相互独立,则t=nY X~tn 自由度为n 的t 分布. 2性质①n →∞时,t 分布的极限为标准正态分布.②X ~N ,2 时,nS X μ-~ t n-1 . ③两个正态总体相互独立的样本 样本均值 样本方差X~ N 1,12 且12=22=2 X 1 ,X 2 ,…,X n1 X S 12Y~ N 2,22 Y 1 ,Y 2 ,…,Y n2 Y S 22则 212111)()(n n S Y X w +---μμ~ t n 1+n 2-2 , 其中 2)1()1(212222112-+-+-=n n S n S n S w3分位点 若t ~ t n ,0 < <1 , 则满足的点)(),(),(2/n t n t n t ααα±-分别称t 分布的上、下、双侧分位点.注意: t 1- n = - t n.分布 1定义 若U~2n 1, V~ 2n 2, 且U,V 相互独立,则F =21n V n U ~Fn 1,n 2自由度为n 1,n 2的F 分布.2性质条件同3.2③22212221σσS S ~Fn 1-1,n 2-13分位点 若F~ Fn 1,n 2 ,0< <1,则满足的点),(),(),,(),,(212/1212/21121n n F n n F n n F n n F αααα--和分别称为F 分布的上、下、双侧分位点. 注意: .).(1),(12211n n F n n F αα=- 第七章 参数估计一.点估计 总体X 的分布中有k 个待估参数1, 2,…, k .X 1 ,X 2 ,…,X n 是X 的一个样本, x 1 ,x 2 ,…,x n 是样本值.1.矩估计法先求总体矩⎪⎩⎪⎨⎧===),,,(),,,(),,,(2121222111k k k k k θθθμμθθθμμθθθμμ 解此方程组,得到⎪⎩⎪⎨⎧===),,,(),,,(),,,(2121222111kk k k k μμμθθμμμθθμμμθθ ,以样本矩A l 取代总体矩 ll=1,2,…,k 得到矩估计量⎪⎪⎩⎪⎪⎨⎧===∧∧∧),,,(),,,(),,,(2121222111k k k k k A A A A A A A A A θθθθθθ,若代入样本值则得到矩估计值.2.最大似然估计法若总体分布形式可以是分布律或概率密度为px, 1, 2,…, k ,称样本X 1 ,X 2 ,…,X n 的联合分布∏==ni k i k x p L 12121),,,,(),,,(θθθθθθ 为似然函数.取使似然函数达到最大值的∧∧∧k θθθ,,,21 ,称为参数1, 2,…,k 的最大似然估计值,代入样本得到最大似然估计量.若L 1, 2,…, k 关于1, 2,…, k 可微,则一般可由似然方程组 0=∂∂i L θ 或 对数似然方程组 0ln =∂∂iLθ i =1,2,…,k 求出最大似然估计. 3.估计量的标准(1)无偏性 若E ∧θ=,则估计量∧θ称为参数的无偏估计量.不论总体X 服从什么分布, E X = EX , ES 2=DX, EA k =k =EX k ,即样本均值X , 样本方差S 2,样本k 阶矩A k 分别是总体均值EX,方差DX,总体k 阶矩k 的无偏估计,2有效性 若E ∧θ1 =E ∧θ2= , 而D ∧θ1< D ∧θ2, 则称估计量∧θ1比∧θ2有效.3一致性相合性 若n →∞时,θθP →∧,则称估计量∧θ是参数的相合估计量.二.区间估计1.求参数的置信水平为1-的双侧置信区间的步骤1寻找样本函数W=WX 1 ,X 2 ,…,X n ,,其中只有一个待估参数未知,且其分布完全确定.2利用双侧分位点找出W 的区间a,b,使P{a<W <b}=1-.3由不等式a<W<b 解出θθθ<<则区间θθ,为所求.2.单个正态总体待估参数 其它参数 W 及其分布 置信区间2已知 nX σμ-~N 0,1 2/ασz n X ±2未知 nS X μ-~ t n-1 )1((2/-±n t n S X α 2未知22)1(σS n -~ 2n-1 ))1()1(,)1()1((22/1222/2-----n S n n S n ααχχ 3.两个正态总体1均值差 1- 2其它参数 W 及其分布 置信区间已知2221,σσ22212121)(n n Y X σσμμ+--- ~ N0,1 )(2221212n n z Y Xσσα+±-未知22221σσσ==212111)(n n S Y X w +---μμ~tn 1+n 2-2)11)2((21212n n S n n t Y X w+-+±-α 其中S w 等符号的意义见第六章二. 3 2③.2 1, 2未知, W=22212221σσS S ~ Fn 1-1,n 2-1,方差比12/22的置信区间为注意:对于单侧置信区间,只需将以上所列的双侧置信区间中的上下限中的下标/2改为,另外的下上限取为- 即可.。
《概率论与数理统计》学习笔记十一

σ 2 = S2 =
2 1 n Xi − X ) ( ∑ n i =1
n −1 2 ⎛ n −1 2 ⎞ n −1 S ⎟= E (S2 ) = 由于 E σ 2 = E S 2 = E ⎜ σ , n n ⎝ n ⎠
n 3 ⎡ X 2 − nX 2 ⎤ ∑ i ⎥ n⎢ ⎣ i =1 ⎦
3 ( X − X )2 i n∑ i =1
n
在总体 X 为离散型随机变量情形, 求未知参数 θ 的矩估计量的方法和连续型 情形完全相同。 极大似然估计法 直观想法:概率最大的事件最可能出现。 设总体 X 为连续型随机变量,具有密度函数 f ( x;θ ) ,其中 θ 是待估未知参 数,又设 ( x1 ,L , xn ) 是样本 ( X 1 ,L , X n ) 的一个观测值,则样本 ( X 1 ,L , X n ) 落在观
n
(1)
ˆr , 把上式中的 α r 都换成相应的样本矩 M r = 1 ∑ X ir ,便得到参数 θ r 的矩估计量 θ n i =1
概率论与数理统计—学习笔记十一
即
θˆr = hr ( M 1 ,L , M k ) , r = 1, 2,L , k .
(2)
这种求估计量的方法称为矩估计法(简称矩法) ,由矩估计法得出的估计量称为 矩估计量。 例1 设总体 X 在 [ a, b ] 上服从均匀分布,a,b 未知, X 1 ,L , X n 是总体 X 的 一个样本,试求 a,b 矩估计量。 解 X 的概率密度为 1 , a≤ x≤b ⎧ ⎪ f ( x; a, b ) = ⎨ b − a ⎪ 其它 ⎩ 0,
上节介绍了总体参数的常用点估计方法,对同一参数用不同的估计方法可能 得到不同的估计量,哪个估计量更好些呢?下面给出几种评选估计量好坏的标 准。 无偏估计 估计量是样本的函数,是随机变量,对不同的样本观测值,它有不同的估计 值,我们希望估计量的取值在未知参数真值附近摆动,即希望估计量的数学期望 等于未知参数的真值,这就是无偏性的概念。 定义 设 θˆ ( X 1 ,L , X n ) 是未知参数 θ 的估计量,若
概率论与数理统计答案(华南理工)

开讨论
例 对容量为n的样本,求下列密度函数中参数 a 的
2 2 (a x), (0 x a) f ( x) a 其它 0, a 2 a 解 由于 E [ X ] x 2 ( a x )dx 0 a 3 a 所以由矩法估计,得 X 3 3 n 解得 a 3 X X i n i 1 3 n 所以,参数 a 的矩估计量为 a X i n i 1
方差
1 50 ˆ X Xi 50 i 1 50 1 2 2 2 ˆ 2 S50 Xi ( X ) 50 i 1
此时,ˆ ,
ˆ
2
为两个统计量
根据大数定理,样本的矩和总体的矩应当非常接近 假若样本有观测值x1,x2,……x50,代入统计量中,有
用样本的统计量来估计分布的数字特征,进而得到参
数估计的办法也叫数字特征法,是矩法的特例。
思考一下,是否有其他求解的办法? 考虑泊松分布的二阶中心矩 得到矩法估计量
Var[ X ]
1 n ( X i X )2 n i 1
可见:同一个参数的矩估计量可以不同。 使用哪个更好一些? 矩法估计总能用低阶矩就不用高阶矩 之后会系统地介绍估计量优劣的评价,届时再展
解:设装袋的重量为随机变量X,即总体为X~N(μ, σ2)。
E[ X ] 2 2 2 Var [ X ] E [ X ] ( E [ X ])
此时,要估计参数,就转化为估计随机变量的矩 观测50次,即取X1,X2,……X50个样本,样本容量50 计算样本 的期望和
若总体的密度函数中有多个参数1,2,…,n,则将 ln L 第(3)步改为 0, (i 1, 2, , n) i 解方程组即可。
概率论与数理统计知识点总结

概率论与数理统计知识点总结一、概率论知识点总结:1.随机事件:随机事件是指在一次试验中,可能发生也可能不发生的事件。
例如:掷硬币的结果、抽取扑克牌的花色等。
2.概率:概率是描述随机事件发生可能性大小的数值。
概率的取值范围是[0,1],表示事件发生的可能性大小,0表示不可能发生,1表示一定会发生。
3.古典概型:古典概型是指每种可能的结果发生的概率相等的情形。
例如:掷骰子的结果、抽取彩色球的颜色等。
4.随机变量:随机变量是用来描述试验结果的数值,它的取值是根据随机事件的结果确定的。
例如:掷骰子的点数、抽取扑克牌的点数等。
5.概率分布:随机变量的概率分布描述了每个取值发生的概率。
常见的概率分布有离散概率分布和连续概率分布,如二项分布、正态分布等。
6. 期望值:期望值是衡量随机变量取值的平均值。
对于离散型随机变量,期望值=E[X]=∑[xP(X=x)];对于连续型随机变量,期望值=E[X]=∫[x f(x)dx],其中f(x)为概率密度函数。
7. 方差:方差是衡量随机变量取值与期望值之间的偏离程度。
方差=Var(X)=E[(X-E[X])^2]。
8.独立性:两个随机事件或随机变量之间的独立性表示它们的发生与否或取值无关联。
独立性的判定通常通过联合概率、条件概率等来进行推导。
二、数理统计知识点总结:1.样本与总体:在统计学中,样本是指从总体中选取的具体观测数据。
总体是指要研究的对象的全部个体或事物的集合。
2.参数与统计量:参数是描述总体特征的数值,如总体均值、总体方差等。
统计量是根据样本计算得到的参数估计值,用来估计总体参数。
3.抽样方法:抽样方法是从总体中选取样本的方法,常见的抽样方法有简单随机抽样、系统抽样、整群抽样等。
4.统计分布:统计分布是指样本统计量的分布。
常见的统计分布有t分布、F分布、x^2分布等,其中t分布适用于小样本、F分布适用于方差比较、x^2分布适用于拟合优度检验等。
5.点估计与区间估计:点估计是以样本统计量为基础,估计总体参数的数值。
概率论与数理统计实训06讲解

函 数 说 明
二项分布的最大似然估计 返回 水平的参数估计和置信区间 泊松分布的最大似然估计 返回 水平的 参数和置信区间 正态分布的最大似然估计 返回 水平的期望、方差和置信区间 均匀分布的最大似然估计 返回 水平的参数估计和置信区间 指数分布的最大似然估计 返回 水平的参数估计和置信区间
expfit
例 1 产生 100 行2 列服从区间(10, 12)上的均匀分布的随机数, 计算区间端 点“a”和“b”的极大似然估计值, 求出置信度为0.95 的这两个参数的置信 区间.
解 在命令窗口中输入: r = unifrnd(10, 12, 100, 2); [ahat, bhat, aci, bci] = unifit(r)
调 用 形 式
binofit (X, N) [PHAT, PCI] = binofit (X, N, ALPHA) poissfit (X) [LAMBDAHAT, LAMBDACI]= poissfit (X,) normfit (X, ALPHA) [MUHAT, SIGMAHAT, MUCI, SIGMACI] = normfit (X, ALPHA) unifit (X, ALPHA) [AHAT, BHAT, ACI, BCI] = unifit (X, ALPHA) expfit (X) [MUHAT, MUCI] = expfit (X, ALPHA)
基本数学原理:
样本数字特征法 1 用样本均值 x n x 作为总体均值EX的估计值; 用样本方差 S n 1 1 ( x x ) 作为总体方差DX的估计值。 在Matlab中,样本x = [x1, x2,…, xn],则 样本均值:mx = 1/n*sum (x) 样本方差:S2 = 1/(n-1)*sum ((x-mx).^2)
概率论与数理统计(理工类_第四版)吴赣昌主编课后习题答案第六章要点

第六章参数估计6.1 点估计问题概述习题1总体X在区间[0,θ]上均匀分布,X1,X2,⋯,Xn是它的样本,则下列估计量θ是θ的一致估计是().(A)θ=Xn; (B)θ=2Xn;(C)θ=X¯=1n∑i=1nXi;(D)θ=Max{X1,X2,⋯,Xn}.解答:应选(D).由一致估计的定义,对任意ɛ>0,P(∣Max{X1,X2,⋯,Xn}-θ∣<ɛ)=P(-ɛ+θ<Max{X1,X2,⋯,Xn}<ɛ+θ)=F(ɛ+θ)-F(-ɛ+θ).因为FX(x)={0,x<0xθ,0≤x≤θ1,x>θ, 及F(x)=FMax{X1,X2,⋯,Xn}(x)=FX1(x)FX2(x)⋯FXn(x),所以F(ɛ+θ)=1, F(-ɛ+θ)=P(Max{X1,X2,⋯,Xn}<-ɛ+θ)=(1-xθ)n,故P(∣Max{X1,X2,⋯,Xn}-θ∣<ɛ)=1-(1-xθ)n→1(n→+∞).习题2设σ是总体X的标准差,X1,X2,⋯,Xn是它的样本,则样本标准差S是总体标准差σ的().(A)矩估计量;(B)最大似然估计量;(C)无偏估计量;(D)相合估计量.解答:应选(D).因为,总体标准差σ的矩估计量和最大似然估计量都是未修正的样本标准差;样本方差是总体方差的无偏估计,但是样本标准差不是总体标准差的无偏估计.可见,样本标准差S是总体标准差σ的相合估计量.习题3设总体X的数学期望为μ,X1,X2,⋯,Xn是来自X的样本,a1,a2,⋯,an是任意常数,验证(∑i=1naiXi)/∑i=1nai(∑i=1nai≠0)是μ的无偏估计量.解答:E(X)=μ,E(∑i=1naiXi∑i=1nai)=1∑i=1nai⋅∑i=1naiE(Xi)(E(Xi)=E(X)=μ)=μ∑i=1nai∑i=1n=μ,综上所证,可知∑i=1naiXi∑i=1nai是μ的无偏估计量.习题4设θ是参数θ的无偏估计,且有D(θ)>0, 试证θ2=(θ)2不是θ2的无偏估计.解答:因为D(θ)=E(θ2)-[E(θ)]2, 所以E(θ2)=D(θ)+[E(θ)]2=θ2+D(θ)>θ2,故(θ)2不是θ2的无偏估计.习题5设X1,X2,⋯,Xn是来自参数为λ的泊松分布的简单随机样本,试求λ2的无偏估计量.解答:因X服从参数为λ的泊松分布,故D(X)=λ, E(X2)=D(X)+[E(X)]2=λ+λ2=E(X)+λ2,于是E(X2)-E(X)=λ2, 即E(X2-X)=λ2.用样本矩A2=1n∑i=1nXi2,A1=X¯代替相应的总体矩E(X2),E(X), 便得λ2的无偏估计量λ2=A2-A1=1n∑i=1nXi2-X¯.习题6设X1,X2,⋯,Xn为来自参数为n,p的二项分布总体,试求p2的无偏估计量.解答:因总体X∼b(n,p), 故E(X)=np,E(X2)=D(X)+[E(X)]2=np(1-p)+n2p2=np+n(n-1)p2=E(X)+n(n-1)p2,E(X2)-E(X)n(-1)=E[1n(n-1)(X2-X)]=p2,于是,用样本矩A2,A1分别代替相应的总体矩E(X2),E(X),便得p2的无偏估计量p2=A2-A1n(n-1)=1n2(n-1)∑i=1n(Xi2-Xi).习题7设总体X服从均值为θ的指数分布,其概率密度为f(x;θ)={1θe-xθ,x>00,x≤0,其中参数θ>0未知. 又设X1,X2,⋯,Xn是来自该总体的样本,试证:X¯和n(min(X1,X2,⋯,Xn))都是θ的无偏估计量,并比较哪个更有效.解答:因为E(X)=θ, 而E(X¯)=E(X),所以E(X¯)=θ, X¯是θ的无偏估计量.设Z=min(X1,X2,⋯,Xn),因为FX(x)={0,x≤01-e-xθ,x>0,FZ(x)=1-[1-FX(x)]n={1-e-nxθ,x>00,x≤0,所以fZ(x)={nθe-nxθ,x>00,x≤0,这是参数为nθ的指数分布,故知E(Z)=θn, 而E(nZ)=E[n(min(X1,X2,⋯,Xn)]=θ,所以nZ也是θ的无偏估计.现比较它们的方差大小.由于D(X)=θ2, 故D(X¯)=θ2n.又由于D(Z)=(θn)2, 故有D(nZ)=n2D(Z)=n2⋅θ2n2=θ2.当n>1时,D(nZ)>D(X¯),故X¯较nZ有效.习题8设总体X服从正态分布N(m,1),X1,X2是总体X的子样,试验证1=2 X1+1 X2, 2=1 X1+ X2,=12X1+12X2,都是m的无偏估计量;并问哪一个估计量的方差最小?解答:因为X服从N(m,1), 有E(Xi)=m,D(Xi)=1(i=1,2),得E( 1)=E(23X1+13X2)=23E(X1)+13E(X2)=23m+13m=m,D( 1)=D(23X1+13X2)=49D(X1)+19D(X2)=49+19=59,同理可得:E( 2)= ,D( 2)= ,E( )= ,D( )=12.所以, 1, 2,都是m的无偏估计量,并且在 1, 2,中,以的方差为最小.习题9设有k台仪器. 已知用第i台仪器测量时,测定值总体的标准差为σi(i=1,2,⋯,k), 用这些仪器独立地对某一物理量θ各观察一次,分别得到X1,X2,⋯,Xk. 设仪器都没有系统误差,即E(Xi)=θ(i=1,2,⋯,k), 问a1,a2,⋯,ak应取何值,方能使用=∑i=1kaiXi估计θ时, 是无偏的,并且D( )最小?解答:因为E(Xi)=θ(i=1,2,⋯,k), 故E( )=E(∑i=1kaiXi)=∑i=1kaiE(Xi)=θ∑i=1kai,欲使E( )=θ, 则要∑i=1kai=1.因此,当∑i=1kai=1时,=∑i=1kaiXi为θ的无偏估计,D( )=∑i=1kai2σi2, 要在∑i=1kai=1的条件下D( )最小,采用拉格朗日乘数法.令L(a1,a2,⋯,ak)=D()+λ(1-∑i=1kai)=∑i=1kai2σi2+λ(1-∑i=1kai),{∂L∂ai=0,i=1,2,⋯,k∑i=1kai=1,即2aiσi2-λ=0,ai=λ2i2;又因∑i=1kai=1,所以λ∑i=1k12σi2=1, 记∑i=1k1σi2=1σ02, 所以λ=2σ02, 于是ai=σ02σi2 (i=1,2,⋯,k),故当ai=σ02σi2(i=1,2,⋯,k)时, =∑i=1kaiXi是θ的无偏估计,且方差最小.习题6.2 点估计的常用方法习题1设X1,X2,⋯,Xn为总体的一个样本,x1,x2,⋯,xn为一相应的样本值,求下述各总体的密度函数或分布律中的未知参数的矩估计量和估计值及最大似然估计量.(1)f(x)={θcθx-(θ+1),x>c0,其它, 其中c>0为已知,θ>1,θ为未知参数.(2)f(x)={θxθ-1,0≤x≤10,其它, 其中θ>0,θ为未知参数.(3)P{X=x}=(mx)px(1-p)m-x, 其中x=0,1,2,⋯,m,0<p<1,p为未知参数.解答:(1)E(X)=∫c+∞x⋅θcθx-(θ+1)dx=θcθ∫c+∞x-θdx=θcθ-1,解出θ=E(X)E(X)-c,令X¯=E(X),于是=X¯X¯-c为矩估计量,θ的矩估计值为=x¯x¯-c,其中x¯=1n∑i=1nxi.另外,似然函数为L(θ)=∏i=1nf(xi;θ)=θncnθ(∏i=1nxi)-(θ+1),xi>c,对数似然函数为lnL(θ)=nlnθ+nθlnc-(θ+1)∑i=1nlnxi,对lnL(θ)求导,并令其为零,得dlnL(θ)dθ=nθ+nlnc-∑i=1nlnxi=0,解方程得θ=n∑i=1nlnxi-nlnc,故参数的最大似然估计量为=n∑i=1nlnXi-nlnc.(2)E(X)=∫01x⋅θxθ-1dx=θθ+1,以X¯作为E(X)的矩估计,则θ的矩估计由X¯=θθ+1解出,得=(X¯1-X¯)2,θ的矩估计值为=(x¯1-x¯)2,其中x¯=1n∑i=1nxi为样本均值的观测值.另外,似然函数为L(θ)=∏i=1nf(xi;θ)=θn/2(∏i=1nxi)θ-1,0≤xi≤1,对数似然函数为lnL(θ)=n2lnθ+(θ-1)∑i=1nlnxi,对lnL(θ)求导,并令其为零,得dlnL(θ)dθ=n2θ+12θ∑i=1nlnxi=0,解方程得θ=(-n∑i=1nlnxi)2,故参数的最大似然估计量为=(n∑i=1nlnXi)2.(3)X∼b(m,p),E(X)=mp,以X¯作为E(X)的矩估计,即X¯=E(X),则参数p的矩估计为=1 X¯=1 ⋅1n∑i=1nXi,p的矩估计值为=1 x¯=1 ⋅1n∑i=1nxi.另外,似然函数为L(θ)=∏i=1nf(xi;θ)=(∏i=1nC xi) ∑i=1nxi(1- )∑i=1n( -xi),xi=0,1,⋯,m,对数似然函数为lnL(θ)=∑i=1nlnC xi+(∑i=1nxi)ln +(∑i=1n( -xi))ln(1-p),对lnL(θ)求导,并令其为零,得dlnL(θ)dθ=1 ∑i=1nxi-11- ∑i=1n( -xi)=0,解方程得 =1 n∑i=1nxi,故参数的最大似然估计量为=1 n∑i=1nXi=1 X¯.习题2设总体X服从均匀分布U[0,θ],它的密度函数为f(x;θ)={1θ,0≤x≤θ0,其它,(1)求未知参数θ的矩估计量;(2)当样本观察值为0.3,0.8,0.27,0.35,0.62,0.55时,求θ的矩估计值.解答:(1)因为E(X)=∫-∞+∞xf(x;θ)dx=1θ∫0θxdx=θ2,令E(X)=1n∑i=1nXi,即θ2=X¯,所以=2X¯.(2)由所给样本的观察值算得x¯=16∑i=16xi=16(0. +0. +0.27+0. +0.62+0. )=0. 17,所以=2x¯=0.96 .习题3设总体X以等概率1θ取值1,2,⋯,θ, 求未知参数θ的矩估计量.解答:由E(X)=1×1θ+2×1θ+⋯+θ×1θ=1+θ2=1n∑i=1nXi=X¯,得θ的矩估计为=2X¯-1.习题4一批产品中含有废品,从中随机地抽取60件,发现废品4件,试用矩估计法估计这批产品的废品率.解答:设p为抽得废品的概率,1-p为抽得正品的概率(放回抽取). 为了估计p,引入随机变量Xi={1,第i次抽取到的是废品0,第i次抽取到的是正品,于是P{Xi=1}=p,P{Xi=0}=1-p=q, 其中i=1,2,⋯,60,且E(Xi)=p, 故对于样本X1,X2,⋯,X60的一个观测值x1,x2,⋯,x60, 由矩估计法得p的估计值为=160∑i=160xi= 60=11 ,即这批产品的废品率为115.习题5设总体X具有分布律X 1 2 3pi θ2 2θ(1-θ) (1-θ)2其中θ(0<θ<1)为未知参数. 已知取得了样本值x1=1,x2=2,x3=1, 试求θ的矩估计值和最大似然估计值.解答:E(X)=1×θ2+2×2θ(1-θ)+ ×(1-θ)2=3-2θ,x¯=1/ ×(1+2+1)= / .因为E(X)=X¯,所以=(3-x¯)/2= /6为矩估计值,L(θ)=∏i=1 P{Xi=xi}=P{X1=1}P{X2=2}P{X =1}=θ4⋅2θ⋅(1-θ)=2θ5(1-θ),lnL(θ)=ln2+5lnθ+ln(1-θ),对θ求导,并令导数为零dlnLdθ=5θ-11-θ=0,得=56.习题6(1)设X1,X2,⋯,Xn来自总体X的一个样本, 且X∼π(λ), 求P{X=0}的最大似然估计.(2)某铁路局证实一个扳道员五年内所引起的严重事故的次数服从泊松分布,求一个扳道员在五年内未引起严重事故的概率p的最大似然估计,使用下面122个观察值统计情况. 下表中,r表示一扳道员某五年中引起严重事故的次数,s表示观察到的扳道员人数.习题6.3 置信区间习题1对参数的一种区间估计及一组观察值(x1,x2,⋯,xn)来说,下列结论中正确的是().(A)置信度越大,对参数取值范围估计越准确;(B)置信度越大,置信区间越长;(C)置信度越大,置信区间越短;(D)置信度大小与置信区间有长度无关.解答:应选(B).置信度越大,置信区间包含真值的概率就越大,置信区间的长度就越大,对未知参数的估计精度越低.反之,对参数的估计精度越高,置信区间的长度越小,它包含真值的概率就越低,置信度就越小.习题2设(θ1,θ2)是参数θ的置信度为1-α的区间估计,则以下结论正确的是().(A)参数θ落在区间(θ1,θ2)之内的概率为1-α;(B)参数θ落在区间(θ1,θ2)之外的概率为α;(C)区间(θ1,θ2)包含参数θ的概率为1-α;(D)对不同的样本观察值,区间(θ1,θ2)的长度相同.解答:应先(C).由于θ1,θ2都是统计量,即(θ1,θ2)是随机区间,而θ是一个客观存在的未知常数,故(A),(B)不正确.习题3设总体的期望μ和方差σ2均存在,如何求μ的置信度为1-α的置信区间?解答:先从总体中抽取一容量为n的样本X1,X2,⋯,Xn.根据中心极限定理,知U=X¯-μσ/n→N(0,1)(n→∞).(1)当σ2已知时,则近似得到μ的置信度为1-α的置信区间为(X¯-uα/2σn,X¯+uα/2σn).(2)当σ2未知时,用σ2的无偏估计S2代替σ2, 这里仍有X¯-μS/n→N(0,1)(n→∞),于是得到μ的1-α的置信区间为(X¯-uα/2Sn,X¯+uα/2Sn),一般要求n≥ 0才能使用上述公式,称为大样本区间估计.习题4某总体的标准差σ=3cm, 从中抽取40个个体,其样本平均数x¯=6 2c ,试给出总体期望值μ的95%的置信上、下限(即置信区间的上、下限).解答:因为n=40属于大样本情形,所以X¯近似服从N(μ,σ2n)的正态分布,于是μ的95%的置信区间近似为(X¯±σnuα/2),这里x¯=6 2,σ= ,n= 0≈6. 2,uα/2=1.96, 从而(x¯±σnuα/2)=(6 2± 0×1.96)≈(6 2±0.93),故μ的95%的置信上限为642.93, 下限为641.07.习题5某商店为了了解居民对某种商品的需要,调查了100家住户,得出每户每月平均需求量为10kg, 方差为9,如果这个商店供应10000户,试就居民对该种商品的平均需求量进行区间估计(α=0.01), 并依此考虑最少要准备多少这种商品才能以0.99的概率满足需求?解答:因为n=100属于大样本问题,所以X¯近似服从N(μ,σ2/n),于是μ的99%的置信区间近似为(X¯±Snuα/2), 而x¯=10,s= ,n=100,uα/2=2.58,习题7某城镇抽样调查的500名应就业的人中,有13名待业者,试求该城镇的待业率p的置信度为0.95置信区间.解答:这是(0-1)分布参数的区间估计问题. 待业率p的0.95置信区间为( 1, 2)=(-b-b2-4ac2a,-b+b2-4ac2a).其中a=n+uα/22,b=-2nX¯-(uα/2)2, c=nX¯2,n= 00,x¯=1 00,uα/2=1.96.则( 1, 2)=(0.015,0.044).习题8设X1,X2,⋯,Xn为来自正态总体N(μ,σ2)的一个样本,求μ的置信度为1-α的单侧置信限.解答:这是一个正态总体在方差未知的条件下,对μ的区间估计问题,应选取统计量:T=X¯-μS/n∼t(n-1).因为只需作单边估计,注意到t分布的对称性,故令P{T<tα(n-1)}=1-α和P{T>tα(n-1)}=1-α.由给定的置信度1-α, 查自由度为n-1的t分布表可得单侧临界值tα(n-1). 将不等式T<tα(n-1)和T>tα(n-1), 即X¯-μS/n<tα(n-1)和X¯-μS/n>tα(n-1)分别变形,求出μ即得μ的1-α的置信下限为X¯-tα(n-1)Sn.μ的1-α的置信上限为X¯+tα(n-1)Sn,μ的1-α的双侧置信限(X¯-tα/2(n-1)Sn,X¯+tα/2(n-1)Sn).习题6.4 正态总体的置信区间习题1已知灯泡寿命的标准差σ=50小时,抽出25个灯泡检验,得平均寿命x¯= 00小时,试以95%的可靠性对灯泡的平均寿命进行区间估计(假设灯泡寿命服从正态分布).解答:由于X∼N(μ,502), 所以μ的置信度为95%的置信区间为(X¯±uα/2σn),这里x¯= 00,n=2 ,σ=50,uα/2=1.96, 所以灯泡的平均寿命的置信区间为(x¯±uα/2σn)=( 00± 02 ×1.96)=( 00±19.6)=( 0. , 19.6).习题2一个随机样本来自正态总体X,总体标准差σ=1.5, 抽样前希望有95%的置信水平使得μ的估计的置信区间长度为L=1.7, 试问应抽取多大的一个样本?解答:因方差已知,μ的置信区间长度为L=2uα/2⋅σn,于是n=(2σLuα/2)2.由题设知,1-α=0.95,α=0.05,α2=0.025. 查标准正态分布表得u0.025=1.96,σ=1.5,L=1.7,所以,样本容量n=(2×1. ×1.961.7)2≈11.96.向上取整数得n=12, 于是欲使估计的区间长度为1.7的置信水平为95%, 所以需样本容量为n=12.习题3设某种电子管的使用寿命服从正态分布. 从中随机抽取15个进行检验,得平均使用寿命为1950小时,标准差s为300小时,以95%的可靠性估计整批电子管平均使用寿命的置信上、下限.解答:由X∼N(μ,σ2), 知μ的95%的置信区间为(X¯±Sntα/2(n-1)),这里x¯=19 0,s= 00,n=1 ,tα/2(14)=2.145, 于是(x¯±sntα/2(n-1))=(19 0± 001 ×2.1 )≈(19 0±166.1 1)=(17 . ,2116 .15).即整批电子管平均使用寿命的置信上限为2116.15, 下限为1783.85.习题4人的身高服从正态分布,从初一女生中随机抽取6名,测其身高如下(单位:cm): 149 158.5 152.5 165 157 142求初一女生平均身高的置信区间(α=0.05).解答:X∼N(μ,σ2),μ的置信度为95%的置信区间为(X¯±Sntα/2(n-1)),这里x¯=1 ,s=8.0187, t0.025(5)=2.571, 于是(x¯±sntα/2(n-1))=(1 ± .01 76×2. 71)≈(1 ± . 16)≈(1 . ,162. 2) .习题5某大学数学测验,抽得20个学生的分数平均数x¯=72,样本方差s2=16, 假设分数服从正态分布,求σ2的置信度为98%的置信区间.解答:先取χ2分布变量,构造出1-α的σ2的置信区间为((n-1)S2χα/22(n-1),(n-1)S2χ1-α/22(n-1)).已知1-α=0.98,α=0.02,α2=0.01,n=20, S2=16.查χ2分布表得χ0.012(19)=36.191,χ0.992(19)=7.633,于是得σ2的98%的置信区间为(19×16 6.191,19×167.6 ),即(8.400,39.827).习题6随机地取某种炮弹9发做试验,得炮口速度的样本标准差s=11(m/s).设炮口速度服从正态分布,求这种炮弹的炮口速度的标准差σ的置信度为0.95的置信区间.解答:已知n=9,s=11(m/s),1-α=0.95.查表得χ0.0252(8)=17.535, χ0.9752(8)=2.180,σ的0.95的置信区间为(8sχ0.0252(8),8sχ0.9752(8)), 即(7.4,21.1).习题7设来自总体N(μ1,16)的一容量为15的样本,其样本均值x1¯=1 .6;来自总体N(μ2,9)的一容量为20的样本,其样本均值x2¯=1 .2;并且两样本是相互独立的,试求μ1-μ2的90%的置信区间.解答:1-α=0.9,α=0.1, 由Φ(uα/2)=1-α2=0.95, 查表,得uα/2=1.645,再由n1=15,n2=20, 得σ12n1+σ22n2=161 +920=9160≈1.2 2,uα/2σ12n1+σ22n2=1.6 ×1.2 2≈2.0 ,x¯1-x¯2=1 .6-13.2=1.4,所以,μ1-μ2的90%的置信区间为(1.4-2.03,1.4+2.03)=(-0.63,3.43).习题8物理系学生可选择一学期3学分没有实验课,也可选一学期4学分有实验的课. 期未考试每一章节都考得一样,若有上实验课的12个学生平均考分为84,标准差为4,没上实验课的18个学生平均考分为77,标准差为6,假设总体均为正态分布且其方差相等,求两种课程平均分数差的置信度为99%的置信区间.解答:设有实验课的考分总体X1∼N(μ1,σ2), 无实验课的考分总体X2∼N(μ2,σ2). 两方差相等但均未知,求μ1-μ2的99%的置信区间,应选t分布变量,T=X1¯-X2¯-(μ1-μ2)SW1n1+1n2∼t(n1+n2-2),其中SW=(n1-1)S12+(n2-1)S22n1+n2-2.μ1-μ2的1-α的置信区间为习题10设两位化验员A,B独立地对某种聚合物含氯量用相同的方法各作10次测定,其测定值的样本方差依次为 sA2=0.5419,sB2=0.6065. 设σA2,σB2分别为A,B所测定的测定值的总体方差,又设总体均为正态的,两样本独立,求方差比σA2/σB2的置信水平为0.95的置信区间.解答:选用随机变量F=SA2σA2/SB2σB2∼F(n1-1,n2-1),依题意,已知sA2=0.5419, sB2=0.6065, n1=n2=10.对于1-α=0.95, 查F分布表得F0.025(9,9)=1F0.025(9,9)=14.03, 于是得σA2σB2的0.95的置信区间为(sA2sB21Fα/2(9,9),sA2sB2Fα/2(9,9))≈(0.222,3.601).总习题解答习题1设总体X服从参数为λ(λ>0)的指数分布,X1,X2,⋯,Xn为一随机样本,令Y=min{X1,X2,⋯,Xn}, 问常数c为何值时,才能使cY是λ的无偏估计量.解答:关键是求出E(Y). 为此要求Y的密度fY(y).因Xi的密度函数为fX(x)={λe-λx,x>00,x<0;Xi的分布函数为FX(x)={1-e-λx,x>00,x≤0,于是FY(y)=1-[1-FX(y)]n={1-e-nλy,y>00,y≤0.两边对y求导得fY(y)=ddyFY(y)={nλe-nλy,y>00,y≤0,即Y服从参数为nλ的指数分布,故E(Y)=nλ.为使cY成为λ的无偏估计量,需且只需E(cY)=λ, 即cnλ=λ, 故c=1n.习题2设X1,X2,⋯,Xn是来自总体X的一个样本,已知E(X)=μ, D(X)=σ2.(1)确定常数c, 使c∑i=1n-1(Xi+1-Xi)2为σ2的无偏估计;(2)确定常数c, 使(X¯)2-cS2是μ2的无偏估计(X¯,S2分别是样本均值和样本方差).解答:(1)E(c∑i=1n-1(Xi+1-Xi)2)=c∑i=1n-1E(Xi+12-2XiXi+1+Xi2)=c∑i=1n-1{D(Xi+1)+[E(Xi+1)]2-2E(Xi)E(Xi+1)+D(Xi)+[E(Xi)+[E(Xi)]2}=c(n-1)(σ2+μ2-2μ2+σ2+μ2)=2(n-1)σ2c.令2(n-1)σ2c=σ2, 所以c=12(n-1).(2)E[(X¯)2-cS2]=E(X¯2)-cE(S2)=D(X¯)+[E(X¯)]2-cσ2=σ2n+μ2-cσ2.令σ2n+μ2-cσ2=μ2, 则得c=1n.习题3设X1,X2,X3,X4是来自均值为θ的指数分布总体的样本,其中θ未知. 设有估计量T1=16(X1+X2)+13(X3+X4),T2=X1+2X2+3X3+4X45,T3=X1+X2+X3+X44.(1)指出T1,T2,T3中哪几个是θ的无偏估计量;(2)在上述θ的无偏估计中指出一个较为有效的.解答:(1)θ=E(X),E(Xi)=E(X)=θ,D(X)=θ2=D(Xi),i=1,2,3,4.E(T1)=E(16(X1+X2)+13(X3+X4))=(26+23)θ=θ,E(T2)=15E(X1+2X2+3X3+4X4)=15(1+2+3+4)θ=2θ,E(T3)=14E(X1+X2+X3+X4)=θ,因此,T1,T3是θ的无偏估计量.(2)D(T1)=236θ2+29θ2=1036θ2, D(T3)=116⋅4θ2=14θ2=936θ2,所以D(T3)<D(T1), 作为θ的无偏估计量,T3更为有效.习题4设从均值为μ, 方差为σ2(σ>0)的总体中,分别抽取容量为n1,n2的两独立样本,X1¯和X2¯分别是两样本的均值,试证:对于任意常数a,b(a+b=1),Y=aX1¯+bX2¯都是μ的无偏估计;并确定常数a,b, 使D(Y)达到最小.解答:E(Y)=E(aX1¯+bX2¯)=aE(X1¯)+bE(X2¯)=(a+b)μ.因为a+b=1, 所以E(Y)=μ.因此,对于常数a,b(a+b=1),Y都是μ的无偏估计,D(Y)=a2D(X1¯)+b2D(X2¯)=a2σ2n1+b2σ2n2.因a+b=1, 所以D(Y)=σ2[a2n1+1n2(1-a)2], 令dD(Y)da=0, 即2σ2(an1-1-an2)=0, 解得a=n1n1+n2,b=n2n1+n2是惟一驻点.又因为d2D(Y)da2=2σ2(1n1+1n2)>0, 故取此a,b二值时,D(Y)达到最小.习题5设有一批产品,为估计其废品率p, 随机取一样本X1,X2,⋯,Xn, 其中Xi={1,取得废品0,取得合格品, i=1,2,⋯,n,证明: =X¯=1n∑i=1nXi是p的一致无偏估计量.解答:由题设条件E(Xi)=p⋅1+(1-p)⋅0=p,D(Xi)=E(Xi2)-[E(Xi)]2=p⋅12+(1-p)02-p2=p(1-p),E( )=E(X¯)=E(1n∑i=1nE(Xi))=1n∑i=1nE(Xi)=1n∑i=1np=p.由定义, 是p的无偏估计量,又D( )=D(X¯)=D(1n∑i=1nXi)=1n2∑i=1nD(Xi)=1n2∑i=1np(1-p)=1n2np(1-p)=pqn.由切比雪夫不等式,任给ɛ>0P{∣ -p∣≥ɛ}=P{∣X¯-p∣≥ɛ}≤1ɛ2D(X¯)=1ɛ2p(1-p)n→0,n→∞所以limn→∞P{∣ -p∣≥ɛ}=0, 故=X¯是废品率p的一致无偏估计量.习题6设总体X∼b(k,p), k是正整数,0<p<1,k,p都未知,X1,X2,⋯,Xn是一样本,试求k和p的矩估计.解答:因总体X服从二项分布b(k,p), 故{a1=E(X)=kpa2=E(X2)=D(X)+[E(X)]2=kp(1-p)+(kp)2,解此方程组得p=a1+a12-a2a1,k=a12a1+a12-a2.用A1=1n∑i=1nXi=X¯,A2=1n∑i=1nXi2分别代替a1,a2, 即得p,k的矩估计为=X¯-S2X¯,k=[X¯2X¯-S2],其中S2=1n∑i=1n(Xi-X¯)2,[x]表示x的最大整数部分.习题7求泊松分布中参数λ的最大似然估计.解答:总体的概率函数为P{X=k}=λkk!e-λ,k=0,1,2,⋯.设x1,x2,⋯,xn为从总体中抽取的容量为n的样本,则似然函数为L(x1,x2,⋯,xn;λ)=∏i=1nf(xi;λ)=∏i=1nλxixi!e-λ=λ∑i=1nxi∏i=1nxi!e-nλ, lnL=(∑i=1nxi)lnλ-nλ-∑i=1nlnxi!,令dlnLdλ=1λ∑i=1nxi-n=0, 得λ的最大是然估计为λ=1n∑i=1nxi=x¯,即x¯=1n∑i=1nxi就是参数λ的最大似然估计.习题8已知总体X的概率分布P{X=k}=C2k(1-θ)kθ2-k,k=0,1,2,求参数的矩估计.解答:总体X为离散型分布,且只含一个未知参数θ, 因此,只要先求离散型随机变量的数学期望E(X), 然后解出θ并用样本均值X¯代替E(X)即可得θ的矩估计.由E(X)=∑k=02kC2k(1-θ)kθ2-k=1×2(1-θ)θ+2(1-θ)2=2-2θ, 即有θ=1-E(X)2.用样本均值X¯代替上式的E(X), 得矩估计为=1-X¯2.习题9设总体X的概率密度为f(x)={(θ+1)xθ,0<x<10,其它,其中θ>-1是未知参数,X1,X2,⋯,Xn为一个样本,试求参数θ的矩估计和最大似然估计量. 解答:因E(X)=∫01(θ+1)xθ+1dx=θ+1θ+2. 令E(X)=1n∑i=1nXi=X¯, 得θ+1θ+2=X¯, 解得θ的矩估计量为θ=2X¯-11-X¯.设x1,x2,⋯,xn是样本X1,X2,⋯,Xn的观察值,则似然函数L(x1,x2,⋯,xn,θ)=∏i=1n(θ+1)xiθ=(θ+1)n(x1x2⋯xn)θ(0<xi<1,i=1,2,⋯,n),取对数得lnL=nln(θ+1)+θ∑i=1nlnxi, 从而得对数似然方程dlnLdθ=nθ+1+∑i=1nlnxi=0,解出θ, 得θ的最大似然估计量为θ=-n∑i=1nlnXi.由此可知,θ的矩估计和最大似然估计是不相同的.习题10设X具有分布密度f(x,θ)={θxe-θx!,x=0,1,2,⋯0,其它,0<θ<+∞,X1,X2,⋯,Xn是X的一个样本,求θ的最大似然估计量.解答:似然函数L(θ)=∏i=1nθxie-θxi!=e-nθ∏i=1nθxixi!,lnL(θ)=-nθ+∑i=1nxilnθ-∑i=1nln(xi!),ddθ(lnL(θ))=-n+1θ∑i=1nxi,令ddθ(lnL(θ))=0, 即-n+1θ∑i=1nxi=0⇒θ=1n∑i=1nxi,故θ最大似然估计量为θ=X¯=1n∑i=1nXi.习题11设使用了某种仪器对同一量进行了12次独立的测量,其数据(单位:毫米)如下:232.50 232.48 232.15 232.53 232.45 232.30232.48 232.05 232.45 232.60 232.47 232.30试用矩估计法估计测量值的均值与方差(设仪器无系统误差).解答:设测量值的均值与方差分别为μ与σ2,因为仪器无系统误差,所以θ= =X¯=1n∑i=1nXi=232+112∑i=1n(Xi-232)=232+1/12×4.76≈232.3967.用样本二阶中心矩B2估计方差σ2, 有2=1n∑i=1n(Xi-X¯)2=1n∑i=1n(Xi-a)2-(X¯-a)2=112∑i=112(Xi-232)2-(232.3967-232)2=0.1819-0.1574=0.0245.习题12设随机变量X服从二项分布P{X=k}=Cnkpk(1-p)n-k,k=0,1,2,⋯,n,X1为其一个样本,试求p2的无偏估计量.解答:\becauseX∼b(n,p),∴E(X)=np, D(X)=np(1-p)=E(X)-np2⇒p2=1n[E(X)-D(X)]=1n[E(X)-E(X2)+(EX)2]⇒p2=1n[E(X(1-X))]+1nn2p2=1nE(X(1-X))]+np2⇒p2=E[X(X-1)]n(n-1), 由于E[X(X-1)]=E[X1(X1-1)],故2=X1(X1-1)n(n-1).习题13设X1,X2,⋯,Xn是来自总体X的随机样本,试证估计量X¯=1n∑i=1nXi和Y=∑i=1nCiXi(Ci≥0为常数,∑i=1nCi=1)都是总体期望E(X)的无偏估计,但X¯比Y有效.解答:依题设可得E(X¯)=1n∑i=1nE(Xi)=1n×nE(X)=E(X),E(Y)=∑i=1nCiE(Xi)=E(X)∑i=1nCi=E(X).从而X¯,Y均为E(X)的无偏估计量,由于D(X¯)=1n2∑i=1nD(Xi)=1nD(X),D(Y)=D(∑i=1nCiXi)=∑i=1nCi2D(Xi)=D(X)∑i=1nCi2.应用柯西—施瓦茨不等式可知1=(∑i=1nCi)2≤(∑i=1nCi2)(∑i=1n12)=n∑i=1nCi2, ⇒1n≤∑i=1nCi2,所以D(Y)≥D(X¯), 故X¯比Y有效.习题14设X1,X2,⋯,Xn是总体X∼U(0,θ)的一个样本,证明:θ1=2X¯和θ2=n+1nX(n)是θ的一致估计.解答:因E( 1)= , D( 1)= 2 n; E( 2)= ,D( 2)=θn(n+2),X(n)=max{Xi}.依切比雪夫不等式,对任给的ɛ>0, 当n→∞时,有P{∣θ1-θ∣≥ɛ}≤D( 1)ɛ2=θ23nɛ2→0,(n→∞)P{∣θ2-θ∣≥ɛ}≤D( 2)ɛ2=θ2n(n+1)ɛ2→0,(n→∞)所以,θ1和θ2都是θ的一致估计量.习题15某面粉厂接到许多顾客的订货,厂内采用自动流水线灌装面粉,按每袋25千克出售. 现从中随机地抽取50袋,其结果如下:25.8, 24.7, 25.0, 24.9, 25.1, 25.0, 25.2,24.8, 25.4, 25.3, 23.1, 25.4, 24.9, 25.0,24.6, 25.0, 25.1, 25.3, 24.9, 24.8, 24.6,21.1, 25.4, 24.9, 24.8, 25.3, 25.0, 25.1,24.7, 25.0, 24.7, 25.3, 25.2, 24.8, 25.1,25.1, 24.7, 25.0, 25.3, 24.9, 25.0, 25.3,25.0, 25.1, 24.7, 25.3, 25.1, 24.9, 25.2,25.1,试求该厂自动流水线灌装袋重总体X的期望的点估计值和期望的置信区间(置信度为0.95). 解答:设X为袋重总体,则E(X)的点估计为E(X)=X¯=1 0(2 . +2 .7+⋯+25.1)=24.92kg.因为样本容量n=50, 可作为大样本处理,由样本值算得x¯=24.92, s2≈0.4376, s=0.6615, 则E(X)的置信度为0.95的置信区间近似为(X¯-uα/2Sn,X¯+uα/2Sn),查标准正态分布表得uα/2=u0.025=1.96, 故所求之置信区间为(24.92-1.96×0.661 0,2 .92+1.96×0.661 0)=(2 .7 7,2 .10 ),即有95%的把握,保证该厂生产的面粉平均每袋重量在24.737千克至25.103千克之间.习题16在一批货物的容量为100的样本中,经检验发现有16只次品,试求这批货物次品率的置信度为0.95的置信区间.解答:这是(0-1)分布参数区间的估计问题.这批货物次品率p的1-α的置信区间为( 1, 2)=(12a(-b-b2-4ac),12a(-b+b2-4ac)).其中a=n+uα/22,b=-(2nX¯+uα/22), c=nX¯2.由题意,x¯=16100=0.16,n=100,1-α=0.95,u0.025=1.96. 算得a=100+1.962=103.842,b=-(2×100×0.16+1.962)=-35.842,c=100×0.162=2. 6.p的0.95的置信区间为( 1, 2)=(12a(-b±b2-4ac)), 即(12×10 . 2( . 16±221.2 2 )),亦即(0.101,0.244).习题17在某校的一个班体检记录中,随意抄录25名男生的身高数据,测得平均身高为170厘米,标准差为12厘米,试求该班男生的平均身高μ和身高的标准差σ的置信度为0.95的置信区间(假设测身高近似服从正态分布).解答:由题设身高X∼N(μ,σ2), n=2 , x¯=170, s=12,α=0.05.(1)先求μ置信区间(σ2未知),取U=X¯-μS/n∼t(n-1),tα/2(n-1)=t0.025(24)=2.06.故μ的0.95的置信区间为(170-122 ×2.06,170+122 ×2.06)=(170-4.94,170+4.94)=(165.06,174,94).(2)σ2的置信区间(μ未知),取U=(n-1)S2σ2∼χ2(n-1),χα/22(n-1)=χ0.0252(24)=39.364, χ1-α/22(n-1)=χ0.9752(24)=12.401,故σ2的0.95的置信区间为(24×12239.364,24×12212.401)≈(87.80,278.69), σ的0.95的置信区间为(87.80,278.69)≈(9.34,16.69).习题18为研究某种汽车轮胎的磨损特性,随机地选择16只轮胎,每只轮胎行驶到磨坏为止. 记录所行驶的路程(以千米计)如下:41250 40187 43175 41010 39265 41872 42654 4128738970 40200 42550 41095 40680 43500 39775 40440假设这些数据来自正态总体N(μ,σ2). 其中μ,σ2未知,试求μ的置信水平为0.95的单侧置信下限.解答:由P{μ>X¯-Sntα(n-1)=1-α, 得μ的1-α的单侧置信下限为μ¯=X¯-Sntα(n-1).由所给数据算得x¯≈41119.38,s≈1345.46,n=16.查t分布表得t0.05(15)=1.7531, 则有μ的0.95的单侧置信下限为μ¯=41119.38-1345.464×1.7531≈40529.73.习题19某车间生产钢丝,设钢丝折断力服从正态分布,现随机在抽取10根,检查折断力,得数据如下(单位:N):578,572,570,568,572,570,570,572,596,584.试求钢丝折断力方差的置信区间和置信上限(置信度为0.95).解答:(1)这是一个正态总体,期望未知,对方差作双侧置信限的估计问题,应选统计量χ2=(n-1)S2σ2∼χ2(n-1).σ2的1-α的置信区间是((n-1)S2χα/22(n-1),(n-1)S2χ1-α/22(n-1)).由所给样本值得x¯=575.2, (n-1)s2=∑1=110(xi-x¯)2=681.6;根据给定的置信度1-α=0.95(即α=0.05).查自由度为10-1=9的χ2分布表,得双侧临界值χα/22(n-1)=χ0.0252(9)=19.0, χ1-α/22(n-1)=χ0.9752(9)=2.7,代入上公式得σ2的95%的置信区间为(681.619.0,681,62.70)=(35.87,232.44),即区间(35.87,232.44)包含σ2的可靠程度为0.95.(2)这是一个正态总体期望未知时,σ2的单侧区间估计问题,σ2的置信度为1-α=95%(α=0.05)的单侧置信上限为(n-1)S2χ1-α2(n-1)=∑i=110(xi-x¯)2χ1-α2(n-1),已算得(n-1)S2=∑i=110(xi-x¯)2=681.6, 根据自由度1-α=0.95.查自由度10-1=9的χ2分布表得单侧临界值χ1-α2(n-1)=χ0.952(9)=3.325,代入上式便得σ2的0.95的置信上限为681.63.325=205, 即有95%的把握,保证σ2包含在区间(0,205)之内,当然也可能碰上σ2超过上限值205的情形,但出现这种情况的可能性很小,不超过5%.习题20设某批铝材料比重X服从正态分布N(μ,σ2),现测量它的比重16次,算得x¯=2.705,s=0.029,分别求μ和σ2的置信度为0.95的置信区间。
西北工业大学《概率论与数理统计》课件-第六章 参数估计

(2) 似然函数
定义6.1 设总体X的分布密度(或分布律)为 p(x; ), 其中 (1, 2, ,m )为未知参数. 又设
( x1, x2,, xn ) 为自总体X的样本(X1,X2,…,Xn) 的一 个观察值,则称样本的联合分布
n
L( ) p(x1, x2, … , xn; ) p( xi; )
2º似然估计方程组与最大似然估计之间没有必 然
从中解得 pˆ k n
参数 p的估计值
这时, 对一切 0< p <1, 均有
P{Y k; pˆ } P{Y k; p}
综上所述: 设某试验的可能结果为: A1, A2 , ···, Ai , ···
若在一次试验中,某结果 Ai 出现,则应选择参 数使Ai 出现的概率最大.
以上这种选择一个参数使得实验结果具有
(k 1,2,, m)
(4) 求最大似然估计(MLE)的步骤:
1 写出似然函数
(1, 2 , ,m )
n
L( ) L( x1, x2,, xn; ) p( xi; )
n
i 1
2 取对数 ln L( ) ln p( xi; )
i 1
3 解似然方程(组)
ln L
ln L
2
为来自总体X的简单随机样本. 矩估计法的具体步骤:
1 求出k E( X k ) (1,2,,m ), k 1,2,,m;
2 要求k Ak , k 1,2,, m
这是一个包含 m个未知参数1,2 ,,m的方程组.
3 解出其中1,2,,m , 用ˆ1,ˆ2,,ˆm表示.
4 用方程组的解ˆ1, ˆ2 , ,ˆm 分别作为 1,2 ,,m的估计量,这个估计量称为
概率论与数理统计实验实验3参数估计假设检验

概率论与数理统计实验实验3 参数估计假设检验实验目的实验内容直观了解统计描述的基本内容。
2、假设检验1、参数估计3、实例4、作业一、参数估计参数估计问题的一般提法X1, X2,…, Xn要依据该样本对参数作出估计,或估计的某个已知函数.现从该总体抽样,得样本设有一个统计总体,总体的分布函数向量). 为F(x, ),其中为未知参数( 可以是参数估计点估计区间估计点估计——估计未知参数的值区间估计——根据样本构造出适当的区间,使他以一定的概率包含未知参数或未知参数的已知函数的真?(一)、点估计的求法1、矩估计法基本思想是用样本矩估计总体矩.令设总体分布含有个m未知参数??1 ,…,??m解此方程组得其根为分别估计参数??i ,i=1,...,m,并称其为??i 的矩估计。
2、最大似然估计法(二)、区间估计的求法反复抽取容量为n的样本,都可得到一个区间,这个区间可能包含未知参数的真值,也可能不包含未知参数的真值,包含真值的区间占置信区间的意义1、数学期望的置信区间设样本来自正态母体X(1) 方差?? 2已知, ?? 的置信区间(2) 方差?? 2 未知, ?? 的置信区间2、方差的区间估计未知时, 方差?? 2 的置信区间为(三)参数估计的命令1、正态总体的参数估计设总体服从正态分布,则其点估计和区间估计可同时由以下命令获得:[muhat,sigmahat,muci,sigmaci] = normfit(X,alpha)此命令以alpha 为显著性水平,在数据X下,对参数进行估计。
(alpha缺省时设定为0.05),返回值muhat是X的均值的点估计值,sigmahat是标准差的点估计值, muci是均值的区间估计,sigmaci是标准差的区间估计.例1、给出两列参数?? =10, ??=2正态分布随机数,并以此为样本值,给出?? 和?? 的点估计和区间估计命令:r=normrnd(10,2,100,2);[mu,sigm,muci,sigmci]=normfit(r);[mu1,sigm1,muci1,si gmci1]=normfit(r,0.01);mu=9.8437 9.9803sigm=1.91381.9955muci=9.4639 9.584310.2234 10.3762sigmci=1.68031.75202.2232 2.3181mu1=9.8437 9.9803sigm1=1.91381.9955muci1=9.3410 9.456210.3463 10.5043sigmci1=1.6152 1.68412.3349 2.4346例2、产生正态分布随机数作为样本值,计算区间估计的覆盖率。