(完整版)(0-1)分布参数的区间估计

合集下载

区间估计公式

区间估计公式

区间估计公式区间估计公式是指一种统计方法,用于估计未知参数的范围。

它是根据给定的数据集以及其参数的极限均值推断出的。

这样可以对参数的正确取值作出一个初步的估算。

一、经典区间估计公式1、样本均值估计法根据“大数定律”,当一个随机变量X的抽样样本个数n(→∞)时,X的样本均值的分布收敛到N(μ,σ2/n),可使用样本均值估计法来估计参数μ的值,即令μ = X的样本均数。

2、样本标准差估计法根据中心极限定理,当样本量趋于无穷的时候,样本标准差的分布符合t分布。

令特定的置信度α代替t值,可求得标准差的估计值,即σ^2 '= n·D / (tα/2)^2二、偏态分布估计量偏态分布估计量是一种分布估计法,它采用具备偏态分布特征的数值来估算参数μ和σ。

偏态分布是所有概率分布中最广泛应用的分布之一,它把参数μ和σ拆分成三部分:偏态参数γ,偏度参数ω和尾部形状参数λ。

从而可以从偏态分布中估计出μ、σ和γ、ω、λ的参数值。

三、无偏估计量无偏估计量是另一种用于估算量的分布。

它使用极值法,即按照某种规则,从一系列有限但不受限制的抽样样本中挑选某个值作为未知数的无偏估计值。

最常用的无偏估计量有方差法和方差除以样本数法。

方差估计量是一种比较简单的无偏估计量,它可用以下公式计算:σ^2 = 1 / n*Σ(xi - X)^2其中n是样本量,xi代表每个样本取值,X表示样本均值。

而另一种常用的无偏估计量就是方差除以样本数的方法,它的公式为:σ^2 = Σ(xi - X)^2 / n - 1四、交叉验证法交叉验证是一种分布估计法,它可以用来预测参数μ和σ,以便获得更准确的估算结果。

交叉验证首先将样本随机分为若干组,然后在每一组中利用其他组的信息来估计参数。

估计出的参数值在另外一组中进行验证,以期往复进行,直到每个组都意义数次验证。

然后再求出每次验证的参数的平均值以求得参数的最终估计值。

五、bootstrap法bootstrap是一种分布估计的方法,它可以用来估计三种不同的参数:均值、标准差和相关系数等。

第2节 区间估计

第2节  区间估计


2
~ (n 1)
2
在给定的置信度1 下,由
P{12 2 (n 1) 2 22 (n 1)} 1

2 的置信区间为:
2 (n 1) S 2 (n 1) S , 2 2 (n 1) 1 (n 1) 2 2
即 P X u X u 1 n 2 n 2 置信度为1 的置信区间是 ( X u , X u )
n
2
n
2
例1 包糖机某日开工包了12包糖,称得重量(单 位:克)分别为506,500,495,488,504,486,505,
2 ( n 1) S n 11 0.04 2 0.0224 2 (n 1) 19.675
故所求置信区间为: (0.0224, 0.0962)
二、两个正态总体均值差与方差比的置信区间 1、二总体均值差
1 2 的区间估计
2 X ~ N ( 1 , 12 ), Y ~ N ( 2 , 2 ) 设两总体
n2
n2
Yi 2
2
) 2 ~ 2 ( n2 )
1 故F

1
2 1 i 1 n2
(X
i
n1
i
1 )
2
2
n1 ~F (n1 , n2 ) n2
( , ) 即是 的置信度为 1 的置信区间
正态总体参数的区间估计
一、单总体均值与方差的区间估计
二、双总体均值差与方差比的区间估计
三、小结
一、单正态总体均值与方差的区间估计 1.单总体均值 的置信区间 X ~ N ( , 2 ), 2 已知时 (1)设

第三节 参数的区间估计

第三节 参数的区间估计

比如,在估计湖中鱼数的问题中,若我们根据一 个实际样本,得到鱼数N的最大似然估计为1000条. 实 际上,N的真值可能大于1000条,也可能小于1000条.
若我们能给出一个区间,在此区间内 我们合理地相信 N 的真值位于其中. 这样对 鱼数的估计就有把握多了.
也就是说,我们希望确定一个区间,使我们能以 比较高的可靠程度相信它包含真参数值.
有 P{ X

n
u 2 X

n
u 2 } 1
于是所求 的 置信区间为
[X n u 2 , X nu 2 ]ຫໍສະໝຸດ 也可简记为X
n
u 2
从上例解题的过程,我们归纳出求置 信区间的一般步骤如下: 1. 明确问题, 是求什么参数的置信区间? 置信水平 1 是多少? 2. 寻找参数 的一个良好的点估计 T (X1,X2,…Xn) 3. 寻找一个待估参数 和估计量T的函数 S(T, ),且其分布为已知.

2
的 u1 , u2 .
如何确 定 u 2 ?
P{| U | u 2 } 1
由标准正态分布分布函数的 定义及其概率密度的性质得 若
P{| U | u 2 } 1 P{U u 2 } 1 / 2 (u 2 )

查正态分布表得 u 2 .
X 又由 P{| | u 2 } 1 n
由Φ(uα/2)=1-α/2查标准正态分布表得uα/2 P{ X u 2 X u 2 } 1 n n 得置信区间 ( X u 2 , X u 2 ) n n 计算 X 将它们代入ⅱ即可。
例 设某苹果园单株果树的产量X~N(μ,σ²),σ=8, 估计该果园单株果树的平均产量。

参数的区间估计

参数的区间估计

参数的区间估计1. 参数的概念参数是指一种描述总体特性的量,通常用符号表示。

以样本均值为例,我们通常用$\bar{x}$表示样本均值,用$\mu$表示总体均值,$\bar{x}$就是关于$\mu$的一个参数。

2. 区间估计的基本思想区间估计是通过样本的统计量来估计总体的参数,因为样本数据毕竟是有限的,所以估计值与真实值之间必然存在误差。

为了消除这种误差,我们采用确定一个区间的方法,即“置信区间”。

置信区间是指用样本数据计算出来的一个范围,其含义是真实的总体参数值有一定的置信水平(置信度)落在这个区间内。

①确定信赖水平(置信度)$1-\alpha$,$\alpha$称为显著性水平。

②根据样本均值选择合适的经验公式或理论公式来计算样本估计量的标准误差。

③根据置信度$1-\alpha$,查找$t$分布表或正态分布表,得到置信水平为$1-\alpha$的$t$值或$z$值。

④根据样本容量和总体方差是否已知,确定区间估计公式。

⑤根据置信度和样本数据计算出置信区间。

下面具体介绍区间估计的步骤:A. 确定总体所服从的概率分布总体可以服从正态分布、泊松分布、二项分布等概率分布,其中正态分布是最为常用的一种分布。

B. 确定样本容量$n$样本容量$n$的大小直接影响到置信区间的精度,当样本容量越大,置信区间的长度就越短。

一般观测数据越多,则样本容量越大。

C. 确定置信度$1-\alpha$置信度是指总体参数落在某一特定区间内的概率,一般取$95\%$或$99\%$。

D. 求出样本均值$\bar{x}$样本均值$\bar{x}$是样本中所有元素值的总和除以样本容量$n$,即$\bar{x}=\frac{\sum_{i=1}^nx_i}{n}$E. 求出样本方差$s^2$若总体标准差未知,用样本标准差$s$代替,$S(\bar{x})=\frac{s}{\sqrt{n}}$G. 选择合适的分布当总体服从正态分布,$\frac{\bar{x}-\mu}{\frac{\sigma}{\sqrt{n}}}$服从标准正态分布;当总体未知且样本容量$n$较小($n<30$),$\frac{\bar{x}-\mu}{\frac{s}{\sqrt{n}}}$服从$t$分布。

正态总体均值及方差的区间估计

正态总体均值及方差的区间估计

第十九讲 正态总体均值及方差的区间估计1. 单个正态总体方差的区间估计设总体),(~2σμN X , ),,(21n X X X 为来自X 的一个样本,已给定置信度(水平)为α-1,求2σ的置信区间。

①当μ已知时,由于),(~2σμN X i ,因此,)1,0(~N X i σμ-(,2,1=i n , )。

由2χ分布的定义知:∑=-ni i n X 1222)(~)(χσμ,据)(2n χ分布上α分位点的定义,有:αχσμχαα-=<-<∑=-1)}()()({21222122n X n P ni i从而αχμσχμαα-=⎪⎪⎭⎪⎪⎬⎫-<<⎪⎪⎩⎪⎪⎨⎧--=-∑∑1)()()()(2112221222n X n X P ni i ni i 故2σ的置信度为α-1的置信区间为:⎪⎪⎪⎪⎭⎫ ⎝⎛---==∑∑)()(,)()(211221222n X n X ni i n i i ααχμχμ ②当μ未知时,据抽样分布有:)1(~)1(222--n S n χσ类似以上过程,得到第七章 参数估计第5节 正态总体均值及方差的区间估计单个正态总体均值的区间估计 ①当2σ已知时,μ的置信水平为α-1的置信区间为:⎪⎪⎭⎫ ⎝⎛±2ασz n X (5.1) ②当2σ未知时,μ的置信水平为α-1的置信区间为⎪⎪⎭⎫ ⎝⎛-±)1(2n t n SX α.(5.4)注意:当分布不对称时,如2χ分布和F 分布,习惯上仍然取其对称的分位点,来确定置信区间,但所得区间不是最短的。

αχσχαα-=⎪⎭⎪⎬⎫⎪⎩⎪⎨⎧--<<---1)1()1()1()1(21222222n S n n S n P 2σ的置信度为α-1的置信区间为:⎪⎪⎭⎫⎝⎛-----)1()1(,)1()1(2122222n S n n S n ααχχ σ的置信度为α-1的置信区间为:⎪⎪⎪⎭⎫ ⎝⎛-----)1()1(,)1()1(2122222n S n n S n ααχχ 例2 有一大批袋装糖果, 现从中随机地取出16袋, 称得重量(以克计)如下:506 508 499 503 504 510 497 512 514 505 493 496 506 502 509 496 设袋装糖果的重量近似地服从正态分布, 求总体标准差σ的置信水平为0.95的置信区间.解:总体均值μ未知,σ的置信度为α-1的置信区间为:⎪⎪⎪⎭⎫ ⎝⎛-----)1()1(,)1()1(2122222n S n n S n ααχχ 此时,,975.021,025.02,05.0=-==ααα16=n ,查表得,488.27)15(025.0=χ,262.6)15(975.0=χ由给出的数据算得.4667.382=s 因此,σ的一个置信度为0.95的置信区间为(4.58,9.60).2. 两个正态总体均值差的区间估计设总体),(~),,(~222211σμσμN Y N X ,且X 与Y 相互独立,),,(21m X X X 来自X 的一个样本,),,,(21n Y Y Y 为来自Y 的一个样本,且设2221,,,S S Y X 分别为总体X 与Y 的样本均值与样本方差,对给定置信水平α-1,求21μμ-的一个置信区间。

2015考研数学基础阶段学习计划(数一)

2015考研数学基础阶段学习计划(数一)

2015考研数学基础阶段学习计划(数一)考研数学一般考察考生的基础知识的掌握和运用解题的能力。

数学的复习需要一步一步的积累知识、循序渐进地完全掌握。

学好考研数学,务必要夯实基础。

在此,建议您在6月底之前前完成基础阶段的学习,3月份之前主要是以教材、零基础入门课程为主,把教材上的习题做一遍,然后3月份——6月份把基础课程学习一遍,以便于后面的强化、冲刺。

根据考研数学中高数、线代、概率所占分值的不同,对不同章节确定了合理的学习时间。

复习计划使用说明:(1) 计划里明确了每章节的重难点,以及不需要掌握的内容也已经指明,后面备有考纲规定的考试内容,同学们要根据大纲要求合理学习知识点。

(2) 同学们在学习的时候如果有条件一定要和你周围的同学、老师多交流学习心得。

只有你总结出来的方法才是最适合你的方法。

(3) 同学们在学习的过程中难免会遇到一些疑难问题、做错的题目,一定要在第一时间把它整理到你的笔记本里,并到名师堂提问。

本阶段主要复习资料是大学教材,包括高等数学、线性代数、概率论与数理统计,如果手头没有这几本书,推荐购买:《高等数学》同济第六版上下册;《工程数学线性代数》同济第五版;《概率论与数理统计》浙江大学第四版。

学习课程:高等数学零基础入门(一元函数微积分学)、线性代数零基础入门(线代基础)、概率论零基础入门(概率论初步)高等数学基础、线性代数基础、概率论与数理统计基础说明:听课之前一定要复习过一遍教材,这样在听课的时候才能抓住重点。

零基础入门课程所讲内容是考研数学最基础,也是最重要的部分,其中包括了与考研数学紧密联系的部分高中知识,如三角函数、排列组合等。

数学的学习是一个循序渐进、由浅入深的过程,夯实基础尤为关键,之后的学习才能达到事半功倍的效果。

建议先学习零基础入门课程,然后再学习基础课程。

学习顺序:教材与零基础入门课程同步进行,之后学习基础课程。

复习教材的时候先复习高等数学内容,高等数学是基础,然后再复习线性代数或概率论与数理统计,这两者谁前谁后都可以,也可以同时兼顾。

0—1分布在解概率论与数理统计题中的应用

0—1分布在解概率论与数理统计题中的应用

0—1分布在解概率论与数理统计题中的应用摘要:10-分布是0-分布研究的是一个随机试验,它只有两个可能结果.1二项分布的特例,二项分布是10-分布的推广且二项分布的极限分布是正态分布.首先本文给出了10-分布在解概率论与数0-分布的定义和性质,然后探讨了1理统计题中的应用,最后得到了在10-分布中不相关和独立是等价的.关键词:10-分布; 数学期望; 相关系数; 参数估计引言随着科学的发展,数学在生活中的应用越来越广,生活的数学无处不在.而概率作为数学的一个重要部分,同样也在发挥着越来越广泛的用处.而基于概率统计在我们的生活中几乎无处不在,学好概率尤其是能够将学习的概率统计应用于实践中对我们来说确实是较困难而又受益非浅的事啊.很多随机试验的样本空间S只有两个结果,记为A与A,因此我们在处理一些实际问题时常常引入服从X使问题变得简单,任何一个只有两种结果的随机现象, 0(-分布的随机变量)1i都可以用)10(-分布来描述.很多文献对)10(-分布在解概率论与数理统计题中的应用进行了不同程度的讨论,文献[2]给出了)10(-0(-分布的定义,文献[4][7]和[10]给出了有关)1分布的性质,文献[2][3][4]和[8]探讨了)10(-分布在解概率论与数理统计题中的应用,得到了它在求解概率、数学期望与方差、相关系数、以及参数估计量中的作用,教会了我们如何巧妙地引入)10(-分布分布来解决问题.本文在上述文献的基础上,给出了)10(-分布在求数学期望和方差的应用,探讨了有关)10(-变量让随机事0(-分布的相关系数与相互独立的关系,利用)1件和随机变量联系起来,以及给出了)10(-分布在中心极限定理和统计推断的应用,其中在探讨了有关)10(-分布的相关系数与相互独立的关系中我们可以得到不相关与独立是等价的,具有一定的理论意义和实践意义.1.0-1分布的定义[2]设随机变量X 只可能取0与1两个值,它的分布律是{},,)10(1,0)1(1<<=-==-p k p p k X P k k 则称X 服从)10(-分布或两点分布或伯努利分布.)10(-分布的分布律也可写成2.0-1分布的性质性质 2.1 期望和方差[10]设),1(~p b X ,则p X E =)(,)1()(p p X D -=.性质 2.2 可加性[7]设),1(~p b X ,),1(~p b Y ,且X 与Y 相互独立,则),2(~p b Y X Z +=. 性质 2.3 矩估计[4]设总体),1(~p b X ,p 未知.n X X X ,,,21 是来自X 的样本,则X p=ˆ. 3.0—1分布在解概率论与数理统计题中的应用3.1 0—1分布在求数学期望和方差中的应用期望在我们日常生活中常指有根据的希望,而在概率论中,数学期望却源于历史上一个著名的分赌本问题,通过解决此问题我们看到了它在概率统计中的地位,方差则是用来描述随机变量取值的集中与分散程度[2],它在现实生活中的应用也是很广泛的.而对于离散型随机变量的数学期望和方差的求解一般是先求其分布列,然后按照定义计算.但是对于有些随机变量的分布列不容易求出,有些还要判断其数学期望和方差是否存在,计算过程往往比较复杂.这就要求我们借助中间变量来求解数学期望和方差,由于)10(-分布描述的是只有两个结果的随机试验,而在现实生活中很多随机试验我们都可以直接或间接地把它看作服从)10(-分布,进而转化成求多个独立同分布或同分布的数学期望和方差,我们知道)10(-分布的数学期望和方差都是容易求出的.因此,我们可以借助)10(-分布X 0 1 k Pp -1 p来解决复杂的随机变量的数学期望和方差.例1 一民航送客车载有20位旅客自机场开出,旅客有10个车站可以下车.如到达一个车站没有旅客下车就不停车.以X 表示停车的次数,求)(X E (设每位旅客在各个车站下车是等可能的,并设各旅客是否下车相互独立).解 引入随机变量10,,2,1,,1,0 =⎩⎨⎧=i i i X i 站有人下车在第站没有人下车在第.易知1021X X X X +++= .现在来求)(X E .按题意,任一旅客在第i 站不下车的概率为109,因此20位都不在第i 站下车的概率为20)109(,在第i 站有人下车的概率为20)109(1-,也就是 {}20)109(0==i X P ,{}20)109(11-==i X P ,10,,2,1 =i . 由此20)109(1)(-=i X E ,10,,2,1 =i . 进而 .次)(784.8)109(110)()()()()(2010211021=⎥⎦⎤⎢⎣⎡-=+++=+++=X E X E X E X X X E X E例2 设随机变量),(~p n b Y ,求)(Y E ,)(Y D .解 由二项分布的定义知,随机变量Y 是n 重伯努利试验中事件A 发生的次数,且在每次试验中A 发生的概率为p .引入随机变量:n k k A k A X k ,,2,1,0,1 =⎩⎨⎧=,次试验不发生在第次试验发生在第.易知n X X X Y +++= 21,(1)由于k X 只依赖于第k 次试验,而各次试验相互独立,于是n X X X ,,,21 相互独立,又知k X ,n k ,,2,1 =服从同一)10(-分布:(1)式表明以n ,p 为参数的二项分布变量,可分解成为n 个相互独立且都服从以p 为参数的)10(-分布的随机变量之和.易知p X E k =)(,)1()(p p X D k -=,n k ,,2,1 =.故np X E X E Y E nk k n k k ===∑∑==11)()()(.又由于n X X X ,,,21 相互独立,得)1()()()(11p np X D X D Y D nk k n k k -===∑∑==.即)1()(,)(p np Y D np Y E -==.例3 将n 个球)~1(号n 随机地放进n 只盒子)~1(号n 中去,一只盒子装一只球.若一只球装入与球同号的盒子中,称为一个配对,记X 为总的配对数,求)(X E .解 设n i i i X i ,,2,101 =⎩⎨⎧=,个不配对第,个球配对第,. 则n X X X X +++= 21. k X 0 1 k P p -1 p因为将n 只球随机地放进n 只盒子,可作为n 只球进行全排列为!n ,第i 只球放进第i 号盒子,剩余的)1(-n 只球进行全排列,有)!1(-n ,故i X 的分布律为:n n n X P i 1!)!1()1(=-==,nX P i 11)0(-==. 则 {}n X P X E i i 11)(===,n i ,,2,1 =. 所以11)()()()(21=⨯=+++=nn X E X E X E X E n . 例4 若有n 把看上去样子相同的钥匙,其中只有一把能打开门上的锁,用它们去试门上的锁,设取到每只钥匙是等可能的.若每把钥匙试开一次后除去,试求试开次数X 的数学期望.解 设随机变量⎩⎨⎧--=把钥匙中有一把能打开前开把钥匙中没有一把能打前)1(,0)1(,1i i X i ,n i ,,3,2 =. 则∑=+=ni i X X X 21,因为1)(1=X E ,{}ni n i n i n n n n n X P i 1)2()1(1211+-=----⋅⋅⋅--⋅-==,n i ,,3,2 =. {}n i n X P X E i i 111)(+-==⨯=,n i ,,3,2 =. 所以2111)()()(221+=+-+=+=∑∑==n n i n X E X E X E n i n i i . 例5 一台设备由三大部件构成,在设备运转中各部件需要调整的概率相应为0.10,0.20和0.30.假设各部件的状态相互独立,以X 表示同时需要调整的部件数,试求X 的数学期望)(X E 与方差)(X D .解 设随机变量⎩⎨⎧=否则个部件需要调整第,0,1i X i ,3,2,1=i . 由题意321,,X X X 相互独立,均服从)10(-分布,且321X X X X ++=.则{}10.01)(11===X P X E ,{}{}09.001)(111==⨯==X P X P X D .{}20.01)(22===X P X E ,{}{}16.001)(222==⨯==X P X P X D .{}30.01)(33===X P X E ,{}{}21.001)(333==⨯==X P X P X D .所以.60.030.020.010.0)()()()(321=++=++=X E X E X E X E.46.021.016.009.0)()()()(321=++=++=X D X D X D X D 3.2 探讨有关0—1分布的相关系数与相互独立的关系设随机变量X ,Y 的相关系数XY ρ存在.当X 和Y 相互独立时,有数学期望的性质)()()(Y E X E XY E =及)()()(),(Y E X E XY E Y X Cov -=知0),(=Y X Cov ,从而0=XY ρ,即X ,Y 不相关.反之,若X ,Y 不相关,X 和Y 却不一定相互独立[1].我们知道在二维正态分布中,不相关与独立是等价的,那么若X ,Y 都服从)10(-分布,结论如何?下面我们就给出证明.例 6 设A 和B 是试验E 的两个事件,且0)(>A P ,0)(>B P ,并定义随机变量X ,Y 如下:⎩⎨⎧=⎩⎨⎧=不发生若发生若不发生若发生若B B Y A A X ,0,1,,0,1证明若0=XY ρ,则X 和Y 必定相互独立.证明 设X ,Y 的分布律为⎪⎪⎭⎫ ⎝⎛-)(1)(10~A P A P X ,⎪⎪⎭⎫ ⎝⎛-)(1)(10~B P B P Y . 于是XY 也只能取0及1这两个值,从而)()(1))(1(0)(A P A P A P X E =⨯+-⨯=,同理)()(B P Y E =,{}1,1)(===Y X P XY E .由于0=XY ρ,则0),(=Y X Cov ,即)()()(Y E X E XY E =.从而)1()1()1,1(=====Y P X P Y X P.)1()0()0()1())1(1()1()1()1()1()1,1()1()1,0(=======-====-====-====Y P X P X P Y P X P P Y P Y P X P Y P Y X P Y P Y X P同理可证)0()0()0,0(=====Y P X P Y X P .)0()1()0,1(=====Y P X P Y X P . 所以 X 和Y 必定相互独立.分析 通过上述证明,我们可以得到:不仅在二维正态分布中不相关与独立是等价的,在)10(-分布中不相关和独立也是等价的.此结论可以启发我们对二项分布中不相关和独立是否等价进行探究,具有一定的理论意义.3.3 探讨随机事件与随机变量的联系我们知道随机现象的某些样本点组成的集合称为随机事件,用来表示随机现象结果的变量称为随机变量[2].对于一个随机事件A 它有两种潜在的可能:要么发生要么不发生,它代表了两种可能的结果,这让我们很容易想到)10(-分布.一般地,如果A 是某个随机事件,则可通过如下示性函数使它与数值发生联系⎩⎨⎧=发生若发生若A A X ,0,1 [8],这就是通过引入)10(-分布来实现随机事件与随机变量的转化.它启发了我们在解某些概率统计的题中可以利用)10(-变量来解决一些问题.例7 对于任意两事件A 和B ,1)(0<<A P ,1)(0<<B P ,)()()()()()()(B P A P B P A P B P A P AB P -=ρ称为事件A 和B 的相关系数. 利用随机变量相关系数的基本性质,证明1≤ρ.证明 定义随机变量⎩⎨⎧=出现,若不出现,若A A X ,1,0,⎩⎨⎧=出现若不出现若B B Y ,1,0. 则X ,Y 的分布律分别为⎪⎪⎭⎫ ⎝⎛-)(1)(10~A P A P X ,⎪⎪⎭⎫ ⎝⎛-)(1)(10~B P B P Y . 于是)()(A P X E =,)()(B P Y E =,)()()(A P A P X D =,)()()(B P B P Y D =,)()()(),(B P A P AB P Y X Cov -=,ρρ=-==)()()()()()()()()(),(B P A P B P A P B P A P AB P Y D X D Y X Cov XY .即事件A 和B 的相关系数就是随机变量X 和Y 的相关系数,由随机变量相关系数的基本性质知1≤ρ.3.4 0—1分布在中心极限定理与统计推断中的应用伯努利大数定理表明事件发生的频率nn A 依概率收敛于事件的概率p .在实际应用中,当试验次数n 很大时,可以用事件发生的频率来代替事件的概率[1].而)10(-分布的数学期望刚好等于事件发生的概率,那么我们可以用)10(-分布的数学期望来代替事件发生的频率.林德贝格-列维中心极限定理表明独立同分布随机变量之和∑=nk k X 1,当n 充分大时近似的服从正态分布[1].当我们在求解某些关于二项分布中心极限定理问题时,若不能直接利用棣莫弗-拉普拉斯定理时,我们可以利用二项分布与)10(-分布的关系,将二项分布分解成n 个独立服从同一)10(-分布之和,再利用林德贝格-列维中心极限定理求解.我们还可以得到若一来自)10(-分布的样本n X X X ,,,21 ,当样本容量n 很大时,)1(1p np npX n i i --∑=近似的服从)1,0(N 分布,而有关正态分布的区间估计问题都是很容易求出的,我们可以利用此结论来求)10(-分布参数的区间估计.例8 一复杂系统由100个相互独立起作用的部件所组成.在整个运行期间每个部件损坏的概率为0.10.为了使整个系统起作用,至少必须有85个部件正常工作,求整个系统起作用的概率.解 引入随机变量⎩⎨⎧=个元件不能正常工作若第个元件正常工作若第i i X i ,0,1,100,,2,1 =i . 随机变量i X 的分布律为易知 09.0)(9.0)(==i i X D X E ,.由题意知,10021,,,X X X 独立同分布,则)9.0,100(~1001B Xi i ∑=.根据林德贝格-列维中心极限定理,952.0)35(1390851.09.0100908510011001≈-Φ-≈⎪⎪⎭⎪⎪⎬⎫⎪⎪⎩⎪⎪⎨⎧-≥⨯⨯-=⎭⎬⎫⎩⎨⎧≥∑∑==i i i i X P X P . 例9 从1批含有次品的产品中随机抽取85件,发现2件次品,试估计次品率.解 引入随机变量⎩⎨⎧=次抽取出正品第次抽取出次品第i i X i ,0,1,85,,2,1 =i . 设总体X 的次品率为p ,则总体X 的分布律为由矩估计知,x p X E ==)(,解得∑====n i i x n x p 18521ˆ. 例10 工厂生产的某产品次品率不超过5%才能出产.今抽检100件产品,发现次品4件,问这批产品能否出厂?要求检验结果具有95%的可信度.解 令⎩⎨⎧=检验不合格检验合格,1,0X . i X 0 1 P .09.0 X 0 1 Pp -1 p则总体),1(~p b X ,因为p X E =)(,所以的置信区间为的α-1p⎪⎪⎭⎫+ ⎝⎛-22ααZ n S X Z n S X ,.由于100=n ,04.0=X ,96.1025.02==Z Z α,又因X X =2,故()0384.01122122=-=-=-=∑=X X X X X X n S n i i . 求得p 的95%置信区间为)0786.0,0014.0(.由于置信上限%50786.0>,故这批产品不能出产.结束语0—1分布是一种重要的离散型随机变量的分布,以上我们通过四个方面的应用看到了它在求解概率、数学期望与方差、相关系数、以及参数估计量中的作用.事实是它在解概率论与数理统计题中的应用不止我们以上涉及的几个方面.在解题中,如何巧妙地引入0—1分布来解决问题是一种重要的方法和技巧,也是很多考试题目的考点,但是往往学生在解题时对0—1分布并没有足够的重视.希望本文能对解概率统计题的朋友们提供一些有益的帮助,开拓解题的思路.由于本人的能力有限未能给出在二项分布中不相关与独立是否是等价的,这也是本文的一大遗憾,希望读者能够给出证明.参考文献[1] 茆诗松,程依明,濮晓龙等.概率论与数理统计教程[M].北京:高等教育出版社,2004,7.[2] 盛骤,谢式千,潘承毅等.概率论与数理统计[M].北京:高等教育出版社,2001,12.[3] 周华任,滕加俊.概率论与数理统计辅导及习题精解[M].陕西:陕西师范大学出版社,2006,4.[4] 曹显兵,黄先开.概率论与数理统计过关与提高[M].北京:原子能出版社,2008,1.[5] 陈兰祥,蒋凤瑛.应用概率论[M].上海:同济大学出版社,1999.[6] 应坚刚,何萍.概率论[M].上海:复旦大学出版社,2001.[7] 魏宗舒,概率论与数理统计教程[M].北京:高等教育出版社,2005.[8] 李战江.0-1分布在解概率论与数理统计题中的应用[J].内蒙古农业大学学报,2005,3(3):91-92.[9] 刁培松,张静.两点分布及其应用[J].山东工程学院学报,1999(1):38-40.[10] 陈家鼎,刘婉如,汪仁官等.概率统计讲义[M].北京:高等教育出版社,2004,5.。

概率论-7.5 分布参数的区间估计

概率论-7.5 分布参数的区间估计


p2
1 2a
(b
b2 4ac) 0.69
因此, p 的一个置信度为 0.95 的置信区间为(0.50,0.69) .
2020年4月26日星期日
4
目录
上页
下页
ቤተ መጻሕፍቲ ባይዱ
返回

p1
1 2a
(b
b2 4ac )

p2
1 2a
(b
b2 4ac) ,
此处 a n u2 /2 ,b (2nX u2 /2 ) ,c nX 2 .于是可得
p 的一个近似的置信水平为1 的置信区间为
( p1, p2 ) .
2020年4月26日星期日
3
目录
上页
下页
返回
【例 19】 从一批手工艺中抽取 100 个样品中,得一级 品 60 个,求这批产品的一级品率 p 的置信水平为 0.95
限定理知
n
Xi np
i 1
nX np
np(1 p) np(1 p)
近似地服从 N (0,1) 分布,
2020年4月26日星期日
2
目录
上页
下页
返回
于是有
P u /2
nX np np(1 p)
u
/
2
1
.
而 u /2
nX np np(1 p)
u / 2
等价于
(n u2 / 2 ) p2 (2nX u2 / 2 ) p nX 2 0 .
的置信区间.
解 一级品率 p 是(0-1)分布的参数。由 n 100 ,
x
60 100
0.6 ,1
0.95 ,
/
2

参数的区间估计

参数的区间估计

2
单个正态总体期望与方差的1-α置信区间(小结)
条件 σ2已知
/
统计量
X n
~ t (n 1)
置信区间
X U n 2
S X t ( n 1) n 2

~ N ( 0 , 1)
μ
σ2未知
置信区间不唯一。
区间估计:对于给定的置信水平1-α,根据样本观测值 来确定未知参数θ的置信区间( ˆ,1 ˆ),称为参数θ的区间 2 估计。 如何求未知参数的置信区间呢?
常用统计量及分位点的确定方法
1. 若 X~N(μ,σ2): X1,X2,…,Xn
U X

~ N (0 ,1)
n
X S/ n
X S / n
μ已知
1

2
(X
i1
n
i
)
2
~ (n)
2
(X
i1 2 2
n
i
)
2

,
(n)
σ2
μ未知
( n 1) S
2
(X i ) i1 2 (n) 1 2
n 2

2
~ ( n 1)
2
( n 1) S 2 , 2 ( n 1) 2
i1
2 P (n) 1 2

i1
(xi 0 ) 2 ( n ) 1 2 2
2

(X
i1 2 2
n
i
0)
2

,
(n)

正态总体参数的区间估计

正态总体参数的区间估计

, 0
2
2 ( 1 , ) 2
已知
≥0
2
2
2
2
2
( n 1)
( n 1)
]
正态总体均值和方差的假设检验 检 验 法
H H
0
1
检验统计量
自 由 度
拒绝域
| |
2
条件
0
≠ 0
> 0 < 0
=
x 0
μ
检 验
≤ 0
≥ 0
0
n
0
, 0
2
已知
0
| t | t
六大分布的期望和方差 分布 参数为 p 的 0~1 分布 离 散 型 分布率或概率密度 P{X=0}=q, P{X=1}=p; 0<p<1,q=1-p P{X=k}=C n p q k=0,1,…,n;0<p<1,q=1-p 泊松分布 X~P(λ ) P{X=k}=
e
k
期望
方差
p np λ
设 x 1 , x 2 , , x n 为来自正态总体 N ( , ) 的一个样本,则样本函数
2
t 分布
def
t
x s/ n
~ t ( n 1 ),
其中 t(n-1)表示自由度为 n-1 的 t 分布。
2
设 x 1 , x 2 , , x n 为来自正态总体 N ( , ) 的一个样本,则样本函数
n
μ = t=

(x )

(x ) s ( n 1) s
2
[x u [x t [

2

经济数学概率论与数理统计

经济数学概率论与数理统计

《经济数学——概率论与数理统计》教学大纲第一部分大纲说明一、课程性质与任务本课程是为经济学院的国际经济与贸易、金融学等经济学类专业本科生开设的一门必修的重要基础课课。

本课程由概率论与数理统计两部分组成。

概率论部分侧重于理论探讨,介绍概率论的基本概念,建立一系列定理和公式,寻求解决统计和随机过程问题的方法。

其中包括随机事件和概率、随机变量及其分布、随机变量的数字特征、大数定律和中心极限定理等内容;数理统计部分则是以概率论作为理论基础,研究如何对试验结果进行统计推断。

包括数理统计的基本概念、参数统计、假设检验等。

通过本课程的教学,应使学生掌握概率论与数理统计的基本概念,了解它的基本理论和方法,从而使学生初步掌握处理随机事件的基本思想和方法,培养学生运用概率统计方法分析和解决实际问题的能力。

二、教学基本要求本大纲对线性代数课程的不同内容作了不同的要求,在教学内容部分一一列出,对大纲中所列具体内容的要求程度,引用了国家教委课程指导委员会制定的“高等工业学校数学课程教学基本要求”的用语,将基本要求分为由高到低的三个等级,对概念和理论性的知识,由高到低分别用“理解”,“了解”,“知道”三级区分,对运算、方法和技巧方面的知识,由高到低用“熟练掌握”,“掌握”,“会或能”三级区分。

本大纲根据国家教委审定的经济数学基础中概率论与数理统计课程教学基本要求及高等工科院校概率论与数理统计课程教学基本要求选定了教学内容。

其中,第一章(随机事件的概率)、第二章(随机变量及其分布)、第三章(多维随机变量及其分布)、第四章(随机变量的数字特征)、第五章(大数定律及中心极限定理),第六章(样本及抽样分布)、第七章(参数估计)、第八章(假设检验)为必学内容,第九章(方差分析及回归分析)为选学内容。

通过本课程的学习,要求能够理解随机事件、样本空间与随机变量的基本概念,掌握概率的运算公式,常见的各种随机变量(如0-1分布、二项分布、泊松(Poisson)分布、均匀分布、正态分布、指数分布等)的表述、性质、数字特征及其应用,一维随机变量函数的分布。

第六节(0-1)参数分布的区间估计

第六节(0-1)参数分布的区间估计
第 6节
(0--1)分布参数的区间估计
这是一种特殊的离散型分布的区间估计,取自容 量 n > 50 的大样本。取大样本的目的是意在利用 中心极限定理,使其近似服从标准正态分布.
问题: 设总体 X 服从参数为 p 的 (0---1)分布
A发生时 1 当事件 X A不发生时 0 当事件
且 P ( X 1) p, P ( X 0) 1 p q
2
z
z
2
z n p(1 p) nX n p z n p(1 n p)
2 2
nX n p z n p(1 n p)
2
nX n p z n p(1 n p)
2
概率统计

p X
z
2
p X
z
n
2
n p(1 n p)
X n 是一个大样本,
所以由中心极限定理得:
X
i 1
n
i
np
nX n p n p (1 p)
n p (1 p)
概率统计
~ N (0,1)
P ( z
由不等式:
2
nX np z ) 1 2 np(1 p)
nX n p n p(1 p)
1 记: p1 ( b b 2 4ac ) 2a 1 p2 ( b b 2 4ac ) 2a
其中:
概率统计
即为二次方程 的两个根
2 a ( z n) , b (2nX z ), c nX 2
2 2
2
得 p 的近似的置信度为 1
(
2ቤተ መጻሕፍቲ ባይዱz

数理统计(区间估计)

数理统计(区间估计)

数理统计
例2 设总体 X ~ N ( , 2 ), X1, X2,…, Xn为 总体的样本, 求 , 2 的矩法估计量.
解 ˆ矩 X
ˆ2矩1
n
n i1
Xi2
X2
例3 设总体 X ~ E(), X1, X2,…, Xn为总体的 样本, 求 的矩法估计量.
解 E(X)1/, 令 X 1 / .
2)求出 ˆ1,ˆ2, ,ˆk , 使得
L ( x 1 ,x 2 , ,x n ;ˆ 1 ,ˆ 2 , ,ˆ k )
( 1 , m 2 , , k ) { L ( x a 1 ,x 2 , x ,x n ;1 ,2 , ,k )}
数理统计
若 L是 1, ,k的可微函数,解似然方程组
解 总体 X 的概率分布为
P ( X x ) p x ( 1 p ) 1 x ,x 0 , 1
设 x1, x2,…, xn为总体样本X1, X2,…, Xn 的样本值,
则 P ( X 1 x 1 , X 2 x 2 , , X n x n )
n
n
xi
n xi
pi1 (1p) i1 L(p) x i 0 ,1 ,i 1 ,2 , ,n
则称 1, ,k 为1,…, k 的极大似然估计值
数理统计
显然,
ˆr g (x 1 ,x 2 , ,x n ) r 1 ,2 , ,k
称统计量
ˆ r g (X 1 ,X 2 , ,X n ) r 1 ,2 , ,k
为1, 2,…, k 的极大似然估计量
求最大似然估计(MLE)的一般步骤
(1) 由总体分布导出样本的联合分布律(或联合 密度);
1( X 1, X 2 , , X n ) 2 ( X 1, X 2 , , X n )

概率论与数理统计 7.2(参数的区间估计)

概率论与数理统计 7.2(参数的区间估计)

常将该对称区间写成较短的形式: X z 2 n
7.2.2 正态总体均值的区间估计 当然,(7.7)式中的不等式不是唯一的,取两个对称 的分位点 –z/2 和 z/2 是为了使两点之间的长度最小, 从而保证了所得置信区间的精度最大. 2. 2未知时, 的置信区间
1. 已知时,2的置信区间
由于X~N(,2),所以 取枢轴量
n 2
Xi 2 ~ ( n), i 1
n
2
n X 1 2 2 i 2 X i i 1 i 1
由于 2概率密度不是对称的,对给定的置信水平1 – ,不容易找到最短的置信区间,习惯上仍取对称形
2未知时,不能再用
区间的枢轴量,因为其中含有另一个未知参数2. 考虑到S2是2的无偏估计,可以用S2代替2, 由定理6.3知 X ~ t ( n 1),
S/ n
X Z 作为求 的置信 / n
所以,可以选用 T
X 作为枢轴量. S/ n
7.2.2 正态总体均值的区间估计
第三节 区间估计
前面,我们讨论了参数点估计. 它 是用样本算得的一个值去估计未知参数. 但是,点估计值仅仅是未知参数的一个 近似值。 点估计缺点
它没有反映出这个近似值的误差范围, 还有可信度. 区间估计正好弥补了点估计的这个缺陷 .
7.2.1 区间估计的一般步骤
定义7.5 设X1,X2,…,Xn为总体X的一个样 本,θ为总体X的未知参数,对给定的(0,1),如 果有两个统计量 ˆ1 ˆ1 ( X1 , X 2 ,, X n )和
本相互独立,其样本均值分别记为 X 和 Y ,其样本方 差分别记为S12和S22. 我们来研究参数1 – 2的区间估计. 1. 12和22已知时,1–2的置信区间 由定理6.4知

分布的参数估计

分布的参数估计
自由度 . 7 8 9 10 . .10 . 1.415 1.397 1.383 1.372 . .05 . 1.895 1.860 1.833 1.812 . 右尾面积 .025 . 2.365 2.306 2.262 2.228 . .01 . 2.998 2.896 2.821 2.764 . .005 . 3.499 3.355 3.250 3.169 .
西南民族大学经济学院

解:已知X~N(,102),n=25, 1- = 95%,z/2=1.96。根 据样本数据计算得: 105.36 x 总体均值在1-置信水平下的置信区间为
n 105.36 3.92
x z

2
105.36 1.96
10 25
101.44,109.28
一致性
(consistency)

一致性:随着样本容量的增大,估计量的值越来越接近被估计的 总体参数
ˆ P( )
较大的样本容量
B A
较小的样本容量

统计学原理
ˆ
西南民族大学经济学院
7.2 点估计
1.
用样本的估计量直接作为总体参数的估计值
例如:用样本均值直接作为总体均值的估计 例如:用两个样本均值之差直接作为总体均值之差的估计
西南民族大学经济学院
统计学原理

运用t分布进行区间估计:
x t.025
550 2.262
s n 60
10

550 + 42.92 $507.08 to $592.92
统计学原理
西南民族大学经济学院
总体比例的区间估计
总体比例的区间估计
1.
假定条件 总体服从二项分布 可以由正态分布来近似 使用正态分布统计量Z

数学建模十大算法总结

数学建模十大算法总结

建模十大算法总结:1、蒙特卡罗算法。

该算法又称随机性模拟算法,是通过计算机仿真来解决问题的算法,同时通过模拟可以来检验自己模型的正确性。

2、数据拟合、参数估计、插值等数据处理算法。

比赛中通常会遇到大量的数据需要处理,而处理数据的关键就在于这些算法,通常使用Matlab 作为工具。

3、线性规划、整数规划、多元规划、二次规划等规划类问题。

建模竞赛大多数问题属于最优化问题,很多时候这些问题可以用数学规划算法来描述,通常使用Lindo 、Lingo 、MATLAB 软件实现。

4、图论算法。

这类算法可以分为很多种,包括最短路、网络流、二分图等算法,涉及到图论的问题可以用这些方法解决,需要认真准备。

5、动态规划、回溯搜索、分治算法、分支定界等计算机算法。

这些算法是算法设计中比较常用的方法,很多场合可以用到竞赛中。

6、最优化理论的三大非经典算法:模拟退火法、神经网络、遗传算法。

这些问题是用来解决一些较困难的最优化问题的算法,对于有些问题非常有帮助,但是算法的实现比较困难,需慎重使用。

7、网格算法和穷举法。

网格算法和穷举法都是暴力搜索最优点的算法,在很多竞赛题中有应用,当重点讨论模型本身而轻视算法的时候,可以使用这种暴力方案,最好使用一些高级语言作为编程工具。

8、一些连续离散化方法。

很多问题都是实际来的,数据可以是连续的,而计算机只认的是离散的数据,因此将其离散化后进行差分代替微分、求和代替积分等思想是非常重要的。

9、数值分析算法。

如果在比赛中采用高级语言进行编程的话,那一些数值分析中常用的算法比如方程组求解、矩阵运算、函数积分等算法就需要额外编写库函数进行调用。

10、图象处理算法。

赛题中有一类问题与图形有关,即使与图形无关,论文中也应该要不乏图片的,这些图形如何展示以及如何处理就是需要解决的问题,通常使用Matlab 进行处理。

从历年竞赛题来看,常用的方法:线性规划 整数规划 非线性规划 动态规划 层次分析法 图论方法 拟合方法 插值方法 随机方法 微分方程方法一、蒙特卡洛算法1、含义的理解以概率和统计理论方法为基础的一种计算方法。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

对给定的置信水平1 ,确定分位数t (n 1)
使
P{ X S


n

t (n 1)}
1

P{ X t (n 1)
S }1
n
于是得到 的置信水平为 1 的单侧置
信区间为
[ X t (n 1)
S , ] n
即 的置信水平为 1 的单侧置信下限为
第六节 (0-1)分布参数的区间估计
设总体X~B(1,p), X1,X2,…,Xn 为一组简单样本,
n
由中心极限定理得
Xi np
i 1
近似服从
N (0, 1)
np(1 p)
φ(x)
α/2
α/2
-zα/2
zα/2
X
1-α
n
Xi np

P{ Z / 2

i 1
np(1
p)
P{ ˆ1} 1
则称区间 [ˆ1, )是 的置信水平为 1 的 单侧置信区间. ˆ1 称为单侧置信下限.
又若统计量 ˆ2 ˆ2( X1, X2, , Xn) 满足
P{ ˆ2 } 1
则称区间(,ˆ2 ]是 的置信水平为 1 的 单侧置信区间. ˆ2 称为单侧置信上限.
解 一级品率p是(0-1)分布的参数.
n 100, x 0.6, z /2 1.96
p的1-α置信区间: (0.5, 0.69)
第七节 单侧置信区间
设 是 一个待估参数,给定 0,
若由样本X1,X2,…Xn确定的统计量
ˆ1 ˆ1( X1, X2, , Xn) 满足
X t (n 1)
S n
将样本值代入得
的置信水平为0.95的单侧置信下限是
1065小时
例4 从一批灯泡中随机抽取5只作寿命试 验,测得寿命X(单位:小时)如下:
1050,1100,1120,1250,1280 设灯泡寿命服从正态分布. 求灯泡寿命均
值 的置信水平为0.95的单侧置信下限.
解: 的点估计取为样本均值 X
由于方差 2未知,取枢轴量
X ~ t(n 1)
Sn

Z / 2 } 1 .

(n

Z
2
/
2
)
p2

(2nX

Z
2
/2
)
p

nX
2

0
故p的置信度为1-α置信区间
1 ( (b
b2 4ac ), 1 (b
b2 4ac ))
2a
2a
其中
a

n

Z
2
/
2
,
b

(2nX

Z
2
/
2
),
c nX 2.
例1 设自一大批产品的100个样品中,得一级品 60 个 , 求 这 批 产 品 的 一 级 品 率 p 的 置 信 水 平 为 0.95的置信区间。
相关文档
最新文档