§7-1 已知方差的均值区间估计
区间估计及运算
查表,得到
整理课件
13
由公式,
得,总体均值μ的置信度为90%的置信区间 为
于是可以说,我们有90%的把握确信,寿险 投保人总体的平均年龄介于37.37到 41.63
岁之间。
整理课件
14
1.从正态总体中抽取样本,且总体方差已知, 均值μ的区间估计
(2)在不重复抽样的条件下,置信区间为
X Z
2
n
N n N 1
的置信度为1-α的置信区间。
整理课件
54
四、简单随机抽样和等距抽样的参数估计
(三)一个总体比例的区间估计
整理课件
55
在许多实际应用中,经常会遇到总体比例的 估计问题。例如:企业的管理人员想了解 一批产品中次品的比例;职工收入中工资 外收入所占的比例;某高校学生参加英语 四级考试的通过率;某地区绿化荒山新栽 树木的成活率等。
整理课件
8
1.从正态总体中抽取样本,且总体方差已知,
均值μ的区间估计
(1)重复抽样的条件下
设
, 已知,
为来自总体的容
量为n的简单随机样本,则 的抽样分布为
整理课件
9
在重复抽样的方式下,总体均值μ的置信度 为1-α的置信区间为
其中, 是标准正态分布α水平的双侧分位数。
整理课件
10
整理课件
11
例一:
信区间。 称为置信区间的置信度,也称
置信概率、置信系数或置信水平, 称为置
信下限, 称为置信上限。
整理课件
6
三、置信区间的含义
若独立地反复多次抽取容量相同的简单随机样本,每一个样
本都确定一个随机区间
,在这些区间中,包含总体
参数 真值的约占
区间估计ppt课件
极端值处理问题
剔除极端值
在数据分析前,对极端值进行识别和处理,如采用箱线图、Zscore等方法剔除异常值。
转换数据
对数据进行适当的转换,如对数转换、平方根转换等,使极端值的 影响减小。
使用稳健统计量
采用对极端值不敏感的稳健统计量进行区间估计,如中位数、截尾 均值等。
多重比较问题
控制比较次数
在实验设计和数据分析阶段,合理控制比较次数,避免不必要的 多重比较。
02
抽样分布与中心极限定理
抽样分布概念及类型
抽样分布概念
从总体中随机抽取一定数量的样本,统计量的分布称为抽样分布。
常见抽样分布类型
正态分布、t分布、F分布、卡方分布等。
中心极限定理内容及应用
中心极限定理内容
当样本量足够大时,无论总体分布如何,样本均值的分布将近似于正态分布。
中心极限定理应用
在统计学中,中心极限定理是推断统计的理论基础,常用于区间估计、假设检验 等。
构造方法
根据样本均值、标准差和样本量,结 合正态分布或t分布的性质,可以构造 出总体均值的置信区间。
比例p置信区间构建方法
二项分布与比例估计
01
当总体服从二项分布时,样本比例是总体比例的一个良好估计
量。
置信区间的构造
02
利用样本比例、样本量和二项分布的性质,可以构造出总体比
例的置信区间。
注意事项
03
配对样本t检验原理及应用
原理
配对样本t检验是通过比较同一组样本在不同条件下的均值差异来检验两个总体均值是否存在显著差 异的方法。其原假设为两个总体均值相等,备择假设为两个总体均值不等或大于/小于另一个总体均 值。
应用
配对样本t检验适用于前后测量、两种处理方法等配对设计的数据分析。例如,在医学领域,可以通过 配对样本t检验来比较同一种药物在不同剂量下的疗效差异;在教育领域,可以通过配对样本t检验来 比较同一种教学方法在不同班级中的教学效果差异。
第五节 正态总体均值与方差的区间估计
t 2 (n 1)
得EX的区间估计为
X
S n
t
2
(n
1)
,
X
S n
t
2
(n
1)
小结
数理统计
总体服从正态分布的均值或方差的区间估计
假设置信水平为1-
(3)均值已知,对方差的区间估计
解
计算
6
xi 2 2931
i 1
查表 2 (6) 1.24, 2 (6) 14.45
10.05 2
0.05 2
果树方差的置信区间为
2931 14.45
,
2931 1.24
202.84,
2363.71
2. 均值未知方差 σ 2的置信区间
数理统计
构造2-统计量,查2-分布临界值表,确定2的双侧分位数
2 (n), 2 (n)
1 2
2
得2的区间估计为
n
Xi 2
i1
,
2 (n)
2
n
Xi
2
i 1
2 (n)
1 2
小结
数理统计
总体服从正态分布的均值或方差的区间估计
506 508 499 503 504 510 497 512
514 505 493 496 506 502 509 496 设袋装糖果的重量近似地服从正态分布,试求总体
标准差 σ 的置信水平0.95为的置信区间.
7.4 (正态总体均值与方差的区间估计)
,
计算得到灯泡平均使用寿命µ 的90%、95%及99%的 、 及 的 置信区间分别为(1479.15,1500.85)、(1476.80,1503.20) 置信区间分别为 、 其长度分别为21.7,26.4和36.48. 和(1471.76,1508.24),其长度分别为 其长度分别为 和 . 可以看出置信水平越高,置信区间的长度越长. 可以看出置信水平越高,置信区间的长度越长.
( n − 1) S 2 2 = ~ χ (n − 1) σ2
Xi − X 作为枢轴量 作为枢轴量. σ i =1
n 2
所以, 所以,可以取 χ 2 = ∑
已知的情形, 的一个信水平为1– 类似µ 已知的情形,容易得到σ2的一个信水平为 α n 的置信区间为 n 2 2 即
计.
(一)
正态总体均值的区间估计
1. σ2已知时,µ 的置信区间 已知时,
X −µ ~ N (0, 1) 的无偏估计, 由于 X 是µ 的无偏估计,且有 σ/ n 容易想到将 Z = X − µ 作为求µ 的置信区间的枢轴 σ/ n
量. 对给定的置信水平1 对给定的置信水平1 – α, 由右图易知
X −Y ± z α 2
1
n1
+
n2
2
两正态总体均值差的区间估计 说明: 说明 实际应用中两个总体方差的信息往往是未知的, 实际应用中两个总体方差的信息往往是未知的 在两个样本容量都比较大的情况下(n 在两个样本容量都比较大的情况下 1,n2≥ 30),一 , 般采用两个样本方差S 近似代替σ 般采用两个样本方差 12和S22近似代替σ12和σ22,于 的一个置信水平为 是,µ1 – µ2的一个置信水平为1 – α 的置信区间可 以由
概率论第七章参数估计2区间估计
2 / 2 ( n 1)
即
置信区间:
标准差σ的一个置信水平为 1 的置信区间
2 (n 1) S , 2 (n 1) 2
(n 1) S 2 1 (n 1) 2
2
注意:在密度函数不对称时,如 2分布和F 分布,
置信度 1 下,来确定 的置信区间[ , ]
⑴ 已知方差 ,估计均值μ
2
n 1 2 设已知方差 2 0 ,且 X X i 是 的 n i 1 一个无偏点估计,
又
X ~ N (0 , 1) 0 / n
且 对于给定的置信度 查正态分布表,找出
临界值
使得:
2 1 2 2
一个无偏估计, 因为X与Y 相互独立,所以
X Y ~ N ( 1 2 ,
X Y ( 1 2 )
2 1
n1
2 2
n2
)
2 1
n1 n2 所以 1 2 的置信水平为1-α的置信区间为
2 2
~ N (0,1)
( X Y z / 2
已知
由样本值算得:
查表 t0.025 (6) 2.447
得区间:
对某种型号飞机的飞行速度进行15次试验, 测 例 5: 得最大飞行速度(单位: 米/秒)为 422.2, 417.2, 425.6 420.3, 425.8, 423.1, 418.7, 438.3, 434.0, 412.3, 431.5 413.5, 441.3, 423.0, 428.2, 根据长期经验, 可以认为 最大飞行速度服从正态分布. 求飞机最大飞行速度
第三节 区间估计 譬如,在估计湖中鱼数的问题中,若 我们根据一个实际样本,得到鱼数 N 的极 大似然估计为1000条.
区间估计的基本原理
职员
时间
职员
时间
职员
时间
1
52
6
2
44
7
3
55
8
4
44
9
5
45
10
59 50 54 62 46
11 12 13 14 15
54 58 60 62 63
根据上述资料建立置信度为95%的总体均值的区间估计。
(假定培训时间总体服从正态分布)。
16
STAT
解:依题意,总体服从正态分布,n=15(小样本),此时
差作为 的估计值。 (3)运用对 值的判断或者“最好的猜测”,例如,通常可用 全距的作为 的近似值。
20
STAT
7.4总体比例的区间估计
7.4.1区间估计
p 对总体比例 的区间估计在原理上与总体均值的区间估计相
同。同样要利用样本比例 p 的抽样分布来进行估计。 若,n 30, np 5, n(1 p) 5 则样本比例近似服从正态分布。
2
可得
n
(Z
2
)2
E
2 2
1.96 2 9.652 22
89.43
将以上结果取下一个整数(90)即为必要的样本容量。 19
STAT
说明:
由于总体标准差 在大多数情况下 是未知的,可以有以 下方法取得 的值。
(1)使用有同样或者类似单元的以前样本的样本标准差; (2)抽取一个预备样本进行试验性研究。用实验性样本的标准
2
抽样误差
x
Z 2
x
1.96 x
1.96 2
3.92
此时抽样误差的意义可表述为:以样本均值为中心的±3.92
正态分布总体 总体均值已知 方差的置信区间
如何确定正态分布总体均值已知的方差的置信区间在统计学中,置信区间是一种用来估计参数真实值范围的方法。
当我们知道总体均值,但方差未知时,我们需要确定正态分布总体总体均值已知的方差的置信区间。
在本文中,我将以从简到繁的方式来探讨这个主题,让您能更深入地理解。
1. 正态分布总体的概念让我们简要回顾一下正态分布总体的概念。
正态分布是最为常见的概率分布之一,其特点是呈钟形曲线,均值和标准差决定了曲线的中心位置和宽度。
在统计学中,我们常常使用正态分布来描述连续型随机变量的分布情况。
2. 总体均值已知的情况当我们已经知道正态分布总体的均值时,我们可以通过样本来估计总体的方差。
我们可以利用样本方差来估计总体方差,然后构建置信区间来确定总体方差的范围。
3. 方差的置信区间估计为了确定正态分布总体均值已知的方差的置信区间,我们可以利用卡方分布来进行估计。
卡方分布是一种特殊的概率分布,用于描述正态分布总体方差的抽样分布。
通过卡方分布的性质,我们可以构建出方差的置信区间,从而对总体方差做出估计。
4. 个人观点和理解在我的个人观点中,确定正态分布总体总体均值已知的方差的置信区间是统计学中非常重要的一部分。
这不仅可以帮助我们对总体方差进行估计,还可以为我们后续的推断统计提供重要的依据。
通过合理地构建置信区间,我们可以更准确地对总体参数进行推断,并且可以对我们的结论进行更加可靠的评估。
总结通过本文的阐述,我们可以深刻理解确定正态分布总体总体均值已知的方差的置信区间的方法。
我们需要对正态分布总体及其性质有一个清晰的认识。
我们可以利用样本数据来对总体方差进行估计,并且通过卡方分布来构建置信区间。
我也共享了我个人的观点和理解,希望可以为您对这个主题提供更多的思考。
在知识的文章格式中,可以使用序号标注来清晰地展示每个步骤的逻辑关系。
我希望本文的内容能够帮助您更好地理解正态分布总体总体均值已知的方差的置信区间的确定方法。
在统计学中,确定正态分布总体均值已知的方差的置信区间是一项重要的任务。
总体方差的区间估计例题
总体方差的区间估计例题
摘要:
1.总体方差的区间估计概念
2.区间估计的基本原理
3.计算总体方差区间估计的例题
4.例题解析
正文:
一、总体方差的区间估计概念
总体方差是指一个总体的所有观测值的离差平方和的平均值。
总体方差的区间估计,就是在没有给出总体方差的确切值的情况下,通过对样本数据的分析,得到一个包含总体方差真实值的区间范围。
二、区间估计的基本原理
区间估计是基于抽样分布理论的一种统计推断方法。
其基本原理是:由样本数据计算出某个统计量的抽样分布,然后根据这个分布的性质,确定出一个包含总体参数真实值的区间范围。
三、计算总体方差区间估计的例题
假设我们有一个包含n 个观测值的样本,其均值为μ,标准差为σ,我们要估计总体方差。
根据中心极限定理,样本均值的分布近似于正态分布,其方差为总体方差除以n。
因此,我们可以通过构建一个包含样本均值和标准差的区间,来估计总体方差。
具体的计算公式为:
方差区间= [μ- z*σ, μ+ z*σ]
其中,z 是标准正态分布的分位数,对应于1-α的置信水平。
α是显著性水平,一般取0.05。
四、例题解析
假设我们有一个包含5 个观测值的样本,其均值为10,标准差为3,我们要估计总体方差。
首先,计算z 值,对应于1-α=0.95 和n=5,查表得到z=1.96。
概率论与数理统计(叶慈南 刘锡平 科学出版社)第7章 参数估计教程
估计 θ ,故称这种估计为点估计.
5 6
,σ 2未知,
… 随机抽查100个婴儿 得100个体重数据 10,7,6,6.5,5,5.2, …
而全部信息就由这100个数组成. 据此,我们应如何估计 和 σ 呢?
我们知道,服从正态分布N ( , σ 2 )的r.v. X , E ( X ) = , 由大数定律, 样本体重的平均值 1 → ∑ X i P n i =1 自然想到把样本体重的平均值作为总体平均 体重的一个估计. X= 用样本体重的均值 X估计 , 类似地,用样本体重的方差 S 2估计 σ 2 . 1 n 1 n 2 X = ∑ Xi, S = ∑ ( X i X )2 n 1 i =1 n i =1
(一)矩估计法
基本思想:用样本矩估计总体矩
(二)最大似然估计法
基本思想:
15
16
最大似然估计法 (最大似然法)
它首先是由德国数学家 高斯在1821年提出的 , 然而,这个方法常归功于 英国统计学家费希尔(Fisher) . 费希尔在1922年重新发现了 这一方法,并首先研究了这 种 方法的一些性质 . Fisher
1. 矩估计法 2. 最大似然法 3. 最小二乘法 4. 贝叶斯方法 ……
(一) 矩估计法(简称"矩法")
它是基于一种简单的"替换"思想 建立起来的一种估计方法 . 英国统计学家 K. 皮尔逊 最早提出的 . 基本思想: 用样本矩估计总体矩 . 理论依据: 大数定律
Ak = 1 n k P ∑ X i → k = E ( X k ) n i =1
4
在参数估计问题中,假定总体分布 形式已知,未知的仅仅是一个或几个 参数.
正态总体均值及方差的区间估计
第十九讲 正态总体均值及方差的区间估计1. 单个正态总体方差的区间估计设总体),(~2σμN X , ),,(21n X X X 为来自X 的一个样本,已给定置信度(水平)为α-1,求2σ的置信区间。
①当μ已知时,由于),(~2σμN X i ,因此,)1,0(~N X i σμ-(,2,1=i n , )。
由2χ分布的定义知:∑=-ni i n X 1222)(~)(χσμ,据)(2n χ分布上α分位点的定义,有:αχσμχαα-=<-<∑=-1)}()()({21222122n X n P ni i从而αχμσχμαα-=⎪⎪⎭⎪⎪⎬⎫-<<⎪⎪⎩⎪⎪⎨⎧--=-∑∑1)()()()(2112221222n X n X P ni i ni i 故2σ的置信度为α-1的置信区间为:⎪⎪⎪⎪⎭⎫ ⎝⎛---==∑∑)()(,)()(211221222n X n X ni i n i i ααχμχμ ②当μ未知时,据抽样分布有:)1(~)1(222--n S n χσ类似以上过程,得到第七章 参数估计第5节 正态总体均值及方差的区间估计单个正态总体均值的区间估计 ①当2σ已知时,μ的置信水平为α-1的置信区间为:⎪⎪⎭⎫ ⎝⎛±2ασz n X (5.1) ②当2σ未知时,μ的置信水平为α-1的置信区间为⎪⎪⎭⎫ ⎝⎛-±)1(2n t n SX α.(5.4)注意:当分布不对称时,如2χ分布和F 分布,习惯上仍然取其对称的分位点,来确定置信区间,但所得区间不是最短的。
αχσχαα-=⎪⎭⎪⎬⎫⎪⎩⎪⎨⎧--<<---1)1()1()1()1(21222222n S n n S n P 2σ的置信度为α-1的置信区间为:⎪⎪⎭⎫⎝⎛-----)1()1(,)1()1(2122222n S n n S n ααχχ σ的置信度为α-1的置信区间为:⎪⎪⎪⎭⎫ ⎝⎛-----)1()1(,)1()1(2122222n S n n S n ααχχ 例2 有一大批袋装糖果, 现从中随机地取出16袋, 称得重量(以克计)如下:506 508 499 503 504 510 497 512 514 505 493 496 506 502 509 496 设袋装糖果的重量近似地服从正态分布, 求总体标准差σ的置信水平为0.95的置信区间.解:总体均值μ未知,σ的置信度为α-1的置信区间为:⎪⎪⎪⎭⎫ ⎝⎛-----)1()1(,)1()1(2122222n S n n S n ααχχ 此时,,975.021,025.02,05.0=-==ααα16=n ,查表得,488.27)15(025.0=χ,262.6)15(975.0=χ由给出的数据算得.4667.382=s 因此,σ的一个置信度为0.95的置信区间为(4.58,9.60).2. 两个正态总体均值差的区间估计设总体),(~),,(~222211σμσμN Y N X ,且X 与Y 相互独立,),,(21m X X X 来自X 的一个样本,),,,(21n Y Y Y 为来自Y 的一个样本,且设2221,,,S S Y X 分别为总体X 与Y 的样本均值与样本方差,对给定置信水平α-1,求21μμ-的一个置信区间。
正态总体均值与方差的区间估计
2
2
例7
为比较І, ІІ两种型号步枪子弹的枪口速度,
随机地取І型子弹10发, 得到枪口速度的平均值为
x1 500(m / s),标准差 s1 1.10(m / s), 随机地取ІІ 型子弹20发, 得枪口速度平均值为 x 2 496(m / s),
标准差 s2 1.20(m / s), 假设两总体都可认为近似
代入公式得标准差的置信区间 (4.58, 9.60 ).
例6
(续例1) 求例1中总体方差 2 和标准差 的
n 1 11,
置信度为0.95的置信区间. 0.025, 1 0.975, 解 2 2
查 2 ( n 1) 分布表可知:
2 0 .025 (11) 21.920,
2
个总体 N ( 2 , 2 )的样本, X ,Y 分别是第一、二个
2
总体的样本均值 , S1 , S2 分别是第一、二个总体 的样本方差.
讨论两个整体总体均值差和方差比的估计问题.
2
2
1. 两个总体均值差1 2 的置信区间
(1) 1 和 2 均为已知
2 2
1 2的一个置信度为1 的置信区间
2 0 .975 (11) 3.816,
方差 2 的置信区间 (78.97, 453.64);
标准差 的置信区间 (8.87 , 21.30 ).
二、两个总体 N ( 1 , ), N ( 2 , ) 的情况
2 1 2 2
设给定置信度为 1 , 并设 X 1 , X 2 ,, X n 为 第一个总体N ( 1 , 1 )的样本, Y1 ,Y2 ,,Yn 为第二
2 2 1 2 X Y z / 2 . n n 1 2
区间估计
38第二节 区间估计一、区间估计的概念和步骤点估计用一个确定的值去估计未知的参数,具有较大的风险。
因为估计量来自于一个随机抽取的样本,结果也就带有随机性。
样本估计量刚好等于所估计的总体参数的可能性极小。
但是如果说所估计的总体参数就落在估计值附近,即所估计的总体参数就落在以点估计所得到的估计值为中心的某一个小区间内,那就比较有把握了。
这种方法就是区间估计法。
在第四章中我们已经知道,一个足够大样本的均值的抽样分布是正态的,并且所抽到的样本均值落在总体均值的两侧x σ±范围内的概率是0.683,落在总体均值±2σx 范围内的概率是0.955,落在总体均值3±σx 范围内的概率是0.997等等。
由此可见,我们可以按照概率来估计总体均值是落在某一区间范围内的。
我们把这种对总体均值的估计称作区间估计。
从上述说明可以看到:1. 如果所估计的区间越大,参数被包含在该区间内的概率就越大。
2. 如果样本的方差越小,则在相同的概率下区间估计所得到的结果就越短。
一般地,设θ为总体的一个未知参数,θθ12,分别为由一组样本所确定的对θ的两个估计量,对于给定的10<<α,若P(θθθ12≤≤)=1-α,则称区间[θθ12,]为置信度是1-α的置信区间。
θθ12,分别为置信区间的下限和上限。
1-α称为置信度或置信概率,表示区间估计的可靠度。
α称为置信度水平。
常用的置信度有 0.80,0.90,0.95 0.99等。
一般来说,对于估计要求比较精确的问题,置信程度也要求高一些,在社会经济现象中,通常采用95%就可以了。
置信度反过来也表示可能犯错误的概率。
如置信度为95%,则犯错误的概率就为1-95%=5%。
这一概率也就是置信度水平α,也可理解为风险率或风险水平。
图5-2 根据不同样本所得到的置信度为95.5%的置信区间39需要指出的是,P(θθθ12≤≤)=1-α不应理解为θ落在某一固定区间的概率。
概率论区间估计
解 由题设可知:口杯的重量X~N(,2)
由抽取的9个样本,可得
S 0.18 x 21.4 n 9
由 1 0.95 得 0.05 查表得 t0.025 (8) 2.306
t 2 (8)
S 2.306 0.18 0.13836
n
9
全部口杯的平均重量的置信区间为(21.26,21.54)
例2 假定某地一旅游者的消费额X服从正态分布 N(,2),且标准差=12元,今要对该地旅游者的平 均消费额EX加以估计,为了能以95%的置信度相信这种 估计误差小于2元,问至少要调查多少人?
解 由题意知:消费额X~N(,122),设要调查n人。
由 1 0.95 得 0.05 查表得
构造T-统计量,查t-分布临界值表, 确定T的双侧分位数
得EX的区间估计为
t 2 (n 1)
X
S n
t
2
(n
1)
,
X
S n
t
2
(n
1)
小结
总体服从正态分布的均值或方差的区间估计 假设置信水平为1-
(3)均值已知,对方差的区间估计
构造2-统计量,查2-分布临界值表, 确定2的双侧分位数
得2的区间估计为
2 (n), 2 (n)
1 2
2
n
Xi 2
i1
,
2 (n)
2
n
Xi
2
i 1
2 (n)
1 2
小结
总体服从正态分布的均值或方差的区间估计 假设置信水平为1- (4)均值未知,对方差的区间估计
正态分布总体均值和方差的区间估计
2
的置信区间是
x
1.96
n
, x1.96
n
0.01时, z1 z0.995 2 的置信区间是
2.58
x
2.58
n
,
x
2.58
n
比较可知 越大,则 1 越小,置信区间越小,
落在区间内的把握也就越小。
因此,在实际应用中,要适当选取
常取 值: 0.05, 0.01, 0.10
1
2
n
s 用样本方差 2 来代替总体方差 2
x
1 n (x1 U
x2 xn )
x
~
N (0,1)
~
N(, 2
n
)
n
s 2 1
n
(x x)2
n 1 i i 1
V (n 1) s 2 ~ 2 (n 1) 2
U与V独立, 统计量
T x U ~ t(n 1)
s/ n V (n 1)
设总体 X ~ N (, 2 ), 其中 2 已知.
x , x ,, x 为来自于总体的样本。
1
2
n
x
1 n
( x1
xn )
~
N(, 2
n
)
U x ~ N (0,1) / n
对于给定的 , 可以找到一个数 z1 , 2
使 P{| U | z } 1 1 2
即
P
x
/
n
z 1 2
1
P
对于给定的 , 查t分布表可得临界值
t (n 1), 使得
1 2
P T t (n 1) 1
1 2
2
P T
t 1 2
(n
1)
参数估计第二讲区间估计、正态总体均值与方差的区间估计
第二讲区间估计、正态总体均值与方差的区间估计Ⅰ.授课题目(章节)§7.4区间估计§7.5正态总体均值与方差的区间估计 Ⅱ.教学目的与要求1. 理解置信区间的基本概念;2. 掌握正态总体均值和方差的置信区间的求法. Ⅲ.教学重点与难点:重点:置信区间的基本概念的理解难点:正态总体均值和方差在给定置信水平条件下的置信区间的求法 Ⅳ.讲授内容:§7.4区间估计对于一个未知量,人们在测量或计算时,常不以得到近似值为满足,还需估计误差,即要求知道近似值的精确程度(亦即所求真值所在的范围).类似地,对于未知参数θ,除了求出它的点估计θˆ外,我们还希望估计出一个范围,并希望知道这个范围包含参数θ真值的可信程度,这样的范围通常以区间的形式给出,同时还给出此区间包含参数θ真值的可信程度.这种形式的估计称为区间估计,这样的区间即所谓置信区间. 置信区间 设总体X 的分布函数);(θx F 含有一个未知参数θ,,Θ∈θ(Θ是θ可能取值的范围),对于给定值α)10(<<α,若由来自X 的样本1X ,n X X ,,2 确定的两个统计量θ=θ(1X ,n X X ,,2 )和θ=θ(1X ,n X X ,,2 )(θθ<),对于任意Θ∈θ满足P {θ(1X ,n X X ,,2 )<<θθ(1X ,n X X ,,2 )α-≥1},则称随机区间(θ,θ)是θ的置信水平为α-1的置信区间,θ和θ分别称为置信水平为α-1的双侧置信区间的置信下限和置信上限,α-1称为置信水平.例 1.设总体设X ~N (μ,2σ),2σ为已知,μ为未知,设1X ,n X X ,,2 是来自X 的样本,求μ的置信水平为α-1的置信区间.解 X 是μ的无偏估计,且有nX /σμ-~N (0,1).nX /σμ-所服从的分布N (0 ,1)不依赖于任何未知参数,按标准正态分布的上α分位点的定义,有⎭⎬⎫⎩⎨⎧<-2//ασμz n X P =α-1, 即 ⎭⎬⎫⎩⎨⎧+<<-2/2/αασμσz n X z n X P =α-1.这样,我们得到了μ的一个置信水平为α-1的置信区间⎪⎪⎭⎫⎝⎛+-2/2/,αασσz n X z n X . 这样的置信区间常写成⎪⎪⎭⎫ ⎝⎛±2/ασz n X .通过例1,可以看到寻求未知参数θ的置信区间的具体做法如下.1.寻求一个样本1X ,n X X ,,2 的函数:) ;X ,,X ,X (n 21θ W W =,它包含待估参数θ,而不含其它未知参数,并且W 的分布已知且不依赖于任何未知参数(当然不依赖于待估参数θ);2.对于给定的置信水平α-1,定出常数b a ,,使<a P {) ;X ,,X ,X (n 21θ W }b < ≥α-1;3.若能从<a ) ;X ,,X ,X (n 21θ W b <得到等价的不等式θθ<θ<,其中θ=θ(1X ,n X X ,,2 ),θ=θ(1X ,n X X ,,2 )都是统计量,那么(θ,θ)就是θ的一个置信水平为α-1的置信区间.§7.5正态总体均值与方差的区间估计一、单个总体N (μ,2σ)的情况设已经定置信水平为α-1,并设1X ,n X X ,,2 为总体N (μ,2σ)的样本.X ,S 2分别是样本均值和样本方差。
§7-1 已知方差的均值区间估计
§7—1 已知方差的均值区间估计
五、假设检验与区间估计的关系 若均值的一个置信水平为的置信区间为:则对 假设:的检验法就是:若在区间上,就接受; 否则就否定。这时的检验水平即为。 已知方差对均值的假设检验问题,与已知方差 对均值的区间估计问题,形式上虽然不同,但 它们的统计思想是相通的。
§7—1 已知方差的均值区间估计
§7—1 已知方差的均值区间估计
(1)构造统计量,并确定其分布: (2)对给定的概率,查正态分布表知 其中=是根据需要选定的,是在选定后查正态 = 分布表所得到的。一般不能过大。 (3)因为,从而 解出 得:这就是说: 值包含在区间内的概率为 (4)当作一次具体的抽样,得到一组样本值 后,以代入上式,得到区间 ,可以认为总体均 值在
几个常用的置信水平及对应的临界值和置信区 间如下: 间如下: 置信水平临界值置信区间例1 某厂生产滚珠, 从长期实践知道,滚珠直径X可认为服从正态 X 分布,从某天的产品里随机抽取6个,量得直 径如下(单位:mm): 如果知道该天的产品直径的方差是,试求平均 直径的置信区间。(=)
六、归纳小结 1.已知方差估计均值的基本思想方法 2.置信水平、临界值和置信区间 3.已知方差估计均值的程序 4.假设检验与区间估计的关系
§7—1 已知方差的均值区间估计
一、复习引入 1.点估计 2.假设检验的方法和程序
§7—1 已知方差的均值区间估计
二、已知方差估计均值的基本思想方法 引例: 引例: 从长期的生产实践知道,某厂生产的灯泡的 使用寿命 , 现从该厂生产的一批灯泡中随机抽取5只,测得使用寿 命如下: 试对这批灯泡的平均使用寿命作区间估计。 样本均值的观测值 这就是对总体均值的点估计 但只是的近似值,的真值是未知的。 我们希望给出一个区间,使得这个区间能够按足够大 的概率(比如)包含总体均值。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
一、复习引入 1.点估计 2.假设检验的方法和程序
§7—1 已知方差的均值区间估计
二、已知方差估计均值的基本思想方法 引例: 引例: 从长期的生产实践知道,某厂生产的灯泡的 使用寿命 , 现从该厂生产的一批灯泡中随机抽取5只,测得使用寿 命如下: 试对这批灯泡的平均使用寿命作区间估计。 样本均值的观测值 这就是对总体均值的点估计 但只是的近似值,的真值是未知的。 我们希望给出一个区间,使得这个区间能够按足够大 的概率(比如)包含总体均值。
§7—1 已知方差的均值区间估计
(1)构造统计量,并确定其分布: (2)对给定的概率,查正态分布表知 其中=是根据需要选定的,是在选定后查正态 = 分布表所得到的。一般不能过大。 (3)因为,从而 解出 得:这就是说: 值包含在区间内的概率为 (4)当作一次具体的抽样,得到一组样本值 后,以代入上式,得到区间 ,可以认为总体均 值在该区间了。
§7—1 已知方差的均值区间估计
三、置信水平、临界值和置信区间 置信水平、 从引例可知,区间表达了估计的精确度,概率表达了估计的可靠 程度。 称区间为的置信区间。 置信区间。 置信区间 称概率为为的置信水平 置信水平(或叫置信度)。 置信水平 由所确定的称为置信水平为时的临界值 临界值。 临界值 置信水平通常用表示,不一定选取。通常选取=、、。对于不同 的置信水平,可确定不同的临界值,从而得到不同的置信区间。 注意: 注意: 总体均值虽然未知,但它是一个常量。由于样本是随机抽取的, 观测值不同,置信区间也不同,所以置信区间也是随机的,它以 很大的概率()包含了总体均值。 置信区间的长度越小,估计越精确;置信水平越大,估计越可 靠。我们希望:估计的范围要小,而可靠性要大。但对固定样本 容量来说,这是办不到的。如果不降低可靠性,而缩小估计范围, 那么就只有增大样本容量。
六、归纳小结 1.已知方差估计均值的基本思想方法 2.置信水平、临界值和置信区间 3.已知方差估计均值的程序 4.假设检验与区间估计的关系
§7—1 已知方差的均值区间估计
五、假设检验与区间估计的关系 若均值的一个置信水平为的置信区间为:则对 假设:的检验法就是:若在区间上,就接受; 否则就否定。这时的检验水平即为。 已知方差对均值的假设检验问题,与已知方差 对均值的区间估计问题,形式上虽然不同,但 它们的统计思想
§7—1 已知方差的均值区间估计
四、已知方差估计均值的程序 已知正态总体的方差,估计总体均值 的程序: 1.构造统计量,并确定其分布: 2.对给定 的置信水平,由 查正态分布表得临界值(实际 由来查) 3.由解出得:从而得到置信区间:4.根据已 知的样本值,先计算,再得到置信区间。 实际计算统计量U的观测值得:
§7—1 已知方差的均值区间估计
几个常用的置信水平及对应的临界值和置信区 间如下: 间如下: 置信水平临界值置信区间例1 某厂生产滚珠, 从长期实践知道,滚珠直径X可认为服从正态 X 分布,从某天的产品里随机抽取6个,量得直 径如下(单位:mm): 如果知道该天的产品直径的方差是,试求平均 直径的置信区间。(=)