总体均值的置信区间

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
Sn
3. 总体均值 在1-置信水平下的置信区间为

x

t
2

S n
,
x
t
2
S n
2019/9/18
32
总体均值的区间估计 (2 未知实例)
【例3】从一个 正态总体中抽
取一个随机样 本, n = 25 , 其均值x = 50 ,标准差 s = 8 。 建立总体均
值 的 95% 的
1.概念
从总体中抽取一个样本,根据该样本的统计 量对总体的未知参数作出一个数值点的估计。
例如: 用样本均值作为总体未知均值的估计 值就是一个点估计。 2.点估计的方法:有矩估计法、顺序统计量法、 最大似然法、最小二乘法等。
优点:简单明确 缺点:不能说明估计结果的抽样误差和把握程 度。
2019/9/18
2 未知
方差
2019/9/18
26
落在总体均值某一区间内的样本
x - 3x
x -1.65 x
x +1.65x
x + 3 x
x -1.96 x
x +1.96x
90%的样本
95% 的样本
99.73% 的样本
2019/9/18
27
(三)置信水平 总体未知参数落在区间内的概率 表示为 (1 -
N=4。4 个个体分别为X1=1、X2=2、X3=3 、X4=4 。总体的 均值、方差及分布如下:
均值和方差
总体分布
N
Xi
.3
i1 2.5
2
N
.1
N
(Xi )2
2 i1
1.25
N
0 1 234
2019/9/18
12
现从总体中抽取n=2的简单随机样本,在重复 抽样条件下,共有42=16个样本。所有样本的结果 如下表
24
三、总体参数的区间估计
(一)区间估计的概念要点
1.根据一个样本的观察值给出总体参数的估计范围
2.给出总体参数落在这一区间的概率
3.例如: 总体均值在50~70之间,置信度为 95%
置信区间
样本统计量 (点估计)
2019/9/18
置信下限
置信上限
25
(二)区间估计的内容
置信区间
均值
比例
2 已知
教学难点:抽样调查的特点、抽样平均误差和
抽样极限误差的计算及误差范围和置信区间
教学学时:8学时
2019/9/18
1
统计推断的过程
总 体
2019/9/18
样本统计量


例如:样本
均值、比例
、方差
2
第一节 抽样调查
一、抽样调查的概念及特点
1.概念
(1)抽样调查:从所研究的总体中抽出 一部分单位,作为样本进行观察研究,以认 识总体的数量特征一种统计方法。
i 1
M
1.0 1.5 4.0 16
2.5
n
(xi x )2
2
i 1
x
M
(1.0 2.5)2 (4.0 2.5)2 0.625 2
16
n
式中:M为样本数目 比较及结论:
1. 样本均值的均值(数学期望)等于总体均值
2. 样本均值的方差等于总体方差的1/n
◆时间表抽样筐——将总体全部单位按照时间顺 序排列,把总体的时间过程分为若干小的时间单 位,以时间单位为抽样单位。如检测流水线上的 产品质量时以1分钟为一个抽样单位。
2019/9/18
8
第二节 抽样误差
一、抽样误差的概念
(一)抽样误差的性质
1.抽样误差
由于随机抽样的偶然因素使各单位的结构不足
以代表总体的结构而引起抽样指标与总体指标间
2019/9/18
15
1.抽样平均数的平均误差
(1)重复抽样
ห้องสมุดไป่ตู้
(x)
2

nn
(2)不重复抽样
(x) 2 ( N n) 2 (1 n )
n N 1 n N
2019/9/18
16
2.抽样成数的平均误差
(1)重复抽样
( p) P(1 P)
n
(2)不重复抽样
2019/9/18
20
第三节 简单随机抽样估计的方法
一、抽样估计的优良标准
同一个总体参数有多个样本估计量,究竟
哪一个才是最优估计量呢,常用以下三个标准
衡量:
1.无偏性:估计量的数学期望等于被估计
的总体参数
P( X )
无偏 有偏
A
C
2019/9/18

X 21
2.有效性:一个方差较小的无偏估计量称为
平均每天参加体育 锻 炼 的 时 间 为 26 分



x Z 2
n , x Z 2
n
钟 。 试 以 95 % 的 置 信水平估计该大学 全体学生平均每天 参加体育锻炼的时 间(已知总体方差
26 1.96
6 ,26 1.96 100
6 100

的绝对离差。
2.抽样调查中误差的来源
(1)登记性误差:可避免
(2)代表性误差 系统误差:非随机、可避免
随机性误差:可计算、控制
抽样估计中所指的误差主要指随机误差。
2019/9/18
9
(二)抽误误差的影响因素
1.样本容量:即样本单位数 2.总体差异程度 3.抽样方法 4.抽样组织形式
2019/9/18
所有可能的n = 2 的样本(共16个)
第一个
第二个观察值
观察值
1
2
3
4
1
1,1
1,2
1,3
1,4
2
2,1
2,2
2,3
2,4
3
3,1
3,2
3,3
3,4
4
4,1
4,2
4,3
4,4
2019/9/18
13
计算出各样本的均值,如下表。并给出样本均 值的抽样分布
16个样本的均值(x)
第一个
第二个观察值
观察值 1
置信区间。
解:已知X~N(,2),x=50, s=8,
n=25, 1- = 0.95,t/2=2.0639。

x

t
2

s n , x t 2
s n


50

2.0639

8 ,50 2.0639 25
8
25

46.69,53.3
我们可以95%的概率保证总体均值 在46.69~53.30 之间
一个更有效的估计量。如,与其他估计量相比,样 本均值是一个更有效的估计量。
P(X )
均值的抽样分布
B
A
中位数的抽样分布

X
2019/9/18
22
3.一致性:随着样本容量的增大,估计 量越来越接近被估计的总体参数。
较大的样本容量
P(X )
B
较小的样本容量
A

X
2019/9/18
23
二、总体参数的点估计
第六章 抽样推断
教学目的:①掌握抽样调查的概念特点、应用 范围;②理解、掌握抽样平均误差和抽样极限 误差的计算及误差范围和置信区间;③熟练掌 握简单随机抽样组织方式下如何利用样本指标 估计总体的平均指标和成数指标。④掌握假设 检验的一般问题
教学重点:抽样调查的特点、抽样平均误差和
抽样极限误差的计算及误差范围和置信区间
2
3
4
1 1.0 1.5 2.0 2.5
2 1.5 2.0 2.5 3.0
3 2.0 2.5 3.0 3.5
4 2.5 3.0 3.5 4.0
P(x)
3
2
1 0
1.0 1.5 2.0 2.5 3.0 3.5 4.0
x
样本均值的抽样分布
2019/9/18
14
所有样本均值的均值和方差
n
x

xi
2019/9/18
33
(五)总体比例的置信区间
1. 假定条件
– 两类结果 – 总体服从二项分布 – 可以由正态分布来近似
2. 使用正态分布统计量Z
Z p P ~ N (0,1) P(1 P)
n
3. 总体比例P 的置信区间为
p Z 2
我们可以95%的概率保证该种零件的平 均长度在21.302~21.498 mm之间。
水平为0.95。
2019/9/18
30
总体均值的区间估计
(非正态总体:实例)
【 例 2】 某 大 学 从 该 校 学 生 中 随 机 抽 取 解:已知 x=26, =6,n=100,
100人,调查到他们
1- = 0.95,Z/2=1.96
(二)抽样极限误差的计算
x X x; p P P
2019/9/18
18
(三)抽样误差的概率度
基于概率估计的要求,抽样极限误差通 常需要以抽样平均误差为标准单位来衡量。
极限误差除以抽样平均误差得到的相对 数称为概率度。用Z表示。
(四)抽样估计的置信度
指样本指标与总体指标误差不超过一定 范围的概率保证程度。抽样误差的概率就是 概率度Z的函数,即:
(2)非概率抽样
根据调查者的经验或判断,从总体中有意 识的抽取若干单位构成样本。如典型调查、重 点调查、方便(偶遇)抽样等。
2019/9/18
7
5.抽样筐
(1)定义:包括全体抽样单位的名单框架。
(2)形式:
◆名单抽样筐——列出全部总体单位的名录一览 表。如企业名单、居民名单、学生名单;
◆区域抽样筐——按地理位置将总体范围划分为 若干小区域,以小区域为抽样单位;
(2)抽样估计:根据样本分布的原理、 利用样本资料提供的信息对总体的某些数量 特征进行科学的估计或推断。
2019/9/18
3
2.特点 (1)根据部分实际资料对全部总体的数量特征 作出估计; (2)按随机原则从全部总体中抽取样本单位; (3)抽样误差可以事先计算并加以控制;
二、抽样调查的作用
1.对不可能进行全面调查现象进行抽样估计; 2.抽样调查可以节省人力物力,提高调查的经 济效益,又能够节省时间,提高调查的实效性。
x Z 2

n
, x Z 2

n
2019/9/18
29
总体均值的区间估计
【 例 1】 某 种 零 (正态总体:实例)
件长度服从正态
分布,从该批产 品中随机抽取9
解:已知X~N(,0.152),x=2.14, 1- = 0.95,Z/2=1.96
n=9,
件,测得其平均 总体均值的置信区间为
2019/9/18
4
三、抽样调查的几个基本概念
1.总体和样本
(1)总体 总体单位的总数称为总体容量(用N表示)。
(2)样本 从总体中抽取来代表总体的部分总体单位所
构成的整体。 样本单位的总数称为样本容量(用n表示)。 种类:大样本 小样本
2019/9/18
5
2.总体参数和样本指标
(1)总体参数(总体指标)
10
二、抽样平均误差
(一)抽样平均误差的概念
所有可能样本的估计值与相应总体参数 的标准差,反映样本估计值与其中心的平均 离散程度。
(二)抽样平均误差的计算公式
(ˆ)
(ˆ )2
M (样本个数)
2019/9/18
11
样本均值的抽样分布
(一个例子)
【例】设一个总体,含有4个元素(个体),即总体单位数
为显著性水平,是总体参数未在区间内的概率。
2019/9/18
28
(四)总体均值的区间估计 (2已知)
1. 假定条件
– 总体服从正态分布,且总体方差(2)已知 – 如果不是正态分布,可以由正态分布来近似 (n 30)
2. 使用正态分布统计量Z
Z x ~ N (0,1) n
3. 总体均值 在1-置信水平下的置信区间为
P( x X Z (x)) F(Z)
2019/9/18
19
Z /2 1; F (Z /2 ) 68.27%; Z /2 1.96; F (Z /2 ) 95%; Z /2 2; F (Z /2 ) 95.45%; Z /2 3; F (Z /2 ) 99.73%
( p) P(1 P) ( N n ) P(1 P) (1 n )
n N 1
n
N
例:从40000件产品中随机抽取200件进
行检查,结果有10件不合格。求合格率的抽
样平均误差?
2019/9/18
17
三、抽样极限误差
(一)概念
又称允许误差。指样本指标与总体指标 之间产生抽样误差被允许的最大可能范围。
如 (或记为 X )、P、 等。
(2)样本指标(估计量或样本统计量) 如 x 、p、s 等。
3.重复抽样和不重复抽样
(1)重复抽样(回置抽样) (2)不重复抽样(不回置抽样)
2019/9/18
6
4.概率抽样与非概率抽样
(1)概率抽样
基本的组织方式有:整群抽样、分层抽样、 等距抽样、简单随机抽样。
长 度 为 21.4 mm



x Z 2 n , x Z 2 n
。已知总体标准
差 =0.15mm ,


21.4
1.96
0.15 9
,21.4
1.96
0.15 9

试估计该种零件 21.302,21.498
平均长度的置信 区间,给定置信
24.824,27.176
我们可以95%的概率保证平均每天 参加锻炼的时间在24.824~27.176
为36分钟)。
分钟之间。
2019/9/18
31
总体均值的置信区间 (2 未知)
1. 假定条件
– 总体方差(2)未知 – 总体必须服从正态分布
2. 使用 t 分布统计量
t x ~ t(n 1)
相关文档
最新文档