第三章抽样误差与假设检验详解演示文稿
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
X
2
n
2
Z Z 即
X
2
X
n
2 n
写成区间形式:
(X
Z
2
n
,X
Z
2
)
n
(2)σ未知,但足够大: Z
2
X s
n
Z
2
可信区间为:
(X Z 2
Z s
,X n
2
s) n
同理,单侧可信区间为:
X Z
n
或
X Z
s n
Z
X n
Z 或
s X n
2.σ未知,且n (n<50)不够大时,按t分布原
(三)、抽样误差的分布
理论上可以证明:若从正态总体 N(, 2) 中,反 复多次随机抽取样本含量固定为n 的样本,那么 这些样本均数 X 也服从正态分布,即 X 的总体均 数仍 为 ,样本均数的标准差为 / n 。
抽样分布
抽样分布示意图
(三)、抽样误差的分布
中心极限定理 当样本含量很大的情况下,无论原始测量变量服
理得到均数的可信区间为:
t t
X
2,
sn
2,
t t 即:
( X 2,
s ,X
n
2,
s) n
同理,单侧可信区间为:
t t X ,
s n
,
X ,
s n
例 对某人群随机抽取20人,用某批号的结核 菌素作皮试,平均浸润直径为10.9cm,标准差 为3.86cm。问这批结核菌素在该人群中使用时, 皮试的平均浸润直径的95%可信区间是多少?
从什么分布,X 的抽样分布均近似正态。
抽样分布
图 抽样分布示意图
二.均数的抽样误差
如上所述,数理统计研究表明,抽样 误差具有一定的规律性,可以用特定的指 标来描述。这个指标称为标准误 (standard error SE)。
标准误除了反映样本统计量之间的离 散程度外,也反映样本统计量与相应总体 参数之间的差异,即抽样误差大小。
f(t)
x
t sx
0.4
υ=∞
υ=5
0.3
υ=1
0.2
0.1
0.0
t
-5 -4 -3 -2 -1 0 1 2 3 4 5
图4.1 自由度为1、5、∞的t分布
t 分布曲线下面积
t分布曲线下的面积与自由度ν有 关系。如t 分布曲线下面积为95%或 99%的界值不是一个常量,而是随着
自由度大小而变化的,分别用 t0.05,
标准误的计算公式:
x / n
sx
s n
•意义:反映抽样误差的大小。标准误越小, 抽样误差越小,用样本均数估计总体均数的 可靠性越大。
•与样本量的关系:S 一定,n↑,标准误↓
例4.1 在某地随机抽查成年男子140人, 计算得红细胞均数4.77×1012/L,标准差 0.38 ×1012/L ,试计算均数的标准误。
第三章抽样误差与假 设检验详解演示文稿
优选第三章抽样误差 与假设检验
第三章 抽样误差与假设检验
熟悉: 1、抽样误差的概念 2、引起抽样误差的原因 3、均数的标准误的计算 4、标准差和标准误的区别
第一节 抽样分布与抽样误差
一.抽样研究 (一)抽样研究的意义
总体
样 本
为什么要做抽样研究?
(1) 由于研究对象很多是无限总体,要直接研究 总体的情况是不可能的。
和 t0.01, 表示。
第三节 总体均数的估计
•统计推断包括两个重要的方面:参数估 计和假设检验。
•参数估计就是用样本指标(称为统计量, statistic)来估计总体指标(参数, parameter)。参数估计有两种方法: 点估计和区间估计。
第三节 总体均数的估计 一、可信区间的概念(Confidence Interval)
目的:就是要用样本信息来推断总体特 征,这就叫统计推断(statistical inference)
(二)抽样研究和抽样误差
抽样研究是指从总体中按照随机化的原 则,抽取一定数量的个体组成样本进行研 究,从而推断总体的研究方法。
在抽样研究中产生的样本统计量与相应 的总体参数间的差异,称为抽样误差 (sampling error),
参数估计
点估计:不考虑抽样误差,如 X 区间估计:考虑抽样误差
区间估计:指按预先给定的概率,计算出一个区间, 使它能够包含未知的总体均数。事先给定的概率
1 称为可信度,通常取 1 0.95 。
二、可信区间的计算
1.σ已知或σ未知但n (n>50)足够大时, 由Z分布可知:
Z Z (1)σ已知:
[ u (x ) / x],也可变换为标准正
态分布N (0,1)。
(二)t分布
由于在实际工作中,往往σ是未知 的,常用s作为σ的估计值,为了与Z变 换区别,称为t 变换t = x ,统计量 t 值的分布称为t 分布。 sx
t分布有如下特征
1.以0为中心,左右对称的单峰分布;
2.t分布是一簇曲线,其形态变化与n(确切地 说与自由度ν)大小有关。自由度ν越小,t分布曲 线越低平;自由度ν越大,t分布曲线越接近标准 正态分布(u分布)曲线,如图4.1。
(一)Z分布
正态分布(normal distribution)
常将一般的正态变量X通过变换[ Z (x ) / ] 转
化成标准正态变量Z,以使原来各种形态的正态分 布都转换为μ=0,σ=1的标准正态分布(standard normal distribution),亦称Z分布。
在正态分布总体中以固定n(如 n=10)抽取若干个样本时,样本均数 的分布仍服从正态分布 N(, 2 n) ,即。 所以,对样本均数的分布进行Z变换
(2) 即使对有限总体来说,若包含的观察单位数 过多,需要耗费大量的人力、物力和时间, 而且也不易组织,难以保证工作的质量。
(3)有的时候,观察的实质就是一种破坏性实验, 根本就不允许对总体中的每一个体逐一观察。
目前抽样研究的理论与技术已发展 成熟,只要严格按照有关抽样研究的要 求去做,这是完全可行的。
S S 0.38 0.032(1012 / L) X n 140
均数标准误的用途
1.衡量样本均数的可靠性 由于均数标准 误越小,均数的抽样误差越小,样本均 数就越可靠,代表性越好。
2.估计总体均数的可信区间。 3.用Βιβλιοθήκη Baidu均数的假设检验。
第二节 t 分布 一.t 分布(t-distribution)
该例n=20, n较小,因此,可认为平均浸润 直径服从t分布。自由度ν=20-1=19,查t 界
值表,得 t0.05,19=2.093
(10.9-2.093*3.86/ 20 ,10.9+2.093*3.86/ 20)cm 即(9.1,12.7)cm。