抽样误差55262精选ppt
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
精品课件
4
抽样实验
例1: 假定某地正常成年男子的红细胞计数服从
正态分布N(5.00,0.502) 的总体,单位1012/L。
用计算机模拟从该总体中随机抽样,每次抽10 例组成一个样本,重复100次抽样。结果见表1。
精品课件
5
抽样实验
表1 正常成年男子红细胞计数抽样实验结果
样本号
红细胞计数
X
S
1 5.59 5.11 4.26 5.11 4.74 … 5.55 5.04 0.44
反之, 当σ固定时,n越大, 则σX 就越小。
精品课件
17
样本均数的分布
若原始分布服从正态分布,则其样本均数服 从正态分布。
若原始分布不服从正态分布,当样本量够大 时(如n>60),其样本均数一般服从正态分布 (中心极限定理)。
精品课件
18
抽样误差
由数理统计的中心极限定理可知,无论原始 总体为何种分布, 只要它具有总体均数μ和标准
精品课件
6
抽样实验
总体
__
4.66
0.57
__
X2
S2
X1 S1
__
S X 1 0 0
100
精品课件
7
抽样误差
由于事物间普遍存在着变异,由此产生了 这么一个现象:
由于抽样而引起的误差 —— 抽样误差
精品课件
8
抽样误差
定义: 抽样误差(sampling error):是指
由于样本的随机性引起的统计量与参数的差 别,或同一总体的相同统计量之间的差别。
精品课件
23
t分布的发现
早在1875年,德国天文学家、测 量学家F.R.Helmert 就在数学上
发现了t分布。
1908年Gosset以Student为笔名
发表的论文,提出了t分布的概
念,从而开创了小样本统计推 断的新纪元。
精品课件
希尔米特
哥赛特
24
t分布
标准化变换
抽样实验中,各个`X 也服从总体均数
2
变异
“世界上没有两片完全相同的叶子” ----植物学家
“世界的丰富多彩来源于其多样性” ----哲学家
“个体差异是生物医学领域里普遍存在的现象” ----医学家
统计学就是研究变异(variation)的科学。
精品课件
3
抽样误差
联系? 变 异 ---- 抽样误差
(variation)---- (sampling error)
n→∞时, S`X →0,而S
趋近于稳定。
450
400 350
300
250
200
150
100
50
0
频数
3.71 3.92 4.12 4.33 4.54 4.74 4.95 5.15 5.36 5.57 5.77 5.98 6.19
均数
n10
精品课件
450
400
350 300 250
0
50
100
频数
3.71 3.92 4.12 4.33 4.54 4.74 4.95 5.15 5.36 5.57 5.77 5.98 6.19
统计学上将样本均数`X、样本率P等统计量
的标准差称为标准误,它可用于说明抽样误差的 大小。
精品课件
14
抽样误差
样本均数的标准误:即样本均数的标准差, 说明样本均数抽样误差的统计指标。
总体:__ 0.50/ 100.16
Xn
样本:
S __
__
X
X
S n
精品课件
15
不同样本量抽样实验结果图示
与n成反比,n↑,S`X↓;
问题:如何度量抽样误差的大小?
精品课件
12
抽样误差
由表1可见,各个样本均数`Xi 并不等于相应的
总体均数5.00,相互间也不完全相同。
由数理统计可证明,这些样本均数服从均数为
μ(本例为5.00),标准差为σX的正态分布。
其中,σX的计算公式为:
X
n
一种统计量
精品课件
13
抽样误差
标准误( Standard Error, SE)
150
200
250
300
350
400
450
0
150 100 50
频数
3.71 3.92 4.12 4.33 4.54 4.74 4.95 5.15 5.36 5.57 5.77 5.98 6.19
200
n5
均数
n30
均数
16
抽样误差
由 X
可见:
n
当样本量n一定时,σ越大,即个体变异
越大,则样本均数的抽样误差σX 就越大;
2 4.65 4.65 5.59 5.70 4.46 … 5.32 5.03 0.52
3 4.56 4.87 5.21 4.53 4.53 … 4.23 4.71 0.33
4 4.08 4.73 4.84 4.88 4.65 … 5.33 4.66 0.46
:
:
:: : :
100 5.16 4.49 5.26 5.02 4.64 … 4.56 4.90 0.29
第七章 参数估计
Sampling Error & Estimation of Parameter
南方医科大学生物统计学系
Department of Biostatistics Southern Medical University
精品课件
1
主要内容
抽样误差与标准误 t分布 可(置)信区间
精品课件
精品课件
9
抽样误差
由于抽样而引起的样本指标(统计量)与 总体指标(参数)的差异。
属随机误差:
特点:①无倾向性;②不可避免。
精品课件
10
统计学的分析思路
总体 population
sampling
样本 sample
inferring
精品课件
11
抽样误差
在实际工作中, 由于各种条件所限, 一般不 可能也没有必要观察总体中的每一个个体, 常常 是通过抽样来进行研究的。虽然抽样误差是不可 避免的, 但其大小是可以度量的。
差σ,当样本含量足够大时(n≥60),`X都近似
服从均数为μ, 标准差为σ`X 的正态分布。
精品课件
19
中心极限定理(central limit theorem)
样本X 均 ~ N数 (,2/n)
x
n
任一分布 的总体
当n足够大, 样本均数逐渐 趋于正态分布
x
精品课件
X
20
抽样误差
这一点具有很高的实用价值的。因为在实 际工作中,许多医学测量结果,我们并不知道它 的确切分布。有了这条性质,就可以利用正态 分布原理对其特征进行推断。
精品课件
21
标准差 VS 标准误
内容
SD
性质
表示个体变异大小
控制 个体变异或自然变异,不可通过统计
方法
方法来控制。
SE 统计量的标准差 表示抽样误差大小
增大样本含量可减少
算式
X2 X2 /n
S
n1
S S/ n X
用途
随精品课件
求可信区间 渐趋于0
22
t分布
t Distribution
标准差为
n
的正态分布,对各个`Xi也做