抽样误差
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
F分布的特征
F分布为一簇单峰正偏态分布曲线,与两个自由度 有关。 若F服从自由度为(1,2)的F分布,则其倒数1/F服 从自由度为(2,1)的F分布。 自由度为(1,2)的F分布,其均数为2/(2-2),与 第一自由度无关。 第一自由度1=1时,F分布实际上是t分布之平方; 第二自由度2=∞时,F分布实际上等于2分布。 每一对自由度下的F分布曲线下的面积分布规律。
3.1 样本均数的抽样分布规律
中心极限定理
从均数为μ,标准差为σ的正态总体中随机抽样,样 本均数服从均数为μ,标准差为 的正态分布。 n 从均数为μ,标准差为σ的任意总体中随机抽样, 当样本含量足够大时,样本均数近似服从均数为μ, 标准差为 的正态分布。
n
3.2 t分布的演化
根据中心极限定理的内容,当样本含量足够 大时,对从均数为μ,标准差为σ的任意总体 中随机抽样所得的样本均数进行标准化变换, 有
1.0 1.0
0.8
ν 1=5 ν 2=10
0.8
0.6
ν 1=1 ν 2=10
0.4
0.6
ν 1=10 ν 2=∞
0.4
0.2
0.2
ν 1=10 ν 2=1
0.0 0 1 2 3 4 5
0.0 0 1 2 3 4 5
F分布的应用
方差齐性检验 方差分析
n2 1 2 n1 1 s F 2 2 2 s2 2 s n1 1 n2 1 s2 2 n2 1 2
X 118.21cm s =4.45cm
μ=119.41cm σ= 4.38cm
X 120.18cm s =4.90cm
X 117.78cm s =3.98cm
X 120.81cm s =4.33cm
X 119.87m s =5.15cm
抽样误差的定义
五次抽样得到了不同的结果,原因何在?
样本均数的标准误表示样本均数的变异度。
2 X
X X X
2
ቤተ መጻሕፍቲ ባይዱ
2
2
k
2 x
n
k
2.2 标准误的计算
计算公式为
X
n
其中,σ为总体标准差,n为抽样的样本例数 在研究工作时,由于总体标准差常常未知, 可以利用样本标准差近似估计
s sX n
5 F分布
设从两个方差相等的正态分布N(1,2)和 N(2,2)总体中随机抽取含量分别为n1和n2 X1 的样本,样本均数和标准差分别为 、s1 和 X 2 、 s2。设: 2 s1 F 2 s2 则F值服从自由度为(n1-1,n2-1)的F分布 (F-distribution)。
t界值表
单侧: P(t <=-tα,ν)= α或 P(t >=tα,ν)= α 双侧: -t P(t <=-tα,ν)+ P(t >=tα,ν)= α 即:P(-tα,ν<t <tα,ν)= 1-α [例] 查t界值表得t值表达式 t 0.05,10=2.228 (双侧) t 0.05,10=1.812 (单侧)
抽样误差
抽样误差的重要性 抽样误差的定义 抽样误差的规律性
t分布
t分布的演化 t分布的图形 t分布的性质
标准误
标准误的定义 标准误的计算 标准误的意义 标准误的作用
F分布 χ2分布
1.1 抽样误差的重要性
既然有误差,为什么还要抽样?
无限总体的客观存在 试验研究的成本效益问题(cost effect)
i
样本均数和 样本均数间 的差别 X i X j
抽样误差
定义。 只要有个体变异和随机抽样研究, 抽样误差就是不可避免的。 抽样误差有自己的客观规律,统 计学就是拨开抽样误差之雾来洞 察客观规律的利器。
1.3 抽样误差的规律性
既然抽样误差是有规律的, 那么到底它的分布规律到底 是怎样的?
2=u12+ u22+……+ uv2
0.5
=1
0.4
f(2)
0.3
=2 =3
0.2
=4
=5
=6
0.1
0.0 0 2 4 6 8 10 12
2
χ2分布的作用
方差的抽样分布研究 样本分布与理论分布的拟合优度检验 率或构成比的比较
( Ai Ti ) Ti
2
2
卫生统计学
抽样误差和抽样分布
Sampling Error and Sampling Distribution
Department of Epidemiology and Biostatistics
School of Public Health, Nanjing Medical University
主要内容
2.1 标准误的定义
样本统计量(如均数)也服从一 定的分布; 与描述观测值离散趋势的指标类 似,我们使用样本统计量的标准 差来反映抽样误差的大小。又称 标准误(standard error)。
标准误(standard error)
样本统计量的标准差称为标准误。 样本均数的标准差称为均数的标准误。
=5 =1
0.3
由Gosset提出
0.2
0.1
-4
-3
-2
-1
0
1
2
3
4
3.4 t分布的性质
t分布为一簇单峰分布曲线。 t分布以0为中心,左右对称。 分布的高峰位置比 u 分布低,尾部高。即相同的尾 部面积对应的界值,比 u 分布大。例如:P=0.05, u=1.64,而自由度为10的 t分布界值,t = 1.812。 t分布与自由度有关,自由度越小,t分布的峰越 低,而两侧尾部翘得越高;自由度逐渐增大时,t 分布逐渐逼近标准正态分布;当自由度为无穷大时, t分布就是标准正态分布。 每一自由度下的t分布曲线都有其自身分布规律。t 界值表 。
抽样误差的重要性
总体
同质个体、个体变异 随机 抽样
样本
代表性、抽样误差
总体参数
未知
统计 推断
样本统计量已
知
风 险
1.2 抽样误差的定义
假如事先知道某地七岁男童的平均身高为119.41cm。为了估 计七岁男童的平均身高(总体均数),研究者从所有符合要 求的七岁男童中每次抽取100人,共计抽取了五次。
不同男童的 身高不同 每次抽到的 人几乎不同
个体变异
随机抽样
抽样误差
抽样误差的定义
【定义】由于个体变异的存在,在抽样研究中 产生样本统计量和总体参数之间的差异,称 为抽样误差(sampling error)。
各种参数都有抽样误差,这里我们以均数为研究对象
抽样误差的表现
抽 样 误 差 的 表 现
样本均数和 总体均数间 的差别 X
标准误的计算
【例】根据7岁男童的身高资料, 在已知总体标准差时,标准误为 4.38/10=0.438cm 而若以第一次抽样的样本标准差来代替总体标 准差,则标准误为 4.45/10=0.445cm
2.3 标准误的意义
标准误的意义
反映了样本统计量(样本均数,样本率)分布 的离散程度,体现了抽样误差的大小。 标准误越大,说明样本统计量(样本均数,样 本率)的离散程度越大,即用样本统计量来直 接估计总体参数越不可靠。反之亦然。 标准误的大小与标准差有关,在例数n一定时, 从标准差大的总体中抽样,标准误较大;而当 总体一定时,样本例数越多,标准误越小。说 明我们可以通过增加样本含量来减少抽样误差 的大小。
0
t
4 χ2分布
设从正态分布N(,2)中随机抽取含量为n的 样本,样本均数和标准差分别为X 和s,设:
2
(n 1) s
2
2
则2值服从自由度为n-1的2分布(2distribution),是小写希腊字母,读作chi。 可见,2分布是方差的抽样分布。
χ2分布的特征
2分布为一簇单峰正偏态分布曲线, 自由度为的2分布,其均数为,方差 为2。 =1时2分布实际上是标准正态分布变 量之平方。自由度为的2分布实际上是 个标准正态分布变量之平方和。可表示 为: 每一自由度下的2分布曲线都有其自身 分布规律
Xi
ni
~ N (0,1)
t分布的演化
由于总体标准差往往是未知的,此时往往用 样本标准差代替总体标准差,
X t ~ t s n
这里,ν为自由度(degree of freedom,df),取值为n-1
由W.S. Gosset提出
3.3 t分布的图形
自由度分别为1、5、 ∞时的 t 分布 =∞(标准正态曲线) f(t)
2 1 2 2
s
2 1 2
n1 1 s
2 1
2 1
小结
抽样误差的定义和表现 抽样误差的规律:中心极限定理 标准误的定义及其意义 t分布的演化、图形、特征及意义
Contact: 86862744
Email:
zhaoyang@njmu.edu.cn
Let’s Enjoy Our Experiments!
中心极限定理(central limit theorem)的表现
从正态总体中随机抽样,其样本均数服从正 态分布; 从任意总体中随机抽样,当样本含量足够大 时,其样本均数的分布逐渐逼近正态分布; 样本均数之均数的位置始终在总体均数的附 近; 随着样本含量的增加,样本均数的离散程度 越来越小,表现为样本均数的分布范围越来 越窄,其高峰越来越尖。
2.4 标准误的作用
标准误的用途
衡量样本统计量代表总体参数的可靠性; 估计总体参数的可信区间; 进行假设检验。
2.5 标准差和标准误的联系与区别
标准差
对象 计算方法 性质 用途 个体变异 定义
标准误
抽样误差 定义
n越大,标准差
越稳定 参考值范围 衡量离散程度
n越大,标准误越小
可信区间,假设检验