抽样实验与抽样误差_薛付忠
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
2
18
抽样试验与抽样误差
■ 中心极限定理(central limit theorem ) 随机抽取样本, ①从正态分布总体 N (µ , σ ) 中以固定 n 随机抽取样本,样本均数的 分布仍服从正态分布 即使从非正态总体中抽取样本,所得均数分布仍近似呈正态。 ②即使从非正态总体中抽取样本,所得均数分布仍近似呈正态。 随着样本量的增大, 样本均数的变异范围也逐渐变窄。 ③随着样本量的增大, 样本均数的变异范围也逐渐变窄。
14
抽样试验与抽样误差
■ 均数的抽样误差(sampling error )
15
抽样试验与抽样误差
■ 均数的抽样误差(sampling error )
16
抽样试验与抽样误差
■ 均数的抽样误差(sampling error )
特点: 1.总体标准误的大小与总体标准差成正比,与样本含量的平 方根成反比。即当样本含量n一定时,标准差越大,即样本的个体 差异越大,标准误就越大,样本均数的抽样误差就越大;标准差越 小,标准误就越小,即样本均数抽样误差就越小。 2.当一定时,n越大,标准误就越小;n越小,标准误就越大 。故影响抽样误差大小的主要因素是样本含量。作为总体参数(常 数)通常是未知的,因而,在实际工作中常用样本标准差S来估计 。
σX =
n
为了与反映个体差异的标准差(或)相区别,样本均数的标准差用 s 表示。 S =
X
n
• 统计上通常将统计量(如样本均数、样本率p等)的标准差称为标准误 (standard error,SE)。所以,又称为样本均数的标准误,是反映样本 均数抽样误差大小的指标。
13
抽样试验与抽样误差
■ 均数的抽样误差(sampling error )
11
抽样试验与抽样误差
■ 抽样试验(sampling experimentation )
抽样实验小结
12
抽样试验与抽样误差
■ 均数的抽样误差(sampling error ) • 由于样本均数与相应的总体均数之间存在着差异,由数理统计推理可知 :从正态总体中随机抽取样本含量为n的样本,每抽取一个样本可计算一 个样本均数,重复100次抽样可得到100个样本均数。 这些样本均数服从均数为 µ ,方差为 σ 2 X 的正态分布,其中 σ X 为样本均数的总体标准差,计算公式为: σ
8
抽样试验与抽样误差
■ 抽样试验(sampling experimentation )
1000份样本抽样计算结果
9
抽样试验与抽样误差
■ 抽样试验(sampling experimentation )
例题:已知某市16岁女中学生的身高值分布服从均数 µ = 155.4 (cm),标准差 σ = 5.3 (cm)的正态分布。现用计算机作抽样模拟试验,每次随机抽出10个观察值(即样本 含量),共抽取100个样本,求得100个样本均数和标准差。现将100个样本均数列 入表3-1。 由表3-1可见,从同一总体中随机 抽取样本含量n=10的若干样本, 各样本算得的样本均数并不等于 相应的总体均数,且各样本均数 也不完全相同。这种由于随机抽 样而造成的来自同一总体的样本 均数之间及样本均数与相应的总 体均数之间的差异,称之为均数 的抽样误差。 10
5
抽样试验与抽样误差
■ 抽样试验(sampling experimentation )
6
抽样试验与抽样误差
■ 抽样试验(sampling experimentation )
抽样试验(n=10)
7
抽样试验与抽样误差
■ 抽样试验(sampling experimentation )
抽样试验(n=30)
17
抽样试验与抽样误差
■ 中心极限定理(central limit theorem ) 随机抽取样本, ①从正态分布总体 N (µ , σ ) 中以固定 n 随机抽取样本,样本均数的 分布仍服从正态分布 即使从非正态总体中抽取样本,所得均数分布仍近似呈正态。 ②即使从非正态总体中抽取样本,所得均数分布仍近似呈正态。 随着样本量的增大, 样本均数的变异范围也逐渐变窄。 ③随着样本量的增大, 样本均数的变异范围也逐渐变窄。
抽样试验与抽样误差
■ 抽样试验(sampling experimentation )
例题:已知某市16岁女中学生的身高值分布服从均数 µ = 155.4 (cm),标准差 σ = 5.3 (cm)的正态分布。现用计算机作抽样模拟试验,每次随机抽出10个观察值(即样本 含量),共抽取100个样本,求得100个样本均数和标准差。现将100个样本均数列 入表3-1。
抽样试验与抽样误差
Xue Fuzhong
School of public health, Shandong University
1
抽样试验与抽样误差
实验设计 统计设计 调查设计 研究内容 统计描述 图表描述 统计分析 变量关系 参数估计 统计推断 假设检验
2
指标描述
抽样试验与抽样误差
■ 统计推断(statistical inference)
sp =
p (1 − p ) n
率的标准误与样本含量的平方根成反比,即样本含量越大,率的抽 样误差越小。
20
抽样试验与抽样误差
■ 率的抽样误差
21
抽样试验与抽样误差
■ Poisson计数的抽样误差
对于服从Poisson分布的资料,在抽样研究中,样本阳性数(Poisson 计数)与总体平均阳性数(简称总体平均数)的差异称为Poisson计 µ 数的抽样误差。衡量Poisson计数抽样误差大小的指标为标准误 µ ( µ 理论值),式中 为总体平均数, 越小,表示Poisson计数的抽样 µ µ 误差越小;越大,表示Poisson计数的抽样误差越大。
• 医学统计学中,常把这种由抽样研究造成的 样本均数与总体均数间的差异称为均数的抽样 误差;由抽样研究造成的样本率与总体率间的 差异称为率的抽样误差。 • 在抽样研究中,抽样误差是不可避免的, 但只要严格遵循随机化抽样原则就能估计 抽样误差的大小。
抽样试验与抽样误差
■ 抽样试验(sampling experimentation )
从正态分布总体N(5.00,0.502)中,每次随机抽取样本含量n=5 并计算其均数与标准差;重复抽取1000 1000次 获得1000份样本; 1000份样本 ,并计算其均数与标准差;重复抽取1000次,获得1000份样本;计算 1000份样本的均数与标准差 并对1000份样本的均数作直方图。 份样本的均数与标准差, 1000份样本的均数作直方图 1000份样本的均数与标准差,并对1000份样本的均数作直方图。 10、 30的抽样实验 的抽样实验; 按上述方法再做样本含量n=10、样本含量n=30的抽样实验;比较 计算结果。 计算结果。
2
19
抽样试验与抽样误差
■ 率的抽样误差 在抽样研究中,样本率与总体率的差异称为率的抽样误差。衡量率 的抽样误差大小的指标为率的标准误 σ p 。 越小,表示率的抽样误p σp σ 差越小;越大,表示率的抽样误差越大。 π (1 − π ) σp = n p 实际工作中,由于 往往是未知的,可用样本率 作的估计值, π sp 计算率的标准误 的估计值 。 σp
µ 实际工作中,由于 µ 往往是未知的,可用样本阳性数 估计值,计算标准误( X )的估计值 。
X
µ 作为的
22
Leabharlann Baidu
Thank you !!
23
3
抽样试验与抽样误差
■ 抽样误差(sampling error)
•
由于生物界中变异的普遍存在,
4
在医学研究的总体中同质研究对象 的观察单位间也会存在着个体差异 ;在抽样研究时,随机抽取的样本 只是总体中的部分观察单位,因而 由样本计算的样本统计量往往不等 于总体参数;即使以固定n从同一 总体中随机抽取若干个样本时,因 各样本包含的观察单位不同,所得 的各个样本统计量也往往不相等。 这种由于变异的存在,抽样研究所 造成的样本统计量与总体参数之间 的差异或各样本统计量之间的差异 称为抽样误差(sampling error)
18
抽样试验与抽样误差
■ 中心极限定理(central limit theorem ) 随机抽取样本, ①从正态分布总体 N (µ , σ ) 中以固定 n 随机抽取样本,样本均数的 分布仍服从正态分布 即使从非正态总体中抽取样本,所得均数分布仍近似呈正态。 ②即使从非正态总体中抽取样本,所得均数分布仍近似呈正态。 随着样本量的增大, 样本均数的变异范围也逐渐变窄。 ③随着样本量的增大, 样本均数的变异范围也逐渐变窄。
14
抽样试验与抽样误差
■ 均数的抽样误差(sampling error )
15
抽样试验与抽样误差
■ 均数的抽样误差(sampling error )
16
抽样试验与抽样误差
■ 均数的抽样误差(sampling error )
特点: 1.总体标准误的大小与总体标准差成正比,与样本含量的平 方根成反比。即当样本含量n一定时,标准差越大,即样本的个体 差异越大,标准误就越大,样本均数的抽样误差就越大;标准差越 小,标准误就越小,即样本均数抽样误差就越小。 2.当一定时,n越大,标准误就越小;n越小,标准误就越大 。故影响抽样误差大小的主要因素是样本含量。作为总体参数(常 数)通常是未知的,因而,在实际工作中常用样本标准差S来估计 。
σX =
n
为了与反映个体差异的标准差(或)相区别,样本均数的标准差用 s 表示。 S =
X
n
• 统计上通常将统计量(如样本均数、样本率p等)的标准差称为标准误 (standard error,SE)。所以,又称为样本均数的标准误,是反映样本 均数抽样误差大小的指标。
13
抽样试验与抽样误差
■ 均数的抽样误差(sampling error )
11
抽样试验与抽样误差
■ 抽样试验(sampling experimentation )
抽样实验小结
12
抽样试验与抽样误差
■ 均数的抽样误差(sampling error ) • 由于样本均数与相应的总体均数之间存在着差异,由数理统计推理可知 :从正态总体中随机抽取样本含量为n的样本,每抽取一个样本可计算一 个样本均数,重复100次抽样可得到100个样本均数。 这些样本均数服从均数为 µ ,方差为 σ 2 X 的正态分布,其中 σ X 为样本均数的总体标准差,计算公式为: σ
8
抽样试验与抽样误差
■ 抽样试验(sampling experimentation )
1000份样本抽样计算结果
9
抽样试验与抽样误差
■ 抽样试验(sampling experimentation )
例题:已知某市16岁女中学生的身高值分布服从均数 µ = 155.4 (cm),标准差 σ = 5.3 (cm)的正态分布。现用计算机作抽样模拟试验,每次随机抽出10个观察值(即样本 含量),共抽取100个样本,求得100个样本均数和标准差。现将100个样本均数列 入表3-1。 由表3-1可见,从同一总体中随机 抽取样本含量n=10的若干样本, 各样本算得的样本均数并不等于 相应的总体均数,且各样本均数 也不完全相同。这种由于随机抽 样而造成的来自同一总体的样本 均数之间及样本均数与相应的总 体均数之间的差异,称之为均数 的抽样误差。 10
5
抽样试验与抽样误差
■ 抽样试验(sampling experimentation )
6
抽样试验与抽样误差
■ 抽样试验(sampling experimentation )
抽样试验(n=10)
7
抽样试验与抽样误差
■ 抽样试验(sampling experimentation )
抽样试验(n=30)
17
抽样试验与抽样误差
■ 中心极限定理(central limit theorem ) 随机抽取样本, ①从正态分布总体 N (µ , σ ) 中以固定 n 随机抽取样本,样本均数的 分布仍服从正态分布 即使从非正态总体中抽取样本,所得均数分布仍近似呈正态。 ②即使从非正态总体中抽取样本,所得均数分布仍近似呈正态。 随着样本量的增大, 样本均数的变异范围也逐渐变窄。 ③随着样本量的增大, 样本均数的变异范围也逐渐变窄。
抽样试验与抽样误差
■ 抽样试验(sampling experimentation )
例题:已知某市16岁女中学生的身高值分布服从均数 µ = 155.4 (cm),标准差 σ = 5.3 (cm)的正态分布。现用计算机作抽样模拟试验,每次随机抽出10个观察值(即样本 含量),共抽取100个样本,求得100个样本均数和标准差。现将100个样本均数列 入表3-1。
抽样试验与抽样误差
Xue Fuzhong
School of public health, Shandong University
1
抽样试验与抽样误差
实验设计 统计设计 调查设计 研究内容 统计描述 图表描述 统计分析 变量关系 参数估计 统计推断 假设检验
2
指标描述
抽样试验与抽样误差
■ 统计推断(statistical inference)
sp =
p (1 − p ) n
率的标准误与样本含量的平方根成反比,即样本含量越大,率的抽 样误差越小。
20
抽样试验与抽样误差
■ 率的抽样误差
21
抽样试验与抽样误差
■ Poisson计数的抽样误差
对于服从Poisson分布的资料,在抽样研究中,样本阳性数(Poisson 计数)与总体平均阳性数(简称总体平均数)的差异称为Poisson计 µ 数的抽样误差。衡量Poisson计数抽样误差大小的指标为标准误 µ ( µ 理论值),式中 为总体平均数, 越小,表示Poisson计数的抽样 µ µ 误差越小;越大,表示Poisson计数的抽样误差越大。
• 医学统计学中,常把这种由抽样研究造成的 样本均数与总体均数间的差异称为均数的抽样 误差;由抽样研究造成的样本率与总体率间的 差异称为率的抽样误差。 • 在抽样研究中,抽样误差是不可避免的, 但只要严格遵循随机化抽样原则就能估计 抽样误差的大小。
抽样试验与抽样误差
■ 抽样试验(sampling experimentation )
从正态分布总体N(5.00,0.502)中,每次随机抽取样本含量n=5 并计算其均数与标准差;重复抽取1000 1000次 获得1000份样本; 1000份样本 ,并计算其均数与标准差;重复抽取1000次,获得1000份样本;计算 1000份样本的均数与标准差 并对1000份样本的均数作直方图。 份样本的均数与标准差, 1000份样本的均数作直方图 1000份样本的均数与标准差,并对1000份样本的均数作直方图。 10、 30的抽样实验 的抽样实验; 按上述方法再做样本含量n=10、样本含量n=30的抽样实验;比较 计算结果。 计算结果。
2
19
抽样试验与抽样误差
■ 率的抽样误差 在抽样研究中,样本率与总体率的差异称为率的抽样误差。衡量率 的抽样误差大小的指标为率的标准误 σ p 。 越小,表示率的抽样误p σp σ 差越小;越大,表示率的抽样误差越大。 π (1 − π ) σp = n p 实际工作中,由于 往往是未知的,可用样本率 作的估计值, π sp 计算率的标准误 的估计值 。 σp
µ 实际工作中,由于 µ 往往是未知的,可用样本阳性数 估计值,计算标准误( X )的估计值 。
X
µ 作为的
22
Leabharlann Baidu
Thank you !!
23
3
抽样试验与抽样误差
■ 抽样误差(sampling error)
•
由于生物界中变异的普遍存在,
4
在医学研究的总体中同质研究对象 的观察单位间也会存在着个体差异 ;在抽样研究时,随机抽取的样本 只是总体中的部分观察单位,因而 由样本计算的样本统计量往往不等 于总体参数;即使以固定n从同一 总体中随机抽取若干个样本时,因 各样本包含的观察单位不同,所得 的各个样本统计量也往往不相等。 这种由于变异的存在,抽样研究所 造成的样本统计量与总体参数之间 的差异或各样本统计量之间的差异 称为抽样误差(sampling error)