均数的抽样误差与总体均数估计
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
总体限于人力、财力、物力、时间或个体过多等原因 ,不可能也没必要对所有个体逐一研究。
借助抽样研究。
4
一 、 抽样误差
抽样
总体
样本 抽样误 差 统计推断
一 、 抽 样 误 差 的 概 念
抽样误差(Sampling Error)
由于总体中存在个体变异,在随机抽
样时所引起的样本统计量与总体参数之间 的差异,称为抽样误差。 对于抽样研究,抽样误差不可避免, 但其大小可以控制和估计。
标准误:估计参数的可信区间。
进行假设检验等。
标准差与标准误的区别与联系 与样本含量的关系不同
标准差: 随样本含量的增多,逐渐趋于稳定。 标准误: 随样本含量的增多逐渐减小。
标准差与标准误的区别与联系
联系
(1)标准差与标准误都是变异指标,说明个体 值之间的差异时用标准差,说明统计量之 间的差异时用标准误。
标准误是表示样本均数变异程度。
(2)反映均数的可靠性
标准误越大,样本均数抽样误差就越大,用样
本均数推断总体均数的可靠性就越差;
标准误越小,样本均数抽样误差就越小,用样
本均数推断总体均数的可靠性就越好。
(3)标准误可用于计算总体均数的可信区间,有
关总体均数的假设检验。
标准差与标准误的区别与联系
概念不同
对相应总体参数
、 、 、 p
所做的非确定性的推估。 主要包括:参数估计
假设检验
2
总体参数的估计
A. 研究上海市大一学生男性身高。
B. 根据某几个学校男大一学生的入学体检身 高资料,推测上海市大一学生男性身高。
3
一、 抽样误差
了解总体特征的最好方法是对总体的每一个个体
进行观察、试验,但源自文库医学研究实际中往往不可行。 对无限总体不可能对所有个体逐一观察,对有限
(2)当样本含量不变时,标准差越大,标准误
亦越大。
第二节
总体 2 X ~ N ( , )
变量变换
t 分布
样本均数
中心极限定理
n 100
X~
变量变换
N ( , X )
2
u
X
u
X 未知
标准正态分布
X
X t sX
u ~ N (0,1)
服从自由度 = n 1的t分布
控制其大小的最实际的办法是:增大
样本量。
(一)均数的抽样误差
假定从正态总体 N ( 5.00 , 0.432 ),在该总
体中作100次随机抽样,ni = 10
样本均数 样本n1 样本n2
X1 X2
4.89 5.09 · · · ·
总体
样本n100
Xk
5.44
(一) 均数的抽样误差与标准误
抽样分布
抽样分布示意图
(一)标准误(standard error, SE)
即样本均数的标准差,可用于衡量样本均数抽 样误差的大小。
x
n
通过增加样本含 量n来降低抽样 误差。
通常σ未知,用S来估计。计算标准误采用下式:
某一个样 本的标准 差
S Sx n
该样本的 个体例数
13
一、 均数的抽样误差与标准误
标准差:描述个体值间的变异,标准差较 小,表示观察值围绕均数的波动较小。
说明样本均数的代表性。 标准误:描述统计量的抽样误差,标准误
较小,表示样本统计量与参数较
接近。说明样本均数的可靠性。
标准差与标准误的区别与联系 用途不同
标准差:结合均数估计参考值范围 计算变异系数(CV = S/ X ), 计算标准误 S x 等( S x = S/ n )。
第二节
t 分布
(t-distribution)
可把任何一个均数为µ,标准差为σ的正态 分布N(µ,σ2)转变为µ=0,σ=1的标准正态分布, 即将正态变量值X用
u X
来代替。
由于 X 服从正态分布,故
u X
X
服从标准正态分布N (0,1)。
实际资料分析中,由于 σ 往往未 知,故标准化转换演变为:
(1)标准误的特点:
• 当样本例数n一定时,标准误与标准差
呈正比;
• 当标准差一定时,标准误与样本含量n
的平方根呈反比。
x n
14
(2)标准误意义
标准误越小,说明样本均数与总体均数越接近, 即用样本均数估计总体均数的可靠性越大; 标准误越大,说明样本均数与总体均数相差越
远,即用样本均数估计总体均数的可靠性越小 。
X X 转换值 SX S/ n
1 3 3.0 18 28 28 13 7 1 1.0 1 1.0 100 100.
频率 (%) 1.0
18.0 28.0 28.0 13.0 7.0
样本均数的抽样分布:
理论上可以证明:若从正态总体 N( , 2 ) 中,反
复多次随机抽取样本含量固定为n
的样本,那么
这些样本均数 X 也服从正态分布,即 X 的总体均 数仍为 ,样本均数的标准差为 / n 。
15
(3)标准误的计算方法
X
n
(理论值)
SX
S n
(估计值)
例 在某地随机抽查成年男子140人,得红细均
数 X 4.77 ,标准差 S 0.38 ,试计算其标准误。
S 0.38 12 SX 0.032(10 / L) n 140
标准误的用途:
(1)反映抽样误差大小
将模拟抽样实验中已求得100个样本均数编成频数 表,其中多数与总体均数5.00较接近且集中分布在其周
围,左右基本对称,即样本均数以μ为中心呈正态分布。
从正态总体N(5.00,0.432)抽样得到的100个样本均数的频数分布
组段
频数
4.6 4.70 4.80 4.90 5.00 5.10 5.20 5.30 5.40~ 合计 5.50 ~ ~ ~ ~ ~ ~ ~ ~
100份样本均数的抽样分布特点: ① 各样本均数未必等于总体均数; ② 各样本均数间存在差异; ③ 样本均数的分布很有规律,围绕着总体 均数中间多,两边少,左右基本对称,也服从
正态分布;
9
(一)均数的抽样误差 均数的抽样误差: 由于随机抽样而引起的来自同一总
体的样本均数之间以及样本均数与总体均
数之间的差异,称为均数的抽样误差。
第一节 重点掌握
均数抽样误差与标准误
1、抽样误差、标准误、可信区间 2、标准差与标准误的区别,t分布的特征 3、标准误的计算、可信区间的计算及适用 条件 4、可信区间与参考值范围的区别。
一、 抽样误差
统计推断(Statistical inference): 用样本信息推论总体特征的过程。
即 采用样本统计量 x、S、p、S p
借助抽样研究。
4
一 、 抽样误差
抽样
总体
样本 抽样误 差 统计推断
一 、 抽 样 误 差 的 概 念
抽样误差(Sampling Error)
由于总体中存在个体变异,在随机抽
样时所引起的样本统计量与总体参数之间 的差异,称为抽样误差。 对于抽样研究,抽样误差不可避免, 但其大小可以控制和估计。
标准误:估计参数的可信区间。
进行假设检验等。
标准差与标准误的区别与联系 与样本含量的关系不同
标准差: 随样本含量的增多,逐渐趋于稳定。 标准误: 随样本含量的增多逐渐减小。
标准差与标准误的区别与联系
联系
(1)标准差与标准误都是变异指标,说明个体 值之间的差异时用标准差,说明统计量之 间的差异时用标准误。
标准误是表示样本均数变异程度。
(2)反映均数的可靠性
标准误越大,样本均数抽样误差就越大,用样
本均数推断总体均数的可靠性就越差;
标准误越小,样本均数抽样误差就越小,用样
本均数推断总体均数的可靠性就越好。
(3)标准误可用于计算总体均数的可信区间,有
关总体均数的假设检验。
标准差与标准误的区别与联系
概念不同
对相应总体参数
、 、 、 p
所做的非确定性的推估。 主要包括:参数估计
假设检验
2
总体参数的估计
A. 研究上海市大一学生男性身高。
B. 根据某几个学校男大一学生的入学体检身 高资料,推测上海市大一学生男性身高。
3
一、 抽样误差
了解总体特征的最好方法是对总体的每一个个体
进行观察、试验,但源自文库医学研究实际中往往不可行。 对无限总体不可能对所有个体逐一观察,对有限
(2)当样本含量不变时,标准差越大,标准误
亦越大。
第二节
总体 2 X ~ N ( , )
变量变换
t 分布
样本均数
中心极限定理
n 100
X~
变量变换
N ( , X )
2
u
X
u
X 未知
标准正态分布
X
X t sX
u ~ N (0,1)
服从自由度 = n 1的t分布
控制其大小的最实际的办法是:增大
样本量。
(一)均数的抽样误差
假定从正态总体 N ( 5.00 , 0.432 ),在该总
体中作100次随机抽样,ni = 10
样本均数 样本n1 样本n2
X1 X2
4.89 5.09 · · · ·
总体
样本n100
Xk
5.44
(一) 均数的抽样误差与标准误
抽样分布
抽样分布示意图
(一)标准误(standard error, SE)
即样本均数的标准差,可用于衡量样本均数抽 样误差的大小。
x
n
通过增加样本含 量n来降低抽样 误差。
通常σ未知,用S来估计。计算标准误采用下式:
某一个样 本的标准 差
S Sx n
该样本的 个体例数
13
一、 均数的抽样误差与标准误
标准差:描述个体值间的变异,标准差较 小,表示观察值围绕均数的波动较小。
说明样本均数的代表性。 标准误:描述统计量的抽样误差,标准误
较小,表示样本统计量与参数较
接近。说明样本均数的可靠性。
标准差与标准误的区别与联系 用途不同
标准差:结合均数估计参考值范围 计算变异系数(CV = S/ X ), 计算标准误 S x 等( S x = S/ n )。
第二节
t 分布
(t-distribution)
可把任何一个均数为µ,标准差为σ的正态 分布N(µ,σ2)转变为µ=0,σ=1的标准正态分布, 即将正态变量值X用
u X
来代替。
由于 X 服从正态分布,故
u X
X
服从标准正态分布N (0,1)。
实际资料分析中,由于 σ 往往未 知,故标准化转换演变为:
(1)标准误的特点:
• 当样本例数n一定时,标准误与标准差
呈正比;
• 当标准差一定时,标准误与样本含量n
的平方根呈反比。
x n
14
(2)标准误意义
标准误越小,说明样本均数与总体均数越接近, 即用样本均数估计总体均数的可靠性越大; 标准误越大,说明样本均数与总体均数相差越
远,即用样本均数估计总体均数的可靠性越小 。
X X 转换值 SX S/ n
1 3 3.0 18 28 28 13 7 1 1.0 1 1.0 100 100.
频率 (%) 1.0
18.0 28.0 28.0 13.0 7.0
样本均数的抽样分布:
理论上可以证明:若从正态总体 N( , 2 ) 中,反
复多次随机抽取样本含量固定为n
的样本,那么
这些样本均数 X 也服从正态分布,即 X 的总体均 数仍为 ,样本均数的标准差为 / n 。
15
(3)标准误的计算方法
X
n
(理论值)
SX
S n
(估计值)
例 在某地随机抽查成年男子140人,得红细均
数 X 4.77 ,标准差 S 0.38 ,试计算其标准误。
S 0.38 12 SX 0.032(10 / L) n 140
标准误的用途:
(1)反映抽样误差大小
将模拟抽样实验中已求得100个样本均数编成频数 表,其中多数与总体均数5.00较接近且集中分布在其周
围,左右基本对称,即样本均数以μ为中心呈正态分布。
从正态总体N(5.00,0.432)抽样得到的100个样本均数的频数分布
组段
频数
4.6 4.70 4.80 4.90 5.00 5.10 5.20 5.30 5.40~ 合计 5.50 ~ ~ ~ ~ ~ ~ ~ ~
100份样本均数的抽样分布特点: ① 各样本均数未必等于总体均数; ② 各样本均数间存在差异; ③ 样本均数的分布很有规律,围绕着总体 均数中间多,两边少,左右基本对称,也服从
正态分布;
9
(一)均数的抽样误差 均数的抽样误差: 由于随机抽样而引起的来自同一总
体的样本均数之间以及样本均数与总体均
数之间的差异,称为均数的抽样误差。
第一节 重点掌握
均数抽样误差与标准误
1、抽样误差、标准误、可信区间 2、标准差与标准误的区别,t分布的特征 3、标准误的计算、可信区间的计算及适用 条件 4、可信区间与参考值范围的区别。
一、 抽样误差
统计推断(Statistical inference): 用样本信息推论总体特征的过程。
即 采用样本统计量 x、S、p、S p