均数的抽样误差分布参数估计

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
主要内容
❖ 均数的抽样误差
❖ t分布 ❖ 参数估计
回顾:正态分布(normal distribution)
❖ 概念: 频数分布以均数为中心,左右两侧基本对称, 靠近均数两侧频数较多,离均数愈远,频数愈少, 形成一个中间多,两侧逐渐减少的对称分布。
❖ 是一种连续型分布。又称高斯分布.
❖ 正态分布用N(µ, 2 )表示,其位置与均数有关, 形状与标准差有关。
3、用于假设检验。
抽样分布
❖ 假定2003年汕头市15岁女学生的身高服从均 数155.4cm、标准差5.3cm的正态分布。用计 算机做抽样模拟试验,从N(155.4, 5.32)的总 体中,每次抽出10个数字(样本含量为10), 组成一个样本,求出样本均数 X 、样本标 准差 S。 再求得此100个样本均数的均数、 样本均数的标准差。
即: X i
Xi Xj
❖如何估计抽样误差?
❖ 标准误 standard error,SE
❖ 以样本均数为例:
X
n
SX
S n
❖ SE 越大,均数的抽样误差越大,样本均数与 总体均数间的差异越大。
❖ 当样本例数一定时,样本均数的标准误与原 始数据的标准差成正比;当标准差一定时, 标准误与样本含量 n 的平方根成反比。增加 样本含量可以减小抽样误差。
但是,条件发生了变化
❖ 我们通常用 S X
代替 X
u X X
X X
twenku.baidu.com
SX S/ n
❖ 然而,S X 随着样本量的变化而变化,所以,我
们称之为 t-分布,虽然它是正态分布,但只有 当样本量(自由度)无穷大的时候,它才是标
准正态分布,此时,u=t
t分布曲线
❖ t分布是一簇对称于0的单峰分布曲线。 ❖ 自由度越小(相当于标准差大),曲线的中
正态总体中抽样(样 本量10)
正态总体中抽样(样 本量30)
频数
频数
频数
2.08
2.34
2.61
2.87
3.14
3.40
3.66
450 400 350 300 250 200 150 100
50 0 2.08 2.34 2.61 2.87 3.14 3.40 3.66 3.93 4.19 4.46 4.72 4.98 5.25 均数
间越低,两边越高;随自由度增大, t分布 曲线逐渐逼近于标准正态分布曲线。 ❖ 当自由度无穷大时, t分布就是标准正态分 布曲线。 ❖ 每一条t分布曲线,都对应于相应的自由度。 ❖ t分布模拟试验
t分布曲线下的面积规律 ❖ 与标准正态曲线下的面积规律相似:
❖ 在某一个自由度下,两侧外部总面积为5%的界 限的t值称为t0.05/2(υ),把两侧外部总面积为1% 的界限的t值称为t0.01/2(υ)。
❖ (2)曲线关于直线x=μ左右对称。 ❖ (3)正态分布有两个参数:均数,标准差;标准正
态的参数分别为:0, 1 ❖ (4)正态分布的面积分布有一定规律。
正态分布和标准正态分布曲线下面积分布规律
双侧概率
(-1,1),68.27%
(-1.96,1.96),95%
(-2.58,2.58),99%
单侧概率
变换. 所得到的新变量u的分布即为标准正态 分布。
❖ u的含义:变量到均数间的距离相当于标准差 的倍数。
u x
x
标准正态分布的概率密度函数:
(u)
1
(u2 )
e2
2
(2 )
u
❖ 正态分布的特征和分布规律:
❖ (1)曲线在x轴的上方,与x轴不相交,当x=μ 时,曲线位于最高点。 f(u=0)=0.3989
4.46
4.72
4.98
5.25
抽样时样本量大小 决定了样本均数分 布的形状,当样本 量足够大时,均数 分布趋向正态分布。
二、t 分布(t-distribution)
还记得吗?
u x
❖ u转换将正态分布转换为标准正态, N(0, 1)。
❖ 同理:将样本均数的分布也可以转换为标准正态 分布 。
请思考:
❖抽样? ❖统计量? ❖抽样分布?
一、均数的抽样误差和标准误
均数的抽样误差sampling error of mean
由于总体中存在个体变异,抽样研究中
所抽取的样本,只包含总体中一部分个体, 因而样本均数(或率)往往不等于总体均数 (或率),样本均数之间也互不相等,这种 由抽样引起的差异称为均数的抽样误差的体 现。
450 400 350 300 250 200 150 100 50
0
均数
500 450 400 350 300 250 200 150 100
50 0 2.08 2.34 2.61 2.87 3.14 3.40 3.66 3.93 4.19 4.46 4.72 4.98 5.25 均数
3.93
4.19
❖ 即:
N(,X 2)N(0,1)
u X X
v 实际工作中,总体标准差往往未知,常用S代替σ 计 算标准误,因此:为了和u分布区别,就变为:
t X X
SX S/ n
均数的分布也是这样
❖ 如果我们采用另一个正态变量:
X
u
X
u x
❖ 于是,均数的分布变成了标准正态分布:
N(,X 2)N(0,1)
❖ 医学现象许多呈正态分布,或近似正态分布:如 正常人的生理,生化指标变量,等
❖ 正态分布的密度函数:式中μ为均数;σ为标
准差;π为圆周率;е为自然对数的底,即
2.71828。以上均为常数,仅x为变量。
f(x)
1
(1)[(x )]2
e2
2
(1
)
x
❖ 标准正态分布: ❖ 为了应用方便,常将式进行变量变换,即:u
❖样本均数的标准差是什么?…….. •标准误
❖ 100个样本均数构成一个新的分布,也是正态分 布。
❖ 即使原分布为偏态分布,当样本含量足够大时,
新分布也近似正态分布)。新分布的集中趋势用
均数的均数来表示,离散趋势用标准误表示
N(
,
2 X
)。
❖ 各样本均数的均数等于总体均数。
正态总体中抽样(样 本量5)
❖ 与标准差的区别: ❖ 标准差:表示一般个体值的离散程度; ❖ 标准误:特别说明统计量的离散程度。
再思考一个问题:
v 其它的统计量有抽样误差吗? v 它们的计算公式怎样?
X
n
SX
S n
标准误的应用
1、用来衡量抽样误差的大小: 标准误越小,样本均数与总体均数越接近, 样本均数的可信度越高;
2、结合标准正态分布与 t 分布曲线下的面积规 律,估计总体均数的置信区间。
相关文档
最新文档