均数的抽样误差ppt课件

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
可信度又称置信度、置信率。 区间估计既是按一定的概率或可信度(1- α)用一个区 间估计总体参数所在范围,这个范围称可信度1-α的可信区 间,又称置信区间,它的理论基础是抽样分布规律。
ppt课件
15
1)大样本可信区间估计--正态近似法:
当样本含量较大时,例如n>100,t分布近似正态分布, 此时可用标准正态分布(u分布)代替t分布作为可信区间的 近似计算。
大小与t分布曲线下面积的关系,推算出t界值 表。因t分布是以0为中心的对称分布,故只列 正值,如算得t值为负值,可取其绝对值查表。
表中左侧标目为自由度ν,右侧标目为概 率P,表中数字为不同ν和P值下相应的t界值, 记做tα,ν 。
ppt课件
12
(四)总体均数的区间估计
医学研究的一个目的就是对未知的总体参 数进行估计。由样本信息估计总体参数称为参 数估计。
第二节: 均数的抽样误差 和t检验
ppt课件
1
一、抽样误差与标准误
(一)抽样误差的概念
由于抽样的原因所造成的样本 指标与总体指标之间的差异就叫抽 样误差。
例:某地成年男子血红蛋白的总体均数(μ)为138.2g/L,随机抽取
了400名男子算得平均血红蛋白含量为X =134.8g/L,如果用这个样本均数
ppt课件
5
如果把132(N)个样本均数看着132 (N)个“变量值”,也可求其标准差, 即样本均数的标准差,它说明样本均数间 的变异程度,即样本均数的抽样误差。
样本均数的标准差称为标准误(
standard error),用σX表示。标准误越大,样 本均数的抽样误差越大。标准误计算公式如下

ppt课件
-5.0
-4.0
-3.0
-2.0
-1.0
0.0
1.0
2.0
3.0
4.0
5.0
t
图2-2 不同自由度下t分布图
ppt课件
10
标准正态分布曲线下面积为95%的双侧界值是?
2.5%
2.5%
-1.96
0
1.96
如果双侧界值是1:面积为68.27%;如果为2.58?
ppt课件
11
为了方便使用,统计学家根据自由度(v)
这均是由于总体中每个个体存在变异引起的!
抽样误差产生的两个基本条件:
1)个体变异 2)样本含量
ppt课件
3
(二)标准误及其计算
标准误是反映抽样误差大小的指标,标准误越大 则说明样本均数的代表性越差!
举例说明: 例如:某大学有20000名同质学生,空腹血糖 值(mmol/L)均值为4.655(μ=4.655)。
如果你用这个样本平均数和标准差作为总体均数和标准差 的估计,就可以认为该市所有7岁男孩的平均身高为123.62(cm); 标准差为4.74(cm),这就是点估计。
ppt课件
14
2.区间估计
指按预先给定的概率,计算出一个区间,使它能够包含 未知的总体均数。事先给定的概率(1- α)称为可信度,通 常取1-α=0.95。
作为该地区“成年男子血红蛋白的总体均数(μ)的估计值,它的抽样 误差是多少?
样本的统计指标(统计量)与总体的统计指标(统计量)的差别 称抽样误差。
ppt课件
2
抽样误差有两种表现形式:
1)样本统计量与总体参数之间的差异(如样本均 数与总体均数差异); 2)样本统计量之间的差异(如两次抽样得到的两 个样本均数也不会相等)。
0.0349 (mmol / L)
x n 132
ppt课件
7
思考标准误和标准差的区别?
①标准差描述样本中个体值间的变异;标准误描述样本均 数的抽样误差。
②当样本量足够大时,标准差趋向稳定;而标准误则随样 本量的增大而减小,甚至趋于零。
③标准差可用于制定参考正常值的范围;标准误用于估计 总体均数范围和不同组之间的参数比较。 x ±1.96S(标准差) 估计95%的正常值范围; x ±1.96 S (标准误) 估计总体均数95%的可信区间。
6
标准误计算公式:

X
n
s s__
xn
计算总体均数标准误公式 计算样本均数标准误公式
由于总体标准差(σ)往往不可知,所以一般用样本标
准差(s)代替,得总体标准误的估计值…样本标准误 S 。 X 计算上述资料的标准误:如果计算的标准差为0.401,如
何计算标准误?
s 0.401
s_
总体均数95%可信区间:
X 1.96SX
总体均数99%可信区间
X 2.58SX
ppt课件
n5=100,X5=4.682
n6=100,X6=4.089
n7=100,X7=4.193
X1 X2
X3
X4 …

nN=100, XN=4.754
__
__
__
__
X1 X2 X3 X4
单位:(mmol/L)
这些均数不相等,但其分布有一定规律:大多数集中在总体均 数(4.655)附近,离总体均数越远,样本均数的个数越少。
X
ppt课件
8
(三)t分布
前面介绍:从总体中进行抽样,如果样本含量较大 时,其均数的抽样分布将趋于正态分布[z(u)分布],进
行u变换公式为:[U= ( X- X) /s],求得u的估计值后再查
表可求面积。
但当样本含量较少时,对正态变量 X 采取的就不是
z(u)变换,而是t变换,进行t变换公式为:
t分布是英国统计学家W.S.Gosset 于1909年以 “Student”为笔名在其发表的论文中首次提出来的,故 t分布又称 Student t分布(英国生物统计杂志发表)。
ppt课件
9
t分布图形的特征:
f(x)
0.40
0.30
ν ─>∞(标准正态曲线) ν =5
ν =1
0.20
0.10
0.00
如果我们对这些学生作132次抽样调查,每次抽100个 学生,平均空腹血糖值X1、X2、…。
N=? N=132 n= ? n= 100
ppt课件
4Байду номын сангаас
μ=4.655 n1=100,X1=4.623
μ n2=100,X2=4.412
样本均数也呈正态分布! n3=100,X3=4.661
n4=100,X4=5.022
参数估计 点估计 区间估计
ppt课件
13
1.点估计
点估计是直接用样本统计量作为对应的 总体参数的估计值。
例如,某市1982年所有7岁男童身高是一个总体,但总体参 数(平均身高)未知,为此,随机抽取该市1982年110名7岁男童, 测量他们的平均身高为123.62(cm);标准差为4.74(cm),这两个均 为样本的统计量。
相关文档
最新文档