参数估计基础与假设检验分析(ppt 36页)
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
抽样试验(n=10)
抽样试验(n=30)
3个抽样实验结果图示
样本均数的抽样分布特点
• 各样本均数未必等于总体均数; • 样本均数之间存在差异; • 样本均数的分布很有规律,围绕着总体均数,
中间多、两边少,左右基本对称,也服从正态 分布; • 样本均数的变异较原变量的变异大大缩小。 • 随着样本含量的增加,样本均数的变异范围逐 渐缩小。
图4.2 不同自由度下的 t 分布图
t
t 分布是一抽样分布,t 分布不是一条 曲线,而是一簇曲线,因为t 值的分布与
自由度 有关。其特点:
t分布曲线下面积(附表2)
双侧t0.05/2,9=2.262 =单侧t0.025,9
单侧t0.05,9=1.833 双侧t0.01/2,9=3.250
=单侧t0.005,9 单侧t0.01,9=2.821 双侧t0.05/2,∞=1.96
• 考察:
– 不同的分布----正态分布、偏态分布 – 不同的样本含量
样本均数的分布:
由中心极限定理及大数定理得出:
若原变量X服从正态分布,随机抽取样本含 量为n的样本均数 X 也服从正态分布。
即使从偏态总体中随机抽样,当n足够大( n>50),样本均数也近似服从正态分布。
这个定理不仅具有理论价值,而且具有很 高的实用价值。因为在实际工作当中,许多医 学测量结果并不知道它的确切分布,有了这个 性质,就可以利用正态分布的原理对其特征进 行统计推断。
从正态分布总体N(5.00,0.502)中,每 次随机抽取样本含量n=5,并计算其均数与标
准差;重复抽取1000次,获得1000份样本;计 算1000份样本的均数与标准差,并对1000份样 本的均数作直方图。
按上述方法再做样本含量n=10、样本含 量n=30的抽样实验;比较计算结果。
抽样试验(n=5)
抽样误差的概念
– 定义:由抽样引起的样本统计量与总体参 数间、以及样本统计量与样本统计量之间 的差别。
– 原因:个体变异+随机抽样 – 表现:
• 样本统计量与总体参数间的差别 • 不同样本统计量间的差别
抽样试验
• 假设一个已知总体,从该总体中重复抽取样本 含量相等的样本若干,对每个样本计算样本统 计量(均数、方差等),观察样本统计量的分布规 律--抽样分布规律。
均数的标准误(standard error of mean):
样本均数的正态分布的两个特征指标是什么?
均数:反映了样本均数的集中水平,近似等于总体均数。
标准差:样本均数之间的差异,反映了样本均数的离散 程度,即为抽样误差。这时的样本均数的标准差,称为样本 均数的标准误,简称标准误。
标准误是反映样本抽样误差大小的统计指标。
应用条件:当总体标准差已知时;Βιβλιοθήκη Baidu总体标准差未知,而 样本量较大时(n>50)
68.27%
-2.58 -1.96 -1
95.00% 99.00%
0
1 1.96 2.58
1、单一总体均数的可信区间:
双侧可信区间为:
单侧可信区间为:
例,测得某市16名正常成年男子的血清胆固醇平均含 量= 174.63mg/dl,标准差= 36.27 mg/dl。试问该市正常成 年男子血清胆固醇平均含量的95%置信区间和99%置信区 间各是多少?
t分布方法
应用条件:总体方差未知,样本量小
例 某医师侧的40名老年性慢性支气管炎病人尿中17-酮类固醇 排出量均数为15.19umol/d,标准差为5.03umol/d,试估计该种 病人尿17-酮类固醇排出量总体均数的95%可信区间。
分析条件:总体方差未知,样本量小
(13.58~16.80)
正态分布近似法
=单侧t0.025,∞ 单侧t0.05,∞ =1.64
三、总体均数的估计:
点值估计(point estimation):例,120名成 年男子血清铁含量的均数是18.57。那么,该总体 范围(这个地区)的成年男子血清铁含量的均数就 是18.57。这种方法虽简单,但未考虑抽样误差, 一般不用。
区间估计(interval estimation) :是按一定的 概率如95%,估计总体均数所在的范围,即总体均 数的可信区间或置信区间,通常用样本均数和均数 的标准误来估计。
参数估计基础
均数的抽样误差和标准误 t分布 总体均数的估计
总体
参数
参数估计基础
sampling
inference
样本
统计量
统计推断:参数估计 假设检验
一、均数的抽样误差和标准误
抽样研究,一定存在着抽样误差。 因此,估计抽样误差的大小,就成为 统计推断必须要解决的问题。
抽样误差的概念? 抽样误差的大小?
• 参数估计:估计总体均数的置信区间(区域); • 假设检验:用于总体均数的假设检验(比较)。
例,2000年某研究者随机调查某地健康 成年男子27人,测其血红蛋白量均数为 125 g /L,标准差为15 g /L。试估计该样 本均数的抽样误差。
27 2.89
标准差与标准误
意义:标准差用于描述个体值之间的变异,即观察值间的离散度, 标准差小,表明观察值围绕均数的波动小;标准误描述统计量的抽 样误差,即样本统计量与总体参数的接近程度。标准误小,表明抽 样误差小,则统计量稳定,与参数接近。
用途:标准差表示观察值间波动的大小,用于医学参考值范围;标 准误表示抽样误差的大小,用于参数估计。
关系:随着样本含量增加,都减小。
联系:都是表示变异度的指标,当样本量一定时,两者成正比。
二、t分布
0.5 f(t ) 0.4 0.3 0.2
ν=∞(标准正态曲线) ν=5
ν=1
0.1
0 -6 -5 -4 -3 -2 -1 0 1 2 3 4 5 6
例, 某市2000年随机测量了90名19岁健康男大学生 的身高,其均数为172.2 cm,标准差为4.5 cm,试估计 该市2000年19岁健康男大学生平均身高的95%置信区 间?
标准误与标准差的关系有:
X
n
标准误的估计值为:
SX
S n
标准误的概念
抽样的样本量越大,标准误就越小; 原来总体变异度小,标准误就越小。 标准误反映了样本均数间的离散程度,也反映了样本均 数与总体均数之间的差异。当标准误大时,用样本均数 对总体均数的估计的可靠程度就小;反之亦然。
标准误用途
• 衡量样本均数的可靠性:标准误越小,表明样本 均数越可靠;