医学统计学 参数估计

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

hypothesis)
第一节 样本均数的标准误
总体
抽取部分观察单位 样本
参 数 统计推断 统计量
如:总体均数
如:样本均数 X
总体标准差
样本标准差S
总体率
样本率 P
抽样误差
(sampling error) :由 于个体差异导 致的样本统计 量与总体参数 间的差别。
一、抽样试验
从正态分布总体N(5.00,0.502)中,每次随机抽取样本 含量n=5,并计算其均数与标准差;重复抽取1000次,获得
这些样本均数服从均数为 ,方差为 的
正态分布.其中为样本均数的总体标准差, 计算公式为:
/ n X
为了与反映个体差异的标准差(或)相区 别,样本均数的标准差用 X 表示。
统计上通常将统计量(如样本均数、样本率p 等)的标准差称为标准误(standard error,
SE)。所以,样本均数的标准差 X 又称为
二、总体均数的估计
(一) 总体均数的点估计(point estimation)与区间估计
参数的估计
点估计:由样本统计量 X、S、p 直接估计 总体参数 、、
区间估计:在一定可信度 (Confidence level) 下 ,同时考虑抽样误差
统计学中的统计推断包括两个重要的方面:一是利用样本 统计量的信息对相应总体参数值做出推断,如用样本均数
均数
450 400 350 300 250 200 150 100 50
0 3.71 3.92 4.12 4.33 4.54 4.74 4.95 5.15 5.36 5.57 5.77 5.98 6.19
均数
例7-1 假设正常男子红细胞计数服从的 正态分布总体,从该总体中重复进行100 次抽样,每个样本的含量为10,结果见 表7-1。
1000份样本;计算1000份样本的均数与标准差,并对1000份样 本的均数作直方图。
按上述方法再做样本含量n=10、样本含量n=30的抽样实
验;比较计算结果。
抽样试验(n=5)
抽样试验(n=10)
抽样试验(n=30)
1000份样本抽样计算结果
总体的 总体标 均数的 均数标准差
均数 准差 均数
由表7-1可见,从同一总体中随机抽取样本含量 n=10的若干样本,各样本算得的样本均数并不等于 相应的总体均数,且各样本均数也不完全相同。这种 由于随机抽样而造成的来自同一总体的样本均数之间 及样本均数与相应的总体均数之间的差异,称之为均 数的抽样误差。
由于样本均数与相应的总体均数之间存在着差异,由数 理统计推理可知:从正态总体中随机抽取样本含量为n 的样本,每抽取一个样本可计算一个样本均数,重复 100次抽样可得到100个样本均数。
2.区间估计 总体均数的区间估计 (interval estimation)是利用样 本信息给出一个区间,并同时给出重 复试验时该区间包含总体均数的概率。
1)可信区间的涵义
从总体中作随机抽样,对于含量为n的每个样本而言,都可 以算得一个区间。以95%的可信区间为例,意味着在同一 总体中作100次重复抽样,可得100个可信区间,平均有 95个可信区间包含总体均数(估计正确),只有5个可信区 间不包含总体均数(估计不正确),或对于某一个区间而言, 它包含总体均数的可能性为95%,而不包含总体均数的可 能性仅为5%。因此在实际应用中,以这种方法估计总体均
抽样实验小结
均数的均数围绕总体均数上下波动。
均数的标准差即标准误 X 与总体标准差
相差一个常数的倍数,即 / n X 样本均数的标准误(Standard Error)
=样本标准差/ 样本含量=S n
计算(例7-1,例7-2)
从正态总体N(,2)中抽取样本,获得均数的分
布仍近似呈正态分布N(,2/n) 。
Sn
n=5 n=10 n=30
5.00 5.00 5.00
0.50 0.50 0.50
4.99 5.00 5.00
0.2212 0.1580 0.0920
n
0.2236 0.1581 0.0913
3个抽样实验结果图示
频数
450
400 350
n 5; SX 0.2212
300
250
200
150
100
样本均数的标准误,是反映样本均数抽样误差 大小的指标。
特点:
1.总体标准误的大小与总体标准差成正比,与样本含量的 平方根成反比。即当样本含量n一定时,标准差越大,即样本的 个体差异越大,标准误就越大,样本均数的抽样误差就越大;标 准差越小,标准误就越小,即样本均数抽样误差就越小。
2.当一定时,n越大,就越小;n越小,就越大。故影响 抽样误差大小的主要因素是样本含量。作为总体参数(常数)通 常是未知的,因而,在实际工作中常用样本标准差S来估计。
第七章 参数估计
统计推断 statistical inference
总体
抽取部分观察单位 样本
参数估计 (estimation of
参 数 统计推断 统计量
如:总体均数
如:样本均数 X
parameters)
包括:点估计与 区间估计
总体标准差
总体率
样本标准差S
样本率 P
假设检验(test of
50
0 3.71 3.92 4.12 4.33 4.54 4.74 4.95 5.15 5.36 5.57 5.77 5.98 6.19
均数
n 30; SX 0.0920
频数
频数
450
400 350 300
n 10; SX
0.1580
250
200Biblioteka Baidu
150
100
50
0 3.71 3.92 4.12 4.33 4.54 4.74 4.95 5.15 5.36 5.57 5.77 5.98 6.19
估计总体均数,用样本标准差S估计总体标准差等,称之为
点估计。另一个是利用样本统计量来推断我们是否接受一 个事先的假设,称之为假设检验。本章只讨论参数估计, 假设检验将在下一章中讨论。而参数估计又分为点估计与 区间估计。
1.点估计 总体均数的点估计(point estimation)就是用样本均数来直 接地估计总体均数,这种方法比较简 单,由于没有考虑到抽样误差,只适 合大样本资料的统计推断。
数犯错误的概率仅为5%。
2)可信区间具有两个要素
(1)准确度(accuracy),即可信区间包
含的概率的大小,一般而言概率越大越好。 (2)精密度(precision),反映区间的 长度,区间的长度越窄,估计的精密度越 好,反之越差。
相关文档
最新文档