医学统计学课件:单个样本数据的参数估计
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
标准误。
S
S
x
n
S =6.85 n=100
S χ =0.685(cm)
(二) 计数资料----率的的抽样误差
——率的抽样误差和标准误
﹡概念:
由抽样造成的样本率与总体率 的差别称为率的抽样误差(p - ; p为样品率, 为总体率)。
*率的标准误:表示率的抽样误差大 小的统计指标。
计算公式:
P
(1 )
概念:用样本指标(称为统计量) 估计总体指标(称为参数) 参数估计包括点估计和区间估计
—— 总体均数的估计 ﹡点估计(point estimation)
用样本均数作为总体均数的估计值
﹡区间估计(interval estimation)
按一定的概率(可信度,1 -α)估计总 体均数所在范围,亦称总体均数的可信区间
总体均数区间估计的方法:
2) 当样本含量n较小时, X的平均数—χ 接近t-分布
总体均数的可信区间: X t,SX
• 例:某医师测得40名老年性慢性支气管炎 病人尿中17-酮类固醇排出量均数为 15.19μmol/d,标准差为5.03 μmol/d, 试估计该种病人尿17-酮类固醇排出量总 体均数95%可信区间。(t 0.05,39=2.023)
总体均数区间估计的方法:
1) 当n足X够的大平(均如数1—χ0接0)近时标, 准正 态分布
总体均数95%可信区间:
X U
总体均数99%可信区间:
S
X
X
1.96S x
X
U SX
X
2.58S x
• 例:某地抽得正常成人200名,测得血清 胆固醇的均数为3.64mmol/ L,标准差 为1.20mmol/L,试估计该地正常成年 人血清胆固醇均数的95%可信区间。
——均数的抽样误差和标准误
﹡表示方法:标准误(Standard error) 标准误为样本均数的标准差,是说
明样本均数抽样误差的大小的指标,反 映了样本均数与总体均数的差异。
﹡计算公式
x
n
SS
x
n
总体标准误
样本标准误,
为σχ的估计值
• 某市随机抽取了12岁男孩100人,测得平
均身高139.6cm,标准差为6.85cm,计算
特征:以0为中心,左右对称(与标准正态分布比较)
t-分布曲线的形状与自由度有关 t-分布曲线下面积为1 t-分布曲线下面积分布可由t值表中查出
f(t) = (χ-μ) / σχ -
= ∞(u-d) = 5 =1
-4 -3 -2 -1 0 +1 +2 +3 +4
自由度分别为1、5、∞的t-分布
三、参数估计 (总体均数及总体率的估计)
n
SP
P(1 P) n
(P为 的估计值; Sp 为p的估计值。)
二、 t-分布(t-distribution)
﹡概念
从正态总体N(μ,σ)中进行无数次样
本含量为n的随机抽样,每次均可得
ห้องสมุดไป่ตู้
到一个χ和一个s,通过
t X
S/ n
公
式转换,可得无数个t值,t值的分布即
为含量为n的t值的总体或称t-分布。
某研究者欲研究经常在街头小餐点就餐的中 学生是否乙肝病毒的感染率高,在某地随机 抽取了200名中学生,询问是否经常在小餐 点就餐,并检查了乙肝病毒感染情况,结果 发现经常在小餐点就餐者89人,乙肝感染率 6.74%,不经常者111人,感染率4.60%,试 计算两类中学生乙肝感染率的标准误及总体 乙肝感染率可能所在的范围(95%)。
X
X
n
s sX n
: x t / 2sX
p x n
(1 )
p
n
p(1 p)
sp
n
: p u / 2s p
—— 总体率的区间估计
正态近似法:
当总体率未知时,若 np 5和 n (1-p) 5,则 总体率(1- )可信区间为:
p USp = P - USp ~ P + USp
即:总体率95%可信区间为 P 1.96Sp 总体率99%可信区间为 P 2.58Sp
查表法:n≤50时, p ≥1%(见书)
统计推断
﹡用样本信息推断总体特征,称统计推 断(statistical inference)
﹡统计推断包括总体参数估计和假设检 验
﹡总体指标和样本的统计指标是有误差 的,称为抽样误差
一、抽样误差和标准误
(一) 计量资料----均数的的抽样误差
——均数的抽样误差和标准误
﹡概念:
由于抽样造成的样本均数与总体均 数的差异(x-μ)。 抽样误差是不可避免的, 但可以控制。