抽样总体均数的估计分析

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

0.02 p 0.01
p<0.02,按α=0.05 水准拒绝 H0 接受 H1,可认为该市难 产儿出生体重高于一般婴儿。
㈡配对资料的比较
配对类型: ①配在对子的同对受试对象分别给予两种不同处理; ②同一受试对象分别接受两种不同处理; ③同一受试对象处理前后的比较。 目的:推断某种处理有无作用或两种处理效应有无差别, 即推断样本差值的总体均数μd是否等于零。
例1.1 经产科大量调查得知某市婴儿体重均数为 3.20kg,今随机测得25名难产儿平均出生体重为3.42kg, 标准差为0.42kg。问该市难产儿出生体重与一般婴儿是 否不同?
H0:μ=μ0,即该市难产儿出生体重与一般婴儿相同。 H1:μ≠μ0,即该市难产儿出生体重与一般婴儿不同。 α=0.05
日复一日的努力只为成就美好的明天 。01:47:3001:4 7:3001:47Tues day , November 17, 2020
3
9
6
36
3
9
2
4
6
36
32
136
H0:μd=0
H1:μd=0 α=0.05
本例 d =32, d 2 =136,n=10
d d 32 3.2mm / h
n 10
sd
d2
d2
n
n1
32 2
136 10
1.93mm / h s
sd
1.93 0.61mm / h
10 1
d n 10
②小样本,σ已知且样本来自 正态总体。
检验目的:同t检验。
五、两类错误
假设检验是以样本推断总体,作出的结论是概率 性的,并非绝对正确,可能发生两类错误。如果无效 假设H0为真,拒绝了它,称第一类错误或Ⅰ型错误 (type Ⅰ error);如果无效假设H0不真,不拒绝它, 称第二类错误或Ⅱ型错误(type Ⅱ error)。
本例μ0=3.20kg, x =3.42kg,S=0.42kg,n=25
t x 0 x 0 3.42 - 3.20 2.62 sx s n 0.42 25
n 1 25 1 24
查 t 界值表(双侧):2.492<2.62<2.797
t t t 0.02,24
0.01, 24
根据 t 分布的原理:
P(- t 2, <t< t 2, )=1-α
因t x sx


t
2,

x sx
< t 2,
解之得: x t 2, s x x t 2, s x
按概率为 1-α估计总体均数可信区间的计算公式为: x t 2, s x
求某地 20 岁健康男性血糖值总体均数 95%的可信区间。
二、抽样误差
样本统计量(也称估计值)与总体参数(也称 待估值)之间存在差异,这种差异称抽样误差。 其有两个特点:
1、它们互不相同,有些样本统计量与总体参 数之间差异大,有些差异小;有些为正值,有些 为负值。
2、这些差异虽然客观存在,但却未知,因为 总体参数的具体值我们往往未知。
样本统计量的标准差称为标准误(standard error)。
4.判断结果
当P≤α时,结论为按所取检验水准拒绝H0,接受 H1,两均数差别有统计意义(或称显著性意义),即 它们之间存在着本质的不同(数学上认为小概率事件 在一次实验中不可能发生。P≤α,即被推断为小概率 事件);当P>α时,结论为按所取检验水准尚不能拒 绝H0,可认为两均数差别无统计意义,即它们之间无 本质的不同,差别仅由抽样误差引起。
生活中的辛苦阻挠不了我对生活的热 爱。20. 11.1720 .11.17 Tuesday , November 17, 2020
人生得意须尽欢,莫使金樽空对月。0 1:47:30 01:47:3 001:47 11/17/2 020 1:47:30 AM
做一枚螺丝钉,那里需要那里上。20. 11.1701 :47:300 1:47No v-2017 -Nov-2 0
样本均数的标准差也称样本均数的标准误 (standard error of mean),它反映了样本均数间的 离散程度,也反映了样本均数与总体均数间的差异, 说明均数抽样误差的大小。
根据数理统计的推导,的计算公式如下:
x
n ,sx
s n
标准误的大小与标准差σ成正比,与样本含量 n 的平方根成反比。因此增加样本含量,可减小抽 样误差。
三、t检验
概念:选用检验统计量t进行假设检验的方法,称t检验。 用途: ①样本均数与总体均数的比较 ②配对计量资料的比较 ③两样本均数的比较 应用条件:①正态分布:当样本含量较小时,要求
样本来自正态总体。 ②方差齐性:两样本均数比较时,要求
两总体方差相等。
㈠、样本均数与总体均数的比较
目的:推断样本所代表的未知总体均数μ与已知总 体均数μ0是否相等。
三、均数的分布及其标准误
数理统计的中心极限定理和大数定 理表明:① 从正态总体N(μ,σ2)中随机 抽取含量为n的样本,其样本均数服从正 态分布;即使从偏态总体中随机抽样, 当n足够大时(如n>30),样本均数也近 似正态分布;② 从均数为μ,标准差为σ 的总体中随机抽取含量为n的样本,则样 本均数的均数也为μ,样本均数的标准差 为。
总体均数的估计和假设检验
参数估计
第一Байду номын сангаас 抽样误差与标准误 第二节 t分布 第三节 总体均数的估计
第一节 抽样误差与标准误
一、抽样研究 医 学 科 学 研 究 多 为 抽 样 研 究 ( sampling
study),即从研究总体中随机抽取一定数量观 察单位作为样本进行研究,通过样本的研究结 果来推论总体。一个好的抽样研究可用尽量少 的人力、物力、经费和时间获得需要的、符合 一定科学要求的结果,并可减少非抽样误差。
t
x1 x2
n1
1s12
n2
1s
2 2
n1 n2 2
1 n1
1 n2
x1 x2
s12
s
2 2
n
9.302
9.36 7.58 0.832 0.642
30
n1 n2 2 230 1 58
以 n=58 查 t 界值表,得 P<0.001。按α=0.05 水准拒绝 H0 接受 H1,有统计学
意义。可以认为肥胖组和对照组 LPO 总体平均含量不等,肥胖组儿童血中脂 质过氧化物(LPO)较高。
t检验条件不能满足时的处理方法: ①变量变换(对数变换、倒数变换、平方根变换、
平方根反三角函数变换等) ② t’检验 ③非参数检验(秩和检验、Ridit分析等)
四、u检验
概念:选用检验统计量u值进行假设检验的方法称u检验。 用途:同t检验。 应用条件:①大样本(如n>30);
第二节 t 分布
若变量 X 服从总体均数为μ,总体标准差为σ的正态分
布 N(μ, σ 2),则 x 服从标准正态分布 N(0,1),
即 u 分布。同理,若样本均数服从总体均数为μ,标准差为
x
的正态分布
N(μ,
2 x
),则 x x
也服从标准正态分布
N(0,1),即 u 分布。
在实际工作中,由于 x 未知,常用 sx
例 用某药治疗某病患者 10 人,治疗前后(治后一月)的血沉(㎜/h)
如下表,问治疗后血沉有无变化?
表 病人编号

某药治疗某病前后的血沉变化(㎜/h)
治疗前 治疗后
差数,d
d2


⑷=⑵-⑶

1
10
6
2
13
9
3
6
3
4
11
10
5
10
10
6
7
4
7
8
2
8
8
5
9
5
3
10
9
3
合计


4
16
4
16
3
9
1
1
0
0
假设检验
一、假设检验的基本思想 二、假设检验的基本步骤 三、t检验 四、u检验 五、两类错误 六、假设检验注意事项
一、基本思想
假设检验(test of hypothesis)亦称显著性检 验(test of statistical significance),就是先 对总体的参数或分布作出某种假设,如两个总体均数 相等,总体服从正态分布或两总体分布相同等,然后 用适当的统计方法计算某检验统计量,根据检验统计 量的大小来推断此假设应当被接受或拒绝,它是统计 推断的另一重要方面。
t d 3.2 5.246, v 10 1 9 s 0.61
d
5.25 4.781 查 t 界值表(双侧): t t0.001,9
p 0.001
p<0.001,按α=0.05 水准拒绝 H0 接受 H1,可认为用该药治疗后血沉有所下降。
㈢两样本均数的比较
目的:通过两样本均数 x1 与 x 2 的比较,推断两样本分别代表的总
二、假设检验的基本步骤
1.建立检验假设、确定检验水准 检 验 假 设 有 两 种 : 一 种 是 无 效 假 设 ( null hypothesis), 符 号 为 H0, 即 假 设 均 数 来 自 同 一 总 体 , 它们的总体均数相同,样本均数间无本质的不同,差 别仅由抽样误差引起; 另一种是备择假设(alternative hypothesis), 符号为H1,即假设均数来自不同总体,它们之间的差 别存在本质的不同,并非仅由抽样误差引起。 检验水准(size of a test)亦称显著性水准 (significance level),符号为α,即判断由H0所 规定的总体中随机抽样,抽到与现有样本具有相同的 检验统计量的样本及其更极端情况的样本是否小概率 事件的界值。
已知 x =39.5mg/100ml,S=0.69mg/100ml,n=20,1-α=0.9
sx
0.69 20
=0.15(mg/100ml)
=20-1=19,
查附表 2,得 t0.05 2,19 =2.093。
3.95±2.093×0.15=3.64--4.26(mg/100ml) 即该地 20 岁健康男性血糖总体均数 95%的可信区间为: 3.64mg/100ml--4.26mg/100ml。
2.选择和计算统计量 根据统计推断的目的和资料的性质、特点选择合适的 检验统计量。 3.确定P值 P值是指由H0所规定的总体中随机抽样,获得等于及 大于(或等于及小于)现有样本所获得的检验统计量值 的概率。求得检验统计量后,一般可通过特别的统计表 直接查出P值。例如t值可查t界值表,u值可查u界值表
按 t 分布的规律,理论上有:
单尾:P(t≤- t , )=α或 P(t≥t , )=α; 双尾:P(t≤- t 2, )+P(t≥t 2, ) =α, 即:P(- t 2, <t < t 2, ==1-α
第三节 总体均数的估计
1.点(值)估计 用样本统计量直接作为总体参 数的估计值。
2.区间估计 即按预先给定的概率(1-α)估计 包含未知总体参数的范围。该范围通常称为参 数的可信区间(confidence internal,CI)。可 信区间的确切含义是指:有1-α(如95%)的可 能可信区间包含总体参数。可信区间通常由两 个数值即可信限(confidence limit)构成。其 中较小值称为下限(lower limit),较大的值 称为上限(upper limit)。
例4-1 某地随机抽取20岁健康男性20名,求得其血 中葡萄糖样本均数=39.5mg/100ml,标准差S=0.69mg/100ml, 问其抽样误差是多少?
本例:s=0.69mg/100ml,n=20,将其代入式(4-2),得
sx
0.69 20
0.15(mg
/100ml)
即该研究的抽样误差为0.15mg/100ml。
体均数 1 与 2 是否相等。
为研究肥胖与脂质代谢的关系,在某地小学中随机抽取了 30 名肥胖儿童(肥胖组)和 30 名正常儿童(对照组),用改良八木国 夫法测定两组儿童血中脂质过氧化物(LPO)得下表结果,请问能 否认为肥胖与脂质代谢有关系?
两组儿童血液中 LPO 含量(μmol/L)
分组
n
肥胖组
30
对照组
30
xs
9.36±0.83 7.5±0.64
H0:μ1=μ2,即肥胖组和对照组 LPO 总体平均含量相等
H1:μ1≠μ2,即肥胖组和对照组 LPO 总体平均含量相等 α=0.05
n1=n2=30<50,为两小样本,但方差齐(方差齐性检验 F=1.682 P>0.1)故选 用两样本 t 检验。
代替,此时 x 服从 t 分布(t-distribution)即:
sx
t x , v n 1t 分布有如下特征:①单峰型分
sx
布,以 0 为中心,左右完全对称;②越小,t 值越分散,t 分布的峰部越矮而尾部翘得越高;③当逼近∞时,t 分布逼 近 u 分布,故标准正态分布是 t 分布的特例。
相关文档
最新文档