中医药统计学.
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
抽样调查:从总体中抽取一定 数量观察单位组成样本,然后 根据样本信息来推断总体特征 典型调查:称案例调查。在对 事物进行全面分析的基础上, 选择典型的人或单位进行调查
组织调查
确定调查方 式及调查表 宣传目的及 培训调查员 实施调查及 抽样复查
整理分析
数据录入汇 总及复查 计算得统计 及专业结论
8.1.2 随机与系统抽样
抽样调查的方法有单纯随机抽样、系统抽样、整群抽 样、分层抽样 单纯随机抽样,是把调查总体的全部观察单位进行编 号,再用随机数表或抽签等方法随机抽取部分观察单 位组成样本。总体例数为N,样本例数为n,样本均数 及样本率的标准误分别为
n S2 S X 1 N n ˆ 1 p ˆ np Sp ˆ 1 N n 1
=4264.68+8410.09+11400.00+14392.93=38467.6985 n1=1000×4264.6805/38467.6985=110.8639
n2=218.6273,n3=296.3525,n4=374.1562
年龄组 人数Nj 比例分配nj 0~ 25000 179
5~ 31000 10~ 38000 15~19 46000 合计 140000
⑴ 正确划分调查范围 ⑵ 正确选择调查指标
⑶ 明确定义调查项目
⑷ 正确设置调查问题 ⑸ 选择恰当的调查方式 ⑹ 预调查 在调查阶段,常见非抽样误差及控制方法有下面2种 ⑴ 调查人员的工作态度不好,专业知识欠缺,业务 水平不足
⑵ 被调查者不能很好配合,因故不在,故意躲避、 拒查、有意隐瞒事情真相,记忆不清 在整理与分析阶段,非抽样误差主要源于计算机数据 录入、汇总、计算等方面的错误,在条件许可时应当 使用机读卡 调查质量一般使用效度与信度两个指标进行评价,应 做到效度与信度的统一。效度是调查工具对调查对象 测量的有效程度或准确程度,反映调查的真实性。信 度是调查工具对调查对象测量的可靠程度,反映调查 的稳定性或一致性。
221 271 329 1000
最 优 分 配 既往阳性率pj N j p j (1 p j ) 0.03 4264.68 0.08 8410.09 0.10 11400.00 0.11 14392.93 38467.70
nj 111
219 296 374 1000
8.1.4 调查误差的控制
在设计阶段常见的非抽样误差及控制方法有下面6种
故总体率的95%置信区间为
ˆ u0.05/ 2 S p p ˆ =0.1±1.96×0.0296=(0.0419,0.1581)
例2 欲调查某社区贫血患病情况,该社区有居民1000 人,试按系统抽样方法,抽取例数为100的样本 先将1000名居民按某一特征的顺序编号,总体例数N =1000,样本例数n=100,抽样间隔1000/100=10, 在 1~ 10之间随机确定一个数字,比如7,每间隔10个 观察单位取一个,抽取7,17,27,…,997组成样本
ai a 2 =(12-13.75)2+(11-13.75)2+(15-13.75)2
+(17-13.75)2=22.75
40 ˆ p 55 0.1833 3000 4
40 4 1 Sp 22.75 0.0174 1 ˆ 3000 40 4 (4 1)
Ni X i X
N
SX
2 (1 ni / N i ) N i2 S X
i
N
分层抽样中,样本率及其标准误分别为
ˆi Ni p ˆ p N
Sp ˆ
(1 ni / Ni ) Ni
N
2
2 Sp ˆ
i
例3 在某校40个班3000学生中,随机抽查4个班,学 生人数分别为60、80、90、120人,用锡克试验检查 白喉易感情况,查得阳性人数分别为12、11、15、17, 试以α=0.05水准估计该校学生锡克试验阳性率 这是整群抽样,N=3000,K=40、k=4、a1=12、 a2=11、a3=15、a4=17 a-=(12+11+15+17)/4=55/4=13.75
总体率95%的置信区间为 0.1833±1.96×0.0174=(0.1492,0.2174) 例4 某地0~19岁人群共14万人,欲调查其HbsAg
阳性率,已知各年龄组分组、人数及既往阳性率,若 确定样本例数为 1000 人,试分别按比例分配和最优 分配确定各年龄组的调查人数 这是分层抽样,按年龄组分为四层 按比例分配时,N=140000,N1=25000、N2=31000, N3=38000、N4=46000 n1=1000×25000/140000=178.57 n2=221.43,n3=271.43,n4=328.57 最优分配时,以既往阳性率为各层总体率pj的估计值 由p1=0.03、p2=0.08、p3=0.10、p4=0.11,计算得
nNi ni N
最优分配,是由总体第j层观察单位数Nj和标准差的 大小决定样本各层的容量nj,均数抽样和率抽样的公 式分别为 N j p j (1 p j ) N j j nj n nj n N i i N p (1 p )
i i i
分层抽样中,样本均数及其标准误分别为
主编
周仁郁
8.1 调查设计的全过程
8.1.1 调查设计的目的与方法
不加任何干预措施,客观描述研究总体的统计设计, 称为调查设计 调查设计包括确定方案,组织调查,整理分析全过程 调查方法可分为普查,抽样调查,典型调查3种
设Leabharlann Baidu方案
确定目的及 调查对象 定抽样方法 及样本容量 定调查项目 及观测指标
普查称全面调查:就是对总体 进行调查。普查一般用于了解 总体在某一特定时点上的情况
8.1.3 整群与分层抽样
整群抽样是把总体N个观察单位分为K个“群”,每 个群包含若干观察单位,随机抽取k个“群”,用这 些群中的全部观察对象组成样本。 整群抽样样本均数及其标准误分别为
K X X i Nk
k K k 1 SX (Ti T ) 2 1 N K k (k 1) i 1
1234 2978 6456 0782 5242 0744 3815 5100 1342 9966…
除以3000取余,随机抽样编号为
1234 2978 0456 0782 2242 0744 0815 2100 1342 0966…
N=3000,n=100为大样本,样本率p=0.1,标准误为
Sp ) 0.1 0.9 / 99 0.0296 ˆ (1 100/ 3000
随机抽样时,样本容量估计使用6.1的方法,但要用 有限总体公式进行校正。总体均数、总体率的样本容 量估计校正式分别为
n nC 1 n/ N
n nC 1 (n 1) / N
整群抽样≥随机抽样≥系统抽样≥分层抽样 系统抽样又称为机械抽样或等距抽样,是把总体观察 单位按一定顺序分为n个部分,从第一个部分随机抽 取第k位次的观察单位,再从每一部分中抽取相同位 次的观察单位,由这些观察单位组成样本
∑X为各群观察单位之和,Ti为第i群内观察值之和 整群抽样时,样本率及其标准误分别为
ˆ p
K ai Nk
k K k 1 2 Sp 1 ( a a ) ˆ i N K k k 1 i 1
其中,∑ai为各群阳性数之和 分层抽样又称分类抽样,是把总体按影响观察值变异 较大的某种特征分为若干类型或组别,称为层,再从 每一层随机抽取一定数量的观察单位合起来组成样本 分层设计时,先确定总样本容量n,再用按比例或最 优法确定第i层样本容量n 按比例分配,是由总体第i层的观察单位数Ni占总体所 有观察单位数的比例Ni/N决定样本各层的容量ni
N1 p1 (1 p1 ) 25000 0.03 (1 0.03) 4264.6805 N2 p2 (1 p2 ) 8410.0892 N3 p3 (1 p3 ) 11400 .0000 N4 p4 (1 p4 ) 14392 .9288
Ni
pi (1 pi )
例1 某校3000学生用随机数表抽取100人,若乙肝 表面抗原阳性样本率10%,求总体率95%置信区间
把全校学生编为0、1、…、2999号,查统计用表23, 任意指定某行某列,以4个数字为一组,除以3000取 余数为抽取的编号,后面出现与前面有相同的数字者 弃去。如从第9行第5列顺序取100组数
组织调查
确定调查方 式及调查表 宣传目的及 培训调查员 实施调查及 抽样复查
整理分析
数据录入汇 总及复查 计算得统计 及专业结论
8.1.2 随机与系统抽样
抽样调查的方法有单纯随机抽样、系统抽样、整群抽 样、分层抽样 单纯随机抽样,是把调查总体的全部观察单位进行编 号,再用随机数表或抽签等方法随机抽取部分观察单 位组成样本。总体例数为N,样本例数为n,样本均数 及样本率的标准误分别为
n S2 S X 1 N n ˆ 1 p ˆ np Sp ˆ 1 N n 1
=4264.68+8410.09+11400.00+14392.93=38467.6985 n1=1000×4264.6805/38467.6985=110.8639
n2=218.6273,n3=296.3525,n4=374.1562
年龄组 人数Nj 比例分配nj 0~ 25000 179
5~ 31000 10~ 38000 15~19 46000 合计 140000
⑴ 正确划分调查范围 ⑵ 正确选择调查指标
⑶ 明确定义调查项目
⑷ 正确设置调查问题 ⑸ 选择恰当的调查方式 ⑹ 预调查 在调查阶段,常见非抽样误差及控制方法有下面2种 ⑴ 调查人员的工作态度不好,专业知识欠缺,业务 水平不足
⑵ 被调查者不能很好配合,因故不在,故意躲避、 拒查、有意隐瞒事情真相,记忆不清 在整理与分析阶段,非抽样误差主要源于计算机数据 录入、汇总、计算等方面的错误,在条件许可时应当 使用机读卡 调查质量一般使用效度与信度两个指标进行评价,应 做到效度与信度的统一。效度是调查工具对调查对象 测量的有效程度或准确程度,反映调查的真实性。信 度是调查工具对调查对象测量的可靠程度,反映调查 的稳定性或一致性。
221 271 329 1000
最 优 分 配 既往阳性率pj N j p j (1 p j ) 0.03 4264.68 0.08 8410.09 0.10 11400.00 0.11 14392.93 38467.70
nj 111
219 296 374 1000
8.1.4 调查误差的控制
在设计阶段常见的非抽样误差及控制方法有下面6种
故总体率的95%置信区间为
ˆ u0.05/ 2 S p p ˆ =0.1±1.96×0.0296=(0.0419,0.1581)
例2 欲调查某社区贫血患病情况,该社区有居民1000 人,试按系统抽样方法,抽取例数为100的样本 先将1000名居民按某一特征的顺序编号,总体例数N =1000,样本例数n=100,抽样间隔1000/100=10, 在 1~ 10之间随机确定一个数字,比如7,每间隔10个 观察单位取一个,抽取7,17,27,…,997组成样本
ai a 2 =(12-13.75)2+(11-13.75)2+(15-13.75)2
+(17-13.75)2=22.75
40 ˆ p 55 0.1833 3000 4
40 4 1 Sp 22.75 0.0174 1 ˆ 3000 40 4 (4 1)
Ni X i X
N
SX
2 (1 ni / N i ) N i2 S X
i
N
分层抽样中,样本率及其标准误分别为
ˆi Ni p ˆ p N
Sp ˆ
(1 ni / Ni ) Ni
N
2
2 Sp ˆ
i
例3 在某校40个班3000学生中,随机抽查4个班,学 生人数分别为60、80、90、120人,用锡克试验检查 白喉易感情况,查得阳性人数分别为12、11、15、17, 试以α=0.05水准估计该校学生锡克试验阳性率 这是整群抽样,N=3000,K=40、k=4、a1=12、 a2=11、a3=15、a4=17 a-=(12+11+15+17)/4=55/4=13.75
总体率95%的置信区间为 0.1833±1.96×0.0174=(0.1492,0.2174) 例4 某地0~19岁人群共14万人,欲调查其HbsAg
阳性率,已知各年龄组分组、人数及既往阳性率,若 确定样本例数为 1000 人,试分别按比例分配和最优 分配确定各年龄组的调查人数 这是分层抽样,按年龄组分为四层 按比例分配时,N=140000,N1=25000、N2=31000, N3=38000、N4=46000 n1=1000×25000/140000=178.57 n2=221.43,n3=271.43,n4=328.57 最优分配时,以既往阳性率为各层总体率pj的估计值 由p1=0.03、p2=0.08、p3=0.10、p4=0.11,计算得
nNi ni N
最优分配,是由总体第j层观察单位数Nj和标准差的 大小决定样本各层的容量nj,均数抽样和率抽样的公 式分别为 N j p j (1 p j ) N j j nj n nj n N i i N p (1 p )
i i i
分层抽样中,样本均数及其标准误分别为
主编
周仁郁
8.1 调查设计的全过程
8.1.1 调查设计的目的与方法
不加任何干预措施,客观描述研究总体的统计设计, 称为调查设计 调查设计包括确定方案,组织调查,整理分析全过程 调查方法可分为普查,抽样调查,典型调查3种
设Leabharlann Baidu方案
确定目的及 调查对象 定抽样方法 及样本容量 定调查项目 及观测指标
普查称全面调查:就是对总体 进行调查。普查一般用于了解 总体在某一特定时点上的情况
8.1.3 整群与分层抽样
整群抽样是把总体N个观察单位分为K个“群”,每 个群包含若干观察单位,随机抽取k个“群”,用这 些群中的全部观察对象组成样本。 整群抽样样本均数及其标准误分别为
K X X i Nk
k K k 1 SX (Ti T ) 2 1 N K k (k 1) i 1
1234 2978 6456 0782 5242 0744 3815 5100 1342 9966…
除以3000取余,随机抽样编号为
1234 2978 0456 0782 2242 0744 0815 2100 1342 0966…
N=3000,n=100为大样本,样本率p=0.1,标准误为
Sp ) 0.1 0.9 / 99 0.0296 ˆ (1 100/ 3000
随机抽样时,样本容量估计使用6.1的方法,但要用 有限总体公式进行校正。总体均数、总体率的样本容 量估计校正式分别为
n nC 1 n/ N
n nC 1 (n 1) / N
整群抽样≥随机抽样≥系统抽样≥分层抽样 系统抽样又称为机械抽样或等距抽样,是把总体观察 单位按一定顺序分为n个部分,从第一个部分随机抽 取第k位次的观察单位,再从每一部分中抽取相同位 次的观察单位,由这些观察单位组成样本
∑X为各群观察单位之和,Ti为第i群内观察值之和 整群抽样时,样本率及其标准误分别为
ˆ p
K ai Nk
k K k 1 2 Sp 1 ( a a ) ˆ i N K k k 1 i 1
其中,∑ai为各群阳性数之和 分层抽样又称分类抽样,是把总体按影响观察值变异 较大的某种特征分为若干类型或组别,称为层,再从 每一层随机抽取一定数量的观察单位合起来组成样本 分层设计时,先确定总样本容量n,再用按比例或最 优法确定第i层样本容量n 按比例分配,是由总体第i层的观察单位数Ni占总体所 有观察单位数的比例Ni/N决定样本各层的容量ni
N1 p1 (1 p1 ) 25000 0.03 (1 0.03) 4264.6805 N2 p2 (1 p2 ) 8410.0892 N3 p3 (1 p3 ) 11400 .0000 N4 p4 (1 p4 ) 14392 .9288
Ni
pi (1 pi )
例1 某校3000学生用随机数表抽取100人,若乙肝 表面抗原阳性样本率10%,求总体率95%置信区间
把全校学生编为0、1、…、2999号,查统计用表23, 任意指定某行某列,以4个数字为一组,除以3000取 余数为抽取的编号,后面出现与前面有相同的数字者 弃去。如从第9行第5列顺序取100组数