计数资料的统计推断

合集下载

医学统计学---统计推断

第一节常用相对数
例5-1 某医院1998年在某城区随机调查了8589例60岁及以上老人，体检发现高血压患者为2823例。高血压患病率为： 2823 / 8589 100% = 32.87% 。

第一节常用相对数
二、构成比构成比：表示事物内部某一部分的个体数与该事物各部分个体数的总和之比，用来说明各构成部分在总体中所占的比重或分布。通常以100%为比例基数。其计算公式为
表 5-4 甲、乙两种疗法治疗某病的治愈率比较治愈率（%） 60.0 35.0 53.8 病人数 100 300 400 乙疗法治愈数 65 125 190 治愈率（%） 65.0 41.7 47.5
病
型
普通型重型合计
病人数 300 100 400
甲疗法治愈数 180 35 215
第三节率的标准化法

第三节率的标准化法
标准化法计算的关键是选择统一的标准构成。选择标准构成的方法通常有三种： 1.两组资料中任选一组资料的人口数（或人口构成）作为两者的“共同标准”。这种方法适用于直接法。 2.两组资料各部分人口之和组成的人口数（或人口构成）作为两者的“共同标准”。这种方法适用于直接法。 3.另外选用一个通用的或便于比较的标准作为两者的“共同标准”，如采用全国、全省或全地区的数据作为标准。

式中两指标可以是绝对数、相对数或平均数。
第一节常用相对数
例5-3 某年某医院出生婴儿中，男性婴儿为370 人，女性婴儿为358人，则出生婴儿性别比例为 370/358×100 = 103，说明该医院该年每出生 100名女婴儿，就有103名男性婴儿出生，它反映了男性婴儿与女性婴儿出生的对比水平。据大量观察，出生婴儿男多于女，出生性别比一般在104~107之间。这个医院的出生性别比为103，说明该年该医院出生女婴相对较多。

统计描述与统计推断

统计描述与统计推断统计的主要工作就是对统计数据进行统计描述和统计推断。

统计描述是统计分析的最基本内容，是指应用统计指标、统计表、统计图等方法，对资料的数量特征及其分布规律进行测定和描述；而统计推断是指通过抽样等方式进行样本估计总体特征的过程，包括参数估计和假设检验两项内容。

(一)统计描述1.计量资料的统计描述计量资料的统计描述主要通过编制频数分布表、计算集中趋势指标和离散趁势指标以及统计图表来进行。

(1)集中趋势。

指频数表中频数分布表现为频数向某一位置集中的趋势。

集中趋势的描述指标：1)算术平均数。

直接法：x为观察值，n为个数加权法又称频数表法，适用于频数表资料，当观察例数较多时用。

f为各组段的频数。

2）几何平均数（geometric mean）。

几何平均数用符号G表示。

用于反映一组经对数转换后呈对称分布的变量值在数学上的平均水平。

直接法：加权法又称频数表法，当观察例数n较大时，可先编制频数分布表，用此法算几何平均数：3)百分位数（percentile ）与中位数（median ）。

百分位数是一种位置坐标，用符号x P 表示常用的百分位数有 2.5P 、5P 、50P 、75P 、95P 、97.5P 等，其中25P 、50P 、75P 又称为四分位数。

百分位数常用于描述一组观察值在某百分位置上的水平，多个百分位结合使用，可更全面地描述资料的分布特征。

中位数是一个特定的百分位数即50P ，用符号M 表示。

把一组观察值按从小到大（或从大到小）的次序排列，位置居于最中央的那个数据就是中位数。

中位数也是反映频数分布集中位置的统计指标，但它只由所处中间位置的部分变量值计算所得，不能反映所有数值的变化，故中位数缺乏敏感性。

中位数理论上可以用于任何分布类型的资料，但实践中常用于偏态分布资料和分布两端无确定值的资料。

其计算方法有直接法和频数表法两种。

直接法：当观察例数n 不大时，此法常用，先将观察值按大小次序排列，选用下列公式求M 。

医学统计学之卡方x2检验

举例
买彩票
奖项中奖概率
T
A
一等 1% 10 0
0
二等 5% 50 0
0
三等 10% 100 20
2%
四等 20% 200 180
18%
五等 64% 640 800
80%
二、基本原理
基本思想是检验实际频数和理论频数的差别是否由抽样误差所引起的，由样本率来推断总体率。
x2反映了实际频数于理论频数的吻合程度，x2值
α=0.05。
T11 =44(41/70)=25.8 T12=44(29/70)=18.2 T21=26(41/70)=15.2 T22 = 26(29/70)=10.8
（2）求检验统计量值
2 (20 25.8)2 (24 18.2)2 (21 15.2)2 (5 10.8)2 8.40
作χ2检验后所得概率P接近检验水准α，需要
计数资料的统计推断
卡方检验是χ2检验(Chi-square test) 是现代统计学的创始人之一，英国人K . Pearson（1857-1936）于1900年提出的一种具有广泛用途的统计方法，是分类计数资料的假设检验方法,可用于两个或多个率间或构成比之间的比较，计数资料的关联度分析，拟合优度检验等等。
2 检验的应用
①检验两个样本率之间差别的显著性； ②检验多个样本率或构成比之间差别的
显著性； ③配对计数资料的比较； ④检验两个双向无序分类变量是否存在
关联。
某医生想观察一种新药对流感的预防效果，进行了如下的研究，问此药是否有效？
组别实验组对照组合计
发病人数 14 30 44
未发病人数 86 90 176
观察例数 100 120 220

统计方法介绍

（4）百分位数：第X百分位数以Px表示,它将全部观察值分成二个部分,其中有x%个观察值小于Px, (100-x)%个观察值大于Px。用途：1.描述一组资料在各个百分位置上的水平,用一组百分位数如P5 ，P25, P50, P75, P95,可以描述总体或样本的分布特征，如集中位置、变异度等。 2.确定医学正常值范围。
三. 方差分析
方差分析主要用于检验计量资料中两个或两个以上样本均数间差别的显著性。常见的错误是进行各组之间的两两t 检验。这将增加第一类误差的概率。两组以上均数的比较不能用两两t检验，而必须用方差分析。如差别有统计学意义，然后再进一步用SNK等方法作两两比较。
例：小白鼠给药前后发生咳嗽的推迟时间(秒)
1. 样本均数与总体均数比较的t检验
检验样本是否来自均数为μ0的已知总体。如：要研究现在13岁男孩的身高是否比20年前的13岁男孩高。 20年前的13岁男孩平均身高为1.30。现测量了13岁男孩100名平均身高为1.35，标准差为0.12,要检验现在13岁男孩身高的总体均数是否高于 1.30。
—————————————————————————— 单位组处理1 处理2 ……... 处理k
—————————————————————————— 1 2 ┇ b X11 X21 ┇ Xb1 X12 X22 ┇ Xb2 ……... ……... ……... X1k X2k ┇ Xbk
——————————————————————————
二个或多个构成比的比较或两个属性之间有无关系：
────────────────────── 血型民族 ────────────────── A B O AB 合计 ───────────────────── 傣族 f11 f12 f13 f14 n1+ 佤族土家族 f21 f31 f22 f32 f23 f33 f24 f34 n2+ n3+

《医学统计学》教学大纲(医学检验)

《医学统计学》课程教学大纲（Medical Statistics）一、课程基本信息课程编号：14232080课程类别：专业必修课适用专业：医学检验技术学分：理论教学学分：2学分，实验学分：0.5学分总学时：40学时（其中讲授学时：24学时；实验(上机)学时：16学时）先修课程：医学基础课程后续课程：医学检验、预防医学选用教材：李康主编：医学统计学(第6版)[M].北京：人民卫生出版社，2013必读书目：[1]方积乾主编.医学统计学(第7版)[M].北京：人民卫生出版社，2013[2]袁兆康.医学统计学[M].北京：人民军医出版社.2013[3]张文彤主编.SPSS统计分析基础教程(第2版)[M].北京：高等教育出版社，2011选读书目：[1] 颜虹, 医学统计学[M]. 北京：人民卫生出版社，2005[2] 康晓平，实用卫生统计学 [M].北京：北京大学医学出版社，2002[3] Belinda Barton，Medical Statistics: A Guide to SPSS, Data Analysis and Critical Appraisal [M].美国：WILEY Blackwell，2014二、课程教学目标通过本门课程的学习，要使学生学会人群健康研究的统计学方法，学会数值变量和分类变量资料的分析，配对资料的分析，直线相关和直线回归，非参数统计方法，病例随访资料分析。

其目的使大家具备新的推理思维，结合专业问题合理设计试验，科学获取资料，提高科研素质。

本课程教学的主要方法有理论讲授、课堂讨论、实验实习、课堂演算、统计软件SPSS上机等。

通过实验实习，使学生加深对理论的理解。

三、课程教学内容与教学要求1．绪论教学要求：掌握：同质与变异，总体、个体和样本，变量的分类，统计量与参数，抽样误差，频率与概率等基本概念。

理解：统计工作的基本步骤，医学统计学的主要内容。

了解：学习统计学的目的和要求。

计数资料的相关分析

计数资料的相关分析字体[大][中][小]对计数资料作相关分析的目的是推断两因素间有无相关关系，常用x2检验;必要时再进一步确定相关的密切程度，常用列联系数来说明。

分析时常按配对设计，将单一样本的每一观察单位同时按两种因素(如两种检验方法、两种治疗方法或两种特征等)的不同水平(如类别、等级、程度等)分组。

如甲因素有R个水平，乙因素有C个水平，分组后即得R×C 列联表。

如表1为R与C均等于2的2×2表，有a、b、c、d四个基本数据，特称为四格表。

表3为3×3表。

四格表资料的相关分析推断两因素间有无相关关系一般用x2检验，可按式(1)计算统计量x2值。

式中a、b、c、d为实际频数或对子数，n为样本含量或总对子数。

条目“两样本率比较”中，计算x2值的其他公式亦可选用。

算得x2值后，查x2界值表得P值，按所取检验水准作出推断结论。

当样本含量甚小时宜用四格表的确切概率法直接计算P值(见条目“四格表的确切概率法”)。

经假设检验推断两因素间有相关关系，若须进一步说明相关的密切程度，可按式(2)或式(3)计算相关系数(亦称列联系数) r或rn。

类似普通相关系数，其值在-1与+1之间。

绝对值愈大，相关程度愈高;等于1为完全正相关，等于-1为完全负相关，等于0为无相关。

式中a、b、c、d的意义同式(1)。

K. H. Ives和J. D. Gibbon提出用式中符号意义同式(1)，(a+d)为反应相同的对子数，(b+c)为反应不同的对子数。

由式(3)可见：如例1，若所有对子两法结果全相同，即b、c均为零，则rn=1，为完全正相关;若所有对子两法结果全不同，即a、d均为零，则rn=-1，为完全负相关;若结果相同与结果不同的对子数各占1/2，即α+d=b+c，则rn=0，为无相关。

例1 就表1资料说明两种方法检查食品沙门菌的结果是否一致。

表1用两法检查同一批鸭样的结果荧光抗体法常规培养法合计+ -+ - 160(a)5(c)26(b)48(d)18653合计165 74 239(1) 推断相关关系：H0：两法无相关，H1：两法有相关。

计数资料常用检验方法

计数资料行×列（R ×C）表卡方检验公式：
X2=35.81> , 差异有显著性，P<0.01，可以认为三组疗效不同，中西药结合组较其他两组高，若要进一步作两两比较，可分成三个四格表再进行比较。
中西药结合组
组别
有效
无效
合计
46
12
02
Pearson列联系数(P)
Cramer(修正)列联系数(C)
演讲人姓名
列联表计数资料的相关分析数据格式 (PEMS软件包)
卡方值 = 74.4015
自由度 v = 4
概率 P = 0.0000
Pearson 列联系数 = 0.2597
各个格子的理论数均大于 5
结果
列联表计数资料的相关分析.一致性检验.Kappa值(PEMS软件包)
66
12
78
0.05，差异无统计学意义，可以认为甲、乙两组有效率相同，如用X2值一般公式计算X2=2.85
(3) 、当总例数n>40，但有理论数0<T<1，或总例数n<40，有实际观察数为0的情况，此时应采用确切概率法直接算出概率P
两种药物治疗结果
组别
治愈
未愈
合计
新药
5(1.82)
、当总例数n>40,1<T<5时，由于理论数偏小，往往使得X2值偏大，此时可应用四格表X2值校正公式：
甲、乙两组有效率比较
表中有一个理论数 4.62（（30×12）/78=4.62）大于1小于5，可采用X2值校正公式计算
分组
有效数
无效数
合计数
甲组
38
10
48
乙组

量性研究资料的统计学分析方法--高等教育自学考试辅导《护理学研究》第八章第二节讲义1

正保远程教育旗下品牌网站美国纽交所上市公司(NYSE:DL)
自考365 中国权威专业的自考辅导网站
官方网站：高等教育自学考试辅导《护理学研究》第八章第二节讲义1
量性研究资料的统计学分析方法
一、计量资料的统计学分析方法
二、计数资料的统计学分析方法
三、等级资料常用的统计学分析方法
四、统计表和统计图
量性研究资料的统计分析包括两个方面：
①统计描述：即描述数据的分布规律和特征，常用均数、标准差、中位数、率、构成比等统计指标，以及统计表、统计图等进行描述。

②统计推断：即由样本信息推断总体特征，常用t 检验、方差分析、χ2检验、秩和检验等比较组间有无差异，以及相关分析、回归分析等探讨变量之间的关联性。

统计学分析方法的选择取决于研究目的、科研设计类型和资料类型。

计量资料的统计学分析方法
（一）统计描述
正态分布：均数±标准差
偏态分布：中位数、四分位数间距
1.均数。

计数资料的统计描述与统计推断

2 nnARn2C 1
(一) 多个样本率的比较：
表3.8 三种药物治疗高血压的疗效
处理
有效
无效
合计
有效率%
复方哌唑嗪 35
5
40
87.50
复方降压片 20
10
30
66.67
安慰剂
7
25
32
21.88
合计
62
40
102
60.78
38
H0:三种处理方法的有效率相等, 即π1= π2= π3 H1:三种处理方法的有效率不等或不全相等
某类死因构某成同年比年某死类亡死总因人死 1数亡 0% 0人数
8
（二）疾病统计指标
某病发病一率定该时期期间内新可病发能的生例发平的数生均某某人 K病
某病患病率某该时时点点某受病检现人患口病 K数例数
某
病
病死同因率期某某病
死亡人数病病 10人 % 0 数
29
31
（三）四格表χ2检验的专用公式
2
(ad b)c2n
(ab)c(d)a (c)b (d)
两组人群尿棕色素阳性率比较
组别
阳性数
阴性数
合计
铅中毒病人对照组
29（a) 9(c)
7(b) 28(d)
36(a+b) 37(c+d)
合计
38(a+c)
35(b+d)
73(n)
阳性率（%） 80.56 24.32 52.05
712 142 185
61
1100
4
0.6
9
6.3

《医学统计学》教学课件计数资料的统计推断 ——x2检验

2
ad bc2 n
a ca bc db d
11
例8.1
为了解某中药治疗原发性高血压的疗效，将 70名高血压患者随机分为两组。试验组用该药加辅助治疗，对照组用安慰剂加辅助治疗，观察结果如表8-1，问该药治疗原发性高血压是否有效？
12
表8-1 两种疗法治疗原发性高血压的疗效
组别对照组试验组合计
大，说明实际频数和理论频数的差距大，如果假
设检验成立，A与T不应该相差太大。理论上可以
证明
2 ( A T )2
T
服从x2分布，计算出x2值后，查表判断这么大的x2
是否为小概率事件，以判断建设检验是否成立。
7
χ2分布（chi-square distribution）
纵高
0.5 0.4 0.3 0.2 0.1 0.0
P=0.01， x2 =6.63 P=0.05时， v=1， x2 =3.84
v=2， x2 =5.99
9
三、四格表χ2检验
一般格式
处理组甲组乙组
四格表格式
发生数未发生数
a
b
a+b
c
d
c+d
a+c
b+d n=a+b+c+d
10
四格表统计量公式
当n≥40，T≥5时
2
( ARC TRC )2 TRC
21
年级四年级五年级
合计
表 8-2 两个年级大学生的近视眼患病率比较
近视
非近视
合计近视率（%）
2（4.67） 26(23.33)
28
7.14
5（2.33） 9 (11.67)

动物模型与动物实验设计—实验动物实验设计与分析

1. 数据的录入和清理在对数据录入之前，要对数据进行核实，
包括对数值和度量衡单位的核实。数据的录入和清理是为了防止和减少计算机录入的错误，进一步检查数据存在的问题。
9/9/2023
2 . 实验数据的分类对实验数据进行检查和核对完成后，还需将数
据进行整理。
9/9/2023
整理数据时应先区别原始数据是数量性状资料（包括连续性资料即计量资料和不连续性或间断性资料即计数资料），还是质量性状资料。
9/9/2023
8. 正交设计正交设计是一种高效、多因素实验的
设计。它是利用一套规格化的正交表将各实验因素、各水平之间的组合均匀搭配，合理安排，大大减少实验次数，并提供较多的信息。
9/9/2023
三、动物选择与观测指标 1. 动物选择
（1）动物类别选用哪种动物进行实验要根据实验目的、
动物的生物学特性以及实验经费、动物的易得性等而定。
动物动物
A
B
B
A
动物 …
B
…
A
…
拉丁方设计拉丁方实验设计是三困素、等水平的实验设计。
9/9/2023
它是将r个拉丁字母排成r行r列的方阵，使每行每列中的每个字母均只出现次，这样的方阵称r阶拉丁方，或r*r拉丁方，分别按拉丁字母、行和列安排处理因素及影响因素的试验（或实验）称拉丁方试验（或实验）。
动物实验的结果能否达到预期的效果，很大方面取决于实验设计是否科学严密
9/9/2023
实验分为预实验和正式实验，前者是对选题进行初步实验，以熟悉实验技术，确定正式实验的各项条件，然后进行正式实验；实验中应准确操作，认真观察，仔细记录各项实验结果。
9/9/2023

计量资料统计推断(t检验)-预防医学-课件

02
t检验的步骤
建立假设
假设检验的基本思想
设立原假设的依据
在假设检验中，通常先设立一个原假设，然后基于样本数据对原假设进行检验，判断是否拒绝原假设。
原假设的设立通常基于已有的研究结果、理论或实践经验，并且原假设应该是一个可以验证的命题。
原假设与备择假设
原假设通常是研究者想要否定的假设，备择假设则是研究者想要接受的假设。
p值是用于判断是否拒绝原假设的统计量，p值越小，说明样本数据与原假设之间的差异越大，
越有理由拒绝原假设。
显著性水平
显著性水平是预先设定的一个临界值，用于判断是否拒绝原假设
，通常取0.05或0.01。
结论的表述
根据p值与显著性水平的比较结果，可以得出是否拒绝原假设的结论，并进一步解释结果的意义
断实验处理或条件改变对数据的影响。
两独立样本t检验
总结词
用于比较两个独立样本的平均值是否存在显著性差异。
VS
详细描述
两独立样本t检验，也称为两组独立样本t 检验，是统计学中常用的方法之一，用于比较两个独立样本的平均值是否存在显著差异。这种方法常用于比较不同组对象的数据、不同条件下的独立测量等。通过计算t统计量，我们可以判断两组独立样本的均值是否存在显著差异，从而推断不同组别或条件对数据的影响。在进行两独立样本t检验时，需要注意样本来自的总体是否具有方差齐性和正态分布等统计假设，以确保检验结果的准确性和可靠性。
t检验的适用范围
• t检验适用于样本量较小、数据分布情况未知或总体标准差未知的情况。在预防医学领域，t检验常用于比较两组人群的生理指标、行为习惯等计量资料的差异。
t检验的假设条件
• 假设条件包括：样本数据来自正态分布总体、总体方差齐性、独立样本等。在进行t检验之前，需要检验样本数据是否满足这些假设条件，以确保统计推断的准确性。

统计学简答题汇总

统计学简答题汇总1、标准正态分布（u分布）与t分布有何异同？相同点：集中位置都为0，都是单峰分布，是对称分布，标准正态分布是t分布的特例（⾃由度是⽆限⼤时）不同点：t分布是⼀簇分布曲线，t 分布的曲线的形状是随⾃由度的变化⽽变化，标准正态分布的曲线的形状不变，是固定不变的，因为它的形状参数为1。

3、简述直线回归与直线相关的区别。

1资料要求上不同：直线回归分析适⽤于应变量是服从正态分布的随机变量，⾃变量是选定变量；直线相关分析适⽤于服从双变量正态分布的资料。

2 两种系数的意义不同：回归系数是表明两个变量之间数量上的依存关系，回归系数越⼤回归直线越陡峭，表⽰应变量随⾃变量变化越快；相关系数是表明两个变量之间相关的⽅向和紧密程度的，相关系数越⼤，两个变量的关联程度越⼤。

第⼀章医学统计中的基本概念2、抽样中要求每⼀个样本应该具有哪三性？从总体中抽取样本，其样本应具有“代表性”、“随机性”和“可靠性”。

（1）代表性: 就是要求样本中的每⼀个个体必须符合总体的规定。

（2）随机性: 就是要保证总体中的每个个体均有相同的⼏率被抽作样本。

（3）可靠性: 即实验的结果要具有可重复性，即由科研课题的样本得出的结果所推测总体的结论有较⼤的可信度。

由于个体之间存在差异, 只有观察⼀定数量的个体⽅能体现出其客观规律性。

每个样本的含量越多，可靠性会越⼤，但是例数增加，⼈⼒、物⼒都会发⽣困难，所以应以“⾜够”为准。

需要作“样本例数估计”。

3、什么是两个样本之间的可⽐性？可⽐性是指处理组（临床设计中称为治疗组）与对照组之间，除处理因素不同外，其他可能影响实验结果的因素要求基本齐同，也称为齐同对⽐原则。

实习⼀统计研究⼯作的基本步骤1、什么叫医学统计学？医学统计学与统计学、卫⽣统计学、⽣物统计学有何联系与区别？医学统计学：是运⽤统计学原理和⽅法研究⽣物医学资料的搜索、整理、分析和推断的⼀门学科统计学：是研究数据的收集、整理、分析与推断的科学。

计数资料统计推断(X2检验)-预防医学

N 为总合计数
疗法甲药乙药合计
治愈 20（） 18（）
38
未治愈 5（） 12（）
17
合计 25 30 55
整理ppt
6
一、准备工作
（二）判断能否作检验，是否需要校正
1、计算理论数： ×
T＝
＝ 7.7
疗法甲药乙药合计
治愈 20（17.3） 18（）
38
未治愈 5（） 12（）
＝（│24×8－10×3│－45／2）2×45 27×18×34×11
＝4.82
＋－合计
甲 24 3 27
乙 10 8 18
合计 34 11 45
整理ppt
15
二、假设检验
1、H0：π1＝π2 H1：π1≠π2 α=0.05
2、X2＝
(│ad－bc│－N／2)2 N (a＋b)(c＋d)(a＋c)(b＋d)
任何格子的T＞1。 1＜T＜5的格子数不得超过总格子数的1/5。
Ω 如果出现上述任何一种情况，可采用下列措施
扩大样本继续调查，直至T符合要求。将性质相近的邻行或邻列合并，使T符合要求将T不符合要求的行或列去除
整理ppt
17
行×列表X2检验
例：胡氏等某年在北京进行住宅日照卫生标准研究，对214幢楼房婴幼儿712人体检，检出轻度佝偻病患儿379例，列表如下，请分析儿童佝偻病与房屋朝向有无关系。
居室朝向患病人数无病人数
南
180
200
西、西南
14
16
东、东南
120
84
北、东北、西北
65
33
合计
379
333
合计 380

2012级临床专升本统计学复习题

专升本统计复习题汇总目录：第一部分：统计绪论习题一、名解1、总体2、样本3、变量4、同质5、参数6、统计量7、误差8、小概率事件二、选择题1、若要通过样本作统计推断，样本应是A．总体中典型的一部分 B. 总体中任一部分C. 总体中随机抽取的一部分D. 总体中选取的有意义的一部分E. 总体中信息明确的一部分2、统计量A. 是统计总体数据得到的量B. 反映总体统计特征的量C. 是根据总体中的全部数据计算出的统计指标D. 是用参数估计出来的E. 是由样本数据计算出的统计量3、抽样误差是指A.不同样本指标之间的差别B.样本指标与总体指标之间由于抽样产生的差别C.由于抽样产生观察值之间的差别D.样本中每个个体之间的差别E.随机测量误差和过失误差的总称4、教材中提及美国人1954年实施了旨在评价索尔克（Salk）疫苗预防小儿麻痹或死于脊髓灰质炎效果的临床试验。

有180万儿童参与，约有1/4参与者得到了随机化。

这180万儿童是。

A.目标总体B.研究总体C.1份样本D. 1份随机样本E. 180万份样本上述试验最终肯定了索尔克疫苗的效果。

请问系结论是针对（E）而言。

A.180万儿童B.每个儿童C.所有使用索尔克疫苗的儿童D.所有儿童E.180万儿童中随机化的1/45、概率是描述某随机事件发生的可能性大小的数值，以下对概率的描述哪项是正确的A.其值的大小在0和1之间B.当样本含量n充分大时，我们有理由将频率近似为概率C.随机事件发生的概率小于0.05或0.01时，可认为在一次抽样中它不可能发生D.必然事件发生的概率为1E.其值必须由某一统计量对应的概率分布表中得到6、统计学中所说的总体是指A.任意想象的研究对象的全体B.根据研究目的确定的研究对象的全体C.根据时间划分的研究对象的全体D.根据人群划分的研究对象的全体E.根据地区划分的研究对象的全体三、是非题1、定量变量、分类变量和有序变量可以相互转换。

2、同质的个体间不存在变异。

统计学复习题

《医学统计学》复习资料广西医科大学流行病与卫生统计学教研室2013.1.52012年留学生总复习练习题Part A理论考试题型一、单选题（每题1.5分，共45分。

请在答题卡上将正确答案对应的字母涂黑二、辨析题（每题3分，共15分。

判断对错，并给出理由）三、简答题（每题5分，共10分）四、分析应用题（共30分+10分）Part B练习题一、单选题（每题1.5分，共45分。

请在答题卡上将正确答案对应的字母涂黑）（一）计量资料统计描述1.卫生统计工作的步骤为________。

A.统计研究调查、搜集资料、整理资料、分析资料B.统计资料收集、整理资料、统计描述、统计推断C.统计研究设计、搜集资料、整理资料、分析资料D.统计研究调查、统计描述、统计推断、统计图表2.某病患者5人的潜伏期(天)分别为6,8,5,10,>13,则平均潜伏期为________。

A.5天B.8天C.6～13天D.11天3.算术均数与中位数相比，。

A.抽样误差更大B.不易受极端值的影响C.更充分利用数据信息D.更适用于分布不明及偏态分布资料值为。

4.标准正态分布中，单侧u0.05A．1.96B．0.05C．1.64D．0.0255.统计分析的主要内容有________。

A.统计描述和统计学检验B.区间估计与假设检验C.统计图表和统计报告D.统计描述和统计推断E.统计描述和统计图表6.统计资料的类型包括________。

A.频数分布资料和等级分类资料B.多项分类资料和二项分类资料C.正态分布资料和频数分布资料D.数值变量资料和等级资料E.数值变量资料和分类变量资料7.抽样误差是指________。

A.不同样本指标之间的差别B.样本指标与总体指标之间由于抽样产生的差别C.样本中每个体之间的差别D.由于抽样产生的观测值之间的差别E.测量误差与过失误差的总称8.统计学中所说的总体是指________。

A.任意想象的研究对象的全体B.根据研究目的确定的研究对象的全体C.根据地区划分的研究对象的全体D.根据时间划分的研究对象的全体E.根据人群划分的研究对象的全体9.描述一组偏态分布资料的变异度，宜用________。

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

例11-2 某新药的毒理研究中，用20只小白鼠作急性毒性实验，死亡3只，估计该药急性致死率的95%可信区间。从附表3（根据二项分布原理制成）查得，在n=20与X=3纵列交叉处的数值为3~38，即该药急性致死率的95% 可信区间为3%~38%。
如果死亡12只呢?
2018/6/22 Plan 1-2-3：1-17-33-44 10
6
（1）正态近似法
p 1.96S p
当n足够大，且样本率p和（1p）均不太小时，如np与n(1p) 均≥5时。
2018/6/22
Plan 1-2-3：1-17-33-44
7
如例11-1的p=0.1410，Sp =0.0125
该例的总体率双侧95%可信区间为（0.1410-1.96×0.0125， 0.1410+1.96×0.0125） →（0.1165，0.1655）即该地40-60岁成年男子高血压总体患病率的95%可信区间为11.65%～16.55%。注意：如果计算获得的可信区间下限小于0%，上限大于100%，则将下限直接定为0%，上限直接定为100%。
0.1333 0.0872
u=
0.0872 (1 0.0872 ) / 120
1.79
本例 1.79<1.96 , 故P>0.05 , 差异无显著性。按 α =0.05 水准，不拒绝H0，差别无统计学意义，尚不能认为某县该病的发病率与全国该病的发病率有差别 15 2018/6/22 Plan 1-2-3：1-17-33-44
率的u检验
大样本时，样本率的频数分布近似正态分布，故可用u检验，其假设检验的原理、步骤及方法与均数的u检验相同。
2018/6/22
Plan 1-2-3：1-17-33-44
13
率的u检验
1、单个总体率的假设检验
p 0 计算公式如下： u p 0
p
0 (1 0 ) / n
式中 P 为样本率，σP为总体率的标准误， π0为已知的总体率，n为样本含量。
2018/6/22
Plan 1-2-3：1-17-33-44
14
例11.5 某病的年发病率对全国人口来说为8.72%。现在某县回顾一年，抽样调查了120人，有16人发该病。问该县该病的发病率与全国该病的发病率有无差别？建立假设：H0：π =π 0 ， H1：π ≠π 0 α =0.05
2、两个总体率的假设检验
计算公式如下：
u p1 p2 S P1 P2
X1 X 2 n1 n2

p1 p2 pc (1 pc )(1 / n1 1 / n2 )
PC
式中P1 、P2为样本率，SP 1-P 2 为两样本率之差的标准误，PC为合并样本率，n1和 n2 分别为两样本含量， X1和X2分别为两样本的某类发生数。 16 2018/6/22 Plan 1-2-3：1-17-33-44
P 1 或者P 1 P n
率的抽样误差大小用率的标准误来衡量
2018/6/22
Plan 1-2-3：1-17-33-44
2
样本率抽样误差示意图：
样本 1 p1 样本 2 p2
样本 k pk
样本 3 p3
总体
π
样本 4 p4
总体率：π 样本率：P
2018/6/22
样本 6 p6
样本 5 p5
2018/6/22 Plan 1-2-3：1-17-33-44 5
二、率的可信区间
1.点值估计：直接用样本率代替总体率的估计值。方法简单，但是没有考虑抽样误差。
2.可信区间的估计：按照预先给定的概率（通常取 95％）来估计未知总体率所在的范围。
2018/6/22
Plan 1-2-3：1-17-33-44
三、率的u检验
1、单个总体率的假设检验 2、两总体率的假设检验
2018/6/22
Plan 1-2-3：1-17-33-44
11
总体率（或构成比）的假设检验当两个样本率不同时,有两种可能: （1）P1 , P2所代表的总体率相同,由于抽样误差的存在,造成的不同,这种差别在统计上叫差别无统计学意义。（2） P1 , P2所代表的总体率不同,即两个样本来不同的总体,其差别有统计学意义。现在就是要用统计学的方法进行判断到底属于那种情况。 12 2018/6/22 Plan 1-2-3：1-17-33-44
2018/6/22 Plan 1-2-3：1-17-33-44 4
例11-1：某地抽样调查40~60岁的成年男子 780人，得到高血压患病率为p=0.1410，问抽样误差为多少？
Sp p(1 p) 0.1410(1 0.1410) 0.0125 n 780
率的标准误小，说明抽样误差较小，表示样本率对总体率的代表性好
Plan 1-2-3：1-17-33-44
3
2.计算
p
(1 )
n
一般情况下，由于我们研究的是样本，未知，所以常用p代替，得到率的标准误的估计值：
sp
p (1 p ) n

pq n
（1）率的标准误，与样本含量的平方根成反比
（2）减小率的抽样误差的有效方法是增大样本含量
例11.6 某医师用某新药治疗类风湿关节炎，结果见右表，问两组治疗效果有无差别？建立假设： H 0： π 1 = π α =0.05
2
H1： π
1
≠π
2
127 36 PC 0.7309 148 75
2018/6/Plan 1-2-3：1-17-33-44 8
（2）非正态分布——查表法
当n≤50,或者P接近0或1的资料时，即np与n(1p) 均≤5时当x≤n/2时查： n,x 当x＞n/2时查： n,(n-x) 先得出阴性率，再用（1-阴性率）
2018/6/22 Plan 1-2-3：1-17-33-44 9
分类资料的统计推断
一、率的抽样误差与标准误二、总体率的估计三、率的u检验四、 2 检验（一）四格表 2 检验（二）配对四格表 2 检验（三）行×列表 2 检验
小结
2018/6/22 Plan 1-2-3：1-17-33-44
习题
1
一、率的抽样误差与标准误
1.率的抽样误差定义