第七章样本率(或构成比)比较的假设检验
《卫生统计学》考试题及答案

《卫生统计学》一、名词解释1. 计量资料2. 计数资料3. 等级资料4. 总体5. 样本6. 抽样误差7. 频数表8. 算术均数9. 中位数10. 极差11. 方差12. 标准差13. 变异系数14. 正态分布15. 标准正态分布16. 统计推断17. 抽样误差18. 标准误19. 可信区间20. 参数估计21. 假设检验中P的含义22. I型和II型错误23. 检验效能24. 检验水准25. 方差分析26. 随机区组设计27. 相对数28. 标准化法29. 二项分布30. Yates校正31. 非参数统计32. 直线回归33. 直线相关34. 相关系数35. 回归系数36. 人口总数37. 老年人口系数38. 围产儿死亡率39. 新生儿死亡率40. 婴儿死亡率41. 孕产妇死亡率42. 死因顺位43. 人口金字塔二、单项选择题1.观察单位为研究中的( D )。
A.样本 B.全部对象C.影响因素 D.个体2.总体是由( C )。
A.个体组成 B.研究对象组成C.同质个体组成 D.研究指标组成3.抽样的目的是( B )。
A.研究样本统计量 B.由样本统计量推断总体参数C.研究典型案例研究误差 D.研究总体统计量4.参数是指( B )。
A.参与个体数 B.总体的统计指标C.样本的统计指标 D.样本的总和5.关于随机抽样,下列那一项说法是正确的( A )。
A.抽样时应使得总体中的每一个个体都有同等的机会被抽取B.研究者在抽样时应精心挑选个体,以使样本更能代表总体C.随机抽样即随意抽取个体D.为确保样本具有更好的代表性,样本量应越大越好6.各观察值均加(或减)同一数后( B )。
A.均数不变,标准差改变 B.均数改变,标准差不变C.两者均不变 D.两者均改变7.比较身高和体重两组数据变异度大小宜采用( A )。
A.变异系数 B.方差C.极差 D.标准差8.以下指标中( D )可用来描述计量资料的离散程度。
国开作业实用卫生统计学-第七章 行列表 自测练习07参考(含答案)

题目:三个率比较的卡方检验,若P0.05,则结论是?()
选项A:至少有两个总体率有差别
选项B:总体率之间两两有差别
选项C:三个样本率各不相同
选项D:两两样本率之间各不相同
答案:至少有两个总体率有差别
题目:三行四列表作χ2检验,当有4个格子的理论频数1T5时,以下哪项可取?()
选项A:增加样本例数
选项B:仍做χ2检验
选项C:作校正的χ2检验
选项D:应进行适当的合并
答案:增加样本例数
题目:五个样本率比较的χ2检验,若结论拒绝无效假设,如果要推断它们彼此之间不同,或某两者之间有差别,可用什么方法?()
选项A:方差分析
选项B:χ2分割法
选项C:秩和检验
选项D:LSD法
答案:χ2分割法
题目:作多个样本率的假设检验,其检验假设是?()
选项A:π1=π2=……=πn
选项B:X1=X2= (X)
选项C:P1=P2 =……=Pn
选项D:m1= m2=……=mn
答案:π1=π2=……=πn
题目:四行四列表作χ2检验,当有2个格子的理论频数T1时,以下哪项可取?()选项A:仍做χ2检验
选项B:增加样本例数
选项C:应进行适当的合并
选项D:作校正的χ2检验
答案:增加样本例数
题目:行列表资料的χ2检验的目的之一是?()
选项A:推断其总体效应是否不同
选项B:推断其样本效应是否不同
选项C:推断其样本率或构成比是否不同
选项D:推断其总体率或构成比是否不同
答案:推断其总体率或构成比是否不同。
公卫执业医师-综合笔试-卫生统计学-第七单元卡方检验

公卫执业医师-综合笔试-卫生统计学-第七单元卡方检验[单选题]1.多个样本率比较X2检验中,若P≤a,拒绝H0,接受H1,所得的结论是A.多个样本率全相等B.多个总体率全相等(江南博哥)C.多个样本率不全相等D.多个总体率不全相等E.多个总体率全不相等正确答案:D参考解析:多个样本率的检验假设,H0多个总体率全相等,H1是多个总体率不全相等.掌握“行×列表资料的χ2检验★”知识点。
[单选题]2.在四行三列表χ2检验中,统计量χ2的自由度等于A.2B.3C.4D.6E.12正确答案:D参考解析:在行×列表χ2检验中,其自由度=(行数-1)×(列数-1)。
本题中自由度=(4-1)×(3-1)=6。
掌握“行×列表资料的χ2检验★”知识点。
[单选题]3.5个总体率比较的行×列表资料χ2检验的无效假设是5个总体率A.至少有2个相等B.至少有3个相等C.至少有4个相等D.全相等E.各不相等正确答案:D参考解析:行×列表资料χ2检验的无效假设是各总体率全相等。
所以选项D正确。
掌握“行×列表资料的χ2检验★”知识点。
[单选题]4.欲比较某药三个不同剂量水平对某病的疗效,宜选用的假设检验方法是A.四格表资料的χ2检验B.成组资料的t检验C.行×列表资料的χ2检验D.秩和检验E.方差分析正确答案:C参考解析:行×列表资料:当比较组数大于等于2,或资料的属性分类数大于等于2种时,数据可采用多行×多列表形式来表达,称行×列表。
行×列表的χ2检验用于检验两个或多个样本率(构成比)的差别是否有统计学意义。
该资料属于行×列表资料,应采用行×列表的χ2检验,故选项C正确。
掌握“行×列表资料的χ2检验★”知识点。
[单选题]5.多个样本率比较的R×C表χ2检验,以下错误的一项是A.其备择假设是多个总体率不全相等B.χ2的自由度是(R一1)(C--1)C.χ2值越小,越有理由认为理论频数与实际频数符合的好D.由于格子数较多,可不必考虑每个格子的理论数的大小E.若P0.01,还不能推断每两个率值不等正确答案:D参考解析:在卡方检验中,不论格子多少,都需要考虑每个格子的理论数的大小。
《卫生统计学》考试重点复习资料

②权衡两类错误的危害以确定α的大小。 ③正确理解 P 值的意义,如果 P<α,宜说差异“有统计学意义”。
第八章 方差分析
名词解释
总变异:样本中全部实验单位差异称为总变异。其大小可以用全部观察值的均方(方差)表 示。 组间变异:各处理组样本均数之间的差异,受处理因素的影响,这种变异称为组间变异,其 大小可用组间均方表示。 组内变异: 各处理组内部观察值大小不等,这种变异称为组内变异,可用组内均方表示。 随机区组设计:事先将全部受试对象按自然属性分为若干区组,原则是各区组内的受试对象 的特征相同或相近,且受试对象数与处理因素的水平数相等。然后再将每个区组内的观察对 象随机地分配到各处理组,这种设计叫做随机区组设计。
构成比
某一组成部分的观察单 位数 同一事物各组成部分的 观察单位总数
100 %
③比又称相对比,是 A、B 两个有关指标之比,说明两者的对比水平,常以倍数或百分数表
示,其公式为:相对比=甲指标 / 乙指标(或 100%)
甲乙两个指标可以是绝对数、相对数或平均数等。
应用相对数时应注意哪些问题?
答:应用相对数时应注意的问题有:
相对数:是两个有联系的指标之比,是分类变量常用的描述性统计指标,常用相对数有率、
构成比、比等。
标准化法:是常用于内部构成不同的两个或多个率比较的一种方法。标准化法的基本思想就
是指定一个统一“标准”(标准人口构成比或标准人口数),按指定“标准”计算调整率,使
之具备可比性以后再比较,以消除由于内部构成不同对总率比较带来的影响。
料间的相对水平。 3) 报告比较结果时必须说明所选用的“标准”和理由。 4) 两样本标准化率是样本值,存在抽样误差。当样本含量较小时,还应作假设检验。
第七章样本率(或构成比)比较的假设检验

第七章样本率(或构成比)比较的假设检验第七章样本率(或构成比)比较的假设检验第一节样本率与总体率比较的u检验样本率与总体率(一般为已知的理论值、标准值或经大量观察所得到的稳定值等)比较的目的,是推断该样本所代表的未知总体率π与已知总体率π0是否不同。
u检验的适用条件:当样本含量n足够大,且样本率p和(1-p)均不太小,如np与n(1-p)均大于5时,样本率的分布近似正态分布,此时样本率与总体率差别的假设检验可利用正态分布的原理作u 检验。
第二节两个样本率比较的u检验当两样本含量n1及n2足够大,且两个样本率p1、(1-p1)及p2、(1-p2)均不太小,如n1 p1和n1(1- p1)及n2 p2和n2(1- p2)均大于5时,可根据正态分布原理,进行u检验。
第三节四格表资料的χ2检验(两个样本率比较)一、两个样本率资料的四格表形式1、χ2检验的基本思想χ2值反映了实际频数和理论频数的吻合程度。
χ2值越小,说明实际频数与理论频数越吻合,χ2值越大,说明实际频数与理论频数差异越大。
如果检验假设成立,则实际频数与理论频数之差一般不会很大,即出现大的χ2值的概率是小的。
若在无效假设下,出现了大的χ2值的概率P≤α(检验水准),我们就怀疑假设的成立,因此拒绝它。
另外χ2值的大小,还与自由度有关。
故考虑χ2值大小的意义时要同时考虑自由度。
若χ2≥χ2α,,(υ), 则P≤α, 拒绝H0,接受H1。
2、四格表χ2检验的的校正公式(1)当自由度为1的四格表资料,理论数较小时,需做连续性校正。
(2)四格表χ2检验的适用条件当n>40,且所有T≥5时,用χ2检验的基本公式或四格表专用公式。
当n>40,但有1<t<5时,需用四格表χ2检验的校正公式。
< p="">若n≤40,或T≤1时,需用确切概率计算法。
第四节行×列表资料的χ2检验一、多个样本率和构成比资料,其基本数据均可整理成R行C列,称为R×C表,又称行×列表,χ2检验目的是推断其总体率或构成比是否不同。
医学统计学重点简答题

一、平均水平常用的统计指标及其适用范围?常用统计指标包括算术均数,几何均数,中位数。
算术均数适用于对称分布,特别是正态分布的数据;几何均数适用于经对数变换后频数分布对称或呈等比级数的数据;中位数主要适用于三种情形:①非正态分布资料(对数正态分布除外)。
②频数分布的一端或两端无确切数据的资料。
③总体分布不清楚的资料。
二、应用相对数的注意事项1.计算相对数时应有足够的观察单位数。
例数太少会使相对数波动较大,这种情况下最好用绝对数表示。
2。
正确计算合计率. 计算观察单位不等的几个率的合计率(平均率)时,不能将几个率直接相加求其平均率,而应分别将分子分母合计,再求出合计率。
3不能以构成比代替率. 构成比说明事物内部各部分所占的比重,不能说明某现象发生的频率或强度.4.注意资料的可比性。
在比较相对数时,除了要比较的因素外,其余的因素应尽可能相同或相近。
5。
样本率或构成比的比较应做假设检验. 由于样本率或构成比也存在抽样误差,比较两个或多个率或构成比时,不能凭样本率或构成比的差别作出结论,而必须进行差别的假设检验。
三、正常值范围与置信区间的区别四、标准误与标准差的区别与联系.区别点标准误标准差含义样本均数的标准差,描述样本均数的抽样误差,即样本均数与总体均数的接近程度。
描述个体间的变异程度计算公式1k)xx(s2x--=∑---1n)xx(s2--=∑-用途总体均数的区间估计医学参考值范围估计相似点性质相似,都是用来说明变异程度五、简述四格表卡方检验统计方法的选择条件六、行×列表资料χ²检验的注意事项1。
行×列表资料中各格的理论频数T均不应小于1,并且1≤ T<5的格子数不宜超过格子总数的1/5,否则可能产生偏性。
处理的方法有三种:①增大样本含量,使理论频数增大;②根据专业知识,删去理论频数太小的行或列或将理论频数太小的行或列与性质相近的邻行或邻列合并。
③改用双向无序R×C表的Fisher确切概率法。
医学统计知识点整理

医学统计学知识点整理第一节统计学中基本概念一、同质与变异同质:统计研究中,给观察单位规定一些相同的因素情况。
如儿童的生长发育,规定同性别、同年龄、健康的儿童即为同质的儿童。
变异:同质的基础上个体间的差异。
“同质”是相对的,是客观事物在特定条件下的相对一致性,而“变异”则是绝对的μ.δ.πX.S.p1.2.变量:确定总体之后,研究者应对每个观察单位的某项特征进行观察或测量,这种特征能表现观察单位的变异性,称为变量。
一、数值变量资料又称为计量资料、定量资料:观测每个观察单位某项指标的大小而获得的资料。
表现为数值大小,带有度、量、衡单位。
如身高(cm)、体重(kg)、血红蛋白(g)等。
二、无序分类变量资料又称为定性资料或计数资料:将观察对象按观察对象的某种类别或属性进行分组计数,分组汇总各组观察单位后得到的资料。
分类:二分类:+ -;有效,无效;多分类:ABO血型系统特点:没有度量衡单位,多为间断性资料【例题单选】某地A、B、O、AB血型人数分布的数据资料是( )A.定量资料B.计量资料C.计数资料D.等级资料分组统计描述:是利用统计指标、统计表和统计图相结合来描述样本资料的数量特征及分布规律。
统计推断:是使用样本信息来推断总体特征。
统计推断包括区间估计和假设检验。
第四节统计表与统计图★一、统计表统计表的基本结构与要求标题:高度概括表的主要内容,时间、地点、研究内容,位于表的上方,居中摆放,左侧加表的序号。
标目:横标目和纵标目。
线条:通常采用三线表和四线表的形式。
没有竖线或斜线。
数字:表内数字一律用阿拉伯数字。
同一指标,小数位数应一致,位次对齐。
无数字用“—”表示。
暂缺用“…”表示。
“0”为确切值。
备注:位于表的下面,通常是对表内数字的注解和说明,必要时可以用“*”等标出。
一张统计表的备注不宜太多。
二、制表原则1.(7理分布。
【例题填空】描述某地十年间结核病死亡率的变化趋势宜绘制_________图。
卫生统计学第七章卡方检验

做答人数:0
做对人数:0
所占比例: 0
题号: 15 本题分数: 2
χ2检验应用范围不包括
A. 两个或多个率的差别
B. 两个或多个构成比的差别
C. 小样本配对设计计量资料均数的比较
D. 两种属性间的相关分析
E. 检验频数分布的似合优度
正确答案: C
A. 三个总体率不同或不全相同
B. 三个总体率都不相同
C. 三个样本率都不相同
D. 三个样本率不同或不全相同
E. 三个总体率中有两个不同
正确答案: A
答案解析:三个率比较的假设检验中,H0:三个总体率全相等,H1:三个总体率不全相等,包括三个总体率全不同或不全相同,当χ2>χ20.01(2),P<0.01,拒绝H0,接受H1,可认为三个总体率不同或不全相同,故答案为A。
做答人数:0
做对人数:0
所占比例: 0
题号: 12 本题分数: 2
对于总合计数n为400的4个样本率的资料做χ2检验,其自由度为
A. 399
B. 396
C. 1
D. 4
E. 3
正确答案: E
答案解析:4个样本率的比较,资料可整理为4×2的行×列表,χ2统计量所对应的自由度为(4-1)×(2-1)=3。
统计大题

当真实情况为Ho不成立而H1成立时,假设检验结论不拒绝Ho,这类错误称为第二类错误或Ⅱ型错误,用β表示。1-β称为检验效能,也称把握度。
α愈小β愈大;相反,α愈大β愈小。若要同时减小Ⅰ型错误α和Ⅱ型错误β,唯一的方法就是增加样本含量n。
α愈小β愈大;相反,α愈大β愈小.若要同时减小Ⅰ型错误α和Ⅱ型错误β,唯一的方法就是增加样本含量n.
注意:拒绝Ho,只可能犯Ⅰ型错误,不可能犯Ⅱ型错误;不拒绝Ho,只可能犯Ⅱ型错误,不可能犯Ⅰ型错误.
(1)理论依据
"小概率事件在一次随机试验中不(大)可能发生"的推断原理.
(2)假设检验时拒绝实际上成立的Ho,犯第Ⅰ类错误,俗称"弃真"错误;不拒绝实际上并不成立的Ho,犯第Ⅱ类错误,俗称"存伪"错误.犯第Ⅰ类错误的概率用α表示,假设检验时,根据研究者的要求来确定;犯第二类错误的概率用β表示,它只有与特定的H1结合起来才有意义.对于某一具体的检验来说,当样本含量n一定时,α越小β越大,α越大β越小.
(5)样本率(或构成比)的比较需作假设检验。
二项分布,Poisson分布和正态分布的关系
二项分布,Poisson分布是离散型概率分布,用概率函数描述其分布状况,而正态分布是连续型概率分布,用密度函数和分布函数描述其分布状况。Poisson分布可以视为是n很大而π很小的二项分布。当n很大而π和1-π都不是很小的时候二项分布渐近正态分布,当λ≥20的时候Poisson分布渐近正态分布。
S趋近于σ(恒定)
标准误减少并趋近于0(不存在抽样误差)
(3)用途不同
S表示个体值变异度的大小,计算变异系数,估计正常值范围,计算标准误等;
第7章 χ2检验

89.02
70.27 80.13
2、计算卡方值 a=73 b=9 c=52 d=22 n=156 2 ( ad bc ) n 2 =8.59 (a b)(a c)(b d )(c d )
(四)四格表资料卡方检验的校正
1、校正条件: n≥40,且 1<T<5(一个及以上格子) 2、基本公式
那么A药组82人中理论上讲有效人数为65.7人
(82*80.13%=65.7),即第一行第一列的理论频
数为82*80.13%=65.7
n n R C 用计算,即 也可以 T RC n
T11=125*82/156=65.7)。
表7-1 两药治疗脑血管栓塞有效率比较
药物 A B 合计 有效 73 (65.7) 52 (59.3) 125 无效 9 (16.3) 22 (14.7) 31 合计 82 74 156 有效率(%) 89.02 70.27 80.13
a c
b d
73 52
9 3
四格表资料的基本形式
处理组 A药 B药 合 计 发生数 未发生数 合计 a+b c+d n
a c a+c
b d b+d
请判断下列a、b、c谁属四格表:两组大白鼠 在不同致癌剂作用下的发癌率如下表,问两组发 癌率有无差别?
表 处理 甲组 乙组 合计 不同致癌剂作用下大白鼠发癌率比较 例数 71 42 113 发癌数 52 39 91 未发癌数 19 3 22 发癌率% 73.24 92.86 80.33
T 怎么求 ?
n n R C T:理论频数(theoretical frequency) TRC n T 第R 行C 列的理论频数
中南大学《卫生统计学》课程作业(网上作业)二及参考答案

(一) 单选题1. 构成比具有的特点为()。
(A)各个组成部分的构成比之和等于100%或1(B) 各个组成部分的构成比之和小于100%或1(C) 各个组成部分的构成比之和大于100%或1(D) 各个组成部分的构成比之和大于或小于100%或1(E) 以上都不对参考答案:(E)2. 配对资料的秩和检验,统计量的确定为()。
(A)只可取T+作为统计量(B) 只可取T-作为统计量(C) T+、T-可任取一个作为统计量(D) 只以绝对值小的作为统计量(E) 以上均不对参考答案:(C)3. 等级资料两样本比较的秩和检验中,如相同秩次过多,应计算校正值,校正结果使()。
(A)值增大,值减小(B) 值增大,值增大(C) 值减小,值增大(D) 值减小,值减小(E) 视具体资料而定参考答案:(A)4. 下列哪种说法是错误的()。
(A)计算相对数尤其是率时应有足够数量的观察单位数或观察次数(B) 分析大样本数据时可以用构成比代替率(C) 应分别将分子和分母合计求合计率或平均率(D) 相对数的比较应注意其可比性(E) 样本率或构成比比较时应作假设检验参考答案:(B)5. 甲、乙两个医院的等级相同,规模相当。
在某年疾病统计中发现:甲院对5型肝炎的治愈率都高于乙院,但总的治愈率却是乙院的总治愈率反而高于甲院的总治愈率,造成这种矛盾现象,最可能的原因是()。
(A)两个医院对预后的诊断标准不一致(B) 两个医院各型病人的构成比相差太大(C) 两个医院医疗技术相差悬殊(D) 两个医院的领导重视程度相差悬殊(E) 两个医院的设备相差太大参考答案:(B)6.样本含量分别为的两组数值变量资料比较,用秩和检验时有()。
(A)秩次范围为(B) 秩次范围为(C) 秩次范围为(D) 秩次范围为(E) 无限个秩次参考答案:(C)7.设配对设计资料的变量值为,则配对资料的秩和检验()。
(A)分别按从小到大编秩(B) 把所有观察值从小到大编秩(C) 把所有观察值按绝对值从小到大编秩(D) 把的差值从小到大编秩(E) 把的差值的绝对值从小到大编秩参考答案:(E)8.秩和检验中,统计量与的关系中,描述正确的是()。
率与构成比的假设检验概述

故用
不能反映实际观察频数与理论观 察频数相差的程度
❖ 如果将A-T平方,并将各组 相加,得总
数
。观察频数与理论频数相差越大
❖ ,则
的数值越大,反之则越小。
❖ 尚有不足之处,因为绝对差异数还不能完全 反映相差的程度:
❖ 某一资料的观察频数为204,理论频数为200
❖ 另一资料的观察频数为19,理论频数为15
(1)建立假设,确定检验水准 (2)计算检验统计量
(3)求P值,做统计结论
(4) 作统计结论
在α=0.05的水平上拒绝H0,接受 H1 , 可认为吸烟与不吸烟的中学生心理特质构成不同。
注 意 事 项:
1.总样本量不能太小,至少50例; 2.如有1/5以上格子的理论数小于5或 有一个格子的理论数小于1;应考虑 a.条件允许时增加样本含量以增大 理论数;
(1)建立假设,确定检验水准 (2)计算检验统计量
(3)确定P值,作统计结论
所以P< 0 . 005 ,
在 a = 0 . 05 水平上拒绝 H0,接受 H1 , 可认为两种检测结果有关联。
2. 两种检测结果比率比较
❖在本章前部已经对配对设计有所了 解。如果这种设计的反应变量为二 项分类,其观察结果可以整理成 2 x2 表(如表 14-18 )。对这种资料分 析的目的之一是比较两种方法的阳 性率 。
(3)确定P值作统计结论
查附表13, 知 0 . 5 < P < 0 .75,在a= 0.05 的水平 上不能拒绝 H 。 所以尚不能认为P53 在两种病理切片 的表达率不同。 本例如果不校正,X2= 0 . 6835 ,相应 的 0 . 25 < P < 0 . 5 。
四、四格表精确概率法
医药数理统计习题及答案

第一套试卷及参考答案一、选择题(40分)1、根据某医院对急性白血病患者构成调查所获得的资料应绘制( B )A 条图B 百分条图或圆图C线图D直方图2、均数和标准差可全面描述 D 资料的特征A 所有分布形式B负偏态分布C正偏态分布D正态分布和近似正态分布3、要评价某市一名5岁男孩的身高是否偏高或偏矮,其统计方法是( A )A 用该市五岁男孩的身高的95%或99%正常值范围来评价B 用身高差别的假设检验来评价C 用身高均数的95%或99%的可信区间来评价D 不能作评价4、比较身高与体重两组数据变异大小宜采用(A )A 变异系数B 方差C 标准差D 四分位间距5、产生均数有抽样误差的根本原因是( A )A.个体差异B. 群体差异C. 样本均数不同D. 总体均数不同6. 男性吸烟率是女性的10倍,该指标为(A )(A)相对比(B)构成比(C)定基比(D)率7、统计推断的内容为( D )A.用样本指标估计相应的总体指标B.检验统计上的“检验假设”C. A和B均不是D. A和B均是8、两样本均数比较用t检验,其目的是检验( C )A两样本均数是否不同B两总体均数是否不同C两个总体均数是否相同D两个样本均数是否相同9、有两个独立随机的样本,样本含量分别为n1和n2,在进行成组设计资料的t检验时,自由度是( D )(A)n1+ n2(B)n1+ n2–1(C)n1+ n2 +1(D)n1+ n2 -210、标准误反映(A )A 抽样误差的大小 B总体参数的波动大小C 重复实验准确度的高低D 数据的离散程度11、最小二乘法是指各实测点到回归直线的 (C)A垂直距离的平方和最小B垂直距离最小C纵向距离的平方和最小D纵向距离最小12、对含有两个随机变量的同一批资料,既作直线回归分析,又作直线相关分析。
令对相关系数检验的t值为tr ,对回归系数检验的t值为tb,二者之间具有什么关系?(C)A tr >tbB tr<tbC tr= tbD二者大小关系不能肯定13、设配对资料的变量值为x1和x2,则配对资料的秩和检验(D )A分别按x1和x2从小到大编秩B把x1和x2综合从小到大编秩C把x1和x2综合按绝对值从小到大编秩D把x1和x2的差数按绝对值从小到大编秩14、四个样本率作比较,χ2>χ20.05,ν可认为( A )A各总体率不同或不全相同 B各总体率均不相同C各样本率均不相同 D各样本率不同或不全相同15、某学院抽样调查两个年级学生的乙型肝炎表面抗原,其中甲年级调查35人,阳性人数4人;乙年级调查40人,阳性人数8人。
医学统计学思考题

医学统计学思考题第一章绪论1.举例说明总体和样本的概念。
研究人员通常需要了解和研究某一类个体,这个类就是总体。
总体是根据研究目的所确定的所有同质观察单位某种观察值(即变量值)的集合,通常有无限总体和有限总体之分,前者指总体中的个体是无限的,如研究药物疗效,某病患者就是无限总体,后者指总体中的个体是有限的,它是指特定时间、空间中有限个研究个体。
但是,研究整个总体一般并不实际,通常能研究的只是它的一部分,这个部分就是样本。
例如在一项关于2007年西藏自治区正常成年男子的红细胞平均水平的调查研究中,该地2007年全部正常成年男子的红细胞数就构成一个总体,从此总体中随即抽取2000人,分别测的其红细胞数,组成样本,其样本含量为2000人。
2.简述误差的概念。
误差泛指实测值与真实值之差,一般分为随机误差和非随机误差。
随机误差是使重复观测获得的实际观测值往往无方向性地围绕着某一个数值左右波动的误差;非随机误差中最常见的为系统误差,系统误差也叫偏倚,是使实际观测值系统的偏离真实值的误差。
3.举例说明参数和统计量的概念。
某项研究通常想知道关于总体的某些数值特征,这些数值特征称为参数,如整个城市的高血压患病率。
根据样本算得的某些数值特征称为统计量,如根据几百人的抽样调查数据所算得的样本人群高血压患病。
统计量是研究人员能够知道的,而参数是他们想知道的。
一般情况下,这些参数是难以测定的,仅能够根据样本估计。
显然,只有当样本代表了总体时,根据样本统计量估计的总体参数才是合理的。
4.简述小概率事件原理。
当某事件发生的概率小于或等于0.05时,统计学上习惯称该事件为小概率事件,其含义是该事件发生的可能性很小,进而认为它在一次抽样中不可能发生,这就是所谓的小概率事件原理,它是进行统计推断的重要基础。
第二章调查研究设计1.调查研究主要特点是什么?调查研究的主要特点是:①研究的对象及其相关因素(包括研究因素和非研究因素)是客观存在的,不能人为给予干预措施②不能用随机化分组来平衡混杂因素对调查结果的影响。
医学统计学--问答题

1、标准正态分布(u分布)与t分布有何异同?相同点:集中位置都为0,都是单峰分布,是对称分布,标准正态分布是t分布的特例(自由度是无限大时)不同点:t分布是一簇分布曲线,t 分布的曲线的形状是随自由度的变化而变化,标准正态分布的曲线的形状不变,是固定不变的,因为它的形状参数为1。
3、简述直线回归与直线相关的区别。
1资料要求上不同:直线回归分析适用于应变量是服从正态分布的随机变量,自变量是选定变量;直线相关分析适用于服从双变量正态分布的资料。
2 两种系数的意义不同:回归系数是表明两个变量之间数量上的依存关系,回归系数越大回归直线越陡峭,表示应变量随自变量变化越快;相关系数是表明两个变量之间相关的方向和紧密程度的,相关系数越大,两个变量的关联程度越大。
第一章医学统计中的基本概念2、抽样中要求每一个样本应该具有哪三性?从总体中抽取样本,其样本应具有“代表性”、“随机性”和“可靠性”。
(1)代表性: 就是要求样本中的每一个个体必须符合总体的规定。
(2)随机性: 就是要保证总体中的每个个体均有相同的几率被抽作样本。
(3)可靠性: 即实验的结果要具有可重复性,即由科研课题的样本得出的结果所推测总体的结论有较大的可信度。
由于个体之间存在差异, 只有观察一定数量的个体方能体现出其客观规律性。
每个样本的含量越多,可靠性会越大,但是例数增加,人力、物力都会发生困难,所以应以“足够”为准。
需要作“样本例数估计”。
3、什么是两个样本之间的可比性?可比性是指处理组(临床设计中称为治疗组)与对照组之间,除处理因素不同外,其他可能影响实验结果的因素要求基本齐同,也称为齐同对比原则。
实习一统计研究工作的基本步骤1、什么叫医学统计学?医学统计学与统计学、卫生统计学、生物统计学有何了解与区别?医学统计学:是运用统计学原理和方法研究生物医学资料的搜索、整理、分析和推断的一门学科统计学:是研究数据的收集、整理、分析与推断的科学。
卫生统计学:是把统计理论、方法应用于居民健康状况研究、医疗卫生实践、卫生事业管理和医学科研的一门应用学科。
卫生统计学第二版习题册方积乾答案与解析

卫生统计学第二版习题册方积乾答案与解析第一章绪论1、统计资料可以分为那几种类型?举例说明不同类型资料之间是如何转换的?答:(1)1定量资料(离散型变量、连续型变量)、2无序分类资料(二项分类资料、无序多项分类资料)、3有序分类资料(即等级资料);(2)例如人的健康状况可分为“非常好、较好、一般、差、非常差”5个等级,应归为等级资料,若将该五个等级赋值为5、4、3、2、1,就可按定量资料处理。
2、统计工作可分为那几个步骤?答:设计、收集资料、整理资料、分析资料四个步骤。
3、举例说明小概率事件的含义。
答:某人打靶100次,中靶次数少于等于5,那么该人一次打中靶的概率≤0.05,即可称该人一次打中靶的事件为小概率事件,可以视为很可能不发生。
第二章调查研究设计1、调查研究有何特点?答:(1)不能人为施加干预措施;(2)不能随机分组;(3)很难控制干扰因素;(4)一般不能下因果结论2、四种常用的抽样方法各有什么特点?答:(1)单纯随机抽样:优点是操作简单,统计量的计算较简便:缺点是当总体观察单位数量庞大时,逐一编号繁复,有时难以做到。
(2)系统抽样:优点是易于理解、操作简便,被抽到的观察单位在总体中分布均匀,抽样误差较单纯随机抽样小:缺点是在某些情况下会出现偏性或周期性变化。
(3)分层抽样:优点是抽样误差小,各层可以独立进行统计分析,适合大规模统计:缺点是事先要进行分层,操作麻烦。
(4)整群抽样:优点是易于组织和操作大规模抽样调查:缺点是抽样误差大。
3、调查设计包括那些基本内容?答:(1)明确调查目的和指标;(2)确定调查对象和观察单位;(3)选释调查方法和技术;(4)估计样本大小;(5)编制调查表;(6)评价问卷的信度和效度;(7)制定资料的收集计划;(8)指定资料的整理与分析计划;(9)制定调查的组织措施。
4、调查表中包含那几种项目?答:(1)分析项目直接整理计算的必须的内容;(2)备查项目保证分析项目填写得完整和准确的内容;(3)其他项目大型调查表的前言和表底附注。
常用卫生统计学方法

s X ﹡定义 CV = / ×100%
﹡用途: 1) 比较多组单位不同资料的变异度 2)比较多组均数相差较大资料的变度
2020/6/11
(三) 正态分布和参考值范围的估计 —— 正态分布的概念和特征 ﹡正态分布是以均数为中心呈对称的钟型分布
Normal distribution curve
直接法 x=
x1+ x2+……+ xn n
∑x
=n
加权法 2020/6/11 x= f 1x1 + f 2x2 + ……+f kxk f 1 +f 2+……+f k
∑ fx =n
——常用平均数 2. 几何均数 (geometric mean)
﹡表示符号
(G)
﹡应 用 ﹡计算方法
对数正态分布资料,变量值呈倍数关系
H0(无效假设):假设两组或多组资料的总体均数 相等。μ= μ0 或μ1= μ2 = μ3
H1(备择假设):μ μ0 (双侧检验) μ> μ0 或μ< μ0 (单侧检验)
(检验水准) :通常取 =0.05
2020/6/11
2) 选定检验方法,计算检验统计量
根据资料类型及统计推断的目的选用合适 的检验方法计算出统计量( t值、u值、2值等 ) 。
频
数 (
f
人
数
)
125 129 133 137 141 145 149 153 157 161
身高 (cm)
2020/6/11120名12岁健康男孩身高的频数分布
﹡正态分布的特征有:
1) 正态分布曲线在均数处最高 2) 正态分布以均数为中心,左右对称且逐渐减少 3) 正态分布曲线的两个参数μ和σ, 记作N (μ, σ2) 4) 正态曲线在±1σ处各有一个拐点
《卫生统计学》考试重点复习资料

《卫生统计学》复习资料08生物技术曾洋and林阳第一章绪论名词解释统计学:是一门通过收集、整理和分析数据来认识社会和自然现象数量特征的方法论科学。
其目的是通过研究随机事件的局部外在数量特征和数量关系, 从而探索事件的总体在规律性,而随机性的数量化,是通过概率表现出来。
总体:总体是根据研究目的确定的同质的观察单位的全体,更确切的说,是同质的所有观察单位某种观察值(变量值)的集合。
总体可分为有限总体和无限总体。
总体中的所有单位都能够标识者为有限总体,反之为无限总体。
样本:从总体中随机抽取部分观察单位,其测量结果的集合称为样本(sample)。
样本应具有代表性。
所谓有代表性的样本,是指用随机抽样方法获得的样本。
抽样:从研究总体中抽取少量有代表性的个体,称为抽样。
概率:概率(probability)又称几率,是度量某一随机事件A发生可能性大小的一个数值,记为P(A),P(A)越大,说明A事件发生的可能性越大。
0﹤P(A)﹤1。
频率:在相同的条件下,独立重复做n次试验,事件A出现了m次,则比值m/n称为随机事件A在n次试验中出现的频率(freqency)。
当试验重复很多次时P(A)= m/n。
变量:表现出个体变异性的任何特征或属性。
随机变量:随机变量(random variable)是指取指不能事先确定的观察结果。
随机变量的具体容虽然是各式各样的,但共同的特点是不能用一个常数来表示,而且,理论上讲,每个变量的取值服从特定的概率分布。
系统误差:系统误差(systematic error)是指由于仪器未校正、测量者感官的某种偏差、医生掌握疗效标准偏高或偏低等原因,使观察值不是分散在真值的两侧,而是有方向性、系统性或周期性地偏离真值。
系统误差可以通过实验设计和完善技术措施来消除或使之减少。
随机误差:随机误差(random error)又称偶然误差,是指排除了系统误差后尚存的误差。
它受多种因素的影响,使观察值不按方向性和系统性而随机的变化。
医院统计学复习题库及答案

医院统计学复习题库及答案1、下列哪种说法是错误的()A、计算相对数尤其是率时应有足够的观察单位或观察次数B、分析大样本数据时可以构成比代替率C、应分别将分子和分母合计求合计率或平均率D、样本率或构成比的比较应作假设检验E、以上都不对答案:B2、甲、乙两地的恶性肿瘤的粗死亡率均为89.94/10万,经过标准化后甲地恶性肿瘤的死亡率为82.74/10万,而乙地为93.52/10万,最有可能的原因是A、甲地的诊断技术水平更高B、乙地的恶性肿瘤防治工作做得比甲地更好C、甲地的老年人口在总人口中所占比例比乙地多D、乙地的老年人口在总人口中所占比例比甲地多E、甲地的男性人口在总人口中所占比例比乙地多答案:C3、实验研究和调查研究最根本的区别是A、调查研究以人为对象B、实验研究以动物为对象C、调查研究不能随机分组D、实验研究可人为设置处理因素,给予干预措施E、调查研究也可以给予干预措施答案:D4、以下关于非概率抽样的说法不正确的是()A、不需要考虑等概率原则B、依赖研究人员的经验和专业知识C、可以取代概率抽样D、简便易行,节约资源E、结果的稳定性容易受主观性影响答案:C5、某地冠心病的死亡率为15‰,说明该地A、每1000B、每1000C、每1000D、每1000E、每1000答案:D6、用某个降糖药物对糖尿病患者进行治疗,根据某个大规模随机抽样调查的研究结果得到该药的降糖有效率为85%的结论,请问降糖有效率是指A、每治疗100B、每个接受该药物治疗的糖尿病患者,降糖有效的机会为85%C、接受该药物治疗的糖尿病人群中,降糖有效的比例为85%D、根据该研究的入选标准所规定的糖尿病患者人群中,估计该药降糖有效的比例为85%E、以上都不对答案:D7、住院疾病统计不涉及()A、疾病谱分析B、等级医院评审C、患者满意度评价D、医疗保险付费E、临床路径答案:C8、关于调查目的和指标,下列说法不正确的是A、调查目的之一是了解参数,用以说明总体特征B、调查目的之一是研究变量间的相关联系,探索病因C、调查目的应具体化到指标D、调查指标应尽量用定性指标E、调查指标应精选,重点突出答案:D9、孕产妇死亡率不包括A、妇女在妊娠期与妊娠有关的死亡B、妇女在分娩时与分娩有关的死亡C、妇女在产后42天以内与妊娠有关原因所致的死亡D、妊娠妇女的意外事故死亡E、由于妊娠使病情恶化引起的死亡答案:D10、下列哪种说法是错误的()A、计算相对数尤其是率时应有足够的观察单位或观察次数B、分析大样本数据时可以构成比代替率C、应分别将分子和分母合计求合计率或平均率D、样本率或构成比的比较应作假设检验E、以上都不对答案:B11、当比较的两组数据内部构成不同时,可作A、直接法标化B、间接法标化C、根据具体情况,选择直接法或间接法标化D、两组不可比较E、以上都不对答案:C12、甲乙两地某病的死亡率进行标准化计算时,其标准的选择A、不能用甲地的数据B、不能用乙地的数据C、不能用甲地和乙地的合并数据D、可用甲地或乙地的数据E、以上都不对答案:D13、关于实验设计中的处理因素,下列说法错误的一项是A、确定处理因素时,应抓住实验中的主要因素B、同时要找出非处理因素C、处理因素可不必标准化D、研究可人为设置处理因素E、一次实验设计的处理因素不宜太多答案:C14、在岗职工人数不包括()A、在编人员B、合同工C、返聘人员D、离开本单位仍保留劳动关系人员E、临聘人员答案:D15、下列叙述正确的是A、r=0.7,可认为两个变量存在相关B、r=0.7,经检验假设后,可认为两个变量存在相关C、r=0.9,可认为两个变量存在相关D、r=0.2,可认为两个变量不存在相关E、以上均不对答案:B16、制定调查计划时,下列哪项是不正确的A、根据调查目的和指标,确定观察对象和单位B、应划清调查总体的同质范围C、调查指标应精选,重点突出D、调查指标是选定调查目的的依据E、调查指标应尽量选定量指标答案:D17、用某药治疗某病患者,5例中有4例治愈,宜写作4/5,而不计算治愈率为4/5×100%=80%,这是由于A、计算治愈率的方法不正确B、样本治愈率的置信区间太宽C、样本治愈率的置信区间太窄D、总体治愈率的置信区间太宽E、总体治愈率的置信区间太窄答案:D18、甲乙两地区脑血管病总死亡率为30‰,标化后,甲地标化死亡率为40‰,乙地标化死亡率为20‰,由此可认为A、甲地实际人口构成较乙地年轻,老年人少B、乙地实际人口构成较甲地年轻,老年人少C、甲乙两地实际人口构成完全相同D、甲乙两地实际人口构成没有规律E、以上都不对答案:A19、医院统计资料的来源不包括()A、日常工作记录B、各种报告卡片C、统计报表D、HIS系统E、社会工业调查答案:E20、下列指标属于相对数的有A、均数B、中位数C、构成比D、发病数E、测量值答案:C21、判断下列哪项正确A、r>0时,一定有b<0B、r>0时,一定有b>0C、r的正负与b无关D、r<0时,b>0E、以上均不对答案:B22、与粗出生率计算公式分母相同的指标是A、婴儿死亡率B、新生儿死亡率C、粗死亡率D、总生育率E、生存率答案:C23、某年孕产妇死亡率是指()。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第七章样本率(或构成比)比较的假设检验
第一节样本率与总体率比较的u检验
样本率与总体率(一般为已知的理论值、标准值或经大量观察所得到的稳定值等)比较的目的,是推断该样本所代表的未知总体率π与已知总体率π0是否不同。
u检验的适用条件:当样本含量n足够大,且样本率p和(1-p)均不太小,如np与n(1-p)均大于5时,样本率的分布近似正态分布,此时样本率与总体率差别的假设检验可利用正态分布的原理作u检验。
第二节两个样本率比较的u检验
当两样本含量n1及n2足够大,且两个样本率p1、(1-p1)及p2、(1-p2)均不太小,如n1 p1和n1(1- p1)及n2 p2和n2(1- p2)均大于5时,可根据正态分布原理,进行u检验。
第三节四格表资料的χ2检验(两个样本率比较)
一、两个样本率资料的四格表形式
1、χ2检验的基本思想
χ2值反映了实际频数和理论频数的吻合程度。
χ2值越小,说明实际频数与理论频数越吻合,χ2值越大,说明实际频数与理论频数差异越大。
如果检验假设成立,则实际频数与理论频数之差一般不会很大,即出现大的χ2值的概率是小的。
若在无效假设下,出现了大的χ2值的概率P≤α(检验水准),我们就怀疑假设的成立,因此拒绝它。
另外χ2值的大小,还与自由度有关。
故考虑χ2值大小的意义时要同时考虑自由度。
若χ2≥χ2α,,(υ), 则P≤α, 拒绝H0,接受H1。
2、四格表χ2检验的的校正公式
(1)当自由度为1的四格表资料,理论数较小时,需做连续性校正。
(2)四格表χ2检验的适用条件
当n>40,且所有T≥5时,用χ2检验的基本公式或四格表专用公式。
当n>40,但有1<T<5时,需用四格表χ2检验的校正公式。
若n≤40,或T≤1时,需用确切概率计算法。
第四节行×列表资料的χ2检验
一、多个样本率和构成比资料,其基本数据均可整理成R行C列,称为R×C表,又称行×列表,χ2检验目的是推断其总体率或构成比是否不同。
二、双向无序分类资料的χ2检验
对同一样本资料按其两个无序分类变量(行变量和列变量)归纳成R×C列联表。
列联表资料两变量(行变量、列变量)之间分布是否相互独立的检验,用列联表的独立性χ2检验。
三、行×列表χ2检验的注意事项
1. 行×列表χ2检验对理论频数有要求。
一般认为不宜有1/5以上格子数的理论频数小于5,或有1个格子的理论数小于1,否则将导致分析的偏性。
2. 多个样本率(或多组构成比)比较的χ2检验,若结论拒绝无效假设,只能认为各总体率(或多组构成比)之间总的来说不同,但不能说明它们彼此之间都不同,或某两者之间有差别。
3. 关于单向有序资料(等级资料)的统计处理,宜用秩和检验。
χ2检验只能说明各处理组间效应在构成比上有无差别。
第五节配对资料差别的χ2检验
同一受试对象实验前后比较、同一样本用两种方法检验以及配对的两个受试对象接受两种不同处理等资料,可按配对资料进行处理。
第八章秩和检验
第一节概述
参数检验是假定样本来自某种已知分布的总体,在此的基础上对总体参数进行的检验。
非参数检验又称为不拘分布的统计检验。
非参数检验不要求对总体分布情况作出任何的假定,即不要求样本必须来自某种(正态)分布的总体;其次,非参数检验不是直接对总体参数进行检验而是考察总体秩次的情况。
参数检验
优点:能充分利用提供的信息,统计分析的效率较高。
缺点:对样本所对应的总体分布有比较严格的要求,这样就限制了它的适用范围。
非参数检验
优点:(1)对总体分布未做出任何假定,因此适用于任何分布的资料。
如严重偏态分布、分布不明的资料、等级资料或末端无确定数值的资料。
(2)易于收集资料、统计分析比较简便
缺点:不直接分析原始测量值,从而有可能会降低它的检验效率。
满足参数检验要求的资料分析时应首选参数检验方法。
不满足参数检验要求的资料应选非参数检验
秩次与秩和的概念
秩次就是将观察值按顺序由小到大排列,并用序号代替了变量值本身,秩次即通常意义上的序号。
秩和就是对序号求和。
秩和检验需对资料正确的编秩、求秩和并选出检验统计量。