14章-6 率与构成比的假设检验
《卫生统计学》考试重点复习资料
卫生统计学Statistics第一章绪论统计学:是一门通过收集、分析、解释、表达数据,目的是求得可靠的结果。
总体:根据研究目的确定的同质(大同小异)的观察单位的全体。
分为目标总体和研究总体。
样本:从总体中随机抽取部分观察单位,其测量结果的集合称为样本(sample)。
样本应具有代表性。
所谓有代表性的样本,是指用随机抽样方法获得的样本。
抽样:从研究总体中抽取少量有代表性的个体。
变量:表现出个体变异性的任何特征或属性。
分定型变量和定量变量。
定型变量:1)分类变量或名义变量:最简单的是二分类变量。
0-1变量也常称为假变量或哑变量。
2)有序变量或等级变量。
定量变量:分离散型变量和连续型变量。
变量只能由高级向低级转化:定量→有序→分类→二值。
常见的三种资料类型1)计量或测量或数值资料,如身高、体重等。
2)计数资料或分类资料,如性别、血型等。
3)等级资料,如尿蛋白含量-、+、++、+++、…第一章定量变量的统计描述此章节x即为样本均数(X拔)1.离散型定量变量的取值是不连续的。
累计频数为该组及前面各组的频数之和。
累计频率表示各组累计频数在总例数中所占的比例。
可用直条图表达。
2.编制频数表的步骤与要点步骤:1确定极差2确定组数3确定各组段的上下限4列表要点(注意事项)1)制表是为了揭示数据的分布特征,故分组不宜过粗或过细。
2)为计算方便,组段下限一般取较整齐的数值3)第一组段应包含最小值,最后一个组段应包含最大值。
3.频率分布表(图)的用途1)描述变量的分布类型2)揭示变量的分布特征3)便于发现某些离群值或极端值4)便于进一步计算统计指标和统计分析。
4.描述平均水平的统计指标算术均数(mean):描述一组数据在数量上的平均水平。
总体均数用μ表示,样本均数用X表示。
适用于服从对称分布变量的平均水平描述,这时均数位于分布的中心,能反应全部观察值的平均水平。
分:直接法和频率表法。
即所有变量值加和除以总数n或所有频数f k乘以组中值X0k后求和再除以总数n。
全科医学主治医师基础知识医学统计学方法-(2)
全科医学主治医师基础知识医学统计学方法-(2)一、以下每一道题下面有A、B、C、D、E五个备选答案。
请从中选择一个最佳答案。
1. 对于一组正态分布的资料,样本含量为n,样本均数为X,标准差为S,该资料的总体均数可信区间为A.X±1.96SB.X±t(0.05,v)SC.X±t(0.05,v)SXD.P2.5~P97.5E.lg-1(X±1.96SlgX)答案:C2. 在同一总体中进行抽样研究,随着样本含量增大,则A.标准差增大B.标准误增大C.标准差趋向0D.标准差减小E.标准误减小答案:E[解答] 在同一总体中进行抽样研究,随着样本含量增大,则标准误减小。
3. 抽样误差是指A.总体参数与总体参数间的差异B.个体值与样本统计量间的差异C.总体参数间的差异D.样本统计量与总体参数间的差异E.以上都不对答案:D[解答] 在同一总体中做随机抽样,因抽样而造成的样本指标与总体参数之差或样本指标与总体指标之差称为抽样误差。
4. X±2.58S包括变量值的A.68.3%B.80.0%C.90.0%D.95.0%E.99.0%答案:E[解答] 均数±2.58S下面的面积为99%。
5. 正常参考值范围应A.取双侧界限B.取单侧界限C.同时计算单侧和双侧界限D.根据实际情况取单侧或双侧界限E.以上都不是答案:D6. 确定正常人的某项指标的正常范围时,调查对象是A.从未患过病的人B.排除影响研究指标的疾病和因素的人C.只患过轻微疾病,但不影响被研究指标的人D.排除了患过某病或接触过某因素的人E.以上都不是答案:B7. 下列是有关参考值范围的说法,其中正确的是A.参考值范围应根据正常人范围的95%来制定B.如果随机测量某人的某项指标,其值在正常人范围的95%之内,那么应认为此人的此项指标正常C.如果某项指标超出了参考值范围,那么其应为不正常D.求正态资料的参考值范围,精确度越高越好E.所谓的正常和健康都是相对的,在正常人或健康人身上都存在着某种程度的病理状态答案:E8. 在标准正态分布的曲线下面积中,区间(1.96,+∞)所对应的面积是A.95%B.99%C.5%D.2.5%E.1%答案:D[解答] 因为均数±1.96标准差下面的面积为95%,则曲线外的面积5%,根据正态分布的对称性特点,区间(1.96,+∞)所对应的面积是2.5%。
卡方检验解释
2(1 96 9. 690.48)25(55.4 13.52)22(67.5 483.52)2 87(.26112.48)
16.4 2(112 61..8 69 6 0.5 45 8 1.4261.4 138.7 5 1.26)34.3283.52
12.48
(21)2 (1)1
以 = 1 查 附 表 8 的 2 界 值 表 得 P 0 . 005 。 按 0 . 05 检 验 水 准 拒 绝 H 0 , 接 受 H1, 肺 癌 患 者 癌 胚 抗 原 的 阳性率显著高于健康人,提示可能具有临床诊断价 值。
合 计
乙 剂 量
死 亡 (+ )
生 存 (- )
6( a) 3( c)
12( b) 18( d)
9
30
合 计
18 21 39
上述配对设计实验中,就每个对子而 言,两种处理的结果不外乎有四种可能:
①两只大鼠均死亡(甲+乙+)数(a); ②两只均生存(甲-乙-)数(d); ③其中一只死亡(甲+乙- )数(b); ④其中一只死亡(甲-乙+)数 (c)。
表7-8 不同文化程度患者首选疼痛量表的类型
文 化 程 度
高 中 以 下 高 中
高 中 以 上 合 计
V AS 3(3.5) 0(1.6) 4(1.8)
7
首 选 测 痛 量 表
V DS
NRS
16(18.7) 10(8.6)
18(19.7) 9(9.0)
11(9.7)
12(10.2)
37
39
FPS 44(39.0) 18(17.8) 15(20.2)
卡方检验解释
主讲内容
第一 第二 第三 第四 第五 第六 第七
2 概述——基本思想 2×2表卡方检验 配对四格表卡方检验 R×C表卡方检验 Fisher确切概率检验 多个样本率的多重比较 有序分组资料的线性趋势检验
中南大学《卫生统计学》在线作业答案
答案
解析
2.
(2分)甲、乙两个医院的等级相同,规模相当。在某年疾病统计中发现:甲院对5型肝炎的治愈率都高于乙院,但总的治愈率却是乙院的总治愈率反而高于甲院的总治愈率,造成这种矛盾现象,最可能的原因是()。
.两个医院对预后的诊断标准不一致
.两个医院各型病人的构成比相差太大
.两个医院医疗技术相差悬殊
得分:0
知识点:在线作业一
收起解析
答案
解析
12.
(2分)标准差与标准误的关系中,的是()。
.二者均反映抽样误差的大小
.总体标准差不变时,增大样本例数可以减小标准误
.总体标准差增大时,总体的标准误也增大
.样本例数增大时,样本的标准差和标准误都会减小
.标准差用于计算可信区间,标准误用于计算参考值范围
得分:0
得分:0
知识点:在线作业一
收起解析
答案
解析
4.
(2分)可信区间估计时可信度是指。
得分:0
知识点:在线作业一
收起解析
答案
解析
5.
(2分)II型是指拒绝了实际上成立的H0。
得分:0
知识点:在线作业一
收起解析
答案
解析
考试成绩
0分
用时: 0分9秒
不判断
一、单选题
1234567891011121314151617181920
.任一格的理论数小于5,要用校正公式
.任一格的实际数小于5,要用校正公式
.要求理论数不宜太小。理论数太小界定为:有1/5以上格子的理论数小于5,或有1个格子的理论数小于1
.要求实际数不宜太小
得分:0
知识点:在线作业二
收起解析
医学统计学智慧树知到课后章节答案2023年下宁波大学
医学统计学智慧树知到课后章节答案2023年下宁波大学宁波大学绪论单元测试1.约翰斯诺,在1854年统计了一些霍乱死者的生活情况,发现霍乱的发生与水源有明显关联。
( )答案:对2.南丁格尔根据南丁格尔玫瑰图发现士兵战死人数明显少于由于受伤而缺乏及时治疗而死亡的士兵人数。
( )答案:对3.统计学的应用无处不在。
( )答案:对4.统计学就是?以下说法正确的是()。
答案:是分析事物发展及规律的重要工具;用数据说话的科学5.当今,统计已成为()。
答案:政府决策的参谋部;百姓生活的智慧帮手;经济运行的千里眼;企业运营的百宝箱第一章测试1.统计中所说的总体是指()。
答案:根据研究目的确定的同质的研究对象的全体2.概率,则表示()。
答案:某事件必然不发生3.测量身高、体重等指标的原始资料叫()。
答案:定量资料4.若以舒张压大于等于12kPa 为高血压,调查某地1000 人,记录每人是否患有高血压。
最后清点结果,其中有10 名高血压患者,有990 名正常人()。
答案:定性资料5.以下属于定量变量的是()。
答案:住院天数;病人白细胞计数;心律;门诊人数6.样本是总体的()。
答案:有代表性的部分7.计量资料、计数资料和等级资料的关系是()。
答案:等级资料兼有计量资料和计数资料的一些性质8.统计工作的基本步骤是()。
答案:收集资料、整理资料、分析资料9.在统计学上的统计量是指()。
答案:描述样本特征的指标10.统计上小概率事件通常是指()。
答案:一次实验或观察中该事件发生的可以性很小第二章测试1.研究一组数据的分布规律时,画频数表的第一个步骤应该是()。
答案:找出这组数据的最大值和最小值2.制作频数表的主要目的是()。
答案:观察数据的分布规律3.描述一组正态分布资料的平均水平应选择用()。
答案:算术均数4.描述一组成等比关系的数据的平均水平应选择用()。
答案:几何均数5.一组数据的均数等于其中位数,描述这组数据的集中趋势应选择用()。
卫生统计学简答题
三、简答题(20分)1、描述集中趋势的指标有哪些?其适用范围有何异同?(5分)均数:正态或近似正态分布几何均数:等比数列或对数正态分布资料中位数:资料是偏态分布的;分布不规则;一端或两端有不确定数据(开口资料)时。
2、何谓假设检验?可以举例说明。
(5分)首先建立检验假设,然后在该假设下进行随机抽样,计算得到该统计量及其极端情形的概率,如果概率较小,则拒绝该假设,如果概率不是小概率,则接受该假设,这个过程称为假设检验。
3、请你谈谈对假设检验结论的认识。
(5分)由于假设检验的结论是依据小概率事件一次试验实际不可能发生的原理进行的,因此当拒绝检验假设时可能犯I型错误,当接受检验假设时可能犯II型错误。
4、请你谈谈标准差和标准误的异同点。
(5分)四、简答题 15分1. 抽样研究中如何才能控制或减小抽样误差?答:合理的抽样设计,增大样本含量。
2、何谓抽样误差?为什么说抽样误差在抽样研究中是不可避免的?答:由抽样造成的样本统计量与样本统计量,样本统计量与总体参数间的差异因为个体差异是客观存在的,研究对象又是总体的一部分,因此这部分的结果与总体的结果存在差异彩是不可避免的3. 能否说假设检验的p值越小,比较的两个总体指标间差异越大?为什么?答:不能,因为P值的大小与总体指标间差异大小不完全等同。
P值的大小除与总体差异大小有关,更与抽样误差大小有关,同样的总体差异,抽样误差大小不同,所得的P也会不一样,抽样误差大小实际工作中主要反映在样本量大小上。
四、简答题 20分2 某医生用某药治疗10例小儿支气管哮喘,治愈8例,结论为“该药对小儿支气管哮喘的治愈率为80%,值得推广”。
答:一是没有对照组,二是样本例数太少,抽样误差大,可信区间宽。
3.某地1岁婴儿平均血红蛋白95%可信区间为116.2~130.1(g/L),表示什么意义?该地1岁正常婴儿血红蛋白95%的参考值范围为111.2~135.1(g/L),又说明了什么含义?答:表示该地1岁婴儿血红蛋白总体平均数在116.2~130.1(g/L),估计正确的概率为95%表示该地有95%1岁正常婴儿的血红蛋白值在111.2~135.1(g/L)4.对同一组资料,如果相关分析算出的r越大,则回归分析算出的b也越大。
医学统计学考试题
21.百分位数: 数据从小到大排列;在百分尺度下,所占百分比对应的值。记为Px
二、简答
1.构成比与率混用问题的辨别。
为案例题,重点看习题集P20页第5题
4.构成比:结构相对数的简称, 表示某一事物内部各
组成部分所占的比重或分布,常以百分数表示。
5. 比 :比较相对数的简称,两个相关指标之比。
6.均数:即算术均数,有总体均数和样本均数之分,分别用希腊字母μ 和英文字母表示。∑(Sigma),求和符号
7.中位数:中位数是一组观察值的位置平均数,是将一组观察值从小到大按顺序排列,居中心位置的数值,记为M
2.直线相关与回归有何区别联系?
区别:(1)在资料要求上,回归要求因变量Y服从正态分布;X是可以精确测量和严格控制的变量,一般称为Ⅰ型回归。
相关要求两个变量X,Y服从双变量正态分布,这类资料作回归分析称为Ⅱ型回归。 (2)对于同一样本资料,只能计算一个相关系数,Ⅱ型回归可以计算出由X推Y和由Y推X的两个回归方程。(3)应用上:相关—— 只反映两变量间有无联系以及联系的强弱。不一定是因果联系。回归——反映两变量间依存变化的数量关系。意味着两个变量间有某种因果关系的含义。
8.回归系数:即直线的斜率,在直线回归方程中用b表示,b的统计意义为X每改变一个单位,Y平均改变b个单位。
9.相关系数 :又称积差相关系数,r表示样本相关系数,ρ表示总体相关系数,说明具有直线关系的两个变量间,相关的密切程度和方向的指标 。
10.标准误 :说明样本均数抽样误差大小的指标,其含义 为样本均数的标准差。也就是说,它是描述样本均数对总体均数离散程度的指标。
医学统计学问答题
简答题0. 算术均数、几何均数和中位数各有什么适用条件?答:(1)算术均数:适用对称分布,特别是正态或近似正态分布的数值变量资料。
(2)几何均数:适用于频数分布呈正偏态的资料,或者经对数变换后服从正态分布(对数正态分布)的资料,以及等比数列资料。
(3)中位数:适用各种类型的资料,尤其以下情况:A 资料分布呈明显偏态;B 资料一端或两端存在不确定数值(开口资料或无界资料);C 资料分布不明。
1.对于一组近似正态分布的资料,除样本含量n 外,还可计算S X ,和S X 96.1±,问各说明什么?(1)X 为算数均数,说明正态分布或近似正态分布资料的集中趋势(2)S 为标准差,说明正态分布或近似正态分布的离散趋势(3)S X 96.1±可估计正态指标的95%的医学参考值范围,即此范围在理论上应包含95%的个体值。
2.试述正态分布、标准正态分布的联系和区别。
正态分布标准正态分布 原始值X 无需转换作u=(X-µ)/σ转换 分布类型 对称对称 集中趋势 µµ=0 均数与中位数的关系µ=M µ=M 参考:标准正态分布的均数为0,标准差为1;正态分布的均数则为µ,标准差为σ(µ为任意数,而σ为大于0的任意数)。
标准正态分布的曲线只有一条,而正态分布曲线是一簇。
任何正态分布都可以通过标准正态变换转换成标准正态分布。
标准正态分布是正态分布的特例。
3.说明频数分布表的用途。
1)描述频数分布的类型 2)描述频数分布的特征 3)便于发现一些特大或特小的可疑值 4)便于进一步做统计分析和处理4.变异系数的用途是什么?多用于观察指标单位不同时,如身高与体重的变异程度的比较;或均数相差较大时,如儿童身高与成人身高变异程度的比较。
5.试述正态分布的面积分布规律。
(1)X 轴与正态曲线所夹的面积恒等于1或100%;(2)区间µ±σ的面积为%,区间µ±σ的面积为%,区间µ±σ的面积为%。
医学统计学思考题
医学统计学思考题第一章绪论1.举例说明总体和样本的概念。
研究人员通常需要了解和研究某一类个体,这个类就是总体。
总体是根据研究目的所确定的所有同质观察单位某种观察值(即变量值)的集合,通常有无限总体和有限总体之分,前者指总体中的个体是无限的,如研究药物疗效,某病患者就是无限总体,后者指总体中的个体是有限的,它是指特定时间、空间中有限个研究个体。
但是,研究整个总体一般并不实际,通常能研究的只是它的一部分,这个部分就是样本。
例如在一项关于2007年西藏自治区正常成年男子的红细胞平均水平的调查研究中,该地2007年全部正常成年男子的红细胞数就构成一个总体,从此总体中随即抽取2000人,分别测的其红细胞数,组成样本,其样本含量为2000人。
2.简述误差的概念。
误差泛指实测值与真实值之差,一般分为随机误差和非随机误差。
随机误差是使重复观测获得的实际观测值往往无方向性地围绕着某一个数值左右波动的误差;非随机误差中最常见的为系统误差,系统误差也叫偏倚,是使实际观测值系统的偏离真实值的误差。
3.举例说明参数和统计量的概念。
某项研究通常想知道关于总体的某些数值特征,这些数值特征称为参数,如整个城市的高血压患病率。
根据样本算得的某些数值特征称为统计量,如根据几百人的抽样调查数据所算得的样本人群高血压患病。
统计量是研究人员能够知道的,而参数是他们想知道的。
一般情况下,这些参数是难以测定的,仅能够根据样本估计。
显然,只有当样本代表了总体时,根据样本统计量估计的总体参数才是合理的。
4.简述小概率事件原理。
当某事件发生的概率小于或等于0.05时,统计学上习惯称该事件为小概率事件,其含义是该事件发生的可能性很小,进而认为它在一次抽样中不可能发生,这就是所谓的小概率事件原理,它是进行统计推断的重要基础。
第二章调查研究设计1.调查研究主要特点是什么?调查研究的主要特点是:①研究的对象及其相关因素(包括研究因素和非研究因素)是客观存在的,不能人为给予干预措施②不能用随机化分组来平衡混杂因素对调查结果的影响。
卫生统计学习题:构成比、秩和
关于构成比的假设检验:1.四个样本率比较的卡方检验,如χ2>χ20.05(3),则( b )A. 各样本率不等或不全相等B. 各总体率不等或不全相等C. 各总体率均不相等D. 各样本率均不相等2.欲反映细菌性痢疾占某地所有急性传染病的比重,应该计算( c )A.病死率 B.患病率 C.构成比 D.死亡率3.要研究鼻咽癌患者、眼病患者和正常人血型的构成比是否相同,采用三组构成比比较的卡方检验,构建一个3行4列的R*C表后,其卡方值的自由度为( A )A.6 B.8 C.12 D.与样本含量有关4.R×C表周边合计不变时,实际频数若有改变,理论频数( c )A. 增加B. 减少C. 不变D.不一定5说明某事物内部各组成部分的比重或分布的指标为( c )A. 平均数B. 率C. 构成比D.相对数6 根据如下资料,经假设检验得P<0.05,则可认为三种国籍国民血型( D )国籍血型合计O A B AB美国人450(45.0) 410(41.0) 100(10.0) 40( 4.0) 1000挪威人190(38.0) 250(50.0) 40( 8.0) 20( 4.0) 500中国人300(30.0) 250(25.0) 350(35.0) 100(10.0) 1000合计940(37.6) 910(36.4) 490(19.6) 160( 6.4) 2500A.总体率不同 B.总体构成比不同C.总体率不同或不全相同 D.总体构成比不同或不全相同7 多个样本构成比比较的2χ检验中,备择假设应为( b )A.各总体构成比不同 B.各总体构成比不同或不全相同C.各总体构成比全不相同 D.以上均不正确8 如果将R×C表分割成多个四格表,分别进行2χ检验,则( A )A、I型误差增加B、I型误差减少C、I型误差不变D、不定9 多个样本构成比比较的2χ检验的应用条件是( c )A、理论数不能小于1B、理论数大于1小于5的不能超过总格子数的1/5C、A和B 均正确D、A和B均不正确10 K个样本率的比较,用卡方检验,其自由度为( c )A、K+1B、KC、K-1D、2K关于等级资料的平均秩或秩和:1.当样本含量较小的资料要比较多组均数差异是否有统计意义时,不了解资料是否来自正态分布总体,可用( c )A、t检验B、F检验C、秩和检验D、B、C都对2.两组等级资料的比较宜用( c )A、t检验B、χ2检验C、秩和检验D、方差分析3. 配伍组设计资料秩和检验(Friedman)的秩次编排是(b )A、处理组内部编秩B、配伍组内部编秩C、所有观察单位混合编秩D、以上均不正确4. 某实验室检测了两组患者的心功能分级,结果如下,则A组患者的理论秩和为( a )A组:Ⅰ、Ⅱ、Ⅳ、Ⅰ、Ⅲ、Ⅱ、Ⅳ、Ⅲ、Ⅳ、ⅡB组:Ⅲ、Ⅱ、Ⅳ、Ⅰ、Ⅱ、Ⅲ、Ⅲ、Ⅳ、Ⅳ、Ⅱ、ⅣA、110B、121C、231D、115.55. 某实验室检测了两组患者的心功能分级,结果如下,则两组秩和相加应等于( c )A组:Ⅰ、Ⅱ、Ⅳ、Ⅰ、Ⅲ、Ⅱ、Ⅳ、Ⅲ、Ⅳ、ⅡB组:Ⅲ、Ⅱ、Ⅳ、Ⅰ、Ⅱ、Ⅲ、Ⅲ、Ⅳ、Ⅳ、Ⅱ、ⅣA、110B、121C、231D、115.510. 某实验室检测了两组患者的心功能,结果如下。
人卫第七版医学统计学课后答案及解析-李康、贺佳主编
人卫第七版医学统计学课后答案李康、贺佳主编第一章绪论一、单项选择题答案 1. D 2. E 3. D 4. B 5. A 6. D 7. A 8. C 9. E 10. D11、E 12、C 13、E 14、A 15、C二、简答题1答由样本数据获得的结果,需要对其进行统计描述和统计推断,统计描述可以使数据更容易理解,统计推断则可以使用概率的方式给出结论,两者的重要作用在于能够透过偶然现象来探测具有变异性的医学规律,使研究结论具有科学性。
2答医学统计学的基本内容包括统计设计、数据整理、统计描述和统计推断。
统计设计能够提高研究效率,并使结果更加准确和可靠,数据整理主要是对数据进行归类,检查数据质量,以及是否符合特定的统计分析方法要求等。
统计描述用来描述及总结数据的重要特征,统计推断指由样本数据的特征推断总体特征的方法,包括参数估计和假设检验。
3答统计描述结果的表达方式主要是通过统计指标、统计表和统计图,统计推断主要是计算参数估计的可信区间、假设检验的P 值得出相互比较是否有差别的结论。
4答统计量是描述样本特征的指标,由样本数据计算得到,参数是描述总体分布特征的指标可由“全体”数据算出。
5答系统误差、随机测量误差、抽样误差。
系统误差由一些固定因素产生,随机测量误差是生物体的自然变异和各种不可预知因素产生的误差,抽样误差是由于抽样而引起的样本统计量与总体参数间的差异。
第二章定量数据的统计描述一、单项选择题答案 1. A 2. B 3. E 4. B 5. A 6. E 7. E 8. D 9. B 10. E 11、D 12、E 13、E 14、C 15、E二、计算与分析第三章正态分布与医学参考值范围一、单项选择题答案 1. A 2. B 3. B 4. C 5. D 6. D 7. C 8. E 9. B 10. A11、E 12、C 13、C 14、B 15、A二、计算与分析2[参考答案] 题中所给资料属于正偏态分布资料,所以宜用百分位数法计算其参考值范围。
人群健康研究的统计学方法(四)考试答案和讲义
人群健康研究的统计学方法(四)1、率表示()A、某现象发生的频率或强度B、事物内部各组成部分所占的比重或分布情况C、两个有联系指标之比D、某事物内部各组成部分出现的频率2、以下关于率的抽样误差代表意义描述错误的是()A、率的抽样误差越小,说明率的标准误越小B、率的抽样误差越小,用样本推论总体时,可信程度越低C、率的抽样误差越小,用样本推论总体时,可信程度越高D、率的抽样误差越大,说明率的标准误越大3、相对比=A/B,说明()A、A为B的若干倍或百分之几B、A、B两个指标只可以为绝对数C、性质肯定相同D、肯定是定性资料4、以下关于应用相对数时的描述正确的是()A、分析时可以以构成比代替率B、观察单位数不等的几个率的平均率,不能将这几个率直接相加求其均值C、所比较资料的内部构成不一定相同D、样本率或构成比的比较不必进行假设检验5、()在表的左侧,表明被研究事物的主要特征,相当于句子的主语A、备注B、标题C、纵标目D、横标目人群健康研究的统计学方法(四)北京大学公共卫生学院刘爱萍一、分类变量资料的统计分析(一)分类变量资料的统计描述1 .相对数常用的指标及其意义相对数主要涵盖:率、构成比和相对比。
率是表示某现象发生的频率或强度,常用百分率、千分率、万分率或十万分率等表示。
它的计算公式是:(实际发生某现象的观察单位数 / 可能发生该现象的观察单位总数)×比例基数。
构成比是说明事物内部各组成部分所占的比重或分布情况,用百分数表示。
构成比 = (事物内部某一组成部分的观察单位数 / 同一事物各组成部分的观察单位总数)× 100% 。
构成比的特点有 : 它的值在 0 和 1 之间变动。
当某一部分构成比发生变化时,其他部分的构成比也相应地发生变化。
相对比是指两个有联系指标之比( A/B ),常以百分数或者倍数表示。
它说明 A 是 B 的若干倍或百分之几,指标可以是绝对数,也可以是相对数,性质可以相同,也可以不同,可以是定性资料,也可以是定量资料。
研究生医学统计学第一讲作业与答案
医学统计学第一讲作业与答案教材:《医学统计学》,颜虹主编,2010年8月第2版1.P.6, 简答题1,3;1 统计学在医学研究中发挥什么作用?实际生活中由于个体结构和功能千差万别,机体反应受到各种自然和社会环境因素的影响和制约,对内外环境刺激的反应同样千差万别。
个体差异是自然界普遍存在的现象。
统计学将这种差异称为变异。
由于变异的存在,同一条件下对同一个体的重复观测结果具有不确定性。
生物医学中充满了个体变异和不确定性,其原因有些是已知的,有些未知的,有些是可人为控制的,有的则是无法控制的。
事实上,客观事物在数量上所变现出来的现象即受到本质规律的制约,又受到诸多偶然因素的影响,这就妨碍了我们对事物规律性的认识,统计学正是处理数据中变异和不确定性的一门科学和艺术,它通过偶然性的现象来探测和揭示那些令人困惑的医学问题的规律性,对不确定性的数据作出统计推断,它是认识客观世界的重要工具和手段。
3 西部农村A、B两县,每年各约有2000名婴儿出生,一位研究者分别从两县县医院的出生记录中获得50名儿童的出生体重,A县50名儿童平均出生体重为2980g,B县50名儿童平均出生体重为3055g。
请评价下列说法是否正确,为什么?(1)B县儿童平均出生体重高于A县。
(2)B县县医院的这50名儿童的平均出生体重高于A县县医院的50名儿童。
(3)B县县医院儿童的平均出生体重高于A县县医院。
答案:(1)不正确,因为50名A县县医院儿童的出生体重和50名B县县医院儿童的出生体重并不能代表A县和B县的全部的儿童的出生体重。
(2)正确。
(3)不正确,A县县医院50名儿童平均出生体重为2980g,B县县医院50名儿童平均出生体重为3055g,均是样本的统计量,若对该两县县医院的儿童平均出生体重进行比较,需进行假设检验。
2.P.52-53,定量资料相关习题;一、最佳选择题(9-11不要求)1 C2 A3 D4 B5 E6 E7 C8 D 12 D二、简答题1 简述编制计量资料频数分布表的方法步骤。
吉大18春学期《医学统计学》在线作业二-0003.2BD235D6-468D-4FAD-9F08-238A9BE4FE1E(总9页)
吉大18春学期《医学统计学》在线作业二-0003说明某现象发生强度的指标为()
A:平均数
B:率
C:构成比
D:相对比
答案:B
比较身高与坐高两组单位相同数据变异度的大小,宜采用_()____ A:变异系数(CV)
B:标准差(s)
C:方差(s2)
D:极差(R)
E:四分位间距
答案:A
下列哪种说法是错误的
A:计算相对数尤其是率时应有足够的观察单位或观察次数
B:分析大样本数据时可以构成比代替率
C:应分别将分子和分母合计求合计率或平均率
D:样本率或构成比的比较应作假设检验
答案:B
对药物半衰期较长的某药作不同剂量疗效的临床试验,以下_()____设计不适宜A:配对设计
B:完全随机设计
C:交叉设计
D:配伍组设计
E:以上设计都不合适
答案:C
将 90 名高血压病人随机等分成三组后分别用 A、B 和 C 方法治疗,以服药前后血压的差值为疗效,欲比较三种方法的效果是否相同,正确的是()____
A:作三个样本两两间差值比较的 t 检验
B:作三个样本差值比较的方差分析
C:作服药前后配对设计资料的 t 检验方差分析
D:作配伍组设计资料的方差分析
E:以上都不对
答案:B。
率与构成比的假设检验概述
故用
不能反映实际观察频数与理论观 察频数相差的程度
❖ 如果将A-T平方,并将各组 相加,得总
数
。观察频数与理论频数相差越大
❖ ,则
的数值越大,反之则越小。
❖ 尚有不足之处,因为绝对差异数还不能完全 反映相差的程度:
❖ 某一资料的观察频数为204,理论频数为200
❖ 另一资料的观察频数为19,理论频数为15
(1)建立假设,确定检验水准 (2)计算检验统计量
(3)求P值,做统计结论
(4) 作统计结论
在α=0.05的水平上拒绝H0,接受 H1 , 可认为吸烟与不吸烟的中学生心理特质构成不同。
注 意 事 项:
1.总样本量不能太小,至少50例; 2.如有1/5以上格子的理论数小于5或 有一个格子的理论数小于1;应考虑 a.条件允许时增加样本含量以增大 理论数;
(1)建立假设,确定检验水准 (2)计算检验统计量
(3)确定P值,作统计结论
所以P< 0 . 005 ,
在 a = 0 . 05 水平上拒绝 H0,接受 H1 , 可认为两种检测结果有关联。
2. 两种检测结果比率比较
❖在本章前部已经对配对设计有所了 解。如果这种设计的反应变量为二 项分类,其观察结果可以整理成 2 x2 表(如表 14-18 )。对这种资料分 析的目的之一是比较两种方法的阳 性率 。
(3)确定P值作统计结论
查附表13, 知 0 . 5 < P < 0 .75,在a= 0.05 的水平 上不能拒绝 H 。 所以尚不能认为P53 在两种病理切片 的表达率不同。 本例如果不校正,X2= 0 . 6835 ,相应 的 0 . 25 < P < 0 . 5 。
四、四格表精确概率法
医学统计学---统计推断
第一节 常用相对数
例5-1 某医院1998年在某城区随机调查 了8589例60岁及以上老人,体检发现高 血压患者为2823例。 高血压患病率为: 2823 / 8589 100% = 32.87% 。
第一节 常用相对数
二、构成比 构成比:表示事物内部某一部分的个体数 与该事物各部分个体数的总和之比,用来 说明各构成部分在总体中所占的比重或分 布。 通常以100%为比例基数。其计算公式为
表 5-4 甲、乙两种疗法治疗某病的治愈率比较 治愈率(%) 60.0 35.0 53.8 病人数 100 300 400 乙疗法 治愈数 65 125 190 治愈率(%) 65.0 41.7 47.5
病
型
普通型 重 型 合 计
病人数 300 100 400
甲疗法 治愈数 180 35 215
第三节 率的标准化法
第三节 率的标准化法
标准化法计算的关键是选择统一的标准构成。 选择标准构成的方法通常有三种: 1.两组资料中任选一组资料的人口数(或人口 构成)作为两者的“共同标准”。这种方法适 用于直接法。 2.两组资料各部分人口之和组成的人口数(或 人口构成)作为两者的“共同标准”。这种方 法适用于直接法。 3.另外选用一个通用的或便于比较的标准作 为两者的“共同标准”,如采用全国、全省或 全地区的数据作为标准。
式中两指标可以是绝对数、相对数或平均 数。
第一节 常用相对数
例5-3 某年某医院出生婴儿中,男性婴儿为370 人,女性婴儿为358人,则出生婴儿性别比例为 370/358×100 = 103,说明该医院该年每出生 100名女婴儿,就有103名男性婴儿出生,它反 映了男性婴儿与女性婴儿出生的对比水平。 据大量观察,出生婴儿男多于女,出生性别比 一般在104~107之间。这个医院的出生性别比 为103,说明该年该医院出生女婴相对较多。
医学统计学重点简答题
一、平均水平常用的统计指标及其适用范围?常用统计指标包括算术均数,几何均数,中位数。
算术均数适用于对称分布,特别是正态分布的数据;几何均数适用于经对数变换后频数分布对称或呈等比级数的数据;中位数主要适用于三种情形:①非正态分布资料(对数正态分布除外)。
②频数分布的一端或两端无确切数据的资料。
③总体分布不清楚的资料。
二、应用相对数的注意事项1.计算相对数时应有足够的观察单位数。
例数太少会使相对数波动较大,这种情况下最好用绝对数表示。
2.正确计算合计率。
计算观察单位不等的几个率的合计率(平均率)时,不能将几个率直接相加求其平均率,而应分别将分子分母合计,再求出合计率。
3不能以构成比代替率。
构成比说明事物内部各部分所占的比重,不能说明某现象发生的频率或强度。
4.注意资料的可比性。
在比较相对数时,除了要比较的因素外,其余的因素应尽可能相同或相近。
5.样本率或构成比的比较应做假设检验。
由于样本率或构成比也存在抽样误差,比较两个或多个率或构成比时,不能凭样本率或构成比的差别作出结论,而必须进行差别的假设检验。
三、正常值范围与置信区间的区别四、标准误与标准差的区别与联系。
区别点标准误标准差含义样本均数的标准差,描述样本均数的抽样误差,即样本均数与总体均数的接近程度。
描述个体间的变异程度计算公式1k)xx(s2x--=∑---1n)xx(s2--=∑-用途总体均数的区间估计医学参考值范围估计相似点性质相似,都是用来说明变异程度五、简述四格表卡方检验统计方法的选择条件六、行×列表资料χ²检验的注意事项1.行×列表资料中各格的理论频数T均不应小于1,并且1≤ T<5的格子数不宜超过格子总数的1/5,否则可能产生偏性。
处理的方法有三种:①增大样本含量,使理论频数增大;②根据专业知识,删去理论频数太小的行或列或将理论频数太小的行或列与性质相近的邻行或邻列合并。
③改用双向无序R×C表的Fisher确切概率法。
统计学整理资料
统计学整理资料选择题(A)1.某地区抽查1000名成年人的血压并制作成频数表,这属于___资料A.计量资料 B.计数资料 C.等级资料D。
半定量资料(B)2.上述调查按血压正常与否整理资料,其中高血压患者200名,血压正常者800名,这属于___资料A.定量资料B。
计数资料C。
等级资料D。
半定量资料(C)3.对变异的事物可采用抽样观察,其主要目的是___A.反映某个体情况B。
反映某样本情况 C.反映某总体情况D。
上述都是(D)4.从4个市级医院外科病史中随机抽样,反映全市外科医护质量,你认为____ A.可以,抽样面广B。
不可以,可能样本大小C。
可以,是随机抽样D.不可以,不能反映研究总体(A)5.概率P=0,则表示______A事件必然不发生B。
某事件必然发生(P=1)C。
某事件发生的可能性很小(P接近0)D。
某事件发生的可能性很大(P接近1)(A)6.要减少抽样误差,最切实可行的方法是___A.增加观察对象(样本含量)B。
控制个体变异C。
遵循随机化原则抽样D.严格挑选研究对象(B)7.表示正态分布计量资料集中趋势的统计指标是____A.M B.x(上划线请标示) C.G D.S(A)8.欲从频数表了解计量资料的分布情况,可通过观察各组的___A.频数B.组中值C.组距D.上,下限(B)9.标准差越大的意义,下列认识中错误的___A.观察个体之间变异越大 B.观察个体之间变异越小C.样本的抽样误差可能越大D.样本对总体的代表性可能越差(B)10.血清学滴度资料最常计算___表示其平均水平A.算术均数 B.几何均数 C.中位数 D.全距(C)11.某厂发生食物中毒,9名患者潜伏期分别为:16,2,6,3,30,5,10,2,24(小时),问该食物中毒的平均潜伏期为___(小时)A.5B.5.5C.6D.10(A)12.来自同一总体的两个样本,___小的那个样本均数估计总体均数更可靠A.Sx (上划线请标示)B.SC.CVD.t.0.05(v)Sx(上划线请标示)(B)13.下列___公式可用于估计总体均数可信区间(95%)(选项请自己填写打不出,谢谢)(C)14.当自由度V→∞时,t0.05值____A.≠1,96B.<1.96C.=1.96D.>1.96(A)15.随着自由度的增加,t值____A.变小B.增大C.不变D.视情况而定(B)16.下列____公式可用于估计95%样本均数分布范围(选项请自己填写打不出,谢谢)(C)17.关于t检验的作用的认识,确切地是检验____A.x(上划线请标示)之间是否存在抽样误差B.u之间是否存在抽样误差C.x(上划线请标示)之间的差别由抽样误差引起的概率大小D.u之间的差别由抽样误差引起的概率大小(B)18.在两样本均数比较的t检验中,无效假设(H0)的正确表达应为__A.u1≠u2B.u1=u2C.x1≠x2D.x1=x2(C)19.在t检验中,当t>t0.05(v)时,则结论为___A.P>0.05B.P>=0.05C.P<0.05D.P<=0.05(A) 20.抽样调查男生和女生各100名,并分别统计出身与体重均数,其中同性别的身高与体重均数不可作假设检验,是因为__A.资料不具备可比性B.身高资料不呈正态分布C.体重资料不呈正态分布D.样本含量较小(C)21.由10对(20个)数据组成的资料作配对t检验,其自由度等于___A.10B.20C.9D.18(C) 22.对两样本均数作t检验,n1=20,n2=20,其自由度等于___A.19B.20C.38D.40(C) 23.将同类高血压病患者若干随机分成两组,一组给予传统医疗方法,另一组给予新医疗方法,以各组治疗前后血压的平均下降值为指标,比较两种医疗方法的效果。
预防医学答案
遵义医学院成教学院专升本《预防医学》作业(一)一、选择题(每小题1分,共20分)1、常见的介水传染病中霍乱、副霍乱、伤寒、副伤寒及痢疾等属于疾病。
A、病毒性B、真菌性C、细菌性D、寄生虫性E、非生物性2、室内主要污染物中来源于各种溶剂、粘合剂等化工产品;其危害主要表现为对中枢神经系统、消化系统、造血系统、免疫系统的损伤,A、致病微生物B、一氧化碳C、有机挥发性化合物D、甲醛E、放射性物质3、职业病有以下特点,除外A、病因明确B、存在剂量-反应关系C、接触人群中常有一定发病率D、症状典型,多有特效疗法E、早期发现,及时处理,预后良好4、治疗铅中毒的最常用药物A、二巯基丙醇B、二巯基丙磺酸钠C、依地酸二钠钙D、青霉胺E、美蓝5、慢性汞中毒无下列哪项临床表现A、神经衰弱综合征B、口腔炎C、震颤D、易兴奋症E、腹绞痛6、下列哪种气体不属于刺激性气体A、二氧化硫B、二氧化氮C、光气D、二氧化碳E、臭氧7、某制革厂设在室内的废水池阀门堵塞,一名工人欲用水泵抽废水疏通,下池后即感胸闷,爬出时突然神志不清,有3名工人进行救助,也先后昏倒。
治疗时应预防A、脑水肿B、肺水肿C、心肌损害D、肾脏损害E、迟发脑病8、营养素的需要量是指。
A、为满足机体从事轻体力劳动所需要的量B、为满足机体需要,每日必需由膳食摄取以满足机体需要的量C、维持机体正常生理功能所需要的量D、为保证机体正常生长发育所需要的量E、以上均是9、蛋白质生物学价值的高低主要取决于。
A、食物蛋白质的真消化率B、食物蛋白质的表观消化率C、食物蛋白质所含氨基酸的数量D、食物蛋白质所含必须氨基酸的含量和比值E、以上均不是10、下列含锌最丰富的食物是。
A、海贝类B、海带C、牛乳及乳制品D、木耳E、谷物类11、某患儿,“方颅”、“枕秃”“串珠胸”,夜间经常啼哭,最可能的原因是。
A、铁缺乏B、受惊吓C、钙缺乏D、锌缺乏E、硒缺乏12、下列不易被黄曲霉毒素污染的食品为。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
设有k个相互独立的标准正态分布变量,则
称为自由度为k的χ2分布。与标准正 χ 态分布不同,χ2 分布的随机变量取 χ 值在「 o ,十 ∞ )。图 14 一 4 描述 了不同自由度χ2分布的概率密度曲线。 χ 从附表 13 ( 22 分布界值表)可以查到 不同自由度的χ2分布的各种临界值。 χ
2检验 (二)分布的χ
(1)χ2分布是一种连续型随机变量 的概率分布
χ2分布的形状依赖于自由度v的大小,
A:当自由度v ≤ 2时,曲线呈L型; B:当自由度v> 2时,随着v的增加,曲线逐渐 趋于对称; C:当自由度v趋于∞时, χ2分布逼近正态分布
(2) χ2分布的基本性质——可加性
如果两个独立的随机变量X1和X2分 别服从自由度为v1和v2的 χ2 分布, 那么它们的和(X1+X2)服从 (V1+V2)的 χ2 分布。
1.两种特征分布间独立性检验
检验的目的:是判断两种特征分 类间是否存在关联 。如果一种特 征的概率分布与另一种特征的概 率分布无关,则认为这两种特征 相互独立。
例 14 一 26
某医院从正常体检人员血清标本获得如 下结果,试问,乙肝表面抗原( HbsAg ) 与乙肝核心抗体(-HBc )检测结果之间 是否存在联系?
分析
在表 14 - 17 中,如果 HbsAg 为阳性的151 人中一 HBc 的阳性率与 HbsAg 为阴性的 1911 人中一 HBe 的阳性率没有统计差异, 则可认为 HbsAg 与一 HBc 检测结果之间没 有关联,即相互独立。若将 HbsAg 与- HBc 位置互换进行分析,道理是一样的。因此可 应用两个率比较的 X2 检验处理本例的问题。
于是格子 a 的理论频数
(2)计算其余三个格子的理论频数为:
(3)计算χ2统计量
3、计算P值并作统计结论
查附表 13:
X 02.01(1) = 6.636
X 02.025(1) = 5.412
故 0 . 01 <P< 0 . 025
在a= 0 . 05 水平上拒绝 H0 ,接受 H1 。 可认为两药疗效不同,替硝哗疗效较好。
(1)建立假设,确定检验水准
(2)计算检验统计量
(3)确定P值,作统计结论
X
2 0.005(1)
= 7.88 所以P< 0 . 005 ,
在 a = 0 . 05 水平上拒绝 H0,接受 H1 , 可认为两种检测结果有关联。
2. 两种检测结果比率比较
在本章前部已经对配对设计有所了 解。如果这种设计的反应变量为二 项分类,其观察结果可以整理成 2 x2 表(如表 14-18 )。对这种资料分 析的目的之一是比较两种方法的阳 性率 。
(1)建立假设,确定检验水准
(2)计算检验统计量
(3)求P值,做统计结论
X 02.005( 2) = 10.60, P 0.005, 在α=0.05的水平上拒绝H 0 , 接受H 1。 可以认为三个年龄组立克次感染率不全相同。
例 14 一 25
为探讨青少年吸烟行为与心理特质的关 系,南方某市调查到如下资料。试问, 吸烟与不吸烟的中学生心理特质构成是 否相同?
由每组的观察频数(A)减去相应的理论频数(T), 即得每组A与T的差异,如果将各组A-T的频数相加, 其总和数常等于零,这种关系可用下式表示:
∑ (A T ) = ∑ A ∑T = n n = 0
故用 ∑ ( A T ) 不能反映实际观察频数与理论观 察频数相差的程度
如果将A-T平方,并将各组( A T ) 2 相加,得总 2 数 ∑ ( A T ) 。观察频数与理论频数相差越大 ,则 ( A T ) 2 的数值越大,反之则越小。 尚有不足之处,因为绝对差异数还不能完全 反映相差的程度: 某一资料的观察频数为204,理论频数为200 另一资料的观察频数为19,理论频数为15 故需把 ( A T ) 2 的数值变为相对数,即
例 14 一 23
1997 年血清流行病学调查部分 结果如下。试间立克次氏体感 染率甲地是否高于乙地?
(1(建立假设,确定检验水准
a= 0 . 05
(2)计算概率
将原表以及 a = 5 与 a = 6 两个表的概率之和 作为检验的P值: P = 0 . 01088 + 0 . 08899 + 0 . 25955 = 0 . 35942 > 0 . 05 。 按a = 0 . 05 水准,不能拒绝 H0 。所以尚不 能认为甲地的感染率高于乙地。
求,所以应用较广。 所以应用较广。
K . Pearson ( 1899 )证明了,如果零假设 “ H0 :样本来自某理论分布”成立而且当 大样本时, ( 14 一 37 )式服从自由度为v的 χ2 分布。其中,v=k一 1 一(计算 T 时利用 样本估计的总体参数的个数)。
χ2统计量的意义,可通过下列例子说明:
知 0 . 5 < P < 0 .75,在a= 0.05 的水平 上不能拒绝 H 。 所以尚不能认为P53 在两种病理切片 的表达率不同。 本例如果不校正,X2= 0 . 6835 ,相应 的 0 . 25 < P < 0 . 5 。
四、四格表精确概率法
两个样本率比较的四格表资料如果出现 : <40或T<1时 不能用χ 检验, n<40或T<1时,不能用χ2检验,需用 精确概率法。 Fisher 精确概率法。
列表资料的χ (3)行×列表资料的χ2检验 )
(A T) χ =∑ T
2 2
经推导,行×列表: 行 列表
A2 2 x = n ∑ n n 1 R c
A为实际数; n为总例数
n R 为与某实际数(A)同行的合计数;
n c 为与某实际数(A)同列的合计数;
例 14 一 24 为了解立克次体病在某省存在的 情况, 1997 年对 23 个县(市) 进行了血清流行病学调查,结果 如下,试问不同年龄人群的立克 次体感染率是否不同?
χ
2
=
∑
( A T )2 T
分母为什么是T而不是A,因为:
1.当理论数的数值极小时,由于抽样误差可 使实际观察例数为零; 2.理论数是大量的经验和自然规律推算出来 的,论据较广,而观察例数来自有限的样本, 变动较大。
二、完全随机设计两个样本率 2检验 比较的四格表χ χ
这里的两个样本可以是完全随机分 组的两份样本,也可以是从两个总 体(例如男性与女性)分别独立抽 取的两份样本。
例如:母豚鼠所产的幼豚鼠的性别分为雌雄两组, 在某次实验中,若干只母豚鼠所产的幼豚鼠中有70 只为雌性,54只为雄性,而在大量的调查资料中, 雌雄豚鼠的性比例一般为1:1。 如果观察频数与理论频数相吻合,则其性比例符合 1:1;如果相差很大,即需要研究某种实验条件是 否影响母豚鼠所产幼豚鼠的性比例,这就需要研究 观察频数与理论频数相差的程度。
例 14 一 28
某医院称治疗声带白斑的有效率为 80 %。今 统计来求医的此类患者60例,其中 45 例有 效。试问该医院宣称的疗效是否客观?
(1)建立假设,确定检验水准
第六节 率与构成比的假设检验
学 习 目 标
能够进行两个或多个率(或构成比) 两个或多个率(或构成比 两个或多个率 差别的 检验2 X 能够根据资料的性质正确选择 X 2 检 验方法。
2检验 χ
检验是一种用途较广的假设检验方法。 χ2检验是一种用途较广的假设检验方法。 它常用于分类计数资料的分析, 它常用于分类计数资料的分析,如两个 或多个率或构成比的比较 的比较、 或多个率或构成比的比较、计数资料的 相关分析等 相关分析等。
如果是双侧检验
H 0: π 1 = π 2 H1 : 1 ≠ π 2 π 则应将 IA 一 Tl 大于等于原表的所有四格表 (它们更支持 H1 )的概率相加作为检验的P 值。
双侧检验: P=0.05, χ2 =3.86 P=0.01, χ2 =6.63
五、 R xC 表分析
把表达构成比或多个样本率资料的统计表 统称为 R ( Row ) x C ( Column )表。 行列表χ2常用于多个样本构成比或多个样 χ 本率的比较。
2 .如果行或列的变量是有序的(等级 分组的),不要仅作率或构成比的比较。 根据资料特点或研究目的还应考虑作秩 和检验或趋势检验分析。
六、 2 x 2 列联表分析
对一份随机样本按两个二项分类的特征 进行交叉分类的结果,可归纳成双向分 类表,称为 2 x2 列联表。 这种表虽然在形式上与两个率比较的四 格表类似,但是分析的角度却有不同。 对 2 x2列联表一般可作两个方面的分析。
四格表专用公式:
2检验 常用的χ 常用的χ
成组(四格表)资料的χ 成组(四格表)资料的χ2检验 n>40,T>5时 , 时
χ χ
2
2
( A T )2 = ∑ 或 T ( ad bc)2 n = (a + b )(c + d )(a + c )(b + d )
P149
甲 乙 合计
+ a c a+c
注 意 事 项:
1.总样本量不能太小,至少50例; 2.如有1/5以上格子的理论数小于5或 有一个格子的理论数小于1;应考虑 a.条件允许时增加样本含量以增大 理论数;
b.将理论数太小的行或列与相邻的行或列 的观察值合并,以增大理论数,但合并 时应考虑资料的性质合理合并,不能把 不同性质的实际频数合并,否则会导致 错误的结论。
(Hale Waihona Puke )建立假设,确定检验水准(2)计算检验统计量
(3)求P值,做统计结论
2 X 0.005(2) = 10.60, 知P 0.005 ,在 =0.05 α 的水平上拒绝 0 , 接受 1, H H
可认为吸烟与不吸烟的 中学生心理特质构成不 同。