卫生统计学 第八版(李晓松)习题解答03

合集下载

《卫生统计学》课后思考题答案

《卫生统计学》课后思考题答案

第一章:ECDBB第二章:BDABC第三章:DEBCD AEA第四章:DCCDD DCBD第五章:DCBDB AEEEC第六章:CBEDC DDDDA第七章:ACCBB DACEA第八章:ABCDD BDADB第九章:DDBCD AEA第十章:BDCCE BDAEA第十一章:CAEDC DBCCD第十二章:BCAEE BA第十三章:DDBCC BCDE第十四章:无第十五章:无第十六章:无第十七章:DBABC BDE第十八章:无第十九章:BDCDC CCADC《卫生统计学》思考题参考答案第一章绪论1、统计资料可以分为那几种类型?举例说明不同类型资料之间是如何转换的?答:(1)1定量资料(离散型变量、连续型变量)、2无序分类资料(二项分类资料、无序多项分类资料)、3有序分类资料(即等级资料);(2)例如人的健康状况可分为“非常好、较好、一般、差、非常差”5个等级,应归为等级资料,若将该五个等级赋值为5、4、3、2、1,就可按定量资料处理。

2、统计工作可分为那几个步骤?答:设计、收集资料、整理资料、分析资料四个步骤。

3、举例说明小概率事件的含义。

答:某人打靶100次,中靶次数少于等于5,那么该人一次打中靶的概率≤0.05,即可称该人一次打中靶的事件为小概率事件,可以视为很可能不发生。

第二章调查研究设计1、调查研究有何特点?答:(1)不能人为施加干预措施(2)不能随机分组(3)很难控制干扰因素(4)一般不能下因果结论2、四种常用的抽样方法各有什么特点?答:(1)单纯随机抽样:优点是操作简单,统计量的计算较简便;缺点是当总体观察单位数量庞大时,逐一编号繁复,有时难以做到。

(2)系统抽样:优点是易于理解、操作简便,被抽到的观察单位在总体中分布均匀,抽样误差较单纯随机抽样小;缺点是在某些情况下会出现偏性或周期性变化。

(3)分层抽样:优点是抽样误差小,各层可以独立进行统计分析,适合大规模统计;缺点是事先要进行分层,操作麻烦。

医学统计学课后思考题答案(李晓松版)

医学统计学课后思考题答案(李晓松版)

第一章绪论1.举例说明总体和样本的概念。

研究人员通常需要了解和研究某一类个体,这个类就是总体。

总体是根据研究目的所确定的所有同质观察单位某种观察值(即变量值)的集合,通常有无限总体和有限总体之分,前者指总体中的个体是无限的,如研究药物疗效,某病患者就是无限总体,后者指总体中的个体是有限的,它是指特定时间、空间中有限个研究个体。

但是,研究整个总体一般并不实际,通常能研究的只是它的一部分,这个部分就是样本。

例如在一项关于 2007年西藏自治区正常成年男子的红细胞平均水平的调查研究中,该地 2007年全部正常成年男子的红细胞数就构成一个总体,从此总体中随即抽取 2000人,分别测的其红细胞数,组成样本,其样本含量为 2000人。

2.简述误差的概念。

误差泛指实测值与真实值之差,一般分为随机误差和非随机误差。

随机误差是使重复观测获得的实际观测值往往无方向性地围绕着某一个数值左右波动的误差;非随机误差中最常见的为系统误差,系统误差也叫偏倚,是使实际观测值系统的偏离真实值的误差。

3.举例说明参数和统计量的概念。

某项研究通常想知道关于总体的某些数值特征,这些数值特征称为参数,如整个城市的高血压患病率。

根据样本算得的某些数值特征称为统计量,如根据几百人的抽样调查数据所算得的样本人群高血压患病。

统计量是研究人员能够知道的,而参数是他们想知道的。

一般情况下,这些参数是难以测定的,仅能够根据样本估计。

显然,只有当样本代表了总体时,根据样本统计量估计的总体参数才是合理的。

4.简述小概率事件原理。

当某事件发生的概率小于或等于 0.05时,统计学上习惯称该事件为小概率事件,其含义是该事件发生的可能性很小,进而认为它在一次抽样中不可能发生,这就是所谓的小概率事件原理,它是进行统计推断的重要基础。

第二章调查研究设计1.调查研究主要特点是什么?调查研究的主要特点是:①研究的对象及其相关因素(包括研究因素和非研究因素)是客观存在的,不能人为给予干预措施②不能用随机化分组来平衡混杂因素对调查结果的影响。

卫生统计学第八版李晓松第一章 数据分布的描述

卫生统计学第八版李晓松第一章 数据分布的描述

累计频率(%) (5) 1.69 5.08 14.41 35.59 60.17 81.36 93.22 98.31 100.00 —
第一节 数据分布表与直方图
(二)直方图
慢性鼻窦炎患者生命质量评估总分的直方图
慢性鼻窦炎患者生命质量评估总分的直方图
(非等距分组造成错觉)
第一节 数据分布表与直方图
(三)数据分布特征
值) 都适用。日常应用中,对称分布资料更常用均数。 (2)与均数相比,中位数存在一些不足:
①中位数未考虑大部分观测值的实际大小,而均数充分利用了全部数据的信息;
②两组数据合并时,合并后的中位数不能用原来两组的中位数表达,而均数可 基于两组的均数和例数用求得; ③均数可通过如估计截尾均数等方法进行修正,而中位数无法进行此修正。
(4)确定组段的上、下限:每个组段的起点为下限(lower limit),终点为上限(upper
limit)。每个组段均包含组段的下限值,最后一组的组段写出上限值。 (5)列表整理:计算频数、频率、累计频数及累计频率。
第一节 数据分布表与直方图
(一)频数分布表
广州市118名慢性鼻窦炎患者生命质量评估总分的频数分布表
1. 分布形态分类
(1)对称分布:集中位置在正中,左右两侧频数分布对称。
(2)偏态分布:集中位置偏向一侧,左右两侧频数分布不对称。 ①正偏态(positive skewness):有小部分数据偏大、直方图呈现右侧拖尾,又 称右偏态(right skewness); ②负偏态(negative skewness):有小部分数据偏小、直方图呈现左侧拖尾, 又称左偏态(left skewness)。
组段 (1) 10~ 20~ 30~ 40~ 50~ 60~ 70~ 80~ 90~100 合计

卫生统计学试题及答案(附解释)

卫生统计学试题及答案(附解释)

卫生统计学试题及答案(一)1.用某地6~16岁学生近视情况的调查资料制作统计图,以反映患者的年龄分布,可用图形种类为______.A.普通线图B.半对数线图C.直方图D.直条图E.复式直条图【答案】C(6——16岁为连续变量,得到的是连续变量的频数分布)2.为了反映某地区五年期间鼻咽癌死亡病例的年龄分布,可采用______.A.直方图B.普通线图C.半对数线图D.直条图E.复式直条图(一个检测指标,两个分组变量)【答案】E? 3.为了反映某地区2000~____年男性肺癌年龄别死亡率的变化情况,可采用______.A.直方图B.普通线图(适用于随时间变化的连续性资料,用线段的升降表示某事物在时间上的发展变化趋势)C.半对数线图(适用于随时间变化的连续性资料,尤其比较数值相差悬殊的多组资料时采用,线段的升降用来表示某事物的发展速度)D.直条图E.复式直条图【答案】E4.调查某疫苗在儿童中接种后的预防效果,在某地全部1000名易感儿童中进行接种,经一定时间后从中随机抽取300名儿童做效果测定,得阳性人数228名。

若要研究该疫苗在该地儿童中的接种效果,则______.A.该研究的样本是1000名易感儿童B.该研究的样本是228名阳性儿童C.该研究的总体是300名易感儿童D.该研究的总体是1000名易感儿童E.该研究的总体是228名阳性儿童【答案】D5.若要通过样本作统计推断,样本应是__________.A.总体中典型的一部分B.总体中任一部分C.总体中随机抽取的一部分D.总体中选取的有意义的一部分E.总体中信息明确的一部分【答案】C6.下面关于均数的正确的说法是______.A.当样本含量增大时,均数也增大B.均数总大于中位数C.均数总大于标准差D.均数是所有观察值的平均值E.均数是最大和最小值的平均值【答案】D7.某地易感儿童注射乙肝疫苗后,从中随机抽取100名儿童测量其乙肝表面抗体滴度水平,欲描述其平均水平,宜采用______.A.均数B.几何均数C.中位数D.方差E.四分位数间距【答案】B8.有人根据某种沙门菌食物中毒患者164例的潜伏期资料,用百分位数法求得潜伏期的单侧95%上限为57.8小时,其含义是:______.A.大约有95人的潜伏期小于57.8小时B.大约有5人的潜伏期大于57.8小时C.大约有5人的潜伏期小于57.8小时D.大约有8人的潜伏期大于57.8小时(全体的百分之五,即是约有8人)E.大约有8人的潜伏期小于57.8小时【答案】D9.以下说法中不正确的是______.A.方差除以其自由度就是均方B.方差分析时要求各样本来自相互独立的正态总体C.方差分析时要求各样本所在总体的方差相等D.完全随机设计的方差分析时,组内均方就是误差均方E.完全随机设计的方差分析时,F=MS组间/MS组内【答案】A10.两组数据中的每个变量值减去同一常数后,作两个样本均数比较的假设检验______.A.t值不变B.t值变小C.t值变大D.t值变小或变大E.不能判断【答案】A11.甲乙两地某病的死亡率进行标准化计算时,其标准的选择______.A.不能用甲地的数据B.不能用乙地的数据C.不能用甲地和乙地的合并数据D.可用甲地或乙地的数据E.以上都不对【答案】D12.以下属于数值变量的是______.A.性别B.病人白细胞计数C.血型D.疗效E.某病感染人数【答案】B13.以下关于样本的说法,不正确的是______.A.样本是从总体中随机抽取的B.样本来自的总体应该是同质的C.样本中应有足够的个体数D.样本来自的总体中不能有变异存在E.样本含量可以估计【答案】D14.以下属于分类变量的是___________.A.IQ得分B.心率C.住院天数D.性别E.胸围【答案】D15.在抽样研究中,当样本例数逐渐增多时_____.A.标准误逐渐加大B.标准差逐渐加大C.标准差逐渐减小D.标准误逐渐减小E.标准差趋近于0【答案】D16.某医院一年内收治202例腰椎间盘后突病人,其年龄的频数分布如下,为了形象表达该资料,适合选用_____.年龄(岁):10~20~30~40~50~60~人数:6405085 20 1A.线图B.条图C.直方图D.圆图E.散点图【答案】C17.关于构成比,不正确的是_____.A.构成比中某一部分比重的增减相应地会影响其他部分的比重B.构成比说明某现象发生的强度大小(某现象发生的强度大小用“概率”即“率”表示)C.构成比说明某一事物内部各组成部分所占的分布D.若内部构成不同,可对率进行标准化E.构成比之和必为100%【答案】B18.若分析肺活量和体重之间的数量关系,拟用体重值预测肺活量,则采用_____.A.直线相关分析B.秩相关分析C.直线回归分析D.方差分析E.病例对照研究【答案】C19.根据下述资料,样本指标提示_____.甲疗法乙疗法病情病人数治愈数治愈率(%)病人数治愈数治愈率(%)轻型403690605490重型604270402870合计10078781008282A.乙疗法优于甲疗法B.甲疗法优于乙疗法C.甲疗法与乙疗法疗效相等D.此资料甲、乙疗法不能比较E.以上都不对【答案】C20.若算得F药物=7.604,P<0.01;F区组=1.596,P>0.05.按α=0.05水准,则4种药物的抑瘤效果和5个随机区组的瘤重的推断结论分别为_____.A.药物组间瘤重不同,区组间也不同B.不能认为药物组间瘤重不同,不能认为区组间不同C.药物组间瘤重不同,但不能认为区组间不同D.不能认为药物组间瘤重不同,但区组间不同E.药物差别较大,不能认为区组间不同【答案】C卫生统计学试题及答案(二)1.对两个定量变量同时进行了直线相关和直线回归分析,r有统计学意义(P<0.05),则_____.A.b无统计学意义B.b有高度统计学意义C.b有统计学意义(r有统计学意义,b也有统计学意义)D.不能肯定b有无统计学意义E.a有统计学意义【答案】C2.关于基于秩次的非参数检验,下列说法错误的是_____.A.符号秩和检验中,差值为零不参加编秩B.两样本比较的秩和检验方法中的正态近似法为参数检验C.当符合正态假定时,非参数检验犯II类错误的概率较参数检验大D.当样本足够大时,秩和分布近似正态E.秩和检验适用于检验等级资料、可排序资料和分布不明资料的差异【答案】B3.随机事件的概率为______.A.P=1B.P=0C.P=-0.5D.0≤P≤1E.-0.5<P<0.5< P>【答案】D4.两样本均数比较,经t检验得出差别有统计学意义的结论时,P越小,说明______.A.两样本均数差别越大B.两总体均数差别越大C.越有理由认为两总体均数不同D.越有理由认为两样本均数不同E.越有理由认为两总体均数相同【答案】C5.为研究缺氧对正常人心率的影响,有50名志愿者参加试验,分别测得试验前后的心率,应用何种统计检验方法来较好地分析此数据_____.A.配对t检验B.成组t检验C.成组秩和检验D.配对秩和检验E.两组方差齐性检验【答案】A6.作符号秩和检验时,记统计量T为较小的秩和,则正确的是_____.A.T值越大P值越小B.T值越大越有理由拒绝H0C.P值与T值毫无联系D.T值越小P值越小E.以上都不对【答案】D7.方差分析中要求______.A.各个样本均数相等B.各个总体方差相等C.各个总体均数相等D.两样本方差相等E.两个样本来自同一总体【答案】B8.比较非典型肺炎和普通肺炎患者的白细胞计数水平,若,可作单侧检验。

卫生统计学第八版李晓松第三章数据的产生

卫生统计学第八版李晓松第三章数据的产生

第二节 随机对照试验
(一)设计原则
3. 重复(repeat)
(1)每组只有一个试验对象,那么试验结果可能只依赖于具有这类潜在 特质的人被分到了哪个组,但是,如果试验对象足够多,这类人的效应就 能够被平均化,两组的区别就会减少。 (2)重复思想:运用足够多的样本来降低试验的随机误差。
第二节 随机对照试验
第五节 伦理问题
(一)知情同意与个人隐私
1. 知情同意 受试者在参与试验前需充分了解研究的性质和任何潜在风险。 2. 国际医学委员会建议使用下面的方法
(1)对在社区水平上进行的研究,需征得对此试验负责的卫生行政部门的知情同意。 (2)以医院为研究单位时,应当获得当地伦理审查委员会的同意。 (3)当研究单位是学校、工作场所或社区时,应征得有关负责人的同意;同时,尽 可能告知社区民众该试验的研究目的、预期收益和可能的不方便或危险,并告知不同 意的人如何免受干预措施的影响。
第四节 样本的可靠性与代表性
(一)抽样分布
1. 变量的总体分布 总体中所有个体观测值的分布。 2. 统计量抽样分布 统计量的分布规律,描述了从同一总体重复抽样时,统计 量会有些什么样的值,以及每个值出现的可能性大小。
例3 某环境监测点2015年1月1日至2月28日对每小时PM10浓度值进行监测。 图 (A)采用某环 图 (B) 从这个总体中随机抽样(每次样本量为50),共抽取100次得到的100个样本均 数的分布。
卫生统计学
第三章 数据的产生
夏结来
第四军医大学
目录
01 02
03 04 05
第一节:数据的来源 第二节:随机对照试验 第三节:简单随机抽样 第四节:抽样的可靠性与代表性 第五节:伦理问题
重点难点

卫生统计学第八版李晓松第六章 统计推断

卫生统计学第八版李晓松第六章 统计推断

第一节 置信区间的估计
(一)统计信心
第一节 置信区间的估计
(一)统计信心
第一节 置信区间的估计
(一)统计信心
第一节 置信区间的估计
(二)置信区间
来自同一总体的25次抽样及其95%置信区间
C z
第一节置信区间的估计
(二)置信区间
C z
第一节 置信区间的估计
(二)置信区间
标准正态曲线下C与z’之间的关系
※ 基于决策的推断中两类错误的含义 ※ 两类错误、检验水准及检验效能之间的关系
第一节 置信区间的估计
x
第一节 置信区间的估计
(一)统计信心
统计推断
定义
统计推断是基于样本统计量对总体参数给出统计学结论
常用方法 置信区间估计和假设检验 注:为避免繁杂的计算而掩盖统计推断的基本逻辑和核心思想,本 章以总体方差已知的情形为例,叙述推断总体均数的过程
(四)注意事项
第一节 置信区间的估计
(四)注意事项
4. 统计分析无法拯救糟糕的数据。 5. 实际操作中的问题(如无应答与失访)会给抽样研究带来额外的误差,这些误差可能
比随机抽样误差大得多,并且研究结果中这些误差并不能被误差范围所反映。
6. 统计推断的概率是指该方法重复进行的正确频率,但并不知道某一次结果的正确性。
第二节 假设检验
第二节 假设检验
(一)基本思想
假设检验:假设是指我们对总体特征(如参数、分布)的
某种推测,进而用概率来判断样本数据所提供的信息和我
们对总体特征猜想的一致性,从而结合专业知识判断这一 猜想的正确性。
第二节 假设检验
(一)基本思想
例2 为了解某高校在校大学生2015年平均网上购物花费情况:

卫生统计学第八版李晓松第七章基本情形参数推断

卫生统计学第八版李晓松第七章基本情形参数推断

第二节 两个总体均数
(二)两总体均数之差的置信区间
两组儿童体重资料(kg)
分组
安慰剂组
44
27.2
0.9
硒补充剂组
48
27.3
0.8
第二节 两个总体均数
(二)两总体均数之差的置信区间
第二节 两个总体均数
(二)两总体均数之差的置信区间
第二节 两个总体均数
(二)两总体均数之差的置信区间
v' (0.32(/0 1 .0 32 )2//19 0 (0 0 .1 .1 22//2 2 9 9 ))22/2810
(二)单样本情形
第一节 单个总体均数
(二)单样本情形
第一节 单个总体均数
(三)配对设计的情形
d
(dt/2,
n
第一节 单个总体均数
(三)配对设计的情形
例4 对某地区因患大骨节病进行换膝手术的患者进行术后效果评价,共纳 入11名患者,每名患者分别在术前、术后各测量一次下肢力线角度(下肢 力线角度定义为:股骨机械轴与胫骨机械轴的夹角)并分别求出与标准角 度(180°)的差别,同一患者术前和术后的差别可视为配对资料,数据如 表所示。术前、术后下肢力线角度与标准角度分别获得的偏差度数的差值 服从正态分布。现估计术前术后下肢力线角与标准角度偏差度数的差值的 95%置信区间。
(一)t 分布
单个样本均数的抽样分布与t分布
第一节 单个总体均数
(一)t 分布
第一节 单个总体均数
(一)t 分布
第一节 单个总体均数
(二)单样本情形
(xt/2,
sn, xt/2,
s) n
第一节 单个总体均数
(二)单样本情形
s
s

卫生统计学第八版李晓松第十七章寿命表

卫生统计学第八版李晓松第十七章寿命表

第十七章寿命表目录第一节:寿命表的概念与计算方法第二节:简略现时寿命表第三节:去死因寿命表第四节:健康期望寿命表第五节:寿命表相关指标的分析与应用0102030405第六节:伤残调整寿命年及模型寿命表 06重点难点※现时寿命表的概念和计算方法※简略现时寿命表的编制方法※去死因寿命表的编制方法※健康期望寿命表的编制方法※伤残调整寿命年及模型寿命表的概念第一节寿命表的概念与计算方法1.寿命表的概念寿命表(life table)也称为死亡率表或保险计算表,在人口学、流行病学、保险精算学等领域广泛应用,是一种呈现不同年龄组死亡概率、期望寿命及相关指标的表格。

这些指标可以反映某群体的生命全过程,反映该人群健康水平及死亡状况。

编制原理期望寿命本质上就是令假想的人口数根据当地各年龄组的实际死亡率来死亡时,同年龄人的平均余寿。

因此,现时寿命表相当于进行标准化,有关的计算与标准化法类似。

只要知道各年龄组的平均人口数和死亡数即可编制寿命表。

期望寿命既可综合反映各年龄组的死亡水平,又能以期望寿命的长短表明人群的健康水平,它是社会、经济、文化和卫生发展水平的综合体现。

通过期望寿命的比较,可以衡量不同地区或国家人群的健康水平,这是不同国家、不同时期健康水平进行比较的最常用指标。

据2015年《中国卫生和计划生育统计年鉴》报告,我国1990年、2000年、2005年和2010年的期望寿命分别为68.6岁、71.4岁、73.0岁和74.8岁,反映了我国卫生事业和社会经济发展迅速。

第二节简略寿命表的编制第二节简略寿命表的编制第三节去死因寿命表第三节去死因寿命表去死因寿命表(cause eliminated life table)。

研究某种死因对居民死亡的影响,可编制去死因寿命表基本思想是:假使消除了某种死因,则原死于该死因的人不死于该死因,寿命就会有所延长。

显然,如果消除了对生命威胁大的死因,寿命就会延长更多。

优点:①以某死因耗损的期望寿命和尚存人数合理地说明了该死因对群体生命的影响程度;②去死因寿命表的指标既能综合说明某死因对全人口的作用,又能分别说明某死因对各年龄组人口的作用;③去死因寿命表的指标同样不受人口年龄构成的影响,便于相互比较。

卫生统计学第八版李晓松第十七章 寿命表

卫生统计学第八版李晓松第十七章 寿命表

第四节 健康期望寿命表
第四节 健康期望寿命表
同时考虑年龄组死亡率与年龄组患病率,良好健康状况下的期望寿命即为健康期望寿命 (healthy life expectancy,HALE) 。
1964年Sanders首次提出健康期望寿命的概念,1971年Sullivan提出编制健康期望寿命表的 方法,称为Sullivan方法。
第一节 寿命表的概念与计算方法
期望寿命既可综合反映各年龄组的死亡水平,又能以期望寿命的长短 表明人群的健康水平,它是社会、经济、文化和卫生发展水平的综合体现。 通过期望寿命的比较,可以衡量不同地区或国家人群的健康水平,这是不 同国家、不同时期健康水平进行比较的最常用指标。
据2015年《中国卫生和计划生育统计年鉴》报告,我国1990年、2000 年、2005年和2010年的期望寿命分别为68.6岁、71.4岁、73.0岁和74.8岁, 反映了我国卫生事业和社会经济发展迅速。
出 生 期 望 寿 命 life e0 即“0~岁”组的期望寿命。一定死亡率下同时出生的一代人
expectancy at birth
的未来平均存活年数
第一节 寿命表的概念与计算方法
编制原理 期望寿命本质上就是令假想的人口数根据当地各年龄组的
实际死亡率来死亡时,同年龄人的平均余寿。因此,现时寿命 表相当于进行标准化,有关的计算与标准化法类似。只要知道 各年龄组的平均人口数和死亡数即可编制寿命表。
第五节 寿命表相关指标的分析与应用
第五节 寿命表相关指标的分析与应用
表 17-7 中国和全球不同 SDI 国家的出生期望寿命与出生健康期望寿命(岁)
2005 年
地区


2015 年

卫生统计学第八版李晓松第三章 数据的产生

卫生统计学第八版李晓松第三章 数据的产生

B
11
第二节 随机对照试验
(一)设计原则
2. 随机化(randomization)
(1)决定如何将试验对象分配到各处理组中,只有当所有处理组中试验对象的基本 情况相当时,各处理组间的效应比较才是有效的。 (2)匹配定义:找到性别、年龄等变量情况相似的两组对象分别给予不同的处理。 (3)匹配存在的问题:不一定能完全避免偏倚,因为有太多潜在的变量可能影响试 验的结果,很难把所有的因素都进行匹配。 (4)随机化思想:使用随机的方式使每个实验对象有同等的机会被分配到各处理组。 (5)随机化方法:抽签。 (6)随机化意义:保证了各对比组间的均衡可比性。
1. 总体(population) 根据研究目的确定的同质研究个体的全体。 2. 样本(sample) 是为了解总体而观测的总体的一部分。 3. 简单随机抽样(simple random sample, SRS)
(1)随机抽样:总体中每个个体有相同的机会被选中作为样本参与调查,降低样本 的选择偏倚。 (2)简单随机抽样:从总体中以相同机会抽取的n个个体称为一个简单随机样本,n 为样本量。
由抽样引起的统计量与统计量之间或者统计量与总体参数之间的变异不 是无规律的,而是具有某种潜在的模式。
B
22
第四节 样本的可靠性与代表性
(一)抽样分布
1. 变量的总体分布 总体中所有个体观测值的分布。 2. 统计量抽样分布 统计量的分布规律,描述了从同一总体重复抽样时,统计 量会有些什么样的值,以及每个值出现的可能性大小。
B
12
第二节 随机对照试验
(一)设计原则
3. 重复(repeat)
(1)每组只有一个试验对象,那么试验结果可能只依赖于具有这类潜在 特质的人被分到了哪个组,但是,如果试验对象足够多,这类人的效应就 能够被平均化,两组的区别就会减少。 (2)重复思想:运用足够多的样本来降低试验的随机误差。

卫生统计学第八版李晓松第十章基于秩的非参数检验

卫生统计学第八版李晓松第十章基于秩的非参数检验

第一节 配对样本的比较
(一)单样本数据的符号秩和检验
基本思想 1.假设样本所对应的总体中位数与给定的总体中位数相同,H0:M1 = M0。 2.计算样本中所有数值与给定中位数的差值,根据所有差值绝对值进行编 秩,得到正差值的秩和R+和负差值的秩和R-。
n(n +1) 3.若H0成立,理论上,R+与R-的总体均数应相等,等于: R ,总体 4 n(n 1)(2n 1) 标准差也应相等,等于: R 。 24 4.若R+与R-相差悬殊,均远离M0,则有理由拒绝H0 。具体通过R+ 或R- 的
第二节 两组独立样本的比较
(一)两组定量数据的比较
12岁男童与女童发样中Ca含量(μg/g)的比较 男童 Ca含量(1) 秩(2) 1843 18 383 4 406 5 334 1 443 6 676 11 771 13 358 3 607 9 484 7 n1=10 R1=77 女童 Ca含量(3) 秩(4) 842 14 336 2 742 12 1367 15 1623 16 597 8 1976 19 1818 17 643 10 4534 20 n2=10 R2=133
第一节 配对样本的比较
(二)配对样本数据的符号秩和检验
检验步骤
(1) 建立检验假设,确定检验水准 H0:差值的总体中位数等于0, Md = 0 H1:差值的总体中位数不等于0, Md ≠ 0
=0.05
(2) 求差值、编秩、求秩和
首先计算每对数据的差值,并对差值进行编秩。分别计算正、负差
值的秩和,得出 R+与R- ,如表所示。
第二节 两组独立样本的比较
(一)两组定量数据的比较
基本思想

卫生统计学第八版李晓松第八章 多个均数比较的方差分析

卫生统计学第八版李晓松第八章 多个均数比较的方差分析
卫生统计学
第八章
多个均数比较的方差分析
尹 平 华中科技大学
曹明芹
新疆医科大学
目录
01 02
第一节:完全随机设计的方差分析
第二节:随机区组设计的方差分析 第三节:多个样本均数间的多重比较
03
05
重点难点
※ 方差分析的基本思想 ※ 完全随机设计方差分析总变异的分解方法 ※ 方差分析的应用条件 ※ 随机区组设计方差总变异的分解方法
第三节 多个样本均数间的多重比较
(三) Bonferroni法
x A xB t s x A xB
x A xB
MS (
误差
1 n
A

1 n
B
误差
)
小结
1. 方差分析常用于多个均数的比较,它与研究目的和设计类型联系在一起, 衍生为单因素和多因素方差分析,应用十分广泛。
2. 方差分析的基本思想: 根据研究目的和设计类型,将全部数据的总变异进行
DON 在 大 骨 节 病 发 病 中 的 作 用 机 制 , 将 24 只 20 日 龄 、 初 始 体 重 为 (90.3±7.8)g 的 健 康 Wistar 幼鼠完全随机地分配至对照(零剂量)组、 DON 低剂量组和高剂量组,每组 8 只, 每两天灌胃染毒 1 次。高、低剂量组分别给予 0.25μg/g 、 0.06 μg/g 的 DON ,对照组给予相 同容量生理盐水灌胃,连续 80 天后,采用免疫组化法检测小鼠软骨内 Ⅱ 型胶原含量。以 IOD(integrated optical density) 值表示 Ⅱ 型胶原的相对含量( Ⅱ 型胶原含量反映软骨细胞 和成骨细胞成熟状况,含量降低提示关节软骨损伤)。实验结果数据见表 8-1 ,试分析 DON对关节软骨代谢是否存在影响。

卫生统计学习题及答案(精华版)

卫生统计学习题及答案(精华版)

统计学习题二、简答1 .简述描述一组资料的集中趋势和离散趋势的指标.集中趋势和离散趋势是定量资料中总体分布的两个重要指标.〔1〕描述集中趋势的统计指标:平均数〔算术均数、几何均数和中位数〕、百分位数〔是一种位置参数,用于确定医学参考值范围,P50就是中位数〕、众数.算术均数:适用于对称分布资料,特别是正态分布资料或近似正态分布资料;几何均数:对数正态分布资料〔频率图一般呈正偏峰分布〕、等比数列;中位数:适用于各种分布的资料,特别是偏峰分布资料,也可用于分布末端无确定值得资料.〔2〕描述离散趋势的指标:极差、四分位数间距、方差、标准差和变异系数.四分位数间距:适用于各种分布的资料,特别是偏峰分布资料,常把中位数和四分位数间距结合起来描述资料的集中趋势和离散趋势. 方差和标准差:都适用于对称分布资料,特别对正态分布资料或近似正态分布资料, 常把均数和标准差结合起来描述资料的集中趋势和离散趋势;变异系数:主要用于量纲不同时,或均数相差较大时变量间变异程度的比拟.2 .举例说明变异系数适用于哪两种形式的资料,作变异程度的比拟度量衡单位不同的多组资料的变异度的比拟. 例如,欲比拟身高和体重何者变异度大,由于度量衡单位不同,不能直接用标准差来比拟,而应用变异系数比拟.3 .试比拟标准差和标准误的关系与区别.区别:⑴标准差S:①意义:描述个体观察值变异程度的大小.标准差小,均数对一组观察值得代表性好;②应用:与均数结合,用以描述个体观察值的分布范围,常用于医学参考值范围的估计;③与n的关系:n越大,S越趋于稳定;⑵ 标准误①意义:描述样本均数变异程度及抽样误差的大小.标准误小,用样本均数推断总体均数的可靠性大;②应用于均数结合,用以估计总体均数可能出现的范围以及对总体均数作假设检验;③与n的关系:n越大,3越小.联系:①都是描述变异程度的指标;②由S=s/n-1可知,&与S成正比.n一定时,s越大,S<越大.4 .简述应用相对数时的考前须知.应用相对数应该注意:①预防概念混淆,预防以比代率的错误现象;②计算相对数时分母应有足够数量,如果例数较少会使相对数波动较大,应该使用绝对数;③正确的计算频率〔或强度〕指标的合计值.当分组的资料需要合并起来估计频率〔或强度〕时,应将各组频率的分子相加作为合并估计的分子,各组的分母相加作为合并估计的分母;④频率型指标的解释要紧扣总体和属性;⑤相对数间比较要具备可比性:要注意观察对象是否同质、研究方法是否相同、观察时间是否一致、观察对象内部结构是否一致、比照不同时期资料应注意客观条件是否相同;⑥正确进行相对数的统计推断:在随机抽样的情况下,从样本估计值推断总体相对数应该考虑抽样误差,因此要进行参数估计和假设检验.5 .说明率的标准化的根本思想及考前须知.⑴标准化:两个率或多个率之间进行比拟时, 为消除内部构成不同的影响,采用 统一的标准,对两组或多组资料进行校正〔调整〕,计算得到标准化率后再做比 较的方法,称为〜.其目的是统一内部构成,消除混杂因素,是资料具有可比性. ⑵应用标准化法的考前须知:①标准化法的应用范围很广.当某个分类变量在 两组中分布不同时,这两个分类变量就成为两组频率比拟的混杂因素,标准化的目的是消除混杂因素.②标准化后的标准化率,已经不再反映当时当地的实际水平,只表示相互比拟的资料间的相对水平. ③标准化法实质是找一个标准, 使两组得意在一个共同的平台上进行比拟.选择不同的标准,算出的标准 化率 也会不同,比拟的结果也未必相同,因此报告比拟结果时必须说明所选用的标准 和理由.④两样本标准化率是样本值,存在抽样误差.比拟两样本标准化率, 当样本含量较小时,还应作假设检验.6 .简述二项分布、Poisson 分布、正态分布三者的关系.①二项分布与Poisson 分布的关系:当n 很大,发生概率冗〔或1-冗〕很小, 二项分布B 〔n,兀〕近似于Poisson 分布P 〔口冗〕;②二项分布与正态分布的关系:当 n 较大,冗不接近0或1 〔特别是当n 九和n 〔1-九〕均大于5时〕,二项分布B 〔n,冗〕近似于正态分布 N ⑴兀,nt 〔1- 兀〕〕; ④Poisson 分布与正态分布的关系:当 人学20时,Poisson 分布渐进正态分布 N 〔入,入〕.关系:①a + B 不一■定等于1.②在样本容量确定的情况下,a 与B 不能同时增加或减少③统计检验力〔1- B 〕.9、参考值范围与总体均数置信区间的区别 〔1身胃值越憎①宣义:姬大多敢人某项指板的数位箱阐;__②计算:正态分•.'电X ±20 .. v S ;单值I I X - 4工8 〕或1-9. X + 19 £〕植端分布获㈣pjR —J 牵似〔Pi. g1或:-g, p-.M 〕任应用;判断某项指后正常与否二总体均数的置售区间tJ 克义;技一定的罟信度佶计总体功数:i 在/用:2 lift ;正态分布□ L ; 口:娟侧了二士「h S-,鼠伸]I. 产二,g 〕或?,,,一%.5『?:0 己如:双巾X ±Z_ n a _ * 单例〔X ~Z… 0一…।支S•, X + Z n a _ :0 工1 *6'• X口J X正态分布江侑峰分布1 o米勒但n是5大】JKWX ±Z tt1.Si 单恻f5-4〞S-P a 或C-U .1 XU.i J L③应用:估计总体均数所在棺围.10 .医院拟研究某新药治疗高血压的疗效,试确定该研究设计中的三要素.实验设计的根本要素:受试对象、处理因素、实验效应;受试对象即为高血压患者,且应分实验组与对照组;处理因素至少应包括旧药治疗、新药治疗,最好设有抚慰剂治疗;实验效应即疗程开始及结束时患者血压变化状况.11 .简述非参数检验的应用条件和优缺点.非参数检验适用于:①有序变量资料;②总体分布类型不明的资料;③分布不对称且无法转化为正态分布资料;④比照组间方差不齐,有无适当变换方法到达方差齐性的资料;⑤一端或两端观察值不确切的资料;⑥等级资料.优缺点:不以特定的总体分布为前提,也不针对决定总体分布的几个参数做推断, 进行的是分布之间的检验.一般不直接用样本观察值做分析,统计量的计算基于原数据在整个样本中按大小所占位次. 由于丢弃了观察值的具体数据,只保存了大小次序的信息,凡适合参数检验的资料,应首选参数检验.12 .举例简要说明随机区组设计资料秩和检验的编秩方法.随机区组设计资料秩和检验的编秩方法为将每个区组的数据由小到大分别编秩, 遇相同数据取平均秩次,按处理因素求秩和;T++T=n 〔n+1〕 /2.13 .简述相关分析的步骤.①进行相关分析前,应先绘制散点图.只有散点有线性趋势时,才能进行直线相关分析.②线性相关分析要求两个变量都是随机变量,而且仅适用于二元正态分布资料;③出现离群值慎用相关;④相关关系不一定是因果关系;⑤分层资料盲目合并易出现假象;⑥样本的相关系数接近零并不意味着两变量间一定无相关性, 有可能是非线性的曲线关系.14 .简述回归模型的适用条件.线性回归模型的适用条件:①线性:因变量Y与自变量X称线性关系;②独立:每个个体观察值之间互相独立;③正态性:任意给定X值,对应的随机变量Y都服从正态分布;④等方差性:在一定范围内不同的X值所对应的随机变量Y 的方差相等.简记为LINE.15 .试述直线相关与直线回归的区别与联系.⑴区别:① 单位:相关系数r没有单位,回归系数b有单位;所以,相关系数与单位无关,回归系数与单位有关;②应用目的:说明两变量间的关联性用相关分析, 说明两者依存变化的数量关系那么用回归分析;③对资料的要求不同:线性回归要求应变量Y是服从正态分布的随机变量;线性相关要求两个变量X和Y为服从双变量正态分布的随机变量.④取值范围:-oo<b<+oo, -1 < r< 1 ;⑤意义:回归系数b表示X每增〔减〕一个单位,Y平均改变b个单位;相关系数r说明具有线性关联的两个变量间关系的密切程度与相关方向;⑤计⑵联系:①方向一致:r与b的正负号一致;②假设检验等价:tr=tb ;; ④用回归解释相关决定系数〔coefficient of determination〕:回归平方和越接近总平方和,那么r2越接近1,相关性越好.三、分析题〔不需要具体计算,给出大概计算步骤即可〕1 .某研究调查了山区、丘陵、平原和沿海地区居民饮用水中氟含量与氟骨症患病率如下表,试问:1〕饮用水中氟含量与氟骨症患病率有无关系2〕有人说,如相关系数的检验结果为P<0.05,可认为,饮水中氟含量高是导致氟骨症高发的原因之一,对吗氟含量〔mg/l〕0.480.644.001.481.602.863.214.71患病率〔%〕22.3723.31 25.32 22.29 28.59 35.00 46.07 46.081〕通过相关分析确定是否有关系:由于两个变量中患病率不能确定其正态性, 本研究宜采用秩相关分析;首先对资料依次进行编秩,根据公式计算秩相关系数r s,然后进行秩相关系数的假设检验,H0: ps=0相关系数为0, H I: ps为相关系数不为0; a =0.05;通过查表或t检验的方法求得统计量与P值,按检验水准作出统计推断.2 〕 P<0.05只能说明他们有统计学上的关联,不能推断因果关系,同时,这个结果是从局域水平上说明两个指标之间的关系,可能存在生态学谬误.2.某医生欲比拟三种镇咳药的疗效,分析三种镇咳药延迟咳嗽的时间.结果经方差分析得下表.(1)请补充并完成方差分析;(2)解释结果.方差分析步骤:(1)建立检验假设,确定检验水准出三种镇咳药疗效相同(误)H:三种镇咳药疗效不同(误)三种镇咳药延迟咳嗽的时间总体均数相同H:三种镇咳药延迟咳嗽的时间总体均数不全相同民=0.05(2)计算检验统计量根据公式F=MS且间/MS组内,求得F=3.445(3)确定P值,作出推断根据V 1= V组间=2, V 2=v组内=37,查F界值表,可知P< 0.05 ,按a =0.05水准, 差异具有统计学意义,可认为三种镇咳药延迟咳嗽的时间总体均数不全相同.3.测得老年性慢性支气管炎病人与健康人的尿中17酮类固醇排出量见下表,比拟两组均数差异是否有统计学意义并解释结果.表X2老年慢支病人与健康人尿中17酮类固醇排出量(mg/24h)病人组2.90 5.41 5.48 4.60 4.03 5.10 5.92 4.97 4.24 4.36 2.72 2.372.09 7.10健康组5.18 8.493.14 6.46 3.726.64 4.01 5.60 4.57 7.71 4.99答:该资料宜采用两独立样本t检验进行分析:(1)建立检验假设,确定检验水准^1=^2,即慢性支气管炎病人组与健康人组的尿中17酮类固醇排出量总体均数相同.H: gw仙2,慢性支气管炎病人组与健康人组的尿中17酮类固醇排出量总体均数不同.a =0.05(2)计算检验统计量根据两组资料方差齐性检验确定用t检验或L检验,根据公式求得统计量t (t ')(3)确定P值,作出推断根据V =n1+n2-2,查t界值表,判断P值大小①假设P> 0.05,接受Hb,可认为两组17酮类固醇排出量总体均数无差异②假设P< 0.05,拒绝H0,接受H 认为两组类固醇排出量总体均数有差异.4.在某地卫生效劳调查中随机抽样调查了400户家庭,他们的平均年医疗费用支出是947元,标准差是291元.设家庭医疗费用近似正态分布,请估计这些 家庭的95麻医疗费用支出范围,并估计当地家庭年医疗费用平均支出.答:假设该地平均年医疗费用支出服从t 分布,由于n=400,可认为t 分布近似 服从标准正态分布.1〕这些家庭的95■医疗费用支出范围即根据95%勺标准计算这些家庭年医疗费 用支出的置信区间,根据公式:均数 班准差*Z 0.05/n -1求得95%S 信区间为:947^291*1.96/400 -1得出这些家庭的95■医疗费用支出范围为〔918, 976〕.2〕估计当地家庭年医疗费用平均支出即提供当地家庭大多数家庭年医疗费用支 出,即提供一个参考值范围,根据公式:均数项准差*Z 0.05求得参考值范围为:947磔1*1.96, 〔377-1517〕.5、某牧区观察慢性布鲁氏病患者植物血凝素 〔PHA 〕皮肤试验反响,问活动型与 稳定型布鲁氏病患者PHAffl 性反响率有无差异〔写出详细步骤〕. 11活动型 1 14 15稳定型 3 7 10提示:四格表周边合计不变的情况下,不同组合确实切概率如下〔1〕建立检验假设,确定检验水准出 冗尸冗2,活动型与稳定型布鲁氏病患者 PHN 日性反响率无差异H:九1手冗2,活动型与稳定型布鲁氏病患者 PH 郊日性反响率有差异a =0.05〔2〕计算检验统计量由于有格子出现1&T&5,因此用确切概率法计算 P 值.⑶确定P 值,作出推断由提示中表〔2〕可知P=0.14>0.05,不拒绝H0,认为活动型与稳定型布鲁氏 病患者PHAffl 性反响率无差异.⑴ 0.0166 ⑵0.14236、观察局部温热治疗移植肿瘤小鼠的疗效,以小鼠的生存天数作为观察指标,结果如下.问: 局部温热治疗对移植肿瘤小鼠的生存天数是否有影响(g=i)(g=2)生存日数秩次生存日数秩次1021231541551661771882092310>90111213(1)对该资料进行编秩,以便进行统计分析(2)两组的理论秩和分别为多少(3)作出统计推断.5 (6分)观察局部温热治疗移植胆寤小鼠的疗效,以小鼠的生存天数作为观察指标,结果如下.问:局部温热治疗对移椎肿相小鼠的生存天数是否有影哨?实粒组但=】)对照组但=2)生存日数秩次生存日薪铁次109.52J1212…*3151*,541515 J5416176P1S719S20一口g232110咖22111L1212.*14(1)对该管料进行编程•葭便逐行统计分折(2)两组的理论铁和分别为多少实验组的理论秩和为115,对照组的理论佚和为138(3)(1)建立检验假设,确定检验水准H0:两组温热治疗时小鼠的生存天数总体分布位置相同;H1:两组温热治疗时小鼠的生存天数总体分布位置不相同;a =0.05 ;(2)计算检验统计量根据公式计算统计量T值(3)确定P值,作出推断通过查T界值表,确定P值① 假设P> 0.05,接受H,可认为两组温热治疗时小鼠的生存天数总体分布位置相同.②假设P<0.05,拒绝H),接受H两组温热治疗时小鼠的生存天数总体分布位置不相同四、论述题1.估计样本例数的意义何在需要确定哪些前提条件答:样本含量估计充分反映了 "重复〞的根本原那么,过小过大都有其弊端.样本含量过小,所得指标不稳定,用以推断总体的精密度和准确度差;检验的功效低,应有的差异不能显示出来,难以获得正确的研究结果,结论也缺乏充分的依据.样本含量过大,会增加实际工作的困难,浪费人力、物力和时间.可能引入更多的混杂因素,从而影响数据的质量.实验所需的样本含量取决于4个因素:(1)假设检验的第I类错误的概率a (2) 假设检验的第II类错误的概率 B (3)容许误差6 (4)总体标准差6或总体概率九o单纯的课本内容,并不能满足学生的需要,通过补充,到达内容的完善教育之通病是教用脑的人不用手,不教用手的人用脑,所以一无所能.教育革命的对策是手脑联盟,结果是手与脑的力量都可以大到不可思议.。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

阳性率的比较: 2 5.10 。请讨论:该医生的统计处理是否正确?若否,请分析
原因并加以修正。
答:不正确,在对 P53 阳性率差异性就行检验的时候,表格理论频数出现 1<T<5 的情况,故应该采用连续用校正公式计算卡方值( 2=0.012,p>0.05)。
7. 什么是非参数检验?与参数检验相比,非参数检验有哪些优点? 答:不依赖于总体分布类型,也不对参数进行推断,而是对总体分布进行分析 的假设检验方法。与参数检验相比,非参数检验对资料要求低,适用范围广,计算 过程相对简单。
18. 生存数据分析的基本内容是什么?分析方法有哪些? 答:基本内容: (1)描述生存时间的分布特点。通过生存时间和生存结局的数据估计平均存 活时间及生存率,绘制生存曲线,根据生存曲线分析其生存特点等。例如上例中肾 上腺皮质癌研究所绘制的生存率曲线可提供预期治疗价值评估信息。 (2)比较生存曲线。通过相应的假设检验方法对不同样本的生存曲线进行比 较,以推断各总体的生存状况是否存在差别,比较不同治疗方法预后效果的差异。 例如本研究比较手术治疗和药物治疗肾上腺皮质癌患者的生存曲线,以推断两种疗 法的效果优劣。 (3)分析影响生存状况的因素。通过生存分析模型来探讨影响生存状况的因 素,通常以生存时间和结局作为因变量,而将可能的影响因素作为自变量,比如年 龄、性别、病理分型、临床分期、治疗方式等。通过拟合生存分析模型,筛选具有 统计学意义的生存状况的影响因素。 分析方法: (1)生存曲线的估计常用的方法有 Kaplan-Meier 法和寿命表法。 (2)生存曲线的比较常用的方法有 log-rank 检验。 (3)分析影响生存状况的因素的方法有 Cox 回归模型。
5. 某职业病防治院希望了解矽肺不同分期患者的胸部平片密度是否存在差异,
收集矽肺患者 492 例,数据见下表 3-2。
矽肺分期
1期 2期 3期 合计
表 3-2 不同分期矽肺患者的胸片密度
密度



43
188
14
1
96
72
6
17
55
50
301
141
合计
245 169 78 492
某医生采用 R×C 交叉表 2 检验,求得统计量 2 163.01,ν= 4,P<0.01,认
4. 多重比较方法 SNK 法、Dunnett-t 法以及 Bonferroni 法有何不同?同一数据 进行多个均数的两两比较,是否存在 SNK 法、Dunnett-t 法以及 Bonferroni 法结果 不一致的情况?
答:SNK 法应用于各组两两间均进行多重比较,考虑到比较均数跨越的组数, 借 助 q 界 值 表 , 做 推 断 结 论 ; Dunnett-t 法 各 实 验 组 均 与 对 照 组 进 行 比 较 ;
Bonferroni 法则是通过调整 水平,使多重比较的整体犯错误的概率不超过 0.05, 调整的水平为 / m (m 为多重比较的次数)。
同一数据进行多个均数的两两比较,可能会存在 SNK 法、Dunnett-t 法以及 Bonferroni 法结果不一致的情况,需结合实际情况慎重下结论,或者进一步增大样 本含量,使最终两两比较结果保持稳定。
xij x 2 ,反映了每个个体观测值与总均数之间的差异。总的自由度为������ − 1。
ij
3. 通过配对 t 检验和两样本均数 t 检验的数据,讨论并验证 t 检验和方差分析 间存在什么关系?
答:配对设计两均数的比较的 t 检验,可以采用随机区组设计的方差分析,结 果完全等价,方差分析的 F 值与配对 t 检验的 t 值存在关系: F t2 ;两独立样本 均数 t 检验,可以采用完全随机设计方差分析,结果完全等价,方差分析的 F 值与 t 检验存在关系: F t2 。
为矽肺不同分期的平片密度不同,且 2、3 期患者胸片密度比 1 期患者高。
(1)该医生的统计处理是否正确?若否,请分析原因。
(2)为了达到本研究目的,宜采用何种统计分析方法?
答:(1)不正确,该资料为双向有序资料,不能用卡方检验。 (2)应采用基于秩次的非参数检验。
6. 某医生对 26 名前列腺癌患者和 20 名直肠癌患者病理标本中 CEA,Pgp,
第三篇 常用推断方法
一、讨论题
1. 某研究选取体重接近的雌体中年大鼠 20 只,随机分为甲、乙两组,每组 10
只。乙组每只大鼠接受 3mg/kg 内毒素,甲组作为对照组,分别测得两组大鼠的肌
酐(mg/L)见表 3-1,为检验两总体均值之间有无差别,该研究先计算两组差值并
进行正态性检验,服从条件后采用配对设计 t 检验:t=3.540,P=0.006。你是否同
意这种统计分析方法?
表 3-1 甲、乙两组大鼠肌酐(mg/L)数据
组别 1
2
3
4
5
6
7
8
9
10
甲组 6.2 3.7 5.8 2.7 3.9 6.1 6.7 7.8 3.8 6.9
乙组 8.5 6.8 11.3 9.4 9.3 7.3 5.8 7.8 7.2 8.2
差值 2.3 3.1 5.5 6.7 5.4 1.2 -0.9 0.0 3.4 1.3
10. 两组独立样本比较的秩和检验,检验假设( H0 )是否可以用 1 2 表示?
为什么? 答:不可以,因为是一般用于描述正态分布集中趋势的统计指标,而秩和检
验比较的总体分布,而不是某个服从某种特定分布的参数。
11. 在秩和检验中,若遇到相同的观测值,为什么要取平均秩? 答:为保证相同观测值的秩和不变,而且相同数值的秩又不能有差别,因而, 这些相同的数值应取相同秩。
数的差值,正差值表示样本中个体值大于给定中位数,负差值则为样本中个体值小 于给定中位数。进而根据所有差值的绝对值进行编秩,将所有正差值的秩相加就得 到正差值的秩和 R+,同理,所有负差值的秩相加即为负差值的秩和 R-。若 R+与 R相差悬殊,均远离 M0,则有理由拒绝 H0。
配对数据符号秩和检验的基本思想与单样本符号秩和检验是一致的。配对数据 中每个配对数值的差值可以看作是一个单独的样本,给定的总体中位数为 0,即推 断差值的单样本是否来自给定中位数为 0 的总体。其余部分则与单样本符号秩和检 验并无差别。
13. 多组独立样本比较的秩和检验的基本思想是什么? 答:Kruskal-Wallis 检验的基本思想就是用所有观测值的秩代替原始观测值进 行单因素方差分析。若所有观测值的总例数为 N,秩只能是 1 到 N 之间的某个整数 (假设没有相同的观测值出现),不管原始观测值是什么,秩的离均差平方和会是 一个固定的数值,因此无需组间变异和组内变异两个都用。Kruskal-Wallis 检验的
17. 生存分析的统计描述指标有哪些?各指标的含义是什么? 答:(1)死亡概率与生存概率:死亡概率指某时段开始时存活的个体,在该 时段内死亡的可能性。
生存概率指某时段开始时存活的个体,到该时段结束时仍存活的可能性。 (2)生存率:生存率表示观察对象的生存时间 T 大于时间 t 的概率,常用 S(t) 表示,即 S(t) Pr(T t) 。生存函数又称为累积生存率,简称生存率。 (3)中位生存时间:生存函数取值为 0.5 时对应的生存时间称为中位生存时 间(median survival time),又称中位生存期或半数生存期。它表示有 50%的个体 可以存活到比更长时间,通常用于描述生存期的平均水平。
P53 三项指标的阳性率进行差异性检验,结果见表 3-3。
表 3-3 两种患者病理标本三项指标的阳性率比较
指标
疾病
直肠癌
前列腺癌
2值
P值
阳性
2
13
CEA
阴性
24
7
阳性
21
15
P53
阴性
5
5
阳性
7
12Байду номын сангаас
Pgp
阴性
19
8
14.39 0.22 5.10
<0.05 >0.05 <0.05
其中,CEA阳性率的比较: 2 14.39 ,P53阳性率的比较: 2 0.22 ,Pgp
的。
16. 举例说明生存资料的特点及生存资料收集时的注意事项。 答:生存资料的特点: (1)生存资料是既考虑生存结局又考虑生存时间的数据。 (2)生存时间指从观察起点到终点事件的时间间隔,往往不满足正态分布, 且存在删失数据。 (3)生存资料通常进行生存分析,可充分利用删失数据所提供的不完全信息。 生存资料收集时注意事项: (1)明确观察对象的起止时间。如肿瘤术后疗效,是以术后第二天为开始时 间,还是出院日为开始时间? (2)明确观察对象的结局事件。如肿瘤术后疗效,以因肿瘤死亡为结局事件, 还是肿瘤出现转移或(和)复发? (3)注意删失数据的随访时间。当这次随访时发生删失,则该观察对象的随 访终止时间为上次随访记录的时间。
检验统计量实质是用秩计算组间变异,当组间变异的数值较大,有理由认为组间存 在差异。
14. 简述直线相关和回归的区别与联系。 答:区别: (1)资料要求不同:直线相关要求 X、Y 服从双变量正态分布;直线回归要 求固定 X 时,反应变量 Y 服从正态分布且等方差,X 可以是精确测量和严格控制 的变量,也可以是随机变量。 (2)应用目的不同:直线相关说明的是两变量间的密切程度,两变量是平等 关系;直线回归说明的是两变量间数量上的依存关系。 (3)指标计算不同:r 与 b 的计算公式不同, r lXY lXX lYY , b lXY lXX 。 (4)指标取值范围不同: 1 r 1, b 。 (5)指标意义不同:r 表示具有直线相关关系的两变量间的相关程度与方向; b 表示 X 每改变一个单位时,Y 平均改变 b 个单位。 (6)指标单位不同:r 没有单位,b 有单位。 联系: (1)对于同一组资料若能同时计算 b 和 r,则二者的正负号一致。 (2)对于同一资料,r 和 b 的假设检验等价,计算得的 t 统计量值相等,即 tr tb 。 (3)用回归解释相关:由于决定系数 R2 SS回 SS总 ,当总平方和固定时,回 归平方和越大, R2 越接近于 1,说明两变量间的相关关系越密切。 (4)对于同一资料,相关系数和回归系数间可以相互换算。
相关文档
最新文档