医学统计学2

合集下载

医学统计学案例分析2

医学统计学案例分析2

案例分析—四格表确切概率法【例1-5】为比较中西药治疗急性心肌梗塞的疗效,某医师将27例急性心肌梗塞患者随机分成两组,分别给予中药和西药治疗,结果见表1-4。

经检验,得连续性校正χ22=3.134,P>0.05,差异无统计学意义,故认为中西药治疗急性心肌梗塞的疗效基本相同。

表1-4两种药物治疗急性心肌梗塞的疗效比较药物有效无效合计有效率(%)中药12(9.33)2(4.67)1485.7西药6(8.67)7(4.33)1346.2合计1892766.7【问题1-5】(1)这是什么资料?(2)该资料属于何种设计方案?(3)该医师统计方法是否正确?为什么?【分析】(1)该资料是按中西药的治疗结果(有效、无效)分类的计数资料。

该资料是按中西药的治疗结果(有效、无效)分类的计数资料完全随机设计方案。

(2)27例患者随机分配到中药组和西药组,属于例患者随机分配到中药组和西药组,属于完全随机设计方案(3)患者总例数n=27<40,该医师用χ2检验是不正确的。

当n<40或T<1时,不宜计算χ2值,需采用四格表确切概率法(exact probabilities in2×2table)直接计算概率案例分析-卡方检验(一)【例1-1】某医师为比较中药和西药治疗胃炎的疗效,随机抽取140例胃炎患者分成中药组和西药组,结果中药组治疗80例,有效64例,西药组治疗60例,有效35例。

该医师采用成组t检验(有效=1,无效=0)进行假设检验,结果t=2.848,P=0.005,差异有统计学意义检验,故认为中西药治疗胃炎的疗效有差别,中药疗效高于西药。

【问题1-1】(1)这是什么资料?(2)该资料属于何种设计方案?(3)该医师统计方法是否正确?为什么?(4)该资料应该用何种统计方法?【分析】(1)该资料是按中西药疗效(有效、无效)分类的该资料是按中西药疗效(有效、无效)分类的二分类资料,即计二分类资料,即计数资料。

(2)随机抽取140例胃炎患者分成西药组和中药组,属于属于完全随机设完全随机设计方案。

医学统计学(2)

医学统计学(2)

1.制定医学参考值范围
参考值范围(reference range):指所谓“正常人” 的解剖、生理、生化等指标的波动范围。 制定方法:
制定参考值范围时,首先要确定一批样本含量
足够大的“正常人”。
测量样本人群相应指标的值,测量的过程中要
严格控制各种误差。
而后根据指标的实际用途确定单侧或双侧界值,
所以,该地健康成年男子第一秒肺通气量的95%参考值 范围为不低于3.05(L)。
2.质量控制
基本原理: 许多临床检验指标,当影响某一指标的随 机因素很多,而每个因素所起的作用均不 太大时,这个指标的随机波动属于随机误 差,则往往服从正态分布。
质量控制领域的“3σ原则”:其意义是指 正常情况下检测误差服从正态分布,根据 正态分布的曲线面积或概率分布理论可知, 3σ之外的观察值出现的概率不到3‰,如 果超过这一值,则提示测量或产品质量有 问题。 统计学规定:以x为中心线,x〒2S 为警戒 线,x〒3S为控制线,根据以上的规定还可 以绘制出质量控制图。
• 2.展示频数分布的特征 频数分布有两个重要特征:一是集中趋势,反映 一组观察值的中心位臵或平均水平;二是离散趋 势,反映观察值之间参差不齐的程度。对数值变 量资料作统计描述,就是用统计指标将这两个重 要特征数量化。 • 3.便于发现某些特大或特小的异常值 对资料中出现的异常值应谨慎对待,必要时对原 始资料进行核实,并再次进行观察或测量。若条 件不允许再次观察或测量,在有充分依据的前提 下,可将异常值予以剔除,然后再做统计描述和 分析。 • 4.有利于进一步计算有关指标和统计分析处理
从数值资料的频数表和频数图中虽可以看 出观察值的分布情况,但为了揭示数据的 基本特征,还需用可量化指标作进一步的 统计描述分析。 数值资料的统计描述,它包括集中趋势和 离散趋势的统计描述。

医学统计学(第2版)(2019年科学出版社出版教材)

医学统计学(第2版)(2019年科学出版社出版教材)
医学统计学(第2版)(2019年科 学出版社出版教材)
2019年科学出版社出版教材
01 成书过程
03 教材目录
目录
02 内容简介 04 教学资源
05 教材特色
07 图书目录
目录06 作者简介《医学统计学(第2版)》是由钟晓妮主编,科学出版社于2019年出版的中国科学院教材建设专家委员会规 划教材、全国高等医药院校规划教材。该教材可供临床医学专业及其他医学专业学生、医学科研人员等使用。
《医学统计学(第2版)》的编写者有王润华教授、钟晓妮教授、张菊英教授、方亚教授、彭斌教授、邓丹教 授、王学梅教授、高晓凤教授、宋桂荣副教授、张燕副教授、叶孟良副教授、张星光副教授、陈卫中副教授以及 高菲菲讲师,张燕担任秘书工作。
《医学统计学(第2版)》在结构上,将原估计性分析拆分为定量变量资料统计描述、定性变量资料统计描述、 统计表与统计图、参数估计;将组间统计量差异比较性分析分解为假设检验基础与t检验、方差分析、X2检验、 秩和检验。内容上,原“两变量间的关联性与趋势性分析”章节主要保留直线相关与回归分析及Spearman等级相 关分析等内容,章节更名为“直线相关与直线回归分析”。删除了各章节之后的练习题,而将其纳入配套的实习 指导用书中;对于例题与统计图的绘制等内容,除常规讲解外,增加了SPSS操作过程介绍。
作者简介
钟晓妮:女,1966年2月生于重庆市梁平县,重庆医科大学公共卫生学院教授、硕士生导师,主要研究领域 为居民健康、卫生服务评价的理论与方法研究以及艾滋病等传染病防治。
图书目录
第一章绪论 第二章医学研究统计设计 第三章定量变量资料统计描述 第四章定性变量资料统计描述 第五章统计表与统计图 第六章 第七章假设检验基础与t检验 第八章方差分析 第九章χ<sup>2</sup>检验 第十章秩和检验 第十一章直线相关与直线回归分析

医学统计学习题二

医学统计学习题二

医学统计学习题二一、名词解释:1、参数2、统计量3、检验水准4、概率5、抽样误差6、医学参考值范围7、统计推断8、标准误9、可信区间10、Ⅰ型错误11、Ⅱ型错误12、标准化死亡比13、非参数检验14、回归系数15、相关系数二、简答题1、医学统计学工作的步骤。

2、正态分布有什么基本特征?有哪几个参数?3、医学正常值范围与可信区间有何区别?4、假设检验中应注意哪些问题?6、应用相对数时应注意的事项?8、非参数检验的适用条件、优缺点?三、是非题1、对数正态分布资料最好计算几何均数以表示其平均水平。

2、不论数据呈什么分布,用算术均数和用中位数表示平均水平都一样合理。

3、理论上只有服从正态分布条件的变量的算术均数等于中位数。

4、随机抽样就是指在抽样研究中不要主观挑选研究个体。

8、同一总体中随机抽样,样本含量越大,则样本标准差越小。

9、只要单位相同,用s和用CV来比较两套变量值的离散度,结论是完全一样的。

10、从同一总体随机抽取的两组数据中,平均数大的组标准差也大。

11、同一批计量数据的标准差不会比标准误大。

12、t检验是对两样本均数的差别作统计检验的方法之一。

13、当总体方差已知时,检验样本均数和某个已知总体均数差别有无统计意义只能用t检验。

14、在配对t检验中,用药前数据减去用药后数据和用药后数据减去用药前数据,作t检验后的结论是相同的。

15、方差分析中均方就是方差。

16、随机区组设计和完全随机设计方差分析的统计效能总是一样的。

17、4个均数作差别的统计检验,可以分别作两两比较的6次t检验以作详细分析。

18、回归系数越大,两变量的数量关系越密切。

19、双变量正态分布资料,样本回归系数小于零,可认为两变量呈负相关。

20、某事物内部某一部分所占的比重就是比例,患病率也是一种比例。

21、要消除甲乙两地各年龄组死亡率不同的影响而对两总的死亡率作比较,可以计算标准化死亡率后再作比较。

22、非参数统计方法不对特定分布的参数作统计推断,但仍要求数据服从正态分布。

医学统计学总结2

医学统计学总结2

九、非参数秩和检验1、非参数统计:有许多资料不符合参数统计的要求,分布是未知,不能用参数统计的方法进行检验,而需要一种不依赖于总体分布类型,也不对总体参数进行统计推断的假设检验,而是对总体的分布或分布位置进行检验,成为非参数检验2、参数检验与非参数检验的比较3、秩和检验:是非参数统计中一种常用的检验方法,其中“秩”又称等级、即按数据大小排定的次序号,上述次序号的和称“秩和”,秩和检验就是用秩和作为统计量进行假设检验的方法4、配对资料符号的秩和检验(1)基本思想假定两种处理效应相同,则差值的总体分布对称,总体中位数为0,也就是说样本的正负秩和绝对值应相近;反之,若两种处理效应不同,则差值总体中位数不为0,中位数偏离0越明显,样本的正负秩和绝对值就会相差越大,原假设H0成立的可能性越小(2)适用条件:1)配对设计的计量资料,但不服从正态分布或分布未知2)配对设计的等级资料(3)一般步骤:1)建立检验假设,确定检验水准H0:差值的总体中位数为0H1:差值的总体中位数不为0a=0.052)编秩次并求秩和统计量先算出各对值的代数差,根据差值绝对值的大小编秩,将秩次冠以正负号;若差值为“0”,舍去不计,总的对子数也要减去此对子数(记为n);若遇到相同数值在不同组,要取平均秩次;最后分别计算正负秩次之和T+和T-,任取其中一个作为检验统计量T(习惯取较小者)3)确定P值,作出推断①当5<n≦50时,可根据n和T查配对设计用的T界值表,若检验统计量T值在上下界值范围内,则P值大于表上方对应的概率值,即0.05;若T值在上下界值外,则P值小于表上方对应的概率值②当n>50时,无法查表,可利用秩和分布的近似正态分布法进行检验;当相同秩次较多时,应采用校正公式进行校正(公式不用记)5、两独立样本比较的秩和检验(1)基本思想如果H0成立,在两样本来自分布相同的总体,两样本的平均秩次应相等或很接近,与总的平均秩次(N+1)/2相差较小;含量为n1的样本的秩和T1应在n1(N+1)/2的左右变化;若T 值偏离此值太远,H0发生的可能性就很小;若偏离出给定的a值所确定的范围内,即P<a,拒绝H0(2)适用条件:完全随机设计的两个样本比较,若不满足参数检验的应用条件,则用本法;两个等级资料比较(3)查表法1)建立假设检验,确定检验水准H0:两总体分布相同H1:两总体分布不同a=0.052)确定秩和检验统计量T首先编秩号,排序时若有相同数据,取平均秩次,进而将两组数据的秩次分别求和,若两组例数相同,则任取一组的秩和作为统计量;若两组秩次不同,则以例数较小者对应的秩和作为统计量3)确定P值,作出推断结论当n1≦10,n2-n1≦10时,查两样本比较的T界值表,将检验统计量T值与T的临界值作为比较,如果T在界值范围内,则P值大于表上方的概率值(0.05),;若T等于界值或在界值范围外,则P值等于或小于表上方的概率值(4)正态近似法当n1或n2-n1超过10时,可用正态近似法计算z值进行z检验;当相同秩次较多时(尤其等级资料),z值需进行校正(公式不用记)6、多个独立样本比较的秩和检验(1)基本思想:如果总体分布位置相同,各组的秩和应该相差不大(2)适用条件:不满足参数检验的应用条件的完全随机设计的多个样本比较;多个等级资料比较(3)一般步骤:1)建立假设,确定检验水准H0:多个总体分布相同H1:多个总体分布不全相同2)计算检验统计量H将多组数据从小到大混合编秩,如有相等数值则取平均秩次;然后分别计算各组的秩和;最后计算H如果相同秩次较多,使用校正公式更加准确3)确定P值,作出推断结论①当k=3,每组例数≦5,查H界值表②k>3,ni>5,近似服从v=k-1的X2分布,查X2界值表7、参数统计和非参数统计的优缺点十、线性相关与回归1、相关:当一个变量增大,另一个也随之增大(或减少),我们称这种现象为共变,或相关;两个变量有共变现象,称为有相关关系;相关关系不一定是因果关系,有可能是伴随关系2、直线相关的资料要求:双变量正态分布3、相关系数:是指衡量两个连续变量之间关联的强度的指标,样本的相关系数用r表示,总体的相关系数用表示;取值范围:-1≦相关系数≦1(1)正相关:0<r≦1,散点云图是斜向上的,这时一个变量增加,另一个变量将增加(2)负相关:-1≦r<0,散点云图是斜向下的,这时一个变量增加,另一个变量将减少(3)相关系数的绝对值越接近1,两变量的关联程度越强;相关系数的绝对值越接近0,两变量的关联程度越弱4、相关系数的显著性检验(1)查表法:当n≦52,v=n-2,查r界值表得到P值1)建立检验假设,确定检验水准H0:=0,XX与XX之间不存在相关关系H1:≠0,XX与XX之间存在相关关系a=0.052)计算统计量3)确定P值,作出结论查r界值表(2)t检验法:当n>52,计算检验统计量tr,查t界值表得到P值1)建立检验假设,确定检验水准2)计算统计量3)确定P值,作出结论查t界值表5、相关注意事项(1)线性相关的前提条件是X、Y都服从正态分布(双变量正态分布)(2)必须在假设检验认为相关的前提下才能以r的大小判断相关程度(3)相关关系并不一定是因果关系,有可能是伴随关系6、自变量(X):原因、容易得到的、变化小的7、因变量(Y):结果、不容易得到的、变化大的8、线性回归:当两个变量存在准确、严格的直线关系时,可以用Y=a+bX,表示两者的函数关系,但在实际生活当中,由于其他因素的干扰,许多双变量之间的关系并不是严格的函数关系,不能用函数方程反映,为了区别于两变量间的函数方程,我们称这种关系式为直线回归方程,这种关系为直线回归——Y^=a+bX(1)式中的Y^是由自变量X推算因变量Y的估计值,a是回归直线在Y轴上的截距,即X=0时的Y值;b为样本的回归系数,即回归直线的斜率,表示当X变动一个单位时,Y 平均变动b个单位(2)计算原理:最小二乘法,该方法的原则是保证各实测点到回归直线的纵向距离的平方和最小,从而使计算出的回归直线最能代表实测数据所反映出的直线趋势9、回归方程的假设检验:总体的回归系数一般用β表示(1)方差分析基本思想:如果X与Y之间无线性回归关系,则SS回归与SS残差都只包含随机因素对Y的影响,因此其均方MS回归与MS残差应近似相等,如果两者差别较大,并超出能够用随机波动解释的程度,则认为回归方程具有统计学意义1)建立检验假设,确定检验水准H0:β=0,即XX与XX间无线性回归关系H1:β≠0,即XX与XX间有线性回归关系a=0.052)计算统计量3)确定P值,得出统计结论查F界值表(2)t检验1)建立检验假设,确定检验水准2)计算统计量Sb是样本回归系数b的标准误,反映样本回归系数与总体回归系数之间的抽样误差Sy|x是剩余标准差,表示因变量Y对于回归直线的离散程度3)确定P值,作出结论10、线性回归分析的注意事项(1)只有将两个内在有联系的变量放在一起进行回归分析才是有意义的(2)作回归分析时,如果两个有内在联系的变量之间存在的是一种依存因果的关系,那么应该以“因”的变量为X,以“果“的变量为Y;如果变量之间并无因果关系,则应以易于测定、较为稳定或变异较小者为X(3)在回归分析中,因变量是随机变量,自变量既可以是随机变量(II型回归模型,两个变量都应该服从正态分布),也可以是给定的量(I型回归模型,在X取值固定时Y服从正态分布),如果数据不符合要求,在进行回归分析前,必须先进行变量的变换(4)回归方程建立后必须作假设检验,只有经假设检验拒绝了无效假设,回归方程才有意义(5)使用回归方程计算估计值时,不可把估计的范围扩大到建立方程时的自变量的取值范围外11、线性相关和回归的区别和联系(1)相关系数的计算只适用于两个变量都服从正态分布的情形,而在回归分析中,因变量是随机变量,自变量既可以是随机变量(II型回归模型,两个变量都应该服从正态分布),也可以是给定的量(I型回归模型,在X取值固定时Y服从正态分布)(2)线性相关表示两个变量之间的相互关系是双向的,回归则反映两个变量之间的依存关系是单向的(3)如果对同一资料进行相关与回归分析,则得到的相关系数r与回归方程中的b正负号是相同的(4)无论是相关分析还是回归分析,求出r或b后都要进行假设检验;实际上,对同一样本可以得出r与b互化的公式,同一样本的两种假设检验也是等价的r与b的符号一致,检验等价——t r=t b=(5)相关回归可以相互解释R的平方称为确定系数;R2=r2=SS回归/SS总;R2表示回归平方和在总平方和中所占的比重,即R2越接近1,说明回归效果越好十一、统计表与统计图1、统计表:是把统计资料和统计分析结果用表格的形式进行表达,其目的是简洁、清晰和直观,方便对比和阅读2、统计表的编制原则(1)重点突出,简单明了(2)主谓分明,层次清楚(3)格式规范3、统计表的结构(1)外形上包括:标题、标目、线条、数字及备注(注释)(2)内容上包括:1)主语:被研究的事物,在表的左边作为横标目2)宾语:说明主语的各项指标,在表的右侧3)定语:在标题内4、制作统计表的基本要求(1)标题:是统计表的总名称,放在表的上方中间位置,简明扼要地说明表的主要内容,包括时间、地点和研究内容(2)标目:用来说明表内数据涵义的文字;横标目位于表的左侧;纵标目位于表头右侧;总标目主要是对纵标目内容的概况,在需要时才设置;标目要尽可能简单、明了,指标的单位标示需清楚(3)线条:一般采用“三线表”的格式;表的顶线和底线把表的主要内容与标题分隔开,中间一条线把纵标目与数据分隔开,不宜使用竖线和斜线;如果某些标目或数据需要分层显示,可用短横线分隔(4)数字:用阿拉伯数字表示,位数对齐,小数位数一致;表内不留空格,无数字用“-”表示,缺失数字用“...”表示,并最好以备注的形式进行说明;若数字是“0”,则填写“0”(5)备注:位于表的下方,不列入表内5、统计图:是把数据资料以图示的形式表达,使数据对比更加形象、直观、一目了然6、统计图的制作原则(1)必须根据资料的性质、分析目的及表达效果选用适当的统计图(2)一个图通常只表达一个中心内容和一个主题,即一个统计学指标(3)绘制图形应注意准确、美观,图线粗细适当,定点准确,不同事物用不同线条或颜色表示,给人以清晰的印象7、绘制统计图的基本要求(1)标题:其作用是简明扼要地说明统计资料的内容、时间和地点,一般位于图的下方中央位置并编号,便于引用和说明(2)图域:一般用直角坐标系第一象限的位置表示图域,或者用长方形框架表示;纵横轴长度比例为5:7(3)标目:分为纵标目和横标目,分别表示纵轴和横轴数字刻度的意义,如有度衡量单位则要标出(4)图例:对图中不同颜色或图案代表的指标注释;通常放在横标目与标题之间(5)刻度:刻度可在内侧或外侧,其数值一般按从小到大的顺序,纵轴由下向上,横轴由左向右8、直方图:用直条矩形面积代表各组频数,各矩形面积总和代表频数的总和;主要用于表示连续变量频数分布情况9、线图:是通过线段的上升或下降来表示指标(变量)的连续变化过程,适用于描述一个变量随另一个变量变化的趋势和波动情况;通常纵坐标是统计指标,横坐标是时间变量10、半对数线图:是一种特殊的线图,纵坐标按对数尺度(通常采用常用对数)给出,横坐标仍按算术尺度,适用于描述研究指标变化的速度,比较事物之间相对的变化速度11、箱式图:用于比较两组或多组数据的平均水平和变异程度,各组数据均可呈现其平均水平、四分位间距、最小值和最大值,主要适用于描述偏态分布的资料;中间的横线表示中位数,箱体的长度表示四分位间距,两端分别是P75和P2512、散点图:用点的密集程度和变化趋势表示两指标之间的直线或曲线关系;适用于双变量资料13、直条图:又称条图,即用等宽直条的长短来表示相互独立的统计指标数值大小和它们之间的对比关系,统计指标既可以是绝对数也可以是相对数;纵轴坐标刻度必须从“0”开始;适用于各组统计指标的比较14、误差条图:用于比较多组资料的均值和标准差(或标准误、可信区间)15、百分条图:适用于描述一个计数资料的构成比或比较多个计数资料的构成比;以长条面积为100%,用长条内各段面积所占的百分比来表示各部分在全体中所占的比例16、圆图:把圆的总面积作为100%,表示事物的全部,而圆内各扇形面积用来表示全体中各部分所占的比例;适用于构成比资料十二、研究设计1、实验设计:是指研究者根据研究目的和条件,结合统计学要求,合理安排各种实验因素,严格控制实验误差,最大限度地获得丰富而可靠的数据;周密的研究设计,可以节省人力、物力、财力和时间,使研究因素的效应得以充分体现2、实验设计三要素(1)研究对象:是指根据研究目的而确定的观察总体,也称为受试对象/受试者或实验对象在实验开始前应对研究对象的条件做出严格的规定,以保证其同质性:1)研究对象应具有明确的纳入标准和排除标准2)选择对处理因素敏感的研究对象3)选择依从性好的受试者作为研究对象4)注意医学伦理学问题(2)处理因素:又称研究因素,是指根据研究目的施加于研究对象的干预措施处理水平:处理因素在实验中所处的状态称为因素的水平混杂因素:在实验过程中,除处理因素外也能使受试对象产生效应的因素(非处理因素),它可能干扰处理因素与效应间的关系在确定处理因素时,需注意以下两点:1)处理因素要标准化:处理因素在整个实验过程中应始终保持不变,有利于分析处理因素与实验结果之间的关系2)明确处理因素和非处理因素(3)实验效应:是处理因素作用于受试对象产生的反应和结果,通过具体的观察指标来表达1)主观指标和客观指标:选用的指标要尽量客观,客观指标不易受主观因素影响2)选择灵敏度和特异度高的指标①灵敏度:是指某处理因素存在时,所选指标能够反映处理因素的效应程度,即反映指标检出真阳性的能力②特异度:是指某处理因素不存在时所选指标不显示处理效应的程度,即反映指标鉴别真阴性的能力3)观察指标的准确度和精密度①准确度:是指研究结果与相应测定事物真实情况符合或接近的程度,主要受系统误差的影响②精密度:是指相同条件下对同一对象的某项指标进行重复测量时,观测值与其均值的接近程度,主要受随机因素的影响3、实验设计四原则(1)对照原则:对照是指在实验中应设立对照组,其目的是通过与对照组效应对比鉴别出实验组的效应大小;只有设立了对照组,才能消除非处理因素对实验结果的影响,使处理因素的效应得以体现1)空白对照:指对照组不给予任何处理;临床上一般不宜使用2)安慰剂对照:指对照组使用一种不含药物有效成分的“伪药物”,即安慰剂,其外观、气味、剂型和处置上均与实验药物相同,不能为受试对象所识别,常用于临床试验3)标准对照:对照组采用现有标准方法或常规方法,或不专门设立对照组,而以标准值或正常值作为对照,即为标准对照4)实验对照:对照组不施加处理因素,但施加某种有关的实验因素,其目的是使两组受试对象所受到的刺激、损伤相同,以避免施加处理的方式可能对其产生的影响5)自身对照:是指对照与实验在同一受试对象身上进行,可以是同一受试对象处理前后,也可以是同一受试对象同期接受不同处理6)相互对照:指各实验组之间互为对照7)历史对照(2)随机化原则:随机化是指每个受试对象有相同的概率或机会被分配到不同的处理组;随机化分组可以使各处理组的受试对象具有相近的特征,可比性好,避免研究者的主观因素对实验效应的影响(3)重复原则:重复是指在相同实验条件下重复进行多次观察;重复是消除非处理因素影响的重要方法,表现为样本量的大小和重复次数的多少为了保证研究结论具有一定可靠性,需要在设计阶段估算所需的最少实验单位数,即样本含量(4)均衡原则:均衡是指某因素各水平组中的受试对象所受到的非实验因素的影响是完全平衡的,即这些组之间的差别完全是由于该因素采取了不同水平所致,而并非其他因素取值不同所造成的影响。

《医学统计学》第二版习题(五年制临床医学等本科生用)

《医学统计学》第二版习题(五年制临床医学等本科生用)

《医学统计学》第二版习题(五年制临床医学等本科生用)习题(一)单项选择题绪论部分1.观察单位为研究中的()。

A.样本B.全部对象C.影响因素D.个体2.总体是由()。

A.个体组成B.研究对象组成C.同质个体组成D.研究指标组成3.抽样的目的是()。

A.研究样本统计量B.由样本统计量推断总体参数C.研究典型案例研究误差D.研究总体统计量4.参数是指()。

A.参与个体数B.总体的统计指标C.样本的统计指标D.样本的总和5.关于随机抽样,下列那一项说法是正确的()。

A.抽样时应使得总体中的每一个个体都有同等的机会被抽取B.研究者在抽样时应精心挑选个体,以使样本更能代表总体C.随机抽样即随意抽取个体D.为确保样本具有更好的代表性,样本量应越大越好第二章6.各观察值均加(或减)同一数后()。

A.均数不变,标准差改变B.均数改变,标准差不变C.两者均不变D.两者均改变7.比较身高和体重两组数据变异度大小宜采用()。

A.变异系数B.差C.极差D.标准差9.偏态分布宜用()描述其分布的集中趋势。

A.算术均数B.标准差C.中位数D.四分位数间距C.右偏态D.偏态12.对数正态分布是一种()分布。

A.正态B.近似正态C.左偏态D.右偏态14.()小,表示用该样本均数估计总体均数的可靠性大。

A.变异系数B.标准差C.标准误D.极差A.算术平均数B.中位数C.几何均数D.平均数16.变异系数CV的数值()。

A.一定大于1B.一定小于1C.可大于1,也可小于1D.一定比标准差小17.数列8、-3、5、0、1、4、-1的中位数是()。

A.2B.1C.2.5D.0.519.关于标准差,那项是错误的()。

A.反映全部观察值的离散程度B.度量了一组数据偏离平均数的大小C.反映了均数代表性的好坏D.不会小于算术均数20.中位数描述集中位置时,下面那项是错误的()。

的平均水平,用那种指标较好()。

A.平均数B.几何均数C.算术均数D.中位数22.一组变量的标准差将()。

医学统计学(第二版)思考与练习答案

医学统计学(第二版)思考与练习答案
逐年
定基比
环比
定基比
环比
1998~
a0
160.5






1999~
a1
144.2
-16.3
-16.3
0.90
0.90
-0.10
-0.10
2000~
a2
130.0
-30.5
-14.2
0.81
0.90
-0.19
-0.10
2001~
a3
120.2
-40.3
-9.8
0.75
0.92
-0.25
-0.08
2002~
4.正态分布的特征:①正态曲线在横轴上方均数处最高;②正态分布以均数为中心,左右对称;③正态分布有两个参数,即位置参数 和形态参数 ;④正态曲线下的面积分布有一定的规律,正态曲线与横轴间的面积恒等于1。曲线下区间 内的面积为95.00%;区间 内的面积为99.00%。
5.①通过大量调查证实符合正态分布的变量或近似正态分布的变量,可按正态分布曲线下面积分布的规律制定医学参考值范围;服从对数正态分布的变量,可对观察值取对数后按正态分布法算出医学参考值范围的对数值,然后求其反对数即可;②对于经正态性检验不服从正态分布的变量,应采用百分位数法制定医学参考值范围。
COPD患者的经常吸烟率比非COPD患者高26.69%
还需进一步对 作假设检验(见第十一章),若经检验有统计学意义,可以认为经常吸烟与慢性阻塞性肺病(COPD)有一定的关系。
输出结果
2.解:
表5-4某地居民1998~2004年某病死亡率(1/10万)动态变化
年份
符号
死亡率
绝对增长量

医学统计学试卷2

医学统计学试卷2

医学统计学试卷2标题:医学统计学试卷2一、选择题1、以下哪个统计方法适用于描述连续变量的分布情况?A.频数分布表B.列联表C.直方图D.散点图答案:C.直方图解释:直方图可以直观地展示连续变量的频数分布情况,通过直方图的形状可以大致判断数据的分布情况。

2、在医学研究中,以下哪个因素不属于混杂因素?A.研究对象的年龄B.研究对象的性别C.研究对象的种族D.研究对象的遗传背景答案:A.研究对象的年龄解释:混杂因素是指与研究因素和疾病结局相关的非处理因素,与研究对象的年龄无关。

而研究对象的性别、种族和遗传背景都可能影响疾病的发生和发展,因此属于混杂因素。

3、在随机抽样中,以下哪种方法可以保证样本的代表性?A.简单随机抽样B.系统抽样C.分层抽样D.多层抽样答案:A.简单随机抽样解释:简单随机抽样是指从总体中随机抽取一定数量的样本,每个样本被抽中的概率相等,因此可以保证样本的代表性。

系统抽样和分层抽样都有可能引入偏差,多层抽样则在实际操作中较为困难。

4、在医学研究中,以下哪个指标是用于衡量治疗效果的最佳指标?A.有效率B.治愈率C.生存率D.发病率答案:C.生存率解释:生存率是指研究对象在一段时间内仍然存活的概率,是医学研究中用于衡量治疗效果的最佳指标之一。

有效率、治愈率和发病率都不能完全反映治疗效果。

5、在统计分析中,以下哪个方法可以判断两个变量之间是否存在线性相关关系?A. t检验B. F检验C.相关系数D.卡方检验答案:C.相关系数解释:相关系数是用于衡量两个变量之间线性相关程度的指标,通过计算相关系数可以判断两个变量之间是否存在线性相关关系。

t检验和F检验主要用于检验单个变量的假设,卡方检验主要用于检验分类变量之间的关联性。

二、简答题6、请简述医学统计学在医学研究中的应用及意义。

答案:医学统计学在医学研究中具有广泛的应用和意义。

医学统计学可以帮助研究者设计合理的试验方案,确定合适的样本量和分组方法,从而减少试验的误差和偏倚。

医学统计学习题二

医学统计学习题二

医学统计学习题二一、名词解释:1、参数2、统计量3、检验水准4、概率5、抽样误差6、医学参考值范围7、统计推断8、标准误9、可信区间10、Ⅰ型错误11、Ⅱ型错误12、标准化死亡比13、非参数检验14、回归系数15、相关系数二、简答题1、医学统计学工作的步骤。

2、正态分布有什么基本特征?有哪几个参数?3、医学正常值范围与可信区间有何区别?4、假设检验中应注意哪些问题?6、应用相对数时应注意的事项?8、非参数检验的适用条件、优缺点?三、是非题1、对数正态分布资料最好计算几何均数以表示其平均水平。

2、不论数据呈什么分布,用算术均数和用中位数表示平均水平都一样合理。

3、理论上只有服从正态分布条件的变量的算术均数等于中位数。

4、随机抽样就是指在抽样研究中不要主观挑选研究个体。

8、同一总体中随机抽样,样本含量越大,则样本标准差越小。

9、只要单位相同,用s和用CV来比较两套变量值的离散度,结论是完全一样的。

10、从同一总体随机抽取的两组数据中,平均数大的组标准差也大。

11、同一批计量数据的标准差不会比标准误大。

12、t检验是对两样本均数的差别作统计检验的方法之一。

13、当总体方差已知时,检验样本均数和某个已知总体均数差别有无统计意义只能用t检验。

14、在配对t检验中,用药前数据减去用药后数据和用药后数据减去用药前数据,作t检验后的结论是相同的。

15、方差分析中均方就是方差。

16、随机区组设计和完全随机设计方差分析的统计效能总是一样的。

17、4个均数作差别的统计检验,可以分别作两两比较的6次t检验以作详细分析。

18、回归系数越大,两变量的数量关系越密切。

19、双变量正态分布资料,样本回归系数小于零,可认为两变量呈负相关。

20、某事物内部某一部分所占的比重就是比例,患病率也是一种比例。

21、要消除甲乙两地各年龄组死亡率不同的影响而对两总的死亡率作比较,可以计算标准化死亡率后再作比较。

22、非参数统计方法不对特定分布的参数作统计推断,但仍要求数据服从正态分布。

医学统计学2

医学统计学2

参考值
3.5-10 0.5-0.7
单位
X10E9/L
No


结果
0.296 86.3 32.4 375
参考值
0.35-0.55 78.8-100 27-32 300-600
单位
1 白细胞计数(WBC) 2 中性粒细胞百分率(NEUT%) 3 中间细胞百分率(MXD%) 4 淋巴细胞百分率(LYMPH%)
人数
3.7
4.1
4胞数 (1012/L)
频数(频率)分布逐渐接近正态分布示意图
人数
3.7
4.1
4.5
4.9
5.3
5.7
红细胞数 (1012/L)
频数(频率)分布逐渐接近正态分布示意图
高尔顿钉板试验
0
1
2
3
4
5
6
7
8
高尔顿钉板试验
y
0
a b
x
高斯(Gauss)与正态分布
2、单、双侧问题,常依据医学专业知识而定。
双侧 :
血清总胆固醇无论过低或过高均属异常
白细胞数无论过低或过高均属异常
异常
正常
异常 双侧上限
4.80
0.20 2.20 3.48 111
2.0-4.0
X10E9/L
X10E9/L
14 红细胞分布宽度CV(RDW%) 0.137
15 血小板计数(PLT) 16 血小板分布宽度(PDW) 17 平均血小板体积(MPV) 18 大血小板比率(P-LCR) 170 14.8 11.50 0.370 80-300 12-18 4.0-12.0 0.15-0.45 X10E9/L fl fl
1.0-3.3

医学统计学选择

医学统计学选择

习题《医学统计学》第二版(七年制临床医学用)(一)最佳选择题1.描述一组偏态分布资料的变异度,以()指标较好。

A. 全距B. 标准差C. 变异系数D. 四分位数间距E.方差2.用均数和标准差可以全面描述()资料的特征。

A. 正偏态分布B. 负偏态分布C. 正态分布D. 对称分布E.对数正态分布3.各观察值均加(或减)同一数后()。

A. 均数不变,标准差改变B. 均数改变,标准差不变C. 两者均不变D. 两者均改变E.以上都不对4.比较身高和体重两组数据变异度大小宜采用()。

A. 变异系数B. 方差C. 极差D. 标准差E.四分位数间距5.偏态分布宜用()描述其分布的集中趋势。

A. 算术均数B. 标准差C. 中位数D. 四分位数间距E.方差6.各观察值同乘以一个不等于0的常数后,()不变。

A.算术均数 B. 标准差C. 几何均数D. 中位数E.变异系数7.()分布的资料,均数等于中位数。

A. 对数正态B. 正偏态C. 负偏态D. 偏态E.正态8.对数正态分布是一种()分布。

(说明:设X变量经变换后服从正态分布,问X变量属何种分布?)A. 正态B. 近似正态C. 左偏态D. 右偏态E.对称9.最小组段无下限或最大组段无上限的频数分布资料,可用()描述其集中趋势。

A. 均数B. 标准差C. 中位数D. 四分位数间距E.几何均数10.血清学滴度资料最常用来表示其平均水平的指标是()。

A.算术平均数B.中位数C.几何均数D.变异系数E.标准差11.( )小,表示用该样本均数估计总体均数的可靠性大。

A. B. S R E.四分位数间距12.两样本均数比较的t 检验,差别有统计学意义时,P 越小,说明( )。

A.两样本均数差别越大B.两总体均数差别越大C.越有理由认为两总体均数不同D.越有理由认为两样本均数不同E.越有理由认为两总体均数相同13. 甲乙两人分别从同一随机数字表抽得30个(各取两位数字)随机数字作为两个样本,求得1X 和21S ;2X 和22S ,则理论上( )。

医学统计学(第2章)正态分布

医学统计学(第2章)正态分布

dx
(2-18) )
F(X)
p(a〈x〈b)
0 12.00 14.50 17.00 19.50 22.00 24.50 27.00 29.50 32.00
正态分布曲线下面积的含义
1.表示变量值(x)在a-b区间变量值所占 1.表示变量值 表示变量值( 全部(总体)变量值的比例或概率 比例或概率(p)。 全部(总体)变量值的比例或概率(p)。 2变量值在整个曲线下的面积为100%,或 变量值在整个曲线下的面积为100%,或 出现的概率为1 出现的概率为1。
第五节 医学参考值范围的制定
一、概念 医学参考值是指包括绝大多数“ 医学参考值是指包括绝大多数“正 常人” 的各种生理及生化指标常数, 常人 ” 的各种生理及生化指标常数 , 也 称正常值。 称正常值。 正常值是指在一定范围内波动的值, 正常值是指在一定范围内波动的值, 医学上常用95% 医学上常用95%的范围作为判定正常或 异常的参考标准。 异常的参考标准。
二、 标准正态分布
1.标准正态分布及标准化变量值(u) 标准正态分布及标准化变量值( ) 标准正态分布及标准化变量值 任何正态分布的X值通过 值转换后,称为标 任何正态分布的 值通过u值转换后 称为标 准化的正态分布, 准化的正态分布,即u ~N( µ=0 , σ2=1) ( ) 概率密度函数为: 。概率密度函数为: 2
Φ(−u) 表示从-∞到- u值对应曲线范围 表示从- 值分布比例。 内X值分布比例。
例1: :
Φ(u = −1) = 0.1587 Φ(µ =1) =1− Φ(u = −1)
=1− 0.1587 = 0.8413
例2:标准正态变量值u=(-1,1)和u= 标准正态变量值u=( 1.96,1.96)区间内面积各为多少? ( -1.96,1.96)区间内面积各为多少?

《医学统计学》第二章定量数据的统计描述

《医学统计学》第二章定量数据的统计描述
630
累积频数
(3) 27
196 363 457 538 580 608 622 626 629 630

累积频率(%)
(4) 4.29 31.11 57.62 72.54 85.40 92.06 96.51 98.73 99.37 99.84 100.00
资料如表,试计算其中位数。
某地630名正常女性血清甘油三酯含量(mmol/L)
甘油三酯(mmol/L)
(1) 0.10~ 0.40~ 0.70~ 1.00~ 1.30~ 1.60~ 1.90~ 2.20~ 2.50~ 2.80~ 3.10~
合计
频数
(2) 27 169 167 94 81 42 28 14 4 3 1
练习
例 8名食物中毒患者的潜伏期分别为1,4,3,3,2,5,8,16小时,
求中位数。
n=8,为偶数
M
1
2
(
x (
8 2
)
x (
8
1)
)
2
1 2 ( x4
x5 )
1 3 4
2
3.5(小时)
例 某传染病11名患者的潜伏期(天)分别为1,3,2,2,3,7,5,6,
4,7,9,求中位数。
n=11,为奇数 M xn1 2 x(111) x6 4(天 ) 2
偏态分布
正偏态 负偏态
正偏态:集中位置偏向数值小的一侧 负偏态:集中位置偏向数值大的一侧
医学统计学(第7版)
正 态 分 布
医学统计学(第7版)
正偏态
集中位置偏向 数值小的一侧
负偏态
集中位置偏向 数值大的一侧
(麻疹年龄分布)
(肺癌年龄分布)

医学统计学--第二章 计量资料的统计描述

医学统计学--第二章  计量资料的统计描述

4.13 4.28 4.91 3.95 4.23 3.75 4.57 3.51
2.78 3.26 3.18 5.08 3.57 3.98 3.80 3.86
4.26 3.50 3.68 4.53 4.83 4.13 3.93 3.02
3.58 2.70 4.83 3.92 3.52 4.26 3.78 3.70
1
lg X ) lg (
n
1
ቤተ መጻሕፍቲ ባይዱ
lg10 lg 20 lg 40 lg 40 lg160 ( ) 34.8 5
(2)加权法 公式:
G lg (
1
f lg X f
)
例2-5 69例类风湿关节炎(RA)患者血清EBV-VCAlgG抗体滴度的分布见表2-4第(1)、(2)栏,求其平均 抗体滴度。
三、频数表和频数分布图用途
1.描述频数分布的 类型 (1)对称分布 :若 各组段的频数以频数 最多组段为中心左右 两侧大体对称,就认 为该资料是对称分布
25
20 15
Æ µ Ê ý
10 5
0
2.45
3.05
3.65
4.25
4.85
5.45
6.10
Ñ Ç × µ ¹ ´ £ mmol/L£ ª å Ü ¨Ì ¼ ¨ ©
G 公式: X 1 X 2 X n
n

G lg
1
lg X ) (
n
例2-4 某地5例微丝蚴血症患者治疗七年后用间接 荧光抗体试验测得其抗体滴度倒数分别为,10, 20,40,40,160,求几何均数。
G 10 20 40 40 160 34.8
5
G lg

医学统计学第二版高等教育出版社课后习题答案

医学统计学第二版高等教育出版社课后习题答案

医学统计学第二版高等教育出版社课后习题答案第一章绪论1.举例说明总体和样本的概念。

研究人员通常需要了解和研究某一类个体,这个类就是总体。

总体是根据研究目的所确定的所有同质观察单位某种观察值(即变量值)的集合,通常有无限总体和有限总体之分,前者指总体中的个体是无限的,如研究药物疗效,某病患者就是无限总体,后者指总体中的个体是有限的,它是指特定时间、空间中有限个研究个体。

但是,研究整个总体一般并不实际,通常能研究的只是它的一部分,这个部分就是样本。

例如在一项关于2007年西藏自治区正常成年男子的红细胞平均水平的调查研究中,该地2007年全部正常成年男子的红细胞数就构成一个总体,从此总体中随即抽取2000人,分别测的其红细胞数,组成样本,其样本含量为2000人。

2.简述误差的概念。

误差泛指实测值与真实值之差,一般分为随机误差和非随机误差。

随机误差是使重复观测获得的实际观测值往往无方向性地围绕着某一个数值左右波动的误差;非随机误差中最常见的为系统误差,系统误差也叫偏倚,是使实际观测值系统的偏离真实值的误差。

3.举例说明参数和统计量的概念。

某项研究通常想知道关于总体的某些数值特征,这些数值特征称为参数,如整个城市的高血压患病率。

根据样本算得的某些数值特征称为统计量,如根据几百人的抽样调查数据所算得的样本人群高血压患病。

统计量是研究人员能够知道的,而参数是他们想知道的。

一般情况下,这些参数是难以测定的,仅能够根据样本估计。

显然,只有当样本代表了总体时,根据样本统计量估计的总体参数才是合理的。

4.简述小概率事件原理。

当某事件发生的概率小于或等于0.05时,统计学上习惯称该事件为小概率事件,其含义是该事件发生的可能性很小,进而认为它在一次抽样中不可能发生,这就是所谓的小概率事件原理,它是进行统计推断的重要基础。

第二章调查研究设计1.调查研究主要特点是什么?调查研究的主要特点是:①研究的对象及其相关因素(包括研究因素和非研究因素)是客观存在的,不能人为给予干预措施②不能用随机化分组来平衡混杂因素对调查结果的影响。

医学统计学(李晓松主编第2版高等教育提高出版社)附录思考与理解练习95%答案解析

医学统计学(李晓松主编第2版高等教育提高出版社)附录思考与理解练习95%答案解析

一、SPSS 基本功能SPSS基本功能数据管理统计分析图表分析:条图、直方图、饼图、线图、散点图等输出管理:对输出结果复制、编辑等描述性分析均数比较一般线性模型相关与回归分析非参数检验生存分析FrequenciesDescriptivesExploreCrosstabs 统计资料的类型资料类型定量资料:用定量的方法获得的数值资料计数资料:按性质或类别分组后清点各组个数等级资料:半定量资料定量资料的统计推断正态分布两组均数比较单样本设计t检验配对设计t检验成组设计t检验三组及以上均数比较完全随机设计方差分析随机区组设计方差分析重复测量方差分析析因设计方差分析偏态分布配对设计秩和检验单样本设计秩和检验成组设计秩和检验资料类型定量资料计数资料等级资料统计分析统计描述统计推断相对数总体率的估计假设检验u检验卡方检验4假设检验参数检验非参数检验正态分布等级资料偏态分布资料分布类型未知方差不齐,且不易变换达到齐性数据一端或两端不确定的资料1.参数检验:已知总体分布类型,对未知的总体参数做推断的假设检验方法。

故参数检验依赖于特定的分布类型,比较的是总体参数2.非参数检验:不依赖于总体分布类型、不针对总体参数的检验方法。

故非参数检验对总体的分布类型不做任何要求,不受总体参数的影响,比较的是分布或分布位置。

适用范围广,可适用于任何类型资料 参数检验➢ 优点:资料信息利用充分;检验效能较高 ➢ 缺点:对资料的要求高;适用范围有限 ➢ 优点:适用范围广,可适用于任何类型的资料 ➢ 缺点:检验效能低,易犯Ⅱ型错误 凡适合参数检验的资料,应首选参数检验对于符合参数检验条件者,采用非参数检验,其检验效能低,易犯Ⅱ型错误第一章绪论1.举例说明总体和样本的概念。

研究人员通常需要了解和研究某一类个体,这个类就是总体。

总体是根据研究目的所确定的所有同质观察单位某种观察值(即变量值)的集合,通常有无限总体和有限总体之分,前者指总体中的个体是无限的,如研究药物疗效,某病患者就是无限总体,后者指总体中的个体是有限的,它是指特定时间、空间中有限个研究个体。

医学统计学试题 (2)

医学统计学试题 (2)

一、简答题(每题6分,共60分)1、配对比较的假设检验,符合参数检验条件,能否出现t检验结果P>0.05;而非参数检验P<0.05的结果?如果出现上述情况,此时应该怎样解释检验结果?有可能,因为非参数检验检验效能低(具体自己she)2、某市为了解该地居民发汞(μmol/kg)的基础水平,为汞污染的坏境监测积累资料,对238名留住该市一年以上,无汞作业接触史,无明显肝、肾疾病的居民进行了调查,结果见表1:表1:238名居民发汞含量(μmol/kg)发汞含量1.5~3.5~5.5~7.5~9.5~11.5~13.5~15.5~17.5~19.5~21.5人数20 66 60 48 18 16 6 1 0 3(1)说明此频数分布的特征;选用何中指标描述其集中趋势和离散趋势较好?分布特征:正偏态分布。

描述集中趋势的指标:几何均数;or中位数?(不确定)描述离散趋势的指标:四分位数间距(2)计算该地居民发汞值的95%正常值范围(只写公式,不必计算)。

因为资料呈负偏态分布,故应使用百分位数法计算参数范围,因为发汞过高为异常,应制定单侧95%参考范围。

用公式:P x=L X+i*(n x% —∑f x)/f x3、标淮差与标准误之间的联系与区别是什么?具体答案详见教材75页。

4、某医师对某年某医院的住院病人按不同 职业进行分组统计,结果见表2。

该医 师得到结论:全体病人中工人占75%, 农民占10%。

因此,工人比农民更容易 患病,提示工人的健康状况应受到重视。

你认为这种说法是否合理?若不合理, 为什么?不合理,因为该医师所计算的指标是构成比,只能说明全体病人中,工人、农民及其他所占的比重,不能说明3种职业患病的频率或强度,该医师犯了以构成比代替率的错误。

4、某年级一班、二班各有学生50人。

从两个半各抽取10人测量身高,并求其平均身高。

如果一班平均身高160cm ,二班平均身高154cm ,能否认为一班学生的平均身高高于二班?为什么? 不能进行此推论,理由如下。

医学统计学题二

医学统计学题二

医学统计学习题二一、名词解释:1、参数2、统计量3、检验水准4、概率5、抽样误差6、医学参考值范围7、统计推断8、标准误9、可信区间10、Ⅰ型错误11、Ⅱ型错误12、标准化死亡比13、非参数检验14、回归系数15、相关系数二、简答题1、医学统计学工作的步骤。

2、正态分布有什么基本特征?有哪几个参数?3、医学正常值范围与可信区间有何区别?4、假设检验中应注意哪些问题?6、应用相对数时应注意的事项?8、非参数检验的适用条件、优缺点?三、是非题1、对数正态分布资料最好计算几何均数以表示其平均水平。

2、不论数据呈什么分布,用算术均数和用中位数表示平均水平都一样合理。

3、理论上只有服从正态分布条件的变量的算术均数等于中位数。

4、随机抽样就是指在抽样研究中不要主观挑选研究个体。

8、同一总体中随机抽样,样本含量越大,则样本标准差越小。

9、只要单位相同,用s和用CV来比较两套变量值的离散度,结论是完全一样的。

10、从同一总体随机抽取的两组数据中,平均数大的组标准差也大。

11、同一批计量数据的标准差不会比标准误大。

12、t检验是对两样本均数的差别作统计检验的方法之一。

13、当总体方差已知时,检验样本均数和某个已知总体均数差别有无统计意义只能用t检验。

14、在配对t检验中,用药前数据减去用药后数据和用药后数据减去用药前数据,作t检验后的结论是相同的。

15、方差分析中均方就是方差。

16、随机区组设计和完全随机设计方差分析的统计效能总是一样的。

17、4个均数作差别的统计检验,可以分别作两两比较的6次t检验以作详细分析。

18、回归系数越大,两变量的数量关系越密切。

19、双变量正态分布资料,样本回归系数小于零,可认为两变量呈负相关。

20、某事物内部某一部分所占的比重就是比例,患病率也是一种比例。

21、要消除甲乙两地各年龄组死亡率不同的影响而对两总的死亡率作比较,可以计算标准化死亡率后再作比较。

22、非参数统计方法不对特定分布的参数作统计推断,但仍要求数据服从正态分布。

医学统计学(第2版)练习思考题

医学统计学(第2版)练习思考题

《医学统计学》(第2版)练习思考题第一章 绪论一、最佳选择题1.医学统计学研究的对象是( c )A .医学领域的某种小概率事件B .疾病的预防与治疗C .有变异的医学事件D .各种类型的数据E .医学中的必然事件2.从总体中抽取样本的目的是( c )A .研究样本统计量B .研究典型案例C .由样本统计量推断总体参数D .计算统计指标E .研究总体统计量3.用样本推断总体,具有代表性的样本是指( d )A .在总体中随意抽取任意个体B .剔除总体中偏大或偏小后的部分个体C .总体中最容易获得的部分个体D .依照随机原则抽取总体中的部分个体E .挑选总体中的有代表性的部分个体4.下列资料属于等级资料的是(C )A .红细胞计数B .门诊就诊人数C .患者的病情分级D .ABO 血型分型E .成年男性的体重资料5.关于随机抽样误差,下列不正确的是(A )A .不可避免B .可尽量减小C .无方向性D .可间接地计算出它的大小E .与样本含量大小无关6.关于概率的说法,下列不正确的是(A )A .某种事件发生的频率即概率B .大小在10≤≤PC.在实际中,概率是难以获得的D.随机事件的概率为1<P0< E.某事件发生的概率为05P时,称为小概率事件≤.0二、简答题1.医学统计学与数理统计学有什么区别与联系?P12.资料类型有哪几类?根据分析需要,如何将其相互转化?P63.医学统计工作包括那几个基本步骤?P74.医学统计学的主要内容是什么?P35.统计学的特点和基本思想是什么?P36.如何正确认识医学统计学的作用?P8第二章实验设计与调查设计一、最佳选择题1.实验设计和调查设计的根本区别是( D )A.实验设计是以动物为研究对象B.调查设计是以人为研究对象C.实验设计可以随机分组D.调查设计不可以随机分组E.实验设计可以人为设置处理因素2.实验设计的三个基本要素是( D )A.随机、对照、均衡B.随机、对照、重复C.随机、对照、盲法D.处理因素、研究对象、实验效应E.受试对象、处理因素、综合指标3.在实验设计中,选择实验效应指标时应注意( E )A.特异性B.灵敏性C.客观性D.精确性E.以上都是4.实验设计应遵循的基本原则是( A )A.随机、对照、均衡、重复B.随机、对照、盲法、重复C.随机、配对、盲法、均衡D.随机、配伍、对照、重复E.随机、盲法、对照、实用5.实验设计中影响样本含量大小的因素为( E )σA.αB.βC.参数的容许误差δD.总体标准差E.以上都是6.在常用的调查研究抽样中,抽样误差由大到小的顺序为(C )A.整群抽样≥单纯随机抽样≥分层抽样≥系统抽样B.分层抽样≥系统抽样≥单纯随机抽样≥整群抽样C.单纯随机抽样≥整群抽样≥系统抽样≥分层抽样D.整群抽样≥单纯随机抽样≥系统抽样≥分层抽样E.整群抽样≥分层抽样≥系统抽样≥单纯随机抽样1.实验设计的基本原则是什么?基本要素包括哪些?P13P122.何谓随机?随机的目的是什么?P133.决定样本含量的依据有哪些?. 决定样本含量的依据有哪些?答:决定样本含量的依据有:①犯Ⅰ类错误的概率α,即检验水准。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
Σ为求和符号,读成sigma
17
表2-3 140名正常男子红细胞数的均数计算表
脉搏组段(i) 3. 80~ 4.00~ 4.20~ 4.40~ 4.60~ 4.80~ 5.00~ 5.20~ 5.40~ 5.60~ 5.80~6.00 合计 组中值(xi) 3.90 4.10 4.30 4.50 4.70 4.90 5.10 5.30 5.50 5.70 5.90 频数(fi) 2 6 11 25 32 27 17 13 4 2 1 140 fi xi 7.8 24.6 47.3 112.5 150.4 132.3 86.7 68.9 22 11.4 5.9 669.8
fm=167
∑fL=196
169 167 94 81 42 28 14 4 3 1 630
L=70
M = 70 +
30 (630 × 50% − 196) = 91.4(mg / dl ) 167
32
(二)百分位数
——是把一组数据从小到大排列,分割成100等 是把一组数据从小到大排列,分割成 等 是把一组数据从小到大排列 的观察值, 份,每等份含1%的观察值,分割界限上的值 每等份含 的观察值 就是百分位数。用符号 P x 表示。 表示。 就是百分位数。
)
i (n • 50 % − ∑ f L ) M = L+ fm
28
例2-5:
有9名中学生甲型肝炎的潜伏期(天): 12,13,14,14,15,15,15,17,19, 试求中位数。 解:(1)对数值从小到大排序; (2)n=9为奇数;
(3 ) M = x
= x5
n +1 2
定义:同时列出观察指标(变量) 定义:同时列出观察指标(变量)的可 观察指标 能取值区间及其在各区间出现的频数的 取值区间及其在各区间出现的频数的 及其在各区间出现的频数 一种统计表。 一种统计表。 制作方法: 制作方法:先根据观察值的大小进行分 组,然后计算每组中观察值出现的次数
5
表2-1 某地140名成年男性红细胞数(次/分)
∑lgx) = lg (
−1
n
21
例2-3:
有8份血清的抗体效价分别为1:5,1:10, 1:20,1:40,1:80,1:160,1:320,1:640, 求平均抗体效价。
解:将各抗体效价的倒数代入上式,得
G = lg −1 [(lg 5 + lg10 + lg 20 + L + lg 640) / 8] = lg −1 (1.752575) = 56.57
= 15
29
例2-6:
有8名中学生甲型肝炎的潜伏期(天): 12,13,14,14,15,15,15,17,试 求中位数。 解:(1)对数值从小到大排序; (2)n=8为偶数;
(3 ) M = ( x
n 2
+ x
n +1 2
) / 2
= ( x4 + x5 ) / 2
9
二、直方图
10
三、频数分布表的用途
分布类型:
正态分布(normal distribution) 正偏态分布:数值偏小的为多数;
如研究有害化学物质在人体内的分布
负偏态分布:数值偏大者为多数;
如研究高血压患者的年龄分布
发现特异值 估计概率
11
集中趋势——平均数 第二节 集中趋势 平均数
平均数——描述一组观察值集中位 描述一组观察值集中位 平均数 置或平均水平的统计指标。 置或平均水平的统计指标。
−1
所以,50人的血清平均抗体效价为1:41.70。 24
注意: 注意:
几何均数的观察值不能小于或等于0。 同一组数据若服从正态分布,几何均数 小于均数。
25
三、中位数和百分位数
(一)中位数:是将一批数据从小至大排列 中位数: 后位次居中的数据值, 后位次居中的数据值,符号为M,反映一 批观察值在位次上的平均水平。 批观察值在位次上的平均水平。
适用条件:适合各种类型的资料。 适用条件:适合各种类型的资料。尤其适合于 ①大样本偏态分布的资料;②资料有不确定数 大样本偏态分布的资料; 资料分布不明等。 值;③资料分布不明等。
26
中位数计算方法:
直接法:
27
频数表法: 频数表法:
M = 该组段的下限 + 组距 (总样本例数 • 50 % − 小于 L的各组段累计频数 该组段的频数
算术均数 几何Biblioteka 数 中位数和百分位数12一、算数均数
直接法:当观察例数不多(如样本含量n 小于30)时,或观察例数虽然很多,但 有计算机及统计软件,均可选择。
(小样本)
加权法:适用于频数表资料。当观察例 数很多又缺乏计算机及统计软件时,若 用直接法很容易出错,可选择。
(大样本)
13
例2-1:
求81、70、66、75、71、63、77、74、 76、68、65、77、69的均数。
= (14 + 15 ) / 2 = 14 . 5
30
例2-7:
对某地630名50-60岁的正常女性检查了 血清甘油三脂含量,资料如下表,试计 算其中位数。
31
表2-4 某地630名正常女性血清甘油三脂含量的频数表
甘油三脂(mg/dl) (1) 10~ M所在组 40~ 70 ~ 100 ~ 130 ~ 160 ~ 190 ~ 220 ~ 250 ~ 280 ~ 310 ~ 合计 频数 (2) 27 累积频数 (3) 27 196 363 457 538 580 608 622 626 629 630 相对频数(%) (4) 4.3 26.8 26.5 14.9 12.9 6.7 4.4 2.2 0.6 0.5 0.2 100.00 累积相对频数(%) (5) 4.3 31.1 57.6 72.5 85.4 92.1 96.5 98.7 99.4 99.8 100.00 包含50%
所以,血清的抗体平均效价为1:56.57。
22
加权法:
G =
lg
−1
∑ (
f lg x

f
)
23
例2-4:
有50人的血清抗体效价,分别为:5人 1:10,9人1:20,20人1:40,10人1:80,6 人1:160,求平均抗体效价。
解:将抗体效价的倒数直接代入上式,得:
5lg10+ 9 lg 20+ 20lg 40+10lg80+ 6 lg160 −1 ) G = lg = lg (1.62012 = 41.70 5 + 9 + 20+10+ 6
平均数( 第二节 平均数(average) )
算数均数( 算数均数(arithmetic mean) ) 几何均数( 几何均数(geometric mean) ) 中位数( 中位数(median)和百分位数(percentile) )和百分位数( ) 2
集中趋势 计量资料 统计描述 计数资料 统计分析 区间估计 统计推断 假设检验 离散趋势
编号 红细胞数 1 2 3 4 5 6 7 8 … 4.76 5.26 5.61 5.95 4.46 4.57 4.31 5.18 … 编号 红细胞数 … 61 62 63 64 65 66 67 … … 4.81 4.54 3.82 4.01 4.89 4.62 5.12 … 编号 … 133 134 135 136 137 138 139 140 红细胞数 … 4.71 5.21 4.94 4.68 5.17 4.91 5.02 4.76
X = 669 .8 140 = 4 .78
18
均数的应用
适用条件:正态分布或者近似正态分布 总体均数:µ;样本均数:
19
二、几何均数
适用条件: 对数正态分布资料。 数据特点: 数值按大小顺序排列后,各观察值呈倍 数关系或近似倍数关系; 例如:抗体的滴度、药物的效价等
20
计算方法:
直接法:
G=n xx2Lxn 1
6
1.频数分布表的制作步骤
):即最大值与最小值之差 (1)求极差(range):即最大值与最小值之差,又称为全距。 ) 极差( ):即最大值与最小值之差,又称为全距。 本例极差: 本例极差: R=5.95-3.82=2.13(次/分) - ( 分 组数、 (2)决定组数、组段和组距:根据研究目的和样本含量 )决定组数 组段和组距:根据研究目的和样本含量n 确定。组距=极差 组数,通常分8-15个组,为方便计,组距 极差/组数 个组, 确定。组距 极差 组数,通常分 个组 为方便计, 参考极差的十分之一, 再略加调整。 参考极差的十分之一 再略加调整。 本例i= 本例 R /10=2.13/10=0.213≈0.20。 。 下限略小于最小值, (3)列出组段:第一组段的下限略小于最小值,最后一个 )列出组段:第一组段的下限略小于最小值 组段上限必须包含最大值 其它组段上限值忽略。 上限必须包含最大值, 组段上限必须包含最大值,其它组段上限值忽略。 (4)列表划记:用划记法将所有数据归纳到各组段,得到各 )列表划记:用划记法将所有数据归纳到各组段, 组段的频数。 组段的频数。
8
2.频数表的分布特征 频数表的分布特征
①集中趋势(central tendency):变量值集中位置 集中趋势 变量值集中位置 本例在组段“ 。本例在组段“4.60~”。 ~ ——平均水平指标 平均水平指标 ②离散趋势(tendency of dispersion):变量值围 离散趋势 变量值围 绕集中位置的分布情况。 中心”位置越远, 绕集中位置的分布情况。离“中心”位置越远, 频数越小;且围绕“中心”左右对称。 频数越小;且围绕“中心”左右对称。 ——变异水平指标 变异水平指标
数值变量的统计描述——之一 数值变量的统计描述——之一 ——
相关文档
最新文档