医学]医学统计学医学检验检验总复习
医学统计学复习重点

整理分析和2.计描述4.(集合)。
1.抽样随机2.分组随机3.实验顺序随机。
称全距,用离散系数,为标准差与均数只比,常:CV=s/x究,1.抽样研究2.个体变异。
系统误差:指数据搜集和测量过程中由于仪器不准确、造成观察结果呈倾向性的偏大或偏小,这种误差称为系统误差由于一些非人真实性(validity):观察值与真值的接近程度,受系统误差的影响( (reliabiliy)——也称精密度(precision)或重复性(repeatability)是直接用样本统计量作为对应的总体参数最常用的是95%10095有5在描述两变量间的关系时,若散点图呈直线趋势或有直线相关关系,可进行直线回归分析。
参数:根根据样本的分布特征而计算得到的1、★医学统计学工作基本步骤:统计设计;收集资料.;整理资料;分析资料2、★统计分析包括:统计描述、统计推断3、频数分布的两个重要特征:集中趋势和离散趋势4、正态分布的两个参数:均数;标准差。
5、★频数表的用途:揭示计量资料的分布类型;揭示计量资料的分布特征;便于发现特大值和特小值;便于进一步进行统计分析★常见的统计资料的类型有:计量资料;计数资料;等级资料7、★t检验的应用条件是:①正态分布:当样本含量较小时,要求样本来自正态总体。
②方差齐性:两样本均数比较时,要求两总体方差相等。
U检验的应用条件是:①大样本(如n>50);②小样本,σ已知且样本来自正态总体。
8、★.描述分类变量常用的指标有率、构成比、相对数。
9、率是指某种现象在一定条件下,实际发生的观察单位数与可能发生该现象的总观察单位数之比,常用来描述某种现象发生的频率大小或强度构成比是指一事物内部某一组成部分的观察单位数与该事物各组成部分的观察单位总数之比,常用来描述某一事物内部各组成部分所占的比重或分布。
10、★四格表卡方专用公式应用条件n≥40,且Tmin≥5 研究事物或现象间的线性关系用相关分析,研究事物或现象间的线性数量依存关系用回归分析。
医学统计学医学检验检验总复习 .ppt

假设检验
统计资料的类型
—— 计量资料
观察单位某项指标测定值的集合。亦称 变量值,是定量的指标,一般有单位。
—— 计数资料
按性质和类别进行分组所得的资料。其变量值 是定性的,可分二项分类和多项分类。
—— 等级资料
按某项指标的不同程度进行分组的资料。 各组之间有量的差别亦为半定量的资料。
根据分析的需要各类资料可以互相转化。
审核 合理分组
统计描述 统计推断
统计工作的步骤
—— 设计
医学科研设计
调查设计
临床实验设计
—— 搜集资料
统计报表
统计资料
医疗卫生工作记录 (经常性工作记录)
专题调查或实验 (一时性工作记录)
—— 整理资料
整理资料
核对检查原始数据 分组汇总资料
—— 分析资料
统计分析
统计描述 统计推断
统计指标、统计 图、表
抽样误差产生的原因:
1、个体之间存在变异; 2、样本是总体中的一部分。
六、 概率 (probability)
•是描述随机事件发生可能性大小的数 值,用P表示。
0≤ P≤1 ﹡ 必然事件的概率为1(100%) ﹡ 不可能发生事件的概率为0 ﹡ 随机事件的概率在0~1之间
统计学基本概念
变量
同质 总体 测量
总复习
医学统计学是统计学的一门分支学科, 它应用概率论和数理统计的原理和方 法,研究医学领域数据资料的收集, 整理分析和推断。它是进行医学科学 研究所必需的主要手段。
医学统计学的主要内容有:
﹡统计描述
﹡参数估计 ﹡假设检验 ﹡医学科研设计
统计学基本步骤
设计
资料搜集
整理
医学统计学复习资料

小;③要注意分子分母正确选用;④要注意率与比的正确应用;⑤要注 意平均率的计算方法;⑥要注意资料的可比性;⑦率和构成比比较时作 假设检验。 7. 简述直线回归与直线相关的区别。 (1)资料要求上不同:直线回归分析适用于应变量是服从正态分布的随 机变量,自变量是选定变量;直线相关分析适用于服从双变量正态分布 的资料。 (2) 两种系数的意义不同:回归系数是表明两个变量之间数量上的依存 关系,回归系数越大回归直线越陡峭,表示应变量随自变量变化越快; 相关系数是表明两个变量之间相关的方向和紧密程度的,相关系数越 大,两个变量的关联程度越大。 9. 假设检验的理论依据是什么?请简述假设检验的基本步骤。 答:假设检验的理论依据是小概率事件原理,步骤为: (1)根据研究目的建立假设,确定检验水准 (2)根据样本统计量的抽样分布规律,选择适当的统计方法,计算检验 统计量 (3)确定P值,做出推断结论 10.方差分析应用广泛,可用于:①两个或多个样本均数间的比较;②分 析两个或多个因素间的交互作用;③回归方程的线性假设检验;④多元 线性回归分析中偏回归系数的假设检验等。本章主要介绍完全随机设计 资料的方差分析、配伍组设计资料的方差分析及重复测量数据的方差分 析。 11. 完全随机设计的两样本率比较时,如何正确选择统计分析方法 (写出相应的计算公式)。 (1)当总例数n≥40且所有格子的T≥5时,用2检验的基本公式或四格表 资料2检验的专用公式; (2)当n≥40但有1≤T<5时,用四格表资料2检验的校正公式;或改用四 格表资料的Fisher确切概率法的连续性校正法: (3)当n<40,或T<1时,用四格表资料的Fisher确切概率法。 12. 什么是医学参考值范围?估计医学参考值范围如何正确选用统计 方法? 答:医学参考值范围是指所谓“正常人”的解剖、生理、生化等指标的 波动范围,亦称正常值范围。如95%的参考值范围包括了95%的观察 值,而有5%的观察值不在这一范围内。 估计医学参考值范围确定方法:
医学统计学复习资料

医学统计学第一章绪论第一节医学统计学的定义和内容1.医学统计学的主要内容 :统计推断、统计描述第二节统计工作的基本步骤1.医学统计工作可分为四个步骤:统计设计搜集资料整理资料分析资料第三节统计资料的类型医学统计资料按研究指标的性质一般分为:定量资料、定性资料、等级资料一、定量资料(计量资料)定量资料(quantitative data)是用定量的方法测定观察单位(个体)某项指标数值的大小,所得的资料称定量资料。
如身高(㎝)、体重(㎏)、脉搏(次/分)、血压(kPa,mmHg)等为数值变量,其组成的资料为定量资料。
二、定性资料(计数资料)定性资料(qualitative data)是将观察单位按某种属性或类别分组,清点各组的观察单位数,所得的资料。
亦称无序分类资料。
如:男-女分组;中医的虚、实,阴、阳等分组;按生存-死亡分组;A、B、O、AB分组。
三、等级资料等级资料(ranked data)是将观察单位按属性的等级分组,清点各组的观察单位数,所得的资料为等级资料。
亦称有序分类资料。
如治疗结果分为治愈、显效、好转、无效四个等级。
:疾病的严重程度可以分为,轻、中、重;中医辨证中舌象的颜色有,淡、红、暗、紫。
♦根据需要,各类变量可以互相转化。
♦若按贫血的诊断标准将血红蛋白分为四个等级:重度贫血、中度贫血、轻度贫血、正常,可按等级资料处理。
有时亦可将定性资料或等级资料数量化,如将等级资料的治疗结果赋以分值,分别用0、1、2…等表示,则可按定量资料处理。
第四节统计学中的几个基本概念一、同质与变异同质(homogeneity)是指观察单位或研究个体间被研究指标的主要影响因素相同或基本相同。
如研究儿童的生长发育,同性别、同年龄、同地区、同民族、健康的儿童即为同质儿童。
变异(variation)由于生物个体的各种指标所受影响因素极为复杂,同质的个体间各种指标存在差异,这种差异称为变异。
如同质的儿童身高、体重、血压、脉搏等指标会有一定的差别。
医学统计学复习资料(完整版)

第1章绪论医学统计学是一门“运用统计学的原理和方法,研究医学科研中有关数据的收集、整理和分析的应用科学。
1.个体:又称观察单位,是统计研究的最基本单位,也是构成总体的最基本的观察单位。
2.总体:根据研究目的确定的同质观察单位某项指标测量值(观察值)的集合。
分为有限总体(明确规定了空间、时间、人群范围内有限个观察单位)和无限总体(无时间和空间范围的限制)。
反映总体特征的指标为参数,常用小写希腊字母表示。
3.样本:从总体中随机抽取的一部分有代表性的观察单位组成的整体。
(抽样,随机化原则,样本含量)根据样本资料计算出来的相应指标为统计量,常用大写英文字母表示。
4.抽样研究:从总体中随机抽取样本,根据样本信息推断总体特征的方法。
抽样误差是由随机抽样(样本的偶然性)造成的样本指标与总体指标之间、样本指标与样本指标之间的差异。
其根源在于总体中的个体存在变异性。
只要是抽样研究,就一定存在抽样误差,不能用样本的指标直接下结论。
统计分析主要是针对抽样误差而言。
5.变量(一个个体的任意“特征”);资料(变量值的集合),资料类型:①计量资料/定量资料/数值变量资料:表现为数值大小,一般有度量衡单位,又可分为连续型和离散型两类;②计数资料/定性资料/无序分类变量资料/名义变量资料:表现为互补相容的属性或类别,一般无度量衡单位,可分为二分类和多分类;③等级资料/半定量资料/有序分类变量资料:表现为等级大小或属性程度。
各类资料间可相互转化。
①可选分析方法有:t检验、方差分析、相关回归分析等;②可选分析方法有:χ2检验、z检验等;③可选分析方法有:秩和检验、Ridit分析等。
6.误差:实测值与真实值之差。
可分为随机误差(随机测量误差+抽样误差)与非随机误差(系统误差与非系统误差)。
①随机误差:是一类不恒定、随机变化的误差,由多种尚无法控制的因素引起,它是不可避免的;②系统误差:是实验过程中产生的误差,它的值或恒定不变,或遵循一定的变化规律,其产生原因往往是可知的或可以掌握的,它是可以消除或控制的;③非系统误差:又称过失误差,是指在实验过程中由于研究者偶然失误而造成的误差,可以消除。
tj8[医学]医学统计学试题
![tj8[医学]医学统计学试题](https://img.taocdn.com/s3/m/5495126fe45c3b3566ec8b25.png)
医学统计学复习题一、名词解释1.总体2.样本3.随机抽样4.变异5.等级资料6.参数7.统计量8.算术均数9.中位数10.百分位数11.频数分布表12.几何均数13.方差14.标准差15.变异系数16.可信区间17.统计推断18.参数估计19.构成比20.率二、单项选择1.观察单位为研究中的()。
A.样本B.全部对象C.影响因素D.个体E.观察指标2.总体是由( )组成。
A.部分个体B.全部对象C.全部个体D.同质个体的所有观察值E.相同的观察指标3.抽样的目的是()。
A.研究样本统计量B.由样本统计量推断总体参数C.研究典型案例D.研究总体统计量E.研究特殊个体的特征4.参数是指( ) 。
A.参与个体数B.总体中研究对象的总和C.样本的统计指标D.样本的总和E.总体的统计指标5.关于随机抽样,下列哪一项说法是正确的()。
A.抽样时应使得总体中的每一个个体都有同等的机会被抽取B.研究者在抽样时应精心挑选个体,以使样本更能代表总体C.随机抽样即随机抽取个体D.为确保样本具有更好的代表性,样本量应越大越好E.选择符合研究者意愿的样本6.反映计量资料平均的指标是()。
A.频数B.参数C.百分位数D.平均数E.统计量7.表示总体均数的符号是( ) 。
A.σB.μC.XD. SE. M8.下列指标中,不属于集中趋势指标的是()。
A.均数B.中位数C.百分位数D.几何均数E.众数9. ( )分布的资料,均数等于中位数。
A.对称分布B.正偏态分布C.负偏态分布D.对数正态分布E.正态分布10.一组某病患者的潜伏期(天)分别是:2、5、4、6、9、7、10和18,其平均水平的指标该选()。
A.中位数B.算术均数C.几何均数D.平均数E.百分位数末端有确定数据11.编制频数分布时,组距通常是()。
A.极差的1/20B.极差的1/10C.极差的1/5D.极差的1/4E.极差的1/212.以下适宜描述计量资料离散趋势的指标有()。
复习资料(医学统计)

复习资料第一大题:单项选择题1、欲了解某市8岁小学生的身高情况,该市某小学二年级8岁小学生是:()∙ A. 样本∙ B. 有限总体∙ C. 无限总体∙ D. 个体2、抽样调查了某地4岁男孩的生长发育情况,得到身高均数为98.67cm,标准差为4.63cm,头围均数为46.23cm,标准差为3.16cm,欲比较两者的变异程度,下列结论正确的是:()∙ A. 身高变异程度大∙ B. 头围变异程度大∙ C. 身高和头围的变异程度相同∙ D. 由于两者的均数相差很大,无法比较两者的变异程度3、在计算方差时,若将各观察值同时减去某一常数后求得的方差:( )∙ A. 会变小∙ B. 会变大∙ C. 不变∙ D. 会出现负值4、某地2006年肝炎发病人数占当年传染病发病人数的10.1%,该指标为( )∙ A. 概率∙ B. 构成比∙C. 发病率∙D. 相对比5、两个分类变量的频数表资料作关联性分析,可用( )∙A. 积距相关或等级相关∙B. 积距相关或列联系数∙C. 列联系数或等级相关∙D. 只有等级相关6、对于服从双变量正态分布的资料,如果直线相关分析算出的值越大,则经回归分析得的相应的b 值:∙A. 越大∙B. 越小∙C. 比r小∙D. 可能较大也可能较小7、多组均数的两两比较中,若不用q检验而用t 检验,则:()∙A. 结果更合理∙B. 结果一样∙C. 会把一些无差别的总体判断为有差别∙D. 会把一些有差别的总体判断为无差别8、在比较甲、乙两种监测方法测量结果是否一直时,若采用配对设计秩和检验,甲、乙两法测量值之差中有-0.02、0.02,若差值绝对值的位次为3、4,则这两个差值的秩次分别为:()∙A. -3.5,3.5∙ B. -3.5,-3.5∙ C. 3.5,3.5∙ D. -3,49、Y=14+4X是1~7岁儿童以年龄(岁)估计体重(市斤)回归方程,若体重换成国际单位kg,则此方程:()∙ A. 截距改变∙ B. 回归系数改变∙ C. 两者都改变∙ D. 两者都不变10、某卫生局对其辖区内甲、乙两医院医疗技术人员的业务素质进行考核,在甲医院随机抽取100人,80人考核结果为优良;乙医院随机抽取150人,100人考核结果为优良。
医学统计学复习

复 习
医学统计中的基本概念
医学统计工作的内容
实验设计 整理资料
收集资料 分析资料
资料的类型
医学统计资料一般可分为计量资料 和计数资料两大类。 不同的统计资料应采用不同的统计 分析方法。
总体和样本
总体是同质的个体所构成的全体。 从总体中抽取部分个体的过程称 为抽样,所抽得的部分成为样本
通常单侧检验比双侧检验更为灵敏,更 易检验出差别,以此宜广泛采用。 错。单侧检验的使用应以专业知识为依据, 它充分利用了另一侧的不可能性,故检出 率高,但应慎用。
2 2 四个样本率作比较, 0.05( 3) 可认为
各总体率均不相等
错。应为均不相等或不全相等
选择题 对两样本作均数比较时,已知两样本例数 均小于30,总体方差不齐,且呈偏态分 布,宜用( C )。 A. t 检验 B. u 检验 C. 秩和检验 D. F 检验
配对资料的秩和检验 成组资料的秩和检验 多组资料的秩和检验
完全随机化设计资料 配伍组设计资料
非参数检验方法的优点是适应性强,但 此时由于损失了部分信息,检验效率降 低了。即在资料服从正态分布的前提下, 当H0不真时,非参数检验方法不如参数 检验方法能灵敏地拒绝H0,换句话说犯 第二类错误的可能性大于参数检验法。 因此,对于适合参数检验的资料,最好 还是用参数检验。
t检验
t检验的适用条件:总体服从正态分布, 且不知总体标准误,而用样本标准误代 替标准误进行计算 两小样本均数进行比较时,方差齐,用t 检验;方差不齐,用t’检验。
t 检验
例 根据大量调查,已知健康成年男子的 脉搏均数为72次/分。某医生在某山区随 机调查25名健康男子,求得脉搏均数为 74.2次/分,标准差为6.0次/分。能否认 为该山区的成年男子的脉搏均数高于一 般成年男子的脉搏均数?
医学统计学复习重点

医学统计学复习重点统计设计:调查设计、实验设计第一章绪论1.基本概念:总体——根据研究目的确定,所有同质观察单位某种观察值的全体。
样本——总体中抽取的一部分具有代表性的个体组成的集合。
参数-—刻画总体特征的统计指标。
一般用希腊字母表示μ、σ、π统计量—-刻画样本特征的统计指标.抽取的样本不同,统计量会变化;一般用拉丁字母或英文字母表示、S、p抽样误差:个体变异所致,抽样研究中样本信息与总体特征间的差异。
抽样误差是不可避免的。
属于随机误差,无方向性,重复抽样可以呈现一定的规律性。
小概率事件P≤0。
052.*统计工作的四个步骤:设计、收集资料、整理资料、分析资料。
(用工作实例解释)第二章调查研究设计第三章实验研究设计1.调查研究(观察性研究):特点:无人为施加处理因素调查研究的分类:按调查涉及的对象划分:全面调查(普查)、抽样调查、典型调查注意:收集的资料要有可比性*随机抽样方法(做统计推断有意义):单纯随机抽样、系统抽样、分层抽样、整群抽样非随机抽样方法(不能做统计推断,可能有偏差):偶遇抽样、判断抽样、滚雪球抽样等2.实验研究特点:与调查研究最本质的区别:根据研究目的主动施加干预措施实验设计的三个基本要素:受试对象、处理因素、实验效应实验设计的基本原则:对照原则、随机化原则、重复原则第四章定量资料的统计描述第五章定性资料的统计描述1.定量资料(1)定量资料——*频数分布表、直方图、箱式图—-判断分布类型——(2)描述离散趋势的统计指标:✓极差R=最大值—最小值、✓四分位数间距Q:常用于描述*偏态分布资料的离散趋势、一端或两端无确切值的资料、分布不明确资料✓方差(总体、样本S2)&标准差(、S):*正态或近似正态分布✓变异系数(3)(4)正态分布及其应用:**制定医学参考值范围步骤:判断分布类型-—正态分布-—*双侧95%参考值范围:±1.96S、单侧95%参考值范围:下限为—1。
64S、上限为+1。
医学统计学总复习练习题(含答案)

一、最佳选择题1.卫生统计工作的步骤为 CA.统计研究调查、搜集资料、整理资料、分析资料B.统计资料收集、整理资料、统计描述、统计推断C.统计研究设计、搜集资料、整理资料、分析资料D.统计研究调查、统计描述、统计推断、统计图表E.统计研究设计、统计描述、统计推断、统计图表2.统计分析的主要内容有 DA.统计描述和统计学检验B.区间估计与假设检验C.统计图表和统计报告D.统计描述和统计推断E.统计描述和统计图表3.统计资料的类型包括EA.频数分布资料和等级分类资料B.多项分类资料和二项分类资料C.正态分布资料和频数分布资料D.数值变量资料和等级资料E.数值变量资料和分类变量资料4.抽样误差是指 BA.不同样本指标之间的差别B.样本指标与总体指标之间由于抽样产生的差别C.样本中每个体之间的差别D.由于抽样产生的观测值之间的差别E.测量误差与过失误差的总称5.统计学中所说的总体是指 BA.任意想象的研究对象的全体B.根据研究目的确定的研究对象的全体C.根据地区划分的研究对象的全体D.根据时间划分的研究对象的全体E.根据人群划分的研究对象的全体6.描述一组偏态分布资料的变异度,宜用 DA.全距B.标准差C.变异系数D.四分位数间距E.方差7.用均数与标准差可全面描述其资料分布特点的是 CA.正偏态分布B.负偏态分布C.正态分布和近似正态分布D.对称分布E.任何分布8.比较身高和体重两组数据变异度大小宜采用 AA.变异系数B.方差C.极差D.标准差E.四分位数间距9.频数分布的两个重要特征是 CA.统计量与参数B.样本均数与总体均数C.集中趋势与离散趋势D.样本标准差与总体标准差E.样本与总体10.正态分布的特点有 BA.算术均数=几何均数B.算术均数=中位数C.几何均数=中位数D.算术均数=几何均数=中位数E.以上都没有11.正态分布曲线下右侧5%对应的分位点为 DA.μ+1.96σB.μ-1.96σC.μ+2.58σD.μ+1.64σE.μ-2.58σ12.下列哪个变量为标准正态变量 D A.s x μ- B.σμ-x C. x s x μ- D.xx σμ- E. s x μ- 13.某种人群(如成年男子)的某个生理指标(如收缩压)或生化指标(如血糖水平)的正常值范围一般指 CA.该指标在所有人中的波动范围B.该指标在所有正常人中的波动范围C.该指标在绝大部分正常人中的波动范围D.该指标在少部分正常人中的波动范围E.该指标在一个人不同时间的波动范围14.下列哪一变量服从t 分布e A. σμ-x B. σμ-x C. x x σμ- D. x s x x - E. xs x μ-15.统计推断的主要内容为 BA.统计描述与统计图表B.参数估计和假设检验C.区间估计和点估计D.统计预测与统计控制E.参数估计与统计预测16.可信区间估计的可信度是指 BA.αB.1-αC.βD.1-βE.估计误差的自由度17.下面哪一指标较小时可说明用样本均数估计总体均数的可靠性大CA.变异系数B.标准差C.标准误D.极差E.四分位数间距18.两样本比较作t 检验,差别有显著性时,P 值越小说明 CA.两样本均数差别越大B.两总体均数差别越大C.越有理由认为两总体均数不同D.越有理由认为两样本均数不同E. I 型错误越大19.两样本比较时,分别取以下检验水准,哪一个的第二类错误最小 DA.α=0.05B.α=0.01C.α=0.10D.α=0.20E.α=0.0220.当样本含量n 固定时,选择下列哪个检验水准得到的检验效能最高DA.α=0.01B.α=0.10C.α=0.05D.α=0.20E.α=0.0221.在假设检验中,P 值和α的关系为 EA. P 值越大,α值就越大B. P 值越大,α值就越小C. P 值和α值均可由研究者事先设定D. P 值和α值都不可以由研究者事先设定E. P 值的大小与 值的大小无关22.假设检验中的第二类错误是指 DA.拒绝了实际上成立的0HB.不拒绝实际上成立的0HC.拒绝了实际上成立的1HD.不拒绝实际上不成立的0HE.拒绝0H 时所犯的错误23.多组均数的两两比较中,若不用q 检验而用t 检验,则 CA. 结果更合理B. 结果会一样C. 会把一些无差别的总体判断有差别的概率加大D. 会把一些有差别的总体判断无差别的概率加大E. 以上都不对24.说明某现象发生强度的指标为 EA.构成比B.相对比C.定基比D.环比E. 率25.对计数资料进行统计描述的主要指标是 BA.平均数B.相对数C.标准差D.变异系数E.中位数26.构成比用来反映CA.某现象发生的强度B.表示两个同类指标的比C.反映某事物内部各部分占全部的比重D.表示某一现象在时间顺序的排列E.上述A 与C 都对27.下列哪一指标为相对比EA. 中位数B. 几何均数C. 均数D. 标准差E. 变异系数28.两个样本率差别的假设检验,其目的是BA.推断两个样本率有无差别B.推断两个总体率有无差别C.推断两个样本率和两个总体率有无差别D.推断两个样本率和两个总体率的差别有无统计意义E.推断两个总体分布是否相同29.用正态近似法进行总体率的区间估计时,应满足DA. n 足够大B. p 或(1-p )不太小C. np 或n(1-p)均大于5D. 以上均要求E. 以上均不要求30.由两样本率的差别推断两总体率的差别,若P 〈0.05,则DA. 两样本率相差很大B. 两总体率相差很大C. 两样本率和两总体率差别有统计意义D. 两总体率相差有统计意义E. 其中一个样本率和总体率的差别有统计意义31.假设对两个率差别的显著性检验同时用u 检验和2χ检验,则所得到的统计量u 与2χ的关系为DA. u 值较2χ值准确B. 2χ值较u 值准确C. u=2χD. u=2χE. 2χ=u32.四格表资料中的实际数与理论数分别用A 与T 表示,其基本公式与专用公式求2χ的条件为EA. A ≥5B. T ≥5C. A ≥5 且 T ≥5D. A ≥5 且n ≥40E. T ≥5 且n ≥4033.三个样本率比较得到2χ>2)2(01.0χ,可以为AA.三个总体率不同或不全相同B.三个总体率都不相同C.三个样本率都不相同D.三个样本率不同或不全相同E.三个总体率中有两个不同34.四格表2χ检验的校正公式应用条件为CA. n>40 且T>5B. n<40 且T>5C. n>40 且 1<T<5D. n<40 且1<T<5E. n>40 且T<135.下述哪项不是非参数统计的优点DA.不受总体分布的限定B.简便、易掌握C.适用于等级资料D.检验效能高于参数检验E.适用于未知分布型资料36.秩和检验和t 检验相比,其优点是AA. 计算简便,不受分布限制B.公式更为合理C.检验效能高D.抽样误差小E.第二类错误概率小37.等级资料比较宜用CA. t 检验B. u 检验C.秩和检验D. 2χ检验E. F 检验38.从文献中得到同类研究的两个率比较的四格表资料,其2χ检验结果为:甲文)1(01.02χχ>,乙文2)1(05.02χχ>,可认为CA.两文结果有矛盾B.两文结果基本一致C.甲文结果更可信D.乙文结果更可信E.甲文说明总体间的差别更大39.拟以图示某市1990~1994年三种传染病发病率随时间的变化,宜采用AA.普通线图B.直方图C.统计地图D.半对数线图E.圆形图40.调查某地高血压患者情况,以舒张压≥90mmHg为高血压,结果在1000人中有10名高血压患者,99名非高血压患者,整理后的资料是:BA.计量资料B.计数资料C.多项分类资料D.等级资料E.既是计量资料又是分类资料41. 某医师检测了60例链球菌咽炎患者的潜伏期,结果如下。
医学统计学总复习(刘桂芬主编-研究生使用) (1)

b. t 检验 c. 用 r 检验来代替。 ④ 作结论:如 P≤0.05, 说明方程成立,列出回归方程;如 P>0.05, 说明方程不成立,不列回归方程。 5. 直线相关的概念 6. 直线相关的主要用途:用于分析两变量是否有相关关系及其方 向
观察人数
期内死亡人数
- 14 -
x~
nx
Dx
0~
25
10
1~
22
20
2~
10
9
3~
11
7
4~
10
1
5~
8
4
6~
4
0
7~
4
1
8~
3
0
9~
3
0
10~
2
0
11~
1
0
第三部分 期末成绩评定
一、成绩评定方法 总评(100%)=平时作业 10%+基础理论知识考试(笔试)60%+操作 技能考试(上机)30% 二、考试题型 (一)基础理论知识考试(笔试)(考试时间:100 分钟) 1、最佳选择题(单选)(30%,30 小题,每题 1 分) 2、辨析题(30%,10 小题,每题 3 分) 3、简答题(10%,2 小题,每题 5 分) 4、分析应用题(30%,5-6 题)
第十六章 生存分析
1.生存资料的特点 2.生存分析的几个基本概念(生存时间、死亡概率与生存概率、生存 率、中位生存期) 3.生存分析的用途 4.生存率计算方法:(1)K-M 法:例数少,且为未分组;(2)寿命表 法:例数多,且为频数表资料(注意:生存概率与生存率的结果) 5.生存率曲线比较:(1)log-rank test:两组或多组;(2)Gehan Score test:两组 6.Cox 模型(不要求) 第二十二章 医学论文统计结果报告
(完整版)医学统计学复习要点

(完整版)医学统计学复习要点第⼀章绪论1、数据/资料的分类:①、计量资料,⼜称定量资料或者数值变量;为观测每个观察单位某项治疗的⼤⼩⽽获得的资料。
②、计数资料,⼜称定性资料或者⽆序分类变量;为将观察单位按照某种属性或者类别分组计数,分组汇总各组观察单位数后⽽得到的资料。
③、等级资料,⼜称半定量资料或者有序分类变量。
为将观察单位按某种属性的不同程度分成等级后分组计数,分类汇总各组观察单位数后⽽得到的资料。
2、统计学常⽤基本概念:①、统计学(statistics)是关于数据的科学与艺术,包括设计、搜集、整理、分析和表达等步骤,从数据中提炼新的有科学价值的信息。
②、总体(population)指的是根据研究⽬的⽽确定的同质观察单位的全体。
③、医学统计学(medical statistics):⽤统计学的原理和⽅法处理医学资料中的同质性和变异性的科学和艺术,通过⼀定数量的观察、对⽐、分析,揭⽰那些困惑费解的医学问题背后的规律性。
④、样本(sample):指的是从总体中随机抽取的部分观察单位。
⑤、变量(variable):对观察单位某项特征进⾏测量或者观察,这种特征称为变量。
⑥、频率(frequency):指的是样本的实际发⽣率。
⑦、概率(probability):指的是随机事件发⽣的可能性⼤⼩。
⽤⼤写的P表⽰。
3、统计⼯作的基本步骤:①、统计设计:包括对资料的收集、整理和分析全过程的设想与安排;②、收集资料:采取措施取得准确可靠的原始数据;③、整理资料:将原始数据净化、系统化和条理化;④、分析资料:包括统计描述和统计推断两个⽅⾯。
第⼆章计量资料的统计描述1. 频数表的编制⽅法,频数分布的类型及频数表的⽤途①、求极差(range):也称全距,即最⼤值和最⼩值之差,记作R;②、确定组段数和组距,组段数通常取10-15组;③、根据组距写出组段,每个组段的下限为L,上限为U,变量X值得归组统⼀定为L≤X<U,最后⼀组包括下限。
医学统计学复习题

一、最正确选择题1.抽样研究是一种科学高效的方法,目的是研究〔B 〕• A.样本 B.总体• C.抽样误差 D.概率2.由样本推断总体,样本应该是〔D 〕• A.总体中的典型局部• B.总体中有意义的局部• C.总体中有价值的局部• D.总体中有代表性的局部3.统计上所说的系统误差、过失误差、测量误差和抽样误差四种误差,在实际工作中〔C 〕• A.四种误差都不可防止• B.过失误差和测量误差不可防止• C.测量误差和抽样误差不可防止• D.系统误差和抽样误差不可防止4.统计描述是指〔C 〕• A.比拟指标的差异有无显著性• B.估计参数• C.用统计指标描述事物的特征• D.判断无效假设是否成立5.统计推断是指〔D 〕• A.从总体推断样本特征• B.从总体推断总体特征• C.从样本推断样本特征• D.从样本推断总体特征6.对某样品进行测量时,由于仪器事先未校正,造成测量结果普遍偏高,这种误差属于〔A 〕• A.系统误差 B.随机测量误差• C.抽样误差 D.过失误差7.随机抽样的目的是〔D 〕• A.能消除系统误差• B.能消除测量误差• C.能消除抽样误差• D.能减小样本偏性8.对某地200名16岁中学生口腔检查,发现患龋齿的人数为54人,该资料属于〔B 〕• A.计量资料 B.计数资料• C.等级资料 D.三个都不是9.计量资料是〔C 〕• A.用仪器测量出来的资料• B.按观察单位的类别,清点各类观察单位数的资料• C.用定量方法测定观察单位某个变量的大小的资料• D.按观察单位的等级,清点各等级观察单位数的资料10.计数资料是〔B 〕• A.用仪器测量出来的资料• B.按观察单位的类别,清点各类观察单位数的资料• C.用定量方法测定观察单位某个变量的大小的资料• D.按观察单位的等级,清点各等级观察单位数的资料11.等级资料是〔D 〕• A.用仪器测量出来的资料• B.按观察单位的类别,清点各类观察单位数的资料• C.用定量方法测定观察单位某个变量的大小的资料• D.按观察单位的等级,清点各等级观察单位数的资料12.以下哪种不属于计量资料〔C 〕• A.红细胞数 B.血钙浓度• C.阳性人数 D.脉搏13.以下哪种属于等级资料〔A 〕• A.治疗痊愈、有效、无效人数• B.各血型人数• C.白细胞分类百分比• D.贫血和不贫血人数二、判断题• 1.统计工作的主要内容是对资料进行统计分析。
医学统计学_总结_重点_笔记_复习资料

第一章2选1总体:总体(population)是根据研究目的确定的同质观察单位(研究对象)的全体,实际上是某一变量值的集合。
可分为有限总体和无限总体。
总体中的所有单位都能够标识者为有限总体,反之为无限总体。
总体population根据研究目的而确定的同质观察单位的全体。
样本:从总体中随机抽取部分观察单位,其测量结果的集合称为样本(sample)。
样本应具有代表性。
所谓有代表性的样本,是指用随机抽样方法获得的样本。
样本sample从总体中随机抽得的部分观察单位,其实测值的集合。
3选1小概率事件:我们把概率很接近于0(即在大量重复试验中出现的频率非常低)的事件称为小概率事件。
P值:P 值即概率,反映某一事件发生的可能性大小。
统计学根据显著性检验方法所得到的P 值反应结果真实程度,一般以P ≤ 0.05 认为有统计学意义, P ≤0.01 认为有高度统计学意义,其含义是样本间的差异由抽样误差所致的概率等于或小于0.05 或0.01。
P值是:1) 一种概率,一种在原假设为真的前提下出现观察样本以及更极端情况的概率。
2) 拒绝原假设的最小显著性水平。
3) 观察到的(实例的) 显著性水平。
4) 表示对原假设的支持程度,是用于确定是否应该拒绝原假设的另一种方法。
小概率原理:一个事件如果发生的概率很小的话,那么可认为它在一次实际实验中是不会发生的,数学上称之小概率原理,也称为小概率的实际不可能性原理。
统计学中,一般认为等于或小于0.05或0.01的概率为小概率。
资料的类型(3选1)(1)计量资料:对每个观察单位用定量的方法测定某项指标量的大小,所得的资料称为计量资料(measurement data)。
计量资料亦称定量资料、测量资料。
.其变量值是定量的,表现为数值大小,一般有度量衡单位。
如某一患者的身高(cm)、体重(kg)、红细胞计数(1012/L)、脉搏(次/分)、血压(KPa)等。
计量资料measurement data定量资料quantitative data数值变量资料numerical variable为观测每个观察单位某项指标的大小,而获得的资料。
大学医学院医学统计学复习总结(首版)

⼤学医学院医学统计学复习总结(⾸版)1.要反映某市连续5年甲肝发病率的变化情况,宜选⽤A.直条图 B.直⽅图C.线图 D.百分直条图2.下列哪种统计图纵坐标必须从0开始,A. 普通线图B.散点图C.百分分直条图D.直条图3.关于统计表的列表要求,下列哪项是错误的?A.横标⽬是研究对象,列在表的右侧;纵标⽬是分析指标,列在表的左侧B.线条主要有顶线、底线及纵标⽬下⾯的横线,不宜有斜线和竖线C.数字右对齐,同⼀指标⼩数位数⼀致,表内不宜有空格D.备注⽤“*”标出,写在表的下⾯4.医学统计⼯作的基本步骤是A.统计资料收集、整理资料、统计描述、统计推断B.调查、搜集资料、整理资料、分折资料C.设计、搜集资料、整理资料、分析资料D.设计、统计描述、统计推断、统计图表5.统计分析的主要内容有A.描述性统计和统计学检验B.统计描述和统计推断C.统计图表和统计报告D.描述性统计和分析性统计6制作统计图时要求A.纵横两轴应有标⽬。
⼀般不注明单位B.纵轴尺度必须从0开始C.标题应注明图的主要内容,⼀般应写在图的上⽅D.在制作直条图和线图时,纵横两轴长度的⽐例⼀般取5:77.痊愈、显效、好转、⽆效属于A. 计数资料B. 计量资料C. 等级资料D.以上均不是8.均数和标准差的关系是A.x愈⼤,s愈⼤B.x愈⼤,s愈⼩C.s愈⼤,x对各变量值的代表性愈好D.s愈⼩,x对各变量值的代表性愈好9.对于均数为µ,标准差为σ的正态分布,95%的变量值分布范围为A. µ-σ ~ µ+σB. µ-1.96σ ~ µ+1.96σC. µ-2.58σ ~ µ+2.58σD. 0 ~ µ+1.96σ10.从⼀个数值变量资料的总体中抽样,产⽣抽样误差的原因是A.总体中的个体值存在差别B.样本中的个体值存在差别C.总体均数不等于0D.样本均数不等于011.从偏态总体抽样,当n⾜够⼤时(⽐如n > 60),样本均数的分布。
医学统计学复习题(名词解释和简答)

一、名词解释:1、总体:根据研究目的确定的同质观察单位的全体。
是同质所有观察单位的某种变量值的集合。
2、有限总体:是指空间、时间范围限制的总体。
3、无限总体:是指没有空间、时间限制的总体。
4、样本:从总体中随机抽取部分观察单位,其实测值的集合。
5、@计量资料:又称定量资料或数值变量资料。
为观测每个观察单位的某项指标的大小,而获得的资料。
其变量值是定量的,表现为数值大小,一般有度量衡单位。
根据其观测值取值是否连续,又可分为连续型或离散型两类。
6、计数资料:又称定性资料或者无序分类变量资料,亦称名义变量资料,是将观察单位按照某种属性或类别分组计数,分组汇总各组观察单位数后得到的资料。
其变量值是定性的,表现为互不相容的性或类别。
分两种情形:(1)二分类:两类间相互对立,互不相容。
(2)多分类:各类间互不相容。
7、等级资料:又称半定量资料或有序分类变量资料,是将观察单位按某种属性的不同程度分成等级后分组计数,分类汇总各组观察单位数后而得到的资料。
其变量值具有半定量性质,表现为等级大小或属性程度。
8、随机误差(偶然误差):是一类不恒定的、随机变化的误差,由多种尚无法控制的因素引起,观察值不按方向性和系统性变化,在大量重复测量中,它可呈现或大或小,或正或负的规律性变化。
9、平均数:描述一组变量值的集中位置或水平。
常用的平均数有算术平均数、几何平均数和中位数。
10、抽样误差:由于个体差异和随机抽样造成的样本统计量和总体参数之间的差异,以及统一总体若干样本统计量之间的差异。
11、I型错误:拒绝了实际上成立的H0,这类“弃真”错误称为I 型错误。
检验水平,就是预先规定的允许犯I型错误概率的最大值。
I型错误概率大小也用α表示,α可取单尾亦可取双尾。
12、II型错误:“接受”了实际上不成立的H0,这类“取伪”的错误称为II型错误。
其概率大小用β表示,β只取单尾,β值的大小一般未知,,须在知道两总体差值δ、α及n时,才能算出。
医学统计学复习(练习及答案)

第36题:使用相对数时容易犯的错误是。
A.把构成比作为相对比
B.把构成比作为率
C.把率作为相对比
D.把率作为构成比
E.把相对比作为构成比
第37题:描述一组偏态分布资料的变异度,宜用。
A.全距
B.标准差
C.变异系数
D.四分位数间距
E.方差
第38题:当统计分析结果是差别无显着性,但所求得的检验统计量在界值附近时,下结论应慎重,是因为。
A.差值的总体均数为0
B.差值的总体中位数为0
C. μd≠0
D. Md≠0
E. μ1≠μ2
第23题:样本率的标准误sp的特点有。
A.n越大,则sp越大
B.p越大,则sp越大
C.1-p越大,则sp越大
D.np越大,则sp越大
E.n越大,则sp越小
第24题:统计地图可用于表示。
A.某现象内部构成
B.某现象地理分布
A. ∑(X-X)2
B. ∑(Y-Y)2
C. ∑XY-(∑X)( ∑Y)/n
D. ∑Y2-(∑Y)2/n
E. ∑(X-X)2/n
第32题:t分布与正态分布存在如下哪一种关系。
A.二者均以0为中心,左右对称
B.曲线下中间95%面积对应的分位点均为±1.96
C.当样本含量无限大时,二都分布一致
D.当样本含量无限大时,t分布与标准正态分布一致
C.用该市5岁男孩身高的均数来评价
D.用该市5岁男孩身高的1-α可信区间来评价
E.用该市5岁男孩身高的全距来评价
第44题:同一双变量资料,进行直线相关与回归分析,有。
A. r>0时,b<0
B. r>0时,b>0
医学统计学复习题

预防医学复习题统计部分复习重点及简答题1. 医学统计学的基本概念如:总体与样本的联系区别2. 资料的分类如:请列举资料的类型并举例说明3. 定量资料统计描述的指标集中与离散趋势如:定量统计描述指标有哪些如:正态分布与偏态分布资料统计描述方法有何区别4. 定性资料统计描述的指标5. 正态分布、标准正态分布、t分布的概念、特征、曲线下面积规律如:正态分布、标准正态分布与t分布的区别联系6. 小概率事件在医学统计学的应用P值的含义如:P值的含义是什么,对统计结论有何意义7. 假设检验的基本原理与步骤8. 四种主要统计假设检验方法及其应用场合9. 统计表的绘制选择题1.样本是总体中:2.A、任意一部分B、典型部分C、有意义的部分D、有代表性的部分E、有价值的部分2、参数是指:A、参与个体数B、研究个体数C、总体的统计指标D、样本的总和E、样本的统计指标3、抽样的目的是:A、研究样本统计量B、研究总体统计量C、研究典型案例D、研究误差E、样本推断总体参数4、脉搏数次/分是:A、观察单位B、数值变量C、名义变量D.等级变量E.研究个体5、疗效是:A、观察单位B、数值变量C、名义变量D、等级变量E、研究个体6、统计学常将P≤或P≤的事件称A、必然事件B、不可能事件C、随机事件D、小概率事件E、偶然事件7.统计中所说的总体是指:A根据研究目的确定的同质的研究对象的全体B随意想象的研究对象的全体C根据地区划分的研究对象的全体D根据时间划分的研究对象的全体E根据人群划分的研究对象的全体8.概率P=0,则表示A某事件必然发生B某事件必然不发生C某事件发生的可能性很小D某事件发生的可能性很大E以上均不对9.总体应该由A.研究对象组成B.研究变量组成C.研究目的而定D.同质个体组成E.个体组成10. 在统计学中,参数的含义是A.变量B.参与研究的数目C.研究样本的统计指标D.总体的统计指标E.与统计研究有关的变量11.调查某单位科研人员论文发表的情况,统计每人每年的论文发表数应属于A.计数资料B.计量资料C.总体D.个体E.样本12.统计学中的小概率事件,下面说法正确的是:A.反复多次观察,绝对不发生的事件B.在一次观察中,可以认为不会发生的事件C.发生概率小于的事件D.发生概率小于的事件E.发生概率小于的事件13、统计上所说的样本是指:A、按照研究者要求抽取总体中有意义的部分B、随意抽取总体中任意部分C、有意识的抽取总体中有典型部分D、按照随机原则抽取总体中有代表性部分E、总体中的每一个个体14、以舒张压≥为高血压,测量1000人,结果有990名非高血压患者,有10名高血压患者,该资料属资料;A、计算B、计数C、计量D、等级E、都对15、红细胞数是:A、观察单位B、数值变量C、名义变量D、等级变量E、研究个体16、某次研究进行随机抽样,测量得到该市120名健康成年男子的血红蛋白数,则本次研究总体为:A.所有成年男子B.该市所有成年男子C.该市所有健康成年男子D.120名该市成年男子E.120名该市健康成年男子17、某地区抽样调查1000名成年人的血压值,此资料属于:A、集中型资料B、数值变量资料C、无序分类资料D、有序分类资料E、离散型资料18、抽样调查的目的是:A、研究样本统计量B、研究总体统计量C、研究典型案例D、研究误差E、样本推断总体参数19、测量身高、体重等指标的原始资料叫:A计数资料B计量资料C等级资料D分类资料E有序分类资料20、某种新疗法治疗某病患者41人,治疗结果如下:治疗结果治愈显效好转恶化死亡治疗数823631该资料的类型是:A计数资料B计量资料C无序分类资料D有序分类资料E数值变量资料21、样本是总体的A有价值的部分B有意义的部分C有代表性的部分D任意一部分E典型部分22.以下指标中____可用来描述计量资料离散程度;A.算术平均数B.几何均数C.中位数D.标准差E.第50百分位数23.偏态分布资料宜用___描述其分布的集中趋势;A.算术平均数B.标准差C.中位数D.四分位数间距E.方差24.用均数和标准差可全面描述___资料的分布特征;A.正态分布B.正偏态分布C.负偏态分布D.对称分布E.任何计量资料分布可用于比较身高与体重的变异度A.方差B.标准差C.变异系数D.全距E.四分位数间距26.描述一组偏态分布资料的变异度,以_____指标较好.A. 全距RB. 标准差sC. 变异系数CVD. 四分位数间距Qu-QL27.对于均数μ﹑标准差为σ的正态分布,95%的变量值分布范围为A.μ-σ~μ+σB.μσ~μ+σ~μ+σ∞~μ+σE.μσ~μ+σ28.若u服从均数为0,标准差为1的正态分布,则≥的P= ≥的P=的P= ≥的P=E. u≥的P=双侧29.正态分布有两个参数μ与σ,______曲线的形状越扁平;A. μ越大B. μ越小C. σ越大D. σ越小E. μ与σ越接近030.正态分布是以A.标准差为中心的频数分布值为中心的频数分布C.组距为中心的频数分布D.均数为中心的频数分布E.观察例数为中心的频数分布DCEBD DABDD ABDBB C17 18 BD CDCAC DBACD三、综合案例题每题2分,共20分1. 现有若干名高危人群体检部分指标,见下表表1 某年某地某人群健康检查部分检测结果编号性别年龄身高坐高血型乙肝表面抗原便血肠癌1 男47 A + ++ 有2 女28 AB - - 无3 女42 O - + 有4 男39 A - - 无5 男69 A - - 无. . . . . . . .1.上述变量中,下列哪个指标不是计量资料_ ______计量、定量、数值变量一个意思A.年龄B.性别C. 肠癌D. 身高2. 上述变量中,下列哪个指标不是计数资料__ _____这里的计数指的是无序分类变量资料A.性别B. 便血C.血型D. 肠癌3. 上述变量中,下列哪个指标是等级资料_ _____等级资料是有序分类变量资料A. 便血B.血型C. 年龄D. 性别4. 如果年龄是正态分布的资料,在进行统计描述时宜计算哪两个指标___ __A. 均数B. 标准差C. 四分卫数间距D. 变异系数E. 率F. 构成比5. 采用什么指标来比较身高和坐高的变异程度____ ___A. 均数B. 标准差C. 四分卫数间距D. 变异系数6. 描述人群的肠癌指标宜计算___ ___A. 均数B.比例C. 率D. 构成比7. 描述人群的血型分布,宜计算____ __A. 均数B.比例C. 率D. 构成比8. 要分析乙肝抗原阳性与阴性者肠癌发病率是否不同,宜选用的统计方法为____ __A. t检验B.方差分析F检验C. 卡方检验D. 秩和检验9. 要分析不同性别的病情程度便血是否不同,宜选用的统计方法为____ __A. t检验B.方差分析F检验C. 卡方检验D. 秩和检验10. 要分析不同血型的人群身高是否不同,宜选用的统计方法为____ ___A. t检验B.方差分析F检验C. 卡方检验D. 秩和检验B B A AB DCD C D B分析题1. 某防疫站1972年开始在城关建立“预防接种卡”使计划免疫得到加强;为说明效果,1975年的5月观察了482人的锡克试验反应,其中:幼儿园儿童101人,阳性21人,小学生145人,阳性22人;中学生236人,阳性15人;相比起来,1974年为:幼儿园儿童144人,阳性37人,小学生1417人,阳性323人;中学生259人,阳性41人;试用适当的统计表描述上述结果,并作简要分析2. 某医院对麦芽根糖浆治疗急慢性肝炎161例的疗效列表9-1,试作改进;3.某医师用甲、乙两药治疗某病,结果如下表,问甲、乙两药疗效有无差别表6-1 甲、乙两药疗效比较药物例数治愈数治愈率%甲40 29乙73 691若要比较甲药乙药的疗效差异,应采用何种统计分析方法2若P>,请下结论4.试检验表三组人的血浆总皮质醇测定值有无差别表7-7:三组人的血浆总皮质醇测定值正常人单纯性肥胖皮质醇增多症测定值测定值测定值1三组资料正态分布,请问采用何种统计描述指标进行描述2三组资料非正态分布,请问采用何种指标进行统计描述3三组资料正态分布,与比较差异,应采用何种统计分析方法4三组资料非正态分布,与比较差异,应采用何种统计分析方法5若统计结果P<,请下结论;一、简答题共2题,每题5分,共10分1. 应用两样本t检验时,对资料有什么要求2. 以卡方检验为例,请写出假设检验基本步骤二、选择填空题每题2分,共20分1. 现有若干名高危人群体检部分指标,见下表表1 某年某地某人群健康检查部分检测结果编号性别年龄身高坐高血型乙肝表面抗原便血肠癌1 男47 A + ++ 有2 女28 AB - - 无3 女42 O - + 有4 男39 A - - 无5 男69 A - - 无. . . . . . . .1. 上述变量中,下列哪个指标不是计量资料_______A.年龄B.性别C. 肠癌D. 身高2. 上述变量中,下列哪个指标不是计数资料_______A.性别B. 便血C.血型D. 肠癌3. 上述变量中,下列哪个指标是等级资料_______A. 便血B.血型C. 年龄D. 性别4. 如果年龄是正态分布的资料,在进行统计描述时宜计算哪两个指标______A. 均数B. 标准差C. 四分卫数间距D. 变异系数E. 率F. 构成比5. 采用什么指标来比较身高和坐高的变异程度_______A. 均数B. 标准差C. 四分卫数间距D. 变异系数6. 描述人群的肠癌指标宜计算______A. 均数B.比例C. 率D. 构成比7. 描述人群的血型分布,宜计算______A. 均数B.比例C. 率D. 构成比8. 要分析乙肝抗原阳性与阴性者肠癌发病率是否不同,宜选用的统计方法为______A. t检验B.方差分析F检验C. 卡方检验D. 秩和检验9. 要分析不同性别的病情程度便血是否不同,宜选用的统计方法为_______A. t检验B.方差分析F检验C. 卡方检验D. 秩和检验10. 要分析不同血型的人群身高是否不同,宜选用的统计方法为_______A. t检验B.方差分析F检验C. 卡方检验D. 秩和检验三.论述题本大题共2题,每题10分,共20分1.某个班级共有男性18名,女性19名,分别测量男性和女性的每分钟脉搏跳动次数;结果如下:某研究者采用配对t检验方法比较男性和女性脉搏跳动次数总体均数有无统计学差异发现P<,则可以认为男女脉搏跳动次数总体均数存在着差异;请问这种方法是否正确,为什么正确的方法是2.应用中医和传统西医疗法治疗系统性红斑狼疮,疗效如下表3,要比较两种药物的疗效的差异,采用何种检验方法有学者采用了卡方分析方法,结果发现,χ2=, P<,认为两种方法在疗效上的差异有统计学意义;请问这种方法是否正确,为什么正确的方法是表3 两种方法治疗系统性红斑狼疮分组治愈显效好转无效合计中医2241141188西医2037161588合计42783026176四、综合分析题1. 为了解某中药降血糖的疗效,某研究者选取34位糖尿病病人作为研究对象,将34位糖尿病患者随机分为两组,一组安慰剂组,一组为中药组,在治疗后对每一位研究对象的空腹血糖进行测量;请问:(1)学者在对两组资料的正态性检验发现,两组资料正态性检验结果P<;请问,上述两组资料血糖总体水平的比较,应采用何种统计分析方法;5分(2)通过SPSS统计分析,研究获得了以下统计结果,请下结论;5分3 请写出本题SPSS统计分析操作过程;8分2. 某学者研究中西医结合治疗和单纯西医治疗方案治疗肺炎病人,在89名患者身上进行实验,比较两种方案的有效率,得到资料如下表5;表5 两组肺炎病人治疗结果治疗方案例数无效有效中西医结合46 6 西医18 81请分别对中西医结合与西医治疗肺炎病人的疗效进行统计描述6分2若通过SPSS 统计软件得到以下结果,请选择正确的统计方法并下结论;6分3请写出SPSS统计分析操作过程8分3.开展中医、中西医、西医治疗前列腺炎的比较研究,将42只雄性大鼠随机等分成三组,分别为中医、中西医结合组和西医组组,测得各个体的HTT指标,HTT数据下表和统计分析结果如下:请问:1 本题应采用哪些统计分析方法6分2请根据两张分析结果表,分别报告统计结果6分医学统计学案例与分析题1. 某市20岁男学生160人的脉搏次/分钟,经正态性检验服从正态分布;求得样本均数为,样本标准差为;试估计:A、脉搏数的95%参考值范围;B、脉搏总体均数95%的可信区间;6. 应用中医和传统西医疗法治疗COPD,疗效如下表3,要比较两种药物的疗效的差异,采用何种检验方法有学者采用了卡方分析方法,结果发现,χ2=, P<,认为两种方法在疗效上的差异有统计学意义;请问这种方法是否正确,为什么正确的方法是秩和检验表3 两种方法治疗COPD分组治愈显效好转无效合计中医2241141188西医2037161588合计427830261768. 现有100名糖尿病病人健康检查一览表的部分检测指标,见下表;20分表3某年某地100名糖尿病病人检查部分检测结果性别 年龄周岁 身高cm 坐高cm 血型 乙肝抗原尿蛋白血糖 男 27 A 阴性 ++女 48 AB 阳性 - 女 60 O 阴性 + 男 91 A 阳性 - . . . . . . .请回答:① 上述变量中,定量资料的指标有_身高 坐高 年龄 血糖 ② 无序分类资料的指标有_性别 血型 乙肝抗原 ③ 有序分类资料的指标有_____________________④ 如果年龄是正态分布的资料,在进行统计描述时宜计算哪两个指标 均数 标准差⑤ 如果年龄是偏态分布的资料,在进行统计描述时宜计算哪两个指标 中位数、四分位数间距⑥ 采用什么指标来比较身高和坐高的变异程度 __变异系数_____________ ⑦ 描述人群的血型指标宜计算 ______构成比_______________⑧ 要分析男性和女性的血糖值是否不同,宜选用的统计方法为_______t 检验______________⑨ 要分析不同性别血型是否不同,宜选用的统计方法为_____卡方检验______ ⑩ 若进行男性和女性的乙肝抗原阳性率比较时,计算出检验统计量0.42=χ,则统计学结论为__________p<, 男女阳性率有差异9. 为了研究“果糖二磷酸钠”治疗新生儿缺血性脑病的疗效,某课题将患者随机分为观察组和对照组,观察组用“果糖二磷酸钠”,对照组用“胞二磷胆碱”;治疗效果分为无效、有效和显效三个等级,见下表;原作者进行一般t 检验,t =>,P <,认为两组疗效之间的差异有显著性意义;你认为这样的分析是否正确 如果不正确的话,应该采用什么方法进行分析 请计算正确方法的统计量F 值、卡方值或各组总秩和并写出计算过程不需要进行统计推断;10分;秩和检验组别 例 数例疗效: 显效 有效 无效 观察组 58 44 18 对照组564335。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
﹡应 用
变量值分布一端或两端无确定数值
分布不明资料
﹡计算方法
直接用变量值计算
M = X n+1 (n为奇数时)
2
1
或 M= 2
X n + X n+1 (n为偶数时)
2
2
用频数表计算
in M = L + ( — ∑fL )
fx 2
附:百分位数 ( Percentile,Px ) 描述变量值序列在某百分位位置的水平,
标)。观察指标的测定结果则 称变量值。
变 异: 同质个体间测定结果的差异。
二、总体和样本
总 体 (population):
根据研究目的而确定的同质的观察单位 某项指标测定值的集合。
有限总体
总体
无限总体
样 本 (sample):
从总体中随机抽取部分观察单位组成 为使样本对总体具有代表性要求:
﹡抽样必须遵循随机的原则 ﹡保证足够的样本含量
多个百分位数结合可更全面地描述变量值的 分布特征。
i Px = L + fx (n ·x% — ∑fL )
三、离散趋势 (fendency of dispersion)
抽样误差产生的原因:
1、个体之间存在变异; 2、样本是总体中的一部分。
六、 概率 (probability)
•是描述随机事件发生可能性大小的数 值,用P表示。
0≤ P≤1 ﹡ 必然事件的概率为1(100%) ﹡ 不可能发生事件的概率为0 ﹡ 随机事件的概率在0~1之间
统计学基本概念
变量
误差
同质 总体 测量
参数估计
假设检验
统计资料的类型
—— 计量资料 (数值变量)
观察单位某项指标测定值的集合。 亦称变量值,是定量的指标,一般有单 位。
—— 计数资料 (无序分类变量)
按性质和类别进行分组所得的资料。其 变量值是定性的,可分二项分类和多项分类。
—— 等级资料 (有序分类变量)
按某项指标的不同程度进行分组的资料。 各组之间有量的差别亦为半定量的资料。
﹡应 用
对称分布资料,尤其是正态分布资料
﹡计算方法 直接法χ=
χ1+ χ2+……+ χn n
∑χ =n
加权法χ=
f 1 χ1+f 2 χ2+……+f kχk =
∑f χ
f 1 +f 2+……+f k
n
常用平均数:
—— 几何均数 (geometric mean)
﹡表示符号 (G) ﹡应 用 变量值呈倍数关系,对数正态分布资料
根据分析的需要各类资料可以互相转化。
三类数据间的关系
例:一组2040岁成年人的血压
<8 低血压
等 8 正常血压
定量数据
级 数 据
12 15
轻度高血压 中度高血压
定性数据
17 重度高血压
以12kPa为界分为正常与异常两组,统计每组例
数
医学统计学的几个基本概念 一、 变量与变异
变 量: 被观察单位的特征(即观察指
﹡计算方法 直接法 G = n √ x1 ·x2 … xn
加权法
G = lg–1 lgx1+lgx2+…+lgxn = lg–1 ∑ lgx
n
n
G = lg–1 f1lgx1+f2lgx2+…+fklgxk = lg–1 ∑f lgx
n
n
常用平均数
—— 中位数 (median)
﹡表示符号
(M)
偏态分布资料
16
228
95.8
2.7~
6
234
98.3
3.1~
1
235
98.7
3.5~
0
235
98.7
3.9~4.3
3
238
100.0
负偏态分布
某地某年恶性肿瘤死亡率的年龄分布
年龄组 0~ 10~ 20~ 30~ 40~ 50~ 60~ 70~
恶性肿瘤死亡率(1/10万) 0.5 12 15 76
189 234 386 286
三、 抽样
从总体中抽样必须遵循科学原则 样本应具有: 代表性、随机性、可靠性、可比性
常用随机抽样方法:
机械抽样、分层抽样、随机数字表
四、 设计类型
完全随机设计:(两组或多组比较) 配对设计:(同源或异源两两配对) 随机区组设计:(两个以上受试对象组成一
个配伍组)
五、 误差 (error)
系统误差、随机测量误差、抽样误差 (smapling error):指样本统计量与总体参数 之差,由抽样所造成,是不可避免的,但可 以控制。
参数: 变异 ,,
概率
•P(A | B) = P(A and B) P(B)
样本
统计量:
x, s, p
频率
一、计量资料的统计描述
——编制频数表
—— 频数分布的特征
﹡集中趋势
变量值集中分布的位 置
﹡离散趋势
变量值围绕集中位置 的分布情况
—— 频数分布的类型
﹡对称分布
某地区130名正常成年男子红细胞数(1012/L)的频数分布
红细胞数
划记
频数
(1)
(2)
(3)
3.70~
||
2
3.90~ 4.10~ 4.30~ 4.50~ 4.70~ 4.90~ 5.10~ 5.30~
||||
4
正||||
9
正正正 |
16
正正正正 | |
22
正正正正正
25
正正正正 |
21
正正正 | |
17
正||||
9
5.50~
||||
4
5.70~5.90
|
审核 合理分组
统计描述 统计推断
统计工作的步骤
—— 设计
医学科研设计
调查设计
临床实验设计
—— 搜集资料
统计报表
统计资料
医疗卫生工作记录 (经常性工作记录)
专题调查或实验 (一时性工作记录)
—— 整理资料
整理资料
核对检查原始数据 分组汇总资料
—— 分析资料
统计分析
统计描述 统计推断
统计指标、统计 图、表
1
合计
——
130
﹡偏态分布
正偏态分布
238名正常人发汞值(μg/g) 的中位数和百分位数的频数表计算
发汞值
频数
累计频数
累计频率(%)
(1)
(2)
(3)
(4)=(3)/238
0.3~
20
20
8.4
0.7~
66
866
61.3
1.5~
48
194
81.5
1.9~
18
212
89.1
2.3~
总复习
医学统计学是统计学的一门分支学科, 它应用概率论和数理统计的原理和方 法,研究医学领域数据资料的收集, 整理分析和推断。它是进行医学科学 研究所必需的主要手段。
医学统计学的主要内容有:
﹡统计描述
﹡参数估计 ﹡假设检验 ﹡医学科研设计
统计学基本步骤
设计
资料搜集
整理
分析
调查设计 实验设计
资料来源 质量控制
二、集中趋势(Central tendency) 的描述
平均数(average)常用于描述一组变量值 的集中趋势,是反映同质资料的平均水平或 集中位置的特征值。
常用平均数
均数 ( X ) 几何均数(G)
中位数(M)
常用平均数:
—— 均数 (算术均数) (mean)
﹡表示符号
总体均数 (μ)
样本均数 (χ)