医学统计学复习资料
医学统计学总复习--资料
平均数与变异度
均数±标准差(min,max)
中位数±四分位数间距 (min,max) 几何均数± 对数标准差 变异度小,则均数代表性好! 变异度大,数据分散,则均数代表性差! 平均数所表示的集中性与变异度所表示的离散性,从两个 不同的角度阐明计量资料的特征!
1. 某医学资料数据大的一端没有确定数值,描述其集中趋势适用 的统计指标是() A. 中位数 B. 几何均数 C. 均数 D. 频数分布 2. 算术均数与中位数相比,其特点是() A.不易受极端值的影响 B.能充分利用数据的信息 C.抽样误差较大 D.更适用于偏态分布资料 3. 一组原始数据呈正偏态分布,其数据的特点是 A. 数值离散度较小 B. 数值离散度较大 C. 数值分布偏向较大一侧 D. 数值分布偏向较小一侧
男
女 女 男 女
1.71
1.58 1.60 1.76 1.62
A
B O AB O
异常
正常 异常 正常 正常
++
++ ++ +++ +
工人
工人 干部 干部 军人
3.49
5.48 6.78 7.10 5.24
研究设计的常见类型
完全随机设计:将实验对象完全随机地分配 到实验组与对照组或几个对比组中或从几个 不同总体中随机抽样 配对设计:
参考值范围(reference interval)
参考值范围又称正常值范围(normal range)。
什么是参考值范围:
是绝大多数正常人的某观察指标所在的范围。
绝大多数:90%,95%,99%等等。
确定参考值范围的意义:
用于判断正常与异常。
医学统计学复习资料
小;③要注意分子分母正确选用;④要注意率与比的正确应用;⑤要注 意平均率的计算方法;⑥要注意资料的可比性;⑦率和构成比比较时作 假设检验。 7. 简述直线回归与直线相关的区别。 (1)资料要求上不同:直线回归分析适用于应变量是服从正态分布的随 机变量,自变量是选定变量;直线相关分析适用于服从双变量正态分布 的资料。 (2) 两种系数的意义不同:回归系数是表明两个变量之间数量上的依存 关系,回归系数越大回归直线越陡峭,表示应变量随自变量变化越快; 相关系数是表明两个变量之间相关的方向和紧密程度的,相关系数越 大,两个变量的关联程度越大。 9. 假设检验的理论依据是什么?请简述假设检验的基本步骤。 答:假设检验的理论依据是小概率事件原理,步骤为: (1)根据研究目的建立假设,确定检验水准 (2)根据样本统计量的抽样分布规律,选择适当的统计方法,计算检验 统计量 (3)确定P值,做出推断结论 10.方差分析应用广泛,可用于:①两个或多个样本均数间的比较;②分 析两个或多个因素间的交互作用;③回归方程的线性假设检验;④多元 线性回归分析中偏回归系数的假设检验等。本章主要介绍完全随机设计 资料的方差分析、配伍组设计资料的方差分析及重复测量数据的方差分 析。 11. 完全随机设计的两样本率比较时,如何正确选择统计分析方法 (写出相应的计算公式)。 (1)当总例数n≥40且所有格子的T≥5时,用2检验的基本公式或四格表 资料2检验的专用公式; (2)当n≥40但有1≤T<5时,用四格表资料2检验的校正公式;或改用四 格表资料的Fisher确切概率法的连续性校正法: (3)当n<40,或T<1时,用四格表资料的Fisher确切概率法。 12. 什么是医学参考值范围?估计医学参考值范围如何正确选用统计 方法? 答:医学参考值范围是指所谓“正常人”的解剖、生理、生化等指标的 波动范围,亦称正常值范围。如95%的参考值范围包括了95%的观察 值,而有5%的观察值不在这一范围内。 估计医学参考值范围确定方法:
医学统计学复习资料
医学统计学第一章绪论第一节医学统计学的定义和内容1.医学统计学的主要内容 :统计推断、统计描述第二节统计工作的基本步骤1.医学统计工作可分为四个步骤:统计设计搜集资料整理资料分析资料第三节统计资料的类型医学统计资料按研究指标的性质一般分为:定量资料、定性资料、等级资料一、定量资料(计量资料)定量资料(quantitative data)是用定量的方法测定观察单位(个体)某项指标数值的大小,所得的资料称定量资料。
如身高(㎝)、体重(㎏)、脉搏(次/分)、血压(kPa,mmHg)等为数值变量,其组成的资料为定量资料。
二、定性资料(计数资料)定性资料(qualitative data)是将观察单位按某种属性或类别分组,清点各组的观察单位数,所得的资料。
亦称无序分类资料。
如:男-女分组;中医的虚、实,阴、阳等分组;按生存-死亡分组;A、B、O、AB分组。
三、等级资料等级资料(ranked data)是将观察单位按属性的等级分组,清点各组的观察单位数,所得的资料为等级资料。
亦称有序分类资料。
如治疗结果分为治愈、显效、好转、无效四个等级。
:疾病的严重程度可以分为,轻、中、重;中医辨证中舌象的颜色有,淡、红、暗、紫。
♦根据需要,各类变量可以互相转化。
♦若按贫血的诊断标准将血红蛋白分为四个等级:重度贫血、中度贫血、轻度贫血、正常,可按等级资料处理。
有时亦可将定性资料或等级资料数量化,如将等级资料的治疗结果赋以分值,分别用0、1、2…等表示,则可按定量资料处理。
第四节统计学中的几个基本概念一、同质与变异同质(homogeneity)是指观察单位或研究个体间被研究指标的主要影响因素相同或基本相同。
如研究儿童的生长发育,同性别、同年龄、同地区、同民族、健康的儿童即为同质儿童。
变异(variation)由于生物个体的各种指标所受影响因素极为复杂,同质的个体间各种指标存在差异,这种差异称为变异。
如同质的儿童身高、体重、血压、脉搏等指标会有一定的差别。
医学统计学复习资料(完整版)
第1章绪论医学统计学是一门“运用统计学的原理和方法,研究医学科研中有关数据的收集、整理和分析的应用科学。
1.个体:又称观察单位,是统计研究的最基本单位,也是构成总体的最基本的观察单位。
2.总体:根据研究目的确定的同质观察单位某项指标测量值(观察值)的集合。
分为有限总体(明确规定了空间、时间、人群范围内有限个观察单位)和无限总体(无时间和空间范围的限制)。
反映总体特征的指标为参数,常用小写希腊字母表示。
3.样本:从总体中随机抽取的一部分有代表性的观察单位组成的整体。
(抽样,随机化原则,样本含量)根据样本资料计算出来的相应指标为统计量,常用大写英文字母表示。
4.抽样研究:从总体中随机抽取样本,根据样本信息推断总体特征的方法。
抽样误差是由随机抽样(样本的偶然性)造成的样本指标与总体指标之间、样本指标与样本指标之间的差异。
其根源在于总体中的个体存在变异性。
只要是抽样研究,就一定存在抽样误差,不能用样本的指标直接下结论。
统计分析主要是针对抽样误差而言。
5.变量(一个个体的任意“特征”);资料(变量值的集合),资料类型:①计量资料/定量资料/数值变量资料:表现为数值大小,一般有度量衡单位,又可分为连续型和离散型两类;②计数资料/定性资料/无序分类变量资料/名义变量资料:表现为互补相容的属性或类别,一般无度量衡单位,可分为二分类和多分类;③等级资料/半定量资料/有序分类变量资料:表现为等级大小或属性程度。
各类资料间可相互转化。
①可选分析方法有:t检验、方差分析、相关回归分析等;②可选分析方法有:χ2检验、z检验等;③可选分析方法有:秩和检验、Ridit分析等。
6.误差:实测值与真实值之差。
可分为随机误差(随机测量误差+抽样误差)与非随机误差(系统误差与非系统误差)。
①随机误差:是一类不恒定、随机变化的误差,由多种尚无法控制的因素引起,它是不可避免的;②系统误差:是实验过程中产生的误差,它的值或恒定不变,或遵循一定的变化规律,其产生原因往往是可知的或可以掌握的,它是可以消除或控制的;③非系统误差:又称过失误差,是指在实验过程中由于研究者偶然失误而造成的误差,可以消除。
《医学统计学》复习资料与习题答案
---------------------------------------------------------------最新资料推荐------------------------------------------------------ 《医学统计学》复习资料与习题答案《医学统计学》复习资料与习题答案教学提要(一)《医用统计学》基本概念 1、变异:宇宙中的事物,千差万别,各不相同。
即使是性质相同的事物,就同一观察指标来看,各观察指标(亦称个体)之间,也各有差异,称为变异。
同质观察单位之间的个体变异,是生物的重要特征,是偶然性的表现。
2、变量:由于生物的变异特性,使得观察单位某种指标的数值互相不等,所以个体值称为变量值或观察值。
3、总体:即根据研究目的确定的同质的研究对象的全体。
更确切地说,是性质相同的所有观察单位的某种变量值的集合。
4、样本:即从总体中抽取一部分作为观察单位进行观察,这部分观察单位称为样本。
为了使样本对总体有较好的代表性,抽样必须遵循随机化的原则,即总体中每一观察单位均有相同的机会被抽取到样本中去。
5、计量资料(数值变量资料):对每个观察单位用定量方法测定某项指标量的大小,所得的资1 / 9料称为计量资料,一般有度量衡等单位。
6、计数资料(分类变量资料):将观察单位按某种属性或类别分组,所得各组的观察单位数,称为计数资料。
可分为二项式或多项式分类变量。
7、等级资料:将观察单位按某种属性的不同程度分组,所得各组的观察单位数,称为等级资料。
这类资料与计数资料不同的是:属性的分组有程度的差别,各组按大小顺序排列;与计量资料不同的是:每个观察单位未确切定量,因而称为半定量资料。
8、抽样误差:由于总体中各观察单位间存在个体差异, 抽样研究中抽取的样本, 只包含总体的一部分, 因而样本指标不一定等于相应的总体指标, 这种样本统计量与总体参数间的差别称为抽样误差。
(二)统计工作的基本步骤 1、设计: 这是关键的一步。
医学统计学考试重点资料
一、名解:1、定量资料:以定量值表达每个观察单位的某项观察指标2、定性资料:以定性方式表达每个观察单位的某项观察指标3、等级资料:以等级方式表达每个观察单位的某项观察指标4、总体:是指按研究目的所确定的研究对象中所有观察单位某项指标取值的集合。
5、样本:是指从研究总体中随机抽取具有代表性的部分观察单位某项指标取值的集合。
6、参数:描述某总体特征的指标称为总体参数。
7、统计量:描述某样本特征的指标称为样本统计量。
8、小概率事件:当某事件发生的概率小于或等于0.05时,统计学上称该事件为小概率事件9、小概率原理:其涵义为该事件发生的可能性很小,进而认为其在一次抽样中不可能发生,此即为小概率原理。
小概率原理是进行统计推断的依据。
(8&9常写在一起)10∙变异,是以具有同质性的观察单位为载体,某项观察指标在其单位之间显示的差别。
11标准化率:用统一的标准对内部构成不同的各组频率进行调整和对比,对比后的率为标准化率。
12参考值范围:又称正常值范围,大多数人正常人某观察指标所在的范围。
由于正常人的形态、功能、生化等各种指标的数据因人而异,而且同一个人的某些指标还会随着时间、机体内外环境的改变而变化,因此需要确定其波动范围,即正常值范围,简称正常值。
13、抽样误差:由抽样引起的样本统计量与总体参数间的差别。
14、中心极限定理:①从均数为U,标准差为。
的总体中独立随机抽样,当样本含量?增加时,样本均数的分布将趋于正态分布,均数为标准差为。
X②从非正态分布的总体中随机抽样,只要样本含量足够大,样本均数趋于正态分布。
15、统计推断:就是根据样本所提供的信息,以一定的概率推断总体的性质。
16、区间估计/参数估计/可信区间:包括点估计和区间估计,由样本信息估计总体参数。
按一定的概率或可信度(La)用一个区间估计总体参数所在范围。
这个范围称作可信度为l-α的可信区间(ConfidenCeinterval,Cl),又称置信区间。
医学统计学复习资料
医学统计学复习资料导言医学统计学是医学领域中非常重要的一门学科,它的作用是帮助医生和研究人员通过收集、分析和解释数据来评估医学检验和治疗的效果。
本文将提供一份医学统计学的复习资料,帮助读者回顾和巩固相关的知识。
一、基本概念1.1 总体和样本在医学统计学中,总体是指我们研究的整体对象,而样本则是总体的一个子集。
例如,我们对某种疾病的患者进行研究时,患者总体就是所有患该病的人群,而样本则是我们实际观察到的一部分患者。
1.2 参数和统计量在医学统计学中,参数是用来描述总体特征的统计量,例如总体均值、总体方差等。
而统计量是通过样本数据来估计总体参数的量,例如样本均值、样本方差等。
假设检验是医学统计学中常用的一种方法,它用于判断总体参数的假设是否成立。
在假设检验中,我们先假设总体参数的某个值是正确的(称为零假设),然后通过收集样本数据来判断该假设是否成立。
二、数据的分布2.1 正态分布正态分布在医学统计学中非常重要,因为许多统计方法都假设数据服从正态分布。
正态分布具有钟形曲线的特点,均值、中位数和众数都重合在一起。
常见的正态分布检验有Shapiro-Wilk检验和Kolmogorov-Smirnov检验。
2.2 t分布t分布是一种在样本量较小的情况下使用的概率分布,它比正态分布的尾部更加厚重。
t分布的形状取决于样本量,当样本量增加时,t分布逐渐趋近于正态分布。
在医学研究中,常用t分布来进行样本均值的假设检验。
非参数检验是一种不依赖于数据分布的统计方法,它对数据的要求相对较低。
与参数检验不同,非参数检验适用于无法确定数据分布或偏离正态分布的情况。
常见的非参数检验方法有Wilcoxon秩和检验和Mann-Whitney U检验。
三、统计推断3.1 置信区间置信区间是一种用来估计总体参数的范围,它是一个区间,表示我们对总体参数的估计在一定置信水平下的可信程度。
通常,置信区间的宽度与置信水平相关,越高的置信水平意味着更宽的置信区间。
医学统计学复习资料
名词解释1.总体:是指根据研究目的确定的、性质相同的的所有观察单位的集合。
2.样本:是从总体中随机抽取的,对总体有代表性的一部分观察单位所组成的集合3.抽样误差:由于随机抽样所造成的样本统计量与总体参数的差异4.概率:表示事件发生机会大小的统计指标,是一个介于0-1时间的值5.小概率事件:习惯上将P≦0.05或P≦0.01成为小概率事件,表示事件发生的可能性小6.构成比:表示某事物内部各组成部分在总体中所占的比重或分布7.率:说明某现象在一定条件下发生的频率或强度8.标准化法:采用同一标准,计算得到标准化率后再进行比较的方法9.流行:当一个地区(或单位)某病的发生率显著超过该病的历年的发病水平时10.发病率:表示一定时间内(通常是一年)特定人群中某病新病例出现的频率11.患病率:表示某以特定时间内被发现观察总人口中某病新旧病例所占的比值12.死亡率:指某人群在一定期间(通常为一年)内的死亡人数与该地区同期人口数的比值13.抽样调查:在研究人群中随机地抽取一部分个体进行调查,即调查人群中具有代表性的一部分,根据这种调查结果估计该人群某病的患病率或某些特征的情况14.食物中毒:是指摄入了还有生物性、化学性有毒有害物质的食物或把有毒有害物质当作食品摄入后引起的非传染性急性或亚急性疾病15.消毒:用化学、物理、生物等方法杀灭或消除外界环境中致病性微生物的一种措施16.病原携带者:没有任何临床症状但有排出病原体的人17.潜伏期:指病原体侵入机体到最早出现临床症状的这段时间18.空白对照:对照组不施加任何处理措施19.双盲:指研究者和研究对象都不知道研究对象的分组情况20.沾染:对照组的患者额外地接受了实验组的药物,使对照组疗效提高,人为地扩大对照组疗效的情况21.分类变量:按属性或类别事先将研究对象分组,然后清点各组研究对象的个数而得的数据22.Ⅰ类错误:在假设检验中拒绝一个实际成立的原假设所犯癿错误,其概率记为α23.Ⅱ类错误:在假设检验中接叐了一个实际不成立的原假设所犯的错误其概率记为β24.合理营养:全面而平衡的营养,每日膳食中各种营养素种类齐全,数量充足,相互间比例恰当25.RR:暴露组与非暴露组的发病率或死亡率之比,表示暴露某因素后易患某病的程度26.OR:含义与相对危险度相同,指暴露组发生某病的危险性为非暴露组的多少倍或百分之几简答题1.描述集中趋势三个指标的应用区别算数均数适用于对称分布,尤其是正态分布;几何均数适用于对数正态分布,如抗体滴度等呈倍数关系的资料,但应注意数值中出现零值或负值时不宜使用;中位数适用于各种分布的资料,特别是偏态分布资料,分布末端无确定值的资料2.相对数的应用注意计算相对数时应有足够的样本例数;不能用构成比代替率;正确计算总率;注意资料的可比性;样本率或构成比的比较需要进行假设检验3.统计表的制作要求(1)标题:简明扼要,清晰地反应统计表的核心内容,包括研究时间地点内容(2)标目:分横标目和纵标目,。
《医学统计学》复习资料
统计学概述一、统计学的意义统计学是研究数据的收集、整理、分析的一门科学,是认识社会和自然现象客观规律数量特征的重要工具。
统计学方法就是帮助人们透过偶然现象认识其内在的规律性,揭示疾病或现象发生、发展规律,为预防疾病、促进健康提供客观依据。
二、统计学的基本概念(一)同质与变异同质是指被研究指标的影响因素相同。
变异是同质基础上的观察单位(亦称为个体)之间的差异。
(二)总体与样本总体是指根据研究目的确定的同质观察单位的全体。
样本从总体中随机抽取的部分观察单位,其测量值(或变量值)的集合。
(三)变量与变量值变量:确定总体后,研究者应对每个观察单位的某些特征进行测量或观察,这种特征称为变量,如:身高、体重等。
变量值:变量的测得值。
如身高150cm,体重50Kg等。
(四)参数与统计量参数是指总体特征的统计指标。
如某地健康成年男性的平均血红蛋白值。
统计量是指样本特征的统计指标。
如从某地健康成年男性中抽取一部分人的平均血红蛋白值。
(五)误差误差泛指测量值与真实值之差。
根据误差的性质和来源,统计工作中产生的误差主要有三种类型,即系统误差、随机测量误差、抽样误差。
1.系统误差:测量结果有倾向性。
查明原因,可以避免。
特点:①测量结果有倾向性。
如仪器、试剂、判定标准等。
②查明原因,可以避免。
2.随机测量误差:收集资料的过程中,即使避免了系统误差,但由于各种偶然因素造成的测量值与真实值不完全一致,这种误差称为随机测量误差。
特点:①随机误差没有大小和方向。
②不可避免。
3.抽样误差:由于随机抽样所引起的样本统计量与总体参数之间的差异以及各样本统计量之间的差异称为抽样误差。
特点:变异是绝对的,抽样误差不可避免。
原因:个体之间的差异;抽样时只能抽取总体中的一部分作为样本。
(六)概率(P)概率是描述某随机事件发生可能性大小的量值,常用符号P表示。
随机事件的概率在0~1之间,即0≤P≤1。
小概率事件:P≤0.05或P≤0.01的事件。
医学统计学总复习资料
几种常用的方差分析
❖ 完全随机设计的方差分析(单因素) ❖ 随机区组的方差分析 ❖ 交叉设计的方差分析 ❖ 析因设计的方差分析
比较各种方差分析的变异分解
❖ 多个样本均数经方差分析后,若有统计学意义, 需用多重比较的方法进一步了解哪些均数间差 别有统计学意义。
❖ 常用SNK法(q检验)和Dunnett-t检验,前者为 两两间均作比较,后者为实验组和对照组比较。
❖ 一.名词解释5个(每题3分,共15分) ❖ 二.选择题30个(每题1.5分,共45分) ❖ 三.简答题3个(共15分) ❖ 四.案例辨析题2个(共15分) ❖ 五.综合分析题1个(共10分)
医学统计学总复习
张俊辉 2Leabharlann 10.12.27统计工作的步骤 ❖ 设计:统计工作的第一步和最关键的一步 ❖ 搜集 ❖ 整理 ❖ 分析
❖ 是否99%的置信区间优于95%置信区间 ?
❖ 建立检验假设,确定检验水准 ❖ 选定检验方法,计算检验统计量 ❖ 确定P值,作出统计推断
t检验
❖ t检验的应用条件为: ❖ ①在单样本检验中,总体标准差未知且样本含量较
小(n<50)时,要求样本来自正态分布总体; ❖ ②成组检验要求两组资料相应的总体分别服从正态
把全部观察值间的变异按设计类型的不同, 分解成两个或多个组成部分,然后将各部分 的变异与随机误差进行比较,以判断各部分 的变异是否具有统计学意义 。
❖ 1. 各样本是相互独立的随机样本,均服从正 态分布
❖ 2. 各样本的总体方差相等,即方差齐性
独立、正态、方差齐性 如果方差不齐时,可采用F’检验或秩和检验。
为
。一般情况下要求检验效能应在0.8
以上。
假设检验中的注意事项
医学统计学复习资料
一、名词解释1. 概率:在重复试验中,事件A的频率,随着试验次数的不断增加将愈来愈接近一个常数p,这个常数p就称为事件A出现的概率(probability) ,记作P(A)或P。
2•抽样误差:由于抽样造成的统计量与参数之间的差别,特点是不能避免的,可用标准误描述其大小。
3•医学参考值范围:是指绝大多数正常人的某指标值都在一定的范围内,其中最常用的是95%4•总体:是指根据研究目的确定的、同质的全部研究的观测值,即某个随机变量X可能取的值得全体。
4•总体:根据研究目的所确定的同质观察单位的全体。
5•线性回归系数:直线回归方程y=a+bX的系数b称为回归系数,也就是回归直线的斜率(slope),表示X每增加一个单位,Y 平均改变b个单位。
二、填空题1•统计资料的类型分:计量资料、计数资料、等级资料。
2•统计工作的步骤分为:统计设计、收集资料、整理资料、分析资料。
3•统计表的结构为:标题、标目、线条、数字。
4•可信区间的两个要素是:准确度、精密度。
5•方差分析的应用条件为:①各组样本是相互独立的随机样本②来自正态总体③各组总体方差相等,即方差齐性。
6. 描述正态分布曲线形态的指标是(T,描述t分布曲线形态的指标是V。
7•从集中趋势、离散趋势两个方面来描述计量资料的分布特征。
三、单项选择题(请把正确答案写在下面的表格里,每题 2 分,共20分)1•将90名高血压病人随机等分成三组后分别用A、B和C方法治疗,以服药前后血压的差值为疗效,欲比较三种方法的效果是否相同,正确的是CA 作三个差值样本比较的t检验B作三个差值样本比较的方差分析C作配伍组设计资料的方差分析D作两两比较的t检验2. 某地1952和1998年三种死因别死亡率绘制成统计图,宜用BA直条图B 百分条图 C 圆图D 直方图3. 下列哪个变量为标准正态变量 BA 二B x- ■'CD x —」S CT S x 64. 某医院对30名麻疹易感儿童经气溶胶免疫一个月后,测得其血凝抑制抗体滴度,最合适描述其集中趋势的指标是 BA 均数B几何均数C 标准差D中位数5. 配对设计的目的DA提高测量精度B操作方便C 为了可以使用t检验D提高组间可比性6. 测定尿铅含量有甲乙两种方法。
医学统计复习资料
医学统计复习资料一、引言医学统计学是医学研究中非常重要的一门学科,它通过收集、整理和分析医学数据,帮助医学研究者更好地了解和解释医学现象。
本文将为您提供一份医学统计复习资料,帮助您系统地复习医学统计学的基本概念、方法和应用。
二、医学统计学的基本概念1. 统计学的定义:统计学是一门研究数据收集、整理、分析和解释的学科,它可以帮助我们从大量的数据中发现规律和趋势。
2. 研究设计与样本选择:在医学研究中,合理的研究设计和样本选择是确保研究结果准确性的关键。
常见的研究设计包括前瞻性研究、回顾性研究和随机对照试验等。
3. 变量类型与测量:医学研究中常见的变量类型包括定性变量和定量变量。
定性变量是指描述性质或特征的变量,如性别、病情等;定量变量是指能够用数字表示的变量,如年龄、血压等。
4. 描述统计学:描述统计学是对收集到的数据进行整理、总结和描述的方法。
常用的描述统计学方法包括频数分布表、直方图、均值和标准差等。
5. 推断统计学:推断统计学是通过对样本数据进行分析,从而对总体进行推断的方法。
常用的推断统计学方法包括假设检验、置信区间和相关分析等。
三、医学统计学的常用方法1. 假设检验:假设检验是用来判断样本数据是否支持某个假设的方法。
它包括设立原假设和备择假设、选择适当的检验统计量、计算P值并进行决策等步骤。
2. 置信区间:置信区间是用来估计总体参数的范围的方法。
它通常以一个区间来表示,如95%的置信区间表示有95%的把握总体参数落在该区间内。
3. 相关分析:相关分析用来研究两个变量之间的关系。
常见的相关分析方法包括皮尔逊相关系数和斯皮尔曼等级相关系数。
4. 方差分析:方差分析是用来比较两个或多个样本均值之间差异的方法。
它可以判断不同因素对样本均值的影响是否显著。
5. 生存分析:生存分析是用来研究时间至某一事件发生的概率的方法。
它常用于医学研究中的生存分析和生存率比较。
四、医学统计学的应用1. 流行病学研究:医学统计学在流行病学研究中起着重要作用,可以帮助研究者确定疾病的发病率、死亡率和风险因素等。
医学统计学_总结_重点_笔记_复习资料
第一章2选1总体:总体(population)是根据研究目的确定的同质观察单位(研究对象)的全体,实际上是某一变量值的集合。
可分为有限总体和无限总体。
总体中的所有单位都能够标识者为有限总体,反之为无限总体。
总体population根据研究目的而确定的同质观察单位的全体。
样本:从总体中随机抽取部分观察单位,其测量结果的集合称为样本(sample)。
样本应具有代表性。
所谓有代表性的样本,是指用随机抽样方法获得的样本。
样本sample从总体中随机抽得的部分观察单位,其实测值的集合。
3选1小概率事件:我们把概率很接近于0(即在大量重复试验中出现的频率非常低)的事件称为小概率事件。
P值:P 值即概率,反映某一事件发生的可能性大小。
统计学根据显著性检验方法所得到的P 值反应结果真实程度,一般以P ≤ 0.05 认为有统计学意义, P ≤0.01 认为有高度统计学意义,其含义是样本间的差异由抽样误差所致的概率等于或小于0.05 或0.01。
P值是:1) 一种概率,一种在原假设为真的前提下出现观察样本以及更极端情况的概率。
2) 拒绝原假设的最小显著性水平。
3) 观察到的(实例的) 显著性水平。
4) 表示对原假设的支持程度,是用于确定是否应该拒绝原假设的另一种方法。
小概率原理:一个事件如果发生的概率很小的话,那么可认为它在一次实际实验中是不会发生的,数学上称之小概率原理,也称为小概率的实际不可能性原理。
统计学中,一般认为等于或小于0.05或0.01的概率为小概率。
资料的类型(3选1)(1)计量资料:对每个观察单位用定量的方法测定某项指标量的大小,所得的资料称为计量资料(measurement data)。
计量资料亦称定量资料、测量资料。
.其变量值是定量的,表现为数值大小,一般有度量衡单位。
如某一患者的身高(cm)、体重(kg)、红细胞计数(1012/L)、脉搏(次/分)、血压(KPa)等。
计量资料measurement data定量资料quantitative data数值变量资料numerical variable为观测每个观察单位某项指标的大小,而获得的资料。
医学统计学总复习资料
第四讲 参数估计 (第5章)
第一节 抽样分布与抽样误差 抽样误差的概念 标准误的概念及其与标准差的区别与联系 样本均数的抽样分布与抽样误差 样本率的抽样分布与抽样误差 第二节 总体均数的估计 参数估计:点(值)估计和区间估计 总体均数的区间估计 两总体均数之差的区间估计 可信区间的涵义:和医学参考值范围的区别 可信区间估计的优劣
总 复 习
考题类型
选择题(20分)
判断题(10分)
简答题(40分) 综合分析题 (30分)
第一讲 绪论 (第1章)
第一节 医学统计学 第二节 统计学中的几个基本概念:总体与样本、同质与变异、 变量与资料 统计资料的分类 :计量资料-连续变量 计数资料-分类变量 等级资料-有序分类变量 ——不同类型的资料要用不同的统计分析方法 第三节 医学统计工作的基本步骤:统计设计、收集资料、整理 资料、分析资料 分析资料包括统计描述和统计推断 统计推断又包括参数估计和假设检验
参数、非参数统计方法的概念和区别
第一节 配对计量资料:差值满足正态分布条件:配对t检验 差值不满足正态分布条件:配对符号秩和检验 配对计数资料:McNemar配对x2检验
第二节 单样本计量资料:样本来自正态分布总体:单样本均数t检验 样本来自非正态总体或总体分布无法确定: 配对符号秩和检验 单样本计数资料: x2 检验 第三节 完全随机化设计两独立样本 两组计量资料:来自正态分布总体,且两总体方差齐:两独 立样本均数的 t 检验 不满足t 检验条件且无适当的变量变换方法: 两独立样本秩和检验 (Mann-Whitney U test) 两组计数资料:x2检验 两组等级(结果变量)资料:Mann-Whitney U test
第二讲 统计描述 (第3章)
医学统计学总复习
医学统计学总复习1、几种集中趋势指标的适用条件均数—正态分布或近似正态分布;几何均数—呈正偏态分布,但数据经过对数变换后呈正态分布的资料,也可用于观察值之间呈倍数或近似倍数变化(等比关系)的资料;中位数—偏态分布资料以及频数分布的一端或两端无确切数据资料。
几种离散程度指标的适用条件:极差(全距)—常用于描述单峰对称分布小样本资料的变异程度或用于初步了解资料。
四分位数间距—常用于描述偏态分布资料、两端无确切值或分布不明确资料的离散程度。
方差和标准差—正态分布和近似正态分布。
变异系数—比较计量单位不同以及均数相差悬殊的几组资料。
21.标准正态分布(u分布)与t分布的异同:相同点;集中位置都是0,都是单峰分布,是对称分布,标准正态分布是t分布的特例(自由度是无限大时)。
不同点:t分布是一簇分布曲线,t分布的曲线形态是随自由度的变化而变化,标准正态分布的曲线的形态不变,是固定不变的,因为它的形状参数为1。
3.为什么不可以说“总体均数有95%的概率落在这个区间里”?样调查的成本会更高5.t检验的应用条件为:▪①在单样本检验中,总体标准差未知且样本含量较小(n<50)时,要求样本来自正态分布总体;▪②成组检验要求两组资料相应的总体分别服从正态分布且方差齐。
当不满足这些条件时可使用变量变换将数据转换成正态或者近似正态分布,或使用秩和检验。
两小样本均数比较时,若两总体方差不相等,还可使用t’检验。
6.假设检验中的注意事项▪要保证组间的可比性▪要根据研究目的、设计类型和资料类型选用适当的检验方法▪正确理解假设检验中概率P值的含义▪结论不能绝对化▪单、双侧检验应事先确定7.方差分析的基本思想把全部观察值间的变异按设计类型的不同,分解成两个或多个组成部分,然后将各部分的变异与随机误差进行比较,以判断各部分的变异是否具有统计学意义。
8.方差分析的应用条件▪ 1. 各样本是相互独立的随机样本,均服从正态分布▪ 2. 各样本的总体方差相等,即方差齐性独立、正态、方差齐性如果方差不齐时,可采用F’检验或秩和检验。
(完整版)医学统计学复习要点
..第一章绪论1、数据/资料的分类:①、计量资料,又称定量资料或者数值变量;为观测每个观察单位某项治疗的大小而获得的资料。
②、计数资料,又称定性资料或者无序分类变量;为将观察单位按照某种属性或者类别分组计数,分组汇总各组观察单位数后而得到的资料。
③、等级资料,又称半定量资料或者有序分类变量。
为将观察单位按某种属性的不同程度分成等级后分组计数,分类汇总各组观察单位数后而得到的资料。
2、统计学常用基本概念:①、统计学(statistics )是关于数据的科学与艺术,包括设计、搜集、整理、分析和表达等步骤,从数据中提炼新的有科学价值的信息。
②、总体(population )指的是根据研究目的而确定的同质观察单位的全体。
③、医学统计学(medical statistics ):用统计学的原理和方法处理医学资料中的同质性和变异性的科学和艺术,通过一定数量的观察、对比、分析,揭示那些困惑费解的医学问题背后的规律性。
④、样本(sample ):指的是从总体中随机抽取的部分观察单位。
⑤、变量(variable ):对观察单位某项特征进行测量或者观察,这种特征称为变量。
⑥、频率(frequency ):指的是样本的实际发生率。
⑦、概率(probability):指的是随机事件发生的可能性大小。
用大写的P 表示。
3、统计工作的基本步骤:①、统计设计:包括对资料的收集、整理和分析全过程的设想与安排;②、收集资料:采取措施取得准确可靠的原始数据;③、整理资料:将原始数据净化、系统化和条理化;④、分析资料:包括统计描述和统计推断两个方面。
第二章计量资料的统计描述1. 频数表的编制方法,频数分布的类型及频数表的用途①、求极差(range ):也称全距,即最大值和最小值之差,记作R ;②、确定组段数和组距,组段数通常取10-15组;③、根据组距写出组段,每个组段的下限为L ,上限为U ,变量X 值得归组统一定为L ≤X <U ,最后一组包括下限。
《医学统计学》复习资料
《医学统计学》复习资料一、名词解释1.计量资料( measurement data):是用定量方法测量观察对象指标数值的大小所得到的资料。
通常有单位。
又称为数值变量资料。
2.计数资料(enumeration data):通常先将研究对象按观察指标的性质和类别分类,然后清点个数得到的资料。
又称分类变量资料。
如患病未患病。
3.等级资料(ranked data,等级分组资料):指研究资料既有计数资料的特性,又有半定量的性质,称等级(分组)资料,又称半定量资料。
4、同质(homogeneity)指观察单位研究指标的影响因素相同(即同质指研究指标的影响因素性质相同)。
5、变异(heterogeneity/variance):指同质的个体之间的差异,来源于一些未加控制或无法控制的甚至不明原因的因素。
6、总体(population):根据研究目的确定的同质观察单位的全体,即按研究目的确定的同质观察单位某项变量值的集合。
7、样本(sample):从总体中随机抽取的有代表性的一部分观察单位组成样本(是某项指标的实测值组成样本)。
8、抽样( sampling ):从总体中抽取部分个体的过程。
9、完全随机设计(completely random design):指将受试对象随机分配到处理组、对照组中,或从不同总体中随机抽样进行研究。
10、配对设计(paired design):指将受试对象按配对条件配成对子,称为配对样本。
11、●随机区组设计(randomized block design):随机区组设计是配对设计的扩展。
●随机事件(random event):是指随机现象的某个可能的观察结果或可能发生也可能不发生的事件。
12、误差(error):泛指观测值与真实值之差,统计量与总体参数之差。
13、系统误差(system error):观测值倾向性的偏大或偏小。
影响准确性,须克服。
14、抽样误差(sampling error) :由抽样不同引起的样本均数(或其他统计量)与总体均数(或其他参数)之间的差异称作抽样误差;产生原因包括个体差异和抽样时只能抽取部分总体做样本;虽然不可避免,但可以用统计方法进行分析。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
一、名词解释1.概率:在重复试验中,事件A的频率,随着试验次数的不断增加将愈来愈接近一个常数p,这个常数p就称为事件A 出现的概率(probability),记作P(A)或P。
2.抽样误差:由于抽样造成的统计量与参数之间的差别,特点是不能避免的,可用标准误描述其大小。
3.医学参考值范围:是指绝大多数正常人的某指标值都在一定的范围内,其中最常用的是95%4.总体:是指根据研究目的确定的、同质的全部研究的观测值,即某个随机变量X可能取的值得全体。
4.总体:根据研究目的所确定的同质观察单位的全体。
5.线性回归系数:直线回归方程y=a+bX的系数b称为回归系数,也就是回归直线的斜率(slope),表示X 每增加一个单位,Y 平均改变 b 个单位。
二、填空题1.统计资料的类型分:计量资料、计数资料、等级资料。
2.统计工作的步骤分为:统计设计、收集资料、整理资料、分析资料。
3.统计表的结构为:标题、标目、线条、数字。
4.可信区间的两个要素是:准确度、精密度。
5.方差分析的应用条件为:①各组样本是相互独立的随机样本②来自正态总体③各组总体方差相等,即方差齐性。
6.描述正态分布曲线形态的指标是σ,描述t分布曲线形态的指标是ν。
7.从集中趋势、离散趋势两个方面来描述计量资料的分布特征。
三、单项选择题(请把正确答案写在下面的表格里,每题2分,共20分)1.将90名高血压病人随机等分成三组后分别用 A、B 和 C方法治疗,以服药前后血压的差值为疗效,欲比较三种方法的效果是否相同,正确的是 CA 作三个差值样本比较的 t 检验B 作三个差值样本比较的方差分析C 作配伍组设计资料的方差分析D 作两两比较的 t 检验2.某地1952和1998年三种死因别死亡率绘制成统计图,宜用 BA 直条图B 百分条图C 圆图D 直方图3.下列哪个变量为标准正态变量 BAsxμ- Bσμ-x Cxsxμ- Dxxσμ-4.某医院对30名麻疹易感儿童经气溶胶免疫一个月后,测得其血凝抑制抗体滴度,最合适描述其集中趋势的指标是 BA 均数B 几何均数C 标准差 D中位数5.配对设计的目的 DA 提高测量精度 B操作方便 C为了可以使用t检验D提高组间可比性6.测定尿铅含量有甲乙两种方法。
现用甲乙两法检测10份相同样品,要比较两法测得的结果有无差别,宜用 AA 配对设计t检验B 成组设计的t检验 C均数的u检验 D 方差分析7.应变量Y的离均差平方和划分,可出现 AA SS剩=SS回B SS总=SS剩C SS总=SS回1 / 5D 以上均可8.相关系数r与决定系数2r在含义上是有区别的,下面表述中最正确的是 CA r值的大小反映了两个变量之间是否有密切的关系B r值接近于零,表明两变量之间没有任何关系C 2r值接近于零,表明直线回归的贡献很小D 2r值大小反映了两个变量之间呈直线关系的密切程度和方向9.以下统计量结果错误的是 DA t=-3.15B b=-7.2C r=-0.5 Dχ2=-3.8510.若x服从均数为μ,标准差为σ的正态分布,则x的第95百分位数等于 DA μ+1.64σB μ+1.96σC μ-2.32σD μ+2.32σ四、简答题(15分)1.简述正态分布的特征。
答:1.正态分布曲线位于直角坐标系上方,以X=U为中心,左右完全对称,两端以X轴为渐近线2.在X=U出有F(x)最大值,F(u)=1/∝√2,x越远离u,F(x)值越小3.正态分布有两个参数,即位置参数u和形态参数∝,若固定∝,u值变小,曲线则沿X轴向左平移,u值变大,曲线则沿X 轴向右平移,形状均不变,若固定u,∝变小,曲线则陡峭,∝增大,则曲线变平坦 4.u=0,∝=1时为标准正态分布记做u→N(0,1)2.简述应用相对数时的注意事项。
3.答:①率和构成比的关系;②计算相对数时分母不宜太小③注意指标的可比性④不能以构成比代替强度相对数;⑤对观察例数不等的几个率不能直接相加求平均数。
3.简述线性回归的用途。
答:①描述两个变量变化的依存关系;②利用回归方程进行预测预报;③用容易测的指标估计不宜测量的指标;④获得精度更高的医学参考值范围;⑤利用回归可以进行统计控制。
五、计算题1.某地抽查144份黄连中小蘖碱含量(mg/100g)得均数为4.38,标准差为0.18,假设数据服从正态分布,问:①95%的黄连样品中小蘖碱含量在什么范围?②估计黄连中小蘖碱含量95%总体均数在什么范围?③有一份黄连样品,小蘖碱含量为4.80,怎样评价?④160份样品中,小蘖碱含量在4.0~4.4之间的样品理论上有多少份?Φ(-2.11)=0.0174,Φ(-2.33)=0.0099,Φ(-0.11)2.用两种方法检查某疾病患者120名,甲法检出率为60%,乙法检出率为50%,甲、乙法一致的检出率为35%,问两种2 / 5方法何者为优?(列出表格写出假设检验步骤)(15分)一、名词解释1.计数资料:将研究对象按照某种属性或类别进行分组,然后计算每组的观察例数。
2.抽样误差:由于样本的随机性引起的,统计量与参数的差别,或同一总体的相同统计量之间的差别。
3.P值:在假设检验中根据P值的大小,与实现的检验水准a进行比较的而作出拒绝Ho(p<a)或不拒绝Ho(p≥a)。
4.r:即样本相关系数,用以表示两个随机变量之间的相关关系的密切程度和相关方向的统计指标。
5.参数:反映总体统计学指标特性的数字称为参数。
二、填空题1.描述计量资料集中趋势的指标有_算数均数、几何均数_、_中位数。
2.统计工作的步骤分为_设计、_收集资料、_整理资料、_分析资料。
3.线性相关分为_正相关、负相关_、零相关_三种类型。
4.常用的相对数有_率、_构成比、速率_。
5.标准正态分布的均数等于___0__,标准差等于__1__。
6.用百分位数法计算血汞的95%参考值范围是_P2.5-P97.5。
7.两独立样本率的χ2检验当_T<5且_n>_40时需连续性校正。
8.频数分布的的类型分为_正态分布_和_偏态分布。
三、单项选择题1.比较 20 头河马体重和 20 只小白鼠体重变异程度大小宜采用 AA CV%B S2C RD S2.当自由度v→∞时,横轴上,正态曲线下从0到1.96的面积为 DA 95%B 45%C 97.5%D 47.5%3.用t检验对直线回归系数进行假设检验,其自由度为 BA n-1B n-2C 2(n-1)D n4.方差分析的目的是 CA 比较均数B 比较标准差C 比较均方D 比较离均差平方和5.某学院抽查两个年级学生HBsAg情况,结果甲:抽查35人,HBsAg(+)4人;乙年级40人,HBsAg(+)8人,该资料应选用的统计方法是 AA 连续性χ2检验B 非连续性校正χ2检验C t检验D 秩和检验6.下列哪一变量服从t分布 D3 / 54 / 5A σμ-x B σμ-x C x x σμ- D xs x μ-7.已知r=1,则一定有 CA b=1B S y =0C S yx =0D 截距=0 8.完全随机设计的方差分析中,不正确的是 C A ν总=ν处理+ν误差 B SS 总=SS 处理+SS 误差 C ν处理=N-k D F=MS 处理/MS 误差 9.以下统计量结果错误的是 DA t =-3.15B b=-7.2C r=-0.5D χ2=-3.8510.直方图可用于 BA 2001年5种疾病发病率比较B 10个年龄组患病率比较C 身高和患病率的关系分析D 描述O 型血者血红蛋白含量分布 四、简答题1.简述标准差的用途。
(5分)答:1.表示数据分布的离散程度 2.常用X ±S 作为计量资料的数字特征,描述的专用符号计算临床上的各种生化,生理指标的参考值的范围4在单纯随机抽样中,是计量资料估计样本量不可缺少的重依据之一 5.可用来计算均数的抽样误差大小2.简述应用相对数时的注意事项。
(5分)答:①率和构成比所说明的问题不同,构成比可以说明某事物内部各组成部分的比重或分布,而率是说明某现象发生的频率或强度的,所以不能以构成比代替率。
②计算相对数时分母不宜太小③注意指标的可比性③可比性指所比较指标,除研究因素外,其他影响因素应基本相同或相近,即在相同条件下进行对比。
通常应注意:1.观察对象同质,研究方法相同,观察时间相等,以及地区、民族、性别、年龄、病情及病程等客观条件均基本一致。
2.某个对研究结果有影响的因素,在各组的内部构成是否相同。
若因混杂因素干扰,使各对比组构成分布不同时,可采用标准化,平衡内部构成不同的影响后,再进行总率的比较。
3.简述线性回归的用途。
(5分)答:①描述两个变量变化的依存关系;②利用回归方程进行预测预报;③用容易测的指标估计不宜测量的指标;④获得精度更高的医学参考值范围;⑤利用回归可以进行统计控制。
五、计算分析题(共 30分)1.假定 5岁男童的体重服从正态分布,平均体重μ=19.5kg ,标准差σ=2.3kg 。
①95%的5岁男童的体重在什么范围?随机抽取一5岁男童的体重为20.9Kg,怎样评价?(5分)②假设n=100,估计5岁男童的体重总体均数在什么范围?(3分)③体重在14.6 kg 到23.9 kg 之间的男童的概率为多少?(7分)=0.27092.为探讨MRI无创性测量肺脉舒张压的新途径,分别用MRI和右心导管两种方法测量12名患者的肺脉舒张压,请回答:①该研究的设计类型是什么?常用的形式有哪些?(7分)答:实验性研究。
常用形式:②根据下面表格的分析结果,写出统计结论。
(写出具体的假设检验的步骤)(8分)5 / 5。