医学统计学复习资料 (1)
医学统计学复习资料

医学统计学第一章绪论第一节医学统计学的定义和内容1.医学统计学的主要内容 :统计推断、统计描述第二节统计工作的基本步骤1.医学统计工作可分为四个步骤:统计设计搜集资料整理资料分析资料第三节统计资料的类型医学统计资料按研究指标的性质一般分为:定量资料、定性资料、等级资料一、定量资料(计量资料)定量资料(quantitative data)是用定量的方法测定观察单位(个体)某项指标数值的大小,所得的资料称定量资料。
如身高(㎝)、体重(㎏)、脉搏(次/分)、血压(kPa,mmHg)等为数值变量,其组成的资料为定量资料。
二、定性资料(计数资料)定性资料(qualitative data)是将观察单位按某种属性或类别分组,清点各组的观察单位数,所得的资料。
亦称无序分类资料。
如:男-女分组;中医的虚、实,阴、阳等分组;按生存-死亡分组;A、B、O、AB分组。
三、等级资料等级资料(ranked data)是将观察单位按属性的等级分组,清点各组的观察单位数,所得的资料为等级资料。
亦称有序分类资料。
如治疗结果分为治愈、显效、好转、无效四个等级。
:疾病的严重程度可以分为,轻、中、重;中医辨证中舌象的颜色有,淡、红、暗、紫。
♦根据需要,各类变量可以互相转化。
♦若按贫血的诊断标准将血红蛋白分为四个等级:重度贫血、中度贫血、轻度贫血、正常,可按等级资料处理。
有时亦可将定性资料或等级资料数量化,如将等级资料的治疗结果赋以分值,分别用0、1、2…等表示,则可按定量资料处理。
第四节统计学中的几个基本概念一、同质与变异同质(homogeneity)是指观察单位或研究个体间被研究指标的主要影响因素相同或基本相同。
如研究儿童的生长发育,同性别、同年龄、同地区、同民族、健康的儿童即为同质儿童。
变异(variation)由于生物个体的各种指标所受影响因素极为复杂,同质的个体间各种指标存在差异,这种差异称为变异。
如同质的儿童身高、体重、血压、脉搏等指标会有一定的差别。
《医学统计学》总复习

§1 统计分析
一,定量资料的统计分析
定量资料的统计描述
反映集中趋势的指标: X 反映集中趋势的指标: 反映离散趋势的指标: 反映离散趋势的指标:
定量资料的统计推断
G
S
M
S2 Q CV
R
参数估计 假设检验
参数估计
点估计:用样本均数直接作为总体 点估计:
三,等级资料的统计分析(秩和检验) 等级资料的统计分析(秩和检验)
非参数检验的概念 非参数检验的优缺点 常用的秩和检验方法
(1) Wilcoxon符号秩和检验 配对设计 符号秩和检验(配对设计 符号秩和检验 配对设计) (2) Wilcoxon 两样本比较法 成组设计两样本 两样本比较法(成组设计两样本 成组设计两样本) (3) Kruskal-Wallis 法或 检验 (成组设计多样本 法或H 成组设计多样本) 成组设计多样本 (4) Friedman 法(随机区组设计 随机区组设计) 随机区组设计 (5) Nemenyi 法(成组设计多样本两两比较) 成组设计多样本两两比较) 成组设计多样本两两比较 (6) 随机区组设计两两比较的秩和检验
u 检验应用类型: 检验应用类型: 1)样本均数与总体均数的比较 2)完全随机设计的两样本均数的比较 ANOVA 检验应用类型: 检验应用类型: 1)完全随机设计的方差分析 2)随机区组设计的方差分析 3)交叉设计的方差分析 4)析因设计的方差分析 5)重复测量资料的方差分析
二,计数资料的统计分析
t 检验 t'检验 检验 ′
t
u 检验 ANOVA
正态分布的经验判断方法
若 若 , S ≥ 3X可认为资料呈偏态分布
S ≥ ,有理由怀疑资料呈偏态分布 X
医学统计学复习资料①(期中单选题库+解题思路整理)

医学统计学复习资料①(期中单选题库+解题思路整理)期中考试选择题题库,单选:1、某研究者测量了某地237⼈晨尿中的氟含量,结果见表1-1,对该资料的集中趋势和离散趋势进⾏描述宜选⽤()B表1-1:0.2~(75)0.6~(67)1.0~(30)1.4~(20)1.8~(16)2.2~(19)2.6~(6)3.0~(2)3.4~(1)3.8~(1)A、均数与标准差B、中位数与四分位数间距C、众数与标准差D、均数与变异系数E、中位数与变异系数1、某⼚发⽣⾷物中毒,9名患者潜伏期分别为:16、2、6、3、30、2、10、2、34+(⼩时),问该⾷物中毒的平均潜伏期为多少⼩时?()CA、5B、5.5C、6D、10E、122、正态分布是以()EA、t值为中⼼的频数分布B、z值为中⼼的频数分布C、变量为中⼼的频数分布D、观察例数为中⼼的频数分布E、均数为中⼼的频数分布3、某次研究进⾏随机抽样,测量得到该市120名健康成年男⼦的⾎红蛋⽩数,则本次研究总体为()CA、所有成年男⼦⾎红蛋⽩数B、该市所有成年男⼦⾎红蛋⽩数C、该市所有健康成年男⼦⾎红蛋⽩数D、120名该市成年男⼦⾎红蛋⽩数E、120名该市健康成年男⼦⾎红蛋⽩数4、以舒张压≥12.7kPa为⾼⾎压,测量1000⼈,结果有990名⾮⾼⾎压患者,有10名⾼⾎压患者,该资料属于()资料BA、计算B、计数C、计量D、等级E、都对5、某病患者8⼈的潜伏期(天)为:2、3、3、3、4、5、6、30+,则平均潜伏期为()DA、7天B、3天C、4天D、3.5天E、⼤于7天6、确定某指标的医学参考值范围时,其正常⼈是指()DA、从未患过病的⼈B、只患过⼩病但不影响被研究指标的⼈C、健康状况良好的⼈D、排除了影响被研究指标的疾病或因素的⼈E、排除了患过某病或某因素的⼈7、关于假设检验,下列哪个说法正确()CA、单侧检验优于双侧检验B、采⽤单侧检验还是双侧检验取决于检验统计量的⼤⼩C、若P值⼤于0.05,应不拒绝H0D、若P值⼩于0.05,接受H1可能犯错误,所以接受H0E、⽤z检验进⾏两样本总体均数⽐较时,对样本量没有要求8、t分布曲线⽐标准正态分布曲线()CA、中⼼位置右移,但曲线形状相同B、中⼼位置左移,但曲线形状相同C、中⼼位置相同,但曲线峰部偏低D、中⼼位置相同,但曲线峰部偏⾼E、中⼼位置相同,且曲线形状相同9、下列哪项指标为统计量()(x指x-bar)CA、µB、бC、SxD、ΠE、бx11、下列哪个变量为标准正态变量(D)医学统计学作业4第7题,选D12、统计上所说的样本是指()DA、按照研究者要求抽取总体中有意义的部分B、随意抽取总体中任意部分C、有意识的抽取总体中有典型部分D、按照随机原则抽取总体中有代表性部分E、总体中的每⼀个个体13、下列哪个公式可⽤于估计医学95%参考值范围(A)14、在2011年我国死亡⼈⼝中,恶性肿瘤占27.79%,则27.79%是()BA、率B、构成⽐C、绝对数D、标化率E、平均率15、某种疗法治疗患者41⼈,治疗结果如下,该资料的类型是()D治愈:8,显效:23,好转;6,恶化:3,死亡:1A、计数资料B、计量资料C、⽆序分类资料D、有序分类资料E、数值变量资料16、样本量⼀定,标准差越⼤时,下列认识中错误的是()BA、观察个体之间变异越⼤B、观察个体之间变异越⼩C、样本的抽样误差可能越⼤B、样本对总体的代表性可能越差E、由样本估计总体参数可能越容易出现偏差17、良好的实验设计,能减少⼈⼒、物⼒,提⾼实验效率,还有助于消除或减少()BA、抽样误差B、系统误差C、随机误差D、责任事故E、以上都不对18、关于抽样误差说法正确的是()BA、抽样研究中抽样误差是可以避免的B、从同⼀总体中随机抽样,获得的各样本均数间也存在抽样误差C、抽样误差的⼤⼩可以⽤标准差来说明D、造成抽样误差的唯⼀原因是个体差异E、控制抽样误差⼤⼩的最佳⽅法是减⼩个体变异19、对成倍增长的计量资料描绘其集中趋势,宜⽤()BA、算数均数B、⼏何均数C、中位数D、众数E、百分位数20、假设检验中,结果为P<0.05,有统计学意义。
医学统计学复习资料(完整版)

第1章绪论医学统计学是一门“运用统计学的原理和方法,研究医学科研中有关数据的收集、整理和分析的应用科学。
1.个体:又称观察单位,是统计研究的最基本单位,也是构成总体的最基本的观察单位。
2.总体:根据研究目的确定的同质观察单位某项指标测量值(观察值)的集合。
分为有限总体(明确规定了空间、时间、人群范围内有限个观察单位)和无限总体(无时间和空间范围的限制)。
反映总体特征的指标为参数,常用小写希腊字母表示。
3.样本:从总体中随机抽取的一部分有代表性的观察单位组成的整体。
(抽样,随机化原则,样本含量)根据样本资料计算出来的相应指标为统计量,常用大写英文字母表示。
4.抽样研究:从总体中随机抽取样本,根据样本信息推断总体特征的方法。
抽样误差是由随机抽样(样本的偶然性)造成的样本指标与总体指标之间、样本指标与样本指标之间的差异。
其根源在于总体中的个体存在变异性。
只要是抽样研究,就一定存在抽样误差,不能用样本的指标直接下结论。
统计分析主要是针对抽样误差而言。
5.变量(一个个体的任意“特征”);资料(变量值的集合),资料类型:①计量资料/定量资料/数值变量资料:表现为数值大小,一般有度量衡单位,又可分为连续型和离散型两类;②计数资料/定性资料/无序分类变量资料/名义变量资料:表现为互补相容的属性或类别,一般无度量衡单位,可分为二分类和多分类;③等级资料/半定量资料/有序分类变量资料:表现为等级大小或属性程度。
各类资料间可相互转化。
①可选分析方法有:t检验、方差分析、相关回归分析等;②可选分析方法有:χ2检验、z检验等;③可选分析方法有:秩和检验、Ridit分析等。
6.误差:实测值与真实值之差。
可分为随机误差(随机测量误差+抽样误差)与非随机误差(系统误差与非系统误差)。
①随机误差:是一类不恒定、随机变化的误差,由多种尚无法控制的因素引起,它是不可避免的;②系统误差:是实验过程中产生的误差,它的值或恒定不变,或遵循一定的变化规律,其产生原因往往是可知的或可以掌握的,它是可以消除或控制的;③非系统误差:又称过失误差,是指在实验过程中由于研究者偶然失误而造成的误差,可以消除。
医学统计学重点笔记一复习必备

正态分布及其应用
2024/1/26
正态分布概念
一种概率分布,具有钟型曲线特点,由均数和标准差决定 其分布形状。
正态分布在医学中的应用
许多医学指标如身高、体重、血压等服从或近似服从正态 分布;在估计医学参考值范围、质量控制等方面有广泛应 用。
正态性检验方法
图形法(直方图、P-P图、Q-Q图)、计算法(偏度系数 和峰度系数检验、Shapiro-Wilk检验、KolmogorovSmirnov检验等)。
任务
揭示医学领域中的数量规律,为 医学研究和临床实践提供科学的 方法和手段。
4
医学统计学发展简史
01
02
03
古典统计学时期
以描述性统计为主,关注 数据的收集和整理。
2024/1/26
推断统计学时期
以概率论为基础,发展出 假设检验、参数估计等推 断性统计方法。
现代统计学时期
引入计算机技术和复杂数 学模型,推动统计学向更 高层次发展。
2024/1/26
26
2024/1/26
06
卡方检验
27
四格表资料卡方检验
2024/1/26
适用条件
四格表资料,即2×2列联表,用于分析两个二分类变量之间的关联 。
检验统计量
卡方值,计算公式为χ2=(ad-bc)2N/(a+b)(c+d)(a+c)(b+d),其 中N为样本总量。
拒绝域
根据自由度和显著性水平确定拒绝域,自由度为1。
20
多重比较方法
多重比较方法是在方差分析的基础上 ,进一步比较各组均值之间的差异是 否显著的方法。
常用的多重比较方法有LSD法、S-NK法、Tukey法等,其中LSD法是一种 较为简单的方法,适用于各组样本量 相等的情况;S-N-K法是一种基于学 生化极差的方法,适用于各组样本量 不等的情况;Tukey法是一种基于t分 布的方法,适用于多组比较的情况。
医学统计学复习资料与复习题答案

教学提要(一)《医用统计学》基本概念1、变异:宇宙中的事物,千差万别,各不相同。
即使是性质相同的事物,就同一观察指标来看,各观察指标(亦称个体)之间,也各有差异,称为变异。
同质观察单位之间的个体变异,是生物的重要特征,是偶然性的表现。
2、变量:由于生物的变异特性,使得观察单位某种指标的数值互相不等,所以个体值称为变量值或观察值。
3、总体:即根据研究目的确定的同质的研究对象的全体。
更确切地说,是性质相同的所有观察单位的某种变量值的集合。
4、样本:即从总体中抽取一部分作为观察单位进行观察,这部分观察单位称为样本。
为了使样本对总体有较好的代表性,抽样必须遵循随机化的原则,即总体中每一观察单位均有相同的机会被抽取到样本中去。
5、计量资料(数值变量资料):对每个观察单位用定量方法测定某项指标量的大小,所得的资料称为计量资料,一般有度量衡等单位。
6、计数资料(分类变量资料):将观察单位按某种属性或类别分组,所得各组的观察单位数,称为计数资料。
可分为二项式或多项式分类变量。
7、等级资料:将观察单位按某种属性的不同程度分组,所得各组的观察单位数,称为等级资料。
这类资料与计数资料不同的是:属性的分组有程度的差别,各组按大小顺序排列;与计量资料不同的是:每个观察单位未确切定量,因而称为半定量资料。
8、抽样误差:由于总体中各观察单位间存在个体差异, 抽样研究中抽取的样本, 只包含总体的一部分, 因而样本指标不一定等于相应的总体指标, 这种样本统计量与总体参数间的差别称为抽样误差。
(二)统计工作的基本步骤1、设计: 这是关键的一步。
要求科学、周密、简明。
2、搜集资料: 要求完整、准确、及时。
医学统计资料的来源主要有三个方面:(1) 统计报表; (2) 日常医疗工作的原始记录和报告卡片; (3) 专题调查3、整理资料: 核查资料; 按性质或数量分组, 拟定整理表。
4、分析资料: 包括指标的计算、统计图表的绘制, 用统计方法如参数估计、假设检验等对资料作统计分析。
医学统计学复习资料

医学统计学复习资料导言医学统计学是医学领域中非常重要的一门学科,它的作用是帮助医生和研究人员通过收集、分析和解释数据来评估医学检验和治疗的效果。
本文将提供一份医学统计学的复习资料,帮助读者回顾和巩固相关的知识。
一、基本概念1.1 总体和样本在医学统计学中,总体是指我们研究的整体对象,而样本则是总体的一个子集。
例如,我们对某种疾病的患者进行研究时,患者总体就是所有患该病的人群,而样本则是我们实际观察到的一部分患者。
1.2 参数和统计量在医学统计学中,参数是用来描述总体特征的统计量,例如总体均值、总体方差等。
而统计量是通过样本数据来估计总体参数的量,例如样本均值、样本方差等。
假设检验是医学统计学中常用的一种方法,它用于判断总体参数的假设是否成立。
在假设检验中,我们先假设总体参数的某个值是正确的(称为零假设),然后通过收集样本数据来判断该假设是否成立。
二、数据的分布2.1 正态分布正态分布在医学统计学中非常重要,因为许多统计方法都假设数据服从正态分布。
正态分布具有钟形曲线的特点,均值、中位数和众数都重合在一起。
常见的正态分布检验有Shapiro-Wilk检验和Kolmogorov-Smirnov检验。
2.2 t分布t分布是一种在样本量较小的情况下使用的概率分布,它比正态分布的尾部更加厚重。
t分布的形状取决于样本量,当样本量增加时,t分布逐渐趋近于正态分布。
在医学研究中,常用t分布来进行样本均值的假设检验。
非参数检验是一种不依赖于数据分布的统计方法,它对数据的要求相对较低。
与参数检验不同,非参数检验适用于无法确定数据分布或偏离正态分布的情况。
常见的非参数检验方法有Wilcoxon秩和检验和Mann-Whitney U检验。
三、统计推断3.1 置信区间置信区间是一种用来估计总体参数的范围,它是一个区间,表示我们对总体参数的估计在一定置信水平下的可信程度。
通常,置信区间的宽度与置信水平相关,越高的置信水平意味着更宽的置信区间。
医学统计学总结重点笔记复习资料

第一章2选1总体:总体(population)是根据研究目的确定的同质观察单位(研究对象)的全体,实际上是某一变量值的集合。
可分为有限总体和无限总体。
总体中的所有单位都能够标识者为有限总体,反之为无限总体。
样本:从总体中随机抽取部分观察单位,其测量结果的集合称为样本(sample)。
样本应具有代表性。
所谓有代表性的样本,是指用随机抽样方法获得的样本。
3选1小概率事件:我们把概率很接近于0(即在大量重复试验中出现的频率非常低)的事件称为小概率事件。
P值:P 值即概率,反映某一事件发生的可能性大小。
统计学根据显著性检验方法所得到的P 值反应结果真实程度,一般以P ≤ 0.05 认为有统计学意义, P ≤0.01 认为有高度统计学意义,其含义是样本间的差异由抽样误差所致的概率等于或小于0.05 或0.01。
P值是:1) 一种概率,一种在原假设为真的前提下出现观察样本以及更极端情况的概率。
2) 拒绝原假设的最小显著性水平。
3) 观察到的(实例的) 显著性水平。
4) 表示对原假设的支持程度,是用于确定是否应该拒绝原假设的另一种方法。
小概率原理:一个事件如果发生的概率很小的话,那么可认为它在一次实际实验中是不会发生的,数学上称之小概率原理,也称为小概率的实际不可能性原理。
统计学中,一般认为等于或小于0.05或0.01的概率为小概率。
资料的类型(3选1)(1)计量资料:对每个观察单位用定量的方法测定某项指标量的大小,所得的资料称为计量资料(measurement data)。
计量资料亦称定量资料、测量资料。
.其变量值是定量的,表现为数值大小,一般有度量衡单位。
如某一患者的身高(cm)、体重(kg)、红细胞计数(1012/L)、脉搏(次/分)、血压(KPa)等。
(2)计数资料:将观察单位按某种属性或类别分组,所得的观察单位数称为计数资料(count data)。
计数资料亦称定性资料或分类资料。
其观察值是定性的,表现为互不相容的类别或属性。
医学统计学复习资料

名词解释1.总体:是指根据研究目的确定的、性质相同的的所有观察单位的集合。
2.样本:是从总体中随机抽取的,对总体有代表性的一部分观察单位所组成的集合3.抽样误差:由于随机抽样所造成的样本统计量与总体参数的差异4.概率:表示事件发生机会大小的统计指标,是一个介于0-1时间的值5.小概率事件:习惯上将P≦0.05或P≦0.01成为小概率事件,表示事件发生的可能性小6.构成比:表示某事物内部各组成部分在总体中所占的比重或分布7.率:说明某现象在一定条件下发生的频率或强度8.标准化法:采用同一标准,计算得到标准化率后再进行比较的方法9.流行:当一个地区(或单位)某病的发生率显著超过该病的历年的发病水平时10.发病率:表示一定时间内(通常是一年)特定人群中某病新病例出现的频率11.患病率:表示某以特定时间内被发现观察总人口中某病新旧病例所占的比值12.死亡率:指某人群在一定期间(通常为一年)内的死亡人数与该地区同期人口数的比值13.抽样调查:在研究人群中随机地抽取一部分个体进行调查,即调查人群中具有代表性的一部分,根据这种调查结果估计该人群某病的患病率或某些特征的情况14.食物中毒:是指摄入了还有生物性、化学性有毒有害物质的食物或把有毒有害物质当作食品摄入后引起的非传染性急性或亚急性疾病15.消毒:用化学、物理、生物等方法杀灭或消除外界环境中致病性微生物的一种措施16.病原携带者:没有任何临床症状但有排出病原体的人17.潜伏期:指病原体侵入机体到最早出现临床症状的这段时间18.空白对照:对照组不施加任何处理措施19.双盲:指研究者和研究对象都不知道研究对象的分组情况20.沾染:对照组的患者额外地接受了实验组的药物,使对照组疗效提高,人为地扩大对照组疗效的情况21.分类变量:按属性或类别事先将研究对象分组,然后清点各组研究对象的个数而得的数据22.Ⅰ类错误:在假设检验中拒绝一个实际成立的原假设所犯癿错误,其概率记为α23.Ⅱ类错误:在假设检验中接叐了一个实际不成立的原假设所犯的错误其概率记为β24.合理营养:全面而平衡的营养,每日膳食中各种营养素种类齐全,数量充足,相互间比例恰当25.RR:暴露组与非暴露组的发病率或死亡率之比,表示暴露某因素后易患某病的程度26.OR:含义与相对危险度相同,指暴露组发生某病的危险性为非暴露组的多少倍或百分之几简答题1.描述集中趋势三个指标的应用区别算数均数适用于对称分布,尤其是正态分布;几何均数适用于对数正态分布,如抗体滴度等呈倍数关系的资料,但应注意数值中出现零值或负值时不宜使用;中位数适用于各种分布的资料,特别是偏态分布资料,分布末端无确定值的资料2.相对数的应用注意计算相对数时应有足够的样本例数;不能用构成比代替率;正确计算总率;注意资料的可比性;样本率或构成比的比较需要进行假设检验3.统计表的制作要求(1)标题:简明扼要,清晰地反应统计表的核心内容,包括研究时间地点内容(2)标目:分横标目和纵标目,。
《医学统计学》复习资料

统计学概述一、统计学的意义统计学是研究数据的收集、整理、分析的一门科学,是认识社会和自然现象客观规律数量特征的重要工具。
统计学方法就是帮助人们透过偶然现象认识其内在的规律性,揭示疾病或现象发生、发展规律,为预防疾病、促进健康提供客观依据。
二、统计学的基本概念(一)同质与变异同质是指被研究指标的影响因素相同。
变异是同质基础上的观察单位(亦称为个体)之间的差异。
(二)总体与样本总体是指根据研究目的确定的同质观察单位的全体。
样本从总体中随机抽取的部分观察单位,其测量值(或变量值)的集合。
(三)变量与变量值变量:确定总体后,研究者应对每个观察单位的某些特征进行测量或观察,这种特征称为变量,如:身高、体重等。
变量值:变量的测得值。
如身高150cm,体重50Kg等。
(四)参数与统计量参数是指总体特征的统计指标。
如某地健康成年男性的平均血红蛋白值。
统计量是指样本特征的统计指标。
如从某地健康成年男性中抽取一部分人的平均血红蛋白值。
(五)误差误差泛指测量值与真实值之差。
根据误差的性质和来源,统计工作中产生的误差主要有三种类型,即系统误差、随机测量误差、抽样误差。
1.系统误差:测量结果有倾向性。
查明原因,可以避免。
特点:①测量结果有倾向性。
如仪器、试剂、判定标准等。
②查明原因,可以避免。
2.随机测量误差:收集资料的过程中,即使避免了系统误差,但由于各种偶然因素造成的测量值与真实值不完全一致,这种误差称为随机测量误差。
特点:①随机误差没有大小和方向。
②不可避免。
3.抽样误差:由于随机抽样所引起的样本统计量与总体参数之间的差异以及各样本统计量之间的差异称为抽样误差。
特点:变异是绝对的,抽样误差不可避免。
原因:个体之间的差异;抽样时只能抽取总体中的一部分作为样本。
(六)概率(P)概率是描述某随机事件发生可能性大小的量值,常用符号P表示。
随机事件的概率在0~1之间,即0≤P≤1。
小概率事件:P≤0.05或P≤0.01的事件。
医学统计学总复习(刘桂芬主编-研究生使用) (1)

b. t 检验 c. 用 r 检验来代替。 ④ 作结论:如 P≤0.05, 说明方程成立,列出回归方程;如 P>0.05, 说明方程不成立,不列回归方程。 5. 直线相关的概念 6. 直线相关的主要用途:用于分析两变量是否有相关关系及其方 向
观察人数
期内死亡人数
- 14 -
x~
nx
Dx
0~
25
10
1~
22
20
2~
10
9
3~
11
7
4~
10
1
5~
8
4
6~
4
0
7~
4
1
8~
3
0
9~
3
0
10~
2
0
11~
1
0
第三部分 期末成绩评定
一、成绩评定方法 总评(100%)=平时作业 10%+基础理论知识考试(笔试)60%+操作 技能考试(上机)30% 二、考试题型 (一)基础理论知识考试(笔试)(考试时间:100 分钟) 1、最佳选择题(单选)(30%,30 小题,每题 1 分) 2、辨析题(30%,10 小题,每题 3 分) 3、简答题(10%,2 小题,每题 5 分) 4、分析应用题(30%,5-6 题)
第十六章 生存分析
1.生存资料的特点 2.生存分析的几个基本概念(生存时间、死亡概率与生存概率、生存 率、中位生存期) 3.生存分析的用途 4.生存率计算方法:(1)K-M 法:例数少,且为未分组;(2)寿命表 法:例数多,且为频数表资料(注意:生存概率与生存率的结果) 5.生存率曲线比较:(1)log-rank test:两组或多组;(2)Gehan Score test:两组 6.Cox 模型(不要求) 第二十二章 医学论文统计结果报告
(完整版)医学统计学复习要点

..第一章绪论1、数据/资料的分类:①、计量资料,又称定量资料或者数值变量;为观测每个观察单位某项治疗的大小而获得的资料。
②、计数资料,又称定性资料或者无序分类变量;为将观察单位按照某种属性或者类别分组计数,分组汇总各组观察单位数后而得到的资料。
③、等级资料,又称半定量资料或者有序分类变量。
为将观察单位按某种属性的不同程度分成等级后分组计数,分类汇总各组观察单位数后而得到的资料。
2、统计学常用基本概念:①、统计学(statistics )是关于数据的科学与艺术,包括设计、搜集、整理、分析和表达等步骤,从数据中提炼新的有科学价值的信息。
②、总体(population )指的是根据研究目的而确定的同质观察单位的全体。
③、医学统计学(medical statistics ):用统计学的原理和方法处理医学资料中的同质性和变异性的科学和艺术,通过一定数量的观察、对比、分析,揭示那些困惑费解的医学问题背后的规律性。
④、样本(sample ):指的是从总体中随机抽取的部分观察单位。
⑤、变量(variable ):对观察单位某项特征进行测量或者观察,这种特征称为变量。
⑥、频率(frequency ):指的是样本的实际发生率。
⑦、概率(probability):指的是随机事件发生的可能性大小。
用大写的P 表示。
3、统计工作的基本步骤:①、统计设计:包括对资料的收集、整理和分析全过程的设想与安排;②、收集资料:采取措施取得准确可靠的原始数据;③、整理资料:将原始数据净化、系统化和条理化;④、分析资料:包括统计描述和统计推断两个方面。
第二章计量资料的统计描述1. 频数表的编制方法,频数分布的类型及频数表的用途①、求极差(range ):也称全距,即最大值和最小值之差,记作R ;②、确定组段数和组距,组段数通常取10-15组;③、根据组距写出组段,每个组段的下限为L ,上限为U ,变量X 值得归组统一定为L ≤X <U ,最后一组包括下限。
医学统计学复习资料

医学统计复习资料一、名词解释[1].总体:根据研究目得确定得同质观察单位得全体。
就是同质所有观察单位得某种变量值得集合。
总体可分为有限总体与无限总体。
总体中得所有单位都能够标识者为有限总体,反之为无限总体。
[2].样本:从总体中随机抽取部分观察单位,其实测值得集合。
[3].计量资料:又称定量资料或数值变量资料。
为观测每个观察单位得某项指标得大小,而获得得资料。
其变量值就是定量得,表现为数值大小,一般有度量衡单位。
根据其观测值取值就是否连续,又可分为连续型或离散型两类。
[4].计数资料:又称定性资料或者无序分类变量资料,亦称名义变量资料,就是将观察单位按照某种属性或类别分组计数,分组汇总各组观察单位数后得到得资料。
其变量值就是定性得,表现为互不相容得性或类别。
分两种情形:(1)二分类:两类间相互对立,互不相容。
(2)多分类:各类间互不相容。
[5].等级资料:又称半定量资料或有序分类变量资料,就是将观察单位按某种属性得不同程度分成等级后分组计数,分类汇总各组观察单位数后而得到得资料。
其变量值具有半定量性质,表现为等级大小或属性程度。
[6].随机误差(偶然误差):就是一类不恒定得、随机变化得误差,由多种尚无法控制得因素引起,观察值不按方向性与系统性变化,在大量重复测量中,它可呈现或大或小,或正或负得规律性变化。
[7].概率:概率(probability)又称几率,就是度量某一随机事件A发生可能性大小得一个数值,记为P(A),P(A)越大,说明A事件发生得可能性越大。
0﹤P(A)﹤1。
频率:在相同得条件下,独立重复做n 次试验,事件A 出现了m 次,则比值m/n 称为随机事件A 在n 次试验中出现得频率(freqency)。
当试验重复很多次时P(A)= m/n。
[8].平均数:描述一组变量值得集中位置或水平。
常用得平均数有算术平均数、几何平均数与中位数。
[9].算术均数(arithmetic mean)描述一组数据在数量上得平均水平。
《医学统计学》复习资料

《医学统计学》复习资料一、名词解释1.计量资料( measurement data):是用定量方法测量观察对象指标数值的大小所得到的资料。
通常有单位。
又称为数值变量资料。
2.计数资料(enumeration data):通常先将研究对象按观察指标的性质和类别分类,然后清点个数得到的资料。
又称分类变量资料。
如患病未患病。
3.等级资料(ranked data,等级分组资料):指研究资料既有计数资料的特性,又有半定量的性质,称等级(分组)资料,又称半定量资料。
4、同质(homogeneity)指观察单位研究指标的影响因素相同(即同质指研究指标的影响因素性质相同)。
5、变异(heterogeneity/variance):指同质的个体之间的差异,来源于一些未加控制或无法控制的甚至不明原因的因素。
6、总体(population):根据研究目的确定的同质观察单位的全体,即按研究目的确定的同质观察单位某项变量值的集合。
7、样本(sample):从总体中随机抽取的有代表性的一部分观察单位组成样本(是某项指标的实测值组成样本)。
8、抽样( sampling ):从总体中抽取部分个体的过程。
9、完全随机设计(completely random design):指将受试对象随机分配到处理组、对照组中,或从不同总体中随机抽样进行研究。
10、配对设计(paired design):指将受试对象按配对条件配成对子,称为配对样本。
11、●随机区组设计(randomized block design):随机区组设计是配对设计的扩展。
●随机事件(random event):是指随机现象的某个可能的观察结果或可能发生也可能不发生的事件。
12、误差(error):泛指观测值与真实值之差,统计量与总体参数之差。
13、系统误差(system error):观测值倾向性的偏大或偏小。
影响准确性,须克服。
14、抽样误差(sampling error) :由抽样不同引起的样本均数(或其他统计量)与总体均数(或其他参数)之间的差异称作抽样误差;产生原因包括个体差异和抽样时只能抽取部分总体做样本;虽然不可避免,但可以用统计方法进行分析。
医学统计学复习资料

一、名词解释1。
概率:在重复试验中,事件A的频率,随着试验次数的不断增加将愈来愈接近一个常数p,这个常数p就称为事件A出现的概率(probability),记作P(A)或P。
2.抽样误差:由于抽样造成的统计量与参数之间的差别,特点是不能避免的,可用标准误描述其大小。
3。
医学参考值范围:是指绝大多数正常人的某指标值都在一定的范围内,其中最常用的是95%4。
总体:是指根据研究目的确定的、同质的全部研究的观测值,即某个随机变量X可能取的值得全体。
4。
总体:根据研究目的所确定的同质观察单位的全体。
5。
线性回归系数:直线回归方程y=a+bX的系数b称为回归系数,也就是回归直线的斜率(slope),表示X 每增加一个单位,Y 平均改变 b 个单位。
二、填空题1.统计资料的类型分:计量资料、计数资料、等级资料。
2。
统计工作的步骤分为:统计设计、收集资料、整理资料、分析资料.3。
统计表的结构为:标题、标目、线条、数字.4。
可信区间的两个要素是:准确度、精密度.5。
方差分析的应用条件为:①各组样本是相互独立的随机样本②来自正态总体③各组总体方差相等,即方差齐性。
6.描述正态分布曲线形态的指标是σ,描述t分布曲线形态的指标是ν。
7。
从集中趋势、离散趋势两个方面来描述计量资料的分布特征.三、单项选择题(请把正确答案写在下面的表格里,每题2分,共20分)1。
将90名高血压病人随机等分成三组后分别用 A、B 和 C 方法治疗,以服药前后血压的差值为疗效,欲比较三种方法的效果是否相同,正确的是 CA 作三个差值样本比较的 t 检验B 作三个差值样本比较的方差分析C 作配伍组设计资料的方差分析D 作两两比较的 t 检验2。
某地1952和1998年三种死因别死亡率绘制成统计图,宜用 BA 直条图B 百分条图C 圆图D 直方图3.下列哪个变量为标准正态变量 BA B C D4。
某医院对30名麻疹易感儿童经气溶胶免疫一个月后,测得其血凝抑制抗体滴度,最合适描述其集中趋势的指标是 B A 均数 B 几何均数 C 标准差 D中位数5。
本科医学统计学复习题 ( 1 )

名词解释:1.定量数据:也称计量资料,变量的观测值是定量的,其特点是能够用数值大小衡量其水平的高低。
定性资料:也称计数资料,变量的观测值是定性的,变现为互不相容的类别或属性。
2.sampling error:抽样误差,由于抽样而引起的样本统计量与总体参数间的差异。
3.standard deviation:标准差,是将方差取平方根。
4.非参数检验:不以特定的总体分布为前提,也不针对总体参数做统计推断的方法。
5. normal distribution:正态分布一种非常重要的分布类型,其特征是中间组段的频数最多,两侧的频数分布对称,并按一定的规律下降。
6.相关系数:是说明具有直线相关关系的两个数值变量间相关的密切程度和相关方向的统计量。
5.方差分析:又称F检验,其基本思想是将全部观测值的总变异按影响因素分解为相应的若干部分变异,在此基础上,计算假设检验的统计量F值,实现对总体均数是否有差别的推断,6.率的标准化:采用统一的标准对内部构成不同的各组频率进行调整和对比的方法7.假设检验:也称显著性检验,是统计推断的另一重要内容,其目的是比较总体参数之间有无差别8.构成比:表示某事物内容各组成部分在整体中所占的比重。
9.正态分布10. standard normal distribution:任何正态分布的X值通过u值转换后,称为标准化的正态分布13.医学参考值范围14.发病率15.参数估计(parameter estimation):由样本信息估计总体参数。
它包括两种:点估计和区间估计。
16.完全随机设计17.随机区组设计18.决定系数19总体(population):大同小异的研究对象全体。
更确切的说,总体是指根据研究目的确定的、同质的全部研究单位的观测值。
20.同质(homogeneity):研究对象具有的相同的状况或属性等共性。
21.变异(variation):对于同质的各观察单位,其某变量值之间的差异22. 概率(probability):在重复试验中,事件A的频率,随着试验次数的不断增加将愈来愈接近一个常数p,这个常数p就称为事件A出现的概率(probability),记作P(A)或P。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
一、名词解释1.概率:在重复试验中,事件A的频率,随着试验次数的不断增加将愈来愈接近一个常数p,这个常数p就称为事件A出现的概率(probability),记作P(A)或P。
2.抽样误差:由于抽样造成的统计量与参数之间的差别,特点是不能避免的,可用标准误描述其大小。
3.医学参考值范围:是指绝大多数正常人的某指标值都在一定的范围内,其中最常用的是95%4.总体:是指根据研究目的确定的、同质的全部研究的观测值,即某个随机变量X可能取的值得全体。
4.总体:根据研究目的所确定的同质观察单位的全体。
5.线性回归系数:直线回归方程y=a+bX的系数b称为回归系数,也就是回归直线的斜率(slope),表示X 每增加一个单位,Y 平均改变 b 个单位。
二、填空题1.统计资料的类型分:计量资料、计数资料、等级资料。
2.统计工作的步骤分为:统计设计、收集资料、整理资料、分析资料。
3.统计表的结构为:标题、标目、线条、数字。
4.可信区间的两个要素是:准确度、精密度。
5.方差分析的应用条件为:①各组样本是相互独立的随机样本②来自正态总体③各组总体方差相等,即方差齐性。
6.描述正态分布曲线形态的指标是σ,描述t分布曲线形态的指标是ν。
7.从集中趋势、离散趋势两个方面来描述计量资料的分布特征。
三、单项选择题(请把正确答案写在下面的表格里,每题2分,共20分)1.将90名高血压病人随机等分成三组后分别用 A、B 和 C 方法治疗,以服药前后血压的差值为疗效,欲比较三种方法的效果是否相同,正确的是 CA 作三个差值样本比较的 t 检验B 作三个差值样本比较的方差分析C 作配伍组设计资料的方差分析D 作两两比较的 t 检验2.某地1952和1998年三种死因别死亡率绘制成统计图,宜用 BA 直条图B 百分条图C 圆图D 直方图3.下列哪个变量为标准正态变量 BAsxμ- Bσμ-x Cxsxμ- Dxxσμ-4.某医院对30名麻疹易感儿童经气溶胶免疫一个月后,测得其血凝抑制抗体滴度,最合适描述其集中趋势的指标是 BA 均数B 几何均数C 标准差 D中位数5.配对设计的目的 DA 提高测量精度 B操作方便 C为了可以使用t检验D提高组间可比性6.测定尿铅含量有甲乙两种方法。
现用甲乙两法检测10份相同样品,要比较两法测得的结果有无差别,宜用 AA 配对设计t检验B 成组设计的t检验 C均数的u检验 D 方差分析7.应变量Y的离均差平方和划分,可出现 AA SS剩=SS回B SS总=SS剩C SS总=SS回D 以上均可8.相关系数r与决定系数2r在含义上是有区别的,下面表述中最正确的是 CA r值的大小反映了两个变量之间是否有密切的关系B r值接近于零,表明两变量之间没有任何关系C 2r值接近于零,表明直线回归的贡献很小D 2r值大小反映了两个变量之间呈直线关系的密切程度和方向9.以下统计量结果错误的是 DA t=-3.15B b=-7.2C r=-0.5 Dχ2=-3.8510.若x服从均数为μ,标准差为σ的正态分布,则x的第95百分位数等于 DA μ+1.64σB μ+1.96σC μ-2.32σD μ+2.32σ四、简答题(15分)1.简述正态分布的特征。
答:1.正态分布曲线位于直角坐标系上方,以X=U为中心,左右完全对称,两端以X轴为渐近线2.在X=U出有F(x)最大值,F(u)=1/∝√2,x越远离u,F(x)值越小3.正态分布有两个参数,即位置参数u和形态参数∝,若固定∝,u 值变小,曲线则沿X轴向左平移,u值变大,曲线则沿X轴向右平移,形状均不变,若固定u,∝变小,曲线则陡峭,∝增大,则曲线变平坦4.u=0,∝=1时为标准正态分布记做u →N(0,1)2.简述应用相对数时的注意事项。
3.答:①率和构成比的关系;②计算相对数时分母不宜太小③注意指标的可比性④不能以构成比代替强度相对数;⑤对观察例数不等的几个率不能直接相加求平均数。
3.简述线性回归的用途。
答:①描述两个变量变化的依存关系;②利用回归方程进行预测预报;③用容易测的指标估计不宜测量的指标;④获得精度更高的医学参考值范围;⑤利用回归可以进行统计控制。
五、计算题1.某地抽查144份黄连中小蘖碱含量(mg/100g)得均数为4.38,标准差为0.18,假设数据服从正态分布,问:①95%的黄连样品中小蘖碱含量在什么范围?②估计黄连中小蘖碱含量95%总体均数在什么范围?③有一份黄连样品,小蘖碱含量为4.80,怎样评价?④160份样品中,小蘖碱含量在4.0~4.4之间的样品理论上有多少份?Φ(-2.11)=0.0174,Φ(-2.33)=0.0099,Φ(-0.11)2.用两种方法检查某疾病患者120名,甲法检出率为60%,乙法检出率为50%,甲、乙法一致的检出率为35%,问两种方法何者为优?(列出表格写出假设检验步骤)(15分)一、名词解释1.计数资料:将研究对象按照某种属性或类别进行分组,然后计算每组的观察例数。
2.抽样误差:由于样本的随机性引起的,统计量与参数的差别,或同一总体的相同统计量之间的差别。
3.P值:在假设检验中根据P值的大小,与实现的检验水准a 进行比较的而作出拒绝Ho(p<a)或不拒绝Ho(p≥a)。
4.r:即样本相关系数,用以表示两个随机变量之间的相关关系的密切程度和相关方向的统计指标。
5.参数:反映总体统计学指标特性的数字称为参数。
二、填空题1.描述计量资料集中趋势的指标有_算数均数、几何均数_、_中位数。
2.统计工作的步骤分为_设计、_收集资料、_整理资料、_分析资料。
3.线性相关分为_正相关、负相关_、零相关_三种类型。
4.常用的相对数有_率、_构成比、速率_。
5.标准正态分布的均数等于___0__,标准差等于__1__。
6.用百分位数法计算血汞的95%参考值范围是_P2.5-P97.5。
7.两独立样本率的χ2检验当_T<5且_n>_40时需连续性校正。
8.频数分布的的类型分为_正态分布_和_偏态分布。
三、单项选择题1.比较 20 头河马体重和 20 只小白鼠体重变异程度大小宜采用 AA CV%B S2C RD S2.当自由度v→∞时,横轴上,正态曲线下从0到1.96的面积为 DA 95%B 45%C 97.5%D 47.5% 3.用t检验对直线回归系数进行假设检验,其自由度为 BA n-1B n-2C 2(n-1)D n4.方差分析的目的是 CA 比较均数B 比较标准差C 比较均方D 比较离均差平方和5.某学院抽查两个年级学生HBsAg情况,结果甲:抽查35人,HBsAg(+)4人;乙年级40人,HBsAg(+)8人,该资料应选用的统计方法是 AA 连续性χ2检验B 非连续性校正χ2检验C t检验D 秩和检验6.下列哪一变量服从t分布 DAσμ-x Bσμ-x Cxxσμ- Dxsxμ-7.已知r=1,则一定有 CA b=1B S y=0C S yx=0D 截距=08.完全随机设计的方差分析中,不正确的是 CA ν总=ν处理+ν误差B SS总=SS处理+SS误差C ν处理=N-kD F=MS处理/MS误差9.以下统计量结果错误的是 DA t=-3.15B b=-7.2C r=-0.5D χ2=-3.8510.直方图可用于 BA 2001年5种疾病发病率比较B 10个年龄组患病率比较C 身高和患病率的关系分析D 描述O型血者血红蛋白含量分布四、简答题1.简述标准差的用途。
(5分)答:1.表示数据分布的离散程度2.常用X±S作为计量资料的数字特征,描述的专用符号计算临床上的各种生化,生理指标的参考值的范围4在单纯随机抽样中,是计量资料估计样本量不可缺少的重依据之一 5.可用来计算均数的抽样误差大小2.简述应用相对数时的注意事项。
(5分)答:①率和构成比所说明的问题不同,构成比可以说明某事物内部各组成部分的比重或分布,而率是说明某现象发生的频率或强度的,所以不能以构成比代替率。
②计算相对数时分母不宜太小③注意指标的可比性③可比性指所比较指标,除研究因素外,其他影响因素应基本相同或相近,即在相同条件下进行对比。
通常应注意:1.观察对象同质,研究方法相同,观察时间相等,以及地区、民族、性别、年龄、病情及病程等客观条件均基本一致。
2.某个对研究结果有影响的因素,在各组的内部构成是否相同。
若因混杂因素干扰,使各对比组构成分布不同时,可采用标准化,平衡内部构成不同的影响后,再进行总率的比较。
3.简述线性回归的用途。
(5分)答:①描述两个变量变化的依存关系;②利用回归方程进行预测预报;③用容易测的指标估计不宜测量的指标;④获得精度更高的医学参考值范围;⑤利用回归可以进行统计控制。
五、计算分析题(共 30分)1.假定 5岁男童的体重服从正态分布,平均体重μ=19.5kg,标准差σ=2.3kg。
①95%的5岁男童的体重在什么范围?随机抽取一5岁男童的体重为20.9Kg,怎样评价?(5分)②假设n=100,估计5岁男童的体重总体均数在什么范围?(3分)③体重在14.6 kg到23.9 kg之间的男童的概率为多少?(7分)Φ(-2.13)=0.0166,Φ(-1.91)=0.0281,Φ(-0.61)=0.27092.为探讨MRI无创性测量肺脉舒张压的新途径,分别用MRI 和右心导管两种方法测量12名患者的肺脉舒张压,请回答:①该研究的设计类型是什么?常用的形式有哪些?(7分)答:实验性研究。
常用形式:②根据下面表格的分析结果,写出统计结论。
(写出具体的假设检验的步骤)(8分)。