2016级安徽医科大学医学统计学重点概述

合集下载

医学统计学章节重点归纳

医学统计学章节重点归纳

医学统计学章节重点归纳第一节概述1、主要内容:a、卫生统计学的基本原理和方法(研究设计和数据处理中的统计理论和方法)b、健康统计(医学人口统计、疾病统计和生长发育统计)c、卫生服务统计(卫生资源、医疗卫生服务的需求和利用、医疗保健制度和管理中的统计问题)。

2、卫生统计工作的步骤:设计、资料的搜集、资料的整理、资料的分析3、医学统计资料主要四个方面:统计报表、报告卡(单)、日常医疗卫生工作记录,专题研究或实验。

4、观察单位:是获得数据的最小单位,观察单位是根据研究目的确定的,观察单位可以是人、标本、家庭、国家等。

5、变异:是指客观事物的多样性和不确定性。

6、变量:观察单位的某种特征,称为变量。

a、数值变量(定量变量)b、分类变量(定型变量或字符变量)。

7、总体:根据研究目的所确定的同质研究对象的全体。

确切的说是性质相同的所有观察单位的某种变量的集合。

8、样本:从总体中随机抽取部分观察单位,其变量值就构成样本,通过样本信息来推断总体特征。

9、概率:事件发生的可能性大小的量度,通常以符号P表示。

10、误差:测量值与真值之差或样本指标和总体指标之差。

分为随机误差和系统误差。

第二节数值资料的统计描述1、频数分布就是观察值在所取得范围内分布的情况。

重要特征:集中趋势和离散趋势。

2、频数分布类型:正态分布型频数、正偏态分布型频数,负偏态分布型频数。

3、集中趋势指标:算术平均数(均数)、几何均数、中位数。

指标使用条件计算公式算术平均数适用于正态或近似正态分布的数值变量资料几何均数①对数正态分布,即数据经过对数变换后呈正态分布的资料;②等比级数资料,即观察值之间呈倍数或近似倍数变化的资料。

中位数①非正态分布资料(对数正态分布除外);②频数分布的一端或两端无确切数据的资料③总体分布不清楚的资料。

为奇数 , 为偶数,4、离散型趋势指标:极差、标准差和变异系数指标计算公式主要优缺点极差R=Xmax-Xmin 计算简单,便于理解;只考虑最大值与最小值之差异,不能反映组内其它观察值的变异度,不稳定,受样本量影响很大。

医学统计学重点总结

医学统计学重点总结
小结:
(1) 单个样本均数 H0:μ=μ0t= ν=n-1 (小样本)
(已知样本——均数) H1:μ≠μ0
α=u= 或u= (大样本)(2)配对:H0:μ=μ0
H1:μ≠μ0t= ν=对子数-1
α=
(3) 两独立样本均数H0:μ=μ0t= ν=n1+n2-2
(4)(已知样本——样本) H1:μ≠μ0
9.对任何参数μ和σ的正态分布,都可以通过一个简单的变量变换成标准正态分布,即μ=X-μ
σ
9
标准正态分布
正态分布
面积或概率
-1~1
μ σ
%
~
μ σ
%
·
μ σ
%
10.医学参考值范围(reference value range)传统上称作正常值范围,指正常人的解剖、生理、生化、免疫及组织代谢产物的含量等各种数据的波动范围。习惯上是包含95%的参照总体的范围。
实际工作中标准差 σ往往未知,因而通常用样本标准差S代替σ,求得样本均数 准误估计值S ,计算公式为 S = (当n→无穷,S→σ,S →0)
3 95%的可信区间的计算:x (μ,σ ) 1) σ已知,可信区间= σ
2)σ未知,n为小样本: t 3)σ未知,n为大样本:
T变换
μ变换
N (0,1)
3、t分布曲线的形态变化与自由度v=n-1有关。
2.四格表专用公式(
3对于四格表资料,通常规定为:(1)当n≥40且所有的T ≥ 5时,用检验的基本公式或四格表的专用公式;(2)当n ≥ 40 但有1≤T<5时,用四格表资料的校正公式;(3)当n<40,或T<1时,用四格表资料的Fisher确切 概率法。
4 行×列表资料的χ 检验: 自由度:ν=(行数-1)(列数-1)

医学统计学重点概要

医学统计学重点概要

第一章 绪论总体:根据研究目的确定的同质的所有观察单位某种变量值的集合。

总体包括有限总体和无限总体。

样本:从总体中随机抽取的部分观察单位,其实测值的集合。

获取样本仅仅是手段,通过样本信息来推断总体特性才是研究的目的。

资料的类型计量资料、计数资料和等级资料。

误差包括随机误差、系统误差和非系统误差。

抽样误差:由抽样造成的样本统计量和总体参数之间的差异或者是各个样本统计量之间的差异称为抽样误差。

概率:是描述随机事件发生可能性大小的一个度量。

取值范围0≤P ≤1。

小概率事件:表示在一次实验或观察中该事件发生的可能性很小,可以认为很可能不发生。

P ≤0.05或P ≤0.01。

医学统计学的步骤:设计、收集资料、整理资料和分析资料。

统计分析包括:统计描述和统计推断。

统计推断包括:参数估计和假设检验。

第二章计量资料的统计描述频数表和频数分布图的用途:(1)描述频数分布的类型,以便选择相应的统计指标和分析方法。

对称分布:集中位置在中间,左右两侧頻数基本对称。

偏态分布:正、负偏态分布正偏态集中位置偏向值小一侧,负偏态反之。

(2)描述頻数分布的特征;(3)便于发现资料中的可疑值;(4)便于进一步计算统计指标和进行统计分析。

计量资料集中趋势包括算术均数、几何均数和中位数。

算术均数:直接法(样本小):n x x ∑=;頻数表法(样本大)x =nfx ∑ 几何均数:直接法:)lg (lg 1n x G ∑-=;頻数表法)lg (lg )lg (lg 11n x f fx f G ∑∑∑--==(常用于等比资料或对数正态分布资料)中位数:直接法:n 为奇数2/)1(+=n x M ,n 为偶数2/)(12/2/++=n n x x M ;頻数表法:∑-⨯+=)%50(L M M f n f iL M 。

中位数的应用注意事项:可用于各种分布资料,不受极端值的影响,主要用于(1)偏态分布资料(2)端点无确切值的资料(3)分布不明确的资料。

医科大学医学统计学重点知识总结

医科大学医学统计学重点知识总结

第一章绪论1、统计学的定义:统计学研究数据的收集、整理、分析的一门学科。

医学统计学:医学统计学是以医学理论为指导,应用概率论与数理统计的有关原理、方法,研究医学资料的搜集、整理、分析和推断的一门科学。

2、医学统计研究三个步骤:研究设计、资料分析、结论3、(必考的)几个概念:(1)同质:性质相同异质:性质不同观察单位间的同质性是进行研究的前提同质是相对的(不同研究中或同一研究中不同观察指标对观察对象的同质性的要求不同)(2)个体变异:同质个体间的差异。

变异的两个方面:不同观察单位(个体)间的差别;同一个体在不同阶段的差别(重复测量)个体变异是普遍存在的;个体变异是有规律的。

注意:由于个体变异的存在,同质个体指标的取值会存在差异!(例:体温波动)(3)总体:按研究目的所确定的同质研究对象的全体。

有限总体:有时间、空间的概念,观察单位有限无限总体:无时间、空间的概念(例:某种治疗措施的效果,就包括接受这种治疗措施的所有病人过去、现在、未来,因而观察单位无限)(4)个体:组成总体的基本单位。

样本:从研究总体中随机抽取具有代表性的部分观察单位随机性的三个体现:抽样随机、分组随机、试验顺序随机(5)随机变量:观察对象个体的特征或测量的结果观察结果在一定范围内以一定的概率分布随机取值的变量,表示随机现象。

在一定条件下,并不总是出现相同结果变量值:个体观察指标具体取值(6)总体参数:总体的统计指标或特征值固有的、不变的,但往往是未知的(7)样本统计量:由样本所算出的统计指标或特征值已知的,且随着试验的不同而不同,但分布是有规律的(8)样本含量:样本中包含个体的数量(9)频率f=m/n,f的值随n的增大接近常数p,概率P(A)=p即:频率为一变量,是样本统计量;概率为常数,是一总体参数小概率事件:概率小于等于0.05小概率原理:小概率事件在一次试验中是不会发生的(10)抽样误差:两个表现:样本统计量与总体参数间的差别;不同样本统计量间的差别两个原因:个体变异;抽样过程抽样误差不可避免,但是有规律。

2016级安徽医科大学医学统计学重点概述

2016级安徽医科大学医学统计学重点概述

一、名词解释1.总体population:就是根据研究目的确定的同质观察单位的全体,确切的说,是同质的所有观察单位某种变量值的集合2.样本sample:就是从总体中随机抽取部分观察单位,其实测值的集合3.同质homogeneity:性质相同的事物称为同质,否则称为异质4.系统误差:是指数据搜集和测量过程中由于仪器不准确、标准不规范等人为原因,造成观察结果偏大或偏小的一种误差,是由确定原因造成的误差。

5.随机误差:是由一些非人为的偶然因素,使得结果或大或小,是不确定、不可预知的一种误差,分为随机测量误差和抽样误差6.抽样误差sampling error:由于随机抽样所引起的样本统计量与总体参数之间的差异以及样本统计量之间的差别称为抽样误差7.定量资料:是通过度量衡的方法,测定每一单个观察单位某项研究指标的量的大小得到的资料,也称计量变量或数值变量。

8.定性资料:是将全体观察单位按某种性质或特征分组,然后再分别清点各组观察单位的个数所得到的资料,称定性资料也称计数变量或分类变量。

9.等级资料:是将观察单位按属性的等级分组,清点各组的观察单位数,所得的资料为等级资料,又称有序分类资料。

10.变异系数:又称变异程度,简称变异度,记为CV ,是相对数,用于比较单位不同或均数相差较大的多组资料的变异程度。

公式为CV=s /X ×100%11.小概率事件(原理):若在一次观察或试验中发生的可能性很小或几乎不可能发生,可以看做很可能不发生,则称该事件为小概率事件。

12.率rate :是某现象实际发生的观察单位数与可能发生该现象的观察单位总数之比,用以说明某现象发生的频率或强度13.构成比:说明某一事物内部各组成部分所占的比重或分布,等于某一组成部分的观察单位数/同一事物各组成部分的观察单位总数×100%14.医学参考值范围reference range :指医学领域中特定的“正常”人群(即排除了对所研究指标有影响的疾病和相关因素的特定人群)的解剖、生理、生化指标及组织代谢产物含量等数据的大多数个体(一般为95%)的取值范围15.置信区间:是对这个样本的某个总体参数的区间估计,置信区间展现的是这个参数的真实值有一定概率落在测量结果的周围的程度,给出的是被测量参数的nX σσ=测量值的可信程度16.均数为95%的CI值(置信区间):按一定的概率或可信度(1-a)用一个区间来估计总体参数所在的范围,这个范围称作可信度为1-a的可信区间(CI)又称置信区间,95%的可信区间中的95%是可信度,即,所求的可信区间包含总体参数的可信程度为95%17.标准误standard error:是反映均数抽样误差大小及样本统计量之间离散程度的指标18.检验水准size of test:亦称显著性水准,用α表示,它是预先确定的概率值,即小概率事件的标准,一般情况下α取0.0519.P值:指H0成立,从所规定的总体中随机抽样,所获得等于及大于(或等于及小于)现有样本计算获得的检验统计量值的概率20.Ⅰ类错误typeⅠerror:如果实际情况与H0一致,仅仅因为抽样的原因,使得假设检验的结论为拒绝原本正确的H0,导致推断结论错误,这样的错误称为Ⅰ类错误。

医学统计学重点

医学统计学重点

医学统计学重点说明:本重点仅供参考:不能包括所有选择题考题,名词和简答可信度高,计算题熟练运算过程;同时自己要清楚各种检验方法的基本思想,重点程度与星号数量相关)一、名词解释1、★★★医学统计学:用概率论和数理统计方法研究医学事件的群体特征的一门方法。

2、★总体:根据研究目的确定的同质的研究对象的全体(集合)。

3、样本:从总体中随机抽取的部分研究对象。

4、随机:总体中每个个体有同等的机会进入样本。

5、系统误差:指数据搜集和测量过程中由于仪器不准确、标准不规范等原因,造成观察结果呈倾向性的偏大或偏小,这种误差称为系统误差。

6、随机误差:由于一些非人为的偶然因素使得结果或大或小,是不确定、不可预知的。

7、★★抽样误差:由于抽样原因造成的样本指标与总体指标之间的差,或者是样本指标与样本指标之间的差。

8、准确度(accuracy)或真实性(validity):观察值与真值的接近程度,受系统误差的影响(9、可靠度(reliabiliy)——也称精密度(precision)或重复性(repeatability):重复观察时观察值与其均值的接近程度,受随机误差的影响。

10、★★★小概率事件:一般常将p ≤ 0.05或p ≤ 0.01称为小概率事件,表示某事件发生的可能性很小。

通俗讲一次抽样是不可能发生的事件。

11、★★正态分布定:又称高斯分布,是一条中间高,两头低,左右完全对称地下降,但永远不与横轴相交的钟形曲线。

12、★★医学参考值范围:指绝大多数正常人的解剖、生理、生化、免疫及组织代谢产物的含量等各种数据的波动范围。

最常用的是95%参考值范围。

13、★★标准误:用于反映均数抽样误差大小的指标,也叫样本均数的标准差,它反映了样本均数之间的离散程度。

14、★95%的可信区间:如果从同一总体中重复抽取100个独立样本,将可能有95个可信区间包括总体均数,有5个可信区间未包括总体均数。

二、填空题1、★医学统计学工作基本步骤:统计设计;收集资料.;整理资料;分析资料2、★统计分析包括:统计描述、统计推断3、频数分布的两个重要特征:集中趋势和离散趋势4、正态分布的两个参数:均数;标准差。

医学统计学章节重点归纳

医学统计学章节重点归纳

医学统计学章节重点归纳第一节概述1、主要内容:a、卫生统计学的基本原理和方法(研究设计和数据处理中的统计理论和方法)b、健康统计(医学人口统计、疾病统计和生长发育统计)c、卫生服务统计(卫生资源、医疗卫生服务的需求和利用、医疗保健制度和管理中的统计问题)。

2、卫生统计工作的步骤:设计、资料的搜集、资料的整理、资料的分析3、医学统计资料主要四个方面:统计报表、报告卡(单)、日常医疗卫生工作记录,专题研究或实验。

4、观察单位:是获得数据的最小单位,观察单位是根据研究目的确定的,观察单位可以是人、标本、家庭、国家等。

5、变异:是指客观事物的多样性和不确定性。

6、变量:观察单位的某种特征,称为变量。

a、数值变量(定量变量)b、分类变量(定型变量或字符变量)。

7、总体:根据研究目的所确定的同质研究对象的全体。

确切的说是性质相同的所有观察单位的某种变量的集合。

8、样本:从总体中随机抽取部分观察单位,其变量值就构成样本,通过样本信息来推断总体特征。

9、概率:事件发生的可能性大小的量度,通常以符号P表示。

10、误差:测量值与真值之差或样本指标和总体指标之差。

分为随机误差和系统误差。

第二节数值资料的统计描述1、频数分布就是观察值在所取得范围内分布的情况。

重要特征:集中趋势和离散趋势。

2、频数分布类型:正态分布型频数、正偏态分布型频数,负偏态分布型频数。

3、集中趋势指标:算术平均数(均数)、几何均数、中位数。

指标使用条件计算公式算术平均数适用于正态或近似正态分布的数值变量资料几何均数①对数正态分布,即数据经过对数变换后呈正态分布的资料;②等比级数资料,即观察值之间呈倍数或近似倍数变化的资料。

中位数①非正态分布资料(对数正态分布除外);②频数分布的一端或两端无确切数据的资料③总体分布不清楚的资料。

为奇数 , 为偶数,4、离散型趋势指标:极差、标准差和变异系数指标计算公式主要优缺点极差R=Xmax-Xmin 计算简单,便于理解;只考虑最大值与最小值之差异,不能反映组内其它观察值的变异度,不稳定,受样本量影响很大。

医学统计学重点知识梳理

医学统计学重点知识梳理

重点知识梳理第一章1.统计学(statistics)是研究数据的收集、整理和分析的一门科学,帮助人们分析所占有的信息,达到去伪存真、去粗取精、正确认识世界的一种重要手段。

2.总体(population)与样本(sample)任何统计研究都必须首先确定观察单位亦称个体(individual)总体(population)是根据研究目的确定的同质观察单位的全体,或者说,是同质的所有观察单位某种观察值(变量值)的集合。

总体又分为有限总体(finite population)和无限总体(infinite population),有限总体是指在某特定的时间与空间范围内,同质研究对象的所有观察单位的某变量值的个数为有限个无限总体是抽象的,无时间和空间的限制,观察单位数是无限的3.统计学的研究方法(1)大量观察法对所研究事物的全部或足够数量进行观察的方法。

依据是大数定律(2)综合指标法从数量方面对现象总体特征的概括说明(3)统计推断法在一定的置信度下,根据样本资料的特征对总体特征作出估计和预测的方法第二章1.方差(variance):为了全面考虑观察值的变异情况,克服全距和四分位数间距的缺点,需计算总体中每个观察值X与总体均数的差值(X-μ),称之为离均差。

2.标准差(standard deviation):方差的度量单位是原度量单位的平方,将方差开方后与原数据的度量单位相同。

标准差大,表示观察值的变异度大;反之,标准差小,表示观察值的变异度小。

3.变异系数(coefficient of variation,简记为CV):常用于比较度量单位不同或均数相差悬殊的两组或多组资料的变异度。

第三章1.正态分布(Normal distribution),也称“常态分布”,又名高斯分布。

是一个在数学、物理及工程等领域都非常重要的概率分布,在统计学的许多方面有着重大的影响力。

正态曲线呈钟型,两头低,中间高,左右对称因其曲线呈钟形,因此人们又经常称之为钟形曲线。

医学统计学重点

医学统计学重点

医学统计学重点医学统计学是医学领域中不可或缺的一门学科,它借助数理统计方法研究医学数据和临床试验的结果,为医学决策提供可靠的依据。

以下是医学统计学的几个重点内容。

一、描述统计学描述统计学是医学统计学的基础,主要研究如何分类、整理和描述医学数据。

其主要方法包括测量尺度、频率分布表、中心趋势测量和变异程度测量。

1. 测量尺度在医学统计学中,常见的测量尺度包括名目尺度、有序尺度和数值尺度。

名目尺度适用于无序分类的变量,有序尺度适用于有序分类的变量,而数值尺度适用于具有度量意义的变量。

2. 频率分布表频率分布表用来展示变量的分布情况,主要包括类别、频数和频率等内容。

通过频率分布表,可以直观地了解变量的分布状况。

3. 中心趋势测量中心趋势测量主要包括平均数、中位数和众数。

平均数是所有观测值的总和除以观测值的个数,中位数是将观测值按大小排列后的中间值,众数是出现次数最多的观测值。

4. 变异程度测量变异程度测量用来描述数据的分散程度,主要包括极差、方差和标准差。

极差是最大观测值与最小观测值之间的差异,方差是观测值与均值之间的差异的平方的平均数,标准差是方差的平方根。

二、推断统计学推断统计学是医学统计学的核心内容,主要研究如何通过样本数据推断总体参数,并对假设进行检验。

其中包括参数估计、假设检验和置信区间等方法。

1. 参数估计参数估计是利用样本数据估计总体参数,常用的方法有点估计和区间估计。

点估计是通过样本数据得到一个单一的数值作为总体参数的估计值,区间估计是通过样本数据得到一个范围作为总体参数的估计区间。

2. 假设检验假设检验是用来检验某个陈述是否与观察数据相符的方法。

在医学研究中,研究者常常根据实验数据对研究假设进行检验,以确定是否有统计显著性。

3. 置信区间置信区间是对总体参数的一个范围估计。

置信区间的计算方法与区间估计相似,通过对样本数据进行分析计算得到。

三、生存分析生存分析是医学统计学中的一个重要分支,主要研究疾病患者的生存时间和生存率等问题。

医学统计学知识点

医学统计学知识点

医学统计学知识点医学统计学是一门应用统计学方法和原理,研究医学领域中数据的收集、整理、分析和解释的科学。

它为医学研究、临床实践和公共卫生决策提供了重要的工具和方法。

下面让我们来了解一些关键的医学统计学知识点。

一、数据类型在医学研究中,我们会遇到不同类型的数据。

主要包括:1、定量数据:也称为数值数据,是可以用数字进行测量和记录的数据,如身高、体重、血压等。

定量数据又可分为连续型数据(可以在一定区间内取任意值,如身高)和离散型数据(只能取整数,如白细胞计数)。

2、定性数据:也称分类数据,是按照某种属性或类别进行划分的数据,如性别(男、女)、疾病的诊断(是、否)等。

定性数据又分为无序分类数据(各类别之间没有顺序关系,如血型)和有序分类数据(各类别之间有顺序关系,如疾病的严重程度分为轻、中、重)。

二、数据的收集为了获得准确和有用的数据,我们需要遵循科学的方法进行收集。

1、抽样方法:包括简单随机抽样、系统抽样、分层抽样和整群抽样等。

简单随机抽样是从总体中随机抽取个体;系统抽样是按照一定的间隔抽取样本;分层抽样是将总体按照某些特征分层,然后从各层中抽样;整群抽样则是以群体为单位进行抽样。

2、样本量的确定:样本量的大小取决于研究的目的、总体的变异程度、研究的精度和检验效能等因素。

一般来说,样本量越大,结果的准确性越高,但研究成本也会增加。

三、数据的整理收集到数据后,需要对其进行整理,以便后续的分析。

1、频数分布:将数据按照不同的类别或区间进行分组,计算每组的频数(出现的次数)和频率(频数与总例数的比值),可以了解数据的分布特征。

2、统计图表:常用的图表有直方图、折线图、饼图等,用于直观地展示数据的分布和趋势。

四、描述性统计描述性统计是对数据的基本特征进行概括和描述。

1、集中趋势的描述:包括算术均数、中位数和众数。

算术均数适用于正态分布的数据;中位数适用于偏态分布或分布不明的数据;众数是出现次数最多的数据值。

2、离散程度的描述:常用的指标有标准差、方差和极差。

医学统计学重点整理汇总

医学统计学重点整理汇总

医学统计学重点第一章绪论1.基本概念:总体:根据研究目的确定的性质相同或相近的研究对象的某个变量值的全体。

样本:从总体中随机抽取部分个体的某个变量值的集合。

总体参数:刻画总体特征的指标,简称参数。

是固定不变的常数,一般未知。

统计量:刻画样本特征的指标,由样本观察值计算得到,不包含任何未知参数。

抽样误差:由随机抽样造成的样本统计量与相应的总体参数之间的差异。

频率:若事件A在n次独立重复试验中发生了m次,则称m为频数。

称m/n为事件A在n次试验中出现的频率或相对频率。

概率:频率所稳定的常数称为概率。

统计描述:选用合适统计指标(样本统计量)、统计图、统计表对数据的数量特征及其分布规律进行刻画和描述。

统计推断:包括参数估计和假设检验。

用样本统计指标(统计量)来推断总体相应指标(参数),称为参数估计。

用样本差别或样本与总体差别推断总体之间是否可能存在差别,称为假设检验。

2.样本特点:足够的样本含量、可靠性、代表性。

3.资料类型:(1)定量资料:又称计量资料、数值变量或尺度资料。

是对观察对象测量指标的数值大小所得的资料,观察指标是定量的,表现为数值大小。

每个个体都能观察到一个观察指标的数值,有度量衡单位。

(2)分类资料:包括无序分类资料(计数资料)和有序分类资料(等级资料)①计数资料:是将观察单位按某种属性或类别分组,清点各组观察单位的个数(频数),由各分组标志及其频数构成。

包括二分类资料和多分类资料。

二分类:将观察对象按两种对立的属性分类,两类间相互对立,互不相容。

多分类:将观察对象按多种互斥的属性分类②等级资料:将观察单位按某种属性的不同程度、档次或等级顺序分组,清点各组观察单位的个数所得的资料。

4.统计工作基本步骤:统计设计、资料收集、资料整理、统计分析。

第二章实验研究的三要素1.实验设计三要素:被试因素、受试对象、实验效应2.误差分类:随机误差(抽样误差、随机测量误差)、系统误差、过失误差。

3.实验设计的三个基本原则:对照原则、随机化分组原则、重复原则。

(完整版)医学统计学重点总结

(完整版)医学统计学重点总结

1.简述总体和样本的定义,并且举例说明。

总体是研究目的确定的所有同质观察单位的全体。

样品是从研究总体中抽取部分有代表性的观察单位。

2.简述参数和统计量的定义,并且举例说明。

描述总体特征的指标称为参数,描述样本特征的指标称为统计量。

3.变量的类型有哪几种?举例说明各种类型变量有什么特点。

①定量数据:计量资料;定量的观测值是定量的,其特点是能够用数值的大小衡量其水平的高低。

②定性数据:计数资料;变量的观测值是定性的,表现为互不相容的类别或属性。

③有序数据:半定量数据/等级资料;变量的观测值是定性的,但各类别(属性)有程度或顺序上的差异。

4.请举例说明一种类型的变量如何变换为另一种类型的变量。

定量数据>有序数据>定性数据--------------->5.请简述什么是小概率事件?概率是描述事件发生可能性大小的度量,P 0.05事件称为小概率事件。

≤6.举例说明什么是配对设计。

配对设计是将受试对象按某些重要特征相近的原则配成对子,每对中的两个个体随机地给予两种处理。

①同源配对:同一受试对象或同一标本的两个部分,随机分配接受两种不同处理;②异源配对:为消除混杂因素的影响,将两个同质受试对象配对分别接受两种处理。

7.非参数假设检验适合什么类型数据进行分析?①总体分布类型未知或非正态分布数据;②定量或半定量数据;③数据两端无确定的数值。

8.简述P 25 P 50 P 75的统计学意义。

(条件:明显偏态且不能转化为正态或近似对称;一端或两端无确定数值;分布情况未知)用来描述资料的观测值序列在某百分位置的水平,四分位数间距可以作为说明个体差异的指标(说明个体在不同位置的变异情况)。

9.直条图、直方图、圆饼图的使用条件是什么?直条图:各自独立的统计指标的数值大小和他们之间的对比;直方图:连续变量频数分布情况;圆饼图:全体中各部分所占的比例。

10.统计分析包括哪两个方面的内容?为什么要进行统计推断?统计描述和统计分析;统计描述用来描述及总结一组数据的重要特征,其目的是使实验或观察得到的数据表达清楚并便于分析。

医学统计学 (2)重点知识总结

医学统计学 (2)重点知识总结

医学统计学第一章、绪论1、医学统计学★★★:是以医学理论为指导,应用概率论与数理统计的有关原理和方法,研究医学资料的搜集、整理、分析和推断的一门科学。

2、如何学好、用好医学统计学?①进行科学的医学科研设计;②掌握资料的收集、处理方法(流行病学);③虽不要求掌握统计公式的数理推导,但必须了解其直观的意义、用途和应用条件;④对于不同类型的数据资料选择合理的统计描述和分析方法;⑤对于统计获得的结果进行合理的解读,不能将医学问题归结到纯粹的数量问题。

3、几个基本概念(1)同质和异质:①具有相同性质的事物称为同质的(homogeneous);否则称为异质的或者间杂(heterogeneous)。

②同质和异质是相对的概念。

③不同质的个体不能笼统地混在一起分析(不同年龄组的男童身高)。

(2)变异★①同质事物之间的差别称为变异(Variation);②由于观察单位通常即观察个体,变异亦称为个体变异;③就每个观察单位而言,观察指标的变异是不可预测的,或者说是随机的;④统计学是探讨变异规律并运用其规律性进行深入分析的一门学科,因此,没有变异就没有统计学。

(3)总体、个体和样本★★★总体(Population):根据研究目的所确定的同质观察单位的全体;分为有限总体(确定的时间和空间范围,如20名患者的血红蛋白含量)和无限总体(没有时间和空间的概念,如辅助疗法对肾移植病人生存时间的影响)。

个体(Individual):是构成总体的最基本观察单位。

样本(Sample):是从总体中按照一定的目的随机抽取的一部分个体。

样本含量(Sample Size):样本中包含的个体个数。

即使是有限的总体,实际研究中也不可能逐一筛查;因此,在实际工作中,从总体中随机抽取一定含量的样本,根据样本所提供的信息推断总体的特征,这是统计推断的基础。

(4)随机★随机(Random):是指机会均等,目的是保证样本对总体的代表性、可靠性。

随机抽样:有相同的机会被抽到。

《医学统计学》复习重点总结ppt课件

《医学统计学》复习重点总结ppt课件

例:某医院部分科室院内感染情况
住院 感染 病 人数 人数 呼吸内科 100 10 心血管内科 100 8 泌尿外科 40 6 胸外科 42 2 普外科 100 12 合计 382 38 科 室 感染 感染人数 率% 构成比% 10 .0 26.32 8.0 21.05 15.0 15.78 11.9 13.16 12.0 31.58 9.9 100.00
相对数指标
不同职业各年龄(岁)组冠心病发 病率比较
年 龄 (岁 ) 50 病人数 % 9 25.7 4 23.5
职业
40病人数 % 干部 21 60 工人 12 70
60-70 病人数 % 5 14.3 1 5.9
有人认为:该单位冠心病发病率随年龄增加在下降, 该结论——。
3、统计描述——统计表与统计图
掌握的基本概念 1.统计学研究的对象是什么?有什么特点? 2.总体与样本 3.变量与资料类型 4.参数与统计量 5.什么叫配对设计或完全随机分组设计?
表 100例高血压患者治疗后临床记录
患者 编号 1 2 3 4 。 100 年龄 X1 37 45 43 59 性别 X2 男 女 男 女 治疗组 舒张压 体温 X3 X4 X5 A 11.27 37.5 B 12.53 37.0 A 10.93 36.5 B 14.67 37.8 疗效 X6 显效 有效 有效 无效
频数表表达资料
表 6.1 某地正常成人腋下温度(C)的频数表 腋温 频数( f) 组段 35.61 35.84 36.013 36.224 36.442 36.630 36.815 37.010 37.25 37.4-37.6 1 合计 145 f(%) 0.68 2.75 8.96 16.55 28.96 20.69 10.34 6.89 3.45 0.68 100

完整版医学统计学复习要点

完整版医学统计学复习要点

第一章绪论1、数据 / 资料的分类:①、计量资料,又称定量资料也许数值变量;为观察每个观察单位某项治疗的大小而获取的资料。

②、计数资料,又称定性资料也许无序分类变量;为将观察单位依照某种属性也许种类分组计数,分组汇总各组观察单位数后而获取的资料。

③、等级资料,又称半定量资料也许有序分类变量。

为将观察单位按某种属性的不相同程度分成等级后分组计数,分类汇总各组观察单位数后而获取的资料。

2、统计学常用基本看法:①、统计学( statistics)是关于数据的科学与艺术,包括设计、收集、整理、解析和表达等步骤,从数据中提炼新的有科学价值的信息。

②、整体( population )指的是依照研究目的而确定的同质观察单位的全体。

③、医学统计学( medical statistics):用统计学的原理和方法办理医学资料中的同质性和变异性的科学和艺术,经过一定数量的观察、比较、解析,揭穿那些迷惑难懂的医学问题背后的规律性。

④、样本( sample):指的是从整体中随机抽取的部分观察单位。

⑤、变量( variable):对观察单位某项特点进行测量也许观察,这类特点称为变量。

⑥、频率( frequency ):指的是样本的本质发生率。

⑦、概率( probability):指的是随机事件发生的可能性大小。

用大写的 P 表示。

3、统计工作的基本步骤:①、统计设计:包括对资料的收集、整理和解析全过程的设想④、分组划记并统计频数。

与安排;频数分布的种类包括对称分布和偏态分布;②、收集资料:采用措施获取正确可靠的原始数据;偏态分布主要分为右偏态分布(也称正偏态分布)和左偏态分③、整理资料:将原始数据净化、系统化和条理化;布(也称负偏态分布)。

④、解析资料:包括统计描述和统计推断两个方面。

频数表的用途包括以下几个方面:①、描述频数分布的种类;第二章计量资料的统计描述②、描述频数分布的特点;1.频数表的编制方法,频数分布的种类及频数表的用途③、便于发现一些特大或特小的离群值;①、求极差( range ):也称全距,即最大值和最小值之差,记④、便于进一步做统计解析和办理。

《医学统计学》复习重点总结-PPT文档资料

《医学统计学》复习重点总结-PPT文档资料

X
、 S、 CV ,
表达: x s
几何均数(G)
2) 描述计量数据变量值(x)分布范围
正态分布法
X 1 .96 S (正态或近似正态分布资料)
百分位数法 P2.5%-P97.5%
(偏态分布资料)
作用:①估计变量值分布范围 ②评价个体的指标正常与否
2、计数资料统计描述指标
相对数指标及含义: 率指标:说明事物发生的频率和强度。 构成比:说明各类别所占的构成比。说明事物 的组成和分布情况。 相对比:两事件的相对关系(增长速度)。 掌握: ①相对数指标意义及计算 ②应用时的注意问题
54

B
16.80
37.6
无效
实验与观察研究要求掌握概念
1.实验与观察研究二者的主要区别。 2.实验设计的三原则及意义和作用。 3.实验设计的三要素是什么? 4.观察研究中有那几种概率抽样方法? 5.观察研究有几种研究类型?主要回答那些 问题? 6.何为随机化分组与随机化抽样?
第四、六章 数据特征与统计描述
定性数据的频数表
两组疗效的比较 比较组 (x) 实验组 对照组 痊愈 20 2 疗效(y) 显效 25 5 有效 10 15 无效 2 30 合计 57 52
1.计量资料统计描述指标
1) 描述计量数据(X)几个特征值:
平均水平、变异程度指标 正态或近似正态分 布资料
描述指标:
偏态分布资料
中位数(M) 、四 分位间距(QR) 表达 :M (QR) 等比关系资料
相对数指标
不同职业各年龄(岁)组冠心病发 病率比较
年 龄 (岁 ) 50 病人数 % 9 25.7 4 23.5
职业
40病人数 % 干部 21 60 工人 12 70

医学统计学知识点汇集总结

医学统计学知识点汇集总结

医学统计学知识点汇集总结一、医学统计学概述医学统计学是指运用统计学方法和技术研究医学数据,并分析、解释医学现象的学科。

对于医学研究和临床实践来说,统计学扮演了至关重要的角色,它可以帮助我们从数据中找出规律和关联,了解疾病的发病机制、评估治疗效果、预测疾病的发展趋势等。

医学统计学应用广泛,包括流行病学调查、临床试验、疾病筛查、医疗资源分配等方面。

二、基本统计概念1.总体与样本总体是指研究者希望了解的所有个体或事物的集合,而样本是从总体中抽出的一部分个体或事物。

在医学统计学中,我们往往针对总体的某些特征进行研究,但因为总体过于庞大或难以直接观察,所以需要通过样本来间接推断总体特征。

2.描述统计学与推断统计学描述统计学是通过对样本数据进行整理、汇总和展示,来描述总体的特征。

例如,用均值、标准差、百分比等指标来描述样本的中心趋势、离散程度和分布规律。

推断统计学则是通过对样本数据进行分析和推断,来进行总体参数估计、假设检验和区间估计等操作,从样本的情况推断总体的性质。

3.测量尺度在医学统计学中,常用的测量尺度有四种:名义尺度、序数尺度、区间尺度和比率尺度。

名义尺度用于对个体进行分类,如性别、种族等;序数尺度表达了个体之间的顺序关系,如疾病的分期、疼痛的程度等;区间尺度是指定了单位长度的测量尺度,其间隔是均匀的,但没有绝对的零点,如温度;比率尺度有绝对的零点,可以进行加减乘除运算,如年龄、身高、体重等。

4.受试者特征曲线(ROC曲线)受试者特征曲线(Receiver Operating Characteristic Curve,ROC曲线)常用于评价诊断试验的准确性。

横轴表示假阳性率(1-特异度),纵轴表示真阳性率(灵敏度),曲线下面积(AUC)为对角线以下的面积,用来评价诊断试验在不同判断标准下的表现。

三、数据的搜集与整理1.样本量计算样本量的大小直接关系到研究结果的可靠性和精度。

样本量计算需要根据预期效应大小、显著性水平、统计功效、数据分析方法等因素来确定。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

一、名词解释1.总体population:就是根据研究目的确定的同质观察单位的全体,确切的说,是同质的所有观察单位某种变量值的集合2.样本sample:就是从总体中随机抽取部分观察单位,其实测值的集合3.同质homogeneity:性质相同的事物称为同质,否则称为异质4.系统误差:是指数据搜集和测量过程中由于仪器不准确、标准不规范等人为原因,造成观察结果偏大或偏小的一种误差,是由确定原因造成的误差。

5.随机误差:是由一些非人为的偶然因素,使得结果或大或小,是不确定、不可预知的一种误差,分为随机测量误差和抽样误差6.抽样误差sampling error:由于随机抽样所引起的样本统计量与总体参数之间的差异以及样本统计量之间的差别称为抽样误差7.定量资料:是通过度量衡的方法,测定每一单个观察单位某项研究指标的量的大小得到的资料,也称计量变量或数值变量。

8.定性资料:是将全体观察单位按某种性质或特征分组,然后再分别清点各组观察单位的个数所得到的资料,称定性资料也称计数变量或分类变量。

9.等级资料:是将观察单位按属性的等级分组,清点各组的观察单位数,所得的资料为等级资料,又称有序分类资料。

10.变异系数:又称变异程度,简称变异度,记为CV ,是相对数,用于比较单位不同或均数相差较大的多组资料的变异程度。

公式为CV=s /X ×100%11.小概率事件(原理):若在一次观察或试验中发生的可能性很小或几乎不可能发生,可以看做很可能不发生,则称该事件为小概率事件。

12.率rate :是某现象实际发生的观察单位数与可能发生该现象的观察单位总数之比,用以说明某现象发生的频率或强度13.构成比:说明某一事物内部各组成部分所占的比重或分布,等于某一组成部分的观察单位数/同一事物各组成部分的观察单位总数×100%14.医学参考值范围reference range :指医学领域中特定的“正常”人群(即排除了对所研究指标有影响的疾病和相关因素的特定人群)的解剖、生理、生化指标及组织代谢产物含量等数据的大多数个体(一般为95%)的取值范围15.置信区间:是对这个样本的某个总体参数的区间估计,置信区间展现的是这个参数的真实值有一定概率落在测量结果的周围的程度,给出的是被测量参数的nX σσ=测量值的可信程度16.均数为95%的CI值(置信区间):按一定的概率或可信度(1-a)用一个区间来估计总体参数所在的范围,这个范围称作可信度为1-a的可信区间(CI)又称置信区间,95%的可信区间中的95%是可信度,即,所求的可信区间包含总体参数的可信程度为95%17.标准误standard error:是反映均数抽样误差大小及样本统计量之间离散程度的指标18.检验水准size of test:亦称显著性水准,用α表示,它是预先确定的概率值,即小概率事件的标准,一般情况下α取0.0519.P值:指H0成立,从所规定的总体中随机抽样,所获得等于及大于(或等于及小于)现有样本计算获得的检验统计量值的概率20.Ⅰ类错误typeⅠerror:如果实际情况与H0一致,仅仅因为抽样的原因,使得假设检验的结论为拒绝原本正确的H0,导致推断结论错误,这样的错误称为Ⅰ类错误。

犯Ⅰ类错误的概率用α来控制(假阳性/ 弃真错误)21.第Ⅱ类错误typeⅡerror:如果实际情况与H0不一致,仅仅因为抽样的原因,使得假设检验的结论为不拒绝原本错误的H0,导致推断结论错误,这样的错误称为Ⅱ类错误。

犯Ⅱ类错误的概率用β来控制(假阴性/ 取尾错误)22.检验效能power of a test:为1-β,即当两总体的确有差别(H0不成立),按照事先确定的检验水准α,假设检验能发现该差异(拒绝H0)的能力,1-β也取单尾23.配对设计:配对设计是将受试对象按配对条件配成对子,每对中的个体接受不同的处理,配对设计一般以主要的非实验因素作为配比条件,而不以实验因素作为配比条件24.完全随机设计:又称成组设计,只有单个研究因素,该因素有多个水平,如在实验中安随机化原则将受试对象随机分配到一个研究因素的多个水平中去,然后观察实验效能25.随机区组设计:又称配伍设计,属于两因素方差分析,用于多个样本均属的比较26.析因设计:当两个因素或多个因素之间存在相互影响或交互作用时,可用该设计来进行分析。

该设计不仅可以分析多个因素的独立作用,也可以分析多个因素间的交互作用,是一种高效率的方差分析方法27.卡方检验的基本思想:通过计算实际频数与理论频数的吻合程度来判断所给的处理因素是否有效28.卡方值:实际频数与理论频数的吻合程度,其大小即用卡方值来表示。

29.非参数检验:不依赖于总体分布类型,也不对总体参数进行统计推断的假设检验的方法,称为非参数检验30.线性相关关系:如果具有相关关系的随机变量组成的散点图在直角坐标系中呈直线趋势,就称这两个变量存在线性相关关系31.线性相关方关系:如果两个随机变量中,一个变量有小到大变化时,另一个变量也相应的由小变大(或由大变小),并且呈直线趋势,就称这两个变量存在直线相关关系(老师给的定义)32.相关系数:是说明两变量间线性关系的密切程度和相关方向的一个统计指标,样本的相关系数用r表示,总体的相关系数用ρ表示33.回归系数:在回归方程中表示自变量x对因变量y影响大小的参数,正回归系数表示y随x增大而增大,负回归系数表示y随x增大而减小34.最小二乘法原理:即各实测点到回归直线法的纵向距离的平方和最小,是回归方程可以较好的反映各实测点的分布情况35.双盲:受试对象和实验者都不知道受试对象分在哪一组36.调查设计的四种方法:1)单纯随机抽样:保证总体中每一个个体都有同等的机会被抽出来作为样本的抽样方法2)系统抽样:即先将总体的全部个体按与研究现象无关的特定排序编号,依次每隔若干号码抽取的一个个体组成样本3)分层抽样:先将总体全部个体按某种特征分成若干层,再从每层内随机抽取一定数量的个体合起来组成样本4)整群抽样:先将总体分成若干群体,形成一个抽样框,从中随机抽取几个群体组成样本,对抽中群体的全部个体进行调查二、简答题1.简述频数表的绘制方法(1)找出最大值、最小值和极差:极差=最大值—最小值(2)确定组距、组段、组数:频数表一般设8-15个组段,常用极差的1/10取整作组距,第一组段包括最小值,最后一个组段要包括最大值并写出其下限上限(3)列表划记:把确定的组段序列制成表的形式,得出各组段频数2.简述应用相对数的注意事项(1)计算相对数时分母一般不宜过小。

只有当观察单位足够多时,计算出的相对数才比较稳定,且能正确反映实际情况。

(2)分析时注意构成比和率的区别。

构成比说明事物内部各组成部分所占的比重,即只能说明分布,不能说明某现象发生的频率或强度。

(3)合计率的计算。

对观察单位不等的几个率,不能直接相加求其平均率,而应用合计的数据来计算。

(4)比较相对数时应注意资料的可比性。

除了研究因素以外,其他影响因素应尽可能相近或相同比较才有意义。

(5)对样本率、构成比的比较应作假设检验,不能凭表面数值大小下结论。

3.确定医学参考值范围的原则:(1)制定“正常”人群的入选标准(2)确定样本量的大小,在符合入选标准的人群中随机抽样(3)对样本中的每个个体进行指标测量(4)确定是否要分组制定参考值范围(5)根据该指标X 的背景意义,确定参考值的范围是双侧还是单侧(6)根据样本资料的分布情况确定采用正态分布法还是百多分位数法4.检验假设的基本步骤:(1)建立检验假设,确定检验水准(2)选择检验方法,计算统计量(3)确定P值,做出推断结论5.简述假设检验应用的注意事项(1)假设检验的前提是要有严密的抽样研究设计:应尽量从同质总体中随机抽取,尽量保证组间均衡性,以确保资料具有可比性。

(2)正确选定假设检验方法:资料性质、分布类型、设计类型、样本大小等不同,以及分析的目的不同,适用的假设检验的方法也不同。

(3)正确理解“差异无统计学意义”:H0成立可能性是小概率,也就是说两者差异存在的可能性较大,“差异统计学意义”也不一定具有临床意义。

(4)结论不能绝对化:是否拒绝H0取决于研究对象有无本质差异和抽样误差大小,以及检验水准的高低,而检验水准与实验设计密切相关。

(5)报告结论时应注意:应列出样本计算的检验统计量值,注明采用的是单侧检验还是双侧检验,写出P值。

4.简述假设检验应注意的问题:(1)选择检验方法必须符合资料的适用条件(2)单侧检验和双侧检验的选择(3)正确理解P值得意义(4)结论不能绝对化(5)当假设检验的结果为不拒绝时,应考虑该检验的检验效能,如果检验效能较低,则此时的结论可靠性较差5.方差分析的基本思想:是根据资料的设计类型和研究目的,将全部观察值总的离散程度和自由度分解为相应的几个部分,除了随机误差外,其余每个部分的变异可由某个因素的作用加以解释,如各组均数间的变异可由处理因素的作用加以解释6.在进行双向无序行列表卡方检验时发生偏性的处理方法:P157(1)增大样本量,当样本量增大时理论频数会增大(2)根据专业知识对理论频数较小的行或者列进行合并或者删除(3)改用双向无序行×列表的Fisher确切概率法7.简述秩和检验的优缺点及应用(1)优点:①计算简单便于掌握缺点:①损失信息②应用范围广②检验效率低③收集资料方便(2)应用:①分布型未知②能以严重程度、优劣等级、效果大小和名次先后等等级资料③分布极度偏态④本组内个别变量值偏离过大,远离本组其它变量值⑤方差不齐时⑥筛选或只需获得初步结果。

8.秩和检验编秩次的方法:(1)按差值的绝对值大小编秩次,并根据差值的正负给秩次加上正负号(2)若差值为0,则舍去不计,相应的对子数n随之减少(3)若差值的绝对值相等,则取平均秩次9.在进行双向无序行列表卡方检验时发生偏性的处理方法:P157(4)增大样本量,当样本量增大时理论频数会增大(5)根据专业知识对理论频数较小的行或者列进行合并或者删除(6)改用双向无序行×列表的Fisher确切概率法10.简述应用线性相关分析的注意事项(1)绘散点图了解线性趋势,样本的相关系数接近零时并不意味着两变量间一定无相关性(2)线性相关分析要求两个变量都是随机变量,且仅适用于二元正态分布资料(3)作相关分析时,应该剔除离群值,出现异常点时慎用相关(4)相关要有实际意义,两变量相关并不代表两变量间一定存在内在联系(5)r=0表明无相关或非线性相关(6)分层资料盲目合并易出假象老师的更简洁:(1)进行相关分析前应先绘制散点图,以提示是否有必要进行线性相关分析(2)样本的相关系数为0时,并不意味着两变量一定无相关性(3)一个数值随机变动,而另一个变量的数值却是人为选定的,此时不宜做相关分析(两变量都应是随机的,均符合正态分布)(4)作相关分析时,应该剔除离群值,出现异常点时慎用相关(5)相关分析要有实际意义,相关未必真有内在联系(6)分层资料盲目合并易出现假象11.线性回归分析的适用条件:线性独立正态方差相等(1)因变量Y与自变量X呈线性关系(2)每个个体观察值之间相互独立(3)因变量Y属于正态随机变量(4)在一定范围内,不同的X值所对应的随机变量Y的方差相等12.简述应用线性回归的注意事项(1)进行线性回归分析时,应先绘散点图,提示有直线趋势存在时,可作线性回归分析(2)进行线性回归分析时,一般要求因变量Y是来自正态总体的随机变量,自变量X可以是正态随机变量,也可以是精确测量和严密控制的值(3)进行线性回归分析要有实际意义,不能把毫无关联的两个事物或现象进行进行线性回归分析(4)进行线性回归分析必须进行假设检验,以推断两变量间的线性关系是否存在(5)回归直线不能外延,以自变量取值范围为限13.简述线性回归与相关的区别及联系(1)区别:①资料要求不同:相关:两变量均为随机变量,并服从双变量正态分布回归:Y服从正态分布,X为选定变量②统计意义不同:相关:只反映两变量间相互依存回归:有一个变量推算另一个变量回归关系与原度量衡单位有关,相关关系则无③分析目的不同:相关:两变量间线性关系的密切程度及相关方向回归:用函数公式定量表达因变量随自变量变化的关系(2)联系:①变量间关系的方向一致:对同一资料,其相关系数r与回归系数b的正负号一致②假设检验等价:实际分析中常以r的假设检验代替对b的检验③r与b值可相互换算④用回归解释相关:r2称决定系数,r2越接近1,回归效果越好。

相关文档
最新文档