研究生医学统计学考点总结(精心整理)
《医学统计学》复习重点总结

计量数据比较的统计公式
X 0 t Sx
样本均数与标准值的比较 *配对数据的比较(不做方 差齐性检验 *两样本均数的比较,例数 较小时(做方差齐性检验)
d d t Sd
X1 X 2 t S x1 x2
t检验与可信区间公式小结
X1 X 2 t , SX1X 2
两独立样本均数的t n1 n2 2 检验公式
病变性质
肿瘤
恶性
1.层次不清,结构混乱,难于理解 2.线条过多,不符要求
修改后:
表 10 病变性质 良性肿瘤 恶性肿瘤﹡ 囊肿 瘤样病变 合 计
口腔颌面部不同病变构成情况 例 数 674 558 192 168 1592 构成比(%) 42.34 35.05 12.06 10.55 100.00
﹡包括癌437例,肉瘤101例,果用统计表表达。
统计表类型:
简单表和组合表
统计图: 要求掌握图形选择. 如线图、直条图、直方图、构成图
例: 简单表格式
某地1980年男女HBsAg阳性率的比较 性别 调查例数 男 4234 女 4530 合计 8764 阳性数 303 181 484 阳性率% 7.16 4.00 5.52
第14章基于秩次的统计方法
掌握概念: 1)何为非参数统计? 2) 什么样数据适合采用秩和检验,以及秩和 检验的优缺点。 3)秩和检验有那几种检验方法?
注意:结果(y)数据为等级时,两组比较采 用秩和检验效率高于χ2检验,应首选秩和检验.
表 某病两组疗效的比较 比较组 无效 有效 显效 痊愈 合计 试验组 18( 31.6) 18 (31.6) 15(26.3) 6 (10.5) 57 对照组 21 (46.7) 15( 33.3) 8(17.8) 1( 2.2) 45 Total 39 33 23 7 102
医学统计学知识点汇总(精华)

医学统计学知识点汇总(精华)一.概论1,医学统计学:运用概率论和数理统计学的原理和方法,研究医学领域中随机现象有关数据的搜集、整理、分析和推断,进而阐明其客观规律性的一门应用科学。
2,医学统计学的主要内容:1)统计研究设计调查研究设计和实验研究设计2)医学统计学的基本原理和方法研究设计和数据处理中的基本统计理论和方法。
A:资料的搜集与整理 B:常用统计描述,集中趋势和离散趋势,相对数,相关系数,回归系数,统计表,统计图 C:统计推断,如参数估计和假设检验。
3)医学多元统计方法多元线性回归和逐步回归分析、判别分析、聚类分析、主成分分析、因子分析、logistic回归与Cox回归分析。
3,统计工作步骤:1)设计明确研究目的和研究假说,确定观察对象与观察单位,样本含量和抽样方法,拟定研究方案,预期分析指标,误差控制措施,进度与费用。
2)搜集材料A,搜集材料的原则及时、准确、完整B,统计资料的来源医学领域的统计资料的来源主要有三个方面。
一是统计报表,二是经常性工作记录,三是专题调查或专题实验。
C,资料贮存3)整理资料 a检查核对b设计分组c拟定整理表d归表4)分析资料统计分析包括统计描述和统计推断4,同质(homogeneity):指被研究指标的影响因素相同。
变异(variation):同质基础上的各观察单位间的差异。
变量(variable):收集资料过程中,根据研究目的确定同质观察单位,再对每个观察单位的某项特征进行测量或观察,这种特征称为变量变量值:变量的观察结果或测量值。
变量类型变量值表现实例资料类型数值变量离散型定量测量值,有计量单位产前检查次数计量资料连续型身高分类变量无序二分类对立的两类属性性别(男女)计数资料多分类不相容的多类属性血型(A,B,O,AB)有序多分类类间有程度差异的属性受教育程度(小学,中学,高中,大学…)等级资料5,总体(population)根据研究目的所确定的同质研究对象中所有观察单位某变量值的集合。
医学统计学重点总结

(1) 单个样本均数 H0:μ=μ0t= ν=n-1 (小样本)
(已知样本——均数) H1:μ≠μ0
α=u= 或u= (大样本)(2)配对:H0:μ=μ0
H1:μ≠μ0t= ν=对子数-1
α=
(3) 两独立样本均数H0:μ=μ0t= ν=n1+n2-2
(4)(已知样本——样本) H1:μ≠μ0
9.对任何参数μ和σ的正态分布,都可以通过一个简单的变量变换成标准正态分布,即μ=X-μ
σ
9
标准正态分布
正态分布
面积或概率
-1~1
μ σ
%
~
μ σ
%
·
μ σ
%
10.医学参考值范围(reference value range)传统上称作正常值范围,指正常人的解剖、生理、生化、免疫及组织代谢产物的含量等各种数据的波动范围。习惯上是包含95%的参照总体的范围。
实际工作中标准差 σ往往未知,因而通常用样本标准差S代替σ,求得样本均数 准误估计值S ,计算公式为 S = (当n→无穷,S→σ,S →0)
3 95%的可信区间的计算:x (μ,σ ) 1) σ已知,可信区间= σ
2)σ未知,n为小样本: t 3)σ未知,n为大样本:
T变换
μ变换
N (0,1)
3、t分布曲线的形态变化与自由度v=n-1有关。
2.四格表专用公式(
3对于四格表资料,通常规定为:(1)当n≥40且所有的T ≥ 5时,用检验的基本公式或四格表的专用公式;(2)当n ≥ 40 但有1≤T<5时,用四格表资料的校正公式;(3)当n<40,或T<1时,用四格表资料的Fisher确切 概率法。
4 行×列表资料的χ 检验: 自由度:ν=(行数-1)(列数-1)
研究生医学统计学考点总结

研究生医学统计学考点总结
1.数据概括与描述性统计学:
-数据的类型和测量尺度
-描述性统计学指标,如均值、中位数、标准差和百分位数
-数据的分布,如正态分布、偏态和峰态
-相关性和协方差
-统计图表的绘制与解读,如直方图、散点图和箱线图
2.概率与统计推断:
-概率的基本概念:概率的定义、加法和乘法规则、条件概率和贝叶斯定理
-随机变量与概率分布:离散型和连续性变量、二项分布、正态分布等
-参数估计:点估计和区间估计,如均值和比例的估计
-统计推断:假设检验、P值和置信区间,如两个均值的比较和方差分析
-非参数方法:秩和检验、列联表分析和生存分析
3.实验设计与样本量计算:
-随机对照试验的基本原理与设计
-防治和疫苗试验的设计
-回顾性研究的设计与分析
-配对设计和席德曼秩和检验
-样本量计算与效能分析
4.线性回归与多元统计:
-简单线性回归与多元线性回归的基本概念与应用
-模型诊断与改进:残差分析、多重共线性和非线性关系
-变量选择与交互作用
-逻辑回归模型与生存回归模型
除了以上的主要考点,也有一些其他辅助性质的内容:
-数据的收集与质量控制
-缺失数据的处理方法
-数据转换与处理
-系统评价与荟萃分析的基本原理与方法
总结起来,研究生医学统计学的考点涉及到数据的概括与描述、概率与统计推断、实验设计与样本量计算、线性回归与多元统计等多个方面。
通过学习这些知识,研究生能够更好地理解和运用统计学方法来支持医学研究的设计、分析和解读。
医科大学医学统计学重点知识总结

第一章绪论1、统计学的定义:统计学研究数据的收集、整理、分析的一门学科。
医学统计学:医学统计学是以医学理论为指导,应用概率论与数理统计的有关原理、方法,研究医学资料的搜集、整理、分析和推断的一门科学。
2、医学统计研究三个步骤:研究设计、资料分析、结论3、(必考的)几个概念:(1)同质:性质相同异质:性质不同观察单位间的同质性是进行研究的前提同质是相对的(不同研究中或同一研究中不同观察指标对观察对象的同质性的要求不同)(2)个体变异:同质个体间的差异。
变异的两个方面:不同观察单位(个体)间的差别;同一个体在不同阶段的差别(重复测量)个体变异是普遍存在的;个体变异是有规律的。
注意:由于个体变异的存在,同质个体指标的取值会存在差异!(例:体温波动)(3)总体:按研究目的所确定的同质研究对象的全体。
有限总体:有时间、空间的概念,观察单位有限无限总体:无时间、空间的概念(例:某种治疗措施的效果,就包括接受这种治疗措施的所有病人过去、现在、未来,因而观察单位无限)(4)个体:组成总体的基本单位。
样本:从研究总体中随机抽取具有代表性的部分观察单位随机性的三个体现:抽样随机、分组随机、试验顺序随机(5)随机变量:观察对象个体的特征或测量的结果观察结果在一定范围内以一定的概率分布随机取值的变量,表示随机现象。
在一定条件下,并不总是出现相同结果变量值:个体观察指标具体取值(6)总体参数:总体的统计指标或特征值固有的、不变的,但往往是未知的(7)样本统计量:由样本所算出的统计指标或特征值已知的,且随着试验的不同而不同,但分布是有规律的(8)样本含量:样本中包含个体的数量(9)频率f=m/n,f的值随n的增大接近常数p,概率P(A)=p即:频率为一变量,是样本统计量;概率为常数,是一总体参数小概率事件:概率小于等于0.05小概率原理:小概率事件在一次试验中是不会发生的(10)抽样误差:两个表现:样本统计量与总体参数间的差别;不同样本统计量间的差别两个原因:个体变异;抽样过程抽样误差不可避免,但是有规律。
硕士医学统计学知识点总结汇总

硕士医学统计学知识点总结汇总第2章统计描述1. 对定量资料进行统计描述时,如何选择适宜的指标?定量资料统计描述常用的统计指标及其适用场合描述内容指标意义适用场合平均水平均数个体的平均值对称分布几何均数平均倍数取对数后对称分布中位数位次居中的观察值①非对称分布;②半定量资料;③末端开口资料;④分布不明众数频数最多的观察值不拘分布形式,概略分析调和均数基于倒数变换的平均值正偏峰分布资料变异全距观察值取值范围不拘分布形式,概略分析度标准差(方差)观察值平均离开均数的程度对称分布,特别是正态分布资料四分位数间距居中半数观察值的全距①非对称分布;②半定量资料;③末端开口资料;④分布不明变异系数标准差与均数的相对比①不同量纲的变量间比较;②量纲相同但数量级相差悬殊的变量间比较定性资料:阳性事件的概率,概率分布,强度和相对比。
2. 应用相对数时应注意哪些问题?答:(1)防止概念混淆相对数的计算是两部分观察结果的比值,根据这两部分观察结果的特点,就可以判断所计算的相对数属于前述何种指标。
(2)计算相对数时分母不宜过小样本量较小时以直接报告绝对数为宜。
(3)观察单位数不等的几个相对数,不能直接相加求其平均水平。
(4)相对数间的比较须注意可比性,有时需分组讨论或计算标准化率。
3. 常用统计图有哪些?分别适用于什么分析目的?常用统计图的适用资料及实施方法图形适用资料实施方法条图组间数量对比用直条高度表示数量大小直方图定量资料的分布用直条的面积表示各组段的频数或频率百分条图构成比用直条分段的长度表示全体中各部分的构成比饼图构成比用圆饼的扇形面积表示全体中各部分的构成比线图定量资料数值变动线条位于横、纵坐标均为算术尺度的坐标系半对数线定量资料发展速度线条位于算术尺度为横坐标和对数尺度为纵坐标的坐标系图散点图双变量间的关联点的密集程度和形成的趋势,表示两现象间的相关关系箱式图定量资料取值范围用箱体、线条标志四分位数间距及中位数、全距的位置茎叶图定量资料的分布用茎表示组段的设置情形,叶片为个体值,叶长为频数第3章概率分布1. 服从二项分布及Poisson分布的条件分别是什么?二项分布成立的条件:①每次试验只能是互斥的两个结果之一;②每次试验的条件不变;③各次试验独立。
(完整版)医学统计学复习要点

(完整版)医学统计学复习要点第⼀章绪论1、数据/资料的分类:①、计量资料,⼜称定量资料或者数值变量;为观测每个观察单位某项治疗的⼤⼩⽽获得的资料。
②、计数资料,⼜称定性资料或者⽆序分类变量;为将观察单位按照某种属性或者类别分组计数,分组汇总各组观察单位数后⽽得到的资料。
③、等级资料,⼜称半定量资料或者有序分类变量。
为将观察单位按某种属性的不同程度分成等级后分组计数,分类汇总各组观察单位数后⽽得到的资料。
2、统计学常⽤基本概念:①、统计学(statistics)是关于数据的科学与艺术,包括设计、搜集、整理、分析和表达等步骤,从数据中提炼新的有科学价值的信息。
②、总体(population)指的是根据研究⽬的⽽确定的同质观察单位的全体。
③、医学统计学(medical statistics):⽤统计学的原理和⽅法处理医学资料中的同质性和变异性的科学和艺术,通过⼀定数量的观察、对⽐、分析,揭⽰那些困惑费解的医学问题背后的规律性。
④、样本(sample):指的是从总体中随机抽取的部分观察单位。
⑤、变量(variable):对观察单位某项特征进⾏测量或者观察,这种特征称为变量。
⑥、频率(frequency):指的是样本的实际发⽣率。
⑦、概率(probability):指的是随机事件发⽣的可能性⼤⼩。
⽤⼤写的P表⽰。
3、统计⼯作的基本步骤:①、统计设计:包括对资料的收集、整理和分析全过程的设想与安排;②、收集资料:采取措施取得准确可靠的原始数据;③、整理资料:将原始数据净化、系统化和条理化;④、分析资料:包括统计描述和统计推断两个⽅⾯。
第⼆章计量资料的统计描述1. 频数表的编制⽅法,频数分布的类型及频数表的⽤途①、求极差(range):也称全距,即最⼤值和最⼩值之差,记作R;②、确定组段数和组距,组段数通常取10-15组;③、根据组距写出组段,每个组段的下限为L,上限为U,变量X值得归组统⼀定为L≤X<U,最后⼀组包括下限。
医学统计知识点整理

医学统计学知识点整理第一节统计学中基本概念一、同质与变异同质:统计研究中,给观察单位规定一些相同的因素情况。
如儿童的生长发育,规定同性别、同年龄、健康的儿童即为同质的儿童。
变异:同质的基础上个体间的差异。
“同质”是相对的,是客观事物在特定条件下的相对一致性,而“变异”则是绝对的μ.δ.πX.S.p1.2.变量:确定总体之后,研究者应对每个观察单位的某项特征进行观察或测量,这种特征能表现观察单位的变异性,称为变量。
一、数值变量资料又称为计量资料、定量资料:观测每个观察单位某项指标的大小而获得的资料。
表现为数值大小,带有度、量、衡单位。
如身高(cm)、体重(kg)、血红蛋白(g)等。
二、无序分类变量资料又称为定性资料或计数资料:将观察对象按观察对象的某种类别或属性进行分组计数,分组汇总各组观察单位后得到的资料。
分类:二分类:+ -;有效,无效;多分类:ABO血型系统特点:没有度量衡单位,多为间断性资料【例题单选】某地A、B、O、AB血型人数分布的数据资料是( )A.定量资料B.计量资料C.计数资料D.等级资料分组统计描述:是利用统计指标、统计表和统计图相结合来描述样本资料的数量特征及分布规律。
统计推断:是使用样本信息来推断总体特征。
统计推断包括区间估计和假设检验。
第四节统计表与统计图★一、统计表统计表的基本结构与要求标题:高度概括表的主要内容,时间、地点、研究内容,位于表的上方,居中摆放,左侧加表的序号。
标目:横标目和纵标目。
线条:通常采用三线表和四线表的形式。
没有竖线或斜线。
数字:表内数字一律用阿拉伯数字。
同一指标,小数位数应一致,位次对齐。
无数字用“—”表示。
暂缺用“…”表示。
“0”为确切值。
备注:位于表的下面,通常是对表内数字的注解和说明,必要时可以用“*”等标出。
一张统计表的备注不宜太多。
二、制表原则1.(7理分布。
【例题填空】描述某地十年间结核病死亡率的变化趋势宜绘制_________图。
硕士医学统计学知识点总结汇总

第2章统计描述1. 对定量资料进行统计描述时,如何选择适宜的指标?定量资料统计描述常用的统计指标及其适用场合描述内容指标意义适用场合平均水平均数个体的平均值对称分布几何均数平均倍数取对数后对称分布中位数位次居中的观察值①非对称分布;②半定量资料;③末端开口资料;④分布不明众数频数最多的观察值不拘分布形式,概略分析调和均数基于倒数变换的平均值正偏峰分布资料变异度全距观察值取值范围不拘分布形式,概略分析标准差(方差)观察值平均离开均数的程度对称分布,特别是正态分布资料四分位数间距居中半数观察值的全距①非对称分布;②半定量资料;③末端开口资料;④分布不明变异系数标准差与均数的相对比①不同量纲的变量间比较;②量纲相同但数量级相差悬殊的变量间比较定性资料:阳性事件的概率,概率分布,强度和相对比。
2. 应用相对数时应注意哪些问题?答:(1)防止概念混淆相对数的计算是两部分观察结果的比值,根据这两部分观察结果的特点,就可以判断所计算的相对数属于前述何种指标。
(2)计算相对数时分母不宜过小样本量较小时以直接报告绝对数为宜。
(3)观察单位数不等的几个相对数,不能直接相加求其平均水平。
(4)相对数间的比较须注意可比性,有时需分组讨论或计算标准化率。
3. 常用统计图有哪些?分别适用于什么分析目的?常用统计图的适用资料及实施方法图形适用资料实施方法条图组间数量对比用直条高度表示数量大小直方图定量资料的分布用直条的面积表示各组段的频数或频率百分条图构成比用直条分段的长度表示全体中各部分的构成比饼图构成比用圆饼的扇形面积表示全体中各部分的构成比线图定量资料数值变动线条位于横、纵坐标均为算术尺度的坐标系半对数线图定量资料发展速度线条位于算术尺度为横坐标和对数尺度为纵坐标的坐标系散点图双变量间的关联点的密集程度和形成的趋势,表示两现象间的相关关系箱式图定量资料取值范围用箱体、线条标志四分位数间距及中位数、全距的位置茎叶图定量资料的分布用茎表示组段的设置情形,叶片为个体值,叶长为频数第3章概率分布1. 服从二项分布及Poisson分布的条件分别是什么?二项分布成立的条件:①每次试验只能是互斥的两个结果之一;②每次试验的条件不变;③各次试验独立。
医学统计学重点整理汇总

医学统计学重点第一章绪论1.基本概念:总体:根据研究目的确定的性质相同或相近的研究对象的某个变量值的全体。
样本:从总体中随机抽取部分个体的某个变量值的集合。
总体参数:刻画总体特征的指标,简称参数。
是固定不变的常数,一般未知。
统计量:刻画样本特征的指标,由样本观察值计算得到,不包含任何未知参数。
抽样误差:由随机抽样造成的样本统计量与相应的总体参数之间的差异。
频率:若事件A在n次独立重复试验中发生了m次,则称m为频数。
称m/n为事件A在n次试验中出现的频率或相对频率。
概率:频率所稳定的常数称为概率。
统计描述:选用合适统计指标(样本统计量)、统计图、统计表对数据的数量特征及其分布规律进行刻画和描述。
统计推断:包括参数估计和假设检验。
用样本统计指标(统计量)来推断总体相应指标(参数),称为参数估计。
用样本差别或样本与总体差别推断总体之间是否可能存在差别,称为假设检验。
2.样本特点:足够的样本含量、可靠性、代表性。
3.资料类型:(1)定量资料:又称计量资料、数值变量或尺度资料。
是对观察对象测量指标的数值大小所得的资料,观察指标是定量的,表现为数值大小。
每个个体都能观察到一个观察指标的数值,有度量衡单位。
(2)分类资料:包括无序分类资料(计数资料)和有序分类资料(等级资料)①计数资料:是将观察单位按某种属性或类别分组,清点各组观察单位的个数(频数),由各分组标志及其频数构成。
包括二分类资料和多分类资料。
二分类:将观察对象按两种对立的属性分类,两类间相互对立,互不相容。
多分类:将观察对象按多种互斥的属性分类②等级资料:将观察单位按某种属性的不同程度、档次或等级顺序分组,清点各组观察单位的个数所得的资料。
4.统计工作基本步骤:统计设计、资料收集、资料整理、统计分析。
第二章实验研究的三要素1.实验设计三要素:被试因素、受试对象、实验效应2.误差分类:随机误差(抽样误差、随机测量误差)、系统误差、过失误差。
3.实验设计的三个基本原则:对照原则、随机化分组原则、重复原则。
(完整版)医学统计学重点总结

1.简述总体和样本的定义,并且举例说明。
总体是研究目的确定的所有同质观察单位的全体。
样品是从研究总体中抽取部分有代表性的观察单位。
2.简述参数和统计量的定义,并且举例说明。
描述总体特征的指标称为参数,描述样本特征的指标称为统计量。
3.变量的类型有哪几种?举例说明各种类型变量有什么特点。
①定量数据:计量资料;定量的观测值是定量的,其特点是能够用数值的大小衡量其水平的高低。
②定性数据:计数资料;变量的观测值是定性的,表现为互不相容的类别或属性。
③有序数据:半定量数据/等级资料;变量的观测值是定性的,但各类别(属性)有程度或顺序上的差异。
4.请举例说明一种类型的变量如何变换为另一种类型的变量。
定量数据>有序数据>定性数据--------------->5.请简述什么是小概率事件?概率是描述事件发生可能性大小的度量,P 0.05事件称为小概率事件。
≤6.举例说明什么是配对设计。
配对设计是将受试对象按某些重要特征相近的原则配成对子,每对中的两个个体随机地给予两种处理。
①同源配对:同一受试对象或同一标本的两个部分,随机分配接受两种不同处理;②异源配对:为消除混杂因素的影响,将两个同质受试对象配对分别接受两种处理。
7.非参数假设检验适合什么类型数据进行分析?①总体分布类型未知或非正态分布数据;②定量或半定量数据;③数据两端无确定的数值。
8.简述P 25 P 50 P 75的统计学意义。
(条件:明显偏态且不能转化为正态或近似对称;一端或两端无确定数值;分布情况未知)用来描述资料的观测值序列在某百分位置的水平,四分位数间距可以作为说明个体差异的指标(说明个体在不同位置的变异情况)。
9.直条图、直方图、圆饼图的使用条件是什么?直条图:各自独立的统计指标的数值大小和他们之间的对比;直方图:连续变量频数分布情况;圆饼图:全体中各部分所占的比例。
10.统计分析包括哪两个方面的内容?为什么要进行统计推断?统计描述和统计分析;统计描述用来描述及总结一组数据的重要特征,其目的是使实验或观察得到的数据表达清楚并便于分析。
医学统计学知识点

医学统计学知识点1.数据类型:医学研究中使用的数据包括定类数据和定量数据。
定类数据是非数值型的数据,例如性别、种族等;定量数据是数值型的数据,例如年龄、体重等。
了解数据类型是分析数据的第一步。
2.数据收集:医学研究中的数据可以通过不同的方式收集,例如问卷调查、实验研究、观察等。
在数据收集过程中,需要注意样本的选择、数据的完整性和准确性。
3.描述统计学:描述统计学包括对数据的整体特征进行描述和总结。
常用的描述统计学方法包括中心趋势度量(例如均值、中位数、众数)、离散程度度量(例如标准差、方差)和数据分布描述等。
4.推断统计学:推断统计学是从样本数据推断总体特征的一种方法。
通过推断统计学,可以根据样本数据的统计量(例如样本均值、样本比例)来推断总体参数的区间估计或假设检验。
5.假设检验:假设检验是根据样本数据对总体参数提出假设,并通过计算概率值来判断是否接受或拒绝该假设。
常用的假设检验方法包括t检验、卡方检验、方差分析等。
6.相关分析:相关分析用于研究两个或多个变量之间的关系。
常见的相关分析方法有皮尔逊相关系数、斯皮尔曼相关系数等。
相关分析可以帮助研究者了解变量之间的线性关系和方向。
7. 回归分析:回归分析用于研究因变量与自变量之间的关系,并可用于预测因变量的数值。
常用的回归分析方法有简单线性回归分析、多元线性回归分析和 logistic 回归分析等。
8. 生存分析:生存分析用于研究时间相关的数据,例如疾病患者的生存时间或事件发生的时间。
生存分析方法包括 Kaplan-Meier 曲线、Cox 比例风险模型等。
9.双盲试验和随机分组:在医学研究中,双盲试验和随机分组是常用的研究设计方法。
双盲试验是指研究中既不知道接受治疗的病人,也不知道给予治疗的医生;随机分组是指将研究对象随机分配到不同的治疗组和对照组。
10.统计软件:为了进行医学统计分析,研究者可以使用专业的统计软件,例如SPSS、SAS、R等。
(完整版)医学统计学知识点汇总

医学统计学总结绪论1、随机现象:在同一条件下进行试验,一次试验结果不能确定,而在一定数量的重复试验之后呈现统计规律的现象。
2、同质:统计学中对研究指标影响较大的,可以控制的主要因素。
3、变异:同质基础上各观察单位某变量值的差异。
数值变量:变量值是定量的,由此而构成的资料称为数值变量资料或计量资料,其数值是连续性的,称之为连续型变量。
变量无序分类变量:所分类别或属性之间无顺序和程度上的差异分类变量有序分类变量:有顺序和程度上的差异4、总体:根据研究目的确定的同质研究对象中所有观察单位某变量值的集合。
可以分为有限总体和无限总体。
5、样本:是按随机化原则从同质总体中随机抽取的部分观察单位某变量值的集合。
样本代表性的前提:同质总体,足够的观察单位数,随机抽样。
统计学中,描述样本特征的指标称为统计量,描述总体特征的指标称为参数。
6、概率:描述随机事件发生的可能性大小的一个度量。
若P(A)=1,则称A为必然事件;若P(A)=0,则称A为不可能事件;随机事件A的概率为0<P<1.小概率事件:若随机事件A的概率P≤α,则称随机事件A为小概率事件,其统计学意义为:小概率事件在一次随机试验中认为是不可能发生的。
统计描述1、频数分布有两个重要的特征:集中趋势和离散程度。
频数分布有对称分布和偏态分布之分。
后者是指频数分布不对称,集中趋势偏向一侧,如偏向数值小的一侧为正偏态分布,如偏向数值大的一侧为负偏态分布。
2、常用的集中趋势的描述指标有:均数,几何均数,中位数等。
x均数:适用于正态或近似正态的分布的数值变量资料。
样本均数用表示,总体均数用μ表示。
几何均数:适用于等比级数资料和对数呈正态分布的资料。
注意观察值中不能有零,一组观察值中不能同时有正值和负值。
中位数:适用于偏态分布资料以及频数分布的一端或两端无确切数据的资料。
3、常用的离散程度的描述指标有:全距,四分位数间距,方差,标准差,变异系数。
全距:任何资料,一组中最大值与最小值的差。
(完整版)医学统计学知识点梳理

医学统计学知识点梳理医学统计学:?是用统计学原理和方法研究生物医学问题的一门学科。
他包括了研究设计、数据收集、整理、分析以及分析结果的正确解释和表达。
统计描述:用统计指标、统计图表对资料的数量特征及分布规律进行客观的描述和表达。
统计推断:在一定的置信度和概率保证下,用样本信息推断总体特征:①参数估计:用样本的指标去推断总体相应的指标②假设检验:由样本的差异推断总体之间是否可能存在的差异同质:一个总体中有许多个体,他们之所以共同成为人们研究的对象,必定存在共性,我们说一些个体处于同一总体,就是指他们大同小异,具有同质性。
总体(population)是根据研究目的确定的同质的观察单位的全体,更确切的说,是同质的所有观察单位某种观察值(变量值)的集合。
总体可分为有限总体和无限总体。
总体中的所有单位都能够标识者为有限总体,反之为无限总体。
样本:从总体中随机抽取部分观察单位,其测量结果的集合称为样本(sample)。
样本应具有代表性。
所谓有代表性的样本,是指用随机抽样方法获得的样本。
随机抽样:随机抽样(random sampling)是指按照随机化的原则(总体中每一个观察单位都有同等的机会被选入到样本中),从总体中抽取部分观察单位的过程。
随机抽样是样本具有代表性的保证。
变异:在自然状态下,个体间测量结果的差异称为变异(variation)。
变异是生物医学研究领域普遍存在的现象。
严格的说,在自然状态下,任何两个患者或研究群体间都存在差异,其表现为各种生理测量值的参差不齐。
(1)计量资料:对每个观察单位用定量的方法测定某项指标量的大小,所得的资料称为计量资料(measurement data)。
计量资料亦称定量资料、测量资料。
.其变量值是定量的,表现为数值大小,一般有度量衡单位。
(2)计数资料:将观察单位按某种属性或类别分组,所得的观察单位数称为计数资料(count data)。
计数资料亦称定性资料或分类资料。
研究生医学统计学考点总结(精心整理)

2. 频数分布所提供的信息 频数分布图用以表示数据的分布规律。 观察有无可疑值。 考察分布的类型。 对称分布
非对称分布 ( 偏态分布 )
? 左偏态 ( 负偏态 ) :指分布的长尾在峰的左侧。
? 右偏态 ( 正偏态 ) :指分布的长尾在峰的右侧。
考察分布的特征
集中位置 (Central Tendency) :描述指标有平均数(算术均数
数常用于: 比较度量衡单位不同的两组或多组资料的变异度
s
CV
100%
X
比较均数相差悬殊的两组或多组资料的变异度
5. 变异度的正确应用: 极差不稳定,不灵敏 标准差的基本内容是离均差, 它显示一组变量值与其均数的间距, 故标准
差直接地、总结地、平均地描述了变量值的离散程度。 在同质的前提下, 标准差大表示变量值的离散程度大, 即变量值的分布分 散、不整齐、波动较大;反之,标准差小表示变量值的离散程度小,即变 量值的分布集中、整齐、波动较小。 变异系数派生于标准差, 其应用价值在于排除了平均水平的影响, 并消除 了单位。 6. 总结: 每个观察指标均有其特定的变异规律; 描述变异:
t 分布为一簇单峰分布曲线,高峰在 0 的位置上,说明从正态总体中随机
抽样所得样本计算出的 t 值接近 0 的可能性较大。
t 分布以 0 为中心,左右对称。
分布的高峰位置比 u 分布低,尾部高。
t 分布与自由度 有关,自由度越小, t 分布的峰越低,而两侧尾部翘得
越高;自由度逐渐增大时, t 分布逐渐逼近标准正态分布;当自由度为无
8. 小概率事件和小概率原理:
小概率事件:医学研究中,将概率小于等于 0.05 或 0.01 的事件称为小概率事
件。
医学统计学_总结_重点_笔记_复习资料[精选]
![医学统计学_总结_重点_笔记_复习资料[精选]](https://img.taocdn.com/s3/m/0b8ac7e80408763231126edb6f1aff00bed57032.png)
医学统计学_总结_重点_笔记_复习资料[精选]第一篇:医学统计学_总结_重点_笔记_复习资料[精选]第一章2选1 总体:总体(population)是根据研究目的确定的同质观察单位(研究对象)的全体,实际上是某一变量值的集合。
可分为有限总体和无限总体。
总体中的所有单位都能够标识者为有限总体,反之为无限总体。
总体population根据研究目的而确定的同质观察单位的全体。
样本:从总体中随机抽取部分观察单位,其测量结果的集合称为样本(sample)。
样本应具有代表性。
所谓有代表性的样本,是指用随机抽样方法获得的样本。
样本sample从总体中随机抽得的部分观察单位,其实测值的集合。
3选1 小概率事件:我们把概率很接近于0(即在大量重复试验中出现的频率非常低)的事件称为小概率事件。
P值:P 值即概率,反映某一事件发生的可能性大小。
统计学根据显著性检验方法所得到的P 值反应结果真实程度,一般以P ≤ 0.05 认为有统计学意义,P ≤0.01 认为有高度统计学意义,其含义是样本间的差异由抽样误差所致的概率等于或小于0.05 或0.01。
P值是:1)一种概率,一种在原假设为真的前提下出现观察样本以及更极端情况的概率。
2)拒绝原假设的最小显著性水平。
3)观察到的(实例的)显著性水平。
4)表示对原假设的支持程度,是用于确定是否应该拒绝原假设的另一种方法。
小概率原理:一个事件如果发生的概率很小的话,那么可认为它在一次实际实验中是不会发生的,数学上称之小概率原理,也称为小概率的实际不可能性原理。
统计学中,一般认为等于或小于0.05或0.01的概率为小概率。
资料的类型(3选1)(1)计量资料:对每个观察单位用定量的方法测定某项指标量的大小,所得的资料称为计量资料(measurement data)。
计量资料亦称定量资料、测量资料。
.其变量值是定量的,表现为数值大小,一般有度量衡单位。
如某一患者的身高(cm)、体重(kg)、红细胞计数(10/L)、脉搏(次/分)、血压(KPa)等。
医学统计学考试重点整理知识讲解

医学统计学考试重点整理一、基本概念1.总体与样本总体:所有同质观察单位某种观察值(即变量值)的全体样本:是总体中抽取部分观察单位的观察值的集合2.普查与抽样调查普查:就是全面调查,即调查目标总体中全部观察对象抽样调查:是一种非全面调查,即从总体中抽取一定数量的观察单位组成样本,对样本进行调查3.参数与统计量参数:总体的某些数值特征统计量:根据样本算得的某些数值特征4.Ⅰ型与Ⅱ型错误假设检验的结论真实情况拒绝H0不拒绝H0H0正确Ⅰ型错误(ɑ) 推断正确(1−ɑ)H0不正确推断正确(1−β) Ⅱ型错误(β)Ⅰ型错误(ɑ错误): H0为真时却被拒绝,弃真错误Ⅱ型错误(β错误): H0为假时却被接受,取伪错误5.随机化原则与安慰剂对照随机化原则:是将研究对象随机分配到实验组和对照组,使每个研究对象都有同等机会被分配到各组中去,以平衡两组中已知和未知的混杂因素,从而提高两组的可比性,避免造成偏倚。
(意义: ①是提高组间均衡性的重要设计方法;②避免有意扩大或缩小组间差别导致的偏倚;③各种统计学方法均建立在随机化基础上)安慰剂对照:是一种常用的对照方法。
安慰剂又称伪药物,是一种无药理作用的制剂,不含试验药物的有效成分,但其感观如剂型、大小、颜色、质量、气味及口味等都与试验药物一样,不能被受试对象和研究者所识别。
(安慰剂对照主要用于临床试验,其目的在于控制研究者和受试对象的心理因素导致的偏倚,并提高依从性。
安慰剂对照还可以控制疾病自然进程的影响,显示试验药物的效应)6.误差与标准误(区分率与均数)㈠均数抽样误差:由个体变异产生的、随机抽样引起的样本统计量与总体参数间的差异。
标准误:是指样本均数的标准差,反映抽样误差大小的定量指标,其公式表示为S x =S/√n㈡样本率率的抽样误差:样本率p和总体率π的差异率的标准误:样本率的标准差,公式为σp=√π(1-π)/n7.方差分析方差分析:又称F检验,是通过对数据变异按设计类型的不同,分解成两个或多个样本均数所代表总体均数是否有差别的一种统计学方法。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
t 分布为一簇单峰分布曲线,高峰在 0 的位置上,说明从正态总体中随机
抽样所得样本计算出的 t 值接近 0 的可能性较大。
t 分布以 0 为中心,左右对称。
分布的高峰位置比 u 分布低,尾部高。
t 分布与自由度 有关,自由度越小, t 分布的峰越低,而两侧尾部翘得
越高;自由度逐渐增大时, t 分布逐渐逼近标准正态分布;当自由度为无
在研究工作时,由于总体标准差常常未知,可以利用样本标准差近似估计 4. 标准误的意义:
反映了样本统计量(样本均数,样本率)分布的离散程度,体现了抽样误 差的大小。 标准误越大,说明样本统计量(样本均数,样本率)的离散程度越大,即 用样本统计量来直接估计总体参数越不可靠。 标准误的大小与标准差有关, 在例数 n 一定时,从标准差大的总体中抽样, 标准误较大;而当总体一定时,样本例数越多,标准误越小。说明我们可 以通过增加样本含量来减少抽样误差的大小。
医学统计学
基本概念:
1. 医学统计学 Statistics :医学统计学是以医学理论为指导,应用概率论与数 理统计的有关原理和方法, 研究医学资料的搜集、 整理、分析和推断的一门科学。 2. 同质和异质:具有相同性质的事物称为同质 (homogeneous)。否则称为异质的 或者间杂的 (heterogeneous) 。不同质的个体不能笼统地混在一起分析,同质和 异质是相对的概念。 3. 变异:同质事物之间的差别称为变异 (variation) ,亦称个体变异。变异的两 个方面:
标准差为 n 的正态分布。 X n 从均数为 μ,标准差为 σ的任意总体中随机抽样,当样本含量足够大时,
样本均数近似服从均数为 μ ,标准差为
n 的正态分布。
3. 标准误 (standard error) :用样本统计量的标准差来反映抽样误差的大小,
又称标准误。
s
sX
n
其中, σ 为总体标准差, n 为抽样的样本例数
选定足够例数的同质的正常人作为研究对象: 例数过少, 代表性差; 例数 过多增加成本,且易导致正常标准把握不严,影响数据的可靠性 控制检测误差 判断是否分组 ( 性别 , 年龄组 ) 单、双侧问题 (one sided or two sided) 选择百分界值 (90%,95%) 确定可疑范围 3. 参考值范围的估计方法:正态分布法、百分位数法
频数分布
1. 频数表编制步骤 求极差: R=Xmax- Xmin 选定适当的组段数后估计组距:组段数的选取以能反映资料的分布特征为宜,
一般取 8 ~ 12 组 列出组段: 组段的含义 : 包括组段的下限而不含组段的上限 。如:3.2~ 等价
于 [3.2 ,3.5) 。 划记归组获得频数 求频率,完成频数表 :相应的频数除以总数即为频率,各组段的频率总和为
抽样误差
1.概念:由于个体变异的存在,在抽样研究中产生样本统计量和总体参数之间 的差异,称为抽样误差( sampling error )。 抽样误差的表现:样本均数和总体均数间的差别、 样本均数和样本均数间的差别。
2. 中心极限定理 (central limit theorem)
:
从均数为 μ,标准差为 σ的正态总体中随机抽样, 样本均数服从均数为 μ,
categorics 等级变量 : 仅
有顺序,无单位;取值间
的差异是不可度量的
不同分类的互相转化
数值变量→无序分类变量
数值变量→有序分类变量
有序分类变量→无序分类变量
信息量只有减少,不可增加
统计描述指标,呈现方式可分为两种 统计图:直观,但精确度稍差 统计报表:能尽量详细,精确,但不够直观
统计推断:从样本信息外推到总体,以最终获得对所感兴趣问题的解答 参数估计:样本→所在总体特征 假设检验:该指标可能的影响因素分析
差为单位 ) 。
3. 标准正态分布:
标准正态分布 (standard normal distribution)
是均数为 0,标准差为 1
的正态分布。记为 N(0,1) 。标准正态分布是一条曲线。
概率密度函数为: (u) 1 (e- u2 2
∞< u <+∞)
2
正态分布转换为标准正态分布:若 X~ N( , 2) ,作变换:u X
数常用于: 比较度量衡单位不同的两组或多组资料的变异度
s
CV
100%
X
比较均数相差悬殊的两组或多组资料的变异度
5. 变异度的正确应用: 极差不稳定,不灵敏 标准差的基本内容是离均差, 它显示一组变量值与其均数的间距, 故标准
差直接地、总结地、平均地描述了变量值的离散程度。 在同质的前提下, 标准差大表示变量值的离散程度大, 即变量值的分布分 散、不整齐、波动较大;反之,标准差小表示变量值的离散程度小,即变 量值的分布集中、整齐、波动较小。 变异系数派生于标准差, 其应用价值在于排除了平均水平的影响, 并消除 了单位。 6. 总结: 每个观察指标均有其特定的变异规律; 描述变异:
差 (Standard Deviation) 、 变 异 系 数 ( coefficient of
variation ) 。
3. 平均数应用的注意事项: 同质的资料计算平均数才有意义。 均数适用于:单峰对称分布的资料。 几何均数适用于:对数变换后单峰对称的资料。等比资料、滴度资料、对 数正态分布资料。计算几何均数时: 变量值中不能有 0 同一组变量值不能同时存在正、 负值, 若变量值全为负值, 可先将 负号除去,算出结果后再冠以负号 中位数:理论上可用于任何分布资料,常用于描述偏态资料,开口资料, 有不确定值的资料的集中位置。 但当资料适合计算均数或几何均数时, 不 宜用中位数。 中位数和百分位数在样本含量较少时不稳定,越靠两端越不稳定; 中位数在抗极端值的影响方面, 比均数具有较好的稳定性, 但不如均数精 确。 不同质的资料应考虑分别计算平均数。 百分位数:样本含量较少时不宜计算靠近两端的百分位数。 平均数要与变异指标结合使用。
图形描述 统计量描述
平均数:均数、几何均数、中位数和百分位数 变异度:极差、方差、标准差、四分位数间距、变异系数 不同分布的指标,用不同的统计量描述; 用平均数与变异度共同描述。
正态分布
1. 公式:如果随机变量 X 的概率密度函数为f ( X ) 1
< +∞ )
2
则称 X 服从正态分布 , 记作 X~ N( , 2) , 其中,
8. 小概率事件和小概率原理:
小概率事件:医学研究中,将概率小于等于 0.05 或 0.01 的事件称为小概率事
件。
小概率原理:小概率事件并不表示不可能发生,但在某一次试验中,是不会发
生的。
9. 变量的分类:
按照取值的特性:
数值变量 numerical Variable 定量变量:既有顺序的意义,又
(Mean)、几何均数 (Geometric Mean) 、中位数 (Median) 、百分位
数 (Percentile) )。
离散趋势 (Tendency of Dispersion) :描述指标有极差 (Range) 、
四分位数间距 (interquartile range)
、方差 (Variance) 、标准
个体与个体间的差别 同一个体重复测量值间的差别 结果是随机的,不可预测的; 一种或多种不可控因素 ( 已知的或未知的 ) 作用下的综合表现; 个体变异是普遍存在的; 个体变异是有规律的; 没有个体变异,就没有统计学。 4. 总体和样本: 总体 (population) :根据研究目的所确定的同质观察单位的全体;分为有限总 体和无限总体。 个体 (individual) :是构成总体的最基本观察单位。 样本 (sample) :是从总体中按照一定的目的随机抽取的一部分具有代表性的个 体集合。 样本含量 (sample size) :样本中包含的个体个数。 5. 参数和统计量: 总体参数 (parameter) :描述某总体特征的指标,简称参数,一般用希腊 字母表示,如: 、 、 π 。 统计量 (statistic) :描述某样本特征的指标, 一般用拉丁X 字母表示, 如: 、 s、p 。 在总体被确定之后, 总体参数就是一个常数, 是不会变化的, 不管你是否 确切知其大小;而统计量是几乎总是随着样本而变的。
差)。
有些指标本身不服从正态分布,但经过变换之后可以服从正态分布。
正态曲线下的面积分布有一定的规律。
X 轴与正态曲线所夹面积恒等于 1 ,对称区域面积相等。
-1.64 ~ +1.64 内面积为 90%;
-1.96 ~ +1.96 内面积为 95%;
-2.58 ~ +2.58 内面积为 99%。
正态分布曲线下的面积与标准正态分布曲线下的面积对应 ( 以标准正态离
穷大时, t 分布就是标准正态分布。
每一自由度下的 t 分布曲线都有其自身分布规律。 t 界值表 。
可信区间
1. 统计推断 (statistical inference) :是指如何抽样,以及如何用样本性质推
断总体特征,分为参数估计 (parameter estimation) 、假设检验 (hypothesis
testing) 。
2. 参数估计:
点估计( Point Estimation) :用样本统计量作为总体参数的估计。
则 u 服从标准正态分布, u 称为标准正态离差 (standard normal deviation) 4. 正态分布的应用:估计频数分布、质量控制、确定临床参考值范围
参考值范围 :
1. 参考值范围 (reference interval) :是绝大多数正常人的某观察指标所在的范 围,绝大多数: 90%, 95%,99%等等。确定参考值范围的意义:用于判断正常与 异常。 “正常人”的定义:排除了影响所研究的指标的疾病和有关因素的同质的人群。 2. 参考值范围确定的原则: