医学统计学重点精选文档
【方案】医学统计学重点.docx
1.变异:同质事物之间的差别。
2.频数分布的两个特征:集中位置,离散趋势3.数据分布的类型:对称分布和非对称分布。
非对称分布又称偏态分布,包括正偏态和负偏态。
单峰分布,双峰分布,多峰分布。
4.统计描述:用统计表、统计图和统计指标等方法对资料的数量特征与分布规律进行描述。
5.集中位置的描述,集中位置指标又称平均数指标。
有哪些及适用条件?(1)算数平均数:最适用于单峰对称分布资料的平均水平的描述,特别是正态分布资料(2)几何平均数:适用于①等比资料②对数正态分布资料(3)中位数和百分位数:适用于①偏态分布的资料②开口资料③资料分布不明等6.离散趋势的描述(1)全距亦称极差,适用于单峰小样本资料(2)四分位数间距,适用于单峰小样本资料(3)方差和标准差,适用于对称分布尤其是正态分布资料(4)变异系数,常用于①比较度量衡单位不同的两组或多种资料的变异度②比较均数相差悬殊的两组或多组资料的变异度7.常用相对数(1)率,是二分类指标(2)构成比(3)比8.正确应用相对数应注意几个问题:(1)计算相对数的分母不宜过小(2)分析时不能以构成比代替率(3)对观察单位数不等的几个率,不能直接相加求其总率(4)计算率时要注意资料的同质性,对比分析时应注意资料的可比性(5)也有抽样误差,需要假设检验。
9.率的标准法(1)基本思想:采用统一的标准,以消除病情构成不同对治愈率比较的影响,使算得的标准化治愈率有可比性。
(2)目的:控制混杂因素对研究结果的影响。
10.正态分布(1)概念P16(2)标准正态分布,u变换:u=σμ-X,u是标准正态离差,μ是均数,σ是标准差。
u ~N (0,1)(3)正态分布的特征:①是单峰分布,高峰位置在均数X=μ处。
②以均数为中心,左右完全对称。
③取决于两个参数,均数μ和标准差σ。
μ为位置参数,μ越大,则曲线沿横轴向右移动;μ越小,则曲线沿横轴向左移动。
σ为形态参数,表示数据的离散程度,若σ小,则曲线形态“瘦高”;σ大,则曲线形态“矮胖”。
(完整版)医学统计学总结,推荐文档
医学统计学总结(基础部分)一、医学统计学基础(一)基本概念同质与变异总体与样本参数与统计量变量与数据类型概率误差1.由变异(variation)衍生出的术语:变量variable 方差variance方差分析、变异数分析(ANOVA analysis of variance)多反应变量multivariate2.变量:数值变量(顺序变量、连续性变量、定量变量)名义变量(定性变量、无序分类变量)等级变量(有序分类变量)3.资料类型:定量资料/定性资料计数资料/计量资料连续型资料/离散型资料。
4.统计步骤:(1)统计设计;(2)搜集资料;(3)整理资料;(4)分析资料(二)统计描述:1.定量资料的统计描述:平均数(均数,中位数,几何均指标意义应用场合平均数均数平均水平对称分布,特别是正态分布或近似正态分布资料几何均数平均增(减)倍数对数正态分布资料中位数排序后位次居中的观察值水平偏态分布;分布不明;分布末端无确定值变异度极差(全距)个体差异范围说明传染病,食物中毒等的最短、最长潜伏期等四分位数间距个体变异程度偏态分布、分布不明、分布末端无确定值资料的离散程度方差/标准差个体变异程度描述正态分布或近似正态分布资料的离散程度变异系数相对变异程度比较度量衡单位不同或单位相同但均数相差悬殊的多组资料的变异度2.理解:标准差与标准误的区别与联系3.定性资料的统计描述:相对数(率,构成比,比),一些常用率的应用:发病率与患病率死亡率与病死率、因病死亡率等标准化法动态数列4.统计图表:统计图(线图,半对数线图,直条图,直方图,百分条图,圆图,散点图,统计地图,箱式图)图形适用资料做图方法条图组间数量对比用直条高度表示数量大小直方图定量资料的分布用直条的面积表示各组段的频数或频率百分条图构成比用直条分段的长度表示全体中各部分的构成比饼图构成比用圆饼的扇形面积表示全体中各部分的构成比线图定量资料数值变动线条位于横、纵坐标均为算术尺度的坐标系半对数线图定量资料发展速度线条位于算术尺度为横坐标和对数尺度为纵坐标的坐标系散点图双变量间的关联点的密集程度和形成的趋势,表示两现象间的相关关系箱式图定量资料取值范围用箱体、线条标志四分位数间距及中位数、全距的位置茎叶图定量资料的分布用茎表示组段的设置情形,叶片为个体值,叶长为频数(三)统计推断:1.抽样误差、标准误2.t 分布特点:①以0 为中心左右对称的单峰分布;②自由度越小,曲线越扁平,自由度越大曲线越尖峭;③自由度 ∞,t 分布曲线趋近与标准正态分布曲线。
医学统计学重点
医学统计学重点说明:本重点仅供参考:不能包括所有选择题考题,名词和简答可信度高,计算题熟练运算过程;同时自己要清楚各种检验方法的基本思想,重点程度与星号数量相关)一、名词解释1、★★★医学统计学:用概率论和数理统计方法研究医学事件的群体特征的一门方法。
2、★总体:根据研究目的确定的同质的研究对象的全体(集合)。
3、样本:从总体中随机抽取的部分研究对象。
4、随机:总体中每个个体有同等的机会进入样本。
5、系统误差:指数据搜集和测量过程中由于仪器不准确、标准不规范等原因,造成观察结果呈倾向性的偏大或偏小,这种误差称为系统误差。
6、随机误差:由于一些非人为的偶然因素使得结果或大或小,是不确定、不可预知的。
7、★★抽样误差:由于抽样原因造成的样本指标与总体指标之间的差,或者是样本指标与样本指标之间的差。
8、准确度(accuracy)或真实性(validity):观察值与真值的接近程度,受系统误差的影响(9、可靠度(reliabiliy)——也称精密度(precision)或重复性(repeatability):重复观察时观察值与其均值的接近程度,受随机误差的影响。
10、★★★小概率事件:一般常将p ≤ 0.05或p ≤ 0.01称为小概率事件,表示某事件发生的可能性很小。
通俗讲一次抽样是不可能发生的事件。
11、★★正态分布定:又称高斯分布,是一条中间高,两头低,左右完全对称地下降,但永远不与横轴相交的钟形曲线。
12、★★医学参考值范围:指绝大多数正常人的解剖、生理、生化、免疫及组织代谢产物的含量等各种数据的波动范围。
最常用的是95%参考值范围。
13、★★标准误:用于反映均数抽样误差大小的指标,也叫样本均数的标准差,它反映了样本均数之间的离散程度。
14、★95%的可信区间:如果从同一总体中重复抽取100个独立样本,将可能有95个可信区间包括总体均数,有5个可信区间未包括总体均数。
二、填空题1、★医学统计学工作基本步骤:统计设计;收集资料.;整理资料;分析资料2、★统计分析包括:统计描述、统计推断3、频数分布的两个重要特征:集中趋势和离散趋势4、正态分布的两个参数:均数;标准差。
医学统计学复习重点.doc
t检验t检验应用条件:%1小样本(n<100),且总体标准差。
未知%1样本取自正态分布的总体,;%1两样本总体方差相等(。
12二。
22)o1)总之,六个字:正态性、方差齐(1)建立假设、确定检验水准HO: n = pO铅作业工人与正常成年男性血红蛋白平均值相等H1:日走口0铅作业工人与正常成年男性血红蛋白平均值不等a =0.05(2)选定检验方法,计算检验统计量(3)确定P值,作出推断结论一、单样本t检验单样本t检验--- 例4-1(1)正态性检验Analyze-* Descriptive statistics-* Explore-* "皂忒含量" 选入Dependent list 框中—点击plots 复选框并选中Normlity plots with test 一Continue -* OK(2)t检验Analyze —Compare Means—One-samples T Test —"皂贰含量"选入Test Variables 框中Test Value 框中填“8.9” 一Continue — OK二、配对样本t检验配对t检验一一例4-3(1)计算差值dTransform —Compute variable —Target variable (d) = Numeric Express (new・ old)— OK (2)正态性检验(同前)(3)t检验Analyze —Compare Means— Paired-samples T Test —“new "、“old"选入Paired Variables 框中一OK三、独立样本的方差齐性检验与t检验两独立样本t检验——例4-4(1)正态性检验和方差齐性检验Analyze— Descriptive statistics — Explore-* “转化率” 选入Dependent list 框中一“group” 选入Factor框中一点击plots复选框并选中Normlity plots with test 同时选中Spread vs level with levene test 勺untransformed 按钮—Continue — OK(2)t检验Analyze —Compare Means Independent-samples T Test-* u转化率”选入Dependent list 框中一“Group” 选入Grouping Variables 框中,并点击u Define Groups nGroupl对应的框中填“1” Group2对应的框中填“2”方差分析方差分析的应用条件:⑴各样本是相互独立的随机样本。
(完整word版)医学统计学符号,公式,重点
(完整word版)医学统计学符号,公式,重点第⼀章医学统计中的基本概念1、医学统计学是研究医学数据的收集、整理、分析、解释和呈现其结果的⼀门学科。
2、个体:研究的基本观察单位。
3、变量:⽤于观察研究对象的指标。
4、观察值:个体变量的数值。
5、资料:⼜称为数据,由变量的观察值构成。
变异:个体观察值之间具有的差异。
变异和同质是对统计学数据的要求!变异是统计学研究的真正对象!统计学是研究变异规律的科学!同质:个体观察值之间的变异在允许范围内。
异质:个体观察值之间的变异超出允许范围。
⼀、总体、抽样、样本、参数、统计量总体:同质的个体所构成的全体研究对象。
总体同时具有同质和变异两个特点。
有限总体:总体中的个体数量是有限的。
⽆限总体:总体中的个体数量是⽆限的。
样本:从总体中随机抽取的部分个体。
样本量:样本所包含的个体数⽬。
参数:刻画总体特征的指标。
统计量:刻画样本特征的指标。
抽样:从总体中随机抽取部分个体的过程。
抽样具有代表性、随机性、可靠性、可⽐性;原则:代表性:样本能充分反映总体特征。
随机性:保证总体中每个个体都有相同的⼏率被抽样。
随机性是代表性的保证;⽣活中随机性的例⼦(思考题);计量资料:由连续变量的观察值构成的资料。
对每个观察对象的观察指标⽤定量⽅法测定其数值⼤⼩所得的资料,⼀般有度量衡单位,例如年龄、⾝⾼、⾎糖。
计数资料:由离散变量的观察值构成的资料。
先将观察对象的观测指标按性质或类别进⾏分组,然后计数各组的数⽬所得的资料,例如性别、患病、⾎型。
等级分组资料:由等级变量的观测值构成的资料。
具有计数资料的特征,同时⼜具有半定量性质的资料,例如细菌培养阳性结果。
⼆、3种设计类型:完全随机设计;配对设计;配伍组设计。
三、抽样误差、概率和⼩概率事件抽样误差:由抽样引起的样本统计量与总体参数之间的差异。
抽样误差的原因;抽样误差是不可避免的。
概率P :表⽰某事件发⽣的可能性⼤⼩的度量。
⼩概率事件:统计学上习惯将P ≤0.05或P ≤0.01的事件称为⼩概率事件,表⽰该事件发⽣的可能性很⼩。
2024年度-医学统计学重点笔记一复习必备
即标准正态分布,当样本量足够大时(n>30),t分布近似u分布。
14
总体均数置信区间估计
置信区间的概念
按一定的置信水平(1-α),根据样 本统计量估计总体参数所在的范围。
置信区间的计算
根据样本均数、标准差和样本量计算 置信区间。常用的置信水平为95%和
99%。
置信区间的意义
表示总体参数有100(1-α)%的可能性 落在此区间内。
适用条件
01
R×C列联表资料,即多行多列列联表,用于分析两个多分类变
量之间的关联。
检验统计量
02
卡方值,计算公式为χ2=∑(O-E)2/E,其中O为观察频数,E为
理论频数。
拒绝域
03
根据自由度和显著性水平确定拒绝域,自由度为(R-1)(C-1)。
29
配对设计四格表资料卡方检验
01
适用条件
配对设计四格表资料,即两个相 关样本的二分类变量之间的关联 分析。
26
06
卡方检验
27
四格表资料卡方检验
适用条件
四格表资料,即2×2列联表,用于分析两个二分类变量之间的关联。
检验统计量
卡方值,计算公式为χ2=(ad-bc)2N/(a+b)(c+d)(a+c)(b+d),其 中N为样本总量。
拒绝域
根据自由度和显著性水平确定拒绝域,自由度为1。
28
R×C列联表资料卡方检验
正态分布在医学中的应用 许多医学指标如身高、体重、血压等服从或近似服从正态 分布;在估计医学参考值范围、质量控制等方面有广泛应 用。
正态性检验方法 图形法(直方图、P-P图、Q-Q图)、计算法(偏度系数 和峰度系数检验、Shapiro-Wilk检验、KolmogorovSmirnov检验等)。
2023年医学统计学必背重点
绪论2选1总体:总体(population)指特定研究对象中所有观测单位旳测量值。
可分为有限总体和无限总体。
总体中旳所有单位都可以标识者为有限总体,反之为无限总体。
样本:从总体中随机抽取部分观测单位,其测量成果旳集合称为样本(sample)。
样本应具有代表性。
所谓有代表性旳样本,是指用随机抽样措施获得旳样本。
3选1小概率事件:我们把概率很靠近于0(即在大量反复试验中出现旳频率非常低)旳事件称为小概率事件P值:成果旳记录学意义是成果真实程度(可以代表总体)旳一种估计措施。
p值是将观测成果认为有效即具有总体代表性旳出错概率。
一般成果≤0.05被认为是有记录学意义小概率原理:一种事件假如发生旳概率很小旳话,那么可认为它在一次试验中是不会发生旳,数学上称之小概率原理。
记录学中,一般认为等于或不不小于0.05或0.01旳概率为小概率。
资料旳类型(3选1)(1)计量资料:对每个观测单位用定量旳措施测定某项指标量旳大小,所得旳资料称为计量资料(measurement data)。
计量资料亦称定量资料、测量资料。
.其变量值是定量旳,表现为数值大小,一般有度量衡单位。
如某一患者旳身高(cm)、体重(kg)、红细胞计数(1012/L)、脉搏(次/分)、血压(KPa)等。
(2)计数资料:将观测单位按某种属性或类别分组,所得旳观测单位数称为计数资料(count data)。
计数资料亦称定性资料或分类资料。
其观测值是定性旳,体现为互不相容旳类别或属性。
如调查某地某时旳男、女性人口数;治疗一批患者,其治疗效果为有效、无效旳人数;调查一批少数民族居民旳A、B、AB、O 四种血型旳人数等。
(3)等级资料:将观测单位按测量成果旳某种属性旳不一样程度分组,所得各组旳观测单位数,称为等级资料(ordinal data)。
等级资料又称有序变量。
如患者旳治疗成果可分为治愈、好转、有效、无效或死亡,多种成果既是分类成果,又有次序和等级差异,但这种差异却不能精确测量;一批肾病患者尿蛋白含量旳测定成果分为+、++、+++等。
医学统计学重点官方版
一:基本概念:1.参数:反映总体的统计指标。
2. 统计量:反映样本的统计指标称为统计量。
3. 概率:描述随机事件发生的可能性的大小的一个量度4.小概率事件:把p小于等于0.05或小于等于0.01的随机事件。
资料类型:计量资料,计数资料,等级资料。
医学统计的基本步骤:研究设计,收集资料,整理资料,分析资料,结果报告与结论表达。
二:变量分布:1.正态分布:指变量的频数或频率呈中间最多,两端逐渐对称地减少,表现为钟形的一种概率分布。
特征:(1)正态分布曲线是单峰,对称,钟形曲线,X=μ时曲线达到最高峰。
(2)正态曲线有两个参数,总体均数μ和总体标准差σ,μ越大曲线右移,越小左移,故称位置参数,σ越小曲线越瘦高,越大曲线越矮胖,故称形状参数。
(3)正态分布曲线下的面积分布具有一定的规律。
P80页。
应用:(1)质量控制(2)是统计学的理论基础(3)制定医学参考值范围制定医学参考值范围:包括绝大多数正常人的人体形态功能和代谢反应等各种生理生化指标的波动范围,是作为判定某项指标正常与否的参考标准。
方法:确定正常人对象的范围,统一测量标准,确定分组,样本含量确定,确定参考值范围的但双侧,确定百分界值,医学参考值范围的估计。
2.二项分布特征:(1)二项分布的图形:当π=0.5时图形对称,π≠0.5时,图形呈偏态,且当n的含量增大时,图形趋于对称。
(2)二项分布的均数与标准差:μ=n π;σ²=nπ(1-π);σ=根号下nπ(1-π)(3)二项分布的正态近似:当n无限增大时越趋近于正态分布。
应用:对立性,独立性,重复性三:统计分析:㈠1.统计描述:图表和指标(1)图表:频数分布图分为正偏态和负偏态,长尾向右侧延伸为正偏态,向左侧延伸为负偏态。
频数分布的特点:集中趋势和离散趋势。
(2)指标:分为计数指标和计量指标。
计数指标:相对数。
应用相对数的注意事项:①计算相对数时分母不宜太小②观测单位数不等的几个率不能直接想加求其合计率③资料对比时注意可比性④资料分析时不能以构成比代替率⑤考虑存在抽样误差计量指标:1.集中趋势:①算数均数χ:适用于对称分布资料,特别是正态或近似正态分布的计量资料。
(完整版)医学统计学复习要点
(完整版)医学统计学复习要点第⼀章绪论1、数据/资料的分类:①、计量资料,⼜称定量资料或者数值变量;为观测每个观察单位某项治疗的⼤⼩⽽获得的资料。
②、计数资料,⼜称定性资料或者⽆序分类变量;为将观察单位按照某种属性或者类别分组计数,分组汇总各组观察单位数后⽽得到的资料。
③、等级资料,⼜称半定量资料或者有序分类变量。
为将观察单位按某种属性的不同程度分成等级后分组计数,分类汇总各组观察单位数后⽽得到的资料。
2、统计学常⽤基本概念:①、统计学(statistics)是关于数据的科学与艺术,包括设计、搜集、整理、分析和表达等步骤,从数据中提炼新的有科学价值的信息。
②、总体(population)指的是根据研究⽬的⽽确定的同质观察单位的全体。
③、医学统计学(medical statistics):⽤统计学的原理和⽅法处理医学资料中的同质性和变异性的科学和艺术,通过⼀定数量的观察、对⽐、分析,揭⽰那些困惑费解的医学问题背后的规律性。
④、样本(sample):指的是从总体中随机抽取的部分观察单位。
⑤、变量(variable):对观察单位某项特征进⾏测量或者观察,这种特征称为变量。
⑥、频率(frequency):指的是样本的实际发⽣率。
⑦、概率(probability):指的是随机事件发⽣的可能性⼤⼩。
⽤⼤写的P表⽰。
3、统计⼯作的基本步骤:①、统计设计:包括对资料的收集、整理和分析全过程的设想与安排;②、收集资料:采取措施取得准确可靠的原始数据;③、整理资料:将原始数据净化、系统化和条理化;④、分析资料:包括统计描述和统计推断两个⽅⾯。
第⼆章计量资料的统计描述1. 频数表的编制⽅法,频数分布的类型及频数表的⽤途①、求极差(range):也称全距,即最⼤值和最⼩值之差,记作R;②、确定组段数和组距,组段数通常取10-15组;③、根据组距写出组段,每个组段的下限为L,上限为U,变量X值得归组统⼀定为L≤X<U,最后⼀组包括下限。
(完整版)医学统计学重点总结
1.简述总体和样本的定义,并且举例说明。
总体是研究目的确定的所有同质观察单位的全体。
样品是从研究总体中抽取部分有代表性的观察单位。
2.简述参数和统计量的定义,并且举例说明。
描述总体特征的指标称为参数,描述样本特征的指标称为统计量。
3.变量的类型有哪几种?举例说明各种类型变量有什么特点。
①定量数据:计量资料;定量的观测值是定量的,其特点是能够用数值的大小衡量其水平的高低。
②定性数据:计数资料;变量的观测值是定性的,表现为互不相容的类别或属性。
③有序数据:半定量数据/等级资料;变量的观测值是定性的,但各类别(属性)有程度或顺序上的差异。
4.请举例说明一种类型的变量如何变换为另一种类型的变量。
定量数据>有序数据>定性数据--------------->5.请简述什么是小概率事件?概率是描述事件发生可能性大小的度量,P 0.05事件称为小概率事件。
≤6.举例说明什么是配对设计。
配对设计是将受试对象按某些重要特征相近的原则配成对子,每对中的两个个体随机地给予两种处理。
①同源配对:同一受试对象或同一标本的两个部分,随机分配接受两种不同处理;②异源配对:为消除混杂因素的影响,将两个同质受试对象配对分别接受两种处理。
7.非参数假设检验适合什么类型数据进行分析?①总体分布类型未知或非正态分布数据;②定量或半定量数据;③数据两端无确定的数值。
8.简述P 25 P 50 P 75的统计学意义。
(条件:明显偏态且不能转化为正态或近似对称;一端或两端无确定数值;分布情况未知)用来描述资料的观测值序列在某百分位置的水平,四分位数间距可以作为说明个体差异的指标(说明个体在不同位置的变异情况)。
9.直条图、直方图、圆饼图的使用条件是什么?直条图:各自独立的统计指标的数值大小和他们之间的对比;直方图:连续变量频数分布情况;圆饼图:全体中各部分所占的比例。
10.统计分析包括哪两个方面的内容?为什么要进行统计推断?统计描述和统计分析;统计描述用来描述及总结一组数据的重要特征,其目的是使实验或观察得到的数据表达清楚并便于分析。
医学统计学重点word精品
医学统计学重点第一章绪论1. 基本概念:总体:根据研究目的确定的性质相同或相近的研究对象的某个变量值的全体。
样本:从总体中随机抽取部分个体的某个变量值的集合。
总体参数:刻画总体特征的指标,简称参数。
是固定不变的常数,一般未知。
统计量:刻画样本特征的指标,由样本观察值计算得到,不包含任何未知参数。
抽样误差:由随机抽样造成的样本统计量与相应的总体参数之间的差异。
频率:若事件A在n次独立重复试验中发生了m次,则称m为频数。
称m/n为事件A在n次试验中出现的频率或相对频率。
概率:频率所稳定的常数称为概率。
统计描述:选用合适统计指标(样本统计量)、统计图、统计表对数据的数量特征及其分布规律进行刻画和描述。
统计推断:包括参数估计和假设检验。
用样本统计指标(统计量)来推断总体相应指标(参数),称为参数估计。
用样本差别或样本与总体差别推断总体之间是否可能存在差别,称为假设检验。
2. 样本特点:足够的样本含量、可靠性、代表性。
3. 资料类型:(1)定量资料:又称计量资料、数值变量或尺度资料。
是对观察对象测量指标的数值大小所得的资料,观察指标是定量的,表现为数值大小。
每个个体都能观察到一个观察指标的数值,有度量衡单位。
(2)分类资料:包括无序分类资料(计数资料)和有序分类资料(等级资料)①计数资料:是将观察单位按某种属性或类别分组,清点各组观察单位的个数(频数),由各分组标志及其频数构成。
包括二分类资料和多分类资料。
二分类:将观察对象按两种对立的属性分类,两类间相互对立,互不相容。
多分类:将观察对象按多种互斥的属性分类②等级资料:将观察单位按某种属性的不同程度、档次或等级顺序分组,清点各组观察单位的个数所得的资料。
4.统计工作基本步骤:统计设计、资料收集、资料整理、统计分析第二章实验研究的三要素1. 实验设计三要素:被试因素、受试对象、实验效应2. 误差分类:随机误差(抽样误差、随机测量误差)、系统误差、过失误差3.实验设计的三个基本原则:对照原则、随机化分组原则、重复原则4. 实验设计方法有/X析因设计---------- ►正交试验设计------- * 均匀试验设计交互作用两组:异体配对设计一同体配对设计一交叉设计无、随机同期对照实验设计(单因素两水平)扩展多组:单因素多水平一配伍组设计一拉丁方设计(两因素多水平)(三因素多水平)配伍组设计:也称随机区组设计,将条件相近的受试对象配伍,每个配伍组中的对象随机分配到各处理组中。
《医学统计学》复习重点总结-PPT文档资料
X
、 S、 CV ,
表达: x s
几何均数(G)
2) 描述计量数据变量值(x)分布范围
正态分布法
X 1 .96 S (正态或近似正态分布资料)
百分位数法 P2.5%-P97.5%
(偏态分布资料)
作用:①估计变量值分布范围 ②评价个体的指标正常与否
2、计数资料统计描述指标
相对数指标及含义: 率指标:说明事物发生的频率和强度。 构成比:说明各类别所占的构成比。说明事物 的组成和分布情况。 相对比:两事件的相对关系(增长速度)。 掌握: ①相对数指标意义及计算 ②应用时的注意问题
54
男
B
16.80
37.6
无效
实验与观察研究要求掌握概念
1.实验与观察研究二者的主要区别。 2.实验设计的三原则及意义和作用。 3.实验设计的三要素是什么? 4.观察研究中有那几种概率抽样方法? 5.观察研究有几种研究类型?主要回答那些 问题? 6.何为随机化分组与随机化抽样?
第四、六章 数据特征与统计描述
定性数据的频数表
两组疗效的比较 比较组 (x) 实验组 对照组 痊愈 20 2 疗效(y) 显效 25 5 有效 10 15 无效 2 30 合计 57 52
1.计量资料统计描述指标
1) 描述计量数据(X)几个特征值:
平均水平、变异程度指标 正态或近似正态分 布资料
描述指标:
偏态分布资料
中位数(M) 、四 分位间距(QR) 表达 :M (QR) 等比关系资料
相对数指标
不同职业各年龄(岁)组冠心病发 病率比较
年 龄 (岁 ) 50 病人数 % 9 25.7 4 23.5
职业
40病人数 % 干部 21 60 工人 12 70
医学统计学复习重点-精选.
医学统计学复习重点统计设计:调查设计、实验设计第一章绪论1.基本概念:总体——根据研究目的确定,所有同质观察单位某种观察值的全体。
样本——总体中抽取的一部分具有代表性的个体组成的集合。
参数——刻画总体特征的统计指标。
一般用希腊字母表示μ、σ、π统计量——刻画样本特征的统计指标。
抽取的样本不同,统计量会变化;一般用拉丁字母或英文字母表示X、S、p抽样误差:个体变异所致,抽样研究中样本信息与总体特征间的差异。
抽样误差是不可避免的。
属于随机误差,无方向性,重复抽样可以呈现一定的规律性。
小概率事件P≤0.052.*统计工作的四个步骤:设计、收集资料、整理资料、分析资料。
(用工作实例解释)第二章调查研究设计第三章实验研究设计1.调查研究(观察性研究):特点:无人为施加处理因素调查研究的分类:按调查涉及的对象划分:全面调查(普查)、抽样调查、典型调查注意:收集的资料要有可比性*随机抽样方法(做统计推断有意义):单纯随机抽样、系统抽样、分层抽样、整群抽样非随机抽样方法(不能做统计推断,可能有偏差):偶遇抽样、判断抽样、滚雪球抽样等2.实验研究特点:与调查研究最本质的区别:根据研究目的主动施加干预措施实验设计的三个基本要素:受试对象、处理因素、实验效应实验设计的基本原则:对照原则、随机化原则、重复原则第四章定量资料的统计描述第五章定性资料的统计描述1.定量资料(1)定量资料——*频数分布表、直方图、箱式图——判断分布类型——集中位置离散趋势(变异程度)*对称分布(正态分布)X±S 均数X标准差S*偏态分布M(P25~P75)中位数M=P50四分位数间距Q=P25~P75对数正态分布几何均数G 对数标准差S lgX(2)描述离散趋势的统计指标:✓极差R=最大值-最小值、✓四分位数间距Q:常用于描述*偏态分布资料的离散趋势、一端或两端无确切值的资料、分布不明确资料✓方差(总体、样本S2)&标准差(、S):*正态或近似正态分布✓变异系数%100⨯=XSCV(3)(4)正态分布及其应用:**制定医学参考值范围步骤:判断分布类型——正态分布——*双侧95%参考值范围:X±1.96S、单侧95%参考值范围:下限为X-1.64S、上限为X+1.64S——偏态分布——*双侧95%参考值范围:(百分位数法)P2.5~P97.5单侧95%参考值范围:下限为P5、上限为P952.定性资料*率:指某现象实际发生数与某时间点或某时间段可能发生该现象的观察单位总数之比。
医学统计学重点
<<医学统计学>>重点1. 总体:根据研究的目的确定的同质研究对象中所有的观察单位变量值的集合。
2. 样本:按随机化原则从同质总体中随机抽取的部分观察单位某变量值的集合。
3. 同质:影响究指研标的主要因素易控制的因素基本上相同。
4. 抽样误差:在抽样研究中,由于变异的存在,即使在同一总体中抽取的几个样本,各样本统计量往往不等。
样本统计量与总体参数也不等,这种由于抽样研究所至样本之间和样本与总体之间的差异称为。
5. 变量:观察指标在统计学上统称为指标变量,它反应的是生物个体间的变异情况,根据其性质可分为定性变量(分类)和定量变量(连续)。
6. 截尾数据:生存时间观察过程被人为的截止称为截尾,又称删失或终检。
原因:失访/退出/终止(研究时限已到而终止观察)。
7. 卡方基本思想:X2分布是一种连续型分布,可用于检验资料的实际频数和按检验假设计算的理论频数是否相等等问题。
X2反应实现了实际频数与理论频数的吻合程度。
如果检验假设成立,则A-T一般不大,X2应很小,即出现大X2值概率很小。
即X2越大,P越小,若P≤a时,就怀疑假设的成立,拒绝H0。
若P>a则没有理由拒绝H0。
8. X2用途:(1)实际频数与拟合频数拟合优度:A推断两个或两个以上总体率或构成比有无差别(四格表/行x列表)。
B两变量之间有无相互关系。
C频数分布的拟合优度检验(判断次样本是否来自某种分布)。
(2)某些分布可用X2近似。
(3)间接应用:如t分布和F分布就是在X2分布基础上推导出来的。
9. 方差分析的基本思想:根据研究目的和设计类型,把总体变异中离均差平方和分解成两部分或更多部分,也把总变异中的自由度相应分成两部分或更多部分,然后再进行比较,评价由某种因素引起的变异是否具有统计学意义。
10. 假设检验中P,a,b(倍他)的关系及统计学意义:a:检验水准,即显著性检验,在此概率之下的认为是小概率事件,统计学上以为此事件“不可能发生”,以此判断是否不拒绝H0无效假设,在假设检验中,按a检验水准,拒绝了原来正确的H0,即犯了第1类错误,犯此错误的概率为a。
医学统计学_总结_重点_笔记_复习资料[精选]
医学统计学_总结_重点_笔记_复习资料[精选]第一篇:医学统计学_总结_重点_笔记_复习资料[精选]第一章2选1 总体:总体(population)是根据研究目的确定的同质观察单位(研究对象)的全体,实际上是某一变量值的集合。
可分为有限总体和无限总体。
总体中的所有单位都能够标识者为有限总体,反之为无限总体。
总体population根据研究目的而确定的同质观察单位的全体。
样本:从总体中随机抽取部分观察单位,其测量结果的集合称为样本(sample)。
样本应具有代表性。
所谓有代表性的样本,是指用随机抽样方法获得的样本。
样本sample从总体中随机抽得的部分观察单位,其实测值的集合。
3选1 小概率事件:我们把概率很接近于0(即在大量重复试验中出现的频率非常低)的事件称为小概率事件。
P值:P 值即概率,反映某一事件发生的可能性大小。
统计学根据显著性检验方法所得到的P 值反应结果真实程度,一般以P ≤ 0.05 认为有统计学意义,P ≤0.01 认为有高度统计学意义,其含义是样本间的差异由抽样误差所致的概率等于或小于0.05 或0.01。
P值是:1)一种概率,一种在原假设为真的前提下出现观察样本以及更极端情况的概率。
2)拒绝原假设的最小显著性水平。
3)观察到的(实例的)显著性水平。
4)表示对原假设的支持程度,是用于确定是否应该拒绝原假设的另一种方法。
小概率原理:一个事件如果发生的概率很小的话,那么可认为它在一次实际实验中是不会发生的,数学上称之小概率原理,也称为小概率的实际不可能性原理。
统计学中,一般认为等于或小于0.05或0.01的概率为小概率。
资料的类型(3选1)(1)计量资料:对每个观察单位用定量的方法测定某项指标量的大小,所得的资料称为计量资料(measurement data)。
计量资料亦称定量资料、测量资料。
.其变量值是定量的,表现为数值大小,一般有度量衡单位。
如某一患者的身高(cm)、体重(kg)、红细胞计数(10/L)、脉搏(次/分)、血压(KPa)等。
(完整word版)医学统计学考试重点(人卫第七版)
1、同质:是指观察单位或观察指标受共同因素制约的部分2、观察单位:亦称个体,是统计研究中最基本的单位3、变异:在同质的基础上个体间的差距4、总体:根据研究目的所确定的同质观察单位的全体,既是同质的所有观察单位某项观察值的集合5、有限总体:总体若受一定的时间和空间控制,其观察单位数是有限的,称为有限总体无限总体:理论上其观察单位数是无法穷尽的6、样本:是指从总体中随机抽取部分观察单位其某项指标实测值的集合7、抽样:从总体中抽取部分个体的过程称为抽样8、抽样必须遵循随机化原则,即总体中每一个体都有同等的机会被抽取到9、抽样研究的方法,利用样本的信息推论总体的特征来达到研究目的10、参数:描述总体特征的量11、统计量:根据样本个体值计算得到的描述样本特征的量12、总体参数是常数,而样本统计量可随样本不同而不同13、随机误差:指一类不恒定、随机变化的误差,有多种尚无法控制的因素所引起14、抽样误差:指抽样引起的样本统计量与总体参数之间的差异15、系统误差:在实际观测过程中,由于仪器未校正、观测者感官的某种倾向、研究者掌握的标准偏高或偏低等原因,使观察值不是随机分散在真值两侧,而是具有方向性、系统性或周期性的偏离真值,这类误差称为系统误差16、过失误差:指各种失误所导致的误差17、随机事件:在一定条件下某一现象可能发生也可能不发生的事件18、概率:反映某一随机事件发生可能性大小的量,用符号P表示19、小概率事件:统计学上一般把P≤0。
05的事件称为小概率事件,表示某事件发生的可能性很小20、变量:观察单位的某个特征21、变量值:变量的观察结果或测定值22、按变量值是定性的还是定量的,可将变量分为数值变量和分类变量23、数值变量又称定量变量,其变量值是用定量方法测得的,所的资料是计量资料24、分类变量又称定性变量,其变量值是用定性方法测得的25、分类变量根据类别是否有程度上的差别,可分为无序分类变量(构成的资料为计数资料)和有序分类变量(所得资料为等级资料)25、医学统计工作的基本步骤:一、设计;二、收集资料;三、整理资料;四、分析资料26、统计表和统计图是描述统计资料的重要工具27、统计表的结构:①标题位于统计表的上中方②标目用来说明表内各纵横数字的含义,注意标明指标的单位。
医学统计学重点总结
1.简述总体和样本的定义,并且举例说明。
总体是研究目的确定的所有同质观察单位的全体。
样品是从研究总体中抽取部分有代表性的观察单位。
2.简述参数和统计量的定义,并且举例说明。
描述总体特征的指标称为参数,描述样本特征的指标称为统计量。
3.变量的类型有哪几种?举例说明各种类型变量有什么特点。
①定量数据:计量资料;定量的观测值是定量的,其特点是能够用数值的大小衡量其水平的高低。
②定性数据:计数资料;变量的观测值是定性的,表现为互不相容的类别或属性。
③有序数据:半定量数据/等级资料;变量的观测值是定性的,但各类别(属性)有程度或顺序上的差异。
4.请举例说明一种类型的变量如何变换为另一种类型的变量。
定量数据>有序数据>定性数据--------------->5.请简述什么是小概率事件?概率是描述事件发生可能性大小的度量,P≤0.05事件称为小概率事件。
6.举例说明什么是配对设计。
配对设计是将受试对象按某些重要特征相近的原则配成对子,每对中的两个个体随机地给予两种处理。
①同源配对:同一受试对象或同一标本的两个部分,随机分配接受两种不同处理;②异源配对:为消除混杂因素的影响,将两个同质受试对象配对分别接受两种处理。
7.非参数假设检验适合什么类型数据进行分析?①总体分布类型未知或非正态分布数据;②定量或半定量数据;③数据两端无确定的数值。
8.简述P25 P50P75的统计学意义。
(条件:明显偏态且不能转化为正态或近似对称;一端或两端无确定数值;分布情况未知)用来描述资料的观测值序列在某百分位置的水平,四分位数间距可以作为说明个体差异的指标(说明个体在不同位置的变异情况)。
9.直条图、直方图、圆饼图的使用条件是什么?直条图:各自独立的统计指标的数值大小和他们之间的对比;直方图:连续变量频数分布情况;圆饼图:全体中各部分所占的比例。
10.统计分析包括哪两个方面的内容?为什么要进行统计推断?统计描述和统计分析;统计描述用来描述及总结一组数据的重要特征,其目的是使实验或观察得到的数据表达清楚并便于分析。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
医学统计学重点精选文档TTMS system office room 【TTMS16H-TTMS2A-TTMS8Q8-医学统计学重点第一章绪论1.基本概念:总体:根据研究目的确定的性质相同或相近的研究对象的某个变量值的全体。
样本:从总体中随机抽取部分个体的某个变量值的集合。
总体参数:刻画总体特征的指标,简称参数。
是固定不变的常数,一般未知。
统计量:刻画样本特征的指标,由样本观察值计算得到,不包含任何未知参数。
抽样误差:由随机抽样造成的样本统计量与相应的总体参数之间的差异。
频率:若事件A在n次独立重复试验中发生了m次,则称m为频数。
称m/n为事件A在n次试验中出现的频率或相对频率。
概率:频率所稳定的常数称为概率。
统计描述:选用合适统计指标(样本统计量)、统计图、统计表对数据的数量特征及其分布规律进行刻画和描述。
统计推断:包括参数估计和假设检验。
用样本统计指标(统计量)来推断总体相应指标(参数),称为参数估计。
用样本差别或样本与总体差别推断总体之间是否可能存在差别,称为假设检验。
2.样本特点:足够的样本含量、可靠性、代表性。
3.资料类型:(1)定量资料:又称计量资料、数值变量或尺度资料。
是对观察对象测量指标的数值大小所得的资料,观察指标是定量的,表现为数值大小。
每个个体都能观察到一个观察指标的数值,有度量衡单位。
(2)分类资料:包括无序分类资料(计数资料)和有序分类资料(等级资料)①计数资料:是将观察单位按某种属性或类别分组,清点各组观察单位的个数(频数),由各分组标志及其频数构成。
包括二分类资料和多分类资料。
二分类:将观察对象按两种对立的属性分类,两类间相互对立,互不相容。
多分类:将观察对象按多种互斥的属性分类②等级资料:将观察单位按某种属性的不同程度、档次或等级顺序分组,清点各组观察单位的个数所得的资料。
4.统计工作基本步骤:统计设计、资料收集、资料整理、统计分析。
第二章实验研究的三要素1.实验设计三要素:被试因素、受试对象、实验效应2.误差分类:随机误差(抽样误差、随机测量误差)、系统误差、过失误差。
3.实验设计的三个基本原则:对照原则、随机化分组原则、重复原则。
4.实验设计方法有析因设计正交试验设计均匀试验设计交互作用两组:异体配对设计同体配对设计交叉设计无随机同期对照实验设计(单因素两水平)扩展多组:单因素多水平配伍组设计拉丁方设计(两因素多水平)(三因素多水平)配伍组设计:也称随机区组设计,将条件相近的受试对象配伍,每个配伍组中的对象随机分配到各处理组中。
析因设计:考察两个或两个以上的处理因素,将各个因素的水平进行全面组合,每个组合下至少有两个以上的观察对象重复测量。
一般来讲,应尽可能安排等重复试验,以简化计算,2-3个水平数。
优点是全面性和均衡性较好,可同时分析处理因素的效应及因素间的交互作用。
拉丁方设计:用于三因素等水平无交互。
第三章定量资料的统计描述、参考值范围1.频数表编制过程(了解)(1)找出样本数据的最大值和最小值,计算极差 R;(2)分组:确定分组的组距 d 和组数 k;一般n<50,5-6组;n在100左右,7-10组;n>100,10-15组(3)求频率密度:统计频数,算出频率、频率密度和累积频率;(4)画出直方图。
2.频数表和直方图的作用:用于观察个数较多资料的统计描述,可以直观提示资料的分布特征和分布类型。
3.集中趋势、离散趋势的指标及适用范围(1)集中趋势:x,G,M,P x,M0算术均数:适用于对称分布;不适用于偏态分布和资料中出现极值的资料。
几何均数:适用于呈倍数关系的资料或对数正态分布的资料,尤其是正偏态分布。
不适用与观察值中有0或正负数值同时出现的资料。
中位数:适用于大样本偏态分布或分布情况不明的资料或资料中有不确定数值的资料。
百分位数的作用:多个百分位数结合使用,全面描述数据分布的特征;用于确定医学参考值范围(偏态或分布不明的资料)。
众数:适用于大样本,较粗糙。
(2)离散趋势:极差:优点:简单明了、容易使用。
缺点:①只反映最大值和最小值间的差异,不能反映其他观察值的变异程度。
②样本容量越大,极差可能越大。
③极差的抽样误差大,不稳定。
四分位数间距:适用于确定医学参考值范围,与中位数一起描述偏态分布资料变异程度。
缺点:类似于极差,利用度低。
方差与标准差:与均数一起描述对称分布,特别是正态分布的分布特征。
变异系数:适用于:①适用于比较度量衡单位不同资料的变异度。
②比较均数相差悬殊的资料的变异度。
③衡量实验精密度和稳定性的常用指标。
(3)频数分布特征高峰在中间,左右大致对称,称为对称分布。
平均数=中位数=众数 高峰偏向小值的一侧(左侧),称正偏态分布(亦称右偏态)。
平均数>中位数>众数高峰偏向大值的一侧(左侧),称负偏态分布(亦称左偏态)。
平均数<中位数<众数对称分布 正(右)偏态分布 负(左)偏态分布 4.正态分布图形的特点及意义(1)特点:①f (x )关于x=μ对称 ②x=μ时取得最大值③在x=μ±σ处为拐点,且以 x 轴为水平渐近线 ④f (x )大于0⑤P (x=a )=0⑥若 f (x) 在点 x 处连续,则F ′(x )=f (x) (2)意义:⎰+∞∞-)(x f =1,f (x )在负无穷到正无穷的积分值为1,即曲线下方面积为1。
5.μ和σ2的意义μ:位置参数,当σ固定时,μ增大,曲线沿横轴向右移动;μ减小,曲线沿横轴向左移动。
σ2:形状参数,当μ固定时,σ越大,曲线越矮胖;σ越小,曲线越高瘦。
6.标准化变换z=σμ-x x ~N (μ,σ2) z ~N (0,1) F (x)=Ф(σμ-x )=Ф(z) 即P (X ≤x)=Ф(σμ-x )=P (Z ≤z)P (a<x<b)=F (b)-F (a)=Ф(σμ-b )-Ф(σμ-a P (σμ-a <σμ-x <σμ-b )=P (σμ-a < Z<σμ-b )7.标准正态分布界值规定:界值右侧曲线下方面积等于它的下角标。
下角标一致,x 轴上方中间面积一致。
双侧界值:P (|z|≤z 2α)=1-α P (z<z 2α)=1-2αP (|z|≥z 2α)=α P (z>z 2α)=2α单侧界值:上限: 下限: P (z>z α)=α P (z>z 1-α)=1-α P (z<z α)=1-α P (z<z 1-α)=α8.正常值范围及意义概念:医学临床中,常将就诊者的某些生理、生化、免疫学指标的测定结果,与排除了对研究指标有影响的疾病和有关因素的大多数“正常人”的相应数值进行比较,以就诊者的测定值是否超出了大多数“正常人”相应指标的波动范围,作为临床诊断的重要参考,又称医学参考值范围。
意义:95%的参考值范围含义是指:样本中有95%的个体测定值在所求范围之内。
以95%的置信区间来说,意义是:该区间以95%的概率包含了待估计的参数,这种估计的可信度是95%,会冒5%的风险。
公式:双侧95%的界限值:x±1.96s单侧95%的上限值:x+1.645s单侧95%的上限值:x-1.645s第四章总体均数的估计、假设检验1.标准误(1)概念:每次样本计算出的x不同,这些x的标准差称为均数的标准误。
(2)意义:是衡量样本统计量抽样误差大小的统计指标。
(3)与标准差的区别:二者都是描述变异程度的指标,标准差描述个体值的变异,标准误描述统计量的变异。
(4)均数标准误的公式:S x=ns2.置信区间(1)定义:设θ为总体的未知参数,若由样本确定的两个统计量θ1(x1、x2、…、xn)和θ2(x1、x2、…、xn),且θ1<θ2,对于预先给定的值α(0<α<1),若满足P(^θ1<^θ2)=1-α,则称随机区间(^θ1,^θ2)为θ的1-α置信区间,其中称为^θ1置信下限,称为^θ2置信上限,1-α称置信度。
(2)意义:区间(^θ1,^θ2)包含有参数θ的概率为1-α,不能说θ在(^θ1,^θ2)的概率为1-α。
例:可以说(a ,b )包含均数μ的概率为95%,不能说μ在(a ,b )的概率为95%。
(3)公式:单个正态总体均数μ的区间估计 ①σ已知:双侧:nz x σα2± 即 x z x σα2±z 分布单侧:nz x σα± 即 x z x σα±②σ未知:双侧:n st x 2α± 即 x s t x 2α± 小样本(n ≤50) t 分布单侧:n st x α± 即 x s t x α± 双侧:n sz x 2α± 即 x s z x 2α±大样本(n>50) z 分布单侧:nsz x α± 即 x s z x α±(4)两要素:准确度:由1-α 决定,1-α 越大,准确度越高。
精确度:由区间长度决定。
99%置信区间准确度高于95%置信区间。
95%置信区间精确度更高。
3.抽样分布(1)t 分布①定义: 来自正态总体的一组样本,x 和s 分别是样本的均数和标准差。
则t=ns x /μ-~t 分布,自由度 df=n-1,极限分布是标准正态分布。
②图形分布特征:以0为中心,左右对称的单峰分布。
自由度越大,越高瘦 ③界值: 双侧:P (|t|≤t 2α)=1-α P (t<t 2α)=1-2αP (|t|≥t 2α)=α P (t>t 2α)=2α单侧:上限: 下限:P (t<t α)=1-α P (t<t 1-α)=α P (t>t α)=α P (t>t 1-α)=1-α (2)χ2分布①定义:若从均数为μ,标准差σ的正态总体中,每次抽取样本含量为n 的样本,计算样本标准差s ,则χ2=(n-1)s 2/σ2服从自由度df=n-1的χ2分布。
②图形分布特征: 曲线偏向左边 自由度越小曲线越偏 ③界值: 双侧:P (x 2>x 22α)=2α P (x 2>212α-x )=1-2α P (x 2<x 22α)=1-2α P (x 2<212α-x )=2α单侧:上限: 下限: P (x 2>x 2α)=α P (x 2>x 21-α)=1-α P (x 2<x 2α)=1-α P (x 2<x 21-α)=α (3)F 分布①定义:如果分别从两个正态总体N (μ1,σ1)和N (μ1,σ1)中随机抽取样本含量 n 1、n 2的两个样本,算出样本均数和方差分别为x 1,s 21和x 2,s 22,则σσ22222121//s s F =服从df 1=n 1-1,df 2=n 2-1的F 分布。