医学统计学重点41073

合集下载

医学统计学重点(精.选)

医学统计学重点(精.选)

1.变异:同质事物之间的差异。

2.频数散布的两个特点:集中地点,失散趋向3.数据散布的种类:对称散布和非对称散布。

非对称散布又称偏态散布,包含正偏态和负偏态。

单峰散布,双峰散布,多峰散布。

4.统计描绘:用统计表、统计图和统计指标等方法对资料的数目特点与散布规律进行描绘。

5.集中地点的描绘,集中地点指标又称均匀数指标。

有哪些及合用条件?(1)算数均匀数:最合用于单峰对称散布资料的均匀水平的描绘,特别是正态散布资料(2)几何均匀数:合用于①等比资料②对数正态散布资料(3)中位数和百分位数:合用于①偏态散布的资料②张口资料③资料散布不明等6.失散趋向的描绘(1)全距亦称极差,合用于单峰小样本资料(2)四分位数间距,合用于单峰小样本资料(3)方差和标准差,合用于对称散布特别是正态散布资料(4)变异系数,常用于① 比较胸怀衡单位不一样的两组或多种资料的变异度② 比较均数相差悬殊的两组或多组资料的变异度7.常用相对数( 1)率,是二分类指标(2)组成比( 3)比8.正确应用相对数应注意几个问题:(1)计算相对数的分母不宜过小(2)剖析时不可以以组成比取代率(3)对察看单位数不等的几个率,不可以直接相加求其总率(4)计算率时要注意资料的同质性,对照剖析时应注意资料的可比性(5)也有抽样偏差,需要假定查验。

9.率的标准法(1)基本思想:采纳一致的标准,以除去病情组成不一样对治愈率比较的影响,使算得的标准化治愈率有可比性。

(2)目的:控制混淆因素对研究结果的影响。

10.正态散布(1)观点 P16(2)标准正态散布,u 变换: u= X,u 是标准正态离差,μ是均数,σ是标准差。

u~ N( 0, 1)(3)正态散布的特点:①是单峰散布,顶峰地点在均数X=μ处。

② 以均数为中心,左右完整对称。

③ 取决于两个参数,均数μ和标准差σ。

μ为地点参数,μ越大,则曲线沿横轴向右挪动;μ越小,则曲线沿横轴向左挪动。

σ为形态参数,表示数据的失散程度,若σ小,则曲线形态“瘦高”;σ大,则曲线形态“矮胖” 。

医学统计学知识点汇总(精华)

医学统计学知识点汇总(精华)

医学统计学知识点汇总(精华)一.概论1,医学统计学:运用概率论和数理统计学的原理和方法,研究医学领域中随机现象有关数据的搜集、整理、分析和推断,进而阐明其客观规律性的一门应用科学。

2,医学统计学的主要内容:1)统计研究设计调查研究设计和实验研究设计2)医学统计学的基本原理和方法研究设计和数据处理中的基本统计理论和方法。

A:资料的搜集与整理 B:常用统计描述,集中趋势和离散趋势,相对数,相关系数,回归系数,统计表,统计图 C:统计推断,如参数估计和假设检验。

3)医学多元统计方法多元线性回归和逐步回归分析、判别分析、聚类分析、主成分分析、因子分析、logistic回归与Cox回归分析。

3,统计工作步骤:1)设计明确研究目的和研究假说,确定观察对象与观察单位,样本含量和抽样方法,拟定研究方案,预期分析指标,误差控制措施,进度与费用。

2)搜集材料A,搜集材料的原则及时、准确、完整B,统计资料的来源医学领域的统计资料的来源主要有三个方面。

一是统计报表,二是经常性工作记录,三是专题调查或专题实验。

C,资料贮存3)整理资料 a检查核对b设计分组c拟定整理表d归表4)分析资料统计分析包括统计描述和统计推断4,同质(homogeneity):指被研究指标的影响因素相同。

变异(variation):同质基础上的各观察单位间的差异。

变量(variable):收集资料过程中,根据研究目的确定同质观察单位,再对每个观察单位的某项特征进行测量或观察,这种特征称为变量变量值:变量的观察结果或测量值。

变量类型变量值表现实例资料类型数值变量离散型定量测量值,有计量单位产前检查次数计量资料连续型身高分类变量无序二分类对立的两类属性性别(男女)计数资料多分类不相容的多类属性血型(A,B,O,AB)有序多分类类间有程度差异的属性受教育程度(小学,中学,高中,大学…)等级资料5,总体(population)根据研究目的所确定的同质研究对象中所有观察单位某变量值的集合。

(完整word版)医学统计学考试重点(人卫第七版)

(完整word版)医学统计学考试重点(人卫第七版)

1、同质:是指观察单位或观察指标受共同因素制约的部分2、观察单位:亦称个体,是统计研究中最基本的单位3、变异:在同质的基础上个体间的差距4、总体:根据研究目的所确定的同质观察单位的全体,既是同质的所有观察单位某项观察值的集合5、有限总体:总体若受一定的时间和空间控制,其观察单位数是有限的,称为有限总体无限总体:理论上其观察单位数是无法穷尽的6、样本:是指从总体中随机抽取部分观察单位其某项指标实测值的集合7、抽样:从总体中抽取部分个体的过程称为抽样8、抽样必须遵循随机化原则,即总体中每一个体都有同等的机会被抽取到9、抽样研究的方法,利用样本的信息推论总体的特征来达到研究目的10、参数:描述总体特征的量11、统计量:根据样本个体值计算得到的描述样本特征的量12、总体参数是常数,而样本统计量可随样本不同而不同13、随机误差:指一类不恒定、随机变化的误差,有多种尚无法控制的因素所引起14、抽样误差:指抽样引起的样本统计量与总体参数之间的差异15、系统误差:在实际观测过程中,由于仪器未校正、观测者感官的某种倾向、研究者掌握的标准偏高或偏低等原因,使观察值不是随机分散在真值两侧,而是具有方向性、系统性或周期性的偏离真值,这类误差称为系统误差16、过失误差:指各种失误所导致的误差17、随机事件:在一定条件下某一现象可能发生也可能不发生的事件18、概率:反映某一随机事件发生可能性大小的量,用符号P表示19、小概率事件:统计学上一般把P≤0.05的事件称为小概率事件,表示某事件发生的可能性很小20、变量:观察单位的某个特征21、变量值:变量的观察结果或测定值22、按变量值是定性的还是定量的,可将变量分为数值变量和分类变量23、数值变量又称定量变量,其变量值是用定量方法测得的,所的资料是计量资料24、分类变量又称定性变量,其变量值是用定性方法测得的25、分类变量根据类别是否有程度上的差别,可分为无序分类变量(构成的资料为计数资料)和有序分类变量(所得资料为等级资料)25、医学统计工作的基本步骤:一、设计;二、收集资料;三、整理资料;四、分析资料26、统计表和统计图是描述统计资料的重要工具27、统计表的结构:①标题位于统计表的上中方②标目用来说明表内各纵横数字的含义,注意标明指标的单位。

医学统计学重点知识点

医学统计学重点知识点

<<医学统计学>>1. 总体:根据研究的目的确定的同质研究对象中所有的观察单位变量值的集合。

2. 样本:按随机化原则从同质总体中随机抽取的部分观察单位某变量值的集合。

3. 同质:影响研究指标的主要因素易控制的因素基本上相同。

4. 抽样误差:在抽样研究中,由于变异的存在,即使在同一总体中抽取的几个样本,各样本统计量往往不等。

样本统计量与总体参数也不等,这种由于抽样研究所至样本之间和样本与总体之间的差异称为--5. 变量:观察指标在统计学上统称为指标变量,它反应的是生物个体间的变异情况,根据其性质可分为定性变量(分类)和定量变量(连续)。

6. 截尾数据:生存时间观察过程被人为的截止称为截尾,又称删失或终检。

原因:失访/退出/终止(研究时限已到而终止观察)。

7. 卡方基本思想:X2分布是一种连续型分布,可用于检验资料的实际频数和按检验假设计算的理论频数是否相等等问题。

X2反应实现了实际频数与理论频数的吻合程度。

如果检验假设成立,则A-T一般不大,X2应很小,即出现大X2值概率很小。

即X2越大,P越小,若P≤a时,就怀疑假设的成立,拒绝H0。

若P>a则没有理由拒绝H0。

8. X2用途:(1)实际频数与拟合频数拟合优度:A推断两个或两个以上总体率或构成比有无差别(四格表/行x列表)。

B两变量之间有无相互关系。

C频数分布的拟合优度检验(判断次样本是否来自某种分布)。

(2)某些分布可用X2近似。

(3)间接应用:如t分布和F分布就是在X2分布基础上推导出来的。

9. 方差分析的基本思想:根据研究目的和设计类型,把总体变异中离均差平方和分解成两部分或更多部分,也把总变异中的自由度相应分成两部分或更多部分,然后再进行比较,评价由某种因素引起的变异是否具有统计学意义。

10. 假设检验中P,a,b(倍他)的关系及统计学意义:a:检验水准,即显着性检验,在此概率之下的认为是小概率事件,统计学上以为此事件“不可能发生”,以此判断是否不拒绝H0无效假设,在假设检验中,按a检验水准,拒绝了原来正确的H0,即犯了第1类错误,犯此错误的概率为a。

医科大学医学统计学重点知识总结

医科大学医学统计学重点知识总结

第一章绪论1、统计学的定义:统计学研究数据的收集、整理、分析的一门学科。

医学统计学:医学统计学是以医学理论为指导,应用概率论与数理统计的有关原理、方法,研究医学资料的搜集、整理、分析和推断的一门科学。

2、医学统计研究三个步骤:研究设计、资料分析、结论3、(必考的)几个概念:(1)同质:性质相同异质:性质不同观察单位间的同质性是进行研究的前提同质是相对的(不同研究中或同一研究中不同观察指标对观察对象的同质性的要求不同)(2)个体变异:同质个体间的差异。

变异的两个方面:不同观察单位(个体)间的差别;同一个体在不同阶段的差别(重复测量)个体变异是普遍存在的;个体变异是有规律的。

注意:由于个体变异的存在,同质个体指标的取值会存在差异!(例:体温波动)(3)总体:按研究目的所确定的同质研究对象的全体。

有限总体:有时间、空间的概念,观察单位有限无限总体:无时间、空间的概念(例:某种治疗措施的效果,就包括接受这种治疗措施的所有病人过去、现在、未来,因而观察单位无限)(4)个体:组成总体的基本单位。

样本:从研究总体中随机抽取具有代表性的部分观察单位随机性的三个体现:抽样随机、分组随机、试验顺序随机(5)随机变量:观察对象个体的特征或测量的结果观察结果在一定范围内以一定的概率分布随机取值的变量,表示随机现象。

在一定条件下,并不总是出现相同结果变量值:个体观察指标具体取值(6)总体参数:总体的统计指标或特征值固有的、不变的,但往往是未知的(7)样本统计量:由样本所算出的统计指标或特征值已知的,且随着试验的不同而不同,但分布是有规律的(8)样本含量:样本中包含个体的数量(9)频率f=m/n,f的值随n的增大接近常数p,概率P(A)=p即:频率为一变量,是样本统计量;概率为常数,是一总体参数小概率事件:概率小于等于0.05小概率原理:小概率事件在一次试验中是不会发生的(10)抽样误差:两个表现:样本统计量与总体参数间的差别;不同样本统计量间的差别两个原因:个体变异;抽样过程抽样误差不可避免,但是有规律。

医学统计学重点

医学统计学重点

医学统计学重点说明:本重点仅供参考:不能包括所有选择题考题,名词和简答可信度高,计算题熟练运算过程;同时自己要清楚各种检验方法的基本思想,重点程度与星号数量相关)一、名词解释1、★★★医学统计学:用概率论和数理统计方法研究医学事件的群体特征的一门方法。

2、★总体:根据研究目的确定的同质的研究对象的全体(集合)。

3、样本:从总体中随机抽取的部分研究对象。

4、随机:总体中每个个体有同等的机会进入样本。

5、系统误差:指数据搜集和测量过程中由于仪器不准确、标准不规范等原因,造成观察结果呈倾向性的偏大或偏小,这种误差称为系统误差。

6、随机误差:由于一些非人为的偶然因素使得结果或大或小,是不确定、不可预知的。

7、★★抽样误差:由于抽样原因造成的样本指标与总体指标之间的差,或者是样本指标与样本指标之间的差。

8、准确度(accuracy)或真实性(validity):观察值与真值的接近程度,受系统误差的影响(9、可靠度(reliabiliy)——也称精密度(precision)或重复性(repeatability):重复观察时观察值与其均值的接近程度,受随机误差的影响。

10、★★★小概率事件:一般常将p ≤ 0.05或p ≤ 0.01称为小概率事件,表示某事件发生的可能性很小。

通俗讲一次抽样是不可能发生的事件。

11、★★正态分布定:又称高斯分布,是一条中间高,两头低,左右完全对称地下降,但永远不与横轴相交的钟形曲线。

12、★★医学参考值范围:指绝大多数正常人的解剖、生理、生化、免疫及组织代谢产物的含量等各种数据的波动范围。

最常用的是95%参考值范围。

13、★★标准误:用于反映均数抽样误差大小的指标,也叫样本均数的标准差,它反映了样本均数之间的离散程度。

14、★95%的可信区间:如果从同一总体中重复抽取100个独立样本,将可能有95个可信区间包括总体均数,有5个可信区间未包括总体均数。

二、填空题1、★医学统计学工作基本步骤:统计设计;收集资料.;整理资料;分析资料2、★统计分析包括:统计描述、统计推断3、频数分布的两个重要特征:集中趋势和离散趋势4、正态分布的两个参数:均数;标准差。

医学统计学重点官方版

医学统计学重点官方版

一:基本概念:1.参数:反映总体的统计指标。

2. 统计量:反映样本的统计指标称为统计量。

3. 概率:描述随机事件发生的可能性的大小的一个量度4.小概率事件:把p小于等于0.05或小于等于0.01的随机事件。

资料类型:计量资料,计数资料,等级资料。

医学统计的基本步骤:研究设计,收集资料,整理资料,分析资料,结果报告与结论表达。

二:变量分布:1.正态分布:指变量的频数或频率呈中间最多,两端逐渐对称地减少,表现为钟形的一种概率分布。

特征:(1)正态分布曲线是单峰,对称,钟形曲线,X=μ时曲线达到最高峰。

(2)正态曲线有两个参数,总体均数μ和总体标准差σ,μ越大曲线右移,越小左移,故称位置参数,σ越小曲线越瘦高,越大曲线越矮胖,故称形状参数。

(3)正态分布曲线下的面积分布具有一定的规律。

P80页。

应用:(1)质量控制(2)是统计学的理论基础(3)制定医学参考值范围制定医学参考值范围:包括绝大多数正常人的人体形态功能和代谢反应等各种生理生化指标的波动范围,是作为判定某项指标正常与否的参考标准。

方法:确定正常人对象的范围,统一测量标准,确定分组,样本含量确定,确定参考值范围的但双侧,确定百分界值,医学参考值范围的估计。

2.二项分布特征:(1)二项分布的图形:当π=0.5时图形对称,π≠0.5时,图形呈偏态,且当n的含量增大时,图形趋于对称。

(2)二项分布的均数与标准差:μ=n π;σ²=nπ(1-π);σ=根号下nπ(1-π)(3)二项分布的正态近似:当n无限增大时越趋近于正态分布。

应用:对立性,独立性,重复性三:统计分析:㈠1.统计描述:图表和指标(1)图表:频数分布图分为正偏态和负偏态,长尾向右侧延伸为正偏态,向左侧延伸为负偏态。

频数分布的特点:集中趋势和离散趋势。

(2)指标:分为计数指标和计量指标。

计数指标:相对数。

应用相对数的注意事项:①计算相对数时分母不宜太小②观测单位数不等的几个率不能直接想加求其合计率③资料对比时注意可比性④资料分析时不能以构成比代替率⑤考虑存在抽样误差计量指标:1.集中趋势:①算数均数χ:适用于对称分布资料,特别是正态或近似正态分布的计量资料。

医学统计学知识点

医学统计学知识点

第一章绪论1、统计学,是关于数据收集、整理、分析、表达和解释的普遍原理和方法。

2、研究对象:具有不确定性结果的事物。

3、统计学作用:能够透过偶然现象来探测其规律性,使研究结论具有科学性。

4、统计分析要点:正确选用统计分析方法,结合专业知识作出科学的结论。

5、医学统计学基本内容:统计设计、数据整理、统计描述、统计推断。

6、医学统计学中的基本概念(1) 同质与变异同质,指根据研究目的所确定的观察单位其性质应大致相同。

变异,指总体内的个体间存在的、绝对的差异。

统计学通过对变异的研究来探索事物。

(2) 变量与数据类型变量,是反映实验或观察对象生理、生化、解剖等特征的指标。

变量的观测值,称为数据分为三种类型:定量数据,也称计量资料,指对每个观察单位某个变量用测量或其他定量方法准确获得的定量结果。

(如身高、体重、血压、温度等)定性数据,也称计数资料,指将观察单位按某种属性分组计数的定性观察结果。

包括二分类、无序多分类。

(进一步分为二分类和多分类,如性别分为男和女,血型分为A、B、O、AB等)有序数据,也称半定量数据或等级资料,指将观察单位按某种属性的不同程度或次序分成等级后分组计数的观察结果,具有半定量性质。

统计方法的选用与数据类型有密切的关系。

(3)总体与样本总体,指根据研究目的确定的所有同质观察单位的全体,包括所有定义范围内的个体变量值。

样本,是从研究总体中随机抽取部分有代表性的观察单位,对变量进行观测得到的数据。

抽样,是从研究总体中随机抽取部分有代表性的观察单位。

参数,指描述总体特征的指标。

统计量,指描述样本特征的指标。

(4)误差误差,指观测值与真实值、统计量与参数之间的差别。

可分为三种:系统误差,也称统计偏倚,是某种必然因素所致,不是偶然机遇造成的,误差的大小通常恒定,具有明确的方向性。

随机测量误差,是偶然机遇所致,误差没有固定的大小和方向。

抽样误差,是抽样引起的统计量与参数间的差异。

抽样误差主要来源于个体的变异。

医学统计学重点

医学统计学重点

医学统计学重点医学统计学是医学领域中不可或缺的一门学科,它借助数理统计方法研究医学数据和临床试验的结果,为医学决策提供可靠的依据。

以下是医学统计学的几个重点内容。

一、描述统计学描述统计学是医学统计学的基础,主要研究如何分类、整理和描述医学数据。

其主要方法包括测量尺度、频率分布表、中心趋势测量和变异程度测量。

1. 测量尺度在医学统计学中,常见的测量尺度包括名目尺度、有序尺度和数值尺度。

名目尺度适用于无序分类的变量,有序尺度适用于有序分类的变量,而数值尺度适用于具有度量意义的变量。

2. 频率分布表频率分布表用来展示变量的分布情况,主要包括类别、频数和频率等内容。

通过频率分布表,可以直观地了解变量的分布状况。

3. 中心趋势测量中心趋势测量主要包括平均数、中位数和众数。

平均数是所有观测值的总和除以观测值的个数,中位数是将观测值按大小排列后的中间值,众数是出现次数最多的观测值。

4. 变异程度测量变异程度测量用来描述数据的分散程度,主要包括极差、方差和标准差。

极差是最大观测值与最小观测值之间的差异,方差是观测值与均值之间的差异的平方的平均数,标准差是方差的平方根。

二、推断统计学推断统计学是医学统计学的核心内容,主要研究如何通过样本数据推断总体参数,并对假设进行检验。

其中包括参数估计、假设检验和置信区间等方法。

1. 参数估计参数估计是利用样本数据估计总体参数,常用的方法有点估计和区间估计。

点估计是通过样本数据得到一个单一的数值作为总体参数的估计值,区间估计是通过样本数据得到一个范围作为总体参数的估计区间。

2. 假设检验假设检验是用来检验某个陈述是否与观察数据相符的方法。

在医学研究中,研究者常常根据实验数据对研究假设进行检验,以确定是否有统计显著性。

3. 置信区间置信区间是对总体参数的一个范围估计。

置信区间的计算方法与区间估计相似,通过对样本数据进行分析计算得到。

三、生存分析生存分析是医学统计学中的一个重要分支,主要研究疾病患者的生存时间和生存率等问题。

(完整版)医学统计学知识点汇总

(完整版)医学统计学知识点汇总

医学统计学总结绪论1、随机现象:在同一条件下进行试验,一次试验结果不能确定,而在一定数量的重复试验之后呈现统计规律的现象。

2、同质:统计学中对研究指标影响较大的,可以控制的主要因素。

3、变异:同质基础上各观察单位某变量值的差异。

数值变量:变量值是定量的,由此而构成的资料称为数值变量资料或计量资料,其数值是连续性的,称之为连续型变量。

变量无序分类变量:所分类别或属性之间无顺序和程度上的差异分类变量有序分类变量:有顺序和程度上的差异4、总体:根据研究目的确定的同质研究对象中所有观察单位某变量值的集合。

可以分为有限总体和无限总体。

5、样本:是按随机化原则从同质总体中随机抽取的部分观察单位某变量值的集合。

样本代表性的前提:同质总体,足够的观察单位数,随机抽样。

统计学中,描述样本特征的指标称为统计量,描述总体特征的指标称为参数。

6、概率:描述随机事件发生的可能性大小的一个度量。

若P(A)=1,则称A为必然事件;若P(A)=0,则称A为不可能事件;随机事件A的概率为0<P<1.小概率事件:若随机事件A的概率P≤α,则称随机事件A为小概率事件,其统计学意义为:小概率事件在一次随机试验中认为是不可能发生的。

统计描述1、频数分布有两个重要的特征:集中趋势和离散程度。

频数分布有对称分布和偏态分布之分。

后者是指频数分布不对称,集中趋势偏向一侧,如偏向数值小的一侧为正偏态分布,如偏向数值大的一侧为负偏态分布。

2、常用的集中趋势的描述指标有:均数,几何均数,中位数等。

x均数:适用于正态或近似正态的分布的数值变量资料。

样本均数用表示,总体均数用μ表示。

几何均数:适用于等比级数资料和对数呈正态分布的资料。

注意观察值中不能有零,一组观察值中不能同时有正值和负值。

中位数:适用于偏态分布资料以及频数分布的一端或两端无确切数据的资料。

3、常用的离散程度的描述指标有:全距,四分位数间距,方差,标准差,变异系数。

全距:任何资料,一组中最大值与最小值的差。

医学统计学重点总结

医学统计学重点总结

医学统计学第一章 医学统计中得基本概念1 医学统计工作得内容:设计,收集资料,整理资料,分析资料。

2 资料得类型:计量资料(数值变量),计数资料(无序分类),等变异(variation ):在同质得基础上被观察个体得差异。

级分组资料(有序分类)。

3 同质(homogeneity ):对研究指标有影响得非实验因素相同。

4 总体(population ):根据研究目得确定得同质得全部研究对象称总体 。

样本(sample ):根据随机化得原则从总体中抽出有代表性得一部分观察单位组成得子集称样本。

5 参数(parameter ):总体得设计指标称为参数。

统计量(statistic ):样本得统计指标称为统计量。

6 变量(variable ):观察对象得特征或指标称为变量,测量得结果即为变量值。

7 概率(probability):描述随机事件发生得可能性得大小得一个量度,其概率介于0与1之间。

第二章 集中趋势得统计描述一 算术均法(mean )简称为均数,适用于正态或近似正态分布资料(一)直接法 (二)加权法(针对频数表)nfx n x f f f X k k ∑=+++=...21 二 几何均数(geometic mean,G )适用于倍数关系变化,经对数转换后呈正态分布(如:抗体滴度,血清凝集效价,细菌计数,某些物质浓度等)G= 为了计算方便,常改用对数得形式计算,即lg()对于频数表资料,可用公式 G=lg()三 中位数(M )与百分位数中位数:适用于偏态分布资料,末端无确切数值得资料及分布情况不确定公式:M=L+() L,,分别为M 所在组段得下限,组距与频数,为M 所在组段之前各组数得累积频数。

百分位数:用符号表示,x 即百分位公式:=L+() 式中L,,分别为所在组段得下限,组距与频数,为所在组段之前各组段得累积频数第三章 变异程度得统计描述1.衡量、变异程度得指标有:极差,四分位数间距,方差,标准差,变异系数。

(完整版)医学统计学复习要点

(完整版)医学统计学复习要点

..第一章绪论1、数据/资料的分类:①、计量资料,又称定量资料或者数值变量;为观测每个观察单位某项治疗的大小而获得的资料。

②、计数资料,又称定性资料或者无序分类变量;为将观察单位按照某种属性或者类别分组计数,分组汇总各组观察单位数后而得到的资料。

③、等级资料,又称半定量资料或者有序分类变量。

为将观察单位按某种属性的不同程度分成等级后分组计数,分类汇总各组观察单位数后而得到的资料。

2、统计学常用基本概念:①、统计学(statistics )是关于数据的科学与艺术,包括设计、搜集、整理、分析和表达等步骤,从数据中提炼新的有科学价值的信息。

②、总体(population )指的是根据研究目的而确定的同质观察单位的全体。

③、医学统计学(medical statistics ):用统计学的原理和方法处理医学资料中的同质性和变异性的科学和艺术,通过一定数量的观察、对比、分析,揭示那些困惑费解的医学问题背后的规律性。

④、样本(sample ):指的是从总体中随机抽取的部分观察单位。

⑤、变量(variable ):对观察单位某项特征进行测量或者观察,这种特征称为变量。

⑥、频率(frequency ):指的是样本的实际发生率。

⑦、概率(probability):指的是随机事件发生的可能性大小。

用大写的P 表示。

3、统计工作的基本步骤:①、统计设计:包括对资料的收集、整理和分析全过程的设想与安排;②、收集资料:采取措施取得准确可靠的原始数据;③、整理资料:将原始数据净化、系统化和条理化;④、分析资料:包括统计描述和统计推断两个方面。

第二章计量资料的统计描述1. 频数表的编制方法,频数分布的类型及频数表的用途①、求极差(range ):也称全距,即最大值和最小值之差,记作R ;②、确定组段数和组距,组段数通常取10-15组;③、根据组距写出组段,每个组段的下限为L ,上限为U ,变量X 值得归组统一定为L ≤X <U ,最后一组包括下限。

医学统计学期末考试重点

医学统计学期末考试重点

一、总体:是根据研究目的确定的同质观测单位的集合。

样本:是从统计总体中随机抽取的、具有代表性的部分观测单位的集合。

同质:即构成总体的各个观测单位在某一方面或几方面的性质相同或基本相同。

变异:是指在同质基础上各观测单位之间的差异。

离散型变量:指只能取可数的或有限个数的变量。

特点只是取顺序整数值连续性变量:指可以取各整数区间的一切实数值的变量。

特点是在两个连续的整数值之间还可以用小数或分数连接起来的非整数值。

二、统计的含义1.统计工作:指搜集、整理、分析和研究统计数据的工作,是统计数据与统计理论的基础和源泉。

2.统计数据:指统计工作研究的主体及成果。

3.统计学:是对研究对象的数据进行搜集、整理、分析和研究,以揭示其总体特征和规律性的方法论科学。

三、统计学的主要内容1.研究设计:是按照研究目的和统计学要求制定具有针对性、具体性、专业性的工作方案。

2.统计描述:用统计指标、统计图、统计表等方法描述样本资料的数据特征及其分布规律,是整个统计学的基础。

3.统计推断:用样本信息推论总体特征的归纳过程,它有两个重要领域。

四、误差及其分类误差指实际观测值与真值之差或样本指标与总体指标之差。

误差分为非随机误差和随机误差,非随机误差:粗差-粗心大意,无规律性,可以避免;系统误差-仪器、方法、等条件的差异,感官、理论和实验方法的差异。

随机误差:测量误差-由一系列实验或观测条件的随机波动造成的实测值与真值之差;抽样误差-随机抽样引起的统计量与参数之间的差异。

五、统计工作的基本步骤研究设计、搜集资料、整理资料、分析资料中医统计资料的搜集与整理一、中医统计资料的类型1.计量资料:是由数值变量产生的资料,即对每个观察单位用计量方法测得某项标志数值大小所得资料,变量值大多有度量衡单位;2.计数资料:是由分类变量产生的资料,即对每个观察单位按某种属性分组计数得到的资料,变量值变现为互不相容的属性或类别,无度量衡单位。

统计描述一、频数分布:是指观测值按大小分组,各个组段内观测值个数的分布,它是了解数据分布形态特征与规律的基础。

医学统计学复习要点

医学统计学复习要点

第一章绪论1、数据/资料的分类:①、计量资料,又称定量资料或者数值变量;为观测每个观察单位某项治疗的大小而获得的资料。

②、计数资料,又称定性资料或者无序分类变量;为将观察单位按照某种属性或者类别分组计数,分组汇总各组观察单位数后而得到的资料。

③、等级资料,又称半定量资料或者有序分类变量。

为将观察单位按某种属性的不同程度分成等级后分组计数,分类汇总各组观察单位数后而得到的资料。

2、统计学常用基本概念:①、统计学(statistics)是关于数据的科学与艺术,包括设计、搜集、整理、分析和表达等步骤,从数据中提炼新的有科学价值的信息。

②、总体(population)指的是根据研究目的而确定的同质观察单位的全体。

③、医学统计学(medical statistics):用统计学的原理和方法处理医学资料中的同质性和变异性的科学和艺术,通过一定数量的观察、对比、分析,揭示那些困惑费解的医学问题背后的规律性。

④、样本(sample):指的是从总体中随机抽取的部分观察单位。

⑤、变量(variable):对观察单位某项特征进行测量或者观察,这种特征称为变量。

⑥、频率(frequency):指的是样本的实际发生率。

⑦、概率(probability):指的是随机事件发生的可能性大小。

用大写的P表示。

3、统计工作的基本步骤:①、统计设计:包括对资料的收集、整理和分析全过程的设想与安排;②、收集资料:采取措施取得准确可靠的原始数据;③、整理资料:将原始数据净化、系统化和条理化;④、分析资料:包括统计描述和统计推断两个方面。

第二章计量资料的统计描述1. 频数表的编制方法,频数分布的类型及频数表的用途①、求极差(range):也称全距,即最大值和最小值之差,记作R;②、确定组段数和组距,组段数通常取10-15组;③、根据组距写出组段,每个组段的下限为L,上限为U,变量X值得归组统一定为L≤X<U,最后一组包括下限。

④、分组划记并统计频数。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

医学统计学重点第一章绪论1.基本概念:总体:根据研究目的确定的性质相同或相近的研究对象的某个变量值的全体。

样本:从总体中随机抽取部分个体的某个变量值的集合。

总体参数:刻画总体特征的指标,简称参数。

是固定不变的常数,一般未知。

统计量:刻画样本特征的指标,由样本观察值计算得到,不包含任何未知参数。

抽样误差:由随机抽样造成的样本统计量与相应的总体参数之间的差异。

频率:若事件A在n次独立重复试验中发生了m次,则称m为频数。

称m/n为事件A在n 次试验中出现的频率或相对频率。

概率:频率所稳定的常数称为概率。

统计描述:选用合适统计指标(样本统计量)、统计图、统计表对数据的数量特征及其分布规律进行刻画和描述。

统计推断:包括参数估计和假设检验。

用样本统计指标(统计量)来推断总体相应指标(参数),称为参数估计。

用样本差别或样本与总体差别推断总体之间是否可能存在差别,称为假设检验。

2.样本特点:足够的样本含量、可靠性、代表性。

3.资料类型:(1)定量资料:又称计量资料、数值变量或尺度资料。

是对观察对象测量指标的数值大小所得的资料,观察指标是定量的,表现为数值大小。

每个个体都能观察到一个观察指标的数值,有度量衡单位。

(2)分类资料:包括无序分类资料(计数资料)和有序分类资料(等级资料)①计数资料:是将观察单位按某种属性或类别分组,清点各组观察单位的个数(频数),由各分组标志及其频数构成。

包括二分类资料和多分类资料。

二分类:将观察对象按两种对立的属性分类,两类间相互对立,互不相容。

多分类:将观察对象按多种互斥的属性分类②等级资料:将观察单位按某种属性的不同程度、档次或等级顺序分组,清点各组观察单位的个数所得的资料。

4.统计工作基本步骤:统计设计、资料收集、资料整理、统计分析。

第二章实验研究的三要素1.实验设计三要素:被试因素、受试对象、实验效应2.误差分类:随机误差(抽样误差、随机测量误差)、系统误差、过失误差。

3.实验设计的三个基本原则:对照原则、随机化分组原则、重复原则。

4.实验设计方法有析因设计正交试验设计均匀试验设计交互作用两组:异体配对设计同体配对设计交叉设计无随机同期对照实验设计(单因素两水平)扩展多组:单因素多水平配伍组设计拉丁方设计(两因素多水平)(三因素多水平)配伍组设计:也称随机区组设计,将条件相近的受试对象配伍,每个配伍组中的对象随机分配到各处理组中。

析因设计:考察两个或两个以上的处理因素,将各个因素的水平进行全面组合,每个组合下至少有两个以上的观察对象重复测量。

一般来讲,应尽可能安排等重复试验,以简化计算,2-3个水平数。

优点是全面性和均衡性较好,可同时分析处理因素的效应及因素间的交互作用。

拉丁方设计:用于三因素等水平无交互。

第三章定量资料的统计描述、参考值范围1.频数表编制过程(了解)(1)找出样本数据的最大值和最小值,计算极差R;(2)分组:确定分组的组距d 和组数k;一般n<50,5-6组;n在100左右,7-10组;n>100,10-15组(3)求频率密度:统计频数,算出频率、频率密度和累积频率;(4)画出直方图。

2.频数表和直方图的作用:用于观察个数较多资料的统计描述,可以直观提示资料的分布特征和分布类型。

3.集中趋势、离散趋势的指标及适用范围(1)集中趋势:x,G,M,P x,M0算术均数:适用于对称分布;不适用于偏态分布和资料中出现极值的资料。

几何均数:适用于呈倍数关系的资料或对数正态分布的资料,尤其是正偏态分布。

不适用与观察值中有0或正负数值同时出现的资料。

中位数:适用于大样本偏态分布或分布情况不明的资料或资料中有不确定数值的资料。

百分位数的作用:多个百分位数结合使用,全面描述数据分布的特征;用于确定医学参考值范围(偏态或分布不明的资料)。

众数:适用于大样本,较粗糙。

(2)离散趋势:极差:优点:简单明了、容易使用。

缺点:①只反映最大值和最小值间的差异,不能反映其他观察值的变异程度。

②样本容量越大,极差可能越大。

③极差的抽样误差大,不稳定。

四分位数间距:适用于确定医学参考值范围,与中位数一起描述偏态分布资料变异程度。

缺点:类似于极差,利用度低。

方差与标准差:与均数一起描述对称分布,特别是正态分布的分布特征。

变异系数:适用于:①适用于比较度量衡单位不同资料的变异度。

②比较均数相差悬殊的资料的变异度。

③衡量实验精密度和稳定性的常用指标。

(3)频数分布特征高峰在中间,左右大致对称,称为对称分布。

平均数=中位数=众数高峰偏向小值的一侧(左侧),称正偏态分布(亦称右偏态)。

平均数>中位数>众数高峰偏向大值的一侧(左侧),称负偏态分布(亦称左偏态)。

平均数<中位数<众数对称分布正(右)偏态分布负(左)偏态分布4.正态分布图形的特点及意义(1)特点:①f(x)关于x=μ对称②x=μ时取得最大值③在x=μ±σ处为拐点,且以x 轴为水平渐近线④f (x )大于0⑤P (x=a )=0⑥若 f (x) 在点 x 处连续,则F ´(x )=f (x) (2)意义:⎰+∞∞-)(x f =1,f (x )在负无穷到正无穷的积分值为1,即曲线下方面积为1。

5.μ和σ2的意义μ:位置参数,当σ固定时,μ增大,曲线沿横轴向右移动;μ减小,曲线沿横轴向左移动。

σ2:形状参数,当μ固定时,σ越大,曲线越矮胖;σ越小,曲线越高瘦。

6.标准化变换z=σμ-x x ~N (μ,σ2) z ~N (0,1) F (x)=Ф(σμ-x )=Ф(z) 即P (X ≤x)=Ф(σμ-x )=P (Z ≤z)P (a<x<b)=F (b)-F (a)=Ф(σμ-b )-Ф(σμ-a ) P (σμ-a <σμ-x <σμ-b )=P (σμ-a < Z <σμ-b )7.标准正态分布界值规定:界值右侧曲线下方面积等于它的下角标。

下角标一致,x 轴上方中间面积一致。

双侧界值:P (|z|≤z 2α)=1-α P (z<z 2α)=1-2αP (|z|≥z 2α)=α P (z>z 2α)=2α单侧界值:上限: 下限:P (z>z α)=α P (z>z 1-α)=1-α P (z<z α)=1-α P (z<z 1-α)=α8.正常值范围及意义概念:医学临床中,常将就诊者的某些生理、生化、免疫学指标的测定结果,与排除了对研究指标有影响的疾病和有关因素的大多数“正常人”的相应数值进行比较,以就诊者的测定值是否超出了大多数“正常人”相应指标的波动范围,作为临床诊断的重要参考,又称医学参考值范围。

意义:95%的参考值范围含义是指:样本中有95%的个体测定值在所求范围之内。

以95%的置信区间来说,意义是:该区间以95%的概率包含了待估计的参数,这种估计的可信度是95%,会冒5%的风险。

公式:双侧95%的界限值:x±1.96s单侧95%的上限值:x+1.645s单侧95%的上限值:x-1.645s第四章总体均数的估计、假设检验1.标准误(1)概念:每次样本计算出的x不同,这些x的标准差称为均数的标准误。

(2)意义:是衡量样本统计量抽样误差大小的统计指标。

(3)与标准差的区别:二者都是描述变异程度的指标,标准差描述个体值的变异,标准误描述统计量的变异。

s(4)均数标准误的公式:S x=n2.置信区间(1)定义:设θ为总体的未知参数,若由样本确定的两个统计量θ1(x1、x2、…、xn)和θ2(x1、x 2、…、x n ),且θ1<θ2,对于预先给定的值α(0<α<1),若满足P(^θ1<^θ2)=1-α, 则称随机区间(^θ1,^θ2)为θ的1-α置信区间,其中称为^θ1置信下限,称为^θ2 置信上限,1-α称置信度。

(2)意义:区间(^θ1,^θ2)包含有参数θ的概率为1-α,不能说θ在(^θ1,^θ2)的概率为 1-α。

例:可以说(a ,b )包含均数μ的概率为95%,不能说μ在(a ,b )的概率为95%。

(3)公式:单个正态总体均数μ的区间估计 ①σ已知:双侧:nz x σα2± 即 x z x σα2±z 分布单侧:nz x σα± 即 x z x σα±②σ未知:双侧:n st x 2α± 即 x s t x 2α± 小样本(n ≤50) t 分布单侧:nst x α± 即 x s t x α±双侧:n sz x 2α± 即 x s z x 2α± 大样本(n>50) z 分布单侧:nsz x α± 即 x s z x α± (4)两要素:准确度:由1-α 决定,1-α 越大,准确度越高。

精确度:由区间长度决定。

99%置信区间准确度高于95%置信区间。

95%置信区间精确度更高。

3.抽样分布(1)t 分布①定义: 来自正态总体的一组样本,x 和s 分别是样本的均数和标准差。

则t=ns x /μ-~t 分布,自由度 df=n-1,极限分布是标准正态分布。

②图形分布特征:以0为中心,左右对称的单峰分布。

自由度越大,越高瘦 ③界值: 双侧:P (|t|≤t 2α)=1-α P (t<t 2α)=1-2αP (|t|≥t 2α)=α P (t>t 2α)=2α单侧:上限: 下限:P (t<t α)=1-α P (t<t 1-α)=α P (t>t α)=α P (t>t 1-α)=1-α (2)χ2分布①定义:若从均数为μ,标准差σ的正态总体中,每次抽取样本含量为n 的样本,计算 样本标准差s ,则χ2=(n-1)s 2/σ2服从自由度df=n-1的χ2分布。

②图形分布特征: 曲线偏向左边 自由度越小曲线越偏③界值: 双侧:P (x 2>x 22α)=2α P (x 2>212α-x )=1-2αP (x 2<x 22α)=1-2α P (x 2<212α-x )=2α单侧:上限: 下限:P (x 2>x 2α)=α P (x 2>x 21-α)=1-α P (x 2<x 2α)=1-α P (x 2<x 21-α)=α (3)F 分布①定义:如果分别从两个正态总体N (μ1,σ1)和N (μ1,σ1)中随机抽取样本含量 n 1、n 2的两个样本,算出样本均数和方差分别为x 1,s 21和x 2,s 22,则σσ22222121//s s F =服从df 1=n 1-1,df 2=n 2-1的F 分布。

若χ1、χ2分别服从自由度df 1、df 2的χ2分布,则F=dfdf222121//χχ~df 1df 2②图形分布特征 曲线偏向左边df 1、df 2同时增大,曲线趋向于对称 ③倒数性质:F df df )(),1(2,1α-=F df df)(2,11α④界值: 双侧:P (F>F 2α)=2α P (F>21α-F )=1-2αP (F<F 2α)=1-2α P (F<21α-F )=2α单侧:上限: 下限:P (F>F α)=α P (F>F 1-α)=1-α P (F<F α)=1-α P (F<F 1-α)=α4.假设检验(1)基本思想:反证法、小概率事件原理 (2)基本步骤:①建立假设,确定检验水准H0:原假设,差异存在但不显著或差异无统计学意义 H1:备择假设,差异显著或差异有统计学意义②在原假设成立条件下,选择统计方法并计算检验统计量。

相关文档
最新文档