医学统计学期末重点总结

合集下载

医学统计学复习重点

医学统计学复习重点

整理分析和2.计描述4.(集合)。

1.抽样随机2.分组随机3.实验顺序随机。

称全距,用离散系数,为标准差与均数只比,常:CV=s/x究,1.抽样研究2.个体变异。

系统误差:指数据搜集和测量过程中由于仪器不准确、造成观察结果呈倾向性的偏大或偏小,这种误差称为系统误差由于一些非人真实性(validity):观察值与真值的接近程度,受系统误差的影响( (reliabiliy)——也称精密度(precision)或重复性(repeatability)是直接用样本统计量作为对应的总体参数最常用的是95%10095有5在描述两变量间的关系时,若散点图呈直线趋势或有直线相关关系,可进行直线回归分析。

参数:根根据样本的分布特征而计算得到的1、★医学统计学工作基本步骤:统计设计;收集资料.;整理资料;分析资料2、★统计分析包括:统计描述、统计推断3、频数分布的两个重要特征:集中趋势和离散趋势4、正态分布的两个参数:均数;标准差。

5、★频数表的用途:揭示计量资料的分布类型;揭示计量资料的分布特征;便于发现特大值和特小值;便于进一步进行统计分析★常见的统计资料的类型有:计量资料;计数资料;等级资料7、★t检验的应用条件是:①正态分布:当样本含量较小时,要求样本来自正态总体。

②方差齐性:两样本均数比较时,要求两总体方差相等。

U检验的应用条件是:①大样本(如n>50);②小样本,σ已知且样本来自正态总体。

8、★.描述分类变量常用的指标有率、构成比、相对数。

9、率是指某种现象在一定条件下,实际发生的观察单位数与可能发生该现象的总观察单位数之比,常用来描述某种现象发生的频率大小或强度构成比是指一事物内部某一组成部分的观察单位数与该事物各组成部分的观察单位总数之比,常用来描述某一事物内部各组成部分所占的比重或分布。

10、★四格表卡方专用公式应用条件n≥40,且Tmin≥5 研究事物或现象间的线性关系用相关分析,研究事物或现象间的线性数量依存关系用回归分析。

医学统计学总结

医学统计学总结

医学统计学总结医学统计学总结1、随机现象:在同一条件下进行试验,一次试验结果不能确定,而在一定数量的重复试验之后呈现统计规律的现象。

2、同质:统计学中对研究指标影响较大的,可以控制的主要因素。

3、变异:同质基础上各观察单位某变量值的差异。

数值变量:变量值是定量的,由此而构成的资料称为数值变量资料或计量资料,其数值是连续性的,称之为连续型变量。

变量无序分类变量:所分类别或属性之间无顺序和程度上的差异分类变量:定性变量有序分类变量:有顺序和程度上的差异4总体和无限总体。

5、样本:是按随机化原则从同质总体中随机抽取的部分观察单位某变量值的集合。

样本代表性的前提:同质总体,足够的观察单位数,随机抽样。

统计学中,描述样本特征的指标称为统计量,描述总体特征的指标称为参数。

6、概率:描述随机事件发生的可能性大小的一个度量。

若P(A)=1,则称A为必然事件;若P(A)=0,则称A为不可能事件;随机事件A的概率为0<P<1.小概率事件:若随机事件A的概率P≤α,则称随机事件A为小概率事件,其统计学意义为:小概率事件在一次随机试验中认为是不可能发生的。

统计描述1、频数分布有两个重要的特征:集中趋势和离散程度。

频数分布有对称分布和偏态分布之分。

后者是指频数分布不对称,集中趋势偏向一侧,如偏向数值小的一侧为正偏态分布,如偏向数值大的一侧为负偏态分布。

2、常用的集中趋势的描述指标有:均数,几何均数,中位数等。

均数:适用于正态或近似正态的分布的数值变量资料。

样本均数用_表示,总体均数用μ几何均数:适用于等比级数资料和对数呈正态分布的资料。

注意观察值中不能有零,一组观察值中不能同时有正值和负值。

中位数:适用于偏态分布资料以及频数分布的一端或两端无确切数据的资料。

3、常用的离散程度的描述指标有:全距,四分位数间距,方差,标准差,变异系数。

全距:任何资料,一组中最大值与最小值的差。

四分位数间距:适用于偏态分布以及分布的一端或两端无确切数据资料。

医学统计学重点总结

医学统计学重点总结
小结:
(1) 单个样本均数 H0:μ=μ0t= ν=n-1 (小样本)
(已知样本——均数) H1:μ≠μ0
α=u= 或u= (大样本)(2)配对:H0:μ=μ0
H1:μ≠μ0t= ν=对子数-1
α=
(3) 两独立样本均数H0:μ=μ0t= ν=n1+n2-2
(4)(已知样本——样本) H1:μ≠μ0
9.对任何参数μ和σ的正态分布,都可以通过一个简单的变量变换成标准正态分布,即μ=X-μ
σ
9
标准正态分布
正态分布
面积或概率
-1~1
μ σ
%
~
μ σ
%
·
μ σ
%
10.医学参考值范围(reference value range)传统上称作正常值范围,指正常人的解剖、生理、生化、免疫及组织代谢产物的含量等各种数据的波动范围。习惯上是包含95%的参照总体的范围。
实际工作中标准差 σ往往未知,因而通常用样本标准差S代替σ,求得样本均数 准误估计值S ,计算公式为 S = (当n→无穷,S→σ,S →0)
3 95%的可信区间的计算:x (μ,σ ) 1) σ已知,可信区间= σ
2)σ未知,n为小样本: t 3)σ未知,n为大样本:
T变换
μ变换
N (0,1)
3、t分布曲线的形态变化与自由度v=n-1有关。
2.四格表专用公式(
3对于四格表资料,通常规定为:(1)当n≥40且所有的T ≥ 5时,用检验的基本公式或四格表的专用公式;(2)当n ≥ 40 但有1≤T<5时,用四格表资料的校正公式;(3)当n<40,或T<1时,用四格表资料的Fisher确切 概率法。
4 行×列表资料的χ 检验: 自由度:ν=(行数-1)(列数-1)

医学统计学期末重点总结

医学统计学期末重点总结

误差:观测值与真实值、样本计量与总体参数之间的差别。

相对数:两个有关的绝对数之比,也可以是两个有关联统计指标之比。

相对比:相对比是A、B两个有关联指标值之比,用以描述两者的对比水平,说明A是B 的若干倍或百分之几。

统计描述:描述及总结一组数据的重要特征,目的是使实验或观察得到的数据表达清楚并便于分析。

统计推断:指由样本数据的特征推断总体特征的方法,包括参数估计和假设检验。

同质:指根据研究目的所确定的观察单位其性质应大致相同。

变量:反映实验或观察对象生理、生化、解剖等特征的指标,变量的观测值称为数据。

定量数据:也称计量资料。

变量的观测值是定量的,其特点是能够用数值大小衡量其水平的高低,一般有计量单位。

根据变量的取值特征可分为连续型数据和离散型数据。

有序数据:也称半定量数据或等级资料。

变量的观测值是定性的,但各类别(属性)之间有程度或顺序上的差别。

总体:根据研究目的确定的所有同质观察单位的全体,它包括所有定义范围内的个体变量值。

样本:从研究总体中抽取部分有代表性的观察单位,对变量进行观测得到的数据。

参数:描述总体特征的指标称为参数。

统计量:描述样本特征的指标称为统计量。

概率:描述某事件发生可能性大小的度量。

小概率事件:习惯上将P≤0.05的事件称为小概率事件。

平均数:是描述一组观察值集中位置或平均水平的统计指标,常用的有算术均数、几何均数和中位数。

率:率表示在一定空间或时间范围内某现象的发生数与可能发生的总数之比。

构成比:表示某事物内部各组成部分在整体中所占的比重,常以百分数表示,计算公式为区间估计:是指按预先给定的概率,计算出一个区间,使它能够包含未知的总体均数。

线性相关的概念:研究两个变量之间是否具有直线相关关系。

相关系数:是说明具有线性相关关系的两个数值变量间相关的密切程度与相关方向的统计量。

研究对象:根据研究目的而确定的观察总体,也可称为受试对象或实验对象。

处理因素:根据研究目而欲施研究对象的干预措施。

医学统计学重点总结

医学统计学重点总结
医学统计学
综合练习
三类资料
(1) 定量资料(quantitative data) 以定量值表达每个观察单位的某项观察指标, 如血脂、心率等。 特点:
① 各观察单位间只有量的差别; ② 数据间有连续性。
三类资料
(2) 定性资料(qualitative data) 以定性方式表达每个观察单位的某项观察指标, 如血型、性别等。 特点:
举例 血型(A、B、O、AB) 人群中某病发生与否(发生、不发生)
描述指标: 相对数
率 构成比 相对比
常用相对数(1)
率(rate),又称频率指标,说明某现 象发生的频率和强度。(强度相对数)
率 = 可 实 能 际 发 发 生 生 某 某 现 现 象 象 的 的 观 观 察 察 单 单 位 位 总 数 数 比 例 基 数
比 A B
四格表(fourfold table)的概念
a
b
c
d
这四个格子的频数是整个表的基本数据,其 余数据都是从这四个基本数据推算出来的,这 种资料称为四格表资料。
2检验的基本思想
如果H0假设成立,则实际频数( actual
frequency)与理论频数应该比较接近。
如果实际频数与理论频数相差较大,超出了
区别
r 没有单位,b有单位;所以,相关系数与单位无 关,回归系数与单位有关;
相关表示相互关系;回归表示依存关系; 对资料的要求不同:
当X和Y都是随机的,可以进行相关和回归分析; 当Y是随机的(X是控制的),理论上只能作回归而不能作相关分析

实验研究的基本要素
处理因素:作用于受试对象,要求在实验过 程中观察其处理的因素
两样本比较的秩和检验(基本原理) Wilcoxon符号秩和检验(基本原理)

医学卫生统计期末总结

医学卫生统计期末总结

医学卫生统计期末总结一、引言医学卫生统计是现代医学与卫生事业中的一门重要学科,它以数理统计学为基础理论,运用各种方法来研究和分析医学和卫生领域的数据。

本学期,我们学习了医学卫生统计的基本概念、研究方法与技巧,以及一些实际应用案例。

通过学习,我对医学卫生统计有了更深入的认识,也掌握了一些基本的数据分析技能。

二、理论知识掌握在学习医学卫生统计的过程中,我们学习了很多基本概念和理论知识,如概率与统计的基本概念、统计数据的描述和总结、假设检验等。

掌握这些基本理论知识对于进行医学卫生统计的研究和应用具有重要意义。

三、数据分析方法在医学卫生统计中,我们使用了多种数据分析方法,如描述性统计、相关分析、多元回归分析等。

通过实际应用案例的学习,我对这些方法有了一定的了解,并能够独立进行一些简单的数据分析。

四、实际应用案例本学期,我们还学习了一些实际的医学卫生统计应用案例,如流行病学调查、临床试验设计等。

通过对这些案例的学习,我对医学卫生统计的实际应用有了更深入的认识,并了解了一些实际应用中需要注意的问题。

五、遇到的困难与解决在学习医学卫生统计过程中,我也遇到了一些困难。

一方面,理论知识较多,需要花费一定时间来消化和理解。

另一方面,数据分析方法的应用也需要一些实际操作,掌握需要一定的实践经验。

为了解决这些困难,我主动向老师请教,也积极与同学交流,通过课外阅读和实际练习,不断提升自己的理论和实践水平。

六、学习收获与展望通过本学期的学习,我对医学卫生统计有了更深入的认识,掌握了一些基本的理论和实践知识。

在以后的学习和实践中,我将继续深入学习医学卫生统计的相关知识,提升自己的数据分析能力,为医学卫生事业的发展做出自己的贡献。

总之,医学卫生统计作为一门重要的学科,在现代医学与卫生事业中具有重要地位。

通过本学期的学习,我对医学卫生统计有了更深入的了解,也掌握了一些基本的理论和实践知识。

在今后的学习和实践中,我将继续深入学习和应用医学卫生统计的相关知识,不断提升自己的数据分析能力,为医学卫生事业的发展做出自己的贡献。

医学统计学重点重点知识总结

医学统计学重点重点知识总结

医学统计学重点选择1.几何均数:平均血清抗体滴度(如P9例2.4)2.正态分布:横轴为μ(界值、面积)2.5% I1.962.5%单侧双侧90%: 1.6495%: 1.64 1.9699%: 2.583.P值与α的关系,α是人为规定的,它们之间没有关系;P值f,Qt(X)4.方差分析自由度V的计算,V总=nT;V组间=组数(k)-1;V组间=V总-V组间5.理论秩和(n(n+1)∕2),实际秩和(通过平均秩次算)6.可信区间的正确应用:总体参数有95%的可能落在该区间内(X);有95%的总体参数在该区间内(X);该区间包含95%的总体参数(X);该区间有95%的可能包含总体参数。

(X);这个区间的可信度为95%(√);总体参数只有一个,要么在区间内,要么不在7.相关系数与回归系数:相关系数为0,两个变量之间没有相关关系(X);回归系数t,相关系数t(X);(要做假设检验)二、名解1.参考值范围:根据正常人的数据估计绝大多数的正常人所在的范围2.区间估计(可信区间):按一定的概率或可信度(bα)用一个区间估计总体参数所在范围。

这个范围称作可信度为1-a的可信区间,又称置信区间。

3.P值:拒绝HO时所冒的风险(或“作出拒绝HO而接受H1”结论时冒了P风险)4.a(第一类错误):HO真实时被拒绝(或HO真实时,拒绝H0,接受H1)5.β(第二类错误):HO不真实时不拒绝(或HO不真实时,不拒绝HO)1-β检验效能:对真实的H1做肯定结论之概率6.秩次:是指全部观察值按某种顺序排列的位序;7.秩和:同组秩次之和8.剩余标准差:扣除了X的影响后,Y方面的变异;引进回归方程后,Y方面的变异。

三、简答1.假设检验与可信区间的联系与区别分辨多个样本是否分别属于不同的总体,并对总体作出适当的结论。

分辨一个样本是否属于某特定总体等。

区间估计(可信区间):按一定的概率或可信度(1-a)用一个区间估计总体参数所在范围。

医学数理统计期末总结

医学数理统计期末总结

医学数理统计期末总结一、引言医学数理统计是将数学和统计学的原理与方法应用于医学领域的一门学科。

通过分析和解释医学数据,医学数理统计能够帮助医学工作者更好地理解和应用医学知识,为医学研究和临床实践提供科学依据。

医学数理统计作为医学的重要辅助学科,对于医学专业的学生而言,具有重要的学术意义和实际价值。

本次期末总结将对医学数理统计的基本概念、方法和应用进行总结和归纳,希望能够对今后的学习和工作有所帮助。

二、基本概念1. 概率论基础:医学数理统计的基础是概率论,包括基本概念、概率分布、随机变量、随机过程等内容。

掌握概率论的基本知识,能够帮助我们理解统计学的原理和方法。

2. 统计学基本概念:统计学是指通过对数据进行收集、整理、分析和解释,揭示事物之间的规律和关系的科学。

掌握统计学的基本概念,包括总体和样本、参数和统计量、频数分布、统计推断等,是进行医学数理统计工作的基础。

三、统计方法1. 描述统计学:描述统计学是通过数理统计方法对数据进行整理、分析和描述,从而揭示数据的基本特征。

包括数据的整理和展示、中心位置和离散程度的度量、数据分布和形态的描述等内容。

掌握描述统计学的方法,能够对医学数据进行分析和解释。

2. 参数检验:参数检验是指通过对样本数据进行分析,推断总体参数的值是否在某个范围内,并对其进行推断的方法。

包括单样本参数检验、双样本参数检验和配对样本参数检验等。

参数检验方法能够帮助我们判断和验证医学数据的差异是否具有统计学意义。

3. 方差分析:方差分析是一种通过比较两个或多个样本均值是否相等的方法。

包括单因素方差分析、双因素方差分析和多因素方差分析等。

方差分析方法能够帮助我们研究不同因素对医学数据的影响和差异。

4. 相关分析:相关分析是一种通过计算两个或多个变量之间关系的强弱和方向的方法。

包括皮尔逊相关系数、斯皮尔曼相关系数和判定系数等。

相关分析方法能够帮助我们研究变量之间的相关性,为医学研究提供科学依据。

医学统计学期末复习总结

医学统计学期末复习总结

医学统计学期末复习总结医学统计学期末复习总结名词解释1.参数Patameter:是指总体的统计指标,如总体均数、标准差,,采用希腊字母分别记为μ、σ。

是固定的常数。

多数情况下,总体参数是不易知道的,但可以通过随机抽样抽取具有代表性的样本,用算得的样本统计量估计未知的总体参数。

2.统计量statistic:样本的统计指标,如样本均数、标准差,采用拉丁字母分别记为X、S。

样本统计量是在总体参数附近波动的随机变量,可用来估计总体参数。

3.系统误差systematic error:是实验过程中产生的误差,它的值或恒定不变,或遵循一定的变化规律,其产生原因往往是克制的或可能掌握的。

(受确定因素影响,大小变化有方向性)4随机误差random error:是一类不恒定的、随机变化的误差,由多种尚无法控制的因素引起。

(影响因素众多,变化无方向性,不可避免,但可用统计方法进行分析)5 I型错误type I error:拒绝了实际上成立的H0,这类“弃真”的错误称为I型错误,其概率大小用α来表示。

(1-a)即可信度:重复抽样时,样本区间包含总体参数(m)的百分数。

6 II型错误type II error:“接受”了实际上不成立的H0,这类“取伪”的错误称为II型错误,其概率大小用β来表示。

(1-β)即把握度(或检验效能):两总体确有差别,被检出有差别的能力。

7 P值P-value:在H0成立的前提下,用样本数据获得的样本统计量,及比样本统计量总计更极端的曲线下的面积。

8 置信区间confidence bound / confidence interval, CI:按预先给定的概率(1-α)所确定的包含未知总体参数的一个范围。

9 多重共线性Multicollinearity:是指线性回归模型中的解释变量之间由于存在精确相关关系或高度相关关系而使模型估计失真或难以估计准确。

10哑变量dummy variable:用以反映质的属性的一个人工变量,是量化了的自变量,通常取值为0或1。

医学统计学知识点汇总

医学统计学知识点汇总

医学统计学知识点汇总医学统计学是指应用统计学原理和方法进行医学研究设计、数据分析和结果解释的学科。

医学统计学的知识点非常丰富,包括统计学基础知识、研究设计、样本量计算、控制方法、参数估计、假设检验和数据分析等方面。

以下是医学统计学知识点的一些精华汇总。

1.统计学基本概念:包括基本统计量(均值、中位数、众数)、数据类型(定量数据、定性数据)、数据的描述方法(频数分布表、直方图等)。

2.研究设计:包括随机对照试验、队列研究、病例对照研究等,了解不同研究设计的优缺点及适用场景。

3.样本量计算:确定研究样本量是保证研究结果可靠性的重要一环,需要根据研究目的、效应量和统计显著性水平确定样本量。

4.控制方法:包括随机分组、盲法、配对设计等,用于减少实验误差和避免偏倚。

5.参数估计:常用的参数估计方法有点估计和区间估计。

点估计是通过样本数据得到总体参数的一个点估计值,区间估计是对总体参数的一个区间估计。

6.假设检验:假设检验是用来判断样本数据与总体假设之间的差异是否显著的统计方法。

常用的假设检验方法有t检验、卡方检验、方差分析等。

7.数据分析:包括描述性统计分析和推断性统计分析。

描述性统计分析用来描述研究变量的基本情况,推断性统计分析用来推断样本数据与总体数据之间的关系。

8.相关分析:用来分析变量之间的关联程度,包括皮尔逊相关系数和斯皮尔曼等级相关系数等。

9. 回归分析:用来分析因变量与自变量之间的关系,包括线性回归分析和 logistic回归分析等。

10.生存分析:用来分析时间到达事件发生的概率,包括生存曲线的绘制、生存率的估计和影响因素的分析等。

11. 多变量分析:用来分析多个自变量对因变量的影响,包括多元方差分析、多元回归分析和多元Logistic回归分析等。

12. Meta分析:用于综合多个独立研究结果,对总体效应进行定量分析和综合评价。

以上是医学统计学的一些精华知识点的汇总。

医学统计学的应用非常广泛,不仅在医学研究中需要应用统计学的原理和方法,也在临床实践中需要对医学统计学知识有一定的了解和应用。

医学统计学重点整理汇总

医学统计学重点整理汇总

医学统计学重点第一章绪论1.基本概念:总体:根据研究目的确定的性质相同或相近的研究对象的某个变量值的全体。

样本:从总体中随机抽取部分个体的某个变量值的集合。

总体参数:刻画总体特征的指标,简称参数。

是固定不变的常数,一般未知。

统计量:刻画样本特征的指标,由样本观察值计算得到,不包含任何未知参数。

抽样误差:由随机抽样造成的样本统计量与相应的总体参数之间的差异。

频率:若事件A在n次独立重复试验中发生了m次,则称m为频数。

称m/n为事件A在n次试验中出现的频率或相对频率。

概率:频率所稳定的常数称为概率。

统计描述:选用合适统计指标(样本统计量)、统计图、统计表对数据的数量特征及其分布规律进行刻画和描述。

统计推断:包括参数估计和假设检验。

用样本统计指标(统计量)来推断总体相应指标(参数),称为参数估计。

用样本差别或样本与总体差别推断总体之间是否可能存在差别,称为假设检验。

2.样本特点:足够的样本含量、可靠性、代表性。

3.资料类型:(1)定量资料:又称计量资料、数值变量或尺度资料。

是对观察对象测量指标的数值大小所得的资料,观察指标是定量的,表现为数值大小。

每个个体都能观察到一个观察指标的数值,有度量衡单位。

(2)分类资料:包括无序分类资料(计数资料)和有序分类资料(等级资料)①计数资料:是将观察单位按某种属性或类别分组,清点各组观察单位的个数(频数),由各分组标志及其频数构成。

包括二分类资料和多分类资料。

二分类:将观察对象按两种对立的属性分类,两类间相互对立,互不相容。

多分类:将观察对象按多种互斥的属性分类②等级资料:将观察单位按某种属性的不同程度、档次或等级顺序分组,清点各组观察单位的个数所得的资料。

4.统计工作基本步骤:统计设计、资料收集、资料整理、统计分析。

第二章实验研究的三要素1.实验设计三要素:被试因素、受试对象、实验效应2.误差分类:随机误差(抽样误差、随机测量误差)、系统误差、过失误差。

3.实验设计的三个基本原则:对照原则、随机化分组原则、重复原则。

(完整版)医学统计学重点总结

(完整版)医学统计学重点总结

1.简述总体和样本的定义,并且举例说明。

总体是研究目的确定的所有同质观察单位的全体。

样品是从研究总体中抽取部分有代表性的观察单位。

2.简述参数和统计量的定义,并且举例说明。

描述总体特征的指标称为参数,描述样本特征的指标称为统计量。

3.变量的类型有哪几种?举例说明各种类型变量有什么特点。

①定量数据:计量资料;定量的观测值是定量的,其特点是能够用数值的大小衡量其水平的高低。

②定性数据:计数资料;变量的观测值是定性的,表现为互不相容的类别或属性。

③有序数据:半定量数据/等级资料;变量的观测值是定性的,但各类别(属性)有程度或顺序上的差异。

4.请举例说明一种类型的变量如何变换为另一种类型的变量。

定量数据>有序数据>定性数据--------------->5.请简述什么是小概率事件?概率是描述事件发生可能性大小的度量,P 0.05事件称为小概率事件。

≤6.举例说明什么是配对设计。

配对设计是将受试对象按某些重要特征相近的原则配成对子,每对中的两个个体随机地给予两种处理。

①同源配对:同一受试对象或同一标本的两个部分,随机分配接受两种不同处理;②异源配对:为消除混杂因素的影响,将两个同质受试对象配对分别接受两种处理。

7.非参数假设检验适合什么类型数据进行分析?①总体分布类型未知或非正态分布数据;②定量或半定量数据;③数据两端无确定的数值。

8.简述P 25 P 50 P 75的统计学意义。

(条件:明显偏态且不能转化为正态或近似对称;一端或两端无确定数值;分布情况未知)用来描述资料的观测值序列在某百分位置的水平,四分位数间距可以作为说明个体差异的指标(说明个体在不同位置的变异情况)。

9.直条图、直方图、圆饼图的使用条件是什么?直条图:各自独立的统计指标的数值大小和他们之间的对比;直方图:连续变量频数分布情况;圆饼图:全体中各部分所占的比例。

10.统计分析包括哪两个方面的内容?为什么要进行统计推断?统计描述和统计分析;统计描述用来描述及总结一组数据的重要特征,其目的是使实验或观察得到的数据表达清楚并便于分析。

医学统计学_总结_重点_笔记_复习资料

医学统计学_总结_重点_笔记_复习资料

第一章2选1总体:总体(population)是根据研究目的确定的同质观察单位(研究对象)的全体,实际上是某一变量值的集合。

可分为有限总体和无限总体。

总体中的所有单位都能够标识者为有限总体,反之为无限总体。

总体population根据研究目的而确定的同质观察单位的全体。

样本:从总体中随机抽取部分观察单位,其测量结果的集合称为样本(sample)。

样本应具有代表性。

所谓有代表性的样本,是指用随机抽样方法获得的样本。

样本sample从总体中随机抽得的部分观察单位,其实测值的集合。

3选1小概率事件:我们把概率很接近于0(即在大量重复试验中出现的频率非常低)的事件称为小概率事件。

P值:P 值即概率,反映某一事件发生的可能性大小。

统计学根据显著性检验方法所得到的P 值反应结果真实程度,一般以P ≤ 0.05 认为有统计学意义, P ≤0.01 认为有高度统计学意义,其含义是样本间的差异由抽样误差所致的概率等于或小于0.05 或0.01。

P值是:1) 一种概率,一种在原假设为真的前提下出现观察样本以及更极端情况的概率。

2) 拒绝原假设的最小显著性水平。

3) 观察到的(实例的) 显著性水平。

4) 表示对原假设的支持程度,是用于确定是否应该拒绝原假设的另一种方法。

小概率原理:一个事件如果发生的概率很小的话,那么可认为它在一次实际实验中是不会发生的,数学上称之小概率原理,也称为小概率的实际不可能性原理。

统计学中,一般认为等于或小于0.05或0.01的概率为小概率。

资料的类型(3选1)(1)计量资料:对每个观察单位用定量的方法测定某项指标量的大小,所得的资料称为计量资料(measurement data)。

计量资料亦称定量资料、测量资料。

.其变量值是定量的,表现为数值大小,一般有度量衡单位。

如某一患者的身高(cm)、体重(kg)、红细胞计数(1012/L)、脉搏(次/分)、血压(KPa)等。

计量资料measurement data定量资料quantitative data数值变量资料numerical variable为观测每个观察单位某项指标的大小,而获得的资料。

完整版医学统计学复习要点

完整版医学统计学复习要点

第一章绪论1、数据 / 资料的分类:①、计量资料,又称定量资料也许数值变量;为观察每个观察单位某项治疗的大小而获取的资料。

②、计数资料,又称定性资料也许无序分类变量;为将观察单位依照某种属性也许种类分组计数,分组汇总各组观察单位数后而获取的资料。

③、等级资料,又称半定量资料也许有序分类变量。

为将观察单位按某种属性的不相同程度分成等级后分组计数,分类汇总各组观察单位数后而获取的资料。

2、统计学常用基本看法:①、统计学( statistics)是关于数据的科学与艺术,包括设计、收集、整理、解析和表达等步骤,从数据中提炼新的有科学价值的信息。

②、整体( population )指的是依照研究目的而确定的同质观察单位的全体。

③、医学统计学( medical statistics):用统计学的原理和方法办理医学资料中的同质性和变异性的科学和艺术,经过一定数量的观察、比较、解析,揭穿那些迷惑难懂的医学问题背后的规律性。

④、样本( sample):指的是从整体中随机抽取的部分观察单位。

⑤、变量( variable):对观察单位某项特点进行测量也许观察,这类特点称为变量。

⑥、频率( frequency ):指的是样本的本质发生率。

⑦、概率( probability):指的是随机事件发生的可能性大小。

用大写的 P 表示。

3、统计工作的基本步骤:①、统计设计:包括对资料的收集、整理和解析全过程的设想④、分组划记并统计频数。

与安排;频数分布的种类包括对称分布和偏态分布;②、收集资料:采用措施获取正确可靠的原始数据;偏态分布主要分为右偏态分布(也称正偏态分布)和左偏态分③、整理资料:将原始数据净化、系统化和条理化;布(也称负偏态分布)。

④、解析资料:包括统计描述和统计推断两个方面。

频数表的用途包括以下几个方面:①、描述频数分布的种类;第二章计量资料的统计描述②、描述频数分布的特点;1.频数表的编制方法,频数分布的种类及频数表的用途③、便于发现一些特大或特小的离群值;①、求极差( range ):也称全距,即最大值和最小值之差,记④、便于进一步做统计解析和办理。

医学统计学 重点知识总结

医学统计学 重点知识总结

名词解释1、一类错误:拒绝了实际上成立的H。

,这类“弃真”的错误称为I型错误或第一类错误。

2、参数和统计量:这些总体的统计指标或特征值称为参数。

由样本所算出的统计指标或特征值称为统计量。

3、变异系数:亦称离散系数,为标准差与均数之比,常用百分数表示。

4、P值:即概率,反映某一事件发生的可能性大小。

5、检验效能:B称为检验效能或把握度,即两总体却有差别,按α水准能发现它们有差别的能力。

简答题1、描述数值变量资料(统计资料)的集中程度有哪些指标,有何运用条件?算数均数:单峰对称分布的资料几何均数:对数变换后的单峰对称的资料中位数:偏态分布,分布不明资料,有不确定值的资料。

百分位数:当样本含量较少时不宜用靠近俩端的百分位数来估计频数分布范围。

2、实验研究的基本要素和基本原则是什么?基本要素:处理因素、受试对象和实验效应。

基本原则:对照原则、随机化原则和重狂原则大题1、(1)变量资料(2)成组t检验对立性正态性方差齐性(3)H0ιμ1=μ2,新药与常规药物的疗效相同H1rμ1≠μ2,新药与常规药物的疗效不同α=0.05T=1.0195V=n1+n2-2=18(2)t<t0.05z18,p>0.05,按a=0.05水准,不拒绝H0,差别无统计学意义。

结论:t检验结果表明,故尚不能认为新药与常规药物的疗效相同。

2、(1)T=13×17/47=4.7(2)x2检验(3)X2>X2(0.05,1),p<0.05,按a=0.05水准,拒绝H0,接受HQ差别有统计学意义。

结论:x2检验结果表明,乙疗法比甲疗法好。

3、(1)成组设计两样本比较的秩和检验(2)实验组秩次:13、I15、8.5、14、15.5、15.5、17、18对照组秩次:1、2、4、3、5、6、8.5、7、10、11.5(3)H0:两组局部温热的疗效总体分布相同H1:两组局部温热的疗效总体分布不同4(1)Ho:P=O,即母体内时间与体重无线性相关关系H1:P≠0,即母体内时间与体重有线性相关关系a=0.05F>5.23,拒绝HO,接受HI,相关系数有统计学意义。

医学统计学期末考试重点

医学统计学期末考试重点

一、总体:是根据研究目的确定的同质观测单位的集合。

样本:是从统计总体中随机抽取的、具有代表性的部分观测单位的集合。

同质:即构成总体的各个观测单位在某一方面或几方面的性质相同或基本相同。

变异:是指在同质基础上各观测单位之间的差异。

离散型变量:指只能取可数的或有限个数的变量。

特点只是取顺序整数值连续性变量:指可以取各整数区间的一切实数值的变量。

特点是在两个连续的整数值之间还可以用小数或分数连接起来的非整数值。

二、统计的含义1.统计工作:指搜集、整理、分析和研究统计数据的工作,是统计数据与统计理论的基础和源泉。

2.统计数据:指统计工作研究的主体及成果。

3.统计学:是对研究对象的数据进行搜集、整理、分析和研究,以揭示其总体特征和规律性的方法论科学。

三、统计学的主要内容1.研究设计:是按照研究目的和统计学要求制定具有针对性、具体性、专业性的工作方案。

2.统计描述:用统计指标、统计图、统计表等方法描述样本资料的数据特征及其分布规律,是整个统计学的基础。

3.统计推断:用样本信息推论总体特征的归纳过程,它有两个重要领域。

四、误差及其分类误差指实际观测值与真值之差或样本指标与总体指标之差。

误差分为非随机误差和随机误差,非随机误差:粗差-粗心大意,无规律性,可以避免;系统误差-仪器、方法、等条件的差异,感官、理论和实验方法的差异。

随机误差:测量误差-由一系列实验或观测条件的随机波动造成的实测值与真值之差;抽样误差-随机抽样引起的统计量与参数之间的差异。

五、统计工作的基本步骤研究设计、搜集资料、整理资料、分析资料中医统计资料的搜集与整理一、中医统计资料的类型1.计量资料:是由数值变量产生的资料,即对每个观察单位用计量方法测得某项标志数值大小所得资料,变量值大多有度量衡单位;2.计数资料:是由分类变量产生的资料,即对每个观察单位按某种属性分组计数得到的资料,变量值变现为互不相容的属性或类别,无度量衡单位。

统计描述一、频数分布:是指观测值按大小分组,各个组段内观测值个数的分布,它是了解数据分布形态特征与规律的基础。

医学统计学重点知识总结

医学统计学重点知识总结

医学统计学第一章 绪言研究设计、资料分析、结论定量资料:以定量值表达每个观察单位的某项观察指标,如血脂心率等。

定性资料:以定性方式表达每个观察单位的某项观察指标,如血型性别等。

等级资料:以等级方式表达每个观察单位的某项观察指标,如疗效分级等。

总体:是指按研究目的所确定的研究对象中所有观察单位某项指标取值的集合。

样本:是指从研究总体中随机抽取具有代表性的部分观察单位某项指标取值的集合。

(以上均可能考名解)描述某总体特征的指标称为总体参数,简称参数;描述某样本特征的指标称为样本统计量,简称统计量。

概率是随机事件发生可能性大小的一个度量,概率小于或等于0.05时,统计学通常称该事件为小概率事件,其涵义为该事件发生的可能性很小,进而认为其在一次抽样中不可能发生,此即为小概率原理。

定量资料的统计指标(大题):算术均数,几何均数,中位数和百分位数。

同质性与异质性:同质是指观察单位具有相同的性质,是构成研究总体的必备条件;异质性是指性质不同,研究内容不同,对同质性的要求不同。

第二章 个体变异与变量分布变异(名解):是以具有同质性的观察单位为载体,某项观察指标在观察单位之间显示的差别。

【在同质的基础上各观察单位(或个体)之间的差异】 正偏态与负偏态【2.3节为重点,尤其是统计指标与图的关系】几何均数应用于比值数据,中位数适用于偏态分布离散趋势指标(重点简答):全距,四分位数间距,方差,标准差和变异系数,其中常用的是标准差和变异系数。

变异系数(名解):亦称离散系数,是标准差s 与均数x 之比,即XS CV X100%,变异系数常用于比较度量衡单位不同的两组或多组资料的变异度、比较均数相差悬殊的两组或多组资料的变异度。

如何正确使用相对数(选择或简答):1,计算相对数的分母不宜过小。

2,分析时不能以构成比代替率。

3,对观察单位数不等的几个率,不能直接相加求其平均率(或称总率)。

4,计算率时要注意资料的同质性,对比分析时应注意资料的可比性。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

误差:观测值与真实值、样本计量与总体参数之间的差别。

相对数:两个有关的绝对数之比,也可以是两个有关联统计指标之比。

相对比:相对比是A、B两个有关联指标值之比,用以描述两者的对比水平,说明A是B 的若干倍或百分之几。

统计描述:描述及总结一组数据的重要特征,目的是使实验或观察得到的数据表达清楚并便于分析。

统计推断:指由样本数据的特征推断总体特征的方法,包括参数估计和假设检验。

同质:指根据研究目的所确定的观察单位其性质应大致相同。

变量:反映实验或观察对象生理、生化、解剖等特征的指标,变量的观测值称为数据。

定量数据:也称计量资料。

变量的观测值是定量的,其特点是能够用数值大小衡量其水平的高低,一般有计量单位。

根据变量的取值特征可分为连续型数据和离散型数据。

有序数据:也称半定量数据或等级资料。

变量的观测值是定性的,但各类别(属性)之间有程度或顺序上的差别。

总体:根据研究目的确定的所有同质观察单位的全体,它包括所有定义范围内的个体变量值。

样本:从研究总体中抽取部分有代表性的观察单位,对变量进行观测得到的数据。

参数:描述总体特征的指标称为参数。

统计量:描述样本特征的指标称为统计量。

概率:描述某事件发生可能性大小的度量。

小概率事件:习惯上将P≤0.05的事件称为小概率事件。

平均数:是描述一组观察值集中位置或平均水平的统计指标,常用的有算术均数、几何均数和中位数。

率:率表示在一定空间或时间范围内某现象的发生数与可能发生的总数之比。

构成比:表示某事物内部各组成部分在整体中所占的比重,常以百分数表示,计算公式为区间估计:是指按预先给定的概率,计算出一个区间,使它能够包含未知的总体均数。

线性相关的概念:研究两个变量之间是否具有直线相关关系。

相关系数:是说明具有线性相关关系的两个数值变量间相关的密切程度与相关方向的统计量。

研究对象:根据研究目的而确定的观察总体,也可称为受试对象或实验对象。

处理因素:根据研究目而欲施研究对象的干预措施。

处理水平:处理因素在实验中所处的状态称为因素的水平(level),亦称处理水平。

对照:指在实验中应设立对照组,其目的是通过与对照组效应对比鉴别出实验组的效应大小。

随机化:是指每个受试对象有相同的概率或机会被分配到不同的处理组。

重复:是指在相同实验条件下重复进行多次观察。

统计学的基本内容:统计设计,数据整理,统计描述,统计判断
数据类型:定量数据,定性数据,有序数据
误差的类型:系统误差,随机测量误差,抽样误差
配对样本t检验配对设计:同源配对,异源配对,自身配对
方差分析的基本思想:将全部观测值的总变异按影响因素分解为相应的若干部分变异,在此基础上,计算假设检验的统计量F 值,实现对总体均数是否有差别的推断。

非参数检验的适用范围:①总体分布类型未知或非正态分布数据;②有序或半定量资料;③数据两端无确定的数值。

标准差与标准误的区别与联系:区别:标准差:意义,描述个体观察值变异程度的大小,标准差越小,均数对一组观察值的代表性越好。

应用,与X拔结合,用以描述个体观察值的
分布范围,常用于医学参考值范围估计。

与N的关系,N越大,S越趋于稳定
标准误Sx拔:描述样本均数变异程度及抽样误差的大小,标准误越小,用样本均数推断总体均数可靠性好。

与X拔结合,用以估计总体的均数可能出现的范围,以及对总体的均数作假设检验。

N越大,Sx拔越小。

联系:标准差与标准误都是描述便宜程度的指标。

Sx拔与S成正比,N一定时,S越大,Sx拔越大
1类错误与2类错误区别联系:区别:依依不通过,1类错误为拒绝了实际上成立的H0,也称弃真错误,第2类错误为不拒绝实际上不成立的H0,也称存伪错误。

概率不同,1类错误的概率为α,是根据研究目的设定的,2类错误概率为β是未知的,β能通过α间接估计大小。

联系:当样本含量一定时,α越大,β越小,α越小,β越大。

要同时减少1、2类错误,可增加样本含量
怎样正确选择用单侧检验和双侧检验:对于假设中的单侧检验和双侧检验的选择,要根据研究目的和专业知识而定。

若目的在于判断两总体均数,是否不等,或者有无差别,则应选择双侧检验,若从专业知识认为不会出现M<M0或M>M0,而检验目的是用以说明M>M0或M<M0时,则应选择单侧检验,在对专业知识不明确时,一般选择双侧检验单侧检验易获得p<α的结论,应慎重使用
线性回归与相关的关系:对同一资料做相关回归分析,相关系数r与回归系数b的正负符号相同,对同一资料做相关与回归分析,相关系数的t检验与回归系数的t检验相同,即t=tb,相关与回归可以相互解释,即r的平方=SS回归/SS总
计量资料的检验方法有哪些:t检验(样本均数总体均数的比较,两个样本的均数的比较,配对资料的t检验)μ检验:大样本均数与总体均数的比较,两个大样本均数的比较。

F检验:完全随机设计单因素方差分析,随机区组设计方差分析,拉丁方设计的f方差分析
描述计量资料离散趋势常用的指标有哪些,其适用条件:指标有:极差,四分位数,方差,标准差,变异系数。

适用条件:极差和四分位数适用于偏态分布资料用以描述其离散程度或变异度。

方差标准差适用于对称分布或正态分布资料用以描述其离散程度或变异度。

变异系数适用于度量衡单位不同,或均数相差比较悬殊的两组资料,比较其离散程度,或变异度描述计量资料集中趋势的指标有哪些,其适用条件:指标:算数平均数,几何均数,中位数。

适用条件:算数平均数适用于对称分布或正态分布资料,几何均数适用于等比分布或对数正态分布资料
卡方资料的假设检验方法(四格表资料卡方检验,行x列资料,配对资料
描述计量资料的统计描述有:频数分布表和频数直方图,集中趋势的描述(常用平均数,算数平均数,几何均数,中位数)离散趋势的描述(极差,四分为间距,方差,标准差,变异系数)
描述方差分析的应用范围:完全随机设计的两个或两个以上的均数比较的方差分析,随机区组设计的方差分析,拉丁方设计的方差分析,回归分析中直线回归方程的假设检验,多个因素的交互作用分析
简述检验假设步骤:建立假设和确定检验水准,选择检验方法和计算检验统计,确定p值和做出统计推断结论
均数的可信区间与参考值范围有何不同:可信区间:是指按预先给定的概率,计算出一个区间,使它能够包含未知的总体均数。

计算:正态分布:δ未知
应用:总体均数的区间估计,评估未知总体均数所在的范围;参考值范围:正常人的解剖,生理,生化某项指标波动的范围,95%参考值范围指同质总体包含95%个体值的估计范围,说明个体的波动范围。

计算:
判断观察值的某项指标与否,评价个体指标是否正常。

线性回归分析的应用:1. 线性回归方程可应用于以下三个方面:①分析两个变量之间是否存在线性依存关系;②利用回归方程由自变量X 对应变量Y 进行估计,必要时可以作区间估计;③利用回归方程进行统计控制,即利用回归方程进行逆运算,通过控制自变量X 取值来限定应变量Y在一定范围内波动。

2. 作回归分析时,如果两个有内在联系的变量之间存在因果关系,那么应该以原因变量为X ,以结果变量为Y;如果变量之间因果关系难以确定,则应以易于测定或变异较小者为X。

3. 在回归分析中,自变量X 既可以是随机变量,也可以是给定的量。

如果Y不服从正态分布,在进行回归分析前,应先进行变量的变换以使应变量符合回归分析的要求。

4. 使用回归方程估计Y 值时,尽量不要把估计的范围扩大到建立方程时的自变量的取值范围之外,由于超出样本取值范围,其线性关系是否成立难以判断,外推要慎重。

相关文档
最新文档