医学统计学复习

合集下载

医学统计学复习资料

医学统计学复习资料

小;③要注意分子分母正确选用;④要注意率与比的正确应用;⑤要注 意平均率的计算方法;⑥要注意资料的可比性;⑦率和构成比比较时作 假设检验。 7. 简述直线回归与直线相关的区别。 (1)资料要求上不同:直线回归分析适用于应变量是服从正态分布的随 机变量,自变量是选定变量;直线相关分析适用于服从双变量正态分布 的资料。 (2) 两种系数的意义不同:回归系数是表明两个变量之间数量上的依存 关系,回归系数越大回归直线越陡峭,表示应变量随自变量变化越快; 相关系数是表明两个变量之间相关的方向和紧密程度的,相关系数越 大,两个变量的关联程度越大。 9. 假设检验的理论依据是什么?请简述假设检验的基本步骤。 答:假设检验的理论依据是小概率事件原理,步骤为: (1)根据研究目的建立假设,确定检验水准 (2)根据样本统计量的抽样分布规律,选择适当的统计方法,计算检验 统计量 (3)确定P值,做出推断结论 10.方差分析应用广泛,可用于:①两个或多个样本均数间的比较;②分 析两个或多个因素间的交互作用;③回归方程的线性假设检验;④多元 线性回归分析中偏回归系数的假设检验等。本章主要介绍完全随机设计 资料的方差分析、配伍组设计资料的方差分析及重复测量数据的方差分 析。 11. 完全随机设计的两样本率比较时,如何正确选择统计分析方法 (写出相应的计算公式)。 (1)当总例数n≥40且所有格子的T≥5时,用2检验的基本公式或四格表 资料2检验的专用公式; (2)当n≥40但有1≤T<5时,用四格表资料2检验的校正公式;或改用四 格表资料的Fisher确切概率法的连续性校正法: (3)当n<40,或T<1时,用四格表资料的Fisher确切概率法。 12. 什么是医学参考值范围?估计医学参考值范围如何正确选用统计 方法? 答:医学参考值范围是指所谓“正常人”的解剖、生理、生化等指标的 波动范围,亦称正常值范围。如95%的参考值范围包括了95%的观察 值,而有5%的观察值不在这一范围内。 估计医学参考值范围确定方法:

医学统计学复习资料

医学统计学复习资料

医学统计学第一章绪论第一节医学统计学的定义和内容1.医学统计学的主要内容 :统计推断、统计描述第二节统计工作的基本步骤1.医学统计工作可分为四个步骤:统计设计搜集资料整理资料分析资料第三节统计资料的类型医学统计资料按研究指标的性质一般分为:定量资料、定性资料、等级资料一、定量资料(计量资料)定量资料(quantitative data)是用定量的方法测定观察单位(个体)某项指标数值的大小,所得的资料称定量资料。

如身高(㎝)、体重(㎏)、脉搏(次/分)、血压(kPa,mmHg)等为数值变量,其组成的资料为定量资料。

二、定性资料(计数资料)定性资料(qualitative data)是将观察单位按某种属性或类别分组,清点各组的观察单位数,所得的资料。

亦称无序分类资料。

如:男-女分组;中医的虚、实,阴、阳等分组;按生存-死亡分组;A、B、O、AB分组。

三、等级资料等级资料(ranked data)是将观察单位按属性的等级分组,清点各组的观察单位数,所得的资料为等级资料。

亦称有序分类资料。

如治疗结果分为治愈、显效、好转、无效四个等级。

:疾病的严重程度可以分为,轻、中、重;中医辨证中舌象的颜色有,淡、红、暗、紫。

♦根据需要,各类变量可以互相转化。

♦若按贫血的诊断标准将血红蛋白分为四个等级:重度贫血、中度贫血、轻度贫血、正常,可按等级资料处理。

有时亦可将定性资料或等级资料数量化,如将等级资料的治疗结果赋以分值,分别用0、1、2…等表示,则可按定量资料处理。

第四节统计学中的几个基本概念一、同质与变异同质(homogeneity)是指观察单位或研究个体间被研究指标的主要影响因素相同或基本相同。

如研究儿童的生长发育,同性别、同年龄、同地区、同民族、健康的儿童即为同质儿童。

变异(variation)由于生物个体的各种指标所受影响因素极为复杂,同质的个体间各种指标存在差异,这种差异称为变异。

如同质的儿童身高、体重、血压、脉搏等指标会有一定的差别。

《医学统计学》总复习

《医学统计学》总复习
《医学统计学》总复习 医学统计学》
§1 统计分析
一,定量资料的统计分析
定量资料的统计描述
反映集中趋势的指标: X 反映集中趋势的指标: 反映离散趋势的指标: 反映离散趋势的指标:
定量资料的统计推断
G
S
M
S2 Q CV
R
参数估计 假设检验
参数估计
点估计:用样本均数直接作为总体 点估计:
三,等级资料的统计分析(秩和检验) 等级资料的统计分析(秩和检验)
非参数检验的概念 非参数检验的优缺点 常用的秩和检验方法
(1) Wilcoxon符号秩和检验 配对设计 符号秩和检验(配对设计 符号秩和检验 配对设计) (2) Wilcoxon 两样本比较法 成组设计两样本 两样本比较法(成组设计两样本 成组设计两样本) (3) Kruskal-Wallis 法或 检验 (成组设计多样本 法或H 成组设计多样本) 成组设计多样本 (4) Friedman 法(随机区组设计 随机区组设计) 随机区组设计 (5) Nemenyi 法(成组设计多样本两两比较) 成组设计多样本两两比较) 成组设计多样本两两比较 (6) 随机区组设计两两比较的秩和检验
u 检验应用类型: 检验应用类型: 1)样本均数与总体均数的比较 2)完全随机设计的两样本均数的比较 ANOVA 检验应用类型: 检验应用类型: 1)完全随机设计的方差分析 2)随机区组设计的方差分析 3)交叉设计的方差分析 4)析因设计的方差分析 5)重复测量资料的方差分析
二,计数资料的统计分析
t 检验 t'检验 检验 ′
t
u 检验 ANOVA
正态分布的经验判断方法
若 若 , S ≥ 3X可认为资料呈偏态分布
S ≥ ,有理由怀疑资料呈偏态分布 X

医学统计学复习资料(完整版)

医学统计学复习资料(完整版)

第1章绪论医学统计学是一门“运用统计学的原理和方法,研究医学科研中有关数据的收集、整理和分析的应用科学。

1.个体:又称观察单位,是统计研究的最基本单位,也是构成总体的最基本的观察单位。

2.总体:根据研究目的确定的同质观察单位某项指标测量值(观察值)的集合。

分为有限总体(明确规定了空间、时间、人群范围内有限个观察单位)和无限总体(无时间和空间范围的限制)。

反映总体特征的指标为参数,常用小写希腊字母表示。

3.样本:从总体中随机抽取的一部分有代表性的观察单位组成的整体。

(抽样,随机化原则,样本含量)根据样本资料计算出来的相应指标为统计量,常用大写英文字母表示。

4.抽样研究:从总体中随机抽取样本,根据样本信息推断总体特征的方法。

抽样误差是由随机抽样(样本的偶然性)造成的样本指标与总体指标之间、样本指标与样本指标之间的差异。

其根源在于总体中的个体存在变异性。

只要是抽样研究,就一定存在抽样误差,不能用样本的指标直接下结论。

统计分析主要是针对抽样误差而言。

5.变量(一个个体的任意“特征”);资料(变量值的集合),资料类型:①计量资料/定量资料/数值变量资料:表现为数值大小,一般有度量衡单位,又可分为连续型和离散型两类;②计数资料/定性资料/无序分类变量资料/名义变量资料:表现为互补相容的属性或类别,一般无度量衡单位,可分为二分类和多分类;③等级资料/半定量资料/有序分类变量资料:表现为等级大小或属性程度。

各类资料间可相互转化。

①可选分析方法有:t检验、方差分析、相关回归分析等;②可选分析方法有:χ2检验、z检验等;③可选分析方法有:秩和检验、Ridit分析等。

6.误差:实测值与真实值之差。

可分为随机误差(随机测量误差+抽样误差)与非随机误差(系统误差与非系统误差)。

①随机误差:是一类不恒定、随机变化的误差,由多种尚无法控制的因素引起,它是不可避免的;②系统误差:是实验过程中产生的误差,它的值或恒定不变,或遵循一定的变化规律,其产生原因往往是可知的或可以掌握的,它是可以消除或控制的;③非系统误差:又称过失误差,是指在实验过程中由于研究者偶然失误而造成的误差,可以消除。

医学统计学复习资料

医学统计学复习资料

医学统计学复习资料导言医学统计学是医学领域中非常重要的一门学科,它的作用是帮助医生和研究人员通过收集、分析和解释数据来评估医学检验和治疗的效果。

本文将提供一份医学统计学的复习资料,帮助读者回顾和巩固相关的知识。

一、基本概念1.1 总体和样本在医学统计学中,总体是指我们研究的整体对象,而样本则是总体的一个子集。

例如,我们对某种疾病的患者进行研究时,患者总体就是所有患该病的人群,而样本则是我们实际观察到的一部分患者。

1.2 参数和统计量在医学统计学中,参数是用来描述总体特征的统计量,例如总体均值、总体方差等。

而统计量是通过样本数据来估计总体参数的量,例如样本均值、样本方差等。

假设检验是医学统计学中常用的一种方法,它用于判断总体参数的假设是否成立。

在假设检验中,我们先假设总体参数的某个值是正确的(称为零假设),然后通过收集样本数据来判断该假设是否成立。

二、数据的分布2.1 正态分布正态分布在医学统计学中非常重要,因为许多统计方法都假设数据服从正态分布。

正态分布具有钟形曲线的特点,均值、中位数和众数都重合在一起。

常见的正态分布检验有Shapiro-Wilk检验和Kolmogorov-Smirnov检验。

2.2 t分布t分布是一种在样本量较小的情况下使用的概率分布,它比正态分布的尾部更加厚重。

t分布的形状取决于样本量,当样本量增加时,t分布逐渐趋近于正态分布。

在医学研究中,常用t分布来进行样本均值的假设检验。

非参数检验是一种不依赖于数据分布的统计方法,它对数据的要求相对较低。

与参数检验不同,非参数检验适用于无法确定数据分布或偏离正态分布的情况。

常见的非参数检验方法有Wilcoxon秩和检验和Mann-Whitney U检验。

三、统计推断3.1 置信区间置信区间是一种用来估计总体参数的范围,它是一个区间,表示我们对总体参数的估计在一定置信水平下的可信程度。

通常,置信区间的宽度与置信水平相关,越高的置信水平意味着更宽的置信区间。

(完整)医学统计学复习(练习及答案)

(完整)医学统计学复习(练习及答案)

第1题:下列有关等级相关系数ts的描述中不正确的是A。

不服从双变量正态分布的资料宜计算rSB。

等级数据宜计算rsC。

rs值-1~+1之间D.查rs界值表时, rs值越大,所对应的概率P值也越大E。

当变量中相同秩次较多时,宜计算校正rs值,使rs值减小第2题:对某样本的相关系数r和0的差别进行检验,结果t1A。

两变量的差别无统计意义B.两变量存在直线相关的可能性小于5%C。

两变量肯定不存在相关关系D.两变量间存在相关关系E。

就本资料尚不能认为两变量存在直线相关关系第3题:总体率95%可信区间的意义是。

A.95%的正常值在此范围B。

95%的样本率在此范围C.95%的总体率在此范围D.总体率在此范围内的可能性为95%E。

样本率在此范围内的可能性为95%第4题:样本含量的确定下面哪种说法合理。

A。

样本越大越好B.样本越小越好C。

保证一定检验效能条件下尽量增大样本含量D.保证一定检验效能条件下尽量减少样本含量E.越易于组织实施的样本含量越好第5题:直线相关与回归分析中,下列描述不正确的是。

A.r值的范围在—1~+1之间B.已知r来自ρ≠0的总体,则r〉0表示正相关, r<0表示负相关C。

已知Y和X相关,则必可计算其直线回归方程D。

回归描述两变量的依存关系,相关描述其相互关系E.r无单位第6题:四格表χ2检验的自由度为1,是因为四格表的四个理论频数( )A.受一个独立条件限制B。

受二个独立条件限制C。

受三个独立条件限制D。

受四个独立条件限制E.不受任何限制第7题:对同一双变量(X,Y)的样本进行样本相关系数的tr检验和样本回归系数的tb检验,有。

A. tb≠trB. tb=trC. tb〉trD。

tbE。

视具体情况而定第8题:为了由样本推断总体,样本应该是。

A。

总体中任意的一部分B.总体中的典型部分C。

总体中有意义的一部分D。

总体中有价值的一部分E。

总体中有代表性的一部分第9题:以下检验方法属非参数法的是。

医学统计学复习资料(名解+简答)

医学统计学复习资料(名解+简答)

医学统计学复习资料(名解+简答)一、名词解释1.统计量 (statistic):统计量是统计理论中用来对数据进行分析、检验的变量。

2.同质 (homogeneity):是指观察单位(研究个体)间被研究指标的影响因素相同。

3. 抽样误差 (sampling error):由于随机抽样造成的样本均数与总体均数的差别。

4. 总体 (population):根据研究目的而确定的同质观察单位的全体称为总体,更确切的说,它是同质的所有观察单位某种观察值的集合。

5. 变异 (variation):变异就是标志在同一总体不同总体单位之间的差别。

6. 参数 (parameter):参数,也叫参变量,是一种变量。

7. 样本 (sample):研究中实际观测或调查的一部分个体称为样本,研究对象的全部称为总体。

8. 概率 (probability):概率是对随机事件发生的可能性的度量,一般以一个在0到1之间的实数表示一个事件发生的可能性大小。

越接近1,该事件更可能发生;越接近0,则该事件更不可能发生。

1. 正态分布 (normal distribution):靠近均数分布的频数最多,离开均数越远,分布的数据越少,左右两侧基本对称,这种中间多、两侧逐渐减少的基本对称的分布,称为正态分布2. 中位数 (median):一组数据按从小到大(或从大到小)的顺序依次排列,处在中间位置的一个数(或最中间两个数据的平均数,注意:和众数不同,中位数不一定在这组数据中)3. 方差 (variance):是各个数据与其算术平均数的离差平方和的平均数,通常以σ2表示。

4. 四分位数间距 (quartile interval):是上四分位数与下四分位数之差,用四分位数间距可反映变异程度的大小。

5. 正偏态分布 (positively skewed distribution):为统计学概念,即统计数据峰值与平均值不相等的频率分布。

如果频数分布的高峰向左偏移,长尾向右侧延伸称为正偏态分布,也称右偏态分布。

《医学统计学》复习资料

《医学统计学》复习资料

统计学概述一、统计学的意义统计学是研究数据的收集、整理、分析的一门科学,是认识社会和自然现象客观规律数量特征的重要工具。

统计学方法就是帮助人们透过偶然现象认识其内在的规律性,揭示疾病或现象发生、发展规律,为预防疾病、促进健康提供客观依据。

二、统计学的基本概念(一)同质与变异同质是指被研究指标的影响因素相同。

变异是同质基础上的观察单位(亦称为个体)之间的差异。

(二)总体与样本总体是指根据研究目的确定的同质观察单位的全体。

样本从总体中随机抽取的部分观察单位,其测量值(或变量值)的集合。

(三)变量与变量值变量:确定总体后,研究者应对每个观察单位的某些特征进行测量或观察,这种特征称为变量,如:身高、体重等。

变量值:变量的测得值。

如身高150cm,体重50Kg等。

(四)参数与统计量参数是指总体特征的统计指标。

如某地健康成年男性的平均血红蛋白值。

统计量是指样本特征的统计指标。

如从某地健康成年男性中抽取一部分人的平均血红蛋白值。

(五)误差误差泛指测量值与真实值之差。

根据误差的性质和来源,统计工作中产生的误差主要有三种类型,即系统误差、随机测量误差、抽样误差。

1.系统误差:测量结果有倾向性。

查明原因,可以避免。

特点:①测量结果有倾向性。

如仪器、试剂、判定标准等。

②查明原因,可以避免。

2.随机测量误差:收集资料的过程中,即使避免了系统误差,但由于各种偶然因素造成的测量值与真实值不完全一致,这种误差称为随机测量误差。

特点:①随机误差没有大小和方向。

②不可避免。

3.抽样误差:由于随机抽样所引起的样本统计量与总体参数之间的差异以及各样本统计量之间的差异称为抽样误差。

特点:变异是绝对的,抽样误差不可避免。

原因:个体之间的差异;抽样时只能抽取总体中的一部分作为样本。

(六)概率(P)概率是描述某随机事件发生可能性大小的量值,常用符号P表示。

随机事件的概率在0~1之间,即0≤P≤1。

小概率事件:P≤0.05或P≤0.01的事件。

医学统计学总复习

医学统计学总复习

医学统计学总复习1、几种集中趋势指标的适用条件均数—正态分布或近似正态分布;几何均数—呈正偏态分布,但数据经过对数变换后呈正态分布的资料,也可用于观察值之间呈倍数或近似倍数变化(等比关系)的资料;中位数—偏态分布资料以及频数分布的一端或两端无确切数据资料。

几种离散程度指标的适用条件:极差(全距)—常用于描述单峰对称分布小样本资料的变异程度或用于初步了解资料。

四分位数间距—常用于描述偏态分布资料、两端无确切值或分布不明确资料的离散程度。

方差和标准差—正态分布和近似正态分布。

变异系数—比较计量单位不同以及均数相差悬殊的几组资料。

21.标准正态分布(u分布)与t分布的异同:相同点;集中位置都是0,都是单峰分布,是对称分布,标准正态分布是t分布的特例(自由度是无限大时)。

不同点:t分布是一簇分布曲线,t分布的曲线形态是随自由度的变化而变化,标准正态分布的曲线的形态不变,是固定不变的,因为它的形状参数为1。

3.为什么不可以说“总体均数有95%的概率落在这个区间里”?样调查的成本会更高5.t检验的应用条件为:▪①在单样本检验中,总体标准差未知且样本含量较小(n<50)时,要求样本来自正态分布总体;▪②成组检验要求两组资料相应的总体分别服从正态分布且方差齐。

当不满足这些条件时可使用变量变换将数据转换成正态或者近似正态分布,或使用秩和检验。

两小样本均数比较时,若两总体方差不相等,还可使用t’检验。

6.假设检验中的注意事项▪要保证组间的可比性▪要根据研究目的、设计类型和资料类型选用适当的检验方法▪正确理解假设检验中概率P值的含义▪结论不能绝对化▪单、双侧检验应事先确定7.方差分析的基本思想把全部观察值间的变异按设计类型的不同,分解成两个或多个组成部分,然后将各部分的变异与随机误差进行比较,以判断各部分的变异是否具有统计学意义。

8.方差分析的应用条件▪ 1. 各样本是相互独立的随机样本,均服从正态分布▪ 2. 各样本的总体方差相等,即方差齐性独立、正态、方差齐性如果方差不齐时,可采用F’检验或秩和检验。

医学统计学复习题

医学统计学复习题

一、最佳选择题1.抽样研究是一种科学高效的方法,目的是研究( B )• A.样本 B.总体• C.抽样误差 D.概率2.由样本推断总体,样本应该是( D )• A.总体中的典型部分• B.总体中有意义的部分• C.总体中有价值的部分• D.总体中有代表性的部分3.统计上所说的系统误差、过失误差、测量误差和抽样误差四种误差,在实际工作中( C )• A.四种误差都不可避免• B.过失误差和测量误差不可避免• C.测量误差和抽样误差不可避免• D.系统误差和抽样误差不可避免4.统计描述是指( C )• A.比较指标的差别有无显著性• B.估计参数• C.用统计指标描述事物的特征• D.判断无效假设是否成立5.统计推断是指( D )• A.从总体推断样本特征• B.从总体推断总体特征• C.从样本推断样本特征• D.从样本推断总体特征6.对某样品进行测量时,由于仪器事先未校正,造成测量结果普遍偏高,这种误差属于( A )• A.系统误差 B.随机测量误差• C.抽样误差 D.过失误差7.随机抽样的目的是( D )• A.能消除系统误差• B.能消除测量误差• C.能消除抽样误差• D.能减小样本偏性8.对某地200名16岁中学生口腔检查,发现患龋齿的人数为54人,该资料属于( B )• A.计量资料 B.计数资料• C.等级资料 D.三个都不是9.计量资料是( C )• A.用仪器测量出来的资料• B.按观察单位的类别,清点各类观察单位数的资料• C.用定量方法测定观察单位某个变量的大小的资料• D.按观察单位的等级,清点各等级观察单位数的资料10.计数资料是( B )• A.用仪器测量出来的资料• B.按观察单位的类别,清点各类观察单位数的资料• C.用定量方法测定观察单位某个变量的大小的资料• D.按观察单位的等级,清点各等级观察单位数的资料11.等级资料是( D )• A.用仪器测量出来的资料• B.按观察单位的类别,清点各类观察单位数的资料• C.用定量方法测定观察单位某个变量的大小的资料• D.按观察单位的等级,清点各等级观察单位数的资料12.下列哪种不属于计量资料( C )• A.红细胞数 B.血钙浓度• C.阳性人数 D.脉搏13.下列哪种属于等级资料( A )• A.治疗痊愈、有效、无效人数• B.各血型人数• C.白细胞分类百分比• D.贫血和不贫血人数二、判断题• 1.统计工作的主要内容是对资料进行统计分析。

医学统计学复习题

医学统计学复习题

医学统计学复习题一、名词解释1.总体:根据研究目的确定的同质的观察单位的全体,更确切的说,是同质的所有观察单位某种观察值变量值的集合;总体可分为有限总体和无限总体;总体中的所有单位都能够标识者为有限总体,反之为无限总体;2.样本:从总体中随机抽取部分观察单位,其测量结果的集合称为样本sample;样本应具有代表性;所谓有代表性的样本,是指用随机抽样方法获得的样本;3.随机抽样:随机抽样random sampling是指按照随机化的原则总体中每一个观察单位都有同等的机会被选入到样本中,从总体中抽取部分观察单位的过程;随机抽样是样本具有代表性的保证;4.变异:在自然状态下,个体间测量结果的差异称为变异variation;变异是生物医学研究领域普遍存在的现象;严格的说,在自然状态下,任何两个患者或研究群体间都存在差异,其表现为各种生理测量值的参差不齐;5.计量资料:对每个观察单位用定量的方法测定某项指标量的大小,所得的资料称为计量资料measurement data;计量资料亦称定量资料、测量资料;.其变量值是定量的,表现为数值大小,一般有度量衡单位;如某一患者的身高cm、体重kg、红细胞计数1012/L、脉搏次/分、血压KPa等;6.计数资料:将观察单位按某种属性或类别分组,所得的观察单位数称为计数资料count data;计数资料亦称定性资料或分类资料;其观察值是定性的,表现为互不相容的类别或属性;如调查某地某时的男、女性人口数;治疗一批患者,其治疗效果为有效、无效的人数;调查一批少数民族居民的A、B、AB、O四种血型的人数等;7.等级资料:将观察单位按测量结果的某种属性的不同程度分组,所得各组的观察单位数,称为等级资料ordinal data;等级资料又称有序资料;如患者的治疗结果可分为治愈、好转、有效、无效、死亡,各种结果既是分类结果,又有顺序和等级差别,但这种差别却不能准确测量;8.概率:概率probability又称几率,是度量某一随机事件A发生可能性大小的一个数值,记为PA,PA越大,说明A事件发生的可能性越大;0﹤PA﹤1;9.频率:在相同的条件下,独立重复做n次试验,事件A出现了m次,则比值m/n 称为随机事件A在n次试验中出现的频率freqency;当试验重复很多次时PA=m/n;10. 随机误差:随机误差random error又称偶然误差,是指排除了系统误差后尚存的误差;它受多种因素的影响,使观察值不按方向性和系统性而随机的变化;误差变量一般服从正态分布;随机误差可以通过统计处理来估计;11.系统误差:是指由于仪器未校正、测量者感官的某种偏差、医生掌握疗效标准偏高或偏低等原因,使观察值不是分散在真值的两侧,而是有方向性、系统性或周期性地偏离真值;系统误差可以通过实验设计和完善技术措施来消除或使之减少;12.参数:指总体的统计指标,如总体均数、总体率等;总体参数是固定的常数;多数情况下,总体参数是不易知道的,但可通过随机抽样抽取有代表性的样本,用算得的样本统计量估计未知的总体参数;13.统计量:是指样本的统计指标,如样本均数、样本率等;样本统计量可用来估计总体参数;总体参数是固定的常数,统计量是在总体参数附近波动的随机变量;14.频数表frequency table用来表示一批数据各观察值或在不同取值区间的出现的频繁程度频数;对于离散数据,每一个观察值即对应一个频数,如某医院某年度一日内死亡0,1,2…20个病人的天数;对于散布区间很大的离散数据和连续型数据,数据散布区间由若干组段组成,每个组段对应一个频数;15.算术均数arithmetic mean 描述一组数据在数量上的平均水平;总体均数用μ表示,样本均数用 表示;16.几何均数geometric mean 用以描述对数正态分布或数据呈倍数变化资料的水平;记为G;17.中位数median 将一组观察值由小到大排列,n 为奇数时取位次居中的变量值;为偶数时,取位次居中的两个变量的平均值;18.极差range 亦称全距,即最大值与最小值之差,用于资料的粗略分析,其计算简便但稳定性较差;19.百分位数percentile 是将n 个观察值从小到大依次排列,再把它们的位次依次转化为百分位;百分位数的另一个重要用途是确定医学参考值范围;20.四分位数间距inter-quartile range 是由第3四分位数和第1四分位数相减计算而得,常与中位数一起使用,描述偏态分布资料的分布特征,较极差稳定;21.方差variance :方差表示一组数据的平均离散情况,由离均差的平方和除以样本个数得到;22.标准差standard deviation 是方差的正平方根,使用的量纲与原量纲相同,适用于近似正态分布的资料,大样本、小样本均可,最为常用;23.变异系数coefficient of variation 用于观察指标单位不同或均数相差较大时两组资料变异程度的比较;用CV 表示;24.正态分布:若指标X 的频率曲线对应于数学上的正态曲线,则称该指标服从正态分布normal distribution;通常用记号),(2σμN 表示均数为μ,标准差为σ的正态分布;25.标准正态分布:均数为0、标准差为1的正态分布被称为标准正态分布standard normal distribution,通常记为2N;(0,1)26.抽样误差:抽样研究中,由抽样引起的样本统计量与总体参数间的差别称为抽样误差sampling error;统计上用标准误standard error,SE来衡量抽样误差的大小;其产生的本质原因是由于个体间存在变异;27.可信区间:按预先给定的概率确定的包含未知总体参数的可能范围;该范围称为总体参数的可信区间confidence interval,CI;它的确切含义是:可信区间包含总体参数的可能性是1-α,而不是总体参数落在该范围的可能性为1-α;28.相对数relative number是两个有联系的指标之比,是分类变量常用的描述性统计指标,常用相对数有率、构成比、比等;29.率rate又称频率指标,说明一定时期内某现象发生的频率或强度;30.构成比proportion又称构成指标,说明某一事物内部各组成部分所占的比重或分布;31.标准化法standardization method是常用于内部构成不同的两个或多个率比较的一种方法;标准化法的基本思想就是指定一个统一“标准”标准人口构成比或标准人口数,按指定“标准”计算调整率,使之具备可比性以后再比较,以消除由于内部构成不同对总率比较带来的影响;32.统计表:将统计资料及其指标以表格形式列出,称为统计表statisticaltable;狭义的统计表只表示统计指标;33.统计图statistical graph:是将统计指标以点的位置、线段的升降、直条的长短或面积的大小等几何图形直观的表示事物间的数量关系;34.普通线图适用于连续性资料;用线段的升降来表示一事物随另一事物变化的趋势;35.散点图以点的密集程度和趋势表示两种事物间的相关关系;二、简答题1. 一位研究人员欲做一项实验研究,研究设计应包括那几方面的内容答:一般来讲,研究设计应包括两方面的设计:专业设计和统计设计;专业设计是针对专业问题进行的研究设计,如选题、形成假说、干预措施、实验对象、实验方法等;统计设计是针对统计数据收集进行的设计,如样本来源、样本量、干预措施的分配、统计设计类型测量指标的选择等;统计设计是统计分析的基础,任何设计上的缺陷,都不可能在统计分析阶段弥补和纠正;2.试述极差、四分位数间距、标准差及变异系数的适用范围;答:这三个指标均反映计量资料的离散程度;极差与四分位数间距可用于任何分布,后者较前者稳定,但均不能综合反映各观察值的变异程度;标准差最为常用,要求资料近似服从正态分布;变异系数可用于多组资料间度量衡单位不同或均数相差悬殊时的变异程度比较;3.简述医学中参考值范围的涵义及制定参考值范围的一般步骤;医学中常把绝大多数正常人的某指标范围称为该指标的参考值范围,也叫正常值范围;所谓“正常人”不是指完全健康的人,而是指排除了所研究指标的疾病和有关因素的同质人群;制定参考值范围的一般步骤:1定义“正常人”,不同的指标“正常人”的定义也不同;2选定足够数量的正常人作为研究对象;3用统一和准确的方法测定相应的指标;4根据不同的用途选定适当的百分界限,常用95%;5根据此指标的实际意义,决定用单侧范围还是双侧范围;6根据此指标的分布决定计算方法,常用的计算方法:正态分布法、百分位数法;4.正态分布的特征:服从正态分布的变量的频数分布由均数、标准差完全决定;1 是正态分布的位置参数,描述正态分布的集中趋势位置;正态分布以为对称轴,左右完全对称;正态分布的均数、中位数、众数相同,均等于 ;2 描述正态分布资料数据分布的离散程度, 越大,数据分布越分散, 越小,数据分布越集中; 也称为是正态分布的形状参数, 越大,曲线越扁平,反之, 越小,曲线越瘦高;5. 四格表资料卡方检验校正条件:分析四格表资料时,应注意连续性校正的问题,当1<T<5,n>40时,用连续性校正2χ检验;T≤1,或n≤40时,用Fisher精确概率法;6.统计表的结构与编制要求统计表由标题、标目、线条和数字所构成;如下表所示:顶线表号标题横标目名称纵标目名称合计横标目合计数字底线1 标题位于表的上方,概括表的主要内容,一般需注明时间与地点;2标目有横、纵标目之分,分别说明横行和纵行数字的含义,应做到文字简明,层次清楚;3线条多采用三条半线,即顶线、底线、纵标目下的横隔线及合计上的半线;忌斜线和竖线;4数字表内数据一律采用阿拉伯数字;同一指标小数点位数要一致,位次要对齐;表内不应有空项,无数字用“—”表示,数字若为零则填“0”,暂缺项或未记录用“…”表示;5备注不为表的必备内容,如有必要,可在表内用“”号标记,然后在表的下方加以说明;7.统计表的种类统计表可分为简单表simple table和复合表combinative table两种类型;简单表:只按单一特征或标志分组;复合表:按两个或两个以上主要标志分组,如年龄和性别结合起来分组;8.制图的基本要求1根据资料的性质和分析目的,选择合适的图形;2标题扼要说明图的主要内容,位于图的下方,必要时注明时间和地点;3建立在直角坐标系上的统计图,其纵轴尺度自下而上,横轴尺度从左到右,数字一律由小到大,某些图还要求纵轴尺度从0开始如直条图、直方图;纵横两轴一般应有标目,注明单位;9.统计表和统计图在表达资料中各有何特殊意义统计表可以代替冗长的文字叙述,便于指标的计算、分析和对比,其制作合理与否,对统计分析质量有着重要的影响;统计图可用点的位置、线段的升降、直条的长短和面积的大小直观地反映分析事物间的数量关系;因统计如对数量表达较粗略,故最好附上相应的统计表;10.统计表有哪些要素构成制表的注意事项有哪些一般说来,统计表由标题、标目、线条、数字四部分构成有时附有备注;编制统计表的注意事项:1 标题概括表的内容,写于表的上方,通常需注明时间与地点;2 标目以横、纵标目分别说明主语与谓语,文字简明,层次清楚;3 线条不宜过多,通常采用三条半线表示,即顶线、底线、纵标目下的横隔线及合计上的半条线 ;4 表内一律采用阿拉伯数字;同一指标小数点位数要一致,数次要对齐;表内不留空格;5 备注不要列于表内,如有必要,可在表内用“”号标记,并在表外加以说明;11.频数表制作的基本步骤:用来表示一批数据各观察值或在不同取值区间的出现的频繁程度频数;对于离散数据,每一个观察值即对应一个频数,如某医院某年度一日内死亡0,1,2,…20个病人的天数;如描述某学校学生性别分布情况,男、女生的人数即为各自的频数;对于散布区间很大的离散数据和连续型数据,数据散布区间由若干组段组成,每个组段对应一个频数;制作连续型数据频数表一般步骤如下:1求数据的极差range;min max X X R -=2-12根据极差选定适当“组段”数通常8—10个;确定组段和组距;每个组段都有下限L 和上限U ,数据χ归组统一定为L ≤χ<U ;3写出组段,逐一划记;频数表可用于揭示资料的分布特征和分布类型,在文献中常用于陈述资料,它便于发现某些特大或特小的可疑值,也便于进一步计算指标和统计分析处理;12.实验设计的基本原则1随机化原则总体中的每一个观察单位都有同等的机会被选入实验组和对照组或进入样本,保证了非处理因素在各组间均衡一致而使样本具有代表性;2对照原则正确的设立对照可可控制实验过程中非实验因素的影响和偏倚,从而使处理因素的效应充分的显露出来;3.重复的原则保证每一个处理都有足够的重复数样本量,避免把偶然性或巧合的现象当作必然的规律性现象,并能正确的估计实验误差;三、综合题1.应用相对数时应注意的问题有:⑴计算相对数的分母一般不宜过小;⑵分析时不能以构成比代替率;⑶不能用构成比的动态分析代替率的动态分析;⑷对观察单位数不等的几个率,不能直接相加求其总率;⑸在比较相对数时应注意可比性;⑹对样本率或构成比的比较应随机抽样,并做假设检验;2.为什么不能以构成比代率请联系实际加以说明;率和构成比所说明的问题不同,绝不能以构成比代率;构成比只能说明各组成部分的比重或分布,而不能说明某现象发生的频率或强度;例如:以男性各年龄组高血压分布为例,50~60岁年龄组的高血压病例占%,所占比重最大,60~岁组则只占到%;这是因为60~岁以上受检人数少,造成患病数低于50~60岁组,因而构成比相对较低;但不能认为年龄在50~60岁组的高血压患病率最严重,而60岁以上反而有所减轻;若要比较高血压的患病率,应该计算患病率指标;3.某年抽样调查某地120名18~35岁健康男性居民血清铁含量μmol/L,数据如下:….. …. ……………….. ….. …问如何对该资料进行统计描述答案要点:可绘制频率表或直方图,以直观的体现该资料的分布特征;若成对称分布,可选用算数均数表达集中水平,标准差表达变异离散情况;若偏态非对称,可用中位数表达集中水平,四分位数间距表达变异离散情况;4.某县防疫站1972年开始在城关镇建立“预防接种卡”,使计划免疫得到加强;为说明效果,1975年5月观察了482人的锡克试验反应,其中:幼儿园儿童101人,阳性21人;小学生145人,阳性22人;中学生236人,阳性15人;相比起来,1947年为:幼儿园儿童144人,阳性37人;小学生1417人,阳性323人;中学生359人,阳性41人;试用适当的统计表和统计图描述上述结果,并作简要分析;。

(完整版)医学统计学复习要点

(完整版)医学统计学复习要点

..第一章绪论1、数据/资料的分类:①、计量资料,又称定量资料或者数值变量;为观测每个观察单位某项治疗的大小而获得的资料。

②、计数资料,又称定性资料或者无序分类变量;为将观察单位按照某种属性或者类别分组计数,分组汇总各组观察单位数后而得到的资料。

③、等级资料,又称半定量资料或者有序分类变量。

为将观察单位按某种属性的不同程度分成等级后分组计数,分类汇总各组观察单位数后而得到的资料。

2、统计学常用基本概念:①、统计学(statistics )是关于数据的科学与艺术,包括设计、搜集、整理、分析和表达等步骤,从数据中提炼新的有科学价值的信息。

②、总体(population )指的是根据研究目的而确定的同质观察单位的全体。

③、医学统计学(medical statistics ):用统计学的原理和方法处理医学资料中的同质性和变异性的科学和艺术,通过一定数量的观察、对比、分析,揭示那些困惑费解的医学问题背后的规律性。

④、样本(sample ):指的是从总体中随机抽取的部分观察单位。

⑤、变量(variable ):对观察单位某项特征进行测量或者观察,这种特征称为变量。

⑥、频率(frequency ):指的是样本的实际发生率。

⑦、概率(probability):指的是随机事件发生的可能性大小。

用大写的P 表示。

3、统计工作的基本步骤:①、统计设计:包括对资料的收集、整理和分析全过程的设想与安排;②、收集资料:采取措施取得准确可靠的原始数据;③、整理资料:将原始数据净化、系统化和条理化;④、分析资料:包括统计描述和统计推断两个方面。

第二章计量资料的统计描述1. 频数表的编制方法,频数分布的类型及频数表的用途①、求极差(range ):也称全距,即最大值和最小值之差,记作R ;②、确定组段数和组距,组段数通常取10-15组;③、根据组距写出组段,每个组段的下限为L ,上限为U ,变量X 值得归组统一定为L ≤X <U ,最后一组包括下限。

医学统计学复习资料

医学统计学复习资料

医学统计复习资料一、名词解释[1].总体:根据研究目得确定得同质观察单位得全体。

就是同质所有观察单位得某种变量值得集合。

总体可分为有限总体与无限总体。

总体中得所有单位都能够标识者为有限总体,反之为无限总体。

[2].样本:从总体中随机抽取部分观察单位,其实测值得集合。

[3].计量资料:又称定量资料或数值变量资料。

为观测每个观察单位得某项指标得大小,而获得得资料。

其变量值就是定量得,表现为数值大小,一般有度量衡单位。

根据其观测值取值就是否连续,又可分为连续型或离散型两类。

[4].计数资料:又称定性资料或者无序分类变量资料,亦称名义变量资料,就是将观察单位按照某种属性或类别分组计数,分组汇总各组观察单位数后得到得资料。

其变量值就是定性得,表现为互不相容得性或类别。

分两种情形:(1)二分类:两类间相互对立,互不相容。

(2)多分类:各类间互不相容。

[5].等级资料:又称半定量资料或有序分类变量资料,就是将观察单位按某种属性得不同程度分成等级后分组计数,分类汇总各组观察单位数后而得到得资料。

其变量值具有半定量性质,表现为等级大小或属性程度。

[6].随机误差(偶然误差):就是一类不恒定得、随机变化得误差,由多种尚无法控制得因素引起,观察值不按方向性与系统性变化,在大量重复测量中,它可呈现或大或小,或正或负得规律性变化。

[7].概率:概率(probability)又称几率,就是度量某一随机事件A发生可能性大小得一个数值,记为P(A),P(A)越大,说明A事件发生得可能性越大。

0﹤P(A)﹤1。

频率:在相同得条件下,独立重复做n 次试验,事件A 出现了m 次,则比值m/n 称为随机事件A 在n 次试验中出现得频率(freqency)。

当试验重复很多次时P(A)= m/n。

[8].平均数:描述一组变量值得集中位置或水平。

常用得平均数有算术平均数、几何平均数与中位数。

[9].算术均数(arithmetic mean)描述一组数据在数量上得平均水平。

《医学统计学》复习资料

《医学统计学》复习资料

《医学统计学》复习资料一、名词解释1.计量资料( measurement data):是用定量方法测量观察对象指标数值的大小所得到的资料。

通常有单位。

又称为数值变量资料。

2.计数资料(enumeration data):通常先将研究对象按观察指标的性质和类别分类,然后清点个数得到的资料。

又称分类变量资料。

如患病未患病。

3.等级资料(ranked data,等级分组资料):指研究资料既有计数资料的特性,又有半定量的性质,称等级(分组)资料,又称半定量资料。

4、同质(homogeneity)指观察单位研究指标的影响因素相同(即同质指研究指标的影响因素性质相同)。

5、变异(heterogeneity/variance):指同质的个体之间的差异,来源于一些未加控制或无法控制的甚至不明原因的因素。

6、总体(population):根据研究目的确定的同质观察单位的全体,即按研究目的确定的同质观察单位某项变量值的集合。

7、样本(sample):从总体中随机抽取的有代表性的一部分观察单位组成样本(是某项指标的实测值组成样本)。

8、抽样( sampling ):从总体中抽取部分个体的过程。

9、完全随机设计(completely random design):指将受试对象随机分配到处理组、对照组中,或从不同总体中随机抽样进行研究。

10、配对设计(paired design):指将受试对象按配对条件配成对子,称为配对样本。

11、●随机区组设计(randomized block design):随机区组设计是配对设计的扩展。

●随机事件(random event):是指随机现象的某个可能的观察结果或可能发生也可能不发生的事件。

12、误差(error):泛指观测值与真实值之差,统计量与总体参数之差。

13、系统误差(system error):观测值倾向性的偏大或偏小。

影响准确性,须克服。

14、抽样误差(sampling error) :由抽样不同引起的样本均数(或其他统计量)与总体均数(或其他参数)之间的差异称作抽样误差;产生原因包括个体差异和抽样时只能抽取部分总体做样本;虽然不可避免,但可以用统计方法进行分析。

(完整版)医学统计学复习题

(完整版)医学统计学复习题
A. 1:6.96
B. 1:16
C. 1:11.6
D. 1:4
E. 1:8
3用频率表计算方差的公式为:A
A
B
C.
D.
E.
4.已知某疾病患者10人的潜伏期(天)分别为:6,13,5,9,12,10,8,11,8,>20,其潜伏期的平均水平约为:E
A. 11天
B. 9天
C. 10天
D. 10.2天
E. 9.5天
C.总体均数不同
D.抽样误差或总体均数不同
E.系统误差
9.从某地随机抽取10名7岁正常男孩,测得其平均收缩压为90.5 mmHg,标准差为10.4mmHg,则该地7岁正常男孩的收缩压总体均数的95%的置信区间为(A)
A.
B.
C. 90.5±1.96×10.4
D. 120.2±t(0.05/2,9)×10.4
A.样本与总体之差
B.系统误差
C.随机误差
D.抽样误差
E.随机测量误差
6.某人记录了50名病人体重的测定结果:小于50Kg的13人,介于50Kg和70 Kg间的20人,大于70 Kg的17人,此种资料属于A
A.定量资料
B.分类资料
C.有序资料
D.名义变量资料
E.二分类资料
7.上述资料可以进一步转换为B
A.是统计总体数据得到的量
B.反映总体统计特征的量
C.是由样本数据计算出的统计指标
D.是用参数估计出来的
E.是根据总体中的全部数据计算出的统计指标
4.欲了解某市某年所有三级甲医院的病床数,该市每个三级甲医院就是一个:C
A.有限总体
B.观察值
C.无限总体
D.分类变量
E.观察单位

医学统计学复习资料

医学统计学复习资料

一、名词解释1。

概率:在重复试验中,事件A的频率,随着试验次数的不断增加将愈来愈接近一个常数p,这个常数p就称为事件A出现的概率(probability),记作P(A)或P。

2.抽样误差:由于抽样造成的统计量与参数之间的差别,特点是不能避免的,可用标准误描述其大小。

3。

医学参考值范围:是指绝大多数正常人的某指标值都在一定的范围内,其中最常用的是95%4。

总体:是指根据研究目的确定的、同质的全部研究的观测值,即某个随机变量X可能取的值得全体。

4。

总体:根据研究目的所确定的同质观察单位的全体。

5。

线性回归系数:直线回归方程y=a+bX的系数b称为回归系数,也就是回归直线的斜率(slope),表示X 每增加一个单位,Y 平均改变 b 个单位。

二、填空题1.统计资料的类型分:计量资料、计数资料、等级资料。

2。

统计工作的步骤分为:统计设计、收集资料、整理资料、分析资料.3。

统计表的结构为:标题、标目、线条、数字.4。

可信区间的两个要素是:准确度、精密度.5。

方差分析的应用条件为:①各组样本是相互独立的随机样本②来自正态总体③各组总体方差相等,即方差齐性。

6.描述正态分布曲线形态的指标是σ,描述t分布曲线形态的指标是ν。

7。

从集中趋势、离散趋势两个方面来描述计量资料的分布特征.三、单项选择题(请把正确答案写在下面的表格里,每题2分,共20分)1。

将90名高血压病人随机等分成三组后分别用 A、B 和 C 方法治疗,以服药前后血压的差值为疗效,欲比较三种方法的效果是否相同,正确的是 CA 作三个差值样本比较的 t 检验B 作三个差值样本比较的方差分析C 作配伍组设计资料的方差分析D 作两两比较的 t 检验2。

某地1952和1998年三种死因别死亡率绘制成统计图,宜用 BA 直条图B 百分条图C 圆图D 直方图3.下列哪个变量为标准正态变量 BA B C D4。

某医院对30名麻疹易感儿童经气溶胶免疫一个月后,测得其血凝抑制抗体滴度,最合适描述其集中趋势的指标是 B A 均数 B 几何均数 C 标准差 D中位数5。

医学统计学复习题

医学统计学复习题

一、最佳选择题1.抽样研究是一种科学高效的方法,目的是研究(B )? A.样本 B.总体? C.抽样误差 D. 概率2.由样本推断总体,样本应该是( D )? A.总体中的典型部分? B.总体中有意义的部分? C.总体中有价值的部分? D. 总体中有代表性的部分3.统计上所说的系统误差、过失误差、测量误差和抽样误差四种误差,在实际工作中( C )? A.四种误差都不可避免? B.过失误差和测量误差不可避免? C.测量误差和抽样误差不可避免? D. 系统误差和抽样误差不可避免4.统计描述是指( C )? A.比较指标的差别有无显著性? B.估计参数? C.用统计指标描述事物的特征? D. 判断无效假设是否成立5.统计推断是指( D )? A.从总体推断样本特征? B.从总体推断总体特征? C.从样本推断样本特征? D. 从样本推断总体特征6.对某样品进行测量时,由于仪器事先未校正,造成测量结果普遍偏高,这种误差属于( A )? A.系统误差 B.随机测量误差? C.抽样误差 D. 过失误差7.随机抽样的目的是( D )? A.能消除系统误差? B.能消除测量误差? C.能消除抽样误差? D. 能减小样本偏性54 人,该资料属于( B )8.对某地 200 名 16 岁中学生口腔检查,发现患龋齿的人数为? A.计量资料 B.计数资料? C.等级资料 D. 三个都不是9.计量资料是( C )? A.用仪器测量出来的资料? B.按观察单位的类别,清点各类观察单位数的资料? C.用定量方法测定观察单位某个变量的大小的资料? D. 按观察单位的等级,清点各等级观察单位数的资料10.计数资料是( B )? A.用仪器测量出来的资料? B.按观察单位的类别,清点各类观察单位数的资料? C.用定量方法测定观察单位某个变量的大小的资料? D. 按观察单位的等级,清点各等级观察单位数的资料11.等级资料是( D )? A.用仪器测量出来的资料? B.按观察单位的类别,清点各类观察单位数的资料? C.用定量方法测定观察单位某个变量的大小的资料? D. 按观察单位的等级,清点各等级观察单位数的资料12.下列哪种不属于计量资料( C )? A.红细胞数 B.血钙浓度? C.阳性人数 D.脉搏13.下列哪种属于等级资料( A )? A.治疗痊愈、有效、无效人数? B.各血型人数? C.白细胞分类百分比? D. 贫血和不贫血人数二、判断题? 1.统计工作的主要内容是对资料进行统计分析。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
• 频数表、频数图:步骤和用途; • 集中趋势的描述:均数(原始数据和频数资 料),几何均数,中位数(百分位数); • 离散趋势的描述:方差,标准差,全距, 四分位数范围, 变异系数。 • 总体和样本统计量的表示
3
分类资料的统计描述
• 频数表; • 常用统计量:比,比例,率; • 率的标准化。
4
生存人年
10
多组独立定量资料的统计分析
• 正态性检验、方差齐性检验; • 方差分析:基本思想(三个变异、方差分析 表),步骤(检验假设),多重比较(LSD、 Bonferroni); • 秩和检验:Kruskal-Wallis检验(方法、公式), 多重比较(Nemenyi, Bonferroni校正)。
11
14
线性相关
• Pearson线性相关系数计算方法、公式; • 相关系数的假设检验:tr与tb的关系; • 双变量正态分布; • Spearman等级相关:步骤、方法及假设检 验; • 线性回归与线性相关。
15
无序分类资料—χ 无序分类资料 2检验
• 频数分布拟合优度; • 四格表资料:标准、校正; • R×C表; • 配对四表格; • 计算公式。
配对设计资料的统计分析
• 参数检验法(差值服从正态分布):配对t检验 (步骤、方法、公式); • 非参数检验:Wilcoxon符号秩和检验(方法、 公式)。
12
随机区组设计资料的统计分析
• 正态性检验、方差齐性检验; • 参数检验法:双向方差分析(四个变异、方 差分析表、假设、方法和公式),组间多重 比较(LSD-t); • 非参数检验法:Friedman检验,检验步骤、 方法,组间多重比较(Bonferroni)。
• 点估计 • 区间估计:总体均数,两均数之差,率; • 可信区间的两个要素:准确性、精确性。 • 假设检验的步骤:假设、检验水准、统计 量、推断结论; • 两类错误:一类错误和二类错误;
9
两独立样本定量资料的统计分析
• 正态性检验、方差齐性检验; • 方差齐性时:t检验; • 方差不齐,但正态分布或样本量大: t’检验; • 方差不齐、不服从正态分布或资料分布未 知:Wilcoxon秩和检验。 • 各统计量计算公式重要。
5
统计表和统计图
• 统计表; • 统计图:条图,饼图,线图,直方图,散 点图。 • 绘图方法和图的用途
6
正态分布
• 概念:密度和分布函数; • 性质:对称分布; • 概率分布规律:面积示意图。 • 参考值范围
7
抽样误差与抽样分布
• 样本均数:标准误与标准差; • 率:标准误 • t分布
8
参数估计与假设检验
《医学统计学》复习 医学统计学》
生物统计学系 陈征
1
基本概念
• 统计学; • 观察单位;总体;同质性;样本; • 变量:连续性变量,离散性变量;二分类 资料,无序多分类,有序多分类,不具有 分类性质的离散性资料; • 随机事件;频率;概率(小概率事件);总体 参数;统计量;个体变异;抽样误差;
2
定量资料的统计描述
13
直线回归
• 回归模型的前提假设:线性、独立性、正 态、等方差; • 直线回归的变易分解(总平方和、回归平方 和、残差平方和); • 求回归方程步骤:散点图,最小二乘求系 数,决定系数,F检验,回归系数假设检验, 总体回归系数区间估计; • 总体均数的区间估计,个体Y值的容许区间 估计,统计控制。
• 简称人年数。人口统计分析中最重要的基本 概念之一。表示人数同生存年数乘积之和, 是计算人口生存时间总长度的复合单位。 • 例如:1个人生存了一年,其生存人年数为1 人年;2个人各生存了半年,他们的生存人 年数也为1人年,等等。因此,生存人年数 不仅与人数有关,也取决于时间长度,是一 个时间概念。
16
有序分类、 有序分类、等级资料
• 两组:Wilcoxon检验及检验方法; • 多组:Kruskal-Willis检验,多重比较。
17பைடு நூலகம்
相关文档
最新文档