医学统计复习

合集下载

医学统计学复习资料

医学统计学复习资料

小;③要注意分子分母正确选用;④要注意率与比的正确应用;⑤要注 意平均率的计算方法;⑥要注意资料的可比性;⑦率和构成比比较时作 假设检验。 7. 简述直线回归与直线相关的区别。 (1)资料要求上不同:直线回归分析适用于应变量是服从正态分布的随 机变量,自变量是选定变量;直线相关分析适用于服从双变量正态分布 的资料。 (2) 两种系数的意义不同:回归系数是表明两个变量之间数量上的依存 关系,回归系数越大回归直线越陡峭,表示应变量随自变量变化越快; 相关系数是表明两个变量之间相关的方向和紧密程度的,相关系数越 大,两个变量的关联程度越大。 9. 假设检验的理论依据是什么?请简述假设检验的基本步骤。 答:假设检验的理论依据是小概率事件原理,步骤为: (1)根据研究目的建立假设,确定检验水准 (2)根据样本统计量的抽样分布规律,选择适当的统计方法,计算检验 统计量 (3)确定P值,做出推断结论 10.方差分析应用广泛,可用于:①两个或多个样本均数间的比较;②分 析两个或多个因素间的交互作用;③回归方程的线性假设检验;④多元 线性回归分析中偏回归系数的假设检验等。本章主要介绍完全随机设计 资料的方差分析、配伍组设计资料的方差分析及重复测量数据的方差分 析。 11. 完全随机设计的两样本率比较时,如何正确选择统计分析方法 (写出相应的计算公式)。 (1)当总例数n≥40且所有格子的T≥5时,用2检验的基本公式或四格表 资料2检验的专用公式; (2)当n≥40但有1≤T<5时,用四格表资料2检验的校正公式;或改用四 格表资料的Fisher确切概率法的连续性校正法: (3)当n<40,或T<1时,用四格表资料的Fisher确切概率法。 12. 什么是医学参考值范围?估计医学参考值范围如何正确选用统计 方法? 答:医学参考值范围是指所谓“正常人”的解剖、生理、生化等指标的 波动范围,亦称正常值范围。如95%的参考值范围包括了95%的观察 值,而有5%的观察值不在这一范围内。 估计医学参考值范围确定方法:

《医学统计学》总复习

《医学统计学》总复习
《医学统计学》总复习 医学统计学》
§1 统计分析
一,定量资料的统计分析
定量资料的统计描述
反映集中趋势的指标: X 反映集中趋势的指标: 反映离散趋势的指标: 反映离散趋势的指标:
定量资料的统计推断
G
S
M
S2 Q CV
R
参数估计 假设检验
参数估计
点估计:用样本均数直接作为总体 点估计:
三,等级资料的统计分析(秩和检验) 等级资料的统计分析(秩和检验)
非参数检验的概念 非参数检验的优缺点 常用的秩和检验方法
(1) Wilcoxon符号秩和检验 配对设计 符号秩和检验(配对设计 符号秩和检验 配对设计) (2) Wilcoxon 两样本比较法 成组设计两样本 两样本比较法(成组设计两样本 成组设计两样本) (3) Kruskal-Wallis 法或 检验 (成组设计多样本 法或H 成组设计多样本) 成组设计多样本 (4) Friedman 法(随机区组设计 随机区组设计) 随机区组设计 (5) Nemenyi 法(成组设计多样本两两比较) 成组设计多样本两两比较) 成组设计多样本两两比较 (6) 随机区组设计两两比较的秩和检验
u 检验应用类型: 检验应用类型: 1)样本均数与总体均数的比较 2)完全随机设计的两样本均数的比较 ANOVA 检验应用类型: 检验应用类型: 1)完全随机设计的方差分析 2)随机区组设计的方差分析 3)交叉设计的方差分析 4)析因设计的方差分析 5)重复测量资料的方差分析
二,计数资料的统计分析
t 检验 t'检验 检验 ′
t
u 检验 ANOVA
正态分布的经验判断方法
若 若 , S ≥ 3X可认为资料呈偏态分布
S ≥ ,有理由怀疑资料呈偏态分布 X

医学统计学复习资料(完整版)

医学统计学复习资料(完整版)

第1章绪论医学统计学是一门“运用统计学的原理和方法,研究医学科研中有关数据的收集、整理和分析的应用科学。

1.个体:又称观察单位,是统计研究的最基本单位,也是构成总体的最基本的观察单位。

2.总体:根据研究目的确定的同质观察单位某项指标测量值(观察值)的集合。

分为有限总体(明确规定了空间、时间、人群范围内有限个观察单位)和无限总体(无时间和空间范围的限制)。

反映总体特征的指标为参数,常用小写希腊字母表示。

3.样本:从总体中随机抽取的一部分有代表性的观察单位组成的整体。

(抽样,随机化原则,样本含量)根据样本资料计算出来的相应指标为统计量,常用大写英文字母表示。

4.抽样研究:从总体中随机抽取样本,根据样本信息推断总体特征的方法。

抽样误差是由随机抽样(样本的偶然性)造成的样本指标与总体指标之间、样本指标与样本指标之间的差异。

其根源在于总体中的个体存在变异性。

只要是抽样研究,就一定存在抽样误差,不能用样本的指标直接下结论。

统计分析主要是针对抽样误差而言。

5.变量(一个个体的任意“特征”);资料(变量值的集合),资料类型:①计量资料/定量资料/数值变量资料:表现为数值大小,一般有度量衡单位,又可分为连续型和离散型两类;②计数资料/定性资料/无序分类变量资料/名义变量资料:表现为互补相容的属性或类别,一般无度量衡单位,可分为二分类和多分类;③等级资料/半定量资料/有序分类变量资料:表现为等级大小或属性程度。

各类资料间可相互转化。

①可选分析方法有:t检验、方差分析、相关回归分析等;②可选分析方法有:χ2检验、z检验等;③可选分析方法有:秩和检验、Ridit分析等。

6.误差:实测值与真实值之差。

可分为随机误差(随机测量误差+抽样误差)与非随机误差(系统误差与非系统误差)。

①随机误差:是一类不恒定、随机变化的误差,由多种尚无法控制的因素引起,它是不可避免的;②系统误差:是实验过程中产生的误差,它的值或恒定不变,或遵循一定的变化规律,其产生原因往往是可知的或可以掌握的,它是可以消除或控制的;③非系统误差:又称过失误差,是指在实验过程中由于研究者偶然失误而造成的误差,可以消除。

医学统计学复习资料

医学统计学复习资料

医学统计学复习资料导言医学统计学是医学领域中非常重要的一门学科,它的作用是帮助医生和研究人员通过收集、分析和解释数据来评估医学检验和治疗的效果。

本文将提供一份医学统计学的复习资料,帮助读者回顾和巩固相关的知识。

一、基本概念1.1 总体和样本在医学统计学中,总体是指我们研究的整体对象,而样本则是总体的一个子集。

例如,我们对某种疾病的患者进行研究时,患者总体就是所有患该病的人群,而样本则是我们实际观察到的一部分患者。

1.2 参数和统计量在医学统计学中,参数是用来描述总体特征的统计量,例如总体均值、总体方差等。

而统计量是通过样本数据来估计总体参数的量,例如样本均值、样本方差等。

假设检验是医学统计学中常用的一种方法,它用于判断总体参数的假设是否成立。

在假设检验中,我们先假设总体参数的某个值是正确的(称为零假设),然后通过收集样本数据来判断该假设是否成立。

二、数据的分布2.1 正态分布正态分布在医学统计学中非常重要,因为许多统计方法都假设数据服从正态分布。

正态分布具有钟形曲线的特点,均值、中位数和众数都重合在一起。

常见的正态分布检验有Shapiro-Wilk检验和Kolmogorov-Smirnov检验。

2.2 t分布t分布是一种在样本量较小的情况下使用的概率分布,它比正态分布的尾部更加厚重。

t分布的形状取决于样本量,当样本量增加时,t分布逐渐趋近于正态分布。

在医学研究中,常用t分布来进行样本均值的假设检验。

非参数检验是一种不依赖于数据分布的统计方法,它对数据的要求相对较低。

与参数检验不同,非参数检验适用于无法确定数据分布或偏离正态分布的情况。

常见的非参数检验方法有Wilcoxon秩和检验和Mann-Whitney U检验。

三、统计推断3.1 置信区间置信区间是一种用来估计总体参数的范围,它是一个区间,表示我们对总体参数的估计在一定置信水平下的可信程度。

通常,置信区间的宽度与置信水平相关,越高的置信水平意味着更宽的置信区间。

(完整)医学统计学复习(练习及答案)

(完整)医学统计学复习(练习及答案)

第1题:下列有关等级相关系数ts的描述中不正确的是A。

不服从双变量正态分布的资料宜计算rSB。

等级数据宜计算rsC。

rs值-1~+1之间D.查rs界值表时, rs值越大,所对应的概率P值也越大E。

当变量中相同秩次较多时,宜计算校正rs值,使rs值减小第2题:对某样本的相关系数r和0的差别进行检验,结果t1A。

两变量的差别无统计意义B.两变量存在直线相关的可能性小于5%C。

两变量肯定不存在相关关系D.两变量间存在相关关系E。

就本资料尚不能认为两变量存在直线相关关系第3题:总体率95%可信区间的意义是。

A.95%的正常值在此范围B。

95%的样本率在此范围C.95%的总体率在此范围D.总体率在此范围内的可能性为95%E。

样本率在此范围内的可能性为95%第4题:样本含量的确定下面哪种说法合理。

A。

样本越大越好B.样本越小越好C。

保证一定检验效能条件下尽量增大样本含量D.保证一定检验效能条件下尽量减少样本含量E.越易于组织实施的样本含量越好第5题:直线相关与回归分析中,下列描述不正确的是。

A.r值的范围在—1~+1之间B.已知r来自ρ≠0的总体,则r〉0表示正相关, r<0表示负相关C。

已知Y和X相关,则必可计算其直线回归方程D。

回归描述两变量的依存关系,相关描述其相互关系E.r无单位第6题:四格表χ2检验的自由度为1,是因为四格表的四个理论频数( )A.受一个独立条件限制B。

受二个独立条件限制C。

受三个独立条件限制D。

受四个独立条件限制E.不受任何限制第7题:对同一双变量(X,Y)的样本进行样本相关系数的tr检验和样本回归系数的tb检验,有。

A. tb≠trB. tb=trC. tb〉trD。

tbE。

视具体情况而定第8题:为了由样本推断总体,样本应该是。

A。

总体中任意的一部分B.总体中的典型部分C。

总体中有意义的一部分D。

总体中有价值的一部分E。

总体中有代表性的一部分第9题:以下检验方法属非参数法的是。

医学统计学复习资料(名解+简答)

医学统计学复习资料(名解+简答)

医学统计学复习资料(名解+简答)一、名词解释1.统计量 (statistic):统计量是统计理论中用来对数据进行分析、检验的变量。

2.同质 (homogeneity):是指观察单位(研究个体)间被研究指标的影响因素相同。

3. 抽样误差 (sampling error):由于随机抽样造成的样本均数与总体均数的差别。

4. 总体 (population):根据研究目的而确定的同质观察单位的全体称为总体,更确切的说,它是同质的所有观察单位某种观察值的集合。

5. 变异 (variation):变异就是标志在同一总体不同总体单位之间的差别。

6. 参数 (parameter):参数,也叫参变量,是一种变量。

7. 样本 (sample):研究中实际观测或调查的一部分个体称为样本,研究对象的全部称为总体。

8. 概率 (probability):概率是对随机事件发生的可能性的度量,一般以一个在0到1之间的实数表示一个事件发生的可能性大小。

越接近1,该事件更可能发生;越接近0,则该事件更不可能发生。

1. 正态分布 (normal distribution):靠近均数分布的频数最多,离开均数越远,分布的数据越少,左右两侧基本对称,这种中间多、两侧逐渐减少的基本对称的分布,称为正态分布2. 中位数 (median):一组数据按从小到大(或从大到小)的顺序依次排列,处在中间位置的一个数(或最中间两个数据的平均数,注意:和众数不同,中位数不一定在这组数据中)3. 方差 (variance):是各个数据与其算术平均数的离差平方和的平均数,通常以σ2表示。

4. 四分位数间距 (quartile interval):是上四分位数与下四分位数之差,用四分位数间距可反映变异程度的大小。

5. 正偏态分布 (positively skewed distribution):为统计学概念,即统计数据峰值与平均值不相等的频率分布。

如果频数分布的高峰向左偏移,长尾向右侧延伸称为正偏态分布,也称右偏态分布。

《医学统计学》复习资料

《医学统计学》复习资料

统计学概述一、统计学的意义统计学是研究数据的收集、整理、分析的一门科学,是认识社会和自然现象客观规律数量特征的重要工具。

统计学方法就是帮助人们透过偶然现象认识其内在的规律性,揭示疾病或现象发生、发展规律,为预防疾病、促进健康提供客观依据。

二、统计学的基本概念(一)同质与变异同质是指被研究指标的影响因素相同。

变异是同质基础上的观察单位(亦称为个体)之间的差异。

(二)总体与样本总体是指根据研究目的确定的同质观察单位的全体。

样本从总体中随机抽取的部分观察单位,其测量值(或变量值)的集合。

(三)变量与变量值变量:确定总体后,研究者应对每个观察单位的某些特征进行测量或观察,这种特征称为变量,如:身高、体重等。

变量值:变量的测得值。

如身高150cm,体重50Kg等。

(四)参数与统计量参数是指总体特征的统计指标。

如某地健康成年男性的平均血红蛋白值。

统计量是指样本特征的统计指标。

如从某地健康成年男性中抽取一部分人的平均血红蛋白值。

(五)误差误差泛指测量值与真实值之差。

根据误差的性质和来源,统计工作中产生的误差主要有三种类型,即系统误差、随机测量误差、抽样误差。

1.系统误差:测量结果有倾向性。

查明原因,可以避免。

特点:①测量结果有倾向性。

如仪器、试剂、判定标准等。

②查明原因,可以避免。

2.随机测量误差:收集资料的过程中,即使避免了系统误差,但由于各种偶然因素造成的测量值与真实值不完全一致,这种误差称为随机测量误差。

特点:①随机误差没有大小和方向。

②不可避免。

3.抽样误差:由于随机抽样所引起的样本统计量与总体参数之间的差异以及各样本统计量之间的差异称为抽样误差。

特点:变异是绝对的,抽样误差不可避免。

原因:个体之间的差异;抽样时只能抽取总体中的一部分作为样本。

(六)概率(P)概率是描述某随机事件发生可能性大小的量值,常用符号P表示。

随机事件的概率在0~1之间,即0≤P≤1。

小概率事件:P≤0.05或P≤0.01的事件。

医学统计学-总复习

医学统计学-总复习

2021/9/24
47
四格表资料卡方
根据以下三条件选择具体方法: • 若n>40,T>5时,直接计算2值;
• 若n > 40 ,此时有 1< T 5时,需计算
Yates连续性校正2值;
• T <1,或n≤40或P≈α时,应改用Fisher
确切概率法直接计算概率。
2021/9/24
48
配对四格表资料卡方
2021/9/24
51
第十二章 基于秩的非参数检验
2021etric test)
信区间要么包含了总体均数,要么不包 动范围。“正常人”指排除了影

含。但可以说:当=0.05 时,95%CI 估 响所研究指标的疾病和有关因
计正确的概率为 0.95,估计错误的概率小 素的同质人群。“大多数”是指
于或等于 0.05,即有 95%的可能性包含 90%,95%,99%等。
了总体均数。
总体均数的波动范围
• 正态分布概念:
是一种重要的连续型分布,若以计量值为横轴绘 制一条频数分布曲线,这条曲线呈现对称的、中间 高、两侧逐渐下降的形状,其位置与均数有关,形 状与标准差有关。
记作 X N(, 2) ,μ为 X 的总体均数, 2 为总体方差。
医学中常见的正态分布:
正态分布的参数
• 变量服从正态分布。记做 X ~ N (, 2 )
• 总体均数(位置参数) :描述正态分布的集中趋
势的位置
• 总体标准差(变异度参数) :描述正态分布离散 趋势, 越小,分布越集中,曲线形状越“瘦 高”;反之越“矮胖”。
• 正态曲线的形状由
两个参数决定
正态分布曲线的对称性质
• 设X服从 N(, 2) ,则正态曲线在X =处对称,正态曲线(-∞, )处的曲线下 面积为0.5,

医学统计学复习资料

医学统计学复习资料

一、名词解释1.概率:在重复试验中,事件A的频率,随着试验次数的不断增加将愈来愈接近一个常数p,这个常数p就称为事件A出现的概率(probability),记作P(A)或P。

2。

抽样误差:由于抽样造成的统计量与参数之间的差别,特点是不能避免的,可用标准误描述其大小.3.医学参考值范围:是指绝大多数正常人的某指标值都在一定的范围内,其中最常用的是95%4.总体:是指根据研究目的确定的、同质的全部研究的观测值,即某个随机变量X可能取的值得全体。

4。

总体:根据研究目的所确定的同质观察单位的全体.5。

线性回归系数:直线回归方程y=a+bX的系数b称为回归系数,也就是回归直线的斜率(slope),表示X 每增加一个单位,Y 平均改变 b 个单位.二、填空题1。

统计资料的类型分:计量资料、计数资料、等级资料。

2.统计工作的步骤分为:统计设计、收集资料、整理资料、分析资料。

3。

统计表的结构为:标题、标目、线条、数字.4。

可信区间的两个要素是:准确度、精密度。

5。

方差分析的应用条件为:①各组样本是相互独立的随机样本②来自正态总体③各组总体方差相等,即方差齐性。

6。

描述正态分布曲线形态的指标是σ,描述t分布曲线形态的指标是ν。

7。

从集中趋势、离散趋势两个方面来描述计量资料的分布特征。

三、单项选择题(请把正确答案写在下面的表格里,每题2分,共20分)1.将90名高血压病人随机等分成三组后分别用 A、B 和 C 方法治疗,以服药前后血压的差值为疗效,欲比较三种方法的效果是否相同,正确的是 CA 作三个差值样本比较的 t 检验B 作三个差值样本比较的方差分析C 作配伍组设计资料的方差分析D 作两两比较的 t 检验2。

某地1952和1998年三种死因别死亡率绘制成统计图,宜用 BA 直条图B 百分条图C 圆图D 直方图3。

下列哪个变量为标准正态变量 BA B C D4.某医院对30名麻疹易感儿童经气溶胶免疫一个月后,测得其血凝抑制抗体滴度,最合适描述其集中趋势的指标是 BA 均数B 几何均数C 标准差 D中位数5.配对设计的目的 DA 提高测量精度 B操作方便 C为了可以使用t检验D提高组间可比性6.测定尿铅含量有甲乙两种方法.现用甲乙两法检测10份相同样品,要比较两法测得的结果有无差别,宜用 AA 配对设计t检验B 成组设计的t检验 C均数的u检验 D 方差分析7。

医学统计学总复习

医学统计学总复习

医学统计学总复习1、几种集中趋势指标的适用条件均数—正态分布或近似正态分布;几何均数—呈正偏态分布,但数据经过对数变换后呈正态分布的资料,也可用于观察值之间呈倍数或近似倍数变化(等比关系)的资料;中位数—偏态分布资料以及频数分布的一端或两端无确切数据资料。

几种离散程度指标的适用条件:极差(全距)—常用于描述单峰对称分布小样本资料的变异程度或用于初步了解资料。

四分位数间距—常用于描述偏态分布资料、两端无确切值或分布不明确资料的离散程度。

方差和标准差—正态分布和近似正态分布。

变异系数—比较计量单位不同以及均数相差悬殊的几组资料。

21.标准正态分布(u分布)与t分布的异同:相同点;集中位置都是0,都是单峰分布,是对称分布,标准正态分布是t分布的特例(自由度是无限大时)。

不同点:t分布是一簇分布曲线,t分布的曲线形态是随自由度的变化而变化,标准正态分布的曲线的形态不变,是固定不变的,因为它的形状参数为1。

3.为什么不可以说“总体均数有95%的概率落在这个区间里”?样调查的成本会更高5.t检验的应用条件为:▪①在单样本检验中,总体标准差未知且样本含量较小(n<50)时,要求样本来自正态分布总体;▪②成组检验要求两组资料相应的总体分别服从正态分布且方差齐。

当不满足这些条件时可使用变量变换将数据转换成正态或者近似正态分布,或使用秩和检验。

两小样本均数比较时,若两总体方差不相等,还可使用t’检验。

6.假设检验中的注意事项▪要保证组间的可比性▪要根据研究目的、设计类型和资料类型选用适当的检验方法▪正确理解假设检验中概率P值的含义▪结论不能绝对化▪单、双侧检验应事先确定7.方差分析的基本思想把全部观察值间的变异按设计类型的不同,分解成两个或多个组成部分,然后将各部分的变异与随机误差进行比较,以判断各部分的变异是否具有统计学意义。

8.方差分析的应用条件▪ 1. 各样本是相互独立的随机样本,均服从正态分布▪ 2. 各样本的总体方差相等,即方差齐性独立、正态、方差齐性如果方差不齐时,可采用F’检验或秩和检验。

医学统计学复习题

医学统计学复习题

医学统计学复习题一、名词解释1.总体:根据研究目的确定的同质的观察单位的全体,更确切的说,是同质的所有观察单位某种观察值变量值的集合;总体可分为有限总体和无限总体;总体中的所有单位都能够标识者为有限总体,反之为无限总体;2.样本:从总体中随机抽取部分观察单位,其测量结果的集合称为样本sample;样本应具有代表性;所谓有代表性的样本,是指用随机抽样方法获得的样本;3.随机抽样:随机抽样random sampling是指按照随机化的原则总体中每一个观察单位都有同等的机会被选入到样本中,从总体中抽取部分观察单位的过程;随机抽样是样本具有代表性的保证;4.变异:在自然状态下,个体间测量结果的差异称为变异variation;变异是生物医学研究领域普遍存在的现象;严格的说,在自然状态下,任何两个患者或研究群体间都存在差异,其表现为各种生理测量值的参差不齐;5.计量资料:对每个观察单位用定量的方法测定某项指标量的大小,所得的资料称为计量资料measurement data;计量资料亦称定量资料、测量资料;.其变量值是定量的,表现为数值大小,一般有度量衡单位;如某一患者的身高cm、体重kg、红细胞计数1012/L、脉搏次/分、血压KPa等;6.计数资料:将观察单位按某种属性或类别分组,所得的观察单位数称为计数资料count data;计数资料亦称定性资料或分类资料;其观察值是定性的,表现为互不相容的类别或属性;如调查某地某时的男、女性人口数;治疗一批患者,其治疗效果为有效、无效的人数;调查一批少数民族居民的A、B、AB、O四种血型的人数等;7.等级资料:将观察单位按测量结果的某种属性的不同程度分组,所得各组的观察单位数,称为等级资料ordinal data;等级资料又称有序资料;如患者的治疗结果可分为治愈、好转、有效、无效、死亡,各种结果既是分类结果,又有顺序和等级差别,但这种差别却不能准确测量;8.概率:概率probability又称几率,是度量某一随机事件A发生可能性大小的一个数值,记为PA,PA越大,说明A事件发生的可能性越大;0﹤PA﹤1;9.频率:在相同的条件下,独立重复做n次试验,事件A出现了m次,则比值m/n 称为随机事件A在n次试验中出现的频率freqency;当试验重复很多次时PA=m/n;10. 随机误差:随机误差random error又称偶然误差,是指排除了系统误差后尚存的误差;它受多种因素的影响,使观察值不按方向性和系统性而随机的变化;误差变量一般服从正态分布;随机误差可以通过统计处理来估计;11.系统误差:是指由于仪器未校正、测量者感官的某种偏差、医生掌握疗效标准偏高或偏低等原因,使观察值不是分散在真值的两侧,而是有方向性、系统性或周期性地偏离真值;系统误差可以通过实验设计和完善技术措施来消除或使之减少;12.参数:指总体的统计指标,如总体均数、总体率等;总体参数是固定的常数;多数情况下,总体参数是不易知道的,但可通过随机抽样抽取有代表性的样本,用算得的样本统计量估计未知的总体参数;13.统计量:是指样本的统计指标,如样本均数、样本率等;样本统计量可用来估计总体参数;总体参数是固定的常数,统计量是在总体参数附近波动的随机变量;14.频数表frequency table用来表示一批数据各观察值或在不同取值区间的出现的频繁程度频数;对于离散数据,每一个观察值即对应一个频数,如某医院某年度一日内死亡0,1,2…20个病人的天数;对于散布区间很大的离散数据和连续型数据,数据散布区间由若干组段组成,每个组段对应一个频数;15.算术均数arithmetic mean 描述一组数据在数量上的平均水平;总体均数用μ表示,样本均数用 表示;16.几何均数geometric mean 用以描述对数正态分布或数据呈倍数变化资料的水平;记为G;17.中位数median 将一组观察值由小到大排列,n 为奇数时取位次居中的变量值;为偶数时,取位次居中的两个变量的平均值;18.极差range 亦称全距,即最大值与最小值之差,用于资料的粗略分析,其计算简便但稳定性较差;19.百分位数percentile 是将n 个观察值从小到大依次排列,再把它们的位次依次转化为百分位;百分位数的另一个重要用途是确定医学参考值范围;20.四分位数间距inter-quartile range 是由第3四分位数和第1四分位数相减计算而得,常与中位数一起使用,描述偏态分布资料的分布特征,较极差稳定;21.方差variance :方差表示一组数据的平均离散情况,由离均差的平方和除以样本个数得到;22.标准差standard deviation 是方差的正平方根,使用的量纲与原量纲相同,适用于近似正态分布的资料,大样本、小样本均可,最为常用;23.变异系数coefficient of variation 用于观察指标单位不同或均数相差较大时两组资料变异程度的比较;用CV 表示;24.正态分布:若指标X 的频率曲线对应于数学上的正态曲线,则称该指标服从正态分布normal distribution;通常用记号),(2σμN 表示均数为μ,标准差为σ的正态分布;25.标准正态分布:均数为0、标准差为1的正态分布被称为标准正态分布standard normal distribution,通常记为2N;(0,1)26.抽样误差:抽样研究中,由抽样引起的样本统计量与总体参数间的差别称为抽样误差sampling error;统计上用标准误standard error,SE来衡量抽样误差的大小;其产生的本质原因是由于个体间存在变异;27.可信区间:按预先给定的概率确定的包含未知总体参数的可能范围;该范围称为总体参数的可信区间confidence interval,CI;它的确切含义是:可信区间包含总体参数的可能性是1-α,而不是总体参数落在该范围的可能性为1-α;28.相对数relative number是两个有联系的指标之比,是分类变量常用的描述性统计指标,常用相对数有率、构成比、比等;29.率rate又称频率指标,说明一定时期内某现象发生的频率或强度;30.构成比proportion又称构成指标,说明某一事物内部各组成部分所占的比重或分布;31.标准化法standardization method是常用于内部构成不同的两个或多个率比较的一种方法;标准化法的基本思想就是指定一个统一“标准”标准人口构成比或标准人口数,按指定“标准”计算调整率,使之具备可比性以后再比较,以消除由于内部构成不同对总率比较带来的影响;32.统计表:将统计资料及其指标以表格形式列出,称为统计表statisticaltable;狭义的统计表只表示统计指标;33.统计图statistical graph:是将统计指标以点的位置、线段的升降、直条的长短或面积的大小等几何图形直观的表示事物间的数量关系;34.普通线图适用于连续性资料;用线段的升降来表示一事物随另一事物变化的趋势;35.散点图以点的密集程度和趋势表示两种事物间的相关关系;二、简答题1. 一位研究人员欲做一项实验研究,研究设计应包括那几方面的内容答:一般来讲,研究设计应包括两方面的设计:专业设计和统计设计;专业设计是针对专业问题进行的研究设计,如选题、形成假说、干预措施、实验对象、实验方法等;统计设计是针对统计数据收集进行的设计,如样本来源、样本量、干预措施的分配、统计设计类型测量指标的选择等;统计设计是统计分析的基础,任何设计上的缺陷,都不可能在统计分析阶段弥补和纠正;2.试述极差、四分位数间距、标准差及变异系数的适用范围;答:这三个指标均反映计量资料的离散程度;极差与四分位数间距可用于任何分布,后者较前者稳定,但均不能综合反映各观察值的变异程度;标准差最为常用,要求资料近似服从正态分布;变异系数可用于多组资料间度量衡单位不同或均数相差悬殊时的变异程度比较;3.简述医学中参考值范围的涵义及制定参考值范围的一般步骤;医学中常把绝大多数正常人的某指标范围称为该指标的参考值范围,也叫正常值范围;所谓“正常人”不是指完全健康的人,而是指排除了所研究指标的疾病和有关因素的同质人群;制定参考值范围的一般步骤:1定义“正常人”,不同的指标“正常人”的定义也不同;2选定足够数量的正常人作为研究对象;3用统一和准确的方法测定相应的指标;4根据不同的用途选定适当的百分界限,常用95%;5根据此指标的实际意义,决定用单侧范围还是双侧范围;6根据此指标的分布决定计算方法,常用的计算方法:正态分布法、百分位数法;4.正态分布的特征:服从正态分布的变量的频数分布由均数、标准差完全决定;1 是正态分布的位置参数,描述正态分布的集中趋势位置;正态分布以为对称轴,左右完全对称;正态分布的均数、中位数、众数相同,均等于 ;2 描述正态分布资料数据分布的离散程度, 越大,数据分布越分散, 越小,数据分布越集中; 也称为是正态分布的形状参数, 越大,曲线越扁平,反之, 越小,曲线越瘦高;5. 四格表资料卡方检验校正条件:分析四格表资料时,应注意连续性校正的问题,当1<T<5,n>40时,用连续性校正2χ检验;T≤1,或n≤40时,用Fisher精确概率法;6.统计表的结构与编制要求统计表由标题、标目、线条和数字所构成;如下表所示:顶线表号标题横标目名称纵标目名称合计横标目合计数字底线1 标题位于表的上方,概括表的主要内容,一般需注明时间与地点;2标目有横、纵标目之分,分别说明横行和纵行数字的含义,应做到文字简明,层次清楚;3线条多采用三条半线,即顶线、底线、纵标目下的横隔线及合计上的半线;忌斜线和竖线;4数字表内数据一律采用阿拉伯数字;同一指标小数点位数要一致,位次要对齐;表内不应有空项,无数字用“—”表示,数字若为零则填“0”,暂缺项或未记录用“…”表示;5备注不为表的必备内容,如有必要,可在表内用“”号标记,然后在表的下方加以说明;7.统计表的种类统计表可分为简单表simple table和复合表combinative table两种类型;简单表:只按单一特征或标志分组;复合表:按两个或两个以上主要标志分组,如年龄和性别结合起来分组;8.制图的基本要求1根据资料的性质和分析目的,选择合适的图形;2标题扼要说明图的主要内容,位于图的下方,必要时注明时间和地点;3建立在直角坐标系上的统计图,其纵轴尺度自下而上,横轴尺度从左到右,数字一律由小到大,某些图还要求纵轴尺度从0开始如直条图、直方图;纵横两轴一般应有标目,注明单位;9.统计表和统计图在表达资料中各有何特殊意义统计表可以代替冗长的文字叙述,便于指标的计算、分析和对比,其制作合理与否,对统计分析质量有着重要的影响;统计图可用点的位置、线段的升降、直条的长短和面积的大小直观地反映分析事物间的数量关系;因统计如对数量表达较粗略,故最好附上相应的统计表;10.统计表有哪些要素构成制表的注意事项有哪些一般说来,统计表由标题、标目、线条、数字四部分构成有时附有备注;编制统计表的注意事项:1 标题概括表的内容,写于表的上方,通常需注明时间与地点;2 标目以横、纵标目分别说明主语与谓语,文字简明,层次清楚;3 线条不宜过多,通常采用三条半线表示,即顶线、底线、纵标目下的横隔线及合计上的半条线 ;4 表内一律采用阿拉伯数字;同一指标小数点位数要一致,数次要对齐;表内不留空格;5 备注不要列于表内,如有必要,可在表内用“”号标记,并在表外加以说明;11.频数表制作的基本步骤:用来表示一批数据各观察值或在不同取值区间的出现的频繁程度频数;对于离散数据,每一个观察值即对应一个频数,如某医院某年度一日内死亡0,1,2,…20个病人的天数;如描述某学校学生性别分布情况,男、女生的人数即为各自的频数;对于散布区间很大的离散数据和连续型数据,数据散布区间由若干组段组成,每个组段对应一个频数;制作连续型数据频数表一般步骤如下:1求数据的极差range;min max X X R -=2-12根据极差选定适当“组段”数通常8—10个;确定组段和组距;每个组段都有下限L 和上限U ,数据χ归组统一定为L ≤χ<U ;3写出组段,逐一划记;频数表可用于揭示资料的分布特征和分布类型,在文献中常用于陈述资料,它便于发现某些特大或特小的可疑值,也便于进一步计算指标和统计分析处理;12.实验设计的基本原则1随机化原则总体中的每一个观察单位都有同等的机会被选入实验组和对照组或进入样本,保证了非处理因素在各组间均衡一致而使样本具有代表性;2对照原则正确的设立对照可可控制实验过程中非实验因素的影响和偏倚,从而使处理因素的效应充分的显露出来;3.重复的原则保证每一个处理都有足够的重复数样本量,避免把偶然性或巧合的现象当作必然的规律性现象,并能正确的估计实验误差;三、综合题1.应用相对数时应注意的问题有:⑴计算相对数的分母一般不宜过小;⑵分析时不能以构成比代替率;⑶不能用构成比的动态分析代替率的动态分析;⑷对观察单位数不等的几个率,不能直接相加求其总率;⑸在比较相对数时应注意可比性;⑹对样本率或构成比的比较应随机抽样,并做假设检验;2.为什么不能以构成比代率请联系实际加以说明;率和构成比所说明的问题不同,绝不能以构成比代率;构成比只能说明各组成部分的比重或分布,而不能说明某现象发生的频率或强度;例如:以男性各年龄组高血压分布为例,50~60岁年龄组的高血压病例占%,所占比重最大,60~岁组则只占到%;这是因为60~岁以上受检人数少,造成患病数低于50~60岁组,因而构成比相对较低;但不能认为年龄在50~60岁组的高血压患病率最严重,而60岁以上反而有所减轻;若要比较高血压的患病率,应该计算患病率指标;3.某年抽样调查某地120名18~35岁健康男性居民血清铁含量μmol/L,数据如下:….. …. ……………….. ….. …问如何对该资料进行统计描述答案要点:可绘制频率表或直方图,以直观的体现该资料的分布特征;若成对称分布,可选用算数均数表达集中水平,标准差表达变异离散情况;若偏态非对称,可用中位数表达集中水平,四分位数间距表达变异离散情况;4.某县防疫站1972年开始在城关镇建立“预防接种卡”,使计划免疫得到加强;为说明效果,1975年5月观察了482人的锡克试验反应,其中:幼儿园儿童101人,阳性21人;小学生145人,阳性22人;中学生236人,阳性15人;相比起来,1947年为:幼儿园儿童144人,阳性37人;小学生1417人,阳性323人;中学生359人,阳性41人;试用适当的统计表和统计图描述上述结果,并作简要分析;。

(完整版)医学统计学复习要点

(完整版)医学统计学复习要点

..第一章绪论1、数据/资料的分类:①、计量资料,又称定量资料或者数值变量;为观测每个观察单位某项治疗的大小而获得的资料。

②、计数资料,又称定性资料或者无序分类变量;为将观察单位按照某种属性或者类别分组计数,分组汇总各组观察单位数后而得到的资料。

③、等级资料,又称半定量资料或者有序分类变量。

为将观察单位按某种属性的不同程度分成等级后分组计数,分类汇总各组观察单位数后而得到的资料。

2、统计学常用基本概念:①、统计学(statistics )是关于数据的科学与艺术,包括设计、搜集、整理、分析和表达等步骤,从数据中提炼新的有科学价值的信息。

②、总体(population )指的是根据研究目的而确定的同质观察单位的全体。

③、医学统计学(medical statistics ):用统计学的原理和方法处理医学资料中的同质性和变异性的科学和艺术,通过一定数量的观察、对比、分析,揭示那些困惑费解的医学问题背后的规律性。

④、样本(sample ):指的是从总体中随机抽取的部分观察单位。

⑤、变量(variable ):对观察单位某项特征进行测量或者观察,这种特征称为变量。

⑥、频率(frequency ):指的是样本的实际发生率。

⑦、概率(probability):指的是随机事件发生的可能性大小。

用大写的P 表示。

3、统计工作的基本步骤:①、统计设计:包括对资料的收集、整理和分析全过程的设想与安排;②、收集资料:采取措施取得准确可靠的原始数据;③、整理资料:将原始数据净化、系统化和条理化;④、分析资料:包括统计描述和统计推断两个方面。

第二章计量资料的统计描述1. 频数表的编制方法,频数分布的类型及频数表的用途①、求极差(range ):也称全距,即最大值和最小值之差,记作R ;②、确定组段数和组距,组段数通常取10-15组;③、根据组距写出组段,每个组段的下限为L ,上限为U ,变量X 值得归组统一定为L ≤X <U ,最后一组包括下限。

《医学统计学》复习资料

《医学统计学》复习资料

《医学统计学》复习资料一、名词解释1.计量资料( measurement data):是用定量方法测量观察对象指标数值的大小所得到的资料。

通常有单位。

又称为数值变量资料。

2.计数资料(enumeration data):通常先将研究对象按观察指标的性质和类别分类,然后清点个数得到的资料。

又称分类变量资料。

如患病未患病。

3.等级资料(ranked data,等级分组资料):指研究资料既有计数资料的特性,又有半定量的性质,称等级(分组)资料,又称半定量资料。

4、同质(homogeneity)指观察单位研究指标的影响因素相同(即同质指研究指标的影响因素性质相同)。

5、变异(heterogeneity/variance):指同质的个体之间的差异,来源于一些未加控制或无法控制的甚至不明原因的因素。

6、总体(population):根据研究目的确定的同质观察单位的全体,即按研究目的确定的同质观察单位某项变量值的集合。

7、样本(sample):从总体中随机抽取的有代表性的一部分观察单位组成样本(是某项指标的实测值组成样本)。

8、抽样( sampling ):从总体中抽取部分个体的过程。

9、完全随机设计(completely random design):指将受试对象随机分配到处理组、对照组中,或从不同总体中随机抽样进行研究。

10、配对设计(paired design):指将受试对象按配对条件配成对子,称为配对样本。

11、●随机区组设计(randomized block design):随机区组设计是配对设计的扩展。

●随机事件(random event):是指随机现象的某个可能的观察结果或可能发生也可能不发生的事件。

12、误差(error):泛指观测值与真实值之差,统计量与总体参数之差。

13、系统误差(system error):观测值倾向性的偏大或偏小。

影响准确性,须克服。

14、抽样误差(sampling error) :由抽样不同引起的样本均数(或其他统计量)与总体均数(或其他参数)之间的差异称作抽样误差;产生原因包括个体差异和抽样时只能抽取部分总体做样本;虽然不可避免,但可以用统计方法进行分析。

医学统计课程理论复习

医学统计课程理论复习
1
两指标均为正态计量指标用相关系数。
2
两指标为非正态计量指标用秩相关系数。
3
两指标均为等级指标用秩相关系数。
6
一个为计数指标,另一个为计量指标用 t 检验或者方差分析。
5
一个为等级指标,另一个为计量指标用秩相关系数,或者用方差分析。
4
两指标为计数指标用列联系数,卡方检验。
考察两指标间有无关系
八.计数资料的统计分析
可信区间的大小与样本含量及可信度的大小有关,一般地说,随着可信度的加大,可信区间也加大,随着样本含量的加大,可信区间缩小。(P2,-L7)
假设检验又称显著性检验,先对总体的参数或分布作出某种假设,假设有两种(1)检验假设用H0表示,(2)对立假设或备择假设用H1表示,H0与H1是相互联系、相互对立的假设。然后选择适当的样本统计量,进行统计推断,究竟是拒绝H0,还是不拒绝H0。 其基本步骤为: 建立H0,H1。 选择合适的统计检验方法,计算统计量。 根据检验统计量的分布,计算概率P值,或者根据其临界值表,决定P的大小。 (P2,-L4)
计数资料的描述性统计指标主要是:率和构成比。(P177,L11) 率说明某种现象发生的频率或强度。 (P177,L17) 构成比表示事物或现象内部各构成部分的比重,通常以100作为比例基数, 故常称为百分比。 (P178,L2) 构成比和率是两个不同的相对数,不能混淆。
01
小样本团体t检验如方差不齐时可用t'检验。
05
团体t检验要求两个样本都来自正态分布并具有相同的方差。
03
如不符合要求可作变量置换或用非参数统计分析方法。
04
方差分析
01
方差分析主要用于检验计量资料中两个或两个以上均数间差别显著性的方法。要求各样本都来自正态总体, 且有一个相同的方差σ2,仅仅均数可以不相同;还需假定每一个观察值都由若干部分累加而成,也即总的效果可分成若干部分,而每一部分都有一个特定的含义,称之谓效应的可加性。(P60,L4)

医学统计学-知识梳理

医学统计学-知识梳理

均数±2.58标准差: 表示集中位置、离散程度均数±2.58标准误: 表示平均水平、抽样误差大小P75一、标准差的主要作用是估计正常值的范围实际应用中, 估计观察值正常值范围应该用标准差(s), 表示为“Mean ±SD”。

此写法综合表达一组观察值的集中和离散特征的变异情况, 说明样本平均数对观察值的代表性。

s 的大或小说明数据取值的分散或集中。

s与样本均数合用, 主要是在大样本调查研究中, 对正态或近似正态分布的总体正常值范围进行估计。

如果不是为了正常值范围估计, 一般不用。

当数据与正态分布相差很大, 或者虽为正态分布, 但样本容量太小(小于30 或100), 也不宜用估计正常值范围。

二、标准差还可用来计算变异系数(CV)当两组观察值单位不同, 或两均数相差较大时, 不能直接用标准差比较其变异程度的大小, 须用变异系数系数来做比较。

:2.2 标准误的正确使用一、标准误用来衡量抽样误差的大小和了解用样本平均数来推论总体平均数的可靠程度。

在抽样调查中, 往往通过样本平均数来推论总体平均数, 样本标准误适用于正态或近似正态分布的数据, 是主要描述小样本试验中, 样本容量相同的同质的多个样本平均均数间的变异程度的统计量。

即如果多次重复同一个试验, 它们之间的变异程度用。

显然它越小, 样本平均数变异越小, 越稳定, 用样本平均数估计总体均数越可靠。

因此, 为说明它的稳定性、可靠性或通过几个对几组数据进行比较(这是科研论文中最常见的), 应当用描述数据。

实际应用中应该写成“平均数±标准误”或而英文表示为“Mean ±SE”的形式。

二、标准误还可以进行总体平均数的区间估计与点估计(置信区间)。

根据正态分布原理, 与合用还可以给出正态总体平均数的可信区间估计即推论总体平均数的可靠区间, 例如常用(其中t0.05 (n-1) 为样本容量是n的t界值)表示总体均值的95%可信区间, 意指总体平均数有95%的把握在所给范围内。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

名词解释:1.计量资料:用定量方法对每个观察对象测定某项指标量的大小,所得的资料称为计量资料。

2.sampling error(抽样误差):由个体变异产生的、由于抽样而造成的样本统计量与样本统计量及样本统计量与总体参数之间的差异称为抽样误差。

无倾向性,不可避免。

3.standard deviation(标准差):是各数据偏离平均数的距离的平均数,它是离均差平方和平均后的方根,用σ表示。

标准差是方差的算术平方根。

标准差能反映一个数据集的离散程度。

平均数相同的,标准差未必相同。

4.非参数检验:泛指“对分布类型已知的总体进行参数检验”之外的所有检验方法。

从检验的内容来说,不是检验总体分布的某些参数,而是检验总体某些有关的性质。

5.正态分布(normal distribution):若指标X的频率曲线对应于正态曲线,则称该指标服从正态分布,通常用记号N(µ,σ2)表示均数为标准差为的正态分布。

6.相关系数:以符号r表示样本相关系数,表示总体相关系数。

它是说明具有直线关系的两个变量相关关系的密切程度和相关方向的指标。

7.方差分析:方差分析(analysis of variance,ANOVA)就是根据资料的设计类型,即变异的不同来源将全部观察值总的离均差平方和与自由度分解为两个或多个部分,除随机误差外,其余每个部分的变异可由某个因素的作用(或某几个因素的交互作用)加以解释。

通过各变异来源的均方与误差均方比值的大小,借助F分布作出统计推断,判断各因素对观测指标有无影响。

8.率的标准化:在一个指定的标准构成条件下进行率的比较的方法。

9.confidence interva(置信区间):统计上把这个给定的抽样误差范围叫做抽样极限误差,也称置信区间(抽样误差范围:变动的的抽样指标与确定的全及指标之间离差的可能范围)。

10.构成比:表示某事物内部各组成部分在整体中的比重,常以百分比表示。

11.standard normal distribution(标准正态分布):均数为0标准差为1的正态分布为标准正态分布,记为N(0,1)。

简答题:1.简述t分布的特征以及t检验的基本思想、t检验的注意事项,方差分析基本思想t分布有如下特征:1.以0为中心,左右对称的单峰分布;2.t分布是一簇曲线,其形态变化与n(确切地说与自由度ν)大小有关。

自由度ν越小,t分布曲线越低平;自由度ν越大,t分布曲线越接近标准正态分布(u分布)曲线假设检验的基本思想是:先提出假设,然后在假设成立的前提下看实际抽到的样本是否属小概率事件若属小概率事件则拒绝该属小概率事件,若属小概率事件,则拒绝该假设;若不属小概率事件,则不拒绝该假设。

方差分析基本思想:将全部观察值总的离均差平方和(SS总)及自由度(?总)分解为两个或多个部分除随机误差外,其余每个部分的变异可由某个因素的作用加以解释通过比较不同来源变异的均方(MS),借助F分布做出统计推断,从而了解该因素对观察指标有无影响。

2.试述假设检验的步骤有哪些以及配对设计的几种情况如何假设检验的基本步:1.建立假设,确定检验水准α2.根据研究目的和设计类型选择适合的检验方法3.确定P值并作出统计结论3.线性相关分析和线性回归分析注意事项,直线相关与回归的区别与联系线性相关分析:双向性,正态性,抽样性,相关因果不等性。

线性回归分析:关联性,顺序性,正态性,抽样性,限制性。

区别和联系:(1)应用不同:直线回归用于说明两变量间数量依存变化的关系,描述y如何依赖于x而变化;直线相关用于说明两变量间的直线相关关系,此时两变量的关系是平等的。

(2)资料要求不同:直线回归要求应变量y是来自正态总体的随机变量,而x可以是来自正态总体的随机变量,也可以是严密控制、精确测量的变量;相关分析则要求x,y是来自双变量正态分布总体的随机变量。

4. χ2检验的基本思想是什么?进行χ2检验主要有哪3种类型的公式及其使用的条件是什么?行列表卡方检验的注意事项2检验的基本思想:是以X2值的大小来反映理论频数与实际频数的吻合程度。

在零假设H0(比如H0:2X1=X2)成立的条件下,实际频数与理论频数相差不应该很大,即X2值不应该很大,若实际计算出的X2值较大,超过了设定的检验水准所对应的界值,则有理由怀疑H0的真实性,从而拒绝H0,接受H1(比如H1:X1不等于X2)。

X2检验的通用公式对于四格表资料,理论频数T根据检验假设H0;π1=π2确定。

专用公式:在对两样本率比较时,当总例数n大于等于40且所有格子的T大于等于5,可用通用公式。

实际应用,为省去计算理论频数的步骤,简化计算公式,常用专用公式。

校正公式,用以校正以上公式。

检验的应用条件及注意事项:1.分析四格表资料时,应注意连续性校正的问题,当1<T<5,n>40时,用连续性校正2检验;T 1,或n 40时,用Fisher精确概率法。

2.对于R C表资料应注意以下两点:(1)理论频数不宜太小,一般要求:理论频数<5的格子数不应超过全部格子的1/5;(2)注意考察是否有有序变量存在。

对于单向有序R C表资料,当指标分组变量是有序的时,宜用秩和检验;对于双向有序且属性不同的R C表资料,若希望弄清两有序变量之间是否存在线性相关关系或存在线性变化趋势,应选用定性资料的相关分析或线性趋势检验;对于双向有序且属性相同的R C 表资料,为考察两种方法检测的一致性,应选用Kappa检验5.如何确定医学正常值范围的界限计算正常值百分界值的方法甚多,如正态分布法、对数正态分布法、正态概率纸法、百分位数法、曲线拟合法、容许区间法等。

现以95%正常值范围为例,主要介绍以下三种。

1.正态分布法:适用于正诚或近似正态分布资料。

2.对数正态分布法:适用于对数正态分布资料。

3.百分位数法:常用于偏态分布资料。

7. 简述描述资料离散程度的指标有哪些,正态分布的主要特征是什么?描述资料离散程度的指标有:极差,平均差,标准差。

正态分布有下列特征:①正态曲线(normal curve)在横轴上方均数处最高。

②正态分布以均数为中心,左右对称。

③正态分布两个参数(parameter),即均数μ和标准差σ;常用N(μ,σ)表示均数为μ、标准差为σ的正态分布;所以标准正态分布用N(0,1)表示。

④正态曲线在±1σ处各有一人拐点。

⑤正态曲线下的面积分布有一定的规律。

8. 简述变异系数的用途和正态分布曲线下面积分布规律变异系数的用途:进行两个或多个资料变异程度的比较时,如果度量单位与平均数相同,可以直接利用标准差来比较。

如果单位和(或)平均数不同时,比较其变异程度就不能采用标准差,而需采用标准差与平均数的比值(相对值)来比较。

标准差与平均数的比值称为变异系数正态分布曲线下面积分布规律:①标准正态分布时区间(-1,1)或正态分布时区间(μ-1σ,μ+1σ)的面积占总面积的68.27%;②标准正态分布时间(-1.96,1.96)或正态分布时区间(μ-1.96,μ+1.96)的面积占总面积的95.00%;③标准正态分布区间(-2.58,2.58)或正态分布时间区(μ-2.58,μ+2.58)的面积占总面积的99.00%.9、误差的分类及其各自特点系统误差与随机误差①系统误差:在实际观测过程中,由受试对象、研究者、仪器设备、研究方法、非实验因素影响等原因造成的有一定倾向性或规律性的误差。

流行病学称之为偏倚(bias)。

特点:观察值有系统性、方向性、周期性的偏离真值。

可以通过严格的实验设计和技术措施消除。

②随机误差:排除上述误差后尚存的误差,受多种无法控制的因素的影响。

特点:大小方向不一的随机变化。

10、频数分布表的用途可以揭示资料分布类型和分布特征,以便选取适当的统计方法;医.学教育网搜集整理便于进一步计算指标和统计处理;便于发现某些特大或特小的可疑值。

11、率的标准化标准如何选取一、率的标准化二、直接标准化法的计算方法三、间接标准化死亡比的计算方法12、非参数检验的适用范围1.有序分类资料(等级资料)。

2.分布类型未知的资料。

3.数据一端或两端有不确切值的资料。

4.不符合参数检验条件的资料。

13、多元逐步回归分析自变量选择方法,多元回归分析注意事项逐步回归是多元回归中用以选择自变量的一种常用方法,有“向前法”,“向后法”。

多元回归分析注意事项:(1) 确定几个特定的变量之间是否存在相关关系, 如果存在的话, 找出它们之间合适的数学表达式;(2) 根据一个或几个变量的值, 预测或控制另一个变量的取值, 并且可以知道这种预测或控制能达到什么样的精确度;(3) 进行因素分析。

例如在对于共同影响一个变量的许多变量(因素)之间, 找出哪些是重要因素, 哪些是次要因素, 这些因素之间又有什么关系等等。

14、统计表的结构如何?统计表由标题、标目、线条和数字所构成。

(1)标题:位于表的上方,概括表的主要内容,一般需注明时间与地点。

(2)标目:有横、纵标目之分,分别说明横行和纵行数字的含义,应做到文字简明,层次清楚。

(3)线条:多采用三条半线,即顶线、底线、纵标目下的横隔线及合计上的半线。

忌斜线和竖线。

(4)数字:表内数据一律采用阿拉伯数字。

同一指标小数点位数要一致,位次要对齐。

表内不应有空项,无数字用“—”表示,数字为零则填“0”,暂缺项或未记录用“…”表示。

(5)备注:不为表的必备内容,如有必要,可在表内用“*”号标记,然后在表的下方加以说明。

15、试验设计的三要素是什么?医学研究设计的几个原则?三要素:受试对象的种类问题,实验因素,实验效应。

医学研究设计的原则:随机化原则,对照的原则,盲法的原则,均衡性原则。

计算分析题:1、某医院147例大肠肝菌标本接种在A、B两种培养基上,然后进行检验,资料如下表,是分析两种培养基的检验结果是否有显著性。

大肠肝菌标本A、B两种培养基的培养结果A培养基B培养基+-+59 36-15 37合计74 73[参考答案]本题是一个配对设计的二分类资料,采用配对四个表资料的X2检验。

(1)建立检验假设并确定检验水准H0:C=B,即两种培养基的阳性培养率相等H1:C不等于B,即两种培养基的阳性培养率不相等a=0.5(2)计算检验统计量本例b+c =36+15=51> 40,用配对四个表X2检验公式,计算检验统计量X2值(3)确定P值,作出推断结论查X2界值表得P < 0.05。

按a=0.05水准,拒绝H0。

认为两种培养基的阳性培养率不同。

2、为研究某补钙制剂的临床效果,观察56例儿童,其中一组给与这种新药,另一组给与钙片,观察结果如表,问两种药物预防儿童的佝偻病患病率是否不同?表两组儿童的佝偻病患病情况组别病例数非病例数合计患病率(%)新药组8 32 40 20.0钙片组 6 10 16 37.5合计14 42 56 25.0[参考答案]本题是两组二分类频数分布的比较,用四个表2 检验。

相关文档
最新文档