《医学统计学》总复习
医学统计学总复习
总复习一、统计工作的基本步骤:四个步骤:设计(最关键的一步)、搜集资料(统计分析的前提)、整理资料、分析资料。
二、三种资料类型:1. 计量资料(定量资料)2. 计数资料(分类资料)3. 等级资料三、几个基本概念1. 总体与样本2. 概率四、计量资料的统计描述1. 集中趋势:X、G、M(Px):适用条件、计算2. 离散趋势:R、Q、S、CV:意义及适用条件五、集中趋势离散趋势指标的选择判断步骤:资料是抗体滴度 G、S否是偏态、开口 M、Q否X、S六、正态分布1.正态分布的特征2.正态曲线下分布面积的规律3.u变换(见下)七、抽样误差的概念1. 抽样误差(概念)2. 抽样误差的特点:⑴客观存在,可控制但不能消除;⑵它是反映抽样误差大小的指标:用Sx来说明均数的抽样误差大小;用Sp 来说明率的抽样误差大小;⑶均数抽样误差的大小与标准差成正比,与√n成反比;⑷减少抽样误差最切实可行的办法为:增加样本含量。
3. 总体均数的估计方法⑴点(值)估计:⑵区间估计:①95%可信区间:X±1.96Sx②99%可信区间:X±2.58Sx附:①正常参考值范围估计:①95%正常值范围:X±1.96S②99%正常值范围:X±2.58S②可信区间与正常值范围的区别4. u变换与t变换:X-μ X-μu变换: u=──── u=────σσxt变换: X-μt=────Sx八、假设检验的一般步骤:⑴建立假设①H0:无效假设;H1:备择假设②单双侧检验:根据专业知识来定。
⑵确定检验水准:α=0.05⑶选定检验方法并计算检验统计量⑷确定P值:直接计算、查表法⑸作出推断结论:统计结论:是否拒绝H0专业结论:谁高谁低?(有无效果)九、常用t检验(重点是掌握根据资料的性质、分析的目的来选择假设检验方法)1. t(u)检验的应用条件2. 假设检验方法:⑴ X与μ的比较的t检验(一般是单组原始数据)⑵配对设计资料的t检验(关键是掌握什么是配对资料)配对设计的三种情况:①同一对象治疗前后比较;②同一标本分别用两种方法处理;③将条件相同或相近的两个对象配成对子,然后随机分配到两个处理组中,观察两种处理有无差别。
医学统计学复习资料
小;③要注意分子分母正确选用;④要注意率与比的正确应用;⑤要注 意平均率的计算方法;⑥要注意资料的可比性;⑦率和构成比比较时作 假设检验。 7. 简述直线回归与直线相关的区别。 (1)资料要求上不同:直线回归分析适用于应变量是服从正态分布的随 机变量,自变量是选定变量;直线相关分析适用于服从双变量正态分布 的资料。 (2) 两种系数的意义不同:回归系数是表明两个变量之间数量上的依存 关系,回归系数越大回归直线越陡峭,表示应变量随自变量变化越快; 相关系数是表明两个变量之间相关的方向和紧密程度的,相关系数越 大,两个变量的关联程度越大。 9. 假设检验的理论依据是什么?请简述假设检验的基本步骤。 答:假设检验的理论依据是小概率事件原理,步骤为: (1)根据研究目的建立假设,确定检验水准 (2)根据样本统计量的抽样分布规律,选择适当的统计方法,计算检验 统计量 (3)确定P值,做出推断结论 10.方差分析应用广泛,可用于:①两个或多个样本均数间的比较;②分 析两个或多个因素间的交互作用;③回归方程的线性假设检验;④多元 线性回归分析中偏回归系数的假设检验等。本章主要介绍完全随机设计 资料的方差分析、配伍组设计资料的方差分析及重复测量数据的方差分 析。 11. 完全随机设计的两样本率比较时,如何正确选择统计分析方法 (写出相应的计算公式)。 (1)当总例数n≥40且所有格子的T≥5时,用2检验的基本公式或四格表 资料2检验的专用公式; (2)当n≥40但有1≤T<5时,用四格表资料2检验的校正公式;或改用四 格表资料的Fisher确切概率法的连续性校正法: (3)当n<40,或T<1时,用四格表资料的Fisher确切概率法。 12. 什么是医学参考值范围?估计医学参考值范围如何正确选用统计 方法? 答:医学参考值范围是指所谓“正常人”的解剖、生理、生化等指标的 波动范围,亦称正常值范围。如95%的参考值范围包括了95%的观察 值,而有5%的观察值不在这一范围内。 估计医学参考值范围确定方法:
医学统计学复习题
医学统计学复习题一、名词解释1、总体2、样本3、随机抽样4、变异5、概率6、随机误差(偶然误差)7、参数8、统计量9、算术均数10、中位数11、百分位数12、频数分布表13、几何均数14、四分位数间距15、方差16、标准差17、变异系数18、标准正态分布19、医学参考值范围20、可信区间21、统计推断22、参数估计23、标准误及24、检验水准25、检验效能26、率27、直线相关28、直线回归29、实验研究30、回归系数二、单项选择1.观察单位为研究中的()。
A.样本B.全部对象C.影响因素D.个体E.观察指标2.总体是由( )组成。
A.部分个体B.全部对象C.全部个体D.同质个体的所有观察值E.相同的观察指标3.抽样的目的是()。
A.研究样本统计量B.由样本统计量推断总体参数C.研究典型案例D.研究总体统计量E.研究特殊个体的特征4.参数是指( ) 。
A.参与个体数B.总体中研究对象的总和C.样本的统计指标D.样本的总和E.总体的统计指标5.关于随机抽样,下列哪一项说法是正确的()。
A.抽样时应使得总体中的每一个个体都有同等的机会被抽取B.研究者在抽样时应精心挑选个体,以使样本更能代表总体C.随机抽样即随机抽取个体D.为确保样本具有更好的代表性,样本量应越大越好E.选择符合研究者意愿的样本6.反映计量资料平均的指标是()。
A.频数B.参数C.百分位数D.平均数E.统计量7.表示总体均数的符号是( ) 。
A.σB.μC.XD. SE. M8.下列指标中,不属于集中趋势指标的是( )。
A.均数B.中位数C.百分位数D.几何均数E.众数9. ( )分布的资料,均数等于中位数 。
A.对称分布B.正偏态分布C.负偏态分布D.对数正态分布E.正态分布10.一组某病患者的潜伏期(天)分别是:2、5、4、6、9、7、10和18,其平均水平的指标该选( )。
A.中位数B.算术均数C.几何均数D.平均数E.百分位数末端有确定数据11.利用频数分布表和公式 ∑-+=L m f n f iL M 2(计算中位数时,要求( )。
医学统计学复习资料(完整版)
第1章绪论医学统计学是一门“运用统计学的原理和方法,研究医学科研中有关数据的收集、整理和分析的应用科学。
1.个体:又称观察单位,是统计研究的最基本单位,也是构成总体的最基本的观察单位。
2.总体:根据研究目的确定的同质观察单位某项指标测量值(观察值)的集合。
分为有限总体(明确规定了空间、时间、人群范围内有限个观察单位)和无限总体(无时间和空间范围的限制)。
反映总体特征的指标为参数,常用小写希腊字母表示。
3.样本:从总体中随机抽取的一部分有代表性的观察单位组成的整体。
(抽样,随机化原则,样本含量)根据样本资料计算出来的相应指标为统计量,常用大写英文字母表示。
4.抽样研究:从总体中随机抽取样本,根据样本信息推断总体特征的方法。
抽样误差是由随机抽样(样本的偶然性)造成的样本指标与总体指标之间、样本指标与样本指标之间的差异。
其根源在于总体中的个体存在变异性。
只要是抽样研究,就一定存在抽样误差,不能用样本的指标直接下结论。
统计分析主要是针对抽样误差而言。
5.变量(一个个体的任意“特征”);资料(变量值的集合),资料类型:①计量资料/定量资料/数值变量资料:表现为数值大小,一般有度量衡单位,又可分为连续型和离散型两类;②计数资料/定性资料/无序分类变量资料/名义变量资料:表现为互补相容的属性或类别,一般无度量衡单位,可分为二分类和多分类;③等级资料/半定量资料/有序分类变量资料:表现为等级大小或属性程度。
各类资料间可相互转化。
①可选分析方法有:t检验、方差分析、相关回归分析等;②可选分析方法有:χ2检验、z检验等;③可选分析方法有:秩和检验、Ridit分析等。
6.误差:实测值与真实值之差。
可分为随机误差(随机测量误差+抽样误差)与非随机误差(系统误差与非系统误差)。
①随机误差:是一类不恒定、随机变化的误差,由多种尚无法控制的因素引起,它是不可避免的;②系统误差:是实验过程中产生的误差,它的值或恒定不变,或遵循一定的变化规律,其产生原因往往是可知的或可以掌握的,它是可以消除或控制的;③非系统误差:又称过失误差,是指在实验过程中由于研究者偶然失误而造成的误差,可以消除。
(完整)医学统计学复习(练习及答案)
第1题:下列有关等级相关系数ts的描述中不正确的是A。
不服从双变量正态分布的资料宜计算rSB。
等级数据宜计算rsC。
rs值-1~+1之间D.查rs界值表时, rs值越大,所对应的概率P值也越大E。
当变量中相同秩次较多时,宜计算校正rs值,使rs值减小第2题:对某样本的相关系数r和0的差别进行检验,结果t1A。
两变量的差别无统计意义B.两变量存在直线相关的可能性小于5%C。
两变量肯定不存在相关关系D.两变量间存在相关关系E。
就本资料尚不能认为两变量存在直线相关关系第3题:总体率95%可信区间的意义是。
A.95%的正常值在此范围B。
95%的样本率在此范围C.95%的总体率在此范围D.总体率在此范围内的可能性为95%E。
样本率在此范围内的可能性为95%第4题:样本含量的确定下面哪种说法合理。
A。
样本越大越好B.样本越小越好C。
保证一定检验效能条件下尽量增大样本含量D.保证一定检验效能条件下尽量减少样本含量E.越易于组织实施的样本含量越好第5题:直线相关与回归分析中,下列描述不正确的是。
A.r值的范围在—1~+1之间B.已知r来自ρ≠0的总体,则r〉0表示正相关, r<0表示负相关C。
已知Y和X相关,则必可计算其直线回归方程D。
回归描述两变量的依存关系,相关描述其相互关系E.r无单位第6题:四格表χ2检验的自由度为1,是因为四格表的四个理论频数( )A.受一个独立条件限制B。
受二个独立条件限制C。
受三个独立条件限制D。
受四个独立条件限制E.不受任何限制第7题:对同一双变量(X,Y)的样本进行样本相关系数的tr检验和样本回归系数的tb检验,有。
A. tb≠trB. tb=trC. tb〉trD。
tbE。
视具体情况而定第8题:为了由样本推断总体,样本应该是。
A。
总体中任意的一部分B.总体中的典型部分C。
总体中有意义的一部分D。
总体中有价值的一部分E。
总体中有代表性的一部分第9题:以下检验方法属非参数法的是。
医学统计学复习资料(名解+简答)
医学统计学复习资料(名解+简答)一、名词解释1.统计量 (statistic):统计量是统计理论中用来对数据进行分析、检验的变量。
2.同质 (homogeneity):是指观察单位(研究个体)间被研究指标的影响因素相同。
3. 抽样误差 (sampling error):由于随机抽样造成的样本均数与总体均数的差别。
4. 总体 (population):根据研究目的而确定的同质观察单位的全体称为总体,更确切的说,它是同质的所有观察单位某种观察值的集合。
5. 变异 (variation):变异就是标志在同一总体不同总体单位之间的差别。
6. 参数 (parameter):参数,也叫参变量,是一种变量。
7. 样本 (sample):研究中实际观测或调查的一部分个体称为样本,研究对象的全部称为总体。
8. 概率 (probability):概率是对随机事件发生的可能性的度量,一般以一个在0到1之间的实数表示一个事件发生的可能性大小。
越接近1,该事件更可能发生;越接近0,则该事件更不可能发生。
1. 正态分布 (normal distribution):靠近均数分布的频数最多,离开均数越远,分布的数据越少,左右两侧基本对称,这种中间多、两侧逐渐减少的基本对称的分布,称为正态分布2. 中位数 (median):一组数据按从小到大(或从大到小)的顺序依次排列,处在中间位置的一个数(或最中间两个数据的平均数,注意:和众数不同,中位数不一定在这组数据中)3. 方差 (variance):是各个数据与其算术平均数的离差平方和的平均数,通常以σ2表示。
4. 四分位数间距 (quartile interval):是上四分位数与下四分位数之差,用四分位数间距可反映变异程度的大小。
5. 正偏态分布 (positively skewed distribution):为统计学概念,即统计数据峰值与平均值不相等的频率分布。
如果频数分布的高峰向左偏移,长尾向右侧延伸称为正偏态分布,也称右偏态分布。
医学统计学-总复习
2021/9/24
47
四格表资料卡方
根据以下三条件选择具体方法: • 若n>40,T>5时,直接计算2值;
• 若n > 40 ,此时有 1< T 5时,需计算
Yates连续性校正2值;
• T <1,或n≤40或P≈α时,应改用Fisher
确切概率法直接计算概率。
2021/9/24
48
配对四格表资料卡方
2021/9/24
51
第十二章 基于秩的非参数检验
2021etric test)
信区间要么包含了总体均数,要么不包 动范围。“正常人”指排除了影
义
含。但可以说:当=0.05 时,95%CI 估 响所研究指标的疾病和有关因
计正确的概率为 0.95,估计错误的概率小 素的同质人群。“大多数”是指
于或等于 0.05,即有 95%的可能性包含 90%,95%,99%等。
了总体均数。
总体均数的波动范围
• 正态分布概念:
是一种重要的连续型分布,若以计量值为横轴绘 制一条频数分布曲线,这条曲线呈现对称的、中间 高、两侧逐渐下降的形状,其位置与均数有关,形 状与标准差有关。
记作 X N(, 2) ,μ为 X 的总体均数, 2 为总体方差。
医学中常见的正态分布:
正态分布的参数
• 变量服从正态分布。记做 X ~ N (, 2 )
• 总体均数(位置参数) :描述正态分布的集中趋
势的位置
• 总体标准差(变异度参数) :描述正态分布离散 趋势, 越小,分布越集中,曲线形状越“瘦 高”;反之越“矮胖”。
• 正态曲线的形状由
两个参数决定
正态分布曲线的对称性质
• 设X服从 N(, 2) ,则正态曲线在X =处对称,正态曲线(-∞, )处的曲线下 面积为0.5,
医学统计学总复习资料
几种常用的方差分析
❖ 完全随机设计的方差分析(单因素) ❖ 随机区组的方差分析 ❖ 交叉设计的方差分析 ❖ 析因设计的方差分析
比较各种方差分析的变异分解
❖ 多个样本均数经方差分析后,若有统计学意义, 需用多重比较的方法进一步了解哪些均数间差 别有统计学意义。
❖ 常用SNK法(q检验)和Dunnett-t检验,前者为 两两间均作比较,后者为实验组和对照组比较。
❖ 一.名词解释5个(每题3分,共15分) ❖ 二.选择题30个(每题1.5分,共45分) ❖ 三.简答题3个(共15分) ❖ 四.案例辨析题2个(共15分) ❖ 五.综合分析题1个(共10分)
医学统计学总复习
张俊辉 2Leabharlann 10.12.27统计工作的步骤 ❖ 设计:统计工作的第一步和最关键的一步 ❖ 搜集 ❖ 整理 ❖ 分析
❖ 是否99%的置信区间优于95%置信区间 ?
❖ 建立检验假设,确定检验水准 ❖ 选定检验方法,计算检验统计量 ❖ 确定P值,作出统计推断
t检验
❖ t检验的应用条件为: ❖ ①在单样本检验中,总体标准差未知且样本含量较
小(n<50)时,要求样本来自正态分布总体; ❖ ②成组检验要求两组资料相应的总体分别服从正态
把全部观察值间的变异按设计类型的不同, 分解成两个或多个组成部分,然后将各部分 的变异与随机误差进行比较,以判断各部分 的变异是否具有统计学意义 。
❖ 1. 各样本是相互独立的随机样本,均服从正 态分布
❖ 2. 各样本的总体方差相等,即方差齐性
独立、正态、方差齐性 如果方差不齐时,可采用F’检验或秩和检验。
为
。一般情况下要求检验效能应在0.8
以上。
假设检验中的注意事项
医学统计学_总结_重点_笔记_复习资料
第一章2选1总体:总体(population)是根据研究目的确定的同质观察单位(研究对象)的全体,实际上是某一变量值的集合。
可分为有限总体和无限总体。
总体中的所有单位都能够标识者为有限总体,反之为无限总体。
总体population根据研究目的而确定的同质观察单位的全体。
样本:从总体中随机抽取部分观察单位,其测量结果的集合称为样本(sample)。
样本应具有代表性。
所谓有代表性的样本,是指用随机抽样方法获得的样本。
样本sample从总体中随机抽得的部分观察单位,其实测值的集合。
3选1小概率事件:我们把概率很接近于0(即在大量重复试验中出现的频率非常低)的事件称为小概率事件。
P值:P 值即概率,反映某一事件发生的可能性大小。
统计学根据显著性检验方法所得到的P 值反应结果真实程度,一般以P ≤ 0.05 认为有统计学意义, P ≤0.01 认为有高度统计学意义,其含义是样本间的差异由抽样误差所致的概率等于或小于0.05 或0.01。
P值是:1) 一种概率,一种在原假设为真的前提下出现观察样本以及更极端情况的概率。
2) 拒绝原假设的最小显著性水平。
3) 观察到的(实例的) 显著性水平。
4) 表示对原假设的支持程度,是用于确定是否应该拒绝原假设的另一种方法。
小概率原理:一个事件如果发生的概率很小的话,那么可认为它在一次实际实验中是不会发生的,数学上称之小概率原理,也称为小概率的实际不可能性原理。
统计学中,一般认为等于或小于0.05或0.01的概率为小概率。
资料的类型(3选1)(1)计量资料:对每个观察单位用定量的方法测定某项指标量的大小,所得的资料称为计量资料(measurement data)。
计量资料亦称定量资料、测量资料。
.其变量值是定量的,表现为数值大小,一般有度量衡单位。
如某一患者的身高(cm)、体重(kg)、红细胞计数(1012/L)、脉搏(次/分)、血压(KPa)等。
计量资料measurement data定量资料quantitative data数值变量资料numerical variable为观测每个观察单位某项指标的大小,而获得的资料。
医学统计学总复习
医学统计学总复习1、几种集中趋势指标的适用条件均数—正态分布或近似正态分布;几何均数—呈正偏态分布,但数据经过对数变换后呈正态分布的资料,也可用于观察值之间呈倍数或近似倍数变化(等比关系)的资料;中位数—偏态分布资料以及频数分布的一端或两端无确切数据资料。
几种离散程度指标的适用条件:极差(全距)—常用于描述单峰对称分布小样本资料的变异程度或用于初步了解资料。
四分位数间距—常用于描述偏态分布资料、两端无确切值或分布不明确资料的离散程度。
方差和标准差—正态分布和近似正态分布。
变异系数—比较计量单位不同以及均数相差悬殊的几组资料。
21.标准正态分布(u分布)与t分布的异同:相同点;集中位置都是0,都是单峰分布,是对称分布,标准正态分布是t分布的特例(自由度是无限大时)。
不同点:t分布是一簇分布曲线,t分布的曲线形态是随自由度的变化而变化,标准正态分布的曲线的形态不变,是固定不变的,因为它的形状参数为1。
3.为什么不可以说“总体均数有95%的概率落在这个区间里”?样调查的成本会更高5.t检验的应用条件为:▪①在单样本检验中,总体标准差未知且样本含量较小(n<50)时,要求样本来自正态分布总体;▪②成组检验要求两组资料相应的总体分别服从正态分布且方差齐。
当不满足这些条件时可使用变量变换将数据转换成正态或者近似正态分布,或使用秩和检验。
两小样本均数比较时,若两总体方差不相等,还可使用t’检验。
6.假设检验中的注意事项▪要保证组间的可比性▪要根据研究目的、设计类型和资料类型选用适当的检验方法▪正确理解假设检验中概率P值的含义▪结论不能绝对化▪单、双侧检验应事先确定7.方差分析的基本思想把全部观察值间的变异按设计类型的不同,分解成两个或多个组成部分,然后将各部分的变异与随机误差进行比较,以判断各部分的变异是否具有统计学意义。
8.方差分析的应用条件▪ 1. 各样本是相互独立的随机样本,均服从正态分布▪ 2. 各样本的总体方差相等,即方差齐性独立、正态、方差齐性如果方差不齐时,可采用F’检验或秩和检验。
(完整版)医学统计学复习要点
..第一章绪论1、数据/资料的分类:①、计量资料,又称定量资料或者数值变量;为观测每个观察单位某项治疗的大小而获得的资料。
②、计数资料,又称定性资料或者无序分类变量;为将观察单位按照某种属性或者类别分组计数,分组汇总各组观察单位数后而得到的资料。
③、等级资料,又称半定量资料或者有序分类变量。
为将观察单位按某种属性的不同程度分成等级后分组计数,分类汇总各组观察单位数后而得到的资料。
2、统计学常用基本概念:①、统计学(statistics )是关于数据的科学与艺术,包括设计、搜集、整理、分析和表达等步骤,从数据中提炼新的有科学价值的信息。
②、总体(population )指的是根据研究目的而确定的同质观察单位的全体。
③、医学统计学(medical statistics ):用统计学的原理和方法处理医学资料中的同质性和变异性的科学和艺术,通过一定数量的观察、对比、分析,揭示那些困惑费解的医学问题背后的规律性。
④、样本(sample ):指的是从总体中随机抽取的部分观察单位。
⑤、变量(variable ):对观察单位某项特征进行测量或者观察,这种特征称为变量。
⑥、频率(frequency ):指的是样本的实际发生率。
⑦、概率(probability):指的是随机事件发生的可能性大小。
用大写的P 表示。
3、统计工作的基本步骤:①、统计设计:包括对资料的收集、整理和分析全过程的设想与安排;②、收集资料:采取措施取得准确可靠的原始数据;③、整理资料:将原始数据净化、系统化和条理化;④、分析资料:包括统计描述和统计推断两个方面。
第二章计量资料的统计描述1. 频数表的编制方法,频数分布的类型及频数表的用途①、求极差(range ):也称全距,即最大值和最小值之差,记作R ;②、确定组段数和组距,组段数通常取10-15组;③、根据组距写出组段,每个组段的下限为L ,上限为U ,变量X 值得归组统一定为L ≤X <U ,最后一组包括下限。
《医学统计学》复习资料
《医学统计学》复习资料一、名词解释1.计量资料( measurement data):是用定量方法测量观察对象指标数值的大小所得到的资料。
通常有单位。
又称为数值变量资料。
2.计数资料(enumeration data):通常先将研究对象按观察指标的性质和类别分类,然后清点个数得到的资料。
又称分类变量资料。
如患病未患病。
3.等级资料(ranked data,等级分组资料):指研究资料既有计数资料的特性,又有半定量的性质,称等级(分组)资料,又称半定量资料。
4、同质(homogeneity)指观察单位研究指标的影响因素相同(即同质指研究指标的影响因素性质相同)。
5、变异(heterogeneity/variance):指同质的个体之间的差异,来源于一些未加控制或无法控制的甚至不明原因的因素。
6、总体(population):根据研究目的确定的同质观察单位的全体,即按研究目的确定的同质观察单位某项变量值的集合。
7、样本(sample):从总体中随机抽取的有代表性的一部分观察单位组成样本(是某项指标的实测值组成样本)。
8、抽样( sampling ):从总体中抽取部分个体的过程。
9、完全随机设计(completely random design):指将受试对象随机分配到处理组、对照组中,或从不同总体中随机抽样进行研究。
10、配对设计(paired design):指将受试对象按配对条件配成对子,称为配对样本。
11、●随机区组设计(randomized block design):随机区组设计是配对设计的扩展。
●随机事件(random event):是指随机现象的某个可能的观察结果或可能发生也可能不发生的事件。
12、误差(error):泛指观测值与真实值之差,统计量与总体参数之差。
13、系统误差(system error):观测值倾向性的偏大或偏小。
影响准确性,须克服。
14、抽样误差(sampling error) :由抽样不同引起的样本均数(或其他统计量)与总体均数(或其他参数)之间的差异称作抽样误差;产生原因包括个体差异和抽样时只能抽取部分总体做样本;虽然不可避免,但可以用统计方法进行分析。
医学统计学教学资料 医学统计学复习
---------------------------------------------------------------最新资料推荐------------------------------------------------------医学统计学教学资料医学统计学复习1、随机抽样调查上海市区某年男孩出生体重,得下表数据,问:(1)理论上95%男孩出生体重在什么范围?(2)估计全市男孩出生体重均数在什么范围?(3)该市某男孩出生体重为4.51kg,怎样评价?(4)以前上海市区男孩平均出生体重为3kg,问现在出生的男孩是否更重些? 129名男孩出生体重分布体重人数体重人数2.0- 13.6- 17 2.2- 23.8- 7 2.4- 54.0- 3 2.6- 10 4.2- 2 2.8- 12 4.4-4.6 1 3.0- 24 3.2- 23 3.4- 22 2、某地抽样调查100名正常成年男子红细胞数(万/立方毫米), 此资料符合正态分布 , 现计算其均数为537.8(万/立方毫米),标准差为40.9(万/立方毫米),, (1)理论上95%该地正常成年男子红细胞在什么范围?(2)估计该地正常成年男子红细胞的均数在什么范围?(95%) 3.从8窝大鼠的每窝中选出同性别,体重相近的2只,分别喂以水解蛋白和酪蛋白饲料,4周后测定其体重增加量,结果如下,若比较两种饲料对大鼠体重增加量有无显著性影响,应该用何种统计学方法?怎样做?窝编号 1 23 4 5 6 7 8 酪蛋白饲料组 82 6674 78 82 78 73 90 水解蛋白饲料组 15 28 291 / 428 24 38 21 37 4、某卫生防疫站对屠宰场及肉食零售点的猪肉,检查其表层沙门氏菌带菌情况,如下表,问两者带菌率有无差别?采样地点检查例数阳性例数带菌率(%)屠宰场28 2 7.14 零售点 14 5 35.71合计 42 7 16.67 5、某省在两县进行居民甲状腺抽样调查,得如下资料。
医学统计学_总结_重点_笔记_复习资料[精选]
医学统计学_总结_重点_笔记_复习资料[精选]第一篇:医学统计学_总结_重点_笔记_复习资料[精选]第一章2选1 总体:总体(population)是根据研究目的确定的同质观察单位(研究对象)的全体,实际上是某一变量值的集合。
可分为有限总体和无限总体。
总体中的所有单位都能够标识者为有限总体,反之为无限总体。
总体population根据研究目的而确定的同质观察单位的全体。
样本:从总体中随机抽取部分观察单位,其测量结果的集合称为样本(sample)。
样本应具有代表性。
所谓有代表性的样本,是指用随机抽样方法获得的样本。
样本sample从总体中随机抽得的部分观察单位,其实测值的集合。
3选1 小概率事件:我们把概率很接近于0(即在大量重复试验中出现的频率非常低)的事件称为小概率事件。
P值:P 值即概率,反映某一事件发生的可能性大小。
统计学根据显著性检验方法所得到的P 值反应结果真实程度,一般以P ≤ 0.05 认为有统计学意义,P ≤0.01 认为有高度统计学意义,其含义是样本间的差异由抽样误差所致的概率等于或小于0.05 或0.01。
P值是:1)一种概率,一种在原假设为真的前提下出现观察样本以及更极端情况的概率。
2)拒绝原假设的最小显著性水平。
3)观察到的(实例的)显著性水平。
4)表示对原假设的支持程度,是用于确定是否应该拒绝原假设的另一种方法。
小概率原理:一个事件如果发生的概率很小的话,那么可认为它在一次实际实验中是不会发生的,数学上称之小概率原理,也称为小概率的实际不可能性原理。
统计学中,一般认为等于或小于0.05或0.01的概率为小概率。
资料的类型(3选1)(1)计量资料:对每个观察单位用定量的方法测定某项指标量的大小,所得的资料称为计量资料(measurement data)。
计量资料亦称定量资料、测量资料。
.其变量值是定量的,表现为数值大小,一般有度量衡单位。
如某一患者的身高(cm)、体重(kg)、红细胞计数(10/L)、脉搏(次/分)、血压(KPa)等。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
• 描述生存过程的生存分析方法(乘积极限法和
寿命表法)的计算步骤
• 比较生存过程的生存分析方法(对数秩检验或
称log-rank 检验)及其应用注意事项
六、多因素分析简介
• 多重线性回归的应用条件和用途 • logistic回归的应用条件和用途 • Cox回归的应用条件和用途 • 多因素分析中几个共性问题
t 检验应用类型:
1)样本均数与总体均数的比较 2)完全随机设计的两样本均数的比较 3)完全随机设计的两样本几何均数的比较
4)配对设计的两样本均数的比较
u 检验应用类型:
1)样本均数与总体均数的比较
2)完全随机设计的两样本均数的比较
ANOVA 检验应用类型: 1)完全随机设计的方差分析 2)随机区组设计的方差分析 3)交叉设计的方差分析
G
S
M
S2 Q CV
定量资料的统计推断
• 参数估计
• 假设检验
参数估计
• 点估计:用样本均数直接作为总体
均数的估计值。优点:简单
缺点:没有考虑抽样误差
• 区间估计:常用95%的可信区间,样本含量
较大(n≥50)时采用以下公式:
X 1.96S X
假设检验方法
应用条件 正态分布、方差齐 正态分布、方差不齐
考试时间: 150分钟
17周六(12月29日)上午9:00-11:30
地点:附楼7楼
四、回归与相关分析
• 直线回归的应用条件和基本步骤
• 直线回归的应用和应用注意事项
• 直线相关的应用条件和基本步骤
• 直线相关的应用注意事项 • 直线回归和直线相关的区别与联系 • 秩相关的适用条件和基本步骤
五、生存分析
• 生存分析的概念及生存资料的特点
• 生存分析中的几个基本概念(生存时间、截尾
• χ2 检验
• 四格表确切概率法
• 一般四格表χ2 检验
应用条件:n≥40 且 T ≥5
ห้องสมุดไป่ตู้
• 校正四格表χ2 检验
应用条件:n≥40 但 1< T <5
• 行×列表χ2 检验
应用条件:不能有一个 格子T < 1 或1/5个格
子 T <5
• χ2 检验分割法
三、等级资料的统计分析(秩和检验)
• 非参数检验的概念 • 非参数检验的优缺点 • 常用的秩和检验方法
与联系
• 寿命表及其应用
二、统计图表
• 统计表的概念和种类 • 统计表的基本结构和制表原则 • 统计图的概念、基本结构和种类 • 统计图的制作原则 • 各种类型统计图的适用范围和用途(条图、
圆图和百分比条图、线图、直方图、散点图、 箱式图)
考试题型:
1、简答题:7题×5=35分 2、分析计算题: 5题×10=50分 3、SAS实习题15分
二、实验设计
• 实验设计的基本要素(处理因素、受试对象
和实验效应)
• 实验设计的基本原则 • 误差和偏倚的概念、分类及其控制措施 • 实验研究的样本含量估计 • 常用的实验设计方法(成组设计、随机区组
设计、析因设计、交叉设计)
• 随机数字表和随机排列表
§3
其他
一、生命统计的常用指标
• 死亡统计常用指标、疾病统计常用指标 • 发病率、患病率、病死率和死亡率的区别
X≤50(Poisson分布)
nπ且n( 1- π )≥5(二项分布)
正态近似法 μ≥20(Poisson分布)
• 基于二项分布的假设检验方法
二项分布的直接概率法 二项分布的正态近似法 nπ且n( 1- π )≥5
• 基于Poisson分布的假设检验方法
Poisson分布的直接概率法 :μ Poisson分布的正态近似法 ≥20
• t 检验 • t’检验
t
• u 检验
• ANOVA
大样本或总体标准差已知
独立随机、正态分布、方差齐
正态分布的经验判断方法
若 S 3 X ,可认为资料呈偏态分布
若 S X ,有理由怀疑资料呈偏态分布
方差齐性的经验判断方法
若 S12/ S22≥5,认为两样本总体方差不等
否则认为两总体方差相等
七、Meta分析
• Meta分析的概念 • Meta分析的基本统计方法 • Meta分析的注意事项
§2 统计设计
一、调查设计
• 调查研究的特点 • 常用调查方法(普查、典型调查和抽样调查) • 常用抽样调查方法的实施及其误差大小顺序
(整群抽样≥单纯随机抽样≥系统抽样≥分层 抽样)
• 问卷设计及其注意事项 • 调查研究的样本含量估计
4)析因设计的方差分析
5)重复测量资料的方差分析
二、计数资料的统计分析
计数资料的统计描述
• 绝对数 • 相对数:率(标准化率) 构成比 相对比
计数资料的统计推断
• 参数估计
• 假设检验
• 点估计
P→π (二项分布) X →μ (Poisson分布) N≤50(二项分布)
• 区间估计
查表法
(1) Wilcoxon符号秩和检验(配对设计)
(2) Wilcoxon 两样本比较法(成组设计两样本) (3) Kruskal-Wallis 法或H 检验 (成组设计多样本)
(4) Friedman 法(随机区组设计)
(5) Nemenyi 法(成组设计多样本两两比较) (6) 随机区组设计两两比较的秩和检验
《医学统计学》
总复习
胡利人 广东医学院 流行病与卫生统计学教研室
一、明确复习方向,转变观念
十二字方针: 强调设计
注重应用
淡化计算
二、熟悉教材内容,统揽全局
统计分析 统计设计
其它
§1 统计分析
一、定量资料的统计分析
定量资料的统计描述
• 反映集中趋势的指标: X • 反映离散趋势的指标: R