医学统计学总复习
医学统计学复习资料
小;③要注意分子分母正确选用;④要注意率与比的正确应用;⑤要注 意平均率的计算方法;⑥要注意资料的可比性;⑦率和构成比比较时作 假设检验。 7. 简述直线回归与直线相关的区别。 (1)资料要求上不同:直线回归分析适用于应变量是服从正态分布的随 机变量,自变量是选定变量;直线相关分析适用于服从双变量正态分布 的资料。 (2) 两种系数的意义不同:回归系数是表明两个变量之间数量上的依存 关系,回归系数越大回归直线越陡峭,表示应变量随自变量变化越快; 相关系数是表明两个变量之间相关的方向和紧密程度的,相关系数越 大,两个变量的关联程度越大。 9. 假设检验的理论依据是什么?请简述假设检验的基本步骤。 答:假设检验的理论依据是小概率事件原理,步骤为: (1)根据研究目的建立假设,确定检验水准 (2)根据样本统计量的抽样分布规律,选择适当的统计方法,计算检验 统计量 (3)确定P值,做出推断结论 10.方差分析应用广泛,可用于:①两个或多个样本均数间的比较;②分 析两个或多个因素间的交互作用;③回归方程的线性假设检验;④多元 线性回归分析中偏回归系数的假设检验等。本章主要介绍完全随机设计 资料的方差分析、配伍组设计资料的方差分析及重复测量数据的方差分 析。 11. 完全随机设计的两样本率比较时,如何正确选择统计分析方法 (写出相应的计算公式)。 (1)当总例数n≥40且所有格子的T≥5时,用2检验的基本公式或四格表 资料2检验的专用公式; (2)当n≥40但有1≤T<5时,用四格表资料2检验的校正公式;或改用四 格表资料的Fisher确切概率法的连续性校正法: (3)当n<40,或T<1时,用四格表资料的Fisher确切概率法。 12. 什么是医学参考值范围?估计医学参考值范围如何正确选用统计 方法? 答:医学参考值范围是指所谓“正常人”的解剖、生理、生化等指标的 波动范围,亦称正常值范围。如95%的参考值范围包括了95%的观察 值,而有5%的观察值不在这一范围内。 估计医学参考值范围确定方法:
医学统计学复习资料(完整版)
第1章绪论医学统计学是一门“运用统计学的原理和方法,研究医学科研中有关数据的收集、整理和分析的应用科学。
1.个体:又称观察单位,是统计研究的最基本单位,也是构成总体的最基本的观察单位。
2.总体:根据研究目的确定的同质观察单位某项指标测量值(观察值)的集合。
分为有限总体(明确规定了空间、时间、人群范围内有限个观察单位)和无限总体(无时间和空间范围的限制)。
反映总体特征的指标为参数,常用小写希腊字母表示。
3.样本:从总体中随机抽取的一部分有代表性的观察单位组成的整体。
(抽样,随机化原则,样本含量)根据样本资料计算出来的相应指标为统计量,常用大写英文字母表示。
4.抽样研究:从总体中随机抽取样本,根据样本信息推断总体特征的方法。
抽样误差是由随机抽样(样本的偶然性)造成的样本指标与总体指标之间、样本指标与样本指标之间的差异。
其根源在于总体中的个体存在变异性。
只要是抽样研究,就一定存在抽样误差,不能用样本的指标直接下结论。
统计分析主要是针对抽样误差而言。
5.变量(一个个体的任意“特征”);资料(变量值的集合),资料类型:①计量资料/定量资料/数值变量资料:表现为数值大小,一般有度量衡单位,又可分为连续型和离散型两类;②计数资料/定性资料/无序分类变量资料/名义变量资料:表现为互补相容的属性或类别,一般无度量衡单位,可分为二分类和多分类;③等级资料/半定量资料/有序分类变量资料:表现为等级大小或属性程度。
各类资料间可相互转化。
①可选分析方法有:t检验、方差分析、相关回归分析等;②可选分析方法有:χ2检验、z检验等;③可选分析方法有:秩和检验、Ridit分析等。
6.误差:实测值与真实值之差。
可分为随机误差(随机测量误差+抽样误差)与非随机误差(系统误差与非系统误差)。
①随机误差:是一类不恒定、随机变化的误差,由多种尚无法控制的因素引起,它是不可避免的;②系统误差:是实验过程中产生的误差,它的值或恒定不变,或遵循一定的变化规律,其产生原因往往是可知的或可以掌握的,它是可以消除或控制的;③非系统误差:又称过失误差,是指在实验过程中由于研究者偶然失误而造成的误差,可以消除。
《医学统计学》复习资料
统计学概述一、统计学的意义统计学是研究数据的收集、整理、分析的一门科学,是认识社会和自然现象客观规律数量特征的重要工具。
统计学方法就是帮助人们透过偶然现象认识其内在的规律性,揭示疾病或现象发生、发展规律,为预防疾病、促进健康提供客观依据。
二、统计学的基本概念(一)同质与变异同质是指被研究指标的影响因素相同。
变异是同质基础上的观察单位(亦称为个体)之间的差异。
(二)总体与样本总体是指根据研究目的确定的同质观察单位的全体。
样本从总体中随机抽取的部分观察单位,其测量值(或变量值)的集合。
(三)变量与变量值变量:确定总体后,研究者应对每个观察单位的某些特征进行测量或观察,这种特征称为变量,如:身高、体重等。
变量值:变量的测得值。
如身高150cm,体重50Kg等。
(四)参数与统计量参数是指总体特征的统计指标。
如某地健康成年男性的平均血红蛋白值。
统计量是指样本特征的统计指标。
如从某地健康成年男性中抽取一部分人的平均血红蛋白值。
(五)误差误差泛指测量值与真实值之差。
根据误差的性质和来源,统计工作中产生的误差主要有三种类型,即系统误差、随机测量误差、抽样误差。
1.系统误差:测量结果有倾向性。
查明原因,可以避免。
特点:①测量结果有倾向性。
如仪器、试剂、判定标准等。
②查明原因,可以避免。
2.随机测量误差:收集资料的过程中,即使避免了系统误差,但由于各种偶然因素造成的测量值与真实值不完全一致,这种误差称为随机测量误差。
特点:①随机误差没有大小和方向。
②不可避免。
3.抽样误差:由于随机抽样所引起的样本统计量与总体参数之间的差异以及各样本统计量之间的差异称为抽样误差。
特点:变异是绝对的,抽样误差不可避免。
原因:个体之间的差异;抽样时只能抽取总体中的一部分作为样本。
(六)概率(P)概率是描述某随机事件发生可能性大小的量值,常用符号P表示。
随机事件的概率在0~1之间,即0≤P≤1。
小概率事件:P≤0.05或P≤0.01的事件。
医学统计学-总复习
2021/9/24
47
四格表资料卡方
根据以下三条件选择具体方法: • 若n>40,T>5时,直接计算2值;
• 若n > 40 ,此时有 1< T 5时,需计算
Yates连续性校正2值;
• T <1,或n≤40或P≈α时,应改用Fisher
确切概率法直接计算概率。
2021/9/24
48
配对四格表资料卡方
2021/9/24
51
第十二章 基于秩的非参数检验
2021etric test)
信区间要么包含了总体均数,要么不包 动范围。“正常人”指排除了影
义
含。但可以说:当=0.05 时,95%CI 估 响所研究指标的疾病和有关因
计正确的概率为 0.95,估计错误的概率小 素的同质人群。“大多数”是指
于或等于 0.05,即有 95%的可能性包含 90%,95%,99%等。
了总体均数。
总体均数的波动范围
• 正态分布概念:
是一种重要的连续型分布,若以计量值为横轴绘 制一条频数分布曲线,这条曲线呈现对称的、中间 高、两侧逐渐下降的形状,其位置与均数有关,形 状与标准差有关。
记作 X N(, 2) ,μ为 X 的总体均数, 2 为总体方差。
医学中常见的正态分布:
正态分布的参数
• 变量服从正态分布。记做 X ~ N (, 2 )
• 总体均数(位置参数) :描述正态分布的集中趋
势的位置
• 总体标准差(变异度参数) :描述正态分布离散 趋势, 越小,分布越集中,曲线形状越“瘦 高”;反之越“矮胖”。
• 正态曲线的形状由
两个参数决定
正态分布曲线的对称性质
• 设X服从 N(, 2) ,则正态曲线在X =处对称,正态曲线(-∞, )处的曲线下 面积为0.5,
医学统计学总复习资料
几种常用的方差分析
❖ 完全随机设计的方差分析(单因素) ❖ 随机区组的方差分析 ❖ 交叉设计的方差分析 ❖ 析因设计的方差分析
比较各种方差分析的变异分解
❖ 多个样本均数经方差分析后,若有统计学意义, 需用多重比较的方法进一步了解哪些均数间差 别有统计学意义。
❖ 常用SNK法(q检验)和Dunnett-t检验,前者为 两两间均作比较,后者为实验组和对照组比较。
❖ 一.名词解释5个(每题3分,共15分) ❖ 二.选择题30个(每题1.5分,共45分) ❖ 三.简答题3个(共15分) ❖ 四.案例辨析题2个(共15分) ❖ 五.综合分析题1个(共10分)
医学统计学总复习
张俊辉 2Leabharlann 10.12.27统计工作的步骤 ❖ 设计:统计工作的第一步和最关键的一步 ❖ 搜集 ❖ 整理 ❖ 分析
❖ 是否99%的置信区间优于95%置信区间 ?
❖ 建立检验假设,确定检验水准 ❖ 选定检验方法,计算检验统计量 ❖ 确定P值,作出统计推断
t检验
❖ t检验的应用条件为: ❖ ①在单样本检验中,总体标准差未知且样本含量较
小(n<50)时,要求样本来自正态分布总体; ❖ ②成组检验要求两组资料相应的总体分别服从正态
把全部观察值间的变异按设计类型的不同, 分解成两个或多个组成部分,然后将各部分 的变异与随机误差进行比较,以判断各部分 的变异是否具有统计学意义 。
❖ 1. 各样本是相互独立的随机样本,均服从正 态分布
❖ 2. 各样本的总体方差相等,即方差齐性
独立、正态、方差齐性 如果方差不齐时,可采用F’检验或秩和检验。
为
。一般情况下要求检验效能应在0.8
以上。
假设检验中的注意事项
医学统计学_总结_重点_笔记_复习资料
第一章2选1总体:总体(population)是根据研究目的确定的同质观察单位(研究对象)的全体,实际上是某一变量值的集合。
可分为有限总体和无限总体。
总体中的所有单位都能够标识者为有限总体,反之为无限总体。
总体population根据研究目的而确定的同质观察单位的全体。
样本:从总体中随机抽取部分观察单位,其测量结果的集合称为样本(sample)。
样本应具有代表性。
所谓有代表性的样本,是指用随机抽样方法获得的样本。
样本sample从总体中随机抽得的部分观察单位,其实测值的集合。
3选1小概率事件:我们把概率很接近于0(即在大量重复试验中出现的频率非常低)的事件称为小概率事件。
P值:P 值即概率,反映某一事件发生的可能性大小。
统计学根据显著性检验方法所得到的P 值反应结果真实程度,一般以P ≤ 0.05 认为有统计学意义, P ≤0.01 认为有高度统计学意义,其含义是样本间的差异由抽样误差所致的概率等于或小于0.05 或0.01。
P值是:1) 一种概率,一种在原假设为真的前提下出现观察样本以及更极端情况的概率。
2) 拒绝原假设的最小显著性水平。
3) 观察到的(实例的) 显著性水平。
4) 表示对原假设的支持程度,是用于确定是否应该拒绝原假设的另一种方法。
小概率原理:一个事件如果发生的概率很小的话,那么可认为它在一次实际实验中是不会发生的,数学上称之小概率原理,也称为小概率的实际不可能性原理。
统计学中,一般认为等于或小于0.05或0.01的概率为小概率。
资料的类型(3选1)(1)计量资料:对每个观察单位用定量的方法测定某项指标量的大小,所得的资料称为计量资料(measurement data)。
计量资料亦称定量资料、测量资料。
.其变量值是定量的,表现为数值大小,一般有度量衡单位。
如某一患者的身高(cm)、体重(kg)、红细胞计数(1012/L)、脉搏(次/分)、血压(KPa)等。
计量资料measurement data定量资料quantitative data数值变量资料numerical variable为观测每个观察单位某项指标的大小,而获得的资料。
医学统计学总复习
医学统计学总复习1、几种集中趋势指标的适用条件均数—正态分布或近似正态分布;几何均数—呈正偏态分布,但数据经过对数变换后呈正态分布的资料,也可用于观察值之间呈倍数或近似倍数变化(等比关系)的资料;中位数—偏态分布资料以及频数分布的一端或两端无确切数据资料。
几种离散程度指标的适用条件:极差(全距)—常用于描述单峰对称分布小样本资料的变异程度或用于初步了解资料。
四分位数间距—常用于描述偏态分布资料、两端无确切值或分布不明确资料的离散程度。
方差和标准差—正态分布和近似正态分布。
变异系数—比较计量单位不同以及均数相差悬殊的几组资料。
21.标准正态分布(u分布)与t分布的异同:相同点;集中位置都是0,都是单峰分布,是对称分布,标准正态分布是t分布的特例(自由度是无限大时)。
不同点:t分布是一簇分布曲线,t分布的曲线形态是随自由度的变化而变化,标准正态分布的曲线的形态不变,是固定不变的,因为它的形状参数为1。
3.为什么不可以说“总体均数有95%的概率落在这个区间里”?样调查的成本会更高5.t检验的应用条件为:▪①在单样本检验中,总体标准差未知且样本含量较小(n<50)时,要求样本来自正态分布总体;▪②成组检验要求两组资料相应的总体分别服从正态分布且方差齐。
当不满足这些条件时可使用变量变换将数据转换成正态或者近似正态分布,或使用秩和检验。
两小样本均数比较时,若两总体方差不相等,还可使用t’检验。
6.假设检验中的注意事项▪要保证组间的可比性▪要根据研究目的、设计类型和资料类型选用适当的检验方法▪正确理解假设检验中概率P值的含义▪结论不能绝对化▪单、双侧检验应事先确定7.方差分析的基本思想把全部观察值间的变异按设计类型的不同,分解成两个或多个组成部分,然后将各部分的变异与随机误差进行比较,以判断各部分的变异是否具有统计学意义。
8.方差分析的应用条件▪ 1. 各样本是相互独立的随机样本,均服从正态分布▪ 2. 各样本的总体方差相等,即方差齐性独立、正态、方差齐性如果方差不齐时,可采用F’检验或秩和检验。
(完整版)医学统计学复习要点
..第一章绪论1、数据/资料的分类:①、计量资料,又称定量资料或者数值变量;为观测每个观察单位某项治疗的大小而获得的资料。
②、计数资料,又称定性资料或者无序分类变量;为将观察单位按照某种属性或者类别分组计数,分组汇总各组观察单位数后而得到的资料。
③、等级资料,又称半定量资料或者有序分类变量。
为将观察单位按某种属性的不同程度分成等级后分组计数,分类汇总各组观察单位数后而得到的资料。
2、统计学常用基本概念:①、统计学(statistics )是关于数据的科学与艺术,包括设计、搜集、整理、分析和表达等步骤,从数据中提炼新的有科学价值的信息。
②、总体(population )指的是根据研究目的而确定的同质观察单位的全体。
③、医学统计学(medical statistics ):用统计学的原理和方法处理医学资料中的同质性和变异性的科学和艺术,通过一定数量的观察、对比、分析,揭示那些困惑费解的医学问题背后的规律性。
④、样本(sample ):指的是从总体中随机抽取的部分观察单位。
⑤、变量(variable ):对观察单位某项特征进行测量或者观察,这种特征称为变量。
⑥、频率(frequency ):指的是样本的实际发生率。
⑦、概率(probability):指的是随机事件发生的可能性大小。
用大写的P 表示。
3、统计工作的基本步骤:①、统计设计:包括对资料的收集、整理和分析全过程的设想与安排;②、收集资料:采取措施取得准确可靠的原始数据;③、整理资料:将原始数据净化、系统化和条理化;④、分析资料:包括统计描述和统计推断两个方面。
第二章计量资料的统计描述1. 频数表的编制方法,频数分布的类型及频数表的用途①、求极差(range ):也称全距,即最大值和最小值之差,记作R ;②、确定组段数和组距,组段数通常取10-15组;③、根据组距写出组段,每个组段的下限为L ,上限为U ,变量X 值得归组统一定为L ≤X <U ,最后一组包括下限。
医学统计学_总结_重点_笔记_复习资料[精选]
医学统计学_总结_重点_笔记_复习资料[精选]第一篇:医学统计学_总结_重点_笔记_复习资料[精选]第一章2选1 总体:总体(population)是根据研究目的确定的同质观察单位(研究对象)的全体,实际上是某一变量值的集合。
可分为有限总体和无限总体。
总体中的所有单位都能够标识者为有限总体,反之为无限总体。
总体population根据研究目的而确定的同质观察单位的全体。
样本:从总体中随机抽取部分观察单位,其测量结果的集合称为样本(sample)。
样本应具有代表性。
所谓有代表性的样本,是指用随机抽样方法获得的样本。
样本sample从总体中随机抽得的部分观察单位,其实测值的集合。
3选1 小概率事件:我们把概率很接近于0(即在大量重复试验中出现的频率非常低)的事件称为小概率事件。
P值:P 值即概率,反映某一事件发生的可能性大小。
统计学根据显著性检验方法所得到的P 值反应结果真实程度,一般以P ≤ 0.05 认为有统计学意义,P ≤0.01 认为有高度统计学意义,其含义是样本间的差异由抽样误差所致的概率等于或小于0.05 或0.01。
P值是:1)一种概率,一种在原假设为真的前提下出现观察样本以及更极端情况的概率。
2)拒绝原假设的最小显著性水平。
3)观察到的(实例的)显著性水平。
4)表示对原假设的支持程度,是用于确定是否应该拒绝原假设的另一种方法。
小概率原理:一个事件如果发生的概率很小的话,那么可认为它在一次实际实验中是不会发生的,数学上称之小概率原理,也称为小概率的实际不可能性原理。
统计学中,一般认为等于或小于0.05或0.01的概率为小概率。
资料的类型(3选1)(1)计量资料:对每个观察单位用定量的方法测定某项指标量的大小,所得的资料称为计量资料(measurement data)。
计量资料亦称定量资料、测量资料。
.其变量值是定量的,表现为数值大小,一般有度量衡单位。
如某一患者的身高(cm)、体重(kg)、红细胞计数(10/L)、脉搏(次/分)、血压(KPa)等。
医学统计学复习(练习及答案)
第36题:使用相对数时容易犯的错误是。
A.把构成比作为相对比
B.把构成比作为率
C.把率作为相对比
D.把率作为构成比
E.把相对比作为构成比
第37题:描述一组偏态分布资料的变异度,宜用。
A.全距
B.标准差
C.变异系数
D.四分位数间距
E.方差
第38题:当统计分析结果是差别无显着性,但所求得的检验统计量在界值附近时,下结论应慎重,是因为。
A.差值的总体均数为0
B.差值的总体中位数为0
C. μd≠0
D. Md≠0
E. μ1≠μ2
第23题:样本率的标准误sp的特点有。
A.n越大,则sp越大
B.p越大,则sp越大
C.1-p越大,则sp越大
D.np越大,则sp越大
E.n越大,则sp越小
第24题:统计地图可用于表示。
A.某现象内部构成
B.某现象地理分布
A. ∑(X-X)2
B. ∑(Y-Y)2
C. ∑XY-(∑X)( ∑Y)/n
D. ∑Y2-(∑Y)2/n
E. ∑(X-X)2/n
第32题:t分布与正态分布存在如下哪一种关系。
A.二者均以0为中心,左右对称
B.曲线下中间95%面积对应的分位点均为±1.96
C.当样本含量无限大时,二都分布一致
D.当样本含量无限大时,t分布与标准正态分布一致
C.用该市5岁男孩身高的均数来评价
D.用该市5岁男孩身高的1-α可信区间来评价
E.用该市5岁男孩身高的全距来评价
第44题:同一双变量资料,进行直线相关与回归分析,有。
A. r>0时,b<0
B. r>0时,b>0
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
总复习
一、统计工作的基本步骤:
四个步骤:设计(最关键的一步)、搜集资料(统计分析的前提)、整理资料、分析资料。
二、三种资料类型:
1. 计量资料(定量资料)
2. 计数资料(分类资料)
3. 等级资料
三、几个基本概念
1. 总体与样本
2. 概率
四、计量资料的统计描述
1. 集中趋势:X、G、M(Px):适用条件、计算
2. 离散趋势:R、Q、S、CV:意义及适用条件
五、集中趋势离散趋势指标的选择判断步骤:
资料
是
抗体滴度 G、S
否是
偏态、开口 M、Q
否
X、S
六、正态分布
1.正态分布的特征
2.正态曲线下分布面积的规律
3.u变换(见下)
七、抽样误差的概念
1. 抽样误差(概念)
2. 抽样误差的特点:
⑴客观存在,可控制但不能消除;
⑵它是反映抽样误差大小的指标:用Sx来说明均数的抽样误差大小;用Sp 来说明率的抽样误差大小;
⑶均数抽样误差的大小与标准差成正比,与√n成反比;
⑷减少抽样误差最切实可行的办法为:增加样本含量。
3. 总体均数的估计方法
⑴点(值)估计:
⑵区间估计:①95%可信区间:X±1.96Sx
②99%可信区间:X±2.58Sx
附:①正常参考值范围估计:
①95%正常值范围:X±1.96S
②99%正常值范围:X±2.58S
②可信区间与正常值范围的区别
4. u变换与t变换:
X-μ X-μ
u变换: u=──── u=────
σσx
t变换: X-μ
t=────
Sx
八、假设检验的一般步骤:
⑴建立假设①H0:无效假设;H1:备择假设
②单双侧检验:根据专业知识来定。
⑵确定检验水准:α=0.05
⑶选定检验方法并计算检验统计量
⑷确定P值:直接计算、查表法
⑸作出推断结论:统计结论:是否拒绝H0
专业结论:谁高谁低?(有无效果)
九、常用t检验(重点是掌握根据资料的性质、分析的目的来选择假设检验方法)
1. t(u)检验的应用条件
2. 假设检验方法:
⑴ X与μ的比较的t检验(一般是单组原始数据)
⑵配对设计资料的t检验(关键是掌握什么是配对资料)
配对设计的三种情况:
①同一对象治疗前后比较;
②同一标本分别用两种方法处理;
③将条件相同或相近的两个对象配成对子,然后随机分配到两
个处理组中,观察两种处理有无差别。
⑶两样本均数比较的t检验
⑷两样本几何均数的t检验(两组抗体滴度比较)
⑸两大样本均数比较的u检验(n1,n2均大于50)
3.两小样本比较,方差不齐时的处理方法:①变量变换、②秩和检验、③t'检验
4.第一类错误与第二类错误(概念)
⒌假设检验应注意的问题(重点在于理解)
十、分类资料的统计描述
⑴常用相对数指标(概念)
⑵注意事项
⑶标化率:①意义②计算(直接法)
⑷动态数列(不要求)
十一、X2检验
1. X2检验的用途
2. 四格表资料X2检验的应用条件:
①不校正: n≥40, 且T≥5
②校正: n≥40, 且1≤T≤5
③不能用X2检验: n<40, 或T<1(改用确切概率法)
3. 常用的X2检验方法
⑴四格表资料(注意:a、b、c、d是否给全;校正条件);
⑵配对四格表资料
⑶行×列表资料:①用途;②注意事项。
⑷列联表资料:多样本率比较、计数资料的关联分析(双向有序分类资料);
⒋四格表的确切概率法(应用条件)
十二、秩和检验
1. 非参数统计的概念及其优缺点。
2. 常用的秩和检验方法:重点记住其编秩方法及查表确定P值的方法。
3. 首选秩和检验的情况:等级资料、开口资料、明显偏态分布资料的比较。
十三、调查设计
1. 四种抽样方法的概念及优缺点
2. 四种抽样方法的抽样误差大小顺序
3. 为了解参数而进行样本含量估计的目的及需事先确定的条件
十四、实验设计(全部为重点内容)
1. 基本原则(三原则)
2. 常用的对照形式(概念)
3. 实验设计的基本内容和步骤(重点在于理解)
4. 常用的实验设计方案(应用及特点,不要求具体的设计)
⒌样本例数估计(意义,需确定的条件)
十五、方差分析(多组资料比较)
1.方差分析基本思想(重点)
2.成组设计与配伍设计方差分析方法的判断:注意题目有无“配伍”二字。
3.本章只要求掌握:第一至四节,其余不要求。
十六、回归与相关
1. 直线回归的概念
2. 直线回归主要用途:解决由一个指标推算另一个指标的问题。
3. 回归系数的意义。
4. 回归分析的一般步骤:
①绘制散点图,初步判断是否呈直线趋势;
②计算a、b。
(如果基本呈直线趋势)
③对b作假设检验:方法:a. F检验
b. t检验
c. 用r检验来代替。
④作结论:如P≤0.05, 说明方程成立,列出回归方程;如P>0.05, 说明方程不成立,不列回归方程。
5. 直线相关的概念
6. 直线相关的主要用途:用于分析两变量是否有相关关系及其方向
7. 相关系数的意义
8. 相关分析的一般步骤:
①绘制散点图
②求r
③对r作假设检验:a. t检验; b. 查表
④作结论:有无相关及其方向
9. 直线回归与相关的联系与区别
10. 秩(等级)相关及其适用资料
11. 曲线回归(意义、方法)(不要求)
十七、生存分析
1、生存资料的特点
2、生存分析的几个基本概念
3、生存率计算方法:(1)K-M法:例数少,且为未分组;(2)寿命表法:例数多,且为频数表资料(注意:生存概率与生存率的结果)
4、生存率曲线比较:(1)log-rank test:两组或多组;(2)Gehan Score test:两组
十八、统计图表
重点在各种统计图的适用条件
期末考试题型
一、理论笔试(时间:90分钟)
1、最佳选择题:20题,每题2分,共40分;
2、是非题:15题,每题2分,共30分;
3、分析应用题:5/6题,每题5/10分,共30分。
二、上机考试(时间:50分钟)
每卷3题
卫生统计学上机考试题(样题)
姓名________ 学号________ 成绩________
1、随机抽样调查上海市区某年男孩出生体重,得下表数据,试估计全市男孩出生体重均数在什么范围?
129名男孩出生体重分布
体重人数体重人数
2.0- 1
3.6- 17
2.2- 2
3.8- 7
2.4- 5 4.0- 3
2.6- 10 4.2- 2
2.8- 12 4.4-4.6 1
3.0- 24
3.2- 23
3.4- 22
2、从8窝大鼠的每窝中选出同性别,体重相近的2只,分别喂以水解蛋白和酪蛋白饲料,4周后测定其体重增加量,结果如下,问两种饲料对大鼠体重增加量有无影响?
窝编号 1 2 3 4 5 6 7 8
酪蛋白饲料组 82 66 74 78 82 78 73 90
水解蛋白饲料组 15 28 29 28 24 38 21 37
3、下表是小肝癌患者手术后生存情况随访结果(11年底总结),用寿
命表法计算第 5、10年生存概率及5、10年生存率。
术后年数观察人数期内死亡人数
x~n x D x
0~ 25 10 1~ 22 20 2~ 10 9 3~ 11 7 4~ 10 1 5~ 8 4 6~ 4 0 7~ 4 1 8~ 3 0 9~ 3 0 10~ 2 0 11~ 1 0
上机考试答题要求
一、统计描述题
题意分析:
经SPSS计算得:
(列举计算结果)
答:…………..
二、假设检验题
题意分析:(指出用何种统计方法)
H0:
H1:
α=0.05
经SPSS计算得:
(列举统计量和P值)
推断结论:
注:如是多组比较(方差分析或秩和检验),可归纳性描述,不必再写出假设和统计量。
三、回归分析题
题意分析:……,经绘制散点图,基本呈直线趋势,用直线回归分析。
经SPSS计算,得:
a= b=
F= p=
结论:(如P≤0.05, 说明方程成立,列出回归方程;如P>0.05, 说明方程不成立,不列回归方程。
四、相关分析(含等级相关)
题意分析:……,经绘制散点图,基本呈(不)直线趋势,用直
线(等级)相关分析。
经SPSS计算,得:
r= p=
结论:。