医学统计学资料

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

医学统计学资料
第⼀章
1. 统计学定义
统计学是关于批量数据资料收集、分析、解释与表达的科学。

医学统计学(medical statistics)
⽤统计学理论和⽅法研究⽣物医学现象的⼀门学科。

医学统计学的主要研究对象是⼈,涉及到伦理学等诸多特殊问题,⼜有别于其他统计学。

2. 医学统计学的作⽤
◆医学统计知识是医学知识的组成部分,
◆医学统计⽅法是医学科研的基本⽅法,
◆医学统计结果是所有医学研究结果是否科学的重要证据之⼀。

3. 统计学在医学中的应⽤
⼀、变异的描述
在⾃然状态下,任何两个患者或两个研究群体间都存在差异。

这种在⾃然状态下测量结果的差异,统计上称为变异(variation)。

⼆、观察对⽐
早期的观察对⽐主要是⽐较不同总体统计指标的差异(地区、⼈群、时间)。

三、实验性研究
在有控制的条件下评价⼲预效果
第⼆章
◆采取前瞻性研究:治疗前采⽤随机分组,可保证两组患者治疗前的各种特征基本相
同。

采取回顾性研究:应根据患者病情、⼊院时间分层后,在患者的特征基本相同的条件下⽐较两种疗法的有效率。

这时,两组间除病情、⼊院时间基本相同外,其他影响有效率的因素不⼀定相同,如年龄、性别等。

回顾性的分层⽐较不能保证A、B两组治疗前的主要特征相同。

因此,只有在前瞻性随机对照试验研究设计的基础上,如果得到“A组的有效率⼤于B组”的结果,统计上才有充分理由说明治疗效果与不同的治疗⽅法有关。

◆区分科学研究和⽇常临床⼯作的关系
●科学研究预先有明确的研究⽬的,需要标准的试验条件和统⼀的数据采集⽅
法;
●⽇常临床⼯作只需要满⾜临床需要即可。

●临床疗效评价的结论性研究不能依赖⽇常临床⼯作采集的数据,应该按照正
规的研究设计统⼀采集,⽽且数据的统计分析⽅法,也要事先在研究设计计
划中明确。

●纳⼊

准:
研究
者确定实验单位的范围。

应注意选择对处理因素反映灵敏的个体作
为研究对象。

●排除标准:规定不能作为实验单位的范围。

应避免对⼀些特殊的⼈
群造成伤害、排除那些容易导致依从性偏倚与失访偏倚的研究对象。

◆处理因素:即实验中⼈为施加于受试对象、理论上能使研究对象产⽣效应(作⽤)
的因素(如药物、实验条件、⼿术⽅式等)。

◆⾮处理因素:在实验中可能对实验结果产⽣作⽤的其它因素,为⾮处理因素,如实
验对象的基本情况(年龄、病情轻重等)、实验的条件、测定仪器等。

有利的条件是指在科学的实验设计指导下,在排除其他⾮⼲预措施因素的影响后,推论⼲预措施的因果效应。

重复原则:实验组与对照组要有⼀定数量的重复观察(测量)结果,即试验单位要达到⼀定的数量。

重复的意义:
◆在同样条件下能重现的试验,处理因素的结果才可靠。

◆有⾜够例数才能根据重复观察的结果,估计观察单位的个体差异,描述观察
结果的统计分布规律。

◆只有样本量⾜够多时才能获得误差⽐较⼩的估计值。

对照:指没有“暴露”因素存在时提供的基线数据,⽤于评价“暴露”因素的效应⼤⼩。

对照的意义:
◆均衡掉实验中⾮处理因素的影响。

如疾病的⾃⾏缓解、安慰剂效应。

◆处理组通过与对照组⽐较,得到效应差别⼤⼩的程度。

作为对照的基线数据
是否准确,决定了对“暴露”因素评价的科学性。

要求:对照组除“暴露”因素有⽆外,其他对试验结果可能有影响的因素都应基本相同、可⽐。

◆⽆对照研究:常见于评价药物代谢和安全性的Ⅰ、Ⅱ期临床试验、探索试验效果和
试验⽅法的预试验、以及有可能的潜在对照(某⽅法⽆成功先例)的单样本研究。

◆历史对照:⽤历史⽂献报道的治疗结果,或常规治疗结果作为基线的单样本研究。

历史对照要选⽤公认的标准值,并且诊断标准、疗效评价、指标的检测⽅法等均⽆变化。

◆⾃⾝前后对照:⽤实验前的数据作为对照。

多⽤于易控制实验条件的急性动物试验。

◆⾮随机化同期对照:指在同⼀时间段内,将观察对象分为试验组和对照组,避免了
历史对照和⾃⾝前后对照诊断标准不同、试验条件不⼀致的缺点,常见于“暴露”因素不能⼈为分组的情况,如将⾮⼿术患者、正常出⽣婴⼉作为对照组。

◆随机化同期对照:指在同⼀时间段内,将观察对象随机的分为试验组和对照组,既
避免了历史对照和⾃⾝前后对照诊断标准不同、试验条件不⼀致的缺点,⼜保证了试验组和对照组观察对象的可⽐性。

◆空⽩对照:不给任何⼲预的对照。

通常⽤于⽆损伤、⽆刺激的实验性研究、动物实
验和临床试验。

◆实验对照:⼜称假⼲预对照,是指与试验组操作相同,但与处理效应⽆关的对照,
通常⽤于有损伤、有刺激的动物实验。

⽬的是保证试验组和对照组接受损伤和刺激相同。

◆慰剂对照:主要⽤于临床试验。

⽬的是保持对照组和试验组患者⼼理作⽤对疗效评
价影响的⼀致。

使⽤安慰剂要以不损害病⼈健康为前提,在没有可靠对照药物时才允许使⽤。

在临床试验中,安慰剂对照属于盲法试验。

◆标准对照:对照组的⼲预采⽤公认的“标准”⽅式,主要⽤于临床试验。

如伦理上不
允许在患者⾝上采⽤空⽩对照、安慰剂或假⼲预。

试验新的药物或治疗⽅法,对照组患者应采⽤⽬前疗效确定的药物或治疗⽅法。

特别是新药研究,应采⽤⽬前疗效最好的药物作为对照药。

随机化原则:即每个试验对象以均等的概率分到实验组和对照组中。

意义:
◆通过随机化分组使⾮处理因素(包括已知和未知因素)在组间达到均衡,保
证组间的可⽐性。

◆避免研究者主观愿望破坏试验组和对照组的均衡性
◆随机化分组是所有统计假设检验推论因果关系的基础
◆⾮盲(开放性)临床试验:即病⼈、医⽣都知道病⼈接受治疗的内容。

◆缺点:易产⽣观察结果的偏倚,对照组病⼈依从性不好。

◆ 2.单盲临床试验(single blindess):研究的医⽣知道分组情况。

◆ 3.双盲临床试验(double blindess):考核疗效的医⽣、病⼈均不知分组情况。

◆ 4.三盲临床试验(triple blindess):医⽣、病⼈、资料分析⼈员都不知道分组情况
随机对照试验(randomized control trial, RCT)是指采⽤同期对照且随机分组的试验。

平⾏设计:将符合研究设计要求的观察对象随机分为两组或多组,每个观察对象的试验起始时间与终⽌时间相同。

随机对照的配对设计:将符合设计要求的观察对象,在随机分组前,先按其⽣物学属性(体重、年龄、性别、病情等)配对。

⼆、⾮随机对照试验
1.历史对照:⽤历史⽂献或潜在对照作为基线。

潜在对照是以公认事实作为对照。

2.前后对照:
3.准试验设计:在前瞻性研究中,试验组和对照组不能随机分配,在较⾃然的情况下进⾏的称为准试验设计。

历史对照偏倚:偏倚的主要来源是不同历史时期,疾病的诊断标准、收治标准、医院的诊断⼿段、治疗设备,甚⾄疗效评价指标都有较⼤的差异。

历史资料提供的基线往往不全⾯、不完整、缺乏可⽐性。

历史对照偏倚:偏倚的主要来源是不同历史时期,疾病的诊断标准、收治标准、医院的诊断⼿段、治疗设备,甚⾄疗效评价指标都有较⼤的差异。

历史资料提供的基线往往不全⾯、不完整、缺乏可⽐性。

⾮随机同期对照和准试验偏倚:来⾃两个⽅⾯,⼀是主观偏倚,研究者和受试者都知道分组结果,在病情诉说和疗效评价上难免有主观性;⼆是试验组和对照组的可⽐性差。

依从性偏倚与失访偏倚:主要出现在前瞻性临床实验中,⽆论随机对照试验还是⾮随机对照试验,都可能发⽣。

依从性:受试者对⼲预措施的执⾏程度,包括服药、接受检查、回答问题等。

失访:⼜称脱落,指在临床试验中,受试者由于种种原因退出试验。

临床试验中失访偏倚⽆从避免,当失访率⼤于20%时,统计结果与真实结果的差距就难以说清楚了。

意向性分析:上表中1103名患者,是根据研究设计随机分配到安妥明组的,是研究者期望的治疗⼈数,根据1103名患者计算病死率,称为意向性分析。

其中包含有患者依从性和失访带来的偏倚
处理效果分析:真正的疗效统计,应该依据服药量超过80%的708名患者计算病死率
处理效果分析虽然说明“纯”的处理效应,但在临床上患者不能作到百分百依从,所以可能夸⼤试验效果。

因此,尽管意向性分析结论倾向保守,仍然在临床试验中⼴泛使⽤,但必须清楚意向性分析“暗藏”着依从性和失访偏倚。

计量资料:指⽤仪器、⼯具或其他定量⽅法准确获得的定量结果,研究对象的指标(变量值)表现为有数字⼤⼩和单位的数据。

计数资料:变量值表现为按某属性划分的定性类别,清点各类别个数后得到的资料。

等级资料:半定量或半定性。

先按某种属性分类,清点各分类的个数后得到的资料,但属性之间有⼤⼩、程度上的差别。

硬”指标:可以精确测量的指标,如长度、重量、时间等。

采⽤“硬”⼯具测量,如体重计、⾎压计等。

“软”指标:不能精确测量的指标,如患者的疼痛程度、⽣活能⼒改善情况等。

采⽤“软”⼯具测量,如调查表、调查问卷等。

调查问卷:就是在调查中⽤于收集资料的⼀种测量⼯具,它是由⼀组问题和相应答案所构成的表格,⽤以记录调查对象的基本情况和各种测量结果,故国内也称为调查表。

问卷设计的好坏将影响所收集到的资料的有效性及可信度,从⽽影响调查的结果。

根据问题是否预设答案,可将问题分为开放式、封闭式、可视性量化记分三种。

(1)开放式问题:对答案不予提⽰和限制,主要适⽤于探索性调查、不熟知的事物、敏感问题。

如:对⾃⼰⽬前的治疗结果有什么感受?
优点:可⽤于不知道问题答案有⼏种的情况,可让回答者⾃由发挥,回答者之间的⼀些细微差别也可反映出来。

缺点:要求回答者有较⾼的知识⽔平和语⾔表达能⼒;需花费较长的时间和精⼒,回答者不易接受,回答率低;统计处理⽐较困难。

(2)封闭式问题:
如:你⼼情有觉得郁闷的时候吗?
答案:1.经常 2.有时 3.偶尔 4.没有
优点:回答容易节省时间,⽂化程度较低的调查对象也能完成,回答者乐于接受,问卷的回答率较⾼;在测量级别、频率等⼀些等级问题⽅⾯有优势;便于统计分析。

缺点:某些问题的答案不易列全;回答者没有表明⾃⼰意见的可能;给回答者提供了猜测答案的机会,资料有时不能反映真实情况。

3)可视性量化记分:也称线性模糊评分,是让被试者在⼀个有刻度的线段上,标出⾃⼰的
主观感受或对某⼀个问题的认同感。

第三章:观察与抽样
观察:是⼈们对周围事物或现象直接接触与认识的过程,也是思维和创造的源泉之⼀科学的观察:是研究者在⾃然条件下积极主动的、有⽬的的在综合运⽤观察者感官能⼒的基础上,借助科学仪器和⽅法,逐渐认识事物内在规律的过程
观察对象:有时是总体⼈群,但绝⼤多数医学研究的观察对象是样本⼈群
观察性研究:在⾃然状态下通过调查与研究分析去认识疾病或健康问题的现象、规律与病因
普查:在特定时间内对特定⼈群所作的全⾯调查。

抽样调查:从总体中⽤⼀定的⽅法抽取⼀个样本作为调查对象,再把结果推及总体。

是⾮全⾯调查
总体:根据研究⽬的确定的、同质的研究对象的某指标值的全体。

有限总体:总体中的研究对象为N个,是可以全部获得的(可⼀⼀编号)
⽆限总体:总体中研究对象是不可能全部获得、为⼀假设的总体(例:某药治疗⾼⾎压病的疗效)
样本:从总体中随机抽取有代表性的部分研究对象的观察值所组成,称为样本。

观察对象的个数称为样本量(n)。

抽样框架:就是⼀份完整的可以⽤来抽样的名单,可以对有限总体的每个观察对象编号(1-N),可在总体内实现随机抽样。

参数:总体的统计指标叫做参数,它是固定的常数。

统计量:样本的统计指标叫做统计量,它在参数附近波动的随机变量
抽样误差:样本统计量与总体参数的差异
概率抽样:每个对象都可能被抽中,且被抽中的概率是已知的或可以计算的。

由随机样本计算的统计量可以作为参数的估计值,并可计算抽样误差的⼤⼩
⾮概率抽样:不是完全按随机原则选取样本,每个研究对象被抽中的概率是未知的或⽆法计算的。

不容易计算抽样误差和推断总体,有局限性,但在特定条件下,还是有应⽤价值的。

“滚雪球”样本:缺少⽬标总体中全部个体的名单,⽆法构成抽样框架时使⽤。

单纯随机抽样:完全随机地抽取⼀部分个体组成样本。

系统抽样:⼜称等距抽样或机械抽样,指完全随机地在抽样的名单中每隔⼀定距离抽选⼀个个体。

. 整群抽样:将总体按照某种与研究⽬的⽆关的分布特征(如地区范围、不同的团体等)划分为若⼲个群组,每个群包含若⼲个观察单位;然后根据需要随机抽取其中部分群,并调查被抽中的各群中的全部观察单位。

分层抽样:按照与研究⽬的明显有关的因素(或特征)将总体分成不同的“层”,然后在每⼀层内按⽐例抽取⼀定数量的观察单位,将各层的观察单位合起来组成样本。

横断⾯研究:按事先设计的要求,在某⼀⼈群中以⼈为基本研究单位,采⽤普查或抽样调查的⽅法收集特定时间内有关疾病及其影响因素的描述性资料,⽤以描述所研究疾病的分布及影响因素与疾病之间的关联
第四章:数据特征与统计描述
频数:在⼀批样本中,相同情形出现的次数称为该情形的频数
频数表:将所有“互相排斥的情形”的频数毫⽆遗漏地列在⼀起,构成频数分布表。

频数表由“组段”和“频数”组成平均数(average ):描述⼀组同质计量资料的集中趋势。

(1)说明⼀组资料的平均⽔平或集中趋势,具有典型性;(2)⽤来进⾏组间⽐较,以判断⼀组资料与另⼀组资料的差别。

中位数:是将⼀批数据从⼩⾄⼤排列后位次居中的数据值,符号为M d ,反映⼀批观察值在位次上的平均⽔平。

极差:也称全距,反映个体变异的范围。

即最⼤值减最⼩值。

⽅差(variance )也称均⽅差(mean square deviation ),样本观察值的离均差平⽅和的均值。

表⽰⼀组数据的平均离散情况
标准差(standard deviation )即⽅差的正平⽅根;其单位与原变量X 的单位相同
变异系数(coefficient of variation ,CV): ⽐(ratio ):是任意两数A 、B 之⽐。

说明A 是B 的若⼲倍或百分之⼏,通常⽤倍数或分数表⽰。

计算公式为: ⽐=A/B
强度相对数:⼜称率(rate ),说明某现象或某事物发⽣的频率或强度。

率=(实际发⽣数/可能发⽣总数)×⽐例基数⽐例基数:100%、1000‰、10000/万、1/10万等
结构相对数:⼜称构成⽐(proportion ),说明某⼀事物内部各组成部分所占的⽐重。

也叫百分⽐。

构成⽐=(某部分观察单位数/各组成部分观察单位总数)×100%
速率(rate):与⽐率的最⼤区别在于分母中含有时间量纲, 反映单位时间内某事件出现的可能性⼤⼩,多⽤于⾯向⼈群的出⽣、死亡和发病资料的统计。

统计图(statistical chart 或statistical graph)是⽤点、线、⾯等⼏何图形,直观形象地表达、描述数据或结果
条图(bar chart) 是⽤等宽的直条长度表⽰事物的数量,常⽤来⽐较各个相互独⽴的统计指标。

(1)单式条图具有⼀个统计指标,⼀个分组因素。

(2)复式条图⼀个统计指标,但有两个分组因素。

圆图:⽤于表达事物内部的百分构成⽐⼤⼩。

各个扇形⾯积或圆⼼⾓的度数(3.6°)的⼤⼩反映了各组成部分百分⽐(1%)的⼤⼩
从9点或12点钟处开始绘制,顺时针⽅向排列各扇形内要注明简要的⽂字和百分⽐
普通线图(line chart):⽤线段的升降表⽰某事物动态变化,或某现象随另⼀现象变迁的
%100?=X
S
CV N
X X l SS X xx ∑


2
22)-()-()square of sum (0)-(µσµµ====总体⽅差离均差平⽅和离均差和()
1
1)(222
2

----=∑
∑n n X X n X X S =样本⽅差()
11)(222

----=∑
∑n n X X n X X S =
样本标准差
情况。

适⽤于连续性资料
半对数线图(semilogarithmic line chart):
表⽰事物之间变化的相对速度纵轴:对数尺度;横轴:连续性变量(时间、年龄等)直⽅图(histogram ):⽤矩形⾯积表⽰连续变量的频数(频率)分布。

1. 横轴:连续变量的组段,可以不从“0”点开始。

纵轴:频数或频率,尺度从0开始。

2. 各矩形条之间不留空隙,可划直线隔开,也可以不划。

3. 矩形的⾼度为频数或频率,宽度为组距。

当各组的组距不等时,不能直接⽤各组频数绘图,⽽应将频数除以组距作⾼度再作图,否则会给⼈以错误的印象。

散点图(scatter diagram):⽤点的密集程度和趋势表⽰两种现象间的相关关系。

第六章
如果随机变量 X 的分布服从概率密度函数 f (X ),则称正态分布,记作)
,(~2σµN X
医学参考值是指包括绝⼤多数正常⼈的⼈体形态、机能和代谢产物等各种⽣理及⽣化指标常数,也称正常值。

单侧1α-参考值范围: X u S X u S αα>-<+或
第七章
2
2
()2()X f X e µσ
--=X -∞<<+∞式中X 为均数,S 为标准差,u 值可由表6-3查出。

偏态分布资料医学参考值范围的制定通常采⽤百分位数法,所要求的样本含量⽐正态分布法要多(不低于100),其计算公式为
双侧1α-参考值范围:2/1001002/100~αα-P P 单侧1α-参考值范围:100P α>或100100P
α-<
双侧1α-参考值范围:/2X u S α±
参数估计
第⼀节样本均数的标准误
n
/S S ,n X X ==σ
σ样本均数的均数:样本均数的标准差:µ→X 标准误(standard error )
统计量()的标准差
p X ,
⼆、样本均数的分布
1. 来⾃同⼀正态总体的样本均数的分布
2. 从同⼀个⾮正态总体中抽取样本,⽆论X 服从何种分布,只要存在总体均数和总体⽅差,
当n ⾜够⼤时(≥60),样本均数
4. 样本均数的标准误,是反映样本均数抽样误差⼤⼩的指标
5. 总体标准误的⼤⼩与总体标准差成正⽐,与样本含量的平⽅根成反⽐
6. 从正态总体X ~N (µ,σ2)中随机抽取样本,获得样本均数的分布亦呈正态分布
~N (µ, σ2 /n ) 。

当n ⾜够⼤时,从⾮正态总体中获得的随机样本均数亦近似服从正态分布。

三、总体均数的估计
1. 总体均数的点估计(point estimation )⽤样本均数来直接地估计总体均数
2. 总体均数的可信区间 confidence interval ,CI
利⽤样本信息给出⼀个区间,并同时给出重复试验时该区间包含总体均数的概率。

22~(,),~(,/)µσµσX N X N n 2
~(,/)µσX N n
(2)如果未知,且样本量较⼩时
S ?<σ
/2,/2,1v v X
X P t t ααµα
--<=-
/2,/2,v v X X
X t S X t S ααµ-<<+
3.可信区间的涵义
95%的可信区间,意味着在同⼀总体中作100次重复抽样,可得100个可信区间,平均有95个可信区间包含总体均数(估计正确),只有5个可信区间不包含总体均数(估计不正确,⼩概率事件)。

但在实际⼯作中,只能根据⼀次试验结果估计可信区间。

根据⼩概率事件不太可能在⼀次试验中发⽣的原理,有理由认为⽤样本信息估计的总体参数的可信区间包含了总体参数,该结论错误的概率不超过0.05。

可信区间的两个要素:准确度(accuracy ):可信区间包含总体均数的概率⼤⼩。

概率越⼤越好。

精密度(precision ):反映区间的长度,区间越窄,估计的精
密度越好,反之越差。

在样本含量⼀定的情况下,⼆者是相互⽭盾的,在实际中需要兼顾⼆个要素。

⼀般以95%的可信区间较为常⽤。

在可信度固定的前提下,要提⾼精密度的唯⼀⽅法是扩⼤样本含量。

第⼆节率的标准误
⼀、率的抽样误差与标准误
在同⼀个总体中随机抽取含量相同的若⼲个样本,各样本率往往不同,与总体率也有⼀定误差。

这种由于抽样所造成的样本率之间及样本率与总体率之间的差别称为率的抽样误差。

率的抽样误差⼤⼩可由率的标准误来衡量
⼆、样本率的分布
从总体中抽样所得的样本含量为n的样本,虽然其样本率p的⼤⼩不等,但各样本率p的抽样分布随着n的增⼤⽽趋近正态分布。

三、总体率的估计
点估计:直接⽤样本p去估计相应的总体率,

区间估计:当n⾜够⼤,且与均⼤于5时p的抽样分布近似正态
分布。

第⼋章
假设检验的基本概念
检验⽔准:接受域和拒绝域的划分界线(决策界限),常以曲线下两侧尾部⾯积(概率)来表⽰,⼜称显著性⽔平。

检验⽔准是预先⼈为确定的,表⽰拒绝了实际上成⽴的H0的概率⼤⼩,也可表⽰为在拒绝H0做出“有差别”结论时可能犯错误的最⼤概率。

检验⽔准实际上确定了⼩概率事件的判断标准。

⼤⼩可根据研究⽬的确定,⼀般取0.05或0.01
P值:
指在H0规定的总体中进⾏随机抽样,得到等于及⼤于(或等于及⼩于)现有样本统计量(如本例|u|=2.27)的概率,或者是⽐现有试验结果更“极端”的样本统计量出现的概率。

假设检验的基本思想
◆“反证法”的思想
◆先根据研究⽬的建⽴假设,从H0假设出发,先假设它是正确的,再分析样本提供
的信息是否与H0有较⼤⽭盾,即是否⽀持H0,若样本信息不⽀持H0,便拒绝之并接受H1,否则不拒绝H0
第三节⼤样本均数的假设检验
均数⽐较u检验的主要适⽤条件:
1. 单样本数据,每组例数等于或⼤于60例;两样本数据,两组例数的合计等于或⼤于60例,⽽且基本均等。

2. 样本数据不要求⼀定服从正态分布总体。

3. 两总体⽅差已知(不⼀定相等)。

4. 理论上要求:单样本是从总体中随机抽取,两样本为随机分组资料;观察性资料要求组
间具有可⽐性,保证因果推论的合理性。

⼀、单样本均数的u 检验
样本均数与总体均数⽐较,总体均数指已知的理论值、标准值或经过⼤量观察所得到的稳定值,记作
;样本
所代表的未知总体均数记作µ;检验的⽬的是推断µ与
µ0是否有差别
0µn
S X u /0µ-=
⼆、两均数⽐较的u 检验
第四节⼤样本率的假设检验
两个⼤样本率的⽐较可采⽤u 检验,主要适⽤条件: 1.n 较⼤,如每组例数⼤于60 例;
2.样本p 或1-p 均不接近于100%和0%; 3.np 和n (1-p )均⼤于5。

第五节检验⽔准与两类错误
假设检验是针对H 0,利⽤⼩概率事件的原理对总体参数做出统计推论。

⽆论拒绝H 0还是不拒绝H 0,都可能犯错误。

◆Ⅰ型错误(type Ⅰ error ):亦称假阳性错误,其概率最⼤值为检验⽔准(即当H 0
为真时,假设检验结论拒绝H 0的概率最⼤值),⽤α表⽰。

◆Ⅱ型错误(type Ⅱ error ),亦称假阴性错误。

其概率⼤⼩⽤β表⽰,其值的⼤⼩
⼀般未知,须在知道两总体差值d (如µ1-µ2)、和n 时,才能算出。

第六节单侧检验与双侧检验
⼀般采⽤双侧检验,除⾮专业上有⾮常充分的理由。

第七节假设检验的统计意义与实际意义 1,P 值的含义
当P 值在检验⽔准α附近时,下结论要谨慎,并同时报告使⽤的假设检验⽅法,如是否是单侧检验,检验是否采⽤校正公式等,⽽且要列出P 值的确切值。

2.假设检验与可信区间的区别与联系
◆可信区间⽤于推断总体均数的范围,⽽假设检验⽤于推断总体均数间是否有差别;◆可信区间可部分回答假设检验的问题,但并不能完全代替假设检验。

有些复杂的假
设检验⽅法⽆对应的可信区间估计⽅法可⽤。

◆可信区间只能在预先规定的检验⽔准下进⾏计算,⽽假设检验能够获得⼀个确切的
概率值(P 值)
3、假设检验的实际意义
P 值⼤⼩只能说明统计学意义的“显著”,不⼀定有实际意义。

当样本量⾜够⼤时,
标准误趋于0,⽆论两样本均数或两样本率相差多少,都能获得⾜以拒绝H0的u 值和P 值。

对假设检验结果的实际意义或临床意义的判定,⼀定要结合专业知识。

当专业上和
统计学上都具有“显著性”时,试验结果才有实⽤价值。

第九章:卡⽅检验
医学统计⼯作的基本步骤
◆统计设计◆收集资料◆整理资料◆分析资料
第⼀节 2×2表资料的检验⼀、两独⽴样本率检验
A :实际频数(Actual frequency )
T : 理论频数(Theoretical frequency
1)分布是⼀种连续型分布,只有⼀个参数,即⾃由度。

2) 分布可加性 3)分布分位数
四格表资料的连续性校正
实际频数为分类资料,是不连续的,因此计算所得的统计量值是不连续的,离散型分布。

⽽界值表的依据是分布,分布是连续型分布。

校正公式(Yates 校正)
22
()A T T
χ-=∑
2χ检验统计量2
χ分布2
χ检验的基本思想
2
χ四格表资料检验的专⽤公式22
()()()()()ad bc n a b c d a c b d χ-=++++22
(0.5)c A T T
χ--=∑
2
2(||)2
()()()()
c n a
d bc n
a b c d a c b d χ--=
++++
四格表资料检验公式选择
⼆、两相关样本率检验
(McNemar 检验
配对设计是指将实验单位按⼀
定条件配成对⼦,再将每对中的两个实验单位随机分配到两个处理组。

①配成对⼦的两个个体分别给予两种不同的处理(异源配对) ②同⼀个体同时分别接受两种不同处理(同源配对)。

相关文档
最新文档