定性资料的统计分析共60页

合集下载

第五讲 定性资料的统计分析

第五讲  定性资料的统计分析
表1 两种检验方法结果比较
常规培养法 荧光抗体法
+ 160 5 165
26 48 74
合计 186 53 239
+ 合计
2. 某地调查了1995-1998四个年度中小学女生的贫血状 某地调查了 四个年度中小学女生的贫血状 见下表,问各年度间学生贫血率有无差别 况,见下表 问各年度间学生贫血率有无差别 见下表 问各年度间学生贫血率有无差别?
连续性校正公式: 连续性校正公式:
χ =∑
2 c
2
( A−T − 0.5) T
n 2 2
2
(| ad - bc | - ) n χc = (a +b)(c+ d )(a + c)(b+ d )
行×列表资料卡方检验
可用于检验多个样本率或构成比以推断多个总 可用于检验多个样本率或构成比以推断多个总 多个样本率 体率或构成比是否相等。 体率或构成比是否相等。
2
行×列表资料的 χ 检验
2
四格表资料卡方检验
进行比较, 一定是两组进行比较,实验结果是两个对 立的结果。 四格表资料表格
_____________________________________ + 合计 _____________________________________ a b a+b 第一组 c d c+d _____________________________ a+b b+d a+b+c+d 合计 ______________________________________ 第二组
表2 某地各年度学生贫血检出率的比较(%) 某地各年度学生贫血检出率的比较 贫血人数 279 271 367 784 1701 正常人数 4702 2089 2161 4199 13151

定性资料常用的统计学方法

定性资料常用的统计学方法

定性资料常用的统计学方法一、χ2检验χ2检验(chi-square test)是一种主要用于分析分类变量数据的假设检验方法,该方法主要目的是推断两个或多个总体率或构成比之间有无差别。

(一)四格表资料的χ2检验例17:为了解吲达帕胺片治疗原发性高血压的疗效,将70名高血压患者随机分为两组,试验组用吲达帕胺片加辅助治疗,对照组用安慰剂加辅助治疗,观察结果见表4 -5-1,试分析吲达帕胺片治疗原发性高血压的有效性。

表4 -5-1 两种疗法治疗原发性高血压的疗效1.四格表χ2检验的原理:对于四格表资料,χ2检验的基本公式为:式中,A为实际频数(actual frequency),T为理论频数(theoreticalfrequency)。

理论频数T根据检验假设H0:π1=π2确定,其中π1和π2分别为两组的总体率。

计算理论频数T的公式为:式中Tij 为第i行第j列的理论频数,ni+和n+j分别为相应行与列的周边合计数,n为总例数。

现以例17为例说明χ2检验的步骤:(1)建立检验假设并确定检验水准。

H0:π1=π2,即试验组与对照组的总体有效率相等H1:π1≠π2,即试验组与对照组的总体有效率不等α=0.05(2)计算检验统计量。

按式(4 -5-2)计算T11,然后利用四格表的各行列的合计数计算T12、T21和T22,即T11=(44×41)/70=25.77,T12=44-25.77=18.23T21=41-25.77=15.23,T22=26-15.23=10.77按式(4 -5-3)计算χ2值(3)确定P值,作出推断结论。

以ν=1查χ2分布界值表,得P<0.005。

按α=0.05水准,拒绝H,接受H1,可以认为两组治疗原发性高血压的总体有效率不等,即可以认为吲达帕胺片治疗原发性高血压优于对照组。

2.四格表资料χ2检验的专用公式:在对两样本率比较时,当总例数n≥40且所有格子的T≥5时,可用χ2检验的通用公式(4 -5-1)。

9-定性资料的统计分析(1)

9-定性资料的统计分析(1)

二、配对四格表的确切概率法


在配对四格表资料中,当b+c≤20时,因配 对四格表2检验近似程度较差,易导致分析 的偏性。此时,同样需要用确切概率法来 计算。 方法与四格表确切概率法有区别,利用二 项分布原理。
例、用两种检验方法对某食品作沙门氏菌 检验,结果如下表,试用配对四格表的确 切概率法比较两种方法的阳性结果是否有 差别。
0 .0 0 2 0 5 6
0 .0 0 0 0 7 1
本例|A-T|等于1.9655。
H 0: 大 脑 两 半 球 恶 性 肿 瘤 所 占 比 例 相 等 ; H 1: 大 脑 两 半 球 恶 性 肿 瘤 所 占 比 例 不 等 。 = 0 .0 5
计 算 大 于 等 于 现 有 差 别 的 所 有 组 合 的 概 率 P:

长期来,对理论频数太小有三种处理办法:

1、最好增加样本例数以增大理论频数; 2、删去上述理论频数太小的行或列; 3、将太小理论频数所在行或列的实际频数与性 质相近的邻行或邻列的频数合并,使重新计算 的理论频数增大。

一般认为,后两种方法可能会损失信息, 也会损害样本的随机性,故不作为常规方 法。
部位 左半球 右半球 合计 良性 1 3 ( 1 1 .0 3 4 5 ) 7 ( 8 .9 6 5 5 ) 20 恶性 3 ( 4 .9 6 5 5 ) 6 ( 4 .0 3 4 5 ) 9 合计 16 13 29 恶 性 肿 瘤 占 百 分 比 (% ) 1 8 .7 5 4 6 .1 5
每个格子的|A-T|均等于1.9655
X
n1
n2
双 侧 u 0 .0 1 = 2 .5 8 , u > u 0 .0 1 , P < 0 .0 1 , 故 按 = 0 .0 5 水 准 拒 绝 H 0 , 接 受 H 1, 差 异 有 统 计 学 意 义 , 可 认 为 工 艺 改 革前后车间空气中粉尘浓度有差别,改革后粉尘浓度降低。

第五讲 定性资料的统计分析

第五讲  定性资料的统计分析
2
行×列ቤተ መጻሕፍቲ ባይዱ资料的 χ 检验
2
四格表资料卡方检验
进行比较, 一定是两组进行比较,实验结果是两个对 立的结果。 四格表资料表格
_____________________________________ + 合计 _____________________________________ a b a+b 第一组 c d c+d _____________________________ a+b b+d a+b+c+d 合计 ______________________________________ 第二组
A χ = n(Σ −1) nRnC
2
2
ν = (行数−1)(列数−1)
配对设计资料的两样本检验
配对设计是医学研究中常用的设计方法之一, 配对设计是医学研究中常用的设计方法之一, 配对研究常用于比较两种检验方法 二分类结果资料的配对研究常用于比较两种检验方法、 二分类结果资料的配对研究常用于比较两种检验方法、 两种培养方法、两种提取方法等的差别。 两种培养方法、两种提取方法等的差别。 配对四格表资料表格 甲种属性
用药史 曾服该药 未服该药 合计 不敏感 180 73 253 敏感 215 106 321 合计 395 179 574 耐药率( ) 耐药率(%) 45.57 40.78 44.08
Public health school, Xuzhou medical college
建立数据文件
Dose 表示服该药情况 1 2 Sensi 表示敏感情况 1 2 Weight 表示相应的频数 表示不敏感 表示敏感 表示曾服该药 表示未曾服该药

医学统计学定性资料的统计分析-χ2检验

医学统计学定性资料的统计分析-χ2检验

29 41
48.28 39.02

H0:1=2; H1:12; =0.05。 本例a格的理论频数最小,T11=1216/41=4.68<5, n>40,故考虑用校正公式计算2 值。
2 C
( 2 15 1014 41/ 2) 12 2916 25
2
41
2 2.36 0.05,1 3.84
(二)2检验的基本思想
例4-6-1 据临床研究,一般的胃溃疡病患者有25%会出现胃出 血症状。某医院观察了300例65岁的胃溃疡病患者,其中有99例 发生胃出血,占33.0%,问老年患者是否较一般患者易出血? 表中基本数据是a,b,c,d,其余数 据都是从这四个基本数据推算出 表4-6-1 131例胃癌患者治疗后5年存活率的比较 来的,这种资料称为四格表资料。 存活率(%) 存活数 死亡数 合计治疗数
(即多个率或构成比的比较)
上述两个样本率比较的资料,其基本数据只 有2行2列,称为2 ×2表或四格表资料。当基 本数据超过2行或2列的资料,就称为行×列 表或 R × C表资料。行×列表资料的2检验 主要用于多个样本率或多个构成比之间的比 较。
2 值的计算可按前述基本公式( 2 =∑(A-
2

计算统计量Z :
z
0.33 0.25
0.25 (1 0.25) / 300
3.20

. 确定P 值和判断结果:
Z0.01=2.326,得P<0.01,按=0.05水 准拒绝H0,接受H1。 认为老年胃溃疡病患者的胃出血率大于 20%,即老年患者较一般患者易出血.
(二)两样本率的比较
3.确定P 和判断结果:=(2-1)×(2-1)= 1;查2界 值表,20.05=3.84, 所以P>0.05,按=0.05水准不拒绝H0,差别无统计 学意义。故尚不能认为单纯手术疗法与联合疗法对胃 癌患者治疗效果有差别。

《医学统计学》第四章定性资料的统计描述

《医学统计学》第四章定性资料的统计描述

1、不要把构成比与率相混淆。即分析时不能以构成 比代率;这是常见的错误。
某文章作者根据上述资料认为,沙眼在20~组的患病率最高,以后随年 龄增大而减少。该作者把构成比当作率进行分析,犯了以比代率的错误。
2、使用相对数时分母不宜过小。分母过小时相对数 不稳定。
3、注意资料的可比性;
不同时期、不同地区、不同条件下的资料比较时应注意具有 可比性。
12965.2
46.3

265
660291.4
40.1
说明该地市区非吸烟女性饮酒者的肺癌发病率是
非吸烟女性不饮酒者的1.15倍。
3.比数比
比数比( Odds ratio ,OR) : 常用于流行病学
中病例-对照研究资料,表示病例组和对照组中的 暴露比例与非暴露比例的比值之比,是反映疾病 与暴露之间关联强度的指标。其计算公式为
一般的,两个地方的出生率、死亡率、发病率、不同级别 医院某病的治愈率等不能直接比较。
无可比性的实例:
由表2-7可见,无论有无腋下淋巴结转移,省医院的5年生存 率均高于市医院,但从总生存率看,省医院的5年生存率低于市 医院。这不符合常理。因此,省医院与市医院的总生存率就不能 直接比较(标准化后再比)。
感谢聆听

某事物或现象发生的实 际数 某事物或现象发生的所 有可能数
比例基数
公式中的“比例基数”通常依据习惯而定。
需要注意的是,率在更多情况下是一个具有时间 概念的指标,即用于说明在某一段时间内某现象 发生的强度或频率,如出生率、死亡率、发病率 、患病率等,这些指标通常是指在1年时间内发 生的频率。
例4-1 某单位在2009年有3128名职工,该单位 每年对职工进行体检,在这一年新发生高血压 病人12例,则

定性资料的统计分析最新课件

定性资料的统计分析最新课件

若均数与标准差不用绝对数X而用率p 表示时,即对以上两式分别除以n:
p
p
(1 )
n
sp
p(1 p) n
样本率的标准差 又称为率的标准误。
定性资料的统计分析最新课件
二项分布的累计概率
常用的有左侧累计和右侧累计两种方法。从
阳性率为 的总体中随机抽取n个个体,则:
1、最多有k例阳性的概率:
每种结果的概率
0.20.20.2=0.008 0.20.20.8=0.032 0.20.80.2=0.032 0.80.20.2=0.032 0.20.80.8=0.128 0.80.20.8=0.128 0.80.80.2=0.128 0.80.80.8=0.512
1.000
死亡数 生存数 不同死亡数的概率
可信度为95%时, u =1.96 可信度为99%时, u =2.58。
定性资料的统计分析最新课件
例1、从某地人群中随机抽取144人,检查乙型 肝炎表面抗原携带状况,阳性率为9.20%,求 该地人群的乙型肝炎表面抗原阳性率的95%可 信区间。
本例n =144,p=9.20%,可用近似正态法计算 可信区间。
0.4 P(X)
0.3
n =20 =0.5
n =5 =0.3
n =10 =0.3
n =30 =0.3
0.2
0.1
0.0 4
8 12 16 0 2 4
0246
X
定性资料的统计分析最新课件
4 8 12 16
在实际应用中,n足够大,且 不太大
也不太小,即既不接近于0也不接近于 1时,常可用正态近似原理处理二项分 布的问题。
因此,从阳性率为π的总体中随机抽取含量为 n的样本,恰有X例阳性的概率为:

医学统计学定性资料的统计描述

医学统计学定性资料的统计描述

卡方检验在医学领域应用
疾病与基因型关联分析
01
通过比较不同基因型在疾病组和对照组中的分布差异,判断基
因型与疾病是否有关联。
临床试验效果评价
02
比较不同治疗方法在患者中的疗效差异,如药物疗效、手术效
果等。
医学影像学诊断准确性评估
03
通过比较影像学诊断结果与金标准诊断结果的一致性,评估影
像学诊断方法的准确性。
非数值性
定性资料不以数值形式表示,而是用 文字、符号等描述。
类别性
定性资料通常按照不同的类别或属性 进行分类。
主观性
定性资料的收集和分析往往涉及主观 判断和解释。
常见定性资料类型
分类资料
按照某种特征或属性将数据分成不同的组别,如性别、 血型等。
顺序资料
除了分类外,还具有一定程度的顺序或等级关系,如 病情严重程度、治疗效果评价等。
数分布表。
图表展示技巧与规范
选择合适的图表类型
根据数据的性质和特点,选择合适的图表类 型,如直方图、条形图等。
数据点标识
在图表中标识出重要的数据点,如最大值、 最小值、平均值等。
图表标题和坐标轴标签
为图表添加标题和坐标轴标签,以便读者理 解图表内容。
图例和颜色使用
使用图例说明不同数据系列的含义,并合理 运用颜色以增强图表的可读性。
整性。
02
Fisher确切概率法计算
根据研究目的和假设,选择合适的统计软件或编程语言实现Fisher确切
概率法的计算过程。
03
结果解读与报告
对计算结果进行解读和分析,将结果以图表或文字形式呈现,并结合专
业知识对结果进行解释和讨论。同时,需要注意结果的可靠性和可重复

第8章定性资料整理与分析

第8章定性资料整理与分析
话语分析可以应用于大多数的定性资料如访谈资料、文件 与记录、报刊文章、漫画、小说、政治演讲和日常对话等。
第28页,共66页。
话语分析的内容包括 :
(1)话语策略及其社会效应分析 (2)话语系统及其话语规则和作用机制分析 (3)发掘和展示话语建构的多元性
第29页,共66页。
(四)编辑式分析方法
编辑式分析方法强调:主观——诠释的分 析,研究者可以如编辑者的角色一样,对文本 资料进行编辑、裁剪、再重组,直到找出类别 之间的关联和意义,并对资料加以诠释。
第5页,共66页。
形式 文本
影像 声音
表8-1 定性资料的类型
正式资料来源 访谈、报纸、广播节目、个案记 录
图片、相片、录像带 音乐、音乐带
非正式资料来源 聊天
儿童绘画 唱歌
知识链接
定量资料定义 定量资料是医学社会科学研究中最具有价值的资料之一,主要是指所收集到 的以数字形式表现出来的资料,如数字及其组成的图文、图标资料等。定量资料 有两个来源——实地源和文献源。定量资料的实地源包括封闭式问卷、结构性观察; 文献源包括年鉴、实验报告、调查报告等。
第6页,共66页。
定性资料整理是研究者根据研究的目的,应用 科学的方法对所收集定性资料的真实性、正确 性、准确性进行审核,对不同类型、不同内容 的资料进行分类,对数据及其他方面的信息进 行汇总统计和再加工,使之系统化和条理化, 并以集中、简明的方式反映研究对象总体情况 的过程。
第7页,共66页。
第30页,共66页。
第三节 计算机辅助定性资料分析
内容提纲:
一、计算机辅助定性分析概述 二、常用计算机辅助定性分析软件简介
三、NVivo软件使用说明
第31页,共66页。

[临床医学]3定性资料的统计描述_OK

[临床医学]3定性资料的统计描述_OK

表 某地1990~1998年床位发展动态
年份
1990 1991 1992 1993 1994 1995 1996 1997 1998
指标 符号
a0 a1 a2 a3 a4 a5 a6 a7 a8
年末床 位数
5420 5608 5766 5886 5991 6284 6609 6955 7352
绝对增长量
疾病种类
死亡人数
百分比(%)
恶性肿瘤
50
33.33
呼吸系统疾病
30
20.00
消化系统疾病
20
13.33
循环系统疾病
40
26.67
传染病
10
6.67
合计
150
100.00
5
第一节 定性变量的分布描述
二、描述定性资料的统计指标
除了用频数分布表、图全面反映定性资 料外,也可以用若干相对数指标从某个侧面 来描述定性变量。相对数指标大致有三种类 型:相对比型指标、频率型指标、强度型指 标。
两比较组的内部构成应相同或相近。
21
例 某病两种疗法的治愈率(%)比较的资料如表
表 某病两种疗法的治愈率(%)的比较
普通型
病例数 60
西医疗法组
中西医结合疗法组
治愈数 治愈率 病例数 治愈数 治愈率
(%)
(%)
36 60
20
13
65
重型
20
8 40
60
27
45
爆发型
20
4 20
20
5
25
合计
100
年龄 组
(1)
标准人 口构成 比
(2)
原死 亡率

定性资料的统计分析

定性资料的统计分析
2
A T 2
检验的自由度取决于可以自由取值的格子数目, 而不是样本含量n。四格表资料只有两行两列,ν =1, 即在周边合计数固定的情况下,4个基本数据当中只 有一个可以自由取值。
2 分布图形
0.5 0.4 0.3 0.2 0.1 0 0 2 4 6
1
f ( )
2
6
10
可通过 检验的基本公式来理解。
2
卡方分布: 若k个随机变量,z1,z2,…zk,相互独立且服从标
准正态分布,则随机变量x=z12+z22+…+zK2被称 为服从自由度为k的卡方分布,记作: x 2 (k )
2
( AT ) , (行数-1)(列数 1) T
2
H1:π1≠π2 即试验组与对照组降低颅内压的总体有效率不相等
α =0.05。
(2)求检验统计量值
T11 104 174/ 200 90.48 ,T12 104 90.48 13.52
T21 174 90.48 83.52 ,T22 26 13.52 12.48 。
表7-2 两组降低颅内压有效率的比较
组 别 试验组 对照组 合 计 有 效 99(90.48) a 75(83.52) c 174(a+c) 无 效 5(13.52) b 21(12.48) d 26(b+d) 合 计 104 (a+ b) 96 (c+d) 200 (n) 有效率(%) 95.20 78.13 87.00
( b c 1) 2 bc
, =1
本例检验步骤如下:
(1)建立检验假设
H0:总体B=C,即两种方法肝癌检出率相同

第5章定性资料的统计描述

第5章定性资料的统计描述

第五章定性资料的统计描述在医学研究与实践中,大量资料都是按照事物的特征或属性进行分类的,这类资料称为定性资料,也称分类资料或计数资料。

如性别、HIV感染情况、病情轻重等都属于分类资料。

分类资料按类别分类计数所得到的数叫绝对数,绝对数往往不便于进行相互比较。

例如甲医院某年因某病死亡105人,同年乙医院因该病死亡185人。

但不能据此认为乙医院该病的死亡情况比甲医院严重,因为两医院因该病住院的人数不一定相等,此时需要采用相对数指标进行统计描述。

第一节常用相对数及其应用一、定性资料的频数分布与定量资料一样,定性资料也可通过编制频数分布表描述其分布特征,并通过计算一些常用的相对数指标进行统计描述和统计推断。

定性资料频数分布表又称为列联表,是用两个分类变量对同一资料进行双向分类形成的表,可用于考察两种属性的关系。

表5.1为某中学不同性别青春期少年对自身体型感觉的构成情况的列联表。

表5.1 某中学不同性别青春期少年对自身体型感觉的构成情况性别自感偏瘦正常自感偏胖男39 186 20女25 130 54列联表的横标目一般为分组变量,纵标目为结局变量。

列联表的用途主要有:1. 列出每组中各种不同结局分类后的频数。

2. 描述频数分布的特征。

3. 便于进一步对分类资料的特征进行统计描述和统计推断。

二、常用相对数指标除了用频数分布表可以全面反映定性资料的特征外,也可计算相对数指标来描述定性资料的特征。

相对数是两个有关联的数值之比,常用的相对数指标有率、构成比和相对比三种。

(一)率率是指某现象实际发生数与某时间点或某时间段可能发生该现象的观察单位总数之比,用以说明该现象发生的频率或强度。

根据计算公式中分母的观察单位总数是否引入时间因素,率包括频率和速率两类指标。

频率(frequency)计算中,分母没有引入时间因素,无时间量纲,分子是分母的一部分,其取值在0~1之间,如常见的发病率、患病率、病死率、治愈率等指标,都属于频率型指标,其实质是比例,在流行病学中也常称为累积发生率。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
相关文档
最新文档