计数资料的统计分析
医学统计学计数资料的统计描述(一)
医学统计学计数资料的统计描述(一)医学统计学计数资料的统计描述计数资料是医学研究中常见的数据类型,例如统计某种疾病的患病人数、治愈人数等。
如何对这些数据进行科学统计描述,成为了医学研究不可避免的问题。
一、计数资料的基本概念计数资料是指由离散数据组成的一种数据类型,这些数据仅取有限个数值,如某类疾病的患病人数(自然数)或治愈人数(非负整数)。
计数资料是医学研究中常见的数据类型,对于这些数据的科学统计描述极为重要。
二、计数资料的统计描述1. 频数频数是指计数资料中各取值出现的次数,常以小写字母n表示。
例如患病人数为0的样本数为n0,患病人数为1的样本数为n1,以此类推。
2. 频率频率是指频数与总样本数的比值,常以小写字母f表示。
例如患病人数为0的频率为f0=n0/n,患病人数为1的频率为f1=n1/n,以此类推。
频率可以体现每个取值在样本中的分布情况,是比较常用的统计指标,其和为1。
3. 百分比百分比是指频数与总样本数的比值乘以100,常以百分号表示。
例如患病人数为0的百分比为f0×100%,患病人数为1的百分比为f1×100%,以此类推。
4. 累计频率累计频率是指某一取值及其以下所有取值的频率之和,常以小写字母F 表示。
例如患病人数小于等于3的累计频率为F3=f0+f1+f2+f3。
累计频率可以体现小于等于某个取值的样本在总样本中所占比例。
三、总结计数资料是医学研究中常见的数据类型,对于这些数据的科学统计描述有益于研究者更加深入地了解样本的分布情况,进而提出相应的研究假设。
频数、频率、百分比和累计频率是计数资料的常用统计指标,可分析每个取值在样本中的分布情况和各个取值间的差异。
在实际研究中,研究者应根据实际情况选择合适的统计方法进行分析,以期得到更为科学的结论。
计数资料的基本统计方法
0.6520 0.0909 0.0934 0.0768 0.0534 0.0335 1.0000
0
0 1725819 0.6580
12
4.9 289298 0.1103
91 36.2 250480 0.0955
307 148.3 191204 0.0729
460 319.7
114355 0.0436
292 323.5
51670 0.0197
1162 43.12 2622826 1.0000
0 25 125 344 371 170 1035
0 8.6 49.9 179.9 324.4 329.0 39.46
(1)直接法:
•选择标准组的方法 1)大范围内的人口资料 2)两组年龄段人口合并 3)以其中一组为标准组,对另一组作标准化
小鼠存亡的组合方式 死亡数(x) 生存数(n-x)
排列方式 甲乙丙
每种组合的概率
0
3
1
2
2
1
3
0
生
生
生 0.2× 0.2× 0.2 =0.008
死
生
生 0.8 × 0.2 × 0.2
生
死
生 0.2 × 0.8 × 0.2
生
生
死 0.2 × 0.2 × 0.8 } = 0.096
死
死
生 0.8 × 0.8 × 0.2
死
生
死 0.8 × 0.2 × 0.8
生
死
死 0.2 × 0.8 × 0.8 } = 0.384
死
死
死 0.8 × 0.8 × 0.8 = 0.512
P = 1.000
(0.2 +0.8)3=(0.2)3 + 3(0.8)(0.2)2 + 3(0.8)2(0.2) + (0.8)3 三生 二生一死 一生二死 三死
计数资料常用的统计学方法
计数资料常用的统计学方法
对计数资料常用的统计学方法
一、假设检验:
1. Z检验:通过比较一组计数资料与总体分布的拟合程度,来检验样本数据和全体总体数据之间是否存在显著差异。
2. t检验:通过比较两组独立计数资料之间的拟合程度,来检验样本数
据和全体总体数据之间是否存在显著差异。
3. F检验:通过比较多组相同样本的拟合程度,来确定至少有一个处于未知实际总体中的样本均值是和其它样本有显著差别的。
二、数据可视化:
1. 直方图:通过显示计数资料的直方图来表示资料的分位数、最小值、中位数、最大值,以及数据的分布形态。
2. 折线图:利用折线图表示计数资料在比较不同因素因素下的差异情况。
3. 饼图:可以通过饼图展示一组计数资料的比例或结构情况,可以从
整体上窥视计数资料分布情况。
三、贝叶斯统计:
1. 条件概率:又称为贝叶斯定理,通过根据计数资料计算概率,来确
定事件的可能性大小,进而推断概率的变化趋势,以帮助更好地决策。
2. 统计重要性:根据计数资料中的关联性,来发现事件和趋势之间的关系,从而实现计算特定变量的重要性。
3. 模型选择:根据计数资料中各变量的相关性,来判断模型的正确性和可行性,以便判断数据的有效性。
2.spss应用(计数资料分析、非参数检验、统计图绘制)
配伍组设计的秩和检验:例题8-9(P143) Analyze→nonparametric tests →k related samples
→test variables:变量1、变→ok
三、统计图的绘制
1.直条图、误差条图 2.圆图
3.线图、半对数线图
配对四格表资料的2检验:例题7-3(P114)
Data→weight cases → weight cases by: frequency variable:f →ok analyze→descriptive statistics →crosstabs … : row: 法一 column:法二 statistics →选择McNemar →continue →ok
实例分析
P112 P114 P114 P116 P117 P119 P119 P120 例7-1 例7-2 例7-3 例7-4 例7-5 例7-6 例7-7 例7-8
二、非参数检验
配对设计的符号秩检验:例题8-1(P132)
Analyze→nonparametric tests
→2 related samples
例题7-1(P112)数据输入的格式: 组别:分组变量 1-试验组 2-对照组 疗效: 1-有效 0-无效 f:表示频数 组别 1 1 2 2 疗效 1 0 1 0 f 99 5 75 21
1 2 3 4
四格表资料的2检验:例题7-1(P112)
Data→weight cases → weight cases by: frequency variable:f →ok analyze →descriptive statistics →crosstabs … : row: 组别 column:疗效 statistics →选择chi-square →continue → ok
计数资料 两组比较 统计学方法
计数资料两组比较统计学方法计数资料是指能够用数字进行计算和比较的数据,例如频数、比率、百分比等。
在统计学中,比较两组计数资料是非常常见的。
本文将探讨两组计数资料的比较和应用统计学方法进行分析的方法。
一、比较两组计数资料的方法1.绝对数比较法绝对数比较法是比较两组计数资料中,某一指标的绝对数的大小。
例如,两组人群中的患病人数的大小比较,通过比较得出哪一组人的患病率更高。
这种方法的优点在于简单易行,但无法对数据进行标准化,无法消除其他因素的影响。
2.比率比较法比率比较法是通过两组计数资料中某一指标的比率进行比较。
例如,两组人群中男女比例的大小比较,通过比较男女比例的大小得出哪一组男女比例更接近。
这种方法具有较高的精度和客观性,但是需要进行标准化才能比较数据。
3.标准化比较法标准化比较法是通过将两组计数资料进行标准化处理后进行比较。
例如,将两组人群的男女比例标准化,通过比较标准化后的数据得出哪一组男女比例更接近。
这种方法可以消除因素的影响,具有更高的精度和客观性。
二、应用统计学方法进行分析在比较两组计数资料时,还可以应用统计学方法进行进一步分析。
常用的统计学方法包括:1.卡方检验卡方检验是一种用于比较两个或多个分类变量的方法。
以两组人群为例,可以通过卡方检验来比较这两组人群中男女比例是否有显著差异。
如果差异是显著的,则说明这两组人群男女比例不一致。
2. t检验t检验是一种用于比较两组数值型变量的方法。
例如,可以通过t检验来比较两组人群的年龄分布是否有显著差异。
如果差异是显著的,则说明这两组人群年龄分布不一致。
3.方差分析方差分析是一种用于比较三个或更多组数值型变量的方法。
例如,可以通过方差分析来比较三个不同城市中的日均气温是否有显著差异。
如果差异是显著的,则说明这三个城市的气温日均值不同。
结论在比较两组计数资料时,需要根据不同情况选择不同的比较方法。
在进行分析时,可以应用统计学方法来分析数据,从而得出更准确的结论。
医学统计学-计数资料的统计描述
02
相对频数的计算公 式
相对频率 = (某组的频数 / 所有 观察值的总数) × 100%。
03
相对频数分布的应 用
用于比较不同组别之间的相对大 小关系,特别是在样本量差异较 大时。
集中趋势的描述:平均数、中位数、众数
平均数
所有观察值的总和除以观察值的数量,反映 数据的平均水平。
中位数
将数据从小到大排序后,位于中间位置的数 值,反映数据的中心位置。
总结词
Logistic回归分析是一种用于处理因变量 为分类变量(通常是二分类)的统计方 法。
VS
详细描述
Logistic回归分析通过建立数学模型,将 自变量与因变量的关系转化为概率形式, 从而预测因变量的发生概率。它广泛应用 于医学、经济学、社会学等领域,尤其在 医学研究中,常用于疾病发生风险的预测 和诊断模型的建立。
Spearman秩相关与Kendall秩相关
Spearman秩相关和Kendall秩相关是两种常用的非参数相关分析方法, 适用于处理等级数据。
Spearman秩相关是根据变量的秩次来计算相关系数,反映两个变量之间 的线性关系。
Kendall秩相关则是基于排序数据中相邻数据的变化情况来计算相关系数, 反映两个变量之间的单调关系。
1 2 3
早期发展
计数资料统计描述起源于早期的统计学研究,最 初主要用于人口普查和农业统计等领域。
近代发展
随着计算机技术的进步和统计学理论的不断完善, 计数资料统计描述的方法和手段得到了极大的丰 富和发展。
未来趋势
随着大数据时代的到来,计数资料统计描述将更 加注重自动化、智能化和可视化,以提高数据处 理和分析的效率和准确性。
计数资料统计描述的重要性
计数资料的数据分析
计数资料的数据分析1、四格表资料(1)简单四格表资料i.非配对的四格表资料例:比较A、B两种疗法治愈率,数据如下:分析目的:A、B疗法有效率是否有差异?数据如用通用符号表示:分析方法:Pearson 卡方检验其中,Oi 表示观察数,Ei表示理论期望数, n 格子数(这里等于4)Yates'连续性校正关联分析:计算A疗法有效率相对于B疗法的优势比Odds Ratio (比值比)= (a/b) / (b/d) = (ad)/(bc) = (20*14)/(16*10) = 1.75易侕统计软件输入界面:易侕统计软件输出结果:ii. 配对的四格表资料例:比较A、B两种疗法治愈率,配对设计,每个病人与另一个年龄、性别、病程等相同的病人配对,一个用 A疗法治疗,另一个病人用B疗法治疗,数据如下分析目的:A、B疗法有效率是否有差异?: H0:A、B疗法有效率相同,即p b=p c数据如用通用符号表示:McNemar 卡方检验Edwards 连续性校正:McNemar精确检验:总共有b+c (8+4=12)不一致的对子数,按H0,理论上b与c出现的概率相同,即b占(b+c)的比例为50%,相当于OR=b/c=1。
实际观察到的OR = b/c = 8/4 =2,计算出现8/4 或更极端的情况(9/3,10/2,11/1,12/0)的概率。
易侕统计软件输入界面:易侕统计软件输出结果:McNemar 配对四格表卡方检验(2)诊断试验四格表资料分析目的:分析试验结果与真实情况(金标准)的吻合程度。
金标准是指当前公认的诊断疾病最可靠的标准方法,可正确区分“有病”或“无病”。
数据如用通用符号表示:分析指标:1. 检测患病率(prevalence)是指被检测的全部对象中,检测出来的患者的比例。
即:检测患病率 = (a+b)/(a+b+c+d)2. 实际患病率(prevalence)是指被检测的全部对象中,真正患者的比例。
计数资料的统计分析
Fisher确切概率法的应用范围
当四格表中由理论频数小于1或n≤40时,宜用
四格表的确切概率法;
当 2检验所得概率P略大于a时,应用Fisher确 切概率法。
实例
两种药物治疗某病结果见下表,试比较其差别有
无显著性。 表
组别 旧药 新药 合计
两种药物治疗某病结果比较
治愈 2(3.2) 4(2.8) 6 未愈 5(3.8) 2(3.2) 7 合计 7 6 13
缺点:①不利于保密;②不便于比较
表 某季度甲、乙两部队的感冒发生情况 部别 总人数 发病人数 发病率(%)
甲部队
乙部队 合计
1834
1313 3147
58
42 100
3.16
3.20 3.18
相对数指标(relative number ):有联系的两个 指标之比。
意义:便于表达事物出现的普遍程度;
率与构成比
率 构成比 发生的频率或强度 各组成部分所占的比重 随机发生事件 各部分的构成
概念 强调点
资料获得 特点
较难 不一定
容易 合计为100%
率与构成比的例子
年龄 组 ⑴ 40~ 50~ 60~ 70~ ≥80 合计 受检 人数 ⑵ 560 441 296 149 22 1468 白内障 例数 ⑶ 68 129 135 97 19 448 患者年龄构 患病率(%) 成比(%) ⑸=(3)/(2) ⑷ 15.18 12.14 28.79 29.25 30.13 45.61 21.65 65.10 4.24 86.36 100.00 30.52
防护服种类
阳性例数 1 10 11
阴性例数 14 18 32
患病率(%) 6.7 35.7 25.6
新药临床试用及评价的统计分析方法
新药临床试用及评价的统计分析方法目的:讨论新药临床试用及评价的统计分析方法。
方法:查阅文献资料并结合个人经验进行归纳总结。
结论:药效试验报告及新药申报材料不同于一般科研论文,应尽可能详细地提供较精密的信息。
标签:新药临床试用评价统计分析方法1.计数资料的统计分析方法计数资料又称属性资料,基本数据有各组例数(n),阳性反应例数(r),阳性反应率(P)等。
常用于计数资料统计分析的方法很多。
1.1两级阳性率的统计方法可选用X2检验、U检验、L检验或C值法(对数拟然比法)等。
但由于药效统计中样本数一般不大,故以Rates校正的X2(2×2)法为好。
1.2两组小样本阳性率的统计分析当两组总例数(N)小于20,或数据中有。
或1时,上述X2(2×2)法计算误差较大,宜改用确切概率法或确切概率的环套公式为好。
1.3两组有配对关系的阳性率的统计分析当每一受试对象同时接受两种处理(如两个疗程、左右两侧用药)时,宜选用配对X2法。
1.4无等级关系多率资料的统计分析药效统计中此类资料较少见。
综合分析可应用X2(R×C)法或C值法。
分析两组间阳性率仍可用X2(2×2)法。
1.5有等级关系的多率资料的统计分析对有等级关系的统计资料不宜用X2(R×C)法或C值法。
而应采用Ridit 法或等级序值法。
这两种方法计算结果完全一致,均可对总疗效结果进行分析,比分别检验各组结果为好。
其中等级序值法原理易懂,计算简便、准确,特别便于多个实验组于对照组的对比分析,在药效统计分析中值得推广。
1.6多批计数资料的合并分析对多批或多个中心汇集的计数资料,只要实验条件一致,阳性率相近,趋势相同,可以将数据合并进行X2(2×2)检验;但如条件不完全相同,阳性率相差也较大,则不宜将数据直接相加,而应采用合并X2法。
2.计量资料的统计分析方法计量资料又称测量资料。
基本數据有各组均数叉、标准差(S)及例数(咒)。
计数资料统计结果再分析举例_王英敏
(收稿日期: 2007- 01- 04)
作者简介: 王英敏 ( 1973~ )女 ,黑龙江佳木斯人 ,学士 ,助研。
Abstract: Objective: T o i nv estiga te the eff ect s of di etary soybea n hydro lysa te i nt ake on the concent ra tion o f serum to tal cholest erol ( T C) and serum lipid i n hy percholesterol emic ra ts and to study thei r m echa nism s. M ethods: 28 day s af ter w e successf ull y i nduced the hypercholest erolemi a rat m odel, w e f ed the rat s a purifi ed diet containi ng ei ther casei n o r so ybean hy dro lysa te. Af ter the ex perimental di ets had been f ed fo r 56 days, fasti ng a ni mals were ki lled. Results: Compari ng wi th the rat s in casein gro up, the T C and T G i n soy bean hydroly sat e g ro up were si g ni fica nt ly low er ( P < 0. 05) . The concentra ti on o f fecal ex creti on of bile acids w as hig her in the rat s of soy bean hydrolysat e g ro up ( P < 0. 05) . How ev er, the cha ng es of HDL - C w ere no t sig nifi cant i n t hese ra ts. The lev el o f LDL recepto r m RN A in soy bean hydroly sat e ra ts w as si gni ficiant ly hig her. Conclusions: Dieta ry soy bean hydroly sat e inta ke may lo wer T C but further researches a re needed t o ex plai n the po ssible mechanism o f soybea n hydroly sat e inta ke i n lo w ering T C.
计数资料的统计分析
例 已知甲县食管癌死亡总数为452人,乙县为353人,以及标准 死亡率pi、总死亡率p,两县人口资料如下,求两县标准化死亡 率(1/10万)。
标准化死亡率: 甲县 p’=79.8×452/418=86.2(1/10万) 乙县 p’=79.8×353/387=72.6(1/10万)
但绝对数不宜直接作出比较,如:
某人在某农牧区调查了40岁以上的1468人进行
老年性查人 数
560
白内障 例数
68
患病率 (%)
12.14
患病人数构成比 (%)
15.18
50-
441
129
29.25
28.79
60-
296
135
45.61
30.13
70-
149
97
65.10
如从某地抽查了300名成年人,其中: 男性100人,某病患病率为20%, 女性200人,患病率为14%, 则此地男女合计的患病率为: (20+28)/300=16%
4.资料的对比应注意可比性 5.对率的比较应作假设检验
四.率的标准化
1.标准化法的意义 消除混杂因素的影响.
例 甲、乙两县各年龄组人口数及食管癌死亡率 (1/10万)如下:
注1:可以用标准人口构成比计算标准化死亡率, 求出分配食管癌死亡率(Ni/N)pi 再求和比较 。 注2:标准人口的选取应选择有代表性的、稳定 的、数量较大的人群。如国际的、全国的、全 省的数据。也可选择要比较的人群之一或其合 计作为标准。不同的标准所计算出的标准化率 亦不同。 注3:两标化率的比较应作假设检验
三.应用相对数注意事项
计数资料统计方法
计数资料统计方法
计数资料统计方法是指在数据收集过程中,对每个数据进行计数的一种统计方法。
计数资料一般是指属于某个类别的数据,如学生的性别、年级、班级等。
计数资料统计方法主要包括频数分布、百分比分布和列联表分析。
1. 频数分布:
- 将计数资料按照不同的类别进行分类,并统计每个类别的频数(出现的次数)。
然后将频数制成表格,称为频数分布表。
可以使用频数分布表直观地展示不同类别的计数资料的分布情况。
2. 百分比分布:
- 在频数分布的基础上,可以计算每个类别的频数占总样本数的百分比,用以描述每个类别在总体中的相对比例。
百分比分布可以更好地比较不同类别的计数资料之间的差异。
3. 列联表分析:
- 当有多个计数资料之间存在关联关系时,可以使用列联表分析来描述和分析这种关系。
列联表分析是通过将不同的计数资料构建成一个二维表格,并计算每个类别的频数和百分比,以便研究不同类别之间的关联性。
计数资料统计方法可以帮助研究者更好地理解和描述计数资料的分布情况和关
联关系,从而为进一步的数据分析提供基础。
计量资料的统计分析
实例:某部队干部体检得到体脂的均数和标准差分别
为18.9%和5.8%,血清胆固醇的均数与标准差分别为 4.84mmol/L和1.03mmol/L,试比较两者的变异情况。
由于体脂和血清胆固醇是两个不同的观察指标, 不能直接比较其标准差大小,而应比较变异系数。 对本例: 体脂变异系数: C1V 15..8 8 910% 03.0 6% 9
68
无
┆
┆┆
┆
┆
┆
┆
┆
┆
┆
计量 计量 计数 等级 等级 计量 计数 计量 计量
计数
注:体重指数=体重/身高3 (Kg/m3); 嗜肥肉史
劳动强度 轻1,中等2,重3
紧张程度 不紧张1,一般2,紧张3
班制
日班制1,两班制2,三班制3
有1,无0
平均数指标
Average Number
平均数指标
平均数(average) 是描述一群同质变量值集 中位置的特征值,用以说明同类现象或事物数量的 中等水平(集中趋势)。
教学内容
9.7 3学时 计量资料的统计分析(理论课) 9.7 2学时 计量资料的软件实现(操作演示)
9.9 3学时 计数资料的统计分析(理论课) 9.9 2学时 计数资料的软件实现(操作演示)
计量资料的统计描述
Descriptive Statistics
统计资料的分类
1、计量资料(或定量变量) 2、计数资料(或无序分类变量) 3、等级资料(或有序等级变量)
缺点:比较稳定,但不能反映其余数据的变异情 况,没有充分利用每个变量值的信息。 适用条件:四分位数间距用来描述大样本偏态资 料的变异情况。通常与中位数结合使用。
➢方差(Variance)
计数资料的统计分析
(2) 用单样本K-S拟合优度检验(1-Sample K-S Test) 例题:例7-12,例02-01 建立数据文件:例7-12.sav:1列279行。例02-01.sav 过程:
Analyze Nonparametric test 1-Sample K-S …
Row(s): smoke Column(s): case_ctr Layer: gender
Statistics…
Chi-square Risk Cells… Row
5. 样本率与总体率比较 数据文件:“例06-04.sav”。例题6-4
数据格式:2列2行。1个分组变量“受孕” ,1个 频数变量“freq” 。
Analyze
Descriptive Statistics Crosstabs…
Row(s):免疫荧光 Collumn(s):乳胶凝集
Statistics… McNemar
3.多个样本率比较的2检验 例题:例7-6 数据文件:“例07-06.sav”
数据格式:3列6行。2个分类变量,“疗法”和 “疗效”,1个频数变量“freq”
3.多个样本率比较的2检验: Chi-Square (Descriptive Statistics Crosstabs)
4.分层资料的2检验 (Descriptive Statistics Crosstabs)
5. 样本率与总体率比较 (Nonparametric Tests Binomial)
Test Variable List: x
Test Distribution Normal
Poisson Options…
Desceipitve
计数资料和计量资料的统计方法
计数资料和计量资料的统计方法一、引言统计学是应用数学的一门学科,它研究那些规律性现象和在自然和社会科学过程中数字数据的收集、分析、解释和推断的方法。
统计学是一门非常重要的学科,在现代科技、工程和商业领域中具有广泛的应用。
在统计学中,数据可以分为计数资料和计量资料两类。
计数资料是指数据只能计算某个特定事件发生的次数或频率,这种数据通常表现为分类变量的形式。
而计量资料是指这样的数据,可以通过数值结构来描述它们的数量或大小,这种数据通常表现为连续或离散变量的形式。
本文旨在介绍计数资料和计量资料的统计方法,以帮助读者更好地理解这两种类型的数据并能够正确应用其相关的统计方法。
二、计数资料计数资料又称分类资料。
计数资料的数据量统计通常以频数或百分比来进行。
频数是指某个特定事件在数据集中出现的次数,而百分比是指这些事件在数据集中的出现频率。
这些计数资料通常可以用柱状图或饼图来进行可视化呈现。
在计数资料的统计分析中,最常见的是用卡方检验来判断两个或多个分类变量是否存在显著关联。
通过比较两种不同的口罩在不同寿命期间的感染率,我们可以使用卡方检验来检验它们之间是否存在显著差异。
除了卡方检验外,在计数资料的统计分析中还有一些常用的量。
我们可以使用似然比比率来比较两个或多个不同的模型,以及使用警戒区分析来评估两个或多个分类变量之间的关系。
三、计量资料计量资料又称数值资料或连续资料。
计量资料的数据通常用平均值、标准差和相关系数等指标来进行描述。
这些指标可以帮助我们更好地了解数据的中心趋势和数据之间的变异情况。
计量资料通常可以用直方图或箱线图等图表来进行可视化呈现。
在计量资料的统计分析中,最常用的是使用t检验或ANOVA分析来比较组间或样本间的差异。
在医学试验中,我们可以使用t检验来比较用药组和对照组之间的差异。
线性回归和相关性分析也是常用的计量资料分析方法,可以用来探究变量之间的关系和相关性。
四、结论五、计数资料的实例计数资料的实例非常丰富。
计数资料的统计分析
操作方式与上述相同 (1)加权频数 (2)交叉表
公共卫生学院
2.1 多个样本率的卡方检验
➢检验步骤 ②选择检验方法,计算统计量
公共卫生学院
2.1 多个样本率的卡方检验
③根据检验统计量的结果做出统计推断 三个地区60岁以上老年人高血压患病率分别 为25.2%,23.3%,21.2%,Pearson卡方 =6.293,P=0.043,按0.05的检验水准拒绝H0, 认为三个地区的60岁以上老年人高血压患病 率间的差异有统计学意义。
公共卫生学院
1.2 连续校正卡方检验
③根据检验统计量的结果做出统计推断
即冠心病初发后进行体育锻炼的人复发冠心 病的危险是不锻炼的0.169倍。
公共卫生学院
内容
2. R×C列无序列联表卡方检验
• 1.1 多个样本率的卡方检验 • 1.2 多个样本构成的卡方检验
公共卫生学院
应用条件
R×C列无序列联表卡方检验检
据题意,本题需分析两组的构成比例之间有无差异
①建立假设检验,确定检验水准
H0:三组的总体构成相同 H1:三组的总体构成不同或不全相同
α=0.05
公共卫生学院
2.2 多个样本构成的卡方检验
➢检验步骤 ②选择检验方法,计算统计量
公共卫生学院
2.2 多个样本构成的卡方检验
➢检验步骤 ②选择检验方法,计算统计量
公共卫生学院
内容
1. 四格表的卡方检验
• 1.1 一般四格表卡方检验 • 1.2 连续校正卡方检验
公共卫生学院
1.1 一般四格表卡方检验
➢卡方检验的零假设,假定比较样本来自 总体率(π)相等的总体,即H0:π1=π2.卡方 检验的统计量也称为Pearson’s卡方检验
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
计量资料(定量资料)
❖统计资料类型:
计数资料(定性资料)
❖计数资料:按某事物属性或类别分组,清点 各组观察单位数而得到的资料称为分类资料
❖
一、常用的相对数
分类资料常采用相对数进行描述。 收集到的分类资料,表现为绝对数。
绝对数说明事物发生的实际水平,是进行 统计分析的基础,但不便于事物进行深入 分析比较。
、正确计算合计率(总率) 对观察单位数 不等的几个率,不能直接相加求平均率
正确的方法:总的发生数除以总的观 察单位数。
例: 用某疗法治疗肝炎,甲医院治疗人,
治愈人,治愈率为;乙医院治疗人,治愈 人,治愈率为。两个医院合计治愈率应该 是?
正确算法:[()()]× 错误算法:
或 ( ),
、注意资料的可比性
215
治愈率(%) 60.0 35.0 53.8
病人数 100 300 400
乙疗法 治愈数
65 125 190
治愈率(%) 65.0 41.7 47.5
2020/10/17
不能直接比较两医院总生存率 (应标化后再比)
一、标准化的意义和基本思想
❖ 与其合计的差别之所以大,是由于两疗法中 病人中病型构成不同。要正确比较甲、乙两 疗法的总治愈率,需按照统一标准进行校正, 然后进行比较。
❖ 即男性人口数是女性的倍。
表 某市某年各区急性传染病发生数及其相对数
年平均 急性传染 各区与Ⅰ 各区急性传染病发 各区急性传染病发生 市区
人口数 病发生数 区之比 生数构成(%) 率(1/10 万)
⑴
⑵
⑶
⑷
⑸
⑹
Ⅰ 636723 2433
-
18.9
Ⅱ 389540 3033
1.25
23.5
Ⅲ 699712 1相65对0 比 0.38 构成比 12.8
构 成 比 2 A 1 + A 2 + A 2 + A k 1 0 0 %
❖
构 成 比 k A 1 + A 2 + A k + A k 1 0 0 %
9% 12%
14% 17%
脑血管疾病
48%
心血管疾病
恶性肿瘤
意外伤害
呼吸系病
某地某年种慢性疾病的构成
某年中国农村死亡原因构成 ()
消化系病 4%
常用的相对数:率、构成比、相对比
(一)率()
率()又称频率指标,是指在一定时间 内发生某现象的观察单位数与可能发生 该现象的总观察单位数之比。它说明某 现象发生的频率或强度。
率可实能际发发生生该某现现象象单 的 单 的位 观 位 观总 察 数 察 数 K
为比例基数,可以是百分率()、千分率 (‰)、万分率(万)或十万分率(万), 可根据习惯或使计算出的率保持一、二位整 数。
构成该 比 某事 事物 物内 内部 部分 某 单 的的 一 位 所观 组 之 有察 成 和 观单 部 ( 察 ) 位 例 10数 % 数 0( 之
构成比
❖ 设某事物个体数的合计由,,· · ·,个部分 组成,构成比的计算为:
构 成 比 1 A 1 + A 2 A 1 + A k 1 0 0 %
定,不可靠,容易产生误解。 临床资料至少例才好计算率
、构成比不能代替率(分析时不能以比代率 )
在实际应用中经常出现以构成比代替率的错误。
年龄(岁)~ ~ ~ ~ ~ ~ ~ ~ 合计 沙眼人数
某文章作者根据上述资料认为,沙眼在~组 的患病率最高,以后随年龄增大而减少。
犯了以比代率的 错误
要想得到这一结论,应如何做?
()同一地区不同时期资料的相对数比较, 应注意条件有无变化。
、率或构成比的比较要遵循随机抽样的原则, 要做假设检验。
即两组或多组率比较,要作假设检验再下结论。
二、 率的标准化法
例如:
表 5 甲、乙两种疗法治疗某病的治愈率比较
病型 普通型 重型 合计
病人数 300 100 400
甲疗法 治愈数
180 35
例如: 某年甲乙两村发病情况如下: 甲村:发病人数 人。 乙村:发病人数 人。
发病情况乙村比甲村严重?
甲村: 人口数:人 发病人数: 人 发病率:。
乙村: 人口数:人 发病人数: 人 发病率: 。
甲村比乙村严重!
相对数:是两个有联系指标之比,说明事物发 生的相对水平,便于对分类资料进行分析和比 较。
其它 14%
恶性肿瘤 18%
损伤中毒 11%
呼吸系病 23%
心脏病 12%
脑血管病 18%
构成比两个特点
)一组构成比之和等于100%或1; )某部分构成增加或减少,则其它部分 构成就相应减少或增加。
某医院年与年各科病床情况
科别 年
年
病床数 构成比 病床数 构成比
内科
外科
儿科
合计
(三)相对比()
习惯用法:
人口出生率、死亡率、自然增长率、婴 儿死亡率等采用千分率;
肿瘤的死亡率采用十万分率。
例:
❖某单位在年有名职工,该单位每年对职 工进行体检,在这一年新发生高血压病 人例,则
高 血 压 发 病 率 1 2 1 0 0 0 ‰ = 3 .8 4 ‰ 3 1 2 8
(二)构成比
构成比()又称构成指标,说明某事物内部各 组成部分在整体中所占的比重或分布,常以百 分数表示,又称百分比。
382
779
率 236
Ⅳ 328363 1503
0.62
11.6
458
Ⅴ 286967 1282
0.53
10.0
447
Ⅵ 317504 1853
0.76
14.4
584
Ⅶ 153838 1130
0.46
8.8
735
合计 2812647 12884
-
100.0ຫໍສະໝຸດ 458(四)应用相对数的注意事项
、计算相对数的分母不宜过小 分母过小则计算所得的相对数不稳
相对比是、两个有关指标之比,说明是 的多少倍或百分之几。
比A(10% 0 ) B
与的性质可以相同,也可以不同。 可以是绝对数也可以是相对数或平均数。
人口密度、性别比、医护比,医技比
❖ 例: 我国年人口普查的男性人口数为,女性
人口数为人,则
❖ 男女 别 比 性 =68685 1 2 .055722 652872280
两个及以上的率(构成比)相比较时, 其他重要的影响因素要相同或相近(即所谓 的具有可比性),否则就不能直接对率进行 比较。一般的,两个地方的出生率、死亡率、 发病率,不同级别医院某病的治愈率等不能 直接比较。
率(或构成比)的比较是否具有可比性, 通常注意以下两个方面:
()观察对象同质,研究方法相同,观察 时间相等,以及研究对象所处的地区、民族、 职业、生活条件和习惯要一致;影响率的其 它因素在各对比组的内部构成是否相同。