第3讲 计量资料与计数资料的统计描述

合集下载

医学统计学之计量资料的统计描述

医学统计学之计量资料的统计描述

医学研究中有一类比较特殊的资料,如抗 体滴度等变量值呈倍数变化的数据,宜用 几何均数描述其平均水平。
适用资料: ①对数正态分布,原始数据偏态分布,经
对数变换后成正态分布的资料。 ②等比资料,即呈倍数变化的数据。例如
抗体滴度。
2020/12/16
计量资料的统计描述
21
几何均数的计算方法:
➢ 直接法 ➢ 加权法
计量资料的统计描述
24
2.加权法:
G
lg1
f lg
f
X
2020/12/16
计量资料的统计描述
25
举例:
IgG滴度倒数 40 80 160 320 640 1280
例数 3 22 17 9 0 1
G
lg
1
3
lg
40
22
lg
80
17
lg
160 52
9
lg
320
0
lg
1280
129.3
2020/12/16
2020/12/16
计量资料的统计描述
22
1.直接法:
G n X1 X2
Xn
写成对数形式 :
G
lg 1
lg
X1
lg
X
2 n
lg
X
n
lg 1
lg X n
2020/12/16
计量资料的统计描述
23
举例:
如上例:
G 10 2 2 4 48888 32 32 7
2020/12/16
M 160 10 (50 16) 164.5 20 2
2020/12/16
计量资料的统计描述
n

计量资料的统计描述

计量资料的统计描述

中位数(M)和百分位数(P)
中位数(median, M)是将一组观察值从小到大 按顺序排列,位次居中的数值对应的观察值就是 中位数。因而全部观察值中,大于和小于中位数 的观察值的个数相等。 百分位数(percentile,P)是指把一组资料的全 部观测值分为两部分,理论上讲,有x%的观测值 比Px小,有(100-x)%的观测值比Px大。中位数 是特定的百分位数,即P50,它是表示一组资料集 中位置的指标。
计算器功能简介
MODE或D·R·G:模式转换
DEG:degree 角度 RAD:radian 弧度 GRA:gradient 梯度
INV、 SHIFT或2nd F:第二功能键 SD 或 STAT:统计分析功能 x ,n,Σx,Σx2, σn (σX , σ),σn-1(sX , s)。 X 、 data 或DT:数据储存
标准差的应用
标准差是反映数据变异程度的指标,其大 小受每一个观察值的影响。 常用于描述对称分布,尤其是正态分布或 近似正态分布资料的离散程度。 随着样本量增大,标准差逐渐趋于稳定。
变异系数(CV)
CV =s/ x ×100% 它是反映相对变异度的指标。 变异系数常用于:
测量单位不同的几组资料变异度的比较; 均数相差悬殊的几组资料变异度的比较。
H = R 1 + 3 . 322 lg N
第一组段必须包括最小值,一般取略小于最小值 的整数作为第一组的下限;最后一个组段应该包 括最大值,并且封口,但最后一个组段的上限不 能等于最大值。
频数表的编制
3.列表划记,统计各组段频数。 4.计算频率与累计频率
频数分布的两个特征
体重虽有轻有重,但都向35~组段集中,数据大多 数集中在32~38组段,共83人,占总人数的55%, 这种趋势称为集中趋势 集中趋势。 集中趋势 另一方面,随体重逐渐变大或变小,仍有小部分变 量值存在,称这种特征为离散趋势 离散趋势。 离散趋势 集中趋势和离散趋势是频数分布的两个重要特征。

《医学统计学》教学大纲(医学检验)

《医学统计学》教学大纲(医学检验)

《医学统计学》课程教学大纲(Medical Statistics)一、课程基本信息课程编号:14232080课程类别:专业必修课适用专业:医学检验技术学分:理论教学学分:2学分,实验学分:0.5学分总学时:40学时(其中讲授学时:24学时;实验(上机)学时:16学时)先修课程:医学基础课程后续课程:医学检验、预防医学选用教材:李康主编:医学统计学(第6版)[M].北京:人民卫生出版社,2013必读书目:[1]方积乾主编.医学统计学(第7版)[M].北京:人民卫生出版社,2013[2]袁兆康.医学统计学[M].北京:人民军医出版社.2013[3]张文彤主编.SPSS统计分析基础教程(第2版)[M].北京:高等教育出版社,2011选读书目:[1] 颜虹, 医学统计学[M]. 北京:人民卫生出版社,2005[2] 康晓平,实用卫生统计学 [M].北京:北京大学医学出版社,2002[3] Belinda Barton,Medical Statistics: A Guide to SPSS, Data Analysis and Critical Appraisal [M].美国:WILEY Blackwell,2014二、课程教学目标通过本门课程的学习,要使学生学会人群健康研究的统计学方法,学会数值变量和分类变量资料的分析,配对资料的分析,直线相关和直线回归,非参数统计方法,病例随访资料分析。

其目的使大家具备新的推理思维,结合专业问题合理设计试验,科学获取资料,提高科研素质。

本课程教学的主要方法有理论讲授、课堂讨论、实验实习、课堂演算、统计软件SPSS上机等。

通过实验实习,使学生加深对理论的理解。

三、课程教学内容与教学要求1.绪论教学要求:掌握:同质与变异,总体、个体和样本,变量的分类,统计量与参数,抽样误差,频率与概率等基本概念。

理解:统计工作的基本步骤,医学统计学的主要内容。

了解:学习统计学的目的和要求。

预防医学--计量资料的统计描述 ppt课件

预防医学--计量资料的统计描述  ppt课件

3.列出频数表。采用划记法或计算机
汇总。
PPT课件
10
110名20岁健康男大学生身高(cm)均数计算表(加权法)
身高组段 组中值x
(1)
(2)
162~
163
164~
165
166~
167
168~
169
170~
171
172~
173
174~
175
176~
177
178~
179
180~
181
182~184 183
PPT课件
29
一、 正态分布曲线
(normal distribution curve)
PPT课件
30
频数分布逐渐接PPT课近件 正态分布示意图 31
简称正态曲线(normal
curve),是一条高峰位
于中央(均数所在处),
两侧完全对称,而且逐渐
降低,但永远不与横轴相
交的钟型曲线。横轴上曲
线下的总面积为100%或1,
PPT课件
44
3.确定分组。原则上组间差别明显且 有实际意义者分开,否则可分开。
4.根据ห้องสมุดไป่ตู้标的实际用途确定单、双 侧。
5.选定适当的百分界限。
6.根据资料的分布特点,选用恰当 的界值计算方法。
PPT课件
45
四常用参考值范围估计方法
95%正常值范围:同质总体中包含95%的个体 值所在的范围。
1.正态分布法:适用于正态或近似正态分布资料。 双侧:X±1.96S,
单侧:X+1.645S或X–1.645S
2.对数正常分布法:适用于对数正态分布资料。 双侧:Lg–1(XlgX±1.96SlgX) 单侧:Lg–1(XlgX –1.645SlgX) 或Lg–1(XlgX +1.645SlgX)

计数资料统计描述_科学学位PPT课件

计数资料统计描述_科学学位PPT课件

(3)常见率的计算
病死率 (fatality rate):表示一定时期内,患
某病的全部病人中因该病死亡者的比例。
某年某病的病死率=一定时期内因某病死亡的人数 同期内确证为某病的人数

K
24
(4)率的统计学意义 率是表示频率或强度的指标。 影响因素相同时,率越大则事物发生的频率或强 度越大;对疾病而言,频率越大,对人群的危害 也越大。
25
常用的相对数指标
2、构成比 proportion 定义 公式 特点 构成比的统计学意义
26
(1)定义:构成比说明某一事物内部各 组成部分所占的比重或分布。常以百分比表示。
(2)公式
构成比

某一组成部分的观察单位数 同一事物各组成部分观察单位总数
100%
27
设某事物个体数的合计由A1,A2,…,Ak个部分组成,构 成比计算为:
构成比1
A1
100%
A1 A2 Ak
构成比2
A2
100%
A1 A2 Ak



构成比K
AK
100%
A1 A2 Ak
K个构成比的合计为100%
28
(3) 特 点
a. 一组资料各部分构成比之和为100%; b. 当某一部分构成比增大时,其余部分的构成比相 应减少。
… 2000386
关于孕妇分娩的原始资料记录
年龄 27 22 25 24 30 32 27 29 … 26
职业 无 无
管理人员 知识分子 管理人员
无 无 无 … 无
文化程度 中学 小学 大学 中学 大学 小学 中学 大学 … 小学
分娩方式 顺产 助产 顺产 顺产 顺产

统计学--第二章计量资料的统计描述幻灯片PPT

统计学--第二章计量资料的统计描述幻灯片PPT
甲组 26 28 30 32 34
乙组 24 27 30 33 36
丙组 26 29 30 31 34
课件
36
离散程度(或变异程度)
指数据参差不齐的程度,反映资料的 离散趋势。
将反映平均水平与离散程度的指标结 合起来使用,可全面地描述数据的分 布规律。
课件
37
(一)全距(或极差 , Range )
(53.0 55.0) / 2 54(cm)
数。
课件
28
中位数的应用
中位数可用于任何分布的定量资料; 资料的分布呈明显偏态,特别是负偏态; 分布的一端或两端无确定的数值;
(如:>50, 或 <10)
资料的分布不清。 注意:在完全对称的单峰曲线分布中,同
一组资料的均数与中位数相同, Mean = Median
XX22XX2
XX2 2 XX2
课件
19
(二)几何均数 Geometric mean,
G
反映一组呈倍数关系的观察值的平 均水平
适用:数据呈正偏态分布,经对数 转换后呈正态分布。多用于观察值 之间呈倍数关系,如抗体滴度
计算方法
➢直接法
➢加权法
课件
20
1.直接法
G n X1X2...Xn
lg1lgX1 lgX1 ...lgXn
对称分布
正偏态分布
课件
负偏态分布
9
三、频数表和频数分布图的用途
揭示变量的分布特征和分布类型; 便于进一步计算指标和统计分析处
理; 便于发现某些特大或特小的可疑值

课件
10
频数分布的两个特征
集中趋势,central tendency
指变量值的中心数值或中心位置所在。

医学统计学PPT课件

医学统计学PPT课件

验结果,每次都有如此好的吻合. 的概率约10万分之4。 6
绪论 Introduction
讲授内容:
一、医学统计学的意义
二、统计学中的几个基本概念
三、统计资料的类型
四、医学统计工作的基本步骤
五、学习医学统计学应注意的问题
.
7
一、医学统计学的意义
• 1.统计学(statistics):应用数学的原理与 方法,研究数据的搜集、整理与分析的科 学,对不确定性数据作出科学的推断。
例如:某药治疗高血压患者30名
样本含量(n)为30
.
21
二、统计学中的几个基本概念
• 4、参数(parameter)和统计量(statistic)
• (1)参数(parameter):根据总体个体 值统 计计算出来的描述总体的特征量。
• 一般用希腊字母表示
• (2)、统计量(statistic):根据样本个体值统 计计算出来的描述样本的特征量。
(120.2cm,118.6cm,121.8cm,…)
研究某人群性别构成 变量值:男、女。
.
15
二、统计学中的几个基本概念
• 2、同质(homogeneity)和变异 (variation)
• (1)、同质(homogeneity):根据研究 目的给研究单位确定的相同性质。
• 研究长沙市2004年7岁 男孩身高的正常值范围?
.
27
二、统计学中的几个基本概念
• (3)、抽样误差(sampling error):由 于抽样所造成的样本统计量与总体参数 的差别。
• 例如:=120.0cm
n=100

N=5万 → X =118.6cm
• 特点:1)不可避免性

2.计量资料的统计描述

2.计量资料的统计描述

20
组 段 (1) 124~ ~ 128~ ~ 132~ ~ 136~ ~ 140~ ~ 144~ ~ 148~ ~ 152~ ~ 156~ ~ 160~ ~ 合 计
频 数 (2) 1 2 10 22 37 26 15 4 2 1 120
累计频数 (3) 1 3 13 35 72 98 113 117 119 120
12
第二节
简称均数
描述集中趋势的指标
算数均数( 算数均数(mean) ) 适用条件:对称分布, 适用条件:对称分布,尤其是正态分布或近似正态分布 表示:总体均数用μ表示;样本均数用 表示:总体均数用μ表示; 意义:描述一组同质资料的平均水平。 意义:描述一组同质资料的平均水平。 计算方法: 计算方法: 直接法 间接法(频数表法) 间接法(频数表法)
19
频数表法:适用于样本量较大的计量资料, 频数表法:适用于样本量较大的计量资料,如频数表 资料。 资料。
M所在组下限 其中 LM:M所在组下限 i:M所在组组距 : 所在组组距 fM:M所在组频数 所在组频数 n:样本例数 : ΣfL:M所在组段之前的累计频数 所在组段之前的 所在组段之前的累计频数
统计描述是统计分析的最基本内容 统计描述的三种形式: 统计描述的三种形式
统计表 统计图 统计指标
2
第一节 频数分布表和频率分布图
岁女孩身高( )资料如下: 例2-1、某市 、某市2005年100名18岁女孩身高(cm)资料如下: 年 名 岁女孩身高 165.1 169.6 163.0 166.5 160.9 156.6 169.3 165.9 162.0 165.3 165.1 164.0 159.9 171.2 169.1 168.0 160.6 157.1 162.5 165.8 161.5 166.3 168.5 167.1 161.0 159.0 167.3 157.2 163.7 163.1 166.1 167.5 166.0 158.5 161.2 167.5 158.2 154.7 155.6 168.2 162.8 163.6 164.2 161.8 160.7 173.6 159.8 158.0 159.4 158.2 166.2 166.1 156.8 166.6 161.5 162.0 160.6 164.3 161.9 167.2 170.2 160.4 163.0 163.5 162.9 167.4 162.2 162.7 169.7 159.9 165.2 169.0 162.3 164.6 163.4 170.6 162.8 163.1 164.0 161.2 161.0 161.3 165.0 160.4 168.9 165.0 164.2 165.2 162.6 164.5 161.5 162.6 158.3 165.1 170.5 166.8 165.8 164.5 167.5 162.8

计量资料与计数资料统计描述

计量资料与计数资料统计描述
医学统计学 (Medical Statistics)
第3讲 计量与计数资料的统计描述
本讲结构
一、数据类型的分类 二、计量资料的统计描述 三、SPSS实现计量资料的统计描述 四、计数资料的统计描述 五、统计表与统计图
一、数据类型的分类
1、计量资料 (measurement data)
用仪器、工具等测量方法获得的数据,又称数值变量。 特点:有计量单位,如患者的身高(cm),体重(kg),血压(kPa)等.
频数表的编制步骤
(1)求极差(range):即最大值与最小值之差,又称为全距。 (2)数据分组: 由样本容量n确定组数、通常分10-15个组; 一般采取等距分 组, 组距=极差/组数。 (3)列出组段:第一组段的下限略小于最小值,最后一个组段上限必须包 含最大值,其它组段上限值忽略。 (4)划记计数:用划记法将所有数据归纳到各组段,得到各组段的频数。
住院 天数
5 5 6 5 11 2 4 3 7
职业
无 无 管理员 无 商业 无 无 无 干部
文化 程度 中学 小学 大学 中学 中学 小学 中学 中学 中学
分娩 方式 顺产 助产 顺产 剖宫产 剖宫产 顺产 助产 助产 剖宫产
妊娠 结局 足月 足月 足月 足月 足月 早产 早产 足月 足月
计量资料
计数资料
大学
32

小学
27

中学
29

大学
25
农民
中学
26无小学源自分娩方式 顺产 助产 顺产 顺产 顺产
剖宫产 顺产
剖宫产 顺产 顺产
妊娠结局 足月 足月 足月 早产 足月 足月 死产 足月 足月 足月
按年龄(2岁一组)与职业整理

医学统计学:计量资料的统计描述

医学统计学:计量资料的统计描述

方差、标准差计算方法和意义
方差
指各数据与均数之差的平方和的平均 数,用于反映数据的术平方根,用于衡量数据偏 离均数的程度。标准差越大,数据分 布越离散。
变异系数在医学研究中应用
变异系数
指标准差与均数之比,用于比较不同单位或不同均数水平下数据的离散程度。在医学研究中,常用于评价不同指 标或不同人群间的变异程度。
分类
根据测量水平不同,可分为离散型计量资料和连续型计量资料。离散型计量资 料只能取整数值,如人口数、医院床位数等;连续型计量资料可以取实数范围 内的任何值,如身高、体重等。
计量资料特点分析
01
数值性
计量资料以数值形式表示,具有明 确的数量特征。
可比性
同类计量资料之间可以进行比较, 如不同人群的身高、体重等。
众数
一组观察值中出现次数最多的数。
应用场景
常用于描述无明显集中趋势或分布规 律资料的集中趋势,如一些分类数据 的统计描述。
04 离散程度指标解读
极差、四分位数间距计算及意义
极差
指一组数据中最大值与最小值之差, 用于反映数据的波动范围。计算简单, 但易受极端值影响。
四分位数间距
指第三四分位数与第一四分位数之差, 用于反映中间50%数据的离散程度。 较极差更稳定,不易受极端值影响。
常用统计描述方法介绍
频数分布表与直方图
通过分组和计数的方式展示数 据的分布情况,适用于连续型
变量。
集中趋势描述
包括算术均数、几何均数和中 位数等,用于描述数据的平均 水平或中心位置。
离散程度描述
包括标准差、方差和四分位数 间距等,用于描述数据的波动 范围或离散程度。
偏态与峰态描述
通过偏态系数和峰态系数等描 述数据的偏态和峰态特征,反

计量资料的统计分析ppt课件

计量资料的统计分析ppt课件
丙组 3
乙组 2
甲组 1
0 20 24 28 32 36 40
方差与标准差的应用
方差或标准差属同类变异指标,它们多用 来描述均匀分布或近似正态分布的资料,大、 小样本均可,其中以标准差的应用最广,通常 与均数结合使用。比如在许多医学研究报告中
常用 x s 的形式表达资料。
方差与标准差的应用
方差是样本观察值的离均差平方的平均值, 它全面地反映了数据的变异大小;方差越 大,观察值与均数间的差异就越大,数据 的变异程度就越大,反之亦然;
顺序号 (1) (2) (3) (4) (5) (6) (7) (8) (9) (10) (11) (12)
数据值 7.4 8.6 8.6 10.8 11.6 11.6 11.6 12.1 12.3 14.3 15.0 15.6
中位数的应用与特点
适用条件:适合各种类型的资料。尤其适合于 ①大样本偏态分布的资料; ②资料有不确定数值; ③资料分布不明等。
由于体脂和血清胆固醇是两个不同的观察指标,
不能直接比较其标准差大小,而应比较变异系数。
对本例:
体脂变异系数:
CV1

5.8 18.9
100%

30.69%
血清胆固醇变异系数:
CV2

1.036 100% 4.84

21.40%
显然,体脂变异大于血清胆固醇变异。
变异系数的特点
变异系数主要用于量纲不同的指标间,或均数相差较 大的指标间的变异程度的比较;
71
下 中分化 Ⅱ 阳性
78
5
5男
59
上 高分化 Ⅲ 阴性
85
35
……


统计学之计量资料的统计描述(ppt 50页)

统计学之计量资料的统计描述(ppt 50页)
可用于反映一组呈对称分布的变量值在 数量上的平均水平或者说是集中位置的特 征值。
1. 均数(mean)
符适号用:条总件体:资 料样呈本对称X 分布,尤其是正态或
近似正态。计算:
(1)直接法 XX1X2 XnX
(2)频数表法
n
n
X f1 X 1 f2 X 2 f3 X 3 fk X k fX i
第三节 离散趋势的描述
例2-11 三组同龄男孩的身高值(cm)
描述离散趋势的特征数 (变异(variation)指标)
反映数据的离散度( Dispersion )。即 个体观察值的变异程度。常用的指标有:
1. 极差(Range) (全距) 2. 百分位数与四分位数间距
Percentile and Quartile range 3. 方差 Variance 4. 标准差Standard Deviation 5. 变异系数 Coefficient of Variation
合计 2500 2500 2500 440
均数 500 500 500 420
甲 乙丙
1.极差(Range)
符号:R 意义:反映全部变量值 的变动范围。 优点:简便,如说明传染 病、食物中毒的最长、 最短潜伏期等。 缺点:1. 只利用了两个
极端值 2.n大,R也会大 3.不稳定 适用范围:任何计量资 料;是参考变异指标
总称为平均数(average)反映了资料的集中 趋势( central tendency )。常用的有: 1. 算术均数(arithmetic mean),简称均数 (mean) 2. 几何均数(geometric mean) 3. 中位数 (median)
一、算术均数
算术均数:简称均数(mean)

计量资料的统计描述(研究生) PPT课件

计量资料的统计描述(研究生) PPT课件

第二章计量资料的统计描述计量资料的统计描述频数表与频数分布集中趋势(算术均数、几何均数、中位数)离散趋势(极差、四分位间距、方差、标准差、变异系数)福建医科大学流行病与卫生统计一、频数表与频数分布(frequency table and frequency distribution) 福建医科大学流行病与卫生统计(一)连续型计量资料的频数表1、频数表的制作步骤2、频数分布表的作用例2-1 从某单位1999年的职工体检资料中获得101名正常成年女子的血清总胆固醇(mmol/L)的测量结果如下,试编制频数分布表。

2.35 4.213.32 5.354.17 4.13 2.78 4.26 3.58 4.34 4.84 4.41 4.78 3.95 3.92 3.58 3.66 4.28 3.26 3.5 2.7 4.61 4.75 2.913.914.59 4.19 2.68 4.52 4.91 3.18 3.68 4.83 3.87 3.95 3.914.15 4.55 4.8 3.41 4.12 3.955.08 4.53 3.92 3.58 5.35 3.843.60 3.514.06 3.07 3.55 4.23 3.57 4.83 3.52 3.84 4.5 3.964.50 3.27 4.52 3.19 4.59 3.75 3.98 4.13 4.26 3.63 3.875.713.304.73 4.175.13 3.78 4.57 3.8 3.93 3.78 3.99 4.48 4.284.065.26 5.25 3.98 5.03 3.51 3.86 3.02 3.7 4.33 3.29 3.25 4.15 4.36 4.95 3.00 3.26频数表的编制步骤(1)求全距(range):即最大值与最小值之差,又称为极差。

本例全距:R=(5.71-2.35)cm=3.36cm(2)划分组段组数:组段常取10~15组为方便计,组距参考极差的十分之一, 再略加调整。

计数资料和计量资料的统计方法

计数资料和计量资料的统计方法

计数资料和计量资料的统计方法一、引言统计学是应用数学的一门学科,它研究那些规律性现象和在自然和社会科学过程中数字数据的收集、分析、解释和推断的方法。

统计学是一门非常重要的学科,在现代科技、工程和商业领域中具有广泛的应用。

在统计学中,数据可以分为计数资料和计量资料两类。

计数资料是指数据只能计算某个特定事件发生的次数或频率,这种数据通常表现为分类变量的形式。

而计量资料是指这样的数据,可以通过数值结构来描述它们的数量或大小,这种数据通常表现为连续或离散变量的形式。

本文旨在介绍计数资料和计量资料的统计方法,以帮助读者更好地理解这两种类型的数据并能够正确应用其相关的统计方法。

二、计数资料计数资料又称分类资料。

计数资料的数据量统计通常以频数或百分比来进行。

频数是指某个特定事件在数据集中出现的次数,而百分比是指这些事件在数据集中的出现频率。

这些计数资料通常可以用柱状图或饼图来进行可视化呈现。

在计数资料的统计分析中,最常见的是用卡方检验来判断两个或多个分类变量是否存在显著关联。

通过比较两种不同的口罩在不同寿命期间的感染率,我们可以使用卡方检验来检验它们之间是否存在显著差异。

除了卡方检验外,在计数资料的统计分析中还有一些常用的量。

我们可以使用似然比比率来比较两个或多个不同的模型,以及使用警戒区分析来评估两个或多个分类变量之间的关系。

三、计量资料计量资料又称数值资料或连续资料。

计量资料的数据通常用平均值、标准差和相关系数等指标来进行描述。

这些指标可以帮助我们更好地了解数据的中心趋势和数据之间的变异情况。

计量资料通常可以用直方图或箱线图等图表来进行可视化呈现。

在计量资料的统计分析中,最常用的是使用t检验或ANOVA分析来比较组间或样本间的差异。

在医学试验中,我们可以使用t检验来比较用药组和对照组之间的差异。

线性回归和相关性分析也是常用的计量资料分析方法,可以用来探究变量之间的关系和相关性。

四、结论五、计数资料的实例计数资料的实例非常丰富。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
一、数据类型的分类
1、计量资料 (measurement data)
用仪器、工具等测量方法获得的数据,又称数值变量。 特点:有计量单位,如患者的身高(cm),体重(kg),血压(kPa)等.
2、计数资料 (count data)
按某种属性分类计数后得到的数据,又称无序分类变量,有二分 类和多分类两种情形.
366
28 34
35
10
34
78
57
248
30 11
14
11
22
39
17
114
32 14
2
3
14
24
3
60
34
4
2
5
3
12
2
28
36
2
1
1
4
5
1
14
38
3
1
1
0
2
1
8
40
0
0
2
0
0
0
2
合计 207
141
102
208 537 206 1401
2、常用相对数指标
计数资料常用的数据形式是绝对数,如某病的出院人数,治愈人数 等.但绝对数不具可比性,需要计算相对数.
2、三线表
表号 标题(包括何时、何地、何事)
横标目的 总标目 横标目

总标目
纵标目 纵标目
××× ×××
××
××
总 标 目(单位)
纵标目
纵标目
××. ×× ××. ××
×. ×× ×. ××
┋ ┋ 合计
┋ ┋ ×××
┋ ┋ ×××
┋ ┋ ×:
3、统计表的分类
根据分组标目的复杂程度,统计表可大致分为简单表 和复合表。
率(rate):说明某现象或某事物发生的频率或强度。 率=(实际发生数/可能发生总数)×比例基数
比例基数:100%、1000‰、10000/万、100000(1/10万)等 如:发病率、死亡率、发生率、阳性率、患病率等 构成比(proportion):说明某一事物内部,各组成部分所占的比 重,也叫百分比。 构成比=(某部分观察单位数/各组成部分观察单位总数)×100% 如:教研室20人中高级职称有5人,占25%。 相对比(relative ratio):是A、B两个有关指标之比,说明A是 B的若干倍或百分之几,通常用倍数或分数表示。如:男:女、医生: 护士、教师:学生
用途:用等宽直条的长短来表示相互独立的各统 计指标的数值大小,也叫直条图. 分单式和复式两种.
单式条形图
复式条形图
圆图(Pie Chart)
用途:以圆的半径将圆面分割成多个大小不等的 扇形,以扇形面积来表达构成比的图形。
线图(Line Chart)
用途:适用于连续变量资料,说明某事物因时间、 条件推移而变迁的趋势。
实例数据
住院号 年龄 身高 体重
2025655 27 165 71.5 2025653 22 160 74.0 2025830 25 158 68.0 2022543 23 161 69.0 2022466 25 159 62.0 2024535 27 157 68.0 2025834 20 158 66.0 2019464 24 158 70.5 2025783 29 154 57.0
正正正
17
1.35
22.95
正正
13
1.45
18.85

9
1.55
12.40

8
1.65
14.85
3
1.75
5.25
160
182.30
对称分布:以频数最多组段为中心左
右大体对称.
右(正)偏态分布: 频数最多组段右侧组
段数多.(skewed to the right distribution)
左(负)偏态分布: 频数最多组段左侧组
(4)=(2)+(3)
急性期 死亡数
(5)
住院期总病 急性期病 死率(%) 死率(%) (6)=(4)/(2) (7)=(5)/(2)
1964
17
9
8
7
47.1
41.2
1965
13
8
5
4
38.5
30.8
1966
15
8
7
6
46.7
40.0
1967 15
9
6
6
40.0
40.0
1968 12
8
4
4
33.3
448
100.00
30.52
3、相对数应用注意事项
(1) 不能以构成比代替率。 (2) 计算相对数的分母不宜过小, 小则直接叙述。 (3) 进行率的对比分析时,应注意资料可比性。如比较疗
效时,比较组间应病情轻重相同,性别影响,应按性别 分组后再作比较。 (4) 正确求平均率。 例: 若P1=x1/n1 P2=x2/n2 P3=x3/n3

小学
2025830 25 管理人员 大学
2025677 24 知识分子 中学
2025647 30 管理人员 大学
2025848 32

小学
2019915 27

中学
2025861 29

大学
2024601 25
农民
中学
2000386 26

小学
分娩方式 顺产 助产 顺产 顺产 顺产
剖宫产 顺产
剖宫产 顺产 顺产
例: 率与构成比
白内障 患者年龄
年龄组 受检人数 例数 构成比(%) 患病率(%)




⑸=(3)/(2)
40~ 560
68
15.18
12.14
50~ 441
129
28.79
29.25
60~ 296
135
30.13
45.61
70~ 149
97
21.65
65.10
≥80
22
19
4.24
86.36
合计 1468
妊娠结局 足月 足月 足月 早产 足月 足月 死产 足月 足月 足月
按年龄(2岁一组)与职业整理
年龄 工人 管理人员 农民 商业服务 无 知识分子 总计
18
2
0
0
0
3
0
5
20
9
2
6
10
18
0
45
22 28
7
10
24
70
11
150
24 50
34
28
52
153
44
361
26 50
43
25
45
133
70
三类资料间关系
例:一组2040岁成年人的血压
等级 资料
<8 低血压 8 正常血压 12 轻度高血压 15 中度高血压 17 重度高血压
计量资料 计数资料
以12kPa为界分为正常与异常两组,统计每组例数
二、计量资料的统计描述
1、频数分布 (frequency distribution)
为了了解数据的分布情况,可以编制频数表(frequency table).
特点:无计量单位,如肤色(黑白)、血型(ABO)、职业(工农兵)、 性别(1=男,2=女)等.
3、等级资料 (ordinal data)
半定性或半定量的观察结果,有大小顺序,又称有序分类变量. 如 ①癌症分期:早、中、晚。
②药物疗效:治愈、好转、无效、死亡。 ③尿蛋白: ,,,++,+++及以上
P=(x1+ x2+ x3)/ n1+ n2+ n3) (正确) P=(P1+ P2+ P3)/3 (错误)
计数资料和等级资料的SPSS表示
五、统计表与统计图
统计表(statistical table)——数据代替文字描述,便于 统计结果的精确、简洁的表达和对比分析.
统计图(statistical chart)——用图形代替数据,获得直 观、形象的效果.
简单表(simple table):只按一个特征或标志分组。 如表2-8 。
复合表(combinative table) :按两个或两个以上特 征或标志结合起来分组。如表2-9。
3、不良统计表的修改
表 2-15 第三组病人各年存活及死亡情况 (原表)
年份 (1)
病例数 (2)
存活数 (3)
住院期死 亡总例数
段数多.(skewed to the right distribution)
2、集中趋势的描述
统计上使用平均数(average)来反映计量资料的集中趋 势( central tendency ).
常用平均数有: 1. 算术均数(arithmetic mean),简称均数 (mean) 2. 几何均数(geometric mean) 3. 中位数 (median) 4. 百分位数(percentile)
41.2
38.5 46.7
30.8 40.0
40.0 33.3
40.0 33.3
41.7
37.5
3、统计图
统计图(statistical chart 或statistical graph)是用点、线、面等几何图形,直观形象地表达、 描述数据或结果。
SPSS绘制基本图形
条形图(Bar Chart)
定义:将统计分析的事物及指 标用表格列出.
特点:避免长篇文字叙述,便 于阅读和对比分析;数据具体.
相关文档
最新文档