计量资料与计数资料的统计描述.PPT
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
1.3~
1.4~ 1.5~
正正正
正正 正
17
13 9
1.35
1.45 1.55
22.95
18.85 12.40
1.6~
1.7~1.8 合计
正
8
3 160
1.65
1.75
14.85
5.25 182.30
对称分布:以频数最多组段为中心左
右大体对称.
右(正)偏态分布: 频数最多组段右侧组
段数多.(skewed to the right distribution)
3、相对数应用注意事项
(1) 不能以构成比代替率。 (2) 计算相对数的分母不宜过小, 小则直接叙述。 (3) 进行率的对比分析时,应注意资料可比性。如比较疗 效时,比较组间应病情轻重相同,性别影响,应按性别 分组后再作比较。 (4) 正确求平均率。 例: 若P1=x1/n1 P2=x2/n2 P3=x3/n3 (错误) P=(x1+ x2+ x3)/ n1+ n2+ n3) (正确) P=(P1+ P2+ P3)/3
等级 资料
8 12 15 17
ຫໍສະໝຸດ Baidu计量资料
计数资料
以12kPa为界分为正常与异常两组,统计每组例数
二、计量资料的统计描述
1、频数分布 (frequency distribution)
为了了解数据的分布情况,可以编制频数表(frequency table).
频数表的编制步骤
(1)求极差(range):即最大值与最小值之差,又称为全距。 (2)数据分组: 由样本容量n确定组数、通常分10-15个组; 一般采取等距分 组, 组距=极差/组数。 (3)列出组段:第一组段的下限略小于最小值,最后一个组段上限必须包 含最大值,其它组段上限值忽略。 (4)划记计数:用划记法将所有数据归纳到各组段,得到各组段的频数。
:TTT(麝香草酚浊度试验), :GPT(谷丙转氨酶)。 (丁建生等. 中国卫生统计 1999; 16(3):166 )
2、三线表
表号 标题(包括何时、何地、何事)
横标目的 总标目 横标目 ┋ ┋ ┋ 合 计 总标目 纵标目 ××× ×× ┋ ┋ ××× 纵标目 ××× ×× ┋ ┋ ××× 总 标 目(单位) 纵标目 ××. ×× ×. ×× ┋ ┋ ××. ×× 纵标目 ××. ×× ×. ×× ┋ ┋ ××. ××
2025653
27
22
165
160
71.5
74.0
5
5
无
无
中学
小学
顺产
助产
足月
足月
2025830
2022543 2022466 2024535 2025834 2019464 2025783
25
23 25 27 20 24 29
158
161 159 157 158 158 154
68.0
69.0 62.0 68.0 66.0 70.5 57.0
x( n1) / 2 Md xn / 2 x1 n / 2 2
3、离散趋势的描述
反映数据的离散度(Dispersion), 即个体观察值的变异 (variation)程度, 常用的统计指标有:
1. 2. 3. 4. 5.
极差(Range) (全距) 四分位数间距 (Quartile range) 方差(Variance) 标准差(Standard Deviation) 变异系数(Coefficient of Variation)
表2-1: 160名正常成年女子的血清甘油三酯(mmol/L)
编号 1 2 3 4 5 血清甘油三脂 0.51 0.52 0.59 0.61 0.61 编号 … 153 154 155 156 血清甘油三脂 … 1.65 1.66 1.67 1.67
6
7 8
0.62
0.63 0.64
157
158 159
R X max X min
S
四分位间距:QR=P75- P25
X 2 X n
2
n 1
S CV 100% X
三、SPSS实现计量资料的统计描述
四、计数资料的统计描述
1、计数资料数据的整理
住院号
2025655
年龄
27
职业
无
文化程度
中学
分娩方式
顺产
妊娠结局
足月
2025653
用仪器、工具等测量方法获得的数据,又称数值变量。 特点:有计量单位,如患者的身高(cm),体重(kg),血压(kPa)等.
2、计数资料 (count data)
按某种属性分类计数后得到的数据,又称无序分类变量,有二分 类和多分类两种情形. 特点:无计量单位,如肤色(黑白)、血型(ABO)、职业(工农兵)、 性别(1=男,2=女)等.
医学统计学 (Medical Statistics) 第3讲 计量与计数资料的统计描述
西南交通大学峨眉校区基础课部数学教研室
本讲结构
一、数据类型的分类 二、计量资料的统计描述 三、SPSS实现计量资料的统计描述 四、计数资料的统计描述 五、统计表与统计图
一、数据类型的分类
1、计量资料 (measurement data)
计数资料和等级资料的SPSS表示
五、统计表与统计图
统计表(statistical table)——数据代替文字描述,便于 统计结果的精确、简洁的表达和对比分析.
统计图(statistical chart)——用图形代替数据,获得直 观、形象的效果.
定义:将统计分析的事物及指 标用表格列出. 特点:避免长篇文字叙述,便 于阅读和对比分析;数据具体.
6
5 11 2 4 3 7
管理员
无 商业 无 无 无 干部
大学
中学 中学 小学 中学 中学 中学
顺产
剖宫产 剖宫产 顺产 助产 助产 剖宫产
足月
足月 足月 早产 早产 足月 足月
计量资料
计数资料
三类资料间关系
例:一组2040岁成年人的血压
<8 低血压 正常血压 轻度高血压 中度高血压 重度高血压
2000386
25
26
农民
无
中学
小学
顺产
顺产
足月
足月
按年龄(2岁一组)与职业整理
年龄 18 20 22 24 26 28 30 32 34 36 38 40 合计 工人 2 9 28 50 50 34 11 14 4 2 3 0 207 管理人员 0 2 7 34 43 35 14 2 2 1 1 0 141 农民 0 6 10 28 25 10 11 3 5 1 1 2 102 商业服务 0 10 24 52 45 34 22 14 3 4 0 0 208 无 3 18 70 153 133 78 39 24 12 5 2 0 537 知识分子 0 0 11 44 70 57 17 3 2 1 1 0 206 总计 5 45 150 361 366 248 114 60 28 14 8 2 1401
1.69
1.7 1.71
…
…
160
1.77
编制频数表,绘制频数分布图
组段 (1) 0.5~ 0.6~ 0.7~ 0.8~ 0.9~ 1.0~ 1.1~ 1.2~ 正 正正 正正 正正正 正正正 正正正正 正正正 划记 (2) 频数,f (3) 3 9 12 13 17 18 20 18 组中值,X ( 4) 0.55 0.65 0.75 0.85 0.95 1.05 1.15 1.25 fX (5)= (3)×(4) 1.65 5.85 9.00 11.05 16.15 18.90 23.00 22.50
2025830 2025677 2025647 2025848 2019915 2025861
22
25 24 30 32 27 29
无
管理人员 知识分子 管理人员 无 无 无
小学
大学 中学 大学 小学 中学 大学
助产
顺产 顺产 顺产 剖宫产 顺产 剖宫产
足月
足月 早产 足月 足月 死产 足月
2024601
2、常用相对数指标
计数资料常用的数据形式是绝对数,如某病的出院人数,治愈人数 等.但绝对数不具可比性,需要计算相对数. 率(rate):说明某现象或某事物发生的频率或强度。 率=(实际发生数/可能发生总数)×比例基数 比例基数:100%、1000‰、10000/万、100000(1/10万)等 如:发病率、死亡率、发生率、阳性率、患病率等 构成比(proportion):说明某一事物内部,各组成部分所占的比 重,也叫百分比。 构成比=(某部分观察单位数/各组成部分观察单位总数)×100% 如:教研室20人中高级职称有5人,占25%。 相对比(relative ratio):是A、B两个有关指标之比,说明A是 B的若干倍或百分之几,通常用倍数或分数表示。如:男:女、医生: 护士、教师:学生
住院期总病 死率(%) (6)=(4)/(2) 47.1 38.5 46.7 40.0 33.3 41.7
表 2-16 1964~1968 年急性心肌梗塞患者的病死率 年份 1964 1965 1966 1967 1968 合计 病例数 17 13 15 15 12 72 死亡例数 住院数 急性期 8 7 5 4 7 6 6 6 4 4 30 27
左(负)偏态分布: 频数最多组段左侧组
段数多.(skewed to the right distribution)
2、集中趋势的描述
统计上使用平均数(average)来反映计量资料的集中趋 势( central tendency ). 常用平均数有: 1. 算术均数(arithmetic mean),简称均数 (mean) 2. 几何均数(geometric mean) 3. 中位数 (median) 4. 百分位数(percentile)
X X 1 X 2 X n X n n
X
f1 X 1 fX 2 fX 3 f k X k fX i f1 f 2 f 3 f k f i
n为奇数 n为偶数
G n X1 X 2 X n
fi lg X i G lg 1 f i
定义:用点的位置,线段的升 降,直条的长短或面积的大小 等形式表达统计资料.
特点:直观,醒目,常给人以深 刻印象.
1、统计表的结构
统计表由以下几个部分组成:
①标题、②标目、③线条、④数字、⑤备注
表2-9 某省某工厂 1994、1998年四项检测指标异常检出率 1994年 检测 指标 受检人数 异常人数 检出率(%) 519 55 10.16 血压 519 44 0.48 心率 TTT 519 36 6.94 GPT 519 20 3.85 1998年 受检人数 异常人数 检出率(%) 582 38 6.52 582 39 6.70 582 23 3.95 582 16 2.75
(修改表)
病死率(% ) 住院期 急性期 47.1 41.2 38.5 30.8 46.7 40.0 40.0 40.0 33.3 33.3 41.7 37.5
备注:
3、统计表的分类
根据分组标目的复杂程度,统计表可大致分为简单表
和复合表。 简单表(simple table):只按一个特征或标志分组。 如表2-8 。 复合表(combinative table) :按两个或两个以上特 征或标志结合起来分组。如表2-9。
3、不良统计表的修改
表 2-15
年份 (1) 1964 1965 1966 1967 1968 合计 病例数 (2) 17 13 15 15 12 72
3、等级资料 (ordinal data)
半定性或半定量的观察结果,有大小顺序,又称有序分类变量. 如 ①癌症分期:早、中、晚。 ②药物疗效:治愈、好转、无效、死亡。 ③尿蛋白: ,,,++,+++及以上
实例数据
住院号 年龄 身高 体重 住院 天数 职业 文化 程度 分娩 方式 妊娠 结局
2025655
第三组病人各年存活及死亡情况
存活数 (3) 9 8 8 9 8 42 住院期死 亡总例数 (4)=(2)+(3) 8 5 7 6 4 30 急性期 死亡数 (5) 7 4 6 6 4 27
(原表)
急性期病 死率(%) (7)=(5)/(2) 41.2 30.8 40.0 40.0 33.3 37.5
例: 率与构成比
白内障 患者年龄 年龄组 受检人数 例数 构成比(%) 患病率(%) ⑴ ⑵ ⑶ ⑷ ⑸=(3)/(2) 560 68 15.18 12.14 40~ 441 129 28.79 29.25 50~ 296 135 30.13 45.61 60~ 149 97 21.65 65.10 70~ ≥80 22 19 4.24 86.36 合计 1468 448 100.00 30.52