计量资料与计数资料的统计描述.PPT

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

1.3~
1.4~ 1.5~
正正正
正正 正
17
13 9
1.35
1.45 1.55
22.95
18.85 12.40
1.6~
1.7~1.8 合计

8
3 160
1.65
1.75
14.85
5.25 182.30
对称分布:以频数最多组段为中心左
右大体对称.
右(正)偏态分布: 频数最多组段右侧组
段数多.(skewed to the right distribution)
3、相对数应用注意事项
(1) 不能以构成比代替率。 (2) 计算相对数的分母不宜过小, 小则直接叙述。 (3) 进行率的对比分析时,应注意资料可比性。如比较疗 效时,比较组间应病情轻重相同,性别影响,应按性别 分组后再作比较。 (4) 正确求平均率。 例: 若P1=x1/n1 P2=x2/n2 P3=x3/n3 (错误) P=(x1+ x2+ x3)/ n1+ n2+ n3) (正确) P=(P1+ P2+ P3)/3
等级 资料
8 12 15 17
ຫໍສະໝຸດ Baidu计量资料
计数资料
以12kPa为界分为正常与异常两组,统计每组例数
二、计量资料的统计描述
1、频数分布 (frequency distribution)
为了了解数据的分布情况,可以编制频数表(frequency table).
频数表的编制步骤
(1)求极差(range):即最大值与最小值之差,又称为全距。 (2)数据分组: 由样本容量n确定组数、通常分10-15个组; 一般采取等距分 组, 组距=极差/组数。 (3)列出组段:第一组段的下限略小于最小值,最后一个组段上限必须包 含最大值,其它组段上限值忽略。 (4)划记计数:用划记法将所有数据归纳到各组段,得到各组段的频数。
:TTT(麝香草酚浊度试验), :GPT(谷丙转氨酶)。 (丁建生等. 中国卫生统计 1999; 16(3):166 )
2、三线表
表号 标题(包括何时、何地、何事)
横标目的 总标目 横标目 ┋ ┋ ┋ 合 计 总标目 纵标目 ××× ×× ┋ ┋ ××× 纵标目 ××× ×× ┋ ┋ ××× 总 标 目(单位) 纵标目 ××. ×× ×. ×× ┋ ┋ ××. ×× 纵标目 ××. ×× ×. ×× ┋ ┋ ××. ××
2025653
27
22
165
160
71.5
74.0
5
5


中学
小学
顺产
助产
足月
足月
2025830
2022543 2022466 2024535 2025834 2019464 2025783
25
23 25 27 20 24 29
158
161 159 157 158 158 154
68.0
69.0 62.0 68.0 66.0 70.5 57.0
x( n1) / 2 Md xn / 2 x1 n / 2 2
3、离散趋势的描述
反映数据的离散度(Dispersion), 即个体观察值的变异 (variation)程度, 常用的统计指标有:
1. 2. 3. 4. 5.
极差(Range) (全距) 四分位数间距 (Quartile range) 方差(Variance) 标准差(Standard Deviation) 变异系数(Coefficient of Variation)
表2-1: 160名正常成年女子的血清甘油三酯(mmol/L)
编号 1 2 3 4 5 血清甘油三脂 0.51 0.52 0.59 0.61 0.61 编号 … 153 154 155 156 血清甘油三脂 … 1.65 1.66 1.67 1.67
6
7 8
0.62
0.63 0.64
157
158 159
R X max X min
S
四分位间距:QR=P75- P25
X 2 X n
2
n 1
S CV 100% X
三、SPSS实现计量资料的统计描述
四、计数资料的统计描述
1、计数资料数据的整理
住院号
2025655
年龄
27
职业

文化程度
中学
分娩方式
顺产
妊娠结局
足月
2025653
用仪器、工具等测量方法获得的数据,又称数值变量。 特点:有计量单位,如患者的身高(cm),体重(kg),血压(kPa)等.
2、计数资料 (count data)
按某种属性分类计数后得到的数据,又称无序分类变量,有二分 类和多分类两种情形. 特点:无计量单位,如肤色(黑白)、血型(ABO)、职业(工农兵)、 性别(1=男,2=女)等.
医学统计学 (Medical Statistics) 第3讲 计量与计数资料的统计描述
西南交通大学峨眉校区基础课部数学教研室
本讲结构
一、数据类型的分类 二、计量资料的统计描述 三、SPSS实现计量资料的统计描述 四、计数资料的统计描述 五、统计表与统计图
一、数据类型的分类
1、计量资料 (measurement data)
计数资料和等级资料的SPSS表示
五、统计表与统计图
统计表(statistical table)——数据代替文字描述,便于 统计结果的精确、简洁的表达和对比分析.
统计图(statistical chart)——用图形代替数据,获得直 观、形象的效果.
定义:将统计分析的事物及指 标用表格列出. 特点:避免长篇文字叙述,便 于阅读和对比分析;数据具体.
6
5 11 2 4 3 7
管理员
无 商业 无 无 无 干部
大学
中学 中学 小学 中学 中学 中学
顺产
剖宫产 剖宫产 顺产 助产 助产 剖宫产
足月
足月 足月 早产 早产 足月 足月
计量资料
计数资料
三类资料间关系
例:一组2040岁成年人的血压
<8 低血压 正常血压 轻度高血压 中度高血压 重度高血压
2000386
25
26
农民

中学
小学
顺产
顺产
足月
足月
按年龄(2岁一组)与职业整理
年龄 18 20 22 24 26 28 30 32 34 36 38 40 合计 工人 2 9 28 50 50 34 11 14 4 2 3 0 207 管理人员 0 2 7 34 43 35 14 2 2 1 1 0 141 农民 0 6 10 28 25 10 11 3 5 1 1 2 102 商业服务 0 10 24 52 45 34 22 14 3 4 0 0 208 无 3 18 70 153 133 78 39 24 12 5 2 0 537 知识分子 0 0 11 44 70 57 17 3 2 1 1 0 206 总计 5 45 150 361 366 248 114 60 28 14 8 2 1401
1.69
1.7 1.71


160
1.77
编制频数表,绘制频数分布图
组段 (1) 0.5~ 0.6~ 0.7~ 0.8~ 0.9~ 1.0~ 1.1~ 1.2~ 正 正正 正正 正正正 正正正 正正正正 正正正 划记 (2) 频数,f (3) 3 9 12 13 17 18 20 18 组中值,X ( 4) 0.55 0.65 0.75 0.85 0.95 1.05 1.15 1.25 fX (5)= (3)×(4) 1.65 5.85 9.00 11.05 16.15 18.90 23.00 22.50
2025830 2025677 2025647 2025848 2019915 2025861
22
25 24 30 32 27 29

管理人员 知识分子 管理人员 无 无 无
小学
大学 中学 大学 小学 中学 大学
助产
顺产 顺产 顺产 剖宫产 顺产 剖宫产
足月
足月 早产 足月 足月 死产 足月
2024601
2、常用相对数指标
计数资料常用的数据形式是绝对数,如某病的出院人数,治愈人数 等.但绝对数不具可比性,需要计算相对数. 率(rate):说明某现象或某事物发生的频率或强度。 率=(实际发生数/可能发生总数)×比例基数 比例基数:100%、1000‰、10000/万、100000(1/10万)等 如:发病率、死亡率、发生率、阳性率、患病率等 构成比(proportion):说明某一事物内部,各组成部分所占的比 重,也叫百分比。 构成比=(某部分观察单位数/各组成部分观察单位总数)×100% 如:教研室20人中高级职称有5人,占25%。 相对比(relative ratio):是A、B两个有关指标之比,说明A是 B的若干倍或百分之几,通常用倍数或分数表示。如:男:女、医生: 护士、教师:学生
住院期总病 死率(%) (6)=(4)/(2) 47.1 38.5 46.7 40.0 33.3 41.7
表 2-16 1964~1968 年急性心肌梗塞患者的病死率 年份 1964 1965 1966 1967 1968 合计 病例数 17 13 15 15 12 72 死亡例数 住院数 急性期 8 7 5 4 7 6 6 6 4 4 30 27
左(负)偏态分布: 频数最多组段左侧组
段数多.(skewed to the right distribution)
2、集中趋势的描述
统计上使用平均数(average)来反映计量资料的集中趋 势( central tendency ). 常用平均数有: 1. 算术均数(arithmetic mean),简称均数 (mean) 2. 几何均数(geometric mean) 3. 中位数 (median) 4. 百分位数(percentile)
X X 1 X 2 X n X n n

X
f1 X 1 fX 2 fX 3 f k X k fX i f1 f 2 f 3 f k f i
n为奇数 n为偶数
G n X1 X 2 X n
fi lg X i G lg 1 f i
定义:用点的位置,线段的升 降,直条的长短或面积的大小 等形式表达统计资料.
特点:直观,醒目,常给人以深 刻印象.
1、统计表的结构
统计表由以下几个部分组成:
①标题、②标目、③线条、④数字、⑤备注
表2-9 某省某工厂 1994、1998年四项检测指标异常检出率 1994年 检测 指标 受检人数 异常人数 检出率(%) 519 55 10.16 血压 519 44 0.48 心率 TTT 519 36 6.94 GPT 519 20 3.85 1998年 受检人数 异常人数 检出率(%) 582 38 6.52 582 39 6.70 582 23 3.95 582 16 2.75
(修改表)
病死率(% ) 住院期 急性期 47.1 41.2 38.5 30.8 46.7 40.0 40.0 40.0 33.3 33.3 41.7 37.5
备注:
3、统计表的分类
根据分组标目的复杂程度,统计表可大致分为简单表
和复合表。 简单表(simple table):只按一个特征或标志分组。 如表2-8 。 复合表(combinative table) :按两个或两个以上特 征或标志结合起来分组。如表2-9。
3、不良统计表的修改
表 2-15
年份 (1) 1964 1965 1966 1967 1968 合计 病例数 (2) 17 13 15 15 12 72
3、等级资料 (ordinal data)
半定性或半定量的观察结果,有大小顺序,又称有序分类变量. 如 ①癌症分期:早、中、晚。 ②药物疗效:治愈、好转、无效、死亡。 ③尿蛋白: ,,,++,+++及以上
实例数据
住院号 年龄 身高 体重 住院 天数 职业 文化 程度 分娩 方式 妊娠 结局
2025655
第三组病人各年存活及死亡情况
存活数 (3) 9 8 8 9 8 42 住院期死 亡总例数 (4)=(2)+(3) 8 5 7 6 4 30 急性期 死亡数 (5) 7 4 6 6 4 27
(原表)
急性期病 死率(%) (7)=(5)/(2) 41.2 30.8 40.0 40.0 33.3 37.5
例: 率与构成比
白内障 患者年龄 年龄组 受检人数 例数 构成比(%) 患病率(%) ⑴ ⑵ ⑶ ⑷ ⑸=(3)/(2) 560 68 15.18 12.14 40~ 441 129 28.79 29.25 50~ 296 135 30.13 45.61 60~ 149 97 21.65 65.10 70~ ≥80 22 19 4.24 86.36 合计 1468 448 100.00 30.52
相关文档
最新文档