集中趋势、离散趋势的描述
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
k X fkk
本组下限+下组下限 X 2
k:频数表的组段数, 组中值。
2014-12-2
f :频数, X:
延安大学医学院计量资料统计描述
28
例: 利用下表计算101名正常成年女子的血 总胆固醇的均数。
组 段 (1) 2.30~ 2.60~ 2.90~ 3.20~ 3.50~ 3.80~ 4.10~ 4.40~ 4.70~ 5.00~ 5.30~ 5.60~5.90 合 计
常数A;每个观察值都乘以一个常数B,则均数为
原均数的B倍。
2014-12-2 延安大学医学院计量资料统计描述 30
(二) 几何均数(geometric mean)
意义:N个数值的乘积开N次方即为这N 个 数的几何均数。 表示:G = n x1x2...xn = ㏒-1 ∑ ㏒X
n
应用:原始数据分布不对称,经对数转换 后呈对称分布的资料或资料呈倍数增加的 变量值。例如抗体滴度。
2.35 4.78 X 101
2014-12-2
3.91
4.03(mmol/L)
27
延安大学医学院计量资料统计描述
(2)加权法(利用频数表)
公式 :
f1 X1 f 2 X 2 f3 X 3 f k X k fX X f1 f 2 f3 f k f
10
4.划记并统计频数
逐一划记
L X U
2014-12-2
延安大学医学院计量资料统计描述
11
101名正常成年女子的血清总胆固醇(mmol/L)频数分布
组 段
(1) 2.30~ 2.60~ 2.90~ 3.20~ 3.50~ 3.80~ 4.10~ 4.40~ 4.70~ 5.00~ 5.30~ 5.60~5.90 合 计
段
频 数 f
(2) 1 0 0 0 17 20 17 12 9 0 0 8 101
2014-12-2
延安大学医学院计量资料统计描述
20
4.提供分组数据,便于进一步计算统 计描述指标和统计分析
2014-12-2
延安大学医学院计量资料统计描述
21
2014-12-2
延安大学医学院计量资料统计描述
22
2014-12-2
延安大学医学院计量资料统计描述
31
1、计算方法 (1)直接计算法
公式:
或
G X1 X 2
n
1
Xn
G lg
lg X ( ) n
32
2014-12-2
延安大学医学院计量资料统计描述
例:某地5例微丝蚴血症患者治疗七年后用间
接荧光抗体试验测得其抗体滴度倒数分别为:
10,20,40,40,160,求几何均数。
数值变量资料的统计分析
樊 霞
2013.3
2014-12-2
延安大学医学院计量资料统计描述
1
基本内容
统计描述 计量资料
频数分布 集中趋势 离散趋势 统计图表
统计推断
抽样误差 标准误 t u F检验 秩和检验
应
用
正常值范围估计 可信区间的估计
计数资料
相关与回归
相对数及其 标准化 统计图表 r b 统计图表
2014-12-2
延安大学医学院计量资料统计描述
7
制表步骤:
1. 求极差(range) 极差也称全距,
即最大值和最小值之差,记作R。本例
R 5.71 2.35 3.36(mmol/L)
2014-12-2
延安大学医学院计量资料统计描述
8
2.确定组距(i) : 通常取组数为 10-15组,本例组距
果如下,
2.35 4.78 3.91 4.15 3.60 4.50 3.30 4.06 4.15
2014-12-2
4.21 3.95 4.59 4.55 3.51 3.27 4.73 5.26 4.36
3.32 3.92 4.19 4.80 4.06 4.52 4.17 5.25 4.95
5.35 3.58 2.68 3.41 3.07 3.19 5.13 3.98 3.00
u 、 2检验 秩和检验
t 检验
2014-12-2
延安大学医学院计量资料统计描述
2
本章在临床资料处理中的用途
资料整理阶段,判断资料适合何种方法
分析的初步阶段,对变量的特点进行描述 (求出均数和标准差)为假设检验做准备
2014-12-2
延安大学医学院计量资料统计描述
3
计量资料的统计描述
2.揭示计量资料分布的重要特征
集中趋势:是指频数向中间组段集中(所有的观 察值以某一数值为中心,即频数分布有一个高 峰)。 离散趋势:是指频数由中间组段向两侧逐渐减少 (观察值又不同程度地偏离集中位置)。
2014-12-2
延安大学医学院计量资料统计描述
19
3.便于发现一些特大或特小的可疑值
组
(1) 2.30~ 2.60~ 2.90~ 3.20~ 3.50~ 3.80~ 4.10~ 4.40~ 4.70~ 5.00~ 5.30~ 5.60~5.90 合 计
13.5
19.5
25.5
31.5
37.5
43.5.
血清转氨酶(mmol/L)
图2-2 115名正常成年女子血清转氨酶的频数分布
115名正常成年女子血清转氨酶(mmol/L)含量分布
转氨酶含量 12~ 15~ 18~ 21~ 24~ 27~ 30~ 33~ 36~ 39~ 42~45
2014-12-2 延安大学医学院计量资料统计描述
血 清 总 胆 固 醇(mmol/L)
图 2 - 1 101 名 正 常 成 年 女 子 血 清 总 胆 固 醇 的 频 数 分
2014-12-2
延安大学医学院计量资料统计描述
14
(2)偏态分布 :
1)正偏态分布:高峰位置偏左,右侧的
组段数多于左侧的组段数,频数向右侧拖尾。
25 20
人数
15 10 5 0
血 清 总 胆 固 醇(mmol/L)
101 名 正 常 成 年 女 子 血 清 总 胆 固 醇 的 频 数 分 布
(三)频数分布表和频数分布图的用途
1.描述频数分布的类型
频 数
25 20
(1)对称分布
:若
15 10 5 0 2.45 3.05 3.65 4.25 4.85 5.45 6.10
各组段的频数以频数最多 组段为中心左右两侧大体 对称,就认为该资料是对 称分布。
延安大学医学院计量资料统计描述
5
问题:
1. 这是什么类型的资料? 2. 这些正常成年女子的血清总胆固醇值有 什么特征? 3. 如何描述这些正常成年女子的血清总胆 固醇?
2014-12-2
延安大学医学院计量资料统计描述
6
一、数值变量资料的频数分布 (一)频数分布表(frequency table)
f
频数 (2) 1 3 6 8 17 20 17 12 9 5 2 1 101
1´2.45 3´2.75 L1´5.75 409.75 X 4.06(mmol/L) 1 3L 1 101
2014-12-2 延安大学医学院计量资料统计描述 29
2、知识点:
①均数应用于呈正态分布或近似正态分布的计量资 料。 ②当资料呈正态分布时,均数位于分布的中心。 ③每个观察值都加一个常数A,则均数为原均数加
wenku.baidu.com
i 3.36 /10 0.336 0.30
2014-12-2
延安大学医学院计量资料统计描述
9
3.划分组段:
组下限(L):每 个组段的起点 组上限(U):每
组
第1组段
第2组段 …
段
2.30~
2.60~ …
…
最后组段
…
5.60~5.90
个组段的终点
2014-12-2
延安大学医学院计量资料统计描述
4.17 3.66 4.52 4.12 3.55 4.59 3.78 5.03 3.26
4.13 4.28 4.91 3.95 4.23 3.75 4.57 3.51
2.78 3.26 3.18 5.08 3.57 3.98 3.80 3.86
4.26 3.50 3.68 4.53 4.83 4.13 3.93 3.02
人 2 9 14 23 19 14 11 9 7 4 3
数
16
2 )负偏态分布:高峰位置偏右, 左侧的
组段数多于右侧的组段数,频数向左侧拖尾。
25 20
人 数
15 10 5 0 2.5 12.5 22.5 32.5 42.5 52.5 血 清 肌 红 蛋 白(μ g / m L) 图 2-3 101 名 正 常 人 血 清 肌 红 蛋 白 的 频 数 分 布
(5)=(2)×(3)2 6.00 22.69 55.82 89.78 226.48 312.05 307.06 248.43 211.70 132.61 59.41 33.06 1705.09
2014-12-2
延安大学医学院计量资料统计描述
12
(二)频数分布图(直方图)
25 20
频 数
15 10 5 0 2.45 3.05 3.65 4.25 4.85 5.45 6.10
3.58 2.70 4.83 3.92 3.52 4.26 3.78 3.70
4.34 4.61 3.87 3.58 3.84 3.63 3.99 4.33
4.84 4.41 4.75 2.91 3.95 3.91 5.35 4.50 3.87 4.48 3.84 3.96 5.71 4.28
3.29 3.25
2014-12-2
延安大学医学院计量资料统计描述
23
二、平均水平(集中趋势)指标
统计上使用平均数(average)这一指标体
系来描述一组变量值的集中位置或平均水平。
常用的平均数有:
算术均数
几何均数 中 位 数
2014-12-2
众 数 调和均数
延安大学医学院计量资料统计描述
24
(一)算术均数
算术均数:简称均数(mean)
意义:反映一组性质相同、呈对称分布的
观察值在数量上的平均水平或者说是集中
位置的特征值。
表示符号:(总体) (样本) X
适用的资料:呈正态分布或近似正态分布
2014-12-2
延安大学医学院计量资料统计描述
25
1、计算方法 (1)直接计算法
公式 :
X1 X 2 X n
Xn
X n
频数 f
(2) 1 3 6 8 17 20 17 12 9 5 2 1 101
组中值, X (3) 2.45 2.75 3.05 3.35 3.65 3.95 4.25 4.55 4.85 5.15 5.45 5.75 —
fX
fX 2
(4)=(2)×(3) 2.45 8.25 18.30 26.80 62.05 79.00 72.25 54.60 43.65 25.75 10.90 5.75 409.75
2014-12-2
延安大学医学院计量资料统计描述
26
例: 用直接法计算某单位101名正常成年女子的血清总胆
固醇的均数。
2.35 4.78 3.91 4.15 3.60 4.50 3.30 4.06 4.15 4.21 3.95 4.59 4.55 3.51 3.27 4.73 5.26 4.36 3.32 3.92 4.19 4.80 4.06 4.52 4.17 5.25 4.95 5.35 3.58 2.68 3.41 3.07 3.19 5.13 3.98 3.00 4.17 3.66 4.52 4.12 3.55 4.59 3.78 5.03 3.26 4.13 4.28 4.91 3.95 4.23 3.75 4.57 3.51 2.78 3.26 3.18 5.08 3.57 3.98 3.80 3.86 4.26 3.50 3.68 4.53 4.83 4.13 3.93 3.02 3.58 2.70 4.83 3.92 3.52 4.26 3.78 3.70 4.34 4.61 3.87 3.58 3.84 3.63 3.99 4.33 4.84 4.75 3.95 5.35 4.50 3.87 4.48 3.29 4.41 2.91 3.91 3.84 3.96 5.71 4.28 3.25
2014-12-2
延安大学医学院计量资料统计描述
17
101名正常人的血清肌红蛋白含量分布
肌红蛋白含量 0~ 5~ 10~ 15~ 20~ 25~ 30~ 35~ 40~ 45~50
2014-12-2 延安大学医学院计量资料统计描述
g/mL
人 数 2 3 7 9 10 22 23 14 9 2
18
G
5
10 ´ 20 ´ 40 ´ 40 ´160 34.8
是用统计图表和统计指标来描述资料的分布规 律及其数量特征。
本章的主要内容:
数值变量资料描述性指标
正态分布及其应用
2014-12-2
延安大学医学院计量资料统计描述
4
第一节 计量资料的统计描述
例:从某单位2011年的职工体检资料中随机获得101名
正常成年女子的血清总胆固醇(mmol/L )的测量结