2数值变量资料的统计描述PPT课件
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
40~
189
297
24.69
50~
234
531
44.14
60~
386
917
76.23
70~
286
1203
100.00
9
25
正态分布:中间高、
20
15
两边低、左右对称
频数
10
5
0
0.50 0.70 0.90 1.10 1.30 1.50 1.70 1.90
血清甘油三酯(mmol/L)
图2-1 160名正常成年女子的血清甘油三酯的频数分布图
9 4 1
合计
——
130
7
﹡偏态正分偏布态分布
238名正常人发汞值(μg/g)
发汞值 (1) 0.3~ 0.7~ 1.1~ 1.5~ 1.9~ 2.3~ 2.7~ 3.1~ 3.5~ 3.9~
频数 (2) 20 66 60 48 18 16 6 1 0 3
累计频数 (3) 20 86 146 194 212 228 234 235 235 238
= lg–1
∑f lgx
15
n
n
几何均数(geometric mean)
XG n X1X2Xn
lgXG
1 n(lgX1
lgX2
——常用平均数
2. 几何均数 (geometric mean)
﹡表示符号: (G)
﹡应 用: 变量值呈倍数关系;对数正态分布资料。 ﹡计算方法:
直接法 G = n √ x1 ·x2 … xn
G = lg–1 lgx1+lgx2+…+lgxn = lg–1 ∑ lgx
n
n
加权法
G = lg–1
f1lgx1+f2lgx2+…+fklgxk
﹡应 用: 对称分布资料,尤其是正态或近似正 态分布资料
﹡计算方法:
直接法 x=
1+ 2+……+ n n
=
∑
n
加权法 x=
f 1x1 + f 2x2 + ……+f kxk f 1 +f 2+……+f k
Σ:求和符号,读成sigma
∑ fx =f
13
55~58岁健康成人空腹血糖均数和标准差的计算表(加权法)
血糖 频数f 组中值X f X (4)
f X2 (5)
(1) (2) (3)
=(2)×(3) =(3)×(4)
3.60~ 3
3.7
3.80~ 3
3.9
4.00~ 8
4.1
4.20~ 23
4.3
4.40~ 24
4.5
4.60~ 25
4.7
4.80~ 20
4.9
5.00~ 12
5.1
5.20~ 10
5.3
5.40~5.60 4
5.5
11.1
11.2 32.8 98.9 108.0 117.5 98.0 61.2 53.0 22.0
41.07
45.63 134.48 425.27 486.00 552.25 480.20 312.12 280.90 121.00
合计 132(Σf)
614.2(ΣfX) 2878.92 (ΣfX2) 14
正偏态分布:长尾向右延伸;负偏态分布:长尾向左延伸
18
25
16
14
20
12
10
15
人数
病例数
8 10
6
4
5
2
0 12 24 36 48 60 72 84 96 108 120
潜伏期(h)
0 0 5 10 15 20 25 30 35 40 45 50
肌红蛋白含量(ug/mL)
图2-2 59名链球菌咽喉炎患者的潜伏期(h)
• 用来反映各变量值与其频数之间的关系, 并观察资料的分布类型
4
一、频数分布(Distribution of frenquency)表与频数分布图
—— 频数分布表的编制
﹡找全距 ﹡定组距 ﹡写组段
﹡划 记
R=最大值 - 最小值 i =全距 / 组数 第一组组段包括最小值 最后一组组段包括最大值 各组段的观察单位数(频数)
图2-3 101名正常人的血清肌红蛋白含1量0
ห้องสมุดไป่ตู้
❖ 频数分布类型:
①对称分布或近似正态分布:即频数集中位置(或高 峰)在正中,两侧频数分布大致对称;
②偏态分布:即集中位置偏向一侧,频数分布不对称。
若频数集中位置偏向数值小的一侧,为正偏态分布; 若频数集中位置偏向数值大的一侧,为负偏态分布。
不同类型的分布,应采用相应描述指标和统计分 析方法。
累计频率(%) (4)=(3)/238
8.4 36.1 61.3 81.5 89.1 95.8 98.3 98.7 98.7 100.0 8
负偏态分布
某地某年恶性肿瘤死亡数
年龄组(岁) 死亡人数 累计频数 累计频率(%)
0~
5
5
0.42
10~
12
17
1.41
20~
15
32
2.66
30~
76
108
8.98
医学院 预防医学教研室 2020/7/29
11
二、集中趋势(Central tendency) 指标
平均数(average)常用于描述一组计量 变量值的集中趋势,是反映同质资料的平 均水平或集中位置的特征值。
均数
常用平均数 几何均数
中位数 12
1. 算术均数(均数,mean)
﹡表示符号: 总体均数 (μ) 样本均数 (x )
方差、标准差、变异系数
➢正态分布及其应用
医学院 预防医学教研室 2020/7/29
3
• 对一组研究对象进行观察,某变量或指标 (如肺活量)数值出现的次数被称为频数 (frequency);
• 可以将各变量值及其出现的频数编制频 数分布表(frequency distribution table);
数值变量资料
(计量资料) 统计描述(Descriptive Statistics)
2020/7/29
1
标题添加
点击此处输入相 关文本内容
标题添加
点击此处输入相 关文本内容
总体概述
点击此处输入 相关文本内容
点击此处输入 相关文本内容
数值变量资料的统计描述
➢ 频数表与频数分布 ➢平均指标:算术均数、几何均数、中位数 ➢变异指标:极差、百分位数与四分位间距
红细胞数 3.70~ 3.90~ 4.10~ 4.30~ 4.50~ 4.70~ 4.90~ 5.10~ 5.30~ 5.50~ 5.70~5.90
划记
T
|||| 正|||| 正正正 | 正正正正 T 正正正正正 正正正正 | 正正正 | | 正|||| ||||
|
频数 2 4 9
16 22 25 21 17
5
——频数分布的用途:
(1)频数分布的特征描述 ﹡集中趋势:变量值集中分布的位置 ﹡离散趋势:变量值围绕集中位置的
分布情况
(2) 频数分布的类型 ﹡ 对称分布——正态或近似正态分布 ﹡ 非对称分布 ——偏态分布
* 对称分布(正态分布或近似正态分布)
某地区130名正常成年男子红细胞数(1012/L)的频数分布