第十六章 数值变量资料的统计分析之统计描述

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

四分位数间距
• 四分位数间距,用Q表示:

Q=
P75 P25
四分位数间距越大,说明变异度 越大;反之,说明变异度越小。
2.应用条件 适用于呈对称分布或近似对称
分布的资料。
3.计算方法 ⑴直接法 :变量值个数不多 公式为
x
x
1

x
2
... n
x
n
x n
⑵加权法 :
公式为
n ≥100
x


某年某市120名12岁健康男孩身 高(cm)资料如下表,求其平均数。
120名12岁男孩身高(cm)资料
142.3 134.5 145.2 151.1 141.2 156.6 148.8 141.8 144.0 141.5 142.7 134.4 146.8 145.4 148.8 145.7 148.8 135.1 146.2 140.1 138.2 137.9 150.3 143.3 150.6 141.6 151.3 133.1 156.3 139.5 142.5 140.8 142.7 141.9 146.4 130.5 149.8 143.9 140.7 143.8 132.1 143.6 142.4 145.9 150.0 135.5 149.0 139.6 144.4 142.1
140.2
138.7 137.4 145.4 139.9
1.计算全距(极差)R=最大值-最小值 2.确定组距 ①确定组段数:8~15组 ②确定组距 :组距i =全距/组段数 3.划分组段
4.统计频数
120名12岁男孩身高(cm)资料的频数分布
组段 (1) 125~ 129~ 133~ 137~ 141~ 145~ 149~ 153~ 157~161 划记 (2) 一 止 正止 正正正正正下 正正正正正正正 正正正正正丁 正正一 止 — 合计
142.3 134.5 145.2 156.6 148.8 141.8 142.7 134.4 146.8 145.7 148.8 135.1 138.2 137.9 150.3 141.6 151.3 133.1 142.5 140.8 142.7 130.5 149.8 143.9 132.1 143.6 142.4 135.5 149.0 139.6
143.5
134.7 150.8 125.9① 160.9② 134.7 129.4
139.2
147.3 144.5 132.7 154.2 138.5 142.5
144.7
138.1 137.1 152.9 137.9 138.9 141.2
139.3
140.2 147.1 147.9 139.9 137.7 148.9
示,求该疫苗的抗体平均滴度。
(三)中位数和百分位数
中位数
1.定义 将一组变量值按大小顺序排列, 位次居中的变量值即为中位数。
符号 用M表示
2.适用条件
① 变量值中出现特小或特大的数值 ② 资料的分布呈明显偏态 ③ 变量值分布一端或两端无确定数值,只有 小于或大于某个数值 ④ 资料的分布类型不清


PX X% (100-X)%
2.计算方法 i Px Lx (n x% f L ) fx
L:Px 所在组段下限 i:组距
n:总例数
f:Px所在组段频数
fL:小于L的各组段累计频数
145例食物中毒病人潜伏期分布表
潜伏期(小时) (1) 频数f (2) 累计频数 (3) 累计频率(%) (4 )
141.9
137.4 142.9 141.8 149.7 138.5 154.0
147.8
145.1 134.9 141.4 147.5 139.6 147.7
140.5
145.8 143.6 140.9 136.9 143.5 152.3
138.9
147.9 142.3 141.4 148.1 142.9 146.6
平均水平指标仅描述一组数据的集中趋势,可作为总体均 数的一个估计值。由于变异的客观存在,需要一类指标描 述资料的离散趋势。 常用指标: 全距,四分位数间距,方差,标准差,变异系数
极差(又称全距)
概念
是一组变量值中最大值与最小值之
差,反映一组变量值的变异范围。
符号
以符号R表示
公式
R=最大值-最小值
科学出版社卫生职业教育出版分社
---
1 4 9 28 35 27 11 4 1
=120
127 524 1215 3892 5005 3969 1661 620 159
= 17172
f
fx
(二)几何均数
1.定义 将n个变量值的乘积开n次方所
得的根即为几何均数。
符号 用G表示
2.适用条件:

数值变量呈倍数关系或呈对数正态 分布,如抗体效价、抗体滴定度、疾 病潜伏期
0~ 6~ 12~ 18~ 24~ 30~ 36~ 42~
17 46 38 32 6 0 4 2
17 63 101 133 139 139 143 145
11.7 43.4 69.6 91.7 95.9 95.9 98.6 100.0
合计
145
——
——
求P25和P75
P25=6+(6/46)(145×25%-17) =8.51(小时) P75=18+(6/32)(145×75%-101) =19.45(小时)
3.计算方法
⑴直接法 • 当变量值个数为奇数时计算公式为
M=
X n 1
2
当变量值个数为偶数时计算公式为

• 某地11例某传染病患者,其潜伏期(天)
分别为2,2,4,3,5,6,3,8,9,
11,15,求其平均潜伏期。

• 如上例资料在第21天又发生1例该传染病患 者,其平均潜伏期又为多少? 先将变量值按从小到大的顺序排列:2,2,
——
• 可确定中位数所在组段是12~,故L=12,i=6,
fm=38,n=145, 代入公式,得 = 63 f L。 f
L
M=12+(6/38)×(145 ×50%-63)
=13.5(小时)
百分位数
1.定义 指将n个观察值从小到大依次排列,再把它分成 100等份,对应于 x%位的数值即为第x百分位数。 • 中位数是第50百分位数,用P50表示。 • 第25,第75,第95百分位数记为P25, P75 • P95是统计学上常用的指标。
148.9
146.7 143.3 146.7 144.0 146.5 139.2
142.4
143.4 140.2 138.7 137.4 145.4 139.9
120名12岁男孩身高(cm)资料的频数分布
组段 (1) 125~ 129~ 133~ 137~ 141~ 145~ 149~ 153~ 157~161 划记 (2) 一 止 正止 正正正正正下 正正正正正正正 正正正正正丁 正正一 止 — 合计
3,3,4,5,6,8,9,11,15,21。
⑵频数表法
计算步骤4
计算中位数
计算步骤3
确定中位数所在的组段
计算步骤2
编制中位数计算表
计算步骤1
编制频数表
计算公式
i n ( f L ) fm 2

• 现有145例食物中毒病人,其潜伏 期分布如下表的第(1)(2)栏,
求中位数 。
145例食物中毒病人潜伏期分布表
3.计算某抗体滴度的平均水平,一般宜选择 A.算术均数 B.几何均数 C.中位数 D.百分位数 答案:B
描述呈倍数关系的数值变量的指标是 A.算术均数 B.几何均数 C.中位数 D.百分位数 答案:B
三、离散趋势指标(掌握)
离散趋势指标(掌握)
• 三组同龄男孩体重(kg)如下:
甲组 乙组 丙组 90 95 100 105 110 96 98 100 102 104 96 99 100 101 104 均数=100 (cm) 均数=100 (cm) 均数=100 (kg)
练习题
1.适用于对称分布或近似对称分布的资料的 平均数为 A.算数均数 B.几何均数 C.中位数 D.百分位数 答案:A
Βιβλιοθήκη Baidu
描述正态分布资料集中趋势的指标是( ) A.中位数 B.几何均数 C.算术平均数 D.标准差 答案:C
(全国2011年4月高等教育自学考试预防医学(二)试题)
2.描述一组偏态分布资料的平均水平,下列 哪个指标较好 A.算术均数 B.几何均数 C.百分位数 D.中位数 答案:D
潜伏期(小时) (1) 频数f (2) 累计频数 (3) 累计频率(%) (4 )
0~ 6~ 12~ 18~ 24~ 30~ 36~ 42~
合计
17 46 38 32 6 0 4 2
145
17 63 101 133 139 139 143 145
——
11.7 43.4 69.6 91.7 95.9 95.9 98.6 100.0
147.1
147.9 139.9 137.7 148.9
142.9
141.8 149.7 138.5 154.0
134.9
141.4 147.5 139.6 147.7
143.6
140.9 136.9 143.5 152.3
142.3
141.4 148.1 142.9 146.6
143.3
146.7 144.0 146.5 139.2
140.7
143.8 138.9 147.9
145.9
150.0 148.9 146.7
144.4
142.1 142.4 143.4
150.8
125.9① 160.9② 134.7 129.4
144.5
132.7 154.2 138.5 142.5
137.1
152.9 137.9 138.9 141.2
第十六章 数值变量资料的统计 分析
江海东
学习目的和要求
掌握: 1.集中趋势指标的计算与应用意义 2.离散趋势指标的计算与应用意义 3.数值变量资料的t检验★ 熟悉: 1.总体均数的区间估计 2.假设检验的意义和步骤 了解:数值变量资料的统计描述中频数表的制作
第一节 数值变量资料的统计描述
一、编制频数表(了解) 120名12岁男孩身高(cm)资料
f
频数f (3) 1 4 9 28 35 27 11 4 1
=120
120名12岁健康男孩身高(cm)均数的加权法计算
组段 (1) 组中值x (2) 频数 f (3) fx (4)=(2)×(3)
125~ 129~ 133~ 137~ 141~ 145~ 149~ 153~ 157~161
合计
127 131 135 139 143 147 151 155 159
f
频数f (3) 1 4 9 28 35 27 11 4 1
=120
二、集中趋势指标(掌握)
• 数值变量资料的集中趋势指标用平均数来 描述。 • 常用的平均数有算数均数、几何均数、中 位数
(一)算数均数
1、定义
将各观察值相 加后除以观察 值个数所得的 商即为算术均 数。
总体均数用希 腊字母 表 示 样本均数用 x 表示
优点: ①表示变异范围,简单明了; ②各种分布类型的资料均可用。
缺点:
①只用到最大、最小值,样本信息没能充分利用,
不能反映所有数据的变异程度。
②受样本含量影响较大,样本例数越多,R可能
越大,2组观察值例数悬殊时不用R比较。
③样本含量不变时,每次抽样得到的极差值相差
较大,R稳定性较差。
练习题
关于极差的描述错误的是 A.极差值大,离散度就大 B.极差可以反映所有数据的变异大小 C.极差受样本含量的影响较大 D.极差只能粗略的说明变量值的变动范围 答案:B
甲组 乙组 丙组
90 95 100 105 110 96 98 100 102 104 96 99 100 101 104
均数=100 (cm) 均数=100 (cm) 均数=100 (kg)
• R甲=110-90=20( cm ) • R乙=104-96=8( cm ) • R丙= 104-96=8( cm )
151.1
141.2 143.5 134.7
144.0
141.5 139.2 147.3
145.4
148.8 144.7 138.1
146.2
140.1 139.3 140.2
143.3
150.6 141.9 137.4
156.3
139.5 147.8 145.1
141.9
146.4 140.5 145.8
3.计算

• 5人的血清滴度分别为1:2、1:4、 1:8、1:16、1:32,求平均滴度。
二、几何均数(几何平均数)
⑵加权法:变量值个数较多或变量值 为频数表资料
f lg x G lg ( ) f
1
例2-4
• 某年某市100名儿童接种某种疫苗后,
测定抗体滴度的资料如第(1)、(2)列所
相关文档
最新文档