3.计量资料统计(1)描述
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
2、确定组段数(即组数)、组距: 频数表一般设 8 ~ 15个组段。 组距(class interval) = R / 组段数。往往取近似值。
3、确定组段,列表划记: 每个组段的起点称下限,终点称上限。 第一组段要包括最小值,最后一个组段要包括最大值。 各组段从本组段的“下限”开始,不包括本组段的
“上限”,最末一组段应同时写出其上下限。
计算方法:
l 直接法:当观察单位的个数不多时可直接计算。公式 为:
x x1 x2 xn
X
n
n
l 加权法:当资料中相同观察值的个数较多时,可将相
同观察值的个数,即频数f,乘以该观察值X,以代替相同
观察值逐个相加。
x f1 x1 f 2 x2 f m xm f
f1 f2 fm
第三章 数值变量资料的 统计描述
第一节 数值变量资料的频数表
频数就是观察值的个数。频数分布 就是观察值在其取值范围内分布的情况。 要了解数值变量资料的分布规律,当观 察单位较多时,可编制频数分布表(简称 频数表)和绘制直方图。
一、频数表(equency table)的编制
1、找出观察值中的最大值(Max)、最小值(Min)和极差(R) R=Max—Min
10
125
1250
126~
4
127
508
128~
3
129
397
130~
2
131
262
132~134
1
133
133
合计
110
13194
二、几何均数(geometric mean)
记作G。 该指标适用于: ①变量值呈等比级数关系的资料,如 血清抗体滴度的资料; ②对数正态分布的资料,即某些偏态 分布的资料,当将变量值取对数后又呈现 正态分布的资料。
2.1 110名7岁男童身高(cm)频数表
身高组段
108~ 110~ 112~ 114~ 116~ 118~ 120~ 122~ 124~ 126~ 128~ 130~ 132~134 合计
划记
频数 频率(%) 累计频数
1
0.91
1
3
2.72
4
9
8.18
13
9
8.18
22
15
13.64
37
18
16.36
身高组段 ( 1)
频数, f ( 2)
组中值, X ( 3)
fX ( 4 ) = ( 2 )(3 )
108~
1
109
109
110~
3
111
333
112~
9
113
1017
114~
9
115
1035
116~
15
117
1755
118~
18
119
2142
120~
21
121
2541
122~
14
123
1722
124~
55
21
19.09
76
14
12.73
90
10
9.09
100
4
3.64
104
3
2.72
107
2
1.82
109
1
0.91
110
110
本例,R=24.3(cm) ,i=24.3/10 = 2.43 ,近似取 2 。
累计频率 (%) 0.91 3.64 11.82 20.00 33.64 50.00 69.09 81.82 90.91 94.54 97.27 99.09 100.00
f
加权法用于频数表资料时,式中,f为组段频数,x为 组中值,组中值 = 组段下限 组段上限 。
2
例 2.2 对表2.1资料用加权法求平均身高
计算方法如下:
X 1109 3111 2 1311133 13194 119.95
13 21
110
表 2.2 110名7岁男童身高均数的计算(加权法)
二、频数分布的两个特征
从频数表可以看出频数分布的两个重要特征:
集中趋势(central tendency):身高向中央部分
集中,以中等身高者居多,是为集中趋势。
离散趋势(tendency of dispersion):从中央部分
到两侧频数分布逐渐减少,是为离散趋势。
集中和离散趋势是频数分布的两个重要侧面,
第二节 集中趋势的描述
平 均 数 ( average ) 是 用 于 描 述 一 组同质的定量变量值集中趋势的一系 列指标,它反映一组变量值的平均水 平。医学研究中常用的平均数有算术 均数、几何均数、中位数。
一、算术均数(简称均数mean)
总体均数记作 μ ,样本均数记作 X。 该指标适用于对称分布,尤其是正态 或近似正态分布的资料。
其可较全面地分析所研究的事物。
三、频数分布的类型:
对称分布:集中位置在正中左右两侧频 数分布大体对称,如正态分布。
偏态分布:集中位置偏向一侧,频数分 布不对称。 正偏态分布
负偏态分布
不同类型的分布,应采用相应的统计分析方法。
四、频数表的用途:
1、揭示资料的分布特征和分布类型。 2、便于进一步计算指标和统计分析处理。 3、便于发现某些错误。
例 2.1 某市1982年110名7岁男童的身高(cm)资料
112.4 117.2 122.7 123.0 113.0 108.2 118.2 108.2 118.9 118.1 123.5 118.3 120.3 116.2 114.7 119.7 114.8 119.6 113.2 120.0 119.7 116.8 119.8 122.5 119.7 120.7 114.3 122.0 117.0 122.5 119.8 122.9 128.0 121.5 126.1 117.7 124.1 129.3 121.8 112.7 120.2 120.8 126.6 120.0 130.5 120.0 121.5 114.3 124.1 117.2 124.4 116.4 119.0 117.1 114.9 129.1 118.4 113.2 116.0 120.4 112.3 114.9 124.4 112.2 125.2 116.3 125.8 121.0 115.4 121.2 117.9 120.1 118.4 122.8 120.1 112.4 118.5 113.0 120.8 114.8 123.8 119.1 122.8 120.7 117.4 126.2 122.1 125.2 118.0 120.7 116.3 125.1 120.5 114.3 123.1 122.4 110.3 119.3 125.0 111.5 116.8 125.6 123.2 119.5 120.5 127.1 120.6 132.5 116.3 130.8
3、确定组段,列表划记: 每个组段的起点称下限,终点称上限。 第一组段要包括最小值,最后一个组段要包括最大值。 各组段从本组段的“下限”开始,不包括本组段的
“上限”,最末一组段应同时写出其上下限。
计算方法:
l 直接法:当观察单位的个数不多时可直接计算。公式 为:
x x1 x2 xn
X
n
n
l 加权法:当资料中相同观察值的个数较多时,可将相
同观察值的个数,即频数f,乘以该观察值X,以代替相同
观察值逐个相加。
x f1 x1 f 2 x2 f m xm f
f1 f2 fm
第三章 数值变量资料的 统计描述
第一节 数值变量资料的频数表
频数就是观察值的个数。频数分布 就是观察值在其取值范围内分布的情况。 要了解数值变量资料的分布规律,当观 察单位较多时,可编制频数分布表(简称 频数表)和绘制直方图。
一、频数表(equency table)的编制
1、找出观察值中的最大值(Max)、最小值(Min)和极差(R) R=Max—Min
10
125
1250
126~
4
127
508
128~
3
129
397
130~
2
131
262
132~134
1
133
133
合计
110
13194
二、几何均数(geometric mean)
记作G。 该指标适用于: ①变量值呈等比级数关系的资料,如 血清抗体滴度的资料; ②对数正态分布的资料,即某些偏态 分布的资料,当将变量值取对数后又呈现 正态分布的资料。
2.1 110名7岁男童身高(cm)频数表
身高组段
108~ 110~ 112~ 114~ 116~ 118~ 120~ 122~ 124~ 126~ 128~ 130~ 132~134 合计
划记
频数 频率(%) 累计频数
1
0.91
1
3
2.72
4
9
8.18
13
9
8.18
22
15
13.64
37
18
16.36
身高组段 ( 1)
频数, f ( 2)
组中值, X ( 3)
fX ( 4 ) = ( 2 )(3 )
108~
1
109
109
110~
3
111
333
112~
9
113
1017
114~
9
115
1035
116~
15
117
1755
118~
18
119
2142
120~
21
121
2541
122~
14
123
1722
124~
55
21
19.09
76
14
12.73
90
10
9.09
100
4
3.64
104
3
2.72
107
2
1.82
109
1
0.91
110
110
本例,R=24.3(cm) ,i=24.3/10 = 2.43 ,近似取 2 。
累计频率 (%) 0.91 3.64 11.82 20.00 33.64 50.00 69.09 81.82 90.91 94.54 97.27 99.09 100.00
f
加权法用于频数表资料时,式中,f为组段频数,x为 组中值,组中值 = 组段下限 组段上限 。
2
例 2.2 对表2.1资料用加权法求平均身高
计算方法如下:
X 1109 3111 2 1311133 13194 119.95
13 21
110
表 2.2 110名7岁男童身高均数的计算(加权法)
二、频数分布的两个特征
从频数表可以看出频数分布的两个重要特征:
集中趋势(central tendency):身高向中央部分
集中,以中等身高者居多,是为集中趋势。
离散趋势(tendency of dispersion):从中央部分
到两侧频数分布逐渐减少,是为离散趋势。
集中和离散趋势是频数分布的两个重要侧面,
第二节 集中趋势的描述
平 均 数 ( average ) 是 用 于 描 述 一 组同质的定量变量值集中趋势的一系 列指标,它反映一组变量值的平均水 平。医学研究中常用的平均数有算术 均数、几何均数、中位数。
一、算术均数(简称均数mean)
总体均数记作 μ ,样本均数记作 X。 该指标适用于对称分布,尤其是正态 或近似正态分布的资料。
其可较全面地分析所研究的事物。
三、频数分布的类型:
对称分布:集中位置在正中左右两侧频 数分布大体对称,如正态分布。
偏态分布:集中位置偏向一侧,频数分 布不对称。 正偏态分布
负偏态分布
不同类型的分布,应采用相应的统计分析方法。
四、频数表的用途:
1、揭示资料的分布特征和分布类型。 2、便于进一步计算指标和统计分析处理。 3、便于发现某些错误。
例 2.1 某市1982年110名7岁男童的身高(cm)资料
112.4 117.2 122.7 123.0 113.0 108.2 118.2 108.2 118.9 118.1 123.5 118.3 120.3 116.2 114.7 119.7 114.8 119.6 113.2 120.0 119.7 116.8 119.8 122.5 119.7 120.7 114.3 122.0 117.0 122.5 119.8 122.9 128.0 121.5 126.1 117.7 124.1 129.3 121.8 112.7 120.2 120.8 126.6 120.0 130.5 120.0 121.5 114.3 124.1 117.2 124.4 116.4 119.0 117.1 114.9 129.1 118.4 113.2 116.0 120.4 112.3 114.9 124.4 112.2 125.2 116.3 125.8 121.0 115.4 121.2 117.9 120.1 118.4 122.8 120.1 112.4 118.5 113.0 120.8 114.8 123.8 119.1 122.8 120.7 117.4 126.2 122.1 125.2 118.0 120.7 116.3 125.1 120.5 114.3 123.1 122.4 110.3 119.3 125.0 111.5 116.8 125.6 123.2 119.5 120.5 127.1 120.6 132.5 116.3 130.8