离散趋势的指标
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
2
中医药统计学
2012/4/16
四、变异系数 (coefficient of variation , CV) CV) 亦称相对标准差(RSD) 亦称相对标准差(RSD),是标准差 与均数的比值,用百分数表示。 与均数的比值,用百分数表示。
S CV = ×100% x 变异系数没有量纲, 变异系数没有量纲,反映观察值的
∑(x − x)
i
2
n −1 2 ∑(xi − µ)
N
中医药统计学
2012/4/16
频数表资料: 频数表资料:
S=
∑f x
2 i i
−(∑ fi xi ) / ∑ fi
2
∑ f −1
i
xi和fi为各组段的组中值及频数
中医药统计学
2012/4/16
注: 1、方差和标准差越大(小),说明数 方差和标准差越大( 据的变异越大( 据的变异越大(小)。 2、均数与标准差一起描述对称分布, 均数与标准差一起描述对称分布, 特别是正态分布的分布特征。 特别是正态分布的分布特征。 x ± S
中医药统计学
2012/4/16
样本方差为什么除以(n-1)? 样本方差为什么除以( 参数估计中,样本方差是总体方 参数估计中, 差的无偏估计量: 差的无偏估计量:
E(S ) =σ
2
2
要求样本方差公式中除以n 要求样本方差公式中除以n-1。
中医药统计学
2012/4/16
标准差(standard 标准差(standard deviation , S) 方差的算术平方根。 方差的算术平方根。其量纲与观 察值量纲相同。 察值量纲相同。 样本标准差: 样本标准差: S = 总体标准差: 总体标准差: σ =
2012/4/16
MGDP 1355 1512 1634 1879 2287 2939 3923 4854 5576 6079
中医药统计学
MGDP N
Statistics
2012/4/16
46 0 965.4783 213.63991 313.0000 119.00a 1448.9764 2099532.5 2.415 .350 5.248 .688 5960.00 119.00 6079.00 44412.00 191.0000 214.0000 270.8000 313.0000 425.6000 993.0000 1449.2000
2012/4/16
极差可用于说明传染病、 极差可用于说明传染病、食物中 毒等的最短、最长潜伏期等。 毒等的最短、最长潜伏期等。 优点:简单明了、容易使用。 优点:简单明了、容易使用。 缺点: 缺点: 只反映最大值和最小值间的差异, ①只反映最大值和最小值间的差异, 不能反映其他观察值的变异程度; 不能反映其他观察值的变异程度; 样本容量越大,极差可能越大; ②样本容量越大,极差可能越大; 极差的抽样误差大,不稳定。 ③极差的抽样误差大,不稳定。
Q1 Min Q3 Max
中医药统计学
2012/4/16
如果要进行更细致的分析, 如果要进行更细致的分析,可再加 上百分位数P 上百分位数P1,P5,P10,P90,P95, P99
M Q1 P10 P5 P1 Min Q3 P90 P95 P99 Max
中医药统ห้องสมุดไป่ตู้学
2012/4/16
例 某班31名学生某门课程成绩: 某班31名学生某门课程成绩 名学生某门课程成绩: 25,45,50,54,55,61,64,68,72,75,75,78, 79,81,83,84,84,84,85,86,86,86,87,89, 89,89,90,91,91,92,100
单击此处
Mean Std. Error of Mean Median Mode Std. Deviation Variance Skewness Std. Error of Skewness Kurtosis Std. Error of Kurtosis Range Minimum Maximum Sum Percentiles
中医药统计学
2012/4/16
四分位数间距(inter二、四分位数间距(inter-quartile range , QR) 将两端的数据去掉25%, 将两端的数据去掉25%,取中间 50%观察值的数据范围即为四分位 50%观察值的数据范围即为四分位 数间距。 数间距。 记QL=P25,Q2=P50=M, QU=P75 四分位数间距 QR=QU-QL=P75-P25
中医药统计学
2012/4/16
一、极差 二、四分位数间距 三、方差和标准差 四、变异系数
中医药统计学
2012/4/16
例 用三种方法对同一个人连续5天 用三种方法对同一个人连续5 测量血清胆固醇(mg/dl),数据如下: ),数据如下 测量血清胆固醇(mg/dl),数据如下: A法:177、185、191、221、226 177、185、191、221、 B法:177、193、195、209、226 177、193、195、209、 C法:192、197、200、202、209 192、197、200、202、
中医药统计学
2012/4/16
离均差和: ∑(xi − x) = 0 离均差和: 离均差平方和(sum 离均差平方和(sum of square ,SS): ,SS): 2 (∑xi ) 2 2 SS = ∑(xi − x) = ∑xi − n 2 ∑(xi − x) 2 样本方差: 样本方差: S = n −1 2 总体方差: 总体方差: 2 ∑(xi − µ) σ = N
M=84 M=84 Q1=68 Min=25 Q3=89 Max=100 Q1=68 P10=54 P5=45 P1=25 Min=25 Q3=89 P90=91 P95=92 P99=100 Max=100
中医药统计学 1952~1997年我国人均国内生产总值 1952~1997年我国人均国内生产总值
中医药统计学
2012/4/16
注: 1、中位数M与四分位数间距QR一起 中位数M与四分位数间距Q 描述偏态分布资料的变异程度。 描述偏态分布资料的变异程度。 2、确定医学参考值范围。(如95% 确定医学参考值范围。( 。(如 参考值范围P 参考值范围P2.5~P97.5) 3、仍未用到每一个具体的观察值, 仍未用到每一个具体的观察值, 在统计分析中应用不够普遍。 在统计分析中应用不够普遍。
相对变异程度。 相对变异程度。
中医药统计学
2012/4/16
注: 1、比较度量衡单位不同资料的变异 度。 2、比较均数相差悬殊的资料的变异 度。 3、衡量实验精密度和稳定性的常用 指标。 指标。
中医药统计学
2012/4/16
例 144名青年男子的指标 144名青年男子的指标
指标 身高(cm) 身高(cm) 体重(kg) 体重(kg) 指标 红细胞( 红细胞(万/mm3) 白细胞( 白细胞(个/mm3) 均数 170 60 标准差 变异系数 6 3.5% 3.5% 7 11.7% 11.7%
中医药统计学
2012/4/16
方差(variance) 三、方差(variance) 样本观察值的离均差平方和的均 也称均方差(mean 值,也称均方差(mean square deviation , MS) 。表示一组数据的平 MS) 均离散情况。 均离散情况。 2 总体方差: 总体方差:σ 2 样本方差: 样本方差: S
中医药统计学
2012/4/16
五数总括显示如下: 五数总括显示如下:
M=313 M=313 Q1=216 Min=119 Q3=956 Max=6079 Q1=216 P10=165 P5=144 P1=119 Min=119 Q3=956 P90=2939 P95=4854 P99=6079 Max=6079
均数 537.8 7793.0
标准差 变异系数 43.9 8.2% 8.2% 176.1 2.3% 2.3%
中医药统计学
2012/4/16
五数总括 在探索性分析中, 在探索性分析中,主为最有代表 性的能反映数据重要特征的是五个 中位数M 下四分位数Q 数:中位数M、下四分位数Q1、上 四分位数Q 最小值Min, 四分位数Q3,最小值Min,最大值 Max。 Max。 M
中医药统计学
2012/4/16
第三章 计量资料的 统计描述
中医药统计学
2012/4/16
第三节 描述离散 趋势的指标
中医药统计学
2012/4/16
变异是指一组性质相同的资料 观察值参差不齐的现象, 观察值参差不齐的现象,变异度的 大小与中心位置一样, 大小与中心位置一样,是描述一组 资料特征的重要指标。 资料特征的重要指标。
2012/4/16
例 前例A、B、C三法的极差分别 前例A 为:
RA = 226 −177 = 49(mg / dl) RB = 226 −177 = 49(mg / dl) RC = 209 −192 =17(mg / dl)
可见A 可见A、B两法波动大,C法波动小。 两法波动大, 法波动小。
中医药统计学
中医药统计学
2012/4/16
样本方差为什么除以(n-1)? 样本方差为什么除以( 自由度(degree 自由度(degree of freedom , df ): n个变量中可以独立(自由)取值的 个变量中可以独立(自由) 变量的个数。 变量的个数。 样本方差公式中受离均差和等于 一个条件的限制, 零 ∑(xi − x) = 0 一个条件的限制,所以 自由度为df= 自由度为df=n-1。
xA = xB = xC = 200
中医药统计学
2012/4/16
极差(range ,R) 一、极差(range ,R) 全距, 全距,一组数据最大值和最小值 之差。 之差。
R = xmax − xmin
极差大,说明变异程度大,反之, 极差大,说明变异程度大,反之, 变异程度小。 变异程度小。
中医药统计学
Valid Missing
20 25 40 50 60 75 80
a. Multiple modes exist. The smallest value is shown
中医药统计学
2012/4/16
结果分析: 结果分析: 由于偏度2.415, 由于偏度2.415,数据分布图形显 著右偏;峰度5.248, 著右偏;峰度5.248,数据分布的右 端有许多极端值。标准差1448.98, 端有许多极端值。标准差1448.98, 超过了均数965.48, 超过了均数965.48,说明数据的分散 性相当大。数据严重偏态。 性相当大。数据严重偏态。 由于改革开放,特别是近10年来 年来, 由于改革开放,特别是近10年来, 我国人均生产总值增长很快, 我国人均生产总值增长很快,因此 出现上述数据分布特点。 出现上述数据分布特点。
中医药统计学
2012/4/16
例 前例A、B、C三法的标准差。 前例A 三法的标准差。 ∑ A法: xi =177 +185+191+ 221+ 226 =1000
xi2 =1772 +1852 +1912 + 2212 + 2262 = 201952 ∑
B法 : C法 :
201952 −10002 / 5 SA = = 22.1(mg / dl) 5−1 2 201360 −1000 / 5 SB = =18.4(mg / dl) 5−1 200158−1000 / 5 SC = = 6.28(mg / dl) 5−1
年份 1952 1953 1954 1955 1956 1957 1958 1959 1960 1961 1962 1963 MGDP 119 142 144 150 165 168 200 216 218 185 173 181 年份 1964 1965 1966 1967 1968 1969 1970 1971 1972 1973 1974 1975 MGDP 208 240 254 235 222 243 275 288 292 309 310 327 年份 1976 1977 1978 1979 1980 1981 1982 1983 1984 1985 1986 1987 MGDP 316 339 379 417 460 489 525 580 692 853 956 1104 年份 1988 1989 1990 1990 1992 1993 1994 1995 1996 1997
中医药统计学
2012/4/16
四、变异系数 (coefficient of variation , CV) CV) 亦称相对标准差(RSD) 亦称相对标准差(RSD),是标准差 与均数的比值,用百分数表示。 与均数的比值,用百分数表示。
S CV = ×100% x 变异系数没有量纲, 变异系数没有量纲,反映观察值的
∑(x − x)
i
2
n −1 2 ∑(xi − µ)
N
中医药统计学
2012/4/16
频数表资料: 频数表资料:
S=
∑f x
2 i i
−(∑ fi xi ) / ∑ fi
2
∑ f −1
i
xi和fi为各组段的组中值及频数
中医药统计学
2012/4/16
注: 1、方差和标准差越大(小),说明数 方差和标准差越大( 据的变异越大( 据的变异越大(小)。 2、均数与标准差一起描述对称分布, 均数与标准差一起描述对称分布, 特别是正态分布的分布特征。 特别是正态分布的分布特征。 x ± S
中医药统计学
2012/4/16
样本方差为什么除以(n-1)? 样本方差为什么除以( 参数估计中,样本方差是总体方 参数估计中, 差的无偏估计量: 差的无偏估计量:
E(S ) =σ
2
2
要求样本方差公式中除以n 要求样本方差公式中除以n-1。
中医药统计学
2012/4/16
标准差(standard 标准差(standard deviation , S) 方差的算术平方根。 方差的算术平方根。其量纲与观 察值量纲相同。 察值量纲相同。 样本标准差: 样本标准差: S = 总体标准差: 总体标准差: σ =
2012/4/16
MGDP 1355 1512 1634 1879 2287 2939 3923 4854 5576 6079
中医药统计学
MGDP N
Statistics
2012/4/16
46 0 965.4783 213.63991 313.0000 119.00a 1448.9764 2099532.5 2.415 .350 5.248 .688 5960.00 119.00 6079.00 44412.00 191.0000 214.0000 270.8000 313.0000 425.6000 993.0000 1449.2000
2012/4/16
极差可用于说明传染病、 极差可用于说明传染病、食物中 毒等的最短、最长潜伏期等。 毒等的最短、最长潜伏期等。 优点:简单明了、容易使用。 优点:简单明了、容易使用。 缺点: 缺点: 只反映最大值和最小值间的差异, ①只反映最大值和最小值间的差异, 不能反映其他观察值的变异程度; 不能反映其他观察值的变异程度; 样本容量越大,极差可能越大; ②样本容量越大,极差可能越大; 极差的抽样误差大,不稳定。 ③极差的抽样误差大,不稳定。
Q1 Min Q3 Max
中医药统计学
2012/4/16
如果要进行更细致的分析, 如果要进行更细致的分析,可再加 上百分位数P 上百分位数P1,P5,P10,P90,P95, P99
M Q1 P10 P5 P1 Min Q3 P90 P95 P99 Max
中医药统ห้องสมุดไป่ตู้学
2012/4/16
例 某班31名学生某门课程成绩: 某班31名学生某门课程成绩 名学生某门课程成绩: 25,45,50,54,55,61,64,68,72,75,75,78, 79,81,83,84,84,84,85,86,86,86,87,89, 89,89,90,91,91,92,100
单击此处
Mean Std. Error of Mean Median Mode Std. Deviation Variance Skewness Std. Error of Skewness Kurtosis Std. Error of Kurtosis Range Minimum Maximum Sum Percentiles
中医药统计学
2012/4/16
四分位数间距(inter二、四分位数间距(inter-quartile range , QR) 将两端的数据去掉25%, 将两端的数据去掉25%,取中间 50%观察值的数据范围即为四分位 50%观察值的数据范围即为四分位 数间距。 数间距。 记QL=P25,Q2=P50=M, QU=P75 四分位数间距 QR=QU-QL=P75-P25
中医药统计学
2012/4/16
一、极差 二、四分位数间距 三、方差和标准差 四、变异系数
中医药统计学
2012/4/16
例 用三种方法对同一个人连续5天 用三种方法对同一个人连续5 测量血清胆固醇(mg/dl),数据如下: ),数据如下 测量血清胆固醇(mg/dl),数据如下: A法:177、185、191、221、226 177、185、191、221、 B法:177、193、195、209、226 177、193、195、209、 C法:192、197、200、202、209 192、197、200、202、
中医药统计学
2012/4/16
离均差和: ∑(xi − x) = 0 离均差和: 离均差平方和(sum 离均差平方和(sum of square ,SS): ,SS): 2 (∑xi ) 2 2 SS = ∑(xi − x) = ∑xi − n 2 ∑(xi − x) 2 样本方差: 样本方差: S = n −1 2 总体方差: 总体方差: 2 ∑(xi − µ) σ = N
M=84 M=84 Q1=68 Min=25 Q3=89 Max=100 Q1=68 P10=54 P5=45 P1=25 Min=25 Q3=89 P90=91 P95=92 P99=100 Max=100
中医药统计学 1952~1997年我国人均国内生产总值 1952~1997年我国人均国内生产总值
中医药统计学
2012/4/16
注: 1、中位数M与四分位数间距QR一起 中位数M与四分位数间距Q 描述偏态分布资料的变异程度。 描述偏态分布资料的变异程度。 2、确定医学参考值范围。(如95% 确定医学参考值范围。( 。(如 参考值范围P 参考值范围P2.5~P97.5) 3、仍未用到每一个具体的观察值, 仍未用到每一个具体的观察值, 在统计分析中应用不够普遍。 在统计分析中应用不够普遍。
相对变异程度。 相对变异程度。
中医药统计学
2012/4/16
注: 1、比较度量衡单位不同资料的变异 度。 2、比较均数相差悬殊的资料的变异 度。 3、衡量实验精密度和稳定性的常用 指标。 指标。
中医药统计学
2012/4/16
例 144名青年男子的指标 144名青年男子的指标
指标 身高(cm) 身高(cm) 体重(kg) 体重(kg) 指标 红细胞( 红细胞(万/mm3) 白细胞( 白细胞(个/mm3) 均数 170 60 标准差 变异系数 6 3.5% 3.5% 7 11.7% 11.7%
中医药统计学
2012/4/16
方差(variance) 三、方差(variance) 样本观察值的离均差平方和的均 也称均方差(mean 值,也称均方差(mean square deviation , MS) 。表示一组数据的平 MS) 均离散情况。 均离散情况。 2 总体方差: 总体方差:σ 2 样本方差: 样本方差: S
中医药统计学
2012/4/16
五数总括显示如下: 五数总括显示如下:
M=313 M=313 Q1=216 Min=119 Q3=956 Max=6079 Q1=216 P10=165 P5=144 P1=119 Min=119 Q3=956 P90=2939 P95=4854 P99=6079 Max=6079
均数 537.8 7793.0
标准差 变异系数 43.9 8.2% 8.2% 176.1 2.3% 2.3%
中医药统计学
2012/4/16
五数总括 在探索性分析中, 在探索性分析中,主为最有代表 性的能反映数据重要特征的是五个 中位数M 下四分位数Q 数:中位数M、下四分位数Q1、上 四分位数Q 最小值Min, 四分位数Q3,最小值Min,最大值 Max。 Max。 M
中医药统计学
2012/4/16
第三章 计量资料的 统计描述
中医药统计学
2012/4/16
第三节 描述离散 趋势的指标
中医药统计学
2012/4/16
变异是指一组性质相同的资料 观察值参差不齐的现象, 观察值参差不齐的现象,变异度的 大小与中心位置一样, 大小与中心位置一样,是描述一组 资料特征的重要指标。 资料特征的重要指标。
2012/4/16
例 前例A、B、C三法的极差分别 前例A 为:
RA = 226 −177 = 49(mg / dl) RB = 226 −177 = 49(mg / dl) RC = 209 −192 =17(mg / dl)
可见A 可见A、B两法波动大,C法波动小。 两法波动大, 法波动小。
中医药统计学
中医药统计学
2012/4/16
样本方差为什么除以(n-1)? 样本方差为什么除以( 自由度(degree 自由度(degree of freedom , df ): n个变量中可以独立(自由)取值的 个变量中可以独立(自由) 变量的个数。 变量的个数。 样本方差公式中受离均差和等于 一个条件的限制, 零 ∑(xi − x) = 0 一个条件的限制,所以 自由度为df= 自由度为df=n-1。
xA = xB = xC = 200
中医药统计学
2012/4/16
极差(range ,R) 一、极差(range ,R) 全距, 全距,一组数据最大值和最小值 之差。 之差。
R = xmax − xmin
极差大,说明变异程度大,反之, 极差大,说明变异程度大,反之, 变异程度小。 变异程度小。
中医药统计学
Valid Missing
20 25 40 50 60 75 80
a. Multiple modes exist. The smallest value is shown
中医药统计学
2012/4/16
结果分析: 结果分析: 由于偏度2.415, 由于偏度2.415,数据分布图形显 著右偏;峰度5.248, 著右偏;峰度5.248,数据分布的右 端有许多极端值。标准差1448.98, 端有许多极端值。标准差1448.98, 超过了均数965.48, 超过了均数965.48,说明数据的分散 性相当大。数据严重偏态。 性相当大。数据严重偏态。 由于改革开放,特别是近10年来 年来, 由于改革开放,特别是近10年来, 我国人均生产总值增长很快, 我国人均生产总值增长很快,因此 出现上述数据分布特点。 出现上述数据分布特点。
中医药统计学
2012/4/16
例 前例A、B、C三法的标准差。 前例A 三法的标准差。 ∑ A法: xi =177 +185+191+ 221+ 226 =1000
xi2 =1772 +1852 +1912 + 2212 + 2262 = 201952 ∑
B法 : C法 :
201952 −10002 / 5 SA = = 22.1(mg / dl) 5−1 2 201360 −1000 / 5 SB = =18.4(mg / dl) 5−1 200158−1000 / 5 SC = = 6.28(mg / dl) 5−1
年份 1952 1953 1954 1955 1956 1957 1958 1959 1960 1961 1962 1963 MGDP 119 142 144 150 165 168 200 216 218 185 173 181 年份 1964 1965 1966 1967 1968 1969 1970 1971 1972 1973 1974 1975 MGDP 208 240 254 235 222 243 275 288 292 309 310 327 年份 1976 1977 1978 1979 1980 1981 1982 1983 1984 1985 1986 1987 MGDP 316 339 379 417 460 489 525 580 692 853 956 1104 年份 1988 1989 1990 1990 1992 1993 1994 1995 1996 1997