第4章 定量资料的统计描述20150909

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

Skewness=0.979
图4.2某年某地一次伤寒暴发潜伏期频数表
总结:分布形式与分布特征
频数
对称分布
正偏态分布
负偏态分布
测量 指标

集中趋势(central tendency)
一组数据向某一个位置聚集或集中的倾向 该集中位置,反映一组数据的平均水平
分布形式与分布特征
频数
对称分布
正偏态分布
Skewness=0.979
图4.2某年某地一次伤寒暴发潜伏期频数表
70 60 50 频数 40 30 20 10 0 25 35 45 55 65 75 85 95
Skewness=−1.036
图4.3 219名乳腺癌患者康复期生存质量评分
频数表和直方图的用途

频数分布类型(分布形式)

揭示频数分布特征
负偏态分布
测量 指标

离散趋势(dispersion tendency)
各个数据背离集中位置的倾向 反映一组数据的分散性或变异度
总结

统计描述:是用统计图 (表 )、统计指标来描 述群体的分布特征
资料的初步分析
思考与讨论1

频数表、直方图是揭示资料分布形式的工具
其编制条件是什么?
当数据量较小时,应如何说明资料的分布形式?
思考与讨论2

在分布形式中,主要讨论了单峰分布,即只 存在一个集中位置
实际工作中会不会存在“多峰分布”? 如何理解和处理“多峰分布”?
李晓松主编. 医学统计学(第3版). 北京: 高等教育出版社, 2014.
第 二 节
2018年10月18日星期四
复习:频数分布特征

集中趋势(central tendency):一组数据向某 一个位置聚集或集中的倾向
99
125 136
3140~
3170~ 3200~ 3230~3260 合 计
11
4 3 1 155
7.10
2.58 1.94 0.65 100.00
147
151 154 155 —
94.84
97.42 99.35 100.00 —
内容提要
频数分布表 频数分布图 频数表和直方图的用途
直方图(historgram)
5 3 4 4 7 5 4 5 6 5 5 5 5 5 2 6 6 3 7 7 4 6 6 6 6 5 7 8 4 5 4 5 5 6 4 5 5 8 4 8 8 4 5 4 4 5 4 5 7 2 6 3 4 4 5 5 7 7 5 6 7 6 4 6 7 2 6 7 7 5 6 5 6 5 7 6 5 6 6 5 5 7 6 9 6 5 5 5 3 6 3 7 3 6 4 6 5 5 3 6 5 5
集中趋势
离散趋势

便于进一步计算指标和统计处理

便于发现某些特大或特小的可疑值
图4.1 155名6月龄婴儿SOS值的频数分布

集中趋势(central tendency)
一组数据向某一个位置聚集或集中的倾向
该集中位置,反映一组数据的平均水平
30 25 20 频数 15 10 5 0 4 6 8 10 12 14 16 18 20 22
Skewness=0.979
图4.2某年某地一次伤寒暴发潜伏期频数表
图4.1 155名6月龄婴儿SOS值的频数分布

离散趋势(dispersion tendency)
各个数据背离集中位置的倾向 反映一组数据的分散性或变异度
30 25 20 频数 15 10 5 0 4 6 8 10 12 14 16 18 20 22
偏态分布:频数分布不对称,发生频数最多的
位置偏向一侧

正偏态分布 (positively skewed) :发生频数最多的位 置偏向数值小的一侧 负偏态分布(negatively skewed) :发生频数最多的位 置偏向数值大的一侧

图4.1 155名6月龄婴儿SOS值的频数分布
30 25 20 频数 15 10 5 0 4 6 8 10 12 14 16 18 20 22
定量变量的统计描述

原始资料
以个体为对象收集的数据——排列杂乱无章
很难发现、总结出群体的特征和规律

分组整理,用简明扼要的形式来全面反映资 料(群体)的特点
频数分布表 频数分布图
李晓松主编. 医学统计学(第3版). 北京: 高等教育出版社, 2014.
第 一 节
2018年10月18日星期四
离散型定量变量频数表

取值为某实数范围区间的特定值

以变量取值为分组标志,并列出相应频数
表4.1 2005年某市102名高中男生引体向上完成次数的频数分布
完成次数 2 频数f 3 频率(%) 2.94 累计频数 3 累计频率(%) 2.94
3
4 5 6 7
7
16 33 24 14
6.86
15.69 32.35 23.53 13.73
众数(Mo)—较少使用
均数(Mean)


是算术均数(arithmetic mean)的简称
表示符号

总体均数用表示 样本均数用 X 表示
计算方法
X 1 … X n X X n n
均数(Mean)
图4.1 155名6月龄婴儿SOS值的频数分布
3054 3137 x 155
例4.1

抽样调查 2005 年某市 102 名高中男生引体向 上完成次数
5 3 4 4 7 5 4 5 6 5 5 5 5 5 2 6 6 3 7 7 4 6 6 6 6 5 7 8 4 5 4 5 5 6 4 5 5 8 4 8 8 4 5 4 4 5 4 5 7 2 6 3 4 4 5 5 7 7 5 6 7 6 4 6 7 2 6 7 7 5 6 5 6 5 7 6 5 6 6 5 5 7 6 9 6 5 5 5 3 6 3 7 3 6 4 6 5 5 3 6 5 5
内容提要
频数分布表 频数分布图 频数表和直方图的用途
频数分布表

频数表(frequency table)—分组整理
分组:将资料按照某种属性(分组标志)划分成不
同的组别,也称为组段
频数 (frequency) :统计不同组别内发生的观察
值个数
定量变量的统计描述

抽样调查 2005 年某市 102 名高中男生引体向 上完成次数
集中位置

说明数据的平均水平或中心位置
常作为群体中最有代表性的值与其它群体进行比较
频数
对称分布
正偏态分布
负偏态分布
测量 指标
集中位置的刻画指标

集中位置的刻画指标:平均数(Average),根 据计算方法和适用场合的不同,分为:
均数(mean) 几何均数(geometric mean) 中位数(median)
内容提要
频数分布表 频数分布图 频数表和直方图的用途
频数表和直方图的用途

频数分布类型(分布形式)

揭示频数分布特征
集中趋势
离散趋势

便于进一步计算指标和统计处理

便于发现某些特大或特小的可疑值
频数分布类型

频数的分布是否对称
对称分布:发生频数最多的位置在正中,左右
两侧频数分布大致对称
频数( f )
1 3 6 8 22 26 33 26 11
频率(%)
0.65 1.94 3.87 5.16 14.19 16.77 21.29 16.77 7.10
累计频数 1
4 10 18 40 66
累计频率(%)
0.65 2.58 6.45 11.61 25.81 42.58 63.87 80.65 87.74
众数(mode)
众数(mode)

是一组数据中出现次数最多或频率最高的数
用Mo表示
1 2 3 3 4 5 6
缺点:可能不唯一、没有众数,较少使用
1
1
2
2
3
3
3
4
4
5
4
6
6
7
集中位置的刻画指标

集中位置的刻画指标:平均数(Average),根 据计算方法和适用场合的不同,分为:
均数(mean) 几何均数(geometric mean) 中位数(median)
3055
474334 3060.2(m/s) 155
均数的特点

优点
计算简单、容易理解
均衡考虑了每个个体值的信息,利用信息全面 一组单峰对称分布资料中最有代表性的值
总体均数是正态分布的一个重要参数
频数
( X ) 0 ( X ) ( X a)
图4.1 155名6月龄婴儿SOS值的频数分布
累计频率图
100 90 80 70
累计频率(%)
60 50 40 30 20 10 0 2870 2900 2930 2960 2990 3020 3050 3080 3110 3140 3170 3200 3230 3260 SOS(m/s)
图4.1 155名6月龄婴儿SOS值的累计频率分布图
纵标目
数字区
底线
9 合计
自学“第21章
统计分析结果的正确表达”
例4.2

为了解婴儿的骨强度情况,某医院用定量超声骨强度仪对 155名 6月龄足月正常婴儿测定了胫骨中段骨骼的超声传播 速度(speed of sound, SOS, 单位为m/s),资料如下。
3054 3137 2999 3056 3127 3041 3052 3105 3182 3141 3083 2947 3151 3000 3194 3014 3063 2983 2968 3091 3101 3049 2984 3056 3034 3059 2947 3062 3093 2957 3120 3073 3029 3164 3115 2879 3084 3052 2965 3156 3034 3041 3130 3040 3044 3070 3076 3111 3082 3045 3103 3092 3145 3022 3052 3023 3036 3024 3064 3000 3029 3060 3017 3154 2995 3004 3008 3047 3008 3058 2908 3146 3081 3107 2981 2998 3071 3025 3011 3055 2923 3103 3061 3222 3056 3076 3128 3104 3050 3050 3004 3066 3100 3159 3054 3207 3018 3095 3049 2963 3119 2958 3095 3018 3069 3056 2900 2930 3159 3156 3109 2992 3076 3079 3100 2968 2954 3087 3103 2995 3081 3043 3043 3060 3016 3254 3032 3053 2997 3186 3165 3072 3204 3004 2989 2998 3177 2992 3088 3024 3046 3116 3022 3007 3045 3048 3107 3058 3095 3088 3129 3108 3043 3052 3117
3. 确定组距i:等距划分,i=R/a
4. 确定组段:不重不漏(穷尽互斥)、半闭半开 [Li, Ui)
5. 统计频数,编制成表
5. 统计各组段频数,计算频率和累计频率
表4.2 155名6月龄婴儿SOS值(m/s)的频数分布
组段
2870~ 2900~ 2930~ 2960~ 2990~ 3020~ 3050~ 3080~ 3110~
10
26 59 83 97
9.80
25.49 57.84 81.37 95.10
分布范围 集中组段
频数分布形 式是否对称
8
9 合计
4
1 102
3.92
0.98 100.00
101
102 —
99.02
100.00 —
标题 顶线 纵标目 下横线 横标目
表4.1 2005年某市102名高中男生引体向上完成次数的频数分布 完成次数 2 3 4 5 6 7 8 频数 3 7 16 33 24 14 4 1 102 频率(%) 2.94 6.86 15.69 32.35 23.53 13.73 3.92 0.98 100.00 累计频数 3 10 26 59 83 97 101 102 — 累计频率(%) 2.94 9.80 25.49 57.84 81.37 95.10 99.02 100.00 —
2
2
均数的特点
连续型定量变量的频数表

其值可以取在某个实数范围区间的任意值, 即在某个实数范围区间连续存在 人为分割成若干个组段,再求频数

连续型定量变量的频数表
1. 求全距R (range,也称极差):R=Max-Min
2. 确定组数a:经验法,一般观察对象在50以下时
可分5~8组,在50以上时可分9~15组
相关文档
最新文档