【医学统计学】第4章 定量资料的描述(12-17)
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
图4-1 某市2010年120名正常成年男子红细胞计数值(×1012/L)的频数图
连续型定量资料
20
对称分布
10
30Baidu Nhomakorabea
20
10
0 0.0
250.0
0 2.25 2.50 2.75 3.00 3.25 3.50 3.75 4.00 4.25 4.50 4.75 5.00 5.25 5.50 5.75
4.41 4.90 4.49 5.26 5.69 4.75 5.12 4.06
4.33 5.09 4.85 3.84 5.25 5.39 5.36 3.42
4.58 4.64 5.28 4.17 4.56 5.27 3.86 4.68
【问题4-1】 该资料为何种类型资料? 如何对该资料进行描述?
定量资料的统计描述
5.25 4.66
5.17 4.94
4.68 6.00
4.28 4.86
4.37 4.13
4.43 5.31
3.29
4.31 4.84
4.89 4.20
5.79 5.21
4.91 4.05
4.46 4.97
5.33 5.22
4.02 4.53
4.18
4.09 4.79 5.46 5.13 5.03 4.78 5.86 4.13
定量资料的统计描述
• 连续型定量资料:频数图中各距形是相连的,又称直方图 (histogram)
• 离散型定量资料:频数图中各距形是间隔的,又称直条图(bar graph)
定量资料的统计描述
频率(%)
25
正态分布
20
15
10
5
0
2.6
3.2
3.8
4.4
5.0
5.6
6.2
红细胞计数(×1012/L)
频数分布表(frequency table):由变 量值及其频数编制而成的表
定量资料的统计描述
(一)频数表的编制
1. 求极差(range): 极差又称全距,是指全部观察值中最大值与
最小值之差,用符号R表示 R=xmax-xmin
R 6.183.29 2.89cm
定量资料的统计描述
2. 确定组数和组距
i 2.89 10 0.289 0.30
定量资料的统计描述
3. 确定组段 组段起点称为下限(lower limit) 组段终点称为上限(upper limit) 注意:第一组段必须包含最小值,最后一个组段必须包括最大值,
各组段不能重叠。除最末一个组段需同时写出上下限外,其余组段 只写出其下限
定量资料的统计描述
4. 归组计数,整理成表 用计算机或手工划记法汇总,得到各组段观察单位个数,绘制成频
数分布表
定量资料的统计描述
表4-1 某市2010年120名正常成年男子红细胞计数值(×1012/L)的频数表
组段(×1012/L) (1)
组中值 (2)
3.20~ 3.50~ 3.80~ 4.10~ 4.40~ 4.70~ 5.00~ 5.30~ 5.60~ 5.90~6.20 合计
定量资料的统计描述
3
5.12 4.24
4.91 5.14
4.21 4.78
4.68 4.56
4.92 5.53
4.70 4.89
4.44 4.68
4.83
5.13 5.45
5.14 5.46
3.73 4.32
5.09 3.52
4.87 4.58
4.28 6.18
4.13 5.48
4.11
4.58 4.32
• 由于个体变异的存在,医学研究中某指标在各个体上的观察结果 不是恒定不变的,但也不是杂乱无章的,而是有一定规律的,呈 一定的分布(distribution)
• 将原始数据按照一定的标准划分为若干各组,合计各组的频数, 得到频数分布表;也可再将频数表绘制成频数分布图
一、频数分布表
频数(frequency):一组资料中各观察 值或不同组段内观察值出现的频繁程度 (次数)
本对称
定量资料的统计描述
• 偏态分布(skewed distribution):集中位置(高峰 位置)偏向一侧,两侧频数分布不对称
• 正偏态(positive skew)高峰位置偏向数值小的一 侧
• 负偏态(negative skew)高峰位置偏向数值小的一
正偏态
负偏态
侧
二、频数分布图
•频数分布图(graph of frequency)是以变 量值为横坐标、频数(或频率)为纵坐标 (不等距分组时以频率/组距=频率密度为纵 坐标),以每个等宽的距形面积表示每组的 频数(或频率)
定量资料的统计描述
• 频数分布的两个特征 •集中趋势(central tendency):指一组数 据向某个位置聚集或集中的倾向 • 离散趋势(dispersion):指一组数据的分散 性或变异度
定量资料的统计描述
• 频数分布的类型 • 对称分布(symmetric distribution) :集中位置在中间,左右两侧频数基
(1) 根据研究目的和分析要求灵活确定组
数:
若为计算用,组数可适当增多,
以减少计算误差;若为显示分布特征,则
组数不宜太多或太少, 一般n<50,5~8,
n>50,9~15
(2)确定组距(class interval):相邻两个组段下限之差为组距,一般 采用等距分组。 i=R/ 组数,为了方便资料整理汇总,组距一般取 整数
2 7 17 36 58 82 103 114 118 120 —
累计频率(%) (6)
1.7 5.9 14.2 30.0 48.2 68.3 85.8 95.3 98.0 100.0 —
(二)频数分布表的用途
1. 揭示频数分布的特征 2. 揭示频数分布的类型 3. 便于发现特大或特小的可疑值 4. 便于进一步计算统计指标和进行统计分析
第四章 定量资料的统计描述 Chapter4:Statistic Description
for Quantitative Data
2021/2/8 Monday
1
主要内容
• 频数表与频数图** • 集中趋势的统计描述* • 离散趋势的统计描述* • 正态分布*
定量资料的统计描述
2
第一节 频数表与频数图
3.35 3.65 3.95 4.25 4.55 4.85 5.15 5.45 5.75 6.05 —
频数(f) (3)
2 5 10 19 22 24 21 11 4 2 120
频率(%) (4)
1.7 4.2 8.3 15.8 18.3 20.0 17.5 9.2 3.3 1.7 10.0
累计频数 (5)