第3章 统计描述

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

P24
图3-4 右偏态分布、左偏态分布示意图
偏态分布: 右偏态分布(right-skewed distribution) 、 正偏态分布(positive-skewed distribution); 左偏态分布(left-skewed distribution)、 负偏态分布(negative-skewed distribution)。
图3-1 162例健康成年男性血清总胆固醇频数分布图
(4)计算各组段频数(frequency)
(5)计算各组段频率(percent) (6)计算累计频数(cumulative frequency) 和累计频率(cumulative percent)
从表3-1频数分布表可以看出: 中间五个组段内集中了较多的观察
值,而两端组段含有较少的观察值。
2. 计量资料的频数分布图
2. 计数资料和等级资料的频数分布图 条图 (bar chart)
图3-2 120名大学生性别的来自百度文库数分布图
P25
图3-3 35名大学生心理抑郁状况的频数分布图
P25
三、频数分布表的作用
对计数资料和等级资料来说,频数分布 表淸楚地显示了各分类观察值出现的频 率大小,为资料的描述提供了数据基本 特征,便于作进一步的统计推断分析。
计量资料频数分布表编制步骤:
(1)计算全距 (range, R)
R=Max-Min=6.34-2.72=3.62(mmol/L)
(2)确定组段数与组距:
样本量在100左右时,取8 ~15组为宜。
组距 ≈ R / 组段数 本例:R= 3.62,如果取组段数=10, 则组距=3.62/10 =0.362≈0. 35。 实际得到11个不重叠的组段。
(3)确定组段的上下限: 第一组段必须包括Min,最后一组段 必须包括Max。前一组的上限是后一 组的下限。等距。
仅最后一组段包含下限和上限,其余 各组段只包含下限,不包含上限。
表3-1 162例成年男性血清总胆固醇(mmol/L)频数分布表 组段(mmol/L) (1) 2.70~ 3.05~ 3.40~ 3.75~ 4.10~ 4.45~ 4.80~ 5.15~ 5.50~ 5.85~ 6.20~6.55 合计 频数 (2) 2 3 8 16 27 45 29 18 9 4 1 162 频率(%) (3) 1.23 1.85 4.94 9.88 16.67 27.78 17.90 11.11 5.56 2.47 0.62 100.00 累计频数 (4) 2 5 13 29 56 101 130 148 157 161 162 — 累计频率(%) (5) 1.23 3.09 8.02 17.90 34.57 62.35 80.25 91.36 96.91 99.38 100.00 —
如果类别数较多,先按观察值的顺序 合并成较少的组,再按上法制表。
例3-2 对某地35名大学生作了心理抑郁状况检 査,其检测评分结果分别为:5,5,5,5,4, 4, 4, 3 , 3 , 3, 3, 3 , 2, 2, 2, 2, 2, 2 , 2, 2, 2, 2 , 1, 1, 1 , 1, 1, 1, 1, 0, 0, 0, 0,0。试绘制这 35 名大学生心理抑郁状况的 频数分布表。
直接计算各观察值的频数、频率、
累计频数和累计频率,列于表中。
表3-2 120名大学生性别的频数分布表
性别 男 女 合计 频数 50 70 120 频率(%) 41.67 58.33 100.00 累计频数 50 120 — 累计频率(%) 41.67 100.00 —
等级资料:
如果类别数不多,按计数资料频数分 布表的方法编制,再按照取值的顺序 列在一个表中。
对计量资料来说,频数分布表的作用:
1. 揭示计量资料的分布特征。 2. 描述计量资料分布的集中趋势和离散趋势。 3. 易于发现数据中远离群体数据的离群值。
四、频数分布图的作用 比频数分布表更直观地 揭示数据分布类型。
数据的分布类型: 对称分布 (symmetric distribution)、 偏态分布(skewed distribution)。
直方图(histogram) 与频数分布表一样,直观地 描述计量资料的频数分布。
图3-1 162例健康成年男性血清总胆固醇频数分布图
P24
二、计数资料和等级资料的频数分布
1. 频数分布表 2. 频数分布图
二、计数资料和等级资料的频数分布
1. 频数分布表 2. 频数分布图
计数资料编制频数分布表方法:
第三章 统计描述
第一节 频数分布
一、计量资料的频数分布 1. 频数分布表 2. 频数分布图
例3-1 某医生收集某区162例健康成年男性血清总胆固醇 (mmol/L)资料,测定结果如下,试编制频数分布表。 5.53 4.34 5.60 3.55 4.13 3.93 4.20 4.35 4.31 4.81 5.80 4.08 4.90 4.92 3.94 6.34 4.89 4.16 3.05 4.50 4.48 3.62 4.52 3.97 4.11 4.37 5.26 4.98 2.72 5.39 3.75 3.70 4.94 3.90 6.10 4.56 4.39 4.09 3.76 4.82 4.69 4.02 4.54 3.78 5.33 4.44 4.53 4.50 3.79 4.28 4.53 4.55 5.20 4.49 5.57 4.21 4.88 4.44 4.96 4.70 4.57 4.45 4.33 3.53 4.84 4.10 3.84 5.11 4.45 5.65 4.47 5.01 4.21 4.56 3.89 4.73 4.86 5.10 4.67 5.40 3.22 4.98 3.52 4.11 3.82 3.59 5.02 4.66 5.23 5.05 4.23 4.68 4.90 5.00 4.75 2.96 4.74 4.35 4.71 4.85 5.25 4.25 5.14 4.29 3.39 4.72 3.43 5.08 5.17 4.96 5.21 4.27 6.12 4.91 5.43 4.93 4.87 4.46 4.26 4.76 4.69 4.79 5.22 4.61 4.78 4.24 4.51 4.71 4.56 3.86 4.45 5.29 4.50 4.72 4.00 4.54 4.20 5.30 5.18 5.73 4.97 4.66 5.49 4.37 5.34 4.68 3.66 4.38 5.41 4.53 5.07 4.78 4.69 4.71 5.03 5.37 5.68 5.83 5.93 4.62 6.01 5.77
解:表3-3给出的是35名大学生心理抑郁状况 的频数分布表。
表3-3 35名大学生心理抑郁状况的频数分布表
心理抑郁状况分组 正常组(0或1) 临界值(2或3) 抑郁组(4或5) 合计 频数 12 15 8 35 频率(%) 34.28 42.86 22.86 100.00 累计频数 12 27 35 — 累计频率(%) 34.28 77.14 100.00 —
相关文档
最新文档