第三讲 数据的整理和统计描述

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

一、频数表 例2.1
某地用随机抽样方法检查了140名正常成年男子
的红细胞数,检测结果如表2-1所示:
表 2.1 某地 140 名正常成年男子的红细胞数(×1012/L)
4.76 5.00 5.24 4.33 4.95 4.81 5.05 4.52 4.76 4.62 4.48 4.71
5.26 4.73 4.97 4.83 5.07 4.54 4.40 4.64 4.88 4.73 4.59 5.21
第二章
定量资料的统计描述
第一节 频数分布表
统计描述:是用统计图表、统计指标来 描述资料的分布规律及其数量特征。 频数分布表(frequency distribution table):主要由组段和频数两部分组成表 格。
二、频数分布表的编制
• 编制步骤 : • 1. 计算全距 (range): 一组变量值最大值和 最小值之差称为全距(range),亦称极差,常 用R表示。 • 2. 确定组距(class interval): 组距用i表 示; • 3. 划分组段: 每个组段的起点称组下限,终 点称组上限。一般分为8~15组。 ; • 4. 统计频数: 将所有变量值通过划记逐个归 入相应组段 ; • 5.频率与累计频率: 将各组的频数除以n所得 的比值被称为频率。累计频率等于累计频数除 以总例数。
4.77 4.63 5.24 5.60 4.58 4.82 5.05 4.15 5.15 4.63 4.49
4.88 5.50 4.98 4.46 5.07 4.93 4.79 4.65 4.50 4.36 4.22
编制频数表步骤:
1. 计算全距(range,R)、极差。 R = 最大值-最小值 = 5.95-3.82=2.13(×1012/L)
某小学四年级50名女生的身高资料如下, 请编制频数表和直方图
• 128,136,134,139,132,143,136, 133,135,134,138,135,145,139 , • 136,139,136,146,137,138,140, • 138,135,144,129,135,138,137, • 136,144,142,143,137,137,137, 138,137,129,130,132,137,137, 141,137,138,141,140,131,130, 133
第一节 统计资料的类型
医学统计资料按研究指标的性质一般分为定量 资料、定性资料和等级资料三大类。
一、定量资料
定量资料(quantitative data) 亦称计量资 料(measurement data),是用定量的方法测 定观察单位(个体)某项指标数值的大小,所 得的资料称定量资料。如身高(㎝)、体重 (㎏)、脉搏(次/分)、血压(kPa)等为数 值变量,其组成的资料为定量资料。
4.92 4.40 4.63 4.87 5.49 4.59 4.82 4.68 4.16 4.78 4.64
4.27 5.27 5.51 4.99 5.22 5.08 4.94 4.80 5.04 4.51 4.75
4.77 4.63 5.24 5.60 4.58 4.82 5.05 4.15 5.15 4.63 4.49
晰的印象。
2.统计图的结构
▲标题:其作用是简明扼要地说明资料的内 容、时间和地点,一般位于图的下方中央 位置并编号,便于说明。 ▲图域:即制图空间,除圆图外,一般用直 角坐标系第一象限的位置表示图域,或者 用长方形的框架表示。
2.统计图的结构
▲标目:分为纵标目和横标目,表示纵轴和 横轴数字刻度的意义,一般有度量衡单位。 ▲图例:对图中不同颜色或图案代表的指标 注释。图例通常放在横标目与标题之间, 如果图域部分有较大空间,也可以放在图 域中。
表 2-2 某地 140 名正常成年男子的 红细胞数的频数表
红细胞数
( ×1012/L) (1)
划记 (2)
频数 (fi) (3) 2 6 11 25 32 27 17 13 4 2 1 140
3.80~ 4.00~ 4.20~ 4.40~ 4.60~ 4.80~ 5.00~ 5.20~ 5.40~ 5.60~ 5.80~6.00 合计
2.避免内容混杂,表达不清,结构混乱。若标目层次多 于四个以上,统计表就会变得繁冗,尽量少用。
表12-4
存在问题
▲ 标题不够明确,而且未注明时间、地点。
▲ 发病季节、年龄和职业三项指标无可比性,放在一 起,内容繁杂。 ▲ 标目设计不合理,“人数”、“%”多次重复,不 便于比较分析。
▲ 表内文字和线条过多。内容较多,层次复杂,表格
5.61 4.47 4.71 4.56 4.80 3.82 4.14 4.37 4.61 4.47 5.09 4.94
5.95 5.34 4.44 5.44 5.30 4.01 5.01 4.87 3.97 4.58 5.20 4.68
4.46 4.70 4.94 4.79 4.65 4.89 4.37 4.60 4.08 4.70 5.32 5.17
2. 确定组段数(组数)、计算组距。
组段数为11 组距≈极差/ (预计的组段数) 本例组距= 2.13/11≈0.20。 3. 划分组段、划记、计算频数 确定各组段的下限(low limit):每个组段的起点。 两端的组段应分别包含最小值和最大值;各组段不能重叠,
每一
组段均为闭开区间,上限一般不列出。
2. 复合表
统计表的主语有两个以上层次
如表12-2。将老人的年龄和性别结合起来分组,可以分析 不同年龄、性别的老年人的死亡率和死亡百分比。
三、编制统计表的注意事项
1. 统计表不一定是唯一的,同一份数据经过标目重排或
分解组合,可以根据需要构造不同形式的统计表,如表122也可以转换成表12-3,便于将男女的死亡率、死亡百分比 放在一起对比。也可以把复合表分解为多个简单表。
4.57 4.81 5.05 4.91 4.77 4.62 5.24 4.72 4.58 4.81 5.05 4.91
4.31 4.93 4.78 4.26 4.50 5.12 4.60 4.83 4.31 4.55 4.41 5.02
5.18 5.04 4.52 4.38 5.37 4.85 4.71 5.33 4.05 4.28 4.52 4.76
4.46 4.70 4.94 4.79 4.65 4.89 4.37 4.60 4.08 4.70 5.32 5.17
4.57 4.81 5.05 4.91 4.77 4.62 5.24 4.72 4.58 4.81 5.05 4.91
4.31 4.93 4.78 4.26 4.50 5.12 4.60 4.83 4.31 4.55 4.41 5.02
wenku.baidu.com 三、等级资料
等级资料(ranked data)亦称有序分类 资料(ordinal categorical data),是 将观察单位按属性的等级分组,清点各组 的观察单位数,所得的资料为等级资料。 如治疗结果分为治愈、显效、好转、无效 四个等级。
根据需要,各类变量可以互相转化。 若按贫血的诊断标准将血红蛋白分为 四个等级:重度贫血、中度贫血、轻 度贫血、正常,可按等级资料处理。 有时亦可将定性资料或等级资料数量 化,如将等级资料的治疗结果赋以分 值,分别用0、1、2…等表示,则可按 定量资料处理。 如调查某人群的尿糖的情况,以人 为观察单位,结果可分—、±、+、 ++、+++五个等级。
5.26 4.73 4.97 4.83 5.07 4.54 4.40 4.64 4.88 4.73 4.59 5.21
5.61 4.47 4.71 4.56 4.80 3.82 4.14 4.37 4.61 4.47 5.09 4.94
5.95 5.34 4.44 5.44 5.30 4.01 5.01 4.87 3.97 4.58 5.20 4.68
中数据罗列无条理,较难读懂。
可以将其分为三个表,表12-5、12-6、12-7,具体修改如下。
例12.2 某医院用麦牙根糖浆治疗急慢性 肝炎161例,疗效资料如表12-8,指出其 缺点并加以改进。
问题: 标题过于简单;主谓安排不合理,标目 组合重复。可进行如下修改,见表12-9。
第二节
统计图
一、统计图的制作原则和结构
1. 统计图的制作原则 ▲必须根据资料的性质、分析目的选用适当的统计图,由于统计图 不能精确地显示数据大小,所以经常需要与统计表一起使用。 ▲一个图一般只表达一个中心内容,表达一个主题,即一个统计指 标。 ▲绘制图形应注意准确、美观,图线粗细应用适当,定点准确,不 同事物用不同线条(实线、虚线、点线)或颜色表示,给人以清
第二节
统计表与统计图
(Statistical Table & Statistical Graph)

统计表(statistical table)是表
达统计分析结果中数据和统计指标的
表格形式;
▲统计图(statistical graph)是用点、
线、面等各种几何图形来形象化表达 统计数据。
第一节
▲数字: 用 阿拉伯 数字表示 。 无数字用 “—”表示,缺失数字用“ ”表示,数 值为 0 者记为“ 0”,不要留空项。数字按 小数位对齐。 ▲备注:表中数字区不要插入文字,也不列
备注项。必须说明者标“*”号,在表下方
说明。
二、统计表的种类
1.简单表 统计表的主语只有一个层次
如表 12-1, 每一行可用一个完整的句子表 达 , 第 一 行 可 读 为 “ 某 地 1988 年 老 年 人 口 60~年龄组死亡率为19.61‰,死亡百分比为 16.60%”。
正 一 正正 一 正正正正正 正正正正正正 正正正正正 正正正 正正
一 140
二、直方图
频数
35 30 25 20 15 10 5 0 3.80~ 4.20~ 4.60~ 5.00~ 5.40~ 5.80~6.00
男子的红细胞数(× 10 12 /L)
图 2.1 某地140名正常成年男子的红细胞计数的直方图
5.18 5.04 4.52 4.38 5.37 4.85 4.71 5.33 4.05 4.28 4.52 4.76
4.92 4.40 4.63 4.87 5.49 4.59 4.82 4.68 4.16 4.78 4.64
4.27 5.27 5.51 4.99 5.22 5.08 4.94 4.80 5.04 4.51 4.75
二、定性资料
定性资料(qualitative data) 亦称计 数 资 料 ( enumeration data ) 或 分 类 资 料 ( categorical data ),是将观察单位按某种 属性或类别分组,清点各组的观察单位数,所 得的资料称定性资料。 定 性 资 料 的 观 察 指 标 为 分 类 变 量 ( categorical variable )。如人的性别按男、 女分组;化验结果按阳性、阴性分组;动物实 验按生存、死亡分组;调查某人群的血型按 A 、 B、O、AB分组等,观察单位出现的结果为分类 变量,分类变量没有量的差别,只有质的不同, 其组成的资料为定性资料。
4.88 5.50 4.98 4.46 5.07 4.93 4.79 4.65 4.50 4.36 4.22
当观察例数较多时,资料通常要分组编成频数表。
表 2.1 某地 140 名正常成年男子的红细胞数(×1012/L)
4.76 5.00 5.24 4.33 4.95 4.81 5.05 4.52 4.76 4.62 4.48 4.71
统计表
一、统计表的编制原则和结构
1.编制原则 ◆重点突出,简单明了 ◆主谓分明,层次清楚 ◆数据准确、可靠,文字和线条尽量从简
2.结构 ▲ 标题:概括表的主要内容,包括研究的时间、地
点和研究内容,放在表的上方。
▲标目:分别用横标目和纵标目说明表格每行和每
列数字的意义,注意标明指标的单位。
▲线条:至少用三条线,表格的顶线和底线 将表格与文章的其它部分分隔开来,纵标 目下横线将标目的文字区与表格的数字区 分隔开来。部分表格可再用横线将合计分 隔开,或用横线将两重纵标目分割开。其 它竖线和斜线一概省去。
相关文档
最新文档