人群健康研究的统计学方法 -
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
图10-5
某地1968-1974年结核病死亡率
第十章 第二节
(三)常用统计图及其绘制方法
4.直方图(histogram) 直方图又称频数分布图,是以各矩形
的面积表示各组段的频数,各矩形面积的总和为总频数,适
用于表示连续性资料的频数分布。
第十章 第二节
30 25 20 15 10 5 0 80 84 88 92 身高(cm) 96 100 104
有效率 (%) 86.9 77.8
第十章 第二节
(一)统计表的种类
2.复合表
复合表:指被研究对象按两个(或两个以上)特征分组的表格。如表 3-2 ,将被研究 对象按年龄和性别两个特征结合起来分组,故称为组合表。
表 10-2 某地某年不同年龄、性别的儿童青少年意外损伤情况
年龄(岁) 3.5 ~ 6.5 ~ 9.5 ~ 12.5 ~ 15.8 ~18.5 合计
学习目标
1. 掌握:总体、样本等统计学基本概念;统计资料的 类型;统计表及统计图的制作;数值变量资料和分类 变量资料统计描述的指标、计算及适用条件;数值变 量资料和分类变量资料区间估计的方法,常用的假设 检验方法及应用条件。
2. 熟悉:医学统计工作的基本步骤;频数表的编制方 法;正态分布曲线下的面积分布规律及参考值范围的 制订。
第十章 第一节
(五)误差
1. 系统误差(systematic error):测量结果又倾向性。查明 原因,可以避免。 2.随机测量误差(random error of measurement):测量结 果没有倾向性。不可避免。 3. 抽样误差(sampling error):由于随机抽样所引起的样 本统计量与总体参数之间的差异以及各样本统计量之间的 差异称为抽样误差。变异是绝对的,抽样误差不可避免。
第十章 第二节
(一)统计表的类型与选择
1. 资料是连续性的,其目的是用线段升降表达事物的动态 变化趋势,选择普通线图; 2. 表示变量分布的频数表资料,其目的是用直方的面积表 达各组段的频数或频率分布情况,宜选择直方图; 3. 资料是相互独立的,其目的是用直条的长短比较数值的 大小,选择直条图;
第十章 第二节
图10-8 抑肿瘤药不同剂量与对照组用药后小白鼠肿瘤重量的比较
第十章 第二节
第三节 数值变量资料的统计分析
刘琥 济宁医学院
(一)频数分布
1. 频数表的编制
第一组段包括极小值,最后 一组段包括极大值,除最后 一般 8- 15 之间 求出极差 确定组段数 确定组距 列出各个组段 确 定 每 一组 段 频 数 选 组距=R/组段数, 但一般取一方便 计算的数字 根据变量值大小 把各观察单位归 入各个组段 一组段可同时标出上下限, 其他组段只标出下限。
男 调查人数 447 1215 1180 1217 622 4681 损伤人数 66 92 122 150 65 495 损伤率(%) 14.77 7.57 10.34 12.33 10.45 10.57 调查人数 424 1239 1070 1136 582 4451
女 损伤人数 29 53 80 66 20 248 损伤率(%) 6.84 4.28 7.48 5.81 3.44 5.57
图10-7 15名8岁男孩身高与坐高散点图
第十章 第二节
(三)常用统计图及其绘制方法
6.箱式图(box plot) 用于比较两组或多组资料的集中趋
势和离散趋势,箱式图的中间横线表示中位数,箱子的长
度表示四分位数间距,两端分别是P75和P25,箱式图最外 面两端连线表示最大值和最小值。
第十章 第二节
2 2
第一节 统计学概述
丁可 南阳医学高等专科学校
第十章 第一节
统计学(statistics)是研究数据的收集、整理、分析的一 门科学,是认识社会和自然现象客观规律数量特征的重要 工具。 统计学方法就是帮助人们透过偶然现象认识其内在的规律 性,揭示疾病或现象发生、发展规律,为预防疾病、促进 健康提供客观依据。
46
1.全距(R)
全距也称极差,是一组观察值中最大值与最小值之差。 反映个体变异的范围。全距大,说明离散程度大;反之, 说明离散程度小。 缺点: (1)除了最大值和最小值外,不能反映组内其他数据 的离散程度。 (2)样本含量悬殊时不宜比较其全距。 (3)即使样本含量不变,全距的抽样误差亦较大,即 不够稳定。
80%
100%
图10-4 复方猪胆囊治疗老年性气管炎近期疗效比较
第十章 第二节
(三)常用统计图及其绘制方法
3.线图(line graph):用线段的升降来表示某事物(某现象
)随时间或条件而变化的趋势。适用于连续性资料。
第十章 第二节
100
男
女
死亡率(1/10万)
80 60 40 20 0 1968 1969 1970 1971 年份 1972 1973 1974
(一)统计表的类型与选择
4. 事物内部各部分的百分构成比资料,其目的是用面积大 小表达各部分所占的比重大小,则应选择圆图; 5. 双变量连续性资料,其目的是用点的密集程度和趋势表 达两个变量的相互关系,选择散点图; 6. 资料是连续性的,其目的是比较两组或多组资料的集中 趋势和离散趋势,宜选择箱式图。
第十章 第二节
(三)常用统计图及其绘制方法
1. 直条图(bar graph) 直条图是以等宽直条(柱)
的长短来表示各指标数值的大小。适用于指标为各自
独立的分类资料。
第十章 第二节
举例说明: 单式条图:
60 50 55
发 病 率 ‰
40 30 20 10 0 甲
39
第十章 第二节
( )
19
3. 了解:t分布的特征;统计中两型错误。
重点:总体和样本的概念;统计资料的类型;统计表及统计 图的制作要求;数值变量资料和分类变量资料统计描述的指 标、计算及适用条件;抽样误差与标准误;数值变量资料和 分类变量资料区间估计的方法;常用假设检验方法及应用条 件。
2
难点:抽样误差与标准误;t分布与t界值;假设检验的基本思 检验。 想;P值的含义;假设检验中的两型错误;分布与
乙
丙
图 10-1 三城市某种传染病发病比较
复式条图:
30 28 25 24 89 年 90 年
Байду номын сангаас
死 亡 率 ‰
20 15 10 5 0
20
21
第十章 第二节
( )
男婴 图 10-2 较
女婴
某地 1989 年与 1990 年男女婴儿死亡率比
(三)常用统计图及其绘制方法
2.构成图(constituent ratio chart) 它是以图形的面积大小 表示事物内部各组成部分所占比重或比例。适用于按性质 分类、能计算构成比的资料。构成图可分为圆形图和百分 条图。
第十章 第一节
(六)概率
概率(probability)是描述某随机事件发生可能性大小的量 值,常用符号P表示。随机事件的概率在0~1之间,即 0≤P≤1。
小概率事件:P≤0.05或P≤0.01的事件。统计学上,认为
小概率事件在一次抽样中几乎不可能发生。
第十章 第一节
(一)数值变量资料
数值变量资料(measurement data)亦称定量资料 (quantitative data)或计量资料(numerical variable data)
极差即最大值 与最小值之差
编制频数表步骤流程图
(1)揭示数值变量频数分布的类型和特征
(2)作为陈述资料的形式 (3)便于发现一些特大或特小的可疑值 (4)便于进一步的统计分析
3.数值变量资料频数分布的类型和特征
(二)集中趋势指标
1.算术均数(mean)
样本均数: x 总体均数:
(1)应用:对称分布资料,尤其是正态分布资料。 (2 )计算 直接法 加权法
第一节 统计学概述 一、统计学的意义 二、统计学中的几个基本概念 三、统计资料的类型 四、统计工作的基本步骤 第二节 统计表和统计图 一、统计表 二、统计图
第三节 数值变量资料的统计分析 一、数值变量资料的统计描述 二、数值变量资料的统计推断 第四节 分类变量资料的统计分析 一、分类变量资料的统计描述 二、分类变量资料的统计推断
x fx f
x1 x2 x3 xn x x n n
43
2.几何均数(geometric mean):
(1)应用:等比数列资料;对数正态分布资料 (2) 计算:直接法 加权法
f lg x G lg 1 n
lg x G lg 1 n
第十章 第二节
无效 5.43 临床治愈 27.15 有效 23.08
显效 44.34
临床治愈
显效
有效
无效
图10-3 复方猪胆囊治疗单纯型老年气管炎近期疗效比较
第十章 第二节
哮喘型
12.64
45.06
36.26
6.04
单纯型
27.15
44.34
23.08
5.43
0%
20%
40% 临床治愈 显效
60% 有效 无效
转化,以满足不同统计分析方法的要求。
第十章 第一节
(一)统计设计:第一步,最关键的环节
(二)收集资料:经常性资料和一时性资料
(三)整理资料:查漏补缺,系统化、条理化
(四)分析资料
1. 统计描述 2. 统计推断
第十章 第一节
丁可 南阳医学高等专科学校
第十章 第二节
(一)统计表的结构和制表要求
1. 统计表主要有标题、标目(包括横标目、纵标目)、 线条、数字和备注五部分构成。 2. 编制统计表主要的要求是表的中心内容要突出,一张
44
3.中位数(median) (1)概念:将一组观察值从小到大按顺序排列,位次 具中的观察值就是中位数。 (2)应用:偏态分布;分布一端或两端无确定数据; 资料的分布情况不清楚。 (3)计算:直接法 频数表法
45
(三)离散趋势指标
离散趋势即个体值之间的变异程度,数据越分散,变异程 度越高。 极差 四分位数间距 方差 标准差 变异系数
第十章 第一节
(三)变量与变量值
总体(population)是指根据研究目的确定的同质观察单位 的全体 样本(sample)从总体中随机抽取的部分观察单位,其测 量值(或变量值)的集合
第十章 第一节
(四)参数与统计量
参数(parameter)是指总体的统计指标。习惯上用希腊字 母表示总体参数 统计量(statistic)是指样本的统计指标。习惯上用拉丁字 母表示统计量
表表达一个中心问题为宜。
第十章 第二节
统计表的基本框架:
表序
横标目名称 横标目
标题
纵标目名称
数字
合计
第十章 第二节
(一)统计表的种类
1. 简单表 简单表:指被研究对象只按单一特征或标志分组的表格。 表10-1 某地某年咽舒康治疗急性咽喉炎疗效比较
组别 试验组 对照组
例数 107 108
有效数 93 84
图10-6 某市某年150名3岁女孩身高频数分布
第十章 第二节
(三)常用统计图及其绘制方法
5. 散点图(scatter diagram) 散点图是用点的密集程度 和变化趋势来表示两种现象间的相关关系。适用于双变 量资料,均具有连续性变化的特征。
第十章 第二节
74 72 70
坐高(cm)
68 66 64 62 60 115 120 125 身高(cm) 130 135
(二)分类变量资料
分类变量资料(categorical variable data)又称定性资料( qualitative data) 1.无序分类(unordered categories) 2.有序分类(ordered categories)
第十章 第一节
资料类型的划分是根据研究目的确定的,而统计分析 方法的选用,则与资料类型密切相关。在资料的分析过程 中,根据有关专业理论和实际需要,各类资料间可以互相
第十章 第二节
(二)制图通则
1. 根据资料性质和分析目的正确选用适当的统计图。 2. 要有标题,简明扼要地说明统计图资料的时间、地点和 主要内容,一般放在图下方。 3. 绘制有坐标轴的图形时,纵横两轴应有标目并注明单位 。一般将两轴的相交点即原点初定为0。纵横轴比例一般 以5∶7或7∶5为宜。 4. 在同一张图内比较不同事物时,须用不同线条或颜色来 表示,并附图例加以说明。
第十章 第一节
(一)同质与变异
同质(homogeneity)是指被研究指标的影响因素相同 变异(variable)是同质基础上的各观察单位(亦称为个体) 之间的差异
第十章 第一节
(二)总体与样本
总体(population)是指根据研究目的确定的同质观察单位 的全体 样本(sample)从总体中随机抽取的部分观察单位,其测 量值(或变量值)的集合