【统计学】04 第二章 定量资料的统计描述
第二章--定量资料的统计描述

分类变量(名义变量 分类变量 名义变量) 名义变量 定性变量 有序变量(等级变量 有序变量 等级变量) 等级变量
变量
离散型变量 定量变量 连续型变量 统计描述: 统计描述:用统计图表或计算统计指标的方法表达一个特定群 这个群体可以是总体也可以是样本)的某种现象或特征, 体(这个群体可以是总体也可以是样本)的某种现象或特征, 称为统计描述。 称为统计描述。 统计描述可以使人们对资料有一个大致的了解, 统计描述可以使人们对资料有一个大致的了解,为进一步的统 计分析打下基础。 计分析打下基础。
图2-1 某地96名妇女产前检查次数频率分布 某地96名妇女产前检查次数频率分布 96
30 25 20
频率(%)
15 10 5 0 0 1 2 3 4 产前检查次数 5 >5
横坐标为产前检查 横坐标为产前检查 频率, 次数,纵坐标为频率 次数,纵坐标为频率, 即产前检查k次的妇 即产前检查 次的妇 女在被统计妇女中所 占的比例(%) 占的比例( ) 从表2-1和图 和图2-1可 从表 和图 可 以看出, 以看出,产前检查次 数为4次或 次或5次的孕妇 数为 次或 次的孕妇 数目最多, 数目最多,不检查或 检查次数很多的孕妇 不多, 不多,产前检查很多 次的孕妇也不多。 次的孕妇也不多。
与表2-2相比, 与表 相比,直方图可以更直观 相比 地表达出血清铁数据在各组段的分 布情况。 布情况。
三、频率分布表(图)的用途 频率分布表( (一)揭示资料的分布类型 1、对称分布 集中位置位于中央,左右两侧频数对称。 集中位置位于中央,左右两侧频数对称。
12 10 频 率 密度 (%) 8 6 4 2 0 7 9 11 13 15 17 19 血清铁 21 23 25 27 29
定量资料的统计描述解析

第一节 频数分布表与频数分布图
统计描述是统计分析的最基本内容,也 是统计分析的重要一部分.在统计学中经常 用统计指标和统计图表来揭示和反映原始 资料的数量特征和信息.
频数分布表
➢ 用于反映各变量(观察单位的某种特征)值及其 相应频数之间关系的一类表格,我们称之为频 数表.这里频数指对一种变量在多个观察单位 中进行多次观察,其中某一变量值重复出现的 次数.
数表法两种。
(1)直接法 当观察例数 n 不大时,此法常用。
先将观察值按大小顺序排列,选用下列公式
求 M。
当 n 为奇数时
为偶数时
M=
X
n 2
X
n 1 2
2
例 某病患者 8 人的潜伏期(天)分别为 2,3,3,4,7,8, 10,18,求它们的中位数。
本例 n=8 为偶数,将 8 人潜伏期从小到大排列,用公式算 得
➢ 不同的资料类型编制频数表难易程度不同,其 中计数资料和等级资料比较简单,而计量资料 相对较繁杂些.
计量资料频数表的编制
一般情况下,样本含量小于30的统计资料 无须编制频数表,但对于大样本含量的资料, 编制频数表有利于进一步的统计分析、且频 数表本身也具有统计描述的作用.
编制频数表的步骤
一般 8- 15 之间
3、方差(variance) 离均差平方和的算术平均数,即为方差。总体方差用
符号σ2(σ读seigama)表示,样本方差用S2表示。计算公 式分别为:
N
xi 2
2 i1
N
n
xi
X
2
S 2 i1
n 1
4、标准差(standard deviation) 方差的平方根即为标准差。总体标准差用σ表示,
第二章 定量资料的统计描述 1-4节

fx x f
0
1 7 3 9 .... 1 29 2228 18.57( μ m ol/ L) 1 3 .... 1 120
2、几何均数(geometric mean,G)
有研究者测定8人血清的抗体效价分别为 1:200,1:25,1:400,1:800,1:50,1:100, 1:50,1:25,求平均抗体滴度。该研究者用倒 数求均数,得平均抗体低度为1:206.25。 1)资料的类型? 2)该研究者对资料的描述是否正确? 3)如何描述该资料的集中趋势?
第二章
定量资料的统计描述
第一节 频率分布表与频率分布图
频率分布表(frequency distribution table):
整理原始数据的一种工具,用来表示数据 各观察值在不同取值区间出现的频数分布情 况。 频数分布表: 显示数据分布的范围、分布最集中的区间 和分布形态。
一、离散型定量变量的频率分布 例2-1 某年某山区96名孕产妇产前检查次 数资料如下: 0,3,2,0,1,5,6,3,2,4,1,0,6,5….4,7 试编制产前 检查次数的频率分布表
(1)直接法:直接将所有原始观察值相加, 再除以总例数。
x1 x2 ..... xn x n
x
i 1
i
n
(2 1)
例2-3 某年某医院女性晚期肺癌患者红 细胞计数(1012/L)为4.20,6.43,2.08, 3.45, 2.26,4.04,5.42,3.38。试求其算术均 数。
1.描述变量的分布类型 1)对称分布 2)偏态分布 (1)正偏态分布:峰向左侧偏移 (2)负偏态分布:峰向右侧偏移 2.揭示变量的分布特征 集中趋势:频数向中间组段集中, 离散趋势:由中间组段向两侧,频数逐渐 减少 3.便于发现某些离群值或极端值 4.便于进一步计算统计指标和统计分析
【统计学】04 第二章 定量资料的统计描述

频率(%)
30
25
直条图
20
15
10
5
0
0
1
2
3
4
5
>5
产前检查次数
图2-1 1998年某地96名孕妇产前检查次数频率分布
8
二、连续型定量变量的频率分布
例2-2 抽样调查某地120名18~35岁健康男性居民血清铁含量(μmmo/L),数 据如下。试编制血清铁含量的频率分布表。
首先,分析资料类型? 定量数据---连续型
表211998年某地96名孕妇产前检查次数频率分布检查次数检查次数11频数频数22频率频率33累计频数累计频数44累计频率累计频率11132623124273115135271240125112235618496421152293656358751000合计961000图211998年某地96名孕妇产前检查次数频率分布1015202530离散型定量变量的频率分布图可用直条图表达以等宽直条的高度表示各组频率的多少直条图二连续型定量变量的频率分布例22抽样调查某地120名1835岁健康男性居民血清铁含量mmol数据如下
频数
25 20 15 10
5 0
0
20
40
60
80
100
120
140
滴度倒数
25
20
15
f 10
5
0
0
0.5
1
1.5
2
2.5
lgX
23
3、计算公式:直接法和频数表法。
(1)直接法 公式:
G n X1 X2 X3 Xn
对数的形式为
G lg 1 lg X1 lg X 2 lg X n lg 1 lg X
定量资料数据的统计描述

求例2-2中某地120名正常成年男子的血清铁 含量的均数.
120名成年男子血清铁含量均数、标准差计算表加权法
组段
1
频数f 组中值X0 fX 0
2
一、描述集中趋势的统计指标
平均数:描述一组同质计量资料的集中趋势;反映一组观察值 的平均水平. 常用的平均数有算术均数,几何均数和中位数. 一算术均数mean:简称均数,总体均数用希腊字母µ表示,样本 均数用拉丁字母 表示. X
1. 计算方法 1 直接法:适用于样本例数n较少的资料.
X X1 X2 ... Xn X
Glg1
lngXlg1lg16lg3
2lg3 7
2..l.g512
lg 11.80 6624
7份HBsAg的平均滴度为1:64
2 加权法:适用于样本例数n较多的资料.
G l
g 1 f1l
g X 1f2l g X 2. .fn.l f1f2...fn
g X n
lg
1
f lg f
52例慢性肝炎患者的HBsAg滴度的几何均数为1:119.74705
二几何均数应用的注意事项: 1几何均数常用于等比级数资料或对数正 态分布资料. 2观察值中不能有0. 3观察值中不能同时有正值和负值.
三中位数和百分位数
中位数median,M:将一组变量值从小到大按顺序排列,位次 居中的那个变量值就是中位数.
等距分组 以横轴表示被观察变量,纵轴表示频率密度,以各
矩形宽度为组距的面积代表各组段的频率.
图中横轴为血清铁含量,纵轴为频率密度,直条面积等 于相应组段的频率.
第2章定量资料的统计描述

1、计算方法 (1)直接法:当样本含量较小时,用直接法。公 式:
X
X
n
例2.3 测得8只正常大鼠血清磷 酸酶含量(U/L)为4.20,6.43, 2.08,3.45,2.26,4.04,5.42, 3.38。试求其算术均数。
10
5
0
0
1
2
3
4
检查次数
某地96名产妇产前检查次率分布
频数
5
>5
>5
二、连续型定量变量的频数分布
例2.2 某地120名18~35岁健康男性居民血清铁含量 (umol/L),编制频数表。
7.42 8.65 23.02 21.31 21.46 9.97 22.73 14.94 20.18 21.62 23.07 20.38 8.04 17.32 29.64 19.69 23.90 17.45 19.08 20.52 24.14 23.77 18.36 23.04 24.22 24.13 21.53 11.09 18.89 18.26 23.29 17.67 15.38 18.61 14.27 17.40 22.55 17.55 16.10 17.98 20.13 21.00 14.56 19.89 19.82 17.48 14.89 18.37 19.50 17.08 18.12 26.02 11.34 13.81 10.25 15.94 15.83 18.54 24.52 19.26 26.13 16.99 18.89 18.46 20.87 17.51 13.12 11.75 17.40 21.36 17.14 13.77 12.50 20.40 20.30 19.38 23.11 12.67 23.02 24.36 25.61 19.53 14.77 14.37 24.75 12.73 17.25 19.09 16.79 17.19 19.32 19.59 19.12 15.31 21.75 19.47 15.51 10.86 27.81 21.65 16.32 20.75 22.11 13.17 17.55 19.26 12.65 18.48 19.83 23.12 19.22 19.22 16.72 27.90 11.74 24.66 14.18 16.52
《定量资料数据的统计描述》教案

《定量资料数据的统计描述》教案标题:定量资料数据的统计描述教案一、教学目标1.理解什么是定量资料数据的统计描述。
2.掌握常见的统计描述方法:集中趋势与离散程度。
3.能够应用统计描述方法对实际问题进行分析和讨论。
二、教学内容1.定量资料数据的统计描述的定义和意义。
2.集中趋势的统计描述方法:平均数、中位数、众数。
3.离散程度的统计描述方法:极差、四分位数、方差、标准差。
4.实例分析和练习。
三、教学步骤步骤一:导入(10分钟)1.向学生介绍定量资料数据的统计描述的概念和意义。
2.引导学生思考:为什么我们需要对数据进行统计描述?步骤二:集中趋势的统计描述(20分钟)1.介绍平均数的概念和计算方法。
2.分享实际应用平均数的例子,并提示其局限性。
3.介绍中位数的概念和计算方法。
4.引导学生分析什么情况下使用中位数比平均数更合适。
5.介绍众数的概念和计算方法,并解释其应用场景。
步骤三:离散程度的统计描述(25分钟)1.介绍极差的概念和计算方法。
2.引导学生思考四分位数的意义和计算方法,并分享实际应用的例子。
3.介绍方差的概念和计算方法。
4.介绍标准差的概念和计算方法,并解释其在数据分析中的重要性。
5.引导学生讨论方差和标准差的应用场景。
步骤四:综合分析和应用(25分钟)1.提供实际问题或案例,并引导学生运用所学内容进行分析和讨论。
2.给予学生时间思考和解答问题。
3.分享学生的分析和答案,并引导学生进行互动讨论。
步骤五:总结和拓展(10分钟)1.回顾本节课学习的内容和重点,确保学生对定量资料数据的统计描述有所掌握。
2.提示学生可以进一步了解其他统计描述方法,如箱线图等。
3.激发学生对数据分析和统计描述的兴趣,引导学生向实际问题应用所学方法。
四、教学评估1.教师针对学生的学习情况进行同步评估,包括学生积极参与讨论、能够正确运用统计描述方法等。
2.可以布置课后作业,要求学生分析和描述给定的数据集。
五、教学资源1.PPT或黑板/白板2.实际数据案例3.学生练习题和课后作业六、教学延伸1.引导学生自行寻找相关的应用案例进行研究和分析。
02定量资料的统计描述

4
例:抽样调查某地120名18岁~35岁健康男性居民血清铁含 抽样调查某地 名 岁 岁健康男性居民血清铁含 量(µmol/L) )
7.42 20.38 18.36 14.27 14.89 24.52 17.14 14.77 21.75 12.65
8.65 8.40 23.04 17.40 18.37 19.26 13.77 14.37 19.47 18.48
23.02 17.32 24.22 22.55 19.50 26.13 12.50 24.75 15.51 19.83
21.61 29.64 24.13 17.55 17.08 16.99 20.40 12.73 10.86 23.12
6
名正常成年男子血清铁含量( 表2-2 120名正常成年男子血清铁含量(µmol/L)频数表 名正常成年男子血清铁含量 )
组段(1) 组段(1) 6~ ~ 8~ ~ 10~ ~ 12~ ~ 14~ ~ 16~ ~ 18~ ~ 20~ ~ 22~ ~ 24~ ~ 26~ ~ 28~30 ~ 合计 频数(2) 频数(2) 1 3 6 8 12 20 27 18 12 8 4 1 120
累计频数: 累计频数: 某一指定 组段及前 面各组段 的频数之 和。
名正常成年男子血清铁含量( 表2-2 120名正常成年男子血清铁含量(µmol/L)频数表 名正常成年男子血清铁含量 )
组段(1) 组段(1) 6~ ~ 8~ ~ 10~ ~ 12~ ~ 14~ ~ 16~ ~ 18~ ~ 20~ ~ 22~ ~ 24~ ~ 26~ ~ 28~30 ~ 合计 频数(2) 频数(2) 1 3 6 8 12 20 27 18 12 8 4 1 120 频率(%) (3) 频率 0.83 2.50 5.00 6.67 10.00 16.67 22.50 15.00 10.00 6.67 3.33 0.83 100 累计频数(4) 累计频数(4) 1 4 累计频数除 10 以总频数的 18 比值称为累 比值称为累 30 计频率。 计频率。它 50 描述了累计 77 频数在全体 95 中所占的比 重。107 115 119 120 累计频率(%) (5) 累计频率 0.83 3.33 8.33 15.00 25.00 41.67 64.17 79.17 89.17 95.83 99.17 100.00 10
02定量数据的统计描述(医学统计学)

累积频率(%)
4.3
31.1
57.6
M
72.5 85.4 92.1 96.5 98.7 99.4 99.8
100.0 -
思考
三组白鼠体重情况 甲组:26 28 30 32 34 乙组:24 27 30 33 36 丙组:27 28 28 32 35
X甲 X乙 X丙
三组体重的离散程度?
方差( variance )是将离均差平方和再取平均, 即
平均数(average):描述一组变量值的集中位置或 平均水平的指标。
常用的平均数有(算术平)均数、几何(平)均数、中 位数。
不同的分布使用不同的平均数。
一、算术均数
应用:主要适用于单峰对称分布或偏斜度不 大的资料,尤其适合正态分布资料。
例2-3 测得8只正常大白鼠总酸性磷酸酶含量(U/L) 为4.20,6.43,2.08,3.45,2.26,4.04,5.42,3.38。 试求其算术均数。
变异系数(coefficient of variation):用于对均数相
差较大或单位不同的几组观察值的变异程度进行比较。
例3.3 测得某地成年人舒张压均数为77.5mmHg,标准差 10.7mmHg;收缩压均数为122.9mmHg,标准差为 17.1mmHg。试比较舒张压和收缩压的变异程度。
例: 某地120名7岁男孩身高的均数为 123.10cm,标准差为4.71cm;体重均数为 22.29kg,标准差为2.26kg,比较其变异度。
频数
27 169 167
94 81 42 28 14
4 3 1 630
累积频数
27 196 363 457 538 580 608 622 626 629 630
定量资料统计描述课件

数值型数据的分布形态描述
偏态与峰态
描述数据分布的不对称性 和尖锐程度。
正态分布
一种常见的连续概率分布 ,特点是钟形曲线,平均 数、中位数和众数相等。
分布函数
描述数据落在某个区间的 概率。
05
分类数据的统计描述
频数分布表与频数分布图
频数分布表
将分类数据按照某一分类标准进行分组,并统计每一组的频 数。
数据。
实验法
通过实验设计和实验操作获取 数据,适用于需要获取数据,适 用于自然状态下的数据收集。
文献法
通过查阅文献资料获取数据, 适用于历史数据和无法直接获
取的数据。
数据整理的步骤
数据清洗
去除无效、异常和缺失数据, 确保数据质量。
数据转换
将数据转换为统一格式,便于 后续处理和分析。
列联表
将两个分类变量交叉分组,并对每个 单元格中的观察单位数进行统计,形 成列联表,可以用来分析两个分类变 量之间的关系。
06
定量资料统计描述的应用实
例
实例一:人口普查数据统计描述
总结词
人口普查数据是典型的定量资料,统计描述方法在人口普查数据中应用广泛,用于描述人口数量、性别比例、年 龄结构等基本情况。
统计描述的基本原则
课程安排
第二章:定量资料的收集与整理 定量资料的收集方法
定量资料的整理原则
课程安排
第三章:数值变量统计描述 数值变量的集中趋势描述
数值变量的离散趋势描述
课程安排
第四章:分类变量统计描述 分类变量的频数分布描述 分类变量的相对数描述
课程安排
第五章:统计图表在描述中的应用 常用统计图形的选择与绘制
中心位置。
离散趋势指标
第2章 定量资料的统计描述

①两端的组段应分别包含最小值或 步骤: 步骤: 最大值; 最大值; :(极差 ② (1) 求全距:(极差)R=29.64-7.42=22.22 ) 求全距:(极差) 尽量取较整齐的数值作为组段的 端点,便于对数据进行表述; 端点,便于对数据进行表述; 个组段, 全距/组段数 (2) 定组段数与组距 : 8~15个组段,组距 全距 组段数 ) ~ 个组段 组距i=全距 组距以相等为宜。 ③组距以相等为宜。 (3) 划组段:以一个稍小于或等于最小值的整数作为第一个 ) 划组段:
fX 0
(4)=(2)(3) (5)=(3)(4)
6~ 8~ 10~ 12~ 14~ 16~ 18~ 20~ 22~ 24~ 26~ 28~30
1 3 6 8 12 20 27 12 10 8 4 1 120(∑f) ( )
X=
7 9 11 13 15 17 19 21 23 25 27 29
7 27 66 104 180 340 513 378 276 200 108 29 2228(∑f X0)
一、描述集中趋势的统计指标
平均数:描述一组同质计量资料的集中趋势; 平均数:描述一组同质计量资料的集中趋势;反映一组观察值 的平均水平。 的平均水平。 常用的平均数有算术均数,几何均数和中位数。 常用的平均数有算术均数,几何均数和中位数。 (一)算术均数(mean):简称均数,总体均数用希腊字母 µ 算术均数(mean):简称均数, (mean) 表示,样本均数用拉丁字母 表示, 1. 计算方法 直接法:适用于样本例数n较少的资料。 直接法:适用于样本例数n较少的资料。
第一节
频数与频数分布
一、连续型定量变量的频数分布 频数表的编制: 频数表的编制: 频数(frequency):对一个随机变量做重复观察, :对一个随机变量做重复观察, 频数 其中某变量值出现的次数。 其中某变量值出现的次数。 频数分布表(frequency distribution table):将各变 频数分布表 : 量值及其相应的频数列成表格的形式。 量值及其相应的频数列成表格的形式。 抽样调查某地120名18岁~35岁健康男嵌居 例2-2 抽样调查某地 名 岁 岁健康男嵌居 民血清铁含量(µmol/L)见P12,试编制频数分布表。 见 ,试编制频数分布表。 民血清铁含量
第二章定量的资料的统计描述

图形中间的直条高,两边对称(或基本对称)地逐渐减少,为 正态分布或近似正态分布,若集中位置偏向左侧为正偏态分布 (skewed positively distribution)若集中位置偏向右侧为负 偏态分布(skewed negatively distribution)。
2019/11/10
徐州医学院卫生事业管理教研室
4
图2-2 某地120名18~35岁健康成年男性居民血清铁含量(μmol/L)
7.42 8.65 23.02 21.61 21.31 21.46 9.97 22.73 14.94 20.18 21.62 23.07 20.38 8.40 17.32 29.64 19.69 21.69 23.90 17.45 19.08 20.52 24.14 23.77 18.36 23.04 24.22 24.13 21.53 11.09 18.89 18.26 23.29 17.67 15.38 18.61 14.27 17.40 22.55 17.55 16.10 17.98 20.13 21.00 14.56 19.89 19.82 17.48 14.89 18.37 19.50 17.08 18.12 26.02 11.34 13.81 10.25 15.94 15.83 18.54 24.52 19.26 26.13 16.99 18.89 18.56 20.87 17.51 13.12 11.75 17.40 21.36 17.14 13.77 12.50 20.40 20.30 19.38 23.11 12.67 23.02 24.36 25.61 19.53 14.77 14.37 24.75 12.73 17.25 19.09 16.79 17.19 19.32 19.59 19.12 15.31 21.75 19.47 15.51 10.86 27.81 21.65 16.32 20.75 22.11 13.17 17.55 19.26 12.65 18.48 19.83 23.12 19.22 19.22 16.72 27.90 11.74 24.66 14.18 16.52
《医学统计学》基本统计学部分公式总结

̅2 ������1 − ������ ������ 2 √ 1 ������1 +
2 ������2
������1 = ������1 − 1, ������2 = ������2 − 1
1 2 的双侧 1 置信区间为:
������2
X
1
X 2 t / 2, S X 1 X 2 , t 值 自 由 度 为
̅������ − ������ ̅0 ������ Dunnett − ������ = ,ν = ������误差 ������������ ̅ ������ −������ ̅������ ������������ ̅ ������ −������ ̅������ 1 1 = √������������误差 ( + ) ������������ ������0
������������组内 =
������������组内 ������组内
������ 2 ∑������ ������=1(������������ − 1) ln 1+
2 ������������ ������������2
������ =
������������组间 ������������组内
第二章 定量资料的统计描述 1.算术均数
X
S
2
fX
2
fX
n 1 n
2
X 或( X fX )
n n
8.变异系数
CV
或
2.几何均数
lg X G n X 1 X 2 X 3 X n 或 G lg 1 n f lg X G lg 1 n
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
9
频率表的编制步骤如下:
1. 计算极差 (range, R),亦称全距,即最大值与最小值之差。 本例最大值29.64,最小值7.42 (借助excel等数据管理软件) 故R=29.64-7.42=22.22 (μmmo/L)。
2. 确定组段数与组距(class interval) 组段数一般取10组左右。 组距用 i 表示,组距=极差/组段数, 本例拟分10组,i=22.22/10=2.22, 一般取靠近的整数作为组距,本例取i=2。
-
12
频率密度(%)
概率密度(%)
12
10
8
12
10
6
8
直方图
6
4 4
2
2
0
0
6~ 8~ 10~ 12~ 14~ 16~ 18~ 20~ 22~ 24~ 26~ 28~
6~ 8~ 10~ 12~ 14~血清1铁6~含量(1μ8mo~l/L)20~ 22~ 24~ 26~ 28~
血清铁含量(μmol/L)
11
表2-3 某年某地120名18~35健康男性居民血清铁含量(μmmo/L)频率分布
组段
(1)
6~ 8~ 10~ 12~ 14~ 16 ~ 18 ~ 20 ~ 22 ~ 24 ~ 26 ~ 28~30
合计
频数 (2) 1 3 6 8 12 20 27 18 12 8 4 1 120
频率(%) (3) 0.83 2.50 5.00 6.67
Table and chart
Parameter estimation Hypothesis
testing
[学习要求] 了解:应用SAS程序编制频率表的方法和means、
univariate过程对定量资料的描述。 熟悉:定量资料频率表的编制方法和用途。 掌握:
集中趋势指标:算术均数、几何均数、中位数; 离散趋势指标:四分位间距、方差、标准差、变异系数。 两种描述指标的计算方法和适用条件
4
第一节 频率分布表与频率分布图 医学研究资料变量值的个数较多时,对各变量值出现的频数或频率列表即 为频数分布表或频率分布表(frequency distribution table),简称频数表或频
率表。
5
• 例2-1
•
某年某山区96名孕产妇产前检查次数资料如下:
•
0,3,2,0,1,5,6,3,2,4,
Review: chapter 1
1、统计工作的基本步骤: design collection sorting analysis
2、基本的概念: homogeneity and variation、 population and sample、 parameter and statistic、 sampling error、 variable and variable value、 probability and frequency small probability event
10
频率表的编制步骤如下: 3. 确定各组段的上、下限
每个组段的起点称为组段的下限,终点称为组段的上限。 第一组段要包括最小值,本例取6为第一组段的下限(也可取7), 最后一个组段要包括最大值。 注意各组段不能重合,每组段只写出下限,如6~,8~, 最后一个组段可包括其上限值,如本例28~30。
4. 列表 清点各组的频数,计算频率、累积频率数和累计频率。
图2-2 某年某地120名18~35健康男性居民血清铁含量(μmmo/L)频率分布
频率密度=频率/组距,直条面积=该组段的频率
13
频数
30 25 20 15 10 5 0
6~ 8~ 10~ 12~ 14~ 16~ 18~ 20~ 22~ 24~ 26~ 28~ 血清铁含量(μmol/L)
图2-2 某年某地120名18~35健康男性居民血清铁含量(μmmo/L)频数分布
14
三、频率分布表(图)的用途 1、揭示资料的分布类型
15
正偏态(右偏态)
负偏态(左偏态)
2.揭示变量的分布特征:观察资料的集中趋势和离散趋势 3.便于发现某些特大或特小的可疑值 4.便于进一步计算统计指标和作统计处理
16
第二节 描述集中趋势的统计指标
对于定量资料, 描述其集中趋势的统计指标:平均数, 主要有算术均数、几何均数和中位数等。
•
1,3,6,5,1,3,3,
•
…… …… 4,7
•
如何描述96名孕产妇的产前检查次数呢?
•
• 首先,分析资料类型?
定量数据---离散型 其次,考虑利用图表等形式粗略描述。
6
一、离散型定量变量的频率分布
例2-1 1998年某山区96名孕妇产前检查次数资料,编制 频率表。
分布
检查次表数2-1 19频9数8年某地频9率6(名%)孕妇累产计前频数检查累次计数频率频(%率)1第二章 定量资料的统计描述
统计描述是用统计图表、统计指标来描述资料的分布规律及其数 量特征。
2
4. Data Analysis
Statistical description
Statistical analysis
Statistical inference
3
Measures
Distribution
(1)
(2)
(3)
(4)
(5)
0
4
4.2
4
4.2
1
7
7.3
11
11.5
2
11
11.5
22
22.9
3
13
13.5
35
36.5
4
26
27.1
61
63.5
5
23
24.0
84
87.5
>5
12
12.5
96
100.0
合计
96
100.0
-
-
介绍统计表的格式
7
离散型定量变量的频率分布图可用直条图表达,以等宽直条的高 度表示各组频率的多少
10.00 16.67 22.50 15.00 10.00 6.67 3.33 0.83 100.00
累计频数 (4) 1 4 10 18 30 50 77 95 107 115 119 120
-
累计频率(%) (5)
0.83 3.33 8.33 15.00 25.00 41.67 64.17 79.17 89.17 95.83 99.17 100.00
频率(%)
30
25
直条图
20
15
10
5
0
0
1
2
3
4
5
>5
产前检查次数
图2-1 1998年某地96名孕妇产前检查次数频率分布
8
二、连续型定量变量的频率分布
例2-2 抽样调查某地120名18~35岁健康男性居民血清铁含量(μmmo/L),数 据如下。试编制血清铁含量的频率分布表。
首先,分析资料类型? 定量数据---连续型