定量数据的统计描述PPT讲稿
合集下载
第二章定量资料的统计描述PPT精品文档68页
本例 组距(i)设为2(µmol/L) 三、列表划记并清点频数(f)
按照“下限≤X<上限”的原则划记归组,清点频数、 计算频率、累计频数、累计频率等。本例见下表
15.05.2020
徐州医学院卫生事业管理教研室
5
表2-2 某地120名18~35岁健康成年男性居民血清铁含量(μmol/L)
组段 (1)
X
n
n
n
2、加权法(基于频数表)
15.05.2020
徐州医学院卫生事业管理教研室
11
15.05.2020
x0=(组段上限+组段下限)/2
在表2-2的基础上,可以绘制直方图如下:
30 25 20 15 10
5 0
6.0 10.0 14.0 18.0 22.0 26.0 血清铁含量(μmol/L)
图 2-2 某地120名18-35岁健康成年男 性居民血清铁含量(μmol/L)
图形中间的直条高,两边对称(或基本对称)地逐渐减少,为 正态分布或近似正态分布,若集中位置偏向左侧为正偏态分布 (skewed positively distribution)若集中位置偏向右侧为负 偏态分布(skewed negatively distribution)。
15.05.2020
徐州医学院卫生事业管理教研室
1
第二章 定量资料的统计描述
第一节 频数分布 第二节 定量资料的特征数
第三节 常用统计图表
15.05.2020
徐州医学院卫生事业管理教研室
2
第一节 频数分布
对样本量较大的资料进行统计描述常用方 法是频数分布表(frequency distribution table) 法,频数表可以显示数据分布的范围与形态。使 用统计软件(如SPSS、SAS、PEMS等)可以 方便地由原始数据编制出频数分布表。
按照“下限≤X<上限”的原则划记归组,清点频数、 计算频率、累计频数、累计频率等。本例见下表
15.05.2020
徐州医学院卫生事业管理教研室
5
表2-2 某地120名18~35岁健康成年男性居民血清铁含量(μmol/L)
组段 (1)
X
n
n
n
2、加权法(基于频数表)
15.05.2020
徐州医学院卫生事业管理教研室
11
15.05.2020
x0=(组段上限+组段下限)/2
在表2-2的基础上,可以绘制直方图如下:
30 25 20 15 10
5 0
6.0 10.0 14.0 18.0 22.0 26.0 血清铁含量(μmol/L)
图 2-2 某地120名18-35岁健康成年男 性居民血清铁含量(μmol/L)
图形中间的直条高,两边对称(或基本对称)地逐渐减少,为 正态分布或近似正态分布,若集中位置偏向左侧为正偏态分布 (skewed positively distribution)若集中位置偏向右侧为负 偏态分布(skewed negatively distribution)。
15.05.2020
徐州医学院卫生事业管理教研室
1
第二章 定量资料的统计描述
第一节 频数分布 第二节 定量资料的特征数
第三节 常用统计图表
15.05.2020
徐州医学院卫生事业管理教研室
2
第一节 频数分布
对样本量较大的资料进行统计描述常用方 法是频数分布表(frequency distribution table) 法,频数表可以显示数据分布的范围与形态。使 用统计软件(如SPSS、SAS、PEMS等)可以 方便地由原始数据编制出频数分布表。
定量资料的统计描述精品PPT课件
有些离散型数据的描述要参照分类资料处理,如龋齿个数、 流产次数、尿失禁次数、交通事故死亡人数。
分类资料
分类资料、也称为定性资料、计数资料,是将观察 单位按某种属性分组计数的定性观察结果。
分类资料的变量值只能代表事物的某些属性或分类, 表现为无不相容的类别或属性。
各观察单位之间没有量的区别,但有质的不同。
定量资料的各个观察值之间有量的区别,没有性质 的不同。
连续型资料和离散型 资料
连续型资料(continuous data)
任何两个连续型数据之间都有无穷多个数据; 只要测量仪器足够精确,连续型数据可以精确到小数点后
无限位。
离散型资料(discrete data)
是一种计数(count data),只能是0和正整数,不会是 负数,也没有小数点,如心率、血小板数。
247.60万元,农村家庭平均为37.70万元。
变量和研究资料的类 型
数值变量、定量资料、计量资料
分类变量、定性资料、计数资料
顺序变量、有序分类变量、等级资料
定量资料
定量资料是指每个观察单位某个变量用测量或其他 定量方法观察结果,一般有计量单位。
定量资料、数值资料、计量资料(measurement data,quantitative data,numeric data)
疗效:痊愈、有效、无效和恶化; 文化程度:小学、中学、大学和研究生; 抑郁症的程度:轻度、中度和重度。
随机变量和研究资 料的类型
收缩压
脉搏数 产次
文化程度 ABO血型
定量 定性 等级 连续型 离散型 资料 资料 资料 资料 资料
频数分布表
当观察值很多时,直接从原始数据很难得出概括的 印象,为了解资料的分布特征,可通过资料的整理, 编制频数分布表,来显示数据分布的范围、数据最 集中的区间和分布的形态。
分类资料
分类资料、也称为定性资料、计数资料,是将观察 单位按某种属性分组计数的定性观察结果。
分类资料的变量值只能代表事物的某些属性或分类, 表现为无不相容的类别或属性。
各观察单位之间没有量的区别,但有质的不同。
定量资料的各个观察值之间有量的区别,没有性质 的不同。
连续型资料和离散型 资料
连续型资料(continuous data)
任何两个连续型数据之间都有无穷多个数据; 只要测量仪器足够精确,连续型数据可以精确到小数点后
无限位。
离散型资料(discrete data)
是一种计数(count data),只能是0和正整数,不会是 负数,也没有小数点,如心率、血小板数。
247.60万元,农村家庭平均为37.70万元。
变量和研究资料的类 型
数值变量、定量资料、计量资料
分类变量、定性资料、计数资料
顺序变量、有序分类变量、等级资料
定量资料
定量资料是指每个观察单位某个变量用测量或其他 定量方法观察结果,一般有计量单位。
定量资料、数值资料、计量资料(measurement data,quantitative data,numeric data)
疗效:痊愈、有效、无效和恶化; 文化程度:小学、中学、大学和研究生; 抑郁症的程度:轻度、中度和重度。
随机变量和研究资 料的类型
收缩压
脉搏数 产次
文化程度 ABO血型
定量 定性 等级 连续型 离散型 资料 资料 资料 资料 资料
频数分布表
当观察值很多时,直接从原始数据很难得出概括的 印象,为了解资料的分布特征,可通过资料的整理, 编制频数分布表,来显示数据分布的范围、数据最 集中的区间和分布的形态。
《定量资料统计描述》PPT课件
病例数
频数
人数
25
20
正态分布:中间高、
15
两边低、左右对称
10
5
0
0.50 0.70 0.90 1.10 1.30 1.50 1.70 1.90
血清甘油三酯(mmol/L)
图2-1 160名正常成年女子的血清甘油三酯的频数分布图
正偏态分布:
18
16
长尾向右延伸
14
12ቤተ መጻሕፍቲ ባይዱ
10
8
6
4
2
0 12 24 36 48 60 72 84 96 108 120
均数中位数非正态分布偏态分布多峰分布即右偏态集中位置偏右均数中位数正偏态即左偏态集中位置偏左均数中位数48图21160名正常成年女子的血清甘油三酯的频数分布图10152025050070090110130150170190血清甘油三酯mmoll图2259名链球菌咽喉炎患者的潜伏期h10121416181224364860728496108120潜伏期h图23101名正常人的血清肌红蛋白含量10152025101520253035404550肌红蛋白含量ugml正态分布
精选课件ppt
24
组距的大小或宽度
❖ 组距的大小或宽度是上下组界的差,也常称 为组宽.如果一个频数分布的所有组距都有同 样的宽度,那么这个共同的宽度用f来表示.在 这种情况下,f等于2个连续下组界或2个连续 上组界的差。
❖ 在表2.1中,c=62.5-59.5=65.5-62.5=3.
精选课件ppt
卫生统 计学
预防医学教研室: 徐 谦
办公地点: 大学城基础医学院六楼
精选课件ppt
1
第二章 定量资料的统计描述
最新定量资料统计描述PPT课件
表 100 名 受 试 者 平 均 抗 体 滴 度 计 算 表
抗体滴 频数
度
f
(1)
(2)
1:4
6
1:8
10
1:16 16
1:32 34
1:64 20
1:128 8
1:256 5
1:512 1
合 计 100
滴度倒 数X (3) 4 8 16 32 64 128 256 512 ---
lgX
(4) 0.6021 0.9031 1.2041 1.5051 1.8062 2.1072 2.4082 2.7093
数表法两种。
(1)直 接 法 当 观 察 例 数 n 不 大 时 ,此 法 常 用 。
先将观察值按大小顺序排列,选用下列公式
求 M。
当 n为奇数时
M = X [(n+ 1)/2]
当 n为偶数时
M
=
X
n 2
X
n 2
1
2
例 某 病 患 者 8 人 的 潜 伏 期( 天 )分 别 为 2,3, 3,4,7,8, 10, 18, 求 它 们 的 中 位 数 。
本 例 n=8 为 偶 数 ,将 8 人 潜 伏 期 从 小 到 大 排 列 ,用 公 式 算 得
M
=
X
n 2
X
n 2
1
2 = [X4 + X5]/2=( 4+7) /2=5.5(天 )
(2)频数表法 当观察例数n较多时,可先编制频数表, 再通过频数表计算中位数。
公式为:
M = Lm + i/fm( n×50% - ΣfL )
186
72--84
1
187
M = 12 + 12/70( 187×50% - 35 )= 22.0(小时)
抗体滴 频数
度
f
(1)
(2)
1:4
6
1:8
10
1:16 16
1:32 34
1:64 20
1:128 8
1:256 5
1:512 1
合 计 100
滴度倒 数X (3) 4 8 16 32 64 128 256 512 ---
lgX
(4) 0.6021 0.9031 1.2041 1.5051 1.8062 2.1072 2.4082 2.7093
数表法两种。
(1)直 接 法 当 观 察 例 数 n 不 大 时 ,此 法 常 用 。
先将观察值按大小顺序排列,选用下列公式
求 M。
当 n为奇数时
M = X [(n+ 1)/2]
当 n为偶数时
M
=
X
n 2
X
n 2
1
2
例 某 病 患 者 8 人 的 潜 伏 期( 天 )分 别 为 2,3, 3,4,7,8, 10, 18, 求 它 们 的 中 位 数 。
本 例 n=8 为 偶 数 ,将 8 人 潜 伏 期 从 小 到 大 排 列 ,用 公 式 算 得
M
=
X
n 2
X
n 2
1
2 = [X4 + X5]/2=( 4+7) /2=5.5(天 )
(2)频数表法 当观察例数n较多时,可先编制频数表, 再通过频数表计算中位数。
公式为:
M = Lm + i/fm( n×50% - ΣfL )
186
72--84
1
187
M = 12 + 12/70( 187×50% - 35 )= 22.0(小时)
定量资料的统计描述与t检验 ppt课件
4.77 3.37 6.14 3.95 3.56 4.23 4.31 4.71 5.69 4.12 4.56 4.37 5.39 6.30 5.21 7.22 5.54 3.93 5.21 4.12 5.18 5.77 4.79 5.12 5.20 5.10 4.70 4.74 3.50 4.69 4.38 4.89 6.25 5.32 4.50 4.63 3.61 4.44 4.43 4.25 4.03 5.85 4.09 3.35 4.08 4.79 5.30 4.97 3.18 3.97 5.16 5.10 5.86 4.79 5.34 4.24 4.32 4.77 6.36 6.38 4.88 5.55 3.04 4.55 3.35 4.87 4.17 5.85 5.16 5.09 4.52 4.38 4.31 4.58 5.72 6.55 4.76 4.61 4.17 4.03 4.47 3.40 3.91 2.70 4.60 4.09 5.96 5.48 4.40 4.55 5.38 3.89 4.60 4.47 3.64 4.34 5.18 6.14 3.24 4.90 3.05
选中Percentiles复选框:输入2.5:单击Add: 输入97.5:单击Add: 5. 单击Continue钮 6. 单击Charts钮: 7. 选中Bar charts 8. 单击Continue钮 9. 单击OK
ppt课件
7
精确频数表--按照数值精确列表,没有组段和组距 日常需要的频数表--等距分组、且组数保持在8~15组
ppt课件
16
One-sample T Test 过程
用于检验样本所在总体均数与已 知总体均数的比较
ppt课件
17
例2 已知某地成年男子的脉搏均数为72次/分,
定量数据的描述方法课件
公式
计算方法
先计算每个数值与均值之间的差的平 方,再求平均数得到方差;再求方差 的平方根得到标准差。
方差 s²=1n[(x1−μ)²+(x2−μ)²+…+(xn−μ) ²],标准差s=s²
极差与四分位数间距
定义
极差是定量数据集中最大值与最小值之 间的差值。四分位数间距是第三四分位 数与第一四分位数的差值。它们反映了 一个数据的“范围”大小。
定量数据的描述方法课件
目录
• 定量数据的基本概念 • 描述定量数据的统计量 • 数据的图形描述方法 • 数据的数字描述方法 • 数据描述的应用场景与案例
01
定量数据的基本概念
定量数据的定义
01
定量数据是可以通过数学的方式 进行描述和分析的一类数据,其 特点是具有数值型和可测量性。
02
定量数据可以具体地表示事物或 现象的数量特征和规律性,例如 统计数据、实验数据、调查数据 等。
03
数据的图形描述方法
直方图
总结词
直方图是一种用直条矩形面积代表各组频数,各矩形面积总和代表频数的分布图。其主 要作用是表示连续变量频数分布情况。
详细描述
直方图用一系列等宽不等高的直条矩形,长度为组距,宽度为组距除以组数,绘制频率 分布的图形。其横轴代表数据所属的类别,纵轴代表频数或频率,不同颜色的矩形叠放 在一起,可以清晰地展示数据的分布情况。通过观察直方图,可以大致了解数据分布的
VS
公式ห้องสมุดไป่ตู้
极差=max(X)-min(X),第一四分位数( 25%位数) =Q1=X(1)×25\%+X(2)×25\%+…+X(4) ×25\%,第三四分位数(75%位数) =Q3=X(1)×75\%+X(2)×75\%+…+X(4) ×75\%,四分位数间距=Q3-Q1- 计算方 法:将数据按照从小到大的顺序排列,找 到最大值和最小值,计算它们的差值得到 极差;找到25%和75%的位置的数值,计 算它们之间的差值得到四分位数间距。
定量数据的统计描述PPT课件
(用数据库捕获技术建立一个新问题)
❖ Open an existing data source
(打开一个已经存在的数据源)
❖ Open another type of file (打开其它类型的文件)
.
43
(二)SPSS for Windows 的菜单命令
❖ File 文件操作 ❖ Edit 数据编辑 ❖ View 观察 (视图) ❖ Data 建立数据与数据整
筛选出来
.
6
❖ 表中是8名学生4门课程的考试成绩数据(单位:分)。 试找出统计学成绩等于75分的学生,英语成绩最高的前 三名学生,四门课程成绩都大于70分的学生。
注意:满足多项条件时,数据清单上面至少留 出三行作为条件区域
.
7
用Excel进行数据筛选的操作步骤
➢ 第一步:选择【数据】菜单,并选择 【筛选】命令。如 果要筛选出满足给定的条件的数据,可使用 【自动筛选】 命令。这时会在第一行出现下拉箭头,用鼠标点击箭头。
理 ❖ Transform 变量变换
❖ Analyze 统计分析 ❖ Graphs 作图 ❖ Utilities 实用程序 ❖ Window 视窗控制 ❖ Help 在线帮助(辅助说明)
.
44
数据编辑窗 (Data Editor)
(1)数据编辑窗主要功能:
建立新数据文件, 编辑和显示已有数据文件。 注意:一次只能打开一个数据编辑窗口。
➢ 定量数据的排序
▪ 递增排序:设一组数据为X1,X2,…,XN,递增排 序后可表示为:X(1)<X(2)<…<X(N)
▪ 递减排序可表示为:X(1)>X(2)>…>X(N)
.
13
❖ Open an existing data source
(打开一个已经存在的数据源)
❖ Open another type of file (打开其它类型的文件)
.
43
(二)SPSS for Windows 的菜单命令
❖ File 文件操作 ❖ Edit 数据编辑 ❖ View 观察 (视图) ❖ Data 建立数据与数据整
筛选出来
.
6
❖ 表中是8名学生4门课程的考试成绩数据(单位:分)。 试找出统计学成绩等于75分的学生,英语成绩最高的前 三名学生,四门课程成绩都大于70分的学生。
注意:满足多项条件时,数据清单上面至少留 出三行作为条件区域
.
7
用Excel进行数据筛选的操作步骤
➢ 第一步:选择【数据】菜单,并选择 【筛选】命令。如 果要筛选出满足给定的条件的数据,可使用 【自动筛选】 命令。这时会在第一行出现下拉箭头,用鼠标点击箭头。
理 ❖ Transform 变量变换
❖ Analyze 统计分析 ❖ Graphs 作图 ❖ Utilities 实用程序 ❖ Window 视窗控制 ❖ Help 在线帮助(辅助说明)
.
44
数据编辑窗 (Data Editor)
(1)数据编辑窗主要功能:
建立新数据文件, 编辑和显示已有数据文件。 注意:一次只能打开一个数据编辑窗口。
➢ 定量数据的排序
▪ 递增排序:设一组数据为X1,X2,…,XN,递增排 序后可表示为:X(1)<X(2)<…<X(N)
▪ 递减排序可表示为:X(1)>X(2)>…>X(N)
.
13
定量资料统计描述课件
数值型数据的分布形态描述
偏态与峰态
描述数据分布的不对称性 和尖锐程度。
正态分布
一种常见的连续概率分布 ,特点是钟形曲线,平均 数、中位数和众数相等。
分布函数
描述数据落在某个区间的 概率。
05
分类数据的统计描述
频数分布表与频数分布图
频数分布表
将分类数据按照某一分类标准进行分组,并统计每一组的频 数。
数据。
实验法
通过实验设计和实验操作获取 数据,适用于需要获取数据,适 用于自然状态下的数据收集。
文献法
通过查阅文献资料获取数据, 适用于历史数据和无法直接获
取的数据。
数据整理的步骤
数据清洗
去除无效、异常和缺失数据, 确保数据质量。
数据转换
将数据转换为统一格式,便于 后续处理和分析。
列联表
将两个分类变量交叉分组,并对每个 单元格中的观察单位数进行统计,形 成列联表,可以用来分析两个分类变 量之间的关系。
06
定量资料统计描述的应用实
例
实例一:人口普查数据统计描述
总结词
人口普查数据是典型的定量资料,统计描述方法在人口普查数据中应用广泛,用于描述人口数量、性别比例、年 龄结构等基本情况。
统计描述的基本原则
课程安排
第二章:定量资料的收集与整理 定量资料的收集方法
定量资料的整理原则
课程安排
第三章:数值变量统计描述 数值变量的集中趋势描述
数值变量的离散趋势描述
课程安排
第四章:分类变量统计描述 分类变量的频数分布描述 分类变量的相对数描述
课程安排
第五章:统计图表在描述中的应用 常用统计图形的选择与绘制
中心位置。
离散趋势指标
统计学定量的资料的统计描述29页PPT
120.1 127.6 125.8 117.0 114.0 118.2 124.8 122.1 124.1 118.2
123.0 125.1 126.1 114.6 123.4 124.7 115.2 127.0 119.9 122.5
122.8 120.1 120.9 123.9 126.6 122.4 119.4 135.3 121.7 127.7
s2i1
i1
i1
n1
n1
16
方差和标准差
n
离均差平方和 (xi x)2 :描述每个数据X 相对于 X 分布的i1 集中程度;与样本含量n 有关,样本含量不同时不宜直接比较
方差:相当于平均每个数据的离均差的 平方;可用于不同样本含量数据离散度 的比较。
自由度(degree of freedom):当 X 选定时 n个X中能自由变动的X的个数
num
频数分布图
离散型资料的频数分布图
f
y
6000
4000
2000
0
0
12Biblioteka 3456
7
8
9
10
children
12
频数分布图
连续变量
以直条的面积大小表示频数的多少 以直方面积在总面积中的比例表示频率大小
离散变量
以各直条的长短表示频数的多少
13
频数表/图的用途
揭示资料分布类型:频数图较频数表更 直观
妇女数 (2) 2734 5018 6206 5785 4341 2797 1475
655 231 64 33 29339
频率 (3) 9.32 17.10 21.15 19.72 14.80 9.53 5.03 2.23 0.79 0.22 0.11 100.00
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
的应用。
计算方法 1.直接法
X X1 X 2 ... X n
X
n
n
• Σ:希腊字母(西格马,sigma),求和符号 • 例9.2 有8名正常人的空腹血糖值(mmol/L):
6.2,5.4,5.7,5.3,6.1,6.0,5.8,5.9
X 6.2 5.4 5.7 5.3 6.1 6.0 5.8 5.9 5.8 8
4.85
6.05
3.05
4.25
5.45
血清总胆固醇(mmol/L)
Frequency
SPSS中的操作:
1.建立数据库 2.使用Frequencies
命令 3.先使用Recode 命令, 再用Frequencies命令
频数分布的类型
• 对称分布:集中位置居中,左右两边对称 • 偏态分布:正偏态分布(右偏态)峰左尾右
一、算术均数,简称均数
(arithmetic mean/mean)
• 均数是算术均数的简称。
➢总体均数用希腊字母μ(缪,mu)表示
➢样本均数 (X X bar)表示。
• 均数反映一组观察值在数量上的平均水
平。
均数的应用
• 主要用于对称性或近似对称性分布的
资料;
• 尤其是在正态分布或近似正态分布上
33.06 1705.09
频数表计算均数:
X f1x1 f2 x2 ... fk xk fx
n
n
• Xj 为各组的组中值。
组中值等于该组的上限加下限之和除以2。
• fj 为各组的频数。
•101名正常成年女子的血清总胆固醇均值为:
• X = 409.75/101 =4.06( mmol/L )
8.25
3.05
18.30
3.35
26.80
3.65
62.05
3.95
79.00
4.25
72.25
4.55
54.60
4.85
43.65
5.15
25.75
5.45
10.90
5.75
5.75
—— 409.75
f X2
6.00 22.69 55.82 89.78 226.48 312.05 307.06 248.43 211.70 132.61 59.41
定量数据的统计描述课件
第一节 频数分布
一、频数分布表
简称频数表(frequency table)
例2-1 从某单位1999年的职工体检资料中获 得101名正常成年女子的血清总胆固醇 (mmol/L)的测量结果如下,试编制频数分 布表。
试编制频数分布表。
2.35 4.21 3.32 5.35 4.17 4.13 2.78 4.26 3.58 4.34 4.84 4.41 4.78 3.95 3.92 3.58 3.66 4.28 3.26 3.50 2.70 4.61 4.75 2.91 3.91 4.59 4.19 2.68 4.52 4.91 3.18 3.68 4.83 3.87 3.95 3.91 4.15 4.55 4.80 3.41 4.12 3.95 5.08 4.53 3.92 3.58 5.35 3.84 3.60 3.51 4.06 3.07 3.55 4.23 3.57 4.83 3.52 3.84 4.50 3.96 4.50 3.27 4.52 3.19 4.59 3.75 3.98 4.13 4.26 3.63 3.87 5.71 3.30 4.73 4.17 5.13 3.78 4.57 3.80 3.93 3.78 3.99 4.48 4.28 4.06 5.26 5.25 3.98 5.03 3.51 3.86 3.02 3.70 4.33 3.29 3.25 4.15 4.36 4.95 3.00 3.26
1、频数表的编制
• 找全距(range) • 定组距(class interval):
一般分为10~15组,如组距约为全距/10
• 写组段:
– 每个组段的起点称为下限,lower limit; – 每个组段的终点称为上限,upper limit; – 下限≤X<上限
频数表的编制--续
1.计算极差 : 极大值-极小值 5.71-2.35=3.36
9
5.00 ~
5
5.30~
2
5.60 ~5.90
1
二、频数分布图(graph of frequency distribution)
• 以各组段总胆固醇含量为横轴,频数为纵轴。
Histogram
30
25
20
15
10
5
Std. Dev = .66
Mean = 4.03
0
N = 101.00
2.45
3.65
– 指变量值围绕中心数值或中心位置的分布情况。
第二节 集中趋势的描述
• 平均数(average):用于观察一组同质变
量值的平均水平/集中位置。亦称中心位置 指标。它不但给人一个简明概括的印象, 而且便于事物间的分析比较。
• 常用的平均数
– 算术均数 (arithmetic mean/mean) – 几何均数 (geometric mean) – 中位数 (median)
负偏态分布(左偏态)
对称分布
正偏态分布
负偏态分布
三、频数表和频数分布图的用途
• 揭示变量的分布特征和分布类型; • 便于进一步计算指标和统计分析处理; • 便于发现某些特大或特小的可疑值。
频数分布的两个特征
• 集中趋势,central tendency
– 指变量值的中心数值或中心位置所在。
• 离散趋势,tendency of dispersion
补充: 均数的两个重要特征(1)
• 离均差之和为零 X X 0
证
:
X
X
X
X
n
X
nX n
X
X
0
均数的两个重要特征(2)
• 离均差平方和为最小 X X 2为最小
2.频数表法(加权法)
组段
2.30~ 2.60~ 2.90~ 3.20~ 3.50 ~ 3.80 ~ 4.10 ~ 4.40 ~ 4.70 ~ 5.00 ~ 5.30~
5.60~5.90 合计
频数f
1 3 6 8 17 20 17 12 9 5 2
1 101
组中值X f X
2.45
2.45
2.75
2.组数:10 组距段: 最小组段2.3~ 最大组段5.6~5.9
4.列表划记:
101名正常成年女子的血清 总胆固醇频数分布
胆固醇组段
频数
2.30~
1
2.60~
3
2.90~
6
3.20~
8
3.50 ~
17
3.80 ~
20
4.10 ~
17
4.40 ~
12
4.70 ~
计算方法 1.直接法
X X1 X 2 ... X n
X
n
n
• Σ:希腊字母(西格马,sigma),求和符号 • 例9.2 有8名正常人的空腹血糖值(mmol/L):
6.2,5.4,5.7,5.3,6.1,6.0,5.8,5.9
X 6.2 5.4 5.7 5.3 6.1 6.0 5.8 5.9 5.8 8
4.85
6.05
3.05
4.25
5.45
血清总胆固醇(mmol/L)
Frequency
SPSS中的操作:
1.建立数据库 2.使用Frequencies
命令 3.先使用Recode 命令, 再用Frequencies命令
频数分布的类型
• 对称分布:集中位置居中,左右两边对称 • 偏态分布:正偏态分布(右偏态)峰左尾右
一、算术均数,简称均数
(arithmetic mean/mean)
• 均数是算术均数的简称。
➢总体均数用希腊字母μ(缪,mu)表示
➢样本均数 (X X bar)表示。
• 均数反映一组观察值在数量上的平均水
平。
均数的应用
• 主要用于对称性或近似对称性分布的
资料;
• 尤其是在正态分布或近似正态分布上
33.06 1705.09
频数表计算均数:
X f1x1 f2 x2 ... fk xk fx
n
n
• Xj 为各组的组中值。
组中值等于该组的上限加下限之和除以2。
• fj 为各组的频数。
•101名正常成年女子的血清总胆固醇均值为:
• X = 409.75/101 =4.06( mmol/L )
8.25
3.05
18.30
3.35
26.80
3.65
62.05
3.95
79.00
4.25
72.25
4.55
54.60
4.85
43.65
5.15
25.75
5.45
10.90
5.75
5.75
—— 409.75
f X2
6.00 22.69 55.82 89.78 226.48 312.05 307.06 248.43 211.70 132.61 59.41
定量数据的统计描述课件
第一节 频数分布
一、频数分布表
简称频数表(frequency table)
例2-1 从某单位1999年的职工体检资料中获 得101名正常成年女子的血清总胆固醇 (mmol/L)的测量结果如下,试编制频数分 布表。
试编制频数分布表。
2.35 4.21 3.32 5.35 4.17 4.13 2.78 4.26 3.58 4.34 4.84 4.41 4.78 3.95 3.92 3.58 3.66 4.28 3.26 3.50 2.70 4.61 4.75 2.91 3.91 4.59 4.19 2.68 4.52 4.91 3.18 3.68 4.83 3.87 3.95 3.91 4.15 4.55 4.80 3.41 4.12 3.95 5.08 4.53 3.92 3.58 5.35 3.84 3.60 3.51 4.06 3.07 3.55 4.23 3.57 4.83 3.52 3.84 4.50 3.96 4.50 3.27 4.52 3.19 4.59 3.75 3.98 4.13 4.26 3.63 3.87 5.71 3.30 4.73 4.17 5.13 3.78 4.57 3.80 3.93 3.78 3.99 4.48 4.28 4.06 5.26 5.25 3.98 5.03 3.51 3.86 3.02 3.70 4.33 3.29 3.25 4.15 4.36 4.95 3.00 3.26
1、频数表的编制
• 找全距(range) • 定组距(class interval):
一般分为10~15组,如组距约为全距/10
• 写组段:
– 每个组段的起点称为下限,lower limit; – 每个组段的终点称为上限,upper limit; – 下限≤X<上限
频数表的编制--续
1.计算极差 : 极大值-极小值 5.71-2.35=3.36
9
5.00 ~
5
5.30~
2
5.60 ~5.90
1
二、频数分布图(graph of frequency distribution)
• 以各组段总胆固醇含量为横轴,频数为纵轴。
Histogram
30
25
20
15
10
5
Std. Dev = .66
Mean = 4.03
0
N = 101.00
2.45
3.65
– 指变量值围绕中心数值或中心位置的分布情况。
第二节 集中趋势的描述
• 平均数(average):用于观察一组同质变
量值的平均水平/集中位置。亦称中心位置 指标。它不但给人一个简明概括的印象, 而且便于事物间的分析比较。
• 常用的平均数
– 算术均数 (arithmetic mean/mean) – 几何均数 (geometric mean) – 中位数 (median)
负偏态分布(左偏态)
对称分布
正偏态分布
负偏态分布
三、频数表和频数分布图的用途
• 揭示变量的分布特征和分布类型; • 便于进一步计算指标和统计分析处理; • 便于发现某些特大或特小的可疑值。
频数分布的两个特征
• 集中趋势,central tendency
– 指变量值的中心数值或中心位置所在。
• 离散趋势,tendency of dispersion
补充: 均数的两个重要特征(1)
• 离均差之和为零 X X 0
证
:
X
X
X
X
n
X
nX n
X
X
0
均数的两个重要特征(2)
• 离均差平方和为最小 X X 2为最小
2.频数表法(加权法)
组段
2.30~ 2.60~ 2.90~ 3.20~ 3.50 ~ 3.80 ~ 4.10 ~ 4.40 ~ 4.70 ~ 5.00 ~ 5.30~
5.60~5.90 合计
频数f
1 3 6 8 17 20 17 12 9 5 2
1 101
组中值X f X
2.45
2.45
2.75
2.组数:10 组距段: 最小组段2.3~ 最大组段5.6~5.9
4.列表划记:
101名正常成年女子的血清 总胆固醇频数分布
胆固醇组段
频数
2.30~
1
2.60~
3
2.90~
6
3.20~
8
3.50 ~
17
3.80 ~
20
4.10 ~
17
4.40 ~
12
4.70 ~