定量数据的统计描述PPT讲稿
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
2.组数:10 组距 3.36/10=0.336 取0.3
3.分组段: 最小组段2.3~ 最大组段5.6~5.9
4.列表划记:
101名正常成年女子的血清 总胆固醇频数分布
胆固醇组段
频数
2.30~
1
2.60~
3
2.90~
6
3.20~
8
3.50 ~
17
3.80 ~
20
4.10 ~
17
4.40 ~
12
4.70 ~
1、频数表的编制
• 找全距(range) • 定组距(class interval):
一般分为10~15组,如组距约为全距/10
• 写组段:
– 每个组段的起点称为下限,lower limit; – 每个组段的终点称为上限,upper limit; – 下限≤X<上限
频数表的编制--续
1.计算极差 : 极大值-极小值 5.71-2.35=3.36
2.频数表法(加权法)
组段
2.30~ 2.60~ 2.90~ 3.20~ 3.50 ~ 3.80 ~ 4.10 ~ 4.40 ~ 4.70 ~ 5.00 ~ 5.30~
5.60~5.90 合计
频数f
1 3 6 8 17 20 17 12 9 5 2
1 101
组中值X f X
2.45
2.45
2.75
8.25
3.05
18.30
3.35
26.80
3.65
62.05
3.95
79.00
4.25
72.25
4.55
54.60
4.85
43.65
5.15
25.75
5.45
10.90
5.75
5.75
—— 409.75
f X2
6.00 22.69 55.82 89.78 226.48 312.05 307.06 248.43 211.70 132.61 59.41
33.06 1705.09
频数表计算均数:
X f1x1 f2 x2 ... fk xk fx
n
n
• Xj 为各组的组中值。
组中值等于该组的上限加下限之和除以2。
• fj 为各组的频数。
•101名正常成年女子的血清总胆固醇均值为:
• X = 409.75/101 =4.06( mmol/L )
定量数据的统计描述课件
第一节 频数分布
一、频数分布表
简称频数表(frequency table)
例2-1 从某单位1999年的职工体检资料中获 得101名正常成年女子的血清总胆固醇 (mmol/L)的测量结果如下,试编制频数分 布表。
试编制频数分布表。
2.35 4.21 3.32 5.35 4.17 4.13 2.78 4.26 3.58 4.34 4.84 4.41 4.78 3.95 3.92 3.58 3.66 4.28 3.26 3.50 2.70 4.61 4.75 2.91 3.91 4.59 4.19 2.68 4.52 4.91 3.18 3.68 4.83 3.87 3.95 3.91 4.15 4.55 4.80 3.41 4.12 3.95 5.08 4.53 3.92 3.58 5.35 3.84 3.60 3.51 4.06 3.07 3.55 4.23 3.57 4.83 3.52 3.84 4.50 3.96 4.50 3.27 4.52 3.19 4.59 3.75 3.98 4.13 4.26 3.63 3.87 5.71 3.30 4.73 4.17 5.13 3.78 4.57 3.80 3.93 3.78 3.99 4.48 4.28 4.06 5.26 5.25 3.98 5.03 3.51 3.86 3.02 3.70 4.33 3.29 3.25 4.15 4.36 4.95 3.00 3.26
负偏态分布(左偏态)
对称分布
正偏态分布
负偏态分布
Baidu Nhomakorabea
三、频数表和频数分布图的用途
• 揭示变量的分布特征和分布类型; • 便于进一步计算指标和统计分析处理; • 便于发现某些特大或特小的可疑值。
频数分布的两个特征
• 集中趋势,central tendency
– 指变量值的中心数值或中心位置所在。
• 离散趋势,tendency of dispersion
4.85
6.05
3.05
4.25
5.45
血清总胆固醇(mmol/L)
Frequency
SPSS中的操作:
1.建立数据库 2.使用Frequencies
命令 3.先使用Recode 命令, 再用Frequencies命令
频数分布的类型
• 对称分布:集中位置居中,左右两边对称 • 偏态分布:正偏态分布(右偏态)峰左尾右
一、算术均数,简称均数
(arithmetic mean/mean)
• 均数是算术均数的简称。
➢总体均数用希腊字母μ(缪,mu)表示
➢样本均数 (X X bar)表示。
• 均数反映一组观察值在数量上的平均水
平。
均数的应用
• 主要用于对称性或近似对称性分布的
资料;
• 尤其是在正态分布或近似正态分布上
9
5.00 ~
5
5.30~
2
5.60 ~5.90
1
二、频数分布图(graph of frequency distribution)
• 以各组段总胆固醇含量为横轴,频数为纵轴。
Histogram
30
25
20
15
10
5
Std. Dev = .66
Mean = 4.03
0
N = 101.00
2.45
3.65
– 指变量值围绕中心数值或中心位置的分布情况。
第二节 集中趋势的描述
• 平均数(average):用于观察一组同质变
量值的平均水平/集中位置。亦称中心位置 指标。它不但给人一个简明概括的印象, 而且便于事物间的分析比较。
• 常用的平均数
– 算术均数 (arithmetic mean/mean) – 几何均数 (geometric mean) – 中位数 (median)
补充: 均数的两个重要特征(1)
• 离均差之和为零 X X 0
证
:
X
X
X
X
n
X
nX n
X
X
0
均数的两个重要特征(2)
• 离均差平方和为最小 X X 2为最小
的应用。
计算方法 1.直接法
X X1 X 2 ... X n
X
n
n
• Σ:希腊字母(西格马,sigma),求和符号 • 例9.2 有8名正常人的空腹血糖值(mmol/L):
6.2,5.4,5.7,5.3,6.1,6.0,5.8,5.9
X 6.2 5.4 5.7 5.3 6.1 6.0 5.8 5.9 5.8 8
3.分组段: 最小组段2.3~ 最大组段5.6~5.9
4.列表划记:
101名正常成年女子的血清 总胆固醇频数分布
胆固醇组段
频数
2.30~
1
2.60~
3
2.90~
6
3.20~
8
3.50 ~
17
3.80 ~
20
4.10 ~
17
4.40 ~
12
4.70 ~
1、频数表的编制
• 找全距(range) • 定组距(class interval):
一般分为10~15组,如组距约为全距/10
• 写组段:
– 每个组段的起点称为下限,lower limit; – 每个组段的终点称为上限,upper limit; – 下限≤X<上限
频数表的编制--续
1.计算极差 : 极大值-极小值 5.71-2.35=3.36
2.频数表法(加权法)
组段
2.30~ 2.60~ 2.90~ 3.20~ 3.50 ~ 3.80 ~ 4.10 ~ 4.40 ~ 4.70 ~ 5.00 ~ 5.30~
5.60~5.90 合计
频数f
1 3 6 8 17 20 17 12 9 5 2
1 101
组中值X f X
2.45
2.45
2.75
8.25
3.05
18.30
3.35
26.80
3.65
62.05
3.95
79.00
4.25
72.25
4.55
54.60
4.85
43.65
5.15
25.75
5.45
10.90
5.75
5.75
—— 409.75
f X2
6.00 22.69 55.82 89.78 226.48 312.05 307.06 248.43 211.70 132.61 59.41
33.06 1705.09
频数表计算均数:
X f1x1 f2 x2 ... fk xk fx
n
n
• Xj 为各组的组中值。
组中值等于该组的上限加下限之和除以2。
• fj 为各组的频数。
•101名正常成年女子的血清总胆固醇均值为:
• X = 409.75/101 =4.06( mmol/L )
定量数据的统计描述课件
第一节 频数分布
一、频数分布表
简称频数表(frequency table)
例2-1 从某单位1999年的职工体检资料中获 得101名正常成年女子的血清总胆固醇 (mmol/L)的测量结果如下,试编制频数分 布表。
试编制频数分布表。
2.35 4.21 3.32 5.35 4.17 4.13 2.78 4.26 3.58 4.34 4.84 4.41 4.78 3.95 3.92 3.58 3.66 4.28 3.26 3.50 2.70 4.61 4.75 2.91 3.91 4.59 4.19 2.68 4.52 4.91 3.18 3.68 4.83 3.87 3.95 3.91 4.15 4.55 4.80 3.41 4.12 3.95 5.08 4.53 3.92 3.58 5.35 3.84 3.60 3.51 4.06 3.07 3.55 4.23 3.57 4.83 3.52 3.84 4.50 3.96 4.50 3.27 4.52 3.19 4.59 3.75 3.98 4.13 4.26 3.63 3.87 5.71 3.30 4.73 4.17 5.13 3.78 4.57 3.80 3.93 3.78 3.99 4.48 4.28 4.06 5.26 5.25 3.98 5.03 3.51 3.86 3.02 3.70 4.33 3.29 3.25 4.15 4.36 4.95 3.00 3.26
负偏态分布(左偏态)
对称分布
正偏态分布
负偏态分布
Baidu Nhomakorabea
三、频数表和频数分布图的用途
• 揭示变量的分布特征和分布类型; • 便于进一步计算指标和统计分析处理; • 便于发现某些特大或特小的可疑值。
频数分布的两个特征
• 集中趋势,central tendency
– 指变量值的中心数值或中心位置所在。
• 离散趋势,tendency of dispersion
4.85
6.05
3.05
4.25
5.45
血清总胆固醇(mmol/L)
Frequency
SPSS中的操作:
1.建立数据库 2.使用Frequencies
命令 3.先使用Recode 命令, 再用Frequencies命令
频数分布的类型
• 对称分布:集中位置居中,左右两边对称 • 偏态分布:正偏态分布(右偏态)峰左尾右
一、算术均数,简称均数
(arithmetic mean/mean)
• 均数是算术均数的简称。
➢总体均数用希腊字母μ(缪,mu)表示
➢样本均数 (X X bar)表示。
• 均数反映一组观察值在数量上的平均水
平。
均数的应用
• 主要用于对称性或近似对称性分布的
资料;
• 尤其是在正态分布或近似正态分布上
9
5.00 ~
5
5.30~
2
5.60 ~5.90
1
二、频数分布图(graph of frequency distribution)
• 以各组段总胆固醇含量为横轴,频数为纵轴。
Histogram
30
25
20
15
10
5
Std. Dev = .66
Mean = 4.03
0
N = 101.00
2.45
3.65
– 指变量值围绕中心数值或中心位置的分布情况。
第二节 集中趋势的描述
• 平均数(average):用于观察一组同质变
量值的平均水平/集中位置。亦称中心位置 指标。它不但给人一个简明概括的印象, 而且便于事物间的分析比较。
• 常用的平均数
– 算术均数 (arithmetic mean/mean) – 几何均数 (geometric mean) – 中位数 (median)
补充: 均数的两个重要特征(1)
• 离均差之和为零 X X 0
证
:
X
X
X
X
n
X
nX n
X
X
0
均数的两个重要特征(2)
• 离均差平方和为最小 X X 2为最小
的应用。
计算方法 1.直接法
X X1 X 2 ... X n
X
n
n
• Σ:希腊字母(西格马,sigma),求和符号 • 例9.2 有8名正常人的空腹血糖值(mmol/L):
6.2,5.4,5.7,5.3,6.1,6.0,5.8,5.9
X 6.2 5.4 5.7 5.3 6.1 6.0 5.8 5.9 5.8 8