统计学基础知识培训PPT课件
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
距,频数密度才能准确反映频数分布的实际情况。 返回
统计学基础知识培训
13
连续数值型数据的显示方法
分组数据的图形显示——直方图 这是406例汽车的马力的直方图
60
40
20
0
50
100
150
200
汽车马力
统计学基础知识培训
14
连续数值型数据的显示方法
未分组数据的显示方法——箱线图 箱线图是由一组数据的5个特征值绘制而成的,它由一个箱子和两条线段 组成,5个特征值为:最大值、最小值、中位数和两个四分位,下面是 406例产地为美国、欧洲和日本三个地区的汽车马力值的箱线图。欧洲箱 线图有两个离群点。
300
200
汽
车
马
力
285 283
100
0
N=
249
American
71
European
79
Japanese
统计学基础知识培国训别
返回
15
你有何种数据?
1.分类数据(定类、定序) 2.连续数值型数据(定距、定比)
统计学基础知识培训
返回
16
分类数据分布的统计量指标
1.集中趋势:计算众数、中位数
众数是一组数据中出现次数最多的变量值;
SPSS实现:Analyze—Descriptive Statistics—
Descriptives
统计学基础知识培训
12
数据分组法
数据分组包括单变量分组和组距分组两种,单变量适合离散变量分 组,一般数据都使用组距分组。
数据分组的步骤:
1.确定组数,可以按斯特奇斯(Sturges)提出的经验公式来确定组 数K;K=1+lgn/lg2。n为数据的个数,对结果四舍五入即为组数;
员工级别
年龄段
Analyze——Descriptive Statistics——Crosstabs
统计学基础知识培训
返回
8
比率值的计算及显示
Analyze——Reports——Case summaries
员工级别
<30 岁
30-39 岁
40-49 岁
49-50 岁
<40岁在本 级别中的比 率
合计
员工
1.统计量:度量集中趋势的统计量包括平 均数、几何平均;度量离散趋势的统计 量包括极差、方差和标准差等。
3.数据分组:分组是根据统计分析的需要, 将原始数据按照某种标准划分成不同的 组别,形成分组数据,分组后计算数据 出现的频数,形成频数分布表。
统计学基础知识培训
11
各常用统计量的计算方法
平均值(mean):一组数据之和除以数据个数;
注:1.本表纯属虚构,如有雷同实属巧合;2.性别栏0代表男,1代表女;级 别栏0代表员工,1代表领班,2代表主管;3.绩效栏10分为满分。
统计学基础知识培训
2
数据的分类
•根据数据测量的尺度:分为定类数据、定 序数据、定距数据、定比数据
•根据描述对象与时间的关系:分为截面数 据和时间序列数据
•根据统计数据的收集方法:分为观测数据 和实验数据
员工级别
<3 0岁
30-39 岁
40-49 岁
4950岁
合计
员工
47 20
领班
7
5
主管
2
2
经理助理
— —
1
6
2 75
2
1 15
3
18
1 —— 2
合计
56 28 12 4 100
员工 领班 主管 经理助理
<30岁 30-39岁
40频数
20 10 0
统计学基础知识培训
返回
5
你想如何归纳整理数据?
1.分类计算频数和百分比
2.计算两分类变量下的频数和百分比
3.计算比率值:比率是各不同类别数值之 间的比值
统计学基础知识培训
返回
6
分类变量的图形及图表显示
员工级别
员工 领班 主管 经理助理 合计
频数
75 15 8 2 100
百分 (%)
累积百 分比 (%)
几何平均值:用于计算比率的平均,实际应用 中,主要用于社会经济现象的年平均增长率;
极差(Range):也称全距,是一组数据的最大 值和最小值之差;
方差:各变量与其均值离差平方的平均数;
标准差(std.Deviation):即是方差的平方根; 与方差不同的是,标准差具有与变量值一样的 量纲,实际的意义要比方差清楚。
统计学基础知识培训
2007年5月
统计学基础知识培训
1
根据测量尺度数据的分类
姓名 甲 乙 丙 丁 戊 戌
1999年某公司员工情况明细表
性别
级别
年龄 绩效分数
1
0
21
8.6
1
0
25
7.8
0
0
26
9.2
1
1
27
7.9
1
1
25
8.9
0
2
31
8.4
月均收入
2479 2345 2547 2689 2776 3124
中位数是一组数据排序后,处于中间位置的变量值 ;
2.离散趋势:异众比率、四分位差
异众比率是指非众数组的频数占总频数的比率,用Vr表示,Vr= (Σfi-fm)/Σfi。 四分位差也称内距或者四分间距,计算方法:Qd= QU - Ql。四分 位差反映的是50%数据的离散程度,其数值越小,说明中间数据
统计学基础知识培训
3
你想要干什么?
一.归纳、描述或者显示数据 二.观察变量和数据的分布 三.比较组间数据的不同 四.变量之间显著性关系的测度 五.相似数据分组的测度 六.相似变量的压缩测度
统计学基础知识培训
结束
4
你要归纳整理的是什么类型的数 据?
1.已分类数据(定类、定序) 2.连续、数值型数据(定距、定比)
2.确定各组的组距。组距是上限与下限的差,组距=(最大值-最小 值)/组数;
3.根据分组整理成频数分布表。
分组需要“不重不漏”,因此习惯上规定“上组限不在内”。若有 的值过大,可以设置开口组。等距分组由于各组的组距相等,各组频 数分布不受组距大小的影响,可以从频数分布中直接观察频数分布的
特征和规律,而不等距分组就必须计算频数密度,频数密度=频数/组
75% 75.00%
15% 90.00%
8% 98.00%
2% 100%
100% ——
频数
各级别员工人数表
80
频数
70
60
50
40
30
20
10
0
员工 领班 主管 经理助理
Analyze——Descriptive Statistics——Frequencies
统计学基础知识培训
返回
7
两分类变量数据的图表及图形 显示
47
20
领班
7
5
主管
2
2
经理助理 —— 1
6
2
2
1
3
1
1 ——
89.33% 75
80%
15
50%
8
50%
2
合计
56
28 12 4
84% 100
统计学基础知识培训
返回
9
如何整理连续数值型数据?
1.描述连续数值型数据的统计量及数据分 组法
2.图表显示
统计学基础知识培训
返回
10
连续数值型数据统计量及数据 分组法
统计学基础知识培训
13
连续数值型数据的显示方法
分组数据的图形显示——直方图 这是406例汽车的马力的直方图
60
40
20
0
50
100
150
200
汽车马力
统计学基础知识培训
14
连续数值型数据的显示方法
未分组数据的显示方法——箱线图 箱线图是由一组数据的5个特征值绘制而成的,它由一个箱子和两条线段 组成,5个特征值为:最大值、最小值、中位数和两个四分位,下面是 406例产地为美国、欧洲和日本三个地区的汽车马力值的箱线图。欧洲箱 线图有两个离群点。
300
200
汽
车
马
力
285 283
100
0
N=
249
American
71
European
79
Japanese
统计学基础知识培国训别
返回
15
你有何种数据?
1.分类数据(定类、定序) 2.连续数值型数据(定距、定比)
统计学基础知识培训
返回
16
分类数据分布的统计量指标
1.集中趋势:计算众数、中位数
众数是一组数据中出现次数最多的变量值;
SPSS实现:Analyze—Descriptive Statistics—
Descriptives
统计学基础知识培训
12
数据分组法
数据分组包括单变量分组和组距分组两种,单变量适合离散变量分 组,一般数据都使用组距分组。
数据分组的步骤:
1.确定组数,可以按斯特奇斯(Sturges)提出的经验公式来确定组 数K;K=1+lgn/lg2。n为数据的个数,对结果四舍五入即为组数;
员工级别
年龄段
Analyze——Descriptive Statistics——Crosstabs
统计学基础知识培训
返回
8
比率值的计算及显示
Analyze——Reports——Case summaries
员工级别
<30 岁
30-39 岁
40-49 岁
49-50 岁
<40岁在本 级别中的比 率
合计
员工
1.统计量:度量集中趋势的统计量包括平 均数、几何平均;度量离散趋势的统计 量包括极差、方差和标准差等。
3.数据分组:分组是根据统计分析的需要, 将原始数据按照某种标准划分成不同的 组别,形成分组数据,分组后计算数据 出现的频数,形成频数分布表。
统计学基础知识培训
11
各常用统计量的计算方法
平均值(mean):一组数据之和除以数据个数;
注:1.本表纯属虚构,如有雷同实属巧合;2.性别栏0代表男,1代表女;级 别栏0代表员工,1代表领班,2代表主管;3.绩效栏10分为满分。
统计学基础知识培训
2
数据的分类
•根据数据测量的尺度:分为定类数据、定 序数据、定距数据、定比数据
•根据描述对象与时间的关系:分为截面数 据和时间序列数据
•根据统计数据的收集方法:分为观测数据 和实验数据
员工级别
<3 0岁
30-39 岁
40-49 岁
4950岁
合计
员工
47 20
领班
7
5
主管
2
2
经理助理
— —
1
6
2 75
2
1 15
3
18
1 —— 2
合计
56 28 12 4 100
员工 领班 主管 经理助理
<30岁 30-39岁
40频数
20 10 0
统计学基础知识培训
返回
5
你想如何归纳整理数据?
1.分类计算频数和百分比
2.计算两分类变量下的频数和百分比
3.计算比率值:比率是各不同类别数值之 间的比值
统计学基础知识培训
返回
6
分类变量的图形及图表显示
员工级别
员工 领班 主管 经理助理 合计
频数
75 15 8 2 100
百分 (%)
累积百 分比 (%)
几何平均值:用于计算比率的平均,实际应用 中,主要用于社会经济现象的年平均增长率;
极差(Range):也称全距,是一组数据的最大 值和最小值之差;
方差:各变量与其均值离差平方的平均数;
标准差(std.Deviation):即是方差的平方根; 与方差不同的是,标准差具有与变量值一样的 量纲,实际的意义要比方差清楚。
统计学基础知识培训
2007年5月
统计学基础知识培训
1
根据测量尺度数据的分类
姓名 甲 乙 丙 丁 戊 戌
1999年某公司员工情况明细表
性别
级别
年龄 绩效分数
1
0
21
8.6
1
0
25
7.8
0
0
26
9.2
1
1
27
7.9
1
1
25
8.9
0
2
31
8.4
月均收入
2479 2345 2547 2689 2776 3124
中位数是一组数据排序后,处于中间位置的变量值 ;
2.离散趋势:异众比率、四分位差
异众比率是指非众数组的频数占总频数的比率,用Vr表示,Vr= (Σfi-fm)/Σfi。 四分位差也称内距或者四分间距,计算方法:Qd= QU - Ql。四分 位差反映的是50%数据的离散程度,其数值越小,说明中间数据
统计学基础知识培训
3
你想要干什么?
一.归纳、描述或者显示数据 二.观察变量和数据的分布 三.比较组间数据的不同 四.变量之间显著性关系的测度 五.相似数据分组的测度 六.相似变量的压缩测度
统计学基础知识培训
结束
4
你要归纳整理的是什么类型的数 据?
1.已分类数据(定类、定序) 2.连续、数值型数据(定距、定比)
2.确定各组的组距。组距是上限与下限的差,组距=(最大值-最小 值)/组数;
3.根据分组整理成频数分布表。
分组需要“不重不漏”,因此习惯上规定“上组限不在内”。若有 的值过大,可以设置开口组。等距分组由于各组的组距相等,各组频 数分布不受组距大小的影响,可以从频数分布中直接观察频数分布的
特征和规律,而不等距分组就必须计算频数密度,频数密度=频数/组
75% 75.00%
15% 90.00%
8% 98.00%
2% 100%
100% ——
频数
各级别员工人数表
80
频数
70
60
50
40
30
20
10
0
员工 领班 主管 经理助理
Analyze——Descriptive Statistics——Frequencies
统计学基础知识培训
返回
7
两分类变量数据的图表及图形 显示
47
20
领班
7
5
主管
2
2
经理助理 —— 1
6
2
2
1
3
1
1 ——
89.33% 75
80%
15
50%
8
50%
2
合计
56
28 12 4
84% 100
统计学基础知识培训
返回
9
如何整理连续数值型数据?
1.描述连续数值型数据的统计量及数据分 组法
2.图表显示
统计学基础知识培训
返回
10
连续数值型数据统计量及数据 分组法