调查资料的统计分析资料
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
项目九:调查资料的统计分析
一、频数分布与频率分布
(1) 频数分布 频数分布是指一组数据中取不同值的个
案的次数分布情况。它一般是以频数分布表 的形式表达。(见表1)
表1. 97年统计学历分布
学历 小学以下
中学 高中 中专 大专 大学 硕士 博士
Missing Total
人数 1 72 44 13 52 58 4 7 49
450wenku.baidu.com
9 000
500-599
20
合计
100
550
11 000
38 000
练习:调查100名学生的成绩得到资料如下, 求平均成绩。
表3 100名学生的成绩分布
成绩
41-60 61-80 81-100
组中值
人数
20 50 30
合计
100
注意:开口组的组中值
前面缺下限的开 口组的组中值
=上限-
邻组组距 2
组中值的计算公式为:
组中值 = 上限+下限
2
例:调查某企业100名职工的收入得到如下资料, 请计算平均收入。
表 4. 某企业百名职工收入分布
收入(元) 职工数(人)
组中值
Xf
100-199
10
150
1 500
200-299
10
250
2 500
300-399
40
350
14 000
400-499
20
(1)平均数:
平均数是使用得最多的集中量数。平均 数是指总体各单位数值之和除以总体单位 数目所得之商。
统计分析中习惯以X来表示。其计算公式
如下: ∑X
X= n
①从原始数据计算平均数
例: 某班10名学生的年龄分别为20、21、19、
19、19、20、20、21、22、18、20岁,求 他们的平均年龄。
萨姆;你欺骗我!我已经找其他工人核对过了,没 有一个人的工资超过每周100元。平均工资怎么可能 是一周300元呢?
表2. 97年学历分布
学历 小学以下
中学 高中 中专 大专 大学 硕士 博士
Missing Total
人数 1 72 44 13 52 58 4 7 49
300
Percent .3
24.0 14.7 4.3 17.3 19.3 1.3 2.3 16.3 100(n=300)
例1
某班学生的年龄分布(频数) 某班学生的年龄分布(频率)
后面缺上限的开口 =下限+ 邻组组距
组的组中值
2
平均数的作用
n
x x1 x2 xn i1 xi
n
n
能反映总体分布的集中趋势; 能反映总体现象的共性特征; 是总体分布的重要数量特征值;
小故事:骗人的“平均数”
M:吉斯莫先生有一个小工厂,生产超级小玩意儿。
年龄(岁) 学生人数 年龄(岁) 百分比
17
2
17
8
18
5
19
10
20
5
21
3
合计
25
18 19 20 21 合计
20 40 20 12 100(n=25)
例2:
频数分布:一组数据中取不 同值的个案的次数分布情 况 (数量)
频率分布:一组数据中不同 取值的频数相对于总数的 比率分布情况。通常以百 分比的形式表达。 (相对 数量)
300
频数分布表的作用: A、简化资料。
将调查得到的杂乱的 原始数据,以十分简洁 的统计表反映出来。
B、清楚地了解 调查数据的众多信息。
(2)频率分布:
一组数据中不同取值的频数相对于总数 的比率分布情况。常是以百分比的形式来表 达。(见表2)
频率分布表:是不同类别在总体中的相 对数量分布。能十分方便不同总体和不同类 别之间的比较。因此这种分布表的应用更为 普遍。
表9-1 某班学生父亲的职业分布 职业类别 工人 干部 教师 商人 农民 合计
表9-2 某班学生父亲职业分布 职业类别 工人 干部 教师 商人 农民 合计
人数 4 6 3 5 2 20
百分比 20 30 15 25 10 100
例:调查某年级150名学生的年龄得到下列结果: 表 3.某年级学生的年龄分布
M:管理人员由吉斯莫先生、他的弟弟、六个亲戚 组成。工作人员由5个领工和10个工人组成。工厂 经营得很顺利,现在需要一个新工人。
M:现在吉斯莫先生正在接见萨姆,谈工作问题。
吉斯莫:我们这里报酬不错。平均薪金是每周300 元。你在学徒期间每周得75元,不过很快就可以加 工资。
M:萨姆工作了几天之后,要求见厂长。
(二)离散程度指标 全距/极差(range) 方差(variance) 标准差(standard deviation)
(一)集中趋势分析
集中趋势分析指的是用一个典型值或代表 值来反映一组数据的一般水平,或者说反映 这组数据向这个典型值集中的情况。
最常见的集中量数有: (1)算术平均数(简称平均数,也称为均值) (2)众数 (3)中位数。
11-13 3 12 36 小说书。
14-16 2 15 30
17-19 1 18 18
总数 17
159
练习:100名工人的收入资料如下,计算他们的 平均工资。
表 100名工人的收入分布
收入
300 400 500 600
人数
30 20 30 20
合计
100
③从组距分组资料计算均值
在调查收入、年龄等方面情况时,常常得到组 距分组形式的资料,如我们知道各年龄段的人数, 若要计算平均年龄就需要计算出各组的组中值,然 后在按照单值分组资料计算平均数的公式计算。
描述统计的主要目的在于用最简单的概 括性地反映出大量数据资料所容纳的基本信 息。它的基本方法包括:集中量数分析和离 散量数分析等。
推论统计的主要目的使用从样本调查中 所得到的数据资料来推断总体的情况,主要包 括:区间估计和假设检验等。
(一)集中趋势统计指标 均值/平均数(mean) 众数(mode) 中位数(median)
年龄 17 18 19 20 21 22
合计
人数(频数) 10 25 50 40 20 5 150
频数分布
作用: 有助于明确未回答者的多少,同时也能显示
不合格答案的多少; 可以检验奇异值和极端值; 根据频数分布可以划出各种统计图形。
二、单变量描述统计
单变量统计分析分两大方面,即,描述统 计和推论统计。
②从单值分组资料计算平均数
首先要将每一个变量值乘以对应的 频数f,得出各组的数值之和,然后将 各组的数值之和全部相加,最后除以单 位总数。
∑Xf ∑Xf X = ∑f = n
青年人阅读小说书的数目
书数 f xm fxm
2-4 2 3 6
5-7 4 6 24
按照公式,可知每名
8-10 5 9 45 青年人一年来读过9.4本
一、频数分布与频率分布
(1) 频数分布 频数分布是指一组数据中取不同值的个
案的次数分布情况。它一般是以频数分布表 的形式表达。(见表1)
表1. 97年统计学历分布
学历 小学以下
中学 高中 中专 大专 大学 硕士 博士
Missing Total
人数 1 72 44 13 52 58 4 7 49
450wenku.baidu.com
9 000
500-599
20
合计
100
550
11 000
38 000
练习:调查100名学生的成绩得到资料如下, 求平均成绩。
表3 100名学生的成绩分布
成绩
41-60 61-80 81-100
组中值
人数
20 50 30
合计
100
注意:开口组的组中值
前面缺下限的开 口组的组中值
=上限-
邻组组距 2
组中值的计算公式为:
组中值 = 上限+下限
2
例:调查某企业100名职工的收入得到如下资料, 请计算平均收入。
表 4. 某企业百名职工收入分布
收入(元) 职工数(人)
组中值
Xf
100-199
10
150
1 500
200-299
10
250
2 500
300-399
40
350
14 000
400-499
20
(1)平均数:
平均数是使用得最多的集中量数。平均 数是指总体各单位数值之和除以总体单位 数目所得之商。
统计分析中习惯以X来表示。其计算公式
如下: ∑X
X= n
①从原始数据计算平均数
例: 某班10名学生的年龄分别为20、21、19、
19、19、20、20、21、22、18、20岁,求 他们的平均年龄。
萨姆;你欺骗我!我已经找其他工人核对过了,没 有一个人的工资超过每周100元。平均工资怎么可能 是一周300元呢?
表2. 97年学历分布
学历 小学以下
中学 高中 中专 大专 大学 硕士 博士
Missing Total
人数 1 72 44 13 52 58 4 7 49
300
Percent .3
24.0 14.7 4.3 17.3 19.3 1.3 2.3 16.3 100(n=300)
例1
某班学生的年龄分布(频数) 某班学生的年龄分布(频率)
后面缺上限的开口 =下限+ 邻组组距
组的组中值
2
平均数的作用
n
x x1 x2 xn i1 xi
n
n
能反映总体分布的集中趋势; 能反映总体现象的共性特征; 是总体分布的重要数量特征值;
小故事:骗人的“平均数”
M:吉斯莫先生有一个小工厂,生产超级小玩意儿。
年龄(岁) 学生人数 年龄(岁) 百分比
17
2
17
8
18
5
19
10
20
5
21
3
合计
25
18 19 20 21 合计
20 40 20 12 100(n=25)
例2:
频数分布:一组数据中取不 同值的个案的次数分布情 况 (数量)
频率分布:一组数据中不同 取值的频数相对于总数的 比率分布情况。通常以百 分比的形式表达。 (相对 数量)
300
频数分布表的作用: A、简化资料。
将调查得到的杂乱的 原始数据,以十分简洁 的统计表反映出来。
B、清楚地了解 调查数据的众多信息。
(2)频率分布:
一组数据中不同取值的频数相对于总数 的比率分布情况。常是以百分比的形式来表 达。(见表2)
频率分布表:是不同类别在总体中的相 对数量分布。能十分方便不同总体和不同类 别之间的比较。因此这种分布表的应用更为 普遍。
表9-1 某班学生父亲的职业分布 职业类别 工人 干部 教师 商人 农民 合计
表9-2 某班学生父亲职业分布 职业类别 工人 干部 教师 商人 农民 合计
人数 4 6 3 5 2 20
百分比 20 30 15 25 10 100
例:调查某年级150名学生的年龄得到下列结果: 表 3.某年级学生的年龄分布
M:管理人员由吉斯莫先生、他的弟弟、六个亲戚 组成。工作人员由5个领工和10个工人组成。工厂 经营得很顺利,现在需要一个新工人。
M:现在吉斯莫先生正在接见萨姆,谈工作问题。
吉斯莫:我们这里报酬不错。平均薪金是每周300 元。你在学徒期间每周得75元,不过很快就可以加 工资。
M:萨姆工作了几天之后,要求见厂长。
(二)离散程度指标 全距/极差(range) 方差(variance) 标准差(standard deviation)
(一)集中趋势分析
集中趋势分析指的是用一个典型值或代表 值来反映一组数据的一般水平,或者说反映 这组数据向这个典型值集中的情况。
最常见的集中量数有: (1)算术平均数(简称平均数,也称为均值) (2)众数 (3)中位数。
11-13 3 12 36 小说书。
14-16 2 15 30
17-19 1 18 18
总数 17
159
练习:100名工人的收入资料如下,计算他们的 平均工资。
表 100名工人的收入分布
收入
300 400 500 600
人数
30 20 30 20
合计
100
③从组距分组资料计算均值
在调查收入、年龄等方面情况时,常常得到组 距分组形式的资料,如我们知道各年龄段的人数, 若要计算平均年龄就需要计算出各组的组中值,然 后在按照单值分组资料计算平均数的公式计算。
描述统计的主要目的在于用最简单的概 括性地反映出大量数据资料所容纳的基本信 息。它的基本方法包括:集中量数分析和离 散量数分析等。
推论统计的主要目的使用从样本调查中 所得到的数据资料来推断总体的情况,主要包 括:区间估计和假设检验等。
(一)集中趋势统计指标 均值/平均数(mean) 众数(mode) 中位数(median)
年龄 17 18 19 20 21 22
合计
人数(频数) 10 25 50 40 20 5 150
频数分布
作用: 有助于明确未回答者的多少,同时也能显示
不合格答案的多少; 可以检验奇异值和极端值; 根据频数分布可以划出各种统计图形。
二、单变量描述统计
单变量统计分析分两大方面,即,描述统 计和推论统计。
②从单值分组资料计算平均数
首先要将每一个变量值乘以对应的 频数f,得出各组的数值之和,然后将 各组的数值之和全部相加,最后除以单 位总数。
∑Xf ∑Xf X = ∑f = n
青年人阅读小说书的数目
书数 f xm fxm
2-4 2 3 6
5-7 4 6 24
按照公式,可知每名
8-10 5 9 45 青年人一年来读过9.4本