管理统计学-基于SPSS软件应用总结归纳信息管理实验报告
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
2
5.3
5.3
15.8
$24,000
2
5.3
5.3
21.1
$26,250
1
2.6
2.6
23.7
$27,300
1
2.6
2.6
26.3
$27,750
1
2.6
2.6
28.9
$27,900
1
2.6
2.6
31.6
$28,350
1
2.6
2.6
34.2
$29,100
1
2.6
2.6
36.8
$30,300
1
2.6
2.6
检验统计量b
训练后成绩-训练前成绩
Z
-1.599a
渐近显着性(双侧)
.110
a.基于负秩。
b. Wilcoxon带符号秩检验
两个方法的p值都大于0.05,所以没有显着差异
3.从甲乙两种不同工艺生产出来的产品中随机选取若干个观测数据(见产品使用寿命.SAV),分析两种工艺产品的使用寿命是否存在显着差异?
累积百分比
有效
F
13
34.2
34.2
34.2
M
25
65.8
65.8
100.0
合计
38
100.0
100.0
salary
频率
百分比
有效百分比
累积百分比
有效
$16,950
1
2.6
2.6
2.6
$21,150
1
2.6
2.6
5.3
$21,450
1
2.6
2.6
7.9
$21,750
1
2.6
2.6
10.5
$21,900
源
III型平方和
df
均方
F
Sig.
截距
假设
99641.101
1
99641.101
306.037
.038
误差
321.132
.986
325.585a
组别
假设
3290.333
2
1645.167
18.516
.000
误差
1243.927
14
88.852b
性别
假设
319.740
1
319.740
3.599
.079
1
2.6
2.6
65.8
$40,200
1
2.6
2.6
68.4
$40,800
1
2.6
2.6
71.1
$42,000
1
2.6
2.6
73.7
$42,300
1
2.6
2.6
76.3
$45,000
1
2.6
2.6
78.9
$46,000
1
2.6
2.6
81.6
$57,000
1
2.6
2.6
84.2
$60,375
1
2.6
2.6
2-new3
89
2
Male
2-new4
55
1
Female
2-new5
50
1
Male
2-new6
67
1
Female
2-new7
67
1
Male
2-new8
56
1
Female
2-new9
56
1
Male
试进行方差分析性别和教学方法是否对数学成绩影响显着,说明过程及理由。
(4)得出结论:
主体间效应的检验
因变量:数学
(2)将销售额移入因变量,广告形式移入固定因子,地区移入随机因子;
(3)点击模型,弹出窗口后点击设定来自定义,选择类型为交互,将广告形式、地区移入右边;
(4)得出结果:
主体间效应的检验
因变量:销售额
源
III 型平方和
df
均方
F
Sig.
截距
假设
642936.694
1
642936.694
1179.661
【结果分析、体会和收获】:
通过本次学习,在SPSS软件中认识到了求均值、中位数、平均数等一系列的应用,通过两次操作,更加深层了解SPSS软件。
实验三
一、实验目的与要求
1.熟练掌握T检验的SPSS操作
2.学会利用T检验方法解决身边的实际问题
二、实验原理
1.假设检验的基本原理
三、实验演示内容与步骤
1.某项分析希望通过随机调查收集到的26家保险公司人员构成的数据(见数据文件:保险公司人员工程情况.sav),对保险公司从业人员受高等教育的程度和年轻化的程度进行推断。该分析的两个原假设为:
表三组不同性别学生的数学成绩
人名
数学
组别
性别
Hxh
99
0
Male
Yaju
88
0
Female
Yu
99
0
Male
Shizg
89
0
Male
Hah
94
0
Female
S
90
0
Male
Watet
79
2
Male
Jess
56
2
Female
Wish
89
2
Male
2-new1
99
2
Male
2-new2
70
2
Female
Pearson相关性
.775**
1
显着性(双侧)
.000
N
18
18
**.在.01水平(双侧)上显着相关。
t统计量的值的显着性概率p=0.000<0.05,相关系数是显着异于0的。
二问两次评分的等级相关有多大,是否达到显着水平作出分析。
相关系数
【实验内容及要求】:
用SPSS软件对某航空公司38名职员性别和工资情况的调查数据进行频次模块分析等。
【实验过程及结果】:
(1)将数据文件按income和gender排名次。
(2)对gender和salary进行频次模块分析。
统计量
gender
salary
N
有效
38
38
缺失
0
0
gender
频率
百分比
有效百分比
2、根据95%的置信水平估计:全校本科学生平均月生活费支出的置信区间。
得到
求的均值为3547.0968
2、人均GDP的平均值
①定义新变量人均GDP
②计算变量:
人均GDP=GDP值/人口
3、求人均GDP的平均值、中位数、标准差、峰度和偏度
在分析--描述统计---描述里面
在选项里面
选中均值、标准差、峰度和偏度,点继续、确定
两个显着性概率p不都大于0.05,所以存在显着差异
实验五
1、某企业在制定某商品的广告策略时,对不同广告形式在不同地区的广告效果(销售额)进行了评估,(见数据文件:广告城市与销售额.SAV)。试以商品销售额为观测变量,广告形式和地区为控制变量,利用单因素方差分析分别对广告形式、地区对销售额的影响进行分析。
39.5
$31,050
1
2.6
2.6
42.1
$31,200
1
2.6
2.6
44.7
$31,350
2
5.3
5.3
50.0
$32,100
1
2.6
2.6
52.6
$32,550
1
2.6
2.6
55.3
$35,100
1
2.6
2.6
57.9
$36,000
1
2.6
2.6
60.5
$36,150
1
2.6
2.6
63.2
$38,850
所以中位数为0.6482
4、求出人均GDP前五位及后五位的省份
即对所有省份人均GDP进行排序
点击确定,得到前五位的省份是
后五位的省份是
5、并作出茎叶图、检验人均GDP的95%的置信区间
在分析--描述统计--探索里面
在统计量里
人居GDP的茎叶图
6根据得到的特征值对该年中国GDP和人均GDP情况作出简要分析陈述。
【实验过程及结果】:
1.收集一批周岁儿童身高的样本数据(见儿童身高.SAV),利用样本数据推断周岁儿童总体身高是否与正态分布有显着差异。(K-S检验)
显着性概率p=0.344>0.01,表明样本与正态分布没有显着差异
2.为检验某种新的训练方法是否有助于提高跳远运动员的成绩(见训练成绩.SAV),收集到10名跳远运动员在使用新训练方法前后的跳远最好成绩。这样得到了两个配对样本,在对总体分布不作任何假设的条件下,推断新方法训练前后是否存在显着差异。
86.8
$81,250
1
2.6
2.6
89.5
$92,000
1
2.6
2.6
92.1
$103,750
1
2.6
2.6
94.7
$110,625
1
2.6
2.6
97.4
$135,000
1
2.6
2.6
100.0
合计
38
100.0
100.0
(3)画出salary/100(取整后)茎叶图
【结果分析、体会和收获】:
通过本次的学习,对SPSS有了初步的了解、对一些数据的导入、变量的设置以及简单的数据分析等基本操作已经熟练掌握;但还有很多不足,对于一些复杂的分析不能完全理解。不过我会慢慢的学习,是自己可以理解的透彻,并熟练的掌握。
.000
误差
9265.306
17
545.018a
广告形式
假设
5866.083
3
1955.361
21.789
.000
误差
11037.917
123
89.739b
地区
假设
9265.306
17
545.018
6.073
.000
误差
11037.917
123
89.739b
a. MS(地区)
b. MS(错误)
3、某补习机构为研究一个班3组不同性别的同学(分别接受了3种不同的教学方法)在数学成绩上是否有显着差异,需要研究不同教学方法和不同性别对数学成绩的影响。数据如表所示。
读入数据后:
(1)点击分析,比较均值,单因素分析;
(2)得出结果:
ANOVA
销售额
平方和
df
均方
F
显着性
组间
5866.083
3
1955.361
13.483
.000
组内
20303.222
140
145.023
总数
26169.306
143
有以上结果可知:广告形式对于销售额是存在影响的。
(4)选择左框中的变量“销售额”,用箭头送入右边的因变量列表中,选择左框中的变量“广告形式”,用箭头送入右边的因子列表中;
4.对数据文件“CH6 考试及格问题.sav”中,20题,30题,40题的情况进行二项分布的参数检验,并解释结果(设α=0.05)
实验四
【实验名称】:spss非参数检验
【实验时间】:2014年4月25日
【实验目的】:
3.验证spss非参数检验
【实验内容及要求】:
用SPSS软件检验两个独立,两个相关样本分布是否相同;一组样本的总体分布是否与猜想的分布相同。
女(n=12)
92 96 86 83 78 87 70 65 70 65 70 78 72 56
3.为了研究某种减肥茶是否具有明显的减肥效果,某减肥茶生产厂商对35名肥胖志愿者进行了减肥跟踪调研(见数据文件:减肥茶.sav)。首先将其喝茶前的体重记录下来,三个月后再依次将这35名志愿者喝茶后的体重记录下来。通过这两组样本数据对比分析,推断减肥茶是否具有明显的减肥作用。
GDP的值的高低并不决定人均GDP的高低,因为人均GDP等于GDP值除以人数,GDP受人均GDP和人数共同作用。所以一个地区的GDP值很高 也不能说明该地的人均GDP很高。
二、大学生日常生活费支出及生活费来源状况
……
1.根据95%的置信水平估计:全校本科学生平均月生活费支出的置信区间。
在分析--描述统计--探索里面 ,得到
(1)保险公司具有高等教育水平的员工比例的平均值不低于0.8,即H0:μ<=0.8
(2)年青人比例的平均值与0.5无显着差异,即H0:μ=0.5
设α=0.05
2.分析某班级学生的高考数学成绩是否存在性别上的差异。数据如表所示:
某班级学生的高考数学成绩
性别
数学成绩
男(n=18)
85 89 75 58 86 80 78 76 84 89 99 95 82 87 60 85 75 80
(5)得出结论:
ANOVA
销售额
平方和
df
均方
F
显着性
组间
9265.306
17
545.018
4.062
.000
组内
16904.000
126
134.159
总数
26169.306
143
地区对于销售额也是有影响的。
对上题进行双因素分析(包括无重复和有重复)
无重复双因素分析:
操作如下:
(1)点击分析,一般线性模型,单变量;
2.学会利用普通相关分析方法解决身边的实际问题
【实验内容及要求】:1.某班级学生高等数学和统计学期末考试成绩如表所示,现要研究该班学生的高等数学和统计学成绩之间是否具有相关性,根据数据散点图及相关分析运算结果进行分析。
2.某专家先后对一个工程的多个项目加以评分,两次评分分别记为变量“分值1”和“分值2”,如下表所示。问两次评分的等级相关有多大,是否达到显着水平作出分析。
误差
1243.927
14
88.852b
a. 1.025 MS(性别) - .025 MS(错误)
b. MS(错误)
有结果可知:第六列表示的是F统计量的显着性水平。由此可知,性别对成绩的影响是显着的,组别对成绩的影响是不显着的。
实 验 六
【实验名称】:普通相关分析
【实验时间】:2013年5月20日
【实验目的】:1.熟练掌握普通相关分析的SPSS操作
实 验 二
【实验名称】:某年全国31个省、市、自治区的GDP数据分析
大学生月平均生活费支出的调查数据
【实验时间】:
【实验目的】:求数据平均值、中位数、标准差、峰度、偏度、排序和检验置信区间
【实验内容及要求】:1、求出GDP的平均值、人均GDP的平均值、中位数、标准差、峰度、偏度、前五位及后五位的省份,并作出茎叶图、检验人均GDP的95%的置信区间,根据得到的特征值对该年中国GDP和人均GDP情况作出简要分析陈述。
3.某农业实验场通过试验取得小麦产量与单位虫害值和平均温度的数据,如下表所示。求单位虫害值对产量的偏相关(剔除温度变量的影响),作简要分析。
【实验过程及结果】:一数据散点图及相关分析运算结果进行分析。
相关性
高等数学
统计学
5.3
5.3
15.8
$24,000
2
5.3
5.3
21.1
$26,250
1
2.6
2.6
23.7
$27,300
1
2.6
2.6
26.3
$27,750
1
2.6
2.6
28.9
$27,900
1
2.6
2.6
31.6
$28,350
1
2.6
2.6
34.2
$29,100
1
2.6
2.6
36.8
$30,300
1
2.6
2.6
检验统计量b
训练后成绩-训练前成绩
Z
-1.599a
渐近显着性(双侧)
.110
a.基于负秩。
b. Wilcoxon带符号秩检验
两个方法的p值都大于0.05,所以没有显着差异
3.从甲乙两种不同工艺生产出来的产品中随机选取若干个观测数据(见产品使用寿命.SAV),分析两种工艺产品的使用寿命是否存在显着差异?
累积百分比
有效
F
13
34.2
34.2
34.2
M
25
65.8
65.8
100.0
合计
38
100.0
100.0
salary
频率
百分比
有效百分比
累积百分比
有效
$16,950
1
2.6
2.6
2.6
$21,150
1
2.6
2.6
5.3
$21,450
1
2.6
2.6
7.9
$21,750
1
2.6
2.6
10.5
$21,900
源
III型平方和
df
均方
F
Sig.
截距
假设
99641.101
1
99641.101
306.037
.038
误差
321.132
.986
325.585a
组别
假设
3290.333
2
1645.167
18.516
.000
误差
1243.927
14
88.852b
性别
假设
319.740
1
319.740
3.599
.079
1
2.6
2.6
65.8
$40,200
1
2.6
2.6
68.4
$40,800
1
2.6
2.6
71.1
$42,000
1
2.6
2.6
73.7
$42,300
1
2.6
2.6
76.3
$45,000
1
2.6
2.6
78.9
$46,000
1
2.6
2.6
81.6
$57,000
1
2.6
2.6
84.2
$60,375
1
2.6
2.6
2-new3
89
2
Male
2-new4
55
1
Female
2-new5
50
1
Male
2-new6
67
1
Female
2-new7
67
1
Male
2-new8
56
1
Female
2-new9
56
1
Male
试进行方差分析性别和教学方法是否对数学成绩影响显着,说明过程及理由。
(4)得出结论:
主体间效应的检验
因变量:数学
(2)将销售额移入因变量,广告形式移入固定因子,地区移入随机因子;
(3)点击模型,弹出窗口后点击设定来自定义,选择类型为交互,将广告形式、地区移入右边;
(4)得出结果:
主体间效应的检验
因变量:销售额
源
III 型平方和
df
均方
F
Sig.
截距
假设
642936.694
1
642936.694
1179.661
【结果分析、体会和收获】:
通过本次学习,在SPSS软件中认识到了求均值、中位数、平均数等一系列的应用,通过两次操作,更加深层了解SPSS软件。
实验三
一、实验目的与要求
1.熟练掌握T检验的SPSS操作
2.学会利用T检验方法解决身边的实际问题
二、实验原理
1.假设检验的基本原理
三、实验演示内容与步骤
1.某项分析希望通过随机调查收集到的26家保险公司人员构成的数据(见数据文件:保险公司人员工程情况.sav),对保险公司从业人员受高等教育的程度和年轻化的程度进行推断。该分析的两个原假设为:
表三组不同性别学生的数学成绩
人名
数学
组别
性别
Hxh
99
0
Male
Yaju
88
0
Female
Yu
99
0
Male
Shizg
89
0
Male
Hah
94
0
Female
S
90
0
Male
Watet
79
2
Male
Jess
56
2
Female
Wish
89
2
Male
2-new1
99
2
Male
2-new2
70
2
Female
Pearson相关性
.775**
1
显着性(双侧)
.000
N
18
18
**.在.01水平(双侧)上显着相关。
t统计量的值的显着性概率p=0.000<0.05,相关系数是显着异于0的。
二问两次评分的等级相关有多大,是否达到显着水平作出分析。
相关系数
【实验内容及要求】:
用SPSS软件对某航空公司38名职员性别和工资情况的调查数据进行频次模块分析等。
【实验过程及结果】:
(1)将数据文件按income和gender排名次。
(2)对gender和salary进行频次模块分析。
统计量
gender
salary
N
有效
38
38
缺失
0
0
gender
频率
百分比
有效百分比
2、根据95%的置信水平估计:全校本科学生平均月生活费支出的置信区间。
得到
求的均值为3547.0968
2、人均GDP的平均值
①定义新变量人均GDP
②计算变量:
人均GDP=GDP值/人口
3、求人均GDP的平均值、中位数、标准差、峰度和偏度
在分析--描述统计---描述里面
在选项里面
选中均值、标准差、峰度和偏度,点继续、确定
两个显着性概率p不都大于0.05,所以存在显着差异
实验五
1、某企业在制定某商品的广告策略时,对不同广告形式在不同地区的广告效果(销售额)进行了评估,(见数据文件:广告城市与销售额.SAV)。试以商品销售额为观测变量,广告形式和地区为控制变量,利用单因素方差分析分别对广告形式、地区对销售额的影响进行分析。
39.5
$31,050
1
2.6
2.6
42.1
$31,200
1
2.6
2.6
44.7
$31,350
2
5.3
5.3
50.0
$32,100
1
2.6
2.6
52.6
$32,550
1
2.6
2.6
55.3
$35,100
1
2.6
2.6
57.9
$36,000
1
2.6
2.6
60.5
$36,150
1
2.6
2.6
63.2
$38,850
所以中位数为0.6482
4、求出人均GDP前五位及后五位的省份
即对所有省份人均GDP进行排序
点击确定,得到前五位的省份是
后五位的省份是
5、并作出茎叶图、检验人均GDP的95%的置信区间
在分析--描述统计--探索里面
在统计量里
人居GDP的茎叶图
6根据得到的特征值对该年中国GDP和人均GDP情况作出简要分析陈述。
【实验过程及结果】:
1.收集一批周岁儿童身高的样本数据(见儿童身高.SAV),利用样本数据推断周岁儿童总体身高是否与正态分布有显着差异。(K-S检验)
显着性概率p=0.344>0.01,表明样本与正态分布没有显着差异
2.为检验某种新的训练方法是否有助于提高跳远运动员的成绩(见训练成绩.SAV),收集到10名跳远运动员在使用新训练方法前后的跳远最好成绩。这样得到了两个配对样本,在对总体分布不作任何假设的条件下,推断新方法训练前后是否存在显着差异。
86.8
$81,250
1
2.6
2.6
89.5
$92,000
1
2.6
2.6
92.1
$103,750
1
2.6
2.6
94.7
$110,625
1
2.6
2.6
97.4
$135,000
1
2.6
2.6
100.0
合计
38
100.0
100.0
(3)画出salary/100(取整后)茎叶图
【结果分析、体会和收获】:
通过本次的学习,对SPSS有了初步的了解、对一些数据的导入、变量的设置以及简单的数据分析等基本操作已经熟练掌握;但还有很多不足,对于一些复杂的分析不能完全理解。不过我会慢慢的学习,是自己可以理解的透彻,并熟练的掌握。
.000
误差
9265.306
17
545.018a
广告形式
假设
5866.083
3
1955.361
21.789
.000
误差
11037.917
123
89.739b
地区
假设
9265.306
17
545.018
6.073
.000
误差
11037.917
123
89.739b
a. MS(地区)
b. MS(错误)
3、某补习机构为研究一个班3组不同性别的同学(分别接受了3种不同的教学方法)在数学成绩上是否有显着差异,需要研究不同教学方法和不同性别对数学成绩的影响。数据如表所示。
读入数据后:
(1)点击分析,比较均值,单因素分析;
(2)得出结果:
ANOVA
销售额
平方和
df
均方
F
显着性
组间
5866.083
3
1955.361
13.483
.000
组内
20303.222
140
145.023
总数
26169.306
143
有以上结果可知:广告形式对于销售额是存在影响的。
(4)选择左框中的变量“销售额”,用箭头送入右边的因变量列表中,选择左框中的变量“广告形式”,用箭头送入右边的因子列表中;
4.对数据文件“CH6 考试及格问题.sav”中,20题,30题,40题的情况进行二项分布的参数检验,并解释结果(设α=0.05)
实验四
【实验名称】:spss非参数检验
【实验时间】:2014年4月25日
【实验目的】:
3.验证spss非参数检验
【实验内容及要求】:
用SPSS软件检验两个独立,两个相关样本分布是否相同;一组样本的总体分布是否与猜想的分布相同。
女(n=12)
92 96 86 83 78 87 70 65 70 65 70 78 72 56
3.为了研究某种减肥茶是否具有明显的减肥效果,某减肥茶生产厂商对35名肥胖志愿者进行了减肥跟踪调研(见数据文件:减肥茶.sav)。首先将其喝茶前的体重记录下来,三个月后再依次将这35名志愿者喝茶后的体重记录下来。通过这两组样本数据对比分析,推断减肥茶是否具有明显的减肥作用。
GDP的值的高低并不决定人均GDP的高低,因为人均GDP等于GDP值除以人数,GDP受人均GDP和人数共同作用。所以一个地区的GDP值很高 也不能说明该地的人均GDP很高。
二、大学生日常生活费支出及生活费来源状况
……
1.根据95%的置信水平估计:全校本科学生平均月生活费支出的置信区间。
在分析--描述统计--探索里面 ,得到
(1)保险公司具有高等教育水平的员工比例的平均值不低于0.8,即H0:μ<=0.8
(2)年青人比例的平均值与0.5无显着差异,即H0:μ=0.5
设α=0.05
2.分析某班级学生的高考数学成绩是否存在性别上的差异。数据如表所示:
某班级学生的高考数学成绩
性别
数学成绩
男(n=18)
85 89 75 58 86 80 78 76 84 89 99 95 82 87 60 85 75 80
(5)得出结论:
ANOVA
销售额
平方和
df
均方
F
显着性
组间
9265.306
17
545.018
4.062
.000
组内
16904.000
126
134.159
总数
26169.306
143
地区对于销售额也是有影响的。
对上题进行双因素分析(包括无重复和有重复)
无重复双因素分析:
操作如下:
(1)点击分析,一般线性模型,单变量;
2.学会利用普通相关分析方法解决身边的实际问题
【实验内容及要求】:1.某班级学生高等数学和统计学期末考试成绩如表所示,现要研究该班学生的高等数学和统计学成绩之间是否具有相关性,根据数据散点图及相关分析运算结果进行分析。
2.某专家先后对一个工程的多个项目加以评分,两次评分分别记为变量“分值1”和“分值2”,如下表所示。问两次评分的等级相关有多大,是否达到显着水平作出分析。
误差
1243.927
14
88.852b
a. 1.025 MS(性别) - .025 MS(错误)
b. MS(错误)
有结果可知:第六列表示的是F统计量的显着性水平。由此可知,性别对成绩的影响是显着的,组别对成绩的影响是不显着的。
实 验 六
【实验名称】:普通相关分析
【实验时间】:2013年5月20日
【实验目的】:1.熟练掌握普通相关分析的SPSS操作
实 验 二
【实验名称】:某年全国31个省、市、自治区的GDP数据分析
大学生月平均生活费支出的调查数据
【实验时间】:
【实验目的】:求数据平均值、中位数、标准差、峰度、偏度、排序和检验置信区间
【实验内容及要求】:1、求出GDP的平均值、人均GDP的平均值、中位数、标准差、峰度、偏度、前五位及后五位的省份,并作出茎叶图、检验人均GDP的95%的置信区间,根据得到的特征值对该年中国GDP和人均GDP情况作出简要分析陈述。
3.某农业实验场通过试验取得小麦产量与单位虫害值和平均温度的数据,如下表所示。求单位虫害值对产量的偏相关(剔除温度变量的影响),作简要分析。
【实验过程及结果】:一数据散点图及相关分析运算结果进行分析。
相关性
高等数学
统计学