多元统计分析实验指导书——实验一均值向量和协方差阵检验
多元统计分析实验指导书——实验一均值向量和协方差阵检验
实验一SPSS软件的基本操作与均值向量和协方差阵的检验【实验目的】通过本次实验,了解SPSS的基本特征、结构、运行模式、主要窗口等,了解如何录入数据和建立数据文件,掌握基本的数据文件编辑与修改方法,对SPSS有一个浅层次的综合认识。
同时能够掌握对均值向量和协方差阵进行检验。
【实验性质】必修,基础层次【实验仪器及软件】计算机及SPSS软件【实验内容】1.操作SPSS的基本方法(打开、保存、编辑数据文件)2.问卷编码3.录入数据并练习数据相关操作4.对均值向量和协方差阵进行检验,并给出分析结论。
【实验学时】4学时【实验方法与步骤】1.开机2.找到SPSS的快捷按纽或在程序中找到SPSS,打开SPSS3.认识SPSS数据编辑窗、结果输出窗、帮助窗口、图表编辑窗、语句编辑窗4.对一份给出的问卷进行编码和变量定义5.按要求录入数据6.练习基本的数据修改编辑方法7.检验多元总体的均值向量和协方差阵8.保存数据文件9.关闭SPSS,关机。
【实验注意事项】1.实验中不轻易改动SPSS的参数设置,以免引起系统运行问题。
2.遇到各种难以处理的问题,请询问指导教师。
3.为保证计算机的安全,上机过程中非经指导教师和实验室管理人员同意,禁止使用移动存储器。
4.每次上机,个人应按规定要求使用同一计算机,如因故障需更换,应报指导教师或实验室管理人员同意。
5.上机时间,禁止使用计算机从事与课程无关的工作。
【上机作业】1.定义变量:试录入以下数据文件,并按要求进行变量定义。
表1学号姓名性别生日身高(cm)体重(kg)英语(总分100分)数学(总分100分)生活费($代表人民币)200201 刘一迪男1982.01.12 156.42 47.54 75 79 345.00 200202 许兆辉男1982.06.05 155.73 37.83 78 76 435.00 200203 王鸿屿男1982.05.17 144.6 38.66 65 88 643.50 200204 江飞男1982.08.31 161.5 41.68 79 82 235.50 200205 袁翼鹏男1982.09.17 161.3 43.36 82 77 867.00 200206 段燕女1982.12.21 158 47.35 81 74200207 安剑萍女1982.10.18 161.5 47.44 77 69 1233.00 200208 赵冬莉女1982.07.06 162.76 47.87 67 73 767.80 200209 叶敏女1982.06.01 164.3 33.85 64 77 553.90 200210 毛云华女1982.09.12 144 33.84 70 80 343.00200211 孙世伟男1981.10.13 157.9 49.23 84 85 453.80200212 杨维清男1981.12.6 176.1 54.54 85 80 843.00男1981.11.21 168.55 50.67 79 79 657.40 200213 欧阳已祥200214 贺以礼男1981.09.28 164.5 44.56 75 80 1863.90200215 张放男1981.12.08 153 58.87 76 69 462.20200216 陆晓蓝女1981.10.07 164.7 44.14 80 83 476.80200217 吴挽君女1981.09.09 160.5 53.34 79 82200218 李利女1981.09.14 147 36.46 75 97 452.80200219 韩琴女1981.10.15 153.2 30.17 90 75 244.70200220 黄捷蕾女1981.12.02 157.9 40.45 71 80 253.00要求:1)变量名同表格名,以“()”内的内容作为变量标签。
多元正态分布均值向量和协差阵的检验
1T
2
~
F( p, n
m
p
1)
经ቤተ መጻሕፍቲ ባይዱ算得
X=(64,43,30.5,63),Y=(51.5,51,40,70.5)
490 -170 -120 245 502.5 60 175 -7.5
S
=-170 x -120
510 10
10 332.5
310 260
;S
= y
i 1
i 1
S Sx Sy ~ Wp (m n 2, )
又由于
mn n+m
(
X
Y)
~
N p (0, )
所以有
F
(n+m 2) (n+m
p 2) p
1T
2
~
F( p,n
m
p
1)
以后假设统计量的选取和前面统计量的选取思路是
一样的,只提出待检验的假设,然后给出统计量及其分 布,为节省篇幅,就不再重复解释。
60 175
390 50
50 450
195
-100
245 310
260
510
-7.5 195 -100 322.5
992.5
S
Sx
S
= y
-110 55
252.5
-110 900 60 505
55 60 802.5 160
252.5
505
其中,T 2 (n 1)[ n ( X 0 )T S 1 n ( X 0 )]
给定检验水平,查F分布表,使PF F =,确定出临界值F。
第二章均值向量和协方差阵的检验
若m元随机向量X=(X1,…,Xm)T的概率密度函数为
f(x1,…,xm) = (2π)- m/2 |Σ|- 0.5 exp{--0.5(x—μ)T Σ-1 (x—μ)}
其中μ、Σ分别是X的均值向量和协方差阵,则称X为m元正态分 布。记作X ~ N (μ, Σ)。
正态随机变量的线性函数的分布
定理1.已知XN(,2),则Y=a+bXN(a+b,b22)
1) 1)
S12 / σ12 S22 / σ22
i1
~ F ( n1 -1 ,n2 -1 ) .
§3 正态总体参数的假设检验
一、单总体均值的假设检验
iid
~ 设X1,,X n N(, 2 ),给定检验水平,由观测
值 x1,,xn检验假设H0: 0
1、2已知的情形---U检验
2
2
检验统计量: T X μ0 ~ t(n1) Sn
由p{|T|>t/2(n 1)} =,
得水平为的拒绝域为
|T|>t/2(n1)
·右侧HT问题 H0: =0 ;H1: >0
·左侧HT问题 H0: =0 ;H1: <0
检验统计量: T X μ0 ~ t(n1) Sn
)
(
y2
2 2
)2
21 2 1 2
1 0, 2 0, x , y
X与Y的边缘密度函数为:
fX (x) f (x, y)dy
1
e
(
x1 )2 212
,
x
2 1
fY ( y) f (x, y)dx
多元实验报告
多元实验报告实验一:多元正态总体的均值和方差的假设检验〔综合性实验〕实验原理:利用正态检验统计量对给定的多维数据进行正态性检验。
实验目的:〔1〕掌握单一多元正态总体均值的检验;〔2〕掌握两个多元正态总体均值向量的检验。
实验内容:单一多元正态总体均值向量的检验,有相等协差阵的两个正态总体均值向量的检验,有相等未知协差阵的两个正态总体均值向量的检验,协差阵不等的两个正态总体均值向量的检验。
实验题目:实验二:判别分析〔设计性实验〕实验原理:判别分析是判别样品所属类型的一种统计方法。
判别分析是在研究对象分成假设干类型〔或组别〕并已取得各种类型的一批样品的观测数目,在此根底上根据某些准那么建立判别式,然后对未知类型的样品进行判别分类。
本实验要求学生应用距离判别准那么〔即,对任给的一次观测,假设它与第i类的重心距离最近,就认为它来自第i类〕,对两总体和多总体情形下分别进行判别分析。
实验中需注意协方差矩阵相等时,选取线性判别函数;协方差矩阵不相等时,应选取二次判别函数。
实验目的及要求:判别分析是判别样品所属类型的一种统计方法。
本实验要求学生应用距离判别准那么〔即,对任给的一次观测,假设它与第i类的重心距离最近,就认为它来自第i类〕,对两总体和多总体情形下分别进行判别分析。
实验中需注意协方差矩阵相等时,选取线性判别函数;协方差矩阵不相等时,应选取二次判别函数。
实验题目:实验三:聚类分析〔设计性实验〕〔2课时〕实验原理:聚类分析的目的是将分类对象按一定规那么分为假设干类,这些类不是事先给定的,而是根据数据的特征确定的。
在同一类里的这些对象在某种意义上倾向于彼此相似,而在不同的类里的对象倾向于不相似。
系统聚类法是聚类分析中用的最多的一种,其根本思想是:开始将n个对象各自作为一类,并规定对象之间的距离和类与类之间的距离,然后将距离最近的两类合并成一个新类,计算新类与其它类之间的距离;重复进行两个最近类的合并,每次减少一类,直至所有的对象合并为一类。
多元统计分析变量样本均值和协方差阵的相等检验
实验名称
变量样本均值和协方差阵的相等检验
姓名
学号
班级
实验地点
实验日期
指导教师
实验目的:
1.检验样本均值和协方差阵是否相等。
2.检验变量是否符合正态分布。
涉及实验的相关情况介绍(包含使用软件或实验设备等情况):
1、实验设备:一台电脑、互联网、SAS软件、投影仪。
2、实验相关知识点:
样本均值和协方差阵的估计
变量是否服从正态分布
实验报告(2):
在主要城市废气中主要污染物排放情况数据中六个变量互不影响,工业二氧化硫,工业氮氧化物,工业烟尘都符合正态分布,而生活二氧化硫,生活氮氧化物,生活烟尘在QQ图上的表现较为符合正态分布。
注实验报告电子版命名方式为:学号+姓名+实验名称。
实验过程:
1.自行车租用数据:
样本均值和协方差阵估计
样本均值相等
BOX’S M-协方差相等
检验变量是否服从正态分布
实验结论(1):
在自行车租用数据中四个变量互不影响,互不相关,变量都符合正态分布。在实验中,பைடு நூலகம்行单变量正态检验时,从QQ图,箱型图可以得出变量服从正态分布。
2.“主要城市废气中主要污染物排放情况”
第四讲均值向量和协方差阵的检验
2
若两总体协差阵相等且未知时,
n1n2 ˆ 1 ( X Y ) ~ T 2 ( p, n n 2) T ( X Y )' 1 2 n1 n2
2
根据两个样本可得μ1和μ2的无偏估计量为
1 n1 x xi n1 i 1 1 n2 y yi n2 i 1 1 1 X Y ~ N p 0,( ) n21 n2 n1n2 X Y ~ N p 0, n1 n2
L1 L2 ˆ 又 ~ Wp (n1 n2 2, ) n1 n2 2
检验原k个观测指标向量之间的互协方差阵是否为零,就是要 检验如下的假设:
H0 : ij 0, i j, i, j 1, 2,, k
若对此p维观测指标向量进行了n次观测,得到了一个容量 为n的样本 x(1) , x(2) , x(n )
并已计算出了样本叉积矩阵向量,则可将此样本叉积 矩阵按原k个观测指标向量进行分块,得到如下的分块 叉积矩阵为:
方差分析表
协方差阵的检验
单个总体协方差阵相等的检验
总体协方差阵是否等于已知常数矩阵的检验
H0 : 0 , H1 : 0
总体协方差阵是否等于已知常数矩阵倍数的 检验
H0 : 0 , H1 : 0
2 2
多总体协方差阵相等的检验
假设有k个多元正态总体,它们的分布分别 为 N p (1, 1 ),, N p (k , k ) 。现从每个总体中分别 随机抽取了一个样本,要根据这些样本,对于 这些总体的协方差阵是否相同进行检验。 首先,列出原假设和备择假设。它们分别为:
应用多元统计分析-第四章 均值向量和协差阵检验
假设检验的过程-以妇女身高为例
形式上,上面的关于总体均值的H0 相对 于H1的检验记为:
H 0 : 160cm H1 : 160cm
我们将 H1 : 160cm 的假设称为双 尾检验 ,即前面说述的假设检验。
假设检验的过程-以妇女身高为例
如果备选假设为: H1 : 160cm
第三,确定显著性水平 根据样本所得的数据来拒绝零假设的概 率应小于0.05,当然也可能是0.01, 0.005,0.001等等。 显著性水平就是小概率水平,但小概率 并不能说明不会发生,仅仅是发生的概 率很小罢了。拒绝正确零假设的错误常 被称为第一类错误(type I error)。
假设检验的过程
有第一类错误,就有第二类错误; 那是备选假设正确时反而说零假设正确 的错误,称为第二类错误(type II error)。 在一般的假设检验问题中,由于备选假 设往往不是一个点,所以无法算出犯第 二类错误的概率。
假设检验的过程
第四,根据数据计算检验统计量的实现 值(t-值)和根据这个实现值计算p-值; 这一步一般都可由计算机软件来完成。 第五,进行判断:如果p-值小于或等于a, 就拒绝零假设,这时犯错误的概率最多 为 ;如果p-值大于 ,就不拒绝零假 设,因为证据不足。
这就是双尾概率,p值为0.045,即p=4.5%
假设检验的过程-以妇女身高为例
首先要提出一个原假设,如妇女身高的 均值等于160cm( 160cm )。这种原假 设也称为零假设(null hypothesis),记 为H0。 与此同时必须提出对立假设,如妇女身 高均值不等于160cm( 160cm )。对立 假设又称为备选假设或备择假设 (alternative hypothesis)记为H1。
多元统计分析——均值向量和协方差阵检验
多元统计分析——均值向量和协方差阵检验均值向量检验是评估两个或多个总体均值是否相等的方法。
在多元统计分析中,均值向量检验常用于比较不同组别或条件下的均值是否有差异。
假设有k个样本组别,每个组别有n个观测值,那么总共有nk个观测值。
假设每个观测值有p个测量变量,那么每个样本组别的均值向量可以表示为一个p维的向量。
我们的目标是比较这k个均值向量是否相等。
常用的均值向量检验方法有Hotelling's T-squared统计量和Wilks' Lambda统计量。
Hotelling's T-squared统计量是基于方差-协方差阵的一个推广,它考虑了样本组别的大小和协方差结构。
它的计算公式为:T^2=n(p-k)/(k(n-1))*(x1-x)^TS^(-1)(x1-x)其中,n是每个组别的观测数,p是变量的个数,k是组别的个数,x1是第一个组别的均值向量,x是总体均值向量,S是协方差阵。
T^2的分布是一个自由度为k,维度为p的非中心F分布。
Wilks' Lambda统计量是基于协方差阵的特征值的一个变换,它的计算公式为:Lambda = ,W,/,B其中,W是所有组别的散布矩阵(Within-groups scatter matrix),B是总体的散布矩阵(Between-groups scatter matrix)。
Wilks' Lambda的分布是一个自由度为k和n-k-1的F分布。
协方差阵检验是评估两个或多个总体协方差阵是否相等的方法。
在多元统计分析中,协方差阵检验常用于比较不同组别或条件下的变量之间的协方差结构是否有差异。
假设有k个样本组别,每个组别有n个观测值,那么总共有nk个观测值。
假设每个观测值有p个测量变量,那么每个样本组别的协方差阵可以表示为一个p维的矩阵。
我们的目标是比较这k个协方差阵是否相等。
常用的协方差阵检验方法有Hotelling-Lawley's Trace统计量和Pillai-Bartlett's Trace统计量。
多元统计分析第二章均值、方差检验
H1
2 方差 σ 12 , σ 2 已知 统计量 z
2 方差σ 12 , σ 2 未知但相等 统计量t
在显著水平α 下拒绝 H0,若 Ⅰ Ⅱ Ⅲ
µ1 = µ 2 µ1 = µ 2 µ1 = µ 2
µ1 ≠ µ 2 µ1 > µ 2 µ1 < µ 2
2012-3-1
16 cxt
500g 例1:如果你买了一包标有 500g 重的一包 红糖,你觉得份量不足。 红糖,你觉得份量不足。于是你找到监督部 门;当然他们会觉得一包份量不够可能是随 机的。 机的。于是监督部门就去商店称了 50 包红 );其中均值 其中均值( 糖(数据在 sugar.sav );其中均值(平 均重量) 498.35g 500g 均重量)是 498.35g ;这的确比 500g 少, 但这是否能够说明厂家生产的这批红糖平均 起来不够份量呢?于是需要统计检验。 起来不够份量呢?于是需要统计检验。
2012-3-1 10 cxt
2.1 均值向量的检验
1、正态总体均值检验的类型 根据样本对其总体均值大小进行检验( One根据样本对其总体均值大小进行检验( OneSample T Test ) 如妇女身高的检验。 根据来自两个总体的独立样本对其总体均值的检验 ( Indepent Two-Sample T Test ) 如两个班平均成绩的检验。 配对样本的检验( Pair配对样本的检验( Pair-Sample T Test ) 如减肥效果的检验。 多个总体均值的检验
µ = µ0
2012-3-1
14 cxt
如根据大量调查,已知健康成年男性的脉搏 均数为72次/分,某医生在一山区随即抽查 了25名健康男性,求得其脉搏均数为74.2次 /分,标准差为6.0次/分,问是否能据此认 为该山区成年男性的脉搏均数高于一般成年 男性。
均值向量和协方差阵的检验实验报告
均值向量和协方差阵的检验实验报告嘿,大家好!今天咱们聊聊一个听上去挺高大上的话题,均值向量和协方差阵的检验。
这听起来就像在说外星人的语言,其实也没那么复杂,咱们慢慢来,轻松愉快地搞定它。
想象一下你在和朋友聚会,大家都在聊各自的生活,分享自己的故事。
每个人的经历就像一组数据,有的高高兴兴,有的郁郁寡欢,这些故事就形成了一个均值向量。
均值向量呢,就是这些故事的“平均水平”,能告诉我们大家的普遍状况。
比如说,某个朋友总是出去旅游,那他在这个聚会里的均值肯定就比其他人高。
这其实很有趣,感觉每个人的生活就像一根根串珠,串在一起的就是大家的均值。
再说到协方差阵,这玩意儿就像一个大网,把每个人的故事串联起来。
它能告诉你不同数据之间的关系。
想象一下,你和你的小伙伴经常一起吃饭,这种关系就像是协方差阵的体现。
它不仅仅告诉你们的吃饭频率,还能分析出你们吃什么、什么时候吃,以及这段友情对你们生活的影响。
换句话说,协方差阵帮我们理解这些数据是怎么互动的。
在我们的实验中,咱们主要是想检验一下这些均值和协方差是不是合理。
这时候,就需要一些统计的方法。
大家可能会觉得统计是个无聊的领域,满是公式和计算,简直让人打哈欠。
其实不然,这个过程就像侦探在寻找证据,解决一个个谜团。
我们拿到数据,就像是拿到了一张藏宝图。
通过计算均值、协方差,咱们一点点挖掘出其中的秘密。
检验均值向量和协方差阵的过程可不简单,得用到一些统计检验的方法,比如t检验和卡方检验。
这些方法就像是咱们的工具箱,各种工具都有其独特的用途。
有的用来比较均值,有的用来检查数据的分布。
想象一下,一个厨师在厨房里忙碌,调料、锅具、食材各司其职,最后做出一顿美味的大餐。
咱们在统计的世界里也是如此,得心应手才能得出正确的结论。
在这个过程中,数据可得经过一番“洗礼”。
有时,咱们会发现数据里藏着一些“异常值”,这些就像是在聚会上讲冷笑话的人,让人哭笑不得。
为了让我们的结果更靠谱,就得把这些“冷笑话”给去掉,保持数据的干净整洁。
多元统计分析——均值向量和协方差阵检验33页PPT
46、法律有权打破平静。——马·格林 47、在一千磅法律里,没有一盎司仁 爱。— —英国
48、法律一多,公正就少。——托·富 勒 49、犯罪总是以惩罚相补偿;只有处 罚才能 使犯罪 得到偿 还。— —达雷 尔
50、弱者比强者更能富 ❖ 丰富你的人生
71、既然我已经踏上这条道路,那么,任何东西都不应妨碍我沿着这条路走下去。——康德 72、家庭成为快乐的种子在外也不致成为障碍物但在旅行之际却是夜间的伴侣。——西塞罗 73、坚持意志伟大的事业需要始终不渝的精神。——伏尔泰 74、路漫漫其修道远,吾将上下而求索。——屈原 75、内外相应,言行相称。——韩非
多元统计分析实验报告
1.实验目的:(1)掌握均值向量及协方差阵的检验方法。
(2)能够用SPSS软件或R软件实现均值及协方差阵的检验,并正确理解输出结果。
2.实验内容均值向量检验和协方差阵检验3.实验步骤(1)在进行比较分析之前,首先要对数据是否遵从多元正态分布进行检验。
对数据进行以下操作“Analyze-descriptive statistics-explore”。
图一图二单击plots,选择正态分布检验,单击continue,ok 得出结果。
图三(2)多元正态分布有关均值与方差的检验,单击“Analyze-general linear model-multivariate”,得到下图。
图4Options打开,将省份导入display means for中,如图5,continue继续,ok运行。
图54.实验结果(或心得体会)Tests of NormalityKolmogorov-Smirnov a Shapiro-WilkStatistic df Sig. Statistic df Sig.年末总户数(户).116 94 .003 .942 94 .000 年末总人口(万人).406 94 .000 .659 94 .000 地方财政一般预算收入(万元).174 94 .000 .842 94 .000 行政区域土地面积.177 94 .000 .837 94 .000 其中:乡村户数.141 94 .000 .924 94 .000 地方财政一般预算支出.258 94 .000 .777 94 .000 城乡居民储蓄存款余额.230 94 .000 .603 94 .000 规模以上工业企业个数.167 94 .000 .854 94 .000 普通中学在校学生数.336 94 .000 .588 94 .000。
第二章均值向量和协方差阵的检验
r
nk
总平方和 : SST (X (k) X k ) 2 ; j
k 1 j1
r
1 n k (k) 式中X k X j 是第k个组的均值 n k j1 1 r n k (k) X k X j , 是总均值, n n1 n r . n k 1 j1
多总体均值的检验
2
2
(1) X 1(1) , , X n1 ~ N ( 1 , 2 ) (2) X 1(2) , , X n2 ~ N ( 2 , 2 )
பைடு நூலகம்
( X 1( r ) , , X nrr ) ~ N ( r , 2 )
假设r个总体的方差相等,要检验的假设就是
H 0 : 1 r , H1 : 至少存在i j, 使得i j
2013-7-23
目录 上页 下页 返回 结束
14
§2.1.4
多总体均值的检验
这个检验的统计量与下列平方和密切相关
组间平方和 : SS(TR) n k (X K X) 2 ;
k 1 r
组内平方和 : SSE (X (k) X k ) 2 ; j
一个指标检验的回顾 多元均值检验 两总体均值的比较 多总体均值的检验
2013-7-23
目录 上页 下页 返回 结束
3
§2.1.2
(ⅰ)协方差阵Σ已知
多元均值检验
类似于(2.3)的统计量(注意(2.3)的形式)是
n( x 0 ) ( x 0 )
2 0 ' 1
2
(2.5)
nk
(2.16)
W SST ( X(jk ) X )( X (j k ) X ) /
均值向量和协方差阵的检验
实验报告实验课程名称多元统计分析实验项目名称均值向量和协方差阵的检验年级 09级专业统计学生姓名周江学号 01理学院实验时间:2011年 10 月 4 日学生实验室守则一、按教学安排准时到实验室上实验课,不得迟到、早退和旷课。
二、进入实验室必须遵守实验室的各项规章制度,保持室内安静、整洁,不准在室内打闹、喧哗、吸烟、吃食物、随地吐痰、乱扔杂物,不准做与实验内容无关的事,非实验用品一律不准带进实验室。
三、实验前必须做好预习(或按要求写好预习报告),未做预习者不准参加实验。
四、实验必须服从教师的安排和指导,认真按规程操作,未经教师允许不得擅自动用仪器设备,特别是与本实验无关的仪器设备和设施,如擅自动用或违反操作规程造成损坏,应按规定赔偿,严重者给予纪律处分。
五、实验中要节约水、电、气及其它消耗材料。
六、细心观察、如实记录实验现象和结果,不得抄袭或随意更改原始记录和数据,不得擅离操作岗位和干扰他人实验。
七、使用易燃、易爆、腐蚀性、有毒有害物品或接触带电设备进行实验,应特别注意规范操作,注意防护;若发生意外,要保持冷静,并及时向指导教师和管理人员报告,不得自行处理。
仪器设备发生故障和损坏,应立即停止实验,并主动向指导教师报告,不得自行拆卸查看和拼装。
八、实验完毕,应清理好实验仪器设备并放回原位,清扫好实验现场,经指导教师检查认可并将实验记录交指导教师检查签字后方可离去。
九、无故不参加实验者,应写出检查,提出申请并缴纳相应的实验费及材料消耗费,经批准后,方可补做。
十、自选实验,应事先预约,拟订出实验方案,经实验室主任同意后,在指导教师或实验技术人员的指导下进行。
十一、实验室内一切物品未经允许严禁带出室外,确需带出,必须经过批准并办理手续。
学生所在学院:理学院专业:统计班级:09(1)班实验步骤:1.在SPSS软件的数据窗口依次定义变量,并输入要进行检验的数据。
2.首先要对数据是否遵从多元分布进行检验:Analyze-Descriptive Statistic-Explore....进入对话框,选中净资产收益率、总资产报酬率、资产负载率、总资产周转率、流动资产周转率、已获利息倍数、销售增长率及资本积累率八个变量到Dependend List框中,点击进入Plots对话框,选中Normality Plots with tests复选项以输出有关正态性检验的图表,Continue继续,OK运行,则得到结果。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
实验一SPSS软件的基本操作与均值向量和协方差阵的检验【实验目的】通过本次实验,了解SPSS的基本特征、结构、运行模式、主要窗口等,了解如何录入数据和建立数据文件,掌握基本的数据文件编辑与修改方法,对SPSS有一个浅层次的综合认识。
同时能够掌握对均值向量和协方差阵进行检验。
【实验性质】必修,基础层次【实验仪器及软件】计算机及SPSS软件【实验内容】1.操作SPSS的基本方法(打开、保存、编辑数据文件)2.问卷编码3.录入数据并练习数据相关操作4.对均值向量和协方差阵进行检验,并给出分析结论。
【实验学时】4学时【实验方法与步骤】1.开机2.找到SPSS的快捷按纽或在程序中找到SPSS,打开SPSS3.认识SPSS数据编辑窗、结果输出窗、帮助窗口、图表编辑窗、语句编辑窗4.对一份给出的问卷进行编码和变量定义5.按要求录入数据6.练习基本的数据修改编辑方法7.检验多元总体的均值向量和协方差阵8.保存数据文件9.关闭SPSS,关机。
【实验注意事项】1.实验中不轻易改动SPSS的参数设置,以免引起系统运行问题。
2.遇到各种难以处理的问题,请询问指导教师。
3.为保证计算机的安全,上机过程中非经指导教师和实验室管理人员同意,禁止使用移动存储器。
4.每次上机,个人应按规定要求使用同一计算机,如因故障需更换,应报指导教师或实验室管理人员同意。
5.上机时间,禁止使用计算机从事与课程无关的工作。
【上机作业】1.定义变量:试录入以下数据文件,并按要求进行变量定义。
表1学号姓名性别生日身高(cm)体重(kg)英语(总分100分)数学(总分100分)生活费($代表人民币)200201 刘一迪男1982.01.12 156.42 47.54 75 79 345.00 200202 许兆辉男1982.06.05 155.73 37.83 78 76 435.00 200203 王鸿屿男1982.05.17 144.6 38.66 65 88 643.50 200204 江飞男1982.08.31 161.5 41.68 79 82 235.50 200205 袁翼鹏男1982.09.17 161.3 43.36 82 77 867.00 200206 段燕女1982.12.21 158 47.35 81 74200207 安剑萍女1982.10.18 161.5 47.44 77 69 1233.00 200208 赵冬莉女1982.07.06 162.76 47.87 67 73 767.80 200209 叶敏女1982.06.01 164.3 33.85 64 77 553.90 200210 毛云华女1982.09.12 144 33.84 70 80 343.00200211 孙世伟男1981.10.13 157.9 49.23 84 85 453.80200212 杨维清男1981.12.6 176.1 54.54 85 80 843.00男1981.11.21 168.55 50.67 79 79 657.40 200213 欧阳已祥200214 贺以礼男1981.09.28 164.5 44.56 75 80 1863.90200215 张放男1981.12.08 153 58.87 76 69 462.20200216 陆晓蓝女1981.10.07 164.7 44.14 80 83 476.80200217 吴挽君女1981.09.09 160.5 53.34 79 82200218 李利女1981.09.14 147 36.46 75 97 452.80200219 韩琴女1981.10.15 153.2 30.17 90 75 244.70200220 黄捷蕾女1981.12.02 157.9 40.45 71 80 253.00要求:1)变量名同表格名,以“()”内的内容作为变量标签。
对性别(Sex)设值标签“男=0;女=1”。
2)正确设定变量类型。
其中学号设为数值型;日期型统一用“mm/dd/yyyy“型号;生活费用货币型。
3)变量值宽统一为10,身高与体重、生活费的小数位2,其余为0。
2.(1)试录入以下数据文件,保存为“数据1.sav”。
表2序号性别职称在公司工作的时间年龄工资1 男2 5 30 20002 女 2 4 25 19003 女 2 5 28 20004 男 1 1 25 15005 男 3 8 35 30006 男 2 3 29 18507 男 3 10 34 32008 女 2 8 30 19509 女 1 3 27 160010 女 4 15 38 420011 男 3 8 35 300012 男 2 5 32 200013 女 1 2 25 155014 女 2 9 30 210015 女 3 14 34 350016 女 1 3 26 160017 男 4 10 36 400018 女 3 9 34 315019 男 2 6 28 180020 男 2 2 28 180021 女 2 3 28 185022 男 2 10 30 190023 男 3 20 50 340024 男 3 16 45 330025 男 4 25 48 480026 男 4 10 34 450027 女 2 5 29 200028 女 3 15 38 320029 女 1 1 25 150030 男 3 6 35 3100(2)试录入以下数据文件,保存为“数据2.sav”。
表3序号性别职称在公司工作的时间年龄工资31 男 3 16 46 330032 男 4 30 51 500033 男 4 10 33 450034 女 2 5 29 200035 女 1 5 33 150036 女 4 18 48 470037 男 3 5 37 305038 男 3 15 38 320039 男 4 18 48 470040 男 3 6 35 3100(3)试将数据2合并到数据1,合并后的数据文件另存为“数据3.sav”。
(4)将工资进行重编码,2000以下(含2000)为1,2000-3000为2,3000-4000为3,4000以上为4,重编码的结果保存为“工资等级”。
新数据文件保存为“数据4.sav”。
(5)求出各职工刚进入公司时的年龄,保存为“初入年龄”。
新数据文件保存为“数据5.sav”。
(6)试按各职员的工资数进行排秩,排秩要求工资最高的排为第一,相同数额取平均等级。
排秩后的数据文件保存为“数据6.sav”。
(7)试按各职员的工资数分性别进行排序,要求先排男性,后排女性。
同一性别按工资从高到低排列。
排序后的数据文件保存为“数据7.sav”。
3.某航空公司38名职员性别和工资情况的调查数据表4 某航空公司38名职员基本情况调查数据表Id Gender Id Gender Id Gender1 M 14 F 27 M2 M 15 M 28 M3 F 16 M 29 M4 F 17 M 30 M5 M 18 M 31 M6 M 19 M 32 M7 M 20 F 33 M8 F 21 F 34 M9 F 22 M 35 M10 F 23 F 36 F11 F 24 F 37 M12 M 25 F 38 M13 M 26 M表5 某航空公司38名职员收入情况调查数据表Id Salary Id Salary Id Salary1 $57,000 14 $35,100 27 $60,3752 $40,200 15 $27,300 28 $32,5503 $21,450 16 $40,800 29 $135,0004 $21,900 17 $46,000 30 $31,2005 $45,000 18 $103,750 31 $36,1506 $32,100 19 $42,300 32 $110,6257 $36,000 20 $26,250 33 $42,0008 $21,900 21 $38,850 34 $92,0009 $27,900 22 $21,750 35 $81,25010 $24,000 23 $24,000 36 $31,35011 $30,300 24 $16,950 37 $29,10012 $28,350 25 $21,150 38 $31,35013 $27,750 26 31050(1)将表1数据输入到SPSS的数据编辑窗口中,将gender定义为字符型变量,保存数据文件,命名为“gender.sav”。
(2)将表2数据输入到SPSS的数据编辑窗口中,将salary定义为数值型变量,保存数据文件,命名为“salary.sav”。
(3)将两个数据文件合成一个数据文件,命名为“Employee Data.sav”。
(4)要求将数据文件“Employee Data.sav”按照变量salary(收入)进行升序排序,并建立一个新数据文件“Employee Data(sorted).sav”放置排序以后的结果。
(5)要求将数据文件“Employee Data.sav”按照变量gender(性别)进行分组,对每一组的变量salary计算其算术平均数,并计算其最大观察值,并建立一个新数据文件“Employee Data(aggregate).sav”放置分类汇总以后的结果。
(6)要求以gender(性别)对数据文件“Employee Data.sav”进行拆分,并要求在以后的统计分析中可以将各拆分文件的统计分析结果放在同一表格中显示。
(看不出操作结果,熟悉该操作过程即可)。
(7)要求在“Employee Data.sav”文件中,标识工资在30000元以上的员工。
标识变量名设为s_ed变量标签为工资学历标识。
并把文件保存为“Employee Data(counted).sav”4.大学生的素质高低要受各方面因素的影响,其中包括家庭环境与家庭教育(x1)、学校生活环境(x2)、学校周围环境(x3)和个人向上发展的心理动机(x4)等。
从某大学在校学生中抽取了20 人对以上因素在自己成长和发展过程中的影响程度给予评分(以9分制),数据如表6所示:表6学生x1 x2x3x4学生x1x2x3x41 5 6 9 8 11 9 32 82 8 53 6 12 9 6 3 43 9 6 7 9 13 8 6 7 84 9 2 2 8 14 9 3 8 65 9 4 3 7 15 9 3 4 66 9 5 37 16 9 6 2 87 6 9 5 5 17 7 4 3 98 8 5 4 4 18 6 8 4 99 8 4 3 7 19 9 6 8 910 9 4 3 6 20 8 7 6 8假定x=(x1,x2,x3,x4)’服从四元正态分布。