Mean过程和T检验过程
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
一、Means过程
1.简单介绍
Means过程计算指定变量的综合描述计量,包括均值、标准差、总和、观测量数、方差等一系列单变量描述统计。当观测量按一个分类变量分组时,Means 过程可以进行分组计算。例如,要计算某地区高考的数学成绩,Sex变量把考生分为男生和女生两组,Means过程可以分别计算男女生的数学成绩。Means过程还可以给出方差分析表和线性检验结果。
使用Means过程求若干组的描述统计量的目的在于比较,因此必须求均值。这是与Descriptive过程不同之处。
2.完全窗口分析
Means过程的大部分功能可以完全由窗口实现,这给用户带来了很大的方便。
(1)Means主对话框
按Analyze →Compare Means →Means的顺序单击,即可打开“Means”主对话框,如图1所示。
图1 Means主对话框
(2)Dependent框
该框中的变量作为因变量,通常认为受自变量影响或决定,因此被用来预测或建模。
要从源变量框中选取变量进入该框,只需选中所要选取的变量,然后按向右的箭头即可。
(3)Independent框
该框中的变量是自变量,又被称为预测变量或解释变量。要运行Means过程,该框中必须至少有一个变量。要从源变量框中选取变量进入该框,同样只需激活所要选取的变量,然后按向右的箭头即可。
选中变量进入该框后,可以看到上方的【Next】按钮有效,单击该按钮进入下一层,在下一层的自变量将再细分样本。要回到上一层,单击【Previous】按钮即可。
(4)Options 对话框
单击Options按钮,即可打开“Options”对话框,如图2所示。
图2 Options 对话框
①Cell Statistics框
从左边框中选择要输出的统计量进入该框,该框中的统计量是输出时显示的统计量,其排列顺序即是输出时显示的顺序。
可供选择的统计量的意义如下:
Sum(总和)、Number of cases(观测量数目)、Mean(均值)、Median(中位数)、Grouped median(分组中位数)、Standard error of the mean(均值标准误差)、Minimum(最小值)、Maximum(最大值)、Range(范围)、Standard deviation (标准差)、Variance(方差)、Kurtosis(峰度)、Standard error of kurtosis(峰度的标准差)、Skewness(偏度)、Standard error of Skewness(偏度的标准差)、First (首值)、Last(尾值)、Percentage of total sum(占总和的百分比)、Percentage of total N(占观测量总数的百分比)、Geometric mean(几何均数)、Harmonic mean (调和均数)。
②Statistics for First Layer
该栏中有两个复选框,决定对第一层自变量的有关分析。
●ANOV A table and eta复选框
选中该复选项对第一层自变量给出方差分析表和eta统计量η和η2。方差分析的零假设是,第一层自变量各水平上的因素量均值都相等。η统计量表明因变量和自变量之间联系的强度。η2是因变量中不同组中差异所解释的方差比,是组间平方和与总平方和之比。
●Tests for linearity复选框
选中该复选框产生R和R2。只有早控制变量有基本的数量级(例如自变量表示年龄或人种,不能是房子颜色或居住城市等),且自变量有三个水平以上。其检验的假设是因变量均值是第一层自变量值的线性函数。R和R2测度线性拟合的良好度。R是观测值与预测值之间的相关系数。
3.例题分析
某医师测得如下血红蛋白值(g%),用Means过程对其做基本的描述性统计分析。
(1)操作步骤
①激活数据管理窗口,输入数据文件,定义变量名:性别为sex,年龄为age,血红蛋白值hb。按顺序输入数据(sex变量中,男为1,女为2)。
②按Analyze →Compare Means →Means 的顺序单击,即可打开“means”主对话框。
③在对话框左侧的变量中选hb,单击向右按钮使之进入Dependent List框,选sex单击向右按钮使之进入Independent List框。
④单击败【Options】按钮打开“Options”对话框,从中选择统计项目:在Cell Displays项中,选中Mean、Standard deviation、Variance、Number of Cases和Sum五个复选框。
⑤在Statistics for First Layer项中,将为第一层的分组选择计算方差分析(ANOV A table and eta)和线性检验(Test of linearity)。单击【Continue】按钮返回“Means”主对话框。
⑥选age单击向右按钮使之进入Independent List框。重复④和⑤步骤,返回“Means”主对话框。
⑦在主对话框中单击【OK】钮完成。
(2)输出结果及分析
表2是我们造已熟悉的观测量摘要表,说明了观测量总个数为40,其中有效值为40 个,无效值有0。
表2 观测量摘要表
表3分为三部分,第一、第二部分先按性别分组(分男性和女性),再按年龄分组(16,17,18岁三组)计算观测值合计、均值、标准差、方差和个数;第三部分是之按年龄分组,最后一行表示40个观测值合计为457.79,均数为11.4448,标准差为2.2690,方差为5.1484,个数为40。
若在Independent List中未分层次,即sex和age一起在Layer 1of 1中,则结果是分别计算男性与女性(不作年龄分组)。16、17、18岁三组(不作性别分组)的观测值合计、均值、标准差、方差和个数,如表4、5所示。
表3 分组描述统计量
Report
血红蛋白值
表4 按性别分组的描述统计量
Report
血红蛋白值