SPSS统计分析平均数差异检验
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
(2)打开主对话框:选择“分析”|“比较均值”|“单样本T检验” 命令,打开“单样本T检验”主对话框。 (3)选择变量:将变量列表框中“绿化面积”变量移入右边的“检 验变量”列表框中。 (4)输入检验值:在“检验变量”列表框下方的“检验值”文本框 中填入检验均值56300,如图所示:
(5)单击 “确定”按钮,执行操作,输出结果。
第4章 平均数差异检验
LOGO
• 重点班的学生和一般学生的平均智商是否有差异呢?要解 决这个问题就可以运用本章将要介绍的平均数差异检验的 方法。
4.1 wk.baidu.com设检验原理
• 假设检验(hypothesis testing)是推论统计中的重要内 容,是指先提出一个假设,一般是对总体参数或总体分布 形态的假设,然后通过检验样本统计量的差异来推断总体 参数之间是不是存在差异。因为在现实调查研究中,往往 由于各种限制而无法得到总体的参数。
• 例如要调查汉族和蒙古族7岁儿童的运算能力是否存在差异 ,不可能对所有的汉族和蒙古族7岁儿童进行测试,只能通 过合理的抽样,然后对样本进行调查。这样得到的参数就 是样本参数,通过对样本的参数进行检验从而推测汉族7 岁儿童总体和蒙古族7岁儿童总体在运算能力上是否有差异 。
4.1.1 假设与假设检验
• (6)设置完成后,单击“继续”按钮返回单样本t检验主对话框 ,单击 “确定”按钮,执行操作,输出结果。
4.3.4 实例分析:全国各地区城市园林绿地面积
• 2008年的全国调查显示中国各地区平均城市园林绿地面积 约为56300公顷。假设2010又进行一次全国各地区城市园 林绿地面积的调查,试检验2010年各地区城市园林绿地面 积与2008年全国平均城市园林绿地面积是否有差异。
• 在统计学上,只能对虚无假设H0进行直接的检验。假设检 验的任务就是先假设H0是真的,然后以此为前提,如果有 不合理的现象出现则说明假设是错误的,即H0为真这一假 设是不成立的,要被拒绝。如果H0为假,就要拒绝H0并接 受H1,则研究者的假设成立;如果H0 为真,就要接受H0并 拒绝H1,则研究者的假设不能成立。这就是统计学上的“反 证法”。H1称为备择假设就是指其是预备当H0被拒绝时以供 选择的。虚无假设和备择假设互相排斥并且只有一个正确
解:在本案例中,要检验2010年各地区城市园林绿地面积与 2008年全国平均城市园林绿地面积(已知值:56300公顷 )是否有差异,即某一样本数据与某一确定均值进行比较 。虽然不知道总体分布是否是正态,但样本较大(N=30) ,狂热以运用单样本T检验。
1.操作过程
(1)建立数据文件:将调查获得数据输入数据文件中,如下表所 示,单位(公顷)。
• (4)选择自变量:在源变量框中选择作为自变量的变量,即 分组变量。单击下面的箭头按钮,该变量进入“自变量列表”框 。首先选择的自变量默认为第一层控制变量,若单击“下一张” 按钮,可以再选择其他变量作为第二层控制变量。
• (5)选择描述性统计量:单击“选项”按钮,出现“选项”对话 框,如图所示。
• (6)选择进行单因素方差分析或线性相关性检验:在“选 项”对话框的下方有两个复选按钮,分别是Anova 表 和 eta、线性相关检验,前者对第一层的自变量进行单因素方 差分析和计算变量相关程度的eta值;后者在第一层自变量 有三个以上水平时对其进行线性相关性检验。
• 在统计学中,假设一般用来指对总体参数所做的假定性说 明。
• 在 统 计 学 上 有 两 种 假 设 , 一 种 称 为 虚 无 假 设 ( null hypothesis),或叫做零假设,记为H0;一种称为备择假 设(alternative hypothesis),或叫做对立假设,记为 H1。H1是研究者提出的研究假设。
4.3 单一样本T检验
• 4.2节所介绍的均值过程可以呈现分组变量的平均值等描述 统计量,将不同的组进行一个直观的比较。在以下的三节 中将介绍的检验方法有单样本T检验、独立样本T检验、配 对样本T检验,根据数据的特征,选择运用合适的检验方法 。
4.3.1 单一样本T检验的主要功能
• 单一样本t检验是比较某一样本的平均数与某一确定总体均 值是否有统计学意义上的差异。用样本的平均数来估计样 本所代表的未知总体的平均数,通过检验样本平均数与确 定总体平均数值是否存在差异来推论未知总体是否和确定 总体一致。
(4)单击“确定”按钮,执行操作,输出结果。
• 结果分析
(1)案例处理摘要表:
结果首先呈现的是案例处理摘要表。该表格呈现了在均值 比较中参与统计分析的案例和排除的案例的个数和所占的百 分比。如下表所示,有152个数据个案参与统计处理,占总 个案数的100%,剔除的个案数为0。
(2)均值比较结果报表:
2.结果分析
(1)描述性统计量表:该表格呈现了单个样本的描述性统计量 的值,包括参与统计的单个样本的个案数(N)、均值、标准 差和均值的标准误。如下表所示,共调查了中国30个地区,平 均城市园林绿地面积为58030.63公顷,标准差为69705.957, 标准误为12726.508。
(2)单样本T检验结果报表:该样本呈现了单样本T检验的结果 ,包括T值、自由度(df)、检验的概率( Sig.)、均值差值 ,以及差分的95%置信区间。如下表所示,本案例T检验的T值 为0.136,自由度df=29,双侧T检验的概率Sig.(双侧)=0.893. 由于显著性水平为0.05,而0.893>0.05,因此接受虚无假设, 即2010年调查所得各地区平均城市园林绿地面积,与2008年调 查所得的全国平均城市园林绿地面积56300公顷无显著差异。
均值比较结果报表呈现了不同分组的描述性统计量变量,便 于直观比较。如下表所示,分别呈现了女生和男生自尊的平均 水平,女生共有85人参与检验,平均自尊得分是158.65,标准 差为27.230;男生共有67人参与检验,平均自尊得分是173.00 ,标准差为28.410;所有参与比较的被试的总数为152,自尊平 均值是164.97,标准差为28.572。
• 如图所示,是H0为真时和H1为真时的分布,两个分布是有重合的 。
• 在这个阴影部分中既有可能是H0为真也有可能H1为真。但是我们 拒绝了H1为真的可能性,这就可能又犯错误了。统计学中将这类 不该拒绝H1却拒绝了H1的错误称为Ⅱ型错误(type Ⅱ error), 这类错误的概率用β表示,所以又称β型错误,这类错误往往导 致科学发现被埋没。
• (7)设置完成后,单击“继续”按钮返回均值主对话框,单 击 “确定”按钮,执行操作,输出结果。
4.2.4 实例分析:某普通高校本科生自尊平均水平
• 在某普通高校随机抽取152名本科生,运用缺憾感量表对其 自尊水平进行测量,收集测验数据。部分数据如下所示:
1.描述不同性别学生自尊的平均水平
解:在该案例中,因变量是被试的缺憾感量表的得分,即自尊 水平;自变量是被试的性别和专业。要描述不同性别学生的 自尊平均水平,可以直接由均值比较的操作实现。
• 均值过程和前面的描述统计过程一样,可以对指定变量的 描述性统计变量进行呈现。
4.2.2 均值比较的适用条件
• 均值过程主要功能是统计变量的描述和不同组之间粗略的 比较,因此对数据没有什么要求。需要注意的是用来形成 分组的变量应该是能明确表明某种特征的变量。另外均值 过程中有一个对数据进行线性检验的功能,由“选项”对话 框中的“线性相关检验”功能实现,这要求在第一层的控制 变量要不少三个水平。
检验”命令,打开“单样本T检验”主对话框,如图所示。
• (3)选择变量:在左边的源变量列表框中选中要进行单一样 本t检验的变量名,单击中间的箭头按钮,使选中的变量进入 右边的“检验变量”列表框中。
• (4)输入检验值:在“检验变量”列表框下方的“检验值”文本 框中填入要进行检验的确定的均值。
• (5)设置置信度、选择缺失值处理方法:单击“选项”按钮, 打开“选项”对话框,如图所示。
(3)选择描述性统计量:选择描述性统计量:单击“选项”按钮, 打开“选项”对话框。因为系统已将均值作为默认的描述统计量 ,因此可以不做其他选择。单击“继续”按钮,返回“均值”主对 话框。
(4)单击“确定”按钮,执行操作,输出结果。
• 结果分析
结果除了呈现案例处理摘要表,还呈现了均值结果报表, 如下表所示。从该统计报表中不仅可以分别看出女生和男生 的平均自尊得分,还可以进一步看到不同专业的女生和男生 的平均自尊得分,以及不同专业学生总体的平均自尊得分。 例如哲学专业女生共有26人,平均自尊得分为151.46,标准 差为20.120;心理学专业的学生共有111人,平均自尊得分 为167.06,标准差为29.601。
• 然而,即使概率再小(如α=0.01)、临界区域的面积再小,任 意抽取的仍有1%的概率落入临界区域,即这种小概率事件的发生 仍有1%的可能性是合理的。这时H0是真的,然而依据假设检验的 统计逻辑却要拒绝H0,这样就犯错误了。统计学中将这类不该拒 绝H0却拒绝了H0的错误称为Ⅰ型错误(typeⅠerror),因为常用 α表示概率,所以又常称为α型错误。这种错误往往导致虚假的 科学发现。
,因此H1又称为对立假设。
4.1.2 假设检验中的小概率事件
• 小概率事件就是指一个发生概率接近零的事件,也就是一 般情况下不会发生的事件。
4.1.3 假设检验的两类错误
• 虽然小概率事件发生的可能性很小,但仍有发生的可能。
• 若设定临界概率为0.05,从某一平均数为μ0的总体中抽取
任一样本,样本平均数为。当没有落入总体分布两端5%概 率的范围内,如图阴影部分所示。
4.3.2 单一样本T检验的适用条件
• 当确定均值的总体的条件不同时,如总体是否为正态分布 以及总体方差是否已知,所适用的单一样本平均数差异检 验的方法是不同的。
4.3.3 单一样本T检验的操作过程
• 在SPSS中进行单一样本t检验的操作过程如下: • (1)打开或建立数据文件。 • (2)打开主对话框:选择“分析”|“比较均值”|“单样本T
4.2 均值比较
• 介绍了一定的假设检验的统计学知识,下面将具体讲解在 SPSS18.0中如何利用假设检验的思想对平均数的差异进行 检验。在SPSS18.0中,是由“分析”|“比较均值”下的子菜 单完成各种情况下的平均数差异检验的。先从最基本的“均 值过程”进行介绍。
4.2.1 均值比较的主要功能
2.描述不同性别和不同专业的学生的自尊平均水平
解:在该案例中,如果要描述不同性别和不同专业学生的平均 自尊水平,需要有两层分组,分别以“性别”和“专业”为 分组变量,可以通过均值比较中添加分组层次的功能来实现 。
• 操作过程
(1)打开数据文件。
(2)打开主对话框并完成变量选择:选择“分析”|“比较均值 ”|“均值”命令,打开“均值”主对话框。将因变量“自 尊”选入“因变量列表”框中,将分组变量“性别”选入“ 自变量列表”框中。单击“下一张”按钮,选择“专业”进 入“自变量列表”框中作为第二层分组变量,如图所示:
• 操作过程 (1)创建新的数据文件:变量包括被试的性别、专业和自尊。
(2)打开主对话框并完成变量选择:选择“分析”|“比较均值 ”|“均值”命令,打开“均值”对话框。将因变量“自尊 ”选入“因变量列表”框中,将分组变量“性别”选入“自 变量列表”框中,如图所示:
(3)选择描述性统计量:单击“选项”按钮,打开“选项”对话框。 因为系统已将均值作为默认的描述统计量,因此可以不做其他 选择。单击“继续”按钮,返回“均值”主对话框。
4.1.4 单侧检验和双侧检验
• 根据是否强调检验的方向性,将检验分为单侧检验和双侧 检验。双侧检验只关心两个总体参数之间是否有差异,而 不关心谁大谁小。
4.1.5 假设检验的步骤
• 假设检验一般包括以下五个步骤: • (1)根据研究问题的要求提出假设,包括虚无假设H0和备
择假设H1。 • (2)选择合适的检验统计量。 • (3)根据需要选择显著性水平α。 • (4)计算出检验统计量。 • (5)根据检验统计量做出统计决策。
4.2.3 均值比较的操作过程
• 在SPSS中均值比较的操作过程如下: • (1)打开或建立数据文件。 • (2)选择“分析”|“比较均值”|“均值”命令,打开“均值”
主对话框,如图所示。
• (3)选择因变量:对话框左面是源变量框,其中罗列了数据 文件中已命名的变量,从中选择作为因变量的变量,单击上方 的箭头按钮,该变量进入“因变量列表”框。因变量可以根据需 要选择一个或多个变量。