SPSS统计分析均值比较与T检验
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
统计分析常常采取抽样研究的方法。即从总 体中随机抽取一定数量的样本进行研究来推 论总体的特性。由于总体中的每个个体间均 存在差异,即使严格遵守随机抽样原则也会 由于多抽到一些数值较大或较小的个体致使 样本统计量与总体参数之间有所不同。
由此可以得出这样的认识:均值不相等的两 个样本不一定来自均值不同的总体。 能否用 样本均数估计总体均数,两个变量均数接近 的样本是否来自均值相同的总体?换句话说, 两个样本某变量均值不同,其差异是否具有 统计意义,能否说明总体差异?这是各种研 究工作中经常提出的问题。这就要进行均值 比较。
Eta Squared:η2为组间偏差平方和与偏差 平方和总和之比。
练习题
已知97个被调查幼儿的体健资料并建立了 CHILD.sav数据文件。试按性别(X2)对身 高(X5)与体重(X4)做平均数分析。 CHILD.sav数据文件在SP11DATA文件夹下
二、T test过程
1、单一样本T检验(One-sample T Test) 检验单个变量的均值是否与给定的常数(一般为理 论值、标准值或经过大量观察所得的稳定值等)之间 存在差异。样本均数与总体均数之间的差异显著性 检验属于单一样本T检验。 举例:已知某地区12岁男孩平均身高为142.3cm。 1973年某市测量120名12岁男孩身高资料。分析该市 12岁男孩的身高与该地区平均身高有无明显差异。 建立数据库(data11--02)
线性检验结果
身高 * 年龄
Measures of Association
R
R Squared
.879
.772
Eta
Eta Squared
Leabharlann Baidu
.915
.838
R是因变量身高的观测值与预测值之间的的相 关系数,R值越接近1 表明回归方程的预测性 越好;
Eta:即η值(0~1)说明因变量与自变量之 间的联系程度;
练习题
已知某水样中含CaCO3的真值为20.7mg/L, 现用某方法重复测定该水样11次CaCO3的含 量(mg/L)为:20.99,20.41,20.10, 20.00,20.91,22.60,20.99,20.41, 20.00,23.00,22.00。问该方法测得的均值 是否偏高?
对来自正态总体的两个样本进行均值比较常使用T检 验的方法。T检验要求两个被比较的样本来自正态总 体。两个样本方差相等与不等时使用的计算t值的公 式不同。
进行方差齐次性检验使用F检验。对应的零假设是: 两组样本方差相等。p值小于0.05说明在该水平上否 定原假设,方差不齐;否则两组方差无显著性差异。
F值的计算公式是:F=S12(较大)/S22(较小)
进行均值比较及检验的过程
MEANS 过程 T test 过程
单一样本T检验 独立样本的T检验 配对样本的T检验 单因素方差分析
一、MEANS过程
MEANS过程计算指定变量的综合描述统计 量。当观测量按一个分类变量分组时, MEANS过程可以进行分组计算。例如要计算 学生的平均身高,SEX变量把学生按性别分 为男、女生两组,MEANS过程可以分别计算 男、女生平均身高。用于形成分组的变量应 该是其值数量少且能明确表明其特征的变量。
Test for linearity:线性检验,输出R和R2,只有在控制变量有基本的控制级, 且自变量有三个水平以上时才能选用。
对第一层变量的方差分析结果
身高*年龄(方差分析的变量信息) :说明是分析不同年龄的身高均值间是 否存在显著性差异; Sum of Squares(偏差平方和);df(自由度);Mean square(均方);F(方差值); sig(P值); Between Groups(组间偏差平方和):由两部分组成:Linearity是由因变量与 控制变量之间的线性关系引起的;Deviation from linearity不是由因变量与控 制变量之间的线性关系引起的; Within Groups(组内偏差平方和):各组内的变异相对于组均值的变异; Total(偏差平方和的总和):为组间偏差平方和与组内偏差平方和之和。
使用MEANS过程求若干组的描述统计量, 目的在于比较。因此必须分组求均值。这是 与Descriptives过程不同之处。
MEANS过程的基本功能是分组计算指定变 量的描述统计量。包括均值、标准差、总和、 观测量数、方差等一系列单变量描述统计量。 还可以给出方差分析表和线性检验结果。
Mean过程的数据文件要求:至少有一个连续 变量、一个分类变量(离散变量)。对连续 变量求其基本描述统计量。分类变量用来分 组。
Confidence interval:95%:置信区间项,可以自定义。 Missing Values:选择对缺失值的处理方法 Exclude cases analysis by analysis:带有缺失值的观测值当它 与分析有关时才被剔除; Exclude cases listwise:剔除所有列在Test、Grouping矩形框 中的变量带缺失值的项
以27个学生的身高为例说明操作步骤 (data11-01)
变量no编号,sex性别,age年龄,h身高,w 体重。
ANOVA table and eta:输出第一层控制变量给出的方差分析表和eta统计值η和 η2 。 η统计量表明因变量和自变量之间联系的强度。 η2 是组间平方和与总平 方和之比。
身高基本描述统计量
单样本T检验分析结果
95% Confidence Interval of the Difference(差值的95%置信 区间):95%的置信区间=均值±1.96标准误。根据上表95%置信 区间是143.048 ± 1.96×0.531即142.0~144.1之间。由此推出, 改范围与总体均数之差为142.0-142.3~144.1-142.3,即表中- 0.304和1.800的含义。实际上样本均值与总体均值142.3之间的差 值落在-0.301~1.800之间的占95%的范围包括0,由此得出样本 均数与总体均数无显著性差异。也就是样本均数与总体均数之差与 0无显著性差异。
由此可以得出这样的认识:均值不相等的两 个样本不一定来自均值不同的总体。 能否用 样本均数估计总体均数,两个变量均数接近 的样本是否来自均值相同的总体?换句话说, 两个样本某变量均值不同,其差异是否具有 统计意义,能否说明总体差异?这是各种研 究工作中经常提出的问题。这就要进行均值 比较。
Eta Squared:η2为组间偏差平方和与偏差 平方和总和之比。
练习题
已知97个被调查幼儿的体健资料并建立了 CHILD.sav数据文件。试按性别(X2)对身 高(X5)与体重(X4)做平均数分析。 CHILD.sav数据文件在SP11DATA文件夹下
二、T test过程
1、单一样本T检验(One-sample T Test) 检验单个变量的均值是否与给定的常数(一般为理 论值、标准值或经过大量观察所得的稳定值等)之间 存在差异。样本均数与总体均数之间的差异显著性 检验属于单一样本T检验。 举例:已知某地区12岁男孩平均身高为142.3cm。 1973年某市测量120名12岁男孩身高资料。分析该市 12岁男孩的身高与该地区平均身高有无明显差异。 建立数据库(data11--02)
线性检验结果
身高 * 年龄
Measures of Association
R
R Squared
.879
.772
Eta
Eta Squared
Leabharlann Baidu
.915
.838
R是因变量身高的观测值与预测值之间的的相 关系数,R值越接近1 表明回归方程的预测性 越好;
Eta:即η值(0~1)说明因变量与自变量之 间的联系程度;
练习题
已知某水样中含CaCO3的真值为20.7mg/L, 现用某方法重复测定该水样11次CaCO3的含 量(mg/L)为:20.99,20.41,20.10, 20.00,20.91,22.60,20.99,20.41, 20.00,23.00,22.00。问该方法测得的均值 是否偏高?
对来自正态总体的两个样本进行均值比较常使用T检 验的方法。T检验要求两个被比较的样本来自正态总 体。两个样本方差相等与不等时使用的计算t值的公 式不同。
进行方差齐次性检验使用F检验。对应的零假设是: 两组样本方差相等。p值小于0.05说明在该水平上否 定原假设,方差不齐;否则两组方差无显著性差异。
F值的计算公式是:F=S12(较大)/S22(较小)
进行均值比较及检验的过程
MEANS 过程 T test 过程
单一样本T检验 独立样本的T检验 配对样本的T检验 单因素方差分析
一、MEANS过程
MEANS过程计算指定变量的综合描述统计 量。当观测量按一个分类变量分组时, MEANS过程可以进行分组计算。例如要计算 学生的平均身高,SEX变量把学生按性别分 为男、女生两组,MEANS过程可以分别计算 男、女生平均身高。用于形成分组的变量应 该是其值数量少且能明确表明其特征的变量。
Test for linearity:线性检验,输出R和R2,只有在控制变量有基本的控制级, 且自变量有三个水平以上时才能选用。
对第一层变量的方差分析结果
身高*年龄(方差分析的变量信息) :说明是分析不同年龄的身高均值间是 否存在显著性差异; Sum of Squares(偏差平方和);df(自由度);Mean square(均方);F(方差值); sig(P值); Between Groups(组间偏差平方和):由两部分组成:Linearity是由因变量与 控制变量之间的线性关系引起的;Deviation from linearity不是由因变量与控 制变量之间的线性关系引起的; Within Groups(组内偏差平方和):各组内的变异相对于组均值的变异; Total(偏差平方和的总和):为组间偏差平方和与组内偏差平方和之和。
使用MEANS过程求若干组的描述统计量, 目的在于比较。因此必须分组求均值。这是 与Descriptives过程不同之处。
MEANS过程的基本功能是分组计算指定变 量的描述统计量。包括均值、标准差、总和、 观测量数、方差等一系列单变量描述统计量。 还可以给出方差分析表和线性检验结果。
Mean过程的数据文件要求:至少有一个连续 变量、一个分类变量(离散变量)。对连续 变量求其基本描述统计量。分类变量用来分 组。
Confidence interval:95%:置信区间项,可以自定义。 Missing Values:选择对缺失值的处理方法 Exclude cases analysis by analysis:带有缺失值的观测值当它 与分析有关时才被剔除; Exclude cases listwise:剔除所有列在Test、Grouping矩形框 中的变量带缺失值的项
以27个学生的身高为例说明操作步骤 (data11-01)
变量no编号,sex性别,age年龄,h身高,w 体重。
ANOVA table and eta:输出第一层控制变量给出的方差分析表和eta统计值η和 η2 。 η统计量表明因变量和自变量之间联系的强度。 η2 是组间平方和与总平 方和之比。
身高基本描述统计量
单样本T检验分析结果
95% Confidence Interval of the Difference(差值的95%置信 区间):95%的置信区间=均值±1.96标准误。根据上表95%置信 区间是143.048 ± 1.96×0.531即142.0~144.1之间。由此推出, 改范围与总体均数之差为142.0-142.3~144.1-142.3,即表中- 0.304和1.800的含义。实际上样本均值与总体均值142.3之间的差 值落在-0.301~1.800之间的占95%的范围包括0,由此得出样本 均数与总体均数无显著性差异。也就是样本均数与总体均数之差与 0无显著性差异。