双变量的统计分析之均值比较与检验PPT(共49页)
合集下载
双变量的统计分析之均值比较与检验
三、例题分析
仍以表5-1的资料来说明。 1、操作步骤 1)按Analyze—Compare Means— Independent-Sample T Test 顺序,打开主对话框。打开数据文件“Means过程.sav”。 2)将变量hb选入 Test Variable框。 3)在sex选入Grouping Variable框中作为检验变量。 4)打开Define Groups对话框,在Group1输入1, Group2输 入2,单击Continue,再单击OK。
表6—1 是观测量摘要表,观测量总 个数为40,其中有效值为40个、无效值0 。
What is 城市轨道交通 urban rail transport
精品ppt模板
表6—2 分组描述统计量
表6—2 分三部分:第一、二部分先按性
别分组,再按年龄分组计算观测值合计、均
数、标准差、方差和个数;第三部分只按年
5
2 17 8.99 19 2 18 8.54
33 2 18 10.09
6
2 17 11.35 20 2 17 7.78
34 2 18 12.55
7
1 17 14.56 21 2 16 11.36 35 1 18 16.04
8
1 16 12.40 22 1 16 12.78 36 1 18 13.78
精品ppt模板
图6-7 Options对话框
Missing Values: 在检验变量中含 有缺失值的观测将 不被计算。
在任何一个变量 中含有缺失值的观 测都将不被计算
三、例题分析
仍以表5-1的资料来说明。已知另一地区
16-18岁的少年血红蛋白平均值为11.657g%
,检验这一地区16-18岁少年血红蛋白值是
《双变量的统计分析》课件
双变量的统计分析
目 录
• 引言 • 双变量统计分析基础 • 双变量相关性分析 • 双变量回归分析 • 双变量分布与检验 • 实际应用案例分析
01
引言
主题介绍
01
双变量统计分析是统计学中的一种重要方法,用于 研究两个变量之间的关系。
02
它可以帮助我们了解两个变量之间的关联程度、因 果关系以及预测关系。
非线性相关性分析
识别非线性关系
通过观察数据分布和散点图,识别两个变量之间是否 存在非线性关系。
非线性模型拟合
选择适合的非线性模型(如多项式回归、逻辑回归等 )来描述两个变量之间的非线性关系。
模型评估与验证
对非线性模型进行评估和验证,确保模型的可靠性和 预测能力。
相关性检验
选择相关性检验方法
01
根据数据类型和分布,选择适合的相关性检验方法(如卡方检
力越强。
02
案例2
分析股票价格与成交量之间的关系。通过分析股票市场数据,发现股票
价格和成交量之间存在正相关关系,即价格上涨时成交量增加,价格下
跌时成交量减少。
03
案例3
研究广告投入与销售额之间的关系。通过分析某品牌广告投入和销售额
数据,发现广告投入和销售额之间存在正相关关系,即广告投入越多,
销售额越高。
回归模型的评估与优化
在建立回归模型后,需要对模型进行评估和优化 ,以确保其准确性和可靠性。
评估指标包括决定系数 (R^2)、调整决定系数 (Adj R^2)、均方误差 (MSE) 等。
优化可以通过添加或删除变量、改变模型形式、 使用交叉验证等技术来实现。
05
双变量分布与检验
双变量正态分布检验
正态性检验
目 录
• 引言 • 双变量统计分析基础 • 双变量相关性分析 • 双变量回归分析 • 双变量分布与检验 • 实际应用案例分析
01
引言
主题介绍
01
双变量统计分析是统计学中的一种重要方法,用于 研究两个变量之间的关系。
02
它可以帮助我们了解两个变量之间的关联程度、因 果关系以及预测关系。
非线性相关性分析
识别非线性关系
通过观察数据分布和散点图,识别两个变量之间是否 存在非线性关系。
非线性模型拟合
选择适合的非线性模型(如多项式回归、逻辑回归等 )来描述两个变量之间的非线性关系。
模型评估与验证
对非线性模型进行评估和验证,确保模型的可靠性和 预测能力。
相关性检验
选择相关性检验方法
01
根据数据类型和分布,选择适合的相关性检验方法(如卡方检
力越强。
02
案例2
分析股票价格与成交量之间的关系。通过分析股票市场数据,发现股票
价格和成交量之间存在正相关关系,即价格上涨时成交量增加,价格下
跌时成交量减少。
03
案例3
研究广告投入与销售额之间的关系。通过分析某品牌广告投入和销售额
数据,发现广告投入和销售额之间存在正相关关系,即广告投入越多,
销售额越高。
回归模型的评估与优化
在建立回归模型后,需要对模型进行评估和优化 ,以确保其准确性和可靠性。
评估指标包括决定系数 (R^2)、调整决定系数 (Adj R^2)、均方误差 (MSE) 等。
优化可以通过添加或删除变量、改变模型形式、 使用交叉验证等技术来实现。
05
双变量分布与检验
双变量正态分布检验
正态性检验
统计学 两样本均数比较的t检验ppt课件
1、打开SPSS软件,输入数据,如下图示
数据
注意组别和数据, 不要输错或错位 还有2个数据没有 显示出来!
组别
二、用SPSS软件处理问题
2、选择SPSS软件中的方法
为什么 要输入 “1”和 “2”?
输入 “1” 输入 “2”
变色,点击
显示
显示后点击
二、用SPSS软件处理问题
3、软件分析结果
者与健康成人的血磷值是否不同?
患 者 x1:0.84,1.05,1.20,1.20,1.39,1.53,
1.67,1.80,1.87,2.07,2.11 健康人x2:0.54,0.64,0.64,0.75,0.76,0.81, 1.16,1.20,1.34,1.35,1.48,1.56,1.87
怎么处理这一问题?
个值呢,还是其他的某个特定值?
3、研究设计采用的是那种方式? 4、资料的分布(参考,一般为正态分布) 本例经综合分析用“两样本均数比较的t 检 验”,也可用“成组设计的方差分析”。
方法选定后采用何种方式进行分析?
传统(手工)分析
北京
SPSS软件分析
还有骑自行车的,如用计算软件
传统分析方法(见教材)
处理此问题的流程
选用统计分析方法(综合判断)
进行分析(传统分析方法/软件分析)
分析结果解释(根据P值下结论)
首要任务是选择正确的方法
研究目的 设计方式 资料类型 分布情况
综合判断
怎么选择具体的分析方法?
1、此资料是什么类型?
2、两组资料进行血磷值比较,是比较2组
数据的最大值、最小值、其中的某个或某几
二、用SPSS软件处理问题
5、软件分析结果与传统分析结果(见教材)比较
数据
注意组别和数据, 不要输错或错位 还有2个数据没有 显示出来!
组别
二、用SPSS软件处理问题
2、选择SPSS软件中的方法
为什么 要输入 “1”和 “2”?
输入 “1” 输入 “2”
变色,点击
显示
显示后点击
二、用SPSS软件处理问题
3、软件分析结果
者与健康成人的血磷值是否不同?
患 者 x1:0.84,1.05,1.20,1.20,1.39,1.53,
1.67,1.80,1.87,2.07,2.11 健康人x2:0.54,0.64,0.64,0.75,0.76,0.81, 1.16,1.20,1.34,1.35,1.48,1.56,1.87
怎么处理这一问题?
个值呢,还是其他的某个特定值?
3、研究设计采用的是那种方式? 4、资料的分布(参考,一般为正态分布) 本例经综合分析用“两样本均数比较的t 检 验”,也可用“成组设计的方差分析”。
方法选定后采用何种方式进行分析?
传统(手工)分析
北京
SPSS软件分析
还有骑自行车的,如用计算软件
传统分析方法(见教材)
处理此问题的流程
选用统计分析方法(综合判断)
进行分析(传统分析方法/软件分析)
分析结果解释(根据P值下结论)
首要任务是选择正确的方法
研究目的 设计方式 资料类型 分布情况
综合判断
怎么选择具体的分析方法?
1、此资料是什么类型?
2、两组资料进行血磷值比较,是比较2组
数据的最大值、最小值、其中的某个或某几
二、用SPSS软件处理问题
5、软件分析结果与传统分析结果(见教材)比较
第五章均值比较与检验详解演示文稿
22
第二十二页,共48页。
H0
5.3 单样本T检验
1、单样本T检验目的和步骤
(1)单样本T检验的目的 单样本T检验的目的是利用来自某总体的样本数据,推断该总 体的均值是否与指定的检验值之间存在显著性差异。它是对 总体均值的假设检验。
例如,从新生的入学成绩的抽样数据推断平均成绩是否为75分; 在人口普查中,某地区职工今年的平均收入是否和往年的平均收 入有显著差异。
H0
5.3单样本T检验
2、单样本T检验的操作界面
从候选变量框中选择要进行T检验的变 量移入此框中,可同时选择多个变量, 此时,SPSS就将分别产生多个变量的 T检验分析结果。
在此框中输入检验值,即检验与什么 值有无显著性差异。
第二十七页,共48页。
图5-3
单击该按钮 弹出Option对话框,该对话框用 于指定置信水平和缺失值的处理方法
p 0.5
H1
5
第五页,共48页。
H0
5.1 统计推断与假设检验
2、假设检验的几个概念 (2)假设检验的两类错误
➢ 第一类错误:在假设检验中拒绝了本来是正确的零 假设,称为“弃真”错误 。
➢ 第二类错误:在假设检验中没有拒绝本来是错误的零
假设,称为“取伪”错误 。
6
第六页,共48页。
H0
5.1 统计推断与假设检验
18
第十八页,共48页。
H0
5.2 Means过程
3、实例分析
➢结果分析
19
第十九页,共48页。
H0
5.2 Means过程
3、实例分析
➢结果分析
表5.4是性别的单因素方差分析,在下一章会详细介绍方差分析,此处不再详细 讲述。表中的Sig.值远大于0.05,说明不同性别受教育的人口数量没有显著性差 异。
第二十二页,共48页。
H0
5.3 单样本T检验
1、单样本T检验目的和步骤
(1)单样本T检验的目的 单样本T检验的目的是利用来自某总体的样本数据,推断该总 体的均值是否与指定的检验值之间存在显著性差异。它是对 总体均值的假设检验。
例如,从新生的入学成绩的抽样数据推断平均成绩是否为75分; 在人口普查中,某地区职工今年的平均收入是否和往年的平均收 入有显著差异。
H0
5.3单样本T检验
2、单样本T检验的操作界面
从候选变量框中选择要进行T检验的变 量移入此框中,可同时选择多个变量, 此时,SPSS就将分别产生多个变量的 T检验分析结果。
在此框中输入检验值,即检验与什么 值有无显著性差异。
第二十七页,共48页。
图5-3
单击该按钮 弹出Option对话框,该对话框用 于指定置信水平和缺失值的处理方法
p 0.5
H1
5
第五页,共48页。
H0
5.1 统计推断与假设检验
2、假设检验的几个概念 (2)假设检验的两类错误
➢ 第一类错误:在假设检验中拒绝了本来是正确的零 假设,称为“弃真”错误 。
➢ 第二类错误:在假设检验中没有拒绝本来是错误的零
假设,称为“取伪”错误 。
6
第六页,共48页。
H0
5.1 统计推断与假设检验
18
第十八页,共48页。
H0
5.2 Means过程
3、实例分析
➢结果分析
19
第十九页,共48页。
H0
5.2 Means过程
3、实例分析
➢结果分析
表5.4是性别的单因素方差分析,在下一章会详细介绍方差分析,此处不再详细 讲述。表中的Sig.值远大于0.05,说明不同性别受教育的人口数量没有显著性差 异。
双变量的统计分析相关分析 PPT
双变量的统计分析相关分析
那么中国得情况如何? 白威廉(William Parish)得研究最具影响力,白氏通过对
中国大陆1972-1978年间迁居香港得132位移民得访谈, 得到了她们2865位邻居得数据,发现:对于那些在“文革” 前(1966年前)就年满20岁得同期群案例来说,父亲得 “受教育水平”与“职业地位”对子女得受教育水平, 父亲得“职业地位”与“阶级出身”对子女得“职业地 位”获得等具有显著影响作用。但对于那些在“文革” 时期才年满20岁得同期群案例来说,作用却并不显著。 谢文和林南于1983年在北京得调查(N=1774)、林南和 边燕杰于1985在天津得调查(N=1000)等进一步证实:父 亲得职业地位既对人们得初职地位获得毫无影响,也对 人们目前职业地位得获得缺少明显作用。 林南与边燕杰将“工作单位部门”这一具有国家社会 主义特色得指标作为中介变量,置于职业地位之前进行 检验。研究发现,虽然父亲得职业地位对子女得教育和 职业地位获得缺少统计意义得影响,但父亲得“工作单 位部门”却通过对儿子“工作单位部门”得作用而影响 了儿子得初职地位获得,但女儿却无此殊荣。
3
变量之间得关系
两个变量之间得关系 多个变量之间得关系。 在多数情况下,多个变量之间得关系又可以分
解为若干个两个变量之间得关系,也就就是说 多个变量之间得关系可以通过若干个两个变量 间得关系来描述。
4
5
知识点
双变量间关系得种类 主要得双变量得测量方法 (1)交互分析—列联表分析 (2)不同层次变量得测量法 (3)自变量和因变量得关系 相关分析和因果分析
22
•理解:x对y得可认知程度
如假定不知道x得值,我们在认识y时得全部 误差就是E1。我们知道x得值,可以根据x得值 来认识y得值时得误差得总数(不可认知得部 分)为E2,那么用x得值来预测y得值时减少得 误差就就是E1-E2,这个值( E1-E2 )与y全部误 差得比例,则称谓消减了得误差比例
那么中国得情况如何? 白威廉(William Parish)得研究最具影响力,白氏通过对
中国大陆1972-1978年间迁居香港得132位移民得访谈, 得到了她们2865位邻居得数据,发现:对于那些在“文革” 前(1966年前)就年满20岁得同期群案例来说,父亲得 “受教育水平”与“职业地位”对子女得受教育水平, 父亲得“职业地位”与“阶级出身”对子女得“职业地 位”获得等具有显著影响作用。但对于那些在“文革” 时期才年满20岁得同期群案例来说,作用却并不显著。 谢文和林南于1983年在北京得调查(N=1774)、林南和 边燕杰于1985在天津得调查(N=1000)等进一步证实:父 亲得职业地位既对人们得初职地位获得毫无影响,也对 人们目前职业地位得获得缺少明显作用。 林南与边燕杰将“工作单位部门”这一具有国家社会 主义特色得指标作为中介变量,置于职业地位之前进行 检验。研究发现,虽然父亲得职业地位对子女得教育和 职业地位获得缺少统计意义得影响,但父亲得“工作单 位部门”却通过对儿子“工作单位部门”得作用而影响 了儿子得初职地位获得,但女儿却无此殊荣。
3
变量之间得关系
两个变量之间得关系 多个变量之间得关系。 在多数情况下,多个变量之间得关系又可以分
解为若干个两个变量之间得关系,也就就是说 多个变量之间得关系可以通过若干个两个变量 间得关系来描述。
4
5
知识点
双变量间关系得种类 主要得双变量得测量方法 (1)交互分析—列联表分析 (2)不同层次变量得测量法 (3)自变量和因变量得关系 相关分析和因果分析
22
•理解:x对y得可认知程度
如假定不知道x得值,我们在认识y时得全部 误差就是E1。我们知道x得值,可以根据x得值 来认识y得值时得误差得总数(不可认知得部 分)为E2,那么用x得值来预测y得值时减少得 误差就就是E1-E2,这个值( E1-E2 )与y全部误 差得比例,则称谓消减了得误差比例
双变量的统计分析之均值比较与检验
R ep o r t
N 9 3 9
5 7 7
19 14 10 16 40
Std. Deviation
2.2455 1.8993 2.0933 2.0531 1.3494 1.4036 1.9158 1.6989 2.4649 1.9421 2.1827 2.2690
Variance 5.042 3.607 4.382 4.215 1.821 1.970 3.670 2.886 6.076 3.772 4.764 5.148
表6—4 按年龄分组的描述统计量
HB
AGE Mean 16 11.2921 17 10.5380 18 12.1450 Tota1l1.4448
血R红ep蛋o白rt* 年龄
Std. N DeviatioVnariance Sum
14 2.4649 6.076 158.09 10 1.9421 3.772 105.38 16 2.1827 4.764 194.32 40 2.2690 5.148 457.79
表6—3、4是将sex和age一起放在layer 1of 1中,分别 计算男、女(不作年龄分组)。年龄分三组(不作性别 分组)的观测值合计、均数、标准差、方差和个数。
表6—3 按性别分组的描述性统计量
HB
SEX Mean 1 12.6529 2 10.1095 To1t1a.l4448
血R红e蛋p白o r* t性别
Std. N DeviatiVoanriance Sum
21 2.0531 4.215 265.71 19 1.6989 2.886 192.08 40 2.2690 5.148 457.79
Total
AGE 16 17 18 Total 16 17 18 Total 16 17 18 Total
均值比较及差异性检验ppt课件
❖ 基本操作过程:
1. 选定Means过程对话框;
(Analyze-Compare Means-Means)
2. 选择自变量与分组变量(也可加入层变 量);
3. 对Means过程的分析结果进行比较分析;
5.2 单样本T检验
❖ SPSS单样本T检验是检验某个变量的总体均 值和某指定值之间是否存在显著差异。统计 的前提是样本总体服从正态分布。也就是说 单样本本身无法比较,进行的是其均数与已 知总体均数间的比较。
❖ 5.1 Mean过程 ❖ 5.2 单一样本T检验 ❖ 5.3 独立样本T检验 ❖ 5.4 两配对样本T检验 ❖ 5.5 正态分布检验
5.1 Means过程
❖ Means过程是SPSS计算各种基本描述统计量 的过程。与计算某一样本总体均值相比, Means过程其实就是按照用户指定条件,对样 本进行分组计算均数和标准差,如按性别计 算各组的均数和标准差。
❖ 在统计分析过程中,很重要的一点是对抽 样的样本必须有代表性,即每个个体都有同 等概率被抽中。但由于抽样误差的存在,在 抽样过程中不可避免会抽到一些数值较大或 较小的个体导致样本统计量与总体参数之间 有所不同,所造成的问题就是:某个样本能 否认为是来自某个确定均值的总体。
❖ 在正态或近似正态分布的计量资料中,经 常在使用统计描述过程分析后,还要进行组 与组之间平均水平的比较。本章介绍的T检验 方法,主要应用在两个样本间比较且只能进 行一个或两个样本间的比较。如果需要比较 两组以上样本均数的差别,则需使用方差分 析方法。
❖ 单样本T检验的零假设为H0:总体均值和指 定检验值之间不存在显著差异。
❖ 采用T检验方法,按照下面公式计算T统计 量:
❖ 基本操作步骤:
1.选择单样本T检验对话框;
【正式版】统计软件均值比较与检验PPT
参数之间有所不同。
某变量均值不同,其差异是否具有统计意义?能否说 明总体差异?这是各种研究工作中经常提出的问题。 这就要进行均值比较。
8.1.2 进行均值比较及检验的过程
MEANS过程:不同水平下(不同组)的描述统计量,如男女
的平均工资,各工种的平均工资。目的在于比较。术语:水平数 两组样本均来自(正态指总体分c类. 变量的值数,如sex变量有2个值,称为有两个水平)、 4的独平立 均样工本资的是否T检单是验$元30,0C00e。ll(指因变量按分类变量值所分的组)、水平组合
Independent List:自变量(分组变量,为分类变量,注意可分层) 两组样本均来自正态总体 c.
MEANS过程:不同水平下(不同组)的描述统计量 由参于数总 之体间中有的所每不个同个。体间均存在差异,即使严格遵守随机抽样原则也会由于多抽到一些数值较大或较小的个体致使样本统计量与总体 ,如男女的平均工资,各工种的平均工资 被比较的两组样本有配对关系 b.
8.1.1 均值比较的概念
统计分析常常采取抽样研究的方法,即从总体中随机 某地区12岁男孩的平均身高为142.
能否用样本均值估计总体均值?两个变量均值接近的样本是否来自均值相同的总体?换句话说,两组样本某变量均值不同,其差异是
抽取一定数量的样本进行研究来推断总体的特性。由 否具有统计意义?能否说明总体差异?这是各种研究工作中经常提出的问题。
独立样本的T检验:检验两组不相关的样本是否来自具有相同均值的总体(均值是否相同,如男女的平均收入是否相同,是否有显著性
差异) 于总体中的每个个体间均存在差异,即使严格遵守随 机抽样原则也会由于多抽到一些数值较大或较小的个 Test Variable(s):要求平均值的变量(一般是定距变量)
某变量均值不同,其差异是否具有统计意义?能否说 明总体差异?这是各种研究工作中经常提出的问题。 这就要进行均值比较。
8.1.2 进行均值比较及检验的过程
MEANS过程:不同水平下(不同组)的描述统计量,如男女
的平均工资,各工种的平均工资。目的在于比较。术语:水平数 两组样本均来自(正态指总体分c类. 变量的值数,如sex变量有2个值,称为有两个水平)、 4的独平立 均样工本资的是否T检单是验$元30,0C00e。ll(指因变量按分类变量值所分的组)、水平组合
Independent List:自变量(分组变量,为分类变量,注意可分层) 两组样本均来自正态总体 c.
MEANS过程:不同水平下(不同组)的描述统计量 由参于数总 之体间中有的所每不个同个。体间均存在差异,即使严格遵守随机抽样原则也会由于多抽到一些数值较大或较小的个体致使样本统计量与总体 ,如男女的平均工资,各工种的平均工资 被比较的两组样本有配对关系 b.
8.1.1 均值比较的概念
统计分析常常采取抽样研究的方法,即从总体中随机 某地区12岁男孩的平均身高为142.
能否用样本均值估计总体均值?两个变量均值接近的样本是否来自均值相同的总体?换句话说,两组样本某变量均值不同,其差异是
抽取一定数量的样本进行研究来推断总体的特性。由 否具有统计意义?能否说明总体差异?这是各种研究工作中经常提出的问题。
独立样本的T检验:检验两组不相关的样本是否来自具有相同均值的总体(均值是否相同,如男女的平均收入是否相同,是否有显著性
差异) 于总体中的每个个体间均存在差异,即使严格遵守随 机抽样原则也会由于多抽到一些数值较大或较小的个 Test Variable(s):要求平均值的变量(一般是定距变量)
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
18 12.56
40 1 16 11.35
13
2 18 12.25 27 2 17 11.56
14
2 17 10.06 28 1 16 14.67
1、操作步骤
• 1) 打开数据文件“Means过程.sav” 。 • 2)按顺序Analyze Compare Means
Means打开主对话框。 • 3)单击Option, 打开Options对话框,选择统
计项目。 • 4)单击OK完成。
选hb sex
图6—3 在主对话框选送变量
按Next,进入 layer 2of 2, 选age
图6—4 第二层变量框
选
择
统
复选此2
计
项,第一
项
按此
层次分
目
按钮
组选择
计算方
差分析
和线性
检验
图6—5 Options对话框
2. 结果及分析
表6—1 观测量摘要表
Case Processing Summary
一、 简介
二、独立样本T检验
用于检验对于两组来自独立总体的样本,其独立总体的均值或中 心位置是否一样。如果两组样本彼此不独立,应使用配对T检验( Paired -Sample T Test )。如果分组不止一个,应使用One-Way ANOVA 过程进行单变量方差分析。如果想比较的变量是分类变量 ,应使用Crosstabs功能。
MEANS过程
一、 Means过程 该过程实际上更倾向于对样本进行
描述,可以对需要比较的各组计算 描述指标,包括均值、标准差、总 和、观测量数、方差等一系列单变 量统计量。 二、完全窗口分析 按Analyze—Compare Means— Means顺序,打开Means主对话框 (如图6--1)。
One-Sample Test
Test Value = 11.657 95% Confidence
Interval of the Sig. Mean Difference df(2-tail De id f) ferenc LoewerUpper 39 .558-.212-2.9379.5134
从表5-10可看出,t 值为-0.592,自由度 39,显著值为0.558,样本均值与检验值的 差为-0.2122,该差值95%的置信区间是 0.9379~0.5134。
表6—4 按年龄分组的描述统计量
HB
AGE Mean 16 11.2921 17 10.5380 18 12.1450 Tot1a1l.4448
血R红ep蛋o白rt* 年龄
Std. N DeviatioVnariance Sum
14 2.4649 6.076 158.09 10 1.9421 3.772 105.38 16 2.1827 4.764 194.32 40 2.2690 5.148 457.79
图6-6
Test Value: 输入已 知的总 体均值, 默认0
One-Sample T Test主对话框
Confidence Interval:输 入置信区间, 一般取90、 95、99等。
图6-7 Options对话框
Missing Values: 在检验变量中含 有缺失值的观测将 不被计算。
在任何一个变量 中含有缺失值的观 测都将不被计算
31 1 16 13.65
4
2
17 9.87
18 1
18 11.66
32 2 16 9.87
5
2
17 8.99
19 2
18 8.54
33 2 18 10.09
6
2 17 11.35 20 2 17 7.78
34 2 18 12.55
7
1
17 14.56 21 2
16 11.36
35 1 18 16.04
Within G1r3o6u.p2s61
383.586
Total
200.787 39
a. With fewer than three groups, linearity
表6—5是方差分析表,共6列:第一列方 差来源:组间的、组内的、总的方差;第二
列为平方和;第三列为自由度;第四列为均 方;第五列为F值;第六列为F统计量的显 著值,显著值小于0.05,所以性别对血红蛋白 值有显著影响。
表6—7 按年龄分组的方差分析表
ANOVA Table
HB
Sum of Squares dM fean SquareF
* BAeGtEween(Comb1 i6 n. e3 d9 )4 Groups Linear5 i. t9 y52
2 8.1971.645 1 5.9521.194
D Le iv ni ea a1 t r0 i i. o t4 n y41 from 110.4412.095
2、结果分析
表5-9 单个样本统计量
One-Sample Statistics StdS.td. Error
N MeaDneviatioMnean HB 1410.44482.2690 .3588
表5-9 是血红蛋白值的观测量个数、均值、 标准差和均值的标准误等统计量。
表5-10 单个样本检验
t的资料来说明。已知另一地区 16-18岁的少年血红蛋白平均值为11.657g%, 检验这一地区16-18岁少年血红蛋白值是否 与另一地区的平均值相等。
1、操作步骤 1)按Analyze—Compare Means—One Sample T Test顺序,打开主对话框。(打开数 据文件“Means过程.sav”。) 2)将变量hb选入 Test Variable框。 3)在Test Value中输入 11.657,后单击OK。
一、单一样本T检验
一、 简介
用于检验单个变量的均值与假设检 验值(给定的常数)之间是否存在差异。
二、完全窗口分析
按Analyze—Compare Means—OneSample T Test顺序,打开One-Sample T Test主对话框(如图5--1)
Test
Variables 框:用于 选取需要 分析的变 量
Within Grou1p8s4.394
37 4.984
Total
200.787
39
Sig. .207 .282
.156
表6—7是将年龄作为第一层自变量得到 的方差分析表,Linearity是假设因变量均值 是第一层自变量值的线性函数,Deviation from Linearity是不能由线性模型解释的部分。
AGE 16 17 18 Total 16 17 18 Total 16 17 18 Total
Mean 12.4078 12.4033 12.9811 12.6529
9.2840 9.7386 11.0700 10.1095 11.2921 10.5380 12.1450 11.4448
Report
该框的变量为因变量,即用于分析的变量。
单击此按钮,
进入下一层, 该框的变量为自
返回则按
变量,必须至少
Previous按钮。 有一个变量
见图6—2
图6—1 Means主对话框
Statistics框:供选择的统计量 Cell Statistics框: 选入的描述统
计量,默认为均
值、样本数、标
Sta准tis差tic。s for First
表6—3 按性别分组的描述性统计量
HB
SEX Mean 1 12.6529 2 10.1095 To1t1a.l4448
血R 红e蛋p白or*t性别
Std. N DeviatiVoanriance Sum
21 2.0531 4.215265.71 19 1.6989 2.886192.08 40 2.2690 5.148457.79
N 9 3 9
21 5 7 7
19 14 10 16 40
Std. Deviation
2.2455 1.8993 2.0933 2.0531 1.3494 1.4036 1.9158 1.6989 2.4649 1.9421 2.1827 2.2690
Variance 5.042 3.607 4.382 4.215 1.821 1.970 3.670 2.886 6.076 3.772 4.764 5.148
表6—3、4是将sex和age一起放在layer 1of 1中,分别 计算男、女(不作年龄分组)。年龄分三组(不作性别 分组)的观测值合计、均数、标准差、方差和个数。
表6—5 方差分析表
ANOVA Taable
Sum of Squaresd Mf ean SquarFe Sig.
HB *Be St EwXeen (CG o6r m4o b.u i5p n2s e6d) 6 14.52167.995 .000
表6—6 eta统计量
Measures of Association
EtaEta Squared
HB * SE.X567
.321
表6—6是eta统计量表,η统计量表明因变 量和自变量之间联系的强度,0.567的值处 于中等水平,η2是因变量中不同组间差异所 解释的方差比,是组间平方和与总平方和之 比,即由64.5256除以 200.787得到。
HB
Cases
IncludedExcluded Total
NPercentNPercentNPercent * S14E00X0.*0%AGE0 .0% 14000.0%
表6—1 是观测量摘要表,观测量总 个数为40,其中有效值为40个、无效值0。
表6—2 分组描述统计量
HB SEX 1
2
Total
Layer复选框: