利用SPSS进行列联表分析
第四章 SPSS的基本统计分析知识讲解
多选项分析
多选项分析的基本思路
– 定义多选项变量集 – 多选项频数分析 – 多选项交叉分组下的频数分析
多选项分析
定义多选项变量集
目的:将已分解的变量定义为一个集合,便于进行多选 项分析
– 菜单选项:analyze->multiple response->define sets – 从原变量中选取被分解的变量(数值型)到variables in
进一步计算
– cells选项:选择在频数分析表中输出各种百分比.
row:行百分比(Row pct); column:列百分比(Col pct); total:总百分比(Tot pct);
分析列联表中变量间的关系
目的:
通过列联表分析,检验行列变量之间是否独立。
方法:
– 卡方检验:对品质数据的相关性进行度量
频数分析
基本操作步骤
(1)菜单选项:analyze->descriptive statistics->frequencies (2)选择几个待分析的变量到variables框. (3)chart选项,选择所需要的图形
计算描述统计量
目的
– 精确把握变量的总体分布状况,了解数据的集中趋 势、离散趋势、对称程度、陡峭程度。
– 菜单选项:analyze->multiple response->crosstabs
频数分析
目的
粗略把握变量值的分布状况。
例:研究被调查者的特征(如:性别、年龄、收入) 研究被调查者对某个问题的总体看法(如:教学方式、选修课程) 研究被调查者某方面的状态(如:购买家电的类型、居民月支出状况)
采用的方法
– 计算频分布表:包括计算 频数、累计频数、百分比、累 计百分比
用SPSS进行列联表分析(Crosstabs)实例
用SPSS进行列联表分析(Crosstabs)实例列联表分析(Crosstabs)列联表是指两个或多个分类变量各水平的频数分布表,又称频数交叉表。
SPSS的Crosstabs过程,为二维或高维列联表分析提供了22种检验和相关性度量方法。
其中卡方检验是分析列联表资料常用的假设检验方法。
例子:山东烟台地区病虫测报站预测一代玉米螟卵高峰期。
预报发生期y为3级(1级为6月20日前,2级为6月21-25日,3级为6月25日后);预报因子5月份平均气温x1(℃)分为3级(1级为16.5℃以下,2级为16.6-17.8℃,3级为17.8℃以上),6月上旬平均气温x2(℃)分为3级(1级为20℃以下,2级为20.1-21.5℃,3级为21.5℃以上),6月上旬降雨量x3(mm)分为3级(1级为15mm以下,2级为15.1-30mm,3级为30mm以上),6月中旬降雨量x4(mm)分为3级(1级为29mm以下,2级为29.1-36mm,3级为36mm以上)。
数据如下表。
注:摘自《农业病虫统计测报》131页。
1) 输入分析数据在数据编辑器窗口打开“data1-3.sav”数据文件。
数据文件中变量格式如下:2)调用分析过程在菜单选中“Analyze-Descriptive- Crosstabs”命令,弹出列联表分析对话框,如下图3)设置分析变量选择行变量:将“五月气温[x1],六月上气温[x2],六月上降雨[x3],六月中降雨[x4]”变量选入“Rows:”行变量框中。
选择列变量:将“玉米螟卵高峰发生期[y]”变量选入“Columns:”列变量框中。
4)输出条形图和频数分布表Display clustered bar charts: 选中显示复式条形图。
Suppress table: 选中则不输出多维频数分布表。
5)统计量输出点击“Statistics”按钮,弹出统计分析对话框(如下图)。
Chi-Square: 卡方检验。
RC列联表资料的统计分析与SAS软件实现
一、调查问卷数据导入SPSS中。数据导入后,可以在SPSS主界面的 数据视图中查看数据。
二、进行列联表分析
1、打开列联表分析对话框
1、打开列联表分析对话框
在SPSS主菜单中,选择“分析”>“表”>“列联表”。这将打开列联表分析 对话框。
2、选择变量
2、选择变量
3、SAS实现
在这个示例中,mydata是包含RC列联表资料的数据集名称,var1和var2是需 要进行卡方检验的两个分类变量。chisq选项告诉PROC FREQ过程执行卡方检验。 运行这个过程后,将会生成一个包含卡方统计量、自由度和p值的输出表。
3、SAS实现
案例分析 为了更好地说明RC列联表资料的统计分析和SAS软件实现,让我们以一个实际 案例为例。在这个案例中,我们有一份包含两个分类变量的RC列联表资料,目的 是检验这两个变量之间的关联性。我们将分别使用Excel和SAS进行分析。
2、统计方法
2、统计方法
对于RC列联表资料,常用的统计方法包括卡方检验、Fisher精确检验、对数 似然比检验等。这些方法可以用来检验两个分类变量之间的独立性,以及判断某 种关联的存在性。根据分析目的和数据特点,选择合适的统计方法是非常重要的。
3、SAS实现
3、SAS实现
在SAS软件中,可以使用PROC FREQ和PROC LOGISTIC等过程来对RC列联表资 料进行统计分析。PROC FREQ过程可以用来进行频数统计和独立性检验,而PROC LOGISTIC过程则可以用来进行关联性分析和效应估计。下面是一个使用PROC FREQ进行卡方检验的示例代码:
三、解读结果
1、频率表
1、频率表
频率表展示了每个变量的单独频率以及不同变量组合的频率。通过查看频率 表,可以了解不同变量之间的关系。
列联表资料的SPSS分析
1
一、一般四格表(2 × 2 列联表)资料
实验研究一般四格表(2×2 列联表)资料分析目的主 要有 2 个,一是分析两个比率总体的差别有无统计学意义 或两样本某指标的分布(或构成)总体是否相同,二是分 析两个分类特征是否有关联。
别;Kappa 检验(SPSS 不给可信区间),Kappa = 0.824, P < 0. 01,说明两种检查具有较好的一致性。
可以看出, 两种检验结果是矛盾的。为什么呢? McNemar 法一般用于样本含量 n 不太大的资料,因只考 虑结果不一致的情况,而未考虑样本含量 n 和结果一致的 情况,所以,当 n 很大且结果一致率高时,不一致的数值 相对较小,容易出现有统计学意义的检验结果,但实际意 义可能不大。本例即是如此,应以一致性检验结果为准。 实际上,对于两种检验(查)方法或诊断方法结果进行分 析时,主要分析的也就是一致性。根据Kappa 值判断一致 性强度的标准尚有争议,一般认为:Kappa 值< 0.4 时, 一致性较差;在 0.4~0.75 之间有中度至高度一致性;> 0.75 时,有极好的一致性。
列联表资料的SPSS分析
在实验研究与基础实验研究中,所分析的指 标可以是定量的,也可以是定性的。其定量指标, 有时也转化成定性资料进行分析。这些定性资料 或由定量资料转化而来的定性资料,一般都整理 成列联表形式,根据资料性质和分析目的选择恰 当的分析方法进行统计分析,并将统计分析结果 与专业知识相结合, 做出合理的解释。
51
合计
260 182 144
532
有效率(%)
96.60 90.11 81.94
(可视化整理)spss统计分析-实例分析
众数(Mode)统计学名词,在统计分布上具有 明显集中趋势点的数值,代表数据的一般水平( 众数可以不存在或多于一个)。 修正定义:是 一组数据中出现次数最多的数值,叫众数,有时 众数在一组数中有好几个。用M表示。 理性理解 :简单的说,就是一组数据中占比例最多的那个 数。
全距也称为极差,是数据的最大值与最小 值之间的绝对差。在相同样本容量情况下 的两组数据,全距大的一组数据要比全距 小的一组数据更为分散。 计算公式:最大值-最小值。
1.2 描述分析
计算基本描述统计量的操作
(1)分析—描述统计—描述 (2)将分析变量选择到变量框中 (3)单击选项按钮指定基本统计量
1.2 描述分析
1.2.2 应用例一
案例1-3:计算人均住房面积的基本描述统计量 ,并对本市户口和外地户口家庭的情况进行比较。 操作步骤:
• 调用命令Analyze\Descriptive Statistics \Descriptives
1.1频数分析
1.1频数分析
输出结果
1.1 频数分析_例1
例1-1 分析住房状况调查数据中户主的从业状况 和目前所住房屋的产权情况 思路:利用频数分布表及图形 条件:都是分类变量,直接分析 步骤:
• 调用命令:
• Analyze\Descriptive Statistics\Frequencies
常用统计量:均值、中位数、众数
1.2 描述分析
刻画离散程度的统计量
离散程度是指一组数据远离其“中心值”的程度。
如果数据都紧密地集中在“中心值”的周围,数据的离 散程度较小,说明这个“中心值”对数据的代表性好; 相反,如果数据仅是比较松散地分布在“中心值”的周 围,数据的离散程度较大,则此“中心值”说明数据特 征是不具有代表性的。
SPSS超详细操作:卡方检验(R×C列联表)
SPSS超详细操作:卡⽅检验(R×C列联表)医咖会之前推送过⼀些卡⽅检验相关的⽂章,包括:卡⽅检验(2x2)、卡⽅检验(2xC)、配对卡⽅检验、分层卡⽅检验等。
今天我们再和⼤家分享⼀下,如何⽤SPSS来做RxC列联表的卡⽅检验。
⼀、问题与数据研究者拟分析购房⼈与购房类型的关系,共招募了在过去12个⽉中有过购房记录的333位受试者,收集了购房⼈类型(buyer_type)和房屋类型(property_type)的变量信息。
其中研究对象类型按照单⾝男性(single male)、单⾝⼥性(single female)、已婚两⼈(married couple)和多⼈家庭(family)分类;房屋类型按照楼房(flat)、平房(bungalow)、独栋别墅(detached house)和联排别墅(terrace)分类,部分数据如下图。
其中,Individual scores for each paticipant(左图)列出了每⼀个研究对象的情况,⽽Total count data (frequencies)(右图)则是对相同情况研究对象的数据进⾏了汇总。
⼆、对问题的分析研究者想分析多种购房⼈类型与多种房屋类型的关系,建议使⽤卡⽅检验(R×C),但需要先满⾜3项假设:假设1:存在两个⽆序多分类变量,如本研究中购房⼈类型和房屋类型均为⽆序分类变量。
假设2:具有相互独⽴的观测值,如本研究中各位研究对象的信息都是独⽴的,不会相互⼲扰。
假设3:样本量⾜够⼤,最⼩的样本量要求为分析中的任⼀期望频数⼤于5。
本研究数据符合假设1和假设2,那么应该如何检验假设3,并进⾏卡⽅检验(R×C)呢?三、SPSS操作1. 数据加权如果数据是汇总格式(如上图中的Total count data),则在进⾏卡⽅检验之前,需要先对数据加权。
如果数据是个案格式(如上图中的Individual scores for each paticipant),则可以跳过“数据加权”步骤,直接进⾏卡⽅检验的SPSS操作。
spss基本分析
统计分析往往是从了解数据的基本特征开始的。
描述数据分布特征的统计量可分为两类:一类表示数量的中心位置,另一类表示数量的变异程度(或称离散程度)。
两者相互补充,共同反映数据的全貌。
这些内容可以通过SPSS中的“Descriptive Statistics”菜单中的过程来完成。
1 频数分析 (Descriptive Statistics - Frequencies)频数分布分析主要通过频数分布表、条形图和直方图,以及集中趋势和离散趋势的各种统计量来描述数据的分布特征。
下面我们通过例子来学习单变量频数分析操作。
1) 输入分析数据在数据编辑器窗口打开“data1-2.sav”数据文件。
2)调用分析过程在主菜单栏单击“Analyze”,在出现的下拉菜单里移动鼠标至“Descriptive Statistics”项上,在出现的次菜单里单击“Frequencies”项,打开如图3-4所示的对话框。
图3-4 “Frequencies” 对话框3)设置分析变量从左则的源变量框里选择一个和多个变量进入“Variable(s):”框里。
在这里我们选“三化螟蚁螟 [虫口数]”变量进入“Variable(s):”框。
4)输出频数分布表Display frequency tables,选中显示。
5)设置输出的统计量单击“Statistics”按钮,打开图3-5所示的对话框,该对话框用于选择统计量:图3-5 “Statistics”对话框① 选择百分位显示“Percentiles Values”栏:Quartiles:四分位数,显示25%、50%和75%的百分位数。
Cut points for 10 equal groups:将数据平分为输入的10个等份。
Percentile(s)::用户自定义百分位数,输入值0—100之间。
选中此项后,可以利用“Add”、“Change”和“Remove”按钮设置多个百分位数。
② 选择变异程度的统计量“Dispersion”:(离散趋势)Std.deviation 标准差Minimum 最小值Variance 方差Maximum 最大值Range 极差S.E.mean 均值标准误③ 选择表示数据中心位置的统计量“Central Tendency”:(集中趋势)Mean 均值Median 中位数Mode 众数Sum 算术和④ 选择分布指标“Distribution”:Skewness 偏度Kurtosis 峰度6) 统计图形输出设置单击“Charts”按钮,将弹出如图3-6所示的对话框:图3-6 “Charts”对话框① Chart Type 图形选择栏:○ None:不输出图形;○ Bar charts:输出条形图;○ Pie char ts:输出饼图;⊙ Histograms:输出柱状图。
888相应分析(案例)
相应分析第五节实例分析一、利用SPSS进行相应分析为研究我国东部地区11个城市的空气质量,这里选取二氧化硫、二氧化氮、一氧化碳及臭氧等4类污染物作为评价指标来进行相应分析,数据来源于2014年《中国统计局年鉴》。
表8.4 我国东部地区11个重要城市的空气质量情况(2013年)(一)操作步骤(1)数据录入。
进行相应分析之前,需要对原始数据进行处理,整理成交叉表的单元格计数形式。
具体操作如下:①打开SPSS文件,按顺序:File-New-Data打开一个空白数据文件,进行变量的编辑,点击Variable View选项,录入三个变量,见图8.3。
②对变量进行赋值,选择Values项需要作如下设置:在弹出的对话框里,对东部地区11个城市以及4个空气质量指标进行数字赋值,如图8.4和图8.5。
图8.4 对“地区”进行赋值图8.5 对“空气质量指标”赋值完成变量的编辑后,返回到“Data View”窗口,录入数据,即为交叉表的单元格计数形式,见表8.5。
表8.5 交叉表的单元格计数形式③使用加权个案。
点击Data-weight cases功能,定义“浓度”为权重变量(图8.6)。
图8.6 Weight Cases对话框设置完成后,点击OK按钮进入相应分析。
(2)点击Analyze--Data Reduction--Correspondence analysis,进入Correspondence analysis 主对话框(图8.7)。
图8.7 相应分析主对话框①Row框用于设置行变量。
这里,将“地区”变量放置于此。
此时,“Define Ranges”按钮被激活,用于定义行变量参与分析的分类范围(图8.8)。
本例的地区有11个,故minimum value 输入1,maximum value 输入11,然后点击Update。
②Column框用于设置列变量。
这里,将“消费支出结构”变量放置于此,点击“Define Ranges”按钮,定义列变量参与分析的分类范围(图8.9)。
SPSS列联表分析
例3: 以下是胃癌真菌病因研究中3种食物样品的真菌检出率,比较3种食物真菌检出率有无差异.
本例中SPSS提示没有理论频数小于5,且最小的理论频数为8.00,故直接选择Pearson 卡方结果,即χ2=22.841,P<0.001,提示三种食物中真菌检出率不同.此时还需要进一步考虑三种食物真菌检出率到底谁与谁之间的差异存在统计学意义,这里就需要用到卡方分割,通俗讲就是把RC列联表拆分成若干个四个表分别进行χ2检验,进而判断不同组两两比较差异是否用统计学意义,但是因为多组比较可能会增加犯I类错误概率,所以还需要对χ2检验的P值进行校正.常用Bonferroni法进行校正,本例中需要进行3次两两比较,校正的检验水准α=0.05/比较次数=0.05/3=0.0167,即当两两比较P<0.0167才能认为差异有统计学意义.
Kappa一致性检验
1、Kappa检验旨在评价两种方法是否存在一致性,或者是同一个研究者先后两次的诊断结果 2、Kappa检验会利用列联表的全部数据 3、Kappa检验可计算Kappa值用于评价一致性大小
配对χ2检验(McNemar检验)
1、配对χ2检验主要确定两种方法诊断结果是否有差别 2、配对χ2检验只利用“不一致“数据,如表中b和c 3、配对χ2检验只能给出两种方法差别是否具有统计学意义的判断
无效 疗效=1
好转 疗效=2
显效 疗效=3
治愈 疗效=4
合计
有效率%
甲法
24
26ห้องสมุดไป่ตู้
72
186
308
92.2
乙法
20
16
24
32
92
78.3
丙法
20
22
14
22
统计学教程(含spss)六 列联分析
32
45
33
31
141
合计
100
120
90
110
420
自由度=
R 1C 1 2 14 1 3
列联表中的卡方检验
自由度用以衡量列联表的大小。
3×4列联表 C1 R1 R2 R3
合计 合计
C2 f12 f22 f32 CT2
C3 f13 f23 f33 CT3
C4 f14 f24 f34 CT4
查表得临界值: 0.05 经计算: 结论:
2
2 5.99 f 0 f e 2 6.13 5.99
fe
拒绝 “男性与女性啤酒偏好相同”的原假设并接 受“男性与女性啤酒偏好不同”的备择假设。即啤酒的 偏好与性别是有关联的。
列联表中的相关性测量
Φ相关系数 C相关系数 V相关系数
a bc d a c a d
于是得:
ad bc a bc d a c b d
0 1
Φ相关系数
完全相关的两种情况
2×2列联表 C1 R1 R2 C2
2×2列联表
合计
a+b c+d
R1 R2
C1
C2
合计
a+b c+d
淡啤
男性 女性 合计 20 30 50
普啤
40 30 70
黑啤
20 10 30
合计
80
总比率: 70 150
淡 啤
50 100% 33.3% 150
普 啤 黑 啤
70 100% 46.7% 150
30 100% 20.0% 150
SPSS统计分析—描述性统计分析
Skewness
中位数 Median
方差
Variance
峰度
Kurtosis
众数
Mode
极小值
Minimum
和
Sum
极大值
Maximum
全距
Range
均值的标准 误差
S.E.mean
• 【Descriptive Statistics】子菜单
• ① Frequencies:产生变量值的频数分布表,并可计算常见 描述性统计量和绘制相对应的统计图。
• 执行【Analyze】/【Descriptive Statistics】/ 【Crosstabs】命令,弹出如图所示对话框
• 结果解读
1、列联表 2、卡方检验结果
3、条图
相对比描述——Ratio
• 在实际问题中,研究者有时除了希望了解变量自身的统计特 征,还希望得到两个变量相对比之间的统计描述。
适用范围:更适用于对分类变量以及不服从正态分布的连 续性变量进行描述。
• 学生身高频数表:已知有某地120名12岁男童身高数据,编 制其传统的简易频数表。
执行【Analyze】/【Descriptive Statistics】/ 【Frequencies】命令,弹出如下所示对话框
• 结果解读 1、频数表
每个格子中的理论频数T是在假定两组的发癌率相等(均等于两组 合计的发癌率)的情况下计算出来的,如第一行第一列的理论频数 为71*91/113=57.18,故卡方值越大,说明实际频数与理论频数的 差别越明显,两组发癌率不同的可能性越大。
2、卡方检验方法的适用条件
• 吸烟习惯与患病率的关系
调查339名50岁以上吸烟习惯与患慢性气管炎病的关系,如 上表所示。试问吸烟者与不吸烟者慢性气管炎患病率是否有 所不同。 ◆ 数据的预处理:WEIGHT CASE
spss列联表分析
列联表分析分析:从表中可以看出,每箱数量的低、中、高与品牌偏好的低、中、高基本一致,说明每箱数量对是有影响的。
分析:从表中可以看出,价格低时,品牌偏好度不高,而在价格高时,品牌偏好高的一组值达到了87.8%,说明价格对品牌偏好有明显的影响。
分析:从表中可以看出,价值低时,品牌偏好不明显,价格适中时,品牌偏好有高值的趋势,价值高时,品牌偏好度达到了88.0%,说明消费者在考虑产品的价值时,品牌偏好比较明显。
分析:从表中可以看出,在护肤的低、中、高三组中,品牌偏好度高的比例都比较高,说明消费者在考虑产品护肤时,有较高的品牌偏好。
分析:从表中可以看出,在样式的低、中、高三组中,品牌偏好度高的比例都比较高,说明消费者在考虑产品样式时,有较高的品牌偏好。
分析:从表中可以看出,随着吸水性由低到高,品牌偏好的高值比例也在增加,说明吸水性越好,品牌选择偏好越明显。
分析:从表中可以看出,随着渗漏值由低到高,品牌偏好的高值比例也在增加,说明渗漏越差,品牌选择偏好越明显。
分析:从表中可以看出,在舒适度上,品牌偏好的高值比例一直都很高,说明在考虑产品的舒适度时,品牌偏好非常明显。
分析::从表中可以看出,在考虑舒胶带时,品牌偏好的高值比例一直都很高,说明在考虑产品是重复粘贴胶带还是普通胶带时,品牌偏好非常明显。
分析:这是控制了价格时的每箱数量和品牌偏好,可以看出,在价格低时,每箱数量的低、中、高与品牌偏好的低、中、高还是有关系的,但是与没有控制价格时相比,两者之间的关系被削弱了。
价格适中时,也是如此。
在价格高时,关系更加清晰。
分析:这是控制了样式时的护肤与品牌偏好,可以看出,在样式低组和中组,护肤与品牌偏好之间原有的关系被逆反了,只有在样式的值高的时候,护肤与品牌偏好才有一定正向相关关系。
分析:这是控制胶带时的舒适度与品牌偏好,可以看出,控制胶带以后,舒适度与品牌偏好完全一致,这加强了舒适度与品牌偏好之间原有的高度相关性。
例题的列联表分析spss步骤
三、数据分析
• 1.百分比 • 步骤:(1) 点击主菜单 【Analyze】 >[discritptive statistic]>[crosstab], 弹出下列窗 口
(2)选择行、列要安排的变量。 选择“单位”->columns;变量“意见”>row;
• (3)选择需要的分析结果(本次主要求期望频数) 第一步:点击【cell】弹出下列窗口. 第二步:选择
“Expected”。最后点击【continue】返回原来的窗口
点击【ok】查看输出结果
3.卡方检验
(3)点击【statistic...】,在弹出的窗口中选择【chisquare】,点击[continue]返回原来窗口。
(3)选择需要的分析结果(本次主要求百分比)
第一步:点击【cell】弹出下列窗口. 第二步:选择“percentage”内
的“row”-->行百分比;"column"-列百分比;"total->"全部百分比。最后 点击【continue】返回原来的窗口
(4).点击【ok】,
5.查看输出结果
2.期望频数
列联表分析spss实现步骤
李俊海 河南工业大学理学院
一、数据格式
二、选择权重(可选步骤)
• 如果数据最原始 赞成和反对数据,则可以直接用列联 表分析。 • 若数据是上述格式---调查结果频数数据,则应需要 把频数变量“人数”作为权重对待! 方法:点击[data]菜单->选择【weight case...】-->弹出 下列窗口
用SPSS作列联分析分解
网球
28 37
合计
110 90
合计
71
64
65
200
如果原假设成立,则总体中男生和女生喜欢乒乓球、羽毛球、网球人数的比 率应是相等的,由列联表所计算得出的总比率35.5%、32.0%、32.5%就是对总 体中的相应比率的估计。做为总体中相应比率的估计,它们对男生和女生就 应当都是适用的。于是,可以根据这些总比率,计算得出各个单元格中的一 个理论上的频数,此理论频数可称之为期望频数,记作 f e : 期望频数 男生
列联表的一般结构
列联表中的自由度
I×j列联表
f ij
C1 f11 f 21
C2 f12 f 22
Cj
f1 j f2 j
合计
RT 1 RT 2
R1 R2
Ri
f i1
fi 2
f ij
RTi
合计
CT 1
CT 2
CTj
n
3×3列联表自由度为4
C1 R1 R2
R3
C2 f12 f 22
f eij
乒乓球 39.1
f eij RTi
CTj n
CTj RTi n
网球 35.8 合计 110
羽毛球 35.2
女生
合计
32.0
71
28.8
64
29.3
65
90
200
观察频数与期望频差异的大小以 2
统计量衡量。该统计量服从自由度 为 R 1 C 1 的 2 分布。 0.30 0.25 0.20 0.15 0.10 0.05
1.70 8.00 2.33 2.02 22.4
SPSS
《基于SPSS的数据分析》实验报告实验项目1:交叉分组下的频数分析(一)实验目的交叉分组下的频数分析又称列联表分析,包括两大任务:一是根据收集到的样本数据编制交叉列联表,二是在交叉列联表的基础上,对两两变量间是否存在一定的相关性进行分析。
(二)实验资料利用“大学生职业生涯规划”数据,分析不同性别大学生在填报高考志愿时所考虑的因素是否存在差异,影响高考志愿填报的因素与性别是否有关。
具体数据见下表:(三)实验步骤1、选择菜单2、进行二维列联表分析3、统计量设置(四)实验结果及分析被调查的898名学生中,男生有369人,女生有529人,分别占总人数的41.1%和58.9%。
以兴趣爱好、市场就业、职业目标、能力优势、性格特点、其他为高考志愿填报决定因素的人数依次为270,287,76,138,68,59人。
其中,兴趣爱好、市场就业和能力优势的占比较高,分别为30.1%,32.0%和15.4%.其次,对不同性别进行分析。
在369名男生中,填报高考志愿时只考虑兴趣爱好和市场就业,百分比分别为73.2%和26.8%。
显然,大多男生是依据自己的兴趣爱好填报志愿的。
在529名女生中,填报高考志愿时考虑的主要因素是市场就业、能力优势、职业目标和性格特点等,而不考虑兴趣爱好。
可见,性别的差异性是比较明显的。
实验项目2:两独立样本t检验(一)实验目的两独立样本t检验的目的是利用来自两个总体的独立样本,推断两个总体的均值是否存在显著差异。
(二)实验资料利用大学生职业生涯规划数据,研究男生与女生的专业和职业认知得分的平均值是否存在显著差异具体数据如下(三)实验步骤1.选择菜单2.定义组(四)实验结果及分析由上表可以看出,男生与女生的认知得分的样本平均值有一定差距。
上表分析分为两个部分,第一步,两总体方差是否相等的F检验。
这里,该检验的F统计量的观测值为25.8,对应概率为0.00.如果显著性水平a为0.05,由于概率小于0.05,可以认为两总体的方差有显著差异。
列联表分析spss步骤
【Exact钮】
• 针对2*2以上的行*列表设定计算确切概 率的方法,可以是不计算(Asymptotic only)、蒙特卡罗模拟(Monte Carlo) 或确切计算(Exact)。蒙特卡罗模拟 默认进行10000次模拟,给出99%可信 区间;确切计算默认计算时间限制在5 分钟内。这些默认值均可更改。
【Statistics钮】
• 弹出Statistics对话框,用于定义所 需计算的统计量。
• o Chi-square复选框:计算X2 值。
• o Correlations复选框:计算行、 列两变量的Pearson相关系数和 Spearman等级相关系数。
• o Norminal复选框组:选择是 否输出反映分类资料相关性的指标, 很少使用。
Crosstabs过程不能产生一维频数表(单变 量频数表),该功能由Frequencies过程实现。
界面说明
【Rows框】 • 用于选择行*列表中的行变量。 • 【Columns框】 • 用于选择行*列表中的列变量。 • 【Layer框】 • Layer指的是层,对话框中的许多设置都可以分层设定,在同一层中
注意事项
• 如何选用上面众多的统计结果令许多初学 者头痛,实际上我们只需要在
• 未校正卡方、 • 校正卡方和 • 确切概率法 三种方法之间选择即可,其余的对我们而言
用处不大,可以视而不见。
假设三个变量分别名为R、C和W,则数据集结构和命令如下:
R
C
W
1.00
1.00
54.00
1.00
2.00
44.00
2.00
1.00
8.00
2.00
2.00
20.00
1.
Data==>Weight Cases
SPSS列联表分析
设置好后,点击“确定”按 钮,SPSS将自动进行列联表
分析。
打开SPSS软件,点击“文件” 菜单,选择“新建”,然后
选择“数据视图”。
在变量视图界面,点击 “新建变量”按钮,设置 变量名称、类型、标签等
信息。
在数据视图界面,输入数据, 每行代表一个观测值,每列
代表一个变量。
在列联表对话框中,设置行 变量和列变量,以及单元格
卡方检验的公式为:卡方值 = Σ[(观测值 - 期望值)^2 / 期望值]
卡方检验的显著性水平通常设定为0.05,当卡方值大于显著性水平时,可以拒绝原假设,认为 两个变量之间存在显著性关联。
独立性:两个变量之间相互独立, 不存在因果关系
方差齐性:两个变量的方差应该 相等
添加标题
添加标题
添加标题
添加标题
列联表制作:使用 SPSS软件制作列联 表
添加标题
列联表分析:对列 联表进行卡方检验、 相关性分析等
添加标题
结果解释:根据分 析结果,解释行变 量和列变量之间的 关系
添加标题
结论与建议:根据 分析结果,提出结 论和建议
卡方检验是一种用于检验两个分类变量之间是否存在关联的统计方法。
卡方检验的基本思想是通过比较观测值和期望值的差异,来判断两个变量之间是否存在显著性 关联。
列联表分析的结果需要结合实际 情况进行解释,不能简单地根据 统计数据得出结论。
结果解释需要结合其他相关因素, 如样本量、数据来源、研究目的 等,进行全面分析。
添加标题
添加标题
添加标题
添加标题
在解释结果时,需要注意到数据 的代表性和可靠性,避免过度解 读或误读数据。
在解释结果时,需要注意到数据 的局限性,如数据收集过程中的 偏差、数据质量等问题,避免盲 目相信统计结果。