第二章SPSS基本统计分析

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

• 2.3.3 交叉分组下的频数分析的基本操作
(1)菜单选项Analyze-Descriptive Statistics-Crosstabs,出现窗口如下:
Crosstabs 对话框
该框中的变量 作为分布表中 的行变量和列 变量。
显示每 一组中 各变量 的分类 条形图。
只输出统 计量,不 输出多维 列联表。
工 程师
助 理工 程师
无 技术 职称
Total
上表中的职称变量称为行变量(Row),文化程度称 为列变量(Column)。行标题和列标题分别是两个变量 的变量值(或分组值)。表格中间是观测频数( Observed Counts)和各种百分比。16名职工中,本科 、专科、高中、初中的人数分别为4,4,5,3,构成的 分布称为交叉列联表的列边缘分布;高级工程师、工程师 、助理工程师、无技术职称的人数分别为3,4,6,3, 构成的分布称为交叉列联表的行边缘分布;4个本科学历 职工中各职称的人数分别是1,1,2等,这些频数构成的 分布称为条件分布,即在行变量(列变量)取值条件下的 列变量(行变量)的分布。
该框中的变量作 为控制变量,决 定频数分布表中 的层,可有多个 控制变量。
(2)如果进行二维列联表分析,则将行变量选 择到Row(s)框中,将列变量选择到 Column(s)框中。如果Row(s) 和 Column(s)框中有多个变量名,SPSS会将 行列变量一一配对后产生多张二维列联表。如 果进行三维或多维列联表分析,则将其他变量 作为控制变量选到Layer框中。多控制变量间 可以是同层次的,也可以是逐层叠加的,可通 过Previous或Next按钮确定控制变量间的层次 关系。
Std .Re siduals
f0 fe fe
(5)单击Format按钮指定列联表各单元格的输出排列 顺序。Ascending表示以行变量取值的升序排列,是 SPSS默认项;Descending表示以行变量取值的降序 排列。 (6)单击Statistics按钮指定用哪种方法分析行变量和 列变量间的关系,窗口如下,其中,Chi-Square为卡 方检验。
本科 职称 高 级工 程师 Count % within 职 称 % within 文 化 程 度 % of Total Count % within 职 称 % within 文 化 程 度 % of Total Count % within 职 称 % within 文 化 程 度 % of Total Count % within 职 称 % within 文 化 程 度 % of Total Count % within 职 称 % within 文 化 程 度 % of Total 1 33.3% 25.0% 6.3% 1 25.0% 25.0% 6.3% 2 33.3% 50.0% 12.5% 0 .0% .0% .0% 4 25.0% 100.0% 25.0%
(3)选择Display clustered bar charts选项,指定绘 制各变量交叉分组下频数分布条形图。Suppress tables表示不输出列联表,在仅分析行列变量间关系 时可选择该选项。 (4)单击Cells按钮指定列联表单元格中的输出内容, 窗口如下:
Crosstabs的Cell Display 对话框
• 2.3.4 交叉列联表行列变量间关系的分析
对交叉列联表中的行变量和列变量之间关系进行 分析是交叉分组下频数分析的第二个任务。 为了理解行、列变量之间的关系,可以从分析两 个极端的例子出发: (1)年龄与工资收入的交叉列联表(一)
工资收入 年 龄 段 低 中 高

中 老
400
0 0
0
400 0
0
工 程师
助 理工 程师
无 技术 职称
Total
• 例如,具有本科学历的高级工程师的期望频数是
职 称 * 文 化 程 度 Crosstabulation 文 化程 度 专科 高中 1 1 33.3% 33.3% 25.0% 20.0% 6.3% 6.3% 3 0 75.0% .0% 75.0% .0% 18.8% .0% 0 1 .0% 16.7% .0% 20.0% .0% 6.3% 0 3 .0% 100.0% .0% 60.0% .0% 18.8% 4 5 25.0% 31.3% 100.0% 100.0% 25.0% 31.3%
0 400
(2)年龄与工资收入交叉列联表(二)
工资收入
年 龄 段 低 青 中 0 0 中 0 400 高 400 0

400
0
0
表一中表示年龄与工资收入呈正相关关系,表二 表示年龄与工资收入呈负相关关系。但大多数情况下 ,观测频数分散在列联表的各个单元格中,不容易直 接发现行列变量之间的关系强弱程度,此时就要借助 非参数检验方法。通常用的方法是卡方检验。
初中 0 .0% .0% .0% 0 .0% .0% .0% 3 50.0% 100.0% 18.8% 0 .0% .0% .0% 3 18.8% 100.0% 18.8%
Total 3 100.0% 18.8% 18.8% 4 100.0% 25.0% 25.0% 6 100.0% 37.5% 37.5% 3 100.0% 18.8% 18.8% 16 100.0% 100.0% 100.0%
交叉列联表的卡方检验 卡方检验属假设检验的范畴,步骤如下: (1)建立原假设 H 0 在列联表分析中卡方检验的原假设为行变 量与列变量独立 (2)选择和计算检验统计量 列联表分析卡方检验统计量是Pearson 卡方统计量,其数学定义为:

2 i 1 j 1
r
c
(f f )
0 ij
描述性统计分析是统计分析的第一步,做好这第一步是 下面进行正确统计推断的先决条件。SPSS的许多模块均可 完成描述性分析,但专门为该目的而设计的几个模块则集中 在Descriptive Statistics菜单中,包括: Frequencies:频数分析过程,特色是产生频数表(主 要针对分类变量) Descriptives:数据描述过程,进行一般性的统计描述 (主要针对数值型变量) Explore:数据探察过程,用于对数据概况不清时的探索 性分析 Crosstabs:多维频数分布交叉表分析(列联表分析) Ratio statistics:比率分析
计算非标准化残差 计算标准化残差 计算调整后残差
SPSS默认列联表单元格中只输出观测频数( Observed)。为便于分析,通常还应指定输出 Percentage框中的行百分比(Row)、列百分比( Column)、总百分比(Total)。Counts框中的 Expected表示输出期望频数;Residuals框中的各个 选项表示在各个单元格中输出剩余。其中, Unstandardized为非标准化剩余,定义为观测频数 -期望频数;Standardized为标准化剩余,又称 Pearson剩余,定义为:
2、基本任务: (1)根据收集到的样本数据,产生二维或多维交叉列 联表; (2)在交叉列联表的基础上,对两两变量间是否存在 一定的相关性进行分析。 • 2.3.2 交叉列联表的主要内容 编制交叉列联表是交叉分组下频数分析的第一个 任务。交叉列联表是两个或两个以上的变量交叉分组 后形成的频数分布表。 例:职工基本情况数据按职称和文化程度编制的二维 交叉列联表(见下页表):
初中 0 .0% .0% .0% 0 .0% .0% .0% 3 50.0% 100.0% 18.8% 0 .0% .0% .0% 3 18.8% 100.0% 18.8%
Total 3 100.0% 18.8% 18.8% 4 100.0% 25.0% 25.0% 6 100.0% 37.5% 37.5% 3 100.0% 18.8% 18.8% 16 100.0% 100.0% 100.0%
e 2 ij
f
e ij
f e 为期望频数(Expected Count)。期望频数的计算方法是: RT CT RT CT e f n n n n
f 0 为观察频数, 其中,r为列联表的行数,c为列联表的列数;
其中,RT是指定单元格所在行的观测频数合计,CT是指定 单元格所在列的观测频数合计,n是观测频数的合计。
本科 职称 高 级工 程师 Count % within 职 称 % within 文 化 程 度 % of Total Count % within 职 称 % within 文 化 程 度 % of Total Count % within 职 称 % within 文 化 程 度 % of Total Count % within 职 称 % within 文 化 程 度 % of Total Count % within 职 称 % within 文 化 程 度 % of Total 1 33.3% 25.0% 6.3% 1 25.0% 25.0% 6.3% 2 33.3% 50.0% 12.5% 0 .0% .0% .0% 4 25.0% 100.0% 25.0%
2.3 交叉分组下的频数分析
• 2.3.1 目的和基本任务
1、目的:交叉分组下的频数分析又称列联表分析。通 过前面的频数分析能够掌握单个变量的数据分布情况 ,在实际分析中,不仅要了解单个变量的分布特征, 还要分析多个变量不同取值下的分布,进而分析变量 之间的相互影响和关系。对于这种涉及两个或两个以 上变量分布情况的研究通常要利用交叉分组下的频数 分析来完成。
在交叉列联表中,除了频数外还引进了各种百分比。 例如表中第一行中的33.3%, 33.3%, 33.3%分别 是高级工程师3人中各学历人数所占的比例,称为行百分 比(Row percentage),一行的百分比总和为100% ;表中第一列的25.0%,25.0%,50.0%分别是本科 学历4人中各职称人数所占的比例,称为列百分比( Column percentage),一列的列百分比总和为100% ,表中的6.3%,6.3%,12.5%等分别是总人数16人 中各交叉组中人数所占的百分比,称为总百分比(Total percentage),所有格子中的总百分比之和也为100% 。
输出观测量的实际数量 如果行和列变量在统计 上是独立的或不相关的, 那么会在单元格中输出期 望的观测值的数量。 输出单元格中观测量的数目占 整行全部观测量数目的百分比 输出单元格中观测值的数目占 整列全部观测量数目的百分比 输出单元格中观测量的数目占 全部观测量数目的百分比 选择在列联表中输出的统计量, 包括观测量数、百分比、残差
期望频数的分布反映的是行列变量互不相干下的分布。
职 称 * 文 化 程 度 Crosstabulation 文 化程 度 专科 高中 1 1 33.3% 33.3% 25.0% 20.0% 6.3% 6.3% 3 0 75.0% .0% 75.0% .0% 18.8% .0% 0 1 .0% 16.7% .0% 20.0% .0% 6.3% 0 3 .0% 100.0% .0% 60.0% .0% 18.8% 4 5 25.0% 31.3% 100.0% 100.0% 25.0% 31.3%
பைடு நூலகம்第二章
SPSS基本统计分析
SPSS的主要分析工具——Analyze菜单
• 报告--Reports • 描述性统计分析--Descriptive Statistics菜单 • 表格--Tables • 均数间的比较--Compare Means菜单 • 一般线性模型――General Linear Model菜单 • 相关分析――Correlate菜单 • 多元线性回归与曲线拟合―― Regression菜单 • 对数线性模型——Loglinear菜单 • 聚类分析与判别分析——Classify菜单 • 因子分析与对应分析——Data Reduction菜单 • 信度分析与多维尺度分析——Scale菜单 • 非参数检验――Nonparametric Tests菜单 • 时间序列分析--Time series
相关文档
最新文档