列联表
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
.784
1
.376
N of Valid Cases
300
a. 0 cells (.0%) have expected count less than 5. The minimum expected count is 13.33.
结
束
Value 20.124b 18.652 20.953
20.033
df 1 1 1
1
Asy mp. Sig. (2-sided) .000 .000 .000
.000
Exact Sig. (2-sided)
.000
Exact Sig. (1-sided)
.000
N of Valid Cases
221
• 变量 X 条件下变量 Y 的分布,或在 变量 Y 条件下变量 X 的分布
• 每个具体的观察值称为条件频数
百分比分布
1. 条件频数反映了数据的分布,但不适合 进行对比
2. 为在相同的基数上进行比较,可以计算 相应的百分比,称为百分比分布。
行百分比分布
东部地区 西部地区 南部地区 北部地区 合计 愿意购买 24.4% 26.9% 20.4% 28.3% 100% 不愿意购买 22.7% 31.9% 23.4% 22.0% 100%
列百分比分布
东部地区 西部地区 南部地区 北部地区
愿意购买 68.0% 62.5% 63.35 71.8% 不愿意购买 32.0% 37.5% 36.7% 28.2%
合计 100% 100% 100% 100%
总百分比分布
东部地区 西部地区 南部地区 北部地区 合计 愿意购买 16.2% 17.8% 13.6% 18.8% 66.4% 不愿意购买 7.6% 10.7% 7.9% 7.4% 33.6%
▪ 结论: 拒绝原假设,认为规模与负债率不 独立。
Chi-Squar e Tests
Pear son Chi-Square Continuity Correctiona Lik elihood Ratio Fisher 's Exact Test Linear -by -Linear A sso ciation
▪ 结论: 不能拒绝原假设,可认为购买意愿与地
区独立。
Chi-Square Tests
Pearson Chi-Square
Value 2.761a
df 3
Asymp. Sig. (2 -si d e d) .430
Likelihood Ratio
2.784
3
.426
L i ne a r-b y-L i ne a r Asso ci a tio n
家电 53 30 17 100
合计
178 82 40 300
▪ 本例中原假设为: 三个行业“支持”态度百分比完全相同 三个行业“中立”态度百分比完全相同 三个行业“反对”态度百分比完全相同
(原假设是上述三个条件同时成立)
▪ SPSS操作完全同前 ▪ 数据文件:齐性检验
▪ 输出结果的解释:
▪ 该检验的P-值为0.283,高于10%。
▪ 资本结构采用负债率来表示。
▪ 下面以“规模与资本结构”相关性的研究为 例。
▪ 基本资料
打开数据文件
▪ 文件名:独立性检验(资本结构) ▪ 注意变量及数据文件的格式
数据文件的建立方法
• 以行变量r 标识企业规模类型
▪ r=1 标识“规模小” ▪ r=2 标识“规模大”
• 列变量c 标识企业负债高低类别
▪ 单击Statistics 按钮进入Statistics 对话框选择 ▪ Chi-square ▪ 单击Continue 按钮返回Crosstabs 主对话框 ▪ 单击OK 按钮
▪ 注意:
如果不对原始数据进行“加权处理”,则 列联表个格中的频数均误认为1
输出结果——列联表
购 买 意 愿 * 地 区 Cross tabulation
列联表
——独立性检验 与
齐性检验
第一节 列联表概述
列联表的构造
列联表例子
考虑不同“行业”的企业“成长性”, 随机抽取420个公司,有关结果如下表 所示。
成长性
高 低 合计
房地产 68 32 100
行业
电子 机械
75
57
45
33
120 90
商业 79 31 110
合计
279 141 420
列联表概念
90
110 420ຫໍສະໝຸດ 列边缘分布观察值的分布
1. 边缘分布
• 行边缘分布
▪ 行观察值的合计数的分布 ▪ 例如,愿意购买该产品的客户共有279人,不愿意
购买的141人 。
• 列边缘分布
▪ 列观察值的合计数的分布 ▪ 例如,四个不同地区接受调查的人数分别为100人,
120人,90人,110人
1. 条件分布与条件频数
a. Computed only for a 2x2 table
b. 0 cells (.0%) hav e expected count less than 5. The minimum expected count is 21.58.
▪ 本文还就“成长性与资本结构”、“盈利能 力与资本结构”等相关性进行分析,所使用 的数量方法与前述方法完全相同。此处不再 详细介绍。
行变量:“成长性” 列变量:“行业” 表中部数值:“频数” 该列联表称为 2 4 列联表
行业 成长性
房地产 电子 机械
合计 商业
高
68
75
57
79 279
低
32
45
33
31 141
合计 100 120
90
110 420
列联表的分布
列联表例子
某公司适销一种新研制的产品。从四个不 同地区随机调查了420个目标客户,其购买意 愿的统计结果如下表所示。
• 以变量f 标识相应类别下的人数(频数)。
▪ 显示标签后:
SPSS操作过程
▪ 选择Data→ Weight Cases 进入Weight Cases 对话 框把频数f 放入Frequency栏中单击OK 按钮
▪ 从Analyze → Descriptive Statistics → Crosstabs 进入Crosstabs 对话框 • 把变量r 放入Row(s)栏 • 把变量c 放入Column(s)栏
Count
购买 意愿
T o ta l
愿意 购买 不愿 意购买
东部 地区 68 32
100
地区
西部地区 南部地区
75
57
45
33
120
90
北部 地区 79 31
110
T o ta l 279 141 420
输出结果与分析
▪ 由于最低期望频数大于5,所以卡方值应选 2.761,相应P--值为0.430。
▪ 结论,上述三行业员工对实行全面预算管理 的态度没有显著差异。
Chi-Square Tests
Pearson Chi-Square
Value 5.038a
df 4
Asymp. Sig. (2 -si d e d) .283
Likelihood Ratio
5.315
4
.256
L i ne a r-b y-L i ne a r Asso ci a tio n
• 1万元以下——低收入 • 1-10万元——中等收入 • 10万元以上——高收入
例题(续上节中的例子)
某公司适销一种新研制的产品。从四个不同地区 随机调查了420个目标客户。其购买意愿的统计 结果如下表所示。 问题:购买意愿与客户所在的地区独立否?
东部地区 西部地区 南部地区 北部地区 合计
愿意购买
合计 23.8% 28.6% 21.4% 26.2% 100%
第二节 独立性检验
作用
▪ 主要用于两个定性变量间的“独 立性”检验。
▪ 原假设:两个变量相互独立。 ▪ 对立假设:两变量相关。
▪ 对于定距变量,也可采用该方法,但如要将 连续变量转化为分类变量(定类、定序变 量)。
▪ 例如:“家庭年收入”这一变量属于定距变 量,可以按以下标准,转化成定序变量:
68
75
57
79 279
不愿意购买 32
45
33
31 141
合计
100 120
90
110 420
▪ 数据文件:独立性检验(购买意愿)
数据文件的建立方法
• 以行变量r 标识“购买意愿”
▪ r=1 标识“愿意购买” ▪ r=2 标识“不愿意购买”
• 列变量c 标识“地区”
▪ c=1 标识“东部地区” ▪ c=2 标识“西部地区” ▪ c=3 标识“南部地区” ▪ c=4 标识“北部地区”
.479
1
.489
N of Valid Cases
420
a. 0 cells (.0%) have expected count less than 5. The minimum expected count is 30.21.
卡方检验
应用举例
我国上市公司资本结构影响因素 的
实证分析
▪ 本文分别对“公司规模”、“成长性”、 “盈利能力”等因素与“资本结构”相关性 进行研究。
东部地区 西部地区 南部地区 北部地区 合计
愿意购买
68
75
57
79 279
不愿意购买 32
45
33
31 141
合计
100 120
90
110 420
观察值的分布
条件频数
行边缘分布
东部地区 西部地区 南部地区 北部地区 合计
愿意购买
68
75
57
79 279
不愿意购买 32
45
33
31 141
合计
100 120
▪ c=1 标识”负债低“ ▪ c=2 标识“负债高”
• 以变量f 标识相应类别下的公司数(频数)。
▪ 点击 按钮,显示标签后的数据:
▪ 点击
SPSS操作过程
按钮,打开“样本加权”对话框
▪ 加权操作完成后,不会产生任何输出结果, 数据文件看不到任何变化。
▪ 但是如果不经加权直接进入下面的独立性检 验,计算机会错误地认为样本量仅有4个公司 而实际上样本公司是221个。
卡方齐性检验
应用举例
为研究不同行业的企业员工对实行预算管理的态度, 对三个不同行业的300名员工进行了调查,有关结果 如下表所示。
问题:这三个不同行业员工对于实行预算管理的态度 是否存在显著差异?
对预算管 理态度
支持 中立 反对 合计
电子 60 25 15 100
行业 冶金 65 27 8 100
第三节
齐性检验
(homogeneity)
▪ 作用:检验两个(或两个以上)总体某种比 例相同。
▪ 原假设:比例相同
▪ 对立假设:比例不同
▪ “卡方齐性检验”与上节讨论的“独 立性检验”是两个完全不同的统计 检验问题。但是在具体计算公式等 方面完全相同。因此可以“借用” 上节独立性检验的功能实现。
1 2
3
输出结果分析
▪ 列联表——请与原始数据核对!
规 模 类 别 * 负 债 类 别 Crosstabulation
C o un t
规模 类别
Total
规模 小 规模 大
负债 类别
负债低 负债高
105
71
10
35
115
106
Total 176 45 221
▪ 结果分析:由于最低期望频数大于5,所 以卡方值应选20.124,相应P值为0.000,