定性数据的建模分析.
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
6/29/2019
ncutstat
9
目录 上页 下页 返回 结束
§8 .1 对数线性模型基本理论和方法
6/29/2019
ncutstat
10
目录 上页 下页 返回 结束
§8 .1 对数线性模型基本理论和方法
在实际分析中,概率表中各项值,以交叉列联表 计算得的频率表的对应项为无偏估计值。公式表示为:
然而当被解释变量只有两组时,Logistic回 归由于多种原因更受欢迎。
首先,判别分析依赖于严格的多元正态性和
相等协差阵的假设,这在很多情况下是达不到 的。
Logistic回归没有类似的假设,而且这些假 设不满足时,结果非常稳定。
6/29/2019
ncutstat
3
第八章 定型数据的建模分析
其次,即使满足假定,许多研究者仍偏好 Logistic回归,因为它类似于回归分析。 两者都有直接的统计检验,都能包含非线性效果 和大范围的诊断。因为这些和更多技术原因, Logistic回归等同于两组的判别分析,在很多情 况下更加适用。 再者,Logistic回归对于自变量没有要求,度量 变量或者非度量变量都可以进行回归,
6/29/2019
ncutstat
13
目录 上页 下页 返回 结束
§8 .2 对数线性模型分析的上机实践
表8.1.
高 中 低 合计
满意 53 434 111 598
不满意 38 108 48 194
合计 91 542 159 792
6/29/2019
它可以把方差分析和线性模型的一些方法应用到对交叉 列联表的分析中,从而对定性变量间的关系作更进一步 的描述和分析。
6/29/2019
ncutstat
2
目录 上页 下页 返回 结束
列联表分析无法系统地评价变量间的联系,
也无法估计变量间交互作用的大小,而对数线 性模型是处理这些问题的最佳方法。
当被解释变量是非度量变量时,可以用判别 分析。
6/29/2019
ncutstat
5
目录 上页 下页 返回 结束
§8 .1 对数线性模型基本理论和方法
6/29/2019
ncutstat
6
目录 上页 下页 返回 结束
§8 .1 对数线性模型基本理论和方法
该式的结构与有交互效应,且各水平均为二的
双因素方差分析模型的结构相似,因此模仿方差分 析,可以有如下关系式:
第八章 定性数据的建模分析
•§8.1 对数线性模型基本理论和方法 •§8.2 对数线性模型分析的上机实验 •§8.3 Logistic回归基本理论和方法 •§8.4 Logistic回归的方法与步骤
6/29/2019
ncutstat
1
目录 上页 下页 返回 结束
第八章 定型数据的建模分析
第三章我们曾讨论过定性数据的列联表分析,对数 线性模型是进一步用于离散型数据或整理成列联表格式 的数据的统计分析工具。
2
i. ij j 1
2
. j ij i 1
22
..
ij
i1 j1
对上面三式各取其平均数为:
i.
1
2 i.
. j
ቤተ መጻሕፍቲ ባይዱ
1
2 .j
..
1
4 ..
6/29/2019
ncutstat
7
目录 上页 下页 返回 结束
§8 .1 对数线性模型基本理论和方法
6/29/2019
ncutstat
8
目录 上页 下页 返回 结束
§8 .1 对数线性模型基本理论和方法
ij .. i j ij
2
i
2
j
2
2
ij
ij 0
(8.2)
i1
j 1
i1
j 1
i 1,2 j 1,2
ˆij
ˆij ˆi. ˆ. j
ˆ..
ln
nij
1 2
2 j1
(ln
nij
)
1 2
2 i1
(ln
nij
)
1 4
2 i1
2
(ln nij )
j1
(8.3)
即可得 ij 的估计值 ˆij。实际分析中,二维数据表并不 是每个因素都是双水平的,在分析中,把公式的 i, j
的取值上限调整即可。
6/29/2019
ncutstat
12
目录 上页 下页 返回 结束
§8 .2 对数线性模型分析的上机实践
可以使用SPSS软件来实现对数线性模型分析。 这里举一个例子是3×2维的交叉列联表的分析。我 们用SPSS软件中的Loglinear模块实现分析。
【例8.1】 某企业想了解顾客对其产品是否满意, 同时还想了解不同收入的人群对其产品的满意程度 是否相同。在随机发放的1000份问卷中收回有效问 卷792份,根据收入高低和满意回答的交叉分组数据 如表8-1:
若记
i
i.
..
j . j ..
ij ij i. . j ..
其中 ij ij i. . j ..
ij (i. .. ) (. j ) .. ij i j .. 移项,可得与有交互效应的双因素方差分析数学 模型极为相似的关系式:
ˆij ln pˆ ij ln nij ln n
ˆi.
1 2
2
ij
j 1
1 2
2
(ln
j 1
nij ) n
1 2
2
(ln
j 1
nij ) ln n
6/29/2019
ncutstat
11
目录 上页 下页 返回 结束
§8 .1 对数线性模型基本理论和方法
ˆ. j
1 2
2
ij
i1
1 2
2
(ln
i 1
nij ) 1 n2
2
(ln nij ) ln n
i 1
ˆ..
1 4
2 i 1
2
ij
j 1
1 4
2 i 1
2
(ln
j 1
nij ) 1 n4
2 i 1
2
(ln nij ) ln n
j 1
将以上三式代入公式
这样,本章仅介绍定性数据建模的对数线性模型 和Logistic回归方法。
6/29/2019
ncutstat
4
目录 上页 下页 返回 结束
§8 .1 对数线性模型基本理论和方法
本节将利用2×2维的交叉列联表来说明对数线性模型的 基本理论和方法,同时利用SPSS软件对真实的经济定性数 据作分析。
从2×2维的交叉列联表的概率表,介绍对数线性模型的 基本理论和方法。