高维列联表独立性与相关性解析

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

频数的定义。
• A给定后,B和C条件独立意味着:
P(BC | A) P(B | A) P(C | A)
P( ABC) P( AB) P( AC) P( A) P( A) P( A)
高维列联表的独立性
•即
pi jk pi j pi k
pi
pi pi
pi jk =
pi j pi
pi k
• 对相关关系的分析,还可以通过对数线性模型和 统计软件进行分析。
高维列联表的相关性
• 对期望频数的迭代估计类似于二维不完备 列联表中的迭代算法。
• 对仅有两两交互作用模型检验的原假设应 为:
mijk ij jkik
• 采用的似然比检验统计量与独立性检验的 统计量完全相同;
• 当检验统计量的卡方值较小时,不拒绝原 假设;当卡方值较大时,拒绝原假设。
• 四格表的优比用期望频数定义为:
•其行mm与ii11 jj12列mmii22分jj21 别,1 是i二1 维i2r*cr列,1联表j1的 第j2 i1和ci2行
与第j1和j2列,mij是期望频数:mij=E(nij)
• 对于三维r*c*t列联表,我们按属性A分层,
将它变成r个二维c*t列联表,对第i层二维c*t
• 根据三维列联表独立性的三种情况下不同 的期望频数的估计,可以构造出似然比检 验统计量:
G 2
r
2 ln 2
i 1
c j 1
t k 1
nijk
ln
mˆ ijk nijk
高维列联表的相关性
• 在三维列联表中,前面所有的独立性问题讨论完 后,可以进一步分析三个变量之间的相关关系。
• 相关关系有两种情况:
– 一种是饱和模型,表示为(ABC),即期望频数不能分解, 三个属性之间不仅两两存在交互作用,而且三个之间 也有交互作用;其期望频数的估计就是实际频数nijk。
– 另一种是齐次关联模型,表示为(AB,AC,BC),即期望 频数可分解,两两之间存在交互作用,但三个之间没 有交互作用;其期望频数的估计需要使用迭代算法。
列联表计算优比:
m m ij1k1 ij2k2 m m ij1k2 ij2k1
,1
j1
j2
c,1 k1
k2
t
高维列联表的优比
• 我们知道,在优比等于1时,这两个属性相互独立
• 所以,对于属性A,B,C相互独立时,不论按哪个属 性分层,各层二维表的优比总等于1;
• 对于A与(B,C)相互独立时,按属性A分层后第i层 二维c×t列联表的优比与i无关,故各层B与C的相 合程度相同;无论按B,或C分层,这些二维列联 表上的优比总等于1;由期望频数定义的独立性可 知:
m m ( )( ) ij1k1 ij2k2
i j 1 k1
i j 2 k2
j 1 k1 j ij2k1
i j 1 k2
i j 2 k1
j 1 k2 j 2 k1
高维列联表的优比
• 对于A给定后B和C条件独立时,按A分层的 二维列联表上的优比总等于1;且按B分层各 层A与C相合程度相同,按C分层各层A与B相 合程度相同。
ij1 j1k2 ik2
ij2 j2k1 ik1
j1k2 j2k1
• 对于齐次关联模型,各层二维列联表的优比都与在 第几层没有关系。当以属性A进行分层时,由下式
可证得结论,以B,C进行分层的情形与此类似。
m m ( )( ) ij1k1 ij2k2
ij1 j1k1 ik1
ij2 j2k2 ik2
j1k1 j2k2
m m ( )( ) ij1k2 ij2k1
• 用期望频数定义条件独立性的方法:
• 若存在ξij,ωik使任意格都有: mijk ijik • 则称A给定后B和C条件独立。

其中mijk的估计为:
mˆ ijk
nij ik
ni
高维列联表的独立性
• 与给定A后B和C条件独立类似,可以得到 给定B后A和C条件独立、给定C后A和B条 件独立的期望频数定义。
高维列联表的独立性
• 独立性的定义可以使用概率方式,也可以 采用期望频数来定义。三维列联表独立性 的定义与二维列联表类似。
• 在三维列联表中,令mijk为期望频数,若存 在αi,βj,γk使任意格(ijk)都有: mijk i j k
• 则称A、B、C相互独立。

m其ˆ ijk 中=npmi jkijk的np估ˆi计pˆ为j pˆ:k
n ni n
n j n
nk n
nin jnk n2
高维列联表的独立性
• •
若存在αi,ηjk使任意格都有: 则称A和(B,C)相互独立。
mijk i jk
• •
其 与A中和m(ijBk的,C估)相计互为独:立mˆ的ijk 情n况in类 j似k ,可以得
到B和(A,C)以及C 和(A ,B)相互独立的期望
高维列联表的优比
• 期望频数除用来描述列联表的独立性、相 关性外,还可以描述优势比。
• 优比不仅可以用于四格表,还可推广到一 般的二维列联表。
• 可以取二维表的两行两列来构造一个四格 表计算优比,二维表有若干个优比。
• 三维列联表可以按某一属性分层后形成若 干二维列联表再进行优比分析。
高维列联表的优比
相关文档
最新文档