高中数学第三章统计案例-3.1独立性检验卡方检验素材
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
2
χ
检验
(一) 掌握内容 1. 2χ检验的用途。 2. 四格表的2χ检验。
(1) 四格表2χ检验公式的应用条件; (2) 不满足应用条件时的解决办法; (3) 配对四格表的2χ检验。 3. 行⨯列表的2χ检验。 (二) 熟悉内容
频数分布拟合优度的2χ检验。 (三) 了解内容 1.2χ分布的图形。
2.四格表的确切概率法。
(一) 2χ检验的用途
2χ检验(Chi-square test )用途较广,主要用途如下:
1.推断两个率及多个总体率或总体构成比之间有无差别 2.两种属性或两个变量之间有无关联性 3.频数分布的拟合优度检验 (二) 2χ检验的基本思想
1.2χ检验的基本思想是以2χ值的大小来反映理论频数与实际频数的吻合程度。在零假设0H (比如0H :21ππ=)成立的条件下,实际频数与理论频数相差不应该很大,即2χ值不应该很大,若实际计算出的2χ值较大,超过了设定的检验水准所对应的界值,则有理由怀疑0H 的真实性,从而拒绝0H ,接受H 1(比如1H :21ππ≠)。 2. 基本公式:()∑
-=
T
T A 2
2
χ,A 为实际频数(Actual Frequency ),T 为理论频数
(Theoretical Frequency )。四格表2χ检验的专用公式正是由此公式推导出来的,用专用公
式与用基本公式计算出的2χ值是一致的。
(三)率的抽样误差与可信区间 1.率的抽样误差与标准误
样本率与总体率之间存在抽样误差,其度量方法:
n
p )
1(ππσ-=
,π为总体率,或 (8-1)
n
p p S p )
1(-=
, p 为样本率; (8-2) 2.总体率的可信区间
当n 足够大,且p 和1-p 均不太小,p 的抽样分布逼近正态分布。 总体率的可信区间:(p p S u p S u p ⨯+⨯-2/2/,αα)。 (8-3) (四)2χ检验的基本计算
见表8-1。
表8-1 2
χ检验的用途、假设的设立及基本计算公式
资料形式用途
H、1H的设立与计算公式自由度
四格表①独立资料两
样本率的比较
②配对资料两
样本率的比较
H:两总体率相等1H:两总体率不等
①专用公式
)
)(
)(
)(
(
)
(2
2
d
b
c
a
d
c
b
a
n
bc
ad
+
+
+
+
-
=
χ
②当n≥40但1≤T<5时,校正公式
)
)(
)(
)(
(
)2/
(2
2
d
b
c
a
d
c
b
a
n
n
bc
ad
+
+
+
+
-
-
=
χ
③配对设计
c
b
c
b
+
-
-
=
2
2
)1
(
χ
1
R⨯C表①多个样本率、
构成比的比较
②两个变量之
间关联性分析
H:多个总体率(构成比)相等
(
H:两种属性间存在关联)
1
H:多个总体率(构成比)不全相等
(
H:两种属性间存在关联)
)1
(
2
2-
=∑
C
R
n
n
A
n
χ
(R-1)(C-
1)
频数分布表频数分布的拟
合优度检验
H:资料服从某已知的理论分布
1
H:资料不服从某已知的理论分布
∑-
T
T
A2)
(
据频数表
的组数而
定
(五)四格表的确切概率法
当四格表有理论数小于1或n<40时,宜用四格表的确切概率法。
(六)
2
χ检验的应用条件及注意事项
1.分析四格表资料时,应注意连续性校正的问题,当1
2χ
检验;T≤1,或n≤40时,用Fisher精确概率法。
2.对于R⨯C表资料应注意以下两点:
(1)理论频数不宜太小,一般要求:理论频数<5的格子数不应超过全部格子的1/5;
(2)注意考察是否有有序变量存在。对于单向有序R⨯C表资料,当指标分组变量是有序的时,宜用秩和检验;对于双向有序且属性不同的R⨯C表资料,若希望弄清两有序变量之间是否存在线性相关关系或存在线性变化趋势,应选用定性资料的相关分析或线性趋势检验;对于双向有序且属性相同的R⨯C表资料,为考察两种方法检测的一致性,应选用Kappa检验。
典型试题分析
(一)单项选择题
1.下列哪项检验不适用2
χ检验()
A.两样本均数的比较
B.两样本率的比较
C.多个样本构成比的比较
D.拟合优度检验
答案:A
[评析]本题考点:2
χ检验的主要用途。2χ检验不能用于均数差别的比较。
2.分析四格表时,通常在什么情况下需用Fisher精确概率法()