独立性检验的思想方法

合集下载

1.2独立性检验的基本思想

1.2独立性检验的基本思想
1.2
独立性检验的基本思想及其初步应用
在统计学中, 在统计学中,独立性检验就是检验两个分类变量是 否有关系的一种统计方法。 否有关系的一种统计方法。 所谓“分类变量” 就是指个体所属的类别不同, 所谓“分类变量”,就是指个体所属的类别不同,也 称为属性变量或定型变量。 称为属性变量或定型变量。 在日常生活中, 在日常生活中,我们常常关心两个分类变量之间是 否有关系,例如吸烟是否与患肺癌有关系? 否有关系,例如吸烟是否与患肺癌有关系?性别是否对 于喜欢数学课程有影响等等。 于喜欢数学课程有影响等等。
在吸烟与患肺病这两个分类变量的计算中,下列说法正确 在吸烟与患肺病这两个分类变量的计算中, 的是( 的是(
c

A、若K的观测值为 、 的观测值为k=6.635,我们有 我们有99%的把握认为吸烟与患 的观测值为 我们有 的把握认为吸烟与患 肺病有关系,那么在 个吸烟的人中必有99个患肺病 肺病有关系,那么在100个吸烟的人中必有 个患肺病 个吸烟的人中必有 B、从独立性检验可知有99%的把握认为吸烟与患肺病有关 、从独立性检验可知有 的把握认为吸烟与患肺病有关 系时,我们说某人吸烟,那么他有99%的可能患肺病 系时,我们说某人吸烟,那么他有 的可能患肺病 C、若从统计量中求出有95%的把握认为吸烟与患肺病有关 、若从统计量中求出有 的把握认为吸烟与患肺病有关 系,是指有5%的可能性使得推理出现错误 是指有 的可能性使得推理出现错误 D、以上三种说法都不对 、
列联表的条形图: 90% 列联表的条形图: 100%
80% 70% 60% 50% 40% 30% 20% 10% 0%
优秀 不优秀
由图及表直观判断,好像“成绩优秀与班级有关系”,由表中 由图及表直观判断,好像“成绩优秀与班级有关系” 数据计算, 数据计算,得 K 2 的观察值为 k ≈ 0.653 > 0.455。由教科书中表 11, 1-11,得

独立性检验思想及应用

独立性检验思想及应用

独立性检验思想及应用独立性检验(Independence Test)是统计学中用于研究两个或多个分类变量之间是否存在关联的方法。

它基于假设显著性检验的思想,通过计算观察值与期望值之间的差异程度,来判断两个变量是否独立。

在实际应用中,独立性检验经常用于确定两个变量是否相互影响或存在某种联系,以及在实验设计、社会科学研究、生物学研究等领域中的数据分析。

独立性检验的基本思想是基于对观察样本的期望值进行比较,来推断两个或多个分类变量是否存在关联。

在进行独立性检验时,常用的统计方法包括卡方检验(Chi-square Test)、Fisher精确检验(Fisher's Exact Test)和logistic回归分析(Logistic Regression)等。

卡方检验是独立性检验中最常用的方法之一。

它基于卡方统计量的分布特性,通过计算观测频数与期望频数之间的差异,来判断两个或多个分类变量之间的关联性。

卡方检验的原理是比较观测频数与期望频数之间的差异是否显著,若差异显著,则表明两个变量之间存在关联。

Fisher精确检验是一种非参数的检验方法,用于较小样本量且存在预期频数很低的情况。

它通过穷举计算所有可能的观测结果,来计算出在给定的边际总和下,观测频数与期望频数之差异的概率。

Fisher精确检验在小样本研究中经常被使用,特别是用于研究罕见事件的相关性。

logistic回归分析是一种广义线性模型,可用于分析二分类变量的关联性。

它将自变量的线性组合通过logistic函数转换为估计概率,从而实现对二分类变量之间的关系进行研究。

logistic回归分析在独立性检验领域中常用的方法包括二分类变量的logistic回归、多分类变量的logistic回归和多项式logistic回归等。

独立性检验在很多领域都有广泛的应用。

在医学研究中,独立性检验可以用于分析某种疾病的发病率与多个危险因素之间的关联性,以及评估治疗方法对疾病预后的影响;在社会科学研究中,独立性检验可以用于分析社会经济因素与人群特征之间的关联,以及评估政策改革对社会发展的影响;在生物学研究中,独立性检验可以用于分析基因型与表型之间的关联,以及评估不同基因型对遗传疾病的易感性等。

1.2独立性检验的基本思想及其初步应用

1.2独立性检验的基本思想及其初步应用

试用图形判断服用药和患病之间是否有关系?
解析:相应的等高条形图如下:
从图形可以看出,服用药的样本中患病的比例明显低于 没有服用药的样本中患病的比例,因此可以认为:服用药和 患病之间有关系.
独立性检验方法——K2公式
在调查的480名男士中有38名患有色盲,520名女 士中有6名患有色盲,能否在犯错误的概率不超过0.001的前 提下认为性别与患色盲有关系? 分析:
4.下面是一个2×2列联表: x1 x2 总计 y1 a 2 b y2 21 25 46 总计 73 27 100
则表中a、b的值分别为( C ) A.94、96 C.52、54 B.52、50 D.54、52
5.性别与身高列联表如下: 男 女 总计 高(165 cm以上) 37 6 43 矮(165 cm以下) 4 13 17 总计 41 19 60
作出2×2列联表 → 计算随机变量K2的值 → 对照临界值作出结论 解析:根据题目所给的数据作出如下的列联表:
色盲 不色盲 总计

女 总计
38
6 44
442
514 956
480
520 1 000
根据列联表中所给的数据可以得: a=38,b=442,c=6,d=514,a+b=480,c+d= 520,a+c=44,b+d=956,n=1 000.
3.独立性检验. 利用随机变量K2来判断“两个分类变量有关系”的方法 定义 称为独立性检验.
nad-bc2 公式 K2=_____________________ a+bc+da+cb+d ,其中n=______________. a+b+c+d
①根据实际问题的需要确定容许推断“两个分类变量有 临界值 k0 .② 关系”犯错误概率的上界α,然后查表确定 ________ k________ ≥k0 利用公式计算随机变量K2的 ________ , 观测值 k .③如果 具体 就推断“X与Y有关系”,这种推断犯错误的概率不超过 步骤 α;否则,就认为在犯错误的概率不超过α的前提下不能 推断“X与Y有关系”,或者在样本数据中没有发现足够 证据支持结论“X与Y有关系”.

1.2独立性检验的基本思想及其初步应用课件人教新课标

1.2独立性检验的基本思想及其初步应用课件人教新课标
解答
类型二 由K2进行独立性检验 例2 对196个接受心脏搭桥手术的病人和196个接受血管清障手术的病 人进行3年的跟踪研究,调查他们是否又发作过心脏病,调查结果如下 表所示.
心脏搭桥手术 血管清障手术
总计
又发作过心脏病 39 29 68
未发作过心脏病 总计
157
196
167
196
324
392
试根据上述数据比较这两种手术对病人又发作过心脏病的影响有没有差别. 解 假设病人又发作过心脏病与做过心脏搭桥手术还是血管清障手术没 有关系,由表中数据得a=39,b=157,c=29,d=167,a+b=196,c +d=196,a+c=68,b+d=324,n=392, 由公式得K2的观测值
解答
达标检测
1.通过随机询问110名性别不同的大学生是否爱好某项运动,得到如下列
联表:
喜欢程度


总计
爱好
40
20
60
不爱好
20
30
50
总计
60
50
110
nad-bc2 由 K2=a+bc+da+cb+d算得,
110×40×30-20×202 k= 60×50×60×50 ≈7.8,
12345
附表:
12345
解析 答案
5.“全国文明城市”称号是最有价值的城市品牌,某市为创建第五届“全 国文明城市”,开展了“创建文明城市人人有责”活动.为了了解哪些人 更关注“创城”活动,随机抽取了年龄在10~70岁之间的100人进行调 查,并按年龄绘制如下频数散布表.
年龄(岁) [10,20) [20,30) [30,40) [40,50) [50,60) [60,70]

独立性检验基本思想及应用

独立性检验基本思想及应用

独立性检验基本思想及应用独立性检验是一种用于确定两个变量之间是否存在关联的统计方法。

其基本思想是通过比较观察到的数据与预期的数据之间的差异来推断这两个变量之间的关系。

独立性检验的应用非常广泛。

在社会科学中,独立性检验常被用于研究两个分类变量之间是否存在关联,例如性别和职业、教育水平和政治倾向等。

在医学研究中,独立性检验也可以用来检查某种治疗方法是否与疾病的发展有关,以及风险因素和某种疾病之间的关系。

此外,独立性检验还被广泛应用于市场调查、品牌定位以及质量控制等领域。

独立性检验的基本思想是建立一个零假设(H0)和一个备择假设(H1)。

零假设认为两个变量是独立的,即它们之间没有关联;备择假设则认为两个变量之间存在关联。

独立性检验的步骤可以分为以下几步:1. 收集数据:需要收集两个分类变量的数据,例如通过问卷调查或观察获得数据。

2. 建立列联表:将数据整理成列联表形式,列联表是一种用于描述两个或多个分类变量之间关系的矩阵。

表格的行表示一个变量的不同类别,列表示另一个变量的不同类别,表格中的每个单元格表示两个类别的交叉数量。

3. 计算期望频数:在独立性检验中,我们假设两个变量是独立的,因此可以基于各类别的边际总数以及样本总数来计算期望频数。

期望频数是在两个变量独立情况下,各个类别的交叉数量。

4. 计算卡方统计量:卡方统计量用于衡量观察到的数据与期望数据之间的差异程度。

计算公式为:χ2 = Σ((观察频数- 期望频数)^2 / 期望频数)。

其中,Σ表示对所有单元格进行求和。

5. 设定显著性水平:显著性水平α为决策的临界点,用于决定是否拒绝零假设。

通常,α的常见选择为0.05或0.01。

6. 判断和解释结果:根据计算出的卡方统计量与临界值进行比较,如果计算出的卡方值大于临界值,拒绝零假设,认为两个变量之间存在关联;反之,接受零假设,认为两个变量是独立的。

独立性检验的结果常常以卡方统计量和p值的形式呈现。

p值是在零假设成立的条件下,观察到的数据与期望数据之间差异的概率。

独立性检验的基本思想及其初步应用教学设计-【通用,经典教学资料】

独立性检验的基本思想及其初步应用教学设计-【通用,经典教学资料】

3.2.1 《独立性检验的基本思想及其初步应用》教学设计【教学目标】1.知识与技能:通过对典型案例的探究,了解独立性检验的基本思想,会对两个分类变量进行独立性检验,明确独立性检验的基本步骤,并能解决实际问题。

2.过程与方法:通过设置问题,引导学生自主发现、合作探究、归纳展示、质疑对抗,使学生成为课堂主体。

3.情感、态度与价值观:通过本节课学习,让学生体会统计方法在决策中的作用;合作探究的学习过程,使学生感受发现、探索的乐趣及成功展示的成就感,培养学生学习数学知识的积极态度。

【教学重点】了解独立性检验的基本思想及实施步骤。

【教学难点】独立性检验的基本思想;随机变量2K的含义。

【学情分析】本节课是在学习了统计、回归分析的基本思想及初步应用后,利用独立性检验进一步分析两个分类变量之间是否有关系,为以后学习统计理论奠定基础。

【教学方式】多媒体辅助,合作探究式教学。

【教学过程】一、情境引入,提出问题请看视频:[设计意图说明]好的课堂情景引入,能激发学生的求知欲,是新问题能够顺利解决的前提之一。

问题1、你认为吸烟与患肺癌有关系吗?怎样用数学知识说明呢?[设计意图说明]提出问题,引导学生自主探究,指明方向,步步深入。

二、阅读教材,探究新知1.分类变量对于性别变量,其取值为男和女两种:[设计意图说明]利用图像向学生展示变量的不同取值,更加形象的表示分类变量的概念。

这种变量的不同“值”表示个体所属的不同类别,像这样的变量称为分类变量。

生活中有很多这样的分类变量如:是否吸烟宗教信仰国籍民族……2.列联表为研究吸烟是否对患肺癌有影响,某肿瘤研究所随机地调查了9965人,得到如下结果:表3—7 吸烟与患肺癌列联表单位:人不患肺癌患肺癌总计不吸烟7775427817吸烟2099492148总计9874919965究每个分类变量只取两个值,这样的列联表称为22 列联表)。

问题1、吸烟与患肺癌有关系吗?由以上列联表,我们估计①在不吸烟者中患肺癌的比例为________;②在吸烟者中患肺癌的比例为。

1.2独立性检验的基本思想及其初步应用课件人教新课标

1.2独立性检验的基本思想及其初步应用课件人教新课标
a+b c+d
因此,
|ad-bc|越小,说明吸烟与患肺癌之间关系越弱; |ad-bc|越大,说明吸烟与患肺癌之间关系越强.
为了使不同样本容量的数据有统一的评判 标准,基于上述分析,我们构造一个随机变量:
K2 =
n(ad - bc)n
(a + b)(c + d)(a + c)(b + d)
其中n=a+b+c+d为样本容量.
48 121 208 223 193 165 42
(I)将各组的频率填入表中;
(II)根据上述统计结果,计算灯管使用寿命不足 1500小时的频率.
解答
分组
频数 频率
[500,9 [900, 00) 1100)
48 121 0.048 0.121
[1100, 1300)
208 0.208
[1300, 1500)
P(k2>k) 0.50 0.40 0.25 0.15 0.10 0.05 0.025 0.010 0.005 0.001 k 0.455 0.708 1.323 2.072 2.706 3.84 5.024 6.635 7.879 10.83
(2)利用K2公式,计算随机变量K2的观测值k.
(3)如果k>k0,就推断“X与Y有关系”,这 种推断犯错误的概率不超过a;否则,就认为在犯 错误的概率不超过a的前提下不能推断“X与Y有关 系”.
k=
16.373 > 6.635
3891048 665 772
所以有99%的把握认为”秃顶与患心脏病有关”.
解答
根据题目所得数据得到列联表:
秃顶 不秃顶
总计
患心脏病 214 451 665

人教版高中选修2-33.2独立性检验的基本思想及其初步课程设计

人教版高中选修2-33.2独立性检验的基本思想及其初步课程设计

人教版高中选修2-33.2独立性检验的基本思想及其初步课程设计一、独立性检验概述在概率论和数理统计中,独立性检验是指检验两个离散随机变量之间是否独立的方法。

在实际问题中,常常需要研究两个随机变量之间的关系,是否存在关联。

例如,对于一个大学招生的案例,一个人的高中成绩和大学录取情况可以是两个随机变量,我们需要使用独立性检验来判断这两个随机变量是否有关联。

二、独立性检验方法独立性检验方法有很多种,其中最常用的是卡方检验。

2.1 卡方检验卡方检验是一种统计检验方法,用于检验分类资料之间的独立性。

它的基本思想是,将观察结果与理论期望作比较,确定两者之间是否有显著差异来判断两个随机变量之间是否独立。

卡方检验的基本步骤包括:1.假设零假设为两个随机变量独立,对这个假设建立尽可能充分的理论模型。

2.将实际观察值与理论值进行比较,计算出统计量。

3.利用卡方分布表来获得临界值,以判断是否拒绝零假设。

2.2 其他方法在实际应用中,除了卡方检验,还有很多独立性检验的方法。

例如,t检验中的独立样本t检验,ANOVA中的多元卡方检验等等。

这些方法在不同的领域和场合有不同的应用。

三、课程设计建议针对高中选修2-33.2独立性检验,可以设计以下课程教学内容:3.1 概念讲解在课程开头,可以先为学生介绍独立性检验的基本概念,包括随机变量、独立性、检验方法等。

这部分内容可以通过举例子、讲解理论、使用模拟仿真等方式进行,让学生对独立性检验有一个初步的认识。

3.2 卡方检验的具体操作在学生掌握了基本概念之后,可以进一步教授卡方检验的具体操作方法。

在讲解过程中,教师可采取课堂讲解方式,为学生演示计算过程和判断方法。

并且可以为学生演示如何使用统计软件完成卡方检验。

同时,为了让学生更好的掌握卡方检验的操作,可以设计一些实际案例,让学生进行计算和判断实验。

3.3 讨论与总结在课程结束时,可以组织学生进行小组讨论和总结。

讨论的主题可以是卡方检验的应用与展望,或是针对课程内容的总结与反思。

独立性检验的基本思想及其初步应用参考模板范本

独立性检验的基本思想及其初步应用参考模板范本
最后,根据随机变量K2的含义,查临界值表。先确 定分类变量无关的可信度,再转化得到我们有多大把握 认为两个分类变量是有关的。
反证法原理与独立性检验原理
反证法原理:
在一个已知假设 下,如果推出一 个矛盾,就证明 了这个假设不成 立。
独立性检验原理:
在一个已知假设下, 如果一个与该假设 矛盾的小概率事件 发生,就推断这个 假设不成立。
患肺癌 42 0.54% 49 2.28% 91
总计 7817 2148 9965
100%
90%

80%

70%

60%

50%

40%
30%
20%10%0%源自不吸烟吸烟患肺癌 不患肺癌
不吸烟
吸烟 总计
不患肺癌 a
c a+c
患肺癌 b
d b+d
总计 a+b
c+d a+b+c+d
问3:a、b、c、d应该满足怎样的关系?
高二数学 选修 2-3
第三章 统计案例
3.2
独立性检验的
基本思想及其初步应用
视频
问题1 心脏病、肺癌、脑血管病等都与吸烟有关, 吸烟已成为继高血压之后的第二号全球杀手。 这些疾病与吸烟有关的结论是怎样得出的呢?
案 例:某肿瘤研究所为了研究吸烟是否对患肺癌 有影响,进行了一次随机抽样调查,共调查了9965 个成年人,其中吸烟者2148人,不吸烟者7817人。 调查结果如下表所示:
解:列出吸烟与是否患肺癌的2x2列联表如下
不吸烟 吸烟 总计
不患病 7775 2099 9874
患病 42 49 91
总计 7817 2148 9965

独立性检验

独立性检验

独立性检验的步骤及应用1、独立性检验的思想及步骤独立性检验的基本思想类似于数学上的“反证法”。

要确认“两个分类变量有关系”这一结论成立的可信程度。

首先假设结论不成立,即“这两个分类变量几乎没有关系”(“几乎独立”)成立,则,此时,我们所构造的随机变量应该很小。

如果由观测数据计算得到的k不是很小,则在一定程度上说明假设不合理。

而且观测值k越大,说明假设(“几乎无关或独立”)不成立的可能性就越大,即两者有关的可能性越大,这样我们就可以由的观测值k并结合已往估算经验值表定出我们有多大程度等等把握可以认为“两个分类变量有关系”。

这个经验值表如下(有必要记住):与的观测值k相应的参考值:在假设“X与Y无关”的前提下出现=k概率:P(=k)考查结果=k与假设矛盾的可能性,即可以认为“X与Y有关”的把握程度:1-P(=k)=10.8280.00199.9%(“有关”程度较高。

“独立性”较弱)=7.7890.00599.5%=6.6350.0199%=5.0240.02597.5%=3.8410.0595%=2.7060.1090%超过0.1585%以下(无明显理由认为“有关”,“独立性”较强)2、典例分析例1、某校对学生课外活动内容进行调查,结果整理成2×2列联表如下:体育文娱合计男生212344女生62935合计275279试分析“喜欢体育还是喜欢文娱”与“性别”之间三多大程度上有关?解:将a=21,b=23,c=6,d=29,n=79代入,得即的观察值假设喜欢体育还是喜欢文娱与性别没有关系,则的观察值k应该很小,且由经验值表知,即在此假设成立的前提下出现的可能性只有0.005左右,而不出现的可能性约为99.5%,但在本调查中却得出的观察值,超过了7.789,所以我们有99.5%的把握可以认为此假设不成立,即有99.5%的把握可以认为喜欢体育还是喜欢文娱与性别有关。

例2、调查在2~3级风时的海上航行中男女乘客的晕船情况,共调查了71人,其中女性34人,男性37人。

高中数学1-2独立性检验的基本思想及其初步应用同步课件新人教A版选修1-2.ppt

高中数学1-2独立性检验的基本思想及其初步应用同步课件新人教A版选修1-2.ppt

与性别是有关的.
根据列联表中所给的数据,有 a=38,b=442,c=6,
d=514,a+b=480,c+d=520,a+c=44,b+d=956,n
=1000,得 K2 的观测值
k=(a+b)(cn+(add-)(ab+c)c2)(b+d)

1000×(38×514-442×6)2 480×520×44×956
第一种剂量 第二种剂量
合计
死亡 14 6 20
存活 11 19 30
合计 25 25 50
三、解答题
7.在500个人身上试验某种血清预防感冒的作用,把一年中的记录与另外500个未用血 清的人作比较,结果如下表所示.
试画出列表的条形图,并通过图形判断这种血清能否起到预防感冒的作用?并进行独立
性检验.
[答案] 0.005
[解析] k=8.654>7.879,就推断“X与Y有关”犯错误的 概率不超过0.005.
6.为了探究电离辐射的剂量与人体的受损程度是否有关,用两种不同剂量的电离辐射 照射小白鼠.在照射后14天内的结果如下表所示:
进行统计分析时的统计假设是__________________. [答案] 假设电离辐射的剂量与人体受损程度无关.
≈27.1.


k≈27.1>10.828,所以我们有 99.9%的把握认为色盲与性
别有关系.这个结论只对所调查的 480 名男人和 520 名
女人有效.
[点评] 本题应首先作出调查数据的列联表,再根据列联 表画出二维条形图或三维柱形图,并进行分析,最后利用 独立性检验作出判断.
1.利用图形来判断两个分类变量是否有关系,可以画出三 维柱形图,也可以画出二维条形图,仅从图形上只可以粗 略地判断两个分类变量是否有关系,可以结合所给的数值 来进行比较.作图应注意单位统一,图形准确,但它不能 给我们两个分类变量有关或无关的精确的可信程度,若要 作出精确的判断,可以作独立性检验的有关计算.

8.3.2独立性检验(解析版)

8.3.2独立性检验(解析版)

独立性检验【学习目标】1.了解独立性检验的基本思想、方法及其简单应用2.理解判断两个分类变量是否有关系的常用方法、独立性检验中K2的含义及其实施步骤【自主学习】知识点独立性检验(1)定义:利用随机变量K2来判断“两个分类变量有关系”的方法称为独立性检验.(2)K2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d),其中n=a+b+c+d.(3)独立性检验的具体做法①根据实际问题的需要确定容许推断“两个分类变量有关系”犯错误概率的上界α,然后查表确定临界值k0.②利用公式计算随机变量K2的观测值k.③如果k≥k0,就推断“X与Y有关系”,这种推断犯错误的概率不超过α,否则就认为在犯错误的概率不超过α的前提下不能推断“X与Y有关系”,或者在样本数据中没有发现足够证据支持结论“X与Y有关系”.【合作探究】探究一 有关“相关的检验”【例1】某校对学生课外活动进行调查,结果整理成下表:用你所学过的知识进行分析,能否在犯错误的概率不超过0.005的前提下,认为“喜欢体育还是文娱与性别有关系”?解 判断方法如下:假设H 0“喜欢体育还是喜欢文娱与性别没有关系”,若H 0成立,则K 2应该很小. ∵a =21,b =23,c =6,d =29,n =79, ∴K 2=n (ad -bc )2(a +b )(c +d )(a +c )(b +d )=79×(21×29-23×6)244×35×27×52≈8.106.且P (K 2≥7.879)≈0.005即我们得到的K 2的观测值k ≈8.106超过7.879,这就意味着:“喜欢体育还是文娱与性别没有关系”这一结论成立的可能性小于0.005,即在犯错误的概率不超过0.005的前提下认为“喜欢体育还是喜欢文娱与性别有关”.归纳总结:(1)利用K 2=n (ad -bc )2(a +b )(c +d )(a +c )(b +d )求出K 2的观测值k 的值.再利用临界值的大小来判断假设是否成立.(2)解题时应注意准确代数与计算,不可错用公式,准确进行比较与判断.【练习1】为研究学生的数学成绩与对学习数学的兴趣是否有关,对某年级学生作调查得到如下数据:判断学生的数学成绩好坏与对学习数学的兴趣是否有关? 解 由公式得K 2的观测值k =189×(64×73-22×30)286×103×95×94≈38.459.∵38.459>10.828,∴有99.9%的把握说学生学习数学的兴趣与数学成绩是有关的.探究二 有关“无关的检验”【例2】为了探究学生选报文、理科是否与对外语的兴趣有关,某同学调查了361名高二在校学生,调查结果如下:理科对外语有兴趣的有138人,无兴趣的有98人,文科对外语有兴趣的有73人,无兴趣的有52人.分析学生选报文、理科与对外语的兴趣是否有关? 解 列出2×2列联表代入公式得K 2的观测值k =361×(138×52-73×98)2236×125×211×150≈1.871×10-4.∵1.871×10-4<2.706,∴可以认为学生选报文、理科与对外语的兴趣无关.归纳总结:运用独立性检验的方法:(1)列出2×2列联表,根据公式计算K 2的观测值k . (2)比较k 与k 0的大小作出结论.【练习2】第16届亚运会于2010年11月12日至27日在中国广州进行,为了搞好接待工作,组委会招募了16名男志愿者和14名女志愿者,调查发现,男、女志愿者中分别有10人和6人喜爱运动,其余人不喜爱运动. (1)根据以上数据完成以下2×2列联表:(2)根据列联表的独立性检验,能否在犯错误的概率不超过0.10的前提下认为性别与喜爱运动有关? 解 (1)(2)假设是否喜爱运动与性别无关,由已知数据可求得: K 2=30×(10×8-6×6)2(10+6)(6+8)(10+6)(6+8)≈1.157 5<2.706,因此,在犯错误的概率不超过0.10的前提下不能判断喜爱运动与性别有关.探究三 独立性检验的基本思想【例3】某企业有两个分厂生产某种零件,按规定内径尺寸(单位:mm)的值落在(29.94,30.06)的零件为优质品.从两个分厂生产的零件中各抽出500件,量其内径尺寸,结果如下表: 甲厂乙厂(1)试分别估计两个分厂生产的零件的优质品率;(2)由以上统计数据填下面2×2列联表,并问是否有99%的把握认为“两个分厂生产的零件的质量有差异”.附:K 2=n (ad -bc )(a +b )(c +d )(a +c )(b +d ),解 (1)甲厂抽查的产品中有360件优质品,从而甲厂生产的零件的优质品率估计为360500=72%;乙厂抽查的产品中有320件优质品,从而乙厂生产的零件的优质品率估计为320500=64%.(2)K 2=1 000×(360×180-320×140)2500×500×680×320≈7.353>6.635,所以有99%的把握认为“两个分厂生产的零件的质量有差异”.归纳总结:(1)解答此类题目的关键在于正确利用K 2=n (ad -bc )2(a +b )(c +d )(a +c )(b +d )计算k 的值,再用它与临界值k 0的大小作比较来判断假设检验是否成立,从而使问题得到解决.(2)此类题目规律性强,解题比较格式化,填表计算分析比较即可,要熟悉其计算流程,不难理解掌握.【练习3】下表是某地区的一种传染病与饮用水的调查表:(1)这种传染病是否与饮用水的卫生程度有关,请说明理由;(2)若饮用干净水得病5人,不得病50人,饮用不干净水得病9人,不得病22人.按此样本数据分析这种疾病是否与饮用水有关,并比较两种样本在反映总体时的差异.解 (1)假设H 0:传染病与饮用水无关.把表中数据代入公式得:K 2的观测值k =830×(52×218-466×94)2146×684×518×312≈54.21,∵54.21>10.828,所以拒绝H 0.因此我们有99.9%的把握认为该地区这种传染病与饮用不干净水有关. (2)依题意得2×2列联表:此时,K 2的观测值k =86×(5×22-50×9)14×72×55×31≈5.785.由于5.785>5.024,所以我们有97.5%的把握认为该种疾病与饮用不干净水有关.两个样本都能统计得到传染病与饮用不干净水有关这一相同结论,但(1)中我们有99.9%的把握肯定结论的正确性,(2)中我们只有97.5%的把握肯定.课后作业A组基础题一、选择题1.经过对K2的统计量的研究,得到了若干个临界值,当K2的观测值k>3.841时,我们() A.在犯错误的概率不超过0.05的前提下可认为X与Y有关B.在犯错误的概率不超过0.05的前提下可认为X与Y无关C.在犯错误的概率不超过0.01的前提下可认为X与Y有关D.没有充分理由说明事件X与Y有关系【答案】A2.用独立性检验来考察两个分类变量x与y是否有关系,当统计量K2的观测值() A.越大,“x与y有关系”成立的可能性越小B.越大,“x与y有关系”成立的可能性越大C.越小,“x与y没有关系”成立的可能性越小D.与“x与y有关系”成立的可能性无关【答案】B3.在一个2×2列联表中,由其数据计算得K2的观测值k=7.097,则这两个变量间有关系的可能性为()A.99% B.99.5%C.99.9% D.无关系【答案】A解析K2的观测值6.635<k<7.879,所以有99%的把握认为两个变量有关系.4.对两个分类变量A,B的下列说法中正确的个数为()①A与B无关,即A与B互不影响;②A与B关系越密切,则K2的值就越大;③K2的大小是判定A与B是否相关的唯一依据A.0 B.1 C.2 D.3【答案】B解析①正确,A与B无关即A与B相互独立;②不正确,K2的值的大小只是用来检验A 与B是否相互独立;③不正确,例如借助三维柱形图、二维条形图等.故选B.5.考察棉花种子经过处理跟生病之间的关系得到下表数据:根据以上数据,可得出()A.种子是否经过处理跟是否生病有关B.种子是否经过处理跟是否生病无关C.种子是否经过处理决定是否生病D.以上都是错误的【答案】B解析由K2=407×(32×213-61×101)293×314×133×274≈0.164<2.706,即没有把握认为种子是否经过处理跟是否生病有关. 二、填空题 6.根据下表计算:K 2的观测值k ≈________(保留3位小数). 【答案】 4.514解析 k =300×(37×143-85×35)2122×178×72×228≈4.514.7.如果K 2的观测值为6.645,可以认为“x 与y 无关”的可信度是________. 【答案】 1%解析 查表可知可信度为1%.8.为了解高中生作文成绩与课外阅读量之间的关系,某研究机构随机抽取了60名高中生,通过问卷调查,得到以下数据:由以上数据,计算得到K 2的观测值k ≈9.643,根据临界值表,有________把握认为课外阅读量大与作文成绩优秀有关. 【答案】 99.5%解析根据临界值表,9.643>7.879,在犯错误的概率不超过0.005的前提下,认为课外阅读量大与作文成绩优秀有关,即有99.5%的把握认为课外阅读量大与作文成绩优秀有关.9.为研究某新药的疗效,给50名患者服用此药,跟踪调查后得下表中的数据:设H0:服用此药的效果与患者的性别无关,则K2的观测值k≈________(小数点后保留三位有效数字),从而得出结论:服用此药的效果与患者的性别有关,这种判断出错的可能性为________.【答案】 4.8825%解析由公式计算得K2的观测值k≈4.882,∵k>3.841,∴我们有95%的把握认为服用此药的效果与患者的性别有关,从而有5%的可能性出错.三、解答题10.高中流行这样一句话“文科就怕数学不好,理科就怕英语不好”.下表是一次针对高三文科学生的调查所得数据,试问:在出错概率不超过0.025的前提下,能否判断“文科学生总成绩不好与数学成绩不好有关系”?解依题意,计算随机变量K2的观测值:k =913×(478×24-399×12)2490×423×877×36≈6.233>5.024,所以在出错概率不超过0.025的前提下,可以判断“文科学生总成绩不好与数学成绩不好有关系”.11.吃零食是中学生中普遍存在的现象,吃零食对学生身体发育有诸多不利影响,影响学生的健康成长.下表是性别与吃零食的列联表:请问喜欢吃零食与性别是否有关?解K 2=n (ad -bc )2(a +b )(c +d )(a +c )(b +d ),把相关数据代入公式,得 K 2的观测值k =85×(5×28-40×12)217×68×45×40≈4.722>3.841.因此,在犯错误的概率不超过0.05的前提下,可以认为“喜欢吃零食与性别有关”. 12.在某校对有心理障碍学生进行测试得到如下列联表:试说明在这三种心理障碍中哪一种与性别关系最大?解 对于题中三种心理障碍分别构造三个随机变量K 21,K 22,K 23.其观测值分别为k 1,k 2,k 3.由表中数据列出焦虑是否与性别有关的2×2列联表可得k 1=110×(5×60-25×20)30×80×25×85≈0.863<2.706,同理,k 2=110×(10×70-20×10)230×80×20×90≈6.366>5.024,k 3=110×(15×30-15×50)230×80×65×45≈1.410<2.706.因此,在犯错误的概率不超过0.025的前提下,认为说谎与性别有关,没有充分的证据显示焦虑、懒惰与性别有关.B组能力提升一、选择题1.千百年来,我国劳动人民在生产实践中根据云的形状、走向、速度、厚度、颜色等的变化,总结了丰富的“看云识天气”的经验,并将这些经验编成谚语,如“天上钩钩云,地上雨淋淋”“日落云里走,雨在半夜后”……小波同学为了验证“日落云里走,雨在半夜后”,观察了所在地区A的100天日落和夜晚天气,得到如下2×2列联表:0010并计算得到219.05K≈,下列小波对地区A天气判断不正确的是()A. 夜晚下雨的概率约为1 2B. 未出现“日落云里走”夜晚下雨的概率约为5 14C. 有99.9%的把握认为“‘日落云里走’是否出现”与“当晚是否下雨”有关D. 出现“日落云里走”,有99.9%的把握认为夜晚会下雨【答案】:D【分析】把频率看作概率,即可判断,A B的正误;根据独立性检验可判断,C D的正误,即得【答案】.【详解】由题意,把频率看作概率可得:夜晚下雨的概率约为252511002+=,故A正确;未出现“日落云里走”夜晚下雨的概率约为255254514=+,故B正确;由219.0510.828K≈>,根据临界值表,可得有99.9%的把握认为“‘日落云里走’是否出现”与“当晚是否下雨”有关,故C正确;故D错误.故选:D.2.为了判断英语词汇量与阅读水平是否相互独立,某语言培训机构随机抽取了100位英语学习者进行调查,经过计算2K的观测值为7,根据这一数据分析,下列说法正确的()附:A. 有99%以上的把握认为英语词汇量与阅读水平无关B. 有99.5%以上的把握认为英语词汇量与阅读水平有关C. 有99.9%以上的把握认为英语词汇量与阅读水平有关D. 在犯错误的概率不超过1%的前提下,可以认为英语词汇量与阅读水平有关 【答案】:D 【分析】由题意()26.6350.01P K ≥=,由独立性检验的原理即可得解.【详解】由题意27K =,()26.6350.01P K ≥=,所以在犯错误的概率不超过1%的前提下,可以认为英语词汇量与阅读水平有关,有99%的把握认为英语词汇量与阅读水平有关. 故选:D.3.通过随机询问110名性别不同的大学生是否爱好某项运动,得到如下的22⨯列联表:由22()()()()()n ad bc a b c d a c b d χ-=++++算得,22110(40302020)7.860506050χ⨯⨯-⨯=≈⨯⨯⨯.附表:参照附表,得到的正确结论是()A. 在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别有关”;B. 在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别无关”;C. 有99%以上的把握认为“爱好该项运动与性别有关”;D. 有99%以上的把握认为“爱好该项运动与性别无关”.【答案】:C【分析】根据给定的2K的值,结合附表,即可得到结论.【详解】由22110(40302020)7.8 6.63560506050χ⨯⨯-⨯=≈>⨯⨯⨯,所以有99%以上的把握认为“爱好该项运动与性别有关.故选:C.4.在一次独立性检验中得到如下列联表:若这两个分类变量A和B没有关系,则a的可能值是() A. 200 B. 720C. 100D. 180【答案】:B 【分析】令2k 的观测值为零,解方程即得解.【详解】当a =720时,k =0,易知此时两个分类变量没有关系. 故【答案】为B5.(多选题)针对时下的“抖音热”,某校团委对“学生性别和喜欢抖音是否有关”作了一次调查,其中被调查的男女生人数相同,男生喜欢抖音的人数占男生人数的45,女生喜欢抖音的人数占女生人数35,若有95%的把握认为是否喜欢抖音和性别有关则调查人数中男生可能有( )人 附表:附:()()()()()22n ad bc K a b c d a c b d -=++++ A. 25 B. 45C. 60D. 75【答案】:BC 【分析】设男生的人数为()5n n N*∈,列出22⨯列联表,计算出2K 的观测值,结合题中条件可得出关于n 的不等式,解出n 的取值范围,即可得出男生人数的可能值.【详解】设男生的人数为()5n n N*∈,根据题意列出22⨯列联表如下表所示:则()221042310557321n n n n n n K n n n n ⨯⨯-⨯==⨯⨯⨯,由于有95%的把握认为是否喜欢抖音和性别有关,则23.841 6.632K ≤<,即103.841 6.63221n≤<,得8.066113.9272n ≤<, n N *∈,则n 的可能取值有9、10、11、12,因此,调查人数中男生人数的可能值为45或60. 故选:BC. 二、填空题6.某手机运营商为了拓展业务,现对该手机使用潜在客户进行调查,随机抽取国内国外潜在用户代表各100名,调查用户对是否使用该手机的态度,得到如图所示的等高条形图.根据等高图,______(填“有”或“没有”)99.5%以上的把握认为持乐观态度和国内外差异有关.(参考公式与数据:()()()()()22n ad bc K a b c d a c b d -=++++,其中n a b c d =+++)()20P K k ≥0.05 0.01 0.005 0.001 0k3.841 6.635 7.879 10.828【答案】:有依题意,可知国内代表乐观人数60人,不乐观人数40人,国外乐观人数40人,不乐观人数60人,总计乐观人数100人,不乐观人数100人,所以,而,所以有99.5%以上的把握认为持乐观态度和国内外差异有关.7.给给给给给给给 给线性回归方程y bx a =+必过点(),x y ;给相关系数r 越小,表明两个变量相关性越弱; ()22200606040408100100100100K ⨯-⨯==⨯⨯⨯87.879>给相关指数2R 越接近1,表明回归的效果越好;给在一个2×2列联表中,由计算得2K 的观测值k =13.079,则有99%以上的把握认为这两个变量之间没有关系;给设有一个线性回归方程35y x =-,则变量x 增加一个单位时,y 平均增加5个单位. 其中正确的说法有 (填序号).【答案】:给给对于给,应该是相关系数r 的绝对值越小,表明两个变量相关性越弱.所以它是错误的.对于给,应该是有99%以上的把握认为这两个变量之间有关系.对于给,应该是变量x 增加一个单位时,y 平均减少5个单位.故填给给.三、解答题8.随着现代教育技术的不断发展,我市部分学校开办智慧班教学,某校从甲乙两智慧班各随机抽取45名学生,调查两个班学生对智慧课堂的评价:“满意”与“不满意”,调查中发现甲班评价“满意”的学生人数比乙班评价“满意”的学生人数多9人,根据调查情况制成如下图所示的2×2列联表:(1)完成2×2列联表,并判断能否有97.5%的把握认为评价与班级有关系?(2)从甲乙两班调查评价为“不满意”的学生中按照分层抽样的方法随机抽取7人,现从这7人中选派3人到校外参加智慧课堂研究活动,求其中至少有2人选自乙班学生的概率. 附:22()()()()()n ad bc K a b c d a c b d -=++++,其中n a b c d =+++.【答案】:(1)表格见解析,有97.5%的把握认为评价与班级有关系;(2)67. 【分析】 (1)首先根据题意填写22⨯列联表,再计算2 5.031 5.024=>K 即可得到结论.(2)首先根据题意得到甲班选取2人,乙班选取5人,再计算概率即可.【详解】(1)完成列联表如下:2290(3915306)=5.031 5.024********⨯-⨯=>⨯⨯⨯K . 所以有97.5%的把握认为评价与班级有关系.(2)抽样比17213==,甲班选取2人,乙班选取5人,则1232553767C C CpC+==.9.盲盒里面通常装的是动漫、影视作品的周边,或者设计师单独设计出来的玩偶.由于盒子上没有标注,购买者只有打开才会知道自己买到了什么,因此这种惊喜吸引了众多年轻人,形成了“盲盒经济”.某款盲盒内可能装有某一套玩偶的A、B、C三种样式,且每个盲盒只装一个.(1)若每个盲盒装有A、B、C三种样式玩偶的概率相同.某同学已经有了A样式的玩偶,若他再购买两个这款盲盒,恰好能收集齐这三种样式的概率是多少?(2)某销售网点为调查该款盲盒的受欢迎程度,随机发放了200份问卷,并全部收回.经统计,有30%的人购买了该款盲盒,在这些购买者当中,女生占23;而在未购买者当中,男生女生各占50%.请根据以上信息填写下表,并分析是否有95%的把握认为购买该款盲盒与性别有关?参考公式:()()()()()22n ad bca b c d a c b dχ-=++++,其中n a b c d=+++.参考数据:(3)该销售网点已经售卖该款盲盒6周,并记录了销售情况,如下表:由于电脑故障,第二周数据现已丢失,该销售网点负责人决定用第4、5、6周的数据求线性回归方程,再用第1、3周数据进行检验.①请用4、5、6周的数据求出y关于x的线性回归方程y bx a=+;(注:()()()1122211n ni i i ii in ni ii ix x y y x y nx ybx x x nx====---==--∑∑∑∑,a y bx=-)②若由线性回归方程得到的估计数据与所选出的检验数据的误差均不超过2盒,则认为得到的线性回归方程是可靠的,试问①中所得的线性回归方程是否可靠?③如果通过②的检验得到的回归直线方程可靠,我们可以认为第2周卖出的盒数误差也不超过2盒,请你求出第2周卖出的盒数的可能取值;如果不可靠,请你设计一个估计第2周卖出的盒数的方案.【答案】:(1)29;(2)表格见解析,有95%把握认为购买该款盲盒与性别有关;(3)给2.514.5y x=+;给是可靠的;给第2周卖出的盒数的可能值为18、19、20、21.【分析】(1)用列举法写出所有基本事件,再从中找出满足要求的基本事件,用古典概型的公式即可求得结果;(2)通过计算,完成列联表,再计算出观测值2 4.714k ≈,比表中0.05所对应的数据3.841大,故得出结论“有95%把握认为购买该款盲盒与性别有关”;(3)给将第4、5、6周的数据代入公式,计算出b 和a ,写出回归直线方程;给将第1、3周的数据代入给所求出的回归直线方程进行检验,该方程可靠;给将2x =代入给所求出的回归直线方程,解得19.5y =,根据可靠性的要求,以及该应用题的实际要求,得出第2周卖出的盒数的可能取值.【详解】解:(1)由题意,基本事件空间为{}(,),(,),(,),(,),(,),(,),(,),(,),(,)A A A B A C B A B B B C C A C B C C Ω=,其中基本事件的个数为9,设事件D 为:“他恰好能收集齐这三种样式”,则()(){},,,D B C C B =,其中基本事件的个数为2, 则他恰好能收集齐这三种样式的概率29P =; (2)22200(40702070) 4.7141109060140k ⨯-⨯=≈⨯⨯⨯, 又因为4.714 3.841>,故有95%把握认为“购买该款盲盒与性别有关”;(3)给由数据,求得5x =,27y =,由公式求得 222(45)(2527)(55)(2627)(65)(3027)5(45)(55)(65)2b --+--+--==-+-+-, 527514.52a =-⨯=, 所以y 关于x 的线性回归方程为 2.514.5y x =+;给当1x =时, 2.5114.517y =⨯+=,17162-<,同样,当3x =时, 2.5314.522y =⨯+=,22232-<,所以,所得到的线性回归方程是可靠的;给由给可知回归直线方程可靠,2x =时 2.5214.519.5y =⨯+=,设第二周卖出的盒数为()n n N ∈,则19.52n -≤,≤≤,n17.521.5给n能取18、19、20、21,即第2周卖出的盒数的可能值为18、19、20、21.【点睛】本题考查了古典概型的概率计算,独立性检验的实际应用,线性回归直线方程的求解及实际应用问题,综合性较强.10.阿基米德是古希腊伟大的哲学家、数学家、物理学家,对几何学、力学等学科作出过卓越贡献.为调查中学生对这一伟大科学家的了解程度,某调查小组随机抽取了某市的100名高中生,请他们列举阿基米德的成就,把能列举阿基米德成就不少于3项的称为“比较了解”,少于三项的称为“不太了解”.他们的调查结果如下:(1)完成如下2×2列联表,并判断是否有99%的把握认为,了解阿基米德与选择文理科有关?(2)在抽取的100名高中生中,按照文理科采用分层抽样的方法抽取10人的样本. (i )求抽取的文科生和理科生的人数;(ii )从10人的样本中随机抽取3人,用X 表示这3人中文科生的人数,求X 的分布列和数学期望.参考数据:22()()()()()n ad bc k a b c d a c b d -=++++,n a b c d =+++. 【答案】:(1)见解析;(2) (i )文科生3人,理科生7人 (ii )见解析【分析】(1)写出列联表后可计算2K ,根据预测值表可得没有99%的把握认为,了解阿基米德与选择文理科有关.(2)(i )文科生与理科生的比为310,据此可计算出文科生和理科生的人数. (ii )利用超几何分布可计算X 的分布列及其数学期望.【详解】解:(1)依题意填写列联表如下:计算222()100(42182812) 3.382 6.635()()()()30705446n ad bc K a b c d a c b d -⨯-⨯==≈<++++⨯⨯⨯, ∴没有99%的把握认为,了解阿基米德与选择文理科有关.(2)(i )抽取的文科生人数是30103100⨯=(人),理科生人数是70107100⨯=(人). (ii )X 的可能取值为0,1,2,3,则0337310C C 7(0)C 24P X ===⋅, 1237310C C 21(1)C 40P X ===⋅, 17213307(2)40C C P X C ⋅===, 3037310C C 1(3)C 120P X ===⋅. 其分布列为所以72171369()01232440401204010E X =⨯+⨯+⨯+⨯==.31。

独立性检验的基本思想及初步应用教案

独立性检验的基本思想及初步应用教案

独立性检验的基本思想及初步应用一、教学目标1. 让学生理解独立性检验的基本思想,掌握独立性检验的步骤和应用。

2. 培养学生运用独立性检验解决实际问题的能力,提高学生的数据分析素养。

3. 引导学生运用数学软件或计算器进行独立性检验,培养学生的操作能力。

二、教学内容1. 独立性检验的基本思想(1)理解独立性检验的定义和作用。

(2)掌握独立性检验的基本步骤:提出假设、构造检验统计量、确定显著性水平、计算临界值、做出结论。

2. 独立性检验的初步应用(1)学会运用独立性检验解决实际问题,如判断两个分类变量是否独立。

(2)学会运用数学软件或计算器进行独立性检验,提高数据分析能力。

三、教学重点与难点1. 教学重点:(1)独立性检验的基本思想及步骤。

(2)独立性检验在实际问题中的应用。

(3)运用数学软件或计算器进行独立性检验。

2. 教学难点:(1)独立性检验步骤中构造检验统计量的方法。

(2)如何正确选择显著性水平。

四、教学方法与手段1. 教学方法:(1)讲授法:讲解独立性检验的基本思想和步骤。

(2)案例教学法:分析实际问题,引导学生运用独立性检验。

(3)实践操作法:让学生运用数学软件或计算器进行独立性检验。

2. 教学手段:(1)多媒体课件:展示独立性检验的基本思想和步骤。

(2)数学软件或计算器:让学生进行实际操作。

五、教学过程1. 导入新课:通过一个实际问题引入独立性检验的概念,激发学生的兴趣。

2. 讲解独立性检验的基本思想:讲解独立性检验的定义、作用和基本步骤,让学生理解独立性检验的基本思想。

3. 案例分析:分析一个实际问题,引导学生运用独立性检验,体会独立性检验在解决实际问题中的应用。

4. 实践操作:让学生运用数学软件或计算器进行独立性检验,培养学生的操作能力。

5. 总结与反思:总结本节课的主要内容,让学生巩固所学知识,并思考如何更好地运用独立性检验解决实际问题。

六、教学拓展1. 引导学生探讨独立性检验在实际应用中的局限性,如样本量对检验结果的影响。

独立性检验的基本思想及其初步应用

独立性检验的基本思想及其初步应用
独立性检验的基本思想 及其初步应用
分类变量
探究
为调查吸烟是否对患肺癌有影响,某肿瘤研究所随 机的调查了9965人,得到如下结果(单位:人)
吸烟是与患肺癌列联表
不患肺癌 不吸烟
吸烟
患肺癌 42
49
总计 7817
2148
7775
2099
总计
9874
91
9965
那么吸烟是否对患肺癌有影响?
吸烟是与患肺癌列联表
(它越小,原假设“H :吸烟与患肺癌没有关系” 成立的可能性越大;它越大,备择假设“H
0
吸烟与患肺癌有关系”成立的可能性越大.
1
第三步:查表得出结论
P(k2>k) 0.50 0.40 0.25 0.15 0.10 0.05 0.025 0.010 0.005 0.001
k
0.455
0.708
1.323
2.072
2.706
3.84
5.024
6.635
推出有利于H成立的小概率事件不 不能对A下任何 发生,接受原假设
结论,即反证法 不成功
独立性检验步骤
第一步:提出假设检验问题H :吸烟与患肺癌有关系 吸烟与患肺癌没有关系
0
第二步:选择检验的指标
1
K
2
n ( ad bc )
2
( a b )( c d )( a c )( b d )
不患肺癌 不吸烟 吸烟 a c 患肺癌 b d 总计 a+b c+d
总计
a+c
b+d
a+b+c+d
独立性检验原理(与反证法类似):
反证法 备择假设H 要证明结论A 假设检验

独立性检验的基本思想及初步应用教案

独立性检验的基本思想及初步应用教案

独立性检验的基本思想及初步应用教案教学目标:1. 了解独立性检验的基本思想及应用;2. 学会使用独立性检验进行数据分析;3. 能够解释独立性检验的结果及意义。

教学内容:一、独立性检验的基本思想1. 引入独立性检验的概念;2. 解释独立性检验的目的;3. 阐述独立性检验的基本步骤。

二、独立性检验的初步应用1. 介绍独立性检验的应用场景;2. 展示独立性检验的实际案例;3. 引导学生通过独立性检验分析数据。

三、独立性检验的计算方法1. 介绍独立性检验的计算方法;2. 解释卡方统计量的含义;3. 演示如何计算卡方统计量及p值。

四、独立性检验的结果解释1. 解释独立性检验的结果;2. 讲解如何判断假设检验的结果;3. 强调独立性检验的局限性。

五、独立性检验的实践操作1. 引导学生使用统计软件进行独立性检验;2. 分析实际数据,展示独立性检验的操作过程;教学方法:1. 采用案例教学法,结合实际数据进行分析;2. 利用统计软件进行独立性检验的演示;3. 引导学生进行小组讨论,分享学习心得。

教学评估:1. 课后作业:要求学生独立完成独立性检验的练习题;2. 课堂问答:提问学生关于独立性检验的概念及应用;3. 小组报告:评估学生在小组讨论中的表现及成果。

教学资源:1. 独立性检验的教学案例及数据;2. 统计软件及相关教学视频;3. 独立性检验的练习题及答案。

六、独立性检验的拓展应用1. 介绍独立性检验在其他领域的应用;2. 分析不同领域中独立性检验的实际案例;3. 引导学生探讨独立性检验的潜在拓展方向。

七、独立性检验的优缺点分析1. 阐述独立性检验的优点;2. 讨论独立性检验的局限性;3. 比较独立性检验与其他统计方法的差异。

八、独立性检验在实际研究中的应用案例1. 分享独立性检验在实际研究中的经典案例;2. 分析案例中独立性检验的使用方法和结果;3. 引导学生从案例中学习独立性检验的应用技巧。

九、独立性检验的敏感性分析1. 介绍独立性检验的敏感性分析概念;2. 解释敏感性分析在独立性检验中的作用;3. 演示如何进行独立性检验的敏感性分析。

独立性检验的基本思想及其初步应用》

独立性检验的基本思想及其初步应用》

独立性检验的基本思想及其初步应用》生更加直观地理解两个分类变量之间的关系。

问题2:根据三维柱形图和二维条形图,你能否看出吸烟者和不吸烟者患肺癌的比例有何不同?二、独立性检验的基本思想1、独立性检验的基本思想:独立性检验是用来检验两个分类变量是否有关系的一种统计方法。

如果两个分类变量是独立的,那么它们之间是没有关系的;如果两个分类变量不独立,则它们之间是有关系的。

2、独立性检验的步骤:1)列出列联表;2)计算期望频数;3)计算卡方值;4)查表得出显著性水平;5)判断两个分类变量是否有关系。

三、K2检验的计算公式1、K2检验的计算公式:K2=∑(Oi-Ei)²/Ei其中,Oi为观察频数,Ei为期望频数。

2、K2检验的含义:K2检验的值越大,观察频数与期望频数的差距越大,两个分类变量之间的关系就越显著。

四、独立性检验的应用举例1、应用举例:1)医学研究:调查吸烟是否对患肺癌有影响;2)社会调查:调查男女是否对某一品牌的喜好程度有影响;3)市场调查:调查年龄与消费金额是否有关系。

2、独立性检验的应用:通过独立性检验,可以判断两个分类变量是否有关系,从而为我们提供科学的依据,进行合理的决策。

教学反思:本节课通过生动的例子和图表,引入了独立性检验的基本概念和思想。

通过对K2检验公式的介绍,让学生了解了如何计算卡方值。

同时,通过应用举例,让学生了解了独立性检验的实际应用。

在教学过程中,教师注重启发学生的思维,让学生在合作探究中主动掌握知识,达到了预期的教学目标。

练1、在某医院,665名男性病人中,214人秃顶,而在772名非心脏病男性病人中,175人秃顶。

能否以99%的置信度认为“秃顶与患心脏病”有关系?思考1、为调查某地区老年人是否需要志愿者提供帮助,用简单随机抽样方法从该地区调查了500位老年人,结果如下:性别。

是否需要志愿者需要。

不需要男性。

30.170女性。

373.271)估计该地区老年人中需要志愿者提供帮助的比例;2)能否以99%的置信度认为该地区的老年人是否需要志愿者提供帮助与性别有关系?思考2、某研究小组为了研究中学生的身体发育情况,在某学校随机抽出20名15至16周岁的男生,将他们的身高和体重制成2×2列联表,根据列联表的数据,能否以95%的置信度认为该学校15至16周岁的男生的身高和体重之间有关系?课后作业:课本第18页第1题和第2题。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

独立性检验的思想方法
独立性检验实际上是检验两个分类变量是否相关,相关的程度有多大.在进行独位性检验时,应注意给定的可靠性的要求,不同的可靠性要求可能会导致得出完全不同的结论.在断言正确时很少发生的结果若发生了,就是断言不正确的证据.一般地,对分类变量的相关
关系的判断方法有:2×2列联表、二维条形图、三维柱形图和利用随机变量K 2来确定,与表
格相比,三维柱形图和二维条形图能够更直观地反映出相关数据的总体状况.并能从中清晰地看出各个频数的相对大小关系.三维柱形图和二维条形图因为所表示的关系只是一种粗略的估计,不能够精确地反应有关的两个分类变量的可信程度,因而不常用,并且在实际问题
的解决中也较为烦琐,故在判断两个分类变量的关系的可靠性时,一般利用随机变量K 2来
确定的.下面举例说明.
一.二维条形图
在二维条形图中,可以估计满足条件X=x 1的个体中具有Y= y 1的个体所占的比例b a a +,也可以估计满足条件X=x 2的个体中具有Y= y 2的个体所占的比例d c c +,两个比例的值相差越大,H 1成立的可能性就越大.
例 1.有甲、乙两个班级进行一门课程的考试,按照学生的考试成绩优秀和不优秀统计人数后,得到下面的列联表:
请画出列联表的二维条形图,并通过图形判断成绩与班级是否有关,利用列联表的独立性假设检验估计判断成绩是否优秀与所在班级是否有关.
分析:本题应首先作出调查数据的列联表,再根据列联表画出二维条形图或三维柱形图,并进行分析,最后利用独立性检验作出判断.
解:根据列联表的数据,作出二维条形图,如图.
从条形图中可以看出,甲班学生中优秀的人数的比例数为
4510,乙班学生中优秀的人数的比例为45
7,二者差别不是很大,因此我们认为成绩是否优秀与所在的班级没有关系,用独立性假设检验来判断,由题意知a =10,b=35,c=7,d=38,a+b=45,c+d=45,a+c=17,b+d=73,n=90.
代入公式
))()()(()(2
2
d c c a d b b a bc ad n K ++++-=
.
65.073174545)3573810(902
≈⨯⨯⨯⨯-⨯⨯=k
由于0.65<2.706,所以我们没有充足的理由认为成绩优秀与班级有关系.
点拨:在列联表中注意事件的对应关系及有关值的确定,避免混乱.利用图形来判断两个变量之间是否有关系,可以画出三维柱形图,也可以画出二维条形图,仅从图形上只可以作两个分类变量关系的粗略的估计,可以结合所求的数值来进行比较.
练习:
1.在调查的480名男人中有38名患有色盲,520名女人中有6名患有色盲,分别利用图形和独立性检验的方法来判断色盲与性别是否有关,你所得到的结论在什么范围内有效?
解:根据题目所给的数据作出如下的列联表:
图形法:根据列联表作出相应的二维条形图,如图
从二维条形图来看,在男人中患色盲的比例为480
38,在女人中患色盲的比例为5206.又48038>5206,其差值为|48038-520
6|≈0.068,差值较大,因而我们可认为性别与患色盲是有关的.
根据列联表中所给的数据可以有a =38,b=442,c=6,d=514,a+b =480,c+d =520,a+c =44,b+d=956,n=1000,代入公式
,))()()(()(2
2
d c d b d a c a bc ad n K ++++-= 得14.27956
44520480)442651438(10002
≈⨯⨯⨯⨯-⨯⨯=k ,由于K ≈27.14 4>10.828, 所以我们有99.9%的把握认为性别与患色盲有关系.
二. 三维柱形图
在三维柱形图中,主对角线上两个柱形高度的乘积ad 与副对角线上的两个柱形高度的乘积bc 相差越大,H 1成立的可能性就越大,
例2.为考察某种药物预防疾病的效果,进行动物试验,得到如下的列联表:
试用三维柱形图分析服用药和患病之间是否有关系.
分析:若要推断的论述为H0:X与Y有关系,可以用三维柱形图来粗略地判断两个分类变量X与Y是否有关系.
解:根据列联表所给的数据作出三维柱形图如图,
主对角线上两个柱形的高度a与d的乘积ad=10×30=300,与副对角线上两个柱形高度的乘积bc=20×45=900相差很大,因而服用药与未患病之间有关的程度很大.点拨:在三维柱形图中,应对主对角线上两个柱形的高度的乘积ad与副对角线上两个柱形高度的乘积bc作比较,两个乘积相差越大,H0成立的可能性就越大.练习:
2.研究人员选取170名青年大学生的样本,对他们进行一项心理测验,发现有60名女生对该心理测验中的最后一个题目的反应是:作肯定回答的有22名,否定回答的有38名;男生110名在相同的题目上作肯定回答的有22名,否定回答的有88名.问:性别与态度之间是否存在某种关系?分别用图形和独立性检验的方法判断.
解:根据题目所给数据建立如下列联表:
性别与态度的关系列联表
相应的三维柱形图如图,比较来说,底面副对角线上两个柱体高度的乘积要大一些,因此可以在某种程度上认为“性别与态度有关”.
根据列联表中的数据得到
.024.5622.5126
4460110)88223822(1702
>≈⨯⨯⨯⨯-⨯⨯=k 所以有97.5%的把握认为性别与态度有关.
三. 利用随机变量K 2来确定
解独立性检验问题的基本步骤是:①找出相关数据,作列联表;②求统计量K 2的观测
值;③判断可能性,注意与临界值作比较,得出事件有关的可能性大小.
例 3.运动员参加比赛前往往做热身运动,下表是一体育运动的研究机构通过考察160位专业运动员运动前是否做热身运动而得到的数据,试问:由此数据,你认为运动员受伤与不做热身运动有关吗?
解:由))()()(()(2
2
d b d c b a c a bc ad n K ++++-= .94.3896
646595)45762019(1602
≈⨯⨯⨯⨯-⨯⨯=k 因为38.974>10.828,所以有99.9%的把握认为运动员受伤与不做热身运动有关. 点拨:独立性检验是用来考查两个分类变量是否具有相关关系,并且能较精确地给出这
种判断的可靠程度的一种统计方法.利用这一方法,可以直接用K 2的观测值解决实际问题.这
里需特别说明的是:K 2与k 的关系并不是k=2K ,K 2
是一个随机变量,它在a,b,c,d 取不同的值时,K 2可能不同;而k 是K 2
的观测值,是取定一组数a 、b 、c 、d 后的一个确定的值.
练习:
3.某些行为在运动员的比赛之中往往被赋予很强的神秘色彩,如有一种说法认为,在进入某乒乓球场比赛时先迈入左脚的运动员就会赢得比赛的胜利.某记者为此追踪了某著名乒乓球运动员在该球场中的308场比赛.获得数据如下表:
据此资料,你能得出什么结论? 解:由))()()(()(2
2
d c d b b a c a bc ad n K ++++-= , 得.502.146
262103205)278419178(3082
≈⨯⨯⨯⨯-⨯⨯=k 因为1.502<2.706,所以我们认为先迈进哪只脚跟比赛的胜负是无关的.
在实际问题中,独立性检验的结论也仅仅是一种数学关系,得到的结论也可能错误,这是数学中的统计思维与确定性思维差异的反映,但我们可以利用统计分析的结果去预测实际问题的结果.。

相关文档
最新文档