苏教版数学高二- 选修1-2素材 1.1独立性检验是如何判断两个事件是否相互独立的
苏教版选修1-2高中数学1.1《独立性检验》
甲厂 乙厂 合计 优质品 非优质品 合计
2 n ad - bc 附:χ2= , a+bb+ca+cb+d
P(χ2≥x0) x0
0.05
0.01
3.841 6.635
课前探究学习
课堂讲练互动
解 (1)甲厂抽查的产品中有 360 件优质品,从而甲厂生产的零件 360 的优质品率估计为500=72%; 乙厂抽查的产品中有 320 件优质品,从而乙厂生产的零件的优质 320 品率估计为500=64%. (2) 甲厂 乙厂 合计 优质品 360 320 680
课前探究学习 课堂讲练互动
【题后反思】 统计的基本思维模式是归纳,通过部分数据的性质 来推测全部数据的性质,从数据上体现的只是统计关系,而不是 因果关系.
课前探究学习
课堂讲练互动
【训练3】 某企业有两个分厂生产某种零件,按规定内径尺寸(单 位: mm) 的值落在 [29.94,30.06) 的零件为优质品.从两个分 厂生产的零件中各抽出了 500 件,量其内径尺寸,得结果如
(4)若χ2≤2.706,则认为没有充分的证据显示“Ⅰ与Ⅱ有关系”,
但也不能作出结论“H0成立”,即不能认为Ⅰ与Ⅱ没有关 系.
课前探究学习
课堂讲练互动
题型一 利用χ2判定两个变量间的关系 【例1】 某电视台联合相关报社对“男女同龄退休”这一公众关
注的问题进行了民意调查,数据如下表所示:
赞同 男 女 合计 198 476 674
可能性为1%.
课前探究学习 课堂讲练互动
名师点睛 1.独立性检验
2 n ad - bc (1)利用随机变量 χ2= ,(其中 n=a+b a+bc+da+cb+d
+c+d 为样本容量),来确定在多大程度上可以认为“两个分 类变量有关系”的方法称为两个分类变量的独立性检验.
2021年苏教版高中数学选修1-2全册同步练习及单元检测含答案
2021年苏教版高中数学选修1-2全册同步练习及单元检测含答案苏教版高中数学选修1~2 全册同步练习及检测苏版高中数学课时作业及单元检测题全册合编含答案第1章统计案例§1.1 独立性检验课时目标1.了解独立性检验的基本思想.2.体会由实际问题建模的过程,了解独立性检验的基本方法.1.独立性检验:用______________研究两个对象是否有关的方法称为独立性检验. 2.对于两个研究对象Ⅰ和Ⅱ,Ⅰ有两类取值,即类A和类B,Ⅱ也有两类取值,即类1和类2.我们得到如下列联表所示的抽样数据:Ⅱ 类A 类B 合计类1 a c a+c 类2 b d b+d 合计 a+b c+d a+b+c+d Ⅰ则χ2的计算公式是________________. 3.独立性检验的一般步骤:(1)提出假设H0:两个研究对象没有关系;(2)根据2×2列联表计算χ2的值;(3)查对临界值,作出判断.一、填空题1.下面是一个2×2列联表:x1 x2 总计 y1 a 8 b y2 21 25 46 总计 73 33 则表中a、b处的值分别为________,________. 2.为了检验两个事件A,B是否相关,经过计算得χ2=8.283,则说明事件A和事件B________(填“相关”或“无关”).3.为了考察高一年级学生的性别与是否喜欢数学课程之间的关系,在高一年级随机抽1苏版高中数学课时作业及单元检测题全册合编含答案取了300名,得到如下2×2列联表.判断学生性别与是否喜欢数学________(填“有”或“无”)关系.男女合计喜欢 37 35 72 不喜欢 85 143 228 合计 122 178 300 4.为了评价某个电视栏目的改革效果,在改革前后分别从居民点抽取了100位居民进行调查,经过计算χ2=99.9,根据这一数据分析,下列说法正确的是________(只填序号).①有99.9%的人认为该栏目优秀;②有99.9%的人认为栏目是否优秀与改革有关系;③有99.9%的把握认为电视栏目是否优秀与改革有关系;④以上说法都不对.5.某班班主任对全班50名学生学习积极性和对待班级工作的态度进行了调查,统计数据如下表所示.从表中数据分析,学生学习积极性与对待班级工作的态度之间有关系的把握有________.学习积极性高学习积极性一般合计 6.给出下列实际问题:①一种药物对某种病的治愈率;②两种药物治疗同一种病是否有区别;③吸烟者得肺病的概率;④吸烟人群是否与性别有关系;⑤网吧与青少年的犯罪是否有关系.其中用独立性检验可以解决的问题有______.7.下列说法正确的是________.(填序号)①对事件A与B的检验无关,即两个事件互不影响;②事件A与B关系越密切,χ2就越大;③χ2的大小是判断事件A与B是否相关的唯一数据;④若判定两事件A与B有关,则A发生B一定发生.8.某市政府在调查市民收入增减与旅游愿望的关系时,采用独立性检验法抽查了3 000人,计算发现χ2=6.023,根据这一数据查表,市政府断言市民收入增减与旅游愿望有关系,这一断言犯错误的概率不超过____________________________________________________.二、解答题2积极参加班级工作 18 6 24 不太主动参加班级工作 7 19 26 合计 25 25 50 苏版高中数学课时作业及单元检测题全册合编含答案9.在对人们休闲的一次调查中,共调查了124人,其中女性70人,男性54人.女性中有43人主要的休闲方式是看电视,另外27人主要的休闲方式是运动;男性中有21人主要的休闲方式是看电视,另外33人主要的休闲方式是运动.(1)根据以上数据建立一个2×2的列联表; (2)检验性别与休闲方式是否有关系.10.有甲、乙两个工厂生产同一种产品,产品分为一等品和二等品.为了考察这两个工厂的产品质量的水平是否一致,从甲、乙两个工厂中分别随机地抽出产品109件,191件,其中甲工厂一等品58件,二等品51件,乙工厂一等品70件,二等品121件.(1)根据以上数据,建立2×2列联表;(2)试分析甲、乙两个工厂的产品质量有无显著差别(可靠性不低于99%)能力提升11.在吸烟与患肺病是否相关的判断中,有下面的说法:3苏版高中数学课时作业及单元检测题全册合编含答案①若χ2的观测值k>6.635,则在犯错误的概率不超过0.01的前提下,认为吸烟与患肺病有关系,那么在100个吸烟的人中必有99人患有肺病;②从独立性检验可知在犯错误的概率不超过0.01的前提下,认为吸烟与患肺病有关系,若某人吸烟,则他有99%的可能患有肺病;③从独立性检验可知在犯错误的概率不超过0.05的前提下,认为吸烟与患肺病有关系时,是指有5%的可能性使得推断错误.其中说法正确的是________.12.下表是对某市8所中学学生是否吸烟进行调查所得的结果:父母中至少有一人吸烟父母均不吸烟吸烟学生 816 188 不吸烟学生 3 203 1 168 (1)在父母至少有一人吸烟的学生中,估计吸烟学生所占的百分比是多少? (2)在父母均不吸烟的学生中,估计吸烟学生所占的百分比是多少? (3)学生的吸烟习惯和父母是否吸烟有关吗?请简要说明理由. (4)有多大的把握认为学生的吸烟习惯和父母是否吸烟有关?1.对独立性检验思想的理解独立性检验的基本思想类似于数学中的反证法,要确认两个变量有关系这一结论成立的可信程度,首先假设该结论不成立,即假设“两个变量没有关系”成立,在该假设下我们构造的随机变量χ2应该很小,如果由观测数据计算得到的χ2的观测值很大,则在一定程度上4感谢您的阅读,祝您生活愉快。
苏教版选修1-2高中数学1.1《独立性检验》ppt课件
【训练2】 某大型企业人力资源部为了研究企业员工工 作积极性和对待企业改革态度的关系,随机抽取了 189名员工进行调查,所得数据如下表所示:
积极支持 不太赞成 企业改革 企业改革
合计
工作 积极
54
40
94
工作 一般
32
63
95
对于人合力计 资源部86 的研究项10目3 ,根据上1述89数据能得出 什么结论?
解 提出假设 H0:工作积极性与是否积极支持企业改革无关. χ2=1899×4×549×5×638-6×401×03322≈10.759. 当 H0 成立时,χ2>6.635 的概率约为 0.010, 因为 10.759>6.635,所以有 99%的把握说:抽样员工对待企业改 革的态度与工作积极性是有关的,可以认为企业的全体员工对待 企业改革的态度与其工作积极性是有关的.
44
合计 480 520 1 000
依据公式得
χ2=1
000×442×6-38×5142 480×520×956×44
≈27.139.
当 H0 成立时,χ2≥10.828 的概率约为 0.001, 因为 χ2≈27.139>10.828,
所以我们有 99.9%的把握认为色盲与性别是有关的.
题型二 独立性检验的基本思想
如P(χ2≥6.635)≈0.01,由实际计算得χ2>6.635说明假设不 合理的程度约为99%,即两个分类变量有关系这一结论 成立的可信程度为99%.
2.利用χ2的值判定两个研究对象Ⅰ和Ⅱ之间的关系
(1)若χ2>10.828,则有99.9%的把握认为“Ⅰ与Ⅱ有 关系”;
(2)若χ2>6.635,则有99%的把握认为“Ⅰ与Ⅱ有关 系”;
1.1独立性检验 苏教版数学选修PPT优选课件
2020/10/18
复习回顾
1.用χ2统计量来研究两个分类变量之间的相关关系的 方法称为——独—立—性——检—验——.
2.在2×2列联表中,计算卡方χ2统计量的公式是——.
3.一般地,对于两个研究对象Ⅰ和Ⅱ,Ⅰ和Ⅱ分别有两类 取值,要推断“Ⅰ和Ⅱ有关系”可按下面的步骤进行: ①提出假设H0:—————————; ②根据2×2列联表与χ2公式计算χ2的值; ③查对————,作出判断.
口服 注射 合计
有效 58 64 122
无效 40 31 71
合计 98 95 193
2020/10/18
7
例题选讲 例2.气管炎是一种常见的呼吸道疾病,医药研究人员对
两种中草药治疗慢性气管炎的疗效进行对比,所得数 据如图所示,问:它们的疗效有无差异.
复方江剪刀草 胆黄片 合计
有效 184 91 275
2020/10/18
2
复习回顾
4.①若观测值χ2—≥—10.828,则有99,9%的把握认为 “Ⅰ
和Ⅱ有关系”; ≥
②若观测值χ2——6.635,则有99%的把握认为“Ⅰ
和
≤
Ⅱ有关系”;
③若观测值χ2——2.706,则认为没有充分的证据显 示“Ⅰ和Ⅱ有关系”,但也不能作出“Ⅰ和Ⅱ没
有关系”.
2020/10/18
2020/10/18
10
练习二
3.调查者询问72名男女大学生在购买食品时是否看 营养说明,得到如表所示的数据,从表中的数据分析 大学生的性别与看不看营养说明之间有没有关系?
男大学生 女大学生
合计
看营养说明 不看营养说明
28
8
16
20
44
28
苏教版数学高二数学苏教版选修1-21.1独立性检验
互动课堂疏导引导1.独立性检验的基本思想独立性检验的基本思想类似于数学上的反证法.要确认“两个分类变量有关系”这一结论成立的可信程度,首先假设该结论不成立,即假设结论“两个分类变量没有关系”成立,在该假设下构造的随机变量χ2应该很小,如果由观测数据求得的x 2的值很大,则在一定程度上说明假设不合理.然后根据随机变量x 2的含义,通过查阅P-值的估计表来评价假设不合理的程度,即“两个分类变量有关系”成立的可信程度.2.检验两个分类变量是否相关的方法主要是三维柱形图法和二维条形图法及独立性检验法. 基本步骤为:(1)找相关数据,作列联表; (2)画三维柱形图; (3)求χ2=))()()(()(2d b c a d c b a bc ad n ++++-的值;(4)判断可能性.3.独立性检验的应用独立性检验实际上是检验两个分类变量是否相关,相关的程度有多大.其应用过程如下:由公式χ2=))()()(()(2d b c a d c b a bc ad n ++++-(n=a+b+c+d),根据观测数据计算出χ2的值,其值越大,说明“x 与y 有关系”成立的可能性越大;在假设x 与y 没有关系的前提下,可以通过查阅书中表格得到P -值的估计,从而得到两变量相关的程度.案例 某聋哑研究机构,对聋哑关系进行抽样调查,在耳聋的657人中有416人哑,而另外不聋的680人中有249人哑.你能运用这组数据,得出相应结论吗?认真分析后,我们就是要在聋与哑有无关系上作出结论.于是运用独立性检验进行判断.根据列联表中数据得到:χ2=680657672665)241249-431337(416 12⨯⨯⨯⨯⨯≈95.29>10.828,所以我们有99.9%的把握说聋哑有关系.另外,本问题也可以三维柱形图粗略估计,相应三维柱图形如图比较来说,底面副对角线两个柱体高度的乘积大些,可以在某种程度上认为聋与哑有关. 规律总结一般地,假设有两个分类变量X 和Y ,它们的值域分别为{x 1,x 2}和{y 1,y 2},其样品 y 1 y 2 总 计 x 1 a b a+b x 1cdc+d总 计a+c b+d a+b+c+d若要推断的论述为:H 1:“X 与Y 有关系” 可以按如下步骤判断结论H 1成立的可能性.(1)通过三维柱形图和二维条形图,可以粗略判断两个分类变量是否有关系,但是这种判断无法精确地给出所得结论的可靠程度.①在三维柱形图中,主对角线上两个柱形高度的乘积ad 与副对角线上的两个柱形高度的乘积bc 相差越大,H 1成立可能性越大.②在二维条形图中,可以估计满足条件X=x 1的个体中具有Y=y 1的个体所占的比例ba a +,也可以估计满足条件X=x 2的个体中具有Y=y 1的个体所占比例为dc c +,两个比例相差越大,H 1成立的可能性越大.(2)可以利用独立性检验来考察两个变量是否有关系,并且能较精确地给出这种判断的可靠性程度. 活学巧用例1在一项有关医疗保健的社会调查中,发现调查的男性为530人,女性为670人,其中男性中喜欢吃甜食的为117人,女性中喜欢吃甜食的为492人,请作出性别与喜欢吃甜食的列联表.分析:分为不同的类别,分别找出相关数据后,再列表. 喜欢甜食 不喜欢甜食总 计 男 117 413 530 女 492178670总 计609 591 1 200点评:分清类别是列联表的作表关键步骤.例2 某地震观测站对地下水位的变化和发生地震的情况共进行了n=1 700次观测,列联表如下:问观测结果是否说明地下水位的变化与地震的发生相关? 分析:可通过三维柱形图及假设检验得到. 解:画三维柱形图如图,比较来说,主、副对角线上柱体高度的乘积差别不大,因而不能判断地震与水位变化相关.根据列联表中的数据得到χ2=700000 1520 1180902)82-618(98700 12⨯⨯⨯⨯⨯⨯=1.59<2.706,∴没有充分的证据显示地下水位的变化与地震的发生相关.点评:判断两个分类变量是否相关,只需画图或利用假设检验即可得到结果. 例3 某种药物研制成功后,要测定药物是否有效,这就需要独立检验知识,如: 为考察某种药物预防疾病的效果,进行动物实验,得如下列联表:患 病 未患病 总 计 服药 20 32 52 未服药 24 25 49 总 计4457101试问该药物有效吗? 解:由列联表可得:χ2=4952574432)24-25(201012⨯⨯⨯⨯⨯⨯≈1.135>0.708所以我们有60%的把握说该药物有效,根据实际情况,该药物效果是非常差的.例 4 为调查饮酒是否对患胃癌有影响,某科研机构随机地抽查了10 138人,得到如下结果.(单位:人)不患胃癌 患胃癌 总 计 不饮酒6 5001056 605那么饮酒是否对患胃癌有影响? 解:根据列联表中数据,得到χ2=6056533 3183955 9105)455 3-78500 (6138 102⨯⨯⨯⨯⨯⨯≈4.960 5>3.841,所以有95%的把握认为“饮酒与患胃癌”有关.。
2019-2020学年苏教版选修1-2 独立性检验 课件(16张)
数据整理
吸烟 不吸烟
合计
患病
37 21 58
未患病
183 274 457合计 Nhomakorabea220 295 515
问题:判断的标准是什么?
吸烟与不吸烟,患病的可能性的大小是否有差异?
频率估计概率
患 病 未患病 合 计(n)
吸烟 不吸烟
16.82% 7.12%
83.18% 100%(220) 92.88% 100%(295)
d
c+d
总计
a+c
b+d
a+b+c+d
要推断“Ⅰ和Ⅱ有关系”,可按下面的步骤进行:
(1)提出假设H0 :Ⅰ和Ⅱ没有关系; (2)根据2× 2列联表与公式计算 K2 的值;
(3)查对临界值,作出判断。
由于抽样的随机性,由样本得到的推断 有可能正确,也有可能错误。利用 K2进行独 立性检验,可以对推断的正确性的概率作出 估计,样本量n越大,估计越准确。
教学目标
• 1理解独立性检验的基本思想 • 2、会从列联表、柱形图、条形图直观判断吸
烟与患肺癌有关。
• 3、了解随机变量K2的含义。 • 理解独立性检验的基本思想及实施步骤。 • 教学重点:理解独立性检验的基本思想。独
立性检验的步骤。
• 教学难点;1、理解独立性检验的基本思想; 2、了解随机变量K²的含义;独立性检验的步 骤。
看到这个课题,你能想到什么?
案 例:某医疗机构为了了解呼吸道疾病与吸 烟是否有关,进行了一次抽样调查,共调查了 515个成年人,其中吸烟者220人,不吸烟者 295人。
调查结果:吸烟的220人中有37人患呼吸道疾 病,183人未患呼吸道疾病;不吸烟的295人中 有21人患病,274人未患病。
高中数学 1.1.1《独立性检验一》教学案 苏教版选修1-2
独立性检验(一)
教学目标:
1, 了解独立性检验的含义,理解22⨯列联表。
2, 会用统计量判断两系。
3, 通过典型案例,掌握独立性检验的基本思想。
课前预习
1用样本估计总体时,由于抽样的随机性,由样本得到的推断不一定正确。
利用2
x 进行独立性检验,可以对推断的正确性的概率作出估计,样本量n 越大,这个估计越 . 2.一般地,对于两个研究对象I 和Ⅱ,Ⅰ有两类取值类A 和类B ,Ⅱ也有两类取值类1和类2,可列联表如下:
则2
χ= 其中n= 为 样本量。
3.2
χ 临界值表
例1. 在500人身上试验某种,把他们一年中的感冒记录与另外500名未用血清的人的感冒记录作比较,结果如表1—1—5所示。
问:该种血清能否起到预防感冒的作用?
表1—1—5
例2.考查人的高血压是否与食盐摄入量有关,对某地区人群进行跟踪调查,得到以下数据:
1.某桑场为了了解职工发生工作人员进行了一次调查,结果如下表。
试问:发生皮炎是否与
采桑有关?
2.为了鉴定新疫苗的效力,将60只豚鼠随机地分成两组,在其中一组接种疫苗后,两组都注射了病源菌,结果列于下表。
问:能否有90%的把握认为疫苗有效?
3某医疗研究机构为了了解关系,进行了一次抽样调查,得到如下数据。
问:打鼾与患心脏病是否有关?。
苏教版数学高二-数学苏教版选修1-2素材 1.1 独立性检验
课堂导学三点剖析各个击破一、作列联表【例1】在一项有关医疗保健的社会调查中,发现调查的男性为530人,女性为670人,其中男性中喜欢吃甜食的为117人,女性中喜欢吃甜食的为492人,请作出性别与喜欢吃甜食的列联表.思路分析:分为不同的类别,分别找出相关数据后,再列表.温馨提示分清类别是列联表的作表关键步骤.表中排成两行两列的数据是调查得来的结果,希望根据这4个数据来检验上述两种状态是否有关.这一检验问题就称为2×2列联表的独立性检验.类题演练 1研究人员选取170名青年男女大学生的样本,对他们进行一种心理测验.发现有60名女生对该心理测验中的最后一个题目的反应是:作肯定的18名,否定的42名;男生110名在相同的项目上作肯定的有22名,否定的有88名.试作出性别与态度的列联表.变式提升1某小学,对232名小学生调查发现在180名男生中有98名有多动症,另外82名没有多动症,52名女生中有2名有多动症,另外50名没有多动症,试作出性别与多动症的列联表.二、判断给出的两个变量是否相关【例2】在某医院,因为患心脏病而住院的665名男性病人中,有214人秃顶;而另外772名不是因为患心脏病而住院的男性病人中有175人秃顶,利用独立性检验方法判断秃顶与患心脏病是否有关系?所得的结论在什么范围内有效?思路分析:把所给数据列出列联表,被调查的人有两种状态:秃顶,不秃顶.每个状态又有两种情况.患心脏病,患其他病,这是一个2×2列联表的独立性检验的问题,因而只需求出x2,用它的大小可以确定是否拒绝原来的假设从而得出的两个量之间的关系.秃顶 214 175 389 不秃顶 4515971 048总计665 772 1 437假设秃顶与患心脏病无关.由于a =214,b =175,c =451,d =597,a +b =389,c +d =1 048,a +c =665,b +d =772,n=1 437. 因为x 2=77266510483894511755972141437d)d)(b c)(c b)(a (a bc)-n(ad 22⨯⨯⨯⨯⨯⨯=++++)-(≈16.373>10.828,因而我们有99.9%的把握认为秃顶与患心脏病有关系.类题演练 2打鼾不仅影响别人休息,而且可能与患某种疾病有关.下表是一次调查所得的数据列联患心脏病 未患心脏病合计 每一晚都打鼾 30 224 254 不打鼾 2413551379 合计54 15791633(1)画出等高条形图,由图可得到什么结论; (2)把(1)问得出结论的把握度进行定量分析. 解:(1)每一晚都打鼾患心脏病的百分比为25430×100%≈12%. 不打鼾患心脏病的百分比为135524×100%≈2%. 等高条形图如下图所示.其中不涂色表示未患心脏病的百分比;阴影表示患心脏病的百分比.由图可知,每一晚都打鼾与患心脏病有关.(2)根据列联表中数据,可得到随机变量x 2的观测值 x 2=15795425413792422413553016332⨯⨯⨯⨯-⨯⨯)(=68.033.因为68.033>6.635,所以有99%的把握说,每一晚都打鼾与患心脏病有关. 三、独立性检验【例3】在一次恶劣气候的飞行航程中调查男女乘客在机上晕机的情况如下表所示,根晕机 不晕机 合计 男人243155解:这是一个2×2列联表的独立性检验问题,根据列联表中的数据,得到x 2=573234558312624892⨯⨯⨯⨯-⨯⨯)(=3.689.因为3.689<3.841,所以我们没有理由说晕机与否跟男女性别有关,尽管这次航班中男人晕机的比例(5524)比女人晕机的比例(348)高,但我们不能认为在恶劣气候飞行中男人比女人更容易晕机.类题演练 3由表中数据计算得x 2≈4.715,性别与色盲之间是否有关系?为什么?解:因为在假设“性别与色盲症没关系”的前提下,事件A ={x 2≥3.841}的概率为 P (x 2≥3.841)≈0.05.而由样本计算得到x 2≈4.751,即有利于“性别与色盲有关系”的小概率事件发生,由独立性检验基本原理,有大约95%的把握认为“性别与色盲有关系”.。
苏教版高中数学选修1-2《独立性检验》教案2
1.1 独立性检验(共计5课时)一、教学内容与教学对象分析通过典型案例,学习下列一些常用的统计方法,并能初步应用这些方法解决一些实际问题。
通过对典型案例(如“患肺癌与吸烟有关吗”等)的探究。
了解独立性检验(只要求2×2列联表)的基本思想、方法及初步应用。
二. 学习目标1、知识与技能通过本节知识的学习,了解独立性检验的基本思想和初步应用,能对两个分类变量是否有关做出明确的判断。
明确对两个分类变量的独立性检验的基本思想具体步骤,会对具体问题作出独立性检验。
2、过程与方法在本节知识的学习中,应使学生从具体问题中认识进行独立性检验的作用及必要性,树立学好本节知识的信心,在此基础上学习三维柱形图和二维柱形图,并认识它们的基本作用和存在的不足,从而为学习下面作好铺垫,进而介绍K的平方的计算公式和K的平方的观测值R的求法,以及它们的实际意义。
从中得出判断“X与Y有关系”的一般步骤及利用独立性检验来考察两个分类变量是否有关系,并能较准确地给出这种判断的可靠程度的具体做法和可信程度的大小。
最后介绍了独立性检验思想的综合运用。
3、情感、态度与价值观通过本节知识的学习,首先让学生了解对两个分类博变量进行独立性检验的必要性和作用,并引导学生注意比较与观测值之间的联系与区别,从而引导学生去探索新知识,培养学生全面的观点和辨证地分析问题,不为假想所迷惑,寻求问题的内在联系,培养学生学习数学、应用数学的良好的数学品质。
加强与现实生活相联系,从对实际问题的分析中学会利用图形分析、解决问题及用具体的数量来衡量两个变量之间的联系,学习用图形、数据来正确描述两个变量的关系。
明确数学在现实生活中的重要作用和实际价值。
教学中,应多给学生提供自主学习、独立探究、合作交流的机会。
养成严谨的学习态度及实事求是的分析问题、解决问题的科学世界观,并会用所学到的知识来解决实际问题。
三.教学重点、难点教学重点:理解独立性检验的基本思想;独立性检验的步骤。
苏教版数学高二-选修1-2教案 1.1独立性检验的基本思想及其初步应用
1.1独立性检验的基本思想及其初步应用●三维目标1.知识与技能了解独立性检验的基本思想、方法及初步应用.会从列联表(只要求2×2列联表)、柱形图、条形图直观分析两个分类变量是否有关.会用K2公式判断两个分类变量在某种可信程度上的相关性.2.过程与方法运用数形结合的方法,借助对典型案例的探究,来了解独立性检验的基本思想,总结独立性检验的基本步骤.3.情感、态度与价值观(1)通过本节课的学习,让学生感受数学与现实生活的联系,休会独立性检验的基本思想在解决日常生活问题中的作用.(2)培养学生运用所学知识,依据独立性检验的思想作出合理推断的实事求是的好习惯.●重点难点重点:理解独立性检验的基本思想及实施步骤.难点:了解独立性检验的基本思想、了解随机变量K2的含义.分别利用2×2列联表、等高条形图、K2公式分析两变量之间的关系,探究解题方法和规律,充分理解观测值k的意义,能熟练正确地对问题作出判断,达到化难为易的目的.●教学建议通过对典型案例“吸烟是否对患肺癌有影响?”的提出,联系生活,引起共鸣,激发学生的学习兴趣.从生活的实例出发,让学生充分体会数学与实际生活的联系,从而使得本节知识的形成更自然、更生动.要注重学生的主体参与,努力创设教师引导下的学生自主探究、合作交流的学习方式.建议在教学过程中,教师点拨、学生探讨,共同完成例题的解答.要注重数学的思想性,采用反证法做类比,帮助学生理解独立性检验的思想,通过课堂练习,检验学生能否熟练掌握用独立性检验思想解决实际问题的方法.●教学流程通过典型案例“吸烟是否与患肺癌有关系”的研究,介绍了独立性检验的基本思想、方法和初步应用.创设问题情境引出列联表、等高条形图和K2公式等基础知识.利用填一填的形式,使学生自主学习本节基础知识,并反馈了解,对理解有困难的概念加以讲解.引导学生在学习基础知识的基础上分析解决例题1的问题,并总结规律方法,完成变式训练.引导学生分析例题2,根据图中的数据计算出各类变量对应的频率,作出等宽且高度均为1的条形图.并通过图形作出判断,完成变式训练.完成当堂双基达标,巩固所学知识及应用方法,并进行反馈矫正.归纳整理,进行课堂小结,整体认识本节所学知识,强调重点内容和规律方法.要求学生借鉴例题3的解法完成变式训练.给出易错辨析题目及错解,让学生讨论错因,并给出正确解答.引导学生探究例题3的解法,(1)直接由表中数据代入公式,作出判断.(2)列出列联表,由公式计算观测值,作出判断.解后让学生总结规律方法.课标解读1.了解独立性检验的基本思想、方法及其简单应用.(重点)2.通过收集数据,并依据独立性检验的原理作出合理推断,培养学生良好的思维习惯.(难点)分类变量与列联表吸烟变量有几种类别?国籍变量呢?【提示】吸烟变量有吸烟与不吸烟两种类别,而国籍变量则有多种类别,如中国、美国、法国…….1.分类变量变量的不同“值”表示个体所属的不同类别,像这样的变量称为分类变量.2.列联表(1)定义:列出的两个分类变量的频数表,称为列联表.(2)2×2列联表:一般地,假设有两个分类变量X和Y,它们的取值分别为{x1,x2}和{y1,y2},其样本频数列联表(称为2×2列联表)为:2×2列联表y1y2总计x1 a b a+bx 2 c d c +d 总计a +cb +da +b +c +d等高条形图【问题导思】表格和图形哪一个更能直观地反映出两个分类变量间是否相互影响? 【提示】 图形.(1)定义:将列联表中的数据用高度相同的两个条形图表示出来,其中两列的数据分别对应不同的颜色,这就是等高条形图.(2)特征:等高条形图与表格相比,更能直观地反映出两个分类变量间是否相互影响,常用等高条形图展示列联表数据的频率特征.(3)用法:观察等高条形图发现a a +b 和cc +d 相差很大,就判断两个分类变量之间有关系.独立性检验(1)定义:利用随机变量K 2来判断“两个分类变量有关系”的方法称为独立性检验. (2)公式:K 2=n ad -bc 2a +bc +d a +cb +d,其中n =a +b +c +d 为样本容量.用2×2列联表分析两变量间的关系在对人们饮食习惯的一次调查中,共调查了124人,其中六十岁以上的70人,六十岁以下的54人.六十岁以上的人中有43人的饮食以蔬菜为主,另外27人则以肉类为主;六十岁以下的人中有21人饮食以蔬菜为主,另外33人则以肉类为主.请根据以上数据作出饮食习惯与年龄的列联表,并利用a a +b 与cc +d判断二者是否有关系.【思路探究】 对变量进行分类→求出分类变量的不同取值→作出2×2列联表→计算a a +b 与c c +d的值作出判断 【自主解答】 2×2列联表如下:年龄在六年龄在六总计十岁以上十岁以下 饮食以蔬菜为主 43 21 64 饮食以肉类为主 27 33 60 总计7054124将表中数据代入公式得 a a +b =4364=0.671 875. c c +d =2760=0.45. 显然二者数据具有较为明显的差距,据此可以在某种程度上认为饮食习惯与年龄有关系.1.作2×2列联表时,注意应该是4行4列,计算时要准确无误. 2.作2×2列联表时,关键是对涉及的变量分清类别.题中条件不变,尝试用|ad -bc|的大小判断饮食习惯与年龄是否有关. 【解】 将本例2×2列联表中的数据代入可得 |ad -bc|=|43×33-21×27|=852.相差较大,可在某种程度上认为饮食习惯与年龄有关系.用等高条形图分析两变量间的关系某学校对高三学生作了一项调查,发现:在平时的模拟考试中,性格内向的学生426人中有332人在考前心情紧张,性格外向的学生594人中有213人在考前心情紧张.作出等高条形图,利用图形判断考前心情紧张与性格类别是否有关系.【思路探究】 作出2×2列联表―→根据列联表数据 作等高条形图―→对比乘积的差距判断两 个分类变量是否有关【自主解答】 作列联表如下:性格内向 性格外向 总计 考前心情紧张 332 213 545 考前心情不紧张 94 381 475 总计4265941 020图中阴影部分表示考前心情紧张与考前心情不紧张中性格内向的比例.从图中可以看出,考前紧张的样本中性格内向占的比例比考前心情不紧张样本中性格内向占的比例高,可以认为考前紧张与性格类型有关.1.利用列联表中数据计算出各类变量取值对应频率,作出等宽度且高度均为1的等高条形图.2.利用数形结合的思想,借助等高条形图来判断两个分类变量是否相关是判断变量相关的常见方法之一.一般地,在等高条形图中,a a +b 与c c +d 相差越大,两个分类变量有关系的可能性就越大.作等高条形图时可以用列联表来寻找相关数据,作图要精确,且易于观察,使对结论的判断不出现偏差.某生产线上,质量监督员甲在生产现场时,990件产品中有合格品982件,次品8件;不在生产现场时,510件产品中有合格品493件,次品17件.试利用图形判断监督员甲在不在生产现场对产品质量好坏有无影响.【解】 根据题目所给数据得如下2×2列联表:合格品数 次品数 总计 甲在生产现场 982 8 990 甲不在生产现场 493 17 510 总计1 475251 500图中两个深色条的高分别表示甲在生产现场和甲不在生产现场样本中次品数的频率.从图中可以看出,甲不在生产现场样本中次品数的频率明显高于甲在生产现场样本中次品数的频率.因此可以认为质量监督员甲在不在生产现场与产品质量好坏有关系.独立性检验下表是某地区的一种传染病与饮用水的调查表:得病 不得病 总计 干净水 52 466 518 不干净水 94 218 312 总计146684830(1)这种传染病是否与饮用水的卫生程度有关,请说明理由;(2)若饮用干净水得病的有5人,不得病的有50人,饮用不干净水得病的有9人,不得病的有22人.按此样本数据分析这种疾病是否与饮用水有关,并比较两种样本在反映总体时的差异.【思路探究】 求出k 2的值―→与临界值作比较―→作出判断.【自主解答】 (1)假设H 0:传染病与饮用水无关.把表中数据代入公式得: K 2的观测值k =830×52×218-466×942146×684×518×312≈54.21.在H 0成立的情况下,P(K 2>10.828)≈0.001,是小概率事件, 所以拒绝H 0.因此我们有99.9%的把握认为该地区这种传染病与饮用不干净水有关. (2)依题意得2×2列联表:得病 不得病 总计 干净水 5 50 55 不干净水 9 22 31 总计147286此时,K 2的观测值k =86×5×22-50×9214×72×55×31≈5.785.因为5.785>5.024,P(K 2>5.024)≈0.025,所以我们有97.5%的把握认为该种疾病与饮用不干净水有关.两个样本都能统计得到传染病与饮用不干净水有关这一相同结论,但(1)中我们有99.9%的把握肯定结论的正确性,(2)中我们只有97.5%的把握肯定.解决一般的独立性检验问题的步骤:(1)通过列联表确定a 、b 、c 、d 、n 的值,根据实际问题需要的可信程度确定临界值k 0;(2)利用K 2=n ad -bc 2a +bc +d a +cb +d求出K 2的观测值k ;(3)如果k≥k 0,就推断“两个分类变量有关系”,这种推断犯错误的概率不超过α;否则就认为在犯错误的概率不超过α的前提下不能推断“两个分类变量有关系”.某社区医疗服务部门为了考察人的高血压病是否与食盐摄入量有关,对该社区的1 633人进行了跟踪测查,得出以下数据:患高血压 未患高血压 合计 喜欢较咸食物 34 220 254 喜欢清淡食物 26 1 353 1 379 合计601 5731 633问能否判断在犯错误的概率不超过0.001的前提下,认为患高血压与食盐摄入量有关? 【解】 提出假设H 0:该社区患有高血压病与食盐的摄入量无关. 由公式计算K 2的观测值为 k =1 633×34×1 353-220×26260×1 573×254×1 379≈80.155.因为80.155>10.828,因此在犯错误的概率不超过0.001的前提下,我们认为该社区患有高血压病与食盐的摄入量有关.因未理解P(K 2≥k 0)的含义而致误某小学在对232名小学生调查中发现:180名男生中有98名有多动症,另外82名没有多动症,52名女生中有2名有多动症,另外50名没有多动症,用独立性检验方法判断多动症与性别是否有关系?【错解】 由题目数据列出如下列联表:多动症 无多动症 总计 男生 98 82 180 女生 2 50 52 总计100132232k =232×98×50-2×82100×132×180×52≈42.117>10.828.所以有0.1%的把握认为多动症与性别有关系.【错因分析】 应该是有(1-P(K 2≥10.828))×100%=(1-0.001)×100%的把握,而不是P(K 2≥10.828)×100%=0.001×100%的把握.【防范措施】 本题的错误之处在于不能正确理解独立性检验步骤的含义,当计算的K 2的观测值k 大于临界值k 0时,就可推断在犯错误的概率不超过α的前提下说两分类变量有关系.这一点需牢记,才能避免类似错误.【正解】 由题目数据列出如下列联表:多动症 无多动症 总计 男生 98 82 180 女生 2 50 52 总计100132232由表中数据可得到: k =232×98×50-2×822100×132×180×52≈42.117>10.828.所以有99.9%的把握认为多动症与性别有关系.1.列联表与等高条形图列联表由两个分类变量之间频率大小差异说明这两个变量之间是否有关联关系,而利用等高条形图能形象直观地反映它们之间的差异,进而推断它们之间是否具有关联关系.2.对独立性检验思想的理解独立性检验的基本思想类似于数学中的反证法.先假设“两个分类变量没有关系”成立,计算随机变量K2的值,如果K2值很大,说明假设不合理.K2越大,两个分类变量有关系的可能性越大.1.在研究吸烟与患肺癌的关系中,通过收集数据、整理分析数据得“吸烟与患肺癌有关”的结论,并且在犯错误的概率不超过0.01的前提下认为这个结论是成立的,下列说法中正确的是()A.100个吸烟者中至少有99人患有肺癌B.1个人吸烟,那么这个人有99%的概率患有肺癌C.在100个吸烟者中一定有患肺癌的人D.在100个吸烟者中可能一个患肺癌的人也没有【解析】独立性检验的结果与实际问题有差异,即独立性检验的结论是一个数学统计量,它与实际问题中的确定性存在差异.【答案】 D2.分类变量X和Y的列联表如下,则()y1y2总计x1 a b a+bx2 c d c+d总计a+c b+d a+b+c+dA.ad-bcB.ad-bc越大,说明X与Y的关系越强C.(ad-bc)2越大,说明X与Y的关系越强D.(ad-bc)2越接近于0,说明X与Y的关系越强【解析】由K2的计算公式可知,(ad-bc)2越大,则K2越大,故相关关系越强.【答案】 C3.观察下列各图,其中两个分类变量x、y之间关系最强的是()【解析】 在四幅图中,D 图中两个深色条的高相差最明显,说明两个分类变量之间关系最强.【答案】 D4.为了探究患慢性气管炎是否与吸烟有关,调查了339名50岁以上的人,调查结果如下表所示:患慢性气管炎 未患慢性气管炎 合计 吸烟 43 162 205 不吸烟 13 121 134 合计56283339【解】 从题目的2×2列联表中可知:a =43,b =162,c =13,d =121,a +b =205,c +d =134,a +c =56,b +d =283,n =a +b +c +d =339,代入公式:K 2=n ad -bc 2a +bc +d a +cb +d ,得k =339×43×121-162×132205×134×56×283≈7.469.因为7.469>6.635,所以我们有99%的把握认为50岁以上的人患慢性气管炎与吸烟习惯有关系.一、选择题1.有两个分类变量X 与Y 的一组数据,由其列联表计算得k≈4.523,则认为“X 与Y 有关系”犯错误的概率为( )A .95%B .90%C .5%D .10%【解析】 P(K 2≥3.841)≈0.05,而k≈4.523>3.841.这表明认为“X 与Y 有关系”是错误的可能性约为0.05,即认为“X 与Y 有关系”犯错误的概率为5%.【答案】 C2.在一项中学生近视情况的调查中,某校男生150名中有80名近视,女生140名中有70名近视,在检验这些中学生眼睛近视是否与性别有关时用什么方法最有说服力( )A .平均数与方差B .回归分析C .独立性检验D .概率【解析】 判断两个分类变量是否有关的最有效方法是进行独立性检验,故选C. 【答案】 C3.利用独立性检验来考虑两个分类变量X 和Y 是否有关系时,通过查阅临界值表来确定推断“X 与Y 有关系”的可信度,如果k >5.024,那么就推断“X 和Y 有关系”,这种推断犯错误的概率不超过( )A.0.25 B.0.75C.0.025 D.0.975【解析】∵P(k>5.024)=0.025,故在犯错误的概率不超过0.025的条件下,认为“X 和Y有关系”.【答案】 C4.下面是调查某地区男女中学生喜欢理科的等高条形图,阴影部分表示喜欢理科的百分比,从图中可以看出()图1-2-1A.性别与喜欢理科无关B.女生中喜欢理科的比为80%C.男生比女生喜欢理科的可能性大些D.男生不喜欢理科的比为60%【解析】本题考查学生的识图能力,从图中可以分析,男生喜欢理科的可能性比女生大一些.【答案】 C5.在调查中发现480名男人中有38名患有色盲,520名女人中有6名患有色盲.下列说法正确的是()A.男、女患色盲的频率分别为0.038,0.006B.男、女患色盲的概率分别为19240,3 260C.男人中患色盲的比例比女人中患色盲的比例大,患色盲与性别是有关的D.调查人数太少,不能说明色盲与性别有关【解析】男人中患色盲的比例为38480,要比女人中患色盲的比例6520大,其差值为|38480-6520|≈0.0 676,差值较大.【答案】 C二、填空题6.某班主任对全班50名学生作了一次调查,所得数据如表:认为作业多认为作业不多总计喜欢玩电脑游戏 18 9 27 不喜欢玩电脑游戏 8 15 23 总计262450在犯错误的概率不超过0.01的前提下认为喜欢玩电脑游戏与认为作业多有关.【解析】 查表知若要在犯错误的概率不超过0.01的前提下认为喜欢玩电脑游戏与认为作业多有关,则临界值k 0=6.635.本题中,k≈5.059<6.635,所以不能在犯错误的概率不超过0.01的前提下认为喜欢玩电脑游戏与认为作业多有关.【答案】 不能7.独立性检验所采用的思路是:要研究A ,B 两类型变量彼此相关,首先假设这两类变量彼此________.在此假设下构造随机变量K 2,如果K 2的观测值较大,那么在一定程度上说明假设________.【答案】 无关 不成立8.某高校《统计初步》课程的教师随机调查了选该课的一些学生的情况,具体数据如下表:专业性别 非统计专业 统计专业 男生 13 10 女生720K 2的观测值为k =50×13×20-10×7223×27×20×30≈4.844.因为k >3.841,所以确认“主修统计专业与性别有关系”,这种判断出现错误的可能性为________.【解析】 因为随机变量K 2的观测值k >3.841,所以在犯错误的概率不超过0.05的前提下认为“主修统计专业与性别有关系”.故这种判断出现错误的可能性为5%.【答案】 5%三、解答题9.为了探究学生选报文、理科是否与对外语的兴趣有关,某同学调查了361名高二在校学生,调查结果如下:理科对外语有兴趣的有138人,无兴趣的有98人,文科对外语有兴趣的有73人,无兴趣的有52人.试分析学生选报文、理科与对外语的兴趣是否有关?【解】 列出2×2列联表理 文 总计 有兴趣 138 73 211 无兴趣9852150总计236 125 361代入公式得K 2的观测值 k =361×138×52-73×982236×125×211×150≈1.871×10-4.∵1.871×10-4<2.706,∴可以认为学生选报文、理科与对外语的兴趣无关.10.某校对学生课外活动进行调查,结果整理成下表:运用你所学过的知识进行分析,能否在犯错误的概率不超过0.005的前提下,认为“喜欢体育还是文娱与性别有关系”?体育 文娱 合计 男生 21 23 44 女生 6 29 35 合计275279【解】由图可以直观地看出喜欢体育还是喜欢文娱与性别在某种程度上有关系,但只能作粗略判断,具体判断方法如下:假设“喜欢体育还是喜欢文娱与性别没有关系”, ∵a =21,b =23,c =6,d =29,n =79, ∴K 2的观测值为k =79×21×29-23×6221+23×6+29×21+6×23+29≈8.106.且P(K 2≥7.879)≈0.005,即我们得到的K 2的观测值k≈8.106超过7.879,这就意味着:“喜欢体育还是文娱与性别没有关系”这一结论成立的可能性小于0.005,即在犯错误的概率不超过0.005的前提下认为“喜欢体育还是喜欢文娱与性别有关”.11.某企业有两个分厂生产某种零件,按规定内径尺寸(单位:mm)的值落在[29.94,30.06)的零件为优质品.从两个分厂生产的零件中各抽出了500件,量其内径尺寸,得结果如下表:甲厂:分组[29.86,29.90) [29.90, 29.94) [29.94, 29.98) [29.98, 30.02) [30.02, 30.06) [30.06, 30.10) [30.10, 30.14) 频数12638618292614分组 [29.86, 29.90) [29.90, 29.94) [29.94, 29.98) [29.98, 30.02) [30.02, 30.06) [30.06, 30.10) [30.10, 30.14) 频数297185159766218(2)由以上统计数据填下面2×2列联表,并问是否有99%的把握认为“两个分厂生产的零件的质量有差异”.甲厂 乙厂 合计 优质品 非优质品 合计附:K 2=n ad -bc a +bc +d a +cb +dP(K 2≥k) 0.05 0.01 k3.8416.635 【解】 (1)为360500=72%; 乙厂抽查的产品中有320件优质品,从而乙厂生产的零件的优质品率估计为320500=64%.(2)甲厂 乙厂 合计 优质品 360 320 680 非优质品 140 180 320 合计5005001 000k =1 000×360×180-320×1402500×500×680×320≈7.353>6.635,因此,在犯错误的概率不超过0.01的前提下,即有99%的把握认为“两个分厂生产的零件的质量有差异”.在对人们休闲方式的调查中,已知男性占总调查人数的25,其中有一半的休闲方式是运动,而女性只有13的休闲方式是运动.经过调查员计算,在犯错误的概率不超过0.05的前提下,可认为“性别与休闲方式有关”,那么被调查的人中最少有多少人的休闲方式是运动?【思路探究】 (1)设总共调查了n 人,则其中男性有多少人?其中休闲方式为运动的有多少人?非运动的呢?(2)被调查的女性有多少人?休闲方式是运动的有多少人?非运动的呢? (3)根据题意,K 2的临界值为多少?K 2的观测值为多少?二者之间有什么关系? 【自主解答】 设总共调查n 人,则被调查的男性人数应为25n ,其中有n5人的休闲方式是运动;被调查的女性人数应为3n 5,其中有n5人的休闲方式是运动,列出2×2列联表如下:运动 非运动 总计 男性 n5 n 5 25n 女性 n 5 25n 3n 5 总计25n 3n 5n由表中数据,得k =n·n 5·2n 5-n 5·n 522n 5·3n 5·2n 5·3n 5=n 36. 要使调查员在犯错误的概率不超过0.05的前提下认为“休闲方式与性别有关”,则k≥3.841.所以n 36≥3.841.解得n≥138.276.又n5∈N *,所以n≥140.所以被调查的人中,以运动为休闲方式的最少有140×25=56(人).本题属于逆向探求型问题,目的在于训练K 2公式的熟练应用.解题的关键在于根据犯错误概率的上界α确定临界值k 0,然后设出未知数利用K 2≥k 0列出不等式进行解决.这里运用了方程思想和化归思想.有两个分类变量X 与Y ,其一组观测值如下面的2×2列联表所示:y 1 y 2 合计 x 1 a 20-a 20 x 2 15-a 30+a 45 合计155065其中a,15-a 均为大于5的整数,则a 取何值时,在犯错误的概率不超过0.10的前提下认为“X 和Y 有关系”?【解】 查表可知:要使犯错误的概率不超过0.1,则K 2≥2.706, 而K 2=65×[a×30+a -15-a ×20-a ]220×45×15×50=13×65a -300250×45×60=13×13a -60290×60,因为K 2≥2.706, 所以13×13a -60290×60≥2.706.即(13a -60)2≥1 124,所以13a -60≥33.5或13a -60≤-33.5, 解得a≥7.2或a≤2.又⎩⎪⎨⎪⎧a>5,15-a>5, 所以5<a<10,且a ∈Z , 所以a =6,7,8,9,又因为a≥7.2或a≤2,所以a =8或a =9.。
苏教版数学高二数学苏教版选修1-2知识必备1.1独立性检验
1.1 独立性检验知识梳理1.利用随机变量来确定在多大程度上可以认为“两个分类变量有关系”的方法称为两个随机变量的______________,常用______________表示.2.用样本估计总体时,由于抽样的随机性,结果并不唯一,因此,由某个样本得到的推断有可能正确,也有可能错误.利用χ2进行独立性检验,可以对推断的正确性的概率作出估计,样本量n 越大,这个估计______________.3.一般地,对于两个研究对象Ⅰ和Ⅱ,Ⅰ有两类取值类A 和类B ,Ⅱ也有两类取值类1和类2,可列联表如下:Ⅱ 合计 类1 类2Ⅰ 类A a a+b 类B d c+d合计 a+c a+b+c+d则χ2=________________________________________________其中n=__________________________为样本量.要推断“Ⅰ与Ⅱ有关系”的步骤是__________________________(1)______________________________________________________________________(2)______________________________________________________________________(3)______________________________________________________________________ 知识导学可以利用独立性检验来考查两个分类变量是否有关系,并且能够较精确地给出这种判断的可靠程度,x 2的值越大,说明两个变量有关系的可能性越大,当数据a 、b 、c 、d 都不小于5时,可用课本中的表1-1-4来判断.疑难突破1.独立性检验与数学中的反证法的区别与联系是什么呢?可以用反证法的思想解释假设检验原理,它们的对应关系为:反证法: 假设检验要证明结论A 备择假设H 1在A 不成立的前提下进行推理 在H 1不成立的条件下,即H 0成立的条件下推理推出矛盾,意味着结论A 成立 推出有利于H 1成立的小概率事件发生,意味着H 1成立的可能性很大没有找到矛盾,不能对A 下任何结论,即反证法不成功 推出有利于H 1成立的小概率事件不发生,接受原假设从上述对比中可以看出,假设检验的思想和反证法类似.不同之处:一是假设检验中用有利于H 1的小概率事件的发生代替了反证法中的矛盾;二是假设检验中接受原假设的结论相当于反证法中没有找到矛盾.把假设检验的基本思想具体化到独立性检验中,就可以通过随机变量χ2=))()()(()(2d b c a d c b a bc ad n ++++-当χ2很大时,就认为所涉及的两个分类变量有关系;否则,就认为没有充分的证据显示这两个变量有关系.2.独立性检验的一般步骤为:(1)提出假设H 0:Ⅰ与Ⅱ没有关系;(2)根据2×2列联表与公式χ2=))()()(()(2d b c a d c b a bc ad n ++++-计算χ2的值; (3)把χ2的值与临界值比较,确定Ⅰ与Ⅱ有关的程序或无关系,具体比较时可参考以下标准;①如果χ2>10.828,则有99.9%的把握认为Ⅰ与Ⅱ有关系;②如果χ2>7.879,则有99.5%的把握认为Ⅰ与Ⅱ有关系;③如果χ2>6.635,则有99%的把握认为Ⅰ与Ⅱ有关系;④如果χ2>5.024,则有97.5%的把握认为Ⅰ与Ⅱ有关系;⑤如果χ2>3.841,则有95%的把握认为Ⅰ与Ⅱ有关系;⑥如果χ2>2.706,则有90%的把握认为Ⅰ与Ⅱ有关系;⑦如果χ2≤2.706,就没有充分证据显示Ⅰ与Ⅱ有关系,这时就认为Ⅰ与Ⅱ无关系成立,只要χ2≤2.706我们就认为Ⅰ与Ⅱ有关系.典题精讲【例1】 对196个接受心脏搭桥手术的病人和196个接受血管清障手术的病人进行了3年的跟踪研究,调查他们是否又发作过心脏病,调查结果如下:又发作心脏病 未发作过心脏病 全计心脏搭 桥手术 39 157196 血管清 障手术 29167 196 合计 68试根据上述数据比较这两种手术对病人又发作过心脏病的影响有没有差别.思路解析:从所给的列联表中可知病人有两种类型:做过心脏搭桥手术和做过血管清障手术.每种类型又有两种情况,又发作过心脏病,未发作过心脏病,问题是:用表中所给出的数据来检验上述两种状态是否有关系.这是一个独立性检验问题,解决的方法是先计算χ2,用χ2的大小来决定是否又发作过心脏病与心脏搭桥手术有关还是无关.解:假设做过心脏搭桥手术与又发作心脏病没有关系.由于a=39,b=157,c=29,d=167, a+b=196,c+d=196,a+c=68,b+d=324,n=392,由公式可得χ2的观测值为:χ2=))()()(()(2d b c a d c b a bc ad n ++++- =32468196196)2915716739(3922⨯⨯⨯⨯-⨯⨯ =1.78因为χ2=1.78<2.706,所以我们没有理由说心脏搭桥手术与又发作心脏病有关系.绿色通道:此类问题的一般解法是利用χ2=))()()(()(2d b c a d c b a bc ad n ++++-;求出χ2的值,再此利用χ2与临界值的大小关系,来判断假设是否成立.黑色陷阱:在解题时应注意准确代数与计算,有些同学常把数代错,或计算错误,用错公式等,同时,准确进行比较与判断也非常重要.【变式训练】 在一次恶劣气候的飞机航程中,调查了男女乘客在飞机上晕机的情况,如下表所示,请你根据所给的数据判定是否在恶劣气候飞行中男人比女人更容易晕机?晕机 不晕机 合计男人 24 31 55女人 8 26 34合计 32 57 89解:由题意可知a=24,b=31,c=8,d=26,a+b=55,c+d=34,a+c=32,b+d=57,n=89,代入公式得, χ2=))()()(()(2d b c a d c b a bc ad n ++++-=57323455)8312624(892⨯⨯⨯⨯-⨯⨯=3.689, 因为χ2=3.689>2.706.因此,我们有90%的把握认为男人比女人更容易晕机.【例2】 在某医院,因为患心脏病而住院的665名男性病人中,有214人秃顶;而另外772名不是因为心脏病而住院的男性病人中有175人秃顶,利用独立性检验方法判断秃顶与患心脏病是否有关系?所得的结论在什么范围内有效?思路分析:把所给数据列出列联表,被调查的人有两种状态:秃顶、不秃顶.每个状态又有两种情况:患心脏病、患其他病.这是一个2×2列联表的独立性检验的问题,因而需求出χ2,用它的大小可以确定是否拒绝原来的假设,从而得出两个量之间的关系.解:根据题目所给的数据得到如下列联表:患心脏病 患其他病 合计秃顶 214 175 389不秃顶 451 597 1 048合计 665 772 1 437假设秃顶与心脏病无关.由于a=214,b=175,c=451,d=597,则a+b=389,c+d=1 048,a+c=665,b+d=772,n=1 437.因此,χ2=))()()(()(2d b c a d c b a bc ad n ++++- =7721048665389)451175597214(1437(2⨯⨯⨯⨯-⨯⨯ ≈16.373>10.828.因而我们有99.9%的把握认为秃顶与患心脏病有关系.绿色通道:正确判断出列联表,比较易于观察,因此对结论的判断才不会出现偏差.【变式训练】 在研究某种新措施对猪白痢的防治效果问题时,得到以下数据:存活数 死亡数 合计未采取新措施 114 36 150采取新措施 132 18 150合计 246 54 300试问新措施对防治猪白痴是否有效?解:由题意可知:a=114,b=36,c=132,d=18∴a+b=150,c+d=150,a+c=246,b+d=54,n=300,代入公式可得,χ2=))()()(()(2d b c a d c b a bc ad n ++++-=54240150150)1323618114(3002⨯⨯⨯⨯-⨯⨯=7.317因为χ2=7.317>6.635因此我们有99%的把握认为新措施对防治猪白痢是有效果的.【例3】(2006年全国高考卷Ⅱ,文19)某批产品成箱包装,每箱5件,一用户在购进该批产品前先取出3箱,再从每箱中任意抽取2件产品进行检验.设取出的第一、二、三箱中分别有0件,1件,2件二等品,其余为一等品.(1)求抽检的6件产品中恰有1件二等品的概率;(2)若抽检的6件产品中有2件或2件以上二等品,用户就拒绝购买这批产品,求这批产品被用户拒绝购买的概率.思路分析:本题是相互独立事件概率公式的应用类问题,要求会用公式P(A·B )=P (A )·P(B )来解决实际问题.解:设A i 表示事件“第二箱中取出i 件二等品”,i=0,1;B i 表示事件“第三箱中取出i 件二等品”,i=0,1,2.(1)由题意可知,所求的概率为P 1=P(A 1·B 0)+P (A 0·B 1)=P (A 1)P (B 0)+P (A 0)P (B 1) =2512251213252425232514=••+•C C C C C C C C C . (2)解法1:所求的概率为P 2=1-P(A 0·B 0)-P 1=50172512125232524==•-C C C C 解法2:所求的概率为P 2=P(A 1·B 1)+P (A 0·B 2)+P (A 1·B 2)=P (A 1)P (B 1)+P (A 0)P (B 2)+P (A 1)P (B 2) =501725222514252225242512132514=•+•+••C C C C C C C C C C C C C . 绿色通道:本题考查互斥事件的概率及相互独立事件的概率计算,考查运用所学知识与方法解决实际问题的能力和合理推理的能力.【变式训练】 袋子A 和B 中各装有若干个均匀的红球和白球,从A 中摸出一个红球的概率为31,从B 中摸出一个红球的概率为P. (1)从A 袋中有放回地摸球,每次摸出一个球,共摸5次.求:①恰好有3次摸出红球的概率;②第一次,第三次,第五次均摸出红球的概率;(2)若A 、B 两个袋子中的球数之比为1∶2,将两个袋子中的球混装在一起后,从中摸出一个红球的概率为52,求P 的值. 解:(1)①243409427110)32()31(2335=⨯⨯=⨯C ②P=271)31(3=. (2)设A 袋中有m 个球,则B 袋中有2m 个球,由523231=+m mp m ,可求得p=3013. 问题探究问题:把一颗质地均匀的骰子任意投掷一次,设事件A 为“掷出偶数点”,B 为“掷出3的倍数点”.求(1)事件A ,B ,A ,B 的概率,以及事件A∩B,A ∩B,A∩B ,A ∩B 的概率,(2)判断P (A∩B )与P (A )·P (B ),P (A∩B)与P (A )·P (B ),P (A ∩B )与P (A )·P (B ),P (A ∩B )与P (A )·P (B )的大小关系.导思:要判断P (A∩B )与P (A )·P (B ),P (A∩B )与P (A )·P (B ),P (A ∩B )与P (A )·P (B ),P (A ∩B )与P (A )·P (B )的大小关系,首先要知道P (A∩B )是指A 、B 同时交事件的概率.即A 、B 同时发生的概率,然后再计算P (A∩B )的值.在处理此类问题时,要分清楚是相互独立事件同时发生的概率,即交事件还是和事件的概率.探究:(1)P (A )=2163=,P (B )=3162= 所以P (A )=1-2121=,P (B )=1-3231=. P (A∩B )=P (掷出6点)=61·61=361. P (A ∩B )=P (掷出3点)=61·61=361. P (A∩B )=P (掷出2点或4点)=226122612⨯•C C C C =22582152152=⨯⨯ P (A ∩B )=P (掷出1点或5点)=2258216121612=⨯•C C C C . (2)∵P (A∩B )=2258,而P (A )·P (B )=21×32=31 ∴P(A)·P (B )>P(A∩B );∵P (A∩B)=361而P(A)·P (B )=21·31=61 ∴P (A∩B)<P(A)·P(B); ∵P(A ∩B)=361,而P (A )·P (B )=21·31=61 ∴P (A ∩B )<P (A )·P (B );∵P (A ∩B )=2258,P (A )·P (B )=21×32=31 ∴P (A ∩B )<P (A )·P (B ).综上可知,交事件的概率与互斥事件同时发生的概率并非完全相等.。
《独立性检验》素材2(苏教版选修1-2)
学会用数据说话1.分析两个变量的相关关系的常用方法(1)把样本数据表示的点在平面直角坐标系中作出,从而得到散点图,从散点图分析相关关系,如果这些点大致分布在通过散点图中心的一条直线附近,那么就说这两个变量之间具有线性相关关系.(2)利用相关系数r进行判断,而且越接近于1,相关程度越大;越接近于0,相关程度越小.2.对具有相关关系的两个变量进行统计分析时,首先进行相关性检验,在确认具有线性相关关系后,再求回归直线方程.3.可化为线性回归的非线性回归对某些特殊的非线性关系,可以通过变量置换,把非线性回归转化为线性回归,然后用线性回归的方法进行研究.4.独立性检验的一般步骤(1)根据样本数据制成2×2列联表;(2)根据公式,计算的值;(3)比较与临界值的大小关系作统计推断.例1现随机抽取某校10名学生在入学考试中的数学成绩x与入学后的第一次考试的数学成绩请问:这10个学生的两次数学考试成绩是否具有显著的线性相关关系?分析:若已知x与y呈线性相关关系,就无须进行相关性检验,否则须进行相关性检验.解:,,,,,∴相关系数为.由知,两次数学考试成绩有显著的线性相关关系.评注:如果两个变量不具备线性相关关系,或者线性相关关系不显著,即使求出回归直线方程也是无意义的,用于估计和预测是不可信的.例2某企业为了更好地了解设备改造前后与生产合格品的关系,随机抽取了180件产品进行分析.其中设备改造前生产的合格品有36件,不合格品有49件;设备改造后生产的合格品有65件,不合格品有30件.根据上面的数据,你能得出什么结论?分析:利用已知条件来判断两个分类变量是否具有关系,可以先假设两个变量之间没有关系,再计算的值.的值越大,说明两个变量之间有关系的可能性也就越大,再参考临界值,从而判断两个变量有关系的可信程度.解:由已知数据得下表:根据公式得.由于,可以有的把握说产品是否合格与设备改造是有关的.评注:在利用统计变量进行独立性检验时,应该注意准确代数和正确计算,再把计算的结果与有关临界值相比较,正确下结论.练习:考察黄烟经过培养液处理与否跟发生青花病的关系.调查了457株黄烟,得到答案:经过培养液处理的黄烟跟发生青花病是有关的.。
高中数学 第一章 统计案例 1.1 独立性检验 苏教版选修1 -2
Ⅱ
类1
类2
合计
类A Ⅰ
类B 合计
a c
_a_+__c_
b d
_b_+__d_
_a_+__b__ __c+__d__
a+b+c+d
(2)χ2统计量的求法 公式 χ2=a+bcn+add-ab+cc2b+d.
知识点二 独立性检验
独立性检验的概念 用χ2统计量研究两变量是否有关的方法称为独立性检验.
知识点三 独立性检验的步骤
第1章 统计案例
1.1 独立性检验
学习目标 1.了解2×2列联表的意义. 2.了解统计量χ2的意义. 3.通过对典型案例分析,了解独立性检验的基本思想和方 法.
内容索引
问题导学 题型探究 达标检测
问题导学
知识点一 2×2列联表
思考 山东省教育厅大力推行素质教育,增加了高中生的课外活动时间,
某校调查了学生的课外活动方式,结果整理成下表:
男生 女生 合计
体育 210 60 270
文娱 230 290 520
合计 440 350 790
如何判定“喜欢体育还是文娱与性别是否有联系”?
答案 可通过表格与图形进行直观分析,也可通过统计分析定量判断.
梳理 (1)2×2列联表的定义 对于两个研究对象Ⅰ和Ⅱ,Ⅰ有两类取值,即类A和类B;Ⅱ也有两类取 值,即类1和类2.我们得到如下列联表所示的抽样数据:
跟踪训练2 某省进行高中新课程改革已经四年了,为了解教师对新课程 教学模式的使用情况,某一教育机构对某学校的教师关于新课程教学模式
的使用情况进行了问卷调查,共调查了50人,其中有老教师20人,青年教
师30人.老教师对新课程教学模式赞同的有10人,不赞同的有10人;青年
高中数学 第一章 统计案例 1.2 独立性检验是如何判断
独立性检验是如何判断两个事件是否相互独立的独立性检验的基本思想类似于反证法.要确认“两个分类变量有关系”这一结论成立的可信程度,首先假设结论不成立,即假设结论“两个分类变量没有关系”成立,在该假设下构造的随机变量2χ应该很小.如果由观测数据计算得到的2χ的观测值很大,则在一定程度上说明假设不合理.根据随机变量2χ的含义,可以通过概率式评价该假设不合理的程度,由实际计算的2χ>6.635,说明假设不合理的程度约为99%,即“两个分类变量有关系”这一结论成立的可信程度约为99%.当2χ≤3.841时,认为两个分类变量是无关的.对于两事件而言即相互独立. 1.两个事件独立的判定例1: 为了研究不同的给药方式(口服与注射)和药的效果(有效与无效)是否有关,进根据193个病人的数据,能否作出药的效果与给药方式有关的结论?请说明理由. 解:提出假设H 0:药的效果与给药方式无关系.根据列联表中的数据,得χ2=2193(58314064)122719895-⨯-⨯⨯⨯⨯≈1.3896<2.072.当H 0成立时,χ2>1.3896的概率大于15%,这个概率比较大,所以根据目前的调查数据,不能否定假设H 0,即不能作出药的效果与给药方式有关的结论.注意:这是一个由列联表来验证的独立性检验问题,其结论是没有关系的假设成立.并且应该注意上述结论是对所有口服药物与注射药物的实验人而言的,绝不要误以为对被跟踪的193个跟踪研究对象成立.例2:调查某医院某段时间内婴儿出生的时间与性别的关系,得到下面的数据表.试问能以多大把握认为婴儿的性别与出生时间有关系.分析:利用表中的数据通过公式计算出2χ统计量,可以用它的取值大小来推断独立性是否成立. 解:由公式()841.368892.35732345531826248922<≈⨯⨯⨯⨯-⨯⨯=χ 故婴儿的性别与出生时间是相互独立的(也可以说没有充分证据显示婴儿的性别与出生时间有关).2.两个事件不独立的判定例3:在某医院,因为患心脏病而住院的665名男性病人中,有214人秃顶,而另外772名不是因为患心脏病而住院的男性病人中有175人秃顶.利用独立性检验方法判断秃顶与患心脏病是否有关系?你所得的结论在什么范围内有效?分析:列出22⨯列联表,利用公式求出2χ与两个临界值3.841与6.635比较大小得适当范围.解:根据题目所给数据得到如下表所示: 秃顶与患心脏病列联表由公式,得:()635.6373.167726651048389451175597214143722>≈⨯⨯⨯⨯-⨯⨯=χ 所以有99%的把握认为“秃顶与患心脏病有关”.说明:因为这组数据来自住院的病人,因此所得到的结论适合住院的病人群体.例 4.某班主任对全班50名学生进行了作业量多少的调查,喜欢玩电脑游戏的同学认为作业多的有18人,认为作业不多的有9人,不喜欢玩电脑游戏的同学认为作业多的有8人,认为作业不多的有15人,则认为喜欢玩电脑游戏与认为作业量的多少有关系的把握大约是多少?2x =059.523272426)981518(502=⨯⨯⨯⨯-⨯, ()024.52>x P =0.025,有97.5%的把握认为喜欢玩电脑游戏与认为作业多有关系.。
苏教版数学高二数学苏教版选修1-2课前引导1.1独立性检验
1.1 独立性检验课前导引 问题导入为了探究患慢性气管炎是否与吸烟有关,调查了339名50岁以上的人,调查结果如下试问:50岁以上的人患慢性气管炎与吸烟习惯有关吗?思路分析:最理想的解决办法是向所有50岁以上的人做调查,然后对得到的数据进行统计处理,但这花费的代价太大,实际上是行不通的.339个人相对于全体50岁以上的人,只是一个小部分.回忆一下数学3(必修)中学过的总体和样本的关系,当用样本平均数、样本标准差去估计总体相应的数字特征时,由于抽样的随机性,结果并不唯一.现在情况类似,我们用部分对全体作推断,推断可能正确,也可能错误.例如我们知道,不少中老年烟民的身体很好,没有患慢性气管炎;而又有很多从不吸烟的中老年人体质很差,患有慢性气管炎.如果抽取的339个调查对象中很多人来自上述两个群体,试想会得出什么结论吧.我们有95%(或99%)的把握说事件A 与B 有关,是指推断犯错误的可能性为5%(或1%),这也常常说成是“以95%或(99%)的概率”,其含义是一样的.解:根据列联表中的数据,得到x 2=2835613420513162121433392⨯⨯⨯⨯-⨯⨯)(=7.469.因为7.469>6.635,所以我们有99%的把握说50岁以上的人患慢性气管炎与吸烟习惯有关.知识预览1.独立性检验实际上就是检验两个分类变量是否相关,在多大程度上相关.得到比较精确结果的做法是进行__________.答案:独立性检验 2.对于2×2列联表:一般地,对于两个研究对象Ⅰ和Ⅱ,Ⅰ有两类取值类A 和类B (如吸烟与不吸烟),Ⅱ要推断“Ⅰ与Ⅱ有关系”可按下面的步骤进行: (1)提出假设H 0:Ⅰ与Ⅱ没有关系;(2)根据2×2列联表与公x 2=d)c)(b d)(a b)(c (a bc)-n(ad 2++++其中n=a +b +c +d 为样本量.例如:(1)若观测值x2>10.828,则有99.9%的把握认为“Ⅰ与Ⅱ有关系”;(2)若观测值x2>6.635,则有99%的把握认为“Ⅰ与Ⅱ有关系”;(3)若观测值x2>2.706,则有90%的把握认为“Ⅰ与Ⅱ有关系”;(4)若观测值x2≤2.706,则认为没有充分的证据显示“Ⅰ与Ⅱ有关系”,但也不能作出结论“H0成立”,即不能认为Ⅰ与Ⅱ没有关系.。
苏教版数学高二- 选修1-2教案 1.1独立性检验的基本思想(1)
不吸烟
a
b
a+b
吸烟
c
d
c+d
总计
a+c
b+d
a+b+c+d
五、当堂检测
打鼾不仅影响别人休息,而且可能与患某种疾病有关,下表是一次调查所得的数据,试问:每一晚都打鼾与患心脏病有关吗?
患心脏病
未患心脏病
合计
每一晚都打鼾
30
224
254
不打鼾
24
1355
1379
合计
54
1579
1633
六、作业布置课本16第1题
2、会从列联表、柱形图、条形图直观判断吸烟与患癌有关
引入:从问题“吸烟是否与患肺癌有关系”引出独立性检验的问题,并借助样本数据的列联表,柱形图,和条形图的展示,使学生直观感觉到吸烟和患肺癌可能会有关系。但这种结论能否推广到总体呢?要回答这个问题,就必须借助于统计理论来分析。
二、预习检测
什么是分类变量?
情感态度价值观
让学生了解对两个分类博变量进行独立性检验的必要性和作用,并引导学生注意比较与观测值之间的联系与区别。
教材分析
重难点
教学重点理解独立性检验的基本思想。
教学难点了解独立性检验的基本思想、独立性检验的步骤。
教学设想
教法
引导探究
学法
合作交流
教具
多媒体,直尺
课堂设计
一、目标展示
1.了解独立性检验的基本思想及实施步骤。
板
书
设
计
1.什么是分类变量?
学生自己举例
2.
其中 为样本容量.
[例]打鼾不仅影响别人休息,而且可能与患某种疾病有关,下表是一次调查所得的数据,试问:每一晚都打鼾与患心脏病有关吗?
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
1.1 独立性检验是如何判断两个事件是否相互独立的
独立性检验的基本思想类似于反证法.要确认“两个分类变量有关系”这一结论成立的可信程度,首先假设结论不成立,即假设结论“两个分类变量没有关系”成立,在该假设下构造的随机变量2
χ应该很小.如果由观测数据计算得到的2χ的观测值很大,则在一定程度上说明假设不合理.根据随机变量2
χ的含义,可以通过概率式评价该假设不合理的程度,由实际计算的2
χ>6.635,说明假设不合理的程度约为99%,即“两个分类变量有关系”这一结论成立的可信程度约为99%.
当2
χ≤3.841时,认为两个分类变量是无关的.对于两事件而言即相互独立.
1.两个事件独立的判定
例1: 为了研究不同的给药方式(口服与注射)和药的效果(有效与无效)是否有关,进行了相应的抽样调查,调查结果列表如下:
根据193个病人的数据,能否作出药的效果与给药方式有关的结论?请说明理由.解:提出假设H0:药的效果与给药方式无关系.
根据列联表中的数据,得χ2=
2
193(58314064)
122719895
-⨯-⨯
⨯⨯⨯
≈1.3896<2.072.
当H0成立时,χ2>1.3896的概率大于15%,
这个概率比较大,所以根据目前的调查数据,不能否定假设H0,即不能作出药的效果与给药方式有关的结论.
注意:这是一个由列联表来验证的独立性检验问题,其结论是没有关系的假设成立.并且应该注意上述结论是对所有口服药物与注射药物的实验人而言的,绝不要误以为对被跟踪的193个跟踪研究对象成立.
例2:调查某医院某段时间内婴儿出生的时间与性别的关系,得到下面的数据表.试问能以多大把握认为婴儿的性别与出生时间有关系.
分析:利用表中的数据通过公式计算出2
χ统计量,可以用它的取值大小来推断独立性是否成立.
解:由公式
()841.368892.357
3234553182624892
2
<≈⨯⨯⨯⨯-⨯⨯=χ 故婴儿的性别与出生时间是相互独立的(也可以说没有充分证据显示婴儿的性别与出生时间有关).
2.两个事件不独立的判定
例3:在某医院,因为患心脏病而住院的665名男性病人中,有214人秃顶,而另外772名不是因为患心脏病而住院的男性病人中有175人秃顶.利用独立性检验方法判断秃顶与患心脏病是否有关系?你所得的结论在什么范围内有效?
分析:列出22⨯列联表,利用公式求出2
χ与两个临界值3.841与6.635比较大小得适当范围.
解:根据题目所给数据得到如下表所示: 秃顶与患心脏病列联表
由公式,得:
()635
.6373.16772
665104838945117559721414372
2
>≈⨯⨯⨯⨯-⨯⨯=χ
所以有99%的把握认为“秃顶与患心脏病有关”.
说明:因为这组数据来自住院的病人,因此所得到的结论适合住院的病人群
体.
例4.某班主任对全班50名学生进行了作业量多少的调查,喜欢玩电脑游戏的同学认为作业多的有18人,认为作业不多的有9人,不喜欢玩电脑游戏的同学认为作业多的有8人,认为作业不多的有15人,则认为喜欢玩电脑游戏与认为作业量的多少有关系的把握大约是多少?
解:
2x =059.523
272426)981518(502
=⨯⨯⨯⨯-⨯, ()024.52>x P =0.025,
有97.5%的把握认为喜欢玩电脑游戏与认为作业多有关系.。