高中数学选修2-3《独立性检验的基本思想及其初步应用》教案资料
人教课标版高中数学选修2-3《独立性检验的基本思想及其初步应用(第3课时)》教学设计
3.2 独立性检验的基本思想及其初步应用第三课时一、教学目标 1.核心素养:通过学习独立性检验的基本思想及其初步应用,初步形成基本的数据分析能力, 培养数学运算能力. 2.学习目标(1)1.1.3.1 巩固复习利用等高条形图、列联表、独立性检验的基本思想判断分类变量的关系(3)1.1.3.2 总结归纳利用独立性检验判断两个分类变量相关关系的一般步骤. 3.学习重点总结归纳利用独立性检验判断两个分类变量相关关系的一般步骤. 4.学习难点对独立性检验基本思想的进一步理解 二、教学设计 (一)课前设计 1.预习任务 任务1阅读教材P10-P15,回顾本节主要知识点有哪些? 任务2利用独立性检验判断两个分类变量相关关系的一般步骤是什么?2.预习自测1.与表格相比,能更直观地反映出相关数据总体状况的是( ) A.列联表 B.散点图 C.残差图D.等高条形图解: D2.在吸烟与患肺病这两个分类变量的计算中,下列说法正确的是( )A.若2K 的观测值为635.6 k ,我们有%99的把握认为吸烟与患肺病有关系,那么在100个吸烟的人中必有99人患有肺病.B.从独立性检验可知有%99的把握认为吸烟与患肺病有关系时,我们说某人吸烟,那么他有%99的可能患有肺病.C.若从统计量中求出有%95的把握认为吸烟与患肺病有关系,是指有%5的可能性使得推判出现错误.D.以上三种说法都不正确.解: C(二)课堂设计1.知识回顾(1)变量的不同“值”表示个体所属的不同类别,像这样的变量成为分类变量.(2)列出两个分类变量的频数表,称为列联表.(3)独立性检验的基本思想类似于数学中的反证法,要确认两个分类变量有关系这一结论成立的可信程度,首先假设该结论不成立,即H:两个分类变量没有关系成立,在该假设下我们构造的随机变量2K应该很小,如果由观测数据计算得到2K的观测值k很大,则在一定程度上说明假设不合理,即断言H不成立,即认为“两个分类变量有关系”;如果观测值k很小,则说明在样本数据中没有发现足够证据拒绝H.2.问题探究问题探究一我们主要从几个方面来研究两个分类变量之间有无关系?●活动一回归旧知,巩固复习重点知识例1.为了调查某生产线上,某质量监督员甲对产品质量好坏有无影响,现统计数据如下:质量监督员甲在现场时,990件产品中合格品982件,次品87件;甲不在现场时,510件产品中合格品493件,次品17件.试分别用列联表,等高条形图,独立性检验的方法对数据进行分析.【知识点:分类变量,独立性检验,变量间的关系】详解:(1)2×2列联表如下:由列联表看出|ac-bd|=|982×17-493×8|=12750,即可在某种程度上认为“甲在不在场与产品质量有关”.相应的等高条形图如图所示:●活动二 对比学习,巩固重点由2×2列联表中数据,计算221500(982174938)13.097 6.635147525510990K ⨯⨯-⨯==>⨯⨯⨯. 所以约有99%的把握认为“质量监督员甲在不在现场与产品质量有关系”. 点拨:(1)在现在等高条形图中,b a a +与dc c+相差越大,两个分类变量有关系的可能性越大. (2)在解答独立性检验题目过程中.数据有时比较多,一定不要混淆,要分辨清楚,否则会影响解题的下一步,同时计算不能失误.问题探究二 利用独立性检验判断两个分类变量是否有关系的一般步骤是什么? 重点、难点知识★▲●活动一 实际操作例2.为考察某种药物预防禽流感的效果,进行动物家禽试验,调查了100个样本,统计结果为:服用药的共有60个样本,服用药但患病的仍有20个样本,没有服用药且未患病的有20个样本. (1)根据所给样本数据完成下面2×2列联表; (2)请问能有多大把握认为药物有效?不得禽流感 得禽流感 总计 服药 不服药 总计【知识点:分类变量,独立性检验,变量间的关系】详解:(1)(2)由列联表得:706.2778.260404060)20202040(10022>≈⨯⨯⨯⨯-⨯=K所以大概90%认为药物有效. ●活动二 深层思考,得出一般步骤通过上述解答过程,利用独立性检验判断两个分类变量是否有关系的一般步骤是什么? 1.独立性检验的基本步骤①根据实际问题的需要确定容许推断“两个分类变量有关系”犯错误概率的上界α,然后查临界值表确定临界值0k .②利用公式))()()(()(22d b c a d c b a bd ac n K ++++-=计算随机变量2K 的观测值0k .③如果0k k ≥,就推断“X 与Y 有关系”,这种推断犯错误的概率不超过α;否则,就认为在犯错误的概率不超过α的前提下不能推断“X 与Y 有关系”,或者在样本数据中没有发现足够证据支持结论“X 与Y 有关系”. 2.独立性检验的基本思想(1)利用2K 进行独立性检验,可以对推断的正确性的概率作出估计,样本容量n 越大,这个估计值越准确,如果抽取的样本容量很小,那么利用2K 进行独立性检验的结果就不具有可靠性. (2)独立性检验的思想就是在假设0H 成立的条件下,如果出现一个与0H 相矛盾的小概率事件,就推断0H 不成立,且该推断犯错误的概率不超过这个小概率. 3.课堂总结【知识梳理】1.独立性检验的基本步骤①根据实际问题的需要确定容许推断“两个分类变量有关系”犯错误概率的上界α,然后查临界值表确定临界值0k .②利用公式))()()(()(22d b c a d c b a bd ac n K ++++-=计算随机变量2K 的观测值0k .③如果0k k ≥,就推断“X 与Y 有关系”,这种推断犯错误的概率不超过α;否则,就认为在犯错误的概率不超过α的前提下不能推断“X 与Y 有关系”,或者在样本数据中没有发现足够证据支持结论“X 与Y 有关系”. 2.独立性检验的基本思想(1)利用2K 进行独立性检验,可以对推断的正确性的概率作出估计,样本容量n 越大,这个估计值越准确,如果抽取的样本容量很小,那么利用2K 进行独立性检验的结果就不具有可靠性. (2)独立性检验的思想就是在假设0H 成立的条件下,如果出现一个与0H 相矛盾的小概率事件,就推断0H 不成立,且该推断犯错误的概率不超过这个小概率.【重难点突破】(1)利用三维柱形图、二维条形图、等高条形图直观判断两个分类变量之间是否有关系. (2)利用2×2列联表以及随机变量2K 对两个变量进行独立性检验. 4.随堂检测1.在研究两个分类变量之间是否有关时,可以粗略地判断两个分类变量是否有关的是( ) A.散点图 B.等高条形图 C.2×2列联表 D.以上均不对 【知识点:独立性检验】解:B2.性别与身高列联表如下:A.0.043B.0.367C.22D.26.87【知识点:独立性检验】解:C3.给出列联表如下:()A.0.4B.0.5C.0.75D.0.85【知识点:独立性检验】解:B4.为了解高中生作文成绩与课外阅读量之间的关系,某研究机构随机抽取了60名高中生,通过问卷调查,得到以下数据:()A.没有充足的理由认为课外阅读量大与作文成绩优秀有关B.有0.5%的把握认为课外阅读量大与作文成绩优秀有关C.有99.9%的把握认为课外阅读量大与作文成绩优秀有关D.有99.5%的把握认为课外阅读量大与作文成绩优秀有关【知识点:独立性检验】解:D5.若由一个2×2列联表中的数据计算得K2=4.013,那么在犯错误的概率不超过0.05的前提下认为两个变量______(填“有”或“没有”)关系.【知识点:独立性检验】解:有(三)课后作业基础型自主突破1.在吸烟与患肺病是否有关的研究中,下列属于两个分类变量的是()A.吸烟,不吸烟B.患病,不患病C.是否吸烟、是否患病D.以上都不对【知识点:独立性检验】解:C“是否吸烟”是分类变量,它的两个不同取值;吸烟和不吸烟;“是否患病”是分类变量,它的两个不同取值:患病和不患病.可知A、B都是一个分类变量所取的两个不同值.故选C.【知识点:独立性检验】解:C 由题设知:a =45,b =10,c =30,d =15,所以k =100×45×15-30×10255×45×75×25≈3.030,2.706<3.030<3.841,由附表可知,有90%以上的把握认为“该市居民能否做到‘光盘’与性别有关”,故选C. ① 若K 2的观测值满足K 2≥6.635,我们有99%的把握认为吸烟与患肺病有关系,那么在100个吸烟的人中必有99人患有肺病;②从独立性检验可知有99%的把握认为吸烟与患病有关系时,我们说某人吸烟,那么他有99%的可能患有肺病;③从统计量中得知有95%的把握认为吸烟与患肺病有关系,是指有5%的可能性使得推断出现错误A.①B.① ③C.③D.②【知识点:独立性检验】解:C ①推断在100个吸烟的人中必有99人患有肺病,说法错误,排除A ,B ,③正确.排除D.4.在一个2×2列联表中,由其数据计算得K 2的观测值679.7 k ,则这两个变量间有关系的可能性为( ) A.99%B.99.5%C.99.9%D.无关系【知识点:独立性检验】解:A K 2的观测值6.635<k <7.879,所以有99%的把握认为两个变量有关系.5. 在600人身上实验某种新药预防感冒的作用,把一年中的记录与另外600个未用新药的人作比较,结果如下未感冒 感冒 总计 试验 292 308 600 未用过 284 316 600 总计5766241200问该种新药起到预防感冒的作用的可能性为( ) A. 99%B. 90%C.99.9%D.小于90%【知识点:独立性检验】解:D6.分析两个分类变量之间是否有关系的常用方法有________;独立性检验的基本思想类似于____.【知识点:独立性检验】解:.频率比较法、图形分析法(三维柱形图、二维条形图、等高条形图)、独立性检验;反证法能力型 师生共研7.有人发现,多看电视容易使人变冷漠,下表是一个调查机构对此现象的调查结果:则有多少的把握认为多看电视与人变冷漠有关系( )A.95%B.99%C. 5%D. 99.9%【知识点:独立性检验】解:B8. 两个分类变量X 和Y 可能的取值分别为{}21,x x 和{}21,y y ,其样本频数满足10=a ,21=b ,35=+d c .若“X 和Y 有关系”犯错误的概率不超过0.05,则c 的值可能等于( )A. 4B. 5C. 6D. 7【知识点:独立性检验】解:A9. 为了考察长头发与女性头晕是否有关联,随机抽取了301名女性,得到如下列联表.试根据表格中已有数据填空.空格中的数据应分别为①________;②________;③________;④________. 【知识点:独立性检验】解:86; 180; 229; 30110. 为了探究电离辐射的剂量与人体的受损程度是否有关,用两种不同剂量的电离辐射照射小白鼠.在照射14天内的结果如表所示:进行统计分析时的统计假设是_______. 【知识点:独立性检验】解:小白鼠的死亡与剂量无关 探究型 多维突破11.调查339名50岁以上有吸烟习惯与患慢性气管炎的人的情况,获数据如下试问:(1)有吸烟习惯与患慢性气管炎病是否有关? (2)用假设检验的思想给予说明. 【知识点:独立性检验】解:(1)根据列联表的数据,得到 6.6356.674))()()(()(22>=++++-=d b c a d c b a bd ac n K 所以有99%的把握认为“吸烟与患慢性气管炎病有关”.(2)假设“吸烟与患病之间没有关系”,由于事件A ={635.62≥K }的概率P(A)≈0.01,即A 为小概率事件,而小概率事件发生了,进而得假设错误,这种推断出错的可能性约有1%.10. 20国集团峰会于2016年月9日至4日在中国杭州进行,为了搞好接待工作,组委会招幕了16名男志愿者和14名女志愿者,调查发现,男、女志愿者中分别有10人和6人会德语,其余人不会德语.(1)根据以上数据完成以下2×2列联表:(2)根据列联表的独立性检验,能否在犯错误的概率不超过0.10的前提下认为性别与会德语有关?【知识点:独立性检验】 解:(1)(2)假设:是否会德语与性别无关,由已知数据可求得:706.21575.1<≈k 因此,在犯错误的概率不超过0.10的前提下不能判断会德语与性别有关.自助餐1.为了评价某个电视栏目改革效果,在改革前后分别从居名点抽取了100居民进行调查,经过计算得2K 的观测值99.0=k .根据这一数据分析,下列说法正确的是( ) A.有99%的人认为该栏目优秀B.有99%的人认为该栏目是否优秀与改革无关C.有99%的把握认为该栏目是否优秀与改革有关系D.没有充分理由认为该栏目是否优秀与改革有关系【知识点:独立性检验】解:D2.硕士学位与博士学位的一个随机样本给出了关于所获取学位类别与学生性别的分类数据,如下表所示下列各项说法正确的是()A.在犯错误的概率不超过0.01的前提下认为性别与获取学位类别有关B.在犯错误的概率不超过0.01的前提下认为性别与获取学位类别无关C.性格决定获取学位的类别D.以上都是错误的【知识点:独立性检验】解:A3.经过对随机变量2K的研究,得到了若干临界值,当其观测值072k时,对于两个事件A与B,.2我们认为()A. 有95%的把握认为A与B有关系B. 有99%的把握认为A与B有关系C. 没有充分理由说明事件A与B有关系D. 确定事件A与B没有关系【知识点:独立性检验】解:C4. 以下关于独立性检验的说法中,错误的是()A. 独立性检验依据小概率原理B. 独立性检验得到的结论一定正确C. 样本不同,独立性检验的结论可能有差异D. 独立性检验不是判定两分类变量是否相关的唯一方法 【知识点:独立性检验】解:B6.某班主任对全班50名学生进行了作业量多少的调查,数据如下表则认为喜欢玩电脑游戏与认为作业量的多少有关系的把握大约为( ) A. 99% B. 97.5%C. 90%D.无充分依据【知识点:独立性检验】解:B7. 给出下列实际问题:①一种药物对某种病的治愈率;②两种药物治疗同一种病是否有区别;③吸烟者得肺病的概率;④吸烟人群是否与性别有关系;⑤网吧与青少年的犯罪是否有关系.其中用独立性检验可以解决的问题有_______. 【知识点:独立性检验】 解:②④⑤8.某高校“统计初步”课程的教师随机调查了选该课的一些学生情况,具体数据如下表:250(1320107) 4.84423272030k ⨯⨯-⨯=≈⨯⨯⨯因为2 3.841K ≥,所以判定主修统计专业与性别有关系,那么这种判断出错的可能性为________. 【知识点:独立性检验】 解:0.059. 为加强素质教育,使学生各方面全面发展,某学校对学生文化课与体育课的成绩进行了调查统计,结果如下:在探究体育课成绩与文化课成绩是否有关时,根据以上数据可以得到2K的观测值为________.(精确到0.001)【知识点:独立性检验】解:1.25510. 某电视台在一次对收看文艺节目和新闻节目观众的抽样调查中,随机抽取了100名电视观众,相关的数据如下表所示:由表中数据直观分析,收看新闻节目的观众是否与年龄有关;________(填“是”或“否”)【知识点:独立性检验】解:是11. 为了了解少年儿童的肥胖是否与常喝碳酸饮料有关,现对30名六年级学生进行了问卷调查得到如下列联表:(平均每天喝500ml以上为常喝,体重超过50kg为肥胖)已知在30人中随机抽取一人,抽到肥胖的学生的概率为154. (1)请将上面的列联表补充完整(2)是否有99.5%的把握认为肥胖与常喝碳酸饮料有关?说明你的理由 参考数据:)(02k K P ≥0.50 0.40 0.25 0.15 0.10 0.05 0.025 0.010 0.005 0.0010k0.455 0.708 1.323 2.072 2.706 3.841 5.024 6.635 7.879 10.828(参考公式:))()()(()(22d b c a d c b a bd ac n K ++++-=,其中d c b a n +++=)【知识点:独立性检验,古典概型】解:(1)设常喝碳酸饮料肥胖的学生有x 人,154302=+x ,6=x 常喝 不常喝 总计 肥胖 6 2 8 不肥胖 4 18 总计102030(2)由已知数据可求得: 879.7523.82>≈K ,因此有99.5%的把握认为肥胖与常喝碳酸饮料有关.12. 某大学高等数学老师这学期分别用B A ,两种不同的教学方式试验甲、乙两个大一新班(人数均为60人,入学数学平均分数和优秀率都相同;勤奋程度和自觉性都一样).现随机抽取甲、乙两班各20名的高等数学期末考试成绩,得到茎叶图:(1)依茎叶图判断哪个班的平均分高?(2)现从甲班高等数学成绩不得低于80分的同学中随机抽取两名同学,求成绩为86分的同学至少有一个被抽中的概率;(3)学校规定:成绩不低于85分的为优秀,请填写下面的2×2列联表,并判断“能否在犯错误的概率不超过0.025的前提下认为成绩优秀与教学方式有关”.下面临界值表仅供参考:)(02k K P ≥0.50 0.40 0.25 0.15 0.10 0.05 0.025 0.010 0.005 0.001 0k0.4550.7081.3232.0722.7063.8415.0246.6357.87910.828(参考公式:))()()(()(22d b c a d c b a bd ac n K ++++-=,其中d c b a n +++=)【知识点:独立性检验,简单抽样,概率】解(1)甲班高等数学成绩集中于60-90分之间,而乙班数学成绩集中于80-100分之间,所以乙班的平均分高.(2)记成绩为86分的同学为A,B ,其他不低于80分的同学为C,D,E,F“从甲班高等数学成绩不得低于80分的同学中随机抽取两名同学”的一切可能结果组成的基本事件有:(A,B)、(A,C)、(A,D)、(A,E)、(A,F)、(B,C)、(B,D)、(B,E)、(B,F)、(C,D)、(C,E)、(C,F)、(D,E)、(D,F)、(E,F)一共15个.“抽到至少有一个86分的同学”所组成的基本事件有:(A,B)、(A,C)、(A,D)、(A,E)、(A,F)、(B,C)、(B,D)、(B,E)、(B,F)共9个,故93155P ==. (3)2240(3101017) 5.584 5.024********K ⨯⨯-⨯=≈>⨯⨯⨯,因此在犯错误的概率不超过0.025的前提下可以认为成绩优秀与教学方式有关. 数学视野在实际问题中,经常会面临需要推断的问题,比说研制出一种新药,需要推断此药是否有效;有人怀疑吸烟的人更易患肺癌,需要推断患肺癌是否与吸烟有关;等等.在对类似问题作出推断时,我们不能仅凭主观意愿得出结论,需要通过试验来手机数据,并依据独立性检验的原理作出合理的推断.。
人教新课标版数学高二人教A选修2-3教案 独立性检验的基本思想及其初步应用(讲)
3.2.2独立性检验的基本思想及其初步应用教学目标通过对典型案例的探究,进一步巩固独立性检验的基本思想、方法,并能运用K 2进行独立性检验.教学重点:独立性检验的基本方法 教学难点:基本思想的领会及方法应用 教学过程 一.学生活动练习:(1)某大学在研究性别与职称(分正教授、副教授)之间是否有关系,你认为应该收集哪些数据?女教授人数,男教授人数,女副教授人数,男副教授人数。
(2)某高校“统计初步”课程的教师随机调查了选该课的一些学生情况,具体数据如下表:K 2250(1320107) 4.84423272030⨯⨯-⨯=≈⨯⨯⨯,∵K 2 3.841≥,所以判定主修统计专业与性别有关系,那么这种判断出错的可能性为.(答案:5%) 附:临界值表(部分):二.数学运用例1为考察高中生的性别与是否喜欢数学课程之间的关系,在某城市的某校高中生中随机抽取300名学生,得到如下列联表: 由表中数据计算得到K 的观察值 4.514k ≈. 在多大程度上可以认为高中生的性别与是否数学课程之间有关系?为什么?(学生自练,教师总结)强调:①使得2( 3.841)0.05P K ≥≈成立的前提是假设“性别与是否喜欢数学课程之间没有关系”.如果这个前提不成立,上面的概率估计式就不一定正确;②结论有95%的把握认为“性别与喜欢数学课程之间有关系”的含义;③在熟练掌握了两个分类变量的独立性检验方法之后,可直接计算2K 的值解决实际问题,而没有必要画相应的图形,但是图形的直观性也不可忽视.例2、为研究不同的给药方式(口服或注射)和药的效果(有效与无效)是否有关,进行了相应的抽样调查,调查结果如表所示。
根据所选择的193个病人的数据,能否作出药的效果与给药方式有关的结论?有效 无效 合计 口服 58 40 98 注射 64 31 95 合计12271193分析:在口服的病人中,有59%98≈的人有效;在注射的病人中,有67%95≈的人有效。
人教版高中数学选修2-3 教学案:3.2 独立性检验的基本思想及其初步应用
独立性检验的基本思想及其初步应用预习课本P91~96,思考并完成以下问题1.分类变量与列联表分别是如何定义的?2.独立性检验的基本思想是怎样的?3.独立性检验的常用方法有哪些?[新知初探]1.与列联表相关的概念(1)分类变量:变量的不同“值”表示个体所属的不同类型,像这样的变量称为分类变量.(2)列联表:①列出的两个分类变量的频数表,称为列联表.②一般地,假设有两个分类变量X和Y,它们的取值分别为{x1,x2}和{y1,y2},其样本频数列联表(称为2×2列联表)为:在2×2列联表中,如果两个分类变量没有关系,则应满足ad-bc≈0, 因此|ad-bc|越小,关系越弱;|ad-bc|越大,关系越强.2.等高条形图等高条形图与表格相比,图形更能直观地反映出两个分类变量间是否相互影响,常用等高条形图展示列表数据的频率特征.3.独立性检验的基本思想(1)定义:利用随机变量K2来判断“两个分类变量有关系”的方法称为独立性检验.(2)公式:K2=n ad-bc2a+b c+d a+c b+d,其中n=a+b+c+d为样本容量.[小试身手]1.判断下列命题是否正确.(正确的打“√”,错误的打“×”)(1)分类变量中的变量与函数中的变量是同一概念.()(2)列联表频率分析法、等高条形图可初步分析两分类变量是否有关系,而独立性检验中K2取值则可通过统计表从数据上说明两分类变量的相关性的大小.()(3)独立性检验的方法就是反证法.()答案:(1)×(2)√(3)×2.与表格相比,能更直观地反映出相关数据总体状况的是()A.列联表B.散点图C.残差图D.等高条形图答案:D3.如果有99%的把握认为“X与Y有关系”,那么具体算出的数据满足()附表:A.k>6.635 B.k>5.024C.k>7.879 D.k>3.841答案:A4.下面是一个2×2列联表:则表中a,b的值分别为________.答案:52, 54[典例]液作尿棕色素定性检查,结果如下:铅中毒病人与尿棕色素为阳性是否有关系?[解]等高条形图如图所示:其中两个浅色条的高分别代表铅中毒病人和对照组样本中尿棕色素为阳性的频率.由图可以直观地看出铅中毒病人与对照组相比,尿棕色素为阳性的频率差异明显,因此铅中毒病人与尿棕色素为阳性有关系.,在等高条形图中,可以估计满足条件X=x1的个体中具有Y=y1的个体所占的比例aa+b.两个比例的值相差也可以估计满足条件X=x2的个体中具有Y=y1的个体所占的比例cc+d越大,X与Y有关系成立的可能性就越大.[活学活用]某学校对高三学生作了一项调查发现:在平时的模拟考试中,性格内向的学生426人中有332人在考前心情紧张,性格外向的学生594人中有213人在考前心情紧张,作出等高条形图,利用图形判断考前心情紧张与性格类别是否有关系.解:作列联表如下:相应的等高条形图如图所示:图中阴影部分表示考前心情紧张与考前心情不紧张中性格内向的比例,从图中可以看出考前紧张的样本中性格内向占的比例比考前心情不紧张样本中性格内向占的比例高,可以认为考前紧张与性格类型有关.两个变量的独立性检验[典例]为了探究学生选报文、理科是否与对外语的兴趣有关,某同学调查了361名高二在校学生,调查结果如下:理科对外语有兴趣的有138人,无兴趣的有98人,文科对外语有兴趣的有73人,无兴趣的有52人.能否在犯错误的概率不超过0.1的前提下,认为“学生选报文、理科与对外语的兴趣有关”?[解]根据题目所给的数据得到如下列联表:理科文科总计有兴趣13873211无兴趣9852150总计236125361根据列联表中数据由公式计算得随机变量K2的观测值k=361××52-73×2211×150×236×125≈1.871×10-4.因为1.871×10-4<2.706,所以在犯错误的概率不超过0.1的前提下,不能认为“学生选报文、理科与对外语的兴趣有关”.独立性检验的步骤(1)确定分类变量,获取样本频数,得到列联表.(2)根据实际问题的需要确定容许推断“两个分类变量有关系”犯错误概率的上界α,然后查表确定临界值k0.(3)利用公式K2=n ad-bc2a+b c+d a+c b+d计算随机变量K2的观测值k0.(4)作出判断.如果k≥k0,就推断“X与Y有关系”,这种推断犯错误的概率不超过α,否则就认为在犯错误的概率不超过α的前提下不能推断“X与Y的关系”,或者在样本数据中没有发现足够证据支持结论“X与Y有关系”.[活学活用]在对人们的休闲方式的一次调查中,共调查了124人,其中女性70人,男性54人.女性中有43人主要的休闲方式是看电视,另外27人主要的休闲方式是运动;男性中有21人主要的休闲方式是看电视,另外33人主要的休闲方式是运动.(1)根据以上数据建立一个2×2的列联表;并估计,以运动为主的休闲方式的人的比例;(2)能否在犯错误的概率不超过0.025的前提下,认为性别与休闲方式有关系?附表:P(K2≥k0)0.500.400.250.150.100.050.0250.0100.0050.001k00.4550.7081.3232.0722.7063.8415.0246.6357.87910.8 28K2=n() ad-bc2()a+b()c+d()a+c()b+d.解:(1)由所给的数据得到列联表休闲方式性别看电视运动总计女432770男213354总计6460124 所以以运动为主要的休闲方式的人的比例为15∶31.(2)根据列联表中的数据计算得随机变量K2的观测值,k=124××33-27×270×54×64×60≈6.201,因为k>5.024,所以在犯错误的概率不超过0.025的前提下认为休闲方式与性别有关.独立性检验的综合应用[典例]某中学将100名高一新生分成水平相同的甲、乙两个“平行班”,每班50人.陈老师采用A,B两种不同的教学方式分别在甲、乙两个班级进行教改实验.为了解教学效果,期末考试后,陈老师分别从两个班级中各随机抽取20名学生的成绩进行统计,作出茎叶图如图.记成绩不低于90分者为“成绩优秀”.(1)在乙班样本的20个个体中,从不低于86分的成绩中随机抽取2个,求抽出的两个均“成绩优秀”的概率;(2)由以上统计数据作出列联表,并判断能否在犯错误的概率不超过0.1的前提下认为:“成绩优秀”与教学方式有关.[解](1)由题意知本题是一个等可能事件的概率,试验发生包含的事件是从不低于86分的成绩中随机抽取两个包含的基本事件是:(86,93), (86,96), (86,97), (86,99), (86,99), (93,96),(93,97), (93,99), (93,99), (96,97), (96,99), (96,99),(97,99),(97,99),(99,99),共有15种结果,符合条件的事件数(93,96),(93,97),(93,99),(93,99),(96,97),(96,99),(96,99),(97,99),(97,99),(99,99),共有10种结果,根据等可能事件的概率得到P=1015=2 3.(2)由已知数据得甲班乙班总计成绩优秀15 6成绩不优秀191534总计202040 根据列联表中的数据,计算得随机变量K2的观测值k=-26×34×20×20≈3.137,由于3.137>2.706,所以在犯错误的概率不超过0.1的前提下认为:“成绩优秀”与教学方式有关.(1)独立性检验问题是常与统计、概率相结合,解题时一定要认真审题,找出各数据的联系.(2)解决独立性检验的应用问题,一定要按照独立性检验的步骤得出结论.[活学活用]某市教育局邀请教育专家深入该市多所中小学,开展听课、访谈及随堂检测等活动,他们把收集到的180节课分为三类课堂教学模式,教师主讲的为A 模式,少数学生参与的为B 模式,多数学生参与的为C 模式,A ,B ,C 三类课的节数比例为3∶2∶1.(1)为便于研究分析,教育专家将A 模式称为传统课堂模式,B ,C 统称为新课堂模式,根据随堂检测结果,把课堂教学效率分为高效和非高效,根据检测结果统计得到如下2×2列联表(单位:节)请根据统计数据回答:有没有99%的把握认为课堂教学效率与教学模式有关?并说明理由.(2)教育专家采用分层抽样的方法从收集到的180节课中选出12节课作为样本进行研究,并从样本中的B 模式和C 模式课堂中随机抽取2节课,求至少有一节课为C 模式课堂的概率.参考临界值有:参考公式:K 2=n ad -bc 2a +bc +d a +cb +d,其中n =a +b +c +d .解:(1)由列联表中的统计数据计算随机变量K 2的观测值为: ∵k =180××50-40×2100×80×90×90=9>6.635,由临界值表P (K 2≥6.635)≈0.010,∴有99%的把握认为课堂效率与教学模式有关.(2)样本中的B 模式课堂和C 模式课堂分别是4节和2节.从中任取两节有C 26=15种取法,其中至少有一节课为C 模式课堂取法有C 26-C 24=9种,∴至少有一节课为C 模式课堂的概率为915=35.层级一 学业水平达标1.以下关于独立性检验的说法中, 错误的是( ) A .独立性检验依赖于小概率原理 B .独立性检验得到的结论一定准确C .样本不同,独立性检验的结论可能有差异D .独立性检验不是判断两事物是否相关的唯一方法解析:选B 根据独立性检验的原理可知得到的结论是错误的情况是小概率事件,但并不一定是准确的.2.观察下列各图,其中两个分类变量之间关系最强的是( )解析:选D 在四幅图中,D 图中两个阴影条的高相差最明显,说明两个分类变量之间关系最强,故选D .3.在列联表中,下列哪两个比值相差越大,两个分类变量有关系的可能性就越大( ) A .a a +b 与d c +d B .c a +b 与a c +dC .a a +b 与c c +dD .a a +b 与c b +c解析:选C 由等高条形图可知a a +b 与cc +d的值相差越大,|ad -bc |就越大,相关性就越强.4.对于分类变量X 与Y 的随机变量K 2的观测值k ,下列说法正确的是( ) A .k 越大,“X 与Y 有关系”的可信程度越小 B .k 越小,“X 与Y 有关系”的可信程度越小 C .k 越接近于0,“X 与Y 没有关系”的可信程度越小 D .k 越大,“X 与Y 没有关系”的可信程度越大解析:选B K 2的观测值k 越大,“X 与Y 有关系”的可信程度越大.因此,A 、C 、D 都不正确.5.考察棉花种子经过处理跟生病之间的关系得到下表数据:A.种子是否经过处理跟是否生病有关B.种子是否经过处理跟是否生病无关C.种子是否经过处理决定是否生病D.以上都是错误的解析:选B由K2=407××213-61×293×314×133×274≈0.164<2.706,即没有把握认为是否经过处理跟是否生病有关.6.在一项打鼾与患心脏病的调查中,共调查了1 671人,经过计算K2的观测值k=27.63,根据这一数据分析,我们有理由认为打鼾与患心脏病是________的.(填“有关”或“无关”)解析:∵K2的观测值k=27.63,∴k>10.828,∴在犯错误的概率不超过0.001的前提下认为打鼾与患心脏病是有关的.答案:有关7.如果根据性别与是否爱好运动的列联表得到K2≈3.852>3.841,则判断性别与是否爱好运动有关,那么这种判断犯错的可能性不超过________.解析:∵P(K2≥3.841)≈0.05.∴判断性别与是否爱好运动有关,出错的可能性不超过5%.答案:5%8.统计推断,当________时,在犯错误的概率不超过0.05的前提下认为事件A与B 有关;当________时,认为没有充分的证据显示事件A与B是有关的.解析:当k>3.841时,就有在犯错误的概率不超过0.05的前提下认为事件A与B 有关,当k≤2.706时认为没有充分的证据显示事件A与B是有关的.答案:k>3.841k≤2.7069.为了调查胃病是否与生活规律有关,在某地对540名40岁以上的人进行了调查,结果是:患胃病者生活不规律的共60人,患胃病者生活规律的共20人,未患胃病者生活不规律的共260人,未患胃病者生活规律的共200人.(1)根据以上数据列出2×2列联表;(2)在犯错误的概率不超过0.01的前提下认为40岁以上的人患胃病与否和生活规律有关系吗?为什么?解:(1)由已知可列2×2列联表:(2)k =540××260-200×2220×320×80×460≈9.638.∵9.638>6.635,因此,在犯错误的概率不超过0.01的前提下认为40岁以上的人患胃病与否和生活规律有关.10.为了解某班学生喜爱打篮球是否与性别有关,对本班50人进行了问卷调查得到了如下的列联表:已知在全部50人中随机抽取1人抽到爱打篮球的学生的概率为35.(1)请将上面的列联表补充完整;(2)是否有99.5%的把握认为喜爱打篮球与性别有关;请说明理由. 附参考公式:K 2=n ad -bc 2a +bc +d a +cb +d,其中n =a +b +c +d .解:(1)列联表补充如下:(2)∵K 2=50××15-10×230×20×25×25≈8.333>7.879,∴有99.5%的把握认为喜爱打篮球与性别有关.层级二 应试能力达标1.在第29届北京奥运会上,中国健儿取得了51金、21银、28铜的好成绩,稳居金牌榜榜首,由此许多人认为中国进入了世界体育强国之列,也有许多人持反对意见,有网友为此进行了调查,在参加调查的2 548名男性中有1 560名持反对意见,2 452名女性中有1 200名持反对意见,在运用这些数据说明性别对判断“中国进入了世界体育强国之列”是否有关系时,用什么方法最有说服力()A.平均数与方差B.回归直线方程C.独立性检验D.概率解析:选C由于参加调查的人按性别被分成了两组,而且每一组又被分成了两种情况,判断有关与无关,符合2×2列联表的要求,故用独立性检验最有说服力.2.对于独立性检验,下列说法正确的是()A.K2>3.841时,有95%的把握说事件A与B无关B.K2>6.635时,有99%的把握说事件A与B有关C.K2≤3.841时,有95%的把握说事件A与B有关D.K2>6.635时,有99%的把握说事件A与B无关解析:选B由独立性检验的知识知:K2>3.841时,有95%的把握认为“变量X与Y 有关系”;K2>6.635时,有99%的把握认为“变量X与Y有关系”.故选项B正确.3.想要检验是否喜欢参加体育活动是不是与性别有关,应该检验()A.H0:男性喜欢参加体育活动B.H0:女性不喜欢参加体育活动C.H0:喜欢参加体育活动与性别有关D.H0:喜欢参加体育活动与性别无关解析:选D独立性检验假设有反证法的意味,应假设两类变量(而非变量的属性)无关,这时的K2应该很小,如果K2很大,则可以否定假设,如果K2很小,则不能够肯定或者否定假设.4.春节期间,“厉行节约,反对浪费”之风悄然吹开,某市通过随机询问100名性别不同的居民是否能做到“光盘”,得到如下的列联表:由此表得到的正确结论是()A.在犯错误的概率不超过0.01的前提下,认为“该市居民能否做到‘光盘’与性别有关”B.在犯错误的概率不超过0.01的前提下,认为“该市居民能否做到‘光盘’与性别无关”C.在犯错误的概率不超过0.1的前提下,认为“该市居民能否做到‘光盘’与性别有关”D.在犯错误的概率不超过0.1的前提下,认为“该市居民能否做到‘光盘’与性别无关”解析:选C由2×2列联表得到a=45,b=10,c=30,d=15.则a+b=55,c+d=45,a+c=75,b+d=25,ad=675,bc=300,n=100.代入K2=n ad-bc2a+b c+d a+c b+d,得K2的观测值k=100×-255×45×75×25≈3.030.因为2.706<3.030<3.841.所以在犯错误的概率不超过0.1的前提下认为“该市居民能否做到‘光盘’与性别有关”.5.若两个分类变量X与Y的列联表为:则“X与Y之间有关系”这个结论出错的可能性为________.解析:由题意可得K2的观测值k=+15+40+××16-40×2+×+×+×+≈7.227,∵P(K2≥6.635)≈1%, 所以“x与y之间有关系”出错的可能性为1%.答案:1%6.对196个接受心脏搭桥手术的病人和196个接受血管清障手术的病人进行了3年的跟踪研究,调查他们是否又发作过心脏病,调查结果如下表所示:差别的结论________(填“能”或“不能”).解析:根据列联表中的数据,可以求得K2的观测值k=392××167-29×2 68×324×196×196≈1.779.K2<2.072的概率为0.85.作出这两种手术对病人又发作心脏病的影响有差别的结论.答案:1.779不能7.甲、乙两机床加工同一种零件,抽检得到它们加工后的零件尺寸x(单位:cm)及个数y,如下表:由表中数据得y关于x的线性回归方程为y=-91+100x(1.01≤x≤1.05),其中合格零件尺寸为1.03±0.01(cm).完成下面列联表,并判断是否有99%的把握认为加工零件的质量与甲、乙有关?解:x=1.03,y=a+495,由y^=-91+100x知,a+495=-91+100×1.03,所以a=11,由于合格零件尺寸为1.03±0.01 cm,故甲、乙加工的合格与不合格零件的数据表为:所以K2=n ad-bca+b c+d a+c b+d=60××18-6×230×30×36×24=10,因K2=10>6.635,故有99%的把握认为加工零件的质量与甲、乙有关.8.某大学餐饮中心为了解新生的饮食习惯,在全校一年级学生中进行了抽样调查,调查结果如下表所示:(1)习惯方面有差异”;(2)已知在被调查的北方学生中有5名数学系的学生,其中2名喜欢甜品.现在从这5名学生中随机抽取3人,求至多有1人喜欢甜品的概率.解:(1)将2×2列联表中的数据代入公式计算,得 K 2=100××10-20×270×30×80×20=10021≈4.762. 由于4.762>3.841,所以有95%的把握认为“南方学生和北方学生在选用甜品的饮食习惯方面有差异”.(2)从5名数学系学生中任取3人的一切可能结果所组成的基本事件空间Ω={(a 1,a 2,b 1),(a 1,a 2,b 2),(a 1,a 2,b 3),(a 1,b 1,b 2),(a 1,b 1,b 3),(a 1,b 2,b 3),(a 2,b 1,b 2),(a 2,b 1,b 3),(a 2,b 2,b 3),(b 1,b 2,b 3)}.(其中a i 表示喜欢甜品的学生,i =1,2.b j 表示不喜欢甜品的学生,j =1,2,3)Ω由10个基本事件组成,且这些基本事件的出现是等可能的.用A 表示“3人中至多有1人喜欢甜品”这一事件,则A ={(a 1,b 1,b 2),(a 1,b 1,b 3),(a 1,b 2,b 3),(a 2,b 1,b 2),(a 2,b 1,b 3),(a 2,b 2,b 3),(b 1,b 2,b 3)}.事件A 是由7个基本事件组成,因而P (A )=710.(时间120分钟 满分150分)一、选择题(本大题共12小题,每小题5分,共60分.在每小题给出的四个选项中,只有一项是符合题目要求的)1.对有线性相关关系的两个变量建立的回归直线方程y ^=a ^+b ^x 中,回归系数b ^( ) A .可以小于0 B .大于0 C .能等于0D .只能小于0解析:选A ∵b ^=0时,则r =0,这时不具有线性相关关系,但b ^可以大于0也可以小于0.2.每一吨铸铁成本y (元)与铸件废品率x %建立的回归方程y ^=56+8x ,下列说法正确的是( )A .废品率每增加1%,成本每吨增加64元B .废品率每增加1%,成本每吨增加8%C .废品率每增加1%,成本每吨增加8元D .如果废品率增加1%,则每吨成本为56元解析:选C 根据回归方程知y 是关于x 的单调增函数,并且由系数知x 每增加一个单位,y 平均增加8个单位.3.下表显示出样本中变量y 随变量x 变化的一组数据,由此判断它最可能是( )A .线性函数模型B .二次函数模型C .指数函数模型D .对数函数模型解析:选A 画出散点图(图略)可以得到这些样本点在某一条直线上或该直线附近,故最可能是线性函数模型.4.试验测得四组(x ,y )的值为(1,2),(2,3),(3,4),(4,5),则y 与x 之间的回归直线方程为( )A .y ^=x +1B . y ^=x +2 C .y ^=2x +1 D .y ^=x -1解析:选A 由题意发现,(x ,y )的四组值均满足y ^=x +1,故y ^=x +1为回归直线方程.5.下列关于等高条形图说法正确的是( ) A .等高条形图表示高度相对的条形图 B .等高条形图表示的是分类变量的频数 C .等高条形图表示的是分类变量的百分比 D .等高条形图表示的是分类变量的实际高度 解析:选C 由等高条形图的特点及性质进行判断.6.根据一组样本数据(x 1,y 1),(x 2,y 2),…,(x n ,y n )的散点图分析存在线性相关关系,求得其回归方程y ^=0.85x -85.7,则在样本点(165,57)处的残差为( )A .54.55B .2.45C .3.45D .111.55解析:选B 把x =165代入y ^=0.85x -85.7,得y =0.85×165-85.7=54.55,由57-54.55=2.45,故选B .7.有甲、乙两个班级进行数学考试,按照大于等于85分为优秀,85分以下为非优秀统计成绩,得到如下所示的列联表:已知在全部105人中随机抽取1人,成绩优秀的概率为27,则下列说法正确的是( )A .列联表中c 的值为30,b 的值为35B .列联表中c 的值为15,b 的值为50C .根据列联表中的数据,若按95%的可靠性要求,能认为“成绩与班级有关系”D .根据列联表中的数据,若按95%的可靠性要求,不能认为“成绩与班级有关系” 解析:选C 由题意知,成绩优秀的学生数是30,成绩非优秀的学生数是75,所以c =20,b =45,选项A 、B 错误.根据列联表中的数据,得到K 2=105××30-20×255×50×30×75≈6.109>3.841,因此有95%的把握认为“成绩与班级有关系”,选项C 正确.8.某考察团对全国10大城市进行职工人均工资水平x (千元)与居民人均消费水平y (千元)统计调查,y 与x 具有相关关系,回归方程为y ^=0.66x +1.562,若某城市居民人均消费水平为7.675千元,估计该城市人均消费额占人均工资收入的百分比约为( )A .83%B .72%C .67%D .66%解析:选A 将y =7.675代入回归方程,可计算得x ≈9.262,所以该城市人均消费额占人均工资收入的百分比约为7.675÷9.262≈0.83≈83%,即约为83%.9.为了研究男子的年龄与吸烟的关系,抽查了100个男子,按年龄超过和不超过40岁,吸烟量每天多于和不多于20支进行分组,如下表:则在犯错误的概率不超过__________的前提下认为吸烟量与年龄有关( ) A .0.001 B .0.01 C .0.05 D .没有理由解析:选A K 2=100××25-10×265×35×60×40≈22.16>10.828,所以我们在犯错误的概率不超过0.001的前提下认为吸烟量与年龄有关.10.为了考察两个变量x 和y 之间的线性相关性,甲、乙两个同学各自独立做了10次和15次试验,并且利用线性回归方法,求得回归直线为l1和l2,已知在两人的试验中发现对变量x的观测数据的平均值恰好相等,都为s,对变量y的观测数据的平均值也恰好相等,都为t,那么下列说法正确的是()A.直线l1和直线l2有交点(s,t)B.直线l1和直线l2相交,但交点未必是点(s,t)C.直线l1和直线l2由于斜率相等,所以必定平行D.直线l1和直线l2必定重合解析:选A l1与l2都过样本中心(x,y).11.假设有两个分类变量X和Y,它们的可能取值分别为{x1,x2}和{y1,y2},其2×2列联表如下:() A.a=9,b=8,c=7,d=6B.a=9,b=7,c=6,d=8C.a=8,b=6,c=9,d=7D.a=6,b=7,c=8,d=9解析:选B对于同一样本|ad-bc|越小,说明X与Y之间的关系越弱,|ad-bc|越大,故检验知选B.12.两个分类变量X和Y, 值域分别为{x1,x2}和{y1,y2}, 其样本频数分别是a=10, b =21, c+d=35.若X与Y有关系的可信程度不小于97.5%, 则c等于() A.3 B.4C.5 D.6解析:选A列2×2列联表如下:故K2的观测值k=66×-c-21c]31×35×+c-c≥5.024.把选项A, B, C, D代入验证可知选A.二、填空题(本大题共4小题,每小题5分,共20分.请把正确答案填在题中的横线上)13.已知某车间加工零件的个数x 与所花费时间y (h)之间的线性回归方程为y ^=0.01x +0.5,则加工600个零件大约需要________h .解析:当x =600时,y ^=0.01×600+0.5=6.5. 答案:6.514.若一组观测值(x 1,y 1),(x 2,y 2),…,(x n ,y n )之间满足y i =bx i +a +e i (i =1,2,…,n ),若e i 恒为0,则R 2为________.解析:e i 恒为0,说明随机误差总为0,于是y i =y ^,故R 2=1. 答案:115.下列是关于出生男婴与女婴调查的列联表那么A =______,B =______,C ______,D =________,E =________. 解析:∵45+E =98,∴E =53,∵E +35=C ,∴C =88,∵98+D =180,∴D =82, ∵A +35=D ,∴A =47,∵45+A =B ,∴B =92. 答案:47 92 88 82 5316.已知x ,y 之间的一组数据如表,对于表中数据,甲、乙两同学给出的拟合直线分别为l 1:y =13x +1与l 2:y =12x +12,利用最小二乘法判断拟合程度更好的直线是________.解析:用y =13x +1作为拟合直线时,所得y 的实际值与y 的估计值的差的平方和为:S 1=⎝⎛⎭⎫1-432+(2-2)2+(3-3)2+⎝⎛⎭⎫4-1032+⎝⎛⎭⎫5-1132=73.用y =12x +12作为拟合直线时,所得y 的实际值与y 的估计值的差的平方和为:S 2=(1-1)2+(2-2)2+⎝⎛⎭⎫3-722+(4-4)2+⎝⎛⎭⎫5-922=12.因为S 2<S 1,故用直线l 2:y =12x +12,拟合程度更好.答案:y =12x +12三、解答题(本大题共6小题,共70分,解答时写出必要的文字说明、证明过程或演算步骤)17.(本小题满分10分)对某校小学生进行心理障碍测试得如下列联表:(其中焦虑、说谎、懒惰都是心理障碍)试说明在这三种心理障碍中哪一种与性别关系最大?解:对于上述三种心理障碍分别构造三个随机变量K 21,K 22,K 23,由表中数据可得K 21=110××60-25×230×80×25×85≈0.863,K 22=110××70-20×230×80×20×90≈6.366,K 23=110××30-15×230×80×65×45≈1.410.因为K 22的值最大,所以说谎与性别关系最大.18.(本小题满分12分)有人统计一个省的6个城市某一年的人均国内生产总值(人均GDP)x 和这一年各城市患白血病的儿童数量y ,其数据如下表所示:(1)画出散点图,并判断是否线性相关; (2)求y 与x 之间的回归方程. 解:(1)作散点图(如下图所示).由散点图可知y 与x 具有线性相关关系.(2)将数据代入公式,可得b ^≈23.253,a ^≈102.151.故y 与x 之间的线性回归方程是y ^=23.253x +102.151.19.(本小题满分12分)某校在两个班进行教学方式对比试验,两个月后进行了一次检测,试验班与对照班成绩统计如下表所示(单位:人):(1)求m ,n ;(2)能否在犯错误的概率不超过0.005的情况下认为教学方式与成绩有关系? 解:(1)m =45-15=30,n =50+50=100. (2)由表中的数据,得K 2的观测值为 k =100××30-15×250×50×55×45≈9.091.因为9.091>7.879,所以能在犯错误的概率不超过0.005的前提下认为教学方式与成绩有关系.20.(本小题满分12分)某工厂用甲、乙两种不同工艺生产一大批同一种零件,零件尺寸均在[21.7,22.3](单位:cm)之间,把零件尺寸在[21.9,22.1)的记为一等品,尺寸在[21.8,21.9)∪[22.1,22.2)的记为二等品,尺寸在[21.7,21.8)∪[22.2,22.3]的记为三等品,现从甲、乙工艺生产的零件中各随机抽取100件产品,所得零件尺寸的频率分布直方图如图所示:(1)根据上述数据完成下列2×2列联表,根据此数据你认为选择不同的工艺与生产出一等品是否有关?附:K2=n ad-bc2a+b c+d a+c b+d(2)以上述各种产品的频率作为各种产品发生的概率,若一等品、二等品、三等品的单件利润分别为30元、20元、15元,你认为以后该工厂应该选择哪种工艺生产该种零件?请说明理由.解:(1)2×2列联表如下K2=200××40-60×2110×90×100×100≈2.02<2.706,所以没有理由认为选择不同的工艺与生产出一等品有关.(2)由题知运用甲工艺生产单件产品的利润X的分布列为X的数学期望为E(X)=30×0.5+20×0.3+15×0.2=24,X的方差为D(X)=(30-24)2×0.5+(20-24)2×0.3+(15-24)2×0.2=39.乙工艺生产单件产品的利润Y的分布列为Y的数学期望为E(Y)=30×0.6+20×0.1+15×0.3=24.5,Y的方差为D(Y)=(30-24.5)2×0.6+(20-24.5)2×0.1+(15-24.5)2×0.3=47.25.由上述结果可以看出D(X)<D(Y),即甲工艺波动小,虽然E(X)<E(Y),但相差不大,所以以后选择甲工艺.21.(本小题满分12分)为调查某地区老年人是否需要志愿者提供帮助,用简单随机抽样的方法从该地区调查了500位老年人,结果如下:附:K2的观测值k=n ad-bc2a+b c+d a+c b+d.(1)估计该地区老年人中,需要志愿者提供帮助的老年人的比例;(2)在犯错误的概率不超过0.01的前提下是否可认为该地区的老年人是否需要志愿者提供帮助与性别有关?(3)根据(2)的结论,能否提出更好的调查方法来估计该地区的老年人中,需要志愿者提供帮助的老年人的比例?请说明理由.解:(1)调查的500位老人中有70位需要志愿者提供帮助,因此该地区老年人中,需要帮助的老年人的比例的估算值为70500=14%.(2)随机变量K2的观测值k=500××270-30×2200×300×70×430≈9.967.由于9.967>6.635,因此,在犯错误的概率不超过0.01的前提下认为该地区的老年人是否需要志愿者提供帮助与性别有关.(3)由(2)的结论知,该地区的老年人是否需要帮助与性别有关,并且从样本数据中能看出该地区男性老年人与女性老年人中需要帮助的比例有明显差异,因此在调查时,先确定该地区老年人中男、女的比例,再把老年人分成男、女两层,并且采用分层抽样方法比采用简单随机抽样的方法更好.22.(本小题满分12分)某市为了对学生的数理(数学与物理)学习能力进行分析,从10 000名学生中随机抽出100位学生的数理综合学习能力等级分数(6分制)作为样本,分数频数分布如下表:。
高中数学选修2-3优质三段式学案2:3.2 独立性检验的基本思想及其初步应用
3.2 独立性检验的基本思想及其初步应用一、学习目标通过探究“秃顶是否与患心脏病有关系”引出独立性检验的问题,并借助样本数据的列联表、条形图展示患心脏病的秃顶比例比患其它病的秃顶比例高,让学生亲身体验独立性检验的实施步骤与必要性. 二、学习过程 1. 分类变量:. 2. 22 列联表:. 3. 统计量2K :.4.探究:吸烟与患肺癌的关系 第一步:提出假设检验问题 H 0:第二步:根据公式求2K 观测值 k =(它越小,原假设“H 0:吸烟与患肺癌没有关系”成立的可能性越;它越大,备择假设“H 1:” 成立的可能性越大.) 第三步:查表得出结论例1. 吃零食是中学生中普遍存在的现象,吃零食对学生身体发育有诸多不利影响,影响学生的健康成长.下表是性别与吃零食的列联表:例2.某校对学生课外活动进行调查,结果整理成下表:试用你所学过的知识进行分析,能否在犯错误的概率不超过0.005的前提下,认为“喜欢体育还是文娱与性别有关系”?例3.某中学共2200名学生中有男生1200名,按男女性别用分层抽样抽出110名学生,询问是否爱好某项运动.已知男生中有40名爱好该项运动,女生中有30名不爱好该项运动.(1)完成如下的列联表:(2)通过计算说明,是否在犯错误的概率不超过0.01的前提下认为“爱好该项运动与性别有关”?四、当堂检测1.某研究小组为了研究中学生的身体发育情况,在某中学随机抽出20名15至16周岁的男生将他们的身高和体重制成2×2列联表,根据列联表中的数据,可以在犯错误的概率不超过的前提下认为该学校15至16周岁的男生的身高和体重之间有关系.2.对某校小学生进行心理障碍测试得到如下的列联表试说明心理障碍与性别的关系:.3.在500个用血清的人身上试验某种血清预防感冒的作用,把一年中的记录与另外500个未用血清的人作比较,得到如下的列联表:由以上数据能否在犯错误的概率不超过0.01的前提下认为血清能对预防感冒起到一定的作用?4.某地区甲校高二年级有1100人,乙校高二年级有900人,为了统计两个学校高二年级在学业水平考试中的数学学科成绩,采用分层抽样的方法在两校共抽取了200名学生的数学成绩,如下表:(已知本次测试合格线是50分,两校合格率均为100%)甲校高二年级数学成绩:乙校高二年级数学成绩:(1)计算x,y的值,并分别估计以上两所学校数学成绩的平均分(精确到1分).(2)若数学成绩不低于80分为优秀,低于80分为非优秀,根据以上统计数据写下面2×2列联表,并回答能否在犯错误的概率不超过0.05的前提下认为“两个学校的数学成绩有差异”?——★ 参 考 答 案 ★——学习过程 1.分类变量变量的不同“值”表示个体所属的不同类别,像这样的变量称为分类变量. 2.2×2列联表一般地,假设有两个分类变量X 和Y ,它们的取值分别为{x 1,x 2}和{y 1,y 2},其样本频数列联表(也称为2×2列联表)为下表.3.K 2=2()()()()()n ad bc a d c d a c b d -++++,其中n =a +b +c +d 为样本容量.4.第一步:H 0:吸烟与患肺癌没有关系第二步:()22996577754942209956.63278172148987491K ⨯-⨯=≈⨯⨯⨯,第三步:2( 6.635)0.01P K ≥≈.说明在H 0成立的情况下,2K 的观测值超过 6. 635 的概率非常小,近似为0 . 01,是一个小概率事件.现在2K 的观测值k ≈56.632 ,远远大于6. 635,所以有理由断定H 0不成立,即认为“吸烟与患肺癌有关系”.但这种判断会犯错误,犯错误的概率不会超过0.01,即我们有99%的把握认为“吸烟与患肺癌有关系” . 例1.解 k =2()()()()()n ad bc a d c d a c b d -++++,把相关数据代入公式,得k =285(5284012)17684540⨯-⨯⨯⨯⨯≈4.722>3.841.因此,在犯错误的概率不超过0.05的前提下,可以认为“喜欢吃零食与性别有关”. 例2.[[解析]]判断方法如下:假设H 0“喜欢体育还是喜欢文娱与性别没有关系”,若H 0成立,则K 2应该很小. ∵a =21,b =23,c =6,d =29,n =79,∴k =2()()()()()n ad bc a b c d a c b d -++++=279(2129236)(2123)(629)(216)(2329)⨯⨯-⨯+⨯+⨯+⨯+≈8.106.且P (2K ≥7.879)≈0.005即我们得到的2K 的观测值k ≈8.106超过7.879,这就意味着:“喜欢体育还是文娱与性别没有关系”这一结论成立的可能性小于0.005,即在犯错误的概率不超过0.005的前提下认为“喜欢体育还是喜欢文娱与性别有关”.例3.[[解析]](1)(2)K2的观测值k=60×50×60×50≈7.8>6.635.所以在犯错误的概率不超过0.01的前提下认为“爱好该项运动与性别有关”.当堂检测:1.[[解析]]根据公式K2=2()()()()()n ad bca b c d a c b d-++++得,K2的观测值k=220(41213)515713⨯⨯-⨯⨯⨯⨯≈5.934,因为k>5.024,因此在犯错误的概率不超过0.025的前提下认为该学校15至16周岁的男生的身高和体重之间有关系.[答案]:0.0252.[[解析]]由表可知,a=10,b=20,c=10,d=70,a+b=30,c+d=80,a+c=20,b+d=90,n=110,ad=700,bc=200,把以上数值代入K2=2()()()()()n ad bca b c d a c b d-++++=2110(700200)30802090⨯-⨯⨯⨯≈6.3657.因为6.3657>5.024,所以在犯错误的概率不超过0.025的前提下认为心理障碍与性别有关系. [答案]:在犯错误的概率不超过0.025的前提下认为心理障碍与性别有关系3.[[解析]]由列联表中的数据得k=21000(252276224248)500500476524⨯⨯-⨯⨯⨯⨯≈3.14.由于3.14<6.635,故不能在犯错误的概率不超过0.01的前提下认为血清对预防感冒有作用.4.[[解析]](1)依题意知甲校应抽取110人,乙校应抽取90人,所以x=10,y=15,估计两个学校的平均分,甲校的平均分为50106525753585309510110⨯+⨯+⨯+⨯+⨯≈75,乙校的平均分为551565307525851595590⨯+⨯+⨯+⨯+⨯≈71.(2)数学成绩不低于80分为优秀,低于80分为非优秀,得到列联表:所以K2的观测值k=2200(40702070)1109060140⨯⨯-⨯⨯⨯⨯≈4.714,又因为4.714>3.841,故能在犯错误的概率不超过0.05的前提下认为“两个学校的数学成绩有差异”.。
选修2-3《独立检验的基本思想及其应用》教案
教材:普通高中课程标准实验教科书数学选修32 人教A版章节:2.3独立性检验的基本思想及其初步应用一、内容和内容解析本节课是人教A版(选修)2—3第三章第二单元第一课时的内容.理论性比较强,很多教师为了图省事,在教学过程中采用学生看书自学的方式,我认为不妥。
结合课本内容,拟用两节课的时间完成整节的教学内容,本节为第一节。
山东省教育厅在2010年9月15日“关于印发山东省普通高中学科教学内容调整意见二、教学目标分析1.目标:①知识与技能目标通过生活中案例的探究,理解独立性检验的基本思想,明确独立性检验的基本步骤,会对两个分类变量进行独立性检验,并能利用独立性检验的基本思想来解决实际问题。
②过程与方法目标通过探究引出独立性检验的问题,借助样本数据的列联表分析独立性检验的实施步骤。
③情感态度价值观目标通过本节课的学习,加强数学与现实生活的联系。
以科学的态度评价两个分类变量有关系的可能性。
培养学生运用所学知识,解决实际问题的能力。
教学中适当地利用学生合作与交流,使学生在学习的同时,体会与他人合作的重要性。
2.目标解析:在学习中通过对统计案例的分析,理解和掌握独立性检验的方法,体会独立性检验的基本思想在解决实际问题的应用,以提高我们处理生活和工作中的某些问题的能力.新课标指出:学生的数学学习内容应当是现实的、有趣的和富有挑战性的。
从心理学的角度看,青少年有一种好奇的心态、探究的心理。
因此,紧紧地抓住学生的这一特征,利用学生身边的问题设计教学情境,使学生在观察、讨论等活动中,逐步提高数学能力。
本节课学生应该了解的几个问题:1、判断两个分类变量是否有关的几种方法及其不同点⑴列联表⑵三维柱形图⑶二维条形图⑷等高条形图⑸独立性检验的思想及应用2、独立性检验的思想与反证法思想的比较3、k2表达式及k2值表的含义三、教学问题诊断分析1.课本上k2的结构比较复杂,来的也比较突然,学生可能会提出疑问.关于这个问题,可借助两件事独立的定义以及样本容量较大时可以用频率近似表示概率来解决。
人教版高中数学选修2-3第三章统计案例3.2独立性检验的基本思想及其初步应用教案(1)
1.2独立性检验的基本思想及其初步应用(第二课时)一.教学目标:1,理解独立性检验的基本思想; 2,理解独立性检验的实施步骤; 3,了解随机变量K 2的含义。
二.教学重点:理解独立性检验的基本思想实施步骤。
教学难点;1、理解独立性检验的基本思想及实施步骤2、了解随机变量K 2的含义。
三.知识链接独立性检验原理: 四.新课学习1. 独立性检验的概念:利用随机变量2K 来确定在多大程度上可以认为“__________”的方法,称为两个分类变量的独立性检验。
2. 独立性检验的步骤:设有两个分类变量X 与Y ,他们的取值分别为 和 其样本频数列联表(称2⨯2列联表)为:引入随机变量2K ,____________________2=K ,(其中d c b a n +++=为样本容量)推断X 与Y 有关系可按下列步骤进行: (1)假设0H : X 与Y 没有关系(2)根据实际问题的需要确定容许推断“两个分类变量有关系”犯错误概率的上界a ,然后查表1-11确定临界值o k(3)利用公式(1),计算随机变量2K 的观测值k 。
(4)如果,就判断“X 与Y 有关系”,这种判断犯错误的概率不超过a ,否则,就认为在犯错误的概率不超过a 的前提下不能推断“X 与Y 有关系”,或则在样本数据中没有发现足够证据支持结论“X 与Y 有关系”, 3. 为了使不同样本容量的数据有统一的评判标准,我们利用统计量2K 的观测值k 来判断x 与y 有关系的程度。
如果828.10>k ,就有_____的把握认为“x 与y 有关系”; 如果879.7>k ,就有_____的把握认为“x 与y 有关系”;如果_____>k ,就有99%的把握认为“x 与y 有关系”; 如果_____>k,就有97.5%的把握认为“x 与y 有关系”;如果841.3>k ,就有_____的把握认为“x 与y 有关系”; 如果706.2>k ,就有_____的把握认为“x 与y 有关系”; 如果706.2≤k,就认为没有充分证据显示“x 与y 有关系” 。
高中数学选修2-3精品教案6:3.2 独立性检验的基本思想及其初步应用教学设计
3.2 独立性检验的基本思想及其初步应用学习目标:1.了解分类变量、2×2列联表、随机变量χ2的意义.2.通过对典型案例的分析,了解独立性检验的基本思想方法.(重点)3.通过对典型案例的分析,了解两个分类变量的独立性检验的应用.(难点) 知识梳理:[基础·初探]教材整理 独立性检验 1.卡方统计量 χ2=nn 11n 22-n 12n 212n 1+n 2+n +1n +2,用χ2的大小可以决定是否拒绝原来的统计假设H 0.如果算出的χ2值较大,就拒绝H 0,也就是拒绝“事件A 与B 无关”,从而就认为它们是有关的了.2.两个临界值(1)当根据具体的数据算出的χ2>3.841时,有95%的把握说事件A 与B 有关; (2)当χ2>6.635时,有99%的把握说事件A 与B 有关,当χ2≤3.841时,认为事件A 与B 是无关的.1.判断(正确的打“√”,错误的打“×”)(1)分类变量中的变量与函数中的变量是同一概念.(×) (2)独立性检验的方法就是反证法.(×)(3)独立性检验中可通过统计表从数据上说明两分类变量的相关性的大小.(√) 2.考察棉花种子经过处理与生病之间的关系,得到下表中的数据:种子处理 种子未处理合计 得病 32 101 133 不得病 61 213 274 合计93314407根据以上数据可得出( )A.种子是否经过处理与是否生病有关B.种子是否经过处理与是否生病无关C.种子是否经过处理决定是否生病D.有90%的把握认为种子经过处理与生病有关 【解析】χ2=407×(32×213-61×101)293×314×133×274≈0.164<0.455,即没有充足的理由认为种子是否经过处理跟生病有关.【答案】 B3.若由一个2×2列联表中的数据计算得χ2=4.013,那么有__________的把握认为两个变量之间有关系.【解析】查阅χ2表知有95%的把握认为两个变量之间有关系.【答案】95%[质疑·手记]预习完成后,请将你的疑问记录,并与“小伙伴们”探讨交流:疑问1:解惑:疑问2:解惑:疑问3:解惑:疑难探究:[小组合作型]用2×2列联表分析两变量间的关系在对人们饮食习惯的一次调查中,共调查了124人,其中六十岁以上的70人,六十岁以下的54人.六十岁以上的人中有43人的饮食以蔬菜为主,另外27人则以肉类为主;六十岁以下的人中有21人的饮食以蔬菜为主,另外33人则以肉类为主.请根据以上数据作出饮食习惯与年龄的列联表,并利用n11n1+与n21n2+判断二者是否有关系.【精彩点拨】对变量进行分类→求出分类变量的不同取值→作出2×2列联表→计算n11n1+与n21n2+的值作出判断【自主解答】饮食习惯与年龄2×2列联表如下:年龄在六十岁以上年龄在六十岁以下合计饮食以蔬菜为主432164 饮食以肉类为主273360 合计7054124 将表中数据代入公式得n11n1+=4364≈0.67,n21n2+=2760=0.45.显然二者数据具有较为明显的差距,据此可以在某种程度上认为饮食习惯与年龄有关系.1.作2×2列联表时,注意应该是4行4列,计算时要准确无误.2.作2×2列联表时,关键是对涉及的变量分清类别.[再练一题]1.上例中条件不变,尝试用|n11n22-n12n21|的大小判断饮食习惯与年龄是否有关.【解】将本例2×2列联表中的数据代入可得|n11n22-n12n21|=|43×33-21×27|=852.相差较大,可在某种程度上认为饮食习惯与年龄有关系.由χ2进行独立性检验某校高三年级在一次全年级的大型考试中,数学成绩优秀和非优秀的学生中,物理、化学、总分也为优秀的人数如下表所示,则我们能否在犯错误的概率不超过0.001的前提下认为数学成绩优秀与物理、化学优秀有关系?物理优秀化学优秀总分优秀数学优秀228225267数学非优秀14315699注:该年级此次考试中数学成绩优秀的有360人,非优秀的有880人.【精彩点拨】首先分别列出数学成绩与物理、化学、总分的2×2列联表,再正确计算χ2的观测值,然后由χ2的值作出判断.【自主解答】(1)根据已知数据列出数学与物理优秀的2×2列联表如下:物理优秀物理非优秀合计数学优秀228 b 360数学非优秀143 d 880合计371b+d 1 240∴b=360-228=132,d=880-143=737,b+d=132+737=869.代入公式可得χ2≈270.114.(2)按照上述方法列出数学与化学优秀的2×2列联表如下:化学优秀化学非优秀合计数学优秀225135360数学非优秀 156 724 880 合计3818591 240代入公式可得χ2≈240.611.综上,由于χ2的观测值都大于10.828,因此说明都能在犯错误的概率不超过0.001的前提下认为数学成绩优秀与物理、化学优秀有关系.1.独立性检验的关注点在2×2列联表中,如果两个分类变量没有关系,则应满足n 11n 22-n 12n 21≈0,因此|n 11n 22-n 12n 21|越小,关系越弱;|n 11n 22-n 12n 21|越大,关系越强.2.独立性检验的具体做法(1)根据实际问题的需要确定允许推断“事件A 与B 有关系”犯错误的概率的上界α,然后查表确定临界值k 0.(2)利用公式χ2=n (n 11n 22-n 12n 221)n 1+n 2+n +1n +2计算随机变量χ2.(3)如果χ2≥k 0,推断“X 与Y 有关系”这种推断犯错误的概率不超过α;否则,就认为在犯错误的概率不超过α的前提下不能推断“X 与Y 有关系”,或者在样本数据中没有发现足够的证据支持结论“X 与Y 有关系”.[再练一题]2.为了调查胃病是否与生活规律有关,在某地对540名40岁以上的人的调查结果如下:患胃病 未患胃病 合计 生活不规律 60 260 320 生活有规律 20 200 220 合计80460540根据以上数据判断40岁以上的人患胃病与生活规律有关吗? 【解】 由公式得χ2=540(60×200-260×20)2320×220×80×460≈9.638.∵9.638>6.635,∴有99%的把握说40岁以上的人患胃病与生活是否有规律有关,即生活不规律的人易患胃病.[探究共研型]独立性检验的综合应用探究1 利用χ2进行独立性检验,估计值的准确度与样本容量有关吗?【提示】 利用χ2进行独立性检验,可以对推断的正确性的概率作出估计,样本容量n 越大,这个估计值越准确,如果抽取的样本容量很小,那么利用χ2进行独立性检验的结果就不具有可靠性.探究2 在χ2运算后,得到χ2的值为29.78,在判断变量相关时,P (χ2≥6.635)≈0.01和P (χ2≥7.879)≈0.005,哪种说法是正确的?【提示】 两种说法均正确.P (χ2≥6.635)≈0.01的含义是在犯错误的概率不超过0.01的前提下认为两个变量相关;而P (χ2≥7.879)≈0.005的含义是在犯错误的概率不超过0.005的前提下认为两个变量相关.为调查某地区老年人是否需要志愿者提供帮助,用简单随机抽样方法从该地区调查了500位老年人,结果如下:男 女 需要 40 30 不需要160270(1)估计该地区老年人中,需要志愿者提供帮助的老年人的比例;(2)能否有99%的把握认为该地区的老年人是否需要志愿者提供帮助与性别有关? (3)根据(2)的结论,能否提出更好的调查方法来估计该地区的老年人中需要志愿者提供帮助的老年人的比例?说明理由.【精彩点拨】 题中给出了2×2列联表,从而可通过求χ2的值进行判定.对于(1)(3)可依据古典概率及抽样方法分析求解.【自主解答】 (1)调查的500位老年人中有70位需要志愿者提供帮助,因此该地区老年人中,需要帮助的老年人的比例的估计值为70500=14%.(2)χ2=500×(40×270-30×160)2200×300×70×430≈9.967.由于9.967>6.635,所以有99%的把握认为该地区的老年人是否需要帮助与性别有关. (3)由(2)的结论知,该地区老年人是否需要帮助与性别有关,并且从样本数据能看出该地区男性老年人与女性老年人中需要帮助的比例有明显差异,因此在调查时,先确定该地区老年人中男、女的比例,再把老年人分成男、女两层并采用分层抽样方法进行抽样,这比采用简单随机抽样方法更好.1.检验两个变量是否相互独立,主要依据是利用χ2=n (n 11n 22-n 12n 21)2n 1+n 2+n +1n +2公式计算χ2的值,再利用该值与3.841,6.635两个值进行比较作出判断.2.χ2计算公式较复杂,一是公式要清楚;二是代入数值时不能张冠李戴;三是计算时要细心.3.统计的基本思维模式是归纳,它的特征之一是通过部分数据的性质来推测全部数据的性质.因此,统计推断是可能犯错误的,即从数据上体现的只是统计关系,而不是因果关系.[再练一题]3.若两个分类变量x 和y 的列联表为:y x y 1 y 2 x 1 5 15 x 24010则x 与y 之间有关系的概率约为________. 【解析】χ2=(5+15+40+10)(5×10-40×15)2(5+15)(40+10)(5+40)(15+10)≈18.822.∵18.822>6.635,∴x 与y 之间有关系的概率约为1-0.01=0.99. 【答案】 0.99[构建·体系]达标检测:1.下列选项中,哪一个χ2的值可以有95%以上的把握认为“A 与B 有关系”( ) A.χ2=2.700 B.χ2=2.710 C.χ2=3.765D.χ2=5.014【解析】 ∵5.014>3.841,故D 正确. 【答案】 D2.通过随机询问110名性别不同的大学生是否爱好某项运动,得到如下的列联表:男 女 合计 爱好 40 20 60 不爱好 20 30 50 合计6050110经计算得χ2=110×(40×30-20×20)260×50×60×50≈7.8.则正确结论是( )A.在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别有关”B.在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别无关”C.有99%以上的把握认为“爱好该项运动与性别有关”D.有99%以上的把握认为“爱好该项运动与性别无关” 【解析】 根据独立性检验的思想方法,正确选项为C. 【答案】 C3.在一个2×2列联表中,由其数据计算得χ2=13.097,认为两个变量有关系犯错误的概率不超过________.【解析】 如果χ2>6.635时,认为“两变量有关系”犯错误的概率不超过0.01. 【答案】 0.014.某大学在研究性别与职称(分正教授、副教授)之间是否有关系,你认为应该收集的数据是________.【解析】 由研究的问题可知,需收集的数据应为男正教授人数,女正教授人数,男副教授人数,女副教授人数.【答案】 男正教授,女正教授,男副教授,女副教授5.调查某医院某段时间内婴儿出生的时间与性别的关系,得到下面的数据:出生时间在晚上的男婴为24人,女婴为8人;出生时间在白天的男婴为31人,女婴为26人.(1)将下面的2×2列联表补充完整;晚上 白天 合计 男婴 女婴 合计(2)能否在犯错误的概率不超过0.1的前提下认为婴儿性别与出生时间有关系? 【解】 (1)晚上 白天 合计 男婴 24 31 55 女婴 8 26 34 合计325789(2)由所给数据计算χ2 χ2=89×(24×26-31×8)255×34×32×57≈3.689>2.706.根据临界值表知P (χ2≥2.706)≈0.10.因此在犯错误的概率不超过0.1的前提下认为婴儿的性别与出生的时间有关系.我还有这些不足: (1)(2)我的课下提升方案:(1)(2)。
人教A版选修2-3独立性检验的基本思想及其初步应用教学设计
人教A 版选修2—3第三章§3.2 独立性检验的基本思想及其初步应用教学设计【一、教学内容解析】1.教材内容分析统计是研究如何合理地收集、整理、分析数据的学科.它可以为人们制定决策提供依据.在生活中,人们常常需要收集数据,根据所获得的数据提取有价值的信息,做出合理的决策.为了体现统计学科的这一特点,在教学中需要通过案例进行教学。
本节课是人教A 版(选修)2—3第三章第二单元的内容,本单元内容是在学生们学习了初中统计知识以及《数学3》(必修)中的统计知识后的进一步的学习,并与本册课本前面提到的事件的独立性一节关系紧密,此外还涉及到与《数学2-2》(选修)中讲到的“反证法”类似的思想——独立性检验.利用独立性检验进一步分析两个分类变量之间是否有关系,是高中数学知识中体现统计思想的重要课节。
本节的主要内容就是两个分类变量是否有关系的推断,从生活实例出发,发现数学概念、方法与结论,体现数学来源于生活,数学又服务于生活.本节的教学中,重点放在了独立性检验的统计学原理上,理解独立性检验的基本思想,明确独立性检验的基本步骤。
通过对典型案例的研究,介绍了独立性检验的基本思想、方法和解决问题的一般步骤。
独立性检验的基本思想和反证法类似,它们都是假设结论不成立,反证法是在假设结论不成立基础上推出矛盾从而证得结论成立,而独立性检验是在假设结论不成立基础上推出有利于结论成立的小概率事件发生,于是认为结论在很大程度上是成立的。
因为小概率事件在一次试验中通常是不会发生的,所以有利于结论成立的小概率事件的发生为否定假设提供了有力的证据。
但在全部逻辑推理正确的情况下,反证法不会犯错误,但独立性检验会犯随机性错误.独立性检验的具体的操作步骤就是:明确问题→确定犯错误概率的上界 及2K 的临界值0k →收集数据→整理数据→制列联表→计算统计量2K 的观测值k →比较观测值k 与临界值0k 并给出结论.这是一种非常重要的推断方法,不仅有相当广泛的应用,也开启了人类认识世界的一种新的思维方式.学习独立性检验的目的是“通过典型案例介绍独立性检验的基本思想、方法及其初步应用,使学生认识统计方法在决策中的作用”.这是因为,随着现代信息技术飞速发展,信息传播速度快,人们每天都会接触到影响我们生活的统计方面信息,所以具备一些统计知识已经成为现代人应具备的一种数学素养。
独立性检验的基本思想及初步应用教案
独立性检验的基本思想及初步应用一、教学目标1. 让学生理解独立性检验的基本思想,掌握独立性检验的步骤和应用。
2. 培养学生运用独立性检验解决实际问题的能力,提高学生的数据分析素养。
3. 引导学生运用数学软件或计算器进行独立性检验,培养学生的操作能力。
二、教学内容1. 独立性检验的基本思想(1)理解独立性检验的定义和作用。
(2)掌握独立性检验的基本步骤:提出假设、构造检验统计量、确定显著性水平、计算临界值、做出结论。
2. 独立性检验的初步应用(1)学会运用独立性检验解决实际问题,如判断两个分类变量是否独立。
(2)学会运用数学软件或计算器进行独立性检验,提高数据分析能力。
三、教学重点与难点1. 教学重点:(1)独立性检验的基本思想及步骤。
(2)独立性检验在实际问题中的应用。
(3)运用数学软件或计算器进行独立性检验。
2. 教学难点:(1)独立性检验步骤中构造检验统计量的方法。
(2)如何正确选择显著性水平。
四、教学方法与手段1. 教学方法:(1)讲授法:讲解独立性检验的基本思想和步骤。
(2)案例教学法:分析实际问题,引导学生运用独立性检验。
(3)实践操作法:让学生运用数学软件或计算器进行独立性检验。
2. 教学手段:(1)多媒体课件:展示独立性检验的基本思想和步骤。
(2)数学软件或计算器:让学生进行实际操作。
五、教学过程1. 导入新课:通过一个实际问题引入独立性检验的概念,激发学生的兴趣。
2. 讲解独立性检验的基本思想:讲解独立性检验的定义、作用和基本步骤,让学生理解独立性检验的基本思想。
3. 案例分析:分析一个实际问题,引导学生运用独立性检验,体会独立性检验在解决实际问题中的应用。
4. 实践操作:让学生运用数学软件或计算器进行独立性检验,培养学生的操作能力。
5. 总结与反思:总结本节课的主要内容,让学生巩固所学知识,并思考如何更好地运用独立性检验解决实际问题。
六、教学拓展1. 引导学生探讨独立性检验在实际应用中的局限性,如样本量对检验结果的影响。
[精品]新人教A版选修2-3高中数学3.2.1独立性检验的基本思想及其初步应用优质课教案
3. 2.1独立性检验的基本思想及其初步应用教学目标(1)通过对典型案例的探究,了解独立性检验(只要求22 列联表)的基本思想、方法及初步应用;(2)经历由实际问题建立数学模型的过程,体会其基本方法。
教学重点:独立性检验的基本方法教学难点:基本思想的领会及方法应用教学过程一、问题情境5月31日是世界无烟日。
有关医学研究表明,许多疾病,例如:心脏病、癌症、脑血管病、慢性阻塞性肺病等都与吸烟有关,吸烟已成为继高血压之后的第二号全球杀手。
这些疾病与吸烟有关的结论是怎样得出的呢?我们看一下问题:某医疗机构为了了解肺癌与吸烟是否有关,进行了一次抽样调查,共调查了9965个人,其中吸烟者2148人,不吸烟者7817人。
调查结果是:吸烟的2148人中有49人患肺癌,2099人未患肺癌;不吸烟的7817人中有42人患肺癌,7775人未患肺癌。
问题:根据这些数据能否断定“患肺癌与吸烟有关”?二、学生活动(1)引导学生将上述数据用下表(一)来表示:(即列联表)在不吸烟者中,有427817 ≈0.54%的人患肺癌;在吸烟的人中,有492148≈2.28%的人患肺癌。
问题:由上述结论能否得出患肺癌与吸烟有关?把握有多大? 三、建构数学1、从问题“吸烟是否与患肺癌有关系”引出独立性检验的问题,借助样本数据的列联表,柱形图和条形图的展示,使学生直观感觉到吸烟和患肺癌可能会有关系。
但这种结论能否推广到总体呢?要回答这个问题,就必须借助于统计理论来分析。
2、独立性检验:(1)假设0H :患肺癌与吸烟没有关系。
即:“吸烟与患肺癌相互独立”。
用A 表示不吸烟,B 表示不患肺癌,则有P(AB)=P(A)P(B)若将表中“观测值”用字母代替,则得下表(二):学生活动:让学生利用上述字母来表示对应概率,并化简整理。
思考交流:||ad bc -越小,说明患肺癌与吸烟之间的关系越 (强、弱)?(2)构造随机变量22()()()()()n ad bc K a b c d a c b d -=++++(其中n a b c d =+++)由此若0H 成立,即患肺癌与吸烟没有关系,则K 2的值应该很小。
人教课标版高中数学选修2-3:《独立性检验的基本思想及其初步应用(第2课时)》教案-新版
3.2 独立性检验的基本思想及其初步应用(第2课时)一、教学目标1.核心素养:通过学习独立性检验的基本思想及其初步应用,初步形成基本的数据分析能力,培养数学运算能力.2.学习目标(1)1.1.1.1 温习利用等高条形图、列联表、独立性检验的基本思想判断分类变量的关系(3)1.1.1.2 理解独立性检验基本思想,区分反证法与独立性检验(3)1.1.1.2 熟练运用独立性检验的基本思想判断分类变量的关系3.学习重点理解独立性检验基本思想,熟练运用独立性检验的基本思想判断分类变量的关系4.学习难点理解独立性检验的基本思想二、教学设计(一)课前设计1.预习任务任务1阅读教材P12-P14,思考独立性检验与反证法有何区别?任务2独立性检验的基本思想是什么?2.预习自测1.经过对K2的统计量的研究,得到了若干个临界值,当K2的观测值k>3.841时,我们()A.在犯错误的概率不超过0.05的前提下可认为A与B有关B.在犯错误的概率不超过0.05的前提下可认为A与B无关C.在犯错误的概率不超过0.01的前提下可认为A与B有关D .没有充分理由说明事件A 与B 有关系 解: A2.通过随机询问110名性别不同的大学生是否爱好某项运动,得到如下的22⨯列联表:计算得到2K 的观测值约为7.822.下列说法正确的是( )A .在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别有关”B .在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别无关”C .有99%以上的把握认为“爱好该项运动与性别有关”D .有99%以上的把握认为“爱好该项运动与性别无关”解:C 由随机变量2K 的值,查表知7.8226.6357.879<<,有99.5%以上的把握认为“爱好该项运动与性别有关”.故本题答案选C. (二)课堂设计 1.知识回顾(1)变量的不同“值”表示个体所属的不同类别,像这样的变量成为分类变量. (2)列出两个分类变量的频数表,称为列联表.(3)等高条形图是用来分析两个分类变量之间是否具有相关关系,可以形象、直观地反映两个分类变量之间的总体状态和差异大小,进而判断它们之间是否具有相关关系的图形. 2.问题探究问题探究一 我们主要从几个方面来研究两个分类变量之间有无关系?●活动一 回归旧知,忆分类变量间关系的判断例1 在某医院,因为患心脏病而住院的665名男性病人中,有214人秃顶;而另外772名不是因为患心脏病而住院的男性病人中有175名秃顶. 分别利用图形和独立性检验方法判断秃顶与患心脏病是否有关系?你所得的结论在什么范围内有效?【知识点:分类变量,独立性检验,变量间的关系】详解:根据题中所给数据列出列联表相应的等高条形图如图所示:比较来说,秃顶的病人中患心脏病的比例大一些,可以在某种程度上认为“秃顶与患心脏病有关”.●活动二对比学习,提炼优缺点根据数据有多大把握判断秃顶与患心脏病是否有关系?在假设的前提下,,所以有99%的把握认为“秃顶与患心脏病有关”.这里的数据来自于医院的住院病人,因此题目中的结论能够很好地适用于住院的病人群体,而把这个结论推广到其他群体则可能会出现错误,除非有其它的证据表明可以进行这种推广.点拨:(1)列联表由两个分类变量之间频率大小差异说明这两个变量之间是否有关联关系,而利用等高条形图能形象直观地反映它们之间的差异,进而推断它们之间是否具有关联关系.(2)独立性检验能精确判断可靠程度,而等高条形图的优点是直观,但只可以粗略判断两个分类变量是否有关系,一般在通过图表判断后还需要用独立性检验来确认.问题探究二 什么是独立性检验?利用独立性检验判断两个分类变量的是否有关系的一般过程是什么? ●活动一 理论学习,提升高度1.定义:利用随机变量2K 来判断“两个分类变量有关系”的方法称为独立性检验. ●活动二 对比学习,提炼方法通过反思例1的解答过程中,你能总结出利用独立性检验判断两个分类变量的是否有关系的一般过程吗?一般地,假设有两个分类变量X 和Y ,它们的取值分别为{}21,x x 和{}21,y y ,其2×2列联表为下表:我们构造一个变量:))()()(()(22d b c a d c b a bd ac n K ++++-=,其中d c b a n +++=.利用随机变量2K 来确定在多大程度上可以认为两个分类变量有关系:利用上述公式求出2K 的观测值为))()()(()(2d b c a d c b a bd ac n k ++++-=,其中d c b a n +++=.再得出X 与Y 有关系的程度:①如果k >10.828,就有99.9%的把握认为X 与Y 有关系; ②如果k >7.879,就有99.5%的把握认为X 与Y 有关系; ③如果k >6.635,就有99%的把握认为X 与Y 有关系;④如果k >5.024,就有97.5%的把握认为X 与Y 有关系; ⑤如果k >3.841,就有95%的把握认为X 与Y 有关系; ⑥如果k >2.706,就有90%的把握认为X 与Y 有关系; ⑦如果k ≤2.706,就认为没有充分的证据证明X 与Y 有关系.问题探究三 独立性检验的基本思想是什么? ●活动一 深层思考,得出基本思想通过上述问题,我们可以利用独立性检验来说明两个分类变量是否有关系,相关性有多强.那么为什么可以用独立性检验来判断两个分类变量的相关性呢?其基本思想是什么?独立性检验的基本思想类似于数学中的反证法,要确认两个分类变量有关系这一结论成立的可信程度,首先假设该结论不成立,即:0H :两个分类变量没有关系成立,在该假设下我们构造的随机变量2K 应该很小,如果由观测数据计算得到2K 的观测值k 很大,则在一定程度上说明假设不合理,即断言0H 不成立,即认为“两个分类变量有关系”;如果观测值k 很小,则说明在样本数据中没有发现足够证据拒绝0H .如何判断2K 的观测值k 的大小?确定一个正数0k ,当0k k ≥时认为2K 的观测值k 大.此时相应于0k 的判断规则为:如果0k k ≥,则认为“两个分类变量有关系”;否则认为“两个分类变量没有关系”.我们称这样的0k 为一个判断规则的临界值.按照上述规则,把“两个分类变量没有关系”错误判断为“两个分类变量有关系”的概率为)(02k K P ≥根据随机变量2K 的含义,可以通过)01.0635.6(2≈≥K P 来评价假设的不合理程度,又实际计算出635.6>k ,说明假设不合理的程度约为%99,级两个变量是由关系这一结论成立的可信度为%99. ●活动二 对比提升,区分不同独立性检验的原理与反证法的原理是否一样呢?我们对比可以发现: (1)反证法原理是在假设0H 下,如果推出一个矛盾,就证明了0H 不成立. (2)独立性检验原理是在假设0H 下,如果出现一个与0H 相矛盾的小概率事件,就推断0H 不成立,且该推断犯错误的概率不超过这个小概率.例 2 某高校为研究学生的身体素质与课外体育锻炼时间的关系,对该校一年级200名学生的课外体育锻炼平均每天运动的时间进行调查,如下表:(平均每天锻炼的时间单位:分钟)将学生日均课外体育运动时间在[40,60)上的学生评价为“课外体育达标”.请根据上述表格中的统计数据填写下面22⨯列联表,并通过计算判断是否能在犯错误的概率不超过0.01的前提下认为“课外体育达标”与性别有关?,其中n a b c d =+++.参考数据:【知识点:分类变量,独立性检验,变量间的关系】详解:其列联表如下故所以在犯错误的概率不超过0.01的前提下不能判断“课外体育达标”与性别有关; 点拨:独立性检验得出的结论是带有概率性质的,只能说结论成立的概率有多大,而不能完全肯定一个结论.在分析问题时一定要注意这一点,不可对某个问题下确定性结论否则就可能对统计计算得结果作出错误的解释. 3.课堂总结【知识梳理】(1)利用随机变量2K 来判断“两个分类变量有关系”的方法称为独立性检验. (2)独立性检验的基本思想类似于数学中的反证法,要确认两个分类变量有关系这一结论成立的可信程度,首先假设该结论不成立,即假设结论“两个分类变量没有关系”成立,在该假设下我们构造的随机变量2K 应该很小,如果由观测数据计算得到2K 的观测值k 很大,则在一定程度上说明假设不合理.(3)独立性检验的原理与反证法的原理比较:反证法原理是在假设0H 下,如果推出一个矛盾,就证明了0H 不成立;独立性检验原理是在假设0H 下,如果出现一个与0H 相矛盾的小概率事件,就推断0H 不成立,且该推断犯错误的概率不超过这个小概率.【重难点突破】(1)独立性检验是对两个分类变量间是否有关系的一种案例分析方法,其分析方法有:等高条形图法和利用假设检验的思想方法,计算出来一个随机变量2K 的观测值来进行判断(2)独立性检验的基本思想是:①假设结论不成立,即“两个分类变量没有关系”.②在此假设下随机变量2K应该很能小,如果由观测数据计算得到2K的观测值k很大,则在一定程度上说明假设不合理.③根据随机变量2K的含义,可以通过评价该假设不合理的程度,由实际计算出的,说明假设合理的程度为99.9%,即“两个分类变量有关系”这一结论成立的可信度为约为99.9%.4.随堂检测1.下列变量中不属于分类变量的是()A.性别B.吸烟C.宗教信仰D.国籍【知识点:分类变量】解:B“吸烟”不是分类变量,“是否吸烟”才是分类变量.2.下面是调查某地区男女中学生喜欢理科的等高条形图,阴影部分表示喜欢理科的百分比,从图中可以看出()A.性别与喜欢理科无关B.女生中喜欢理科的比为80%C.男生比女生喜欢理科的可能性大些D.男生不喜欢理科的比为60%【知识点:等高条形图】解:C由等高条形图知:女生喜欢理科的比例为20%,男生不喜欢理科的比例为40%,因此,B、D不正确.从图形中,男生比女生喜欢理科的可能性大些.3.为大力提倡“厉行节约,反对浪费”,某区通过随机询问100名性别不同的居民是否做到“光盘”的正确结论是()A.在犯错误的概率不超过1%的前提下,认为“该市民能否做到‘光盘’行动与性别有关”B.在犯错误的概率不超过1%的前提下,认为“该市民能否做到‘光盘’行动与性别无关”C.有90%以上的把握认为“该市民能否做到‘光盘’行动与性别有关”D.有90%以上的把握认为“该市民能否做到‘光盘’行动与性别无关”【知识点:独立性检验】解:C因为2.706<3.030<3.841所以有90%以上的把握认为“该市居民能否做到‘光盘’与性别有关”.4.若两个分类变量X和Y的22⨯列联表为:则认为“X与Y之间有关系”的把握可以达到()A.95%B.5%C.97.5%D.2.5%【知识点:独立性检验】解:A 根据列联表可以得到有100个样本,且10,40,20,30a b c d ====,代入表达式,得到2 4.7K ≈,2 3.84()051.9P K ≥=.5.某医疗研究所为了检验某种血清预防感冒的作用,把500名使用血清的人与另外500名未使用血清的人一年中的感冒记录作比较,提出假设H 0:“这种血清不能起到预防感冒的作用”.利用2×2列联表计算,得K 2=3.918.经查对临界值表,知P (K 2≥3.814)=0.05.给出下列结论:①有95%把握认为“这种血清能起到预防感冒的作用”;②若某人未使用血清,那么他在一年中有95%的可能性得感冒;③这种血清预防感冒的有效率为95%;④这种血清预防感冒的有效率为5%.其中正确结论的序号是( )A .①③B .②④C .①D .③ 【知识点:独立性检验】 解:C6.独立性检验所采用的思路是:要研究X ,Y 两个分类变量彼此相关,首先假设这两个分类变量彼此________,在此假设下构造随机变量K 2.如果K 2的观测值较大,那么在一定程度上说明假设________. 【知识点:独立性检验】解:无关系 不成立 (三)课后作业基础型 自主突破1.下列关于等高条形图的叙述正确的是( ).A .从等高条形图中可以精确地判断两个分类变量是否有关系B .从等高条形图中可以看出两个变量频数的相对大小C .从等高条形图可以粗略地看出两个分类变量是否有关系D .以上说法都不对 【知识点:独立性检验】解:C 在等高条形图中仅能粗略判断两个分类变量的关系,故A 错.在等高条形图中仅能够找出频率,无法找出频数,故B 错.2.如果有95%的把握说事件A 和B 有关系,那么具体计算出的数据是( )A . 841.3>kB . 841.3<kC . 635.6>kD . 635.6<k 【知识点:独立性检验】 解: A3.下面关于2K 的说法正确的是( )A . 2K 在任何相互独立的问题中都可以用于检验有关还是无关B . 2K 的值越大,两个事件的相关性就越大C . 2K 是用来判断两个分类变量是否相关的随机变量,当2K 的值很小时可以推定两个变量不相关D . 2K 的观测值的计算公式是))()()(()(2d b c a d c b a bd ac n K ++++-=【知识点:独立性检验】 解: B4. 为了研究学生性别与是否喜欢数学课之间的关系,得到列联表如下,请判断有( )把握认为性别与喜欢数学课有关.ABCD 【知识点:独立性检验】解:D99.9%的把握认为性别与喜欢数学课有关.5.以下关于独立性检验的说法中,错误的是____.(填序号) ①独立性检验依据小概率原理; ②独立性检验得到的结论一定正确;③样本不同,独立性检验的结论可能有差异;④独立性检验不是判定两个分类变量是否相关的唯一方法. 【知识点:独立性检验】 解: ②能力型 师生共研6.有两个分类变量X 与Y 的一组数据,由其列联表计算得k ≈4.523,则认为“X 与Y 有关系”犯错误的概率为( )A .95%B .90%C .5%D .10% 【知识点:独立性检验】 解: C7.某医疗所为了检查新开发的流感疫苗对甲型HINI 流感的预防作用,把1000名注射疫苗的人与另外1000名未注射疫苗的人半年的感冒记录作比较,提出假设0:H “这种疫苗不能起到预防甲型HINI 流感的作用”,并计算()2 6.6350.01P X ≥≈,则下列说法正确的是( )A .这种疫苗能起到预防甲型HINI 流感的有效率为B .的可能性得甲型HINIC .“这种疫苗能起到预防甲型HINI 流感的作用” D .“这种疫苗能起到预防甲型HINI 流感的作用” 【知识点:独立性检验】解: C 因为()2 6.6350.01P X ≥≈,这说明假设不合理的程度为99%,即这种疫苗不能起到预防甲型HINI 流感的作用不合理的程度约为99%,所以有认为“这种疫苗能起到预防甲型HINI 流感的作用”,故选C.8.某企业为研究企业员工工作积极性和对待企业改革态度的关系,随机抽取了72名员工进行调查,所得的数据如下表所示:对于人力资源部的研究项目,根据上述数据能得出的结论是( )当2 3.841χ>时,有95%的把握说事件A 与B 有关;当26.635χ>时,有99%的把握说事件A 与B 有关; 当2 3.841χ<时认为事件A 与B 无关.)A .有99%的把握说事件A 与B 有关 B .有95%的把握说事件A 与B 有关C .有90%的把握说事件A 与B 有关 D .事件A 与B 无关 【知识点:独立性检验】解:A 故有的把握说事件A 与B 有关,所以应选A.探究型 多维突破9.微信是腾讯公司推出的一种手机通讯软件,它支持发送语音短信、视频、图片和文字,一经推出便风靡全国,甚至涌现出一批在微信的朋友圈内销售商品的人(被称为微商).为了调查每天微信用户使用微信的时间,某经销化妆品的微商在一广场随机采访男性、女性用户各50名,其中每天玩微信超过6小时的用户列为“微信控”,否则称其为“非微信控”,调查结果如下:(1)根据以上数据,能否有60%的把握认为“微信控”与”性别“有关?(2)现从调查的女性用户中按分层抽样的方法选出5人,从这5人中再随机抽取3人赠送200元的护肤品套装,求这3人中“微信控”的人数为2的概率.n =a +b +c +d .参考数据:【知识点:独立性检验,古典概型】 解:(1)由列联表可得所以没有60%的把握认为“微信控”与”性别“有关.(2)记从(2)中抽取的5人中“微信控”的3人为321,,a a a ,“非微信控”的2人为21,b b ,从中随机抽取3人,所有可能结果:),,(),,,(),,,(),,,(),,,(),,,(),,,(132211231131221121321b a a b b a b a a b a a b a a b a a a a a , ),,(),,,(),,,(213212232b b a b b a b a a ,共10种;其中“微信控”的人数为2的结果有:),,(),,,(),,,(),,,(),,,(),,,(),,,(232132211231131221121b a a b a a b b a b a a b a a b a a b a a ,共6种,10.NBA 决赛期间,某高校对学生是否收看直播进行调查,将得到的数据绘成如下的2×2列联表,但部分字迹不清:将表格填写完整,试说明是否收看直播与性别是否有关?【知识点:独立性检验,概率统计】解析:所以有99%的把握认为是否收看直播与性别有关,(四)自助餐1.利用独立性检验来考虑两个分类变量X和Y是否有关系时,通过查阅临界值表来确定推断“X与Y有关系”的可信度,如果k>5.024,那么就推断“X和Y有关系”,这种推断犯错误的概率不超过()A.0.25B.0.75C.0.025D.0.975【知识点:独立性检验】答案 C2. 关于独立性检验的说法中,错误的是()A.独立性检验的基本思想是带有概率性质的反证法B.独立性检验得到的结论一定正确C.样本不同,独立性检验的结论可能有差异D.独立性检验不是判断两事物是否相关的唯一方法【知识点:独立性检验】答案 B3.在调查中发现480名男人中有38名患有色盲,520名女人中有6名患有色盲.下列说法正确的是()A.男、女人患色盲的频率分别为0.038,0.006B.男、女人患色盲的概率分别为19240,3260C.男人中患色盲的比例比女人中患色盲的比例大,患色盲与性别是有关的D.调查人数太少,不能说明色盲与性别有关【知识点:独立性检验】解:C4.在调查学生数学成绩与物理成绩之间的关系时,得到如下数据(人数:)数学成绩与物理成绩之间有把握有关?()A.90%B.95%C.97.5%D.99%【知识点:独立性检验】解:D5.某疾病研究所想知道吸烟与患肺病是否有关,于是随机抽取1000名成年人调查是否吸烟及是否患有肺病,得到22⨯列联表,经计算得2 5.231K=,已知在假设吸烟与患肺病无关的前提条件下,22( 3.841)0.05,( 6.635)0.01P K P K≥=≥=,则该研究所可以()A.有95%以上的把握认为“吸烟与患肺病有关”B.有95%以上的把握认为“吸烟与患肺病无关”C.有99%以上的把握认为“吸烟与患肺病有关”D.有99%以上的把握认为“吸烟与患肺病无关”【知识点:独立性检验】解:A根据查对临界值表知22( 3.841)0.05,( 6.635)0.01P K P K≥=≥=,故有95%的把握认为“吸烟与患肺病有关”,即A正确;6.为了判断高中学生的文理科选修是否与性别有关,随机调查了50名学生,得到如下22⨯列联表:那么,认为“高中学生的文理科选修与性别有关系”犯错误的概率不超过( ) A .001.0 B .005.0 C .1.0 D .025.0 【知识点:独立性检验】解: B 因为8.3>7.879,所以我们认为“高中学生的文理科选修与性别有关系”犯错误的概率不超过005.0. 7.在对某小学的学生进行吃零食的调查中,得到如下表数据:根据上述数据分析,我们得出的K 2的观测值k 约为 . 【知识点:独立性检验】解:3.689 由公式可计算得k =错误!未找到引用源。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
)
◆教案
独立性检验的基本思想及其初步应用(第1课时)教材:人教A版·普通高中课程标准实验教科书·数学·选修2-3
【教学目标】
知识与技能目标:
(1)通过学生课前分组进行“事件与事件之间是否有关系”的调查研究,理解统计方法的基本思想和应用,通过学生根据已有知识的基础上进行的数据分析,得到的直观结论,了解独立性检验的必要性,为知识的形成起到较好的推动作用.
.
(2)通过一起对典型案例“吸烟是否与患肺癌有关系”的合作探究、自主学习,并通过和反证法原理的对比,进一步让学生去理解独立性检验的基本思想、方法及初步应用.
(3)经历由实际问题建立数学模型的过程,进一步体会运用统计方法解决实际问题的基本思想,认识统计方法在决策中的作用.
过程与方法目标:
(1) 学生通过自主调查、设计抽样方案、分析数据、动手探究,培养学生的数学应用意识,掌握统计学的基本思想和方法,培养学生的动手能力、数理统计能力和合作精神.
(2) 学生通过对调查数据的分析,作出的直观结论的可靠性程度的探究及其过程,理解独立性检验的基本思想,进一步掌握统计的方法,完善思维品质,并过特殊问题到一般性方法的探究,寻求知识之间的联系,通过新的知识与旧知识之间的对比,使学生掌握学习数学的基本方法,进一步完善认知结构.
(3) 在探究过程中,在老师的引导下学生自主学习,学生主要通过合作交流,独立思考探究新知,获取新的知识;通过不同层次学生反映的问题进行适当的分析和指导,让不同层次的学生在学习过程中都有不同程度的提高,在练习中设置B组题,让思维和掌握程度较好同学能够“吃饱”.
情感、态度、价值观:
"
(1) 通过学生自主研究,进一步体会统计思想在实践中的应用,体会数形结合的思想;在探究过程中通过对具体情景中的问题到寻求一般解决方案,培养由特殊到一般思想,通过知识间的联系和对比,体验数学中转化思想的意义和价值.
(2) 在教学中为学生提供充分的从事数学活动的机会,如:课前的调查研究,分析数据,通过课堂的探究活动,让学生自主探究新知,经历知识形成过程.
(3)通过小组的协作,培养学生的团队精神,在活动中激发学生的学习潜能,促进他们真正理解和掌握基本的数学知识技能、数学思想方法及数学的应用意识,学会用计算器或计算机软件进行数理统计能力,获得广泛的数学活动经验,提高综合能力,学会学习,进一步在意志力、自信心、理性精神等情感与态度方面得到良好的发展.
【教学重点与难点】
重点:理解独立性检验的基本思想及实施步骤.
难点:(1)了解独立性检验的基本思想;(2)了解随机变量2K的含义.
?
【教学方法】
《新课程标准》的理念是“向学生提供充分从事数学活动的机会,帮助他们在自主探索和合作交流的过程中真正理解和掌握基本的数学知识和技能,数学思想和方法”.
考虑授课对象是高二年级理科生,学生层次差异比较明显,动手能力不足,因此通过课前的分组进行课题的调查研究,分析数据,获取结论的过程让学生在活动中提升数学思考能力,锻炼动手能力,学会处理数据的基本方法,课中通过合作探究,自主学习等方式体验知识的形成,根据不同层次学生在探究、解决问题和练习中反映的问题进行适当的引导,让学生在已有的基础上获得最大的发展.
本节课主要是探究性学习,学生通过课前的调查研究和直观发现的结论和样本的随机性,理解独立性检验的必要性,根据所探究问题进行类比联想,寻求突破点,并在过程中分析所得数据与问题之间的联系,提升数学思维能力,通过与反证法思想的类比,进一步加深对独立性检验思想的理解.
课堂中的例题和练习,主要是学生知识的应用为主,体会统计方法在实际问题中的应用,
体会统计方法应用的广泛性,以丰富学生对数学文化价值的认识;并且通过身边问题的研究统计,提高学习数学的信心,数学课也承担着育人的任务,因此通过实际生活中的问题研究有助于完善人生观世界观,树立良好价值观.
对实际问题的分析中借助信息技术学会利用图形分析、解决问题及用具体的数量来衡量两个变量之间的联系,学习用图形、数据来正确描述两个变量的关系.展示学生作品则给学生以成功的体验,增强学习数学的兴趣和信心.
【学法指导】
通过自己设计研究的问题的调查,进行数理统计分析,引出问题后,通过每个环节不同的问题的思考,学生主动积极地参与探究活动,体验学习的乐趣,进行有意义学习活动;教师在这个教学过程中进行有意义的引导,放手让学生进行思考和探究,让学生主动找知识的联系,寻求问题的解决.使学生充分经历“调查研究——分析统计——数学解释——知识障碍——探究新知——讨论归纳——发现新知——应用新知——回归应用”这一完整的数学学习活动,让学生感受到数学来源于生活应用于生活.学生自主探索、动手实践、合作交流的学习方式,体现在整个教学过程中.
-
【教学手段】
(1)学生课前分组调查研究,体会统计方法.
(2)借助计算器、多媒体,强化直观感知,体现数形结合.
(3) 提供学案“学生活动”,突破理解难点.
【教学流程】
、
【教学过程】
&
附注1:(课堂上通过学案给出)
学生课堂练习题
A 组.
1.下列关于K 2的说法正确的是( )
A. K 2是用来判断两个分类变量是否有关系的一个随机变量;
B. K 2的值越大,两个分类变量间的关系就越大
C. K 2的观测值计算公式为K 2=| a d-bc|
D.以上都正确 @
2.在一个2×2列联表中,由其数据计算的K 2观测值k 为,则这两个变量间有关系的可能性为( )
%
D.无关系
3.观察下列图表,期中两个分类变量的关系最强的是( )
&
A
B
C D
4.如果有95%的把握说事件A 和B 有关系,那么具体计算出K 2的观测值k 的数据可能是( ) > <3.841 > <
5. 有甲乙两个班级进行一门课程的考试,按照学生成绩优秀和不优秀统计成绩后,得到如下列联表:
请画出列联表的等高条形图,并通过图形判断成绩与班级是否有关系;根据列联表的独立性检验,能否在犯错误的概率不超过的前提下认为成绩与班级有关系 ¥
B 组.
1. 给出假设0H ,下列结论中,不能对0H 成立与否作出明确判断的是( )
A.235.2=k
B.723.7=k
C.321.10=k
D.125.20=k
2.在调查的480名男性中有38名患有色盲,520名女性中有6名患色盲,分别利用图形和独立性检验的方法判断色盲与性别是否有关系
3.在对人们休闲方式的一次调查中,共调查了124人,其中女性70人,男性54人,女性中有43人主要是看电视,另外27人主要是运动,男性中21人主要是看电视,另外33人主要是运动.
(1)根据以上数据建立一个2×2的列联表;。