2017-2018学年高中数学第一章统计案例1.2独立检验的基本思想及其初步应用教学案新人教A版选修1_2

合集下载

2017-2018版高中数学 第一章 统计案例 1.2 独立性检验的基本思想及其初步应用学案 新人教

2017-2018版高中数学 第一章 统计案例 1.2 独立性检验的基本思想及其初步应用学案 新人教

1.2 独立性检验的基本思想及其初步应用1.理解独立性检验的基本思想及其实施步骤.(重点)2.能利用条形图、列联表探讨两个分类变量的关系.(易混点)3.了解K2的含义及其应用.4.通过对数据的处理,来提高解决实际问题的能力.(难点)[基础·初探]教材整理1 分类变量与列联表阅读教材P10~P13的内容,完成下列问题.1.分类变量变量的不同“值”表示个体所属的不同类别,像这样的变量称为分类变量.2.列联表(1)定义:列出的两个分类变量的频数表,称为列联表.(2)2×2列联表:一般地,假设有两个分类变量X和Y,它们的取值分别为{x1,x2}和{y1,y2},其样本频数列联表(称为2×2列联表)为:下面是一个2×2列联表:【解析】 ∵a +21=73,∴a =52. 又b =a +8=52+8=60. 【答案】 52,60 教材整理2 等高条形图阅读教材P 14的内容,完成下列问题.1.定义:将列联表中的数据用高度相同的两个条形图表示出来,其中两列的数据分别对应不同的颜色,这就是等高条形图.2.等高条形图和表格相比,更能直观地反映出两个分类变量间是否相互影响,常用等高条形图展示列联表数据的频率特征.3.观察等高条形图发现aa +b 和cc +d相差很大,就判断两个分类变量之间有关系.观察下列各图,其中两个分类变量x ,y 之间关系最强的是________.图1­2­1【解析】 在四幅图中图(4)中两个深色条的高相差最明显,说明两个分类变量之间关系最强,故选(4).【答案】 (4)教材整理3 独立性检验阅读教材P 12的内容,完成下列问题. 1.定义利用随机变量K 2来判断“两个分类变量有关系”的方法称为独立性检验. 2.公式K 2=n ad -bc 2a +bc +d a +cb +d,其中n =a +b +c +d .1.关于分类变量x 与y 的随机变量K 2的观测值k ,下列说法正确的是________(填序号). (1)k 的值越大,“X 和Y 有关系”可信程度越小; (2)k 的值越小,“X 和Y 有关系”可信程度越小; (3)k 的值越接近于0,“X 和Y 无关”程度越小; (4)k 的值越大,“X 和Y 无关”程度越大.【解析】 k 的值越大,X 和Y 有关系的可能性就越大,也就意味着X 和Y 无关系的可能性就越小.【答案】 (2)2.式子|ad -bc |越大,K 2的值就越________.(填“大”或“小”) 【解析】 由K 2的表达式知|ad -bc |越大,(ad -bc )2就越大,K 2就越大. 【答案】 大[小组合作型]70人,六十岁以下的54人.六十岁以上的人中有43人的饮食以蔬菜为主,另外27人则以肉类为主;六十岁以下的人中有21人饮食以蔬菜为主,另外33人则以肉类为主.请根据以上数据作出饮食习惯与年龄的列联表,并利用a a +b 与cc +d 判断二者是否有关系.【精彩点拨】 对变量进行分类→求出分类变量的不同取值→ 作出2×2列联表→计算aa +b 与cc +d的值作出判断【自主解答】 2×2列联表如下:将表中数据代入公式得a +b =64=0.671 875. cc +d =2760=0.45. 显然二者数据具有较为明显的差距,据此可以在某种程度上认为饮食习惯与年龄有关系.1.作2×2列联表时,关键是对涉及的变量分清类别.注意应该是4行4列,计算时要准确无误.2.利用2×2列联表分析两变量间的关系时,首先要根据题中数据获得2×2列联表,然后根据频率特征,即将aa +b 与c c +d ⎝ ⎛⎭⎪⎫或b a +b 与d c +d 的值相比,直观地反映出两个分类变量间是否相互影响,但方法较粗劣.[再练一题]1.某电视台在一次对收看文艺节目和新闻节目观众的抽样调查中,随机抽取了100名电视观众,相关的数据如下表所示:【解析】 因为在20至40岁的58名观众中有18名观众收看新闻节目,而大于40岁的42名观众中有27名观众收看新闻节目,即ba +b =1858,dc +d =2742,两者相差较大,所以,经直观分析,收看新闻节目的观众与年龄有关.【答案】 有关426人中332人在考前心情紧张,性格外向的学生594人中有213人在考前心情紧张.作出等高条形图,利用图形判断考前心情紧张与性格类别是否有关系.【精彩点拨】 作出2×2列联表―→根据列联表数据作等高条形图―→ 对比乘积的差距判断两个分类变量是否有关 【自主解答】 作列联表如下:图中阴影部分表示考前心情紧张与考前心情不紧张中性格内向的比例.从图中可以看出,考前紧张的样本中性格内向占的比例比考前心情不紧张样本中性格内向占的比例高,可以认为考前紧张与性格类型有关.1.判断两个分类变量是否有关系的两种常用方法(1)利用数形结合思想,借助等高条形图来判断两个分类变量是否相关是判断变量相关的常见方法.(2)一般地,在等高条形图中,aa +b 与cc +d相差越大,两个分类变量有关系的可能性就越大.2.利用等高条形图判断两个分类变量是否相关的步骤[再练一题]2.为考察某种药物预防疾病的效果,进行动物试验,得到如下的列联表:药物效果试验列联表【解】相应的等高条形图如下:从图形可以看出,服用药的样本中患病的比例明显低于没有服用药的样本中患病的比例,因此可以认为:服用药和患病之间有关系.70人、男性50人.女性中有40人主要的休闲方式是看电视,另外30人主要的休闲方式是运动;男性中有20人主要的休闲方式是看电视,另外30人主要的休闲方式是运动.(1)根据以上数据建立一个2×2的列联表;(2)休闲方式与性别是否有关?【精彩点拨】先根据已知数据建立2×2列联表,再通过列联表中的数值求K2,再根据K2的值作出判断.【自主解答】(1)2×2的列联表为k=-270×50×60×60=247≈3.429.而2.706<3.429<3.841.因为P(K2>2.706)≈0.10.所以,在犯错误的概率不超过0.10的前提下,认为休闲方式与性别有关.解决一般的独立性检验问题的步骤[再练一题]3.为了探究学生选报文、理科是否与对外语的兴趣有关,某同学调查了361名高二在校学生,调查结果如下:理科对外语有兴趣的有138人,无兴趣的有98人,文科对外语有兴趣的有73人,无兴趣的有52人.试分析学生选报文、理科与对外语的兴趣是否有关?【导学号:81092004】【解】根据题目所给的数据得到如下列联表:k=-732236×125×211×150≈1.871×10-4.因为1.871×10-4<2.706,所以据目前的数据不能认为学生选报文、理科与对外语的兴趣有关,即可以认为学生选报文、理科与对外语的兴趣无关.[探究共研型]探究1【提示】利用K2进行独立性检验,可以对推断的正确性的概率作出估计,样本容量n 越大,这个估计值越准确,如果抽取的样本容量很小,那么利用K2进行独立性检验的结果就不具有可靠性.探究2 在K2运算后,得到K2的值为29.78,在判断变量相关时,P(K2≥6.635)≈0.01和P(K2≥7.879)≈0.005,哪种说法是正确的?【提示】两种说法均正确.P(K2≥6.635)≈0.01的含义是在犯错误的概率不超过0.01的前提下认为两个变量相关;而P(K2≥7.879)≈0.005的含义是在犯错误的概率不超过0.005的前提下认为两个变量相关.为了调查某生产线上质量监督员甲对产品质量好坏有无影响,现统计数据如下:甲在生产现场时,990件产品中有合格品982件,次品8件;甲不在生产现场时,510件产品中有合格品493件,次品17件.试分别用列联表、独立性检验的方法分析监督员甲对产品质量好坏有无影响.能否在犯错误的概率不超过0.001的前提下,认为质量监督员甲是否在生产现场与产品质量有关?【精彩点拨】解答本题可先列出2×2列联表,然后具体分析.【自主解答】(1)2×2列联表如下:为“质量监督员甲是否在生产现场与产品质量有关系”.(2)由2×2列联表中数据,计算得到K2的观测值为k=-2990×510×1 475×25≈13.097>10.828,因此在犯错误不超过0.001的前提下,认为质量监督员甲是否在生产现场与产品质量有关.判断两个变量是否有关的三种方法[再练一题]4.调查某医院某段时间内婴儿出生的时间与性别的关系,得到下面的数据:出生时间在晚上的男婴为24人,女婴为8人;出生时间在白天的男婴为31人,女婴为26人.(1)将下面的2×2列联表补充完整;(2)【解】(1)2×2列联表如下:k=-2 55×34×32×57≈3.689>2.706.根据临界值表知P(K2≥2.706)≈0.10.因此在犯错误的概率不超过0.10的前提下认为婴儿的性别与出生时间有关系.1.在一项中学生近视情况的调查中,某校男生150名中有80名近视,女生140名中有70名近视,在检验这些中学生眼睛近视是否与性别有关时用什么方法最有说服力( ) A.平均数与方差B.回归分析C.独立性检验D.概率【解析】判断两个分类变量是否有关的最有效方法是进行独立性检验,故选C.【答案】 C2.为了研究高中学生对乡村音乐的态度(喜欢和不喜欢两种态度)与性别的关系,运用2×2列联表进行独立性检验,经计算K2=8.01,则认为“喜欢乡村音乐与性别有关系”的把握性约为( )C.99% D.99.9%【解析】因为K2=8.01>6.635,所以有99%以上的把握认为“喜欢乡村音乐与性别有关系”.【答案】 C3.以下关于独立性检验的说法中,错误的是( ) A .独立性检验依赖小概率原理 B .独立性检验得到的结论一定正确 C .样本不同,独立性检验的结论可能有差异 D .独立性检验不是判定两事物是否相关的唯一方法【解析】 受样本选取的影响,独立性检验得到的结论不一定正确,选B. 【答案】 B4.在2×2列联表中,两个比值aa +b与________相差越大,两个分类变量有关系的可能性越大. 【导学号:81092005】【解析】 根据2×2列联表可知,比值aa +b 与cc +d相差越大,则|ad -bc |就越大,那么两个分类变量有关系的可能性就越大.【答案】cc +d5.某大学餐饮中心为了解新生的饮食习惯,在全校一年级学生中进行了抽样调查,调查结果如下表所示:方面有差异”.【解】 将2×2列联表中的数据代入公式计算,得k =n ad -bc 2a +bc +d a +cb +d=-270×30×80×20=10021≈4.762. 因为4.762>3.841,所以有95%的把握认为“南方学生和北方学生在选用甜品的饮食习惯方面有差异”.学业分层测评 (建议用时:45分钟)[学业达标]一、选择题1.如果在犯错误的概率不超过0.05的前提下认为事件A 和B 有关,那么具体算出的数据满足( )A.K2>3.841 B.K2<3.841C.K2>6.635 D.K2<6.635【解析】对应P(K2≥k0)的临界值表可知,当K2>3.841时,在犯错误的概率不超过0.05的前提下认为事件A与B有关.【答案】 A2.下列关于等高条形图的叙述正确的是( )A.从等高条形图中可以精确地判断两个分类变量是否有关系B.从等高条形图中可以看出两个变量频数的相对大小C.从等高条形图中可以粗略地看出两个分类变量是否有关系D.以上说法都不对【解析】在等高条形图中仅能粗略判断两个分类变量的关系,故A错.在等高条形图中仅能够找出频率,无法找出频数,故B错.【答案】 C3.分类变量X和Y的列联表如下,则( )A.ad-bcB.ad-bc越大,说明X与Y的关系越强C.(ad-bc)2越大,说明X与Y的关系越强D.(ad-bc)2越接近于0,说明X与Y的关系越强【解析】结合独立性检验的思想可知|ad-bc|越大,X与Y的相关性越强,从而(ad -bc)2越大,说明X与Y的相关性越强.【答案】 C4.在研究打鼾与患心脏病之间的关系中,通过收集数据、整理分析数据得到“打鼾与患心脏病有关”的结论,并且在犯错误的概率不超过0.01的前提下认为这个结论是成立的.下列说法中正确的是( )A.100个心脏病患者中至少有99人打鼾B.1个人患心脏病,则这个人有99%的概率打鼾C.100个心脏病患者中一定有打鼾的人D.100个心脏病患者中可能一个打鼾的人都没有【解析】这是独立性检验,在犯错误的概率不超过0.01的前提下认为“打鼾与患心脏病有关”.这只是一个概率,即打鼾与患心脏病有关的可能性为99%.根据概率的意义可知答案应选D.【答案】 D5.为了解高中生作文成绩与课外阅读量之间的关系,某研究机构随机抽取了60名高中生,通过问卷调查,得到以下数据:( ) 【导学号:81092006】A.没有充足的理由认为课外阅读量大与作文成绩优秀有关B.有0.5%的把握认为课外阅读量大与作文成绩优秀有关C.有99.9%的把握认为课外阅读量大与作文成绩优秀有关D.有99.5%的把握认为课外阅读量大与作文成绩优秀有关【解析】根据临界值表,9.643>7.879,在犯错误的概率不超过0.005的前提下,认为课外阅读量大与作文成绩优秀有关,即有99.5%的把握认为课外阅读量大与作文成绩优秀有关.【答案】 D二、填空题6.为了探究电离辐射的剂量与人体的受损程度是否有关,用两种不同剂量的电离辐射照射小白鼠.在照射后14天内的结果如表所示:【解析】由独立性检验的步骤知第一步先假设两分类变量无关,即假设电离辐射的剂量与小白鼠的死亡无关.【答案】假设电离辐射的剂量与小白鼠的死亡无关7.为研究某新药的疗效,给50名患者服用此药,跟踪调查后得下表中的数据:设H0服用此药的效果与患者的性别有关,这种判断出错的可能性为________.【解析】由公式计算得K2的观测值k≈4.882,∵k>3.841,∴有95%的把握认为服用此药的效果与患者的性别有关,从而有5%的可能性出错.【答案】 4.882 5%8.在对某小学的学生进行吃零食的调查中,得到如下表数据:【解析】由公式可计算得k=-2 39×63×61×41≈2.334.【答案】 2.334三、解答题9.对某校小学生进行心理障碍测试得到如下列联表:附:k =30×80×20×90≈6.366>5.024,所以有97.5%的把握认为心理障碍与性别有关.10.某市地铁即将于2017年6月开始运营,为此召开了一个价格听证会,拟定价格后又进行了一次调查,随机抽查了50人,他们的收入与态度如下:与“认为价格偏高者”的月平均收入的差距是多少(结果保留2位小数);(2)由以上统计数据填下面2×2列联表,分析是否有99%的把握认为“月收入以55百元为分界点对地铁定价的态度有差异”.附:K 2=a +bc +d a +c a +d. x 1=20×1+30×2+40×3+50×5+60×3+70×41+2+3+5+3+4≈50.56.“认为价格偏高者”的月平均收入为x 2=20×4+30×8+40×12+50×5+60×2+70×14+8+12+5+2+1=38.75,∴“赞成定价者”与“认为价格偏高者”的月平均收入的差距是x 1-x 2=50.56-38.75=11.81(百元).(2)根据条件可得2×2列联表如下:K 2=10×40×18×32≈6.27<6.635,∴没有99%的把握认为“月收入以55百元为分界点对地铁定价的态度有差异”.[能力提升]1.假设有两个分类变量X 和Y ,它们的值域分别为{x 1,x 2}和{y 1,y 2},其2×2列联表为:A .a =5,b =4,c =3,d =2B .a =5,b =3,c =4,d =2C .a =2,b =3,c =4,d =5D .a =3,b =2,c =4,d =5【解析】 对于同一样本,|ad -bc |越小,说明x 与y 相关性越弱,而|ad -bc |越大,说明x 与y相关性越强,通过计算知,对于A ,B ,C 都有|ad -bc |=|10-12|=2.对于选项D ,有|ad -bc |=|15-8|=7,显然7>2.【答案】 D2.有两个分类变量X ,Y ,其一组观测值如下面的2×2列联表所示:其中a,15-a 的前提下认为X ,Y 有关,则a 的值为( )A .8B .9C .8,9D .6,8【解析】 根据公式,得 k =65×[a +a --a -a220×45×15×50=a -220×45×3×2>3.841,根据a >5且15-a >5,a ∈Z ,求得a =8,9满足题意. 【答案】 C3.某高校“统计初步”课程的教师随机调查了选该课的一些学生情况,具体数据如下表:=________(保留三位小数),所以判定________(填“有”或“没有”)95%的把握认为主修统计专业与性别有关系.参考公式:K 2=n ad -bc 2a +bc +d a +cb +d;【解析】 根据提供的表格,得k =23×27×20×30≈4.844>3.841,∴可以判定有95%的把握认为主修统计专业与性别有关系. 【答案】 4.844 有4.某地震观测站对地下水位的变化和发生地震的情况共进行1 700次观测,列联表如下:分的证据显示二者有关系.【解】 相应的等高条形图如图所示.图中两个阴影条的高分别表示水位有变化和水位无变化的样本中有震的频率.由图可看出,水位有变化样本中有震的频率与水位无变化样本中有震的频率相差不大,因此不能判断地震与水位变化有关系.根据列联表中的数据,得K 2的观测值为 k =1 -21 000×700×180×1 520≈1.594<2.072,所以题中数据没有充分的证据显示地下水位的变化与地震的发生有关系,但也不能认为二者无关系.。

高中数学人教版选修1-2全套教案

高中数学人教版选修1-2全套教案

高中数学人教版选修1-2全套教案第一章统计案例第一课时 1.1回归分析的基本思想及其初步应用(一)教学目标1、知识与技能目标 认识随机误差;2、过程与方法目标(1)会使用函数计算器求回归方程; (2)能正确理解回归方程的预报结果. 3、情感、态度、价值观通过本节课的学习,加强数学与现实生活的联系,以科学的态度评价两个变量的相关性,理解处理问题的方法,形成严谨的治学态度和锲而不舍的求学精神.培养学生运用所学知识,解决实际问题的能力.教学中适当地利用学生合作与交流,使学生在学习的同时,体会与他人合作的重要性.教学重点:了解线性回归模型与函数模型的差异,了解判断刻画模型拟合效果的方法-相关指数和残差分析. 教学难点:解释残差变量的含义,了解偏差平方和分解的思想. 教学过程: 一、复习准备:1. 提问:“名师出高徒”这句彦语的意思是什么?有名气的老师就一定能教出厉害的学生吗?这两者之间是否有关?2. 复习:函数关系是一种确定性关系,而相关关系是一种非确定性关系. 回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法,其步骤:收集数据→作散点图→求回归直线方程→利用方程进行预报. 二、讲授新课: 1. 教学例题:① 例1 从某大学中随机选取8名女大学生,其身高和体重数据如下表所示: 编 号 1 2 3 4 5 6 7 8 身高/cm165165 157 170 175 165 155 170 体重/kg 4857505464614359求根据一名女大学生的身高预报她的体重的回归方程,并预报一名身高为172cm 的女大学生的体重. (分析思路→教师演示→学生整理)第一步:作散点图第二步:求回归方程 第三步:代值计算010203040506070150155160165170175180身高/cm体重/k g② 提问:身高为172cm 的女大学生的体重一定是60.316kg 吗? 不一定,但一般可以认为她的体重在60.316kg 左右. ③ 解释线性回归模型与一次函数的不同事实上,观察上述散点图,我们可以发现女大学生的体重y 和身高x 之间的关系并不能用一次函数y bx a =+来严格刻画(因为所有的样本点不共线,所以线性模型只能近似地刻画身高和体重的关系). 在数据表中身高为165cm 的3名女大学生的体重分别为48kg 、57kg 和61kg ,如果能用一次函数来描述体重与身高的关系,那么身高为165cm 的3名女在学生的体重应相同. 这就说明体重不仅受身高的影响还受其他因素的影响,把这种影响的结果e (即残差变量或随机变量)引入到线性函数模型中,得到线性回归模型y bx a e =++,其中残差变量e 中包含体重不能由身高的线性函数解释的所有部分. 当残差变量恒等于0时,线性回归模型就变成一次函数模型. 因此,一次函数模型是线性回归模型的特殊形式,线性回归模型是一次函数模型的一般形式.2. 相关系数:相关系数的绝对值越接近于1,两个变量的线性相关关系越强,它们的散点图越接近一条直线,这时用线性回归模型拟合这组数据就越好,此时建立的线性回归模型是有意义.3. 小结:求线性回归方程的步骤、线性回归模型与一次函数的不同.第二课时 1.1回归分析的基本思想及其初步应用(二)教学目标:1知识与技能:会建立回归模型,进而学习相关指数(相关系数r 、总偏差平方和、随机误差的效应即残差、残差平方和、回归平方和、相关指数R2、残差分析) 2过程与方法:通过学习会求上述的相关指数3情感态度价值观:从实际问题发现已有知识不足,激发好奇心、求知欲。

人教版A版高中数学选修1-2课后习题解答

人教版A版高中数学选修1-2课后习题解答

人教版A版高中数学选修1-2课后习题解答高中数学选修1-2课后题答案第一章统计案例1.1 回归分析的基本思想及其初步应用回归分析是一种统计分析方法,用于探究自变量与因变量之间的关系。

它的基本思想是通过建立数学模型,利用已知数据进行拟合,从而预测或解释未知数据。

回归分析的初步应用包括简单线性回归和多元线性回归。

1.2 独立性检验的基本思想及其初步应用独立性检验是一种用于检验两个变量之间是否存在关联的方法。

其基本思想是通过观察两个变量之间的频数或频率分布,来判断它们是否相互独立。

独立性检验的初步应用包括卡方检验和Fisher精确检验。

第二章推理证明2.1 合情推理与演绎推理合情推理是指根据已知事实和常识,推断出可能的结论。

演绎推理是指根据已知的前提和逻辑规则,推导出必然的结论。

两种推理方法都有其适用的场合,需要根据具体情况进行选择。

2.2 直接证明与间接证明直接证明是指通过逻辑推理,直接证明所要证明的命题成立。

间接证明是指采用反证法或归谬法,证明所要证明的命题的否定不成立,从而推出所要证明的命题成立。

第三章数系的扩充与复数的引入3.1 数系的扩充与复数的概念数系的扩充是指在实数系的基础上引入新的数,使得一些原来不可解的方程可以得到解。

复数是指由实部和虚部组成的数,可以表示在平面直角坐标系中的点。

复数的引入扩充了数系,使得一些原本无解的方程可以得到解。

3.2 复数的代数形式的四则运算复数的代数形式是指将复数表示为实部和虚部的和的形式。

复数的四则运算包括加减乘除四种运算,可以通过对实部和虚部分别进行运算来得到结果。

第四章框图4.1 流程图流程图是一种用图形表示算法或过程的方法。

它由各种基本符号和连线构成,用于描述算法或过程的各个步骤及其执行顺序。

流程图可以帮助人们更好地理解算法或过程,从而提高效率。

4.2 结构图结构图是一种用于描述程序结构的图形表示方法。

它包括顺序结构、选择结构和循环结构三种基本结构,可以用来表示程序的控制流程。

“独立性检验的基本思想及其初步应用”教材与教学解析

“独立性检验的基本思想及其初步应用”教材与教学解析
摘要 :“ 独 立 性 检 验 的基 本 思 想及 其初 步 应 用 ” 是 一 个 教 学 难 点 ,在 反 复 研 究 和 多 次教 学 实践 的 基 础 上 ,从 教 学 内容 、教
二 、教 学 指 导 思 想 分 析
《 普通高 中数学课程标 准 ( 实验 ) 》 对独立性检 验的基本 思 学指 导 思 想 、教 学 目标 、教 学 中 可 能 存 在 的 问题 、 完成 教 学 所 想及其初 步应 用 的教 学要求较低 ,在教学 实践 中,也 未引起重 需的 支持条件 、引导 学生学 习的设 问方式 、达标检测题 的设计 视 , 至 多 是 围 绕 高 考 进 行 ,许 多 教 师 也 不 知 怎 么教 才 好 ,往 往 是教学生 “ 套 用 ”教 材的解题格 式或步骤 ,可是 ,没 过多长 时 间学生就 忘了 !这种 功利性极 强的 “ 应试 教学 ”行 为难 以达 到
步骤 就是顺理成 章的事 了 ,因此 ,核 心在于独立 性检验 的基 本
思想 .

我们在 高 中数学课 程 中教授 统计 内容 ,根本 目的应是通过 些具体 的统 计案 例 ,指导学生 领会统计思 想 ,教 导学生认识
目的 ,还 需 在 今 后 的学 习或 工 作 中加 强 训 练 和应 用 . 四 、教 学 问题 诊 断分 析
1 . 教 学 内容
本节 的教学 内容是 通过 具 体实 例 “ 患 肺 癌 是 否 与 吸 烟 有 人 们 的生 存 ,直 至 推 动 社 会 发展 . 本 部 分 的 教 学 就 应 引 导 学 生 理 关” ,介绍 独立性检验 的基本思想 ,它是用 随机变量 : 判断两 解 独 立 性 检 验 的 含 义 ,探 究 独 立 性 检 验 蕴 含 的统 计 学 思 想 和 基 个 分 类 变 量有 关 的方 法 .独立 性 检 验是 一种 假设 检 验 ,它 的基 本 本 方 法 ,培 养 学 生 学 习 数 学 、研 究 数 学 的 习 惯 和 能 力 ,不 能 只 思想 来 源 于统 计 学 中的 假设 检 验 思想 . 为 了考试而轻视概念的理解 、轻视 阅读 自学能力的培养.

1.2独立性检验的基本思想及其初步应用

1.2独立性检验的基本思想及其初步应用

试用图形判断服用药和患病之间是否有关系?
解析:相应的等高条形图如下:
从图形可以看出,服用药的样本中患病的比例明显低于 没有服用药的样本中患病的比例,因此可以认为:服用药和 患病之间有关系.
独立性检验方法——K2公式
在调查的480名男士中有38名患有色盲,520名女 士中有6名患有色盲,能否在犯错误的概率不超过0.001的前 提下认为性别与患色盲有关系? 分析:
4.下面是一个2×2列联表: x1 x2 总计 y1 a 2 b y2 21 25 46 总计 73 27 100
则表中a、b的值分别为( C ) A.94、96 C.52、54 B.52、50 D.54、52
5.性别与身高列联表如下: 男 女 总计 高(165 cm以上) 37 6 43 矮(165 cm以下) 4 13 17 总计 41 19 60
作出2×2列联表 → 计算随机变量K2的值 → 对照临界值作出结论 解析:根据题目所给的数据作出如下的列联表:
色盲 不色盲 总计

女 总计
38
6 44
442
514 956
480
520 1 000
根据列联表中所给的数据可以得: a=38,b=442,c=6,d=514,a+b=480,c+d= 520,a+c=44,b+d=956,n=1 000.
3.独立性检验. 利用随机变量K2来判断“两个分类变量有关系”的方法 定义 称为独立性检验.
nad-bc2 公式 K2=_____________________ a+bc+da+cb+d ,其中n=______________. a+b+c+d
①根据实际问题的需要确定容许推断“两个分类变量有 临界值 k0 .② 关系”犯错误概率的上界α,然后查表确定 ________ k________ ≥k0 利用公式计算随机变量K2的 ________ , 观测值 k .③如果 具体 就推断“X与Y有关系”,这种推断犯错误的概率不超过 步骤 α;否则,就认为在犯错误的概率不超过α的前提下不能 推断“X与Y有关系”,或者在样本数据中没有发现足够 证据支持结论“X与Y有关系”.

高中数学选修1-2第一章课后习题解答

高中数学选修1-2第一章课后习题解答

新课程标准数学选修1—2第一章课后习题解答第一章统计案例1.1回归分析的基本思想及其初步应用练习(P8)1、画散点图的目的是通过变量的散点图判断两个变量更近似于什么样的函数关系,以确定是否直接用线性回归模型来拟合原始数据.说明:学生在对常用的函数图象比较了解的情况下,通过观察散点图可以判断两个变量的关系更近似于哪种函数.2、分析残差可以帮助我们解决以下两个问题:(1)寻找异常点,就是残差特别大的点,考察相应的样本数据是否有错.(2)分析残差图可以发现模型选择是否合适.说明:分析残差是回归诊断的一部分,可以帮助我们发现样本数据中的错误,分析模型选择是否合适,是否有其他变量需要加入到模型中,模型的假设是否正确等. 本题只要求学生能回答上面两点即可,主要让学生体会残差和残差图可以用于判断模型的拟合效果.3、(1)解释变量和预报变量的关系式线性函数关系.R=.(2)21说明:如果所有的样本点都在一条直线上,建立的线性回归模型一定是该直线,所以每个=+,没有随机误差项,是严样本点的残差均为0,残差平方和也为0,即此时的模型为y bx aR=.格的一次函数关系. 通过计算可得21习题1.1 (P9)1、(1)由表中数据制作的散点图如下:从散点图中可以看出GDP值与年份近似呈线性关系.y表示GDP值,t表示年份. 根据截距和斜率的最小二乘计算公式,得(2)用tˆ14292537.729a≈-,ˆ7191.969b≈从而得线性回归方程ˆ7191.96914292537.729=-.y t残差计算结果见下表.GDP 值与年份线性拟合残差表(年实际GDP 值为117251.9,所以预报与实际相差4275.540-.(4)上面建立的回归方程的20.974R =,说明年份能够解释约97%的GDP 值变化,因此所建立的模型能够很好地刻画GDP 和年份的关系.说明:关于2003年的GDP 值的来源,不同的渠道可能会有所不同.2、说明:本题的结果与具体的数据有关,所以答案不唯一.3、由表中数据得散点图如下:从散点图中可以看出,震级x 与大于或等于该震级的地震数N 之间不呈线性相关关系,随着x 的减少,所考察的地震数N 近似地以指数形式增长. 做变换lg y N =,得到的数据如下表所示.x 和y 的散点图如下:从这个散点图中可以看出x 和y 之间有很强的线性相关性,因此可以用线性回归模型拟合它们之间的关系. 根据截距和斜率的最小二乘计算公式,得ˆ 6.704a≈,ˆ0.741b ≈-, 故线性回归方程为 ˆ0.741 6.704y x =-+. 20.997R ≈,说明x 可以解释y 的99.7%的变化.因此,可以用回归方程 0.741 6.704ˆ10x N-+= 描述x 和N 之间的关系. 1.2独立性检验的基本思想及其初步应用练习(P15)列联表的条形图如图所示.由图及表直观判断,好像“成绩优秀与班级有关系”. 因为2K 的观测值0.653 6.635k ≈<,由教科书中表1-11克重,在犯错误的概率不超过0.01的前提下,不能认为“成绩与班级有关系”.说明:(1)教师应要求学生画出等高条形图后,从图形上判断两个分类变量之间是否有关系. 这里通过图形的直观感觉的结果可能会出错.(2)本题与例题不同,本题计算得到的2K 的观测值比较小,所以没有理由说明“成绩优秀与班级有关系”. 这与反证法也有类似的地方,在使用反证法证明结论时,假设结论不成立的条件下如果没有推出矛盾,并不能说明结论成立也不能说明结论不成立. 在独立性检验中,没有推出小概率事件发生类似于反证法中没有推出矛盾.习题1.2 (P16)1、假设“服药与患病之间没有关系”,则2K 的值应该比较小;如果2K 的值很大,则说明很可能“服药与患病之间没有关系”. 由列联表中数据可得2K 的观测值 6.110 5.024k ≈>,而由教科书表1-11,得2( 5.024)0.025P K ≥≈,所以在犯错误的概率不超过0.025的前提下可以认为“服药与患病之间有关系”. 又因为服药群体中患病的频率0.182小于没有服药群体中患病的频率0.400,所以“服药与患病之间关系”可以解释为药物对于疾病有预防作用. 因此在犯错误的概率不超过0.025的前提下,可以认为药物有效.说明:仿照例1,学生很容易完成此题,但希望学生能理解独立性检验在这里的具体含义,即“服药与患病之间关系”可以解释为“药物对于疾病有预防作用”.2、如果“性别与读营养说明之间没有关系”,由题目中所给数据计算,得2K 的观测值为8.416k ≈,而由教科书中表1-11知2(7.879)0.005P K ≥≈,所以在犯错误的概率不超过0.005的前提下认为“性别与读营养说明之间有关系”.3、说明:需要收集数据,所有没有统一答案. 第一步,要求学生收集并整理数据后得到列联表;第二步,类似上面的习题做出判断.4、说明:需要从媒体上收集数据,学生关心的问题不同,收集的数据会不同. 第一步,要求学生收集并整理数据后得到列联表;第二步,类似上面的习题做出判断.第一章 复习参考题A 组(P19)根据散点图,可以认为中国人口总数与年份呈现很强的线性相关关系,因此选用线性回归模型建立回归方程.由最小二乘法的计算公式,得 2095141.503a ≈-,1110.903b ≈,则线性回归方程为 ˆ1110.9032095141.503yx =-. 由2R 的计算公式,得 20.994R ≈,明线性回归模型对数据的拟合效果很好.根据回归方程,,预计2003年末中国人口总数约为129997万人,而实际情况为129227万人,预测误差为770万人;预计2004年末中国人口总数约为131108万人,而实际情况为129988万人,预测误差为1120万人.说明:数据来源为《中国统计年鉴》(2003). 由于人数为整数,所以预测的数据经过四舍五入的取整运算.2、(1)将销售总额作为横轴,利润作为纵轴,根据表中数据绘制散点图如下:由于散点图中的样本点基本上在一个带形区域内分布,猜想销售总额与利润之间呈现线性相关关系.(2)由最小二乘法的计算公式,得 ˆ1334.5a≈,ˆ0.026b ≈, 则线性回归方程为 ˆ0.0261334.5yx =+ 其残差值计算结果见下表:(3)对于(2)中所建立的线性回归方程,20.457R ≈,说明在线性回归模型中销售总额只能解释利润变化的46%,所以线性回归模型不能很好地刻画销售总额和利润之间的关系. 说明:此题也可以建立对数模型或二次回归模型等,只要计算和分析合理,就算正确.3、由所给数据计算得2K 的观测值为 3.689k ≈,而由教科书中表1-11知2( 2.706)0.10P K ≥=所以在犯错误的概率不超过0.10的前提下认为“婴儿的性别与出生的时间有关系”.第一章 复习参考题B 组(P19)1、因为 21(,)()ni i i Q a b y a bx ==--∑21(()())n i i i y bx y bx a y bx ==--+--+∑ 2211()()n n i i i i y bx y bx a y bx ===--++-+∑∑12()()ni i i y bx y bx a y bx =---+-+∑ 并且221()()n i a y bx n a y bx =-+=-+∑,12()()n i i i y bx y bx a y bx =--+-+∑ 1()(())ni i i a y bx y bx ny nbx ==-+--+∑ ()()0a y b x n y n b xn y n b x=-+--+= 所以 221(,)()()ni i i Q a b y bx y bx n a y bx ==--++-+∑.考察上面的等式,等号右边的求和号中不包含a ,而另外一项非负,所以ˆa和ˆb 必然使得等号右边的最后一项达到最小值,即 ˆˆ0ay bx -+=, 即ˆˆy a bx =+. 2、总偏差平方和21()n i i y y =-∑表示总的效应,即因变量的变化效应;残差平方和21ˆ()ni i y y =-∑表示随机误差的效应,即随机误差的变化效应;回归平方和21ˆ()ni yy =-∑表示表示变量的效应,即自变量的变化效应. 等式 222111ˆˆ()()()n n n i ii i i y y y y y y ===-=-+-∑∑∑ 表示因变量的变化总效应等于随机误差的变化效应与自变量的变化效应之和.3、说明:该题主要是考察学生应用回归分析模型解决实际问题的能力,解答应该包括如何获取数据,如何根据散点图寻找合适的模型去拟合数据,以及所得结果的解释三方面的内容.。

高中数学 第一章 统计案例 1.2 独立性检验的基本思想及其初步应用自我小测 新人教A版选修1-2(

高中数学 第一章 统计案例 1.2 独立性检验的基本思想及其初步应用自我小测 新人教A版选修1-2(

测新人教A版选修1-2编辑整理:尊敬的读者朋友们:这里是精品文档编辑中心,本文档内容是由我和我的同事精心编辑整理后发布的,发布之前我们对文中内容进行仔细校对,但是难免会有疏漏的地方,但是任然希望(高中数学第一章统计案例1.2 独立性检验的基本思想及其初步应用自我小测新人教A版选修1-2)的内容能够给您的工作和学习带来便利。

同时也真诚的希望收到您的建议和反馈,这将是我们进步的源泉,前进的动力。

本文可编辑可修改,如果觉得对您有帮助请收藏以便随时查阅,最后祝您生活愉快业绩进步,以下为高中数学第一章统计案例1.2 独立性检验的基本思想及其初步应用自我小测新人教A版选修1-2的全部内容。

我小测新人教A版选修1—21.下面是2×2列联表:则表中a,b的值分别为(A.94,96 B.52,50 C.52,54 D.54,522.对于分类变量X与Y的随机变量K2的观测值k,下列说法正确的是( )A.k越大,推断“X与Y有关系”,犯错误的概率越大B.k越小,推断“X与Y有关系”,犯错误的概率越大C.k越接近于0,推断“X与Y无关",犯错误的概率越大D.k越大,推断“X与Y无关”,犯错误的概率越小名学生进行了作业量的调查,数据如下表:3.某班主任对全班50A.99% B.95%C.90% D.无充分根据4.在列联表中,相差越大,两个分类变量之间的关系越强的两个比值是()A.错误!与错误! B.错误!与错误!C.错误!与错误! D.错误!与错误!5.在一项打鼾与患心脏病是否有关的调查中,共调查了1 978人,经过计算K2=28.63,根据这一数据分析,我们有理由认为打鼾与患心脏病是__________的.(填“有关"、“无关”) 6.有人发现,多看电视容易使人变冷漠,下表是一个调查机构对此现象的调查结果.7.为研究学生的数学成绩与学习数学的兴趣浓厚是否有关,对某年级学生作调查,得到如下数据:成绩好坏与学习数学的兴趣浓厚有关?8.在500个用血清的人身上试验某种血清预防感冒的作用,把一年中的记录与另外500个未用血清的人作比较,结果如下:9.某企业有两个分厂生产某种零件,按规定内径尺寸(单位:mm)的值落在[29。

人教A版高中数学选修1-2《一章 统计案例 1.2 独立性检验的基本思想及其初步应用》精品课件_33

人教A版高中数学选修1-2《一章 统计案例  1.2 独立性检验的基本思想及其初步应用》精品课件_33

解:根据题目所给数据得到如下列联表:
患心脏病 不患心脏病 总计
秃顶
214
ቤተ መጻሕፍቲ ባይዱ不秃顶
451
总计
665
175
389
597
1048
772
1437
根据列联表中的数据,得到
K 2 1437 (214597 175 451)2 16.373 6.635. 3891048 665 772
案 例:某医疗机构为了了解呼吸道疾病与吸 烟是否有关,进行了一次抽样调查,共调查了 515个成年人,其中吸烟者220人,不吸烟者 295人。
调查结果:吸烟的220人中有37人患呼吸道疾 病,183人未患呼吸道疾病;不吸烟的295人中 有21人患病,274人未患病。
根据这些数据,能否断定:患呼吸道疾 病与吸烟有关?
(2)求k值 (3)下结论
5
8
3
2
6
1
4
5
9
8
(1)如果k 10.828,就有99.9%的把握认为" X 与Y有关系" (2)如果k 7.879,就有99.5%的把握认为" X 与Y有关系"
(3)如果k 6.635,就有99%的把握认为" X 与Y有关系"
(4)如果k 5.024,就有97.5%的把握认为" X 与Y有关系"
练习3:为了调查胃病是否与生活规律有关,在某地对540名40岁以上 的人进行了调查,结果是:患胃病者生活不规律的共60人,患胃病者 生活规律的共20人,未患胃病者生活不规律的共260人,未患胃病者生 活规律的共200人. (1)根据以上数据列出2×2列联表; (2)能够以99%的把握认为40岁以上的人患胃病与否和生活规律有关 系吗?为什么?

高中数学 第一章 统计案例 1.2 独立性检验是如何判断

高中数学 第一章 统计案例 1.2 独立性检验是如何判断

独立性检验是如何判断两个事件是否相互独立的独立性检验的基本思想类似于反证法.要确认“两个分类变量有关系”这一结论成立的可信程度,首先假设结论不成立,即假设结论“两个分类变量没有关系”成立,在该假设下构造的随机变量2χ应该很小.如果由观测数据计算得到的2χ的观测值很大,则在一定程度上说明假设不合理.根据随机变量2χ的含义,可以通过概率式评价该假设不合理的程度,由实际计算的2χ>6.635,说明假设不合理的程度约为99%,即“两个分类变量有关系”这一结论成立的可信程度约为99%.当2χ≤3.841时,认为两个分类变量是无关的.对于两事件而言即相互独立. 1.两个事件独立的判定例1: 为了研究不同的给药方式(口服与注射)和药的效果(有效与无效)是否有关,进根据193个病人的数据,能否作出药的效果与给药方式有关的结论?请说明理由. 解:提出假设H 0:药的效果与给药方式无关系.根据列联表中的数据,得χ2=2193(58314064)122719895-⨯-⨯⨯⨯⨯≈1.3896<2.072.当H 0成立时,χ2>1.3896的概率大于15%,这个概率比较大,所以根据目前的调查数据,不能否定假设H 0,即不能作出药的效果与给药方式有关的结论.注意:这是一个由列联表来验证的独立性检验问题,其结论是没有关系的假设成立.并且应该注意上述结论是对所有口服药物与注射药物的实验人而言的,绝不要误以为对被跟踪的193个跟踪研究对象成立.例2:调查某医院某段时间内婴儿出生的时间与性别的关系,得到下面的数据表.试问能以多大把握认为婴儿的性别与出生时间有关系.分析:利用表中的数据通过公式计算出2χ统计量,可以用它的取值大小来推断独立性是否成立. 解:由公式()841.368892.35732345531826248922<≈⨯⨯⨯⨯-⨯⨯=χ 故婴儿的性别与出生时间是相互独立的(也可以说没有充分证据显示婴儿的性别与出生时间有关).2.两个事件不独立的判定例3:在某医院,因为患心脏病而住院的665名男性病人中,有214人秃顶,而另外772名不是因为患心脏病而住院的男性病人中有175人秃顶.利用独立性检验方法判断秃顶与患心脏病是否有关系?你所得的结论在什么范围内有效?分析:列出22⨯列联表,利用公式求出2χ与两个临界值3.841与6.635比较大小得适当范围.解:根据题目所给数据得到如下表所示: 秃顶与患心脏病列联表由公式,得:()635.6373.167726651048389451175597214143722>≈⨯⨯⨯⨯-⨯⨯=χ 所以有99%的把握认为“秃顶与患心脏病有关”.说明:因为这组数据来自住院的病人,因此所得到的结论适合住院的病人群体.例 4.某班主任对全班50名学生进行了作业量多少的调查,喜欢玩电脑游戏的同学认为作业多的有18人,认为作业不多的有9人,不喜欢玩电脑游戏的同学认为作业多的有8人,认为作业不多的有15人,则认为喜欢玩电脑游戏与认为作业量的多少有关系的把握大约是多少?2x =059.523272426)981518(502=⨯⨯⨯⨯-⨯, ()024.52>x P =0.025,有97.5%的把握认为喜欢玩电脑游戏与认为作业多有关系.。

2017-2018版高中数学 第一章 统计案例 1.1 独立性检验课件 新人教B版选修1-2

2017-2018版高中数学 第一章 统计案例 1.1 独立性检验课件 新人教B版选修1-2

频数
5 10 15 10
5
5
支持“生育二孩放开” 4
5
12
8
2
1
由以上统计数据填下面2×2列联表:
支持 不支持
合计
年龄不低于45岁的人数 a= b=
年龄低于45岁的人数 c= d=
合计
解答
反思与感悟
准确理解给定信息,找准分类变量,然后依次填入相应空格内数据.
跟踪训练1 某校高二年级共有1 600名学生,其中男生960名,女生640名, 该校组织了一次满分为100分的数学学业水平模拟考试.根据研究,在正式 的 学 业 水 平 考 试 中 , 本 次 成 绩 在 [80,100] 的 学 生 可 取 得 A 等 ( 优 秀 ) , 在 [60,80]的学生可取得B等(良好),在[40,60]的学生可取得C等(合格),不到 40分的学生只能取得D等(不合格).为研究这次考试成绩优秀是否与性别有 关,现按性别采用分层抽样的方法抽取100名学生,将他们的成绩按从低 到高分成[30,40),[40,50),[50,60),[60,70),[70,80),[80,90),[90,100],
解答
当堂训练
1.下面是一个2×2列联表:
y1
y2
总计
x1
a 21
73
x2
2 25
27
总计 b 46
则表中a,b处的值分别为
A.94,96
√C.52,54
B.52,50 D.54,52
解析 ∵a+21=73,∴a=52,b=a+2=52+2=54.
12345
解析 答案
2.某科研机构为了研究中年人秃发与心脏病是否有关,随机调查了一些 中年人的情况,具体数据如表:
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

1.2 独立检验的基本思想及其初步应用[核心必知]1.预习教材,问题导入根据以下提纲,预习教材P10~P15的内容,回答下列问题.阅读教材P10“探究”的内容,思考:(1)是否吸烟、是否患肺癌是什么变量?提示:分类变量.(2)吸烟与患肺癌之间的关系还是前面我们研究的线性相关关系吗?提示:不是.(3)如何研究吸烟是否对患肺癌有影响?提示:独立性检验.2.归纳总结,核心必记(1)分类变量变量的不同“值”表示个体所属的不同类别,像这样的变量称为分类变量.(2)列联表①定义:列出的两个分类变量的频数表称为列联表.②2×2列联表一般地,假设有两个分类变量X和Y,它们的取值分别为{x1,x2}和{y1,y2},其样本频数列联表(称为2×2列联表)为(3)等高条形图①图形与表格相比,更能直观地反映出两个分类变量间是否相互影响,常用等高条形图展示列联表数据的频率特征.②通过直接计算或观察等高条形图发现aa+b和cc+d相差很大,就判断两个分类变量之间有关系.(4)独立性检验K2=n ad-bc2a+b c+d a+c b+d,其中n=a+b+c+d(1)有人说:“在犯错误的概率不超过0.01的前提下认为吸烟和患肺癌有关,是指每100个吸烟者中就会有99个患肺癌的.”你认为这种观点正确吗?为什么?提示:观点不正确.犯错误的概率不超过0.01说明的是吸烟与患肺癌有关的程度,不是患肺癌的百分数.(2)应用独立性检验的基本思想对两个变量间的关系作出的推断一定是正确的吗?提示:不一定.所有的推断只代表一种可能性,不代表具体情况.(3)下面是2×2列联表.y1则表中a,b提示:a=46-13=33,b=33+a=33+33=66.[课前反思](1)分类变量的定义是什么?(2)列联表的定义是什么?2×2列联表中的各个数据有什么意义?(3)什么是等高条形图,有什么作用?(4)独立性检验的内容是什么?讲一讲1.在对人们饮食习惯的一次调查中,共调查了124人,其中六十岁以上的70人,六十岁以下的54人.六十岁以上的人中有43人的饮食以蔬菜为主,另外27人则以肉类为主;六十岁以下的人中有21人饮食以蔬菜为主,另外33人则以肉类为主.请根据以上数据作出饮食习惯与年龄的列联表,并利用aa +b 与cc +d判断二者是否有关系.[尝试解答] 2×2列联表如下:aa +b =4364=0.671 875.c c +d =2760=0.45. 显然二者数据具有较为明显的差距,据此可以在某种程度上认为饮食习惯与年龄有关系.(1)作2×2列联表时,关键是对涉及的变量分清类别.计算时要准确无误.(2)利用2×2列联表分析两个分类变量间的关系时,首先要根据题中数据获得2×2列联表,然后根据频率特征,即将aa +b 与c c +d ⎝ ⎛⎭⎪⎫ba +b 与dc +d 的值相比,直观地反映出两个分类变量间是否相互影响,但方法较粗劣.练一练1.假设有两个分类变量X与Y,它们的可能取值分别为{x1,x2}和{y1,y2},其2×2列联表为:则当m取下面何值时,X与YA.8 B.9 C.14 D.19解析:选C 由10×26≈18m,解得m≈14.4,所以当m=14时,X与Y的关系最弱.讲一讲2.某学校对高三学生作了一项调查发现:在平时的模拟考试中,性格内向的学生426人中有332人在考前心情紧张,性格外向的学生594人中有213人在考前心情紧张,作出等高条形图,利用图形判断考前心情紧张与性格类型是否有关系.[尝试解答] 作列联表如下:图中阴影部分表示考前心情紧张与考前心情不紧张中性格内向的人数的比例,从图中可以看出考前心情紧张的样本中性格内向的人数占的比例比考前心情不紧张样本中性格内向的人数占的比例高,可以认为考前紧张与性格类型有关.利用等高条形图判断两个分类变量是否相关的步骤:练一练2.在调查的480名男人中有38人患色盲,520名女人中有6名患色盲,试利用图形来判断色盲与性别是否有关?解:根据题目给出的数据作出如下的列联表:我们认为患色盲与性别是有关系的.3.研究人员选取170名青年男女大学生为样本,对他们进行一种心理测验.发现有60名女生对该心理测验中的最后一个题目的反应是:作肯定的有22名,否定的有38名;110名男生在相同的项目上作肯定的有22名,否定的有88名.问:性别与态度之间是否存在某种关系?用独立性检验的方法判断.(链接教材P13-例1)附:[尝试解答]根据2×2k=-2110×60×44×126≈5.622>5.024.所以在犯错误的概率不超过0.025的前提下,认为“性别与态度有关系”.根据题意列出2×2列联表,计算K2的观测值,如果K2的观测值很大,说明两个分类变量有关系的可能性很大;如果K2的观测值比较小,则认为没有充分的证据显示两个分类变量有关系.练一练3.在一次天气恶劣的飞机航程中,调查了男女乘客在飞机上晕机的情况:男乘客晕机的有24人,不晕机的有31人;女乘客晕机的有8人,不晕机的有26人.请你根据所给数据判定:在天气恶劣的飞机航程中,男乘客是否比女乘客更容易晕机?附:解:根据题意,列出由公式可得K2的观测值k=n ad-bc2a +b c+d a+c b+d=-255×34×32×57≈3.689>2.706,故在犯错误的概率不超过0.10的前提下,认为“在天气恶劣的飞机航程中男乘客比女乘客更容易晕机”.——————————————[课堂归纳·感悟提升]——————————1.本节课的重点是用2×2列联表、等高条形图分析两个分类变量间的关系以及独立性检验.2.本节课要重点掌握的规律方法(1)用2×2列联表分析两分类变量间的关系,见讲1;(2)用等高条形图分析两分类变量间的关系,见讲2;(3)独立性检验,见讲3.3.解决一般的独立性检验问题的步骤:(1)通过列联表确定a,b,c,d,n的值,根据实际问题需要的可信程度确定临界值k0;(2)利用K2=n ad-bc2a +b c+d a+c b+d求出K2的观测值k;(3)如果k≥k0,就推断“两个分类变量有关系”,这种推断犯错误的概率不超过α,否则就认为在犯错误的概率不超过α的前提下不能推断“两个分类变量有关系”.其中第(2)步易算错K2的值,是本节课的易错点.课下能力提升(二)[学业水平达标练]题组1 用2×2列联表分析两分类变量间的关系1.分类变量X和Y的列联表如下:dA.ad-bc越小,说明X与Y关系越弱B.ad-bc越大,说明X与Y关系越强C.(ad-bc)2越大,说明X与Y关系越强D.(ad-bc)2越接近于0,说明X与Y关系越强解析:选C |ad -bc |越小,说明X 与Y 关系越弱,|ad -bc |越大,说明X 与Y 关系越强.2.假设有两个变量X 与Y ,它们的取值分别为x 1,x 2和y 1,y 2,其列联表为:( ) A .a =50,b =40,c =30,d =20 B .a =50,b =30,c =40,d =20 C .a =20,b =30,c =40,d =50 D .a =20,b =30,c =50,d =40解析:选D 当(ad -bc )2的值越大,随机变量K 2=n ad -bc 2a+bc +d a +cb +d的值越大,可知X 与Y 有关系的可能性就越大.显然选项D 中,(ad -bc )2的值最大.3.某电视台在一次对收看文艺节目和新闻节目观众的抽样调查中,随机抽取了100名电视观众,相关的数据如下表所示:填“是”或“否”).解析:因为在20至40岁的58名观众中有18名观众收看新闻节目,而大于40岁的42名观众中有27名观众收看新闻节目,即ba +b =1858,dc +d =2742,两者相差较大,所以经直观分析,收看新闻节目的观众与年龄是有关的.答案:是题组2 用等高条形图分析两分类变量间的关系4.如图是调查某地区男女中学生喜欢理科的等高条形图,阴影部分表示喜欢理科的百分比,从图中可以看出( )A.性别与喜欢理科无关B.女生中喜欢理科的百分比为80%C.男生比女生喜欢理科的可能性大些D.男生不喜欢理科的比为60%解析:选C 从图中可以分析,男生喜欢理科的可能性比女生大一些.5.观察下列各图,其中两个分类变量x,y之间关系最强的是( )解析:选D 在四幅图中,D图中两个深色条的高相差最明显,说明两个分类变量之间关系最强.6.为了研究子女吸烟与父母吸烟的关系,调查了一千多名青少年及其家长,数据如下:解:等高条形图如图所示:由图形观察可以看出父母吸烟者中子女吸烟的比例要比父母不吸烟者中子女吸烟的比例高,因此可以在某种程度上认为“子女吸烟与父母吸烟有关系”.题组3 独立性检验7.在一项中学生近视情况的调查中,某校男生150名中有80名近视,女生140名中有70名近视,在检验这些中学生眼睛近视是否与性别有关时用什么方法最有说服力( ) A.平均数与方差 B.回归分析C.独立性检验 D.概率解析:选C 判断两个分类变量是否有关的最有效方法是进行独立性检验.8.对于分类变量X与Y的随机变量K2的观测值k,下列说法正确的是( )A.k越大,“X与Y有关系”的可信程度越小B.k越小,“X与Y有关系”的可信程度越小C.k越接近于0,“X与Y没有关系”的可信程度越小D.k越大,“X与Y没有关系”的可信程度越大解析:选B k越大,“X与Y没有关系”的可信程度越小,则“X与Y有关系”的可信程度越大,即k越小,“X与Y有关系”的可信程度越小.9.在吸烟与患肺病是否相关的判断中,有下面的说法:①若K2的观测值k>6.635,则在犯错误的概率不超过0.01的前提下,认为吸烟与患肺病有关系,那么在100个吸烟的人中必有99人患有肺病;②从独立性检验可知在犯错误的概率不超过0.01的前提下,认为吸烟与患肺病有关系时,若某人吸烟,则他有99%的可能患有肺病;③从独立性检验可知在犯错误的概率不超过0.05的前提下,认为吸烟与患肺病有关系时,是指有5%的可能性使得推断错误.其中说法正确的是________.解析:K2是检验吸烟与患肺病相关程度的量,是相关关系,而不是确定关系,是反映有关和无关的概率,故说法①不正确;说法②中对“确定容许推断犯错误概率的上界”理解错误;说法③正确.答案:③10.为了解决高二年级统计案例入门难的问题,某校在高一年级的数学教学中设有试验班,着重加强统计思想的渗透,下面是高二年级统计案例的测验成绩统计表(单位:分)的一部分,试分析试验效果.附:k=n ad-bc2a +b c+d a+c b+d=-250×50×44×56≈16.234.因为16.234>6.635,所以,在犯错误的概率不超过0.01的前提下认为高二年级统计案例的测试成绩与高一年级数学教学中增加统计思想的渗透有联系.[能力提升综合练]1.利用独立性检验对两个分类变量是否有关系进行研究时,若有99.5%的把握认为事件A和B有关系,则具体计算出的数据应该是( )A.k≥6.635 B.k<6.635C.k≥7.879 D.k<7.879解析:选C 有99.5%的把握认为事件A和B有关系,即犯错误的概率为0.5%,对应的k0的值为7.879,由独立性检验的思想可知应为k≥7.879.2.通过随机询问110名性别不同的大学生是否爱好某项运动,得到如下的列联表:由K2=a +b c+d a+c b+d算得,观测值k=-260×50×60×50≈7.8.附表:A.有99%以上的把握认为“爱好该项运动与性别有关”B.有99%以上的把握认为“爱好该项运动与性别无关”C.在犯错误的概率不超过0.1% 的前提下,认为“爱好该项运动与性别有关”D.在犯错误的概率不超过0.1% 的前提下,认为“爱好该项运动与性别无关”解析:选A 由k≈7.8及P(K2≥6.635)=0.010可知,在犯错误的概率不超过1%的前提下认为“爱好该项运动与性别有关”,也就是有99%以上的把握认为“爱好该项运动与性别有关”.3.某人研究中学生的性别与成绩、视力、智商、阅读量这4个变量的关系,随机抽查了52名中学生,得到统计数据如表1至表4,则与性别有关联的可能性最大的变量是( )表1表3A.成绩 B.视力C.智商 D.阅读量解析:选D 因为K21=-2 16×36×32×20=52×8216×36×32×20,K22=-216×36×32×20=52×112216×36×32×20,k23=-216×36×32×20=52×96216×36×32×20,K24=-216×36×32×20=52×408216×36×32×20,则有K24>K22>K23>K21,所以阅读量与性别有关联的可能性最大.4.下列关于K2的说法中,正确的有________.①K2的值越大,两个分类变量的相关性越大;②K2的计算公式是K2=n ad-bca +b c+d a+c b+d;③若求出K2=4>3.841,则有95%的把握认为两个分类变量有关系,即有5%的可能性使得“两个分类变量有关系”的推断出现错误;④独立性检验就是选取一个假设H0条件下的小概率事件,若在一次试验中该事件发生了,这是与实际推断相抵触的“不合理”现象,则作出拒绝H0的推断.解析:对于①,K2的值越大,只能说明我们有更大的把握认为二者有关系,却不能判断相关性大小,故①错;对于②,(ad-bc)应为(ad-bc)2,故②错;③④对.答案:③④5.某班主任对全班50名学生作了一次调查,所得数据如表:错误的概率不超过0.01的前提下认为喜欢玩电脑游戏与认为作业多有关.解析:查表知若要在犯错误的概率不超过0.01的前提下认为喜欢玩电脑游戏与认为作业多有关,则临界值k0=6.635,本题中,k≈5.059<6.635,所以不能在犯错误的概率不超过0.01的前提下认为喜欢玩电脑游戏与认为作业多有关.答案:不能6.随着生活水平的提高,人们患肝病的越来越多,为了解中年人患肝病与经常饮酒是否有关,现对30名中年人进行了问卷调查得到如下列联表:已知在全部30人中随机抽取1人,抽到肝病患者的概率为15.(1)请将上面的列联表补充完整,并判断是否有99.5%的把握认为患肝病与常饮酒有关?说明你的理由;(2)现从常饮酒且患肝病的中年人(恰有2名女性)中,抽取2人参加电视节目,则正好抽到一男一女的概率是多少?参考数据:解:(1)设患肝病中常饮酒的人有x人,30=15,x=6.由已知数据可求得K2=10×20×8×22≈8.523>7.879,因此有99.5%的把握认为患肝病与常饮酒有关.(2)设常饮酒且患肝病的男性为A,B,C,D,女性为E,F,则任取两人有AB,AC,AD,AE,AF,BC,BD,BE,BF,CD,CE,CF,DE,DF,EF,共15种.其中一男一女有AE,AF,BE,BF,CE,CF,DE,DF,共8种.故抽出一男一女的概率是P=8 15 .7.某食品厂为了检查甲乙两条自动包装流水线的生产情况,随机在这两条流水线上各抽取40件产品作为样本称出它们的质量(单位:克),质量值落在(495,510]的产品为合格品,否则为不合格品.表1是甲流水线样本频数分布表,图1是乙流水线样本频率分布直方图.表1 甲流水线样本频数分布表(505,510](1)根据上表数据作出甲流水线样本频率分布直方图;(2)若以频率作为概率,试估计从两条流水线分别任取1件产品,该产品恰好是合格品的概率分别是多少;(3)由以上统计数据作出2×2列联表,并回答在犯错误的概率不超过多少的前提下认为“产品的包装质量与两条要自动包装流水线的选择有关”.解:(1)甲流水线样本频率分布直方图如下:(2)由表1知甲样本合格品数为8+14+8=30,由图1知乙样本中合格品数为(0.06+0.09+0.03)×5×40=36, 故甲样本合格品的频率为3040=0.75,乙样本合格品的频率为3640=0.9,据此可估计从甲流水线任取1件产品, 该产品恰好是合格品的概率为0.75. 从乙流水线任取1件产品, 该产品恰好是合格品的概率为0.9. (3)2×2列联表如下:因为K2的观测值k=n ad-bc2a +b c+d a+c b+d=-266×14×40×40≈3.117>2.706,所以在犯错误的概率不超过0.1的前提下认为产品的包装质量与两条自动包装流水线的选择有关.。

相关文档
最新文档