人教版数学选修1-2第一章1.2独立性检验的基本思想及其初步应用
高中数学人教版选修1-2全套教案
高中数学人教版选修1-2全套教案第一章统计案例第一课时 1.1回归分析的基本思想及其初步应用(一)教学目标1、知识与技能目标 认识随机误差;2、过程与方法目标(1)会使用函数计算器求回归方程; (2)能正确理解回归方程的预报结果. 3、情感、态度、价值观通过本节课的学习,加强数学与现实生活的联系,以科学的态度评价两个变量的相关性,理解处理问题的方法,形成严谨的治学态度和锲而不舍的求学精神.培养学生运用所学知识,解决实际问题的能力.教学中适当地利用学生合作与交流,使学生在学习的同时,体会与他人合作的重要性.教学重点:了解线性回归模型与函数模型的差异,了解判断刻画模型拟合效果的方法-相关指数和残差分析. 教学难点:解释残差变量的含义,了解偏差平方和分解的思想. 教学过程: 一、复习准备:1. 提问:“名师出高徒”这句彦语的意思是什么?有名气的老师就一定能教出厉害的学生吗?这两者之间是否有关?2. 复习:函数关系是一种确定性关系,而相关关系是一种非确定性关系. 回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法,其步骤:收集数据→作散点图→求回归直线方程→利用方程进行预报. 二、讲授新课: 1. 教学例题:① 例1 从某大学中随机选取8名女大学生,其身高和体重数据如下表所示: 编 号 1 2 3 4 5 6 7 8 身高/cm165165 157 170 175 165 155 170 体重/kg 4857505464614359求根据一名女大学生的身高预报她的体重的回归方程,并预报一名身高为172cm 的女大学生的体重. (分析思路→教师演示→学生整理)第一步:作散点图第二步:求回归方程 第三步:代值计算010203040506070150155160165170175180身高/cm体重/k g② 提问:身高为172cm 的女大学生的体重一定是60.316kg 吗? 不一定,但一般可以认为她的体重在60.316kg 左右. ③ 解释线性回归模型与一次函数的不同事实上,观察上述散点图,我们可以发现女大学生的体重y 和身高x 之间的关系并不能用一次函数y bx a =+来严格刻画(因为所有的样本点不共线,所以线性模型只能近似地刻画身高和体重的关系). 在数据表中身高为165cm 的3名女大学生的体重分别为48kg 、57kg 和61kg ,如果能用一次函数来描述体重与身高的关系,那么身高为165cm 的3名女在学生的体重应相同. 这就说明体重不仅受身高的影响还受其他因素的影响,把这种影响的结果e (即残差变量或随机变量)引入到线性函数模型中,得到线性回归模型y bx a e =++,其中残差变量e 中包含体重不能由身高的线性函数解释的所有部分. 当残差变量恒等于0时,线性回归模型就变成一次函数模型. 因此,一次函数模型是线性回归模型的特殊形式,线性回归模型是一次函数模型的一般形式.2. 相关系数:相关系数的绝对值越接近于1,两个变量的线性相关关系越强,它们的散点图越接近一条直线,这时用线性回归模型拟合这组数据就越好,此时建立的线性回归模型是有意义.3. 小结:求线性回归方程的步骤、线性回归模型与一次函数的不同.第二课时 1.1回归分析的基本思想及其初步应用(二)教学目标:1知识与技能:会建立回归模型,进而学习相关指数(相关系数r 、总偏差平方和、随机误差的效应即残差、残差平方和、回归平方和、相关指数R2、残差分析) 2过程与方法:通过学习会求上述的相关指数3情感态度价值观:从实际问题发现已有知识不足,激发好奇心、求知欲。
人教版A版高中数学选修1-2课后习题解答
人教版A版高中数学选修1-2课后习题解答高中数学选修1-2课后题答案第一章统计案例1.1 回归分析的基本思想及其初步应用回归分析是一种统计分析方法,用于探究自变量与因变量之间的关系。
它的基本思想是通过建立数学模型,利用已知数据进行拟合,从而预测或解释未知数据。
回归分析的初步应用包括简单线性回归和多元线性回归。
1.2 独立性检验的基本思想及其初步应用独立性检验是一种用于检验两个变量之间是否存在关联的方法。
其基本思想是通过观察两个变量之间的频数或频率分布,来判断它们是否相互独立。
独立性检验的初步应用包括卡方检验和Fisher精确检验。
第二章推理证明2.1 合情推理与演绎推理合情推理是指根据已知事实和常识,推断出可能的结论。
演绎推理是指根据已知的前提和逻辑规则,推导出必然的结论。
两种推理方法都有其适用的场合,需要根据具体情况进行选择。
2.2 直接证明与间接证明直接证明是指通过逻辑推理,直接证明所要证明的命题成立。
间接证明是指采用反证法或归谬法,证明所要证明的命题的否定不成立,从而推出所要证明的命题成立。
第三章数系的扩充与复数的引入3.1 数系的扩充与复数的概念数系的扩充是指在实数系的基础上引入新的数,使得一些原来不可解的方程可以得到解。
复数是指由实部和虚部组成的数,可以表示在平面直角坐标系中的点。
复数的引入扩充了数系,使得一些原本无解的方程可以得到解。
3.2 复数的代数形式的四则运算复数的代数形式是指将复数表示为实部和虚部的和的形式。
复数的四则运算包括加减乘除四种运算,可以通过对实部和虚部分别进行运算来得到结果。
第四章框图4.1 流程图流程图是一种用图形表示算法或过程的方法。
它由各种基本符号和连线构成,用于描述算法或过程的各个步骤及其执行顺序。
流程图可以帮助人们更好地理解算法或过程,从而提高效率。
4.2 结构图结构图是一种用于描述程序结构的图形表示方法。
它包括顺序结构、选择结构和循环结构三种基本结构,可以用来表示程序的控制流程。
2014年人教A版选修1-2课件 1.2 独立性检验的基本思想及其初步应用
问题1. 下表是对吸烟和不吸烟的人中患肺癌的调 查数据, 你能从中分析吸烟对患肺癌的影响程度吗?
不吸烟 吸烟 总计 不患肺癌 7775 2099 9874 患肺癌 42 49 91 总计 7817 2148 9965
对于某种变量取不同的 “值” 表示不同的类别, 这样的变量称为分类变量. 如: 是否吸烟, 是否信仰宗教, 男性或女性等. 如上表这样, 列出两个分类变量的频数表, 称为 列联表.
不患肺癌 患肺癌 总计 不吸烟 a b a+ b 即 |ad -bc| 越小, 吸烟与患肺癌之间的关系越弱 ; 吸烟 c d c+d 反之越强.总计 a+ c b+ d a+b+c+d
为了使不同容量的数据有统一的评判标准, 我们 我们把列联表中的数字用字母代替, 并计算: 把检查 |ad-bc| 的大小转换成检查 a ; “不吸烟” 样本中 “不患肺癌” 的比例 : n(ad - bc)2 a+ b 2 K , (a + b)(c + d )(a的比例 + c)(b +c “吸烟” 样本中 “不患肺癌” :d ) . c+d 其中 na+b+c+d 为样本容量. 假设 H0: 吸烟与患肺癌没有关系 , 则需 2 若 H0 成立, a则 K c 应该很小. , ad-bc≈0. a + b c + d H0 成立与否呢? 小到什么程度来判断
0.4
0.2 0 不吸烟 吸烟
问题1. 下表是对吸烟和不吸烟的人中患肺癌的调 查数据, 你能从中分析吸烟对患肺癌的影响程度吗?
不吸烟 吸烟 总计 不患肺癌 7775 2099 9874
1
1.2独立性检验的基本思想及其初步应用
试用图形判断服用药和患病之间是否有关系?
解析:相应的等高条形图如下:
从图形可以看出,服用药的样本中患病的比例明显低于 没有服用药的样本中患病的比例,因此可以认为:服用药和 患病之间有关系.
独立性检验方法——K2公式
在调查的480名男士中有38名患有色盲,520名女 士中有6名患有色盲,能否在犯错误的概率不超过0.001的前 提下认为性别与患色盲有关系? 分析:
4.下面是一个2×2列联表: x1 x2 总计 y1 a 2 b y2 21 25 46 总计 73 27 100
则表中a、b的值分别为( C ) A.94、96 C.52、54 B.52、50 D.54、52
5.性别与身高列联表如下: 男 女 总计 高(165 cm以上) 37 6 43 矮(165 cm以下) 4 13 17 总计 41 19 60
作出2×2列联表 → 计算随机变量K2的值 → 对照临界值作出结论 解析:根据题目所给的数据作出如下的列联表:
色盲 不色盲 总计
男
女 总计
38
6 44
442
514 956
480
520 1 000
根据列联表中所给的数据可以得: a=38,b=442,c=6,d=514,a+b=480,c+d= 520,a+c=44,b+d=956,n=1 000.
3.独立性检验. 利用随机变量K2来判断“两个分类变量有关系”的方法 定义 称为独立性检验.
nad-bc2 公式 K2=_____________________ a+bc+da+cb+d ,其中n=______________. a+b+c+d
①根据实际问题的需要确定容许推断“两个分类变量有 临界值 k0 .② 关系”犯错误概率的上界α,然后查表确定 ________ k________ ≥k0 利用公式计算随机变量K2的 ________ , 观测值 k .③如果 具体 就推断“X与Y有关系”,这种推断犯错误的概率不超过 步骤 α;否则,就认为在犯错误的概率不超过α的前提下不能 推断“X与Y有关系”,或者在样本数据中没有发现足够 证据支持结论“X与Y有关系”.
人教A版 选修1-2 1.2 独立性检验的基本思想及初步应用 教案
[核心必知]1.预习教材,问题导入根据以下提纲,预习教材P 10~P 15的内容,回答下列问题. 阅读教材P 10“探究”的内容,思考: (1)是否吸烟、是否患肺癌是什么变量? 提示:分类变量.(2)吸烟与患肺癌之间的关系还是前面我们研究的线性相关关系吗? 提示:不是.(3)如何研究吸烟是否对患肺癌有影响? 提示:独立性检验. 2.归纳总结,核心必记 (1)分类变量变量的不同“值”表示个体所属的不同类别,像这样的变量称为分类变量. (2)列联表①定义:列出的两个分类变量的频数表称为列联表. ②2×2列联表一般地,假设有两个分类变量X 和Y ,它们的取值分别为{x 1,x 2}和{y 1,y 2},其样本频数列联表(称为2×2列联表)为(3)等高条形图①图形与表格相比,更能直观地反映出两个分类变量间是否相互影响,常用等高条形图展示列联表数据的频率特征.②通过直接计算或观察等高条形图发现a +b a 和c +d c相差很大,就判断两个分类变量之间有关系.(4)独立性检验(1)有人说:“在犯错误的概率不超过0.01的前提下认为吸烟和患肺癌有关,是指每100个吸烟者中就会有99个患肺癌的.”你认为这种观点正确吗?为什么?提示:观点不正确.犯错误的概率不超过0.01说明的是吸烟与患肺癌有关的程度,不是患肺癌的百分数.(2)应用独立性检验的基本思想对两个变量间的关系作出的推断一定是正确的吗? 提示:不一定.所有的推断只代表一种可能性,不代表具体情况. (3)下面是2×2列联表.则表中a ,b 提示:a =46-13=33,b =33+a =33+33=66.[课前反思](1)分类变量的定义是什么?(2)列联表的定义是什么?2×2列联表中的各个数据有什么意义?(3)什么是等高条形图,有什么作用?(4)独立性检验的内容是什么?讲一讲1.在对人们饮食习惯的一次调查中,共调查了124人,其中六十岁以上的70人,六十岁以下的54人.六十岁以上的人中有43人的饮食以蔬菜为主,另外27人则以肉类为主;六十岁以下的人中有21人饮食以蔬菜为主,另外33人则以肉类为主.请根据以上数据作出饮食习惯与年龄的列联表,并利用a +b a 与c +d c判断二者是否有关系.[尝试解答] 2×2列联表如下:年龄在六 十岁以上 年龄在六 十岁以下 总计 饮食以蔬菜为主 43 21 64 饮食以肉类为主27 33 60 总计7054124a +b a =6443=0.671 875.c +d c =6027=0.45.显然二者数据具有较为明显的差距,据此可以在某种程度上认为饮食习惯与年龄有关系.(1)作2×2列联表时,关键是对涉及的变量分清类别.计算时要准确无误.(2)利用2×2列联表分析两个分类变量间的关系时,首先要根据题中数据获得2×2列联表,然后根据频率特征,即将a +b a 与c +d c c +d d的值相比,直观地反映出两个分类变量间是否相互影响,但方法较粗劣.练一练1.假设有两个分类变量X 与Y ,它们的可能取值分别为{x 1,x 2}和{y 1,y 2},其2×2列联表为:y 1y 2x 1 1018 x 2m26则当m 取下面何值时,X 与Y A .8 B .9 C .14 D .19解析:选C 由10×26≈18m ,解得m ≈14.4,所以当m =14时,X 与Y 的关系最弱.讲一讲2.某学校对高三学生作了一项调查发现:在平时的模拟考试中,性格内向的学生426人中有332人在考前心情紧张,性格外向的学生594人中有213人在考前心情紧张,作出等高条形图,利用图形判断考前心情紧张与性格类型是否有关系.[尝试解答] 作列联表如下:性格内向 性格外向 总计 考前心情紧张 332 213 545 考前心情不紧张94 381 475 总计4265941 020图中阴影部分表示考前心情紧张与考前心情不紧张中性格内向的人数的比例,从图中可以看出考前心情紧张的样本中性格内向的人数占的比例比考前心情不紧张样本中性格内向的人数占的比例高,可以认为考前紧张与性格类型有关.利用等高条形图判断两个分类变量是否相关的步骤:练一练2.在调查的480名男人中有38人患色盲,520名女人中有6名患色盲,试利用图形来判断色盲与性别是否有关?解:根据题目给出的数据作出如下的列联表:色盲不色盲总计男38442480女6514520总计449561000从等高条形图来看,在男人中患色盲的比例要比在女人中患色盲的比例大得多,因此,我们认为患色盲与性别是有关系的.讲一讲3.研究人员选取170名青年男女大学生为样本,对他们进行一种心理测验.发现有60名女生对该心理测验中的最后一个题目的反应是:作肯定的有22名,否定的有38名;110名男生在相同的项目上作肯定的有22名,否定的有88名.问:性别与态度之间是否存在某种关系?用独立性检验的方法判断.(链接教材P 13-例1)附:P (K 2≥k 0)0.10 0.05 0.025 k 02.7063.8415.024[尝试解答]肯定 否定 总计 男生 22 88 110 女生 22 38 60 总计44126170根据2×2k =110×60×44×126170×(22×38-22×88≈5.622>5.024.所以在犯错误的概率不超过0.025的前提下,认为“性别与态度有关系”.根据题意列出2×2列联表,计算K 2的观测值,如果K 2的观测值很大,说明两个分类变量有关系的可能性很大;如果K 2的观测值比较小,则认为没有充分的证据显示两个分类变量有关系.练一练3.在一次天气恶劣的飞机航程中,调查了男女乘客在飞机上晕机的情况:男乘客晕机的有24人,不晕机的有31人;女乘客晕机的有8人,不晕机的有26人.请你根据所给数据判定:在天气恶劣的飞机航程中,男乘客是否比女乘客更容易晕机?附:P (K 2≥k 0)0.10 0.05 k 02.7063.848解:根据题意,列出 晕机 不晕机 总计由公式可得K 2的观测值k =(a +b n(ad -bc=55×34×32×5789(24×26-31×8≈3.689>2.706,故在犯错误的概率不超过0.10的前提下,认为“在天气恶劣的飞机航程中男乘客比女乘客更容易晕机”.——————————————[课堂归纳·感悟提升]——————————1.本节课的重点是用2×2列联表、等高条形图分析两个分类变量间的关系以及独立性检验.2.本节课要重点掌握的规律方法(1)用2×2列联表分析两分类变量间的关系,见讲1; (2)用等高条形图分析两分类变量间的关系,见讲2; (3)独立性检验,见讲3.3.解决一般的独立性检验问题的步骤:(1)通过列联表确定a ,b ,c ,d ,n 的值,根据实际问题需要的可信程度确定临界值k 0; (2)利用K 2=(a +b n(ad -bc 求出K 2的观测值k ;(3)如果k ≥k 0,就推断“两个分类变量有关系”,这种推断犯错误的概率不超过α,否则就认为在犯错误的概率不超过α的前提下不能推断“两个分类变量有关系”.其中第(2)步易算错K 2的值,是本节课的易错点.课下能力提升(二) [学业水平达标练]题组1 用2×2列联表分析两分类变量间的关系 1.分类变量X 和Y 的列联表如下:A .ad -bc 越小,说明X 与Y 关系越弱B .ad -bc 越大,说明X 与Y 关系越强C .(ad -bc )2越大,说明X 与Y 关系越强 D .(ad -bc )2越接近于0,说明X 与Y 关系越强解析:选C |ad -bc |越小,说明X 与Y 关系越弱,|ad -bc |越大,说明X 与Y 关系越强.2.假设有两个变量X 与Y ,它们的取值分别为x 1,x 2和y 1,y 2,其列联表为:( ) A .a =50,b =40,c =30,d =20 B .a =50,b =30,c =40,d =20 C .a =20,b =30,c =40,d =50 D .a =20,b =30,c =50,d =40解析:选D 当(ad -bc )2的值越大,随机变量K 2=(a +b n(ad -bc的值越大,可知X 与Y 有关系的可能性就越大.显然选项D 中,(ad -bc )2的值最大.3.某电视台在一次对收看文艺节目和新闻节目观众的抽样调查中,随机抽取了100名电视观众,相关的数据如下表所示:填“是”或“否”).解析:因为在20至40岁的58名观众中有18名观众收看新闻节目,而大于40岁的42名观众中有27名观众收看新闻节目,即a +b b =5818,c +d d =4227,两者相差较大,所以经直观分析,收看新闻节目的观众与年龄是有关的.答案:是题组2 用等高条形图分析两分类变量间的关系4.如图是调查某地区男女中学生喜欢理科的等高条形图,阴影部分表示喜欢理科的百分比,从图中可以看出( )A .性别与喜欢理科无关B .女生中喜欢理科的百分比为80%C .男生比女生喜欢理科的可能性大些D .男生不喜欢理科的比为60%解析:选C 从图中可以分析,男生喜欢理科的可能性比女生大一些. 5.观察下列各图,其中两个分类变量x ,y 之间关系最强的是( )解析:选D 在四幅图中,D 图中两个深色条的高相差最明显,说明两个分类变量之间关系最强.6.为了研究子女吸烟与父母吸烟的关系,调查了一千多名青少年及其家长,数据如下:解:等高条形图如图所示:由图形观察可以看出父母吸烟者中子女吸烟的比例要比父母不吸烟者中子女吸烟的比例高,因此可以在某种程度上认为“子女吸烟与父母吸烟有关系”.题组3 独立性检验7.在一项中学生近视情况的调查中,某校男生150名中有80名近视,女生140名中有70名近视,在检验这些中学生眼睛近视是否与性别有关时用什么方法最有说服力( ) A.平均数与方差 B.回归分析C.独立性检验 D.概率解析:选C 判断两个分类变量是否有关的最有效方法是进行独立性检验.8.对于分类变量X与Y的随机变量K2的观测值k,下列说法正确的是( )A.k越大,“X与Y有关系”的可信程度越小B.k越小,“X与Y有关系”的可信程度越小C.k越接近于0,“X与Y没有关系”的可信程度越小D.k越大,“X与Y没有关系”的可信程度越大解析:选B k越大,“X与Y没有关系”的可信程度越小,则“X与Y有关系”的可信程度越大,即k越小,“X与Y有关系”的可信程度越小.9.在吸烟与患肺病是否相关的判断中,有下面的说法:①若K2的观测值k>6.635,则在犯错误的概率不超过0.01的前提下,认为吸烟与患肺病有关系,那么在100个吸烟的人中必有99人患有肺病;②从独立性检验可知在犯错误的概率不超过0.01的前提下,认为吸烟与患肺病有关系时,若某人吸烟,则他有99%的可能患有肺病;③从独立性检验可知在犯错误的概率不超过0.05的前提下,认为吸烟与患肺病有关系时,是指有5%的可能性使得推断错误.其中说法正确的是________.解析:K2是检验吸烟与患肺病相关程度的量,是相关关系,而不是确定关系,是反映有关和无关的概率,故说法①不正确;说法②中对“确定容许推断犯错误概率的上界”理解错误;说法③正确.答案:③10.为了解决高二年级统计案例入门难的问题,某校在高一年级的数学教学中设有试验班,着重加强统计思想的渗透,下面是高二年级统计案例的测验成绩统计表(单位:分)的一部分,试分析试验效果.附:k =(a +b n(ad -bc=50×50×44×56100(32×38-18×12≈16.234. 因为16.234>6.635,所以,在犯错误的概率不超过0.01的前提下认为高二年级统计案例的测试成绩与高一年级数学教学中增加统计思想的渗透有联系.[能力提升综合练]1.利用独立性检验对两个分类变量是否有关系进行研究时,若有99.5%的把握认为事件A 和B 有关系,则具体计算出的数据应该是( )A .k ≥6.635B .k <6.635C .k ≥7.879D .k <7.879解析:选C 有99.5%的把握认为事件A 和B 有关系,即犯错误的概率为0.5%,对应的k 0的值为7.879,由独立性检验的思想可知应为k ≥7.879.2.通过随机询问110名性别不同的大学生是否爱好某项运动,得到如下的列联表:由K 2=(a +b n(ad -bc 算得,观测值k =60×50×60×50≈7.8. 附表:A .有99%以上的把握认为“爱好该项运动与性别有关”B .有99%以上的把握认为“爱好该项运动与性别无关”C .在犯错误的概率不超过0.1% 的前提下,认为“爱好该项运动与性别有关”D .在犯错误的概率不超过0.1% 的前提下,认为“爱好该项运动与性别无关” 解析:选A 由k ≈7.8及P (K 2≥6.635)=0.010可知,在犯错误的概率不超过1%的前提下认为“爱好该项运动与性别有关”,也就是有99%以上的把握认为“爱好该项运动与性别有关”.3.某人研究中学生的性别与成绩、视力、智商、阅读量这4个变量的关系,随机抽查了52名中学生,得到统计数据如表1至表4,则与性别有关联的可能性最大的变量是( )表1表3A .成绩B .视力C .智商D .阅读量解析:选D 因为K 12=16×36×32×2052×(6×22-14×10=16×36×32×2052×82,K 22=16×36×32×2052×(4×20-16×12=16×36×32×2052×1122,k 32=16×36×32×2052×(8×24-12×8=16×36×32×2052×962, K 42=16×36×32×2052×(14×30-6×2=16×36×32×2052×4082,则有K 42>K 22>K 32>K 12,所以阅读量与性别有关联的可能性最大. 4.下列关于K 2的说法中,正确的有________. ①K 2的值越大,两个分类变量的相关性越大; ②K 2的计算公式是K 2=(a +b n(ad -bc ;③若求出K 2=4>3.841,则有95%的把握认为两个分类变量有关系,即有5%的可能性使得“两个分类变量有关系”的推断出现错误;④独立性检验就是选取一个假设H 0条件下的小概率事件,若在一次试验中该事件发生了,这是与实际推断相抵触的“不合理”现象,则作出拒绝H 0的推断.解析:对于①,K 2的值越大,只能说明我们有更大的把握认为二者有关系,却不能判断相关性大小,故①错;对于②,(ad -bc )应为(ad -bc )2,故②错;③④对.答案:③④5.某班主任对全班50名学生作了一次调查,所得数据如表:)在犯错误的概率不超过0.01的前提下认为喜欢玩电脑游戏与认为作业多有关.解析:查表知若要在犯错误的概率不超过0.01的前提下认为喜欢玩电脑游戏与认为作业多有关,则临界值k 0=6.635,本题中,k ≈5.059<6.635,所以不能在犯错误的概率不超过0.01的前提下认为喜欢玩电脑游戏与认为作业多有关.答案:不能6.随着生活水平的提高,人们患肝病的越来越多,为了解中年人患肝病与经常饮酒是否有关,现对30名中年人进行了问卷调查得到如下列联表:已知在全部30人中随机抽取1人,抽到肝病患者的概率为15.(1)请将上面的列联表补充完整,并判断是否有99.5%的把握认为患肝病与常饮酒有关?说明你的理由;(2)现从常饮酒且患肝病的中年人(恰有2名女性)中,抽取2人参加电视节目,则正好抽到一男一女的概率是多少?参考数据:解:(1)设患肝病中常饮酒的人有x 人,30=15,x =6.由已知数据可求得K 2=10×20×8×22≈8.523>7.879,因此有99.5%的把握认为患肝病与常饮酒有关.(2)设常饮酒且患肝病的男性为A ,B ,C ,D ,女性为E ,F ,则任取两人有AB ,AC ,AD ,AE ,AF ,BC ,BD ,BE ,BF ,CD ,CE ,CF ,DE ,DF ,EF ,共15种.其中一男一女有AE ,AF ,BE ,BF ,CE ,CF ,DE ,DF ,共8种.故抽出一男一女的概率是P =158.7.某食品厂为了检查甲乙两条自动包装流水线的生产情况,随机在这两条流水线上各抽取40件产品作为样本称出它们的质量(单位:克),质量值落在(495,510]的产品为合格品,否则为不合格品.表1是甲流水线样本频数分布表,图1是乙流水线样本频率分布直方图.表1 甲流水线样本频数分布表(1)根据上表数据作出甲流水线样本频率分布直方图;(2)若以频率作为概率,试估计从两条流水线分别任取1件产品,该产品恰好是合格品的概率分别是多少;(3)由以上统计数据作出2×2列联表,并回答在犯错误的概率不超过多少的前提下认为“产品的包装质量与两条要自动包装流水线的选择有关”.解:(1)甲流水线样本频率分布直方图如下:(2)由表1知甲样本合格品数为8+14+8=30,由图1知乙样本中合格品数为(0.06+0.09+0.03)×5×40=36, 故甲样本合格品的频率为4030=0.75, 乙样本合格品的频率为4036=0.9, 据此可估计从甲流水线任取1件产品, 该产品恰好是合格品的概率为0.75. 从乙流水线任取1件产品, 该产品恰好是合格品的概率为0.9. (3)2×2列联表如下:因为K2的观测值k=(a+b=66×14×40×40≈3.117>2.706,所以在犯错误的概率不超过0.1的前提下认为产品的包装质量与两条自动包装流水线的选择有关.。
高中数学选修1-2第一章课后习题解答
新课程标准数学选修1—2第一章课后习题解答第一章统计案例1.1回归分析的基本思想及其初步应用练习(P8)1、画散点图的目的是通过变量的散点图判断两个变量更近似于什么样的函数关系,以确定是否直接用线性回归模型来拟合原始数据.说明:学生在对常用的函数图象比较了解的情况下,通过观察散点图可以判断两个变量的关系更近似于哪种函数.2、分析残差可以帮助我们解决以下两个问题:(1)寻找异常点,就是残差特别大的点,考察相应的样本数据是否有错.(2)分析残差图可以发现模型选择是否合适.说明:分析残差是回归诊断的一部分,可以帮助我们发现样本数据中的错误,分析模型选择是否合适,是否有其他变量需要加入到模型中,模型的假设是否正确等. 本题只要求学生能回答上面两点即可,主要让学生体会残差和残差图可以用于判断模型的拟合效果.3、(1)解释变量和预报变量的关系式线性函数关系.R=.(2)21说明:如果所有的样本点都在一条直线上,建立的线性回归模型一定是该直线,所以每个=+,没有随机误差项,是严样本点的残差均为0,残差平方和也为0,即此时的模型为y bx aR=.格的一次函数关系. 通过计算可得21习题1.1 (P9)1、(1)由表中数据制作的散点图如下:从散点图中可以看出GDP值与年份近似呈线性关系.y表示GDP值,t表示年份. 根据截距和斜率的最小二乘计算公式,得(2)用tˆ14292537.729a≈-,ˆ7191.969b≈从而得线性回归方程ˆ7191.96914292537.729=-.y t残差计算结果见下表.GDP 值与年份线性拟合残差表(年实际GDP 值为117251.9,所以预报与实际相差4275.540-.(4)上面建立的回归方程的20.974R =,说明年份能够解释约97%的GDP 值变化,因此所建立的模型能够很好地刻画GDP 和年份的关系.说明:关于2003年的GDP 值的来源,不同的渠道可能会有所不同.2、说明:本题的结果与具体的数据有关,所以答案不唯一.3、由表中数据得散点图如下:从散点图中可以看出,震级x 与大于或等于该震级的地震数N 之间不呈线性相关关系,随着x 的减少,所考察的地震数N 近似地以指数形式增长. 做变换lg y N =,得到的数据如下表所示.x 和y 的散点图如下:从这个散点图中可以看出x 和y 之间有很强的线性相关性,因此可以用线性回归模型拟合它们之间的关系. 根据截距和斜率的最小二乘计算公式,得ˆ 6.704a≈,ˆ0.741b ≈-, 故线性回归方程为 ˆ0.741 6.704y x =-+. 20.997R ≈,说明x 可以解释y 的99.7%的变化.因此,可以用回归方程 0.741 6.704ˆ10x N-+= 描述x 和N 之间的关系. 1.2独立性检验的基本思想及其初步应用练习(P15)列联表的条形图如图所示.由图及表直观判断,好像“成绩优秀与班级有关系”. 因为2K 的观测值0.653 6.635k ≈<,由教科书中表1-11克重,在犯错误的概率不超过0.01的前提下,不能认为“成绩与班级有关系”.说明:(1)教师应要求学生画出等高条形图后,从图形上判断两个分类变量之间是否有关系. 这里通过图形的直观感觉的结果可能会出错.(2)本题与例题不同,本题计算得到的2K 的观测值比较小,所以没有理由说明“成绩优秀与班级有关系”. 这与反证法也有类似的地方,在使用反证法证明结论时,假设结论不成立的条件下如果没有推出矛盾,并不能说明结论成立也不能说明结论不成立. 在独立性检验中,没有推出小概率事件发生类似于反证法中没有推出矛盾.习题1.2 (P16)1、假设“服药与患病之间没有关系”,则2K 的值应该比较小;如果2K 的值很大,则说明很可能“服药与患病之间没有关系”. 由列联表中数据可得2K 的观测值 6.110 5.024k ≈>,而由教科书表1-11,得2( 5.024)0.025P K ≥≈,所以在犯错误的概率不超过0.025的前提下可以认为“服药与患病之间有关系”. 又因为服药群体中患病的频率0.182小于没有服药群体中患病的频率0.400,所以“服药与患病之间关系”可以解释为药物对于疾病有预防作用. 因此在犯错误的概率不超过0.025的前提下,可以认为药物有效.说明:仿照例1,学生很容易完成此题,但希望学生能理解独立性检验在这里的具体含义,即“服药与患病之间关系”可以解释为“药物对于疾病有预防作用”.2、如果“性别与读营养说明之间没有关系”,由题目中所给数据计算,得2K 的观测值为8.416k ≈,而由教科书中表1-11知2(7.879)0.005P K ≥≈,所以在犯错误的概率不超过0.005的前提下认为“性别与读营养说明之间有关系”.3、说明:需要收集数据,所有没有统一答案. 第一步,要求学生收集并整理数据后得到列联表;第二步,类似上面的习题做出判断.4、说明:需要从媒体上收集数据,学生关心的问题不同,收集的数据会不同. 第一步,要求学生收集并整理数据后得到列联表;第二步,类似上面的习题做出判断.第一章 复习参考题A 组(P19)根据散点图,可以认为中国人口总数与年份呈现很强的线性相关关系,因此选用线性回归模型建立回归方程.由最小二乘法的计算公式,得 2095141.503a ≈-,1110.903b ≈,则线性回归方程为 ˆ1110.9032095141.503yx =-. 由2R 的计算公式,得 20.994R ≈,明线性回归模型对数据的拟合效果很好.根据回归方程,,预计2003年末中国人口总数约为129997万人,而实际情况为129227万人,预测误差为770万人;预计2004年末中国人口总数约为131108万人,而实际情况为129988万人,预测误差为1120万人.说明:数据来源为《中国统计年鉴》(2003). 由于人数为整数,所以预测的数据经过四舍五入的取整运算.2、(1)将销售总额作为横轴,利润作为纵轴,根据表中数据绘制散点图如下:由于散点图中的样本点基本上在一个带形区域内分布,猜想销售总额与利润之间呈现线性相关关系.(2)由最小二乘法的计算公式,得 ˆ1334.5a≈,ˆ0.026b ≈, 则线性回归方程为 ˆ0.0261334.5yx =+ 其残差值计算结果见下表:(3)对于(2)中所建立的线性回归方程,20.457R ≈,说明在线性回归模型中销售总额只能解释利润变化的46%,所以线性回归模型不能很好地刻画销售总额和利润之间的关系. 说明:此题也可以建立对数模型或二次回归模型等,只要计算和分析合理,就算正确.3、由所给数据计算得2K 的观测值为 3.689k ≈,而由教科书中表1-11知2( 2.706)0.10P K ≥=所以在犯错误的概率不超过0.10的前提下认为“婴儿的性别与出生的时间有关系”.第一章 复习参考题B 组(P19)1、因为 21(,)()ni i i Q a b y a bx ==--∑21(()())n i i i y bx y bx a y bx ==--+--+∑ 2211()()n n i i i i y bx y bx a y bx ===--++-+∑∑12()()ni i i y bx y bx a y bx =---+-+∑ 并且221()()n i a y bx n a y bx =-+=-+∑,12()()n i i i y bx y bx a y bx =--+-+∑ 1()(())ni i i a y bx y bx ny nbx ==-+--+∑ ()()0a y b x n y n b xn y n b x=-+--+= 所以 221(,)()()ni i i Q a b y bx y bx n a y bx ==--++-+∑.考察上面的等式,等号右边的求和号中不包含a ,而另外一项非负,所以ˆa和ˆb 必然使得等号右边的最后一项达到最小值,即 ˆˆ0ay bx -+=, 即ˆˆy a bx =+. 2、总偏差平方和21()n i i y y =-∑表示总的效应,即因变量的变化效应;残差平方和21ˆ()ni i y y =-∑表示随机误差的效应,即随机误差的变化效应;回归平方和21ˆ()ni yy =-∑表示表示变量的效应,即自变量的变化效应. 等式 222111ˆˆ()()()n n n i ii i i y y y y y y ===-=-+-∑∑∑ 表示因变量的变化总效应等于随机误差的变化效应与自变量的变化效应之和.3、说明:该题主要是考察学生应用回归分析模型解决实际问题的能力,解答应该包括如何获取数据,如何根据散点图寻找合适的模型去拟合数据,以及所得结果的解释三方面的内容.。
2020最新人教版高二数学选修1-2电子课本课件【全册】
பைடு நூலகம்
实习作业
2020最新人教版高二数学选修1-2 电子课本课件【全册】
2020最新人教版高二数学选修1 -2电子课本课件【全册】目录
0002页 0084页 0113页 0202页 0241页 0276页 0352页 0389页 0466页 0513页 0576页 0587页
第一章 统计案例 1.2 独立性检验的基本思想及其初步应用 小结 第二章 推理与证明 阅读与思考 科学发现中的推理 小结 第三章 数系的扩充与复数的引入 3.2 复数代数形式的四则运算 复习参考题 4.1 流程图 信息技术应用 用word2002绘制流程图 复习参考题
第一章 统计案例
2020最新人教版高二数学选修1-2 电子课本课件【全册】
1.1 回归分析的基本思想及其 初步应用
2020最新人教版高二数学选修1-2 电子课本课件【全册】
1.2 独立性检验的基本思想及 其初步应用
人教A版高中数学选修1-2《一章 统计案例 1.2 独立性检验的基本思想及其初步应用》精品课件_33
解:根据题目所给数据得到如下列联表:
患心脏病 不患心脏病 总计
秃顶
214
ቤተ መጻሕፍቲ ባይዱ不秃顶
451
总计
665
175
389
597
1048
772
1437
根据列联表中的数据,得到
K 2 1437 (214597 175 451)2 16.373 6.635. 3891048 665 772
案 例:某医疗机构为了了解呼吸道疾病与吸 烟是否有关,进行了一次抽样调查,共调查了 515个成年人,其中吸烟者220人,不吸烟者 295人。
调查结果:吸烟的220人中有37人患呼吸道疾 病,183人未患呼吸道疾病;不吸烟的295人中 有21人患病,274人未患病。
根据这些数据,能否断定:患呼吸道疾 病与吸烟有关?
(2)求k值 (3)下结论
5
8
3
2
6
1
4
5
9
8
(1)如果k 10.828,就有99.9%的把握认为" X 与Y有关系" (2)如果k 7.879,就有99.5%的把握认为" X 与Y有关系"
(3)如果k 6.635,就有99%的把握认为" X 与Y有关系"
(4)如果k 5.024,就有97.5%的把握认为" X 与Y有关系"
练习3:为了调查胃病是否与生活规律有关,在某地对540名40岁以上 的人进行了调查,结果是:患胃病者生活不规律的共60人,患胃病者 生活规律的共20人,未患胃病者生活不规律的共260人,未患胃病者生 活规律的共200人. (1)根据以上数据列出2×2列联表; (2)能够以99%的把握认为40岁以上的人患胃病与否和生活规律有关 系吗?为什么?
人教A版 选修1-2 独立性检验的基本思想及其初步应用(一) 教案
在该规则下,把结论h0错判成H0不成立的概率不会超过P(K2>=)=0.010这里计算的前提是H0成立。上面解决问题的想法类似于反正法,要判断“两个分类变量有关系”,首现假设该结论不成立。即H0:两个变量没有关系成立,在该假设下我们所构造的随机变量K2应该很小,如果由观测值数据计算得到的K2的观测值k很大,则断言H0不成立即认为“两个分类变量有关系”;如果观测值k很小,则说明在样本数据组没有发现足够理由拒绝H0。怎么样判断K2的观测值k是大还是小?这仅需要一个确定的整数k0,当k>=k0时就认为K2的观测值k大。此时相应于k0的判断规则:如果k>=k0,就认为“两个分类变量有关系”;否则就认为“两个分类变量没有关系”,我们称这样的一个k0为临界值。
上述利用随机变量K2判断“两个随机分类变量有关系”的方法称为独立性检验
目标三导
学做思一:独立性检验原理
列联表:列出两个变量的频数表。解决问题的想法类似于反正法,要判断“两个分类变量有关系”,首现假设该结论不成立。
即H0:两个变量没有关系成立,在该假设下我们所构造的随机变量K2应该很小,如果由观测值数据计算得到的K2的观测值k很大,则断言H0不成立即认为“两个分类变量有关系”;如果观测值k很小,则说明在样本数据组没有发现足够理由拒绝H0。怎么样判断K2的观测值k是大还是小?这仅需要一个确定的整数k0,当k>=k0时就认为K2的观测值k大。此时相应于k0的判断规则:如果k>=k0,就认为“两个分类变量有关系”;否则就认为“两个分类变量没有关系”,我们称这样的一个k0为临界值。
独立性检验原理
在假设H0下,如果推出了一个与H0相矛盾的小概率事件,就推断H0不成立,且该推论犯错误的概率不超过这个小概率。
1.2.2独立性检验的基本思想及其初步应用习题及答案
数学·选修1-2(人教A版)独立性检验的基本思想及其初步应用►达标训练1.在研究两个分类变量之间是否有关时,可以粗略地判断两个分类变量是否有关的是()A.散点图B.等高条形图C.2×2列联表D.以上均不对,答案:B2.在等高条形图形图中,下列哪两个比值相差越大,要推断的论述成立的可能性就越大()与dc+d与ac+d与cc+d与cb+c答案:C3.对分类变量X与Y的随机变量K2的观测值k,说法正确的是()A.k越大,“ X与Y有关系”可信程度越小【B.k越小,“ X与Y有关系”可信程度越小C.k越接近于0,“X与Y无关”程度越小D.k越大,“X与Y无关”程度越大答案:B@4.下面是一个2×2列联表:则表中a、b的值分别为()。
A.94、96 B.52、50C.52、54 D.54、52答案:C5.性别与身高列联表如下:那么,检验随机变量K2的值约等于()A.B.C.22 D.答案:C:6.给出列联表如下:根据表格提供的数据,估计“成绩与班级有关系”犯错误的概率约是( ) *A .B .0.5C .D .答案:B►素能提高1.在调查中发现480名男人中有38名患有色盲,520名女人中有6名患有色盲,下列说法中正确的是( )A .男人、女人中患有色盲的频率分别为、B .男人、女人患色盲的概率分别为19240、3260C .男人中患色盲的比例比女人中患色盲的比例大,患色盲是与性别有关的 /D .调查人数太少,不能说明色盲与性别有关解析:男人患色盲的比例为38480,比女人中患色盲的比例6520大,其差值为⎪⎪⎪⎪⎪⎪38480-6520≈ 6,差值较大. 答案:C2.通过随机询问110名性别不同的大学生是否爱好某项运动,得到如下的列联表:男 女 :总计爱好40 20 60 不爱好 20 30 50总计¥6050 110由K 2=算得, K 2=≈.附表:P(K2≥k0):k0参照附表,得到的正确结论是()A.有99%以上的把握认为“爱好该项运动与性别有关”B.有99%以上的把握认为“爱好该项运动与性别无关”¥C.在犯错误的概率不超过%的前提下,认为“爱好该项运动与性别有关”D.在犯错误的概率不超过%的前提下,认为“爱好该项运动与性别无关”答案:A3.若由一个2×2列联表中的数据计算得K2=,那么在犯错误的概率不超过的前提下认为两个变量______(填“有”或“没有”)关系.答案:有4.(2013·韶关二模)以下四个命题:%①在一次试卷分析中,从每个试室中抽取第5号考生的成绩进行统计,是简单随机抽样;②样本数据:3,4,5,6,7的方差为2;③对于相关系数r,|r|越接近1,则线性相关程度越强;④通过随机询问110名性别不同的行人,对过马路是愿意走斑马线还是愿意走人行天桥进行抽样调查,得到如下列联表:男女总计走天桥—402060走斑马线203050总计6050·110由K2=可得,K2==,则有99%以上的把握认为“选择过马路方式与性别有关”,其中正确的命题序号是________.答案:②③④附表P(K2≥k0)?k05.某学校为了调查喜欢语文学科与性别的关系,随机调查了一些学生情况,具体数据如下表:^类别不喜欢语文喜欢语文性别男1310女720—为了判断喜欢语文学科是否与性别有关系,根据表中的数据,得到K2的观测值k=≈,因为k≥,根据下表中的参考数据:P(K2≥k0)/k0|判定喜欢语文学科与性别有关系,那么这种判断出错的可能性为________.答案:5%—6.某学校课题组为了研究学生的数学成绩与物理成绩之间的关系,随机抽取高二年级20名学生某次考试成绩(满分100分)如下表序号12345678~910数学成绩95758094926567 (849871)物理成绩906372879171]58829381序号11121314(151617181920数学成绩679364·78779057837283物理成绩7782 (4885699161847886)若单科成绩85以上(含85分),则该科成绩优秀.(1)根据上表完成下面的2×2列联表(单位:人).< 数学成绩优秀数学成绩不优秀合计物理成绩优秀物理成绩不优秀【合计解析:(1)2×2列联表为(单位:人):;数学成绩优秀数学成绩不优秀合计物理成绩优秀527物理成绩不优秀112;13合计61420(2)根据题(1)中表格的数据计算,能否在犯错误的概率不超过的前提下认为学生的数学成绩与物理成绩之间有关系参数数据:①假设有两个分类变量X和Y,它们的值域分别为(x1,x2)和(y1,y2),其样本频数列联表(称为2×2列联表)为:! y1y2合计x1a b a+bx2c:d c+d合计a+c b+d a+b+c+d则随机变量K2=,其中n=a+b+c+d为样本容量;②独立检验随机变量K2的临界值参考表如下:…P(K2≥k0)k0<P(K2≥k0)k0/解析:根据列联表可以求得K2的观测值k=≈>.在犯错误的概率不超过的前提下认为:学生的数学成绩与物理成绩之间有关系."7.2013年3月14日,CCTV财经频道报道了某地建筑市场存在违规使用未经淡化海砂的现象.为了研究使用淡化海砂与混凝土耐久性是否达标有关,某大学实验室随机抽取了60个样本,得到了相混凝土耐久性达标混凝土耐久性不达标总计使用淡化海砂255^30使用未经淡化海砂151530总计402060的概率不超过1%的前提下,认为使用淡化海砂与混凝土耐久性是否达标有关、解析:提出假设H0:使用淡化海砂与混凝土耐久性是否达标无关.根据表中数据,求得K2的观测值k==>.查表得P(K2≥=.∴能在犯错误的概率不超过1%的前提下,认为使用淡化海砂与混凝土耐久性是否达标有关.(2)若用分层抽样的方法在使用淡化海砂的样本中抽取了6个,现从这6个样本中任取2个,则取出的2个样本混凝土耐久性都达标的概率是多少参考数据:解析:用分层抽样的方法在使用淡化海砂的样本中抽取6个,其中应抽取“混凝土耐久性达标”的为2530×6=5,“混凝土耐久性不达标”的为6-5=1,“混凝土耐久性达标记”为A1,A2,A3,A4,A5”;“混凝土耐久性不达标”的记为B.在这6个样本中任取2个,有以下几种可能:(A1,A2),(A1,A3),(A1,A4),(A1,A5),(A1,B),(A2,A3),(A2,A4),(A2,A5),(A2,B),(A3,A4),(A3,A5),(A3,B),(A4,A5),(A4,B)(A5,B),共15种.设“取出的2个样本混凝土耐久性都达标”为事件A,它的对立事件A为“取出的2个样本至少有1个混凝土耐久性不达标”,包含(A1,B),(A2,B),(A3,B),(A4,B),(A5,B),共5种可能.∴P(A)=1-P(A)=1-515=2 3.即取出的2个样本混凝土耐久性都达标的概率是2 3.8.某食品厂为了检查甲、乙两条自动包装流水线的生产情况,随机在这两条流水线上各抽取40件产品作为样本称出它们的重量(单位:克),重量值落在(495,510]的产品为合格品,否则为不合格品.左下表是甲流水线样本频数分布表,右下图是乙流水线样本的频率分布直方图.(1)根据上表数据作出甲流水线样本的频率分布直方图;解析:甲流水线样本的频率分布直方图如下:((2)若以频率作为概率,试估计从两条流水线分别任取1件产品,该产品恰好是合格品的概率;解析:由题表知甲样本中合格品数为8+14+8=30,由题图知乙样本中合格品数为++×5×40=36,故甲样本合格品的频率为3040=,乙样本合格品的频率为36 40=.据此可估计从甲流水线任取1件产品,该产品恰好是合格品的概率为.从乙流水线任取1件产品,该产品恰好是合格品的概率为.(3)由以上统计数据完成下面2×2列联表,能否在犯错误的概率不超过的前提下认为产品的包装质量与两条自动包装流水线的选择有关甲流水线?乙流水线合计合格品a=b=不合格品c=d=|合计n=附表:P(K2≥k0)?k0~(参考公式:K2=,其中n=a+b+c+d)解析:2×2列联表如下:¥甲流水线乙流水线合计合格品a=30b=3666不合格品c=10d=4'14合计4040n=80∵K2=n ad-bc2a+b c+d a+c b+d=80×120-360266×14×40×40≈>.∴在犯错误的概率不超过的前提下认为产品的包装质量与两条自动包装流水线的选择有关.>►品味高考1.为调查某地区老年人是否需要志愿者提供帮助,用简单随机抽样方法从该地区调查了500位老人,结果如下:性别是否需要志愿者男女需要4030:不需要160270(1)解析:调查的500位老年人中有70位需要志愿者提供帮助,因此该地区老年人中需要帮助的老年人的比例的估计值为70500=14%.(2)能否在犯错误的概率不超过的前提下认为该地区的老年人是否需要志愿者提供帮助与性别有关解析:K2的观测值k=500×40×270-30×1602200×300×70×430≈,`由于>所以在犯错误的概率不超过的前提下认为该地区的老年人是否需要帮助与性别有关.(3)根据(2)的结论,能否提出更好的调查办法来估计该地区的老年人中需要志愿者提供帮助的老年人的比例说明理由.解析:由于(2)的结论知,该地区的老年人是否需要帮助与性别有关,并且从样本数据能看出该地区男性老年人与女性老年人中需要帮助的比例有明显差异,因此在调查时,先确定该地区老年人中男、女的比例,再把老年人分成男、女两层并采用分层抽样方法比采用简单随机抽样方法更好.附:K2=P(K2≥k0)k02.某工厂有25周岁以上(含25周岁)工人300名,25周岁以下工人200名.为研究工人的日平均生产量是否与年龄有关,现采用分层抽样的方法,从中抽取了100名工人,先统计了他们某月的日平均生产件数,然后按工人年龄在“25周岁以上(含25周岁)”和“25周岁以下”分为两组,再将两组工人的日平均生产件数分为5组:[50,60),[60,70),[70,80),[80,90),[90,100)分别加以统计,得到如图所示的频率分布直方图.(1)从样本中日平均生产件数不足60件的工人中随机抽取2人,求至少抽到一名“25周岁以下组”工人的概率;解析:由已知得,样本中有25周岁以上组工人60名,25周岁以下组工人40名.所以,样本中日平均生产件数不足60件的工人中,25周岁以上组工人有60×=3(人),记为A1,A2,A3;25周岁以下组工人有40×=2(人),记为B1,B2.从中随机抽取2名工人,所有的可能结果共有10种,它们是:(A1,A2),(A1,A3),(A2,A3),(A1,B1),(A1,B2),(A2,B1),(A2,B2),(A3,B1),(A3,B2),(B1,B2).其中至少有1名“25岁以下组”工人的可能结果共有7种,它们是:(A1,B1),(A1,B2),(A2,B1),(A2,B2),(A3,B1),(A3,B2),(B1,B2).故所求的概率P=7 10.(2)规定日平均生产件数不少于80件者为“生产能手”,请你根据已知条件完成列联表,并判断是否有90%的把握认为“生产能手与工人所在的年龄组有关”附:K2=P(K2≥k0)k0解析:由频率分布直方图可知,在抽取的100名工人中,“25周岁以上组”中的生产能手60×=15(人),“25周岁以下组”中的生产能手40×=15(人),据此可得2×2列联表如下:生产能手非生产能手合计25周岁以上组15456025周岁以下组152540合计3070100因为<,所以没有90%的把握认为“生产能手与工人所在年龄组有关”.。
人教A版高中数学选修1-2《独立性检验的基本思想及其初步应用》
课题:独立性检验的基本思想及其初步应用教材:人教A版·普通高中课程标准实验教科书·数学·选修1-2一、教学任务分析1. 在统计学中,独立性检验就是检验两个分类变量是否相关的一种统计方法. 高中数学研究的是两个分类变量各取2个值即2×2列联表的情况:2. 独立性检验与回归分析都可以判断两个变量的相关关系. 两者既有联系又有区别,回归分析适用于定量变量的问题,独立性检验适用于分类变量的问题.二、教学目标(1)能够用列联表、三维柱形图、二维条形图、等高条形图直观地判断两个分类变量是否相关.(2)了解独立性检验的基本思想,能够按照独立性检验的步骤去检验两个分类变量的关系.(3)通过独立性检验的学习,了解数学在统计与概率中的确定性思维特点,体会直观与抽象、感性与理性的联系.三、教学重点、难点教学重点:理解独立性检验的基本思想及实施步骤.教学难点:(1)了解独立性检验的基本思想.(2)了解随机变量卡方的含义.四、教学方法与手段采用“活动(课前)→问题→解决问题→总结”的教学方法,即:在教师的引导下,通过开放性问题的设置来启发学生思考,在思考中体会数学概念的形成过程中所蕴涵的数学思想和方法,加强学生能力的培养.利用计算器进行数据计算,通过Excel软件作图,通过制作的课件呈现更丰富的教学素材.五、课前准备(1)布置实习作业学完《§1.1回归分析的基本思想及其初步应用》后,让学生完成判断两个变量是否相关的题目,一类是可以用回归分析解决的(如问题一),另一类则不行(如问题二). 把这两类问题以实习作业的形式要求学生进行收集数据、整理分析数据、得出结论并进行估计与预测. 作业要求思路清晰、图文并茂、言之有理.(2)本节课前的实习作业问题一:课外学习时间与学习成绩的关系问题二:高中学生是否喜欢音乐与性别的关系六、教学流程(一)创设情景,问题引入(二)观察感知,启发引导(三)自主探究,体会思想(四)例题学习,变式巩固(五)知识应用,尝试练习(六)解决疑问,尝试小结(七)课后作业,自主学习板书设计八、教学反思1. 注重系统学习,课后作业为下一节课作铺垫.课前作业(即前面学习的作业)的中“问题二”与熟悉的问题有些类似,都是两个变量的相关关系,但却不能使用回归分析的方法来做. 尽管如此,学生还是能够利用比例、图形去解决问题,为新课学习提供了很好的铺垫. 本节课的作业,除了巩固所学知识,也要为下一节课作铺垫.2. 解决疑问,尝试小结在教学设计过程中,预留时间给学生提出自己的问题,尝试自己去小结,可让学生做到自主学习,进行课堂复习,有时还能克服学生在下课前的疲劳状态.给时间学生思考本节课还不懂的问题,可写在小纸上. 对于学生提出的问题,适当解决. 这样可方便进行教学反思,也为下一节课的设计提供一些材料.独立性检验的基本思想及其初步应用的教案说明教材:人教A版·普通高中课程标准实验教科书·数学·选修1-2针对所教班级的数学基础比较弱,本节课通过之前准备的两个实习作业,让学生在一定的感性认识的基础上,带着问题与好奇心,感受数学从感性认识上升到理性认识,共同经历从定性描述到定量描述的过程,从中认识数学解决问题的方法. 根据新课程的特点,本课以学生发展为本,遵循学生的认知规律,体现循序渐进、共同探究与启发式的教学原则,充分发挥学生的主体作用与教师在适当环节的引导作用.一、对教学目标和教学重难点的认识:根据数学学科的特点、学生身心发展的合理需要,本节课从认知、能力、情感等层面确定了相应的教学目标.想及随机变量卡方的含义二、教学方法的选择:采用“活动(课前)→问题→解决问题→总结”的教学方法,即:在教师的引导下,通过开放性问题的设置来启发学生思考,在思考中体会数学概念的形成过程中所蕴涵的数学思想和方法,加强学生能力的培养.三、教学手段的利用:采用多媒体技术,通过各种素材的呈现,提高学生学习兴趣、激活学生思维、加深理解.四、教学过程的说明:针对学生已有的体验以及学生的认知水平,把教学过程分为了七个环节:。
人教版高中数学章节目录
第一章集合与函数概念
集合
函数及其表示
函数的基本性质
第二章基本初等函数(Ⅰ)
指数函数
对数函数
幂函数
第三章函数的应用
函数与方程
函数模型及其应用
人教版高中数学必修二目录
第一章空间几何体
空间几何体的结构
空间几何体的三视图和直观图
空间几何体的表面积与体积
第二章点、直线、平面之间的位置关系
3.3 导数在研究函数中的应用
3.4 生活中的优化问题举例
人教版高中数学选修1-2目录
第一章 统计案例
1.1 回归分析的基本思想及其初步应用
1.2 独立性检验的基本思想及其初步应用
第二章 推理与证明
2.1 合情推理与演绎推理
2.2 直接证明与间接证明
第三章 数系的扩充与复数的引入
3.1 数系的扩充和复数的概念
2.2 二项分布及其应用
2.3 离散型随机变量的均值与方差
2.4 正态分布
第三章 统计案例
3.1 回归分析的基本思想及其初步应用
3.2 独立性检验的基本思想及其初步应用
人教版高中数学选修4-1目录
第一讲 相似三角形的判定及有关性质
一 平行线等分线段定理
二 平行线分线段成比例定理
三 相似三角形的判定及性质
2.2 直接证明与间接证明
2.3 数学归纳法
第三章 数系的扩充与复数的引入
3.1 数系的扩充和复数的概念
3.2 复数代数形式的四则运算
人教版高中数学选修2-3目录
第一章 计数原理
1.1 分类加法计数原理与分步乘法计数原理
1.2 排列与组合
1.3 二项式定理
独立性检验的基本思想及其初步应用
【解】 根据题目所给数据得如下 2×2 列联表:
(a c)(b d) n(a b)(c d)
课堂练习
1.下列关于等高条形图的叙述正确的是( ) A.从等高条形图中可以精确地判断两个分类变量是否有关系 B.从等高条形图中可以看出两个变量频数的相对大小 C.从等高条形图可以粗略地看出两个分类变量是否有关系 D.以上说法都不对 解析:选 C.在等高条形图中仅能粗略判断两个分类变量的关 系,故 A 错.在等高条形图中仅能找出频率,无法找出频数, 故 B 错.
有关概念:分类变量
对于性别变量,其取值为男和女两种,这种变量的 不同“值”表示个体所属的不同类别,像这样的变量称 为分类变量.如是否吸烟、是否患肺癌、宗教信仰、国 籍等等
在日常生活中,主要考虑分类变量之间是否有关系: 例如,吸烟是否与患肺癌有关系?等等.
“美图”欣赏
列联表 2×2 为了调查吸烟是否对肺癌有影响,某肿瘤研究所随机 地调查了9965人,得到如下结果(单位:人)
查对临界值表,作出判断。(如果K2值很大,就断言 H0不成立,即认为“两个分类变量有关系”;如果很 小,则说明在样本数据中没有发现足够证据拒绝H0。)
例题解析:
例1. 在某医院,因为患心脏病而住院的665名男性病人中, 有214人秃顶;而另外772名不是因为患心脏病而住院的 男性病人中,有175人秃顶. 利用图形判断秃顶与患心脏 病是否有关系。能否在犯错误的概率不超过0.010的前 提下认为秃顶与患心脏病有关系?
9965(7775 49 42 2099)2
k
56.632.
7817 2148 9874 91
在H0成立的情况下,统计学家估算出如下的概率:
P(K 2 6.635) 0.01
2014-2015学年高中数学(人教版选修1-2)课时训练第一章 1.2 独立性检验的基本思想及其初步应用
y
x x1 x2 总计
y1
a c a+c
y2
b d b+d
总计
a+b c+ d a+b+c+d
栏 目 链 接
在列联表中,如果两个分类变量没有关系,则应该满足ad -bc≈0.因此|ad-bc|越小,说明两个分量之间的关系越 弱;|ad-bc|越大,说明两个分类变量之间的关系越强.
栏 目 链 接
解析:P(K2>3.841)=0.05,判断出错的可能性为5%.
答案:5%
栏 目 链 接
1.重点 通过案例理解分类变量、列联表、独立性检验的含义; 利用列联表的独立性检验进行估计.
栏 目 链 接
2.难点 独立性检验的基本思想;随机变量K2的含义.
第一章
统计案例
1.2 独立性检验的基本思想及其初步应用
栏 目 链 接
1. 了解独立性检验 记住K2的计算公式. 用.
只要求 2×2 列联表
的基本思想,
2. 了解实际推断原理和假设检验的基本思想及其初步应 3. 通过实际问题培养学生的学习兴趣,激发学生学习的 积极性和主动性,增强社会实践能力,培养分析问题、解决 问题的能力.
②图形分析: 利用等高条形图来分析两分类变量之间是否具有相关关系,形象、直 观地反映两个分类变量之间的总体状态和差异大小, 进而推断它们之间是 否有关系. a.绘制等高条形图时,列联表的行对应的是高度,两行的数据不相等, 但对应的条形图的高度是相同的,两列的数据对应不同颜色.b.等高条形 图中有两个高度相同的矩形,每一个矩形中都有两种颜色,观察下方颜色 a c 区域的高度,如果两个高度相差比较明显(即 和 相差很大),就判 a+b c+d 断两个分类变量之间有关系.
独立性检验的基本思想及其初步应用》
独立性检验的基本思想及其初步应用》生更加直观地理解两个分类变量之间的关系。
问题2:根据三维柱形图和二维条形图,你能否看出吸烟者和不吸烟者患肺癌的比例有何不同?二、独立性检验的基本思想1、独立性检验的基本思想:独立性检验是用来检验两个分类变量是否有关系的一种统计方法。
如果两个分类变量是独立的,那么它们之间是没有关系的;如果两个分类变量不独立,则它们之间是有关系的。
2、独立性检验的步骤:1)列出列联表;2)计算期望频数;3)计算卡方值;4)查表得出显著性水平;5)判断两个分类变量是否有关系。
三、K2检验的计算公式1、K2检验的计算公式:K2=∑(Oi-Ei)²/Ei其中,Oi为观察频数,Ei为期望频数。
2、K2检验的含义:K2检验的值越大,观察频数与期望频数的差距越大,两个分类变量之间的关系就越显著。
四、独立性检验的应用举例1、应用举例:1)医学研究:调查吸烟是否对患肺癌有影响;2)社会调查:调查男女是否对某一品牌的喜好程度有影响;3)市场调查:调查年龄与消费金额是否有关系。
2、独立性检验的应用:通过独立性检验,可以判断两个分类变量是否有关系,从而为我们提供科学的依据,进行合理的决策。
教学反思:本节课通过生动的例子和图表,引入了独立性检验的基本概念和思想。
通过对K2检验公式的介绍,让学生了解了如何计算卡方值。
同时,通过应用举例,让学生了解了独立性检验的实际应用。
在教学过程中,教师注重启发学生的思维,让学生在合作探究中主动掌握知识,达到了预期的教学目标。
练1、在某医院,665名男性病人中,214人秃顶,而在772名非心脏病男性病人中,175人秃顶。
能否以99%的置信度认为“秃顶与患心脏病”有关系?思考1、为调查某地区老年人是否需要志愿者提供帮助,用简单随机抽样方法从该地区调查了500位老年人,结果如下:性别。
是否需要志愿者需要。
不需要男性。
30.170女性。
373.271)估计该地区老年人中需要志愿者提供帮助的比例;2)能否以99%的置信度认为该地区的老年人是否需要志愿者提供帮助与性别有关系?思考2、某研究小组为了研究中学生的身体发育情况,在某学校随机抽出20名15至16周岁的男生,将他们的身高和体重制成2×2列联表,根据列联表的数据,能否以95%的置信度认为该学校15至16周岁的男生的身高和体重之间有关系?课后作业:课本第18页第1题和第2题。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
1.2独立性检验的基本思想及其初步应用1.了解分类变量的意义.2.了解2×2列联表的意义.3.了解随机变量K2的意义.4.通过对典型案例分析,了解独立性检验的基本思想和方法.1.分类变量和列联表(1)分类变量变量的不同“值”表示个体所属的不同类别,像这样的变量称为分类变量.(2)列联表①定义:列出的两个分类变量的频数表称为列联表.②2×2列联表一般地,假设有两个分类变量X和Y,它们的取值分别为{x1,x2}和{y1,y2},其样本频数列联表(也称为2×2列联表)为下表.2.等高条形图(1)等高条形图与表格相比,更能直观地反映出两个分类变量间是否相互影响,常用等高条形图展示列联表数据的频率特征.(2)观察等高条形图发现aa+b和cc+d相差很大,就判断两个分类变量之间有关系.3.独立性检验(1)定义利用随机变量K2来判断“两个分类变量有关系”的方法称为独立性检验.(2)K2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d),其中n=a+b+c+d为样本容量.(3)独立性检验的具体做法①根据实际问题的需要确定容许推断“两个分类变量有关系”犯错误概率的上界α,然后查表确定临界值k0.②利用公式计算随机变量K2的观测值k.③如果k≥k0,就推断“X与Y有关系”,这种推断犯错误的概率不超过α,否则,就认为在犯错误的概率不超过α的前提下不能推断“X与Y有关系”,或者在样本数据中没有发现足够证据支持结论“X与Y有关系”.1.判断下列命题(正确的打“√”,错误的打“×”)(1)列联表中的数据是两个分类变量的频数.()(2)事件A与B的独立性检验无关,即两个事件互不影响.()(3)K2的大小是判断事件A与B是否相关的统计量.()答案:(1)√(2)×(3)√2.下面是调查某地区男女中学生喜欢理科的等高条形图,阴影部分表示喜欢理科的百分比,从图中可以看出()A.性别与喜欢理科无关B.女生中喜欢理科的比为80%C.男生比女生喜欢理科的可能性大些D.男生不喜欢理科的比为60%答案:C3.若由一个2×2列联表中的数据计算K2的观测值k=4.013,那么在犯错误的概率不超过________的前提下认为两个变量有关系.答案:0.05探究点一等高条形图从发生交通事故的司机中抽取2 000名司机作随机样本,根据他们血液中是否含有酒精以及他们是否对事故负有责任将数据整理如下:相应的等高条形图如图.试结合等高条形图分析血液中含有酒精与对事故负有责任是否有关.[解]从题图中可以看出,阴影部分所占比例差距较大,由此我们可以在某种程度上认为“血液中含有酒精”与“对事故负有责任”有关系.利用等高条形图判断两个分类变量是否相关的步骤1.某学校对高三学生做了一项调查发现:在平时的模拟考试中,性格内向的学生426人中332人在考前心情紧张,性格外向的学生594人中有213人在考前心情紧张,作出等高条形图,利用图形判断考前心情紧张与性格类别是否有关系.解:作列联表如下:相应的等高条形图如图所示:图中阴影部分表示考前心情紧张与考前心情不紧张中性格内向的比例,从图中可以看出考前心情紧张的样本中性格内向占的比例比考前心情不紧张样本中性格内向占的比例大,可以认为考前心情紧张与性格类别有关.探究点二独立性检验某校对学生的课外活动进行调查,结果整理成下表:试用你所学过的知识进行分析,能否在犯错误的概率不超过0.005的前提下,认为学生喜欢课外活动的类别与性别有关系.[解]由表中数据可知K2的观测值k=n(ad-bc)2(a+b)(c+d)(a+c)(b+d)=79×(21×29-23×6)2 44×35×27×52≈8.106.因为P(K2≥7.879)≈0.005,且8.106>7.879,所以在犯错误的概率不超过0.005的前提下,可以认为学生喜欢课外活动的类别与性别有关系.解决独立性检验问题的基本步骤(1)根据已知的数据作出列联表. (2)求K 2的观测值.(3)判断可能性:与临界值比较,得出事件有关的可能性大小.2.福建师大开展阳光体育活动,为了研究锻炼时间与性别是否有关,对全校大学生的锻炼时间进行随机抽样调查,从中随机抽取男、女生各25名进行了问卷调查,得到如下列联表:(1)请把列联表中的数据补充完整;(2)根据表中数据分析,在犯错误的概率不超过多少的前提下可以认为“锻炼时间与性别有关”?解:(1)列联表如下:(2)根据2×2k =50×(5×10-20×15)220×30×25×25≈8.333>7.879,所以在犯错误的概率不超过0.005的前提下,可以认为“锻炼时间与性别有关”.1.两分类变量之间关联关系的定性分析 (1)频率分析通过对样本的每个分类变量的不同类别和事件发生的频率的大小比较来分析分类变量之间是否有关联关系,通常通过列联表列出两个分类变量进行分析.(2)图形分析利用等高条形图来分析两分类变量之间是否具有相关关系,形象、直观地反映两个分类变量之间的总体状态和差异大小,进而推断它们之间是否具有相关关系.2.独立性检验的基本思想独立性检验的基本思想类似于数学上的反证法.要判断“两个分类变量有关系”这一结论成立的可信程度,首先假设该结论不成立,即假设结论“两个分类变量没有关系”成立,在该假设下构造的随机变量K 2应该很小.若由观测数据求得的K 2的观测值k 很大,则断言假设不成立.给定一个正数k 0,称为一个判断规则的临界值.如果k ≥k 0,就认为“两个分类变量之间有关系”;否则就认为“两个分类变量之间没有关系”.规范解答——频率分布直方图与独立性检验的综合应用(本题满分12分)某高校共有学生15 000人,其中男生10 500人,女生4 500人,为调查该校学生每周平均体育运动时间的情况,采用分层抽样的方法,收集300位学生每周平均体育运动时间的样本数据(单位:小时).(1)应收集多少位女生的样本数据?(2)根据这300个样本数据,得到学生每周平均体育运动时间的频率分布直方图(如图所示),其中样本数据的分组区间为[0,2),[2,4),[4,6),[6,8),[8,10),[10,12],估计该校学生每周平均体育运动时间超过4小时的概率.(3)在样本数据中,有60位女生的每周平均体育运动时间超过4小时,请完成每周平均体育运动时间与性别列联表,并判断在犯错误的概率不超过0.05的前提下,是否可认为“该校学生的每周平均体育运动时间与性别有关”.附:K 2=n (ad -bc )(a +b )(c +d )(a +c )(b +d ).[解] (1)300×4 50015 000=90,所以应收集90位女生的样本数据. (3分)(2)由频率分布直方图得1-2×(0.025+0.100)=0.75,所以该校学生每周平均体育运动时间超过4小时的概率的估计值为0.75. (6分)(3)由(2)知,300位学生中有300×0.75=225(人)的每周平均体育运动时间超过4小时,75人的每周平均体育运动时间不超过4小时.又因为样本数据中有210份是关于男生的,90份是关于女生的,所以每周平均体育运动时间与性别列联表如下:每周平均体育运动时间与性别列联表结合列联表可算得k =300×(45×60-165×30)75×225×210×90=10021≈4.762>3.841.(10分)所以,在犯错误的概率不超过0.05的前提下,可以认为“该校学生的每周平均体育运动时间与性别有关”.(12分)[规范与警示] (1)按频率分布直方图的信息,统计出相关的数值. (2)利用独立性检验的基本思想作出分析判断.[A 基础达标]1.下面是2×2列联表:则表中a ,b 的值分别为( ) A .94,72 B .52,50 C .52,74 D .74,52 解析:选C.根据列联表的特点,可知:⎩⎪⎨⎪⎧a +21=73,a +22=b ,解得⎩⎪⎨⎪⎧a =52,b =74. 2.下列关于等高条形图的叙述正确的是( )A .从等高条形图中可以精确地判断两个分类变量是否有关系B .从等高条形图中可以看出两个变量频数的相对大小C .从等高条形图中可以粗略地看出两个分类变量是否有关系D .以上说法都不对解析:选C.在等高条形图中仅能粗略判断两个分类变量的关系,故A 错.在等高条形图中仅能够看出频率,无法看出频数,故B 错.3.在研究打鼾与患心脏病之间的关系中,通过收集数据、整理分析数据得到“打鼾与患心脏病有关”的结论,并且在犯错误的概率不超过0.01的前提下认为这个结论是成立的.下列说法中正确的是( )A .100个心脏病患者中至少有99人打鼾B .1个人患心脏病,则这个人有99%的概率打鼾C .100个心脏病患者中一定有打鼾的人D .100个心脏病患者中可能一个打鼾的人都没有解析:选D.这是独立性检验,在犯错误的概率不超过0.01的前提下认为“打鼾与患心脏病有关”.这只是一个概率,即打鼾与患心脏病有关的可能性为99%.根据概率的意义可知答案应选D.4.在等高条形图中,下列哪两个比值相差越大,要推断的论述成立的可能性就越大( )A.a a +b 与d c +dB.c a +b 与a c +dC.a a +b 与c c +dD.a a +b 与c b +c解析:选C.由等高条形图的意义可知a a +b 与c c +d的值相差越大,|ad -bc |就越大,相关性就越强.5.对两个分类变量A 、B 的下列说法中正确的个数为( ) ①A 与B 无关,即A 与B 互不影响;②A 与B 关系越密切,则K 2的观测值就越大;③K 2的观测值大小是判定A 与B 是否相关的唯一依据. A .1 B .2C.3 D.0解析:选A.①正确,A与B无关即A与B相互独立;②不正确,K2的观测值的大小只是用来检验A与B是否相互独立;③不正确,也可借助等高条形图等.故选A.6.如果由一个2×2列联表中的数据计算得K2的观测值k≈4.013,那么在犯错误的概率不超过________的前提下,认为两个变量之间有关系.解析:因为k=4.013>3.841,所以在犯错误的概率不超过0.05的前提下,认为两个变量有关系.答案:0.057.在吸烟与患肺病是否相关的判断中,有下面的说法:①若K2的观测值k>6.635,则在犯错误的概率不超过0.01的前提下,认为吸烟与患肺病有关系,那么在100个吸烟的人中必有99人患有肺病;②从独立性检验可知在犯错误的概率不超过0.01的前提下,认为吸烟与患肺病有关系时,若某人吸烟,则他有99%的可能患有肺病;③从独立性检验可知在犯错误的概率不超过0.05的前提下,认为吸烟与患肺病有关系时,是指有5%的可能性使得推断错误.其中说法正确的是________.解析:K2是检验吸烟与患肺病相关程度的量,是相关关系,而不是确定关系,是反映有关和无关的概率,故说法①不正确;说法②中对“确定容许推断犯错误概率的上界”理解错误;说法③正确.答案:③8.某高校《统计初步》课程的教师随机调查了选该课的一些学生情况,具体数据如下表:为了判断主修统计专业是否与性别有关系,根据表中数据,得到K2=50×(13×20-10×7)2≈4.844>3.841.所以断定主修统计专业与性别有关系,那么这种判23×27×20×30断出错的可能性约是________.解析:根据K2≈4.844>3.841知,这种判断出错的可能性约是5%.答案:5%9.某生产线上,质量监督员甲在生产现场时,990件产品中有合格品982件,次品8件;不在生产现场时,510件产品中有合格品493件,次品17件.试利用列联表和等高条形图判断监督员甲在不在生产现场对产品质量好坏有无影响.解:根据题目所给数据得如下2×2列联表:因为ad-bc=982×17-8×493=12 750,|ad-bc|比较大,说明甲在不在生产现场与产品质量好坏有关系.相应的等高条形图如图所示.图中两个阴影部分的高分别表示甲在生产现场和甲不在生产现场时样品中次品数的频率.从图中可以看出,甲不在生产现场时样本中次品数的频率明显高于甲在生产现场时样本中次品数的频率.因此可以认为质量监督员甲在不在生产现场与产品质量好坏有关系.10.某校高一年级共有800名学生,其中男生480名,女生320名,在某次满分为100分的数学考试中,所有学生的成绩均在30分及30分以上,成绩在“80分及80分以上”的学生视为优秀,现按性别采用分层抽样的方法抽取100名学生的数学成绩,将他们的成绩按[30,40)、[40,50)、[50,60)、[60,70)、[70,80)、[80,90)、[90、100]分成七组,得到的频率分布直方图如图所示:(1)估计该年级本次数学考试成绩的平均分(同一组中的数据用该区间中点值作代表); (2)请将下列2×2列联表补充完整,计算并说明能否在犯错误的概率不超过0.05的前提下认为“该校学生数学成绩优秀与性别有关”.解:(1)估计该年级本次数学考试成绩的平均分为0.04×35+0.12×45+0.2×55+0.28×65+0.18×75+0.12×85+0.06×95=65.4(分).(2)应抽取男生60人,女生40人,可得2×2列联表:则K 2的观测值k =100×(12×34-6×48)18×82×40×60≈0.407<3.841,所以在犯错误的概率不超过0.05的前提下不能认为“该校学生数学成绩优秀与性别有关”.[B 能力提升]1.观察下列各图,其中两个分类变量x ,y 之间关系最强的是( )解析:选B.根据独立性检验的基本思想知x 与y 关系最强的是B. 2.有两个分类变量X ,Y ,其一组的列联表如下所示,其中a ,15-a 均为大于50.05的前提下认为X ,Y 有关,则a 的值为( )A .8B .9C .8,9D .6,8解析:选C.根据公式,得K 2的观测值k =65×[a (30+a )-(15-a )(20-a )]220×45×15×50=13×(13a -60)220×45×3×2>3.841,根据a >5且15-a >5,a ∈Z ,求得a =8,9满足题意.3.某校对有心理障碍学生进行测试得到如下列联表:则在焦虑、说谎、懒惰这三种心理障碍中与性别关系最大的是________.解析:对于题中三种心理障碍分别构造三个随机变量K 21,K 22,K 23,其观测值分别为k 1,k 2,k 3,由表中数据列出焦虑是否与性别有关的2×2列联表:可得k 1=110×(5×60-25×20)30×80×25×85≈0.863<2.706,同理,k 2=110×(10×70-20×10)230×80×20×90≈6.366>5.024,k 3=110×(15×30-15×50)230×80×65×45≈1.410<2.706.因此,说谎与性别关系最大.答案:说谎4.(选做题)某大学高等数学老师这学期分别用A ,B 两种不同的教学方式试验甲、乙两个大一新班(人数均为60人,入学时数学平均分数和优秀率都相同,勤奋程度和自觉性都一样).现随机抽取甲、乙两班各20名同学的高等数学期末考试成绩(单位:分),得到如下茎叶图:(1)依茎叶图判断哪个班的平均分高;(2)现从甲班高等数学成绩不低于80分的同学中随机抽取两名同学,求成绩为86分的同学至少有一个被抽中的概率;(3)学校规定:成绩不低于85分为优秀,请填写下面的2×2列联表,并判断“能否在犯错误的概率不超过0.025的前提下认为成绩优秀与教学方式有关”.解:(1)80~100分之间,所以乙班的平均分高.(2)记成绩为86分的同学为A 、B ,其他不低于80分的同学为C ,D ,E ,F .“从甲班高等数学成绩不低于80分的同学中随机抽取两名同学”的一切可能结果组成的基本事件有(A ,B ),(A ,C ),(A ,D ),(A ,E ),(A ,F ),(B ,C ),(B ,D ),(B ,E ),(B ,F ),(C ,D ),(C ,E ),(C ,F ),(D ,E ),(D ,F ),(E ,F )共15个,“抽到至少有一个同学的成绩为86分”所组成的基本事件有(A ,B ),(A ,C ),(A ,D ),(A ,E ),(A ,F ),(B ,C ),(B ,D ),(B ,E ),(B ,F )共9个,故P =915=35.(3)根据给定的数据,填写相应的数据如下所示:则K 2的观测值k =40×(3×10-10×17)213×27×20×20≈5.584>5.024,因此在犯错误的概率不超过0.025的前提下可以认为成绩优秀与教学方式有关.。