选修1-2.1.2独立性检验
苏教版选修1-2高中数学1.1《独立性检验》
甲厂 乙厂 合计 优质品 非优质品 合计
2 n ad - bc 附:χ2= , a+bb+ca+cb+d
P(χ2≥x0) x0
0.05
0.01
3.841 6.635
课前探究学习
课堂讲练互动
解 (1)甲厂抽查的产品中有 360 件优质品,从而甲厂生产的零件 360 的优质品率估计为500=72%; 乙厂抽查的产品中有 320 件优质品,从而乙厂生产的零件的优质 320 品率估计为500=64%. (2) 甲厂 乙厂 合计 优质品 360 320 680
课前探究学习 课堂讲练互动
【题后反思】 统计的基本思维模式是归纳,通过部分数据的性质 来推测全部数据的性质,从数据上体现的只是统计关系,而不是 因果关系.
课前探究学习
课堂讲练互动
【训练3】 某企业有两个分厂生产某种零件,按规定内径尺寸(单 位: mm) 的值落在 [29.94,30.06) 的零件为优质品.从两个分 厂生产的零件中各抽出了 500 件,量其内径尺寸,得结果如
(4)若χ2≤2.706,则认为没有充分的证据显示“Ⅰ与Ⅱ有关系”,
但也不能作出结论“H0成立”,即不能认为Ⅰ与Ⅱ没有关 系.
课前探究学习
课堂讲练互动
题型一 利用χ2判定两个变量间的关系 【例1】 某电视台联合相关报社对“男女同龄退休”这一公众关
注的问题进行了民意调查,数据如下表所示:
赞同 男 女 合计 198 476 674
可能性为1%.
课前探究学习 课堂讲练互动
名师点睛 1.独立性检验
2 n ad - bc (1)利用随机变量 χ2= ,(其中 n=a+b a+bc+da+cb+d
+c+d 为样本容量),来确定在多大程度上可以认为“两个分 类变量有关系”的方法称为两个分类变量的独立性检验.
高中选修1-2回归分析和独立性检验知识总结与联系
高中选修1-2回归分析和独立性检验知识总结与联系-CAL-FENGHAI-(2020YEAR-YICAI)_JINGBIAN1122211()()()n n i i i i i i n n i i i i x x y y x y nx y b x x x nx a y bx ====⎧---⎪⎪==⎪⎨--⎪⎪=-⎪⎩∑∑∑∑选修1-2第一部分 变量间的相关关系与统计案例【基础知识】一、回归分析1.两个变量的线性相关:判断是否线性相关 ①用散点图(1)正相关:在散点图中,点散布在从左下角到右上角的区域.对于两个变量的这种相关关系,我们将它称为正相关.(2)负相关:在散点图中,点散布在从左上角到右下角的区域,两个变量的这种相关关系称为负相关.(3)线性相关关系、回归直线:如果散点图中点的分布从整体上看大致在一条直线附近,就称这两个变量之间具有线性相关关系,这条直线叫做回归直线. ②用相关系数r(3)除用散点图外,还可用样本相关系数r 来衡量两个变量x ,y 相关关系的强弱,ni ix y nx yr -•=∑当r >0,表明两个变量正相关,当r <0,表明两个变量负相关,r 的绝对值越接近于1,表明两个变量的线性相关性越强;r 的绝对值越接近于0,表明两个变量之间几乎不存在线性相关关系,通常|r |0.75>时,认为这两个变量具有很强的线性相关关系. 2.回归方程:两个变量具有线性相关关系,数据收集如下:可用最小二乘法得到回归方程ˆy bx a =+,其中3.回归分析的基本思想及其初步应用(1)回归分析是对具有相关关系的两个变量进行统计分析的方法,其常用的 研究方法步骤是画出散点图,求出回归直线方程,并利用回归直线方程进行预报.(2)对n 个样本数据(x 1,y 1)、(x 2,y 2)、…、(xn ,yn ),(,)x y 称为样本点的中心.样本点中心一定落在回归直线上。
4、回归效果的刻画:用相关指数2R来刻画回归的效果,公式是2 2121()1()ni iiniiy yRy y==-=--∑∑2R的值越大,说明残差平方和越小,也就是说模型拟合效果好二.独立性检验的基本思想及其初步应用题型一相关关系的判断【例1】对四组数据进行统计,获得以下散点图,关于其相关系数比较,正确的是()A.r2<r4<0<r3<r1B. r4<r2<0<r 1<r3C. r4<r2<0<r3<r1D. r2<r4<0<r1<r3【变式1】 根据两个变量x ,y 之间的观测数据画成散点图如图所示,这两个变量是否具有线性相关关系________(填“是”与“否”).题型二 线性回归方程【例2】在2013年元旦期间,某市物价部门对本市五个商场销售的某商品一天的销售量及其价格进行调查,五个商场的售价x 元和销售量y 件之间的一价格x 9 9.5 10 10.5 11销售量y11 10 8 6 5 y 关于商品的价格x 的线性回归方程为________.(参考公式:b ^= ,a ^=y -b ^x )【变式3】为了解儿子身高与其父亲身高的关系,随机抽取5对父子的身高数据如下:父亲身高x /cm 174 176 176 176 178儿子身高y /cm175 175 176 177 177则y 对x 的线性回归方程为( ). A .y =x -1 B .y =x +1C .y =88+12x D .y =176题型三 独立性检验【例4】通过随机询问110名性别不同的行人,对过马路是愿意走斑马线由K 2=n (ad -dc )(a +b )(c +d)(a +c )(b +d ),算得K 2=110×(40×30-20×20)260×50×60×50≈7.8.附表:A. 有99%以上的把握认为“选择过马路的方式与性别有关”B. 有99%以上的把握认为“选择过马路的方式与性别无关”C. 在犯错误概率不超过0.1%的前提下,认为“选择过马路的方式与性别有关”D. 在犯错误概率不超过0.1%的前提下,认为“选择过马路的方式与性别无关【变式2】 某企业有两个分厂生产某种零件,按规定内径尺寸(单位:mm)的值落在[29.94,30.06)的零件为优质品.从两个分厂生产的零件中各抽出了500件,(2)由以上统计数据填下面2×2列联表,并问是否有99%的把握认为“两个分附 K 2巩固提高1.下列说法:①将一组数据中的每个数据都加上或减去同一个常数后,方差恒不变;②设有一个回归方程y ^=3-5x ,变量x 增加一个单位时,y 平均增加5个单位;③线性回归方程y ^=b ^x +a ^必过(x ,y );④在一个2×2列联表中,由计算得K 2=13.079,则有99%的把握确认这两个变量间有关系;其中错误的个数是( )A. 0B. 1C. 2D. 32.已知回归直线斜率的估计值为1.23,样本点的中心为点(4,5),则回归直线的方程为( ) A. y ^=1.23x +4 B. y ^=1.23x +5 C. y ^=1.23x +0.08 D. y ^=0.08x +1.23 3.从所得的散点图分析可知:y 与x 线性相关,且y =0.95x +a ,则a =( ) A. 1.30 B. 1.45 C. 1.65 D. 1.804.根据上表可得回归直线方程:y =0.56x +a ,据此模型预报身高为172 cm 的高三男生的体重为( )A. 70.09 kgB. 70.12 kgC. 70.55 kgD. 71.05 kg5.调查了某地若干户家庭的年收入x (单位:万元)和年饮食支出y (单位:万元),调查显示年收入x 与年饮食支出y 具有线性相关关系,并由调查数据得到y 对x的回归直线方程:y ^=0.254x +0.321.由回归方程可知,家庭年收入每增加1万元,年饮食支出平均增加________万元.6.利用独立性检验对两个分类变量是否有关系进行研究时,若在犯错误的概率不超过0.005的前提下认为事件A 和B 有关系,则具体计算出的数据应该是( )A .k≥6.635B .k <6.635C .k≥7.879D .k <7.8797.某高校“统计初步”课程的教师随机调查了选该课的一些学生的情况,具体数据如下表:非统计专业统计专业男13 10女7 20为了判断主修统计专业是否与性别有关系,根据表中数据得到,k=50(13×20-10×7)220×30×23×27≈4.844,因为k>3.841,所以确定主修统计专业与性别有关系,那么这种判断出错的可能性为________.与销售额(单位:百万元)之间有如下对应数据:(1)画出散点图;(2)求线性回归方程;(3)试预测广告费支出为百万元时,销售额多大?9.下表提供了某厂节能降耗技术改造后生产甲产品过程中记录的产量x(吨)与相应的生产能耗y(吨标准煤)的几组对照数据.(1)请画出上表数据的散点图;(2)请根据上表提供的数据,用最小二乘法求出关于的线性回归方程;(3)已知该厂技改前吨甲产品的生产能耗为吨标准煤,试根据(2)求出的线性回归方程,预测生产吨甲产品的生产能耗比技改前降低多少吨标准煤(参考数值:)9.某大学餐饮中心为了了解新生的饮食习惯,在全校一年级学生中进行了抽样调查,调查结果如下表所示:喜欢甜品不喜欢甜品合计南方学生60 20 80北方学生10 10 20合计70 30 100(1)甜品的饮食习惯方面有差异”;(2)已知在被调查的北方学生中有5名数学系学生,其中2名习惯甜品,现在从这5名学生中随机抽取3人,求至多有1人喜欢甜品的概率.10、我市某校某数学老师这学期分别用两种不同的教学方式试验高一甲、乙两个班(人数均为人,入学数学平均分和优秀率都相同,勤奋程度和自觉性都一样)。
(完整版)1.2.2独立性检验的基本思想及其初步应用习题及答案
数学·选修1-2(人教A版)1.2 独立性检验的基本思想及其初步应用►达标训练1.在研究两个分类变量之间是否有关时,可以粗略地判断两个分类变量是否有关的是( )A.散点图B.等高条形图C.2×2列联表 D.以上均不对答案:B2.在等高条形图形图中,下列哪两个比值相差越大,要推断的论述成立的可能性就越大( )A.aa+b与dc+dB.ca+b与ac+dC.aa+b与cc+dD.aa+b与cb+c答案:C3.对分类变量X与Y的随机变量K2的观测值k,说法正确的是( )A.k越大,“ X与Y有关系”可信程度越小B.k越小,“ X与Y有关系”可信程度越小C.k越接近于0,“X与Y无关”程度越小D.k越大,“X与Y无关”程度越大答案:B4.下面是一个2×2列联表:则表中a、b的值分别为( )A.94、96 B.52、50C.52、54 D.54、52答案:C5.性别与身高列联表如下:那么,检验随机变量K2的值约等于 ( )A.0.043 B.0.367C.22 D.26.87答案:C6.给出列联表如下:根据表格提供的数据,估计“成绩与班级有关系”犯错误的概率约是( )A.0.4 B.0.5 C.0.75 D.0.85答案:B►素能提高1.在调查中发现480名男人中有38名患有色盲,520名女人中有6名患有色盲,下列说法中正确的是( )A .男人、女人中患有色盲的频率分别为0.038、0.006B .男人、女人患色盲的概率分别为19240、3260C .男人中患色盲的比例比女人中患色盲的比例大,患色盲是与性别有关的D .调查人数太少,不能说明色盲与性别有关解析:男人患色盲的比例为38480,比女人中患色盲的比例6520大,其差值为⎪⎪⎪⎪⎪⎪38480-6520≈0.067 6,差值较大. 答案:C2.通过随机询问110名性别不同的大学生是否爱好某项运动,得到如下的列联表:男 女 总计 爱好 40 20 60 不爱好 20 30 50 总计 60 50 110由K 2=算得, K 2=≈7.8.附表:P (K 2≥k 0)0.050 0.010 0.001 k 03.841 6.635 10.828参照附表,得到的正确结论是( )A .有99%以上的把握认为“爱好该项运动与性别有关”B.有99%以上的把握认为“爱好该项运动与性别无关”C.在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别有关”D.在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别无关”答案:A3.若由一个2×2列联表中的数据计算得K2=4.013,那么在犯错误的概率不超过0.05的前提下认为两个变量______(填“有”或“没有”)关系.答案:有4.(2013·韶关二模)以下四个命题:①在一次试卷分析中,从每个试室中抽取第5号考生的成绩进行统计,是简单随机抽样;②样本数据:3,4,5,6,7的方差为2;③对于相关系数r,|r|越接近1,则线性相关程度越强;④通过随机询问110名性别不同的行人,对过马路是愿意走斑马线还是愿意走人行天桥进行抽样调查,得到如下列联表:男女总计走天桥402060走斑马线203050总计6050110由K2=可得,K2==7.8,则有99%以上的把握认为“选择过马路方式与性别有关”,其中正确的命题序号是________.答案:②③④附表P (K2≥k0)0.050.0100.001k03.8416.63510.8285.某学校为了调查喜欢语文学科与性别的关系,随机调查了一些学生情况,具体数据如下表:类别性别不喜欢语文喜欢语文男1310女720为了判断喜欢语文学科是否与性别有关系,根据表中的数据,得到K2的观测值k=≈4.844,因为k≥3.841,根据下表中的参考数据:P(K2≥k0)0.500.400.250.150.100.050.0250.010.0050.001k00.4550.7081.3232.0722.7063.8415.0246.6357.87910.828 判定喜欢语文学科与性别有关系,那么这种判断出错的可能性为________.答案:5%6.某学校课题组为了研究学生的数学成绩与物理成绩之间的关系,随机抽取高二年级20名学生某次考试成绩(满分100分)如下表序号12345678910 数学成绩95758094926567849871物理成绩90637287917158829381序号11121314151617181920 数学成绩67936478779057837283物理成绩77824885699161847886若单科成绩85以上(含85分),则该科成绩优秀.数学成绩优秀数学成绩不优秀合计物理成绩优秀物理成绩不优秀合计解析:(1)2×2列联表为(单位:人):数学成绩优秀数学成绩不优秀合计物理成绩优秀 527物理成绩不优秀 1 1213 合计 6 1420(2)根据题(1)中表格的数据计算,能否在犯错误的概率不超过0.005的前提下认为学生的数学成绩与物理成绩之间有关系?参数数据:①假设有两个分类变量X和Y,它们的值域分别为(x1,x2)和(y1,y2),其样本频数列联表(称为2×2列联表)为:y1y2合计x1 a b a+bx2 c d c+d合计a+c b+d a+b+c+d则随机变量K2=,其中n=a+b+c+d为样本容量;②独立检验随机变量K2的临界值参考表如下:P(K2≥k0)0.500.400.250.150.10k00.4550.708 1.323 2.072 2.706P(K2≥k0)0.050.0250.0100.0050.001 k0 3.841 5.024 6.6357.87910.828解析:根据列联表可以求得K2的观测值k=≈8.802>7.879.在犯错误的概率不超过0.005的前提下认为:学生的数学成绩与物理成绩之间有关系.7. 2013年3月14日,CCTV财经频道报道了某地建筑市场存在违规使用未经淡化海砂的现象.为了研究使用淡化海砂与混凝土耐久性是否达标有关,某大学实验室随机抽取了60个样本,得到了相关混凝土耐久性达标混凝土耐久性不达标总计使用淡化海砂25530 使用未经淡化海砂151530 总计402060的概率不超过1%的前提下,认为使用淡化海砂与混凝土耐久性是否达标有关?解析:提出假设H0:使用淡化海砂与混凝土耐久性是否达标无关.根据表中数据,求得K2的观测值k==7.5>6.635.查表得P(K2≥6.635)=0.010.∴能在犯错误的概率不超过1%的前提下,认为使用淡化海砂与混凝土耐久性是否达标有关.(2)若用分层抽样的方法在使用淡化海砂的样本中抽取了6个,现从这6个样本中任取2个,则取出的2个样本混凝土耐久性都达标的概率是多少?P(K2≥k)0.100.0500.0250.0100.001 k 2.706 3.841 5.024 6.63510.828解析:用分层抽样的方法在使用淡化海砂的样本中抽取6个,其中应抽取“混凝土耐久性达标”的为2530×6=5,“混凝土耐久性不达标”的为6-5=1,“混凝土耐久性达标记”为A1,A2,A3,A4,A5”;“混凝土耐久性不达标”的记为B.在这6个样本中任取2个,有以下几种可能:(A1,A2),(A1,A3),(A1,A4),(A1,A5),(A1,B),(A2,A3),(A2,A4),(A2,A5),(A2,B),(A3,A4),(A3,A5),(A3,B),(A4,A5),(A4,B)(A5,B),共15种.设“取出的2个样本混凝土耐久性都达标”为事件A,它的对立事件A为“取出的2个样本至少有1个混凝土耐久性不达标”,包含(A1,B),(A2,B),(A3,B),(A4,B),(A5,B),共5种可能.∴P(A)=1-P(A)=1-515=23.即取出的2个样本混凝土耐久性都达标的概率是2 3 .8.某食品厂为了检查甲、乙两条自动包装流水线的生产情况,随机在这两条流水线上各抽取40件产品作为样本称出它们的重量(单位:克),重量值落在(495,510]的产品为合格品,否则为不合格品.左下表是甲流水线样本频数分布表,右下图是乙流水线样本的频率分布直方图.产品重量/克频数(490,495] 6(495,500]8(500,505]14(505,510]8(510,515] 4(1)根据上表数据作出甲流水线样本的频率分布直方图;解析:甲流水线样本的频率分布直方图如下:(2)若以频率作为概率,试估计从两条流水线分别任取1件产品,该产品恰好是合格品的概率;解析:由题表知甲样本中合格品数为8+14+8=30,由题图知乙样本中合格品数为(0.06+0.09+0.03)×5×40=36,故甲样本合格品的频率为3040=0.75,乙样本合格品的频率为3640=0.9.据此可估计从甲流水线任取1件产品,该产品恰好是合格品的概率为0.75.从乙流水线任取1件产品,该产品恰好是合格品的概率为0.9.(3)由以上统计数据完成下面2×2列联表,能否在犯错误的概率不超过0.1的前提下认为产品的包装质量与两条自动包装流水线的选择有关?甲流水线乙流水线合计合格品a=b=不合格品c=d=合计n=附表:P(K2≥k0)0.150.100.050.0250.010.0050.001k02.0722.7063.8415.0246.6357.87910.828(参考公式:K2=,其中n=a+b+c+d)解析:2×2列联表如下:∵K2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d)=80×(120-360)266×14×40×40≈3.117>2.706.∴在犯错误的概率不超过0.1的前提下认为产品的包装质量与两条自动包装流水线的选择有关.►品味高考1.为调查某地区老年人是否需要志愿者提供帮助,用简单随机抽样方法从该地区调查了500位老人,结果如下:解析:调查的500位老年人中有70位需要志愿者提供帮助,因此该地区老年人中需要帮助的老年人的比例的估计值为70500=14%.(2)能否在犯错误的概率不超过0.01的前提下认为该地区的老年人是否需要志愿者提供帮助与性别有关?解析:K2的观测值k=500×(40×270-30×160)2200×300×70×430≈9.967,由于9.967>6.635所以在犯错误的概率不超过0.01的前提下认为该地区的老年人是否需要帮助与性别有关.(3)根据(2)的结论,能否提出更好的调查办法来估计该地区的老年人中需要志愿者提供帮助的老年人的比例?说明理由.解析:由于(2)的结论知,该地区的老年人是否需要帮助与性别有关,并且从样本数据能看出该地区男性老年人与女性老年人中需要帮助的比例有明显差异,因此在调查时,先确定该地区老年人中男、女的比例,再把老年人分成男、女两层并采用分层抽样方法比采用简单随机抽样方法更好.附:K2=P(K2≥k0)0.0500.0100.001k0 3.841 6.63510.8282.某工厂有25周岁以上(含25周岁)工人300名,25周岁以下工人200名.为研究工人的日平均生产量是否与年龄有关,现采用分层抽样的方法,从中抽取了100名工人,先统计了他们某月的日平均生产件数,然后按工人年龄在“25周岁以上(含25周岁)”和“25周岁以下”分为两组,再将两组工人的日平均生产件数分为5组:[50,60),[60,70),[70,80),[80,90),[90,100)分别加以统计,得到如图所示的频率分布直方图.(1)从样本中日平均生产件数不足60件的工人中随机抽取2人,求至少抽到一名“25周岁以下组”工人的概率;解析:由已知得,样本中有25周岁以上组工人60名,25周岁以下组工人40名.所以,样本中日平均生产件数不足60件的工人中,25周岁以上组工人有60×0.05=3(人),记为A1,A2,A3;25周岁以下组工人有40×0.05=2(人),记为B1,B2.从中随机抽取2名工人,所有的可能结果共有10种,它们是:(A1,A2),(A1,A3),(A2,A3),(A1,B1),(A1,B2),(A2,B1),(A2,B2),(A3,B1),(A3,B2),(B1,B2).其中至少有1名“25岁以下组”工人的可能结果共有7种,它们是:(A1,B1),(A1,B2),(A2,B1),(A2,B2),(A3,B1),(A3,B2),(B1,B2).故所求的概率P=7 10 .(2)规定日平均生产件数不少于80件者为“生产能手”,请你根据已知条件完成列联表,并判断是否有90%的把握认为“生产能手与工人所在的年龄组有关”?附:K2=P(K2≥k0)0.1000.0500.0100.001k0 2.706 3.841 6.63510.828解析:由频率分布直方图可知,在抽取的100名工人中,“25周岁以上组”中的生产能手60×0.25=15(人),“25周岁以下组”中的生产能手40×0.375=15(人),据此可得2×2列联表如下:生产能手非生产能手合计25周岁以上组15456025周岁以下组152540合计3070100因为1.79<2.706,所以没有90%的把握认为“生产能手与工人所在年龄组有关”.。
人教版A版高中数学选修1-2课后习题解答
人教版A版高中数学选修1-2课后习题解答高中数学选修1-2课后题答案第一章统计案例1.1 回归分析的基本思想及其初步应用回归分析是一种统计分析方法,用于探究自变量与因变量之间的关系。
它的基本思想是通过建立数学模型,利用已知数据进行拟合,从而预测或解释未知数据。
回归分析的初步应用包括简单线性回归和多元线性回归。
1.2 独立性检验的基本思想及其初步应用独立性检验是一种用于检验两个变量之间是否存在关联的方法。
其基本思想是通过观察两个变量之间的频数或频率分布,来判断它们是否相互独立。
独立性检验的初步应用包括卡方检验和Fisher精确检验。
第二章推理证明2.1 合情推理与演绎推理合情推理是指根据已知事实和常识,推断出可能的结论。
演绎推理是指根据已知的前提和逻辑规则,推导出必然的结论。
两种推理方法都有其适用的场合,需要根据具体情况进行选择。
2.2 直接证明与间接证明直接证明是指通过逻辑推理,直接证明所要证明的命题成立。
间接证明是指采用反证法或归谬法,证明所要证明的命题的否定不成立,从而推出所要证明的命题成立。
第三章数系的扩充与复数的引入3.1 数系的扩充与复数的概念数系的扩充是指在实数系的基础上引入新的数,使得一些原来不可解的方程可以得到解。
复数是指由实部和虚部组成的数,可以表示在平面直角坐标系中的点。
复数的引入扩充了数系,使得一些原本无解的方程可以得到解。
3.2 复数的代数形式的四则运算复数的代数形式是指将复数表示为实部和虚部的和的形式。
复数的四则运算包括加减乘除四种运算,可以通过对实部和虚部分别进行运算来得到结果。
第四章框图4.1 流程图流程图是一种用图形表示算法或过程的方法。
它由各种基本符号和连线构成,用于描述算法或过程的各个步骤及其执行顺序。
流程图可以帮助人们更好地理解算法或过程,从而提高效率。
4.2 结构图结构图是一种用于描述程序结构的图形表示方法。
它包括顺序结构、选择结构和循环结构三种基本结构,可以用来表示程序的控制流程。
人教课标版高中数学选修1-2《独立性检验的基本思想及其初步应用(第3课时)》教案-新版
1.1.2 独立性检验的基本思想及其初步应用第三课时一、教学目标 1.核心素养:通过学习独立性检验的基本思想及其初步应用,初步形成基本的数据分析能力, 培养数学运算能力. 2.学习目标(1)1.1.3.1 巩固复习利用等高条形图、列联表、独立性检验的基本思想判断分类变量的关系(3)1.1.3.2 总结归纳利用独立性检验判断两个分类变量相关关系的一般步骤. 3.学习重点总结归纳利用独立性检验判断两个分类变量相关关系的一般步骤. 4.学习难点对独立性检验基本思想的进一步理解 二、教学设计 (一)课前设计 1.预习任务 任务1阅读教材P10-P15,回顾本节主要知识点有哪些? 任务2利用独立性检验判断两个分类变量相关关系的一般步骤是什么?2.预习自测1.与表格相比,能更直观地反映出相关数据总体状况的是( ) A.列联表 B.散点图 C.残差图D.等高条形图解: D2.在吸烟与患肺病这两个分类变量的计算中,下列说法正确的是( )A.若2K 的观测值为635.6 k ,我们有%99的把握认为吸烟与患肺病有关系,那么在100个吸烟的人中必有99人患有肺病.B.从独立性检验可知有%99的把握认为吸烟与患肺病有关系时,我们说某人吸烟,那么他有%99的可能患有肺病.C.若从统计量中求出有%95的把握认为吸烟与患肺病有关系,是指有%5的可能性使得推判出现错误.D.以上三种说法都不正确. 解: C (二)课堂设计 1.知识回顾(1)变量的不同“值”表示个体所属的不同类别,像这样的变量成为分类变量. (2)列出两个分类变量的频数表,称为列联表.(3)独立性检验的基本思想类似于数学中的反证法,要确认两个分类变量有关系这一结论成立的可信程度,首先假设该结论不成立,即0H :两个分类变量没有关系成立,在该假设下我们构造的随机变量2K 应该很小,如果由观测数据计算得到2K 的观测值k 很大,则在一定程度上说明假设不合理,即断言0H 不成立,即认为“两个分类变量有关系”;如果观测值k 很小,则说明在样本数据中没有发现足够证据拒绝0H . 2.问题探究问题探究一 我们主要从几个方面来研究两个分类变量之间有无关系?●活动一 回归旧知,巩固复习重点知识例1.为了调查某生产线上,某质量监督员甲对产品质量好坏有无影响,现统计数据如下:质量监督员甲在现场时,990件产品中合格品982件,次品87件;甲不在现场时,510件产品中合格品493件,次品17件.试分别用列联表,等高条形图,独立性检验的方法对数据进行分析. 【知识点:分类变量,独立性检验,变量间的关系】 详解:(1)2×2列联表如下:由列联表看出|ac -bd |=|982×17-493×8|=12750,即可在某种程度上认为“甲在不在场与产品质量有关”.相应的等高条形图如图所示:●活动二对比学习,巩固重点(2)在解答独立性检验题目过程中.数据有时比较多,一定不要混淆,要分辨清楚,否则会影响解题的下一步,同时计算不能失误.问题探究二利用独立性检验判断两个分类变量是否有关系的一般步骤是什么?●活动一实际操作例2.为考察某种药物预防禽流感的效果,进行动物家禽试验,调查了100个样本,统计结果为:服用药的共有60个样本,服用药但患病的仍有20个样本,没有服用药且未患病的有20个样本. (1)根据所给样本数据完成下面2×2列联表;(2)请问能有多大把握认为药物有效?【知识点:分类变量,独立性检验,变量间的关系】详解:(1)(2)由列联表得:706.2778.260404060)20202040(10022>≈⨯⨯⨯⨯-⨯=K所以大概90%认为药物有效. ●活动二 深层思考,得出一般步骤通过上述解答过程,利用独立性检验判断两个分类变量是否有关系的一般步骤是什么? 1.独立性检验的基本步骤①根据实际问题的需要确定容许推断“两个分类变量有关系”犯错误概率的上界α,然后查临界值表确定临界值0k .②利用公式))()()(()(22d b c a d c b a bd ac n K ++++-=计算随机变量2K 的观测值0k .③如果0k k ≥,就推断“X 与Y 有关系”,这种推断犯错误的概率不超过α;否则,就认为在犯错误的概率不超过α的前提下不能推断“X 与Y 有关系”,或者在样本数据中没有发现足够证据支持结论“X 与Y 有关系”. 2.独立性检验的基本思想(1)利用2K 进行独立性检验,可以对推断的正确性的概率作出估计,样本容量n 越大,这个估计值越准确,如果抽取的样本容量很小,那么利用2K 进行独立性检验的结果就不具有可靠性. (2)独立性检验的思想就是在假设0H 成立的条件下,如果出现一个与0H 相矛盾的小概率事件,就推断0H 不成立,且该推断犯错误的概率不超过这个小概率. 3.课堂总结【知识梳理】1.独立性检验的基本步骤①根据实际问题的需要确定容许推断“两个分类变量有关系”犯错误概率的上界α,然后查临界值表确定临界值0k .②利用公式))()()(()(22d b c a d c b a bd ac n K ++++-=计算随机变量2K 的观测值0k .③如果0k k ≥,就推断“X 与Y 有关系”,这种推断犯错误的概率不超过α;否则,就认为在犯错误的概率不超过α的前提下不能推断“X 与Y 有关系”,或者在样本数据中没有发现足够证据支持结论“X 与Y 有关系”. 2.独立性检验的基本思想(1)利用2K 进行独立性检验,可以对推断的正确性的概率作出估计,样本容量n 越大,这个估计值越准确,如果抽取的样本容量很小,那么利用2K 进行独立性检验的结果就不具有可靠性. (2)独立性检验的思想就是在假设0H 成立的条件下,如果出现一个与0H 相矛盾的小概率事件,就推断0H 不成立,且该推断犯错误的概率不超过这个小概率.【重难点突破】(1)利用三维柱形图、二维条形图、等高条形图直观判断两个分类变量之间是否有关系. (2)利用2×2列联表以及随机变量2K 对两个变量进行独立性检验. 4.随堂检测1.在研究两个分类变量之间是否有关时,可以粗略地判断两个分类变量是否有关的是( ) A.散点图 B.等高条形图 C.2×2列联表 D.以上均不对 【知识点:独立性检验】解:B2.性别与身高列联表如下:A.0.043B.0.367C.22D.26.87【知识点:独立性检验】解:C3.给出列联表如下:()A.0.4B.0.5C.0.75D.0.85【知识点:独立性检验】解:B4.为了解高中生作文成绩与课外阅读量之间的关系,某研究机构随机抽取了60名高中生,通过问卷调查,得到以下数据:()A.没有充足的理由认为课外阅读量大与作文成绩优秀有关B.有0.5%的把握认为课外阅读量大与作文成绩优秀有关C.有99.9%的把握认为课外阅读量大与作文成绩优秀有关D.有99.5%的把握认为课外阅读量大与作文成绩优秀有关【知识点:独立性检验】解:D5.若由一个2×2列联表中的数据计算得K2=4.013,那么在犯错误的概率不超过0.05的前提下认为两个变量______(填“有”或“没有”)关系.【知识点:独立性检验】解:有(三)课后作业基础型自主突破1.在吸烟与患肺病是否有关的研究中,下列属于两个分类变量的是()A.吸烟,不吸烟B.患病,不患病C.是否吸烟、是否患病D.以上都不对【知识点:独立性检验】解:C“是否吸烟”是分类变量,它的两个不同取值;吸烟和不吸烟;“是否患病”是分类变量,它的两个不同取值:患病和不患病.可知A、B都是一个分类变量所取的两个不同值.故选C.【知识点:独立性检验】解:C 由题设知:a=45,b=10,c=30,d=15,=-255×45×75×25≈3.030由附表可知,有90%以上的把握认为“该市居民能否做到‘光盘’与性别有关”,故选C. 3.在吸烟与患肺病这两个分类变量的计算中,下列说法正确的是( )① 若K 2的观测值满足K 2≥6.635,我们有99%的把握认为吸烟与患肺病有关系,那么在100个吸烟的人中必有99人患有肺病;②从独立性检验可知有99%的把握认为吸烟与患病有关系时,我们说某人吸烟,那么他有99%的可能患有肺病;③从统计量中得知有95%的把握认为吸烟与患肺病有关系,是指有5%的可能性使得推断出现错误A.①B.① ③C.③D.②【知识点:独立性检验】解:C ①推断在100个吸烟的人中必有99人患有肺病,说法错误,排除A ,B ,③正确.排除D.4.在一个2×2列联表中,由其数据计算得K 2的观测值679.7 k ,则这两个变量间有关系的可能性为( ) A.99%B.99.5%C.99.9%D.无关系【知识点:独立性检验】解:A K 2的观测值6.635<k <7.879,所以有99%的把握认为两个变量有关系.5. 在600人身上实验某种新药预防感冒的作用,把一年中的记录与另外600个未用新药的人作比较,结果如下问该种新药起到预防感冒的作用的可能性为( ) A. 99%B. 90%C.99.9%D.小于90%【知识点:独立性检验】 解:D6.分析两个分类变量之间是否有关系的常用方法有________;独立性检验的基本思想类似于____.【知识点:独立性检验】解:.频率比较法、图形分析法(三维柱形图、二维条形图、等高条形图)、独立性检验;反证法能力型 师生共研7.有人发现,多看电视容易使人变冷漠,下表是一个调查机构对此现象的调查结果:则有多少的把握认为多看电视与人变冷漠有关系( )A.95%B.99%C. 5%D. 99.9%【知识点:独立性检验】解:B8. 两个分类变量X 和Y 可能的取值分别为{}21,x x 和{}21,y y ,其样本频数满足10=a ,21=b ,35=+d c .若“X 和Y 有关系”犯错误的概率不超过0.05,则c 的值可能等于( )A. 4B. 5C. 6D. 7【知识点:独立性检验】解:A9. 为了考察长头发与女性头晕是否有关联,随机抽取了301名女性,得到如下列联表.试根据表格中已有数据填空.空格中的数据应分别为①________;②________;③________;④________. 【知识点:独立性检验】解:86; 180; 229; 30110. 为了探究电离辐射的剂量与人体的受损程度是否有关,用两种不同剂量的电离辐射照射小白鼠.在照射14天内的结果如表所示:进行统计分析时的统计假设是_______. 【知识点:独立性检验】解:小白鼠的死亡与剂量无关 探究型 多维突破11.调查339名50岁以上有吸烟习惯与患慢性气管炎的人的情况,获数据如下试问:(1)有吸烟习惯与患慢性气管炎病是否有关? (2)用假设检验的思想给予说明. 【知识点:独立性检验】解:(1)根据列联表的数据,得到 6.6356.674))()()(()(22>=++++-=d b c a d c b a bd ac n K 所以有99%的把握认为“吸烟与患慢性气管炎病有关”.(2)假设“吸烟与患病之间没有关系”,由于事件A ={635.62≥K }的概率P(A)≈0.01,即A 为小概率事件,而小概率事件发生了,进而得假设错误,这种推断出错的可能性约有1%.10. 20国集团峰会于2016年月9日至4日在中国杭州进行,为了搞好接待工作,组委会招幕了16名男志愿者和14名女志愿者,调查发现,男、女志愿者中分别有10人和6人会德语,其余人不会德语.(1)根据以上数据完成以下2×2列联表:(2)根据列联表的独立性检验,能否在犯错误的概率不超过0.10的前提下认为性别与会德语有关?【知识点:独立性检验】解:(1)(2)假设:是否会德语与性别无关,由已知数据可求得:706≈k1575.2.1<因此,在犯错误的概率不超过0.10的前提下不能判断会德语与性别有关.自助餐1.为了评价某个电视栏目改革效果,在改革前后分别从居名点抽取了100居民进行调查,经过计算得2K的观测值99=k.根据这一数据分析,下列说法正确的是().0A.有99%的人认为该栏目优秀B.有99%的人认为该栏目是否优秀与改革无关C.有99%的把握认为该栏目是否优秀与改革有关系D.没有充分理由认为该栏目是否优秀与改革有关系【知识点:独立性检验】解:D2.硕士学位与博士学位的一个随机样本给出了关于所获取学位类别与学生性别的分类数据,如下表所示下列各项说法正确的是()A.在犯错误的概率不超过0.01的前提下认为性别与获取学位类别有关B.在犯错误的概率不超过0.01的前提下认为性别与获取学位类别无关C.性格决定获取学位的类别D.以上都是错误的【知识点:独立性检验】解:A3.经过对随机变量2K的研究,得到了若干临界值,当其观测值072k时,对于两个事件A与B,.2我们认为()A. 有95%的把握认为A与B有关系B. 有99%的把握认为A与B有关系C. 没有充分理由说明事件A与B有关系D. 确定事件A与B没有关系【知识点:独立性检验】解:C4. 以下关于独立性检验的说法中,错误的是()A. 独立性检验依据小概率原理B. 独立性检验得到的结论一定正确C. 样本不同,独立性检验的结论可能有差异D. 独立性检验不是判定两分类变量是否相关的唯一方法【知识点:独立性检验】解:B6.某班主任对全班50名学生进行了作业量多少的调查,数据如下表则认为喜欢玩电脑游戏与认为作业量的多少有关系的把握大约为( ) A. 99% B. 97.5%C. 90%D. 无充分依据【知识点:独立性检验】解:B7. 给出下列实际问题:①一种药物对某种病的治愈率;②两种药物治疗同一种病是否有区别;③吸烟者得肺病的概率;④吸烟人群是否与性别有关系;⑤网吧与青少年的犯罪是否有关系.其中用独立性检验可以解决的问题有_______. 【知识点:独立性检验】 解:②④⑤8.某高校“统计初步”课程的教师随机调查了选该课的一些学生情况,具体数据如下表:250(1320107) 4.84423272030k ⨯⨯-⨯=≈⨯⨯⨯因为2 3.841K ≥,所以判定主修统计专业与性别有关系,那么这种判断出错的可能性为________. 【知识点:独立性检验】 解:0.059. 为加强素质教育,使学生各方面全面发展,某学校对学生文化课与体育课的成绩进行了调查统计,结果如下:在探究体育课成绩与文化课成绩是否有关时,根据以上数据可以得到2K 的观测值为________.(精确到0.001) 【知识点:独立性检验】 解:1.25510. 某电视台在一次对收看文艺节目和新闻节目观众的抽样调查中,随机抽取了100名电视观众,相关的数据如下表所示:由表中数据直观分析,收看新闻节目的观众是否与年龄有关;________(填“是”或“否”) 【知识点:独立性检验】 解:是11. 为了了解少年儿童的肥胖是否与常喝碳酸饮料有关,现对30名六年级学生进行了问卷调查得到如下列联表:(平均每天喝500ml 以上为常喝,体重超过50kg 为肥胖)已知在30人中随机抽取一人,抽到肥胖的学生的概率为154. (1)请将上面的列联表补充完整(2)是否有99.5%的把握认为肥胖与常喝碳酸饮料有关?说明你的理由 参考数据:(参考公式:))()()(()(22d b c a d c b a bd ac n K ++++-=,其中d c b a n +++=)【知识点:独立性检验,古典概型】解:(1)设常喝碳酸饮料肥胖的学生有x 人,154302=+x ,6=x (2)由已知数据可求得: 879.7523.82>≈K ,因此有99.5%的把握认为肥胖与常喝碳酸饮料有关.12. 某大学高等数学老师这学期分别用B A ,两种不同的教学方式试验甲、乙两个大一新班(人数均为60人,入学数学平均分数和优秀率都相同;勤奋程度和自觉性都一样).现随机抽取甲、乙两班各20名的高等数学期末考试成绩,得到茎叶图:(1)依茎叶图判断哪个班的平均分高?(2)现从甲班高等数学成绩不得低于80分的同学中随机抽取两名同学,求成绩为86分的同学至少有一个被抽中的概率;(3)学校规定:成绩不低于85分的为优秀,请填写下面的2×2列联表,并判断“能否在犯错误的概率不超过0.025的前提下认为成绩优秀与教学方式有关”.下面临界值表仅供参考:(参考公式:))()()(()(22d b c a d c b a bd ac n K ++++-=,其中d c b a n +++=)【知识点:独立性检验,简单抽样,概率】解(1)甲班高等数学成绩集中于60-90分之间,而乙班数学成绩集中于80-100分之间,所以乙班的平均分高.(2)记成绩为86分的同学为A,B ,其他不低于80分的同学为C,D,E,F“从甲班高等数学成绩不得低于80分的同学中随机抽取两名同学”的一切可能结果组成的基本事件有:(A,B)、(A,C)、(A,D)、(A,E)、(A,F)、(B,C)、(B,D)、(B,E)、(B,F)、(C,D)、(C,E)、(C,F)、(D,E)、(D,F)、(E,F)一共15个.“抽到至少有一个86分的同学”所组成的基本事件有:(A,B)、(A,C)、(A,D)、(A,E)、(A,F)、(B,C)、(B,D)、(B,E)、(B,F)共9个,故93155P ==. (3)2240(3101017) 5.584 5.024********K ⨯⨯-⨯=≈>⨯⨯⨯,因此在犯错误的概率不超过0.025的前提下可以认为成绩优秀与教学方式有关. 数学视野在实际问题中,经常会面临需要推断的问题,比说研制出一种新药,需要推断此药是否有效;有人怀疑吸烟的人更易患肺癌,需要推断患肺癌是否与吸烟有关;等等.在对类似问题作出推断时,我们不能仅凭主观意愿得出结论,需要通过试验来手机数据,并依据独立性检验的原理作出合理的推断.。
2014年人教A版选修1-2课件 1.2 独立性检验的基本思想及其初步应用
问题1. 下表是对吸烟和不吸烟的人中患肺癌的调 查数据, 你能从中分析吸烟对患肺癌的影响程度吗?
不吸烟 吸烟 总计 不患肺癌 7775 2099 9874 患肺癌 42 49 91 总计 7817 2148 9965
对于某种变量取不同的 “值” 表示不同的类别, 这样的变量称为分类变量. 如: 是否吸烟, 是否信仰宗教, 男性或女性等. 如上表这样, 列出两个分类变量的频数表, 称为 列联表.
不患肺癌 患肺癌 总计 不吸烟 a b a+ b 即 |ad -bc| 越小, 吸烟与患肺癌之间的关系越弱 ; 吸烟 c d c+d 反之越强.总计 a+ c b+ d a+b+c+d
为了使不同容量的数据有统一的评判标准, 我们 我们把列联表中的数字用字母代替, 并计算: 把检查 |ad-bc| 的大小转换成检查 a ; “不吸烟” 样本中 “不患肺癌” 的比例 : n(ad - bc)2 a+ b 2 K , (a + b)(c + d )(a的比例 + c)(b +c “吸烟” 样本中 “不患肺癌” :d ) . c+d 其中 na+b+c+d 为样本容量. 假设 H0: 吸烟与患肺癌没有关系 , 则需 2 若 H0 成立, a则 K c 应该很小. , ad-bc≈0. a + b c + d H0 成立与否呢? 小到什么程度来判断
0.4
0.2 0 不吸烟 吸烟
问题1. 下表是对吸烟和不吸烟的人中患肺癌的调 查数据, 你能从中分析吸烟对患肺癌的影响程度吗?
不吸烟 吸烟 总计 不患肺癌 7775 2099 9874
1
人教版数学选修1-21.2独立性检验的基本思想及其初步应用
d)
22
偏高 不偏高
合计
超重 不超重
4
1
3 12
7 13
合计 5 15 20
独立性检验临界值表:
P(K2≥k0) 0.025 0.010 0.005 0.001
k0
5.024 6.635 7.879 10.828
由独立性检验随机变量 K 2 值的计算公式得:
K
2
a
n ad bc2 bc da cb
9874
91
9965
像上表列出的两个分类变量的频数表,称为列联表
4
1.下面是一个2×2列联表:
y1
y2
x1
a 21
x2
2 25
总计 b 46
总计 73 27 100
则表中a、b的值分别为( C )
A.94、96
B.52、50
C.52、54
D.54、52
5
分类变量
为了调查吸烟是否对肺癌有影响,某肿瘤研究所随 机地调查了9965人,得到如下结果(单位:人)
1
1.2独立性检验的 基本思想及其初 步应用
2两种变量:
对于性别变量,其取值为男和女两种。这种变量的不同‘值’ ,表示个体所属的不同类别,像这样的变量称为分类变量 在日常生活中,我们常常关心分类变量之间是否有关系: 例如,吸烟是否与患肺癌有关系?
性别是否对于喜欢数学课程有影响?等等。
研究两个变量的相关关系:
2课0堂练习 1:通过随机询问 110 名性别不同的大学生是否爱好某项运动,得到
如下的列联表:
男
女
总计
爱好
40
20
60
不爱好
20
总计
人教A版 选修1-2 1.2 独立性检验的基本思想及初步应用 教案
[核心必知]1.预习教材,问题导入根据以下提纲,预习教材P 10~P 15的内容,回答下列问题. 阅读教材P 10“探究”的内容,思考: (1)是否吸烟、是否患肺癌是什么变量? 提示:分类变量.(2)吸烟与患肺癌之间的关系还是前面我们研究的线性相关关系吗? 提示:不是.(3)如何研究吸烟是否对患肺癌有影响? 提示:独立性检验. 2.归纳总结,核心必记 (1)分类变量变量的不同“值”表示个体所属的不同类别,像这样的变量称为分类变量. (2)列联表①定义:列出的两个分类变量的频数表称为列联表. ②2×2列联表一般地,假设有两个分类变量X 和Y ,它们的取值分别为{x 1,x 2}和{y 1,y 2},其样本频数列联表(称为2×2列联表)为(3)等高条形图①图形与表格相比,更能直观地反映出两个分类变量间是否相互影响,常用等高条形图展示列联表数据的频率特征.②通过直接计算或观察等高条形图发现a +b a 和c +d c相差很大,就判断两个分类变量之间有关系.(4)独立性检验(1)有人说:“在犯错误的概率不超过0.01的前提下认为吸烟和患肺癌有关,是指每100个吸烟者中就会有99个患肺癌的.”你认为这种观点正确吗?为什么?提示:观点不正确.犯错误的概率不超过0.01说明的是吸烟与患肺癌有关的程度,不是患肺癌的百分数.(2)应用独立性检验的基本思想对两个变量间的关系作出的推断一定是正确的吗? 提示:不一定.所有的推断只代表一种可能性,不代表具体情况. (3)下面是2×2列联表.则表中a ,b 提示:a =46-13=33,b =33+a =33+33=66.[课前反思](1)分类变量的定义是什么?(2)列联表的定义是什么?2×2列联表中的各个数据有什么意义?(3)什么是等高条形图,有什么作用?(4)独立性检验的内容是什么?讲一讲1.在对人们饮食习惯的一次调查中,共调查了124人,其中六十岁以上的70人,六十岁以下的54人.六十岁以上的人中有43人的饮食以蔬菜为主,另外27人则以肉类为主;六十岁以下的人中有21人饮食以蔬菜为主,另外33人则以肉类为主.请根据以上数据作出饮食习惯与年龄的列联表,并利用a +b a 与c +d c判断二者是否有关系.[尝试解答] 2×2列联表如下:年龄在六 十岁以上 年龄在六 十岁以下 总计 饮食以蔬菜为主 43 21 64 饮食以肉类为主27 33 60 总计7054124a +b a =6443=0.671 875.c +d c =6027=0.45.显然二者数据具有较为明显的差距,据此可以在某种程度上认为饮食习惯与年龄有关系.(1)作2×2列联表时,关键是对涉及的变量分清类别.计算时要准确无误.(2)利用2×2列联表分析两个分类变量间的关系时,首先要根据题中数据获得2×2列联表,然后根据频率特征,即将a +b a 与c +d c c +d d的值相比,直观地反映出两个分类变量间是否相互影响,但方法较粗劣.练一练1.假设有两个分类变量X 与Y ,它们的可能取值分别为{x 1,x 2}和{y 1,y 2},其2×2列联表为:y 1y 2x 1 1018 x 2m26则当m 取下面何值时,X 与Y A .8 B .9 C .14 D .19解析:选C 由10×26≈18m ,解得m ≈14.4,所以当m =14时,X 与Y 的关系最弱.讲一讲2.某学校对高三学生作了一项调查发现:在平时的模拟考试中,性格内向的学生426人中有332人在考前心情紧张,性格外向的学生594人中有213人在考前心情紧张,作出等高条形图,利用图形判断考前心情紧张与性格类型是否有关系.[尝试解答] 作列联表如下:性格内向 性格外向 总计 考前心情紧张 332 213 545 考前心情不紧张94 381 475 总计4265941 020图中阴影部分表示考前心情紧张与考前心情不紧张中性格内向的人数的比例,从图中可以看出考前心情紧张的样本中性格内向的人数占的比例比考前心情不紧张样本中性格内向的人数占的比例高,可以认为考前紧张与性格类型有关.利用等高条形图判断两个分类变量是否相关的步骤:练一练2.在调查的480名男人中有38人患色盲,520名女人中有6名患色盲,试利用图形来判断色盲与性别是否有关?解:根据题目给出的数据作出如下的列联表:色盲不色盲总计男38442480女6514520总计449561000从等高条形图来看,在男人中患色盲的比例要比在女人中患色盲的比例大得多,因此,我们认为患色盲与性别是有关系的.讲一讲3.研究人员选取170名青年男女大学生为样本,对他们进行一种心理测验.发现有60名女生对该心理测验中的最后一个题目的反应是:作肯定的有22名,否定的有38名;110名男生在相同的项目上作肯定的有22名,否定的有88名.问:性别与态度之间是否存在某种关系?用独立性检验的方法判断.(链接教材P 13-例1)附:P (K 2≥k 0)0.10 0.05 0.025 k 02.7063.8415.024[尝试解答]肯定 否定 总计 男生 22 88 110 女生 22 38 60 总计44126170根据2×2k =110×60×44×126170×(22×38-22×88≈5.622>5.024.所以在犯错误的概率不超过0.025的前提下,认为“性别与态度有关系”.根据题意列出2×2列联表,计算K 2的观测值,如果K 2的观测值很大,说明两个分类变量有关系的可能性很大;如果K 2的观测值比较小,则认为没有充分的证据显示两个分类变量有关系.练一练3.在一次天气恶劣的飞机航程中,调查了男女乘客在飞机上晕机的情况:男乘客晕机的有24人,不晕机的有31人;女乘客晕机的有8人,不晕机的有26人.请你根据所给数据判定:在天气恶劣的飞机航程中,男乘客是否比女乘客更容易晕机?附:P (K 2≥k 0)0.10 0.05 k 02.7063.848解:根据题意,列出 晕机 不晕机 总计由公式可得K 2的观测值k =(a +b n(ad -bc=55×34×32×5789(24×26-31×8≈3.689>2.706,故在犯错误的概率不超过0.10的前提下,认为“在天气恶劣的飞机航程中男乘客比女乘客更容易晕机”.——————————————[课堂归纳·感悟提升]——————————1.本节课的重点是用2×2列联表、等高条形图分析两个分类变量间的关系以及独立性检验.2.本节课要重点掌握的规律方法(1)用2×2列联表分析两分类变量间的关系,见讲1; (2)用等高条形图分析两分类变量间的关系,见讲2; (3)独立性检验,见讲3.3.解决一般的独立性检验问题的步骤:(1)通过列联表确定a ,b ,c ,d ,n 的值,根据实际问题需要的可信程度确定临界值k 0; (2)利用K 2=(a +b n(ad -bc 求出K 2的观测值k ;(3)如果k ≥k 0,就推断“两个分类变量有关系”,这种推断犯错误的概率不超过α,否则就认为在犯错误的概率不超过α的前提下不能推断“两个分类变量有关系”.其中第(2)步易算错K 2的值,是本节课的易错点.课下能力提升(二) [学业水平达标练]题组1 用2×2列联表分析两分类变量间的关系 1.分类变量X 和Y 的列联表如下:A .ad -bc 越小,说明X 与Y 关系越弱B .ad -bc 越大,说明X 与Y 关系越强C .(ad -bc )2越大,说明X 与Y 关系越强 D .(ad -bc )2越接近于0,说明X 与Y 关系越强解析:选C |ad -bc |越小,说明X 与Y 关系越弱,|ad -bc |越大,说明X 与Y 关系越强.2.假设有两个变量X 与Y ,它们的取值分别为x 1,x 2和y 1,y 2,其列联表为:( ) A .a =50,b =40,c =30,d =20 B .a =50,b =30,c =40,d =20 C .a =20,b =30,c =40,d =50 D .a =20,b =30,c =50,d =40解析:选D 当(ad -bc )2的值越大,随机变量K 2=(a +b n(ad -bc的值越大,可知X 与Y 有关系的可能性就越大.显然选项D 中,(ad -bc )2的值最大.3.某电视台在一次对收看文艺节目和新闻节目观众的抽样调查中,随机抽取了100名电视观众,相关的数据如下表所示:填“是”或“否”).解析:因为在20至40岁的58名观众中有18名观众收看新闻节目,而大于40岁的42名观众中有27名观众收看新闻节目,即a +b b =5818,c +d d =4227,两者相差较大,所以经直观分析,收看新闻节目的观众与年龄是有关的.答案:是题组2 用等高条形图分析两分类变量间的关系4.如图是调查某地区男女中学生喜欢理科的等高条形图,阴影部分表示喜欢理科的百分比,从图中可以看出( )A .性别与喜欢理科无关B .女生中喜欢理科的百分比为80%C .男生比女生喜欢理科的可能性大些D .男生不喜欢理科的比为60%解析:选C 从图中可以分析,男生喜欢理科的可能性比女生大一些. 5.观察下列各图,其中两个分类变量x ,y 之间关系最强的是( )解析:选D 在四幅图中,D 图中两个深色条的高相差最明显,说明两个分类变量之间关系最强.6.为了研究子女吸烟与父母吸烟的关系,调查了一千多名青少年及其家长,数据如下:解:等高条形图如图所示:由图形观察可以看出父母吸烟者中子女吸烟的比例要比父母不吸烟者中子女吸烟的比例高,因此可以在某种程度上认为“子女吸烟与父母吸烟有关系”.题组3 独立性检验7.在一项中学生近视情况的调查中,某校男生150名中有80名近视,女生140名中有70名近视,在检验这些中学生眼睛近视是否与性别有关时用什么方法最有说服力( ) A.平均数与方差 B.回归分析C.独立性检验 D.概率解析:选C 判断两个分类变量是否有关的最有效方法是进行独立性检验.8.对于分类变量X与Y的随机变量K2的观测值k,下列说法正确的是( )A.k越大,“X与Y有关系”的可信程度越小B.k越小,“X与Y有关系”的可信程度越小C.k越接近于0,“X与Y没有关系”的可信程度越小D.k越大,“X与Y没有关系”的可信程度越大解析:选B k越大,“X与Y没有关系”的可信程度越小,则“X与Y有关系”的可信程度越大,即k越小,“X与Y有关系”的可信程度越小.9.在吸烟与患肺病是否相关的判断中,有下面的说法:①若K2的观测值k>6.635,则在犯错误的概率不超过0.01的前提下,认为吸烟与患肺病有关系,那么在100个吸烟的人中必有99人患有肺病;②从独立性检验可知在犯错误的概率不超过0.01的前提下,认为吸烟与患肺病有关系时,若某人吸烟,则他有99%的可能患有肺病;③从独立性检验可知在犯错误的概率不超过0.05的前提下,认为吸烟与患肺病有关系时,是指有5%的可能性使得推断错误.其中说法正确的是________.解析:K2是检验吸烟与患肺病相关程度的量,是相关关系,而不是确定关系,是反映有关和无关的概率,故说法①不正确;说法②中对“确定容许推断犯错误概率的上界”理解错误;说法③正确.答案:③10.为了解决高二年级统计案例入门难的问题,某校在高一年级的数学教学中设有试验班,着重加强统计思想的渗透,下面是高二年级统计案例的测验成绩统计表(单位:分)的一部分,试分析试验效果.附:k =(a +b n(ad -bc=50×50×44×56100(32×38-18×12≈16.234. 因为16.234>6.635,所以,在犯错误的概率不超过0.01的前提下认为高二年级统计案例的测试成绩与高一年级数学教学中增加统计思想的渗透有联系.[能力提升综合练]1.利用独立性检验对两个分类变量是否有关系进行研究时,若有99.5%的把握认为事件A 和B 有关系,则具体计算出的数据应该是( )A .k ≥6.635B .k <6.635C .k ≥7.879D .k <7.879解析:选C 有99.5%的把握认为事件A 和B 有关系,即犯错误的概率为0.5%,对应的k 0的值为7.879,由独立性检验的思想可知应为k ≥7.879.2.通过随机询问110名性别不同的大学生是否爱好某项运动,得到如下的列联表:由K 2=(a +b n(ad -bc 算得,观测值k =60×50×60×50≈7.8. 附表:A .有99%以上的把握认为“爱好该项运动与性别有关”B .有99%以上的把握认为“爱好该项运动与性别无关”C .在犯错误的概率不超过0.1% 的前提下,认为“爱好该项运动与性别有关”D .在犯错误的概率不超过0.1% 的前提下,认为“爱好该项运动与性别无关” 解析:选A 由k ≈7.8及P (K 2≥6.635)=0.010可知,在犯错误的概率不超过1%的前提下认为“爱好该项运动与性别有关”,也就是有99%以上的把握认为“爱好该项运动与性别有关”.3.某人研究中学生的性别与成绩、视力、智商、阅读量这4个变量的关系,随机抽查了52名中学生,得到统计数据如表1至表4,则与性别有关联的可能性最大的变量是( )表1表3A .成绩B .视力C .智商D .阅读量解析:选D 因为K 12=16×36×32×2052×(6×22-14×10=16×36×32×2052×82,K 22=16×36×32×2052×(4×20-16×12=16×36×32×2052×1122,k 32=16×36×32×2052×(8×24-12×8=16×36×32×2052×962, K 42=16×36×32×2052×(14×30-6×2=16×36×32×2052×4082,则有K 42>K 22>K 32>K 12,所以阅读量与性别有关联的可能性最大. 4.下列关于K 2的说法中,正确的有________. ①K 2的值越大,两个分类变量的相关性越大; ②K 2的计算公式是K 2=(a +b n(ad -bc ;③若求出K 2=4>3.841,则有95%的把握认为两个分类变量有关系,即有5%的可能性使得“两个分类变量有关系”的推断出现错误;④独立性检验就是选取一个假设H 0条件下的小概率事件,若在一次试验中该事件发生了,这是与实际推断相抵触的“不合理”现象,则作出拒绝H 0的推断.解析:对于①,K 2的值越大,只能说明我们有更大的把握认为二者有关系,却不能判断相关性大小,故①错;对于②,(ad -bc )应为(ad -bc )2,故②错;③④对.答案:③④5.某班主任对全班50名学生作了一次调查,所得数据如表:)在犯错误的概率不超过0.01的前提下认为喜欢玩电脑游戏与认为作业多有关.解析:查表知若要在犯错误的概率不超过0.01的前提下认为喜欢玩电脑游戏与认为作业多有关,则临界值k 0=6.635,本题中,k ≈5.059<6.635,所以不能在犯错误的概率不超过0.01的前提下认为喜欢玩电脑游戏与认为作业多有关.答案:不能6.随着生活水平的提高,人们患肝病的越来越多,为了解中年人患肝病与经常饮酒是否有关,现对30名中年人进行了问卷调查得到如下列联表:已知在全部30人中随机抽取1人,抽到肝病患者的概率为15.(1)请将上面的列联表补充完整,并判断是否有99.5%的把握认为患肝病与常饮酒有关?说明你的理由;(2)现从常饮酒且患肝病的中年人(恰有2名女性)中,抽取2人参加电视节目,则正好抽到一男一女的概率是多少?参考数据:解:(1)设患肝病中常饮酒的人有x 人,30=15,x =6.由已知数据可求得K 2=10×20×8×22≈8.523>7.879,因此有99.5%的把握认为患肝病与常饮酒有关.(2)设常饮酒且患肝病的男性为A ,B ,C ,D ,女性为E ,F ,则任取两人有AB ,AC ,AD ,AE ,AF ,BC ,BD ,BE ,BF ,CD ,CE ,CF ,DE ,DF ,EF ,共15种.其中一男一女有AE ,AF ,BE ,BF ,CE ,CF ,DE ,DF ,共8种.故抽出一男一女的概率是P =158.7.某食品厂为了检查甲乙两条自动包装流水线的生产情况,随机在这两条流水线上各抽取40件产品作为样本称出它们的质量(单位:克),质量值落在(495,510]的产品为合格品,否则为不合格品.表1是甲流水线样本频数分布表,图1是乙流水线样本频率分布直方图.表1 甲流水线样本频数分布表(1)根据上表数据作出甲流水线样本频率分布直方图;(2)若以频率作为概率,试估计从两条流水线分别任取1件产品,该产品恰好是合格品的概率分别是多少;(3)由以上统计数据作出2×2列联表,并回答在犯错误的概率不超过多少的前提下认为“产品的包装质量与两条要自动包装流水线的选择有关”.解:(1)甲流水线样本频率分布直方图如下:(2)由表1知甲样本合格品数为8+14+8=30,由图1知乙样本中合格品数为(0.06+0.09+0.03)×5×40=36, 故甲样本合格品的频率为4030=0.75, 乙样本合格品的频率为4036=0.9, 据此可估计从甲流水线任取1件产品, 该产品恰好是合格品的概率为0.75. 从乙流水线任取1件产品, 该产品恰好是合格品的概率为0.9. (3)2×2列联表如下:因为K2的观测值k=(a+b=66×14×40×40≈3.117>2.706,所以在犯错误的概率不超过0.1的前提下认为产品的包装质量与两条自动包装流水线的选择有关.。
高中数学选修1-2第一章课后习题解答
新课程标准数学选修1—2第一章课后习题解答第一章统计案例1.1回归分析的基本思想及其初步应用练习(P8)1、画散点图的目的是通过变量的散点图判断两个变量更近似于什么样的函数关系,以确定是否直接用线性回归模型来拟合原始数据.说明:学生在对常用的函数图象比较了解的情况下,通过观察散点图可以判断两个变量的关系更近似于哪种函数.2、分析残差可以帮助我们解决以下两个问题:(1)寻找异常点,就是残差特别大的点,考察相应的样本数据是否有错.(2)分析残差图可以发现模型选择是否合适.说明:分析残差是回归诊断的一部分,可以帮助我们发现样本数据中的错误,分析模型选择是否合适,是否有其他变量需要加入到模型中,模型的假设是否正确等. 本题只要求学生能回答上面两点即可,主要让学生体会残差和残差图可以用于判断模型的拟合效果.3、(1)解释变量和预报变量的关系式线性函数关系.R=.(2)21说明:如果所有的样本点都在一条直线上,建立的线性回归模型一定是该直线,所以每个=+,没有随机误差项,是严样本点的残差均为0,残差平方和也为0,即此时的模型为y bx aR=.格的一次函数关系. 通过计算可得21习题1.1 (P9)1、(1)由表中数据制作的散点图如下:从散点图中可以看出GDP值与年份近似呈线性关系.y表示GDP值,t表示年份. 根据截距和斜率的最小二乘计算公式,得(2)用tˆ14292537.729a≈-,ˆ7191.969b≈从而得线性回归方程ˆ7191.96914292537.729=-.y t残差计算结果见下表.GDP 值与年份线性拟合残差表(年实际GDP 值为117251.9,所以预报与实际相差4275.540-.(4)上面建立的回归方程的20.974R =,说明年份能够解释约97%的GDP 值变化,因此所建立的模型能够很好地刻画GDP 和年份的关系.说明:关于2003年的GDP 值的来源,不同的渠道可能会有所不同.2、说明:本题的结果与具体的数据有关,所以答案不唯一.3、由表中数据得散点图如下:从散点图中可以看出,震级x 与大于或等于该震级的地震数N 之间不呈线性相关关系,随着x 的减少,所考察的地震数N 近似地以指数形式增长. 做变换lg y N =,得到的数据如下表所示.x 和y 的散点图如下:从这个散点图中可以看出x 和y 之间有很强的线性相关性,因此可以用线性回归模型拟合它们之间的关系. 根据截距和斜率的最小二乘计算公式,得ˆ 6.704a≈,ˆ0.741b ≈-, 故线性回归方程为 ˆ0.741 6.704y x =-+. 20.997R ≈,说明x 可以解释y 的99.7%的变化.因此,可以用回归方程 0.741 6.704ˆ10x N-+= 描述x 和N 之间的关系. 1.2独立性检验的基本思想及其初步应用练习(P15)列联表的条形图如图所示.由图及表直观判断,好像“成绩优秀与班级有关系”. 因为2K 的观测值0.653 6.635k ≈<,由教科书中表1-11克重,在犯错误的概率不超过0.01的前提下,不能认为“成绩与班级有关系”.说明:(1)教师应要求学生画出等高条形图后,从图形上判断两个分类变量之间是否有关系. 这里通过图形的直观感觉的结果可能会出错.(2)本题与例题不同,本题计算得到的2K 的观测值比较小,所以没有理由说明“成绩优秀与班级有关系”. 这与反证法也有类似的地方,在使用反证法证明结论时,假设结论不成立的条件下如果没有推出矛盾,并不能说明结论成立也不能说明结论不成立. 在独立性检验中,没有推出小概率事件发生类似于反证法中没有推出矛盾.习题1.2 (P16)1、假设“服药与患病之间没有关系”,则2K 的值应该比较小;如果2K 的值很大,则说明很可能“服药与患病之间没有关系”. 由列联表中数据可得2K 的观测值 6.110 5.024k ≈>,而由教科书表1-11,得2( 5.024)0.025P K ≥≈,所以在犯错误的概率不超过0.025的前提下可以认为“服药与患病之间有关系”. 又因为服药群体中患病的频率0.182小于没有服药群体中患病的频率0.400,所以“服药与患病之间关系”可以解释为药物对于疾病有预防作用. 因此在犯错误的概率不超过0.025的前提下,可以认为药物有效.说明:仿照例1,学生很容易完成此题,但希望学生能理解独立性检验在这里的具体含义,即“服药与患病之间关系”可以解释为“药物对于疾病有预防作用”.2、如果“性别与读营养说明之间没有关系”,由题目中所给数据计算,得2K 的观测值为8.416k ≈,而由教科书中表1-11知2(7.879)0.005P K ≥≈,所以在犯错误的概率不超过0.005的前提下认为“性别与读营养说明之间有关系”.3、说明:需要收集数据,所有没有统一答案. 第一步,要求学生收集并整理数据后得到列联表;第二步,类似上面的习题做出判断.4、说明:需要从媒体上收集数据,学生关心的问题不同,收集的数据会不同. 第一步,要求学生收集并整理数据后得到列联表;第二步,类似上面的习题做出判断.第一章 复习参考题A 组(P19)根据散点图,可以认为中国人口总数与年份呈现很强的线性相关关系,因此选用线性回归模型建立回归方程.由最小二乘法的计算公式,得 2095141.503a ≈-,1110.903b ≈,则线性回归方程为 ˆ1110.9032095141.503yx =-. 由2R 的计算公式,得 20.994R ≈,明线性回归模型对数据的拟合效果很好.根据回归方程,,预计2003年末中国人口总数约为129997万人,而实际情况为129227万人,预测误差为770万人;预计2004年末中国人口总数约为131108万人,而实际情况为129988万人,预测误差为1120万人.说明:数据来源为《中国统计年鉴》(2003). 由于人数为整数,所以预测的数据经过四舍五入的取整运算.2、(1)将销售总额作为横轴,利润作为纵轴,根据表中数据绘制散点图如下:由于散点图中的样本点基本上在一个带形区域内分布,猜想销售总额与利润之间呈现线性相关关系.(2)由最小二乘法的计算公式,得 ˆ1334.5a≈,ˆ0.026b ≈, 则线性回归方程为 ˆ0.0261334.5yx =+ 其残差值计算结果见下表:(3)对于(2)中所建立的线性回归方程,20.457R ≈,说明在线性回归模型中销售总额只能解释利润变化的46%,所以线性回归模型不能很好地刻画销售总额和利润之间的关系. 说明:此题也可以建立对数模型或二次回归模型等,只要计算和分析合理,就算正确.3、由所给数据计算得2K 的观测值为 3.689k ≈,而由教科书中表1-11知2( 2.706)0.10P K ≥=所以在犯错误的概率不超过0.10的前提下认为“婴儿的性别与出生的时间有关系”.第一章 复习参考题B 组(P19)1、因为 21(,)()ni i i Q a b y a bx ==--∑21(()())n i i i y bx y bx a y bx ==--+--+∑ 2211()()n n i i i i y bx y bx a y bx ===--++-+∑∑12()()ni i i y bx y bx a y bx =---+-+∑ 并且221()()n i a y bx n a y bx =-+=-+∑,12()()n i i i y bx y bx a y bx =--+-+∑ 1()(())ni i i a y bx y bx ny nbx ==-+--+∑ ()()0a y b x n y n b xn y n b x=-+--+= 所以 221(,)()()ni i i Q a b y bx y bx n a y bx ==--++-+∑.考察上面的等式,等号右边的求和号中不包含a ,而另外一项非负,所以ˆa和ˆb 必然使得等号右边的最后一项达到最小值,即 ˆˆ0ay bx -+=, 即ˆˆy a bx =+. 2、总偏差平方和21()n i i y y =-∑表示总的效应,即因变量的变化效应;残差平方和21ˆ()ni i y y =-∑表示随机误差的效应,即随机误差的变化效应;回归平方和21ˆ()ni yy =-∑表示表示变量的效应,即自变量的变化效应. 等式 222111ˆˆ()()()n n n i ii i i y y y y y y ===-=-+-∑∑∑ 表示因变量的变化总效应等于随机误差的变化效应与自变量的变化效应之和.3、说明:该题主要是考察学生应用回归分析模型解决实际问题的能力,解答应该包括如何获取数据,如何根据散点图寻找合适的模型去拟合数据,以及所得结果的解释三方面的内容.。
高中数学《1.2 独立性检验的基本思想及其初步应用》导学案2 新人教A版选修1-2
独立性检验的基本思想及其初步应用通过探究“秃顶是否与患心脏病有关系”引出独立性检验的问题,并借助样本数据的列联表、柱形图和条形图展示患心脏病的秃顶比例比患其它病的秃顶比例高,让学生亲身体验独立性1416 复习1:统计量2K :复习2:独立性检验的必要性:二、新课导学 ※ 学习探究新知1:独立性检验的基本思想: 1、 独立性检验的必要性:探究任务:吸烟与患肺癌的关系第一步:提出假设检验问题 H 0:第二步:根据公式求2K 观测值k =(它越小,原假设“H 0:吸烟与患肺癌没有关系”成立的可能性越 ;它越大,备择假设“H 1: ” 成立的可能性越大.)第三步:查表得出结论※典型例题例1 在某医院,因为患心脏病而住院的665名男性病人中,有214人秃顶;而另外772名不是因为患心脏病而住院的男性病人中有175名秃顶. 分别利用图形和独立性检验方法判断秃顶与患心脏病是否有关系?你所得的结论在什么范围内有效?小结:用独立性检验的思想解决问题:第一步:第二步:第三步:例2为考察高中生的性别与是否喜欢数学课程之间的关系,在某城市的某校高中生中随机抽k . 在多大程度上可以认为高中生的性别与是否由表中数据计算得到K的观察值 4.513数学课程之间有关系?为什么?※动手试试练1. 某市为调查全市高中生学习状况是否对生理健康有影响,随机进行调查并得到如下的列联表:请问有多大把握认为“高中生学习状况Array与生理健康有关”?三、总结提升※学习小结1. 独立性检验的原理:2. 独立性检验的步骤:※知识拓展. Array※自我评价你完成本节导学案的情况为().A. 很好B. 较好C. 一般D. 较差※当堂检测(时量:5分钟满分:10分)计分:1. 在吸烟与患肺病这两个分类变量的计算中,下列说法正确的是()A. 若k=6.635,则有99%的把握认为吸烟与患肺病有关,那么100名吸烟者中,有99个患肺病.B. 从独立性检验可知,有99%的把握认为吸烟与患肺病有关时,可以说某人吸烟,那么他有99%的可能性患肺病.C. 若从统计量中求出有95%的把握认为吸烟与患肺病有关,是指有5%的可能性使推断出现错误.D. 以上三种说法都不对.2. 下面是一个22⨯列联表则表中a,b 的之分别是( )D. 54,52 3.某班主任对全班50名学生进行了作业量多少的调查,数据如下表:则认为喜欢玩游戏与认为作业量多少有关系的把握大约为( )A. 99%B. 95%C. 90%D.无充分依据4. 在独立性检验中,当统计量2K 满足时,我们有99%的把握认为这两个分类变量有关系. 5. 在22⨯列联表中,统计量2K = . 为考察某种药物预防疾病的效果,进行动物试验,得到如下列联表 能以97.5%的把握认为药物有效吗?为什么?。
人教A版高中数学选修1-2《独立性检验的基本思想及其初步应用》
课题:独立性检验的基本思想及其初步应用教材:人教A版·普通高中课程标准实验教科书·数学·选修1-2一、教学任务分析1. 在统计学中,独立性检验就是检验两个分类变量是否相关的一种统计方法. 高中数学研究的是两个分类变量各取2个值即2×2列联表的情况:2. 独立性检验与回归分析都可以判断两个变量的相关关系. 两者既有联系又有区别,回归分析适用于定量变量的问题,独立性检验适用于分类变量的问题.二、教学目标(1)能够用列联表、三维柱形图、二维条形图、等高条形图直观地判断两个分类变量是否相关.(2)了解独立性检验的基本思想,能够按照独立性检验的步骤去检验两个分类变量的关系.(3)通过独立性检验的学习,了解数学在统计与概率中的确定性思维特点,体会直观与抽象、感性与理性的联系.三、教学重点、难点教学重点:理解独立性检验的基本思想及实施步骤.教学难点:(1)了解独立性检验的基本思想.(2)了解随机变量卡方的含义.四、教学方法与手段采用“活动(课前)→问题→解决问题→总结”的教学方法,即:在教师的引导下,通过开放性问题的设置来启发学生思考,在思考中体会数学概念的形成过程中所蕴涵的数学思想和方法,加强学生能力的培养.利用计算器进行数据计算,通过Excel软件作图,通过制作的课件呈现更丰富的教学素材.五、课前准备(1)布置实习作业学完《§1.1回归分析的基本思想及其初步应用》后,让学生完成判断两个变量是否相关的题目,一类是可以用回归分析解决的(如问题一),另一类则不行(如问题二). 把这两类问题以实习作业的形式要求学生进行收集数据、整理分析数据、得出结论并进行估计与预测. 作业要求思路清晰、图文并茂、言之有理.(2)本节课前的实习作业问题一:课外学习时间与学习成绩的关系问题二:高中学生是否喜欢音乐与性别的关系六、教学流程(一)创设情景,问题引入(二)观察感知,启发引导(三)自主探究,体会思想(四)例题学习,变式巩固(五)知识应用,尝试练习(六)解决疑问,尝试小结(七)课后作业,自主学习板书设计八、教学反思1. 注重系统学习,课后作业为下一节课作铺垫.课前作业(即前面学习的作业)的中“问题二”与熟悉的问题有些类似,都是两个变量的相关关系,但却不能使用回归分析的方法来做. 尽管如此,学生还是能够利用比例、图形去解决问题,为新课学习提供了很好的铺垫. 本节课的作业,除了巩固所学知识,也要为下一节课作铺垫.2. 解决疑问,尝试小结在教学设计过程中,预留时间给学生提出自己的问题,尝试自己去小结,可让学生做到自主学习,进行课堂复习,有时还能克服学生在下课前的疲劳状态.给时间学生思考本节课还不懂的问题,可写在小纸上. 对于学生提出的问题,适当解决. 这样可方便进行教学反思,也为下一节课的设计提供一些材料.独立性检验的基本思想及其初步应用的教案说明教材:人教A版·普通高中课程标准实验教科书·数学·选修1-2针对所教班级的数学基础比较弱,本节课通过之前准备的两个实习作业,让学生在一定的感性认识的基础上,带着问题与好奇心,感受数学从感性认识上升到理性认识,共同经历从定性描述到定量描述的过程,从中认识数学解决问题的方法. 根据新课程的特点,本课以学生发展为本,遵循学生的认知规律,体现循序渐进、共同探究与启发式的教学原则,充分发挥学生的主体作用与教师在适当环节的引导作用.一、对教学目标和教学重难点的认识:根据数学学科的特点、学生身心发展的合理需要,本节课从认知、能力、情感等层面确定了相应的教学目标.想及随机变量卡方的含义二、教学方法的选择:采用“活动(课前)→问题→解决问题→总结”的教学方法,即:在教师的引导下,通过开放性问题的设置来启发学生思考,在思考中体会数学概念的形成过程中所蕴涵的数学思想和方法,加强学生能力的培养.三、教学手段的利用:采用多媒体技术,通过各种素材的呈现,提高学生学习兴趣、激活学生思维、加深理解.四、教学过程的说明:针对学生已有的体验以及学生的认知水平,把教学过程分为了七个环节:。
人教A版高中数学选修1-2课件:1.2独立性检验的基本思想及其初步应用 (共39张PPT)
梅青中学
高二备课组
1.2×2列联表
(1) 分 类 变 量 : 变 量 的 不 同 “ 值 ” 表 示 个 体 所 属 的
不同类别 ________,像这类变量称为分类变量.
(2)2×2列联表 假设有两个分类变量X和Y,它们的取值分别为{x1,x2}和 {y1,y2},其样本频数列联表(也称为2×2列联表)为 变 量 x1 x2 总 计 表. y1 a c a+c y2 b d b+d 总 计 a+b c+d a+b+c+d
像上表这样列出的两个分类变量的 __________ 频数表 称为列联
在列联表中,如果两个分类变量没有关系,则应满足ad-
bc≈0.因此|ad-bc|越小,说明两个分类变量之间关系越弱; |ad -bc|越大,说明两个分类变量之间关系越强.
2.独立性检验 为了使不同样本容量的数据有统一的评判标准,我们构造
独立性检验 【例2】 某大学餐饮中心为了解新生的饮食习惯,在全校
一年级学生中进行了抽样调查,调查结果如下表所示:
学 生 喜欢甜品 60 10 70 不喜欢甜品 20 10 30 合 计 80 20 100
南方学生 北方学生 合 计
根据表中数据,问是否有 95%的把握认为“南方学生和北 方学生在选用甜品的饮食习惯方面有差异”?
关系很大; 如果 K2 的值比较小,则说明二者之间关系不明 显.
2.某大型企业人力资源部为了研究企业员工工作态度和 对待企业改革态度的关系,经过调查得到如下列联表: 态 度 积极支持企业改革 不太支持企业改革 总计 32 63 95 工作一般 86 103 189 总 计 根据列联表,能否在犯错误的概率不超过 0.005 的前提下 认为工作态度与对待企业改革态度之间有关系?
高中数学人教版选修1-2同课异构教学课件:1.2 独立性检验的基本思想及其初步应用 探究导学课型
2.等高条形图与列联表相比有何优点? 提示:更直观,更明了. 3.利用等高条形图能否精确地判断两个分类变量是否有关系?为什么? 提示:不能,因为通过等高条形图,可以粗略地判断两个分类变量是否 有关系,但这种判断无法精确地给出所得结论的可靠程度.
【过关小练】 1.观察下列各图,其中两个分类变量x,y之间关系最强的是( )
结论.
【巩固训练】(2015·昆明高二检测)国家虽然出台了多次限购令,但各 地房地产市场依然热火朝天,主要是利益的驱使,有些开发商不遵守职 业道德,违规使用未经淡化海砂;为了研究使用淡化海砂与混凝土耐久 性是否达标有关,某大学实验室随机抽取了60个样本,得到了如下的 2×2列联表:
使用淡化海砂 使用未经 淡化海砂 总计
【巩固训练】为了了解铅中毒病人是否有尿棕色素增加现象,分别对 病人组和对照组的尿液做尿棕色素定性检查,结果如下表,问铅中毒病 人组和对照组的尿棕色素阳性数有无相关关系?
组别 铅中毒病人组
对照组 总计
阳性数 29 9 38
阴性数 7 28 35
总计 36 37 73
【解析】根据列联表作出等高条形图(如图).由图形可知,铅中毒病人 组与对照组相比较,尿棕色素为阳性差异明显,因此铅中毒病人与尿棕 色素为阳性存在相关关系.
1.2 独立性检验的基本思想及其初步应用
【阅读教材】 根据下面的知识结构图阅读教材,了解独立性检验的基本步骤及 基本思想.
【知识链接】 1.散点图 散点图可以形象地展示两个变量之间的关系,所以它的主要目的就是 直观了解两个变量之间的关系. 2.用样本估计总体的两种情况 (1)用样本的频率分布估计总体分布. (2)用样本的数字特征估计总体数字特征.
推出有利于H1成立的小概率事件不发生,接受 原假设
2014-2015学年高中数学(人教版选修1-2)课时训练第一章 1.2 独立性检验的基本思想及其初步应用
y
x x1 x2 总计
y1
a c a+c
y2
b d b+d
总计
a+b c+ d a+b+c+d
栏 目 链 接
在列联表中,如果两个分类变量没有关系,则应该满足ad -bc≈0.因此|ad-bc|越小,说明两个分量之间的关系越 弱;|ad-bc|越大,说明两个分类变量之间的关系越强.
栏 目 链 接
解析:P(K2>3.841)=0.05,判断出错的可能性为5%.
答案:5%
栏 目 链 接
1.重点 通过案例理解分类变量、列联表、独立性检验的含义; 利用列联表的独立性检验进行估计.
栏 目 链 接
2.难点 独立性检验的基本思想;随机变量K2的含义.
第一章
统计案例
1.2 独立性检验的基本思想及其初步应用
栏 目 链 接
1. 了解独立性检验 记住K2的计算公式. 用.
只要求 2×2 列联表
的基本思想,
2. 了解实际推断原理和假设检验的基本思想及其初步应 3. 通过实际问题培养学生的学习兴趣,激发学生学习的 积极性和主动性,增强社会实践能力,培养分析问题、解决 问题的能力.
②图形分析: 利用等高条形图来分析两分类变量之间是否具有相关关系,形象、直 观地反映两个分类变量之间的总体状态和差异大小, 进而推断它们之间是 否有关系. a.绘制等高条形图时,列联表的行对应的是高度,两行的数据不相等, 但对应的条形图的高度是相同的,两列的数据对应不同颜色.b.等高条形 图中有两个高度相同的矩形,每一个矩形中都有两种颜色,观察下方颜色 a c 区域的高度,如果两个高度相差比较明显(即 和 相差很大),就判 a+b c+d 断两个分类变量之间有关系.
选修1-2《独立性检验》课件
(2)分类变量的取值有时可用数字来表示,但这时 的数字除了分类以外没有其他的含义,如用“0” 表示“男”,用“1”表示“女”.
某医疗机构为了了解患肺癌与吸烟是否有 关,进行了一次抽样调查,共调查了9965 个成年人,其中吸烟者2148人,不吸烟者 7817人,调查结果是:吸烟的2148人中49 人患肺癌, ;不吸烟的7817人中42人患肺 癌.
由观测 数据计算 得到随机变量K 2的观测 值k.
(3)如果k≥k0 ,就以(1-P(K2≥k0)) ×100%的把握 认为“X与Y有关系”;否则就说样本观测数据 没有提供“X与Y有关系”的充分证据.
反证法原理与假设检验原理
反证法原理:
在一个已知假 设下,如果推 出一个矛盾, 就证明了这个 假设不成立。
问题3:能否用数量刻画出“有关”的程度?
独立性检验
通过数据和图表分析,得到 结论是:吸烟与患呼吸道疾 病有关
H0: 吸烟和患肺癌之间没有关系
结论的可靠 程度如何?
不吸烟 吸烟 总计
吸烟与呼吸道疾病列联表
不患肺癌
患肺癌
a
b
c
d
a+c
b+d
不吸烟的人中不患肺癌的比例: 吸烟的人中不患肺癌的比例:
a ab
假设检验原理:
在一个已知假设 下,如果一个与 该假设矛盾的小 概率事件发生, 就推断这个假设 不成立。
例题解析:
例1、在某医院,因为患心脏病而住院的665名男性病 人中,有214人秃顶,而另外772名不是因为患心脏病而住 院的男性病人中有175人秃顶.(1)利用图形判断秃顶与患 心脏病是否有关系;(2)能否在犯错误的概率不超过0.01 的前提下认为秃顶与患心脏病有关系?
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
临界值表:
P ( K k0 )
2
0.50 0.45 5
0.40 0.70 8
0.25 1.32 3
0.15 2.07 2
0.10 2.70 6
0.05 3.84 1
0.02 5 5.02 4
3、某班主任对全班50名学生作了一次调查得下表,由表中数据得到 K2的观测值 k ≈ 5.059,于是__________(能或不能)在犯错误的概率不超过0.01的前提下认为喜欢玩电脑游戏与认为作业多有关系。
2.某单位餐厅的固定餐椅经常有损坏,于是该单位领导决定在餐 厅墙壁上张贴文明标语,并对文明标语张贴前后餐椅的损坏情况作
0.02总计 0.01 5 55 0 5.02 4 6.63 45 5 0.00 5 7.87 9 0.001 10.82 8
100
假设“性别与是否做到光盘之间没有关系”
2 100 ( 45 15 30 10 ) 2 K 3.03 2.706 75 25 55 45
不患肺癌 不吸烟 吸烟 总计 7775 2099 9874 患肺癌 42 49 91 总计 7817 2148 9965
利用公式(1)计算得K2的观测值为:
9965 7775 49 42 2099 k 56.632 7817 2148 9874 91
2
在H0成立的情况下,统计学家估算出如下的概率:
a b c d a c b d
n ad bc
2
(1)
其中n a b c d 为样本容量
若H0成立,即“吸烟与患肺癌没有关系”,则 K 应 该很小。
2
接下来,我们就利用卡方统计量K2来判断探究中“吸 烟与患肺癌有关”的可靠程度。 例:现在,根据表1-7中的数据
男 女 总计 喜欢数学课程 37 35 72 不喜欢数学课程 85 143 228 总计 122 178 300
由表中数据计算K2的观测值k 4.513.在多大程度上可以认 为高中生的性别与是否喜欢数学课程之间有关系?为什么?
练习:1性别与喜欢数学课
男 女 总计
喜欢数学课程 37 35 72
不喜欢数学课程 85 143 228
吸烟者和不吸烟者患肺癌的可能性存在差异。
等高条形图
100% 80% 60% 40% 20% 0%
0.54%
2.28%
患病比例
不患肺癌 患肺癌
不患病比例
不吸烟
吸烟
上面我们通过分析数据和图形,得到的直观印象是“吸 烟和患肺癌有关”。这一直觉来自于观测数据,即样本。 问题是我们有多大的把握认为“吸烟和患肺癌有关” 我们假设 H0:吸烟与患肺癌没有关系
“光盘”与性别列联表 做不到光盘 做到光盘 45 15 75 总计 55 100
男 女 总计
例题解析:
例1 春节期间,“厉行节约,反对浪费”之风悄然吹开, 某市随机询问100名性别不同的居民是否能做到“光盘” 行动, (1)完成如下列联表。 (2)有多大的把握认为居民能否做到“光盘”与性 别有关系? (3)能否在犯错误的概率不超过0.010的前提下认为居 民能否做到“光盘”与性别有关系?
P K 6.635 0.010
2
即在H0成立的情况下,K2的值大于6.635的概率非常小, 近似于0.010。 现在的观测值56.632远大于6.635,即假设成立的概率 为0.010,是小概率事件,所以有理由断定H0不成立, 即认为“吸烟与患肺癌有关系”。但这种判断会犯错 误,犯错误的概率不会超过0.010 。即有99%的把握认 为“吸烟与患肺癌有关”。
“光盘”与性别列联表 男 女 总计 做不到光盘 做到光盘 45 10 30 15 75 25 总计 55 45 100
“光盘”与性别列联表 做不到光盘 做到光盘 0.40 0.25 0.15 0.10 0.05 P( K 2 k0 ) 0.50 45 10 男 0.45 0.70 1.32 2.07 2.70 3.84 k0 5女 8 3 30 2 6 15 1 75 25 总计
不患肺癌 不吸烟 吸烟 总计 7775 2099 9874 患肺癌 42 49 91 总计 7817 2148 9965
与表格相比, 等高条形图能 更直观地反映 出相关数据的 总体状况 列联表:两个 分类变量的频 数表 (四行四列)
那么吸烟是否对患肺癌有影响? 在不吸烟者中患肺癌的比例是 0.54% 在吸烟者中患肺癌的比例是 2.28% 因此,直观上得到结论:
总计 122 178 300
解:假设高中生的性别与是否喜欢数学课程之间 没关系. 由k 4.513>3.841
这就意味着“性别与是否喜欢数学课程之间有关系”这一结论 错误的可能性约为0.05,即有95%的把握认为“性别与是否喜 欢数学课程之间有关系”.
2.某单位餐厅的固定餐椅经常有损坏,于是该单位领导决定在餐
P( K 2.706) 0.10
2
有90%的把握认为居民能否做到“光盘”与性别 有关。
“光盘”与性别列联表 做不到光盘 做到光盘 0.40 0.25 0.15 0.10 0.05 P( K 2 k0 ) 0.50 45 10 男 0.45 0.70 1.32 2.07 2.70 3.84 k0 5女 8 3 30 2 6 15 1 75 25 总计
ab
cd
a c d c a b ad bc 0
结论:|ad-bc|越小,说明吸烟与患肺癌之间关系越弱; |ad-bc|越大,说明吸烟与患肺癌之间关系越强;
为了使不同样本容量的数据有统一的评判标准,基于 上述分析,我们构造一个随机变量(卡方统计量)
2
K
P( K 6.635) 0.01
2
5.059 6.635
练习4、在吸烟和患肺癌这两个分类变量的计算中, 下列说法正确的是 (C) A、若K2的观测值k=6.635,我们在犯错的概率不超 过0.010的前提下认为吸烟与患肺癌有关系,那么在 100个吸烟的人中必有99人患有肺病 B、从独立性检验可知有99%的把握认为吸烟与患肺 癌有关系时,我们说某人吸烟,那么他有99%的可能 患有肺病 C、若从统计量中求出有5%的可能性使得推断出现 错误,是指有95%的把握认为吸烟与患肺病有关系 D、以上三种说法都不正确 解析:因为统计结果只是说明事件发生的概率大 小,具体到一个个体不一定发生。
0.02总计 0.01 5 55 0 5.02 4 6.63 45 5 0.00 5 7.87 9 0.001 10.82 8
100
假设“性别与是否做到光盘之间没有关系”
2 100 ( 45 15 30 10 ) 2 K 3.03 6.635 75 25 55 45
了一个统计,具体数据如下: 损坏餐 椅数 39
29
文明标语张贴前 文明标语张贴后
未损坏餐 椅数 157
167
总计 196 196
总计
68
324
392
3、某班主任对全班 50 名学生作了 一次调查得下表,由表中数据得到 2 K 的观测值 k ≈ 5.059,于是 不能 ________( 能或不能)在犯错误的 概率不超过 0.01 的前提下认为喜 欢玩电脑游戏与认为作业多有关系。
日常生活中,我们常常关心两个分类变量之间是否 有关系,例如吸烟是否与患肺癌有关系?性别是否 对于喜欢数学课程有影响等等。
在统计学中,独立性检验是检验 两个分类变量是否有关系的一种 统计方法。
探究: 为调查吸烟是否对患肺癌有影响,某肿瘤研究所随机 地调查了9965人,得到如下结果(单位:人)
表1-7 吸烟与患肺癌列联表
0.01 0 6.63 5
0.00 5 7.87 9
0.001 10.82 8
k0Байду номын сангаас
(1)如果k 10.828, 就有99.9%的把握认为" X 与Y 有关系" (2)如果k 7.879, 就有99.5%的把握认为" X 与Y 有关系" (3)如果k 6.635, 就有99%的把握认为" X 与Y 有关系" (4)如果k 5.024, 就有97.5%的把握认为" X 与Y 有关系" (5)如果k 3.841, 就有95%的把握认为" X 与Y 有关系" (6)如果k 2.706, 就有90%的把握认为" X 与Y 有关系" (7)如果k 2.706, 就认为没有充分的证据显示 " X 与Y
看看能推出什么样的结论。
为了研究的一般性,在列联表1-7中中用字母代替数字: 不吸烟 吸烟 总计 不患肺癌 a c a+c 患肺癌 b d b+d 总计 a+b c+d a+b+c+d
不吸烟 吸烟 总计
不患肺癌 a c a+c
患肺癌 b d b+d
总计 a+b c+d a+b+c+d
如果”吸烟与患肺癌没有关系”,则在吸烟样本中不 患肺癌的比例应该与不吸烟样本中相应的比例差不多 , 即a c
有关系"
思考: 你能从上述探究过程中总结出判断两个分类变量有关 系的思路吗? 一般地, 假设有两个分类变量X 和Y , 它们的取值分别为
{x1 , x2 }和{ y1 , y2 }, 其样本频数列联表(称为2 2列联表)为 : y2 y1 总计 x1 a b a+b x2 c d c+d
总计 a+c b+d a+b+c+d