易学通·重难点一本过高二数学(人教版选修1-2):第一章 独立性检验
人教版 高中数学【选修 2-1】第一章独立性检验Word版
人教版高中数学精品资料重点列表:重点名称重要指数重点1 独立性检验★★★重点2 独立性检验与概率交汇综合问题. ★★★★重点详解:重点1:独立性检验【要点解读】1.独立性检验的两个关键,一是是正确列出2×2列联表,二是准确理解并计算出2K的值.2.弄清判断两变量有关的把握性与犯错误概率的关系,根据题目要求作出正确的回答.3.独立性检验中统计量K2的观测值k的计算公式较为复杂,在解题中应明确数据的意义,代入公式准确计算.准确计算2k的值是正确判断的前提.【考向】独立性检验【例题】【2016辽宁省沈阳质量监测一】为考查某种疫苗预防疾病的效果,进行动物实验,得到统计数据如下:现从所有试验动物中任取一只,取到“注射疫苗”动物的概率为25.(Ⅰ)求22⨯列联表中的数据x,y,A,B的值;(Ⅱ)能够有多大把握认为疫苗有效?附:22()()()()()n ad bca b a c c d b dχ-=++++未发病发病合计未注射疫苗20 x A注射疫苗30 y B合计50 50 100【答案】(Ⅰ)10y =,40B =,40x =,60A =.(Ⅱ)至少有99.9%的把握认为疫苗有效.【名师点睛】1.独立性检验是对两个变量有关系的可信程度的判断,而不是对其是否有关系的判断.2.独立性检验得出的结论是带有概率性质的,只能说结论成立的概率有多大,而不能完全肯定一个结论,因此才出现了临界值表.在分析问题时一定要注意这点,不可对某个问题下确定性结论,否则就可能对统计计算的结果做出错误的解释.重点2:独立性检验与概率交汇综合问题 【要点解读】在近几年高考中统计案例与概率结合的解答题所占比例较往年有所增加,重点考查回归直线方程的求解和应用、独立性检验及概率的知识,注重考查考生对相关数据的统计、分析与应用的能力,此类试题一般为中档题.【考向】独立性检验与概率交汇综合问题【例题】【2016吉林长春质量监测二】近年来我国电子商务行业迎来篷布发展的新机遇,2015年双11期间,某购物平台的销售业绩高达918亿人民币.与此同时,相关管理部门也推出了针对电商的商品和服务的评价体系.现从评价系统中选出200次成功的交易,并对其评价进行统计,对商品的好评率为35,对服务的好评率为34,其中对商品和服务都做出好评的交易为80次. (1)是否可以在犯错误概率不超过0.1%的前提下,认为商品好评与服务好评有关?(2)若针对商品的好评率,采用分层抽样的方式从这200次交易中取出5次交易,并从中选择两次交易进行客户回访,求只有一次好评的概率.2()0.150.100.050.0250.0100.0050.0012.072 2.7063.841 5.024 6.6357.87910.828P K k k≥(22()()()()()n ad bc K a b c d a c b d -=++++,其中n a b c d =+++)【答案】(1) 可以在犯错误概率不超过0.1%的前提下,认为商品好评与服务好评有关.(2) 35. 【解析】(1) 由题意可得关于商品和服务评价的22⨯列联表:22200(80104070)11.11110.8281505012080K ⨯⨯-⨯=≈>⨯⨯⨯,可以在犯错误概率不超过0.1%的前提下,认为商品好评与服务好评有关.【名师点睛】独立性检验与概率交汇综合问题解题模板:分析2×2列联表] → 利用2K 公式计算出2K 的值] → 对分类变量的相关性作出判断] → 求相应事件的概率] → 反思解题过程,注意规范化]【趁热打铁】1.下面是2×2列联表:则表中a ,b A .94,72 B .52,50 C .52,74D .74,522.有甲、乙两个班级进行数学考试,按照大于等于85分为优秀,85分以下非优秀统计成绩,得到如下所示的列联表:已知在全部105人中随机抽取1人,成绩优秀的概率为27,则下列说法正确的是________(填序号).①列联表中c 的值为30,b 的值为35; ②列联表中c 的值为15,b 的值为50;③根据列联表中的数据,若按95%的可靠性要求,能认为“成绩与班级有关系”; ④根据列联表中的数据,若按95%的可靠性要求,不能认为“成绩与班级有关系”. 3.医疗研究所为了检验某种血清预防感冒的作用,把500名使用血清的人与另外500名未用血清的人一年中的感冒记录作比较,提出假设H 0:“这种血清不能起到预防感冒的作用”,利用2×2列联表计算得K 2的观测值k ≈3.918,经查对临界值表知P (K 2≥3.841)≈0.05.对此,四名同学得出了以下的判断:p :在犯错误的概率不超过0.05的前提下认为“这种血清能起到预防感冒的作用”; q :若某人未使用该血清,那么他在一年中有95%的可能性得感冒; r :这种血清预防感冒的有效率为95%; s :这种血清预防感冒的有效率为5%.则下列结论中,真命题的序号是________.①()()()()p q p q p q r s p r q s ∧⌝⌝∧⌝∧⌝∧∨∨⌝∧⌝∨;②;③;④.4.【广东省深圳市2016届高三第二次调研考试】某市在对学生的综合素质评价中,将其测评结果分为“优秀、合格、不合格”三个等级,其中不小于80分为“优秀”,小于60分为“不合格”,其它为“合格”.(1)某校高一年级有男生500人,女生400人,为了解性别对该综合素质评价结果的影响,采用分层抽样的方法从高一学生中抽取了45名学生的综合素质评价结果,其各个等级的频数统计如下表:根据表中统计的数据填写下面22⨯列联表,并判断是否有90%的把握认为“综合素质评价测评结果为优秀与性别有关”?参考公式:()()()()()22n ad bcKa b c d a c b d-=++++,其中n a b c d=+++.临界值表:5.【河南省新乡市2017届高三上学期第一次调研】网络购物已经被大多数人接受,随着时间的推移,网络购物的人越来越多,然而也有部分人对网络购物的质量和信誉产生怀疑.对此,某新闻媒体进行了调查,在所有参与调查的人中,持“支持”和“不支持”态度的人数如下表所示:(1)在所有参与调查的人中,用分层抽样的方法抽取m个人,已知从持“支持”态度的人中抽取了9人,求m的值;(2)是否有99.9%的的把握认为支持网络购物与年龄有关?参考数据:()()()()()22n ad bcKa b c d a c b d-=++++,其中n a b c d=+++,6.随机抽取了选修课程的55名学生,得到数据如下表:(2)用分层抽样的方法从喜欢统计课程的学生中抽取6名学生做进一步调查,将这6名学生作为一个样本,从中任选2人,求恰有1个男生和1个女生的概率. 下面的临界值表供参考:(参考公式:()()()()()22n ad bc K a b c d a c b d -=++++,其中n a b c d =+++)7.某班主任对全班50名学生学习积极性和参加社团活动情况进行调查,统计数据见下表所示:动且学习积极性一般的学生的概率是多少?(2)运用独立性检验的思想方法分析:学生的学习积极性与参加社团活动情况是否有关系?并说明理由.(参考公式:()()()()()22n ad bc K a b c d a c b d -=++++,其中n a b c d =+++)8.【2016·深圳调研】某企业通过调查问卷(满分50分)的形式对本企业900名员工的工作满意度进行调查,并随机抽取了其中30名员工(16名女员工,14名男员工)的得分,如下表:(1)根据以上数据,估计该企业得分大于45分的员工人数;(2)现用计算器求得这30名员工的平均得分为40.5分,若规定大于平均得分为“满意”,否则为“不满意”,请完成下列表格:(3)根据上述表中数据,利用独立性检验的方法判断,能否在犯错误的概率不超过1%的前提下,认为该企业员工“性别”与“工作是否满意”有关?参考数据:9.30名六年级学生进行了问卷调查得到如下列联表.平均每天喝500 mL以上为常喝,体重超过50 kg为肥胖.已知在全部30人中随机抽取1人,抽到肥胖的学生的概率为15.(1)请将上面的列联表补充完整.(2)是否有99.5%的把握认为肥胖与常喝碳酸饮料有关?说明你的理由.(3)设常喝碳酸饮料且肥胖的学生中有2名女生,现从常喝碳酸饮料且肥胖的学生中抽取2人参加电视节目,则正好抽到一男一女的概率是多少?参考数据:(参考公式:()()()()()22n ad bcKa b c d a c b d-=++++,其中n a b c d=+++)10.某高校共有学生15 000人,其中男生10 500人,女生4 500人.为调查该校学生每周平均体育运动时间的情况,采用分层抽样的方法,收集了300位学生每周平均体育运动时间的样本数据(单位:小时).(1)应收集多少位女生的样本数据?(2)根据这300个样本数据,得到学生每周平均体育运动时间的频率分布直方图(如图所示),其中样本数据的分组区间为0,2],(2,4],(4,6],(6,8],(8,10],(10,12].估计该校学生每周平均体育运动时间超过4小时的概率;(3)在样本数据中,有60位女生的每周平均体育运动时间超过4小时,请完成每周平均体育运动时间与性别列联表,并判断是否有95%的把握认为“该校学生的每周平均体育运动时间与性别有关”.附:()()()()()22n ad bc K a b c d a c b d -=++++。
高中数学选修1-2(人教A版)第一章统计案例1.2知识点总结含同步练习及答案
为研究不同的给药方式(口服或注射)和药的效果(有效与无效)是否有关,进行了相应的抽样调查,调查结果 如表所示.根据所选择的
193
个病人的数据,能否作出药的效果与给药方式有关的结论? 有效 口服 注射 合计
58 64 122
无效
40 31 71
合计
98 95 193
解:提出假设
H 0 :药的效果与给药方式没有关系.
) 的前提下,认为"爱好该项运动与性别有关" 的前提下,认为"爱好该项运动与性别无关"
以上的把握认为"爱好该项运动与性别有关" 以上的把握认为"爱好该项运动与性别无关"
0.01 = 1% 1%
的机会错误,即有
99%
以上的把握认为“爱好这项运动与性别有
关”.同时,在犯错误的概率不超过
的前提下,认为“爱好该项运动与性别有关”.
答案: C 解析: 由题意
K 2 = 7.8 > 6.635 ,有 0.01 = 1% 的机会错误,即有 99% 以上的把握认为“爱好这项运 动与性别有关”.同时,在犯错误的概率不超过 1% 的前提下,认为“爱好该项运动与性别有关”;
高考不提分,赔付1万元,关注快乐学了解详情。
≈ 7.8
附表:
P (K 2 ⩾ k) k 0.050 3.841 0.010 6.635 0.001 10.828
参照附表,得到的正确结论是( A.在犯错误的概率不超过 B.在犯错误的概率不超过 C.有 D.有 解:C 由题意
K 2 = 7.8 > 6.635 ,有 99% 99% 0.1% 0.1%
答案: A
B.①③
C.②③
D.①②③
3. 分类变量 X 和 Y 的列联表如下:
则下列说法中正确的是 (
高中数学选修1-2第一章课后习题解答
新课程标准数学选修1—2第一章课后习题解答第一章统计案例1.1回归分析的基本思想及其初步应用练习(P8)1、画散点图的目的是通过变量的散点图判断两个变量更近似于什么样的函数关系,以确定是否直接用线性回归模型来拟合原始数据.说明:学生在对常用的函数图象比较了解的情况下,通过观察散点图可以判断两个变量的关系更近似于哪种函数.2、分析残差可以帮助我们解决以下两个问题:(1)寻找异常点,就是残差特别大的点,考察相应的样本数据是否有错.(2)分析残差图可以发现模型选择是否合适.说明:分析残差是回归诊断的一部分,可以帮助我们发现样本数据中的错误,分析模型选择是否合适,是否有其他变量需要加入到模型中,模型的假设是否正确等. 本题只要求学生能回答上面两点即可,主要让学生体会残差和残差图可以用于判断模型的拟合效果.3、(1)解释变量和预报变量的关系式线性函数关系.R=.(2)21说明:如果所有的样本点都在一条直线上,建立的线性回归模型一定是该直线,所以每个=+,没有随机误差项,是严样本点的残差均为0,残差平方和也为0,即此时的模型为y bx aR=.格的一次函数关系. 通过计算可得21习题1.1 (P9)1、(1)由表中数据制作的散点图如下:从散点图中可以看出GDP值与年份近似呈线性关系.y表示GDP值,t表示年份. 根据截距和斜率的最小二乘计算公式,得(2)用tˆ14292537.729a≈-,ˆ7191.969b≈从而得线性回归方程ˆ7191.96914292537.729=-.y t残差计算结果见下表.GDP 值与年份线性拟合残差表(年实际GDP 值为117251.9,所以预报与实际相差4275.540-.(4)上面建立的回归方程的20.974R =,说明年份能够解释约97%的GDP 值变化,因此所建立的模型能够很好地刻画GDP 和年份的关系.说明:关于2003年的GDP 值的来源,不同的渠道可能会有所不同.2、说明:本题的结果与具体的数据有关,所以答案不唯一.3、由表中数据得散点图如下:从散点图中可以看出,震级x 与大于或等于该震级的地震数N 之间不呈线性相关关系,随着x 的减少,所考察的地震数N 近似地以指数形式增长. 做变换lg y N =,得到的数据如下表所示.x 和y 的散点图如下:从这个散点图中可以看出x 和y 之间有很强的线性相关性,因此可以用线性回归模型拟合它们之间的关系. 根据截距和斜率的最小二乘计算公式,得ˆ 6.704a≈,ˆ0.741b ≈-, 故线性回归方程为 ˆ0.741 6.704y x =-+. 20.997R ≈,说明x 可以解释y 的99.7%的变化.因此,可以用回归方程 0.741 6.704ˆ10x N-+= 描述x 和N 之间的关系. 1.2独立性检验的基本思想及其初步应用练习(P15)列联表的条形图如图所示.由图及表直观判断,好像“成绩优秀与班级有关系”. 因为2K 的观测值0.653 6.635k ≈<,由教科书中表1-11克重,在犯错误的概率不超过0.01的前提下,不能认为“成绩与班级有关系”.说明:(1)教师应要求学生画出等高条形图后,从图形上判断两个分类变量之间是否有关系. 这里通过图形的直观感觉的结果可能会出错.(2)本题与例题不同,本题计算得到的2K 的观测值比较小,所以没有理由说明“成绩优秀与班级有关系”. 这与反证法也有类似的地方,在使用反证法证明结论时,假设结论不成立的条件下如果没有推出矛盾,并不能说明结论成立也不能说明结论不成立. 在独立性检验中,没有推出小概率事件发生类似于反证法中没有推出矛盾.习题1.2 (P16)1、假设“服药与患病之间没有关系”,则2K 的值应该比较小;如果2K 的值很大,则说明很可能“服药与患病之间没有关系”. 由列联表中数据可得2K 的观测值 6.110 5.024k ≈>,而由教科书表1-11,得2( 5.024)0.025P K ≥≈,所以在犯错误的概率不超过0.025的前提下可以认为“服药与患病之间有关系”. 又因为服药群体中患病的频率0.182小于没有服药群体中患病的频率0.400,所以“服药与患病之间关系”可以解释为药物对于疾病有预防作用. 因此在犯错误的概率不超过0.025的前提下,可以认为药物有效.说明:仿照例1,学生很容易完成此题,但希望学生能理解独立性检验在这里的具体含义,即“服药与患病之间关系”可以解释为“药物对于疾病有预防作用”.2、如果“性别与读营养说明之间没有关系”,由题目中所给数据计算,得2K 的观测值为8.416k ≈,而由教科书中表1-11知2(7.879)0.005P K ≥≈,所以在犯错误的概率不超过0.005的前提下认为“性别与读营养说明之间有关系”.3、说明:需要收集数据,所有没有统一答案. 第一步,要求学生收集并整理数据后得到列联表;第二步,类似上面的习题做出判断.4、说明:需要从媒体上收集数据,学生关心的问题不同,收集的数据会不同. 第一步,要求学生收集并整理数据后得到列联表;第二步,类似上面的习题做出判断.第一章 复习参考题A 组(P19)根据散点图,可以认为中国人口总数与年份呈现很强的线性相关关系,因此选用线性回归模型建立回归方程.由最小二乘法的计算公式,得 2095141.503a ≈-,1110.903b ≈,则线性回归方程为 ˆ1110.9032095141.503yx =-. 由2R 的计算公式,得 20.994R ≈,明线性回归模型对数据的拟合效果很好.根据回归方程,,预计2003年末中国人口总数约为129997万人,而实际情况为129227万人,预测误差为770万人;预计2004年末中国人口总数约为131108万人,而实际情况为129988万人,预测误差为1120万人.说明:数据来源为《中国统计年鉴》(2003). 由于人数为整数,所以预测的数据经过四舍五入的取整运算.2、(1)将销售总额作为横轴,利润作为纵轴,根据表中数据绘制散点图如下:由于散点图中的样本点基本上在一个带形区域内分布,猜想销售总额与利润之间呈现线性相关关系.(2)由最小二乘法的计算公式,得 ˆ1334.5a≈,ˆ0.026b ≈, 则线性回归方程为 ˆ0.0261334.5yx =+ 其残差值计算结果见下表:(3)对于(2)中所建立的线性回归方程,20.457R ≈,说明在线性回归模型中销售总额只能解释利润变化的46%,所以线性回归模型不能很好地刻画销售总额和利润之间的关系. 说明:此题也可以建立对数模型或二次回归模型等,只要计算和分析合理,就算正确.3、由所给数据计算得2K 的观测值为 3.689k ≈,而由教科书中表1-11知2( 2.706)0.10P K ≥=所以在犯错误的概率不超过0.10的前提下认为“婴儿的性别与出生的时间有关系”.第一章 复习参考题B 组(P19)1、因为 21(,)()ni i i Q a b y a bx ==--∑21(()())n i i i y bx y bx a y bx ==--+--+∑ 2211()()n n i i i i y bx y bx a y bx ===--++-+∑∑12()()ni i i y bx y bx a y bx =---+-+∑ 并且221()()n i a y bx n a y bx =-+=-+∑,12()()n i i i y bx y bx a y bx =--+-+∑ 1()(())ni i i a y bx y bx ny nbx ==-+--+∑ ()()0a y b x n y n b xn y n b x=-+--+= 所以 221(,)()()ni i i Q a b y bx y bx n a y bx ==--++-+∑.考察上面的等式,等号右边的求和号中不包含a ,而另外一项非负,所以ˆa和ˆb 必然使得等号右边的最后一项达到最小值,即 ˆˆ0ay bx -+=, 即ˆˆy a bx =+. 2、总偏差平方和21()n i i y y =-∑表示总的效应,即因变量的变化效应;残差平方和21ˆ()ni i y y =-∑表示随机误差的效应,即随机误差的变化效应;回归平方和21ˆ()ni yy =-∑表示表示变量的效应,即自变量的变化效应. 等式 222111ˆˆ()()()n n n i ii i i y y y y y y ===-=-+-∑∑∑ 表示因变量的变化总效应等于随机误差的变化效应与自变量的变化效应之和.3、说明:该题主要是考察学生应用回归分析模型解决实际问题的能力,解答应该包括如何获取数据,如何根据散点图寻找合适的模型去拟合数据,以及所得结果的解释三方面的内容.。
人教版高中数学选修1-2知识点汇总
人教版高中数学选修1-2知识点第一章统计案例1.线性回归方程①变量之间的两类关系:函数关系与相关关系;②制作散点图,判断线性相关关系;③线性回归方程:a bx y +=∧(最小二乘法)。
其中,1221ni i i nii x y nx y b x nx a y bx==⎧-⎪⎪=⎪⎨-⎪⎪=-⎪⎩∑∑注意:线性回归直线经过定点),(y x .2.相关系数(判定两个变量线性相关性):∑∑∑===----=ni ni iini i iy yx xy y x xr 11221)()()((注意:(1)r >0时,变量y x ,正相关;r <0时,变量y x ,负相关;(2)①||r 越接近于1,两个变量的线性相关性越强;②||r 接近于0时,两个变量之间几乎不存在线性相关关系。
3.条件概率对于任何两个事件A 和B ,在已知B 发生的条件下,A 发生的概率称为B 发生时A 发生的条件概率.记为P (A |B ),其公式为P (A |B )=P (AB )P (A )4.相互独立事件(1)一般地,对于两个事件A ,B ,如果P (AB )=P (A )P (B ),则称A 、B 相互独立.(2)如果A 1,A 2,…,A n 相互独立,则有P (A 1A 2…A n )=P (A 1)P (A 2)…P (A n ).(3)如果A ,B 相互独立,则A 与B -,A -与B ,A -与B -也相互独立.5.独立性检验(分类变量关系):(1)2×2列联表设,A B 为两个变量,每一个变量都可以取两个值,变量121:,;A A A A =变量121:,;B B B B =通过观察得到下表所示数据:并将形如此表的表格称为2×2列联表(2)独立性检验根据2×2列联表中的数据判断两个变量A ,B 是否独立的问题叫2×2列联表的独立性检验。
(3)统计量χ2的计算公式:χ2=n (ad -bc )2(a +b )(c +d )(a +c )(b +d )第二章推理与证明1.推理(1)合情推理:归纳推理和类比推理都是根据已有事实,经过观察、分析、比较、联想,在进行归纳、类比,然后提出猜想的推理,我们把它们称为合情推理。
人教版高中数学选修1-2第一章第2节《独立性检验的基本思想及其初步应用》(共18张PPT)教育课件
作时间(单位:min)绘制了如图所示的茎叶图:
总计
第一种生产方式 15
5
20
第二种生产方式
5
15
20
总计
20
20
40
0.050 0.010 0.001 3.841 6.635 10.828
讲练结合
练习:某校在高一年级学生中,对自然科学类、社会科学类校本选修课程的选课意向进行调 查.现从高一年级学生中随机抽取 180 名学生,其中男生 105 名;在这 180 名学生中选择社 会科学类的男生、女生均为 45 名. (1)试问:从高一年级学生中随机抽取 1 人,抽到男生的概率约为多少? (2)根据抽取的 180 名学生的调查结果,完成下面的 2×2 列联表.并判断能否在犯错误的概 率不超过 0.025 的前提下认为科类的选择与性别有关?
条形图
柱形图
列联表
分类变量间的关系
独立性检验
2.条形图、柱形图、列联表:生活中,常常关心两个分类变量之间是否有关系.
抽样调查
样本
直观形象 易于观察
可靠?
列联表:列出两个分类变量的频数表称为列联表.
由于列联表中的数据是样本数据,它只是总体的代表,具有随机性.因此,需要用列 联表检验的方法提供所得结论犯错误概率的信息.
心
安
;
书
一
笔
清
远
,
盈
一
抹
恬
淡
,
浮
华
三
千
,
只
做
自
己
;
人
间
有
情
,
心
中
有
爱
,
携
一
米
人教版高中数学 选修1-2 第一章 2独立性检验的基本思想及其初步应用 (共38张PPT)教育课件
因此,
|ad-bc|越小,说明吸烟与患肺癌之间关系越弱; |ad-bc|越大,说明吸烟与患肺癌之间关系越强.
为了使不同样本容量的数据有统一的评判 标准,基于上述分析,我们构造一个随机变量:
K2 =
n(ad - bc)n
(a + b)(c + d)(a + c)(b + d)
其中n=a+b+c+d为样本容量.
P(k2>k) 0.50 0.40 0.25 0.15 0.10 0.05 0.025 0.010 0.005 0.001 k 0.455 0.708 1.323 2.072 2.706 3.84 5.024 6.635 7.879 10.83
(2)利用K2公式,计算随机变量K2的观测值k.
(3)如果k>k0,就推断“X与Y有关系”,这 种推断犯错误的概率不超过a;否则,就认为在犯 错误的概率不超过a的前提下不能推断“X与Y有关 系”.
若H0成立,即“吸烟与患肺癌没有关系”, 则K2应该很小.
不吸烟 吸烟 总计
不患肺癌 7775 2099 9874
患肺癌 42 49 91
总计 7817 2148 9965
利用上述公式得
K2 = 9965(7775 49 - 42 2099)2 56.632 7817 2148 9874 91
不吸烟
吸烟
患肺癌 不患肺癌
探究
通过数据和图形分析,我们得到的直观判 断是“吸烟和患肺癌有关”,那么这种判断是否 可靠呢? 我们先假设
H0:吸烟与患肺癌没有关系. 用A表示不吸烟,B表示不患肺癌,则“吸烟 与患肺癌没有关系”等价于“吸烟与患肺癌独 立”,即假设H0等价于
2020-2021学年高二下学期数学人教B版选修1-2第一章1.1独立性检验 说课稿
1.1独立性检验教学设计说课稿一.教学内容解析:(1)“独立性检验”是人教B版高中数学选修1-2中第一章第一节的内容,是对必修3概率统计知识的进一步提升和应用.独立性检验作为统计推断的重要内容之一,能培养学生的统计思维、统计态度、批评性精神等,具有丰富的教学价值.了解独立性检验思想能够帮助学生形成合理的统计推断观,同时也为回归分析做了准备.独立性检验是考察两个变量是否独立的统计学方法,具体做法是:首先对两个变量的关系作假设,然后选取合适的统计量,并根据实测样本计算出该统计量的观测值,最后根据预先设定的显著性水平进行检验,做出接受或拒绝原假设的判断,其本质就是运用假设检验原理的一种特例.在现有的有关独立性检验(大学)教材看,都是先介绍假设检验知识,然后介绍独立性检验,即通过假设检验的原理来理解独立性检验的思想.(2)教学重点:通过典型案例的探究体会独立性检验的思想方法.二.教学目标设置:高中课程标准中,要求通过对典型案例的探究,了解独立性检验的基本思想、方法及初步应用,课时安排为三课时.在高考中基本以考察操作规则,套用卡方公式进行计算为主,根据以往经验,应用公式对于学生来说较为简单,所以作为本节课的第一课时教学目标设置如下:(1)知识与技能:了解两个事件相互独立的含义,通过对典型案例的探究,理清问题 1.不同的样本,数据不同,比例不同,数据所体现的差异性不同,怎样针对不同样本数据设置统一的评判标准?2.针对不同的样本数据,可能做出不同的判断,那么你有多大的把握认为自己的判断是正确的?从而了解独立性检验的基本思想方法和简单应用,进一步体会运用统计方法解决实际问题的基本思想.(2)过程与方法:通过生活中实例的探索、研究、比较归纳等,了解知识的发生发展过程,进一步提高学生对统计思想的认识.(3)情感态度与价值观:通过体验独立性检验思想的过程,体会统计知识在生活中的作用,激发学生的学习兴趣.通过卡方统计量的构造过程培养学生严谨的思维和态度.三.学生学情分析:(1)学生通过必修三的学习能够了解到事件的概率可以用相应的频率来估计,了解到统计中用部分数据来推测全体数据性质的思想.但是对于事件的独立的含义不了解,反证法也没有学习;根据以往对学生的了解,运用公式判断两个分类变量的相关性不是难点,但是独立性检验的思想及原理,为什么要构造卡方统计量,为什么要这样构造卡方统计量,以及卡方统计量的概率统计含义等都是学生的疑问点,考虑到文科学生的知识储备及课标的要求,本节课尽量用生活中的实际例子去引导学生,让学生感受到卡方统计量构造的必要性及独立性检验思想的重要性。
2020届高中数学分册同步讲义(选修1-2) 第1章 1.2 独立性检验的基本思想及其初步应用
§1.2独立性检验的基本思想及其初步应用学习目标1.了解独立性检验的基本思想、方法及其简单应用.2.理解判断两个分类变量是否有关系的常用方法、独立性检验中K2的含义及其实施步骤.知识点一两个分类变量之间关联关系的定性分析1.分类变量变量的不同“值”表示个体所属的不同类别,像这样的变量称为分类变量.这里的“变量”和“值”都应作为“广义”的变量和值进行理解,它们取的不一定是具体的数值.2.列联表列出的两个分类变量的频数表,称为列联表.假设两个分类变量X和Y,它们的可能取值分别为{x1,x2}和{y1,y2},其样本频数列联表(也称为2×2列联表)为:3.两个分类变量之间关联关系的定性分析的方法(1)频率分析法:通过对样本的每个分类变量的不同类别事件发生的频率大小进行比较来分析分类变量之间是否有关联关系.通常通过列联表列出两个分类变量的频数表来进行分析.(2)图形分析法:与表格相比,图形更能直观地反映出两个分类变量间是否互相影响,常用等高条形图展示列联表数据的频率特征.知识点二独立性检验1.定义:利用随机变量K2来判断“两个分类变量有关系”的方法称为独立性检验.2.K2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d),其中n=a+b+c+d.3.独立性检验的具体做法(1)根据实际问题的需要确定容许推断“两个分类变量有关系”犯错误概率的上界α,然后查表确定临界值k0.(2)利用公式计算随机变量K2的观测值k.(3)如果k≥k0,就推断“X与Y有关系”,这种推断犯错误的概率不超过α,否则就认为在犯错误的概率不超过α的前提下不能推断“X与Y有关系”,或者在样本数据中没有发现足够证据支持结论“X与Y有关系”.1.分类变量中的变量与函数的变量是同一概念.(×)2.列联表频率分析法、等高条形图可初步分析两分类变量是否有关系,而独立性检验中K2取值则可通过统计表从数据上说明两分类变量的相关性的大小.(×)3.独立性检验的方法就是反证法.(×)4.事件A与B的独立性检验无关,即两个事件互不影响.(×)5.K2的大小是判断事件A与B是否相关的统计量.(√)一、等高条形图的应用例1为了解铅中毒病人与尿棕色素为阳性是否有关系,分别对病人组和对照组的尿液作尿棕色素定性检查,结果如下:试画出列联表的等高条形图,分析铅中毒病人和对照组的尿棕色素阳性数有无差别,铅中毒病人与尿棕色素为阳性是否有关系?考点定性分析的两类方法题点利用图形定性分析解等高条形图如图所示:其中两个浅色条的高分别代表铅中毒病人和对照组样本中尿棕色素为阳性的频率.由图可以直观地看出铅中毒病人与对照组相比,尿棕色素为阳性的频率差异明显,因此铅中毒病人与尿棕色素为阳性有关系.反思感悟在等高条形图中,可以估计满足条件X=x1的个体中具有Y=y1的个体所占的比例aa+b,也可以估计满足条件X=x2的个体中具有Y=y1的个体所占的比例cc+d.两个比例的值相差越大,X与Y有关系成立的可能性就越大.跟踪训练1网络对现代人的生活影响较大,尤其是对青少年,为了解网络对中学生学习成绩的影响,某地区教育主管部门从辖区初中生中随机抽取了1 000人调查,发现其中经常上网的有200人,这200人中有80人期末考试不及格,而另外800人中有120人不及格.利用图形判断学生经常上网与学习成绩有关吗?解根据题目所给的数据得到如下2×2列联表:得出等高条形图如图所示:比较图中阴影部分高可以发现经常上网不及格的频率明显高于经常上网及格的频率,因此可以认为经常上网与学习成绩有关.二、由K2进行独立性检验例2某校对学生课外活动进行调查,结果整理成下表:用你所学过的知识进行分析,能否在犯错误的概率不超过0.005的前提下,认为“喜欢体育还是文娱与性别有关系”?解判断方法如下:假设H0“喜欢体育还是文娱与性别没有关系”,若H0成立,则K2应该很小.∵a=21,b=23,c=6,d=29,n=79,∴K2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d)=79×(21×29-23×6)244×35×27×52≈8.106.且P(K2≥7.879)≈0.005,即我们得到的K2的观测值k≈8.106超过7.879,这就意味着:“喜欢体育还是文娱与性别没有关系”这一结论成立的可能性小于0.005,即在犯错误的概率不超过0.005的前提下认为“喜欢体育还是喜欢文娱与性别有关”.反思与感悟 (1)独立性检验的关注点在2×2列联表中,如果两个分类变量没有关系,则应满足ad -bc ≈0,因此|ad -bc |越小,关系越弱;|ad -bc |越大,关系越强. (2)独立性检验的具体做法①根据实际问题的需要确定允许推断“两个分类变量有关系”犯错误的概率的上界α,然后查表确定临界值k 0. ②利用公式K 2=n (ad -bc )2(a +b )(c +d )(a +c )(b +d )计算随机变量K 2的观测值k .③如果k ≥k 0,推断“X 与Y 有关系”这种推断犯错误的概率不超过α;否则,就认为在犯错误的概率不超过α的前提下不能推断“X 与Y 有关系”,或者在样本数据中没有发现足够的证据支持结论“X 与Y 有关系”.跟踪训练2 某省进行高中新课程改革已经四年了,为了解教师对新课程教学模式的使用情况,某一教育机构对某学校的教师关于新课程教学模式的使用情况进行了问卷调查,共调查了50人,其中有老教师20人,青年教师30人.老教师对新课程教学模式赞同的有10人,不赞同的有10人;青年教师对新课程教学模式赞同的有24人,不赞同的有6人. (1)根据以上数据建立一个2×2列联表;(2)判断是否有99%的把握说明对新课程教学模式的赞同情况与教师年龄有关系. 解 (1)2×2列联表如下所示:(2)假设“对新课程教学模式的赞同情况与教师年龄无关”. 由公式得K 2=50×(10×6-24×10)234×16×20×30≈4.963<6.635,所以没有99%的把握认为对新课程教学模式的赞同情况与教师年龄有关. 三、独立性检验的综合应用例3 某高校共有学生15 000人,其中男生10 500人,女生4 500人.为调查该校学生每周平均体育运动时间的情况,采用分层抽样的方法,收集300位学生每周平均体育运动时间(单位:时)的样本数据.(1)应收集多少位女生的样本数据?(2)根据这300个样本数据,得到学生每周平均体育运动时间的频率分布直方图(如图),其中样本数据的分组区间为[0,2],(2,4],(4,6],(6,8],(8,10],(10,12].估计该校学生每周平均体育运动时间超过4小时的概率.(3)在样本数据中,有60位女生的每周平均体育运动时间超过4小时,请完成每周平均体育运动时间与性别的列联表,并判断是否认为“该校学生的每周平均体育运动时间与性别有关”.附:K2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d).解(1)由分层抽样可得300×4 50015 000=90,所以应收集90位女生的样本数据.(2)由频率分布直方图得学生每周平均体育运动超过4小时的频率为1-2×(0.100+0.025)=0.75,所以该校学生每周平均体育运动时间超过4小时的概率的估计值为0.75.(3)由(2)知,300位学生中有300×0.75=225(人)的每周平均体育运动时间超过4小时,75人的每周平均体育运动时间不超过4小时.样本数据中有210份是关于男生的,90份是关于女生的,可得每周平均体育运动时间与性别列联表如下:结合列联表可算得K 2的观测值k =300×(45×60-30×165)275×225×210×90≈4.762>3.841.所以有95%的把握认为“该校学生的每周平均体育运动时间与性别有关”. 反思感悟 两个分类变量相关关系的判断(1)等高条形图法:在等高条形图中,可以估计满足条件X =x 1的个体中具有Y =y 1的个体所占的比例a a +b ,也可以估计满足条件X =x 2的个体中具有Y =y 1的个体所占的比例cc +d .两个比例的值相差越大,X 与Y 有关系成立的可能性就越大.(2)观测值法:通过2×2列联表,先计算K 2的观测值k ,然后借助k 的含义判断“两个分类变量有关系”这一结论成立的可信程度.跟踪训练3 为了解某班学生喜爱打篮球是否与性别有关,对本班48人进行了问卷调查得到了如下的2×2列联表:已知在全班48人中随机抽取1人,抽到喜爱打篮球的学生的概率为23.(1)请将上面的2×2列联表补充完整(不用写计算过程);(2)能否在犯错误的概率不超过0.05的前提下认为喜爱打篮球与性别有关?说明你的理由. 考点 独立性检验思想的应用题点 分类变量与统计、概率的综合性问题 解 (1)列联表补充如下:(2)由K 2=n (ad -bc )2(a +b )(c +d )(a +c )(b +d )=48×(220-60)228×20×32×16≈4.286.因为4.286>3.841,所以,能在犯错误的概率不超过0.05的前提下认为喜爱打篮球与性别有关.1.在吸烟与患肺病这两个分类变量是否相关的判断中,下列说法中正确的是( ) ①若K 2的观测值k >6.635,则在犯错误的概率不超过0.01的前提下,认为吸烟与患肺病有关系,那么在100个吸烟的人中必有99人患有肺病;②从独立性检验可知在在犯错误的概率不超过0.01的前提下,认为吸烟与患肺病有关系时,我们说若某人吸烟,则他有99%的可能患有肺病;③从统计量中得知在犯错误的概率不超过0.05的前提下认为吸烟与患肺病有关系,是指有5%的可能性使得推断出现错误. A .① B .①③ C .③ D .② 答案 C解析 K 2是检验吸烟与患肺病相关程度的量,是相关关系,而不是确定关系,是反映有关和无关的概率,故①不正确;②中对“确定容许推断犯错误概率的上界”理解错误;③正确. 2.下面是一个2×2列联表:则表中a ,b 处的值分别为( ) A .94,96 B .52,50 C .52,60 D .54,52答案 C解析 ∵a +21=73,∴a =52,b =a +8=52+8=60.3.某班主任对全班50名学生进行了作业量的调查,数据如下表:则推断“学生的性别与认为作业量大有关”这种推断犯错误的概率不超过( ) A .0.01 B .0.005 C .0.025 D .0.001答案 C 解析 由公式得K 2的观测值k =50×(18×15-8×9)226×24×27×23≈5.059>5.024.∵P (K 2≥5.024)=0.025, ∴犯错误的概率不超过0.025.4.根据如图所示的等高条形图可知吸烟与患肺病________关系.(填“有”或“没有”)答案 有解析 从等高条形图上可以明显地看出吸烟患肺病的频率远远大于不吸烟患肺病的频率. 5.为了判断高中生的文理科选修是否与性别有关系,随机调查了50名学生,得到如下2×2列联表:已知P (K 2≥3.841)≈0.05,P (K 2≥5.024)≈0.025. 根据表中数据,得到K 2的观测值k =50×(13×20-10×7)223×27×20×30≈4.844.可认为选修文理科与性别有关系的可能性不低于________. 答案 95%解析 ∵K 2的观测值k ≈4.844>3.841,且P (K 2≥3.841)≈0.05,这表明在犯错误的概率不超过0.05的前提下认为选修文理科与性别之间有关系,即选修文理科与性别有关系的可能性不低于95%.1.列联表与等高条形图列联表由两个分类变量之间频率大小差异说明这两个变量之间是否有关联关系,而利用等高条形图能形象直观地反映它们之间的差异,进而推断它们之间是否具有关联关系.2.对独立性检验思想的理解独立性检验的基本思想类似于数学中的反证法.先假设“两个分类变量没有关系”成立,计算随机变量K2的值,如果K2值很大,说明假设不合理.K2越大,两个分类变量有关系的可能性越大.一、选择题1.观察下列各图,其中两个分类变量x,y之间关系最强的是()答案 D解析观察等高条形图易知D选项两个分类变量之间关系最强.2.某同学寒假期间对其30位亲属的饮食习惯进行了一次调查,列出了如下2×2列联表:则可以说其亲属的饮食习惯与年龄有关的把握为()A.90% B.95% C.99% D.99.9%答案 C解析 因为K 2的观测值k =30×(4×2-16×8)212×18×20×10=10>6.635,所以有99%的把握认为其亲属的饮食习惯与年龄有关.3.下列关于K 2的说法正确的是( )A .K 2在任何相互独立的问题中都可以用来检验有关系还是无关系B .K 2的值越大,两个事件的相关性就越大C .K 2是用来判断两个分类变量是否有关系的随机变量,只对两个分类变量适用D .K 2的观测值的计算公式为k =n (ad -bc )(a +b )(c +d )(a +c )(b +d )答案 C解析 本题主要考查对K 2的理解,K 2是用来判断两个分类变量是否有关系的随机变量,所以A 错;K 2的值越大,说明我们能以更大的把握认为两个分类变量有关系,不能判断相关性的大小,所以B 错;D 中(ad -bc )应为(ad -bc )2.4.在2×2列联表中,两个比值相差越大,两个分类变量有关系的可能性就越大,那么这两个比值为( ) A.a a +b 与c c +d B.a c +d 与ca +b C.a a +d 与c b +c D.a b +d 与c a +c答案 A解析 由题意,⎪⎪⎪⎪a a +b -c c +d =⎪⎪⎪⎪⎪⎪ac +ad -ac -bc (a +b )(c +d )=⎪⎪⎪⎪⎪⎪ad -bc (a +b )(c +d ),因为|ad -bc |的值越大,两个分类变量有关系的可能性就越大,故选A.5.利用独立性检验来考察两个分类变量X 和Y 是否有关系时,通过查阅下表来确定“X 与Y 有关系”的可信程度.如果K 2≥5.024,那么就有把握认为“X 与Y 有关系”的百分比为( )A.25% B .75% C .2.5% D .97.5% 答案 D解析 k =5.024对应的0.025是“X 和Y 有关系”不可信的程度,因此两个分类变量有关系的可信程度约为97.5%.6.有两个分类变量X ,Y ,其列联表如下所示,其中a,15-a 均为大于5的整数,若在犯错误的概率不超过0.05的前提下认为X ,Y 有关,则a 的值为( )A .8B .9C .8或9D .6或8 考点 分类变量与列联表 题点 求列联表中的数据 答案 C解析 根据公式,得K 2的观测值 k =65×[a (30+a )-(15-a )(20-a )]220×45×15×50=13×(13a -60)220×45×3×2>3.841,根据a >5且15-a >5, a ∈Z ,求得当a =8或9时满足题意.7.某人研究中学生的性别与成绩、视力、智商、阅读量这4个变量的关系,随机抽查了52名中学生,得到统计数据如表1至表4,则与性别有关联的可能性最大的变量是( ) 表1表2表3表4A .成绩B .视力C .智商D .阅读量答案 D解析 因为k 1=52×(6×22-14×10)216×36×32×20=52×8216×36×32×20,k 2=52×(4×20-16×12)216×36×32×20=52×112216×36×32×20,k 3=52×(8×24-12×8)216×36×32×20=52×96216×36×32×20,k 4=52×(14×30-6×2)216×36×32×20=52×408216×36×32×20,则有k 4>k 2>k 3>k 1,所以阅读量与性别有关联的可能性最大. 二、填空题8.下表是关于男婴与女婴出生时间调查的列联表:那么,A =________,B =________,C =________,D =________,E =________. 答案 47 92 88 82 53解析 由列联表知识得⎩⎪⎨⎪⎧45+E =98,98+D =180,A +35=D ,E +35=C ,B +C =180,解得⎩⎪⎨⎪⎧A =47,B =92,C =88,D =82,E =53.9.为研究某新药的疗效,给100名患者服用此药,跟踪调查后得下表中的数据:设H :服用此药的效果与患者的性别无关,则K 2的观测值k ≈________(小数点后保留3位有效数字),从而得出结论;服用此药的效果与患者的性别有关,这种判断出错的可能性为________. 答案 4.882 5%解析由公式计算得K 2的观测值k ≈4.882,∵k >3.841,∴我们有95%的把握认为服用此药的效果与患者的性别有关,从而有5%的可能性出错.10.2018年世界杯期间,某一电视台对年龄高于40岁和不高于40岁的人是否喜欢西班牙队进行调查,对高于40岁的调查了50人,不高于40岁的调查了50人,所得数据制成如下列联表:若工作人员从所有统计结果中任取一个,取到喜欢西班牙队的人的概率为35,则有超过________的把握认为年龄与西班牙队的被喜欢程度有关. 附:K 2=n (ad -bc )2(a +b )(c +d )(a +c )(b +d ).考点 独立性检验及其基本思想 题点 独立性检验的方法 答案 95%解析 设“从所有人中任意抽取一个,取到喜欢西班牙队的人”为事件A ,由已知得P (A )=q +35100=35, 所以q =25,p =25,a =40,b =60. K 2=100×(25×35-25×15)240×60×50×50=256≈4.167>3.841. 故有超过95%的把握认为年龄与西班牙队的被喜欢程度有关. 三、解答题11.高中流行这样一句话“文科就怕数学不好,理科就怕英语不好”.下表是一次针对高三文科学生的调查所得的数据.(1)计算a ,b ,c 的值;(2)文科学生总成绩不好与数学成绩不好有关系吗? 考点 独立性检验及其基本思想题点 独立性检验的方法 解 (1)由478+a =490,得a =12. 由a +24=c ,得c =12+24=36. 由b +c =913,得b =913-36=877. (2)计算随机变量K 2的观测值k =913×(478×24-399×12)2490×423×877×36≈6.233>5.024,因为P (K 2≥5.024)≈0.025,所以在犯错误的概率不超过0.025的前提下,认为文科学生总成绩不好与数学成绩不好有关系. 12.研究人员选取170名青年男女大学生的样本,对他们进行一种心理测验.发现有60名女生对该心理测验中的最后一个题目的反应是:作肯定的有22名,否定的有38名;男生110名在相同的题目上作肯定的有22名,否定的有88名.问:性别与态度之间是否存在某种关系?分别用等高条形图和独立性检验的方法判断. 考点 定性分析的两类方法 题点 利用图形定性分析解 建立性别与态度的2×2列联表如下:根据列联表中所给的数据,可求出男生中作肯定态度的频率为22110=0.2,女生中作肯定态度的频率为2260≈0.37.作等高条形图如图,其中两个深色条形的高分别表示男生和女生中作肯定态度的频率,比较图中深色条形的高可以发现,女生中作肯定态度的频率明显高于男生中作肯定态度的频率,因此可以认为性别与态度有关系.根据列联表中的数据得到K 2的观测值 k =170×(22×38-22×88)2110×60×44×126≈5.622>5.024.因此,在犯错误的概率不超过0.025的前提下认为性别和态度有关系.13.有甲、乙两个班级进行数学考试,按照大于等于85分为优秀,85分以下为非优秀统计成绩,得到如下所示的列联表:已知在全部105人中随机抽取1人,成绩优秀的概率为27,参考下面所给附表,则下列说法正确的是( )A.列联表中c 的值为30,b 的值为35 B .列联表中c 的值为15,b 的值为50C .根据列联表中的数据,若按97.5%的可靠性要求,能认为“成绩与班级有关系”D .根据列联表中的数据,若按97.5%的可靠性要求,不能认为“成绩与班级有关系” 答案 C解析 ∵成绩优秀的概率为27,∴成绩优秀的学生数是105×27=30.成绩非优秀的学生数是75, ∴c =20,b =45,选项A ,B 错误.又根据列联表中的数据,得到K 2的观测值k =105×(10×30-20×45)255×50×30×75≈6.109>5.024,因此有97.5%的把握认为“成绩与班级有关系”.故选C.14.2017年12月1日,“国际教育信息化大会”在山东青岛开幕,为了解哪些人更关注“国际教育信息化大会”,某机构随机抽取了年龄在15~75岁之间的100人进行调查,并按年龄绘制成频率分布直方图,如图所示,其分组区间为:[15,25),[25,35),[35,45),[45,55),[55,65),[65,75],把年龄落在区间[15,35)和[35,75]内的人分别称为“青少年”和“中老年”.(1)根据频率分布直方图求样本的中位数(保留两位小数)和众数;(2)根据已知条件完成下面的2×2列联表,并判断能否有99%的把握认为“中老年”比“青少年”更加关注“国际教育信息化大会”:附:参考公式K 2=n (ad -bc )2(a +b )(c +d )(a +c )(b +d ),其中n =a +b +c +d .临界值表:解 (1)根据频率分布直方图可知样本的众数为40, 因为(0.015+0.030)×10=0.45,设样本的中位数为x ,则(x -35)×0.035=0.5-0.45, 所以x =35107≈36.43,即样本的中位数约为36.43.(2)依题意可知,抽取的“青少年”共有100×(0.015+0.030)×10=45(人), “中老年”共有100-45=55(人). 完成的2×2列联表如下:结合列联表的数据得K 2=n (ad -bc )2(a +b )(c +d )(a +c )(b +d )=100×(30×35-20×15)250×50×55×45≈9.091>6.635,所以有99%的把握认为“中老年”比“青少年”更加关注“国际教育信息化大会”.。
易学通-重难点一本过高二数学(人教版选修2-1):参考答案与解析 含解析
第一章 命题及其关系、充分条件与必要条件1.A【解析】考点:1、元素与集合关系的判断;2、集合的确定性、互异性、无序性.【思路点睛】根据题中条件:“当x S ∈时,有2x S ∈”对三个命题一一进行验证即可,对于①1m =,得2,1,n n n ⎧≤⎨≥⎩,②12m =-,得2,1,4n n n ⎧≤⎪⎨≤⎪⎩,对于③若12n =,则221,2,1,2m m m m ⎧≥⎪⎪⎪≥⎨⎪⎪≥⎪⎩最后解出不等式,根据解出的结果与四个命题的结论对照,即可得出正确结果有几个.本小题考查集合的运算及不等式和不等式组的解法.属于创新题,解答的关键是对新定义的概念的正确理解,列出不等关系转化为不等式问题解决.2.D【解析】试题分析:根据子集的定义知A 正确;由对数的定义及性质知B ,C 正确,对于D ,当零点左右符号相同时不能用二分法,故D 错,故选D.考点:1、子集的定义及对数的定义与性质;2、二分法的基本含义.3.A【解析】试题分析:①根据函数的对应法则,可得不管x 是有理数还是无理数,均有1))((=x f f ;②根据函数奇偶性的定义,可得)(x f 是偶函数;③根据函数的表达式,结合有理数和无理数的性质;④取331-=x ,02=x ,333=x ,可得)0,33(A ,)1,0(B ,)0,33(-C ,三点恰好构成等边三角形. 考点:分段函数的应用.4.C【解析】试题分析:否命题需将条件和结论分别否定,所以否命题为:若2015x ≤,则0x ≤考点:四种命题5.B【解析】考点:四种命题.6.A【解析】 试题分析:由112x <,得2x >或0x <,所以“2x >”是“112x <”的充分不必要条件,故选A.考点:充分条件与必要条件.7.A【解析】 试题分析:两直线垂直,所以1,24a a a -⋅=-=±,所以是充分不必要条件. 考点:充要条件.8.B【解析】试题分析:由题意得,由函数12-+=m y x 有零点可得,1<m ,而由函数x y m log =在),0(+∞上为减函数可得10<<m ,因此是必要不充分条件,故选B .考点:1.指数函数的单调性;2.对数函数的单调性;3.充分必要条件.9.A【解析】考点:解三角形.【易错点晴】本题以解三角形的问题的形式为背景,考查的是充分必要条件的有关知识及推理判断的能力.解答好本题的关键是搞清楚钝角三角形的概念是什么?其外延是什么?其实钝角三角形的概念是有一个内角是钝角即可了.解答这个问题的过程中常常会出现三个内角都是钝角的错误,将锐角三角形的概念和钝角三角形的概念混淆在一起,从而误判得出不正确的答案.10.A【解析】试题分析:由125a a a ,,成等比数列,得2111()(4)a d a a d +=+,即。
人教版高中数学选修1-2(A版)课件:第一章 1.2独立性检验的基本思想及其初步应用 (共92张PPT)
易学通-重难点一本过高二数学(人教版选修2-1):第一章 命题及其关系、充分条件与必要条件 含解析
重点列表:四种命题及其关系1.四种命题即:如果第一个命题的条件是第二个命题的结论,且第一个命题的结论是第二个命题的条件,那么这两个命题叫做互为逆命题;如果一个命题的条件和结论分别是原命题的条件和结论的否定,那么这两个命题叫做互否命题,这个命题叫做原命题的否命题;如果一个命题的条件和结论分别是原命题的结论和条件的否定,那么这两个命题叫做互为逆否命题,这个命题叫做原命题的逆否命题。
2.四种命题间的逆否关系3.四种命题的真假关系(1)两个命题互为逆否命题,它们有相同的真假性;(2)两个命题为互逆命题或互否命题,它们的真假性没有关系.重点1:四种命题及其相互关系【要点解读】1.四种命题反映出命题之间的内在联系,要注意结合实际问题,理解其关系(尤其是两种等价关系)的产生过程,关于逆命题、否命题与逆否命题,也可以叙述为:(1)交换命题的条件和结论,所得的新命题就是原来命题的逆命题;(2)同时否定命题的条件和结论,所得的新命题就是原来的否命题;(3)交换命题的条件和结论,并且同时否定,所得的新命题就是原命题的逆否命题。
注意:在写其他三种命题时,大前提必须放在前面。
2.正确的命题要有充分的依据,不一定正确的命题要举出反例,这是最基本的数学思维方式,也是两种不同的解题方向,有时举出反例可能比进行推理论证更困难,二者同样重要.3. 判断四种形式的命题真假的基本方法是先判断原命题的真假,再判断逆命题的真假,然后根据等价关系确定否命题和逆否命题的真假.如果原命题的真假不好判断,那就首先判断其逆否命题的真假.4. 否命题与命题的否定是两个不同的概念:①否命题是将原命题的条件否定作为条件,将原命题的结论否定作为结论构造的一个新的命题;②命题的否定只是否定命题的结论,常用于反证法.【考向1】四种命题的关系及真假判断【例题】写出下列命题的逆命题、否命题及逆否命题,并分别判断四种命题的真假:(1)末位数字是0的多位数一定是5的倍数;(2)在△ABC中,若AB>AC,则∠C>∠B;(3)若x2-2x-3>0,则x<-1或x>3.解:(1)原命题:若一个多位数的末位数字是0,则它是5的倍数.逆命题:若一个多位数是5的倍数,则它的末位数字是0.否命题:若一个多位数的末位数字不是0,则它不是5的倍数.逆否命题:若一个多位数不是5的倍数,则它的末位数字不是0.这里,原命题与逆否命题为真命题,逆命题与否命题是假命题.(2)逆命题:在△ABC中,若∠C>∠B,则AB>AC.否命题:在△ABC中,若AB≤AC,则∠C≤∠B..逆否命题:在△ABC中,若∠C≤∠B,则AB≤AC.这里,四种命题都是真命题.(3)逆命题:若x<-1或x>3,则x2-2x-3>0.否命题:若x2-2x-3≤0,则-1≤x≤3.逆否命题:若-1≤x≤3,则x2-2x-3≤0.这里,四种命题都是真命题.【点评】写出一个命题的逆命题、否命题和逆否命题,关键是找出原命题的条件p与结论q,将原命题写成“若p,则q”的形式.在(2)中,原命题有大前提“在△ABC中”,在写出它的逆命题、否命题和逆否命题时,应当保留这个大前提.(3)中“x<-1或x>3”的否定形式是“x≥-1且x≤3”,即“-1≤x≤3”.【考向2】命题的否定【例题】写出下列命题的否定形式和否命题:(1)若xy=0,则x,y中至少有一个为零;(2)若a+b=0,则a,b中最多有一个大于零;(3)若四边形是平行四边形,则其相邻两个内角相等;(4)有理数都能写成分数.。
易学通重难点一本过高二数学选修1-1:第一章 命题及其
重点列表:重点详解:重点1:四种命题及其相互关系【要点解读】1.四种命题及其关系(1)四种命题间的相互关系(2)四种命题的真假关系①两个命题互为逆否命题,它们具有相同的真假性.②两个命题为互逆命题或互否命题时,它们的真假性没有关系.【考向】四种命题及其相互关系【例题】A B C三个学生参加【江西省金溪一中、南丰一中、广昌一中等2017届高三上学期期中】,,了一次考试,,A B的得分均为70分,C的得分均为65分,已知命题:p若及格分低于70分,A B C都没有及格,在下列四个命题中,为p的逆否命题的是()则,,A B C都及格A.若及格分不低于70分,则,,A B C都及格,则及格分不低于70分B.若,,A B C至少有人及格,则及格分不低于70分C.若,,A B C至少有人及格,则及格分不高70于分D.若,,【名师点睛】1.写一个命题的其他三种命题时的2个注意点(1)对于不是“若p,则q”形式的命题,需先改写;(2)若命题有大前提,写其他三种命题时需保留大前提.2.命题真假的两种判断方法(1)联系已有的数学公式、定理、结论进行正面直接判断.(2)利用原命题与逆否命题,逆命题与否命题的等价关系进行判断.3.易混淆否命题与命题的否定:否命题是既否定条件,又否定结论,而命题的否定是只否定命题的结论.4.易忽视A是B的充分不必要条件(A⇒B且B A)与A的充分不必要条件是B(B⇒A且AB)两者的不同.重点2:充分条件与必要条件的判定【要点解读】充分条件、必要条件与充要条件的概念且qq【考向】充分条件与必要条件的判定【例题】【2016高考四川文科】设p:实数x ,y 满足1x >且1y >,q: 实数x ,y 满足2x y +>,则p 是q 的( )(A)充分不必要条件 (B)必要不充分条件 (C) 充要条件 (D) 既不充分也不必要条件【名师点睛】1.充要条件的三种判断方法(1)定义法:根据p ⇒q ,q ⇒p 进行判断;(2)集合法:根据p ,q 成立的对象的集合之间的包含关系进行判断;(3)等价转化法:根据一个命题与其逆否命题的等价性,把判断的命题转化为其逆否命题进行判断.这个方法特别适合以否定形式给出的问题,如“xy≠1”是“x≠1或y≠1”的某种条件,即可转化为判断“x =1且y =1”是“xy =1”的某种条件.2.判断条件之间的关系要注意条件之间关系的方向,正确理解“p 的一个充分而不必要条件是q ”的语言.重点3:根据充分条件、必要条件求参数的范围 【要点解读】解决此类问题一般是把充分条件、必要条件或充要条件转化为集合之间的关系,然后根据集合之间的关系列出关于参数的不等式(组)求解,在求解参数的取值范围时,一定要注意区间端点值的检验,尤其是利用两个集合之间的关系求解参数的取值范围时,不等式是否能够取等号决定端点值的取舍,处理不当容易出现漏解或增解的现象. 【考向】根据充分条件、必要条件求参数的范围【例题】设p :实数x 满足x 2-4ax +3a 2<0,其中a ≠0,q :实数x 满足2260280x x x x ⎧--≤⎨+->⎩若p是q 的必要不充分条件,则实数a 的取值范围是________. 【答案】(1,2]【解析】∵p 是q 的必要不充分条件,即q ⇒p 但p ⇒ q ,设A ={x|p(x)},B ={x|q(x)},则,又B =(2,3],当a >0时,A =(a ,3a );当a <0时,A =(3a ,a ),【名师点睛】根据充要条件求参数的值或取值范围的关键:先合理转化条件,常通过有关性质、定理、图象将恒成立问题和有解问题转化为最值问题等,得到关于参数的方程或不等式(组),再通过解方程或不等式(组)求出参数的值或取值范围.【趁热打铁】1.【2016高考上海文科】设R a ∈,则“1>a ”是“12>a ”的( )A.充分非必要条件B.必要非充分条件C.充要条件D.既非充分也非必要条件2.【湖北省襄阳市四校2017届高三上学期期中联考】设0>x ,R y ∈,则“y x >”是“||y x >”的 ( )A.充要条件B.充分而不必要条件C.必要而不充分条件D.既不充分也不必要条件 3.【四川省资阳市2017届高三上学期第一次诊断考试】“2x >”是“112x <”的( ) A .充分不必要条件 B .必要不充分条件 C .充要条件 D .既不充分又不必要条件4.【湖南省郴州市2017届高三上学期第一次教学质量监测】设x R ∈,则“12x <<”是“|2|1x -<”的( )A .充分不必要条件B .必要不充分条件C .充要条件D .既不充分也不必要条件5.【2016届高三(亮剑·快乐考生)三轮冲刺猜题(三)】若p 是的充分不必要条件,则下列判断正确的是 ( )A .p ⌝是的必要不充分条件B .q ⌝是p 的必要不充分条件C .p ⌝是q ⌝的必要不充分条件D .q ⌝是p ⌝的必要不充分条件6.【浙江省绍兴市柯桥区2016届高三教学质量调测(二模)】已知,x y R ∈,则“()()22120x y -+-=”是 “()()120x y --=”的( )A .充分不必要条件B .必要不充分条件C .充要条件D .即不充分又不必要条件7. 【天津市耀华中学2017届高三上学期开学考试(暑假验收考试)】已知{}||1|4M x x =+<,|03x N x x ⎧⎫=<⎨⎬-⎩⎭,那么“a M ∈”是“a N ∈”的( )A .充分而不必要条件B .必要而不充分条件C .充分必要条件D .既不充分也不必要条件8.【四川省成都市2017届高中毕业班摸底测试】已知数列{}n a 是等比数列,则“12a a <”是“数列{}n a 为递增数列”的( )A .充分不必要条件B .充分必要条件C .必要不充分条件D .既不充分也不必要条件9.【山西省孝义市2017届高三上学期二轮模考】已知2:8200p x x --≤,:(1)(1)0(0)q x a x a a -+--≤>.若p 是的充分不必要条件,求实数的取值范围.10.【湖北省襄阳市四校2017届高三上学期期中联考】设命题:p 实数满足:03422<+-a ax x ,其中0>a .命题:q 实数满足121-⎪⎭⎫ ⎝⎛=m x ,其中()2,1∈m(1)若41=a ,且q p ∧为真,求实数的取值范围;(2)p ⌝是q ⌝的充分不必要条件,求实数的取值范围.第一章 命题及其关系、充分条件与必要条件【趁热打铁*答案与解析】 1.【答案】A【解析】2211,111a a a a a >⇒>>⇒><-或,所以是充分非必要条件,选A. 2.【答案】C【解析】当1,2x y ==-时,||x y >不成立;又由||x y >知,0x >且x y >,所以当0x >,y ∈R 时 “x y >”是“||x y >”的必要不充分条件.3.【答案】A 【解析】由112x <,得2x >或0x <,所以“2x >”是“112x <”的充分不必要条件,故选A . 4.【答案】A【解析】|2|113x x -<⇒<<⇒“12x <<”是“|2|1x -<”的充分不必要条件,故选A. 5.【答案】C【解析】由p 是的充分不必要条件可知q p ⇒,p q ⇒.由互为逆否命题的等价性,可知q p ⌝⇒⌝.8.【答案】C【解析】若{}n a 是递增数列一定有1n n a a +<,12a a ∴<成立,当122,2a a =-=时,满足12a a <,而{}n a 不是递增数列,所以“12a a <”是“数列{}n a 为递增数列”必要不充分条件,故选C.9.【答案】[9,)+∞【解析】2:8200210p x x x --≤⇔-≤≤,:(1)(1)0(0)11q x a x a a a x a -+--≤>⇔-≤≤+.∵p q ⇒,q p ∞,∴{|210}{|11}x x x a x a ⊂-≤≤-≤≤+≠.故有121100a a a -<-⎧⎪+>⎨⎪>⎩,解得9a >.又当9a =时,也满足条件,因此,所求实数的取值范围为[9,)+∞.10.【答案】(1)⎭⎬⎫⎩⎨⎧<<4321x x;(2)11[,]32. 【解析】(1)()03:><<a a x a p 121:<<x q ……………………………………2分 41=a 时 4341:<<x p p q ∧Q 为真 p ∴真且真……………………………………………………3分⎪⎪⎩⎪⎪⎨⎧<<<<1214341x x 得4321<<x。
易学通·重难点一本过高二数学(人教版选修2-2):第一章 合情推理与演绎推理 含解析
重点列表:重点名称重要指数重点1归纳推理★★★重点2类比推理★★★★重点3演绎推理★★★★1.推理一般包括合情推理和演绎推理两类.2.合情推理(1)归纳推理:由某类事物的部分对象具有某些特征,推出该类事物的全部对象都具有这些特征的推理,或者由个别事实概括出一般结论的推理,称为归纳推理.简言之,归纳推理是由__________到整体、由__________到一般的推理.(2)类比推理:由两类对象具有某些类似特征和其中一类对象的某些已知特征,推出另一类对象也具有这些特征的推理称为类比推理.简言之,类比推理是由________到________的推理.(3)合情推理:归纳推理和类比推理都是根据已有的事实,经过观察、分析、比较、联想,再进行__________、__________,然后提出猜想的推理,我们把它们统称为合情推理.【答案】(1)部分个别(2)特殊特殊(3)归纳类比重点1:归纳推理【要点解读】归纳推理的类型及相应方法常见的归纳推理分为数的归纳和形的归纳两类:(1)数的归纳包括数字归纳和式子归纳,解决此类问题时,需要细心观察,寻求相邻项及项与序号之间的关系,同时还要联系相关的知识,如等差数列、等比数列等.(2)形的归纳主要包括图形数目归纳和图形变化规律归纳.【考向1】关于数列的类比【例题】在数列{a n}中,a1=1,a n+1=2a n2+a n(n∈N+),试猜想这个数列的通项公式.当n=3时,a3=错误!=错误!=错误!=错误!;当n=4时,a4=2a32+a3=错误!=错误!,由此猜想,这个数列的通项公式为an=错误!.【评析】数列的通项公式表示的是数列{an}的第n 项an与序号n之间的对应关系,先根据已知的递推公式,算出数列的前几项,再通过观察,归纳得到关于数列通项公式的一个猜想,这种猜想是否正确还有待严格的证明.【考向2】不等式的推理【例题】已知x>0,由不等式x+错误!≥2错误!=2,x +错误!=错误!+错误!+错误!≥3错误!=3,x+错误!=错误!+错误!+错误!+错误!≥4错误!=4,……。
高二数学人教选修1-2同步练习:1.1 独立性检验 Word版含解析
第一章统计案例§1.1独立性检验一、基础过关1.下面是一个2×2则表中a、b处的值分别为() A.94、96 B.52、50 C.52、60 D.54、52 2.在2×2列联表中,四个变量的取值n11,n12,n21,n22应是() A.任意实数B.正整数C.不小于5的整数D.非负整数3.如果有99%的把握认为“x与y有关系”,那么χ2满足() A.χ2>6.635 B.χ2≥5.024C.χ2≥7.879 D.χ2>3.8414.在吸烟与患肺病这两个分类变量的计算中,下列说法正确的是() A.若χ2>6.635,我们有99%的把握认为吸烟与患肺病有关系,那么在100个吸烟的人中必有99人患有肺病B.从独立性检验可知,有99%的把握认为吸烟与患肺病有关系时,我们说某人吸烟,那么他有99%的可能患有肺病C.若从χ2统计量中得出有95%的把握认为吸烟与患肺病有关系,是指有5%的可能性使得推断出现错误D.以上三种说法都不正确5.某高校“统计初步”课程的教师随机调查了一些学生,具体数据如下表所示,为了判断选修统计专业是否与性别有关系,根据表中数据,得到χ2=50×(13×20-10×7)2 23×27×20×30≈4.844,因为4.844>3.841.所以选修统计专业与性别有关系,那么这种判断出错的可能性为________.二、能力提升6.在2×2列联表中,两个分类变量有关系的可能性越大,相差越大的两个比值为()A.n11n11+n12与n21n21+n22B.n11n21+n22与n21n11+n12C.n11n11+n22与n21n12+n21D.n11n12+n22与n21n11+n217.在一项打鼾与患心脏病的调查中,共调查了1 671人,经过计算得χ2=27.63,根据这一数据分析,我们有理由认为打鼾与患心脏病是________的(有关、无关).8.在使用独立性检验时,下列说法正确的个数为______.①对事件A与B的检验无关时,两个事件互不影响;②事件A与B关系越密切,则χ2就越大;③χ2的大小是判定事件A与B是否相关的唯一根据;④若判定两事件A与B 有关,则A发生B一定发生.9计算χ2≈______,从而得出结论:服用此药的效果与患者的性别有关,这种判断出错的可能性为______.10.某县对在职的71名高中数学教师就支持新的数学教材还是支持旧的数学教材做了调查,根据此资料,你是否认为教龄的长短与支持新的数学教材有关?11.在一次天气恶劣的飞行航程中,调查了男女乘客在飞机上晕机的情况:男乘客晕机的有24人,不晕机的有31人;女乘客晕机的有8人,不晕机的有26人.请你根据所给数据判定:在天气恶劣的飞行航程中,男乘客是否比女乘客更容易晕机?12.在对人们的休闲方式的一次调查中,共调查了124人,其中女性70人,男性54人.女性中有43人主要的休闲方式是看电视,另外27人主要的休闲方式是运动;男性中有21人主要的休闲方式是看电视,另外33人主要的休闲方式是运动.(1)根据以上数据建立一个2×2列联表;(2)判断性别与休闲方式是否有关系.三、探究与拓展13.某教育机构为了研究人具有大学专科以上学历(包括大学专科)和对待教育改革态度的关对于教育机构的研究项目,根据上述数据能得出什么结论?答案1.C 2.C 3.A 4.C 5.5% 6.A 7.有关 8.1 9.4.882 5% 10.解 由公式得χ2=n (n 11n 22-n 12n 21)2n 1+n 2+n +1n +2=71×(12×24-25×10)237×34×22×49≈0.08. ∵χ2<3.841.∴我们没有理由说教龄的长短与支持新的数学教材有关. 11.解由公式可得 χ2=89×(24×26-31×8)255×34×32×57≈3.689<3.841,故我们没有理由认为“在天气恶劣的飞行航程中,男乘客比女乘客更容易晕机”. 12.解 (1)列联表如下:(2)χ2=124×(43×33-27×21)270×54×64×60≈6.201,∵χ2>3.841且χ2<6.635.∴有95%的把握认为性别与休闲方式有关. 13.解 χ2=392×(39×167-157×29)2196×196×68×324≈1.78.因为1.78<3.841,所以我们没有理由说人具有大学专科以上学历(包括大学专科)和对待教育改革态度有关.。
人教版数学选修1-2第一章1.2独立性检验的基本思想及其初步应用
1.2独立性检验的基本思想及其初步应用1.了解分类变量的意义.2.了解2×2列联表的意义.3.了解随机变量K2的意义.4.通过对典型案例分析,了解独立性检验的基本思想和方法.1.分类变量和列联表(1)分类变量变量的不同“值”表示个体所属的不同类别,像这样的变量称为分类变量.(2)列联表①定义:列出的两个分类变量的频数表称为列联表.②2×2列联表一般地,假设有两个分类变量X和Y,它们的取值分别为{x1,x2}和{y1,y2},其样本频数列联表(也称为2×2列联表)为下表.2.等高条形图(1)等高条形图与表格相比,更能直观地反映出两个分类变量间是否相互影响,常用等高条形图展示列联表数据的频率特征.(2)观察等高条形图发现aa+b和cc+d相差很大,就判断两个分类变量之间有关系.3.独立性检验(1)定义利用随机变量K2来判断“两个分类变量有关系”的方法称为独立性检验.(2)K2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d),其中n=a+b+c+d为样本容量.(3)独立性检验的具体做法①根据实际问题的需要确定容许推断“两个分类变量有关系”犯错误概率的上界α,然后查表确定临界值k0.②利用公式计算随机变量K2的观测值k.③如果k≥k0,就推断“X与Y有关系”,这种推断犯错误的概率不超过α,否则,就认为在犯错误的概率不超过α的前提下不能推断“X与Y有关系”,或者在样本数据中没有发现足够证据支持结论“X与Y有关系”.1.判断下列命题(正确的打“√”,错误的打“×”)(1)列联表中的数据是两个分类变量的频数.()(2)事件A与B的独立性检验无关,即两个事件互不影响.()(3)K2的大小是判断事件A与B是否相关的统计量.()答案:(1)√(2)×(3)√2.下面是调查某地区男女中学生喜欢理科的等高条形图,阴影部分表示喜欢理科的百分比,从图中可以看出()A.性别与喜欢理科无关B.女生中喜欢理科的比为80%C.男生比女生喜欢理科的可能性大些D.男生不喜欢理科的比为60%答案:C3.若由一个2×2列联表中的数据计算K2的观测值k=4.013,那么在犯错误的概率不超过________的前提下认为两个变量有关系.答案:0.05探究点一等高条形图从发生交通事故的司机中抽取2 000名司机作随机样本,根据他们血液中是否含有酒精以及他们是否对事故负有责任将数据整理如下:相应的等高条形图如图.试结合等高条形图分析血液中含有酒精与对事故负有责任是否有关.[解]从题图中可以看出,阴影部分所占比例差距较大,由此我们可以在某种程度上认为“血液中含有酒精”与“对事故负有责任”有关系.利用等高条形图判断两个分类变量是否相关的步骤1.某学校对高三学生做了一项调查发现:在平时的模拟考试中,性格内向的学生426人中332人在考前心情紧张,性格外向的学生594人中有213人在考前心情紧张,作出等高条形图,利用图形判断考前心情紧张与性格类别是否有关系.解:作列联表如下:相应的等高条形图如图所示:图中阴影部分表示考前心情紧张与考前心情不紧张中性格内向的比例,从图中可以看出考前心情紧张的样本中性格内向占的比例比考前心情不紧张样本中性格内向占的比例大,可以认为考前心情紧张与性格类别有关.探究点二独立性检验某校对学生的课外活动进行调查,结果整理成下表:试用你所学过的知识进行分析,能否在犯错误的概率不超过0.005的前提下,认为学生喜欢课外活动的类别与性别有关系.[解]由表中数据可知K2的观测值k=n(ad-bc)2(a+b)(c+d)(a+c)(b+d)=79×(21×29-23×6)2 44×35×27×52≈8.106.因为P(K2≥7.879)≈0.005,且8.106>7.879,所以在犯错误的概率不超过0.005的前提下,可以认为学生喜欢课外活动的类别与性别有关系.解决独立性检验问题的基本步骤(1)根据已知的数据作出列联表. (2)求K 2的观测值.(3)判断可能性:与临界值比较,得出事件有关的可能性大小.2.福建师大开展阳光体育活动,为了研究锻炼时间与性别是否有关,对全校大学生的锻炼时间进行随机抽样调查,从中随机抽取男、女生各25名进行了问卷调查,得到如下列联表:(1)请把列联表中的数据补充完整;(2)根据表中数据分析,在犯错误的概率不超过多少的前提下可以认为“锻炼时间与性别有关”?解:(1)列联表如下:(2)根据2×2k =50×(5×10-20×15)220×30×25×25≈8.333>7.879,所以在犯错误的概率不超过0.005的前提下,可以认为“锻炼时间与性别有关”.1.两分类变量之间关联关系的定性分析 (1)频率分析通过对样本的每个分类变量的不同类别和事件发生的频率的大小比较来分析分类变量之间是否有关联关系,通常通过列联表列出两个分类变量进行分析.(2)图形分析利用等高条形图来分析两分类变量之间是否具有相关关系,形象、直观地反映两个分类变量之间的总体状态和差异大小,进而推断它们之间是否具有相关关系.2.独立性检验的基本思想独立性检验的基本思想类似于数学上的反证法.要判断“两个分类变量有关系”这一结论成立的可信程度,首先假设该结论不成立,即假设结论“两个分类变量没有关系”成立,在该假设下构造的随机变量K 2应该很小.若由观测数据求得的K 2的观测值k 很大,则断言假设不成立.给定一个正数k 0,称为一个判断规则的临界值.如果k ≥k 0,就认为“两个分类变量之间有关系”;否则就认为“两个分类变量之间没有关系”.规范解答——频率分布直方图与独立性检验的综合应用(本题满分12分)某高校共有学生15 000人,其中男生10 500人,女生4 500人,为调查该校学生每周平均体育运动时间的情况,采用分层抽样的方法,收集300位学生每周平均体育运动时间的样本数据(单位:小时).(1)应收集多少位女生的样本数据?(2)根据这300个样本数据,得到学生每周平均体育运动时间的频率分布直方图(如图所示),其中样本数据的分组区间为[0,2),[2,4),[4,6),[6,8),[8,10),[10,12],估计该校学生每周平均体育运动时间超过4小时的概率.(3)在样本数据中,有60位女生的每周平均体育运动时间超过4小时,请完成每周平均体育运动时间与性别列联表,并判断在犯错误的概率不超过0.05的前提下,是否可认为“该校学生的每周平均体育运动时间与性别有关”.附:K 2=n (ad -bc )(a +b )(c +d )(a +c )(b +d ).[解] (1)300×4 50015 000=90,所以应收集90位女生的样本数据. (3分)(2)由频率分布直方图得1-2×(0.025+0.100)=0.75,所以该校学生每周平均体育运动时间超过4小时的概率的估计值为0.75. (6分)(3)由(2)知,300位学生中有300×0.75=225(人)的每周平均体育运动时间超过4小时,75人的每周平均体育运动时间不超过4小时.又因为样本数据中有210份是关于男生的,90份是关于女生的,所以每周平均体育运动时间与性别列联表如下:每周平均体育运动时间与性别列联表结合列联表可算得k =300×(45×60-165×30)75×225×210×90=10021≈4.762>3.841.(10分)所以,在犯错误的概率不超过0.05的前提下,可以认为“该校学生的每周平均体育运动时间与性别有关”.(12分)[规范与警示] (1)按频率分布直方图的信息,统计出相关的数值. (2)利用独立性检验的基本思想作出分析判断.[A 基础达标]1.下面是2×2列联表:则表中a ,b 的值分别为( ) A .94,72 B .52,50 C .52,74 D .74,52 解析:选C.根据列联表的特点,可知:⎩⎪⎨⎪⎧a +21=73,a +22=b ,解得⎩⎪⎨⎪⎧a =52,b =74. 2.下列关于等高条形图的叙述正确的是( )A .从等高条形图中可以精确地判断两个分类变量是否有关系B .从等高条形图中可以看出两个变量频数的相对大小C .从等高条形图中可以粗略地看出两个分类变量是否有关系D .以上说法都不对解析:选C.在等高条形图中仅能粗略判断两个分类变量的关系,故A 错.在等高条形图中仅能够看出频率,无法看出频数,故B 错.3.在研究打鼾与患心脏病之间的关系中,通过收集数据、整理分析数据得到“打鼾与患心脏病有关”的结论,并且在犯错误的概率不超过0.01的前提下认为这个结论是成立的.下列说法中正确的是( )A .100个心脏病患者中至少有99人打鼾B .1个人患心脏病,则这个人有99%的概率打鼾C .100个心脏病患者中一定有打鼾的人D .100个心脏病患者中可能一个打鼾的人都没有解析:选D.这是独立性检验,在犯错误的概率不超过0.01的前提下认为“打鼾与患心脏病有关”.这只是一个概率,即打鼾与患心脏病有关的可能性为99%.根据概率的意义可知答案应选D.4.在等高条形图中,下列哪两个比值相差越大,要推断的论述成立的可能性就越大( )A.a a +b 与d c +dB.c a +b 与a c +dC.a a +b 与c c +dD.a a +b 与c b +c解析:选C.由等高条形图的意义可知a a +b 与c c +d的值相差越大,|ad -bc |就越大,相关性就越强.5.对两个分类变量A 、B 的下列说法中正确的个数为( ) ①A 与B 无关,即A 与B 互不影响;②A 与B 关系越密切,则K 2的观测值就越大;③K 2的观测值大小是判定A 与B 是否相关的唯一依据. A .1 B .2C.3 D.0解析:选A.①正确,A与B无关即A与B相互独立;②不正确,K2的观测值的大小只是用来检验A与B是否相互独立;③不正确,也可借助等高条形图等.故选A.6.如果由一个2×2列联表中的数据计算得K2的观测值k≈4.013,那么在犯错误的概率不超过________的前提下,认为两个变量之间有关系.解析:因为k=4.013>3.841,所以在犯错误的概率不超过0.05的前提下,认为两个变量有关系.答案:0.057.在吸烟与患肺病是否相关的判断中,有下面的说法:①若K2的观测值k>6.635,则在犯错误的概率不超过0.01的前提下,认为吸烟与患肺病有关系,那么在100个吸烟的人中必有99人患有肺病;②从独立性检验可知在犯错误的概率不超过0.01的前提下,认为吸烟与患肺病有关系时,若某人吸烟,则他有99%的可能患有肺病;③从独立性检验可知在犯错误的概率不超过0.05的前提下,认为吸烟与患肺病有关系时,是指有5%的可能性使得推断错误.其中说法正确的是________.解析:K2是检验吸烟与患肺病相关程度的量,是相关关系,而不是确定关系,是反映有关和无关的概率,故说法①不正确;说法②中对“确定容许推断犯错误概率的上界”理解错误;说法③正确.答案:③8.某高校《统计初步》课程的教师随机调查了选该课的一些学生情况,具体数据如下表:为了判断主修统计专业是否与性别有关系,根据表中数据,得到K2=50×(13×20-10×7)2≈4.844>3.841.所以断定主修统计专业与性别有关系,那么这种判23×27×20×30断出错的可能性约是________.解析:根据K2≈4.844>3.841知,这种判断出错的可能性约是5%.答案:5%9.某生产线上,质量监督员甲在生产现场时,990件产品中有合格品982件,次品8件;不在生产现场时,510件产品中有合格品493件,次品17件.试利用列联表和等高条形图判断监督员甲在不在生产现场对产品质量好坏有无影响.解:根据题目所给数据得如下2×2列联表:因为ad-bc=982×17-8×493=12 750,|ad-bc|比较大,说明甲在不在生产现场与产品质量好坏有关系.相应的等高条形图如图所示.图中两个阴影部分的高分别表示甲在生产现场和甲不在生产现场时样品中次品数的频率.从图中可以看出,甲不在生产现场时样本中次品数的频率明显高于甲在生产现场时样本中次品数的频率.因此可以认为质量监督员甲在不在生产现场与产品质量好坏有关系.10.某校高一年级共有800名学生,其中男生480名,女生320名,在某次满分为100分的数学考试中,所有学生的成绩均在30分及30分以上,成绩在“80分及80分以上”的学生视为优秀,现按性别采用分层抽样的方法抽取100名学生的数学成绩,将他们的成绩按[30,40)、[40,50)、[50,60)、[60,70)、[70,80)、[80,90)、[90、100]分成七组,得到的频率分布直方图如图所示:(1)估计该年级本次数学考试成绩的平均分(同一组中的数据用该区间中点值作代表); (2)请将下列2×2列联表补充完整,计算并说明能否在犯错误的概率不超过0.05的前提下认为“该校学生数学成绩优秀与性别有关”.解:(1)估计该年级本次数学考试成绩的平均分为0.04×35+0.12×45+0.2×55+0.28×65+0.18×75+0.12×85+0.06×95=65.4(分).(2)应抽取男生60人,女生40人,可得2×2列联表:则K 2的观测值k =100×(12×34-6×48)18×82×40×60≈0.407<3.841,所以在犯错误的概率不超过0.05的前提下不能认为“该校学生数学成绩优秀与性别有关”.[B 能力提升]1.观察下列各图,其中两个分类变量x ,y 之间关系最强的是( )解析:选B.根据独立性检验的基本思想知x 与y 关系最强的是B. 2.有两个分类变量X ,Y ,其一组的列联表如下所示,其中a ,15-a 均为大于50.05的前提下认为X ,Y 有关,则a 的值为( )A .8B .9C .8,9D .6,8解析:选C.根据公式,得K 2的观测值k =65×[a (30+a )-(15-a )(20-a )]220×45×15×50=13×(13a -60)220×45×3×2>3.841,根据a >5且15-a >5,a ∈Z ,求得a =8,9满足题意.3.某校对有心理障碍学生进行测试得到如下列联表:则在焦虑、说谎、懒惰这三种心理障碍中与性别关系最大的是________.解析:对于题中三种心理障碍分别构造三个随机变量K 21,K 22,K 23,其观测值分别为k 1,k 2,k 3,由表中数据列出焦虑是否与性别有关的2×2列联表:可得k 1=110×(5×60-25×20)30×80×25×85≈0.863<2.706,同理,k 2=110×(10×70-20×10)230×80×20×90≈6.366>5.024,k 3=110×(15×30-15×50)230×80×65×45≈1.410<2.706.因此,说谎与性别关系最大.答案:说谎4.(选做题)某大学高等数学老师这学期分别用A ,B 两种不同的教学方式试验甲、乙两个大一新班(人数均为60人,入学时数学平均分数和优秀率都相同,勤奋程度和自觉性都一样).现随机抽取甲、乙两班各20名同学的高等数学期末考试成绩(单位:分),得到如下茎叶图:(1)依茎叶图判断哪个班的平均分高;(2)现从甲班高等数学成绩不低于80分的同学中随机抽取两名同学,求成绩为86分的同学至少有一个被抽中的概率;(3)学校规定:成绩不低于85分为优秀,请填写下面的2×2列联表,并判断“能否在犯错误的概率不超过0.025的前提下认为成绩优秀与教学方式有关”.解:(1)80~100分之间,所以乙班的平均分高.(2)记成绩为86分的同学为A 、B ,其他不低于80分的同学为C ,D ,E ,F .“从甲班高等数学成绩不低于80分的同学中随机抽取两名同学”的一切可能结果组成的基本事件有(A ,B ),(A ,C ),(A ,D ),(A ,E ),(A ,F ),(B ,C ),(B ,D ),(B ,E ),(B ,F ),(C ,D ),(C ,E ),(C ,F ),(D ,E ),(D ,F ),(E ,F )共15个,“抽到至少有一个同学的成绩为86分”所组成的基本事件有(A ,B ),(A ,C ),(A ,D ),(A ,E ),(A ,F ),(B ,C ),(B ,D ),(B ,E ),(B ,F )共9个,故P =915=35.(3)根据给定的数据,填写相应的数据如下所示:则K 2的观测值k =40×(3×10-10×17)213×27×20×20≈5.584>5.024,因此在犯错误的概率不超过0.025的前提下可以认为成绩优秀与教学方式有关.。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
重点列表:
重点详解: 重点1:独立性检验 【要点解读】
1.独立性检验的两个关键,一是是正确列出2×2列联表,二是准确理解并计算出2K 的值.
2.弄清判断两变量有关的把握性与犯错误概率的关系,根据题目要求作出正确的回答.
3.独立性检验中统计量K 2的观测值k 的计算公式较为复杂,在解题中应明确数据的意义,代入公式准确计算.准确计算2k 的值是正确判断的前提.
【考向】独立性检验 【例题】
【2016辽宁省沈阳质量监测一】为考查某种疫苗预防疾病的效果,进行动物实验,得到统计数据如下:
现从所有试验动物中任取一只,取到“注射
疫苗”动物
(Ⅰ)求22 列联表
x ,y ,A ,B
中的数据的值;
(Ⅱ)能够有多大把握认为疫苗有效?
【答案】(Ⅰ)10
y=,40
B=,40
x=,60
A=.(Ⅱ)至少有99.9%的把握认为疫苗有效.
【名师点睛】
1.独立性检验是对两个变量有关系的可信程度的判断,而不是对其是否有关系的判断.
2.独立性检验得出的结论是带有概率性质的,只能说结论成立的概率有多大,而不能完全肯定一个结论,因此才出现了临界值表.在分析问题时一定要注意这点,不可对某个问题下确定性结论,否则就可能对统计计算的结果做出错误的解释.
重点2:独立性检验与概率交汇综合问题
【要点解读】
在近几年高考中统计案例与概率结合的解答题所占比例较往年有所增加,重点考查回归直线方程的求解和应用、独立性检验及概率的知识,注重考查考生对相关数据的统计、分析与应用的能力,此类试题一般为中档题.
【考向】独立性检验与概率交汇综合问题
【例题】【2016吉林长春质量监测二】近年来我国电子商务行业迎来篷布发展的新机遇,2015年双11期间,某购物平台的销售业绩高达918亿人民币.与此同时,相关管理部门也推出了针对电商的商品和服务的评价体系.现从评价系统中选出
200次成功的交易,并对其评价进行统计,对商品的好评率为3
5
,对服务的好评率为
3
4
,其中对商品和服务都做出好评的交易为80次. (1)是否可以在犯错误概率不超过0.1%的前提下,认为商品好评与服务好评有关?
(2)若针对商品的好评率,采用分层抽样的方式从这200次交易中取出5次交易,并从中选择两次交易进行客户回访,求只有一次好评的概率.
2()0.150.100.050.0250.0100.0050.001
2.072 2.706
3.841 5.024 6.6357.87910.828
P K k k ≥
(22
()()()()()
n ad bc K a b c d a c b d -=++++,其中n a b c d =+++)
【答案】(1) 可以在犯错误概率不超过0.1%的前提下,认为商品好评与服务好
评有关.(2) 3
5
.
【解析】(1) 由题意可得关于商品和服务评价的22⨯列联表:
2
2
200(80104070)11.11110.8281505012080
K ⨯⨯-⨯=≈>⨯⨯⨯,
可以在犯错误概率不超过0.1%的前提下,认为商品好评与服务好评有关.
【名师点睛】
独立性检验与概率交汇综合问题解题模板:。