32独立性检验的基本思及其初步应用

合集下载

高中数学必修2-3第三章3.2独立性检验的基本思想及其初步应用讲解

高中数学必修2-3第三章3.2独立性检验的基本思想及其初步应用讲解

3.2独立性检验的基本思想及其初步应用1.问题导航(1)分类变量的概念是什么?什么是列联表?什么是2×2列联表?(2)等高条形图的优点是什么?如何利用等高条形图判断两个变量之间的关系?(3)独立性检验的概念是什么?怎样进行独立性检验?2.例题导读例1是利用等高条形图和K2值的计算判断秃顶与患心脏病是否有关,请试做教材P97练习.1.分类变量和列联表(1)分类变量变量的不同“值”表示个体所属的_______不同类别,像这样的变量称为分类变量.(2)列联表①定义:列出的两个分类变量的_______频数表称为列联表.②2×2列联表一般地,假设有两个分类变量X和Y,它们的取值分别为_______{x1,x2_______}和_______{y1,y2.2.等高条形图(1)等高条形图与表格相比,更能直观地反映出两个分类变量间是否_______相互影响,常用等高条形图展示列联表数据的_______频率特征.(2)观察等高条形图发现aa+b和cc+d相差很大,就判断两个分类变量之间_______有关系.3.独立性检验(1)定义利用随机变量K2来判断“两个分类变量有关系”的方法称为独立性检验.(2)K2=_______n(ad-bc)2(a+b)(c+d)(a+c)(b+d),其中n=a+b+c+d为样本容量.(3)独立性检验的具体做法①根据实际问题的需要确定容许推断“两个分类变量有关系”犯错误概率的上界α,然后查表确定_______临界值k0.②利用公式计算随机变量K2的_______观测值k.③如果_______k≥k0,就推断“X与Y有关系”,这种推断犯错误的概率不超过α,否则,就认为在_______犯错误的概率不超过α的前提下不能推断“X与Y有关系”,或者在样本数据中_______没有发现足够证据支持结论“X与Y有关系”.1.判断(对的打“√”,错的打“×”)(1)列联表中的数据是两个分类变量的频数.()(2)事件A与B的独立性检验无关,即两个事件互不影响.()(3)K2的大小是判断事件A与B是否相关的统计量.()答案:(1)√(2)×(3)√2.在研究两个分类变量之间是否有关时,可以粗略地判断两个分类变量是否有关的是()A.散点图B.等高条形图C.2×2列联表D.以上均不对答案:B3.分类变量X和则下列说法中正确的是()A.ad-bc越小,说明X与Y关系越弱B.ad-bc越大,说明X与Y关系越强C.(ad-bc)2越大,说明X与Y关系越强D.(ad-bc)2越接近于0,说明X与Y关系越强答案:C4.若由一个2×2列联表中的数据计算K2的观测值k=4.013,那么在犯错误的概率不超过________的前提下认为两个变量有关系.答案:0.05详析独立性检验(1)独立性检验是对两个分类变量有关系的可信程度的判断,而不是对其是否有关系的判断.独立性检验的结论只能是有多大的把握认为两个分类变量有关系,而不能是两个分类变量一定有关系或没有关系.(2)列联表中的数据是样本数据,它只是总体的代表,具有随机性,因此,独立性检验得出的结论是带有概率性质的,只能说结论成立的概率有多大,而不能完全肯定一个结论.(3)独立性检验原理:在假设H0下,如果出现一个与H0相矛盾的小概率事件,就推断H0不成立,且该推断犯错误的概率不超过这个小概率.等高条形图的应用(2015·青岛高二检测)某学校对高三学生作了一项调查发现:在平时的模拟考试中,性格内向的学生426人中332人在考前心情紧张,性格外向的学生594人中有213人在考前心情紧张,作出等高条形图,利用图形判断考前心情紧张与性格类别是否有关系.[解]作列联表如下:相应的等高条形图如图所示:图中阴影部分表示考前心情紧张与考前心情不紧张中性格内向的比例,从图中可以看出考前心情紧张的样本中性格内向占的比例比考前心情不紧张样本中性格内向占的比例大,可以认为考前紧张与性格类别有关.利用等高条形图判断两个分类变量是否相关的步骤1.(1)观察下列各图,其中两个分类变量X,Y之间关系最强的是()解析:选D.在四幅图中,D图中两个阴影条的高度相差最明显,说明两个分类变量之间的关系最强.(2)在一次恶劣气候的飞行航程中,调查男女乘客在机上晕机的情况如下表所示,据此解:由数据的列联表可以得到等高条形图为:从图中可以发现男性中晕机的频率与女性中晕机的频率相差较大,故我们认为性别和是否晕机有关系,且在恶劣气候飞行中男性比女性更容易晕机.独立性检验(2014·高考辽宁卷节选)某大学餐饮中心为了解新生的饮食习惯,在全校一年级学根据表中数据,问是否有95%的把握认为“南方学生和北方学生在选用甜品的饮食习惯方面有差异”.[解]将2×2列联表中的数据代入公式计算,得K2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d)=100×(60×10-20×10)2 70×30×80×20=10021≈4.762.因为4.762>3.841,所以有95%的把握认为“南方学生和北方学生在选用甜品的饮食习惯方面有差异”.解决独立性检验问题的基本步骤:(1)根据已知的数据作出列联表.(2)作出相应的等高条形图,可以利用图形做出相应判断.(3)求K2的观测值.(4)判断可能性:与临界值比较,得出事件有关的可能性大小.2.(1)为了探究学生选报文、理科是否与对外语的兴趣有关,某同学调查了361名高二在校学生,调查结果如下:理科对外语有兴趣的有138人,无兴趣的有98人,文科对外语有兴趣的有73人,无兴趣的有52人.分析学生选报文、理科与对外语的兴趣是否有关?解:列出2×2列联表代入公式得K 2的观测值k =361×(138×52-73×98)2236×125×211×150≈1.871×10-4.∵1.871×10-4<2.706,∴可以认为学生选报文、理科与对外语的兴趣无关. (2)①这种传染病是否与饮用水的卫生程度有关,请说明理由;②若饮用干净水得病5人,不得病50人,饮用不干净水得病9人,不得病22人.按此样本数据分析这种疾病是否与饮用水有关,并比较两种样本在反映总体时的差异.解:①假设H 0:传染病与饮用水无关,把表中数据代入公式得K 2=830×(52×218-466×94)2146×684×518×312≈54.21,∵54.21>10.828,所以拒绝H 0.因此我们有99.9%的把握认为该地区这种传染病与饮用不干净水有关. ②依题意得2×2列联表:此时,K 2的观测值k =86×(5×22-50×9)214×72×55×31≈5.785.由于5.785>5.024,所以我们有97.5%的把握认为该种疾病与饮用不干净水有关.两个样本都能统计得到传染病与饮用不干净水有关这一相同结论,但①中我们有99.9%的把握肯定结论的正确性.②中我们只有97.5%的把握肯定.(本题满分12分)调查某医院某段时间内婴儿出生的时间与性别的关系,得到下面的数据:出生时间在晚上的男婴为24人,女婴为8人;出生时间在白天的男婴为31人,女婴为26人.(1)将下面的2×2(2)能否在犯错误的概率不超过0.1的前提下认为婴儿性别与出生时间有关系? [解] (1)4分(2)由所给数据计算K 2的观测值 k =89×(24×26-31×8)255×34×32×57≈3.689>2.706.8分根据临界值表知P (K 2≥2.706)≈0.10.9分因此在犯错误的概率不超过0.1的前提下认为婴儿的性别与出生的时间有关系.12分 [规范与警示] (1)解答过程中的表格经常因为不认真仔细,把数据填写错误,会直接导致总计出错,也会导致k值求错,另外在利用公式求K2的观测值时经常因为公式用错,数据代入计算错误,而使得独立性检验出错.(2)在解答独立性检验题目中,数据有时比较多,一定不要混淆,要分辨清楚,否则会影响解题的下一步,如本例2×2列联表中数据极易混淆.(3)计算中,有时公式复杂,要记忆准确,同时计算不能失误,如K2的公式很复杂,计算中也不要粗心.1.对于分类变量X与Y的随机变量K2的观测值k,下列说法正确的是()A.k越大,“X与Y有关系”的可信程度越小B.k越小,“X与Y有关系”的可信程度越小C.k越接近于0,“X与Y没有关系”的可信程度越小D.k越大,“X与Y没有关系”的可信程度越大解析:选B.k越大,“X与Y没有关系”的可信程度越小,则“X与Y有关系”的可信程度越大,k越小,“X与Y有关系”的可信程度越小.2.下面是调查某地区男女中学生喜欢理科的等高条形图,阴影部分表示喜欢理科的百分比,从图中可以看出()A.性别与喜欢理科无关B.女生中喜欢理科的比为80%C.男生比女生喜欢理科的可能性大些D.男生不喜欢理科的比为60%解析:选C.由图知女生中喜欢理科的比为20%,男生不喜欢理科的比为40%,故B、D 不正确.由图知,男生比女生喜欢理科的可能性大些.3.某电视台在一次对收看文艺节目和新闻节目观众的抽样调查中,随机抽取了100名由表中数据直观分析,收看新闻节目的观众与年龄________.(填“有关”或“无关”) 解析:因为在20至40岁的58名观众中有18名观众收看新闻节目,而大于40岁的42名观众中有27名观众收看新闻节目,即b a +b =1858,d c +d =2742,两者相差较大,所以,经直观分析,收看新闻节目的观众与年龄有关.答案:有关4.高中流行这样一句话“文科就怕数学不好,理科就怕英语不好”.下表是一次针对高三文科学生的调查所得的数据.(1)计算a ,(2)文科学生总成绩不好与数学成绩不好有关系吗? 解:(1)由478+a =490,得a =12. 由a +24=c ,得c =12+24=36. 由b +c =913,得b =913-36=877. (2)计算随机变量K 2的观测值:k =913×(478×24-399×12)2490×423×877×36≈6.233>5.024,∵P (k ≥5.024)≈0.025,∴在犯错误的概率不超过0.025的前提下,认为文科学生总成绩不好与数学成绩不好有关系.[A.基础达标]1.下面是2×2则表中a ,b 的值分别为A .94,72 B .52,50 C .52,74 D .74,52 解析:选C.根据列联表的特点,可知:⎩⎪⎨⎪⎧a +21=73,a +22=b ,解得⎩⎪⎨⎪⎧a =52,b =74. 2.下列关于等高条形图的叙述正确的是( )A .从等高条形图中可以精确地判断两个分类变量是否有关系B .从等高条形图中可以看出两个变量频数的相对大小C .从等高条形图中可以粗略地看出两个分类变量是否有关系D .以上说法都不对解析:选C.在等高条形图中仅能粗略判断两个分类变量的关系,故A 错.在等高条形图中仅能够找出频率,无法找出频数,故B 错.3.在研究打鼾与患心脏病之间的关系中,通过收集数据、整理分析数据得到“打鼾与患心脏病有关”的结论,并且在犯错误的概率不超过0.01的前提下认为这个结论是成立的.下列说法中正确的是( )A .100个心脏病患者中至少有99人打鼾B .1个人患心脏病,则这个人有99%的概率打鼾C .100个心脏病患者中一定有打鼾的人D .100个心脏病患者中可能一个打鼾的人都没有解析:选D.这是独立性检验,犯错误的概率在不超过0.01的前提下认为“打鼾与患心脏病有关”.这只是一个概率,即打鼾与患心脏病有关的可能性为99%.根据概率的意义可知答案应选D.4.为了解高中生作文成绩与课外阅读量之间的关系,某研究机构随机抽取了60名高中由以上数据,计算得到K 的观测值k ≈9.643,根据临界值表,以下说法正确的是( ) A .没有充足的理由认为课外阅读量大与作文成绩优秀有关 B .有0.5%的把握认为课外阅读量大与作文成绩优秀有关 C .有99.9%的把握认为课外阅读量大与作文成绩优秀有关D.有99.5%的把握认为课外阅读量大与作文成绩优秀有关解析:选D.根据临界值表,9.643>7.879,在犯错误的概率不超过0.005的前提下,认为课外阅读量大与作文成绩优秀有关,即有99.5%的把握认为课外阅读量大与作文成绩优秀有关.5.对两个分类变量A、B的下列说法中正确的个数为()①A与B无关,即A与B互不影响;②A与B关系越密切,则K2的值就越大;③K2的大小是判定A与B是否相关的唯一依据A.1 B.2C.3 D.0解析:选A.①正确,A与B无关即A与B相互独立;②不正确,K2的值的大小只是用来检验A与B是否相互独立;③不正确,也可借助等高条形图等.故选A.6.独立性检验所采用的思路是:要研究X,Y两个分类变量彼此相关,首先假设这两个分类变量彼此________,在此假设下构造随机变量K2.如果K2的观测值较大,那么在一定程度上说明假设________.解析:独立性检验的前提是假设两个分类变量无关系,然后通过随机变量K2的观测值来判断假设是否成立.答案:无关系不成立7.在吸烟与患肺病是否相关的判断中,有下面的说法:①若K2的观测值k>6.635,则在犯错误的概率不超过0.01的前提下,认为吸烟与患肺病有关系,那么在100个吸烟的人中必有99人患有肺病;②从独立性检验可知在犯错误的概率不超过0.01的前提下,认为吸烟与患肺病有关系时,若某人吸烟,则他有99%的可能患有肺病;③从独立性检验可知在犯错误的概率不超过0.05的前提下,认为吸烟与患肺病有关系时,是指有5%的可能性使得推断错误.其中说法正确的是________.解析:K2是检验吸烟与患肺病相关程度的量,是相关关系,而不是确定关系,是反映有关和无关的概率,故说法①不正确;说法②中对“确定容许推断犯错误概率的上界”理解错误;说法③正确.答案:③8根据上述数据分析,我们得出的K 的观测值k 约为________. 解析:由公式可计算得k =102×(27×29-34×12)239×63×61×41≈2.334.答案:2.3349.某生产线上,质量监督员甲在生产现场时,990件产品中有合格品982件,次品8件;不在生产现场时,510件产品中有合格品493件,次品17件.试利用列联表和等高条形图判断监督员甲在不在生产现场对产品质量好坏有无影响.解:根据题目所给数据得如下2×2列联表:∵ad -bc =982×17-8×493=12 750,|ad -bc |比较大,说明甲在不在生产现场与产品质量好坏有关系.相应的等高条形图如图所示.图中两个阴影部分的高分别表示甲在生产现场和甲不在生产现场时样品中次品数的频率.从图中可以看出,甲不在生产现场时样本中次品数的频率明显高于甲在生产现场时样本中次品数的频率.因此可以认为质量监督员甲在不在生产现场与产品质量好坏有关系.10.研究人员选取170名青年男女大学生作为样本,对他们进行一种心理测验,发现60名女生对该心理测验中的最后一个题目的反应是:作肯定的有22名,作否定的有38名;110名男生在相同的题目上作肯定的有22名,作否定的有88名,问:性别与态度之间是否存在某种关系?试用独立性检验的方法判断.解:根据题意,得如下2×2列联表:根据列联表中的数据,得k=170×(22×38-22×88)2110×60×44×126≈5.622>5.024,所以可以在犯错误的概率不超过0.025的前提下认为“性别与态度有关”.[B.能力提升]1.假设有两个分类变量X和Y,它们的取值分别为{x1,x2}和{y1,y2},其2×2列联表如下:对于以下数据,对同一样本能说明X与Y有关的可能性最大的一组为()A.a=5,b=4,c=3,d=2B.a=5,b=3,c=4,d=2C.a=2,b=3,c=4,d=5D.a=2,b=3,c=5,d=4解析:选D.对于A,|ad-bc|=|10-12|=2;对于B,|ad-bc|=|10-12|=2;对于C,|ad-bc|=|10-12|=2;对于D,|ad-bc|=|8-15|=7.2.有两个分类变量X,Y,其一组的列联表如下所示,其中a,15-a均为大于50.05的前提下认为X,Y有关,则a 的值为( )A .8B .9C .8,9D .6,8解析:选 C.根据公式,得K 2的观测值k =65×[a (30+a )-(15-a )(20-a )]220×45×15×50=13×(13a -60)220×45×3×2>3.841,根据a >5且15-a >5,a ∈Z ,求得a =8,9满足题意.3.某高校“统计初步”课程的教师随机调查了选该课的一些学生情况,具体数据如下表:K 2的观测值:k =50×(13×20-10×7)223×27×20×30≈4.844>3.841.因此,判定主修统计专业与性别有关系,那么这种判断出错的概率为________. 解析:根据k >3.841,可判断在犯错误的概率不超过0.05的前提下,认为主修统计专业与性别有关系.故出错的概率为0.05.答案:0.054试说明心理障碍与性别的关系:________. 解析:由表可知,a =10,b =20,c =10,d =70,a +b =30,c +d =80,a +c =20,b +d =90,n =110,ad =700,bc =200, 把以上数值代入K 2=n (ad -bc )2(a +b )(c +d )(a +c )(b +d )=110×(700-200)230×80×20×90≈6.365 7.因为6.365 7>5.024,所以在犯错误的概率不超过0.025的前提下认为心理障碍与性别有关系.答案:在犯错误的概率不超过0.025的前提下认为心理障碍与性别有关系5.某学生对其30位亲属的饮食习惯进行了一次调查,并用茎叶图表示30人的饮食指数,如图所示.(说明:图中饮食指数低于70的人,饮食以蔬菜为主;饮食指数大于等于70的人,饮食以肉类为主.)(1)根据茎叶图,帮助这位同学说明其30位亲属的饮食习惯; (2)(3)能否在犯错误的概率不超过0.010的前提下认为“其亲属的饮食习惯与年龄有关”?并写出简要分析.解:(1)30位亲属中50岁以上的人饮食多以蔬菜为主,50岁以下的人饮食多以肉类为主.(2)列联表如表所示:(3)K 2=30×(4×2-8×16)212×18×20×10=10>6.635,所以在犯错误的概率不超过0.010的前提下认为“其亲属的饮食习惯与年龄有关”. 6.为调查某地区老年人是否需要志愿者提供帮助,用简单随机抽样方法从该地区调查了500(1)估计该地区老年人中,需要志愿者提供帮助的老年人的比例;(2)能否在犯错误的概率不超过0.010的前提下认为该地区的老年人是否需要志愿者提供帮助与性别有关?(3)根据(2)的结论,能否提出更好的调查方法来估计该地区的老年人中,需要志愿者提供帮助的老年人的比例?说明理由.附:K 2=n (ad -bc )(a +b )(c +d )(a +c )(b +d ).解:(1)调查的500位老年人中有70位需要志愿者提供帮助,因此该地区老年人中,需要帮助的老年人的比例的估计值为70500×100%=14%.(2)K 2的观测值k =500×(40×270-30×160)2200×300×70×430≈9.967.由于9.967>6.635,所以在犯错误的概率不超过0.010的前提下认为该地区的老年人是否需要帮助与性别有关.(3)由(2)的结论知,该地区老年人是否需要帮助与性别有关,并且从样本数据能看出该地区男性老年人与女性老年人中需要帮助的比例有明显差异,因此在调查时,先确定该地区老年人中男、女的比例,再把老年人分成男、女两层并采用分层抽样方法比采用简单随机抽样方法更好.。

第三章--统计案例-3.2-独立性检验的基本思想及其初步应用

第三章--统计案例-3.2-独立性检验的基本思想及其初步应用

解:由列联表中的数据,得 K2 的观测值为 1 633×30×1 355-224×242 k= ≈68.033>10.828. 254×1 379×54×1 579 因此,在犯错误的概率不超过 0.001 的前提下,认为每 一晚都打鼾与患心脏病有关.
为了调查某生产线上,某质量监督员甲对产
品质量好坏有无影响,现统计数据如下:质量监督员在现 场时,990件产品中合格品为 982 件,次品数为 8 件,甲不 在现场时,510件产品中合格品为493件,次品数为17件, 试分别用列联表、等高条形图、假设检验的方法对数据进
的方法来判断色盲与性别是否有关?你所得的结论在什么
范围内有效? 解:根据题目所给的数据作出如下的列联表: 色盲 不色盲 合计
男 女 合计
38 6 44
442 514 956
480 520 1 000
根据列联表作出相应的等高条形图,如图所示:
38 从等高条形图来看在男人中患色盲的比例480比在女人
38 6 6 中患色盲的比例520要大,其差值为480-520 ≈0.068,差
位统一,图形准确,但它不能给我们两个分类变量有关或
无关的精确的判断,若要作出精确的判断,可以进行独立 性检验的有关计算.
本题应首先作出调查数据的列联表,再根据列联表画
出等高条形图,并进行分析,ห้องสมุดไป่ตู้后利用独立性检验作出判 断.
在调查 480 名男士中有 38 名患有色盲, 520名女士中有6名患有色盲,分别利用图形和独立性检验


③如果 k≥k0 ,就推断“X与Y有关系”,这种推断
犯错误的概率不超过α;否则,就认为在犯错误的概 率不超过α的前提下不能推断“X与Y有关系”,或者 在样本数据中没有发现足够证据支持结论“X与Y有 关系”.

独立性检验的基本思想及其初步应用

独立性检验的基本思想及其初步应用

如果“吸烟与患肺癌没有关系”,那么吸烟样
本中不患肺癌的比例应该与不吸烟样本中相应的比
例差不多.
所以
a a+
b

c
c +d
,
所以 a c + d ca + b,
ad bc
即 ad bc 0.
︱ad-bc︱越小,说明吸烟与患肺癌之间的关系越弱;
︱ad-bc︱越大,说明吸烟与患肺癌之间的关系越强.
患心脏病 患其他病 总计
秃顶
214
175
389
不秃顶
451
597
1 048
总计
665
772
1 437
(1)相应的等高条形图如下所示,
不患心脏病 患心脏病
秃顶
不秃顶
由图可认为秃顶与患心脏病有关系
吸烟与患肺癌列联表(单位:人)
不患肺癌
患肺癌
总计
不吸烟
7 775
42
7 817
吸烟
2 099
49
2 148
总计
9 874
91
9 965
在不吸烟者中患肺癌的比重是__0_._5_4_%_,
在吸烟者中患肺癌的比重是__2_._2_8_%_.
说明:吸烟者和不吸烟者患肺癌的可能性存在差异, 吸烟者患肺癌的可能性大.
K2
(n ad bc)2
(a b)(c d )(a c)(b d )
临界值表:
P ( K 2 k 0 ) 0.50 0.40 0.25 0.15 0.10 0.05 0.025 0.010 0.005 0.001
k 0 0.455 0.708 1.323 2.072 2.706 3.841 5.024 6.635 7.879 10.828

《3.2独立性检验的基本思想及其初步应用》教学案5

《3.2独立性检验的基本思想及其初步应用》教学案5

《3.2独立性检验的基本思想及其初步应用》教学案5一.教学目标:1,理解独立性检验的基本思想; 2,理解独立性检验的实施步骤; 3,了解随机变量K 2的含义。

二.教学重点:理解独立性检验的基本思想实施步骤。

教学难点;1、理解独立性检验的基本思想及实施步骤2、了解随机变量K 2的含义。

三.知识链接独立性检验原理:四.新课学习1. 独立性检验的概念:利用随机变量2K 来确定在多大程度上可以认为“__________”的方法,称为两个分类变量的独立性检验。

2. 独立性检验的步骤:设有两个分类变量X 与Y ,他们的取值分别为 和 其样本频数列联表(称2⨯2列联表)为:引入随机变量2K , ____________________2=K ,(其中d c b a n +++=为样本容量)推断X 与Y 有关系可按下列步骤进行: (1)假设0H : X 与Y 没有关系(2)根据实际问题的需要确定容许推断“两个分类变量有关系”犯错误概率的上界a ,然后查表1-11确定临界值o k(3)利用公式(1),计算随机变量2K 的观测值k 。

(4)如果,就判断“X 与Y 有关系”,这种判断犯错误的概率不超过a ,否则,就认为在犯错误的概率不超过a 的前提下不能推断“X 与Y 有关系”,或则在样本数据中没有发现足够证据支持结论“X 与Y 有关系”,3. 为了使不同样本容量的数据有统一的评判标准,我们利用统计量2K 的观测值k来判断x 与y 有关系的程度。

如果828.10>k ,就有_____的把握认为“x 与y 有关系”; 如果879.7>k ,就有_____的把握认为“x 与y 有关系”; 如果_____>k ,就有99%的把握认为“x 与y 有关系”; 如果_____>k ,就有97.5%的把握认为“x 与y 有关系”;如果841.3>k ,就有_____的把握认为“x 与y 有关系”; 如果706.2>k ,就有_____的把握认为“x 与y 有关系”; 如果706.2≤k,就认为没有充分证据显示“x 与y 有关系” 。

32独立性检验的基本思想及其初步应用精品文档

32独立性检验的基本思想及其初步应用精品文档

由公式计算得 K2 的观测值 k=2 428000××18702×0×8010-00902×0×1 2400002≈205.22. ………10 分 因为 205.22>10.828,因此在犯错误的概率不超过 0.001 的前提下认为实施西部开发战略的公布对应届大学毕业生 的选择产生了影响. …………………………………………………………12 分
≈325.635.
因为 325.635>6.635,因此,在犯错误的概率不超过 0.01
的前提下认为官员在经济上是否清廉与他们寿命的长短之
间是有关系的.
工具
第三章 统计案例
工具
第三章 统计案例
(2019·湖南高考)通过随机询问110名性别不同的大学生是否 爱好某项运动,得到如下的列联表:
男 女 总计
肠道中有寄生 虫
肠道中没有寄生 虫
合计
每晚都磨牙
224
30
254
不磨牙
24
1 355
1 379
合计
248
1 385
1 633
工具
第三章 统计案例
解析: 根据题意计算得 K2=a+bcn+add-ab+cc2b+d
=1
633×224×1 355-30×242 254×1 379×248×1 385
成绩不小于90分 70 75 145
合计 100 100 200
据此资料是否认为男生比女生成绩差.
工具
第三章 统计案例
工具
第三章 统计案例
[解题过程] 根据列联表中数据,由公式计算得 K2=20505××3104×5×751-002×5×107002≈0.627 ∵0.627<2.706,所以据目前的数据不能认为男生比女 生成绩差,即没理由说男生比女生成绩差.

293.2独立性检验的基本思想及其初步应用

293.2独立性检验的基本思想及其初步应用

3.2独立性检验的基本思想及其初步应用(1)教材分析本节内容是数学选修2-3第三章统计案例的其次节,是在学习了回来分析的基本思想及其初步应用的学问后,对统计案例的再学习.可以看作是与前面学习过的相关关系的并列学问,是统计案例的另一类体现.在统计学中,独立性检验就是检验两个分类变量是否有关系的一种统计方法.在探讨两个分类变量关系时,要把重点放在独立性检验的统计学原理上,使学生初步驾驭独立性检验的基本步骤,体会独立性检验的基本思想.独立性检验的步骤是相对固定的,仿照教科书的例题,学生不难完成书后的习题,但独立性检验的统计思想对学生来说是比较难理解的,所以在教学中结合例题介绍独立性检验的思想是特别重要的,要求特殊留意学生思维的严密性品质的培育.课时安排本节内容用3课时完成,这是第1节,主要讲解独立性检验的基本思想及实施步骤.教学目标重点:理解独立性检验的基本思想及实施步骤.难点:了解独立性检验的基本思想;了解随机变量/的含义.学问点:独立性检验的解题步骤.实力点:正确理解独立性检验的基本思想.教化点:通过大量的实例,体会探究的乐趣,激发学生的学习热忱.自主探究点:如何利用求出的数据正确解读分类变量的关系.考试点:独立性检验的解题步骤.易错易混点:反证法和独立性检验的区分.拓展点:完成思索的解答后,引导学生总结独立性检验的基本思想.教具打算多媒体课件、三角板课堂模式学案导学一、引入新课【师生活动】师:为探讨吸烟是否对患肺癌有影响,某肿瘤探讨所随机地调查了9965人,得到如下结果(单位:人)表1那么吸烟是否对患肺癌有影响?生:探讨回答.师:要想解决这个问题,这就须要了解假设检验的基本原理.我们这节课就来学习一种假设检验一一独立性检验的基本思想及其初步应用.【设计意图】通过实例,引出独立性检验的原理,假设检验.既激发了学生的学习热忱,又让学生体会到学习数学的好用性.二、探究新知1、分类变量:对于性别变量,其取值为男和女两种.这种变量的不同“值”表示个体所属的不同类别,像这样的变量称为分类变量.在现实生活中,分类变量是大量存在的,例如是否吸烟,宗教信仰,国籍,产品等级,是否喜爱数学,等等.2、列联表:像表1这样列出的两个分类变量的频数表,称为列联表.师:从表格中的数据能反映出两个分类变量间是否相互影响? 生:不是很明显.师:图形更能直观地反映出两个分类变量间是否相互影响,常用等富条形图展示列联表数据的频率特征.【设计意图】通过问题来引导学生明确:等高条形图可以直观反映出两个分类变量间是否相互影响,过渡自然,顺理成章.3、等高条形图【师生活动】师:图1就是一个等高条形图,其中两个浅色条的高分别表示吸烟和不吸烟样本中不患肺癌的频率;两个深色条的高分别表示吸烟和不吸烟样本中患肺癌的频率.我们能有什么结论?生:在吸烟样本中患肺癌的频率要高一些,因此直观上可以认为吸烟更简洁引发肺癌.【设计意图】通过提问,要学生明确后续学问学习的必要性,对引出下一个问题起到很好的铺垫.4、独立性检验我们先假设 H 0:吸烟与患肺癌没有关系,把表1中的数字用字母代替,得到表2表2不患肺癌患肺癌 总计不吸烟 a b a+b 吸烟 C d c+d总计a+c b+dα+6+c+d为了使不同样本容量的数据有统•的评判标准,我们构造一个随机变量κι= ________M d-be? ________ (a+b)(c÷d){a+c)(b+d)'其中〃=α+8+c+d 为样本容量.若HO 成立,即“吸烟与患肺癌没有关系”,则K2应当很小.依据表1的数据,计算得K2的观测值为II 不患肺癌患肺癌2k_9965×(7775×49-42×2099)≈56.632.7817×2148×9874×91统计学家经过探讨发觉,在HO成立的状况下,P(∕C2≥6.635)≈0.010.即在HO成立的状况下,K?的观测值大于6.635的概率特别小,近似为0.010,是一个小概率事务.现在K2的观测值&≈56.632,远远大于6.635,所以有理由断定HO不成立,即认为“吸烟与患肺癌有关系”.但这种推断会犯错误,犯错误的概率不会超过0.010.上面这种利用随机变量K?来推断“两个分类变量”的方法称为独立性检验.【设计意图】通过吸烟与患肺癌之间的关系的探讨过程体现了假设检验的思想,其目的是让学生通过实例初步体会一下假设检验的思想.可以从反证法的思想说明上面介绍的假设检验原理.表3(1)依据实际问题的须要确定容许推断“两个分类变量有关系”犯错误的上界α,然后查表确定临界值即.(2)利用公式(1),计算随机变量K?的观测值h(3)假如Z≥%,就推断“两个分类变量有关系”,这种推断犯错误的概率不超过α;否则,就认为在犯错误的概率不超过。

3.2独立性检验的基本思想及其初步应用

3.2独立性检验的基本思想及其初步应用

k2≥6.635
4.某班主任对全班50名学生进行了作业量多 少的调查,数据如下表: 认为作业多 玩游戏 不玩游戏 总 计 18 8 26 认为作业不多 总计 9 15 24 27 23 50
则认为喜欢玩游戏与认为作业量多少有关系的 把握大约为( B ) A. 99% B. 97.5% C. 90% D.无充分依据
2. 下面是一个
2 2
21 25 46
列联表 总计
不健康 健 康
不优秀 a 优 秀 2 总 计 b
73 27 100
则表中a,b的值分别是( c ) A. 94,96 B. 52,50 C. 52,54 D. 54,52
3. 在独立性检验中,当统计量满足 时, 我们有99%的把握认为这两个分类变量有 关系.
枣庄市第十八中学
主讲人 秦真
一、目标展示
1、了解独立性检验的基本思想、方法及其初 步应用。 2、会从列联表(只要求2×2列联表)、条形 图直观分析两个分类变量是否有关
3.会用公式判断两个分类变量在某种程度上的 相关性
问题: 数学家庞加莱每天都从一家
面包店买一块1000g 的面包,并记 录下买回的面包的实际质量。一年 后,这位数学家发现,所记录数据 的均值为950g。于是庞加莱推断这 家面包店的面包分量不足。
思想方法上: 数形结合的思想, 类比的思想
作业:教材习题3.2 1,2
当堂达标
1.在吸烟与患肺病这两个分类变量的计算中,下 列说法正确的是 ( c ) A. 若k=6.635,则有99%的把握认为吸烟与患肺病 有关,那么100名吸烟者中,有99个患肺病. B. 从独立性检验可知,有99%的把握认为吸烟与 患肺病有关时,可以说某人吸烟,那么他有99%的可 能性患肺病. C. 若从统计量中求出有95%的把握认为吸烟与患 肺病有关,是指有5%的可能性使推断出现错误. D. 以上三种说法都不对.

29-3.2独立性检验的基本思想及其初步应用(1)

29-3.2独立性检验的基本思想及其初步应用(1)

3.2 独立性检验的基本思想及其初步应用(1)教材分析本节内容是数学选修2-3 第三章统计案例的第二节,是在学习了回归分析的基本思想及其初步应用的知识后,对统计案例的再学习.可以看作是与前面学习过的相关关系的并列知识,是统计案例的另一类体现.在统计学中,独立性检验就是检验两个分类变量是否有关系的一种统计方法.在讨论两个分类变量关系时,要把重点放在独立性检验的统计学原理上,使学生初步掌握独立性检验的基本步骤,体会独立性检验的基本思想.独立性检验的步骤是相对固定的,仿照教科书的例题,学生不难完成书后的习题,但独立性检验的统计思想对学生来说是比较难理解的,所以在教学中结合例题介绍独立性检验的思想是十分重要的,要求特别注重学生思维的严密性品质的培养.课时分配本节内容用3课时完成,这是第1节,主要讲解独立性检验的基本思想及实施步骤.教学目标重点: 理解独立性检验的基本思想及实施步骤.K的含义.难点:了解独立性检验的基本思想;了解随机变量2知识点:独立性检验的解题步骤.能力点:正确理解独立性检验的基本思想.教育点:通过大量的实例,体会探究的乐趣,激发学生的学习热情.自主探究点:如何利用求出的数据正确解读分类变量的关系.考试点:独立性检验的解题步骤.易错易混点:反证法和独立性检验的区别.拓展点:完成思考的解答后,引导学生总结独立性检验的基本思想.教具准备多媒体课件、三角板课堂模式学案导学一、引入新课【师生活动】师:为研究吸烟是否对患肺癌有影响,某肿瘤研究所随机地调查了9965人,得到如下结果(单位:人)表1 吸烟与患肺癌列联表生:讨论回答.师:要想解决这个问题,这就需要了解假设检验的基本原理.我们这节课就来学习一种假设检验——独立性检验的基本思想及其初步应用.【设计意图】通过实例,引出独立性检验的原理,假设检验.既激发了学生的学习热情,又让学生体会到学习数学的实用性.二、探究新知1、分类变量:对于性别变量,其取值为男和女两种. 这种变量的不同“值”表示个体所属的不同类别,像这样的变量称为分类变量.在现实生活中,分类变量是大量存在的,例如是否吸烟,宗教信仰,国籍,产品等级,是否喜欢数学,等等.2、列联表:像表1这样列出的两个分类变量的频数表,称为列联表. 师:从表格中的数据能反映出两个分类变量间是否相互影响? 生:不是很明显.师:图形更能直观地反映出两个分类变量间是否相互影响,常用等高条形图展示列联表数据的频率特征.【设计意图】通过问题来引导学生明确:等高条形图可以直观反映出两个分类变量间是否相互影响,过渡自然,顺理成章.3、等高条形图图1【师生活动】师:图1就是一个等高条形图,其中两个浅色条的高分别表示吸烟和不吸烟样本中不患肺癌的频率;两个深色条的高分别表示吸烟和不吸烟样本中患肺癌的频率.我们能有什么结论?生:在吸烟样本中患肺癌的频率要高一些,因此直观上可以认为吸烟更容易引发肺癌.【设计意图】通过提问,要学生明确后续知识学习的必要性,对引出下一个问题起到很好的铺垫. 4、独立性检验我们先假设 0H :吸烟与患肺癌没有关系, 把表1中的数字用字母代替,得到表2表222()()()()()n ad bc K a b c d a c b d -=++++,其中n a b c d =+++为样本容量.若0H 成立,即“吸烟与患肺癌没有关系”,则2K 应该很小 .根据表1的数据,计算得2K 的观测值为29965(777549422099)56.63278172148987491k ⨯⨯-⨯=≈⨯⨯⨯.统计学家经过研究发现,在0H 成立的情况下,2( 6.635)0.010P K ≥≈ .即在0H 成立的情况下,2K 的观测值大于6.635的概率非常小,近似为0.010,是一个小概率事件.现在2K 的观测值56.632k ≈,远远大于6.635,所以有理由断定0H 不成立,即认为“吸烟与患肺癌有关系”. 但这种判断会犯错误,犯错误的概率不会超过0.010.上面这种利用随机变量2K 来判断“两个分类变量”的方法称为独立性检验.【设计意图】通过吸烟与患肺癌之间的关系的讨论过程体现了假设检验的思想,其目的是让学生通过实例初步体会一下假设检验的思想.可以从反证法的思想解释上面介绍的假设检验原理. 表35、独立性检验的具体步骤(1)根据实际问题的需要确定容许推断“两个分类变量有关系”犯错误的上界α,然后查表确定临界值0k . (2)利用公式(1),计算随机变量2K 的观测值k .(3)如果0k k ≥,就推断“两个分类变量有关系”,这种推断犯错误的概率不超过α;否则,就认为在犯错误的概率不超过α的前提下不能推断“两个分类变量有关系”,或者在样本数据中,没有足够证据支持结论“两个分类变量有关系”.【设计意图】在介绍完独立性检验的思想以后,对独立性检验的具体实施步骤进行总结、归纳.为学生的下一步应用起到奠基的作用,对解决下面的例题有很大的帮助.三、理解新知判断两个分类变量有关系的思路1、等高条形图可以直观地判断出两个分类变量是否有关系,但是这种判断不可靠, 并且不能提供所得结论犯错误的概率.因此需要用独立性检验的方法来提供有用数据.2、独立性检验的具体步骤(1)根据实际问题的需要确定容许推断“两个分类变量有关系”犯错误的上界α,然后查表确定临界值0k . (2)利用公式(1),计算随机变量2K 的观测值k .(3)如果0k k ≥,就推断“两个分类变量有关系”,这种推断犯错误的概率不超过α;否则,就认为在犯错误的概率不超过α的前提下不能推断“两个分类变量有关系”,或者在样本数据中,没有足够证据支持结论“两个分类变量有关系”.【设计意图】为准确地运用新知,作必要的铺垫.培养学生的归纳概括能力.四、运用新知例1、某医院,因为患心脏病而住院的665名男性病人中,有214人秃顶;而另外772名不是患心脏病而住院的男性病人中,有175人秃顶.利用图形判断秃顶与患心脏病是否有关系.能否在犯错误的概率不超过0.010的前提下认为秃顶与患心脏病有关系?解 :根据题目所给数据得到如下列联表:表4 秃顶与患心脏病列联表图2相应的等高条形图如图2所示,可以看出秃顶样本中患心脏病的频率明显高于不秃顶样本中患心脏病的频率.因此可以认为秃顶与患心脏病有关系.根据列联表4中的数据,得到1437=16.373 6.635k ⨯⨯⨯≈>⨯⨯⨯2(214597-175451)3891048665772.因此,在犯错误的概率不超过0.010的前提下,认为秃顶与患心脏病有关系.【设计说明】教学中要先直观后计算,要注意引导学生运用已经学过的统计知识解决问题.解答中给出列联表,目的是复习列联表的制作.讲完例题解答后,需要向学生说明:在熟悉独立检验的基本原理后,可以通过直接计算2K 的观测值(不画等高条形图)来解决两个分类变量的独立性检验问题.但是,借助于图形可以更直观地向专业人士解释所得到的统计分析结果. 变式训练:在对人们的休闲方式的一次调查中,共调查了124人,其中女性70人,男性54人,女性中有43人主要的休闲方式是看电视,另外27人主要的休闲方式是运动;男性中有21人主要的休闲方式是看电视,另外33人主要的休闲方式是运动.(1)根据以上数据建立一个22⨯的列联表; (2)判断性别与休闲方式是否有关系. 答案:(2)因为,所以在犯错误的概率不超过0.025的前提下,认为休闲方式与性别有关系.五、课堂小结独立性检验的具体步骤(1)根据实际问题的需要确定容许推断“两个分类变量有关系”犯错误的上界α,然后查表确定临界值0k . (2)利用公式(1),计算随机变量2K 的观测值k .(3)如果0k k ≥,就推断“两个分类变量有关系”,这种推断犯错误的概率不超过α;否则,就认为在犯错误的概率不超过α的前提下不能推断“两个分类变量有关系”,或者在样本数据中,没有足够证据支持结论“两个分类变量有关系”.【设计意图】增强学生的归纳概括意识,培养学生整体看待问题的能力.通过课堂小结,加深学生对本节课所学内容的印象.六、布置作业1.阅读教材 P91—94;2.书面作业 教材P97 1 、2必做题:1. 研究人员选取170名青年男女大学生的样本,对他们进行一种心理测验,发现对该心理测中的最后一个题目的反应得以下数据:问:性别与态度之间是否存在某种关系?2. 在研究某种新措施对“非典”的防治效果问题时,得以下数据:试问新措施对防治防治“非典”是否有效?答案: 1. 22170(22421888) 2.158 3.8411106040130K ⨯⨯-⨯=≈<⨯⨯⨯,因此没有充分的证据显示“性别与态度有关” .2. 22300(1323611418)7.317 6.63524654150150K ⨯-⨯=≈>⨯⨯⨯,故在犯错误的概率不超过0.010的前提下,认为“新措施对防治非典有效” .选做题:某企业有两个分工厂生产某种零件,按规定内径尺寸(单位:mm )的值落在 [)29.94,30.06的零件为优质品. 从两个分厂生产的零件中各抽出500件,量其内径尺寸,的结果如下表: 甲厂:(2)由以上统计数据填写下面的22⨯列联表,并问是否有99﹪的把握认为“两个分厂生产的零件的质量有差异”.【设计意图】设计作业1,2,是引导学生先复习,再作业,培养学生良好的学习习惯.书面作业的布置,是为了让学生能够根据独立性检验的思想,算出随机变量2K 的观测值来解决简单的数学问题;并注意巩固独立性检验的步骤.选做题是2009辽宁文科高考题,本题涉及到统计的多个知识点,可以说是一个综合题,在统计这一模块中的高考题不是太多,一方面让学生了解一下题型,另一方面引起学生对统计知识的重视.七、教后反思本教案通过实例引入,在教学中,向学生介绍多个知识点;分类变量、列联表、等高条形图、独立性检验、独立性检验的步骤.在例1的教学中,要注重强调独立性检验的的重要性,要求学生会解释这里“犯错误的概率”,提高了学生的解题能力.八、板书设计。

独立性检验的基本思想及初步应用教案

独立性检验的基本思想及初步应用教案

独立性检验的基本思想及初步应用一、教学目标1. 让学生理解独立性检验的基本思想,掌握独立性检验的步骤和应用。

2. 培养学生运用独立性检验解决实际问题的能力,提高学生的数据分析素养。

3. 引导学生运用数学软件或计算器进行独立性检验,培养学生的操作能力。

二、教学内容1. 独立性检验的基本思想(1)理解独立性检验的定义和作用。

(2)掌握独立性检验的基本步骤:提出假设、构造检验统计量、确定显著性水平、计算临界值、做出结论。

2. 独立性检验的初步应用(1)学会运用独立性检验解决实际问题,如判断两个分类变量是否独立。

(2)学会运用数学软件或计算器进行独立性检验,提高数据分析能力。

三、教学重点与难点1. 教学重点:(1)独立性检验的基本思想及步骤。

(2)独立性检验在实际问题中的应用。

(3)运用数学软件或计算器进行独立性检验。

2. 教学难点:(1)独立性检验步骤中构造检验统计量的方法。

(2)如何正确选择显著性水平。

四、教学方法与手段1. 教学方法:(1)讲授法:讲解独立性检验的基本思想和步骤。

(2)案例教学法:分析实际问题,引导学生运用独立性检验。

(3)实践操作法:让学生运用数学软件或计算器进行独立性检验。

2. 教学手段:(1)多媒体课件:展示独立性检验的基本思想和步骤。

(2)数学软件或计算器:让学生进行实际操作。

五、教学过程1. 导入新课:通过一个实际问题引入独立性检验的概念,激发学生的兴趣。

2. 讲解独立性检验的基本思想:讲解独立性检验的定义、作用和基本步骤,让学生理解独立性检验的基本思想。

3. 案例分析:分析一个实际问题,引导学生运用独立性检验,体会独立性检验在解决实际问题中的应用。

4. 实践操作:让学生运用数学软件或计算器进行独立性检验,培养学生的操作能力。

5. 总结与反思:总结本节课的主要内容,让学生巩固所学知识,并思考如何更好地运用独立性检验解决实际问题。

六、教学拓展1. 引导学生探讨独立性检验在实际应用中的局限性,如样本量对检验结果的影响。

独立性检验的基本思想及其初步应用导学(谢成志)

独立性检验的基本思想及其初步应用导学(谢成志)

3.2独立性检验的基本思想及其初步应用【学习目标】通过典型案例的探究,了解独立性检验的基本思想,会对两个分类变量进行独立性检验,明确独立性检验的基本步骤,并能利用独立性检验的基本思想来解决实际问题。

【学习过程】问题的引入:为研究吸烟是否对患肺癌有影响,某肿瘤研究所随机地调查了9965人,得到如下结果(单位:人)吸烟与肺癌列联表 患肺癌 不患肺癌 总计 吸烟 49 2099 2148 不吸烟 42 7775 7817 总计9198749965那么吸烟是否对患肺癌有影响? 直观上来判断:在不吸烟的样本中,有_______%患肺癌;在吸烟的样本中,则有______% 由此,吸烟群体和不吸烟群体患肺癌的可能性存在差异.但,这种“差异”有多大呢?能够有一个评判的标准呢?我们可以通过以下的统计分析回答这个问题。

独立性检验:1、把上表中数字用字母代替,得到如下用字母表示的列联表:吸烟与肺癌列联表 不患肺癌 患肺癌 总计 吸烟 a b a+b 不吸烟 c d c+d 总计a+cb+da+b+c+d2、假设0H :吸烟与患肺癌没有关系那么吸烟样本中不患肺癌的比例应该与不吸烟样本中不患肺癌的比例差不多,即: __________________________________________因此:bcad -越小说明吸烟与患肺癌之间的关系______.反之,则_____3、计算2K为了使不同样本变量的数据有统一的评测标准,构造一个随机变量2K = _________________________________________________________ 其中_______________=n 为样本容量.从而,若0H 成立,即“吸烟与患肺癌没有关系”,则2K 应该_______,反之,2K 应该___________。

上题2K =56.632.这个值到底能告诉我们什么?能从中得到什么结论? 4、查表 P (2K >k0) 0.50 0.40 0.25 0.15 0.10 k0 0.4550.7081.3232.0722.706P (K2>k0) 0.05 0.025 0.010 0.005 0.001 k03.8415.0246.6357.87910.828上题中2K =56.632>10.828,所以001.0)828.10(2=>K P 该数据表明了在假设0H 成立的情况下,2K 的值大于10.828的概率非常小,为0.001,是一个小概率事件。

教学设计4:3.2 独立性检验的基本思想及其初步应用

教学设计4:3.2 独立性检验的基本思想及其初步应用

3.2独立性检验的基本思想及其初步应用教学目标1、知识与技能通过本节知识的学习,了解独立性检验的基本思想和初步应用,能对两个分类变量是否有关做出明确的判断。

明确对两个分类变量的独立性检验的基本思想具体步骤,会对具体问题作出独立性检验。

2、过程与方法在本节知识的学习中,应使学生从具体问题中认识进行独立性检验的作用及必要性,树立学好本节知识的信心,在此基础上学习三维柱形图和二维柱形图,并认识它们的基本作用和存在的不足,从而为学习下面作好铺垫,进而介绍K的平方的计算公式和K的平方的观测值R的求法,以及它们的实际意义。

从中得出判断“X与Y有关系”的一般步骤及利用独立性检验来考察两个分类变量是否有关系,并能较准确地给出这种判断的可靠程度的具体做法和可信程度的大小。

最后介绍了独立性检验思想的综合运用。

3、情感、态度与价值观通过本节知识的学习,首先让学生了解对两个分类博变量进行独立性检验的必要性和作用,并引导学生注意比较与观测值之间的联系与区别,从而引导学生去探索新知识,培养学生全面的观点和辨证地分析问题,不为假想所迷惑,寻求问题的内在联系,培养学生学习数学、应用数学的良好的数学品质。

加强与现实生活相联系,从对实际问题的分析中学会利用图形分析、解决问题及用具体的数量来衡量两个变量之间的联系,学习用图形、数据来正确描述两个变量的关系。

明确数学在现实生活中的重要作用和实际价值。

教学中,应多给学生提供自主学习、独立探究、合作交流的机会。

养成严谨的学习态度及实事求是的分析问题、解决问题的科学世界观,并会用所学到的知识来解决实际问题。

教学重点、难点教学重点:理解独立性检验的基本思想;独立性检验的步骤。

教学难点;1、理解独立性检验的基本思想;2、了解随机变量K2的含义;3、独立性检验的步骤。

教学策略教学方法:诱思探究教学法学习方法:自主探究、观察发现、合作交流、归纳总结。

教学手段:多媒体辅助教学教学过程:对于性别变量,其取值为男和女两种.这种变量的不同“值”表示个体所属的不同类别,像这类变量称为分类变量.在现实生活中,分类变量是大量存在的,例如是否吸烟,宗教信仰,国籍,等等.在日常生活中,我们常常关心两个分类变量之间是否有关系.例如,吸烟与患肺癌是否有关系?性别对于是否喜欢数学课程有影响?等等.为调查吸烟是否对肺癌有影响,某肿瘤研究所随机地调查了9965人,得到如下结果(单位:人)表3-7 吸烟与肺癌列联表那么吸烟是否对患肺癌有影响吗?像表3一7 这样列出的两个分类变量的频数表,称为列联表.由吸烟情况和患肺癌情况的列联表可以粗略估计出:在不吸烟者中,有0.54 %患有肺癌;在吸烟者中,有2.28%患有肺癌.因此,直观上可以得到结论:吸烟者和不吸烟者患肺癌的可能性存在差异.与表格相比,三维柱形图和二维条形图能更直观地反映出相关数据的总体状况.图3. 2 一1 是列联表的三维柱形图,从中能清晰地看出各个频数的相对大小.图3.2一2 是叠在一起的二维条形图,其中浅色条高表示不患肺癌的人数,深色条高表示患肺癌的人数.从图中可以看出,吸烟者中患肺癌的比例高于不吸烟者中患肺癌的比例.为了更清晰地表达这个特征,我们还可用如下的等高条形图表示两种情况下患肺癌的比例.如图3.2一3 所示,在等高条形图中,浅色的条高表示不患肺癌的百分比;深色的条高表示患肺癌的百分比.通过分析数据和图形,我们得到的直观印象是“吸烟和患肺癌有关”.那么我们是否能够以一定的把握认为“吸烟与患肺癌有关”呢?为了回答上述问题,我们先假设H0:吸烟与患肺癌没有关系.用A表示不吸烟,B表示不患肺癌,则“吸烟与患肺癌没有关系”独立”,即假设H0等价于P(AB)=P(A)+P(B) .把表3一7中的数字用字母代替,得到如下用字母表示的列联表:表3-8 吸烟与肺癌列联表在表3一8中,a恰好为事件AB发生的频数;a+b和a+c恰好分别为事件A和B发生的频数.由于频率近似于概率,所以在H0成立的条件下应该有a ab a cn n n++≈⨯, 其中n a b c d =+++为样本容量, (a+b+c+d )≈(a+b )(a+c ) , 即ad≈bc .因此,|ad -bc |越小,说明吸烟与患肺癌之间关系越弱;|ad -bc |越大,说明吸烟与患肺癌之间关系越强.为了使不同样本容量的数据有统一的评判标准,基于上面的分析,我们构造一个随机变量()()()()()22n ad bc K a b c d a c b d -=++++ (1) 其中n a b c d =+++为样本容量.若 H 0 成立,即“吸烟与患肺癌没有关系”,则 K “应该很小.根据表3一7中的数据,利用公式(1)计算得到 K “的观测值为()22996577754942209956.63278172148987491K ⨯-⨯=≈⨯⨯⨯,这个值到底能告诉我们什么呢?统计学家经过研究后发现,在 H 0成立的情况下,2( 6.635)0.01P K ≥≈. (2)(2)式说明,在H 0成立的情况下,2K 的观测值超过 6. 635 的概率非常小,近似为0 . 01,是一个小概率事件.现在2K 的观测值k ≈56.632 ,远远大于6. 635,所以有理由断定H 0不成立,即认为“吸烟与患肺癌有关系”.但这种判断会犯错误,犯错误的概率不会超过0.01,即我们有99%的把握认为“吸烟与患肺癌有关系” .在上述过程中,实际上是借助于随机变量2K 的观测值k 建立了一个判断H 0是否成立的规则:如果k ≥6. 635,就判断H 0不成立,即认为吸烟与患肺癌有关系;否则,就判断H 0成立,即认为吸烟与患肺癌没有关系.在该规则下,把结论“H 0 成立”错判成“H 0 不成立”的概率不会超过2( 6.635)0.01P K ≥≈, 即有99%的把握认为从不成立.上面解决问题的想法类似于反证法.要确认是否能以给定的可信程度认为“两个分类变量有关系”,首先假设该结论不成立,即 H 0:“两个分类变量没有关系”成立.在该假设下我们所构造的随机变量2K 应该很小.如果由观测数据计算得到的2K 的观测值k 很大,则在一定可信程度上说明H 0不成立,即在一定可信程度上认为“两个分类变量有关系”;如果k 的值很小,则说明由样本观测数据没有发现反对H 0 的充分证据.怎样判断2K 的观测值 k 是大还是小呢?这仅需确定一个正数0k ,当0k k ≥时就认为2K 的观测值k 大.此时相应于0k 的判断规则为:如果0k k ≥,就认为“两个分类变量之间有关系”;否则就认为“两个分类变量之间没有关系”.我们称这样的0k 为一个判断规则的临界值.按照上述规则,把“两个分类变量之间没有关系”错误地判断为“两个分类变量之间有关系”的概率为20()P K k ≥.在实际应用中,我们把0k k ≥解释为有20(1())100%P K k -≥⨯的把握认为“两个分类变量之间有关系”;把0k k <解释为不能以20(1())100%P K k -≥⨯的把握认为“两个分类变量之间有关系”,或者样本观测数据没有提供“两个分类变量之间有关系”的充分证据.上面这种利用随机变量2K 来确定是否能以一定把握认为“两个分类变量有关系”的方法,称为两个分类变量的独立性检验.利用上面结论,你能从列表的三维柱形图中看出两个变量是否相关吗?一般地,假设有两个分类变量X 和Y ,它们的可能取值分别为{12,x x }和{12,y y }, 其样本频数列联表(称为2×2列联表)为: 表3一 9 2×2列联表若要推断的论述为H l :X 与Y 有关系, 可以按如下步骤判断结论H l 成立的可能性:1.通过三维柱形图和二维条形图,可以粗略地判断两个分类变量是否有关系,但是这种判断无法精确地给出所得结论的可靠程度.① 在三维柱形图中,主对角线上两个柱形高度的乘积ad 与副对角线上的两个柱形高度的乘积bc 相差越大,H 1成立的可能性就越大.② 在二维条形图中,可以估计满足条件X=1x 的个体中具有Y=1y 的个体所占的比例a a b+,也可以估计满足条件X=2x 的个体中具有Y=2y ,的个体所占的比例cc d+.“两个比例的值相差越大,H l 成立的可能性就越大.2.可以利用独立性检验来考察两个分类变量是否有关系,并且能较精确地给出这种判断的可靠程度.具体做法是:① 根据实际问题需要的可信程度确定临界值0k ;② 利用公式( 1 ) ,由观测数据计算得到随机变量2K 的观测值k ;③ 如果0k k >,就以20(1())100%P K k -≥⨯的把握认为“X 与Y 有关系”;否则就说样本观测数据没有提供“X 与Y 有关系”的充分证据.在实际应用中,要在获取样本数据之前通过下表确定临界值:表3一10(四)、举例:例1.在某医院,因为患心脏病而住院的 665 名男性病人中,有 214 人秃顶,而另外 772 名不是因为患心脏病而住院的男性病人中有 175 人秃顶. (1)利用图形判断秃顶与患心脏病是否有关系.(2)能够以 99 %的把握认为秃顶与患心脏病有关系吗?为什么? 解:根据题目所给数据得到如下列联表:(1)相应的三维柱形图如图3.2一4所示.比较来说,底面副对角线上两个柱体高度的乘积要大一些,可以在某种程度上认为“秃顶与患心脏病有关”.(2)根据列联表3一11中的数据,得到21437(214597175451)3891048665772k ⨯⨯-⨯=⨯⨯⨯≈16.373>6 .因此有 99 %的把握认为“秃顶与患心脏病有关” .例2.为考察高中生的性别与是否喜欢数学课程之间的关系,在某城市的某校高中生中随机抽取300名学生,得到如下列联表: 表3一12 性别与喜欢数学课程列联表由表中数据计算得2K 的观测值 4.514k ≈.能够以95%的把握认为高中生的性别与是否喜欢数学课程之间有关系吗?请详细阐明得出结论的依据.解:可以有约95%以上的把握认为“性别与喜欢数学课之间有关系”.作出这种判断的依据是独立性检验的基本思想,具体过程如下:分别用a , b , c , d 表示样本中喜欢数学课的男生人数、不喜欢数学课的男生人数、喜欢数学课的女生人数、不喜欢数学课的女生人数.如果性别与是否喜欢数学课有关系,则男生中喜欢数学课的比例aa b+与女生中喜欢数学课的人数比例c c d +应该相差很多,即||||()()a c ad bca b c d a b c d --=++++,然后平方得22()()()()()n ad bc K a b c d a c b d -=++++,其中n a b c d =+++.因此2K 越大,“性别与喜欢数学课之间有关系”成立的可能性越大.另一方面,在假设“性别与喜欢数学课之间没有关系”的前提下,事件A ={2K ≥3. 841}的概率为P (2K ≥3. 841) ≈0.05,因此事件 A 是一个小概率事件.而由样本数据计算得2K 的观测值k=4.514,即小概率事件 A 发生.因此应该断定“性别与喜欢数学课之间有关系”成立,并且这种判断结果出错的可能性约为5 %.所以,约有95 %的把握认为“性别与喜欢数学课之间有关系”.补充例题1:打鼾不仅影响别人休息,而且可能与患某种疾病有关,下表是一次调查所得的数据,试问:每一晚都打鼾与患心脏病有关吗?解:略。

3.2_独立性检验的基本思想及其初步应用

3.2_独立性检验的基本思想及其初步应用

例2.在研究某种新药对小白兔的防治效果时,得到下表 数据:
未用新药 用新药
总计
存活数 101 129 230
死亡数 38 20 58
总计 139 149 288
试分析新药对防治小白兔是否有效?
k
288 101 20 38 129 139 149 230 58
2
8.658 7.879
(1).根据实际问题的需要确定容许推断“两个 分类变量有关系”犯错误概率得上界 ,但是这 种判断不精确. (2)在二维条形图中,两个比例的值相差越大, H1成立的可能变量是否有关系, 并且能较精确地给出这种判断的可靠程度.
具体做法是: 根据观测数据计算由
K
因此|ad-bc|越小,说明吸烟与患肺癌之间关系越弱; |ad-bc|越大,说明吸烟与患肺癌之间关系越强;
为了使不同样本容量的数据有统一的评判标准, 基于上述分析,我们构造一个随机变量:
K
2
a b c d a c b d
n ad bc
2
其中n a b c d为样本容量
等高条形图
100% 90% 80% 70% 60% 50% 40% 30% 20% 10% 0% 不吸烟 吸烟
患肺癌 不患肺癌
上面我们通过分析数据和图形,得到的直观印象 是吸烟和患肺癌有关,那么事实是否真的如此呢?
能够以多大的把握认为”吸烟与患肺癌有关”,假设 H0:吸烟与患肺癌没有关系,看看能推出什么结论
2
56.632
这个值到地告诉我们什么呢?
统计学家经过研究发现,在H0成立的情况下:
P K 6.635 0.01
2
K=56.632,远远大于6.635,所以有理由断定吸 烟与患肺癌有关系。这种判断犯错误的概率 不超过0.01。

独立性检验的基本思想及其初步应用》

独立性检验的基本思想及其初步应用》

独立性检验的基本思想及其初步应用》生更加直观地理解两个分类变量之间的关系。

问题2:根据三维柱形图和二维条形图,你能否看出吸烟者和不吸烟者患肺癌的比例有何不同?二、独立性检验的基本思想1、独立性检验的基本思想:独立性检验是用来检验两个分类变量是否有关系的一种统计方法。

如果两个分类变量是独立的,那么它们之间是没有关系的;如果两个分类变量不独立,则它们之间是有关系的。

2、独立性检验的步骤:1)列出列联表;2)计算期望频数;3)计算卡方值;4)查表得出显著性水平;5)判断两个分类变量是否有关系。

三、K2检验的计算公式1、K2检验的计算公式:K2=∑(Oi-Ei)²/Ei其中,Oi为观察频数,Ei为期望频数。

2、K2检验的含义:K2检验的值越大,观察频数与期望频数的差距越大,两个分类变量之间的关系就越显著。

四、独立性检验的应用举例1、应用举例:1)医学研究:调查吸烟是否对患肺癌有影响;2)社会调查:调查男女是否对某一品牌的喜好程度有影响;3)市场调查:调查年龄与消费金额是否有关系。

2、独立性检验的应用:通过独立性检验,可以判断两个分类变量是否有关系,从而为我们提供科学的依据,进行合理的决策。

教学反思:本节课通过生动的例子和图表,引入了独立性检验的基本概念和思想。

通过对K2检验公式的介绍,让学生了解了如何计算卡方值。

同时,通过应用举例,让学生了解了独立性检验的实际应用。

在教学过程中,教师注重启发学生的思维,让学生在合作探究中主动掌握知识,达到了预期的教学目标。

练1、在某医院,665名男性病人中,214人秃顶,而在772名非心脏病男性病人中,175人秃顶。

能否以99%的置信度认为“秃顶与患心脏病”有关系?思考1、为调查某地区老年人是否需要志愿者提供帮助,用简单随机抽样方法从该地区调查了500位老年人,结果如下:性别。

是否需要志愿者需要。

不需要男性。

30.170女性。

373.271)估计该地区老年人中需要志愿者提供帮助的比例;2)能否以99%的置信度认为该地区的老年人是否需要志愿者提供帮助与性别有关系?思考2、某研究小组为了研究中学生的身体发育情况,在某学校随机抽出20名15至16周岁的男生,将他们的身高和体重制成2×2列联表,根据列联表的数据,能否以95%的置信度认为该学校15至16周岁的男生的身高和体重之间有关系?课后作业:课本第18页第1题和第2题。

教学设计5:3.2 独立性检验的基本思想及其初步应用

教学设计5:3.2 独立性检验的基本思想及其初步应用

3.2 独立性检验的基本思想及其初步应用三维目标1.知识与技能通过本节知识的学习,了解独立性检验的基本思想和初步应用,能对两个分类变量是否有关做出明确的判断.明确对两个分类变量的独立性检验的基本思想和具体步骤,会对具体问题作出独立性检验.2.过程与方法从具体问题中认识独立性检验的作用及必要性,树立学好本节知识的信心,在此基础上学习等高条形图,并认识它们的基本作用和存在的不足,从而为学习下面知识做好铺垫,进而介绍K2的计算公式和K2的观测值k的求法,以及它们的实际意义,从中得出判断“X与Y 有关系”的一般步骤及如何利用独立性检验来考察两个分类变量是否有关系,并能较准确地给出这种判断的具体做法和可信程度的大小.3.情感、态度与价值观培养全面的观点和辩证分析问题的能力,寻求问题的内在联系,不为假象所迷惑,寻求问题的内在联系,培养学习数学、应用数学的意识.加强与现实生活相联系,从对实际问题的分析过程中学会利用图形分析解决问题及用具体的数量来衡量两个变量之间的联系,学习用图形、数据来正确描述两个变量的关系,明确数学在现实生活中的重要作用和实际价值.重点、难点重点:理解独立性检验的基本思想及实施步骤.难点:(1)了解独立性检验的基本思想;(2)了解随机变量K2的含义,K2的观测值很大,就认为两个分类变量是有关系的.引导学生通过类比反证法来体会假设检验,从而理解k2的含义,通过例题与练习更进一步了解独立性检验的基本思想.教学建议教学时通过引导学生探究“吸烟是否与患肺癌有关系”引出独立性检验的问题,借助样本数据的列联表、等高条形图展示在吸烟人中患肺癌的比例比不吸烟人中患肺癌的比例要高,使学生直观感觉到吸烟和患肺癌可能有关系,在教学中可以把假设检验的方法与反证法作对比,以加深学生对独立性检验思想的理解.教学流程创设问题情境,提出问题.⇒引导学生回答问题,理解独立性检验的思想.⇒通过例1及变式训练,使学生掌握利用等高条形图判断两个分类变量是否相关.⇒通过例2及变式训练,使学生掌握两个变量的独立性检验.⇒通过例3及互动探究,使学生掌握独立性检验的综合应用.⇒完成当堂双基达标,巩固所学知识,并进行反馈、矫正.⇒归纳整理,进行课堂小结,整体认识所学知识.课标解读1.了解分类变量、2×2列联表、随机变量K2的意义.2.通过对典型、案例的分析,了解独立性检验的基本思想方法.3.通过典型、案例的分析,了解两个分类变量的独立性检验的应用.知识独立性检验及其应用【问题导思】山东省2016年大力推行素质教育,增加了高中生的课外活动时间,某校调查了学生的课外活动方式,结果整理成下表:体育文娱合计男生210230440女生60290350合计270520790如何判定“喜欢体育还是文娱与性别是否有联系”?【提示】可通过表格与图形进行直观分析,也可通过统计分析定量判断.1.分类变量及2×2列联表(1)分类变量的定义变量的不同“值”表示个体所属的不同类别,像这样的变量称为分类变量.(2)2×2列联表的定义假设有两个分类变量X和Y,它们的取值分别为{x1,x2}和{y1,y2},其样本频数列联表(称为2×2列联表)为:y1y2总计x1a b a+bx2c d c+d总计a+c b+d a+b+c+d2.随机变量K2为了使不同样本容量的数据有统一的评判标准,我们构造一个随机变量K2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d),其中n=a+b+c+d为样本容量.3.独立性检验利用随机变量K 2来判断“两个分类变量有关系”的方法称为独立性检验.类型1利用等高条形图判断两个分类变量是否相关例1.为了解铅中毒病人与尿棕色素为阳性是否有关系,分别对病人组和对照组的尿液作尿棕色素定性检查,结果如下:组别 阳性数 阴性数 总计 铅中毒病人 29 7 36 对照组 9 28 37 总计383573试画出列联表的等高条形图,分析铅中毒病人和对照组的尿棕色素阳性数有无差别,铅中毒病人与尿棕色素为阳性是否有关系?【思路探究】 画等高条形图→分析图中数据差异→作出结论 解 等高条形图如图所示:其中两个浅色条的高分别代表铅中毒病人和对照组样本中尿棕色素为阳性的频率. 由图可以直观地看出铅中毒病人与对照组相比,尿棕色素为阳性的频率差异明显,因此铅中毒病人与尿棕色素为阳性有关系.规律方法1.本题采用数形结合法通过条形图直观地看出差异,得出结论.2.若要推断的论述为H 1:“X 与Y 有关系”在X =x 1的情况下,Y =y 1的频率为aa +b;在X =x 2的情况下,Y =y 1的频率为c c +d .若a a +b 和cc +d 相差很大,就判断两个分类变量之间有关系. 变式训练某校对学生课外活动进行调查,结果整理成下表:试用等高条形图分析,喜欢体育还是文娱与性别是否有关系?体育 文娱 合计 男生 21 23 44 女生 6 29 35 合计275279解 其等高条形图如图所示:由图可以直观地看出喜欢体育还是喜欢文娱与性别在某种程度上有关系.类型2两个变量的独立性检验例2某校高三年级在一次全年级的大型考试中,数学成绩优秀和非优秀的学生中,物理、化学、总分也为优秀的人数如下表所示,则我们能否在犯错误的概率不超过0.001的前提下认为数学成绩优秀与物理、化学、总分优秀有关系?物理优秀化学优秀总分优秀数学优秀228225267数学非优秀14315699注:该年级此次考试中数学成绩优秀的有360人,非优秀的有880人.【思路探究】首先分别列出数学成绩与物理、化学、总分的2×2列联表,再正确计算K2的观测值,然后由K2的值作出判断.解(1)根据已知数据列出数学与物理优秀的2×2列联表如下:物理优秀物理非优秀总计数学优秀228b360数学非优秀143d880总计371b+d 1 240∴b=360-228=132,d=880-143=737,b+d=132+737=869.代入公式可得K2的观测值为k1≈270.114.(2)按照上述方法列出数学与化学优秀的2×2列联表如下:化学优秀化学非优秀总计数学优秀225135360数学非优秀156724880总计381859 1 240代入公式可得K2的观测值k2≈240.611.(3)列出数学与总分优秀的2×2列联表如下:总分优秀总分非优秀总计数学优秀26793360数学非优秀99781880总计 366 874 1 240代入公式可得K 2的观测值k 3≈486.123.由于K 2的观测值都大于10.828,由此说明都能在犯错误的概率不超过0.001的前提下认为数学成绩优秀与物理、化学、总分优秀有关系.规律方法1.本题的关键是多次K 2的计算.2.解决独立性检验问题的基本步骤是:①指(求)出相关数据,作列联表;②求K 2的观测值;③判断可能性,注意与临界值作比较,得出事件有关的可能性大小. 变式训练某大型企业人力资源部为了研究企业员工工作积极性和对待企业改革态度的关系,经过调查得到如下列联表:积极支持企业改革 不太支持企 业改革 总计 工作积极 54 40 94 工作一般 32 63 95 总计86103189根据列联表的独立性检验,能否在犯错误的概率不超过0.005的前提下认为工作态度与支持企业改革之间有关系?解 由列联表中的数据,得K 2的观测值为 k =189(54×63-40×32)294×95×86×103≈10.759>7.879,因此,在犯错误的概率不超过0.005的前提下,认为工作态度与支持企业改革之间有关系.类型3独立性检验的综合应用例3 研究人员选取170名青年男女大学生的样本,对他们进行一种心理测验,发现有60名女生对该心理测验中的最后一个题目的反应是:作肯定的18名,否定的42名;110名男生在相同的题目上作肯定的有22名,否定的有88名.问:性别与态度之间是否存在某种关系?用独立性检验的方法判断.【思路探究】 解答本题可先列出表格,然后计算K 2的观测值,再与临界值比较,判断两个变量是否相互独立.解 根据题目所给数据列出下列表格:态度 性别 肯定 否定 总计 男生2288110女生 18 42 60 总计40130170根据表中的数据得K 2的观测值k =170×(22×42-18×88)2110×60×40×130≈2.158<2.706.所以没有充分的理由说明性别与态度有关.规律方法要得到两个变量之间有关或无关的精确的可信程度,需作独立性检验的有关计算,K 2越小,变量间的关系越弱,当K 2<2.706时,我们认为两个变量无关. 互动探究若将110名男生在相同的题目上作肯定的有22名”改为“有60名”其余不变,结果如何? 解 列2×2列联表得:态度 性别 肯定 否定 总计 男生 60 50 110 女生 18 42 60 总计7892170根据表中的数据得K 2=170×(60×42-18×50)278×92×110×60≈9.420>6.635.所以有99%的把握认为性别与态度有关.独立性检验思想的应用典例 为调查某地区老年人是否需要志愿者提供帮助,用简单随机抽样方法从该地区调查了500位老年人,结果如下:性别是否需要志愿者男 女 需要 40 30 不需要160270(1)估计该地区老年人中,需要志愿者提供帮助的老年人的比例;(2)在犯错误的概率不超过0.01的前提下,能否认为该地区的老年人是否需要志愿者提供帮助与性别有关?(3)根据(2)的结论,能否提出更好的调查方法来估计该地区的老年人中,需要志愿者提供帮助的老年人的比例?说明理由.附:P (K 2≥k ) 0.050 0.010 0.001 k3.8416.63510.828K 2=n (ad -bc )2(a +b )(c +d )(a +c )(b +d ).【思路点拨】 第(2)问是独立性检验问题求出K 2即可.第(3)问是随机抽样问题. 【规范解答】 (1)调查的500位老年人中有70位需要志愿者提供帮助,因此该地区老年人中,需要帮助的老年人的比例的估算值为70500=0.14=14%.(2)K 2=500×(40×270-30×160)2200×300×70×430≈9.967.由于9.967>6.635,所以在犯错误的概率不超过0.01的前提下,认为该地区的老年人是否需要志愿者提供帮助与性别有关.(3)由(2)的结论知,该地区老年人是否需要帮助与性别有关,并且从样本数据能看出该地区男性老年人与女性老年人中需要帮助的比例有明显差异,因此在调查时,先确定该地区老年人中男、女的比例,再把老年人分成男、女两层并采用分层抽样方法比采用简单随机抽样的方法更好.思维启迪用独立性检验来考察“x 1与x 2是否有关系”的步骤: ①提出假设H 0:x 1与x 2没有关系; ②根据2×2列联表与公式计算K 2的值; ③查对临界值表作出判断.课堂小结独立性检验与反证法的比较反证法 独立性检验要证明结论A要确认“两个分类变量有关系”在A 不成立的前提下进行推理假设该结论不成立,即假设结论“两个分类变 量没有关系”成立,在该假设下计算K 2 推出矛盾意味着结论A 成立由观测数据计算得到的K 2的观测值k 很大, 则在一定可信程度上说明假设不合理 没有找到矛盾,不能对A 下任何结论,即反 证法不成立根据随机变量K 2的含义,可以通过概率P (K 2≥k 0)的大小来评价该假设不合理的程度有多大,从而得出“两个分类变量有关系”这一 结论成立的可信程度有多大 当堂检测1.班级与成绩2×2列联表:优秀不优秀总计甲班 10 35 45 乙班 7 38 p 总计mnq表中数据m ,n ,p ,q 的值应分别为( ) A .70,73,45,188 B .17,73,45,90 C .73,17,45,90 D .17,73,45,45 【解析】 m =7+10=17,n =35+38=73, p =7+38=45,q =m +n =90. 【答案】 B2.下列关于回归分析与独立性检验的说法正确的是( )A .回归分析和独立性检验没有什么区别B .回归分析是对两个变量准确关系的分析,而独立性检验是分析两个变量之间的不确定关系C .回归分析研究两个变量之间的相关关系,独立性检验是对两个变量是否具有某种关系的一种检验D .独立性检验可以100%确定两个变量之间是否具有某种关系 【解析】 由回归分析及独立性检验的特点知选项C 正确. 【答案】 C3.在独立性检验中,选用K 2的观测值k 统计量,用其取值大小推断独立性是否成立,当k 满足条件________时,我们在犯错误的概率不超过0.01的前提下认为事件A 与B 有关.【解析】 根据临界值表可知,当K 2的观测值k 满足k ≥6.635时,在犯错误的概率不超过0.01的前提下认为事件A 与B 有关.【答案】 k ≥6.6354.在一次恶劣气候下的飞行航程中调查了男女乘客在飞机上晕机的情况如下表所示,据此资料你是否认为在恶劣气候下的飞行中男性比女性更容易晕机?晕机 不晕机 合计 男性 24 31 55 女性 8 26 34 合计325789解 K 2的观测值k =89×(24×26-31×8)255×34×32×57≈3.689.因为3.689<3.841,我们没有理由说晕机与否跟男女性别有关,尽管这次航班中男性晕机的比例(2455)比女性晕机的比例(834)高,但我们不能认为在恶劣气候下的飞行中男性比女性更容易晕机.。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

3.2独立性检验的基本思想及其初步应用
1.2独立性检验的基本思想及其初步应用(
1)
双基再现
1.
★下列变量中不是分类变量的是

A .近视
B .成绩
C .性别
D .饮酒 2. ^ ★下列说法中错误的是(
A .有时可以把分类变量的不同取值用数字 表示,
但这时的数字除了分类以外没有其它
含义
B .在统计学中,独立性检验就是检验两个 分类变
量是否有关系的一种方法
C .在进行独立性检验时,可以先利用三维 柱形图和
二维条形图粗略地判断两个分类 变量是否有关系
如下:
变式活学
7. ★★★(教材1.2例1变式)研究人员选 取170名青年男女大学生的样本,
对他(她)
们进行一种心理测验,发现有 60名女生对
该心理的最后一个题目的反应是:
作肯定的
18名,否定42名;男生110名在相同的项 目上作
出肯定的有 22名,否定的有 88名. 请问性别与态度之间是否存在某种关系? 请分别用图形与独立性检验的方法进行判 断.
据表中数据,得K 2 4.844,因为K 2 3.841 所以可以判定选修统计专业与性别有关 •那
么这种判断出错的可能性为(

A .5%
B . 95%
C . 1%
D . 99%
4. ★★某大学要研究性别与职称之间是否 有关系,你认为该收集哪些数据?
5. ★★在三维柱形图中,主对角线的两个 柱形高度的乘积be 相关越大,X 与Y 有关 系的可能性就 . 6 .★★★为了探究电离辐射的剂量与人体 的受损程度是否有关,用两种不同的剂量的 电离辐射照射小白鼠•
在照射14天内的结果
&★★★★(教材1.2例1变式)在研究某种新措施对猪白痢的防治效果问题时,得到了以下数据:
试利用图形和独立性检验来判断新措施对防治猪白痢是否有效?10. ★★★ ★★在调查的480名男人中有38
名患有色盲,520名女人中有6名患有色盲,分别利用图形和独立性检验的方法来判断色盲与性别是否有关?你所得到的结论在什么范围内有效?
实践演练
9 ★★如何对草莓、橙子、桃子、苹果、梨等5种水果进行分类?。

相关文档
最新文档