1.2独立性检验的基本思想及其初步应用(学、教案)
《独立性检验的基本思想及其初步应用(第1课时)》教学设计
1.1.2 独立性检验的基本思想及其初步应用第一课时(谷杨华)一、教学目标1.核心素养通过学习独立性检验的基本思想及其初步应用,初步形成基本的数据分析能力,培养数学运算能力.2.学习目标(1)1.1.1.1 了解分类变量的概念(2)1.1.1.2 了解等高条形图、列联表概念,学会用列联表、等高条形图直观判断分类变量的关系(3)1.1.1.3 了解独立性检验基本思想,初步学会用独立性检验的基本思想判断分类变量的关系3.学习重点了解独立性检验基本思想,初步学会用独立性检验的基本思想判断分类变量的关系4.学习难点了解独立性检验基本思想,初步学会用独立性检验的基本思想判断分类变量的关系二、教学设计(一)课前设计1.预习任务任务1阅读教材P10-P12,思考什么是分类变量,列联表如何画?任务2有哪些方法可以直观判断两个分类变量是否有关系?2.预习自测1.下列不是分类变量的是()A.近视B.身高C.血压D.药物反应解:B.判断一个量是否是分类变量,只需看变量的不同值是否表示个体的不同类别,A,C,D选项的不同值都可以表示个体的不同类别,只有B选项的不同值不表示个体的不同类别.2.下面是一个22⨯列联表则表中a,b A. 94,96 B. 52,50 C. 52,54 D. 54,52 解:C(二)课堂设计 1.知识回顾(1)线性回归方程:∧∧∧+=a x b y ,其中:1122211()()()n niii ii i nniii i x x y y x y nx yb x x xnx∧====---==--∑∑∑∑,a ∧=x b ∧-y(2)回归分析:是对具有相关关系的两个变量进行的统计分析的一种常用方法. (3)线性回归模型:y bx a e =++其中a 和b 为模型的未知参数,e 称为随机误差. 2.问题探究问题探究一 什么是分类变量?●活动一 理论研究,概念学习—分类变量在现实生活中,会遇到各种各样的变量,如果要研究它们之间的关系,观察下面两组变量,分析在取不同的值时表示的个体有何差异?变量的不同“值”表示个体所属的不同类别,像这样的变量成为分类变量. (1) 分类变量也称为属性变量或定性变量,它的不同值表示个体所属的不同类别. (2) 分类变量的取值一定是离散的,如性别只取男、女两个值.(3) 可以把分类变量的不同取值用数字表示,如用0表示男,1表示女,这是性别变量就成了取值为0和1的随机变量,但这些数字的大小没有意义. 分类变量是大量存在的,例如是否吸烟,宗教信仰,国籍等问题探究二 如何研究两个分类变量之间是否有关系?在日常生活中,我们常常关心两个分类变量之间是否有关系.例如,吸烟与患肺癌是否有关系?性别是否对喜欢数学课程有影响? ●活动一 实例探究,引出问题例1 为调查吸烟是否对肺癌有影响,某肿瘤研究所随机地调查了9965人,得到如下结果:表格 1那么吸烟是否对患肺癌有影响?估计吸烟者与不吸烟者患病的可能性差异?●活动二 实例探究,引出概念 1.列联表类似于上面的表格这样列出两个分类变量的频数表,称为列联表.即列联表是两个或者两个以上分类变量的频数表,书中仅限于研究两个分类变量的列联表,并且每个分类变量只取两个值,这样的列联表成为2×2列联表.一般的,假设有两个分类变量X 和Y ,它们的取值分别为{}21,x x 和{}21,y y ,其样本频数列联表为:1y 2y总计1x a bb a + 2xcd d c + 总计c a +b d +d c b a +++其中d c b a +++是样本容量. ●活动三 利用旧知,研究问题 利用频率分布表判断;由患肺癌在吸烟者与不吸烟者中的频率差异可粗略估计吸烟对患肺癌有影响; ●活动四 学习新知,对比研究与表格相比,图形更能直观的反映出两个分类变量间是否相互影响,我们常用等高条形图展示列联表数据的频率特征. 2.等高条形图利用等高条形图来分析两个分类变量之间是否具有相关关系,可以形象、直观地反映两个分类变量之间的总体状态和差异大小,进而判断它们之间是否具有相关关系.(1)绘制等高条形图时,列联表的行对应的是高度,两行的数据不相等,但对应的条形图的高度是相同的;两行的数据对应不同的颜色.(2)等高条形图中由两个高度相同的矩形,每一个矩形中都有两种颜色,观察下方颜色区域的高度,如果两个高度相差比较明显,就判断两个分类变量之间有关系.下图是吸烟与是否患肺癌的等高条形图0%10%20%30%40%50%60%70%80%90%100%不吸烟吸烟患肺癌不患肺癌由条形图可以发现,在吸烟样本中,患肺癌的频率要高些,因此直观上可以认为吸烟更容易引发肺癌.例2 在调查的480名男人中有38人患色盲,520名女人中有6名患色盲,试利用图形来判断色盲与性别是否有关? 【知识点:分类变量,等高条形图】详解根据题目给出的数据作出如下的列联表:色盲不色盲总计男38442480女6514520总计44956 1 000根据列联表作出相应的等高条形图:从等高条形图来看在男人中患色盲的比例要比在女人中患色盲的比例大得多,因而,我们认为性别与患色盲是有关系的.点拨:利用数形结合的思想,借助等高条形图来判断两个分类变量是否相关是判断变量相关的常见方法之一.一般地,在等高条形图中,aa+b 与cc+d相差越大,两个分类变量有关系的可能性就越大.问题探究三如何从统计学方面研究两个分类变量之间是否有关系?重点、难点知识★▲通过数据和图形分析,我们得到的直观判断是“吸烟和患肺癌有关”那么这种判断是否可靠?我们通过统计分析回答这个问题.为研究的一般性,在列联表中用字母代替数字为了回答上述问题,我们先假设H:吸烟与患肺癌没有关系,那么吸烟样本中不患肺癌的比例应该与不吸烟样本中相应的比例差不多,即:dc cb a a +≈+,即bc ad ≈. 因此,bc ad -越小,说明吸烟与患肺癌之间关系越弱;bc ad -越大,说明吸烟与患肺癌之间关系越强.为了使不同样本容量的数据有统一的评判标准,构造一个随机变量()()()()()22n ad bc K a b c d a c b d -=++++ (1) (其中n a b c d =+++为样本容量.)若0H 成立,即“吸烟与患肺癌没有关系”,则2K 应该很小. 根据表1中的数据,利用公式(1)计算得到2K 的观测值为632.5691987421487817)209942497775(99652≈⨯⨯⨯⨯-⨯=k这个值到底能告诉我们什么呢?统计学家经过研究后发现,在0H 成立的情况下, 2( 6.635)0.01P K ≥≈ (2)在0H 成立的情况下,2K 的观测值大于6.635的概率非常小,近似为0.010,是个小概率事件.现在2K 的观测值632.56≈k ,远远大于635.6,所以有理由断定0H 不成立,即认为“吸烟与患肺癌有关系”.但这种判断会犯错误,犯错误的概率不会超过010.0.上面这种利用随机变量2K 来确定是否能以一定把握认为“两个分类变量有关系”的方法,称为两个分类变量的独立性检验. 3.课堂总结【知识梳理】(1)变量的不用“值”表示个体所属的不同类别,像这样的变量成为分类变量. (2)列出两个分类变量的频数表,称为列联表.(3)设0H :吸烟与患肺癌没有关系,那么吸烟样本中不患肺癌的比例应该与不吸烟样本中相应的比例差不多,即:dc cb a a +≈+,即bc ad ≈. 因此,bc ad -越小,说明吸烟与患肺癌之间关系越弱;bc ad -越大,说明吸烟与患肺癌之间关系越强.为了使不同样本容量的数据有统一的评判标准,构造一个随机变量()()()()()22n ad bc K a b c d a c b d -=++++ (1) (其中n a b c d =+++为样本容量.)若0H 成立,即“吸烟与患肺癌没有关系”,则2K 应该很小.【重难点突破】(1)列联表与等高条形图列联表由两个分类变量之间频率大小差异说明这两个变量之间是否有关联关系,而利用等高条形图能形象直观地反映它们之间的差异,进而推断它们之间是否具有关联关系.一般地,在等高条形图中,a a +b 与cc +d 相差越大,两个分类变量有关系的可能性就越大.(2)利用等高条形图判断两个分类变量是否有关的步骤:4.随堂检测1.独立性检验中,可以粗略地判断两个分类变量是否有关的是( ) A. 残差B. 等高条形图C.假设检验的思想D.以上都不对【知识点:独立性检验】 解: B.2.分类变量X 和Y 的列联表如下,则( )A. ad bc -越小,说明X 与Y 的关系越弱B. ad bc -越大,说明X 与Y 的关系越强C. 2()ad bc -越大,说明X 与Y 的关系越强 D. 2()ad bc -越接近于0,说明X 与Y 关系越强【知识点:独立性检验】解:C 2K 越大, 2()ad bc -越大, 犯错误的概率的越小,说明X 与Y 的关系越强. 3..在一次独立性检验中,得出2×2列联表如下:最后发现,两个分类变量x 和y 没有任何关系,则m 的可能值是( ) A.200 B.720 C.100 D.180 【知识点:独立性检验】解:B 分类变量x 和y 没有任何的关系,所以,得到720=m ,故选B. 4.在一个2×2列联表中,由其数据计算得到K 2的观测值k =13.097,则其两个变量间有关系的可能性为( ) A.99.9% B.95% C.90% D.0 附表:【知识点:独立性检验】解:A 因为所求的213.09710.828k ,故可能性为99.9%,所以选A.5.某校为了研究学生的性别和对待某一活动的态度(支持和不支持两种态度)的关系,运用2×2列联表进行独立性检验,经计算K 2=7.069,则至少有 _的把握认为“学生性别与是否支持该活动有关系”. 附:【知识点:独立性检验】 解:99﹪ (三)课后作业基础型 自主突破 1.下面说法正确的是( )A.统计方法的特点是统计推断准确、有效B.独立性检验的基本思想类似于数学上的反证法C.任何两个分类变量有关系的可信度都可以通过查表得到D.不能从等高条形图中看出两个分类变量是否相关 【知识点:独立性检验】 解:B2.观察下列各图,其中两个分类变量x ,y 之间关系最强的是( )【知识点:独立性检验】 解:D3.确定结论“X 与Y 有关系”的可信度为95℅时,则随机变量2k 的观测值k 必须( ) A.大于828.10 B.大于841.3 C.小于635.6 D.大于706.2 【知识点:独立性检验】解:B 通过表中的数据可知可信度为95℅时2 3.841kP (K 2≥k 0) 0.05 0.025 0.010 0.005 0.001 k 03.8415.0246.6357.87910.8284. 想要检验是否喜欢参加体育活动是不是与性别有关,应该检验( ) A.H 0:男性喜欢参加体育活动 B.H 0:女性不喜欢参加体育活动 C.H 0:喜欢参加体育活动与性别有关 D.H 0:喜欢参加体育活动与性别无关 【知识点:独立性检验】 解: D5.对分类变量X 与Y 的随机变量2K 的观测值K ,说法正确的是( ) A .K 越大," X 与Y 有关系”可信程度越小; B . K 越小," X 与Y 有关系”可信程度越小; C . K 越接近于0," X 与Y 无关”程度越小 D . K 越大," X 与Y 无关”程度越大 【知识点:独立性检验】 解: B能力型 师生共研6.若有%9.99的把握说事件A 与事件B 有关,那么具体算出的2K 的观测值k 一定满足( )A.828.10>kB.828.10<kC.635.6>kD.635.6<k 【知识点:独立性检验】 解: A7.假设有两个分类变量X 和Y ,它们的值域分别为{x 1,x 2}和{y 1,y 2},其2×2列联表为:(D ) A.a =5,b =4,c =3,d =2 B.a =5,b =3,c =4,d =2 C.a =2,b =3,c =4,d =5 D.a =3,b =2,c =4,d =5 【知识点:独立性检验】 解: D8.某校为了研究学生的性别和对待某一活动的态度(支持与不支持)的关系,运用2⨯2列联表进行独立性检验,经计算K 2=7.069,则所得到的统计学结论为:有 把握认为“学生性别与支持该活动有关系”【知识点:独立性检验】解: 99% 【解析】根据6.6357.06910.828<<,所以犯错误率低于1%,所以应该有99%的把握,认为“学生性别与支持该活动有关系” ,探究型 多维突破9.某班主任对全班50名学生学习积极性和对待班级工作的态度进行了调查,统计数据如下表所示:(1)如果随机抽查这个班的一名学生,那么抽到积极参加班级工作的学生的概率是多少?抽到不太主动参加班级工作且学习积极性一般的学生的概率是多少? (2)试运用独立性检验的思想方法点拨:学生的学习积极性与对待班级工作的态度是否有关系?并说明理由.(参考下表)【知识点:独立性检验,古典概型】解:(1)积极参加班级工作的学生有24人,总人数为50人,概率为25125024=; 不太主动参加班级工作且学习积极性一般的学生有19人,概率为5019.(2)5.111315026242524)761918(5022≈=⨯⨯⨯⨯-⨯⨯=K , ∵828.102>K ,∴有%9.99的把握说学习积极性与对待班级工作的态度有关系.10.2016年夏季奥运会将在巴西里约热内卢举行,体育频道为了解某地区关于奥运会直播的收视情况,随机抽取了100名观众进行调查,其中40岁以上的观众有55名,下面是根据调查结果绘制的观众准备平均每天收看奥运会直播时间的频率分布表(时间:分钟):将每天准备收看奥运会直播的时间不低于80分钟的观众称为“奥运迷”,已知“奥运迷”中有10名40岁以上的观众.(1)根据已知条件完成下面的22⨯列联表,并据此资料你是否有认为“奥运迷”与年龄有关?(2)将每天准备收看奥运会直播不低于100分钟的观众称为“超级奥运迷”,已知“超级奥运迷”中有2名40岁以上的观众,若从“超级奥运迷”中任意选取2人,求至少有1名40岁以上的观众的概率.【知识点:独立性检验,概率统计】解:(1)由频率分布表可知,在轴取的100人中,“奥运迷”有25人,从完成22⨯列联表如下:因为3.030 3.841<,所以没有“奥运迷”与年龄有关.(2)由频率分布表可知,“超级奥运迷”有5人,从而所有可能结果所组成的基本事件空间为:()()()()()()()()()(){}12132311122122313212,,,,,,,,,,,,,,,,,,,a a a a a a a b a b a b a b a b a b b b Ω=其中i a 表示男性,1,2,3,i i b =表示女性,1,2i =.Ω由10个基本事件组成,且是等可能的,用A 表示事件“任意选2人,至少有1名40岁以上观众”,则()()()()()()(){}11122122313212,,,,,,,,,,,,,A a b a b a b a b a b a b b b =,即事件A 包含7个基本事(四)自助餐1.在等高条形图中,下列哪两个比值相差越大,要推断的论述成立的可能性就越大( )A.a a +b 与dc +d B.c a +b 与a c +d C.a a +b 与c c +d D.a a +b 与c b +c【知识点:独立性检验】 解: C2.为了调查中学生近视情况,某校150名男生中有80名近视,140名女生中有70名近视.在检验这些中学生眼睛近视是否与性别有关时用什么方法最有说服力( ) A.平均数 B.方差 C.回归分析 D.独立性检验 【知识点:独立性检验】解: D 本例考查学生眼睛的“近视”与“性别”两件事情之间是否存在相关性,从给出的数据可以列出22⨯列联表,所以适合用独立性检验.3.在一个2×2列联表中,由其数据计算得K 2的观测值k =7.097,则这两个变量间有关系的可能性为 ( )A.99%B.99.5%C.99.9%D.无关系 【知识点:独立性检验】解: A 由表格数据可知k =7.097>6.635,所以这两个变量间有关系的可能性为99%4.某疾病研究所想知道吸烟与患肺病是否有关,于是随机抽取1000名成年人调查是否抽烟及是否患有肺病得到22⨯列联表,经计算得231.52=K ,已知在假设吸烟与患肺病无关的前提条件下,01.0)635.6(,05.0)841.3(22=≥=≥K P K P .则该研究所可以( )A.有%95以上的把握认为“吸烟与患肺病有关”B.有%95以上的把握认为“吸烟与患肺病无关”C.有%99以上的把握认为“吸烟与患肺病有关”D.有%99以上的把握认为“吸烟与患肺病无关” 【知识点:独立性检验】解: A 因为2 5.231 3.841K =>,而2( 3.841)0.05P K ≥=,故有有%95以上的把握认为“吸烟与患肺病有关”5.2016年3月9日至15日,谷歌人工智能系统“阿尔法”迎战围棋冠军李世石,最终结果“阿尔法”以总比分4比1战胜李世石.许多人认为这场比赛是人类的胜利,也有许多人持反对意见,有网友为此进行了调查,在参加调查的2548名男性中有1560名持反对意见, 2452名女性中有1200名持反对意见,在运用这些数据说明“性别”对判断“人机大战是人类的胜利”是否有关系时,应采用的统计方法是( ) A.茎叶图 B.分层抽样 C.独立性检验 D.回归直线方程 【知识点:独立性检验】解:C 这是独立性检验,因为这里有两个分类变量,一个是性别分为男女,一个是意见分为支持和反对,这样就构成一个22⨯联表,用独立性检验来验证“人机大战是人类的胜利”是否有关系.6.某人研究中学生的性别与成绩、视力、智商、阅读量这4个变量之间的关系,随机抽查52名中学生,得到统计数据如表1至表4,这与性别有关联的可能性最大的变量是( )A.成绩B.视力C.智商D.阅读量【知识点:独立性检验】解:D由表中数据可得:表1:()25262210140.00916362032K⨯⨯-⨯=≈⨯⨯⨯;表2:()25242012161.76916362032K⨯⨯-⨯=≈⨯⨯⨯;表3:()2528241281.316362032K⨯⨯-⨯=≈⨯⨯⨯;表4:()25214302623.4816362032K⨯⨯-⨯=≈⨯⨯⨯.其中23.48最大,所以阅读量与性别有关联的可能性最大.7.如下表是对于喜欢足球与否的统计列联表依据表中的数据,得到2K.【知识点:独立性检验】解:228542122854.77245406817k⨯-⨯==⨯⨯⨯.8.若由一个2×2列联表中的数据计算得K2的观测值k=4.013,那么在犯错误的概率不超过________的前提下认为两个变量之间有关系.【知识点:独立性检验】解:0.05 因随机变量K2的观测值k=4.013>3.841,因此,在犯错误的概率不超过0.05的前提下,认为两个变量之间有关系.9.如果K2的观测值为6.645,可以认为“x与y无关”的可信度是________.【知识点:独立性检验】解:1%10.某学校对该校学生作了一项调查发现:在平时的模拟考试中,性格内向的学生426人中332人在考前心情紧张,性格外向的学生594人中有213人在考前心情紧张,作出等高条形图,利用图形判断考前心情紧张与性格类别是否有关系.【知识点:独立性检验】解:作列联表如下:性格内向性格外向总计考前心情紧张332 213 545考前心情不紧张94 381 475总计426 594 1020 相应的等高条形图如图所示:图中阴影部分表示考前心情紧张与考前心情不紧张中性格内向的比例,从图中可以看出考前心情紧张的样本中性格内向占的比例比考前心情不紧张样本中性格内向占的比例大,可以认为考前紧张与性格类型有关.11.甲、乙两所学校高三年级分别有1200人,1000人,为了了解两所学校全体高三年级学生在该地区六校联考的数学成绩情况,采用分层抽样方法从两所学校一共抽取了110名学生的数学成绩,并作出了频数分布统计表如下:(1)计算x,y的值;(2)若规定考试成绩在[120,150]内为优秀,请分别估计两所学校数学成绩的优秀率;(3)根据以上统计数据完成2×2列联表,并判断是否有90%的把握认为两所学校的数学成绩有差异.【知识点:独立性检验,分层抽样,概率统计】解:(1)x=10,y=7;(2)甲乙分别为;25%,40%(3)见解析.试题分析:(1)由题为分层抽样,可确定出甲乙两个学校分别抽取的人数,然后结合频数表,可求出x,y的值;(2)由题给出了优秀的标准,结合给出的表格,可分别求甲乙学校的数学成绩的优秀率,(即由每个学校优秀的人数除以它们的人数);(3)由题为独立性检验;可先做出二列联表,再代入独立性检验的公式,求出2K,对应参考值可下结论.试题解析:(1)甲校抽取人,乙校抽取人,故x=10,y=7,(240%.(3)表格填写如图,k2>2.706又因为1-0.10=0.9,故有90%的把握认为两个学校的数学成绩有差异.。
独立性检验的基本思想及初步应用教案
独立性检验的基本思想及初步应用教案第一章:独立性检验简介1.1 学习目标:(1)理解独立性检验的定义及作用;(2)了解独立性检验在实际应用中的重要性;(3)掌握独立性检验的基本步骤。
1.2 教学内容:(1)独立性检验的定义;(2)独立性检验的实际应用案例;(3)独立性检验的基本步骤。
1.3 教学活动:(1)介绍独立性检验的概念;(2)通过实际案例让学生了解独立性检验的应用;(3)引导学生掌握独立性检验的基本步骤。
第二章:卡方检验2.1 学习目标:(1)理解卡方检验的原理;(2)掌握卡方检验的计算方法;(3)学会判断卡方检验的结果。
2.2 教学内容:(1)卡方检验的原理;(2)卡方检验的计算方法;(3)卡方检验的结果判断。
2.3 教学活动:(1)讲解卡方检验的原理;(2)通过示例让学生掌握卡方检验的计算方法;(3)引导学生学会判断卡方检验的结果。
第三章:列联表与独立性检验3.1 学习目标:(1)了解列联表的概念;(2)掌握列联表的绘制方法;(3)学会利用列联表进行独立性检验。
3.2 教学内容:(1)列联表的概念;(2)列联表的绘制方法;(3)利用列联表进行独立性检验。
3.3 教学活动:(1)介绍列联表的概念;(2)通过示例让学生掌握列联表的绘制方法;(3)引导学生学会利用列联表进行独立性检验。
第四章:独立性检验的应用4.1 学习目标:(1)学会运用独立性检验解决实际问题;(2)掌握独立性检验在调查分析中的作用;(3)了解独立性检验在实际应用中的局限性。
4.2 教学内容:(1)独立性检验在实际问题中的应用;(2)独立性检验在调查分析中的作用;(3)独立性检验的局限性。
4.3 教学活动:(1)讲解独立性检验在实际问题中的应用;(2)通过案例分析让学生了解独立性检验在调查分析中的作用;(3)引导学生认识独立性检验的局限性。
第五章:练习与拓展5.1 学习目标:(1)巩固所学独立性检验知识;(2)提高运用独立性检验解决实际问题的能力;(3)培养学生的创新意识和拓展能力。
1.2《独立性检验的基本思想及其初步应用》教案(新人教选修1-2)
1.2独立性检验的基本思想及其初步应用(第一课时)。
教学目标:1理解独立性检验的基本思想2、会从列联表、柱形图、条形图直观判断吸烟与患癌有关。
3、了解随机变量K 2的含义。
教学重点:理解独立性检验的基本思想。
教学难点;1、理解独立性检验的基本思想、2、了解随机变量K 2的含义。
教学过程:一、引入:从问题“吸烟是否与患肺癌有关系”引出独立性检验的问题,并借助样本数据的列联表,柱形图,和条形图的展示,使学生直观感觉到吸烟和患肺癌可能会有关系。
但这种结论能否推广到总体呢?要回答这个问题,就必须借助于统计理论来分析。
二、独立性检验就是检验两个分类变量是否有关的一种统计方法:用字母表示吸烟与患肺癌的列联表:不患肺癌 患肺癌 合计不吸烟 a b a+b吸烟 c d c+d合计 a+c b+d a+b+c+d样本容量 n=a+b+c+d假设H 0 : 吸烟与患肺癌没有关系。
则吸烟者中不患肺癌的的比例应该与不吸烟者中相应的比例差不多,即:()()()()()()()220a c a c d c a b ad bc a b c dad bc n ad bc k a b c d a c b d n a b c d ≈⇒+≈+⇒-≈++--=++++=+++因此 : 越小, 说明吸烟与患肺癌之间关系越弱.构造随机变量 其中()()2781721489874916.635⨯⨯≈⨯⨯⨯≥≈≥f 2020220202若H 成立,则K 应该很小. 把表中数据代入公式9965777549-422099K =56.632在H 成立的情况下.统计学家估算出如下概率P K 0.01即在H 成立的情况下,K 的值大于6.635的概率非常小.如果K 6.635,就断定H 不成立,出错的可能性有多大?出现K =56.632 6.635 的概率不超过1% .因此,我们有99%的把握认为"吸烟与患肺癌有关系."三、作业:预习17页。
《独立性检验的基本思想及初步应用》教学设计
《独立性检验的基本思想及初步应用》教学设计【教材分析】本节课是人教A版(选修)1—2第一章第二节的内容.在本课之前,学生已经学习过事件的相互独立性,回归分析的基本思想及初步应用。
本节课利用独立性检验进一步分析两个分类变量之间是否有关系,是高中数学知识中体现统计思想的重要课节。
在本节课的教学中,要把重点放在独立性检验的统计学原理上,理解独立性检验的基本思想,明确独立性检验的基本步骤。
在独立性检验中,通过典型案例的研究,介绍了独立性检验的基本思想、方法和初步应用。
独立性检验的基本思想和反证法类似,它们都是假设结论不成立,反证法是在假设结论不成立基础上推出矛盾从而证得结论成立,而独立性检验是在假设结论不成立基础上推出有利于结论成立的小概率事件发生,于是认为结论在很大程度上是成立的。
因为小概率事件在一次试验中通常是不会发生的,所以有利于结论成立的小概率事件的发生为否定假设提供了有力的证据。
学习独立性检验的目的是“通过典型案例介绍独立性检验的基本思想、方法及其初步应用,使学生认识统计方法在决策中的作用”。
这是因为,随着现代信息技术飞速发展,信息传播速度快,人们每天都会接触到影响我们生活的统计方面信息,所以具备一些统计知识已经成为现代人应具备的一种数学素养。
一、教学目标1.使学生理解分类变量(也称属性变量或定性变量)的含义,体会两个分类变量之间可能具有相关性;2.通过对典型案例(吸烟和患肺癌有关吗?)的探究,使学生了解独立性检验(只要求2×2列联表)的基本思想、方法、步骤及应用;3.鼓励学生体验用多种方法(等高条形图和独立性检验)解决同一问题,并对各种方法的优缺点进行比较;4.让学生对统计方法有更深刻的认识,体会统计方法应用的广泛性,进一步体会科学的严谨性(如统计可能犯错误,原因可能是收集的数据样本容量小或样本采集不合理,也可能是理论上的漏洞,如在一次实验中,我们假设小概率事件不发生,这一点本身就值得质疑).二、教学重点本节的重点内容是通过实例让学生体会独立性检验的基本思想,掌握独立性检验的一般步骤.三、教学难点在授课过程中,学生学习过程中遇到的困难主要有以下几个方面:1.的结构的比较奇特,也来的有点突然,学生可能会提出疑问。
高中数学选修1,2《独立性检验的基本思想及其初步应用》教案
高中数学选修1,2《独立性检验的基本思想及其初步应用》教案高中数学选修1-2《独立性检验的基本思想及其初步应用》教案教学要求:通过探究“吸烟是否与患肺癌有关系”引出独立性检验的问题,并借助样本数据的列联表、柱形图和条形图展示在吸烟者中患肺癌的比例比不吸烟者中患肺癌的比例高,让学生亲身体验独立性检验的实施步骤与必要性.教学重点:理解独立性检验的基本思想及实施步骤.教学难点:了解独立性检验的基本思想、了解随机变量的含义.教学过程:教学过程:一、复习准备:独立性检验的基本步骤、思想二、讲授新课:1. 教学例1:例1 在某医院,因为患心脏病而住院的665名男性病人中,有214人秃顶;而另外772名不是因为患心脏病而住院的男性病人中有175名秃顶. 分别利用图形和独立性检验方法判断秃顶与患心脏病是否有关系?你所得的结论在什么范围内有效?① 第一步:教师引导学生作出列联表,并分析列联表,引导学生得出“秃顶与患心脏病有关”的结论;第二步:教师演示三维柱形图和二维条形图,进一步向学生解释所得到的统计结果;第三步:由学生计算出的值;第四步:解释结果的含义.② 通过第2个问题,向学生强调“样本只能代表相应总体”,这里的数据来自于医院的住院病人,因此题目中的结论能够很好地适用于住院的病人群体,而把这个结论推广到其他群体则可能会出现错误,除非有其它的证据表明可以进行这种推广.2. 教学例2:例2 为考察高中生的性别与是否喜欢数学课程之间的关系,在某城市的某校高中生中随机抽取300名学生,得到如下列联表:喜欢数学课程不喜欢数学课程总计男3785122女35143178总计72228300由表中数据计算得到的观察值 . 在多大程度上可以认为高中生的性别与是否数学课程之间有关系?为什么?(学生自练,教师总结)强调:①使得成立的前提是假设“性别与是否喜欢数学课程之间没有关系”.如果这个前提不成立,上面的概率估计式就不一定正确;②结论有95%的把握认为“性别与喜欢数学课程之间有关系”的含义;③在熟练掌握了两个分类变量的独立性检验方法之后,可直接计算的值解决实际问题,而没有必要画相应的图形,但是图形的直观性也不可忽视.不健康健康总计不优秀41626667优秀37296333三、课时小结:独立性检验的方法、原理、步骤四、巩固练习:某市为调查全市高中生学习状况是否对生理健康有影响,随机进行调查并得到如下的列联表:请问有多大把握认为“高中生学习状况与生理健康有关”?五、课外作业课时练习六、板书设计。
《1.2独立性检验的基本思想及其初步应用(一)》教学案3
《1.2独立性检验的基本思想及其初步应用(一)》教学案3 教学目标(一)知识与技能:通过本节知识的学习,了解独立性检验的基本思想和初步应用,能对两个分类变量是否有关做出明确的判断.明确对两个分类变量的独立性检验的基本思想具体步骤,会对具体问题作出独立性检验.(二)过程与方法:在本节知识的学习中,应使学生从具体问题中认识进行独立性检验的作用及必要性,树立学好本节知识的信心,在此基础上学习三维柱形图和二维柱形图,并认识它们的基本作用和存在的不足,从而为学习下面作好铺垫,进而介绍K的平方的计算公式和K的平方的观测值R的求法,以及它们的实际意义.从中得出判断“X与Y有关系”的一般步骤及利用独立性检验来考察两个分类变量是否有关系,并能较准确地给出这种判断的可靠程度的具体做法和可信程度的大小.最后介绍了独立性检验思想的综合运用(三)情感、态度与价值观:通过本节知识的学习,首先让学生了解对两个分类博变量进行独立性检验的必要性和作用,并引导学生注意比较与观测值之间的联系与区别,从而引导学生去探索新知识,培养学生全面的观点和辨证地分析问题,不为假想所迷惑,寻求问题的内在联系,培养学生学习数学、应用数学的良好的数学品质.加强与现实生活相联系,从对实际问题的分析中学会利用图形分析、解决问题及用具体的数量来衡量两个变量之间的联系,学习用图形、数据来正确描述两个变量的关系.明确数学在现实生活中的重要作用和实际价值.教学中,应多给学生提供自主学习、独立探究、合作交流的机会.养成严谨的学习态度及实事求是的分析问题、解决问题的科学世界观,并会用所学到的知识来解决实际问题. 教学重难点教学重点:理解独立性检验的基本思想及实施步骤.K的含义.教学难点:了解独立性检验的基本思想、了解随机变量2教学方法:诱思探究教学法学习方法:自主探究、观察发现、合作交流、归纳总结.教学过程一、复习准备:回归分析的方法、步骤,刻画模型拟合效果的方法(相关指数、残差分析)、步骤.二、讲授新课:1. 教学与列联表相关的概念:①分类变量:变量的不同“值”表示个体所属的不同类别的变量称为分类变量. 分类变量的取值一定是离散的,而且不同的取值仅表示个体所属的类别,如性别变量,只取男、女两个值,商品的等级变量只取一级、二级、三级,等等. 分类变量的取值有时可用数字来表示,但这时的数字除了分类以外没有其他的含义. 如用“0”表示“男”,用“1”表示“女”.②列联表:分类变量的汇总统计表(频数表).一般我们只研究每个分类变量只取两个值,这样的列联表称为22⨯. 如吸烟与患肺癌的列联表:2. 教学三维柱形图和二维条形图的概念:由列联表可以粗略估计出吸烟者和不吸烟者患肺癌的可能性存在差异.(教师在课堂上用EXCEL软件演示三维柱形图和二维条形图,引导学生观察这两类图形的特征,并分析由图形得出的结论)3. 独立性检验的基本思想:①独立性检验的必要性(为什么中能只凭列联表的数据和图形下结论?):列联表中的数据是样本数据,它只是总体的代表,具有随机性,故需要用列联表检验的方法确认所得结论在多大程度上适用于总体.②独立性检验的步骤(略)及原理(与反证法类似):第一步:提出假设检验问题H0:吸烟与患肺癌没有关系↔H1:吸烟与患肺癌有关系第二步:选择检验的指标22()K()()()()n ad bca b c d a c b d-=++++(它越小,原假设“H:吸烟与患肺癌没有关系”成立的可能性越大;它越大,备择假设“H1:吸烟与患肺癌有关系”成立的可能性越大.第三步:查表得出结论1.三维柱形图中柱的高度表示的是( )A .各分类变量的频数B .分类变量的百分比C .分类变量的样本数D .分类变量的具体值解析: 三维柱形图中柱的高度表示图中各个频数的相对大小.选A2. 统计推断,当______时,有95 %的把握说事件A 与B 有关;当______时,认为没有充分的证据显示事件A 与B 是有关的.解析:当841.3>k 时,就有95 %的把握说事件A 与B 有关,当076.2≤k 时认为没有充分的证据显示事件A 与B 是有关的.3.为了探究患慢性气管炎与吸烟有无关系,调查了却339名50岁以上的人,结果如下表所示,据此数据请问:50岁以上的人患慢性气管炎与吸烟习惯有关系吗?分析:有表中所给的数据来计算2K 的观测值k ,再确定其中的具体关系. 解:设患慢性气管炎与吸烟无关.a=43,b=162,c=13,d=121,a+b=205,c+d=134, a+c=56,b+d=283,n=339 所以2K 的观测值为469.7))()()(()(2==+++-=d b c a d c b a bc ad n k .因此635.6>k ,故有99%的把握认为患慢性气管炎与吸烟有关.四,课后练习:1. 在三维柱形图中,主对角线上两个柱形高度的乘积与副对角线上的两个柱形的高度的乘积相差越大两个变量有关系的可能性就( )A.越大B.越小C.无法判断D.以上都不对 2.下列关于三维柱形图和二维条形图的叙述正确的是: ( ) A .从三维柱形图可以精确地看出两个分类变量是否有关系B .从二维条形图中可以看出两个变量频数的相对大小,从三维柱形图中无法看出相对频数的大小C .从三维柱形图和二维条形图可以粗略地看出两个分类变量是否有关系D .以上说法都不对3.对分类变量X 与Y 的随机变量2K 的观测值K ,说法正确的是() A . k 越大," X 与Y 有关系”可信程度越小; B . k 越小," X 与Y 有关系”可信程度越小; C . k 越接近于0," X 与Y 无关”程度越小 D . k 越大," X 与Y 无关”程度越大4. 在吸烟与患肺病这两个分类变量的计算中,下列说法正确的是( )A.若K 2的观测值为k=6.635,我们有99%的把握认为吸烟与患肺病有关系,那么在100个吸烟的人中必有99人患有肺病;B.从独立性检验可知有99%的把握认为吸烟与患肺病有关系时,我们说某人吸烟,那么他有99%的可能患有肺病;C.若从统计量中求出有95% 的把握认为吸烟与患肺病有关系,是指有5% 的可能性使得推判出现错误;D.以上三种说法都不正确.5.若由一个2*2列联表中的数据计算得k 2=4.013,那么有 把握认为两个变量有关系6.某高校“统计初步”课程的教师随机调查了选该课的一些学生情况,具体数据如下表:250(1320107) 4.84423272030k ⨯⨯-⨯=≈⨯⨯⨯因为23.841K ≥,所以判定主修统计专业与性别有关系,那么这种判断出错的可能性为 ____;7.在对人们的休闲方式的一次调查中,共调查了124人,其中女性70人,男性54人.女性中有43人主要的休闲方式是看电视,另外27人主要的休闲方式是运动;男性中有21人主要的休闲方式是看电视,另外33人主要的休闲方式是运动.(1)根据以上数据建立一个2×2的列联表; (2)判断性别与休闲方式是否有关系. 参考答案1.A2.C3.B4.C5. 95%6. 5%7.解:(1)2×2的列联表计算2124(43332721) 6.20170546460k ⨯⨯-⨯=≈⨯⨯⨯因为 5.024k ≥,所以有理由认为假设“休闲方式与性别无关”是不合理的, 即有97.5%的把握认为“休闲方式与性别有关”五,课时小结你能根据上例“吸烟与患肺癌的案例探究”总结“独立性检验”的具体做法步骤第一步:根据实际问题需要的可信程度确定临界值;第二步:利用公式计算随机变量K 2的观测值k ;第三步:查对临界值表得出结论. 六,布置作业:。
独立性检验的基本思想及初步应用教案
独立性检验的基本思想及初步应用教学目标:1. 了解独立性检验的基本思想及其在实际问题中的应用。
2. 学会使用假设检验方法判断两个分类变量之间是否具有独立性。
3. 掌握利用独立性检验解决实际问题的基本步骤。
教学内容:第一章:独立性检验的基本思想1.1 独立性检验的定义1.2 独立性检验的基本原理1.3 独立性检验的应用场景第二章:列联表与卡方检验2.1 列联表的定义及制作2.2 卡方检验的原理及计算2.3 卡方检验的判断标准第三章:假设检验方法3.1 假设检验的定义及类型3.2 独立性检验的假设条件3.3 独立性检验的步骤及注意事项第四章:实际问题中的应用4.1 案例一:产品质量检验4.2 案例二:消费者偏好调查4.3 案例三:疾病与性别关系的分析第五章:总结与拓展5.1 独立性检验在实际问题中的应用范围5.2 独立性检验的局限性5.3 独立性检验与其他统计方法的比较教学方法:1. 讲授:讲解独立性检验的基本思想、原理及应用。
2. 案例分析:分析实际问题,引导学生运用独立性检验解决问题。
3. 小组讨论:分组讨论案例,培养学生的合作与交流能力。
4. 练习与反馈:布置课后习题,及时了解学生掌握情况,给予针对性的指导。
教学评估:1. 课后习题:检验学生对课堂内容的掌握程度。
2. 案例分析报告:评估学生在实际问题中运用独立性检验的能力。
3. 课堂表现:观察学生在课堂讨论、提问等方面的参与度。
教学资源:1. 教材:独立性检验相关章节。
2. 案例材料:产品质量检验、消费者偏好调查、疾病与性别关系等实际问题。
3. 计算器:用于计算卡方值及概率。
教学时数:1. 共计4课时,每课时45分钟。
2. 分配如下:第一章1课时,第二章1课时,第三章1课时,第四章1课时。
第六章:多组独立性检验6.1 多组独立性检验的定义6.2 多组独立性检验的方法6.3 多组独立性检验的应用案例第七章:非参数检验7.1 非参数检验的定义及意义7.2 非参数检验方法简介7.3 独立性检验与非参数检验的比较第八章:独立性检验的软件操作8.1 统计软件的选择与操作8.2 独立性检验的软件实现8.3 结果解读与分析第九章:独立性检验在实际问题中的应用案例分析9.1 案例一:市场调查与分析9.2 案例二:教育公平性研究9.3 案例三:医学研究中的应用第十章:总结与展望10.1 独立性检验在统计学中的地位与作用10.2 独立性检验的发展趋势10.3 独立性检验在未来的挑战与机遇教学方法:1. 讲授:讲解多组独立性检验、非参数检验及软件操作相关知识。
独立性检验的基本思想及初步应用教案
(四)课堂小结,感悟提高 课堂小结,
知识梳理 背景分析
三维柱形图
二维条形图
列联表 学生进行思考
分类变量之间关系
独立性检验
后总结, 教师进行概 括。 让本节课所学的
(五)课后作业,学以至用 课后作业, 课本第 18 页 (六)板书设计 第 1 题和第 2 题
2
过
0.025 5.024
0.010 6.635
0.005 7.879
0.001 10.828 熟 练 运 用 K2 公式进行独立性检
程
k0
独 立 性 检 验 随 机 变 量 K2 值 的 计 算 公 式 :
验。
K2 =
n(ad − bc) 2 (其中 n = a + b + c + d ) (a + b)(c + d )(a + c)(b + d )
程
结, 进一步加深学生 对独立性检验思想 的理解。
(三)课堂练习,夯实基础 课堂练习,
1、应用举例 在某医院, 因为患心脏病而住院的 665 名男性病人中, 214 有 练习 1、 人秃顶,而另外 772 名不是因为患心脏病而住院的男性病人中有 175 人 秃顶。能够以 99 %的把握认为“秃顶与患心脏病”有关系吗? 让学生复习列 联表的制作方法, 运 用独立性检验的思 想解决实际问题。
k0
3.841
6.635
10.828
n(ad − bc) 2 K = (a + b)(c + d )(a + c)(b + d )
2
教
(完整)独立性检验的基本思想及其初步应用教学设计
《独立性检验的基本思想及其初步应用》教学设计邹晓利两当一中《独立性检验的基本思想及其初步应用》教学设计两当一中邹晓利【教学目标】1.知识与技能:通过对典型案例的探究,了解独立性检验的基本思想,会对两个分类变量进行独立性检验,明确独立性检验的基本步骤,并能解决实际问题。
2.过程与方法:通过设置问题,引导学生自主发现、合作探究、归纳展示、质疑对抗,使学生成为课堂主体。
3.情感、态度与价值观:通过本节课学习,让学生体会统计方法在决策中的作用;合作探究的学习过程,使学生感受发现、探索的乐趣及成功展示的成就感,培养学生学习数学知识的积极态度。
【教学重点】了解独立性检验的基本思想及实施步骤。
【教学难点】K的含义。
独立性检验的基本思想;随机变量2【学情分析】本节课是在学习了统计、回归分析的基本思想及初步应用后,利用独立性检验进一步分析两个分类变量之间是否有关系,为以后学习统计理论奠定基础。
【教学方式】多媒体辅助,合作探究式教学。
【教学过程】一、情境引入,提出问题5月31日是世界无烟日,有关医学研究表明,许多疾病,例如:心脏病、癌症、脑血管病、肺病等都与吸烟有关,吸烟已经成为继高血压之后的第二号全球杀手。
这些疾病与吸烟有关的结论是怎样得出的呢?[设计意图说明]好的课堂情景引入,能激发学生的求知欲,是新问题能够顺利解决的前提之一。
问题你认为吸烟与患肺癌有关系吗?怎样用数学知识说明呢?[设计意图说明]提出问题,引导学生自主探究,指明方向,步步深入。
二、阅读教材,探究新知1.分类变量对于性别变量,其取值为男和女两种:[设计意图说明]利用图像向学生展示变量的不同取值,更加形象的表示分类变量的概念。
这种变量的不同“值”表示个体所属的不同类别,像这样的变量称为分类变量。
生活中有很多这样的分类变量如:是否吸烟宗教信仰国籍民族……2.列联表为研究吸烟是否对患肺癌有影响,某肿瘤研究所随机地调查了9965人,得到如下结果:表3—7 吸烟与患肺癌列联表单位:人不患肺癌患肺癌总计不吸烟7775 42 7817吸烟2099 49 2148总计9874 91 9965 这样列出的两个分类变量的频数表,称为列联表(一般我们只研究每个分类变量只取两2 列联表)。
教学设计5:1.2 独立性检验的基本思想及其初步应用
独立性检验的基本思想及其应用【学情分析】:在实际的问题中,经常会面临需要推断的问题,比如研制一种新药,需要推断此药是否有效?有人怀疑吸烟的人更容易患肺癌,那么吸烟是否与患肺癌有关呢?等等。
在对类似的问题作出推断时,我们不能仅凭主观意愿作出结论,需要通过试验来收集数据,并依据独立性检验的原理作出合理的分析推断.在本节的学习中,通过案例分析,使学生学会用假设检验的思想方法解决对于两个分类变量是否有关系的判断问题,并理解统计思维与确定性思维的差异。
【教学目标】:(1)知识与技能:理解分类变量的含义;会根据收集的数据列出2×2列联表,并会阅读三维柱形图和二维条形图,并粗略判断两个分类变量是否有关系;理解假设检验思想,会利用独立性检验精确判断两个分类变量是否有关系;(2)过程与方法:利用学生身边熟悉的问题引入分类变量是否相关的问题;运用统计学解决问题的一般思路引导学生;让学生经历假设检验思想的形成及运用过程,领会分析、总结的方法;(3)情感态度与价值观:通过提供适当的情境资料,吸引学生的注意力,激发学生的学习兴趣;在合作讨论中学会交流与合作,启迪思维,提高创新能力;通过实际问题的解决和从不同角度对问题的解决,可提高学生应用数学能力。
【教学重点】:理解独立性检验的基本思想及实施步骤。
【教学难点】:.(1)了解独立性检验的基本思想;(2)了解随机变量2K太大认为两个分类变量是有关系的。
K的含义,2【课前准备】:课件【教学过程设计】:同步练习与测试:(基础题)1、根据下表计算:计算随机变量的观测值k= 。
【解析】把表格补充完整≈⨯⨯⨯⨯-⨯=17812222872)358514337(3002k 4.512、独立性检验常作的图形是 和 。
【答案】三维柱形图 ,二维条形图3、两个临界值为3.841与6.635。
当2 3.841k ≤时,认为事件A 与B 是 (填“有关的”或“无关的”);当2 6.635k >时,有99%的把握说事件A 与B 是 (填“有关的”或“无关的”)。
1.2 独立性检验的基本思想及其初步应用
1.2 独立性检验的基本思想及其初步应用【学习目标】1.了解独立性检验(只要求2×2列联表)的基本思想; 2.了解实际推断原理和假设检验的基本思想及其初步应用;3.通过实际问题培养学生的学习兴趣,激发学生学习的积极性和主动性。
【重难点】独里性检验的初步应用。
2×2列联表:求随机变量2K :22()()()()()n ad bc K a b c d a c b d -=++++,其中n a b c d =+++为样本容量1、利用独立性检验来考虑两个分类变量X 和Y 是否有关系时,通过查阅临界值表来确定断言“X 与Y 有关系”的可信度,如果K 2的观测值k>5.024,那么就推断“X 和Y 有关系”,这种推断犯错误的概率不超过 ( ).A .0.25B .0.75C .0.025D .0.9752.某高校“统计初步”课程的教师随机调查了选该课的一些学生,具体数据如下表所示,为了判断选修统计专业是否与性别有关系,根据表中数据,得到K 2的观测值k=()2501320107 4.84423272030⨯⨯-⨯≈⨯⨯⨯,因为4.844>3.841.所以我们得到的结论为3、某班主任对全班50名学生进行了作业量多少的调查,数据如下表:则认为喜欢玩游戏与认为作业量多少有关系的把握大约为 ( )A. 99%B. 95%C. 90%D.无充分依据4、在对人们的休闲方式的一次调查中,共调查了124人。
其中女性70人,男性54人。
女性中有43人主要的休闲方式是看电视,另外27人主要的休闲方式是运动;男性中有21人主要的休闲方式是看电视,另外33人主要的休闲方式是运动。
(1)根据以上数据建立一个2×2的列联表(2)能否在犯错误的概率不超过0.025的前提下,认为性别与休闲方式有关系?5.有甲、乙两个班级进行数学考试,按照大于等于85分为优秀,85分以下为非优秀统计成绩,得到如下所示的列联表:已知在全部105人中随机抽取1人,成绩优秀的概率为2 7,(1)求列联表中b和c的值;(2)能否在犯错误的概率不超过0.05的前提下认为成绩与班级有关系?巩固提高1、某医疗研究所为了检验某种血清预防感冒的作用,把500名使用血清的人与另外500名未使用血清的人一年中的感冒记录作比较,提出假设H0:“这种血清不能起到预防感冒的作用”,利用2×2列联表计算得K2≈3.918,经查临界值表知P(K2≥3.841)≈0.05.则下列结论中,正确结论的序号是.①有95%的把握认为“这种血清能起到预防感冒的作用”;②若某人未使用该血清,那么他在一年中有95%的可能性得感冒;③这种血清预防感冒的有效率为95%;④这种血清预防感冒的有效率为5%.2、关于分类变量x与y的随机变量K2的观测值k,下列说法正确的是 ( ).A.k的值越大,“X和Y有关系”可信程度越小B.k的值越小,“X和Y有关系”可信程度越小C.k的值越接近于0,“X和Y无关”程度越小D.k的值越大,“X和Y无关”程度越大3、为了判断高中三年级学生是否选修文科与性别的关系,现随机抽取50名学生,得到如下2×2列联表:则求认为选修文科与性别有关系出错的可能性。
独立性检验的基本思想及初步应用教案
独立性检验的基本思想及初步应用教案教学目标:1. 了解独立性检验的基本思想及应用;2. 学会使用独立性检验进行数据分析;3. 能够解释独立性检验的结果及意义。
教学内容:第一章:独立性检验概述1.1 独立性检验的定义1.2 独立性检验的作用1.3 独立性检验与相关性检验的区别第二章:独立性检验的基本原理2.1 抽样分布2.2 零假设与备择假设2.3 检验统计量第三章:卡方检验3.1 卡方检验的定义3.2 卡方检验的计算方法3.3 卡方检验的判断准则第四章:独立性检验的应用4.1 应用场景介绍4.2 应用实例分析4.3 结果解释与分析第五章:独立性检验的局限性及改进5.1 独立性检验的局限性5.2 改进方法介绍5.3 案例分析教学方法:1. 讲授法:讲解独立性检验的基本概念、原理及应用;2. 案例分析法:分析实际案例,让学生更好地理解独立性检验的方法及意义;3. 讨论法:引导学生思考独立性检验的局限性及改进方法。
教学评价:1. 课堂问答:检查学生对独立性检验基本概念的理解;2. 案例分析报告:评估学生运用独立性检验解决实际问题的能力;3. 期末考试:考察学生对独立性检验的全面掌握程度。
教学资源:1. 教材:《统计学原理》;2. 课件:独立性检验的相关内容;3. 案例素材:用于分析的的实际案例。
教学进度安排:1. 第一章:2课时;2. 第二章:2课时;3. 第三章:3课时;4. 第四章:4课时;5. 第五章:2课时。
独立性检验的基本思想及初步应用教案(续)教学内容:第六章:虚拟变量与独立性检验6.1 虚拟变量的概念6.2 虚拟变量在独立性检验中的应用6.3 虚拟变量检验的实例分析第七章:多重检验问题7.1 多重检验的定义及问题7.2 多重检验的解决方案7.3 多重检验在独立性检验中的应用第八章:独立性检验的软件操作8.1 常用统计软件介绍8.2 独立性检验的操作步骤8.3 独立性检验结果的解读第九章:独立性检验在实际领域的应用9.1 营销领域的应用案例9.2 医学领域的应用案例9.3 社会科学领域的应用案例第十章:总结与展望10.1 独立性检验的重要性10.2 独立性检验的发展趋势10.3 独立性检验在未来的挑战与机遇教学方法:1. 讲授法:讲解虚拟变量、多重检验及软件操作的相关知识;2. 案例分析法:分析实际案例,让学生更好地理解独立性检验的方法及意义;3. 实操演示法:展示独立性检验的软件操作过程,引导学生动手实践。
独立性检验的基本思想及其初步应用(导学案)
1.2 独立性检验的基本思想及其初步应用【使用说明及学法指导】1、先精读教材P 10~ P 14内容,用红色笔进行勾画,再针对导学案的问题,二次阅读教材部分内容,并回答,时间为15分钟。
2、找出自己的疑惑和需要讨论的问题准备课上讨论和质疑。
3、必须记住的内容:独立性检验的基本思想和初步应用【学习目标】(1)了解独立性检验的基本思想和初步应用,能对两个分类变量是否有关做出明确的判断。
(2)明确对两个分类变量的独立性检验的基本思想具体步骤,会对具体问题作出独立性检验。
(3)高效学习,通过对典型案例的探究,激发学习数学激情。
预习案一.预习自习1、对于性别变量,其取值为男和女两种。
这种变量的不同“值”表示个体所属的不同类别像这样的变量称为2、列出的两个分类变量的频数表,称为3、一般地,假设有两个分类变量X 和Y ,它们的可能取值分别为{21,x x }和{21,y y }, 其样本频数列联表如下:计算观测值K 2=其中n= )4. 利用随机变量K 2来确定是否能以给定把握认为“两个分类变量有关系”的方法,称为两个分类量的5、利用独立性检验来考察两个分类变量是否有关系,并且能较精确地给出这种判断的可靠程度的具体做法是(1) (2) (3)二、预习检测示范例题1、通过下表确定的临界值:于两个分类变X 和Y ,假设求K 2的观测值为先从上表到比 4.452小且最近的数为 3.841.它对应的概率为0.05.因此可算得1-0.05=0.95即可估计有95 %的可能认为变量X 和Y 有关.问题:1、若计算得到k ≈7.514,能够估计有 的把握认为变量X 和Y 有关。
例2\为调查吸烟是否对肺癌有影响,某肿瘤研究所随机地调查了9965人,得到如下结果(单位:人)解法一:直观法。
吸烟的患病率为 ≈ 不吸烟的患病率为 ≈ 根据统计分析的思想,用频率估计概率可知,吸烟者与不吸烟者患病的可能性存在差异。
可以认为患病与吸烟问题:2、这种“差异”有多大把握认为“患病与吸烟有关呢?能够有一个评判的标准呢?我们可以通过以下的统计分析回答这个问题。
独立性检验的基本思想及初步应用教案
独立性检验的基本思想及初步应用一、教学目标1. 让学生理解独立性检验的基本思想,掌握独立性检验的步骤和应用。
2. 培养学生运用独立性检验解决实际问题的能力,提高学生的数据分析素养。
3. 引导学生运用数学软件或计算器进行独立性检验,培养学生的操作能力。
二、教学内容1. 独立性检验的基本思想(1)理解独立性检验的定义和作用。
(2)掌握独立性检验的基本步骤:提出假设、构造检验统计量、确定显著性水平、计算临界值、做出结论。
2. 独立性检验的初步应用(1)学会运用独立性检验解决实际问题,如判断两个分类变量是否独立。
(2)学会运用数学软件或计算器进行独立性检验,提高数据分析能力。
三、教学重点与难点1. 教学重点:(1)独立性检验的基本思想及步骤。
(2)独立性检验在实际问题中的应用。
(3)运用数学软件或计算器进行独立性检验。
2. 教学难点:(1)独立性检验步骤中构造检验统计量的方法。
(2)如何正确选择显著性水平。
四、教学方法与手段1. 教学方法:(1)讲授法:讲解独立性检验的基本思想和步骤。
(2)案例教学法:分析实际问题,引导学生运用独立性检验。
(3)实践操作法:让学生运用数学软件或计算器进行独立性检验。
2. 教学手段:(1)多媒体课件:展示独立性检验的基本思想和步骤。
(2)数学软件或计算器:让学生进行实际操作。
五、教学过程1. 导入新课:通过一个实际问题引入独立性检验的概念,激发学生的兴趣。
2. 讲解独立性检验的基本思想:讲解独立性检验的定义、作用和基本步骤,让学生理解独立性检验的基本思想。
3. 案例分析:分析一个实际问题,引导学生运用独立性检验,体会独立性检验在解决实际问题中的应用。
4. 实践操作:让学生运用数学软件或计算器进行独立性检验,培养学生的操作能力。
5. 总结与反思:总结本节课的主要内容,让学生巩固所学知识,并思考如何更好地运用独立性检验解决实际问题。
六、教学拓展1. 引导学生探讨独立性检验在实际应用中的局限性,如样本量对检验结果的影响。
高中数学 1.2 独立性检验的基本思想及其初步应用教案
1.2独立性检验的基本思想及其初步应用(教师用书独具)●三维目标1.知识与技能了解独立性检验的基本思想、方法及初步应用.会从列联表(只要求2×2列联表)、柱形图、条形图直观分析两个分类变量是否有关.会用K2公式判断两个分类变量在某种可信程度上的相关性.2.过程与方法运用数形结合的方法,借助对典型案例的探究,来了解独立性检验的基本思想,总结独立性检验的基本步骤.3.情感、态度与价值观(1)通过本节课的学习,让学生感受数学与现实生活的联系,休会独立性检验的基本思想在解决日常生活问题中的作用.(2)培养学生运用所学知识,依据独立性检验的思想作出合理推断的实事求是的好习惯.●重点难点重点:理解独立性检验的基本思想及实施步骤.难点:了解独立性检验的基本思想、了解随机变量K2的含义.分别利用2×2列联表、等高条形图、K2公式分析两变量之间的关系,探究解题方法和规律,充分理解观测值k的意义,能熟练正确地对问题作出判断,达到化难为易的目的.(教师用书独具)●教学建议通过对典型案例“吸烟是否对患肺癌有影响?”的提出,联系生活,引起共鸣,激发学生的学习兴趣.从生活的实例出发,让学生充分体会数学与实际生活的联系,从而使得本节知识的形成更自然、更生动.要注重学生的主体参与,努力创设教师引导下的学生自主探究、合作交流的学习方式.建议在教学过程中,教师点拨、学生探讨,共同完成例题的解答.要注重数学的思想性,采用反证法做类比,帮助学生理解独立性检验的思想,通过课堂练习,检验学生能否熟练掌握用独立性检验思想解决实际问题的方法.●教学流程通过典型案例“吸烟是否与患肺癌有关系”的研究,介绍了独立性检验的基本思想、方法和初步应用.创设问题情境引出列联表、等高条形图和K2公式等基础知识.利用填一填的形式,使学生自主学习本节基础知识,并反馈了解,对理解有困难的概念加以讲解.引导学生在学习基础知识的基础上分析解决例题1的问题,并总结规律方法,完成变式训练.引导学生分析例题2,根据图中的数据计算出各类变量对应的频率,作出等宽且高度均为1的条形图.并通过图形作出判断,完成变式训练.完成当堂双基达标,巩固所学知识及应用方法,并进行反馈矫正.归纳整理,进行课堂小结,整体认识本节所学知识,强调重点内容和规律方法.要求学生借鉴例题3的解法完成变式训练.给出易错辨析题目及错解,让学生讨论错因,并给出正确解答.引导学生探究例题3的解法,(1)直接由表中数据代入公式,作出判断.(2)列出列联表,由公式计算观测值,作出判断.解后让学生总结规律方法.课标解读1.了解独立性检验的基本思想、方法及其简单应用.(重点) 2.通过收集数据,并依据独立性检验的原理作出合理推断,培养学生良好的思维习惯.(难点)分类变量与列联表【问题导思】吸烟变量有几种类别?国籍变量呢?【提示】 吸烟变量有吸烟与不吸烟两种类别,而国籍变量则有多种类别,如中国、美国、法国…….1.分类变量变量的不同“值”表示个体所属的不同类别,像这样的变量称为分类变量. 2.列联表(1)定义:列出的两个分类变量的频数表,称为列联表.(2)2×2列联表:一般地,假设有两个分类变量X 和Y ,它们的取值分别为{x 1,x 2}和{y 1,y 2},其样本频数列联表(称为2×2列联表)为:2×2列联表y 1 y 2 总计x 1 a b a +b x 2c d c +d 总计a +cb +da +b +c +d等高条形图【问题导思】表格和图形哪一个更能直观地反映出两个分类变量间是否相互影响? 【提示】 图形.(1)定义:将列联表中的数据用高度相同的两个条形图表示出来,其中两列的数据分别对应不同的颜色,这就是等高条形图.(2)特征:等高条形图与表格相比,更能直观地反映出两个分类变量间是否相互影响,常用等高条形图展示列联表数据的频率特征.(3)用法:观察等高条形图发现aa +b 和cc +d相差很大,就判断两个分类变量之间有关系.独立性检验(1)来判断“两个分类变量有关系”的方法称为独立性检验. (2)公式:K 2=n ad -bc 2a +bc +d a +cb +d,其中n =a +b +c +d 为样本容量.用2×2列联表分析两变量间的关系在对人们饮食习惯的一次调查中,共调查了124人,其中六十岁以上的70人,六十岁以下的54人.六十岁以上的人中有43人的饮食以蔬菜为主,另外27人则以肉类为主;六十岁以下的人中有21人饮食以蔬菜为主,另外33人则以肉类为主.请根据以上数据作出饮食习惯与年龄的列联表,并利用aa +b 与cc +d判断二者是否有关系.【思路探究】 对变量进行分类→求出分类变量的不同取值→作出2×2列联表→计算aa +b 与cc +d的值作出判断【自主解答】 2×2列联表如下:年龄在六 十岁以上 年龄在六 十岁以下 总计 饮食以蔬菜为主 43 21 64 饮食以肉类为主27 33 60 总计7054124a a +b =4364=0.671 875. cc +d =2760=0.45. 显然二者数据具有较为明显的差距,据此可以在某种程度上认为饮食习惯与年龄有关系.1.作2×2列联表时,注意应该是4行4列,计算时要准确无误. 2.作2×2列联表时,关键是对涉及的变量分清类别.题中条件不变,尝试用|ad -bc |的大小判断饮食习惯与年龄是否有关. 【解】 将本例2×2列联表中的数据代入可得 |ad -bc |=|43×33-21×27|=852.相差较大,可在某种程度上认为饮食习惯与年龄有关系.用等高条形图分析两变量间的关系某学校对高三学生作了一项调查,发现:在平时的模拟考试中,性格内向的学生426人中有332人在考前心情紧张,性格外向的学生594人中有213人在考前心情紧张.作出等高条形图,利用图形判断考前心情紧张与性格类别是否有关系.【思路探究】 作出2×2列联表―→根据列联表数据 作等高条形图―→对比乘积的差距判断两 个分类变量是否有关【自主解答】 作列联表如下:性格内向 性格外向 总计 考前心情紧张 332 213 545 考前心情不紧张94 381 475 总计4265941 020相应的等高条形图如图所示:图中阴影部分表示考前心情紧张与考前心情不紧张中性格内向的比例.从图中可以看出,考前紧张的样本中性格内向占的比例比考前心情不紧张样本中性格内向占的比例高,可以认为考前紧张与性格类型有关.1.利用列联表中数据计算出各类变量取值对应频率,作出等宽度且高度均为1的等高条形图.2.利用数形结合的思想,借助等高条形图来判断两个分类变量是否相关是判断变量相关的常见方法之一.一般地,在等高条形图中,aa +b 与cc +d相差越大,两个分类变量有关系的可能性就越大.作等高条形图时可以用列联表来寻找相关数据,作图要精确,且易于观察,使对结论的判断不出现偏差.某生产线上,质量监督员甲在生产现场时,990件产品中有合格品982件,次品8件;不在生产现场时,510件产品中有合格品493件,次品17件.试利用图形判断监督员甲在不在生产现场对产品质量好坏有无影响.【解】 根据题目所给数据得如下2×2列联表:合格品数 次品数 总计 甲在生产现场 982 8 990 甲不在生产现场493 17 510 总计1 475251 500相应的等高条形图如图所示.图中两个深色条的高分别表示甲在生产现场和甲不在生产现场样本中次品数的频率.从图中可以看出,甲不在生产现场样本中次品数的频率明显高于甲在生产现场样本中次品数的频率.因此可以认为质量监督员甲在不在生产现场与产品质量好坏有关系.独立性检验下表是某地区的一种传染病与饮用水的调查表:得病 不得病 总计 干净水 52 466 518 不干净水 94 218 312 总计146684830(1)(2)若饮用干净水得病的有5人,不得病的有50人,饮用不干净水得病的有9人,不得病的有22人.按此样本数据分析这种疾病是否与饮用水有关,并比较两种样本在反映总体时的差异.【思路探究】 求出k 2的值―→与临界值作比较―→作出判断.【自主解答】 (1)假设H 0:传染病与饮用水无关.把表中数据代入公式得: K 2的观测值k =830×52×218-466×942146×684×518×312≈54.21.在H 0成立的情况下,P (K 2>10.828)≈0.001,是小概率事件, 所以拒绝H 0.因此我们有99.9%的把握认为该地区这种传染病与饮用不干净水有关. (2)依题意得2×2列联表:得病 不得病 总计 干净水 5 50 55 不干净水 9 22 31 总计147286此时,K 2的观测值k =86×5×22-50×9214×72×55×31≈5.785.因为5.785>5.024,P (K 2>5.024)≈0.025,所以我们有97.5%的把握认为该种疾病与饮用不干净水有关.两个样本都能统计得到传染病与饮用不干净水有关这一相同结论,但(1)中我们有99.9%的把握肯定结论的正确性,(2)中我们只有97.5%的把握肯定.解决一般的独立性检验问题的步骤:(1)通过列联表确定a 、b 、c 、d 、n 的值,根据实际问题需要的可信程度确定临界值k 0; (2)利用K 2=n ad -bc 2a +bc +d a +cb +d求出K 2的观测值k ;(3)如果k ≥k 0,就推断“两个分类变量有关系”,这种推断犯错误的概率不超过α;否则就认为在犯错误的概率不超过α的前提下不能推断“两个分类变量有关系”.某社区医疗服务部门为了考察人的高血压病是否与食盐摄入量有关,对该社区的 1 633人进行了跟踪测查,得出以下数据:患高血压 未患高血压合计 喜欢较咸食物 34 220 254 喜欢清淡食物26 1 353 1 379 合计601 5731 633【解】 提出假设H 0:该社区患有高血压病与食盐的摄入量无关. 由公式计算K 2的观测值为 k =1 633×34×1 353-220×26260×1 573×254×1 379≈80.155.因为80.155>10.828,因此在犯错误的概率不超过0.001的前提下,我们认为该社区患有高血压病与食盐的摄入量有关.因未理解P (K 2≥k 0)的含义而致误某小学在对232名小学生调查中发现:180名男生中有98名有多动症,另外82名没有多动症,52名女生中有2名有多动症,另外50名没有多动症,用独立性检验方法判断多动症与性别是否有关系?【错解】 由题目数据列出如下列联表:多动症 无多动症 总计 男生 98 82 180 女生 2 50 52 总计100132232k =232×98×50-2×822100×132×180×52≈42.117>10.828.所以有0.1%的把握认为多动症与性别有关系.【错因分析】 应该是有(1-P (K 2≥10.828))×100%=(1-0.001)×100%的把握,而不是P (K 2≥10.828)×100%=0.001×100%的把握.【防范措施】 本题的错误之处在于不能正确理解独立性检验步骤的含义,当计算的K 2的观测值k 大于临界值k 0时,就可推断在犯错误的概率不超过α的前提下说两分类变量有关系.这一点需牢记,才能避免类似错误.【正解】 由题目数据列出如下列联表:多动症 无多动症 总计 男生 98 82 180 女生 2 50 52 总计100132232k =232×98×50-2×822100×132×180×52≈42.117>10.828.所以有99.9%的把握认为多动症与性别有关系.1.列联表与等高条形图列联表由两个分类变量之间频率大小差异说明这两个变量之间是否有关联关系,而利用等高条形图能形象直观地反映它们之间的差异,进而推断它们之间是否具有关联关系.2.对独立性检验思想的理解独立性检验的基本思想类似于数学中的反证法.先假设“两个分类变量没有关系”成立,计算随机变量K2的值,如果K2值很大,说明假设不合理.K2越大,两个分类变量有关系的可能性越大.1.在研究吸烟与患肺癌的关系中,通过收集数据、整理分析数据得“吸烟与患肺癌有关”的结论,并且在犯错误的概率不超过0.01的前提下认为这个结论是成立的,下列说法中正确的是( )A.100个吸烟者中至少有99人患有肺癌B.1个人吸烟,那么这个人有99%的概率患有肺癌C.在100个吸烟者中一定有患肺癌的人D.在100个吸烟者中可能一个患肺癌的人也没有【解析】独立性检验的结果与实际问题有差异,即独立性检验的结论是一个数学统计量,它与实际问题中的确定性存在差异.【答案】 D2.(2013·威海高二检测)分类变量X 和Y 的列联表如下,则( )y 1 y 2 总计x 1 a b a +b x 2c d c +d 总计a +cb +da +b +c +dA.ad -bc 越小,说明X 与Y 的关系越弱 B .ad -bc 越大,说明X 与Y 的关系越强 C .(ad -bc )2越大,说明X 与Y 的关系越强 D .(ad -bc )2越接近于0,说明X 与Y 的关系越强【解析】 由K 2的计算公式可知,(ad -bc )2越大,则K 2越大,故相关关系越强. 【答案】 C3.观察下列各图,其中两个分类变量x 、y 之间关系最强的是( )【解析】 在四幅图中,D 图中两个深色条的高相差最明显,说明两个分类变量之间关系最强.【答案】 D4.为了探究患慢性气管炎是否与吸烟有关,调查了339名50岁以上的人,调查结果如下表所示:患慢性气管炎未患慢性气管炎合计 吸烟 43 162 205 不吸烟 13 121 134 合计56283339【解】 从题目的2×2列联表中可知:a =43,b =162,c =13,d =121,a +b =205,c +d =134,a +c =56,b +d =283,n =a +b +c +d =339,代入公式:K 2=n ad -bc 2a +bc +d a +cb +d,得k =339×43×121-162×132205×134×56×283≈7.469.因为7.469>6.635,所以我们有99%的把握认为50岁以上的人患慢性气管炎与吸烟习惯有关系.一、选择题1.有两个分类变量X与Y的一组数据,由其列联表计算得k≈4.523,则认为“X与Y 有关系”犯错误的概率为( )A.95% B.90% C.5% D.10%【解析】P(K2≥3.841)≈0.05,而k≈4.523>3.841.这表明认为“X与Y有关系”是错误的可能性约为0.05,即认为“X与Y有关系”犯错误的概率为5%.【答案】 C2.(2013·大连高二检测)在一项中学生近视情况的调查中,某校男生150名中有80名近视,女生140名中有70名近视,在检验这些中学生眼睛近视是否与性别有关时用什么方法最有说服力( )A.平均数与方差B.回归分析C.独立性检验D.概率【解析】判断两个分类变量是否有关的最有效方法是进行独立性检验,故选C.【答案】 C3.利用独立性检验来考虑两个分类变量X和Y是否有关系时,通过查阅临界值表来确定推断“X与Y有关系”的可信度,如果k>5.024,那么就推断“X和Y有关系”,这种推断犯错误的概率不超过( )A.0.25 B.0.75C.0.025 D.0.975【解析】∵P(k>5.024)=0.025,故在犯错误的概率不超过0.025的条件下,认为“X 和Y有关系”.【答案】 C4.下面是调查某地区男女中学生喜欢理科的等高条形图,阴影部分表示喜欢理科的百分比,从图中可以看出( )图1-2-1A .性别与喜欢理科无关B .女生中喜欢理科的比为80%C .男生比女生喜欢理科的可能性大些D .男生不喜欢理科的比为60%【解析】 本题考查学生的识图能力,从图中可以分析,男生喜欢理科的可能性比女生大一些.【答案】 C5.在调查中发现480名男人中有38名患有色盲,520名女人中有6名患有色盲.下列说法正确的是( )A .男、女患色盲的频率分别为0.038,0.006B .男、女患色盲的概率分别为19240,3260C .男人中患色盲的比例比女人中患色盲的比例大,患色盲与性别是有关的D .调查人数太少,不能说明色盲与性别有关【解析】 男人中患色盲的比例为38480,要比女人中患色盲的比例6520大,其差值为|38480-6520|≈0.0 676,差值较大. 【答案】 C 二、填空题6.某班主任对全班50名学生作了一次调查,所得数据如表:认为作业多认为作业不多总计 喜欢玩电脑游戏 18 9 27 不喜欢玩电脑游戏8 15 23 总计262450错误的概率不超过0.01的前提下认为喜欢玩电脑游戏与认为作业多有关.【解析】 查表知若要在犯错误的概率不超过0.01的前提下认为喜欢玩电脑游戏与认为作业多有关,则临界值k 0=6.635.本题中,k ≈5.059<6.635,所以不能在犯错误的概率不超过0.01的前提下认为喜欢玩电脑游戏与认为作业多有关.【答案】 不能7.独立性检验所采用的思路是:要研究A ,B 两类型变量彼此相关,首先假设这两类变量彼此________.在此假设下构造随机变量K 2,如果K 2的观测值较大,那么在一定程度上说明假设________.【答案】 无关 不成立8.某高校《统计初步》课程的教师随机调查了选该课的一些学生的情况,具体数据如下表:专业性别 非统计专业 统计专业 男生 13 10 女生720为了检验主修统计专业是否与性别有关系,根据表中的数据得到随机变量K 2的观测值为k =50×13×20-10×7223×27×20×30≈4.844.因为k >3.841,所以确认“主修统计专业与性别有关系”,这种判断出现错误的可能性为________.【解析】 因为随机变量K 2的观测值k >3.841,所以在犯错误的概率不超过0.05的前提下认为“主修统计专业与性别有关系”.故这种判断出现错误的可能性为5%.【答案】 5% 三、解答题9.为了探究学生选报文、理科是否与对外语的兴趣有关,某同学调查了361名高二在校学生,调查结果如下:理科对外语有兴趣的有138人,无兴趣的有98人,文科对外语有兴趣的有73人,无兴趣的有52人.试分析学生选报文、理科与对外语的兴趣是否有关?【解】 列出2×2列联表理 文 总计 有兴趣 138 73 211 无兴趣 98 52 150 总计236125361K 2k =361×138×52-73×982236×125×211×150≈1.871×10-4.∵1.871×10-4<2.706,∴可以认为学生选报文、理科与对外语的兴趣无关.10.某校对学生课外活动进行调查,结果整理成下表:运用你所学过的知识进行分析,能否在犯错误的概率不超过0.005的前提下,认为“喜欢体育还是文娱与性别有关系”?体育文娱合计男生212344女生62935合计275279【解】由图可以直观地看出喜欢体育还是喜欢文娱与性别在某种程度上有关系,但只能作粗略判断,具体判断方法如下:假设“喜欢体育还是喜欢文娱与性别没有关系”,∵a=21,b=23,c=6,d=29,n=79,∴K2的观测值为k=79×21×29-23×6221+23×6+29×21+6×23+29≈8.106.且P(K2≥7.879)≈0.005,即我们得到的K2的观测值k≈8.106超过7.879,这就意味着:“喜欢体育还是文娱与性别没有关系”这一结论成立的可能性小于0.005,即在犯错误的概率不超过0.005的前提下认为“喜欢体育还是喜欢文娱与性别有关”.11.某企业有两个分厂生产某种零件,按规定内径尺寸(单位:mm)的值落在[29.94,30.06)的零件为优质品.从两个分厂生产的零件中各抽出了500件,量其内径尺寸,得结果如下表:甲厂:分组[29.86,29.90)[29.90,29.94)[29.94,29.98)[29.98,30.02)[30.02,30.06)[30.06,30.10)[30.10,30.14) 频数 12638618292614乙厂: 分组 [29.86, 29.90) [29.90, 29.94) [29.94, 29.98) [29.98, 30.02) [30.02, 30.06) [30.06, 30.10) [30.10,30.14) 频数297185159766218(1)试分别估计两个分厂生产零件的优质品率;(2)由以上统计数据填下面2×2列联表,并问是否有99%的把握认为“两个分厂生产的零件的质量有差异”.甲厂 乙厂 合计 优质品 非优质品 合计附:K 2=n ad -bc 2a +bc +d a +c b +dP (K 2≥k )0.05 0.01 k3.8416.635【解】 为360500=72%; 乙厂抽查的产品中有320件优质品,从而乙厂生产的零件的优质品率估计为320500=64%.(2)甲厂 乙厂 合计 优质品 360 320 680 非优质品 140 180 320 合计5005001 000k =2500×500×680×320≈7.353>6.635,因此,在犯错误的概率不超过0.01的前提下,即有99%的把握认为“两个分厂生产的零件的质量有差异”.(教师用书独具)在对人们休闲方式的调查中,已知男性占总调查人数的25,其中有一半的休闲方式是运动,而女性只有13的休闲方式是运动.经过调查员计算,在犯错误的概率不超过0.05的前提下,可认为“性别与休闲方式有关”,那么被调查的人中最少有多少人的休闲方式是运动?【思路探究】 (1)设总共调查了n 人,则其中男性有多少人?其中休闲方式为运动的有多少人?非运动的呢?(2)被调查的女性有多少人?休闲方式是运动的有多少人?非运动的呢? (3)根据题意,K 2的临界值为多少?K 2的观测值为多少?二者之间有什么关系? 【自主解答】 设总共调查n 人,则被调查的男性人数应为25n ,其中有n5人的休闲方式是运动;被调查的女性人数应为3n 5,其中有n5人的休闲方式是运动,列出2×2列联表如下:运动 非运动 总计 男性 n 5n 525n 女性 n 525n 3n 5总计25n 3n 5n由表中数据,得k=n ·n 5·2n 5-n 5·n522n 5·3n 5·2n 5·3n 5=n36.要使调查员在犯错误的概率不超过0.05的前提下认为“休闲方式与性别有关”,则k ≥3.841.所以n 36≥3.841.解得n ≥138.276.又n5∈N *,所以n ≥140.所以被调查的人中,以运动为休闲方式的最少有140×25=56(人).本题属于逆向探求型问题,目的在于训练K 2公式的熟练应用.解题的关键在于根据犯错误概率的上界α确定临界值k 0,然后设出未知数利用K 2≥k 0列出不等式进行解决.这里运用了方程思想和化归思想.有两个分类变量X 与Y ,其一组观测值如下面的2×2列联表所示:y 1 y 2合计 x 1 a20-a 20 x 215-a 30+a 45 合计155065其中a,15-a 均为大于5的整数,则a 取何值时,在犯错误的概率不超过0.10的前提下认为“X 和Y 有关系”?【解】 查表可知:要使犯错误的概率不超过0.1,则K 2≥2.706, 而K 2=65×[a ×30+a -15-a ×20-a ]220×45×15×50=13×65a -300250×45×60=13×13a -60290×60,因为K 2≥2.706, 所以13×13a -60290×60≥2.706.即(13a -60)2≥1 124,所以13a -60≥33.5或13a -60≤-33.5, 解得a ≥7.2或a ≤2.又⎩⎪⎨⎪⎧a >5,15-a >5,所以5<a <10,且a ∈Z ,所以a=6,7,8,9,又因为a≥7.2或a≤2,所以a=8或a=9.。
独立性检验的基本思想及初步应用教案
独立性检验的基本思想及初步应用教案教学目标:1. 了解独立性检验的基本思想及应用;2. 学会使用独立性检验进行数据分析;3. 能够解释独立性检验的结果及意义。
教学内容:一、独立性检验的基本思想1. 引入独立性检验的概念;2. 解释独立性检验的目的;3. 阐述独立性检验的基本步骤。
二、独立性检验的初步应用1. 介绍独立性检验的应用场景;2. 展示独立性检验的实际案例;3. 引导学生通过独立性检验分析数据。
三、独立性检验的计算方法1. 介绍独立性检验的计算方法;2. 解释卡方统计量的含义;3. 演示如何计算卡方统计量及p值。
四、独立性检验的结果解释1. 解释独立性检验的结果;2. 讲解如何判断假设检验的结果;3. 强调独立性检验的局限性。
五、独立性检验的实践操作1. 引导学生使用统计软件进行独立性检验;2. 分析实际数据,展示独立性检验的操作过程;教学方法:1. 采用案例教学法,结合实际数据进行分析;2. 利用统计软件进行独立性检验的演示;3. 引导学生进行小组讨论,分享学习心得。
教学评估:1. 课后作业:要求学生独立完成独立性检验的练习题;2. 课堂问答:提问学生关于独立性检验的概念及应用;3. 小组报告:评估学生在小组讨论中的表现及成果。
教学资源:1. 独立性检验的教学案例及数据;2. 统计软件及相关教学视频;3. 独立性检验的练习题及答案。
六、独立性检验的拓展应用1. 介绍独立性检验在其他领域的应用;2. 分析不同领域中独立性检验的实际案例;3. 引导学生探讨独立性检验的潜在拓展方向。
七、独立性检验的优缺点分析1. 阐述独立性检验的优点;2. 讨论独立性检验的局限性;3. 比较独立性检验与其他统计方法的差异。
八、独立性检验在实际研究中的应用案例1. 分享独立性检验在实际研究中的经典案例;2. 分析案例中独立性检验的使用方法和结果;3. 引导学生从案例中学习独立性检验的应用技巧。
九、独立性检验的敏感性分析1. 介绍独立性检验的敏感性分析概念;2. 解释敏感性分析在独立性检验中的作用;3. 演示如何进行独立性检验的敏感性分析。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
1. 2 独立性检验的基本思想及其初步应用
课前预习学案
一、预习目标:能用所学的知识对实际问题进行回归分析,体会回归分析的实际价值与基本
思想;了解判断刻画回归模型拟合好坏的方法――相关指数和残差分析。
二、预习内容
1. 给出例3:一只红铃虫的产卵数y 和温度x 有关,现收集了7组观测数据列于下表中,试建立y 与x 之间的回归方程.
温度/x C
21 23 25 27 29 32 35 产卵数/y 个 7
11
21 24 66
115
325
(学生描述步骤,教师演示)
2. 讨论:观察右图中的散点图,发现样本点并没有分布在某个带状区域内,即两个变量不呈线性相关关系,所以不能直接用线性回归方程来建立两个变量之间的关系.
课内探究学案
一、学习要求:
通过对典型案例的探究,了解独立性检验的基本思想、方法及初步应用
学习重点:
对独立性检验的基本思想的理解.
学习难点:
独立性检验的基本思想的应用.
二、学习过程:
知识点详解
知识点一:分类变量
对于性别变量,其取值为男和女两种.这种变量的不同“值”表示个体所属的不同类别,像这样的变量称为分类变量.
知识点二:列联表
为调查吸烟是否对患肺癌有影响,某肿瘤研究所随机调查了9965人,得到如下结果(单位:人):
吸烟与患肺癌列联表
不患肺癌 患肺癌 总计 不吸烟 7775 42 7817 吸烟 2099 49 2148 总计
9874
91
9965
像上表这样列出的两个分类变量的频数表,称为列联表. 知识点三:独立性检验
这种利用随机变量K 2
来确定在多大程度上可以认为“两个分类变量有关系”的方法称为两个分类变量的独立性检验.
知识点四:判断结论成立的可能性的步骤
一般地,假设有两个分类变量X 和Y ,它们的值域分别为{x 1,x 2}和{y 1,y 2},其样
501001502002503003500
10203040
温度
产卵数
本频数列联表(称为2×2列联表)为:
若要推断的论述为
H1:“X与Y有关系”,
可以按如下步骤判断结论H1成立的可能性:
(1)通过三维柱形图和二维条形图,可以粗略地判断两个分类变量是否有关系,但是这种判断无法精确地给出所得结论的可靠程度.
①在三维柱形图中,主对角线上两个柱形高度的乘积xd与副对角线上的两个柱形高度的乘积bc相差越大,H1成立的可能性就越大.
②在二维条形图中,可以估计满足条件X=x1的个体中具有Y=y1的个体所占的比例
a a+
b ,也可以估计满足条件X=x2的个体中具有Y=y1的个体所占的比例
c
c+d
.两个比例的
值相差越大,H1成立的可能性就越大.
(2)可以利用独立性检验来考察两个分类变量是否有关系,并且能较精确地给出这种判断的可靠程度.具体做法是:根据观测数据计算由K2=n(ad-bc)2
(a+b)(c+d)(a+c)(b+d)
给出的检验随机变量K2的值k,其值越大,说明“X 与Y有关系”成立的可能性越大.当得到的观测数据x,b,c,d都不小于5时,可以通过查
五、几个典型例题:
例1 三维柱形图中柱的高度表示的是(A)
A.各分类变量的频数B.分类变量的百分比
C.分类变量的样本数D.分类变量的具体值
例2 分类变量X和Y的列联表如下
X.xd-bc越小,说明X和Y关系越弱
B.xd-bc越大,说明X和Y关系越强
C.(xd-bc)2越大,说明X和Y关系越强
D.(xd-bc)2越接近于0 ,说明X和Y关系越强
例3 研究人员选取170名青年男女大学生的样本,对他们进行一种心理测验,发现有60名女生对该心理测验中的最后一个题目的反应是:作肯定的18名,不定的42名;男生110名在相同的项目上作肯定的有22名,否定的有88名.问:性别与态度之间是否存在某种关系?分别用图形和独立性检验的方法判断.
解:根据题目所给数据建立如下列联表
根据列联表中的数据得到K 2
=170×(22×42-18×88)
110×60×40×130
≈2.158<2.706
因此没有充分的证据显示“性别与态度有关”.
例 4 打鼾不仅影响别人休息,而且可能与患某种病症有关.下表是一次调查所得的数
解:根据列联表中数据,得到,
K 2
=1633×(30×1355-224×24)2
1379×254×54×1579
=68.033.
因为68.033>6.635,所以有99%的把握说,每一晚都打鼾与患心脏病有关
课后练习与提高
(1(2)试求出预报变量对解释变量的回归方程.(答案:所求非线性回归方程为0.69 1.112ˆy =e x .)。