高中数学第三章统计案例31独立性检验假设检验素材苏教版选修23

合集下载

高中数学第三章统计案例3.1独立性检验学案苏教版选修2-3(2021年整理)

高中数学第三章统计案例3.1独立性检验学案苏教版选修2-3(2021年整理)

2018版高中数学第三章统计案例3.1 独立性检验学案苏教版选修2-3 编辑整理:尊敬的读者朋友们:这里是精品文档编辑中心,本文档内容是由我和我的同事精心编辑整理后发布的,发布之前我们对文中内容进行仔细校对,但是难免会有疏漏的地方,但是任然希望(2018版高中数学第三章统计案例3.1 独立性检验学案苏教版选修2-3)的内容能够给您的工作和学习带来便利。

同时也真诚的希望收到您的建议和反馈,这将是我们进步的源泉,前进的动力。

本文可编辑可修改,如果觉得对您有帮助请收藏以便随时查阅,最后祝您生活愉快业绩进步,以下为2018版高中数学第三章统计案例3.1 独立性检验学案苏教版选修2-3的全部内容。

3.1 独立性检验学习目标1。

了解2×2列联表的意义。

2。

了解统计量χ2的意义。

3。

通过对典型案例分析,了解独立性检验的基本思想和方法.知识点一2×2列联表思考山东省教育厅大力推行素质教育,增加了高中生的课外活动时间,某校调查了学生的课外活动方式,结果整理成下表:体育文娱合计男生210230440女生60290350合计270520790如何判定“喜欢体育还是文娱与性别是否有联系”?梳理(1)2×2列联表的定义对于两个研究对象Ⅰ和Ⅱ,Ⅰ有两类取值,即类A和类B;Ⅱ也有两类取值,即类1和类2。

我们得到如下列联表所示的抽样数据:Ⅱ类1类2合计Ⅰ类A a b类B c d合计a+b+c+d(2)χ2统计量的求法公式χ2=错误!.知识点二独立性检验独立性检验的概念用χ2统计量研究两变量是否有关的方法称为独立性检验.知识点三独立性检验的步骤1.独立性检验的步骤要判断“Ⅰ与Ⅱ有关系”,可按下面的步骤进行:(1)提出假设H0:__________________;(2)根据2×2列联表及χ2公式,计算________的值;(3)查对临界值,作出判断.其中临界值如表所示:P(χ2≥x0)0。

数学选修23第三章统计案例教案

数学选修23第三章统计案例教案

第三章统计案例§独立性检验〔1〕1.某医疗机构为了了解呼吸道疾病与吸烟是否有关,进行了一次抽样调查,共调查了515个成年人,其中吸烟者220人,不吸烟者295人.调查结果是:吸烟的220人中有37人患呼吸道疾病〔简称患病〕,183人未患呼吸道疾病〔简称未患病〕;不吸烟的295人中有21人患病,274人未患病.问题:根据这些数据能否断定“患呼吸道疾病与吸烟有关〞?为了研究这个问题,〔1〕引导学生将上述数据用下表来表示:患病未患病合计吸烟37183220不吸烟21274295合计58457515一.建构数学1.独立性检验:〔1〕假设H0:患病与吸烟没有关系.假设将表中“观测值〞用字母表示,那么得下表:患病未患病合计吸烟a b a b不吸烟c d c d合计ac b d ab cd如果实际观测值与假设求得的估计值相差不大,就可以认为所给数据〔观测值〕不能否认假设H0.否那么,应认为假设H0不能接受,即可作出与假设H0相反的结论.〔2〕卡方统计量:为了消除样本对上式的影响,通常用卡方统计量〔2(观测值预期值)2χ〕来进行估计.预期值2卡方χ统计量公式:2χ2nad bc〔其中n a b c d〕a b c d a c b d由此假设H0成立,即患病与吸烟没有关系,那么2183,c21,d274代入计算得χ的值应该很小.把a37,b2H0成立的情况下,随机事件“2〞χ,统计学中有明确的结论,在发生的概率约为,即P(26.635)2,也就是说,在H0成立的情况下,对统计量χ进行屡次观测,观测值超过的频率约为.由此,我们有99%的把握认为H0不成立,即有99%的把握认为“患病与吸烟有关系〞.2象以上这种用统计量研究吸烟与患呼吸道疾病是否有关等问题的方法称为独立性检验.2.独立性检验的一般步骤:一般地,对于两个研究对象Ⅰ和Ⅱ,Ⅰ有两类取值:类A和类B〔如吸烟与不吸烟〕,Ⅱ也有两类取值:类1和类2〔如患呼吸道疾病与不患呼吸道疾病〕,得到如下表所示:Ⅱ类1类2合计类A a b a bⅠc d c d类B合计ac bd ab cd 推断“Ⅰ和Ⅱ有关系〞的步骤为:第一步,提出假设H0:两个分类变量Ⅰ和Ⅱ没有关系;第二步,根据2×2列联表和公式计算χ2统计量;第三步,查对课本中临界值表,作出判断.3.独立性检验与反证法:反证法原理:在一个假设下,如果推出一个矛盾,就证明了这个假设不成立;独立性检验〔假设检验〕原理:在一个假设下,如果一个与该假设矛盾的小概率事件发生,就推断这个假设不成立.四.数学运用1.例题:例1.在500人身上试验某种血清预防感冒的作用,把他们一年中的感冒记录与另外500名未用血清的人的感冒记录作比拟,结果如表所示.问:该种血清能否起到预防感冒的作用?未感冒感冒合计使用血清258242500未使用血清216284500合计4745261000分析:在使用该种血清的人中,有24248.4%的人患过感冒;在没有使用该种血清的人中,有28456.8%的500500人患过感冒,使用过血清的人与没有使用过血清的人的患病率相差较大.从直观上来看,使用过血清的人与没有使用过血清的人的患感冒的可能性存在差异.解:提出假设H0:感冒与是否使用该种血清没有关系.由列联表中的数据,求得21000(258284242216)2474526500500∵当H0成立时,2的概率约为,∴我们有99%的把握认为:该种血清能起到预防感冒的作用.例2.为研究不同的给药方式〔口服或注射〕和药的效果〔有效与无效〕是否有关,进行了相应的抽样调查,调查结果如表所示.根据所选择的193个病人的数据,能否作出药的效果与给药方式有关的结论?有效无效合计口服584098注射643195合计12271193分析:在口服的病人中,有586459%的人有效;在注射的病人中,有67%的人有效.从直观上来看,口服9895与注射的病人的用药效果的有效率有一定的差异,能否认为用药效果与用药方式一定有关呢?下面用独立性检验的方法加以说明.解:提出假设H0:药的效果与给药方式没有关系.由列联表中的数据,求得2193(58314064)2122719895当H0成立时,2的概率大于15%,这个概率比拟大,所以根据目前的调查数据,不能否认假设H0,即不能作出药的效果与给药方式有关的结论.说明:如果观测值2,那么就认为没有充分的证据显示“Ⅰ与Ⅱ有关系〞,但也不能作出结论“H0成立〞,即Ⅰ与Ⅱ没有关系.§独立性检验〔2〕二.数学运用1.练习题:1.在对人们的休闲方式的一次调查中,共调查了124人,其中女性70人,男性54人。

高中数学选修课件第三章§独立性检验

高中数学选修课件第三章§独立性检验

针对性解决策略和建议
深入理解独立性概念
明确事件独立与随机变量独立的区别,熟练掌握 相关公式和定理的适用条件。
正确选择统计性检验。
ABCD
重视样本容量的选择
在进行独立性检验时,应根据实际情况选择合适 的样本容量,以保证结果的准确性。
明确显著性水平的意义
结果分析与讨论
结果描述
详细阐述检验结果,包 括统计量、显著性水平
等信息。
结果解释
结合研究问题和假设, 对检验结果进行合理解
释。
结果比较
将本研究结果与已有研 究进行比较,分析异同
点。
结果推广与应用
探讨本研究结果的推广 价值和应用前景。
06
独立性检验常见问题及解决方法
常见错误类型及原因剖析
错误理解独立性概念
在判断两个分类变量是否独立时,需 要结合实际情况和专业知识进行综合 判断,避免盲目依赖统计结果。
在计算卡方统计量时,需要注意期望 频数的计算方法,避免出现计算错误 。
需要注意独立性检验只能判断两个分 类变量之间是否存在关联,但不能确 定它们之间的因果关系。
03
独立性检验在统计学中应用
统计分析中作用
实际操作流程演示
确定研究问题和假设
明确研究目的,提出假设并确定检验标准 。
结果解释与报告
对检验结果进行解释,得出结论并撰写报 告。
收集数据
根据研究问题和假设,选择合适的方法收 集数据。
进行独立性检验
根据所选用的检验方法,对数据进行计算 和分析。
数据整理与预处理
对收集到的数据进行整理、清洗和转换, 以便于后续分析。
独立性检验可以帮助我们更好 地理解概率论中的基本概念, 如条件概率、联合概率等。

最新2020高中数学 第3章 统计案例 3.1 独立性检验教学案 苏教版选修2-3

最新2020高中数学 第3章 统计案例 3.1 独立性检验教学案 苏教版选修2-3

3.1 独立性检验1.2×2列联表的定义对于两个研究对象Ⅰ和Ⅱ,Ⅰ有两类取值,即类A和类B;Ⅱ也有两类取值,即类1和类2.这些取值可用下面的2×2列联表表示.2.χ2统计量的求法公式χ2=n(ad-bc)2(a+c)(b+d)(a+b)(c+d).3.独立性检验的概念用统计量χ2研究两变量是否有关的方法称为独立性检验.4.独立性检验的步骤要判断“Ⅰ与Ⅱ有关系”,可按下面的步骤进行:(1)提出假设H0:Ⅰ与Ⅱ没有关系;(2)根据2×2列联表及χ2公式,计算χ2的值;(3)查对临界值,作出判断.其中临界值如表所示:P(χ2≥x0)0.50 0.40 0.25 0.15 0.10 0.05 0.025 0.010 0.005 0.001χ00.455 0.708 1.323 2.072 2.706 3.841 5.024 6.635 7.879 10.82 8表示在H0成立的情况下,事件“χ≥x0”发生的概率.5.变量独立性判断的依据(1)如果χ2>10.828时,那么有99.9%的把握认为“Ⅰ与Ⅱ有关系”;(2)如果χ2>6.635时,那么有99%的把握认为“Ⅰ与Ⅱ有关系”;(3)如果χ2>2.706时,那么有90%的把握认为“Ⅰ与Ⅱ有关系”;(4)如果χ2≤2.706时,那么就认为没有充分的证据显示“Ⅰ与Ⅱ有关系”,但也不能作出结论“H0成立”,即Ⅰ与Ⅱ没有关系.1.在2×2列联表中,通常要求a,b,c,d的值均不小于5.2.表中|ad-bc|越小,Ⅰ与Ⅱ关系越弱;|ad-bc|越大,Ⅰ与Ⅱ关系越强.同时要记准表中a,b,c,d四个数据是交叉相乘然后再作差取绝对值,一定不要乘错.3.表中类A与类B,以及类1与类2的关系:对于对象Ⅰ来说,类A与类B是对立的,也就是说类A发生,类B一定不发生,类A不发生,则类B一定发生;同样对于对象Ⅱ来说,类1与类2的关系也是如此.[例1] 在一项有关医疗保健的社会调查中,发现调查的男性为530人,女性为670人,其中男性中喜欢吃甜食的为117人,女性中喜欢吃甜食的为492人,请作出性别与喜欢吃甜食的列联表.[思路点拨] 在2×2列联表中,共有两类变量,每一类变量都有两个不同的取值,然后找出相应的数据,列表即可.[精解详析] 作列联表如下:喜欢甜食不喜欢甜食合计男117413530女492178670合计609591 1 200[一点通] 分清类别是列联表的作表关键步骤.表中排成两行两列的数据是调查得来的结果.1.下面是2×2y1y2合计x1 a 2173x222527合计 b 46则表中a,b的值分别为________,________.解析:∵a+21=73,∴a=52.又∵a+2=b,∴b=54.答案:52 542.某学校对高三学生作一项调查后发现:在平时的模拟考试中,性格内向的426名学生中有332名在考前心情紧张,性格外向的594名学生中在考前心情紧张的有213人 .作出2×2列联表.性格内向 性格外向 合计 考前心情紧张 332 213 545 考前心情不紧张94 381 475 合计4265941 020[例2] 下表是某地区的一种传染病与饮用水的调查表:得病 不得病 合计 干净水 52 466 518 不干净水 94 218 312 合计146684830(1)这种传染病是否与饮用水的卫生程度有关,请说明理由;(2)若饮用干净水得病5人,不得病50人,饮用不干净水得病9人,不得病22人.按此样本数据分析这种疾病是否与饮用水有关,并比较两种样本在反映总体时的差异.[思路点拨] (1)根据表中的信息计算χ2的值,并根据临界值表来分析相关性的大小,对于(2)要列出2×2列联表,方法同(1).[精解详析] (1)假设H 0:传染病与饮用水无关.把表中数据代入公式,得χ2=830×(52×218-466×94)2146×684×518×312≈54.21,因为当H 0成立时,χ2≥10.828的概率约为0.001,所以我们有99.9%的把握认为该地区这种传染病与饮用不干净水有关. (2)依题意得2×2列联表:得病 不得病 合计 干净水 5 50 55 不干净水 9 22 31 合计147286此时,χ2=86×(5×22-50×9)214×72×55×31≈5.785.由于5.785>2.706,所以我们有90%的把握认为该种疾病与饮用不干净水有关.两个样本都能统计得到传染病与饮用不干净水有关这一相同结论,但(1)中我们有99.9%的把握肯定结论的正确性,(2)中我们只有90%的把握肯定.[一点通] 解决独立性检验问题的基本步骤是:①指出相关数据,作列联表;②求χ2的值;③判断可能性,注意与临界值作比较,得出事件有关的可能性大小.3.某保健药品,在广告中宣传:“在服用该药品的105人中有100人未患A 疾病”.经调查发现,在不使用该药品的418人中仅有18人患A 疾病,请用所学知识分析该药品对患A 疾病是否有效?解:依题意得2×2的列联表:患病 不患病 合计 使用 5 100 105 不使用 18 400 418 合计23500523要判断该药品对患A 疾病是否有效,即进行独立性检验提出假设H 0:该药品对患A 疾病没有效.根据列联表中的数据可以求得χ2=523×(5×400-100×18)223×500×418×105≈0.041 45<0.455,而查表可知P (χ2≥0.455)≈0.5,故没有充分的理由认为该保健药品对预防A 疾病有效.4.在国家未实施西部开发战略前,一新闻单位在应届大学毕业生中随机抽取1 000人问卷,只有80人志愿加入西部建设.而国家实施西部开发战略后,随机抽取1 200名应届大学毕业生问卷,有400人志愿加入国家西部建设.实施西部开发战略是否对应届大学毕业生的选择产生了影响?志愿者 非志愿者 合计 开发战略公布前 80 920 1 000 开发战略公布后400 800 1 200 合计4801 7202 200提出假设H 0:实施西部开发战略的公布对应届大学毕业生的选择没有产生影响,根据列联表中的数据,可以求得χ2=2 200×(80×800-920×400)2480×1 720×1 000×1 200≈205.22.因为当H 0成立时,χ2≥10.828的概率约为0.001,所以有99.9%的所握认为西部开发战略的实施对应届大学毕业生的选择产生了影响.独立性检验的基本思想与反证法的思想比较反证法 独立性检验要证明结论A要确认“两个对象有关系”在A 不成立的前提下进行推理 假设该结论不成立,即假设结论“两个对象没有关系”成立,在该假设下计算χ2推出矛盾意味着结论A 成立由观测数据计算得到的χ2的观测值很大,则在一定可信程度上说明假设不合理 没有找到矛盾,不能对A 下任何结论,即反根据随机变量χ2的含义,可以通过概率P (χ2证法不成立≥x0)的大小来评价该假设不合理的程度有多大,从而得出“两个对象有关系” 这一结论成立的可信程度有多大课下能力提升(十八)一、填空题1.在一项打鼾与患心脏病的调查中,共调查了1 671人,经过计算χ2=27.63,根据这一数据分析,我们有理由认为打鼾与患心脏病是________的.(有关,无关) 解析:由χ2值可判断有关.答案:有关2.若两个研究对象X和Y的列联表为:y1y2x1515x24010则X与Y之间有关系的概率约为________.解析:因为χ2=(5+15+40+10)×(5×10-40×15)2(5+15)×(40+10)×(5+40)×(15+10)≈18.8,查表知P(χ2≥10.828)≈0.001.答案:99.9%3.在吸烟与患肺病这两个对象的独立性检验的计算中,下列说法正确的是________.(填序号)①若χ2=6.635,则我们认为有99%的把握认为吸烟与患肺病有关系.那么在100个吸烟的人中必有99人患肺病.②从独立性检验的计算中求有99%的把握认为吸烟与患肺病有关系时,我们认为如果某人吸烟,那么他有99%的可能患肺病.③若从统计量中求出有95%的把握认为吸烟与患肺病有关系,是指有5%的可能性使得推断出现错误.④以上三种说法都不正确.解析:由独立性检验的意义可知,③正确.答案:③4.调查者询问了72名男女大学生在购买食品时是否观看营养说明得到如下2×2列联表:看营养说明不看营养说明总计男大学生28836从表中数据分析大学生的性别与看不看营养说明之间的关系是________.(填“有关”或“无关”)解析:提出假设H 0:大学生的性别与看不看营养说明无关,由题目中的数据可计算χ2=72×(28×20-16×8)244×28×36×36≈8.42,因为当H 0成立时,P (χ2≥7.879)≈0.005,这里的χ2≈8.42>7.879,所以我们有99.5%的把握认为大学生的性别与看不看营养说明有关.答案:有关5.有人发现,多看电视容易使人变冷漠,下表是一个调查机构对此现象的调查结果:则由表可知大约有解析:由公式得χ2=168×(68×38-42×20)2110×58×88×80≈11.377>10.828,所以我们有99.9%的把握说,多看电视与人变冷漠有关.答案:99.9% 二、解答题6.为研究学生的数学成绩与对学习数学的兴趣是否有关,对某年级学生作调查,得到如下数据:学生的数学成绩好坏与对学习数学的兴趣是否有关?解析:提出假设H 0:学生数学成绩的好坏与对学习数学的兴趣无关.由公式得χ2的值为χ2=189×(64×73-22×30)286×103×95×94≈38.459.∵当H 0成立时,χ2≥10.828的概率约为0.001,而这里χ2≈38.459>10.828,∴有99.9%的把握认为学生数学成绩的好坏与对学习数学的兴趣是有关的.7.考察小麦种子经过灭菌与否跟发生黑穗病的关系,经试验观察,得到数据如下列联表.试按照原试验目的作统计推断.解:提出假设H 0:种子是否灭菌与有无黑穗病无关.由公式得,χ2=460×(26×200-184×50)2210×250×76×384≈4.804.由于4.804>3.841,即当H 0成立时,χ2>3.841的概率约为0.05,所以我们有95%的把握认为种子是否灭菌与有无黑穗病是有关系的.8.为了调查某生产线上质量监督员甲是否在生产现场对产品质量好坏有无影响,现统计数据如下:甲在生产现场时,990件产品中有合格品982件,次品8件;甲不在生产现场时,510件产品中有合格品493件,次品17件.试用独立性检验的方法分析监督员甲是否在生产现场对产品质量好坏有无影响.解:2×2列联表如下提出假设H 0根据χ2公式得χ2=1 500(982×17-493×8)2990×510×1 475×25≈13.097.因为H 0成立时,χ2>10.828的概率约为0.001,而这里χ2≈13.097>10.828,所以有99.9%的把握认为质量监督员甲是否在生产现场与产品质量的好坏有关系.。

(必考题)高中数学高中数学选修2-3第三章《统计案例》检测(含答案解析)

(必考题)高中数学高中数学选修2-3第三章《统计案例》检测(含答案解析)

一、选择题1.以模型kx y ce =去拟合一组数据时,为了求出回归方程,设ln z y =,其变换后得到线性回归方程0.53z x =+,则c =( ) A .3B .3eC .0.5D .0.5e2.已知两个统计案例如下:①为了探究患肺炎与吸烟的关系,调查了339名50岁以上的人,调查结果如下表:②为了解某地母亲与女儿身高的关系,随机测得10对母女的身高如下表:则对这些数据的处理所应用的统计方法是( ) A .①回归分析,②取平均值 B .①独立性检验,②回归分析 C .①回归分析,②独立性检验D .①独立性检验,②取平均值3.假设有两个分类变量X 和Y 的22⨯列联表为:对同一样本,以下数据能说明X 与Y 有关系的可能性最大的一组为参考公式:22()()()()()n ad bc K a b c d a c b d -=++++,其中n a b c d =+++.A .5,35b d ==B .15,25b d ==C .20,20b d ==D .30,10b d ==4.为了解高中生作文成绩与课外阅读量之间的关系,某研究机构随机抽取了60名高中生,通过问卷调查,得到以下数据:2()P K k≥0.0500.0250.0100.0050.001k 3.841 5.024 6.6357.87910.828由以上数据,计算得到K2的观测值k≈9.643,根据临界值表,以下说法正确的是() A.没有充足的理由认为课外阅读量大与作文成绩优秀有关B.有0.5%的把握认为课外阅读量大与作文成绩优秀有关C.有99.9%的把握认为课外阅读量大与作文成绩优秀有关D.有99.5%的把握认为课外阅读量大与作文成绩优秀有关5.某中学共有5000人,其中男生3500人,女生1500人,为了了解该校学生每周平均体育锻炼时间的情况以及该校学生每周平均体育锻炼时间是否与性别有关,现在用分层抽样的方法从中收集300位学生每周平均体育锻炼时间的样本数据(单位:小时),其频率分布直方图如下:附:22()=()()()()n ad bcKa cb d a d b c-++++,其中n a b c d=+++.2()P K k≥0.100.050.010.005k 2.706 3.841 6.6357.879已知在样本数据中,有60位女生的每周平均体育锻炼时间超过4小时,根据独立性检验原理,我们()A.没有理由认为“该校学生每周平均体育锻炼时间与性别有关”B.有95%的把握认为“该校学生每周平均体育锻炼时间与性别有关”C.有95%的把握认为“该校学生每周平均体育锻炼时间与性别无关”D .有99.5%的把握认为“该校学生每周平均体育锻炼时间与性别有关”6.通过随机询问100名性别不同的居民是否能做到“光盘”行动,得到如下的列联表:做不到“光盘” 能做到“光盘” 男 45 10 女3015则有( )以上的把握认为“该市民能否做到‘光盘’与性别有关”,附表及公式()20P K k ≥0.100 0.050 0.010 0.001 0k 2.7063.8416.63510.828()()()()()22n ad bc K a b c d a c b d -=++++A .90%B .95%C .99%D .99.9%7.为了普及环保知识,增强环保意识,随机抽取某大学30名学生参加环保知识测试,得分如图所示,若得分的中位数为m e ,众数为m 0,平均数为x -,则( )A .m e =m 0=x -B .m 0<x -<m e C .m e <m 0<x -D .m 0<m e <x -8.某科研机构为了研究中年人秃发与心脏病是否有关,随机调查了一些中年人的情况,具体数据见下表:心脏病 无心脏病 秃发 20 300 不秃发5450根据表中数据得到()277520450530015.96820750320455k ⨯⨯-⨯=≈⨯⨯⨯,因为K 2≥10.828,则断定秃发与心脏病有关系,那么这种判断出错的可能性为( ) A .0.1B .0.05C .0.01D .0.0019.给出以下四个说法:①绘制频率分布直方图时,各小长方形的面积等于相应各组的组距;②在刻画回归模型的拟合效果时,R2的值越大,说明拟合的效果越好;③设随机变量ξ服从正态分布N(4,22),则P(ξ>4)=12;④对分类变量X与Y,若它们的随机变量K2的观测值k越小,则判断“X与Y有关系”的犯错误的概率越小.其中正确的说法是()A.①④B.②③C.①③D.②④10.在一项中学生近视情况的调查中,某校男生150名中有80名近视,女生140名中有70名近视,在检验这些中学生眼睛近视是否与性别有关时用什么方法最有说服力()A.平均数与方差 B.回归分析C.独立性检验 D.概率11.某中学学生会为了调查爱好游泳运动与性别是否有关,通过随机询问110名性别不同的高中生是否爱好游泳运动得到如下的列联表:由()()()()()22n ad bcka b c d a c b d-=++++并参照附表,得到的正确结论是A.在犯错误的概率不超过1%的前提下,认为“爱好游泳运动与性别有关”B.在犯错误的概率不超过1%的前提下,认为“爱好游泳运动与性别无关”C.有99.9%的把握认为“爱好游泳运动与性别有关”D.有99.9%的把握认为“爱好游泳运动与性别无关”12.通过随机询问2016名性别不同的大学生是否爱好某项运动,得到2 6.023K=,则根据这一数据查阅表,则有把握认为“爱好该项运动与性别有关”的可信程度是()2()P K k≥…0.250.150.100.0250.0100.005…k… 1.323 2.072 2.706 5.024 6.6357.879…A.90%B.95%C.97.5%D.99.5%二、填空题13.给出下列结论:①在回归分析中,可用相关指数2R的值判断模型的拟合效果,2R越大,模型的拟合效果越好;②某工厂加工的某种钢管,内径与规定的内径尺寸之差是离散型随机变量;③随机变量的方差和标准差都反映了随机变量的取值偏离均值的平均程度,它们越小,则随机变量偏离均值的平均程度越小;④甲、乙两人向同一目标同时射击一次,事件A:“甲、乙中至少一人击中目标”与事件B:“甲、乙都没有击中目标”是相互独立事件.其中结论正确的是______.14.新闻媒体为了了解观众对央视某节目的喜爱与性别是否有关,随机调查了观看该节目的观众110名,得到如下的2×2列联表:试根据样本估计总体的思想,估计约有________的把握认为“喜爱该节目与否和性别有关”.参考附表:(参考公式:K2=()()()()()2n ad bca b c d a c b d-++++,其中n=a+b+c+d)15.某市电信宽带私人用户月收费标准如下表:假定每月初可以和电信部门约定上网方案.若某用户每月上网时间为66小时,应选择__________方案最合算.16.下列是某厂1~4月份用水量(单位:百吨)的一组数据,由其散点图可知,用水量y与月份x 之间有较好的线性相关关系,其线性回归方程是=﹣0.7x+,则= . 月 份x 1 2 3 4 用水量y4.5432.517.为了判断高中二年级学生是否喜欢足球运动与性别的关系,现随机抽取50名学生,得到22⨯列联表:喜欢 不喜欢 总计 男 15 10 25 女520 25 总计 203050(参考公式22()()()()()n ad bc k a b c d a c b d -=++++,()n a b c d =+++)20()P K k ≥ 0.010 0.005 0.0010k 6.635 7.879 10.828则有___________以上的把握认为“喜欢足球与性别有关”.18.为了判断高中三年级学生选修文理科是否与性别有关,现随机抽取50名学生,得到2×2列联表:理科 文科 总计 男 13 10 23 女 7 20 27 总计203050已知P (K 2≥3.841)≈0.05,P (K 2≥5.024)≈0.025.根据表中数据,得到≈4.844,则认为选修文理科与性别有关系出错的可能性约为________. 19.下列说法:①分类变量A 与B 的随机变量2K 越大,说明“A 与B 有关系”的可信度越大.②以模型kx y ce =去拟合一组数据时,为了求出回归方程,设ln z y =,将其变换后得到线性方程0.34z x =+,则,c k 的值分别是4e 和0.3.③根据具有线性相关关系的两个变量的统计数据所得的回归直线方程为y a bx =+中,1,1,3b x y ===则1a =.正确的序号是________________.20.已知下列命题:①从匀速传递的产品生产流水线上,质检员每30分钟从生产流水线中抽取一件产品进行某项指标检测,这样的抽样方法是系统抽样;②两个变量的线性相关程度越强,则相关系数的值越接近于1;③两个分类变量X 与Y 的观测值2k ,若2k 越小,则说明“X 与Y 有关系”的把握程度越大;④随机变量X ~(0,1)N ,则(1)2(1)1P X P X <=<-. 其中为真命题的是__________.三、解答题21.为研究男、女生的身高差异,现随机从高三某班选出男生、女生各10人,并测量他们的身高,测量结果如下(单位:厘米): 男:173 178 174 185 170 169 167 164 161 170 女:165 166 156 170 163 162 158 153 169 172(1)根据测量结果完成身高的茎叶图(单位:厘米),并分别求出男、女生身高的平均值;(2)请根据测量结果得到20名学生身高的中位数h (单位:厘米),将男、女生身高不低于h 和低于h 的人数填入下表中,并判断是否有90%的把握认为男、女生身高有差异? 人数 男生 女生身高h ≥ 身高h <参照公式:()()()()()22n ad bc k a b c d a c b d -=++++()20P K k ≥ 0.100.05 0.025 0.010 0.005 0.001 0k2.7063.8415.0246.6357.87910.828175厘米为偏高.采用分层抽样的方法从以上男生中抽取5人作为样本.若从样本中任取2人,试求恰有1人身高属于正常的概率.22.某实验学校为提高学习效率,开展学习方式创新活动,提出了完成某项学习任务的两种新的学习方式.为比较两种学习方式的效率,选取40名学生,将他们随机分成两组,每组20人,第一组学生用第一种学习方式,第二组学生用第二种学习方式.40名学生完成学习任务所需时间的中位数40min m =,并将完成学习任务所需时间超过min m 和不超过min m 的学生人数得到下面的列联表:(Ⅰ)估计第一种学习方式且不超过m 的概率、第二种学习方式且不超过m 的概率; (Ⅱ)能否有99%的把握认为两种学习方式的效率有差异?附:()()()()()22n ad bc K a b c d a c b d -=++++,23.某科研小组为了验证一种治疗新冠肺炎的新药的效果,选60名患者服药一段时间后,记录了这些患者的生理指标x 和y 的数据,并统计得到如下的22⨯列联表(不完整):在生理指标 1.8x >的人中,设A 组为生理指标65y ≤的人,B 组为生理指标65y >的人,将他们服用这种药物后的康复时间(单位:天)记录如下: A 组:10,11,12,13,14,15,16,17,19. B 组:12,13,14,15,16,17,20,21,25.(1)填写上表,并判断是否有95%95%的把握认为患者的两项生理指标x 和y 有关系; (2)从A ,B 两组人中随机各选1人,A 组选出的人记为甲,B 组选出的人记为乙,求乙的康复时间比甲的康复时间长的概率.附:22()()()()()n ad bc K a b c d a c b d -=++++,其中n a b c d =+++.)20k0.2524.在第十五次全国国民阅读调查中,某地区调查组获得一个容量为200的样本,其中城镇居民150人,农村居民50人,在这些居民中,经常阅读的城镇居民100人,农村居民24人.(1)完成上面2×2列联表,并判断是否有95%的把握认为经常阅读与居民居住地有关?(2)从该地区居民城镇的居民中,随机抽取5位居民参加一次阅读交流活动,记这5位居民中经常阅读的人数为X,若用样本的频率作为概率,求随机变量X的分布列和期望.附:K2=2()()()()()n ad bca b c d a c b d-++++,其中n=a+b+c+d.25.某足球运动员进行射门训练,若打进球门算成功,否则算失败.已知某天该球员射门成功次数与射门距离的统计数据如下:(1)请问是否有90%的把握认为该球员射门成功与射门距离是否超过30米有关?参考公式及数据:22(),()()()()n ad bc K n a b c d a b c d a c b d -==+++++++.(2)当该球员距离球门30米射门时,设射门角(射门点与球场底线中点的连线和底线所成的锐角或直角)为([0,])2πθθ∈,其射门成功率为2+3()cos sin 4f θθθθθ=+⋅-,求该球员射门成功率最高时射门角θ的值.26.已知某种新型病毒的传染能力很强,给人们生产和生活带来很大的影响,所以创新研发疫苗成了当务之急.为此,某药企加大了研发投入,市场上这种新型冠状病毒的疫苗A 的研发费用x (百万元)和销量y (万盒)的统计数据如下:(1)根据上表中的数据,建立y 关于x 的线性回归方程y bx a =+(用分数表示); (2)根据所求的回归方程,估计当研发费用为1600万元时,销售量为多少?参考公式:()()()1122211nniii i i i nniii i x x y y x y nx yb x x xnx====---==--∑∑∑∑,a y bx =-.【参考答案】***试卷处理标记,请不要删除一、选择题 1.B 解析:B 【分析】根据指对数互化求解即可. 【详解】解:因为0.53z x =+,ln z y =,所以0.53ln x y +=,所以0.5330.5x x y e e e +==⨯,故3c e=.故选:B.【点睛】本题考查非线性回归问题的转化,是基础题.2.B解析:B【分析】根据独立性检验和回归分析的概念,即可作出判定,得到答案.【详解】由题意,独立性检验通常是研究两个分类变量之间是否有关系,所以①采用独立性检验,回归分析通常是研究两个具有相关关系的变量的相关程度,②采用回归分析,综上可知①是独立性检验,②是回归分析,故选B.【点睛】本题主要考查了独立性检验和回归分析的概念及其判定,其中解答中熟记独立性检验和回归分析的概念是解答的关键,着重考查了分析问题和解答问题的能力,属于基础题.3.D解析:D【解析】【分析】根据公式()()()()()22n ad bcKa b c d a c b d-=++++,分别利用4个选项中所给数据求出2K的值,比较所求值的大小即可得结果.【详解】选项A:22160(535155)3204010502K⨯⨯-⨯==⨯⨯⨯,选项B:22260(5251515)152040204016K⨯⨯-⨯==⨯⨯⨯,选项C:22360(5201520)24204025357K⨯⨯-⨯==⨯⨯⨯,选项D:22 460(5101530)96 204035257K⨯⨯-⨯==⨯⨯⨯,可得222431K K K>>22K>,所以由选项D中的数据得到的2K值最大,说明X与Y有关系的可能性最大,故选D.【点睛】本题主考查独立性检验的基本性质,意在考查对基本概念的理解与应用,属于基础题.解答独立性检验问题时,要注意应用2K越大两个变量有关的可能性越大这一性质.4.D解析:D【解析】【分析】由题意结合独立性检验的结论和临界值表给出结论即可.【详解】根据临界值表,9.643>7.879,在犯错误的概率不超过0.005的前提下,认为课外阅读量大与作文成绩优秀有关,即有99.5%的把握认为课外阅读量大与作文成绩优秀有关.本题选择D选项.【点睛】本题主要考查独立性检验的思想及其应用等知识,意在考查学生的转化能力和计算求解能力.5.B解析:B【解析】分析:根据题设收集的数据,得到男生学生的人数,进而得出22⨯的列联表,利用计算公式,求解2K的值,即可作出判断.详解:由题意得,从5000人中,其中男生3500人,女生1500人,抽取一个容量为300人的样本,其中男女各抽取的人数为35003002105000⨯=人,1500300905000⨯=人,又由频率分布直方图可知,每周体育锻炼时间超过4小时的人数的频率为0.75,所以在300人中每周体育锻炼时间超过4小时的人数为3000.75225⨯=人,又在每周体育锻炼时间超过4小时的人数中,女生有60人,所以男生有22560165-=人,可得如下的22⨯的列联表:结合列联表可算得22300(456016530)4.762 3.8412109075225K⨯⨯-⨯=≈>⨯⨯⨯,所以有95%的把握认为“该校学生的每周平均体育运动时间与性别有关”,故选B.点睛:本题主要考查了独立性检验的基础知识的应用,其中根据题设条件得到男女生的人数,得出22⨯的列联表,利用公式准确计算是解答的关键,着重考查了分析问题和解答问题的能力.6.A解析:A【解析】分析:根据列联表中数据代入公式计算k 的值,和临界值表比对后即可得到答案. 详解:将列联表中数据代入公式可得()210045153010 3.030 2.70675255545k ⨯⨯-⨯=≈>⨯⨯⨯,所以有0090的把握认为“该市居民能否做到‘光盘’”与性别有关.点睛:独立性检验的一般步骤:(1)根据样本数据制成22⨯列联表;(2)根据公式()()()()()22n ad bc K a b a d a c b d -=++++计算2K 的值;(3) 查表比较2K 与临界值的大小关系,作统计判断.(注意:在实际问题中,独立性检验的结论也仅仅是一种数学关系,得到的结论也可能犯错误.)7.D解析:D 【解析】由条形图知,30名学生的得分情况依次为2个人得3分,3个人得4分,10个人得5分,6个人得6分,3个人得7分,2个人得8分,2个人得9分,2个人得10分,中位数为第15,16个数(分别为5,6)的平均数,即m e =5.5,5出现的次数最多,故众数为m 0=5,平均数为x =130(2×3+3×4+10×5+6×6+3×7+2×8+2×9+2×10)≈5.97,故m 0<m e <x . 故答案为D.点睛:这个题目考查的是条型分布直方表的应用,以及基本量:均值,平均数的考查;一般在这类图中平均数就是将数据加到一起除以数据的个数即可,在频率分布直方表中是取每个长方条的中点乘以相应的频率并相加即可.8.D解析:D 【解析】010.828,10.0010.99999.90k ≥∴-==,则有0099.9以上的把握认为秃发与患心脏病有关,故这种判断出错的可能性为10.9990.001-=,故选D.【方法点睛】本题主要考查独立性检验的实际应用,属于难题.独立性检验的一般步骤:(1)根据样本数据制成22⨯列联表;(2)根据公式()()()()()22n ad bc K a b a d a c b d -=++++计算2K 的值;(3) 查表比较2K 与临界值的大小关系,作统计判断.(注意:在实际问题中,独立性检验的结论也仅仅是一种数学关系,得到的结论也可能犯错误.)9.B解析:B 【解析】①中各小长方形的面积等于相应各组的频率;②正确,相关指数R 2越大,拟合效果越好,R 2越小,拟合效果越差;③随机变量ξ服从正态分布N (4,22),正态曲线对称轴为x =4,所以P (ξ>4)=;④对分类变量X 与Y ,若它们的随机变量K 2的观测值k 越小,则说明“X 与Y 有关系”的犯错误的概率越大.故选B.10.C解析:C【解析】判断两个分类变量是否有关的最有效方法是进行独立性检验,故选C. 考点:独立性检验的意义.11.A解析:A 【解析】()22110403020207.8 6.63560506050k ⨯-⨯=≈>⨯⨯⨯,所以有99%的把握认为“爱好游泳运动与性别有关”,所以在犯错误的概率不超过1%的前提下,认为“爱好游泳运动与性别有关”12.C解析:C 【解析】因为2 6.023K =,且5.024 6.023 6.635≤≤,所以有把握认为“爱好该项运动与性别有关”的可信度P 满足10.02510.010P -≤≤-,即0.9750.99P ≤≤,应选答案C 。

高中数学 第三章 统计案例 3.1 独立性检验 假设检验(h

高中数学 第三章 统计案例 3.1 独立性检验 假设检验(h

假设检验(hypothesis testing)方法演变:t检验、z检验、F检验、卡方检验,方差分析( ANOVA)➢概述假设检验是分析数据的一种方法。

回答此类问题:“随机发生的事件的概率是多少?”另一方面的问题是:“我们从数据中发现的结果是真的吗?”当问题是有关大的总体而只能得到总体的一个样本时用假设检验。

这种方法被用来回答在质量改进中一系列重要的问题,如“我们在过程中所做的改变对产出创造了有意义的差别吗?”或”顾客对场地A的满意度是不是比其他场地高?”最常用的检验是:z检验、t检验、F检验、卡方(χ2)检验和方差分析。

这些检验和其他的检验都是基于均值、方差、比例及其他统计量所形成的具有常见模式的频率分布。

最有名的分布就是正态分布,它是:检验的基础。

t检验、F检验和卡方(χ2)检验是基于t分布、F分布和卡方分布。

➢适用场合·想知道一组或更多组数据的平均值、比例、方差或其他特征时;·当结论是基于更大总体中所取得的样本时。

例如:·想确定一个过程的均值或方差有否改变;·想确定很多数据集的均值或方差是否不同:·想确定两组不同的数据集的比例是否不同;·想确定真正的比例、均值或方差是否和一个定值相等(或大于或小于)。

➢实施步骤假设检验的步骤由三部分组成:理解要解决的问题并安排检验(以下步骤1~3);数字计算通常由计算机完成(步骤4和步骤5);应用数值结果到实际问题中(步骤6)。

虽然计算机能处理数字,但理解假没检验隐含的观念对第1部分和第3部分至关重要。

如果第一次接触假设检验,那么从看“注意事项”中的术语和定义开始。

这些定义解释了假设检验的慨念,然后再回来看这个步骤。

本书不可能详细地涉及假设检验。

这个步骤是个综述和快速参考。

要得到更多的信息,查阅统计学参考书或请教统计学家。

1确定要从数据中获得的结论。

选择适当的检验方法。

用哪种检验取决于检验的目的和数据的种类。

苏教版选修2-3高中数学3.1《独立性检验》ppt课件

苏教版选修2-3高中数学3.1《独立性检验》ppt课件

变式训练3 网络对现代人的生活影响较大,尤其 对青少年,为了解网络对中学生学习成绩的影响, 某地区教育主管部门从辖区初中生中随机抽取了 1000 人 调 查 , 发 现 其 中 经 常 上 网 的 有 200 人 , 这 200人中有80人期末考试不及格,而另外800人中 有120人不及格,问:中学生经常上网是否影响学 习,为什么?
4000×1820×240-180×17602 2000×2000×3580×420
≈9.577

6.635,
所以我们有 99%的把握认为学生是否关心国家大事与
性别有关.
(3)依题意男、女生人数分别是250人和200人,男生 中关心国家大事的人数为235人,女生中关心国家大 事的人数为170人; 列出2×2列联表如下:
2.独立性检验 (1)定义:我们用随机变量 χ2 来确定在多大程度上 可以认为“两个分类变量有关系”的方法称为两
个分类变量的独立性检验. (2)公式:χ2=a+bnc+add- ab+cc2b+d (3)步骤:①提出假设 H0:_Ⅰ__与__Ⅱ__没__有__关__系____; ②根据 2×2 列联表及 χ2 公式,计算的__χ2__值;
方法感悟
1.画列联表时要把两个分类变量分别作为第一行 和第一列,把数据填在相应的交叉点上,最右面一 列为对行的合计,最下面一行为对列的合计. 2.对卡方公式要从结构上结合列联表记忆,分母 分别是四个合计的积,分子是列联表主对角线之积 与副对角线之积的差的平方再乘样本容量.注意: 一是不要漏乘了样本容量,二是用公式时要细心计 算,防止出错.
【规范解答】 根据题目所给数据列出下列表格:
态度 性别
男生 女生 合计
肯定
22 18 40

江苏省苏州市第五中学高中数学选修2-3《独立性检验》教学设计

江苏省苏州市第五中学高中数学选修2-3《独立性检验》教学设计

新课标教材人教A版《数学2-3》(选修) 第三章统计案例《独立性检验》教学设计一、教学目标1.使学生理解分类变量(也称属性变量或定性变量)的含义,体会两个分类变量之间可能具有相关性;2.通过对典型案例(吸烟和患肺癌有关吗?)的探究,使学生了解独立性检验(只要求2×2列联表)的基本思想、方法、步骤及应用;3.鼓励学生体验用多种方法(等高条形图和独立性检验)解决同一问题,并对各种方法的优缺点进行比较;4.让学生对统计方法有更深刻的认识,体会统计方法应用的广泛性,进一步体会科学的严谨性(如统计可能犯错误,原因可能是收集的数据样本容量小或样本采集不合理,也可能是理论上的漏洞,如在一次实验中,我们假设小概率事件不发生,这一点本身就值得质疑).二、重点本节的重点内容是通过实例让学生体会独立性检验的基本思想,掌握独立性检验的一般步骤.三、难点在授课过程中,学生学习过程中遇到的困难主要有以下几个方面:1.2K的结构的比较奇特,也来的有点突然,学生可能会提出疑问。

2.如何理解独立性检验的基本思想?3.独立性检验的一般步骤及背后的理论依据是什么?4.为什么在最后表达结论的时候要说明“在犯错误的概率不超过XX的前提下”。

四、教学模式“问题串”模式为主,理清教学思路,鼓励学生思考;“讲授式”为辅,解释学生难以自主探究的知识内容.五、教学过程设计教学环节师生活动设计意图引子[有奖竞猜]师:播放一段视频(《铁齿铜牙纪晓岚》),让学生猜出电视剧的名称通过游戏激发学生的学习兴趣,为本节课的主要问题——吸烟生:观看视频,抢答与健康是否有关做好铺垫.问题导入师:问题1:吸烟会影响到烟民的寿命吗?“吸烟有害健康”,这是我们很熟悉的常识,因此我们很自然地认为,吸烟会减损人的寿命,然而也有很多例外。

一个吸烟而且长寿的人的例子能说明吸烟对人的健康没有影响吗?为什么?生:思考,回答通过这个问题,希望学生能回忆起统计的基本原则,即样本容量不能太小,样本的抽取方式应尽量保证随机性。

(压轴题)高中数学高中数学选修2-3第三章《统计案例》测试题(含答案解析)(1)

(压轴题)高中数学高中数学选修2-3第三章《统计案例》测试题(含答案解析)(1)

一、选择题1.假设有两个分类变量X 和Y 的22⨯列联表为:对同一样本,以下数据能说明X 与Y 有关系的可能性最大的一组为参考公式:22()()()()()n ad bc K a b c d a c b d -=++++,其中n a b c d =+++.A .5,35b d ==B .15,25b d ==C .20,20b d ==D .30,10b d ==2.已知x 与y 之间的几组数据如下表: x 1 2 4 5 y 0 2 3 5假设根据上表数据所得线性回归直线方程y=bx+a,若某同学根据上表中的前两组数据(1,0)和(2,2),求得的直线方程为y=b'x+a',则以下结论正确的是( ) A .b>b',a>a' B .b<b',a<a' C .b>b',a<a' D .b<b',a>a'3.经过对K 2的统计量的研究,得到了若干个观测值,当K 2≈6.706时,我们认为两分类变量A 、B ( )A .有67.06%的把握认为A 与B 有关系 B .有99%的把握认为A 与B 有关系C .有0.010的把握认为A 与B 有关系D .没有充分理由说明A 与B 有关系 4.有如下几个结论: ①相关指数R 2越大,说明残差平方和越小,模型的拟合效果越好; ②回归直线方程:y bx a =+,一定过样本点的中心:(,)x y ③残差点比较均匀地落在水平的带状区域中,说明选用的模型比较合适; ④在独立性检验中,若公式()()()()()22n ad bc K a b c d a c b d -=++++,中的|ad-bc|的值越大,说明“两个分类变量有关系”的可能性越强.其中正确结论的个数有( )个. A .1B .2C .3D .45.下列判断错误的是A .若随机变量ξ服从正态分布()()21,,30.72N P σξ≤=,则()10.28P ξ≤-=;B .若n 组数据()()()1122,,,,...,,n n x y x y x y 的散点都在1y x =-+上,则相关系数1r =-;C .若随机变量ξ服从二项分布: 15,5B ξ⎛⎫~ ⎪⎝⎭, 则()1E ξ=; D .am bm >是a b >的充分不必要条件;6.已知某种商品的广告费支出x (单位:万元)与销售额y (单位:万元)之间有如下对应数据:x 2 4 5 6 8 y3040506070根据上表可得回归方程y bx a =+,计算得7b =,则当投入10万元广告费时,销售额的预报值为 A .75万元 B .85万元 C .99万元D .105万元7.下列说法中,不正确的是A .两个变量的任何一组观测值都能得到线性回归方程B .在平面直角坐标系中,用描点的方法得到表示两个变量的关系的图象叫做散点图C .线性回归方程反映了两个变量所具备的线性相关关系D .线性相关关系可分为正相关和负相关8.为考察数学成绩与物理成绩的关系,在高二随机抽取了300名学生,得到下面的列联表:数学85~100分 数学85分以下 总计 物理85~100分 37 85 122 物理85分以下 35 143 178 总计72228300现判断数学成绩与物理成绩有关系,则犯错误的概率不超过 ( ) A .0.005 B .0.01C .0.02D .0.059.在调查中发现480名男人中有38名患有色盲,520名女人中有6名患有色盲.下列说法正确的是( )A .男、女人患色盲的频率分别为0.038,0.006B .男、女人患色盲的概率分别为,C .男人中患色盲的比例比女人中患色盲的比例大,患色盲与性别是有关的D .调查人数太少,不能说明色盲与性别有关10.已知,x y 的取值如下表:( )x0 1, 2 3 4 y11.33.25.68.9若依据表中数据所画的散点图中,所有样本点()(,)1,2,3,4,5i i x y i =都在曲线212y x a =+附近波动,则a =( ) A .1B .12C .13D .12-11.已知变量x ,y 的一组观测数据如表所示: x 3 4 5 6 7 y4.02.5-0.50.5-2.0据此得到的回归方程为y bx a =+,若a =7.9,则x 每增加1个单位,y 的预测值就( ) A .增加1.4个单位 B .减少1.2个单位C .增加1.2个单位D .减少1.4个单位12.下列说法:①分类变量A 与B 的随机变量2K 越大,说明“A 与B 有关系”的可信度越大.②以模型kx y ce =去拟合一组数据时,为了求出回归方程,设ln z y =,将其变换后得到线性方程0.34z x =+,则,c k 的值分别是4e 和0.3.③根据具有线性相关关系的两个变量的统计数据所得的回归直线方程为y a bx =+中,2,1,3b x y ===,则1a =.④如果两个变量x 与y 之间不存在着线性关系,那么根据它们的一组数据()(,1,2,,)i i x y i n =不能写出一个线性方程正确的个数是( )A .1B .2C .3D .4二、填空题13.x ,y 的取值如下表: x-2-1.5-1-0.50.51y 0.26 0.35 0.51 0.71 1.1 1.41 2.05则x ,y 之间的关系可选用函数___进行拟合.14.下列说法:①将一组数据中的每个数据都加上或减去同一个常数后,方差恒不变;②设有一个回归方程=3-5x ,变量x 增加一个单位时,y 平均增加5个单位;③线性回归方程=x +必过(,);④曲线上的点与该点的坐标之间具有相关关系;⑤在一个2×2列联表中,由计算得K 2=13.079,则其两个变量之间有关系的可能性是90%.其中错误的个数是________. 15.教材上一例问题如下:一只红铃虫的产卵数y 和温度x 有关,现收集了7组观测数据如下表,试建立y 与x 之间的回归方程. 温度 x /℃ 21 23 25 27 29 32 35 产卵数y /个711212466115325某同学利用图形计算器研究它时,先作出散点图(如图所示),发现两个变量不呈线性相关关系. 根据已有的函数知识,发现样本点分布在某一条指数型曲线21c xy c e =的附近(1c 和2c 是待定的参数),于是进行了如下的计算:根据以上计算结果,可以得到红铃虫的产卵数y 对温度x 的回归方程为__________.(精确到0.0001) (提示:21c xy c e =利用代换可转化为线性关系) 16.给出下列命题:①线性相关系数r 越大,两个变量的线性相关性越强;反之,线性相关性越弱;②由变量x 和y 的数据得到其回归直线方程:l ˆybx a =+,则l 一定经过点(),x y P ; ③从匀速传递的产品生产流水线上,质检员每10分钟从中抽取一件产品进行某项指标检测,这样的抽样是分层抽样;④在回归分析模型中,残差平方和越小,说明模型的拟合效果越好;⑤在回归直线方程0.110ˆyx =+中,当解释变量x 每增加一个单位时,预报变量ˆy 增加0.1个单位,其中真命题的序号是___________.17.以下四个命题中:①从匀速传递的产品生产流水线上,质检员每10分钟从中抽取一件产品进行某项指标检测,这样的抽样是分层抽样;②两个随机变量的线性相关性越强,相关系数的绝对值越接近于1; ③某项测量结果服从正太态布,则; ④对于两个分类变量和的随机变量的观测值来说,越小,判断“与有关系”的把握程度越大.以上命题中其中真命题的个数为___________.18.在吸烟与患肺病这两个分类变量的计算中,“若2x 的观测值为6.635,我们有99%的把握认为吸烟与患肺病有关系”这句话的意思: ①是指“在100个吸烟的人中,必有99个人患肺病 ②是指“有1%的可能性认为推理出现错误”; ③是指“某人吸烟,那么他有99%的可能性患有肺病”; ④是指“某人吸烟,如果他患有肺病,那么99%是因为吸烟”. 其中正确的解释是______.19.一个三位自然数百位,十位,个位上的数字依次为a ,b ,c ,当且仅当有两个数字的和等于第三个数字时称为“有缘数”(如213,134等),若{},,1234a b c ∈,,,,且a ,b ,c 互不相同,则这个三位数为”有缘数”的概率是__________. 20.下列说法:①线性回归方程y bx a =+必过(),x y ;②命题“21,34x x ∀≥+≥”的否定是“21,34x x ∃<+<” ③相关系数r 越小,表明两个变量相关性越弱;④在一个22⨯列联表中,由计算得28.079K =,则有99%的把握认为这两个变量间有关系;其中正确..的说法是__________.(把你认为正确的结论都写在横线上) 本题可参考独立性检验临界值表:三、解答题21.今年疫情期间,许多老师进行抖音直播上课某校团委为了解学生喜欢抖音上课是否与性别有关,从高三年级中随机抽取30名学生进行了问卷调查,得到如下列联表:男生 女生 合计 喜欢抖音上课 10不喜欢抖音上课8合计 30已知在这30人中随机抽取1人抽到喜欢抖音上课的学生的概率是815. (1)请将上面的列联表补充完整,并据此资料分析能否有95%的把握认为喜欢抖音上课与性别有关?(2)若从这30人中的女生中随机抽取2人,记喜欢抖音上课的人数为X ,求X 的分布列、数学期望. 附临界值表:()20P K k ≥0.10 0.05 0.010 0.005 0k2.7063.8416.637.879参考公式:22()()()()()n ad bc K a b c d a c b d -=++++,其中n a b c d =+++.22.某校从高三年级的男女生中各随机抽取了100人的体育测试成绩(以下称体测成绩,单位:分),数据都落在[)60100,内,其统计数据如表所示(其中不低于80分的学生为优秀).(1)请根据如表数据完成22⨯列联表,并通过计算判断,是否有95%的把握认为体测成绩与性别有关?(2)视频率为概率,在全校的高三学生中任取3人,记取出的3人中优秀的人数为X ,求X 的分布列和数学期望.附:()()()()()22n ad bc K a b c d a c b d -=++++,n a b c d =+++23.支付宝和微信支付是目前市场占有率较高的支付方式,某第三方调研机构对使用这两种支付方式的人数作了对比,从全国随机抽取了100个地区作为研究样本,计算了各个地区样本的使用人数,其频率分布直方图如下,(1)记A表示事件“微信支付人数低于50千人”,估计A的概率;(2)填写下面2╳2列联表,并根据2╳2列联表判断是否有99%的把握认为支付人数与支付方式有关;支付人数<50千支付人数≥50千人总计人微信支付 支付宝支付 总计附:2()P K k ≥0.050 0.010 0.001 k3.8416.63510.828()()()()()22n ad bc K a b c d a c b d -=++++.24.2020突如其来的疫情让我们经历了最漫长、最特殊的一个假期,教育行政部门部署了“停课不停学”的行动,全力帮助学生在线学习.复课后某校进行了摸底考试,某数学教师为了调查高二学生这次摸底考试的数学成绩与每天在线学习数学的时长之间的相关关系,对在校高二学生随机抽取45名进行调查,了解到其中有25人每天在线学习数学的时长不超过1小时,并得到如下的等高条形图:(1)根据等高条形图填写下面22⨯列联表,并根据列联表判断能否在犯错误的概率不超过0.05的前提下认为“高二学生的这次摸底考试数学成绩与其每天在线学习数学的时长有关”;数学成绩不超过120分 数学成绩超过120分 总计 每天在线学习数学不超过1小时 25每天在线学习数学超过1小时总计45(2)从被抽查的,且这次数学成绩超过120分的学生中,再随机抽取3人,求抽取的3人中每天在线学习数学的时长超过1小时的人数ξ的分布列与数学期望. 附临界值表()20P K k ≥0.050 0.010 0.001 0k3.8416.63510.828参考公式:()()()()()22n ad bc K a b c d a c b d -=++++,其中n a b c d =+++.25.某单位组织开展“学习强国”的学习活动,活动第一周甲、乙两个部门员工的学习情况统计如下:学习活跃的员工人数 学习不活跃的员工人数甲 18 12 乙328(1)根据表中数据判断能否有95%的把握认为员工学习是否活跃与部门有关; (2)活动第二周,单位为检查学习情况,从乙部门随机抽取2人,发现这两人学习都不活跃,能否认为乙部门第二周学习的活跃率比第一周降低了?说明理由.参考公式:22()()()()()n ad bc K a b c d a c b d -=++++,其中n a b c d =+++.参考数据:2(0.1) 2.706P K ≥=,2(0.05) 3.841P K ≥=,2(0.01) 6.635P K ≥=. 26.根据国家统计局数据,1999年至2019年我国进出口贸易总额从3万亿元跃升至31.6万亿元,中国在国际市场上的贸易份额越来越大对外贸易在国民经济中的作用日益突出.将年份1999,2004,2009,2014,2019分别用1,2,3,4,5代替,并表示为t ,y 表示全国进出口贸易总额.(1)根据以上统计数据及图表,给出了下列两个方案,请解决方案1中的问题. 方案1:用y bt a =+作为全国进出口贸易总额y 关于t 的回归方程,根据以下参考数据,求出y 关于t 的回归方程,并求相关指数21R .方案2:用dt y ce =作为全国进出口贸易总额y 关于t 的回归方程,求得回归方程0.57212.3259x y e =,相关指数22R .(2)通过对比(1)中两个方案的相关指数,你认为哪个方案中的回归方程更合适,并利用此回归方程预测2020年全国进出口贸易总额. 参考数据:①0.140.340.66 1.86 2.048.192++++=②222220.140.34 1.86 2.04 2.1412.336++++=③8.1920.0147555.792≈④12.3360.0222555.792≈参考公式:线性回归方程中的斜率和截距的最小二乘法估计公式分别为:()()()121nii i nii xx y yb xx==--=-∑∑,a y bx =-,相关指数()()221211ni ii n ii y y R yy==-=--∑∑.【参考答案】***试卷处理标记,请不要删除一、选择题 1.D 解析:D 【解析】 【分析】 根据公式()()()()()22n ad bc K a b c d a c b d -=++++,分别利用4个选项中所给数据求出2K 的值,比较所求值的大小即可得结果. 【详解】选项A :22160(535155)3204010502K ⨯⨯-⨯==⨯⨯⨯,选项B :22260(5251515)152040204016K ⨯⨯-⨯==⨯⨯⨯,选项C :22360(5201520)24204025357K ⨯⨯-⨯==⨯⨯⨯,选项D :22460(5101530)96204035257K ⨯⨯-⨯==⨯⨯⨯,可得222431K K K >>22K >,所以由选项D 中的数据得到的2K 值最大,说明X 与Y 有关系的可能性最大,故选D . 【点睛】本题主考查独立性检验的基本性质,意在考查对基本概念的理解与应用,属于基础题.解答独立性检验问题时,要注意应用2 K 越大两个变量有关的可能性越大这一性质.2.D解析:D 【解析】 【分析】先根据()()1,0,2,2求得直线y b x a ='+'的方程.然后计算出回归直线方程y bx a =+,由此比较大小,得出正确的结论. 【详解】由于直线y b x a ='+'过()()1,0,2,2,将两点坐标代入直线方程得022b a b a +=⎧⎨+=''''⎩,解得2,2b a ''==-.124534x +++==,02352.54y +++==,1122334414122542x y x y x y x y +++=+++=.2222123414162546x x x x +++=+++=,故24243 2.54230121.24643463610b -⨯⨯-====-⨯-, 2.5 1.23 2.5 3.6 1.1a =-⨯=-=-.所以,a a b b >'<',故选D.【点睛】本小题主要考查利用直线上的两点坐标求直线方程的方法,考查回归直线方程的计算,属于中档题.3.B解析:B 【分析】根据所给的观测值,同临界值表中的临界值进行比较,根据P (K 2>3.841)=0.05,得到我们有1-0.05=95%的把握认为A 与B 有关系. 【详解】 依据下表:2 6.635K > , 2 6.6350.01P K =(>)∴我们在错误的概率不超过0.01的前提下有99%的把握认为A 与B 有关系, 故选B . 【点睛】本题考查独立性检验的应用,本题解题的关键是正确理解临界值对应的概率的意义,本题不用运算只要理解概率的意义即可.4.D解析:D 【分析】根据相关指数定义、残差平方和含义可得①为真,根据回归直线方程特征可得②为真,根据残差点含义可得③为真,根据卡方含义可得④为真. 【详解】相关指数R 2越大,则残差平方和越小,模型的拟合效果越好;回归直线方程:ˆy bx a =+,一定过点() ,x y ;若残差点比较均匀地落在水平的带状区域中,则选用的模型比较合适; 在独立性检验中,若公式()()()()()22n ad bc K a b c d a c b d -=++++,中的|ad-bc|的值越大,则2K 越大, “两个分类变量有关系”的可能性越强.选D. 【点睛】相关指数R 2越大,残差平方和越小,残差点比较均匀地落在水平的带状区域,则模型的拟合效果越好;在独立性检验中,若2 K 越大,则两个变量有关系越强;回归直线方程:ˆy bx a =+,一定过点() ,x y .5.D解析:D 【解析】分析:根据正态分布的对称性求出()1P ξ≤-的值,判断A 正确; 根据线性相关关系与相关系数的定义,判断B 正确; 根据二项分布的均值计算公式求出()E ξ的值,判断C 正确; 判断充分性和必要性是否成立,得出D 错误.详解:对于A ,随机变量ξ服从正态分布()21,N σ,∴曲线关于1ξ=对称,131310.720.28PP P ξξξ∴≤-=≥=-≤=-=()()(),A 正确;对于B ,若n 组数据()()()1122,,,,...,,n n x y x y x y 的散点都在1y x =-+上, 则x y ,成负相关,且相关关系最强,此时相关系数1r =-,B 正确;对于C ,若随机变量ξ服从二项分布: 15,5B ξ⎛⎫~ ⎪⎝⎭,则1515E(),ξ=⨯= C 正确;对于D ,am >bm 时,a >b 不一定成立,即充分性不成立,a b am bm >时,> 不一定成立,即必要性不成立,是既不充分也不必要条件,D 错误. 故选:D .点睛:本题考查了命题真假的判断问题,是综合题.6.B解析:B 【解析】分析:根据表中数据求得样本中心(,)x y ,代入回归方程ˆ7ˆyx a =+后求得ˆa ,然后再求当10x =的函数值即可. 详解:由题意得11(24568)5,(3040506070)5055x y =++++==++++=, ∴样本中心为(5,50).∵回归直线ˆ7ˆyx a =+过样本中心(5,50), ∴ˆ5075a=⨯+,解得ˆ15a =, ∴回归直线方程为ˆ715yx =+. 当10x =时,710158ˆ5y=⨯+=, 故当投入10万元广告费时,销售额的预报值为85万元. 故选B .点睛:本题考查回归直线过样本中心这一结论和平均数的计算,考查学生的运算能力,属容易题.7.A解析:A 【解析】要得到线性回归方程应至少有两个变量的两组观测值,因此A 不正确.根据散点图、线性回归方程、线性相关关系的概念可得B ,C ,D 都正确.故选A .8.D解析:D 【解析】因为K 2的观测值k=2300(371433585)12217872228⨯-⨯⨯⨯⨯≈4.514>3.841, 所以在犯错误的概率不超过0.05的前提下认为数学成绩与物理成绩有关系. 选D.9.C解析:C 【解析】男人中患色盲的比例为,要比女人中患色盲的比例大,其差值为,差值较大,所以认为患色盲与性别是有关的.考点:独立性检验.10.A解析:A 【解析】 设2t x = ,则11(014916)6,(1 1.3 3.2 5.68.9)455t y =++++==++++=,所以点(6,4)在直线12y t a =+上,求出1a =,选A. 点睛:本题主要考查了散点图,属于基础题.样本点的中心(),x y 一定在直线回归直线上,本题关键是将原曲线变形为12y t a =+,将点(6,4)代入,求出值. 11.D解析:D 【解析】由表格得 5x =, 0.9y =,∵回归直线方程为7ˆ9ˆ.y bx=+,过样本中心, ∴57.90.9b +=,即75b =-,则方程为77.95ˆyx =-+,则x 每增加1个单位,y 的预测值就减少1.4个单位,故选D.12.C解析:C 【解析】①分类变量A 与B 的随机变量2K 越大,说明“A 与B 有关系”的可信度越大,正确; ②∵kx y ce =,∴两边取对数,可得lny ln =(kx ce )kx lnc lnce lnc kx =+=+, 令z lny =,可得z lnc kx =+, ∵0.34z x =+, ∴40.3lnc k ==, ∴4c e =.即②正确;③根据具有线性相关关系的两个变量的统计数据所得的回归直线方程为y =a +bx 中,2,1,3b x y ===,则a =1,正确。

高中数学苏教版选修2-3:3.1 独立性检验

高中数学苏教版选修2-3:3.1 独立性检验

遇上你是缘分,愿您生活愉快,身
7
体健康,学业有成,金榜题名!
[精解详析] 作列联表如下:
喜欢甜食 不喜欢甜食 合计

117
413
530

492
178
670
合计 609
591 1 200
[一点通] 分清类别是列联表的作表关键步骤.表中排成两行 两列的数据是调查得来的结果.
遇上你是缘分,愿您生活愉快,身
遇上你是缘分,愿您生活愉快,身
17
体健康,学业有成,金榜题名!
4.在国家未实施西部开发战略前,一新闻单位在应届大学毕业
生中随机抽取 1 000 人问卷,只有 80 人志愿加入西部建设.而
国家实施西部开发战略后,随机抽取 1 200 名应届大学毕业生
问卷,有 400 人志愿加入国家西部建设.实施西部开发战略
考前心情不紧张 94
381 475
合计
426
594 1 020
遇上你是缘分,愿您生活愉快,身
10
体健康,学业有成,金榜题名!
[例 2] 下表是某地区的一种传染病与饮用水的调查表:
得病 不得病 合计
干净水 52 466 518
不干净水 94 218 312
合计 146 684 830
(1)这种传染病是否与饮用水的卫生程度有关,请说明理由;
遇上你是缘分,愿您生活愉快,身
19
体健康,学业有成,金榜题名!
独立性检验的基本思想与反证法的思想比较
反证法
独立性检验
要证明结论 A
要确认“两个对象有关系”
假设该结论不成立,即假设结论 在 A 不成立的前
“两个对象没有关系”成立,在该 提下进行推理

(压轴题)高中数学高中数学选修2-3第三章《统计案例》测试(包含答案解析)(3)

(压轴题)高中数学高中数学选修2-3第三章《统计案例》测试(包含答案解析)(3)

一、选择题1.已知x 与y 之间的几组数据如下表: x 1 2 3 4 y1mn4参考公式:线性回归方程y bx a =+,其中()()()121niii nii x x y y b x x ==--=-∑∑,a y bx =-;相关系数()()()()12211niii nniii i x x y y r x x y y ===--=--∑∑∑.上表数据中y 的平均值为2.5,若某同学对m 赋了三个值分别为1.5,2,2.5得到三条线性回归直线方程分别为11y b x a =+,22y b x a =+,33y b x a =+,对应的相关系数分别为1r ,2r ,3r ,下列结论中错误..的是( ) A .三条回归直线有共同交点 B .相关系数中,2r 最大 C .12b b >D .12a a >2.以模型kx y ce =去拟合一组数据时,为了求出回归方程,设ln z y =,其变换后得到线性回归方程0.53z x =+,则c =( ) A .3B .3eC .0.5D .0.5e3.某商品销售量y (件)与销售价格x (元/件)负相关,则其回归方程可能是A .10200ˆyx =-+ B .10200ˆyx =+ C .10200ˆyx =-- D .10200ˆyx =- 4.设导弹发射的事故率为0.01,若发射10次,其出事故的次数为ξ,则下列结论正确的是 ( ) A .0.1E ξ=B .•01D ξ=C .10()0.01?0.99k k P k ξ-==D .1010()0.99?0.01k k kP k C ξ-==5.某研究型学习小组调查研究学生使用智能手机对学习的影响.部分统计数据如下表:附表:经计算2K 的观测值10k =,则下列选项正确的是( ) A .有99.5%的把握认为使用智能手机对学习有影响 B .有99.5%的把握认为使用智能手机对学习无影响 C .有99.9%的把握认为使用智能手机对学习有影响 D .有99.9%的把握认为使用智能手机对学习无影响 6.下列命题中正确命题的个数是(1)对分类变量X 与Y 的随机变量2K 的观测值k 来说,k 越小,判断“X 与Y 有关系”的把握越大;(2)若将一组样本数据中的每个数据都加上同一个常数后,则样本的方差不变; (3)在残差图,残差点分布的带状区域的宽度越狭窄,其模型拟合的精度越高; (4)设随机变量ξ服从正态分布()0,1N ; 若()1P p ξ>=,则()1102P p ξ-<<=-( ) A .4B .3C .2D .17.在独立性检验中,统计量2χ有三个临界值:2.706、3.841和6.635,在一项打鼾与患心脏病的调查中,共调查了1000人,经计算的2χ=18.87,根据这一数据分析,认为打鼾与患心脏病之间 ( )A .有95%的把握认为两者无关B .约有95%的打鼾者患心脏病C .有99%的把握认为两者有关D .约有99%的打鼾者患心脏病8.对于独立性检验,下列说法正确的是( ) A .K 2>3.841时,有95%的把握说事件A 与B 无关 B .K 2>6.635时,有99%的把握说事件A 与B 有关 C .K 2≤3.841时,有95%的把握说事件A 与B 有关 D .K 2>6.635时,有99%的把握说事件A 与B 无关9.利用独立性检验来考虑两个分类变量X 和Y 是否有关系时,通过查阅临界值表来确定推断“X 与Y 有关系”的可信度,如果k >5.024,那么就推断“X 和Y 有关系”,这种推断犯错误的概率不超过( ) A .0.25 B .0.75 C .0.025 D .0.97510.已知,x y 的取值如下表:( )x0 1, 2 3 4 y11.33.25.68.9若依据表中数据所画的散点图中,所有样本点()(,)1,2,3,4,5i i x y i =都在曲线212y x a =+附近波动,则a =( ) A .1B .12C .13D .12-11.通过随机询问2016名性别不同的大学生是否爱好某项运动,得到2 6.023K =,则根据这一数据查阅表,则有把握认为“爱好该项运动与性别有关”的可信程度是( )A .90%B .95%C .97.5%D .99.5%12.下列说法:①将一组数据中的每个数据都乘以同一个非零常数a 后,标准差也变为原来的a 倍; ②设有一个回归方程35y x =-,变量x 增加1个单位时,y 平均减少5个单位; ③线性相关系数r 越大,两个变量的线性相关性越强;反之,线性相关性越弱;④在某项测量中,测量结果ξ服从正态分布()()21,0N σσ>,若ξ位于区域()0,1的概率为0.4,则ξ位于区域()1,+∞内的概率为0.6⑤利用统计量2χ来判断“两个事件,X Y 的关系”时,算出的2χ值越大,判断“X 与Y 有关”的把握就越大 其中正确的个数是 A .1B .2C .3D .4二、填空题13.在一次独立试验中,有200人按性别和是否色弱分类如下表(单位:人)你能在犯错误的概率不超过_____的前提下认为“是否色弱与性别有关”?14.某中学为了调研学生的数学成绩和物理成绩是否有关系,随机抽取了189名学生进行调查,调查结果如下:在数学成绩较好的94名学生中,有54名学生的物理成绩较好,有40名学生的物理成绩较差;在成绩较差的95名学生中,有32名学生的物理成绩较好,有63名学生的物理成绩较差.根据以上的调查结果,利用独立性检验的方法可知,约有________的把握认为“学生的数学成绩和物理成绩有关系”.15.为了解适龄公务员对放开生育二胎政策的态度,某部门随机调查了200位30~40岁之间的公务员,得到的情况如下表:男公务员 女公务员 生二胎 80 40 不生二胎4040则________(填“有”或“没有”)99%以上的把握认为“生二胎与性别有关”. 附:K 2=. P (K 2≥k 0) 0.10 0.05 0.025 0.010 0.005 0.001 k 02.7063.8415.0246.6357.87910.82816.为了解某班学生喜爱打篮球是否与性别有关,对该班50名 学生进行了问卷调查, 得到了如下22⨯ 列联表喜爱打篮球 不喜爱打篮球 合计男生20 525 女生 10 1525合计30 2050则至少有_____的把握认为喜爱打篮球与性别有关(请用百分数表示). 17.给出下列命题:①线性相关系数r 越大,两个变量的线性相关性越强;反之,线性相关性越弱;②由变量x 和y 的数据得到其回归直线方程:l ˆybx a =+,则l 一定经过点(),x y P ; ③从匀速传递的产品生产流水线上,质检员每10分钟从中抽取一件产品进行某项指标检测,这样的抽样是分层抽样;④在回归分析模型中,残差平方和越小,说明模型的拟合效果越好;⑤在回归直线方程0.110ˆyx =+中,当解释变量x 每增加一个单位时,预报变量ˆy 增加0.1个单位,其中真命题的序号是___________.18.某单位为了了解用电量y (度)与气温x (℃)之间的关系,随机统计了某4天的用电量与当天气温(如表),并求得线性回归方程为^=-2x +60.不小心丢失表中数据c ,d ,那么由现有数据知2c+d=______. x c 13 10 -1 y243438d19.下列4个命题:①为了了解800名学生对学校某项教改试验的意见,打算从中抽取一个容量为40的样本,考虑用系统抽样,则分段的间隔为40;②四边形ABCD 为长方形,2AB =,1BC =,O 为AB 中点,在长方形ABCD 内随机取一点P ,取得的P 点到O 的距离大于1的概率为12π-; ③把函数3sin 23y x π⎛⎫=+⎪⎝⎭的图象向右平移6π个单位,可得到3sin 2y x =的图象; ④已知回归直线的斜率的估计值为1.23,样本点的中心为()4,5,则回归直线方程为1.230.08y x =+.其中正确的命题有__________.(填上所有正确命题的编号)20.2018年春季,世界各地相继出现流感疫情,这已经成为全球性的公共卫生问题.为了考察某种流感疫苗的效果,某实验室随机抽取100只健康小鼠进行试验,得到如下列联表:关系.(参考公式:()()()()()22n ad bc K a b c d a c b d -=++++.)三、解答题21.第十八届中国国际农产品交易会于11月27日在重庆国际博览中心开幕,我市全面推广“遂宁红薯”及“遂宁鲜”农产品区域公用品牌,并组织了100家企业、1000个产品进行展示展销,扩大优质特色农产品市场的占有率和影响力,提升遂宁特色农产品的社会认知度和美誉度,让来自世界各地的与会者和消费者更深入了解遂宁,某记者对本次农交会进行了跟踪报道和实际调查,对某特产的最满意度()%x 和对应的销售额y (万元)进行了调查得到以下数据:关系数r 的绝对值在0.95以上(含0.95)是线性相关性较强;否则,线性相关性较弱.请你对线性相关性强弱作出判断,并给出理由;(2)如果没有达到较强线性相关,则采取“末位淘汰”制(即销售额最少的那一天不作为计算数据),并求在剔除“末位淘汰”的那一天后的销量额y 关于最满意度x 的线性回归方程(系数精确到0.1). 参考数据:24x =,81y =,52215146ii x x =-=∑, 52215176i i y y =-=∑,515151i ii x y xy =-=∑13.27≈≈.附:对于一组数据()()()1122,,,,,,n n x y x y x y ⋅⋅⋅.其回归直线方程 ˆˆˆy bx a =+的斜率和截距的最小二乘法估计公式分别为:1221ˆ·ni ii ni i x y nx y bx nx ==-=-∑∑,ˆa y bx=-,线性相关系数·ni ix y nx y r -=∑22.为了调查某生产线上质量监督员甲对产品质量好坏有无影响,现统计数据如下:质量监督员甲在生产现场时,990件产品中合格品有982件,次品有8件;甲不在生产现场时,510件产品中合格品有493件,次品有17件,试分别用列联表、独立性检验的方法分析监督员甲是否在生产现场对产品质量好坏有无影响?23.2020年初,新型冠状病毒(2019-nCoV )肆虐,全民开启防疫防控.新型冠状病毒的传染主要是人与人之间进行传播,感染人群年龄大多数是40岁以上人群.该病毒进入人体后有潜伏期,潜伏期是指病原体侵入人体至最早出现临床症状的这段时间.潜伏期越长,感染到他人的可能性越高,现对200个病例的潜伏期(单位:天)进行调查,统计发现潜伏期平均数为7.1,方差为22.25.如果认为超过8天的潜伏期属于“长潜伏期”,按照年龄统计样本,得到下面的列联表:(1)是否有95%的把握认为“长期潜伏”与年龄有关;(2)假设潜伏期X 服从正态分布()2,N μσ,其中μ近似为样本平均数x ,2σ近似为样本方差2s .(ⅰ)现在很多省份对入境旅客一律要求隔离14天,请用概率的知识解释其合理性;(ⅱ)以题目中的样本频率估计概率,设1000个病例中恰有()*k k ∈N 个属于“长期潜伏”的概率是()g k ,当k 为何值时,()g k 取得最大值. 附:()()()()()22n ad bc a b c d a c b d χ-=++++若()2,N ξμσ则()0.6862P μσξμσ-<<+=.()220.9544P μσξμσ-<<+=,()330.9974P μσξμσ-<<+=.24.某地一所妇产科医院为了解婴儿性别与出生时间(白天或晚上)之间的联系,从该医院最近出生的200名婴儿获知如下数据:这200名婴儿中男婴的比例为55%,晚上出生的男婴比白天出生的男婴多75%,晚上出生的女婴人数与白天出生的男婴人数恰好相等. (1)根据题意,完成下列2×2列联表;(2)根据列联表,判断能否有99%的把握认为婴儿的性别与出生时间有关,说明你的理由.附:22()()()()()n ad bcKa b c d a c b d-=++++(n=a+b+c+d),参考数据:221999≈0.0368.25.在第十五次全国国民阅读调查中,某地区调查组获得一个容量为200的样本,其中城镇居民150人,农村居民50人,在这些居民中,经常阅读的城镇居民100人,农村居民24人.(1)完成上面2×2列联表,并判断是否有95%的把握认为经常阅读与居民居住地有关?(2)从该地区居民城镇的居民中,随机抽取5位居民参加一次阅读交流活动,记这5位居民中经常阅读的人数为X,若用样本的频率作为概率,求随机变量X的分布列和期望.附:K2=2()()()()()n ad bca b c d a c b d-++++,其中n=a+b+c+d.26.“微粒贷”是腾讯旗下2015年9月开发上市的微众银行网货产品.腾讯公司为了了解“微粒贷”上市以来在C市的使用情况,统计了C市2015年至2019年使用了“微粒货”贷款的累计人数,统计数据如表所示:(1)已知变量x ,y 具有线性相关关系,求累计人数y (万人)关于年份代号x 的线性回归方程y bx a =+;并预测2020年使用“微粒贷“贷款的累计人数;(2)“微粒贷”用户拥有的贷款额度是根据用户的账户信用资质判定的,额度范围在500元至30万元不等,腾讯公司在统计使用人数的同时,对他们所拥有的贷款额度也作了相应的统计.我们把拥有货款额度在500元至5万元(不包括5万元)的人群称为“低额度贷款人群”,简称“A 类人群”;把拥有贷款额度在5万元及以上的人群称为“高额度贷款人群”,简称“B 类人群”.根据统计结果,随机抽取6人,其中A 类人群4人,B 类人群2人.现从这6人中任取3人,记随机变量ξ为A 类人群的人数,求ξ的分布列及其期望.参考公式:1122211()()()()nni iiii i nniii i x y nx y x x y y b xn x x x ====---==--∑∑∑∑, a y bx =-参考数据:5162i ii x y=≈∑【参考答案】***试卷处理标记,请不要删除一、选择题 1.D 解析:D 【分析】由题意可得5m n +=,分别取m 与n 的值,由公式计算出1122123,,,,,,b a b a r r r 的值,逐一分析四个选项,即可得到答案. 【详解】由题意,1410m n +++=,即5m n +=. 若 1.5m =,则 3.5n =,此时12342.54x +++==, 2.5y =. ()()()()()()()()()()411 2.51 2.52 2.5 1.5 2.53 2.5 3.5 2.54 2.54 2.5 5.5iii x x y y =--=--+--+--+--=∑ ,()()()42222211.50.50.5 1.55i i x x =-=-+-++=∑ ,()()()42222211.511 1.5 6.5i i y y =-=-+-++=∑.则1 5.51.15b ==,1 2.5 1.1 2.50.25a =-⨯=- ,1r =≈; 若2m =,则3n =,此时12342.54x +++==, 2.5y =. ()()()()()()()()()()411 2.51 2.52 2.52 2.53 2.53 2.54 2.54 2.55iii x x y y =--=--+--+--+--=∑,()4215ii x x =-=∑,()()()42222211.50.50.5 1.55i i y y =-=-+-++=∑.2515b ==,2 2.51 2.50a =-⨯=,21r ==; 若 2.5m =,则 2.5n =,此时12342.54x +++==, 2.5y =. ()()()()()()()()()()411 2.51 2.52 2.5 2.5 2.53 2.5 2.5 2.54 2.54 2.5 4.5iii x x y y =--=--+--+--+--=∑,()4215i i x x =-=∑,()()422211.5 1.5 4.5i i y y =-=-+=∑,3r ==由样本点的中心相同,故A 正确;由以上计算可得,相关系数中,2r 最大,12b b >,12a a <,故B ,C 正确,D 错误. 故选:D . 【点睛】本题考查线性回归方程与相关系数的求法,考查计算能力,是中档题.2.B解析:B 【分析】根据指对数互化求解即可. 【详解】解:因为0.53z x =+,ln z y =,所以0.53ln x y +=,所以0.5330.5x x y e e e +==⨯,故3c e =.故选:B. 【点睛】本题考查非线性回归问题的转化,是基础题.3.A解析:A 【解析】试题分析:因为商品销售量x 与销售价格ˆy负相关,所以排除B ,D 选项, 将0x =代入10200ˆyx =--可得2000ˆy =-<,不符合实际.故A 正确. 考点:线性回归方程.【方法点睛】本题主要考查线性回归方程,属容易题.线性回归方程ˆˆˆy bx a =+当ˆ0b<时ˆ,x y 负相关;当ˆ0b >时ˆ,x y 正相关. 4.A解析:A 【解析】 【分析】由题意知本题是在相同的条件下发生的试验,发射的事故率都为0.01,实验的结果只有发生和不发生两种结果,故本题符合独立重复试验,由独立重复试验的期望公式得到结果. 【详解】由题意知本题是在相同的条件下发生的试验,发射的事故率都为0.01,故本题符合独立重复试验,即ξ~(10,0.01)B . ∴100.010.1E ξ=⨯= 故选A . 【点睛】解决离散型随机变量分布列和期望问题时,主要依据概率的有关概念和运算,同时还要注意题目中离散型随机变量服从什么分布,若服从特殊的分布则运算要简单的多.5.A解析:A 【解析】 【分析】由题意结合2K 的观测值k 由独立性检验的数学思想给出正确的结论即可. 【详解】由于2K 的观测值10k =7.879>,其对应的值0.0050.5%=,据此结合独立性检验的思想可知:有99.5%的把握认为使用智能手机对学习有影响. 本题选择A 选项. 【点睛】独立性检验得出的结论是带有概率性质的,只能说结论成立的概率有多大,而不能完全肯定一个结论,因此才出现了临界值表,在分析问题时一定要注意这点,不可对某个问题下确定性结论,否则就可能对统计计算的结果作出错误的解释.6.B解析:B 【解析】 【分析】根据独立性检验的定义可判断(1);根据方差的性质可判断(2);根据残差的性质可判断(3);根据正态分布的对称性可判断(4).【详解】(1)对分类变量X 与Y 的随机变量2K 的观测值K 来说,K 越大,判断“X 与Y 有关系”的把握越大,故(1)错误;(2)若将一组样本数据中的每个数据都加上同一个常数后,数据的离散程度不变,则样本的方差不变,故(2)正确;(3)根据残差的定义可知,在残差图,残差点分布的带状区域的宽度越狭窄,预测值与实际值越接近,其模型拟合的精度越高,(3)正确;(4)设随机变量ξ服从正态分布()0,1N ,若()1P p ζ>=,则()1P p ζ<-=,则()1112P p ζ-<<=-,则()1102P p ζ-<<=-,故(4)正确, 故正确的命题的个数为3个,故选B. 【点睛】本题主要通过对多个命题真假的判断,主要综合考查独立性检验的定义、方差的性质、残差的性质以及正态分布的对称性,属于中档题. 这种题型综合性较强,也是高考的命题热点,同学们往往因为某一处知识点掌握不好而导致“全盘皆输”,因此做这类题目更要细心、多读题,尽量挖掘出题目中的隐含条件,另外,要注意从简单的自己已经掌握的知识点入手,然后集中精力突破较难的命题.7.C解析:C 【解析】因为统计量2χ有三个临界值:2.706、3.841和6.635,而2χ=18.87>6.635,所以有99%的把握认为两者有关,选C.8.B解析:B【解析】由独立性检验的知识知:K 2>3.841时,有95%的把握认为“变量X 与Y 有关系”;K 2>6.635时,有99%的把握认为“变量X 与Y 有关系”.故选项B 正确.9.C解析:C【解析】∵P (k >5.024)=0.025,故在犯错误的概率不超过0.025的条件下,认为“X 和Y 有关系”. 考点:独立性检验.10.A解析:A 【解析】 设2t x = ,则11(014916)6,(1 1.3 3.2 5.68.9)455t y =++++==++++=,所以点(6,4)在直线12y t a =+上,求出1a =,选A.点睛:本题主要考查了散点图,属于基础题.样本点的中心(),x y 一定在直线回归直线上,本题关键是将原曲线变形为12y t a =+,将点(6,4)代入,求出值. 11.C解析:C 【解析】因为2 6.023K =,且5.024 6.023 6.635≤≤,所以有把握认为“爱好该项运动与性别有关”的可信度P 满足10.02510.010P -≤≤-,即0.9750.99P ≤≤,应选答案C 。

苏教版数学高二-数学苏教版选修2-3课堂导学 3.1 独立性检验

苏教版数学高二-数学苏教版选修2-3课堂导学 3.1 独立性检验

课堂导学三点剖析一、独立性检验的概念及方法【例1】 已知观测得到如下数据(如下表):未感冒 感冒 合计 用某种药 252 248 500 未用这种药 224276500 合计476 5241 000计算χ2并说明用某种药与患感冒是否有关系. 解析:假设未用药与感冒没有关系.∵a =252,b =248,a +b =500,c =224,d =276,c +d =500,n =1 000,a +c =476,b +d =524,∴χ2=476524500500)224248276252(1000))()()(()(22⨯⨯⨯⨯-⨯⨯=++++-d b c a d c b a bc ad n=3.143.由于χ2=3.143>2.706,∴有90%的把握认为未用药与感冒有关系. 温馨提示根据采集的样本数据,利用公式计算χ2的值,比较χ2与临界值的大小关系,来判定A 与B 是否有关.二、 相互独立事件的判定【例2】 袋子A 和B 中各装有若干个均匀的红球和白球,从A 中摸出一个红球的概率为31,从B 中摸出一个红球的概率为p ,(1)从A 袋中有放回地摸球,每次摸出一个球,共摸5次.求:①恰好有3次摸出红球的概率;②第一次、第三次、第五次均摸出红球的概率.(2)若A 、B 两个袋子中的球数之比为1∶2,将两个袋中的球混装在一起后,从中摸出一个红球的概率为52,求p 的值. 解析:(1)①.243409427110)31(335=⨯⨯⨯⨯C②P =271)31(3=.(2)设A 袋中有m 个球,则B 袋中有2m 个球,由523231=+m mpm ,可求得p =3013.(1)当事件A (或B )的发生对事件B (或A )的发生不产生任何影响,称A 与B 是相互独立事件.(2)确定事件的基本类型,正确运用相互独立事件的概率的有关公式进行求解.三、假设检验【例3】 打鼾不仅影响别人休息,而且可能与患某种疾病有关.下表是一次调查所得的数据,患心脏病 未患心脏病合计 每一晚都打鼾30224254不打鼾 24 1 355 1 379 合计54 1 5791 633解析:假设每一晚都打鼾与患心脏病无关系,则有a =30,b =224,c =24,d =1 355,a +b =254,c +d =1 379,a +c =54,b +d =1 579,n =1 633.∴χ2=))()()(()(2d b c a d c b a bc ad n ++++-=1579541379254)24224135530(16332⨯⨯⨯⨯-⨯⨯=68.033.∵68.033^10.828,所以有99.9%的把握说每一晚都打鼾与患心脏病有关. 各个击破 类题演练 1在研究某种新措施对猪白痢的防治效果问题时,得到以下数据:存活数 死亡数 合计 对照 114 36 150 新措施 13218150合计246 54 300试问新措施对防治猪白痢是否有效?解析:设新措施对防治猪白痢没有效果,由题意可知a =114,b =36,c=132,d=18,a +b =150,c+d=150,a +c=246,b +d=54,n =300,代入公式可得χ2=))()()(()(2d b c a d c b a bc ad n ++++-=54246150150)1323618114(3002⨯⨯⨯⨯-⨯⨯ =7.317.因为χ2=7.317>6.635,因此我们有99%的把握认为新措施对防治猪白痢是有效果的. 变式提升 1在一次恶劣气候的飞机航程中,调查了男、女乘客在飞机上晕机的情况如下表所示,请你根据所给的数据判定是否在恶劣气候飞行中男人比女人更容易晕机?晕机 不晕机 合计 男人 24 31 55 女人 82634合计32 57 89解析:假设在恶劣气候飞行中性别与是否晕机无关.由题意可知a =24,b =31,c=8,d=26,a +b =55,c+d=34,a +c=32,b +d=57,n =89,代入公式得 χ2=57323455)8312624(89))()()(()(22⨯⨯⨯⨯-⨯⨯=++++-d c d b c a b a bc ad n =3.689.因为χ2=3.689>2.706,因此我们有90%的把握认为性别与是否晕机有关.从给出的数据易知男人比女人更容易晕机. 类题演练 2把9粒种子分别种在甲、乙、丙3个坑内,每个坑3粒种子,每粒种子发芽的概率为0.5,若一个坑内至少有1粒种子发芽,则这个坑不需要补种,若一个坑内的种子都没有发芽,则需要补种.(1)求甲坑不需要补种的概率;(2)3个坑中恰有一个不需要补种的概率; (3)求有坑需要补种的概率.解析:(1)因为每粒种子发芽是相互独立的,故可采用相互独立性来解;又因为甲坑内的3粒种子都不发芽的概率为P =(1-0.5)3=81, 所以甲坑不需要补种的概率为P 1=1-P =1-81 =87=87.5%. (2)3个坑恰有一个坑不需要补种的概率为P 2=51221)81(87213=⨯⨯C .(3)因为3个坑都不需要补种的概率为3)87(,所以有坑需要补种的概率为P 3=1-3)87(=51221.变式提升 2把一颗质地均匀的骰子任意抛掷一次,设事件A =“掷出偶数点”,B =“掷出3的倍数点”,求出事件A ,B ,A ,B 的概率,以及事件A ∩B , A ∩B ,A ∩B , A ∩B 的概率,并据此判断P (A ∩B )与P (A )·P (B ),P (A ∩B )与P (A )·P (B ),P (A ∩B )与P (A )·P (B ),P (A ∩B )与P (A )·P (B )的大小关系.解析:A =“掷出偶数点”={2,4,6}, B =“掷出3的倍数点”={3,6}, ∴A ={1,3,5}, B ={1,2,4,5},P (A )=63 =21, P (B )=62 =31,P (A )=21,P (B )=32,A ∩B ={6},P (A ∩B )=61,A ∩B ={3},P (A ∩B )=61,A ∩B ={2,4},P (A ∩B )=31,A ∩B ={1,5},P (A ∩B )=31,P (A ∩B )=P (A )·P (B ),P (A ∩B )=P (A )·P (B ), P (A ∩B )=P (A )·P (B ),P (A ∩B )=P (A )·P (B ). 类题演练 3对196个接受心脏搭桥手术的病人和196个接受血管清障手术的病人进行了3年的跟踪研究,调查他们是否又发作过心脏病,调查结果如下表所示:又发作过心脏病未发作心脏病合计 心脏搭桥手术 39 157 196 血管清障手术29167196合计68 324 392试根据上述数据比较这两种手术对病人又发作过心脏病有没有关系. 解析:假设两种手术与又发作过心脏病有关系.由于a =39,b =157,c=29,d=167,a +b =196,c+d=196,a +c=68,b +d=324,n =392,由公式可得χ2的观测值为χ2=))()()(()(2d b c a d c b a bc ad n ++++-=32468196196)2915716739(3922⨯⨯⨯⨯-⨯⨯=1.78.因为χ2=1.78<2.706,所以我们没有理由说两种手术与又发作过心脏病有关系.。

苏教版高中数学选修2-3课件 3.1 独立性检验课件

苏教版高中数学选修2-3课件 3.1 独立性检验课件

本节内容理论难度较大,而且涉及到很多大学数学的内
易 错


法 分
容,凭高中学生的数学水平难以完成自主探究.因此,在理
误 辨


教 学 方 案 设 计
论部分还得需要教师讲,教师的“讲授”成了无奈的选择.不

过好在《课程标准》中,不要求学生掌握这部分深奥的理论,
堂 双

只要体会独立性检验的思想,掌握独立性检验的操作步骤.因
教 学 方 案 设 计
课 前 自 主 导 学
课 堂 互 动 探 究
菜单
SJ ·数学 选修2-3
易 错 易 误 辨 析
当 堂 双 基 达 标
课 时 作 业
教 师 备 课 资 源
教 学 教 法 分 析
教 学 方 案 设 计
课 前 自 主 导 学
课 堂 互 动 探 究
菜单
SJ ·数学 选修2-3
易 错 易 误 辨 析
课 时 作 业
教 师 备 课 资 源
教 学 教 法 分 析
教 学 方 案 设 计
课 前 自 主 导 学
课 堂 互 动 探 究
菜单
演示结束
SJ ·数学 选修2-3
易 错 易 误 辨 析
当 堂 双 基 达 标
课 时 作 业
教 师 备 课 资 源
SJ ·数学 选修2-3












教 学 方 案 设 计












菜单
SJ ·数学 选修2-3

3.1独立性检验-苏教版高中数学选修2-3课件(共22张PPT)

3.1独立性检验-苏教版高中数学选修2-3课件(共22张PPT)

2
nn n ab ac
n
n
n abbd
nn ncd ac
nn ncd bd
nn
n
n
nn
nn
吸烟 不吸烟
合计
患病 37 21 58
不患病 183 274 457
合计 220 295 515
上式得到的结果11.8634“大”不大呢?判断标准是什么 统计学给出了对照方法:临界值表
独立性检验: 用χ2统计量来研究两类因子彼此相关或相互独立的一种检验方法.
首先,给出假设: H0 :患病与吸烟没有关系!
用A表示吸烟,B表示患病,则“吸烟与患病是否有关”等价于“吸烟与 患病是否独立”,即假设H0等价于 P(AB)=P(A)P(B)是否成立.
问题1:P(A)、P(B)、P(AB)的值都未知怎么办?
答:用频率代替概率,估计P(A)、P(B)、P(AB)的值.
日常生活中我们关心这样一些问题: 1.吸烟与患呼吸道疾病之间有无关系? 2.花的颜色与花粉的形状有无关系? 3.性别与喜欢数学课之间有无关系?
为了了解吸烟是否对患呼吸道疾病有影响,我们应调查哪些数据呢?
应该调查吸烟者得呼吸道疾病、吸烟者没得呼吸道疾病、没吸烟者 呼吸道疾病、没吸烟者没得呼吸道疾病四种情形的人数。
推断两个研究对象Ⅰ和Ⅱ是否相关的独立性检验步骤:
(1):提出假设H0:Ⅰ和Ⅱ没有关系; (2):根据2×2列联表和χ2公式计算χ2的值.

类1 类2 合计
类A Ⅰ 类B
a
b a+b
c
d
c+d
合计 a+c b+d a+b+c+d
(3):查对临界值表,给出结论.

高中数学第3章统计案例3.1独立性检验课件苏教版选修2_3

高中数学第3章统计案例3.1独立性检验课件苏教版选修2_3
三、课后“静思2分钟”大有学问
我们还要注意课后的及时思考。利用课间休息时间,在心中快速把刚才上课时刚讲过的一些关键思路理一遍,把老师讲解的题目从题意到解答整个过 程详细审视一遍,这样,不仅可以加深知识的理解和记忆,还可以轻而易举地掌握一些关键的解题技巧。所以,2分钟的课后静思等于同一学科知识的课 后复习30分钟。
2019/5/29
精选最新中小学教学课件
thank
you!
2019/5/29
精选最新中小学教学课件
要判断该药品对患 A 疾病是否有效,即进行独立性检验提 出假设 H0:该药品对患 A 疾病没有效. 根据列联表中的数据可以求得 χ2=5232×3×55×004×004-181×001×05182≈0.041 45<0.455, 而查表可知 P(χ2≥0.455)≈0.5,故没有充分的理由认为该 保健药品对预防 A 疾病有效.
1.2×2 列联表的定义
对于两个研究对象Ⅰ和Ⅱ,Ⅰ有两类取值,即类 A 和类 B;Ⅱ
也有两类取值,即类 1 和类 2.这些取值可用下面的 2×2 列联表表示.

类1
类2
合计
类A a
b

类B c
d
a+b c+d
合计 a+c
b+d
a+b+c+d
2.χ2 统计量的求法 nad-bc2
公式 χ2= a+cb+da+bc+d .
4.在国家未实施西部开发战略前,一新闻单位在应届大学毕业
生中随机抽取 1 000 人问卷,只有 80 人志愿加入西部建设.而
国家实施西部开发战略后,随机抽取 1 200 名应届大学毕业生
问卷,有 400 人志愿加入国家西部建设.实施西部开发战略
是否对应届大学毕业生的选择产生了影响? 解:依题意,得 2×2 列联表:

苏教版高中数学选修独立性检验素材

苏教版高中数学选修独立性检验素材

详解独立性检验一、课标要求1、通过典型案例(如“肺癌与吸烟有关吗?”等)的探究,了解独立性检验的基本思想、方法及初步应用;2、通过典型案例(如“质量控制”“新药是否有效”等)的探究,了解实际推断原理和假设检验的基本思想方法及初步应用.二、要点直击1.2×2列联表表一: Ⅱ类1 类2 合计Ⅰ 类A a b a b +类B c d c d +a c +b d + a bcd +++注:在实际应用中,通常要求a b c d ,,,均不小于5.2.2χ统计量统计学中非常有用的统计量.读作:卡方,其表达式为:22()()()()()n ad bc a b c d a c b d χ-=++++,(其中n a b c d =+++)此公式如何记住,其特点是什么?结合2×2列联表一理解.3.独立性检验(1)含义:利用2χ统计量来研究如花的颜色与花粉的形状是否有关、用药效果与用药方式是否有关等这类问题的方法称为独立性检验.(2)基本思想独立性检验的基本思想类似于数学证明中的反证法.例如,要确认表一中“对象Ⅰ与对象Ⅱ有关”的可靠程度,先假设“对象Ⅰ与对象Ⅱ没有关系”成立.在假设成立的条件下2χ的值应该很小.如果得出2χ很大,则在一定的程度上说明假设不合理,从而可以根据2χ的值与临界值的比较,得出结论的可信程度.(3)基本步骤:①提出假设0H :Ⅰ与Ⅱ没有关系;②根据2×2列联表计算2χ的值;③查对临界值表(教材7P 表1-1-4),作出判断.注:用样本估计总体时,由于抽样的随机性,结果并不唯一.因此,由某个样本得到的推断进行独立性检验,可以对推断的正确性的概率作出估有可能正确,也有可能错误.利用2计,样本容量n越大,这个估计越准确.。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

假设检验1、某厂生产的化纤纤度服从正态分布)04.0,(2μN 。

某天测得25根纤维的纤度的均值39.1=x ,问与原设计的标准值1.40有无显著差异?(取05.0=α)解 设厂生产的化纤纤度为X ,则总体)04.0,(~2μN X ,且总体方差2204.0=σ已知。

顾客提出要检验的假设为40.1:0=μH , 40.1:1≠μH因为已知总体标准差04.0=σ,所以选用U 检验,且在0H成立的条件下有)1,0(~2504.00N X U μ-=针对备择假设40.1:1≠μH ,拒绝域的形式可取为}/{0c nX U W >-==σμ为使犯第一类错误的概率不超过05.0=α,就要在40.10=μ时,使临界值c 满足()05.0=>c U P成立。

由此,在给定显著性水平05.0=α时,得到临界值为96.1975.02/1===-u u c α故相应的拒绝域为{}96.1>=U W利用来自总体的样本值求得25.125/04.040.139.1-=-=u即975.096.125.1u u =<=成立。

显然,样本未落在拒绝域内,因此在05.0=α水平上认为纤维的纤度与原设计的标准值1.40没有显著差异。

2、设某厂生产的洗衣机的使用寿命(单位:小时)X 服从正态分布),(2σu N 但2,σu 未知。

随机抽取20台,算得样本均值1832=X ,样本标准差=S 497,检验该厂生产的洗衣机的平均使用时数“2000=μ”是否成立?(取检验水平05.0=α)解 待检验假设20000=μ:H 20001≠μ:HH 的拒绝域:21α->tT =2.093T 的观测值512.1/2000-=-=n S X T W ∈ 不能拒绝H ,可以认为洗衣机的平均使用时数“2000=u ”.3、在正常情况下,某炼钢厂的铁水含碳量(%)X ~),.(2554σN (σ未知)。

一日测得5炉铁水含碳量如下:4.48,4.40,4.42,4.45,4.47在显著水平050.=α下,试问该日铁水含碳量的均值是否有明显变化。

解: (1):0H 5540.==μμ :1H 5540.=≠μμ(2)选取检验统计量)(~/10--=n t nS X T μ给定α,查知7764241975021.)()(.==--t n tα。

H 的拒绝域为:W :)(121->-n tT α。

计算|T |=7.054>2.7764,所以显著水平05.0=α下,拒绝0H。

即该日铁水含碳量的均值有明显变化。

4、某厂生产需要用玻璃纸作包装,按规定供应商供应的玻璃纸的横向延伸率不低于65。

已知该指标服从正态分布),(2σμN ,σ一直稳定于5.5。

从近期来货抽查了100个样品,得样本均值06.55=x ,试问在050.水平下能否接收这批玻璃纸。

解65:0≥μH65.105.0-==u u α=*U n X σμ0-=-18.07<-1.65拒绝H ,在050.水平下能否接收这批玻璃纸。

5、根据某地环境保护法规定,倾入河流的废物中某种有毒化学物质含量不得超过3ppm 。

该地区环保组织对某厂连日倾入河流的废物中该物质的含量的记录为:1521,,,x x x 。

经计算得知,48151=∑ix26.1561512=∑ix。

试判断该厂是否符合环保法的规定。

(该有毒化学物质含量X 服从正态分布)解(1)H 0 :,30=≤μμ H 1:3>μ(2)H 0 的拒绝域为:)1(/10->-=-*n t nS X T αμ(3)计算2.348151=⨯=x ,19.0)(141222=-=∑x n x S i ,436.0=S =*T 154360323/..-=1.77667>7613.1)14(95.0=t .所以在显著水平050.=α下,拒绝H 0.6、某医院用一种中药治疗高血压,记录了50例治疗前与治疗后病人舒张压数据之差,得到其均值为16.28,样本标准差为10.58。

假定舒张压之差服从正态分布,试问在05.0=α水平上,该中药对治疗高血压是否有效?解 设治疗前与治疗后病人舒张压数据之差为X ,则总体),(~2σμN X ,且2σ未知。

要检验中药对治疗高血压是否有效?属于单边检验,故此提出假设:0≥μH , 0:1<μH在假设:0≥μH 成立的条件下,应该选用t 检验。

针对备择假设0:1<μH ,拒绝域的形式可取为}/{0c nX T W <-==σμ为使犯第一类错误的概率不超过α,就要求()α=<c T P由于在0μμ=时,()1~-n t t ,所以()1-=n t c α。

当t 分布的自由度大于45时,可以用标准正态分布的分数来近似t 分布的分位数。

现在50=n ,t 分布的自由度为49,该值较大,因此在给定05.0=α时,可利用标准正态分布确定出0.05的分位数为()645.14905.005.0-=≈u t 。

根据来自总体的样本值计算出检验统计量的值为85.10-=t 。

而在05.0=α水平上的拒绝域为{}645.1-<=t W显然,样本落在拒绝域内,因此在05.0=α水平上认为该中药材对治疗高血压有效。

7、某种导线的电阻服从),(2σμN ,μ未知,其中一个质量指标是电阻标准差不大于Ω0050..现从中抽取了9根导线测其电阻,算得标准差0066.0=s ,试问在05.0水平下能否认为这批导线的电阻波动合格。

解 检验假设005.0:00=≤σσH005.0:01=>σσHH 的拒绝区域21202)1(:αχσ->-S n W507.1594.13)1(21202=<=--αχσS n不能拒绝0H ,可以认为这批导线的电阻波动合格.8、新设计的一种测量仪器用来测定某物体的膨胀系数11次,又用进口仪器重复测同一物体11次,两样本的方差分别是263.121=S ,789.322=S 。

假定测量值分别服从正态分布,问在05.0=α水平上,设计仪器的精度(方差的倒数)是否比进口仪器的精度显著为好?解 设新设计的仪器测定的膨胀系数为X ,则),(~211σμN X ,且1μ未知,进口仪器测定的膨胀系数为Y ,则()222,~σμN Y 且2μ未知。

要检验的问题是设计仪器的精度(方差的倒数)是否比进口仪器的精度显著为好?属于单边检验。

故提出假设210:σσ≥H , 211:σσ<H在假设210:σσ≥H 为真时,选用检验统计量)1,1(~22--=m n F S S F YX,针对备择假设211:σσ<H 确定拒绝域为)}1,1({--<=m n F F W α对于给定的显著性水平05.0=α,利用第一自由度10,第二自由度10的F 分布,确定出0.05分位数98.2/1)10,10(/1)10,10(95.005.0==F F由样本值求出3356.098.2/1333.0=<=F 成立,样本落在拒绝域中,应拒绝0H,在05.0=α水平下,认为新设计的仪器精度比进口仪器的精度显著为好。

9、某公司经理听说他们生产的主要商品的价格波动甲地比乙地大,为此他对两地所售商品作了随机抽查。

在甲地调查了51种,其价格的标准差为5.81=S ,在乙地调查了179种,其价格的标准差为75.62=S ,假定两地价格分别服从正态分布,试问05.0=α水平下能支持上述说法吗?解 设甲地价格为X ,则总体),(~211σμN X ,且1μ未知,乙地价格为Y ,则总体()222,~σμN Y 且2μ未知。

要检验的问题是他们生产的主要商品的价格波动甲地比乙地大是否成立,故提出假设210:σσ≥H ,211:σσ<H在假设210:σσ≥H 成立的条件下,选用F 检验,类似上题,利用插值的方法求得05.0=α水平上的拒绝域为{}47.1/1<=F W在由样本求得586.1=F ,显然样本未落在拒绝域中,故在05.0=α水平上支持主要商品价格的波动甲地比乙地大的说法。

10、某厂铸造车间为提高缸体的耐磨性而试制了一种镍合金铸件以取代一种铜合金铸件,现从两种铸件中各抽出一个样本进行硬度测试(表示耐磨性的一种考核指标),其结果如下:镍合金铸件)(X :72.0,69.5,74.0,70.5,71.8铜合金铸件)(Y :69.8,70.0,72.0,68.5,73.0,70.0根据以往经验知硬度),(~211σμN X ,),(~222σμN Y ,且221==σσ,试在05.0=α水平下比较镍合金铸件硬度有无显著提高。

解 因为合镍铸件的硬度),(~211σμN X ,铜合金铸件的硬度),(~222σμN Y ,且已知221==σσ成立。

要检验的问题是比较镍合金铸件硬度有无显著提高,属于单边检验,故提出假设210:μμ=H , 211:μμ>H在假设210:μμ=H 成立的条件下,由于1σ与2σ均已知,所以选用U 检验。

针对备择假设211:μμ>H ,拒绝域的形式可取为()}/{222121c n n Y X U W >+-==σσ为使犯第一类错误的概率不超过α,就要求在21μμ=时,()α=>c U P ,由于在21μμ=时,()1.0~N U ,所以临界值α-=1u c 。

在给定05.0=α水平上,利用标准正态分布,确定出0.95的分位数为645.195.01==-u u α,相应的拒绝域为}645.1{>=u W现由分别来自两个总体的样本计算出,56.71=x ,55.70=y ,因此可得834.0=u ,显然,样本未落入拒绝域内,在05.0=α水平上,认为镍合金铸件硬度没有明显提高。

11、某物质在化学处理前后的含脂率如下:处理前:0.19 0.18 0.21 0.30 0.66 0.42 0.08 0.12 0.30 0.27处理后:0.15 0.13 0.00 0.07 0.24 0.24 0.19 0.04 0.08 0.20 0.12假定处理前后含脂率分别服从正态分布。

问处理后是否降低了含脂率?(取01.0=α)解 设处理前含脂率为X ,分布为),(211σμN ,处理后含脂率为Y ,分布为),(222σμN ,且21σ与22σ都未知,而21σ是否等于22σ也未知。

所以应该首先检验的假设210:σσ=H , 211:σσ≠H如果接受H ,即认为1σ与2σ无明显差异,则可以在两个方差相等的条件下对正态均值作如下检验,即提出假设211210:,:μμμμ>=H H 。

在假设210:σσ=H 成立的条件下,选用F 检验,根据备择假设211:σσ≠H ,在给定01.0=α水平上,利用第一自由度为9,第二自由度为10的F 分布确定出0.005与0.995的分位数,获得01.0=α水平上的拒绝域为()42.6/110,9{005.0=<=F F W 或()}97.510,9995.0=>F F现在利用样本的数字特征135.0,273.0==y x ,00642.0,02811.022==Y X s s 。

相关文档
最新文档