2019年高考数学一轮复习 热点难点精讲精析 10.3统计案例
2019年高考一轮热点难点精讲与专题12:一条特殊的线--函数的切线
基础知识回顾: (一)与切线相关的定义1、切线的定义:在曲线的某点A 附近取点B ,并使B 沿曲线不断接近A 。
这样直线AB 的极限位置就是曲线在点A 的切线。
(1)此为切线的确切定义,一方面在图像上可定性的理解为直线刚好与曲线相碰,另一方面也可理解为一个动态的过程,让切点A 附近的点向A 不断接近,当与A 距离非常小时,观察直线AB 是否稳定在一个位置上(2)判断一条直线是否为曲线的切线,不再能用公共点的个数来判定。
例如函数3y x =在()1,1--处的切线,与曲线有两个公共点。
(3)在定义中,点B 不断接近A 包含两个方向,A 点右边的点向左接近,左边的点向右接近,只有无论从哪个方向接近,直线AB 的极限位置唯一时,这个极限位置才能够成为在点A 处的切线。
对于一个函数,并不能保证在每一个点处均有切线。
例如y x =在()0,0处,通过观察图像可知,当0x =左边的点向其无限接近时,割线的极限位置为y x =-,而当0x =右边的点向其无限接近时,割线的极限位置为y x =,两个不同的方向极限位置不相同,故y x =在()0,0处不含切线(4)由于点B 沿函数曲线不断向A 接近,所以若()f x 在A 处有切线,那么必须在A 点及其附近有定义(包括左边与右边)2、切线与导数:设函数()y f x =上点()()00,,A x f x ()f x 在A 附近有定义且附近的点()()00,B x x f x x +∆+∆,则割线AB 斜率为:()()()()()000000AB f x x f x f x x f x k x x x x +∆-+∆-==+∆-∆ 当B 无限接近A 时,即x ∆接近于零,∴直线AB 到达极限位置时的斜率表示为:()()000limx f x x f x k x∆→+∆-=∆,即切线斜率,由导数定义可知:()()()'0000limx f x x f x k f x x∆→+∆-==∆。
2019年高考数学考纲解读与热点难点突破专题19概率与统计热点难点突破理含解析
概率与统计.在新一轮的素质教育要求下,各地高中陆陆续续开展了选课走班的活动,已知某高中学校提供了门选修课供该校学生选择,现有名同学参加该校选课走班的活动,要求这名同学每人选修一门课程且每门课程都有人选,则这名同学选课的种数为( )....答案解析因为将个人分成组有两种情形,=++=++,所以这名同学选课的种数为·=,故选..某学校为了弘扬中华传统“孝”文化,共评选出位男生和位女生为校园“孝”之星,现将他们的照片展示在宣传栏中,要求同性别的同学不能相邻,不同的排法种数为( ).....将,,,,这名同学从左至右排成一排,则与相邻且与之间恰好有一名同学的排法有( ).种.种.种.种答案解析当,之间为时,看成一个整体进行排列,共有·=(种),当,之间不是时,先在,之间插入,中的任意一个,然后在之前或之后,再将这四个人看成一个整体,与剩余一个进行排列,共有··=(种),所以共有种不同的排法..的展开式中的常数项为( ).-...答案解析由二项式的通项公式为+=·-,当-=时,解得=,当-=-时,解得=,所以展开式中的常数项为-·+·=-+=..若的展开式中只有第项的二项式系数最大,则展开式中含项的系数是( ).-...-.二项式的展开式中,其中是有理项的共有( ).项.项.项.项答案解析二项式的展开式中,通项公式为+=·-·=·,≤≤,∴当=时满足题意,共个..《中国诗词大会》(第二季)亮点颇多,十场比赛每场都有一首特别设计的开场诗词,在声光舞美的配合下,百人团齐声朗诵,别有韵味.若《将进酒》、《山居秋暝》、《望岳》、《送杜少府之任蜀州》和另确定的两首诗词排在后六场,且《将进酒》排在《望岳》的前面,《山居秋暝》与《送杜少府之任蜀州》不相邻且均不排在最后,则后六场的排法有( ).种.种.种.种答案解析《将进酒》、《望岳》和另确定的两首诗词进行全排列共有种排法,满足《将进酒》排在《望岳》的前面的排法共有种,再将《山居秋暝》与《送杜少府之任蜀州》插排在个空里(最后一个空不排),有种排。
高三数学一轮精品复习学案:第十章 统计、统计案例
高三数学一轮精品复习学案:第十章统计、统计案例【知识特点】1.统计中所学的内容是数理统计中最基本的问题,通过这些内容主要来介绍相关的统计思想和方法,了解一些有关统计学的基本知识,并能够应用几个基本概念、基本公式来处理实际生活中的一些基本问题。
2.统计案例为新课标中新增内容,主要是通过案例体会运用统计方法解决实际问题的思想和方法。
增加了统计和统计案例后,使得高中数学的整个体系更加完善了,有利于开阔数学视野,丰富数学思想和方法。
【重点关注】1.从对新课标高考试题的分析可以发现,主要考查抽样方法、各种统计图表、样本数字特征等。
对这部分的考查主要以选择题和填空题的形式出现。
2.统计案例中的独立性检验和回归分析也会逐步在高考题中出现,难度不会太大,多数情况下是考查两种统计分析方法的简单知识,以选择题和填空题为主。
【地位与作用】《全国新课程标准高考数学考试大纲》中对考生能力要求明确界定为空间想象能力、抽象概括能力、推理论证能力、运算求解能力、数据处理能力以及应用意识和创新意识等六个方面,其中数据处理能力是首次提出的一个能力要求,这定义为:会收集数据、整理数据、分析数据,能从大量数据中抽取对研究问题有用的信息,并作出判断。
数据处理能力主要依据统计(高考考试大纲对知识点要求如下表所示)或统计案例中的方法对数据进行整理、分析,并解决给定的实际问题,对统计的要求已提升到能力的高度。
统计的思想方法广泛应用于自然科学和社会科学的研究中,统计的语言不仅是数学的语言,也是各学科经常引用的大众语言,统计知识是作为一个新时期公民所比备的知识。
统计学就是应用科学的方法收集、整理、分析、描述所要研究的数据资料,然后根据所得到的结果,进行推断或决策的一门实用性很强的科学。
统计这部分内容,在高中数学新课程中,主要分布在必修3第二章(约16课时)与选修2—3第三章(约9课时)。
相对于高中学生的认知水平和生活经历还相对不是很高,所以它只能属于非重点内容,所出的相关题目一般来说都相对比较简单。
2019届高考数学一轮复习第10单元算法初步统计统计案例听课学案理
第十单元算法初步、统计、统计案例第63讲算法初步课前双击巩固1.算法(1)算法通常是指按照解决某一类问题的和的步骤.(2)应用:算法通常可以编成计算机,让计算机执行并解决问题.2.程序框图定义:程序框图又称流程图,是一种用、流程线及来表示算法的图形.3.三种基本逻辑结构名称内容顺序结构条件结构循环结构定义由若干个的步骤组成,这是任何一个算法都离不开的算法的流程根据有不同的流向,条件结构就是处理这种过程的结构从某处开始,按照一定的条件某些步骤的情况,反复执行的步骤称为程序框图4.基本算法语句(1)输入语句、输出语句和赋值语句的格式与功能:语句一般格式功能输入语句INPUT“提示内容”;变量输出语句PRINT “提示内容”;表达式输出常量、变量的值和系统信息赋值语句将表达式所代表的值赋给变量(2)条件语句的格式及框图:①IF-THEN格式:图10-63-1②IF-THEN-ELSE格式:图10-63-2(3)循环语句的格式及框图:①UNTIL语句:图10-63-3②WHILE语句:图10-63-4题组一常识题1.[教材改编]执行如图10-63-5所示的程序框图,运行相应的程序,若输入x的值为2,则输出S的值为.图10-63-52.[教材改编]运行如图10-63-6所示的程序后输出的结果是3,则输入的x值是.图10-63-6题组二常错题◆索引:注意循环结构中控制循环的条件;注意区分程序框图是条件结构还是循环结构.3.若[x]表示不超过x的最大整数,执行如图10-63-7所示的程序框图,则输出S的值为.图10-63-74.操作图10-63-8中的流程图,使得当成绩不低于60分时,输出“及格”,当成绩低于60分时,输出“不及格”,则①处填,②处填.图10-63-85.更相减损术是出自中国古代数学专著《九章算术》的一种算法,其内容如下:“可半者半之,不可半者,副置分母、子之数,以少减多,更相减损,求其等也.以等数约之.”图10-63-9是关于该算法的程序框图,如果输入a= 153,b= 119,则输出的a的值是.图10-63-9课堂考点探究探究点一算法的基本结构1 (1)[2017·咸阳三模]已知如图10-63-10所示的程序框图的输入值x∈[-1,4],则输出y值的取值范围是()A.[0,2]B.[-1,2]C.[-1,15]D.[2,15]图10-63-10(2)如图10-63-11所示的程序框图的运行结果为S=20,则判断框中可以填入的关于k的条件是()图10-63-11A.k>9?B.k≤8?C.k<8?D.k>8?[总结反思] 解决程序框图问题时一定要注意以下几点:(1)不要混淆处理框和输入框;(2)注意区分程序框图是条件结构还是循环结构;(3)注意区分“当型循环结构”和“直到型循环结构”;(4)处理关于循环结构的问题时,一定要正确控制循环次数;(5)要注意各个程序框的顺序.式题 (1)[2017·雅安三诊]执行如图10-63-12所示的程序框图,为使输出的数据为31,则判断框中可以填入的条件为()A.i≤3?B.i≤4?C.i≤6?D.i≤7?图10-63-12(2)[2017·银川一中二模]执行如图10-63-13所示的程序框图,输入n=6,m=4,那么输出的p 等于()A.720B.360C.240D.120图10-63-13探究点二算法的交汇性问题考向1与统计的交汇问题2 图10-63-14(1)是某县参加2017年高考的学生身高(单位:cm)的条形统计图,将从左到右的各条形表示的学生人数依次记为A1,A2,…,A10(如A2表示身高(单位:cm)在[150,155)内的学生人数).图(2)是统计图(1)中身高在一定范围内学生人数的一个程序框图.现要统计身高在[160,180)内的学生人数,则在程序框图中的判断框内应填写()图10-63-14A.i<6?B.i<7?C.i<8?D.i<9?[总结反思] 与统计交汇的程序框图问题,多体现在将统计的图表知识(如频率分布直方图、茎叶图等)与程序框图交汇在一起,解决此类问题时应根据题意读懂统计的图表数据后,再根据程序框图的算法进行推理演算.考向2与函数的交汇问题3 [2017·四川绵阳中学三模]某市乘坐出租车的收费办法如下:图10-63-15(1)不超过3千米的里程收费10元;(2)超过3千米的里程按每千米2元收费(对于其中不足千米的部分, 若其小于0.5千米则不收费,若其大于或等于0.5千米则按1千米收费),当车程超过3千米时,另收燃油附加费1元.相应系统收费的程序框图如图10-63-15所示,其中x(单位:千米)为行驶里程,y(单位:元)为所收费用,用[x]表示不大于x的最大整数,则图中①处应填 ()A.y=2[x+0.5]+4B.y=2[x+0.5]+5C.y=2[x-0.5]+4D.y=2[x-0.5]+5[总结反思] 与函数交汇的程序框图问题,常见的有条件结构的应用、分段函数的求值问题,读图时应正确理解题意,根据相应条件选择与之对应的运算法则求值.考向3与数列求和的交汇问题4 图10-63-16图10-63-16是一个算法的程序框图,如果输入i=0,S=0,那么输出的结果为()A.B.C.D.[总结反思] 解决与数列求和交汇的程序框图问题的关键有以下两个方面:一是循环结构的识图、推理,将其输出结果呈现为一个数列求和的形式;二是结合数列求和的知识对结果进行求和运算.常见题型为等差数列、等比数列求和,裂项相消法求和以及周期分组法求和.强化演练1.【考向3】[2017·岳阳二模]执行如图10-63-17所示的程序框图,输出s的值为()图10-63-17A.1B.C.D.2.【考向2】[2017·江西八校联考]执行如图10-63-18所示的程序框图,若输出S的值为4,则判断框中填入的条件可能是()图10-63-18A.k<18?B.k<17?C.k<16?D.k<15?3.【考向3】执行如图10-63-19所示的程序框图,若输出的结果是,则输入的a为()A.6B.5C.4D.3图10-63-194.【考向2】[2017·福州一中质检]执行如图10-63-20所示的程序框图,则输出的结果是()A.1B.C.D.2图10-63-205.【考向1】图10-63-21是计算某年级500名学生期末考试成绩(满分为100分)及格率q 的程序框图,则图中处理框内应填入.图10-63-21探究点三基本算法语句5 图10-63-22为一个求50个数的平均数的程序,在横线上应填充的语句为 ()图10-63-22A.i>50B.i<50C.i>=50D.i<=50[总结反思] 应用基本算法语句的四个关注点:(1)输入、输出语句:在输入、输出语句中加提示信息时要加引号,变量之间用逗号隔开.(2)赋值语句:左、右两边不能对换,赋值号左边只能是变量.(3)条件语句:条件语句中包含其他条件语句时,要分清内外条件结构,保证结构完整性.(4)循环语句:分清“UNTIL”语句和“WHILE”语句的格式和特征,不能混用.式题 (1)当a=3时,如图10-63-23所示的程序输出的结果是()A.9B.3C.10D.6图10-63-23(2)在执行图10-63-24中的程序时,如果输入n的值为6,那么输出的结果为()A.6B.720C.120D.1图10-63-24第64讲随机抽样课前双击巩固1.简单随机抽样(1)抽取方式:逐个;(2)每个个体被抽到的概率;(3)常用方法:和.2.分层抽样(1)定义:在抽样时,将总体分成互不交叉的层,然后按照一定的比例,从各层独立地抽取一定数量的个体,将各层取出的个体合在一起作为样本,这种抽样方法是一种分层抽样.(2)分层抽样的应用范围:当总体是由组成时,往往选用分层抽样.3.系统抽样的步骤假设要从容量为N的总体中抽取容量为n的样本.(1)先将总体的N个个体;(2)确定,对编号进行,当(n是样本容量)是整数时,取k=;(3)在第1段用确定第1个个体编号l(l≤k);(4)按照一定的规则抽取样本,通常是将l加上间隔k得到第2个个体编号(l+k),再加k得到第3个个体编号,依次进行下去,直到获取整个样本.题组一常识题1.[教材改编]为了了解一批零件的长度,抽测了其中200个零件的长度,在这个抽样中,总体的一个样本是.2.[教材改编]某中学从编号为1~60的60个班级中,随机抽取6个班级进行卫生检查,所抽班级的号码是6,16,26,36,46,56,则这种抽样方法是.3.[教材改编]某学校高三年级有男同学200人,女同学300人,用分层抽样的方法抽取一个容量为50的样本,则应抽取男同学人,女同学人.4.[教材改编]总体由编号为01,02,…,19,20的20个个体组成,利用下面的随机数表选取5个个体,选取方法是从随机数表第1行的第5列和第6列数字开始由左到右依次选取两个数字,则选出来的第5个个体的编号为.7816657208026314021443199714019832049234493682003623486969387181题组二常错题◆索引:系统抽样中剔除的个体随机;分层抽样每层抽取的个数比例是相同的;简单随机抽样、系统抽样、分层抽样都是等可能抽样.5.某学校为了解高一年级1203 名学生对某项教改试验的意见,打算从中抽取一个容量为40 的样本,若采用系统抽样,则分段间隔为.6.某公司有员工500人,其中不到35岁的有125人,35~50岁的有280人,50岁以上的有95人,为了调查员工的身体健康状况,从员工中抽取了100人,则应在这三个年龄段中抽取的人数分别为.7.某校要从高一、高二、高三共2012名学生中选取50名组成志愿团,若先用简单随机抽样的方法从2012名学生中剔除12名,再从剩下的2000名学生中按分层抽样的方法抽取50名,则下面对每名学生入选的概率描述正确的是.(填序号)①都相等且为;②都相等且为;③不完全相等.课堂考点探究探究点一简单随机抽样1 (1)某班级有男生20人,女生30人,从中抽取10人组成样本,其中一次抽样结果是抽到了4名男生、6名女生, 则下列说法正确的是()A.这次抽样可能采用的是简单随机抽样B.这次抽样一定没有采用系统抽样C.这次抽样中每个女生被抽到的概率大于每个男生被抽到的概率D.这次抽样中每个女生被抽到的概率小于每个男生被抽到的概率(2)[2017·辽宁实验中学模拟]福利彩票“双色球”中红色球的号码可以从01,02,03,…,32,33这33个两位数号码中选取,小明利用下面的随机数表选取红色球的6个号码,选取方法是从第1行第9列和第10列的数字开始从左到右依次选取两个数字,则第4个被选中的红色球号码为()81 47 23 68 63 93 17 90 12 69 86 81 62 93 50 60 91 33 75 85 61 39 8506 32 35 92 46 22 54 10 02 78 49 82 18 86 70 48 05 46 88 15 19 20 49A.12B.33C.06D.16[总结反思] (1)简单随机抽样满足:①抽取的个体数有限;②逐个抽取;③不放回抽取;④等可能抽取.(2)抽签法适用于总体中个体数较少的情况,随机数表法适用于总体中个体数较多的情况.式题假设要考察某公司生产的500克袋装牛奶的质量是否达标,现从800袋牛奶中抽取60袋牛奶进行检测,利用随机数表抽样时,先将800袋牛奶按000,001,…,799进行编号,如果从下面随机数表第2行第7列开始向右读取,那么抽取检测的第5袋牛奶的编号为.8442 1753 3157 2455 0688 7704 7447 6721 7633 5025 8392 12066301 6378 5916 9556 6719 9810 5071 7512 8673 5807 4439 52383321 1234 2978 6456 0782 5242 0744 3815 5100 1342 9966 0279探究点二系统抽样2 某学校高一、高二、高三年级学生人数分别为720,720,800,现从全校学生中随机抽取56人参加防火防灾问卷调查.先采用分层抽样方法确定各年级参加调查的人数,再在各年级内采用系统抽样方法确定参加调查的学生.若将高三年级的学生依次编号为001,002,…,800,则高三年级抽取的学生的编号不可能为()A.001,041,…,761B.031,071,…,791C.027,067,…,787D.055,095,…,795[总结反思] 解决系统抽样问题的两个关键步骤:(1)分组的方法应依据抽样比例而定,即根据定义每组抽取一个样本.(2)起始编号的确定应用简单随机抽样的方法,一旦起始编号确定,其他编号便随之确定了.式题 (1)某种饮料每箱装6瓶,库存23箱未开封的饮料,现欲对这种饮料进行质量检测,工作人员需从中随机取出10瓶,若采用系统抽样法,则要剔除的饮料的瓶数是 ()A.2B.8C.6D.4(2)[2018.长沙长郡中学月考]某中学将参加摸底测试的1200名学生编号为1,2,3, (1200)从中抽取一个容量为50的样本进行学习情况调查,按系统抽样的方法分为50组,如果第一组中抽出的学生编号为20,则第四组中抽取的学生编号为()A.68B.92C.82D.170探究点三分层抽样3 (1)某工厂生产A,B,C三种不同型号的产品,产品数量之比依次为k∶5∶3,现用分层抽样方法抽出一个容量为120的样本,已知A种型号产品共抽取了24件,则抽取的C种型号产品件数为()A.24B.30C.36D.40(2)[2017·衡水中学二模]某学校为了解学生学习的情况,采用分层抽样的方法从高一年级的2400名学生、高二年级的2000名学生、高三年级的n名学生中,抽取90人进行问卷调查.已知高一年级被抽取的学生人数为36,那么高三年级被抽取的学生人数为()A.20B.24C.30D.32[总结反思] 进行分层抽样的相关计算时,常用到的两个关系:(1)=;(2)总体中某两层的个体数之比等于样本中这两层所抽取的个体数之比.式题 (1)为了调研雄安新区的空气质量状况,某课题组对雄县、容城、安新三县空气质量进行调查,按地域特点在三县内设置空气质量观测点.已知三县内观测点的个数分别为6,y,z,依次构成等差数列,且6,y,z+6成等比数列,若采用分层抽样的方法抽取12个观测点的数据,则应从容城抽取的观测点的数据个数为()A.8B.6C.4D.2(2)[2017·乌鲁木齐模拟]某高中有学生2000人,其中高一年级有760人,若从全校学生中随机抽出1人,抽到的学生是高二年级学生的概率为0.37,现采用分层抽样(按年级分层)方法在全校抽取20人,则应在高三年级中抽取的学生人数为.第65讲用样本估计总体课前双击巩固1.作频率分布直方图的步骤(1)求极差(即一组数据中与的差);(2)决定与;(3)将数据;(4)列;(5)画.2.频率分布折线图和总体密度曲线(1)频率分布折线图:连接频率分布直方图中各小长方形上端的,就得到频率分布折线图.(2)总体密度曲线:随着样本容量的增加,作图时增加,减小,相应的频率折线图会越来越接近于一条光滑曲线,统计中称这条光滑曲线为总体密度曲线.3.茎叶图的优点茎叶图的优点是不但可以保留所有信息,而且可以记录,这对数据的记录和表示都能带来方便.4.样本的数字特征(1)众数、中位数、平均数数字特征定义与求法优点与缺点众数一组数据中重复出现次数的数众数通常用于描述变量的值出现次数最多的数,但它对其他数据信息的忽视比较明显,使它无法客观地反映总体特征中位数把一组数据按的顺序排列,处在位置的一个数据(或两个数据的平均数)中位数等分样本数据所占频率,它不受少数几个极端值的影响,这在某些情况下是优点,但它对极端值的不敏感有时也会成为缺点平均数如果有n个数据x1,x2,…,x n,那么这n个数的平均数=平均数与每一个样本数据有关,可以反映出更多的关于样本数据全体的信息,但平均数受数据中的极端值的影响较大,使平均数在估计总体时可靠性降低(2)标准差、方差①标准差:样本数据到平均数的一种平均距离,一般用s表示,s=.②方差:标准差的平方s2.s2=[(x1-)2+(x2-)2+…+(x n-)2],其中x i(i=1,2,3,…,n)是,n是,是.题组一常识题1.[教材改编]如图10-65-1是100位居民月均用水量的频率分布直方图,则月均用水量在[2,2.5)(单位:t)范围内的居民有人.图10-65-12.[教材改编]某赛季甲、乙两名篮球运动员每场比赛得分数据用茎叶图(如图10-65-2)表示,从茎叶图的分布情况看,运动员的发挥更稳定.图10-65-23.[教材改编]某射手在一次训练中五次射击的成绩(单位:环)分别为9.4,9.4,9.4,9.6,9.7,则该射手成绩的方差是.4.[教材改编]从某项综合能力测试中抽取100人的成绩,统计如下,则这100个成绩的平均数为.分数 1 2 3 4 5人数20 10 40 10 20题组二常错题◆索引:频率分布直方图与茎叶图中识图不清致误;中位数、平均数、众数的概念混淆不清致误;方差、平均数的统计意义不清楚致误.5.如图10-65-3所示的茎叶图记录了甲、乙两组各5名学生在一次英语听力测试中的成绩(单位:分).已知甲组数据的中位数为15,乙组数据的平均数为16.8,则x= ,y= .图10-65-36.如图10-65-4是某学校抽取的部分学生体重的频率分布直方图,已知图中从左到右的前3个分组的频率依次成等差数列,第2个分组的频数为10,则抽取的学生人数为.图10-65-47.甲、乙、丙三个班各有20名学生,一次数学考试后,三个班学生的成绩与人数统计如下:甲班成绩分数70 80 90 100人数 5 5 5 5乙班成绩分数70 80 90 100人数 6 4 4 6丙班成绩分数70 80 90 100人数 4 6 6 4用s1,s2,s3分别表示甲、乙、丙三个班本次考试成绩的标准差,则1,s2,s3的大小关系是.课堂考点探究探究点一频率分布直方图1 某手机厂商推出一款6寸大屏手机,现对500名该手机使用者(200名女性,300名男性)进行调查,使其对手机进行打分,得分的频数分布表如下:女性用户分值区间[50,60)[60,70)[70,80)[80,90) [90,100]频数20 40 80 50 10男性用户分值区间[50,60)[60,70)[70,80)[80,90) [90,100]频数45 75 90 60 30(1)完成如图10-65-5所示的频率分布直方图,并比较女性用户和男性用户评分的波动大小(不计算具体值,给出结论即可);图10-65-5(2)根据评分的不同,利用分层抽样的方法从男性用户中抽取20名用户,在这20名用户中,从评分不低于80分的用户中任意抽取3名用户,求3名用户中评分小于90分的人数的分布列和数学期望.[总结反思] (1)绘制频率分布直方图时的两个注意点:①制作好频率分布表后,可以利用各组的频率之和是否为1来检验该表是否正确;②频率分布直方图的纵坐标是,而不是频率.(2)由频率分布直方图进行相关计算时,需掌握的两个关系式:①×组距=频率;②=频率,此关系式的变形为=样本容量,样本容量×频率=频数.式题 [2017·淮北二模]交通指数是交通拥堵指数的简称,是综合反映道路网畅通或拥堵的概念.记交通指数为T,其范围为[0,10],分别有5个级别:T∈[0,2)畅通;T∈[2,4)基本畅通;T∈[4,6)轻度拥堵;T∈[6,8)中度拥堵;T∈[8,10]严重拥堵.一般早高峰时段T≥3,从贵阳市交通指挥中心随机选取了早高峰时段二环以内50个交通路段,依据交通指数数据绘制的频率分布直方图如图10-65-6所示.(1)据此直方图估算T∈[4,8)时交通指数的中位数和平均数.(2)据此直方图求出早高峰时段二环以内的3个路段中至少有2个严重拥堵的概率.(3)某人上班路上所用时间:畅通时为20分钟,基本畅通时为30分钟,轻度拥堵时为35分钟,中度拥堵时为45分钟,严重拥堵时为60分钟.求此人早高峰时所用时间的数学期望.图10-65-6探究点二茎叶图2 “一带一路”经济带的发展规划已经得到了越来越多相关国家的重视和参与.某市顺潮流、乘东风,闻迅而动,决定利用旅游资源优势,撸起袖子大干一场.该市相关部门为了了解游客的情况,以便制定相应的策略,在某月中随机抽取甲、乙两个景点各10天的游客数,画出茎叶图如图10-65-7所示.(1)若景点甲中的数据的中位数是125,景点乙中的数据的平均数是124,求x,y的值;(2)若将图中景点甲中的数据作为该景点较长一段时期内的样本数据,今从这段时期中任取4天,记其中游客数超过120人的天数为ξ,求P(ξ≤2);(3)现从图中共20天的数据中任取2天的数据(甲、乙两景点中各取1天),记其中游客数不低于115人且不高于125人的天数为η,求η的分布列和数学期望.图10-65-7[总结反思] 使用茎叶图时的两个注意点:(1)观察所有的样本数据,弄清图中数字的特点,注意不要漏掉数据;(2)注意不要混淆茎叶图中茎与叶的含义.式题 (1)[2017·北京海淀区一模]《中国诗词大会》是中央电视台首档全民参与的诗词节目,节目以“赏中华诗词、寻文化基因、品生活之美”为基本宗旨,力求通过对诗词知识的比拼及赏析,带动全民重温那些曾经学过的古诗词,分享诗词之美,感受诗词之趣,从古人的智慧和情怀中汲取营养,涵养心灵.如图10-65-8是2016年《中国诗词大会》节目中,七位评委为甲、乙两名选手打出的分数的茎叶图(其中m为数字0~9中的一个),去掉一个最高分和一个最低分后,甲、乙两名选手得分的平均数分别为a1,a2,则一定有()A.a1>a2B.a2>a1C.a1=a2D.a1,a2的大小与m的值有关图10-65-8(2)[2017·宜宾二诊]某生产车间的甲、乙两位工人生产同一种零件,这种零件的标准尺寸为85 mm,现分别从他们生产的零件中各随机抽取8件进行检测,其尺寸(单位:mm)用茎叶图表示如图10-65-9所示,则估计 ()A.甲、乙生产的零件尺寸的中位数相等B.甲、乙生产的零件质量相当C.甲生产的零件质量比乙生产的零件质量好D.乙生产的零件质量比甲生产的零件质量好图10-65-9探究点三样本数字特征3[2017·蚌埠质检]某学校高一、高二、高三三个年级共有300名教师,为了调查他们的备课时间情况,通过分层抽样获得了20名教师一周的备课时间,统计数据如下表(单位:小时):高一年级 7 7.5 8 8.5 9高二年级 7 8 9 10 11 12 13高三年级 6 6.5 7 8.5 11 13.5 17 18.5(1)试估计该校高三年级的教师人数;(2)从高一年级和高二年级抽出的教师中,各随机选取一人,高一年级选出的人记为甲,高二年级选出的人记为乙,求该周甲的备课时间不比乙的备课时间长的概率;(3)再从高一、高二、高三三个年级中各随机抽取一名教师,他们该周的备课时间分别是8,9,10(单位: 小时),这三个数据与表格中的数据构成的新样本的平均数记为,表格中数据的平均数记为,试判断与的大小(结论不要求证明).[总结反思] 利用频率分布直方图估计样本数字特征的方法:(1)中位数:在频率分布直方图中,中位数左边和右边的直方图面积相等,由此可以估计中位数.(2)平均数:平均数的估计值等于每个小矩形的面积乘矩形底边中点横坐标之和.(3)众数:最高的矩形底边中点的横坐标.式题 (1)[2017·广西贵港、玉林联考]随着人民生活水平的提高,对城市空气质量的关注度也逐渐增高,图10-65-10是某城市1月至8月的空气质量检测情况,图中一、二、三、四级是空气质量等级,一级空气质量最好,一级和二级都是质量合格空气,下面叙述不正确的是()图10-65-10A.1月至8月空气质量合格天数超过20天的月份有5个B.第二季度与第一季度相比,空气质量达标天数的比重下降了C.8月份是空气质量最好的一个月D.6月份的空气质量最差(2)[2017·佛山一模]本学期王老师任教高三(1)班、高三(2)班两个平行班,两个班都是50名学生,如图10-65-11反映的是两个班学生在本学期5次数学测试中班级平均分的对比,由图可知不正确的结论是()图10-65-11A.(1)班的数学成绩平均水平好于(2)班B.(2)班的数学成绩没有(1)班稳定C.下次考试(2)班的数学平均分要高于(1)班D.在第1次考试中,(1),(2)两个班的总平均分为98第66讲变量间的相关关系、统计案例课前双击巩固1.变量间的相关关系(1)常见的两变量之间的关系有两类:一类是函数关系;另一类是,与函数关系不同,是一种非确定性关系.(2)从散点图上看,点散布在从左下角到右上角的区域内,两个变量的这种相关关系称为,点散布在从左上角到右下角的区域内,两个变量的相关关系为.2.两个变量的线性相关(1)从散点图上看,如果这些点从整体上看大致分布在通过散点图中心的一条直线附近,称两个变量之间具有,这条直线叫作.(2)回归方程为=x+,其中=,=-.(3)通过求Q=(y i-bx i-a)2的最小值而得到回归直线的方法,即使得样本数据的点到回归直线的距离的平方和最小,这一方法叫作最小二乘法.(4)相关系数:当r>0时,表明两个变量;当r<0时,表明两个变量.r的绝对值越接近于1,表明两个变量的线性相关性越强.r的绝对值越接近于0时,表明两个变量之间.通常|r|大于时,认为两个变量有很强的线性相关性.3.独立性检验假设有两个分类变量X和Y,它们的取值分别为{x1,x2}和{y1,y2},其样本频数列联表(称为2×2列联表)为:y1y2总计x1a b a+bx2c d c+d总计a+c b+d a+b+c+dK2=(其中n=a+b+c+d为样本容量).题组一常识题1.[教材改编]下列关系中,属于相关关系的是.(填序号)①正方形的边长与面积;②农作物的产量与施肥量;③人的身高与眼睛近视的度数;④哥哥的数学成绩与弟弟的数学成绩.2.[教材改编]对变量x,y有观测数据(x i,y i)(i=1,2,…,10),得散点图如图10-66-1①;对变量u,v有观测数据(u i,v i)(i=1,2,…,10),得散点图如图②.由这两个散点图可以判断变量x 与y, u与v .(填正相关、负相关或不相关)图10-66-13.[教材改编]某医疗机构通过抽样调查(样本容量n=1000),利用2×2列联表和K2统计量研究患肺病是否与吸烟有关.计算得K2的观测值k≈4.453,经查对临界值表知P(K2≥3.841)=0.05,现给出下列四个结论,其中正确的是.(填序号)①在100个吸烟的人中约有95个人患肺病;②若某人吸烟,则他有95%的可能性患肺病;③有95%的把握认为“患肺病与吸烟有关”;④只有5%的把握认为“患肺病与吸烟有关”.4.[教材改编]对具有线性相关关系的变量x和y,测得一组数据如下表所示.x 2 4 5 6 8y30 40 60 50 70若已求得x与y之间的回归直线的斜率为6.5,则这条回归直线的方程为.题组二常错题。
2019版数学一轮高中全程复习方略课件:第十章 算法初
(3)独立性检验 利用随机变量 K2 来判断“两个分类变量有关系”的方法称 为独立性检验.
二、必明 4●个易误点 1.回归分析是对具有相关关系的两个变量进行统计分析的 方法,只有在散点图大致呈线性时,求出的回归直线方程才有实 际意义,否则,求出的回归直线方程毫无意义. 2.根据回归方程进行预报,仅是一个预报值,而不是真实 发生的值. 3.r 的大小只说明是否相关,并不能说明拟合效果的好坏, R2 才是判断拟合效果好坏的依据,必须将二者区分开来. 4.独立性检验的随机变量 K2=2.706 是判断是否有关系的 临界值,K2<2.706 应判断为没有充分依据显示 X 与 Y 有关系, 而不能作为小于 90%的量化值来作出判断.
2.回归方程 (1)最小二乘法 求回归直线, 使得样本数据的点到它的距离的平方和最小的 方法叫做最小二乘法. (2)回归方程 ^ =b ^ x+^ 方程 y a 是两个具有线性相关关系的变量的一组数据 ^是待定参 (x1,y1),(x2,y2),…,(xn,yn)的回归方程,其中^ a,b 数. i∑ ∑ =1 xi- x yi- y i=1xiyi-n x y ^= b = n 2 n 2 2 , ∑ ∑ i= 1 x i- x i=1xi -n x ^ ^x. a = y -b
n n
3.回归分析 (1)定义:对具有相关关系的两个变量进行统计分析的一种常用方 法. (2)样本点的中心 对于一组具有线性相关关系的数据(x1,y1),(x2,y2),…,(xn,yn) 中②( x , y )称为样本点的中心. (3)相关系数 当 r>0 时,表明两个变量③正相关; 当 r<0 时,表明两个变量④负相关. r 的绝对值越接近于 1,表明两个变量的线性相关性⑤越强. r 的绝对值越接近于 0, 表明两个变量之间几乎不存在线性相关关 系.通常|r|大于⑥0.75 时,认为两个变量有很强的线性相关性.
2019版高考数学(文)人教A版(全国)一轮复习 课件 第十章 统计、统计案例与概论 第3讲
越近于 1 ,模拟效果越好,在四个选项中 A 的相关指数最
大,所以拟合效果最好的是模型1,故选A.
答案 A
4.为了评价某个电视栏目的改革效果,在改革前后分别从居
民点抽取了100位居民进行调查,经过计算K2≈0.99,根据
这一数据分析,下列说法正确的是( D )
A.有99%的人认为该电视栏目优秀
B.有99%的人认为该电视栏目是否优秀与改革有关系 C.有99%的把握认为该电视栏目是否优秀与改革有关系 D.没有理由认为该电视栏目是否优秀与改革有关系
小,所以z随x的增大而减小,x与z负相关,故选C.
答案 C
3.两个变量y与x的回归模型中,分别选择了4个不同模型,它 们的相关指数R2如下,其中拟合效果最好的模型是( A.模型1的相关指数R2为0.98 B.模型2的相关指数R2为0.80 )
C.模型3的相关指数R2为0.50
D.模型4的相关指数R2为0.25 解析 在两个变量y与x的回归模型中,它们的相关指数R2
(2)对变量 x,y 有观测数据(xi,yi)(i=1,2,…,10),得散 点图(1);对变量 u,v 有观测数据(ui,vi)(i=1,2,…,10), 得散点图(2).由这两个散点图可以判断( )
A.变量x与y正相关,u与v正相关 B.变量x与y正相关,u与v负相关
2×2 列联表 y2 总计 x1 b a+b x2 d c+d 总计 b+d a+b+c+d 2 n ( ad - bc ) 构造一个随机变量 K2= ,其 (a+b)(c+d)(a+c)(b+d) 中 n=a+b+c+d 为样本容量. (3)独立性检验 利用随机变量 K2 来判断“两个分类变量有关系”的方法称为独 立性检验. y1 a c a+ c
2019版高考数学(文)人教A版(全国)一轮复习 课件 第十章 统计、统计案例与概论 第2讲
B地区用户满意度评分的频数分布表
满意度评 分分组 频数
[50,60) [60,70) [70,80) [80,90) [90,100) 2 8 14 10 6
(1)作出B地区用户满意度评分的频率分布直方图,并通过直方
据制成的频率分布直方图.已知第一组与第二组共有20人,第三
组中没有疗效的有6人,则第三组中有疗效的人数为( A.6 B.8 C.12 D.18 )
解析
20 全体志愿者共有 = 50( 人 ) , (0.24+0.16)×1
所以第三组有志愿者 0.36×1×50=18(人),∵第三组 中没有疗效的有 6(人), ∴有疗效的有 18-6=12(人), 故选 C.
计总体的基本数字特征,理解用样本估计总体的思想; 5.会用随机抽样的基本方法和样本估计总体的思想解决 一些简单的实际问题.
知识梳理 1.用样本的频率分布估计总体分布 (1)频率分布:样本中所有数据 (或者数据组)的频数和样本 容量的比,就是该数据的 频率 ,所有数据 ( 或者数据组 ) 的频率的分布变化规律叫做 频率分布 . (2)作频率分布直方图的步骤:①求极差,即一组数据中的
2. 对某商店一个月内每天的顾客人数进 行了统计,得到样本的茎叶图(如图所 示),则该样本的中位数、众数、极差 分ห้องสมุดไป่ตู้是( ) B.46,45,53
A.46,45,56
C.47,45,56
解析
D.45,47,53
由题意知各数为12,15,20,22,23,23,31,32,
34,34,38,39,45,45,45,47,47,48,48,49,50,
统 计 2019高考数学 考点精讲
突
破
点
一
突
破
点
二
课时达标检测
统
计
结
束
4.三种抽样方法的比较
类别
共同点
各自特点
相互联系
适用范围 总体中的个 数较少 元素个数很 多且均衡的 总体抽样 总体由差异 明显的几部 分组成
简单随 从总体中逐个抽 是后两种方 机抽样 均为不 取 法的基础 放回抽 将总体均分成几 在起始部分 样,且 系统抽 部分,按事先确 抽样时采用 抽样过 样 定的规则在各部 简单随机抽 程中每 分中抽取 样 个个体 各层抽样时 被抽取 将总体分成几层, 分层抽 的机会 采用简单随 分层按比例进行 样 机抽样或系 相等 抽取 统抽样
突 破 点 一 突 破 点 二
课时达标检测
统
计
结
束
考点贯通
抓高考命题的“形”与“神”
简单随机抽样
1.抽签法的步骤 第一步,将总体中的 N 个个体编号; 第二步,将这 N 个号码写在形状、大小相同的号签上; 第三步,将号签放在同一不透明的箱中,并搅拌均匀; 第四步,从箱中每次抽取 1 个号签,连续抽取 k 次; 第五步, 将总体中与抽取的号签的编号一致的 k 个个体取出.
突 破
2
点
10
一 突 破 点 二 课时达标检测
统
计
结
束
第十章 统计与统计案例
第一节 统 计
本节主要包括 2 个知识点: 1.随机抽样; 2.用样本估计总体.
突
破
点
一
突
破
点
二
课时达标检测
统
计
结
束
突破点(一)
基础联通
高考数学1轮复习 热点难点精讲精析 10.3统计案例
精品“正版”资料系列,由本公司独创。
旨在将“人教版”、”苏教版“、”北师大版“、”华师大版“等涵盖几乎所有版本的教材教案、课件、导学案及同步练习和检测题分享给需要的朋友。
本资源创作于2020年8月,是当前最新版本的教材资源。
包含本课对应内容,是您备课、上课、课后练习以及寒暑假预习的最佳选择。
2014年高考一轮复习热点难点精讲精析:10.3统计案例(一)线性回归分析※相关链接※1.首先利用散点图判断两个变量是否线性相关.=+.2.求回归方程y bx a(1)线性回归方程中的截距a和斜率b都是通过样本估计而来的,存在着误差,这种误差可能导致预报结果的偏差.=+中的b表示x增加1个单位时y的变化量为b.(2)回归方程y bx a=+预报在x取某一个值时y的估计值.(3)可以利用回归方程y bx a3.相关系数r利用相关系数r来衡量两个变量之间的线性相关的强弱.4.建立回归模型的步骤(1)确定研究对象,明确哪个变量是解释变量,哪个变量是预报变量.(2)画出确定好的解释变量和预报变量的散点图,观察它们之间的关系(如是否存在线性关系等).=+).(3)由经验确定回归方程的类型(如我们观察到数据呈线性关系,则选用线性回归方程y bx a(4)按一定规则估计回归方程中的参数(如最小二乘法).(5)得出结果后分析残差是否异常(个别数据对应残差过大,或残差呈现不随机的规律性等).若存在异常,则检查数据是否有误,或模型是否适合等.注:回归方程只适用于我们所研究的样本的总体,而且一般都有时间性.样本的取值范围一般不能超过回归方程的适用范围,否则没有实用价值.※例题解析※〖例〗测得某国10对父子身高(单位:英寸)如下:(1)对变量y x 与进行相关性检验;(2)如果y x 与之间具有线性相关关系,求回归方程. (3)如果父亲的身高为73英寸,估计儿子的身高.思路解析:(1)先根据已知计算相关系数r ,判断是否具有相关关系. (2)再利用分工求出回归方程进行回归分析. 解答:(1)1010102222111101101022221166.8,67.01,4462.24,4490.4,44974,44941.93,44842.4,1044842.4104476.26879.72(4479444622.4)(44941.93449.3.4)661(10)(10)iii i i i i i ii i i i i x y x y x y x y x y x yr x x y y =========≈===--⨯==----∑∑∑∑∑∑0.804.1.5764≈所以y x 与之间具有很强的线性相关关系.(2)设回归方程为y bx a =+.由101102211044842.444762.6879.72ˆ0.46464479444662.4171.610i ii i i x y x ybx x==--===≈--∑∑.ˆˆ67.010.464666.835.97.ay bx =-=-⨯≈ 故所求的回归方程为:ˆ0.464635.97yx =+. (3)当x=73时, ˆ0.46467335.9769.9y=⨯+≈.所以当父亲身高为73英寸时,估计儿子身高约为69.9英寸.(二)非线性回归分析 ※相关链接※1.非线性回归模型:当回归方程不是形如y bx a =+时称之为非线性回归模型.2.非线性回归模型的拟合效果:对于给定的样本点1122(,),(,),,(,)n n x y x y x y ,两个含有未知数的模型(1)(2)(,)(,)y f x a y g x b ==和,其中a b 和都是未知参数.可按如下的步骤比较它们的拟合效果:(1)分别建立对应于两个模型的回归方程(1)(2)ˆˆˆˆ(,)(,)yf x a yg x b ==和,其中ˆˆa b 和分别是参数a b 和的估计值;(2)分别计算两个回归方程的残差平方和(1)(1)2(2)(2)211ˆˆˆˆ()()n ni i i i i i Q y y Q y y ===-=-∑∑和;(3)若(1)ˆQ<(2)ˆQ ,则(1)(2)ˆˆˆˆ(,)(,)y f x a y g x b ==的效果比; 反之, (1)(2)ˆˆˆˆ(,)(,)yf x a yg x b ==的效果不如的好. ※例题解析※〖例〗为了研究某种细菌随时间x 变化时,繁殖个数y 的变化,收集数据如下:(1)用天数x 作解释变量,繁殖个数y 作预报变量,作出这些数据的散点图 (2)描述解释变量x 与预报变量y 之间的关系; (3)计算残差平方和、相关指数.思路解析:作出散点图→分析与哪种曲线拟合→转化线性关系→进行回归分析. 解答:(1)所作散点图如图所示.(2)由散点图看出样本点分析在一条指数函数21c xy c e=的周围,于是令ln z y =,则由计算器得:ˆ0.69 1.112,zx =+则有 1.69 1.112ˆx y e +=. (3)则662211ˆˆ() 3.1643ii i i i ey y ===-=∑∑,621ˆ()i i i y y =-∑=24642.8,2 3.164310.999924642.8R =-=,即解释变量天数对预报变量细菌的繁殖个数解释了99.99%.(三)独立性检验〖例〗在调查的480名男人中有38名患有色盲,520名女人中有6名患有色盲,分别利用图形和独立性检验的方法来判断色盲与性别是否有关?你所得到的结论在什么范围内有效?思路解析:(1)先由已知作出调查数据的列联表; (2)再根据列联表画出二维条形图,并进行分析; (3)利用独立性检验作出判断.解答:根据题目所给的数据作出如下的联表:根据列联表作出相应的二维条形图,如图所示.从二维条形图来看,在男人中患色盲的比例38480,要比在女人中患色盲的比例6520要大,其差值为386||0.068,480520-≈差值较大,因而我们可以认为“性别与患色盲是有关的”,根据列联表中所给的数据可以有38,442,6,514,480,520,44,956,1000,a b c d a b c d a c b d n ====+=+=+=+==代入公式22()()()()()n ad bc K a b c d a c b d -=++++得221000(385146442)27.148052044956K ⨯⨯-⨯=≈⨯⨯⨯。
2019年高考数学考纲解读与热点难点突破专题19概率与统计热点难点突破理含解析
率与统计1.在新一轮的素质教育要求下,各地高中陆陆续续开展了选课走班的活动,已知某高中学校提供了3门选修课供该校学生选择,现有5名同学参加该校选课走班的活动,要求这5名同学每人选修一门课程且每门课程都有人选,则这5名同学选课的种数为( ) A .120 B .150 C .240 D .540答案 B解析 因为将5个人分成3组有两种情形, 5=3+1+1,5=2+2+1,所以这5名同学选课的种数为⎝ ⎛⎭⎪⎫C 35C 12C 11A 22+C 15C 24C 22A 22·A 33=150,故选B. 2.某学校为了弘扬中华传统“孝”文化,共评选出2位男生和2位女生为校园“孝”之星,现将他们的照片展示在宣传栏中,要求同性别的同学不能相邻,不同的排法种数为( ) A .4 B .8 C .12 D .243.将A ,B ,C ,D ,E 这5名同学从左至右排成一排,则A 与B 相邻且A 与C 之间恰好有一名同学的排法有( ) A .18种 B .20种 C .21种 D .22种 答案 B解析 当A ,C 之间为B 时,看成一个整体进行排列,共有A 22·A 33=12(种),当A ,C 之间不是B 时,先在A ,C 之间插入D ,E 中的任意一个,然后B 在A 之前或之后,再将这四个人看成一个整体,与剩余一个进行排列,共有C 12·A 22·A 22=8(种),所以共有20种不同的排法.4. ⎝⎛⎭⎪⎫x -1x ⎝⎛⎭⎪⎫x +3x 3的展开式中的常数项为( )A .-6B .6C .12D .18 答案 D解析 由二项式⎝ ⎛⎭⎪⎫x +3x 3的通项公式为T +1=C k 33·3-2, 当3-2=1时,解得=1,当3-2=-1时,解得=2,所以展开式中的常数项为-C 13·31+C 23·32=-9+27=18.5.若⎝ ⎛⎭⎪⎫x -1x n的展开式中只有第7项的二项式系数最大,则展开式中含2项的系数是( )A .-462B .462C .792D .-7926.二项式⎝⎛⎭⎪⎪⎫x +13x 40的展开式中,其中是有理项的共有( ) A .4项 B .7项 C .5项 D .6项 答案 B解析 二项式⎝⎛⎭⎪⎪⎫x +13x 40的展开式中, 通项公式为T +1=C k40·()x 40-·⎝ ⎛⎭⎪⎪⎫13x=C k 40·5206kx-,0≤≤40,∴当=0,6,12,18,24,30,36 时满足题意,共7个.7.《中国诗词大会》(第二季)亮点颇多,十场比赛每场都有一首特别设计的开场诗词,在声光舞美的配合下,百人团齐声朗诵,别有韵味.若《将进酒》、《山居秋暝》、《望岳》、《送杜少府之任蜀州》和另确定的两首诗词排在后六场,且《将进酒》排在《望岳》的前面,《山居秋暝》与《送杜少府之任蜀州》不相邻且均不排在最后,则后六场的排法有( ) A .144种B .288种C .360种D .720种 答案 A解析 《将进酒》、《望岳》和另确定的两首诗词进行全排列共有A 44种排法,满足《将进酒》排在《望岳》的前面的排法共有A 44A 22种,再将《山居秋暝》与《送杜少府之任蜀州》插排在4个空里(最后一个空不排),有A 24种排法.《将进酒》排在《望岳》的前面、《山居秋暝》与《送杜少府之任蜀州》不相邻且均不排在最后,则后六场的排法有A 44A 22×A 24=144(种).8.已知m =ʃπ03cos ⎝ ⎛⎭⎪⎫x -π2d ,则(-2y +3)m 的展开式中含m -2y 项的系数等于( )A .180B .-180C .-90D .15 答案 B解析 由于m =ʃπ03cos ⎝ ⎛⎭⎪⎫x -π2d =ʃπ03sin d=(-3cos )|π0=6,所以(-2y +3)m =(-2y +3)6=[(-2y )+3]6,其展开式的通项为C k 6(-2y )6-(3),当=1时,展开式中才能含有4y 项,这时(-2y )5的展开式的通项为C S 5·5-S (-2y )S , 当s =1时,含有4y 项,系数为-10, 故(-2y +3)6的展开式中含4y 项的系数为 C 16·(-10)×3=-180.9.为迎接中国共产党十九大的到,某校举办了“祖国,你好”的诗歌朗诵比赛.该校高三年级准备从包括甲、乙、丙在内的7名学生中选派4名学生参加,要求甲、乙、丙这3名同学中至少有1人参加,且当这3名同学都参加时,甲和乙的朗诵顺序不能相邻,那么选派的4名学生中不同的朗诵顺序的种数为( )A .720B .768C .810D .816答案 B解析 由题意知结果有三种情况.(1)甲、乙、丙三名同学全参加,有C 14A 44=96(种)情况,其中甲、乙相邻的有C 14A 22A 33=48(种)情况,所以当甲、乙、丙三名同学全参加时,甲和乙的朗诵顺序不能相邻的有96-48=48(种)情况;(2)甲、乙、丙三名同学恰有一人参加,不同的朗诵顺序有C 34C 13A 44=288(种)情况;(3)甲、乙、丙三名同学恰有二人参加时,不同的朗诵顺序有C 24C 23A 44=432(种)情况.则选派的4名学生不同的朗诵顺序有288+432+48=768(种)情况,故选B.10.盒中装有10只乒乓球,其中6只新球,4只旧球,不放回地依次摸出2个球使用,在第一次摸出新球的条件下,第二次也摸出新球的概率为( ) A.35 B.59 C.25 D.110 答案 B解析 设“第一次摸出新球”为事件A ,“第二次摸出新球”为事件B ,则P (A )=C 16C 19C 110C 19=35,P (AB )=C 16C 15C 110C 19=13, P (B |A )=P AB P A =59.11.某游戏中一个珠子从图中的通道(图中实线表示通道)由上至下滑下,从最下面的六个出口(如图所示1,2,3,4,5,6)出,规定猜中出口者为胜.如果你在该游戏中,猜得珠子从3号出口出,那么你取胜的概率为( )A.516B.532C.16 D .以上都不对 答案 A解析 我们把从A 到3的路线图(图略)单独画出:分析可得,从A 到3共有C 25=10(种)走法,每一种走法的概率都是⎝ ⎛⎭⎪⎫125,所以珠子从出口3出的概率是C 25⎝ ⎛⎭⎪⎫125=516. 12.我校高三8个学生参加数学竞赛的得分用茎叶图表示,其中茎为十位数,叶为个位数,则这组数据的平均数和方差分别是( )A .91,9.5B .91,9C .92,8.5D .92,8 答案 A解析 由题意,根据茎叶图,可得平均数x =18(2×80+6×90+8+5+1+5+4+2+0+3)=91,方差s 2=18[(88-91)2+(85-91)2+…+(93-91)2]=18×76=9.5.13.A 地的天气预报显示,A 地在今后的三天中,每一天有强浓雾的概率为30%,现用随机模拟的方法估计这三天中至少有两天有强浓雾的概率:先利用计算器产生0~9之间整数值的随机数,并用0,1,2,3,4,5,6表示没有强浓雾,用7,8,9表示有强浓雾,再以每3个随机数作为一组,代表三天的天气情况,产生了如下20组随机数:402 978 191 925 273 842 812 479 569 683 231 357 394 027 506 588 730 113 537 779 则这三天中至少有两天有强浓雾的概率近似值为( ) A.14 B.25 C.710 D.15 答案 D解析 由随机数表可知,满足题意的数据为978,479,588,779,据此可知,这三天中至少有两天有强浓雾的概率近似为P =420=15.14.在吸烟与患肺癌这两个分类变量的独立性检验的计算中,下列说法正确的是( )A .若2的观测值=6.635,则在犯错误的概率不超过0.01的前提下认为吸烟与患肺癌有关系,那么在100个吸烟的人中必有99人患有肺癌B .由独立性检验可知,在犯错误的概率不超过0.01的前提下认为吸烟与患肺癌有关系时,我们说某人吸烟,那么他有99%的可能患有肺癌C .若从随机变量中求出在犯错误的概率不超过0.01的前提下认为吸烟与患肺癌有关系,是指有1%的可能性使得判断出现错误D .以上三种说法都不正确15.“搜索指数”是网民通过搜索引擎,以每天搜索关键词的次数为基础所得到的统计指标.“搜索指数”越大,表示网民对该关键词的搜索次数越多,对该关键词相关的信息关注度也越高.下图是2017年9月到2018年2月这半年中,某个关键词的搜索指数变化的走势图.根据该走势图,下列结论正确的是( )A.这半年中,网民对该关键词相关的信息关注度呈周期性变化B.这半年中,网民对该关键词相关的信息关注度不断减弱C.从网民对该关键词的搜索指数看,去年10月份的方差小于11月份的方差D.从网民对该关键词的搜索指数看,去年12月份的平均值大于今年1月份的平均值答案 D解析根据走势图可知,这半年中,网民对该关键词相关的信息关注度不呈周期性变化,A错;这半年中,网民对该关键词相关的信息关注度增减不确定,B错;从网民对该关键词的搜索指数看,去年10月份的搜索指数的稳定性小于11 月份的搜索指数的稳定性,所以去年10月份的方差大于11 月份的方差,C错;从网民对该关键词的搜索指数看,去年12月份的平均值大于今年1月份的平均值,D正确.16.下列说法中正确的是( )①相关系数r用衡量两个变量之间线性关系的强弱,|r|越接近于1,相关性越弱;②回归直线y^=b^+a^一定经过样本点的中心(x,y);③随机误差e满足E(e)=0,其方差D(e)的大小用衡量预报的精度;④相关指数R2用刻画回归的效果,R2越小,说明模型的拟合效果越好.A.①②B.③④C.①④D.②③答案 D解析 ①线性相关系数r 是衡量两个变量之间线性关系强弱的量,|r |越接近于1,这两个变量线性相关关系越强,|r |越接近于0,线性相关关系越弱,①错误;②回归直线y ^=b ^+a ^一定通过样本点的中心⎝⎛⎭⎫x ,y ,②正确;③随机误差e 是衡量预报精确度的一个量,它满足E (e )=0,③正确;④相关指数R 2用刻画回归的效果,R 2越大,说明模型的拟合效果越好,④不正确,故选D.的分布列为所以E ()=0×0.1+1×0.6+2×0.3=1.2. (2)由已知可得,2×2列联表为2=n ad -bc 2a +bc +d a +cb +d=406×8-12×14220×20×18×22=4011≈3.636<3.841, 所以不能在误差不超过0.05的情况下,认为B 机器生产的产品比A 机器生产的产品好. (3)A 机器每生产10万件的利润为10×(12×0.1+10×0.2+5×0.7)-20=47(万元),B 机器每生产10万件的利润为10×(12×0.15+10×0.45+5×0.4)-30=53(万元),所以53-47=6>5,所以该工厂不会仍然保留原的两台机器,应该会卖掉A 机器,同时购买一台B 机器.。
2019高三数学文一轮:第9章 重点强化课5 统计与统计案例
重点强化课(五) 统计与统计案例(对应学生用书第145页)[复习导读] 本章是新课程改革增加内容,是命题的热点,以算法框图、回归分析、统计图表为重点,以客观题为主.命题注重背景新颖、角度灵活.但近几年统计与统计案例、统计与概率交汇,加大了考查力度.2015年、2016年全国卷均以解答题的形式呈现,强化统计思想方法和创新应用意识的考查,复习过程中应引起注意,多变换角度,注重新背景、新材料题目的训练.重点1 算法框图及应用角度1 算法框图与数列交汇执行如图1的算法框图,如果输入的N =100,则输出的X =( )【导学号:00090336】A .0.95B .0.98C .0.99D .1.00图1C [由算法框图知,输出的X 表示数列⎩⎪⎨⎪⎧⎭⎪⎬⎪⎫1n (n +1)的前99项和,∴X =11×2+12×3+…+199×100=⎝ ⎛⎭⎪⎫1-12+⎝ ⎛⎭⎪⎫12-13+…+⎝ ⎛⎭⎪⎫199-1100=99100.]角度2 算法框图与统计的渗透(2017·合肥模拟)随机抽取某中学甲、乙两个班各10名同学,测量他们的身高获得身高数据的茎叶图如图2,在样本的20人中,记身高在[150,160),[160,170),[170,180),[180,190)的人数依次为A1,A2,A3,A4.如图3是统计样本中身高在一定范围内的人数的算法框图.若图中输出的S=18,则判断框应填________.图2图3i<5或i≤4[由于i从2开始,也就是统计大于或等于160的所有人数,于是就要计算A2+A3+A4,因此,判断框应填i<5或i≤4.]角度3算法框图与函数交汇渗透如图4所示的算法框图的输入值x∈[-1,3],则输出值y的取值范围为()图4A.[1,2]B.[0,2]C.[0,1]D.[-1,2]B[当0≤x≤3时,1≤x+1≤4,所以0≤log2(x+1)≤2.当-1≤x<0时,0<-x≤1⇒1<2-x≤2,所以0<2-x-1≤1.因此输出值y的取值范围为[0,2].][规律方法] 1.完善算法框图:结合初始条件和输出结果,分析控制循环的变量应满足的条件或累加、累乘的变量的表达式.2.求解该类问题,关键是准确理解算法框图的结构,明确算法框图的功能,按照算法框图中的条件进行程序.重点2用样本估计总体随机抽取某中学甲、乙两班各10名同学,测量他们的身高(单位:cm),获得身高数据的茎叶图,如图5所示.图5(1)根据茎叶图判断哪个班的平均身高较高;(2)计算甲班的样本方差;(3)现从乙班这10名同学中随机抽取2名身高不低于173 cm的同学,求身高为176 cm的同学被抽中的概率.[解](1)由茎叶图可知:甲班同学身高集中在162~179 cm,而乙班同学身高集中在170~179 cm,因此乙班的平均身高高于甲班.(2)x甲=158+162+163+168+168+170+171+179+179+18210=170(cm),甲班的样本方差s2甲=110×[(158-170)2+(162-170)2+(163-170)2+(168-170)2+(168-170)2+(170-170)2+(171-170)2+(179-170)2+(179-170)2+(182-170)2]=57.2(cm)2.(3)记“身高为176 cm的同学被抽中”为事件A.从乙班10名同学中抽出2名身高不低于173 cm的同学有:(173,176),(173,178),(173,179),(173,181),(176,178),(176,179),(176,181),(178,179),(178,181),(179,181),共10个基本事件,而事件A含有4个基本事件,故P(A)=410=25.[规律方法] 1.利用统计图表解决实际问题的关键在于从统计图表中提炼准确的数据信息.2.本例通过茎叶图考查对数据的处理能力和数形结合的思想方法,通过求概率考查运算求解能力和实际应用意识.[对点训练1] 为调查甲、乙两校高三年级学生某次联考数学成绩情况,用简单随机抽样,从这两校中各抽取30名高三年级学生,以他们的数学成绩(百分制)作为样本,样本数据的茎叶图如图6所示.图6(1)若甲校高三年级每位学生被抽取的概率为0.05,求甲校高三年级学生总人数,并估计甲校高三年级这次联考数学成绩的及格率(60分及60分以上为及格);(2)设甲、乙两校高三年级学生这次联考数学平均成绩分别为x 1,x 2,估计x1-x 2的值. 【导学号:00090337】[解] (1)设甲校高三年级学生总人数为n . 由题意知30n =0.05,解得n =600.2分样本中甲校高三年级学生数学成绩不及格人数为5,据此估计甲校高三年级这次联考数学成绩的及格率为 ⎝ ⎛⎭⎪⎫1-530×100%≈83%.5分(2)设甲、乙两校样本平均数分别为x ′1,x ′2,根据样本茎叶图可知30(x ′1-x ′2)=30x ′1-30x ′2=(7-5)+(55+8-14)+(24-12-65)+(26-24-79)+(22-20)+92=2+49-53-77+2+92=15,因此x ′1-x ′2=0.5, 故x 1-x 2的估计值为0.5分.12分重点3 统计的应用(2016·全国卷Ⅰ)某公司计划购买1台机器,该种机器使用三年后即被淘汰.机器有一易损零件,在购进机器时,可以额外购买这种零件作为备件,每个200元.在机器使用期间,如果备件不足再购买,则每个500元.现需决策在购买机器时应同时购买几个易损零件,为此搜集并整理了100台这种机器在三年使用期内更换的易损零件数,得下面柱状图:图7记x 表示1台机器在三年使用期内需更换的易损零件数,y 表示1台机器在购买易损零件上所需的费用(单位:元),n 表示购机的同时购买的易损零件数. (1)若n =19,求y 与x 的函数解析式;(2)若要求“需更换的易损零件数不大于n ”的频率不小于0.5,求n 的最小值; (3)假设这100台机器在购机的同时每台都购买19个易损零件,或每台都购买20个易损零件,分别计算这100台机器在购买易损零件上所需费用的平均数,以此作为决策依据,购买1台机器的同时应购买19个还是20个易损零件? [解] (1)当x ≤19时,y =3 800;当x >19时,y =3 800+500(x -19)=500x -5 700, 所以y 与x 的函数解析式为 y =⎩⎨⎧3 800,x ≤19,500x -5 700,x >19(x ∈N ).4分(2)由柱状图知,需更换的零件数不大于18的频率为0.46,不大于19的频率为0.7,故n 的最小值为19.8分(3)若每台机器在购机同时都购买19个易损零件,则这100台机器中有70台在购买易损零件上的费用为3 800,20台的费用为4 300,10台的费用为4 800,因此这100台机器在购买易损零件上所需费用的平均数为1100(3 800×70+4 300×20+4 800×10)=4 000.10分若每台机器在购机同时都购买20个易损零件,则这100台机器中有90台在购买易损零件上的费用为4 000,10台的费用为4 500,因此这100台机器在购买易损零件上所需费用的平均数为1100(4 000×90+4 500×10)=4 050. 比较两个平均数可知,购买1台机器的同时应购买19个易损零件.12分[规律方法] 1.本题将分段函数、频率分布、样本的数字特征交汇命题,体现了统计思想的意识和应用.2.本题易错点有两处:一是混淆频率分布直方图与柱状图致误;二是审题不清或不懂题意,导致解题无从入手.避免此类错误,需认真审题,读懂题意,并认真观察频率分布直方图与柱状图的区别,纵轴表示的意义.[对点训练2] (2018·池州模拟)某职称晋级评定机构对参加某次专业技术考试的100人的成绩进行了统计,绘制的频率分布直方图如图8所示.规定80分以上者晋级成功,否则晋级失败(满分为100分). 【导学号:00090338】 (1)求图中a 的值;(2)估计该次考试的平均分x (同一组中的数据用该组的区间中点值代表); (3)根据已知条件完成下面2×2列联表,并判断能否有85%的把握认为“晋级成功”与性别有关.图--参考公式:K 2=n (ad -bc )2(a +b )(c +d )(a +c )(b +d ),其中n =a +b +c +d[+0.040)×10=1,解得a=0.005. 3分(2)由频率分布直方图知各小组的中点值依次是55,65,75,85,95,对应的频率分布为0.05,0.30,0.40,0.20,0.05,则估计该次考试的平均分为x=55×0.05+65×0.3+75×0.4+85×0.2+95×0.05=74(分). 6分(3)由频率分布直方图知,晋级成功的频率为0.2+0.05=0.25,故晋级成功的人数为100×0.25=25,8分填写2×2列联表如下:χ2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d)=100×(16×41-34×9)225×75×50×50≈2.613>2.072,所以有85%的把握认为“晋级成功”与性别有关. 12分。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
2019年高考一轮复习热点难点精讲精析:
10.3统计案例
(一)线性回归分析
※相关链接※
1.首先利用散点图判断两个变量是否线性相关.
=+.
2.求回归方程y bx a
(1)线性回归方程中的截距a和斜率b都是通过样本估计而来的,存在着误差,这种误差可能导致预报结果的偏差.
=+中的b表示x增加1个单位时y的变化量为b.
(2)回归方程y bx a
=+预报在x取某一个值时y的估计值.
(3)可以利用回归方程y bx a
3.相关系数r
利用相关系数r来衡量两个变量之间的线性相关的强弱.
4.建立回归模型的步骤
(1)确定研究对象,明确哪个变量是解释变量,哪个变量是预报变量.
(2)画出确定好的解释变量和预报变量的散点图,观察它们之间的关系(如是否存在线性关系等).
=+).
(3)由经验确定回归方程的类型(如我们观察到数据呈线性关系,则选用线性回归方程y bx a
(4)按一定规则估计回归方程中的参数(如最小二乘法).
(5)得出结果后分析残差是否异常(个别数据对应残差过大,或残差呈现不随机的规律性等).若存在异常,则检查数据是否有误,或模型是否适合等.
注:回归方程只适用于我们所研究的样本的总体,而且一般都有时间性.样本的取值范围一般不能超过回归方程的适用范围,否则没有实用价值.
※例题解析※
〖例〗测得某国10对父子身高(单位:英寸)如下:
(1)对变量y x
与进行相关性检验;
(2)如果y x
与之间具有线性相关关系,求回归方程.
(3)如果父亲的身高为73英寸,估计儿子的身高.
思路解析:(1)先根据已知计算相关系数r,判断是否具有相关关系.
(2)再利用分工求出回归方程进行回归分析.
解答:(1)
101010
2222
111
66.8,67.01,4462.24,4490.4,44974,44941.93,44842.4,
i i i i
i i i
x y x y x y x y
r
===
===≈===
==
∑∑∑
0.804.
≈
所以y x
与之间具有很强的线性相关关系.
(2)设回归方程为y bx a
=+.由
10
1
102
2
1
10
44842.444762.6879.72
ˆ0.4646
4479444662.4171.6
10
i i
i
i
i
x y x y
b
x x
=
=
-
-
===≈
-
-
∑
∑
.
ˆ
ˆ67.010.464666.835.97.
a y bx
=-=-⨯≈
故所求的回归方程为:ˆ0.464635.97
y x
=+.
(3)当x=73时, ˆ0.46467335.9769.9
y=⨯+≈.所以当父亲身高为73英寸时,估计儿子身高约为69.9英寸.
(二)非线性回归分析
※相关链接※
1.非线性回归模型:当回归方程不是形如y bx a
=+时称之为非线性回归模型.
2.非线性回归模型的拟合效果:对于给定的样本点
1122
(,),(,),,(,)
n n
x y x y x y,两个含有未知数的模型
(1)(2)(,)(,)y f x a y g x b ==和,其中a b 和都是未知参数.
可按如下的步骤比较它们的拟合效果:
(1)分别建立对应于两个模型的回归方程(1)(2)ˆˆˆˆ(,)(,)y
f x a y
g x b ==和,其中ˆˆa b 和分别是参数a b 和的估计值;
(2)分别计算两个回归方程的残差平方和(1)
(1)2
(2)
(2)21
1
ˆˆˆˆ()()n
n
i i i i i i Q
y y
Q y y
===-=-∑∑和; (3)若(1)ˆQ
<(2)ˆQ ,则(1)(2)ˆˆˆˆ(,)(,)y f x a y g x b ==的效果比; 反之, (1)(2)ˆˆˆˆ(,)(,)y
f x a y
g x b ==的效果不如的好. ※例题解析※
〖例〗为了研究某种细菌随时间x 变化时,繁殖个数y 的变化,收集数据如下:
(1)用天数x 作解释变量,繁殖个数y 作预报变量,作出这些数据的散点图 (2)描述解释变量x 与预报变量y 之间的关系; (3)计算残差平方和、相关指数.
思路解析:作出散点图→分析与哪种曲线拟合→转化线性关系→进行回归分析. 解答:(1)所作散点图如图所示.
(2)由散点图看出样本点分析在一条指数函数21c x
y c e
=的周围,于是令ln z y =,则
由计算器得:ˆ0.69 1.112,z
x =+则有 1.69 1.112ˆx y e +=. (3)
则
6
6
2
2
1
1
ˆˆ() 3.1643i
i i i i e
y y ===-=∑∑,6
21
ˆ()i i i y y =-∑=24642.8,2 3.1643
10.999924642.8
R =-=,即解释变量天数对预
报变量细菌的繁殖个数解释了99.99%.
(三)独立性检验
〖例〗在调查的480名男人中有38名患有色盲,520名女人中有6名患有色盲,分别利用图形和独立性检验的方法来判断色盲与性别是否有关?你所得到的结论在什么范围内有效?
思路解析:(1)先由已知作出调查数据的列联表; (2)再根据列联表画出二维条形图,并进行分析; (3)利用独立性检验作出判断.
解答:根据题目所给的数据作出如下的联表:
根据列联表作出相应的二维条形图,如图所示.
从二维条形图来看,在男人中患色盲的比例
38480,要比在女人中患色盲的比例6
520
要大,其差值为386
|
|0.068,480520
-≈差值较大,因而我们可以认为“性别与患色盲是有关的”
,根据列联表中所给的数据可以有38,442,6,514,480,520,44,956,1000,a b c d a b c d a c b d n ====+=+=+=+==
代入公式
2
2
()
()()()()
n ad bc
K
a b c d a c b d
-
=
++++
得
2
2
1000(385146442)
27.1
48052044956
K
⨯⨯-⨯
=≈
⨯⨯⨯。
由于2
K=27.1>10.828,所以我们有99.9%的把握认为性别与患色盲有关系.这个结论只对所调查的480名男人和520名女人有效.
注:利用图形来判断两个变量之间是否有关系,可以结合所求的数值来进行比较.作图应注意单位统一、图形准确,但它不能给出我们两个分类变量有关或无关的精确的可信程度,若要作出精确的判断,可以作独立性检验的有关计算.。