2019年高考数学一轮复习专题10.2统计与统计案例测

合集下载

(江苏版)高考数学一轮复习 专题10.2 统计与统计案例(讲)-人教版高三全册数学试题

(江苏版)高考数学一轮复习 专题10.2 统计与统计案例(讲)-人教版高三全册数学试题

专题10.2 统计与统计案例【最新考纲解读】【考点深度剖析】1. 统计均是以填空题的形式进行考查,题目多为中低档题,着重考查学生运算求解能力、数据处理及分析问题解决问题的能力.统计一般不与其它章节知识结合考查,常单独设置题目.2.统计是高考中的常考题,统计考查的难度中等偏简单,复习时应以基础题为主.复习中,要在全面掌握的基础上理解相关概念,如分层抽样、频率分布直方图、方差等.要务实统计的基础知识,熟悉统计问题的基本解法,从而提高应用统计知识去分析问题和解决问题的能力.【课前检测训练】【判一判】判断下面结论是否正确(请在括号中打“√”或“×”)(1)简单随机抽样是一种不放回抽样.()(2)简单随机抽样每个个体被抽到的机会不一样,与先后有关.()(3)系统抽样在起始部分抽样时采用简单随机抽样.()(4)要从1 002个学生中用系统抽样的方法选取一个容量为20的样本,需要剔除2个学生,这样对被剔除者不公平.()(5)分层抽样中,每个个体被抽到的可能性与层数及分层有关.()(6)平均数、众数与中位数从不同的角度描述了一组数据的集中趋势.()(7)一组数据的众数可以是一个或几个,那么中位数也具有相同的结论.()(8)从频率分布直方图得不出原始的数据内容,把数据表示成直方图后,原有的具体数据信息就被抹掉了.() (9)茎叶图一般左侧的叶按从大到小的顺序写,右侧的叶按从小到大的顺序写,相同的数据可以只记一次.() (10)在频率分布直方图中,最高的小长方形底边中点的横坐标是众数.() (11)在频率分布直方图中,众数左边和右边的小长方形的面积和是相等的.() 1.√2.×3.√4.×5.×6.√7.×8.√9.×10.√11.× 【练一练】1.某公司有员工500人,其中不到35岁的有125人,35~49岁的有280人,50岁以上的有95人,为了调查员工的身体健康状况,从中抽取100名员工,则应在这三个年龄段分别抽取人数为() A.33人,34人,33人 B.25人,56人,19人 C.20人,40人,30人 D.30人,50人,20人【答案】B2.某学校为了了解三年级、六年级、九年级这三个年级之间的学生视力是否存在显著差异,拟从这三个年级中按人数比例抽取部分学生进行调查,则最合理的抽样方法是() A.抽签法 B.系统抽样法 C.分层抽样法 D.随机数法【答案】C【解析】根据年级不同产生差异及按人数比例抽取易知应为分层抽样法.3.将参加英语口语测试的1 000名学生编号为000,001,002,…,999,从中抽取一个容量为50的样本,按系统抽样的方法分为50组,如果第一组编号为000,001,002,…,019,且第一组随机抽取的编号为015,则抽取的第35个编号为() A.700B.669C.695D.676【答案】C4.某公司共有1 000名员工,下设若干部门,现采用分层抽样方法,从全体员工中抽取一个样本容量为80的样本,已告知广告部门被抽取了4个员工,则广告部门的员工人数为________. 【答案】50【解析】1 00080=x 4,x =50.5.某大学为了了解在校本科生对参加某项社会实践活动的意向,拟采用分层抽样的方法,从该校四个年级的本科生中抽取一个容量为300的样本进行调查,已知该校一年级、二年级、三年级、四年级的本科生人数之比为4∶5∶5∶6,则应从一年级本科生中抽取________名学生. 【答案】60【解析】根据题意,应从一年级本科生中抽取的人数为44+5+5+6×300=60.6.某中学初中部共有110名教师,高中部共有150名教师,其性别比例如图所示,则该校女教师的人数为()A.93B.123C.137D.167【答案】C【解析】由题干扇形统计图可得该校女教师人数为:110×70%+150×(1-60%)=137.故选C.7.若某校高一年级8个班参加合唱比赛的得分茎叶图如图所示,则这组数据的中位数和平均数分别是()和和92 C.91和91.5 D.92和92【答案】A【解析】∵这组数据由小到大排列为87,89,90,91,92,93,94,96,∴中位数为12×(91+92)=91.5.平均数为18×(87+89+90+91+92+93+94+96)=91.5.8.一个容量为66的样本,数据的分组及各组的频数如下:[11.5,15.5)2[15.5,19.5)4[19.5,23.5)9[23.5,27.5)18[27.5,31.5)11[31.5,35.5)12 [35.5,39.5)7[39.5,43.5)3根据样本的频率分布估计,数据落在[31.5,43.5)的概率约是() A.16 B.13 C.12 D.23 【答案】B【解析】由已知,样本容量为66,而落在[31.5,43.5)内的样本数为12+7+3=22,故所求概率为2266=13.9.某赛季,甲、乙两名篮球运动员都参加了11场比赛,他们每场比赛得分的情况用如图所示的茎叶图表示,则甲、乙两名运动员得分的中位数分别为________.【答案】19,1310.甲、乙两人在相同条件下各射靶10次,每次命中环数如下:甲47109568688乙7868678759试问10次射靶的情况较稳定的是________.【答案】乙【题根精选精析】考点1 简单随机抽样【1-1】下列抽取样本的方式不属于简单随机抽样的有________.①从无限多个个体中抽取100个个体作为样本.②盒子里共有80个零件,从中选出5个零件进行质量检验.在抽样操作时,从中任意拿出一个零件进行质量检验后再把它放回盒子里.③从20件玩具中一次性抽取3件进行质量检验.④某班有56名同学,指定个子最高的5名同学参加学校组织的篮球赛.【答案】①②③④【1-2】总体由编号为01,02,…,19,20的20个个体组成.利用下面的随机数表选取5个个体,选取方法是从随机数表第1行的第5列和第6列数字开始由左到右依次选取两个数字,则选出来的第5个个体的编号为.7816 6572 0802 6314 0702 4369 9728 01983204 9234 4935 8200 3623 4869 6938 7481【答案】01【解析】从左到右第1行的第5列和第6列数字是65,依次选取符合条件的数字分别是08,02,14,07,01,故选出来的第5个个体的编号为01.【基础知识】1.简单随机抽样定义:设一个总体含有N个个体,从中逐个不放回抽取n个个体作为样本(n≤N),如果每次抽取时总体内的各个个体被抽到的机会都相等,就把这种抽样方法叫做简单随机抽样.2.简单随机抽样方法:抽签法和随机数法.3.简单随机抽样的特点:(1)被抽取样本的总体个数N是有限的;(2)样本是从总体中逐个抽取的;(3)是一种不放回抽样;(4)是等可能抽取.【思想方法】当总体个数较少时,应用此法简便可行;当总体个数较多时,采用其它抽样方法.【温馨提醒】简单随机抽样是等概率抽样,即抽样过程中,每个个体被抽到的概率相等.若样本容量是n,总体个数是N,则用这种方法抽样时,每个个体被抽到的概率都是n N考点2 系统抽样【2-1】为了了解1000名学生的学习情况,采用系统抽样的方法,从中抽取容量为40的样本,则分段的间隔为.【答案】25【解析】由题意知,分段间隔为10002540=,故选C.【2-2】某班级有50名学生,现要采取系统抽样的方法在这50名学生中抽出10名学生,将这50名学生随机编号1~50号,并分组,第一组1~5号,第二组6~10号,……,第十组46~50号,若在第三组中抽得为12的学生,则在第八组中抽得为________的学生.【答案】37【解析】易知组距为5,因为在第三组中抽得为12,所以在第八组中抽得为12+(8-3)×5=37.【基础知识】1.系统抽样系统抽样是指当总体中个数较多时,将总体分成均衡的几部分,然后按照预先定出的规则,从每一部分抽取1个个体,得到所需要的样本的抽样方法.2.假设要从容量为N的总体中抽取容量为n的样本,系统抽样的步骤为:(1)采用随机的方式将总体中的N个个体编号;(2)将编号按间隔k分段,当Nn是整数时,取k=Nn;当Nn不是整数时,从总体中剔除一些个体,使剩下的总体中个体的个数N′能被n整除,这时取k=Nn,并将剩下的总体重新编号;(3)在第一段中用简单随机抽样确定起始的个体编号l;(4)按照一定的规则抽取样本,通常将编号为l,l+k,l+2k,…,l+(n-1)k的个体抽出.【思想方法】系统抽样:将总体编号按间隔k分段,若在第一段中用简单随机抽样确定起始的个体编号l,那么抽取样本的编号为l,l+k,l+2k,…,l+(n-1)k.【温馨提醒】(1)系统抽样中各段入样的个体编号成等差数列,公差即分段间隔;(2)系统抽样的最大特点是“等距”,利用此特点可以很方便地判断一种抽样方法是否是系统抽样.考点3 分层抽样【2-1】【2015高考数学一轮配套特训】某工厂生产A,B,C三种不同型号的产品,产品的数量之比依次为3∶4∶7,现用分层抽样的方法抽出容量为n的样本,样本中A型产品有15件,那么样本容量n为.【答案】70【解析】n⨯3347++15=,解得70n=.【3-2】【2014某某模拟】某校选修乒乓球课程的学生中,高一年级有30名,高二年级有40名.现用分层抽样的方法在这70名学生中抽取一个样本,已知在高一年级的学生中抽取了6名,则在高二年级的学生中应抽取的人数为. 【答案】8【基础知识】 1.分层抽样在抽样时,当总体由有明显差别的几部分组成时,将总体分成互不交叉的层,然后按照一定的比例,从各层独立地抽取一定数量的个体,将各层取出的个体合在一起作为样本,这种抽样方法是一种分层抽样. 2.三种抽样方法的比较 类别共同点各自特点相互联系适用X 围简单随机抽样 均为不放回抽样,且抽样过程中每个个体被抽取的机会相等从总体中逐个抽取总体中的个体数较少系统 抽样将总体均分成几部分,按事先确定的规则在各部分抽取在起始部分抽样时采用简单随机抽样 总体中的个体数较多分层 抽样 将总体分成几层,分层进行抽取各层抽样时采用简单随机抽样或系统抽样 总体由差异明显的几部分组成【思想方法】在分层抽样中,各层都要按相同的比例抽取样本,这一比例即为抽样比= 样本容量各层样本容量个体总量各层个体数量考点4 频率分布直方图【4-1】某市某年4月1日~4月30日对空气污染指数的监测数据如下(主要污染物为可吸入颗粒): 61,76,70,56,81,91,92,91,75,81,88,67,101,103,95,91,77,86,81,83,82,82,64,79,86,85,75,71,49,45. (1)作出频率分布表; (2)作出频率分布直方图;(3)根据国家标准,污染指数在0~50之间时,空气质量为优;在51~100之间时,为良;在101~150之间时,为轻微污染;在151~200之间时,为轻度污染.请你依据所给数据和上述标准,对该市的空气质量给出一个简短评价.【答案】见解析.【解析】(1)频率分布表:(2)频率分布直方图:(3)答对下述两条中的一条即可:①该市一个月中空气污染指数有2天处于优的水平,占当月天数的115;有26天处于良的水平,占当月天数的1315;处于优或良的天数共有28天,占当月天数的1415,说明该市空气质量基本良好.②轻微污染有2天,占当月天数的115;污染指数在80以上的接近轻微污染的天数有15天,加上处于轻微污染的天数,共有17天,占当月天数的1730,超过50%.说明该市空气质量有待进一步改善.【4-2】【2014某某一模】某校从参加高二年级学业水平测试的学生中抽出100名学生,其数学成绩的频率分布直方图如图所示.其中成绩分组区间是[40,50),[50,60),[60,70),[70,80),[80,90),[90,100].则成绩在[80,100]上的人数为_______.【答案】30【解析】由题知成绩在[80,100]的人数为(0.025×10+0.005×10)×100=30. 【基础知识】 1.频率分布直方图(1)通常我们对总体作出的估计一般分成两种,一种是用样本的频率分布估计总体的频率分布,另一种是用样本的特征数估计总体的特征数.(2)在频率分布直方图中,纵轴表示频率组距,数据落在各小组内的频率用各小长方形的面积表示,各小长方形的面积总和等于1.2.频率分布折线图和总体密度曲线 (1)频率分布折线图连接频率分布直方图中各小长方形上端的中点,就得频率分布折线图. (2)总体密度曲线随着样本容量的增加,作图时所分的组数增加,组距减小,相应的频率折线图会越来越接近于一条光滑曲线,即总体密度曲线.统计中称之为总体分布的密度曲线,它能够更加精细的反映出总体在各个X 围内取值的百分比. 【思想方法】1. 频率分布条形图的纵轴(矩形的高)表示频率;频率分布直方图的纵轴(矩形的高)表示频率与组距的比值,其各小组的频率等于该小组上的矩形的面积.2. 作频率分布直方图的步骤:【温馨提醒】.在频率分布直方图中:(1)最高的小长方形底边中点的横坐标即是众数;(2)中位数左边和右边的小长方形的面积和是相等的;(3)平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小长方形的面积乘以小长方形底边中点的横坐标之和..考点5 茎叶图【5-1】某良种培育基地正在培育一种小麦新品种A.将其与原有的一个优良品种B进行对照试验.两种小麦各种植了25亩,所得亩产数据(单位:千克)如下:品种A:357,359,367,368,375,388,392,399,400,405,412,414,415,421,423,423,427,430,430,434,443,445,445,451,454品种B:363,371,374,383,385,386,391,392,394,394,395,397,397,400,401,401,403,406,407,410,412,415,416,422,430(1)作出茎叶图;(2)通过观察茎叶图,对品种A与B的亩产量及其稳定性进行比较,写出统计结论.【答案】(1)见解析;(2)品种A的亩产稳定性较差.【解析】(1)【5-2】某中学高三年级从甲、乙两个班级各选出8名学生参加数学竞赛,他们取得的成绩(满分100分)的茎叶图如图所示,其中甲班学生成绩的平均分是86,乙班学生成绩的中位数是83,则x y +的值为_______.【答案】13【解析】观察茎叶图,甲班学生成绩的平均分是86,故8=x ,乙班学生成绩的中位数是83,故5=y ,∴x +y 13=. 【基础知识】 茎叶图:定义是统计中用来表示数据的一种图,茎是指中间的一列数,叶就是从茎的旁边生长出来的数画法对于样本数据较少,且分布较为集中的一组数据:若数据是两位整数,则将十位数字作茎,个位数字作叶;若数据是三位整数,则将百位、十位数字作茎,个位数字作叶.样本数据为小数时做类似处理.对于样本数据较少,且分布较为集中的两组数据,关键是找到两组数据共有的茎优缺点用茎叶图表示数据的优点是:(1)所有的信息都可以从茎叶图中得到;(2)便于记录和读取,能够展示数据的分布情况.缺点是:当样本数据较多或数据位数较多时,茎叶图就显得不太方便【思想方法】1.茎叶图的优点是保留了原始数据,便于记录及表示,能反映数据在各段上的分布情况.2.茎叶图不能直接反映总体的分布情况,这就需要通过茎叶图给出的数据求出数据的数字特征,进一步估计总体情况.3.当样本数据较少时,用茎叶图表示数据的效果较好,而样本数据较多时,则不方便记录【温馨提醒】1.当样本数据较少时,用茎叶图表示数据的效果较好,它不但可以保留所有信息,而且可以随时记录,给数据的记录和表示都带来方便.2.由茎叶图由小到大排列可以找到中间一个数或中间两个数,由此得到中位数,由其数据可以得到众数.3.由数据集中情况可以估计平均数大小,再根据其分散程度可以估测方差大小.考点6 用样本的数字特征估计总体的数字特征【6-1】对某商店一个月内每天的顾客人数进行了统计,得到样本的茎叶图(如图所示),则该样本的中位数、众数、极差分别是_______.【答案】46,45,56【6-2】【2014年全国普通高等学校招生统一考试(新课标Ⅰ)文科】.从某企业生产的某种产品中抽取100件,测量这些产品的一项质量指标值,由测量表得如下频数分布表:质量指标值分组[75,85) [85,95) [95,105) [105,115) [115,125)频数 6 26 38 22 8(I)在答题卡上作出这些数据的频率分布直方图:(II)估计这种产品质量指标值的平均数及方差(同一组中的数据用该组区间的中点值作代表);(III)根据以上抽样调查数据,能否认为该企业生产的这种产品符合“质量指标值不低于95的产品至少要占全部产品的80%”的规定?【答案】(1)(2)质量指标值的样本平均数为100,质量指标值的样本方差为104(3)不能认为该企业生产的这种产品符合“质量指标值不低于95的产品至少要占全部产品80%”的规定. 【解析】(1)0.380.220.080.68++=,由于该估计值小于0.8,故不能认为该企业生产的这种产品符合“质量指标值不低于95的产品至少要占全部产品80%”的规定. 【基础知识】1.用样本的特征数估计总体的特征数 (1)众数、中位数、平均数众数:在一组数据中,出现次数最多的数据叫做这组数据的众数.中位数:将一组数据按大小依次排列,把处在最中间位置的一个数据(或最中间两个数据的平均数)叫做这组数据的中位数.平均数:样本数据的算术平均数,即12n 1(x +x +...+x )x n=. 在频率分布直方图中,中位数左边和右边的直方图的面积应该相等. (2)样本方差、标准差 样本方差2222121[()()...()]n s x x x x x x n=-+-++- 标准差222121[()()...()]n s x x x x x x n=-+-++-其中x n 是样本数据的第n 项,n 是样本容量,x 是平均数.2.标准差是反映总体波动大小的特征数,样本方差是标准差的平方.通常用样本方差估计总体方差,当样本容量接近总体容量时,样本方差很接近总体方差. 【思想方法】1.在频率分布直方图中,纵轴表示频率组距,数据落在各小组内的频率用各小长方形的面积表示,各小长方形的面积总和等于1.2.平均数与方差都是重要的特征数,是对总体的一种简明的描述,它们所反映的情况有着重要的实际意义,掌握公式不难求出,平均数、中位数、众数描述其集中趋势,方差和标准差描述其波动大小.【温馨提示】数据的离散程度越大,越不稳定;反之离散程度越小,越稳定.【易错问题大揭秘】[失误与防X]1.进行分层抽样时应注意以下几点:(1)分层抽样中分多少层、如何分层要视具体情况而定,总的原则是层内样本的差异要小,两层之间的样本差异要大,且互不重叠.(2)为了保证每个个体等可能入样,所有层中每个个体被抽到的可能性相同.2.用样本频率分布来估计总体分布的重点是频率分布表和频率分布直方图的绘制及用样本频率分布估计总体分布;难点是频率分布表和频率分布直方图的理解及应用.在计数和计算时一定要准确,在绘制小矩形时,宽窄要一致.通过频率分布表和频率分布直方图可以对总体作出估计.3.茎叶图、频率分布表和频率分布直方图都是用来描述样本数据的分布情况的.茎叶图由所有样本数据构成,没有损失任何样本信息,可以随时记录;而频率分布表和频率分布直方图则损失了样本的一些信息,必须在完成抽样后才能制作.4.若取值x1,x2,…,x n的频率分别为p1,p2,…,p n,则其平均值为x1p1+x2p2+…+x n p n;若x1,x2,…,x n的平均数为x,方差为s2,则ax1+b,ax2+b,…,ax n+b的平均数为a x+b,方差为a2s2.。

2019版高考文科数学大一轮复习人教A版文档:第十章 统

2019版高考文科数学大一轮复习人教A版文档:第十章 统

§10.1 随机抽样1.简单随机抽样(1)定义:一般地,设一个总体含有N 个个体,从中逐个不放回地抽取n 个个体作为样本(n ≤N ),如果每次抽取时总体内的各个个体被抽到的机会都相等,就把这种抽样方法叫做简单随机抽样.(2)最常用的简单随机抽样方法有两种——抽签法和随机数法. (3)应用范围:总体个体数较少. 2.系统抽样的步骤一般地,假设要从容量为N 的总体中抽取容量为n 的样本. (1)先将总体的N 个个体编号;(2)确定分段间隔k ,对编号进行分段.当N n (n 是样本容量)是整数时,取k =Nn ;(3)在第1段用简单随机抽样确定第一个个体编号l (l ≤k );(4)按照一定的规则抽取样本.通常是将l 加上间隔k 得到第2个个体编号(l +k ),再加k 得到第3个个体编号(l +2k ),依次进行下去,直到获取整个样本. 3.分层抽样(1)定义:一般地,在抽样时,将总体分成互不交叉的层,然后按照一定的比例,从各层独立地抽取一定数量的个体,将各层取出的个体合在一起作为样本,这种抽样方法是一种分层抽样.(2)分层抽样的应用范围:当总体是由差异明显的几个部分组成时,往往选用分层抽样的方法.题组一思考辨析1.判断下列结论是否正确(请在括号中打“√”或“×”)(1)简单随机抽样是一种不放回抽样.(√)(2)简单随机抽样每个个体被抽到的机会不一样,与先后有关.(×)(3)抽签法中,先抽的人抽中的可能性大.(×)(4)系统抽样在第1段抽样时采用简单随机抽样.(√)(5)要从1 002个学生中用系统抽样的方法选取一个容量为20的样本,需要剔除2个学生,这样对被剔除者不公平.(×)(6)分层抽样中,每个个体被抽到的可能性与层数及分层有关.(×)题组二教材改编2.[P100A组T1]在“世界读书日”前夕,为了了解某地5 000名居民某天的阅读时间,从中抽取了200名居民的阅读时间进行统计分析.在这个问题中,5 000名居民的阅读时间的全体是()A.总体B.个体C.样本的容量D.从总体中抽取的一个样本答案 A解析由题目条件知,5 000名居民的阅读时间的全体是总体;其中1名居民的阅读时间是个体;从5 000名居民某天的阅读时间中抽取的200名居民的阅读时间是从总体中抽取的一个样本,样本容量是200.3.[P100A组T2]某公司有员工500人,其中不到35岁的有125人,35~49岁的有280人,50岁以上的有95人,为了调查员工的身体健康状况,从中抽取100名员工,则应在这三个年龄段分别抽取人数为()A.33,34,33 B.25,56,19C.20,40,30 D.30,50,20答案 B解析因为125∶280∶95=25∶56∶19,所以抽取人数分别为25,56,19.4.[P59T2]某班共有52人,现根据学生的学号,用系统抽样的方法,抽取一个容量为4的样本,已知3号,29号,42号学生在样本中,那么样本中还有一个学生的学号是() A.10 B.11C.12 D.16答案 D解析从被抽中的3名学生的学号中可以看出学号间距为13,所以样本中还有一个学生的学号是16,故选D.题组三易错自纠5.从编号为1~50的50枚最新研制的某种型号的导弹中随机抽取5枚来进行发射实验,若采用每部分选取的号码间隔一样的系统抽样方法,则所选取5枚导弹的编号可能是() A.5,10,15,20,25 B.3,13,23,33,43C.1,2,3,4,5 D.2,4,6,16,32答案 B解析间隔距离为10,故可能的编号是3,13,23,33,43.6.从300名学生(其中男生180人,女生120人)中按性别用分层抽样的方法抽取50人参加比赛,则应该抽取的男生人数为________.答案30解析因为男生与女生的比例为180∶120=3∶2,所以应该抽取的男生人数为50×33+2=30.题型一简单随机抽样1.某班级有男生20人,女生30人,从中抽取10人作为样本,其中一次抽样结果是:抽到了4名男生,6名女生,则下列命题正确的是()A.这次抽样中可能采用的是简单随机抽样B.这次抽样一定没有采用系统抽样C.这次抽样中每个女生被抽到的概率大于每个男生被抽到的概率D.这次抽样中每个女生被抽到的概率小于每个男生被抽到的概率答案 A解析利用排除法求解.这次抽样可能采用的是简单随机抽样,A正确;这次抽样可能采用系统抽样,男生编号为1~20,女生编号为21~50,间隔为5,依次抽取1号,6号,…,46号便可,B错误;这次抽样中每个女生被抽到的概率等于每个男生被抽到的概率,C和D均错误,故选A.2.总体由编号为01,02,…,19,20的20个个体组成.利用下面的随机数表选取5个个体,选取方法是从随机数表第1行的第5列和第6列数字开始由左到右依次选取两个数字,则选出来的第5个个体的编号为()A.08 B.07 C.02 D.01答案 D解析由题意知前5个个体的编号为08,02,14,07,01.3.下列抽取样本的方式不属于简单随机抽样的个数为()①从无限多个个体中抽取100个个体作为样本;②盒子里共有80个零件,从中选出5个零件进行质量检验.在抽样操作时,从中任意拿出一个零件进行质量检验后再把它放回盒子里;③从20件玩具中一次性抽取3件进行质量检验;④某班有56名同学,指定个子最高的5名同学参加学校组织的篮球赛.A.0 B.1 C.2 D.3答案 A解析①不是简单随机抽样.②不是简单随机抽样.由于它是放回抽样.③不是简单随机抽样.因为这是“一次性”抽取,而不是“逐个”抽取.④不是简单随机抽样.因为指定个子最高的5名同学是56名中特指的,不存在随机性,不是等可能抽样.思维升华应用简单随机抽样应注意的问题(1)一个抽样试验能否用抽签法,关键看两点:一是抽签是否方便;二是号签是否易搅匀.一般地,当总体容量和样本容量都较小时可用抽签法.(2)在使用随机数法时,如遇到三位数或四位数,可从选择的随机数表中的某行某列的数字计起,每三个或四个作为一个单位,自左向右选取,有超过总体号码或出现重复号码的数字舍去.题型二 系统抽样典例 (1)在一次马拉松比赛中,35名运动员的成绩(单位:分钟)的茎叶图如图所示:若将运动员按成绩由好到差编为1~35号,再用系统抽样方法从中抽取7人,则其中成绩在区间[139,151]上的运动员人数是( ) A .3 B .4 C .5 D .6 答案 B解析 由题意知,将1~35号分成7组,每组5名运动员,成绩落在区间[139,151]内的运动员共有4组,故由系统抽样法知,共抽取4名.故选B.(2)某单位有840名职工,现采用系统抽样方法抽取42人做问卷调查,将840人按1,2,…,840随机编号,则抽取的42人中,编号落入区间[481,720]的人数为( ) A .11 B .12 C .13 D .14 答案 B解析 由84042=20,即每20人抽取1人,所以抽取编号落入区间[481,720]的人数为720-48020=24020=12. 引申探究1.若本例(2)中条件不变,若号码“5”被抽到,那么号码“55”________被抽到.(填“能”或“不能”) 答案 不能解析 若55被抽到,则55=5+20n ,n =2.5,n 不是整数.故不能被抽到.2.若本例(2)中条件不变,若在编号为[481,720]中抽取8人,则样本容量为________. 答案 28解析 因为在编号[481,720]中共有720-480=240人,又在[481,720]中抽取8人, 所以抽样比应为240∶8=30∶1,又因为单位职工共有840人,所以应抽取的样本容量为84030=28.思维升华 (1)系统抽样适用的条件是总体容量较大,样本容量也较大.(2)使用系统抽样时,若总体容量不能被样本容量整除,可以先从总体中随机地剔除几个个体,从而确定分段间隔.(3)起始编号的确定应用简单随机抽样的方法,一旦起始编号确定,其他编号便随之确定. 跟踪训练 将参加夏令营的600名学生按001,002,…,600进行编号.采用系统抽样的方法抽取一个容量为50的样本,且随机抽得的号码为003.这600名学生分别住在三个营区,从001到300在第Ⅰ营区,从301到495在第Ⅱ营区,从496到600在第Ⅲ营区,则三个营区被抽中的人数依次为( ) A .26,16,8 B .25,17,8 C .25,16,9 D .24,17,9答案 B解析 由题意及系统抽样的定义可知,将这600名学生按编号依次分成50组,每一组各有12名学生,第k (k ∈N *)组抽中的号码是3+12(k -1).令3+12(k -1)≤300,得k ≤1034,因此第Ⅰ营区被抽中的人数是25;令300<3+12(k -1)≤495,得1034<k ≤42,因此第Ⅱ营区被抽中的人数是42-25=17;第Ⅲ营区被抽中的人数为50-25-17=8.题型三 分层抽样命题点1 求总体或样本容量典例 (1)某工厂甲、乙、丙三个车间生产了同一种产品,数量分别为120件,80件,60件.为了解它们的产品质量是否存在显著差异,用分层抽样方法抽取了一个容量为n 的样本进行调查,其中从丙车间的产品中抽取了3件,则n 等于( ) A .9 B .10 C .12 D .13 答案 D解析 ∵360=n 120+80+60,∴n =13.(2)某市电视台为调查节目收视率,想从全市3个区按人口数用分层抽样的方法抽取一个容量为n 的样本.已知3个区人口数之比为2∶3∶5,如果最多的一个区抽出的个体数是60,那么这个样本的容量为( ) A .96 B .120 C .180 D .240 答案 B解析 设样本容量为n ,则52+3+5=60n,解得n =120.命题点2 求某层入样的个体数典例 (1)某校老年、中年和青年教师的人数见下表,采用分层抽样的方法调查教师的身体状况,在抽取的样本中,青年教师有320人,则该样本中的老年教师的人数为( )A.90 B .100 C .180 D .300 答案 C解析 由题意得抽样比为3201 600=15,∴该样本中的老年教师的人数为900×15=180.(2)(2017·重庆一诊)我国古代数学专著《九章算术》中有一衰分问题:今有北乡八千一百人,西乡七千四百八十八人,南乡六千九百一十二人,凡三乡,发役三百人,则北乡遣( ) A .104人 B .108人 C .112人 D .120人答案 B解析 由题意可知,这是一个分层抽样的问题,其中北乡可抽取的人数为300×8 1008 100+7 488+6 912=300×8 10022 500=108,故选B.思维升华 分层抽样问题类型及解题思路(1)求某层应抽个体数量:按该层所占总体的比例计算.(2)已知某层个体数量,求总体容量或反之:根据分层抽样就是按比例抽样,列比例式进行计算.(3)确定是否应用分层抽样:分层抽样适用于总体中个体差异较大的情况.跟踪训练 (1)(2017·南昌一模)某校为了了解学生学习的情况,采用分层抽样的方法从高一 1 000人,高二1 200人,高三n 人中抽取81人进行问卷调查,已知高二被抽取的人数为30,那么n 等于( ) A .860 B .720 C .1 020 D .1 040 答案 D解析 分层抽样是按比例抽样的,所以81×1 2001 000+1 200+n=30,解得n=1 040.(2)已知某地区中小学生人数和近视情况分别如图①和图②所示.为了解该地区中小学生的近视形成原因,用分层抽样的方法抽取2%的学生进行调查,则样本容量和抽取的高中生近视人数分别为________.答案200,20解析该地区中小学生总人数为3 500+2 000+4 500=10 000,则样本容量为10 000×2%=200,其中抽取的高中生近视人数为2 000×2%×50%=20.五审图表找规律典例(12分)某单位有2 000名职工,老年、中年、青年分布在管理、技术开发、营销、生产各部门中,如下表所示:(1)若要抽取40人调查身体状况,则应怎样抽样?(2)若要开一个25人的讨论单位发展与薪金调整方面的座谈会,则应怎样抽选出席人?(3)若要抽20人调查对天津全运会举办情况的了解,则应怎样抽样?抽取40人调查身体状况↓(观察图表中的人数分类统计情况)样本人群应受年龄影响↓(表中老、中、青分类清楚,人数确定)要以老、中、青分层,用分层抽样↓要开一个25人的座谈会↓(讨论单位发展与薪金调整)样本人群应受管理、技术开发、营销、生产方面的影响↓(表中管理、技术开发、营销、生产分类清楚,人数确定)要以管理、技术开发、营销、生产人员分层,用分层抽样↓要抽20人调查对天津全运会举办情况的了解↓(可认为全运会是大众体育盛会,一个单位人员对情况了解相当)将单位人员看作一个整体↓(从表中数据看总人数为2 000)人员较多,可采用系统抽样规范解答解(1)按老年、中年、青年分层用分层抽样法抽取,[1分]抽取比例为402 000=150.[2分]故老年人、中年人、青年人各抽取4人,12人,24人.[4分] (2)按管理、技术开发、营销、生产分层用分层抽样法抽取,[5分]抽取比例为252 000=180,[6分]故管理、技术开发、营销、生产各部门分别抽取2人,4人,6人,13人.[8分](3)用系统抽样,对全部2 000人随机编号,号码从0001~2000,每100号分为一组,从第一组中用简单随机抽样抽取一个号码,然后将这个号码分别加100,200,…,1 900,共20人组成一个样本.[12分]1.某工厂平均每天生产某种机器零件10 000件,要求产品检验员每天抽取50件零件,检查其质量状况,采用系统抽样方法抽取,将零件编号为0000,0001,0002,…,9999,若抽取的第一组中的号码为0010,则第三组抽取的号码为()A.0210 B.0410C .0610D .0810答案 B解析 将零件分成50段,分段间隔为200,因此,第三组抽取的号码为0010+2×200=0410,故选B.2.打桥牌时,将洗好的扑克牌(52张)随机确定一张为起始牌后,开始按次序搬牌,对任何一家来说,都是从52张总体中抽取一个13张的样本,则这种抽样方法是( ) A .系统抽样 B .分层抽样C .简单随机抽样D .非以上三种抽样方法答案 A解析 符合系统抽样的特点,故选A.3.用简单随机抽样的方法从含有10个个体的总体中抽取一个容量为3的样本,其中某一个体a “第一次被抽到”的可能性与“第二次被抽到”的可能性分别是( ) A.110,110 B.310,15 C.15,310 D.310,310 答案 A解析 在抽样过程中,个体a 每一次被抽中的概率是相等的,因为总体容量为10,故个体a “第一次被抽到”的可能性与“第二次被抽到”的可能性均为110,故选A.4.(2017·长沙一中测试)某中学有高中生3 500人,初中生1 500人,为了解学生的学习情况,用分层抽样的方法从该校学生中抽取一个容量为n 的样本,已知从高中生中抽取70人,则n 为( ) A .100 B .150 C .200 D .250 答案 A解析 方法一 由题意可得70n -70=3 5001 500,解得n =100.方法二 由题意,得抽样比为703 500=150,总体容量为3 500+1 500=5 000,故n =5 000×150=100.5.采用系统抽样方法从960人中抽取32人做问卷调查,为此将他们随机编号为1,2,…,960,分组后在第一组采用简单随机抽样的方法抽到的号码为9.抽到的32人中,编号落入区间[1,450]的人做问卷A ,编号落入区间[451,750]的人做问卷B ,其余的人做问卷C .则抽到的人中,做问卷B 的人数为( ) A .7 B .9 C .10 D .15解析 由系统抽样的特点知,抽取号码的间隔为96032=30,抽取的号码依次为9,39,69,…,939.落入区间[451,750]的有459,489,…,729,这些数构成首项为459,公差为30的等差数列,设有n 项,显然有729=459+(n -1)×30,解得n =10.所以做问卷B 的有10人. 6.福利彩票“双色球”中红色球的号码由编号为01,02,…,33的33个个体组成,某彩民利用下面的随机数表选取6组数作为6个红色球的编号,选取方法是从随机数表第1行的第6列和第7列数字开始由左到右依次选取两个数字,则选出来的第6个红色球的编号为( )A.23 B .09 C .02 D .17 答案 C解析 从随机数表第1行的第6列和第7列数字开始由左到右依次选取两个数字,则选出的6个红色球的编号依次为21,32,09,16,17,02,故选出的第6个红色球的编号为02.7.(2017·雅礼中学月考)某中学教务处采用系统抽样方法,从学校高三年级全体1 000名学生中抽50名学生做学习状况问卷调查.现将1 000名学生从1到1000进行编号,求得间隔数k =20,即分50组每组20人.在第一组中随机抽取一个号,如果抽到的是17号,则第8组中应抽取的号码是( ) A .177 B .157 C .417 D .367答案 B解析 根据系统抽样的特点可知,抽取出的编号成首项为17,公差为20的等差数列,所以第8组应抽取的号码是17+(8-1)×20=157.8.将某班的60名学生编号为01,02,…,60,采用系统抽样方法抽取一个容量为5的样本,且随机抽得的一个号码为04,则剩下的四个号码依次是______________. 答案 16,28,40,52解析 编号组数为5,间隔为605=12,因为在第一组抽得04号:4+12=16,16+12=28,28+12=40,40+12=52, 所以其余4个号码依次为16,28,40,52.9.(2017·江苏)某工厂生产甲、乙、丙、丁四种不同型号的产品,产量分别为200,400,300,100件,为检验产品的质量,现用分层抽样的方法从以上所有的产品中抽取60件进行检验,则应从丙种型号的产品中抽取________件.解析 ∵样本容量总体个数=60200+400+300+100=350,∴应从丙种型号的产品中抽取350×300=18(件).10.(2017·潍坊模拟)某高中在校学生有2 000人.为了响应“阳光体育运动”的号召,学校开展了跑步和登山的比赛活动.每人都参与而且只能参与其中一项比赛,各年级参与比赛的人数情况如下表:其中a ∶b ∶c =2∶3∶5,全校参与登山的人数占总人数的25.为了了解学生对本次活动的满意程度,从中抽取一个200人的样本进行调查,则从高二年级参与跑步的学生中应抽取的人数为________. 答案 36解析 根据题意可知,样本中参与跑步的人数为200×35=120,所以从高二年级参与跑步的学生中应抽取的人数为120×32+3+5=36.11.200名职工年龄分布如图所示,从中随机抽取40名职工作样本,采用系统抽样方法,按1~200编号,分为40组,分别为1~5,6~10,…,196~200,若第5组抽取号码为22,则第8组抽取号码为________.若采用分层抽样,40岁以下年龄段应抽取________人.答案 37 20解析 将1~200编号分为40组,则每组的间隔为5,其中第5组抽取号码为22,则第8组抽取的号码应为22+3×5=37;由已知条件得,200名职工中40岁以下的职工人数为200×50%=100,设在40岁以下年龄段中应抽取x 人,则40200=x100,解得x =20.12.一个总体中有100个个体,随机编号为0,1,2,…,99.依编号顺序平均分成10个小组,组号依次为1,2,…,10.现用系统抽样的方法抽取一个容量为10的样本,规定如果在第1组中随机抽取的号码为m ,那么在第k 组中抽取的号码的个位数字与m +k 的个位数字相同.若m =6,则在第7组中抽取的号码是________. 答案 63解析 m =6,则在第7组中抽取的号码的个位数字与13的个位数字相同,而第7组中数字编号依次为60,61,62,63,…,69,故在第7组中抽取的号码是63.13.(2017·宁夏中卫二模)某市教育主管部门为了全面了解2017届高三学生的学习情况,决定对该市参加2017年高三第一次全省统一考试(后称统考)的32所学校进行抽样调查.将参加统考的32所学校进行编号,依次为1到32,现用系统抽样法抽取8所学校进行调查,若抽到的最大编号为31,则最小编号是( ) A .3 B .1 C .4 D .2 答案 A解析 根据系统抽样的特点可知,总体分成8组,组距为328=4,若抽到的最大编号为31,则最小编号是3.14.为调查德克士各分店的经营状况,某统计机构用分层抽样的方法,从A ,B ,C 三个城市中抽取若干家德克士分店组成样本进行深入研究,有关数据见下表:(单位:个)则样本容量为________. 答案 6解析 设所求的样本容量为n ,由题意得 n 26+13+39=226,解得n =6.15.(2018·泉州质检)某公司员工对户外运动分别持“喜欢”“不喜欢”和“一般”三种态度,其中持“一般”态度的比持“不喜欢”态度的多12人,按分层抽样方法从该公司全体员工中选出部分员工座谈户外运动,如果选出的人有6人对户外运动持“喜欢”态度,有1人对户外运动持“不喜欢”态度,有3人对户外运动持“一般”态度,那么这个公司全体员工中对户外运动持“喜欢”态度的有( ) A .36人 B .30人 C .24人 D .18人 答案 A解析 设持“喜欢”“不喜欢”“一般”态度的人数分别为6x ,x,3x ,由题意可得3x -x =12,x =6,∴持“喜欢”态度的有6x =36(人).16.(2017·开封模拟)某公路设计院有工程师6人,技术员12人,技工18人,要从这些人中抽取n 个人参加市里召开的科学技术大会.如果采用系统抽样和分层抽样的方法抽取,不用剔除个体,如果参会人数增加1人,则在采用系统抽样时,需要在总体中先剔除1个个体,求n .解 总体容量为6+12+18=36.当样本容量为n 时,由题意知,系统抽样的间隔为36n,分层抽样的比例是n 36,抽取的工程师人数为n 36×6=n 6,技术员人数为n 36×12=n3,技工人数为n 36×18=n2, 所以n 应是6的倍数,36的约数,即n =6,12,18.当样本容量为(n +1)时,总体容量剔除以后是35人,系统抽样的间隔为35n +1,因为35n +1必须是整数,所以n 只能取6,即样本容量n =6.。

2019年高考数学(文科)一轮分层演练:第10章概率、统计和统计案例第1讲(含答案解析)

2019年高考数学(文科)一轮分层演练:第10章概率、统计和统计案例第1讲(含答案解析)

[学生用书P273(单独成册)]一、选择题1.设事件A ,B ,已知P (A )=15,P (B )=13,P (A ∪B )=815,则A ,B 之间的关系一定为( )A .两个任意事件B .互斥事件C .非互斥事件D .对立事件解析:选B .因为P (A )+P (B )=15+13=815=P (A ∪B ),所以A ,B 之间的关系一定为互斥事件.故选B .2.某产品分甲、乙、丙三级,其中乙、丙两级均属次品,在正常生产情况下,出现乙级品和丙级品的概率分别是5%和3%,则抽检一件是正品(甲级)的概率为( )A .0.95B .0.97C .0.92D .0.08解析:选C .记抽检的产品是甲级品为事件A ,是乙级品为事件B ,是丙级品为事件C ,这三个事件彼此互斥,因而所求概率为P (A )=1-P (B )-P (C )=1-5%-3%=92%=0.92.3.从3个红球、2个白球中随机取出2个球,则取出的2个球不全是红球的概率是( ) A .110B .310C .710D .35解析:选C .“取出的2个球全是红球”记为事件A ,则P (A )=310.因为“取出的2个球不全是红球”为事件A 的对立事件,所以其概率为P (A )=1-P (A )=1-310=710.4.“微信抢红包”自2015年以来异常火爆,在某个微信群某次进行的抢红包活动中,若所发红包的总金额为9元,被随机分配为1.49元,1.31元,2.19 元,3.40元,0.61元,共5份,供甲、乙等5人抢,每人只能抢一次, 则甲、乙二人抢到的金额之和不低于4元的概率是( )A .12B .25C .34D .56解析:选B .设事件A 为“甲、乙二人抢到的金额之和不低于4元”,甲、乙两人抢到红包的所有结果为{1.49,1.31},{1.49,2.19},{1.49,3.40},{1.49,0.61},{1.31,2.19},{1.31,3.40},{1.31,0.61},{2.19,3.40},{2.19,0.61},{3.40,0.61},共10种情况.其中事件A 的结果一共有4种情况,根据古典概型概率计算公式,得P (A )=410=25,即甲、乙二人抢到的金额之和不低于4元的概率是25.故选B .5.在正六边形的6个顶点中随机选择4个顶点,则构成的四边形是梯形的概率为( ) A .15B .25C .16D .18解析:选B .如图,在正六边形ABCDEF 的6个顶点中随机选择4个顶点,共有15种选法,其中构成的四边形是梯形的有ABEF ,BCDE ,ABCF ,CDEF ,ABCD ,ADEF ,共6种情况,故构成的四边形是梯形的概率P =615=25.6.已知集合M ={1,2,3,4},N ={(a ,b )|a ∈M ,b ∈M },A 是集合N 中任意一点,O 为坐标原点,则直线OA 与y =x 2+1有交点的概率是( )A .12B .13C .14D .18解析:选C .易知过点(0,0)与y =x 2+1相切的直线为y =2x (斜率小于0的无需考虑),集合N 中共有16个元素,其中使OA 斜率不小于2的有(1,2),(1,3),(1,4),(2,4),共4个,由古典概型知概率为416=14.二、填空题7.某城市2017年的空气质量状况如下表所示:轻微污染,则该城市2017年空气质量达到良或优的概率为________.解析:由题意可知2017年空气质量达到良或优的概率为P =110+16+13=35.答案:358.口袋内装有一些除颜色不同之外其他均相同的红球、白球和黑球,从中摸出1个球,摸出红球的概率是0.42,摸出白球的概率是0.28,若红球有21个,则黑球有________个.解析:摸到黑球的概率为1-0.42-0.28=0.3.设黑球有n 个,则0.4221=0.3n ,故n =15.答案:159.从2名男生和2名女生中,任意选择两人在星期六、星期日参加某公益活动,每天一人,则星期六安排一名男生,星期日安排一名女生的概率为________.解析:将2名男生记为A 1,A 2,2名女生记为B 1,B 2,任意选择两人在星期六、星期日参加某公益活动有A 1A 2,A 1B 1,A 1B 2,A 2B 1,A 2B 2,B 1B 2,B 1A 1,B 2A 1,B 1A 2,B 2A 2,B 2B 1,A 2A 1共12种情况,而星期六安排一名男生,星期日安排一名女生共有A 1B 1,A 1B 2,A 2B 1,A 2B 2这4种情况,则其发生的概率为412=13.答案:1310.现有7名数理化成绩优秀者,分别用A 1,A 2,A 3,B 1,B 2,C 1,C 2表示,其中A 1,A 2,A 3的数学成绩优秀,B 1,B 2的物理成绩优秀,C 1,C 2的化学成绩优秀.从中选出数学、物理、化学成绩优秀者各1名,组成一个小组代表学校参加竞赛,则A 1和B 1不全被选中的概率为________.解析:从这7人中选出数学、物理、化学成绩优秀者各1名,所有可能的结果组成的12个基本事件为:(A 1,B 1,C 1),(A 1,B 1,C 2),(A 1,B 2,C 1),(A 1,B 2,C 2),(A 2,B 1,C 1),(A 2,B 1,C 2),(A 2,B 2,C 1),(A 2,B 2,C 2),(A 3,B 1,C 1),(A 3,B 1,C 2),(A 3,B 2,C 1),(A 3,B 2,C 2).设“A 1和B 1不全被选中”为事件N ,则其对立事件N -表示“A 1和B 1全被选中”,由于N -={(A 1,B 1,C 1),(A 1,B 1,C 2)},所以P (N -)=212=16,由对立事件的概率计算公式得P (N )=1-P (N -)=1-16=56.答案:56三、解答题11.如图,从A 地到火车站共有两条路径L 1和L 2,现随机抽取100位从A 地到达火车站的人进行调查,调查结果如下:所用时间(分钟) 10~20 20~30 30~40 40~50 50~60 选择L 1的人数 6 12 18 12 12 选择L 2的人数416164(1)试估计(2)分别求通过路径L 1和L 2所用时间落在上表中各时间段内的频率;(3)现甲、乙两人分别有40分钟和50分钟时间用于赶往火车站,为了尽最大可能在允许的时间内赶到火车站,试通过计算说明,他们应如何选择各自的路径.解:(1)由已知共调查了100人,其中40分钟内不能赶到火车站的有12+12+16+4=44(人), 所以用频率估计相应的概率为44÷100=0.44. (2)选择L 1的有60人,选择L 2的有40人,故由调查结果得频率为(3)设A 1,A 2121,B 2L 1和L 2时,在50分钟内赶到火车站.由(2)知P (A 1)=0.1+0.2+0.3=0.6,P (A 2)=0.1+0.4=0.5,因为P (A 1)>P (A 2),所以甲应选择L 1 . 同理,P (B 1)=0.1+0.2+0.3+0.2=0.8, P (B 2)=0.1+0.4+0.4=0.9, 因为P (B 1)<P (B 2),所以乙应选择L 2.12.根据我国颁布的《环境空气质量指数(AQI)技术规定》:空气质量指数划分为0~50、51~100、101~150、151~200、201~300和大于300六级,对应空气质量指数的六个级别,指数越大,级别越高,说明污染越严重,对人体健康的影响也越明显.专家建议:当空气质量指数小于等于150时,可以进行户外运动;空气质量指数为151及以上时,不适合进行旅游等户外活动,下表是济南市2017年10月上旬的空气质量指数情况:(1)(2)一外地游客在10月上旬来济南旅游,想连续游玩两天,求适合连续旅游两天的概率. 解:(1)该试验的基本事件空间Ω={1,2,3,4,5,6,7,8,9,10},基本事件总数n =10. 设事件A 为“市民不适合进行户外活动”,则A ={3,4,9,10},包含基本事件数m =4.所以P (A )=410=25, 即10月上旬市民不适合进行户外活动的概率为25.(2)该试验的基本事件空间Ω={(1,2),(2,3),(3,4),(4,5),(5,6),(6,7),(7,8),(8,9),(9,10)},基本事件总数n =9,设事件B 为“适合连续旅游两天的日期”,则B ={(1,2),(5,6),(6,7),(7,8)},包含基本事件数m =4, 所以P (B )=49,所以适合连续旅游两天的概率为49.1.某超市随机选取1 000位顾客,记录了他们购买甲、乙、丙、丁四种商品的情况,整理成如下统计表,其中“√”表示购买,“”表示未购买.(1)(2)估计顾客在甲、乙、丙、丁中同时购买3种商品的概率;(3)如果顾客购买了甲,则该顾客同时购买乙、丙、丁中哪种商品的可能性最大?解:(1)从统计表可以看出,在这1 000位顾客中有200位顾客同时购买了乙和丙,所以顾客同时购买乙和丙的概率可以估计为2001 000=0.2.(2)从统计表可以看出,在这1 000位顾客中,有100位顾客同时购买了甲、丙、丁,另有200位顾客同时购买了甲、乙、丙,其他顾客最多购买了2种商品,所以顾客在甲、乙、丙、丁中同时购买3种商品的概率可以估计为100+2001 000=0.3.(3)与(1)同理,可得:顾客同时购买甲和乙的概率可以估计为2001 000=0.2,顾客同时购买甲和丙的概率可以估计为100+200+3001 000=0.6,顾客同时购买甲和丁的概率可以估计为1001 000=0.1,所以,如果顾客购买了甲,则该顾客同时购买丙的可能性最大.2.以青蒿素类药物为主的联合疗法已经成为世界卫生组织推荐的抗疟疾标准疗法,目前,国内青蒿人工种植发展迅速,调查表明,人工种植的青蒿的长势与海拔高度、土壤酸碱度、空气湿度的指标有极强的相关性,现将这三项的指标分别记为x ,y ,z ,并对它们进行量化:0表示不合格,1表示临界合格,2表示合格,再用综合指标ω=x +y +z 评定人工种植的青蒿的长势等级:若ω≥4,则长势为一级;若2≤ω≤3,则长势为二级;若0≤ω≤1,则长势为三级.为了了解目前人工种植的青蒿的长势情况,研究人员随机抽取了10个青蒿人工种植地,得到如下结果:(2)从长势等级为一级的青蒿人工种植地中随机抽取2个,求这2个人工种植地的综合指标ω均为4的概率.解:(1)计算10个青蒿人工种植地的综合指标,可得下表:编号A1A2A3A4A5A6A7A8A9A10综合指标1446245353由上表可知,长势等级为三级的种植地只有A1一个,其频率为110,用样本的频率估计总体的频率,可估计这些种植地中长势等级为三级的个数约为180×110=18.(2)由(1)可知,长势等级是一级的青蒿人工种植地有A2,A3,A4,A6,A7,A9,共6个,从中随机抽取2个,所有的可能结果为(A2,A3),(A2,A4),(A2,A6),(A2,A7),(A2,A9),(A3,A4),(A3,A6),(A3,A7),(A3,A9),(A4,A6),(A4,A7),(A4,A9),(A6,A7),(A6,A9),(A7,A9),共计15个,综合指标ω=4的有A2,A3,A6,共3个,则符合题意的可能结果为(A2,A3),(A2,A6),(A3,A6),共3个,故所求概率P=315=1 5.。

高考数学一轮总复习:线性回归分析与统计案例

高考数学一轮总复习:线性回归分析与统计案例

①y 与 x 负相关且y^=2.347x-6.423;
②y 与 x 负相关且y^=-3.476x+5.648;
③y 与 x 正相关且y^=5.437x+8.493;
④y 与 x 正相关且y^=-4.326x-4.578.
其中一定不正确的结论的序号是( )
A.①②
B.②③
C.③④
D.①④
【解析】 正相关指的是 y 随 x 的增大而增大.负相关指的 是 y 随 x 的增大而减小,故不正确的为①④,故选 D.
5.(2019·沧州七校联考)通过随机询问 200 名性别不同的大
学 生 是 否 爱 好 踢 毽 子 运 动 , 计 算 得 到 统 计 量 K2 的 观 测 值
k≈4.892,参照附表,得到的正确结论是( )
P(K2≥k) 0.10
0.05 0.025
k
2.706 3.841 5.024
A.有 97.5%以上的把握认为“爱好该项运动与性别有关”
请注意 1.以考查线性回归系数为主,同时可考查利用散点图判断 两个变量间的相关关系. 2.以实际生活为背景,重在考查回归方程的求法.
两个变量的线性相关 (1)正相关. 在散点图中,点散布在从__左__下_角__到__右_上__角__的区域.对于两 个变量的这种相关关系,我们将它们称为正相关. (2)负相关. 在散点图中,点散布在从__左__上_角__到__右_下__角__的区域,两个变 量的这种相关关系称为负相关.
A.人体脂肪含量与年龄正相关,且脂肪含量的中位数等于 20%
B.人体脂肪含量与年龄正相关,且脂肪含量的中位数小于 20%
C.人体脂肪含量与年龄负相关,且脂肪含量的中位数等于 20%
D.人体脂肪含量与年龄负相关,且脂肪含量的中位数小于 20%

2019版高考数学一轮复习第十章统计与统计案例课时达标检测(五十)统计理

2019版高考数学一轮复习第十章统计与统计案例课时达标检测(五十)统计理

课时达标检测(五十) 统 计[小题对点练——点点落实]对点练(一) 随机抽样1.某学校为了了解某年高考数学的考试成绩,在高考后对该校1 200名考生进行抽样调查,其中有400名文科考生,600名理科考生,200名艺术和体育类考生,从中抽取120名考生作为样本,记这项调查为①;从10名家长中随机抽取3名参加座谈会,记这项调查为②,则完成①,②这两项调查宜采用的抽样方法依次是( )A .分层抽样法,系统抽样法B .分层抽样法,简单随机抽样法C .系统抽样法,分层抽样法D .简单随机抽样法,分层抽样法解析:选B 在①中,文科考生、理科考生、艺术和体育类考生会存在差异,采用分层抽样法较好;在②中,抽取的样本个数较少,宜采用简单随机抽样法.2.某校高三年级共有学生900人,编号为1,2,3,…,900,现用系统抽样的方法抽取一个容量为45的样本,则抽取的45人中,编号落在[481,720]的人数为( )A .10B .11C .12D .13解析:选C 系统抽样,是抽多少人就把总体分成多少组,于是抽样间隔就是用总体数量除以样本容量:90045=20.于是落在[481,720]内的人数为720-48020=12,故选C. 3.某中学初中部共有110名教师,高中部共有150名教师,其性别比例如图所示,则该校女教师的人数为( )A .93B .123C .137D .167解析:选C 初中部的女教师人数为110×70%=77,高中部的女教师人数为150×(1-60%)=60,该校女教师的人数为77+60=137,故选C.4.高三(3)班共有学生56人,座号分别为1,2,3,…,56,现根据座号,用系统抽样的方法,抽取一个容量为4的样本.已知3号、17号、45号同学在样本中,那么样本中还有一个同学的座号是( )A .30B .31C .32D .33解析:选B 由系统抽样的特点,得到样本中的座号形成一个以3为首项,公差为17-3=14的等差数列,则第三个座号是17+14=31.故选B.5.假设要考察某公司生产的500克袋装牛奶的质量是否达标,现从800袋牛奶中抽取60袋进行检验,利用随机数表抽取样本时,先将800袋牛奶按000,001,…,799进行编号,如果从随机数表第8行第7列的数开始向右读,请你依次写出最先检测的5袋牛奶的编号________________________________________________________________________(下面摘取了随机数表第7行至第9行).84 42 17 53 31 57 24 55 06 88 77 04 7447 67 21 76 33 50 25 83 92 12 06 7663 01 63 78 59 16 95 56 67 19 98 10 5071 75 12 86 73 58 07 44 39 52 38 7933 21 12 34 29 78 64 56 07 82 52 42 0744 38 15 51 00 13 42 99 66 02 79 54解析:找到第8行第7列的数开始向右读,第一个数785,符合条件,第二个数916,舍去,第三个数955,舍去,第四个数667,符合条件,这样依次读出结果.故答案为:785,667,199,507,175.答案:785,667,199,507,1756.一汽车厂生产A ,B ,C 三类轿车,每类轿车均有舒适型和标准型两种型号,某月的产量如下表(单位:辆):A 类轿车10辆,则z 的值为________.解析:由题意可得50100+300+150+450+z +600=10100+300, 解得z =400.答案:4007.(2018·湖北重点中学适应模拟)某校高三年级共有30个班,学校心理咨询室为了了解同学们的心理状况,将每个班编号,依次为1到30,现用系统抽样的方法抽取5个班进行调查,若抽到的编号之和为75,则抽到的最小的编号为________.解析:系统抽样的抽取间隔为305=6,设抽到的最小编号为x ,则x +(6+x )+(12+x )+(18+x )+(24+x )=75,所以x =3.答案:3对点练(二) 用样本估计总体1.为了普及环保知识,增强环保意识,某大学随机抽取30名学生参加环保知识测试,得分(十分制)如图所示,假设所得分数的中位数为m e ,众数为m 0,平均值为x -,则( )A .m e =m 0=x -B .m e =m 0<x -C .m e <m 0<x -D .m 0<m e <x -解析:选D 由图可知,30名学生的得分情况依次为2个人得3分,3个人得4分,10个人得5分,6个人得6分,3个人得7分,2个人得8分,2个人得9分,2个人得10分.中位数为第15,16个数(分别为5,6)的平均数,即m e =5.5;5出现的次数最多,故m 0=5;x -=(3×2+4×3+5×10+6×6+7×3+8×2+9×2+10×2)÷30≈5.97.于是得m 0<m e <x -.2.如图是某样本数据的茎叶图,则该样本的中位数、众数、极差分别是( )A.32 34 32B .33 45 35C .34 45 32D .33 36 35解析:选B 观察茎叶图,16个数已经按大小顺序列出,从上往下数第8个数和第9个数是最中间两个数,它们是32和34,中位数是它们的平均数:33.再读茎叶图,45出现次数最多,共3次,故为众数.极差等于最大值减最小值:47-12=35.故选B.3.(2017·九江二模)已知一组数据x 1,x 2,…,x n 的方差为2,若数据ax 1+b ,ax 2+b ,…,ax n +b (a >0)的方差为8,则a 的值为( )A .1 B. 2 C .2D .4 解析:选C 根据方差的性质可知,a 2×2=8,故a =2.4.(2018·湖北黄冈质检)已知数据x 1,x 2,x 3,…,x n 是某市n (n ≥3,n ∈N *)个普通职工的年收入,设这n 个数据的中位数为x ,平均数为y ,方差为z ,如果再加上世界首富的年收入x n +1,则这(n +1)个数据中,下列说法正确的是( )A .年收入平均数可能不变,中位数可能不变,方差可能不变B .年收入平均数大大增大,中位数可能不变,方差变大C .年收入平均数大大增大,中位数可能不变,方差也不变D .年收入平均数大大增大,中位数一定变大,方差可能不变解析:选B ∵数据x 1,x 2,x 3,…,x n 是某市n (n ≥3,n ∈N *)个普通职工的年收入,x n +1为世界首富的年收入,则x n +1远大于x 1,x 2,x 3,…,x n ,故这(n +1)个数据中,年收入平均数大大增大;中位数可能不变,也可能稍微变大;由于数据的集中程度受到x n +1的影响比较大,更加离散,则方差变大.5.为比较甲、乙两地某月14时的气温情况,随机选取该月中的5天,将这5天中14时的气温数据(单位:℃)制成如图所示的茎叶图.考虑以下结论:①甲地该月14时的平均气温低于乙地该月14时的平均气温;②甲地该月14时的平均气温高于乙地该月14时的平均气温;③甲地该月14时的气温的标准差小于乙地该月14时的气温的标准差;④甲地该月14时的气温的标准差大于乙地该月14时的气温的标准差.其中根据茎叶图能得到的统计结论的编号为( )A .①③B .①④C .②③D .②④解析:选B ∵x 甲=26+28+29+31+315=29, x 乙=28+29+30+31+325=30, ∴x 甲<x 乙,又s 2甲=9+1+0+4+45=185,s 2乙=4+1+0+1+45=2, ∴s 甲>s 乙.故可判断结论①④正确.6.五一期间,某淘宝店趁势推出了“抢红包”的促销活动.已知每人有5次抢红包的机会,每次可得到1元至30元不等的红包.甲、乙二人在这5次抢红包活动中获得的红包金额的茎叶图如图所示.若甲5次获得的红包金额的均值为x 1,乙5次获得的红包金额的均值为x 2,则x 1-x 2=________.解析:由茎叶图可知,甲获得的红包金额分别为1,2,12,20,30,乙获得的红包金额分别为1,2,5,10,30,所以甲获得的红包金额的均值x 1=1+2+12+20+305=13,乙获得的红包金额的均值x 2=1+2+5+10+305=9.6,所以x 1-x 2=13-9.6=3.4. 答案:3.47.从某小区抽取100户居民进行月用电量调查,发现其用电量都在50至350度之间,频率分布直方图如图所示.(1)直方图中x 的值为________;(2)在这些用户中,用电量落在区间[100,250)内的户数为________.解析:(1)由频率分布直方图总面积为1,得(0.001 2+0.002 4×2+0.003 6+x +0.006 0)×50=1,解得x =0.004 4.(2)用电量在[100,250)内的频率为(0.003 6+0.004 4+0.006 0)×50=0.7,故所求户数为100×0.7=70.答案:(1)0.004 4 (2)708.已知x 是1,2,3,x,5,6,7这七个数据的中位数且1,2,x 2,-y 这四个数据的平均数为1,则y -1x的最小值为________. 解析:由题意1+2+x 2-y =4,所以y =x 2-1.由中位数定义知,3≤x ≤5,所以y -1x=x 2-1-1x .当x ∈[3,5]时,函数y =x 2-1与y =-1x 均为增函数,所以y =x 2-1-1x在[3,5]上为增函数,所以⎝ ⎛⎭⎪⎫y -1x min =8-13=233. 答案:233[大题综合练——迁移贯通]1.(2018·湖北四校联考)某班级准备从甲、乙两人中选一人参加某项比赛,已知在一个学期10次考试中,甲、乙两人的成绩(单位:分)的茎叶图如图所示.你认为选派谁参赛更合适?并说明理由.解:根据茎叶图可知,甲的平均成绩x-甲=79+84+85+87+87+88+93+94+96+9710=89,乙的平均成绩x-乙=75+77+85+88+89+89+95+96+97+9910=89,甲、乙的平均成绩相等.又甲成绩的方差s2甲=110[(79-89)2+(84-89)2+(85-89)2+(87-89)2+(87-89)2+(88-89)2+(93-89)2+(94-89)2+(96-89)2+(97-89)2]=30.4,乙成绩的方差s2乙=110[(75-89)2+(77-89)2+(85-89)2+(88-89)2+(89-89)2+(89-89)2+(95-89)2+(96-89)2+(97-89)2+(99-89)2]=60.6,故甲成绩的方差小于乙成绩的方差,因此选派甲参赛更合适.2.随着移动互联网的发展,与餐饮美食相关的手机应用软件层出不穷.现从使用A和B两款订餐软件的商家中分别随机抽取50个商家,对它们的“平均送达时间”进行统计,得到频率分布直方图如下:(1)试估计使用A款订餐软件的50个商家的“平均送达时间”的众数及平均数;(2)根据以上抽样调查数据,将频率视为概率,回答下列问题:①能否认为使用B款订餐软件“平均送达时间”不超过40分钟的商家达到75%?②如果你要从A和B两款订餐软件中选择一款订餐,你会选择哪款?说明理由.解:(1)依题意可得,使用A款订餐软件的50个商家的“平均送达时间”的众数为55.使用A款订餐软件的50个商家的“平均送达时间”的平均数为15×0.06+25×0.34+35×0.12+45×0.04+55×0.4+65×0.04=40.(2)①使用B款订餐软件“平均送达时间”不超过40分钟的商家的比例估计值为0.04+0.20+0.56=0.80=80%>75%.故可以认为使用B款订餐软件“平均送达时间”不超过40分钟的商家达到75%.②使用B款订餐软件的50个商家的“平均送达时间”的平均数为15×0.04+25×0.2+35×0.56+45×0.14+55×0.04+65×0.02=35<40,所以选B款订餐软件.3.我国是世界上严重缺水的国家,某市政府为了鼓励居民节约用水,计划调整居民生活用水收费方案,拟确定一个合理的月用水量标准x(吨),一位居民的月用水量不超过x的部分按平价收费,超出x的部分按议价收费.为了了解居民用水情况,通过抽样,获得了某年100位居民每人的月均用水量(单位:吨),将数据按照[0,0.5),[0.5,1),…,[4,4.5]分成9组,制成了如图所示的频率分布直方图.(1)求直方图中a的值;(2)设该市有30万居民,估计全市居民中月均用水量不低于3吨的人数,并说明理由;(3)若该市政府希望使85%的居民每月的用水量不超过标准x(吨),估计x的值,并说明理由.解:(1)由频率分布直方图可知,月均用水量在[0,0.5)中的频率为0.08×0.5=0.04.同理,在[0.5,1),[1.5,2),[2,2.5),[3,3.5),[3.5,4),[4,4.5]中的频率分别为0.08,0.20,0.26,0.06,0.04,0.02.由0.04+0.08+0.5×a+0.20+0.26+0.5×a+0.06+0.04+0.02=1,解得a=0.30.(2)由(1)知100位居民每人的月均用水量不低于3吨的频率为0.06+0.04+0.02=0.12.由以上样本的频率分布,可以估计全市30万居民中月均用水量不低于3吨的人数为300 000×0.12=36 000.(3)因为前6组的频率之和为0.04+0.08+0.15+0.20+0.26+0.15=0.88>0.85,而前5组的频率之和为0.04+0.08+0.15+0.20+0.26=0.73<0.85,所以 2.5≤x<3.由0.30×(x-2.5)=0.85-0.73,解得x=2.9.所以,估计月用水量标准为2.9吨时,85%的居民每月的用水量不超过标准.。

(通用版)2019版高考数学一轮复习第十章统计与统计案例学案理

(通用版)2019版高考数学一轮复习第十章统计与统计案例学案理

第十章统计与统计案例第一节统计本节主要包括2个知识点: 1.随机抽样; 2.用样本估计总体.突破点(一) 随机抽样[基本知识]1.简单随机抽样(1)定义:设一个总体含有N个个体,从中逐个不放回地抽取n个个体作为样本(n≤N),如果每次抽取时总体内的各个个体被抽到的机会都相等,就把这种抽样方法叫做简单随机抽样.(2)最常用的简单随机抽样的方法:抽签法和随机数法.2.系统抽样在抽样时,将总体分成均衡的几个部分,然后按照事先确定的规则,从每一部分抽取一个个体,得到所需要的样本,这种抽样方法叫做系统抽样(也称为机械抽样).3.分层抽样在抽样时,将总体分成互不交叉的层,然后按照一定的比例,从各层独立地抽取一定数量的个体,将各层取出的个体合在一起作为样本,这种抽样方法是一种分层抽样.4.三种抽样方法的比较[基本能力]1.判断题(1)简单随机抽样是一种不放回抽样.( )(2)简单随机抽样每个个体被抽到的机会不一样,与先后有关.( )(3)系统抽样在起始部分抽样时采用简单随机抽样.( )(4)要从1 002个学生中用系统抽样的方法选取一个容量为20的样本,需要剔除2个学生,这样对被剔除者不公平.( )(5)分层抽样中,每个个体被抽到的可能性与层数及分层有关.( ) 答案:(1)√ (2)× (3)√ (4)× (5)× 2.填空题(1)利用简单随机抽样从含有8个个体的总体中抽取一个容量为4的样本,则总体中每个个体被抽到的概率是________.解析:总体个数为N =8,样本容量为M =4,则每一个个体被抽到的概率为P =M N =48=12.答案:12(2)老师在班级50名学生中,依次抽取学号为5,10,15,20,25,30,35,40,45,50的学生进行作业检查,这种抽样方法是________.解析:因为抽取学号是以5为公差的等差数列,故采用的抽样方法应是系统抽样. 答案:系统抽样(3)某公司共有1 000名员工,下设若干部门,现采用分层抽样方法,从全体员工中抽取一个样本容量为80的样本,已告知广告部门被抽取了4个员工,则广告部门的员工人数为________.解析:1 00080=x 4,x =50.答案:50(4)某学校高一、高二、高三年级的学生人数之比为3∶3∶4,现用分层抽样的方法从该校高中三个年级的学生中抽取容量为50的样本,则应从高二年级抽取________名学生.解析:设应从高二年级抽取x 名学生,则x 50=310.解得x =15. 答案:15[全析考法]1.抽签法的步骤第一步,将总体中的N个个体编号;第二步,将这N个号码写在形状、大小相同的号签上;第三步,将号签放在同一不透明的箱中,并搅拌均匀;第四步,从箱中每次抽取1个号签,连续抽取k次;第五步,将总体中与抽取的号签的编号一致的k个个体取出.2.随机数法的步骤第一步,将个体编号;第二步,在随机数表中任选一个数开始;第三步,从选定的数开始,按照一定抽样规则在随机数表中选取数字,取足满足要求的数字就得到样本的号码.[例1] (1)总体由编号为01,02,…,19,20的20个个体组成.利用下面的随机数表选取5个个体,选取方法是从随机数表第1行的第5列和第6列数字开始由左到右依次选取两个数字,则选出来的第5个个体的编号为( )C.02 D.01(2)下列抽取样本的方式不属于简单随机抽样的有________.①从无限多个个体中抽取100个个体作为样本.②盒子里共有80个零件,从中选出5个零件进行质量检验.在抽样操作时,从中任意拿出一个零件进行质量检验后再把它放回盒子里.③从20件玩具中一次性抽取3件进行质量检验.④某班有56名同学,指定个子最高的5名同学参加学校组织的篮球赛.[解析] (1)由题意知前5个个体的编号为08,02,14,07,01.(2)①不是简单随机抽样.因为不满足总体的有限性.②不是简单随机抽样.因为它是放回抽样.③不是简单随机抽样.因为这是“一次性”抽取,而不是“逐个”抽取.④不是简单随机抽样.因为指定个子最高的5名同学是56名中特指的,不存在随机性,不是等可能抽样.[答案] (1)D (2)①②③④系统抽样的步骤[例2] (1)为了解1 000名学生的学习情况,采用系统抽样的方法,从中抽取容量为40的样本,则分段的间隔为( )A .50B .40C .25D .20(2)将高一(九)班参加社会实践编号为1,2,3,…,48的48名学生,采用系统抽样的方法抽取一个容量为4的样本,已知5号,29号,41号学生在样本中,则样本中还有一名学生的编号是________.[解析] (1)由系统抽样的定义知,分段间隔为1 00040=25.故选C.(2)根据系统抽样的概念,所抽取的4个样本的编号应成等差数列,因为在这组数中的间距为41-29=12,所以所求的编号为5+12=17.[答案] (1)C (2)17 [易错提醒]用系统抽样法抽取样本,当Nn不为整数时,取k =⎣⎢⎡⎦⎥⎤N n ,即先从总体中用简单随机抽样的方法剔除(N -nk )个个体,且剔除多余的个体不影响抽样的公平性.分层抽样进行分层抽样的相关计算时,常利用以下关系式巧解:(1)样本容量n 总体的个数N =该层抽取的个体数该层的个体数; (2)总体中某两层的个体数之比=样本中这两层抽取的个体数之比.[例3] (1)(2018·南昌模拟)某校为了解学生学习的情况,采用分层抽样的方法从高一1 000人、高二1 200 人、高三n 人中,抽取81人进行问卷调查.已知高二被抽取的人数为30,那么n =( )A .860B .720C .1 020D .1 040(2)(2017·江苏高考)某工厂生产甲、乙、丙、丁四种不同型号的产品,产量分别为200,400,300,100件.为检验产品的质量,现用分层抽样的方法从以上所有的产品中抽取60件进行检验,则应从丙种型号的产品中抽取________件.(3)某学校三个兴趣小组的学生人数分布如下表(每名同学只参加一个小组)(单位:人).篮球组 书画组 乐器组高一 45 30 a高二151020学校要对这三个小组的活动效果进行抽样调查,按小组分层抽样的方法,从参加这三个兴趣小组的学生中抽取30人,结果篮球组被抽出12人,则a 的值为________.[解析] (1)根据分层抽样方法,得 1 2001 000+1 200+n ×81=30,解得n =1 040.故选D.(2)本题考查分层抽样方法及用样本估计总体.从丙种型号的产品中抽取的件数为60×300200+400+300+100=18.(3)由题意知1245+15=3045+15+30+10+a +20,解得a =30.[答案] (1)D (2)18 (3)30 [方法技巧]分层抽样的解题策略(1)分层抽样中分多少层,如何分层要视具体情况而定,总的原则是:层内样本的差异要小,两层之间的样本差异要大,且互不重叠.(2)为了保证每个个体等可能入样,所有层中每个个体被抽到的可能性相同. (3)在每层抽样时,应采用简单随机抽样或系统抽样的方法进行抽样. (4)抽样比=样本容量总体容量=各层样本数量各层个体数量.[全练题点]1.[考点一]某工厂的质检人员对生产的100件产品,采用随机数法抽取10件检查,对100件产品采用下面的编号方法:①1,2,3,...,100; ②001,002,...,100; ③00,01,02,...,99; ④01,02,03, (100)其中正确的序号是( )A.②③④B.③④C.②③D.①②解析:选C 根据随机数法编号可知,①④编号位数不统一.2.[考点一、二、三]对一个容量为N的总体抽取容量为n的样本,当选取简单随机抽样、系统抽样和分层抽样三种不同方法抽取样本时,总体中每个个体被抽中的概率分别为p1,p2,p3,则( )A.p1=p2<p3B.p2=p3<p1C.p1=p3<p2D.p1=p2=p3解析:选D 由于三种抽样过程中,每个个体被抽到的概率都是相等的,因此p1=p2=p3.3.[考点二]某班共有52人,现根据学生的学号,用系统抽样的方法,抽取一个容量为4的样本,已知3号、29号、42号学生在样本中,那么样本中还有一个学生的学号是( ) A.10 B.11C.12 D.16解析:选D 从被抽中的3名学生的学号中可以看出学号间距为13,所以样本中还有一个学生的学号是16,故选D.4.[考点三]某校高一年级有学生400人,高二年级有学生360人,现采用分层抽样的方法从全校学生中抽取55人,其中从高一年级学生中抽取20人,则从高三年级学生中抽取的人数为________.解析:设从高二年级学生中抽取x人,由题意得x360=20400,解得x=18,则从高三年级学生中抽取的人数为55-20-18=17人.答案:175.[考点二]为了了解本班学生对网络游戏的态度,高三(6)班计划在全班60人中展开调查,根据调查结果,班主任计划采用系统抽样的方法抽取若干名学生进行座谈,为此先对60名学生进行编号为:01,02,03,…,60,已知抽取的学生中最小的两个编号为03,09,则抽取的学生中最大的编号为________.解析:由最小的两个编号为03,09可知,抽取时的分段间隔是6.即抽取10名同学,其编号构成首项为3,公差为6的等差数列,故最大编号为3+9×6=57.答案:57突破点(二) 用样本估计总体[基本知识]1.频率分布直方图和茎叶图(1)作频率分布直方图的步骤①求极差(即一组数据中最大值与最小值的差);②决定组距与组数;③将数据分组;④列频率分布表;⑤画频率分布直方图.(2)频率分布折线图和总体密度曲线茎叶图的优点是可以保留原始数据,而且可以随时记录,这对数据的记录和表示都能带来方便.2.样本的数字特征(1)众数、中位数、平均数①标准差:样本数据到平均数的一种平均距离,一般用s表示,s=②方差:标准差的平方s 2=1n[(x 1-x -)2+(x 2-x -)2+…+(x n -x -)2],其中x i (i =1,2,3,…,n )是样本数据,n 是样本容量,x -是样本平均数.③方差与标准差相比,都是衡量样本数据离散程度的统计量,但方差因为对标准差进行了平方运算,夸大了样本的偏差程度.(3)平均数、方差公式的推广若数据x 1,x 2,…,x n 的平均数为x -,方差为s 2,则数据mx 1+a ,mx 2+a ,…,mx n +a 的平均数为m x -+a ,方差为m 2s 2.[基本能力]1.判断题(1)在频率分布直方图中,最高的小长方形底边中点的横坐标是众数.( ) (2)在频率分布直方图中,众数左边和右边的小长方形的面积和是相等的.( ) (3)从频率分布直方图得不出原始的数据内容,把数据表示成直方图后,原有的具体数据信息就被抹掉了.( )(4)茎叶图一般左侧的叶按从大到小的顺序写,右侧的叶按从小到大的顺序写,相同的数据可以只记一次.( )(5)平均数、众数与中位数从不同的角度描述了一组数据的集中趋势.( ) (6)一组数据的众数可以是一个或几个,中位数也具有相同的结论.( ) 答案:(1)√ (2)× (3)√ (4)× (5)√ (6)× 2.填空题(1)某校为了了解教科研工作开展状况与教师年龄之间的关系,将该校不小于35岁的80名教师按年龄分组,分组区间为[35,40),[40,45),[45,50),[50,55),[55,60],由此得到频率分布直方图如图,则这80名教师中年龄小于45岁的有________人.解析:由频率分布直方图可知45岁以下的教师的频率为5×(0.040+0.080)=0.6,所以共有80×0.6=48(人).答案:48(2)对某市“四城同创”活动中800名志愿者的年龄抽样调查统计后得到频率分布直方图(如图),但是年龄组为[25,30)的数据不慎丢失,则依据此图可得:①[25,30)年龄组对应小矩形的高度为________;②据此估计该市“四城同创”活动中志愿者年龄在[25,35)的人数为________.解析:设[25,30)年龄组对应小矩形的高度为h,则5×(0.01+h+0.07+0.06+0.02)=1,解得h=0.04.则志愿者年龄在[25,35)年龄组的频率为5(0.04+0.07)=0.55,故志愿者年龄在[25,35)年龄组的人数约为0.55×800=440.答案:①0.04 ②440(3)对某商店一个月内每天的顾客人数进行了统计,得到样本的茎叶图(如图所示),则该样本的中位数、众数、极差分别是____________.解析:由题意知各数为12,15,20,22,23,23,31,32,34,34,38,39,45,45,45,47,47,48,48,49,50,50,51,51,54,57,59 ,61,67,68,中位数是46,众数是45,最大数为68,最小数为12,极差为68-12=56.答案:46,45,56(4)一组数据分别为:12,16,20,23,20,15,28,23,则这组数据的中位数是________.解析:这组数据从小到大排列为:12,15,16,20,20,23,23,28,∴这组数据的中位数是20+202=20.答案:20(5)已知一组数据4.7,4.8,5.1,5.4,5.5,则该组数据的方差是________.解析:5个数的平均数x=4.7+4.8+5.1+5.4+5.55=5.1,所以它们的方差s2=15[(4.7-5.1)2+(4.8-5.1)2+(5.1-5.1)2+(5.4-5.1)2+(5.5-5.1)2]=0.1.答案:0.1[全析考法]频率分布直方图[例1] (2017·北京高考)某大学艺术专业400名学生参加某次测评,根据男女学生人数比例,使用分层抽样的方法从中随机抽取了100名学生,记录他们的分数,将数据分成7组:[20,30),[30,40),…,[80,90],并整理得到如下频率分布直方图:(1)从总体的400名学生中随机抽取一人,估计其分数小于70的概率;(2)已知样本中分数小于40的学生有5人,试估计总体中分数在区间[40,50)内的人数; (3)已知样本中有一半男生的分数不小于70,且样本中分数不小于70的男女生人数相等.试估计总体中男生和女生人数的比例.[解] (1)根据频率分布直方图可知,样本中分数不小于70的频率为(0.02+0.04)×10=0.6,所以样本中分数小于70的频率为1-0.6=0.4.所以从总体的400名学生中随机抽取一人,其分数小于70的概率估计值为0.4. (2)根据题意,样本中分数不小于50的频率为 (0.01+0.02+0.04+0.02)×10=0.9, 故样本中分数小于50的频率为0.1,故分数在区间[40,50)内的人数为100×0.1-5=5.所以总体中分数在区间[40,50)内的人数估计为400×5100=20.(3)由题意可知,样本中分数不小于70的学生人数为 (0.02+0.04)×10×100=60,所以样本中分数不小于70的男生人数为60×12=30.所以样本中的男生人数为30×2=60, 女生人数为100-60=40,男生和女生人数的比例为60∶40=3∶2.所以根据分层抽样原理,总体中男生和女生人数的比例估计为3∶2.[方法技巧]1.绘制频率分布直方图时需注意的两点(1)制作好频率分布表后,可以利用各组的频率之和是否为1来检验该表是否正确; (2)频率分布直方图的纵坐标是频率组距,而不是频率.2.与频率分布直方图计算有关的两个关系式 (1)频率组距×组距=频率; (2)频数样本容量=频率,此关系式的变形为频数频率=样本容量,样本容量×频率=频数. 茎叶图1.(1)“叶”的位置只有一个数字,而“茎”的位置的数字位数一般不需要统一; (2)重复出现的数据要重复记录,不能遗漏,特别是“叶”的位置上的数据. 2.茎叶图通常用来记录两位数的数据,可以用来分析单组数据,也可以用来比较两组数据.通过茎叶图可以确定数据的中位数,数据大致集中在哪个茎,数据是否关于该茎对称,数据分布是否均匀等.[例2] 为了比较两种治疗失眠症的药(分别称为A 药,B 药)的疗效,随机地选取20位患者服用A 药,20位患者服用B 药,这40位患者在服用一段时间后,记录他们日平均增加的睡眠时间(单位:h).试验的观测结果如下:服用A 药的20位患者日平均增加的睡眠时间: 0.6 1.2 2.7 1.5 2.8 1.8 2.2 2.3 3.2 3.5 2.5 2.6 1.2 2.7 1.5 2.9 3.0 3.1 2.3 2.4 服用B 药的20位患者日平均增加的睡眠时间: 3.2 1.7 1.9 0.8 0.9 2.4 1.2 2.6 1.3 1.4 1.6 0.5 1.8 0.6 2.1 1.1 2.5 1.2 2.7 0.5(1)分别计算两组数据的平均数,从计算结果看,哪种药的疗效更好? (2)根据两组数据完成下面茎叶图,从茎叶图看,哪种药的疗效更好?[解] (1)设A 药观测数据的平均数为x -,B 药观测数据的平均数为y -.由观测结果可得x -=120×(0.6+1.2+1.2+1.5+1.5+1.8+2.2+2.3+2.3+2.4+2.5+2.6+2.7+2.7+2.8+2.9+3.0+3.1+3.2+3.5)=2.3,y -=120×(0.5+0.5+0.6+0.8+0.9+1.1+1.2+1.2+1.3+1.4+1.6+1.7+1.8+1.9+2.1+2.4+2.5+2.6+2.7+3.2)=1.6.由以上计算结果可得x ->y -,因此可看出A 药的疗效更好. (2)由观测结果可绘制如下茎叶图:从以上茎叶图可以看出,A 药疗效的试验结果有710的叶集中在茎2,3上,而B 药疗效的试验结果有710的叶集中在茎0,1上,由此可看出A 药的疗效更好.[方法技巧]茎叶图问题的求解策略(1)由于茎叶图完全反映了所有的原始数据,解决由茎叶图给出的统计图表问题时,要充分对这个图表提供的样本数据进行相关的计算或者是对某些问题作出判断.(2)茎叶图不能直接反映总体的分布情况,这就需要通过茎叶图数据求出样本数据的数字特征,进一步估计总体情况.样本的数字特征(1)用样本估计总体时,样本的平均数、标准差只是总体的平均数、标准差的近似.实际应用中,需先计算数据的平均数,分析平均水平,再计算方差(标准差),分析稳定情况.(2)若给出图形,一方面可以由图形得到相应的样本数据,计算平均数、方差(标准差);另一方面,可以从图形直观分析样本数据的分布情况,大致判断平均数的范围,并利用数据的波动性比较方差(标准差)的大小.考法(一) 与频率分布直方图交汇命题[例3] 某城市100户居民的月平均用电量(单位:度),以[160,180),[180,200),[200,220),[220,240),[240,260),[260,280),[280,300]分组的频率分布直方图如图.(1)求直方图中x 的值;(2)求月平均用电量的众数和中位数.[解] (1)由(0.002+0.009 5+0.011+0.012 5+x +0.005+0.002 5)×20=1,得x =0.007 5,∴直方图中x 的值为0.007 5.(2)月平均用电量的众数是220+2402=230.∵(0.002+0.009 5+0.011)×20=0.45<0.5,∴月平均用电量的中位数在[220,240)内,设中位数为a ,则(0.002+0.009 5+0.011)×20+0.012 5×(a -220)=0.5,解得a =224,即中位数为224.[方法技巧]频率分布直方图与众数、中位数、平均数的关系(1)最高的小长方形底边中点的横坐标为众数; (2)中位数左边和右边的小长方形的面积和是相等的;(3)平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小长方形的面积乘以小长方形底边中点的横坐标之和.考法(二) 与茎叶图交汇命题[例4] (1)如图所示的茎叶图记录了甲、乙两组各五名学生在一次英语听力测试中的成绩(单位:分),已知甲组数据的中位数为17,乙组数据的平均数为17.4,则x ,y 的值分别为( )A.7,8B .5,7C .8,5D .7,7(2)将某选手的9个得分去掉1个最高分,去掉1个最低分,7个剩余分数的平均分为91.现场作的9个分数的茎叶图后来有1个数据模糊,无法辨认,在图中以x 表示:则7个剩余分数的方差为________.[解析] (1)甲组数据的中位数为17, 故y =7,乙组数据的平均数为 3×10+20+ 9+6+6+x +95=17.4,解得x =7.(2)由图可知去掉的两个数是87,99,所以87+90×2+91×2+94+90+x =91×7,解得x =4.s 2=17[(87-91)2+(90-91)2×2+(91-91)2×2+(94-91)2×2]=367.[答案] (1)D (2)367[易错提醒]在使用茎叶图时,一定要观察所有的样本数据,弄清楚这个图中数字的特点,不要漏掉了数据,也不要混淆茎叶图中茎与叶的含义.考法(三) 与优化决策问题交汇命题[例5] 甲、乙、丙、丁四人参加某运动会射击项目选拔赛,四人的平均成绩和方差如下表所示:甲 乙 丙 丁 平均环数x 8.3 8.8 8.8 8.7 方差s 23.53.62.25.4) A .甲 B .乙 C .丙D .丁[解析] 由题目表格中数据可知,丙平均环数最高,且方差最小,说明成绩好,且技术稳定,选C.[答案] C [方法技巧]利用样本的数字特征解决优化决策问题的依据(1)平均数反映了数据取值的平均水平;标准差、方差描述了一组数据围绕平均数波动的大小.标准差、方差越大,数据的离散程度越大,越不稳定;标准差、方差越小,数据的离散程度越小,越稳定.(2)用样本估计总体就是利用样本的数字特征来描述总体的数字特征.[全练题点]1.[考点二]在样本的频率分布直方图中,共有7个小长方形,若中间一个小长方形的面积等于其他6个小长方形的面积的和的14,且样本容量为80,则中间一组的频数为( )A .0.25B .0.5C .20D .16解析:选D 设中间一组的频数为x ,依题意有x 80=14⎝ ⎛⎭⎪⎫1-x 80,解得x =16.2.[考点二](2017·山东高考)如图所示的茎叶图记录了甲、乙两组各5名工人某日的产量数据(单位:件).若这两组数据的中位数相等,且平均值也相等,则x 和y 的值分别为( )A.3,5 B .5,5 C .3,7D .5,7解析:选A 由两组数据的中位数相等可得65=60+y ,解得y =5,又它们的平均值相等,所以15×[56+62+65+74+(70+x )]=15×(59+61+67+65+78),解得x =3.3.[考点一]为了了解某校今年准备报考飞行员的学生的体重情况,将所得的数据整理后,画出了频率分布直方图(如图),已知图中从左到右的前3个小组的频率之比为1∶2∶3,第1小组的频数为6,则报考飞行员的学生人数是( )A .36B .40C .48D .50解析:选C 由题知,题图中从左到右的前3个小组的频率之和为1-(0.037+0.013)×5=0.75.又图中从左到右的前3个小组的频率之比为1∶2∶3,所以第1小组的频率为0.75×11+2+3=0.125,所以报考飞行员的学生人数是60.125=48.4.[考点三·考法(二)]如图是某学校举行的运动会上七位评委为某体操项目打出的分数的茎叶统计图,去掉一个最高分和一个最低分后,所剩数据的平均数和方差分别为( )A .84,4.84B .84,1.6C .85,1.6D .85,4解析:选C 依题意,所剩数据的平均数是80+15×(4×3+6+7)=85,所剩数据的方差是15×[3×(84-85)2+(86-85)2+(87-85)2]=1.6. 5.[考点三·考法(三)]甲、乙两名射击运动员参加某大型运动会的预选赛,他们分别射击了5次,成绩如下表(单位:环):.解析:x -甲=x -乙=9,s 2甲=15×[(9-10)2+(9-8)2+(9-9)2+(9-9)2+(9-9)2]=25,s 2乙=15×[(9-10)2+(9-10)2+(9-7)2+(9-9)2+(9-9)2]=65>s 2甲,故甲更稳定. 答案:甲6.[考点三·考法(一)](2017·安徽黄山二模)全世界越来越关注环境保护问题,某监测站点于2017年1月某日起连续n 天监测空气质量指数(AQI),数据统计如下表:(1)根据所给统计表和频率分布直方图中的信息求出n ,m 的值,并完成频率分布直方图;(2)由频率分布直方图,求该组数据的平均数与中位数.解:(1)∵0.004×50=20n ,∴n =100,∵20+40+m +10+5=100,∴m =25.40100×50=0.008;25100×50=0.005;10100×50=0.002;5100×50=0.001.由此完成频率分布直方图,如图:(2)由频率分布直方图得该组数据的平均数为25×0.004×50+75×0.008×50+125×0.005×50+175×0.002×50+225×0.001×50=95,∵[0,50)的频率为0.004×50=0.2,[50,100)的频率为0.008×50=0.4,∴中位数为50+0.5-0.20.4×50=87.5.[全国卷5年真题集中演练——明规律]1.(2017·全国卷Ⅰ)为评估一种农作物的种植效果,选了n 块地作试验田.这n 块地的亩产量(单位:kg)分别为x 1,x 2,…,x n ,下面给出的指标中可以用来评估这种农作物亩产量稳定程度的是( )A .x 1,x 2,…,x n 的平均数B .x 1,x 2,…,x n 的标准差C .x 1,x 2,…,x n 的最大值D .x 1,x 2,…,x n 的中位数解析:选B 标准差能反映一组数据的稳定程度.故选B.2.(2017·全国卷Ⅲ)某城市为了解游客人数的变化规律,提高旅游服务质量,收集并整理了2014年1月至2016年12月期间月接待游客量(单位:万人)的数据,绘制了下面的折线图.根据该折线图,下列结论错误的是( )A.月接待游客量逐月增加B.年接待游客量逐年增加C.各年的月接待游客量高峰期大致在7,8月D.各年1月至6月的月接待游客量相对于7月至12月,波动性更小,变化比较平稳解析:选A 根据折线图可知,2014年8月到9月、2014年10月到11月等月接待游客量都在减少,所以A错误.由图可知,B、C、D正确.3.(2016·全国卷Ⅲ)某旅游城市为向游客介绍本地的气温情况,绘制了一年中各月平均最高气温和平均最低气温的雷达图.图中A点表示十月的平均最高气温约为15 ℃,B点表示四月的平均最低气温约为5 ℃.下面叙述不正确的是( )A.各月的平均最低气温都在0 ℃以上B.七月的平均温差比一月的平均温差大C.三月和十一月的平均最高气温基本相同D.平均最高气温高于20 ℃的月份有5个解析:选D 由图形可得各月的平均最低气温都在0 ℃以上,A正确;七月的平均温差约为10 ℃,而一月的平均温差约为5 ℃,故B正确;三月和十一月的平均最高气温都在10 ℃左右,基本相同,C正确;故D错误.4.(2013·全国卷Ⅰ)为了解某地区的中小学生的视力情况,拟从该地区的中小学生中抽取部分学生进行调查,事先已了解到该地区小学、初中、高中三个学段学生的视力情况有较大差异,而男女生视力情况差异不大,在下面的抽样方法中,最合理的抽样方法是( ) A.简单随机抽样B.按性别分层抽样C.按学段分层抽样D.系统抽样解析:选C 由于该地区的中小学生人数比较多,不能采用简单随机抽样,排除选项A;由于小学、初中、高中三个学段的学生视力差异性比较大,可采取按照学段进行分层抽样,而男女生视力情况差异性不大,不能按照性别进行分层抽样,排除B和D.故选C.5.(2014·全国卷Ⅰ)从某企业生产的某种产品中抽取100件,测量这些产品的一项质量指标值,由测量结果得如下频数分布表:(2)估计这种产品质量指标值的平均数及方差(同一组中的数据用该组区间的中点值作代表);(3)根据以上抽样调查数据,能否认为该企业生产的这种产品符合“质量指标值不低于95的产品至少要占全部产品的80%”的规定?解:(1)如图所示:(2)质量指标值的样本平均数为x=80×0.06+90×0.26+100×0.38+110×0.22+120×0.08=100.质量指标值的样本方差为s2=(-20)2×0.06+(-10)2×0.26+0×0.38+102×0.22+202×0.08=104.所以这种产品质量指标值的平均数的估计值为100,方差的估计值为104. (3)质量指标值不低于95的产品所占比例的估计值为 0.38+0.22+0.08=0.68.由于该估计值小于0.8,故不能认为该企业生产的这种产品符合“质量指标值不低于95的产品至少要占全部产品的80%”的规定.[课时达标检测][小题对点练——点点落实]对点练(一) 随机抽样1.某学校为了了解某年高考数学的考试成绩,在高考后对该校1 200名考生进行抽样调查,其中有400名文科考生,600名理科考生,200名艺术和体育类考生,从中抽取120名考生作为样本,记这项调查为①;从10名家长中随机抽取3名参加座谈会,记这项调查为②,则完成①,②这两项调查宜采用的抽样方法依次是( )A .分层抽样法,系统抽样法B .分层抽样法,简单随机抽样法C .系统抽样法,分层抽样法D .简单随机抽样法,分层抽样法解析:选B 在①中,文科考生、理科考生、艺术和体育类考生会存在差异,采用分层抽样法较好;在②中,抽取的样本个数较少,宜采用简单随机抽样法.2.某校高三年级共有学生900人,编号为1,2,3,…,900,现用系统抽样的方法抽取一个容量为45的样本,则抽取的45人中,编号落在[481,720]的人数为( )A .10B .11C .12D .13解析:选C 系统抽样,是抽多少人就把总体分成多少组,于是抽样间隔就是用总体数量除以样本容量:90045=20.于是落在[481,720]内的人数为720-48020=12,故选C.3.某中学初中部共有110名教师,高中部共有150名教师,其性别比例如图所示,则该校女教师的人数为( )A .93B .123C .137D .167解析:选C 初中部的女教师人数为110×70%=77,高中部的女教师人数为150×(1-60%)=60,该校女教师的人数为77+60=137,故选C.4.高三(3)班共有学生56人,座号分别为1,2,3,…,56,现根据座号,用系统抽样的。

通用版2019版高考数学一轮复习第十章统计与统计案例课时达标检测五十统计理

通用版2019版高考数学一轮复习第十章统计与统计案例课时达标检测五十统计理

课时达标检测(五十)统计[小题对点练——点点落实]对点练(一) 随机抽样A.分层抽样法,系统抽样法B.分层抽样法,简单随机抽样法C.系统抽样法,分层抽样法D.简单随机抽样法,分层抽样法解析:选B 在①中,文科考生、理科考生、艺术和体育类考生会存在差异,采用分层抽样法较好;在②中,抽取的样本个数较少,宜采用简单随机抽样法.2.某校高三年级共有学生900人,编号为1,2,3,…,900,现用系统抽样的方法抽取A.10 B.11C.12 D.13解析:选C 系统抽样,是抽多少人就把总体分成多少组,于是抽样间隔就是用总体数A.93 B.123C.137 D.1674.高三(3)班共有学生56人,座号分别为1,2,3,…,56,现根据座号,用系统抽样的方法,抽取一个容量为4的样本.已知3号、17号、45号同学在样本中,那么样本中还有一个同学的座号是( )A.30 B.31C.32 D.33解析:选B 由系统抽样的特点,得到样本中的座号形成一个以3为首项,公差为17-3=14的等差数列,则第三个座号是17+14=31.故选B.5.假设要考察某公司生产的500克袋装牛奶的质量是否达标,现从800袋牛奶中抽取如果从随机数表第8行第7列的数开始向右读,请你依次写出最先检测的5袋牛奶的编号________________________________________________________________________ (下面摘取了随机数表第7行至第9行).84 42 17 53 31 57 24 55 06 88 77 04 7447 67 21 76 33 50 25 83 92 12 06 7663 01 63 78 59 16 95 56 67 19 98 10 5071 75 12 86 73 58 07 44 39 52 38 7933 21 12 34 29 78 64 56 07 82 52 42 0744 38 15 51 00 13 42 99 66 02 79 54A 类轿车10辆,则z 的值为________.解析:由题意可得50100+300+150+450+z +600=10100+300, 解得z =400.答案:400解析:系统抽样的抽取间隔为305=6,设抽到的最小编号为x ,则x +(6+x )+(12+x )+(18+x )+(24+x )=75,所以x =3.答案:3对点练(二) 用样本估计总体1.为了普及环保知识,增强环保意识,某大学随机抽取30名学生参加环保知识测试,得分(十分制)如图所示,假设所得分数的中位数为m e ,众数为m 0,平均值为x -,则( )A .m e =m 0=x -B .m e =m 0<x -C .m e <m 0<x -D .m 0<m e <x -解析:选D 由图可知,30名学生的得分情况依次为2个人得3分,3个人得4分,10个人得5分,6个人得6分,3个人得7分,2个人得8分,2个人得9分,2个人得10分.中位数为第15,16个数(分别为5,6)的平均数,即m e =5.5;5出现的次数最多,故m 0=5;x -=(3×2+4×3+5×10+6×6+7×3+8×2+9×2+10×2)÷30≈5.97.于是得m 0<m e <x -.2.如图是某样本数据的茎叶图,则该样本的中位数、众数、极差分别是( )A.32 34 32B .33 45 35C .34 45 32D .33 36 35解析:选B 观察茎叶图,16个数已经按大小顺序列出,从上往下数第8个数和第9个数是最中间两个数,它们是32和34,中位数是它们的平均数:33.再读茎叶图,45出现次数最多,共3次,故为众数.极差等于最大值减最小值:47-12=35.故选B.3.(2017·九江二模)已知一组数据x 1,x 2,…,x n 的方差为2,若数据ax 1+b ,ax 2+b ,…,ax n +b (a >0)的方差为8,则a 的值为( )A .1 B. 2 C .2D .4 解析:选C 根据方差的性质可知,a 2×2=8,故a =2.4.(2018·湖北黄冈质检)已知数据x 1,x 2,x 3,…,x n 是某市n (n ≥3,n ∈N *)个普通职工的年收入,设这n 个数据的中位数为x ,平均数为y ,方差为z ,如果再加上世界首富的年收入x n +1,则这(n +1)个数据中,下列说法正确的是( )A .年收入平均数可能不变,中位数可能不变,方差可能不变B .年收入平均数大大增大,中位数可能不变,方差变大C .年收入平均数大大增大,中位数可能不变,方差也不变D .年收入平均数大大增大,中位数一定变大,方差可能不变解析:选B ∵数据x 1,x 2,x 3,…,x n 是某市n (n ≥3,n ∈N *)个普通职工的年收入,x n +1为世界首富的年收入,则x n +1远大于x 1,x 2,x 3,…,x n ,故这(n +1)个数据中,年收入平均数大大增大;中位数可能不变,也可能稍微变大;由于数据的集中程度受到x n +1的影响比较大,更加离散,则方差变大.①甲地该月14时的平均气温低于乙地该月14时的平均气温;②甲地该月14时的平均气温高于乙地该月14时的平均气温;③甲地该月14时的气温的标准差小于乙地该月14时的气温的标准差;④甲地该月14时的气温的标准差大于乙地该月14时的气温的标准差.其中根据茎叶图能得到的统计结论的编号为( )A .①③B .①④C .②③D .②④解析:选B ∵x 甲=26+28+29+31+315=29, x 乙=28+29+30+31+325=30, ∴x 甲<x 乙,又s 2甲=9+1+0+4+45=185,s 2乙=4+1+0+1+45=2, ∴s 甲>s 乙.故可判断结论①④正确.6.五一期间,某淘宝店趁势推出了“抢红包”的促销活动.已知每人有5次抢红包的机会,每次可得到1元至30元不等的红包.甲、乙二人在这5次抢红包活动中获得的红包金额的茎叶图如图所示.若甲5次获得的红包金额的均值为x 1,乙5次获得的红包金额的均值为x 2,则x 1-x 2=________.的红包金额的均值x 2=1+2+5+10+305=9.6,所以x 1-x 2=13-9.6=3.4. 答案:3.47.从某小区抽取100户居民进行月用电量调查,发现其用电量都在50至350度之间,频率分布直方图如图所示.(1)直方图中x 的值为________;解析:(1)由频率分布直方图总面积为1,得(0.001 2+0.002 4×2+0.003 6+x +0.006 0)×50=1,解得x =0.004 4.数为100×0.7=70.答案:(1)0.004 4 (2)708.已知x 是1,2,3,x,5,6,7这七个数据的中位数且1,2,x 2,-y 这四个数据的平均数为1,则y -1x的最小值为________. 解析:由题意1+2+x 2-y =4,所以y =x 2-1.由中位数定义知,3≤x ≤5,所以y -1x=x 2-1-1x .当x ∈[3,5]时,函数y =x 2-1与y =-1x 均为增函数,所以y =x 2-1-1x在[3,5]上为增函数,所以⎝ ⎛⎭⎪⎫y -1x min =8-13=233. 答案:233[大题综合练——迁移贯通]你认为选派谁参赛更合适?并说明理由.解:根据茎叶图可知,甲的平均成绩x -甲=79+84+85+87+87+88+93+94+96+9710=89,乙的平均成绩x -乙=75+77+85+88+89+89+95+96+97+9910=89,甲、乙的平均成绩相等. 又甲成绩的方差s 2甲=110[(79-89)2+(84-89)2+(85-89)2+(87-89)2+(87-89)2+(88-89)2+(93-89)2+(94-89)2+(96-89)2+(97-89)2]=30.4,乙成绩的方差s 2乙=110[(75-89)2+(77-89)2+(85-89)2+(88-89)2+(89-89)2+(89-89)2+(95-89)2+(96-89)2+(97-89)2+(99-89)2]=60.6,故甲成绩的方差小于乙成绩的方差,因此选派甲参赛更合适.2.随着移动互联网的发展,与餐饮美食相关的手机应用软件层出不穷.现从使用A和B两款订餐软件的商家中分别随机抽取50个商家,对它们的“平均送达时间”进行统计,得到频率分布直方图如下:(1)试估计使用A款订餐软件的50个商家的“平均送达时间”的众数及平均数;(2)根据以上抽样调查数据,将频率视为概率,回答下列问题:①能否认为使用B款订餐软件“平均送达时间”不超过40分钟的商家达到75%?②如果你要从A和B两款订餐软件中选择一款订餐,你会选择哪款?说明理由.解:(1)依题意可得,使用A款订餐软件的50个商家的“平均送达时间”的众数为55.使用A款订餐软件的50个商家的“平均送达时间”的平均数为15×0.06+25×0.34+35×0.12+45×0.04+55×0.4+65×0.04=40.(2)①使用B款订餐软件“平均送达时间”不超过40分钟的商家的比例估计值为0.04+0.20+0.56=0.80=80%>75%.故可以认为使用B款订餐软件“平均送达时间”不超过40分钟的商家达到75%.②使用B款订餐软件的50个商家的“平均送达时间”的平均数为15×0.04+25×0.2+35×0.56+45×0.14+55×0.04+65×0.02=35<40,所以选B款订餐软件.(1)求直方图中a的值;(2)设该市有30万居民,估计全市居民中月均用水量不低于3吨的人数,并说明理由;(3)若该市政府希望使85%的居民每月的用水量不超过标准x(吨),估计x的值,并说明理由.解:(1)由频率分布直方图可知,月均用水量在[0,0.5)中的频率为0.08×0.5=0.04.同理,在[0.5,1),[1.5,2),[2,2.5),[3,3.5),[3.5,4),[4,4.5]中的频率分别为0.08,0.20,0.26,0.06,0.04,0.02.由0.04+0.08+0.5×a+0.20+0.26+0.5×a+0.06+0.04+0.02=1,解得a=0.30.(2)由(1)知100位居民每人的月均用水量不低于3吨的频率为0.06+0.04+0.02=0.12.由以上样本的频率分布,可以估计全市30万居民中月均用水量不低于3吨的人数为300 000×0.12=36 000.(3)因为前6组的频率之和为0.04+0.08+0.15+0.20+0.26+0.15=0.88>0.85,而前5组的频率之和为0.04+0.08+0.15+0.20+0.26=0.73<0.85,所以 2.5≤x<3.由0.30×(x-2.5)=0.85-0.73,解得x=2.9.所以,估计月用水量标准为2.9吨时,85%的居民每月的用水量不超过标准.。

2019届一轮复习北师大版 统计与统计案例 课件( 51张)

2019届一轮复习北师大版    统计与统计案例    课件(  51张)

(2)独立性检验 对于取值分别是{x1,x2}和{y1,y2}的分类变量X和Y,其样本频数列联表 是:
y1 x1 x2 a c
y2 b d
总计 a+b c+d
总计
2
a+c
b+d
n
n(ad-bc)2 则K= (其中 n=a+b+c+d (a+b)(c+d)(a+c)(b+d) 为样本容量).
热点一 抽样方法
∴有 99%的把握认为箱产量与养殖方法有关.
(3) 由箱产量的频率分布直方图可知,旧养殖法的箱产量平均值 (或中位
数)约在45~50 kg之间,新养殖法的箱产量平均值(或中位数)约在50~ 55 kg之间,且新养殖法的箱产量分布集中程度较旧养殖法分布集中程
度高,可知新养殖法的箱产量高且稳定,从而新养殖法优于旧养殖法.
i 1 i =1 10 10
生的脚长为 24,据此估计其身高为( C ) A.160 C.166 B.163 D.170
解析
由已知得 x =22.5, y =160,


- - ^=4, ∵回归直线方程过样本点中心( x , y ),且b
^,解得a ^=70. ∴160=4×22.5+a ∴回归直线方程为^ y=4x+70,当 x=24 时,^ y=166.
- 1 (3)平均数:样本数据的算术平均数,即 x =n(x1+x2+„+xn).
(4)方差与标准差. 1 - - - s2=n[(x1- x )2+(x2- x )2+„+(xn- x )2], s= 1 - 2 - 2 - 2 [ ( x 1- x ) +(x2- x ) +„+(xn- x ) ]. n
D.平均最高气温高于20 ℃的月份有5个
解析
根据雷达图可知全年最低气温都在 0 ℃ 以上,故A正确;一月平

高三数学一轮精品复习学案:第十章 统计、统计案例

高三数学一轮精品复习学案:第十章  统计、统计案例

高三数学一轮精品复习学案:第十章统计、统计案例【知识特点】1.统计中所学的内容是数理统计中最基本的问题,通过这些内容主要来介绍相关的统计思想和方法,了解一些有关统计学的基本知识,并能够应用几个基本概念、基本公式来处理实际生活中的一些基本问题。

2.统计案例为新课标中新增内容,主要是通过案例体会运用统计方法解决实际问题的思想和方法。

增加了统计和统计案例后,使得高中数学的整个体系更加完善了,有利于开阔数学视野,丰富数学思想和方法。

【重点关注】1.从对新课标高考试题的分析可以发现,主要考查抽样方法、各种统计图表、样本数字特征等。

对这部分的考查主要以选择题和填空题的形式出现。

2.统计案例中的独立性检验和回归分析也会逐步在高考题中出现,难度不会太大,多数情况下是考查两种统计分析方法的简单知识,以选择题和填空题为主。

【地位与作用】《全国新课程标准高考数学考试大纲》中对考生能力要求明确界定为空间想象能力、抽象概括能力、推理论证能力、运算求解能力、数据处理能力以及应用意识和创新意识等六个方面,其中数据处理能力是首次提出的一个能力要求,这定义为:会收集数据、整理数据、分析数据,能从大量数据中抽取对研究问题有用的信息,并作出判断。

数据处理能力主要依据统计(高考考试大纲对知识点要求如下表所示)或统计案例中的方法对数据进行整理、分析,并解决给定的实际问题,对统计的要求已提升到能力的高度。

统计的思想方法广泛应用于自然科学和社会科学的研究中,统计的语言不仅是数学的语言,也是各学科经常引用的大众语言,统计知识是作为一个新时期公民所比备的知识。

统计学就是应用科学的方法收集、整理、分析、描述所要研究的数据资料,然后根据所得到的结果,进行推断或决策的一门实用性很强的科学。

统计这部分内容,在高中数学新课程中,主要分布在必修3第二章(约16课时)与选修2—3第三章(约9课时)。

相对于高中学生的认知水平和生活经历还相对不是很高,所以它只能属于非重点内容,所出的相关题目一般来说都相对比较简单。

2019版高考文科数学大一轮复习人教A版文档:第十章 统计与统计案例10-2 含答案 精品

2019版高考文科数学大一轮复习人教A版文档:第十章 统计与统计案例10-2 含答案 精品

§10.2用样本估计总体1.作频率分布直方图的步骤(1)求极差(即一组数据中最大值与最小值的差).(2)决定组距与组数.(3)将数据分组.(4)列频率分布表.(5)画频率分布直方图.2.频率分布折线图和总体密度曲线(1)频率分布折线图:连接频率分布直方图中各小长方形上端的中点,就得到频率分布折线图.(2)总体密度曲线:随着样本容量的增加,作图时所分的组数增加,组距减小,相应的频率折线图会越来越接近于一条光滑曲线,统计中称这条光滑曲线为总体密度曲线.3.茎叶图统计中还有一种被用来表示数据的图叫做茎叶图,茎是指中间的一列数,叶就是从茎的旁边生长出来的数.4.标准差和方差(1)标准差是样本数据到平均数的一种平均距离.(2)标准差: s =1n[(x 1-x )2+(x 2-x )2+…+(x n -x )2]. (3)方差:s 2=1n [(x 1-x )2+(x 2-x )2+…+(x n -x )2](x n 是样本数据,n 是样本容量,x 是样本平均数).知识拓展1.频率分布直方图的特点(1)频率分布直方图中相邻两横坐标之差表示组距,纵坐标表示频率组距,频率=组距×频率组距.(2)在频率分布直方图中,各小长方形的面积总和等于1,因为在频率分布直方图中组距是一个固定值,所以各小长方形高的比也就是频率比.(3)频率分布表和频率分布直方图是一组数据频率分布的两种形式,前者准确,后者直观. 2.平均数、方差的公式推广(1)若数据x 1,x 2,…,x n 的平均数为x ,那么mx 1+a ,mx 2+a ,mx 3+a ,…,mx n +a 的平均数是m x +a .(2)数据x 1,x 2,…,x n 的方差为s 2.①数据x 1+a ,x 2+a ,…,x n +a 的方差也为s 2; ②数据ax 1,ax 2,…,ax n 的方差为a 2s 2.题组一 思考辨析1.判断下列结论是否正确(请在括号中打“√”或“×”)(1)平均数、众数与中位数从不同的角度描述了一组数据的集中趋势.( √ ) (2)一组数据的众数可以是一个或几个,那么中位数也具有相同的结论.( × )(3)从频率分布直方图得不出原始的数据内容,把数据表示成直方图后,原有的具体数据信息就被抹掉了.( √ )(4)茎叶图一般左侧的叶按从大到小的顺序写,右侧的叶按从小到大的顺序写,相同的数据可以只记一次.( × )(5)在频率分布直方图中,最高的小长方形底边中点的横坐标是众数.( √ ) (6)在频率分布直方图中,众数左边和右边的小长方形的面积和是相等的.( × )题组二 教材改编2.[P100A 组T2(1)]一个容量为32的样本,已知某组样本的频率为0.25,则该组样本的频数为( )A .4B .8C .12D .16 答案 B解析 设频数为n ,则n 32=0.25,∴n =32×14=8.3.[P81A 组T1]若某校高一年级8个班参加合唱比赛的得分如茎叶图所示,则这组数据的中位数和平均数分别是( )A .91.5和91.5B .91.5和92C .91和91.5D .92和92答案 A解析 ∵这组数据由小到大排列为87,89,90,91,92,93,94,96,∴中位数是91+922=91.5,平均数x =87+89+90+91+92+93+94+968=91.5.4.[P71T1]如图是100位居民月均用水量的频率分布直方图,则月均用水量为[2,2.5)范围内的居民有______人.答案 25解析 0.5×0.5×100=25.题组三 易错自纠5.若数据x 1,x 2,x 3,…,x n 的平均数x =5,方差s 2=2,则数据3x 1+1,3x 2+1,3x 3+1,…,3x n +1的平均数和方差分别为( ) A .5,2 B .16,2 C .16,18 D .16,9答案 C解析 ∵x 1,x 2,x 3,…,x n 的平均数为5,∴x 1+x 2+x 3+…+x nn=5,∴3x 1+3x 2+3x 3+…+3x nn+1=3×5+1=16,∵x 1,x 2,x 3,…,x n 的方差为2,∴3x 1+1,3x 2+1,3x 3+1,…,3x n +1的方差是32×2=18.6.为了普及环保知识,增强环保意识,某大学随机抽取30名学生参加环保知识测试,得分(十分制)如图所示,假设得分的中位数为m ,众数为n ,平均数为x ,则m ,n ,x 的大小关系为________.(用“<”连接)答案 n <m <x解析 由图可知,30名学生得分的中位数为第15个数和第16个数(分别为5,6)的平均数,即m =5.5;又5出现次数最多,故n =5; x =2×3+3×4+10×5+6×6+3×7+2×8+2×9+2×1030≈5.97.故n <m <x .题型一 茎叶图的应用1.(2017·山东)如图所示的茎叶图记录了甲,乙两组各5名工人某日的产量数据(单位:件).若这两组数据的中位数相等,且平均值也相等,则x 和y 的值分别为( )A .3,5B .5,5C .3,7D .5,7 答案 A解析 甲组数据的中位数为65,由甲,乙两组数据的中位数相等,得y =5.又甲、乙两组数据的平均值相等,∴15×(56+65+62+74+70+x)=15×(59+61+67+65+78),∴x=3.故选A.2.为了解某校教师使用多媒体进行教学的情况,采用简单随机抽样的方法,从该校400名授课教师中抽取20名,调查了他们上学期使用多媒体进行教学的次数,结果用茎叶图表示如图所示.据此可估计该校上学期400名教师中,使用多媒体进行教学次数在[16,30)内的人数为()A.100 B.160C.200 D.280答案 B解析观察茎叶图,抽取的20名教师中使用多媒体教学次数在[16,30)内的有8人,所以该区间段的频率为820=0.4,因此全校400名教师使用多媒体教学次数在[16,30)内的有400×0.4=160(人).思维升华茎叶图的优缺点由茎叶图可以清晰地看到数据的分布情况,这一点同频率分布直方图类似.它优于频率分布直方图的第一点是从茎叶图中能看到原始数据,没有任何信息损失,第二点是茎叶图便于记录和表示.其缺点是当样本容量较大时,作图较烦琐.题型二频率分布直方图的绘制与应用命题点1用频率分布直方图求频率、频数典例(2016·山东)某高校调查了200名学生每周的自习时间(单位:小时),制成了如图所示的频率分布直方图,其中自习时间的范围是[17.5,30],样本数据分组为[17.5,20),[20,22.5),[22.5,25),[25,27.5),[27.5,30].根据直方图,这200名学生中每周的自习时间不少于22.5小时的人数是()A.56 B.60 C.120 D.140答案 D解析设所求人数为N,则N=2.5×(0.16+0.08+0.04)×200=140,故选D.命题点2用频率分布直方图估计总体典例(2016·四川)我国是世界上严重缺水的国家,某市为了制定合理的节水方案,对居民用水情况进行了调查,通过抽样,获得了某年100位居民每人的月均用水量(单位:吨),将数据按照[0,0.5),[0.5,1),…,[4,4.5]分成9组,制成了如图所示的频率分布直方图.(1)求直方图中a的值;(2)设该市有30万居民,估计全市居民中月均用水量不低于3吨的人数,说明理由;(3)估计居民月均用水量的中位数.解(1)由频率分布直方图可知,月均用水量在[0,0.5)的频率为0.08×0.5=0.04.同理,在[0.5,1),[1.5,2),[2,2.5),[3,3.5),[3.5,4),[4,4.5]等组的频率分别为0.08,0.21,0.25,0.06,0.04,0.02.由1-(0.04+0.08+0.21+0.25+0.06+0.04+0.02)=0.5×a+0.5×a,解得a=0.30.(2)估计全市居民中月均用水量不低于3吨的人数为3.6万.理由如下:由(1)知,100位居民中月均用水量不低于3吨的频率为0.06+0.04+0.02=0.12.由以上样本的频率分布,可以估计30万居民中月均用水量不低于3吨的人数为300 000×0.12=36 000. (3)设中位数为x吨.因为前5组的频率之和为0.04+0.08+0.15+0.21+0.25=0.73>0.5.而前4组的频率之和为0.04+0.08+0.15+0.21=0.48<0.5.所以2≤x<2.5.由0.50×(x-2)=0.5-0.48,解得x=2.04.故可估计居民月均用水量的中位数为2.04吨.思维升华(1)准确理解频率分布直方图的数据特点,频率分布直方图中纵轴上的数据是各组的频率除以组距的结果,不要误以为纵轴上的数据是各组的频率,不要和条形图混淆.(2)在很多题目中,频率分布直方图中各小长方形的面积之和为1,是解题的关键,常利用频率分布直方图估计总体分布.跟踪训练(2017·北京)某大学艺术专业400名学生参加某次测评,根据男女学生人数比例,使用分层抽样的方法从中随机抽取了100名学生,记录他们的分数,将数据分成7组:[20,30),[30,40),…,[80,90],并整理得到如下频率分布直方图:(1)从总体的400名学生中随机抽取一人,估计其分数小于70的概率;(2)已知样本中分数小于40的学生有5人,试估计总体中分数在区间[40,50)内的人数; (3)已知样本中有一半男生的分数不小于70,且样本中分数不小于70的男女生人数相等.试估计总体中男生和女生人数的比例.解 (1)根据频率分布直方图可知,样本中分数不小于70的频率为(0.02+0.04)×10=0.6, 所以样本中分数小于70的频率为1-0.6=0.4,所以从总体的400名学生中随机抽取一人,其分数小于70的概率估计为0.4. (2)根据题意,样本中分数不小于50的频率为(0.01+0.02+0.04+0.02)×10=0.9, 分数在区间[40,50)内的人数为100-100×0.9-5=5, 所以总体中分数在区间[40,50)内的人数估计为400×5100=20.(3)由题意可知,样本中分数不小于70的学生人数为 (0.02+0.04)×10×100=60,所以样本中分数不小于70的男生人数为60×12=30,所以样本中的男生人数为30×2=60, 女生人数为100-60=40,所以样本中男生和女生人数的比例为60∶40=3∶2,所以根据分层抽样原理,估计总体中男生和女生人数的比例为3∶2.题型三 用样本的数字特征估计总体的数字特征典例 (1)某市有210名初中生参加数学竞赛预赛,随机调阅了60名学生的答卷,成绩如表:①求样本的平均成绩和标准差(精确到0.01分);②若规定预赛成绩在7分或7分以上的学生参加复赛,试估计有多少名学生可以进入复赛.解 ①x =160×(4×6+5×15+6×21+7×12+8×3+9×3)=6,s 2=160×[6×(4-6)2+15×(5-6)2+21×(6-6)2+12×(7-6)2+3×(8-6)2+3×(9-6)2]=1.5.∴s ≈1.22,故样本的平均成绩为6分,标准差约为1.22分.②在60名选手中,有12+3+3=18(名)学生预赛成绩在7分或7分以上,∴210人中有1860×210=63(名)学生的预赛成绩在7分或7分以上,故大约有63名学生可以参加复赛. (2)甲、乙二人参加某体育项目训练,近期的五次测试成绩得分情况如图:①分别求出两人得分的平均数与方差;②根据图和上面算得的结果,对两人的训练成绩作出评价. 解 ①由图象可得甲、乙两人五次测试的成绩分别为 甲:10分,13分,12分,14分,16分; 乙:13分,14分,12分,12分,14分. x 甲=10+13+12+14+165=13;x 乙=13+14+12+12+145=13,s 2甲=15[(10-13)2+(13-13)2+(12-13)2+(14-13)2+(16-13)2]=4; s 2乙=15[(13-13)2+(14-13)2+(12-13)2+(12-13)2+(14-13)2]=0.8. ②由s 2甲>s 2乙,可知乙的成绩较稳定.从折线图看,甲的成绩基本呈上升状态,而乙的成绩上下波动,可知甲的成绩在不断提高,而乙的成绩则无明显提高.思维升华 平均数与方差都是重要的数字特征,是对总体的一种简明的描述,它们所反映的情况有着重要的实际意义,平均数、中位数、众数描述其集中趋势,方差和标准差描述其波动大小.跟踪训练 某企业有甲、乙两个研发小组,为了比较他们的研发水平,现随机抽取这两个小组往年研发新产品的结果如下:(a ,b ),(a ,b ),(a ,b ),(a ,b ),(a ,b ),(a ,b ),(a ,b ),(a ,b ),(a ,b ),(a ,b ),(a ,b ),(a ,b ),(a ,b ),(a ,b ),(a ,b ),其中a ,a 分别表示甲组研发成功和失败;b ,b 分别表示乙组研发成功和失败.(1)若某组成功研发一种新产品,则给该组记1分,否则记0分.试计算甲、乙两组研发新产品的成绩的平均数和方差,并比较甲、乙两组的研发水平;(2)若该企业安排甲、乙两组各自研发一种新产品,试估计恰有一组研发成功的概率. 解 (1)甲组研发新产品的成绩为1,1,1,0,0,1,1,1,0,1,0,1,1,0,1,其平均数x 甲=1015=23;方差为s 2甲=115⎣⎡⎦⎤⎝⎛⎫1-232×10+⎝⎛⎫0-232×5=29. 乙组研发新产品的成绩为1,0,1,1,0,1,1,0,1,0,0,1,0,1,1,其平均数x 乙=915=35;方差为s 2乙=115⎣⎡⎦⎤⎝⎛⎭⎫1-352×9+⎝⎛⎭⎫0-352×6=625. 因为x 甲>x 乙,s 2甲<s 2乙,所以甲组的研发水平优于乙组.(2)记恰有一组研发成功为事件E ,在所抽得的15个结果中,恰有一组研发成功的结果是(a ,b ),(a ,b ),(a ,b ),(a ,b ),(a ,b ),(a ,b ),(a ,b ),共7个.因此事件E 发生的频率为715.用频率估计概率,即得所求概率为P (E )=715.高考中频率分布直方图的应用考点分析 频率分布直方图是高考考查的热点,考查频率很高,题型有选择题,填空题,也有解答题,难度为中低档.用样本频率分布来估计总体分布的重点是频率分布表和频率分布直方图的绘制及用样本频率分布估计总体分布;难点是频率分布表和频率分布直方图的理解及应用.在计数和计算时一定要准确,在绘制小矩形时,宽窄要一致.通过频率分布表和频率分布直方图可以对总体作出估计.频率分布直方图的纵坐标为频率/组距,每一个小长方形的面积表示样本个体落在该区间内的频率;条形图的纵坐标为频数或频率,把直方图视为条形图是常见的错误.典例 (12分)某城市100户居民的月平均用电量(单位:度),以[160,180),[180,200),[200,220),[220,240),[240,260),[260,280),[280,300]分组的频率分布直方图如图.(1)求直方图中x 的值;(2)求月平均用电量的众数和中位数;(3)在月平均用电量为[220,240),[240,260),[260,280),[280,300]的四组用户中,用分层抽样的方法抽取11户居民,则月平均用电量在[220,240)的用户中应抽取多少户? 规范解答解 (1)由(0.002+0.009 5+0.011+0.012 5+x +0.005+0.002 5)×20=1,得x =0.007 5, 所以直方图中x 的值是0.007 5.[2分](2)月平均用电量的众数是220+2402=230.[4分]因为(0.002+0.009 5+0.011)×20=0.45<0.5,所以月平均用电量的中位数在[220,240)内,设中位数为a ,由(0.002+0.009 5+0.011)×20+0.012 5×(a -220)=0.5,得a =224,所以月平均用电量的中位数是224.[8分](3)月平均用电量为[220,240)的用户有0.012 5×20×100=25(户),月平均用电量为[240,260)的用户有0.007 5×20×100=15(户),月平均用电量为[260,280)的用户有0.005×20×100=10(户),月平均用电量为[280,300]的用户有0.002 5×20×100=5(户), 抽取比例为1125+15+10+5=15,所以月平均用电量在[220,240)的用户中应抽取25×15=5(户).[12分]1.(2017·全国Ⅲ)某城市为了解游客人数的变化规律,提高旅游服务质量,收集并整理了2014年1月至2016年12月期间月接待游客量(单位:万人)的数据,绘制了下面的折线图.根据该折线图,下列结论错误的是()A.月接待游客量逐月增加B.年接待游客量逐年增加C.各年的月接待游客量高峰期大致在7,8月D.各年1月至6月的月接待游客量相对于7月至12月,波动性更小,变化比较平稳答案 A解析对于选项A,由图易知,月接待游客量每年7,8月份明显高于12月份,故A错;对于选项B,观察折线图的变化趋势可知,年接待游客量逐年增加,故B正确;对于选项C,D,由图可知显然正确.故选A.2.某市2017年各月的平均气温(°C)数据的茎叶图如下:则这组数据的中位数是()A.19 B.20 C.21.5 D.23答案 B解析从茎叶图知所有数据为8,9,12,15,18,20,20,23,23,28,31,32,中间两个数为20,20,故中位数为20,故选B.3.(2016·全国Ⅲ)某旅游城市为向游客介绍本地的气温情况,绘制了一年中各月平均最高气温和平均最低气温的雷达图.图中A点表示十月的平均最高气温约为15℃,B点表示四月的平均最低气温约为5℃.下面叙述不正确的是()A.各月的平均最低气温都在0℃以上B.七月的平均温差比一月的平均温差大C.三月和十一月的平均最高气温基本相同D.平均最高气温高于20℃的月份有5个答案 D解析 由题意知,平均最高气温高于20℃的有七月,八月,故选D.4.(2018·青岛即墨模拟)为了研究某药品的疗效,选取若干名志愿者进行临床试验,所有志愿者的舒张压数据(单位:kPa)的分组区间为[12,13),[13,14),[14,15),[15,16),[16,17],将其按从左到右的顺序分别编号为第一组,第二组,…,第五组,如图是根据试验数据制成的频率分布直方图.已知第一组与第二组共有20人,第三组中没有疗效的有6人,则第三组中有疗效的人数为( )A .6B .8C .12D .18 答案 C解析 志愿者的总人数为20(0.16+0.24)×1=50,所以第三组人数为50×0.36=18,有疗效的人数为18-6=12.5.(2017·长沙适应性考试)某校开展“爱我母校,爱我家乡”摄影比赛,七位评委为甲,乙两名选手的作品打出的分数的茎叶图如图所示(其中m 为数字0~9中的一个),去掉一个最高分和一个最低分后,甲,乙两名选手得分的平均数分别为a 1,a 2,则一定有( )A .a 1>a 2B .a 2>a 1C .a 1=a 2D .a 1,a 2的大小与m 的值有关 答案 B解析 由茎叶图知,a 1=80+1+5+5+4+55=84,a 2=80+4+4+6+4+75=85,故选B.6.在“南安一中校园歌手大赛”比赛现场上,七位评委为某选手打出的分数的茎叶图如图,则去掉一个最高分和一个最低分后,所剩数据的平均数和方差分别为( )A .85和6.8B .85和1.6C .86和6.8D .86和1.6答案 A解析 剩余的数据为83,83,84,85,90, 平均分x =83+83+84+85+905=85,所以方差为s 2=15[(83-85)2+(83-85)2+(84-85)2+(85-85)2+(90-85)2]=6.8.7.已知样本数据x 1,x 2,…,x n 的平均数x =5,则样本数据2x 1+1,2x 2+1,…,2x n +1的平均数为________. 答案 11解析 由x 1,x 2,…,x n 的平均数x =5,得2x 1+1,2x 2+1,…,2x n +1的平均数为2x +1=2×5+1=11.8.从甲、乙、丙三个厂家生产的同一种产品中抽取8件产品,对其使用寿命(单位:年)进行追踪调查的结果如下: 甲:3,4,5,6,8,8,8,10; 乙:4,6,6,6,8,9,12,13; 丙:3,3,4,7,9,10,11,12.三个厂家广告中都称该产品的使用寿命是8年,请根据结果判断厂家在广告中分别运用了平均数、众数、中位数中的哪一种集中趋势的特征数. 甲:________;乙:________;丙:________. 答案 众数 平均数 中位数解析 甲的众数为8,乙的平均数为8,丙的中位数为8.9.(2018·郑州模拟)某电子商务公司对10 000名网络购物者2016年度的消费情况进行统计,发现消费金额(单位:万元)都在区间[0.3,0.9]内,其频率分布直方图如图所示:(1)直方图中的a =________;(2)在这些购物者中,消费金额在区间[0.5,0.9]内的购物者的人数为________.答案 (1)3 (2)6 000解析 由频率分布直方图及频率和等于1,可得0.2×0.1+0.8×0.1+1.5×0.1+2×0.1+2.5×0.1+a ×0.1=1,解得a =3. 于是消费金额在区间[0.5,0.9]内的频率为0.2×0.1+0.8×0.1+2×0.1+3×0.1=0.6, 所以消费金额在区间[0.5,0.9]内的购物者的人数为0.6×10 000=6 000.10.某校女子篮球队7名运动员身高(单位:cm)分布的茎叶图如图,已知记录的平均身高为175 cm ,但记录中有一名运动员身高的末位数字不清晰,如果把其末位数字记为x ,那么x 的值为________.答案 2解析 170+17×(1+2+x +4+5+10+11)=175,17×(33+x )=5,即33+x =35,解得x =2. 11.某学校随机抽取部分新生调查其上学所需时间(单位:分钟),并将所得数据绘制成频率分布直方图(如图),其中,上学所需时间的范围是[0,100],样本数据分组为[0,20),[20,40),[40,60),[60,80),[80,100],则(1)图中的x =________;(2)若上学所需时间不少于1小时的学生可申请在学校住宿,则该校600名新生中估计有________名学生可以申请住宿. 答案 (1)0.012 5 (2)72解析 (1)由频率分布直方图知20x =1-20×(0.025+0.006 5+0.003+0.003),解得x =0.012 5. (2)上学时间不少于1小时的学生的频率为0.12,因此估计有0.12×600=72(人)可以申请住宿. 12.(2016·北京)某市民用水拟实行阶梯水价,每人月用水量中不超过w 立方米的部分按4元/立方米收费,超出w 立方米的部分按10元/立方米收费,从该市随机调查了10 000位居民,获得了他们某月的用水量数据,整理得到如下频率分布直方图:(1)如果w为整数,那么根据此次调查,为使80%以上居民在该月的用水价格为4元/立方米,w至少定为多少?(2)假设同组中的每个数据用该组区间的右端点值代替,当w=3时,估计该市居民该月的人均水费.解(1)如题图所示,用水量在[0.5,3)的频率的和为(0.2+0.3+0.4+0.5+0.3)×0.5=0.85.∴用水量小于等于3立方米的频率为0.85,又w为整数,∴为使80%以上的居民在该月的用水价格为4元/立方米,w至少定为3.(2)当w=3时,该市居民该月的人均水费估计为(0.1×1+0.15×1.5+0.2×2+0.25×2.5+0.15×3)×4+0.15×3×4+[0.05×(3.5-3)+0.05×(4-3)+0.05×(4.5-3)]×10=7.2+1.8+1.5=10.5(元).即当w=3时该市居民该月的人均水费估计为10.5元.13.(2017·全国Ⅰ)为评估一种农作物的种植效果,选了n块地作试验田.这n块地的亩产量(单位:kg)分别为x1,x2,…,x n,下面给出的指标中可以用来评估这种农作物亩产量稳定程度的是()A.x1,x2,…,x n的平均数B.x1,x2,…,x n的标准差C.x1,x2,…,x n的最大值D.x1,x2,…,x n的中位数答案 B解析因为可以用极差、方差或标准差来描述数据的离散程度,所以要评估亩产量稳定程度,应该用样本数据的极差、方差或标准差.故选B.14.某公司为了解用户对其产品的满意度,从A,B两地区分别随机调查了40个用户,根据用户对产品的满意度评分,得到A地区用户满意度评分的频率分布直方图和B地区用户满意度评分的频数分布表.A地区用户满意度评分的频率分布直方图图①B地区用户满意度评分的频数分布表(1)在图②中作出B地区用户满意度评分的频率分布直方图,并通过直方图比较两地区满意度评分的平均值及分散程度(不要求计算出具体值,给出结论即可);B地区用户满意度评分的频率分布直方图图②(2)根据用户满意度评分,将用户的满意度分为三个等级:估计哪个地区用户的满意度等级为不满意的概率大?说明理由.解(1)作出频率分布直方图如图:通过两地区用户满意度评分的频率分布直方图可以看出,B地区用户满意度评分的平均值高于A地区用户满意度评分的平均值;B地区用户满意度评分比较集中,而A地区用户满意度评分比较分散.(2)A地区用户的满意度等级为不满意的概率大.记C A表示事件:“A地区用户的满意度等级为不满意”;C B表示事件:“B地区用户的满意度等级为不满意”.由直方图得P (C A )的估计值为(0.01+0.02+0.03)×10=0.6, P (C B )的估计值为(0.005+0.02)×10=0.25.所以A 地区用户的满意度等级为不满意的概率大.15.为了普及环保知识,增强环保意识,某大学有300名员工参加环保知识测试,按年龄分组:第1组[25,30),第2组[30,35),第3组[35,40),第4组[40,45),第5组[45,50],得到的频率分布直方图如图所示.现在要从第1,3,4组中用分层抽样的方法抽取16人,则在第4组中抽取的人数为________.答案 6解析 根据频率分布直方图得,第1,3,4组的频率之比为1∶4∶3,所以用分层抽样的方法抽取16人时,在第4组中应抽取的人数为16×31+4+3=6.16.(2018·洛阳质检)从某企业生产的某种产品中抽取100件,测量这些产品的一项质量指标值,由测量结果得到如下频数分布表:(1)作出这些数据的频率分布直方图;(2)估计这种产品质量指标值的平均数及方差(同一组中的数据用该组区间的中点值作代表);(3)根据以上抽样调查数据,能否认为该企业生产的这种产品符合“质量指标值不低于95的产品至少要占全部产品的80%”的规定?解(1)样本数据的分布直方图如图所示:(2)质量指标值的样本平均数为x=80×0.06+90×0.26+100×0.38+110×0.22+120×0.08=100.质量指标值的样本方差为s2=(-20)2×0.06+(-10)2×0.26+0×0.38+102×0.22+202×0.08=104.所以这种产品质量指标值的平均数的估计值为100,方差的估计值为104.(3)质量指标值不低于95的产品所占比例的估计值为0.38+0.22+0.08=0.68.由于该估计值小于0.8,故不能认为该企业生产的这种产品符合“质量指标值不低于95的产品至少要占全部产品的80%”的规定.。

高考一轮复习第10章统计统计案例第2讲用样本估计总体

高考一轮复习第10章统计统计案例第2讲用样本估计总体

第二讲 用样本估计总体知识梳理·双基自测 知识梳理知识点一 用样本的频率分布估计总体分布 (1)频率分布表与频率分布直方图频率分布表和频率分布直方图,是从各个小组数据在样本容量中所占比例大小的角度,来表示数据分布规律,从中可以看到整个样本数据的频率分布情况.绘制频率分布直方图的步骤为:①_求极差__;②_决定组距与组数__;③_将数据分组__;④_列频率分布表__;⑤_画频率分布直方图__.(2)频率分布折线图顺次连接频率分布直方图中_各小长方形上端的中点__,就得到频率分布折线图. (3)总体密度曲线总体密度曲线反映了总体在各个范围内取值的百分比,它能提供更加精细的信息. 知识点二 茎叶图(1)茎叶图中茎是指_中间__的一列数,叶是从茎的_旁边__生长出来的数.(2)茎叶图的优点是可以_保留__原始数据,而且可以_随时__记录,这对数据的记录和表示都能带来方便.知识点三 样本的数字特征(1)众数:一组数据中出现次数最多的数.(2)中位数:将数据从小到大排列,若有奇数个数,则最中间的数是中位数;若有偶数个数,则中间两数的平均数是中位数.(3)平均数:x =_x 1+x 2+…+x nn__,反映了一组数据的平均水平.(4)标准差: s =_1n[x 1-x2+x 2-x2+…+x n -x2]__,反映了样本数据的离散程度.(5)方差:s 2=_1n[(x 1-x )2+(x 2-x )2+…+(x n -x )2]__,反映了样本数据的离散程度.重要结论(1)若一组数据x i (i =1,2,…,n)的平均数为x -,方差为s 2,则数据组ax i +b(i =1,2,…,n ,a ,b 为常数)的平均数为a x -+b ,方差为a 2·s 2.(2)频率分布直方图与众数、中位数与平均数的关系 ①最高的小长方形底边中点的横坐标即是众数.②中位数左边和右边的小长方形的面积和是相等的,均为12.③平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小长方形的面积乘以小长方形底边中点的横坐标之和.双基自测题组一 走出误区1.判断下列结论是否正确(请在括号中打“√”或“×”)(1)平均数、众数与中位数从不同的角度描述了一组数据的集中趋势.( √ ) (2)一组数据的众数可以是一个或几个,那么中位数也具有相同的结论.( × )(3)从频率分布直方图得不出原始的数据内容,把数据表示成直方图后,原有的具体数据信息就被抹掉了.( √ )(4)茎叶图一般左侧的叶按从大到小的顺序写,右侧的叶按从小到大的顺序写,相同的数据可以只记一次.( × )(5)在频率分布直方图中,最高的小长方形底边中点的横坐标是众数.( √ ) (6)在频率分布直方图中,众数左边和右边的小长方形的面积和是相等的.( × ) 题组二 走进教材2.(P 81A 组T1改编)已知某班级部分同学一次测验的成绩统计如图,则其中位数和众数分别为( B )A .95,94B .92,86C .99,86D .95,91[解析]由茎叶图可知,此组数据由小到大排列依次76,79,81,83,86,86,87,91,92,94,95,96,98,99,101,103,114,共17个,故92为中位数,出现次数最多的为众数,故众数为86,故选B .3.(P 7T1)如图是100位居民月均用水量的频率分布直方图,则月均用水量为[2,2.5)范围内的居民有_25__人.[解析]100×(0.5×0.5)=25(人).题组三走向高考4.(2020·新课标Ⅲ)设一组样本数据x1,x2,…,x n的方差为0.01,则数据10x1,10x2,…,10x n的方差为( C )A.0.01 B.0.1C.1 D.10[解析]∵样本数据x1,x2,…,x n的方差为0.01,∴根据任何一组数据同时扩大几倍方差将变为平方倍增长,∴数据10x1,10x2,…,10x n的方差为:100×0.01=1,故选C.5.(2020·天津)从一批零件中抽取80个,测量其直径(单位:mm),将所得数据分为9组:[5.31,5.33),[5.33,5.35),…,[5.45,5.47),[5.47,5.49],并整理得到如下频率分布直方图,则在被抽取的零件中,直径落在区间[5.43,5.47)内的个数为( B )A.10 B.18C.20 D.36[解析]直径落在区间[5.43,5.47)的频率为(6.25+5)×0.02= 0.225,则被抽取的零件中,直径落在区间[5.43,5.47)内的个数为0.225×80 =18个,故选B.考点突破·互动探究考点一频率分布直方图——自主练透例1 (1)(2021·江西赣州十四县联考)中央电视台播出《中国诗词大会》火遍全国,下面是组委会在选拔赛时随机抽取的100名选手的成绩,按成绩分组,得到的频率分布表如下所示:组号分组频数频率第1组[160,165) 0.100笫2组[165,170) ①第3组[170,175) 20 ②第4组[175,180) 20 0.200第5组[180,185) 10 0.100合计100 1.00(ⅰ)请先求出频率分布表中①、②位置的相应数据,再完成频率分布直方图(用阴影表示).(ⅱ)为了能选拔出最优秀的选手,组委会决定在笔试成绩高的第3,4,5组中用分层抽样抽取5名选手进入第二轮面试,则第3,4,5组每组各抽取多少名选手进入第二轮面试?(ⅲ)在(ⅱ)的前提下,组委会决定在5名选手中随机抽取2名选手接受考官A面试,求第4组至少有一名选手被考官A面试的概率.(2)(2021·福建漳州质检)2018年9月的台风“山竹”对我国多个省市的财产造成重大损害,据统计直接经济损失达52亿元.某青年志愿者组织调查了某地区的50个农户在该次台风中造成的直接经济损失,将收集的损失数据分成五组:[0,2 000],(2 000,4 000],(4 000,6 000],(6 000,8 000],(8 000,10 000](单位:元),得到如图所示的频率分布直方图.(ⅰ)试根据频率分布直方图估计该地区每个农户的损失(同一组中的数据用该区间的中点值代表);(ⅱ)台风后该青年志愿者与当地政府向社会发出倡议,为该地区的农户捐款帮扶,现从这50户损失超过4 000元的农户中随机抽取2户进行重点帮扶,设抽出损失超过8 000元的农户数为X,求X的分布列和数学期望.[解析](1)(ⅰ)第1组的频数为100×0.100=10,所以①处应填的数为100-(10+20+20+10)=40, 从而第2组的频率为40100=0.400.②处应填的数为1-(0.1+0.4+0.2+0.1)=0.200. 频率分布直方图如图所示.(ⅱ)因为第3,4,5组共有50名选手,所以利用分层抽样在50名选手中抽取5名选手进入第二轮面试时,每组抽取的人数分别为:第3组:2050×5=2,第4组:2050×5=2,第5组:1050×5=1,所以第3,4,5组分别抽取2人,2人,1人进入第二轮面试. (ⅲ)记“第4组至少有一名选手被考官A 面试”为事件A , 则P(A)=C 12C 13+C 22C 25=710. ⎝ ⎛⎭⎪⎫或P A =1-P A -=1-C 23C 25=710 (2)(ⅰ)记每个农户的平均损失为x -元,则x -=1 000×0.3+3 000×0.4+5 000×0.18+7 000×0.06+9 000×0.06=33 601;(ⅱ)由频率分布直方图,可得损失超过 4 000元的农户共有(0.000 09+0.000 03+0.000 03)×2 000×50=15(户),损失超过8 000元的农户共有0.000 03×2 000×50=3(户),随机抽取2户,则X 的可能取值为0,1,2; 计算P(X =0)=C 212C 215=2235,P(X =1)=C 112C 13C 215=1235,P(X =2)=C 23C 215=135.所以X 的分布列为:X0 1 2P2235 1235 135数学期望为E(X)=0×2235+1×1235+2×135=25.名师点拨应用频率分布直方图时的注意事项用频率分布直方图解决相关问题时,应正确理解图表中各个量的意义,识图掌握信息是解决该类问题的关键.频率分布直方图有以下几个要点:(1)纵轴表示频率/组距;(2)频率分布直方图中各长方形高的比也就是其频率之比;(3)频率分布直方图中每一个矩形的面积是样本数据落在这个区间上的频率,所有的小矩形的面积之和等于1,即频率之和为1.〔变式训练1〕(1)(2021·安徽“皖南八校”摸底)某校高三年级有400名学生,在一次数学测试中,成绩都在[80,130](单位:分)内,其频率分布直方图如图,则这次测试数学成绩不低于100分的人数为_220__.(2)(2021·山西适应性考试)某病毒引起的肺炎的潜伏期平均为7天左右,短的约2~3天,长的约10~14天,甚至有20余天.某医疗机构对400名确诊患者的潜伏期进行统计,整理得到以下频率分布直方图.根据该直方图估计:要使90%的患者显现出明显病状,需隔离观察的天数至少是( C )A .12B .13C .14D .15[解析] (1)根据频率分布直方图知: (2a +0.04+0.03+0.02)×10=1⇒a =0.005; 计算出数学成绩不低于100分的频率为: (0.03+0.02+0.005)×10=0.55;所以这次测试数学成绩不低于100分的人数为0.55×400=220人.(2)由题可知,第一,二,三,四,五组的频率分别为0.16,0.4,0.32,0.08,0.04. 因为前三组的频率和为0.88, 故要使90%的患者显现出明显病状,则需隔离观察的天数至少是:13+0.9-0.880.02=14,故选C .考点二 茎叶图——师生共研例2 (多选题)(2021·四川省乐山市调研改编)胡萝卜中含有大量的β-胡萝卜素,摄入人体消化器官后,可以转化为维生素A ,现从a ,b 两个品种的胡萝卜所含的β-胡萝卜素(单位mg)得到茎叶图如图所示,则下列说法正确的是( ABD )A .x a <x bB .a 的方差大于b 的方差C .b 品种的众数为3.31D .a 品种的中位数为3.27 [解析] 由茎叶图得:b 品种所含β-胡萝卜素普遍高于a 品种, ∴x a <x b ,故A 正确;a 品种的数据波动比b 品种的数据波动大, ∴a 的方差大于b 的方差,故B 正确; b 品种的众数为3.31与3.41,故C 错误; a 品种的数据的中位数为:3.23+3.312=3.27,故D 正确.名师点拨茎叶图的绘制及应用(1)茎叶图的绘制需注意:①“叶”的位置只有一个数字,而“茎”的位置的数字位数一般不需要统一;②重复出现的数据要重复记录,不能遗漏,特别是“叶”的位置上的数据.(2)茎叶图通常用来记录两位数的数据,可以用来分析单组数据,也可以用来比较两组数据.通过茎叶图可以确定数据的中位数,数据大致集中在哪个茎,数据是否关于该茎对称,数据分布是否均匀等.〔变式训练2〕(2019·山东)如图所示的茎叶图记录了甲,乙两组各5名工人某日的产量数据(单位:件).若这两组数据的中位数相等,且平均值也相等,则x 与y 的值分别为( A )A .3,5B .5,5C .3,7D .5,7[解析] 甲组数据的中位数为65,由甲、乙两组数据的中位数相等,得y =5.又甲、乙两组数据的平均值相等,∴15×(56+65+62+74+70+x)=15×(59+61+67+65+78),∴x =3.故选A . 考点三 样本数字特征——多维探究 角度1 样本数字特征与频率分布直方图例3 (1)如图所示是一样本的频率分布直方图,则由图形中的数据,可以估计众数与中位数分别是( B )A .12.5,12.5B .12.5,13C .13,12.5D .13,13[解析] 由频率分布直方图可知,众数为10+152=12.5,因为0.04×5=0.2,0.1×5=0.5,在频率分布直方图中,中位数左边和右边的面积相等,所以中位数在区间[10,15)内.设中位数为x ,则(x -10)×0.1=0.5-0.2,解得x =13.角度2 样本数字特征与茎叶图(2)将某选手的9个得分去掉1个最高分,去掉1个最低分,7个剩余分数的平均分为91,现场作的9个分数的茎叶图后来有1个数据模糊,无法辨认,在图中以x 表示:⎪⎪⎪897 74 0 1 0 x 9 1则7个剩余分数的方差为_367__.[解析] 由图可知去掉的两个数是87,99,所以87+90×2+91×2+94+90+x =91×7,解得x =4,∴s 2=17[(87-91)2+(90-91)2×2+(91-91)2×2+(94-91)2×2]=367.角度3 样本数字特征的计算(3)(2021·湖北武汉、襄阳、荆门、宜昌四地六校考试联盟联考)已知某7个数据的平均数为5,方差为4,现又加入一个新数据5,此时这8个数的方差s 2为( C )A .52B .3C .72D .4[解析] 设某7个数据分别为a 1,a 2,…,a 7, 则由题意得a 1+a 2+…+a 7=5×7=35, (a 1-5)2+(a 2-5)2+…+(a 7-5)2=4×7=28, 加入新数据5后的平均数x -=35+58=5,方差s 2=a 1-52+a 2-52+…+a 7-52+5-528=288=72.故选C .名师点拨平均数与方差都是重要的数字特征,是对总体的一种简明的描述,它们所反映的情况有着重要的实际意义,平均数,中位数,众数描述其集中趋势,方差和标准差描述其波动大小.〔变式训练3〕(1)(角度1)某小区共有1 000户居民,现对他们的用电情况进行调查,得到频率分布直方图如图所示,则该小区居民用电量的中位数为_155__,平均数为_156.8__.(2)(角度2)(2021·陕西西安八校联考)在一次技能比赛中,共有12人参加,他们的得分(百分制)茎叶图如图,则他们得分的中位数和方差分别为( B )A .89 54.5B .89 53.5C .87 53.5D .89 54(3)高铁、扫码支付、共享单车、网购并称中国“新四大发明”,近日对全国100个城市的共享单车和扫码支付的使用人数进行大数据分析,其中共享单车使用的人数分别为x 1,x 2,x 3,…,x 100,它们的平均数为x -,方差为s 2:其中扫码支付使用的人数分别为3x 1+2,3x 2+2,3x 3+2,…,3x 100+2,它们的平均数为x -′,方差为s′2,则x -′,s′2分别为( C )A .3x -+2,3s 2+2 B .3x -,3s 2C .3x -+2,9s 2D .3x -+2,9s 2+2[解析] (1)中位数为:150+(170-150)×0.10.02×20=155.该组数据的平均数为x =0.005×20×120+0.015×20×140+0.020×20×160+0.005×20×180+0.003×20×200+0.002×20×220=156.8.(2)由题可知,中位数为:87+912=89,先求平均数:x -=78+79+84+86+87+87+91+94+98+98+99+9912=90,S 2=112[(-12)2+(-11)2+(-6)2+(-4)2+(-3)2+(-3)2+12+42+82+82+92+92]=53.5,故中位数为:89,方差为53.5,故选:B .(3)显然x -′=3x -+2,而每个数据上都加上或减去相同数不影响方差,但每个数据都乘以a ,则方差变为原方差的a 2倍,故选C .考点四 折线图——师生共研例4 (多选题)(2021·河南顶级名校模拟改编)如图是某地某月1日至15日的日平均温度变化的折线图,根据该折线图,下列结论不正确的是( BCD )A .连续三天日平均温度的方差最大的是7日,8日,9日三天B .这15天日平均温度的极差为15 ℃C .由折线图能预测16日温度要低于19 ℃D .由折线图能预测本月温度小于25 ℃的天数少于温度大于25 ℃的天数[解析] A 选项,日平均温度的方差的大小取决于日平均温度的波动的大小,7,8,9三日的日平均温度的波动最大,故日平均温度的方差最大,正确;B 选项,这15天日平均温度的极差为18 ℃,B 错;C 选项,由折线图无法预测16日温度是否低于19 ℃,故C 错误;D 选项,由折线图无法预测本月温度小于25 ℃的天数是否少于温度大于25 ℃的天数,故D 错误.故选B 、C 、D .名师点拨折线图可以显示随时间(根据常用比例放置)而变化的连续数据,因此非常适用于显示在相等时间间隔下数据的趋势.〔变式训练4〕(多选题)甲乙两名同学在本学期的六次考试成绩统计如图,甲乙两组数据的平均值分别为x -甲、x -乙,则( BC )A .每次考试甲的成绩都比乙的成绩高B .甲的成绩比乙稳定C .x -甲一定大于x -乙D .甲的成绩的极差大于乙的成绩的极差[解析] 第二次考试甲的成绩比乙低,A 错;由图可知甲的成绩比乙的成绩波动小,B 正确,D 错;甲的平均成绩显然比乙的平均成绩高,C 正确;故选B 、C .名师讲坛·素养提升 高考与频率分布直方图例5 (2021·安徽省池州市期末)高三年级某班50名学生期中考试数学成绩的频率分布直方图如图所示,成绩分组区间为:[80,90),[90,100),[100,110),[110,120),[120,130),[130,140),[140,150].其中a ,b ,c 成等差数列且c =2a ,物理成绩统计如表.(说明:数学满分150分,物理满分100分)分组 [50,60) [60,70) [70,80) [80,90) [90,100]频数6920105(1)根据频率分布直方图,请估计数学成绩的平均分; (2)根据物理成绩统计表,请估计物理成绩的中位数;(3)若数学成绩不低于140分的为“优”,物理成绩不低于90分的为“优”,已知本班中至少有一个“优”同学总数为6人,从此6人中随机抽取3人.记X 为抽到两个“优”的学生人数,求X 的分布列和期望值.[解析] (1)根据频率分布直方图得, (a +b +2c +0.024+0.020+0.004)×10 =1, 又因a +c =2b ,c =2a ,解得a =0.008,b =0.012,c =0.016, 故数学成绩的平均分x -=85×0.04+95×0.12+105×0.16+115×0.2+125×0.24 +135×0.16+145×0.08=117.8(分),(2)总人数50分,由物理成绩统计表知,中位数在成绩区间[70,80), 所以物理成绩的中位数为75分.(3)数学成绩为“优”的同学有4人,物理成绩为“优”有5人,因为至少有一个“优”的同学总数为6名同学,故两科均为“优”的人数为3人,故X 的取值为0、1、2、3.P(X =0)=C 33C 36=120,P(X =1)=C 13C 23C 36=920,P(X =2)=C 23C 13C 36=920,P(X =3)=C 33C 36=120,所以分布列为:X 0 1 2 3 P120920920120∴期望值为E(X)=0×120+1×920+2×920+3×120=32.名师点拨(1)通过统计图可以很清楚地表示出各部分数量同总数之间的关系. (2)准确理解频率分布直方图的数据特点是解题关键. 〔变式训练5〕(2019·高考全国Ⅲ卷)为了解甲、乙两种离子在小鼠体内的残留程度,进行如下试验:将200只小鼠随机分成A ,B 两组,每组100只,其中A 组小鼠给服甲离子溶液,B 组小鼠给服乙离子溶液,每只小鼠给服的溶液体积相同、摩尔浓度相同.经过一段时间后用某种科学方法测算出残留在小鼠体内离子的百分比.根据试验数据分别得到如下直方图:记C为事件:“乙离子残留在体内的百分比不低于5.5”,根据直方图得到P(C)的估计值为0.70.(1)求乙离子残留百分比直方图中a,b的值;(2)分别估计甲、乙离子残留百分比的平均值(同一组中的数据用该组区间的中点值为代表).[解析](1)由已知得0.70=a+0.20+0.15,故a=0.35.b=1-0.05-0.15-0.70=0.10.(2)甲离子残留百分比的平均值的估计值为2×0.15+3×0.20+4×0.30+5×0.20+6×0.10+7×0.05=4.05,乙离子残留百分比的平均值的估计值为3×0.05+4×0.10+5×0.15+6×0.35+7×0.20+8×0.15=6.00.。

通用版2019版高考数学一轮复习第十章统计与统计案例课时达标检测五十一统计案例理

通用版2019版高考数学一轮复习第十章统计与统计案例课时达标检测五十一统计案例理

课时达标检测(五十一) 统计案例[小题对点练——点点落实]对点练(一) 回归分析A .y 与x 具有正的线性相关关系B .回归直线过样本点的中心(x -,y -)C .若该大学某女生身高增加1 cm ,则其体重约增加0.85 kgD .若该大学某女生身高为170 cm ,则可断定其体重必为58.79 kg解析:选D 由于线性回归方程中x 的系数为0.85,因此y 与x 具有正的线性相关关系,故A 正确.又线性回归方程必过样本点的中心(x -,y -),故B 正确.由线性回归方程中系数的意义知,x 每增加1 cm ,其体重约增加0.85 kg ,故C 正确.当某女生的身高为170 cm 时,其体重估计值是58.79 kg ,而不是具体值,因此D 不正确.2.为了解某商品销售量y (件)与其单价x (元)的关系,统计了(x ,y )的10组值,并画成散点图如图,则其回归方程可能是( )A.y ^=-10x -198 B.y ^=-10x +198 C.y ^=10x +198D.y ^=10x -198解析:选B 由图象可知回归直线方程的斜率小于零,截距大于零,故选B.3.若一函数模型为y =ax 2+bx +c (a ≠0),为将y 转化为t 的回归直线方程,需作变换t =( )A .x 2B .(x +a )2C.⎝ ⎛⎭⎪⎫x +b 2a 2D .以上都不对解析:选C y 关于t 的回归直线方程,实际上就是y 关于t 的一次函数.因为y =a ⎝ ⎛⎭⎪⎫x +b 2a 2+4ac -b 24a,所以可知选项C 正确.由表可得回归方程为y =10.2x +a ,据此模拟,预测广告费为10万元时的销售额约为( )A .101.2B .108.8C .111.2D .118.2解析:选C 由题意得:x -=4,y -=50,∴50=4×10.2+a ^,解得a ^=9.2,∴回归直线方程为y ^=10.2x +9.2,∴当x =10时,y ^=10.2×10+9.2=111.2,故选C.5.某考察团对10个城市的职工人均工资x (千元)与居民人均消费y (千元)进行调查统计,得出y 与x 具有线性相关关系,且回归方程为y ^=0.6x +1.2.若某城市职工人均工资为5千元,估计该城市人均消费额占人均工资收入的百分比为( )A .66%B .67%C .79%D .84%解析:选D 因为y 与x 具有线性相关关系,满足回归方程y ^=0.6x +1.2,该城市居民人均工资为x =5,所以可以估计该城市的职工人均消费水平y =0.6×5+1.2=4.2,所以可以估计该城市人均消费额占人均工资收入的百分比为4.25=84%. 6.在一组样本数据(x 1,y 1),(x 2,y 2),…,(x n ,y n )(n ≥2,x 1,x 2,…,x n 不全相等)的散点图中,若所有样本点(x i ,y i )(i =1,2,…,n )都在直线y =12x +1上,则这组样本数据的样本相关系数为( )A .-1B .0 C.12D .1解析:选D 因为所有样本点都在直线y =12x +1上,所以这组样本数据完全正相关,故其相关系数为1.7.在2018年1月15日那天,某市物价部门对本市的5家商场的某商品的一天销售量及其价格进行调查,5家商场的售价x 元和销售量y 件之间的一组数据如下表所示:由散点图可知,销售量y 与价格x 之间有较强的线性相关关系,其线性回归方程是y =-3.2x +40,且m +n =20,则其中的n =________.解析:x =9+9.5+m +10.5+115=8+m 5,y =11+n +8+6+55=6+n5,回归直线一定经过样本点中心(x ,y ),即6+n5=-3.2⎝ ⎛⎭⎪⎫8+m 5+40,即3.2m +n =42.又因为m +n =20,即⎩⎪⎨⎪⎧3.2m +n =42,m +n =20,解得⎩⎪⎨⎪⎧m =10,n =10,故n =10.答案:10对点练(二) 独立性检验1.(2017·湖南邵阳二模)假设有两个分类变量x 和y 的2×2列联表A .a =45,c =15B .a =40,c =20C .a =35,c =25D .a =30,c =30解析:选A 根据2×2列联表与独立性检验知:当a a +10与cc +30相差越大,x 与y 有关系的可能性越大,即a ,c 相差越大,a a +10与cc +30相差越大,故选A. 2.(2018·重庆适应性测试)为了判定两个分类变量X 和Y 是否有关系,应用独立性检验法算得K 2的观测值为5,又已知P (K 2≥3.841)=0.05,P (K 2≥6.635)=0.01,则下列说法正确的是( )A .有95%的把握认为“X 和Y 有关系”B .有95%的把握认为“X 和Y 没有关系”C .有99%的把握认为“X 和Y 有关系”D .有99%的把握认为“X 和Y 没有关系”解析:选A 依题意,K 2=5,且P (K 2≥3.841)=0.05,因此有95%的把握认为“X 和Y 有关系”,故选A.表1表3表4A.成绩B.视力C.智商D.阅读量解析:选D 根据K2=n ad-bc2a +b c+d a+c b+d,代入题中数据计算得D选项K2最大.附:K2=n ad-bc2a +b c+d a+c b+dB.在犯错误的概率不超过1%的前提下,认为“该市居民能否做到‘光盘’与性别无关”C.在犯错误的概率不超过1%的前提下,认为“该市居民能否做到‘光盘’与性别有关”D.有90%以上的把握认为“该市居民能否做到‘光盘’与性别无关”解析:选A 由2×2列联表得到a =45,b =10,c =30,d =15,则a +b =55,c +d =45,a +c =75,b +d =25,ad =675,bc =300,n =100,计算得K 2的观测值k =n ad -bc 2a +bc +d a +cb +d=-255×45×75×25≈3.030.因为2.706<3.030<3.841,所以有90%以上的把握认为“该市居民能否做到‘光盘’与性别有关”.5.在独立性检验时计算的K 2的观测值k =3.99,那么我们有________的把握认为这两个分类变量有关系.解析:根据题意,k =3.99>3.841,所以我们有95%的把握认为这两个分类变量有关系. 答案:95%6.(2018·安徽蚌埠段考)为了研究工人的日平均工作量是否与年龄有关,从某工厂抽取了100名工人,且规定日平均生产件数不少于80件者为“生产能手”,列出的2×2列联表如下:解析:由2×2列联表可知,K 2=-240×60×35×65≈2.93,因为2.93>2.706,所以有90%以上的把握认为“工人是否为‘生产能手’与工人的年龄有关”.答案:90%[大题综合练——迁移贯通](1)求y 关于t 的回归方程y ^=b ^t +a ^;(2)用所求回归方程预测该地区2018年(t =6)的人民币储蓄存款.附:回归方程y ^=b ^t +a ^中,b ^=∑i =1nt i y i -n t -y-∑i =1nt 2i -n t -2,a ^=y --b ^t -. 解:(1)列表计算如下:这里n =5,t -=1n ∑i =1nt i =155=3,y -=1n ∑i =1ny i =365=7.2.又∑i =1nt 2i -n t -2=55-5×32=10,∑i =1nt i y i -n t -y -=120-5×3×7.2=12,从而b ^=1210=1.2,a ^=y --b ^t -=7.2-1.2×3=3.6,故所求回归方程为y ^=1.2t +3.6.(2)将t =6代入回归方程可预测该地区2018年的人民币储蓄存款为y ^=1.2×6+3.6=10.8(千亿元).2.为了研究某种细菌在特定环境下随时间变化的繁殖情况,得如下实验数据:(1)求y 关于t 的线性回归方程;(2)利用(1)中的回归方程,预测t =8时,细菌繁殖的数量. 附:回归直线的斜率和截距的最小二乘法估计公式分别为b ^=∑i =1nt i -t -y i -y-∑i =1nt i -t-2,a ^=y --b ^t -.解:(1)由表中数据计算得,t -=5,y -=4,∑i =15(t i -t -)(y i -y -)=8.5,∑i =15(t i -t -)2=10,b ^=∑i =15t i -t -y i -y-∑i =15t i -t-2=0.85,a ^=y --b ^t -=-0.25.所以线性回归方程为y ^=0.85t -0.25.(2)将t =8代入(1)的回归方程中得y ^=0.85×8-0.25=6.55. 故预测t =8时,细菌繁殖的数量为6.55千个.3.某学生对其亲属30人的饮食习惯进行了一次调查,并用如图所示的茎叶图表示30人的饮食指数(说明:图中饮食指数低于70的人,饮食以蔬菜为主;饮食指数高于70的人,饮食以肉类为主).(2)能否有99% 解:(1)2×2列联表如下:(2)因为K 2=12×18×20×10=10>6.635,所以有99%的把握认为其亲属的饮食习惯与年龄有关.。

(通用版)2019版高考数学一轮复习 第11章 统计与统计案例 2 第2讲 用样本估计总体教案 理

(通用版)2019版高考数学一轮复习 第11章 统计与统计案例 2 第2讲 用样本估计总体教案 理

第2讲用样本估计总体1.统计图表(1)频率分布直方图的画法步骤①求极差(即一组数据中最大值与最小值的差);②决定组距与组数;③将数据分组;④列频率分布表;⑤画频率分布直方图.(2)频率分布折线图和总体密度曲线①频率分布折线图:连接频率分布直方图中各小长方形上端的中点,就得到频率分布折线图.②总体密度曲线:随着样本容量的增加,作图时所分组数增加,组距减小,相应的频率折线图会越来越接近于一条光滑曲线,统计中称这条光滑曲线为总体密度曲线.(3)茎叶图的画法步骤第一步:将每个数据分为茎(高位)和叶(低位)两部分;第二步:将最小茎与最大茎之间的数按大小次序排成一列;第三步:将各个数据的叶依次写在其茎的两侧.2.样本的数字特征(1)众数:一组数据中出现次数最多的那个数据,叫做这组数据的众数.(2)中位数:把n个数据按大小顺序排列,处于最中间位置的一个数据(或最中间两个数据的平均数)叫做这组数据的中位数.(3)平均数:把a1+a2+…+a nn称为a1,a2,…,a n这n个数的平均数.(4)标准差与方差:设一组数据x1,x2,x3,…,x n的平均数为错误!,则这组数据的标准差和方差分别是s=错误!s2=错误![(x1-错误!)2+(x2-错误!)2+…+(x n-错误!)2]3.与平均数和方差有关的结论(1)若x1,x2,…,x n的平均数为错误!,那么mx1+a,mx2+a,…,mx n+a的平均数为m错误!+a;(2)数据x1,x2,…,x n与数据x′1=x1+a,x′2=x2+a,…,x′n=x n+a的方差相等,即数据经过平移后方差不变;(3)若x1,x2,…,x n的方差为s2,那么ax1+b,ax2+b,…,ax n+b的方差为a2s2;(4)s2=错误!错误!(x i-错误!)2=错误!错误!错误!-错误!2,即各数平方的平均数减去平均数的平方.判断正误(正确的打“√”,错误的打“×")(1)一组数据的方差越大,说明这组数据的波动越大.( )(2)在频率分布直方图中,小矩形的面积越大,表示样本数据落在该区间内的频率越大.( )(3)茎叶图中的数据要按从小到大的顺序写,相同的数据可以只记一次.( )(4)频率分布表和频率分布直方图是一组数据频率分布的两种形式,前者准确,后者直观.()(5)在频率分布直方图中,最高的小长方形底边中点的横坐标是众数的估计值.( )答案:(1)√(2)√(3)×(4)√(5)√(2017·高考全国卷Ⅲ)某城市为了解游客人数的变化规律,提高旅游服务质量,收集并整理了2014年1月至2016年12月期间月接待游客量(单位:万人)的数据,绘制了下面的折线图.根据该折线图,下列结论错误的是()A.月接待游客量逐月增加B.年接待游客量逐年增加C.各年的月接待游客量高峰期大致在7,8月份D.各年1月至6月的月接待游客量相对7月至12月,波动性更小,变化比较平稳解析:选A.根据折线图可知,2014年8月到9月、2014年10月到11月等月接待游客量都是减少,所以A错误.重庆市某年各月的平均气温(℃)数据的茎叶图如图,则这组数据的中位数是()A.19 B.20C.21.5 D.23解析:选B.由茎叶图可知这组数据由小到大依次为8,9,12,15,18,20,20,23,23,28,31,32,所以中位数为错误!=20.(2018·郑州第一次质量预测)我市某校组织学生参加英语测试,成绩的频率分布直方图如图,数据的分组依次为[20,40),[40,60),[60,80),[80,100],若低于60分的人数是15,则该班的学生人数是________.解析:依题意得,成绩低于60分的相应的频率等于(0。

高考数学一轮复习第十章算法初步统计统计案例专题提能概率统计中的数学建模与数据分析课件

高考数学一轮复习第十章算法初步统计统计案例专题提能概率统计中的数学建模与数据分析课件

(1)从游客中随机抽取3人,记这3人的总得分为随机变量X,求X的分布列 与数学期望; (2)(ⅰ)若从游客中随机抽取m(m∈N+)人,记这m人的总分恰为m分的概 率为Am,求数列{Am}的前10项和; (ⅱ)在对所有游客进行随机问卷调查的过程中,记已调查过的人的累计 得分恰为n分的概率为Bn,探讨Bn与Bn-1(n≥2)之间的关系,并求数列{Bn} 的通项公式.
破解此题的关键:一是认真审题,判断随机变量的所有可能取值,并 注意相互独立事件的概率与互斥事件的概率的区别,求出随机变量取 各个值时的概率,从而列出随机变量的分布列;二是将概率的参数表 达式与数列的递推式相结合,可得数列的通项公式,此种解法新颖独 特.
(二)函数与期望相交汇应用 [例2] (2021·重庆一中模拟)某蛋糕店制作并销售一款蛋糕,制作一个蛋 糕成本3元,且以8元的价格出售,若当天卖不完,剩下的无偿捐献给饲 料加工厂.根据以往100天的资料统计,得到如下需求量表.该蛋糕店一天 制作了这款蛋糕X(X∈N)个,以x(单位:个,100≤x≤150,x∈N)表示当 天的市场需求量,T(单位:元)表示当天出售这款蛋糕获得的利润.
(一)概率与数列交汇问题 [例 1] (2021·湖北武汉质量监测)武汉又称江城,是湖北省省会,它不仅 有着深厚的历史积淀与丰富的民俗文化,更有着众多名胜古迹与旅游景 点,黄鹤楼与东湖便是其中的两个.为合理配置旅游资源,现对已参观黄 鹤楼景点的游客进行随机问卷调查,若不游玩东湖记 1 分,若继续游玩 东湖记 2 分,每位游客选择是否参观东湖的概率均为12,游客之间选择意 愿相互独立.
[解析] (1)X 的所有可能取值为 3,4,5,6.
P(X=3)=123=18,P(X=4)=C23123=38,P(X=5)=C23123=38,P(X=6)= 123=18. 所以 X 的分布列为

高三数学一轮复习:统计与统计案例

高三数学一轮复习:统计与统计案例

一、选择题1.利用系统抽样法从编号分别为1,2,3,…,80的80件不同产品中抽出一个容量为16的样本,如果抽出的产品中有一件产品的编号为13,则抽到产品的最大编号为( )A .73B .78C .77D .76解析:样本的分段间隔为8016=5,所以13号在第三组,则最大的编号为13+(16-3)×5=78.故选B.答案:B2.某课外小组的同学们在社会实践活动中调查了20户家庭某月的用电量如下表所示:则这20A .180,170 B .160,180 C .160,170D .180,160解析:用电量为180度的家庭最多,有8户,故这20户家庭该月用电量的众数是180,排除B ,C ;将用电量按从小到大的顺序排列后,处于最中间位置的两个数是160,180,故这20户家庭该月用电量的中位数是170.故选A.答案:A3.(2017·高考全国卷Ⅲ)某城市为了解游客人数的变化规律,提高旅游服务质量,收集并整理了2014年1月至2016年12月期间月接待游客量(单位:万人)的数据,绘制了如图所示的折线图,根据该折线图,下列结论错误的是()A.月接待游客量逐月增加B.年接待游客量逐年增加C.各年的月接待游客量高峰期大致在7,8月D.各年1月至6月的月接待游客量相对于7月至12月,波动性更小,变化比较平稳解析:根据折线图可知,2014年8月到9月、2014年10月到11月等月接待游客量都在减少,所以A错误.由图可知,B、C、D正确.答案:A4.(2018·宝鸡质检)对一批产品的长度(单位:毫米)进行抽样检测,样本容量为200,如图为检测结果的频率分布直方图,根据产品标准,单件产品长度在区间[25,30)的为一等品,在区间[20,25)和[30,35)的为二等品,其余均为三等品,则该样本中三等品的件数为()A.5 B.7C .10D .50解析:根据题中的频率分布直方图可知,三等品的频率为1-(0.050 0+0.062 5+0.037 5)×5=0.25,因此该样本中三等品的件数为200×0.25=50.答案:D5.(2018·兰州模拟)已知某种商品的广告费支出x (单位:万元)与销售额y (单位:万元)之间有如下对应数据:x 2 4 5 6 8 y304050m70根据表中提供的全部数据,用最小二乘法得出y 与x 的线性回归方程为y ^=6.5x +17.5,则表中m 的值为( )A .45B .50C .55D .60解析:∵x =2+4+5+6+85=5,y =30+40+50+m +705=190+m 5,∴当x =5时,y =6.5×5+17.5=50, ∴190+m5=50,解得m =60.答案:D6.为比较甲、乙两地某月11时的气温情况,随机选取该月中的5天,将这5天中11时的气温数据(单位:℃)制成如图所示的茎叶图,考虑以下结论:①甲地该月11时的平均气温低于乙地该月11时的平均气温 ②甲地该月11时的平均气温高于乙地该月11时的平均气温 ③甲地该月11时的气温的标准差小于乙地该月11时的气温的标准差④甲地该月11时的气温的标准差大于乙地该月11时的气温的标准差 其中根据茎叶图能得到的正确结论的编号为( ) A .①③ B .①④ C .②③D .②④解析:由茎叶图和平均数公式可得甲、乙两地的平均数分别是30,29,则甲地该月11时的平均气温高于乙地该月11时的平均气温,①错误,②正确,排除A 和B ;又甲、乙两地该月11时的标准差分别是s 甲=4+1+1+45=2,s 乙=9+1+4+45=185,则甲地该月11时的气温的标准差小于乙地该月11时的气温的标准差,③正确,④错误,故选项C 正确.答案:C 二、填空题7.(2018·惠州模拟)某车间为了规定工时定额,需要确定加工零件所花费的时间,为此进行了5次试验.根据收集到的数据(如下表):由最小二乘法求得回归方程y =0.67x +a ,则a 的值为________. 解析:因为x =10+20+30+40+505=30,y =62+68+75+81+895=75,所以回归直线一定过样本点的中心(30,75), 则由y ^=0.67x +a ^可得75=30×0.67+a ^, 求得a ^=54.9. 答案:54.98.(2018·高考全国卷Ⅲ)某公司有大量客户,且不同年龄段客户对其服务的评价有较大差异.为了解客户的评价,该公司准备进行抽样调查,可供选择的抽样方法有简单随机抽样、分层抽样和系统抽样,则最合适的抽样方法是________.解析:因为客户数量大,且不同年龄段客户对其服务的评价有较大差异,所以最合适的抽样方法是分层抽样.答案:分层抽样 三、解答题9.某商店为了更好地规划某种商品的进货量,从某一年的销售数据中,随机抽取了8组数据作为研究对象,如下表所示(x 为该商品的进货量,y 为销售天数):(1)(2)根据上表提供的数据,求出y 关于x 的线性回归方程y ^=b ^x +a ^;(3)根据(2)中的计算结果,若该商店准备一次性进货24吨,预测需要销售的天数.参考公式和数据:b ^=∑i =1nx i y i -n x ·y∑i =1nx 2i -n x2,a ^=y -b ^x ;∑i =18x 2i =356,∑i =18x i y i =241. 解析:(1)散点图如图所示.(2)依题意,得x =18×(2+3+4+5+6+8+9+11)=6,y =18×(1+2+3+3+4+5+6+8)=4,又∑i =18x 2i =356,∑i =18x i y i =241,所以b ^=∑i =18x i y i -8x ·y∑i =18x 2i -8x2=241-8×6×4356-8×62=4968,a ^=4-4968×6=-1134,故线性回归方程为y ^=4968x -1134.(3)由(2)知,当x =24时,y ^=4968×24-1134≈17,故若该商店一次性进货24吨,则预计需要销售17天.10.(2018·郑州模拟)为了考察高中学生的身体素质情况,现抽取了某校1 000名(男生800名,女生200名)学生的测试成绩,根据性别按分层抽样的方法抽取100名学生的测试成绩进行分析,得到如下统计表:男生测试情况:(1)2名学生恰好是一男一女的概率;(2)若测试等级为“良好”或“优秀”的学生为“体育达人”,其他等级(含病残免试)的学生为“非体育达人”,根据以上统计数据填写下面列联表,并回答能否在犯错误的概率不超过0.010的前提下认为“是否为‘体育达人’与性别有关?”临界值表:附:K2=n(ad-bc)(a+b)(c+d)(a+c)(b+d),其中n=a+b+c+d.解析:(1)按分层抽样的知识知男生应抽取80名,女生应抽取20名,∴x=80-(5+10+15+47)=3,y=20-(2+3+10+2)=3.抽取的100名且测试等级为“优秀”的3名男生分别记为A,B,C,2名女生分别记为a,b.从5名学生中任选2名,总的基本事件有(A,B),(A,C),(A,a),(A,b),(B,C),(B,a),(B,b),(C,a),(C,b),(a,b),共10个.设“选出的2名学生恰好是一男一女”为事件M,则事件M包含的基本事件有(A,a),(A,b),(B,a),(B,b),(C,a),(C,b),共6个,∴P(A)=610=3 5.(2)2×2列联表如下:则K 2=n (ad -bc )2(a +b )(c +d )(a +c )(b +d )=100×(50×15-30×5)280×20×55×45≈9.091.∵9.091>6.635且P (K 2≥6.635)=0.010,∴能在犯错误的概率不超过0.010的前提下认为“是否为‘体育达人’与性别有关.”。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

专题10.2 统计与统计案例
一、填空题:请把答案直接填写在答题卡相应的位置........
上(共10题,每小题6分,共计60分). 1.交通部门对某路段公路上行驶的汽车速度实施监控,从速度在
的汽车中抽取150辆进行分析,得到数据的频率分布直方图如图所示,则速度在
以下的汽车有辆.

【答案】75
2.某校高一年级有学生人,高二年级有学生人,现采用分层抽样的方法从全校学生中抽出人,其中从高一年级学生中抽出人,则从高三年级学生中抽取的人数为 ▲ .
【答案】17
【解析】高一高二人数之比为10:9,因此高二抽出的人数为18人,高三抽出的人数为55-20-18=17人
3.若一组样本数据9,8,x ,10,11的平均数为10,则该组样本数据的方差为▲.
【答案】2
【解析】由题意得,因此方差为
4.某校共有教师200人,男学生800人,女学生600人,现用分层抽样的方法从所有师生中抽取一个容量为的样本,已知从男学生中抽取的人数为100人,那么 ▲ .
【答案】200
【解析】男学生占全校总人数,那么
5.从某校高三年级随机抽取一个班,对该班50名学生的高校招生体检表中的视力情况进行统计,其频率分布直方图如图所示。

若某高校A 专业对视力的要求在0.9以上,则该班学生中能报A 专业的人数为.
【答案】20
【解析】根据频率分布直方图,得视力在0.9以上的频率为(1.00+0.75+0.25)×0.2=0.4,
∴该班学生中能报A专业的人数为50×0.4=20.
6.某单位200名职工的年龄分布情况如图,现要从中抽取40名职工作样本.用系统抽样法,将全体职工随机按1~200编号,并按编号顺序平均分为40组(1~5号,6~10号,…,196~200号).若第5组抽出的号码为22,则第8组抽出的号码应是________.若用分层抽样方法,则40岁以下年龄段应抽取________人.
【答案】37,20
7.下图是2014年在怀化市举行的演讲比赛,七位评委为第一位演讲者打出的分数的茎叶统计图,去掉一个最高分和一个最低分后,所剩数据的平均数与方差分别为.
【答案】,
【解析】去掉一个最高分和一个最低分之后,剩余的五个数据依次是、、、、,平均数为。

相关文档
最新文档