2021届新高考数学二轮复习课件:专题四 概率与统计 第1讲 统计与统计案例 课件(共50张PPT)
2021届高考数学二轮复习专题四概率与统计第1讲统计与统计案例课件理
高考定位 1.抽样方法、样本的数字特征、统计图表、回归分析与独立性检验主要 以选择题、填空题形式命题,难度较小;2.注重知识的交汇渗透,统计与概率,回 归分析与概率是近年命题的热点,2021年,2021年和2021年在解答题中均有考察.
真题感悟
1.(2021·全国Ⅰ卷)某地区经过一年的新农村建立,农村的经济收入增加了一倍,实现 翻番.为更好地了解该地区农村的经济收入变化情况,统计了该地区新农村建立前后 农村的经济收入构成比例,得到如下图的饼图:
(1)分别利用这两个模型,求该地区2021年的环境根底设施投资额的预测值; (2)你认为用哪个模型得到的预测值更可靠?并说明理由. 解 (1)利用模型①,该地区 2018 年的环境基础设施投资额的预测值为y^=-30.4+ 13.5×19=226.1(亿元). 利用模型②,该地区 2018 年的环境基础设施投资额的预测值为y^=99+17.5×9= 256.5(亿元).
探究提高 1.解决此类题目的关键是深刻理解各种抽样方法的特点和适用范围.但 无论哪种抽样方法,每一个个体被抽到的概率都是相等的,都等于样本容量与总体 容量的比值. 2.在系统抽样的过程中,要注意分段间隔,需要抽取 n 个个体,样本就需要分成 n 个组,则分段间隔即为Nn(n 为样本容量),首先确定在第一组中抽取的个体的号码数, 再从后面的每组中按规则抽取每个个体.
其中符合茎叶图所给数据的结论是( )
A.①②③
B.②③④
C.①②④
D.①③④
解析 由茎叶图知,男生每天锻炼时间差异小,女生差异大,①正确. 男生平均每天锻炼时间超过 65 分钟的概率 P1=150=12,女生平均每天锻炼时间超过
65 分钟的概率 P2=140=25,P1>P2,因此④正确. 设男生、女生两组数据的平均数分别为-x甲,-x乙,标准差分别为 s 甲,s 乙.易求-x甲=65.2, -x乙=61.8,知-x甲>-x乙,②正确. 又根据茎叶图,男生锻炼时间较集中,女生锻炼时间较分散,∴s甲<s乙,③错误, 因此符合茎叶图所给数据的结论是①②④. 答案 C
【2021届高考二轮精品资源-数学】专题五 概率与统计(文理)第1讲 统计与统计案例 教师版
【2021届高考二轮精品资源-数学】专题五 概率与统计(文理) 第1讲 统计与统计案例 教师版1.抽样方法、样本的数字特征、统计图表、回归分析与独立性检验主要以选择题、填空题形式命题,难度较小;2.注重知识的交汇渗透,统计与概率,回归分析与概率是近年命题的热点.1.抽样方法抽样方法包括简单随机抽样、系统抽样、分层抽样,三种抽样方法都是等概率抽样,体现了抽样的公平性,但又各有其特点和适用范围. 2.统计中的四个数据特征(1)众数:在样本数据中,出现次数最多的那个数据.(2)中位数:样本数据中,将数据按大小排列,位于最中间的数据.如果数据的个数为偶数,就取中间两个数据的平均数作为中位数.(3)平均数:样本数据的算术平均数,即=n 1(x 1+x 2+…+x n ). (4)方差与标准差. s 2=n 1[(x 1-)2+(x 2-)2+…+(x n -)2],s=[(x1- EMBED Equation.DSMT4 )2+(x2- EMBED Equation.DSMT4 )2+…+(xn - EMBED Equation.DSM 1.3.直方图的两个结论(1)小长方形的面积=组距×组距频率=频率. (2)各小长方形的面积之和等于1. 4.回归分析与独立性检验(1)回归直线^y =^b x +^a 经过样本点的中心点(,),若x 取某一个值代入回归直线方程^y=^b x +^a中,可求出y 的估计值. (2)独立性检验对于取值分别是{x 1,x 2}和{y 1,y 2}的分类变量X 和Y ,其样本频数列联表是:则K 2=(a +b )(c +d )(a +c )(b +d )n (ad -bc )2(其中n =a +b +c +d 为样本容量).型更合适,并用此模型预测A 超市广告费支出为8万元时的销售额. 参数数据及公式:=8,=42,7x i y i =2 794,7x i 2=708,(1)解析 ∵k ≈3.918>3.841,且P (K 2≥k 0=3.841)=0.05,根据独立性检验思想“这种血清能起到预防感冒的作用”出错的可能性不超过5%. 答案 B(2)解 ①∵=8,=42,7x i y i =2 794,7x i 2=708.因此^a =-^b=42-1.7×8=28.4.所以,y 关于x 的线性回归方程是^y=1.7x +28.4. ②∵0.75<0.97, ∴对数回归模型更合适.当x =8时,^y=12ln 8+22=36ln 2+22=36×0.7+22=47.2万元.∴广告费支出8万元时,预测A超市销售额为47.2万元.1.(2017·全国Ⅰ卷)为评估一种农作物的种植效果,选了n块地作试验田.这n块地的亩产量(单位:kg)分别为x1,x2,…,x n,下面给出的指标中可以用来评估这种农作物亩产量稳定程度的是()A.x1,x2,…,x n的平均数B.x1,x2,…,x n的标准差C.x1,x2,…,x n的最大值D.x1,x2,…,x n的中位数【解题思路】刻画评估这种农作物亩产量稳定程度的指标是标准差.【答案】B2.(2018·全国I卷)某地区经过一年的新农村建设,农村的经济收入增加了一倍.实现翻番.为更好地了解该地区农村的经济收入变化情况,统计了该地区新农村建设前后农村的经济收入构成比例.得到如下饼图:则下面结论中不正确的是()A.新农村建设后,种植收入减少B.新农村建设后,其他收入增加了一倍以上C.新农村建设后,养殖收入增加了一倍D.新农村建设后,养殖收入与第三产业收入的总和超过了经济收入的一半【解题思路】首先设出新农村建设前的经济收入为M,根据题意,得到新农村建设后的经济收入为2M,之后从图中各项收入所占的比例,得到其对应的收入是多少,从而可以比较其大小,并且得到其相应的关系,从而得出正确的选项.【答案】设新农村建设前的收入为M,而新农村建设后的收入为2M,则新农村建设前种植收入为0.6M,而新农村建设后的种植收入为0.74M,所以种植收入增加了,所以A项不正确;新农村建设前其他收入我0.04M,新农村建设后其他收入为0.1M,故增加了一倍以上,所以B项正确;新农村建设前,养殖收入为0.3M,新农村建设后为0.6M,所以增加了一倍,所以C 项正确;新农村建设后,养殖收入与第三产业收入的综合占经济收入的,所以超过了经济收入的一半,所以D正确;故选A.3.(2018·全国III卷))某公司有大量客户,且不同龄段客户对其服务的评价有较大差异.为了解客户的评价,该公司准备进行抽样调查,可供选择的抽样方法有简单随机抽样、分层抽样和系统抽样,则最合适的抽样方法是________.【解题思路】由题可知满足分层抽样特点【答案】由于从不同龄段客户中抽取,故采用分层抽样,故答案为分层抽样.4.7.(2018·全国II卷)下图是某地区2000年至2016年环境基础设施投资额(单位:亿元)的折线图.为了预测该地区2018年的环境基础设施投资额,建立了与时间变量的两个线性回归模型.根据2000年至2016年的数据(时间变量的值依次为)建立模型①:;根据2010年至2016年的数据(时间变量的值依次为)建立模型②:.(1)分别利用这两个模型,求该地区2018年的环境基础设施投资额的预测值;(2)你认为用哪个模型得到的预测值更可靠?并说明理由.【解题思路】(1)两个回归直线方程中无参数,所以分别求自变量为2018时所对应的函数值,就得结果,(2)根据折线图知2000到2009,与2010到2016是两个有明显区别的直线,且2010到2016的增幅明显高于2000到2009,也高于模型1的增幅,因此所以用模型2更能较好得到2018的预测.【答案】(1)利用模型①,该地区2018年的环境基础设施投资额的预测值为=–30.4+13.5×19=226.1(亿元).利用模型②,该地区2018年的环境基础设施投资额的预测值为=99+17.5×9=256.5(亿元).(2)利用模型②得到的预测值更可靠.理由如下:(i)从折线图可以看出,2000年至2016年的数据对应的点没有随机散布在直线y=–30.4+13.5t上下,这说明利用2000年至2016年的数据建立的线性模型①不能很好地描述环境基础设施投资额的变化趋势.2010年相对2009年的环境基础设施投资额有明显增加,2010年至2016年的数据对应的点位于一条直线的附近,这说明从2010年开始环境基础设施投资额的变化规律呈线性增长趋势,利用2010年至2016年的数据建立的线性模型=99+17.5t可以较好地描述2010年以后的环境基础设施投资额的变化趋势,因此利用模型②得到的预测值更可靠.(ii)从计算结果看,相对于2016年的环境基础设施投资额220亿元,由模型①得到的预测值226.1亿元的增幅明显偏低,而利用模型②得到的预测值的增幅比较合理,说明利用模型②得到的预测值更可靠.以上给出了2种理由,考生答出其中任意一种或其他合理理由均可得分.点睛:若已知回归直线方程,则可以直接将数值代入求得特定要求下的预测值;若回归直线方程有待定参数,则根据回归直线方程恒过点求参数.1.(2018·内江期末)为了了解某社区居民是否准备收看电视台直播的“龙舟大赛”,某记者分别从社区60~70岁,40~50岁,20~30岁的三个年龄段中的128,192,x人中,采用分层抽样的方法共抽出了30人进行调查,若60~70岁这个年龄段中抽查了8人,那么x为()A.64B.96C.144D.160【解题思路】根据60~70岁这个年龄段中128人中抽查了8人,可知分层抽样的抽样比为,因为共抽出30人,所以总人数为人,即可求出20~30岁年龄段的人数.【答案】根据60~70岁这个年龄段中128人中抽查了8人,可知分层抽样的抽样比为,因为共抽出30人,所以总人数为人,所以,20~30岁龄段的人有,故选D.2.(2017·全国Ⅲ卷)某城市为了解游客人数的变化规律,提高旅游服务质量,收集并整理了2014年1月至2016年12月期间月接待游客量(单位:万人)的数据,绘制了下面的折线图.根据该折线图,下列结论错误的是()A.月接待游客量逐月增加B.年接待游客量逐年增加C.各年的月接待游客量高峰期大致在7,8月D.各年1月至6月的月接待游客量相对于7月至12月,波动性更小,变化比较平稳【解题思路】由题图可知,2014年8月到9月的月接待游客量在减少,则A选项错误.【答案】A3.(2017·泉州模拟)某厂在生产甲产品的过程中,产量x(吨)与生产能耗y(吨)的对应数据如表:根据最小二乘法求得回归方程为^=0.65x+^,当产量为80吨时,预计需要生产能耗为________吨.【解题思路】由回归直线方程过样本点中心可得^a.【答案】由题意,=45,=36.25,代入^y=0.65x+^a,可得^a=7,∴当产量为80吨时,预计需要生产能耗为0.65×80+7=59.故填59.4.(2018·全国I卷)某家庭记录了未使用节水龙头50天的日用水量数据(单位:m3)和使用了节水龙头50天的日用水量数据,得到频数分布表如下:未使用节水龙头50天的日用水量频数分布表使用了节水龙头50天的日用水量频数分布表(1)在答题卡上作出使用了节水龙头50天的日用水量数据的频率分布直方图:(2)估计该家庭使用节水龙头后,日用水量小于0.35 m3的概率;(3)估计该家庭使用节水龙头后,一年能节省多少水?(一年按365天计算,同一组中的数据以这组数据所在区间中点的值作代表.)【解题思路】(1)根据题中所给的使用了节水龙头50天的日用水量频数分布表,算出落在相应区间上的频率,借助于直方图中长方形的面积表示的就是落在相应区间上的频率,从而确定出对应矩形的高,从而得到直方图;(2)结合直方图,算出日用水量小于0.35的矩形的面积总和,即为所求的频率;(3)根据组中值乘以相应的频率作和求得50天日用水量的平均值,作差乘以365天得到一年能节约用水多少,从而求得结果.【答案】(1)(2)根据以上数据,该家庭使用节水龙头后50天日用水量小于0.35m3的频率为0.2×0.1+1×0.1+2.6×0.1+2×0.05=0.48,因此该家庭使用节水龙头后日用水量小于0.35m3的概率的估计值为0.48.(3)该家庭未使用节水龙头50天日用水量的平均数为.该家庭使用了节水龙头后50天日用水量的平均数为.估计使用节水龙头后,一年可节省水.1.(2017·汉中模拟)已知两个随机变量x,y之间的相关关系如表所示:根据上述数据得到的回归方程为^y =^b x +^a,则大致可以判断( ) A .^a >0,^b >0B .^a >0,^b <0C .^a <0,^b >0D .^a <0,^b <0【解题思路】作出散点图,画出回归直线直观判定^b >0,^a<0. 【答案】C2.(2018·衡水中学)已知某种商品的广告费支出x (单位:万元)与销售额y (单位:万元)之间有如下对应数据:根据表中的全部数据,用最小二乘法得出y 与x 的线性回归方程为,则表中m 的值为( ) A .45B .50C .55D .70【解题思路】根据回归直线经过样本平均数点,可求得m 的值.【答案】由表可知,,,因为回归直线会经过平均数样本中心点,代入,解得,所以选D .3.为了研究雾霾天气的治理情况,某课题组对部分城市进行空气质量调查,按地域特点把这些城市分成甲、乙、丙三组,已知三组城市的个数分别为4,y ,z ,依次构成等差数列,且4,y ,z +4成等比数列,若用分层抽样抽取6个城市,则乙组中应抽取的城市个数为________.【解题思路】根据等差数列和等比数列的定义列方程组解出y ,z .【答案】由题意可得y2=4(z +4),2y =4+z ,即y2=4z +16,,解得z =12或z =-4(舍去),故y =8. 所以甲、乙、丙三组城市的个数分别为4,8,12. 因为一共要抽取6个城市,所以抽样比为4+8+126=41. 故乙组城市应抽取的个数为8×41=2.故填 2.4.(2017·赤峰二模)微信是腾讯公司推出的一种手机通讯软件,它支持发送语音短信、视频、图片和文字,一经推出便风靡全国,甚至涌现出一批在微信的朋友圈内销售商品的人(被称为微商).为了调查每天微信用户使用微信的时间,某经销化妆品的微商在一广场随机采访男性、女性用户各50名,将男性、女性使用微信的时间分成5组:(0,2],(2,4],(4,6],(6,8],(8,10]分别加以统计,得到如图所示的频率分布直方图.(1)根据女性频率分布直方图估计女性使用微信的平均时间;(2)若每天玩微信超过4小时的用户列为“微信控”,否则称其为“非微信控”,请你根据已知条件完成2×2的列联表,并判断是否有90%的把握认为“微信控”与“性别有关”? 【解题思路】(1)取每组的中间值代表这组,平均数;(2)根据题意列出2×2列联表,并计算K 2.【答案】解 (1)女性平均使用微信的时间为:0.16×1+0.24×3+0.28×5+0.2×7+0.12×9=4.76 (小时).(2)由已知得:2(0.04+a +0.14+2×0.12)=1,解得a =0.08. 由题设条件得列联表∴K 2=(a +b )(c +d )(a +c )(b +d )n (ad =50×50×68×32≈2.941>2.706. 所以有90%的把握认为“微信控”与“性别”有关.。
2021届高考数学【新课改版】二轮专题四概率与统计 统计、统计案例ppt下载
(2)理解样本数据标准差的意义和作用,学会计算数字特征(如 平均数、标准差),并作出合理的解释; (3)体会用样本估计总体的思想,会用样本的频率分布估计总体 分布,会用样本的基本数字特征估计总体的基本数字特征;初 步体会样本频率分布和数字特征的随机性. 3.统计案例 (1)通过收集现实问题中两个有关联变量的数据作出散点图,并 利用散点图直观认识变量间的相关关系.知道最小二乘法的思 想,能根据给出的线性回归方程系数公式建立线性回归方程, 并能初步应用; (2)通过对典型案例(如“肺癌与吸烟有关吗”等)的探究,了解 独立性检验(只要求2×2列联表)的基本思想、方法及初步应用.
频率 频率=组距×组距
频率比 频率分布直方图中各小长方形的面积之和为1,各小 长方形高的比也就是频率比
众数 最高小长方形底边中点的横坐标 平分频率分布直方图的面积且垂直于横轴的直线与
中位数 横轴交点的横坐标 频率分布直方图中每个小长方形的面积乘小长方形
平均数 底边中点的横坐标之和
返回
[跟踪训练] (2020·安徽省部分重点学校联考)由于受到网络电商的冲击, 某品牌的洗衣机在线下的销售受到影响,造成了一定的经济 损失,现将A地区200家实体店该品牌洗衣机的月经济损失统 计如图所示.
Contents
1 考点1 用样本估计总体 2 考点2 统计案例 3 考点3 概率与统计的综合问题 4 专题检测 5 高考5个大题 解题研诀窍
返回
考点1 用样本估计总体
返回
[例1] (2020·全国卷Ⅰ)某厂接受了一项加工业务,加工 出来的产品(单位:件)按标准分为A,B,C,D四个等级.加 工业务约定:对于A级品、B级品、C级品,厂家每件分别收 取加工费90元,50元,20元;对于D级品,厂家每件要赔偿原 料损失费50元.该厂有甲、乙两个分厂可承接加工业务.甲 分厂加工成本费为25元/件,乙分厂加工成本费为20元/件.厂 家为决定由哪个分厂承接加工业务,在两个分厂各试加工了 100件这种产品,并统计了这些产品的等级,整理如下:
2021高考数学复习高考中的概率与统计问题课件理北师大版
经典微课堂 规范答题系列4 高考中的概率与统计问题
2
[命题解读] 从近五年全国卷高考试题来看,在高考的解答题 中,对概率与随机变量及其分布相结合的综合问题的考查既是热点 又是重点,是高考必考的内容,并且常常与统计相结合,常常设计 成包含概率计算、概率分布表、随机变量的数学期望与方差、统计 图表的识别等知识为主的综合题.以考生比较熟悉的实际应用问题 为载体,考查学生应用基础知识和基本方法分析问题和解决问题的 能力.
15
故六月份这种冰激凌一天的需求量 X(单位:桶)的分布列为
X
200 400
600
P
1
2
2
5
5
5
16
(2)由题意得, 当 n≤200 时,EY=2n≤400; 当 200<n≤400 时,EY=15×[200×2+(n-200)×(-2)]+45×n×2 =65n+160∈(400,640]; 当 400<n≤600 时, EY=15×[200×2+(n-200)×(-2)]+25×[400×2+(n-400)×(-2)] +25×n×2=-52n+800∈[560,640);
不会证明:{pi+1-pi}(i= 0,1,2,…,7)为等比数列.
采用累加递推法求解.
11
[通性通法] 随机变量分布列类问题的求解步骤: (1)定元:根据已知条件确定离散型随机变量的取值. (2)定性:明确每个随机变量取值所对应的事件. (3)定型:确定事件的概率模型和计算公式. (4)计算:计算随机变量取每一个值的概率. (5)列表:列出分布列. (6)求解:根据公式求期望.
桶,如果最高气温低于 20 ℃,需求量为 200 桶.为了确定六月份的
高考二轮总复习课件(适用于新高考新教材)数学专题四概率与统计
)
答案 CD
解析 =
1
∑ xi,y
=1
=
1 n
∑
n i=1
数相差 c,故 B 错误;2 =
+ = +c,故 A 错误;两组样本数据的样本中位
1
∑ (xi-)2,2
=1
=
1
∑ [(xi+c)-(+c)]2=2 ,故
=1
x 极差=xmax-xmin,y 极差=(xmax+c)-(xmin+c)=xmax-xmin,故 D 正确.
设离散型随机变量X可能取的不同值为x1,x2,…,xi,…,xn,X取每一个值
xi(i=1,2,…,n)的概率P(X=xi)=pi,则称下表为离散型随机变量X的分布列.
X
x1
x2
x3
…
xi
…
xn
P
p1
p2
p3
…
pi
…
pn
名师点析
1.离散型随机变量的分布列的两个性质
(1)pi≥0(i=1,2,…,n);
C 正确;
6.(2022·全国乙·文19)某地经过多年的环境治理,已将荒山改造成了绿水青
山.为估计一林区某种树木的总材积量,随机选取了10棵这种树木,测量每
棵树的根部横截面积(单位:m2)和材积量(单位:m3),得到如下数据:
10
10
10
=1
i=1
=1
并计算得 ∑ xi2 =0.038, ∑ 2 =1.615 8, ∑ xiyi=0.247 4.
B.甲与丁相互独立
C.乙与丙相互独立
D.丙与丁相互独立
)
答案 B
新教材高中数学第4章概率与统计4-1-1条件概率课件新人教B版选择性必修第二册
1.(对接教材 P43 例 3)设某动物由出生算起活到 20 岁的概 率为 0.8,活到 25 岁的概率为 0.4,现有一个 20 岁的这种动物,则它 活到 25 岁的概率是________.
2 3
3 5
[由公式 P(A|B)=PPA∩BB=23,P(B|A)=PPA∩AB=53.]
类型 2 利用基本事件个数求条件概率
在一个坛子中装有 10 个除颜色外完全相同的玻璃球,其中有 2 个红球,8 个黄球.现从中任取一球后(不放回),再取一球,则已知 第一个球为红色的情况下第二个球为黄色的概率为多少?
[解] 设第 1 次抽到舞蹈节目为事件 A,第 2 次抽到舞蹈节目为事 件 B,则第 1 次和第 2 次都抽到舞蹈节目为事件 A∩B.
(1)从 6 个节目中不放回地依次抽取 2 个的事件数为 n(Ω)=A26=30, 根据分步乘法计数原理 n(A)=A14A15=20,于是 P(A)=nnΩA=2300=23. (2)因为 n(A∩B)=A24=12,于是 P(A∩B)=nnA∩ΩB=1320=25.
[由公式 P(A|B)=PPA∩BB=23,P(B|A)=PPA∩AB=53.]
[跟进训练]
1.甲、乙两市都位于长江下游,根据一百多年来的气象记录, 知道一年中下雨天的比例甲市占 20%,乙市占 18%,两地同时下雨 占 12%,记 P(A)=0.2,P(B)=0.18,P(A∩B)=0.12,则 P(A|B)= ________,P(B|A)=________.
[解] 由古典概型的概率公式可知
统计与统计案例PPT课件
走向高考 ·二轮专题复习 ·新课标版 ·数学
用样本估计总体
专题七 第一讲
走向高考 ·二轮专题复习 ·新课标版 ·数学
用样本估计总体 (文)某学校为了调查学生平均每周的上网时间(单 位:h)对学习产生的影响,从高三年级随机抽取了 100 名学生, 将所得数据整理后,画出频率分布直方图(如图),其中频率分 布直方图从左到右前 3 个小矩形的面积之比为 1:3:5,试估 计:
专题七 第一讲
走向高考 ·二轮专题复习 ·新课标版 ·数学
疑难误区警示 1.当总体数 N 不能被样本容量整除,用系统抽样法剔除 多余个体时,必须随机抽样. 2.注意中位数与平均数的区别,中位数可能不在样本数 据中.
专题七 第一讲
走向高考 ·二轮专题复习 ·新课工厂甲、乙、丙三个车
间生产了同一种产品,数量分别为 120 件,80 件,60 件,为
了解它们的产品质量是否存在显著差异,用分层抽样方法抽
取了一个容量为 n 的样本进行调查,其中从丙车间的产品中
抽取了 3 件,则 n=( )
A.9
B.10
C.12
D.13
[答案] D
专题七 第一讲
走向高考 ·二轮专题复习 ·新课标版 ·数学
某市有大型超市 200 家、中型超市 400 家、小型超市 1400 家.为掌握各类超市的营业情况,现按分层抽样方法抽取一个 容量为 100 的样本,应抽取中型超市________家.
[答案] 20
专题七 第一讲
走向高考 ·二轮专题复习 ·新课标版 ·数学
[解析] 属简单题,关键是清楚每一层的抽取比例都一样 是Nn .
专题七 第一讲
走向高考 ·二轮专题复习 ·新课标版 ·数学
2021高考数学(文)复习课件:板块2 命题区间精讲 精讲4 统计与概率
板块二 高考专项突破——解答 题
命题区间精讲 精讲4 统计与概率
数学文
栏目导航
01 命题点1 02 命题点2 03 命题点3 04 命题点4 05 专题限时集训
01 命题点1 用样本估计总体
总体估计的方法 (1)统计量法:①若数据已知,常借助 x ,s2等量对样本总体做出 估计,其中 x =x1+x2+n …+xn,s2=n1∑i=n1 (xi- x )2. ②若数据未知,如以频率分布直方图形式给出,则应明确直方 图中各统计量的求法.
该产品的质量评价标准规定:鉴定成绩在[90,100)内的产品, 质量等级为优秀;鉴定成绩在[80,90)内的产品,质量等级为良好; 鉴定成绩在[60,80)内的产品,质量等级为合格.将频率视为概率.
(1)完成下列2×2列联表,以产品质量等级是否达到良好以上(含 良好)为判断依据,判断能不能在误差不超过0.05的情况下,认为产 品等级是否达到良好以上(含良好)与生产产品的机器有关;
=1 27332.84-4-5×5×7.72.×2×7.229.64=26086.8.4=3, a^= y -b^ x =29.64-3×7.2=8.04. 所以 y 关于 x 的回归方程为^y=3x+8.04. ②把 x=18 代入①中所求回归方程得 ^y=3×18+8.04=62.04,故预报值为 62.04 万元.
(1)从以上模型中选择更优的回归方程,并用相关系数加以说明; (2)根据(1)的选择结果及表中数据,建立 y 关于 x 的回归方程; (3)已知这种产品的年利润 z 与 x,y 的关系为 z=10y-x.根据(2) 的结果回答下列问题: ①年宣传费 x=20 时,年利润的预报值是多少? ②年宣传费 x 为何值时,年利润的预报值最大?
高三数学第二轮专题讲座复习:概率与统计
高三数学第二轮专题讲座复习:概率与统计高考要求概率是高考的重点内容之一,尤其是新增的随机变量这部分内容要充分注意一些重要概念的实际意义,理解概率处理问题的基本思想方法重难点归纳本章内容分为概率初步和随机变量两部分第一部分包括等可能事件的概率、互斥事件有一个发生的概率、相互独立事件同时发生的概率和独立重复实验第二部分包括随机变量、离散型随机变量的期望与方差涉及的思维方法观察与试验、分析与综合、一般化与特殊化主要思维形式有逻辑思维、聚合思维、形象思维和创造性思维典型题例示范讲解例1有一容量为50的样本,数据的分组及各组的频率数如下[10,15]4 [30,35)9 [15,20)5 [35,40)8[20,25)10 [40,45)3 [25,30)11(1)列出样本的频率分布表(含累积频率);(2)画出频率分布直方图和累积频率的分布图命题意图本题主要考查频率分布表,频率分布直方图和累积频率的分布图的画法知识依托频率、累积频率的概念以及频率分布表、直方图和累积频率分布图的画法错解分析解答本题时,计算容易出现失误,且要注意频率分布与累积频率分布的区别技巧与方法本题关键在于掌握三种表格的区别与联系解(1)由所给数据,计算得如下频率分布表数据段频数频率累积频率[10,15) 4 0.08 0.08[15,20) 5 0.10 0.18[20,25)10 0.20 0.38[25,30)11 0.22 0.60[30,35)9 0.18 0.78[35,40)8 0.16 0.94[40,45) 3 0.06 1总计50 1(2)频率分布直方图与累积频率分布图如下例2袋子A 和B 中装有若干个均匀的红球和白球,从A 中摸出一个红球的概率是31,从B 中摸出一个红球的概率为p .(Ⅰ) 从A 中有放回地摸球,每次摸出一个,有3次摸到红球即停止. (i )求恰好摸5次停止的概率;(ii )记5次之内(含5次)摸到红球的次数为ξ,求随机变量ξ的分布率及数学期望E ξ. (Ⅱ) 若A 、B 两个袋子中的球数之比为12,将A 、B 中的球装在一起后,从中摸出一个红球的概率是25,求p 的值. 命题意图本题考查利用概率知识和期望的计算方法 知识依托概率的计算及期望的概念的有关知识错解分析在本题中,随机变量的确定,稍有不慎,就将产生失误 技巧与方法 可借助n 次独立重复试验概率公式计算概率解 (Ⅰ)(i )2224121833381C ⎛⎫⎛⎫⨯⨯⨯= ⎪ ⎪⎝⎭⎝⎭(ii)随机变量ξ的取值为0,1,2,3,;由n 次独立重复试验概率公式()()1n kk kn n P k C p p -=-,得()50513*******P C ξ⎛⎫==⨯-= ⎪⎝⎭; ()41511801133243P C ξ⎛⎫==⨯⨯-= ⎪⎝⎭()232511802133243P C ξ⎛⎫⎛⎫==⨯⨯-= ⎪ ⎪⎝⎭⎝⎭()323511173133243P C ξ⎛⎫⎛⎫==⨯⨯-= ⎪ ⎪⎝⎭⎝⎭(或()328021731243243P ξ+⨯==-=) 随机变量ξ的分布列是ξ0 1 2 3P32243 80243 80243 17243ξ的数学期望是 32808017131012324324324324381E ξ=⨯+⨯+⨯+⨯=(Ⅱ)设袋子A 中有m 个球,则袋子B 中有2m 个球由122335m mpm +=,得1330p = 例3如图,用A 、B 、C 三类不同的元件连接成两个系统N 1、N 2,当元件A 、B 、C 都正常工作时,系统N 1正常工作;当元件A 正常工作且元件B 、C 至少有一个正常工作时,系统N 2正常工作 已知元件A 、B 、C 正常工作的概率依次为0.80,0.90,0.90,分别求系统N 1,N 2正常工作的概率P 1、P 2(N 2)AB C(N 1)CB A解 记元件A 、B 、C 正常工作的事件分别为A 、B 、C , 由已知条件P (A )=0.80, P (B )=0.90,P (C )=0.90(1)因为事件A 、B 、C 是相互独立的,所以,系统N 1正常工作的概率P 1=P (A ·B ·C )=P (A )P (B )P (C )=0.648,故系统N 1正常工作的概率为0.648(2)系统N 2正常工作的概率P 2=P (A )·[1-P (C B ⋅)]=P (A )·[1-P (B )P (C )] =0 80×[1-(1-0 90)(1-0 90)]=0 792 故系统N 2正常工作的概率为0 792 学生巩固练习1 甲射击命中目标的概率是21,乙命中目标的概率是31,41现在三人同时射击目标,则目标被击中的概率为( )107 D. 54C. 32 B. 43A. 2 已知随机变量ζ的分布列为 P (ζ=k )=31,k =1,2,3,则P (3ζ+5)等于A 6B 9C 3D 43 1盒中有9个正品和3个废品,每次取1个产品,取出后不再放回,在取得正品前已取出的废品数ζ的期望E ζ=_________4 某班有52人,男女各半,男女各自平均分成两组,从这个班中选出4人参加某项活动,这4人恰好来自不同组别的概率是_________5 甲、乙两人各进行一次射击,如果两人击中目标的概率都是0.6,计算 (1)两人都击中目标的概率;(2)其中恰有一人击中目标的概率; (3)至少有一人击中目标的概率6 已知连续型随机变量ζ的概率密度函数f (x )=⎪⎩⎪⎨⎧≥<≤-≤2 021 1 0x x a x x(1)求常数a 的值,并画出ζ的概率密度曲线; (2)求P (1<ζ<23) 参考答案:1 解析 设甲命中目标为事件A ,乙命中目标为事件B ,丙命中目标为事件C ,则目标被击中的事件可以表示为A+B+C ,即击中目标表示事件A 、B 、C 中至少有一个发生.41)411)(311)(211()](1[)](1[)](1[)()()()(=---=-⋅-⋅-=⋅⋅=⋅⋅∴C P B P A P C P B P A P C B A P故目标被击中的概率为1-P (A ·B ·C )=1-4341= 答案 A 2 解析 E ξ=(1+2+3)·31=2,E ξ2=(12+22+32)·31=314∴D ξ=E ξ2-(E ξ)2=314-2232∴D (3ξ+5)=9E ξ=6答案 A3 解析 由条件知,ξ的取值为0,1,2,3,并且有P (ξ=0)=43C C 11219=,3.02201322092449143022012C C C )3(,22092C C C )2(,4492C C C )1(412193331219232121913=⨯+⨯+⨯+⨯=ξ∴===ξ=⋅==ξ===ξE P P P 答案 0.34 解析 因为每组人数为13,因此,每组选1人有C 113种方法,所以所求概率为P 4524113)C ( 答案 4524113C )C ( 5 解 (1)我们把“甲射击一次击中目标”叫做事件A ,“乙射击一次击中目标”叫做事件B 显然事件A 、B 相互独立,所以两人各射击一次都击中目标的概率是P (A ·B ) =P (A )·P (B )=0.6×0.6=0.36答 两人都击中目标的概率是0.36(2)同理,两人各射击一次,甲击中、乙未击中的概率是P (A ·B )=P (A )·P (B )=0.6×(1-0.6)=0.6×0.4=0.24甲未击中、乙击中的概率是P (A ·B)=P (A )P (B )=0.24,显然,“甲击中、乙未击中”和“甲未击中、乙击中”是不可能同时发生,即事件A ·B 与A ·B 互斥,所以恰有一人击中目标的概率是P (A ·B )+P (A ·B )=0.24+0.24=0.48(2)两人各射击一次,至少有一人击中目标的概率P =P (A ·B )+[P (A ·B )+P (A )·B ]=0.36+0.48=0.84答 至少有一人击中目标的概率是0.846 解 (1)因为ξ所在区间上的概率总和为1,所以21 (1-a +2-a )·1=1,∴a =21概率密度曲线如图 (2)P (1<ξ<23)=9323)121(21=⋅+⋅。
2021届高考数学二轮专题复习PPT教学课件_专题四统计与统计案例(理)(105页)
(教学提纲)2021届高考数学二轮专 题复习 获奖课 件:专 题四统 计与统 计案例 (理) (共105 页PPT )(免 费下载 )
•义核心价值观典的例情1况(1,)(2用02系0·统中抽卫样三的模方)某法学从校全为校落2实40学0生名掌学握生社中会抽主取
30人进行调查.现将2 400名学生随机地从1~2 400编号,按编号顺
• 抽样方法主要有简单随机抽样、系统抽样、分层抽样三种,这 三种抽样方法各自适用不同特点的总体,但无论哪种抽样方法,每 一个个体被抽到的概率都是相等的,都等于样本容量和总体容量的 比值.
(教学提纲)2021届高考数学二轮专 题复习 获奖课 件:专 题四统 计与统 计案例 (理) (共105 页PPT )(免 费下载 )
• (理科) 年份 卷别 Ⅰ卷
Ⅱ卷 2020
Ⅲ卷
题号 5 18
3、18
考查角度
分值
散点图的识别
5
平均数的估计值、相关系数的计算以 12
及抽样方法的选取
标准差的大小比较、方差公式的应用;
利用频数分布表计算频率和平均数、 17
独立性检验的应用
年份 2019 2018
卷别 Ⅰ卷 Ⅱ卷 Ⅲ卷 Ⅰ卷 Ⅱ卷 Ⅲ卷
又经计算修改前的方差为
1 10
(8.22+12.22+13.82+17.82+15.22+5.22
+17.82+2.22+21.22+14.82)=197.16
修改后的方差为
1 10
(8.22+17.22+18.82+17.82+20.22+5.22+22.82+
(教学提纲)2021届高考数学二轮专 题复习 获奖课 件:专 题四统 计与统 计案例 (理) (共105 页PPT )(免 费下载 )
统考版2024高考数学二轮专题复习专题四统计与概率第1讲统计统计案例课件理
考点三 回归分析的实际应用——准确计算,数据分析
线性回归方程
方程ොy=bx+ො
a称为线性回归方程,其中 b=
x;(തx,തy)称为样本中心点.
·四川省成都市石室中学模拟]某企业为了了解年广告费 x(单位:
万元)对年销售额 y(单位:万元)的影响,统计了近 7 年的年广告费 xi 和年
体由差异明显的几部分组成.
例 1 (1)某工厂利用随机数表对生产的700个零件进行抽样测试,先
将700个零件进行编号001、002、…、699、700.从中抽取70个样本,
下图提供随机数表的第4行到第6行,若从表中第5行第6列开始向右读
取数据,则得到的第5个样本编号是(
)
3321183429 7864560732 5242064438 1223435677 3578905642
支持结论“X与Y有关系”.
对点训练
[2021·全国甲卷]甲、乙两台机床生产同种产品,产品按质量分为一
级品和二级品,为了比较两台机床产品的质量,分别用两台机床各生
产了200件产品,产品的质量情况统计如下表:
甲机床
销售额 yi(i=1,2,3,4,5,6,7)的数据,得到下面的表格:
年广告费 x
2
3
4
5
6
7
8
年销售额 y 25 41 50 58 64 78 89
由表中数据,可判定变量 x,y 的线性相关关系较强.
(1)建立 y 关于 x 的线性回归方程;
(2)已知该企业的年利润 z 与 x,y 的关系为 z=2 y -x,根据(1)的
界人口变化情况的三幅统计图:
下列结论中错误的是(
2021届高考数学统考二轮复习第二部分专题4概率与统计第1讲统计与统计案例
专题4第1讲 统计与统计案例抽样方法授课提示:对应学生用书第37页考情调研考向分析在抽样方法的考查中,系统抽样,分层抽样是考查的重点,题型主要以选择题和填空题为主,属于中低档题.1.系统抽样.2.分层抽样.[题组练透]1.某公司在十周年庆典中有一个抽奖活动,主持人将公司450名员工随机编号为001,002,003,…,450,采用系统抽样的方法从中抽取50名幸运员工.已知抽取的幸运员工中有一个编号为025,那么以下编号中不是幸运员工编号的是( )A .007B .106C .356D .448解析:由题意,根据系统抽样,可得抽样间距为45050=9,又由25+9n =356无正整数解,故选C.答案:C2.将参加数学竞赛决赛的500名同学编号为:001,002,…,500,采用系统抽样的方法抽取一个容量为50的样本,且随机抽到的号码为005,这500名学生分别在三个考点考试,从001到200在第一考点,从201到365在第二考点,从366到500在第三考点,则第二考点被抽中的人数为( )A .15B .16C .17D .18解析:系统抽样的分段间隔为50050=10,在随机抽样中,首次抽到005号,以后每隔10个号抽到一个人,则在201至365号中共有17人被抽中,其编号分别为205,215,225,…,365.故选C.答案:C3.某学校初中部共有120名教师,高中部共有180名教师,其性别比例如图所示,已知按分层抽样方法得到的工会代表中,高中部女教师有6人,则工会代表中男教师的总人数为________.解析:∵高中部女教师与高中部男教师比例为2∶3,按分层抽样方法得到的工会代表中,高中部女教师有6人,则男教师有9人, ∴工会代表中高中部教师共有15人,又初中部与高中部总人数比例为2∶3, ∴工会代表中初中部教师人数与高中部教师人数比例为2∶3, ∴工会代表中初中部教师总人数为10, 又∵初中部女教师与初中部男教师比例为7∶3, 工会代表中初中部男教师的总人数为10×30%=3; ∴工会代表中男教师的总人数为9+3=12. 答案:12[题后悟通]系统抽样和分层抽样中的计算(1)系统抽样①总体容量为N ,样本容量为n ,则要将总体均分成n 组,每组Nn 个(有零头时要先去掉).②若第一组抽到编号为k 的个体,则以后各组中抽取的个体编号依次为k +Nn ,…,k +(n-1)N n.(2)分层抽样按比例抽样,计算的主要依据是:各层抽取的数量之比=总体中各层的数量之比.用样本估计总体授课提示:对应学生用书第38页考情调研考向分析主要考查平均数,方差的计算以及茎叶图与频率分布直方图的简单应用;题型以选择题和填空题为主,出现解答题时经常与概率相结合,难度为中低档.1.统计图表的识别.2.用统计图表估计总体.3.用样本的数字特征估计总体特征.[题组练透]1.(2020·合肥模拟)某调查机构对全国互联网行业进行调查统计,得到整个互联网行业从业者年龄分布饼状图,90后从事互联网行业者岗位分布条形图,则下列结论中不一定正确的是()注:90后指1990年及以后出生,80后指1980—1989年之间出生,80前指1979年及以前出生.A.互联网行业从业人员中90后占一半以上B.互联网行业中从事技术岗位的人数超过总人数的20%C.互联网行业中从事运营岗位的人数90后比80前多D.互联网行业中从事技术岗位的人数90后比80后多解析:A选项,可知90后占了56%,故正确;B选项,仅90后从事技术岗位的人数占总人数比为0.56×0.396=0.22176超过20%,故正确;C选项,可知90后明显比80前多,故正确;D选项,因为技术所占比例90后和80后不清楚,所以不一定多,故错误.故选D.答案:D2.CPI是居民消费价格指数的简称,它是一个反映居民家庭一般所购买的消费品和服务项目价格水平变动情况的宏观经济指标.如图为国家统计局发布的2018年2月-2020年2月全国居民消费价格指数(CPI)数据折线图(注:同比是今年第n个月与去年第n个月之比;环比表示连续2个单位周期(比如连续两月)内的量的变化比,环比增长率=(本期数-上期数)/上期数×100%).下列说法错误的是()A.2020年2月份居民消费价格同比上涨1.5%B.2020年2月份居民消费价格环比上涨1.0%C.2018年6月份居民消费价格环比下降0.1%D.2018年11月份居民消费价格同比下降0.3%解析:逐一考查所给的说法:A.2020年2月份居民消费价格同比上涨1.5%,题中的说法正确;B.2020年2月份居民消费价格环比上涨1.0%,题中的说法正确;C.2018年6月份居民消费价格环比下降0.1%,题中的说法正确;D.2018年11月份居民消费价格环比下降0.3%,2018年11月份居民消费价格同比上升2.2%,题中的说法错误.故选D.答案:D3.(2020·吉安模拟)某市举行“中学生诗词大赛”,分初赛和复赛两个阶段进行,规定:初赛成绩大于90分的具有复赛资格,某校有1 000名学生参加了初赛,所有学生的成绩均在区间(30,150]内,其频率分布直方图如图所示,则获得复赛资格的人数为()A.650B.660C.680 D.700解析:由题意,根据频率分布直方图,可得获得复赛资格的人数为1 000×(1-0.002 5×20-2×0.007 5×20)=650人, 故选A.答案:A4.(2020·淮南模拟)2020年3月18日晚,某校高一年级举行“校园歌手大奖赛”,邀请了七位评委为所有选手评分.某位选手演出结束后,评委们给他评分的茎叶图如图所示,按照比赛规则,需去掉一个最高分和一个最低分,则该选手最终所得分数的平均分为________.解析:该选手所得分数的平均分为80+4+4+6+4+75=85.答案:85[题后悟通]1.方差的计算与含义(1)计算:计算方差首先要计算平均数,然后再按照方差的计算公式进行计算. (2)含义:方差是描述一个样本和总体的波动大小的特征数,方差大说明波动大. 2.从频率分布直方图中得出有关数据的方法 频率 频率分布直方图中横轴表示组数,纵轴表示频率组距,频率=组距×频率组距频率比 频率分布直方图中各小长方形的面积之和为1,各小长方形高的比也就是频率比众数 最高小长方形底边中点的横坐标中位数 平分频率分布直方图的面积且垂直于横轴的直线与横轴交点的横坐标 平均数频率分布直方图中每个小长方形的面积乘小长方形底边中点的横坐标之和统计案例 授课提示:对应学生用书第39页考情调研考向分析回归分析,独立性检验是全国卷高考重点考查的内容,必考一个解答题,选择、填空题中也会出现.主要考查回归方程,相关系数,利用回归方程进行预测,独立性检验的应用等.1.求线性回归方程问题.2.利用回归分析对有关变量作出估计.3.独立性检验.[题组练透]1.(2020·云南质检)为降低汽车尾气排放量,某工厂设计制造了A、B两种不同型号的节排器,规定性能质量评分在[80,100]的为优质品.现从该厂生产的A、B两种型号的节排器中,分别随机抽取500件产品进行性能质量评分,并将评分分别分成以下六个组:[40,50),[50,60),[60,70),[70,80),[80,90),[90,100],绘制成如图所示的频率分布直方图:(1)设500件A型产品性能质量评分的中位数为M,直接写出M所在的分组区间;(2)请完成下面的列联表(单位:件)(把有关结果直接填入下面的表格中);A型节排器B型节排器总计优质品非优质品总计500500 1 000(3)根据(2)差异?附:K2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d),其中n=a+b+c+d.P(K2≥k0)0.100.0100.001k0 2.706 6.63510.828 解析:(1)[70,80).(2)列联表如下:(3)由于K 2=1 000(180×360-140×320)2320×680×500×500=12517≈7.353>6.635,所以有99%的把握认为A ,B 两种不同型号的节排器性能质量有差异.2.某手机厂商在销售200万台某型号手机时开展“手机碎屏险”活动.活动规则如下:用户购买该型号手机时可选购“手机碎屏险”,保费为x元.若在购机后一年内发生碎屏可免费更换一次屏幕.该手机厂商将在这200万台该型号手机全部销售完毕一年后,在购买碎屏险且购机后一年内未发生碎屏的用户中随机抽取1 000名,每名用户赠送1 000元的红包.为了合理确定保费x 的值,该手机厂商进行了问卷调查,统计后得到下表(其中y 表示保费为x 元时愿意购买该“手机碎屏险”的用户比例):(1)(2)通过大数据分析,在使用该型号手机的用户中,购机后一年内发生碎屏的比例为0.2%.已知更换一次该型号手机屏幕的费用为2 000元,若该手机厂商要求在这次活动中因销售该“手机碎屏险”产生的利润不少于70万元,能否把保费x 定为5元?参考公式:回归方程y ^=b ^x +a ^中斜率和截距的最小二乘估计分别为b ^=∑i =1n(x i -x )(y i -y )∑i =1n(x i -x )2,a ^=y -b ^x .参考数据:表中x 的5个值从左到右分别记为x 1,x 2,x 3,x 4,x 5,相应的y 值分别记为y 1,y 2,y 3,y 4,y 5,经计算有∑i =15(x i -x )(y i -y )=-19.2,其中x =15∑i =15x i ,y =15∑i =15y i .解析:(1)由x =30,y =0.4,∑i =15 (x i -x )(y i -y )=-19.2,∑i =15(x i -x )2=1 000,得b ^=∑i =1n(x i -x )(y i -y )∑i =15(x i -x )2=-0.019 2,a ^=y -b ^x =0.976,所以y 关于x 的回归直线方程为y =-0.019 2x +0.976. (2)能把保费x 定为5元.理由如下:若保费x 定为5元,则估计y =-0.019 2×5+0.976=0.88, 估计该手机厂商在这次活动中因销售该“手机碎屏险”产生的利润为 2 000 000×0.88×5-2 000 000×0.88×0.2%×2 000-1 000×1 000 =0.76×106(元)=76(万元)>70(万元), 所以能把保费x 定为5元.[题后悟通]1.求回归直线方程的方法(1)若所求的回归直线方程是在选择题中,常利用回归直线y ^=b ^x +a ^必经过样本点的中心(x ,y )快速选择.(2)若所求的回归直线方程是在解答题中,则求回归直线方程的一般步骤为:2.独立性检验的一般步骤(1)根据样本数据制成2×2列联表. (2)根据公式K 2=n (ad -bc )2(a +b )(c +d )(a +c )(b +d )(其中n =a +b +c +d )计算出K 2的观测值.(3)比较K 2的观测值与临界值的大小,作出统计推断.。
2023高考数学二轮专题复习与测试第一部分专题四微专题1概率与统计课件
专题四 概率与统计
类型一 统计 1.(2022·全国甲卷)某社区通过公益讲座以普及社区居民的垃圾分类知 识.为了解讲座效果,随机抽取 10 位社区居民,让他们在讲座前和讲座 后各回答一份垃圾分类知识问卷,这 10 位社区居民在讲座前和讲座后问 卷答题的正确率如图,则( )
专题四 概率与统计
14 种,故所求概率为1241=23.
故选 D.
答案:D
专题四 概率与统计
3.(2022·全国乙卷)某棋手与甲、乙、丙三位棋手各比赛一盘,各盘比赛 结果相互独立.已知该棋手与甲、乙、丙比赛获胜的概率分别为 p1,p2, p3,且 p3>p2>p1>0.记该棋手连胜两盘的概率为 p,则( ) A.p 与该棋手和甲、乙、丙的比赛次序无关 B.该棋手在第二盘与甲比赛,p 最大 C.该棋手在第二盘与乙比赛,p 最大 D.该棋手在第二盘与丙比赛,p 最大
5),(3,6),(4,5),(4,6),(5,6),共 15 种取法,其中抽到的 2 张卡片
上的数字之积是 4 的倍数有(1,4),(2,4),(2,6),(3,4),(4,5),(4,
6),共 6 种情况,则抽到的 2 张卡片上的数字之积是 4 的倍数的概率 P=
165=25;故选 C.
答案:C
专题四 概率与统计
2.(2022·新高考卷Ⅰ)从 2 至 8 的 7 个整数中随机取 2 个不同的数,则这 2
个数互质的概率为( )
A.16
B.13
1
2
C.2
D.3
解析:从 2 至 8 的 7 个整数中任取两个数共有 C27=21(种)方式,其中互质
的有:23,25,27,34,35,37,38,45,47,56,57,58,67,78,共
2021-2022年高考数学二轮复习第一部分专题四概率与统计教学案文
2021年高考数学二轮复习第一部分专题四概率与统计教学案文2.古典概型与几何概型(3年6考)图、样本数字特征等)有机地交融在一起,有时仅考查利用统计知识(特别是线性回归方程)解决实际问题,题型主要有:1.概率与用样本估计总体交汇问题2.回归分析与统计的交汇问题偶考点变量间的相关关系、统计案例偶考点独立性检验与统计的交汇问题考点(一) 主要考查用统计图表估计总体以及利用样本的数字特征估计总体,且以统计图表的考查为主.用样本估计总体平均最高气温和平均最低气温的雷达图.图中A点表示十月的平均最高气温约为15 ℃,B点表示四月的平均最低气温约为5 ℃.下面叙述不正确的是( )A.各月的平均最低气温都在0 ℃以上B.七月的平均温差比一月的平均温差大C.三月和十一月的平均最高气温基本相同D.平均最高气温高于20 ℃的月份有5个(2)为比较甲、乙两地某月14时的气温情况,随机选取该月中的5天,将这5天中14时的气温数据(单位:℃)制成如图所示的茎叶图.考虑以下结论:①甲地该月14时的平均气温低于乙地该月14时的平均气温;②甲地该月14时的平均气温高于乙地该月14时的平均气温;③甲地该月14时的气温的标准差小于乙地该月14时的气温的标准差;④甲地该月14时的气温的标准差大于乙地该月14时的气温的标准差.其中根据茎叶图能得到的统计结论的编号为( )A.①③ B.①④C.②③ D.②④(3)已知某地区中小学生人数和近视情况分别如图①和图②所示.为了解该地区中小学生的近视形成原因,用分层抽样的方法抽取2%的学生进行调查,则样本容量和抽取的高中生近视人数分别为( )A .100,10B .200,10C .100,20D .200,20[解析] (1)由图形可得各月的平均最低气温都在0 ℃以上,A 正确;七月的平均温差约为10 ℃,而一月的平均温差约为5 ℃,B 正确;三月和十一月的平均最高气温都在10 ℃左右,基本相同,C 正确;平均最高气温高于20℃的月份有2个,故D 错误.(2)∵x 甲=26+28+29+31+315=29,x 乙=28+29+30+31+325=30,∴x 甲<x 乙.又s 2甲=9+1+0+4+45=185,s 2乙=4+1+0+1+45=2,∴s 甲>s 乙.故可判断结论①④正确.(3)易知样本容量为(3 500+4 500+2 000)×2%=200;抽取的高中生人数为2 000×2%=40,由于其近视率为50%,所以近视的人数为40×50%=20.[答案] (1)D (2)B (3)D[方法技巧]1.方差的计算与含义(1)计算:计算方差首先要计算平均数,然后再按照方差的计算公式进行计算. (2)含义:方差是描述一个样本和总体的波动大小的特征数,方差大说明波动大. 2.与频率分布直方图有关问题的常见类型及解题策略(1)已知频率分布直方图中的部分数据,求其他数据.可根据频率分布直方图中的数据求出样本与整体的关系,利用频率和等于1就可以求出其他数据.(2)已知频率分布直方图,求某个范围内的数据.可利用图形及某范围结合求解.[演练冲关]1.(xx·全国卷Ⅲ)某城市为了解游客人数的变化规律,提高旅游服务质量,收集并整理了xx 年1月至xx 年12月期间月接待游客量(单位:万人)的数据,绘制了下面的折线图.根据该折线图,下列结论错误的是( ) A .月接待游客量逐月增加 B .年接待游客量逐年增加C .各年的月接待游客量高峰期大致在7,8月D .各年1月至6月的月接待游客量相对于7月至12月,波动性更小,变化比较平稳 解析:选A 根据折线图可知,xx 年8月到9月、xx 年10月到11月等月接待游客量都在减少,所以A 错误.由图可知,B 、C 、D 正确.2.(xx·山东高考)如图所示的茎叶图记录了甲、乙两组各5名工人某日的产量数据(单位:件).若这两组数据的中位数相等,且平均值也相等,则x 和y 的值分别为( )A .3,5B .5,5C .3,7D .5,7解析:选A 由两组数据的中位数相等可得65=60+y ,解得y =5,又它们的平均值相等,所以15×[56+62+65+74+(70+x )]=15×(59+61+67+65+78),解得x =3.3.某电子商务公司对10 000名网络购物者xx 年度的消费情况进行统计,发现消费金额(单位:万元)都在区间[0.3,0.9]内,其频率分布直方图如图所示.(1)直方图中的a =________;(2)在这些购物者中,消费金额在区间[0.5,0.9]内的购物者的人数为________.解析:(1)由0.1×1.5+0.1×2.5+0.1a +0.1×2.0+0.1×0.8+0.1×0.2=1,解得a =3. (2)区间[0.3,0.5)内的频率为0.1×1.5+0.1×2.5=0.4,故[0.5,0.9]内的频率为1-0.4=0.6.因此,消费金额在区间[0.5,0.9]内的购物者的人数为0.6×10 000=6 000. 答案:(1)3 (2)6 000考点(二)主要考查线性回归方程的求解及应[典例感悟][典例] (1)(xx·兰州诊断)已知某种商品的广告费支出x (单位:万元)与销售额y (单位:万元)之间有如下对应数据:根据表中提供的全部数据,用最小二乘法得出y 与x 的线性回归方程为y ^=6.5x +17.5,则表中m 的值为( )A .45B .50C .55D .60(2)(xx·南昌模拟)设某中学的高中女生体重y (单位:kg)与身高x (单位:cm)具有线性相关关系,根据样本数据(x i ,y i )(i =1,2,3,…,n ),用最小二乘法近似得到回归直线方程为y ^=0.85x -85.71,则下列结论中不正确的是( )A .y 与x 具有正线性相关关系B .回归直线过样本点的中心(x -,y -)C .若该中学某高中女生身高增加1 cm ,则其体重约增加0.85 kgD .若该中学某高中女生身高为160 cm ,则可断定其体重必为50.29 kg [解析] (1)x -=2+4+5+6+85=5,y -=30+40+50+m +705=190+m5.∵当x -=5时,y -=6.5×5+17.5=50, ∴190+m5=50,解得m =60. (2)因为回归直线方程y ^=0.85x -85.71中x 的系数为0.85>0,因此y 与x 具有正线性相关关系,所以选项A 正确;由最小二乘法及回归直线方程的求解可知回归直线过样本点的中心(x -,y -),所以选项B 正确;由于用最小二乘法得到的回归直线方程是估计值,而不是具体值,所以若该中学某高中女生身高增加1 cm ,则其体重约增加0.85 kg ,所以选项C 正确,选项D 不正确.[答案] (1)D (2)D[方法技巧]求回归直线方程的关键及实际应用(1)求回归直线方程的关键是正确理解b ^,a ^的计算公式和准确地求解.(2)在分析实际中两个变量的相关关系时,可根据样本数据作出散点图来确定两个变量之间是否具有相关关系,若具有线性相关关系,则可通过线性回归方程估计和预测变量的值.[演练冲关]1.(xx 届高三·湖北七市(州)联考)广告投入对商品的销售额有较大影响.某电商对连续5个年度的广告费x 和销售额y 进行统计,得到统计数据如表所示(单位:万元):由上表可得回归方程为y =10.2x +a ,据此模型,预测广告费为10万元时的销售额约为( ) A .101.2万元 B .108.8万元 C .111.2万元D .118.2万元解析:选C 根据统计数据表,可得x -=15×(2+3+4+5+6)=4,y -=15×(29+41+50+59+71)=50,而回归直线y ^=10.2x +a ^经过样本点的中心(4,50),∴50=10.2×4+a ^,解得a ^=9.2,∴回归方程为y ^=10.2x +9.2.当x =10时,y =10.2×10+9.2=111.2,故选C.2.(xx 届高三·湘中名校联考)利用独立性检验来考虑两个分类变量X 和Y 是否有关系时,通过查阅下表来确定“X 和Y 有关系”的可信度.如果k >3.841,那么有把握认为“X 和Y 有关系”的百分比为( )C .99.5%D .95%解析:选D 由表中数据可得,当k >3.841时,有0.05的机率说明这两个变量之间的关系是不可信的,即有1-0.05=0.95的机率,也就是有95%的把握认为变量之间有关系,故选D.[典例感悟][典例] (1)(xx·全国卷Ⅲ)小敏打开计算机时,忘记了开机密码的前两位,只记得第一位是M ,I ,N 中的一个字母,第二位是1,2,3,4,5中的一个数字,则小敏输入一次密码能够成功开机的概率是( )A.815B.18C.115D.130(2)(xx·全国卷Ⅰ)如图,正方形ABCD 内的图形来自中国古代的太极图.正方形内切圆中的黑色部分和白色部分关于正方形的中心成中心对称.在正方形内随机取一点,则此点取自黑色部分的概率是( )A.14 B.π8 C.12D.π4(3)(xx 届高三·湖北五市十校联考)在矩形ABCD 中,AD =1,AB =2AD ,在CD 上任取一点P ,△ABP 的最大边是AB 的概率为( )A.22B.32C.2-1D.3-1[解析] (1)∵Ω={(M,1),(M,2),(M,3),(M,4),(M,5),(I,1),(I,2),(I,3),(I,4),(I,5),(N,1),(N,2),(N,3),(N,4),(N,5)},∴事件总数有15种.∵正确的开机密码只有1种,∴P =115.(2)不妨设正方形的边长为2,则正方形的面积为4,正方形的内切圆的半径为1,面积为π.由题意,得S 黑=12S 圆=π2,故此点取自黑色部分的概率P =π24=π8.(3)分别以A ,B 为圆心,AB 的长为半径画弧,交CD 于P 1,P 2,则当P 在线段P 1P 2间运动时,能使得△ABP 的最大边是AB ,在Rt △P 2BC中,BP 2=2,BC =1,故CP 2=3,DP 2=2-3,同理CP 1=2-3,所以P 1P 2=2-(2-3)×2=23-2,所以P 1P 2CD=3-1,即△ABP 的最大边是AB的概率为3-1.[答案] (1)C (2)B (3)D[方法技巧]1.利用古典概型求概率的关键及注意点(1)正确求出基本事件总数和所求事件包含的基本事件总数. (2)对于较复杂的题目条件计数时要正确分类,分类时应不重不漏. 2.几何概型的适用条件及求解关键(1)当构成试验的结果的区域为长度、面积、体积、弧长、夹角等时,应考虑使用几何概型求解.(2)求解关键是寻找构成试验的全部结果的区域和事件发生的区域,有时需要设出变量,在坐标系中表示所需要的区域.[演练冲关]1.(xx 届高三·湘中名校联考)从集合A ={-2,-1,2}中随机选取一个数记为a ,从集合B ={-1,1,3}中随机选取一个数记为b ,则直线ax -y +b =0不经过第四象限的概率为( )A.29B.13C.49D.14解析:选A 从集合A ,B 中随机选取一个数后组合成的数对有(-2,-1),(-2,1),(-2,3),(-1,-1),(-1,1),(-1,3),(2,-1),(2,1),(2,3),共9对,要使直线ax -y +b =0不经过第四象限,则需a ≥0,b ≥0,共有2对满足,所以所求概率P =29,故选A.2.(xx·长春质检)如图,扇形AOB 的圆心角为120°,点P 在弦AB上,且AP =13AB ,延长OP 交弧AB 于点C ,现向扇形AOB 内投一点,则该点落在扇形AOC 内的概率为( )A.14B.13C.27D.38解析:选A 设OA =3,则AB =33,AP =3,由余弦定理可求得OP =3,则∠AOP =30°,所以扇形AOC 的面积为3π4,又扇形AOB 的面积为3π,从而所求概率为3π43π=14.3.(xx·全国卷Ⅱ)从分别写有1,2,3,4,5的5张卡片中随机抽取1张,放回后再随机抽取1张,则抽得的第一张卡片上的数大于第二张卡片上的数的概率为( )A.110 B.15 C.310 D.25解析:选D 记两次取得卡片上的数字依次为a ,b ,则一共有25个不同的数组(a ,b ),其中满足a >b 的数组共有10个,分别为(2,1),(3,1),(3,2),(4,1),(4,2),(4,3),(5,1),(5,2),(5,3),(5,4),因此所求的概率P =1025=25.4.(xx·天津高考)有5支彩笔(除颜色外无差别),颜色分别为红、黄、蓝、绿、紫.从这5支彩笔中任取2支不同颜色的彩笔,则取出的2支彩笔中含有红色彩笔的概率为( )A.45B.35C.25D.15解析:选C 从5支彩笔中任取2支不同颜色的彩笔,有10种不同取法:(红,黄),(红,蓝),(红,绿),(红,紫),(黄,蓝),(黄,绿),(黄,紫),(蓝,绿),(蓝,紫),(绿,紫).而取出的2支彩笔中含有红色彩笔的取法有(红,黄),(红,蓝),(红,绿),(红,紫),共4种,故所求概率P =410=25.5.(xx·江苏高考)记函数f (x )=6+x -x 2的定义域为D .在区间[-4,5]上随机取一个数x ,则x ∈D 的概率是________.解析:由6+x -x 2≥0,解得-2≤x ≤3,则D =[-2,3],则所求概率P =3--25--4=59.答案:59[必备知能·自主补缺] (一) 主干知识要记牢 1.概率的计算公式 (1)古典概型的概率计算公式P (A )=事件A 包含的基本事件数m基本事件总数n;(2)互斥事件的概率计算公式P (A ∪B )=P (A )+P (B );(3)对立事件的概率计算公式P (A )=1-P (A );(4)几何概型的概率计算公式P (A )=构成事件A 的区域长度面积或体积试验的全部结果所构成的区域长度面积或体积.2.抽样方法(1)三种抽样方法的比较 类别 共同点 各自特点 相互联系适用范围 简单随 机抽样是不放回抽样,抽样过程中,每从总体中逐个抽取总体中的个数较少系统 抽样个个体被抽到的机会(概率)相等将总体均分成几部分,按事先确定的规则,在各部分抽取 在起始部分抽样时,采用简单随机抽样总体中的个数比较多 分层 抽样 将总体分成几层,分层进行抽取各层抽样时,采用简单随机抽样或者系统抽样总体由差异明显的几部分组成(2)分层抽样中公式的运用①抽样比=样本容量个体总量=各层样本容量各层个体数量;②层1的数量∶层2的数量∶层3的数量=样本1的容量∶样本2的容量∶样本3的容量. 3.用样本数字特征估计总体 (1)众数、中位数、平均数定义特点众数在一组数据中出现次数最多的数据 体现了样本数据的最大集中点,不受极端值的影响,而且不唯一 中位数 将一组数据按大小顺序依次排列,处在最中间位置的一个数据(或最中间两个数据的平均数)中位数不受极端值的影响,仅利用了排在中间数据的信息,只有一个 平均数 样本数据的算术平均数与每一个样本数据有关,只有一个(2)方差和标准差方差和标准差反映了数据波动程度的大小. ①方差:s 2=1n[(x 1-x -)2+(x 2-x -)2+…+(x n -x -)2];②标准差:s =1n[x 1-x-2+x 2-x-2+…+x n -x-2] .(二) 二级结论要用好 1.频率分布直方图的3个结论 (1)小长方形的面积=组距×频率组距=频率. (2)各小长方形的面积之和等于1.(3)小长方形的高=频率组距,所有小长方形高的和为1组距.2.与平均数和方差有关的4个结论(1)若x 1,x 2,…,x n 的平均数为x -,那么mx 1+a ,mx 2+a ,…,mx n +a 的平均数为m x -+a ; (2)数据x 1,x 2,…,x n 与数据x ′1=x 1+a ,x ′2=x 2+a ,…,x ′n =x n +a 的方差相等,即数据经过平移后方差不变;(3)若x 1,x 2,…,x n 的方差为s 2,那么ax 1+b ,ax 2+b ,…,ax n +b 的方差为a 2s 2;(4)s 2=1n ∑i =1n (x i -x -)2=1n ∑i =1nx 2i -x -2,即各数平方的平均数减去平均数的平方.求s 2时,可根据题目的具体情况,结合题目给出的参考数据,灵活选用公式形式. 3.线性回归方程线性回归方程y ^=b ^x +a ^一定过样本点的中心(x ,y ).[针对练1] (xx 届高三·惠州调研)某车间为了规定工时定额,需要确定加工零件所花费的时间,为此进行了5次试验.根据收集到的数据(如下表):由最小二乘法求得回归方程y =0.67x +a ,则a 的值为________. 解析:因为x -=10+20+30+40+505=30,y -=62+68+75+81+895=75,所以回归直线一定过样本点的中心(30,75),将其代入y ^=0.67x +a ^,可得75=0.67×30+a ^,解得a ^=54.9. 答案:54.9(三) 易错易混要明了1.应用互斥事件的概率加法公式,一定要注意首先确定各事件是否彼此互斥,然后求出各事件分别发生的概率,再求和.2.正确区别互斥事件与对立事件的关系:对立事件是互斥事件,是互斥中的特殊情况,但互斥事件不一定是对立事件,“互斥”是“对立”的必要不充分条件.3.混淆频率分布条形图和频率分布直方图,误把频率分布直方图纵轴的几何意义当成频率,导致样本数据的频率求错.4.在求解几何概型的概率时,要注意分清几何概型的类别(体积型、面积型、长度型、角度型等).[针对练2] 一种小型电子游戏的主界面是半径为r 的圆,点击圆周上的点A 后,该点在圆周上随机转动,最后落在点B 处,当线段AB 的长不小于3r 时自动播放音乐,则一次转动能播放音乐的概率为________.解析:如图,当|AB |≥3r ,即点B 落在劣弧CC ′上时才能播放音乐.又劣弧CC ′所对应的圆心角为2π3,所以一次转动能播放音乐的概率为2π32π=13. 答案:13[课时跟踪检测]A 组——12+4提速练一、选择题1.(xx·南昌模拟)某校为了解学生学习的情况,采用分层抽样的方法从高一1 000人、高二1 200人、高三n 人中,抽取81人进行问卷调查.已知高二被抽取的人数为30,那么n =( )A .860B .720C .1 020D .1 040解析:选D 根据分层抽样方法,得 1 2001 000+1 200+n×81=30,解得n =1 040.2.(xx 届高三·西安八校联考)某班对八校联考成绩进行分析,利用随机数表法抽取样本时,先将60个同学按01,02,03,…,60进行编号,然后从随机数表第9行第5列的数开始向右读,则选出的第6个个体是( )(注:下表为随机数表的第8行和第9行)⎭⎪⎬⎪⎫63 01 63 78 59 16 95 55 67 19 98 10 5071 75 12 86 73 58 07 44 39 52 38 79第8行⎭⎪⎬⎪⎫33 21 12 34 29 78 64 56 07 82 52 42 0744 38 15 51 00 13 42 99 66 02 79 54第9行 A .07 B .25 C .42D .52解析:选D 依题意得,依次选出的个体分别为12,34,29,56,07,52,…因此选出的第6个个体是52,故选D.3.(xx·宝鸡质检)对一批产品的长度(单位:毫米)进行抽样检测,样本容量为200,如图为检测结果的频率分布直方图,根据产品标准,单件产品长度在区间[25,30)的为一等品,在区间[20,25)和[30,35)的为二等品,其余均为三等品,则该样本中三等品的件数为( )A .5B .7C .10D .50解析:选D 根据题中的频率分布直方图可知,三等品的频率为1-(0.050 0+0.062 5+0.037 5)×5=0.25,因此该样本中三等品的件数为200×0.25=50,故选D.4.(xx·全国卷Ⅱ)从区间[0,1]随机抽取2n 个数x 1,x 2,…,x n ,y 1,y 2,…,y n ,构成n 个数对(x 1,y 1),(x 2,y 2),…,(x n ,y n ),其中两数的平方和小于1的数对共有m 个,则用随机模拟的方法得到的圆周率π的近似值为( )A.4n mB.2nmC.4m nD.2m n解析:选C 因为x 1,x 2,…,x n ,y 1,y 2,…,y n 都在区间[0,1]内随机抽取,所以构成的n 个数对(x 1,y 1),(x 2,y 2),…,(x n ,y n )都在边长为1的正方形OABC 内(包括边界),如图所示.若两数的平方和小于1,则对应的数对在扇形OAC 内(不包括扇形圆弧上的点所对应的数对),故在扇形OAC 内的数对有m 个.用随机模拟的方法可得S 扇形S 正方形=m n ,即π4=m n,所以π=4mn.5.在一组样本数据(x 1,y 1),(x 2,y 2),…,(x n ,y n )(n ≥2,x 1,x 2,…,x n 不全相等)的散点图中,若所有样本点(x i ,y i )(i =1,2,…,n )都在直线y =12x +1上,则这组样本数据的样本相关系数为( )A .-1B .0 C.12D .1解析:选D 因为所有样本点都在直线y =12x +1上,所以这组样本数据完全正相关,故其相关系数为1.6.甲、乙两位歌手在“中国新歌声”选拔赛中,5次得分情况如图所示.记甲、乙两人的平均得分分别为x 甲,x 乙,则下列判断正确的是( )A.x 甲<x 乙,甲比乙成绩稳定B.x 甲<x 乙,乙比甲成绩稳定C.x 甲>x 乙,甲比乙成绩稳定D.x 甲>x 乙,乙比甲成绩稳定 解析:选B x 甲=76+77+88+90+945=85,x 乙=75+88+86+88+935=86,s 2甲=15[(76-85)2+(77-85)2+(88-85)2+(90-85)2+(94-85)2]=52,s 2乙=15[(75-86)2+(88-86)2+(86-86)2+(88-86)2+(93-86)2]=35.6,所以x 甲<x 乙,s 2甲>s 2乙,故乙比甲成绩稳定,故选B.7.(xx·洛阳统考)若θ∈[0,π],则sin ⎝ ⎛⎭⎪⎫θ+π3>12成立的概率为( )A.13B.12C.23D .1 解析:选B 依题意,当θ∈[0,π]时,θ+π3∈⎣⎢⎡⎦⎥⎤π3,4π3,由sin ⎝ ⎛⎭⎪⎫θ+π3>12得π3≤θ+π3<5π6,即0≤θ<π2.因此,所求的概率为π2π=12. 8.将一枚骰子先后抛掷两次,并记朝上的点数分别为m ,n ,m 为2或4时,m +n >5的概率为( )A.227 B.29 C.13 D.23解析:选D 依题意得,先后抛掷两次骰子所得的点数对(m ,n )为:(1,1),(1,2),(1,3),(1,4),(1,5),…,(6,5),(6,6),共有36组,其中当m =2或4时,相应的点数对(m ,n )共有12组.当m =2时,满足m +n >5,即n >3的点数对(m ,n )共有3组;当m =4时,满足m +n >5,即n >1的点数对(m ,n )共有5组,因此所求的概率为3+512=23.9.(xx·惠州调研)齐王与田忌赛马,田忌的上等马优于齐王的中等马,劣于齐王的上等马,田忌的中等马优于齐王的下等马,劣于齐王的中等马,田忌的下等马劣于齐王的下等马,现从双方的马匹中各随机选一匹进行一场比赛,则田忌的马获胜的概率为( )A.13B.14C.15D.16解析:选A 设田忌的上、中、下三个等次的马分别为A ,B ,C ,齐王的上、中、下三个等次的马分别为a ,b ,c ,从双方的马匹中各随机选一匹进行一场比赛的所有可能结果有Aa ,Ab ,Ac ,Ba ,Bb ,Bc ,Ca ,Cb ,Cc ,共9种,田忌马获胜有Ab ,Ac ,Bc ,共3种,所以田忌的马获胜的概率为13.10.(xx 届高三·西安八校联考)在平面区域{(x ,y )|0≤x ≤1,1≤y ≤2}内随机投入一点P ,则点P 的坐标(x ,y )满足y ≤2x 的概率为( )A.34B.23C.12D.14解析:选D 依题意得,不等式组⎩⎪⎨⎪⎧0≤x ≤1,1≤y ≤2表示的平面区域为如图所示的正方形ABCD 的内部(含边界),其面积为1×1=1,不等式组⎩⎪⎨⎪⎧0≤x ≤1,1≤y ≤2,y ≤2x表示的平面区域为图中阴影部分(含边界),其面积为12×12×1=14,因此所求的概率为14.11.(xx 届高三·广东五校联考)在区间[-1,1]上随机取一个数k ,使直线y =k (x +3)与圆x 2+y 2=1相交的概率为( )A.12B.13C.24D.23解析:选C 若直线y =k (x +3)与圆x 2+y 2=1相交,则圆心到直线的距离d =|3k |1+k2<1,解得-24<k <24,故在区间[-1,1]上随机取一个数k ,使直线y =k (x +3)与圆x 2+y 2=1相交的概率为P =222=24.12.已知样本(x 1,x 2,…,x n )的平均数为x ,样本(y 1,y 2,…,y m )的平均数为y (x ≠y ),若样本(x 1,x 2,…,x n ,y 1,y 2,…,y m )的平均数z =a x +(1-a )y ,其中0<a <12,则n ,m 的大小关系为( )A .n <mB .n >mC .n =mD .不能确定解析:选A 由题意可得,x =x 1+x 2+…+x nn,y =y 1+y 2+…+y mm,则z =x 1+x 2+…+x n +y 1+y 2+…+y m n +m =n n +m ·x 1+x 2+…+x n n +m n +m ·y 1+y 2+…+y mm =n n +m·x +mn +m ·y =a x +(1-a )y ,所以nn +m=a ,mn +m =1-a ,又0<a <12,所以0<n n +m <12<mn +m,故n <m .二、填空题13.(xx·石家庄质检)设样本数据x 1,x 2,…,x 2 017的方差是4,若y i =2x i -1(i =1,2,…,2 017),则y 1,y 2,…,y 2 017的方差为________.解析:设样本数据的平均数为x -,则y i =2x i -1的平均数为2x --1,则y 1,y 2,…,y 2 017的方差为12 017[(2x 1-1-2x -+1)2+(2x 2-1-2x -+1)2+…+(2x 2 017-1-2x -+1)2]=4×12 017[(x 1-x -)2+(x 2-x -)2+…+(x 2 017-x -)2]=4×4=16.答案:1614.(xx 届高三·广西三市联考)已知函数f (x )=log a x +log 1a 8(a >0,且a ≠1),在集合14,13,12,3,4,5,6,7中任取一个数a ,则f (3a +1)>f (2a )>0的概率为________. 解析:∵3a +1>2a ,f (3a +1)>f (2a ),f (x )=log a x -log a 8,∴a >1.又f (2a )>0,∴2a >8,即a >4,符合条件的a 的值为5,6,7,故所求概率为38.答案:3815.(xx·张掖模拟)在区间[0,π]上随机取一个数θ,则使2≤2sin θ+2cos θ≤2成立的概率为________.解析:由2≤2sin θ+2cos θ≤2,得22≤sin θ+π4≤1,结合θ∈[0,π],得满足条件的θ∈⎣⎢⎡⎦⎥⎤0,π2,∴使2≤2sin θ+2cos θ≤2成立的概率为π2π=12.答案:1216.甲、乙两人在5次综合测评中成绩的茎叶图如图所示,其中一个数字被污损,记甲、乙的平均成绩分别为x -甲,x -乙,则x -甲>x -乙的概率是________.解析:设污损处的数字为m ,由15(84+85+87+90+m +99)=15(86+87+91+92+94),得m=5,即当m =5时,甲、乙两人的平均成绩相等.m 的取值有0,1,2,3,…,9,共10种可能,其中,当m =6,7,8,9时,x -甲>x -乙,故所求概率为410=25.答案:25B 组——能力小题保分练1.(xx·成都模拟)两位同学约定下午5:30~6:00在图书馆见面,且他们5:30~6:00之间到达的时刻是等可能的,先到的同学须等待,若15分钟后还未见面便离开.则这两位同学能够见面的概率是( )A.1136 B.14 C.12 D.34解析:选D 如图所示,以5:30作为原点O ,建立平面直角坐标系,设两位同学到达的时刻分别为x ,y ,设事件A 表示两位同学能够见面,所构成的区域为A ={(x ,y )||x -y |≤15},即图中阴影部分,根据几何概型概率计算公式得P (A )=30×30-2×12×15×1530×30=34.2.(xx·广州模拟)四个人围坐在一张圆桌旁,每个人面前放着一枚完全相同的硬币,所有人同时抛出自己的硬币.若硬币正面朝上,则这个人站起来;若硬币正面朝下,则这个人继续坐着.那么没有相邻的两个人站起来的概率为( )A.14B.716C.12D.916解析:选B 四个人按顺序围成一桌,同时抛出自己的硬币抛出的硬币正面记为0,反面记为1,则总的基本事件为(0,0,0,0),(0,0,0,1),(0,0,1,0),(0,0,1,1),(0,1,0,0),(0,1,0,1),(0,1,1,0),(0,1,1,1),(1,0,0,0),(1,0,0,1),(1,0,1,0),(1,0,1,1),(1,1,0,0)(1,1,0,1),(1,1,1,0),(1,1,1,1),共有16种情况.若四个人同时坐着,有1种情况;若三个人坐着,一个人站着,有4种情况;若两个人坐着,两个人站着,此时没有相邻的两个人站起来有2种情况.所以没有相邻的两个人站起来的情况共有1+4+2=7种,故所求概率为716.3.一个样本容量为10的样本数据,它们组成一个公差不为0的等差数列{a n },若a 3=8,且a 1,a 3,a 7成等比数列,则此样本的平均数和中位数分别是( )A .13,12B .13,13C .12,13D .13,14解析:选B 设等差数列{a n }的公差为d (d ≠0),a 3=8,a 1a 7=a 23=64,即(8-2d )(8+4d )=64,又d ≠0,所以d =2,故样本数据为:4,6,8,10,12,14,16,18,20,22,平均数为S 1010=4+22×510=13,中位数为12+142=13.4.根据如下样本数据:x 3 4 5 6 7y4.0a -5.4 -0.50.5b -0.6得到的回归方程为y =bx +a .若样本点的中心为(5,0.9),则当x 每增加1个单位时,y 就( )A .增加1.4个单位B .减少1.4个单位C .增加7.9个单位D .减少7.9个单位解析:选B 依题意得,4.0+a -5.4-0.5+0.5+b -0.65=0.9,故a +b =6.5;①又样本点的中心为(5,0.9),故0.9=5b +a ,②联立①②,解得b =-1.4,a =7.9,则y ^=-1.4x +7.9, 所以当x 每增加1个单位时,y 就减少1.4个单位.5.正六边形ABCDEF 的边长为1,在正六边形内随机取点M ,则使△MAB 的面积大于34的概率为________.解析:如图所示,作出正六边形ABCDEF ,其中心为O ,过点O 作OG ⊥AB ,垂足为G ,则OG 的长为中心O 到AB 边的距离.易知∠AOB =360°6=60°,且OA =OB ,所以△AOB 是等边三角形,所以OA =OB =AB =1,OG=OA ·sin 60°=1×32=32,即对角线CF 上的点到AB 的距离都为32. 设△MAB 中AB 边上的高为h ,则由S △MAB =12×1×h >34,解得h >32.所以要使△MAB 的面积大于34,只需满足h >32,即需使M 位于CF 的上方.故由几何概型得,△MAB 的面积大于34的概率P =S 梯形CDEF S 正六边形ABCDEF =12. 答案:126.某班运动队由足球运动员18人、篮球运动员12人、乒乓球运动员6人组成(每人只参加一项),现从这些运动员中抽取一个容量为n 的样本,若分别采用系统抽样法和分层抽样法,则都不用剔除个体;当样本容量为n +1时,若采用系统抽样法,则需要剔除1个个体,那么样本容量n 为________.解析:总体容量为6+12+18=36.当样本容量为n 时,由题意可知,系统抽样的抽样距为36n,分层抽样的抽样比是n 36,则采用分层抽样法抽取的乒乓球运动员人数为6×n 36=n6,篮球运动员人数为12×n 36=n 3,足球运动员人数为18×n 36=n2,可知n 应是6的倍数,36的约数,故n =6,12,18.当样本容量为n +1时,剔除1个个体,此时总体容量为35,系统抽样的抽样距为35n +1,因为35n +1必须是整数,所以n 只能取6,即样本容量n 为6.答案:6第二讲 大题考法——概率与统计题型(一)主要考查随机事件的概率、古典概型、频率分布直方图、茎叶图等的应用.概率与用样本估计总体的交汇问题[典例感悟][典例1] (xx·全国卷Ⅰ)某公司计划购买1台机器,该种机器使用三年后即被淘汰.机器有一易损零件,在购进机器时,可以额外购买这种零件作为备件,每个200元.在机器使用期间,如果备件不足再购买,则每个500元.现需决策在购买机器时应同时购买几个易损零件,为此搜集并整理了100台这种机器在三年使用期内更换的易损零件数,得下面柱状图:记x 表示1台机器在三年使用期内需更换的易损零件数,y 表示1台机器在购买易损零件上所需的费用(单位:元),n 表示购机的同时购买的易损零件数.(1)若n =19,求y 与x 的函数解析式;(2)若要求“需更换的易损零件数不大于n ”的频率不小于0.5,求n 的最小值;(3)假设这100台机器在购机的同时每台都购买19个易损零件,或每台都购买20个易损零件,分别计算这100台机器在购买易损零件上所需费用的平均数,以此作为决策依据,购买1台机器的同时应购买19个还是20个易损零件?[解] (1)当x ≤19时,y =3 800;当x >19时,y =3 800+500(x -19)=500x -5 700,所以y 与x 的函数解析式为y =⎩⎪⎨⎪⎧3 800,x ≤19,500x -5 700,x >19,(x ∈N).(2)由柱状图知,需更换的零件数不大于18的频率为0.46,不大于19的频率为0.7,故n 的最小值为19.(3)若每台机器在购机同时都购买19个易损零件,则这100台机器中有70台在购买易损零件上的费用为3 800(元),20台的费用为4 300(元),10台的费用为4 800(元),因此这100台机器在购买易损零件上所需费用的平均数为1100(3 800×70+4 300×20+4 800×10)=4 000(元).若每台机器在购机同时都购买20个易损零件,则这100台机器中有90台在购买易损零件上的费用为4 000(元),10台的费用为4 500(元),因此这100台机器在购买易损零件上所需费用的平均数为1100(4 000×90+4 500×10)=4 050(元).比较两个平均数可知,购买1台机器的同时应购买19个易损零件.[备课札记]。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
地块中用简单随机抽样的方法抽取 20 个作为样区,调查得到样本数据(xi,yi)(i=1,
2,…,20),其中 xi 和 yi 分别表示第 i 个样区的植物覆盖面积(单位:公顷)和这种野
20
20
20
生动物的数量,并计算得∑ i=1xi=60,i∑=1yi=1
200,∑ i=1
(xi--x)2=80,i∑2=01
考点整合 1.抽样方法
抽样方法包括简单随机抽样、分层抽样,两种抽样方法都是等概率抽样,体现了抽 样的公平性,但又各有其特点和适用范围. 2.统计中的四个数据特征 (1)众数:在样本数据中,出现次数最多的那个数据. (2)中位数:在样本数据中,将数据按大小顺序排列,位于最中间的数据.如果数据 的个数为偶数,就取中间两个数据的平均数作为中位数.
得该样方法,
并说明理由. 附:相关系数 r=
∑ i=n∑i=1n1((xix-i--x-)x)2∑ i(=n1 y(i-y-yi-)-y)2, 2≈1.414.
解 (1)由已知得样本平均数-y=210∑ i2=01yi=60,从而该地区这种野生动物数量的估计值
4.回归分析与独立性检验 (1)回归直线y^=b^ x+a^ 经过样本点的中心(-x,-y),若 x 取某一个值代入回归直线方程y^ =b^ x+a^ 中,可求出 y 的估计值.
(2)独立性检验 对于取值分别是{x1,x2}和{y1,y2}的分类变量 X 和 Y,其样本频数列联表是:
x1 x2 总计
A.中位数
B.平均数
C.方差
D.极差
解析 中位数是将9个数据从小到大或从大到小排列后,处于中间位置的数据,因
而去掉1个最高分和1个最低分,中位数是不变的,平均数、方差、极差均受影响.
答案 A
2.(2020·全国Ⅲ卷)在一组样本数据中,1,2,3,4 出现的频率分别为 p1,p2,p3,p4,
4
且∑ i=1pi=1,则下面四种情形中,对应样本的标准差最大的一组是( ) A.p1=p4=0.1,p2=p3=0.4 B.p1=p4=0.4,p2=p3=0.1 C.p1=p4=0.2,p2=p3=0.3 D.p1=p4=0.3,p2=p3=0.2
解析 X 的可能取值为 1,2,3,4,四种情形的数学期望 E(X)=1×p1+2×p2+3×p3 +4×p4 都为 2.5,方差 D(X)=[1-E(X)]2×p1+[2-E(X)]2×p2+[3-E(X)]2×p3+[4 -E(X)]2×p4,标准差为 D(X).A 选项的方差 D(X)=0.65;B 选项的方差 D(X)= 1.85;C 选项的方差 D(X)=1.05;D 选项的方差 D(X)=1.45.可知选项 B 的情形对应 样本的标准差最大.故选 B. 答案 B
为 60×200=12 000.
(2)样本(xi,yi)(i=1,2,…,20)的相关系数 r=
20
∑
i=1
(xi--x)(yi--y)
20
∑
i=1
(xi--x)2∑ i2=01
(yi--y)2
=
800 80×9
=2 000
3
2≈0.94.
(3)分层抽样:根据植物覆盖面积的大小对地块分层,再对200个地块进行分层抽样. 理由如下:由(2)知各样区的这种野生动物数量与植物覆盖面积有很强的正相关性. 由于各地块间植物覆盖面积差异很大,从而各地块间这种野生动物数量差异也很 大,采用分层抽样的方法较好地保持了样本结构与总体结构的一致性,提高了样 本的代表性,从而可以获得该地区这种野生动物数量更准确的估计.
(yi--y)2=9 000,
20
∑
i=1
(xi--x)(yi--y)=800.
(1)求该地区这种野生动物数量的估计值(这种野生动物数量的估计值等于样区这种
野生动物数量的平均数乘以地块数);
(2)求样本(xi,yi)(i=1,2,…,20)的相关系数(精确到0.01); (3)根据现有统计资料,各地块间植物覆盖面积差异很大.为提高样本的代表性以获
(3)平均数:样本数据的算术平均数,即-x=1n(x1+x2+…+xn). (4)方差与标准差. s2=1n[(x1--x)2+(x2--x)2+…+(xn--x)2], s= 1n[(x1--x)2+(x2--x)2+…+(xn--x)2].
3.直方图的两个结论 (1)小长方形的面积=组距×频 组率 距=频率. (2)各小长方形的面积之和等于 1.
A.10
B.18
C.20
D.36
解析 因为直径落在区间[5.43,5.47)内的频率为0.02×(6.25+5.00)=0.225,所以 个数为0.225×80=18.故选B. 答案 B
4.(2020·全国Ⅱ卷)某沙漠地区经过治理,生态系统得到很大改善,野生动物数量有所
增加.为调查该地区某种野生动物的数量,将其分成面积相近的 200 个地块,从这些
3.(2020·天津卷)从一批零件中抽取80个,测量其直径(单位:mm),将所得数据分为9 组:[5.31,5.33),[5.33,5.35),…,[5.45,5.47),[5.47,5.49],并整理得到如下 频 率 分 布 直 方 图 , 则 在 被 抽 取 的 零 件 中 , 直 径 落 在 区 间 [5.43 , 5.47) 内 的 个 数 为 ()
第1讲 统计与统计案例
高考定位 1.抽样方法、样本的数字特征、统计图表、回归分析与独立性检验主要 以选择题、填空题形式命题,难度较小;2.注重知识的交汇渗透,统计与概率、回 归分析与概率是近年命题的热点,2018年、2019年和2020年在解答题中均有考查.
真题感悟
1.(2019·全国Ⅱ卷)演讲比赛共有9位评委分别给出某选手的原始评分,评定该选手的 成绩时,从9个原始评分中去掉1个最高分、1个最低分,得到7个有效评分.7个有效 评分与9个原始评分相比,不变的数字特征是( )
y1 a c a+c
y2 b d b+d
总计 a+b c+d
n
则 K2=(a+b)(cn+(da)d-(bac+)c2)(b+d)(其中 n=a+b+c+d 为样本容量).
热点一 抽样方法