2020版高考数学高考必考题突破讲座6概率与统计的综合问题课时达标文(含解析)新人教A版
2020高考解突破(六)概率与统计

2020高考解答题突破(六)概率与统计突破“两辨”——辨析、辨型[思维流程][技法点拨]概率与统计问题的求解关键是辨别它的模型,只要找到模型,问题便迎刃而解.而概率模型的提取往往需要经过观察、分析、归纳、判断等复杂的辨析思维过程,常常因题设条件理解不准,某个概念认识不清而误入歧途.另外,还需弄清楚概率模型中等可能事件、互斥事件、对立事件等事件间的关系,注意放回和不放回试验的区别,合理划分复合事件.考向一古典概型的概率认真阅读题目,收集各种信息,理解题意.判断试验为古典概型后用字母表示所求事件,利用列举法求出总的基本事件个数及所求事件中包含的基本事件个数,代入公式求解.[解题指导]列举基本事件并确定总数―→确定所求事件个数―→代入古典概型公式求概率[解](1)由题意知,(a,b,c)所有的可能为(1,1,1),(1,1,2),(1,1,3),(1,2,1),(1,2,2),(1,2,3),(1,3,1),(1,3,2),(1,3,3),(2,1,1),(2,1,2),(2,1,3),(2,2,1),(2,2,2),(2,2,3),(2,3,1),(2,3,2),(2,3,3),(3,1,1),(3,1,2),(3,1,3),(3,2,1),(3,2,2),(3,2,3),(3,3,1),(3,3,2),(3,3,3),共27种.古典概型概率问题的关注点求古典概型的概率,关键利用列举法求解基本事件数,求解时要避免“重”和“漏”.要做到正确理解题意,明确一些常见的关键词,如“至多”“至少”“只有”等,还要熟练使用常用的列举方法,如表格法,树图法等.只有有规律地列举基本事件,才能避免“重”和“漏”.[对点训练]1.某校拟从高二年级2名文科生和4名理科生中选出4名同学代表学校参加知识竞赛,其中每个人被选中的可能性均相等.(1)求被选中的4名同学中恰有2名文科生的概率;(2)求被选中的4名同学中至少有1名文科生的概率.[解]将2名文科生和4名理科生依次编号为1,2,3,4,5,6,从2名文科生和4名理科生中选出4名同学记为(a,b,c,d),其结果有(1,2,3,4),(1,2,3,5),(1,2,3,6),(1,2,4,5),(1,2,4,6),(1,2,5,6),(1,3,4,5),(1,3,4,6),(1,3,5,6),(1,4,5,6),(2,3,4,5),(2,3,4,6),(2,3,5,6),(2,4,5,6),(3,4,5,6),共15种.(1)被选中的4名同学中恰有2名文科生的结果有(1,2,3,4),(1,2,3,5),(1,2,3,6),(1,2,4,5),(1,2,4,6),(1,2,5,6),共6种.记“被选中的4名同学中恰有2名文科生”为事件A,则P(A)=615=25.(2)记“被选中的4名同学中至少有1名文科生”为事件B,则事件B包含有1名文科生或者2名文科生这两种情况.其对立事件B为“被选中的4名同学中没有文科生”.只有一种结果(3,4,5,6).因为P(B)=1 15,所以P(B)=1-P(B)=1-115=1415.考向二线性回归分析与独立性检验1.在分析两个变量的相关关系时,可根据样本数据作出散点图来确定两个变量之间是否具有相关关系,若具有线性相关关系,则可通过线性回归方程估计和预测变量的值.2.独立性检验的关键是根据2×2列联表准确计算出K2,再做判断.[解题指导]理解图表信息→计算公式中的相关数据→确定回归方程→作出预测[解](1)从特征量y的5次试验数据中随机抽取两个数据的情况有{601,605},{601,597},{601,599},{601,598},{605,597},{605,599},{605,598},{597,599},{597,598},{599,598}.共10种;其中两个数据都不大于600的情况有{597,599},{597,598},{599,598},共3种.记“至少有一个大于600”为事件A,故特征量x为570时,特征量y的估计值为604.2.线性回归分析与独立性检验问题的关注点(1)由回归方程分析得出的数据只是预测值不是精确值,此类问题的易错点是方程中b^的计算,代入公式计算要细心.(2)独立性检验是指利用2×2列联表,通过计算随机变量K2来确定在多大程度上两个分类变量有关系的方法.[对点训练]2.(2018·东北三校联考)为了研究使用淡化海砂与混凝土耐久性是否达标有关,某大学实验室随机抽取了60个样本,得到了相关数据如下表:(1)根据表中数据,求出s,t的值,利用独立性检验的方法判断,能否在犯错误的概率不超过1%的前提下认为使用淡化海砂与混凝土耐久性是否达标有关?(2)若用分层抽样的方法在使用淡化海砂的样本中抽取了6个,现从这6个样本中任取2个,则取出的2个样本混凝土耐久性都达标的概率是多少?参考数据:P(K2≥k0)0.100.0500.0250.0100.001 k0 2.706 3.841 5.024 6.63510.828参考公式:K2=n ad-bc2a+b c+d a+c b+d.[解](1)s=30-15=15,t=30-25=5.由已知数据可求得K2=60×25×15-15×5230×30×40×20=7.5>6.635.因此,能在犯错误的概率不超过1%的前提下,认为使用淡化海砂与混凝土耐久性是否达标有关.(2)用分层抽样的方法在使用淡化海砂的样本中抽取了 6个,其中应抽取“混凝土耐久性达标”的个数为2530×6=5.“混凝土耐久性不达标”的个数为 1.“混凝土耐久性达标”的记为A1,A2,A3,A4,A5,“混凝土耐久性不达标”的记为B.从这6个样本中任取2个,共有15种可能.设“取出的2个样本混凝土耐久性都达标”为事件A,它的对立事件A-为“取出的2个样本至少有一个混凝土耐久性不达标”,包含(A1,B),(A2,B),(A3,B),(A4,B),(A5,B),共5种可能,所以P(A)=1-P(A-)=1-515=23.故取出的2个样本混凝土耐久性都达标的概率是23.专题跟踪训练(三十)1.某中学调查了某班全部45名同学参加书法社团和演讲社团的情况,数据如下表:(单位:人)参加书法社团未参加书法社团参加演讲社团8 5未参加演讲社团230(1)从该班随机选1名同学,求该同学至少参加上述一个社团的概率;(2)在既参加书法社团又参加演讲社团的8名同学中,有5名男同学A1,A2,A3,A4,A5,3名女同学B1,B2,B3.现从这5名男同学和3名女同学中各随机选1人,求A1被选中且B1未被选中的概率.[解](1)记“该同学至少参加上述一个社团为事件A”,则P(A)=8+2+545=13.所以该同学至少参加上述一个社团的概率为1 3.(2)从5名男同学和3名女同学中各随机选1人的基本事件有:(A1,B1),(A1,B2),(A1,B3),(A2,B1),(A2,B2),(A2,B3),(A3,B1),(A3,B2),(A3,B3),(A4,B1),(A4,B2),(A4,B3),(A5,B1),(A5,B2),(A5,B3)共15个.根据题意,这些基本事件的出现是等可能的.其中A1被选中且B1未被选中的基本事件有(A1,B2),(A1,B3)共2个,所以A1被选中且B1未被选中的概率为P=2 15.2.(2018·安徽合肥模拟)某职称晋级评定机构对参加某次专业技术考试的100人的成绩进行了统计,绘制的频率分布直方图如图所示.规定80分以上者晋级成功,否则晋级失败(满分为100分).(1)求图中a的值;(2)估计该次考试的平均分x-(同一组中的数据用该组的区间中点值代表);(3)根据已知条件完成下面2×2列联表,并判断能否有85%的把握认为“晋级成功”与性别有关.晋级成功晋级失败合计男16女50合计参考公式:K2=n ad-bc2a+b c+d a+c b+d,其中n=a+b+c+dP(K2≥k)0.400.250.150.100.050.025k 0.780 1.323 2.072 2.706 3.841 5.024 [解](1)由频率分布直方图中各小长方形面积总和为1,得(2a +0.020+0.030+0.040)×10=1,解得a=0.005.(2)由频率分布直方图知各小组的中点值依次是55,65,75,85,95,对应的频率分布为0.05,0.30,0.40,0.20,0.05,则估计该次考试的平均分为x-=55×0.05+65×0.3+75×0.4+85×0.2+95×0.05=74(分).(3)由频率分布直方图知,晋级成功的频率为0.2+0.05=0.25,故晋级成功的人数为100×0.25=25,填写2×2列联表如下:晋级成功晋级失败合计男163450女94150合计2575100K2=n ad-bc2a+b c+d a+c b+d=100×16×41-34×9225×75×50×50≈2.613>2.072,所以有85%的把握认为“晋级成功”与性别有关.3.某险种的基本保费为a(单位:元),继续购买该险种的投保人称为续保人,续保人本年度的保费与其上年度出险次数的关联如下:随机调查了该险种的200名续保人在一年内的出险情况,得到如下统计表:出险次数01234≥5频数605030302010(1)记A为事件“一续保人本年度的保费不高于基本保费”.求P(A)的估计值;(2)记B为事件“一续保人本年度的保费高于基本保费但不高于基本保费的160%”.求P(B)的估计值;(3)求续保人本年度平均保费的估计值.[解](1)事件A发生当且仅当一年内出险次数小于 2.由所给数据知,一年内出险次数小于2的频率为60+50200=0.55,故P(A)的估计值为0.55.(2)事件B发生当且仅当一年内出险次数大于1且小于4.由所给数据知,一年内出险次数大于1且小于4的概率为30+30 200=0.3,故P(B)的估计值为0.3.(3)由所给数据得保费0.85a a 1.25a 1.5a 1.75a 2a频率0.300.250.150.150.100.05调查的200名续保人的平均保费为0.85a ×0.30+a ×0.25+1.25a ×0.15+1.5a ×0.15+1.75a ×0.10+2a ×0.05=1.1925a.因此,续保人本年度平均保费的估计值为1.1925a.4.已知鸡的产蛋量与鸡舍的温度有关.为了确定某一个时段鸡舍的控制温度,某企业需要了解鸡舍的时段控制温度x(单位:℃)对某种鸡的时段产蛋量y(单位:t)和时段投入成本z(单位:万元)的影响.为此,该企业选取了7个鸡舍的时段控制温度x i 和产蛋量y i (i =1,2,…7,)的数据,对数据初步处理后得到了如图所示的散点图及一些统计量的值.x -y -k-i =17(x i -x -)2i =17(k i -k -)2i =17(x i -x -)(y i -y -)i =17(x i -x -)(k i -k -) 17.4082.30 3.60140.009.702935.1035.00其中k i =lny i ,k -=17i =17k i . (1)根据散点图判断,y =bx +a 与y =c 1ec 2x(e 为自然对数的底数)哪一个适宜作为该种鸡的时段产蛋量y 关于鸡舍的时段控制温度x 的回归方程类型?(给出判断即可,不必说明理由)(2)根据(1)的判断及表中的数据,建立y关于x的回归方程;(3)已知时段投入成本z与x,y的关系为z=e-2.5y-0.1x+10,当鸡舍的时段控制温度为28 ℃时,鸡的时段产蛋量及时段投入成本的预报值是多少?附:对于一组具有线性相关关系的数据(u1,v1),(u2,v2),…,(u n,v n),其回归直线v=βu+α的斜率和截距的最小二乘估计分别为β^=i=1nu i-u-v i-v-i=1nu i-u-2,α^=v--β^u-.参考数据:e-2.5e-0.75e e3e70.080.47 2.7220.091096.63[解](1)由题中散点图可以判断,y=c1ec2x适宜作为该种鸡的时段产蛋量y关于鸡舍的时段控制温度x的回归方程类型.(2)令k=lny,建立k关于x的线性回归方程k=dx+c(d=c2,c=lnc1).由题意,得d^=i=17x i-x-k i-k-i=17x i-x-2=35.00140.00=0.25,c^=k--d^x-=3.60-0.25×17.40=-0.75,所以k关于x的线性回归方程为k^=0.25x-0.75,c2=0.25,c1=e -0.75=0.47,故y关于x的回归方程为y^=0.47e0.25x.(3)由(2)知,当x=28时,鸡的时段产蛋量y的预报值y^=0.47e0.25×28=0.47e7=0.47×1096.63≈515.42(t),时段投入成本z的预报值z^=e-2.5×515.42-0.1×28+10=0.08×515.42-2.8+10≈48.43(万元).。
2020版高考数学大二轮专题突破文科通用版课件:6.2.2 统计与概率

受.现从这6人中随机抽取2人接受采访.
-11-
考向一 考向二 考向三 考向四
员工 项目 子女教育 继续教育 大病医疗 住房贷款利息 住房租金 赡养老人
ABCDEF
○ ○ ×○ ×○ ××○ × ○ ○ ×××○ ×× ○ ○ ×× ○ ○ ××○ × ×× ○ ○ ×× ×○
-20-
考向一 考向二 考向三 考向四
解 (1)第1组的频数为100×0.100=10人,所以①处应填的数为100(10+20+20+10)=40,从而第2组的频数为14000 =0.400,因此②处应填
的数为1-(0.100+0.400+0.200+0.100)=0.200. 频率分布直方图如图所示.
(2)①从已知的6人中随机抽取2人的所有可能结果为
{A,B},{A,C},{A,D},{A,E},{A,F},{B,C},{B,D},{B,E},{B,F},{C,D},{ C,E},{C,F},{D,E},{D,F},{E,F},共15种.
②由表格知,符合题意的所有可能结果为
{A,B},{A,D},{A,E},{A,F},{B,D},{B,E},{B,F},{C,E},{C,F},{D,F},{E ,F},共11种. 所以,事件 M 发生的概率 P(M)=1115.
(2)估计该家庭使用节水龙头后,日用水量小于0.35 m3的概率; (3)估计该家庭使用节水龙头后,一年能节省多少水?(一年按365 天计算,同一组中的数据以这组数据所在区间中点的值作代-8- 表.)
考向一 考向二
解 (1)
考向三
考向四
2020版高考数学大一轮复习高考必考题突破讲座6概率与统计的综合问题课件理新人教A版

【例 2】(2018·北京卷)电影公司随机收集了电影的有关数 据,经分类整理得到下表: 电影类型 第一类 第二类 第三类 第四类 第五类 第六类 电影部数 140 50 300 200 800 510
好评率 0.4 0.2 0.15 0.25 0.2 0.1 好评率是指:一类电影中获得好评的部数与该类电影总部
解析 (1)设“从电影公司收集的电影中随机选取 1 部,这
部电影是获得好评的第四类电影”为事件 A.
因为第四类电影中获得好评的电影有 200×0.25=50(部),
所以
P(A)
=
50 140+50+300+200+800+510
=
2
50 000
=
0.025.
(2)设“从第四类电影和第五类电影中各随机选取 1 部,恰
个红灯的概率.
解析 (1)随机变量 X 的所有可能取值为 0,1,2,3. P(X=0)=1-21×1-31×1-41=14, P(X=1)=12×1-31×1-41+1-21×13×1-41+1-21 ×1-31×14=2114, P(X=2)=1-21×13×14+12×1-31×14+12×13×1-41= 14,
素养解读 本题考查统计中的概率计算、随机变量的方差计算,考查 运算求解能力,体现了数据分析、数学运算等核心素养.试题 难度:中.
【突破训练 2】 (2017·全国卷Ⅲ)某超市计划按月订购一种
Hale Waihona Puke 酸奶,每天进货量相同,进货成本每瓶 4 元,售价每瓶 6 元,
未售出的酸奶降价处理,以每瓶 2 元的价格当天全部处理完.根
【例 3】 (2017·全国卷Ⅱ)海水养殖场进行某水产品的新、 旧网箱养殖方法的产量对比,收获时各随机抽取了 100 个网 箱,测量各箱水产品的产量(单位:kg),其频率分布直方图如 下.
2020版高考数学一轮复习高考大题增分课6概率与统计中的高考热点问题教学案理含解析北师大版

高考大题增分课六 概率与统计中的高考热点问题[命题解读] 1.概率与统计是高考中相对独立的一个内容,处理问题的方式、方法体现了较高的思维含量.该类问题以应用题为载体,注重考查应用意识及阅读理解能力、分类讨论与化归转化能力.2.概率问题的核心是概率计算,其中事件的互斥、对立、独立是概率计算的核心,排列组合是进行概率计算的工具,统计问题的核心是样本数据的获得及分析方法,重点是频率分布直方图、茎叶图和样本的数字特征,但近两年全国卷突出回归分析与独立性检验的考查.3.离散型随机变量的分布列及其均值的考查是历年高考的重点,难度多为中档类题目,特别是与统计内容渗透,背景新颖,充分体现了概率与统计的工具性和交汇性.统计与统计案例以实际生活中的事例为背景,通过对相关数据的统计分析、抽象概括,作出估计、判断,常与抽样方法、茎叶图、频率分布直方图、概率等知识交汇考查,考查数据处理能力,分析问题、解决问题的能力.【例1】 (2018·全国卷Ⅱ)如图是某地区2000年至2016年环境基础设施投资额y(单位:亿元)的折线图.为了预测该地区2018年的环境基础设施投资额,建立了y与时间变量t的两个线性回归模型.根据2000年至2016年的数据(时间变量t的值依次为1,2,…,17)建立模型①:y=-30.4+13.5t;根据2010年至2016年的数据(时间变量t的值依次为1,2,…,7)建立模型②:y=99+17.5t.(1)分别利用这两个模型,求该地区2018年的环境基础设施投资额的预测值;(2)你认为用哪个模型得到的预测值更可靠?并说明理由.[解] (1)利用模型①,该地区2018年的环境基础设施投资额的预测值为y=-30.4+13.5×19=226.1(亿元).利用模型②,该地区2018年的环境基础设施投资额的预测值为y=99+17.5×9=256.5(亿元).(2)利用模型②得到的预测值更可靠.理由如下:(ⅰ)从折线图可以看出,2000年至2016年的数据对应的点没有随机散布在直线y=-30.4+13.5t上下,这说明利用2000年至2016年的数据建立的线性模型①不能很好地描述环境基础设施投资额的变化趋势.2010年相对2009年的环境基础设施投资额有明显增加,2010年至2016年的数据对应的点位于一条直线的附近,这说明从2010年开始环境基础设施投资额的变化规律呈线性增长趋势,利用2010年至2016年的数据建立的线性模型y=99+17.5t可以较好地描述2010年以后的环境基础设施投资额的变化趋势,因此利用模型②得到的预测值更可靠.(ⅱ)从计算结果看,相对于2016年的环境基础设施投资额220亿元,由模型①得到的预测值226.1亿元的增幅明显偏低,而利用模型②得到的预测值的增幅比较合理,说明利用模型②得到的预测值更可靠.(以上给出了2种理由,答出其中任意一种或其他合理理由均可)[律方规法] 1.在求两变量相关系数和两变量的回归方程时,由于r和b的公式组成比较复杂,求它们的值计算量比较大,为了计算准确,可将其分成几个部分分别计算,这样等同于分散难点,各个攻破,提高了计算的准确度.2.有关独立性检验的问题的解题步骤:(1)作出2×2列联表;(2)计算随机变量K2的值;(3)查临界值,检验作答.科技扶贫是精准扶贫的一项重要措施,某科研机构将自己研发的一项葡萄种植技术提供给某山区果农.为验证该技术的效果,该果农选择40株葡萄树进行试验,其中20株不进行任何处理,记为对照组,另外20株采用新技术培养,记为实验组.葡萄成熟收割后,该果农统计了这40株葡萄树的年产量数据(单位:kg).对照1215212326243535343251524946435344616343 组实验2332343642415159464343455267656562565558组(1)根据数据完成对照组和试验组葡萄产量的茎叶图,并通过茎叶图比较对照组和实验组葡萄产量的平均值和方差的大小(不要求计算出具体值,得出结论即可);(2)若每株葡萄树的年产量不低于45 kg ,则认为“产量高”,否则认为“产量一般”.请根据此样本完成此2×2列联表,并据此样本分析是否有95%的把握认为产量的提高与使用新技术有关;对照组实验组合计产量高产量一般合计(3)从“产量高”的数据中随意抽取3株做进一步科学研究中,计算恰好有2株来自实验组的概率.附:χ2=,其中n =a +b +c +d .n ad -bc 2a +bc +d a +c b +dP (χ2≥k )0.0500.0100.001k3.8416.63510.828[解] (1)实验组的葡萄平均产量要高于对照组的葡萄平均产量;实验组的葡萄产量的方差要小于对照组葡萄产量的方差.(2)完成2×2列联表如下表所示:对照组实验组合计产量高71219产量一般13821合计202040所以χ2的观测值k =≈2.506<3.841.40× 7×8-12×13 220×20×19×21所以没有95%的把握认为产量的提高与使用新技术有关.(3)记事件A 为“这3株中恰好有2株来自实验组”,则P (A )==.C 212C 17C 319154323所以恰好有2株来自实验组的概率为.154323离散型随机变量的分布列、均值和方差的应用离散型随机变量及其分布列、均值与方差及应用是高考的一大热点,每年均有解答题,属于中档题.复习时应强化应用题的理解与掌握,弄清随机变量的所有取值是正确列随机变量分布列和求均值与方差的关键,对概率的确定与转化是解题的基础,准确计算是解题的核心.【例2】 (本题满分12分)(2016·全国卷Ⅰ)某公司计划购买2台机器,该种机器使用三年后即被淘汰.机器有一易损零件,在购进机器时,可以额外购买这种零件作为备件,每个200元.在机器使用期间,如果备件不足再购买,则每个500元.①现需决策在购买机器时应同时购买几个易损零件,为此搜集并整理了100台这种机器在柱状图:三年使用期内更换的易损零件数,得如图所示的②以这100台机器更换的易损零件数的频率代替1台机器更换的易损零件数发生的概率,记X表示2台机器三年内共需更换的易损零件数,③n表示购买2台机器的同时购买的易损零件数.(1)求X的分布列;P X≤n ≥0.5,(2)若要求④确定n的最小值;(3)以购买易损零件所需费用的期望值为决策依据,在n=19与n=20之中选其一,应选用哪个?[信息提取] 看到①这种条件,想到解题时可能要分类求解;看到②想到频数与频率间的关系,想到横轴中的取值含义;看到③想到X的所有可能取值;看到④想到X和n的含义,想到(1)中的分布列.[规范解答] (1)由柱状图及以频率代替概率可得,一台机器在三年内需更换的易损零件数为8,9,10,11的概率分别为0.2,0.4,0.2,0.2. ·················1分由题意可知X的所有可能取值为16,17,18,19,20,21,22.从而P(X=16)=0.2×0.2=0.04;P(X=17)=2×0.2×0.4=0.16;P(X=18)=2×0.2×0.2+0.4×0.4=0.24;P(X=19)=2×0.2×0.2+2×0.4×0.2=0.24;P(X=20)=2×0.2×0.4+0.2×0.2=0.2;P(X=21)=2×0.2×0.2=0.08;P(X=22)=0.2×0.2=0.04.····································4分所以X的分布列为X16171819202122 P0.040.160.240.240.20.080.04·····························································6分(2)由(1)知P(X≤18)=0.44,P(X≤19)=0.68,故n的最小值为19. ···········································7分(3)记Y表示2台机器在购买易损零件上所需的费用(单位:元).当n=19时,E(Y)=19×200×0.68+(19×200+500)×0.2+(19×200+2×500)×0.08+(19×200+3×500)×0.04= 4 040;···································9分当n=20时,E(Y)=20×200×0.88+(20×200+500)×0.08+(20×200+2×500)×0.04= 4 080. ··························································11分可知当n=19时所需费用的期望值小于当n=20时所需费用的期望值,故应选n=19. ·······················································12分[易错与防范]易错点防范措施忽视X的实际含义导致取值错误,进而导致概率计算错误.细心审题,把握题干中的重要字眼,关键处加标记,同时理解X取每个值的含义.忽视P(X≤n)≥0.5的含义,导致不会求解.结合(1)中的分布列及n的含义,推理求解便可.忽视n=19与n=20的含义导致无法解题.本题中购买零件所需费用包含两部分,一部分为购买机器时购买零件的费用,另一部分为备件不足时额外购买的费用.[通性通法] 解答离散型随机变量的分布列及相关问题的一般思路:(1)明确随机变量可能取哪些值.(2)结合事件特点选取恰当的计算方法计算这些可能取值的概率值.(3)根据分布列和均值、方差公式求解.某校首届安琪杯教职工运动会上有一个扑克小游戏,游戏规则如下:甲、乙双方每局比赛均从5张扑克牌(3张红桃A,2张黑桃A)中轮流抽取1张,抽取到第2张黑桃A 的人获胜,并结束该局比赛.每三局比赛为一轮.(1)若在第一局比赛中甲先抽牌,求甲获胜的概率;(2)若在一轮比赛中规定:第一局由甲先抽牌,并且上一局比赛输的人下一局比赛先抽,每一局比赛先抽牌并获胜的人得1分,后抽牌并获胜的人得2分,未获胜的人得0分.求此轮比赛中甲得分X 的概率分布列及其数学期望E (X ).[解] (1)设“在第一局比赛中甲先抽牌,甲获胜”为事件M ,甲先抽牌,甲获胜等价于把这5张牌进行排序,第二张黑桃A 排在3号位置或5号位置,共有2+4=6(种),而2张黑桃A 的位置共有C =10(种).25所以P (M )==.2+41035(2)甲得分X 的所有可能取值为0,1,2,3,5.由(1)知在一局比赛中,先抽牌并获胜(后抽牌并输)的概率为,35则后抽牌并获胜(先抽牌并输)的概率为.25当X =0时,即三局甲都输,P (X =0)=××=;2525258125当X =1时,即第一局甲胜,二、三局甲输或第二局甲胜,一、三局甲输或第三局甲胜,一、二局甲输,P (X =1)=××+××+××=;当X =2时,即第一局甲胜,35352525353525253548125第二局甲输,第三局甲胜,P (X =2)=××=;35353527125当X =3时,即第一局甲输,二、三两局甲都胜或者第一局甲胜,第二局甲胜,第三局甲输,P (X =3)=××+××==;25352535253530125625当X =5时,即三局甲都胜,P (X =5)=××=.35252512125所以此轮比赛中甲得分X 的概率分布列为X 01235P 8125481252712562512125E (X )=0×+1×+2×+3×+5×=.8125481252712562512125252125概率与统计的综合应用概率与统计作为考查考生应用意识的重要载体,已成为近几年高考的一大亮点和热点.主要依托点是统计图表,正确认识和使用这些图表是解决问题的关键.复习时要在这些图表上下功夫,把这些统计图表的含义弄清楚,在此基础上掌握好样本特征数的计数方法、各类概率的计算方法及均值与方差的运算.【例3】 (2014·全国卷Ⅰ)从某企业生产的某种产品中抽取500件,测量这些产品的一项质量指标值,由测量结果得如图所示的频率分布直方图:(1)求这500件产品质量指标值的样本平均数和样本方差s 2(同一组中的数据用该组区x -间的中点值作代表);(2)由直方图可以认为,这种产品的质量指标值Z 服从正态分布N (μ,σ2),其中μ近似为样本平均数,σ2近似为样本方差s 2.x -①利用该正态分布,求P (187.8<Z <212.2);②某用户从该企业购买了100件这种产品,记X 表示这100件产品中质量指标值位于区间(187.8,212.2)的产品件数,利用①的结果,求E (X ).附:≈12.2.150若Z ~N (μ,σ2),则P (μ-σ<Z <μ+σ)=0.682 6,P (μ-2σ<Z <μ+2σ)=0.954 4.[解] (1)抽取产品的质量指标值的样本平均数和样本方差s 2分别为=170×0.02+x x 180×0.09+190×0.22+200×0.33+210×0.24+220×0.08+230×0.02=200,s 2=(-30)2×0.02+(-20)2×0.09+(-10)2×0.22+0×0.33+102×0.24+202×0.08+302×0.02=150.(2)①由(1)知,Z ~N (200,150),从而P (187.8<Z <212.2)=P (200-12.2<Z <200+12.2)=0.682 6.②由①知,一件产品的质量指标值位于区间(187.8,212.2)的概率为0.682 6,依题意知X ~B (100,0.682 6),所以E (X )=100×0.682 6=68.26.[律方规法] 统计与概率的综合应用(1)正态分布:若变量X 服从正态分布N (μ,σ2),其中μ为样本的均值,正态分布曲线的对称轴为x =μ;σ为样本数据的标准差,体现了数据的稳定性.(2)二项分布:若变量X ~B (n ,p ),则X 的期望E (X )=np ,方差D (X )=np (1-p ).某篮球队在某赛季已结束的8场比赛中,队员甲得分统计的茎叶图如图.(1)根据这8场比赛,估计甲每场比赛中得分的均值μ和标准差σ;(2)假设甲在每场比赛的得分服从正态分布N (μ,σ2),且各场比赛间相互没有影响,依此估计甲在82场比赛中得分在26分以上的平均场数.参考数据:≈5.66,≈5.68,≈5.70.3232.2532.5正态总体N (μ,σ2)在区间(μ-2σ,μ+2σ)内取值的概率约为0.954.[解] (1)μ=(7+8+10+15+17+19+21+23)=15,18σ2=[(-8)2+(-7)2+(-5)2+02+22+42+62+82]=32.25.所以σ≈5.68.18所以估计甲每场比赛中得分的均值μ为15,标准差σ为5.68.(2)由(1)得甲在每场比赛中得分在26分以上的概率P (X ≥26)≈[1-P (μ-2σ<X <μ+2σ)]≈(1-0.954)=0.023,1212设在82场比赛中,甲得分在26分以上的次数为Y ,则Y ~B (82,0.023).Y 的均值E (Y )=82×0.023≈2.由此估计甲在82场比赛中得分在26分以上的平均场数约为2.[大题增分专训]1.某县响应中央的号召,积极开展了建设社会主义新农村的活动,实行以奖代补,并组织有关部门围绕新农村建设中的五个方面(新房舍、新设施、新环境、新农民、新风尚)对各个村进行综合评分,高分(大于等于88分)的村先给予5万元的基础奖励,然后比88分每高1分,奖励增加5千元,低分(小于等于75分)的村给予通报,取消5万元的基础奖励,且比75分每低1分,还要扣款1万元,并要求重新整改建设,分数在(75,88)之间的只享受5万元的基础奖励,下表是甲、乙两个乡镇各10个村的得分数据(单位:分):甲:62,74,86,68,97,75,88,98,76,99;乙:71,81,72,86,91,77,85,78,83,84.(1)根据上述数据完成以下茎叶图,并通过茎叶图比较两个乡镇各10个村的得分的平均值及分散程度(不要求计算具体的数值,只给出结论即可);(2)为继续做好社会主义新农村的建设工作,某部门决定在这两个乡镇中各任意抽取一个进行工作总结,求抽取的2个村中至少有一个得分是低分的概率;(3)从获取奖励的角度看,甲、乙两个乡镇哪个获取的奖励多?[解] (1)茎叶图:通过茎叶图可以看出,甲乡镇10个村的平均得分比乙乡镇10个村的平均得分高,甲乡镇10个村的得分比较分散,乙乡镇10个村的得分比较集中.(2)由茎叶图可知甲乡镇10个村中低分的有4个,乙乡镇10个村中低分的有2个,所以从甲乡镇10个村中随机抽取1个,得分是低分的概率为=,从乙乡镇10个村中随机抽取141025个,得分是低分的概率为=,故抽取的2个村中至少有一个得分是低分的概率为×+×21015254535+×=.1525151325(3)由茎叶图可知甲乡镇10个村中,高分(大于等于88分)有4个,分别是88分、97分、98分、99分,奖励分共9+10+11=30分,低分(小于等于75分)有4个,分别是75分、74分、68分、62分,扣款分共1+7十13=21分,分数在(75,88)之间的有2个,故甲乡镇所获奖励为6×5+30×0.5-21×1=30+15-21=24万元.由茎叶图可知乙乡镇10个村中,高分(大于等于88分)有1个,为91分,奖励分共3分,低分(小于等于75分)有2个,分别是71分、72分,扣款分共4+3=7分,分数在(75,88)之间的有7个,故乙乡镇所获奖励为8×5+3×0.5-7×1=40+1.5-7=34.5万元.故从获取奖励的角度看,乙乡镇获取的奖励多.2.(2018·太原二模)按照国家质量标准:某种工业产品的质量指标值落在[100,120)内,则为合格品,否则为不合格品.某企业有甲、乙两套设备生产这种产品,为了检测这两套设备的生产质量情况,随机从两套设备生产的大量产品中各抽取了50件产品作为样本,对规定的质量指标值进行检测.甲套设备的样本频数分布表和乙套设备的样本频率分布直方图如下所示.甲套设备的样本频数分布表质量指标值[95,100)[100,105)[105,110)[110,115)[115,120)[120,125]频数14192051乙套设备的样本频率分布直方图(1)填写下面列联表,并根据列联表判断是否有90%的把握认为这种产品的质量指标值与甲、乙两套设备的选择有关;甲套设备乙套设备合计合格品不合格品合计(2)根据以上数据,对甲、乙两套设备的优劣进行比较;(3)将频率视为概率,若从甲套设备生产的大量产品中,随机抽取3件产品,记抽到的不合格品的个数为X ,求X 的数学期望E (X ).附:P (χ2≥k 0)0.150.100.050.0250.01k 02.0722.7063.8415.0246.635χ2=.n ad -bc 2a +bc +d a +c b +d[解] (1)根据题中数据填写列联表如下:甲套设备乙套设备合计合格品484391不合格品279合计5050100由列联表得χ2=≈3.053.100× 48×7-2×43 250×50×91×9∵3.053>2.706,∴有90%的把握认为这种产品的质量指标值与甲、乙两套设备的选择有关.(2)根据题中数据可知,甲套设备生产的合格品的概率约为,乙套设备生产的合格品的4850概率约为,并且甲套设备生产的产品的质量指标值主要集中在[105,115)之间,乙套设备生4350产的产品的质量指标值与甲套设备的相比,较为分散.因此,可以认为甲套设备生产的合格品的概率更高,且质量指标值更稳定,从而甲套设备优于乙套设备.(3)由题知,X ~B ,(3,125)∴E (X )=3×=.1253253.(2018·石家庄二模)随着网络的发展,网上购物越来越受到人们的喜爱,各大购物网站为增加收入,促销策略越来越多样化,促销费用也不断增加.下表是某购物网站2017年1~8月促销费用(万元)和产品销量(万件)的具体数据.月份12345678促销费用x 2361013211518产品销量y11233.5544.5(1)根据数据可知y 与x 具有线性相关关系,请建立y 关于x 的回归方程y =bx +a (系数精确到0.01);(2)已知6月份该购物网站为庆祝成立1周年,特制定奖励制度:以z (单位:件)表示日销量,z ∈[1 800,2 000),则每位员工每日奖励100元;z ∈[2 000,2 100),则每位员工每日奖励150元;z ∈[2 100,+∞),则每位员工每日奖励200元.现已知该网站6月份日销量z 服从正态分布N (2 000,10 000),请你计算某位员工当月奖励金额总数大约为多少元.(当月奖励金额总数精确到百分位)参考数据:x i y i =338.5,x =1 308,其中x i ,y i 分别为第i 个月的促销费用和产∑8i =1∑8i =12i 品销量,i =1,2,3, (8)参考公式:①对于一组数据(x 1,y 1),(x 2,y 2),…,(x n ,y n ),其回归方程y =bx +a 的斜率和截距的最小二乘估计分别为b =,a =-b .∑ni =1x i y i -n xy∑ni =1x 2i -nx 2y x ②若随机变量Z 服从正态分布N (μ,σ2),则P (μ-σ,μ+σ)=0.682 7,P (μ-2σ,μ+2σ)=0.954 5.[解] (1)由题可得=11,=3,x y将数据代入得b =∑8i =1x i y i -8xy∑8i =1x 2i -8x 2=338.5-8×11×31 308-8×11×11=≈0.219,74.5340a =-b ≈3-0.219×11≈0.59,y x 所以y 关于x 的回归方程y =0.22x +0.59.(2)由题知该网站6月份日销量z 服从正态分布N (2 000,10 000),则日销量在[1 800,2 000)上的概率为=0.477 25,0.954 52日销量在[2 000,2 100)上的概率为=0.341 35 ,0.682 72日销量在[2 100,+∞)上的概率为=0.158 65,1-0.682 72所以某位员工当月奖励金额的总数为(100×0.477 25+150×0.341 35+200×0.158 65)×30=3 919.725≈3 919.73(元).。
2020高考数学(文)专项复习《概率统计》含答案解析

概率统计统计是研究如何合理收集、整理、分析数据的学科,为人们制定决策提供依据.概率是研究随机现象规律的学科,为人们认识客观世界提供重要的思维模式和解决问题的方法. 统计一章介绍随机抽样、样本估计总体、线性回归的基本方法,通过对典型案例的讨论,了解和使用一些常用的统计方法,进一步体会运用统计方法解决实际问题的基本思想,认识统计方法在决策中的作用.概率一章介绍随机现象与概率的意义、古典概型及几何概型等内容,并能用所学知识解决一些简单的实际问题,进一步体会概率模型的作用及运用概率思考问题的特点,初步形成用随机观念观察、分析问题的意识.§10-1 概率(一)【知识要点】1.事件与基本事件空间:随机事件:当我们在同样的条件下重复进行试验时,有的结果始终不会发生,它称为不可能事件;有的结果在每次试验中一定会发生,它称为必然事件;在试验中可能发生也可能不发生的结果称为随机事件,随机事件简称为事件.基本事件与基本事件空间:在一次试验中我们常常要关心的是所有可能发生的基本结果,它们是试验中不能再分的最简单的随机事件,其他事件可以用它们来描述,这样的事件称为基本事件.所有基本事件构成的集合叫做基本事件空间,常用 表示.2.频率与概率频率:在相同的条件S 下,重复n 次试验,观察某个事件A 是否出现,称n 次试验中事件A 的出现次数m 为事件A 出现的频数,称事件A 出现的比例nm 为事件A 出现的频率. 概率:一般的,在n 次重复进行的试验中,事件A 发生的频率nm ,当n 很大时总是在某个常数附近摆动,随着n 的增加,摆动幅度越来越小,这时就把这个常数叫做事件A 的概率,记做P (A ).显然有0≤P (A )≤1.不可能事件的概率为0,必然事件的概率为1,随机事件的概率在(0,1)之间.3.互斥事件的概率加法公式事件的并:由事件A 或B 至少有一个发生构成的事件C 称为事件A 与B 的并,记做C =A ∪B .互斥事件:不可能同时发生的两个事件称为互斥事件.互斥事件加法公式:如果事件A 、B 互斥,则事件A ∪B 发生的概率等于这两个事件分别发生的概率和,即P (A ∪B )=P (A )+P (B ).如果A 1,A 2,…,A n 两两互斥,那么事件A 1∪A 2∪…∪A n 发生的概率,等于这n 个事件分别发生的概率和,即P (A 1∪A 2∪…∪A n )=P (A 1)+P (A 2)+…+P (A n ).对立事件:不能同时发生且必有一个发生的两个事件叫做互为对立事件.事件A 的对立事件记作A ,满足P (A )=1-P (A ).概率的一般加法公式(选学):事件A 和B 同时发生构成的事件D ,称为事件A 与B 的交(积),记作D =A ∩B .在古典概型中,P (A ∪B )=P (A )+P (B )-P (A ∩B ).4.古典概型古典概型:一次试验有下面两个特征:(1)有限性,在一次试验中可能出现的结果只有有限个,即只有有限个不同的基本事件;(2)等可能性,每个基本事件发生的可能性是均等的,则称这个试验为古典概型.古典概型的性质:对于古典概型,如果试验的n 个基本事件为A 1,A 2,…,A n ,则有P (A 1∪A 2∪…∪A n )=1且⋅=nA P i 1)( 概率的古典定义:在古典概型中,如果试验的基本事件总数为n (Ω ),随机事件A 包含的基本事件数为n (A),则p (A)=试验的基本事件总数包含的基本事件数事件A ,即⋅=)()()(Ωn A n A P 5.几何概型几何概型:一次试验具有这样的特征:事件A 理解为区域Ω的一个子区域A ,A 的概率只与子区域A 的几何度量(长度、面积或体积)成正比,而与A 的位置和形状无关,这样的试验称为几何概型.几何概型的特点:(1)无限性:一次试验中可能出现的结果有无穷多个;(2)等可能性,每个基本事件发生的可能性相等.几何概型中事件A 的概率定义:ΩA A P μμ=)(,其中μ Ω 表示区域Ω 的几何度量,μ A 表示子区域A 的几何度量.随机数:就是在一定范围内随机产生的数,并且得到这个范围内的每一个数的机会均等.计算机随机模拟法(蒙特卡罗方法)是利用模型来研究某种现象的性质的一种有效方法,可以节约大量的人力物力.【复习要求】1.了解随机事件发生的不确定性和频率的稳定性,了解概率的意义,了解频率与概率的区别.2.了解两个互斥事件的概率加法公式.3.理解古典概型及其概率计算公式,会计算一些随机事件所含的基本事件数及事件发生的概率.4.了解随机数的意义,了解几何概型的意义.【例题分析】例1 国家射击队的某队员射击一次,命中7-10环的概率如下表:求该队员射击一次,(1)射中9环或10环的概率;(2)至少命中8环的概率;(3)命中不足8环的概率.【分析】射击运动员一次射击只能命中1个环数,命中不同的环数是互斥事件,射中9环或10环的概率等于射中9环与射中10环的概率和.命中不足8环所包含的事件较多,而其对立事件为“至少命中8环”,可先求其对立事件的概率,再通过P (A )=1-P (A )求解.解:设事件“射击一次,命中k 环”为事件A k (k ∈N ,k ≤10),则事件A k 彼此互斥.(1)记“射击一次,射中9环或10环”为事件A ,则P (A )=P (A 10)+P (A 9)=0.60.(2)记“射击一次,至少命中8环”为事件B ,则P (B )=P (A 10)+P (A 9)+P (A 8)=0.78.(3)“射击一次,命中不足8环”为事件B 的对立事件,则P (B )=1-P (B )=0.22.【评析】解决概率问题时,要先分清所求事件由哪些事件组成,分析是否是互斥事件,再决定用哪个公式.当用互斥事件的概率加法公式解题时,要学会不重不漏的将事件拆为几个互斥事件,要善于用对立事件解题.例2 现有8名奥运会志愿者,其中志愿者A 1,A 2,A 3通晓日语,B 1,B 2,B 3通晓俄语,C 1,C 2通晓韩语.从中选出通晓日语、俄语和韩语的志愿者各1名,组成一个小组.(Ⅰ)求A 1被选中的概率;(Ⅱ)求B 1和C 1不全被选中的概率.【分析】本题是一个古典概型的问题,可以直接用概率公式)()()(Ωn A n A P =求解. 解:(Ⅰ)从8人中选出日语、俄语和韩语志愿者各1名,其一切可能的结果组成的基本事件空间Ω={(A 1,B 1,C 1),(A 1,B 1,C 2),(A 1,B 2,C 1),(A 1,B 2,C 2),(A 1,B 3,C 1),(A 1,B 3,C 2),(A 2,B 1,C 1),(A 2,B 1,C 2),(A 2,B 2,C 1),(A 2,B 2,C 2),(A 2,B 3,C 1),(A 2,B 3,C 2),(A 3,B 1,C 1),(A 3,B 1,C 2),(A 3,B 2,C 1),(A 3,B 2,C 2),(A 3,B 3,C 1),(A 3,B 3,C 2)}由18个基本事件组成.由于每一个基本事件被抽取的机会均等,因此这些基本事件的发生是等可能的.用M 表示“A 1恰被选中”这一事件,则M ={(A 1,B 1,C 1),(A 1,B 1,C 2),(A 1,B 2,C 1),(A 1,B 2,C 2),(A 1,B 3,C 1),(A 1,B 3,C 2)}事件M 由6个基本事件组成,因而⋅==31186)(M P (Ⅱ)用N 表示“B 1,C 1不全被选中”这一事件,则其对立事件N 表示“B 1,C 1全被选中”这一事件, 由于N ={(A 1,B 1,C 1),(A 2,B 1,C 1),(A 3,B 1,C 1)},事件N 由3个基本事件组成, 所以61183)(==N P ,由对立事件的概率公式得⋅=-=-=65611)(1)(N P N P 【评析】古典概型解决概率问题时,选定基本事件空间并计算其所含基本事件的个数是重要的一步.本题中选定“从8人中选出日语、俄语和韩语志愿者各1名,其一切可能的结果”为基本事件空间,计算时采用列举法,也可以利用乘法计数原理计算3×3×2=18.本题第一问还可以选定“从通晓日语的3人中选出1人的可能结果”为基本事件空间,共有3个基本事件,选出A 1只有一种可能,故所求概率为⋅31例3 (1)两根相距6米的木杆上系一根绳子,并在绳子上挂一盏灯,则灯与两端距离都大于2米的概率是______.(2)甲乙两人约定在6点到7点之间在某处会面,并约好先到者等候另一人一刻钟,过时即可离去.则两人能会面的概率是______.(3)正方体内有一个内切球,则在正方体内任取一点,这个点在球内的概率为______.【分析】这三个题都可转化为几何概率问题求解.分别转化为线段长度、图形面积、几何体体积问题求解.解:(1)本题可转化为:“在长为6m 的线段上随机取点,恰好落在2m 到4m 间的概率为多少?” 易求得⋅=31P (2)本题可转化为面积问题:即“阴影部分面积占总面积的多少?”, 解得⋅=167)(A P (3)本题可转化为体积问题:即“内切球的体积与正方体体积之比是多少?”.解得⋅=6πP 【评析】几何概型也是一种概率模型,它具有等可能性和无限性两个特点.解题的关键是要建立模型,将实际问题转化为几何概率问题.基本步骤是:把基本事件空间转化为与之对应的区域Ω;把随机事件A 转化为与之对应的区域A ;利用概率公式)()()(ΩA A P μμ=计算.常用的几何度量包括:长度、面积、体积.例4 设有关于x 的一元二次方程x 2+2ax +b 2=0.(Ⅰ)若a 是从0,1,2,3四个数中任取的一个数,b 是从0,1,2三个数中任取的一个数,求上述方程有实根的概率;(Ⅱ)若a 是从区间[0,3]任取的一个数,b 是从区间[0,2]任取的一个数,求上述方程有实根的概率.【分析】本题第一问是古典概型问题,第二问由于a 、b 在实数区间选取,可以转化为几何概型问题求解.解:设事件A 为“方程x 2+2ax +b 2=0有实根”.当a ≥0,b ≥0时,方程x 2+2ax +b 2=0有实根的充要条件为a ≥b .(Ⅰ)基本事件共12个:(0,0),(0,1),(0,2),(1,0),(1,1),(1,2),(2,0),(2,1),(2,2),(3,0),(3,1),(3,2).其中第一个数表示a 的取值,第二个数表示b 的取值.事件A 中包含9个基本事件,事件A 发生的概率为⋅==43129)(A P (Ⅱ)试验的全部结果所构成的区域为{(a ,b )|0≤a ≤3,0≤b ≤2}.构成事件A 的区域为{(a ,b )|0≤a ≤3,0≤b ≤2,a ≥b }. 所以所求的概率为⋅=⨯⨯-⨯=3223221232 【评析】几何概型与古典概型的每个基本事件发生的可能性是均等的,只是几何概型的基本事件有无限个,而古典概型的基本事件有有限个.在具体问题中,不能因为古典概型的基本事件的个数多而误认为是几何概型.练习10-1一、选择题1.下列随机事件的频率和概率的关系中哪个是正确的( )A .频率就是概率B .频率是客观存在的,与试验次数无关C .随着试验次数增加,频率一般会越来越接近概率D .概率是随机的,在试验前不能确定2.从装有2个黑球2个白球的口袋中任取2个球,那么互斥而不对立的两个事件是( )A .至少有一个白球,都是白球B .至少有一个白球,至少有一个红球C .恰有一个白球,恰有两个白球D .至少有一个白球,都是红球3.考察正方体6个面的中心,甲从这6个点中任意选两个点连成直线,乙也从这6个点中任意选两个点连成直线,则所得的两条直线相互平行但不重合的概率等于( )A .751B .752C .753D .754 二、填空题4.甲、乙二人掷同一枚骰子各一次.如果谁掷的点数大谁就取胜,则甲取胜的概率为______.5.在平面直角坐标系xoy 中,设D 是横坐标与纵坐标的绝对值均不大于2的点构成的区域,E 是到原点的距离不大于1的点构成的区域,向D 中随机投一点,则落入E 中概率为______.三、解答题6.已知集合A ={-4.-2,0,1,3,5},在平面直角坐标系中点M (x ,y )的坐标满足x ∈A ,y ∈A .计算:(1)点M 恰在第二象限的概率;(2)点M 不在x 轴上的概率;(3)点M 恰好落在区域⎪⎩⎪⎨⎧>>>-+0008y x y x 上的概率.§10-2 统 计【知识要点】1.随机抽样总体、个体、样本:把所考察对象的某一个数值指标的全体构成的集合看成总体,构成总体的每一个元素称为个体,从总体中抽出若干个体所组成的集合叫做样本.随机抽样:抽样时,保证每一个个体都可能被抽到,且每个个体被抽到的机会均等,满足这样条件的抽样为随机抽样.简单随机抽样:从元素个数为N 的总体中,不放回的抽取容量为n 的样本,如果每一次抽样时,总体中的各个个体有相同的可能性被抽到,这种抽样方法叫简单随机抽样.系统抽样:当总体个数很大时,可将总体分成均匀的若干部分,然后按照预先制定的规则从每一部分抽取一个个体得到所需要的样本,这种抽样的方式叫做系统抽样.分层抽样:当总体由有明显差异的几部分组成时,将总体中各个个体按某种特征分成若干个互不重叠的几部分,每一部分叫做层,在各层中按层在总体中所占比例进行简单随机抽样或系统抽样,这种抽样方法叫做分层抽样.三种抽样方法的比较常用频率分布表、频率分布直方图、频率分布折线图、茎叶图等统计图表来表示样本数据,观察样本数据的特征,从而估计总体的分布情况.频率分布(表)直方图的画法步骤:(1)计算极差(用样本数据的最大值减去最小值)(2)决定组数与组距(组数×组距=极差)(3)决定分点(4)列频率分布表(5)绘制频率分布直方图易见直方图中各个小长方形面积等于相应各组的频率,所有小长方形面积之和等于1. 频率分布折线图:连结频率分布直方图各个长方形上边的中点,就得到频率分布折线图. 总体密度曲线:随着样本容量的增加,分组的组距不断缩小,相应的频率分布折线图就会越来越接近于一条光滑曲线,这条光滑曲线就叫做总体密度曲线.总体密度曲线精确地反映了一个总体在各个区域内取值的规律.茎叶图:茎指中间的一列数,叶是从茎的旁边生长出来的数.在样本数据较少时,茎叶图表示数据的效果较好.它的突出优点是:统计图中没有原始数据的损失,所有的数据信息都可以从茎叶图中得到;茎叶图可随时记录,方便表示.3.用样本的数字特征估计总体的数字特征样本数据的平均数:如果有n 个数x 1,x 2,…,x n ,那么nx x x x n +++=Λ21叫做这n 个数的平均数.标准差:样本数据到平均数的一种平均距离,一般用s 表示,其中nx x x x x x s n 22221)()()(-++-+-=Λ.方差:标准差的平方s 2叫做方差.⋅-++-+-=n x x xx x x s Zn )()()(22212¬Λ 4.两个变量间的关系散点图:两个变量的关系可通过它们所对应的点在平面上表现出来,这些点对应的图形叫做散点图.线性相关:若两个变量的散点图中所有点看上去都在一条直线附近波动,则这两个变量可近似看成具有线性相关关系.回归直线方程:从散点图上看,如果这些点从整体上看大致分布在通过散点图中心一条直线附近,则这条直线叫做这些数据点的回归直线方程,记作yˆ=bx +a ,其中b 叫回归系数.最小二乘法:假设我们已经得到两个具有线性相关关系的变量的一组数组),(11y x ,),(22y x ,…,),(33y x ,求得,)()()(ˆ2211211x n x y x n y x x x y y x x b in i i i n i ini i in i --=---=∑∑∑∑====⋅⋅⋅ x b y a ˆˆ-=,这时离差211)(2i i bx a y n Q --==最小,所求回归直线方程是a x b y ˆˆˆ+=.这种求回归直线的方法称为最小二乘法.【复习要求】1.会用简单随机抽样方法从总体中抽取样本,了解分层抽样和系统抽样方法.2.了解分布的意义和作用,会列频率分布表,会画频率分布直方图、频率折线图、茎叶图,理解它们各自的特点.3.理解样本数据标准差的意义和作用,会计算样本数据平均数、标准差,并给出合理解释.4.会用样本的频率分布估计总体分布,会用样本的基本数字特征估计总体的基本数字特征,理解用样本估计总体的思想.5.会作两个有关联变量的数据的散点图,会利用散点图认识变量间的相关关系.了解最小二乘法的思想,能根据给出的线性回归方程系数公式建立线性回归方程.【例题分析】例1 某单位200名职工的年龄分布情况如图,现要从中抽取40名职工作样本,用系统抽样法,将全体职工随机按1-200编号,并按编号顺序平均分为40组(1-5号,6-10号,…,196-200号).若第5组抽出的号码为22,则第8组抽出的号码应是______,若用分层抽样方法,则40岁以下年龄段应抽取______人.【分析】由已知系统抽样的组距为5,所以相邻组间的号码相差5;由饼形图可知200名职工中,50岁以上人数:40-50岁人数:40岁以下人数=2∶3∶5,总样本为40人,分层抽样抽取每层人数比例为2∶3∶5.解:37;20【评析】系统抽样的特征是等距,也就是只要在一组内选定号码,其余各组的号码随之选定,所选相邻号码的间隔为组距.分层抽样的特征是按比例抽取,也就是每一层所选人数占总选出人数的比例与每层人数占总人数的比例相等.抽样是统计分析的重要部分,最常用的抽样方法是简单随机抽样、系统抽样和分层抽样,抽样时每个个体被抽到的可能性相等.简单随机抽样常用抽签法和随机数表法.例2 对某电子元件进行寿命追踪调查,情况如下:寿命(h) [100,200) [200,300) [300,400) [400,500) [500,600)个数(个) 20 30 80 40 30(2)画出频率分布直方图;(3)估计电子元件寿命在[100,400)以内的概率;(4)估计电子元件寿命在400h以上的概率.【分析】按要求列表、绘图,并用样本的分布估计总体的分布.解:(1)频率分布表(2)(画图);(3)P=0.10+0.15+0.40=0.65;(4)P=1-0.65=0.35.寿命(h) 频数频率[100,200) 20 0.10[200,300) 30 0.15[300,400) 80 0.40[400,500) 40 0.20[500,600) 30 0.15合计200 1.00【评析】频率分布表和频率分布直方图是用统计的方法对样本数据加以概括和总结.列频数分布表时,要区分频数和频率的意义,画频率分布直方图时要注意横、纵坐标代表的意义和单位.频率分布指的是一个样本数据在各拿小范围内所占比例的大小,常用样本数据落在某个范围的频率估计总体落在这个范围的概率.频率分布直方图中众数是最高矩形中点的横坐标,中位数为平分频率分布直方图面积且垂直于横轴的直线与横轴交点的横坐标.例3 (海南)从甲、乙两品种的棉花中各抽测了25根棉花的纤维长度(单位:mm),结果如下:甲品种:271 273 280 285 285 287 292 294 295 301 303 303 307 308 310 314 319 323 325 325 328 331 334 337 352 乙品种:284 292 295 304 306 307 312 313 315 315 316 318 318 320 322 322 324 327 329 331 333 336 337 343 356 由以上数据设计了如下茎叶图根据以上茎叶图,对甲、乙两品种棉花的纤维长度作比较,写出两个统计结论:①___________________________________________________________________________________________________________________________________________________;②___________________________________________________________________________________________________________________________________________________.【分析】抽样数据比较分散,很难观察数据的分布特征,通过茎叶图展现了样本数据的分布.通过茎叶图可观察出平均数、众数、中位数,数据分布的对称性等等,由于茎叶图保留了原始数据,还可计算平均数、方差、标准差.解:(可任选两个作答)(1)乙品种棉花的纤维平均长度大于甲品种棉花的纤维平均长度;(2)甲品种棉花的纤维长度较乙品种棉花的纤维长度更分散(或乙品种棉花的纤维长度较甲品种棉花的纤维长度更集中);(3)甲品种棉花的纤维长度的中位数为307mm,乙品种棉花的纤维长度的中位数为318mm;(4)乙品种棉花的纤维长度基本上是对称的,而且大多集中在中间(均值附近),甲品种棉花的纤维长度除一个特殊值(352)外,也大致对称,其分布较均匀;【评析】茎叶图是统计图表的一种,它具有统计图表的一般功能:通过样本的数据分布推断总体的分布,通过样本的数字特征估计总体的数字特征.本题中的统计结论,是指用样本的特征估计总体特征得到的结论.例4图1是某县参加2007年高考的学生身高条形统计图,从左到右的各条形表示的学生人数依次记为A1、A2、…、A m(如A2表示身高(单位:cm)在[150,155)内的学生人数).图2是统计图1中身高在一定范围内学生人数的一个算法流程图.现要统计身高在160~180cm(含160cm,不含180cm)的学生人数,那么在流程图中的判断框内应填写的条件是______.图1 图2【分析】条形图的横坐标是身高,纵坐标为每个身高区间内的人数.条形图没有提供具体的数据信息.程序框图的算法含义是统计[160,180)内学生人数,即求A 4+A 5+A 6+A 7的和.解:i <8或i ≤7.【评析】设计算法利用计算机完成数据的统计工作,是实际统计工作中经常应用的.除了可以完成计数工作外,还可排序、求最值,利用公式进行各种计算等等.将算法和统计一起考查是新课程的一个特色.例5 甲乙两位运动员在相同的条件下分别射击10次,记录各次命中环数如下: 甲:8,8,6,8,6,5,9,10,7,4乙:9,5,7,8,7,6,8,6,8,7(1)分别计算他们射击环数的平均数及标准差;(2)判断他们设计水平谁高,谁的射击情况更稳定?【分析】平均数、标准差分别反映了两个选手的射击水平和稳定程度,平均数越高说明选手射击水平越高,标准差越小说明选手发挥越稳定.解:(1)甲的平均数为7.1,标准差为1.758;乙的平均数为7.1,标准差为1.136;(2)从平均值上看,两人的水平相当;从标准差上看,乙的情况更稳定.【评析】平均数反映的是平均水平的高低,方差和标准差反映的是数据的离散程度.如果样本数据中每个数都增加数a ,则它的平均数也增加a ,但是它的标准差不变,因为数据的离散程度没有变化.由于方差与原始数据的单位不同,而且可能夸大了偏离程度,实际解决问题中常采用标准差.例6 假定关于某设备的使用年限x 和所支出费用y (万元),有如下的统计资料 使用年限x2 3 4 5 6 维修费用y 2.2 3.8 5.5 6.5 7.0(1)请画出上表数据的散点图;(2)根据上表数据,用最小二乘法求出线性回归方程a x by ˆˆ+=; (3)估计使用10年时,维修费用是多少?【分析】利用描点法画出散点图,用公式x by axn x yx n yx bi n i ii ni ˆˆ,ˆ2211=-=--=∑∑=⋅⋅求得回归直线方程,取x =10求得结果. 解:(1)散点图如图(2)y =0.08+1.23x (3)12.38【评析】判断两个变量有无相关关系时,散点图直观简便,这是一道应用问题,通过回归直线方程分析使用年限和维修费用的关系.例7 某工厂有工人1000名,其中250名工人参加过短期培训(称为A 类工人),另外750名工人参加过长期培训(称为B 类工人),现用分层抽样方法(按A 类、B 类分二层)从该工厂的工人中共抽查100名工人,调查他们的生产能力(此处生产能力指一天加工的零件数).(Ⅰ)求甲、乙两工人都被抽到的概率,其中甲为A 类工人,乙为B 类工人; (Ⅱ)从A 类工人中的抽查结果和从B 类工人中的抽查结果分别如下表1和表2. 生产能力分组 [100,110) [110,120) [120,130) [130,140) [140,150)人数 48x 5 3表2生产能力分组[110,120)[120,130)[130,140)[140,150)人数6y3618(i )先确定x ,y ,再在答题纸上完成下列频率分布直方图.就生产能力而言,A 类工人中个体间的差异程度与B 类工人中个体间的差异程度哪个更小?(不用计算,可通过观察直方图直接回答结论)图1 A 类工人生产能力的频率分布直方图图2 B 类工人生产能力的频率分布直方图(ii )分别估计A 类工人和B 类工人生产能力的平均数,并估计该工厂工人的生产能力的平均数(同一组中的数据用该组区间的中点值作代表).【分析】(1)相互独立事件同时发生的概率用乘法公式(2)画出直方图,从图中分析数据信息.解:(Ⅰ)甲乙被抽到的概率都是101,而且事件“甲工人被抽到”与“乙工人被抽到”相互独立,所以甲、乙两工人都被抽到的概率⋅=⨯=1001101101pA 类工人中和B 类工人中分别抽查25名和75名.(Ⅱ)(i)由4+8+x +5+3=25,得x =5;6+y +36+18=75,得y =15.频率分布直方图如下图1 A 类工人生产能力的频率分布直方图图2 B 类工人生产能力的频率分布直方图从直方图可以判断:B 类工人中个体间的差异程度更小.,123145253135255125255115258105254)ii (=⨯+⨯+⨯⋅+⨯+⨯=A x ,8.133145751813575361257515115756=⨯+⨯+⨯+⨯=B x1.1318.1331007512310025=⨯+⨯=x . A 类工人生产能力的平均数,B 类工人生产能力的平均数以及全厂工人生产能力的平均数的估计值分别为123,133.8和131.1.【评析】本题是一道综合应用题,通过语言叙述和图表给出信息.频率分布直方图反映了数据分布的情况,数据的差异大小及数据的方差大小.练习10-3一、选择题1.(08重庆)某校高三年级有男生500人,女生400人,为了解该年级学生的健康情况,从男生中任意抽取25人,从女生中任意抽取20人进行调查.这种抽样方法是( ) A .简单随机抽样法 B .抽签法 C .随机数表法 D .分层抽样法2.从容量为N 的总体中抽取容量为n 的样本,若采用系统抽样法,则抽样间隔为( ) A .nN B .n C .][nN D .1][+nN3.(08山东)下图是根据《山东统计年整2007》中的资料做成的1997年至2006年我省城镇居民百户家庭人口数的茎叶图.图中左边的数字从左到右分别表示城镇居民百户家庭人口数的百位数字和十位数字,右边的数字表示城镇居民百户家庭人口数的个位数字,从图中可以得到1997年至2006年我省城镇居民百户家庭人口数的平均数为( )A .304.6B .303.6C .302.6D .301.6 4.甲、乙、丙三名射箭运动员在某次测试中各射箭20次,三人的测试成绩如下表甲的成绩乙的成绩丙的成绩环数 7 8 9 10 环数 7 8 9 10 环数 7 8 9 10 频数 55 5 5频数 6446频数 46641,2,3分别表示甲、乙、丙三名运动员这次测试成绩的标准差,则有( ) A .s 3>s 1>s 2 B .s 2>s 1>s 3 C .s 1>s 2>s 3 D .s 2>s 3>s 1二、填空题 5.要考察某公司生产的500克袋装牛奶的质量是否达标,现从800袋牛奶中抽取60袋进行检验,将它们编号为001,002,……800,利用随机数表抽取样本,从第7行第1个数开始,依次向右,再到下一行,继续从左到右.请问选出的第七袋牛奶的标号是______. (为了便于说明,下面摘取了随机数表的第6行至第10行).16 22 77 94 39 49 54 43 54 82 17 37 93 23 78 87 35 20 96 43 84 26 34 91 64 84 42 17 53 31 57 24 55 06 88 77 04 74 47 67 21 76 33 50 25 83 92 12 06 76 63 01 63 78 59 16 95 55 67 19 98 10 50 71 75 12 86 73 58 07 44 39 52 38 79 33 21 12 34 29 78 64 56 07 82 52 42 07 44 38 15 51 00 13 42 99 66 02 79 54 57 60 86 32 44 09 47 27 96 54 49 17 46 09 62 90 52 84 77 27 08 02 73 43 28。
2020高考数学高考大题专项6 高考中的概率与统计

典例剖析
高考大题专项六 高考中的概率与统计
考情分析
典例剖析
-2-
一、考查范围全面 概率与统计解答题对知识点的考查较为全面,近五年的试题考点 覆盖了概率与统计必修与选修的各个章节内容,考查了抽样方法, 统计图表、数据的数字特征、用样本估计总体、回归分析、相关 系数的计算、独立性检验、古典概型、条件概率、相互独立事件 的概率、独立重复试验的概率、离散型随机变量的分布列、数学 期望与方差、超几何分布、二项分布、正态分布等基础知识和基 本方法.
考情分析
典例剖析
-4-
题型一
题型二
题型三
题型四
题型一 相关关系的判断及回归分析 例1(2018黑龙江模拟,19)班主任为了对本班学生的考试成绩进行 分析,决定从本班24名女同学,18名男同学中随机抽取一个容量为7 的样本进行分析. (1)如果按照性别比例分层抽样,可以得到多少个不同的样本?(写 出算式即可,不必计算出结果) (2)如果随机抽取的7名同学的数学、物理成绩(单位:分)对应如 下表:
和数学期望;
②根据上表数据,求物理成绩y关于数学成绩x的线性回归方程(系
数精确到0.01);若班上某位同学的数学成绩为96分,预测该同学的
物理成绩为多少分?
附:线性回归方程^������=bx+a,
n
其中 b=i=∑1(������������������-������)(���������2���-������),a=������-b������.
将其分成几个部分分别计算,这样等同于分散难点,各个攻破,提高
了计算的准确度.
考情分析
典例剖析
-9-
题型一
题型二
题型三
题型四
2020高考数学高考大题专项六 高考中的概率与统计

2016年的数据(时间变量t的值依次为1,2,…,7)建立模型
②:y=99+17.5t.
(1)分别利用这两个模型,求该地区2018年的环境基础设施投资额 的预测值;
(2)你认为用哪个模型得到的预测值更可靠?并说明理由.
学生序号 i
1234567
数学成绩 xi 物理成绩 yi
60 65 70 75 85 87 90 70 77 80 85 90 86 93
随堂巩固
-5-
题型一
题型二
题型三
题型四
①若规定85分以上(包括85分)为优秀,从这7名同学中抽取3名同
学,记3名同学中数学和物理成绩均为优秀的人数为ξ,求ξ的分布列
随堂巩固
-4-
题型一
题型二
题型三
题型四
相关关系的判断及回归分析 例1(2018黑龙江模拟,19)班主任为了对本班学生的考试成绩进行 分析,决定从本班24名女同学,18名男同学中随机抽取一个容量为7 的样本进行分析. (1)如果按照性别比例分层抽样,可以得到多少个不同的样本?(写 出算式即可,不必计算出结果) (2)如果随机抽取的7名同学的数学、物理成绩(单位:分)对应如 下表:
=
1.
35
∴ξ 的分布列为
ξ
0
1
2
3
P
4 35
18 35
12 35
1 35
题型一
题二
题型三
题型四
随堂巩固
-7-
∴Eξ=0×
345+1×
1385+2×
1325+3×
2020版高考数学复习专项突破6高考中的概率、统计与统计案例课件文北师大版

∴b=434-432 = 2,
5 a=27-2×12=-3, 5 y=2x-3.
977-972
5
∴y 关于 x 的线性回归方程为
5 (3)当 x=10 时,y= ×10-3=22,|22-23|<2, 2 5 当 x=8 时,y=2×8-3=17,|17-16|<2.
������甲 = =195(cm), 乙厂这批轮胎宽度的平均值为
1
1 (195+194+196+193+194+197+196+195+193+197) 10
������乙 = 10(195+196+193+192+195+194+195+192+195+193) =194(cm).
-14题型一
-10题型一
题型二
题型三
题型四
题型五
题型六
④由茎叶图可知:用第一种生产方式的工人完成生产任务所需时
间分布在茎8上的最多,关于茎8大致呈对称分布;用第二种生产方 式的工人完成生产任务所需时间分布在茎7上的最多,关于茎7大致 呈对称分布.又用两种生产方式的工人完成生产任务所需时间分布 的区间相同,故可以认为用第二种生产方式完成生产任务所需的时 间比用第一种生产方式完成生产任务所需的时间更少.因此第二种 生产方式的效率更高. 以上给出了4种理由,考生答出其中任意一种或其他合理理由即 可.
所得到的线性回归方程是可靠的.
-19题型一
题型二
题型三
题型四
题型五
题型六
解题心得在求两变量相关系数和两变量的回归方程时,由于r和b 的计算公式比较复杂,求它们的值时计算量比较大,因此为了计算 准确,可将它们分成几个部分分别计算,这样等同于分散难点,各个 攻破,提高了计算的准确度.
高考数学大一轮复习高考必考题突破讲座6概率与统计的综合问题课时达标理(含解析)新人教A版

高考数学大一轮复习高考必考题突破讲座6概率与统计的综合问题课时达标理(含解析)新人教A 版高考必考题突破讲座 (六)1.已知某班n 名同学的数学测试成绩(单位:分,满分100分)的频率分布直方图如图所示,其中a ,b ,c 成等差数列,且成绩在[90,100]内的有6人.(1)求n 的值;(2)若成绩在[40,50)内的人数是成绩在[50,60)内的人数的13,规定60分以下为不及格,从不及格的人中任意选取3人,求成绩在50分以下的人数X 的分布列和数学期望.解析 (1)依题意得⎩⎪⎨⎪⎧100.035+0.025+c +2b +a =1,2b =a +c⇒b =0.01,因为成绩在[90,100]内的有6人,所以n =60.01×10=60.(2)由⎩⎪⎨⎪⎧a +c =0.02,c =3a⇒⎩⎪⎨⎪⎧a =0.005,c =0.015,于是成绩在[40,50)及[50,60)内的人数分别为3和9,即不及格的人数为12,从中任选3人,则成绩在50分以下的人数X 的所有可能取值为0,1,2,3.且P (X =0)=C 39C 03C 312=2155,P (X =1)=C 29C 13C 312=2755,P (X =2)=C 19C 23C 312=27220,P (X =3)=C 09C 33C 312=1220,所以X 的分布列如下X 0 1 2 3P2155 2755 27220 1220故X 的数学期望为E (X )=0×55+1×55+2×220+3×1220=34.2.下图是某市11月1日至14日的空气质量指数趋势图,空气质量指数(AQI)小于100表示空气质量优良,空气质量指数大于200表示空气重度污染,某人随机选择11月1日至11月12日中的某一天到达该市,并停留3天.(1)求此人到达当日空气重度污染的概率;(2)设ξ是此人停留期间空气重度污染的天数,求ξ的分布列与数学期望. 解析 设A i 表示事件“此人于11月i 日到达该市”(i =1,2,…,12). 依题意知,P (A i )=112,且A i ∩A j =∅(i ≠j ).(1)设B 为事件“此人到达当日空气重度污染”,则B =A 1∪A 2∪A 3∪A 7∪A 12, 所以P (B )=P (A 1∪A 2∪A 3∪A 7∪A 12)=P (A 1)+P (A 2)+P (A 3)+P (A 7)+P (A 12)=512.即此人到达当日空气重度污染的概率为512.(2)由题意可知,ξ的所有可能取值为0,1,2,3.P (ξ=0)=P (A 4∪A 8∪A 9)=P (A 4)+P (A 8)+P (A 9)=312=14, P (ξ=2)=P (A 2∪A 11)=P (A 2)+P (A 11)=212=16, P (ξ=3)=P (A 1∪A 12)=P (A 1)+P (A 12)=212=16,P (ξ=1)=1-P (ξ=0)-P (ξ=2)-P (ξ=3)=1-14-16-16=512,所以ξ的分布列为ξ 0 1 2 3 P14 512 16 16故ξ的数学期望E (ξ)=0×4+1×12+2×6+3×6=54.3.(2019·焦作模拟)某单位共10名员工,他们某年的收入如下表.员工编号 123 4567 89 10年薪/万元 3 3.5 4 5 5.5 6.5 7 7.5 8 50(1)求该单位员工当年年薪的平均值和中位数;(2)从该单位中任取2人,此2人中年薪收入高于5万的人数记为ξ,求ξ的分布列和期望;(3)已知员工年薪收入与工作年限成正线性相关关系,若某员工工作第一年至第四年的年薪分别为3万元,4.2万元,5.6万元,7.2万元,预测该员工第五年的年薪为多少?附:线性回归方程y ^=b ^x +a ^中系数计算公式b ^=∑i =1nx i -x-y i -y-∑i =1nx i -x-2,a ^=y --b ^x -,其中x -,y -表示样本均值.解析 (1)平均值为10万元,中位数为6万元.(2)年薪高于5万的有6人,低于或等于5万的有4人,ξ取值为0,1,2. P (ξ=0)=C 24C 210=215,P (ξ=1)=C 14C 16C 210=815,P (ξ=2)=C 26C 210=13,所以ξ的分布列为ξ 0 1 2 P215 815 13数学期望为E (ξ)=0×215+1×15+2×3=5.(3)设x i ,y i (i =1,2,3,4)分别表示工作年限及相应年薪, 则x -=2.5,y -=5,∑i =14x i -x -)2=2.25+0.25+0.25+2.25=5,∑i =14x i -x -)(y i -y -)=-1.5×(-2)+(-0.5)×(-0.8)+0.5×0.6+1.5×2.2=7,b ^=∑i =14x i -x-y i -y-∑i =14x i -x-2=75=1.4, a ^=y --b ^x -=5-1.4×2.5=1.5,因此线性回归方程为y =1.4x +1.5,可预测该员工第5年的年薪收入为8.5万元.4.(2018·全国卷Ⅰ)某工厂的某种产品成箱包装,每箱200件,每一箱产品在交付用户之前要对产品作检验,如检验出不合格品,则更换为合格品.检验时,先从这箱产品中任取20件作检验,再根据检验结果决定是否对余下的所有产品作检验,设每件产品为不合格品的概率都为p(0<p<1),且各件产品是否为不合格品相互独立.(1)记20件产品中恰有2件不合格品的概率为f(p),求f(p)的最大值点p0.(2)现对一箱产品检验了20件,结果恰有2件不合格品,以(1)中确定的p0作为p的值.已知每件产品的检验费用为2元,若有不合格品进入用户手中,则工厂要对每件不合格品支付25元的赔偿费用.①若不对该箱余下的产品作检验,这一箱产品的检验费用与赔偿费用的和记为X,求E(X).②以检验费用与赔偿费用和的期望值为决策依据,是否该对这箱余下的所有产品作检验?解析(1)由题意知,20件产品中恰有2件不合格品的概率为f(p)=C220p2(1-p)18.因此,f′(p)=C220[2p(1-p)18-18p2(1-p)17]=2C220p(1-p)17·(1-10p).令f′(p)=0,得p=0.1.当p∈(0,0.1)时,f′(p)>0;当p∈(0.1,1)时,f′(p)<0,所以f(p)的最大值点p0=0.1.(2)由(1)知,p=0.1.①令Y表示余下的180件产品中的不合格品的件数.依题意知,Y~B(180,0.1),X=20×2+25Y,即X=40+25Y.所以E(X)=E(40+25Y)=40+25E(Y)=40+25×180×0.1=490.②如果对余下的所有产品作检验,那么这一箱产品所需要的检验费用为400元.由于E(X)>400,因此应该对这箱余下的所有产品作检验.5.(2019·甘肃兰州诊断)“中国式过马路”是网友对部分中国人集体闯红灯现象的一种调侃.即“凑够一撮人就可以走了,和红绿灯无关”,某校研究性学习小组对全校学生按“跟从别人闯红灯”“从不闯红灯”“带头闯红灯”等三种形式过马路进行调查,获得下表数据:闯红灯”的人中抽取了66人.(1)求n的值;(2)在所抽取的“带头闯红灯”的人中,任选2人参加星期天社区组织的“文明交通”宣传活动,求这2人中至少有1人是女生的概率.解析 (1)由题意得,66980+340=n980+340+410+150+60+60,解得n =100.(2)因为所有参与调查的人数为980+340+410+150+60+60=2 000,所以从“带头闯红灯”的人中用分层抽样的方法抽取的人数为(60+60)×1002 000=6,其中男生有60×1002 000=3人,女生有60×1002 000=3人,将这3名男生用A 1,A 2,A 3表示,3名女生用B 1,B 2,B 3表示,则从这6人中任选2人的所有基本事件为A 1A 2,A 1A 3,A 2A 3,A 1B 1,A 1B 2,A 1B 3,A 2B 1,A 2B 2,A 2B 3,A 3B 1,A 3B 2,A 3B 3,B 1B 2,B 1B 3,B 2B 3,共15个.这2人均是男生的基本事件有A 1A 2,A 1A 3,A 2A 3,共3个,记“这2人中至少有1人是女生”为事件M ,则M 包含的基本事件共有12个,所以P (M )=1215=45.故从这6人中任选2人,至少有1个是女生的概率为45.6.(2018·全国卷Ⅲ)某工厂为提高生产效率,开展技术创新活动,提出了完成某项生产任务的两种新的生产方式.为比较两种生产方式的效率,选取40名工人,将他们随机分成两组,每组20人.第一组工人用第一种生产方式,第二组工人用第二种生产方式.根据工人完成生产任务的工作时间(单位:min)绘制了如下茎叶图:(1)根据茎叶图判断哪种生产方式的效率更高?并说明理由.(2)求40名工人完成生产任务所需时间的中位数m ,并将完成生产任务所需时间超过m 和不超过m 的工人数填入下面的列联表中:超过m 不超过m 第一种生产方式 第二种生产方式(3)根据(2) 附:K 2=n ad -bc 2a +bc +d a +cb +d,P (K 2≥k 0) 0.050 0.010 0.001k 03.841 6.635 10.828解析 (1)(ⅰ)由茎叶图可知:用第一种生产方式的工人中,有75%的工人完成生产任务所需时间至少为82 min ;用第二种生产方式的工人中,有75%的工人完成生产任务所需时间至多78 min.因此第二种生产方式的效率更高.(ⅱ)由茎叶图可知:用第一种生产方式的工人完成生产任务所需时间的中位数为85.5 min ;用第二种生产方式的工人完成生产任务所需时间的中位数为73.5 min.因此第二种生产方式的效率更高.(ⅲ)由茎叶图可知:用第一种生产方式的工人完成生产任务平均所需时间高于80 min ;用第二种生产方式的工人完成生产任务平均所需时间低于80 min.因此第二种生产方式的效率更高.(ⅳ)由茎叶图可知:用第一种生产方式的工人完成生产任务所需时间分布在茎8上的最多,关于茎8大致呈对称分布;用第二种生产方式的工人完成生产任务所需时间分布在茎7上的最多,关于茎7大致呈对称分布.又用两种生产方式的工人完成生产任务所需的时间比用第一种生产方式完成生产任务所需的时间更少,因此第二种生产方式的效率更高.(以上给出了4种理由,考生答出其中任意一种或其他合理理由均可得分)(2)由茎叶图知m =79+812=80.列联表如下:超过m 不超过m 第一种生产方式 15 5 第二种生产方式515(3)由于K 2=40220×20×20×20=10>6.635,所以有99%的把握认为两种生产方式的效率有差异.。
2020版高考数学大一轮复习高考必考题突破讲座6概率与统计的综合问题课时达标理含解析新人教A

高考必考题突破讲座 (六)1.已知某班n 名同学的数学测试成绩(单位:分,满分100分)的频率分布直方图如图所示,其中a ,b ,c 成等差数列,且成绩在[90,100]内的有6人.(1)求n 的值;(2)若成绩在[40,50)内的人数是成绩在[50,60)内的人数的,规定60分以下为不及格,13从不及格的人中任意选取3人,求成绩在50分以下的人数X 的分布列和数学期望.解析 (1)依题意得Error!⇒b =0.01, 因为成绩在[90,100]内的有6人,所以n ==60.60.01×10(2)由Error!⇒Error!于是成绩在[40,50)及[50,60)内的人数分别为3和9,即不及格的人数为12,从中任选3人,则成绩在50分以下的人数X 的所有可能取值为0,1,2,3.且P (X =0)==,P (X =1)==,C 39C 03C 3122155C 29C 13C 3122755P (X =2)==,P (X =3)==,C 19C 23C 31227220C 09C3C 3121220所以X 的分布列如下X 0123P21552755272201220故X 的数学期望为E (X )=0×+1×+2×+3×=.21552755272201220342.下图是某市11月1日至14日的空气质量指数趋势图,空气质量指数(AQI)小于100表示空气质量优良,空气质量指数大于200表示空气重度污染,某人随机选择11月1日至11月12日中的某一天到达该市,并停留3天.(1)求此人到达当日空气重度污染的概率;(2)设ξ是此人停留期间空气重度污染的天数,求ξ的分布列与数学期望.解析 设A i 表示事件“此人于11月i 日到达该市”(i =1,2,…,12). 依题意知,P (A i )=,且A i ∩A j =∅(i ≠j ).112(1)设B 为事件“此人到达当日空气重度污染”,则B =A 1∪A 2∪A 3∪A 7∪A 12,所以P (B )=P (A 1∪A 2∪A 3∪A 7∪A 12)=P (A 1)+P (A 2)+P (A 3)+P (A 7)+P (A 12)=.512即此人到达当日空气重度污染的概率为.512(2)由题意可知,ξ的所有可能取值为0,1,2,3.P (ξ=0)=P (A 4∪A 8∪A 9)=P (A 4)+P (A 8)+P (A 9)==, 31214P (ξ=2)=P (A 2∪A 11)=P (A 2)+P (A 11)==,21216P (ξ=3)=P (A 1∪A 12)=P (A 1)+P (A 12)==,21216P (ξ=1)=1-P (ξ=0)-P (ξ=2)-P (ξ=3)=1---=,141616512所以ξ的分布列为ξ0123P145121616故ξ的数学期望E (ξ)=0×+1×+2×+3×=.145121616543.(2019·焦作模拟)某单位共10名员工,他们某年的收入如下表.员工编号12345678910年薪/万元33.5455.56.577.5850(1)求该单位员工当年年薪的平均值和中位数;(2)从该单位中任取2人,此2人中年薪收入高于5万的人数记为ξ,求ξ的分布列和期望;(3)已知员工年薪收入与工作年限成正线性相关关系,若某员工工作第一年至第四年的年薪分别为3万元,4.2万元,5.6万元,7.2万元,预测该员工第五年的年薪为多少?附:线性回归方程=x +中系数计算公式y ^ b ^ a ^=,=-,其中,表示样本均值.b ^n∑i =1x i -x-y i -y -n∑i =1x i -x -2a ^ y -b ^ x - x - y -解析 (1)平均值为10万元,中位数为6万元.(2)年薪高于5万的有6人,低于或等于5万的有4人,ξ取值为0,1,2.P (ξ=0)==,P (ξ=1)==,P (ξ=2)==,C 24C 210215C 14C 16C 210815C 26C 21013所以ξ的分布列为ξ012P21581513数学期望为E (ξ)=0×+1×+2×=.2158151365(3)设x i ,y i (i =1,2,3,4)分别表示工作年限及相应年薪,则=2.5,=5,x i -)2=2.25+0.25+0.25+2.25=5, x - y -4∑i =1x -x i-)(y i-)=-1.5×(-2)+(-0.5)×(-0.8)+0.5×0.6+1.5×2.2=7,4∑i =1x- y -===1.4,b ^4∑i =1x i -x-y i -y -4∑i =1x i -x -275=-=5-1.4×2.5=1.5,因此线性回归方程为y =1.4x +1.5,可预测该员工a ^y - b ^ x -第5年的年薪收入为8.5万元.4.(2018·全国卷Ⅰ)某工厂的某种产品成箱包装,每箱200件,每一箱产品在交付用户之前要对产品作检验,如检验出不合格品,则更换为合格品.检验时,先从这箱产品中任取20件作检验,再根据检验结果决定是否对余下的所有产品作检验,设每件产品为不合格品的概率都为p (0<p <1),且各件产品是否为不合格品相互独立.(1)记20件产品中恰有2件不合格品的概率为f (p ),求f (p )的最大值点p 0.(2)现对一箱产品检验了20件,结果恰有2件不合格品,以(1)中确定的p 0作为p 的值.已知每件产品的检验费用为2元,若有不合格品进入用户手中,则工厂要对每件不合格品支付25元的赔偿费用.①若不对该箱余下的产品作检验,这一箱产品的检验费用与赔偿费用的和记为X ,求E (X ).②以检验费用与赔偿费用和的期望值为决策依据,是否该对这箱余下的所有产品作检验?解析 (1)由题意知,20件产品中恰有2件不合格品的概率为f (p )=C p 2(1-p )18.220因此,f ′(p )=C [2p (1-p )18-18p 2(1-p )17]=2C p (1-p )17·(1-10p ).令f ′(p )=2202200,得p =0.1.当p ∈(0,0.1)时,f ′(p )>0;当p ∈(0.1,1)时,f ′(p )<0,所以f (p )的最大值点p 0=0.1.(2)由(1)知,p =0.1.①令Y 表示余下的180件产品中的不合格品的件数.依题意知,Y ~B (180,0.1),X =20×2+25Y ,即X =40+25Y .所以E (X )=E (40+25Y )=40+25E (Y )=40+25×180×0.1=490. ②如果对余下的所有产品作检验,那么这一箱产品所需要的检验费用为400元.由于E (X )>400,因此应该对这箱余下的所有产品作检验.5.(2019·甘肃兰州诊断)“中国式过马路”是网友对部分中国人集体闯红灯现象的一种调侃.即“凑够一撮人就可以走了,和红绿灯无关”,某校研究性学习小组对全校学生按“跟从别人闯红灯”“从不闯红灯”“带头闯红灯”等三种形式过马路进行调查,获得下表数据:跟从别人闯红灯从不闯红灯带头闯红灯男生98041060女生34015060用分层抽样的方法,从所有被调查的人中抽取一个容量为n 的样本,其中在“跟从别人闯红灯”的人中抽取了66人.(1)求n 的值;(2)在所抽取的“带头闯红灯”的人中,任选2人参加星期天社区组织的“文明交通”宣传活动,求这2人中至少有1人是女生的概率.解析 (1)由题意得,=,解得n =100.66980+340n980+340+410+150+60+60(2)因为所有参与调查的人数为980+340+410+150+60+60=2 000,所以从“带头闯红灯”的人中用分层抽样的方法抽取的人数为(60+60)×=6,其中男生有60×=1002 0001002 0003人,女生有60×=3人,将这3名男生用A 1,A 2,A 3表示,3名女生用B 1,B 2,B 3表1002 000。
2020年高考理科数学复习高考必考题突破讲座(六)统计与概率、随机变量及其分布列

高考必考题突破讲座(六) 统计与概率、随机变量及其分布列题型特点考情分析命题趋势1.常见概率模型的计算几何概型、古典概型、相互独立事件与互斥事件的概率、条件概率是高考的热点,几何概型主要以客观题考查,求解的关键在于找准测度(面积,体积或长度);相互独立事件、互斥事件常作为解答题的一问考查,也是进一步求分布列、期望与方差的基础,求解该类问题要正确理解题意,准确判定概率模型,恰当选择概率公式.2.离散型随机变量的分布列、均值与方差离散型随机变量及其分布列、均值与方差及应用是数学高考的一大热点,常有解答题的考查,属于中档题.复习中应强化应用类习题的理解与掌握,弄清随机变量的所有取值,它是正确求随机变量分布列和求均值与方差的关键,对概率模型的确定与转化是解题的基础,准确计算是解题的核心,在备考中应强化解答题的规范性训练.3.概率与统计的综合应用概率与统计作为考查考生应用意识的重要载体,已成为近几年高考的一大亮点.主要依托点是统计图表,正确认识和使用这些图表是解决问题的关键.复习时要在这些图表上下工夫,把这些统计图表的含义弄清楚,在此基础上掌握好样本特征数的计数方法、各类概率的计算方法及数学均值与方差的运算.4.统计与统计案例能根据给出的线性回归方程系数公式求线性回归方程,了解独立性检验的基本思想、方法,在选择或填空题中常涉及频率分布直方图、茎叶图及样本的数字特征(如平均数、方差)的考查,解答题中也有所考查.【例1】 现有4个人去参加某娱乐活动,该活动有甲、乙两个游戏可供参加者选择.为增加趣味性,约定:每个人通过掷一枚质地均匀的骰子决定自己去参加哪个游戏,掷出点数为1或2的人去参加甲游戏,掷出点数大于2的人去参加乙游戏.(1)求这4个人中恰有2人去参加甲游戏的概率;(2)求这4个人中去参加甲游戏的人数大于去参加乙游戏的人数的概率;(3)用X ,Y 分别表示这4个人中去参加甲、乙游戏的人数,记ξ=|X -Y |,求随机变量ξ的分布列.解析 依题意,这4个人中,每个人去参加甲游戏的概率为13,去参加乙游戏的概率为23.设“这4个人恰有i 人去参加甲游戏”事件A i (i =0,1,2,3,4). 则P (A i )=C i 4⎝⎛⎭⎫13i ⎝⎛⎭⎫234-i.(1)这4个人中恰有2人参加甲游戏的概率 P (A 2)=C 24⎝⎛⎭⎫132⎝⎛⎭⎫232=827.(2)设“这4个人中去参加甲游戏的人数大于去参加乙游戏的人数”为事件B ,则B =A 3+A 4且A 3与A 4互斥.故P (B )=P (A 3+A 4)=P (A 3)+P (A 4)=C 34⎝⎛⎭⎫133×23+C 44⎝⎛⎭⎫134=19. (3)依题设,ξ的所有可能取值为0,2,4. 且A 1与A 3互斥,A 0与A 4互斥. 则P (ξ=0)=P (A 2)=827,P (ξ=2)=P (A 1+A 3)=P (A 1)+P (A 3)=C 14⎝⎛⎭⎫131·⎝⎛⎭⎫233+C 34⎝⎛⎭⎫133×23=4081, P (ξ=4)=P (A 0+A 4)=P (A 0)+P (A 4)=C 04⎝⎛⎭⎫234+C 44⎝⎛⎭⎫134=1781. 于是ξ的分布列是【例2】 (2017·北京卷)名患者随机分成两组,每组各50名,一组服药,另一组不服药.一段时间后,记录了两组患者的生理指标x 和y 的数据,并制成下图,其中“*”表示服药者,“+”表示未服药者.(1)从服药的50名患者中随机选出一人,求此人指标y 的值小于60的概率;(2)从图中A ,B ,C ,D 四人中随机选出两人,记ξ为选出的两人中指标x 的值大于1.7的人数,求ξ的分布列和数学期望E (ξ);(3)试判断这100名患者中服药者指标y 数据的方差与未服药者指标y 数据的方差的大小(只需写出结论).解析 (1)由图知,在服药的50名患者中,指标y 的值小于60的有15人.所以从服药的50名患者中随机选出一人,此人指标y 的值小于60的概率为1550=0.3.(2)由图知,A ,B ,C ,D 四人中,指标x 的值大于1.7的有2人:A 和C . 所以ξ的所有可能取值为0,1,2.P (ξ=0)=C 22C 24=16,P (ξ=1)=C 12C 12C 24=23,P (ξ=2)=C 22C 24=16.所以ξ的分布列为故ξ的期望E (ξ)=0×16+1×23+2×16=1.(3)在这100名患者中,服药者指标y 数据的方差大于未服药者指标y 数据方差. 【例3】 (2018·湖南长沙一模)2018年6月14日至7月15日,第21届世界杯足球赛将于俄罗斯举行,某大学为世界杯组委会招收志愿者,被招收的志愿者需参加笔试和面试,把参加笔试的40名大学生的成绩分组:第1组[75,80),第2组[80,85),第3组[85,90),第4组[90,95),第5组[95,100],得到的频率分布直方图如图所示.(1)分别求出成绩在第3,4,5组的人数;(2)现决定在笔试成绩较高的第3,4,5组中用分层抽样抽出6人进行面试.①已知甲和乙的成绩均在第3组,求甲或乙进入面试的概率,②若从这6名学生中随机抽取2名学生接受考官D 的面试,设第4组中有X 名学生被考官D 面试,求X 的分布列和数学期望.解析 (1)由频率分布直方图知: 第3组的人数为5×0.06×40=12; 第4组的人数为5×0.04×40=8; 第5组的人数为5×0.02×40=4.(2)利用分层抽样,在第3组,第4组,第5组中分别抽取3人,2人,1人. ①设“甲或乙进入第二轮面试”为事件A ,则 P (A )=1-C 310C 312=511,所以甲或乙进入第二轮面试的概率为511.②X 的所有可能取值为0,1,2,P (X =0)=C 24C 26=25,P (X =1)=C 12C 14C 26=815,P (X =2)=C 22C 26=115.所以X 的分布列为E (X )=0×25+1×815+2×115=1015=23.【例4】 下图是我国2011年至2017年生活垃圾无害化处理量(单位:亿吨)的折线图.(1)由折线图看出,可用线性回归模型拟合y 与t 的关系,请用相关系数加以说明; (2)建立y 关于t 的回归方程(系数精确到0.01),预测2019年我国生活垃圾无害化处理量.附注:参考数据:∑i =17y i =9.32,∑i =17t i y i =40.17,∑i =17(y i -y )2=0.55,7=2.646.参考公式:相关系数r =∑i =1n(t i -t )(y i -y )∑i =1n(t i -t )2∑i =1n(y i -y )2,回归方程y ^=a ^+b ^t 中斜率和截距的最小二乘法估计公式分别为b ^=∑i =1n(t i -t )(y i -y )∑i =1n(t i -t )2,a ^=y -b ^t .解析 (1)由折线图中数据和附注中参考数据得 t =4,∑i =17(t i -t )2=28,∑i =17(y i -y -)2=0.55,∑i =17(t i -t -)(y i -y -)=∑i =17t i y i -t -∑i =17y i =40.17-4×9.32=2.89,r ≈2.890.55×2×2.646≈0.99.因为y 与t 的相关系数近似为0.99,说明y 与t 的线性相关程度相当高,从而可以用线性回归模型拟合y 与t 的关系.(2)由y -=9.327≈1.331及(1)得b ^=∑i =17(t i -t -)(y i -y -)∑i =17(t i -t -)2=2.8928≈0.103,a ^=y --b ^t -=1.331-0.103×4≈0.92.所以y 关于t 的回归方程为y ^=0.92+0.10t .将2019年对应的t=9代入回归方程得y ^=0.92+0.10×9=1.82. 所以预测2019年我国生活垃圾无害化处理量约为1.82亿吨.1.(2018·河北沧州一模)甲乙两人进行围棋比赛,约定先连胜两局者直接赢得比赛,若赛完5局仍未出现连胜,则判定获胜局数多者赢得比赛.假设每局甲获胜的概率为23,乙获胜的概率为13,各局比赛结果相互独立.(1)求甲在4局以内(含4局)赢得比赛的概率;(2)记X 为比赛决出胜负时的总局数,求X 的分布列和数学期望.解析 用A 表示“甲在4局以内(含4局)赢得比赛”,A k 表示“第k 局甲获胜”,B k 表示“第k 局乙获胜”,则P (A k )=23,P (B k )=13,k =1,2,3,4,5.(1)P (A )=P (A 1A 2)+P (B 1A 2A 3)+P (A 1B 2A 3A 4)=P (A 1)P (A 2)+P (B 1)P (A 2)P (A 3)+P (A 1)P (B 2)P (A 3)P (A 4) =⎝⎛⎭⎫232+13×⎝⎛⎭⎫232+23×13×⎝⎛⎭⎫232=5681. (2)X 的可能取值为2,3,4,5. P (X =2)=P (A 1A 2)+P (B 1B 2) =P (A 1)P (A 2)+P (B 1)P (B 2)=59,P (X =3)=P (B 1A 2A 3)+P (A 1B 2B 3)=P (B 1)P (A 2)P (A 3)+P (A 1)P (B 2)P (B 3)=29,P (X =4)=P (A 1B 2A 3A 4)+P (B 1A 2B 3B 4)=P (A 1)P (B 2)P (A 3)P (A 4)+P (B 1)P (A 2)P (B 3)P (B 4)=1081,P (X =5)=1-P (X =2)-P (X =3)-P (X =4)=881.故X 的分布列为E (X )=2×59+3×29+4×1081+5×881=22481.2.(2018·广东广州质检)从某居民区随机抽取10个家庭,获得第i 个家庭的月收入x i (单位:千元)与月储蓄y i (单位:千元)的数据资料,算得∑i =110x i =80,∑i =110y i =20,∑i =110x i y i =184,∑i =110x2i =720.(1)求家庭的月储蓄y 对月收入x 的线性回归方程y ^=b ^x +a ^; (2)判断变量x 与y 之间是正相关还是负相关;(3)若该居民区某家庭月收入为7千元,预测该家庭的月储蓄.附:线性回归方程y ^=b ^x +a ^中,b ^=∑i =1nx i y i -n x y ∑i =1nx 2i -n x2,a ^=y -b ^x ,其中x ,y 为样本平均值.解析 (1)由题意知n =10,x =1n ∑i =1n x i =8010=8,y =1n ∑i =1n y i =2010=2,l xx =∑i =1n x 2i -n x 2=80,又l xy =∑i =1nx i y i -n x y =184-10×8×2=24,由此得b ^=l xy l xx =2480=0.3,a ^=y -b ^x =2-0.3×8=-0.4, 故所求线性回归方程为y ^=0.3x -0.4.(2)由于变量y 的值随x 值的增加而增加(b ^=0.3>0),故x 与y 之间是正相关. (3)将x =7代入回归方程可以预测该家庭的月储蓄为y ^=0.3×7-0.4=1.7(千元). 3.(2017·全国卷Ⅱ)海水养殖场进行某水产品的新、旧网箱养殖方法的产量对比,收获时各随机抽取了100个网箱,测量各箱水产品的产量(单位:kg),其频率分布直方图如下.(1)设两种养殖方法的箱产量相互独立,记A 表示事件“旧养殖法的箱产量低于50 kg,新养殖法的箱产量不低于50 kg”,估计A的概率;(2)填写下面的列联表,并根据列联表判断是否有99%的把握认为箱产量与养殖方法有关;(3)(精确到0.01).附:K2=n(ad-bc)(a+b)(c+d)(a+c)(b+d).解析(1)记B表示事件“旧养殖法的箱产量低于50 kg”,C表示事件“新养殖法的箱产量不低于50 kg”.由题意知P(A)=P(BC)=P(B)P(C).旧养殖法的箱产量低于50 kg的频率为(0.012+0.014+0.024+0.034+0.040)×5=0.62,故P(B)的估计值为0.62.新养殖法的箱产量不低于50 kg的频率为(0.068+0.046+0.010+0.008)×5=0.66,故P(C)的估计值为0.66.因此事件A的概率估计值为0.62×0.66=0.409 2.(2)根据箱产量的频率分布直方图得列联表.K 2=200×(62×66-34×38)2100×100×96×104≈15.705.由于15.705>6.635,故有99%的把握认为箱产量与养殖方法有关.(3)因为新养殖法的箱产量频率分布直方图中,箱产量低于50 kg 的直方图面积为(0.004+0.020+0.044)×5=0.34<0.5,箱产量低于55 kg 的直方图面积为(0.004+0.020+0.044+0.068)×5=0.68>0.5, 故新养殖法箱产量的中位数的估计值为 50+0.5-0.340.068≈52.35(kg).4.(2018·湖北襄阳五中适应性考试)某商场计划销售某种产品,现邀请生产该产品的甲、乙两个厂家进场试销10天.两个厂家提供的返利方案如下:甲厂家每天固定返利70元,且每卖出一件产品厂家再返利2元;乙厂家无固定返利,卖出40件以内(含40件)的产品,每件产品厂家返利4元,超出40件的部分每件返利6元.经统计,两个厂家的试销情况茎叶图如下.(1)现从甲厂家试销的10天中抽取两天,求这两天的销售量都大于40的概率; (2)若将频率视作概率,回答以下问题:①记乙厂家的日返利额为X (单位:元),求X 的分布列和数学期望;②商场拟在甲、乙两个厂家中选择一家长期销售,如果仅从日返利额的角度考虑,请利用所学的统计学知识为商场作出选择,并说明理由.解析 (1)记“抽取的两天销售量都大于40”为事件A , 则P (A )=C 22C 210=145.(2)①设乙产品的日销售量为a ,则当a =38时,X =38×4=152;当a =39时,X =39×4=156; 当a =40时,X =40×4=160; 当a =41时,X =40×4+1×6=166; 当a =42时,X =40×4+2×6=172; ∴X 的所有可能取值为152,156,160,166,172, ∴X 的分布列为∴E (X )=152×110+156×15+160×15+166×25+172×110=162.②依题意,甲厂家的日平均销售量为38×0.2+39×0.4+40×0.2+41×0.1+42×0.1=39.5, ∴甲厂家的日平均返利额为70+39.5×2=149元, 由①得乙厂家的日平均返利额为162元(>149元), ∴推荐该商场选择乙厂家长期销售.课时达标 讲座(六)[解密考纲]概率与统计是高考中相对独立的一块内容,处理问题的方式、方法体现了较高的思维含量.该类问题以应用题为载体,注重考查学生的应用意识及阅读理解能力、数据分析能力.概率问题的核心是概率计算,其中事件的互斥、对立、独立和随机变量的分布是概率计算的核心.统计问题的核心是样本数据的获得及分析方法,重点是频率分布直方图、茎叶图和样本的数字特征.统计与概率内容相互渗透,背景新颖.1.(2018·海南模拟)已知某班n 名同学的数学测试成绩(单位:分,满分100分)的频率分布直方图如图所示,其中a ,b ,c 成等差数列,且成绩在[90,100]内的有6人.(1)求n 的值;(2)若成绩在[40,50)内的人数是成绩在[50,60)内的人数的13,规定60分以下为不及格,从不及格的人中任意选取3人,求成绩在50分以下的人数X 的分布列和数学期望.解析 (1)依题意得⎩⎪⎨⎪⎧10(0.035+0.025+c +2b +a )=1,2b =a +c ⇒b =0.01, 因为成绩在[90,100]内的有6人,所以n =60.01×10=60.(2)由⎩⎪⎨⎪⎧ a +c =0.02,c =3a ⇒⎩⎪⎨⎪⎧a =0.005,c =0.015,于是成绩在[40,50)及[50,60)内的人数分别为3和9,即不及格的人数为12,从中任选3人,则成绩在50分以下的人数X 的所有可能取值为0,1,2,3,且P (X =0)=C 39C 03C 312=2155,P (X =1)=C 29C 13C 312=2755,P (X =2)=C 19C 23C 312=27220,P (X =3)=C 09C 33C 312=1220,所以X 的分布列如下!故X 的数学期望为E (X )=0×2155+1×2755+2×27220+3×1220=34.2.(2018·广东五校联考)下图是某市11月1日至14日的空气质量指数趋势图,空气质量指数(AQI)小于100表示空气质量优良,空气质量指数大于200表示空气重度污染,某人随机选择11月1日至11月12日中的某一天到达该市,并停留3天.(1)求此人到达当日空气重度污染的概率;(2)设ξ是此人停留期间空气重度污染的天数,求ξ的分布列与数学期望. 解析 设A i 表示事件“此人于11月i 日到达该市”(i =1,2,…,12). 依题意知,P (A i )=112,且A i ∩A j =∅(i ≠j ).(1)设B 为事件“此人到达当日空气重度污染”,则B =A 1∪A 2∪A 3∪A 7∪A 12, 所以P (B )=P (A 1∪A 2∪A 3∪A 7∪A 12)=P (A 1)+P (A 2)+P (A 3)+P (A 7)+P (A 12)=512,即此人到达当日空气重度污染的概率为512.(2)由题意可知,ξ的所有可能取值为0,1,2,3,P (ξ=0)=P (A 4∪A 8∪A 9)=P (A 4)+P (A 8)+P (A 9)=312=14,P (ξ=2)=P (A 2∪A 11)=P (A 2)+P (A 11)=212=16,P (ξ=3)=P (A 1∪A 12)=P (A 1)+P (A 12)=212=16,P (ξ=1)=1-P (ξ=0)-P (ξ=2)-P (ξ=3) =1-14-16-16=512,所以ξ的分布列为故ξ的数学期望E (ξ)=0×14+1×512+2×16+3×16=54.3.(2018·河南焦作模拟)某单位共10名员工,他们某年的收入如下表.(2)从该单位中任取2人,此2人中年薪收入高于5万的人数记为ξ,求ξ的分布列和期望;(3)已知员工年薪收入与工作年限成正线性相关关系,若某员工工作第一年至第四年的年薪分别为3万元,4.2万元,5.6万元,7.2万元,预测该员工第五年的年薪为多少?附:线性回归方程y ^=b ^x +a ^中系数计算公式b ^=∑i =1n(x i -x )(y i -y )∑i =1n(x i -x )2,a ^=y -b^x ,其中x ,y 表示样本均值.解析 (1)平均值为10万元,中位数为6万元.(2)年薪高于5万的有6人,低于或等于5万的有4人,ξ取值为0,1,2.P (ξ=0)=C 24C 210=215,P (ξ=1)=C 14C 16C 210=815,P (ξ=2)=C 26C 210=13,所以ξ的分布列为数学期望为E (ξ)=0×215+1×815+2×13=65.(3)设x i ,y i (i =1,2,3,4)分别表示工作年限及相应年薪,则x =2.5,y =5,∑i =14(x i -x )2=2.25+0.25+0.25+2.25=5,∑i =14(x i -x )(y i -y )=-1.5×(-2)+(-0.5)×(-0.8)+0.5×0.6+1.5×2.2=7,b ^=∑i =14(x i -x )(y i -y )∑i =14(x i -x )2=75=1.4, a ^=y -b ^x =5-1.4×2.5=1.5, 因此线性回归方程为y =1.4x +1.5,可预测该员工第5年的年薪收入为8.5万元.4.(2017·天津卷)从甲地到乙地要经过3个十字路口,设各路口信号灯工作相互独立,且在各路口遇到红灯的概率分别为12,13,14.(1)记X 表示一辆车从甲地到乙地遇到红灯的个数,求随机变量X 的分布列和数学期望; (2)若有2辆车独立地从甲地到乙地,求这2辆车共遇到1个红灯的概率. 解析 (1)随机变量X 的所有可能取值为0,1,2,3. P (X =0)=⎝⎛⎭⎫1-12×⎝⎛⎭⎫1-13×⎝⎛⎭⎫1-14=14, P (X =1)=12×⎝⎛⎭⎫1-13×⎝⎛⎭⎫1-14+⎝⎛⎭⎫1-12×13×⎝⎛⎭⎫1-14+⎝⎛⎭⎫1-12×⎝⎛⎭⎫1-13×14=1124, P (X =2)=⎝⎛⎭⎫1-12×13×14+12×⎝⎛⎭⎫1-13×14+12×13×⎝⎛⎭⎫1-14=14, P (X =3)=12×13×14=124.所以随机变量X 的分布列为∴E (X )=0×14+1×1124+2×14+3×124=1312.(2)设Y 表示第一辆车遇到红灯的个数,Z 表示第二辆车遇到红灯的个数,则所求事件的概率为P (Y +Z =1)=P (Y =0,Z =1)+P (Y =1,Z =0) =P (Y =0)P (Z =1)+P (Y =1)P (Z =0) =14×1124+1124×14=1148. 所以这2辆车共遇到了1个红灯的概率为1148.5.(2018·河南洛阳统考)某教师为了了解本校高三学生一模考试的数学成绩情况,将所教两个班级的数学成绩(单位:分)绘制成如图所示的茎叶图.(1)分别求出甲、乙两个班级数学成绩的中位数、众数;(2)若规定成绩大于或等于115分为优秀,分别求出两个班级数学成绩的优秀率; (3)在(2)的条件下,若用甲班学生数学成绩的频率估计概率,从该校高三年级中随机抽取3人,记这3人中数学成绩优秀的人数为X ,求X 的分布列和数学期望.解析 (1)由所给的茎叶图知,甲班50名同学的成绩由小到大排序,排在第25,26位的是108,109,数量最多的是103,故甲班数学成绩的中位数是108.5,众数是103;乙班48名同学的成绩由小到大排序,排在第24,25位的是106,107,数量最多的是92和101,故乙班数学成绩的中位数是106.5,众数为92或101.(2)由茎叶图中的数据可知,甲班中数学成绩为优秀的人数为20,优秀率为2050=25;乙班中数学成绩为优秀的人数为18,优秀率为1848=38.(3)用甲班学生数学成绩的频率估计概率,则高三学生数学成绩的优秀率P =25,则X 的所有可能取值为0,1,2,3,且X ~B ⎝⎛⎭⎫3,25, P (X =0)=C 03⎝⎛⎭⎫353=27125; P (X =1)=C 13×25×⎝⎛⎭⎫352=54125; P (X =2)=C 23×⎝⎛⎭⎫252×35=36125; P (X =3)=C 33×⎝⎛⎭⎫253=8125; X 的分布列为!E (X )=0×27125+1×54125+2×36125+3×8125=65或E (X )=3×25=65.6.(2018·河北保定模拟)某市拟实行机动车尾号限行交替措施,为了解民众对“车辆限行”的态度,随机调查了50人,并将调查结果制成下表.人中不赞成“车辆限行”的人数记为X ,求X 的分布列和期望;(2)把年龄在[15,45)称为中青年,年龄在[45,75)称为中老年,请根据上表完成2×2列联表,并说明民众对“车辆限行”的态度与年龄是否有关联.参考公式和数据χ2=n (ad -bc )(a +b )(c +d )(a +c )(b +d )解析 (1)P (X =0)=C 24C 25·C 26C 210=90450=15,P (X =1)=C 24C 25·C 16C 14C 210+C 14C 25·C 26C 210=204450=3475,P (X =2)=C 14C25·C 16C 14C 210+C 24C 25·C 24C 210=132450=2275,P (X =3)=C 14C 25·C 24C 210=24450=475,X 的分布列为E (X )=0×15+1×3475+2×2275+3×475=1.2.(2)2×2列联表如图所示.χ2=50×(133-143)30×20×32×18≤2.706,说明民众对“车辆限行”的态度与年龄没有关联.。
2020版高考数学理科人教B版一轮温习高考大题专项6高考中的概率与统计

高考大题专项六高考中的概率与统计1.(2019河北衡水中学一模,18)某高校为了对2018年录取的大一理工科新生有针对性地进行教学,从大一理工科新生中随机抽取40名,对他们2018年高考的数学分数进行分析,研究发觉这40名新生的数学分数x在(其中10n≤x<10(n+1),n∈N*).[100,150]内,且其频率y知足y=10a-n20(1)求a的值;(2)请画出这20名新生高考数学分数的频率散布直方图,并估量这40名新生的高考数学分数的平均数(同一组中的数据用该组区间的中点值作代表);(3)将此样本的频率估量为整体的概率,随机调查4名该校的大一理工科新生,记调查的4名大一理工科新生中“高考数学分数不低于130分”的人数为随机变量ξ,求ξ的数学期望.2.(2018山东青岛调研,18)近期,某公交公司别离推出支付宝和微信扫码支付搭车活动,活动设置了一段时刻的推行期,由于推行期内优惠力度较大,吸引愈来愈多的人开始利用扫码支付.某线路公交车队统计了活动刚推出一周内每一天利用扫码支付的人次,用x表示活动推出的天数,y表示天天利用扫码支付的人次(单位:十人次),统计数据如表1所示:依照以上数据,绘制了如以下图所示的散点图.(1)依照散点图判定,在推行期内,y=a+bx与y=c·d x(c,d均为大于零的常数)哪个适宜作为扫码支付的人次y关于活动推出天数x的回归方程类型?(给出判定即可,没必要说明理由);(2)依照(1)的判定结果及表1中的数据,求y 关于x 的回归方程,并预测活动推出第8天利用扫码支付的人次;(3)推行期终止后,车队对乘客的支付方式进行统计,结果如表2.已知该线路公交车票价为2元,利用现金支付的乘客无优惠,利用搭车卡支付的乘客享受8折优惠,扫码支付的乘客随机优惠,依照统计结果得知,利用扫码支付的乘客,享受7折优惠的概率为16,享受8折优惠的概率为13,享受9折优惠的概率为12.依照所给数据以事件发生的频率作为相应事件发生的概率,估量一名乘客一次搭车的平均费用. 参考数据:其中v i =lg y i ,v =1∑i=17v i3.(2019广东化州一模,18)2018年9月16日下午5时左右,今年第22号台风“山竹”在广东江门川岛镇周围正面登岸,给本地人民造成了庞大的财产损失,某记者调查了本地某小区的100户居民由于台风造成的经济损失,将搜集的数据分成[0,2 000],(2 000,4 000],(4 000,6 000],(6 000,8 000],(8 000,10 000]五组,并作出如下频率散布直方图.(1)台风后居委会号召小区居民为台风重灾区捐钱,记者调查的100户居民捐钱情形如下表格,在下面表格空白处填写正确数字,并说明捐钱数额多于或少于500元和自身经济损失是不是到4 000元有无关系(2)将上述调查所取得的频率视为概率,此刻从该地域大量受灾居民中,采纳随机抽样方式每次抽取1户居民,抽取3次,记被抽取的3户居民中自身经济损失超过4 000元的人数为ξ,假设每次抽取的结果是彼此独立的,求ξ的散布列,数学期望E(ξ)和方差D(ξ).参考公式:χ2=n(n11n22-n12n21)2n1+n2+n+1n+2P(χ2>k0)k04.(2018长春质量监测一,18)某超市打算按月订购一种酸奶,天天进货量相同,进货本钱每瓶4元,售价每瓶6元,未售出的酸奶降价处置,以每瓶2元的价钱当天全数处置完.依照往年销售体会,天天需求量与当天最高气温(单位:℃)有关.若是最高气温不低于25 ℃,需求量为500瓶;若是最高气温位于区间[20,25),需求量为300瓶;若是最高气温低于20 ℃,需求量为200瓶.为了确信六月份的订购打算,统计以最高气温位于各区间的频率代替最高气温位于该区间的概率.(1)求六月份这种酸奶一天的需求量X(单位:瓶)的散布列;(2)设六月份一天销售这种酸奶的利润为Y(单位:元),当六月份这种酸奶一天的进货量n(单位:瓶)为多少时,Y的数学期望达到最大值?5.(2019广东省六校第一次联考,19)某市大力推行纯电动汽车,对购买用户依照车辆出厂续驶里程R 的行业标准,2017年末随机调査该市1 000辆纯电动汽车,统计其出厂续驶里程R,取得频率散布直方图如以下图所示.用样本估量整体,频率估量概率,解决如下问题:(1)求该市每辆纯电动汽车2017年地址财政补助的均值;(2)(同一组数据用该区间的中点值作代表)2018年2月,国家出台政策,将纯电动汽车财政补助慢慢转移到充电基础设施建设上来.该企业拟将转移补助资金用于添置新型充电设备.现有直流、交流两种充电桩可供购买.直流充电桩5万元/台,每台天天最多能够充电30辆车,天天保护费用500元/台; 交流充电桩1万元/台,每台天天最多能够充电4辆车,天天保护费用80元/台.该企业现有两种购买方案:方案一:购买100台直流充电桩和900台交流充电桩;方案二:购买200台直流充电桩和400台交流充电桩.假设车辆充电时优先利用新设备,且充电一辆车产生25元的收入,用2017年的统计数据,别离估量该企业在两种方案下利用新设备产生的日利润.(日利润=日收入-日保护费用)年是某市大力推动居民生活垃圾分类的关键一年,有关部门为宣传垃圾分类知识,面向该市市民进行了一次“垃圾分类知识”的网络问卷调查,每位市民仅有一次参与机遇,通过抽样,取得参与问卷调查中的1 000人的得分数据,其频率散布直方图如下图:(1)由频率散布直方图能够以为,这次问卷调查的得分Z服从正态散布N(μ,210),μ近似为这1 000人得分的平均值(同一组数据用该区间的中点值作代表),利用该正态散布求P<Z<94);(2)在(1)的条件下,有关部门为这次参加问卷调查的市民制定如下奖励方案:①得分不低于μ可获赠2次随机话费;得分低于μ,那么只有1次;②现有一名市民要参加这次问卷调查,记X(单位:元)为该市民参加问卷调查获赠的话费,求X的散布列.附:√210≈.若Z~N(μ,δ2),则P(μ-δ<Z<μ+δ)= 7,P(μ-2δ<Z<μ+2δ)= 5.高考大题专项六 高考中的概率与统计1.解 (1)由题意知:10≤n ≤14,因此n 的取值为10,11,12,13,14,代入y=10a-n20,可得++++=1,解得a=.(2)由(1),得y=,,,,,频率散布直方图如图:这40名新生的高考数学分数的平均数为105×+115×+125×+135×+145×=120.(3)由题意可知,ξ=0,1,2,3,4,且“高考数学分数不低于130分”的概率为+=,因此ξ~B 4,14,因此E (ξ)=4×14=1.2.解 (1)依照散点图判定,y=c·d x 适宜作为扫码支付的人数y 关于活动推出天数x 的回归方程类型.(2)∵y=c·d x ,两边同时取经常使用对数得:lg y=lg(c·d x )=lg c+lg d·x ; 设lg y=v ,∴v=lg c+lg d·x.∵x =4,v =,∑i=17x i 2=140,∴lg d ^=∑i=17x i v i -7x v∑i=17x i 2-7x2=50.12-7×4×1.54140-7×42=,把样本中心点(4,代入v=lg c+lg d ·x ,得:lg c ^=, ∴v ^=+,∴lg y ^=+,∴y 关于x 的回归方程式为y ^=+=×x =×.把x=8代入上式,得y ^=×102=347;活动推出第8天利用扫码支付的人次为3 470. (3)记一名乘客搭车支付的费用为Z , 则Z 的取值可能为:2,,,; P (Z=2)=;P (Z==×1=; P (Z==+×13=,P (Z==×16=.散布列为:因此,2×+×+×+×=(元).3.解 (1)由频率散布直方图可知,在抽取的100人中,经济损失不超过4 000元的有×100=70人,经济损失超过4 000元的有100-70=30人,那么表格数据如下χ2=100×(60×10-10×20)280×20×70×30≈,由于>,因此有95%的把握以为捐钱数额多于或少于500元和自身经济损失是不是到4 000元有关. (2)由频率散布直方图可知抽到自身经济损失超过4 000元的居民的频率为,将频率视为概率. 由题意知ξ的可能取值有0,1,2,3,ξ~B 3,310,P (ξ=0)=C 303100×7103=3431 000; P (ξ=1)=C 313101×7102=4411 000; P (ξ=2)=C 323102×7101=1891 000; P (ξ=3)=C 333103×7100=271 000. 从而ξ的散布列为E (ξ)=np=3×310=, D (ξ)=np (1-p )=3×310×710=.4.解 (1)由题意知,X 所有的可能取值为200,300,500,由表格数据知,P (X=200)=2+1690=,P (X=300)=3690=,P (X=500)=25+7+490=. 因此X 的散布列为(2)由题意知,这种酸奶一天的需求量最多为500,至少为200,因此只需考虑200≤n ≤500. 当300≤n ≤500时,假设最高气温不低于25,则Y=6n-4n=2n.假设最高气温位于区间[20,25),则Y=6×300+2(n-300)-4n=1 200-2n ; 假设最高气温低于20,则Y=6×200+2(n-200)-4n=800-2n ; 因此E (Y )=2n×+(1 200-2n )×+(800-2n )×=. 当200≤n<300时,假设最高气温不低于20,则Y=6n-4n=2n.假设最高气温低于20,则Y=6×200+2(n-200)-4n=800-2n ; 因此E (Y )=2n×++(800-2n )×=160+.因此n=300时,Y的数学期望达到最大值,最大值为520元.5.解(1)纯电动汽车2017年地址财政补助的平均数为3×+4×+×=(万元).(2)假设采纳方案一,100台直流充电桩和900台交流充电桩天天可充电车辆数为30×100+4×900=6 600(辆).可得实际充电车辆数的散布列如下表:实际充电辆数60006600概率于是方案一下新设备产生的日利润均值为25×(6 000×+6 600×-500×100-80×900=40 000(元).假设采纳方案二,200台直流充电桩和400台交流充电桩天天可充电车辆数为30×200+4×400=7 600(辆);于是方案二下新设备产生的日利润均值为25×(6 000×+7 000×+7 600×-500×200-80×400=45 500(元).6.解(1)E(Z)=35×+45×+55×+65×+75×+85×+95×=65,∴μ=65,δ=√210≈,∴P<Z<= 7,P(36<Z<94)= 5,∴P<Z<94)=0.9545-0.68272= 9,∴P<Z<94)=P<Z<+P<Z<94)= 7+ 9= 6.(2)P(Z<μ)=P(Z≥μ)=12,X的可能取值为10,20,30,40,P(X=10)=12×23=13,P(X=20)=12×13+12×23×23=718,P(X=30)=12×23×13+12×13×23=29,P(X=40)=12×13×13=118.故X的散布列为。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
高考必考题突破讲座 (六)1.某保险公司有一款保险产品的历史收益率(收益率=利润÷保费收入)的频率分布直方图如图所示.(1)试估计这款保险产品的收益率的平均值;(2)设每份保单的保费在20元的基础上每增加x 元,对应的销量为y (单位:万份).从历史销售记录中抽样得到如下5组x 与y 的对应数据.由上表知x 与y 有较强的线性相关关系,且据此计算出的回归方程为y ^=10-b ^x . ①求参数b ^的值;②若把回归方程y ^=10-b ^x 当作y 与x 的线性关系,用(1)中求出的收益率的平均值作为此产品的收益率,试问每份保单的保费定为多少元时此产品可获得最大利润,并求出最大利润(注:保险产品的保费收入=每份保单的保费×销量).解析 (1)收益率的平均值为0.05×0.1+0.15×0.2+0.25×0.25+0.35×0.3+0.45×0.1+0.55×0.05=0.275.(2)①x =25+30+38+45+525=1905=38,y =7.5+7.1+6.0+5.6+4.85=315=6.2.由y =10-b ^x 得10-38b ^=6.2,解得b ^=0.1.②设每份保单的保费为(20+x )元,则销量为y =10-0.1x .则这款保险产品的保费收入为f (x )=(20+x )(10-0.1x )万元.所以f (x )=200+8x -0.1x 2=360-0.1(x -40)2.所以当x =40,即每份保单的保费为60元时,保费收入最大为360万元.预计这款保险产品的最大利润为360×0.275=99(万元).2.某网络广告A 公司计划从甲、乙两个网站选择一个网站拓展广告业务,为此A 公司随机抽取了甲、乙两个网站某月中10天的日访问量n (单位:万次),整理后得到如下茎叶图.已知A 公司要从网站日访问量的平均值和稳定性两方面进行考察选择.(1)请说明A公司应选择哪个网站;(2)现将抽取的样本分布近似看作总体分布,A公司根据所选网站的日访问量n进行付费,其付费标准如下表.求A公司每月(按解析(1)由茎叶图可知x甲=(15+24+28+25+30+36+30+32+35+45)÷10=30,s2甲=110×[(15-30)2+(24-30)2+(28-30)2+(25-30)2+(30-30)2+(36-30)2+(30-30)2+(32-30)2+(35-30)2+(45-30)2]=58,x乙=(18+25+22+24+32+38+30+36+35+40)÷10=30,s2乙=110×[(18-30)2+(25-30)2+(22-30)2+(24-30)2+(32-30)2+(38-30)2+(30-30)2+(36-30)2+(35-30)2+(40-30)2]=49.8,因为x甲=x乙,s2甲>s2乙,所以A公司应选择乙网站.(2)由(1)得A公司应选择乙网站,由题意可得乙网站日访问量n<25的概率为0.3,日访问量25≤n≤35的概率为0.4,日访问量n>35的概率为0.3,所以A公司每月应付给乙网站的费用S=30×(500×0.3+700×0.4+1 000×0.3)=21 900(元).3.某汽车美容公司为吸引顾客,推出优惠活动:对首次消费的顾客,按200元/次收费,并注册成为会员,对会员逐次消费给予相应优惠,标准如下表:(1)估计该公司一位会员至少消费两次的概率;(2)某会员仅消费两次,求这两次消费中,公司获得的平均利润;(3)该公司要从这100位里至少消费两次的顾客中按消费次数用分层抽样方法抽出8人,再从这8人中抽出2人发放纪念品,求抽出的2人中恰有1人消费两次的概率.解析 (1)100位会员中,至少消费两次的会员有40位,所以估计一位会员至少消费两次的概率为40100=0.4.(2)该会员第1次消费时,公司获得的利润为200-150=50(元),第2次消费时,公司获得的利润为200×0.95-150=40(元),所以公司获得的平均利润为50+402=45(元).(3)因为20∶10∶5∶5=4∶2∶1∶1,所以用分层抽样方法抽出的8人中,消费2次的有4人,分别设为A 1,A 2,A 3,A 4,消费3次的有2人,分别设为B 1,B 2,消费4次和5次及以上的各有1人,分别设为C ,D ,从中抽出2人,抽到A 1的有A 1A 2,A 1A 3,A 1A 4,A 1B 1,A 1B 2,A 1C ,A 1D ,共7种;去掉A 1后,抽到A 2的有A 2A 3,A 2A 4,A 2B 1,A 2B 2,A 2C ,A 2D ,共6种;……去掉A 1,A 2,A 3,A 4,B 1,B 2后,抽到C 的有CD ,共1种,总的抽取方法有7+6+5+4+3+2+1=28(种),其中恰有1人消费两次的抽取方法有4+4+4+4=16(种),所以抽出的2人中恰有1人消费两次的概率为1628=47.4.(2018·全国卷Ⅰ)某家庭记录了未使用节水龙头50天的日用水量数据(单位:m 3)和使用了节水龙头50天的日用水量数据,得到频数分布表如下:未使用节水龙头50天的日用水量频数分布表(2)估计该家庭使用节水龙头后,日用水量小于0.35 m 3的概率;(3)估计该家庭使用节水龙头后,一年能节省多少水(一年按365天计算,同一组中的数据以这组数据所在区间中点的值作代表)?解析 (1)频率分布直方图如图所示.(2)根据以上数据,该家庭使用节水龙头后50天日用水量小于0.35 m 3的频率为0.2×0.1+1×0.1+2.6×0.1+2×0.05=0.48,因此该家庭使用节水龙头后日用水量小于0.35 m 3的概率的估计值为0.48.(3)该家庭未使用节水龙头50天日用水量的平均数为x 1=150×(0.05×1+0.15×3+0.25×2+0.35×4+0.45×9+0.55×26+0.65×5)=0.48.该家庭使用了节水龙头后50天日用水量的平均数为x 2=150×(0.05×1+0.15×5+0.25×13+0.35×10+0.45×16+0.55×5)=0.35.估计使用节水龙头后,一年可节省水(0.48-0.35)×365=47.45(m 3).5.某小学为迎接校运动会的到来,在三年级招募了16名男志愿者和14名女志愿者.调查发现,男、女志愿者中分别各有10人和6人喜欢运动,其余人员不喜欢运动.(1)根据以上数据完成2×2列联表;(2)是否有95%(3)如果喜欢运动的女志愿者中恰有4人懂得医疗救护,现从喜欢运动的女志愿者中抽取2名负责处理应急事件,求抽出的2名志愿者都懂得医疗救护的概率.附:K2=n ad-bc2a +b c+d a+c b+d,n=a+b+c+d.解析(1)(2)由已知数据可得K2=16×14×14×16≈1.157 5<3.841,因此没有95%的把握认为是否喜欢运动与性别有关.(3)喜欢运动的女志愿者有6人,设分别为A,B,C,D,E,F,其中A,B,C,D懂得医疗救护,则从这6人中任取2人的情况有(A,B),(A,C),(A,D),(A,E),(A,F),(B,C),(B,D),(B,E),(B,F),(C,D),(C,E),(C,F),(D,E),(D,F),(E,F),共15种,其中两人都懂得医疗救护的情况有(A,B),(A,C),(A,D),(B,C),(B,D),(C,D),共6种,设“抽出的2名志愿者都懂得医疗救护”为事件M,则P(M)=615=25.6.(2016·全国卷Ⅲ)下图是我国2008年至2014年生活垃圾无害化处理量(单位:亿吨)的折线图.(1)由折线图看出,可用线性回归模型拟合y与t的关系,请用相关系数加以说明;(2)建立y关于t的回归方程(系数精确到0.01),预测2016年我国生活垃圾无害化处理量.附注:参考数据:∑i =17y i =9.32,∑i =17t i y i =40.17,∑i =17y i -y2=0.55,7≈2.646.参考公式:相关系数r=∑i =1nt i -ty i -y∑i =1nt i -t2∑i =1n y i -y2,回归方程y ^=a ^+b ^t 中斜率和截距的最小二乘估计公式分别为b ^=∑i =1nt i -ty i -y∑i =1nt i -t2,a ^=y -b ^t .解析 (1)由折线图中数据和附注中参考数据得t -=4, ∑i =17(t i -t -)2=28,∑i =17y i -y-2=0.55,∑i =17 (t i -t )(y i -y -)=∑i =17t i y i -t∑i =17yi=40.17-4×9.32=2.89,r ≈ 2.890.55×2×2.646≈0.99.因为y 与t 的相关系数近似为0.99,说明y 与t 的线性相关程度相当高,从而可以用线性回归模型拟合y 与t 的关系.(2)由y -=9.327≈1.331及(1)得b ^=∑i =17t i -ty i -y-∑i =17t i -t2=2.8928≈0.103,a ^=y --b ^t -=1.331-0.103×4≈0.92.所以y 关于t 的回归方程为y ^=0.92+0.10t .将2016年对应的t =9代入回归方程得y ^=0.92+0.10×9=1.82.所以预测2016年我国生活垃圾无害化处理量约为1.82亿吨.7.(2019·蓉城名校联考)成都市现在已是拥有1 400多万人口的城市,机动车保有量已达450多万辆,成年人中约40%拥有机动车驾驶证.为了解本市成年人的交通安全意识情况,某中学的同学利用国庆假期进行了一次全市成年人安全知识抽样调查.先根据是否拥有驾驶证,用分层抽样的方法抽取了200名成年人,然后对这200人进行问卷调查.这200人所得的分数都分布在[30,100]范围内,规定分数在80以上(含80)的为“具有很强安全意识”,所得分数的频率分布直方图如图所示.(1)识’与是否拥有驾驶证”有关?(2)若规定参加调查的200人中分数在70以上(含70)的为“具有较强安全意识”,从参加调查的200人中根据是否具有较强安全意识,按分层抽样的方法抽出5人,再从5人中随机抽取3人,试求抽取的3人中恰有1人“具有较强安全意识”的概率.附表及公式:K2=n ad-bc2a +b c+d a+c b+d,其中n=a+b+c+d.解析全意识的占20%,有40人,不具有很强安全意识的有160人.补全的2×2列联表如表所示:K2=40×80×160×120=16=4.687 5>3.841.所以有超过95%的把握认为“‘具有很强安全意识’与是否拥有驾驶证”有关.(2)5人中不具有较强安全意识的有3人,分别记为A,B,C,“具有较强安全意识”的有2人,分别记为d,e,易知这是一个古典概型.则从5人中随机抽取3人构成的所有基本事件为(A,B,C),(A,B,d),(A,B,e),(A,C,d),(A,C,e),(A,d,e),(B,C,d),(B,C,e),(B,d,e),(C,d,e),共10种;抽取的3人中恰有1人“具有较强安全意识”所包含的基本事件为(A,B,d),(A,B,e),(A,C,d),(A,C,e),(B,C,d),(B,C,e),共有6种.所以抽取的3人中恰有1人“具有较强安全意识”的概率P=610=3 5.8.某公司为确定下一年度投入某种产品的宣传费,需了解年宣传费x(单位:千元)对年销售量y (单位:t)和年利润z (单位:千元)的影响.对近8年的年宣传费x i 和年销售量y i (i =1,2,…,8)数据作了初步处理,得到下面的散点图及一些统计量的值.表中w i =x i ,w =18∑i =18w i .(1)根据散点图判断y =a +bx 与y =c +d x 哪一个适宜作为年销售量y 关于年宣传费x 的回归方程类型?(给出判断即可,不必说明理由)(2)根据(1)的判断结果及表中数据,建立y 关于x 的回归方程;(3)已知这种产品的年利润z 与x ,y 的关系为z =0.2y -x .根据(2)的结果回答下列问题:①年宣传费x =49时,年销售量及年利润的预报值是多少? ②年宣传费x 为何值时,年利润的预报值最大?附:对于一组数据(u 1,v 1),(u 2,v 2),…,(u n ,v n ),其回归直线v ^=α^+β^u 的斜率和截距的最小二乘估计分别为:β^=∑i =1nu i -uv i -v∑i =1nu i -u2,^α=v -^βu .解析 (1)由散点图可以判断,y =c +d x 适宜作为年销售量y 关于宣传费x 的回归方程类型.(2)令ω=x ,先建立y 关于ω的线性回归方程.由于d ^=∑8i =1ωi -ωy i -y∑8i =1ωi -ω2=108.81.6=68,c ^=y -d ^ω=563-68×6.8=100.6,所以y 关于ω的线性回归方程为y ^=100.6+68ω,因此y 关于x 的回归方程为y ^=100.6+68x .(3)①由(2)知,当x =49时,年销售量y 的预报值y ^=100.6+68×49=576.6,年利润z 的预报值z ^=576.6×0.2-49=66.32.②根据(2)的结果知,年利润z 的预报值z ^=0.2(100.6+68x )-x =-x +13.6x +20.12.所以当x =13.62=6.8,即x =46.24时,z ^取最大值.故年宣传费为46.24千元时,年利润的预报值最大.。