主题18 随机变量分布列与统计理-2018年高考数学二轮透
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
2018届二轮透析高考数学23题对对碰【二轮精品】 第三篇
主题18 随机变量分布列与统计(理)
【主题考法】本主题考题类型为解答题,以应用题为背景以茎叶图、频率分布直方图、条形图等统计数表为载体,考查运用排列组合值求古典概型、几何概型、互斥事件和概率公式、相互独立事件积概率、条件概率、n 次独立重复试验、离散型随机变量分布列及其期望与方差、正态分布等数学知识与方法,考查抽样方法、总体估计、回归分析与独立性检验等统计知识和方法,考查运算求解能力、阅读理解能力、应用意识,难度为中档题,分值12分. 【主题考前回扣】 1.抽样方法
简单随机抽样、分层抽样、系统抽样.
①从容量为N 的总体中抽取容量为n 的样本,则每个个体被抽到的概率都为n N
;
②分层抽样实际上就是按比例抽样,即按各层个体数占总体的比确定各层应抽取的样本容量. 2.统计中四个数据特征
①众数:在样本数据中,出现次数最多的那个数据;
②中位数:在样本数据中,将数据按大小排列,位于最中间的数据.如果数据的个数为偶数,就取中间两个数据的平均数作为中位数; ③平均数:样本数据的算术平均数, 即x =1
n
(x 1+x 2+…x n );
④方差与标准差
方差:s 2=1n
[(x 1-x )2+(x 2-x )2+…+(x n -x )2
].
标准差:
s =
1
n
x 1-x
2
+x 2-x
2
+…+x n -x
2
].
3.直方图的三个结论 ①小长方形的面积=组距×
频率
组距
=频率; ②各小长方形的面积之和等于1;
③小长方形的高=频率组距,所有小长方形高的和为1
组距
.
4.回归分析(1)回归直线y ^=b ^x +a ^经过样本点的中心点(x ,y ),若x 取某一个值代入回归直线方程y ^=b ^
x +a ^
中,可求出y 的估计值.
5.独立性检验
对于取值分别是{x 1,x 2}和{y 1,y 2}的分类变量X 和Y ,其样本频数列联表是:
y 1 y 2 总计
x 1 a b a +b x 2
c d c +d 总计
a +c
b +d
n
则K 2
=n (ad -bc )2
(a +b )(c +d )(a +c )(b +d )
(其中n =a +b +c +d 为样本容量).
利用随机变量K 2
来判断“两个分类变量有关系”的方法称为独立性检验.如果K 2
的观测值k 越大,说明“两个分类变量有关系”的可能性越大. 6.牢记概念与公式 (1)概率的计算公式 ①古典概型的概率计算公式
P (A )=
事件A 包含的基本事件数m
基本事件总数n
;
②互斥事件的概率计算公式
P (A ∪B )=P (A )+P (B );
③对立事件的概率计算公式
P (A )=1-P (A );
④几何概型的概率计算公式
P (A )=
构成事件A 的区域长度面积或体积
试验的全部结果所构成的区域长度面积或体积
.
7.八组公式
①离散型随机变量的分布列的两个性质
(ⅰ)p i ≥0(i =1,2,…,n );(ⅱ)p 1+p 2+…+p n =1. ②期望公式
E (X )=x 1p 1+x 2p 2+…+x n p n .
③期望的性质
(ⅰ)E (aX +b )=aE (X )+b ; (ⅱ)若X ~B (n ,p ),则E (X )=np ; (ⅲ)若X 服从两点分布,则E (X )=p . ④方差公式
D (X )=[x 1-
E (X )]2·p 1+[x 2-E (X )]2·p 2+…+[x n -E (X )]2·p n ,标准差为D X .
⑤方差的性质
(ⅰ)D (aX +b )=a 2
D (X );
(ⅱ)若X ~B (n ,p ),则D (X )=np (1-p ); (ⅲ)若X 服从两点分布,则D (X )=p (1-p ). ⑥独立事件同时发生的概率计算公式
P (AB )=P (A )P (B ).
⑦独立重复试验的概率计算公式
P n (k )=C k n p k (1-p )
n -k
. ⑧条件概率公式
P (B |A )=P AB P A
.
【易错点提醒】
1.混淆频率分布条形图和频率分布直方图,误把频率分布直方图纵轴的几何意义当成频率,导致样本数据的频率求错.
2.利用频率分布直方图求众数、中位数与平均数时,易出错,应注意区分这三者的含义: (1)最高的小长方形底边中点的横坐标即是众数; (2)中位数左边和右边的小长方形的面积和是相等的;
(3)平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小长方形的面积乘以小长方形底边中点的横坐标之和.
3.在独立性检验中,K 2
=n (ad -bc )2
(a +b )(a +c )(b +d )(c +d )
(其中n =a +b +c +d )所给出的检验随机变量
K 2的观测值k ,并且k 的值越大,说明“X 与Y 有关系”成立的可能性越大,可以利用数据来确定“X 与Y
有关系”的可信程度.
4.混淆直线方程y =ax +b 与回归直线y ^=b ^x +a ^
系数的含义,导致回归分析中致误.
5.应用互斥事件的概率加法公式,一定要注意首先确定各事件是否彼此互斥,然后求出各事件分别发生的概率,再求和.
6.正确区别互斥事件与对立事件的关系:对立事件是互斥事件,是互斥中的特殊情况,但互斥事件不一定是对立事件,“互斥”是“对立”的必要不充分条件. 7.要注意概率P (A |B )与P (AB )的区别
(1)在P (A |B )中,事件A ,B 发生有时间上的差异,B 先A 后;在P (AB )中,事件A ,B 同时发生.
(2)样本空间不同,在P (A |B )中,事件B 成为样本空间;在P (AB )中,样本空间仍为Ω,因而有P (A |B )≥P (AB ). 8.易忘判定随机变量是否服从二项分布,盲目使用二项分布的期望和方差公式计算致误. 【主题考向】
考向一 抽样方法与总体估计
【解决法宝】1.分层抽样的本质是按比例确定每层抽取个体的个数。
2.解决总体分布估计问题,若利用频率分布直方图求众数,即最高的小长方形底边中点的横坐标即是众数;若利用频率分布直方图求为中位数,即利用中位数左边和右边的小长方形的面积和是相等的求解;若为利用频率分布直方图求平均数,即为频率分布直方图中每个小长方形的面积乘以小长方形底边中点的横坐标之和;若为估计某个范围上的概率或频数,根据频率分布直方图求出该范围上所有频率之和即为概率,频率乘以样本容量即为频数.
.3.给出样本的茎叶图,出现次数最多的样本数据即为众数,数据从小到大排成一列,若中间为一个数,该数为中位数,若中间为两个数,则中间两个数的平均值为中位数,均值和方差利用均值和方差公式计算出样本的均值和方差即为总体的均值与方差.
例1.【宁夏石嘴山市三中2018届一模】某校从参加高一年级期末考试的学生中抽出60名学生,将其数学成绩(均为整数)分成六段[)[)[]
40,50,50,60...90,100后,画出如下部分频率分布直方图.观察图形的信息,回答下列问题:
(1)求第四小组的频率,补全频率分布直方图,并求样本数据的众数,中位数,平均数x 和方差2
s ,(同一组中的数据用该区间的中点值作代表);
(2)从被抽取的数学成绩是70分以上(包括70分)的学生中选两人,求他们在同一分数段的概率; (3)假设从全市参加高一年级期末考试的学生中,任意抽取4个学生,设这四个学生中数学成绩为80分以上(包括80分)的人数为X (以该校学生的成绩的频率估计概率),求X 的分布列和数学期望. 【分析】(1)通过各组的频率和等于1,求出第四组的频率,考查直方图,面积一半的横坐标就是中位数,每个矩形的中点横坐标与该矩形的纵坐标相乘后求和,即可得到平均数,最高矩形的中点横坐标为众数,利用方差公式可求得方差2
s ;(2)分别求出[)70,80, [)80,90, [
)90,100的人数是18, 15, 3,然
后根据组合知识利用古典概型概率求解即可;(3)()4,0.3X B ~, ()440.30.7
k
k
k
p X k C -==⋅即可写出
分布列,利用二项分布的期望公式可得结果.
【解析】(1)因为各组的频率和等于1,故第四组的频率:
41(0.0250.15*20.01f =-++ 0.005)*100.3+=.
直方图如图所示. 中位数是0.1
701073.330.3
c x =+⨯
=,
样本数据中位数是73.33分.众数是75;
=71;
=194
(2)[)70,80, [)80,90, [
)90,100的人数是18, 15, 3,所以从成绩是70分以上(包括70分)的学生中选两人,他们在同一分数段的概率:
222181532
3629
70
C C C P C ++==
.
考向二 独立性检验
【解决法宝】对独立性检验问题,根据条件列出2×2列联表,根据实际问题需要的可信度确定临界值
0k ;利用公式2
K =2()()()()()
n ad bc a b c d a c b d -++++,由观测数据计算得到随机变量2
K 的观测值k ;如果k >
0k ,就以20(1())100%P k k ->⨯的把握认为“X 与Y 有关系”;否则就说样本观测值没有提供“X 与Y
有关系”的充分证据.
例2【云南省保山市2018届第二次市统测某校进行文科、理科数学成绩对比,某次考试后,各随机抽取100名同学的数学考试成绩进行统计,其频率分布表如下.
(Ⅰ)根据数学成绩的频率分布表,求理科数学成绩的中位数的估计值;
(Ⅱ)请填写下面的列联表,并根据列联表判断是否有90%的把握认为数学成绩与文理科有关:
(Ⅲ)设文理科数学成绩相互独立,记A表示事件“文科、理科数学成绩都大于等于120分”,估计A的概率.
附:
()
()()()()
2
2
n ad bc
K
a b c d a c b d
-
=
++++
()
2
P K k
≥0.100 0.050 0.025 0.010 0.001 0
k 2.706 3.841 5.024 6.635 10.828
【分析】(1)利用频率分布直方图求出中位数的估计值;(2)计算2
K,根据表格中的数据,作出判断;(3)记B表示“文科数学成绩大于等于120分”,C表示“理科数学成绩大于等于120分”,由于文理科数学成绩相互独立,利用概率乘法公式即可得到结果.
【解析】(Ⅰ)理科数学成绩的频率分布表中,成绩小于105分的频率为0.35<0.5,
成绩小于120分的频率为0.75>0.5,
故理科数学成绩的中位数的估计值为
()
150.50.35
105110.625
0.40
⨯-
+=分.
(Ⅱ)根据数学成绩的频率分布表得如下列联表:
数学成绩120
≥分数学成绩<120分合计
理科 25 75 100 文科 22 78 100 合计 47
153
200
()2
2200257875220.250 2.70610010047153
K ⨯⨯-⨯=
≈<⨯⨯⨯,
故没有90%的把握认为数学成绩与文理科有关.
(Ⅲ)记B 表示“文科数学成绩大于等于120分”,C 表示“理科数学成绩大于等于120分”, 由于文理科数学成绩相互独立,
所以A 的概率()()()()·0.220.250.055P A P BC P B P C ===⨯=. 考向三 回归分析
【解决法宝】回归分析问题的处理步骤:先画出散点图,利用散点图判定两个变量是否先线性相关,若不线性相关,根据散点图选择合适的拟合函数,然后对拟合函数进行变换,化为线性相关问题;第二步,若
样本数据较小,选第二个公式求b
ˆ,若样本数据较大但与样本均值差较小用第1个公式求b ˆ,再利用回归直线过样本中心点求a
ˆ,得到回归直线方程;第三步,利用回归方程进行预测或对回归模型进行回归分析. 例3.【湖北省荆州中学等“四地七校2018届2月联考】已知鸡的产蛋量与鸡舍的温度有关,为了确定下一个时段鸡舍的控制温度,某企业需要了解鸡舍的温度x (单位C ),对某种鸡的时段产蛋量y (单位: t )和时段投入成本z (单位:万元)的影响,为此,该企业收集了7个鸡舍的时段控制温度i x 和产蛋量
()1,2,,7i y i =的数据,对数据初步处理后得到了如图所示的散点图和表中的统计量的值.
其中ln i i k y =, 7
1
17i i k k ==∑.
(1)根据散点图判断, y bx a =+与21c x y c e =哪一个更适宜作为该种鸡的时段产蛋量y 关于鸡舍时段控制温度x 的回归方程类型?(给判断即可,不必说明理由)
(2)若用21c x y c e =作为回归方程模型,根据表中数据,建立y 关于x 的回归方程;
(3)已知时段投入成本z 与,x y 的关系为 2.50.110z e y x -=-+,当时段控制温度为28℃时,鸡的时段产蛋量及时段投入成本的预报值分别是多少?
附:①对于一组具有线性相关关系的数据()(),1,2,3,
,i i i n μυ=,其回归直线=u υβα+的斜率和截距的
最小二乘估计分别为()()()
1
2
1
=n i
i
i n
i
i u u u u υυβ∧
==---∑∑, =u αυβ∧
∧
- ②
【分析】(1)由散点图可作出判断;(2)由21c x y C e =得21ln ln y C x C =+,令ln y k =, 2=C β, 1=ln C α,
由图表中的数据可知351==1404β∧
, 3
=4
α∧-,从而得到y 关于x 的回归方程;(3)根据回归直线方程得到28x =时, =515.4y ∧, 48.432z ∧
=.
【解析】(1)21c x y C e =适宜 (2)由21c x y C e =得21ln ln y C x C =+ 令ln y k =, 2=C β, 1=ln C α
由图表中的数据可知351=
=1404β∧
, 3
=4
α∧- ∴13
=
44
k x ∧
- ∴y 关于x 的回归方程为3
444
=0.47x x y e e -=
(3)28x =时,由回归方程得=0.471096.63=515.4y ∧
⨯, 0.08515.4 2.81048.432z ∧
=⨯-+= 即鸡舍的温度为28℃时,鸡的时段产量的预报值为515.4,投入成本的预报值为48.432. 考向四 随机变量的分布列、期望和方差
【解决法宝】1.求离散型随机变量的分布列的关键是正确理解随机变量取每一个值所表示的具体事件,然
后综合应用各类求概率的公式,求出概率;
2.求随机变量的均值和方差的关键是正确求出随机变量的分布列,若随机变量服从二项分布(或两点分布),则可直接利用公式求解.
例4【2018届北京市北京101中学3月份零模】摩拜单车和ofo 小黄车等各种共享单车的普及给我们的生活带来了便利.已知某共享单车的收费标准是:每车使用不超过1小时(包含1小时)是免费的,超过1小时的部分每小时收费1元(不足1小时的部分按1小时计算,例如:骑行2.5小时收费2元).现有甲、乙两人各自使用该种共享单车一次.设甲、乙不超过1小时还车的概率分别为11
42
,;1小时以上且不超过2小时还车的概率分别为1124
,;两人用车时间都不会超过3小时. (Ⅰ)求甲乙两人所付的车费相同的概率;
(Ⅱ)设甲乙两人所付的车费之和为随机变量,ξ求ξ的分布列及数学期望.E ξ
【分析】(1)同题意可知所付费用相同即为0,2,4元,即相互独立事件同时发生的概率。
(2)甲乙两个所付费用之和为,ξ ξ可为0,2,4,6,8, 分清楚每个情况分成多少种互斥事件,再根据相互独立事件同时发生求得每一类概率。
(Ⅱ)设甲乙两个所付费用之和为,ξ ξ可为0,2,4,6,8,
()1
0,8P ξ==
()111152,442216
P ξ==
⋅+⋅= ()11111154,44242416P ξ==⋅+⋅+⋅= ()111136,442416
P ξ==
⋅+⋅= ()1118.4416
P ξ==
⋅=
随机变量ξ的分布列是
:
数学期望553172468.161616162
E ξ=⨯
+⨯+⨯+⨯=. 例5 【江苏省南通、徐州、扬州等六市2018届二模】在某公司举行的年终庆典活动中,主持人利用随机抽奖软件进行抽奖:由电脑随机生成一张如图所示的3⨯3表格,其中1格设奖300元,4格各设奖200元,其余4格各设奖100元,点击某一格即显示相应金额.某人在一张表中随机不重复地点击3格,记中奖的总金额为X 元.
(1)求概率()600P X =;
(2)求X 的概率分布及数学期望()E X .
【分析】(1)从3⨯3表格中随机不重复地点击3格,共有39C 种不同情形,再将事件分类,根据古典概型概率公式求得概率;(2)先确定X 的所有可能值为300,400,500,600,700,再分别求出对应的概率,列出分布列,最后根据数学期望公式求期望
.
(2)X 的所有可能值为300,400,500,600,700.
则()3439C 41300C 8421P X ====, ()1214
39
C C 242400C 847P X ⋅====,
()1212144439C C C C 305500C 8414P X ⋅+⋅====, ()1214
3
9C C 63700C 8442
P X ⋅====. ∴X 的概率分布列为:
X 300 400 500 600 700
P
121 27 514 521 342
∴()12553300400500600700500217142142
E X
=⨯
+⨯+⨯+⨯+⨯=(元). 例6 【山东省聊城市2018届一模】某教育培训中心共有25名教师,他们全部在校外住宿.为完全起见,学校派专车接送教师们上下班.这个接送任务承包给了司机王师傅,正常情况下王师傅用34座的大客车接送教师.由于每次乘车人数不尽相同,为了解教师们的乘车情况,王师傅连续记录了100次的乘车人数,统计结果如下: 乘车人数 15
16
17
18
19
20
21
22
23
24
25
频数 2 4 4 10 16 20 16 12 8 6 2
以这100次记录的各乘车人数的频率作为各乘车人数的概率.
(Ⅰ)若随机抽查两次教师们的乘车情况,求这两次中至少有一次乘车人数超过18的概率;
(Ⅱ)有一次,王师傅的大客车出现了故障,于是王师傅准备租一辆小客车来临时送一次需要乘车的教师.可供选择的小客车只有20座的A 型车和22座的B 型车两种, A 型车一次租金为80元, B 型车一次租金为90元.若本次乘车教师的人数超过了所租小客车的座位数,王师傅还要付给多出的人每人20元钱供他们乘出租车.以王师傅本次付出的总费用的期望值为依据,判断王师傅租哪种车较合算?
【分析】(Ⅰ)由统计数据可得在一次接送中,乘车人数超过18的概率为0.8,然后根据对立事件和独立事件的概率求解即可得到结论.(Ⅱ)设X 表示租用A 型车的总费用,则X 的所有可能取值为80,100,120,140,160,180,结合题意求得相应的概率后可得X 的分布列,然后求得99.6EX =;同样设Y 表示租用B 型车的总费用,则可得95.2EX =,故租B 型车较合算. 【解析】(Ⅰ)由题意得,在一次接送中,乘车人数超过18的概率为0.8. 记“抽查的两次中至少有一次乘车人数超过18”为事件A , 则()()110.8P A =-- ()10.80.96-=.
即抽查的两次中至少有一次乘车人数超过18的概率为0.96.
(Ⅱ)设X 表示租用A 型车的总费用(单位:元),则X 的分布列为
X 80 100 120 140 160 180 P
0.56
0.16
0.12
0.08
0.06
0.02
800.561000.16EX =⨯+⨯ 1200.121400.08+⨯+⨯ 1600.061800.02+⨯+⨯ 99.6=.
设Y 表示租用B 型车的总费用(单位:元),则Y 的分布列为
X 90 110 130 150 P
0.84
0.08
0.06
0.02
900.841100.08EX =⨯+⨯ 1300.061500.0295.2+⨯+⨯=.
因此以王师傅本次付出的总费用的期望值为依据,租B 型车较合算. 【主题集训】
1.【内蒙古包头市2018届一模】某地区对一种新品种小麦在一块试验田进行试种.从试验田中抽取500株小麦,测量这些小麦的生长指标值,由测量结果得如下频数分布表: 生
长指标值分组 [)165,175
[)175,185
[)185,195
[)195,205 [)205,215
[)215,225
[)
225,235
频数 10 45 110 165 120 40 10
(1)在相应位置上作出这些数据的频率分布直方图;
(2)求这500株小麦生长指标值的样本平均数x 和样本方差2
s (同一组中的数据用该组区间的中点值作代表);
(3)由直方图可以认为,这种小麦的生长指标值Z 服从正态分布()
2
,6N μ,其中μ近似为样本平均数x ,
26近似为样本方差2s .
①利用该正态分布,求(187.8212.2)P Z <<;
②若从试验田中抽取100株小麦,记X 表示这100株小麦中生长指标值位于区间()187.8,212.2的小麦株数,利用①的结果,求EX . 附: 15012.2≈.
若()
2,6Z N μ~,则(66)0.6826P Z μμ-<<+=,
(2626)0.9544P Z μμ-<<+=.
【解析】(1)画图.
(3)①由(1)知()200,150Z N ~,从而
(187.8212.2)P Z << (20012.220012.2)P Z =-<<+ 0.6826=.
②由①知,一株小麦的生长指标值位于区间()187.8,212.2的概率为0.6826, 依题意知()100,0.6826X B ~, 所以1000.682668.26EX =⨯=.
2.【广西桂林、贺州、崇左三市2018届二联考】在创建“全国文明卫生城”过程中,某市“创城办”为了调查市民对创城工作的了解情况,进行了一次创城知识问卷调查(一位市民只能参加一次).通过随机抽样,得到参加问卷调查的1000人的得分(满分100分)统计结果如下表所示. 组别 [)30,40 [)40,50 [)50,60 [)60,70 [)70,80 [)80,90 [)90,100
频数 25
150
200
250
225
100
50
(1)由频数分布表可以大致认为,此次问卷调查的得分Z 服从正态分布(),210N μ, μ近似为这1000人得分的平均值值(同一组数据用该组数据区间的中点值表示),请用正态分布的知识求
(3679.50)P Z <≤;
(2)在(1)的条件下,“创城办”为此次参加问卷调查的市民制定如下奖励方案:: (ⅰ)得分不低于μ的可以获赠2次随机话费,得分低于μ的可以获赠1次随机话费; (ⅱ)每次获赠送的随机话费和对应的概率为: 赠送的随机话费(单元:元) 20
40
概率 0.75 0.25
现有市民甲要参加此次问卷调查,记X (单位:元)为该市民参加问卷调查获赠的话费,求X 的分布列与数学期望.
附:参考数据与公式
21014.5≈,若()2,X N μσ~,则①()0.6827P X μσμσ-<≤≤=;
②(22)0.9545P X μσμσ-<≤+=;③(33)0.9973P X μσμσ-<≤+=.
【解析】(1)350.025450.15550.2650.25750.225850.1950.0565EZ =⨯+⨯+⨯+⨯+⨯+⨯+⨯=. 故65μ=, 21014.5=, ∴(50.579.5)0.6287P Z <≤≈,
(3694)0.9545P Z >≤≈.
∴(3694)(50.579.5)
(3650.5)0.13592
P Z P Z P Z <≤-<≤<≤≈
=
综上, (3679.5)(3650.5)(50.579.5)P Z P Z P Z <≤=<≤+<≤
0.13590.62870.8186≈+=.
(2)易知()1()2
P Z P Z μμ<=≥=
获赠话费X 的可能取值为20,40,60,80.
()13320248
P X -=⨯=; ()1113313402424432P X ==⨯+⨯⨯=; ()13111336024424416P X ==⨯⨯+⨯⨯=; ()11118024432
P X ==
⨯⨯=. X 的分布列为:
X 20 40 60 80
P
38 1332 316 132
∴313312*********.58321632
EX =⨯
+⨯+⨯+⨯=. 3.【湖南省三湘名校教育联盟2018届三联考】2016年1月1日,我国实行全面二孩政策,同时也对妇幼保健工作提出了更高的要求.某城市实行网格化管理,该市妇联在网格1与网格2两个区域内随机抽取12个刚满8个月的婴儿的体重信息,休重分布数据的茎叶图如图所示(中位:斤,2斤=1千克).体重不超过9.8kg 的为合格.
(1)从网格1与网格2分别随机抽取2个婴儿,求网格1至少一个 婴儿体重合格且网格2至少一个婴儿体重合格的概率;
(2)妇联从网格1内8个婴儿中随机抽取4个进行抽检,若至少
2个 婴儿合格,则抽检通过,若至少3个合格,则抽检为良好.求网格1在抽检通过的条件下,获得抽检为良好的概率;
(3)若从网格1与网格2内12个婴儿中随机抽取2个,用X 表示网格2内婴儿的个数,求X 的分布列与数学期望.
【解析】(1)由茎叶图知,网格1内体重合格的婴儿数为4,网格2内体重合格的婴儿数为2,则所求概率
22
422284551184
C C P C C ⎛⎫⎛⎫=--= ⎪⎪⎝⎭⎝⎭.
(3)由题意知, X 的所有可能取值为0,1,2.
∴()2821214033C P X C ===, ()114821216133C C P X C ===, ()2
42
121
211
C P X C ===, ∴X 的分布列为
∴()1416120123333113
E X =⨯
+⨯+⨯=. 4.【云南省昆明市2018届第二次统考】在贯彻中共中央国务院关于精准扶贫政策的过程中,某单位定点帮扶甲、乙两个村各50户贫困户.为了做到精准帮扶,工作组对这100户村民的年收入情况、劳动能力情况、子女受教育情况、危旧房情况、患病情况等进行调查,并把调查结果转化为各户的贫困指标x 和y ,制成下图,其中“*”表示甲村贫困户,“+”表示乙村贫困户
.
若00.6x <<,则认定该户为“绝对贫困户”,若0.60.8x ≤≤,则认定该户为“相对贫困户”,若
0.81x <≤,则认定该户为“低收入户”;
若100y ≥,则认定该户为“今年能脱贫户”,否则为“今年不能脱贫户”.
(1)从甲村50户中随机选出一户,求该户为“今年不能脱贫的绝对贫困户”的概率;
(2)若从所有“今年不能脱贫的非绝对贫困户”中选3户,用ξ表示所选3户中乙村的户数,求ξ的分布列和数学期望()E ξ;
(3)试比较这100户中,甲、乙两村指标y 的方差的大小(只需写出结论). 【解析】(1)由图知,在甲村50户中,“今年不能脱贫的绝对贫困户”有5户, 所以从甲村50户中随机选出一户,该户为“今年不能脱贫的绝对贫困户”的概率为5
0.150
P =
= (2)由图知,“今年不能脱贫的非绝对贫困户”有10户,其中甲村6户,乙村4户,依题意,
ξ的可能值为0,1,2,3.从而
()3631020101206C P C ξ====, ()1246310601
11202C C P C ξ====,
()2146310363212010C C P C ξ====, ()3431041
312030
C P C ξ====
. 所以ξ的分布列为:
故ξ的数学期望()1131120123 1.262103010
E ξ=⨯
+⨯+⨯+⨯==. (3)这100户中甲村指标y 的方差大于乙村指标y 的方差.
5.【山西省平遥中学2018届高三3月考】随着网络的发展,网上购物越来越受到人们的喜爱,各大购物网站为增加收入,促销策略越来越多样化,促销费用也不断增加.下表是某购物网站2017年1-8月促销费用(万元)和产品销量(万件)的具体数据
.
(1)根据数据可知y 与x 具有线性相关关系,请建立y 关于x 的回归方程y b x a ∧
∧
∧
=+(系数精确到0.01); (2)已知6月份该购物网站为庆祝成立1周年,特制定奖励制度:以z (单位:件)表示日销量,
[)1800,2000z ∈,则每位员工每日奖励100元; [)2000,2100z ∈,则每位员工每日奖励150元;
[)2100,z ∈+∞,
则每位员工每日奖励200元.现已知该网站6月份日销量z 服从正态分布()0.2,0.0001N ,请你计算某位员工当月奖励金额总数大约多少元.(当月奖励金额总数精确到百分位) 参考数据:
8
1
338.5i i
i x y
==∑, 8
21
1308i i x ==∑,其中i x , i y 分别为第i 个月的促销费用和产品销量,
1,2,3,8i =.
参考公式: (1)对于一组数据
()11,x y , ()22,x y ,
,
(),n n x y ,其回归方程y b x a ∧
∧
∧
=+的斜率和截距的最小二
乘估计分别为
, a y b x
∧
∧
=-.
(2)若随机变量z 服从正态分布()
2
,N μσ,则(),0.6827P μσμσ-+=,
()2,20.9545P μσμσ-+=.
【解析】(1)由题可知11x =, 3y =,
将数据代入12
2
1
n
i i i n i i x y nxy b x nx ∧
==-=
-∑∑
得338.5811374.5
0.21913088121340
b ∧
-⨯⨯=
=≈-⨯
30.219110.59a y b x ∧
∧
=-=-⨯≈
所以y 关于x 的回归方程0.220.59y x ∧
=+
6.【河北省衡水中学2018届十模】一只药用昆虫的产卵数y 与一定范围内的温度x 有关,现收集了该种药用昆虫的6组观测数据如下表:
温度/x C 21 23
24
27 29 32
产卵数y /个 6
11
20 27 57 77
经计算得: 611266i i x x ===∑, 611336i i y y ===∑, ()()61557i i i x x y y =--=∑, ()6
2
1
84i i x x =-=∑,
()
6
2
1
3930i
i y y =-=∑,线性回归模型的残差平方和()6
2
1
236.4ˆ6i i i y y
=-=∑, 8.06053167e ≈,其中i x , i y 分别为观测数据中的温差和产卵数, 1,2,3,4,5,6i =.
(1)若用线性回归方程,求y 关于x 的回归方程ˆˆˆy bx a =+(精确到0.1);
(2)若用非线性回归模型求得y 关于x 回归方程为0.23030.06ˆx
y
e =,且相关指数2
0.9522R =.
(i )试与(1)中的回归模型相比,用2
R 说明哪种模型的拟合效果更好.
(ii )用拟合效果好的模型预测温度为35C 时该种药用昆虫的产卵数(结果取整数).
附:一组数据()11,x y , ()22,x y ,…, (),n n x y ,其回归直线ˆˆˆy
bx a =+的斜率和截距的最小二乘估计为
()()()121ˆn i i i n i i x x y y b x x ==--=-∑∑, ˆˆa y bx =-;相关指数()()2
212
1ˆ1n i i i n i i y y R y y ==-=--∑∑
【解析】(1)由题意得, ()()()
1
2
1
ˆn
i
i
i n
i
i x x y y b
x x ==--=-∑∑ 557 6.684
=≈,
∴33 6.62618ˆ3.6a
=-⨯=-, ∴y 关于x 的线性回归方程为 6.6386ˆ1.y
x =-
.
(ii )由(i )得当温度35x C =时, 0.230335ˆ0.06y
e ⨯= 8.06050.06e =⨯. 又∵8.0605
3167e
≈,∴0.063167ˆ190y
≈⨯≈(个). 即当温度35x C =时,该种药用昆虫的产卵数估计为190个.
7.【山西省2018届一模】某快递公司收取快递费用的标准是:重量不超过1kg 的包裹收费10元;重量超过
1kg 的包裹,除1kg 收费10元之外,超过1kg 的部分,每超出1kg (不足1kg ,按1kg 计算)需再收5元.
该公司将最近承揽的100件包裹的重量统计如下:
公司对近60天,每天揽件数量统计如下表:
以上数据已做近似处理,并将频率视为概率.
(1)计算该公司未来3天内恰有2天揽件数在101400~之间的概率; (2)①估计该公司对每件包裹收取的快递费的平均值;
②公司将快递费的三分之一作为前台工作人员的工资和公司利润,剩余的用作其他费用.目前前台有工作人员3人,每人每天揽件不超过150件,工资100元.公司正在考虑是否将前台工作人员裁减1人,试计算裁
员前后公司每日利润的数学期望,并判断裁员是否对提高公司利润更有利? 【解析】(1)样本中包裹件数在101400~之间的天数为48,频率484
605
f ==, 故可估计概率为
45
, 显然未来3天中,包裹件数在101400~之间的天数X 服从二项分布,
即43,5X B ⎛⎫~ ⎪⎝⎭,故所求概率为2
23414855125
C ⎛⎫⨯⨯=
⎪⎝⎭; (2)①样本中快递费用及包裹件数如下表:
故样本中每件快递收取的费用的平均值为
104315302015258304
15100
⨯+⨯+⨯+⨯+⨯=(元),
故该公司对每件快递收取的费用的平均值可估计为15元.
②根据题意及(2)①,揽件数每增加1,可使前台工资和公司利润增加1
1553
⨯=(元), 将题目中的天数转化为频率,得
若不裁员,则每天可揽件的上限为450件,公司每日揽件数情况如下:
故公司平均每日利润的期望值为260531001000⨯-⨯=(元); 若裁员1人,则每天可揽件的上限为300件,公司每日揽件数情况如下:
故公司平均每日利润的期望值为23552100975⨯-⨯=(元) 因9751000<,故公司将前台工作人员裁员1人对提高公司利润不利.
8.【北京市首师附中2018届零模】从某自动包装机包袋的食盐中,随机抽取20袋作为样本,按各袋的质量(单位:g)分成四组, [)[)[)[]
490,495,495,500,500,505,505,510,相应的样本频率分布直方图如图所示.
(Ⅰ)估计样本的中位数是多少?落入[)
500,505的频数是多少?
(Ⅱ)现从这台自动包装机包袋的大批量食盐中,随机抽取3袋,记ξ表示食盐质量属于[)
500,505的袋数,依样本估计总体的统计思想,求ξ的分布列及期望.
试卷
随机变量X的分布列是:
数学期望()
17919121 0123
573819028510
E X=⨯+⨯+⨯+⨯=.
9.【湖南省郴州市2018届二质监】某公司想了解对某产品投入的宣传费用与该产品的营业额的影响.下面是以往公司对该产品的宣传费用x (单位:万元)和产品营业额y (单位:万元)的统计折线图.。