微专题12 创新类的实际应用问题(提高版)

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

微专题12 创新类的实际应用问题
〖真题感悟〗
1.(多选)(2020山东新高考)信息熵是信息论中的一个重要概念.设随机变量X 所有可能的取值为1,2,
,n ,且1
()0(1,2,,),1n
i i i P X i p i n p ===>==∑,定义X 的信息熵
21
()log n
i i i H X p p ==-∑.( ).
A .若n =1,则H (X )=0
B .若n =2,则H (X )随着1p 的增大而增大
C .若1
(1,2,
,)i p i n n
==,则H (X )随着n 的增大而增大
D .若n =2m ,随机变量Y 所有可能的取值为1,2,,m ,且21()(1,2,,)j m j P Y j p p j m +-==+=,
则H (X )≤H (Y )
【答案】AC 【解析】对于A 选项,若1n =,则11,1i p ==,所以()()21log 10H X =-⨯=,所以A 选项正确.对于B 选项,若2n =,则1,2i =,211p p =-, 所以()()()121121X log 1log 1H p p p p =-⋅+-⋅-⎡⎤⎣⎦, 当114p =
时,()22
1
133log log 4444H X ⎛⎫
=-⋅+⋅ ⎪⎝⎭
, 当13p 4=
时,()223
311log log 4
444H X ⎛⎫=-⋅+⋅ ⎪⎝⎭,两者相等,所以B 选项错误.
对于C 选项,若()1
1,2,,i p i n n ==,则()2221
11log log log H X n n n
n n ⎛⎫=-⋅⨯=-= ⎪⎝⎭,
则()H X 随着n
增大而增大,所以C 选项正确.
对于D 选项,若2n m =,随机变量Y 的所有可能的取值为1,2,
,m ,且
()21j m j P Y j p p +-==+(1,2,,j m =).()2222
1
1
1
log log m
m
i i i i i i
H X p p p p ===-⋅=⋅∑∑ 12
22212
22
12
21
21111
log log log log m m m m
p p p p p p p p --=⋅+⋅++⋅+⋅. ()H Y =
()()()122
221212
12221
1
11
1
log log log m m m m m m m m p p p p p p p p p p p p -+-++⋅++⋅+
++⋅+++12
22212
22
122212211211
11
log log log log m m m m m m
p p p p p p p p p p p p ---=⋅+⋅+
+⋅+⋅++++由于()01,2,
,2i p i m >=,所以2111i i m i p p p +->+,所以222111
log log i i m i
p p p +->+, 所以222111
log log i i i i m i
p p p p p +-⋅>⋅+,所以()()H X H Y >,所以D 选项错误. 故选:AC .
(1)求X 的分布列.
(2)若甲药.乙药在试验开始时都赋予4分,p i (i =0,1,…,8)表示“甲药的累计得分为i 时,最终认为甲药比乙药更有效”的概率,则p 0=0,p 8=1,p i =ap i -1+bp i +cp i +1(i =1,2,…,7),其中a =P (X =-1),b =P (X =0),c =P (X =1).假设α=0.5,β=0.8. ①证明:{p i +1-p i }(i =0,1,2,…,7)为等比数列; ②求p 4,并根据p 4的值解释这种试验方案的合理性.
【解析】X 的所有可能取值为-1,0,1. P (X =-1)=(1-α)β,P (X =0)=αβ+(1-α)(1-β), P (X =1)=α(1-β), 所以X 的分布列为
(2)①由(1)得a =0.4,b =0.5,c =0.1.因此p i =0.4p i -1+0.5p i +0.1p i +1, 故0.1(p i +1-p i )=0.4(p i -p i -1),即p i +1-p i =4(p i -p i -1).
又因为p 1-p 0=p 1≠0,所以{p i +1-p i }(i =0,1,2,…,7)为公比为4,首项为p 1的等比数列. ②由①可得p 8=p 8-p 7+p 7-p 6+…+p 1-p 0+p 0=(p 8-p 7)+(p 7-p 6)+…+(p 1-p 0)=48-13
p 1.
由于p 8=1,故p 1=3
48-1,所以p 4=(p 4-p 3)+(p 3-p 2)+(p 2-p 1)+(p 1-p 0)=
44-13
p 1=1
257.
p 4表示最终认为甲药更有效的概率,由计算结果可以看出,在甲药治愈率为0.5,乙药治愈率为0.8时,认为甲药更有效的概率为p 4=1
257≈0.003 9,此时得出错误结论的概率非常小,
说明这种试验方案合理. 〖典题导引〗
例1.2018年政府工作报告指出,要加快建设创新型国家,把握世界新一轮科技革命和产业变革大势,深入实施创新驱动发展战略,不断增强经济创新力和竞争力.某手机生产企业积极响应政府号召,大力研发新产品,争创世界名牌.为了对研发的一批最新款手机进行合理定价,将该款手机按事先拟定的价格进行试销,得到一组销售数据(),(1,2,,6)i i x y i =,
如表所示:
已知6
1
1606i i y y ===∑.
(1)若变量,x y 具有线性相关关系,求产品销量y (百件)关于试销单价x (千元)的线
性回归方程ˆˆˆy
bx a =+; (2)用(1)中所求的线性回归方程得到与i x 对应的产品销量的估计值i y .当销售数据
(),i i x y 对应的残差的绝对值ˆ1i i y y -≤时,则将销售数据(),i i x y 称为一个“好数据”.现从6
个销售数据中任取3个子,求“好数据”个数ξ的分布列和数学期望()E ξ.
(参考公式:线性回归方程中ˆˆ,b
a 的估计值分别为1
2
2
1
ˆˆˆ,)==-==--∑∑n
i i
i n
i
i x y nxy
b a
y bx x
nx . 【解析】(1)由6
11606i i y y ===∑,可求得48t =,故1
1910n
i i i x y ==∑,=1980nx y ,
2
1
199n
i
i x ==∑,2
=181.5nx ,代入可得12
21
1910198070
4199181.517.5
n
i i
i n
i
i x y nx y
b x
nx
==---=
=
==---∑∑,
ˆˆ604 5.582a
y bx =-=+⨯=,所以所求的线性回归方程为ˆ482y x =-+.
(2)利用(1)中所求的线性回归方程ˆ482y
x =-+可得,当13x =时,170y =;当24x = 时,2
66y =;当35x =时,362y =;当46x =时,458y =;当57x =时,554y =;当
68x =时,650y =. 与销售数据对比可知满足||1(1,2,
,6)i i y y i -≤=的共有4个“好数
据”:(3,70).(4,65).(5,62).(6,59) 。

于是ξ的所有可能取值为1,2,3
1242361(1)5C C P C ξ===,2142363(2)5C C P C ξ===,30423
61
(3)5
C C P C ξ===, ∴ξ 的分布列为:
所以131232555
E ξ=⨯+⨯+⨯=.
(1)看过中国女排的纪录片后,某大学掀起“学习女排精神,塑造健康体魄”的年度主题活动,一段时间后,学生的身体素质明显提高,将该大学近5个月体重超重的人数进行统计,得到如下表格:
(2)在某次排球训练课上,球恰由A 队员控制,此后排球仅在A 队员.B 队员和C 队员三人中传递,已知每当球由A 队员控制时,传给B 队员的概率为12,传给C 队员的概率为1
2
;每当球由B 队员控制时,传给A 队员的概率为
23,传给C 队员的概率为1
3
;每当球由C 队员控制时,传给A 队员的概率为23,传给B 队员的概率为1
3
.记n a ,n b ,n c 为经过n 次传
球后球分别恰由A 队员.B 队员.C 队员控制的概率. (i )若3n =,B 队员控制球的次数为X ,求EX ; (ii )若n 112233n n a b c --=
+,111123n n n b a c --=+,1111
23
n n n c a b --=+,2n ≥,n ∈*N ,
证明:25n a ⎧⎫-⎨⎬⎩⎭为等比数列,并判断经过200次传球后A 队员控制球的概率与
2
5
的大小. 附1:回归方程ˆˆˆy
bx a =+中斜率和截距的最小二乘估计公式分别为:()()
()
1
1
2
2
2
1
1
=
n n
i i
i
i
i i n
n
i
i
i i x y nx y x x y y b x
nx
x x ====-⋅--=
--∑∑∑∑;a y bx =-.
附2:参考数据:
5
1
5180i i
i x y
==∑,5
2222221
1234555i i x ==++++=∑.
【解析】(1)由已知可得:12345
35
x ++++=
=,
6405404203002002100
42055
y ++++=
==,
又因为
5
1
5180i i
i x y
==∑,5
2222221
1234555i i x ==++++=∑,
所以5
1
5
2
22
1
5518063001120
ˆ112555310
5i i
i i
i x y xy
b
x
x ==--==
=-=--⨯-∑∑, 所以ˆˆ4201123756a
y bx =-=+⨯=,所以ˆˆˆ112756y bx a x =+=-+, 当(
)
11275610y x x *
=-+<∈N 时,7x ≥,
所以,可以预测从第7月份开始该大学体重超重的人数降至10人以下. (2)(i )由题知X 的可能取值为:0,1,2;
()121102326P X ==⨯⨯=;()1211121112111
12322332323218P X ==⨯⨯+⨯⨯+⨯+⨯⨯=;
()1211112
22322339
P X ==⨯⨯+⨯⨯=;
X 的分布列为:
所以()111219012618918
E X =⨯+⨯+⨯=. (ii )(法一)由111123n n n b a c --=+,1111
23
n n n c a b --=+,
两式相加得:()11113n n n n n b c a b c ---+=++.因为1122
33
n n n a b c --=+,
所以1132n n n b c a --+=,132n n n b c a ++=,代入等式得1131
22
n n n a a a +-=+,即
111233n n n a a a +-=+所以1121222
333
n n n n a a a a a a +-+=+==+,
因为10a =,21212223233a =
⨯+⨯=,所以122
33
n n a a ++=,所以1222535n n a a +⎛⎫-=-- ⎪⎝⎭,
所以数列25n a ⎧⎫-⎨⎬⎩⎭是首项为25-,公比为23-的等比数列,所以1
222553n n a -⎛⎫⎛⎫-=-- ⎪⎪⎝⎭⎝⎭
, 即1
22153n n a -⎡⎤
⎛⎫
=--⎢⎥ ⎪
⎝⎭⎢⎥⎣⎦
,因此经过200次传球后A 队员控制球的概率 199
200
2221535
a ⎡⎤⎛⎫=-->⎢⎥ ⎪⎝⎭
⎢⎥⎣⎦. (法二)由题知:111123n n n c a b --=
+,所以112
23
n n n b c a --=-,所以11112222333n n n n n n a b c c a c ----=+=-+,又因为1111
123
n n n n n b a c a c --=+=--,
所以1111123n n n n c a a c --=---,所以112
212223
n n n n n n a c a c a a --=-+-=--,
所以12233n n a a -=-+,所以1222535n n a a -⎛⎫-=-- ⎪⎝⎭,又因为10a =,所以1
22
055
a -=-≠, 所以数列25n a ⎧
⎫-⎨⎬⎩⎭是首项为25-
,公比为2
3
-的等比数列, 所以1
222553n n a -⎛⎫⎛⎫
-=-- ⎪⎪
⎝⎭⎝⎭
,即1
22153n n a -⎡⎤
⎛⎫=--⎢⎥ ⎪
⎝⎭⎢⎥⎣⎦
, 因此经过200次传球后A 队员控制球的概率199
200222
1535
a ⎡⎤⎛⎫=-->⎢⎥ ⎪⎝⎭⎢⎥⎣⎦. 〖新题在线〗
(1)试估计该校学生在校月消费的平均数;
(2)根据校服务部以往的经验,每个学生在校的月消费金额x (元)和服务部可获得利润y
(元),满足关系式:10,200400,
30,400800,50,8001200,x y x x ≤<⎧⎪
=≤<⎨⎪≤≤⎩
根据以上抽样调查数据,将频率视为概率,
回答下列问题:
(i )将校服务部从一个学生的月消费中,可获得的利润记为ξ,求ξ的分布列及数学期望.
【解析】(1)学生月消费的平均数
113(
300500700400010001000x =⨯+⨯+⨯ 11
9001100)20068020004000
+⨯+⨯⨯=. (2)(i )月消费值落入区间[)200,400.[)400,800.[]
800,1200的频率分别为
0.05.0.80.0.15,因此()100.05P ξ==,()300.80P ξ==,()500.15P ξ==,即ξ的分布列为
ξ的数学期望值()100.05300.80500.1532E ξ=⨯+⨯+⨯=.
(ii )服务部的月利润为32200064000⨯=(元),受资助学生人数为20000.05100⨯=, 每个受资助学生每月可获得1
640001001604
⨯÷=(元).
甲同学报名参加了这四个志愿者服务项目,记ξ为甲同学最终被招募的项目个数,已知P (ξ=0)
140=
,P (ξ=4)1
10
=. (1)求甲同学至多获得三个项目招募的概率; (2)求a ,b 的值;
(3)假设有十名报了项目A 的志愿者(不包含甲)调整到项目D ,试判断E ξ如何变化(结论不要求证明).
【解析】(1)因为()1
040
P ξ==
,所以a >60,且b >80. 设事件A 表示“甲同学被项目A 招募”,由题意可知,()501
1002P A ==; 设事件B 表示“甲同学被项目B 招募”,由题意可知,()60
P B a =;
设事件C 表示“甲同学被项目C 招募”,由题意可知,()80
P C b
=;
设事件D 表示“甲同学被项目D 招募”,由题意可知,()1604
2005
P D =
=, 由于事件“甲同学至多获得三个项目招募”与事件“ξ=4”是对立的, 所以甲同学至多获得三个项目招募的概率是 ()191411010
P ξ-==-=; (2)由题意可知,()()
1608041
011112540
P P ABCD a b ξ⎛⎫⎛⎫⎛⎫⎛⎫===-
⋅-⋅-⋅-=
⎪ ⎪ ⎪ ⎪⎝⎭⎝⎭⎝⎭⎝⎭, ()()1608041
42510
P P ABCD a b ξ===
⋅⋅⋅=,解得a =120,b =160. (3)E ξ变大. 〖作业反馈〗
1.(多选)已知随机变量ξ的分布列如下表所示.
其中a ,b ,c 成等差数列,则P ( ).
A .23
B .1
3 C .⎣⎡⎦⎤-13,13 D .⎣⎡⎦⎤13,23 【答案】AC 【解析】因为a ,b ,c 成等差数列,所以2b =a +c .
又a +b +c =1,所以b =13,所以P (|ξ|=1)=a +c =2
3

则a =13-d ,c =13+d ,根据分布列的性质,得0≤13-d ≤23,0≤13+d ≤2
3,
所以-13≤d ≤1
3
.故选AC .
2.已知随机变量ξ的分布列,则下列说法正确的是( ).
A .存在x ,y ∈(0,1),E (ξ)>
1
2
B .对任意x ,y ∈(0,1),E (ξ)≤
14
C .对任意x ,y ∈(0,1),
D (ξ)≤
E (ξ) D .存在x ,y ∈(0,1),D (ξ)>
14
【答案】C 【解析】依题意可得()2E xy ξ=,
()()()()()()()222222
222212121212D x xy y y xy x y x y x y x y x x y yx
ξ⎡⎤=-+-=-+-=-+-⎣⎦
因为1x y +=。

所以()2
122
2
x y xy +≤
=
即()12E ξ≤故A ,B 错误;
()()()()()()2222
21121212D x x x y yx x x y yx x yx ξ⎡⎤∴=-+-=-+=-⎣⎦
因为10<<x 1211x ∴-<-<()2
0211x ∴<-<()D yx ξ∴<即()()1
2
D E ξξ<
,故C 成立;()()
()2
2
1124
4
x y D x yx xy ξ+=-<≤
=
,故D 错误.故选:C .
(1)求a 的值并估计销售量的平均数;
(2)若销售量大于或等于70,则称该日畅销,其余为滞销.在畅销日中用分层抽样的方法随机
抽取8天,再从这8天中随机抽取3天进行统计,设这3天来自X 个组,求随机变量X 的分布列及数学期望(将频率视为概率) .
【解析】(1)由题意知⎩
⎪⎨⎪⎧10n ≥50,
10(n +1)≤100,解得5≤n ≤9,n 可取5,6,7,8,9,
结合f (x )=⎩⎨⎧n
10-0.5,10n ≤x <10(n +1),n 为偶数,
n
20-a ,10n ≤x <10(n +1),n 为奇数,
得⎝⎛⎭⎫610-0.5+⎝⎛⎭⎫810-0.5+⎝⎛⎭⎫520-a +⎝⎛⎭⎫720-a +⎝⎛⎭
⎫9
20-a =1,则a =0.15. 可知销售量分布在[50,60),[60,70),[70,80),[80,90),[90,100)内的频率分别是0.1,0.1,0.2,0.3,0.3,
∴销售量的平均数为55×0.1+65×0.1+75×0.2+85×0.3+95×0.3=81.
(2)销售量分布在[70,80),[80,90),[90,100)内的频率之比为2∶3∶3,所以在各组抽取的天数分别为2,3,3, X 的所有可能取值为1,2,3,
P (X =1)=2C 38=256=128,P (X =3)=C 12C 13C 1
3C 38
=18
56=928,P (X =2)=1-128-928=914.
X 的分布列为
数学期望E (X )=1×128+2×914+3×928=16
7

4.为了监控某种零件的一条生产线的生产过程,检验员每隔30 min 从该生产线上随机抽取一个零件,并测量其尺寸(单位:cm).下面是检验员在一天内依次抽取的16个零件的尺寸:
经计算得x -
=116∑16
i =1x i
=9.97,s =
116∑16
i =
1
(x i -x -)2=116(∑16i =
1
x 2
i -16x -2)≈0.212,
∑16 i=1(i-8.5)2≈18.439,∑
16
i=1
(x i-x-)(i-8.5)=-2.78,其中x i为抽取的第i个零件的尺寸,
i=1,2, (16)
(1)求(x i,i)(i=1,2,…,16)的相关系数r,并回答是否可以认为这一天生产的零件尺寸不随生产过程的进行而系统地变大或变小(若|r|<0.25,则可以认为零件的尺寸不随生产过程的进行而系统地变大或变小).
(2)一天内抽检零件中,如果出现了尺寸在(x--3s,x-+3s)之外的零件,就认为这条生产线在这一天的生产过程可能出现了异常情况,需对当天的生产过程进行检查.
②在(x--3s,x-+3s)之外的数据称为离群值,试剔除离群值,估计这条生产线当天生产的零件尺寸的均值与标准差.(精确到0.01)
附:样本(x i,y i)(i=1,2,…,n)的相关系数r=

n
i=1
(x i-x-)(y i-y-)

n
i=1
(x i-x-)2∑
n
i=1
(y i-y-)2
,0.008
≈0.09.
【解析】(1)由样本数据得(x i,i)(i=1,2,…,16)的相关系数
r=

16
i=1
(x i-x-)(i-8.5)

16
i=1
(x i-x-)2∑
16
i=1
(i-8.5)2

-2.78
0.212×16×18.439
≈-0.18.
由于|r|<0.25,因此可以认为这一天生产的零件尺寸不随生产过程的进行而变大或变小.(2)①由于x-=9.97,s≈0.212,由样本数据可以看出抽取的第13个零件的尺寸在(x--3s,x-+3s)以外.因此需对当天的生产过程进行检查.
②剔除离群值,即第13个数据,剩下数据的平均数为1
15(16×9.97-9.22)=10.02,这条生产线当天生产的零件尺寸的均值的估计值为10.02.

16
i=1
x2i≈16×0.2122+16×9.972≈1 591.134,
剔除第13个数据,剩下数据的样本方差为1
15(1 591.134-9.222-15×10.022)≈0.008,这条生产线当天生产的零件尺寸的标准差的估计值为0.008≈0.09.
5.(2020北京丰台区二模)为了增强学生的冬奥会知识,弘扬奥林匹克精神,北京市多所中小学校开展了模拟冬奥会各项比赛的活动.为了了解学生在越野滑轮和旱地冰壶两项中的参与情况,在北京市中小学学校中随机抽取了10所学校,10所学校的参与人数如下:
(1)现从这10所学校中随机选取2所学校进行调查.求选出的2所学校参与越野滑轮人数都超过40人的概率;
(2)现有一名旱地冰壶教练在这10所学校中随机选取2所学校进行指导,记X 为教练选中参加旱地冰壶人数在30人以上的学校个数,求X 的分布列和数学期望;
【解析】(1)记“选出的两所学校参与越野滑轮人数都超过40人”为事件S ,现从这10所学校中随机选取2所学校进行调查,可得基本事件总数为
2
10.
参与越野滑轮人数超过40人的学校共4所,随机选择2所学校共2
4C 6=种,
所以()24210
43C 22109C 152
P S ⨯===⨯.
(2)X 的所有可能取值为0,1,2,参加旱地冰壶人数在30人以上的学校共4所.
()0246210C C 10C 3P X ⋅===,()1146210C C 81C 15P X ⋅===,()20
46
2
10C C 22C 15
P X ⋅===. X 的分布列为:
()180********
E X =⨯+⨯+⨯=.
(3)答案不唯一.
答案示例1:可以认为甲同学在指导后总考核为“优”的概率发生了变化.理由如下: 指导前,甲同学总考核为“优”的概率为:2
2
3
3
33C 0.10.9C 0.10.028⋅⋅+⋅=.
指导前,甲同学总考核为“优”的概率非常小,一旦发生,就有理由认为指导后总考核达到“优”的概率发生了变化.
答案示例2:无法确定.理由如下:
指导前,甲同学总考核为“优”的概率为:2
2
3
3
33C 0.10.9C 0.10.028⋅⋅+⋅=.
虽然概率非常小,但是也可能发生,所以,无法确定总考核达到“优”的概率发生了变化. 6.电影公司随机收集了电影的有关数据,经分类整理得到下表:
好评率是指:一类电影中获得好评的部数与该类电影的部数的比值. 假设所有电影是否获得好评相互独立.
(1)从电影公司收集的电影中随机选取1部,求这部电影是获得好评的第四类电影的概率; (2)从第四类电影和第五类电影中各随机选取1部,估计恰有1部获得好评的概率; (3)假设每类电影得到人们喜欢的概率与表格中该类电影的好评率相等.用“ξk =1”表示第k 类电影得到人们喜欢,“ξk =0”表示第k 类电影没有得到人们喜欢(k =1,2,3,4,5,6).写出方差D (ξ1),D (ξ2),D (ξ3),D (ξ4),D (ξ5),D (ξ6)的大小关系.
【解析】(1)由题意知,样本中电影的总部数是140+50+300+200+800+510=2 000,第四类电影中获得好评的电影部数是200×0.25=50.故所求概率为50
2 000
=0.025. (2)设事件A 为“从第四类电影中随机选出的电影获得好评”, 事件B 为“从第五类电影中随机选出的电影获得好评” .
故所求概率为P (AB -
+A -
B )=P (AB -
)+P (A -
B )=P (A )(1-P (B ))+(1-P (A ))P (B ) . 由题意知:P (A )估计为0.25,P (B )估计为0.2. 故所求概率估计为0.25×0.8+0.75×0.2=0.35. (3)由题意可知,定义随机变量如下:
ξk =⎩
⎪⎨⎪⎧0,第k 类电影没有得到人们喜欢,1,第k 类电影得到人们喜欢,则ξk 显然服从两点分布,故
D (ξ1)=0.4×(1-0.4)=0.24,D (ξ2)=0.2×(1-0.2)=0.16,
D (ξ3)=0.15×(1-0.15)=0.127 5,D (ξ4)=0.25×(1-0.25)=0.187 5, D (ξ5)=0.2×(1-0.2)=0.16,D (ξ6)=0.1×(1-0.1)=0.09. 综上所述,D (ξ1)>D (ξ4)>D (ξ2)=D (ξ5)>D (ξ3)>D (ξ6).。

相关文档
最新文档