2020版高考数学二轮复习第2部分专题3概率与统计第1讲概率、随机变量及其分布教案(理)

合集下载

2020高考数学二轮复习概率与统计.docx

2020高考数学二轮复习概率与统计.docx

2020 高考数学二轮复习 概率与统计概率内容的新概念 多,相近概念容易混淆,本 就学生易犯 作如下 :型一 “非等可能 ”与 “等可能 ”混同 例 1 两枚骰子,求所得的点数之和 6 的概率.解两枚骰子出 的点数之和2, 3, 4, ⋯ ,12 共 11 种基本事件,所以概率P=111剖析以上 11 种基本事件不是等可能的,如点数和 2 只有 (1, 1),而点数之和6 有 (1, 5)、(2, 4)、 (3, 3)、 (4,2)、 (5, 1)共 5 种.事 上, 两枚骰子共有 36 种基本事件,且是等可能的,所以“所得点数之和6”的概率 P= 5.36型二 “互斥 ”与 “ 立 ”混同例 2把 、黑、白、4 牌随机地分 甲、乙、丙、丁4 个人,每个人分得1 ,事件“甲分得 牌”与“乙分得 牌”是()A . 立事件B .不可能事件C .互斥但不 立事件D .以上均不解A剖析 本 的原因在于把 “互斥 ”与 “ 立”混同,二者的 系与区 主要体 在 :(1)两事件 立,必定互斥,但互斥未必 立; (2) 互斥概念适用于多个事件,但 立概念只适用于两个事件; (3) 两个事件互斥只表明 两个事件不能同 生,即至多只能 生其中一个,但可以都不 生;而两事件 立 表示它 有且 有一个 生.事件 “甲分得 牌 ”与 “乙分得 牌 ”是不能同 生的两个事件,两个事件可能恰有一个 生,一个不 生,可能两个都不 生,所以 C .型三 例 3解“互斥 ”与 “独立 ”混同甲投 命中率 O .8,乙投 命中率 0.7,每人投 3 次,两人恰好都命中 2 次的概率是多少 ?“甲恰好投中两次” 事件 A , “乙恰好投中两次” 事件B , 两人都恰好投中两次事件A+B , P(A+B)=P(A)+P(B): c 32 0.820.2 c 32 0.720.3 0.825剖析本 的原因是把相互独立同 生的事件当成互斥事件来考 , 将两人都恰好投中2 次理解 “甲恰好投中两次”与 “乙恰好投中两次 ”的和.互斥事件是指两个事件不可能同 生;两事件相互独立是指一个事件的 生与否 另一个事件 生与否没有影响,它 然都描 了两个事件 的关系,但所描 的关系是根本不同.解:“甲恰好投中两次 ” 事件 A ,“乙恰好投中两次” 事件 B ,且 A , B 相互独立,两人都恰好投中两次 事件A ·B ,于是 P(A ·B)=P(A) ×P(B)= 0.169类型四例 4错解“条件概率 P(B / A)”与“积事件的概率P(A·B)”混同袋中有 6 个黄色、 4 个白色的乒乓球,作不放回抽样,每次任取一球,取 2 次,求第二次才取到黄色球的概率.记“第一次取到白球”为事件A,“第二次取到黄球”为事件B,”第二次才取到黄球”为事件62C,所以 P(C)=P(B/A)=.93剖析本题错误在于 P(A B)与 P(B/A) 的含义没有弄清 , P(A B) 表示在样本空间S 中 ,A 与 B 同时发生的概率;而P( B/A )表示在缩减的样本空间S A中,作为条件的 A 已经发生的条件下事件 B 发生的概率。

人教A版2020届高考数学二轮复习(理)讲义及题型归纳(拔高):概率与统计

人教A版2020届高考数学二轮复习(理)讲义及题型归纳(拔高):概率与统计

概率与统计一、考纲解读1.理解取有限个值的离散型随机变量及其分布列的概念,了解分布列对于刻画随机现象的重要性。

2.理解超几何分布及其推导过程,并能进行简单的应用。

3.了解条件概率和两个事件相互独立的概念,理解n 次独立重复实验的模型及二项分布,并能解决一些简单的实际问题。

4.理解取有限个值的离散型变量均值,方差的概念,能计算简单离散型随机变量的均值、方差,并能解决一些实际问题。

5.利用实际问题的频率分布直方图,了解正态分布密度曲线的特点及曲线所表示的意义二、命题趋势探究1.高考命题中,该部分命题形式有选择题、填空题,但更多的是解答题。

2.主要以离散型随机变量分布列为主体命题,计算离散型随机变量的期望和方差,其中二项分布与超几何分布为重要考点,难度中等以下。

3.有关正态分布的考题多为一道小题。

三、知识点精讲(一).条件概率与独立事件(1)在事件A 发生的条件下,时间B 发生的概率叫做A 发生时B 发生的条件概率,记作()P B A ,条件概率公式为()=P B A ()()P AB P A 。

(2)若()=P BA P B (),即()=()()P A B PAPB ,称A 与B 为相互独立事件。

A 与B相互独立,即A 发生与否对B 的发生与否无影响,反之亦然。

即,A B 相互独立,则有公式()=()()P AB P A P B 。

(3)在n 次独立重复实验中,事件A 发生k ()0k n ≤≤次的概率记作()n P k ,记A在其中一次实验中发生的概率为()P A p = ,则()()1n k k k n n P k C p p -=- .(二).离散型随机变量分布列、期望、方差及其性质(1)离散型随机变量ξ的分布列(如表13-1所示).表13-1①()11,i p i n i N θ*≤≤≤≤∈ ;②121n p p p ++= .(2)E ξ表示ξ的期望:1122=+n n p p p E ξξξξ++…,反应随机变量的平均水平,若随机变量ξη,满足=a b ηξ+,则E aE b ηξ=+.(3)D ξ表示ξ的方差:()()()2221122=---n n E p E p E p D ξξξξξξξ+++,反映随机变量ξ取值的波动性。

2020版高考数学大二轮复习第二部分专题4概率与统计第2讲概率、离散型随机变量及其分布课件理

2020版高考数学大二轮复习第二部分专题4概率与统计第2讲概率、离散型随机变量及其分布课件理
出判断.
[题组练透] 1.(2019·甘肃质检)某精准扶贫帮扶单位,为帮助定点扶贫村真正脱贫,坚持扶贫同扶 智相结合,帮助精准扶贫户利用互联网电商渠道销售当地特产苹果.苹果单果直径不 同单价不同,为了更好的销售,现从该精准扶贫户种植的苹果树上随机摘下了 50 个苹 果测量其直径,经统计,其单果直径分布在区间[50,95]内(单位: mm),统计的茎叶 图如图所示:
(1)试判断谁的计算结果正确?求回归方程. (2)若由线性回归方程得到的估计数据与检测数据的误差不超过 1,则该检测数据是 “理想数据”.现从检测数据中随机抽取 3 个,求“理想数据”的个数 X 的分布列和 数学期望.
解析:(1)已知变量 x,y 具有线性负相关关系,故甲不对, ∵ x =6.5, y =79,代入两个回归方程,验证乙同学正确, 故回归方程为^y =-4x+105. (2)
则 P(A)=130,P(AB)=130×79=370,
7 则所求概率为 P(B|A)=PPAAB=330=79.
10 法二:第 1 次抽到螺口灯泡后还剩余 9 只灯泡,其中有 7 只卡口灯泡,故第 2 次抽到 卡口灯泡的概率为CC7119=79. 答案:D
3.某企业有甲、乙两个研发小组,他们研发新产品成功的概率分别为23和35.现安排甲 组研发新产品 A,乙组研发新产品 B.设甲、乙两组的研发相互独立. (1)求至少有一种新产品研发成功的概率; (2)若新产品 A 研发成功,预计企业可获利润 120 万元;若新产品 B 研发成功,预计企 业可获利润 100 万元,求该企业可获利润的分布列.
按方案 B:设收购价格为 X,则
P(X=6)=0.83=0.512,
P(X=5)=C13×0.82×0.2=0.384, P(X=4.5)=C23×0.8×0.22=0.096, P(X=4)=0.23=0.008,

高考数学(理科)二轮专题:第二篇专题四第1讲 概率、随机变量及其分布列

高考数学(理科)二轮专题:第二篇专题四第1讲 概率、随机变量及其分布列

专题四 概率与统计第1讲 概率、随机变量及其分布列(限时45分钟,满分96分)一、选择题(本大题共8小题,每小题5分,共40分.在每小题给出的四个选项中,只有一项是符合题目要求的)1.(2019·株洲二模)如图,在边长为1的正方形内有不规则图形Ω,由电脑随机从正方形中抽取10 000个点,若落在图形Ω内和图形Ω外的豆子分别为3 335,6 665,则图形Ω面积的估计值为A.13B.12C.14D.16解析 设图形Ω 的面积为S ,∵由电脑随机从正方形中抽取10 000个点,落在图形Ω内和图形Ω外的豆子分别为3 335,6 665,∴S 1=3 33510 000≈13,∴S ≈13.故选A. 答案 A2.(2019·潍坊模拟)四色猜想是世界三大数学猜想之一,1976年数学家阿佩尔与哈肯证明,称为四色定理.其内容是:“任意一张平面地图只用四种颜色就能使具有共同边界的国家涂上不同的颜色.”用数学语言表示为“将平面任意地细分为不相重叠的区域,每一个区域总可以用1,2,3,4四个数字之一标记,而不会使相邻的两个区域得到相同的数字.”如图,网格纸上小正方形的边长为1,粗实线围成的各区域上分别标有数字1,2,3,4的四色地图符合四色定理,区域A 和区域B 标记的数字丢失.若在该四色地图上随机取一点,则恰好取在标记为1的区域的概率所有可能值中,最大的是A.115B.110C.13D.1130解析 A ,B 只能有一个可能为1,题目求最大,令B 为1,则总数有30个,1号有10个,则概率为13.故选C.答案 C3.(2019·浙江衢州五校联考)随机变量的分布列如下:若E (X )=13,则D (X )的值是A.19B.29C.49D.59解析 由题设可得a +b =23,b -a =13⇒a =16,b =12,所以由数学期望的计算公式可得 E (X 2)=0×13+1×23=23,(E (X ))2=19,所以由随机变量的方差公式可得 D (X )=E (X 2)-(E (X ))2=59.故选D.答案 D4.(2019·河北省级示范校联合体联考)袋子中有四个小球,分别写有“和、平、世、界”四个字,有放回地从中任取一个小球,直到“和”“平”两个字都取到就停止,用随机模拟的方法估计恰好在第三次停止的概率.利用电脑随机产生0到3之间取整数值的随机数,分别用0,1,2,3代表“和、平、世、界”这四个字,以每三个随机数为一组,表示取球三次的结果,经随机模拟产生了以下24个随机数组:232 321 230 023 123 021 132 220 011 203 331 100 231 130 133 231 031 320 122 103 233 221 020 132 由此可以估计,恰好第三次就停止的概率为 A.18B.14C.16D.524解析 由题意可知,满足条件的随机数组中,前两次抽取的数中必须包含0或1,且0与1不能同时出现,出现0就不能出现1,反之亦然,第三次必须出现前面两个数字中没有出现的1或0,可得符合条件的数组只有3组:021,130,031,故所求概率为P =324=18.故选A.答案 A5.(2019·郑州一模)魔法箱中装有6张卡片,上面分别写着如下六个定义域为R 的函数:f 1(x )=2x ,f 2(x )=2x,f 3(x )=x 2,f 4(x )=sin x ,f 5(x )=cos x ,f 6(x )=1-2x1+2x,现从魔法箱中任取2张卡片,将卡片上的函数相乘得到一个新函数,所得新函数为奇函数的概率是A.25B.35C.12D.13解析 首先结合f (-x )+f (x )与0的关系,判断该六个函数的奇偶性,结合题意可知1,4,6为奇函数,3,5为偶函数,2为非奇非偶函数,从6张卡片抽取2张,有C 26=15种,而任取2张卡片得到的新函数为奇函数,说明该两个函数为一奇一偶函数,故有3×2=6种,结合古典概型计算公式,相除得25.故选A.答案 A6.(2019·辽阳期末)一批排球中正品有m 个,次品有n 个,m +n =10(m ≥n ),从这批排球中每次随机取一个,有放回地抽取10次,X 表示抽到的次品个数.若D (X )=21,从这批排球中随机抽取两个,则至少有一个正品的概率p =A.4445B.1415C.79D.1315解析 依题意可得X ~B ⎝⎛⎭⎫10,n10, 则DX =10×n10×⎝⎛⎭⎫1-n 10=21, 又m ≥n ,则n ≤5,从而n =3, 则p =1-C 23C 210=1415.故选B.答案 B7.(2019·济南期末)如图,在△ABC 中,∠C =90°,BC =2,AC =3,三角形内的空白部分由三个半径均为1的扇形构成,向△ABC 内随机投掷一点,则该点落在阴影部分的概率为A.π6B .1-π6C.π4D .1-π4解析 由题意,题目符合几何概型,在△ABC 中,∠C =90°,BC =2,AC =3,面积为12×BC ×AC =3,阴影部分的面积为:三角形面积-12圆面积=3-π2,所以点落在阴影部分的概率为3-π23=1-π6.故选B.答案 B8.(2019·贵州重点中学联考)有一种“三角形”能够像圆一样,当作轮子用.这种神奇的三角形,就是以19世纪德国工程师勒洛的名字命名的勒洛三角形.这种三角形常出现在制造业中(例如图1中的扫地机器人).三个等半径的圆两两互相经过圆心,三个圆相交的部分就是勒洛三角形,如图2所示.现从图2中的勒洛三角形内部随机取一点,则此点取自阴影部分的概率为A.2π-334π-23 B.23π3-3C.32π-23D.2π-332π-23解析 设圆半径为R ,如图,易得△ABC 的面积为12·32R 2=34R 2,阴影部分面积为3·60πR 2360-3·34R 2=2π-334R 2,勒洛三角形的面积为2π-334R 2+34R 2=π-32R 2,若从勒洛三角形内部随机取一点, 则此点取自阴影部分的概率为P =阴影部分面积勒洛三角形面积=2π-334R 2π-32R 2=2π-332π-23.故选D.答案 D二、填空题(本大题共4小题,每小题5分,共20分)9.一个盒子装有3个红球和2个蓝球(小球除颜色外其他均相同),从盒子中一次性随机取出3个小球后,再将小球放回.重复50次这样的实验.记“取出的3个小球中有2个红球,1个蓝球”发生的次数为ξ,则ξ的方差是________.解析 由题意知ξ~B (n ,p ),其中n =50,p =C 23C 12C 35=610=35,∴D (ξ)=50×35×25=12.答案 1210.(2019·淮南二模)关于圆周率π的近似值,数学发展史上出现过很多有创意的求法,其中可以通过随机数实验来估计π的近似值.为此,李老师组织100名同学进行数学实验教学,要求每位同学随机写下一个实数对(x ,y ),其中0<x <1,0<y <1,经统计数字x 、y 与1可以构成钝角三角形三边的实数对(x ,y )为28个,由此估计π的近似值是________(用分数表示).解析 实数对(x ,y )落在区域⎩⎨⎧0<x <10<y <1的频率为0.28,又设A 表示“实数对(x ,y )满足⎩⎨⎧0<x <10<y <1且能与1构成钝角三角形”,则A 中对应的基本事件如图阴影部分所示:其面积为π4-12,故P (A )=π4-12≈0.28,所以π≈7825.答案782511.(2019·长春外国语学校月考)已知直线l 过点(-1,0),l 与圆C :(x -1)2+y 2=3相交于A 、B 两点,则弦长|AB |≥2的概率为________.解析 显然直线l 的斜率存在, 设直线方程为y =k (x +1), 代入(x -1)2+y 2=3中得, (k 2+1)x 2+2(k 2-1)x +k 2-2=0, ∵l 与⊙C 相交于A 、B 两点, ∴Δ=4(k 2-1)2-4(k 2+1)(k 2-2)>0, ∴k 2<3,∴-3<k <3,又当弦长|AB |≥2时,∵圆半径r =3, ∴圆心到直线的距离d ≤2,即|2k |1+k2≤2, ∴k 2≤1,∴-1≤k ≤1.由几何概型知,事件M :“直线l 与圆C 相交弦长|AB |≥2”的概率 P (M )=1-(-1)3-(-3)=33.答案3312.有一批种子的发芽率为0.9,出芽后的幼苗成活率为0.8,在这批种子中,随机抽取一粒,则这粒种子能成长为幼苗的概率为________.解析 设种子发芽为事件A ,种子成长为幼苗为事件B (发芽又成活为幼苗). 依题意P (B |A )=0.8,P (A )=0.9. 根据条件概率公式P (AB )=P (B |A )·P (A )=0.8×0.9=0.72, 即这粒种子能成长为幼苗的概率为0.72. 答案 0.72三、解答题(本大题共3小题,每小题12分,共36分)13.(2019·湖南三湘名校二联)某种产品的质量以其质量指标值来衡量,质量指标值越大表明质量越好,记其质量指标值为k ,当k ≥85时,产品为一等品;当75≤k <85时,产品为二等品;当70≤k <75时,产品为三等品.现有甲、乙两条生产线,各生产了100件该产品,测量每件产品的质量指标值,得到下面的试验结果.(以下均视频率为概率)甲生产线生产的产品的质量指标值的频数分布表:乙生产线生产的产品的质量指标值的频数分布表:(1)若从乙生产线生产的产品中有放回地随机抽取3件,求至少抽到2件三等品的概率; (2)若该产品的利润率y 与质量指标值k 满足关系y =⎩⎪⎨⎪⎧t ,k ≥855t 2,75≤k <85t 2,70≤k <75,其中0<t <15,从长期来看,哪条生产线生产的产品的平均利润率更高?请说明理由.解析 (1)由题意知,从乙生产线生产的产品中随机抽取一次抽中三等品的概率为110,所以至少抽到2件三等品的概率P =C 23×⎝⎛⎭⎫1102×910+⎝⎛⎭⎫1103=7250.(2)甲生产线生产的产品的利润分布列为所以E (y 甲)=0.6t +2t 2,乙生产线生产的产品的利润分布列为所以 E (y 乙)=0.5t +2.1t 2, 因为0<t <15,所以E (y 乙)-E (y 甲)=0.1t 2-0.1t =0.1t (t -1)<0,所以从长期来看,甲生产线生产的产品平均利润率较大.14.(2019·佛山禅城区二调)研究机构培育一种新型水稻品种,首批培育幼苗2 000株,株长均介于185 mm ~235 mm ,从中随机抽取100株对株长进行统计分析,得到如下频率分布直方图(1)求样本平均株长x -和样本方差s 2(同一组数据用该区间的中点值代替);(2)假设幼苗的株长X 服从正态分布N (μ,σ2),其中μ近似为样本平均数x -,σ2近似为样本方差s 2,试估计2 000株幼苗的株长位于区间(201,219)的株数;(3)在第(2)问的条件下,选取株长在区间(201,219)内的幼苗进入育种试验阶段,若每株幼苗开花的概率为34,开花后结穗的概率为23,设最终结穗的幼苗株数为ξ,求ξ的数学期望.附:83≈9;若X ~N (μ,σ2),则P (μ-σ<X <μ+σ)=0.683; P (μ-2σ<X <μ+2σ)=0.954;P (μ-3σ<X <μ+3σ)=0.997解析 (1)x -=190×0.02+200×0.315+210×0.35+220×0.275+230×0.04=210, s 2=202×0.02+102×0.315+102×0.275+202×0.04=83.(2)由(1)知, μ=x -=210,σ=83≈9, ∴P (201<X <219)=P (210-9<X <210+9)=0.683, 2 000×0.683=1 366∴2 000株幼苗的株长位于区间(201,219)的株数大约是1 366.(3)由题意,进入育种试验阶段的幼苗数1 366,每株幼苗最终结穗的概率P =12,则ξ-B ⎝⎛⎭⎫1 366,12, 所以E (ξ)=1 366×12=683.15.(2019·河北示范高中联合体联考)某工厂共有男女员工500人,现从中抽取100位员工对他们每月完成合格产品的件数统计如下:(1)其中每月完成合格产品的件数不少于3 200件的员工被评为“生产能手”.由以上统计数据填写下面的2×2列联表,并判断是否有95%的把握认为“生产能手”与性别有关?(2)为提高员工劳动的积极性,工厂实行累进计件工资制:规定每月完成合格产品的件数在定额2 600件以内的,计件单价为1元;超出(0,200]件的部分,累进计件单价为1.2元;超出(200,400]件的部分,累进计件单价为1.3元;超出400件以上的部分,累进计件单价为1.4元.将这4段的频率视为相应的概率,在该厂男员工中随机选取1人,女员工中随机选取2人进行工资调查,设实得计件工资(实得计件工资=定额计件工资+超定额计件工资)不少于3 100元的人数为Z ,求Z 的分布列和数学期望.附:K 2=(ad -bc )2(a +b )(c +d )(a +c )(b +d ),解析 (1)因为K 2的观测值k =100×(48×8-42×2)250×50×90×10=4>3.841,所以有95%的把握认为“生产能手”与性别有关. (2)当员工每月完成合格产品的件数为3 000件时, 得计件工资为2 600×1+200×1.2+200×1.3 =3 100元,由统计数据可知,男员工实得计件工资不少于3 100元的概率为p 1=25,女员工实得计件工资不少于3 100元的概率为p 2=12,设2名女员工中实得计件工资不少于3 100元的人数为X ,1名男员工中实得计件工资在3 100元以及以上的人数为Y ,则X ~B ⎝⎛⎭⎫2,12,Y ~B ⎝⎛⎭⎫1,25, Z 的所有可能取值为0,1,2,3,P (Z =0)=P (X =0,Y =0)=⎝⎛⎭⎫1-122⎝⎛⎭⎫1-25=320, P (Z =1)=P (X =1,Y =0)+P (X =0,Y =1) =C 12·12·⎝⎛⎭⎫1-12⎝⎛⎭⎫1-25+⎝⎛⎭⎫1-12225=25, P (Z =2)=P (X =2,Y =0)+P (X =1,Y =1) =C 22⎝⎛⎭⎫122⎝⎛⎭⎫1-25+C 1212⎝⎛⎭⎫1-1225=720, P (Z =3)=P (X =2,Y =1)=⎝⎛⎭⎫122×25=110, 所以Z 的分布列为故E (Z )=0×320+1×25+2×720+3×110=75.。

2020版高考数学二轮复习第2部分专题3概率与统计第1讲概率、随机变量及其分布教案理(最新整理)

2020版高考数学二轮复习第2部分专题3概率与统计第1讲概率、随机变量及其分布教案理(最新整理)

第1讲概率、随机变量及其分布[做小题——激活思维]1.若随机变量X的分布列如表所示,E(X)=1。

6,则a-b=( )X0123P0。

1a b0。

1A.0.2C.0。

8 D.-0。

8B[由0。

1+a+b+0.1=1,得a+b=0。

8,又由E(X)=0×0.1+1×a+2×b+3×0。

1=1。

6,得a+2b=1.3,解得a=0。

3,b=0.5,则a-b=-0。

2.]2.已知甲在上班途中要经过两个路口,在第一个路口遇到红灯的概率为0。

5,两个路口连续遇到红灯的概率为0。

4,则甲在第一个路口遇到红灯的条件下,第二个路口遇到红灯的概率为( )A.0。

6 B.0.7C.0.8 D.0。

9C[记“第一个路口遇到红灯"为事件A,“第二个路口遇到红灯”为事件B,则P(A)=0.5,P(AB)=0。

4,则P(B|A)=错误!=0.8,故选C。

]3.两个实习生每人加工一个零件,加工为一等品的概率分别为错误!和错误!,两个零件是否加工为一等品相互独立,则这两个零件中恰有一个一等品的概率为( )A。

错误!B。

错误!C。

14D。

错误!B[设事件A:甲实习生加工的零件为一等品;事件B:乙实习生加工的零件为一等品,且A,B相互独立,则P(A)=错误!,P(B)=错误!,所以这两个零件中恰有一个一等品的概率为P(A错误!)+P(错误!B)=P(A)P(错误!)+P(错误!)P(B)=错误!×错误!+错误!×错误!=错误!。

]4.设随机变量X~B(2,p),Y~B(4,p),若P(X≥1)=错误!,则P(Y≥1)=( )A.错误!B。

错误!C。

错误!D.1C[∵X~B(2,p),∴P(X≥1)=1-P(X=0)=1-C错误!(1-p)2=错误!,解得p=错误!,∴P(Y≥1)=1-P(Y=0)=1-C0,4(1-p)4=1-错误!=错误!,故选C.]5.罐中有6个红球和4个白球,从中任取1球,记住颜色后再放回,连续取4次,设X为取得红球的次数,则X的方差D(X)的值为________.错误![因为是有放回地取球,所以每次取球(试验)取得红球(成功)的概率均为错误!,连续取4次(做4次试验),X为取得红球(成功)的次数,则X~B错误!,∴D(X)=4×错误!×错误!=错误!.]6.已知某批零件的长度误差(单位:毫米)服从正态分布N(0,32),从中随机取一件,其长度误差落在区间(3,6)内的概率为________.(附:若随机变量X服从正态分布N(μ,σ2),则P(μ-σ<X<μ+σ)=0。

2020届高考二轮复习 专题七 概率与统计(共3讲)

2020届高考二轮复习 专题七 概率与统计(共3讲)

选择题或填空题中,难度为易或中等.
主干知识梳理
1.分类加法计数原理和分步乘法计数原理 如果每种方法都能将规定的事件完成,则要用分类加 法计数原理将方法种数相加;如果需要通过若干步才 能将规定的事件完成,则要用分步乘法计数原理将各 步的方法种数相乘.
2.排列与组合
(1)排列:从n个不同元素中取出m(m≤n)个元素,按
3.二项式定理 (1)二项式定理:(a+b)n=C0nanb0+C1nan-1b+C2nan-2b2 +…+Cnr an-rbr+…+Cnna0bn(r=0,1,2,…,n). (2)二项展开式的通项 Tr+1=Cnr an-rbr,r=0,1,2,…,n,其中 Crn叫做二项 式系数.
(3)二项式系数的性质
情 解
项,利用二项式定理展开式的性质求有关系数问
读 题.主要考查分类与整合思想、转化与化归思想、
补集思想和逻辑思维能力.
2.排列、组合、两个计数原理往往通过实际问
题进行综合考查,一般以选择、填空题的形式
出现,难度中等,还经常与概率问题相结合,
考 出现在解答题的第一或第二个小题中,难度也

解 为中等;对于二项式定理的考查,主要出现在
①当定义域中有 3 个元素时,C11C12C12=4, ②当定义域中有 4 个元素时,C11C34=4, ③当定义域中有5个元素时,有一种情况. 所以共有4+4+1=9(个)这样的函数. 答案 B
热点二 排列与组合
例2 (1)(2014·重庆)某次联欢会要安排3个歌舞类
节目,2个小品类节目和1个相声类节目的演出顺序,
热点分类突破
热点一 两个计数原理 热点二 排列与组合 热点三 二项式定理
热点一 两个计数原理

2020届高考数学二轮复习(理)讲义及题型归纳《概率与统计》(中档)

2020届高考数学二轮复习(理)讲义及题型归纳《概率与统计》(中档)

概率与统计一、考纲解读1.理解取有限个值的离散型随机变量及其分布列的概念,了解分布列对于刻画随机现象的重要性。

2.理解超几何分布及其推导过程,并能进行简单的应用。

3.了解条件概率和两个事件相互独立的概念,理解n 次独立重复实验的模型及二项分布,并能解决一些简单的实际问题。

4.理解取有限个值的离散型变量均值,方差的概念,能计算简单离散型随机变量的均值、方差,并能解决一些实际问题。

5.利用实际问题的频率分布直方图,了解正态分布密度曲线的特点及曲线所表示的意义。

二、命题趋势探究1.高考命题中,该部分命题形式有选择题、填空题,但更多的是解答题。

2.主要以离散型随机变量分布列为主体命题,计算离散型随机变量的期望和方差,其中二项分布与超几何分布为重要考点,难度中等以下。

3.有关正态分布的考题多为一道小题。

三、知识点精讲(一).条件概率与独立事件(1)在事件A 发生的条件下,时间B 发生的概率叫做A 发生时B 发生的条件概率,记作()P B A ,条件概率公式为()=P B A ()()P AB P A 。

(2)若()=P B A P B (),即()=()()P AB P A P B ,称A 与B 为相互独立事件。

A 与B 相互独立,即A 发生与否对B 的发生与否无影响,反之亦然。

即,A B 相互独立,则有公式()=()()P AB P A P B 。

(3)在n 次独立重复实验中,事件A 发生k ()0k n ≤≤次的概率记作()n P k ,记A在其中一次实验中发生的概率为()P A p = ,则()()1n k k k n n P k C p p -=- .(二).离散型随机变量分布列、期望、方差及其性质(1)离散型随机变量ξ的分布列(如表13-1所示).表13-1①()11,i p i n i N θ*≤≤≤≤∈ ;②121n p p p ++=L .(2)E ξ表示ξ的期望:1122=+n n p p p E ξξξξ++…,反应随机变量的平均水平,若随机变量ξη,满足=a b ηξ+,则E aE b ηξ=+.(3)D ξ表示ξ的方差:()()()2221122=---n n E p E p E p D ξξξξξξξ+++L ,反映随机变量ξ取值的波动性。

2020版高考数学二轮复习第2部分专题3概率与统计解密高考3概率与统计问题重在“辨”——辨析、辨型课件理

2020版高考数学二轮复习第2部分专题3概率与统计解密高考3概率与统计问题重在“辨”——辨析、辨型课件理

参考公式: 对于一组数据(u1,v1),(u2,v2),…,(un,vn),其回归直线^v =
n
a^+β^u的斜率和截距的最小二乘估计公式分别为:β^=∑ i=1nuivi-n u v , ∑ i=1u2i -n u 2
a^= v -β^u^.
[解](1)根据散点图判断,y=c·dx适宜作为扫码支付的人次y关于
的分布列、数列的递推 的白鼠比另一种药治愈的白鼠多4只时,就停止试验,并认为治愈只
关系及等比数列的证明 数多的药更有效.为了方便描述问题,约定:对于每轮试验,若施以
等知识,学生的信息提 甲药的白鼠治愈且施以乙药的白鼠未治愈则甲药得1分,乙药得-1
取、转化化归等能力, 分;若施以乙药的白鼠治愈且施以甲药的白鼠未治愈则乙药得1分,
第二部分 讲练篇
专题三 概率与统计 解密高考③ 概率与统计问题重在
“辨”——辨析、辨型
————[思维导图]————
————[技法指津]————
概率与统计问题辨析、辨型的策略 (1)准确弄清问题所涉及的事件有什么特点,事件之间有什么关 系,如互斥、对立、相互独立等; (2)理清事件以什么形式发生,如同时发生、至少有几个发生、 至多有几个发生、恰有几个发生等;
————[技法指津]———— (3)明确抽取方式,如放回还是不放回、抽取有无顺序等; (4)准确选择排列组合的方法来计算基本事件发生数和事件总 数,或根据概率计算公式和性质来计算事件的概率; (5)确定随机变量取值并求其对应的概率,写出分布列后再求期 望、方差; (6)会套用求b^、K2 的公式,再作进一步求值与分析.
(3)推广期结束后,车队对乘客的支付方式进行统计,结果如表 2所示
表2 支付方式 比例
现金 10%

第1讲 概率、随机变量及其分布列

第1讲 概率、随机变量及其分布列

1.(2020·开封市模拟考试)为应对新冠肺炎疫情,许多企业在
非常时期转产抗疫急需物资.某工厂为了监控转产产品的
质量,测得某批n件产品的正品率为98%,现从中任意有
放回地抽取3件产品进行检验,则至多抽到1件次品的概率

()
A.0.998 816
B.0.999 6
C.0.057 624
D.0.001 184
重卦中随机取一重卦,该重卦恰有3个阳爻的概率P=
20 64

5 16
.
故选A.
[答案] A
返回
解题方略
古典概型的概率公式 P(A)=mn =A中所基含本的事基件本总事数件数.
返回
[跟踪训练]
1.(2020·济南模拟)2019年1月1日,济南轨道交通1号线试运
行,济南轨道交通集团面向广大市民开展“参观体验,征
返回
2.连续掷3枚硬币,观察落地后这3枚硬币出现正面还是反
面.“恰好3枚正面都朝上”的概率是________,“至少
有2枚反面朝上”的概率是________.
解析:列举基本事件如下:(正,正,正),(正,正,
反),(正,反,正),(反,正,正),(正,反,反),(反,
正,反),(反,反,正),(反,反,反,),共8个,“恰
2.离散型随机变量及其分布列 (1)在对具体问题的分析中,理解取有限值的离散型随机变量及 其分布列的概念,认识分布列对于刻画随机现象的重要性; (2)了解条件概率和两个事件相互独立的概念,理解n次独立重 复试验的模型及二项分布,理解超几何分布及其导出过程,并 能解决一些简单的实际问题; (3)理解取有限值的离散型随机变量均值、方差的概念,能计算 简单离散型随机变量的均值、方差,并能解决一些实际问题; (4)认识正态分布曲线的特点及曲线所表示的意义.

2020年高考数学理科二轮复习考情分析与核心整合课件:7.2概率、随机变量及其分布列

2020年高考数学理科二轮复习考情分析与核心整合课件:7.2概率、随机变量及其分布列
w=2.5+00..13≈2.83(米 3).
(3)将频率视为概率,设 A 代表居民月用水量,由图知 P(A≤2.5) =0.7,
则由题意可知 X~B(3,0.7), P(X=0)=C30×0.33=0.027, P(X=1)=C31×0.32×0.7=0.189,
P(X=2)=C32×0.3×0.72=0.441, P(X=3)=C33×0.73=0.343. ∴X 的分布列为
『对接训练』
3.[2019·河南一诊]某班为了活跃元旦晚会的气氛,主持人请 12 位同学做一个游戏,第一轮中,主持人将标有数字 1 到 12 的十二张相 同的卡片放入一个不透明的盒子中,每人依次从中取出一张卡片,取 到标有数字 7 到 12 的卡片的同学留下,其余的淘汰;第二轮将标有数 字 1 到 6 的六张相同的卡片放入一个不透明的盒子中,每人依次从中 取出一张卡片,取到标有数字 4 到 6 的卡片的同学留下,其余的淘汰; 第三轮将标有数字 1,2,3 的三张相同的卡片放入一个不透明的盒子中, 每人依次从中取出一张卡片,取到标有数字 2,3 的卡片的同学留下, 其余的淘汰;第四轮用同样的办法淘汰一位同学,最后留下的这位同 学获得一个奖品.已知同学甲参加了该游戏.
解析:(1)记“甲出线”为事件 A,“乙出线”为事件 B,“丙 出线”为事件 C,“甲、乙、丙至少有一名出线”为事件 D,
则 P(D)=1-P(-A -B -C )=1-13×14×25=2390. (2)ξ 的所有可能取值为 0,1,2,3. P(ξ=0)=P(-A -B -C )=310; P(ξ=1)=P(A-B -C )+P(-A B-C )+P(-A -B C)=1630; P(ξ=2)=P(AB-C )+P(A-B C)+P(-A BC)=290; P(ξ=3)=P(ABC)=130.

2020版高考数学大二轮复习专题四概率与统计第一讲概率、统计、统计案例课件文

2020版高考数学大二轮复习专题四概率与统计第一讲概率、统计、统计案例课件文

2.通过随机询问 110 名学生是否爱好打篮球,得到如下的列联表: 男 女 总计
爱好 40 20 60 不爱好 20 30 50
总计 60 50 110
附:K2=a+bcn+add-ab+cc2b+d,其中 n=a+b+c+d. P(K2≥k0) 0.05 0.01 0.001 k0 3.841 6.635 10.828
B.15
3
2
C.10
D.5
解析:依题意,记两次取得卡片上的数字依次为 a,b,则一共 有 25 个不同的数组(a,b),其中满足 a>b 的数组共有 10 个, 分别为(2,1),(3,1),(3,2),(4,1),(4,2),(4,3),(5,1),(5,2),(5,3), (5,4),因此所求的概率为1205=25,故选 D. 答案:D
3.(2019·博望区校级月考)某工厂生产的 A,B,C 三种不同型
号的产品数量之比为 2∶3∶5,为研究这三种产品的质量,现
用分层抽样的方法从该工厂生产的 A,B,C 三种产品中抽出
样本容量为 n 的样本,若样本中 A 型产品有 10 件,则 n 的值
为( )
A.15
B.25
C.50
D.65
解析:某工厂生产的 A,B,C 三种不同型号的产品数量之比 为 2∶3∶5, 用分层抽样的方法从该工厂生产的 A,B,C 三种产品中抽出 样本容量为 n 的样本, ∵样本中 A 型产品有 10 件, ∴120k=2k+3nk+5k,解得 n=50. 故选 C. 答案:C
1.(2018·高考全国卷Ⅰ)如图是来自古希腊数学家希波克拉底所 研究的几何图形.此图由三个半圆构成,三个半圆的直径分别 为直角三角形 ABC 的斜边 BC,直角边 AB,AC.△ABC 的三 边所围成的区域记为Ⅰ,黑色部分记为Ⅱ,其余部分记为Ⅲ. 在整个图形中随机取一点,此点取自Ⅰ,Ⅱ,Ⅲ的概率分别记 为 p1,p2,p3,则( )

2020年高考数学二轮复习重点专题冲刺复习指导 专题3 统计与概率

2020年高考数学二轮复习重点专题冲刺复习指导  专题3  统计与概率

2020年高考数学二轮复习重点专题冲刺复习指导 专题3 统计与概率【高考考场实情】统计与概率在高考考查中一般有一道选择题或填空题、一道解答题,共2道题,分值为17分.高考对这一部分的考查难度相对稳定,选择、填空题为容易题, 解答题为中等难度题.选择题在前六题的位置,填空题在前二题的位置,解答题在前三题的位置.选择、填空题常考古典概型、几何概型(理科时而考查对立事件、相互独立事件概率及独立重复试验的概率)。

【考查重点难点】解答题以频率分布表、频率分布直方图、柱形图、折线图、茎叶图等五个样本频率分布图表为载体,理科侧重考查随机变量的分布列及期望,文科侧重考查样本数字特征的应用,突出了对应用意识、数据处理能力及创新能力的考查.下面对学生存在的主要问题进行剖析,并提出相应的教学对策.【存在问题分析】1.概念理解不透【指点迷津】本专题中,概念理解不到位的有事件、模型的判断等;容易混淆的概念有互斥事件与对立事件、超几何分布与二项分布、二项展开式的通项公式1y n r r r n T C a b -+=与n 次独立重复试验中事件A 发生k 次的概率()(1)k k n k n nP k C p p -=-等. 【例1】已知5只动物中有1只患有某种疾病,需要通过化验血液来确定患病的动物.血液化验结果呈阳性的即为患病动物,呈阴性的即没患病.下面是两种化验方案:方案甲:逐个化验,直到能确定患病动物为止.方案乙:先任取3只,将它们的血液混在一起化验.若结果呈阳性则表明患病动物为这3只中的1只,然后再逐个化验,直到能确定患病动物为止;若结果呈阴性,则在另外2只中任取l 只化验.(Ⅰ)求依方案甲所需化验次数不少于依方案乙所需化验次数的概率;(Ⅱ)ξ表示依方案乙所需化验次数,求ξ的期望.【解析】(Ⅰ)设1ξ、2ξ已分别表示依方案甲和依方案乙需化验的次数,P 表示对应的概率,则方案甲中1ξ的分布列为方案乙中2ξ的分布列为若甲化验的次数不少于乙化验的次数,则[][]1212212221(1)(1)(2)(1)(2)(3)(1)(2)(3)(4)P P P P P P P P P P P ξξξξξξξξξξ==⨯=+=⨯=+=+==+=+=+=131322=0+(0)(0)0.72555555⨯++⨯+++=. (Ⅱ)3212()1023 2.4555E ξ=⨯+⨯+⨯==. 【名师点睛】本题易错的主要原因是对事件不清.对于方案甲,患有疾病的一只动物在每一次化验时出现的概率是等可能的,学生对事件不清,易误认为化验次数的可能取值是1,2,3,4,5,且1(1)(2)(3)(4)(5)2P P P P P ξξξξξ==========.事实上,若前4次化验为阴性,第5次不需再化验即知最后一只是患病动物,所以化验次数只能取l ,2,3,4.类似地,对于方案乙,第一次化验呈阳性,再化验3只中的前2只呈阴性后也不需再化验,或第一次化验呈阴性,再化验另外2只中的第l 只呈阴性或阳性后也不需再化验,即ξ只能取2,3.在解决问题时,要理清事件,求随机变量的分布列时,要弄清随机变量可能取到的每一个值以及取每一个值时所表示的意义,然后再利用所学的概率知识求出随机变量取每一个值时的概率,从而求出分布列.2.审题析题不到位【指点迷津】审题析题不清是本专题解答错误的主要原因,主要包括题意不清,茫然作答;阅读肤浅,丢失信息;条件欠缺,鲁莽下笔;图形不准,缺乏严密;方向不明,目标模糊等情况.审题不清的最主要原因在于学生的阅读理解能力欠缺.【例2】(2017年全国卷Ⅰ理19)为了监控某种零件的一条生产线的生产过程,检验员每天从该生产线上随机抽取16个零件,并测量其尺寸(单位:cm ).根据长期生产经验,可以认为这条生产线正常状态下生产的零件的尺寸服从正态分布2(,)N μσ.(Ⅰ)假设生产状态正常,记X 表示一天内抽取的16个零件中其尺寸在(3,3)μσμσ-+之外的零件数,求(1)P X ≥及X 的数学期望;(Ⅱ)一天内抽检零件中,如果出现了尺寸在(3,3)μσμσ-+之外的零件,就认为这条生产线在这一天的生产过程可能出现了异常情况,需对当天的生产过程进行检查.(ⅰ)试说明上述监控生产过程方法的合理性;(ⅱ)下面是检验员在一天内抽取的16个零件的尺寸: 9.95 10.12 9.96 9.96 10.01 9.92 9.98 10.0410.26 9.91 10.13 10.02 9.22 10.04 10.05 9.95经计算得16119.9716i i x x ===∑,161622221111()(16)0.2121616i i i i s x x x x ===-=-≈∑∑,其中i x 为抽取的第i 个零件的尺寸,1,2,,16i =⋅⋅⋅.用样本平均数x 作为μ的估计值ˆμ,用样本标准差s 作为σ的估计值ˆσ,利用估计值判断是否需对当天的生产过程进行检查?剔除ˆˆˆˆ(3,3)μσμσ-+之外的数据,用剩下的数据估计μ和σ(精确到0.01).附:若随机变量Z 服从正态分布2(,)N μσ,则(33)0.997 4P Z μσμσ-<<+=, 160.997 40.959 2=0.0080.09≈.【解析】(Ⅰ)抽取的一个零件的尺寸在(3,3)μσμσ-+之内的概率为0.9974,从而零件的尺寸在(3,3)μσμσ-+之外的概率为0.0026,故()16,0.0026X B -,因此()()1611010.99740.0408P X P X ≥=-==-≈,X 的数学期望为160.00260.0416EX =⨯=(Ⅱ)(i )如果生产状态正常,一个零件尺寸在(3,3)μσμσ-+之外的概率只有0.0026,一天内抽取的16个零件中,出现尺寸在(3,3)μσμσ-+之外的零件的概率只有0.0408,发生的概率很小.因此一旦发生这种情况,就有理由认为这条生产线在这一天的生产过程可能出现了异常情况,需对当天的生产过程进行检查,可见上述监控生产过程的方法是合理的.(ii )由9.97,0.212x s =≈,得μ的估计值为ˆ9.97,μσ=的估计值为ˆ0.212σ=,由样本数据可以看出有一个零件的尺寸在ˆˆˆˆ(3,3)μσμσ-+之外,因此需对当天的生产过程进行检查. 剔除ˆˆˆˆ(3,3)μσμσ-+之外的数据9.22,剩下数据的平均数为1(169.979.22)10.0215⨯-= 因此μ的估计值为10.02.162221160.212169.971591.134i i x==⨯+⨯≈∑,剔除ˆˆˆˆ(3,3)μσμσ-+之外的数据9.22,剩下数据的样本方差为 221(1591.1349.221510.02)0.00815--⨯≈,因此σ的估计值为0.0080.09≈. 【名师点睛】面对试题中冗长的文字表述,学生方寸大乱,不知所措,从而失去读题、解题信心;没有形成通读全题的习惯,未能发现试题所附相关公式;未能根据试题提供的相关公式,提取零件的尺寸在(3,3)μσμσ-+之外的概率为0.0026;未能准确把握较长问句“生产线在这一天的生产过程可能出现了异常情况”的关键词等,导致回答问题含混不清、词不达意.3.读图识图能力弱【指点迷津】学生面对一堆数据无从下手,主要原因是对数据、图表的直观印象和积累储备的知识经验不够;没有形成“用数据说话”的统计观念;对抽象数据的数字特征理解不到位.【例3】(2016年全国卷Ⅲ理4)某旅游城市为向游客介绍本地的气温情况,绘制了一年中月平均最高气温和平均最低气温的雷达图.图中A 点表示十月的平均最高气温约为15C ︒,B 点表示四月的平均最低气温约为5C ︒.下面叙述不正确的是( )(A)各月的平均最低气温都在0C ︒以上 (B)七月的平均温差比一月的平均温差大(C)三月和十一月的平均最高气温基本相同 (D)平均最高气温高于20C ︒的月份有5个【解析】由图可知0C ︒均在虚线框内,所以各月的平均最低气温都在0C ︒以上,A 正确;由图可知七月的平均温差大于7.5C ︒,而一月的平均温差小于7.5C ︒,B 正确;由图可知三月和十一月的平均最高气温都大约在10C ︒,基本相同,C 正确;由图可知平均气温高于20C ︒的月份只有7、8两个月,D 错误.【名师点睛】解答本题错误主要是读图识图能力弱,对图形中的线条认识不明确,不知所措,只觉得是两把雨伞重叠在一起,找不到解决问题的方法;其次,不会从图表中读取有用数据并进行判断;第三,估计平均温差时易出现错误,错选B .4.解题规范性较差【指点迷津】涉及本专题内容的考查,学生失误和失分最多的是会而不对、对而不全和全而不准,如不能用字母表示事件,导致在利用简单事件表示复杂事件书写混乱;解答过程缺失关键步骤,丢三落四,导致丢分等.【例4】端午节吃粽子是我国的传统习俗,设一盘中装有10个粽子,其中豆沙粽2个,肉粽3个,白粽5个,这三种粽子的外观完全相同,从中任意选取3个.(Ⅰ)求三种粽子各取到1个的概率;(Ⅱ)设X 表示取到的豆沙粽个数,求X 的分布列与数学期望.【解析】(Ⅰ)设A 表示事件“三种粽子各取到1个”,则由古典概型的计算公式有()11123531014C C C P A C ==. (Ⅱ)X 的所有可能取值为0,1,2则()383107015C P X C ===,()12283107115C C P X C ===,()21283101215C C P X C === 所以X 的分布列为 X 1 2 3 P715 715 115 故()0121515155E X =⨯+⨯+⨯=个. 【名师点睛】从解题规范方面看,学生常出现错误有,没有用字母表示事件,即缺少“设A 表示事件‘三种粽子各取到l 个’”这一步骤;直接写出1()4P A =,过程没写出来,应写为1112353101()4C C C P A C ==,一但答案错误,就失去过程分数;忽视“X 的所有可能值为0,1,2”,导致丢分等.5. 运算能力弱【指点迷津】运算求解能力主要是指会根据法则、公式进行正确运算、变形和数据处理,能根据问题的条件寻找与设计合理、简捷的运算途径,能根据要求对数据进行估计和近似计算.本专题中,学生运算能力弱主要体现在不能根据问题的条件寻找与设计合理、简捷的运算途径,不能根据要求对数据进行估计和近似计算.【例5】(2017年全国卷Ⅰ文19)为了监控某种零件的一条生产线的生产过程,检验员每隔30 min 从该生产线上随机抽取一个零件,并测量其尺寸(单位:cm ).下面是检验员在一天内依次抽取的16个零件的尺寸: 抽取次序 12 3 4 5 6 7 8 9 10 11 12 13 14 15 16零件尺寸 9.95 10.12 9.96 9.96 10.01 9.92 9.98 10.04 10.26 9.91 10.13 10.02 9.22 10.04 10.05 9.95 经计算得16119.9716i i x x ===∑,16162221111()(16)0.2121616i i i i s x x x x ===-=-≈∑∑,1621(8.5)18.439i i =-≈∑,161()(8.5) 2.78i i x x i =--=-∑,其中i x 为抽取的第i 个零件的尺寸,1,2,,16i =⋅⋅⋅.(Ⅰ)求(,)i x i (1,2,,16)i =⋅⋅⋅的相关系数r ,并回答是否可以认为这一天生产的零件尺寸不随生产过程的进行而系统地变大或变小(若||0.25r <,则可以认为零件的尺寸不随生产过程的进行而系统地变大或变小).(Ⅱ)一天内抽检零件中,如果出现了尺寸在(3,3)x s x s -+之外的零件,就认为这条生产线在这一天的生产过程可能出现了异常情况,需对当天的生产过程进行检查.(ⅰ)从这一天抽检的结果看,是否需对当天的生产过程进行检查?(ⅱ)在(3,3)x s x s -+之外的数据称为离群值,试剔除离群值,估计这条生产线当天生产的零件尺寸的均值与标准差.(精确到0.01)附:样本(,)i i x y (1,2,,)i n =⋅⋅⋅的相关系数12211()()()()n i ii n n i i i i x x y y r x x y y ===--=--∑∑∑.0.0080.09≈. 【解析】(Ⅰ)由样本数据得(,)(1,2,...,16)i x i i =的相关系数为16116162211()(8.5)0.180.2121618.439()(8.5)ii ii i x x i r x x i ===--==≈-⨯⨯--∑∑∑. 由于||0.25r <,因此可以认为这一天生产的零件尺寸不随生产过程的进行而系统地变大或变小.(Ⅱ)(i )由于9.97,0.212x s =≈,由样本数据可以看出抽取的第13个零件的尺寸在(3,3)x s x s -+以外,因此需对当天的生产过程进行检查.(ii )剔除离群值,即第13个数据,剩下数据的平均数为1(169.979.92)10.0215⨯-=,这条生产线当天生产的零件尺寸的均值的估计值为10.02,162221160.212169.971591.134i i x ==⨯+⨯≈∑,剔除第13个数据,剩下数据的样本方差为221(1591.1349.221510.02)0.00815--⨯≈.[来源:学+科+网] 这条生产线当天生产的零件尺寸的标准差的估计值为0.0080.09≈.【名师点睛】从运算方面看,学生不懂从16162221111()(16)0.2121616i i i i s x x x x ===-=-≈∑∑中解出 16221()160.212i i x x =-=⨯∑;不会计算0.2121618.439r =⨯⨯的值,不懂根据保留小数点后两位的要求,实施近似处理以简化运算;不懂直接由0.2121618.439r =⨯⨯采用放缩方法判断是否满足||0.25r <;不会由9.97x =和0.212s ≈计算出区间(3,3)x s x s -+的端点值9.334,10.606;计算151115i i x x ==∑时,不懂得先做相反数相消处理或各项统一分离10后转化为15'111015i i x x ==+∑计算;计算15'1115iix x==∑时,不懂得转化为1613115iix xx=-=∑,再利用16119.9716iix x===∑简化运算;计算222222221[0.070.10.060.060.010.10.0415s=++++++22220.020.240.110.11+++++222200.020.030.07]++++0.008130.008=≈,不懂得各项统一提取20.01的技巧;计算222221[160.212169.979.221510.02]15s=⨯+⨯--⨯时,不懂得在保证精确度要求的前提下作近似处理以简化运算.【解决问题对策】1.关注统计图表的教学【指点迷津】高考试卷的解答题往往以频率分布表、频率分布直方图、柱形图、折线图、茎叶图五个样本频率分布图表为载体,理科侧重考查随机变量的分布列及期望,文科侧重考查样本数字特征的应用,突出了对应用意识、数据处理能力及创新能力的考查.复习过程中,应充分利用五个样本频率分布图表,让学生会从图表中读取有用数据,或根据问题需要选择合适图表,依据统计学中的方法对数据进行分析,作出合理的决策.【例6】【2015年全国卷Ⅱ文、理3】根据下面给出的2004年至2013年我国二氧化硫排放量(单位:万吨)柱形图.以下结论不正确的是()A.逐年比较,2008年减少二氧化硫排放量的效果最显著B.2007年我国治理二氧化硫排放显现成效C.2006年以来我国二氧化硫年排放量呈减少趋势D.2006年以来我国二氧化硫年排放量与年份正相关【答案】A2.关注样本数字特征的含义【指点迷津】在复习中,应关注众数、中位数、平均数(期望)、方差与标准差有的含义,并能根据解决问题的需要选择合理的数字特征说明问题.【例7】【2014年课标卷Ⅱ文19】某市为了考核甲、乙两部门的工作情况,随机访问了50位市民.根据这50位市民对这两部门的评分(评分越高表明市民的评价越高),绘制茎叶图如下:(Ⅰ)分别估计该市的市民对甲、乙部门评分的中位数;(Ⅱ)分别估计该市的市民对甲、乙部门的评分高于90的概率;(Ⅲ)根据茎叶图分析该市的市民对甲、乙两部门的评价.【答案】(Ⅰ)67;(Ⅱ)由所给茎叶图知,50位市民对甲、乙部门的评分高于90的比率分别为50.150=,80.1650=,故该市的市民对甲、乙部门的评分高于90的概率的估计值分别为0.1,0.16.(Ⅲ)由所给茎叶图知,市民对甲部门的评分的中位数高于对乙部门的评分的中位数,而且由茎叶图可以大致看出对甲部门的评分的标准差要小于对乙部门的评分的标准差,说明该市市民对甲部门的评价较高、评价较为一致,对乙部门的评价较低、评价差异较大.(注:考生利用其他统计量进行分析,结论合理的同样给分)3. 厘清事件及其概率【指点迷津】复习过程中,应厘清事件间的关系,准确计算相关事件的概率.特别要求学生能将复杂事件进行分解,先分解为互斥事件,每个互斥事件又分解为两个相互独立事件的积事件.【例8】(2013年全国卷Ⅰ理19)一批产品需要进行质量检验,检验方案是:先从这批产品中任取4件作检验,这4件产品中优质品的件数记为n.如果3n=,再从这批产品中任取4件作检验,若都为优质品,则这批产品通过检验;如果4n=,再从这批产品中任取1件作检验,若为优质品,则这批产品通过检验;其他情况下,这批产品都不能通过检验.假设这批产品的优质品率为50%,即取出的每件产品是优质品的概率都为12,且各件产品是否为优质品相互独立.(Ⅰ)求这批产品通过检验的概率;(Ⅱ)已知每件产品的检验费用为100元,且抽取的每件产品都需要检验,对这批产品作质量检验所需的费用记为X(单位:元),求X的分布列及数学期望.【解析】(Ⅰ)设第一次取出的4件产品中恰有3件优质品为事件A1,第一次取出的4件产品全是优质品为事件A2,第二次取出的4件产品都是优质品为事件B1,第二次取出的1件产品是优质品为事件B2,这批产品通过检验为事件A,依题意有A=(A1B1)∪(A2B2),且A1B1与A2B2互斥,所以P(A)=P(A1B1)+P(A2B2)=P(A1)P(B1|A1)+P(A2)P(B2|A2)=41113 161616264⨯+⨯=.(Ⅱ)X可能的取值为400,500,800,并且P(X=400)=41111161616--=,P(X=500)=116,P(X=800)=14,所以X的分布列为EX=1111400+500+80016164⨯⨯⨯=506.25.4.关注概率模型的识别与应用【指点迷津】复习过程中,应关注概率模型的识别与应用,一定要注意弄清题意,找出题中的关键字词,厘清各种概率模型及适用范围.如超几何分布和二项分布是教材中两个重要概率分布,二项分布与超几何分布的区别为,二项分布是有放回的抽样,每做一次事件,事件A 发生的概率是相同的;超几何分布是不放回的抽样,每做一次事件,事件A发生的概率是不相同的.【例9】某食品厂为了检查一条自动包装流水线的生产情况,从该流水线上随机抽取40件产品作为样本,测得它们的重量(单位:克),将重量按如下区间分组:(490,495],(495,500],(500,505],(505,510],(510,515],得到样本的频率分布直方图(如图所示).若规定重量超过495克但不超过510克的产品为合格产品,且视频率为概率,回答下列问题:(Ⅰ)在上述抽取的40件产品中任取2件,设X 为合格产品的数量,求X 的分布列和数学期望()E X ;(Ⅱ)若从流水线上任取3件产品,求恰有2件合格产品的概率.【解析】(Ⅰ)由样本的频率分布直方图得,合格产品的频率为0.0450.0750.0550.8⨯+⨯+⨯=. 所以抽取的40件产品中,合格产品的数量为400.832⨯=. 则X 可能的取值为0,1,2,所以()2824070195C P X C ===;()11832240641195C C P X C ===;()2322401242195C P X C ===, 因此X 的分布列为 X0 1 2 P 7195 64195 124195 故X 数学期望7641243128()0121951951951955E X =⨯+⨯+⨯==. (Ⅱ)因为从流水线上任取1件产品合格的概率为40.85=, 所以从流水线上任取3件产品,恰有2件合格产品的概率为223144855125P C ⎛⎫⎛⎫== ⎪⎪⎝⎭⎝⎭.学1科·网 5.关注用样本估计总体的思想分析解决问题【指点迷津】复习过程中,应让学生掌握,为了考察一个总体的情况,在统计中通常是从总体中抽取一个样本,用样本的有关情况去估计总体的相应情况.这种估计大体分为两类:用样本的频率分布估计总体的分布、用样本的数字特征估计总体的数字特征.其次,“预测与决策”与人们的生活休戚相关.随着社会的不断进步,人们对许多实际问题会有多种解决方案,但哪种方案最有利于解决问题,需要进行科学的决策.而通过期望、方差等的计算,并进行大小比较,就是其中的一种科学预测与决策的手段.【例10】【2016年课标Ⅰ理19】某公司计划购买2台机器,该种机器使用三年后即被淘汰.机器有一易损零件,在购进机器时,可以额外购买这种零件作为备件,每个200元.在机器使用期间,如果备件不足再购买,则每个500元.现需决策在购买机器时应同时购买几个易损零件,为此搜集并整理了100台这种机器在三年使用期内更换的易损零件数,得下面柱状图:以这100台机器更换的易损零件数的频率代替1台机器更换的易损零件数发生的概率,记X表示2台机器三年内共需更换的易损零件数,n表示购买2台机器的同时购买的易损零件数. (Ⅰ)求X的分布列;(Ⅱ)若要求()0.5≤≥,确定n的最小值;P X n(Ⅲ)以购买易损零件所需费用的期望值为决策依据,在19n=之中选其一,应选用哪n=与20个?【答案】(Ⅰ)由柱状图并一频率代替概率知,一台机器在三年内需要更换的易损零件数为8,9,10,11的概率分别为0.2,0.4,0.2,0.2,从而P X==⨯=;(16)0.20.20.04P X==⨯⨯=;(17)20.20.40.16(18)20.20.20.40.40.24P X==⨯⨯+⨯=;P X==⨯⨯+⨯⨯=;(19)20.20.220.40.20.24P X==⨯⨯+⨯=;(20)20.20.20.20.20.2P X==⨯⨯=;(21)20.20.20.08P X==⨯=(22)0.20.20.04所以X的分布列为X 16 17 18 19 20 2122P 04.0 16.0 24.0 24.0 2.0 08.0 04.0(Ⅱ)由(Ⅰ)知44.0)18(=≤X P ,68.0)19(=≤X P ,故n 的最小值为19.(Ⅲ)记Y 表示2台机器在购买易损零件上所需的费用(单位:元).当19=n 时,08.0)500220019(2.0)50020019(68.020019⨯⨯+⨯+⨯+⨯+⨯⨯=EY 404004.0)500320019(=⨯⨯+⨯+. 当20=n 时,04.0)500220020(08.0)50020020(88.020020⨯⨯+⨯+⨯+⨯+⨯⨯=EY 4080=. 可知当19=n 时所需费用的期望值小于20=n 时所需费用的期望值,故应选19=n .6.关注“冷门”知识的复习【指点迷津】高考是对高中阶段学习结果的大检阅,统计与概率的考查,在突出核心知识考查的同时,也关注知识点的覆盖面.因此,在复习教学中,要全面检索高中阶段的所有知识,特别是不能忽视对所谓的“冷门知识”的复习,如正态分布、条件概率、相关系数、残差图、拟合效果等.【例11】【2015年课标Ⅰ理18】某公司为确定下一年度投入某种产品的宣传费,需了解年宣传费x (单位:千元)对年销售量y (单位:t )和年利润z (单位:千元)的影响,对近8年的年宣传费i x 和年销售量i y (1,2,,8i =⋅⋅⋅)数据作了初步处理,得到下面的散点图及一些统计量的值.x y w 281(x )ii x =-∑ 281()i i w w =-∑ 81()(y )i i i x x y =--∑ 81()()i i i w w y y =--∑46.6 56.3 6.8 289.8 1.6 1469 108.8表中i i w x =,8118i i w w ==∑ (Ⅰ)根据散点图判断,y a bx =+y 与y c b x =+哪一个适宜作为年销售量y 关于年宣传费x 的回归方程类型?(给出判断即可,不必说明理由)(Ⅱ)根据(Ⅰ)的判断结果及表中数据,建立y 关于x 的回归方程;(Ⅲ)以知这种产品的年利率z 与x 、y 的关系为0.2z y x =-.根据(Ⅱ)的结果回答下列问题: (i )年宣传费49x =时,年销售量及年利润的预报值是多少?(ii)年宣传费x 为何值时,年利率的预报值最大?附:对于一组数据11(,)u v ,22(,),,u v ⋅⋅⋅(,)n n u v ,其回归直线v u αβ=+的斜率和截距的最小二乘估计分别为µ121()()()n i i i n i i u u v v uu β==--=-∑∑,µµv u αβ=-. 【解析】(Ⅰ)100.668y x =+(Ⅲ) (i )由(Ⅱ)知,当49x =时,年销售量y 的预报值$100.66849576.6y =+=,年利润的预报值0.2576.64966.32z=⨯-=$. ②根据(Ⅱ)的结果知,年利润z 的预报值0.2(100.668)13.620.12zx x x x =+-=-++$, 所以当13.6 6.82x ==,即46.24x =时,z 取得最大值. 7.加强阅读理解能力培养与训练【指点迷津】统计与概率进一步强化应用意识的考查,已成高考命题改革的必然趋势,试卷试题文字阅读量的逐年增加,或成高考试卷的发展趋势.复习中,应规范教学的阅读指导.应该呈现读题提取关键信息、析题形成解题思路、解题示范规范表达、反思积淀解题经验的“四步曲”完整过程,才能充分发挥解题教学的效益.其次,加强平时的阅读训练.需要适当增加平时作业习题的阅读量,尤其是应用性试题的读题训练,提高学生的阅读理解能力及应试心态.【例12】【2014年课标Ⅰ理18】从某企业的某种产品中抽取500件,测量这些产品的一项质量指标值,由测量结果得如下频率分布直方图:(Ⅰ)求这500件产品质量指标值的样本平均数x 和样本方差2s (同一组数据用该区间的中点值作代表);(Ⅱ)由频率分布直方图可以认为,这种产品的质量指标值Z 服从正态分布2(,)N μδ,其中μ近似为样本平均数x ,2δ近似为样本方差2s .(i )利用该正态分布,求(187.8212.2)P Z <<;(ii )某用户从该企业购买了100件这种产品,记X 表示这100件产品中质量指标值为于区间(187.8,212.2)的产品件数,利用(i )的结果,求EX .12.2.若Z ~2(,)N μδ,则()P Z μδμδ-<<+=0.6826,(22)P Z μδμδ-<<+=0.9544.【解析】(Ⅰ) 2200,150x s ==(Ⅱ)(ⅰ)由(Ⅰ)知Z ~(200,150)N ,从而(187.8212.2)P Z <<=(20012.220012.2)0.6826P Z -<<+=,(ⅱ)由(ⅰ)知,一件产品中质量指标值为于区间(187.8,212.2)的概率为0.6826, 依题意知(100,0.6826)X B :,所以1000.682668.26EX =⨯=.8.规范答题表达形式【指点迷津】规范答题,一方面,思考问题要规范.也就是从知识的源头出发,弄清知识的来龙去脉.知识是怎么要求的,就怎么想、怎么用、怎么写,不能模棱两可,要会运用知识进行思考;另一方面,书写要规范.书写规范是一个重要的高考增分点,这一点应引起足够重视.如解题中应注意用字母表示事件,注意作答等.【例13】(2015年全国卷Ⅱ理18)某公司为了解用户对其产品的满意度,从A ,B 两地区分别随机调查了20个用户,得到用户对产品的满意度评分如下:A 地区:62 73 81 92 95 85 74 64 53 76 78 86 95 66 97 78 88 82 76 89B 地区:73 83 62 51 91 46 53 73 64 82 93 48 65 81 74 56 54 76 65 79(Ⅰ)根据两组数据完成两地区用户满意度评分的茎叶图,并通过茎叶图比较两地区满意度评分的平均值及分散程度(不要求计算出具体值,得出结论即可);(Ⅱ)根据用户满意度评分,将用户的满意度从低到高分为三个不等级:记时间C :“A 地区用户的满意度等级高于B 地区用户的满意度等级” .假设两地区用户的评价结果相互独立.根据所给数据,以事件发生的频率作为相应事件发生的概率,求C 的概率.【解析】(Ⅰ)略;(Ⅱ)记1A C 表示事件:“A 地区用户满意度等级为满意或者非常满意”;记2A C 表示事件:“A 地区用户满意度等级为非常满意”;记1B C 表示事件:“A 地区用户满意度等级为不满意”;记2B C 表示事件:“A 地区用户满意度等级为满意”;则1A C 与1B C 独立,2A C 与2B C 独立,1B C 与2B C 互斥,1122()()B A B A C C C C C =U ,1122()(()())B A B A P C P C C C C =U 1122()()B A B A P C C P C C =+1122()()()()B A B A P C P C P C P C =+, 由所给数据得1212,,,A A B B C C C C 发生的频率分别为164108,,,20202020,故1212164108(),(),(),()20202020A A B B P C P C P C P C ====,所以164108()0.4820202020P C =⨯⨯⨯=.。

2020版高考数学二轮复习第2部分专题3概率与统计第2讲统计与统计案例教案理

2020版高考数学二轮复习第2部分专题3概率与统计第2讲统计与统计案例教案理

第2讲统计与统计案例[做小题——激活思维]1.(2019·全国卷Ⅱ)演讲比赛共有9位评委分别给出某选手的原始评分,评定该选手的成绩时,从9个原始评分中去掉1个最高分、1个最低分,得到7个有效评分.7个有效评分与9个原始评分相比,不变的数字特征是( )A.中位数B.平均数C.方差D.极差A[记9个原始评分分别为a,b,c,d,e,f,g,h,i(按从小到大的顺序排列),易知e为7个有效评分与9个原始评分的中位数,故不变的数字特征是中位数,故选A.] 2.为了研究高中学生对乡村音乐的态度(喜欢和不喜欢两种态度)与性别的关系,运用2×2列联表进行独立性检验,计算得K2=8.01,则认为“喜欢乡村音乐与性别有关系”的把握约为( )C.99.5% D.99.9%C[因为K2=8.01>7.879,观测值同临界值进行比较可知,有99.5%的把握认为“喜欢乡村音乐与性别有关系”,故选C.]3.已知某赛季甲、乙两名篮球运动员每场比赛得分的茎叶图如图所示,则( )A.甲篮球运动员比赛得分更稳定,中位数为26B.甲篮球运动员比赛得分更稳定,中位数为27C.乙篮球运动员比赛得分更稳定,中位数为31D.乙篮球运动员比赛得分更稳定,中位数为36D[由茎叶图可知,乙运动员的得分大部分集中在30~40分之间,而甲运动员的得分相对比较分散,故乙篮球运动员比赛得分更稳定.乙篮球运动员共有13个得分,由茎叶图由小到大排列后处于中间第7位的是36,故选D.]4.已知某地区中小学生人数和近视情况分别如图1和图2所示.为了了解该地区中小学生的近视形成原因,用分层抽样的方法抽取2%的学生进行调查,则样本容量和抽取的高中生近视人数分别为( )图1 图2A.100,20 B.200,20C.200,10 D.100,10B[由题图1可知学生总人数是10 000,样本容量为10 000×2%=200,抽取的高中生人数是2 000×2%=40,由题图2可知高中生的近视率为50%,所以高中生的近视人数为40×50%=20,故选B.]5.已知x,y的取值如下表所示:若y与x呈线性相关,且回归方程为y=b x+2,则b等于________.1 2[由题意,得x=3,y=5.因为线性回归方程必过样本的中心点(3,5),所以5=3b^+72,解得b^=12.]6.数据1,3,5,7的方差为________.5[x=1+3+5+74=4,∴方差s2=14[(1-4)2+(3-4)2+(5-4)2+(7-4)2]=5.][扣要点——查缺补漏] 1.三种抽样方法(1)简单随机抽样;(2)系统抽样(等间隔抽样);(3)分层抽样(按比例抽样).如T4.2.样本数据x1,x2,…,x n的数字特征(1)样本平均数:x =1n(x 1+x 2+x 3+…+x n )=1n ∑ni =1x i ;(2)样本方差:s 2=1n[(x 1-x )2+(x 2-x )2+…+(x n -x )2]=1n ∑ni =1(x i -x )2=1n(x 21+x 22+x 23+…+x 2n -n x 2);如T 6.(3)样本标准差:s =1nx 1-x 2+x 2-x2+…+x n -x2]=1n ∑ni =1x i -x2;(4)样本数据的性质:若x 1,x 2,…,x n 的平均数为x ,方差为s 2,则ax 1+b ,ax 2+b ,…,ax n +b 的平均数为a x +b ,方差为a 2s 2.3.茎叶图样本数据越集中越稳定,越分散越不稳定,如T 3. 4.在频率分布直方图中:(1)最高的小长方形底边中点的横坐标即是众数; (2)中位数左边和右边的小长方形的面积和是相等的;(3)平均数等于频率分布直方图中每个小长方形的面积乘以小长方形底边中点的横坐标之和.5.线性回归方程y ^=b ^x +a ^一定过样本点的中心(x ,y ).如T 5. 6.独立性检验的关键在于准确求出K 2值,K 2=n ad -bc 2a +bc +d a +cb +d的观测值k 越大,说明“两个分类变量有关系”的可能性越大.如T 2.变量的相关性及回归分析(5年4考)[高考解读] 高考对该点的考查主要立足两点:一是考查学生的数据提取,数据分析能力;二是考查学生的数学建模能力,因此学会从数据中获取有效信息并给予正确的处理是解答此类问题的关键.在备考中,要重视以茎叶图、散点图、折线图、饼状图为载体的题目.(2018·全国卷Ⅱ)下图是某地区2000年至2016年环境基础设施投资额y (单位:亿元)的折线图.为了预测该地区2018年的环境基础设施投资额,建立了y 与时间变量t 的两个线性回归模型.根据2000年至2016年的数据(时间变量t 的值依次为1,2,…,17)建立模型①:y ^=-30.4+13.5t ;根据2010年至2016年的数据(时间变量t 的值依次为1,2,…,7)建立模型②:y ^=99+17.5t .(1)分别利用这两个模型,求该地区2018年的环境基础设施投资额的预测值; (2)你认为用哪个模型得到的预测值更可靠?并说明理由.[解](1)利用模型①,该地区2018年的环境基础设施投资额的预测值为y ^=-30.4+13.5×19=226.1(亿元).利用模型②,该地区2018年的环境基础设施投资额的预测值为y ^=99+17.5×9=256.5(亿元).(2)利用模型②得到的预测值更可靠. 理由如下:(ⅰ)从折线图可以看出,2000年至2016年的数据对应的点没有随机散布在直线y =-30.4+13.5t 上下,这说明利用2000年至2016年的数据建立的线性模型①不能很好地描述环境基础设施投资额的变化趋势.2010年相对2009年的环境基础设施投资额有明显增加,2010年至2016年的数据对应的点位于一条直线的附近,这说明从2010年开始环境基础设施投资额的变化规律呈线性增长趋势,利用2010年至2016年的数据建立的线性模型y ^=99+17.5t 可以较好地描述2010年以后的环境基础设施投资额的变化趋势,因此利用模型②得到的预测值更可靠.(ⅱ)从计算结果看,相对于2016年的环境基础设施投资额220亿元,由模型①得到的预测值226.1亿元的增幅明显偏低,而利用模型②得到的预测值的增幅比较合理,说明利用模型②得到的预测值更可靠.(以上给出了2种理由,答出其中任意一种或其他合理理由均可) [教师备选题](2015·全国Ⅰ)某公司为确定下一年度投入某种产品的宣传费,需了解年宣传费x (单位:千元)对年销售量y (单位:t)和年利润z (单位:千元)的影响.对近8年的年宣传费x i 和年销售量y i (i =1,2,…,8)数据作了初步处理,得到下面的散点图及一些统计量的值.表中w i=x i ,w ]=8∑i =1w i .(1)根据散点图判断,y =a +bx 与y =c +d x 哪一个适宜作为年销售量y 关于年宣传费x 的回归方程类型?(给出判断即可,不必说明理由)(2)根据(1)的判断结果及表中数据,建立y 关于x 的回归方程;(3)已知这种产品的年利润z 与x ,y 的关系为z =0.2y -x .根据(2)的结果回答下列问题: ①年宣传费x =49时,年销售量及年利润的预报值是多少? ②年宣传费x 为何值时,年利润的预报值最大?附:对于一组数据(u 1,v 1),(u 2,v 2),…,(u n ,v n ),其回归直线v =α+βu 的斜率和截距的最小二乘估计分别为[解](1)由散点图可以判断,y =c +d x 适宜作为年销售量y 关于年宣传费x 的回归方程类型.(2)令w =x ,先建立y 关于w 的线性回归方程.c ^=y -d ^w =563-68×6.8=100.6,所以y 关于w 的线性回归方程为y ^=100.6+68w , 因此y 关于x 的回归方程为y ^=100.6+68x .(3)①由(2)知,当x =49时,年销售量y 的预报值y ^=100.6+6849=576.6, 年利润z 的预报值z ^=576.6×0.2-49=66.32. ②根据(2)的结果知,年利润z 的预报值 z ^=0.2(100.6+68x )-x =-x +13.6x +20.12.所以当x =13.62=6.8,即x =46.24时,z ^取得最大值.故年宣传费为46.24千元时,年利润的预报值最大.求线性回归直线方程的步骤1.[重视题](结合散点图分析问题)某青少年成长关爱机构为了调研所在地区青少年的年龄与身高状况,随机抽取6岁,9岁,12岁,15岁,18岁的青少年身高数据各1 000个,根据各年龄段平均身高作出如下图所示的散点图和回归直线l .根据图中数据,下列对该样本描述错误的是( )A .根据样本数据估计,该地区青少年身高与年龄成正相关B .所抽取数据中,5 000名青少年平均身高约为145 cmC .直线l 的斜率的值近似等于样本中青少年平均身高每年的增量D .从这5种年龄的青少年中各取一人的身高数据,由这5人的平均年龄和平均身高数据作出的点一定在直线l 上D [在给定范围内,随着年龄增加,年龄越大身高越高,故该地区青少年身高与年龄成正相关,故A 项正确;用样本数据估计总体可得平均数大约是145 cm ,故B 项正确;根据直线斜率的意义可知斜率的值近似等于样本中青少年平均身高每年的增量,故C 项正确;各取一人具有随机性,根据数据作出的点只能在直线附近,不一定在直线上,故D 项错误.]2.(回归分析与函数交汇)某公司为确定下一年度投入某种产品的宣传费,需了解年宣传费x (单位:千元)对年销售量y (单位:吨)和年利润z (单位:千元)的影响,对近13年的年宣传费x i 和年销售量y i (i =1,2,…,13)数据作了初步处理,得到如下图所示的散点图及一些统计量的值.由散点图知,按y =a +b x ,y =c +d x建立y 关于x 的回归方程是合理的.令s =x ,t =1x, 经计算得如下数据:i i i i 12(1)从以上模型中选择更优的回归方程,并用相关系数加以说明; (2)根据(1)的选择结果及表中数据,建立y 关于x 的回归方程;(3)已知这种产品的年利润z 与x ,y 的关系为z =10y -x .根据(2)的结果回答下列问题: ①年宣传费x =20时,年利润的预报值是多少? ②年宣传费x 为何值时,年利润的预报值最大?附:对于一组数据(u i ,v i )(i =1,2,…,n ),其回归直线v =α+βu 的斜率和截距的最小二乘估计分别为β^=∑ni =1u i v i -n u v∑ni =1u 2i -n u2,α^=v -β^u .[解](1)由于|r 1|<|r 2|<1,故y =c +d x更优.(2)d ^=∑13i =1t i y i -13t y∑13i =1t 2i -13t2=-2.100.21=-10, c ^=y -d ^t =109.94+10×0.16=111.54.则y 关于x 的回归方程为y ^=111.54-10x.(3)由题意,年利润z =10y -x =1 115.4-⎝⎛⎭⎪⎫100x +x ,①当x =20时,年利润的预报值是z ^=1 115.4-⎝ ⎛⎭⎪⎫10020+20=1 090.4.②由基本不等式得,年利润的预报值z ^=1 115.4-⎝ ⎛⎭⎪⎫100x +x ,由于x +100x ≥20,当且仅当x =100x,即x =10时等号成立,此时z ^max =1 115.4-20=1095.4.独立性检验(5年2考)[高考解读] 该类问题常以统计图、表为载体,以生活题材为背景,借助独立性检验中的K 2公式对两类分类变量的相关性作出判断.(2018·全国卷Ⅲ)某工厂为提高生产效率,开展技术创新活动,提出了完成某项生产任务的两种新的生产方式.为比较两种生产方式的效率,选取40名工人,将他们随机分成两组,每组20人.第一组工人用第一种生产方式,第二组工人用第二种生产方式.根据工人完成生产任务的工作时间(单位:min)绘制了如图所示的茎叶图:(1)根据茎叶图判断哪种生产方式的效率更高?并说明理由;(2)求40名工人完成生产任务所需时间的中位数m ,并将完成生产任务所需时间超过m 和不超过m 的工人数填入下面的列联表:附:K 2=n ad -bc 2a +bc +d a +cb +d,理由如下:(ⅰ)由茎叶图可知:用第一种生产方式的工人中,有75%的工人完成生产任务所需时间至少80分钟,用第二种生产方式的工人中,有75%的工人完成生产任务所需时间至多79分钟.因此第二种生产方式的效率更高.(ⅱ)由茎叶图可知:用第一种生产方式的工人完成生产任务所需时间的中位数为85.5分钟,用第二种生产方式的工人完成生产任务所需时间的中位数为73.5分钟.因此第二种生产方式的效率更高.(ⅲ)由茎叶图可知:用第一种生产方式的工人完成生产任务平均所需时间高于80分钟;用第二种生产方式的工人完成生产任务平均所需时间低于80分钟.因此第二种生产方式的效率更高.(ⅳ)由茎叶图可知:用第一种生产方式的工人完成生产任务所需时间分布在茎8上的最多,关于茎8大致呈对称分布;用第二种生产方式的工人完成生产任务所需时间分布在茎7上的最多,关于茎7大致呈对称分布.又用两种生产方式的工人完成生产任务所需时间分布的区间相同,故可以认为用第二种生产方式完成生产任务所需的时间比用第一种生产方式完成生产任务所需的时间更少.因此第二种生产方式的效率更高.(2)由茎叶图知m =79+812=80.列联表如下:(3)由于K 2=20×20×20×20=10>6.635,所以有99%的把握认为两种生产方式的效率有差异.独立性检验的方法步骤(1)根据数据列出2×2列联表; (2)根据公式计算K 2找观测值k ;(3)比较观测值k 与临界值表中相应的检验水平,作出统计判断.1.(柱形图与独立性检验)一家大型超市委托某机构调查该超市的顾客使用移动支付的情况.调查人员从年龄在20至60的顾客中,随机抽取了200人,调查结果如图:(1)为推广移动支付,超市准备对使用移动支付的每位顾客赠送1个环保购物袋.若某日该超市预计有10 000人购物,试根据上述数据估计,该超市当天应准备多少个环保购物袋?(2)填写下面列联表,并根据列联表判断是否有99.9%的把握认为使用移动支付与年龄有关?动支付的顾客为X 人,求X 的分布列.附:K 2=n ad -bc 2a +bc +d a +cb +d率为:20+25+25+15+15+10+8+7200=58,所以超市当天应准备的环保购物袋个数为:10000×58=6 250.(2)由(1)知列联表为:则K 2=125×75×95×105≈56.17,因为56.17>10.828,所以有99.9%的把握认为使用移动支付与年龄有关. (3)X 可能取值为0,1,2,P (X =0)=C 222C 229=3358,P (X =1)=C 122C 17C 229=1129,P (X =2)=C 27C 229=358,所以X 的分布列为:2.(情况,随机在这两条流水线上各抽取100件产品作为样本称出它们的质量(单位:毫克),质量值落在(175,225]的产品为合格品,否则为不合格品.如表是甲流水线样本频数分布表,如图是乙流水线样本的频率分布直方图.(1)由以上统计数据完成下面2×2列联表,能否在犯错误的概率不超过0.15的前提下认为产品的包装合格与两条自动包装流水线的选择有关?附表:(参考公式:K 2=a +ba +cb +dc +d,n =a +b +c +d )(2)由乙流水线的频率分布直方图可以认为乙流水线生产的产品质量指标z 服从正态分布N (200,12.22),求质量指标z 落在(187.8,224.4)上的概率;参考公式:P (μ-σ<z <μ+σ)=0.682 7,P (μ-2σ<z <μ+2σ)=0.954 5. (3)若以频率作为概率,从甲流水线任取2件产品,求至少有一件产品是合格品的概率. [解](1)由甲流水线样本频数分布表可知,合格品的个数为100-(3+5)=92,由乙流水线样本的频率分布直方图可知,合格品的个数为100×(1-0.04)=96,所以,2×2列联表是:所以K 2=100×100×188×12≈1.418<2.072,所以在犯错误的概率不超过0.15的前提下不能认为产品的包装合格与两条自动包装流水线的选择有关.(2)因为乙流水线的产品生产质量指标z 服从正态分布N (200,12.22),P (μ-σ<z <μ+σ)=0.682 7,P (μ-2σ<z <μ+2σ)=0.954 5,所以P (μ-σ<z <μ+2σ)=P (μ-σ<z <0)+P (0≤z <μ+2σ)=12P (μ-σ<z <μ+σ)+12P (μ-2σ<z <μ+2σ)=12×(0.682 7+0.954 5)=0.818 6,即P (200-12.2<z <200+12.2×2)=P (187.8<z <224.4)=0.818 6,所以质量指标落在(187.8,224.4)的概率是0.818 6.(3)若以频率作概率,则从甲流水线任取一件产品是不合格品的概率p =0.08, 设“任取两件产品,至少有一件合格品”为事件A ,则A 为“任取两件产品,两件均为不合格品”,且P (A )=p 2=0.082=0.006 4, 所以P (A )=1-P (A )=1-0.0064=0.993 6,所以任取两件产品至少有一件为合格品的概率为0.993 6.概率与统计的综合问题(5年2考)[高考解读] 以实际问题为背景,以统计图表为载体考查样本数据的数字特征、概率的求法及分布列的相关知识,处理的关键是仔细阅读题目,准确获取信息,将实际问题转化为统计概率问题.(2017·全国卷Ⅲ)某超市计划按月订购一种酸奶,每天进货量相同,进货成本每瓶4元,售价每瓶6元,未售出的酸奶降价处理,以每瓶2元的价格当天全部处理完.根据往年销售经验,每天需求量与当天最高气温(单位:℃)有关.如果最高气温不低于25,需求量为500瓶;如果最高气温位于区间[20,25),需求量为300瓶;如果最高气温低于20,需求量为200瓶.为了确定六月份的订购计划,统计了前三年六月份各天的最高气温数据,得下面的频数分布表:(1)求六月份这种酸奶一天的需求量X (单位:瓶)的分布列;(2)设六月份一天销售这种酸奶的利润为Y (单位:元).当六月份这种酸奶一天的进货量n (单位:瓶)为多少时,Y 的数学期望达到最大值?切入点:由于n ∈[200,500],对n 分类讨论,且同时计算在不同温度下的期望的表达式. [解](1)由题意知,X 所有可能取值为200,300,500,由表格数据知P (X =200)=2+1690=0.2,P (X =300)=3690=0.4, P (X =500)=25+7+490=0.4. 因此X 的分布列为(2)200≤n ≤500.当300≤n ≤500时,若最高气温不低于25,则Y =6n -4n =2n ;若最高气温位于区间[20,25),则Y =6×300+2(n -300)-4n =1 200-2n ;若最高气温低于20,则Y=6×200+2(n-200)-4n=800-2n.因此E(Y)=2n×0.4+(1 200-2n)×0.4+(800-2n)×0.2=640-0.4n.当200≤n<300时,若最高气温不低于20,则Y=6n-4n=2n;若最高气温低于20,则Y=6×200+2(n-200)-4n=800-2n,因此E(Y)=2n×(0.4+0.4)+(800-2n)×0.2=160+1.2n.所以n=300时,Y的数学期望达到最大值,最大值为520元.[教师备选题](2015·全国卷Ⅱ)某公司为了解用户对其产品的满意度,从A,B两地区分别随机调查了20个用户,得到用户对产品的满意度评分如下:A地区:62 73 81 92 95 85 74 64 5376 78 86 95 66 97 78 88 8276 89B地区:73 83 62 51 91 46 53 73 6482 93 48 65 81 74 56 54 7665 79(1)根据两组数据完成两地区用户满意度评分的茎叶图,并通过茎叶图比较两地区满意度评分的平均值及分散程度(不要求计算出具体值,给出结论即可);(2)根据用户满意度评分,将用户的满意度从低到高分为三个等级:的评价结果相互独立.根据所给数据,以事件发生的频率作为相应事件发生的概率,求C的概率.[解](1)两地区用户满意度评分的茎叶图如下:通过茎叶图可以看出,A 地区用户满意度评分的平均值高于B 地区用户满意度评分的平均值;A 地区用户满意度评分比较集中,B 地区用户满意度评分比较分散.(2)记C A 1表示事件:“A 地区用户的满意度等级为满意或非常满意”;C A 2表示事件:“A 地区用户的满意度等级为非常满意”; C B1表示事件:“B 地区用户的满意度等级为不满意”; C B2表示事件:“B 地区用户的满意度等级为满意”,则C A 1与C B1独立,C A 2与C B2独立,C B1与C B2互斥,C =C B1C A 1∪C B2C A 2. P (C )=P (C B1C A 1∪C B2C A 2)=P (C B1C A 1)+P (C B2C A 2) =P (C B1)P (C A 1)+P (C B2)P (C A 2).由所给数据得C A 1,C A 2,C B1,C B2发生的频率分别为1620,420,1020,820,故P (C A 1)=1620,P (C A 2)=420,P (C B1)=1020,P (C B2)=820,P (C )=1020×1620+820×420=0.48.解决概率与统计综合问题的一般步骤1.(统计图表与正态分布、期望交汇)(2019·济宁一模)某学校为了了解全校学生的体重情况,从全校学生中随机抽取了100人的体重数据,结果这100人的体重全部介于45公斤到75公斤之间,现将结果按如下方式分为6组:第一组[45,50),第二组[50,55),…,第六组[70,75],得到如图1所示的频率分布直方图,并发现这100人中,其体重低于55公斤的有15人,这15人体重数据的茎叶图如图2所示,以样本的频率作为总体的概率.(1)求频率分布直方图中a ,b ,c 的值;(2)从全校学生中随机抽取3名学生,记X 为体重在[55,65)的人数,求X 的概率分布列和数学期望;(3)由频率分布直方图可以认为,该校学生的体重ξ近似服从正态分布N (μ,σ2),其中μ=60,σ2=25,若P (μ-2σ≤ξ<μ+2σ)>0.954 5,则认为该校学生的体重是正常的.试判断该校学生的体重是否正常?并说明理由.图1 图2[解](1)由题图2知,100名样本中体重低于50公斤的有2人,用样本的频率估计总体的频率,可得体重低于50公斤的概率为2100=0.02,所以a =0.025=0.004.在[50,55)上有13人,该组的频率为0.13,则b =0.135=0.026,所以2c =1-0.02×2-0.13×25=0.14,即c =0.07.(2)用样本的频率估计总体的频率,可知从全校学生中随机抽取1人,体重在[55,65)的概率为0.07×10=0.7,随机抽取3人,相当于3次独立重复实验,随机变量X 服从二项分布B (3,0.7),则P (X =0)=C 03·0.70·0.33=0.027,P (X =1)=C 13·0.7·0.32=0.189, P (X =2)=C 23·0.72·0.3=0.441, P (X =3)=C 33·0.73·0.30=0.343,所以X 的概率分布列为:(3)由题意知ξ服从正态分布N (60,25),其中σ=5,则P (μ-2σ≤ξ<μ+2σ)=P (50≤ξ<70)=0.96>0.954 5, 所以可以认为该校学生的体重是正常的.2.(统计图表与二项分布交汇)某校为了解甲、乙两班学生的学业水平,从两班中各随机抽取20人参加学业水平等级考试,得到学生的学业成绩茎叶图如图:(1)通过茎叶图比较甲、乙两班学生的学业成绩平均值x 甲与x 乙及方差s 2甲与s 2乙的大小;(只需写出结论)(2)根据学生的学业成绩,将学业水平分为三个等级:①从甲、乙两班中各随机抽取1人,记事件C :“抽到的甲班学生的学业水平高于乙班学生的学业水平等级”,求C 发生的概率;②从甲班中随机抽取2人,记X 为学业水平优秀的人数,求X 的分布列和数学期望. [解](1)由茎叶图能得到x 甲>x 乙,s 2甲<s 2乙.(2)①记A 1,A 2,A 3分别表示事件:甲班学生学业水平成绩为一般,良好,优秀; 记B 1,B 2,B 3分别表示事件:乙班学生学业水平成绩为一般,良好,优秀,则P (C )=P (A 2B 1∪A 3B 1∪A 3B 2)=P (A 2B 1)+P (A 3B 1)+P (A 3B 2)=P (A 2)P (B 1)+P (A 3)P (B 1)+P (A 3)P (B 2)=1220×920+520×920+520×920=99200. ②从甲班随机抽取1人,其学业水平优秀的概率为14,所以,随机变量X 的所有可能取值为0,1,2,且X ~B ⎝ ⎛⎭⎪⎫2,14. P (X =0)=C 02⎝ ⎛⎭⎪⎫342=916,P (X =1)=C 12·14·34=38,P (X =2)=C 22⎝ ⎛⎭⎪⎫142=116.随机变量X 的分布列是:数学期望E (X )=2×4=2.。

第1讲 概率、随机变量

第1讲 概率、随机变量

第1讲 概率、随机变量及其分布列概率的研究对象是随机现象,为人们从不确定性的角度认识客观世界提供重要的思维模式和解决问题的方法,统计的研究对象是数据,核心是数据分析。

概率为统计的发展提供理论基础,高考中概率与统计考题常常具有鲜明的时代和文化背景,试题难度逐渐加大,重点提升数据分析、数学建模、逻辑推理和数学运算素养。

基础知识回顾1.古典概型概率公式: ()试验的样本点总数包含的样本点数事件A A P =。

2.条件概率公式:对于任何两个事件A 和B ,在已知事件A 发生的条件下,事件B 发生的概率叫作条件概率,用符号()A B P 来表示,其公式为()()()()()0>=A P A P AB P A B P 3.全概率公式:设n A A A ,...,21n A A A ,...,21是一组两两互斥的事件,Q A A A n = ...21,且()n i A P i ,...,2,1,0=>,则对任意的事件Q B ⊆,有()()()i ni i A B P A P B P ∑==1。

4.超几何分布:在含有M 件次品的N 件产品中,任取n 件,其中恰有X 件次品,则()m k C C C k X P n N k n M N k M ,...,2,1,0,===--,其中{}n M m ,m in =, 且()NM n X E N N M n N M N n •=∈≤≤*,,,,,。

5.二项分布 :一般地,在n 重伯努利试验中,设每次试验中事件A 发生的概率为p (0<p<1),用X 表示事件A 发生的次数,则X 的分布列为()()()()()p np X D np X E nk p p C k X P k n k k n -===-==-1,,...,2,1,0,1 6.正态分布: 如果对于任何实数a ,b(a<b),随机变量X 满足()()dx x b X a P b au σϕ,⎰=≤<(即x=a ,x=b ,正态曲线及x轴围成的曲边梯形的面积),那么称随机变量X 服从正态分布记作()2,~σu N X 。

2020年高考数学第二轮复习 统计与概率教学案 精品

2020年高考数学第二轮复习 统计与概率教学案 精品

2020年高考第二轮专题复习(教学案):统计与概率考纲指要:“统计”是在初中“统计初步”基础上的深化和扩展,本讲主要会用样本的频率分布估计总体的分布,并会用样本的特征来估计总体的分布。

热点问题是频率分布直方图和用样本的数字特征估计总体的数字特征。

统计案例主要包括回归分析的基本思想及其初步应用和独立性检验的基本思想和初步应用。

对概率考察的重点为互斥事件、古典概型的概率事件的计算为主,了解随机数的意义,能运用模拟方法(包括计算器产生随机数来进行模拟)估计概率,初步体会几何概型的意义。

考点扫描:1.三种常用抽样方法:(1)简单随机抽样;(2)系统抽样;(3)分层抽样。

2.用样本的数字特征估计总体的数字特征: (1)众数、中位数;(2)平均数与方差。

3.频率分布直方图、折线图与茎叶图。

4.线性回归:回归直线方程。

5.统计案例:相关系数、卡方检验,6.随机变量:随机变量的概念,离散性随机变量的分布列,相互独立事件、独立重复试验公式,随机变量的均值和方差,几种特殊的分布列:(1)两点分布;(2)超几何分布;(3)二项分布;正态分布。

7随机事件的概念、概率;事件间的关系:(1)互斥事件;(2)对立事件;(3)包含; 事件间的运算:(1)并事件(和事件)(2)交事件(积事件)8古典概型:古典概型的两大特点;古典概型的概率计算公式。

9几何概型:几何概型的概念;几何概型的概率公式;几种常见的几何概型。

考题先知:例1.为了科学地比较考试的成绩,有些选拔性考试常常会将考试分数转化为标准分,转化关系式为:sxx Z -=(其中x 是某位学生的考试分数,x 是该次考试的平均分,s 是该次 考试的标准差,Z 称为这位学生的标准分).转化成标准分后可能出现小数和负值,因此, 又常常再将Z 分数作线性变换转化成其他分数. 例如某次学业选拔考试采用的是T 分数,线性变换公式是:T=40Z+60. 已知在这次考试中某位考生的考试分数是85,这次考试的平均分是70,标准差是25,则该考生的T 分数为 . 分析:正确理解题意,计算所求分数。

(全国通用)2020版高考数学二轮复习 提升专题 统计与概率教案讲义汇编全集

(全国通用)2020版高考数学二轮复习  提升专题  统计与概率教案讲义汇编全集

第1讲 统计、统计案例[例1] (1)某电视台在因特网上就观众对其某一节目的喜爱程度进行调查,参加调查的一共有20000人,其中各种态度对应的人数如下表所示:电视台为了了解观众的具体想法和意见,打算从中抽选100人进行更为详细的调查,为此要进行分层抽样,那么在分层抽样时,每类人中应抽选的人数分别为( )A.25,25,25,25B.48,72,64,16C.20,40,30,10D.24,36,32,8(2)采用系统抽样方法从960人中抽取32人做问卷调查,为此将他们随机编号为1,2,…,960,分组后在第一组采用简单随机抽样的方法抽到的号码为9,抽到的32人中,编号落入区间[1,450]的人做问卷A ,编号落入区间[451,750]的人做问卷B ,其余的人做问卷C ,则抽到的人中,做问卷B 的人数为( )A.7B.9C.10D.15[解析] (1)因为抽样比为10020000=1200,所以每类人中应抽选的人数分别为4800×1200=24,7200×1200=36,6400×1200=32,1600×1200=8.故选D. (2)由题意知应将960人分成32组,每组30人.设每组选出的人的号码为30k +9(k =0,1,…,31).由451≤30k +9≤750,解得44230≤k ≤74130,又k ∈N ,故k =15,16, (24)共10人.[答案] (1)D (2)C[解题方略] 系统抽样和分层抽样中的计算 (1)系统抽样①总体容量为N ,样本容量为n ,则要将总体均分成n 组,每组Nn个(有零头时要先去掉). ②若第一组抽到编号为k 的个体,则以后各组中抽取的个体编号依次为k +N n,…,k +(n -1)N n.(2)分层抽样按比例抽样,计算的主要依据是:各层抽取的数量之比=总体中各层的数量之比.[跟踪训练]1.(2019·全国卷Ⅰ)某学校为了解1000名新生的身体素质,将这些学生编号为1,2,…,1000,从这些新生中用系统抽样方法等距抽取100名学生进行体质测验.若46号学生被抽到,则下面4名学生中被抽到的是( )A.8号学生B.200号学生C.616号学生D.815号学生解析:选C 根据题意,系统抽样是等距抽样,所以抽样间隔为1000100=10.因为46除以10余6,所以抽到的号码都是除以10余6的数,结合选项知应为616.故选C.2.某中学有高中生3000人,初中生2000人,男、女生所占的比例如图所示.为了解学生的学习情况,用分层抽样的方法从该校学生中抽取一个容量为n 的样本,已知从高中生中抽取女生21人,则从初中生中抽取的男生人数是( )A.12B.15C.20D.21解析:选 A 因为抽样比为213000×70%=1100,所以从初中生中抽取的男生人数为2000×60%×1100=12.故选A.[例2] (2019·全国卷Ⅱ)某行业主管部门为了解本行业中小企业的生产情况,随机调查了100个企业,得到这些企业第一季度相对于前一年第一季度产值增长率y 的频数分布表.(1)分别估计这类企业中产值增长率不低于40%的企业比例、产值负增长的企业比例; (2)求这类企业产值增长率的平均数与标准差的估计值(同一组中的数据用该组区间的中点值为代表).(精确到0.01)附:74≈8.602.[解] (1)根据产值增长率频数分布表得,所调查的100个企业中产值增长率不低于40%的企业频率为14+7100=0.21.产值负增长的企业频率为2100=0.02.用样本频率分布估计总体分布得这类企业中产值增长率不低于40%的企业比例为21%,产值负增长的企业比例为2%.(2)y =1100×(-0.10×2+0.10×24+0.30×53+0.50×14+0.70×7)=0.30, s 2=1100 i =15n i (y i -y )2=1100×[(-0.40)2×2+(-0.20)2×24+02×53+0.202×14+0.402×7] =0.0296,s =0.0296=0.02×74≈0.17.所以,这类企业产值增长率的平均数与标准差的估计值分别为0.30,0.17.[解题方略] 1.方差的计算与含义(1)计算:计算方差首先要计算平均数,然后再按照方差的计算公式进行计算. (2)含义:方差是描述一个样本和总体的波动大小的特征数,方差大说明波动大. 2.从频率分布直方图中得出有关数据的方法[跟踪训练]1.(2019·石家庄市质量检测)甲、乙两人8次测评成绩的茎叶图如图,由茎叶图知甲的成绩的平均数和乙的成绩的中位数分别是( )A.23,22B.23,22.5C.21,22D.21,22.5解析:选D 由茎叶图可得甲的成绩的平均数为10+11+14+21+23+23+32+348=21.将乙的成绩按从小到大的顺序排列,中间的两个成绩分别是22,23,所以乙的成绩的中位数为22+232=22.5.2.为了解一种植物果实的情况,随机抽取一批该植物果实样本测量重量的数据(单位:克),按照[27.5,32.5),[32.5,37.5),[37.5,42.5),[42.5,47.5),[47.5,52.5]分为5组,其频率分布直方图如图所示.(1)求图中a 的值;(2)估计这种植物果实重量的平均数x 和方差s 2(同一组中的数据用该组区间的中点值作代表).解:(1)由5×(0.020+0.040+0.075+a +0.015)=1,得a =0.050. (2)各组中点值和相应的频率依次为中点值 30 35 40 45 50 频率0.10.20.3750.250.075x =30×0.1+35×0.2+40×0.375+45×0.25+50×0.075=40,s 2=(-10)2×0.1+(-5)2×0.2+02×0.375+52×0.25+102×0.075=28.75.考点三统计案例题型一 回归分析在实际问题中的应用[例3] 某省的一个气象站观测点在连续4天里记录的AQI 指数M 与当天的空气水平可见度y (单位:cm)的情况如表1:M 900 700 300 100 y0.53.56.59.5该省某市2019年11月份AQI 指数频数分布如表2:M[0,200)[200,400)[400,600)[600,800)[800,1000]频数(天) 361263(1)设x =M100,若x 与y 之间是线性关系,试根据表1的数据求出y 关于x 的线性回归方程.(2)小李在该市开了一家洗车店,洗车店每天的平均收入与AQI 指数存在相关关系如表3:M[0,200)[200,400)[400,600)[600,800)[800,1000]日均收入(元) -2000-1000200060008000根据表3估计小李的洗车店2019年11月份每天的平均收入.附参考公式:y ^=b ^x +a ^,其中b ^=,a ^=y -b ^x .[解] (1)x =14(9+7+3+1)=5,y =14(0.5+3.5+6.5+9.5)=5,∑4,i =1x i y i =9×0.5+7×3.5+3×6.5+1×9.5=58. ∑4,i =1x 2i =92+72+32+12=140,所以b ^=58-4×5×5140-4×52=-2120,a ^=5-⎝ ⎛⎭⎪⎫-2120×5=414, 所以y 关于x 的线性回归方程为y ^=-2120x +414.(2)根据表3可知,该月30天中有3天每天亏损2000元,有6天每天亏损1000元,有12天每天收入2000元,有6天每天收入6000元,有3天每天收入8000元,估计小李洗车店2019年11月份每天的平均收入为130×(-2000×3-1000×6+2000×12+6000×6+8000×3)=2400(元).[解题方略] 求回归直线方程的方法(1)若所求的回归直线方程是在选择题中,常利用回归直线y ^=b ^x +a ^必经过样本点的中心(x ,y )快速选择.(2)若所求的回归直线方程是在解答题中,则求回归直线方程的一般步骤为:题型二 独立性检验在实际问题中的应用[例4] (2019·全国卷Ⅰ)某商场为提高服务质量,随机调查了50名男顾客和50名女顾客,每位顾客对该商场的服务给出满意或不满意的评价,得到下面列联表:满意 不满意 男顾客 40 10 女顾客3020(1)分别估计男、女顾客对该商场服务满意的概率;(2)能否有95%的把握认为男、女顾客对该商场服务的评价有差异?附:K 2=n (ad -bc )2(a +b )(c +d )(a +c )(b +d ).P (K 2≥k )0.050 0.010 0.001[解] (1)由调查数据,男顾客中对该商场服务满意的比率为4050=0.8,因此男顾客对该商场服务满意的概率的估计值为0.8.女顾客中对该商场服务满意的比率为3050=0.6,因此女顾客对该商场服务满意的概率的估计值为0.6.(2)K 2的观测值k =100×(40×20-30×10)250×50×70×30≈4.762.由于4.762>3.841,故有95%的把握认为男、女顾客对该商场服务的评价有差异.[解题方略] 独立性检验的一般步骤 (1)根据样本数据制成2×2列联表;(2)根据公式K 2=n (ad -bc )2(a +b )(c +d )(a +c )(b +d )(其中n =a +b +c +d )计算出K2的观测值;(3)比较K 2的观测值与临界值的大小,作出统计推断.[跟踪训练]1.某学校为了制定治理学校门口上学、放学期间家长接送孩子乱停车现象的措施,对全校学生家长进行了问卷调查.根据从中随机抽取的50份调查问卷,得到了如下的列联表:则认为“是否同意限定区域停车与家长的性别有关”的把握约为( ) A.0.1% B.0.5% C.99.5%D.99.9%附:K 2=n (ad -bc )2(a +b )(c +d )(a +c )(b +d ),其中n =a +b +c +d .解析:选C 因为K 2=50×(20×15-5×10)225×25×30×20≈8.333>7.879,所以约有99.5%的把握认为“是否同意限定区域停车与家长的性别有关”.2.2019年秋新学期开始,某市对全市中小学学生进行健康状况抽样调查,其中在某校调查得到了该校前五个年级近视率y 的数据如下表:根据前五个年级的数据,利用最小二乘法求出y 关于x 的线性回归方程,并根据方程预测六年级学生的近视率.附:回归直线y ^=b ^x +a ^的斜率和截距的最小二乘法估计公式分别为得b ^=2.76-2.2555-45=0.051,a ^=0.15-0.051×3=-0.003,得线性回归方程为y ^=0.051x -0.003.当x =6时,代入得y ^=0.051×6-0.003=0.303, 所以六年级学生的近视率在0.303左右.数学建模——回归分析问题的求解[典例] (2019·合肥市第二次质量检测)为了了解A 地区足球特色学校的发展状况,某调查机构统计得到如下数据:(1)根据表中数据,计算y 与x 的相关系数r ,并说明y 与x 的线性相关性强弱(已知:0.75≤|r |≤1,则认为y 与x 线性相关性很强;0.3≤|r |<0.75,则认为y 与x 线性相关性一般;|r |≤0.25,则认为y 与x 线性相关性较弱);(2)求y 关于x 的线性回归方程,并预测A 地区2019年足球特色学校的个数(精确到个).[解] (1)x =2016,y =1,r =i =15(x i -x )(y i -y )i =15(x i -x )2i =15(y i -y )2=(-2)×(-0.7)+(-1)×(-0.4)+1×0.4+2×0.710× 1.3= 3.63.6056=0.9984>0.75, ∴y 与x 线性相关性很强.a ^=y -b ^x =1-0.36×2016=-724.76,∴y 关于x 的线性回归方程是y ^=0.36x -724.76. 当x =2019时,y ^=0.36×2019-724.76=2.08, 即A 地区2019年足球特色学校约有208个. [素养通路]本题是典型的回归分析问题,在实际问题中收集数据,画散点图,用线性回归模型拟合变量关系,再用最小二乘法求出回归方程,进而用回归模型对实际问题进行预测,考查了数学建模这一核心素养.[专题过关检测]A 组——“6+3+3”考点落实练一、选择题1.利用系统抽样法从编号分别为1,2,3,…,80的80件不同产品中抽出一个容量为16的样本,如果抽出的产品中有一件产品的编号为13,则抽到产品的最大编号为( )A.73B.78C.77D.76解析:选B 样本的分段间隔为8016=5,所以13号在第三组,则最大的编号为13+(16-3)×5=78.故选B.2.(2019·全国卷Ⅱ)演讲比赛共有9位评委分别给出某选手的原始评分,评定该选手的成绩时,从9个原始评分中去掉1个最高分、1个最低分,得到7个有效评分.7个有效评分与9个原始评分相比,不变的数字特征是( )A.中位数B.平均数C.方差D.极差解析:选A 中位数是将9个数据从小到大或从大到小排列后,处于中间位置的数据,因而去掉1个最高分和1个最低分,不变的是中位数,平均数、方差、极差均受影响.故选A.3.(2019·广东六校第一次联考)某单位为了落实“绿水青山就是金山银山”理念,制定节能减排的目标,先调查了用电量y (单位:kW ·h)与气温x (单位:℃)之间的关系,随机选取了4天的用电量与当天气温,并制作了如下对照表:由表中数据得线性回归方程:y ^=-2x +60,则a 的值为( ) A.48 B.62 C.64D.68解析:选C 由题意,得x =17+14+10-14=10,y =24+34+38+a 4=96+a4.样本点的中心(x ,y )在回归直线y ^=-2x +60上,代入线性回归方程可得96+a 4=-20+60,解得a=64,故选C.4.如图是民航部门统计的2019年春运期间十二个城市售出的往返机票的平均价格以及相比去年同期变化幅度的数据统计图表,根据图表,下面叙述不正确的是( )A.深圳的变化幅度最小,北京的平均价格最高B.深圳和厦门的春运期间往返机票价格同去年相比有所下降C.平均价格从高到低居于前三位的城市为北京、深圳、广州D.平均价格的涨幅从高到低居于前三位的城市为天津、西安、厦门解析:选D 由图可知深圳对应的小黑点最接近0%,故变化幅度最小,北京对应的条形图最高,则北京的平均价格最高,故A 正确;由图可知深圳和厦门对应的小黑点在0%以下,故深圳和厦门的价格同去年相比有所下降,故B 正确;由图可知条形图由高到低居于前三位的城市为北京、深圳和广州,故C 正确;由图可知平均价格的涨幅由高到低分别为天津、西安和南京,故D 错误,选D.5.一个样本容量为10的样本数据,它们组成一个公差不为0的等差数列{a n },若a 3=8,且a 1,a 3,a 7成等比数列,则此样本的平均数和中位数分别是( )A.13,12B.13,13C.12,13D.13,14解析:选B 设等差数列{a n }的公差为d (d ≠0),a 3=8,a 1a 7=a 23=64,(8-2d )(8+4d )=64,即2d -d 2=0,又d ≠0,故d =2,故样本数据为:4,6,8,10,12,14,16,18,20,22,平均数为(4+22)×510=13,中位数为12+142=13.6.(2019·成都市第二次诊断性检测)为比较甲、乙两名篮球运动员的近期竞技状态,选取这两名球员最近五场比赛的得分,制成如图所示的茎叶图.有下列结论:①甲最近五场比赛得分的中位数高于乙最近五场比赛得分的中位数; ②甲最近五场比赛得分的平均数低于乙最近五场比赛得分的平均数;③从最近五场比赛的得分看,乙比甲更稳定; ④从最近五场比赛的得分看,甲比乙更稳定. 其中所有正确结论的编号为( ) A.①③ B.①④ C.②③D.②④解析:选C 对于①,甲得分的中位数为29,乙得分的中位数为30,错误; 对于②,甲得分的平均数为15×(25+28+29+31+32)=29,乙得分的平均数为15×(28+29+30+31+32)=30,正确;对于③,甲得分的方差为15×[(25-29)2+(28-29)2+(29-29)2+(31-29)2+(32-29)2]=15×(16+1+0+4+9)=6,乙得分的方差为15×[(28-30)2+(29-30)2+(30-30)2+(31-30)2+(32-30)2]=15×(4+1+0+1+4)=2,所以乙比甲更稳定,③正确,④错误.所以正确结论的编号为②③.二、填空题7.(2019·全国卷Ⅱ)我国高铁发展迅速,技术先进.经统计,在经停某站的高铁列车中,有10个车次的正点率为0.97,有20个车次的正点率为0.98,有10个车次的正点率为0.99,则经停该站高铁列车所有车次的平均正点率的估计值为________.解析:x =10×0.97+20×0.98+10×0.9910+20+10=0.98.则经停该站高铁列车所有车次的平均正点率的估计值为0.98. 答案:0.988.(2019·安徽五校联盟第二次质检)数据a 1,a 2,a 3,…,a n 的方差为σ2,则数据2a 1,2a 2,2a 3,…,2a n 的方差为________.解析:设a 1,a 2,a 3,…,a n 的平均数为a ,则2a 1,2a 2,2a 3,…,2a n 的平均数为2a , σ2=(a 1-a )2+(a 2-a )2+(a 3-a )2+…+(a n -a )2n.则2a 1,2a 2,2a 3,…,2a n 的方差为(2a 1-2a )2+(2a 2-2a )2+(2a 3-2a )2+…+(2a n -2a )2n=4×(a 1-a )2+(a 2-a )2+(a 3-a )2+…+(a n -a )2n=4σ2.答案:4σ29.某新闻媒体为了了解观众对央视《开门大吉》节目的喜爱与性别是否有关系,随机调查了观看该节目的观众110名,得到如下的列联表:试根据样本估计总体的思想,估计在犯错误的概率不超过________的前提下(约有________的把握)认为“喜爱该节目与否和性别有关”.参考附表:⎝ ⎛⎭⎪⎫参考公式:K 2=n (ad -bc )2(a +b )(c +d )(a +c )(b +d ),其中n =a +b +c +d解析:分析列联表中数据,可得K 2的观测值k =110×(40×30-20×20)260×50×60×50≈7.822>6.635,所以在犯错误的概率不超过0.01的前提下(有99%的把握)认为“喜爱该节目与否和性别有关”.答案:0.01 99% 三、解答题10.(2019·全国卷Ⅲ)为了解甲、乙两种离子在小鼠体内的残留程度,进行如下试验:将200只小鼠随机分成A ,B 两组,每组100只,其中A 组小鼠给服甲离子溶液,B 组小鼠给服乙离子溶液.每只小鼠给服的溶液体积相同、摩尔浓度相同.经过一段时间后用某种科学方法测算出残留在小鼠体内离子的百分比.根据试验数据分别得到如下直方图:记C 为事件:“乙离子残留在体内的百分比不低于5.5”,根据直方图得到P (C )的估计值为0.70.(1)求乙离子残留百分比直方图中a ,b 的值;(2)分别估计甲、乙离子残留百分比的平均值(同一组中的数据用该组区间的中点值为代表).解:(1)由已知得0.70=a +0.20+0.15,故a =0.35.b =1-0.05-0.15-0.70=0.10.(2)甲离子残留百分比的平均值的估计值为2×0.15+3×0.20+4×0.30+5×0.20+6×0.10+7×0.05=4.05, 乙离子残留百分比的平均值的估计值为3×0.05+4×0.10+5×0.15+6×0.35+7×0.20+8×0.15=6.00.11.某市教育学院从参加市级高中数学竞赛的考生中随机抽取60名学生,将其竞赛成绩(均为整数)分成六段:[40,50),[50,60),[60,70),…,[90,100],得到如图所示的频率分布直方图.(1)根据频率分布直方图,估计参加高中数学竞赛的考生的成绩的平均数、众数、中位数(小数点后保留一位有效数字);(2)用分层抽样的方法在各分数段的考生中抽取一个容量为20的样本,则各分数段抽取的人数分别是多少?解:(1)由频率分布直方图可知,(0.010+0.015+0.015+a +0.025+0.005)×10=1,所以a =0.03. 所以参加高中数学竞赛的考生的成绩的平均数为45×0.1+55×0.15+65×0.15+75×0.3+85×0.25+95×0.05=71, 成绩的众数为75.设参加高中数学竞赛的考生的成绩的中位数为x ,则0.1+0.15+0.15+(x -70)×0.03=0.5,解得x ≈73.3, 所以中位数为73.3.(2)因为各层人数分别为6,9,9,18,15,3,各层抽取比例为2060=13,所以各分数段抽取人数依次为2,3,3,6,5,1.12.(2019·沈阳市质量监测(一))某篮球运动员的投篮命中率为50%,他想提高自己的投篮水平,制定了一个夏季训练计划,为了了解训练效果,执行训练前,他统计了10场比赛的得分,计算出得分的中位数为15,平均得分为15,得分的方差为46.3.执行训练后也统计了10场比赛的得分,茎叶图如图所示:(1)请计算该篮球运动员执行训练后统计的10场比赛得分的中位数、平均得分与方差. (2)如果仅从执行训练前后统计的各10场比赛得分数据分析,你认为训练计划对该运动员的投篮水平的提高是否有帮助?为什么?解:(1)训练后得分的中位数为14+152=14.5;平均得分为8+9+12+14+14+15+16+18+21+2310=15;方差为110[(8-15)2+(9-15)2+(12-15)2+(14-15)2+(14-15)2+(15-15)2+(16-15)2+(18-15)2+(21-15)2+(23-15)2]=20.6.(2)尽管中位数训练后比训练前稍小,但平均得分一样,训练后方差20.6小于训练前方差46.3,说明训练后得分稳定性提高了(阐述观点合理即可),这是投篮水平提高的表现.故此训练计划对该篮球运动员的投篮水平的提高有帮助.B 组——大题专攻强化练1.(2019·武汉市调研测试)一个工厂在某年里连续10个月每月产品的总成本y (万元)与该月产量x (万件)之间有如下一组数据:(1)通过画散点图,发现可用线性回归模型拟合y 与x 的关系,请用相关系数加以说明. (2)①建立月总成本y 与月产量x 之间的回归方程;②通过建立的y 关于x 的回归方程,估计某月产量为1.98万件时,产品的总成本为多少万元?(均精确到0.001)附注:①参考数据:错误!i =27.31,∑i =110x 2i -10x 2≈0.850,∑i =110y 2i -10y 2≈1.042,b ^≈1.223. ②参考公式:相关系数回归直线y ^=a ^+b ^x 中斜率和截距的最小二乘估计公式分别为:解:(1)由已知条件得,r =b ^·∑i =110x 2i -10x 2∑i =110y 2i -10y 2,∴r =1.223×0.8501.042≈0.998,这说明y 与x 正相关,且相关性很强. (2)①由已知求得x =1.445,y =2.731, a ^=y -b ^x =2.731-1.223×1.445≈0.964,∴所求回归直线方程为y ^=1.223x +0.964.②当x =1.98时,y =1.223×1.98+0.964≈3.386(万元), 此时产品的总成本约为3.386万元.2.海水养殖场进行某水产品的新、旧网箱养殖方法的产量对比,收获时各随机抽取了100个网箱,测量各箱水产品的产量(单位:kg),其频率分布直方图如下:(1)估计旧养殖法的箱产量低于50kg的概率并估计新养殖法的箱产量的平均值;(2)填写下面的2×2列联表,并根据列联表判断是否有99%的把握认为箱产量与养殖方法有关.附:K2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d),其中n=a+b+c+d.解:(1)旧养殖法的箱产量低于50kg的频率为(0.012+0.014+0.024+0.034+0.040)×5=0.62,所以旧养殖法的箱产量低于50kg的概率估计值为0.62;新养殖法的箱产量的平均值为37.5×0.004×5+42.5×0.020×5+47.5×0.044×5+52.5×0.068×5+57.5×0.046×5+62.5×0.010×5+67.5×0.008×5=52.35.(2)根据箱产量的频率分布直方图得2×2列联表如下:由表中数据得K 2=200×(62×66-34×38)2100×100×96×104≈15.705,由于15.705>6.635,故有99%的把握认为箱产量与养殖方法有关.3.(2019·长沙市统一模拟考试)某互联网公司为了确定下一季度的前期广告投入计划,收集了近6个月广告投入量x (单位:万元)和收益y (单位:万元)的数据如下表:他们用两种模型①y =bx +a ,②y =a e bx分别进行拟合,得到相应的回归方程并进行残差分析,得到如图所示的残差图及一些统计量的值:(1)根据残差图,比较模型①,②的拟合效果,应选择哪个模型?并说明理由. (2)残差绝对值大于2的数据被认为是异常数据,需要剔除:(ⅰ)剔除异常数据后,求出(1)中所选模型的回归方程;(ⅱ)广告投入量x =18时,(1)中所选模型收益的预报值是多少?附:对于一组数据(x 1,y 1),(x 2,y 2),…,(x n ,y n ),其回归直线y ^=b ^x +a ^的斜率和截距的最小二乘估计分别为:解:(1)应该选择模型①,因为模型①的残差点比较均匀地落在水平的带状区域中,且模型①的带状区域比模型②的带状区域窄,所以模型①的拟合精度高,回归方程的预报精度高.(2)(ⅰ)剔除异常数据,即3月份的数据后,得x =15×(7×6-6)=7.2, y =15×(30×6-31.8)=29.64.(ⅱ)把x =18代入(ⅰ)中所求回归方程得y ^=3×18+8.04=62.04,故预报值为62.04万元.4.每年10月中上旬是小麦的最佳种植时间,但小麦的发芽会受到土壤、气候等多方面因素的影响.某科技兴趣小组为了解昼夜温差的大小与小麦发芽的多少之间的关系,在不同的温差下统计了100颗小麦种子的发芽数,得到了如下数据:(1)请根据统计的最后三组数据,求出y 关于x 的线性回归方程y ^=b ^x +a ^;(2)若由(1)中的线性回归方程得到的估计值与前两组数据的实际值误差均不超过两颗,则认为线性回归方程是可靠的,试判断(1)中得到的线性回归方程是否可靠;(3)若100颗小麦种子的发芽数为n 颗,则记n %的发芽率,当发芽率为n %时,平均每亩地的收益为10n 元,某农场有土地10万亩,小麦种植期间昼夜温差大约为9℃,根据(1)中得到的线性回归方程估计该农场种植小麦所获得的收益.附:在线性回归方程y ^=b ^x +a ^中,b ^=解:(1)∵x =11+13+123=12,y =85+90+863=87,∴b ^=11×85+13×90+12×86-3×12×87112+132+122-3×122=52, 由b ^x +a ^=y ,即52×12+a ^=87,得a ^=57,∴线性回归方程为y ^=52x +57.(2)当x =8时,y ^=52×8+57=77,与实际值79比较,误差没有超过两颗;当x =10时,y ^=52×10+57=82,与实际值81比较,误差也没有超过两颗.所以(1)中得到的线性回归方程y ^=52x +57是可靠的.(3)由y ^=52x +57得,当x =9时,y ^=79.5,即每亩地的收益大约为795元,所以该农场种植小麦所获得的收益大约为7950万元.第2讲 概 率[例1] (1)(2019·全国卷Ⅱ)生物实验室有5只兔子,其中只有3只测量过某项指标.若从这5只兔子中随机取出3只,则恰有2只测量过该指标的概率为( )A.23 B.35 C.25D.15(2)某教师让学生从3.1415926的小数点之后的七个数字1,4,1,5,9,2,6中随机选取两个数字,整数部分3不变,那么得到的数大于3.14的概率为( )A.2831B.1921C.2231D.1721[解析] (1)设5只兔子中测量过某项指标的3只为a 1,a 2,a 3,未测量过这项指标的2只为b 1,b 2,则从5只兔子中随机取出3只的所有可能情况为(a 1,a 2,a 3),(a 1,a 2,b 1),(a 1,a 2,b 2),(a 1,a 3,b 1),(a 1,a 3,b 2),(a 1,b 1,b 2),(a 2,a 3,b 1),(a 2,a 3,b 2),(a 2,b 1,b 2),(a 3,b 1,b 2),共10种可能.其中恰有2只测量过该指标的情况为(a 1,a 2,b 1),(a 1,a 2,b 2),(a 1,a 3,b 1),(a 1,a 3,b 2),(a 2,a 3,b 1),(a 2,a 3,b 2),共6种可能.故恰有2只测量过该指标的概率为610=35.故选B.(2)从1,4,1,5,9,2,6这7位数字中任选两位数字的不同情况有:14,11,15,19,12,16,41,45,49,42,46,59,52,56,92,96,26,51,91,21,61,54,94,24,64,95,25,65,29,69,62,共31种,其中使得到的数字不大于3.14的情况有3种,故所得到的数字大于3.14的概率P =1-331=2831.[答案] (1)B (2)A [解题方略]1.求古典概型概率的两个关键点(1)会利用枚举法、列表法等,求样本空间所含的基本事件数n 以及事件A 所含的基本事件数m ;(2)会运用古典概型的概率计算公式P (A )=m n求事件A 发生的概率. 2.互斥事件、对立事件概率的求法解决此类问题,首先应根据互斥事件和对立事件的定义分析出是不是互斥事件或对立事件,再选择概率公式进行计算.其方法有直接法和间接法.[跟踪训练]1.已知a ∈{-2,0,1,2,3},b ∈{3,5},则函数f (x )=(a 2-2)e x+b 为减函数的概率是( )A.310B.35C.25D.15解析:选C 函数f (x )=(a 2-2)e x+b 为减函数,则a 2-2<0,-2<a <2,且与b无关.又a ∈{-2,0,1,2,3},故只有a =0,a =1满足题意,所以函数f (x )=(a 2-2)e x+b 为减函数的概率是25.故选C.2.如图是由1个圆、1个三角形和1个长方形构成的组合体,现用红、蓝2种颜色为其涂色,每个图形只能涂1种颜色,则3个图形颜色不全相同的概率为________.解析:设事件M 为“3个图形颜色不全相同”,则其对立事件M 为“3个图形颜色全相同”,用红、蓝2种颜色为3个图形涂色,每个图形有2种选择,共有2×2×2=8种情况.其中颜色全部相同的有2种,即全部用红色或蓝色,所以P (M )=28=14,所以P (M )=1-P (M )=1-14=34.答案:343.某校拟从高二年级2名文科生和4名理科生中选出4名同学代表学校参加知识竞赛,其中每个人被选中的可能性均相等.(1)求被选中的4名同学中恰有2名文科生的概率; (2)求被选中的4名同学中至少有1名文科生的概率.解:将2名文科生和4名理科生依次编号为1,2,3,4,5,6,从2名文科生和4名理科生中选出4名同学记为(a ,b ,c ,d ),其结果有(1,2,3,4),(1,2,3,5),(1,2,3,6),(1,2,4,5),(1,2,4,6),(1,2,5,6),(1,3,4,5),(1,3,4,6),(1,3,5,6),(1,4,5,6),(2,3,4,5),(2,3,4,6),(2,3,5,6),(2,4,5,6),(3,4,5,6),共15种.(1)被选中的4名同学中恰有2名文科生的结果有(1,2,3,4),(1,2,3,5),(1,2,3,6),(1,2,4,5),(1,2,4,6),(1,2,5,6),共6种.记“被选中的4名同学中恰有2名文科生”为事件A , 则P (A )=615=25.(2)记“被选中的4名同学中至少有1名文科生”为事件B ,则事件B 包含有1名文科生或者2名文科生这两种情况.其对立事件为“被选中的4名同学中没有文科生”,只有一种结果(3,4,5,6).所以P (B )=115,所以P (B )=1-P (B )=1-115=1415.考点二几何概型[例2] (1)设集合A =⎩⎨⎧x ⎪⎪⎪⎭⎬⎫14<2x <16,B ={x |y =ln(x 2-3x )},从集合A 中任取一个元素,则这个元素也是集合B 中元素的概率是________.(2)(2019·江淮十校联考)七巧板是我国古代劳动人民的发明之一,被誉为“东方魔板”,它是由五块等腰直角三角形、一块小正方形和一块平行四边形共七块板组成的.如图是一个用七巧板拼成的大正方形,若在此正方形中任取一点,则此点取自阴影部分的概率为________.[解析] (1)因为集合A =⎩⎨⎧⎭⎬⎫x ⎪⎪⎪14<2x <16=(-2,4),B ={x |y =ln(x 2-3x )}=(-∞,0)∪(3,+∞),所以A ∩B ={x |3<x <4或-2<x <0},所以所求事件的概率是4-3+0+24+2=12.(2)设大正方形的边长为2,则该正方形的面积为4,阴影部分的面积为12×1×2+1×12=32,所以在大正方形中任取一点,此点取自阴影部分的概率为324=38. [答案] (1)12 (2)38[解题方略] 公式法求解几何概型的关键(1)定型,即判断事件的属性——等可能性与无限性,确定所求概率模型为几何概型. (2)定类,即确定所求事件的几何属性及其度量方式,确定其度量的类别——长度、角度、面积或体积等.(3)求量,根据平面几何、立体几何的相关知识求出基本事件空间Ω度量及事件A 的几何度量.(4)求值,把所求的两个几何度量值代入几何概型的计算公式求值.[跟踪训练]1.(2019·福建五校第二次联考)在区间[0,2]上随机取一个数x ,使sin π2x ≥32的概率为( )A.13B.12C.23D.34解析:选A 当x ∈[0,2]时,0≤π2x ≤π,所以sin π2x ≥32⇔π3≤π2x ≤2π3⇔23≤x≤43.故由几何概型的知识可知所求概率P =43-232=13.故选A. 2.(2019·湖南省五市十校联考)一只蚂蚁在三边长分别为6,8,10的三角形内自由爬行,某时刻该蚂蚁距离三角形的任意一个顶点的距离不超过1的概率为( )A.π24 B.π48C.112D.18解析:选 B 由题意,可得三角形为直角三角形,其面积为12×6×8=24,三角形内距离三角形的任意一个顶点的距离不大于1的区域如图中阴影部分所示,它的面积为半径为1的半圆面积,即S =12π×12=π2,所以所求概率P =π224=π48,故选B.3.已知在四棱锥P ­ABCD 中,PA ⊥底面ABCD ,底面ABCD 是正方形,PA =AB =2,现在该四棱锥内部或表面任取一点O ,则四棱锥O ­ABCD 的体积不小于23的概率为________.解析:当四棱锥O ­ABCD 的体积为23时,设O 到平面ABCD 的距离为h ,则有13×22×h =23,解得h =12.如图所示,在四棱锥P ­ABCD 内作平面EFGH 平行于底面ABCD ,且平面EFGH 与底面ABCD 的距离为12.因为PA ⊥底面ABCD ,且PA =2,所以PH PA =34,又四棱锥P ­ABCD 与四棱锥P ­EFGH 相似,所以四棱锥O ­ABCD 的体积不小于23的概率为P =V 四棱锥P ­EFGH V 四棱锥P ­ABCD =⎝ ⎛⎭⎪⎫PH PA 3=⎝ ⎛⎭⎪⎫343=2764.答案:2764。

2020届高考数学二轮复习(理)讲义及题型归纳(拔高):概率与统计

2020届高考数学二轮复习(理)讲义及题型归纳(拔高):概率与统计

概率与统计一、考纲解读1.理解取有限个值的离散型随机变量及其分布列的概念,了解分布列对于刻画随机现象的重要性。

2.理解超几何分布及其推导过程,并能进行简单的应用。

3.了解条件概率和两个事件相互独立的概念,理解次独立重复实验的模型及二n 项分布,并能解决一些简单的实际问题。

4.理解取有限个值的离散型变量均值,方差的概念,能计算简单离散型随机变量的均值、方差,并能解决一些实际问题。

5.利用实际问题的频率分布直方图,了解正态分布密度曲线的特点及曲线所表示的意义。

二、命题趋势探究1.高考命题中,该部分命题形式有选择题、填空题,但更多的是解答题。

2.主要以离散型随机变量分布列为主体命题,计算离散型随机变量的期望和方差,其中二项分布与超几何分布为重要考点,难度中等以下。

3.有关正态分布的考题多为一道小题。

三、知识点精讲(一).条件概率与独立事件(1)在事件A 发生的条件下,时间B 发生的概率叫做A 发生时B 发生的条件概率,记作 ,条件概率公式为 。

()P B A ()=P B A ()()P AB P A (2)若,即,称与为相互独立事件。

与()=P B A P B ()()=()()P AB P A P B A B A B 相互独立,即发生与否对的发生与否无影响,反之亦然。

即相互独立,A B ,A B 则有公式。

()=()()P AB P A P B(3)在次独立重复实验中,事件发生次的概率记作,记n A k ()0k n ≤≤()n P k A在其中一次实验中发生的概率为 ,则 .()P A p =()()1n k k k n n P k C p p -=-(二).离散型随机变量分布列、期望、方差及其性质(1)离散型随机变量的分布列(如表13-1所示).ξ表13-1ξ 1ξ 2ξ 3ξ… n ξ P 1p 2p 3pn p ① ;()11,i p i n i N θ*≤≤≤≤∈② .121n p p p ++= (2)表示的期望:,反应随机变量的平均水平,E ξξ1122=+n n p p p E ξξξξ++…若随机变量满足,则.ξη,=a b ηξ+E aE b ηξ=+(3)表示的方差:,反映随机D ξξ()()()2221122=---n n E p E p E p D ξξξξξξξ+++ 变量取值的波动性。

2020版高考数学二轮复习第二部分专题四概率与统计第1讲概率、离散型随机变量及其分布列课件

2020版高考数学二轮复习第二部分专题四概率与统计第1讲概率、离散型随机变量及其分布列课件
第二部分 高考热点 分层突破
专题四 概率与统计 第1讲 概率、离散型随机变量及其分布列
数学
01
做高考真题
明命题趋向
02
研考点考向
破重点难点
[做真题]
题型 古典概型与事件的相互独立性
1.(2019·高考全国卷Ⅰ)我国古代典籍《周易》用“卦”描述万物的变化.
每一“重卦”由从下到上排列的 6 个爻组成,爻分为阳爻“——”和阴爻
C.12
D.23
解析:选 B.4 名游客去三个景点,每个景点至少有一个人,可以先将其中 2 名游客“捆 绑在一起”作为“一个人”,再将“三个人”安排到三个景点去旅游,共有 C24A33=6×6 =36(种)方案.游客甲去梵净山旅游,若梵净山再没有其他 3 名游客去旅游,则有 C23A22 =3×2=6(种)方案,若“乙、丙、丁”中有 1 人也去了梵净山旅游,则有 C13A22=6(种) 方案,所以游客甲去梵净山旅游共有 12 种方案.所以游客甲去梵净山旅游的概率 P=1326 =13.故选 B.
中随机选取两个不同的数有 C210种不同的取法,这 10 个数中两个不同的数的和等于 30
的有 3 对,所以所求概率 P=C3210=115,故选 C.
3.(2019·高考全国卷Ⅰ)甲、乙两队进行篮球决赛,采取七场四胜制(当一队赢得四场胜 利时,该队获胜,决赛结束).根据前期比赛成绩,甲队的主客场安排依次为“主主客 客主客主”.设甲队主场取胜的概率为 0.6,客场取胜的概率为 0.5,且各场比赛结果 相互独立,则甲队以 4∶1 获胜的概率是________. 解析:记事件 M 为甲队以 4∶1 获胜,则甲队共比赛五场,且第五场甲队获胜,前四 场甲队胜三场负一场,所以 P(M)=0.6×(0.62×0.52×2+0.6×0.4×0.52×2)=0.18.
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

第1讲 概率、随机变量及其分布[做小题——激活思维]1.若随机变量X 的分布列如表所示,E (X )=1.6,则a -b =( )X 0 1 2 3 P0.1ab0.1A .0.2 C .0.8D .-0.8B [由0.1+a +b +0.1=1,得a +b =0.8,又由E (X )=0×0.1+1×a +2×b +3×0.1=1.6,得a +2b =1.3,解得a =0.3,b =0.5,则a -b =-0.2.]2.已知甲在上班途中要经过两个路口,在第一个路口遇到红灯的概率为0.5,两个路口连续遇到红灯的概率为0.4,则甲在第一个路口遇到红灯的条件下,第二个路口遇到红灯的概率为( )A .0.6B .0.7C .0.8D .0.9C [记“第一个路口遇到红灯”为事件A ,“第二个路口遇到红灯”为事件B ,则P (A )=0.5,P (AB )=0.4,则P (B |A )=P ABP A=0.8,故选C.]3.两个实习生每人加工一个零件,加工为一等品的概率分别为23和34,两个零件是否加工为一等品相互独立,则这两个零件中恰有一个一等品的概率为( )A.12B.512C.14D.16B [设事件A :甲实习生加工的零件为一等品;事件B :乙实习生加工的零件为一等品,且A ,B 相互独立,则P (A )=23,P (B )=34,所以这两个零件中恰有一个一等品的概率为P (A B )+P (A B )=P (A )P (B )+P (A )P (B )=23×⎝ ⎛⎭⎪⎫1-34+⎝⎛⎭⎪⎫1-23×34=512.]4.设随机变量X ~B (2,p ),Y ~B (4,p ),若P (X ≥1)=59,则P (Y ≥1)=( )A.12B.1681C.6581D .1C [∵X ~B (2,p ),∴P (X ≥1)=1-P (X =0)=1-C 02(1-p )2=59,解得p =13,∴P (Y ≥1)=1-P (Y =0)=1-C 04(1-p )4=1-1681=6581,故选C.]5.罐中有6个红球和4个白球,从中任取1球,记住颜色后再放回,连续取4次,设X 为取得红球的次数,则X 的方差D (X )的值为________.2425 [因为是有放回地取球,所以每次取球(试验)取得红球(成功)的概率均为35,连续取4次(做4次试验),X 为取得红球(成功)的次数,则X ~B ⎝ ⎛⎭⎪⎫4,35,∴D (X )=4×35×⎝ ⎛⎭⎪⎫1-35=2425.]6.已知某批零件的长度误差(单位:毫米)服从正态分布N (0,32),从中随机取一件,其长度误差落在区间(3,6)内的概率为________.(附:若随机变量X 服从正态分布N (μ,σ2),则P (μ-σ<X <μ+σ)=0.682 7,P (μ-2σ<X <μ+2σ)=0.954 5)0.135 9 [依题意设X ~N (0,32),其中μ=0,σ=3, ∴P (-3<X <3)=0.682 7,P (-6<X <6)=0.954 5.∴P (3<X <6)=12[P (-6<X <6)-P (-3<X <3)]=12×(0.954 5-0.682 7)=0.135 9.][扣要点——查缺补漏]1.离散型随机变量的分布列的两个性质 (1)p i ≥0 (i =1,2,…,n ); (2)p 1+p 2+…+p n =1.如T 1. 2.变量ξ的数学期望、方差 (1)E (ξ)=x 1p 1+x 2p 2+…+x n p n .如T 1.(2)D (ξ)=[x 1-E (ξ)]2·p 1+[x 2-E (ξ)]2·p 2+…+[x n -E (ξ)]2·p n ,标准差为D ξ.3.期望、方差的性质(1)E (aξ+b )=aE (ξ)+b ,D (aξ+b )=a 2D (ξ); (2)若ξ~B (n ,p ),则E (ξ)=np ,D (ξ)=np (1-p ). (3)X 服从两点分布,则E (ξ)=p ,D (ξ)=p (1-p ). 4.常见概率的求法(1)条件概率:在A 发生的条件下B 发生的概率P (B |A )=P ABP A,如T 2.(2)相互独立事件同时发生的概率:P (AB )=P (A )P (B ),如T 3.(3)在n 次独立重复试验中事件A 恰好发生k 次的概率:P (ξ=k )=C k n p k q n -k,(k =0,1,2,…,n ,q =1-p ),如T 4.(4)超几何分布:在含有M 件次品的N 件产品中,任取n 件,其中恰有X 件次品,则P (X =k )=C k M C n -kN -M C n N,k =0,1,2,…,m ,其中m =min{M ,n },且n ≤N ,M ≤N ,n ,M ,N ∈N *.(5)正态分布:若X ~N (μ,σ2),则正态曲线关于直线x =μ对称,常借助图象的对称性求随机变量落在某一范围内的概率,如T 6.[教师授课资源] [备考指导]新考纲把概率与统计作为数学思想提出来,必会重点考查,近几年的概率与统计高考题新颖灵活,并且作为压轴题出现,在备考中特别重视.[命题方向]①数据统计分析,通过观察分析计算数据,计算x ,s 2,E X 等来进行方案的选择,同时与概率、正态分布结合,来解决实际问题如控制生产线.②以频率分布直方图为载体,研究平均数x ,让x 近似等于正态分布N μ,σ2中的μ,进而考查3σ区间与二项分布结合,研究期望与方差.③以统计案例为载体,考查X 2,r 的同时,考查非线性回归问题,通过换元,取对数等手段,把非线性回归问题转化为线性回归问题,其中要通过数据的计算及灵活变通.④以新颖背景为载体,考查分类讨论,要进行多种情况下概率与统计的特征数的计算进行数据比较分析,进行方案的选择.⑤开放型题目,方案选择理由不唯一,会有多种角度回答,这种题型符合新考纲要求,同时增大阅读量与数字字母化,考查阅读转化能力.,本部分建议重点归类研究近几年全国卷高考题,研究考法与题型,进行总结归纳反思,从而开阔思路和视野,以不变应万变,提升分析问题能力.条件概率、相互独立事件及二项分布(5年5考)[高考解读] 高考对该点的考查可以单独考查也可以与概率统计综合考查,注重双基,属基础性题目.解答的关键是分清事件间的关系,套用相应概率公式求解.预测2020年命题风格不变.1.(2018·全国卷Ⅲ)某群体中的每位成员使用移动支付的概率都为p,各成员的支付方式相互独立.设X为该群体的10位成员中使用移动支付的人数,D(X)=2.4,P(X=4)<P(X =6),则p=( )A.0.7 B.0.6C.0.4 D.0.3B[由题意知,该群体的10位成员使用移动支付的人数X概率分布符合二项分布,所以D(X)=10p(1-p)=2.4,所以p=0.6或p=0.4.由P(X=4)<P(X=6),得C410p4(1-p)6<C610p6(1-p)4,即(1-p)2<p2,所以p>0.5,所以p=0.6.]2.(2019·全国卷Ⅱ)11分制乒乓球比赛,每赢一球得1分,当某局打成10∶10平后,每球交换发球权,先多得2分的一方获胜,该局比赛结束.甲、乙两位同学进行单打比赛,假设甲发球时甲得分的概率为0.5,乙发球时甲得分的概率为0.4,各球的结果相互独立,在某局双方10∶10平后,甲先发球,两人又打了X个球该局比赛结束.(1)求P(X=2);(2)求事件“X=4且甲获胜”的概率.[解](1)X=2就是10∶10平后,两人又打了2个球该局比赛结束,则这2个球均由甲得分,或者均由乙得分.因此P(X=2)=0.5×0.4+(1-0.5)×(1-0.4)=0.5.(2)X=4且甲获胜,就是某局双方10∶10平后,两人又打了4个球该局比赛结束,且这4个球的得分情况为:前两球是甲、乙各得1分,后两球均为甲得分.因此所求概率为[0.5×(1-0.4)+(1-0.5)×0.4]×0.5×0.4=0.1.[教师备选题]1.(2015·全国卷Ⅰ)投篮测试中,每人投3次,至少投中2次才能通过测试.已知某同学每次投篮投中的概率为0.6,且各次投篮是否投中相互独立,则该同学通过测试的概率为( )A.0.648 B.0.432C.0.36 D.0.312A[3次投篮投中2次的概率为P(k=2)=C23×0.62×(1-0.6),投中3次的概率为P(k =3)=0.63,所以通过测试的概率为P(k=2)+P(k=3)=C23×0.62×(1-0.6)+0.63=0.648.故选A.]2.(2014·全国卷Ⅱ)某地区空气质量监测资料表明,一天的空气质量为优良的概率是0.75,连续两天为优良的概率是0.6,已知某天的空气质量为优良,则随后一天的空气质量为优良的概率是( )A.0.8 B.0.75C.0.6 D.0.45A [根据条件概率公式,直接代入,可求得随后一天的空气质量为优良的概率. 已知连续两天为优良的概率是0.6,那么在前一天空气质量为优良的前提下,要求随后一天的空气质量为优良的概率,可根据条件概率公式,得P =0.60.75=0.8.]3.(2016·全国卷Ⅱ)某险种的基本保费为a (单位:元),继续购买该险种的投保人称为续保人,续保人本年度的保费与其上年度出险次数的关联如下:上年度出险次数1234≥5保 费 0.85a a 1.25a 1.5a 1.75a 2a设该险种一续保人一年内出险次数与相应概率如下: 一年内出险次数1234≥5概 率 0.30 0.15 0.20 0.20 0.10 0.05(1)求一续保人本年度的保费高于基本保费的概率;(2)若一续保人本年度的保费高于基本保费,求其保费比基本保费高出60%的概率; (3)求续保人本年度的平均保费与基本保费的比值.[解](1)设A 表示事件“一续保人本年度的保费高于基本保费”,则事件A 发生当且仅当一年内出险次数大于1,故P (A )=0.2+0.2+0.1+0.05=0.55.(2)设B 表示事件“一续保人本年度的保费比基本保费高出60%”,则事件B 发生当且仅当一年内出险次数大于3,故P (B )=0.1+0.05=0.15.又P (AB )=P (B ), 故P (B |A )=P AB P A =P B P A =0.150.55=311.因此所求概率为311.(3)记续保人本年度的保费为X 元,则X 的分布列为X 0.85a a 1.25a 1.5a 1.75a 2aP 0.30 0.15 0.20 0.20 0.10 0.051.23a .因此续保人本年度的平均保费与基本保费的比值为1.23.求相互独立事件和独立重复试验的概率的方法(1)直接法:利用相互独立事件的概率乘法公式直接求解.(2)间接法:当复杂事件正面情况比较多,反面情况较少,则可利用其对立事件进行求解.对于“至少”“至多”等问题往往也用这种方法求解.提醒:解决条件概率的关键是明确“既定条件”,即在“谁发生的条件下,求谁的概率”.1.(条件概率)(2019·长沙模拟)已知一种元件的使用寿命超过1年的概率为0.8,超过2年的概率为0.6,若一个这种元件使用到1年时还未损坏,则这个元件使用寿命超过2年的概率为( )A .0.75B .0.6C .0.52D .0.48A [设一个这种元件使用到1年时还未损坏为事件A ,使用到2年时还未损坏为事件B ,则由题意知P (AB )=0.6,P (A )=0.8,则这个元件使用寿命超过2年的概率为P (B |A )=P AB P A=0.60.8=0.75,故选A.] 2.(二项分布)某机械研究所对新研发的某批次机械元件进行寿命追踪调查,随机抽查的200个机械元件情况如下:使用时间/天10~20 21~30 31~40 41~50 51~60 个数1040805020命在30天以上的概率为( )A.1316B.2764C.2532D.2732D [由表可知元件使用寿命在30天以上的频率为80+50+20200=34,则所求概率为C 23·⎝ ⎛⎭⎪⎫342×14+C 33·⎝ ⎛⎭⎪⎫343=2732.] 3.(相互独立事件的概率)甲、乙、丙3位大学生同时应聘某个用人单位的职位,3人能被选中的概率分别为25,34,13,且各自能否被选中互不影响.则3人中至少有1人被选中的概率为________.910 [3人都未被选中的概率为P =⎝ ⎛⎭⎪⎫1-25×⎝ ⎛⎭⎪⎫1-34×⎝ ⎛⎭⎪⎫1-13=110,故3人中至少有1人被选中的概率为1-110=910.]随机变量的分布列、均值、方差(5年6考)[高考解读] 高考对该点的考查常以生产、生活实际为背景,考查考生从题干中提取信息建立数学模型,并应用期望或方差对实际问题作出决策的能力.预测2020年会加强对该点的考查.(2018·全国卷Ⅰ)某工厂的某种产品成箱包装,每箱200件,每一箱产品在交付用户之前要对产品作检验,如检验出不合格品,则更换为合格品.检验时,先从这箱产品中任取20件作检验,再根据检验结果决定是否对余下的所有产品作检验.设每件产品为不合格品的概率都为p (0<p <1),且各件产品是否为不合格品相互独立.(1)记20件产品中恰有2件不合格品的概率为f (p ),求f (p )的最大值点p 0;(2)现对一箱产品检验了20件,结果恰有2件不合格品,以(1)中确定的p 0作为p 的值.已知每件产品的检验费用为2元,若有不合格品进入用户手中,则工厂要对每件不合格品支付25元的赔偿费用.①若不对该箱余下的产品作检验,这一箱产品的检验费用与赔偿费用的和记为X ,求E (X );②以检验费用与赔偿费用和的期望值为决策依据,是否该对这箱余下的所有产品作检验?切入点:借助独立重复试验的概率公式建立概率函数f (p ),并用导数求f (p )的最大值点P 0.[解](1)20件产品中恰有2件不合格品的概率为f (p )=C 220p 2(1-p )18. 因此f ′(p )=C 220[2p (1-p )18-18p 2(1-p )17]=2C 220p (1-p )17(1-10p ).令f ′(p )=0,得p =0.1.当p ∈(0,0.1)时,f ′(p )>0;当p ∈(0.1,1)时,f ′(p )<0.所以f (p )的最大值点为p 0=0.1.(2)由(1)知,p =0.1.①令Y 表示余下的180件产品中的不合格品件数,依题意知Y ~B (180,0.1),X =20×2+25Y ,即X =40+25Y .所以E (X )=E (40+25Y )=40+25E (Y )=490.②如果对余下的产品作检验,则这一箱产品所需要的检验费为400元.由于E(X)>400,故应该对余下的产品作检验.[教师备选题](2016·全国卷Ⅰ)某公司计划购买2台机器,该种机器使用三年后即被淘汰.机器有一易损零件,在购进机器时,可以额外购买这种零件作为备件,每个200元.在机器使用期间,如果备件不足再购买,则每个500元.现需决策在购买机器时应同时购买几个易损零件,为此搜集并整理了100台这种机器在三年使用期内更换的易损零件数,得下面柱状图:以这100台机器更换的易损零件数的频率代替1台机器更换的易损零件数发生的概率,记X表示2台机器三年内共需更换的易损零件数,n表示购买2台机器的同时购买的易损零件数.(1)求X的分布列;(2)若要求P(X≤n)≥0.5,确定n的最小值;(3)以购买易损零件所需费用的期望值为决策依据,在n=19与n=20之中选其一,应选用哪个?[解](1)由柱状图并以频率代替概率可得,一台机器在三年内需更换的易损零件数为8,9,10,11的概率分别为0.2,0.4,0.2,0.2.从而P(X=16)=0.2×0.2=0.04;P(X=17)=2×0.2×0.4=0.16;P(X=18)=2×0.2×0.2+0.4×0.4=0.24;P(X=19)=2×0.2×0.2+2×0.4×0.2=0.24;P(X=20)=2×0.2×0.4+0.2×0.2=0.2;P(X=21)=2×0.2×0.2=0.08;P(X=22)=0.2×0.2=0.04.所以X的分布列为X 16171819202122 P 0.040.160.240.240.20.080.04故n的最小值为19.(3)记Y表示2台机器在购买易损零件上所需的费用(单位:元).当n=19时,E(Y)=19×200×0.68+(19×200+500)×0.2+(19×200+2×500)×0.08+(19×200+3×500)×0.04=4 040;当n=20时,E(Y)=20×200×0.88+(20×200+500)×0.08+(20×200+2×500)×0.04=4 080.可知当n=19时所需费用的期望值小于当n=20时所需费用的期望值,故应选n=19.解决分布列、期望、方差问题的3关(1)判断关:即依据题意判断随机变量的取值及判断所求分布列的类型.(2)概率关:即依据事件间的相互关系,结合相应的概率公式求出每个随机变量取值的概率.(3)决策关:即借助分布列,计算随机变量的数学期望,并结合实际问题作出合理决策.1.(以统计图表为背景)随着移动互联网的发展,与餐饮美食相关的手机A PP软件层出不穷.为调查某款订餐软件的商家的服务情况,统计了10次订餐“送达时间”(时间:分钟),得到茎叶图如下:(1)请计算“送达时间”的平均数与方差;(2)根据茎叶图,求A,B,C,D的值;送达时间35分钟以内(包括35分钟) 超过35分钟频数 A B频率 C D(包括35分钟)收到餐品的人数X的分布列,并求出数学期望.[解](1)“送达时间”的平均数为28+29+32+34+34+35+36+38+41+43=35(分钟),10方差为-72+-62+-32+-12+-12+02+12+32+62+8210=20.6.(2)A =6,B =4,C =0.6,D =0.4.(3)由已知,人数X 的可能取值为0,1,2,3,P (X =0)=C 03×0.60×0.43=0.064; P (X =1)=C 13×0.61×0.42=0.288; P (X =2)=C 23×0.62×0.41=0.432; P (X =3)=C 33×0.63×0.40=0.216.所以随机变量X 的分布列为X 服从二项分布E (X )=3×0.6=1.8.2.(函数与概率统计的交汇)某医院为筛查某种疾病,需要检验血液是否为阳性,现有n (n ∈N *)份血液样本,有以下两种检验方式:(1)逐份检验,则需要检验n 次;(2)混合检验,将其中k (k ∈N *且k ≥2)份血液样本分别取样混合在一起检验.若检验结果为阴性,这k 份血液全为阴性,因而这k 份血液样本只要检验一次就够了,如果检验结果为阳性,为了明确这k 份血液究竟哪几份为阳性,就要对这k 份再逐份检验,此时这k 份血液的检验次数总共为k +1次.假设在接受检验的血液样本中,每份样本的检验结果是阳性还是阴性都是独立的,且每份样本是阳性结果的概率为p (0<p <1).(1)假设有5份血液样本,其中只有2份样本为阳性,若采用逐份检验方式,求恰好经过4次检验就能把阳性样本全部检验出来的概率;(2)现取其中k (k ∈N *且k ≥2)份血液样本,记采用逐份检验方式,样本需要检验的总次数为ξ1,采用混合检验方式,样本需要检验的总次数为ξ2.①试运用概率统计的知识,若Eξ1=Eξ2,试求p 关于k 的函数关系式p =f (k ); ②若p =1-13e,采用混合检验方式可以使得样本需要检验的总次数的期望值比逐份检验的总次数期望值更少,求k 的最大值.参考数据:ln 2≈0.693 1,ln 3≈1.098 6,ln 4≈1.386 3,ln 5≈1.609 4,ln 6≈1.791 8.[解](1)p =C 12C 13A 23A 22A 55=35.∴恰好经过4次检验就能把阳性样本全部检验出来的概率为35.(2)①由已知得Eξ1=k ,ξ2的所有可能取值为1,k +1.∴P (ξ2=1)=(1-p )k ,P (ξ2=k +1)=1-(1-p )k, ∴Eξ2=(1-p )k+(k +1)[1-(1-p )k]=k +1-k (1-p )k.若Eξ1=Eξ2,则k =k +1-k (1-p )k,∴k (1-p )k=1,(1-p )k=1k,∴1-p =⎝ ⎛⎭⎪⎫1k 1k,∴p=1-⎝ ⎛⎭⎪⎫1k 1k.∴p 关于k 的函数关系式p =1-⎝ ⎛⎭⎪⎫1k 1k(k ∈N *且k ≥2).②由题意可知Eξ2<Eξ1,得1k<(1-p )k,∵p =1-13e,∴1k <⎝ ⎛⎭⎪⎪⎫13e k ,∴ln k >13k ,设f (x )=ln x -13x (x >0) ,则f ′(x )=3-x3x,∴当x >3时,f ′(x )<0,即f (x )在(3,+∞)上单调递减, 又ln 4≈1.386 3, 43≈1.333 3,∴ln 4>43,∵ln 5≈1.609 4,53≈1.666 7,∴ln 5<53.∴k 的最大值为4.样本的均值、方差与正态分布的综合(5年2考)[高考解读] 正态分布可与二项分布、控制生产线结合,很受命题者的青睐,主要考查3σ区间与对称性;考查正态分布的题目,要重视题后数据的利用,题后数据作用:①提供方向(计算)与目标;②切勿掉入题后数据误导的陷阱.(2017·全国卷Ⅰ)为了监控某种零件的一条生产线的生产过程,检验员每天从该生产线上随机抽取16个零件,并测量其尺寸(单位:cm).根据长期生产经验,可以认为这条生产线正常状态下生产的零件的尺寸服从正态分布N (μ,σ2).(1)假设生产状态正常,记X 表示一天内抽取的16个零件中其尺寸在(μ-3σ,μ+3σ)之外的零件数,求P (X ≥1)及X 的数学期望;(2)一天内抽检零件中,如果出现了尺寸在(μ-3σ,μ+3σ)之外的零件,就认为这条生产线在这一天的生产过程可能出现了异常情况,需对当天的生产过程进行检查.①试说明上述监控生产过程方法的合理性; ②下面是检验员在一天内抽取的16个零件的尺寸: 9.95 10.12 9.96 9.96 10.01 9.92 9.98 10.04 10.26 9.91 10.13 10.02 9.22 10.04 10.05 9.95经计算得=,其中x i 为抽取的第i 个零件的尺寸,i =1,2, (16)用样本平均数x 作为μ的估计值μ^,用样本标准差s 作为σ的估计值σ^,利用估计值判断是否需对当天的生产过程进行检查?剔除(μ^-3σ^,μ^+3σ^)之外的数据,用剩下的数据估计μ和σ(精确到0.01).附:若随机变量Z 服从正态分布N (μ,σ2),则P (μ-3σ<Z <μ+3σ)=0.997 4,0.997 416≈0.959 2,0.008≈0.09.[解](1)抽取的一个零件的尺寸在(μ-3σ,μ+3σ)之内的概率为0.997 4,从而零件的尺寸在(μ-3σ,μ+3σ)之外的概率为0.002 6,故X ~B (16,0.002 6).因此P (X ≥1)=1-P (X =0)=1-0.997 416≈0.040 8.X 的数学期望E (X )=16×0.002 6=0.041 6.(2)①如果生产状态正常,一个零件尺寸在(μ-3σ,μ+3σ)之外的概率只有0.002 6,一天内抽取的16个零件中,出现尺寸在(μ-3σ,μ+3σ)之外的零件的概率只有0.040 8,发生的概率很小,因此一旦发生这种情况,就有理由认为这条生产线在这一天的生产过程可能出现了异常情况,需对当天的生产过程进行检查,可见上述监控生产过程的方法是合理的.②由x =9.97,s ≈0.212,得μ的估计值为μ^=9.97,σ的估计值为σ^=0.212,由样本数据可以看出有一个零件的尺寸在(μ^-3σ^,μ^+3σ^)之外,因此需对当天的生产过程进行检查.剔除(μ^-3σ^,μ^+3σ^)之外的数据9.22,剩下数据的平均数为115×(16×9.97-9.22)=10.02.因此μ的估计值为10.02.x 2i =16×0.2122+16×9.972≈1 591.134,剔除(μ^-3σ^,μ^+3σ^)之外的数据9.22,剩下数据的样本方差为115×(1 591.134-9.222-15×10.022)≈0.008,因此σ的估计值为0.008≈0.09. [教师备选题](2014·全国卷Ⅰ)从某企业生产的某种产品中抽取500件,测量这些产品的一项质量指标值,由测量结果得如下频率分布直方图:(1)求这500件产品质量指标值的样本平均数x -和样本方差s 2(同一组中的数据用该组区间的中点值作代表);(2)由直方图可以认为,这种产品的质量指标值Z 服从正态分布N (μ,σ2),其中μ近似为样本平均数x -,σ2近似为样本方差s 2.①利用该正态分布,求P (187.8<Z <212.2);②某用户从该企业购买了100件这种产品,记X 表示这100件产品中质量指标值位于区间(187.8,212.2)的产品件数,利用①的结果,求E (X ).附:150≈12.2.若Z ~N (μ,σ2),则P (μ-σ<Z <μ+σ)=0.682 6,P (μ-2σ<Z <μ+2σ)=0.954 4. [解](1)抽取产品的质量指标值的样本平均数x -和样本方差s 2分别为 x -=170×0.02+180×0.09+190×0.22+200×0.33+210×0.24+220×0.08+230×0.02=200,s 2=(-30)2×0.02+(-20)2×0.09+(-10)2×0.22+0×0.33+102×0.24+202×0.08+302×0.02=150.(2)①由(1)知,Z ~N (200,150),从而P (187.8<Z <212.2)=P (200-12.2<Z <200+12.2)=0.682 6.②由①知,一件产品的质量指标值位于区间(187.8,212.2)的概率为0.682 6,依题意知X ~B (100,0.682 6),所以E (X )=100×0.682 6=68.26.解决正态分布问题有4个关键点(1)对称轴x=μ;(2)标准差σ;(3)分布区间.利用对称性求指定范围内的概率值,由μ,σ分布区间的特征进行转化,使分布区间转化为3σ特殊区间,从而求出所求概率;(4)曲线与x轴之间面积为1.(与频率分布直方图交汇)某质检部门从某烤鳗鱼有限公司生产的某批次的烤鳗鱼中随机抽取200箱,检测这些产品的某项质量指标值(记为Z),由检测结果得到如下图所示的频率分布直方图.(1)质检部门规定,当Z≥95时,产品为合格品;当Z<95时,产品为不合格品.该公司每生产一箱这种产品,若是合格品,则盈利90元;若是不合格品,则亏损30元.记Y为生产一箱这种产品的利润,求Y的分布列和E(Y);(2)由频率分布直方图可以认为,Z服从正态分布N(μ,σ2),其中μ近似为样本平均数x,σ2近似为样本方差s2(同一组中的数据用所在区间的中点值作代表).①利用该正态分布,求P(75.6<Z≤124.4);②某客户从该公司购买了500箱这种产品,记X表示这500箱产品中该质量指标值位于(75.6,124.4)上的产品箱数,利用①的结果,求X的期望与方差.附:150≈12.2,若Z~N(μ,σ2),则P(μ-σ<Z≤μ+σ)≈0.682 7,P(μ-2σ<Z≤μ+2σ)≈0.954 5,P(μ-3σ<Z≤μ+3σ)≈0.997 3.[解](1)由频率估计概率,产品为合格品的概率为(0.033+0.024+0.008+0.002)×10=0.67,为不合格品的概率为1-0.67=0.33.所以随机变量Y的分布列为Y 90-30P 0.670.33所以E(Y)=90×0.67+(-30)×0.33=50.4.(2)由频率分布直方图知,抽取产品的质量指标值的样本平均数x和样本方差s2分别为x=70×0.02+80×0.09+90×0.22+100×0.33+110×0.24+120×0.08+130×0.02=100,s2=(-30)2×0.02+(-20)2×0.09+(-10)2×0.22+02×0.33+102×0.24+202×0.08+302×0.02=150,所以Z~N(100,150).①因为Z~N(100,150),所以P(75.6<Z≤124.4)=P(100-12.2×2<Z≤100+12.2×2)≈0.954 5.②由①可知,一箱产品中该质量指标值位于(75.6,124.4)上的概率为0.954 5,依题意知X~B(500,0.954 5),所以E(X)=500×0.954 5=477.25,D(X)=500×0.954 5×(1-0.954 5)≈21.7.。

相关文档
最新文档