知识讲解-高考总复习:统计与统计案例

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

高考总复习:统计与统计案例
【考纲要求】
〔1〕理解随机抽样的必要性和重要性;
〔2〕会用简单随机抽样方法从总体中抽取样本;了解分层抽样和系统抽样方法. 2.用样本估计总体
〔1〕了解分布的意义和作用,会列频率分布表,会画频率分布直方图、频率折线图、茎叶图,理解它们各自的特点.
〔2〕理解样本数据标准差的意义和作用,会计算数据标准差.
〔3〕能从样本数据中提取基本的数字特征〔如平均数、标准差〕,并作出合理的解释.
〔4〕会用样本的频率分布估计总体分布,会用样本的基本数字特征估计总体的基本数字特征,理解用样本估计总体的思想.
〔5〕会用随机抽样的基本方法和样本估计总体的思想,解决一些简单的实际问题. 3.变量的相关性
〔1〕会作两个有关联变量数据的散点图,会利用散点图认识变量间的相关关系;
〔2〕了解最小二乘法的思想,能根据给出的线性回归方程系数公式建立线性回归方程〔线性回归方程系数公式不要求记忆〕. 【知识网络】
【考点梳理】
考点一、随机抽样
从调查的对象中按照一定的方法抽取一部分,进行调查或观测,获取数据,并以此对调查对象的某项
统计图表
用样本估计总体
统计
简单随机抽样
数据的整 理分析
数据的数字特征 分层抽样
系统抽样
变量的相关性
指标做出推断,这就是抽样调查.调查对象的全体称为总体,被抽取的一部分称为样本.
1.简单的随机抽样 简单随机抽样的概念:
设一个总体的个体数为N .如果通过逐个抽取的方法从中抽取一个样本,且每次抽取时各个个体被抽到的概率相等,就称这样的抽样为简单随机抽样.
① 用简单随机抽样从含有N 个个体的总体中抽取一个容量为n 的样本时,每次抽取一个个体时,任一个体被抽到的概率为
1N
;在整个抽样过程中各个个体被抽到的概率为
n N

②简单随机抽样的特点是:不放回抽样,逐个地进行抽取,各个个体被抽到的概率相等; ③简单随机抽样方法表达了抽样的客观性与公平性,是其他更复杂抽样方法的基础. 简单抽样常用方法:
①抽签法:先将总体中的所有个体(共有N 个)编号(号码可从1到N),并把号码写在形状、大小相同的号签上(号签可用小球、卡片、纸条等制作),然后将这些号签放在同一个箱子里,进行均匀搅拌,抽签时每次从中抽一个号签,连续抽取n 次,就得到一个容量为n 的样本.
适用范围:总体的个体数不多.
优点:抽签法简便易行,当总体的个体数不太多时适宜采用抽签法.
②随机数表法:随机数表抽样“三步曲”:第一步,将总体中的个体编号;第二步,选定开始的数字;第三步,获取样本号码.
2.系统抽样:
当总体中的个体数较多时,可将总体分成均衡的几个部分,然后按预先制定出的规则,从每一部分抽取一个个体,得到需要的样本,这种抽样叫做系统抽样.
系统抽样的步骤:
①采用随机的方式将总体中的个体编号,为简便起见,有时可直接采用个体所带有的号码,如考生的准考证号、街道上各户的门牌号等等.
②为将整个的编号分段 (即分成几个部分),要确定分段的间隔k .当N
n
是整数时(N 为总体中的个体的个数,n 为样本容量),N k n =
;当N
n 不是整数时,通过从总体中剔除一些个体使剩下的总体中个体的个数'N 能被n 整除,这时'
N k n
=.
③在第一段用简单随机抽样确定起始的个体编号l .
④按照事先确定的规则抽取样本(通常是将l 加上间隔k ,得到第2个编号l k +,第3个编号2l k +,这样继续下去,直到获取整个样本).
要点诠释:
①系统抽样适用于总体中的个体数较多的情况,它与简单随机抽样的联系在于:将总体均分后的每一部分进行抽样时,采用的是简单随机抽样;
②与简单随机抽样一样,系统抽样是等概率抽样,它是客观的、公平的
③总体中的个体数恰好能被样本容量整除时,可用它们的比值作为系统抽样的间隔;当总体中的个体数不能被样本容量整除时,可用简单随机抽样先从总体中剔除少量个体,使剩下的个体数能被样本容量整除再进行系统抽样.
3.分层抽样:
当已知总体由差异明显的几部分组成时,为了使样本更充分地反映总体的情况,常将总体分成几部分,然后按照各部分所占的比例进行抽样,这种抽样叫做分层抽样,所分成的部分叫做层.
4.常用的三种抽样方法的比较:
要点诠释:
〔1〕各种抽样的个体被抽到的概率相等;
〔2〕抽样过程中个体被抽到的概率相等.
5.不放回抽样和放回抽样:
在抽样中,如果每次抽出个体后不再将它放回总体,称这样的抽样为不放回抽样;如果每次抽出个体后再将它放回总体,称这样的抽样为放回抽样
随机抽样、系统抽样、分层抽样都是不放回抽样
考点二、用样本估计总体
1. 统计图表包括条形图、折线图、饼图、茎叶图.
2.作频率分布直方图的步骤
(1)求极差(即一组数据中最大值与最小值的差)
(2)决定组距与组数
(3)将数据分组
(4)列频率分布表
(5)画频率分布表
3.频率分布折线图和总体密度曲线
(1)频率分布折线图:连接频率分布直方图中各小长方形上端的中点,就得频率分布折线图
(2)总体密度曲线:随着样本容量的增加,作图所分的组数增加,组距减小,相应的频率折线图会越来越接近于一条光滑曲线,即总体密度曲线
4.标准差和方差
(1)标准差是样本数据到平均数的一种平均距离,s =(2)方差: 2
222121
[()()...()]n s x x x x x x n
=-+-++- (n x 是样本数据,n 是样本容量,x 是样本平均数)
要点诠释:现实中的总体所包含个体数往往是很多的,如何求得总体的平均数和标准差呢?(通常的做法是用样本的平均数和标准差去估计总体的平均数与标准差,这与有样本的频率分布近似代替总体分布是类似的,只要样本的代表性好,这样做就是合理的,也是可以接受的.)
5.利用频率分布直方图估计样本的数字特征
(1)中位数:在频率分布直方图中,中位数左边和右边的直方图的面积应该相等,由此可以估计中位数的值
(2)平均数:平均数的估计值等于频率分布直方图中每个小矩形的面积乘以小矩形底边中点的横坐标之和
(3)众数:在频率分布直方图中,众数是最高的矩形的中点的横坐标 6. 频率分布直方图反映样本的频率分布 (1)频率分布直方图中横坐标表示组距,纵坐标表示
组距频率,频率=组距×组距
频率
(2)频率分布直方图中各小长方形的面积之和为1,因此在频率分布直方图中组距是一个固定值,所以各小长方形高的比也就是频率比.
(3)频率分布表和频率分布直方图是一组数据频率分布的两种形式,前者准确,后者直观. (4)众数为最高矩形中点的横坐标.
(5)中位数为平分频率分布直方图面积且垂直于横轴的直线与横轴交点的横坐标. 考点三、变量的相关性 1. 散点图
将两个变量所对应的点描在直角坐标系中,这些点组成了变量之间的一个图,称为变量之间的散点图.散点图形象地反映了各对数据的密切程度.粗略地看,散点分布具有一定的规律.
如果变量之间存在某种关系,这些点会有一个集中趋势,这种趋势通常可以用一条光滑的曲线来近似表示,这样近似的过程称为曲线拟合.
2.两个变量的线性相关
〔1〕相关关系:当自变量一定时,因变量的取值带有一定的随机性的两个变量之间的关系称为相关关系.
(2)正相关
在散点图中,点散布在从左下角到右上角的区域.对于两个变量的这种相关关系,我们将它称为正相关.
(3)负相关
在散点图中,点散布在从左上角到右下角的区域,两个变量的这种相关关系称为负相关. (4)线性相关关系、回归直线
如果散点图中点的分布从整体上看大致在一条直线附近,就称这两个变量之间具有线性相关关系,这条直线叫做回归直线.
3.回归方程 (1)最小二乘法
求回归直线使得样本数据的点到回归直线的距离的平方和最小的方法叫做最小二乘法. (2)回归方程
方程y bx a =+是两个具有线性相关关系的变量的一组数据1122(,),(,),(,),n n x y x y x y 的回归方程,
期中,a b 是待定参数.
1
1
22
211
()()()n
n
i i i i
i i n n
i i
i i x x y y x y
nxy b x x x
nx a y bx
====⎧
---⎪
⎪==⎪⎨--⎪⎪=-⎪⎩∑∑∑∑
要点诠释:
相关关系与函数关系的异同点: 相同点:两者均是指两个变量的关系.
不同点:①函数关系是一种确定的关系,相关关系是一种非确定的关系; ②函数关系是一种因果关系,而相关关系不一定是因果关系,也可能是伴随关系. 考点四、统计案例
(1)定义:对具有相关关系的两个变量进行统计分析的一种常用方法;
(2)随机误差:线性回归模型用y bx a e =++表示,其中a,b 为模型的未知数,e 称为随机误差. (3)样本点的中心在具有线性相关关系的数据1122(,),(,),(,),n n x y x y x y 中回归方程的截距和斜率的
最小二乘估计公式分别为:
1
2
1
()()
,=-()n
i
i i n
i
i x
x y y b a y bx x
x ==--=
-∑∑
其中11
1,
=,(,,)n
n
i i i i x x y x x y n ===∑∑称为样本点的中心.
(4)相关系数
①()()
n
i
i x
x y y r --=
∑②当>0r 时,说明两个变量正相关; 当<0r 时,说明两个变量负相关.
r r 大于0.75时,认为两个变量有很强的线性相关性.
(1)总偏差平方和
把每个效应(观测值减去总的平均值)的平方加起来即:21
()n
i
i y
y =-∑
(2)残差
数据点和它回归直线上相应位置的差异2()i i y y -是随机误差的效应,称=i i i e y y -为残差. (3)残差平方和
21
()n
i
i i y
y =-∑.
(4)相关指数2
2
1
2
1
()()n
i
i i n i
i y
y R y
y ==-=
-∑∑
2R 的值越大,说明残差平方和越小,也就是说模型的拟合效果越好.在线性回归模型中, 2R 表示解释变
量对预报变量变化的奉献率, 2
R 越接近于1,表示回归的效果越好.
3.独立性检验
(1)分类变量:变量的不同“值”表示个体所属的不同类别,像这类变量称为分类变量.
(2)列联表:列出两个分类变量的频数表,称为列联表.假设有两个分类变量X 和Y,它们的可能取值分别为1122{,}{,}x y x y 和,其样本频数列联表(称为2×2列联表)为
2×2列联表
1y 2y
总计
1x
a b a b + 2x
c
d c d + 总计
a c +
b d +
a b c d +++
构造一个随机变量2
2
()()()()()
n ad bc K a b c d a c b d -=++++,其中a b c d +++为样本容量.
(3)独立性检验
利用随机变量2
K 来确定是否能以一定把握认为“两个分类变量有关系”的方法称为两个分类变量的独立性检验.
注: 在独立性检验中经常由2
K 得到观测值k ,则k =2
K 是否成立?〔2
K 与k 的关系并不是k =2
K ,k 是2
K 的观测值,或者说2
K 是一个随机变量,它在a ,b ,c ,d 〕取不同值时,2
K 可能不同,而k 是取定一组数a ,b ,c ,d 后的一个确定的值. 【典型例题】
类型一、简单随机抽样
【例1】某车间工人加工一种轴100件,为了了解这种轴的直径,要从中抽取10件轴在同一条件下测量,如何采用简单随机抽样的方法抽取样本?
【思路点拨】简单随机抽样一般采用两种方法:抽签法和随机数表法.
【解析】解法1:〔抽签法〕将100件轴编号为1,2,…,100,并做好大小、形状相同的号签,分别写上这100个数,将这些号签放在一起,进行均匀搅拌,接着连续抽取10个号签,然后测量这个10个号签对应的轴的直径.
解法2:〔随机数表法〕将100件轴编号为00,01,…99,在随机数表中选定一个起始位置,如取第21行第1个数开始,选取10个为68,34,30,13,70,55,74,77,40,44,这10件即为所要抽取的
样本.
【总结升华】从以上两种方法可以看出,当总体个数较少时用两种方法都可以,当样本总数较多时,方法2优于方法1.
举一反三:
【变式】某大学为了支持奥运会,从报名的24名大三的学生中选6人组成志愿小组,请用抽签法和随机数表法设计抽样方案.
【思路点拨】(1)总体的个体数较少,利用抽签法或随机数表法可容易获取样本;
(2)抽签法的操作要点:编号、制签、搅匀、抽取;
(3)随机数表法的操作要点:编号、选起始数、读数、获取样本.
【解析】抽签法
第一步:将24名志愿者编号,编号为1,2,3, (24)
第二步:将24个号码分别写在24张外形完全相同的纸条上,并揉成团,制成号签;
第三步:将24个号签放入一个不透明的盒子中,充分搅匀;[来源:]
第四步:从盒子中逐个抽取6个号签,并记录上面的编号;
第五步:所得号码对应的志愿者,就是志愿小组的成员.
随机数表法
第一步:将24名学生编号,编号为01,02,03,……24;
第二步:在随机数表中任选一数开始,按某一确定方向读数;
第三步:凡不在01~24中的数或已读过的数,都跳过去不作记录,依次记录下得数;
第四步:找出号码与记录的数相同的学生组成志愿小组.
类型二、系统抽样
【例2】某校高中三年级的295名学生已经编号为1,2,……,295,为了了解学生的学习情况,要按1:5的比例抽取一个样本,用系统抽样的方法进行抽取,并写出过程.
【思路点拨】按1:5分段,每段5人,共分59段,每段抽取一人,关键是确定第1段的编号.
【解析】按照1:5的比例,应该抽取的样本容量为295÷5=59,我们把259名同学分成59组,每组5人,第一组是编号为1~5的5名学生,第2组是编号为6~10的5名学生,依次下去,59组是编号为291~295的5名学生.采用简单随机抽样的方法,从第一组5名学生中抽出一名学生,不妨设编号为k(1≤k≤5),那么抽取的学生编号为k+5L(L=0,1,2,……,58),得到59个个体作为样本,如当k=3时的样本编号为3,8,13,……,288,293.
【总结升华】系统抽样可按事先规定的规则抽取样本. 此题采用的规则是第一组随机抽取的学生编号为k,那么第m组抽取的学生编号为k+5(m-1).
举一反三:
【变式】一个总体中有100个个体,随机编号为0,1,2,…,99,依编号顺序平均分成10个小组,组号依次为l ,2,3,…,10.现用系统抽样方法抽取一个容量为10的样本,规定如果在第1组随机抽取的号码为m ,那么在第最小组中抽取的号码个位数字与m+k 的个位数字相同.假设m=6,则在第7组中抽取的号码是 .
【答案】∵6m =,7k =,∴13m k += ∴在第7小组中抽取的号码是63. 类型三、分层抽样
【例3】某公司在甲、乙、丙、丁四个地区分别有150个、120个、180个、150个销售点.公司为了调查产品销售的情况,需从这600个销售点中抽取一个容量为100的样本,记这项调查为①;在丙地区中有20个特大型销售点,要从中抽取7个调查其销售收入和售后服务情况,记这项调查为②.则完成①、②这两项调查宜采用的抽样方法依次是( )
A .分层抽样法,系统抽样法
B .分层抽样法,简单随机抽样法
C .系统抽样法,分层抽样法
D .简单随机抽样法,分层抽样法
【思路点拨】此题为抽样方法的选取问题.当总体中个体较多而且差异又不大时宜采用系统抽样,采用系统抽样在每小组内抽取时应按规则进行;当总体中的个体差异较大时,宜采用分层抽样;当总体中个体较少时,宜采用随机抽样.
【解析】依据题意,第①项调查应采用分层抽样l 法、第②项调查应采用简单随机抽样法.故选B . 【总结升华】采用什么样的抽样方法要依据研究的总体中的个体情况来定. 举一反三:
【变式】甲校有3600名学生,乙校有5400名学生,丙校有1800名学生,为统计三校学生某方面的情况,计划采用分层抽样法,抽取一个样本容量为90人的样本,应在这三校分别抽取学生〔 〕
A.30人,30人,30人
B.30人,45人,15人
C.20人,30人,10人
D.30人,50人,10人
【答案】B ;根据样本容量和总体容量确定抽样比,最终得到每层中学生人数.
【例4】一个地区共有5个乡镇,人口3万人,其中人口比例为3:2:5:2:3,从3万人中抽取一个300人的样本,分析某种疾病的发病率,已知这种疾病与不同的地理位置及水土有关,问应采取什么样的方法?并写出具体过程.
【思路点拨】采用分层抽样的方法.
【解析】因为疾病与地理位置和水土均有关系,所以不同乡镇的发病情况差异明显,因而采用分层抽样的方法,具体过程如下:
〔1〕将3万人分为5层,其中一个乡镇为一层. 〔2〕按照样本容量的比例随机抽取各乡镇应抽取的样本.
300×3/15=60〔人〕,300×2/15=40〔人〕,300×5/15=100〔人〕,300×2/15=40〔人〕,300×3/15=60〔人〕,因此各乡镇抽取人数分别为60人、40人、100人、40人、60 人.
〔3〕将300人组到一起,即得到一个样本.
【总结升华】分层抽样在日常生活中应用广泛,其抽取样本的步骤尤为重要,应牢记按照相应的比例去抽取.
举一反三:
【变式】某单位最近组织了一次健身活动,活动分为登山组和游泳组,且每个职工至多参加了其中一组.在参加活动的职工中,青年人占42.5%,中年人占47.5%,老年人占10%.登山组的职工占参加活动总人数的
4
1
,且该组中,青年人占50%,中年人占40%,老年人占10%.为了了解各组不同的年龄层次的职工对本次活动的满意程度,现用分层抽样的方法从参加活动的全体职工中抽取一个容量为200的样本.试确定
〔Ⅰ〕游泳组中,青年人、中年人、老年人分别所占的比例; 〔Ⅱ〕游泳组中,青年人、中年人、老年人分别应抽取的人数. 【答案】
〔Ⅰ〕设登山组人数为x ,游泳组中,青年人、中年人、老年人各占比例分别为a 、b 、c ,
则有40%347.5%410%310%4x xb
x
x xc x ⋅+⎧=⎪⎪⎨⋅+⎪=⎪⎩
,解得50%10%b c =⎧⎨=⎩
故a=100%-50%-10%=40%,
即游泳组中,青年人、中年人、老年人各占比例分别为40%、50%、10%. 〔Ⅱ〕游泳组中,抽取的青年人数为3
20040%604
⨯⨯=〔人〕; 抽取的中年人数为3
2004⨯
⨯50%=75〔人〕; 抽取的老年人数为3
2004
⨯⨯10%=15〔人〕.
类型四、用样本估计总体
【例4】甲、乙两小组各10名学生的英语口语测试成绩如下:(单位:分) 甲组 76 90 84 86 81 87 86 82 85 83 乙组 82 84 85 89 79 80 91 89 79 74 用茎叶图表示两小组的成绩,并判断哪个小组的成绩更整齐一些? 【思路点拨】学会用茎叶图表示数据的方法;并会进行统计推断.
【解析】用茎叶图表示两小组的成绩如图:

茎 乙 6
7
4 9 9 7 6 6
5 4 3 2 1 8
0 2 4 5 9 9 0
9
1
由图可知甲组成绩较集中,即甲组成绩更整齐一些.
【总结升华】对各数据是二、三位数,且数据量不是很大时,用用茎叶图表示较为方便,也便于进行统计推断,否则,应改用其他方法.
举一反三:
【变式1】甲、乙两个学习小组各有10名同学,他们在一次数学测验中成绩的茎叶图如下图,则他们在这次测验中成绩较好的是 组.
【答案】甲小组
【变式2】甲、乙两名运发动的5次测试成绩如以下图所示,设12,s s 分别表示甲、乙两名运发动测试成绩的标准差,12,x x 分别表示甲、乙两名运发动测试成绩的平均数,则有〔 〕
A .12x x =,12s s <
B .12x x =, 12s s >
C .12x x >, 12s s >
D .12x x =, 12s s = 【答案】B
【例5】以下茎叶图记录了甲、乙两组各四名同学在某次数学测验中的成绩,甲组记录中有一个数据模糊,无法确认,在图中以X 表示. 甲组 乙组 6 X
8 7
4 1 9 0 0 3
甲 茎 乙 5 7 1 6 8 8 8 2
2
3 6 7
〔Ⅰ〕如果甲组同学与乙组同学的平均成绩一样,求X 及甲组同学数学成绩的方差;
〔Ⅱ〕如果X=7,分别从甲、乙两组同学中各随机选取一名,求这两名同学的数学成绩之和大于180的概率.〔注:方差2
222
121
=[()()...()],n s x x x x x x n
-+-++-其中12,,...,.n x x x x 为的平均数〕
【思路点拨】〔Ⅰ〕利用平均数的基本概念加以求解。

〔Ⅱ〕根据列举法求出所有事件构成样本空间,再求出事件“这两名同学的数学成绩之和大于180”的样本空间,利用古典概型公式可解。

【解析】〔I 〕乙组同学的平均成绩为87909093
904
+++=,甲组同学的平均成绩为90,
所以
80869194
90,9.4
X X ++++==
甲组同学数学成绩的方差为222228690)(8990)(9190)(9490)17
=
42
s -+-+-+-=甲
( (II)设甲组成绩为86,89,91,94的同学分别为1234,,,,a a a a 乙组成绩为87,90,90,93的同学分别为
1234,,,,b b b b 则所有的事件构成的基本领件空间为:
11121314212223243132{(,),(,),(,),(,),(,),(,),(,),(,),(,),(,),a b a b a b a b a b a b a b a b a b a b
333441424344(,),(,),(,),(,),(,),(,)}.a b a b a b a b a b a b 共16个基本领件.
设事件A =“这两名同学的数学成绩之和大于180”,则事件A 包含的基本领件的空间为{32333441424344(,),(,)(,),(,),(,),(,),(,)}.a b a b a b a b a b a b a b 共7个基本领件,
7
()16
P A =
【总结升华】会根据茎叶图列举出相关具体数据,再利用古典概型或是独立重复试验类型加以求解。

举一反三:
【变式】某工厂甲、乙两个车间包装同一种产品,在自动包装传送带上每隔一小时抽一包产品,称其重量〔单位:克〕是否合格,分别记录抽查数据,获得重量数据茎叶图〔如右〕.
〔Ⅰ〕根据样本数据,计算甲、乙两个车间产品重量的均值与方差,并说明哪个车间的产品的重量相对稳定;
〔Ⅱ〕假设从乙车间6件样品中随机抽取两件,求所抽取两件样品重量之差不超过2克的概率.
【解析】〔Ⅰ〕设甲、乙两个车间产品重量的均值分别为X 甲 、X 乙,方差分别为2
s 甲 、2
s 乙,则
122114113111111107
1136
X +++++=
=甲,
1241101121151081091136
X +++++==乙,
2 1 2 4 4
3 1 1 1 1 0 2 5
7 1 0 8 9
甲 乙
()()()222
211221131141131131136s ⎡=
-+-+-⎣
甲 ()()()222
111113111113107113⎤+-+-+-⎦
21=,
()()()222
211241131101131121136s ⎡=
-+-+-⎣
乙 ()()()222
115113108113109113⎤+-+-+-⎦
29.33=,
由于 22
s s <甲乙
,所以 甲车间的产品的重量相对稳定; 〔Ⅱ〕从乙车间6件样品中随机抽取两件,结果共有15个:
()()()()()124,110,124,112,124,115,124,108,124,109, ()()()()()110,112,110,115,110,108,110,109,112,115,()()()()()112,108,112,109,115,108,115,109,108,109.
设所抽取两件样品重量之差不超过2克的事件为A ,则事件A 共有4个结果:
()()()()110,112,110,108,110,109,108,109.
所以 ()4
15
P A =
. 【例6】近年来,某市为了促进生活垃圾的分类处理,将生活垃圾分为厨余垃圾、可回收物和其他垃圾三类,并分别设置了相应的垃圾箱.为调查居民生活垃圾分类投放情况,现随机抽取了该市三类垃圾箱中总计1 000吨生活垃圾,数据统计如下(单位:吨):
(1)试估计厨余垃圾投放正确的概率; (2)试估计生活垃圾投放错误的概率;
(3)假设厨余垃圾在“厨余垃圾”箱、“可回收物”箱、“其他垃圾”箱的投放量分别为a ,b ,c ,其中a >0,a +b +c =600.当数据a ,b ,c 的方差s 2最大时,写出a ,b ,c 的值(结论不要求证明), 并求此时s 2的值.
注:2
22
2121s =[(-)+(-)+
+(-)],n x x x x x x x n
其中为数据x 1,x 2,…,x n 的平均数
【思路点拨】〔1〕、〔2〕两问可通过古典概型公式加以求解;第〔3〕问利用方差的意义求解。

【解析】〔1〕厨余垃圾投放正确的概率约为
4002
==400+100+1003
“厨余垃圾”箱里厨余垃圾量厨余垃圾总量
〔2〕设生活垃圾投放错误为事件A ,则A 表示升华垃圾投放正确。

事件A 的概率约为“厨余垃圾”箱里厨余垃圾量、“可回收物”箱里的可回收物量与“其他垃圾”箱里其他垃圾量的总和除以升华垃圾总量,即()P A 约为400+240+60
=0.71000
所以()P A
〔3〕当a=600,b=c=0时,2
s 取得最大值。

因为1=(++)=2003
x a b c ,所以2
22
21s =[(600-200)+(0-200)+
+(0-200)]=800003。

【总结升华】此题主要考察求解古典概型的方法和方差的几何意义,同时考查数据收集处理的能力。

【例7】为了解甲、乙两厂的产品的质量,从两厂生产的产品中随机抽取各10件,测量产品中某种元素的含量〔单位:毫克〕.下表是测量数据的茎叶图: 甲厂
乙厂
9
3 9 6 5 8 1
8 4 5 6 9 0 3
1 5 0 3 2
1 0 3
规定:当产品中的此种元素含量满足≥18毫克时,该产品为优等品. 〔Ⅰ〕试用上述样本数据估计甲、乙两厂生产的优等品率;
〔Ⅱ〕从乙厂抽出的上述10件产品中,随机抽取3件,求抽到的3件产品中优等品数ξ的分布列及其数学期望()E ξ;
〔Ⅲ〕从上述样品中,各随机抽取3件,逐一选取,取后有放回,求抽到的优等品数甲厂恰比乙厂多2件的概率.
【思路点拨】〔Ⅰ〕根据茎叶图所给数据,数出甲乙厂优等品数量即可。

〔Ⅱ〕ξ的取值为0,1,2,3,分别求出对应的抽取方法,再按照等可能事件概率方法求解可得。

〔Ⅲ〕优等品数甲厂恰比乙厂多2件包括2种情况,“甲厂2件,乙厂0”以及“甲厂3件,乙厂1件”,分别按照独立重复试验概率公式求解,又从甲厂抽取与从乙厂抽取相互独立,按照乘法计算即可。

【解析】〔I 〕甲厂抽取的样本中优等品有6件,优等品率为63
.105= 乙厂抽取的样本中优等品有5件,优等品率为
51.102
= 〔II 〕ξ的取值为0,1,2,3.
031
2555533
10101
5(0),(1),1212
C C C C P P C C ξξ⋅⋅======
21355533
101051
(2),(3)1212
C C C P P C C ξξ⋅====== 所以ξ的分布列为
故0123.121212122
E ξξ=⨯+⨯+⨯+⨯=的数学期望为(
) (III) 抽取的优等品数甲厂恰比乙厂多2件包括2个事件,即A=“抽取的优等品数甲厂2件,乙厂0件”,B=“抽取的优等品数甲厂3件,乙厂1件”
2200333321127
()()()()()5522500
P A C C =⨯=
33112
3331181()()()()5221000
P B C C =⨯=
抽取的优等品数甲厂恰比乙厂多2件的概率为278127
()()
.5001000200
P A P B +=
+= 【总结升华】此题属于统计与概率综合题,考查茎叶图有关知识,同时考查学生对相互独立事件同时发生的概率与独立重复试验的概率的应用能力。

【例8】对某电子元件进行寿命追踪调查,情况如下:
〔1〕列出频率分布表;
〔2〕画出频率分布直方图和累积频率分布图;。

相关文档
最新文档