高三数学概率统计的解题技巧
高考大题规范解答系列——概率与统计高三数学新高考一轮复习优秀课件
高考一轮总复习 • 数学 • 新高考
返回导航
(2)由(1)知,p=0.1,
(i)令 Y 表示余下的 180 件产品中的不合格品件数,依题意知 Y~B(180 得分点④
所以 E(X)=E(40+25Y)=40+25E(Y)=490.
10 分 得分点⑤
高考一轮总复习 • 数学 • 新高考
第十章
统计、统计案例
返回导航
第十章 统计、统计案例
高考一轮总复习 • 数学 • 新高考
返回导航
高考大题规范解答系列(六) ——概率与统计
第十章 统计、统计案例
高考一轮总复习 • 数学 • 新高考
返回导航
考点一 离散型随机变量的分布列与期望
例 1 (2018·课标Ⅰ)某工厂的某种产品成箱包装,每箱200件,每一箱产品 在交付用户之前要对产品作检验,如检验出不合格品,则更换为合格品.检验时, 先从这箱产品中任取20件作检验,再根据检验结果决定是否对余下的所有产品作检 验.设每件产品为不合格品的概率都为p(0<p<1),且各件产品是不是不合格品相互 独立.
高 考 大 题 规 范解答 系列6————概概率率与与统统计计高-三20数21 学版新高高三 考数一学轮( 复新习高优考 秀)一pp轮t课复件习课 件(共6 7张PPT )
第十章 统计、统计案例
高 考 大 题 规 范解答 系列6————概概率率与与统统计计高-三20数21 学版新高高三 考数一学轮( 复新习高优考 秀)一pp轮t课复件习课 件(共6 7张PPT )
第十章 统计、统计案例
高考一轮总复习 • 数学 • 新高考
返回导航
(1)记20件产品中恰有2件不合格品的概率为f(p),求f(p)的最大值点p0. (2)现对一箱产品检验了20件,结果恰有2件不合格品,以(1)中确定的p0作为p的 值.已知每件产品的检验费用为2元.若有不合格品进入用户手中,则工厂要对每 件不合格品支付25元的赔偿费用. (i)若不对该箱余下的产品作检验,这一箱产品的检验费用与赔偿费用的和记为 X,求E(X); (ii)以检验费用与赔偿费用和的期望值为决策依据,是否该对这箱余下的所有产 品作检验?
高三数学选修2-3(B版)_专题提升:概率与统计
概率与统计高考对本内容的考查主要有:(1)抽样方法的选择、与样本容量相关的计算,尤其是分层抽样中的相关计算,A 级要求.(2)图表中的直方图、茎叶图都可以作为考查点,尤其是直方图更是考查的热点,A级要求.(3)特征数中的方差、标准差计算都是考查的热点,B级要求.(4)随机事件的概率计算,通常以古典概型、几何概型的形式出现,B级要求.重难点:1.概率问题(1)求某些较复杂的概率问题时,通常有两种方法:一是将其分解为若干个彼此互斥的事件的和,然后利用概率加法公式求其值;二是求此事件A的对立事件A 的概率,然后利用P(A)=1-P(A)可得解;(2)用列举法把古典概型试验的基本事件一一列出来,然后再求出事件A中的基本事件,利用公式P(A)=mn求出事件A的概率,这是一个形象、直观的好办法,但列举时必须按照某一顺序做到不重复,不遗漏;(3)求几何概型的概率,最关键的一步是求事件A所包含的基本事件所占据区域的测度,这里需要解析几何的知识,而最困难的地方是找出基本事件的约束条件.2.统计问题(1)统计主要是对数据的处理,为了保证统计的客观和公正,抽样是统计的必要和重要环节,抽样的方法有三:简单随机抽样、系统抽样和分层抽样;(2)用样本频率分布来估计总体分布一节的重点是:频率分布表和频率分布直方图的绘制及用样本频率分布估计总体分布,难点是:频率分布表和频率分布直方图的理解及应用;(3)用茎叶图优点是原有信息不会抹掉,能够展开数据发布情况,但当样本数据较多或数据位数较多时,茎叶图就显得不太方便了;(4)两个变量的相关关系中,主要能作出散点图,了解最小二乘法的思想,能根据给出的线性或归方程系数或公式建立线性回归方程.考点1、抽样方法【例1】某学院的A,B,C三个专业共有1 200名学生,为了调查这些学生勤工俭学的情况,拟采用分层抽样的方法抽取一个容量为120的样本. 已知该学院的A专业有380名学生,B专业有420名学生,则在该学院的C专业应抽取________名学生.【方法技巧】分层抽样适用于总体由差异明显的几部分组成的情况,按各部分在总体中所占的比实施抽样,据“每层样本数量与每层个体数量的比与所有样本数量与总体容量的比相等”列式计算;在实际中这种有差异的抽样比其他两类抽样要多的多,所以分层抽样有较大的应用空间,应引起我们的高度重视.【变式探究】某校高三年级学生年龄分布在17岁、18岁、19岁的人数分别为500、400、200,现通过分层抽样从上述学生中抽取一个样本容量为m的样本,已知每位学生被抽到的概率都为0.2,则m=________.【解析】(500+400+200)×0.2=220.【答案】220考点2、用样本估计总体【例2】(2013·重庆卷改编)以下茎叶图记录了甲、乙两组各五名学生在一次英语听力测试中的成绩(单位:分)已知甲组数据的中位数为15,乙组数据的平均数为16.8,则x,y的值分别为________.【解析】由茎叶图及已知得x=5,又因9+15+10+y+18+245=16.8,所以y=8.【答案】5,8【方法技巧】由于数据过大,直接计算会引起计算错误,故要学会像解析中介绍的两种方法那样尽量简化计算;同时要理解茎叶图的特点,能够从茎叶图获取原始数据.【变式探究】某校共有400名学生参加了一次数学竞赛,竞赛成绩的频率分布直方图如图所示(成绩分组为[0,10),[10,20),…,[80,90),[90,100]).则在本次竞赛中,得分不低于80分以上的人数为______ .【例3】袋中有红、黄、白3种颜色的球各1只,从中每次任取1只,有放回地抽取3次,求:(1)3只全是红球的概率;(2)3只颜色全相同的概率;(3)3只颜色不全相同的概率.解(1)记“3只全是红球”为事件A.从袋中有放回地抽取3次,每次取1只,共会出现3×3×3=27种等可能的结果,其中3只全是红球的结果只有一种,故事件A的概率为P(A)=1 27.(2)“3只颜色全相同”只可能是这样三种情况:“3只全是红球”(事件A);“3只全是黄球”(设为事件B);“3只全是白球”(设为事件C).故“3只颜色全相同”这个事件为A+B+C,由于事件A、B、C不可能同时发生,因此它们是互斥事件.再由红、黄、白球个数一样,故不难得P(B)=P(C)=P(A)=127,所以P(A+B+C)=P(A)+P(B)+P(C)=1 9.(3) 3只颜色不全相同的情况较多,如是两只球同色而另一只球不同色,可以两只同红色或同黄色或同白色等等;或三只球颜色全不相同等.考虑起来比较麻烦,现在记“3只颜色不全相同”为事件D,则事件D为“3只颜色全相同”,显然事件D与D是对立事件.∴P(D)=1-P(D)=1-19=89.【方法技巧】在求某些稍复杂的事件的概率时,通常有两种方法:一是将所求事件的概率化成一些彼此互斥事件的概率的和;二是先去求此事件的对立事件的概率.一个复杂事件若正面情况比较多,反面情况较少,则一般利用对立事件进行求解;对于“至少”,“至多”等问题往往用这种方法求解.【训练3】(2013·陕西卷改编)如图,在矩形区域ABCD的A,C两点处各有一个通信基站,假设其信号的覆盖范围分别是扇形区域ADE和扇形区域CBF(该矩形区域内无其他信号来源,基站工作正常).若在该矩形区域内随机地选一地点,则该地点无信号的概率是________.考点预测:1.某校从高一年级学生中随机抽取部分学生,将他们的模块测试成绩分成6组:[40,50),[50,60),[60,70),[70,80),[80,90),[90,100]加以统计,得到如图所示的频率分布直方图.已知高一年级共有学生600名,据此估计,该模块测试成绩不少于60分的学生人数为________.2.先后两次抛掷一枚骰子,在得到点数之和不大于6的条件下,先后出现的点数中有3的概率为________.3.某单位有职工160名,其中业务人员120名,管理人员16名,后勤人员24名.为了解职工的某种情况,要从中抽取一个容量为20的样本.若用分层抽样的方法,抽取的业务人员、管理人员、后勤人员的人数应分别为________.【解析】分层抽样应按各层所占的比例从总体中抽取.4.有3个兴趣小组,甲、乙两位同学各自参加其中一个小组,每位同学参加各个小组的可能性相同,则这两位同学参加同一个兴趣小组的概率为________.5.一个袋中有3个黑球,2个白球共5个大小相同的球,每次摸出一球,放进袋里再摸第二次,则两次摸出的球都是白球的概率为________.6.从甲、乙、丙等5名候选学生中选2名作为青年志愿者,则甲、乙、丙中有2个被选中的概率为________.7.为了分析某篮球运动员在比赛中发挥的稳定程度,统计了该运动员在6场比赛中的得分,用茎叶图表示如图所示,则该组数据的方差为________.【解析】平均数x =14+17+18+18+20+216=18,故方差s 2=16[(-4)2+(-1)2+02+02+22+32)]=5.【答案】58.袋中装有大小相同且形状一样的四个球,四个球上分别标有“2”、“3”、“4”、“6”这四个数.现从中随机选取三个球,则所选的三个球上的数恰好能构成一个等差数列的概率是________.【解析】总的取法是4组,能构成等差数列的有{2,3,4},{2,4,6} 2组;故所求概率为P =24=12.【答案】129.设f (x )=x 2-2x -3(x ∈R ),则在区间[-π,π]上随机取一个数x ,使f (x )<0的概率为________.10.从长度分别为2,3,4,5的四条线段中任意取出三条,则以这三条线段为边可以构成三角形的概率是________.11.利用计算机产生0~1之间的均匀随机数a ,则事件“3a -1>0”发生的概率为________.12.从一副没有大小王的52张扑克牌中随机抽取1张,事件A 为“抽得红桃8”,事件B 为“抽得为黑桃”,则事件“A +B ”的概率值是________(结果用最简分数表示).13.在集合A ={2,3}中随机取一个元素m ,在集合B ={1,2,3}中随机取一个元素n ,得到点P (m ,n ),则点P 在圆x 2+y 2=9内部的概率为________.【解析】由题意得到的P (m ,n )有:(2,1),(2,2),(2,3),(3,1),(3,2),(3,3)共计6个;在圆x 2+y 2=9的内部的点有(2,1),(2,2),所以概率为26=13.【答案】13 14.抛掷甲、乙两枚质地均匀且四面上分别标有1,2,3,4的正四面体,其底面落于桌面,记所得的数字分别为x ,y ,则x y 为整数的概率是________.。
高三概率统计知识点总结
高三概率统计知识点总结在高中数学课程中,概率统计是一个重要的内容模块。
概率统计的学习对于培养学生的数据分析和决策能力具有重要作用。
下面是对高三概率统计知识点的总结。
一、概率的基本概念和性质1. 随机试验和样本空间:随机试验是指在相同条件下可以重复进行的试验,样本空间是随机试验所有可能结果的集合。
2. 事件和事件的概率:事件是样本空间的子集,事件的概率是该事件发生的可能性大小。
3. 等可能概型:当随机试验的样本空间中的每个样本点发生的概率相等时,称为等可能概型。
4. 互斥事件和对立事件:互斥事件指两个事件不可能同时发生,对立事件指两个事件中至少发生一个的事件。
二、概率的计算方法1. 古典概型:根据等可能性原理进行概率计算的方法。
2. 相对频率概率:通过实验进行多次重复试验,计算事件发生的频率来估计概率。
3. 随机事件的运算:包括事件的并、交、差、对立等运算。
三、条件概率和独立性1. 条件概率的定义和计算:在已知事件B发生的条件下,事件A发生的概率。
2. 乘法公式:计算独立事件的联合概率。
3. 独立事件的定义和判定:事件A和事件B的联合概率等于事件A发生的概率乘以事件B发生的概率。
四、全概率公式和贝叶斯定理1. 全概率公式:用于计算一个事件A的概率,通过其他互斥事件的概率计算得出。
2. 贝叶斯定理:用于在已知事件B发生的条件下,求事件A发生的概率。
五、离散型随机变量1. 随机变量的定义:将样本空间中的每个样本点对应到一个实数的变量。
2. 概率质量函数和分布函数:离散型随机变量的概率质量函数描述了每个离散取值对应的概率,分布函数描述了小于等于某个值的概率。
3. 均匀分布、二项分布和几何分布:常见的离散型随机变量分布。
六、连续型随机变量1. 随机变量的定义:将样本空间中的每个样本点对应到一个实数的变量。
2. 概率密度函数和分布函数:连续型随机变量的概率密度函数描述了变量取某一值的概率密度,分布函数描述了小于等于某个值的概率。
高中数学复习概率统计题型归纳与讲解03 频率分布直方图
高中数学复习概率统计题型归纳与讲解专题3频率分布直方图例1.要调查某地区高中学生身体素质,从高中生中抽取100人进行跳高测试,根据测试成绩制作频率分布直方图如图,现从成绩在[120,140)之间的学生中用分层抽样的方法抽取5人,应从[120,130)间抽取人数为b,则()A.a=0.2,b=2B.a=0.025,b=3C.a=0.3,b=4D.a=0.030,b=3【解析】解:由题得10×(0.005+0.035+a+0.020+0.010)=1,所以a=0.030.在[120,130)之间的学生人数为:100×10×0.030=30人,在[130,140)之间的学生人数为:100×10×0.020=20人,在[120,140)之间的学生人数为:100×(10×0.030+0.020)=50人,又用分层抽样的方法在[120,140)之间的学生50人中抽取5人,即抽取比例为:110,所以成绩在[120,130)之间的学生中抽取的人数应,30×110=3,即b=3,故选:D.例2.从某企业生产的某种产品中随机抽取100件,测量这些产品的一项质量指标值,由测量表得如下频数分布表:质量指标值分组[70,80) [80,90) [90,100) [100,110) 110,120)频数 14 20 36 18 12估计这种产品质量指标值的平均数为(同一组中的数据用该组区间的中点值作代表)( )A .100B .98.8C .96.6D .94.4【解析】解:平均数x →=0.14×75+0.20×85+0.36×95+0.18×105+0.12×115=94.4.故选:D .例3.“新冠肺炎”席卷全球,我国医务工作者为了打好这次疫情阻击战,充分发挥优势,很快抑制了病毒,据统计老年患者治愈率为71%,中年患者治愈率为85%,青年患者治愈率为91%.如果某医院有30名老年患者,40名中年患者,50名青年患者,则估计该医院的平均治愈率是( )A .86%B .83%C .90%D .84%【解析】解:利用求加权平均数的公式解得:30×71%+40×85%+50×91%30+40+50=0.84=84%,故选:D .例4.已知样本数据x 1,x 2,…,x n (n ∈N *)的平均数与方差分别是a 和b ,若y i =﹣2x i +3(i =1,2,…n ),且样本数据y 1,y 2,…,y n 的平均数与方差分别是b 和a ,则a ﹣b =( )A .1B .2C .3D .4【解析】解:由题意得:{−2a +3=b a =4b ,解得:{a =43b =13,故a ﹣b =1, 故选:A .例5.下面定义一个同学数学成绩优秀的标志为:“连续5次考试成绩均不低于120分”.现有甲、乙、丙三位同学连续5次数学考试成绩的记录数据(记录数据都是正整数):①甲同学:5个数据的中位数为127,众数为120;②乙同学:5个数据的中位数为125,总体均值为127;③丙同学:5个数据的中位数为135,总体均值为128,总体方差为19.8.则可以判定数学成绩优秀同学为( )A .甲、乙B .乙、丙C .甲、丙D .甲、乙、丙【解析】解:在①中,甲同学:5个数据的中位数为127,众数为120,所以前三个数为120,120,127,则后两个数肯定大于127,故甲同学数学成绩优秀,故①成立;在②中,5个数据的中位数为125,总体均值为127,可以找到很多反例,如:118,119,125,128,145,故乙同学数学成绩不优秀,故②不成立;在③中,5个数据的中位数为135,总体均值为128,总体方差为19.8设x 1<x 2<x 3<x 4,则丙的方差为15[(x 1﹣128)2+(x 2﹣128)2+(x 3﹣128)2+(x 4﹣128)2+(135﹣128)2]=19.8, ∴(x 1﹣128)2+(x 2﹣128)2+(x 3﹣128)2+(x 4﹣128)2=50,∴(x 1﹣128)2≤50,得|x 1﹣128|≤5,∴x 1≥128﹣5>120,∴丙同学数学成绩优秀,故③成立.∴数学成绩优秀有甲和丙2个同学.故选:C .例6.若数据x 1,x 2,…,x n 的平均数x =3,方差s 2=1,则数据2x 1+3,2x 2+3,…,2x n +3的平均数和方差分别为( )A.6,6B.9,2C.9,6D.9,4【解析】解:由题意若数据x1,x2,…,x n的平均数x=3,方差s2=1,可得x1+x2+…+x n=3n,则:2x1+3+x2+3+…+x n+3=2(x1+x2+…+x n)+3n=9n,所以数据2x1+3,2x2+3,…,2x n+3的平均数为9.又S2=1n[(x1﹣3)2+(x2﹣3)2+…+(x n﹣3)2]=1,所以[(x1﹣3)2+(x2﹣3)2+…+(x n﹣3)2]=n,所以1n [(2x1+3﹣9)2+(2x2+3﹣9)2+…+(2x n+3﹣9)2]=4n[(x1﹣3)2+(x2﹣3)2+…+(x n﹣3)2]=4,则数据2x1+3,2x2+3,…,2x n+3的平均数和方差分别为9,4.故选:D.例7.随着城镇化的不断发展,老旧小区的改造及管理已经引起了某市政府的高度重视,为了了解本市甲,乙两个物业公司管理的小区住户对其服务的满意程度,现从他们所服务的小区中随机选择了40个住户,根据住户对其服务的满意度评分,得到A区住户满意度评分的频率分布直方图和B 区住户满意度评分的频率分布表.B区住户满意度评分的频率分布表满意度评分分组[50,60)[60,70)[70,80)[80,90)[90,100]频数4610128(Ⅰ)在图2中作出B区住户满意度评分的频率分布直方图,并通过频率分布直方图计算两区住户满意度评分的平均值及分散程度(其中分散程度不要求计算出具体值,给出结论即可);(Ⅱ)根据住户满意度评分,将住户和满意度分为三个等级:满意度评分低于70分,评定为不满意;满意度评分在70分到89分之间,评定为满意;满意度评分不低于90分,评定为非常满意.试估计哪个地区住户的满意度等级为不满意的概率大?若是要选择一个物业公司来管理老旧小区的物业,从满意度角度考虑,应该选择哪一个物业公司?说明理由.【解析】解:(Ⅰ)作出如图所示的频率分布直方图,B区住户满意度评分的频率分布直方图如图所示A区住户满意度评分的平均值为45×0.1+55×0.2+65×0.3+75×0.2+85×0.15+95×0.05=67.5;B区住户满意度评分的平均值为55×0.1+65×0.15+75×0.25+85×0.3+95×0.2=78.5.通过比较两区住户满意度评分的频率分布直方图可以看出,B区住户满意度评分比较集中,而A 区住户满意度评分比较分散.(Ⅱ)记D表示事件:“A区住户的满意度等级为不满意”,记E表示事件:“B区住户的满意度等级为不满意”,则P(D)=(0.010+0.020+0.030)×10=0.6,P(E)=(0.010十0.015)×10=0.25,所以A区住户的满意度等级为不满意的概率较大.若是要选择一个物业公司来管理老旧小区的物业,从满意度等级为满意来考虑,应该选择乙物业公司来为小区服务,这样的话小区住户满意度会高一些.例8.某校在一次期末数学测试中,为统计学生的考试情况,从学校的2000名学生中随机抽取50名学生的考试成绩,被测学生成绩全部介于65分到145分之间(满分150分),将统计结果按如下方式分成八组:第一组[65,75),第二组[75,85),……第八组[135,145],如图是按上述分组方法得到的频率分布直方图的一部分.(1)求第七组的频率,并完成频率分布直方图;(2)用样本数据估计该校的2000名学生这次考试成绩的平均分(同一组中的数据用该组区间的中点值代表该组数据平均值);(3)若从样本成绩属于第六组和第八组的所有学生中随机抽取2名,求他们的分差的绝对值小于10分的概率.【解析】解:(1)由频率分布直方图得第七组的频率为:1﹣(0.004+0.012+0.016+0.030+0.020+0.006+0.004)×10=0.08.完成频率分布直方图如下:(2)用样本数据估计该校的2000名学生这次考试成绩的平均分为:70×0.004×10+80×0.012×10+90×0.016×10+100×0.030×10+110×0.020×10+120×0.006×10+130×0.008×10+140×0.004×10=102.(3)样本成绩属于第六组的有0.006×10×50=3人,样本成绩属于第八组的有0.004×10×50=2人,从样本成绩属于第六组和第八组的所有学生中随机抽取2名,基本事件总数n=C52=10,他们的分差的绝对值小于10分包含的基本事件个数m=C32+C22=4,∴他们的分差的绝对值小于10分的概率p=mn=410=25.例9.我国是世界上严重缺水的国家之一,城市缺水问题较为突出,某市政府为了节约生活用水,计划在本市试行居民生活用水定额管理,即确定一个居民月用水量标准x,用水量不超过x的部分按平价收费,超出x的部分按议价收费.下面是居民月均用水量的抽样频率分布直方图.①求直方图中a的值;②试估计该市居民月均用水量的众数、平均数;③设该市有30万居民,估计全市居民中月均用水量不低于3吨的人数,并说明理由;④如果希望85%的居民月均用水量不超过标准x ,那么标准x 定为多少比较合理?【解析】解:①由概率统计相关知识,各组频率之和的值为1,∵频率=(频率/组距)*组距,∴0.5×(0.08+0.16+0.4+0.52+0.12+0.08+0.04+2a )=1,解得:a =0.3,∴a 的值为0.3;②由频率分布直方图估计该市居民月均用水量的众数为2+2.52=2.25(吨),估计该市居民月均用水量的平均数为:0.5(0.25×0.08+0.75×0.16+1.25×0.3+1.75×0.4+2.25×0.52+2.75×0.3+3.25×0.12+3.75×0.08+4.25×0.04)=2.035(吨).③由图,不低于3吨人数所占百分比为0.5×(0.12+0.08+0.04)=12%,∴全市月均用水量不低于3吨的人数为:30×12%=3.6(万);④由频率分布直方图得月均用水量低于2.5吨的频率为:0.5×(0.08+0.16+0.3+0.4+0.52)=0.73<85%,月均用水量低于3吨的频率为:0.5×(0.08+0.16+0.3+0.4+0.52+0.3)=0.88>85%,∴x=2.5+0.5×0.85−0.730.3×0.5=2.9(吨).例10.如图是某校高三(1)班的一次数学知识竞赛成绩的基叶图(图中仅列出[50,60),[90,100)的数据)和频率分布直方图.(1)求全班人数以及频率分布直方图中的x,y;(2)估计学生竞赛成绩的平均数和中位数(保留两位小数).【解析】解:(1)分数在[50,60)的频率为0.020×10=0.2,由茎叶图知,分数在[50,60)之间的频数为5,所以全班人数为50.2=25(人);分数在[90,100)之间的频数为2,由225=10y,解得y=0.008;又10x=1﹣10×(0.036+0.024+0.020+0.008),解得x=0.012.(2)由频率分布直方图,计算平均数为x=55×0.2+65×0.24+75×0.36+85×0.12+95×0.08=71.4,由0.2+0.24+0.36=0.80,所以中位数在[70,80)内,设中位数为m,则0.20+0.24+(m﹣70)×0.036=0.5,解得m≈71.67,所以中位数约为71.67.例11.某高中数学建模兴趣小组的同学为了研究所在地区男高中生的身高与体重的关系,从若干个高中男学生中抽取了1000个样本,得到如下数据.数据一:身高在[170,180)(单位:cm)的体重频数统计体重(kg)[50,55)[55,60)[60,65)[65,70)[70,75)[75,80)[80,85)[85,90)人数206010010080201010数据二:身高所在的区间含样本的个数及部分数据身高x(cm)[140,150)[150,160)[160﹣170)[170﹣180)[180﹣190)平均体重y(kg)4553.66075(Ⅰ)依据数据一将下面男高中生身高在[170﹣180)(单位:cm)体重的频率分布直方图补充完整,并利用频率分布直方图估计身高在[170﹣180)(单位:cm)的中学生的平均体重;(保留小数点后一位)(Ⅱ)依据数据一、二,计算身高(取值为区间中点)和体重的相关系数约为0.99,能否用线性回归直线来刻画中学生身高与体重的相关关系,请说明理由;若能,求出该回归直线方程;(Ⅲ)说明残差平方和或相关指数R2与线性回归模型拟合效果之间关系.(只需写出结论,不需要计算)参考公式:b=∑ni=1(x i−x)(y i−y)∑n i=1(x i−x)2=∑ni=1x i y i−nx⋅y∑n i=1x i2−nx2,a=y−b x.参考数据:(1)145×45+155×53.6+165×60+185×75=38608;(2)1452+1552+1652+1752+1852﹣5×1652=1000.(3)663×175=116025,664×175=116200,665×175=116375.(4)728×165=120120.【解析】解:(1)身高在[170,180)的总人数为:20+60+100+100+80+20+10+10=400,体重在[55﹣60)的频率为:60400=0.15,体重在[70﹣75)的频率为:80400=0.2,平均体重为:52.5×0.05+57.5×0.15+62.5×0.25+67.5×0.25+72.5×0.2+77.5×0.05+82.5×0.025+87.5×0.025≈66.4,(2)因为r=0.99→1,线性相关很强,故可以用线性回归直线来刻画中学生身高与体重的相关,x=145+155+165+175+1855=165,y=45+75+60+53.6+66.45=60,b=∑8i=1x i y i−8x⋅y∑8i=1x i2−8x2=38608+175×66.4−5×165×601000=0.728,a=y−b x=60−0.728×165=−60.12,所以回归直线方程为:y=0.728x−60.12,(3)残差平方和越小或相关指数R2越接近于1,线性回归模型拟合效果越好.例12.市政府为了节约用水,调查了100位居民某年的月均用水量(单位:t),频数分布如下:分组[0,0.5)[0.5,1)[1,1.5)[1.5,2)[2,2.5)[2.5,3)[3,3.5)[3.5,4)[4,4.5]频数4815222514642(1)根据所给数据将频率分布直方图补充完整(不必说明理由);(2)根据频率分布直方图估计本市居民月均用水量的中位数;(3)根据频率分布直方图估计本市居民月均用水量的平均数(同一组数据由该组区间的中点值作为代表).【解析】解:(1)频率分布直方图如图所示:(2)∵0.04+0.08+0.15+0.22=0.49<0.5,∴中位数为2+0.5−0.490.25×0.5=2.02,(3)由频率分布直方图得平均数为:0.25×0.04+0.75×0.08+1.25×0.15+1.75×0.22+2.25×0.25+2.75×0.14+3.25×0.06+3.75×0.04+4.25×0.02=2.02.例13.某地区100居民的人均用水量(单位:t)的分组的频数如下:[0,0.5),4;[0.5,1),8;[1,1.5),15;[1.5,2),22;[2,2.5),25;[2.5,3),14;[3,3.5),6;[3.5,4),4;[4,4.5),2.(1)列出样本的频率分布表;(2)画出频率分布直方图,并根据直方图估计这组数据的众数;(坐标轴单位自定)(3)当地政府制订了人均月用水量为3t的标准,若超出标准加倍收费,当地政府解释说,85%以上的居民不超出这个标准,这个解释对吗?为什么?【解析】解:(1 )分组频数频率[0,0.5 )40.04[0.5,1 )80.08[1,1.5 )150.15[1.5,2 )220.22[2,2.5 )250.25[2.5,3 )140.14[3,3.5 )60.06[3.5,4 )40.04[4,4.5 )20.02(2):频率分布直方图如下图,由图知,这组数据的众数为2.25.(3)人均月用水量在3t以上的居民的比例为6%+4%+2%=12%,即大约是有12%的居民月均用水量在3t以上,88%的居民月均用水量在3t以下,因此,政府的解释是正确的.例14.某校从参加高一年级期末考试的学生中抽出60名学生,将其物理成绩(均为整数)分成六段[40,50),[50,60)…[90,100]后画出如下频率分布直方图.观察图形的信息,回答下列问题:(Ⅰ)估计这次考试的众数m与中位数n(结果保留一位小数);(Ⅱ)估计这次考试的及格率(60分及以上为及格)和平均分.【解析】解:(Ⅰ)众数是最高小矩形中点的横坐标,所以众数为m=75(分);(3分)前三个小矩形面积为0.01×10+0.015×10+0.015×10=0.4,∵中位数要平分直方图的面积,∴n=70+0.5−0.40.03=73.3(7分)(Ⅱ)依题意,60及以上的分数所在的第三、四、五、六组,频率和为(0.015+0.03+0.025+0.005)*10=0.75所以,抽样学生成绩的合格率是75% (11分)利用组中值估算抽样学生的平均分45•f1+55•f2+65•f3+75•f4+85•f5+95•f6=45×0.1+55×0.15+65×0.15+75×0.3+85×0.25+95×0.05=71估计这次考试的平均分是71分.(14分)例15.为应对新冠疫情,重庆市于2020年1月24日启动重大突发公共卫生事件一级响应机制,要求市民少出门,少聚集,于是快递业务得到迅猛发展.为满足广大市民的日常生活所需,某快递公司以优厚的条件招聘派送员,现给出了两种日薪薪酬方案,甲方案:底薪100元,每派送一单奖励1元;乙方案:底薪150元,每日前55单没有奖励,超过55单的部分每单奖励10元.(Ⅰ)请分别求出这两种薪酬方案中日薪y(单位:元)与送货单数n的函数关系式;(Ⅱ)根据该公司所有派送员10天的派送记录,发现派送员的日平均派送单数与天数满足以下表格:日均派送单数5054565860频数(天)23221回答下列问题:①根据以上数据,设每名派送员的日薪为X(单位:元),试分别求出这10天中甲、乙两种方案的日薪X的平均数及方差;②结合①中的数据,根据统计学的思想,若你去应聘派送员,选择哪种薪酬方案比较合适,并说明你的理由.(参考数据:172=289,372=1369)【解析】解:(1)甲方案,y =100+n ;乙方案,y ={150,n ≤5510n −400,n >55.(2),①甲方案中,根据已知表格可计算出日平均派送单数为2×50+3×54+2×56+2×58+6010=55,方差为0.2×(50﹣55)2+0.3×(54﹣55)2+0.2×(56﹣55)2+0.2×(58﹣55)2+0.1×(60﹣55)2=9.8,所以,由(1)中变量之间的关系,可以指,甲方案的日薪X 的平均数为155,方差为9.8. 乙方案中,日薪X 的平均数为[5×150+160×2+180×2+200]×0.1=163,日薪方差为0.5×(150﹣163)2+0.2×(160﹣163)2+0.2×(180﹣163)2+0.1×(200﹣163)2=213.4.(3)若去应聘派送员,我会选择乙方案,从平均数的角度来看,乙方案的平均薪酬更高,同时更有激励作用.例16.2019年起,全国地级及以上城市全面启动生活垃圾分类工作,垃圾分类投放逐步成为居民的新时尚.为了促进生活垃圾的分类处理,将生活垃圾分为厨余垃圾、可回收垃圾、有害垃圾和其他垃圾四类,并分别设置了相应的垃圾箱.为调查居民生活垃圾分类投放情况,现随机抽取了某市三类垃圾箱中总计1000吨生活垃圾,数据统计如下(单位:吨):“厨余垃圾”箱 “可回收垃圾”箱 “有害垃圾”箱“其他垃圾”箱厨余垃圾 300 70 30 80 可回收垃圾 30 210 30 30 有害垃圾 20 20 60 20 其他垃圾10201060(1)分别估计厨余垃圾和有害垃圾投放正确的概率;(2)假设厨余垃圾在“厨余垃圾”箱、“可回收垃圾”箱、“有害垃圾”箱、“其他垃圾”箱的投放量分别为a,b,c,d,其中a>0,a+b+c+d=800.当数据a,b,c,d的方差s2最大时,写出a,b,c,d的值(结论不要求证明),并求此时s2的值.【解析】解:(1)根据题意,厨余垃圾共300+70+30+80=480吨,其中投放正确的有300吨,则厨余垃圾投放正确的概率P1=300480=58,有害垃圾共20+20+60+20=120吨,其中投放正确的有60吨,则害垃圾投放正确的概率P2=60120=12;(2)根据题意,厨余垃圾在四种垃圾箱的投放量分别为a,b,c,d,其中a>0,a+b+c+d=800,则其平均数x=8004=200,则其方差S2=14[(a﹣200)2+(b﹣200)2+(c﹣200)2+(d﹣200)2],当a=600,b=c=d=0时,s2最大,而x=a+b+c+d4=200,此时s2=14[(600﹣200)2+(0﹣200)2+(0﹣200)2+(0﹣200)2]=120000例17.某市教育局为了解全市高中学生在素质教育过程中的幸福指数变化情况,对8名学生在高一,高二不同学习阶段的幸福指数进行了一次跟踪调研.结果如表:学生编号12345678高一阶段幸福指数9593969497989695学生编号12345678高二阶段幸福指数9497959695949396(1)根据统计表中的数据情况,分别计算出两组数据的平均值及方差;(2)请根据上述结果,就平均值和方差的角度分析,说明在高一,高二不同阶段的学生幸福指数状况,并发表自己观点.【解析】解:(1)8名学生在高一阶段的幸福指数的平均数为:x=18(95+93+96+94+97+98+96+95)=95.5,方差为:S12=18∑8i=1(x i−x1)2=2.25,8名学生在高二阶段的幸福指数的平均数为:y=18(94+97+95+96+95+94+93+96)=95,方差为:S22=18∑8i=1(y i−y)2=1.5;(2)①∵x>y,∴可以认为这8名学生在高一的平均幸福指数大于在高二的平均幸福指数,②∵S12>S22,∴可以认为这8名学生在高二的幸福指数的稳定性大于在高一的幸福指数的稳定性.例18.2020年1月,教育部《关于在部分高校开展基础学科招生改革试点工作的意见》印发,自2020年起,在部分高校开展基础学科招生改革试点(也称“强基计划”).强基计划聚焦高端芯片与软件、智能科技、新材料、先进制造和国家安全等关键领域以及国家人才紧缺的人文社会科学领域,选拔培养有志于服务国家重大战略需求且综合素质优秀或基础学科拔尖的学生.新材料产业是重要的战略性新兴产业,如图是我国2011﹣2019年中国新材料产业市场规模及增长趋势图.其中柱状图表示新材料产业市场规模(单位:万亿元),折线图表示新材料产业市场规模年增长率(%).(1)求从2012年至2019年,每年新材料产业市场规模年增长量的平均数(精确到0.1);(2)从2015年至2019年中随机挑选两年,求两年中至少有一﹣年新材料产业市场规模年增长率超过20%的概率;(3)由图判断,从哪年开始连续三年的新材料产业市场规模的方差最大.(结论不要求证明)【解析】解:(1)从2012年起,每年新材料产业市场规模的年增加值依次为:0.3,0.2,0.3,0.5,0.6,0.4,0.8,0.6,(单位:万亿元),∴年增加的平均数为:0.3+0.2+0.3+0.5+0.6+0.4+0.8+0.68=0.5万亿元.(2)设A表示事件“从2015年至2019年中随机挑选两个,两年中至少有一年新材料产业市场规模增长率超过20%”,依题意P(A)=1−C22C52=910.(3)从2017年开始连续三年的新材料产业市场规模的方差最大.。
(完整版)高三数学概率统计知识点归纳
概率统计知识点归纳平均数、众数和中位数平均数、众数和中位数.要描述一组数据的集中趋势,最重要也是最常见的方法就是用这“三数”来说明.一、正确理解平均数、众数和中位数的概念平均数平均数是反映一组数据的平均水平的特征数,反映一组数据的集中趋势.平均数的大小与一组数据里的每一个数据都有关系,任何一个数据的变化都会引起平均数的变化.2.众数在一组数据中出现次数最多的数据叫做这一组数据的众数.一组数据中的众数有时不唯一.众数着眼于对各数出现的次数的考察,这就告诉我们在求一组数据的众数时,既不需要排列,又不需要计算,只要能找出样本中出现次数最多的那一个(或几个)数据就可以了.当一组数据中有数据多次重复出现时,它的众数也就是我们所要关心的一种集中趋势.3.中位数中位数就是将一组数据按大小顺序排列后,处在最中间的一个数(或处在最中间的两个数的平均数).一组数据中的中位数是唯一的.二、注意区别平均数、众数和中位数三者之间的关系平均数、众数和中位数都是描述一组数据的集中趋势的量,但它们描述的角度和适用的范围又不尽相同.在具体问题中采用哪种量来描述一组数据的集中趋势,那得看数据的特点和要关注的问题.三、能正确选用平均数、众数和中位数来解决实际问题由于平均数、众数和中位数都是描述一组数据的集中趋势的量,所以利用平均数、众数和中位数可以来解决现实生活中的问题.极差、方差、标准差极差、方差和标准差都是用来研究一组数据的离散程度的,反映一组数据的波动范围或波动大小的量.极差一组数据中最大值与最小值的差叫做这组数据的极差,即极差=最大值-最小值.极差能够反映数据的变化范围,差是最简单的一种度量数据波动情况的量,它受极端值的影响较大.二、方差方差是反映一组数据的整体波动大小的特征的量.它是指一组数据中各个数据与这组数据的平均数的差的平方的平均数,它反映的是一组数据偏离平均值的情况.方差越大,数据的波动越大;方差越小,数据的波动越小.求一组数据的方差可以简记先求平均,再求差,然后平方,最后求平均数.一组数据x1、x2、x3、…、xn 的平均数为x ,则该组数据方差的计算公式为:])()()[(1222212x x x x x x n S n -++-+-=Λ.三、标准差在计算方差的过程中,可以看出方差的数量单位与原数据的单位不一致,在实际的应用时常常将求出的方差再开平方,此时得到量为这组数据的标准差.即标准差=方差.四、极差、方差、标准差的关系方差和标准差都是用来描述一组数据波动情况的量,常用来比较两组数据的波动大小.两组数据中极差大的那一组并不一定方差也大.在实际问题中有时用到标准差,是因为标准差的单位和原数据的单位一致,且能缓解方差过大或过小的现象.一、 随机事件的概率1、必然事件:一般地,把在条件S 下,一定会发生的事件叫做相对于条件S 的必然事件。
文科高考数学重难点05 概率与统计(解析版)
重难点05 概率与统计【命题趋势】统计与概率是高考文科中的一个重要的一环高考对概率与统计内容的考查一般以实际应用题出现,这既是这类问题的特点,也符合高考发展的方向.概率应用题侧重于古典概率,近几年的高考有以概率应用题替代传统应用题的趋势,该题出现在解答题第二或第三题的位置,可见概率统计在高考中属于中档题.虽为中档题,但是实际生活背景在加强,阅读量大,所以快速阅读考题并准确理解题意是很重要的.对于这部分,我们还应当重视与传统内容的有机结合. 为了准确地把握2020年高考概率统计命题思想与趋势,在最后的复习中做到有的放矢,提高复习效率,纵观近五年的全国文科I卷,我们看到近几年每年一考,多出现在19题,分值12分;从难度上看:以中档题为主,重基础,考查的重点为统计图表的绘制与分析、数字特征的计算与分析、概率计算、线性回归分析,独立性检验等知识点,一般都会以实际问题为载体,代替传统建模题目.本专题我们把这些热点问题逐一说明,并提出备考指南,希望同学们在复习时抓住重点、事半功倍.【热点预测以及解题技巧】热点一:“统计”背景下的“概率”问题这类问题一般将统计与概率相结合.以频率分布直方图或茎叶图为背景来考查概率知识,有时以表格为背景来考查概率知识,需要从统计图、表格获取信息、处理数据的能力,并根据得出的数据求概率.热点二:样本分析并通过样本分析作决策进行样本分析时从统计图表中获取数据,得出频率、平均数、方差,用样本频率估计概率、样本数字特征估计总体数字特征,有时需以此作出决策.热点三:线性回归分析根据最小二乘法得出回归直线方程,有时需适当换元转化为线性回归方程. 由于计算量很大,题目一般会给出的参考数据,但是注意数据设置的“障眼法”,这时就要认真领会题意,找出适用的参考数据加以计算.热点四:独立性检验寻找数据完成列联表,下面的解题步骤比较固定,按部就班完成即可.热点五:与函数相结合的概率统计题这类题也是近几年出现较多的一类题,其综合性强,理解题意后找准变量,构建函数关系式.【限时检测】(建议用时:35分钟)一、单选题1.(2021·广西钦州一中高三开学考试(文))点在边长为2的正方形内运动,P ABCD 则动点到顶点的距离的概率为( )P A 2PA <A .B .C .D .14124ππ【答案】C 【解析】分析:先根据题意得出PA 等于2 的临界值情况,再根据几何概型求解即可.详解:由题可知当PA=2时是以A 为圆心2为半径的四分之一圆,所以概率为P=,故选C21444r ππ=2.(2020·全国高三其他模拟(文))从某高中女学生中选取10名学生,根据其身高、体重数据,得到体重关于身高的回归方程,用来刻画回归效(cm)(kg)ˆ0.8585yx =-果的相关指数,则下列说法正确的是( )20.6R =A .这些女学生的体重和身高具有非线性相关关系B .这些女学生的体重差异有60%是由身高引起的C .身高为的女学生的体重一定为170cm 59.5kgD .这些女学生的身高每增加,其体重约增加0.85cm 1kg 【答案】B【分析】因为回归方程为,且刻画回归效果的相关指数,所以,ˆ0.8585y x =-20.6R =这些女学生的体重和身高具有线性相关关系,A 错误;这些女学生的体重差异有60%是由身高引起的,B 正确;时,,预测身高为的女学生体重为,C 错170x =ˆ0.851708559.5y=⨯-=170cm 59.5kg 误;这些女学生的身高每增加,其体重约增加,D 错误.0.85cm 0.850.850.7225(kg)⨯=故选:B3.(2020·石嘴山市第三中学高三其他模拟(文))网络是一种先进的高频传输技5G 术,我国的技术发展迅速,已位居世界前列.华为公司2019年8月初推出了一款手5G 5G 机,现调查得到该款手机上市时间和市场占有率(单位:%)的几组相关对应数5G x y 据.如图所示的折线图中,横轴1代表2019年8月,2代表2019年9月……,5代表2019年12月,根据数据得出关于的线性回归方程为.若用此方程分析并预y x0.042y x a =+测该款手机市场占有率的变化趋势,则最早何时该款手机市场占有率能超过0.5%(精5G 确到月)()A .2020年6月B .2020年7月C .2020年8月D .2020年9月【答案】C【分析】:,1(12345)35x =⨯++++=1(0.020.050.10.150.18)0.15y =⨯++++=点在直线上()3,0.1ˆˆ0.042y x a =+,ˆ0.10.0423a=⨯+ˆ0.026a =-ˆ0.0420.026yx =-令ˆ0.0420.0260.5y x =->13x ≥因为横轴1代表2019年8月,所以横轴13代表2020年8月,故选:C4.(2020·河南新乡市·高三一模(文))年的“金九银十”变成“铜九铁十”,全2020国各地房价“跳水”严重,但某地二手房交易却“逆市”而行.下图是该地某小区年2019月至年月间,当月在售二手房均价(单位:万元/平方米)的散点图.(图中月11202011份代码分别对应年月年月)113:2019112020:11根据散点图选择和两个模型进行拟合,经过数据处理得到的两y a =+ln y c d x =+个回归方程分别为,并得到以下一些0.9369y =+0.95540.0306ln y x =+统计量的值:是()A .当月在售二手房均价与月份代码呈正相关关系y xB .根据年月在售二手房均价约为万元/0.9369y =+20212 1.0509平方米C .曲线的图形经过点0.9369y =+0.95540.0306ln y x =+()x yD .回归曲线的拟合效果好于的拟合效0.95540.0306ln y x =+ 0.9369y =+果【答案】C【分析】对于A ,散点从左下到右上分布,所以当月在售二手房均价与月份代码呈正y x 相关关系,故A 正确;对于B ,令,由,16x =0.9369 1.0509y =+=所以可以预测年月在售二手房均价约为万元/平方米,故B 正确;20212 1.0509对于C ,非线性回归曲线不一定经过,故C 错误;()x y 对于D ,越大,拟合效果越好,故D 正确.2R 故选:C.5.(2020·全国高三专题练习(文))现行普通高中学生在高一时面临着选科的问题,学校抽取了部分男、女学生意愿的一份样本,制作出如下两个等高堆积条形图:根据这两幅图中的信息,下列哪个统计结论是不正确的( )A .样本中的女生数量多于男生数量B .样本中有两理一文意愿的学生数量多于有两文一理意愿的学生数量C .样本中的男生偏爱两理一文D .样本中的女生偏爱两文一理【答案】D【分析】:由条形图知女生数量多于男生数量,故A 正确;有两理一文意愿的学生数量多于有两文一理意愿的学生数量,故B 正确;男生偏爱两理一文,故C 正确;女生中有两理一文意愿的学生数量多于有两文一理意愿的学生数量,故D 错误.故选:D.6.(2021·全国高三专题练习(文))下图为中国古代刘徽的《九章算术注》中研究“勾股容方”问题的图形,图中为直角三角形,四边形为它的内接正方形,已知ABC :DEFC ,,在内任取一点,则此点取自正方形内的概率为(2BC =4AC =ABC :DEFC)A .B .C .D .12592949【答案】D【分析】解:,,4tan 22AC B BC === tan 2EFB FB ∴==,解得,22()2(2)EF FB BC EF EF ==-=-43EF =,,1142422ACB S AC BC ∴==⨯⨯=::4416339DEFC S =⨯=根据几何概型.164949P ==故选:D .7.(2021·江西新余市·高三期末(文))2013年华人数学家张益唐证明了孪生素数猜想的一个弱化形式.孪生素数猜想是希尔伯特在1900年提出的23个问题之一,可以这样描述:存在无穷多个素数,使得是素数.素数对称为孪生素数.从15以p 2p +(,2)p p +内的素数中任取2个构成素数对,其中是孪生素数的概率为()A .B .C .D .13141516【答案】C【分析】以内的素数有,,,,,,共个,任取两个构成素数对,则152********有:,,,,,,,,,,()2,3()2,5()2,7()2,11()2,13()3,5()3,7()3,11()3,13()5,7,,,,,共中取法,而是孪生素数的有,()5,11()5,13()7,11()7,13()11,1315()3,5,,其概率为.()5,7()11,1331155p ==故选:C.8.(2021·安徽阜阳市·高三期末(文))如图,根据已知的散点图,得到y 关于x 的线性回归方程为,则( )ˆ0.2y bx =+ˆb =A .1.5B .1.8C .2D .1.6【答案】D【分析】因为,所以,解得12345235783,555x y ++++++++====530.2b =+ .1.6b = 故选:D .9.(2021·全国高三专题练习(文))在上随机取一个数,则事件“直线与[]1,1-k y kx =圆相交”发生的概率为( )22(x 13)25y -+=A .B .12513C .D .51234【答案】C【分析】直线与圆相交y kx =22(x 13)25y -+=555,1212d k ⎛⎫⇒∈- ⎪⎝⎭直线斜率时与圆相交,故所求概率.55,1212k ⎛⎫∈- ⎪⎝⎭10512212P ==故答案选C10.(2021·全国高三专题练习(文))给出下列说法:①回归直线恒过样本点的中心,且至少过一个样本点;ˆˆˆy bx a =+(,)x y ②两个变量相关性越强,则相关系数就越接近1;||r ③将一组数据的每个数据都加一个相同的常数后,方差不变;④在回归直线方程中,当解释变量增加一个单位时,预报变量平均减少ˆ20.5y x =-x ˆy0.5个单位.其中说法正确的是( )A .①②④B .②③④C .①③④D .②④【答案】B【分析】对于①中,回归直线恒过样本点的中心,但不一定过一个样本ˆˆˆy bx a =+(x y 点,所以不正确;对于②中,根据相关系数的意义,可得两个变量相关性越强,则相关系数就越接近1,||r 所以是正确的;对于③中,根据方差的计算公式,可得将一组数据的每个数据都加一个相同的常数后,方差是不变的,所以是正确的;对于④中,根据回归系数的含义,可得在回归直线方程中,当解释变量增ˆ20.5y x =-x 加一个单位时,预报变量平均减少0.5个单位,所以是正确的.ˆy 故选:B.11.(2020·江西吉安市·高三其他模拟(文))给出一组样本数据:1,4,,3,它们出m 现的频率分别为0.1,0.1,0.4,0.4,且样本数据的平均值为2.5,从1,4,,3中任取m 两个数,则这两个数的和为5的概率为()A .B .C .D .12231314【答案】C【分析】由题意得,样本平均值为,解得,10.140.10.430.4 2.5m ⨯+⨯+⨯+⨯=2m =即这组样本数据为1,4,2,3,从中任取两个有,,,,,共6种情况,()1,4()1,2()1,3()4,2()4,3()2,3其中和为5的有,两种情况,()1,4()2,3∴所求概率为,2163P ==故选:C.12.(2020·全国高三专题练习(理))物流业景气指数反映物流业经济发展的总体LPI 变化情况,以作为经济强弱的分界点,高于时,反映物流业经济扩张;低于50%50%时,则反映物流业经济收缩。
《高三数学复习教案:概率与统计分析》
《高三数学复习教案:概率与统计分析》一、引言在高三阶段,数学成为了学生们备战高考的重中之重。
而在数学中,概率与统计分析是一个重要而复杂的知识点。
本文旨在为高三学生提供一份完善的数学复习教案,帮助他们系统地复习概率与统计分析,提高解题能力和应试水平。
二、概率与统计的基本概念1. 概率的基本概念概率是指某个事件在相同条件下重复进行的随机试验中出现的可能性大小。
介绍概率的基本概念时,可从试验、样本空间、随机事件等方面入手,明确概率的定义和性质。
2. 随机事件与事件的运算随机事件是样本空间的一个子集,对随机事件的求解可运用集合论中的交、并、差等运算。
在此基础上,还需要介绍和讲解事件的概率,并给出概率计算的相关方法。
三、概率的计算方法1. 古典概型古典概型是指在条件相同、等可能性假设成立的情况下,通过数学方法计算概率的一种方法。
介绍古典概型时,需具体讲解排列与组合的概念和应用,以及计算概率的具体步骤和公式。
2. 几何概型几何概型是指通过几何方法计算概率的一种方法。
介绍几何概型时,需重点讲解面积计算和几何概率的计算公式,以及在实际问题中的应用。
3. 条件概率和事件独立性条件概率是指在已知某一事件发生的条件下,另一事件发生的概率。
在介绍条件概率时,需着重讲解条件概率的定义和计算公式,并给出实际问题的例子。
同时,还需介绍事件的独立性,以及如何判断和计算独立事件的概率。
4. 概率的推断与应用概率的推断是指通过已知的概率信息,推断未知概率的一种方法。
介绍概率的推断时,可讲解频率与概率的关系,最大似然估计等相关概念,以及常见的推断问题和解题方法。
四、统计的基本概念1. 统计的基本概念统计是指对大量数据进行收集、整理、分析和解释的一门科学。
在介绍统计的基本概念时,需包括数据的收集和分类,以及统计推断的目的和意义。
2. 数据的表示与整理数据的表示和整理是统计的基础工作,对各种图表和统计量的应用有助于更好地理解数据。
在介绍数据的表示与整理时,可包括频数分布表、直方图、折线图、散点图等,以及相关统计量的计算和应用。
高中概率统计知识点_高三概率知识点总结范文
《高中概率统计知识点总结》高中概率统计是数学中的重要组成部分,它不仅在高考中占据着重要的地位,而且在实际生活中也有着广泛的应用。
本文将对高中概率统计的知识点进行全面总结,帮助高三学生更好地掌握这部分内容。
一、随机事件与概率1. 随机事件随机事件是在一定条件下可能发生也可能不发生的事件。
必然事件是在一定条件下必然发生的事件,不可能事件是在一定条件下不可能发生的事件。
2. 概率的定义概率是对随机事件发生可能性大小的度量。
对于一个随机事件A,它的概率 P(A)满足0≤P(A)≤1。
当 P(A)=1 时,事件 A 为必然事件;当 P(A)=0 时,事件 A 为不可能事件。
3. 概率的基本性质(1)概率的加法公式:对于任意两个互斥事件 A 和 B,P(A∪B)=P(A)+P(B)。
(2)对立事件的概率:若事件 A 的对立事件为\(\overline{A}\),则 P(A)+P(\(\overline{A}\))=1。
二、古典概型1. 古典概型的特点(1)试验中所有可能出现的基本事件只有有限个。
(2)每个基本事件出现的可能性相等。
2. 古典概型的概率计算公式如果一次试验中共有 n 个基本事件,事件 A 包含其中的 m 个基本事件,则事件 A 的概率 P(A)=\(\frac{m}{n}\)。
三、几何概型1. 几何概型的特点(1)试验中所有可能出现的结果(基本事件)有无限多个。
(2)每个基本事件出现的可能性相等。
2. 几何概型的概率计算公式一般地,在几何区域 D 中随机地取一点,记事件“该点落在其内部一个区域 d 内”为事件 A,则事件 A 发生的概率P(A)=\(\frac{d 的测度}{D 的测度}\)。
这里测度可以是长度、面积、体积等。
四、互斥事件与独立事件1. 互斥事件若事件 A 与事件 B 不能同时发生,则称事件 A 与事件 B 为互斥事件。
互斥事件的概率加法公式为P(A∪B)=P(A)+P(B)(A、B 互斥)。
数学高三数学概率与统计知识总结与题型解析
数学高三数学概率与统计知识总结与题型解析概率与统计是高中数学中的一个重要部分,也是数学高考中的一个重点考点。
掌握好概率与统计的知识对于高三学生来说非常重要。
本文将对高三数学概率与统计的知识进行总结,并解析一些常见的题型。
一、概率的基本概念和性质概率是研究随机试验结果出现的可能性的数学理论。
在概率的研究中,有几个基本概念和性质需要掌握。
1.1 试验、样本空间和事件随机试验是指具有以下三个特点的试验:可以在相同的条件下重复进行,每次试验的结果不确定,且试验的结果有多种可能性。
样本空间是指一个随机试验的所有可能结果的集合。
事件是样本空间的一个子集,表示随机试验中我们关心的一些结果。
1.2 概率的定义和性质概率的定义可以通过两种方式来描述:频率定义和古典定义。
频率定义是指当试验重复进行很多次时,事件发生的频率趋近于概率值。
古典定义是指在满足条件的情况下,事件发生的可能性与样本空间中元素个数的比值。
概率具有以下几个性质:非负性、规范性、可列可加性、互斥性和独立性。
1.3 条件概率和乘法定理条件概率是指在另一个事件已经发生的条件下,某个事件发生的概率。
条件概率可以通过乘法定理来计算。
二、离散型随机变量离散型随机变量是指在有限或可数无限个取值中取一个确定值的变量。
离散型随机变量具有以下几个重要的性质:概率函数、分布函数、数学期望、方差等。
2.1 二项分布二项分布是指在n次独立的伯努利试验中,事件发生的次数所符合的概率分布。
如果事件发生的概率为p,不发生的概率为q=1-p,那么在n次试验中,事件发生k次的概率可以由二项分布来计算。
2.2 泊松分布泊松分布是在一定时间或空间范围内,某个事件发生的概率符合的分布。
泊松分布的参数λ表示单位时间或单位空间内事件的平均发生率。
三、连续型随机变量连续型随机变量是指在一个或者几个区间内取值的变量。
连续型随机变量具有以下几个重要的性质:概率密度函数、分布函数、数学期望、方差等。
高中数学经典概率与统计(解析版)
概率与统计统计与概率是高考文科中的一个重要的一环高考对概率与统计内容的考查一般以实际应用题出现,这既是这类问题的特点,也符合高考发展的方向.概率应用题侧重于古典概率,近几年的高考有以概率应用题替代传统应用题的趋势,该题出现在解答题第二或第三题的位置,可见概率统计在高考中属于中档题.虽为中档题,但是实际生活背景在加强,阅读量大,所以快速阅读考题并准确理解题意是很重要的.对于这部分,我们还应当重视与传统内容的有机结合. 为了准确地把握2020年高考概率统计命题思想与趋势,在最后的复习中做到有的放矢,提高复习效率,纵观近五年的全国文科I卷,我们看到近几年每年一考,多出现在19题,分值12分;从难度上看:以中档题为主,重基础,考查的重点为统计图表的绘制与分析、数字特征的计算与分析、概率计算、线性回归分析,独立性检验等知识点,一般都会以实际问题为载体,代替传统建模题目.本专题我们把这些热点问题逐一说明,并提出备考指南,希望同学们在复习时抓住重点、事半功倍.【热点预测以及解题技巧】1 .抽样方法是统计学的基础,在复习时要抓住各种抽样方法的概念以及它们之间的区别与联系.茎叶图也成为高考的热点内容,应重点掌握.明确变量间的相关关系,体会最小二乘法和线性回归方法是解决两个变量线性相关的基本方法,就能适应高考的要求.2.求解概率问题首先确定是何值概型再用相应公式进行计算,特别对于解互斥事件(独立事件)的概率时,要注意两点:(1)仔细审题,明确题中的几个事件是否为互斥事件(独立事件),要结合题意分析清楚这些事件互斥(独立)的原因.(2)要注意所求的事件是包含这些互斥事件(独立事件)中的哪几个事件的和(积),如果不符合以上两点,就不能用互斥事件的和的概率.3.离散型随机变量的均值和方差是概率知识的进一步延伸,是当前高考的热点内容.解决均值和方差问题,都离不开随机变量的分布列,另外在求解分布列时还要注意分布列性质的应用.【考查题型】选择,填空,解答题【限时检测】(建议用时:45分钟)一、单选题1.(2020·上海闵行区·高三二模)某县共有300个村,现采用系统抽样方法,抽取15个村作为样本,调查农民的生活和生产状况,将300个村编上1到300的号码,求得间隔数3002015k==,即每20个村抽取一个村,在1到20中随机抽取一个数,如果抽到的是7,则从41到60这20个数中应取的号码数是( ) A .45B .46C .47D .48 【答案】C【分析】根据系统抽样的定义和性质即可得到结论.【详解】解:根据题意,样本间隔数3002015k ==,在1到20中抽到的是7, 则41到60为第3组,此时对应的数为7+2×20=47.故选:C.【点睛】本题主要考查系统抽样的应用,样本间距是解决本题的关键,比较基础.2.(2020·上海松江区·高三其他模拟)已知6260126(1)x a a x a x a x +=+++⋯+,在0,a 1,a 2,a ,⋅⋅⋅6a 这7个数中,从中任取两数,则所取的两数之和为偶数的概率为( )A .12B .37C .47D .821【答案】B【分析】根据6260126(1)x a a x a x a x +=+++⋯+,将0,a 1,a 2,a ,⋅⋅⋅6a 计算出来,分清几个奇数,几个偶数, 得到从中任取两数的种数;所取的两数之和为偶数的种数,代入古典概型的概率公式求解.【详解】因为6260126(1)x a a x a x a x +=+++⋯+,0,a 1,a 2,a ,⋅⋅⋅6a 这7个数分别为:061,C =166,C =2615,C =3620,C =4615,C =566,C =661,C =. 4个奇数,3个偶数;从中任取两数共有:2721C =种;所取的两数之和为偶数的有:22439C C +=;∴所取的两数之和为偶数的概率为:93217=. 故选:B.【点睛】本题主要考查二项式系数和古典概型的概率,还考查了运算求解的能力,属于基础题.3.(2019·上海杨浦区·高三一模)某象棋俱乐部有队员5人,其中女队员2人,现随机选派2人参加一个象棋比赛,则选出的2人中恰有1人是女队员的概率为( )A .310B .35C .25D .23【答案】B【分析】直接利用概率公式计算得到答案.【详解】11322563105C C P C ⨯=== ,故选:B 【点睛】本题考查了概率的计算,属于简单题.4.(2019·上海黄浦区·高三二模)在某段时间内,甲地不下雨的概率为1P (101P <<),乙地不下雨的概率为2P (201P <<),若在这段时间内两地下雨相互独立,则这段时间内两地都下雨的概率为( ) A .12PPB .121PP -C .12(1)P P -D .12(1)(1)P P -- 【答案】D【分析】根据相互独立事件的概率,可直接写出结果.【详解】因为甲地不下雨的概率为1P ,乙地不下雨的概率为2P ,且在这段时间内两地下雨相互独立, 所以这段时间内两地都下雨的概率为()()1211P P P =--.故选D【点睛】本题主要考查相互独立事件的概率,熟记概念即可,属于基础题型.二、填空题5.(2020·上海奉贤区·高三一模)某工厂生产A 、B 两种型号的不同产品,产品数量之比为2:3.用分层抽样的方法抽出一个样本容量为n 的样本,则其中A 种型号的产品有14件.现从样本中抽出两件产品,此时含有A 型号产品的概率为__________. 【答案】1117【分析】先由分层抽样抽样比求B 种型号抽取件数,以及n ,再根据古典概型公式求概率. 【详解】设B 种型号抽取m 件,所以1423m =,解得:21m =,142135n =+=, 从样本中抽取2件,含有A 型号产品的概率2111414212351117C C C P C +==.故答案为:11176.(2019·上海市建平中学高三月考)一个总体分为A ,B 两层,其个体数之比为4:1,用分层抽样方法从总体中抽取一个容量为10的样本.已知B 层中甲、乙都被抽到的概率为128,则总体中的个体数为 _____ . 【答案】40【解析】设B 层中的个体数为n ,则211828nn C =⇒=,则总体中的个体数为8540.⨯=7.(2020·上海黄浦区·高三二模)某社区利用分层抽样的方法从140户高收入家庭、280户中等收入家庭、80户低收入家庭中选出100户调查社会购买力的某项指标,则中等收入家庭应选________户.【答案】56【分析】由分层抽样的计算方法有,中等收入家庭的户数占总户数的比例再乘以要抽取的户数,即可得到答案.【详解】该社区共有14028080500++=户.利用分层抽样的方法, 中等收入家庭应选28010056500⨯=户,故答案为:56 【点睛】本题考查分层抽样,注意抽取比例是解决问题的关键,属于基础题.8.(2020·上海高三其他模拟)某校三个年级中,高一年级有学生400人,高二年级有学生360人,高三年级有学生340人,现采用分层抽样的方法从高一年级学生中抽出20人,则从高三年级学生中抽取的人数为________.【答案】17【分析】由于分层抽样是按比例抽取,若设高三年级的学生抽取了x 人,则有40034020x=,求出x 的值即可【详解】解:设高三年级的学生抽取了x 人,则由题意得 40034020x=,解得17x =,故答案为:17 【点睛】此题考查分层抽样,属于基础题.9.(2016·上海杨浦区·复旦附中高三月考)如图所示,一家面包销售店根据以往某种面包的销售记录,绘制了日销售量的频率分布直方图,若一个月以30天计算,估计这家面包店一个月内日销售量不少于150个的天数为________.【答案】9【分析】根据频率分布直方图计算出日销售量不少于150个的频率,然后乘以30即可.【详解】根据频率分布直方图可知,一个月内日销售量不少于150个的频率为()0.0040.002500.3+⨯=, 因此,这家面包店一个月内日销售量不少于150个的天数为300.39⨯=.故答案为9.【点睛】本题考查频率分布直方图的应用,解题时要明确频数、频率和样本容量三者之间的关系,考查计算能力,属于基础题.10.(2020·上海高三专题练习)中位数为1010的一组数构成等差数列,其末项为 2015,则该数列的首项为__________.【答案】5.【解析】设数列的首项为1a ,则12015210102020a+=⨯=,所以15a =,故该数列的首项为5,所以答案应填:5.【考点定位】等差中项.11.(2020·上海浦东新区·高三一模)在7(2)x +的二项展开式中任取一项,则该项系数为有理数的概率为_________.(用数字作答)【答案】12【分析】根据二项展开式的通项,确定有理项所对应的r 的值,从而确定其概率. 【详解】7(2)x +展开式的通项为()77217722rr rr rr r T C x C x --+==,07,r r N ≤≤∈, 当且仅当r 为偶数时,该项系数为有理数,故有0,2,4,6r =满足题意,故所求概率4182P ==.【点睛】(1)二项式定理的核心是通项公式,求解此类问题可以分两步完成:第一步根据所给出的条件(特定项)和通项公式,建立方程来确定指数(求解时要注意二项式系数中n 和r 的隐含条件,即n ,r 均为非负整数,且n ≥r ,如常数项指数为零、有理项指数为整数等);第二步是根据所求的指数,再求所求解的项.(2)求两个多项式的积的特定项,可先化简或利用分类加法计数原理讨论求解.12.(2020·上海松江区·高三一模)从包含学生甲的1200名学生中随机抽取一个容量为80的样本,则学生甲被抽到的概率___.【答案】115【分析】基本事件总数801200n C =,学生甲被抽到包含的基本事件个数79112001m C C =,由此能求出学生甲被抽到的概率.【详解】解:从包含学生甲的1200名学生中随机抽取一个容量为80的样本,基本事件总数801200n C =, 学生甲被抽到包含的基本事件个数79112001m C C =,∴学生甲被抽到的概率79111991801200115C C m P n C ===. 故答案为:115. 【点睛】方法点睛:求概率常用的方法是:先定性(六种概率:古典概型的概率、几何概型的概率、独立事件的概率、互斥事件的概率、条件概率和独立重复试验的概率),再定量.13.(2019·上海市建平中学高三月考)已知方程221x y a b+=表示的曲线为C ,任取a 、{}1,2,3,4,5b ∈,则曲线C 表示焦距等于2的椭圆的概率等于________. 【答案】825【分析】计算出基本事件的总数,并列举出事件“曲线C 表示焦距等于2的椭圆”所包含的基本事件,利用古典概型的概率公式可求得所求事件的概率.【详解】所有可能的(),a b 的组数为:5525⨯=,又因为焦距22c =,所以1c =,所以1a b -=±, 则满足条件的有:()1,2、()2,3、()3,4、()4,5、()5,4、()4,3、()3,2、()2,1,共8组, 所以概率为:825P =.故答案为:825. 【点睛】方法点睛:计算古典概型概率的方法如下:(1)列举法;(2)数状图法;(3)列表法;(4)排列、组合数的应用.14.(2020·上海徐汇区·高三一模)小王同学有4本不同的数学书,3本不同的物理书和3本不同的化学书,从中任取2本,则这2本书属于不同学科的概率为______________(结果用分数表示). 【答案】1115【分析】利用古典概型公式计算概率.【详解】共43310++=本不同的数,任取2本包含21045C =种方法,若从中任取两本,这2本书属于不同学科的情况有11111143433333C C C C C C ⋅+⋅+⋅=,所以这2本书属于不同学科的概率33114515P ==. 故答案为:111515.(2020·上海高三一模)近年来,人们的支付方式发生了巨大转变,使用移动支付购买商品已成为一部分人的消费习惯.某企业为了解该企业员工A 、B 两种移动支付方式的使用情况,从全体员工中随机抽取了100人,统计了他们在某个月的消费支出情况.发现样本中A ,B 两种支付方式都没有使用过的有5人;使用了A 、B 两种方式支付的员工,支付金额和相应人数分布如下:依据以上数据估算:若从该公司随机抽取1名员工,则该员工在该月A 、B 两种支付方式都使用过的概率为______.【答案】310【分析】根据题意,计算出两种支付方式都使用过的人数,即可得到该员工在该月A 、B 两种支付方式都使用过的概率.【详解】解:依题意,使用过A 种支付方式的人数为:18292370++=,使用过B 种支付方式的人数为:10242155++=,又两种支付方式都没用过的有5人,所以两种支付方式都用过的有()()7055100530+--=,所以该员工在该月A 、B 两种支付方式都使用过的概率30310010p ==. 故答案为:310. 【点睛】本题考查了古典概型的概率,主要考查计算能力,属于基础题.16.(2020·上海大学附属中学高三三模)一名工人维护甲、乙两台独立的机床,在一小时内,甲需要维护和乙需要维护相互独立,它们的概率分别为0.4和0.3,则一小时内没有一台机床需要维护的概率为________【答案】0.42【分析】根据甲需要维护和乙需要维护相互独立,它们的概率分别为0.4和0.3,利用独立事件和对立事件的概率求法求解.【详解】因为甲需要维护和乙需要维护相互独立,它们的概率分别为0.4和0.3,所以一小时内没有一台机床需要维护的概率为()()10.410.30.42-⨯-=,故答案为:0.42【点睛】本题主要考查独立事件和对立事件的概率,属于基础题.17.(2020·上海长宁区·高三三模)2021年某省将实行“312++”的新高考模式,即语文、数学、英语三科必选,物理、历史二选一,化学、生物、政治、地理四选二,若甲同学选科没有偏好,且不受其他因素影响,则甲同学同时选择历史和化学的概率为________ 【答案】14【分析】甲同学从物理、历史二选一,其中选历史的概率为12,从化学、生物、政治、地理四选二,有6种选法,其中选化学的有3种,从而可得四选二,选化学的概率为12,然后由分步原理可得同时选择历史和化学的概率.【详解】解:由甲同学选科没有偏好,且不受其他因素影响,所以甲同学从物理、历史二选一选历史的概率为12,甲同学从化学、生物、政治、地理四选二有:化学与生物,化学与政治,化学与地理,生物与政治,生物与地理,政治与地理共6种不同的选法,其中选化学的有3种,所以四选二中有化学的概率为12, 所以由分步原理可知甲同学同时选择历史和化学的概率为111=224⨯, 故答案为:14 【点睛】此题考查古典概型概率以及独立事件概率乘法公式的求法,考查理解运算能力,属于基础题. 18.(2019·上海市七宝中学高三三模)一名信息员维护甲乙两公司的5G 网络,一天内甲公司需要维护和乙公司需要维护相互独立,它们需要维护的概率分别为0.4和0.3,则至少有一个公司不需要维护的概率为________【答案】0.88【分析】根据相互独立事件概率计算公式和对立事件的概率计算公式直接求解即可.【详解】"至少有一个公司不需要维护"的对立事件是"两公司都需要维护",所以至少有一个公司不需要维护的概率为10.30.40.88p =-⨯=,故答案为0.88.【点睛】本题主要考查概率的求法以及相互独立事件概率计算公式和对立事件的概率计算公式的应用. 19.(2019·上海金山区·高三二模)若生产某种零件需要经过两道工序,在第一、二道工序中生产出废品的概率分别为0.01、0.02,每道工序生产废品相互独立,则经过两道工序后得到的零件不是废品的概率是________(结果用小数表示)【答案】0.9702【分析】利用对立事件概率计算公式和相互独立事件概率乘法公式能求出经过两道工序后得到的零件不是废品的概率.【详解】生产某种零件需要经过两道工序,在第一、二道工序中生产出废品的概率分别0.01、0.02, 每道工序生产废品相互独立,则经过两道工序后得到的零件不是废品的概率:p =(1﹣0.01)(1﹣0.02)=0.9702.故答案为0.9702.【点睛】本题考查概率的求法,考查对立事件概率计算公式和相互独立事件概率乘法公式等基础知识,考查运算求解能力,是基础题.三、解答题20.(2019·上海普陀区·)某城市自2014年至2019年每年年初统计得到的人口数量如表所示.(1)设第n 年的人口数量为n a (2014年为第1年),根据表中的数据,描述该城市人口数量和2014年至2018年每年该城市人口的增长数量的变化趋势;(2)研究统计人员用函数0.6544450()2000 4.48781x P x e -=++拟合该城市的人口数量,其中x 的单位是年.假设2014年初对应0x =,()P x 的单位是万.设()P x 的反函数为()T x ,求(2440)T 的值(精确到0.1),并解释其实际意义.【分析】(1)根据表中的数据可得从2014年到2019年人口增加的数量,逐年增多,从2017年后,增加的人数逐年减少,但人口总数是逐年增加的;(2)根据函数的表达式,以及反函数的定义,代值计算即可.【详解】(1)201520142135208253f f -=-=,201620152203213568f f -=-=,201720162276220373f f -=-=,201820172339227663f f -=-=,201920182385233946f f -=-=,由上述计算可知,该地区2014年至2019年每年人口增长数量呈先增后减的变化趋势,每一年任可总数呈逐渐递增的趋势;(2)因为0.65444.48781x e -+为单调递减函数,则()P x 为单调递增函数,则0(2440)T x =0()2440P x ⇒=, 代入000.6544450()200024404.48781x P x e -=+=+,解得08.1x =,即(2440)8.1T =, 其实际意义为:可根据数学模型预测人口数量增长规律,及提供有效依据,到2022年人口接近2440万.【点睛】该题考查的是有关统计的问题,涉及到的知识点有利用表格判断其变化趋势,利用题中所给的函数解析式,计算相关的量,反函数的定义,属于中档题目.。
高三数学选择填空难题突破:概率与统计相结合问题
高三数学选择填空难题突破:概率与统计相结合问题概要:本文档将介绍高三数学选择填空难题的突破方法,重点在于概率与统计的相结合问题。
通过对这类问题的分析和解答,学生可以提高解题能力,更好地应对考试。
介绍:高三数学考试中,选择填空是常见的题型之一。
其中,概率与统计相结合的问题常常令学生困扰。
这一类问题需要综合运用概率和统计的知识来解答,对学生的理解和分析能力有一定的要求。
因此,熟悉这类问题的解题方法,能够帮助学生在考试中更加轻松地应对。
解题方法:1. 理解概率和统计的基本概念:首先,学生需要对概率和统计的基本概念有清晰的理解,包括事件、样本空间、随机变量等。
只有掌握这些基础知识,学生才能更好地理解问题,把握解题思路。
2. 分析问题要求:在解题过程中,学生需要仔细分析问题的要求,确定问题的关键信息。
了解问题所涉及的概率和统计的概念及其相关计算方法,可以帮助学生更好地理解问题,找到正确的解题思路。
3. 运用概率的知识:对于概率与统计相结合的问题,学生需要根据题目提供的信息,计算概率。
这包括计算事件的概率、条件概率、互斥事件的概率等。
熟练掌握概率的计算方法,能够帮助学生准确解答这类问题。
4. 运用统计的知识:统计的概念及其计算方法同样对解题起到关键作用。
学生可以根据问题的要求,收集、整理和分析数据。
例如,计算样本的均值、方差、标准差等。
通过统计方法,可以更好地理解问题,找到问题的解答方法。
总结:通过概率和统计的相结合问题的学习和解答,高三学生可以提高解题的能力。
熟练掌握概率和统计的基本概念,分析问题要求,运用概率和统计的知识,可以帮助学生更好地应对这类难题。
希望本文档对高三学生的数学学习有所帮助。
2020版高三新课标大二轮专题辅导与增分攻略数学(文)讲义:高考解答题突破(五) 概率与统计
高考解答题突破(五)概率与统计突破“两辨”——辨析、辨型概率与统计问题的求解关键是辨别它的模型,只要找到模型,问题便迎刃而解.而概率模型的提取往往需要经过观察、分析、归纳、判断等复杂的辨析思维过程,常常因题设条件理解不准,某个概念认识不清而误入歧途.另外,还需弄清楚概率模型中等可能事件、互斥事件、对立事件等事件间的关系,注意放回和不放回试验的区别,合理划分复合事件.考向一古典概型的概率认真阅读题目,收集各种信息,理解题意.判断试验为古典概型后用字母表示所求事件,利用列举法求出总的基本事件个数及所求事件中包含的基本事件个数,代入公式求解.[解题指导]列举基本事件并确定总数―→确定所求事件个数―→代入古典概型公式求概率[解](1)由题意知,(a,b,c)所有的可能为(1,1,1),(1,1,2),(1,1,3),(1,2,1),(1,2,2),(1,2,3),(1,3,1),(1,3,2),(1,3,3),(2,1,1),(2,1,2),(2,1,3),(2,2,1),(2,2,2),(2,2,3),(2,3,1),(2,3,2),(2,3,3),(3,1,1),(3,1,2),(3,1,3),(3,2,1),(3,2,2),(3,2,3),(3,3,1),(3,3,2),(3,3,3),共27种.古典概型概率问题的关注点求古典概型的概率,关键利用列举法求解基本事件数,求解时要避免“重”和“漏”.要做到正确理解题意,明确一些常见的关键词,如“至多”“至少”“只有”等,还要熟练使用常用的列举方法,如表格法,树图法等.只有有规律地列举基本事件,才能避免“重”和“漏”.1.某校拟从高二年级2名文科生和4名理科生中选出4名同学代表学校参加知识竞赛,其中每个人被选中的可能性均相等.(1)求被选中的4名同学中恰有2名文科生的概率;(2)求被选中的4名同学中至少有1名文科生的概率.[解]将2名文科生和4名理科生依次编号为1,2,3,4,5,6,从2名文科生和4名理科生中选出4名同学记为(a,b,c,d),其结果有(1,2,3,4),(1,2,3,5),(1,2,3,6),(1,2,4,5),(1,2,4,6),(1,2,5,6),(1,3,4,5),(1,3,4,6),(1,3,5,6),(1,4,5,6),(2,3,4,5),(2,3,4,6),(2,3,5,6),(2,4,5,6),(3,4,5,6),共15种.(1)被选中的4名同学中恰有2名文科生的结果有(1,2,3,4),(1,2,3,5),(1,2,3,6),(1,2,4,5),(1,2,4,6),(1,2,5,6),共6种.记“被选中的4名同学中恰有2名文科生”为事件A,则P(A)=615=2 5.(2)记“被选中的4名同学中至少有1名文科生”为事件B,则事件B包含有1名文科生或者2名文科生这两种情况.其对立事件B为“被选中的4名同学中没有文科生”.只有一种结果(3,4,5,6).因为P(B)=1 15,所以P(B)=1-P(B)=1-115=1415.考向二线性回归分析与独立性检验1.在分析两个变量的相关关系时,可根据样本数据作出散点图来确定两个变量之间是否具有相关关系,若具有线性相关关系,则可通过线性回归方程估计和预测变量的值.2.独立性检验的关键是根据2×2列联表准确计算出K2,再做判断.[解题指导]理解图表信息→计算公式中的相关数据→确定回归方程→作出预测[解](1)从特征量y的5次试验数据中随机抽取两个数据的情况有{601,605},{601,597},{601,599},{601,598},{605,597},{605,599},{605,598},{597,599},{597,598},{599,598}.共10种;其中两个数据都不大于600的情况有{597,599},{597,598},{599,598},共3种.记“至少有一个大于600”为事件A,线性回归分析与独立性检验问题的关注点(1)由回归方程分析得出的数据只是预测值不是精确值,此类问题的易错点是方程中b ^的计算,代入公式计算要细心.(2)独立性检验是指利用2×2列联表,通过计算随机变量K 2来确定在多大程度上两个分类变量有关系的方法.2.(2019·东北三校联考)为了研究使用淡化海砂与混凝土耐久性是否达标有关,某大学实验室随机抽取了60个样本,得到了相关数据如下表:(1)根据表中数据,求出s ,t 的值,利用独立性检验的方法判断,能否在犯错误的概率不超过1%的前提下认为使用淡化海砂与混凝土耐久性是否达标有关?(2)若用分层抽样的方法在使用淡化海砂的样本中抽取了6个,现从这6个样本中任取2个,则取出的2个样本混凝土耐久性都达标的概率是多少?参考公式:K 2=n (ad -bc )(a +b )(c +d )(a +c )(b +d ).[解] (1)s =30-15=15,t =30-25=5.由已知数据可求得K 2=60×(25×15-15×5)230×30×40×20=7.5>6.635.因此,能在犯错误的概率不超过1%的前提下,认为使用淡化海砂与混凝土耐久性是否达标有关.(2)用分层抽样的方法在使用淡化海砂的样本中抽取了6个,其中应抽取“混凝土耐久性达标”的个数为2530×6=5.“混凝土耐久性不达标”的个数为1.“混凝土耐久性达标”的记为A 1,A 2,A 3,A 4,A 5,“混凝土耐久性不达标”的记为B .从这6个样本中任取2个,共有15种可能.设“取出的2个样本混凝土耐久性都达标”为事件A ,它的对立事件A -为“取出的2个样本至少有一个混凝土耐久性不达标”,包含(A 1,B ),(A 2,B ),(A 3,B ),(A 4,B ),(A 5,B ),共5种可能,所以P (A )=1-P (A -)=1-515=23.故取出的2个样本混凝土耐久性都达标的概率是23.专题强化训练(二十六)1.某中学调查了某班全部45名同学参加书法社团和演讲社团的情况,数据如下表:(单(2)在既参加书法社团又参加演讲社团的8名同学中,有5名男同学A 1,A 2,A 3,A 4,A 5,3名女同学B 1,B 2,B 3.现从这5名男同学和3名女同学中各随机选1人,求A 1被选中且B 1未被选中的概率.[解] (1)记“该同学至少参加上述一个社团为事件A ”,则P (A )=8+2+545=13.所以该同学至少参加上述一个社团的概率为13.(2)从5名男同学和3名女同学中各随机选1人的基本事件有:(A 1,B 1),(A 1,B 2),(A 1,B 3),(A 2,B 1),(A 2,B 2),(A 2,B 3),(A 3,B 1),(A 3,B 2),(A 3,B 3),(A 4,B 1),(A 4,B 2),(A 4,B 3),(A 5,B 1),(A 5,B 2),(A 5,B 3)共15个.根据题意,这些基本事件的出现是等可能的.其中A 1被选中且B 1未被选中的基本事件有(A 1,B 2),(A 1,B 3)共2个,所以A 1被选中且B 1未被选中的概率为P =215.2.(2019·全国卷Ⅱ)某行业主管部门为了解本行业中小企业的生产情况,随机调查了100(2)求这类企业产值增长率的平均数与标准差的估计值(同一组中的数据用该组区间的中点值为代表).(精确到0.01)附:74≈8.602.[解] (1)根据产值增长率频数分布表得,所调查的100个企业中产值增长率不低于40%的企业频率为14+7100=0.21.产值负增长的企业频率为2100=0.02.用样本频率分布估计总体分布得这类企业中产值增长率不低于40%的企业比例为21%,产值负增长的企业比例为2%.(2)y -=1100(-0.10×2+0.10×24+0.30×53+0.50×14+0.70×7)=0.30,s 2=1100 i =15n i (y i -y -)2 =1100[2×(-0.40)2+24×(-0.20)2+53×02+14×0.202+7×0.402]=0.0296, s =0.0296=0.02×74≈0.17.所以,这类企业产值增长率的平均数与标准差的估计值分别为30%,17%. 3.(2019·广东江门3月模拟)为探索课堂教学改革,江门某中学数学老师用“传统教学”和“导学案”两种教学方式分别在甲、乙两个平行班进行教学试验.为了解教学效果,期末考试后,分别从两个班级各随机抽取20名学生的成绩进行统计,得到如下茎叶图.记成绩不低于70分者为“成绩优良”.(1)请大致判断哪种教学方式的教学效果更佳,并说明理由;(2)构造一个教学方式与成绩优良的2×2列联表,并判断能否在犯错误的概率不超过0.05的前提下认为“成绩优良与教学方式有关”.⎝ ⎛⎭⎪⎫附:K 2=n (ad -bc )2(a +b )(c +d )(a +c )(b +d ),其中n =a +b +c +d[解] (1)“理由1:乙班样本数学成绩大多在70分以上,甲班样本数学成绩70分以下的明显更多. 理由2:甲班样本数学成绩的平均分为70.2;乙班样本数学成绩的平均分为79.05.理由3:甲班样本数学成绩的中位数为68+722=70,乙班样本数学成绩的中位数为77+782=77.5.由上表可得K 2=20×20×26×14≈3.956>3.841,所以能在犯错误的概率不超过0.05的前提下认为“成绩优良与教学方式有关”.4.(2019·河北衡水中学5月模拟)已知鸡的产蛋量与鸡舍的温度有关.为了确定某一个时段鸡舍的控制温度,某企业需要了解鸡舍的时段控制温度x (单位:℃)对某种鸡的时段产蛋量y (单位:t)和时段投入成本z (单位:万元)的影响.为此,该企业选取了7个鸡舍的时段控制温度x i 和产蛋量y i (i =1,2,…,7)的数据,对数据初步处理后得到了如图所示的散点图及一些统计量的值.其中k i =ln y i ,k -=17∑i =17k i .(1)根据散点图判断,y =bx +a 与y =c 1e c 2x (e 为自然对数的底数)哪一个适宜作为该种鸡的时段产蛋量y 关于鸡舍的时段控制温度x 的回归方程类型?(给出判断即可,不必说明理由)(2)根据(1)的判断及表中的数据,建立y 关于x 的回归方程;(3)已知时段投入成本z 与x ,y 的关系为z =e -2.5y -0.1x +10,当鸡舍的时段控制温度为28 ℃时,鸡的时段产蛋量及时段投入成本的预报值是多少?附:对于一组具有线性相关关系的数据(u 1,v 1),(u 2,v 2),…,(u n ,v n ),其回归直线v =βu +α的斜率和截距的最小二乘估计分别为β^=∑i =1n(u i -u -)(v i -v -)∑i =1n(u i -u -)2,α^=v --β^u -.12时段控制温度x 的回归方程类型.(2)令k =ln y ,建立k 关于x 的线性回归方程k =dx +c (d =c 2,c =ln c 1).由题意,得d ^=∑i =17(x i -x -)(k i -k -)∑i =17(x i -x -)2=35.00140.00=0.25,c ^=k --d ^x -=3.60-0.25×17.40=-0.75, 所以k 关于x 的线性回归方程为k ^=0.25x -0.75,c 2=0.25,c 1=e -0.75=0.47,故y 关于x 的回归方程为y ^=0.47e 0.25x .(3)由(2)知,当x =28时,鸡的时段产蛋量y 的预报值y ^=0.47e 0.25×28=0.47e 7=0.47×1096.63≈515.42(t),时段投入成本z 的预报值z ^=e -2.5×515.42-0.1×28+10=0.08×515.42-2.8+10≈48.43(万元).即鸡舍的温度为28℃时,鸡的时段产蛋量的预报值为515.42,时段投入成本的预报值为48.43.。
数学高三概率与统计章节重点知识梳理与习题攻略
数学高三概率与统计章节重点知识梳理与习题攻略概率与统计是高中数学中的重要章节,也是高考中的热点内容。
精通概率与统计对于学生提高数学成绩、应对高考至关重要。
为此,本文将对高三概率与统计章节的重点知识进行梳理,并提供习题攻略,帮助学生更好地掌握这一知识点。
一、基本概念1.事件与样本空间在概率与统计中,我们需要了解事件和样本空间的概念。
事件是指一个我们感兴趣的结果或者结果的集合,而样本空间是所有可能结果的集合。
2.概率概率是指某个事件发生的可能性大小。
常见的概率有经典概率、几何概率和统计概率等。
3.条件概率条件概率是指在某个事件已经发生的条件下,另一个事件发生的概率。
它可以用公式表示为:P(B|A) = P(A∩B)/P(A)。
4.互斥事件与独立事件互斥事件是指两个事件不能同时发生的情况,独立事件是指两个事件的发生不会相互影响。
二、概率计算方法1.加法原理与乘法原理加法原理是指计算两个事件至少发生一个的概率。
乘法原理是指计算两个事件同时发生的概率。
2.全概率公式和贝叶斯定理全概率公式是指在一组互斥事件的基础上计算某个事件的概率。
贝叶斯定理是指在已知某个事件发生的条件下计算另一个事件发生的概率。
三、随机变量与概率分布1.随机变量随机变量是指随机试验结果的某个函数,它可以是离散型随机变量或连续型随机变量。
2.离散型随机变量的概率分布离散型随机变量的概率分布可以用概率函数、分布列和累积分布函数来表示。
3.连续型随机变量的概率密度函数和分布函数连续型随机变量的概率密度函数和分布函数可以用来描述其取值的概率。
四、常见的概率分布1.二项分布与泊松分布二项分布是指在一系列独立的、相同概率的伯努利试验中,成功次数的概率分布。
泊松分布是指在一个固定时间或空间内,随机事件发生的概率分布。
2.正态分布正态分布是指在自然界种种现象中,满足特定条件的随机变量的概率分布。
它是统计学中最重要的分布之一。
五、统计推断1.抽样与抽样分布抽样是指从总体中选取个体(样本),通过对样本的统计量进行分析推断出总体特征。
高三数学知识点统计概率
高三数学知识点统计概率统计概率是高三数学中的重要知识点之一,它通过对统计数据进行分析和计算,帮助我们了解事件发生的概率。
下面将从基本概念、概率计算方法和应用实例三个方面进行介绍。
一、基本概念概率是指某一事件在相同条件下发生的可能性大小。
在统计学中,常用的概率计算方法包括频率概率和几何概率两种。
1.1 频率概率频率概率是通过统计大量实验结果得到的概率。
它的计算公式为:事件发生次数/总实验次数。
1.2 几何概率几何概率是通过计算事件所占的样本空间的面积或体积得到的概率。
它的计算公式为:事件发生的可能结果数/总可能结果数。
二、概率计算方法在统计概率的计算中,常用的方法有加法法则、乘法法则和条件概率。
2.1 加法法则加法法则用于计算两个事件中至少发生一个事件的概率。
当两个事件互斥时(即两个事件不可能同时发生),可以直接使用加法法则计算:P(A∪B) = P(A) + P(B)。
2.2 乘法法则乘法法则用于计算两个事件同时发生的概率。
当两个事件独立时(即一个事件的发生不影响另一个事件的发生),可以直接使用乘法法则计算:P(A∩B) = P(A) × P(B)。
2.3 条件概率条件概率是指在已知某一事件发生的条件下,另一个事件发生的概率。
条件概率的计算公式为:P(A|B) = P(A∩B) / P(B)。
三、应用实例统计概率在实际生活中有广泛的应用,下面以两个常见的例子介绍其应用。
3.1 投掷骰子假设我们有一枚均匀的六面骰子,每个面上的点数为1~6。
现在我们想知道投掷一次骰子后,点数为偶数的概率是多少。
根据频率概率,我们可以进行一系列实验,统计出点数为偶数的次数,再除以总实验次数,就可以得到概率。
根据几何概率,点数为偶数的可能结果数为3,总可能结果数为6,因此概率为1/2。
3.2 抽奖活动某个电商平台举办了一个抽奖活动,奖品包括一等奖、二等奖和三等奖。
现在我们想知道抽奖时至少抽到二等奖的概率是多少。
34:概率高三复习数学知识点总结(全)
概率1.随机事件的概率(1)必然事件:在一定条件下,必然会发生的事件;(2)不可能事件:在一定条件下,肯定不会发生的事件;(3)随机事件:在一定条件下,可能发生也可能不发生的事件.(4)随机事件的概率:对于给定的随机事件,A 在大量重复进行同一试验时,事件A 发生的频率n m会在某个常数附近摆动并趋于稳定,我们把这个常数常数称为随机事件A 的概率,记作).(A P 注:由定义可知,1)(0≤≤A P 必然事件的概率是1,不可能事件的概率是0.2.事件的关系与运算定义符号表示包含关系如果事件A 发生,则事件B 一定发生,这时称事件B 包含事件A (或称事件A 包含于事件B )B ⊇A (或A ⊆B )相等关系若A ⊆B 且B ⊆A A =B并事件(和事件)若某事件发生当且仅当事件A 发生或事件B 发生,称此事件为事件A 与事件B 的并事件(或和事件)A ∪B (或A +B )交事件(积事件)若某事件发生当且仅当事件A 发生且事件B 发生,则称此事件为事件A 与事件B 的交事件(或积事件)A ∩B (或AB )互斥事件若A ∩B 为不可能事件(A ∩B =∅),则称事件A 与事件B 互斥A ∩B =∅对立事件若A ∩B 为不可能事件,A ∪B 为必然事件,那么称事件A 与事件B 互为对立事件A ∩B =∅,P(A)+P(B)=13.古典概型(列举法)(1)古典概型的两大特点:①所有的基本事件只有有限个;②每个基本事件的发生都是等可能的.(2)古典概型的概率计算公式:如果一次试验的等可能基本事件共有n 个,那么每一个等可能基本事件发生的概率都是.1n 如果某个事件A 包含了其中m 个等可能基本事件,那么事件A 发生的概率为.)(nmA P =例1-1【2020全国I 文】设O 为正方形ABCD 的中心,在D CB A O ,,,,中任选三点,则取到三点共线的概率为()A.51B.52 C.21 D.54例1-2【2016全国I 文】为美化环境,从红、黄、白、紫4种颜色的花中任取2种花种在一个花坛中,余下的2种花种在另一个花坛中,则红色和紫色的花不在同一花坛的概率是()A.31 B.21 C.32 D.65例1-3【2016江苏高考】将一颗质地均匀的骰子(一种各个面上分别标有1,2,3,4,5,6个点的正方体玩具)先后抛掷2次,则出现向上的点数之和小于10的概率是.答:1-1:A ;1-2:C;1-3:65.4.互斥事件和对立事件(1)互斥事件:不能同时发生的两个事件叫做互斥事件.一般地,如果事件n A A A ,,,21 中的任意两个都是互斥事件,则称事件n A A A ,,,21 彼此互斥.(2)互斥事件概率公式:如果事件B A ,互斥,那么事件B A +发生(注:B A +表示事件B A ,至少有一个发生)的概率,等于事件B A ,分别发生的概率的和,即).()()(B P A P B A P +=+推广:一般地,若n A A A ,,,21 彼此互斥,那么).()()()(2121n n A P A P A P A A A P +++=+++ 注:若A,B 不互斥,则).()()()(B A P B P A P B A P -+=(3)对立事件:如果两个互斥事件必有一个发生,那么称这两个事件为对立事件.事件A 的对立事件记为.A (4)对立事件的概率公式:).(1)(A P A P -=注:“至多”,“至少”的问题考虑反面(对立事件)往往比较简单.例2-1:某中学的学生积极参加体育锻炼,其中有96%的学生喜欢足球或游泳,60%的学生喜欢足球,82%的学生喜欢游泳,则该中学既喜欢足球又喜欢游泳的学生数占该校学生总数的比例是()A.62% B.56% C.46% D.42%例2-2:将一枚骰子连续抛掷两次,至少有一次向上的点数为1的概率是.答:2-1:C;2-2:.36115.事件的独立性(1)条件概率:一般地,对于两个事件A 和,B 在已知事件B 发生的条件下事件A 发生的概率,称为事件B 发生的条件下事件A 的条件概率,记为).|(B A P 概率的乘法公式:).()|()(B P B A P AB P =注:事件AB 表示事件A 和事件B 同时发生.(2)事件的独立性①定义:一般地,若事件B A ,满足)()|(A P B A P =(即事件B 发生不影响事件A 发生的概率),则称事件B A ,独立.②性质:若事件B A ,相互独立,则事件A 与B ,A 与,B A 与B 都相互独立.③公式:事件B A ,相互独立的充要条件是).()()(B P A P AB P =④推广:若n A A A ,,,21 相互独立,则这n 个事件同时发生的概率为).()()()(2121n n A P A P A P A A A P =⑤区别:独立事件与互斥事件的根本区别在于是否能同时发生,如果不能那是互斥事件,如果能再满足)()()(B P A P AB P =则为独立事件.注:求条件概率的两个思路:思路一:缩减样本空间法计算条件概率,如求P (A |B ),可分别求出事件B ,AB 包含的基本事件的个数,再利用公式P (A |B )=n (AB )n (B )计算;思路二:直接利用公式计算条件概率,即先分别计算出P (AB ),P (B ),再利用公式P (A |B )=P (AB )P (B )计算.(3)全概率公式设n A A A ,,,21 是一组两两互斥的事件,,21Ω=n A A A 且,0)(>i A P ,,,2,1n i =则对任意的事件,Ω⊆B 有∑==ni i i A B P A P B P 1).|()()(我们称上面的公式为全概率公式.全概率公式是概率论中最基本的公式之一.6.离散型随机变量及其概率分布(1)随机变量:一般地,如果随机试验的结果可以用一个变量来表示,那么这样的变量叫做随机变量,通常用大写拉丁字母Z Y X ,,(或小写的希腊字母ξ,η,ζ)等表示,而用小写拉丁字母z y x ,,(加上适当下标)等表示随机变量可能的取值.(2)离散型随机变量的概率分布:一般地,假定随机变量X 有n 个不同的取值,它们分别是1x ,2x ,…,n x ,且()i i P X x p ==,1,2,,i n =⋅⋅⋅,①则称①为随机变量X 的概率分布列,简称为X 的分布列.也可以将①用表的形式来表示.X 1x 2x …nx P1p 2p …np 我们将表称为随机变量X 的概率分布表.它和①都叫做随机变量X 的概率分布.注:①),,2,1(0n i p i =≥;②121=+++n p p p ;③求随机变量的概率分布的步骤:1.确定X 的可能取值(1,2,)i x i =…;2.求出相应的概率()i i P X x p ==;3.列成表格的形式.7.常见离散型随机变量的概率分布(1)两点分布(0-1分布)若随机变量X 服从两点分布,即其分布列为X01P p-1p 则,)(p X E =).1()(p p X D -=(2)超几何分布一批产品共N 件,其中有M 件次品,任取n 件,其中恰有X 件次品,则事件}{r X=发生的概率为()r n r M N MnN C C P X r C --==,0,1,2,,r m = ,其中{}min ,m n M =,称X 服从超几何分布,记为),,,(~N M n H X 并将()r n r M N MnNC C P X r C --==记为).,,;(N M n r H X 01…mP00n M N Mn NC C C --11n M N Mn NC C C --…m n m M N Mn NC C C --则N nM X E =)(;)1())(()(2---=N N n N M N nM X D (了解).8.二项分布(1)n 次独立重复试验(伯努利试验)一般地,由n 次试验构成,且每次试验相互独立完成,每次试验的结果仅有两种对立的状态,即A 和,A 每次试验中.0)(>=p A P 我们将这样的试验称为n 次独立重复试验,也称为伯努利试验.(2)二项分布一般地,在n 次独立重复试验中,设事件A 发生的次数为,X 在每次试验事件A 发生的概率均为,p 那么在n 次独立重复试验中,事件A 恰好发生k 次的概率为),2,1,0()1()(n k p p C k X P k n kk n =-==-.此时称随机变量X 服从参数为p n ,的二项分布,记作).,(~p n B X(3)均值与方差若),,(~p n B X 则np x E =)(,).1()(p np x V -=注:超几何分布与二项分布的区别与联系(1)区别:是否有放回是两个的本质区别,有放回是二项分布,无放回是超几何分布;(2)联系:当总体容量较大时如流水线上,也可以用二项分布近似超几何分布.9.离散型随机变量的均值与方差(1)一般地,若离散型随机变量X 的概率分布为X 1x 2x…nx P1p 2p …np 其中,1,,,2,1,021=+++=≥n i p p p n i p 则有如下公式1.均值(数学期望):.)(2211n n p x p x p x X E ++==μ它反映了离散型随机变量取值的平.均水平....注:对于连续型变量通常取“组中值”来代替i x 计算期望.2.方差:.)()()()(22221212n n p x p x p x X V μμμσ-++-+-== (方差也可以用V(x)表示),它刻画了随机变量X 与其均值E (X )的平均偏离程度........3.标准差:.)(X V =σ注:随机变量的方差和标准差都反映了随机变量的取值偏离于均值的平均程度.方差或标准差越小,随机变量偏离于均值的平均程度就越小,稳定性就越好.(2)均值和方差的性质若随机变量b aX Y +=(b a ,为常数),则,)()(b X aE Y E +=).()(2X V a Y V =10.正态分布(1)正态曲线函数,21)(222)(σμπσ--=x e x f 其中实数μ和σ为参数(σ>0,μ∈R).我们称函数)(x f 的图象为正态分布密度曲线,简称正态曲线.(2)正态曲线的特点①曲线位于x 轴上方,与x 轴不相交;当x 无限增大时,曲线无限接近x 轴.②曲线是单峰的,它关于直线μ=x 对称;③曲线在μ=x 处达到峰值1σ2π;④曲线与x 轴之间的面积为1;⑤当σ一定时,曲线的位置由μ确定,曲线随着μ的变化而沿x 轴平移,如图甲所示;⑥当μ一定时,曲线的形状由σ确定,σ越小,曲线越“瘦高”,表示总体的分布越集中;σ越大,曲线越“矮胖”,表示总体的分布越分散,如图乙所示.(3)正态分布的定义及表示①若随机变量X 的概率分布密度函数为,21)(222)(σμπσ--=x e x f 则称随机变量X 服从正态分布,则记作),(~2σμN X .其中,参数μ反映了正态分布的集中位置,σ反映了随机变量的分布相对于均值μ的离散程度,此时=)(X E μ,=)(X D 2σ.特别地,当10==σμ,时,称随机变量X 服从标准正态分布,记作X~N (0,1).②若),,(~2σμN X 则如图所示,X 取值不超过)(x X P ≤为图中区域A 的面积,而)(b X a P ≤≤为区域B的面积.(4)正态总体在三个特殊区间内取值的概率值①P(μ-σ<X ≤μ+σ)=0.6826;②P(μ-2σ<X ≤μ+2σ)=0.9544;③P(μ-3σ<X ≤μ+3σ)=0.9974.注:在实际应用中,通常认为服从正态分布),(2σμN 的随机变量X 只取]3,3[σμσμ+-之间的值,这在统计学中称为σ3原则.在次区间以外取值的概率只有0.0026,通常认为这种情况几乎不可能发生.【解题规范】【2014江苏高考】盒中共有9个球,其中有4个红球,3个黄球和2个绿球,这些球除颜色外完全相同。
【高中数学】 概率与统计
回扣9 概率与统计1.牢记概念与公式 (1)概率的计算公式 ①古典概型的概率计算公式P (A )=事件A 包含的基本事件数m基本事件总数n;②互斥事件的概率计算公式P (A ∪B )=P (A )+P (B );③对立事件的概率计算公式P (A )=1-P (A );④几何概型的概率计算公式P (A )=构成事件A 的区域长度面积或体积试验的全部结果所构成的区域长度面积或体积.(2)抽样方法简单随机抽样、分层抽样、系统抽样.①从容量为N 的总体中抽取容量为n 的样本,则每个个体被抽到的概率都为nN;②分层抽样实际上就是按比例抽样,即按各层个体数占总体的比确定各层应抽取的样本容量.(3)统计中四个数据特征①众数:在样本数据中,出现次数最多的那个数据.②中位数:在样本数据中,将数据按大小排列,位于最中间的数据.如果数据的个数为偶数,就取中间两个数据的平均数作为中位数. ③平均数:样本数据的算术平均数,即x =1n(x 1+x 2+…x n ).④方差与标准差 方差:s 2=1n[(x 1-x )2+(x 2-x )2+…+(x n -x )2].标准差:s =1n[x 1-x 2+x 2-x 2+…+x n -x 2].(4)八组公式①离散型随机变量的分布列的两个性质Ⅰ.p i ≥0(i =1,2,…,n );Ⅱ.p 1+p 2+…+p n =1. ②均值公式E (X )=x 1p 1+x 2p 2+…+x n p n .③均值的性质Ⅰ.E (aX +b )=aE (X )+b ; Ⅱ.若X ~B (n ,p ),则E (X )=np ; Ⅲ.若X 服从两点分布,则E (X )=p . ④方差公式D (X )=[x 1-E (X )]2·p 1+[x 2-E (X )]2·p 2+…+[x n -E (X )]2·p n ,标准差D X .⑤方差的性质Ⅰ.D (aX +b )=a 2D (X );Ⅱ.若X ~B (n ,p ),则D (X )=np (1-p ); Ⅲ.若X 服从两点分布,则D (X )=p (1-p ). ⑥独立事件同时发生的概率计算公式P (AB )=P (A )P (B ).⑦独立重复试验的概率计算公式P n (k )=C k n p k (1-p )n -k . ⑧条件概率公式P (B |A )=P AB P A.2.活用定理与结论 (1)直方图的三个结论①小长方形的面积=组距×频率组距=频率.②各小长方形的面积之和等于1.③小长方形的高=频率组距,所有小长方形高的和为1组距.(2)线性回归方程y ^=b ^x +a ^一定过样本点的中心(x ,y ).(3)利用随机变量K 2=n ad -bc2a +bc +da +cb +d来判断“两个分类变量有关系”的方法称为独立性检验.如果K 2的观测值k 越大,说明“两个分类变量有关系”的可能性越大.(4)如果随机变量X 服从正态分布,则记为X ~N (μ,σ2).满足正态分布的三个基本概率的值是:①P (μ-σ<X ≤μ+σ)=0.682 6;②P (μ-2σ<X ≤μ+2σ2)=0.954 4;③P (μ-3σ<X ≤μ+3σ)=0.997 4.1.应用互斥事件的概率加法公式,一定要注意首先确定各事件是否彼此互斥,然后求出各事件分别发生的概率,再求和.2.正确区别互斥事件与对立事件的关系:对立事件是互斥事件,是互斥中的特殊情况,但互斥事件不一定是对立事件,“互斥”是“对立”的必要不充分条件.3.混淆频率分布条形图和频率分布直方图,误把频率分布直方图纵轴的几何意义当成频率,导致样本数据的频率求错.4.要注意概率P (A |B )与P (AB )的区别(1)在P (A |B )中,事件A ,B 发生有时间上的差异,B 先A 后;在P (AB )中,事件A ,B 同时发生.(2)样本空间不同,在P (A |B )中,事件B 成为样本空间;在P (AB )中,样本空间仍为Ω,因而有P (A |B )≥P (AB ).5.易忘判定随机变量是否服从二项分布,盲目使用二项分布的均值和方差公式计算致误.1.某学校有男学生400名,女学生600名.为了解男女学生在学习兴趣与业余爱好方面是否存在显著差异,拟从全体学生中抽取男学生40名,女学生60名进行调查,则这种抽样方法是( )A.抽签法B.随机数法C.系统抽样法D.分层抽样法 答案 D解析 总体由男生和女生组成,比例为400∶600=2∶3,所抽取的比例也是2∶3,故拟从全体学生中抽取100名学生进行调查,采用的抽样方法是分层抽样法,故选D.2.投掷两颗骰子,得到其向上的点数分别为m 和n ,则复数(m +n i)(n -m i)为实数的概率是( )A.13B.14C.16D.112 答案 C解析 投掷两颗骰子,得到其向上的点数分别为m 和n ,记作(m ,n ),共有6×6=36(种)结果.(m +n i)(n -m i)=2mn +(n 2-m 2)i 为实数,应满足m =n ,有6种情况,所以所求概率为636=16,故选C.3.一个袋子中有5个大小相同的球,其中3个白球2个黑球,现从袋中任意取出一个球,取出后不放回,然后再从袋中任意取出一个球,则第一次为白球、第二次为黑球的概率为( )A.35B.310C.12D.625 答案 B解析 设3个白球分别为a 1,a 2,a 3,2个黑球分别为b 1,b 2,则先后从中取出2个球的所有可能结果为(a 1,a 2),(a 1,a 3),(a 1,b 1),(a 1,b 2),(a 2,a 3),(a 2,b 1),(a 2,b 2),(a 3,b 1),(a 3,b 2),(b 1,b 2),(a 2,a 1),(a 3,a 1),(b 1,a 1),(b 2,a 1),(a 3,a 2),(b 1,a 2),(b 2,a 2),(b 1,a 3),(b 2,a 3),(b 2,b 1),共20种.其中满足第一次为白球、第二次为黑球的有(a 1,b 1),(a 1,b 2),(a 2,b 1),(a 2,b 2),(a 3,b 1),(a 3,b 2),共6种,故所求概率为620=310.4.为了解某社区居民的家庭年收入与年支出的关系,随机调查了该社区5户家庭,得到如下统计数据表:根据上表可得线性回归方程y ^=b ^x +a ^,其中b ^=0.76,a ^=y -b ^x .据此估计,该社区一户年收入为15万元家庭的年支出为( )A.11.4万元B.11.8万元C.12.0万元D.12.2万元 答案 B解析 由题意知,x =8.2+8.6+10.0+11.3+11.95=10,y =6.2+7.5+8.0+8.5+9.85=8,∴a ^=8-0.76×10=0.4, ∴当x =15时,y ^=0.76×15+0.4=11.8(万元).5.设X ~N (1,σ2),其正态分布密度曲线如图所示,且P (X ≥3)=0.022 8,那么向正方形OABC 中随机投掷10 000个点,则落入阴影部分的点的个数的估计值为( )附:(随机变量ξ服从正态分布N (1,σ2),则P (μ-σ<ξ≤μ+σ)=68.26%,P (μ-2σ<ξ≤μ+2σ)=95.44%)( )A.6 038B.6 587C.7 028D.7 539 答案 B解析 由题意知,P (0<X ≤1)=1-12×0.682 6=0.658 7,则落入阴影部分的点的个数的估计值为10 000×0.658 7=6 587.故选B.6.从1,3,5,7,9这五个数中,每次取出两个不同的数分别记为a ,b ,共可得到lg a -lg b 的不同值的个数是( ) A.9 B.10 C.18 D.20 答案 C解析 由于lg a -lg b =lg a b (a >0,b >0),从1,3,5,7,9中任取两个作为ab有A 25=20种,又13与39相同,31与93相同,∴lg a -lg b 的不同值的个数有A 25-2=20-2=18,选C.7.甲、乙两同学用茎叶图记录高三前5次数学测试的成绩,如图所示,他们在分析对比成绩变化时,发现乙同学成绩的一个数字看不清楚了,若已知乙的平均成绩低于甲的平均成绩,则看不清楚的数字为( )A.0B.3C.6D.9 答案 A解析 设看不清的数字为x ,甲的平均成绩为99+100+101+102+1035=101,所以93+94+97+110+110+x 5<101,x <1,所以x =0.故选A.8.在一组样本数据(x 1,y 1),(x 2,y 2),…,(x n ,y n )(n ≥2,x 1,x 2,…,x n 不全相等)的散点图中,若所有样本点(x i ,y i )(i =1,2,…,n )都在直线y =-13x +2上,则这组样本数据的样本的相关系数为( ) A.-1 B.0 C.-13 D.1答案 A解析 数据(x 1,y 1),(x 2,y 2),…,(x n ,y n )(n ≥2,x 1,x 2,…,x n 不全相等)的散点图中,样本点(x i ,y i )(i =1,2,…,n )都在直线y =-13x +2上,说明这组数据点完全负相关,其相关系数为-1,故选A.9.在区间[1,5]和[2,4]内分别取一个数,记为a ,b ,则方程x 2a2+y 2b 2=1表示焦点在x 轴上且离心率小于32的椭圆的概率为________. 答案 1532解析 当方程x 2a2+y 2b 2=1表示焦点在x 轴上且离心率小于32的椭圆时,有⎩⎪⎨⎪⎧a 2>b 2,e =c a=a 2-b 2a <32,即⎩⎪⎨⎪⎧ a 2>b 2,a 2<4b 2, 化简得⎩⎪⎨⎪⎧a >b ,a <2b .又a ∈[1,5],b ∈[2,4],画出满足不等式的平面区域,如图阴影部分所示 ,求得阴影部分的面积为154,故P =S 阴影2×4=1532.10.将某班参加社会实践编号为1,2,3,…,48的48名学生,采用系统抽样的方法抽取一个容量为6的样本,已知5号,21号,29号,37号,45号学生在样本中,则样本中还有一名学生的编号是________. 答案 13解析 系统抽样法取出的样本编号成等差数列,因此还有一个编号为5+8=21-8=13. 11.某班有学生60人,现将所有学生按1,2,3,…,60随机编号,若采用系统抽样的方法抽取一个容量为5的样本(等距抽样),已知编号为4,a ,28,b ,52号学生在样本中,则a +b =________. 答案 56解析 ∵样本容量为5,∴样本间隔为60÷5=12, ∵编号为4,a ,28,b ,52号学生在样本中, ∴a =16,b =40, ∴a +b =56.12.给出如下四对事件:①某人射击1次,“射中7环”与“射中8环”;②甲、乙两人各射击1次,“至少有1人射中目标”与“甲射中,但乙未射中目标”;③从装有2个红球和2个黑球的口袋内任取2个球,“至少一个黑球”与“都是红球”;④从装有2个红球和2个黑球的口袋内任取2个球,“没有黑球”与“恰有一个红球”.其中属于互斥事件的是________.(把你认为正确的事件的序号都填上).答案①③④解析①某人射击1次,“射中7环”与“射中8环”两个事件不会同时发生,故为互斥事件;②甲、乙两人各射击1次,“至少有1人射中目标”与“甲射中,但乙未射中目标”,前者包含后者,故②不是互斥事件;③“至少有一个黑球”与“都是红球”不能同时发生,但一定会有一个发生,所以这两个事件是对立事件,故是互斥事件;④“没有黑球”与“恰有一个红球”,不可能同时发生,故他们属于互斥事件.13.国内某知名大学有男生14 000人,女生10 000人.该校体育学院想了解本校学生的运动状况,根据性别采取分层抽样的方法从全校学生中抽取120人,统计他们平均每天运动的时间,如下表:(平均每天运动的时间单位:小时,该校学生平均每天运动的时间范围是[0,3])男生平均每天运动的时间分布情况:女生平均每天运动的时间分布情况:(1)请根据样本估算该校男生平均每天运动的时间(结果精确到0.1);(2)若规定平均每天运动的时间不少于2小时的学生为“运动达人”,低于2小时的学生为“非运动达人”.①根据样本估算该校“运动达人”的数量;②请根据上述表格中的统计数据填写下面2×2列联表,并通过计算判断能否在犯错误的概率不超过0.05的前提下认为“是否为‘运动达人’与性别有关?”运动达人非运动达人总计 男生 女生 总计参考公式:K 2=n ad -bc2a +ba +da +cb +d,其中n =a +b +c +d参考数据:P (K 2>k 0) 0.15 0.10 0.05 0.025 0.010 0.005 k 02.0722.7063.8415.0246.6357.879解 (1)由分层抽样得:男生抽取的人数为120×14 00014 000+10 000=70,女生抽取的人数为120-70=50,故x =5,y =2,则该校男生平均每天运动的时间为 0.25×2+0.75×12+1.25×23+1.75×18+2.25×10+2.75×570≈1.5.故该校男生平均每天运动的时间约为1.5小时.(2)①样本中“运动达人”所占比例是20120=16,故估计该校“运动达人”有16×(14 000+10000)=4 000(人). ②由表格可知:运动达人 非运动达人总计 男生 15 55 70 女生 5 45 50 总计20100120故K 2的观测值k =120×15×45-5×55220×100×50×70=9635≈2.743<3.841, 故在犯错误的概率不超过0.05的前提下不能认为“是否为‘运动达人’与性别有关”.14.某公司通过初试和复试两轮考试确定最终合格人选,当第一轮初试合格后方可进入第二轮复试,两次考核过程相互独立.根据甲、乙、丙三人现有的水平,第一轮考核甲、乙、丙三人合格的概率分别为0.4、0.6、0.5.第二轮考核,甲、乙、丙三人合格的概率分别为0.5、0.5、0.4.(1)求第一轮考核后甲、乙两人中只有乙合格的概率;(2)设甲、乙、丙三人经过前后两轮考核后合格入选的人数为X ,求X 的分布列和均值. 解 (1)设甲、乙经第一次考核后合格为事件A 1、B 1,设事件E 表示第一轮考核后甲不合格、乙合格,则P (E )=P (A 1·B 1)=0.6×0.6=0.36.即第一轮考核后甲、乙两人中只有乙合格的概率为0.36.(2)分别设甲、乙、丙三人经过前后两次考核后合格入选为事件A 、B 、C ,则P (A )=0.4×0.5=0.2,P (B )=0.6×0.5=0.3,P (C )=0.4×0.5=0.2,经过前后两轮考核后合格入选的人数为X ,则X 可能取0,1,2,3.P (X =0)=0.8×0.7×0.8=0.448,P (X =1)=0.2×0.7×0.8+0.8×0.3×0.8+0.8×0.7×0.2=0.416,P (X =3)=0.2×0.3×0.2=0.012,P (X =2)=1-0.448-0.416-0.012=0.124.X 的分布列为 X0 1 2 3 P0.448 0.416 0.124 0.012均值为E(X)=0×0.448+1×0.416+2×0.124+3×0.012=0.7.。
高三数学第十二章-概率与统计知识点归纳
高中数学知识点第十二章-概率与统计考试内容:抽样方法.总体分布的估计. 总体期望值和方差的估计. 考试要求:(1)了解随机抽样了解分层抽样的意义,会用它们对简单实际问题进行抽样.(2)会用样本频率分布估计总体分布. (3)会用样本估计总体期望值和方差.§12. 概率与统计 知识要点一、随机变量.1. 随机试验的结构应该是不确定的.试验如果满足下述条件: ①试验可以在相同的情形下重复进行;②试验的所有可能结果是明确可知的,并且不止一个;③每次试验总是恰好出现这些结果中的一个,但在一次试验之前却不能肯定这次试验会出现哪一个结果. 它就被称为一个随机试验.2. 离散型随机变量:如果对于随机变量可能取的值,可以按一定次序一一列出,这样的随机变量叫做离散型随机变量.若ξ是一个随机变量,a ,b 是常数.则b a +=ξη也是一个随机变量.一般地,若ξ是随机变量,)(x f 是连续函数或单调函数,则)(ξf 也是随机变量.也就是说,随机变量的某些函数也是随机变量.设离散型随机变量ξ可能取的值为:ΛΛ,,,,21i x x xξ取每一个值),2,1(1Λ=i x 的概率i i p x P ==)(ξ,则表称为随机变量ξ的概率分布,简称ξ的分布列.有性质①Λ,2,1,01=≥i p ; ②121=++++ΛΛi p p p .注意:若随机变量可以取某一区间内的一切值,这样的变量叫做连续型随机变量.例如:]5,0[∈ξ即ξ可以取0~5之间的一切数,包括整数、小数、无理数.3. ⑴二项分布:如果在一次试验中某事件发生的概率是P ,那么在n 次独立重复试验中这个事件恰好发生k 次的概率是:kn k k n qp C k)P(ξ-==[其中p q n k -==1,,,1,0Λ] 于是得到随机变量ξ的概率分布如下:我们称这样的随机变量ξ服从二项分布,记作ξ~B (n ·p ),其中n ,p 为参数,并记p)n b(k;qp C kn kkn⋅=-.⑵二项分布的判断与应用.①二项分布,实际是对n 次独立重复试验.关键是看某一事件是否是进行n 次独立重复,且每次试验只有两种结果,如果不满足此两条件,随机变量就不服从二项分布.②当随机变量的总体很大且抽取的样本容量相对于总体来说又比较小,而每次抽取时又只有两种试验结果,此时可以把它看作独立重复试验,利用二项分布求其分布列.4. 几何分布:“k =ξ”表示在第k 次独立重复试验时,事件第一次发生,如果把k 次试验时事件A 发生记为k A ,事A 不发生记为q )P(A ,A k k =,那么)A A A AP(k)P(ξk 1k 21-==Λ.根据相互独立事件的概率乘法分式:))P(A A P()A )P(A P(k)P(ξk 1k 21-==Λ),3,2,1(1Λ==-k p q k 于是得到随机变量ξ的概率分布列.我们称ξ服从几何分布,并记p q p)g(k,1k -=,其中Λ3,2,1.1=-=k p q5. ⑴超几何分布:一批产品共有N 件,其中有M (M <N )件次品,今抽取)N n n(1≤≤件,则其中的次品数ξ是一离散型随机变量,分布列为)M N k n M,0k (0C C C k)P(ξnNk n MN k M -≤-≤≤≤⋅⋅==--.〔分子是从M 件次品中取k 件,从N-M 件正品中取n-k 件的取法数,如果规定m <r 时0C r m =,则k 的范围可以写为k=0,1,…,n.〕⑵超几何分布的另一种形式:一批产品由 a 件次品、b 件正品组成,今抽取n 件(1≤n ≤a+b ),则次品数ξ的分布列为n.,0,1,k CC C k)P(ξnba kn bk a Λ=⋅==+-.⑶超几何分布与二项分布的关系.设一批产品由a 件次品、b 件正品组成,不放回抽取n 件时,其中次品数ξ服从超几何分布.若放回式抽取,则其中次品数η的分布列可如下求得:把b a +个产品编号,则抽取n 次共有n b a )(+个可能结果,等可能:k)(η=含kn k k n ba C -个结果,故n ,0,1,2,k ,)ba a (1)b a a (C b)(a ba C k)P(ηkn k k n nkn k k n Λ=+-+=+==--,即η~)(b a a n B +⋅.[我们先为k个次品选定位置,共k n C 种选法;然后每个次品位置有a 种选法,每个正品位置有b 种选法] 可以证明:当产品总数很大而抽取个数不多时,k)P(ηk)P(ξ=≈=,因此二项分布可作为超几何分布的近似,无放回抽样可近似看作放回抽样. 二、数学期望与方差.1. 期望的含义:一般地,若离散型随机变量ξ的概率分布为则称ΛΛ++++=n n p x p x p x E 2211ξ为ξ的数学期望或平均数、均值.数学期望又简称期望.数学期望反映了离散型随机变量取值的平均水平. 2. ⑴随机变量b a +=ξη的数学期望:b aE b a E E +=+=ξξη)( ①当0=a 时,b b E =)(,即常数的数学期望就是这个常数本身. ②当1=a 时,b E b E +=+ξξ)(,即随机变量ξ与常数之和的期望等于ξ的期望与这个常数的和.③当0=b 时,ξξaE a E =)(,即常数与随机变量乘积的期望等于这个常数与随机变量期望的乘积.⑵单点分布:c c E =⨯=1ξ其分布列为:c P ==)1(ξ.⑶两点分布:p p q E =⨯+⨯=10ξ,其分布列为:(p + q = 1) ⑷二项分布:∑=⋅-⋅=-np q p k n k n k E k n k )!(!!ξ 其分布列为ξ~),(p n B .(P 为发生ξ的概率)⑸几何分布:pE 1=ξ 其分布列为ξ~),(p k q .(P 为发生ξ的概率)3.方差、标准差的定义:当已知随机变量ξ的分布列为),2,1()(Λ===k p x P k k ξ时,则称ΛΛ+-++-+-=n n p E x pE x p E x D 2222121)()()(ξξξξ为ξ的方差.显然0≥ξD ,故σξξσξ.D =为ξ的根方差或标准差.随机变量ξ的方差与标准差都反映了随机变量ξ取值的稳定与波动,集中与离散的程度.ξD 越小,稳定性越高,波动越小............... 4.方差的性质.⑴随机变量b a +=ξη的方差ξξηD a b a D D 2)()(=+=.(a 、b 均为常数) ⑵单点分布:=ξD 其分布列为p P ==)1(ξ⑶两点分布:pq D =ξ 其分布列为:(+ q = 1)⑷二项分布:npq D =ξ ⑸几何分布:2p q D =ξ5. 期望与方差的关系.⑴如果ξE 和ηE 都存在,则ηξηξE E E ±=±)(⑵设ξ和η是互相独立的两个随机变量,则ηξηξηξξηD D D E E E +=+⋅=)(,)( ⑶期望与方差的转化:22)(ξξξE E D -= ⑷)()()(ξξξξE E E E E -=-(因为ξE 为一常数)0=-=ξξE E .三、正态分布.(基本不列入考试范围)1.密度曲线与密度函数:对于连续型随机变量ξ,位于x 轴上方,ξ落在任一区间),[b a 内的概率等于它与x 轴.直线a x =与直线b x =所围成的曲边梯形的面积图像的函数)(x f 是必然事件,故密度曲线与x 轴所夹部分面积等于1.2. ⑴正态分布与正态曲线:如果随机变量ξ的概率密度为:222)(21)(σμσπ--=x ex f . (σμ,,R x ∈为常数,且0φσ),称ξ服从参数为σμ,的正态分布,用ξ~),(2σμN 表示.)(x f 的表达式可简记为),(2σμN ,它的密度曲线简称为正态曲线.⑵正态分布的期望与方差:若ξ~),(2σμN ,则ξ的期望与方差分别为:2,σξμξ==D E .⑶正态曲线的性质.①曲线在x 轴上方,与x 轴不相交. ②曲线关于直线μ=x 对称.③当μ=x 时曲线处于最高点,当x 向左、向右远离时,曲线不断地降低,呈现出“中间高、两边低”的钟形曲线.④当x <μ时,曲线上升;当x >μ时,曲线下降,并且当曲线向左、向右两边无限延伸时,以x 轴为渐近线,向x 轴无限的靠近. ⑤当μ一定时,曲线的形状由σ确定,σ越大,曲线越“矮胖”.表示总体的分布越分散;σ越小,曲线越“瘦高”,表示总体的分布越集中.3. ⑴标准正态分布:如果随机变量ξ的概率函数为)(21)(22+∞-∞=-ππx ex x πϕ,则称ξ服从标准正态分布. 即ξ~)1,0(N 有)()(x P x ≤=ξϕ,)(1)(x x --=ϕϕ求出,而P (a <ξ≤b )的计算则是)()()(a b b a P ϕϕξ-=≤π.注意:当标准正态分布的)(x Φ的X 取0时,有5.0)(=Φx 当)(x Φ的X 取大于0的数时,有5.0)(φx Φ.比如5.00793.0)5.0(π=-Φσμ则σμ-5.0S 阴=0.5S a =0.5+S如图.⑵正态分布与标准正态分布间的关系:若ξ~),(2σμN 则ξ的分布函数通常用)(x F 表示,且有)σμx (F(x)x)P(ξ-==≤ϕ.4.⑴“3σ”原则.假设检验是就正态总体而言的,进行假设检验可归结为如下三步:①提出统计假设,统计假设里的变量服从正态分布),(2σμN .②确定一次试验中的取值a是否落入范围)3,3(σμσμ+-.③做出判断:如果)3,3(σμσμ+-∈a ,接受统计假设. 如果)3,3(σμσμ+-∉a ,由于这是小概率事件,就拒绝统计假设.⑵“3σ”原则的应用:若随机变量ξ服从正态分布),(2σμN 则 ξ落在)3,3(σμσμ+-内的概率为99.7% 亦即落在)3,3(σμσμ+-之外的概率为0.3%,此为小概率事件,如果此事件发生了,就说明此种产品不合格(即ξ不服从正态分布).。
高中数学大题规范解答-全得分系列之(十)概率与统计的综合问题答题模板
概率与统计是高中数学的重要学习内容,在高考试卷中,每年都有所涉及,以解答题形式出现的试题常常设计成包含概率计算,统计图表的识别等知识为主的综合题,以考生比较熟悉的实际应用问题为载体,注重考查基础知识和基本方法;以排列组合和概率统计等基础知识为工具,考查对概率事件的识别及概率计算.“大题规范解答——得全分”系列之(十)概率与统计的综合问题答题模板[典例](2012辽宁高考改编·满分12分)电视传媒公司为了解某地区观众对某类体育节目的收视情况,随机抽取了100名观众进行调查,其中女性有55名.下面是根据调查结果绘制的观众日均收看该体育节目时间的频率分布直方图:将日均收看该体育节目时间不低于40分钟的观众称为“体育迷”,已知“体育迷”中有10名女性.(1)根据已知条件完成下面的2×2列联表,并据此资料判断是否有95%的把握认为“体育迷”与性别有关?(2)将日均收看该体育节目不低于50分钟的观众称为“超级体育迷”,已知“超级体育迷”中有2名女性,若从“超级体育迷”中任意选取2人,求至少有1名女性观众的概率.附K2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d),[教你快速规范审题]1.审条件,挖解题信息 观察条件―→−−−−−−→借助直方可确定图非体育迷及体育迷人数2.审结论,明解题方向观察所求结论―→完成2×2列联表并判断“体育迷”与性别的相关性 −−−→需要确定a ,b ,c ,d 及K 2的值3.建联系,找解题突破口由直方图及条件确定体育迷与非体育迷人数―→完成列联表―→计算K 2可判断结论1.审条件,挖解题信息观察条件―→确定“超级体育迷”标准且有2名女性“超级体育迷” −−−−−−→由率分布直方频图 确定“超级体育迷”的人数2.审结论,明解题方向观察所求结论―→从“超级体育迷”中任取2人求至少有1名女性观众的概率 −−−−→分分析类1名女性观众或两名女性观众3.建联系,找解题突破口由频率分布直方图确定“超级体育迷”的人数−−−−−→列法列出举举所有基本事件并计数为n 和至少有1名女性的基本事件,计数为m mP n−−−−→代入=求概率[教你准确规范解题](1)由频率分布直方图可知,在抽取的100人中,“体育迷”有25人,从而完成2×2列联表如下:(3分)将2×2列联表中的数据代入公式计算,得K 2=100×(30×10-45×15)275×25×45×55=10033≈3.030.因为3.030<3.841,所以我们没有95%的把握认为“体育迷”与性别有关.(6分)(2)由频率分布直方图可知,“超级体育迷”为5人,从而一切可能结果所组成的基本事件为(a 1,a 2),(a 1,a 3),(a 2,a 3),(a 1,b 1),(a 1,b 2),(a 2,b 1),(a 2,b 2),(a 3,b 1),(a 3,b 2),(b 1,b 2),其中a i 表示男性,i =1,2,3,b j 表示女性,j =1,2.由10个基本事件组成,而且这些基本事件的出现是等可能的.(9分)用A 表示“任选2人中,至少有1人是女性”这一事件,则A ={(a 1,b 1),(a 1,b 2),(a 2,b 1),(a 2,b 2),(a 3,b 1),(a 3,b 2),(b 1,b 2)},(11分)事件A 由7个基本事件组成,因而P (A )=710.(12分)[常见失分探因]忽视直方图纵轴表示为频率组距导致每组人数计算失误.K 2的计算不准确、导致结果判断出错.1.“超级体育迷”人数计算错误导致失误.2.由5人中任取2人列举出所有可能结果时重复或遗漏某一情况导致失误.————————————[教你一个万能模板]—————————————————―→―→―→―→1.(2012·佛山模拟)已知某车间加工零件的个数x 与所花费时间y (h)之间的线性回归方程为y ^=0.01x +0.5,则加工600个零件大约需要的时间为( )A .6.5 hB .5.5 hC .3.5 hD .0.3 h解析:选A 将600代入线性回归方程y ^=0.01x +0.5中得需要的时间为6.5 h. 2.(2013·衡阳联考)已知x 与y 之间的一组数据:已求得关于y 与x 的线性回归方程y ^=2.1x +0.85,则m 的值为( ) A .1 B .0.85 C .0.7D .0.5解析:选D 回归直线必过样本中心点(1.5,y ),故y =4,m +3+5.5+7=16,得m =0.5.3.有甲、乙两个班级进行数学考试,按照大于等于85分为优秀,85分以下为非优秀统计成绩,得到如下所示的列联表:已知在全部105人中随机抽取1人,成绩优秀的概率为27,则下列说法正确的是( )A .列联表中c 的值为30,b 的值为35B .列联表中c 的值为15,b 的值为50C .根据列联表中的数据,若按95%的可靠性要求,能认为“成绩与班级有关系”D .根据列联表中的数据,若按95%的可靠性要求,不能认为“成绩与班级有关系” 解析:选C 由题意知,成绩优秀的学生数是30,成绩非优秀的学生数是75,所以c =20,b =45,选项A 、B 错误.根据列联表中的数据,得到K 2=105×(10×30-20×45)255×50×30×75≈6.109>3.841,因此有95%的把握认为“成绩与班级有关系”.4.已知x 、y 的取值如下表:从所得的散点图分析,y 与x 线性相关,且y =0.95x +a ,则a ^=( ) A .2.5 B .2.6 C .2.7D .2.8解析:选B 因为回归方程必过样本点的中心(x ,y ),又x =2,y =4.5,则将(2,4.5)代入y ^=0.95x +a ^可得a ^=2.6.5.(2012·湖南高考)设某大学的女生体重y (单位:kg)与身高x (单位:cm)具有线性相关关系,根据一组样本数据(x i ,y i )(i =1,2,…,n ),用最小二乘法建立的回归方程为y ^=0.85x -85.71,则下列结论中不.正确的是( ) A .y 与x 具有正的线性相关关系 B .回归直线过样本点的中心(x ,y )C .若该大学某女生身高增加1 cm ,则其体重约增加0.85 kgD .若该大学某女生身高为170 cm ,则可断定其体重必为58.79 kg解析:选D 由于回归直线的斜率为正值,故y 与x 具有正的线性相关关系,选项A 中的结论正确;回归直线过样本点的中心,选项B 中的结论正确;根据回归直线斜率的意义易知选项C 中的结论正确;由于回归分析得出的是估计值,故选项D 中的结论不正确.6.(2013·合肥检测)由数据(x 1,y 1),(x 2,y 2),…,(x 10,y 10)求得线性回归方程y ^=b ^x +a ^,则“(x 0,y 0)满足线性回归方程y ^=b ^x +a ^”是“x 0=x 1+x 2+…+x 1010,y 0=y 1+y 2+…+y 1010”的( )A .充分不必要条件B .必要不充分条件C .充要条件D .既不充分也不必要条件解析:选B x 0,y 0为这10组数据的平均值,又因为回归直线y ^=b ^x +a ^必过样本中心点(x ,y ),因此(x 0,y 0)一定满足线性回归方程,但坐标满足线性回归方程的点不一定是(x ,y ).7.(2012·唐山模拟)考古学家通过始祖鸟化石标本发现:其股骨长度x (cm)与肱骨长度y (cm)的线性回归方程为y ^=1.197x -3.660,由此估计,当股骨长度为50 cm 时,肱骨长度的估计值为________ cm.解析:根据回归方程y ^=1.197x -3.660,将x =50代入,得y =56.19,则肱骨长度的估计值为56.19 cm.答案:56.198.在一项打鼾与患心脏病的调查中,共调查了1 671人,经过计算K 2的观测值k =27.63,根据这一数据分析,我们有理由认为打鼾与患心脏病是________的.(有关,无关)解析:由观测值k =27.63与临界值比较,我们有99%的把握说打鼾与患心脏病有关. 答案:有关9.(2012·宁夏模拟)某单位为了了解用电量y 度与气温x ℃之间的关系,随机统计了某4天的用电量与当天气温,并制作了对照表:由表中数据得线性回归方程y ^=bx +a 中b =-2,预测当气温为-4℃时,用电量的度数约为________.解析:x =10,y =40,回归方程过点(x ,y ), ∴40=-2×10+a . ∴a =60.∴y ^=-2x +60.令x =-4,∴y ^=(-2)×(-4)+60=68. 答案:6810.已知x ,y 的一组数据如下表:(1)从x ,y (2)对于表中数据,甲、乙两同学给出的拟合直线分别为y =13x +1与y =12x +12,试利用“最小平方法(也称最小二乘法)”判断哪条直线拟合程度更好.解:(1)从x ,y 中各取一个数组成数对(x ,y ),共有25对,其中满足x +y ≥10的有(6,4),(6,5),(7,3),(7,4),(7,5),(8,2),(8,3),(8,4),(8,5),共9对.故所求概率P =925.(2)用y =13x +1作为拟合直线时,所得y 值与y 的实际值的差的平方和为S 1=⎝⎛⎭⎫43-12+(2-2)2+(3-3)2+⎝⎛⎭⎫103-42+⎝⎛⎭⎫113-52=73.用y =12x +12作为拟合直线时,所得y 值与y 的实际值的差的平方和为S 2=(1-1)2+(2-2)2+⎝⎛⎭⎫72-32+(4-4)2+⎝⎛⎭⎫92-52=12. ∵S 2<S 1,∴直线y =12x +12的拟合程度更好.11.(2012·东北三省联考)某学生对其亲属30人的饮食习惯进行了一次调查,并用茎叶图表示30人的饮食指数.(说明:图中饮食指数低于70的人,饮食以蔬菜为主;饮食指数高于70的人,饮食以肉类为主.)(1)根据茎叶图,帮助这位学生说明其亲属30人的饮食习惯; (2)根据以上数据完成下列2×2的列联表:(3)能否有99%的把握认为其亲属的饮食习惯与年龄有关,并写出简要分析. 解:(1)30位亲属中50岁以上的人多以食蔬菜为主,50岁以下的人多以食肉为主. (2)(2)K 2=30(8-128)12×18×20×10=30×120×12012×18×20×10=10>6.635,有99%的把握认为亲属的饮食习惯与年龄有关.12.某电脑公司有6名产品推销员,其工作年限与年推销金额的数据如下表:(1)(2)求年推销金额y 关于工作年限x 的线性回归方程;(3)若第6名推销员的工作年限为11年,试估计他的年推销金额. 解:(1)依题意,画出散点图如图所示,(2)从散点图可以看出,这些点大致在一条直线附近,设所求的线性回归方程为y ^=b ^x +a ^.则b ^=∑x =15(x i -x )(y i -y -)∑x =15 (x i -x )2=1020=0.5,a ^=y -b ^x -=0.4, ∴年推销金额y 关于工作年限x 的线性回归方程为 y ^=0.5x +0.4.(3)由(2)可知,当x =11时,y ^=0.5x +0.4=0.5×11+0.4=5.9(万元).∴可以估计第6名推销员的年推销金额为5.9万元.1.某研究机构对高三学生的记忆力x 和判断力y 进行统计分析,所得数据如下表:则y 对x 的线性回归直线方程为( ) A.y ^=2.3x -0.7 B.y ^=2.3x +0.7 C.y ^=0.7x -2.3D.y ^=0.7x +2.3解析:选C ∵∑i =14x i y i =6×2+8×3+10×5+12×6=158,x =6+8+10+124=9,y =2+3+5+64=4.∴b ^=158-4×9×436+64+100+144-4×81=0.7,a ^=4-0.7×9=-2.3.故线性回归直线方程为y ^=0.7x -2.3.2.(2012·东北三校联考)某校为了研究学生的性别和对待某一活动的态度(支持和不支持两种态度)的关系,运用2×2列联表进行独立性检验,经计算K 2=7.069,则有________的把握认为“学生性别与是否支持该活动有关系”.附:解析:因为7.069与附表中的6.635最接近(且大于6.635),所以得到的统计学结论是:有99%的把握认为“学生性别与是否支持该活动有关系”.答案:99%3.某网站就“民众是否支持加大修建城市地下排水设施的资金投入”进行投票.按照北京暴雨前后两个时间收集有效投票,暴雨后的投票收集了50份,暴雨前的投票也收集了50份,所得统计结果如下表:已知工作人员从所有投票中任取一个,取到“不支持投入”的投票的概率为25.(1)求列联表中的数据x ,y ,A ,B 的值;(2)绘制条形统计图,通过图形判断本次暴雨是否影响到民众对加大修建城市地下排水设施的投入的态度?(3)能够有多大把握认为北京暴雨对民众是否赞成加大对修建城市地下排水设施的投入有关?附:K 2=n (ad -bc )2(a +b )(c +d )(a +c )(b +d )解:(1)设“从所有投票中抽取一个,取到不支持投入的投票”为事件A , 由已知得P (A )=y +30100=25,所以y =10,B =40,x =40,A =60.(2)由(1)知北京暴雨后支持为4050=45,不支持率为1-45=15,北京暴雨前支持率为2050=25,不支持率为1-25=35.条形统计图如图所示,由图可以看出暴雨影响到民众对加大修建城市地下排水设施的投入的态度.(3)K 2=100(30×40-20×10)250×50×40×60=1000 00050×20×60=503≈16.78>10.828.故至少有99.9%的把握认为北京暴雨对民众是否赞成加大对修建城市地下排水设施的投入有关.1.以下是某地最新搜集到的二手楼房的销售价格y (单位:万元)和房屋面积x (单位:m 2)的一组数据:若销售价格y 和房屋面积x 具有线性相关关系. (1)求销售价格y 和房屋面积x 的回归直线方程;(2)根据(1)的结果估计当房屋面积为150 m 2时的销售价格.解:(1)由题意知,x =80+105+110+115+1355=109,y =18.4+22+21.6+24.8+29.25=23.2.设所求回归直线方程为y ^=bx +a ,则b =∑i =1n(x i -109)(y i -23.2)∑i =1n(x i -109)2=3081 570≈0.196 2, a =y -b x ≈23.2-0.196 2×109=1.814 2,故回归直线方程为y ^=0.196 2x +1.814 2. (2)由(1)知,当x =150时,估计房屋的销售价格为y ^=0.196 2×150+1.814 2=31.244 2(万元).2.(2012·徐州二模)在研究色盲与性别的关系调查中,调查了男性480人,其中有38人患色盲,调查的520名女性中,有6人患色盲.(1)根据以上数据建立一个2×2列联表;(2)若认为“性别与患色盲有关系”,求出错的概率. 解:(1)2×2列联表如下:(2)假设H 0:“性别与患色盲没有关系”,根据(1)中2×2列联表中数据,可求得K 2=1 000×(38×514-6×442)2480×520×44×956≈27.14,又P (K 2≥10.828)=0.001,即H 0成立的概率不超过0.001,故若认为“性别与患色盲有关系”,则出错的概率为0.1%.。
高考数学概率统计知识点(大全)
高考数学概率统计知识点(大全)高考数学概率统计知识点一、随机事件(1)事件的三种运算:并(和)、交(积)、差;注意差A—B可以表示成A与B 的逆的积。
(2)四种运算律:交换律、结合律、分配律、德莫根律。
(3)事件的五种关系:包含、相等、互斥(互不相容)、对立、相互独立。
二、概率定义(1)统计定义:频率稳定在一个数附近,这个数称为事件的概率;(2)古典定义:要求样本空间只有有限个基本事件,每个基本事件出现的可能性相等,则事件A所含基本事件个数与样本空间所含基本事件个数的比称为事件的古典概率;(3)几何概率:样本空间中的元素有无穷多个,每个元素出现的可能性相等,则可以将样本空间看成一个几何图形,事件A看成这个图形的子集,它的概率通过子集图形的大小与样本空间图形的大小的比来计算;(4)公理化定义:满足三条公理的任何从样本空间的子集集合到[0,1]的映射。
三、概率性质与公式(1)加法公式:P(A+B)=p(A)+P(B)—P(AB),特别地,如果A与B互不相容,则P(A+B)=P(A)+P(B);(2)差:P(A—B)=P(A)—P(AB),特别地,如果B包含于A,则P(A—B)=P(A)—P(B);(3)乘法公式:P(AB)=P(A)P(B|A)或P(AB)=P(A|B)P(B),特别地,如果A与B相互独立,则P(AB)=P(A)P(B);(4)全概率公式:P(B)=∑P(Ai)P(B|Ai)。
它是由因求果,贝叶斯公式:P(Aj|B)=P(Aj)P(B|Aj)/∑P(Ai)P(B|Ai)。
它是由果索因;如果一个事件B可以在多种情形(原因)A1,A2,...,An下发生,则用全概率公式求B发生的概率;如果事件B已经发生,要求它是由Aj引起的概率,则用贝叶斯公式。
(5)二项概率公式:Pn(k)=C(n,k)p^k(1—p)^(n—k),k=0,1,2,...,n。
当一个问题可以看成n重贝努力试验(三个条件:n次重复,每次只有A与A的逆可能发生,各次试验结果相互独立)时,要考虑二项概率公式。
北京市高考概率与统计解题技巧(北京2020教师版含答案)
北京市高考概率与统计解题技巧(基础篇)一、基础知识1. 等可能事件(古典概型)求概率方法:(1)什么是古典概型?基本事件的个数是有限个的,并且每一个基本事件的发生的概率相等。
(2)生活中的基本事件举例:投硬币、投骰子、选班长(不靠实力靠运气选)(3)概率公式:()=A P A 包含的基本事件的个数基本事件的总数例题1.(2020·北京平谷区高三一模)为了解本学期学生参加公益劳动的情况,某校从初高中学生中抽取100名学生,收集了他们参加公益劳动时间(单位:小时)的数据,绘制图表的一部分如表.从男生中随机抽取一人,抽到的男生参加公益劳动时间在[)10,20的概率:答案:100名学生中共有男生48名,其中共有20人参加公益劳动时间在[)10,20,设男生中随机抽取一人,抽到的男生参加公益劳动时间在[)10,20的事件为A ,那么()205 4812P A==;做题技巧:审题的时候一定要审清从哪里随机选取,确定选取范围;本题中是从男生中随机抽取一人。
拓展1-1(2020·北京西城区高三期末)高铁和航空的飞速发展不仅方便了人们的出行,更带动了我国经济的巨大发展.据统计,在2018年这一年内从A市到B市乘坐高铁或飞机出行的成年人约为50万人次.为了解乘客出行的满意度,现从中随机抽取100人次作为样本,得到下表(单位:人次):问题:在样本中任取1个,求这个出行人恰好不是青年人的概率;答案:设事件:“在样本中任取1个,这个出行人恰好不是青年人”为M,由表可得:样本中出行的老年人、中年人、青年人人次分别为19,39,42,所以在样本中任取1个,这个出行人恰好不是青年人的概率193929 ()10050P M+==.拓展1-28.(2020·北京市育英学校高三月考)自由购是通过自助结算方式购物的一种形式.某大型超市为调查顾客使用自由购的情况,随机抽取了100人,统计结果整理如下:(Ⅰ)现随机抽取1名顾客,试估计该顾客年龄在[)30,50且未使用自由购的概率;答案:在随机抽取的100名顾客中,年龄在[30,50)且未使用自由购的共有3+14=17人,所以,随机抽取1名顾客,估计该顾客年龄在[30,50)且未使用自由购的概率为17100P=.拓展1-3(2020·北京人大附中高三月考)某市旅游管理部门为提升该市26个旅游景点的服务质量,对该市26个旅游景点的交通、安全、环保、卫生、管理五项指标进行评分.每项评分最低分0分,最高分100分.每个景点总分为这五项得分之和,根据考核评分结果,绘制交通得分与安全得分散点图、交通得分与景点总分散点图如图请根据图中所提供的信息,完成下列问题:(1)若从交通得分排名前5名的景点中任取1个,求其安全得分大于90分的概率;答案:由图象可知交通得分排名前5名的景点中,安全得分大于90分的景点有3个, ∴从交通得分排名前5名的景点中任取1个,其安全得分大于90分的概率为35.2. 分层抽样在北京高考试题中考察:(1)知识拓展:抽样方法:1.简单随机抽样:设一个总体的个数为N ,如果通过逐个抽取的方法从中抽取一个样本,且每次抽取时各个个体被抽到的概率相等,就称这样的抽样为简单随机抽样.常用抽签法和随机数表法.2.系统抽样:当总体中的个数较多时,可将总体分成均衡的几个部分,然后按照预先定出的规则,从每一部分抽取1个个体,得到所需要的样本,这种抽样叫做系统抽样(也称为机械抽样).3.分层抽样:当已知总体由差异明显的几部分组成时,常将总体分成几部分,然后按照各部分所占的比进行抽样,这种抽样叫做分层抽样.(2)分层抽样计算公式:样本总个数的个数样本中总体个数的个数总体中A A =(3)分层抽样举例:北京市牛栏山一中有高三学生1500人,其中男生1000人,女生500人,现按照分层抽样的方式随机抽取30人,男生抽取人数为多少人?3015001000x=例题:3.(2020·北京人大附中高三月考)2019年底,北京2022年冬奥组委会启动志愿者全球招募,仅一个月内报名人数便突破60万,其中青年学生约有50万人.现从这50万青年学生志愿者中,按男女分层抽样随机选取20人进行英语水平测试,所得成绩(单位:分)统计结果用茎叶图记录如下:(Ⅰ)试估计在这50万青年学生志愿者中,英语测试成绩在80分以上的女生人数;答案:(Ⅰ)样本中女生英语成绩在80分以上的有2人,故人数为:250520⨯=万人.拓展2-1(2019·门头沟一模(文))在某区“创文明城区”(简称“创城”)活动中,教委对本区,,,A B C D四所高中学校按各校人数分层抽样,随机抽查了100人,将调查情况进行整理后制成下表:(注:参与率是指:一所学校“创城”活动中参与的人数与被抽查人数的比值)假设每名高中学生是否参与”创城”活动是相互独立的.(1)若该区共2000名高中学生,估计A学校参与“创城”活动的人数;答案:(1)A学校高中生的总人数为1005010002000÷=人A学校参与“创城”活动的人数为40 100080050⨯=人拓展2-2(2020·北京房山区高一期末)中学生研学旅行是通过集体旅行、集中食宿方式开展的研究性学习和旅行体验相结合的校外教育活动,是学校教育和校外教育衔接的创新形式,是综合实践育人的有效途径.每年暑期都会有大量中学生参加研学旅行活动.为了解某地区中学生暑期研学旅行支出情况,在该地区各个中学随机抽取了部分中学生进行问卷调查,从中统计得到中学生暑期研学旅行支出(单位:百元)频率分布直方图如图所示.利用分层抽样在[40,45),[45,50),[50,55]三组中抽取5人,应从这三组中各抽取几人?答案:由频率分布直方图可知[40,45),[45,50),[50,55)三组的频数的比为0.06:0.02:0.023:1:1=,所以从[40,45)中抽取:353311⨯=++人,从[45,50)中抽取:151311⨯=++人,从[50,55)中抽取:151311⨯=++人,所以从这三组中抽取的人数分别为3,1,1;3.超几何分布:从有限N 个物件(其中包含M 个指定种类的物件)中抽出n 个物件,成功抽出该指定种类的物件的次数(不放回)。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
专题八 概率统计的解题技巧【命题趋向】 概率统计命题特点:1.在近五年高考中,新课程试卷每年都有一道概率统计解答题,并且这五年的命题趋势是一道概率统计解答题逐步增加到一道客观题和一道解答题;从分值上看,从12分提高到17分;由其是实施新课标考试的省份, 增加到两道客观题和一道解答题.值得一提的是此累试题体现了考试中心提出的“突出应用能力考查”以及“突出新增加内容的教学价值和应用功能”的指导思想,在命题时,提高了分值,提高了难度,并设置了灵活的题目情境,如测试成绩、串联并联系统、计算机上网、产品合格率、温度调节等,所以在概率统计复习中要注意全面复习,加强基础,注重应用.2.就考查内容而言,用概率定义(除法)或基本事件求事件(加法、减法、乘法)概率,常以小题形式出现;随机变量取值-取每一个值的概率-列分布列-求期望方差常以大题形式出现.概率与统计还将在选择与填空中出现,可能与实际背景及几何题材有关. 【考点透视】1.了解随机事件的发生存在着规律性和随机事件概率的意义.2.了解等可能性事件的概率的意义,会用排列组合的基本公式计算一些等可能性事件的概率.3.了解互斥事件、相互独立事件的意义,会用互斥事件的概率加法公式与相互独立事件的概率乘法公式计算一些事件的概率.4.会计算事件在n 次独立重复试验中恰好发生k 次的概率. 5. 掌握离散型随机变量的分布列. 6.掌握离散型随机变量的期望与方差. 7.掌握抽样方法与总体分布的估计. 8.掌握正态分布与线性回归. 【例题解析】考点1. 求等可能性事件、互斥事件和相互独立事件的概率 解此类题目常应用以下知识:(1)等可能性事件(古典概型)的概率:P (A )=)()(I card A card =n m ;等可能事件概率的计算步骤:① 计算一次试验的基本事件总数n ;② 设所求事件A ,并计算事件A 包含的基本事件的个数m ; ③ 依公式()m P A n=求值;④ 答,即给问题一个明确的答复.(2)互斥事件有一个发生的概率:P (A +B )=P (A )+P (B ); 特例:对立事件的概率:P (A )+P (A )=P (A +A )=1. (3)相互独立事件同时发生的概率:P (A ·B )=P (A )·P (B );特例:独立重复试验的概率:P n (k )=k n k k n p p C --)1(.其中P 为事件A 在一次试验中发生的概率,此式为二项式[(1-P)+P]n 展开的第k+1项. (4)解决概率问题要注意“四个步骤,一个结合”: ① 求概率的步骤是:第一步,确定事件性质⎧⎪⎪⎨⎪⎪⎩等可能事件 互斥事件 独立事件 n 次独立重复试验即所给的问题归结为四类事件中的某一种. 第二步,判断事件的运算⎧⎨⎩和事件积事件即是至少有一个发生,还是同时发生,分别运用相加或相乘事件.第三步,运用公式()()()()()()()()(1)k k n k n n m P A nP A B P A P B P A B P A P B P k C p p -⎧=⎪⎪⎪+=+⎨⎪⋅=⋅⎪=-⎪⎩等可能事件: 互斥事件: 独立事件: n 次独立重复试验:求解 第四步,答,即给提出的问题有一个明确的答复.例1.(2007年上海卷文)在五个数字12345,,,,中,若随机取出三个数字,则剩下两个数字都是奇数的概率是 (结果用数值表示). [考查目的]本题主要考查概率的概念和等可能性事件的概率求法.[解答过程]0.3提示:1335C 33.54C 102P ===⨯例2.(2007年全国II 卷文)一个总体含有100个个体,以简单随机抽样方式从该总体中抽取一个容量为5的样本,则指定的某个个体被抽到的概率为 .[考查目的]本题主要考查用样本分析总体的简单随机抽样方式,同时考查概率的概念和等可能性事件的概率求法.用频率分布估计总体分布,同时考查数的区间497.5g~501.5的意义和概率的求法. [解答过程]1.20提示:51.10020P ==例3 (2007年全国I 卷文)从自动打包机包装的食盐中,随机抽取20袋,测得各袋的质量分别为(单位:g ):492 496 494 495 498 497 501 502 504 496 497 503 506 508 507 492 496 500 501 499根据的原理,该自动包装机包装的袋装食盐质量在497.5g~501.5g 之间的概率约为__________.[考查目的]本题主要考查用频率分布估计总体分布,同时考查数的区间497.5g~501.5的意义和概率的求法.[解答过程]在497.5g~501.5内的数共有5个,而总数是20个,所以有51.204=点评:首先应理解概率的定义,在确定给定区间的个体的数字时不要出现错误.例4. (2006年湖北卷)接种某疫苗后,出现发热反应的概率为0.80.现有5人接种该疫苗,至少有3人出现发热反应的概率为__________.(精确到0.01)[考查目的] 本题主要考查运用组合、概率的基本知识和分类计数原理解决问题的能力,以及推理和运算能力.[解答提示]至少有3人出现发热反应的概率为33244555550.800.200.800.200.800.94C C C ⋅⋅+⋅⋅+⋅=.故填0.94.例5.(2006年江苏卷)右图中有一个信号源和五个接收器.接收器与信号源在同一个串联线路中时,就能接收到信号,否则就不能接收到信号.若将图中左端的六个接线点随机地平均分成三组,将右端的六个接线点也随机地平均分成三组,再把所有六组中每组的两个接线点用导线连接,则这五个接收器能同时接收到信号的概率是(A )454 (B )361 (C )154 (D )158[考查目的] 本题主要考查运用组合、概率知识,以及分步计数原理解决问题的能力,以及推理和运算能力.[解答提示]由题意,左端的六个接线点随机地平均分成三组有2226423315C C C A =种分法,同理右端的六个接线点也随机地平均分成三组有2226423315C C C A =种分法;要五个接收器能同时接收到信号,则需五个接收器与信号源串联在同一个线路中,即五个接收器的一个全排列,再将排列后的第一个元素与信号源左端连接,最后一个元素与信号源右端连接,所以符合条件的连接方式共有55120A =种,所求的概率是120822515P ==,所以选D.点评:本题要求学生能够熟练运用排列组合知识解决计数问题,并进一步求得概率问题,其中隐含着平均分组问题. 例6. (2007年全国II 卷文)从某批产品中,有放回地抽取产品二次,每次随机抽取1件,假设事件A :“取出的2件产品中至多有1件是二等品”的概率()0.96P A =. (1)求从该批产品中任取1件是二等品的概率p ;(2)若该批产品共100件,从中任意抽取2件,求事件B :“取出的2件产品中至少有一件二等品”的概率()P B .[考查目的]本小题主要考查相互独立事件、互斥事件等的概率计算,运用数学知识解决问题的能力,以及推理与运算能力.[解答过程](1)记0A 表示事件“取出的2件产品中无二等品”, 1A 表示事件“取出的2件产品中恰有1件二等品”. 则01A A ,互斥,且01A A A =+,故01()()P A P A A =+212012()()(1)C (1)1.P A P A p p p p =+=-+-=- 于是20.961p =-.解得120.20.2p p ==-,(舍去).(2)记0B 表示事件“取出的2件产品中无二等品”,则0B B =.若该批产品共100件,由(1)知其中二等品有1000.220⨯=件,故28002100C 316()C 495P B ==.00316179()()1()1.495495P B P B P B ==-=-=例7.(2006年上海卷)两部不同的长篇小说各由第一、二、三、四卷组成,每卷1本,共8本.将它们任意地排成一排,左边4本恰好都属于同一部小说的概率是 (结果用分数表示).[考查目的] 本题主要考查运用排列和概率知识,以及分步计数原理解决问题的能力,以及推理和运算能力.[解答提示]从两部不同的长篇小说8本书的排列方法有88A 种,左边4本恰好都属于同一部小说的的排列方法有442442A A A 种.所以, 将符合条件的长篇小说任意地排成一排,左边4本恰好都属于同一部小说的概率是 44244288135A A A P A ==种.所以,填135.例8.( 2006年浙江卷)甲、乙两袋装有大小相同的红球和白球,甲袋装有2个红球,2个白球;乙袋装有2个红球,n 个白球.由甲,乙两袋中各任取2个球.(Ⅰ)若n=3,求取到的4个球全是红球的概率;(Ⅱ)若取到的4个球中至少有2个红球的概率为43,求n.[考查目的]本题主要考查排列组合、概率等基本知识,同时考察逻辑思维能力和数学应用能力.[标准解答](I )记“取到的4个球全是红球”为事件A .22222245111().61060C C P A C C =⋅=⋅=(II )记“取到的4个球至多有1个红球”为事件B ,“取到的4个球只有1个红球”为事件1B ,“取到的4个球全是白球”为事件2B . 由题意,得31()1.44P B =-=2111122222122224242()n n n n C C C C C C P B C C C C ++⋅⋅=⋅+⋅22;3(2)(1)n n n =++ 22222242()n n C C P B C C +=⋅(1);6(2)(1)n n n n -=++ 所以, 12()()()P B P B P B =+22(1)3(2)(1)6(2)(1)n n n n n n n -=+++++14=,化简,得271160,n n --=解得2n =,或37n =-(舍去), 故 2n =.例9. (2007年全国I 卷文)某商场经销某商品,顾客可采用一次性付款或分期付款购买.根据以往资料统计,顾客采用一次性付款的概率是0.6,经销一件该商品,若顾客采用一次性付款,商场获得利润200元;若顾客采用分期付款,商场获得利润250元.(Ⅰ)求3位购买该商品的顾客中至少有1位采用一次性付款的概率; (Ⅱ)求3位顾客每人购买1件该商品,商场获得利润不超过650元的概率.[考查目的]本小题主要考查相互独立事件、独立重复试验等的概率计算,运用数学知识解决问题的能力,以及推理与运算能力.[解答过程](Ⅰ)记A 表示事件:“3位顾客中至少1位采用一次性付款”,则A 表示事件:“3位顾客中无人采用一次性付款”.2()(10.6)0.064P A =-=, ()1()10.0640.936P A P A =-=-=.(Ⅱ)记B 表示事件:“3位顾客每人购买1件该商品,商场获得利润不超过650元”.0B 表示事件:“购买该商品的3位顾客中无人采用分期付款”.1B 表示事件:“购买该商品的3位顾客中恰有1位采用分期付款”.则01B B B =+.30()0.60.216P B ==,1213()0.60.40.432P B C =⨯⨯=.01()()P B P B B =+01()()P B P B =+0.2160.432=+0.648=.例10.(2006年北京卷)某公司招聘员工,指定三门考试课程,有两种考试方案. 方案一:考试三门课程,至少有两门及格为考试通过;方案二:在三门课程中,随机选取两门,这两门都及格为考试通过.假设某应聘者对三门指定课程考试及格的概率分别是,,a b c ,且三门课程考试是否及格相互之间没有影响.(Ⅰ)分别求该应聘者用方案一和方案二时考试通过的概率;(Ⅱ)试比较该应聘者在上述两种方案下考试通过的概率的大小.(说明理由)[考查目的] 本题主要考查互斥事件有一个发生的概率和对立事件的概率,以及不等式等基本知识,同时考查逻辑思维能力和数学应用能力.[标准解答]记该应聘者对三门指定课程考试及格的事件分别为A ,B,C , 则P (A )=a ,P (B )=b ,P (C )=c. (Ⅰ) 应聘者用方案一考试通过的概率p 1=P (A ·B ·C )+P (A ·B ·C )+P (A ·B ·C )+P (A ·B ·C ) =a ×b ×(1-c)+(1-a)×b ×c+a ×(1-b)×c+a ×b ×c=ab+bc+ca-2abc.应聘者用方案二考试通过的概率p 2=31P (A ·B )+ 31P (B ·C )+ 31P (A ·C )= 31×(a ×b+b ×c+c ×a)= 31 (ab+bc+ca)(Ⅱ) p 1- p 2= ab+bc+ca-2abc-31 (ab+bc+ca)= 23( ab+bc+ca-3abc)≥23]3abc =0≥.∴p 1≥p 2例11.(2007年陕西卷文)某项选拔共有四轮考核,每轮设有一个问题,能正确回答问题者进入下一轮考核,否则即被淘汰.已知某选手能正确回答第一、二、三、四轮的问题的概率分别为54、53、52、51,且各轮问题能否正确回答互不影响.(Ⅰ)求该选手进入第四轮才被淘汰的概率;(Ⅱ)求该选手至多进入第三轮考核的概率. (注:本小题结果可用分数表示)[考查目的]本小题主要考查相互独立事件、独立重复试验的概率计算,运用数学知识解决问题的能力,以及推理与运算能力.[解答过程](Ⅰ)记“该选手能正确回答第i 轮的问题”的事件为(1234)i A i =,,,,则14()5P A =,23()5P A =,32()5P A =,41()5P A =,∴该选手进入第四轮才被淘汰的概率412341234432496()()()()()5555625P P A A A A P A P A P A P P ===⨯⨯⨯=.(Ⅱ)该选手至多进入第三轮考核的概率3112123()P P A A A A A A =++112123()()()()()()P A P A P A P A P A P A =++142433101555555125=+⨯+⨯⨯=. 考点2离散型随机变量的分布列 1.随机变量及相关概念①随机试验的结果可以用一个变量来表示,这样的变量叫做随机变量,常用希腊字母ξ、η等表示.②随机变量可能取的值,可以按一定次序一一列出,这样的随机变量叫做离散型随机变量. ③随机变量可以取某区间内的一切值,这样的随机变量叫做连续型随机变量. 2.离散型随机变量的分布列①离散型随机变量的分布列的概念和性质一般地,设离散型随机变量ξ可能取的值为1x ,2x ,……,i x ,……,ξ取每一个值i x (=i 1,2,……)的概率P (i x =ξ)=i P ,则称下表.为随机变量ξ的概率分布,简称ξ的分布列.由概率的性质可知,任一离散型随机变量的分布列都具有下述两个性质: (1)0≥i P ,=i 1,2,…;(2)++21P P …=1. ②常见的离散型随机变量的分布列: (1)二项分布n 次独立重复试验中,事件A 发生的次数ξ是一个随机变量,其所有可能的取值为0,1,2,…n ,并且k n k k n k q p C k P P -===)(ξ,其中n k ≤≤0,p q -=1,随机变量ξ的分布列如下:称这样随机变量ξ服从二项分布,记作),(~p n B ξ,其中n 、p 为参数,并记:),;(p n k b q p C kn k k n=- .(2) 几何分布在独立重复试验中,某事件第一次发生时所作的试验的次数ξ是一个取值为正整数的离散型随机变量,“k ξ=”表示在第k 次独立重复试验时事件第一次发生. 随机变量ξ的概率分布为:例12.(2007年四川卷理)厂家在产品出厂前,需对产品做检验,厂家将一批产品发给商家时,商家按合同规定也需随机抽取一定数量的产品做检验,以决定是否接收这批产品.(Ⅰ)若厂家库房中的每件产品合格的概率为0.8,从中任意取出4件进行检验,求至少有1件是合格的概率;(Ⅱ)若厂家发给商家20件产品中,其中有3件不合格,按合同规定该商家从中任取2件.都进行检验,只有2件都合格时才接收这批产品.否则拒收,求出该商家检验出不合格产品数ξ的分布列及期望ξE ,并求出该商家拒收这批产品的概率.[考查目的]本题考查相互独立事件、互斥事件等的概率计算,考察随机事件的分布列,数学期望等,考察运用所学知识与方法解决实际问题的能力.[解答过程](Ⅰ)记“厂家任取4件产品检验,其中至少有1件是合格品”为事件A 用对立事件A 来算,有()()4110.20.9984P A P A =-=-= (Ⅱ)ξ可能的取值为0,1,2. ()2172201360190C P C ξ===,()11317220511190C C P C ξ===,()2322032190C P C ξ===136513301219019019010E ξ=⨯+⨯+⨯=. 记“商家任取2件产品检验,都合格”为事件B ,则商家拒收这批产品的概率()136271119095P P B =-=-=.所以商家拒收这批产品的概率为2795.例13.(2007年陕西卷理)某项选拔共有三轮考核,每轮设有一个问题,能正确回答问题者进入下一轮考核,否则即被淘汰. 已知某选手能正确回答第一、二、三轮的问题的概率分别为54、53、52,且各轮问题能否正确回答互不影响. (Ⅰ)求该选手被淘汰的概率;(Ⅱ)该选手在选拔中回答问题的个数记为ξ,求随机变量ξ的分布列与数学期望. (注:本小题结果可用分数表示)[考查目的]本题考查相互独立事件、互斥事件等的概率计算,考察随机事件的分布列,数学期望等,考察运用所学知识与方法解决实际问题的能力.[解答过程]解法一:(Ⅰ)记“该选手能正确回答第i 轮的问题”的事件为(123)i A i =,,,则14()5P A =,23()5P A =,32()5P A =, ∴该选手被淘汰的概率112223112123()()()()()()()P P A A A A A A P A P A P A P A P A P A =++=++142433101555555125=+⨯+⨯⨯=.(Ⅱ)ξ的可能值为123,,,11(1)()5P P A ξ===,1212428(2)()()()5525P P A A P A P A ξ====⨯=,12124312(3)()()()5525P P A A P A P A ξ====⨯=.ξ∴的分布列为1812571235252525E ξ∴=⨯+⨯+⨯=.解法二:(Ⅰ)记“该选手能正确回答第i 轮的问题”的事件为(123)i A i =,,,则14()5P A =,23()5P A =,32()5P A =. ∴该选手被淘汰的概率1231231()1()()()P P A A A P A P A P A =-=-4321011555125=-⨯⨯=.(Ⅱ)同解法一.考点3 离散型随机变量的期望与方差 随机变量的数学期望和方差(1)离散型随机变量的数学期望:++=2211p x p x E ξ…;期望反映随机变量取值的平均水平. ⑵离散型随机变量的方差:+-+-=222121)()(p E x p E x D ξξξ…+-+n n p E x 2)(ξ…; 方差反映随机变量取值的稳定与波动,集中与离散的程度. ⑶基本性质:b aE b a E +=+ξξ)(;ξξD a b a D 2)(=+.(4)若ξ~B(n ,p),则 np E =ξ ; D ξ =npq (这里q=1-p ) ;如果随机变量ξ服从几何分布,),()(p k g k P ==ξ,则pE 1=ξ,D ξ =2pq 其中q=1-p.例14.甲、乙两名工人加工同一种零件,两人每天加工的零件数相等,所得次品数分别为ε、η,ε和η的分布列如下:则比较两名工人的技术水平的高低为 .思路启迪:一是要比较两名工人在加工零件数相等的条件下出次品数的平均值,即期望;二是要看出次品数的波动情况,即方差值的大小.解答过程:工人甲生产出次品数ε的期望和方差分别为:7.0103210111060=⨯+⨯+⨯=εE , 891.0103)7.02(101)7.01(106)7.00(222=⨯-+⨯-+⨯-=εD ; 工人乙生产出次品数η的期望和方差分别为:7.0102210311050=⨯+⨯+⨯=ηE ,664.0102)7.02(103)7.01(105)7.00(222=⨯-+⨯-+⨯-=ηD 由E ε=E η知,两人出次品的平均数相同,技术水平相当,但D ε>D η,可见乙的技术比较稳定.小结:期望反映随机变量取值的平均水平;方差反映随机变量取值的稳定与波动,集中与离散的程度.例15.(2007年全国I 理)某商场经销某商品,根据以往资料统计,顾客采用的付款期数ξ的分布列为商场经销一件该商品,采用1期付款,其利润为200元;分2期或3期付款,其利润为250元;分4期或5期付款,其利润为300元.η表示经销一件该商品的利润.(Ⅰ)求事件A :“购买该商品的3位顾客中,至少有1位采用1期付款”的概率()P A ; (Ⅱ)求η的分布列及期望E η.[考查目的] 本小题主要考查概率和离散型随机变量分布列和数学期望等知识.考查运用概率知识解决实际问题的能力.[解答过程](Ⅰ)由A 表示事件“购买该商品的3位顾客中至少有1位采用1期付款”. 知A 表示事件“购买该商品的3位顾客中无人采用1期付款”2()(10.4)0.216P A =-=, ()1()10.2160.784P A P A =-=-=.(Ⅱ)η的可能取值为200元,250元,300元.(200)(1)0.4P P ηξ====,(250)(2)(3)0.20.20.4P P P ηξξ===+==+=,(300)1(200)(250)10.40.40.2P P P ηηη==-=-==--=.η的分布列为2000.42500.43000.2E η=⨯+⨯+⨯240=(元). 小结:离散型随机变量在某一范围内取值的概率等于它取这个范围内各个值的概率之和.本题考查离散型随机变量分布列和数学期望等概念,考查运用概率知识解决实际问题的能力. 例16.某班有48名学生,在一次考试中统计出平均分为70分,方差为75,后来发现有2名同学的成绩有误,甲实得80分却记为50分,乙实得70分却记为100分,更正后平均分和方差分别是A.70,25B.70,50C.70,1.04D.65,25解答过程:易得x 没有改变,x =70, 而s 2=481[(x 12+x 22+…+502+1002+…+x 482)-48x 2]=75, s ′2=481[(x 12+x 22+…+802+702+…+x 482)-48x 2] =481[(75×48+48x 2-12500+11300)-48x 2] =75-481200=75-25=50. 答案:B考点4 抽样方法与总体分布的估计 抽样方法1.简单随机抽样:设一个总体的个数为N ,如果通过逐个抽取的方法从中抽取一个样本,且每次抽取时各个个体被抽到的概率相等,就称这样的抽样为简单随机抽样.常用抽签法和随机数表法.2.系统抽样:当总体中的个数较多时,可将总体分成均衡的几个部分,然后按照预先定出的规则,从每一部分抽取1个个体,得到所需要的样本,这种抽样叫做系统抽样(也称为机械抽样). 3.分层抽样:当已知总体由差异明显的几部分组成时,常将总体分成几部分,然后按照各部分所占的比进行抽样,这种抽样叫做分层抽样. 总体分布的估计由于总体分布通常不易知道,我们往往用样本的频率分布去估计总体的分布,一般地,样本容量越大,这种估计就越精确.总体分布:总体取值的概率分布规律通常称为总体分布.当总体中的个体取不同数值很少时,其频率分布表由所取样本的不同数值及相应的频率表示,几何表示就是相应的条形图.当总体中的个体取值在某个区间上时用频率分布直方图来表示相应样本的频率分布. 总体密度曲线:当样本容量无限增大,分组的组距无限缩小,那么频率分布直方图就会无限接近于一条光滑曲线,即总体密度曲线. 典型例题例17.某工厂生产A 、B 、C 三种不同型号的产品,产品数量之比依次为2:3:5.现用分层抽样方法抽出一个容量为n 的样本,样本中A 种型号产品有16件.那么此样本的容量n= . 解答过程:A 种型号的总体是210,则样本容量n=1016802⨯=.例18.一个总体中有100个个体,随机编号0,1,2,…,99,依编号顺序平均分成10个小组,组号依次为1,2,3,…,10.现用系统抽样方法抽取一个容量为10的样本,规定如果在第1组随机抽取的号码为m ,那么在第k 组中抽取的号码个位数字与m k +的个位数字相同,若6m =,则在第7组中抽取的号码是 .解答过程:第K 组的号码为(1)10k - ,(1)101k -+,…,(1)109k -+,当m=6时,第k 组抽取的号的个位数字为m+k 的个位数字,所以第7组中抽取的号码的个位数字为3 ,所以抽取号码为63. 例19.考查某校高三年级男生的身高,随机抽取40名高三男生,实测身高数据(单位:cm )如下: 171163163166166168168160168165171 169 167 169 151 168 170 160 168 174 165 168 174 159 167 156 157 164 169 180 176157162161158164163163167161⑴作出频率分布表;⑵画出频率分布直方图.思路启迪:确定组距与组数是解决“总体中的个体取不同值较多”这类问题的出发点. 解答过程:⑴最低身高为151,最高身高180,其差为180-151=29。