18题-高考数学概率与统计知识点
高考数学概率统计专题题库

高考数学概率统计专题题库概率统计是高考数学中的一大重点,对于学生来说是一个难点。
为了帮助同学们更好地掌握概率统计的知识,我们特地整理了一套专题题库,旨在提高同学们的题目解答能力。
以下是该题库中的一些典型题目,供同学们参考。
1. 事件A与事件B相互独立,且P(A)=0.2,P(B)=0.3,求P(A∩B)。
解析:由于事件A与事件B相互独立,所以P(A∩B) = P(A) * P(B)= 0.2 * 0.3 = 0.06。
2. 已知事件A的概率为0.6,事件B的概率为0.4,事件A与事件B相互独立,求事件A或事件B发生的概率。
解析:由于事件A与事件B相互独立,所以P(A或B) = P(A) + P(B) - P(A∩B) = 0.6 + 0.4 - (0.6 * 0.4) = 0.76。
3. 有一批产品,其中80%是合格品,20%是次品。
从中随机抽取3个产品进行检验,求恰好有1个次品的概率。
解析:使用组合数的知识,可以知道从总共的产品中选择1个次品和2个合格品的方法有C(1,1) * C(2,0) = 1种。
所以恰好有1个次品的概率为P = (0.2 * 0.8 * 0.8) = 0.128。
4. 某市共有100辆出租车,其中60辆汽车是空车,40辆汽车是有客人的。
一名乘客拦出租车时,随机选择一辆,发现是空车,求另一辆是空车的概率。
解析:由于已经知道选择的出租车是空车,所以可以将问题简化为从剩下的99辆车中选择一辆是空车的概率。
根据全概率公式,可知选择一辆是空车的概率为P = (60/100) * (59/99) = 0.3636。
5. 有一个罐子,里面有红球、黄球、蓝球各20个。
将这些球随机取出2个,求取出的两个球颜色相同的概率。
解析:首先计算红球颜色相同的概率,即取出两个红球的概率为P1 = (20/60) * (19/59) = 0.1153。
同理,黄球颜色相同的概率为P2 = (20/60) * (19/59) = 0.1153,蓝球颜色相同的概率为P3 = (20/60) * (19/59) =0.1153。
高考数学概率统计知识点总结(文理通用)

概率与统计知识点及专练(一)统计基础知识:1. 随机抽样:(1).简单随机抽样:设一个总体的个数为N ,如果通过逐个抽取的方法从中抽取一个样本,且每次抽取时各个个体被抽到的概率相等,就称这样的抽样为简单随机抽样.常用抽签法和随机数表法.(2).系统抽样:当总体中的个数较多时,可将总体分成均衡的几个部分,然后按照预先定出的规则,从每一部分抽取1个个体,得到所需要的样本,这种抽样叫做系统抽样(也称为机械抽样).(3).分层抽样:当已知总体由差异明显的几部分组成时,常将总体分成几部分,然后按照各部分所占的比进行抽样,这种抽样叫做分层抽样.2. 普通的众数、平均数、中位数及方差: (1).众数:一组数据中,出现次数最多的数(2).平均数:常规平均数:12nx x x x n ++⋅⋅⋅+=(3).中位数:从大到小或者从小到大排列,最中间或最中间两个数的平均数(4).方差:2222121[()()()]n s x x x x x x n =-+-+⋅⋅⋅+-(5).标准差:s3 .频率直方分布图中的频率:(1).频率 =小长方形面积:f S y d ==⨯距;频率=频数/总数; 频数=总数*频率(2).频率之和等于1:121n f f f ++⋅⋅⋅+=;即面积之和为1: 121n S S S ++⋅⋅⋅+=4. 频率直方分布图下的众数、平均数、中位数及方差: (1).众数:最高小矩形底边的中点(2).平均数:112233n n x x f x f x f x f =+++⋅⋅⋅+ 112233n n x x S x S x S x S =+++⋅⋅⋅+(3).中位数:从左到右或者从右到左累加,面积等于0.5时x 的值(4).方差:22221122()()()nn s x x f x x f x x f =-+-+⋅⋅⋅+-5.线性回归直线方程:(1).公式:ˆˆˆy bx a=+其中:1122211()()ˆ()n ni i i ii in ni ii ix x y y x y nxybx x x nx====---∑∑==--∑∑(展开)ˆˆa y bx=-(2).线性回归直线方程必过样本中心(,) x y(3).ˆ0:b>正相关;ˆ0:b<负相关(4).线性回归直线方程:ˆˆˆy bx a=+的斜率ˆb中,两个公式中分子、分母对应也相等;中间可以推导得到6. 回归分析:(1).残差:ˆˆi i ie y y=-(残差=真实值—预报值)分析:ˆie越小越好(2).残差平方和:2 1ˆ() ni iiy y =-∑分析:①意义:越小越好;②计算:222211221ˆˆˆˆ()()()() ni i n niy y y y y y y y =-=-+-+⋅⋅⋅+-∑(3).拟合度(相关指数):2 2121ˆ()1()ni iiniiy y Ry y==-∑=--∑分析:①.(]20,1R∈的常数;②.越大拟合度越高(4).相关系数:()()n ni i i ix x y y x y nx y r---⋅∑∑==分析:①.[1,1]r∈-的常数;②.0:r>正相关;0:r<负相关③.[0,0.25]r∈;相关性很弱;(0.25,0.75)r∈;相关性一般;[0.75,1]r∈;相关性很强7. 独立性检验:(1).2×2列联表(卡方图): (2).独立性检验公式①.22()()()()()n ad bc k a b c d a c b d -=++++②.上界P 对照表:(3).独立性检验步骤:①.计算观察值k :2()()()()()n ad bc k a b c d a c b d -=++++ ②.查找临界值0k :由犯错误概率P ,根据上表查找临界值0k③.下结论:0k k ≥即认为有P 的没把握、有1-P 以上的有把握认为两个量相关;0k k <:即认为没有1-P 以上的把握认为两个量是相关关系。
高考复习概率与统计知识点归纳总结

概率与统计知识点总结(一)知识点思维导图(二)常用定理、公式及其变形1.用样本的数字特征估计总体的数字特征(1)样本本均值:nx x x x n +++= 21 (2)样本标准差:nx x x x x x s s n 222212)()()(-++-+-== (3)频率分布直方图估算样本众数、中位数、平均数①众数:最高小矩形中点值;②中位数:先确定中位数所在小组,设中位数为m ,由直线x=m 两侧小矩形面积之和等于0.5列方程求m . ③平均数:各小矩形中点值与其面积的积的和.2.随机事件的概率及概率的意义(1)随机事件:在条件S 下可能发生也可能不发生的事件,叫相对于条件S 的随机事件;(2)概率定义:在相同的条件S 下重复n 次试验,观察某一事件A 是否出现,称n 次试验中事件A 出现的次数n A 为事件A 出现的频数;称事件A 出现的比例f n (A)=n n A为事件A 出现的频率:对于给定的随机事件A ,如果随着试验次数的增加,事件A 发生的频率f n (A)稳定在某个常数上,把这个常数记作P (A ),称为事件A 的概率.3.概率的基本性质(1)事件的包含、并事件、交事件、相等事件(2)若A∩B 为不可能事件,即A∩B=ф,那么称事件A 与事件B 互斥;(3)若A∩B 为不可能事件,A∪B 为必然事件,那么称事件A 与事件B 互为对立事件;(4)当事件A 与B 互斥时,满足加法公式:P(A∪B)= P(A)+ P(B);若事件A 与B 为对立事件,则A∪B 为必然事件,所以P(A∪B)= P(A)+ P(B)=1,于是有P(A)=1—P(B)4.古典概型及随机数的产生(1)古典概型的使用条件:试验结果的有限性和所有结果的等可能性.(2)公式P (A )=总的基本事件个数包含的基本事件数A 5.几何概型及均匀随机数的产生(1)几何概率模型:如果每个事件发生的概率只与构成该事件区域的长度(面积或体积)成比例,则称这样的概率模型为几何概率模型;(2)公式:P (A )=积)的区域长度(面积或体试验的全部结果所构成积)的区域长度(面积或体构成事件A . 6.随机变量:如果随机试验可能出现的结果可以用一个变量X 来表示,并且X 是随着试验的结果的不同而变化,那么这样的变量叫做随机变量. 随机变量常用大写字母X 、Y 等或希腊字母 ξ、η等表示.7.离散型随机变量的分布列:一般的,设离散型随机变量X 可能取的值为x 1,x 2,..... ,x i ,......,x n .X 取每一个值 x i (i=1,2,......)的概率P(ξ=x i )=P i ,则称表为离散型随机变量X 的概率分布,简称分布列分布列性质:∪ p i ≥0, i =1,2, … ;∪ p 1 + p 2 +…+p n = 1.9.条件概率:对任意事件A 和事件B ,在已知事件A 发生的条件下事件B 发生的概率,叫做条件概率.记作P(B|A),读作A 发生的条件下B 的概率公式:.0)(,)()()|(>=A P A P AB P A B P 10.相互独立事件:事件A(或B)是否发生对事件B(或A)发生的概率没有影响,这样的两个事件叫做相互独立事件,)()()(B P A P B A P ⋅=⋅12.数学期望:一般地,若离散型随机变量ξ的概率分布为 则称 Eξ=x 1p 1+x 2p 2+…+x n p n 为ξ的数学期望或平均数、均值,数学期望又简称为期望.是离散型随机变量.13.方差:D(ξ)=(x 1-Eξ)2·P 1+(x 2-Eξ)2·P 2 +......+(x n -Eξ)2·P n 叫随机变量ξ的均方差,简称方差.14.正态分布:(1)定义:若概率密度曲线就是或近似地是函数 的图象,其中解析式中的实数0)μσσ>、(是参数,分别表示总体的平均数与标准差.则其分布叫正态分布(,)N μσ记作:,f( x )的图象称为正态曲线;(2)基本性质:∪曲线在x 轴的上方,与x 轴不相交;∪曲线关于直线x=对称,且在x=时位于最高点;∪当一定时,曲线的形状由确定.越大,曲线越“矮胖”;表示总体的分布越分散;越小,曲线越“瘦高”,表示总体的分布越集中;∪正态曲线下的总面积等于1.15.3原则:从上表看到,正态总体在 以外取值的概率只有4.6%,在 以外取值的概率只有0.3% 由于这些概率很小,通常称这些情况发生为小概率事件.也就是说,通常认为这些情况在一次试验中几乎是不可能发生的.),(,21)(222)(+∞-∞∈=--x e x f x σμσπμμμσσσσ)2,2(σμσμ+-)3,3(σμσμ+-17.回归分析。
高考数学大题概率知识点

高考数学大题概率知识点1. 引言高考数学中,概率是一个重要的章节。
掌握概率知识对于解答大题尤为关键。
本文将介绍高考数学大题中常见的概率知识点,帮助考生更好地应对考试。
2. 样本空间与事件解决概率问题首先要确定样本空间和事件。
样本空间是指一个试验的所有可能结果的集合,而事件是样本空间内的一个子集。
对于一些复杂的问题,借助树状图或排列组合的方法可以帮助我们确定样本空间和事件。
3. 互斥事件和对立事件互斥事件指的是两个事件不可能同时发生,例如投掷一枚硬币的正面和反面。
而对立事件指的是两个事件只能有一个发生,例如投掷一枚骰子的结果为偶数或奇数。
4. 概率的计算方法概率可以用频率的方法计算,即频率等于发生次数除以总次数。
然而在高考中,更常用的是基于概率的计算方法。
对于等可能的样本空间,事件A发生的概率等于事件A的基本结果数除以样本空间的基本结果数。
5. 条件概率条件概率是指在已知某一事件发生的条件下,另一事件发生的概率。
条件概率的计算方法是在已知条件下,将事件A与事件B的交集除以事件B的概率。
例如,已知某人患病的条件下,他接受某种治疗方法的概率。
6. 事件的独立性两个事件A和B是独立的,指的是事件A的发生与否与事件B 的发生与否无关。
在概率计算中,独立事件的概率计算方法是将事件A的概率乘以事件B的概率。
例如,两次独立投掷一枚硬币的结果。
7. 事件的相互依赖两个事件A和B是相互依赖的,指的是事件A的发生与否会影响事件B的发生与否。
在概率计算中,需要根据已知条件和条件概率进行计算。
例如,抽取有放回和无放回的问题。
8. 排列组合与概率计算在一些情况下,概率计算需要借助排列组合的知识。
例如,从n个元素中取出m个,每次取出后不放回,再继续取出的问题。
对于这类问题,可以利用排列组合的知识计算事件的基本结果数,从而计算概率。
9. 常见题型分析高考中常见的概率题型包括抽球问题、生日问题、赛事问题等。
抽球问题涉及到有放回和无放回的情况,需要根据已知条件进行计算。
高考数学概率统计知识点梳理

高考数学概率统计知识点梳理概率统计作为高中数学的重要组成部分,是高考中常见的考点之一。
掌握好概率统计的知识,对于考生来说至关重要。
下面将对高考数学概率统计知识点进行梳理,帮助考生更好地复习和备考。
一、随机事件及其概率在概率统计中,随机事件是指在相同条件下可以重复出现的试验结果。
概率是描述随机事件发生的可能性大小的数值。
常见的概率计算方法包括:基本概率公式、加法原理、乘法原理等。
在高考中,常见的随机事件概率计算题型有:求事件发生的可能性,计算联合概率、条件概率等。
二、样本空间与事件样本空间是指试验所有可能结果的集合,事件是样本空间的一个子集。
在概率统计中,常用样本空间和事件的关系来求解概率。
考生需要掌握样本空间的求法,以及事件与样本空间的关系。
三、频率与概率频率是指某个事件在重复试验中发生的次数与试验总次数的比值。
概率是指某个事件在理论上发生的可能性大小。
频率与概率之间存在着紧密的联系,频率可以用来近似估算概率。
在高考中,考生需要理解频率与概率的关系,并能够进行频率与概率之间的转换。
四、排列组合与概率排列组合是概率统计中常用的计算方法。
排列是指从n个不同元素中取出m个元素进行顺序安排的方法数,组合是指从n个不同元素中取出m个元素进行不顺序的安排方法数。
在排列组合的基础上,结合概率的计算,考生需要能够解决排列组合与概率相结合的题型。
五、随机变量及其分布随机变量是指随机试验结果的数值化描述,可以是离散的也可以是连续的。
随机变量的分布描述了随机变量每个可能值出现的概率。
常见的离散随机变量分布有:二项分布、泊松分布等;常见的连续随机变量分布有:正态分布、指数分布等。
在高考中,随机变量的概率计算题型经常出现,考生需要熟练掌握各种分布的特点和计算方法。
六、统计与抽样统计是指对大量数据进行收集、整理和分析的过程。
抽样是统计的基本方法之一,是指从总体中选取一部分样本进行研究。
在高考中,常见的统计与抽样的题型有:调查设计、样本估计等。
高考数学概率与统计知识点总结

高考数学概率与统计知识点总结概率和统计的相关题目需要记忆相关的公式和大量的计算,所以也是最能考察学生们计算能力的题了。
果实饱满鲜嫩水灵鸽子、燕子象征和平乳燕初飞婉转悦耳莺歌燕舞翩然归来麻雀、喜鹊枝头嬉戏灰不溜秋叽叽喳喳鹦鹉鹦鹉学舌婉转悦耳笨嘴学舌啄木鸟利嘴如铁钢爪如钉鸡鸭鹅神气活现昂首挺胸肥大丰满自由自在引吭高歌马腾空而起狂奔飞驰膘肥体壮昂首嘶鸣牛瘦骨嶙峋行动迟缓俯首帖耳膘肥体壮车川流不息呼啸而过穿梭往来缓缓驶离船一叶扁舟扬帆远航乘风破浪雾海夜航追波逐浪飞机划破云层直冲云霄穿云而过银鹰展翅学习用品美观实用小巧玲珑造型优美设计独特玩具栩栩如生活泼可爱惹人喜爱爱不释手彩虹雨后彩虹彩桥横空若隐若现光芒万丈雪大雪纷飞大雪封山鹅毛大雪漫天飞雪瑞雪纷飞林海雪原风雪交加霜雪上加霜寒霜袭人霜林尽染露垂露欲滴朝露晶莹日出露干雷电电光石火雷电大作惊天动地春雷滚滚电劈石击雷电交加小雨阴雨连绵牛毛细雨秋雨连绵随风飘洒大雨倾盆大雨狂风暴雨大雨滂沱瓢泼大雨大雨淋漓暴雨如注风秋风送爽金风送爽北风呼啸微风习习寒风刺骨风和日丽雾大雾迷途云雾茫茫雾似轻纱风吹雾散云消雾散云彩云满天天高云淡乌云翻滚彤云密,布霞彩霞缤纷晚霞如火朝霞灿烂丹霞似锦星最远的地方:天涯海角最远的分离:天壤之别最重的话:一言九鼎最可靠的话:一言为定其它成语一、描写人的品质:平易近人宽宏大度冰清玉洁持之以恒锲而不舍废寝忘食大义凛然临危不俱光明磊落不屈不挠鞠躬尽瘁死而后已二、描写人的智慧:料事如神足智多谋融会贯通学贯中西博古通今才华横溢出类拔萃博大精深集思广益举一反三三、描写人物仪态、风貌:憨态可掬文质彬彬风度翩翩相貌堂堂落落大方斗志昂扬意气风发,威风凛凛容光焕发神采奕奕四、描写人物神情、情绪:悠然自得眉飞色舞喜笑颜开神采奕奕欣喜若狂呆若木鸡喜出望外垂头丧气无动于衷勃然大怒五、描写人的口才:能说会道巧舌如簧能言善辩滔滔不绝伶牙俐齿,出口成章语惊四座娓娓而谈妙语连珠口若悬河六、来自历史故事的成语:三顾茅庐铁杵成针望梅止渴完璧归赵四面楚歌负荆请罪精忠报国手不释卷悬梁刺股凿壁偷光七、描写人物动作:走马——花欢呼雀跃扶老携幼手舞足蹈促膝谈心前俯后仰奔走相告跋山涉水前赴后继张牙舞爪八、描写人间情谊:恩重如山深情厚谊手足情深形影不离血浓于水志同道合风雨同舟赤诚相待肝胆相照生死相依九、说明知事晓理方面:循序渐进日积月累温故——新勤能补拙笨鸟先飞学无止境学海无涯滴水穿石发奋图强开卷有益十、来自寓言故事的成语:夏天的,景色鸟语蝉鸣万木葱茏枝繁叶茂莲叶满池秋天秋高气爽天高云淡秋风送爽秋菊怒放秋菊傲骨秋色迷人秋色宜人金桂飘香秋天的景色果实累累北雁南飞满山红叶五谷丰登芦花飘扬冬天天寒地冻北风呼啸滴水成冰寒冬腊月瑞雪纷飞冰天雪地冬天的景色冰封雪盖漫天飞雪白雪皑皑冰封大地冰天雪地早晨东方欲晓旭日东升万物初醒空气清醒雄鸡报晓晨雾弥漫晨光绚丽中午烈日当头丽日临空艳阳高照万里无云碧空如洗傍晚日落西山夕阳西斜残阳如血炊烟四起百鸟归林华灯初上夜幕低垂日薄西山夜晚夜深人静月明星稀夜色柔美夜色迷人深更半夜漫漫长夜城镇风光秀丽人山人海车水马龙宁静和谐村庄草木苍翠竹篱瓦舍山幽路辟小桥流水大楼、饭店直指青云古色古香青砖素瓦耸入碧云工厂机器轰鸣铁流直泻热气腾腾钢花飞溅商店粉饰一新门可罗雀冷冷清清错落有致馆场富丽堂皇设施齐全气势雄伟金碧辉煌学校风景如画闻名遐迩桃李满天下车站、码头井然有序杂乱无章布局巧妙错落有致街道宽阔平坦崎岖不平拥挤不堪畅通无阻花花红柳绿花色迷人花香醉人花枝招展百花齐放百花盛开百花争艳,绚丽多彩五彩缤纷草绿草如,标准答案一、填空题。
高三数学概率和统计

专题18 概率、统计★★★高考在考什么【考题回放】1.甲:A 1、A 2是互斥事件;乙:A 1、A 2是对立事件,那么甲是乙的( B ) A .甲是乙的充分但不必要条件 B .甲是乙的必要但不充分条件C .甲是乙的充要条件D .甲既不是乙的充分条件,也不是乙的必要条件 2.在正方体上任选3个顶点连成三角形,则所得的三角形是直角非等腰三角形的概率为( C ) A .17 B .27 C .37 D .473.某班有50名学生,其中 15人选修A 课程,另外35人选修B 课程.从班级中任选两名学生,他们是选修不同课程的学生的慨率是73.(结果用分数表示) 4.一个均匀小正方体的六个面中,三个面上标以数0,两个面上标以数1,一个面上标以数2,将这个小正方体抛掷2次,则向上的数之积的数学期望是49. 5.某人5次上班途中所花的时间(单位:分钟)分别为x ,y ,10,11,9.已知这组数据的平均数为10,方差为2,则|x -y |的值为 ( D ) (A )1 (B )2 (C )3 (D )4 6.某射手进行射击训练,假设每次射击击中目标的概率为53,且各次射击的结果互不影响。
(1)求射手在3次射击中,至少有两次连续击中目标的概率(用数字作答); (2)求射手第3次击中目标时,恰好射击了4次的概率(用数字作答); (3)设随机变量ξ表示射手第3次击中目标时已射击的次数,求ξ的分布列. 【专家解答】(Ⅰ)记“射手射击1次,击中目标”为事件A ,则在3次射击中至少有两次连续击中目标的概率1()()()P P A A A P A A A P A A A =⋅⋅+⋅⋅+⋅⋅33223333363555555555125=⨯⨯+⨯⨯+⨯⨯=(Ⅱ)射手第3次击中目标时,恰好射击了4次的概率2223323162()555625p C =⨯⨯⨯=(Ⅲ)由题设,“k ξ=”的概率为()P k ξ=233123()()55k k C --=⨯⨯(*k N ∈且3k ≥)所以,ξ的分布列为:★★★高考要考什么【考点透视】等可能性的事件的概率,互斥事件有一个发生的概率,相互独立事件同时发生的概率,独立重复试验、离散型随机变量的分布列、期望和方差.【热点透析】1.相互独立事件同时发生的概率,其关键是利用排列组合的内容求解m ,n . 2.独立重复试验,其关键是明确概念,用好公式,注意正难则反的思想.3.离散型随机变量的分布列、期望和方差,注意ξ取值的完整性以及每一取值的 实际含义.★★★突破重难点【范例1】某批产品成箱包装,每箱5件.一用户在购进该批产品前先取出3箱,再从每箱中任意抽取2件产品进行检验.设取出的第一、二、三箱中分别有0件、1件、2件二等品,其余为一等品.(Ⅰ)用ξ表示抽检的6件产品中二等品的件数,求ξ的分布列及ξ的数学期望; (Ⅱ)若抽检的6件产品中有2件或2件以上二等品,用户就拒绝购买这批产品,求这批产品级用户拒绝的概率.解(1)0,1,2,3ξ=22342255189P( 0)=10050C C C C ξ=∙==, 211123324422225555C 24P( 1 )=C 50C C C C C C C ξ=∙+∙=,11122324422222555515(2)50C C C C C P C C C C ξ==∙+∙=, 124222552(3)50C C P C C ξ==∙=所以ξ的分布列为ξ的数学期望E(ξ)=0123 1.250505050⨯+⨯+⨯+⨯=(2) P(2ξ≥)=15217(2)(3)505050P P ξξ=+==+=【点晴】本题以古典概率为背景,其关键是利用排列组合的方法求出m ,n ,主要考察分布列的求法以及利用分布列求期望和概率。
高考数学概率统计解答题专题

高考数学概率统计解答题专题一、归类解析题型一:离散型随机变量的期望与方差【解题指导】离散型随机变量的期望和方差的求解,一般分两步:一是定型,即先判断随机变量的分布是特殊类型,还是一般类型,如两点分布、二项分布、超几何分布等属于特殊类型;二是定性,对于特殊类型的期望和方差可以直接代入相应公式求解,而对于一般类型的随机变量,应先求其分布列然后代入相应公式计算,注意离散型随机变量的取值与概率的对应.【例】某品牌汽车4S店,对最近100位采用分期付款的购车者进行统计,统计结果如下表所示.已知分9期付款的频率为0.2.4S店经销一辆该品牌的汽车,顾客分3期付款,其利润为1万元;分6期或9期付款,其利润为1.5万元;分12期或15期付款,其利润为2万元.用η表示经销一辆汽车的利润.(1)求上表中的a,b值;(2)若以频率作为概率,求事件A“购买该品牌汽车的3位顾客中,至多有1位采用分9期付款”的概率P(A);(3)求η的分布列及期望E(η).【变式训练】某项大型赛事,需要从高校选拔青年志愿者,某大学生实践中心积极参与,从8名学生会干部(其中男生5名,女生3名)中选3名参加志愿者服务活动.若所选3名学生中的女生人数为X,求X的分布列及期望.题型二:概率与统计的综合应用【解题指导】概率与统计作为考查考生应用意识的重要载体,已成为近几年高考的一大亮点和热点.它与其他知识融合、渗透,情境新颖,充分体现了概率与统计的工具性和交汇性.【例】某公司计划购买2台机器,该种机器使用三年后即被淘汰,机器有一易损零件,在购进机器时,可以额外购买这种零件作为备件,每个200元.在机器使用期间,如果备件不足再购买,则每个500元.现需决策在购买机器时应同时购买几个易损零件,为此搜集并整理了100台这种机器在三年使用期内更换的易损零件数,得下面柱状图:以这100台机器更换的易损零件数的频率代替1台机器更换的易损零件数发生的概率,记X表示2台机器三年内共需更换的易损零件数,n表示购买2台机器的同时购买的易损零件数.(1)求X的分布列;(2)若要求P (X ≤n )≥0.5,确定n 的最小值;(3)以购买易损零件所需费用的期望值为决策依据,在n =19与n =20之中选其一,应选用哪个? 【变式训练】经销商经销某种农产品,在一个销售季度内,每售出1 t 该产品获得利润500元,未售出的产品,每1 t 亏损300元.根据历史资料,得到销售季度内市场需求量的频率分布直方图,如图所示.经销商为下一个销售季度购进了130 t 该农产品.以X (单位:t,100≤X ≤150)表示下一个销售季度内的市场需求量,T (单位:元)表示下一个销售季度内经销该农产品的利润.(1)将T 表示为X 的函数;(2)根据直方图估计利润T 不少于57 000元的概率;(3)在直方图的需求量分组中,以各组的区间中点值代表该组的各个值,需求量落入该区间的频率作为需求量取该区间中点值的概率(例如:若需求量X ∈[100,110),则取X =105,且X =105的概率等于需求量落入[100,110)的频率),求T 的期望. 题型三:概率与统计案例的综合应用【解题指导】 概率与统计案例的综合应用常涉及相互独立事件同时发生的概率、频率分布直方图的识别与应用、数字特征、独立性检验等基础知识,考查学生的阅读理解能力、数据处理能力、运算求解能力及应用意识.【例】高铁、网购、移动支付和共享单车被誉为中国的“新四大发明”,彰显出中国式创新的强劲活力.某移动支付公司从我市移动支付用户中随机抽取100名进行调查,得到如下数据:每周移动支付次数1次 2次 3次 4次 5次 6次及以上总计 男 10 8 7 3 2 15 45 女 5 4 6 4 6 30 55 总计1512137845100(1)把每周使用移动支付超过3次的用户称为“移动支付活跃用户”,能否在犯错误概率不超过0.005的前提下,认为是否为“移动支付活跃用户”与性别有关?(2)把每周使用移动支付6次及6次以上的用户称为“移动支付达人”,视频率为概率,在我市所有“移动支付达人”中,随机抽取4名用户.①求抽取的4名用户中,既有男“移动支付达人”又有女“移动支付达人”的概率;②为了鼓励男性用户使用移动支付,对抽出的男“移动支付达人”每人奖励300元,记奖励总金额为X ,求X 的分布列及期望. 附公式及表如下:χ2=nn 11n 22-n 12n 212n 1+n 2+n +1n +2.P (χ2≥k 0) 0.15 0.10 0.05 0.025 0.010 0.005 0.001 k 02.0722.7063.8415.0246.6357.87910.828【变式训练】电视传媒公司为了解某地区电视观众对某类体育节目的收视情况,随机抽取了100名观众进行调查,其中女性有55名.下面是根据调查结果绘制的观众日均收看该体育节目时间的频率分布直方图:将日均收看该体育节目时间不低于40分钟的观众称为“体育迷”.(1)根据已知条件完成下面的2×2列联表,并据此资料是否可以认为“体育迷”与性别有关?非体育迷体育迷合计 男 女 10 55 合计(2)将上述调查所得到的频率视为概率.现在从该地区大量电视观众中,采用随机抽样方法每次抽取1名观众,抽取3次,记被抽取的3名观众中的“体育迷”人数为X .若每次抽取的结果是相互独立的,求X 的分布列、期望E (X )和方差D (X ). 附:χ2=n n 11n 22-n 12n 212n 1+n 2+n +1n +2.P (χ2≥k 0) 0.10 0.05 0.01 k 02.7063.8416.635二、专题突破训练1.为了增强消防安全意识,某中学对全体学生做了一次消防知识讲座,从男生中随机抽取50人,从女生中随机抽取70人参加消防知识测试,统计数据得到如下列联表:优秀 非优秀 合计 男生 15 35 50 女生 30 40 70 合计4575120(1)试判断能否有90%的把握认为消防知识的测试成绩优秀与否与性别有关?(2)为了宣传消防知识,从该校测试成绩获得优秀的同学中采用分层抽样的方法,随机选出6人组成宣传小组.现从这6人中随机抽取2人到校外宣传,求到校外宣传的同学中男生人数X 的分布列和期望. 附:χ2=n n 11n 22-n 12n 212n 1+n 2+n +1n +2.2(1)求出y关于x的回归直线方程y=b x+a,并在坐标系中画出回归直线;(2)试预测加工10个零件需要的时间.3.为了评估天气对某市运动会的影响,制定相应预案,该市气象局通过对最近50多年气象数据资料的统计分析,发现8月份是该市雷电天气高峰期,在31天中平均发生雷电14.57天(如图所示).如果用频率作为概率的估计值,并假定每一天发生雷电的概率均相等,且相互独立.(1)求在该市运动会开幕(8月12日)后的前3天比赛中,恰好有2天发生雷电天气的概率(精确到0.01);(2)设运动会期间(8月12日至23日,共12天),发生雷电天气的天数为X,求X的期望和方差(精确到0.01).4.某婴幼儿游泳馆为了吸引顾客,推出优惠活动,即对首次消费的顾客按80元收费,并注册成为会员,对会员消费的不同次数给予相应的优惠,标准如下:假设每位顾客游泳1(1)估计该游泳馆1位会员至少消费2次的概率;(2)某会员消费4次,求这4次消费中,游泳馆获得的平均利润;(3)假设每个会员最多消费4次,以事件发生的频率作为相应事件发生的概率,从该游泳馆的会员中随机抽取2位,记游泳馆从这2位会员的消费中获得的平均利润之差的绝对值为X,求X的分布列和期望E(X).。
高三数学(概率统计部分)整理

高三数学(概率统计部分)整理 概率统计是历年高考的热点内容之一,考查方式多样,难度中等,主要考查概率与统计的基本概念、公式以及基本技能、方法,以及分析问题、解决问题的能力.通过对基础知识的重新组合、变式和拓展,从而加工为立意高、情境新、设问巧、并赋予时代气息、贴近学生实际的问题。
以排列和概率统计知识为工具,考查概率的计算、随机变量的概率分布、均值、方差、抽样方法、样本频率估计、线性回归方程、独立性检验、随机变量的分布列、期望、方差等内容.考点1. 求等可能性事件、互斥事件和相互独立事件的概率(1)等可能性事件(古典概型)的概率:P (A )=)()(I card A card =n m ; (2)互斥事件有一个发生的概率:P (A +B )=P (A )+P (B );特例:对立事件的概率:P (A )+P (A )=P (A +A )=1.(3)相互独立事件同时发生的概率:P (A ·B )=P (A )·P (B );特例:独立重复试验的概率:P n (k )=k n k k n p p C --)1(.其中P 为事件A 在一次试验中发生的概率,此式为二项式[(1-P)+P]n 展开的第k+1项.(4)解决概率问题的一般步骤:第一步,确定事件性质⎧⎪⎪⎨⎪⎪⎩等可能事件互斥事件 独立事件n 次独立重复试验即所给的问题归结为四类事件中的某一种.第二步,判断事件的运算⎧⎨⎩和事件积事件即是至少有一个发生,还是同时发生,分别运用相加或相乘事件.第三步,运用公式()()()()()()()()(1)k k n k n n m P A n P A B P A P B P A B P A P B P k C p p -⎧=⎪⎪⎪+=+⎨⎪⋅=⋅⎪=-⎪⎩等可能事件: 互斥事件: 独立事件: n 次独立重复试验:求解 第四步,答,即给提出的问题有一个明确的答复. 注意:(1)注意判断是古典概型还是几何概型,基本事件前者是有限的,后者是无限的,两者都是等可能性.(2)在几何概型中注意区域是线段,平面图形,立体图形.(3)古典概型的概率问题,关键是正确找出基本事件总数和所求事件包含的基本事件数,然后利用古典概型的概率计算公式计算;(4)当基本事件总数较少时,用列举法把所有的基本事件一一列举出来,要做到不重不漏,有时可借助列表,树状图列举,当基本事件总数较多时,注意去分排列与组合;(5)辨别清楚条件概率问题,两种计算方法,合理选用。
高中数学概率与统计常考题型归纳

高中数学概率与统计(理科)常考题型归纳题型一:常见概率模型的概率几何概型、古典概型、相互独立事件与互斥事件的概率、条件概率是高考的热点,几何概型主要以客观题考查,求解的关键在于找准测度(面积,体积或长度);相互独立事件,互斥事件常作为解答题的一问考查,也是进一步求分布列,期望与方差的基础,求解该类问题要正确理解题意,准确判定概率模型,恰当选择概率公式.【例1】现有4个人去参加某娱乐活动,该活动有甲、乙两个游戏可供参加者选择.为增加趣味性,约定:每个人通过掷一枚质地均匀的骰子决定自己去参加哪个游戏,掷出点数为1或2的人去参加甲游戏,掷出点数大于2的人去参加乙游戏. (1)求这4个人中恰有2人去参加甲游戏的概率;(2)求这4个人中去参加甲游戏的人数大于去参加乙游戏的人数的概率;(3)用X ,Y 分别表示这4个人中去参加甲、乙游戏的人数,记ξ=|X -Y |,求随机变量ξ的分布列. 解 依题意,这4个人中,每个人去参加甲游戏的概率为13,去参加乙游戏的概率为23.设“这4个人中恰有i 人去参加甲游戏”为事件A i (i =0,1,2,3,4). 则P (A i )=C i 4⎝ ⎛⎭⎪⎫13i ⎝ ⎛⎭⎪⎫234-i.(1)这4个人中恰有2人去参加甲游戏的概率 P (A 2)=C 24⎝ ⎛⎭⎪⎫132⎝ ⎛⎭⎪⎫232=827.(2)设“这4个人中去参加甲游戏的人数大于去参加乙游戏的人数”为事件B ,则B =A 3+A 4,且A 3与A 4互斥,∴P (B )=P (A 3+A 4)=P (A 3)+P (A 4)=C 34⎝ ⎛⎭⎪⎫133×23+C 44⎝ ⎛⎭⎪⎫134=19.(3)依题设,ξ的所有可能取值为0,2,4. 且A 1与A 3互斥,A 0与A 4互斥. 则P (ξ=0)=P (A 2)=827, P (ξ=2)=P (A 1+A 3)=P (A 1)+P (A 3) =C 14⎝ ⎛⎭⎪⎫131·⎝ ⎛⎭⎪⎫233+C 34⎝ ⎛⎭⎪⎫133×23=4081,P (ξ=4)=P (A 0+A 4)=P (A 0)+P (A 4) =C 04⎝ ⎛⎭⎪⎫234+C 44⎝ ⎛⎭⎪⎫134=1781.所以ξ的分布列是【类题通法】(1)本题44人中恰有i 人参加甲游戏的概率P =C i 4⎝ ⎛⎭⎪⎫13i ⎝ ⎛⎭⎪⎫234-i,这是本题求解的关键.(2)解题中常见的错误是不能分清事件间的关系,选错概率模型,特别是在第(3)问中,不能把ξ=0,2,4的事件转化为相应的互斥事件A i 的概率和.【变式训练】甲、乙两班进行消防安全知识竞赛,每班出3人组成甲乙两支代表队,首轮比赛每人一道必答题,答对则为本队得1分,答错或不答都得0分,已知甲队3人每人答对的概率分别为34,23,12,乙队每人答对的概率都是23,设每人回答正确与否相互之间没有影响,用ξ表示甲队总得分. (1)求ξ=2的概率;(2)求在甲队和乙队得分之和为4的条件下,甲队比乙队得分高的概率. 解 (1)ξ=2,则甲队有两人答对,一人答错,故P (ξ=2)=34×23×⎝⎛⎭⎪⎫1-12+34×⎝ ⎛⎭⎪⎫1-23×12+⎝ ⎛⎭⎪⎫1-34×23×12=1124;(2)设甲队和乙队得分之和为4为事件A ,甲队比乙队得分高为事件B .设乙队得分为η,则η~B ⎝⎛⎭⎪⎫3,23.P (ξ=1)=34×⎝⎛⎭⎪⎫1-23×⎝ ⎛⎭⎪⎫1-12+⎝ ⎛⎭⎪⎫1-34×23×⎝ ⎛⎭⎪⎫1-12+⎝ ⎛⎭⎪⎫1-34×⎝ ⎛⎭⎪⎫1-23×12=14, P (ξ=3)=34×23×12=14,P (η=1)=C 13·23·⎝ ⎛⎭⎪⎫132=29,P (η=2)=C 23·⎝ ⎛⎭⎪⎫232·13=49,P (η=3)=C 33⎝ ⎛⎭⎪⎫233=827,∴P (A )=P (ξ=1)P (η=3)+P (ξ=2)P (η=2)+P (ξ=3)·P (η=1) =14×827+1124×49+14×29=13, P (AB )=P (ξ=3)·P (η=1)=14×29=118,∴所求概率为P (B|A )=P (AB )P (A )=11813=16.题型二:离散型随机变量的分布列、均值与方差离散型随机变量及其分布列、均值与方差及应用是数学高考的一大热点,每年均有解答题的考查,属于中档题.复习中应强化应用题目的理解与掌握,弄清随机变量的所有取值是正确列随机变量分布列和求均值与方差的关键,对概率模型的确定与转化是解题的基础,准确计算是解题的核心,在备考中强化解答题的规范性训练.【例2】甲乙两人进行围棋比赛,约定先连胜两局者直接赢得比赛,若赛完5局仍未出现连胜,则判定获胜局数多者赢得比赛.假设每局甲获胜的概率为23,乙获胜的概率为13,各局比赛结果相互独立.(1)求甲在4局以内(含4局)赢得比赛的概率;(2)记X 为比赛决出胜负时的总局数,求X 的分布列和均值(数学期望).解 用A 表示“甲在4局以内(含4局)赢得比赛”,A k 表示“第k 局甲获胜”,B k 表示“第k 局乙获胜”,则P (A k )=23,P (B k )=13,k =1,2,3,4,5.(1)P (A )=P (A 1A 2)+P (B 1A 2A 3)+P (A 1B 2A 3A 4) =P (A 1)P (A 2)+P (B 1)P (A 2)P (A 3)+P (A 1)P (B 2)·P (A 3)P (A 4)=⎝ ⎛⎭⎪⎫232+13×⎝ ⎛⎭⎪⎫232+23×13×⎝ ⎛⎭⎪⎫232=5681.(2)X 的可能取值为2,3,4,5.P (X =2)=P (A 1A 2)+P (B 1B 2)=P (A 1)P (A 2)+P (B 1)·P (B 2)=59,P (X =3)=P (B 1A 2A 3)+P (A 1B 2B 3)=P(B1)P(A2)P(A3)+P(A1)P(B2)P(B3)=2 9,P(X=4)=P(A1B2A3A4)+P(B1A2B3B4)=P(A1)P(B2)P(A3)P(A4)+P(B1)P(A2)P(B3)P(B4)=10 81,P(X=5)=1-P(X=2)-P(X=3)-P(X=4)=8 81 .故X的分布列为E(X)=2×59+3×29+4×1081+5×81=81.【类题通法】求离散型随机变量的均值和方差问题的一般步骤第一步:确定随机变量的所有可能值;第二步:求每一个可能值所对应的概率;第三步:列出离散型随机变量的分布列;第四步:求均值和方差;第五步:反思回顾.查看关键点、易错点和答题规范.【变式训练】为回馈顾客,某商场拟通过摸球兑奖的方式对1 000位顾客进行奖励,规定:每位顾客从一个装有4个标有面值的球的袋中一次性随机摸出2个球,球上所标的面值之和为该顾客所获的奖励额.(1)若袋中所装的4个球中有1个所标的面值为50元,其余3个均为10元.求:①顾客所获的奖励额为60元的概率;②顾客所获的奖励额的分布列及数学期望;(2)商场对奖励总额的预算是60 000元,并规定袋中的4个球只能由标有面值10元和50元的两种球组成,或标有面值20元和40元的两种球组成.为了使顾客得到的奖励总额尽可能符合商场的预算且每位顾客所获的奖励额相对均衡,请对袋中的4个球的面值给出一个合适的设计,并说明理由.解(1)设顾客所获的奖励额为X.①依题意,得P(X=60)=C11C13C24=12,即顾客所获的奖励额为60元的概率为1 2 .②依题意,得X的所有可能取值为20,60.P(X=60)=12,P(X=20)=C23C24=12,即X的分布列为所以顾客所获的奖励额的数学期望为E(X)=20×2+60×2=40(元).(2)根据商场的预算,每个顾客的平均奖励额为60元.所以,先寻找期望为60元的可能方案.对于面值由10元和50元组成的情况,如果选择(10,10,10,50)的方案,因为60元是面值之和的最大值,所以期望不可能为60元;如果选择(50,50,50,10)的方案,因为60元是面值之和的最小值,所以期望也不可能为60元,因此可能的方案是(10,10,50,50),记为方案1.对于面值由20元和40元组成的情况,同理,可排除(20,20,20,40)和(40,40,40,20)的方案,所以可能的方案是(20,20,40,40),记为方案2.以下是对两个方案的分析:对于方案1,即方案(10,10,50,50),设顾客所获的奖励额为X1,则X1的分布列为X 1的数学期望为E(X1)=20×16+60×3+100×6=60(元),X 1的方差为D(X1)=(20-60)2×16+(60-60)2×23+(100-60)2×16=1 6003.对于方案2,即方案(20,20,40,40),设顾客所获的奖励额为X2,则X2的分布列为X 2的数学期望为E(X2)=40×16+60×3+80×6=60(元),X 2的方差为D(X2)=(40-60)2×16+(60-60)2×23+(80-60)2×16=4003.由于两种方案的奖励额的数学期望都符合要求,但方案2奖励额的方差比方案1的小,所以应该选择方案2.题型三:概率与统计的综合应用概率与统计作为考查考生应用意识的重要载体,已成为近几年高考的一大亮点和热点.主要依托点是统计图表,正确认识和使用这些图表是解决问题的关键.复习时要在这些图表上下工夫,把这些统计图表的含义弄清楚,在此基础上掌握好样本特征数的计数方法、各类概率的计算方法及数学均值与方差的运算.【例3】2018年6月14日至7月15日,第21届世界杯足球赛将于俄罗斯举行,某大学为世界杯组委会招收志愿者,被招收的志愿者需参加笔试和面试,把参加笔试的40名大学生的成绩分组:第1组75,80),第2组80,85),第3组85,90),第4组90,95),第5组95,100],得到的频率分布直方图如图所示:(1)分别求出成绩在第3,4,5组的人数;(2)现决定在笔试成绩较高的第3,4,5组中用分层抽样抽取6人进行面试.①已知甲和乙的成绩均在第3组,求甲或乙进入面试的概率;②若从这6名学生中随机抽取2名学生接受考官D的面试,设第4组中有X名学生被考官D面试,求X的分布列和数学期望.解(1)由频率分布直方图知:第3组的人数为5××40=12.第4组的人数为5××40=8.第5组的人数为5××40=4.(2)利用分层抽样,在第3组,第4组,第5组中分别抽取3人,2人,1人.①设“甲或乙进入第二轮面试”为事件A,则P(A)=1-C310C312=511,所以甲或乙进入第二轮面试的概率为5 11 .②X的所有可能取值为0,1,2,P(X=0)=C24C26=25,P(X=1)=C12C14C26=815,P(X=2)=C22C26=115.所以X的分布列为E(X)=0×25+1×815+2×115=1015=3.【类题通法】本题将传统的频率分布直方图与分布列、数学期望相结合,立意新颖、构思巧妙.求解离散型随机变量的期望与频率分布直方图交汇题的“两步曲”:一是看图说话,即看懂频率分布直方图中每一个小矩形面积表示这一组的频率;二是活用公式,本题中X服从超几何分布.【变式训练】某公司为了解用户对某产品的满意度,从A,B两地区分别随机调查了20个用户,得到用户对产品的满意度评分如下:A地区:62 73 81 92 95 85 74 64 53 7678 86 95 66 97 78 88 82 76 89B地区:73 83 62 51 91 46 53 73 64 8293 48 65 81 74 56 54 76 65 79(1)根据两组数据完成两地区用户满意度评分的茎叶图,并通过茎叶图比较两地区满意度评分的平均值及分散程度(不要求计算出具体值,给出结论即可);(2)根据用户满意度评分,将用户的满意度从低到高分为三个等级:记事件C:“A互独立.根据所给数据,以事件发生的频率作为相应事件发生的概率,求C的概率.解(1)两地区用户满意度评分的茎叶图如下通过茎叶图可以看出,A地区用户满意度评分的平均值高于B地区用户满意度评分的平均值;A地区用户满意度评分比较集中,B地区用户满意度评分比较分散.(2)记C A 1表示事件:“A 地区用户的满意度等级为满意或非常满意”;C A 2表示事件:“A 地区用户的满意度等级为非常满意”; C B 1表示事件:“B 地区用户的满意度等级为不满意”; C B 2表示事件:“B 地区用户的满意度等级为满意”, 则C A 1与C B 1独立,C A 2与C B 2独立,C B 1与C B 2互斥,C =C B 1C A 1∪C B 2C A 2. P (C )=P (C B 1C A 1∪C B 2C A 2) =P (C B 1C A 1)+P (C B 2C A 2) =P (C B 1)P (C A 1)+P (C B 2)P (C A 2).由所给数据得C A 1,C A 2,C B 1,C B 2发生的频率分别为1620,420,1020,820,即P (C A 1)=1620,P (C A 2)=420,P (C B 1)=1020,P (C B 2)=820,故P (C )=1020×1620+820×420=.题型四:统计与统计案例能根据给出的线性回归方程系数公式求线性回归方程,了解独立性检验的基本思想、方法,在选择或填空题中常涉及频率分布直方图、茎叶图及样本的数字特征(如平均数、方差)的考查,解答题中也有所考查.【例4】从某居民区随机抽取10个家庭,获得第i 个家庭的月收入x i (单位:千元)与月储蓄y i (单位:千元)的数据资料,算得∑10i =1x i =80,∑10i =1y i =20,∑10i =1x i y i =184,∑10i =1x 2i =720. (1)求家庭的月储蓄y 对月收入x 的线性回归方程y ^=b ^x +a ^; (2)判断变量x 与y 之间是正相关还是负相关;(3)若该居民区某家庭月收入为7千元,预测该家庭的月储蓄.附:线性回归方程y ^=b ^x +a ^中,b ^=,a ^=y -b ^ x ,其中x ,y 为样本平均值. 解 (1)由题意知n =10,x =1n∑ni =1x i =8010=8, y =1n∑ni =1y i =2010=2, 又l xx =∑ni =1x 2i -n x 2=720-10×82=80, l xy =∑ni =1x i y i -n x y =184-10×8×2=24,由此得b^=lxylxx=2480=,a^=y-b^x=2-×8=-,故所求线性回归方程为y^=-.(2)由于变量y的值随x值的增加而增加(b^=>0),故x与y之间是正相关.(3)将x=7代入回归方程可以预测该家庭的月储蓄为y^=×7-=(千元).【类题通法】(1)分析两个变量的线性相关性,可通过计算相关系数r来确定,r的绝对值越接近于1,表明两个变量的线性相关性越强,r的绝对值越接近于0,表明两变量线性相关性越弱.(2)求线性回归方程的关键是正确运用b^,a^的公式进行准确的计算.【变式训练】4月23日是“世界读书日”,某中学在此期间开展了一系列的读书教育活动.为了解本校学生课外阅读情况,学校随机抽取了100名学生对其课外阅读时间进行调查.下面是根据调查结果绘制的学生日均课外阅读时间(单位:分钟)的频率分布直方图.若将日均课外阅读时间不低于60分钟的学生称为“读书迷”,低于60分钟的学生称为“非读书迷”.(1)根据已知条件完成下面2×2列联表,并据此判断是否有99%的把握认为“读书迷”与性别有关?(2)将频率视为概率.1人,共抽取3次,记被抽取的3人中的“读书迷”的人数为X.若每次抽取的结果是相互独立的,求X的分布列、期望E(X)和方差D(X).解(1)完成2×2列联表如下:K2=10060×40×55×45≈>,故有99%的把握认为“读书迷”与性别有关.(2)将频率视为概率.则从该校学生中任意抽取1名学生恰为读书迷的概率P =25.由题意可知X ~B ⎝ ⎛⎭⎪⎫3,25,P (X =i )=C i 3⎝ ⎛⎭⎪⎫25i ⎝ ⎛⎭⎪⎫353-i(i =0,1,2,3).X 的分布列为均值E (X )=np =3×25=65,方差D (X )=np (1-p )=3×25×⎝ ⎛⎭⎪⎫1-25=1825.。
理第18题 概率与统计(原卷版)-2022年高三毕业班数学第X题满分练(全国通用)

第18题概率与统计高考考点命题分析三年高考探源考查频率概率、随机变量分布列及正态分布高考全国卷每年必有一道概率与统计解答题,该题通常以实际问题为背景,考查考生的数学建模及数据分析等核心素养,可以是较容易的题,也可以是难度较大的题,考查热点是概率的计算、随机变量的分布列、期望与方差的应用、正态分布、用样本估计总体、统计案例.2020课标全国Ⅰ19 2020课标全国Ⅲ18 2019课标全国Ⅱ18 2019课标全国I 21★★★统计与统计案例2021课标全国Ⅰ17 2021课标全国Ⅱ17 2020课标全国Ⅱ18 2020课标全国Ⅲ18 2019课标全国Ⅲ17★★★例题(2021高考全国I )某厂研制了一种生产高精产品的设备,为检验新设备生产产品的某项指标有无提高,用一台旧设备和一台新设备各生产了10件产品,得到各件产品该项指标数据如下:旧设备 9.8 10.3 10.0 10.2 9.99.8 10.0 10.1 10.29.7新设备 10.1 10.4 10.1 10.0 10.1 10.3 10.6 10.5 10.4 10.5y 21S 和22S .(1)求x ,y ,21S ,22S ;(2)判断新设备生产产品的该项指标的均值较旧设备是否有显著提高(如果2212210S S y x +-≥则认为新设备生产产品的该项指标的均值较旧设备有显著提高,否则不认为有显著提高).【答案】(1)221210,10.3,0.036,0.04x y S S ====;(2)新设备生产产品的该项指标的均值较旧设备有 解:(1)9.810.31010.29.99.81010.110.29.71010x +++++++++==,(2分)10.110.410.11010.110.310.610.510.410.510.310y +++++++++==,(4分)22222222210.20.300.20.10.200.10.20.30.03610S +++++++++==,(8分) 222222222220.20.10.20.30.200.30.20.10.20.0410S +++++++++==.(8分)(2)依题意,20.320.1520.1520.025y x -==⨯==,0.0360.040.007610+=(10分)2212210s s y x +-≥,所以新设备生产产品的该项指标的均值较旧设备有显著提高. (12分)1.(2022届江苏省泰州市兴化市高三4月模拟)设(),X Y 是一个二维离散型随机变量,它们的一切可能取的值为(),i j a b ,其中,i j N *∈,令(,)ij i j p P X a Y b ===,称(,)ij p i j N *∈是二维离散型随机变量(),X Y 的联合分布列.与一维的情形相似,我们也习惯于把二维离散型随机变量的联合分布列写成下表形式:(),X Y1b 2b 3b ... 1a 1,1p 1,2p 1,3p (2)a 2,1p 2,2p 2,3p (3)a3,1p3,2p3,3p ·…… … … … …现有()n n N ∈个相同的球等可能的放入编号为1,2,3的三个盒子中,记落下第1号盒子中的球的个数为X ,落入第2号盒子中的球的个数为Y . (1)当n =2时,求(),X Y 的联合分布列;(2)设0(,),nk m p P X k Y m k N ====∈∑且k n ≤计算0nk k kp =∑.2.(陕西省西安市高三下学期二模)某中学对学生进行体质测试(简称体测),随机抽取了100名学生的体测结果等级(“良好以下”或“良好及以上”)进行统计,并制成列联表如下: 良好以下 良好及以上 合计 男 25 女 10 合计70100(2)事先在本次体测等级为“良好及以上”的学生中按照性别采用分层抽样的方式随机抽取了9人.若从这9人中随机抽取3人对其体测指标进行进一步研究,求抽到的3人全是男生的概率.附:()()()()()22n ad bc K a b c d a c b d -=++++,n a b c d =+++.()20P K k ≥0.10 0.05 0.025 0.010 0.001 0k2.7063.8415.0246.63510.828会上参与全民健身活动的人越来越多,小明也有大量好友参与了“健步团”,他随机选取了其中的40人,记录了他们某一天的走路步数,并将数据整理如下:步量性别5001~60006001~70007001~80008001~9000>9000男 1 2 3 6 8 女21062(2)如果每人一天的走路步数超过8000步就会被系统评定为“健步型”,否则为“良好型”,根据题意完成下面的22⨯列联表,并据此判断能否有95%以上的把握认为“评定类型”与“性别”有关健步型良好型总计男女总计附:参考公式()()()()() 2n ad bcKa b c d a c b d-=++++.临界值表:()2P K k≥0.10 0.05 0.025 0.010 0k 2.706 3.841 5.024 6.635专业队,与两名高山滑雪爱好者乙、丙组成的业余队进行友谊比赛.约定赛制如下:业余队中的两名队员轮流与甲进行比赛............,若甲连续豪两场.....则专业队获胜;若甲连续输两场.....则业余队获胜:若比赛三场还没有决出胜负,则视为平局,比赛结束.已知各场比赛相互独立,每场比赛都分出胜负,且甲与乙比赛,乙赢概率为13;甲与丙比赛,丙赢的橱率为p,其中1132p<<.(1)若第一场比赛,业余队可以安接乙与甲进行比赛,也可以安排丙与甲进行比赛.请分别计算两种安排下业余队获胜的概率;若以获胜概率大为最优决策,问:业余队第一场应该安排乙还是丙与甲进行比赛?(2)为了激励专业队和业余队,赛事组织规定:比赛结束时,胜队获奖金3万元,负队获奖金1.5万元;若平局,两队各获奖金1.8万元.在比赛前,已知业余队采用了(1)中的最优决策与甲进行比赛,设赛事组织预备支付的奖金金额共计X万元,求X的数学期望()E X的取值范围.5.(2022届广东省广州市高三二模)某校为全面加强和改进学校体育工作,推进学校体育评价改革,建立了日常参与,体质监测和专项运动技能测试相结合的考查机制,在一次专项运动技能测试中,该校班机抽取60名学生作为样本进行耐力跑测试,这60名学生的测试成绩等级及频数如下表成绩等级优良合格不合格频数7 11 41 1(1)从这60名学生中随机抽取2名学生,这2名学生中耐力跑测试成绩等级为优或良的人数记为X ,求()1P X =;(2)将样本频率视为概率,从该校的学生中随机抽取3名学生参加野外拉练活动,耐力跑测试成绩等级为优或良的学生能完成该活动,合格或不合格的学生不能完成该活动,能完成活动的每名学生得100分,不能完成活动的每名学生得0分.这3名学生所得总分记为Y ,求Y 的数学期望.6.(2022届重庆市高三质量检测)冰壶被喻为冰上的“国际象棋”,是以团队为单位在冰上进行的投掷性竞赛项目,每场比赛共10局,在每局比赛中,每个团队由多名运动员组成,轮流掷壶、刷冰、指挥.两边队员交替掷壶,可击打本方和对手冰壶,以最终离得分区圆心最近的一方冰壶数量多少计算得分,另外一方计零分,以十局总得分最高的一方获胜.冰壶运动考验参与者的体能与脑力,展现动静之美,取舍之智慧.同时由于冰壶的击打规则,后投掷一方有优势,因此前一局的得分方将作为后一局的先手掷壶.已知甲、乙两队参加冰壶比赛,在某局中若甲方先手掷壶,则该局甲方得分概率为25;若甲方后手掷壶,则该局甲方得分概率为23,每局比赛不考虑平局.在该场比赛中,前面已经比赛了六局,双方各有三局得分,其中第六局乙方得分.(1)求第七局、第八局均为甲方得分的概率; (2)求当十局比完,甲方的得分局多于乙方的概率.7.(2022届内蒙古赤峰市高三模拟)为评估设备M 生产某种零件的性能,从设备M 生产零件的流水线上随机抽取100个零件作为样本,测量其直径后,整理得到下表: 直径/mm 58596061626364 65 66 67686970717273合计个数2 1 13 5 6 1931164 4 2 1 2 2 1 10065μ=σ(1)为评判一台设备的性能,从该设备加工的零件中任意抽取一件,记其直径为X ,并根据以下不等式进行评判(P 表示相应事件的概率),()0.6826P X μσμσ-<≤+≥;()220.9545P X μσμσ-<≤+≥;()330.9973P X μσμσ-<≤+≥.评判规则为:若同时满足上述三个不等式,则设备等级为甲;若仅满足其中两个,则等级为乙;若仅满足其中一个,则等级为丙;若全部都不满足,则等级为丁,试判断设备M 的性能等级.(2)将直径小于等于2μσ-或直径大于2μσ+的零件认为是次品.(i )从设备M 的生产流水线上随机抽取3件零件,计算其中次品件数Y 的数学期望()E Y ; (ii )从样本中随机抽取2件零件,计算其中次品件数Z 的概率分布列和数学期望()E Z . 8.(2022届四川省绵阳市高三第三次诊断性考试)随着科技进步,近来年,我国新能源汽车产业迅速发展.以下是中国汽车工业协会2022年2月公布的近六年我国新能源乘用车的年销售量数据:年份 2016 2017 2018 2019 2020 2021 年份代码x1 2 3 4 5 6 新能源乘用车年销售y (万辆)5078126121137352(2)若用e nx y m =模型拟合y 与x 的关系,可得回归方程为0.3337.71e x y =,经计算该模型和第(1)问中模型的2R (2R 为相关指数)分别为0.87和0.71,请分别利用这两个模型,求2022年我国新能源乘用车的年销售量的预测值;(3)你认为(2)中用哪个模型得到的预测值更可靠?请说明理由. 参考数据:设ln u y =,其中ln i i u y =. yu()()61iii x x y y =--∑()()61i ii x x u u =--∑3.63e 5.94e 6.27e144 4.78 841 5.70 37.71 380 528参考公式:对于一组具有线性相关关系的数据()()123i i x y i n =⋅⋅⋅,,,,,,其回归直线ˆˆˆybx a =+的斜率和截距的最小二乘估计公式分别为()()()121ˆnii i nii xx y ybxx==--=-∑∑,ˆˆay bx =-. 9.(2022届四川省攀枝花市高三第三次统一考试)2022年2月4日,北京冬奥会盛大开幕,这是让全国人民普遍关注的体育盛事,因此每天有很多民众通过手机、电视等方式观看相关比赛.某机构将每天收看相关比赛的时间在2小时以上的人称为“冰雪运动爱好者”,否则称为“非冰雪运动爱好者”,该机构通过调查,并从参与调查的人群中随机抽取了100人进行分析,得到下表(单位:人):冰雪运动爱好者非冰雪运动爱好者合计 女性 20 50 男性15合计 100的前提下认为性别与是否为“冰雪运动爱好者”有关?(2)将频率视为概率,现从参与调查的女性人群中用随机抽样的方法每次抽取1人,共抽取3次,记被抽取的3人中“冰雪运动爱好者”的人数为X ,若每次抽取的结果是相互独立的,求X 的分布列、数学期望()E X 和方差()D X . 附:()()()()()22n ad bc K a b c d a c b c -=++++,其中n a b c d =+++. ()20P K k ≥0.05 0.025 0.010 0.005 0.001 0k3.8415.0246.6357.87910.828北京冬奥会男子冰球主要比赛场馆是位于北京奥林匹克公园的“冰之帆”国家体育馆.本届冬奥会男子冰球有12支队伍进入正赛,中国首次组队参赛,比赛规则12支男子冰球参赛队先按照往届冬奥会赛制分成三个小组(每组4个队).正赛分小组赛阶段与决赛阶段;小组赛阶段各组采用单循环赛制(小组内任两队需且仅需比赛一次);决赛阶段均采用淘汰制(每场比赛胜者才晋级),先将12支球队按照小组赛成绩进行种子排名,排名前四的球队晋级四分之一决赛(且不在四分之一决赛中遭遇),其余8支球队按规则进行附加赛(每队比赛一次,胜者晋级),争夺另外4个四分之一决赛席位,随后依次是四分之一决赛、半决赛、铜牌赛、金牌赛(1)本届冬奥会男子冰球项目从正赛开始到产生金牌,组委会共要安排多少场比赛? (2)某机构根据赛前技术统计,率先晋级四分之一决赛的四支球队(甲乙丙丁队)实力相当,假设他们在接下来四分之一决赛、半决赛、铜牌赛、金牌赛中取胜率都依次为34、12、12、12,且每支球队晋级后每场比赛相互独立,试求甲、乙、丙、丁队都没获得冠军的概率.11.(2022届山东省枣庄市高三下学期一模)已知有一道有四个选项的单项选择题和一道有四个选项的多项选择题,小明知道每道多项选择题均有两个或三个正确选项.但根据得分规则:全部选对的得5分,部分选对的得2分,有选错的得0分.这样,小明在做多项选择题时,可能选择一个选项,也可能选择两个或三个选项,但不会选择四个选项.(1)如果小明不知道单项选择题的正确答案,就作随机猜测.已知小明知道单项选择题的正确答案和随机猜测的概率都是12,在他做完单项选择题后,从卷面上看,在题答对的情况下,求他知道单项选择题正确答案的概率.(2)假设小明在做该道多项选择题时,基于已有的解题经验,他选择一个选项的概率为12,选择两个选项的概率为13,选择三个选项的概率为16.已知该道多项选择题只有两个正确选项,小明完全不知道四个选项的正误,只好根据自己的经验随机选择.记X 表示小明做完该道多项选择题后所得的分数.求: (i )()0P X =;(ii )X 的分布列及数学期望.12.(2022届湖北省高三下学期4月二模)某企业使用新技术对某款芯片进行试生产,在试产初期,该款芯片的生产有四道工序,前三道工序的生产互不影响,第四道是检测评估工序,包括智能自动检测与人工抽检.已知该款芯片在生产中,前三道工序的次品率分别为123111,,1098P P P ===. (1)求该款芯片生产在进人第四道工序前的次品率;(2)如果第四道工序中智能自动检测为次品的芯片会被自动淘汰,合格的芯片进入流水线并由工人进行人工抽查检验.在芯片智能自动检测显示合格率为90%的条件下,求工人在流水线进行人工抽检时,抽检一个芯片恰为合格品的概率.13.(2022届广西四市高三4月教学质量检测)近期新冠病毒奥密克戎毒株全球蔓延,传染性更强、潜伏期更短、防控难度更大.为落实动态清零政策下的常态化防疫,某高中学校开展了每周的核酸抽检工作:周一至周五,每天中午13:00开始,当天安排450位师生核酸检测,五天时间全员覆盖.(1)该校教职工有410人,高二学生有620人,高三学生有610人, ①用分层抽样的方法,求高一学生每天抽检人数;②高一年级共15个班,该年级每天抽检的学生有两种安排方案,方案一:集中来自部分班级;方案二:分散来自所有班级.你认为哪种方案更合理,并给出理由. (2)学校开展核酸抽检的第一周,周一至周五核酸抽检用时记录如下: 第x 天12 3 4 5 用时y (小时) 1.21.21.11.01.0x y ②根据①中的计算结果,判定变量x 和y 是正相关,还是负相关,并给出可能的原因.10 3.16,相关系数()()()()12211niii nniii i x x y y r x x y y ===--=--∑∑∑14.(2022届北京市通州区高三一模)某单位有A ,B 两个餐厅为员工提供午餐与晚餐服务,甲、乙两位员工每个工作日午餐和晚餐都在单位就餐,近100个工作日选择餐厅就餐情况统计如下:,A A(),A B(),B A(),B B 选择餐厅情况(午餐,晚餐)()甲员工30天20天40天10天乙员工20天25天15天40天(1)分别估计一天中甲员工午餐和晚餐都选择A餐厅就餐的概率,乙员工午餐和晚餐都选择B餐厅就餐的概率;E X;(2)记X为甲、乙两员工在一天中就餐餐厅的个数,求X的分布列和数学期望()(3)试判断甲、乙员工在晚餐选择B餐厅就餐的条件下,哪位员工更有可能午餐选择A餐厅就餐,并说明理由.。
数学高考概率大题知识点

数学高考概率大题知识点高中数学概率大题是高考中的一个重要考点,考察学生对概率知识的理解和应用能力。
本文将从概率的基本概念、条件概率、独立事件和排列组合等方面,介绍一些常见的概率大题知识点。
概率是研究随机事件发生可能性的数学分支。
在概率论中,试验是指对某个随机现象的观察或操作,事件是试验的某个结果。
概率是描述试验结果的可能性的比例。
在高考中,我们经常会遇到各种概率大题,如计算事件发生的概率、根据条件概率求解问题等。
一、概率的基本概念1. 样本空间和事件:样本空间是指试验可能结果的集合,用Ω表示。
而事件是样本空间Ω的子集,表示我们感兴趣的一些结果。
2. 事件的概率:事件A(记作P(A))的概率是指事件A发生的可能性。
在概率的计算中,我们常常使用频率和古典概率公式来计算概率。
3. 频率概率:频率概率是通过多次重复试验,统计实验结果出现的频率得出的概率。
频率概率计算方法是通过进行大量实验,统计某个事件发生的次数与总实验次数的比值。
4. 古典概率:古典概率基于事件发生的可能性相等的假设。
在一个有限的样本空间Ω中,古典概率P(A)等于事件A中有利的结果数除以样本空间Ω中总的结果数。
二、条件概率条件概率是指在某个条件下,事件发生的概率。
在计算条件概率时,我们需要考虑给定事件已经发生的前提下,另一个事件发生的概率。
条件概率的计算方法是通过使用条件概率公式来计算。
三、独立事件在概率论中,如果两个事件A和B的概率满足P(A|B) = P(A)和P(B|A) = P(B),则我们称事件A和B是独立事件。
独立事件是指当一个事件的发生与其他事件无关时的情况。
在许多概率大题中,我们需要判断事件之间是否是独立事件,以便进行正确的计算。
四、排列组合排列和组合是高中数学中的一个重要内容,也是概率大题中常见的题型。
排列是指从n个元素中取出m个元素进行有序排列的方式的总数。
组合是指从n个元素中取出m个元素进行无序排列的方式的总数。
在概率大题中,我们需要运用排列组合的知识,计算符合要求的事件发生的概率。
高中数学统计知识点高中数学概率与统计

高中数学统计知识点高中数学概率与统计
高中数学统计知识点包括以下内容:
1. 数据的收集和整理:包括原始数据的收集和整理,如问卷调查、实验结果等。
2. 描述统计:用于对数据进行总结和描述的方法,包括平均数、中位数、众数、极差、标准差等。
3. 概率:研究随机事件发生的可能性的数学分支,包括基本概念、概率的计算方法和
性质。
4. 概率分布:描述随机变量取值与相应概率的分布,包括离散型随机变量和连续型随
机变量的分布。
5. 统计推断:从样本数据中推断总体的特征的方法,包括点估计和区间估计。
6. 假设检验:用于推断总体参数的假设检验方法,包括单样本检验、双样本检验和相
关性检验等。
7. 相关分析:研究两个或多个变量之间关系的方法,包括相关系数和回归分析等。
8. 抽样调查:从总体中随机选择样本进行调查和统计分析的方法,包括简单随机抽样、系统抽样和分层抽样等。
以上是高中数学概率与统计的主要知识点,通过掌握这些知识,可以进行数据的整理
和分析,并进行相关的统计推断和假设检验。
高考概率知识点及例题

概率知识要点.随机事件的概率随机事件的概率1、必然事件:一般地,把在条件S 下,一定会发生的事件叫做相对于条件S 的必然事件。
2、不可能事件:把在条件S 下,一定不会发生的事件叫做相对于条件S 的不可能事件。
3、确定事件:必然事件和不可能事件统称相对于条件S 的确定事件。
4、随机事件:在条件S 下可能发生也可能不发生的事件,叫相对于条件S 的随机事件。
5、频数:在相同条件S 下重复n 次试验,观察某一事件A 是否出现,称n 次试验中事件A 出现的次数n A 为事件A 出现的频数。
6、频率:事件A 出现的比例()=A n n A nf 。
7、概率:随机事件A 的概率是频率的稳定值,反之,频率是概率的近似值.概率的意义1、概率的正确解释:随机事件在一次试验中发生与否是随机的,但随机性中含有规律性。
认识了这种随机中的规律性,可以比较准确地预测随机事件发生的可能性。
2、游戏的公平性:抽签的公平性。
3、决策中的概率思想:从多个可选答案中挑选出正确答案的决策任务,那么“使得样本出现的可能性最大”可以作为决策的准则。
——极大似然法、小概率事件4、天气预报的概率解释:明天本地降水概率为70%解释是“明天本地下雨的机会是70%”。
5、试验与发现:孟德尔的豌豆试验。
6、遗传机理中的统计规律。
概率的基本性质1、事件的关系与运算(1)包含。
对于事件A与事件B,如果事件A发生,则事件B一定发生,称事件B包含事件A(或事件A包含于事件B),记作(或A B)。
⊇⊆B A不可能事件记作∅。
(2)相等。
若B A A B且,则称事件A与事件B相等,记作A=B。
⊇⊇(3)事件A与事件B的并事件(和事件):某事件发生当且仅当事件A 发生或事件B发生。
(4)事件A与事件B的交事件(积事件):某事件发生当且仅当事件A 发生且事件B发生。
(5)事件A与事件B互斥:A B为不可能事件,即=A B∅,即事件A与事件B在任何一次试验中并不会同时发生。
高考复习概率与统计知识点归纳总结

高考复习概率与统计知识点归纳总结概率与统计是高中数学中的一大重点和难点。
在高考中,这一部分的知识点占有相当大的比重,因此学生需要在复习阶段集中精力,深入理解和掌握相关的知识点。
本文将对高考概率与统计的知识点进行归纳总结,以帮助学生们更好地复习和备考。
一、概率基本概念1. 随机事件与样本空间:随机事件是对某一随机试验的结果的一种描述,样本空间是一个随机试验中可能出现的所有结果的集合。
2. 事件的概率:事件A发生的概率用P(A)表示,其计算公式为P(A) = 事件A的可能结果数 / 样本空间的结果总数。
3. 事件的互斥与对立:互斥事件指的是两个事件不可能同时发生,对立事件指的是两个事件中一个必然发生,另一个必然不发生。
4. 事件的独立性:两个事件相互独立指的是一个事件的发生不受另一个事件的影响,它们的概率计算是相互独立的。
二、排列与组合1. 排列:排列是从n个不同元素中取出m(m≤n)个元素,按一定的顺序排列成一列。
公式为An^m = n(n-1)(n-2)...(n-m+1)。
2. 组合:组合是从n个不同元素中取出m(m≤n)个元素,不考虑排列顺序。
公式为Cn^m = n! / (m!(n-m)!)。
三、事件概率的计算1. 加法定理:对于两个事件A和B,其和事件A∪B的概率为P(A∪B) = P(A) + P(B) - P(A∩B)。
2. 乘法定理:对于两个独立事件A和B,其积事件A∩B的概率为P(A∩B) = P(A) × P(B)。
3. 全概率公式:对于一组互斥事件A1、A2、...、An,其和事件A的概率为P(A) = P(A1) + P(A2) + ... +P(An)。
4. 条件概率公式:对于两个事件A和B,已知事件B发生的条件下事件A发生的概率为P(A|B) = P(A∩B) / P(B)。
四、随机变量与概率分布1. 随机变量:随机变量是随机试验结果的函数,它的取值是随机的。
高考数学概率与统计知识点

高中数学之概率与统计求等可能性事件、互斥事件和相互独立事件的概率解此类题目常应用以下知识:(1)等可能性事件(古典概型)的概率:P(A)=)()(I card A card =n m;等可能事件概率的计算步骤:计算一次试验的基本事件总数n ;设所求事件A,并计算事件A 包含的基本事件的个数m ; 依公式()mP A n =求值;答,即给问题一个明确的答复.(2)互斥事件有一个发生的概率:P(A+B)=P(A)+P (B); 特例:对立事件的概率:P(A)+P(A )=P(A +A )=1. (3)相互独立事件同时发生的概率:P(A ·B)=P (A )·P(B ); 特例:独立重复试验的概率:Pn(k)=kn k kn p p C --)1(.其中P 为事件A在一次试验中发生的概率,此式为二项式[(1-P)+P]n 展开的第k+1项.(4)解决概率问题要注意“四个步骤,一个结合”:求概率的步骤是:第一步,确定事件性质⎧⎪⎪⎨⎪⎪⎩等可能事件 互斥事件 独立事件 n 次独立重复试验即所给的问题归结为四类事件中的某一种. 第二步,判断事件的运算⎧⎨⎩和事件积事件即是至少有一个发生,还是同时发生,分别运用相加或相乘事件.第三步,运用公式()()()()()()()()(1)k k n k n n m P A nP A B P A P B P A B P A P B P k C p p -⎧=⎪⎪⎪+=+⎨⎪⋅=⋅⎪=-⎪⎩等可能事件: 互斥事件: 独立事件: n 次独立重复试验:求解第四步,答,即给提出的问题有一个明确的答复. 例1. 在五个数字12345,,,,中,。
例2. 若随机取出三个数字,则剩下两个数字都是奇数的概率是(结果用数值表示).[解答过程]0.3提示:1335C 33.54C 102P ===⨯例2.一个总体含有100个个体,以简单随机抽样方式从该总体中抽取一个容量为5的样本,则指定的某个个体被抽到的概率为 .[解答过程]1.20提示:51.10020P == 例3.接种某疫苗后,出现发热反应的概率为0.80.现有5人接种该疫苗,至少有3人出现发热反应的概率为__________.(精确到0.01)[考查目的] 本题主要考查运用组合、概率的基本知识和分类计数原理解决问题的能力,以及推理和运算能力.[解答提示]至少有3人出现发热反应的概率为33244555550.800.200.800.200.800.94C C C ⋅⋅+⋅⋅+⋅=.故填0.94.离散型随机变量的分布列 1.随机变量及相关概念①随机试验的结果可以用一个变量来表示,这样的变量叫做随机变量,常用希腊字母ξ、η等表示.②随机变量可能取的值,可以按一定次序一一列出,这样的随机变量叫做离散型随机变量. ③随机变量可以取某区间内的一切值,这样的随机变量叫做连续型随机变量. 2.离散型随机变量的分布列①离散型随机变量的分布列的概念和性质一般地,设离散型随机变量ξ可能取的值为1x ,2x ,……,ix ,……,ξ取每一个值ix (=i 1,2,……)的概率P(i x =ξ)=i P ,则称下表.为随机变量ξ的概率分布,简称ξ的分布列.由概率的性质可知,任一离散型随机变量的分布列都具有下述两个性质: (1)0≥i P ,=i 1,2,…;(2)++21P P …=1. ②常见的离散型随机变量的分布列: (1)二项分布n 次独立重复试验中,事件A 发生的次数ξ是一个随机变量,其所有可能的取值为0,1,2,…n,并且kn k kn k q p C k P P -===)(ξ,其中n k ≤≤0,p q -=1,随机变量ξ的分布列如下:称这样随机变量ξ服从二项分布,记作),(~p n B ξ,其中n 、p 为参数,并记:),;(p n k b q p C k n k k n =- .(2) 几何分布在独立重复试验中,某事件第一次发生时所作的试验的次数ξ是一个取值为正整数的离散型随机变量,“k ξ=”表示在第k 次独立重复试验时事件第一次发生. 随机变量ξ的概率分布为:例1.厂家在产品出厂前,需对产品做检验,厂家将一批产品发给商家时,商家按合同规定也需随机抽取一定数量的产品做检验,以决定是否接收这批产品.(Ⅰ)若厂家库房中的每件产品合格的概率为0.8,从中任意取出4件进行检验,求至少有1件是合格的概率;(Ⅱ)若厂家发给商家20件产品中,其中有3件不合格,按合同规定该商家从中任取2件.都进行检验,只有2件都合格时才接收这批产品.否则拒收,求出该商家检验出不合格产品数ξ的分布列及期望ξE ,并求出该商家拒收这批产品的概率.[解答过程](Ⅰ)记“厂家任取4件产品检验,其中至少有1件是合格品”为事件A 用对立事件A 来算,有()()4110.20.9984P A P A =-=-=(Ⅱ)ξ可能的取值为0,1,2.()2172201360190C P C ξ===, ()11317220511190C C P C ξ===,()2322032190C P C ξ===136513301219019019010E ξ=⨯+⨯+⨯=.记“商家任取2件产品检验,都合格”为事件B,则商家拒收这批产品的概率()136271119095P P B =-=-=.所以商家拒收这批产品的概率为2795.例12.某项选拔共有三轮考核,每轮设有一个问题,能正确回答问题者进入下一轮考核,否则即被淘汰. 已知某选手能正确回答第一、二、三轮的问题的概率分别为54、53、52,且各轮问题能否正确回答互不影响.(Ⅰ)求该选手被淘汰的概率;(Ⅱ)该选手在选拔中回答问题的个数记为ξ,求随机变量ξ的分布列与数学期望. (注:本小题结果可用分数表示)[解答过程]解法一:(Ⅰ)记“该选手能正确回答第i 轮的问题”的事件为(123)i A i =,,,则14()5P A =,23()5P A =,32()5P A =,∴该选手被淘汰的概率112223112123()()()()()()()P P A A A A A A P A P A P A P A P A P A =++=++142433101555555125=+⨯+⨯⨯=.(Ⅱ)ξ的可能值为123,,,11(1)()5P P A ξ===,1212428(2)()()()5525P P A A P A P A ξ====⨯=, 12124312(3)()()()5525P P A A P A P A ξ====⨯=.ξ∴的分布列为11235252525E ξ∴=⨯+⨯+⨯=.解法二:(Ⅰ)记“该选手能正确回答第i 轮的问题”的事件为(123)i A i =,,,则14()5P A =,23()5P A =,32()5P A =.∴该选手被淘汰的概率1231231()1()()()P P A A A P A P A P A =-=-4321011555125=-⨯⨯=. (Ⅱ)同解法一.(3)离散型随机变量的期望与方差随机变量的数学期望和方差(1)离散型随机变量的数学期望:++=2211p x p x E ξ…;期望反映随机变量取值的平均水平.⑵离散型随机变量的方差:+-+-=222121)()(p E x p E x D ξξξ…+-+n n p E x 2)(ξ…;方差反映随机变量取值的稳定与波动,集中与离散的程度.⑶基本性质:b aE b a E +=+ξξ)(;ξξD a b a D 2)(=+. (4)若ξ~B(n,p),则 np E =ξ ; Dξ =npq(这里q =1-p) ;如果随机变量ξ服从几何分布,),()(p k g k P ==ξ,则p E 1=ξ,D ξ =2p q 其中q=1-p.例1.甲、乙两名工人加工同一种零件,两人每天加工的零件数相等,所得次品数分别为ε、η,ε和η的分布列如下:思路:一是要比较两名工人在加工零件数相等的条件下出次品数的平均值,即期望;二是要看出次品数的波动情况,即方差值的大小.解答过程:工人甲生产出次品数ε的期望和方差分别为:7.0103210111060=⨯+⨯+⨯=εE ,891.0103)7.02(101)7.01(106)7.00(222=⨯-+⨯-+⨯-=εD ;工人乙生产出次品数η的期望和方差分别为:7.0102210311050=⨯+⨯+⨯=ηE ,664.0102)7.02(103)7.01(105)7.00(222=⨯-+⨯-+⨯-=ηD由E ε=E η知,两人出次品的平均数相同,技术水平相当,但D ε>D η,可见乙的技术比较稳定.小结:期望反映随机变量取值的平均水平;方差反映随机变量取值的稳定与波动,集中与离散的程度. 例2.某商场经销某商品,根据以往资料统计,顾客采用的付款期数ξ的分布列为商场经销一件该商品,采用1期付款,其利润为200元;分2期或3期付款,其利润为250元;分4期或5期付款,其利润为300元.η表示经销一件该商品的利润.(Ⅰ)求事件A :“购买该商品的3位顾客中,至少有1位采用1期付款”的概率()P A ;(Ⅱ)求η的分布列及期望E η.[解答过程](Ⅰ)由A 表示事件“购买该商品的3位顾客中至少有1位采用1期付款”. 知A 表示事件“购买该商品的3位顾客中无人采用1期付款”2()(10.4)0.216P A =-=, ()1()10.2160.784P A P A =-=-=.(Ⅱ)η的可能取值为200元,250元,300元.(200)(1)0.4P P ηξ====,(250)(2)(3)0.20.20.4P P P ηξξ===+==+=,(300)1(200)(250)10.40.40.2P P P ηηη==-=-==--=.η的分布列为2000.42500.43000.2E η=⨯+⨯+⨯240=(元).抽样方法与总体分布的估计 抽样方法1.简单随机抽样:设一个总体的个数为N,如果通过逐个抽取的方法从中抽取一个样本,且每次抽取时各个个体被抽到的概率相等,就称这样的抽样为简单随机抽样.常用抽签法和随机数表法. 2.系统抽样:当总体中的个数较多时,可将总体分成均衡的几个部分,然后按照预先定出的规则,从每一部分抽取1个个体,得到所需要的样本,这种抽样叫做系统抽样(也称为机械抽样). 3.分层抽样:当已知总体由差异明显的几部分组成时,常将总体分成几部分,然后按照各部分所占的比进行抽样,这种抽样叫做分层抽样. 总体分布的估计由于总体分布通常不易知道,我们往往用样本的频率分布去估计总体的分布,一般地,样本容量越大,这种估计就越精确.总体分布:总体取值的概率分布规律通常称为总体分布.当总体中的个体取不同数值很少时,其频率分布表由所取样本的不同数值及相应的频率表示,几何表示就是相应的条形图.当总体中的个体取值在某个区间上时用频率分布直方图来表示相应样本的频率分布.总体密度曲线:当样本容量无限增大,分组的组距无限缩小,那么频率分布直方图就会无限接近于一条光滑曲线,即总体密度曲线. 典型例题例1.某工厂生产A 、B 、C 三种不同型号的产品,产品数量之比依次为2:3:5.现用分层抽样方法抽出一个容量为n 的样本,样本中A种型号产品有16件.那么此样本的容量n= .解答过程:A 种型号的总体是210,则样本容量n=1016802⨯=.例2.一个总体中有100个个体,随机编号0,1,2,…,99,依编号顺序平均分成10个小组,组号依次为1,2,3,…,10.现用系统抽样方法抽取一个容量为10的样本,规定如果在第1组随机抽取的号码为m ,那么在第k 组中抽取的号码个位数字与m k +的个位数字相同,若6m =,则在第7组中抽取的号码是 .解答过程:第K组的号码为(1)10k - ,(1)101k -+,…,(1)109k -+,当m =6时,第k 组抽取的号的个位数字为m+k的个位数字,所以第7组中抽取的号码的个位数字为3 ,所以抽取号码为63.正态分布与线性回归1.正态分布的概念及主要性质(1)正态分布的概念如果连续型随机变量ξ 的概率密度函数为222)(21)(σμπσ--=x ex f ,x R ∈ 其中σ、μ为常数,并且σ>0,则称ξ服从正态分布,记为~N ξ(μ,2σ).(2)期望Eξ =μ,方差2σξ=D .(3)正态分布的性质 正态曲线具有下列性质:①曲线在x 轴上方,并且关于直线x =μ对称.②曲线在x=μ时处于最高点,由这一点向左右两边延伸时,曲线逐渐降低.③曲线的对称轴位置由μ确定;曲线的形状由σ确定,σ越大,曲线越“矮胖”;反之越“高瘦”. 三σ原则即为数值分布在(μ—σ,μ+σ)中的概率为0.6526数值分布在(μ—2σ,μ+2σ)中的概率为0.9544ﻫ数值分布在(μ—3σ,μ+3σ)中的概率为0.9974(4)标准正态分布当μ=0,σ=1时ξ服从标准的正态分布,记作~N ξ(0,1) (5)两个重要的公式①()1()x x φφ-=-,② ()()()P a b b a ξφφ<<=-.(6)2(,)N μσ与(0,1)N 二者联系.若2~(,)N ξμσ,则~(0,1)N ξμησ-=;②若2~(,)N ξμσ,则()()()b a P a b μμξφφσσ--<<=-.2.线性回归简单的说,线性回归就是处理变量与变量之间的线性关系的一种数学方法.变量和变量之间的关系大致可分为两种类型:确定性的函数关系和不确定的函数关系.不确定性的两个变量之间往往仍有规律可循.回归分析就是处理变量之间的相关关系的一种数量统计方法.它可以提供变量之间相关关系的经验公式.具体说来,对n 个样本数据(11,x y ),(22,x y ),…,(,n n x y ),其回归直线方程,或经验公式为:a bx y+=ˆ.其中,,)(1221x b y a x n xyx n yx b ni ini ii⋅-=--=∑∑==,其中y x ,分别为|i x |、|i y |的平均数.例1.如果随机变量ξ~N (μ,σ2),且E ξ=3,D ξ=1,则P(-1<ξ≤1=等于( ) A .2Φ(1)-1 ﻩB.Φ(4)-Φ(2) C.Φ(2)-Φ(4) ﻩD.Φ(-4)-Φ(-2)解答过程:对正态分布,μ=E ξ=3,σ2=D ξ=1,故P (-1<ξ≤1)=Φ(1-3)-Φ(-1-3)=Φ(-2)-Φ(-4)=Φ(4)-Φ(2). 答案:B例2. 将温度调节器放置在贮存着某种液体的容器内,调节器设定在d ℃,液体的温度ξ(单位:℃)是一个随机变量,且ξ~N (d ,0.52). (1)若d=90°,则ξ<89的概率为 ;(2)若要保持液体的温度至少为80 ℃的概率不低于0.99,则d 至少是 ?(其中若η~N(0,1),则Φ(2)=P (η<2)=0.9772,Φ(-2.327)=P(η<-2.327)=0.01).解答过程:(1)P(ξ<89)=F(89)=Φ(5.09089-)=Φ(-2)=1-Φ(2)=1-0.9772=0.0228.(2)由已知d 满足0.99≤P(ξ≥80),即1-P(ξ<80)≥1-0.01,∴P(ξ<80)≤0.01.∴Φ(5.080d-)≤0.01=Φ(-2.327).∴5.080d -≤-2.327.∴d ≤81.1635. 故d 至少为81.1635.小结:(1)若ξ~N(0,1),则η=σμξ-~N(0,1).(2)标准正态分布的密度函数f (x )是偶函数,x<0时,f(x )为增函数,x>0时,f (x )为减函数.。
高考概率题知识点总结

高考概率题知识点总结高考数学中,概率题是一个常见而且重要的考点。
掌握概率的基本概念和计算方法,对于解题和应对高考数学考试至关重要。
本文将对高考概率题的一些重要知识点进行总结,帮助考生更好地备考。
一、概率的基本概念概率是数学中的一个重要分支,它研究事件发生可能性的大小。
在高考中,我们常见的概率题目多以抛硬币、掷骰子等为基础,通过求解概率来得出某种情况的可能性。
在概率计算中,事件的发生可以用分数形式表示,范围在0到1之间,其中1代表必然事件,0代表不可能事件。
二、概率的计算方法在概率的计算过程中,有两种常见的方法:古典概率和统计概率。
1.古典概率古典概率是指通过计算所有可能结果的大小,来推断某一结果发生的可能性大小。
典型的例子就是抛掷硬币和掷骰子。
例如,掷一枚硬币,正反两面各出现的概率都是1/2。
2.统计概率统计概率是指通过实验和试验数据,来推测某一事件发生的可能性。
这种方法一般需要大量的数据支撑,通过频率来求解概率。
例如,通过大量的实验数据统计,我们可以推测扔一颗骰子出现点数1的概率是1/6。
三、概率的性质概率具有一些重要的性质,掌握这些性质可以帮助我们更好地解题。
1.加法性对于两个互斥事件A和B,它们的概率可以通过求和来计算。
即P(A∪B) = P(A) + P(B)。
2.减法性对于事件A,我们可以通过事件B的概率计算出A与B同时发生的概率。
即P(A∩B) = P(A) - P(A∪B)。
3.乘法性对于两个独立事件A和B,它们同时发生的概率等于各自的概率的乘积。
即P(A∩B) = P(A) * P(B)。
四、排列组合与概率问题在高考概率题中,经常涉及到排列组合的知识。
1.排列排列是指从一组对象中选取若干个进行排列。
对于n个不相同的对象,从中选取m个进行排列,共有A(n, m) = n!/(n-m)!种排列方式。
2.组合组合是指从一组对象中选取若干个进行组合。
对于n个不相同的对象,从中选取m个进行组合,共有C(n, m) = n!/(m!(n-m)!)种组合方式。
高考数学概率统计知识点(大全)

高考数学概率统计知识点(大全)高考数学概率统计知识点一、随机事件(1)事件的三种运算:并(和)、交(积)、差;注意差A—B可以表示成A与B 的逆的积。
(2)四种运算律:交换律、结合律、分配律、德莫根律。
(3)事件的五种关系:包含、相等、互斥(互不相容)、对立、相互独立。
二、概率定义(1)统计定义:频率稳定在一个数附近,这个数称为事件的概率;(2)古典定义:要求样本空间只有有限个基本事件,每个基本事件出现的可能性相等,则事件A所含基本事件个数与样本空间所含基本事件个数的比称为事件的古典概率;(3)几何概率:样本空间中的元素有无穷多个,每个元素出现的可能性相等,则可以将样本空间看成一个几何图形,事件A看成这个图形的子集,它的概率通过子集图形的大小与样本空间图形的大小的比来计算;(4)公理化定义:满足三条公理的任何从样本空间的子集集合到[0,1]的映射。
三、概率性质与公式(1)加法公式:P(A+B)=p(A)+P(B)—P(AB),特别地,如果A与B互不相容,则P(A+B)=P(A)+P(B);(2)差:P(A—B)=P(A)—P(AB),特别地,如果B包含于A,则P(A—B)=P(A)—P(B);(3)乘法公式:P(AB)=P(A)P(B|A)或P(AB)=P(A|B)P(B),特别地,如果A与B相互独立,则P(AB)=P(A)P(B);(4)全概率公式:P(B)=∑P(Ai)P(B|Ai)。
它是由因求果,贝叶斯公式:P(Aj|B)=P(Aj)P(B|Aj)/∑P(Ai)P(B|Ai)。
它是由果索因;如果一个事件B可以在多种情形(原因)A1,A2,...,An下发生,则用全概率公式求B发生的概率;如果事件B已经发生,要求它是由Aj引起的概率,则用贝叶斯公式。
(5)二项概率公式:Pn(k)=C(n,k)p^k(1—p)^(n—k),k=0,1,2,...,n。
当一个问题可以看成n重贝努力试验(三个条件:n次重复,每次只有A与A的逆可能发生,各次试验结果相互独立)时,要考虑二项概率公式。
高考数学概率与统计部分知识点梳理

高考复习专题之:概率与统计一、概率:随机事件A 的概率是频率的稳定值,反之,频率是概率的近似值.P (A )=O ;注:求随机概率的三种方法: (-)枚举法例1如图1所示,有一电路A3是由图示的开关控制,闭合a ,b, c,d, e 五个开关中的任意两个开关,使电路形成通路.则使电路形成通路的概率是 ________ .分析:要计算使电路形成通路的概率,列举出闭合五个开关中的任意两个可能出现的结果总数,从中找出能使电路形成通路的结果数,根据概率的意义计算即可。
解:闭合五个开关中的两个,可能出现的结果数有10种,分别是ab. ac 、ad 、ae 、be. bd. be. cd 、ce 、de, 英中能形成通路的有6种,所以p (通路)=—=-10 5评注:枚举法是求概率的一种重要方法,这种方法一般应用于可能出现 的结果比较少的事件的概率计算. (-)树形图法例2小刚和小明两位同学玩一种游戏•游戏规则为:两人各执“象、虎、鼠”三张牌,同时0出一张牌龙胜负, 英中象胜虎.虎胜鼠、鼠胜象,若两人所出牌相同,则为平局.例如,小刚岀象牌,小明出虎牌,则小刚胜:又 如,两人同时出象牌,则两人平局.如果用A 、B 、C 分别表示小刚的象、虎、鼠三张牌,用B,、G 分别表示小明 的象、虎、鼠三张牌,那么一次出牌小刚胜小明的概率是多少?分析:为了淸楚地看出小亮胜小刚的概率,可用树状图列出所有可能出现的结 果,并从中找出小刚胜小明可能出现的结果数。
解:画树状图如图树状图。
由树状图(树形图)或列表可知,可能出现的结果 有9种,而且每种结果岀现的可能性相同,苴中小刚胜小明的结果有3种.所 以P (—次出牌小刚胜小明)二13点评:当一事件要涉及两个或更多的因素时,为了不重不漏地列出所有可能的结 果,通过画树形图的方法来计算概率 (三)列表法例3将图中的三张扑克牌背面朝上放在桌而上,从中随机摸岀两张,并用这两张扑克牌上的数字组成一个两位 数.请你用画树形(状)图或列表的方法求:(1)组成的两位数是偶数的概率;(2)组成的两位数是6的倍数 的槪率. 分析:本题可通过列表的方法,列出所有可能组成的两位数的可能情况,然后再找岀组成的两位数是偶数的可能 情况和组成两位数小刚 小明小刚 小明开始图1ABC虫 1 5i Ci是6的倍数的可能情况。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
18题-高考数学概率与统计知识点高考数学第18题(概率与统计)1、求等可能性事件、互斥事件和相互独立事件的概率解此类题目常应用以下知识:(1)等可能性事件(古典概型)的概率:P(A)=)()(I card A card =nm ;等可能事件概率的计算步骤: 计算一次试验的基本事件总数n ;设所求事件A ,并计算事件A 包含的基本事件的个数m ;依公式()mP A n=求值;答,即给问题一个明确的答复.(2)互斥事件有一个发生的概率:P(A +B)=P(A)+P(B);特例:对立事件的概率:P(A)+P(A )=P(A +A )=1.(3)相互独立事件同时发生的概率:P(A ·B)=P(A)·P(B);特例:独立重复试验的概率:Pn(k)=kn k kn p p C --)1(.其中P 为事件A 在一次试验中发生的概率,此式为二项式[(1-P)+P]n 展开的第k+1项. (4)解决概率问题要注意“四个步骤,一个结的概率P (ix =ξ)=iP ,则称下表.为随机变量ξ的概率分布,简称ξ的分布列. 由概率的性质可知,任一离散型随机变量的分布列都具有下述两个性质:(1)0≥iP ,=i 1,2,…;(2)++21P P (1)②常见的离散型随机变量的分布列: (1)二项分布n次独立重复试验中,事件A 发生的次数ξ是一个随机变量,其所有可能的取值为0,1,2,…n ,并且kn k knkq p Ck P P -===)(ξ,其中n k ≤≤0,p q -=1,随机变量ξ的分布列如下:称这样随机变量ξ服从二项分布,记作),(~p n B ξ,其中n 、p 为参数,并记:),;(p n k b q p C k n k k n=- .(2) 几何分布在独立重复试验中,某事件第一次发生时所作的试验的次数ξ是一个取值为正整数的离散型随机变量,“k ξ=”表示在第k 次独立重复试验时事件第一次发生.随机变量ξ的概率分布为:3.离散型随机变量的期望与方差随机变量的数学期望和方差(1)离散型随机变量的数学期望:++=2211p x p x E ξ…;期望反映随机变量取值的平均水平. ⑵离散型随机变量的方差:+-+-=222121)()(p E x p E x D ξξξ…+-+n n p E x 2)(ξ…;方差反映随机变量取值的稳定与波动,集中与离散的程度. ⑶基本性质:baE b a E +=+ξξ)(;ξξD a b a D 2)(=+.(4)若ξ~B(n ,p),则 np E =ξ ; D ξ =npq (这里q=1-p ) ;如果随机变量ξ服从几何分布,),()(p k g k P ==ξ,则pE 1=ξ,D ξ =2p q 其中q=1-p.4.抽样方法与总体分布的估计 抽样方法1.简单随机抽样:设一个总体的个数为N ,如果通过逐个抽取的方法从中抽取一个样本,且每次抽取时各个个体被抽到的概率相等,就称这样的抽样为简单随机抽样.常用抽签法和随机数表法.2.系统抽样:当总体中的个数较多时,可将总体分成均衡的几个部分,然后按照预先定出的规则,从每一部分抽取1个个体,得到所需要的样本,这种抽样叫做系统抽样(也称为机械抽样). 3.分层抽样:当已知总体由差异明显的几部分组成时,常将总体分成几部分,然后按照各部分所占的比进行抽样,这种抽样叫做分层抽样.总体分布的估计由于总体分布通常不易知道,我们往往用样本的频率分布去估计总体的分布,一般地,样本容量越大,这种估计就越精确.总体分布:总体取值的概率分布规律通常称为总体分布.当总体中的个体取不同数值很少时,其频率分布表由所取样本的不同数值及相应的频率表示,几何表示就是相应的条形图.当总体中的个体取值在某个区间上时用频率分布直方图来表示相应样本的频率分布.总体密度曲线:当样本容量无限增大,分组的组距无限缩小,那么频率分布直方图就会无限接近于一条光滑曲线,即总体密度曲线.5.正态分布与线性回归1.正态分布的概念及主要性质(1)正态分布的概念如果连续型随机变量ξ 的概率密度函数为222)(21)(σμπσ--=x ex f ,x R ∈ 其中σ、μ为常数,并且σ>0,则称ξ服从正态分布,记为~N ξ(μ,2σ). (2)期望E ξ =μ,方差2σξ=D . (3)正态分布的性质 正态曲线具有下列性质:①曲线在x 轴上方,并且关于直线x =μ对称. ②曲线在x=μ时处于最高点,由这一点向左右两边延伸时,曲线逐渐降低.③曲线的对称轴位置由μ确定;曲线的形状由σ确定,σ越大,曲线越“矮胖”;反之越“高瘦”. 三σ原则即为数值分布在(μ—σ,μ+σ)中的概率为0.6526 数值分布在(μ—2σ,μ+2σ)中的概率为0.9544数值分布在(μ—3σ,μ+3σ)中的概率为0.9974(4)标准正态分布当μ=0,σ=1时ξ服从标准的正态分布,记作~N ξ(0,1)(5)两个重要的公式 ①()1()x x φφ-=-,② ()()()P a b b a ξφφ<<=-. (6)2(,)N μσ与(0,1)N 二者联系.若2~(,)N ξμσ,则~(0,1)N ξμησ-=;②若2~(,)N ξμσ,则()()()b a P a b μμξφφσσ--<<=-.6.线性回归1.简单的说,线性回归就是处理变量与变量之间的线性关系的一种数学方法.变量和变量之间的关系大致可分为两种类型:确定性的函数关系和不确定的函数关系.不确定性的两个变量之间往往仍有规律可循.回归分析就是处理变量之间的相关关系的一种数量统计方法.它可以提供变量之间相关关系的经验公式. 具体说来,对n 个样本数据(11,x y ),(22,x y ),…,(,n nx y ),其回归直线方程: a x b yˆˆˆ+=,其中()()()∑∑∑∑====--=---=ni ini ii ni ini i ix n xyx n yx x xy y x xb1221121ˆx b y a ˆˆ-=,()y x ,称为样本中心点,因而回归直线过样本中心点.2.相关系数r :假设两个随机变量的取值分别是(x 1,y 1),(x 2,y 2),∑nii i=1(x-x)(y -y)r =⎪⎭⎫ ⎝⎛-⎪⎭⎫ ⎝⎛--=∑∑∑===2_n1i 2i 2n1i 2i n1i __ii)y n(y )x n(x yx n yx当0>r 时,表明两变量正相关;当0<r ,表明两变量负相关. r 越接近1,表明两变量的线性相关性越强; r 越接近0,表明两变量的线性相关关系几乎不存在,通常当75.0>r 时,认为两个变量有很强的线性相关关系.7.独立性检验的概念一般地,假设有两个分类变量X 和Y ,它们的值域分别为{}21,x x 和{}21,y y ,我们利用随机变量()()()()()d b c a d c b a bc ad n K ++++-=22来确定在多大程度上可以认为“两个分类变量有关系”,这种方法称为两个分类变量的独立性检验. (二)独立性检验的基本思想独立性检验的基本思想类似于反证法.要确认“两个分类变量有关系”这一结论成立的可信程度,首先假设该结论不成立,即假设结论“两个分类变量没有关系”成立.在该假设下我们构造的随机变量2K 应该很小,如果由观测数据计算得到的2K 的观测值k 很大,则在一定程度上说明假设不合理.假设1H :“X 与Y 有关系”,可按如下步骤判断结论1H 成立的可能性:1.通过等高条形图,可以粗略地判断两个分类变量是否有关系,但是这种判断无法精确地给出所得结论的可靠程度.2.利用独立性检验来考查两个分类变量是否有关系,并且能较精确地给出这种判断的可靠程度,具体做法是:(1)根据实际问题的需要确定容许推断“两个分类变量有关系”犯错误概率的上界a ,然后通过下表确定临界值0k .(2)由公式()()()()()d b c a d c b a bc ad n K ++++-=22,计算2K 的观测值k .(3)如果0k k ≥,就推断“X 与Y 有关系”.这种推断犯错误的概率不超过a ;否则,就认为在犯错误的概率不超过a 的前提下不能推断“X 与Y 有关系”,或者在样本数据中没有足够证据支持结论“X 与Y 有关系”. 理解总结根据独立性检验的基本思想,可知对于2K 的观测值k ,存在一个正数0k 为判断规则的临界值,当0k k ≥,就认为“两个分类变量之间有关系”;否则就认为“两个分类变量没有关系”.在实际应用中,我们把0k k ≥解释为有 ()()%100102⨯≥-k K P 的把握认为“两个分类变量之间有关系”;把0k k <解释为不能以()()%100102⨯≥-k K P 的把握认为“两个分类变量之间有关系”,或者样本观测数据没有提供“两个分类变量之间有关系”的充分证据.。