高中数学概率与统计知识点
高中数学统计与概率知识点
高中数学统计与概率知识点一、统计学基础1. 数据收集- 普查与抽样调查- 数据的类型(定量数据与定性数据)2. 数据整理与展示- 频数分布表- 直方图- 饼图- 条形图3. 中心趋势的度量- 平均数(算术平均数)- 中位数- 众数4. 离散程度的度量- 极差- 四分位距- 方差与标准差5. 相关性分析- 相关系数- 散点图二、概率论基础1. 随机事件- 事件的定义- 必然事件与不可能事件- 互斥事件与独立事件2. 概率的计算- 单次试验的概率- 多次试验的概率- 条件概率- 贝叶斯定理3. 随机变量- 离散随机变量与连续随机变量 - 概率分布- 概率密度函数与概率分布函数4. 期望值与方差- 随机变量的期望值- 随机变量的方差5. 常见概率分布- 二项分布- 泊松分布- 正态分布三、统计与概率的应用1. 假设检验- 零假设与备择假设- 显著性水平- 第一类错误与第二类错误 - t检验与卡方检验2. 回归分析- 线性回归- 相关系数与决定系数3. 抽样与估计- 抽样误差- 置信区间- 最大似然估计四、综合练习题1. 选择题- 统计图表解读- 概率计算- 假设检验2. 填空题- 计算平均数、中位数、众数 - 计算方差、标准差- 概率分布的应用3. 解答题- 解释统计概念- 概率问题的求解- 应用统计方法解决实际问题五、附录1. 公式汇总- 统计学公式- 概率论公式2. 重要概念索引- 术语解释- 概念间的关系3. 参考资料- 推荐阅读书籍- 在线资源链接请根据需要对上述内容进行编辑和调整。
这篇文章是为了提供一个关于高中数学统计与概率的知识点概览,适用于教育目的。
每个部分都包含了关键的子标题和简短的描述,以便于理解和使用。
(最全)高中数学概率统计知识点总结
高中数学-概率与统计一、普通的众数、平均数、中位数及方差 1、 众数:一组数据中,出现次数最多的数。
2、平均数:①、常规平均数:12nx x x x n++⋅⋅⋅+=②、加权平均数:112212n n n x x x x ωωωωωω++⋅⋅⋅+=++⋅⋅⋅+3、中位数:从大到小或者从小到大排列,最中间或最中间两个数的平均数。
4、方差:2222121[()()()]n s x x x x x x n=-+-+⋅⋅⋅+- 二、频率直方分布图下的频率1、频率 =小长方形面积:f S y d ==⨯距;频率=频数/总数2、频率之和:121n f f f ++⋅⋅⋅+=;同时 121n S S S ++⋅⋅⋅+=;三、频率直方分布图下的众数、平均数、中位数及方差 1、众数:最高小矩形底边的中点。
2、平均数: 112233n nx x f x f x f x f =+++⋅⋅⋅+ 112233n n x x S x S x S x S =+++⋅⋅⋅+ 3、中位数:从左到右或者从右到左累加,面积等于0.5时x 的值。
4、方差:22221122()()()n n s x x f x x f x x f =-+-+⋅⋅⋅+-四、线性回归直线方程:ˆˆˆybx a =+ 其中:1122211()()ˆ()nni i i i i i nni i i i x x y y x y nxybx x x nx ====---∑∑==--∑∑ , ˆˆay bx =- 1、线性回归直线方程必过样本中心(,)x y ;2、ˆ0:b>正相关;ˆ0:b <负相关。
3、线性回归直线方程:ˆˆˆy bx a =+的斜率ˆb 中,两个公式中分子、分母对应也相等;中间可以推导得到。
五、回归分析1、残差:ˆˆi i i ey y =-(残差=真实值—预报值)。
分析:ˆi e 越小越好; 2、残差平方和:21ˆ()ni i i y y=-∑, 分析:①意义:越小越好; ②计算:222211221ˆˆˆˆ()()()()ni i n n i y yy y y y y y =-=-+-+⋅⋅⋅+-∑ 3、拟合度(相关指数):22121ˆ()1()ni i i ni i y yR y y ==-∑=--∑,分析:①.(]20,1R ∈的常数; ②.越大拟合度越高;4、相关系数:()()nni i i i x x y y x y nx yr ---⋅∑∑==分析:①.[r ∈-的常数; ②.0:r >正相关;0:r <负相关③.[0,0.25]r ∈;相关性很弱; (0.25,0.75)r ∈;相关性一般; [0.75,1]r ∈;相关性很强; 六、独立性检验 1、2×2列联表: 2、独立性检验公式 ①.22()()()()()n ad bc k a b c d a c b d -=++++②.犯错误上界P 对照表3、独立性检验步骤①.计算观察值k :2()()()()()n ad bc k a b c d a c b d -=++++;②.查找临界值0k :由犯错误概率P ,根据上表查找临界值0k ;③.下结论:0k k ≥:即犯错误概率不超过P 的前提下认为: ,有1-P 以上的把握认为: ; 0k k <:即犯错误概率超过P 的前提认为: ,没有1-P 以上的把握认为: ;【经典例题】题型1 与茎叶图的应用例1(2014全国)某市为考核甲、乙两部门的工作情况,学科网随机访问了50位市民。
(最全)高中数学概率统计知识点总结
概率与统计一、普通的众数、平均数、中位数及方差1、众数:一组数据中,出现次数最多的数。
2、平均数:①、常规平均数:x x x x1 2 nn②、加权平均数:xx x x1 12 2 n n1 2 n3、中位数:从大到小或者从小到大排列,最中间或最中间两个数的平均数。
4、方差: 2 2 2 21s [(x x) ( x x)(x x) ]1 2 nn二、频率直方分布图下的频率1、频率=小长方形面积: f S y距 d ;频率=频数/ 总数2、频率之和:f1 f2 f 1;同时n S1 S2 S 1;n三、频率直方分布图下的众数、平均数、中位数及方差1、众数:最高小矩形底边的中点。
2、平均数:x x f x f x f x f1 12 23 3 n n x x S x S x S x S1 12 23 3 n n3、中位数:从左到右或者从右到左累加,面积等于0.5 时x 的值。
4、方差: 2 2 2 2s ( x x) f ( x x) f ( x x) f1 12 2 n n四、线性回归直线方程:y?b?x a?其中:?bn n(x x)( y y)x y nxyi i i ii 1 i 1n n2 2 2(x x)x nxi ii 1 i 1, a?y b?x1、线性回归直线方程必过样本中心( x,y);2、b?0:正相关;b?0:负相关。
3、线性回归直线方程:y?b?x a?的斜率b?中,两个公式中分子、分母对应也相等;中间可以推导得到。
五、回归分析1、残差:? ?e y y (残差=真实值—预报值)。
分析:e?越小越好;i i i i2、残差平方和:i n12 ( ?)y y ,i i分析:①意义:越小越好;②计算:i n12 2 2 2 (y y?) (y y?) ( y y?) (y y?)i i 1 1 2 2 n n3、拟合度(相关指数):n( y y )?2i i2 i 1R 1n2( y y)ii 1,分析:①. 2 0,1R 的常数;②. 越大拟合度越高;4、相关系数:rn n(x x)( y y) x y nx yi i i ii 1 i 1n n n n2 2 2 2 (x x) ( y y) (x x) ( y y)i i i ii 1 i 1 i 1 i 1分析:①. r [ 1,1]的常数;②. r 0: 正相关;r 0: 负相关③. r [0,0.25] ;相关性很弱;r (0.25,0.75) ;相关性一般;r [0.75,1] ;相关性很强;六、独立性检验1、2× 2 列联表:x1 x 合计22 、独立性检验公式n ( a d b c )①.k y a b a b 1ycd c d 2合计a cb dn②.犯错误上界 P 对照表3、独立性检验步骤2n( a d bc)①.计算观察值k : k;(a b )(c d )(a c)( b d)②.查找临界值k:由犯错误概率P,根据上表查找临界值0 k ;③.下结论:k k :即犯错误概率不超过P 的前提下认为:, 有1-P 以上的把握认为:;k k :即犯错误概率超过P的前提认为:, 没有1-P 以上的把握认为:;【经典例题】题型1 与茎叶图的应用例1(2014 全国)某市为考核甲、乙两部门的工作情况,学科网随机访问了50 位市民。
高中数学-选修2-3-第八章统计和概率
概率与统计学问点:1、随机变量:假如随机试验可能出现的结果可以用一个变量X 来表示,并且X 是随着试验的结果的不同而改变,那么这样的变量叫做随机变量. 随机变量常用大写字母X 、Y 等或希腊字母 ξ、η等表示。
2、离散型随机变量:在上面的射击、产品检验等例子中,对于随机变量X 可能取的值,我们可以按肯定次序一一列出,这样的随机变量叫做离散型随机变量.3、离散型随机变量的分布列:一般的,设离散型随机变量X 可能取的值为x 1,x 2,..... ,x i ,......,x n X 取每一个值 x i (i=1,2,......)的概率P(ξ=x i )=P i ,则称表为离散型随机变量X 的概率分布,简称分布列4、分布列性质① p i ≥0, i =1,2, … ;② p 1 + p 2 +…+p n = 1.5、二项分布:假如随机变量X 的分布列为:其中0<p<1,q=1-p ,则称离散型随机变量X 听从参数p 的二点分布6、超几何分布:一般地, 设总数为N 件的两类物品,其中一类有M 件,从全部物品中任取n(n ≤N)件,这n 件中所含这类物品件数X 是一个离散型随机变量,则它取值为k 时的概率为,其中,且 7、条件概率:对随意事务A 和事务B ,在已知事务A 发生的条件下事务B 发生的概率,叫做条件概率.记作P(B|A),读作A 发生的条件下B 的概率8、公式:9、相互独立事务:事务A(或B)是否发生对事务B(或A)发生的概率没有影响,这样的两个事务叫做相互独立事务。
10、n 次独立重复事务:在同等条件下进行的,各次之间相互独立的一种试验11、二项分布: 设在n 次独立重复试验中某个事务A 发生的次数,A 发生次数ξ是一个随机变量.假如在一次试验中某事务发生的概率是p ,事务A 不发生的概率为q=1-p ,那么在n 次独立重复试验中 (其中 k=0,1, ……,n ,q=1-p )于是可得随机变量ξ的概率分布如下:这样的随机变量ξ听从二项分布,记作ξ~B(n ,p) ,其中n ,p 为参数12、数学期望:一般地,若离散型随机变量ξ的概率分布为 则称 E ξ=x1p1+x2p2+…+xnpn +…为ξ的数学期望或平均数、均值,数学期望又简称为期()(0,1,2,,)k n k M N M n N C C P X k k m C --==={}min ,m M n =*,,,,n N M N n M N N ∈≤≤.0)(,)()()|(>=A P A P AB P A B P )()()(B P A P B A P ⋅=⋅)(k P =ξkn k k n q p C -=望.是离散型随机变量。
高中数学论与概率与统计知识点总结
高中数学论与概率与统计知识点总结在高中数学学习过程中,概率与统计是重要的一部分内容。
本文将对概率与统计的相关知识点进行总结,以帮助同学们更好地掌握这一部分内容。
一、概率基础知识1. 随机事件与样本空间:随机事件是指在相同条件下,可能发生也可能不发生的事件;样本空间是指随机试验的所有可能结果的集合。
2. 事件的概率:事件A发生的概率是指在相同条件下,事件A发生的可能性大小。
概率的取值范围在0和1之间,其中0表示不可能事件,1表示必然事件。
3. 事件的互斥与独立:如果两个事件A和B不能同时发生,称它们互斥;如果事件A发生与否不影响事件B发生的概率,称它们独立。
二、概率计算方法1. 相对频率法:通过大量重复实验,计算事件A发生的频率来估计概率。
2. 等可能概型法:当样本空间中各个基本事件发生的机会相等时,可以通过事件A包含的基本事件数除以总的基本事件数来计算概率。
3. 排列与组合:排列是指从n个不同元素中取出m个元素按一定顺序排列的可能性数量;组合是指从n个不同元素中取出m个元素的可能性数量,不考虑元素的顺序。
三、离散和连续型随机变量1. 随机变量:随机变量是定义在样本空间上的实值函数,用来描述随机试验的结果。
2. 离散随机变量:在有限次试验中只取有限个或可列个值的随机变量,称为离散随机变量。
离散随机变量的概率分布可以通过概率质量函数来表示。
3. 连续型随机变量:在某一区间内可以取到任意值的随机变量,称为连续型随机变量。
连续型随机变量的概率分布可以通过概率密度函数来表示。
四、概率分布1. 二项分布:是n个独立重复的伯努利试验中成功次数的离散概率分布。
2. 泊松分布:是描述单位时间或单位面积内随机事件发生次数的离散概率分布。
3. 正态分布:又称为高斯分布,是实数上最常见的连续概率分布之一,具有钟形曲线的特点。
五、统计分析方法1. 参数估计:通过样本数据来估计总体的某些未知参数,如均值、方差等。
2. 假设检验:根据采集的样本数据,对总体的某个特征或假设进行判断和推断。
高中数学概率与统计知识点
高中数学概率与统计知识点1、概率的定义随机事件A的概率是频率的稳定值;频率是概率的近似值。
2、等可能事件的概率如果一次试验中可能出现的结果有n个,且所有结果出现的可能性都相等,那么,每一个基本事件的概率都是1/n,如果某个事件A包含的结果有m个,那么事件A的概率为P(A)=m/n。
3、互斥事件不可能同时发生的两个事件叫互斥事件。
如果事件A、B互斥,那么事件A+B发生(A、B中有一个发生)的概率,等于事件A、B 分别发生的概率和,即P(A+B)=P(A)+P(B)。
4、对立事件对立事件是指两个事件必有一个发生的互斥事件。
例如:从1~52张扑克牌中任取一张抽到“红桃”与抽到“黑桃”互为互斥事件,因为其中一个不可能同时发生,但又不能保证其中一个必然发生,故不是对立事件。
而抽到“红色牌”与抽到“黑色牌”互为对立事件,因为其中一个必发生。
对立事件的性质:1)对立事件的概率和等于1:P(A)+P(Ä)=P(A+A)=1。
2)互为对立的两个事件一定互斥,但互斥不一定是对立事件。
5、相互独立事件事件A(或B)是否发生对事件B(或A)发生的概率没有影响,这样的两个事件叫做相互独立事件。
两个相互独立事件同时发生的概率,等于每个事件发生的概率的积,即P(A·B)=P(A)·P(B)。
相互独立事件的性质:1)如果事件A与B相互独立,那么A与B,A与B,A与B也都相互独立。
2)必然事件与任何事件都是相互独立的。
3)独立事件是对任意多个事件来讲,而互斥事件是对同一实验来讲的多个事件,且这多个事件不能同时发生,故这些事件相互之间必然影响,因此互斥事件一定不是独立事件。
6、独立重复试验若n次重复试验中,每次试验结果的概率都不依赖于其他各次试验的结果,则称这n次试验是独立的。
如果在一次试验中某事件发生的概率为P,那么在n次独立重复试验中这个事件恰好发生k 次的概率:P…(k)=CP*(1-P)"-*7、两个事件之间的关系对任何两个事件都有P(A+B)=P(A)+P(B)-P(A·B)。
(完整版)高中数学统计与概率知识点归纳(全)
高中数学统计与概率知识点(文)的平均数就是中位数。
③求平均数时,就用各数据的总和除以数据的个数,得数就是这组数据的平 均数。
四、 中位数与众数的特点。
⑴中位数是一组数据中唯一的,可能是这组数据中的数据,也可能不是这组数据中的数据;⑵求中位数时,先将数据有小到大顺序排列,若这组数据是奇数个,则中间的数据是中位数;若 这组数据是偶数个时,则中间的两个数据的平均数是中位数; ⑶中位数的单位与数据的单位相同; ⑷众数考察的是一组数据中出现的频数;⑸众数的大小只与这组数的个别数据有关,它一定是一组数据中的某个数据,其单位与数据的单 位相同; (6) 众数可能是一个或多个甚至没有;(7) 平均数、众数和中位数都是描述一组数据集中趋势的量。
五、 平均数、中位数与众数的异同:⑴平均数、众数和中位数都是描述一组数据集中趋势的量; ⑵平均数、众数和中位数都有单位; ⑶平均数反映一组数据的平均水平,与这组数据中的每个数都有关系, 所以最为重要,应用最广;⑷中位数不受个别偏大或偏小数据的影响;⑸众数与各组数据出现的频数有关,不受个别数据的影响,有时是我们最为关心的数据。
六、 对于样本数据 X i , X 2,…,X n ,设想通过各数据到其平均数的平均距离来反映样本数据的分散 程度,那么这个平均距离如何计算?|X i - x| + |X 2- X| + L + |X n - x|思考4:反映样本数据的分散程度的大小,最常用的统计量是标准差, 一般用s 表示•假设样本数据X i , X 2,…,X n 的平均数为X ,则标准差的计算公式是:(X i - X)2 + (X 2 - x)2 + L +(x n - X)2七、简单随即抽样的含义一般地,设一个总体有 N 个个体,从中逐个不放回地抽取 n 个个体作为样本(n W N ),如果每次 抽取时总体内的各个个体被抽到的机会都相等,则这种抽样方法叫做简单随机抽样•八、 根据你的理解,简单随机抽样有哪些主要特点?一、 众数:一组数据中出现次数最多的那个数据。
(完整版)高中数学概率统计知识点总结
高中数学概率统计知识点总结一、抽样方法1.简单随机抽样 2.简单随机抽样常用的方法:(1)抽签法;⑵随机数表法.3.系统抽样:K (抽样距离)=N (总体规模)/n (样本规模)4.分层抽样:二、样本估计总体的方式1、用样本的频率分布估计总体分布(1)频率分布直方图的画法;(2)频率的算法;(3)频率分布折线图;(4)总体密度曲线;(5)茎叶图。
化不大的位作为一个主干(茎),将变化大的位的数作为分枝(叶),列在主干的后面,这样就可以清楚地看到每个主干后面的几个数,每个数具体是多少。
2、用样本的数字特征估计总体的数字特征(1)众数、中位数、平均数的算法;(2)标准差、方差公式.3、样本均值:nx x x x n +++= 21 4、.样本标准差:n x x x x x x s s n 222212)()()(-++-+-==三、两个变量的线性相关1、正相关2、负相关正相关:自变量增加,因变量也同时增加(即单调递增) 负相关:自变量增长,因变量减少(即单调递减)四、概率的基本概念(1)必然事件(2)不可能事件(3)确定事件(4)随机事件(5)频数与频率(6)频率与概率的区别与联系必然事件和不可能事件统称为确定事件1他们都是统计系统各元件发生的可能性大小;2、频率一般是大概统计数据经验值,概率是系统固有的准确值; 3频率是近似值,概率是准确值4、频率值一般容易得到,所以一般用来代替概率进行定量分析,首先要知道系统各元件发生故障的频率或概率.事件的频率与概率是度量事件出现可能性大小的两个统计特征数.频率是个试验值,或使用时的统计值,具有随机性,可能取多个数值。
因此,只能近似地反映事件出现可能性的大小概率是个理论值,是由事件的本质所决定的,只能取唯一值,它能精确地反映事件出现可能性的大小虽然概率能精确反映事件出现可能性的大小,但它通过大量试验才能得到,这在实际工作中往往是难以做到的.所以,从应用角度来看,频率比概率更有用,它可以从所积累的比较多的统计资料中得到需要指出的是用频率代替概率,并不否认概率能更精确、更全面地反映事件出现可能性的大小,只是由于在目前的条件下,取得概率比取得频率更为困难。
(完整word版)高中数学统计与概率知识点归纳(全)
高中数学统计与概率知识点(文)一、众数: 一组数据中出现次数最多的那个数据。
众数与平均数的区别: 众数表示一组数据中出现次数最多的那个数据;平均数是一组数据中表示平均每份的数量。
二、.中位数: 一组数据按大小顺序排列,位于最中间的一个数据(当有偶数个数据时,为最中间两个数据的平均数)三 .众数、中位数及平均数的求法。
①众数由所给数据可直接求出;②求中位数时,首先要先排序(从小到大或从大到小),然后根据数据的个数,当数据为奇数个时,最中间的一个数就是中位数;当数据为偶数个时,最中间两个数的平均数就是中位数。
③求平均数时,就用各数据的总和除以数据的个数,得数就是这组数据的平均数。
四、中位数与众数的特点。
⑴中位数是一组数据中唯一的,可能是这组数据中的数据,也可能不是这组数据中的数据; ⑵求中位数时,先将数据有小到大顺序排列,若这组数据是奇数个,则中间的数据是中位数;若这组数据是偶数个时,则中间的两个数据的平均数是中位数; ⑶中位数的单位与数据的单位相同; ⑷众数考察的是一组数据中出现的频数;⑸众数的大小只与这组数的个别数据有关,它一定是一组数据中的某个数据,其单位与数据的单位相同;(6)众数可能是一个或多个甚至没有;(7)平均数、众数和中位数都是描述一组数据集中趋势的量。
五.平均数、中位数与众数的异同:⑴平均数、众数和中位数都是描述一组数据集中趋势的量; ⑵平均数、众数和中位数都有单位; ⑶平均数反映一组数据的平均水平,与这组数据中的每个数都有关系,所以最为重要,应用最广; ⑷中位数不受个别偏大或偏小数据的影响;⑸众数与各组数据出现的频数有关,不受个别数据的影响,有时是我们最为关心的数据。
六、对于样本数据x 1,x 2,…,x n ,设想通过各数据到其平均数的平均距离来反映样本数据的分散程度,那么这个平均距离如何计算?思考4:反映样本数据的分散程度的大小,最常用的统计量是标准差,一般用s 表示.假设样本数据x 1,x 2,…,x n 的平均数为x ,则标准差的计算公式是:七、简单随即抽样的含义一般地,设一个总体有N 个个体, 从中逐个不放回地抽取n 个个体作为样本(n≤N), 如果每次12||||||n x x x x x x n-+-++-L 22212()()()n x x x x x x s n -+-++-=L抽取时总体内的各个个体被抽到的机会都相等, 则这种抽样方法叫做简单随机抽样.八、根据你的理解,简单随机抽样有哪些主要特点?(1)总体的个体数有限;(2)样本的抽取是逐个进行的,每次只抽取一个个体;(3)抽取的样本不放回,样本中无重复个体;(4)每个个体被抽到的机会都相等,抽样具有公平性.九、抽签法的操作步骤?第一步,将总体中的所有个体编号,并把号码写在形状、大小相同的号签上.第二步,将号签放在一个容器中,并搅拌均匀第三步,每次从中抽取一个号签,连续抽取n次,就得到一个容量为n的样本.十一、抽签法有哪些优点和缺点?优点:简单易行,当总体个数不多的时候搅拌均匀很容易,个体有均等的机会被抽中,从而能保证样本的代表性.缺点:当总体个数较多时很难搅拌均匀,产生的样本代表性差的可能性很大.十一、利用随机数表法从含有N个个体的总体中抽取一个容量为n的样本,其抽样步骤如何?第一步,将总体中的所有个体编号.第二步,在随机数表中任选一个数作为起始数.第三步,从选定的数开始依次向右(向左、向上、向下)读,将编号范围内的数取出,编号范围外的数去掉,直到取满n个号码为止,就得到一个容量为n的样本.简单随机抽样一般采用两种方法:抽签法和随机数表法。
高中数学概率与统计知识点总结
概率与统计一、概率及随机变量的分布列、期望与方差(一)概率及其计算1.几个互斥事件和事件概率的加法公式①如果事件A 与事件B 互斥,则()P A B =()()P A P B +.推广:如果事件1A ,2A ,…,n A 两两互斥(彼此互斥),那么事件12n A A A +++发生的概率,等于这n 个事件分别发生的概率的和,即()12n P A A A +++=()()()12n P A P A P A ++.②若事件B 与事件A 互为对立事件,则()P A =()1P B -. 2.古典概型的概率公式P (A )=A 包含的基本事件的个数基本事件的总数.(二)随机变量的分布列、期望与方差1. 常用的离散型随机变量的分布列(1)二项分布如果随机变量X 的可能取值为0,1,2,…,n ,且X 取值的概率()P X k ==C k k n kn p q-(其中0,1,2,,,1k n q p ==-),其随机变量分布列为X 0 1 …k…nP0C nnp q111C n np q-…C k k n knp q-…0C n n n p q则称X 服从二项分布,记为(),X B n p ~.(2)超几何分布在含有M 件次品的N 件产品中,任取n 件,其中恰有X 件次品,则事件{}X k =发生的概率为C C C k n kM N Mn N--()0,10,1,2,,2,,k m =,其中{}min ,m M n =,且n N …,M N …,n ,M ,*N ÎN .此时称随机变量X 的分布列为超几何分布列,称随机变量X 服从超几何分布.2.条件概率及相互独立事件同时发生的概率 I.条件概率条件概率一般地,设A ,B 为两个事件,且()0P A >,称()()()P ABP B A P A=为事件A 发生的条件下,事件B 发生的条件概率.在古典概型中,若用()n A 表示事件A 中基本事件的个数,则()()()()()n AB P AB P B A n A P A ==. II .相互独立事件相互独立事件(1)若,A B 相互独立.则()P AB =()()P A P B .(3)若A 与B 相互独立,则A 与B ,A 与B ,A 与B 也都相互独立. III .独立重复试验与二项分布独立重复试验与二项分布在n 次独立重复试验中,事件A 发生k 次的概率为(每次试验中事件A 发生的概率为p)()C 1n kkknp p --,事件A 发生的次数是一个随机变量X ,其分布列为()01)2()C 1(n kk knP X k k n p p -===-¼,,,,,此时称随机变量X 服从二项分布. 学科*网3.离散型随机变量的数学期望(均值)与方差 (1)若离散型随机变量X 的概率分布列为的概率分布列为X x 1 x 2 … x i … x n P p 1 p 2 … p i … p n则称EX =1122i i n n x p x p x p x p ++++¼+¼为随机变量X 的均值或数学期望. (2)若Y aX b =+,则EY =aEX b +,)(D aX b +=2a DX (3)若()X B n p ~,,则EX np =.()(1)D X np p -=. 4.正态分布(1)正态曲线的性质:正态曲线的性质:①曲线位于x 轴上方,与x 轴不相交;②曲线是单峰的,它关于直线x m =对称;③曲线在x m=处达到峰值12πs;④曲线与x 轴之间的面积为1;⑤当s 一定时,曲线的位置由m 确定,曲线随着m 的变化而沿x 轴平移,⑥当m 一定时,曲线的形状由s 确定,s 越小,曲线越“瘦高”,表示总体的分布越集中;s 越大,曲线越“矮胖”,表示总体的分布越分散,如图乙所示.(3)服从正态分布的变量在三个特殊区间内取值的概率服从正态分布的变量在三个特殊区间内取值的概率 ①0().6826P X m s m s -<+=…;②2209().544P X m s m s -<+=…; ③3309().974P X m s m s -<+=…. 二、统计与统计案例 (一)抽样方法 1.简单随机抽样设一个总体含有N 个个体,从中逐个不放回地抽取n 个个体作为样本()n N …,如果每次抽取时总体内的各个个体被抽到的机会都相等,就把这种抽样方法叫做简单随机抽样,最常用的简单随机抽样的方法:抽签法和随机数表法.最常用的简单随机抽样的方法:抽签法和随机数表法. 2.系统抽样的步骤假设要从容量为N 的总体中抽取容量为n 的样本.的样本.(1)先将总体的N 个个体编号.(2)确定分段间隔k ,对编号进行分段,当Nn是整数时,取N k n =.如果遇到Nn不是整数的情况,可以先从总体中随机地剔除几个个体,使得总体中剩余的个体数能被样本容量整除得总体中剩余的个体数能被样本容量整除(3)在第1段用简单随机抽样确定第一个个体编号()l l k ….(4)按照一定的规则抽取样本,通常是将l 加上间隔k 得到第2个个体编号()l k +,再加k 得到第3个个体编号()2l k +,依次进行下去,直到获取整个样本.直到获取整个样本.3.分层抽样在抽样时,将总体分成互不交叉的层,然后按照一定的比例,从各层独立地抽取一定数量的个体,将各层取出的个体合在一起作为样本,这种抽样方法是一种分层抽样.分层抽样的应用范围:当总体是由差异明显的几个部分组成的,往往选用分层抽样.层抽样.注:注:不论哪种抽样方法不论哪种抽样方法,总体中的每一个个体入样的概率是相同的. (二)统计图表的含义 1.作频率分布直方图的步骤(1)求极差(即一组数据中最大值与最小值的差).(2)决定组距和组数.(3)将数据分组.(4)列频率分布表.列频率分布表. (5)画频率分布直方图.画频率分布直方图. (三)样本的数字特征1.众数:在一组数据中,出现次数最多的数据叫做这组数据的众数.出现次数最多的数据叫做这组数据的众数.2.中位数:将一组数据按大小依次排列,把处在中间位置的一个数据(或中间两个数据的平均数)叫做这组数据的中位数叫做这组数据的中位数3.平均数:样本数据的算术平均数,即x =()121n x x x n+++.4.方差:()()()2222121n s x x x x x x n éù=-+-++-êúëû(n x 是样本数据,n 是样本容量,x 是样本平均数).5.标准差:()()()222121ns x x x x x x n éù=-+-++-êúëû.(四)线性回归直线方程 1.两个变量的线性相关(1)如果散点图中点的分布从整体上看大致在一条直线附近,我们就称这两个变量之间具有线性相关关系,这条直线叫回归直线.(2)从散点图上看,如果点分布在从左下角到右上角的区域内,那么两个变量的这种相关关系称为正相关;如果点分布在从左上角到右下角的区域内,那么两个变量的这种相关关系称为负相关. (3)相关系数相关系数r =ååå===----ni nj jini i i y y x x y y x x 11221)()())((,当0r >时,表示两个变量正相关;当0r <时,表示两个变量负相关.r 的绝对值越接近1,表示两个变量的线性相关性越强;r 的绝对值越接近0,表示两个变量的线性相关性越弱.通常当r 的绝对值大于0.75时,便认为两个变量具有很强的线性相关关系.当1r =时,两个变量在回归直线上两个变量在回归直线上 2.回归直线方程 (1)通过求21()ni i i Qy x a b ==--å的最小值而得出回归直线的方法,即使得样本数据的点到回归直线的距离的平方和最小的方法叫做最小二乘法.该式取最小值时的a ,b 的值即分别为aˆ,b ˆ. (2)两个具有线性相关关系的变量的一组数据:11(,)x y ,22(,)x y ,…,()n n x y ,,其回归方程为a x b y ˆˆˆ+=,则1122211()()ˆ()ˆˆnn i i i i i i n ni ii i x x y y x y nx yb x x x nxa y bx ====ì---×ï==ïí--ïï=-ïîåååå.注:样本点的中心(),x y 一定在回归直线上. (3)相关系数22121ˆ()1()n i ii ni i y yR y y ==-å=--å.2R 越大,说明残差平方和越小,即模型的拟合效果越好;2R 越小,残差平方和越大,即模型的拟合效果越差.在线性回归模型中,2R表示解释变量对于预报变量变化的贡献率,2R 越接近于1,表示回归的效果越好. (六)独立性检验(1)变量的不同“值”表示个体所属的不同类别,像这样的变量称为分类变量.像这样的变量称为分类变量.(2)像下表所示列出两个分类变量的频数表,称为列联表.假设有两个分类变量X和Y ,它们的可能取值分别为12(,)x x 和12(,)y y ,其样本频数列联表(称为22´列联表)为表)为y 1 y 2 总计总计x 1 a b a b + x 2 cdc d +总计a c +b d +a b c d +++构造一个随机变量()()()()()22n ad bc K a b c d a c b d -=++++ ,其中n a b c d =+++为样本容量.确定临界值0k ,如果2K 的观测值0k k …,就认为“两个分类变量之间有关系”;否则就认为“两个分类变量之间没有关系”.。
高中数学统计知识点高中数学概率与统计
高中数学统计知识点高中数学概率与统计
高中数学统计知识点包括以下内容:
1. 数据的收集和整理:包括原始数据的收集和整理,如问卷调查、实验结果等。
2. 描述统计:用于对数据进行总结和描述的方法,包括平均数、中位数、众数、极差、标准差等。
3. 概率:研究随机事件发生的可能性的数学分支,包括基本概念、概率的计算方法和
性质。
4. 概率分布:描述随机变量取值与相应概率的分布,包括离散型随机变量和连续型随
机变量的分布。
5. 统计推断:从样本数据中推断总体的特征的方法,包括点估计和区间估计。
6. 假设检验:用于推断总体参数的假设检验方法,包括单样本检验、双样本检验和相
关性检验等。
7. 相关分析:研究两个或多个变量之间关系的方法,包括相关系数和回归分析等。
8. 抽样调查:从总体中随机选择样本进行调查和统计分析的方法,包括简单随机抽样、系统抽样和分层抽样等。
以上是高中数学概率与统计的主要知识点,通过掌握这些知识,可以进行数据的整理
和分析,并进行相关的统计推断和假设检验。
高中数学概率和统计知识点
高中数学之概率与统计求等可能性事件、互斥事件和相互独立事件的概率解此类题目常应用以下知识:(1)等可能性事件(古典概型)的概率:P(A)=)()(I card A card =n m; 等可能事件概率的计算步骤:计算一次试验的基本事件总数n ;设所求事件A ,并计算事件A 包含的基本事件的个数m ; 依公式()mP A n =求值;答,即给问题一个明确的答复.(2)互斥事件有一个发生的概率:P(A +B)=P(A)+P(B); 特例:对立事件的概率:P(A)+P(A )=P(A +A )=1. (3)相互独立事件同时发生的概率:P(A ·B)=P(A)·P(B); 特例:独立重复试验的概率:Pn(k)=kn k k n p p C --)1(.其中P 为事件A 在一次试验中发生的概率,此式为二项式[(1-P)+P]n 展开的第k+1项.(4)解决概率问题要注意“四个步骤,一个结合”:求概率的步骤是:第一步,确定事件性质⎧⎪⎪⎨⎪⎪⎩等可能事件互斥事件 独立事件 n 次独立重复试验即所给的问题归结为四类事件中的某一种.第二步,判断事件的运算⎧⎨⎩和事件积事件即是至少有一个发生,还是同时发生,分别运用相加或相乘事件.第三步,运用公式()()()()()()()()(1)kk n k n n m P A nP A B P A P B P A B P A P B P k C p p -⎧=⎪⎪⎪+=+⎨⎪⋅=⋅⎪=-⎪⎩等可能事件: 互斥事件: 独立事件: n 次独立重复试验:求解第四步,答,即给提出的问题有一个明确的答复.例1.在五个数字12345,,,,中,若随机取出三个数字,则剩下两个数字都是奇数的概率是 (结果用数值表示).[解答过程]0.3提示:1335C 33.54C 102P ===⨯例2.一个总体含有100个个体,以简单随机抽样方式从该总体中抽取一个容量为5的样本,则指定的某个个体被抽到的概率为 .[解答过程]1.20提示:51.10020P == 例3.接种某疫苗后,出现发热反应的概率为0.80.现有5人接种该疫苗,至少有3人出现发热反应的概率为__________.(精确到0.01)[考查目的] 本题主要考查运用组合、概率的基本知识和分类计数原理解决问题的能力,以及推理和运算能力.[解答提示]至少有3人出现发热反应的概率为33244555550.800.200.800.200.800.94C C C ⋅⋅+⋅⋅+⋅=.故填0.94.离散型随机变量的分布列 1.随机变量及相关概念①随机试验的结果可以用一个变量来表示,这样的变量叫做随机变量,常用希腊字母ξ、η等表示.②随机变量可能取的值,可以按一定次序一一列出,这样的随机变量叫做离散型随机变量. ③随机变量可以取某区间内的一切值,这样的随机变量叫做连续型随机变量. 2.离散型随机变量的分布列①离散型随机变量的分布列的概念和性质一般地,设离散型随机变量ξ可能取的值为1x ,2x ,……,i x ,……,ξ取每一个值i x (=i 1,2,……)的概率P (i x =ξ)=i P ,则称下表.为随机变量ξ的概率分布,简称ξ的分布列.由概率的性质可知,任一离散型随机变量的分布列都具有下述两个性质: (1)0≥i P ,=i 1,2,…;(2)++21P P …=1. ②常见的离散型随机变量的分布列: (1)二项分布n 次独立重复试验中,事件A 发生的次数ξ是一个随机变量,其所有可能的取值为0,1,2,…n ,并且kn k k n k q p C k P P -===)(ξ,其中n k ≤≤0,p q -=1,随机变量ξ的分布列如下:称这样随机变量ξ服从二项分布,记作),(~p n B ξ,其中n 、p 为参数,并记:),;(p n k b q p C kn k k n =- .(2) 几何分布在独立重复试验中,某事件第一次发生时所作的试验的次数ξ是一个取值为正整数的离散型随机变量,“k ξ=”表示在第k 次独立重复试验时事件第一次发生. 随机变量ξ的概率分布为:例1.厂家在产品出厂前,需对产品做检验,厂家将一批产品发给商家时,商家按合同规定也需随机抽取一定数量的产品做检验,以决定是否接收这批产品.(Ⅰ)若厂家库房中的每件产品合格的概率为0.8,从中任意取出4件进行检验,求至少有1件是合格的概率;(Ⅱ)若厂家发给商家20件产品中,其中有3件不合格,按合同规定该商家从中任取2件.都进行检验,只有2件都合格时才接收这批产品.否则拒收,求出该商家检验出不合格产品数ξ的分布列及期望ξE ,并求出该商家拒收这批产品的概率.[解答过程](Ⅰ)记“厂家任取4件产品检验,其中至少有1件是合格品”为事件A 用对立事件A 来算,有()()4110.20.9984P A P A =-=-=(Ⅱ)ξ可能的取值为0,1,2.()2172201360190C P C ξ===, ()11317220511190C C P C ξ===,()2322032190C P C ξ===136513301219019019010E ξ=⨯+⨯+⨯=.记“商家任取2件产品检验,都合格”为事件B ,则商家拒收这批产品的概率()136271119095P P B =-=-=.所以商家拒收这批产品的概率为2795.例12.某项选拔共有三轮考核,每轮设有一个问题,能正确回答问题者进入下一轮考核,否则即被淘汰. 已知某选手能正确回答第一、二、三轮的问题的概率分别为54、53、52,且各轮问题能否正确回答互不影响.(Ⅰ)求该选手被淘汰的概率;(Ⅱ)该选手在选拔中回答问题的个数记为ξ,求随机变量ξ的分布列与数学期望. (注:本小题结果可用分数表示)[解答过程]解法一:(Ⅰ)记“该选手能正确回答第i 轮的问题”的事件为(123)i A i =,,,则14()5P A =,23()5P A =,32()5P A =,∴该选手被淘汰的概率112223112123()()()()()()()P P A A A A A A P A P A P A P A P A P A =++=++142433101555555125=+⨯+⨯⨯=.(Ⅱ)ξ的可能值为123,,,11(1)()5P P A ξ===,1212428(2)()()()5525P P A A P A P A ξ====⨯=, 12124312(3)()()()5525P P A A P A P A ξ====⨯=.ξ∴的分布列为11235252525E ξ∴=⨯+⨯+⨯=.解法二:(Ⅰ)记“该选手能正确回答第i 轮的问题”的事件为(123)i A i =,,,则14()5P A =,23()5P A =,32()5P A =.∴该选手被淘汰的概率1231231()1()()()P P A A A P A P A P A =-=-4321011555125=-⨯⨯=. (Ⅱ)同解法一.离散型随机变量的期望与方差随机变量的数学期望和方差 (1)离散型随机变量的数学期望:++=2211p x p x E ξ…;期望反映随机变量取值的平均水平.⑵离散型随机变量的方差:+-+-=222121)()(p E x p E x D ξξξ…+-+n n p E x 2)(ξ…;方差反映随机变量取值的稳定与波动,集中与离散的程度.⑶基本性质:b aE b a E +=+ξξ)(;ξξD a b a D 2)(=+.(4)若ξ~B(n ,p),则 np E =ξ ; D ξ =npq (这里q=1-p ) ;如果随机变量ξ服从几何分布,),()(p k g k P ==ξ,则p E 1=ξ,D ξ =2p q 其中q=1-p.例1.甲、乙两名工人加工同一种零件,两人每天加工的零件数相等,所得次品数分别为ε、η,ε和η的分布列如下:则比较两名工人的技术水平的高低为 .思路:一是要比较两名工人在加工零件数相等的条件下出次品数的平均值,即期望;二是要看出次品数的波动情况,即方差值的大小.解答过程:工人甲生产出次品数ε的期望和方差分别为:7.0103210111060=⨯+⨯+⨯=εE ,891.0103)7.02(101)7.01(106)7.00(222=⨯-+⨯-+⨯-=εD ;工人乙生产出次品数η的期望和方差分别为:7.0102210311050=⨯+⨯+⨯=ηE ,664.0102)7.02(103)7.01(105)7.00(222=⨯-+⨯-+⨯-=ηD由E ε=E η知,两人出次品的平均数相同,技术水平相当,但D ε>D η,可见乙的技术比较稳定.小结:期望反映随机变量取值的平均水平;方差反映随机变量取值的稳定与波动,集中与离散的程度. 例2.某商场经销某商品,根据以往资料统计,顾客采用的付款期数ξ的分布列为商场经销一件该商品,采用1期付款,其利润为200元;分2期或3期付款,其利润为250元;分4期或5期付款,其利润为300元.η表示经销一件该商品的利润.(Ⅰ)求事件A :“购买该商品的3位顾客中,至少有1位采用1期付款”的概率()P A ;(Ⅱ)求η的分布列及期望E η.[解答过程](Ⅰ)由A 表示事件“购买该商品的3位顾客中至少有1位采用1期付款”. 知A 表示事件“购买该商品的3位顾客中无人采用1期付款”2()(10.4)0.216P A =-=, ()1()10.2160.784P A P A =-=-=.(Ⅱ)η的可能取值为200元,250元,300元.(200)(1)0.4P P ηξ====,(250)(2)(3)0.20.20.4P P P ηξξ===+==+=,(300)1(200)(250)10.40.40.2P P P ηηη==-=-==--=.η的分布列为2000.42500.43000.2E η=⨯+⨯+⨯240=(元).抽样方法与总体分布的估计 抽样方法1.简单随机抽样:设一个总体的个数为N ,如果通过逐个抽取的方法从中抽取一个样本,且每次抽取时各个个体被抽到的概率相等,就称这样的抽样为简单随机抽样.常用抽签法和随机数表法.2.系统抽样:当总体中的个数较多时,可将总体分成均衡的几个部分,然后按照预先定出的规则,从每一部分抽取1个个体,得到所需要的样本,这种抽样叫做系统抽样(也称为机械抽样).3.分层抽样:当已知总体由差异明显的几部分组成时,常将总体分成几部分,然后按照各部分所占的比进行抽样,这种抽样叫做分层抽样. 总体分布的估计由于总体分布通常不易知道,我们往往用样本的频率分布去估计总体的分布,一般地,样本容量越大,这种估计就越精确.总体分布:总体取值的概率分布规律通常称为总体分布.当总体中的个体取不同数值很少时,其频率分布表由所取样本的不同数值及相应的频率表示,几何表示就是相应的条形图.当总体中的个体取值在某个区间上时用频率分布直方图来表示相应样本的频率分布.总体密度曲线:当样本容量无限增大,分组的组距无限缩小,那么频率分布直方图就会无限接近于一条光滑曲线,即总体密度曲线. 典型例题例1.某工厂生产A 、B 、C 三种不同型号的产品,产品数量之比依次为2:3:5.现用分层抽样方法抽出一个容量为n 的样本,样本中A 种型号产品有16件.那么此样本的容量n= .解答过程:A 种型号的总体是210,则样本容量n=1016802⨯=.例2.一个总体中有100个个体,随机编号0,1,2,…,99,依编号顺序平均分成10个小组,组号依次为1,2,3,…,10.现用系统抽样方法抽取一个容量为10的样本,规定如果在第1组随机抽取的号码为m ,那么在第k 组中抽取的号码个位数字与m k +的个位数字相同,若6m =,则在第7组中抽取的号码是 .解答过程:第K 组的号码为(1)10k - ,(1)101k -+,…,(1)109k -+,当m=6时,第k 组抽取的号的个位数字为m+k 的个位数字,所以第7组中抽取的号码的个位数字为3 ,所以抽取号码为63.正态分布与线性回归 1.正态分布的概念及主要性质(1)正态分布的概念如果连续型随机变量ξ 的概率密度函数为 222)(21)(σμπσ--=x ex f ,x R ∈ 其中σ、μ为常数,并且σ>0,则称ξ服从正态分布,记为~N ξ(μ,2σ).(2)期望E ξ =μ,方差2σξ=D .(3)正态分布的性质 正态曲线具有下列性质:①曲线在x 轴上方,并且关于直线x =μ对称.②曲线在x=μ时处于最高点,由这一点向左右两边延伸时,曲线逐渐降低.③曲线的对称轴位置由μ确定;曲线的形状由σ确定,σ越大,曲线越“矮胖”;反之越“高瘦”.三σ原则即为数值分布在(μ—σ,μ+σ)中的概率为0.6526 数值分布在(μ—2σ,μ+2σ)中的概率为0.9544 数值分布在(μ—3σ,μ+3σ)中的概率为0.9974 (4)标准正态分布当μ=0,σ=1时ξ服从标准的正态分布,记作~N ξ(0,1) (5)两个重要的公式①()1()x x φφ-=-,② ()()()P a b b a ξφφ<<=-.(6)2(,)N μσ与(0,1)N 二者联系.若2~(,)N ξμσ,则~(0,1)N ξμησ-=;②若2~(,)N ξμσ,则()()()b a P a b μμξφφσσ--<<=-.2.线性回归简单的说,线性回归就是处理变量与变量之间的线性关系的一种数学方法.变量和变量之间的关系大致可分为两种类型:确定性的函数关系和不确定的函数关系.不确定性的两个变量之间往往仍有规律可循.回归分析就是处理变量之间的相关关系的一种数量统计方法.它可以提供变量之间相关关系的经验公式.具体说来,对n 个样本数据(11,x y ),(22,x y ),…,(,n n x y ),其回归直线方程,或经验公式为:a bx y+=ˆ.其中,,)(1221x b y a x n xyx n yx b ni ini ii⋅-=--=∑∑==,其中y x ,分别为|i x |、|i y |的平均数.例1.如果随机变量ξ~N (μ,σ2),且E ξ=3,D ξ=1,则P (-1<ξ≤1=等于( ) A.2Φ(1)-1 B.Φ(4)-Φ(2) C.Φ(2)-Φ(4) D.Φ(-4)-Φ(-2)解答过程:对正态分布,μ=E ξ=3,σ2=D ξ=1,故P (-1<ξ≤1)=Φ(1-3)-Φ(-1-3)=Φ(-2)-Φ(-4)=Φ(4)-Φ(2). 答案:B例2. 将温度调节器放置在贮存着某种液体的容器内,调节器设定在d ℃,液体的温度ξ(单位:℃)是一个随机变量,且ξ~N (d ,0.52). (1)若d=90°,则ξ<89的概率为 ; (2)若要保持液体的温度至少为80 ℃的概率不低于0.99,则d 至少是 ?(其中若η~N (0,1),则Φ(2)=P (η<2)=0.9772,Φ(-2.327)=P (η<-2.327)=0.01).解答过程:(1)P (ξ<89)=F (89)=Φ(5.09089-)=Φ(-2)=1-Φ(2)=1-0.9772=0.0228.(2)由已知d 满足0.99≤P (ξ≥80),即1-P (ξ<80)≥1-0.01,∴P (ξ<80)≤0.01.∴Φ(5.080d-)≤0.01=Φ(-2.327).∴5.080d -≤-2.327.∴d ≤81.1635.故d 至少为81.1635.小结:(1)若ξ~N (0,1),则η=σμξ-~N (0,1).(2)标准正态分布的密度函数f (x )是偶函数,x<0时,f (x )为增函数,x>0时,f (x )为减函数.。
高中数学知识点第十二章-概率与统计
高中数学知识点第十二章-概率与统计 考试内容:抽样方法.总体分布的估计. 总体期望值和方差的估计. 考试要求:(1)了解随机抽样了解分层抽样的意义,会用它们对简单实际问题进行抽样. (2)会用样本频率分布估计总体分布. (3)会用样本估计总体期望值和方差.§12. 概率与统计 知识要点一、随机变量.1. 随机试验的结构应该是不确定的.试验如果满足下述条件: ①试验可以在相同的情形下重复进行;②试验的所有可能结果是明确可知的,并且不止一个;③每次试验总是恰好出现这些结果中的一个,但在一次试验之前却不能肯定这次试验会出现哪一个结果.它就被称为一个随机试验.2. 离散型随机变量:如果对于随机变量可能取的值,可以按一定次序一一列出,这样的随机变量叫做离散型随机变量.若ξ是一个随机变量,a ,b 是常数.则b a +=ξη也是一个随机变量.一般地,若ξ是随机变量,)(x f 是连续函数或单调函数,则)(ξf 也是随机变量.也就是说,随机变量的某些函数也是随机变量.设离散型随机变量ξ可能取的值为: ,,,,21i x x xξ取每一个值),2,1(1 =i x 的概率i i p x P ==)(ξ,则表称为随机变量ξ的概率分布,简称ξ的121i 注意:若随机变量可以取某一区间内的一切值,这样的变量叫做连续型随机变量.例如:]5,0[∈ξ即ξ可以取0~5之间的一切数,包括整数、小数、无理数.3. ⑴二项分布:如果在一次试验中某事件发生的概率是P ,那么在n 次独立重复试验中这个事件恰好发生k 次的概率是:kn k k n qp C k)P(ξ-==[其中p q n k -==1,,,1,0 ] 于是得到随机变量ξ的概率分布如下:我们称这样的随机变量ξ服从二项分布,记作ξ~B(n ·p ),其中n ,p 为参数,并记p)n b(k;qp C k n k k n ⋅=-. ⑵二项分布的判断与应用.①二项分布,实际是对n 次独立重复试验.关键是看某一事件是否是进行n 次独立重复,且每次试验只有两种结果,如果不满足此两条件,随机变量就不服从二项分布. ②当随机变量的总体很大且抽取的样本容量相对于总体来说又比较小,而每次抽取时又只有两种试验结果,此时可以把它看作独立重复试验,利用二项分布求其分布列. 4. 几何分布:“k =ξ”表示在第k 次独立重复试验时,事件第一次发生,如果把k 次试验时事件A 发生记为k A ,事A 不发生记为q )P(A ,A k k =,那么)A A A A P(k)P(ξk 1k 21-== .根据相互独立事件的概率乘法分式:))P(A A P()A )P(A P(k)P(ξk 1k 21-== ),3,2,1(1 ==-k p q k 于是我们称ξ服从几何分布,并记p q p)g(k,1k -=,其中 3,2,1.1=-=k p q5. ⑴超几何分布:一批产品共有N 件,其中有M (M <N )件次品,今抽取)N n n(1≤≤件,则其中的次品数ξ是一离散型随机变量,分布列为)M N k n M,0k (0CC C k)P(ξnNk n MN k M -≤-≤≤≤⋅⋅==--.〔分子是从M 件次品中取k 件,从N-M 件正品中取n-k 件的取法数,如果规定m <r 时0C rm=,则k 的范围可以写为k=0,1,…,n.〕 ⑵超几何分布的另一种形式:一批产品由 a 件次品、b 件正品组成,今抽取n 件(1≤n ≤a+b ),则次品数ξ的分布列为n.,0,1,k CC C k)P(ξnba kn bk a =⋅==+-.⑶超几何分布与二项分布的关系. 设一批产品由a 件次品、b 件正品组成,不放回抽取n 件时,其中次品数ξ服从超几何分布.若放回式抽取,则其中次品数η的分布列可如下求得:把b a +个产品编号,则抽取n 次共有n b a )(+个可能结果,等可能:k)(η=含kn k k n ba C -个结果,故n 0,1,2,k ,)ba a (1)b a a (C b)(a ba C k)P(ηkn k k n nkn k k n =+-+=+==--,即η~)(b a a n B +⋅.[我们先为k 个次品选定位置,共k n C 种选法;然后每个次品位置有a 种选法,每个正品位置有b 种选法] 可以证明:当产品总数很大而抽取个数不多时,k)P(ηk)P(ξ=≈=,因此二项分布可作为超几何分布的近似,无放回抽样可近似看作放回抽样.二、数学期望与方差.1. 期望的含义:一般地,若离散型随机变量ξ的概率分布为n n 2211.数学期望反映了离散型随机变量取值的平均水平.2. ⑴随机变量b a +=ξη的数学期望:b aE b a E E +=+=ξξη)( ①当0=a 时,b b E =)(,即常数的数学期望就是这个常数本身.②当1=a 时,b E b E +=+ξξ)(,即随机变量ξ与常数之和的期望等于ξ的期望与这个常数的和.③当0=b 时,ξξaE a E =)(,即常数与随机变量乘积的期望等于这个常数与随机变量期望的乘积.⑵单点分布:c c E =⨯=1ξ其分布列为:c P ==)1(ξ.⑶两点分布:p p q E =⨯+⨯=10ξ,其分布列为:(p +q = 1)⑷二项分布:∑=⋅-⋅=-np q pk n k n k E k n k)!(!!ξ 其分布列为ξ~),(p n B .(P 为发生ξ的概率)⑸几何分布:pE 1=ξ 其分布列为ξ~),(p k q .(P 为发生ξ的概率) 3.方差、标准差的定义:当已知随机变量ξ的分布列为),2,1()( ===k p x P k k ξ时,则称+-++-+-=n n p E x p E x p E x D 2222121)()()(ξξξξ为ξ的方差. 显然0≥ξD ,故σξξσξ.D =为ξ的根方差或标准差.随机变量ξ的方差与标准差都反映了随机变量ξ取值的稳定与波动,集中与离散的程度.ξD 越小,稳定性越高,波动越小............... 4.方差的性质.⑴随机变量b a +=ξη的方差ξξηD a b a D D 2)()(=+=.(a 、b 均为常数) ⑵单点分布:0=ξD 其分布列为p P ==)1(ξ ⑶两点分布:pq D =ξ 其分布列为:(p + q = 1)⑷二项分布:npq D =ξ ⑸几何分布:2p q D =ξ5. 期望与方差的关系.⑴如果ξE 和ηE 都存在,则ηξηξE E E ±=±)(⑵设ξ和η是互相独立的两个随机变量,则ηξηξηξξηD D D E E E +=+⋅=)(,)(⑶期望与方差的转化:22)(ξξξE E D -= ⑷)()()(ξξξξE E E E E -=-(因为ξE 为一常数)0=-=ξξE E .三、正态分布.(基本不列入考试范围)1.密度曲线与密度函数:对于连续型随机变量ξ,位于x 轴上方,ξ落在任一区间),[b a 内的概率等于它与x 轴.直线a x =与直线b x =(如图阴影部分)的曲线叫ξ的密度曲线,以其作为图像的函数)(x f 叫做ξ的密度函数,由于“),(+∞-∞∈x 是必然事件,故密度曲线与x 轴所夹部分面积等于1.2. ⑴正态分布与正态曲线:如果随机变量ξ的概率密度为:222)(21)(σμσπ--=x ex f .(σμ,,R x ∈为常数,且0 σ),称ξ服从参数为σμ,的正态分布,用ξ~),(2σμN 表示.)(x f 的表达式可简记为),(2σμN ,它的密度曲线简称为正态曲线.⑵正态分布的期望与方差:若ξ~),(2σμN ,则ξ的期望与方差分别为:2,σξμξ==D E . ⑶正态曲线的性质.①曲线在x 轴上方,与x 轴不相交. ②曲线关于直线μ=x 对称.③当μ=x 时曲线处于最高点,当x 向左、向右远离时,曲线不断地降低,呈现出“中间高、两边低”的钟形曲线.④当x <μ时,曲线上升;当x >μ时,曲线下降,并且当曲线向左、向右两边无限延伸时,以x 轴为渐近线,向x 轴无限的靠近.⑤当μ一定时,曲线的形状由σ确定,σ越大,曲线越“矮胖”.表示总体的分布越分散;σ越小,曲线越“瘦高”,表示总体的分布越集中.3. ⑴标准正态分布:如果随机变量ξ的概率函数为)(21)(22+∞-∞=-x ex x πϕ,则称ξ服从标准正态分布. 即ξ~)1,0(N 有)()(x P x ≤=ξϕ,)(1)(x x --=ϕϕ求出,而P (a <ξ≤b )的计算则是)()()(a b b a P ϕϕξ-=≤ .注意:当标准正态分布的)(x Φ的X 取0时,有5.0)(=Φx 当)(x Φ的X 取大于0的数时,有5.0)( x Φ.比如5.00793.0)5.0(=-Φσμ则σμ-5.0必然小于0,如图.⑵正态分布与标准正态分布间的关系:若ξ~),(2σμN 则ξ的分布函数通 常用)(x F 表示,且有)σμx (F(x)x)P(ξ-==≤ϕ.4.⑴“3σ”原则.假设检验是就正态总体而言的,进行假设检验可归结为如下三步:①提出统计假设,统计假设里的变量服从正态分布),(2σμN .②确定一次试验中的取值a 是否落入范围)3,3(σμσμ+-.③做出判断:如果)3,3(σμσμ+-∈a ,接受统计假设. 如果)3,3(σμσμ+-∉a ,由于这是小概率事件,就拒绝统计假设.⑵“3σ”原则的应用:若随机变量ξ服从正态分布),(2σμN 则 ξ落在)3,3(σμσμ+-内的概率为99.7% 亦即落在)3,3(σμσμ+-之外的概率为0.3%,此为小概率事件,如果此事件发生了,就说明此种产品不合格(即ξ不服从正态分布).S 阴=0.5S a =0.5+S。
高中数学《统计》与《概率》知识点
高中数学《统计》与《概率》知识点高中数学的《统计》和《概率》是数学领域中的两个重要分支,它们是数据分析、预测和决策制定等实际问题中必不可少的工具。
下面将详细介绍这两个知识点。
一、统计学是研究数据收集、整理、分析和解释的学科。
统计学的主要任务是从已有的数据中得出结论,进而得到有关总体的信息。
统计学的主要内容包括:1.描述统计:通过数值特征描述数据的中心位置、离散程度等。
描述统计包括以下几个方面:(1)集中趋势:主要有均值、中位数和众数。
均值是一组数据的平均值,中位数是一组数据中处于中间位置的数值,众数是一组数据中出现频率最高的数值。
(2)离散程度:主要有极差、方差和标准差。
极差是一组数据中最大数与最小数的差值,方差是各个数据与均值的差值的平方的平均值,标准差是方差的平方根。
(3)分布形状:主要有正态分布、偏态分布和峰态分布等类型。
2.探索性数据分析:根据数据特征进行初步探索,主要包括绘制直方图、饼图、箱线图等工具来分析数据分布和异常值。
3.概率论:概率是描述随机事件发生可能性的数值,涉及到概率的计算、随机变量及其分布、大数定律和中心极限定理等概念。
(1)概率的定义与性质:概率的定义有经典概率和条件概率等。
经典概率是指在等可能的情况下,一些事件发生的概率。
条件概率是指在已知一事件发生的条件下,另一事件发生的概率。
(2)随机变量与概率分布:随机变量是具有随机性的数值,可分为离散随机变量和连续随机变量。
离散随机变量取有限或可数个数值,其概率分布函数称为概率分布列;连续随机变量在一些区间上取值,其概率分布函数称为概率密度函数。
(3)大数定律与中心极限定理:大数定律是指随着试验次数的增加,频率逼近概率。
中心极限定理是指多个独立随机变量之和的分布近似于正态分布。
4.统计推断:通过样本数据推断总体特征,主要有参数估计和假设检验。
(1)参数估计:根据样本数据估计总体参数,主要有点估计和区间估计。
点估计是用一个数值来估计总体参数,区间估计是用一个区间来估计总体参数,有置信水平的概念。
高中数学《统计》与《概率》知识点
4)互斥事件与对立事件的区别与联系,互斥事件是指事件
A 与事件 B 在一次试验中不会同时发生,其具体包括三
种不同的情形: ( 1)事件 A 发生且事件 B 不发生;( 2)事件 A 不发生且事件 B 发生;( 3)事件 A 与事件 B 同时不
发生,而对立事件是指事件 A 与事件 B 有且仅有一个发生,其包括两种情形; (1)事件 A 发生 B 不发生;( 2)事件
( 2)若 A ∩B 为不可能事件,即 A ∩ B= ф ,那么称事件 A 与事件 B 互斥;
( 3)若 A ∩ B 为不可能事件,且 A ∪B 为必然事件,那么称事件 A 与事件 B 互为对立事件;注意:对立事件一定是互
斥事件,但互斥事件 不一定是 对立事件!
( 4)当事件 A 与 B 互斥时,满足加法公式: P(A ∪ B)= P(A)+ P(B) ;若事件 A 与 B 为对立事件,则 A ∪ B 为必然事件,
( 2)不按比例分层抽样:有的层次在总体中的比重太小,其样本量就会非常少,此时采用该方法,主要是便于对不 同层次的子总体进行专门研究或进行相互比较。如果要用样本资料推断总体时,则需要先对各层的数据资料进行加权
处理,调整样本中各层的比例,使数据恢复到总体中各层实际的比例结构。 四、用样本的数字特征估计总体的数字特征
nA 与试验总次数 n 的比值 n A ,它具有一定的 n
稳定性,总在某个常数附近摆动,且随着试验次数的不断增多,这种摆动幅度越来越小。我们把这个常数叫做随
机事件的概率, 概率从数量上反映了随机事件发生的可能性的大小。
频率在大量重复试验的前提下可以近似地作
为这个事件的概率 二、 概率的基本性质 1、基本概念: ( 1)事件的包含、并事件、交事件、相等事件;
高中数学概率统计知识点全归纳
高中数学《概率与统计》知识点总结一、统计1、抽样方法:①简单随机抽样(总体个数较少) ②系统抽样(总体个数较多) ③分层抽样(总体中差异明显)注意:在N 个个体的总体中抽取出n 个个体组成样本,每个个体被抽到的机会(概率)均为Nn 。
2、总体分布的估计: ⑴一表二图:①频率分布表——数据详实 ②频率分布直方图——分布直观③频率分布折线图——便于观察总体分布趋势 注:总体分布的密度曲线与横轴围成的面积为1。
⑵茎叶图:①茎叶图适用于数据较少的情况,从中便于看出数据的分布,以及中位数、众位数等。
②个位数为叶,十位数为茎,右侧数据按照从小到大书写,相同的数据重复写。
3、总体特征数的估计:⑴平均数:nx x x x x n++++= 321;取值为n x x x ,,,21 的频率分别为n p p p ,,,21 ,则其平均数为n n p x p x p x +++ 2211; 注意:频率分布表计算平均数要取组中值。
⑵方差与标准差:一组样本数据n x x x ,,,21 方差:212)(1∑=−=ni ix xns ;标准差:21)(1∑=−=ni ix xns注:方差与标准差越小,说明样本数据越稳定。
平均数反映数据总体水平;方差与标准差反映数据的稳定水平。
⑶线性回归方程①变量之间的两类关系:函数关系与相关关系; ②制作散点图,判断线性相关关系③线性回归方程:a bx y +=∧(最小二乘法)1221ni i i nii x y nx y b x nx a y bx==⎧−⎪⎪=⎪⎨−⎪⎪=−⎪⎩∑∑ 注意:线性回归直线经过定点),(y x 。
二、概率1、随机事件及其概率:⑴事件:试验的每一种可能的结果,用大写英文字母表示; ⑵必然事件、不可能事件、随机事件的特点; ⑶随机事件A 的概率:1)(0,)(≤≤=A P nmA P . 2、古典概型:⑴基本事件:一次试验中可能出现的每一个基本结果; ⑵古典概型的特点:①所有的基本事件只有有限个; ②每个基本事件都是等可能发生。
高中概率统计考点归纳
高中概率统计考点归纳一、概率的基本概念与性质概率的定义:概率是一个衡量事件发生可能性的数值,通常用P(A)表示事件A发生的概率。
概率的取值范围为0到1之间,其中P(A) = 0表示事件A不可能发生,P(A) = 1表示事件A必然发生。
举例:抛掷一枚硬币,正面朝上的概率为0.5,反面朝上的概率也为0.5。
概率的性质:非负性:对于任意事件A,有P(A) ≥0;归一性:对于必然事件S,有P(S) = 1;可加性:对于互斥事件A和B(即A和B不能同时发生),有P(A ∪B) = P(A) + P(B)。
举例:一个袋子中有3个红球和2个白球,随机抽取一个球为红球的概率是3/5,为白球的概率是2/5。
由于红球和白球是互斥事件,所以抽取到红球或白球的概率是3/5 + 2/5 = 1。
二、古典概型与几何概型古典概型:在有限个等可能的基本事件中,通过计算事件包含的基本事件个数与总基本事件个数的比值来求概率。
举例:抛掷两颗骰子,求点数之和为7的概率。
总的基本事件个数为6×6=36,点数之和为7的基本事件有(1,6)、(2,5)、(3,4)、(4,3)、(5,2)、(6,1),共6种。
因此,点数之和为7的概率为6/36=1/6。
几何概型:在某一度量(长度、面积、体积等)下,通过计算事件占有的度量与样本空间占有的度量的比值来求概率。
举例:在长度为1的线段上随机取一点,求该点位于线段前1/3部分的概率。
样本空间为整个线段,其长度为1;事件空间为线段前1/3部分,其长度为1/3。
因此,该点位于线段前1/3部分的概率为1/3。
三、条件概率与全概率公式条件概率:在已知事件B发生的条件下,事件A发生的概率,记为P(A|B)。
计算公式为P(A|B) = P(AB) / P(B),其中P(AB)表示事件A和B同时发生的概率。
举例:一个班级中有40名学生,其中25名男生和15名女生。
已知某学生是女生,求该学生数学成绩优秀的概率。
高中概率与统计知识点总结
高中概率与统计知识点总结概率与统计是高中数学中的重要内容,涉及到随机现象的研究以及数据的收集、整理和分析。
掌握概率与统计的基本知识和方法,对于学生在高中阶段的数学学习和日常生活中的决策都具有重要意义。
本文将对高中概率与统计的知识点进行总结,包括概率基本概念、常见的概率分布以及统计学中的统计量等。
一、概率基本概念1. 试验与样本空间:试验是指具有不确定性的随机现象,样本空间是指试验所有可能结果的集合。
2. 事件与事件的概率:事件是样本空间的子集,而事件的概率是指某事件出现的可能性大小,介于0和1之间。
3. 概率的性质:概率具有非负性、规范性、可加性等性质,在计算概率时需要运用这些性质。
4. 条件概率:条件概率是指在已知事件B发生的条件下,事件A发生的概率,记作P(A|B)。
5. 独立事件:若事件A和事件B的发生没有关联性,称事件A和事件B是相互独立的。
6. 乘法定理和全概率公式:乘法定理和全概率公式是概率计算中常用的工具,可用于计算复杂事件的概率。
二、常见的概率分布1. 二项分布:二项分布是指在n次独立重复试验中,成功事件发生k次的概率分布。
它的概率质量函数是二项式系数的乘积。
2. 泊松分布:泊松分布是描述单位时间内随机事件发生的次数的概率分布。
它的概率质量函数是由λ的幂指数和一个阶乘项组成。
3. 正态分布:正态分布是自然界中许多随机变量的分布模式。
其概率密度函数呈钟形曲线,对称分布。
三、统计学中的统计量1. 样本均值与总体均值:样本均值是指从总体中抽取的一组样本数据的平均值,总体均值是指所有可能样本数据的均值。
2. 样本方差与总体方差:样本方差是指从总体中抽取的一组样本数据的方差,总体方差是指所有可能样本数据的方差。
3. 样本标准差与总体标准差:样本标准差是指从总体中抽取的一组样本数据的标准差,总体标准差是指所有可能样本数据的标准差。
4. 相关系数:相关系数是衡量两个变量之间相关关系强弱的统计量。
高考数学概率统计知识点(大全)
高考数学概率统计知识点(大全)高考数学概率统计知识点一、随机事件(1)事件的三种运算:并(和)、交(积)、差;注意差A—B可以表示成A与B 的逆的积。
(2)四种运算律:交换律、结合律、分配律、德莫根律。
(3)事件的五种关系:包含、相等、互斥(互不相容)、对立、相互独立。
二、概率定义(1)统计定义:频率稳定在一个数附近,这个数称为事件的概率;(2)古典定义:要求样本空间只有有限个基本事件,每个基本事件出现的可能性相等,则事件A所含基本事件个数与样本空间所含基本事件个数的比称为事件的古典概率;(3)几何概率:样本空间中的元素有无穷多个,每个元素出现的可能性相等,则可以将样本空间看成一个几何图形,事件A看成这个图形的子集,它的概率通过子集图形的大小与样本空间图形的大小的比来计算;(4)公理化定义:满足三条公理的任何从样本空间的子集集合到[0,1]的映射。
三、概率性质与公式(1)加法公式:P(A+B)=p(A)+P(B)—P(AB),特别地,如果A与B互不相容,则P(A+B)=P(A)+P(B);(2)差:P(A—B)=P(A)—P(AB),特别地,如果B包含于A,则P(A—B)=P(A)—P(B);(3)乘法公式:P(AB)=P(A)P(B|A)或P(AB)=P(A|B)P(B),特别地,如果A与B相互独立,则P(AB)=P(A)P(B);(4)全概率公式:P(B)=∑P(Ai)P(B|Ai)。
它是由因求果,贝叶斯公式:P(Aj|B)=P(Aj)P(B|Aj)/∑P(Ai)P(B|Ai)。
它是由果索因;如果一个事件B可以在多种情形(原因)A1,A2,...,An下发生,则用全概率公式求B发生的概率;如果事件B已经发生,要求它是由Aj引起的概率,则用贝叶斯公式。
(5)二项概率公式:Pn(k)=C(n,k)p^k(1—p)^(n—k),k=0,1,2,...,n。
当一个问题可以看成n重贝努力试验(三个条件:n次重复,每次只有A与A的逆可能发生,各次试验结果相互独立)时,要考虑二项概率公式。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
高中数学之概率与统计求等可能性事件、互斥事件和相互独立事件的概率解此类题目常应用以下知识:(1)等可能性事件(古典概型)的概率:P(A)==;等可能事件概率的计算步骤:计算一次试验的基本事件总数; 设所求事件A,并计算事件A包含的基本事件的个数;依公式求值;答,即给问题一个明确的答复.(2)互斥事件有一个发生的概率:P(A + B) = P(A) + P(B); 特例:对立事件的概率:P(A) + P() =P(A +) = 1.(3)相互独立事件同时发生的概率:P(A • B) = P(A) • P(B);特例:独立重复试验的概率:Pn(k)=.其中P为事件A在一次试验中发生的概率,此式为二项式[(1-P)+P]n 展开的第k+1 项.(4)解决概率问题要注意“四个步骤,一个结合” :求概率的步骤是:第一步,确定事件性质即所给的问题归结为四类事件中的某一种. 第二步,判断事件的运算即是至少有一个发生,还是同时发生,分别运用相加或相乘事件. 第三步,运用公式求解第四步,答,即给提出的问题有一个明确的答复.例1.在五个数字中,若随机取出三个数字,则剩下两个数字都是奇数的概率是 (结果用数值表示) .[ 解答过程] 提示:例2.一个总体含有100 个个体,以简单随机抽样方式从该总体中抽取一个容量为 5 的样本,则指定的某个个体被抽到的概率为.[ 解答过程] 提示:例 3.接种某疫苗后,出现发热反应的概率为. 现有5人接种该疫苗,至少有3人出现发热反应的概率为________________ . (精确到)[ 考查目的] 本题主要考查运用组合、概率的基本知识和分类计数原理解决问题的能力,以及推理和运算能力.[ 解答提示] 至少有3 人出现发热反应的概率为故填.离散型随机变量的分布列1. 随机变量及相关概念①随机试验的结果可以用一个变量来表示,这样的变量叫做随机变量,常用希腊字母E、n等表示.②随机变量可能取的值,可以按一定次序一一列出,这样的随机变量叫做离散型随机变量•③随机变量可以取某区间内的一切值,这样的随机变量叫做连续型随机变量2. 离散型随机变量的分布列①离散型随机变量的分布列的概念和性质一般地,设离散型随机变量可能取的值为,,……,,……,取每一个值(1, 2,……)的概率P ()=则称下表•为随机变量的概率分布,简称的分布列由概率的性质可知,任一离散型随机变量的分布列都具有下述两个性质:(1 ),1, 2,...;(2) (1)②常见的离散型随机变量的分布列:(1 )二项分布次独立重复试验中,事件A发生的次数是一个随机变量,其所有可能的取值为0, 1 , 2,n并且,其中,,随机变量的分布列如下:称这样随机变量服从二项分布,记作,其中、为参数,并记:(2)几何分布在独立重复试验中,某事件第一次发生时所作的试验的次数是一个取值为正整数的离散型随机变量,"”表示在第k次独立重复试验时事件第一次发生随机变量的概率分布为:例1.厂家在产品出厂前,需对产品做检验,厂家将一批产品发给商家时,商家按合同规定也需随机抽取一定数量的产品做检验,以决定是否接收这批产品•(I)若厂家库房中的每件产品合格的概率为,从中任意取出4件进行检验,求至少有1件是合格的概率;(□)若厂家发给商家20件产品中,其中有3件不合格,按合同规定该商家从中任取2件.都进行检验,只有2件都合格时才接收这批产品.否则拒收,求出该商家检验出不合格产品数的分布列及期望,并求出该商家拒收这批产品的概率•[解答过程](I)记“厂家任取4件产品检验,其中至少有1件是合格品”为事件 A 用对立事件A来算,有(n)可能的取值为.记“商家任取2件产品检验,都合格”为事件B,则商家拒收这批产品的概率所以商家拒收这批产品的概率为. 例12.某项选拔共有三轮考核,每轮设有一个问题,能正确回答问题者进入下一轮考核,否则即被淘汰•已知某选手能正确回答第一、二、三轮的问题的概率分别为、、,且各轮问题能否正确回答互不影响•(I)求该选手被淘汰的概率;(n)该选手在选拔中回答问题的个数记为,求随机变量的分布列与数学期望(注:本小题结果可用分数表示)[解答过程]解法一:(I)记“该选手能正确回答第轮的问题”的事件为,则,,该选手被淘汰的概率(n)的可能值为,,的分布列为解法二:(I)记“该选手能正确回答第轮的问题”的事件为,则,,该选手被淘汰的概率.(n)同解法一.离散型随机变量的期望与方差随机变量的数学期望和方差(1)离散型随机变量的数学期望:…;期望反映随机变量取值的平均水平⑵离散型随机变量的方差:……;方差反映随机变量取值的稳定与波动,集中与离散的程度⑶基本性质:;•⑷若〜B(n , p),贝U ; D =npq (这里q=1-p );如果随机变量服从几何分布,,则,D =其中q=1-p.例1 •甲、乙两名工人加工同一种零件,两人每天加工的零件数相等,所得次品数分别为£、n,£和n的分布列如下:则比较两名工人的技术水平的高低为思路:一是要比较两名工人在加工零件数相等的条件下出次品数的平均值,即期望;二是要看出次品数的波动情况,即方差值的大小•解答过程:工人甲生产出次品数&的期望和方差分别为:;工人乙生产出次品数n的期望和方差分别为:由E s =E n知,两人出次品的平均数相同,技术水平相当,但D& >Dm,可见乙的技术比较稳定.小结:期望反映随机变量取值的平均水平;方差反映随机变量取值的稳定与波动,集中与离散的程度•例2.某商场经销某商品,根据以往资料统计,顾客采用的付款期数的分布列为1 2 3 4 5商场经销一件该商品,采用1期付款,其利润为200元;分2期或3期付款,其利润为250元;分4期或5期付款,其利润为300元•表示经销一件该商品的利润.(I)求事件:“购买该商品的3位顾客中,至少有1位采用1期付款”的概率;(H)求的分布列及期望.[解答过程](I)由表示事件“购买该商品的3位顾客中至少有1位采用1期付款”.知表示事件“购买该商品的3位顾客中无人采用1期付款”(n)的可能取值为元,元,元.的分布列为(元).抽样方法与总体分布的估计抽样方法1. 简单随机抽样:设一个总体的个数为N,如果通过逐个抽取的方法从中抽取一个样本,且每次抽取时各个个体被抽到的概率相等,就称这样的抽样为简单随机抽样.常用抽签法和随机数表法.2•系统抽样:当总体中的个数较多时,可将总体分成均衡的几个部分,然后按照预先定出的规则,从每一部分抽取1个个体,得到所需要的样本,这种抽样叫做系统抽样(也称为机械抽样)•3•分层抽样:当已知总体由差异明显的几部分组成时,常将总体分成几部分,然后按照各部分所占的比进行抽样,这种抽样叫做分层抽样总体分布的估计由于总体分布通常不易知道,我们往往用样本的频率分布去估计总体的分布,一般地,样本容量越大,这种估计就越精确•总体分布:总体取值的概率分布规律通常称为总体分布当总体中的个体取不同数值很少时,其频率分布表由所取样本的不同数值及相应的频率表示,几何表示就是相应的条形图•当总体中的个体取值在某个区间上时用频率分布直方图来表示相应样本的频率分布总体密度曲线:当样本容量无限增大,分组的组距无限缩小,那么频率分布直方图就会无限接近于一条光滑曲线,即总体密度曲线•典型例题例1.某工厂生产A、B、C三种不同型号的产品,产品数量之比依次为2: 3: 5.现用分层抽样方法抽出一个容量为n的样本,样本中A种型号产品有16件.那么此样本的容量n=. 解答过程:A 种型号的总体是,则样本容量n=.例2.一个总体中有100个个体,随机编号0, 1, 2,…,99,依编号顺序平均分成10个小组,组号依次为1, 2, 3,…,10.现用系统抽样方法抽取一个容量为10的样本,规定如果在第 1 组随机抽取的号码为,那么在第组中抽取的号码个位数字与的个位数字相同,若,则在第7 组中抽取的号码是.解答过程:第K组的号码为,…,,当m=6时,第k组抽取的号的个位数字为m+k的个位数字,所以第7 组中抽取的号码的个位数字为 3 ,所以抽取号码为63.正态分布与线性回归1. 正态分布的概念及主要性质(1)正态分布的概念如果连续型随机变量的概率密度函数为,x其中、为常数,并且〉0,则称服从正态分布,记为(, ) .(2)期望E =卩,方差.(3)正态分布的性质正态曲线具有下列性质:①曲线在x轴上方,并且关于直线x=y对称.②曲线在x= 时处于最高点,由这一点向左右两边延伸时,曲线逐渐降低③曲线的对称轴位置由卩确定;曲线的形状由确定,越大,曲线越"矮胖”;反之越"高瘦”.三(T原则即为数值分布在(卩一b ,卩+ 6)中的概率为数值分布在(卩一2「卩+26)中的概率为数值分布在(卩一36,卩+36 )中的概率为( 4)标准正态分布当=0,=1时服从标准的正态分布,记作( 0,1)(5)两个重要的公式①, ② .( 6)与二者联系.若,则;②若,则.2. 线性回归简单的说,线性回归就是处理变量与变量之间的线性关系的一种数学方法.变量和变量之间的关系大致可分为两种类型:确定性的函数关系和不确定的函数关系. 不确定性的两个变量之间往往仍有规律可循. 回归分析就是处理变量之间的相关关系的一种数量统计方法. 它可以提供变量之间相关关系的经验公式.具体说来,对n个样本数据(),(),…,(),其回归直线方程,或经验公式为:.其中,其中分别为|| 、|| 的平均数.例1.如果随机变量E〜N (卩,6 2),且E E =3 , D E =1,则P (- 1<^< 1=等于()0( 1)- 1 B. 0( 4)—①(2)C. 0( 2)—0( 4)D.①(一4)—0(—2)解答过程:对正态分布,卩=E E =3 , 6 2=DE =1,故P (—1<EW 1) =0( 1 —3)—0(—1 —3) =0(—2)—0(—4) =0( 4)—0( 2) .答案:B例2.将温度调节器放置在贮存着某种液体的容器内,调节器设定在d C,液体的温度E (单位:C)是一个随机变量,且E〜N(d,).(1 )若d=90°,则E <89的概率为;(2)若要保持液体的温度至少为80 C的概率不低于,则d至少是?(其中若n〜(0 ,1),则0( 2) =P (n <2) =, 0( — ) =P (n <—)=).解答过程:(1) P (E <89) =F (89) =0()二①(—2) =1 —①(2) =1 —=. (2)由已知d满足w P (E> 80),即 1 —P (E <80)> 1 —,••• P (E <80)w ..•.①()w =o( — ).•w—.• d w .故 d 至少为.(x)是小结:(1)若E〜N(0,1),则n =〜N (0,1). (2)标准正态分布的密度函数f偶函数,x<0时,f (x)为增函数,x>0时,f (x)为减函数.。