高中统计与概率知识点
高中数学统计与概率
高中数学统计与概率1、概率的定义随机事件A的概率是频率的稳定值;频率是概率的近似值。
2、等可能事件的概率如果一次试验中可能出现的结果有n个,且所有结果出现的可能性都相等,那么,每一个基本事件的概率都是1/n,如果某个事件A包含的结果有m个,那么事件A的概率为P(A)=m/n。
3、互斥事件不可能同时发生的两个事件叫互斥事件。
如果事件A、B互斥,那么事件A+B发生(A、B中有一个发生)的概率,等于事件A、B分别发生的概率和,即P(A+B)=P(A)+P(B)。
4.抽签法和随机数表法(1)抽签法①优点:简单易行;②缺点:当总体容量非常大时,操作比较麻烦;若抽取前搅拌不均匀,可能导致抽取的样本不具有代表性.(2)随机数表法随机数表是由水技术(通常为自然数)形成的数表,表中的每一位置出现的数都是随机的.随机数表法的一般步骤:第一步:对总体进行编号;第二步:任意指定一个开始选取的位置,位置的确定可以闭着眼用手指随机确定,也可以用其他方法;第三步:按照一定规则选取编号;第四步:按照得到的编号找出对应的个体.【注释】①规则一经确定,就不能更改;②选取过程中,遇到超过编号范围或已经选取了的数字,应该舍弃.5.分层抽样一般地,如果相对于要考察的问题来说,总体可以分为有明显差别的,互不重叠的几部分时,每一部分可称为层,在各层中按层在总体中所占比例进行随机抽样的方法称为分层随机抽样(简称分层抽样).【注释】分层抽样得到的样本,一般更具有代表性,可以更准确地反映总体的特征,尤其是在层内个体相对同质而层间差异较大时更是如此.分层抽样在各层中抽样时,还可根据各层的特点灵活选用不同的随机抽样方法.。
高中数学统计与概率知识点
高中数学统计与概率知识点一、统计学基础1. 数据收集- 普查与抽样调查- 数据的类型(定量数据与定性数据)2. 数据整理与展示- 频数分布表- 直方图- 饼图- 条形图3. 中心趋势的度量- 平均数(算术平均数)- 中位数- 众数4. 离散程度的度量- 极差- 四分位距- 方差与标准差5. 相关性分析- 相关系数- 散点图二、概率论基础1. 随机事件- 事件的定义- 必然事件与不可能事件- 互斥事件与独立事件2. 概率的计算- 单次试验的概率- 多次试验的概率- 条件概率- 贝叶斯定理3. 随机变量- 离散随机变量与连续随机变量 - 概率分布- 概率密度函数与概率分布函数4. 期望值与方差- 随机变量的期望值- 随机变量的方差5. 常见概率分布- 二项分布- 泊松分布- 正态分布三、统计与概率的应用1. 假设检验- 零假设与备择假设- 显著性水平- 第一类错误与第二类错误 - t检验与卡方检验2. 回归分析- 线性回归- 相关系数与决定系数3. 抽样与估计- 抽样误差- 置信区间- 最大似然估计四、综合练习题1. 选择题- 统计图表解读- 概率计算- 假设检验2. 填空题- 计算平均数、中位数、众数 - 计算方差、标准差- 概率分布的应用3. 解答题- 解释统计概念- 概率问题的求解- 应用统计方法解决实际问题五、附录1. 公式汇总- 统计学公式- 概率论公式2. 重要概念索引- 术语解释- 概念间的关系3. 参考资料- 推荐阅读书籍- 在线资源链接请根据需要对上述内容进行编辑和调整。
这篇文章是为了提供一个关于高中数学统计与概率的知识点概览,适用于教育目的。
每个部分都包含了关键的子标题和简短的描述,以便于理解和使用。
(最全)高中数学概率统计知识点总结
概率与统计一、普通的众数、平均数、中位数及方差1、 众数 :一组数据中,出现次数最多的数。
2、平均数 : ①、常规平均数:xx 1x 2x n②、加权平均数: xx 1 1 x 2 2x nnn12n3、中位数: 从大到小或者从小到大排列,最中间或最中间两个数的平均数 。
4、方差: s 21[( x 1 x) 2 ( x 2 x )2( x nx )2 ]n二、频率直方分布图下的频率1、频率 =小长方形面积: f S y 距 d ;频率 =频数 / 总数2、频率之和 : f 1f 2f n 1 ;同时 S 1 S 2S n1 ;三、频率直方分布图下的众数、平均数、中位数及方差1、众数: 最高小矩形底边的中点。
2、平均数: x x 1 f 1 x 2 f 2 x 3 f 3 x n f nx x 1 S 1 x 2 S 2x 3 S 3x n S n3、中位数: 从左到右或者从右到左累加,面积等于0.5 时 x 的值。
4、方差: s 2( x 1x )2 f 1 ( x 2 x) 2 f 2( x n x) 2 f n四、线性回归直线方程 : ? ? ?bxy an(x ix )( y iy )nx i y i nxy??其中: b i 1i 1,a?ybxnn( x i x )2x i 2nx 2i 1i11、线性回归直线方程必过样本中心( x , y ) ;??0 : 负相关。
2、 b 0 : 正相关; b?3、线性回归直线方程: y? ?bx a?的斜率 b 中,两个公式中分子、分母对应也相等;中间可以推导得到。
五、回归分析?i1、残差 : ?iy i?i 越小越好;ey (残差 =真实值—预报值)。
分析:e2、残差平方和 :n? )2(y i,i 1y in( y iy )2( y 1 y )2 ( yy )2( yy )2分析:①意义:越小越好;②计算:?i?12?2n?ni 1n ?i )23、拟合度(相关指数) : R 21( yy ,分析:① . R 20,1②. 越大拟合度越高;i 1的常数;ny)2i ( y i1nn4、相关系数 : ri ( x i x )( y i y)x i y i nx y1i 1nx)2 ny) 2 nx) 2 ny )2i 1( x i i ( y i( x i ( y i1i 1i 1分析:① . r[ 1,1]的常数;② . r 0: 正相关; r0: 负相关③. r[0,0.25] ;相关性很弱;r(0.25,0.75) ;相关性一般;r [0.75,1] ;相关性很强;六、独立性检验 x 1 x 21、2×2 列联表 :合计2、独立性检验公式 bc)2y 1 a b a b ①. k 2(an( add )y 2cdc db)(c d )(a c)(b合计a cb dn②.犯错误上界 P 对照表3、独立性检验步骤①.计算观察值n(ad bc) 2k : k;(a b)(c d )(a c)(b d )②.查找临界值 k0:由犯错误概率P,根据上表查找临界值k0;③.下结论: k k0:即犯错误概率不超过P 的前提下认为:, 有 1-P 以上的把握认为:;k k0:即犯错误概率超过P 的前提认为:,没有 1-P 以上的把握认为:;【经典例题】题型 1 与茎叶图的应用例 1( 2014 全国)某市为考核甲、乙两部门的工作情况,学科网随机访问了50 位市民。
(最全)高中数学概率统计知识点总结
高中数学-概率与统计一、普通的众数、平均数、中位数及方差 1、 众数:一组数据中,出现次数最多的数。
2、平均数:①、常规平均数:12nx x x x n++⋅⋅⋅+=②、加权平均数:112212n n n x x x x ωωωωωω++⋅⋅⋅+=++⋅⋅⋅+3、中位数:从大到小或者从小到大排列,最中间或最中间两个数的平均数。
4、方差:2222121[()()()]n s x x x x x x n=-+-+⋅⋅⋅+- 二、频率直方分布图下的频率1、频率 =小长方形面积:f S y d ==⨯距;频率=频数/总数2、频率之和:121n f f f ++⋅⋅⋅+=;同时 121n S S S ++⋅⋅⋅+=;三、频率直方分布图下的众数、平均数、中位数及方差 1、众数:最高小矩形底边的中点。
2、平均数: 112233n nx x f x f x f x f =+++⋅⋅⋅+ 112233n n x x S x S x S x S =+++⋅⋅⋅+ 3、中位数:从左到右或者从右到左累加,面积等于0.5时x 的值。
4、方差:22221122()()()n n s x x f x x f x x f =-+-+⋅⋅⋅+-四、线性回归直线方程:ˆˆˆybx a =+ 其中:1122211()()ˆ()nni i i i i i nni i i i x x y y x y nxybx x x nx ====---∑∑==--∑∑ , ˆˆay bx =- 1、线性回归直线方程必过样本中心(,)x y ;2、ˆ0:b>正相关;ˆ0:b <负相关。
3、线性回归直线方程:ˆˆˆy bx a =+的斜率ˆb 中,两个公式中分子、分母对应也相等;中间可以推导得到。
五、回归分析1、残差:ˆˆi i i ey y =-(残差=真实值—预报值)。
分析:ˆi e 越小越好; 2、残差平方和:21ˆ()ni i i y y=-∑, 分析:①意义:越小越好; ②计算:222211221ˆˆˆˆ()()()()ni i n n i y yy y y y y y =-=-+-+⋅⋅⋅+-∑ 3、拟合度(相关指数):22121ˆ()1()ni i i ni i y yR y y ==-∑=--∑,分析:①.(]20,1R ∈的常数; ②.越大拟合度越高;4、相关系数:()()nni i i i x x y y x y nx yr ---⋅∑∑==分析:①.[r ∈-的常数; ②.0:r >正相关;0:r <负相关③.[0,0.25]r ∈;相关性很弱; (0.25,0.75)r ∈;相关性一般; [0.75,1]r ∈;相关性很强; 六、独立性检验 1、2×2列联表: 2、独立性检验公式 ①.22()()()()()n ad bc k a b c d a c b d -=++++②.犯错误上界P 对照表3、独立性检验步骤①.计算观察值k :2()()()()()n ad bc k a b c d a c b d -=++++;②.查找临界值0k :由犯错误概率P ,根据上表查找临界值0k ;③.下结论:0k k ≥:即犯错误概率不超过P 的前提下认为: ,有1-P 以上的把握认为: ; 0k k <:即犯错误概率超过P 的前提认为: ,没有1-P 以上的把握认为: ;【经典例题】题型1 与茎叶图的应用例1(2014全国)某市为考核甲、乙两部门的工作情况,学科网随机访问了50位市民。
高中数学概率与统计知识点
高中数学概率与统计知识点1、概率的定义随机事件A的概率是频率的稳定值;频率是概率的近似值。
2、等可能事件的概率如果一次试验中可能出现的结果有n个,且所有结果出现的可能性都相等,那么,每一个基本事件的概率都是1/n,如果某个事件A包含的结果有m个,那么事件A的概率为P(A)=m/n。
3、互斥事件不可能同时发生的两个事件叫互斥事件。
如果事件A、B互斥,那么事件A+B发生(A、B中有一个发生)的概率,等于事件A、B 分别发生的概率和,即P(A+B)=P(A)+P(B)。
4、对立事件对立事件是指两个事件必有一个发生的互斥事件。
例如:从1~52张扑克牌中任取一张抽到“红桃”与抽到“黑桃”互为互斥事件,因为其中一个不可能同时发生,但又不能保证其中一个必然发生,故不是对立事件。
而抽到“红色牌”与抽到“黑色牌”互为对立事件,因为其中一个必发生。
对立事件的性质:1)对立事件的概率和等于1:P(A)+P(Ä)=P(A+A)=1。
2)互为对立的两个事件一定互斥,但互斥不一定是对立事件。
5、相互独立事件事件A(或B)是否发生对事件B(或A)发生的概率没有影响,这样的两个事件叫做相互独立事件。
两个相互独立事件同时发生的概率,等于每个事件发生的概率的积,即P(A·B)=P(A)·P(B)。
相互独立事件的性质:1)如果事件A与B相互独立,那么A与B,A与B,A与B也都相互独立。
2)必然事件与任何事件都是相互独立的。
3)独立事件是对任意多个事件来讲,而互斥事件是对同一实验来讲的多个事件,且这多个事件不能同时发生,故这些事件相互之间必然影响,因此互斥事件一定不是独立事件。
6、独立重复试验若n次重复试验中,每次试验结果的概率都不依赖于其他各次试验的结果,则称这n次试验是独立的。
如果在一次试验中某事件发生的概率为P,那么在n次独立重复试验中这个事件恰好发生k 次的概率:P…(k)=CP*(1-P)"-*7、两个事件之间的关系对任何两个事件都有P(A+B)=P(A)+P(B)-P(A·B)。
(完整版)高中数学统计与概率知识点归纳(全)
高中数学统计与概率知识点(文)的平均数就是中位数。
③求平均数时,就用各数据的总和除以数据的个数,得数就是这组数据的平 均数。
四、 中位数与众数的特点。
⑴中位数是一组数据中唯一的,可能是这组数据中的数据,也可能不是这组数据中的数据;⑵求中位数时,先将数据有小到大顺序排列,若这组数据是奇数个,则中间的数据是中位数;若 这组数据是偶数个时,则中间的两个数据的平均数是中位数; ⑶中位数的单位与数据的单位相同; ⑷众数考察的是一组数据中出现的频数;⑸众数的大小只与这组数的个别数据有关,它一定是一组数据中的某个数据,其单位与数据的单 位相同; (6) 众数可能是一个或多个甚至没有;(7) 平均数、众数和中位数都是描述一组数据集中趋势的量。
五、 平均数、中位数与众数的异同:⑴平均数、众数和中位数都是描述一组数据集中趋势的量; ⑵平均数、众数和中位数都有单位; ⑶平均数反映一组数据的平均水平,与这组数据中的每个数都有关系, 所以最为重要,应用最广;⑷中位数不受个别偏大或偏小数据的影响;⑸众数与各组数据出现的频数有关,不受个别数据的影响,有时是我们最为关心的数据。
六、 对于样本数据 X i , X 2,…,X n ,设想通过各数据到其平均数的平均距离来反映样本数据的分散 程度,那么这个平均距离如何计算?|X i - x| + |X 2- X| + L + |X n - x|思考4:反映样本数据的分散程度的大小,最常用的统计量是标准差, 一般用s 表示•假设样本数据X i , X 2,…,X n 的平均数为X ,则标准差的计算公式是:(X i - X)2 + (X 2 - x)2 + L +(x n - X)2七、简单随即抽样的含义一般地,设一个总体有 N 个个体,从中逐个不放回地抽取 n 个个体作为样本(n W N ),如果每次 抽取时总体内的各个个体被抽到的机会都相等,则这种抽样方法叫做简单随机抽样•八、 根据你的理解,简单随机抽样有哪些主要特点?一、 众数:一组数据中出现次数最多的那个数据。
高中数学统计与概率知识点
高中数学统计与概率知识点高中数学统计与概率知识点第一部分:统计一、众数众数是一组数据中出现次数最多的数据。
它反映了数据的集中趋势,但当数据大小差异很大时,众数的准确值难以判断。
此外,当众数出现次数不具明显优势时,用它来反映数据的典型水平是不可靠的。
二、中位数中位数是一组数据中位于最中间的数据,当数据为偶数个时,为最中间两个数据的平均数。
求中位数时,需要先将数据排序,然后根据数据的个数来确定中位数。
三、众数、中位数及平均数的求法众数由所给数据可直接求出;求中位数时,需要先排序,然后根据数据的个数来确定中位数;求平均数时,需要将各数据的总和除以数据的个数。
四、中位数与众数的特点中位数是一组数据中唯一的,可能是这组数据中的数据,也可能不是;众数考察的是一组数据中出现的频数,它的大小只与这组数据的个别数据有关,可能是一个或多个,甚至没有。
五、平均数、中位数与众数的异同平均数、中位数和众数都是描述一组数据集中趋势的量,都有单位。
平均数反映数据的平均水平,与每个数据都有关系,应用最广;中位数不受个别偏大或偏小数据的影响;众数与各组数据出现的频数有关,不受个别数据的影响,有时是我们最为关心的数据。
六、样本数据的分散程度对于样本数据x1,x2,…,xn,可以通过各数据到其平均数的平均距离来反映样本数据的分散程度。
平均距离的计算公式为12n。
本文介绍了统计学中常用的标准差,以及简单随机抽样的定义和特点。
其中,简单随机抽样的主要特点包括总体个体数有限、逐个抽取、不放回、公平性。
抽签法是一种简单易行的抽样方法,但在总体个数较多时可能会导致样本代表性差。
随机数表法是另一种常用的抽样方法,其步骤包括编号、选定起始位置和依次读取。
最后,对于从100个个体中抽取一个容量为10的样本,可以采用抽签法或随机数表法进行编号。
十三、系统抽样的一般步骤在使用系统抽样从总体中抽取样本时,首先需要将总体中的所有个体进行编号。
举例来说,如果要从605件产品中抽取60件进行质量检查,由于605件产品不能均衡分成60部分,因此需要先从总体中随机剔除5个个体,再均衡分成60部分。
(完整word版)高中数学统计与概率知识点归纳(全)
高中数学统计与概率知识点(文)一、众数: 一组数据中出现次数最多的那个数据。
众数与平均数的区别: 众数表示一组数据中出现次数最多的那个数据;平均数是一组数据中表示平均每份的数量。
二、.中位数: 一组数据按大小顺序排列,位于最中间的一个数据(当有偶数个数据时,为最中间两个数据的平均数)三 .众数、中位数及平均数的求法。
①众数由所给数据可直接求出;②求中位数时,首先要先排序(从小到大或从大到小),然后根据数据的个数,当数据为奇数个时,最中间的一个数就是中位数;当数据为偶数个时,最中间两个数的平均数就是中位数。
③求平均数时,就用各数据的总和除以数据的个数,得数就是这组数据的平均数。
四、中位数与众数的特点。
⑴中位数是一组数据中唯一的,可能是这组数据中的数据,也可能不是这组数据中的数据; ⑵求中位数时,先将数据有小到大顺序排列,若这组数据是奇数个,则中间的数据是中位数;若这组数据是偶数个时,则中间的两个数据的平均数是中位数; ⑶中位数的单位与数据的单位相同; ⑷众数考察的是一组数据中出现的频数;⑸众数的大小只与这组数的个别数据有关,它一定是一组数据中的某个数据,其单位与数据的单位相同;(6)众数可能是一个或多个甚至没有;(7)平均数、众数和中位数都是描述一组数据集中趋势的量。
五.平均数、中位数与众数的异同:⑴平均数、众数和中位数都是描述一组数据集中趋势的量; ⑵平均数、众数和中位数都有单位; ⑶平均数反映一组数据的平均水平,与这组数据中的每个数都有关系,所以最为重要,应用最广; ⑷中位数不受个别偏大或偏小数据的影响;⑸众数与各组数据出现的频数有关,不受个别数据的影响,有时是我们最为关心的数据。
六、对于样本数据x 1,x 2,…,x n ,设想通过各数据到其平均数的平均距离来反映样本数据的分散程度,那么这个平均距离如何计算?思考4:反映样本数据的分散程度的大小,最常用的统计量是标准差,一般用s 表示.假设样本数据x 1,x 2,…,x n 的平均数为x ,则标准差的计算公式是:七、简单随即抽样的含义一般地,设一个总体有N 个个体, 从中逐个不放回地抽取n 个个体作为样本(n≤N), 如果每次12||||||n x x x x x x n-+-++-L 22212()()()n x x x x x x s n -+-++-=L抽取时总体内的各个个体被抽到的机会都相等, 则这种抽样方法叫做简单随机抽样.八、根据你的理解,简单随机抽样有哪些主要特点?(1)总体的个体数有限;(2)样本的抽取是逐个进行的,每次只抽取一个个体;(3)抽取的样本不放回,样本中无重复个体;(4)每个个体被抽到的机会都相等,抽样具有公平性.九、抽签法的操作步骤?第一步,将总体中的所有个体编号,并把号码写在形状、大小相同的号签上.第二步,将号签放在一个容器中,并搅拌均匀第三步,每次从中抽取一个号签,连续抽取n次,就得到一个容量为n的样本.十一、抽签法有哪些优点和缺点?优点:简单易行,当总体个数不多的时候搅拌均匀很容易,个体有均等的机会被抽中,从而能保证样本的代表性.缺点:当总体个数较多时很难搅拌均匀,产生的样本代表性差的可能性很大.十一、利用随机数表法从含有N个个体的总体中抽取一个容量为n的样本,其抽样步骤如何?第一步,将总体中的所有个体编号.第二步,在随机数表中任选一个数作为起始数.第三步,从选定的数开始依次向右(向左、向上、向下)读,将编号范围内的数取出,编号范围外的数去掉,直到取满n个号码为止,就得到一个容量为n的样本.简单随机抽样一般采用两种方法:抽签法和随机数表法。
高中概率与统计数学知识点整理
高中概率与统计数学知识点整理
本文档旨在整理高中概率与统计学科的核心知识点,帮助学生们更好地掌握和应用这些知识。
1. 概率
1.1 基本概念
- 试验、样本空间、事件的概念
- 事件的概率
- 必然事件和不可能事件
1.2 概率的计算
- 古典概型和几何概型
- 加法原理和乘法原理
- 组合与排列
1.3 随机变量和概率分布
- 随机变量的定义和分类
- 离散型和连续型随机变量
- 期望和方差
- 二项分布、正态分布等常见概率分布2. 统计
2.1 数据的整理和描述
- 数据的收集和整理
- 频数表、列联表和帕累托图
- 平均数、中位数、众数和四分位数
2.2 统计图表
- 条形图、折线图和饼图
- 散点图和箱线图
2.3 参数估计和假设检验
- 估计与检验的基本概念
- 置信区间和显著性水平
- 单样本均值检验和两样本均值检验2.4 相关与回归分析
- 相关系数和回归方程
- 最小二乘法拟合直线
以上是高中概率与统计数学的核心知识点,通过研究和掌握这些知识,你将能够更好地理解和应用概率与统计在实际生活中的问题中。
参考资料:
- 高中数学教材
- 统计研究网
- 数学之美。
高中数学选修统计和概率
概率与统计知识点:1、随机变量:如果随机试验可能出现的结果可以用一个变量X 来表示,并且X 是随着试验的结果的不同而变化,那么这样的变量叫做随机变量.随机变量常用大写字母X 、Y 等或希腊字母ξ、η等表示。
2、离散型随机变量:在上面的射击、产品检验等例子中,对于随机变量X 可能取的值,我们可以按一定次序一一列出,这样的随机变量叫做离散型随机变量.3、离散型随机变量的分布列:一般的,设离散型随机变量X 可能取的值为x 1,x 2,.....,x i ,......,x n X 取每一个值x i (i=1,2,......)的概率P(ξ=x i )=P i ,则称表为离散型随机变量X 的概率分布,简称分布列456、n(n ≤N)件,这n 0,1,2,,)m , 其中m =7、概率.8、公式9、10、n 11、如中(k P =ξ12、则称E 是13、14、N15、方差:D(ξ)=(x 1-E ξ)2·P 1+(x 2-E ξ)2·P 2+......+(x n -E ξ)2·P n 叫随机变量ξ的均方差,简称方差。
16、集中分布的期望与方差一览:若概率密度曲线就是或近似地是函数的图像,其中解析式中的实数0)μσσ>、(是参数,分别表示总体的平均数与标准差. 则其分布叫正态分布(,)N μσ记作:,f(x)的图象称为正态曲线。
18.基本性质:③当时x x 轴为④当μ越小,19.3σ考点:123★★★1目B (1)求X (2)★★★2济南市有大明湖、趵突泉、千佛山、园博园4个旅游景点,一位客人浏览这四个景点的概率分别是0.3,0.4,0.5,0.6,且客人是否游览哪个景点互不影响,设ξ表示客人离开该城市时游览的景点数与没有游览的景点数之差的绝对值。
(1)求ξ=0对应的事件的概率;(2)求ξ的分布列及数学期望。
★★★3.袋子中装有8个黑球,2个红球,这些球只有颜色上的区别。
高中数学概率与统计知识点总结
概率与统计一、概率及随机变量的分布列、期望与方差(一)概率及其计算1.几个互斥事件和事件概率的加法公式①如果事件A 与事件B 互斥,则()P A B =()()P A P B +.推广:如果事件1A ,2A ,…,n A 两两互斥(彼此互斥),那么事件12n A A A +++发生的概率,等于这n 个事件分别发生的概率的和,即()12n P A A A +++=()()()12n P A P A P A ++.②若事件B 与事件A 互为对立事件,则()P A =()1P B -. 2.古典概型的概率公式P (A )=A 包含的基本事件的个数基本事件的总数.(二)随机变量的分布列、期望与方差1. 常用的离散型随机变量的分布列(1)二项分布如果随机变量X 的可能取值为0,1,2,…,n ,且X 取值的概率()P X k ==C k k n kn p q-(其中0,1,2,,,1k n q p ==-),其随机变量分布列为X 0 1 …k…nP0C nnp q111C n np q-…C k k n knp q-…0C n n n p q则称X 服从二项分布,记为(),X B n p ~.(2)超几何分布在含有M 件次品的N 件产品中,任取n 件,其中恰有X 件次品,则事件{}X k =发生的概率为C C C k n kM N Mn N--()0,10,1,2,,2,,k m =,其中{}min ,m M n =,且n N …,M N …,n ,M ,*N ÎN .此时称随机变量X 的分布列为超几何分布列,称随机变量X 服从超几何分布.2.条件概率及相互独立事件同时发生的概率 I.条件概率条件概率一般地,设A ,B 为两个事件,且()0P A >,称()()()P ABP B A P A=为事件A 发生的条件下,事件B 发生的条件概率.在古典概型中,若用()n A 表示事件A 中基本事件的个数,则()()()()()n AB P AB P B A n A P A ==. II .相互独立事件相互独立事件(1)若,A B 相互独立.则()P AB =()()P A P B .(3)若A 与B 相互独立,则A 与B ,A 与B ,A 与B 也都相互独立. III .独立重复试验与二项分布独立重复试验与二项分布在n 次独立重复试验中,事件A 发生k 次的概率为(每次试验中事件A 发生的概率为p)()C 1n kkknp p --,事件A 发生的次数是一个随机变量X ,其分布列为()01)2()C 1(n kk knP X k k n p p -===-¼,,,,,此时称随机变量X 服从二项分布. 学科*网3.离散型随机变量的数学期望(均值)与方差 (1)若离散型随机变量X 的概率分布列为的概率分布列为X x 1 x 2 … x i … x n P p 1 p 2 … p i … p n则称EX =1122i i n n x p x p x p x p ++++¼+¼为随机变量X 的均值或数学期望. (2)若Y aX b =+,则EY =aEX b +,)(D aX b +=2a DX (3)若()X B n p ~,,则EX np =.()(1)D X np p -=. 4.正态分布(1)正态曲线的性质:正态曲线的性质:①曲线位于x 轴上方,与x 轴不相交;②曲线是单峰的,它关于直线x m =对称;③曲线在x m=处达到峰值12πs;④曲线与x 轴之间的面积为1;⑤当s 一定时,曲线的位置由m 确定,曲线随着m 的变化而沿x 轴平移,⑥当m 一定时,曲线的形状由s 确定,s 越小,曲线越“瘦高”,表示总体的分布越集中;s 越大,曲线越“矮胖”,表示总体的分布越分散,如图乙所示.(3)服从正态分布的变量在三个特殊区间内取值的概率服从正态分布的变量在三个特殊区间内取值的概率 ①0().6826P X m s m s -<+=…;②2209().544P X m s m s -<+=…; ③3309().974P X m s m s -<+=…. 二、统计与统计案例 (一)抽样方法 1.简单随机抽样设一个总体含有N 个个体,从中逐个不放回地抽取n 个个体作为样本()n N …,如果每次抽取时总体内的各个个体被抽到的机会都相等,就把这种抽样方法叫做简单随机抽样,最常用的简单随机抽样的方法:抽签法和随机数表法.最常用的简单随机抽样的方法:抽签法和随机数表法. 2.系统抽样的步骤假设要从容量为N 的总体中抽取容量为n 的样本.的样本.(1)先将总体的N 个个体编号.(2)确定分段间隔k ,对编号进行分段,当Nn是整数时,取N k n =.如果遇到Nn不是整数的情况,可以先从总体中随机地剔除几个个体,使得总体中剩余的个体数能被样本容量整除得总体中剩余的个体数能被样本容量整除(3)在第1段用简单随机抽样确定第一个个体编号()l l k ….(4)按照一定的规则抽取样本,通常是将l 加上间隔k 得到第2个个体编号()l k +,再加k 得到第3个个体编号()2l k +,依次进行下去,直到获取整个样本.直到获取整个样本.3.分层抽样在抽样时,将总体分成互不交叉的层,然后按照一定的比例,从各层独立地抽取一定数量的个体,将各层取出的个体合在一起作为样本,这种抽样方法是一种分层抽样.分层抽样的应用范围:当总体是由差异明显的几个部分组成的,往往选用分层抽样.层抽样.注:注:不论哪种抽样方法不论哪种抽样方法,总体中的每一个个体入样的概率是相同的. (二)统计图表的含义 1.作频率分布直方图的步骤(1)求极差(即一组数据中最大值与最小值的差).(2)决定组距和组数.(3)将数据分组.(4)列频率分布表.列频率分布表. (5)画频率分布直方图.画频率分布直方图. (三)样本的数字特征1.众数:在一组数据中,出现次数最多的数据叫做这组数据的众数.出现次数最多的数据叫做这组数据的众数.2.中位数:将一组数据按大小依次排列,把处在中间位置的一个数据(或中间两个数据的平均数)叫做这组数据的中位数叫做这组数据的中位数3.平均数:样本数据的算术平均数,即x =()121n x x x n+++.4.方差:()()()2222121n s x x x x x x n éù=-+-++-êúëû(n x 是样本数据,n 是样本容量,x 是样本平均数).5.标准差:()()()222121ns x x x x x x n éù=-+-++-êúëû.(四)线性回归直线方程 1.两个变量的线性相关(1)如果散点图中点的分布从整体上看大致在一条直线附近,我们就称这两个变量之间具有线性相关关系,这条直线叫回归直线.(2)从散点图上看,如果点分布在从左下角到右上角的区域内,那么两个变量的这种相关关系称为正相关;如果点分布在从左上角到右下角的区域内,那么两个变量的这种相关关系称为负相关. (3)相关系数相关系数r =ååå===----ni nj jini i i y y x x y y x x 11221)()())((,当0r >时,表示两个变量正相关;当0r <时,表示两个变量负相关.r 的绝对值越接近1,表示两个变量的线性相关性越强;r 的绝对值越接近0,表示两个变量的线性相关性越弱.通常当r 的绝对值大于0.75时,便认为两个变量具有很强的线性相关关系.当1r =时,两个变量在回归直线上两个变量在回归直线上 2.回归直线方程 (1)通过求21()ni i i Qy x a b ==--å的最小值而得出回归直线的方法,即使得样本数据的点到回归直线的距离的平方和最小的方法叫做最小二乘法.该式取最小值时的a ,b 的值即分别为aˆ,b ˆ. (2)两个具有线性相关关系的变量的一组数据:11(,)x y ,22(,)x y ,…,()n n x y ,,其回归方程为a x b y ˆˆˆ+=,则1122211()()ˆ()ˆˆnn i i i i i i n ni ii i x x y y x y nx yb x x x nxa y bx ====ì---×ï==ïí--ïï=-ïîåååå.注:样本点的中心(),x y 一定在回归直线上. (3)相关系数22121ˆ()1()n i ii ni i y yR y y ==-å=--å.2R 越大,说明残差平方和越小,即模型的拟合效果越好;2R 越小,残差平方和越大,即模型的拟合效果越差.在线性回归模型中,2R表示解释变量对于预报变量变化的贡献率,2R 越接近于1,表示回归的效果越好. (六)独立性检验(1)变量的不同“值”表示个体所属的不同类别,像这样的变量称为分类变量.像这样的变量称为分类变量.(2)像下表所示列出两个分类变量的频数表,称为列联表.假设有两个分类变量X和Y ,它们的可能取值分别为12(,)x x 和12(,)y y ,其样本频数列联表(称为22´列联表)为表)为y 1 y 2 总计总计x 1 a b a b + x 2 cdc d +总计a c +b d +a b c d +++构造一个随机变量()()()()()22n ad bc K a b c d a c b d -=++++ ,其中n a b c d =+++为样本容量.确定临界值0k ,如果2K 的观测值0k k …,就认为“两个分类变量之间有关系”;否则就认为“两个分类变量之间没有关系”.。
高中数学知识点总结统计与概率
高中数学知识点总结统计与概率高中数学知识点总结——统计与概率统计与概率是高中数学中的一个重要分支,它涉及到数据的收集、整理、分析,以及随机事件的概率计算等内容。
本文将对高中数学中的统计与概率知识点进行总结和解析。
一、统计学基础1. 总体和样本在统计学中,所研究的对象被称为总体,而从总体中选取的一部分元素被称为样本。
样本是对总体的一种抽样,通过对样本的研究来了解总体的特征。
2. 参数与统计量总体的特征可以用参数来描述,例如总体的均值、标准差等。
而样本的特征可以用统计量来描述,例如样本的均值、标准差等。
通过对样本的统计量进行分析,可以推断总体的参数。
3. 频数和频率统计学中常用到的两个概念是频数和频率。
频数指某个特定数值在样本或总体中出现的次数,频率指频数与样本或总体的大小之比,通常以百分比表示。
二、统计图表1. 条形图条形图是一种用长方形的长度表示各种数据间比较大小的图表形式。
它适用于展示不同类别的数量或比例的差异。
2. 折线图折线图通过在坐标系上连接数据点,在时间序列上展示数据的变化趋势,是描述连续数据变化情况的一种图表形式。
3. 散点图散点图用来展示两个变量之间的关系,其中每个数据点代表一个样本,横坐标表示一个变量,纵坐标表示另一个变量。
4. 饼图饼图是将一个圆分成若干部分,每个部分的面积与相应类别的频数或频率成比例,用于展示不同类别在总体中的占比情况。
三、概率论基础1. 随机事件与样本空间随机事件是指在一次实验中可能发生、也可能不发生的事件。
样本空间是指所有可能结果的集合。
随机事件可以用样本空间中的子集来表示。
2. 频率与概率频率是指某个事件在相同条件下重复实验中出现的频率,概率是指某个事件发生的可能性大小。
频率与概率之间存在着一种近似关系。
3. 条件概率与独立事件条件概率是指在某个事件已经发生的条件下,其他事件发生的概率。
如果两个事件的发生互不影响,即一个事件的发生不会改变另一个事件发生的概率,那么这两个事件是独立事件。
高中数学统计与概率知识点
1.总体和样本在统计学中 , 把研究对象的全体叫做总体.把每个研究对象叫做个体.把总体中个体的总数叫做总体容量.为了研究总体的有关性质,一般从总体中随机抽取一部分:,,,研究,我们称它为样本.其中个体的个数称为样本容量.2.简单随机抽样,也叫纯随机抽样。
就是从总体中不加任何分组、划类、排队等,完全随机地抽取调查单位。
特点是:每个样本单位被抽中的可能性相同(概率相等),样本的每个单位完全独立,彼此间无一定的关联性和排斥性。
简单随机抽样是其它各种抽样形式的基础。
通常只是在总体单位之间差异程度较小和数目较少时,才采用这种方法。
3.简单随机抽样常用的方法:(1)抽签法;⑵随机数表法;⑶计算机模拟法;⑷使用统计软件直接抽取。
在简单随机抽样的样本容量设计中,主要考虑:①总体变异情况;②允许误差范围;③概率保证程度。
4.抽签法:(1)给调查对象群体中的每一个对象编号;(2)准备抽签的工具,实施抽签(3)对样本中的每一个个体进行测量或调查例:请调查你所在的学校的学生做喜欢的体育活动情况。
5.随机数表法:例:利用随机数表在所在的班级中抽取10位同学参加某项活动。
6.系统抽样(等距抽样或机械抽样):把总体的单位进行排序,再计算出抽样距离,然后按照这一固定的抽样距离抽取样本。
第一个样本采用简单随机抽样的办法抽取。
K (抽样距离)=N (总体规模)/n (样本规模)前提条件:总体中个体的排列对于研究的变量来说,应是随机的,即不存在某种与研究变量相关的规则分布。
可以在调查允许的条件下,从不同的样本开始抽样,对比几次样本的特点。
如果有明显差别,说明样本在总体中的分布承某种循环性规律,且这种循环和抽样距离重合。
7.系统抽样,即等距抽样是实际中最为常用的抽样方法之一。
因为它对抽样框的要求较低,实施也比较简单。
更为重要的是,如果有某种与调查指标相关的辅助变量可供使用,总体单元按辅助变量的大小顺序排队的话,使用系统抽样可以大大提高估计精度。
高中数学概率和统计知识点
高中数学之概率与统计求等可能性事件、互斥事件和相互独立事件的概率解此类题目常应用以下知识:(1)等可能性事件(古典概型)的概率:P(A)=)()(I card A card =n m; 等可能事件概率的计算步骤:计算一次试验的基本事件总数n ;设所求事件A ,并计算事件A 包含的基本事件的个数m ; 依公式()mP A n =求值;答,即给问题一个明确的答复.(2)互斥事件有一个发生的概率:P(A +B)=P(A)+P(B); 特例:对立事件的概率:P(A)+P(A )=P(A +A )=1. (3)相互独立事件同时发生的概率:P(A ·B)=P(A)·P(B); 特例:独立重复试验的概率:Pn(k)=kn k k n p p C --)1(.其中P 为事件A 在一次试验中发生的概率,此式为二项式[(1-P)+P]n 展开的第k+1项.(4)解决概率问题要注意“四个步骤,一个结合”:求概率的步骤是:第一步,确定事件性质⎧⎪⎪⎨⎪⎪⎩等可能事件互斥事件 独立事件 n 次独立重复试验即所给的问题归结为四类事件中的某一种.第二步,判断事件的运算⎧⎨⎩和事件积事件即是至少有一个发生,还是同时发生,分别运用相加或相乘事件.第三步,运用公式()()()()()()()()(1)kk n k n n m P A nP A B P A P B P A B P A P B P k C p p -⎧=⎪⎪⎪+=+⎨⎪⋅=⋅⎪=-⎪⎩等可能事件: 互斥事件: 独立事件: n 次独立重复试验:求解第四步,答,即给提出的问题有一个明确的答复.例1.在五个数字12345,,,,中,若随机取出三个数字,则剩下两个数字都是奇数的概率是 (结果用数值表示).[解答过程]0.3提示:1335C 33.54C 102P ===⨯例2.一个总体含有100个个体,以简单随机抽样方式从该总体中抽取一个容量为5的样本,则指定的某个个体被抽到的概率为 .[解答过程]1.20提示:51.10020P == 例3.接种某疫苗后,出现发热反应的概率为0.80.现有5人接种该疫苗,至少有3人出现发热反应的概率为__________.(精确到0.01)[考查目的] 本题主要考查运用组合、概率的基本知识和分类计数原理解决问题的能力,以及推理和运算能力.[解答提示]至少有3人出现发热反应的概率为33244555550.800.200.800.200.800.94C C C ⋅⋅+⋅⋅+⋅=.故填0.94.离散型随机变量的分布列 1.随机变量及相关概念①随机试验的结果可以用一个变量来表示,这样的变量叫做随机变量,常用希腊字母ξ、η等表示.②随机变量可能取的值,可以按一定次序一一列出,这样的随机变量叫做离散型随机变量. ③随机变量可以取某区间内的一切值,这样的随机变量叫做连续型随机变量. 2.离散型随机变量的分布列①离散型随机变量的分布列的概念和性质一般地,设离散型随机变量ξ可能取的值为1x ,2x ,……,i x ,……,ξ取每一个值i x (=i 1,2,……)的概率P (i x =ξ)=i P ,则称下表.为随机变量ξ的概率分布,简称ξ的分布列.由概率的性质可知,任一离散型随机变量的分布列都具有下述两个性质: (1)0≥i P ,=i 1,2,…;(2)++21P P …=1. ②常见的离散型随机变量的分布列: (1)二项分布n 次独立重复试验中,事件A 发生的次数ξ是一个随机变量,其所有可能的取值为0,1,2,…n ,并且kn k k n k q p C k P P -===)(ξ,其中n k ≤≤0,p q -=1,随机变量ξ的分布列如下:称这样随机变量ξ服从二项分布,记作),(~p n B ξ,其中n 、p 为参数,并记:),;(p n k b q p C kn k k n =- .(2) 几何分布在独立重复试验中,某事件第一次发生时所作的试验的次数ξ是一个取值为正整数的离散型随机变量,“k ξ=”表示在第k 次独立重复试验时事件第一次发生. 随机变量ξ的概率分布为:例1.厂家在产品出厂前,需对产品做检验,厂家将一批产品发给商家时,商家按合同规定也需随机抽取一定数量的产品做检验,以决定是否接收这批产品.(Ⅰ)若厂家库房中的每件产品合格的概率为0.8,从中任意取出4件进行检验,求至少有1件是合格的概率;(Ⅱ)若厂家发给商家20件产品中,其中有3件不合格,按合同规定该商家从中任取2件.都进行检验,只有2件都合格时才接收这批产品.否则拒收,求出该商家检验出不合格产品数ξ的分布列及期望ξE ,并求出该商家拒收这批产品的概率.[解答过程](Ⅰ)记“厂家任取4件产品检验,其中至少有1件是合格品”为事件A 用对立事件A 来算,有()()4110.20.9984P A P A =-=-=(Ⅱ)ξ可能的取值为0,1,2.()2172201360190C P C ξ===, ()11317220511190C C P C ξ===,()2322032190C P C ξ===136513301219019019010E ξ=⨯+⨯+⨯=.记“商家任取2件产品检验,都合格”为事件B ,则商家拒收这批产品的概率()136271119095P P B =-=-=.所以商家拒收这批产品的概率为2795.例12.某项选拔共有三轮考核,每轮设有一个问题,能正确回答问题者进入下一轮考核,否则即被淘汰. 已知某选手能正确回答第一、二、三轮的问题的概率分别为54、53、52,且各轮问题能否正确回答互不影响.(Ⅰ)求该选手被淘汰的概率;(Ⅱ)该选手在选拔中回答问题的个数记为ξ,求随机变量ξ的分布列与数学期望. (注:本小题结果可用分数表示)[解答过程]解法一:(Ⅰ)记“该选手能正确回答第i 轮的问题”的事件为(123)i A i =,,,则14()5P A =,23()5P A =,32()5P A =,∴该选手被淘汰的概率112223112123()()()()()()()P P A A A A A A P A P A P A P A P A P A =++=++142433101555555125=+⨯+⨯⨯=.(Ⅱ)ξ的可能值为123,,,11(1)()5P P A ξ===,1212428(2)()()()5525P P A A P A P A ξ====⨯=, 12124312(3)()()()5525P P A A P A P A ξ====⨯=.ξ∴的分布列为11235252525E ξ∴=⨯+⨯+⨯=.解法二:(Ⅰ)记“该选手能正确回答第i 轮的问题”的事件为(123)i A i =,,,则14()5P A =,23()5P A =,32()5P A =.∴该选手被淘汰的概率1231231()1()()()P P A A A P A P A P A =-=-4321011555125=-⨯⨯=. (Ⅱ)同解法一.离散型随机变量的期望与方差随机变量的数学期望和方差 (1)离散型随机变量的数学期望:++=2211p x p x E ξ…;期望反映随机变量取值的平均水平.⑵离散型随机变量的方差:+-+-=222121)()(p E x p E x D ξξξ…+-+n n p E x 2)(ξ…;方差反映随机变量取值的稳定与波动,集中与离散的程度.⑶基本性质:b aE b a E +=+ξξ)(;ξξD a b a D 2)(=+.(4)若ξ~B(n ,p),则 np E =ξ ; D ξ =npq (这里q=1-p ) ;如果随机变量ξ服从几何分布,),()(p k g k P ==ξ,则p E 1=ξ,D ξ =2p q 其中q=1-p.例1.甲、乙两名工人加工同一种零件,两人每天加工的零件数相等,所得次品数分别为ε、η,ε和η的分布列如下:则比较两名工人的技术水平的高低为 .思路:一是要比较两名工人在加工零件数相等的条件下出次品数的平均值,即期望;二是要看出次品数的波动情况,即方差值的大小.解答过程:工人甲生产出次品数ε的期望和方差分别为:7.0103210111060=⨯+⨯+⨯=εE ,891.0103)7.02(101)7.01(106)7.00(222=⨯-+⨯-+⨯-=εD ;工人乙生产出次品数η的期望和方差分别为:7.0102210311050=⨯+⨯+⨯=ηE ,664.0102)7.02(103)7.01(105)7.00(222=⨯-+⨯-+⨯-=ηD由E ε=E η知,两人出次品的平均数相同,技术水平相当,但D ε>D η,可见乙的技术比较稳定.小结:期望反映随机变量取值的平均水平;方差反映随机变量取值的稳定与波动,集中与离散的程度. 例2.某商场经销某商品,根据以往资料统计,顾客采用的付款期数ξ的分布列为商场经销一件该商品,采用1期付款,其利润为200元;分2期或3期付款,其利润为250元;分4期或5期付款,其利润为300元.η表示经销一件该商品的利润.(Ⅰ)求事件A :“购买该商品的3位顾客中,至少有1位采用1期付款”的概率()P A ;(Ⅱ)求η的分布列及期望E η.[解答过程](Ⅰ)由A 表示事件“购买该商品的3位顾客中至少有1位采用1期付款”. 知A 表示事件“购买该商品的3位顾客中无人采用1期付款”2()(10.4)0.216P A =-=, ()1()10.2160.784P A P A =-=-=.(Ⅱ)η的可能取值为200元,250元,300元.(200)(1)0.4P P ηξ====,(250)(2)(3)0.20.20.4P P P ηξξ===+==+=,(300)1(200)(250)10.40.40.2P P P ηηη==-=-==--=.η的分布列为2000.42500.43000.2E η=⨯+⨯+⨯240=(元).抽样方法与总体分布的估计 抽样方法1.简单随机抽样:设一个总体的个数为N ,如果通过逐个抽取的方法从中抽取一个样本,且每次抽取时各个个体被抽到的概率相等,就称这样的抽样为简单随机抽样.常用抽签法和随机数表法.2.系统抽样:当总体中的个数较多时,可将总体分成均衡的几个部分,然后按照预先定出的规则,从每一部分抽取1个个体,得到所需要的样本,这种抽样叫做系统抽样(也称为机械抽样).3.分层抽样:当已知总体由差异明显的几部分组成时,常将总体分成几部分,然后按照各部分所占的比进行抽样,这种抽样叫做分层抽样. 总体分布的估计由于总体分布通常不易知道,我们往往用样本的频率分布去估计总体的分布,一般地,样本容量越大,这种估计就越精确.总体分布:总体取值的概率分布规律通常称为总体分布.当总体中的个体取不同数值很少时,其频率分布表由所取样本的不同数值及相应的频率表示,几何表示就是相应的条形图.当总体中的个体取值在某个区间上时用频率分布直方图来表示相应样本的频率分布.总体密度曲线:当样本容量无限增大,分组的组距无限缩小,那么频率分布直方图就会无限接近于一条光滑曲线,即总体密度曲线. 典型例题例1.某工厂生产A 、B 、C 三种不同型号的产品,产品数量之比依次为2:3:5.现用分层抽样方法抽出一个容量为n 的样本,样本中A 种型号产品有16件.那么此样本的容量n= .解答过程:A 种型号的总体是210,则样本容量n=1016802⨯=.例2.一个总体中有100个个体,随机编号0,1,2,…,99,依编号顺序平均分成10个小组,组号依次为1,2,3,…,10.现用系统抽样方法抽取一个容量为10的样本,规定如果在第1组随机抽取的号码为m ,那么在第k 组中抽取的号码个位数字与m k +的个位数字相同,若6m =,则在第7组中抽取的号码是 .解答过程:第K 组的号码为(1)10k - ,(1)101k -+,…,(1)109k -+,当m=6时,第k 组抽取的号的个位数字为m+k 的个位数字,所以第7组中抽取的号码的个位数字为3 ,所以抽取号码为63.正态分布与线性回归 1.正态分布的概念及主要性质(1)正态分布的概念如果连续型随机变量ξ 的概率密度函数为 222)(21)(σμπσ--=x ex f ,x R ∈ 其中σ、μ为常数,并且σ>0,则称ξ服从正态分布,记为~N ξ(μ,2σ).(2)期望E ξ =μ,方差2σξ=D .(3)正态分布的性质 正态曲线具有下列性质:①曲线在x 轴上方,并且关于直线x =μ对称.②曲线在x=μ时处于最高点,由这一点向左右两边延伸时,曲线逐渐降低.③曲线的对称轴位置由μ确定;曲线的形状由σ确定,σ越大,曲线越“矮胖”;反之越“高瘦”.三σ原则即为数值分布在(μ—σ,μ+σ)中的概率为0.6526 数值分布在(μ—2σ,μ+2σ)中的概率为0.9544 数值分布在(μ—3σ,μ+3σ)中的概率为0.9974 (4)标准正态分布当μ=0,σ=1时ξ服从标准的正态分布,记作~N ξ(0,1) (5)两个重要的公式①()1()x x φφ-=-,② ()()()P a b b a ξφφ<<=-.(6)2(,)N μσ与(0,1)N 二者联系.若2~(,)N ξμσ,则~(0,1)N ξμησ-=;②若2~(,)N ξμσ,则()()()b a P a b μμξφφσσ--<<=-.2.线性回归简单的说,线性回归就是处理变量与变量之间的线性关系的一种数学方法.变量和变量之间的关系大致可分为两种类型:确定性的函数关系和不确定的函数关系.不确定性的两个变量之间往往仍有规律可循.回归分析就是处理变量之间的相关关系的一种数量统计方法.它可以提供变量之间相关关系的经验公式.具体说来,对n 个样本数据(11,x y ),(22,x y ),…,(,n n x y ),其回归直线方程,或经验公式为:a bx y+=ˆ.其中,,)(1221x b y a x n xyx n yx b ni ini ii⋅-=--=∑∑==,其中y x ,分别为|i x |、|i y |的平均数.例1.如果随机变量ξ~N (μ,σ2),且E ξ=3,D ξ=1,则P (-1<ξ≤1=等于( ) A.2Φ(1)-1 B.Φ(4)-Φ(2) C.Φ(2)-Φ(4) D.Φ(-4)-Φ(-2)解答过程:对正态分布,μ=E ξ=3,σ2=D ξ=1,故P (-1<ξ≤1)=Φ(1-3)-Φ(-1-3)=Φ(-2)-Φ(-4)=Φ(4)-Φ(2). 答案:B例2. 将温度调节器放置在贮存着某种液体的容器内,调节器设定在d ℃,液体的温度ξ(单位:℃)是一个随机变量,且ξ~N (d ,0.52). (1)若d=90°,则ξ<89的概率为 ; (2)若要保持液体的温度至少为80 ℃的概率不低于0.99,则d 至少是 ?(其中若η~N (0,1),则Φ(2)=P (η<2)=0.9772,Φ(-2.327)=P (η<-2.327)=0.01).解答过程:(1)P (ξ<89)=F (89)=Φ(5.09089-)=Φ(-2)=1-Φ(2)=1-0.9772=0.0228.(2)由已知d 满足0.99≤P (ξ≥80),即1-P (ξ<80)≥1-0.01,∴P (ξ<80)≤0.01.∴Φ(5.080d-)≤0.01=Φ(-2.327).∴5.080d -≤-2.327.∴d ≤81.1635.故d 至少为81.1635.小结:(1)若ξ~N (0,1),则η=σμξ-~N (0,1).(2)标准正态分布的密度函数f (x )是偶函数,x<0时,f (x )为增函数,x>0时,f (x )为减函数.。
高中数学知识点第十二章-概率与统计
高中数学知识点第十二章-概率与统计 考试内容:抽样方法.总体分布的估计. 总体期望值和方差的估计. 考试要求:(1)了解随机抽样了解分层抽样的意义,会用它们对简单实际问题进行抽样. (2)会用样本频率分布估计总体分布. (3)会用样本估计总体期望值和方差.§12. 概率与统计 知识要点一、随机变量.1. 随机试验的结构应该是不确定的.试验如果满足下述条件: ①试验可以在相同的情形下重复进行;②试验的所有可能结果是明确可知的,并且不止一个;③每次试验总是恰好出现这些结果中的一个,但在一次试验之前却不能肯定这次试验会出现哪一个结果.它就被称为一个随机试验.2. 离散型随机变量:如果对于随机变量可能取的值,可以按一定次序一一列出,这样的随机变量叫做离散型随机变量.若ξ是一个随机变量,a ,b 是常数.则b a +=ξη也是一个随机变量.一般地,若ξ是随机变量,)(x f 是连续函数或单调函数,则)(ξf 也是随机变量.也就是说,随机变量的某些函数也是随机变量.设离散型随机变量ξ可能取的值为: ,,,,21i x x xξ取每一个值),2,1(1 =i x 的概率i i p x P ==)(ξ,则表称为随机变量ξ的概率分布,简称ξ的121i 注意:若随机变量可以取某一区间内的一切值,这样的变量叫做连续型随机变量.例如:]5,0[∈ξ即ξ可以取0~5之间的一切数,包括整数、小数、无理数.3. ⑴二项分布:如果在一次试验中某事件发生的概率是P ,那么在n 次独立重复试验中这个事件恰好发生k 次的概率是:kn k k n qp C k)P(ξ-==[其中p q n k -==1,,,1,0 ] 于是得到随机变量ξ的概率分布如下:我们称这样的随机变量ξ服从二项分布,记作ξ~B(n ·p ),其中n ,p 为参数,并记p)n b(k;qp C k n k k n ⋅=-. ⑵二项分布的判断与应用.①二项分布,实际是对n 次独立重复试验.关键是看某一事件是否是进行n 次独立重复,且每次试验只有两种结果,如果不满足此两条件,随机变量就不服从二项分布. ②当随机变量的总体很大且抽取的样本容量相对于总体来说又比较小,而每次抽取时又只有两种试验结果,此时可以把它看作独立重复试验,利用二项分布求其分布列. 4. 几何分布:“k =ξ”表示在第k 次独立重复试验时,事件第一次发生,如果把k 次试验时事件A 发生记为k A ,事A 不发生记为q )P(A ,A k k =,那么)A A A A P(k)P(ξk 1k 21-== .根据相互独立事件的概率乘法分式:))P(A A P()A )P(A P(k)P(ξk 1k 21-== ),3,2,1(1 ==-k p q k 于是我们称ξ服从几何分布,并记p q p)g(k,1k -=,其中 3,2,1.1=-=k p q5. ⑴超几何分布:一批产品共有N 件,其中有M (M <N )件次品,今抽取)N n n(1≤≤件,则其中的次品数ξ是一离散型随机变量,分布列为)M N k n M,0k (0CC C k)P(ξnNk n MN k M -≤-≤≤≤⋅⋅==--.〔分子是从M 件次品中取k 件,从N-M 件正品中取n-k 件的取法数,如果规定m <r 时0C rm=,则k 的范围可以写为k=0,1,…,n.〕 ⑵超几何分布的另一种形式:一批产品由 a 件次品、b 件正品组成,今抽取n 件(1≤n ≤a+b ),则次品数ξ的分布列为n.,0,1,k CC C k)P(ξnba kn bk a =⋅==+-.⑶超几何分布与二项分布的关系. 设一批产品由a 件次品、b 件正品组成,不放回抽取n 件时,其中次品数ξ服从超几何分布.若放回式抽取,则其中次品数η的分布列可如下求得:把b a +个产品编号,则抽取n 次共有n b a )(+个可能结果,等可能:k)(η=含kn k k n ba C -个结果,故n 0,1,2,k ,)ba a (1)b a a (C b)(a ba C k)P(ηkn k k n nkn k k n =+-+=+==--,即η~)(b a a n B +⋅.[我们先为k 个次品选定位置,共k n C 种选法;然后每个次品位置有a 种选法,每个正品位置有b 种选法] 可以证明:当产品总数很大而抽取个数不多时,k)P(ηk)P(ξ=≈=,因此二项分布可作为超几何分布的近似,无放回抽样可近似看作放回抽样.二、数学期望与方差.1. 期望的含义:一般地,若离散型随机变量ξ的概率分布为n n 2211.数学期望反映了离散型随机变量取值的平均水平.2. ⑴随机变量b a +=ξη的数学期望:b aE b a E E +=+=ξξη)( ①当0=a 时,b b E =)(,即常数的数学期望就是这个常数本身.②当1=a 时,b E b E +=+ξξ)(,即随机变量ξ与常数之和的期望等于ξ的期望与这个常数的和.③当0=b 时,ξξaE a E =)(,即常数与随机变量乘积的期望等于这个常数与随机变量期望的乘积.⑵单点分布:c c E =⨯=1ξ其分布列为:c P ==)1(ξ.⑶两点分布:p p q E =⨯+⨯=10ξ,其分布列为:(p +q = 1)⑷二项分布:∑=⋅-⋅=-np q pk n k n k E k n k)!(!!ξ 其分布列为ξ~),(p n B .(P 为发生ξ的概率)⑸几何分布:pE 1=ξ 其分布列为ξ~),(p k q .(P 为发生ξ的概率) 3.方差、标准差的定义:当已知随机变量ξ的分布列为),2,1()( ===k p x P k k ξ时,则称+-++-+-=n n p E x p E x p E x D 2222121)()()(ξξξξ为ξ的方差. 显然0≥ξD ,故σξξσξ.D =为ξ的根方差或标准差.随机变量ξ的方差与标准差都反映了随机变量ξ取值的稳定与波动,集中与离散的程度.ξD 越小,稳定性越高,波动越小............... 4.方差的性质.⑴随机变量b a +=ξη的方差ξξηD a b a D D 2)()(=+=.(a 、b 均为常数) ⑵单点分布:0=ξD 其分布列为p P ==)1(ξ ⑶两点分布:pq D =ξ 其分布列为:(p + q = 1)⑷二项分布:npq D =ξ ⑸几何分布:2p q D =ξ5. 期望与方差的关系.⑴如果ξE 和ηE 都存在,则ηξηξE E E ±=±)(⑵设ξ和η是互相独立的两个随机变量,则ηξηξηξξηD D D E E E +=+⋅=)(,)(⑶期望与方差的转化:22)(ξξξE E D -= ⑷)()()(ξξξξE E E E E -=-(因为ξE 为一常数)0=-=ξξE E .三、正态分布.(基本不列入考试范围)1.密度曲线与密度函数:对于连续型随机变量ξ,位于x 轴上方,ξ落在任一区间),[b a 内的概率等于它与x 轴.直线a x =与直线b x =(如图阴影部分)的曲线叫ξ的密度曲线,以其作为图像的函数)(x f 叫做ξ的密度函数,由于“),(+∞-∞∈x 是必然事件,故密度曲线与x 轴所夹部分面积等于1.2. ⑴正态分布与正态曲线:如果随机变量ξ的概率密度为:222)(21)(σμσπ--=x ex f .(σμ,,R x ∈为常数,且0 σ),称ξ服从参数为σμ,的正态分布,用ξ~),(2σμN 表示.)(x f 的表达式可简记为),(2σμN ,它的密度曲线简称为正态曲线.⑵正态分布的期望与方差:若ξ~),(2σμN ,则ξ的期望与方差分别为:2,σξμξ==D E . ⑶正态曲线的性质.①曲线在x 轴上方,与x 轴不相交. ②曲线关于直线μ=x 对称.③当μ=x 时曲线处于最高点,当x 向左、向右远离时,曲线不断地降低,呈现出“中间高、两边低”的钟形曲线.④当x <μ时,曲线上升;当x >μ时,曲线下降,并且当曲线向左、向右两边无限延伸时,以x 轴为渐近线,向x 轴无限的靠近.⑤当μ一定时,曲线的形状由σ确定,σ越大,曲线越“矮胖”.表示总体的分布越分散;σ越小,曲线越“瘦高”,表示总体的分布越集中.3. ⑴标准正态分布:如果随机变量ξ的概率函数为)(21)(22+∞-∞=-x ex x πϕ,则称ξ服从标准正态分布. 即ξ~)1,0(N 有)()(x P x ≤=ξϕ,)(1)(x x --=ϕϕ求出,而P (a <ξ≤b )的计算则是)()()(a b b a P ϕϕξ-=≤ .注意:当标准正态分布的)(x Φ的X 取0时,有5.0)(=Φx 当)(x Φ的X 取大于0的数时,有5.0)( x Φ.比如5.00793.0)5.0(=-Φσμ则σμ-5.0必然小于0,如图.⑵正态分布与标准正态分布间的关系:若ξ~),(2σμN 则ξ的分布函数通 常用)(x F 表示,且有)σμx (F(x)x)P(ξ-==≤ϕ.4.⑴“3σ”原则.假设检验是就正态总体而言的,进行假设检验可归结为如下三步:①提出统计假设,统计假设里的变量服从正态分布),(2σμN .②确定一次试验中的取值a 是否落入范围)3,3(σμσμ+-.③做出判断:如果)3,3(σμσμ+-∈a ,接受统计假设. 如果)3,3(σμσμ+-∉a ,由于这是小概率事件,就拒绝统计假设.⑵“3σ”原则的应用:若随机变量ξ服从正态分布),(2σμN 则 ξ落在)3,3(σμσμ+-内的概率为99.7% 亦即落在)3,3(σμσμ+-之外的概率为0.3%,此为小概率事件,如果此事件发生了,就说明此种产品不合格(即ξ不服从正态分布).S 阴=0.5S a =0.5+S。
高中数学《统计》与《概率》知识点
高中数学《统计》与《概率》知识点高中数学的《统计》和《概率》是数学领域中的两个重要分支,它们是数据分析、预测和决策制定等实际问题中必不可少的工具。
下面将详细介绍这两个知识点。
一、统计学是研究数据收集、整理、分析和解释的学科。
统计学的主要任务是从已有的数据中得出结论,进而得到有关总体的信息。
统计学的主要内容包括:1.描述统计:通过数值特征描述数据的中心位置、离散程度等。
描述统计包括以下几个方面:(1)集中趋势:主要有均值、中位数和众数。
均值是一组数据的平均值,中位数是一组数据中处于中间位置的数值,众数是一组数据中出现频率最高的数值。
(2)离散程度:主要有极差、方差和标准差。
极差是一组数据中最大数与最小数的差值,方差是各个数据与均值的差值的平方的平均值,标准差是方差的平方根。
(3)分布形状:主要有正态分布、偏态分布和峰态分布等类型。
2.探索性数据分析:根据数据特征进行初步探索,主要包括绘制直方图、饼图、箱线图等工具来分析数据分布和异常值。
3.概率论:概率是描述随机事件发生可能性的数值,涉及到概率的计算、随机变量及其分布、大数定律和中心极限定理等概念。
(1)概率的定义与性质:概率的定义有经典概率和条件概率等。
经典概率是指在等可能的情况下,一些事件发生的概率。
条件概率是指在已知一事件发生的条件下,另一事件发生的概率。
(2)随机变量与概率分布:随机变量是具有随机性的数值,可分为离散随机变量和连续随机变量。
离散随机变量取有限或可数个数值,其概率分布函数称为概率分布列;连续随机变量在一些区间上取值,其概率分布函数称为概率密度函数。
(3)大数定律与中心极限定理:大数定律是指随着试验次数的增加,频率逼近概率。
中心极限定理是指多个独立随机变量之和的分布近似于正态分布。
4.统计推断:通过样本数据推断总体特征,主要有参数估计和假设检验。
(1)参数估计:根据样本数据估计总体参数,主要有点估计和区间估计。
点估计是用一个数值来估计总体参数,区间估计是用一个区间来估计总体参数,有置信水平的概念。
高中数学概率统计知识点全归纳
高中数学《概率与统计》知识点总结一、统计1、抽样方法:①简单随机抽样(总体个数较少) ②系统抽样(总体个数较多) ③分层抽样(总体中差异明显)注意:在N 个个体的总体中抽取出n 个个体组成样本,每个个体被抽到的机会(概率)均为Nn 。
2、总体分布的估计: ⑴一表二图:①频率分布表——数据详实 ②频率分布直方图——分布直观③频率分布折线图——便于观察总体分布趋势 注:总体分布的密度曲线与横轴围成的面积为1。
⑵茎叶图:①茎叶图适用于数据较少的情况,从中便于看出数据的分布,以及中位数、众位数等。
②个位数为叶,十位数为茎,右侧数据按照从小到大书写,相同的数据重复写。
3、总体特征数的估计:⑴平均数:nx x x x x n++++= 321;取值为n x x x ,,,21 的频率分别为n p p p ,,,21 ,则其平均数为n n p x p x p x +++ 2211; 注意:频率分布表计算平均数要取组中值。
⑵方差与标准差:一组样本数据n x x x ,,,21 方差:212)(1∑=−=ni ix xns ;标准差:21)(1∑=−=ni ix xns注:方差与标准差越小,说明样本数据越稳定。
平均数反映数据总体水平;方差与标准差反映数据的稳定水平。
⑶线性回归方程①变量之间的两类关系:函数关系与相关关系; ②制作散点图,判断线性相关关系③线性回归方程:a bx y +=∧(最小二乘法)1221ni i i nii x y nx y b x nx a y bx==⎧−⎪⎪=⎪⎨−⎪⎪=−⎪⎩∑∑ 注意:线性回归直线经过定点),(y x 。
二、概率1、随机事件及其概率:⑴事件:试验的每一种可能的结果,用大写英文字母表示; ⑵必然事件、不可能事件、随机事件的特点; ⑶随机事件A 的概率:1)(0,)(≤≤=A P nmA P . 2、古典概型:⑴基本事件:一次试验中可能出现的每一个基本结果; ⑵古典概型的特点:①所有的基本事件只有有限个; ②每个基本事件都是等可能发生。
高一必修二数学统计与概率
高一必修二数学统计与概率摘要:一、统计与概率的基本概念1.统计学的定义与作用2.概率论的定义与作用3.统计与概率的关系二、数据的收集与整理1.数据的来源与分类2.数据的收集方法3.数据的整理与展示三、描述性统计分析1.频数与频率分布2.图表法3.统计量度四、概率的基本概念与运算1.随机事件与样本空间2.概率的公理化定义3.概率的运算五、条件概率与独立性1.条件概率2.独立性3.贝叶斯公式六、随机变量及其分布1.随机变量的定义与性质2.离散型随机变量3.连续型随机变量七、数学期望与方差1.数学期望2.方差与标准差3.协方差与相关系数正文:在我国高中数学课程中,必修二数学统计与概率是高一阶段的重要内容。
本章主要介绍统计与概率的基本概念、数据的收集与整理、描述性统计分析、概率的基本概念与运算、条件概率与独立性、随机变量及其分布以及数学期望与方差等方面的知识。
首先,统计学是一门研究如何收集、整理、分析、解释以及展示数据的方法论,它具有广泛的应用,如在科学研究、企业管理、政府决策等方面都发挥着重要作用。
概率论则是一门研究随机现象的理论,通过研究随机现象发生的可能性,可以对未来事件进行预测。
统计与概率之间存在密切的联系,统计学中的许多方法都基于概率论的理论。
数据的收集与整理是统计分析的基础。
数据来源于各种渠道,包括实验数据、观测数据和调查数据等。
数据的整理主要包括数据的分类、排序、汇总等操作,而数据的展示则有图表法、描述性统计量度等方法。
描述性统计分析是统计学的一个重要分支,主要通过频数与频率分布、图表法以及统计量度等方法来概括和描述数据的基本特征。
在概率论部分,我们学习随机事件与样本空间、概率的公理化定义以及概率的运算等基本概念。
条件概率与独立性是概率论中的重要内容,通过学习这部分知识,我们可以更好地处理复杂事件之间的概率关系。
此外,贝叶斯公式是一种在概率论中广泛应用的计算工具,它可以帮助我们根据已知信息来更新对未知事件的概率估计。
高中数学统计与概率知识点归纳(全)
高中数学统计与概率知识点(文)一、众数: 一组数据中出现次数最多的那个数据。
众数与平均数的区别: 众数表示一组数据中出现次数最多的那个数据;平均数是一组数据中表示平均每份的数量。
二、.中位数: 一组数据按大小顺序排列,位于最中间的一个数据(当有偶数个数据时,为最中间两个数据的平均数)三 .众数、中位数及平均数的求法。
①众数由所给数据可直接求出;②求中位数时,首先要先排序(从小到大或从大到小),然后根据数据的个数,当数据为奇数个时,最中间的一个数就是中位数;当数据为偶数个时,最中间两个数的平均数就是中位数。
③求平均数时,就用各数据的总和除以数据的个数,得数就是这组数据的平均数。
四、中位数与众数的特点。
⑴中位数是一组数据中唯一的,可能是这组数据中的数据,也可能不是这组数据中的数据; ⑵求中位数时,先将数据有小到大顺序排列,若这组数据是奇数个,则中间的数据是中位数;若这组数据是偶数个时,则中间的两个数据的平均数是中位数; ⑶中位数的单位与数据的单位相同; ⑷众数考察的是一组数据中出现的频数;⑸众数的大小只与这组数的个别数据有关,它一定是一组数据中的某个数据,其单位与数据的单位相同;(6)众数可能是一个或多个甚至没有;(7)平均数、众数和中位数都是描述一组数据集中趋势的量。
五.平均数、中位数与众数的异同:⑴平均数、众数和中位数都是描述一组数据集中趋势的量; ⑵平均数、众数和中位数都有单位; ⑶平均数反映一组数据的平均水平,与这组数据中的每个数都有关系,所以最为重要,应用最广; ⑷中位数不受个别偏大或偏小数据的影响;⑸众数与各组数据出现的频数有关,不受个别数据的影响,有时是我们最为关心的数据。
六、对于样本数据x 1,x 2,…,x n ,设想通过各数据到其平均数的平均距离来反映样本数据的分散程度,那么这个平均距离如何计算?思考4:反映样本数据的分散程度的大小,最常用的统计量是标准差,一般用s 表示.假设样本数据x 1,x 2,…,x n 的平均数为x ,则标准差的计算公式是:七、简单随即抽样的含义一般地,设一个总体有N 个个体, 从中逐个不放回地抽取n 个个体作为样本(n≤N), 如果每次12||||||n x x xx x x n22212()()()n x x x x x x sn抽取时总体内的各个个体被抽到的机会都相等, 则这种抽样方法叫做简单随机抽样.八、根据你的理解,简单随机抽样有哪些主要特点?(1)总体的个体数有限;(2)样本的抽取是逐个进行的,每次只抽取一个个体;(3)抽取的样本不放回,样本中无重复个体;(4)每个个体被抽到的机会都相等,抽样具有公平性.九、抽签法的操作步骤?第一步,将总体中的所有个体编号,并把号码写在形状、大小相同的号签上.第二步,将号签放在一个容器中,并搅拌均匀第三步,每次从中抽取一个号签,连续抽取n次,就得到一个容量为n的样本.十一、抽签法有哪些优点和缺点?优点:简单易行,当总体个数不多的时候搅拌均匀很容易,个体有均等的机会被抽中,从而能保证样本的代表性.缺点:当总体个数较多时很难搅拌均匀,产生的样本代表性差的可能性很大.十一、利用随机数表法从含有N个个体的总体中抽取一个容量为n的样本,其抽样步骤如何?第一步,将总体中的所有个体编号.第二步,在随机数表中任选一个数作为起始数.第三步,从选定的数开始依次向右(向左、向上、向下)读,将编号范围内的数取出,编号范围外的数去掉,直到取满n个号码为止,就得到一个容量为n的样本.简单随机抽样一般采用两种方法:抽签法和随机数表法。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
高中统计与概率知识点(文科)(一)统计一、简单随机抽样1.总体和样本在统计学中 , 把研究对象的全体叫做总体.把每个研究对象叫做个体.把总体中个体的总数叫做总体容量.为了研究总体的有关性质,一般从总体中随机抽取一部分:,,,研究,我们称它为样本.其中个体的个数称为样本容量.2.简单随机抽样,也叫纯随机抽样。
就是从总体中不加任何分组、划类、排队等,完全随机地抽取调查单位。
特点是:每个样本单位被抽中的可能性相同(概率相等),样本的每个单位完全独立,彼此间无一定的关联性和排斥性。
简单随机抽样是其它各种抽样形式的基础。
通常只是在总体单位之间差异程度较小和数目较少时,才采用这种方法。
3.简单随机抽样常用的方法:(1)抽签法;⑵随机数表法;⑶计算机模拟法;⑷使用统计软件直接抽取。
在简单随机抽样的样本容量设计中,主要考虑:①总体变异情况;②允许误差范围;③概率保证程度。
4.抽签法:(1)给调查对象群体中的每一个对象编号;(2)准备抽签的工具,实施抽签(3)对样本中的每一个个体进行测量或调查例:请调查你所在的学校的学生做喜欢的体育活动情况。
5.随机数表法:例:利用随机数表在所在的班级中抽取10位同学参加某项活动。
二、系统抽样1.系统抽样(等距抽样或机械抽样):把总体的单位进行排序,再计算出抽样距离,然后按照这一固定的抽样距离抽取样本。
第一个样本采用简单随机抽样的办法抽取。
K(抽样距离)=N(总体规模)/n(样本规模)前提条件:总体中个体的排列对于研究的变量来说,应是随机的,即不存在某种与研究变量相关的规则分布。
可以在调查允许的条件下,从不同的样本开始抽样,对比几次样本的特点。
如果有明显差别,说明样本在总体中的分布成某种循环性规律,且这种循环和抽样距离重合。
系统抽样,即等距抽样是实际中最为常用的抽样方法之一。
因为它对抽样框的要求较低,实施也比较简单。
更为重要的是,如果有某种与调查指标相关的辅助变量可供使用,总体单元按辅助变量的大小顺序排队的话,使用系统抽样可以大大提高估计精度。
三、分层抽样1.分层抽样(类型抽样):先将总体中的所有单位按照某种特征或标志(性别、年龄等)划分成若干类型或层次,然后再在各个类型或层次中采用简单随机抽样或系用抽样的办法抽取一个子样本,最后,将这些子样本合起来构成总体的样本。
两种方法:(1)先以分层变量将总体划分为若干层,再按照各层在总体中的比例从各层中抽取。
(2)先以分层变量将总体划分为若干层,再将各层中的元素按分层的顺序整齐排列,最后用系统抽样的方法抽取样本。
2.分层抽样是把异质性较强的总体分成一个个同质性较强的子总体,再抽取不同的子总体中的样本分别代表该子总体,所有的样本进而代表总体。
分层标准:(1)以调查所要分析和研究的主要变量或相关的变量作为分层的标准。
(2)以保证各层内部同质性强、各层之间异质性强、突出总体内在结构的变量作为分层变量。
(3)以那些有明显分层区分的变量作为分层变量。
3.分层的比例问题:(1)按比例分层抽样:根据各种类型或层次中的单位数目占总体单位数目的比重来抽取子样本的方法。
(2)不按比例分层抽样:有的层次在总体中的比重太小,其样本量就会非常少,此时采用该方法,主要是便于对不同层次的子总体进行专门研究或进行相互比较。
如果要用样本资料推断总体时,则需要先对各层的数据资料进行加权处理,调整样本中各层的比例,使数据恢复到总体中各层实际的比例结构。
四、用样本的频率分布估计总体分布1.频率分布直方图①组距与分组:样本容量越大,分组越多,当样本容量不超过100时,一般可分成5~12组,组距力求“取整”。
②直方图中小长方形的面积表示相应各组的频率,小长方形的面积之和为1。
③频率分布折线图:连接频率分布直方图中各小长方形上端的中点,就得到频率分布折线图。
2.茎叶图:茎是指中间的一列数,叶就是从茎的旁边生长出来的数,中间的数字表示得数的十位数,旁边的数字分别表示两个人得分的个位数.一般将各个数据的叶按大小次序写在茎的左右侧。
五、用样本的数字特征估计总体的数字特征1.平均数:n x x x x n+++= 212.极差:一组数据中的最大值减去最小值的差,它反映了这组数据的偏离程度.3.方差:4.标准差:n x x x x x x s s n 222212)()()(-++-+-== ,标准差越小越稳定. 5.用样本估计总体时,如果抽样的方法比较合理,那么样本可以反映总体的信息,但从样本得到的信息会有偏差。
在随机抽样中,这种偏差是不可避免的。
虽然我们用样本数据得到的分布、均值和标准差并不是总体的真正分布、均值和标准差,而只是一个估计,但这种估计是合理的,特别是当样本量很大时,它们确实反映了总体的信息。
6.(1)如果把一组数据中的每一个数据都加上或减去同一个共同的常数,标准差不变(2)如果把一组数据中的每一个数据乘以一个共同的常数k ,标准差变为原来的k 倍(3)一组数据中的最大值和最小值对标准差的影响,区间)3,3(s x s x +-的应用;“去掉一个最高分,去掉一个最低分”中的科学道理7.如何从频率分布直方图估计样本的数字特征:① 中位数:在直方图中,中位数左边和右边的直方图的面积应该相等。
② 平均数:在直方图中,平均数等于每个小矩形的面积乘以小矩形底边中点的横坐标之和。
六、两个变量的线性相关1、概念:(1)回归直线方程:散点图中的点从整体上看分布在一条直线附近,这条直线叫回归直线.(2)回归系数:直线方程y=kx+b ,我们把直线方程记作:y=bx+a ,其中,a,b 叫做回归系数.b 是直线的斜率,a 是截距.2.最小二乘法3.直线回归方程的应用(1)描述两变量之间的依存关系;利用直线回归方程即可定量描述两个变量间依存的数量关系(2)利用回归方程进行预测;把预报因子(即自变量x )代入回归方程对预报量(即因变量Y )进行估计,即可得到个体Y 值的容许区间。
(3)利用回归方程进行统计控制规定Y 值的变化,通过控制x 的范围来实现统计控制的目标。
如已经得到了空气中NO 2的浓度和汽车流量间的回归方程,即可通过控制汽车流量来控制空气中NO 2的浓度。
(二)概 率随机事件的概率及概率的意义1、基本概念:(1)必然事件:在条件S 下,一定会发生的事件,叫相对于条件S 的必然事件;(2)不可能事件:在条件S 下,一定不会发生的事件,叫相对于条件S 的不可能事件;(3)确定事件:必然事件和不可能事件统称为相对于条件S 的确定事件;(4)随机事件:在条件S 下可能发生也可能不发生的事件,叫相对于条件S 的随机事件;(5)频数与频率:在相同的条件S 下重复n 次试验,观察某一事件A 是否出现,称n 次试验中事件A 出现的次数nA 为事件A 出现的频数;称事件A 出现的比例fn(A)=n n A为事件A 出现的概率:对于给定的随机事件A ,如果随着试验次数的增加,事件A 发生的频率fn(A)稳定在某个常数上,把这个常数记作P (A ),称为事件A 的概率。
(6)频率与概率的区别与联系:随机事件的频率,指此事件发生的次数nA 与试验总次数n 的比值n n A,它具有一定的稳定性,总在某个常数附近摆动,且随着试验次数的不断增多,这种摆动幅度越来越小。
我们把这个常数叫做随机事件的概率,概率从数量上反映了随机事件发生的可能性的大小。
频率在大量重复试验的前提下可以近似地作为这个事件的概率。
3.1.3 概率的基本性质1、基本概念:(1)事件的包含、并事件、交事件、相等事件(2)若A ∩B 为不可能事件,即A ∩B=ф,那么称事件A 与事件B 互斥;(3)若A ∩B 为不可能事件,A ∪B 为必然事件,那么称事件A 与事件B 互为对立事件;(4)当事件A 与B 互斥时,满足加法公式:P(A ∪B)= P(A)+ P(B);若事件A 与B 为对立事件,则A ∪B 为必然事件,所以P(A ∪B)= P(A)+ P(B)=1,于是有P(A)=1—P(B)2、概率的基本性质:1)必然事件概率为1,不可能事件概率为0,因此0≤P(A)≤1;2)当事件A 与B 互斥时,满足加法公式:P(A ∪B)= P(A)+ P(B);3)若事件A 与B 为对立事件,则A ∪B 为必然事件,所以P(A ∪B)= P(A)+ P(B)=1,于是有P(A)=1—P(B);4)互斥事件与对立事件的区别与联系,互斥事件是指事件A 与事件B 在一次试验中不会同时发生,其具体包括三种不同的情形:(1)事件A 发生且事件B 不发生;(2)事件A 不发生且事件B 发生;(3)事件A 与事件B 同时不发生,而对立事件是指事件A 与事件B 有且仅有一个发生,其包括两种情形;(1)事件A 发生B 不发生;(2)事件B 发生事件A 不发生,对立事件互斥事件的特殊情形。
3.2.1 —3.2.2古典概型及随机数的产生1、(1)古典概型的使用条件:试验结果的有限性和所有结果的等可能性。
(2)古典概型的解题步骤;①求出总的基本事件数;②求出事件A 所包含的基本事件数,然后利用公式P (A )=总的基本事件个数包含的基本事件数A3.3.1—3.3.2几何概型及均匀随机数的产生1、基本概念:(1)几何概率模型:如果每个事件发生的概率只与构成该事件区域的长度(面积或体积)成比例,则称这样的概率模型为几何概率模型;(2)几何概型的概率公式:P (A )=积)的区域长度(面积或体试验的全部结果所构成积)的区域长度(面积或体构成事件A ;(1) 几何概型的特点:1)试验中所有可能出现的结果(基本事件)有无限多个;2)每个基本事件出现的可能性相等.。