第六章 概率分布
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第六章概率分布
第一节概率的基本概念
一、什么是概率
概率指用一个比值来概括某事件出现的可能性大小。因为纯粹利用概率的概念是无法计算出概率的,所以它有几个用于不同情况下的计算办法:
(一)古典概率(先验概率)
基本事件:如果某一随机实验可以分成有限的n种可能结果,这n种结果之间是互不交叉的,而且这些结果出现的可能性相等,我们把这n种可能结果称为基本事件。如抛置骰子这一随机试验的基本事件为:{1}{2}{3}{4}{5}{6}。
基本事件必须具备如下的五个条件:
①等可能性:实验中基本事件发生的概率相等(根据对称性来判断)。
②互斥性:各个基本事件不可能在一次试验中同时发生,或者说一次试验中只能发生基本事件中的一个。
③完备性:一次试验中所有基本事件必然有一个发生,即所有基本事件概率之和为100%。
④有限性:全部结果只有有限的n种。
⑤不可再分性:不可能有比基本事件范围更小的事件。若把抛置骰子的基本事件取为:A={1,2,3},B={4,5,6},则它满足前面的所有4上条件,但它们可以再分。
古典概率的定义:在只含有有限个基本事件的试验中,任意事件A发生的概率定义为:
(二)统计概率(后验概率)
统计概率常用于随机现象不满足“基本事件等可能发生”的条件,或者某些试验不可能分为等可能的互不相交的事件。
在相同条件下进行n次试验,事件A出现了m次,如果试验次数n充分地大,且事件A
出现的频率稳定在某一数值p附近,则称p为事件A的概率。由于p也是一抽象的值,
常常用n在充分大时的代替。即:
。
二、概率的基本性质
1、概率的加法定理
两个互不相容事件A、B之和的概率,等于两个事件概率之和,P(A+B)=P(A)+P(B)
2、概率的乘法定理
两个独立事件同时出现的概率等于该两事件概率的乘积,P(AB)=P(A)×P(B)
例6-1:一枚硬币掷三次,或三枚硬币各掷一次,问出现两次或两次以上H的概率是多
少?
解:这样掷硬币可能出现地情况有:HHH,HHT,HTH,THH,TTH,THT,HTT,TTT 共八种。每种
结果可能出现的概率,依概率乘法规则计算: 各为1/8。 设:P(A)代表3次H 的概率,P(B)代表“HHT ”这种结果的概率,P(C)代表“HTH ”的概
率,P(D)代表“THH ”的概率,依概率加法规则计算: P(A+B+C+D)= P(A) +P(B) +P(C)+ P(D)
=
答:一枚硬币掷三次,或三枚硬币各掷一次,出现两次或两次以上H 的概率是1/2。 三、概率分布类型
(一)离散分布与连续分布 1、离散分布
如果随机变量只能取有限的或无限但可以数下去的数值,则这种随机变量取值的概率规律称为离散分布。这类分布往往将随机试验的所有结果及其相应的概率一一列出来以表示分布规律。
例如:抛置硬币这一随机试验可以用如下一些方式来表示其分布规律: ①记A={正面向上},B={反面向上},则P(A)=0.5,P(B)=0.5。
②令出现正面向上用1表示,反面向上用0表示,则P(ξ=1)=0.5,P(ξ=0)=0.5 ③用图形来表示:
2、连续分布
如果随机变量可以取连续的数值,则这种随机变量取值的概率规律称为连续分布。对于连续分布,不能列出所有取值及其对应的概率。连续分布的表示方法有别于离散分布,一般采用概率密度函数来表示。
当样本的容量及分组逐渐增加时,次数分布图将趋近于一条稳定而连续的曲线,这条曲线就称为连续随机变量的概率密度函数,一般记为f(x)。
(二)经验分布与理论分布
根据分布情况如果获得分成这样两类。 1、经验分布
经验分布是根据观察或实验所获得的数据而编制的次数分布或相对频率分布,经验分布往往是总体的一个样本的情况,用来反映总体的大致情况,因此经验分布也称为样本分布。在第一章中对100个考生成绩所做的次数分布就是一个经验分布的例子。
8
1
212121=⨯⨯2
181818181=+++
2、理论分布
理论分布是指根据理论推演出来的随机变量的概率分布模型,它指的是总体的分布规律(与样本分布相对应)。在我们的学习中要学到的理论分布有正态分布、二项分布、T 分布、
F 分布、χ2
分布。在不同的理论分布中,反映它们特征的参数是不一样的。
(三)基本随机变量分布与抽样分布 1、基本随机变量分布
基本随机变量是一个与随机变量的函数相对应的。随机变量的函数仍然是随机变量,后
面将学习到的t 分布、χ2
分布和F 分布,都是由正态随机变量构造而成。
2、抽样分布
抽样分布是样本统计量的理论分布,又称随机变量函数的分布。抽样是从总体中随机地选取一个样本的过程,每一个样本都可以计算平均数、方差、标准差、相关系数等指标,显然从同一总体的抽取出的不同样本的这些指标是不一样的。比如说对于一个容量为50的有
限总体,其容量为5的不同样本一共有505
= 312,500,000个(允许重复的组合),显然这是一个很大的数值,这里的每一个样本可以计算一个平均数,故一共有312,500,000个平均数,这些平均数的分布情况(或分布规律)就是从容量为50的有限总体中抽取容量为5的样本的抽样分布。
第二节 正态分布
一、正态分布
(一)正态分布定义
正态分布也称常态分布,是连续随机变量概率分布的一种,中间量数次数分布多,
两端量数次数分布少,呈对称型的概率分布。
正态分布的概率密度函数为:
其中,Y 为概率密度,σ为分布的标准差,X 为变量值,μ为分布的平均数,e 和π为常数(e =2.7183,π=3.1416)。
在正态分布中,平均数μ和标准差σ决定着分布曲线的位置和形状。其中,平均数决定着曲线在x 轴上的位置,标准差σ决定着曲线的形状。
当σ相同而μ不同时,曲线形状相同,位置各异。 当μ相同而σ不同时,正态曲线有不同的形状,σ越大,曲线越是“低阔”,σ越小曲线越是“高窄”, (二)正态分布的特征
1、正态分布的形式是对称的,对称轴是经过平均数的垂线;
2、正态分布的中央点最高,然后逐渐向两侧下降,曲线先向内弯,后向外弯,两端靠近基线处无限延伸;
3、正态曲线下的面积为1,故对称轴将正态曲线下的面积划分为相等的两部分;
4、正态分布是一族分布。 二、标准正态分布
()2
2
221
σμπ
σ--
=
X e
Y