几种常见的分布知识讲解
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
一、常见数据类型
在正式的解释分布之前,我们先来看一看平时遇到的数据。数据可大致分为离散型数据和连续型数据。
离散型数据
离散型数据顾名思义就是只取几个特定的值。例如:当你掷骰子的时候,结果只有1,2,3,4,5,6,不会出现类似1.5,2.5。
连续型数据
在一个给定的范围内,连续型数据可以取任意值。这个范围可以是有限的或者是无穷的。例如:一个人的体重或者身高,可以取值54kg,54.4kg,54.33333kg等等都没有问题。
下面就开始介绍分布的类型。
二、分布类型
伯努利分布(Bernoulli Distribution)
首先从最简单的分布开始,伯努利分布实际上是一个听起来最容易理解的分布。伯努利分布一次实验有两个可能的结果,比如1代表success及0代表failure。随机变量X X一个取值为1并代表成功,成功概率为p p,一个取值为0表示失败,失败概率为q q或者说1−p1−p。
这里,概率分布函数为p x(1−p)1−x px(1−p)1−x,其中x∈(0,1)x∈(0,1),我们也可以写成如下形式:
P(x)={1−p,p,x=0x=1P(x)={1−p,x=0p,x=1
成功和失败的概率没必要相同,也就是没必要都是0.5,但是这俩概率加和应该为1,比如可以是下面的图:
这个图就是p(success)=0.15,p(failure)=0.85p(success)=0.15,p(failure) =0.85。
下面说一下随机变量的期望,一个分布的期望就是这个分布的均值。服从伯努利分布的随机变量X X的期望值就是:
E(X)=1∗p+0∗(1−p)=p E(X)=1∗p+0∗(1−p)=p
服从伯努利分布的随机变量的方差是:
V(X)=E(X2)−[E(X)]2=p−p2=p(1−p)V(X)=E(X2)−[E(X)]2=p−p2=p(1−p)
还有许多伯努利分布的例子,比如说明天是否会下雨,今天会不会去健身,明天乒乓球比赛是不是会赢。
均匀分布(Uniform Distribution)
当你掷骰子的时候,结果出现1到6中的任何一个,而任何一个结果出现的概率都是相同的,这就是均匀分布最原始的雏形。你可能看出来了,与伯努利分布不同的是,这n n个出现的结果的概率都是相同的。
一个随机变量X X为均匀分布是指密度函数如下: