各种概率分布及应用场合(建模对象)
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
1、高斯分布
高斯分布是最常见的分布,我现在觉得高斯分布中最难的就是,如何说服别人,你假设某个分布是高斯,是有依据的,而不是一个所谓的“经验假设”。
高斯分布的概率密度函数为:
各种各样的心理学测试分数、各种各样的无力现象、测量误差等都被发现近似地服从正态分布。尽管这些现象的根本原因经常是未知的,但是理论上可以证明如果把许多小作用加起来看做一个变量,那么这个变量服从正态分布。
由正态分布还可以到处一些常见的分布:
2、伯努利分布(又称:两点分布,0-1分布)
均值为p,方差为p(1-p).
这是为纪念瑞士科学家伯努利而命名的,猜测应该与伯努利本人没有太大关系吧,哈哈。
3、二项分布
进行独立的n次伯努利实验得到。均值为np,方差为np(1-p)。
与高斯分布的关系:当n足够大时,且p不接近于0或1,则二项分布近似为高斯分布,且n越大越近似。
4、多项分布
与二项分布对应,每次独立事件会出现3个及3个以上可能值。
二项分布和多项分布的概率值都可以经过计算多项式(x1+x2)^n 和多项式
(x1+x2+...+xm)^n的通项得到,对于二项分布,此时的x1=p,x2=1-p。
5、泊松分布
参考资料:
/wiki/%E6%B3%8A%E6%9D%BE%E5%88%86%E5%B8%83
泊松分布适合于描述单位时间内随机事件发生的次数的概率分布。如某一服务设施在一定时间内受到的服务请求的次数,电话交换机接到呼叫的次数、汽车站台的候客人数、机器出现的故障数、自然灾害发生的次数、DNA序列的变异数、放射性原子核的衰变数等等。
概率质量函数为:(区分概率质量函数和概率密度函数,概率质量函数-离散,是概率值;概率密度-连续,不是概率值)
泊松分布的期望和方差均为lemta。
与二项分布的关系:当二项分布的p趋近于0,np固定,或np至少趋近固定时,事件在某个事件间隔内发生的次数,就可以用泊松分布近似。这个关系可以用严格的数学语言证明。
泊松分布的最大似然估计:给定n个样本值k i,希望得到从中推测出总体的泊松分布参数λ
的估计。最大化似然概率得到的参数为:。可以看出来,这个结果也与Lemta的定义吻合。
6、指数分布
参考:/wiki/%E6%8C%87%E6%95%B0%E5%88%86%E5%B8%83
指数分布(Exponential distribution)是一种连续概率分布。指数分布可以用来表示独立随机事件发生的时间间隔,比如旅客进机场的时间间隔、中文维基百科新条目出现的时间间隔等等。
指数分布的概率密度函数为,,期望为1/Lemta,方差为1/Lemta^2。
指数分布中最关键的一点,如何理解率参数。给定独立同分布样本x = (x1, ..., x n),最大化似然概率得到参数的似然值为:。
指数分布的重要特性是无记忆性。它表示随机变量的概率只与时间间隔有关,而与时间起点无关。数学语言表达为:
7、其他
伽马分布,β分布,狄利克莱分布等。以上所有分布,都属于指数分布族。