二项分布的例子
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
二项分布的例子
【篇一:二项分布的例子】
在介绍贝塔分布(beta distribution)之前,需要先明确一下先验概率、后验概率、然函数以及共轭分布的概念。
通俗的讲,先验概率就是事情尚未发生前,我们对该事发生概率的
估计。利用过去历史资料计算得到的先验概率,称为客观先验概率;当历史资料无从取得或资料不完全时,凭人们的主观经验来判断而
得到的先验概率,称为主观先验概率。例如抛一枚硬币头向上的概
率为0.5,这就是主观先验概率。后验概率是指通过调查或其它方式
获取新的附加信息,利用贝叶斯公式对先验概率进行修正,而后得
到的概率。
先验概率和后验概率的区别:先验概率不是根据有关自然状态的全
部资料测定的,而只是利用现有的材料(主要是历史资料)计算的;后
验概率使用了有关自然状态更加全面的资料,既有先验概率资料,
也有补充资料。另外一种表述:先验概率是在缺乏某个事实的情况
下描述一个变量;而后验概率(probability of outcomes of an experiment after it has been performed and a certain event has occured.)是在考虑了一个事实之后的条件概率。
然函数共轭分布(conjugacy):后验概率分布函数与先验概率分布函数具有相同形式好了,有了以上先验知识后,终于可以引入贝塔分
布啦!!首先,考虑一点,在试验数据比较少的情况下,直接用最
大然法估计二项分布的参数可能会出现过拟合的现象(比如,扔硬
币三次都是正面,那么最大然法预测以后的所有抛硬币结果都是正面)。为了避免这种情况的发生,可以考虑引入先验概率分布来控
制参数,防止出现过拟合现象。那么,问题现在转为如何选择!
先验概率和后验概率的关系为:
二项分布的然函数为(就是二项分布除归一化参数之外的后面那部分,然函数之所以不是pdf,是因为它不需要归一化):
如果选择的先验概率也与和次方德乘积的关系,那么后验概率分布
的函数形式就会跟它的先验函数形式一样了。具体来说,选择prior
的形式是,那么posterior就会变成这个样子了(为pdf的归一化参数),所以posterior和prior具有相同的函数形式(都是也与和次方
的乘积),这样先验概率与后验概率就是共轭分布了。
所以,我们选择了贝塔分布作为先验概率,其概率分布函数为:
,其中狄利克雷分布狄利克雷分布(dirichlet distribution)是多项分布的共轭分布,也就是它与多项分布具有相同形式的分布函数。
概率分布函数为:
【篇二:二项分布的例子】