经典统计学与贝叶斯统计学的区别于分1
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
经典统计学与贝叶斯统计学的区别于分析
院 (系) 统计学院
专业统计学
班级 08级统计班
学号 **********
姓名张静
指导教师张贝贝
经典统计学与贝叶斯统计学的区别于分析
摘要:在现代经济高速发展的时代,商业和经济管理中在很多方面需要进行数据数理和分析,在此过程中,贝叶斯统计方法在实际的经济问题处理中的应用也越来越广泛。本文以贝叶斯统计方法的介绍为主,同时分析经典统计学和贝叶斯统计的的区别。
关键词:贝叶斯统计经典统计假设检验先验分布
一、引言
经典统计学派与贝叶斯学派有不同的处理思想。目前,经典统计方法占据着统计学的主导地位,但是,贝叶斯方法正在国外迅速发展并得到日益广泛的应用,我们有必要给以足够的重视。所以,本文分析经典统计学和贝叶斯统计的区别。
二、经典统计与贝叶斯统计的区别:
1.贝叶斯统计:
贝叶斯统计的两个基本概念是先验分布和后验分布。先验分布:总体分布参数θ的一个概率分布。贝叶斯学派的根本观点,是认为在关于总体分布参数θ的任何统计推断问题中,除了使用样本所提供的信息外,还必须规定一个先验分布,它是在进行统计推断时不可缺少的一个要素。他们认为先验分布不必有客观的依据,可以部分的或完全的基于主观信念。后验分布:根据样本分布和未知参数的先验分布,用概率论中求条件概率分布的方法,求出的在样本已知下,未知参数的条件分布。因为这个分布是在抽样后才得到的,故称为后验分布。贝叶斯推断方法的关键是任何推断都必须只根据后验分布,而不能再设计样本分布。
贝叶斯统计(Bayesian statistics),推断统计理论的一种。英国学者贝叶斯在1763年发表的论文《有关机遇问题求解的短论》中提出。依据获得样本(Xl,X2,…,Xn)之后θ的后验分布π(θ|X1,X2,…,Xn)对总体参数θ作出估计和推断。它不是由样本分布作出推断。其理论基础是先验概率和后验分布,即在事件概率时,除样本提供的后验信息外,还会凭借自己主观已有的先验信息来估计事件的概率。而以R.A.费希尔为首的经典统计理论对事件概率的解释是频率解释,即通过抽取样本,由样本计算出事件的频率,而样本提供的信息完全是客观的,一切推断的结论或决策不允许加入任何主观的先验的信息。以对神童出现的
概率P 的估计为例。按经典统计的做法,完全由样本提供的信息(即后验信息)来估计,认为参数p 是一个“值”。贝叶斯统计的做法是,除样本提供的后验信息外,人类的经验对p 有了一个了解,如p 可能取pl 与户p2,且取p1的机会很大,取p2机会很小。先验信息关于参数p 的信息是一个“分布”,如P(p=p1)=0.9,P(p=p2)=0.1,即在抽样之前已知道(先验的)p 取p1的可能性为0.9。若不去抽样便要作出推断,自然会取p=p1。但若抽样后,除非后验信息(即样本提供的信息)包含十分有利于“p—=p2”的支持论据,否则采纳先验的看法“p=p1”。20世纪 50年代后贝叶斯统计得到真正发展,但在发展过程中始终存在着与经典统计之间的争论。
2. 经典统计与贝叶斯统计的区别:
(1)经典学派很注重利用已经出现的样本观察值,没观察到的样本不予考虑。贝叶斯学派很注重先验信息的收集、挖掘和加工,使他们数量化成先验分布,参加到统计推断中,以此提高统计推断的质量。任一个未知量,都可看做一个随机变量。例如:每天测量得到的产品的不合格率 会有一些变化,故看做r.v.也是合适的,用一个概率分布去描述它也是很恰当的。
(2)统计推断利用的信息不同:
经典统计学的统计推断时给予总体信息和样本信息。总体信息即总体分布或总体所属分布族中包含的信息,包括总体认识、参数范围、变量的方式和特征等;样本信息是从总体中抽取的样本所包含的信息,而贝叶斯统计方法在此基础上还利用课先验信息,先验信息主要来源于经验和历史资料。贝叶斯派认为忽视先验信息的应用会造成利用的浪费,应把先验信息的收集、加工和处理数量化,来提高统计推断的质量。
(3)贝叶斯把未知常量看做随机变量,所以用概率分布来描述是合适的:
设()n 21X ,...,X ,X 为来自正态总体()2,σμN 的一个样本,μ是未知参数,样本均值和样本方差分别为:21
21)(111X X n S X n X n i i n i i --==∑∑==,由于总体服从正态分布可得)1,0(~/U N n
X σμ-=,对于给定的置信度α-1,查分位点2/αu ,使得
{}αα-=<12/u U P ,得到ασμα-=⎪⎭⎪⎬⎫⎪⎩⎪⎨⎧<-1/2/u n X P ,从而
ασμσαα-=⎭
⎬⎫⎩⎨⎧+<<-12/2/u n X u n X P ,这样就得到置信度为α-1的μ的置信区间为⎪⎪⎭
⎫ ⎝⎛+-∈n u X n u X u σσαα2/2/,,由于在经典统计的理论体系中参数μ是一个固定的常数,并不具有随机性,因而ασμσαα-=⎭
⎬⎫⎩⎨⎧
+<<-12/2/u n X u n X P 也就不能理解为⎪⎪⎭
⎫ ⎝⎛+-∈n u X n u X u σσαα2/2/,的概率等于α-1,根据经典学派的基本观点,区间⎪⎪⎭⎫ ⎝
⎛+-n u X n u X σσαα2/2/,表示多次抽样得到的这样的置信区间能盖住参数μ的概率是α-1。然而很多试验室不可大量重复或多次观测的,导致这样的解释没有意义,况且人们最关心的恰好是参数μ在该范围内的概率有多大,因此在经典统计理论中区间估计问题的提法及其解答并不令人满意。而贝叶斯方法恰好不存在上述问题,因为在贝叶斯理论体系中,可以从贝叶斯假设直接导出与ασμσαα-=⎭
⎬⎫⎩⎨⎧
+<<-12/2/u n X u n X P 式完全相同的等式,不过此时μ是随机变量,而样本均值是常数,因此,根据贝叶斯学派的观点,上式就是⎪⎪⎭
⎫ ⎝⎛+-∈n u X n u X u σσαα2/2/,这一事发生的概率是α-1。类似的说法,“明天降水的概率是0.85”,“某学生考上大学的概率是0.95”,“甲队胜的概率为0.6左右”……这样的概率陈述能够为大多数人所理解、接受和采用。
(4)来自经典统计学派的主要批评:
认为概率必须通过大量重复试验来确定,才是“客观的”,认为贝叶斯是主观的。对此,贝叶斯学派的反驳:a.认为引入主观概率能扩展概率统计的研究范畴,扩展到不能大量重复的实验; b.主观概率确定不是随意的,而是要求当事人对所考察的事件有比较透彻的了解和丰富的经验,甚至是这一行的专家,在此基础上确定主观概率才能符合实际;c. 揭露经典学派的“客观性”:总体分布的选择对于答案所产生的影响远远超过先验分布所产生的影响重大。
(5)经典统计与贝叶斯统计在估计上的区别: