贝叶斯统计决策

合集下载

统计学中的贝叶斯统计和决策理论

统计学中的贝叶斯统计和决策理论

统计学中的贝叶斯统计和决策理论统计学是研究数据收集、分析和解释的学科,而贝叶斯统计和决策理论是统计学中的两个重要分支。

贝叶斯统计理论是一种基于贝叶斯定理的统计推断方法,而决策理论则关注如何在面对风险或不确定性时做出最佳决策。

一、贝叶斯统计1. 贝叶斯理论的基本思想贝叶斯统计理论是以英国数学家Thomas Bayes的名字命名的,其基本思想是通过先验知识和新收集的数据来进行参数估计。

与传统频率统计不同,贝叶斯统计将概率看作是描述人们对不确定性的信念,通过更新这些信念来进行推理。

2. 先验概率和后验概率在贝叶斯统计中,先验概率是在考虑新数据之前已经拥有的关于参数的概率分布。

随着新数据的不断积累,我们可以更新先验概率,得到后验概率,从而更加准确地估计参数的值。

3. 贝叶斯公式贝叶斯公式是贝叶斯统计的核心公式。

根据贝叶斯公式,我们可以计算参数的后验概率,从而基于数据来更新我们对参数的估计。

4. 贝叶斯推断的优点和应用贝叶斯统计有一些独特的优点。

首先,它允许我们将先验知识与数据结合,从而得到更加准确的推断。

此外,贝叶斯统计还可以通过使用先验概率来处理缺乏数据的情况。

贝叶斯统计在各个领域中都有广泛的应用,包括医学诊断、金融风险评估和机器学习等。

二、决策理论1. 决策理论的基本概念决策理论是研究在面对不确定性和风险时如何做出最佳决策的学科。

决策问题涉及到选择行动和评估不同行动的后果。

决策理论包括概率理论、效用理论和风险管理等概念。

2. 概率理论在决策中的应用概率理论是决策理论中的一项重要概念,它用于描述事件发生的可能性。

决策者可以使用概率理论来估计不同决策的结果,并在不确定性下做出合理的决策。

3. 效用理论和决策权衡效用理论是决策理论中的另一个关键概念,它描述了个体对不同结果的偏好程度。

根据效用理论,决策者可以根据结果的效用来评估不同决策的价值,并选择效用最大化的决策。

4. 风险管理和决策优化决策理论还涉及到风险管理和决策优化。

第2章 贝叶斯决策完整版.ppt

第2章 贝叶斯决策完整版.ppt
精选
最小风险准则
❖ 最小风险贝叶斯决策:考虑各种错误造成损失不
同而提出的一种决策规则。
❖ 条件风险:
精选
最小风险准则
❖ 期望风险:对于x的不同观察值,采取决策αi时,
其条件风险大小是不同的。所以究竟采取哪一种决 策将随x的取值而定。这样,决策α可以看成随机向 量x的函数,记为α(x)。可以定义期望风险Rexp为:
假言:如果鱼的长度 x 大于45cm,则该鱼为 鲈鱼 1,否则该鱼为鲑鱼 2
前提:现在某条鱼 x 38cm
结论:该鱼为鲑鱼 2
❖ 概率推理(不确定性推理)
P i x 精选
最小错误率准则
❖ 例子:
给定
P
y
1
P
y
2
1 2
,类条件概率密度如图。
现有一条鱼 x=38cm, 若采用最小错误率决策,该鱼应该为哪一类?
R2
R1
a p 1 b
❖ 一旦 R1 和 R2 确定,a和b为常数
❖ 一旦 R1 和 R2 确定, R 与 P(ω1) 成线性关系
❖ 选择使 b=0 的R1 和 R2 ,期望风险与P(ω1) 无关!
精选
R* C’ C
最小最大决策准则
D
R1 ,R2不变
A
R*B
D’
B
R1 ,R2改变
b=0
此时最大 风险最小,
P i
x
Px
i P i
Px
则: P1 x P2 x
等价于:
p x 1 P 1 p x 2 P 2
p x 1 p x 2
p 2 p 1
精选
似然比公式
最小错误率准则
❖ 特例1:

统计学中的贝叶斯统计与决策理论

统计学中的贝叶斯统计与决策理论

统计学中的贝叶斯统计与决策理论统计学中的贝叶斯统计学是一种基于贝叶斯公式和概率论原理的统计推断方法。

它与传统的频率主义统计学方法相比,具有许多独特的优势。

本文将介绍贝叶斯统计学的基本原理、应用领域以及与决策理论的关系。

一、贝叶斯统计学的基本原理贝叶斯统计学是由英国数学家托马斯·贝叶斯提出的,它基于概率论的贝叶斯公式:P(A|B) = P(B|A) * P(A) / P(B),其中P(A|B)表示在给定B发生的条件下A发生的概率,P(B|A)表示在给定A发生的条件下B 发生的概率,P(A)和P(B)分别表示A和B分别发生的概率。

贝叶斯统计学的基本原理是根据已有的先验知识和新的观测数据,通过不断更新概率分布来得出对未知参数的后验概率分布。

通过贝叶斯公式,可以将观测数据与已有知识相结合,得出对未知参数的概率分布,从而进行推断和预测。

二、贝叶斯统计学的应用领域贝叶斯统计学广泛应用于各个领域,包括医学、金融、生物学、工程学等。

其应用主要体现在以下几个方面:1. 参数估计:贝叶斯统计学通过考虑先验信息,对参数进行估计。

与传统的频率主义统计学方法相比,贝叶斯统计学能够更好地利用已有的知识,提供更准确的参数估计。

2. 假设检验:贝叶斯统计学提供了一种新的方法来进行假设检验。

通过计算后验概率与先验概率的比值,可以得到对不同假设的相对支持程度,从而在决策时提供更全面的信息。

3. 预测分析:贝叶斯统计学通过更新概率分布,可以对未来的事件进行预测。

这使得贝叶斯统计学在金融风险预测、天气预报等领域有着广泛的应用。

三、贝叶斯统计学与决策理论的关系贝叶斯统计学与决策理论密切相关。

决策理论主要研究如何在不确定情况下做出最优决策。

而贝叶斯统计学可以为决策提供一个统一的框架,通过计算不同决策的后验概率,从而选择概率最大的决策。

在贝叶斯决策理论中,需要考虑多个可能的决策结果以及每个决策结果的概率。

通过使用贝叶斯统计学中的贝叶斯公式,可以将观测数据与已有知识相结合,计算每个决策结果的后验概率,从而选择概率最大的决策。

贝叶斯统计在商业决策中的应用

贝叶斯统计在商业决策中的应用

贝叶斯统计在商业决策中的应用商业决策是企业管理中的重要环节,它的好坏将直接影响企业的发展和生存。

而如何制定出正确的商业决策,又是一个相当复杂的过程,需要考虑到各种因素的影响。

这时,统计学的贝叶斯理论可以为商业决策提供有力的支持。

什么是贝叶斯理论贝叶斯理论最早由英国数学家Thomas Bayes于18世纪发明,它是一种由先验知识出发的推理过程。

简单地说,贝叶斯理论是以概率的形式来描述不确定性的理论,其中“先验概率”是指在考虑任何新数据的情况下,我们对试验结果的概率进行预测。

这个概率是由过去的经验和规律得出的。

而当获得新数据之后,我们可以通过贝叶斯公式来计算出“后验概率”,来调整我们的预测。

因此,贝叶斯理论是利用已知的先验知识,从而不断修正和更新我们的误差估计。

贝叶斯理论在商业决策中的应用对于商业决策,企业需要收集和分析大量的数据,以便准确地了解市场和客户的需求。

然而,在数据收集和分析过程中会带来大量的随机误差和偏差,使得我们不能真正了解事物的本质。

而贝叶斯理论作为一种基于概率模型的方法,可以用来解决这些问题。

首先,贝叶斯理论可以用来处理不完整和不准确的数据。

当数据不够完整或者存在噪声时,我们可以通过联合分析来利用相关数据得到准确的结果。

例如,我们可以通过先验概率和先前数据得到关于在进行新广告活动后受欢迎度提高的概率预测。

当我们有了新数据后,我们可以采用贝叶斯定理将先前的数据与新数据一起来使模型更准确地取得结果。

其次,贝叶斯方法可以用来推断未来趋势或者风险。

通过先前数据的经验和规律以及事物的动态特性,我们可以得到相关概率预测。

当我们有更多信息的时候,这个预测也可以通过贝叶斯公式来不断进行优化和修正。

另外,由于贝叶斯是一种概率模型,因此可以帮助我们评估和比较不同策略的效果。

在决策的过程中,我们可以利用贝叶斯公式对不同决策方案的成本、风险和效益进行比较。

这将使我们更有信心地做出决策,并在自己预备中避免有不必要的财务损失。

贝叶斯决策方法综述

贝叶斯决策方法综述

贝叶斯决策方法综述一、决策问题决策就是对一件事情要做出决定,它与推断的差别在于是否涉及后果。

统计学家在作推断时是按统计理论进行的,很少或根本不考虑推断结论在使用后的损失,而决策者在使用推断结果做决策时必须与得失联系在一起考虑。

能给他带来利润的他就使用,使他遭受损失的就不会被采用,度量得失的尺度就是损失函数。

著名统计学家A.Wald(1902-1950)在20世纪40年代引入了损失函数的概念,指的是由于决策失误导致的损失值。

损失函数与决策环境密切相关,因此从实际问题中归纳出合适的损失函数是决策成败关键。

把损失函数加入贝叶斯推断就形成贝叶斯决策论,而损失函数被称为贝叶斯统计中的第四种信息。

决策分析是一般分四个步骤:1)形成决策问题,包括提出方案和确定目标;2)判断自然状态及其概率;3)拟定多个可行方案;4)评价方案并做出选择。

常用的决策分析技术有:确定型情况下的决策分析、风险型情况下的决策分析及不确定型情况下的决策分析。

(1)确定型情况下的决策分析。

确定型决策问题的主要特征有四方面:一是只有一个状态,二是有决策者希望达到的一个明确的目标,三是存在着可供决策者选择的两个或两个以上的方案,四是不同方案在该状态下的收益值是清楚的。

确定型决策分析技术包括用微分法求极大值和数学规划等方法。

(2)风险型情况下的决策分析。

这类决策问题与确定型决策只在第一点特征上有所区别,即在风险型决策问题中,未来可能的状态不只一种,究竟出现哪种状态不能事先肯定,只知道各种状态出现的可能性大小(如概率、频率、比例或权等)。

常用的风险型决策分析技术有期望值法和决策树法。

期望值法是根据各可行方案在各自然状态下收益值的概率平均值的大小,决定各方案的取舍。

决策树法有利于决策人员使决策问题形象化,把各种可以更换的方案、可能出现的状态、可能性大小及产生的后果等,简单地绘制在一张图上,以便计算、研究与分析,同时还可以随时补充。

(3)不确定型情况下的决策分析。

贝叶斯决策方法的步骤

贝叶斯决策方法的步骤

贝叶斯决策方法的步骤贝叶斯决策方法是一种基于贝叶斯定理的决策方法,其原理是通过先验概率和后验概率来进行决策。

它在众多领域中得到了广泛的应用,比如机器学习、金融领域、医疗诊断等。

下面就让我们来详细了解一下贝叶斯决策方法的步骤。

步骤一:建立概率模型贝叶斯决策方法首先需要建立一个概率模型,包括先验概率、条件概率等。

先验概率是指在没有任何其他信息的情况下,某一事件发生的概率;条件概率是指在已经发生的其他事件的前提下,某一事件发生的概率。

通过收集数据、统计分析等方法,可以得到所需的概率模型。

步骤二:收集样本数据在进行贝叶斯决策之前,需要收集样本数据,以便用于更新概率模型中的参数。

样本数据的收集应当具有代表性,并且需要足够的量来进行统计分析,以准确地估计概率参数。

步骤三:计算先验概率在得到样本数据之后,需要根据这些数据计算先验概率。

先验概率是在考虑其他任何信息之前,某一事件发生的概率。

通过对样本数据进行统计分析,可以得到相应的先验概率。

步骤四:计算条件概率条件概率是在已知其他事件发生的前提下,某一事件发生的概率。

在得到先验概率之后,需要根据样本数据计算条件概率,以便进行后续的决策过程。

步骤五:应用贝叶斯定理进行决策在建立好概率模型并计算好相应的概率之后,可以应用贝叶斯定理进行决策。

贝叶斯定理是通过先验概率和条件概率来计算后验概率,从而做出最优的决策。

根据后验概率的大小,可以确定最优的决策方案。

步骤六:不断更新概率模型随着新的样本数据的不断积累,概率模型中的参数也需要不断地更新。

通过将新的样本数据融入到原先的概率模型中,可以得到更为准确的概率参数,从而提高决策的准确性。

在实际应用中,贝叶斯决策方法需要根据具体问题对概率模型进行适当的建立和调整,同时也需要根据具体的样本数据来进行概率参数的估计。

在处理一些复杂的实际问题时,可能还需要采用一些先进的数学方法来优化概率模型和提高决策的准确性。

贝叶斯决策方法是一种灵活、有效的决策方法,在实际应用中有着广泛的用武之地。

第2章贝叶斯决策理论[1]

第2章贝叶斯决策理论[1]
•决 策
•ω1
•ω2
•根据条件风险公式:
•α•1(正常) •0
•1
•α•(2 异常) •1
•0
•则两类决策的风险为
•(将 判决为第 类的风险 )
•(将 判决为第 类的错误率)
PPT文档演模板
•因此两种决策规则等价 (理论推导见教材P16)
第2章贝叶斯决策理论[1]
•2.3 正态分布时的贝叶斯统计决策
PPT文档演模板
第2章贝叶斯决策理论[1]
•2.2.3 基于最小风险的贝叶斯决策应用实例
•例:细胞识别
•类
•类
• 假设在某个局部地区细胞识别中, 正常( )和异常( )两类的先验概 率分别为
• 正常状态:
P ( ) =0.9;
• 异常状态:
P ( ) =0.1.
•现有一待识别的细胞,其观察值为 ,从类条件概率密度分布曲线上
• 正常状态:
P ( ) =0.9;
• 异常状态:
P ( ) =0.1.
•现有一待识别的细胞,其观察值为 ,从类条件概率密度分布曲线上
查得

P(x | )=0.2, P(x | )=0.4.
•试对该细胞x进行分类。
•解:利用贝叶斯公式,分别计算出 及 的后验概率。

P( | x)=

P( |x)=1- P( |x)=0.182
•(2)多元正态分布
•均值向量: •协方差矩阵:
PPT文档演模板
•多元正态分布
•左图的投影
第2章贝叶斯决策理论[1]
•2.3.1 预备知识(续)
•(3)多元正态分布的协方差矩阵
区域中心由均值决定,区域形状由协方差矩阵决定;且主轴方向是 协方差矩阵的特征向量方向;

3.2.13.2贝叶斯决策的基本步骤

3.2.13.2贝叶斯决策的基本步骤
的经验,估计三种情况的概率分布和利润如表1所示。
状态( )
表1 三种情况的概率分布和利润
表3-8 三种情况的概率分布和利润
好(1 )
中(2 )
差(3 )
概率( )
0.25
0.30
0.45
利润(万元)
15
1
-6
贝叶斯决策的基本步骤——例题
• 为了进一步摸清市场对这种产品的需求情况,工厂通过调查和咨询等方式得到一份市场
值,比较得到最满意的解决方案,这一计算过程预验分析已经完成。
本节结束,感谢观看
• 最大期望收益值 1 = 7.937
• 当 = 2 时:
表3-8× 三种情况的概率分布和利润
• 1 = 0.236 × 15 + 0.509
1 + 0.255 × −6 = 2.519; 2 = 0
• 最大期望收益值 2 = 2.519
• 1 = 0.055 × 15 + 0.199 × 1 + 0.746 × −6 = −3.452; 2 = 0
1. 补充信息(市场调查表)价值多少?2. 如何决策可以使利润期望值最大?
贝叶斯决策的基本步骤——例题
• 首先,第一步,验前分析。该厂生产新产品有两种方案,即生产方案(1 ),不生产方案
(2 ) ,产品市场有三种状态,好(1 ),中(2 ) 和差(3 ) 。状态的先验概率为
• 1 = 0.25; 2 = 0.30; 3 = 0.45;
0.0900
0.3375
0.4525
贝叶斯决策的基本步骤——例题
• 计算出( ),之后,可以进一步用贝叶斯公式 =
( | )( )
( )
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

叶斯统计决策理论是指综合运用决策科学的基础理论和决策的各种科学方法对投资进行分析决策。

其应用决策科学的一般原理和决策分析的方法研究投资方案的比选问题,从多方面考虑投资效果,并进行科学的分析,从而对投资方案作出决策。

涉及到投资效果的各种评价、评价标准、费用(效益分析)等问题。

投资决策效果的评价问题首要的是对投资效果的含义有正确理解,并进行正确评价。

贝叶斯统计中的两个基本概念是先验分布和后验分布。

①先验分布。

总体分布参数θ的一个概率分布。

贝叶斯学派的根本观点,是认为在关于总体分布参数θ的任何统计推断问题中,除了使用样本所提供的信息外,还必须规定一个先验分布,它是在进行统计推断时不可缺少的一个要素。

他们认为先验分布不必有客观的依据,可以部分地或完全地基于主观信念。

②后验分布。

根据样本分布和未知参数的先验分布,用概率论中求条件概率分布的方法,求出的在样本已知下,未知参数的条件分布。

因为这个分布是在抽样以后才得到的,故称为后验分布。

贝叶斯推断方法的关键是任何推断都必须且只须根据后验分布,而不能再涉及样本分布。

贝叶斯统计(Bayesian statistics),推断统计理论的一种。

英国学者贝叶斯在1763年发表的论文《有关机遇问题求解的短论》中提出。

依据获得样本(Xl,X2,…,Xn)之后θ的后验分布π(θ|X1,X2,…,Xn)对总体参数θ作出估计和推断。

它不是由样本分布作出推断。

其理论基础是先验概率和后验分布,即在事件概率时,除样本提供的后验信息外,还会凭借自己主观已有的先验信息来估计事件的概率。

而以R.A.费希尔为首的经典统计理论对事件概率的解释是频率解释,即通过抽取样本,由样本计算出事件的频率,而样本提供的信息完全是客观的,一切推断的结论或决策不允许加入任何主观的先验的信息。

以对神童出现的概率P的估计为例。

按经典统计的做法,完全由样本提供的信息(即后验信息)来估计,认为参数p是一个“值”。

贝叶斯统计的做法是,除样本提供的后验信息外,人类的经验对p 有了一个了解,如p可能取pl与户p2,且取p1的机会很大,取p2机会很小。

先验信息关于参数p的信息是一个“分布”,如P(p=p1)=0.9,P(p=p2)=0.1,即在抽样之前已知道(先验的)p取p1的可能性为0.9。

若不去抽样便要作出推断,自然会取p=p1。

但若抽样后,除非后验信息(即样本提供的信息)包含十分有利于“p—=p2”的支持论据,否则采纳先验的看法“p=p1”。

20世纪50年代后贝叶斯统计得到真正发展,但在发展过程中始终存在着与经典统计之间的争论。

[编辑]贝叶斯统计的历史[1]贝叶斯统计的历史可以上溯到16 世纪。

1713 年,James Bernoulli 意识到在可用于机会游戏的演绎逻辑和每日生活中的归纳逻辑之间的区别,他提出一个著名的问题:前者的机理如何能帮助处理后面的推断。

托马斯.贝叶斯(ThomasBayes,1702-1761)是长老会的牧师。

他对这个问题产生浓厚的兴趣,并且对这个问题进行认真的研究,期间,他写了一篇文章来回答Bernoulli 的问题,提出了后来以他的名字命名的公式:贝叶斯公式。

但是,直到贝叶斯死后才由他的朋友Richard Price 在1763 年发表了这篇文章,对Bernoulli 的问题提供了回答。

这篇文章标志着贝叶斯统计的产生。

但贝叶斯统计的思想在开始时并没有得到重视。

后来,Laplace 本人重新发现了贝叶斯公式,而且阐述得比贝叶斯更为清晰。

由于贝叶斯统计对于概率的观点过于主观,与当时的主流统计观点相左,此外也很难应用当时严谨的数学理论解释。

例如贝叶斯统计中的先验概率的观点,一直以来都是贝叶斯统计学派和非贝叶斯统计学派争论的焦点之一。

在历史上,贝叶斯统计长期受到排斥,受到当时主流的数学家们的拒绝。

例如,近代优秀的统计学家R. A. Fisher就是贝叶斯统计的反对者。

然而,随着科学的进步,贝叶斯统计在实际应用上取得的成功慢慢改变了人们的观点。

贝叶斯统计慢慢的受到人们的重视,目前贝叶斯统计已经成为统计学中一门很热门的研究课题。

从贝叶斯为了回答James Bernoulli 的问题而写的那一篇论文,提出著名的贝叶斯统计思想以来,经过几百年的发展,目前关于贝叶斯统计的论文和学术专著有很多。

目前统计界公认比较权威的贝叶斯统计的著作是James O. Berger 的作品:StatisticalDecision theory and Bayesian Analysis。

国内有其中译本:《统计决策论及贝叶斯分析》,它是由贾乃光主译,吴喜之校译,中国统计出版社出版。

[编辑]基本思想贝叶斯决策理论方法是统计模型决策中的一个基本方法,其基本思想是:★已知类条件概率密度参数表达式和先验概率★利用贝叶斯公式转换成后验概率★根据后验概率大小进行决策分类2公式设D1,D2,……,Dn为样本空间S的一个划分,如果以P(Di)表示事件Di发生的概率,且P(Di)>0(i=1,2,…,n)。

对于任一事件x,P(x)>0,如图3理论分析(1)如果我们已知被分类类别概率分布的形式和已经标记类别的训练样本集合,那我们就需要从训练样本集合中来估计概率分布的参数。

在现实世界中有时会出现这种情况。

(如已知为正态分布了,根据标记好类别的样本来估计参数,常见的是极大似然率和贝叶斯参数估计方法)(2)如果我们不知道任何有关被分类类别概率分布的知识,已知已经标记类别的训练样本集合和判别式函数的形式,那我们就需要从训练样本集合中来估计判别式函数的参数。

在现实世界中有时会出现这种情况。

(如已知判别式函数为线性或二次的,那么就要根据训练样本来估计判别式的参数,常见的是线性判别式和神经网络)(3)如果我们既不知道任何有关被分类类别概率分布的知识,也不知道判别式函数的形式,只有已经标记类别的训练样本集合。

那我们就需要从训练样本集合中来估计概率分布函数的参数。

在现实世界中经常出现这种情况。

(如首先要估计是什么分布,再估计参数。

常见的是非参数估计)(4)只有没有标记类别的训练样本集合。

这是经常发生的情形。

我们需要对训练样本集合进行聚类,从而估计它们概率分布的参数。

(这是无监督的学习)(5)如果我们已知被分类类别的概率分布,那么,我们不需要训练样本集合,利用贝叶斯决策理论就可以设计最优分类器。

但是,在现实世界中从没有出现过这种情况。

这里是贝叶斯决策理论常用的地方。

问题:假设我们将根据特征矢量x 提供的证据来分类某个物体,那么我们进行分类的标准是什么?decide wj,if(p(wj|x)>p(wi|x))(i不等于j)应用贝叶斯展开后可以得到p(x|wj)p(wj)>p(x|wi)p(wi)即或然率p(x|wj)/p(x|wi)>p(wi)/p(wj),决策规则就是似然率测试规则。

结论:对于任何给定问题,可以通过似然率测试决策规则得到最小的错误概率。

这个错误概率称为贝叶斯错误率,且是所有分类器中可以得到的最好结果。

最小化错误概率的决策规则就是最大化后验概率判据。

4决策判据贝叶斯决策理论方法是统计模式识别中的一个基本方法。

贝叶斯决策判据既考虑了各类参考总体出现的概率大小,又考虑了因误判造成的损失大小,判别能力强。

贝叶斯方法更适用于下列场合:(1) 样本(子样)的数量(容量)不充分大,因而大子样统计理论不适宜的场合。

(2) 试验具有继承性,反映在统计学上就是要具有在试验之前已有先验信息的场合。

用这种方法进行分类时要求两点:第一,要决策分类的参考总体的类别数是一定的。

例如两类参考总体(正常状态Dl和异常状态D2),或L类参考总体D1,D2,…,DL(如良好、满意、可以、不满意、不允许、……)。

第二,各类参考总体的概率分布是已知的,即每一类参考总体出现的先验概率P(Di)以及各类概率密度函数P(x/Di)是已知的。

显然,0≤P(Di)≤1,(i=l,2,…,L),∑P(Di)=1。

对于两类故障诊断问题,就相当于在识别前已知正常状态D1的概率P(D1)和异常状态D2的概率P(D2),它们是由先验知识确定的状态先验概率。

如果不做进一步的仔细观测,仅依靠先验概率去作决策,那么就应给出下列的决策规则:若P(D1)>P(D2),则做出状态属于D1类的决策;反之,则做出状态属于D2类的决策。

例如,某设备在365天中,有故障是少见的,无故障是经常的,有故障的概率远小于无故障的概率。

因此,若无特别明显的异常状况,就应判断为无故障。

显然,这样做对某一实际的待检状态根本达不到诊断的目的,这是由于只利用先验概率提供的分类信息太少了。

为此,我们还要对系统状态进行状态检测,分析所观测到的信息。

叶斯学派的根本观点,是认为在关于θ的任何统计推断问题中,除了使用样本X所提供的信息外,还必须对θ规定一个先验分布,它是在进行推断时不可或缺的一个要素。

贝叶斯学派把先验分布解释为在抽样前就有的关于θ的先验信息的概率表述,先验分布不必有客观的依据,它可以部分地或完全地基于主观信念。

例如,某甲怀疑自己患有一种疾病A,在就诊时医生对他测了诸如体温、血压等指标,其结果构成样本X。

引进参数θ:有病时,θ=1;无病时,θ=0。

X的分布取决于θ是0还是1,因而知道了X有助于推断θ是否为1。

按传统(频率)学派的观点,医生诊断时,只使用X提供的信息;而按贝叶斯学派观点,则认为只有在规定了一个介于0与1之间的数p作为事件{θ=1}的先验概率时,才能对甲是否有病(即θ是否为1)进行推断。

p这个数刻画了本问题的先验分布,且可解释为疾病A 的发病率。

先验分布的规定对推断结果有影响,如在此例中,若疾病A的发病率很小,医生将倾向于只有在样本X显示出很强的证据时,才诊断甲有病。

在这里先验分布的使用看来是合理的,但贝叶斯学派并不是基于“p是发病率”这样一个解释而使用它的,事实上即使对本病的发病率毫无所知,也必须规定这样一个p,否则问题就无法求解。

后验分布根据样本X的分布Pθ及θ的先验分布已知X=x的条件下,θ的条件分布π(θ|x)。

因为这个分布是在抽样以后才得到的,故称为后验分布。

贝叶斯学派认为:这个分布综合了样本X及先验分布π(θ)所提供的有关的信息。

抽样的全部目的,就在于完成由先验分布到后验分布的转换。

如上例,设p=P(θ=1)=0.001,而π(θ=1|x)=0.86,则贝叶斯学派解释为:在某甲的指标量出之前,他患病的可能性定为0.001,而在得到X后,认识发生了变化:其患病的可能性提高为0.86,这一点的实现既与X有关,也离不开先验分布。

计算后验分布的公式本质上就是概率论中著名的1763年的文章的一个重要内容。

推断方法贝叶斯推断方法的关键在于所作出的任何推断都必须也只须根据后验分布π(θ│X),而不能再涉及X的样本分布Pθ。

相关文档
最新文档