贝叶斯分类器 讲课
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
贝叶斯分类器在医疗领域的应用举例
考虑一个医疗诊断问题,有两种可能的假设:(1)病 人有癌症。(2)病人无癌症。样本数据来自某化验测试, 它也有两种可能的结果:阳性和阴性。假设我们已经有先验 知识:在所有人口中只有0.008的人患病。此外,化验测试 对有病的患者有98%的可能返回阳性结果,对无病患者有97% 的可能返回阴性结果。
贝叶斯定理
朴素贝叶斯分类器
朴素贝叶斯分类的流程可以由下图表示:
优劣分析
• 优点:简单高效
• 缺点:要求严格的条件独立假设,对于属 性相关的分类问题,效果不理想(方案:贝 叶斯网络) • 缺点:朴素贝叶斯在大多数情况下不能对 类概率做出非常准确的估计
例题解答
P(购买汽车=是)=0.7 P(购买汽车=否)=0.3 (1)P(家庭情况=一般|购买汽车=是)=4/7 P(家庭情况=一般|购买汽车=否)=1
12
Байду номын сангаас
贝叶斯分类器
分类分析
• 分类分析主要解决的问题是利用训练样本 集获得分类函数或分类模型。分类模型能 很好的拟合训练样本集中属性集与类别之 间的关系,也可以预测一个新样本属于哪 一类 • 分类:贝叶斯分类器 • 决策树 • 支持向量机
聚类分析与分类分析的区别
聚类分析不知道数据点的类别标签,需要自己自 动分出来来,简单说就是一堆东西混到一起了, 你要把它们区分开来谁和谁是一类的 分类分析本身已经知道每个数据点属于哪个类, 它的任务是找到最佳的分类方法,也就是在你这 种分类方法下分类的分类效果是最佳的
11
上面的数据可以用以下概率式子表示: P(cancer)=0.008;P(无cancer)=0.992 P(阳性|cancer)=0.98;P(阴性|cancer)=0.02 P(阳性|无cancer)=0.03;P(阴性|无cancer)=0.97 假设现在有一个新病人,化验测试返回阳性,是否将病 人断定为有癌症呢? 我们可以来计算极大后验假设: P(阳性|cancer)p(cancer)=0.98*0.008 = 0.0078 P(阳性|无cancer)*p(无cancer)=0.03*0.992 = 0.0298 因此,应该判断为无癌症。
(2)P(信用级别=优秀|购买汽车=是)=4/7 P(信用级别=优秀|购买汽车=否)=0 (3)P(月收入=12K|购买汽车=是)=1/7 P(月收入=12K|购买汽车=否)=0/3=0
• P(X)=P(购买汽车=是)*P(家庭情况=一般|购买汽车=是)*P(信用 级别=优秀|购买汽车=是)*P(月收入=12K|购买汽车=是)+P(购买 汽车=否)*P(家庭情况=一般|购买汽车=否)*P(信用级别=优秀|购 买汽车=否)*P(月收入=12K|购买汽车=否) • =7/10*4/7*4/7*1/7+3/10*1*0*0=0.03265 • P(X=(一般,优秀,12k)|Y=是)=P(家庭情况=一般|购买汽车=是) *P(信用级别=优秀|购买汽车=是)*P(月收入=12K|购买汽车=是)= 4/7*4/7*1/7=0.04664 • P(Y=是)=7/10 • • • • P(Y=是|X=(一般,优秀,12k)) =P(Y)*P(X|Y)/P(X) =7/10*0.04664/0.03265 =1