模式识别课件2.3 正态分布时的统计决策
模式识别(国家级精品课程讲义).ppt
1)识别方便,可以从简单的基元开始,由简至繁。 2)能反映模式的结构特征,能描述模式的性质。 3)对图象畸变的抗干扰能力较强。 主要缺点: 当存在干扰及噪声时,抽取特征基元困难,且易失误。
28
1.1 概述-模式识别的基本方法
三、模糊模式识别
模式描述方法: 模糊集合 A={(a,a), (b,b),... (n,n)}
p(x)
X2 1
1
p (x 1) p ( x 2 )
2Fra Baidu bibliotek
X1
2
x
45
1.3 随机矢量的描述
46
1.3 随机矢量的描述
(二)随机矢量的数字特征:
其中, 的分量:
i E[ Xi ] xi p(xi )dxi
...
xi p(x1, x2,..., xn )dx1dx2...dxn Xi
可处理一些环境信息十分复杂,背景知识不清楚,推 理规则不明确的问题。允许样本有较大的缺损、畸变。 主要缺点: 模型在不断丰富与完善中,目前能识别的模式类还不 够多。
32
1.1 概述-模式识别的基本方法
五、逻辑推理法(人工智能法)
模式描述方法: 字符串表示的事实
模式判定: 是一种布尔运算。从事实出发运用一系列规
车牌、车型。
语音识别(Speech recognition)
哈工大模式识别课件.pptx
模式识别 – 绪论
例2.2
ω对2一类大代批表人正进常行人癌。症已普知查先,验设概ω率1:类代表患癌症,
P1 0.005, P2 0.995
以一个化验结果作为特征x: {阳性,阴性},患癌症的 人和正常人化验结果为阳性的概率分别为:
P x 阳性 1 0.95,P x 阳性 2 0.01
特征提取与选 择
识别结果 模式分类
分类 训练
分类器设计
模式识别 – 绪论
六、模式识别问题的描述
给定一个训练样本的特征矢量集合:
D x1, x2, , xn, xi Rd
分别属于c个类别:
1,2, ,c
设计出一个分类器,能够对未知类别样本x进行分类
y g x, Rd 1, ,c
模式识别 – 绪论
模式识别
模式识别
授课教师:刘家锋
模式识别
第一章 绪论
模式识别 – 绪论
一、模式识别的概念
什么是模式识别? 模式识别研究的内容?
模式识别 – 绪论
二、模式识别的应用
工业用途:产品质量检验,设备故障检测,智 能机器人的感知系统;
商业用途:钱币的自动识伪,信函的自动分拣, 电话信息查询,声控拨号;
《模式分类》,机械工业出版社,Richard O.
Duda
《模式识别》(第二版),清华大学出版社,边
第3章-正态分布时的统计决策
第3章 正态分布时的统计决策
在统计决策理论中,涉及到类条件概率密度函数)|(i w x P 。对许多实际的数据集,正态分布通常是合理的近似。如果在特征空间中的某一类样本,较多地分布在这一类均值附近,远离均值点的样本比较少,此时用正态分布作为这一类的概率模型是合理的。另外,正态分布概率模型有许多好的性质,有利于作数学分析。概括起来就是: (1) 物理上的合理性 (2) 数学上的简单性
下面重点讨论正态分布分布及其性质,以及正态分布下的Bayes 决策理论。
3.1 正态分布概率密度函数的定义及性质 1.单变量正态分布 定义:])(21ex p[21
)(2
σμσπρ--=
x x
(3.1-1)
其中:μ为随机变量x 的期望,也就是平均值;
2σ为
x 的方差,σ为均方差,又称为标准差。
⎰∞∞
-⋅==dx x x x E )()(ρμ (3.1-2)
⎰
∞∞
-⋅-=dx x x )()(22
ρμσ
(3.1-3)
概率密度函数的一般图形如下:
)(x ρ具有一下性质:
)(,0)(∞<<-∞≥x x ρ
1)(=⎰∞
∞-dx x ρ (3.1-4)
从)(x ρ的图形上可以看出,只要有两个参数2σμ和就可以完全确定其曲线。为了简单,常记)(x ρ为),(2σμN 。若从服从正态分布的总体中随机抽取样本x ,约有95%的样本落在)2,2(σμσμ+-中。样本的分散程度可以用σ来表示,σ越大分散程度越大。
2.多元正态分布 定义:∑---∑=
-)]()(21
ex p[|
|)2(1)(12
12μμπρx x x T d
第2章_贝叶斯决策
Neyman-Pearson准则
❖ 问题:先验概率和损失未知
通常情况下,无法确定损失。 先验概率未知,是一个确定的值 某一种错误较另一种错误更为重要。
❖ 基本思想:
要求一类错误率控制在很小,在满足此条件的前 提下再使另一类错误率尽可能小。
用lagrange乘子法求条件极值
❖ 决策准则 ?
Neyman-Pearson准则
❖ 最小错误率准则的等价形式
❖ Neyman-Pearson准则
两者都以似然比为基础,在未知先验概率时使用 Neyman-Pearson准则。
Bayes决策准则
❖ 最小错误率准则 ❖ 最小风险准则 ❖ Neyman-Pearson准则
❖ 最小最大决策准则
这时需要采用统计方法,对模式样本的统计特 性进行观测,分析属于哪一类的概率最大。此 时要按照某种判据分类,如,分类错误发生的 概率最小,或在最小风险下进行分类决策等。
贝叶斯决策理论
❖ 引言
❖ 贝叶斯决策常用的准则 ❖ 分类器,判别函数,决策面 ❖ 正态分布的判别函数
引言
❖ 机器自动识别分类,能不能避免错分类,做到百分 之百正确?怎样才能减少错误?
❖ 引言
❖ 贝叶斯决策常用的准则
❖ 分类器,判别函数,决策面 ❖ 正态分布的判别函数
Bayes决策准则
模式识别郝旷荣Chap2(MSSB-HKR)
§2.1 引 言 §2.2 几种常用的决策规则 §2.3 正态分布时的统计决策 §本章小节 §本章习题
1
第二章 贝叶斯决策理论与 统计判别方法
本章要点 1. 机器自动识别出现错分类的条件,错分类的
可能性如何计算,如何实现使错分类出现可能 性最小——基于最小错误率的Bayes决策理论 2. 如何减小危害大的错分类情况——基于最小 错误风险的Bayes决策理论 3. 模式识别的基本计算框架——制定准则函数, 实现准则函数极值化的分类器设计方法
13
2.2.1 基于最小错误率的贝叶斯决策
例——癌细胞的识别 还必须利用所抽取到的d维观测向量。为简单起见, 假定d=1,并已知这两类的类条件概率密度函数分布 已知,如图2.1所示,其中P(x|ω1)是正常细胞的属性 分布,P(x|ω2)是异常细胞的属性分布。那末,当观 测向量为X值时,它属于各类的概率又是多少呢?为 此我们可以利用贝叶斯公式, 来计算这种条件概率, 称之为状态的后验概率P(ωi|X)。
P(ωK|X)指在X出现条件下,样本为ωK类的概率。 一个事物在某条件下出现的概率P(*|#)与该事件在不
带任何条件下出现的概率(写成P(*))是不相同的。例 如全世界人口有60亿。因此你见到一个人在不带任 何条件下,有20%的可能性是中国人P(*)=0.2,但是 当有条件时(地理条件),这个值会改变。
模式识别(研究生大纲)
模式识别
课程编码:
课程英文译名:Pattern Recognition
课程类别:学位课
开课对象:模式识别与智能系统开课学期:第2学期
学分: 3 学分;总学时: 48 学时;理论课学时:48 学时;
实验学时:0 学时;上机学时:
先修课程:学习本课程之前,应先学习《概率论》、《线性代数》课程。
教材:《模式识别》清华大学出版社,2000年1月,第二版
参考书:【1】《数字图像处理》 Kenneth.R.Castleman著,朱志刚等译,电子工业出版社 1998年9月
一、课程的性质、目的和任务
《模式识别》是模式识别与智能系统硕士生一门学位课。模式识别就是利用计算机对某些物理现象进行分类,在错误概率最小的条件下,使识别的结果尽量与事物相符。本课程的任务是使学生掌握模式识别的基本原理和方法,了解模式识别在实际系统中的应用。
二、课程的基本要求
通过本课程的学习,要求重点掌握统计模式识别的基本理论和应用。掌握统计模式识别方法中的特征提取和分类决策。掌握特征提取和选择的准则和算法,掌握
监督学习的原理以及分类器的设计方法。基本掌握非监督模式识别方法。了解应用人工神经网络和模糊理论的模式识别方法。掌握模式识别的应用和系统设计。
三、教学方式
课程采用教师课堂讲授和学生课外自学相结合的教学方式。教师课堂讲模式识别方面的核心内容,学生通过阅读参考书和文献资料,进一步深入了解课程的最新研究成果。
四、课程的主要教学内容和学时分配
授课时数:48学时
主要内容:
第一章绪论
1.1 模式和模式识别的概念
1.2 模式识别系统
1.3 关于模式识别的一些基本问题
2 贝叶斯决策理论
1 X 1
1 X 2
„
xd
例题:教材23页,套公式
2.3 正态分布时的统计决策
贝叶斯分类器的结构可由条件概率密度 和先验概率来决定 最受青睐的密度函数——正态分布,也 称高斯分布
合理性:中心极限定理表明,在相当一般的 条件下,当独立随机变量的个数增加时,其 和的分布趋于正态分布 简易性
针对⑵,如果允许的话,可以避开使用损失函数 而采用最小误判概率准则 针对⑶ ,N-P准则
2.2.5 分类器、判别函数及决策面
应用前述Bayes决策规则,设计分类器对 观察量实施分类 用于表达决策规则的某些函数称为判别 函数;是直接用来对模式样本进行分类 的准则函数 对于c类问题,按照决策规则把d维特征 空间分成c个决策域,划分决策域的边界 面称为决策面
例如识别一块模板是不是直角三角形,只要 凭“三条直线边闭合连线和一个直角”这个 特征,测量它是否有三条直线边的闭合连线 并有一个直角,就完全可以确定它是不是直 角三角形 这种现象是确定性的现象
作为统计判别问题的模式分类
但在现实世界中,由许多客观现象的发生,就 每一次观察和测量来说,即使在基本条件保持 不变的情况下也具有不确定性 只有在大量重复的观察下,其结果才能呈现出 某种规律性,即对它们观察到的特征具有统计 特性 特征值不是一个确定的向量,而是一个随机向 量 此时,只能利用模式集的统计特性来分类,以 使分类器发生错误的概率最小
第2章统计决策方法
min P1(e)
s.t.P2 (e) 0 0
2020/7/15
软件工程专业
• Lagrange乘子法将有约束极值问题问题转化 为
min P1(e) (P2 (e) 0 )
2 P x 1 dx 1 P x 2 dx 0
其中:为代定常数,称为Lagrange乘子。
2020/7/15
• 理解本软件章工的程关专业键
– 要正确理解先验概率,类概率密度函数,后验 概率这三种概率
– 对这三种概率的定义,相互关系要搞得清清楚 楚
– Bayes公式正是体现这三者关系的式子,要透彻 掌握。
2020/7/15
软件工程专业
• 统计决策理论
– 是模式分类问题的基本理论之一
• 贝叶斯决策理论
x
1 2
讨论
• 类条件软概件率工程密专度业函数直接用来分类是否合理?
P( X | 1) P( X | 2 ) : 1 P( X | 1) P( X | 2 ) : 2
具有一定的合理性 但是没有考虑先验概率 不满足最小错误率要求
2020/7/15
问题
• 类条软件件工概程率专业和后验概率区别?
– 后验概率: P(ω1|x)和P(ω2|x)
➢ 另一个区R2中的x,条件错误概率为p(w1|x)
因此平均错误率P(e)可表示成
P(e) R1 P(2 | x) p(x)dx R2 P(1 | x) p(x)dx
《正态分布》课件
结论
正态分布是统计学中的重要概念,具有广泛的应用领域。深入理解正态分布有助于我们在实践中进行数据分析 和预测。
《正态分布》PPT课件
# 正态分布 PPT 课件大纲 正态分布是一种常见的概率分布,广泛应用于统计学和科学研究中。
引言
正态分布是一种对称分布,具有许多重要的性质和应用。通过本节课件,我 们将了解正态分布的基本概念和实际应用。
正态分布Fra Baidu bibliotek定义和性质
定义正态分布
正态分布是一种连续型概率分布,其概率密度函数呈钟形曲线。
1
定义标准正态分布
标准正态分布是均值为0,标准差为1的正态分布。
2
概率密度函数
标准正态分布的概率密度函数是标准形式的正态分布。
3
转化为标准正态分布
通过标准化方法,可以将任意正态分布转化为标准正态分布。
正态分布的应用
1 股票市场
正态分布被广泛应用于股票市场的波动性分析和预测。
2 IQ 测试
正态分布在智商测评中用于解释测试结果的分布情况。
平均数和标准差
在正态分布中,平均数和标准差决定了分布的位置和形状。
对称性
正态分布以均值为对称中心,左右两侧呈对称分布。
正态分布的概率密度函数
概率密度函数
正态分布的概率密度函数描述了不同取值的概率分 布情况。
模式识别课件2.3正态分布时的统计决策
04
实际案例分析
基于正态分布的统计决策在人脸识别中的应用
人脸识别是利用计算机技术自动识别人的面部特征,实现身份认证的一种技术。基于正态分布的统计 决策在人脸识别中应用广泛,通过建立人脸特征的统计模型,对输入的人脸图像进行分类和识别。
正态分布的统计决策方法可以处理各种复杂的人脸特征,如面部表情、光照条件、遮挡物等,提高人 脸识别的准确性和鲁棒性。
基于正态分布的统计决策在语音识别中的应用
语音识别是将人类语音转换成文本或 命令的技术。基于正态分布的统计决 策在语音识别中用于特征提取和分类, 通过对语音信号进行统计分析,提取 出说话人的语音特征,然后与预定义 的模型进行匹配,实现语音识别。
概率密度估计
决策边界
在模式识别中,可以利用正态分布的 性质构建决策边界,将不同类别的样 本进行分类。
正态分布可以用于估计某一类别的概 率密度函数,从而判断样本属于某一 类别的可能性。
02
正态分布下的统计决策方法
贝叶斯决策理论
01
贝叶斯决策理论基于贝叶斯定 理,通过已知的先验概率和条 件概率,计算出后验概率,从 而做出最优决策。
在正态分布的情境下,最小错误率贝叶斯决策可以通过计算各类别的后验 概率,选择具有最大后验概率的类别作为决策结果。
模式识别(统计决策方法)PPT课件
目标:
根据特征x判定类别ω ⇔ 计算后验概率 P(i | x)
自动化学院
?
.
8
2.2 最小错误率贝叶斯决策
min P(e) P(e | x) p(x)dx
因为 P(e | x) 0 , p(x) 0,所以上式等价于:
min P(e | x) for all x .而
P(e
|
x)
PP((12
自动化学院
A1
A3
An
B
A2
n
全概率公式: P( Ai )P(B|Ai ) P(B) i 1
.
16
贝叶斯公式推导
设 A1,A2,…,An 是 样 本 空 间 中 的 完 备 事 件 组 且 P(Ai)>0, i=1,2,…,n, 另有一事件B,则有
P( Ai
|
B)
P( Ai B) P(B)
P( Ai )P(B | Ai )
自动化学院
.
20
贝叶斯公式的理解
似然:likelyhood 可能性
因
果
先验
果
因
P(目标是导弹
|目标特征值为X)
P(目标是导弹)P(目标特征值为X|目标是导弹) P(目标特征值为X)
证据
P( Ai
|
B)
P( Ai )P(B P(B)
模式识别-贝叶斯决策.ppt
2021/3/8
5
class-conditional information
类条件概率密度p(x | 1) and p(x | 2)
p(x | 1) and p(x | 2) 描述了同一特征在不同
类别上的分布差异
2021/3/8
6
2021/3/8
7
贝叶斯公式:
P(j | x) = p(x | j) . P (j) / p(x)
j
1,2,...c,
j
i
2021/3/8
24
损失函数对决策阈值的影响
例子
输入信号0,1在信道传递过程中叠加上均值 为零的正态分布噪声,试用最大似然比判 定规则设计分类器
2021/3/8
26
拒绝判决
在C类问题中, a=c+1时, a 表示拒绝判决
2021/3/8
c
R(i | x) (i | j ) p( j | x)
总错误率
P(2 | x) 若 P(2 | x) < P(1 | x)
P(error) P(error, x)dx P(error | x) p(x)dx
P(1 | x) p(x)dx P(2 | x) p(x)dx
2
1
P(1) p(x | 1)dx P(2 ) p(x | 2 )dx
R1
[21P(1) p(x|1) 22P(2 ) p(x|2 )]dx
模式识别课程教学大纲-模式识别原理与技术
课程中文名称:模式识别原理与技术(课程代码:系统生成,不必填写)
课程英文名称:The Principle and Technology of Pattern Recognition
学分:2 总学时:32
开课学院:信息科学与技术学院
层次:学术硕士研究生
主要面向学科(类别):控制科学与工程学科/领域(与培养方案保持一致)
预备知识:概率论与数理统计,最优化理论,数据结构
课程学习目的与要求:
通过本课程的学习,使学生掌握模式识别的基本概念、基本原理、基本分析方法和算法,具有初步设计、实现模式识别中比较简单的分类器算法的能力,从而为学生进一步从事该方向的学习与研究工作打下基础。要求重点掌握统计模式识别方法中的特征提取和分类决策。掌握特征提取和选择的准则和算法,掌握监督学习的原理以及分类器的设计方法。基本掌握非监督模式识别方法。掌握模式识别的应用和系统设计。
课程主要内容:
一、绪论(2学时)
1 模式和模式识别的概念
2 模式识别系统
3 关于模式识别的一些基本问题
二、贝叶斯决策理论(6学时)
1 引言
2几种常用的决策规则
2.1 基于最小错误率的贝叶斯决策
2.2基于最小风险的贝叶斯决策
2.3在限定一类错误率条件下使另一类错误率为最小的两类别决策
2.4判别函数、决策面与分类器设计
3正态分布时的统计决策
3.1正态分布概率密度函数的定义与性质
3.2正态分布概率模型下的最小错误率贝叶斯决策
3分类器的错误率分析
4 小结
三、概率密度函数的估计(4学时)
1. 什么是概率总体的估计?
2 正态分布的监督参数估计
2.1 极大似然估计
统计决策方法概论PPT(56张)
– 类条件概率: P(x|ω1)和P(x|ω2)
• 是在不同条件下讨论的问题 • 即使只有两类ω1与ω2,P(x|ω1)+P(x|ω1)≠1 • P(x|ω1)与P(x|ω2)两者没有联系
问题
• 为什么软先件验工程概专率业和类条件概率密度函数可以作为 已知,而后验概率需要通过计算获得?
模式识别
计软算件机工与程计通专算信业机工与程通学信院工程学院
第二章 统计决策方法
课前思考
• 机器自软件动工识程别专业分类,能不能避免错分类 ? • 怎样才能减少错误? • 不同错误造成的损失一样吗? • 先验概率,后验概率,概率密度函数? • 什么是贝叶斯公式? • 正态分布?期望值、方差? • 正态分布为什么是最重要的分布之一?
2020/9/5
18
平均错误率
•
软件工程专业
(连续情况) (离散情况)
➢ 如果我们把作出w1决策的所有观测值区域称为R1, 则在R1区内的每个x值,条件错误概率为p(w2|x)。
➢ 另一个区R2中的x,条件错误概率为p(w1|x)
因此平均错误率P(e)可表示成
P (e ) R 1P (2 |x )p (x )d x R 2P (1 |x )p (x )dx
2020/9/5
• 理解本软件章工的程关专业键
– 要正确理解先验概率,类概率密度函数,后验 概率这三种概率
模式识别统计决策理论PPT课件
.北京工业大学计算机学院®
1
这一章要讨论:
• 最小错误率贝叶斯决策 • 最小风险贝叶斯决策 • Neyman-Pearson决策(在限定一类错误
率的条件下,使另一类错误率最小的两 类决策问题) • 最小最大决策 • 序贯决策(Sequential Decision)
.北京工业大学计算机学院®
• 抽样、试验设计、估计、假设检验、回 归分析…..等推断方法
.北京工业大学计算机学院®
4
2.1 引言
• 统计理论要解决的是从数据中做出一些 推断、它为解决随机观测事件的决策过 程 提供了理论基础。
• PR中的分类问题是根据识别对象特征的 观测值,将其分到相应的类别中去。
• 而统计决策理论是模式分类的主要理论 和工具之一。
• 利用贝叶斯公式: px ωi Pr ωi Pr ωi x 2 px ωiPrωi
i 1
.北京工业大学计算机学院®
10
• 得到的Pr[ωi|x] 称为状态(正常、异常)
的后验概率。上述的贝叶斯公式,通过观测 到的x,把先验概率转换为后验概率。
• 这时,基于错误率最小的贝叶斯决策规则为: ω1
.北京工业大学计算机学院®
12
3) 若
lx
px ω1 px ω2
Prω2 ,则 Prω1
ω1 x
2-模式识别原理课件-第3章--判别函数及几何分类法
增广权向量的表示:点、有向线段。
2. 线性分类
判别函数形式已定,只需确定权向量。
类:X11,X12,…,X1p
类: X21,X22,…,X2q
设增广样本向量:
使d(X)将ω1和 ω2分开,需满足
给ω2的q个增广模式乘以(-1),统一为
, 其中
—— 样本的规范化过程。
对每个已知的X,d(X)=0在权空间确定一个超平面,共(p+q)个。
在权空间中寻找向量W使判别函数d(X)能把ω1类和ω2类 分开,就是寻找一个权向量,其在(p+q)个超平面的正侧的 交迭区域里(W的解区)。
若 ,则 类;
或拒绝
将某一未知模式 X 代入:
维数=3时:判别边界为一平面。 维数>3时:判别边界为一超平面。
d(X) 表示的是一种分类的标准,它可以是1、2、3维的, 也可以是更高维的。
判别界面的正负侧,是在训练判别函数的权值时确定的。
原因:
一种类别模式的分布要比M-1类模式的分布更为聚集, 分法受到的限制条件少,故线性可分的可能性大。
1.非线性多项式函数 非线性判别函数的形式之一是非线性多项式函数。
3.3 广义线性判别函数
目的: 对非线性边界:通过某映射,把模式空间X变成X*,以便 将X空间中非线性可分的模式集,变成在X*空间中线性可分的 模式集。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
⑶不相关性等价于独立性
不相关与独立的定义:
若
E{xi xj}= E{xi}·E{xj}
则定义随机变量xi和xj是不相关的。
若
p(xi,xj)= p(xi) p(xj)
则定义随机变量xi和xj是独立的。
2.3.1正态分布概率密度函数的定义及性质
一般情况下相关与独立的关系
独立性是比不相关性更强的条件,独立性要求
2.3.1正态分布概率密度函数的定义及性质
⑵等密度点的轨迹为一超椭球面
2(xμ)T1(xμ)
为x到μ的Mahalanobis距离的平方。所以等密 度点轨迹是x到μ的Mahalanobis距离为常数的 超椭球面。这个超椭球体大小是样本对于均 值向量的离散度度量。
可以证明对应于Mahalanobis距离为的超椭球
在正态分布中不相关性等价于独立性。 就随机向量x=[x1,x2,…xn]T进行证明。
2.3.1正态分布概率密度函数的定义及性质
证明: 根据xi与xj互不相关的定义,可求得:
i 2 j E [ x i (i) x j (j ) E ] ( x i i) E ( x j j ) 0
i,j=1,2,…,d;i≠j
多元正态分布被均值向量μ和协方差矩阵 ∑所完全确定。
均值向量μ由d个分量组成; 协方差矩阵∑由于其对称性故其独立元素有
d2 d
d(d1)
d
2
2
多元正态分布概率密度函数常记为
p(x)~N(μ,∑)
2.3.1正态分布概率密度函数的定义及性质
⑵等密度点的轨迹为一超椭球面
从正态分布总体中抽取的样本大部分落在由μ和∑所确
E[(xd d)(x1 1)] E[(xd d)(xd d)]
2.3.1正态分布概率密度函数的定义及性质
协方差的各分量为:
i2jE[(xi i)(xj j)]
(xii)(xjj)p(xi,xj)dixdjx
协方差矩阵总是对称阵,协方差矩阵为
2 11
2 12
2 12
2 22
标准差
σ2为x的方差
E{x}
x(px)dx
2(x)2p(x)dx
2.3.1正态分布概率密度函数的定义及性质
➢ 概率密度函数应满足 下列关系式 p(x)≥0 (-∞<x<∞)
μ-kσ
μ+kσ
p(x)dx1
k=1 P(μ-kσ<x< μ+kσ)=0.68 k=2 P(μ-kσ<x< μ+kσ)=0.95 k=3 P(μ-kσ<x< μ+kσ)=0.99
2.3 正态分布时的统计决策
正态分布概率密度函数的定义及 性质
多元正态概型下的最小错误率贝 叶斯判别函数和决策面
2.3.1正态分布概率密度函数的定义及性质
㈠2单.3变.1量正正态态分分布布概率密度函 数 单的变量定正义态分及布概性率质密度函数定义为随机变量
x的期望
p(x) 21 exp1 2({ x )2}
p (x i) p (x )d 1 d x 2 x d i 1 d x i 1 x d dx
2.3.1正态分布概率密度函数的定义及性质
㈡ 多元正态分布
E{(x μ)(x μ)T}
x1 1
E x1 1
xd d
xd d
E[(x1 1)(x1 1)] E[(x1 1)(xd d)]
p(x)~N(μ,σ2)
2.3.1正态分布概率密度函数的定义及性质
㈡ 多元正态分布
⒈多元正态分布的概率密度函数
p(x) 1 ex p1{ (xμ)T1(xμ)}
d
1
(2)2||2
2
μE(x)xp(x)dx Ed
i E { x i} E dx ip (x )d x x ip (x i)di x
|∑|≠0)。
2.3.1正态分布概率密度函数的定义及性质
⒉多元正态分布的性质
⑴参数μ和∑对分布的决定性 ⑵等密度点的轨迹为一超椭球面 ⑶不相关性等价于独立性 ⑷边缘分布和条件分布的正态性 ⑸线性变换的正态性 ⑹线性组合的正态性
2.3.1正态分布概率密度函数的定义及性质
⑴参数μ和∑对分布的决定性
体积是
1
V Vd | |2 d
其中Vd是d维单位超球体的体积。
2.3.1正态分布概率密度函数的定义及性质
⑵等密度点的轨迹为一超椭球面
d 2
Vd
(
d 2
)!
2d
d 1 2
(
d
2
1 )!
d!
d为偶数 d为奇数
1
• 对于给定的维数,样本离散度直接随| | 2 而变。
2.3.1正态分布概率密度函数的定义及性质
2 1d
2 2d
2 1d
2 2d
2 dd
2.3.1正态分布概率密度函数的定义及性质
协方差矩阵总是非负定阵。 对于任意随机向量x,xT∑x是∑的二次型。
如果对x≠0的一切x 有 xT∑x≥0 都成立,则称∑为非负定阵。 若xT∑x>0,则∑为正定阵。 对于正定矩阵,各阶主子式非零(包括
p(xi,xj)= p(xi) p(xj) 对于xi和xj都成立。 不相关性是两个随机变量的积的期望等于两个 随机变量的期望的积,它反映了xi与xj总体的性 质。
若xi和xj相互独立,则它们之间一定不相关;反 之则不一定成立。
2.3.1正态分布概率密度函数的定义及性质
多元正态分布情况
对多元正态分布的任意两个分量xi和xj而 言,若xi与xj互不相关,则它们之间一定 独立。
定的一个区域里。从一个以均值μ为中心的云团内的二
维高斯分布中取出的样本。椭圆显示了等概率密度的
高斯分布轨迹。
p(x)
x2
x2 μ2
μ
μ2
μ1 x1
μ
μ1
x1
2.3.1正态分布概率密度函数的定义及性质
⑵等密度点的轨迹为一超椭球面
p(x) 1 ex p1{ (xμ)T1(xμ)}
d
1
(2)2||2来自百度文库
2
2.3.1正态分布概率密度函数的定义及性质
⑵等密度点的轨迹为一超椭球面
当指数项为常数时,密度p(x)值不变,因此等 密度点应是此式的指数项为常数的点,即应满
足
(xμ)T1(xμ)常数
证明上式的解是一个超椭球面,且它的主轴方 向由∑阵的特征向量所决定,主轴的长度与相应 的协方差矩阵∑的本征值成正比。在数理统计中 上式所表示的数量:
2(xμ)T1(xμ)
因此协方差矩阵∑就成为对角阵
2 11
0
0
2 dd
d
| |
2 ii
i1
1
2 11
0
1
0
1
2 dd
1d