多元统计分析知识点 多元统计分析课件
《多元统计分析》课件
数据预处理和清洗
1
数据清洗
解决缺失值、异常值和重复数据问题。
2
标准化处理
对数据进行标准化、归一化和正态化处理。
3
变量选择
学习如何选择影响结果的重要变量。
描述性统计分析
1 中心趋势分析
运用平均值、中位数和众数等指标揭示数据的集中情况。
2 离散程度分析
探索数据的离散程度,如标准差和方差。
3 分布形态分析
识别数据分布的形态,如正态分布和偏态分布。
相关分析
线性相关
学习如何评估变量之间的 线性关系。
非线性相关
探索变量之间的非线性关 系,如曲线和曲面拟合。
相关系数
了解相关系数的计算方法 及其解释。
统计显著性检验
1
假设检验
学习如何根据样本数据推断总体参数。
2
置信区间
了解如何估计总体参数的范围。
3
显著性水平
确定显著性水平及其对推断的影响。
回归分析
线性回归
构建线性回归模型来预测因变量。
回归诊断
评估回归模型用。
多元方差分析
单因素设计
比较多个组之间的差异。
多重比较
确定组之间的具体差异。
二因素设计
考虑两个自变量对因变量的 影响。
《多元统计分析》PPT课件
探索多元统计分析的定义、概念和应用。从数据预处理到分析模型选择,帮 助解决实际问题。了解多元统计软件和未来发展方向。
数据结构和类型
结构
探索多元数据的各种结 构,包括矩阵、向量和 表格。
类型
了解多元数据的分类, 如连续型、离散型、定 类型和定序型。
示例
使用实际案例来展示多 元数据的结构和类型。
《多元统计分析》PPT课件
gi (Y ) 2y1i i1i
将上式中提-2,得
gi
(Y )
2(y
1 i
0.5i1i)
令 fi (Y ) (y1i 0.5i1i)
则距离判别法的判别函数为:
§2 距离判别
(一)马氏距离
距离判别的最直观的想法是计算样品到第i类 总体的平均数的距离,哪个距离最小就将它判 归哪个总体,所以,我们首先考虑的是是否能 够构造一个恰当的距离函数,通过样本与某类 别之间距离的大小,判别其所属类别。
设 x (x1, x2,, xm )和 y ( y1, y2,, ym ) 是从
样本,来检验方法是否稳定的问题。
判类
原类
G1 G2 Gk
G1
G2
合计
Gk
m11
m12
m1k
n1
m21
m22
m2k
n2
mk1
mk 2
mkk
nk
简单错判率:p
1 n
k i 1
k
mij
j 1
ji
加权错判率:
设qi是第i类的先验概率, pi是第i类的错判 概率,则加权错判率为
1 1
1
1 1
)
2y1(1 2 ) (1 2 )1(1 2 )
2[y
(1
2
2
)]1 (1
2
)
令 1 2
2
1(1 2 ) (a1, a2,, ap )
多元统计分析 多元正态分布及PPT课件
1
e e dx
itx
(
x) 2 2
2
2
u ( x ) /
1
eit
(u
)
e
u2 2
d
u
2
12
第12页/共83页
第二章 多元正态分布及参数的估计 §2.2 多元正态分布的性质1
eit
1
1[u2 2itu(it )2 (it )2 ]
e2
du
2 eit
1 1 (uit )2 1 (it )2
e e du 2
2
2
exp[it 1 t 2 2 ] 1
1 (uit )2
e2
du
2
2
exp[it 1 t 2 2 ]
2
13
第13页/共83页
第二章 多元正态分布及参数的估计
§2.2 多元正态分布的性质1
当 X~N(0,1)时,φ(t)=exp[-t 2 /2].
性质1 设U= (U1,…,Uq)′为随机向量,
第二章 多元正态分布及参数的估计
§2.2 多元正态分布的性质2
Z=BX+d d= B(AU+μ)+d = (BA)U+(Bμ+d)
由定义2.2.1可知
Z ~Ns(Bμ+d, (BA)(BA)),
Z ~Ns(Bμ+d, BΣB). (这里Σ=AA).
20
第20页/共83页
第二章 多元正态分布及参数的估计
23
第23页/共83页
第二章 多元正态分布及参数的估计
§2.2 多元正态分布性质2的推论
例f (2x.11,.1x2()X1,X212)的e联12合(x12密x22度)[1函数x为1x2e
《多元统计分析》课件
采用L1正则化,通过惩罚项来选择最重要 的自变量,实现特征选择和模型简化。
比较
应用场景
岭回归适用于所有自变量都对因变量有影 响的情况,而套索回归更适用于特征选择 和模型压缩。
适用于数据集较大、自变量之间存在多重 共线性的情况,如生物信息学数据分析、 市场细分等。
主成分回归与偏最小二乘回归
主成分回归
适用于自变量之间存在多重 共线性的情况,同时要求高 预测精度,如金融市场预测 、化学计量学等。
06 多元数据的典型相关分析
典型相关分析的基本思想
01
典型相关分析是一种研究多个 随机变量之间相关性的多元统 计分析方法。
02
它通过寻找一对或多个线性组 合,使得这些线性组合之间的 相关性达到最大或最小,从而 揭示多个变量之间的关系。
原理
基于最小二乘法原理,通过最小化预 测值与实际值之间的平方误差来估计 回归系数。
应用场景
适用于因变量与自变量之间存在线性 关系的情况,如预测房价、股票价格 等。
注意事项
需对自变量进行筛选和多重共线性诊 断,以避免模型的不稳定性和误差。
岭回归与套索回归
岭回归
套索回归
是一种用于解决多重共线性的回归方法, 通过引入一个小的正则化项来稳定系数估 计。
层次聚类
01
步骤
02
1. 将每个数据点视为一个独立的集群。
2. 计算任意两个集群之间的距离或相似度。
03
层次聚类
01 3. 将最相近的两个集群合并为一个新的集群。 02 4. 重复步骤2和3,直到满足终止条件(如达到预
设的集群数量或最大距离阈值)。
03 应用:适用于探索性数据分析,帮助研究者了解 数据的分布和结构。
《实用多元统计分析》课件
常用的求解方法有主成分法、最大似然法、最小二 乘法等。
03
这些方法通过迭代计算,可以求得因子载荷的值, 进而得到公共因子。
因子分析的应用实例
01
因子分析在市场调研中广泛应 用于品牌形象、消费者行为等 方面的研究。
02
通过分析消费者的调查数据, 可以提取出影响消费者行为的 公共因子,进而了解消费者的 需求和偏好。
《实用多元统计分析 》ppt课件
目录
CONTENTS
• 多元统计分析概述 • 多元数据的描述性分析 • 多元数据的可视化分析 • 多元线性回归分析 • 主成分分析 • 因子分析
01 多元统计分析概述
多元统计分析的定义
多元统计分析
在统计学中,对多个随机变量进行统 计分析的方法和理论。它研究多个变 量之间的关系,以及如何利用这些变 量进行预测和推断。
便地比较不同对象在多个变量上的表现,有助于发现数据的规律和异常。
星型图和脸谱图
要点一
总结词
星型图和脸谱图可以用于表示分类数据,通过颜色的变化 展示不同类别的数据分布情况。
要点二
详细描述
星型图是一种将分类数据可视化为星星形状的图形,每个 星星的各个部分表示不同类别的数据。脸谱图则是在星型 图的基础上进行改进,将星星的各个部分表示为不同颜色 的区域,更加直观地展示不同类别的数据分布情况。通过 观察星型图和脸谱图,可以快速了解数据的分类情况和各 类别的数据分布情况,有助于发现数据的规律和异常。
通过比较实际数据与理论分布来评估 数据是否符合某种分布。
03 多元数据的可视化分析
散点图矩阵
总结词
通过散点图矩阵,可以同时展示多个变量之间的关系,有助于发现变量之间的潜在关联。
多元统计分析——对应分析 ppt课件
行轮廓矩阵为:
p11/ p1. N(R)p21/ p2.
p12/ p1.
p22/ p2.
pn1/ pn. pn2/ pn.
p1p/ p1. p2p/ p2.
pnp/ pn.
由此,我们可以将属性变量A的n个取值可 以用P维空间的n个点来表示。n个点的坐 标即为该行轮廓矩阵。
但是,因为原始变量的数量等级可能不同,所以 为了尽量减少各变量尺度差异,将行轮廓中的各列 元素均除以其期望的平方根。得矩阵D(R)
在着的简单对应关系。由特征根和特征向量的性质, A和B有相同的非零特征根。
设 k 是A=Z’Z的非零特征根,则 Z Zku ku k
在上式的两边都左乘Z,则
Z Z ( Z k ) u k ( Z u k )
可见 k 也是ZZ’的特征根,相应的特征向量是Zu k
三、对应图
设12… l(0<i<min(n,p))为矩阵A和B的 非零特征根,其相应的特征向量为
多元统计分析——对应分析
3
列联表
B1 B2
Bj
A1 n11 n12 … n1j
…
A2 n21 n22
n2j
Bp n1p n1. n2p n2.
Ai ni1 ni2
nij
nip ni.
An nn1 nn2
nnj
nnp nn.
n.1
多元统计分析(数学建模)ppt课件
体现了正相关趋
50
势
年龄
40
30 800
性别
女职工
男职工
900
1000
1100
基本工资
8
绘制散点图
(二)基本操作步骤 (1)菜单选项:graphs->scatter (2)选择散点图类型:
simple:简单散点图(显示一对变量的散点图) overlay:重叠散点图(显示多对变量的散点图)
(3)选择x轴和y轴的变量 (4)选择分组变量(set markers by):分别以不同颜色
2020/6/4
2266
目录 上页 下页 返回 结束
图10-1是一个简单的路径路,A是父亲智商,B是母亲智商, C1、C2是两个成年子女的智商,e1, e2是与A,B不相关的另外原因变 量。一般来说,父母亲的智商之间不存在关系;父母亲的智商对 子女的智商存在因果关系,用单箭头表示,子女的之间,存在相关 关关系,用双箭头表示。箭头上的字母表示路径系数,路径系数反 应原因变量对结果变量的相对影响大小。在路径分析中一般采用
2020/6/4
3300
目录 上页 下页 返回 结束
其他变量(A)对内生变量(B)的影响有两种情况 :若A直接通过单向箭头对B具有因果影响,称A 对B有 直接作用(direct effect);若A 对B的作用是间接地通 过其他变量(C)起作用,称A 对B有间接作用( indirect effect),称C为中间变量(mediator variable) 。变量间的间接作用常常由多种路径最终总合而成。图 10-2中,四个外生变量耐用性、操作的简单性、通话效 果和价格既对忠诚度有直接作用,同时通过感知价值对 忠诚度具有间接作用。
tow-tailed:输出双尾概率P. one-tailed:输出单尾概率P
《多元统计分析2》ppt课件
一般用于对样品分类,而相似系数一般用于 对变量聚类。间隔 的定义很多,如极端间隔 、 明考斯基间隔 、欧氏间隔 、切比雪夫间隔 等。
相似系数有相关系数、夹角余弦、列联络数 等。
用VARCLUS过程实现变量聚类分析
┌ Z1=b11x1+b12x2+…+b1mxm │ Z2=b21x1+b22x2+…+b2mxm │…………………………… └ Zm=bm1x1+bm2x2+…+bmmxm
〔2〕
┌ Z1=c11x1+c12x2+…+c1mxm │ Z2=c21x1+c22x2+…+c2mxm 〔3〕 │ …………………………… └ Zm=cm1x1+cm2x2+…+cmmxm
2.旋转后的因子模型
xi=∑bijGj+CiUi 〔i=1,2,…,m;j=1,2,…,p;p<m〕
3.因子得分模型
Gj=∑dijxi 〔i=1,2,…,m;j=1,2,…,p; p<m〕。
第3章 对应分析
第1节 方法的概述
主成分分析、因子分析、变量聚类分析 都是研究变量之间的互相关系。有时,在某 些实际问题中,既要研究变量之间的关系、 还要研究样品之间的关系。不仅如此,人们 往往还希望能在同一个直角坐标系内同时表 达出变量与样品两者之间的互相关系。实现 这一目的的方法,称为对应分析。
因子分析〔Factor Analysis〕就是要找出 某个问题中可直接测量的、具有一定相关性 的诸指标,如何受少数几个在专业上有意义, 又可直接测量到,且相对独立的因子支配的 规律,从而可用诸指标的测定值来间接确定 诸因子的状态。
多元统计分析-第一讲
2024/7/17
18
cxt
❖ 如果:我们想知道我国基础设施发展属于哪 一类型?
运用判别分析
依据:20个国家的分类结果
2024/7/17
19
cxt
❖ 3、变量间的相互联系
一是:分析一个或几个变量的变化是否依赖 另一些变量的变化。(回归分析)
多元线性回归分析,逐步回归分析
定性指标的相关分析,多对多的回归分析
11 159.1 48 72.5
12 164.2 46.5 73
2024/7/17
23
cxt
一元方差分析的结果
━━━━━━━━━━━━━━━━━━━━━━━━━
身高
体重
胸围
── ─────── ──────
──────
组别 平均值 标准差 平均值 标准差 平均值 标准差
─────────────────────────
❖ 多元统计分析优点: 分析问题更全面更透彻
❖ 能使我们对所研究的问题更全面, 更深刻的认识.帮 助我们透过现象看本质,发现事物之间内在的本质 规律。
2024/7/17
9
cxt
二、多元统计分析的内容和方法
❖ 1、简化数据结构(降维问题) 将具有错综复杂关系的多个变量综合成数量 较少且互不相关的变量,使研究问题得到简 化但损失的信息又不太多。
男 161.9 6.8
48.1 8.3
74.4 5.9
女 154.2 5.0
47.3 5.6
77.4 6.6
─────────────────────────
F值
8.7**
0.1
1.3
** P<0.01
❖ 从表可以看出,该校男、女生的身高差异有显著性意义,而体重、胸围
多元统计分析(人大何晓群)绪论PPT课件
考试
期中(20%) 期末(闭卷)(60%) 平时(20%)
上课+作业 注:作业大部分为上机作业,没有上机课,
但课堂上会演示。
18
2024/10/30
、宽等特征来 判别是男或女,根据挖掘出来的动物牙 齿的有关测试指标,判别它属于哪一类 动物、是哪一个时代的。
环境保护
研究多种污染气体的浓度与污染源的排 放和气象因子(风向、风速、温度、湿 度)等之间的相互关系。
14
军事科学 研究某飞机洞库可燃性气体变化的规律以 及对气体浓度的预测。
生态学 对1000个类似的鱼类样本,如何根据测量的特 征如体重、身长、鳍数、鳍长、头宽等,将这 些鱼分成几个不同品种?
12
地质学 在地质勘探中,如何根据岩石样本的多种特征 来判别地层的地址年代,是有矿还是无矿,是 铜矿还是铁矿等?
社会学 调查青年对婚姻家庭的态度、对文化和职业的 要求、对经济收入的态度、对老人的责任、对 相貌的重视等等作主要因素分析以便进行正确 的引导
3
如何同时对多个随机变量的观测数据进 行有效的分析和研究?
做法1:把多个随机变量分开分析(避免 不了变量之间的相关性,会丢失信息, 也不容易取得好的研究结果)。
做法2:同时进行分析研究(采用多元统 计分析方法,通过对多个随机变量观测 数据的分析,来研究变量之间的相互关 系以及揭示这些变量内在的变化规律。 4
某一产品用两种不同的原料生产,产品 的寿命有无显著差异?某商业行业今年 和去年的经营状况有无显著差异?(多 元正态的假设检验)
8
其他领域的应用
工业 企业经济效益的评价? 服装企业如何确定适应大多数顾客的服装的主 要指标以及分类的型号?
农业 如何按照城乡居民消费水平,对我国30个省市 自治区进行分类? 如何根据全国各地区农民生活消费支出情况研 究农民消费结构的趋势?
多元统计分析知识点多元统计分析课件
多元统计分析(1)题目:多兀统计分析知识点研究生___________________________ 专业____________________________ 指导教师________________________完成日期2013年12月目录第一章绪论 (1)§.1什么是多元统计分析 (1)§.2多元统计分析能解决哪些实际问题 (2)§.3主要内容安排 (2)第二章多元正态分布 (2)弦.1基本概念 (2)弦.2多元正态分布的定义及基本性质 (8)1. (多元正态分布)定义 (9)2•多元正态变量的基本性质 (10)§2.3多元正态分布的参数估计X =(X1,X2^|,X p) (11)1•多元样本的概念及表示法 (12)2. 多元样本的数值特征 (12)3」和a 的最大似然估计及基本性质 (15)4.Wishart 分布 (17)第五章聚类分析 (18)§5.1什么是聚类分析 (18)§5.2距离和相似系数 (19)1 • Q—型聚类分析常用的距离和相似系数 (20)2. .......................................................................................................................................... R型聚类分析常用的距离和相似系数 (25)§5.3八种系统聚类方法 (26)1. 最短距离法 (27)2. 最长距离法 (30)3. 中间距离法 (32)4. 重心法 (35)5. 类平均法 (37)6. 可变类平均法 (38)7. 可变法 (38)8. 离差平方和法(Word方法) (38)第六章判别分析 (39)§5.1什么是判别分析 (39)§5.2距离判别法 (40)1、两个总体的距离判别法 (40)2•多总体的距离判别法 (45)§6.3费歇(Fisher)判别法 (46)1•不等协方差矩阵两总体Fisher判别法 (46)2•多总体费歇(Fisher)判别法 (51)§6.4贝叶斯(Bayes)判别法 (58)1•基本思想 (58)2•多元正态总体的Bayes判别法 (59)§6.5逐步判别法 (61)1. 基本思想 (61)2•引入和剔除变量所用的检验统计量 (62)3. .......................................................................................................................................... Bartlett 近似公式 (63)第一章绪论§ 1.1什么是多元统计分析在自然科学、社会科学以及经济领域中,常常需要同时观察多个指标。
多元统计分析ppt课件
dij xik x jk
k 1
❖ 当各变量的单位不同或测量值范围相差很大时,应
先对各变量的数据作标准化处理。最常用的标准化
处理是,令
xi*j
xij
xj s jj
,
i 1, 2,
, n,
j 1, 2,
,p
变其量中的xj样 本1n i均n1 x值ij 和和样s jj 本 n方1差1 i。n1 xij xj
则可求得第一主成分为
y1 t11x1 t21x2 t p1xp t1x
它的方差具有最大值 1 。
❖ 如果第一主成分所含信息不够多,还不足以代表原 始的 p 个变量,则需考虑再使用一个综合变
量 y2 a2x ,为使 y2所含的信息与y1 不重叠,应要求
Cov y1, y2 0
我们在此条件和约束条件 a2a2 1 下寻求向量a2 ,使
❖ 主成分分析的目的就是为了减少变量的个数,因而 一般是不会使用所有 p个主成分的,忽略一些带有
较小方差的主成分将不会给总方差带来大的影响。
❖ 前 m个主成分的贡献率之和
称为主成分 y1, y2,
m
p
i i
i 1
i 1
, ym 的累计贡献率,它表明
y1, y2, , ym解释 x1, x2, , xp的能力。
动态聚类法
❖ 动态聚类法的基本思想是,选择一批凝聚点或给出 一个初始的分类,让样品按某种原则向凝聚点凝聚, 对凝聚点进行不断的修改或迭代,直至分类比较合 理或迭代稳定为止。类的个数k可以事先指定,也可 以在聚类过程中确定。选择初始凝聚点(或给出初始 分类)的一种简单方法是采用随机抽选(或随机分割) 样品的方法。
最短距离法
❖ 定义类与类之间的距离为两类最近样品间的距离, 即
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
多元统计分析(1)题目:多元统计分析知识点研究生专业指导教师完成日期 2013年 12月目录第一章绪论 (1)§1.1什么是多元统计分析 ....................................................................................................... 1 §1.2多元统计分析能解决哪些实际问题 ............................................................................... 2 §1.3主要内容安排 ................................................................................................................... 2 第二章多元正态分布 .. (2)§2.1基本概念 ........................................................................................................................... 2 §2.2多元正态分布的定义及基本性质 .. (8)1.(多元正态分布)定义 ................................................................................................ 9 2.多元正态变量的基本性质 (10)§2.3多元正态分布的参数估计12(,,,)p X X X X '= (11)1.多元样本的概念及表示法 (12)2. 多元样本的数值特征 ................................................................................................ 123.μ和∑的最大似然估计及基本性质 (15)4.Wishart 分布 (17)第五章 聚类分析 (18)§5.1什么是聚类分析 ............................................................................................................. 18 §5.2距离和相似系数 . (19)1.Q —型聚类分析常用的距离和相似系数 ................................................................ 20 2.R 型聚类分析常用的距离和相似系数 ...................................................................... 25 §5.3八种系统聚类方法 (26)1.最短距离法 .................................................................................................................. 27 2.最长距离法 .................................................................................................................. 30 3.中间距离法 .................................................................................................................. 32 4.重心法 .......................................................................................................................... 35 5.类平均法 ...................................................................................................................... 37 6.可变类平均法 .............................................................................................................. 38 7.可变法 .......................................................................................................................... 38 8.离差平方和法(Word 方法) (38)第六章判别分析 (39)§6.1什么是判别分析 ............................................................................................................. 39 §6.2距离判别法 (40)1、两个总体的距离判别法 (40)2.多总体的距离判别法 (45)§6.3费歇(Fisher)判别法 (46)1.不等协方差矩阵两总体Fisher判别法 (46)2.多总体费歇(Fisher)判别法 (51)§6.4贝叶斯(Bayes)判别法 (58)1.基本思想 (58)2.多元正态总体的Bayes判别法 (59)§6.5逐步判别法 (61)1.基本思想 (61)2.引入和剔除变量所用的检验统计量 (62)3.Bartlett近似公式 (63)第一章绪论§1.1什么是多元统计分析在自然科学、社会科学以及经济领域中,常常需要同时观察多个指标。
例如,要衡量一个地区的经济发展,需要观测的指标有:总产值(X1)、利润(X2)、效益(X3)、劳动生产率(X4)、万元生产值能耗(X5)、固定资产(X6)、流动资金周转率(X7)、物价(X8)、信贷(X9)及税收(X10)也就是说一个地区的经济发展,受多种指标共同作用的影响,我们把每一个指标看成一个随机变量,可以单独研究每个随机变量,但这只能揭示该地区经济发展的一个方面,更多的时候需要把把这诸个随机变量一起研究揭示多个随机变量对该地区经济发展的共同影响,以及揭示这些随机变量内在变化规律。
例如,研究某公司的经营状况,需要观测公司的财务指标有:每股净资产(X1)、净资产收益率(X2)、每股收益(X3)、每股现金流(X4)、负债率(X5)、流动比率(X6)及速动比率(X7)。
可以单独研究每个随机变量,更多的时候需要把这诸个随机变量一起研究,揭示这些随机变量内在变化规律。
多元统计分析——研究多个随机变量之间相互依赖关系以及内在统计规律性的一门统计学科。
多元统计分析包括的主要内容:多元(正态)总体的参数估计和假设检验、聚类分析、判别分析、主成分分析、因子分析、对应分析、典型相关分析、多重多元回归分析等。
介绍多元统计分析方法时,需要的时候增加一些线性代数的知识。
§1.2多元统计分析能解决哪些实际问题⑴经济学:对我国32个省市自治区的社会情况进行分析。
⑵工业:服装厂生产服装。
为了适应大多数顾客的需要,如何确定服装的主要指标及分类的型号。
指标:身长、袖长、胸围、腰围、肩宽、肩厚等十几个指标(主要指标:长度、胖瘦)⑶投资组合:§1.3主要内容安排多元(正态)总体的参数估计、聚类分析、判别分析、主成分分析、因子分析、典型相关分析等。
上机操作。
第二章多元正态分布§2.1基本概念1.随机向量的概率分布定义1 将p 个随机变量12,,,p X X X 的整体称为p 维随机向量,记为12(,,,)p X X X X '=在多元统计分析中,仍然将所研究对象的全体称为总体。
一元总体分布函数和分别密度定义:()()F x P X x =≤为随机变量X 的概率分布,记为()X XF x 。
离散型:()k k P X x p == k=1,2,3,…⑴()0k k P X x p ==≥; ⑵1k kp =∑连续型:()()()xF x P X x f t dt -∞=≤=⎰⑴ ()0f t ≥; ⑵()1f t dt +∞-∞=⎰定义2 设12(,,,)p X X X X '=是p 维随机向量,它的多元分别函数定义为111122()=(,,,)(,,,)p p p F x F x x x P X x X x X x =≤≤≤记为()X XF x ,其中记为12=(,,,)R p p x x x x '∈。
定义3 设12(,,,)p X X X X '=是p 维随机向量,若存在有限个或可列个p 维数向量1x ,2x ,3x ,…,记()k k P X x p == (k=1,2,3,…),且满足()0k k P X x p ==≥,1k kp =∑,则称X 为离散型随机向量,称()k k P X x p ==(k=1,2,3,…)为X 的概率分布。
设p 维随机向量()X XF x ,11()=(,,,)p F x F x x x ,若存在一个非负函数12(,,,)p f x x x ,使得对一切12=(,,,)R p p x x x x '∈,有12121212()(,,,)(,,,)px x x p p p F x F x x x f t t t dt dt dt -∞-∞-∞==⎰⎰⎰则称X 为连续随机向量,称12(,,,)X p f x x x 为分布密度函数,易见⑴12(,,,)0p f x x x ≥, ⑵1212(,,,)1p p f t t t dt dt dt ∞∞∞-∞-∞-∞=⎰⎰⎰例1试证函数12()12120,0(,)0x x e x x f x x -+⎧≥≥=⎨⎩其它为随机向量12X X X ⎛⎫= ⎪⎝⎭的密度函数。