矩阵和统计学回顾
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
图中 表示a和b之间的阴 影部分,是指该分布取a至b之间的 概率
Presented By Harry Mills / PRESENTATIONPRO
概率与统计相关知识
随机变量的矩(moments)
• 从统计学角度来说,一个随机变量X的第n阶矩可以定义为:
E[( x ) ] ( x ) n f ( x)dx
Presented By Harry Mills / PRESENTATIONPRO
概率与统计相关知识
随机抽样
• 从总体中抽取一定数量的样本进行观察,并根据样本对总体的代 表性及观察值来对总体进行推论的过程即为抽样。 • 简单随机抽样可以使随机抽取的n个单位的任意组合具有均等的机 会。随机变量X观察值的随机样本是独立同分布的随机变量 的集合,其中的每个变量均具有和X相同的概率分布。 • 不含任何未知参数的随机变量观察值的函数称为样本统计量,最 常用的包括样本均值(用 表示)和样本方差(用 表示): 样本均值: 样本方差:
Presented By Harry Mills / PRESENTATIONPRO
概率与统计相关知识
• 三阶矩被称为偏度,度量了随机变量分布的非对称程度。如果偏 度统计量为正值,说明X的分布具有右侧长尾特征,而负的偏度表 明左侧长尾特征。四阶矩又称尾峰度,其衡量随机变量分布的尖 峰程度或平坦程度。 偏度和峰度统计量来检验随机变量是否服从正态分布。 • 示例:Jarque-Bera正态分布检验,其检验统计量定义为
Jarque Bera N k 2 ( K 3) 2 [S 4 ] 6
其中,N代表样本大小,S表示偏度,K表示峰度,k代表解释变量 个数,原假设是待检验随机变量为正态分布。
Presented By Harry Mills / PRESENTATIONPRO
概率与统计相关知识
• 期望和方差在实践中运用最为广泛,二者具有下列性质: 假设A为常数, t 和 u t 为均值为0的随机变量,则有
Presented By Harry Mills / PRESENTATIONPRO
概率与统计相关知识
正态总体抽样
设X为一个服从均值为 ,方差为 的正态分布的随机变量。从总 体中随机抽取n个样本,得到观察值。则 : • 样本均值 服从正态分布,均值为 ,方差为 ,即: 。由此可以发现,样本均值在均值附近的分散较小,样本量越大 ,方差越小。
Presented By Harry Mills / PRESENTATIONPRO
概率与统计相关知识
• 样本统计量分布
• 从均值为μ,方差为 的正态总体中抽取独立随机样本 样本方差 ,具有性质 。
• • ,即 为 的无偏估计量。 ,当以样本标准差s代替总体标准差σ时,
,
Presented By Harry Mills / PRESENTATIONPRO
概率与统计相关知识
参数估计方法
• 矩估计法 • 设一个分布有k个未知参数,估计方法就是计算分布的前k个样本 距,再利用其作为对应总体距的估计量。分布的总体均值也称作 一阶原点距,样本均值为总体均值的估计量;随机变量的方差也 称为二阶中心距,样本方差即分布总体方差的估计量。 • 示例:估计两个随机变量X和Y之间相关系数
Presented By Harry Mills / PRESENTATIONPRO
概率与统计相关知识
• 最小二乘法-以均值为例 • 由于 ,每个观察值均可视为样本均值的估计量,该估计量 的误差为 。考虑能使误差平方和最小的估计量,即使整个 样本误差的平方和 最小的估计量。 • 要使ESS最小的估计值 ,ESS为
概率分布函数与概率密度函数
• 概率分布函数(用F(x)表示) • 概率密度函数(用函数f(x)表示) • 分布函数,密度函数决定随机变量X在指定区间取值的概率。
Presented By Harry Mills / PRESENTATIONPRO
概率与统计相关知识
• 标准正态分布期望μ=0,方差的正态分布称为,其密度函数 为:
Presented By Harry Mills / PRESENTATIONPRO
概率与统计相关知识
条件概率
• 给定某一随机变量X已发生的条件下另一特定随机变量Y发生的概 率,称之为条件概率。 • 符号“|”代表给定。条件概率密度函数定义如下(同时适用于离 散随机变量和连续随机变量):
其中, 为X和Y联合概率, 为X的密度函数,通常称为X的 边际密度。需要注意的是,条件概率依赖于x和y。当两个随机变 量为独立统计时,条件概率分布变为相应的边际分布。
• 对协方差进行“标准化”,即可得到X和Y间的相关系数,用 表示。X和Y之间的相关系数定义为:
• 独立的两个变量一定不相关,但不相关的两个变量不见得独立
Presented By Harry Mills / PRESENTATIONPRO
概率与统计相关知识
• 协方差与相关系数的性质 1) 如果a、b为常量,则 2) 相关系数 的取值介于-1到1之间
3) 如果X和Y相互独立,则 ;即X和Y不相关。从以 上和(1)可以得出,在这种情况下,Var(X+Y)=Var(X)+Var(Y)且 Var(X-Y)=Var(X)-Var(Y) 4) 如果 ,且 则 ;即在单位比例改变 的情况下,相关系数保持恒定。如果 ,则 。但 当 时, 。这说明在一般线性变 换情况下,相关系数为变量( 不为零)
联合概率
• 一对随机变量的概率函数称为联合概率分布。为简单起见,以离 散随机变量为例讨论。设X或Y为离散随机变量,设x和y为其所取 值。X=x且Y=y的概率就称为来自百度文库和Y的联合概率函数,用 表示 ,则 。因为概率函数通常用f(〃)表示,所以用 下标XY来确认讨论中的随机变量为X和Y的联合。 • 统计独立性 如果随机变量X和Y具有统计独立性,此时联合概率为单个概率的 乘积。 对于连续随机变量: 对于离散随机变量: P(X=x,Y=y)=P(X=x)P(Y=y)
• 该式中仅当是 值 。
,ESS最小,所以最小二乘法估计量μ为样本均
Presented By Harry Mills / PRESENTATIONPRO
概率与统计相关知识
估计量性质——针对小样本
• 无偏性 • 如果 ,则估计量 为 的无偏估计量。否则该估计量有偏, 偏差为 • 有效性 • 设 为参数 的两个无偏估计量,如果 ,则 更 有效 • 均方差——允许在无偏性和方差之间的这种折中情况出现的度量 • 估计量 的均方差定义为 ,即为从 到 偏差平方的期 望值 • 如果 为的两个可选估计量,且 ,则 为均方有效 系数。如果两个估计量都具有无偏性,则 更有效 • 均方差最小的估计量称为最小均方差估计量 Presented By
Presented By Harry Mills / PRESENTATIONPRO
概率与统计相关知识
多元分布
• 设 为n个随机变量,其联合概率密度函数为
。如果联合概率密度函数等于单个概率密度函
数的乘积,则其相互独立:
。
Presented By Harry Mills / PRESENTATIONPRO
Presented By Harry Mills / PRESENTATIONPRO
概率与统计相关知识
• 条件期望与条件方差的性质
1)
2) 3) 4)
Presented By Harry Mills / PRESENTATIONPRO
概率与统计相关知识
协方差和相关系数
• 函数 该函数的期望值称为X和Y的协方差,用 或Cov(X,Y)表示。因此随机变量X和Y的协方差定义为:
Presented By Harry Mills / PRESENTATIONPRO
概率与统计相关知识
大样本分布的两个性质
• 大数定律: • 设 为独立同分布的随机样本 的样本均值,则 向E(Z)汇 聚。即随着n的增大,随机变量集合的样本均值就越接近其期望值 。假设 ,由于 ,总体均值 趋向于 。同样,随着n趋向 于无穷大, 趋向于 。 • 中心极限定理: • 设 为取自同一分布的观察值所组成的随机样本,均值为 ,方差为 ,则随机变量 的抽样分布随着n的趋向于无穷 大而趋向于服从标准正态分布。
Presented By Harry Mills / PRESENTATIONPRO
概率与统计相关知识
常用抽样分布
• 卡方分布 • n个独立标准正态随机变量平方和的分布称为卡方 分布,自由度 为n,也写作 。即n个独立同分布的随机变量 服从 N(0,1)分布。 • 定义一个新的随机变量U,U是Z的平方和,即 , 随机变量U的分布为 。 • 卡方分布的期望值为其自由度n • 两个卡方分布之和仍为卡方分布,自由度为两个卡方分布自由度 之和。
• 更多的时候,我们需要利用样本均值和方差估计随机变量的矩。
1 T ˆ xt T t 1 1 T ˆ ˆ )2 ( xt T 1 t 1
2
其中,T表示随机变量的样本观察值个数
Presented By Harry Mills / PRESENTATIONPRO
概率与统计相关知识
Presented By Harry Mills / PRESENTATIONPRO
概率与统计相关知识
• 学生氏分布(t-分布) • 设 。Z和U相互独立,则随机变量 服从自 由度为n的t-分布。当n较大时,t-分布近似服从正态分布,n≥30 时最佳。 • F-分布 • 设 , 相互独立,则F=(U/m)/(V/n)的分布称为F-分布,自 由度为m和n,写作 。
附录一 统计学与矩阵代数回顾
汪昌云 中国人民大学财政金融学院 教授 张成思 中国人民大学财政金融学院 教授 戴稳胜 中国人民大学财政金融学院 副教授
Presented By Harry Mills / PRESENTATIONPRO
本章内容梗概
能够灵活掌握概率论
概率与统计相关知识
• 随机变量与统计分布 • 参数估计 • 假设检验
、数理统计与矩阵代数的 相关知识,是理解金融计 量学理论的基础,同时也 是熟练运用金融计量方法 的重要前提。
矩阵代数相关知识
• 矩阵定义及运算 • 特征根及特征矩阵 • 矩阵求导
Presented By Harry Mills / PRESENTATIONPRO
概率与统计相关知识
随机变量
• 如果一个随机变量只能取特定的值,则称为离散变量。比如抛100 次硬币正面朝上的次数。 • 如果一个随机变量可以取某一实数区间中的任意值,则称为连续 变量。例如某校冬季供暖每小时能源消耗量。 • 通常都用大写字母表示随机变量(如X或Y),用小写字母表示其 具体结果(如x或y)。
概率与统计相关知识
• 多元分布的性质: • 线性组合的期望为期望的线性组合。如果 • • • • • • 为常量,则 。 若干独立同分布随机变量均值的期望等于他们的共同期望。 ,其中, 为常量。 如果 相互独立,则在 的情况下, 。 独立随机变量的和的方差为所有方差的和。特别地,当方差相同 时,对于每个i,都有 ,所以 。 如果 ,则有 。 如果 相互独立,并服从 ,则它们的均值 服从正态分布,均值为 ,方差为 。
Presented By Harry Mills / PRESENTATIONPRO
概率与统计相关知识
条件期望与条件方差
• 条件期望 给定X的情况下,Y的期望值即为Y对X的条件期望值。以离散随机 变量为例,条件期望可表示为: ,即以条件密 度 作为权重的Y的期望。 • 条件方差 假设 为Y对X的条件期望,即E(Y|X),则Y对X的条件方差定义 为 ,即在X值给定的前提下,求Y对X的条件期 望以及条件密度 为权重求该均值的方差。
E[ A t ] AE[ t ] E[ A t ] A E[ t ] E[ut t ] E[ut ] E[ t ] Var[ A t ] A2Var[ t ] Var[ A t ] Var[ t ] Var[ut t ] Var[ut ] Var[ t ] Cov[ut , t ]
n
其中, 表示X的均值,代表期望。 • 常用n阶矩示例: • 一阶矩被称为均值或期望值,经常使用 来表示,它度量了随机 分布的中央位臵。二阶矩被称为方差,经常用 2 来表示,它衡量 了X的变化幅度。方差的平方根称为标准差,用 表示。 均值和方差被广泛地用来刻画各种随机分布尤其是正态分布的特 性。