统计学基础知识
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
( x1 , y m ) ( x2 , y m ) ( xn , y m )
为这两个随机向量的相关矩阵,其中 ( xi , y j ) 为随机变量 xi 和 y j 的相关系数,
5/7
( xi , y j )
cov( xi , y j ) D ( xi ) D ( y j )
X 成立,则称 为方阵 A 的
正交矩阵 如果 n 阶方阵 A 满足 AA
I ,则称 A 为正交阵。
A 为正交阵的充分必要条件是 A 的列向量都是单位向量,且两两正交。
例 1 矩阵.xls(sheet2)
正定矩阵
AX 设 A 为一 n 阶方阵。如果对任意非零的 n 维向量 X ,都有 X
假设检验的一般步骤: 1) 根据实际问题提出原假设和备择假设;
3/7
2) 给出显著性水平 ; 3) 确定合适的检验统计量; 4) 在 认 为 原 假 设 为 真 的 前 提 下 , 构 造 一 个 与 检 验 统 计 量 有 关 的 小 概 率 事 件 A, 即 确 定 A, 使 得
P( A | H 0为真) ;
0 成立,则称 A 为一正定矩阵。
半正定矩阵(定义) n 阶半正定矩阵一定有 n 个非负的特征根(包括重根) 。
随机向量及其分布 随机变量就是以不同的可能性(概率)进行取值的变量。 如: 在抽检产品时,引入随机变量 X,使正品对应 X=1,次品对应 X=0;
4/7
掷硬币时,引入随机变量 X, 使正面对应 X=1, 反面对应 X=0; 掷骰子时,引入随机变量 Y, 其取值范围为 1,2,3,4,5,6,使 Y 的每一个取值对应于一种抛掷结果; 检测白糖重量时,引入随机变量 Z, 其取值范围为 490—510,使每一检测结果都可由 Z 的一个取值表示。
V (X )
7/7
为对称轴;
越远, f ( x) 值越 小,且以 x 轴为渐近线。
2
处, f ( x) 取最大值。 x 值离
2
越小,曲线
越陡峭;
越大,
曲线越平缓。
2. 密度曲线与 x 轴围成的面积恒等于 1.
3.
E( X ) ,
D( X ) 2
6/7
设 p 维随机向量 X
( x1, x2 ,, x p ) 的联合概率密度函数为
S
1 n ( xi x )2 n 1 i 1
偏度
V1
(x x )
i 1 i
n
3
S 3 (n 1)
2/7
峰度
V2
(x x )
i 1 i
n
4
S 4 (n 1)
几种重要的概率分布 正态分布
2 分布
t 分布
F 分布
自由度
估计 点估计 区间估计 最小二乘估计 极大似然估计 矩估计
。
特别地,称 ( X , X ) 为 X 的相关矩阵。 通常,我们将一个随机向量的协方差矩阵记为 ( ij ) 、相关矩阵记为 R ( ij ) . 任何随机向量的协方差矩阵(相关矩阵)都是半正定矩阵。 任何随机向量的 n 阶协方差矩阵(相关矩阵)都有 n 个非负的特征根(包括重根)和 n 个相互正交的单位 特征向量。
f ( x)
1 (2 )
p/2
||
1/ 2
1 exp[ ( x ) 1 ( x )] , 2
其中 为 p 维实向量, 为 p 阶正定矩阵,则称 X 服从 p 元正态分布,也称 X 为 p 维正态随机变量,简 记为 X ~ N ( , ) . 此时, E ( X ) ,
统计分析方法
分类分析方法
聚类分析
判别分析
定性资料分析
结构简化方法
回归方法
聚类分析
主成分分析
因子分析
对应分析
相关分析方法
定性资料分析
回归分析
典型相关分析
主成分分析
因子分析
对应分析
预测决策方法
回归分析
判别分析 1/7
定性资料分析
聚类分析
统计分析方法应用步骤及流程
现实经济问题
提炼具体问题 确定欲达到目 标
cov( xi , y j ) E[( xi E ( xi )][ y j E ( y j )] 。
特别地,称 cov( X , X ) 为 X 的协方差矩阵,简记为 V ( X ) 。 称矩阵
( x1 , y1 ) ( x1 , y 2 ) ( x2 , y1 ) ( x2 , y 2 ) ( X ,Y ) (x , y ) (x , y ) n 1 n 2
根据定性理论 设置指标变量
收集整理统计 数据
根据目标和数 据选择统计方 法,构造理论 模型
进行统计计算 估计模型参数
统计检验
修改
应用
统计数据的整理与描述 总体和样本 统计量
样本均值
1Fra Baidu bibliotekn x xi n i 1
1 n ( xi x )2 n 1 i 1
样本方差
S2
样本标准差
假设检验的原理与步骤 在假设检验中,我们要依据样本数据做出接受或拒绝 H0(原假设)的选择.那么做出这种选择的理论根据 是什么呢?我们指出,假设检验的理论根据是“小概率事件的实际不可能原理”,即概率很小的随机事件在个 别试验中几乎是不可能发生的.下图给出了假设检验的原理。
由假设检验的原理可见,假设检验真正有意义的工作是在拒绝原假设时。
( x1 , x2 ,, xn ) 是一个随机向量,则称 E( X ) ( E( x1 ), E( x2 ),, E( xn ))
为随机向量 X
( x1 , x2 ,, xn ) 的期望。
( x1 , x2 ,, xn ) , Y ( y1 , y2 ,, ym ) ,称矩阵
对两个随机向量 X
cov( x1 , y1 ) cov( x1 , y 2 ) cov( x2 , y1 ) cov( x2 , y 2 ) cov( X , Y ) cov( x , y ) cov( x , y ) n 1 n 2
cov( x1 , y m ) cov( x2 , y m ) 为这两个随机向量的协方差矩阵,其中 cov( xn , y m )
求出 H0 的拒绝域,即事件 A 发生时,上述统计量的取值范围. H0 的拒绝域也称为假设检验的拒绝域.根据样本 观察值,求出统计量的观察值 ,从而确定是否接受 H0.(统计量的观察值落在拒绝域内,则拒绝 H0; 反之,接受 H0).
多元分布的基本概念 方阵的特征值(根)与特征向量 设 A 为一 n 阶方阵。如果存在数 和非零的 n 维向量 X ,使得 AX 特征值, X 为 A 的对应于特征值 的特征向量。 例 1 矩阵.xls(sheet1)
什么是统计学,统计学的学科性质是什么? 统计学—收集数据、分析数据、并根据数据进行推断的艺术和科学。 《大英百科全书》
描述统计:对所收集的数据资料进行加工整理、综合概括,通过图示、列表和数对资料继续分析和描述。 推断统计:在搜集、整理观测样本数据的基础上,对有关总体做出推断,特点是根据随机性的观测样本数 据以及问题的条件和假定,对未知事件做出的以概率形式表述的推断 1992 年 11 月,国家技术监督局 正式批准 一级学科 1998 年 教育部 本科专业调整 理学类 一级学科 统计学是研究客观事物数量关系和数量特征的方法论学科。 研究问题:具体 统计分析方法 一般 具体
多元正态分布 如果随机变量 X 的概率密度函数为
f ( x)
2
1 2
e
( x )2 2 2
,
x ,
2
则称 X 服从参数为 , 的正态分布,记为 X~N( , ). 特别地 N (0,1) 称为标准正态分布。
正态随机变量的概率密度函数 f ( x) 具有如下性质: 1. 图形呈钟型,以 x 2.在 x
随机变量可分为离散型和连续型两种。离散型随机变量的全部取值可一一列举(试验结果有有限种或 可列种, 如某服务台前等待服务的顾客数) , 连续型随机变量可连续取值 (对应于在一个区间内取值的情况, 如电子元件的寿命,测量误差等) 。
随机向量:每个分量都是随机变量的向量。 随机向量的期望与协方差矩阵 设X