高等多元统计分析第一章-绪论
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
例如均值的检验和方差的检验、如何变得杰出等等。
四、一元统计分析基础知识回顾
❖ 10.比较参数检验和参数检验
3Q
❖ 7、参数估计好坏的评判标准 ❖ (1)一致估计(样本量无限大时候的性质)
❖ (2)无偏估计:
注:无偏估计就是系统误差为零的估计。
四、一元统计分析基础知识回顾
❖ 8、几个重要的参数估计
E(X )
X来自百度文库
1 n
n i1
Xi
X1
X2 n
Xn
var( X
)
1 n 1
n i 1
(Xi
X
)2
var(X )
曲线下面积 (从左侧累计)
切线 斜率 变化
四、一元统计分析基础知识回顾
❖ 常见概率密度函数:
四、一元统计分析基础知识回顾
四、一元统计分析基础知识回顾
❖ 6、参数估计 为什么要进行参数估计: (1)从理想到现实 (2)用少数的几个参数控制一整批数据
参数估计分为:点估计和区间估计
四、一元统计分析基础知识回顾
哈尔滨医科大学
生物信息科学与技术学院
—统计遗传学教研室
主讲教师:姜永帅 分子生物学馆 130办公室
高等多元统计分析
❖ 参考教材: 《多元统计分析》于秀林 任雪松 中国统计出版社
1 2
※△ 3
4
第一章 绪论
什么是多元统计分析 多元统计分析在生物信息学中的作用 多元统计分析中数据的组织方式
一元统计学分析基础知识回顾
样本(个体)
特征
X (1) x11 x12 x1p X (2) x21 x22 x2 p
X (n) xn1 xn2 xnp
X (1)
X (2)
X (n)
其中,n个样本,每个样本有p个特征 即:P维向量
x11
X
(1)
x12
x1p
注:当p=1的时候,为X一元随机变量,多元随机变量为一元随机变量的扩展。
三、多元统计分析中数据的组织方式
(1)
(2)
三、多元统计分析中数据的组织方式
三、多元统计分析中数据的组织方式
三、多元统计分析中数据的组织方式
❖ 实例:下图为一套基因表达谱数据,来自于GEO
三、多元统计分析中数据的组织方式
基因(特征)
样本(个体)
样本(个体)
特征
三、多元统计分析中数据的组织方式
象,如主成分分析、因子分析等 ❖ 2、分类与分组
将具有某些相同属性的特征或样本分组。如基因芯 片聚类分析等 ❖ 3、变量间的依赖性研究
研究变量之间的相互关系,如共表达等
二、多元统计分析在生物信息学中的作用
❖ 4、预测 根据已知一些变量的观测值,对另一些变量的值进行
预测。如根据已知marker预测疾病状态。 ❖ 5、假设检验与验证
1 n 1
n i 1
(Xi
X )2
一些重要的软件SAS,Matlab,R均使用无偏估计
四、一元统计分析基础知识回顾
实战: 9、假设检验 基础:小概率事件是非随机发生的。 ❖ 其基本思想和步骤均可归纳为:
第一,提出待检验的假设H0和H1; 第二,给出检验的统计量及其服从的分布; 第三,给定检验水平,查统计量的分布表,确定相应的临 界值,从而得到否定域; 第四,根据样本观测值计算出统计量的值,看是否落入否 定域中,以便对待判假设做出决策(拒绝或接受)。
四、一元统计分析基础知识回顾
数据是统计分析的生命。 ❖1、数据类型:离散型 和 连续型 ❖2、数据分布类型:离散型 和 连续型 ❖3、研究对象:随机变量 X (注:多元统计中研究对象为随机向量) ❖4、分布:频率 和 概率密度
四、一元统计分析基础知识回顾
❖5 累计分布:
离散型:
sum
连续型:
6
一、什么是多元统计分析
❖ 1、什么是多元统计分析
多元统计分析是研究多个随机变量之间相互 依赖关系以及内在规律性的一门科学
例如:
一、什么是多元统计分析
一、什么是多元统计分析
二、多元统计分析在生物信息学中的作用
多元统计分析在生物信息学的研究中使用非常广泛,是生物信息 学研究的必备工具。
❖ 1、数据简化和结构简化 在不损失信息的情况下,如何简单的描述被研究对
对些设想进行统计推断。
数据分析在各个领域、各个行业都起着重要的作用(例如红楼梦作者验证)。
三、多元统计分析中数据的组织方式
❖ 问题: 当你进行一项社会数据调查或者实验数据记
录时,你通常会怎么去做呢?用什么工具或软件, 以什么格式存放数据呢? 例如: (1)测量全班同学的身高 (2)测量全班同学的身高、体重和年龄
四、一元统计分析基础知识回顾
❖ 10.比较参数检验和参数检验
3Q
❖ 7、参数估计好坏的评判标准 ❖ (1)一致估计(样本量无限大时候的性质)
❖ (2)无偏估计:
注:无偏估计就是系统误差为零的估计。
四、一元统计分析基础知识回顾
❖ 8、几个重要的参数估计
E(X )
X来自百度文库
1 n
n i1
Xi
X1
X2 n
Xn
var( X
)
1 n 1
n i 1
(Xi
X
)2
var(X )
曲线下面积 (从左侧累计)
切线 斜率 变化
四、一元统计分析基础知识回顾
❖ 常见概率密度函数:
四、一元统计分析基础知识回顾
四、一元统计分析基础知识回顾
❖ 6、参数估计 为什么要进行参数估计: (1)从理想到现实 (2)用少数的几个参数控制一整批数据
参数估计分为:点估计和区间估计
四、一元统计分析基础知识回顾
哈尔滨医科大学
生物信息科学与技术学院
—统计遗传学教研室
主讲教师:姜永帅 分子生物学馆 130办公室
高等多元统计分析
❖ 参考教材: 《多元统计分析》于秀林 任雪松 中国统计出版社
1 2
※△ 3
4
第一章 绪论
什么是多元统计分析 多元统计分析在生物信息学中的作用 多元统计分析中数据的组织方式
一元统计学分析基础知识回顾
样本(个体)
特征
X (1) x11 x12 x1p X (2) x21 x22 x2 p
X (n) xn1 xn2 xnp
X (1)
X (2)
X (n)
其中,n个样本,每个样本有p个特征 即:P维向量
x11
X
(1)
x12
x1p
注:当p=1的时候,为X一元随机变量,多元随机变量为一元随机变量的扩展。
三、多元统计分析中数据的组织方式
(1)
(2)
三、多元统计分析中数据的组织方式
三、多元统计分析中数据的组织方式
三、多元统计分析中数据的组织方式
❖ 实例:下图为一套基因表达谱数据,来自于GEO
三、多元统计分析中数据的组织方式
基因(特征)
样本(个体)
样本(个体)
特征
三、多元统计分析中数据的组织方式
象,如主成分分析、因子分析等 ❖ 2、分类与分组
将具有某些相同属性的特征或样本分组。如基因芯 片聚类分析等 ❖ 3、变量间的依赖性研究
研究变量之间的相互关系,如共表达等
二、多元统计分析在生物信息学中的作用
❖ 4、预测 根据已知一些变量的观测值,对另一些变量的值进行
预测。如根据已知marker预测疾病状态。 ❖ 5、假设检验与验证
1 n 1
n i 1
(Xi
X )2
一些重要的软件SAS,Matlab,R均使用无偏估计
四、一元统计分析基础知识回顾
实战: 9、假设检验 基础:小概率事件是非随机发生的。 ❖ 其基本思想和步骤均可归纳为:
第一,提出待检验的假设H0和H1; 第二,给出检验的统计量及其服从的分布; 第三,给定检验水平,查统计量的分布表,确定相应的临 界值,从而得到否定域; 第四,根据样本观测值计算出统计量的值,看是否落入否 定域中,以便对待判假设做出决策(拒绝或接受)。
四、一元统计分析基础知识回顾
数据是统计分析的生命。 ❖1、数据类型:离散型 和 连续型 ❖2、数据分布类型:离散型 和 连续型 ❖3、研究对象:随机变量 X (注:多元统计中研究对象为随机向量) ❖4、分布:频率 和 概率密度
四、一元统计分析基础知识回顾
❖5 累计分布:
离散型:
sum
连续型:
6
一、什么是多元统计分析
❖ 1、什么是多元统计分析
多元统计分析是研究多个随机变量之间相互 依赖关系以及内在规律性的一门科学
例如:
一、什么是多元统计分析
一、什么是多元统计分析
二、多元统计分析在生物信息学中的作用
多元统计分析在生物信息学的研究中使用非常广泛,是生物信息 学研究的必备工具。
❖ 1、数据简化和结构简化 在不损失信息的情况下,如何简单的描述被研究对
对些设想进行统计推断。
数据分析在各个领域、各个行业都起着重要的作用(例如红楼梦作者验证)。
三、多元统计分析中数据的组织方式
❖ 问题: 当你进行一项社会数据调查或者实验数据记
录时,你通常会怎么去做呢?用什么工具或软件, 以什么格式存放数据呢? 例如: (1)测量全班同学的身高 (2)测量全班同学的身高、体重和年龄