一元正态线性回归

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

一元正态线性回归

摘要:本文主要讲述了一元正态线性回归的原理,所涉及的一些方法以及应用。

关键字:一元线性回归正态分布

正文:

在工农业生产和科学研究中,常常需要研究变量之间的关系。变量之间的关系可以分为两类:确定性关系、非确定性关系。确定性关系就是指存在某种函数关系。然而,更常见的变量之间的关系存在着某种不确定性。例如:商品的销售量与当地人口有关,人口越多,销售量越大,但它们之间并没有确定性的数值关系,同样的人口,可能有不同的销售量。这种既有关联,又不存在确定性数值关系的相互关系,就称为相关关系。

回归分析就是研究变量之间相关关系的一种数理统计分析方法。在回归分析中,主要研究以下几个问题:

(1)拟合:建立变量之间有效的经验函数关系;

(2)变量选择:在一批变量中确定哪些变量对因变量有显著影响,哪些没有实质影响;

(3)估计与检验:估计回归模型中的未知参数,并且对模型提出的各种假设进行推断;

(4)预测:给定某个自变量,预测因变量的值或范围。

根据自变量个数和经验函数形式的不同,回归分析可以

分为许多类别。

回归分析涉及三个问题:

(1) 建立模型(找出自变量与因变量)

(2) 确定回归函数μ(x)的类型

(3) 估计参数

在回归模型中最简单的为一元回归模型:

一元回归最简单的情形:线性回归

Y=μ(x)+ε, ε~N(0,σ2

)

相应的一元回归方程为 : y=μ(x)

一、一元线性回归模型

给定一组数据点(x 1, y 1),(x 2 ,y 2),...,(x n , y n ),如果通过散点图可以观察出变量间大致存在线性函数关系,则可以建立如下模型: 其中a,b 称为一元线性回归的回归系数;ε表示回归值与测量值之间的误差。

二、一元正态线性回归

A)定义:一个一元线性回归当其随机变量Y 服从正态分布时,那么称其为一元正态线性回归。

B)原理:

一元正态回归模型:

Y=a+bx+ε, ε~N(0,σ2

) ⎩

⎨⎧++=),0(~2σεεN bX a Y

对于任意一组样本,有Y i= a + bx i+εi,i=1,...,n

其中,a----回归常数(又称截距) b ----回归系数(又称斜率) ε----随机扰动项其中:

(1)各次试验相互独立;

(2) E(εi)=0;

(3) D(εi)= σ2;

(4) ε1,...,εn相互独立;

从而,Yi~N(a+bxi, σ2),且相互独立。

三、一元正态线性回归一些方法

A)最小二乘法

使误差平方和达到最小以寻求估计值的方法,叫最小二乘法,用最小二乘法得到的估计叫最小二乘估计。

B)预测方法

一元线性回归预测法可以分为:点预测和置信区间预测法

1、点预测法:将自变量取值带入回归预测模型求出因变量的预测值。

2、置信区间预测法:估计一个范围,并确定该范围出现的概率。置信区间的大小的影响的因素:a 、因变量估计

值;b、回归标准差;c、概率度t

C)最大似然估计法

最大似然估计是一种统计方法,它用来求一个样本集的相关概率密度函数的参数。这个方法最早是遗传学家以及统计学家罗纳德·费雪爵士在1912年至1922年间开始使用的。“似然”是对likelihood 的一种较为贴近文言文的翻译,“似然”用现代的中文来说即“可能性”。故而,若称之为“最大可能性估计”则更加通俗易懂。

最大似然法明确地使用概率模型,其目标是寻找能够以较高概率产生观察数据的系统发生树。最大似然法是一类完全基于统计的系统发生树重建方法的代表。该方法在每组序列比对中考虑了每个核苷酸替换的概率。

例如,转换出现的概率大约是颠换的三倍。在一个三条序列的比对中,如果发现其中有一列为一个C,一个T和一个G,我们有理由认为,C和T所在的序列之间的关系很有可能更接近。由于被研究序列的共同祖先序列是未知的,概率的计算变得复杂;又由于可能在一个位点或多个位点发生多次替换,并且不是所有的位点都是相互独立,概率计算的复杂度进一步加大。尽管如此,还是能用客观标准来计算每个位点的概率,计算表示序列关系的每棵可能的树的概率。然后,根据定义,概率总和最大的那棵树最有可能是反映真实情况的系统发生树。

四、回归方程应用

A)预测

利用一元正态线性方程求出某个预测带,预测区间愈窄,预测越精确;

B)控制

控制是预测的反问题,可以求出回归变量应该控制在什么区间。

参考文献:

王勇,《概率论与数理统计》,高等教育出版社,2009。

一元正态线性回归

系别交通科学与工程

专业年级大学二年级

学生姓名巴俊颍

学号1103200305

指导教师郭梦舒

2011年11月

相关文档
最新文档