初中数学数学论文线性回归分析的数学模型
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
线性回归分析的数学模型
在实际问题中常常遇到简单的变量之间的关系,我们会遇到多个变量同处于一个过程之中,它们之间互相联系、互相制约.这些问题中最简单的是线性回归.线性回归分析是对客观事物数量关系的分析,是一种重要的统计分析方法,被广泛的应用于社会经济现象变量之间的影响因素和关联的研究.由于客观事物的联系错综复杂经济现象的变化往往用一个变量无法描述,故本篇论文在深入分析一元线性回归及数学模型的情况下,又详细地介绍了多元线性回归方程的参数估计和其显著性检验等.全面揭示了这种复杂的依存关系,准确测定现象之间的数量变动.以提高预测和控制的准确度.
本文中详细的阐述了线性回归的定义及其线性模型的简单分析并应用了最小二乘法原理.具体介绍了线性回归分析方程参数估计办法和其显著性检验.并充分利用回归方程进行点预测和区间预测.
但复杂的计算给分析方法推广带来了困难,需要相应的操作软件来计算回归分析求解操作过程中的数据.以提高预测和控制的准确度.从而为工农业生产及研究起到强有力的推动作用.
关键词:线性回归;最小二乘法;数学模型
目录
第一章前言 (1)
第二章线性模型 (2)
第一节一元线性模型 (2)
第二节多元线性模型 (4)
第三章参数估计 (5)
第一节一元线性回归方程中的未知参数的估计 (5)
第二节多元线性回归模型的参数估计 (8)
第四章显著性检验 (13)
第一节一元线性回归方程的显著性检验 (13)
第二节多元线性回归方程的显著性检验 (20)
第五章利用回归方程进行点预测和区间预测 (21)
第六章总结 (26)
致谢 (27)
参考文献…………………………………………………………………………
第一章前言
回归分析是对客观事物数量依存关系的分析.是数理统计中的一个常用的方法.是处理多个变量之间相互关系的一种数学方法.
在现实世界中,我们常与各种变量打交道,在解决实际问题过程中,我们常常会遇到多个变量同处于一个过程之中,它们之间互相联系、互相制约.常见的关系有两种:一类为“确定的关系”即变量间有确定性关系,其关系可用函数表达式表示.例如:路程s,时间t,与速度v之间有关系式:s=vt 在圆体给与半径r之间有关系式v= 另外还有一些变量.他们之间也有一定的关系,然而这种关系并不完全确定,不能用函数的形式来表达,在这种关系中至少有一个变量是随机的.例如:人的身高与体重有一定的关系,一般来讲身高高的人体重相对大一些.但是它们之间不能用一个确定的表达式表示出来.这次变量(或至少其中有一个是随机变量)之间的关系.我们称之为相关关系.又如环境因素与农作物的产量也有相关关系,因为在相同环境条件下农作物的产量也有区别,这也就是说农作物的产量是一个随机变量.回归分析就是研究相关关系的一种数学方法,是寻找不完全确定的变量间的数学关系式并进行统计推断的一种方法.它能帮助我们从一个变量取得的值去估计另一个变量的值.在这种关系中最简单的是线性回归.
线性回归分析是对客观事物数量关系的分析,是一种重要的统计分析方法,被广泛的应用于社会经济现象变量之间的影响因素和关联的研究.由于客观事物的联系错综复杂经济现象的变化往往用一个变量无法描述,故本篇论文在深入分析一元线性回归及数学模型的情况下,又详细地介绍了多元线性回归方程的参数估计和其显著性检验等.全面揭示了这种复杂的依存关系,准确测定现象之间的数量变动.以提高预测和控制的准确度.
第二章线性模型
第一节一元线性模型
在工农业生产及科研中最常遇到的配直线问题,就是回归分析的统计推断方法来求经验公式(线性回归)的问题.如:
例1 今有某种大豆脂肪含量x(%)与蛋白质含量y(%)的测定结果如下表所示:试求它们之间的关系(检验公式).
x
16.5
17.5
18.5
19.5
20.5
21.5
22.5
y
43.5
42.6
42.6
40.6
40.3
38.7
37.2
首先将这组数据在直角坐标系上描成点,如下图:
一般的,按此方法描点所得的图成为散点图.
从图上可以看出:这些数据描出的点分布在一条直线附近.于是推出他们大致可以表示为线性关系
这里再y上加“ ^ ”是为了区别于他的实际值y,因为y与x一般不具有确定的函数关系,这样,在散点图的启发下,我们选定了回归方程是线性的.然后根据统计推断方法来估计出未知数和从而确定所求的经验公式.一般的,设随机变量y与x之间的相关关系可以用线性模型
, ~
N(0, ) (1)来表示.这里x是试验或观察中可以控制或精确观测的变量.即非随机变量,y是可观测的随机变量是不可观测的随机变量(它表示模型误差,是除去x对Y的先行影响之外的且不能测出的其它各个随机因素对Y的影响的总和)
通过实验观测可得到关于变量x和Y的一组数据(,),(,),……(,)因为对于任意一个(i=1,2,……n),在的观测值在取定前不能精确预言它一定能取什么值,故把看作是随机变量Y的观测值.而相互独立的随机变量,,……为Y的样本.我们知道,样本与样本观测值之间的区别是:前者是随机变量,后者为取定的数值,但为了叙述方便,今后把样本观察值也成为样本.在符号上均用,,……来表示.具体表示的意义也可由上下文分析清楚,设观测值与样本之间满足关系式:
= (i=1,2,……,n)(2)其中~(i=1,2,……,n)且相互独立.
如果两个变量间的关系用上述线性模型描述,则它们之间存在线性相关关系由(1)有: E(Y)=
我们希望根据观测的数据,求出, 的估计量,这样就可以利用方
程(3)去估计随机变量Y的数学期望E(Y).也就是说,将,代入方程(1)并略去误差,就得到了随机变量Y和变量x的线性关系式(3).方程(3)通常称为Y对x的线性回归方程或回归方程,其图形称为回归直线.[1]
对于(1)和(2)所确定的线性模型,所考虑的统计推断主要问题是:未知参数和的估计:检验x和Y之间的关系是否可确信是线性关系,即对假设(1)进行检验,对Y进行预测等.
第二节多元线性模型
一般来讲,影响结果Y的因素往往不止一个.设有,……共p个元素.这时要用图来确定它们的关系是困难的.常可根据经验做出假设.其中最简单的是假设它们之间有线性关系:
……(4)式中,……都是可精确测量或可控制的一般变量,Y是可观测的随机变量,,,……,都是未知参数,是服从分布的不可观测的随机误差.我们对(4)获得了n组相互独立的观测值(样本).