一个求回归直线方程的简单方法
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
一个求回归直线方程的简单方法
科技信息高校理科研究
一
个求回归直线方程明简单方法
华北电力大学柳燕
[摘要]求回归直线方程是统计学中经常用到的一个统计方法,大量的数据处理也可以有一些简单的方法,例如利用常用的数学记
号,经过推导与整理,便得到了简洁易用的公式.
[关键词]统计分析回归直线方程相关性
由于自然界中的许多事物间都包含着某种相互依存的内部规律,
这种联系反映到数学上,就是变量间的关系.变量的关系分为两大类:
有确定性关系和非确定性关系.数学的任务之一就是从数量上来解释
和分析这些关系.回归分析就是一种处理变量与变量间相互关系的数
学方法,也是数据处理中最为常用的一种统计方法.它是用数学方法从
大量观测数据中找出变量间近似关系的定量表达式,并由此利用这个
定量表达式去研究我们所未知的东西.研究两个变量间的相互关系的,
称为一元回归分析,在回归分析中,最简单也是最基本的情形是线性回
归,而一元线性回归所要找寻的是与变量相匹配的线性回归直线.这
里,我们用计算器上的统计键就可以轻而易举地得到这条直线方程.
回归的发现源自于19世纪末期对社会统计学的研究.那时,统计
学家发现,有许多数据都与正态曲线拟合的很好.但是这无所不在的正
态性却给高尔登带来了一个困惑,他发现亲子两代各自的身高数据,都
遵从同一的正态分布,但理论上,遗传把一种性态(例如身高)的优势传
递给下一代,则应该在后代中出现两极分化,即高个子的后代个子更
高,矮个子的后代个子更矮,或者说,高个子与矮个子的比例应该日渐
增加,而中等身材的比例应该日渐下降,但事实却是一代代的身高始终
呈现出稳定的正态分布.怎么解释这一现象呢?为此,高尔登想出了一
个"正态漏斗"试验,现在又称为:高尔登钉板试验.这个实验使高尔登
发现了在亲子代间性状的遗传中,性状有向中心回归的现象,也就是说,虽然高个子的后代平均来说要高些,但却不如其亲代那么高,总会向平均身高的方向"回归"一些.这既是回归的含义,也是回归这个概念的出处.接下来的工作是他在分析一些统计学的数据时注意到,若数据都取统计尺度,则可存在着两条斜率相同的回归直线.而其斜率可以作为两组变量的"相关紧度",就是我们现在所说的"相关系数".高尔登利用散点图去估计相关系数,并在图中指示了这些点理论上落在直线上. 这条直线就是我们要求的线性回归直线.现在求线性回归直线是一件简单的事,有那么多的统计软件,数据输入计算机,所求的直线也就得到了.这里介绍的是仅凭一个小小的计算器上的统计健,求出回归直线方程的简单方法.
设两个随机变量x与Y之间存在着某种相关关系.对于x取定的
一
组值x,作独立试验,得到Y所对应的一组值Y,,即得到n对观测值x., Y.),(i=l2-.,n1,又称为一组样本值.利用散点图,可以看出这些点之间
大致的位置关系,若近似地呈直线状,那么它们之间可成一线性关系, 因为可以想象,这些点散布在一条直线附近.在这些点附近的直线很多,究竟选取哪一条是最佳的呢?这可用最小二乘法解决,即取与观测数据离差的平方和最小的那条直线,这条直线就称为Y与x的回归直线.不妨设Y=a+bX,对应于每个记Y,=a+bx,,则离差的平方和:Q(a,b1= ∑(y.一0:∑(y,一bx),l=Iixl
于是将求回归直线问题转化为求Q(a,b)的最小值问题.
即求使一aQ(a,b):∑2一a-b]【i)(一1):0
曲:时的与b
—aQ(
.
a,b)一:22(yi-a-bxi)(一xJ=0OD_=】
引入记号:_-
I1
∑i=l
,_=
ni=
y.,r=12,s2=12(x.一x-)
fa+b
则上式可整理并变形为'{_a}窆2ibI
从而解得:b:,a=7-b~
S1
这个经过变形整理后的公式,仅含有样本均值和样本方差的形式: i,取s,用计算器上的统计键完全可以轻易地算出.确定了a,b之后,所求的回归直线方程也就有了:Y=a+bX.
例如某种水生植物生长的时间与身长间的关系如下
生长时间x(天)510203040506090120
身长Y(厘米)48l31617l9252946
试求它们之间的回归直线.
先作散点图,从图中大致可以判断这些点之间的关系呈线性关系. 令回归直线方程为:y=a+bx
用计算器中的统计键可得出样本均值,y-,及样本方差S,这里,
22
47.2,7=19.67,_-1344.4,Sl=35.8
故一b=
Sl
1344.4-47.2
2
x19.67
:0.3246
35.8
a=y-'-b__19.67—0.3246x47.2=4.35
故所求的回归直线方程为:y=4.35+0.3246x.
这个过程比一般教科书上给的方法要简便易用,而且也不繁琐,单
纯从求回归直线方程而言,应该已经化到了最简.其实数学就是这样,
当你很好地利用它的记号时,它有时会给你带来意想不到的简洁与规律. (上接第86页)芯片成本,数据传输的快慢等.
3,键盘模块
无线式评分器需要由一个界面来进行信息的录入,我们选择了键
盘电路来达到这一要求.键盘电路有很多种,有的很复杂,需要的技术
含量很高.而无线通信评审系统的键盘不需要太复杂.具体要求如下: (1)具有…0'至…9',"上翻","下翻","完毕","确定","删除","弃权"等
键.(2)若输入数字错误,可按"删除"键修改,按"确定"键数据传送到无
线数据采集器.(3)采用4位大液晶显示.(4)电池供电,具有3级电池
电量显示.(5)具有数据发送成功指示.(6)室内接收距离:200米,室外
接收距离:300米.
4,显示模块
在仪器仪表电路设计中,人机交互界面是必不可少的环节,现阶段
仪器仪表中通常使用的是LCD技术,LCD显示技术获得广泛应用的原因是:(1)价格低廉;(2)显示信息清晰醒目;(3)对仪器仪表系统资源占
用相对较少;(4)能量消耗相对较小,电源电路简单.利用智能型LCD
显示控制器,可以构成较复杂的仪器仪表人机显示界面,相对提高人机
界面的友好程度,减少对仪器仪表系统软硬件资源的占用,提高仪器工
作的可靠性,因而是仪器仪表系统人机界面的一种良好的构成方案.
5,看门狗
在控制系统中,由于微机电路本身的特点,它一旦因干扰或电源电
压不正常使程序失控,即使干扰消除,电压恢复正常,微机也不会自动恢复正常,必须要人工干涉.而在许多场合系统控制的工作是处于无人职
守的状态,这时就需要看门狗电路,它能在异常状态下实现对系统的自
动复位.
此评分器通过无线通信芯片来接收和发送数据,由LCD液晶电路
来显示数据,由键盘电路来录入信息,并通过一个看门狗电路来对此进