11复习线性回归方程的求法
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
不过,现代回归分析虽然沿用了“回归”一词,但内容已有很大变化,它是一种应用 于许多领域的广泛的分析研究方法,在经济理论研究和实证研究中也发挥着重要作用。
回归分析的内容与步骤:
回归分析通过一个变量或一些变量的变化解释另一变量的变化。
其主要内容和步骤是,
首先根据理论和对问题的分析判断,将变量分为自变量和因变量; 其次,设法找出合适的数学方程式(即回归模型)描述变量间的关系; 由于涉及到的变量具有不确定性,接着还要对回归模型进行统计检验;
容选修1-2——统计案例
5. 引入线性回归模型
1. 画散点图
2. 了解最小二乘法 的思想
y=bx+a+e
6. 了解模型中随机误差项e产 生的原因
3. 求回归直线方程
y=bx+a
4. 用回归直线方程 解决应用问题
7. 了解相关指数 R2 和模型拟 合的效果之间的关系
8. 了解残差图的作用
9. 利用线性回归模型解决一类 非线性回归问题
(注意回归直线一定经过样本点的中心)
例1 假设关于某设备的使用年限x和所有支出的维修费用y(万 元)有如下的统计数据:
x
2
3
4
5
6
Y
2.2
3.8
5.5
6.5
7.0
若由此资料所知y对x呈线性相关关系,试求: 1.回归直线方程 2.估计使用年限为10年时,维修费用是多少?
解题步骤:
1.作散点图
2.把数据列表,计算相应的值,求出回归系数 3.写出回归方程,并按要求进行预测说明。
求根据一名女大学生的身高预报她的体重的回归方程,并预报一名身高为 172cm的女大学生的体重。 解:1、选取身高为自变量x,体重为因变量y,作散点图:
2、由散点图知道身高和体重有比较好的
线性相关关系,因此思可考以用P线3性回归方程
刻 3直、画 线从它 的散们 附点之 近图间 ,还的 而产看的关 不生到原系是,随因。在样机一是本条误什点直差散么线项布?上在e,某所一以条
不能用一次函数y=bx+a描述它们关系。
我们可以用下面的线性回归模型来表示: y=bx+a+e,其中a和b为模型的未知参数, e称为随机误差。
(参考数值:3 2 . 5 4 3 5 4 6 4 . 5 6 6 . 5 )
小结:求回归直线方程的步骤
(1)作散点图,通过图看出样本点是否呈条状分
布,进而判断两个量是否具有线性相关关系。
(2)所求直线方程 yˆ = bˆ x + aˆ 叫做回归直线方程;
其中 n
n
y bˆ =
最小二乘法:yˆ = bˆ x + aˆ
n
n
bˆ
=
i
=
( 1
x
i
-
x
)
(
y
i
i
n
=
( 1
x
i
-
x
)2
-
y
)
=
x iy i - n x y
i=1 n
x i2 - n x 2
,
i=1
aˆ = y - bˆ x .
其
中x=
1 n
n
i=1
xi
,y
=
1 n
n
i=
1
y
i
.
( x , y ) 称为样本点的中心。
施化肥量x 15 20 25 30 35 40 45
水稻产量y 330 345 365 405 445 450 455
y
500 水稻产量
450
···
400
·
350 ···
300
散点图 施化肥量
10 20 30 40 50
x
探索2:在这些点附近可画直线不止一条,
哪条直线最能代表x与y之间的关系呢?
2、回归直线方程:
(1)所求直线方程 yˆ = bˆ x + aˆ 叫做回归直线方程;
其中
n
n
y bˆ =
(xi - x)(yi - y)
i=1 n
=
(xiFra Baidu bibliotek- x)2
xi
- nxy
i
i=1
n xi2 - nx2
,
i=1
i=1
aˆ = y - bˆx
(2)相应的直线叫做回归直线。 (3)对两个变量进行的线性分析叫做线性回归分析。
一般而言,父辈身高者,其子辈身高也高,依此推论,祖祖辈辈遗传下来,身 高必然向两极分化,而事实上并非如此,显然有一种力量将身高拉向中心,即子辈 的身高有向中心回归的特点。“回归”一词即源于此。
虽然这种向中心回归的现象只是特定领域里的结论,并不具有普遍性,但从它 所描述的关于X为自变量,Y为不确定的因变量这种变量间的关系看,和我们现在的 回归含义是相同的。
(xi - x)(yi - y)
i=1 n
=
(xi - x)2
xi
- nxy
i
i=1
n xi2 - nx2
,
i=1
i=1
aˆ = y - bˆx
(3)根据回归方程,并按要求进行预测说明。
第一章 统计案例
1.1回归分析的基本思想及其初步应用
(第二课时)
a. 比《数学3》中“回归”增加的内
数学3——统计
例2 (2007年广东)下表提供了某厂节能降耗技术改造后生产 甲产品过程中记录的产量x(吨)与相应的生产能耗y (吨标准 煤)的几组对应数据。
X
3
4
y
2.5
3
5
6
4
4.5
(1)请画出上表数据的散点图
(2)请根据上表提供的数据,用最小二乘法求出y关于x的
(3) 性回归方程y bˆx aˆ
(3)已知该厂技改前100吨甲产品的生产能耗为90吨标准 煤,试根据(2)求出的线性回归方程,预测生产100 吨甲产品的生产能耗比技改前降低多少吨标准煤?
统计检验通过后,最后是利用回归模型,根据自变量去估计、预测因变量。
案例1:女大学生的身高与体重
例1 从某大学中随机选取8名女大学生,其身高和体重数据如表1-1所示。
编号 1 2 3 4 5 6 7 8
身高/cm 165 165 157 170 175 165 155 170
体重/kg 48 57 50 54 64 61 43 59
10. 正确理解分析方法与结果
什么是回归分析:
“回归”一词是由英国生物学家F.Galton在研究人体身高的遗传问题时首先提出的。
根据遗传学的观点,子辈的身高受父辈影响,以X记父辈身高,Y记子辈身高。 虽然子辈身高一般受父辈影响,但同样身高的父亲,其子身高并不一致,因此, X和Y之间存在一种相关关系。
发现:图中各点,大致分布在某条直线附近。
y 水稻产量
500
· · 450
( x i ,y i )
· · 400 | y i - y i |
··· 350
( x i ,y i )
300
10 20 30 40
怎样求回归直线?
施化肥量
50
x
n
Q ( a , b ) = ( y i-b x i-a ) 2取 最 小 值 时 , a , b 的 值 . i = 1
回归分析的内容与步骤:
回归分析通过一个变量或一些变量的变化解释另一变量的变化。
其主要内容和步骤是,
首先根据理论和对问题的分析判断,将变量分为自变量和因变量; 其次,设法找出合适的数学方程式(即回归模型)描述变量间的关系; 由于涉及到的变量具有不确定性,接着还要对回归模型进行统计检验;
容选修1-2——统计案例
5. 引入线性回归模型
1. 画散点图
2. 了解最小二乘法 的思想
y=bx+a+e
6. 了解模型中随机误差项e产 生的原因
3. 求回归直线方程
y=bx+a
4. 用回归直线方程 解决应用问题
7. 了解相关指数 R2 和模型拟 合的效果之间的关系
8. 了解残差图的作用
9. 利用线性回归模型解决一类 非线性回归问题
(注意回归直线一定经过样本点的中心)
例1 假设关于某设备的使用年限x和所有支出的维修费用y(万 元)有如下的统计数据:
x
2
3
4
5
6
Y
2.2
3.8
5.5
6.5
7.0
若由此资料所知y对x呈线性相关关系,试求: 1.回归直线方程 2.估计使用年限为10年时,维修费用是多少?
解题步骤:
1.作散点图
2.把数据列表,计算相应的值,求出回归系数 3.写出回归方程,并按要求进行预测说明。
求根据一名女大学生的身高预报她的体重的回归方程,并预报一名身高为 172cm的女大学生的体重。 解:1、选取身高为自变量x,体重为因变量y,作散点图:
2、由散点图知道身高和体重有比较好的
线性相关关系,因此思可考以用P线3性回归方程
刻 3直、画 线从它 的散们 附点之 近图间 ,还的 而产看的关 不生到原系是,随因。在样机一是本条误什点直差散么线项布?上在e,某所一以条
不能用一次函数y=bx+a描述它们关系。
我们可以用下面的线性回归模型来表示: y=bx+a+e,其中a和b为模型的未知参数, e称为随机误差。
(参考数值:3 2 . 5 4 3 5 4 6 4 . 5 6 6 . 5 )
小结:求回归直线方程的步骤
(1)作散点图,通过图看出样本点是否呈条状分
布,进而判断两个量是否具有线性相关关系。
(2)所求直线方程 yˆ = bˆ x + aˆ 叫做回归直线方程;
其中 n
n
y bˆ =
最小二乘法:yˆ = bˆ x + aˆ
n
n
bˆ
=
i
=
( 1
x
i
-
x
)
(
y
i
i
n
=
( 1
x
i
-
x
)2
-
y
)
=
x iy i - n x y
i=1 n
x i2 - n x 2
,
i=1
aˆ = y - bˆ x .
其
中x=
1 n
n
i=1
xi
,y
=
1 n
n
i=
1
y
i
.
( x , y ) 称为样本点的中心。
施化肥量x 15 20 25 30 35 40 45
水稻产量y 330 345 365 405 445 450 455
y
500 水稻产量
450
···
400
·
350 ···
300
散点图 施化肥量
10 20 30 40 50
x
探索2:在这些点附近可画直线不止一条,
哪条直线最能代表x与y之间的关系呢?
2、回归直线方程:
(1)所求直线方程 yˆ = bˆ x + aˆ 叫做回归直线方程;
其中
n
n
y bˆ =
(xi - x)(yi - y)
i=1 n
=
(xiFra Baidu bibliotek- x)2
xi
- nxy
i
i=1
n xi2 - nx2
,
i=1
i=1
aˆ = y - bˆx
(2)相应的直线叫做回归直线。 (3)对两个变量进行的线性分析叫做线性回归分析。
一般而言,父辈身高者,其子辈身高也高,依此推论,祖祖辈辈遗传下来,身 高必然向两极分化,而事实上并非如此,显然有一种力量将身高拉向中心,即子辈 的身高有向中心回归的特点。“回归”一词即源于此。
虽然这种向中心回归的现象只是特定领域里的结论,并不具有普遍性,但从它 所描述的关于X为自变量,Y为不确定的因变量这种变量间的关系看,和我们现在的 回归含义是相同的。
(xi - x)(yi - y)
i=1 n
=
(xi - x)2
xi
- nxy
i
i=1
n xi2 - nx2
,
i=1
i=1
aˆ = y - bˆx
(3)根据回归方程,并按要求进行预测说明。
第一章 统计案例
1.1回归分析的基本思想及其初步应用
(第二课时)
a. 比《数学3》中“回归”增加的内
数学3——统计
例2 (2007年广东)下表提供了某厂节能降耗技术改造后生产 甲产品过程中记录的产量x(吨)与相应的生产能耗y (吨标准 煤)的几组对应数据。
X
3
4
y
2.5
3
5
6
4
4.5
(1)请画出上表数据的散点图
(2)请根据上表提供的数据,用最小二乘法求出y关于x的
(3) 性回归方程y bˆx aˆ
(3)已知该厂技改前100吨甲产品的生产能耗为90吨标准 煤,试根据(2)求出的线性回归方程,预测生产100 吨甲产品的生产能耗比技改前降低多少吨标准煤?
统计检验通过后,最后是利用回归模型,根据自变量去估计、预测因变量。
案例1:女大学生的身高与体重
例1 从某大学中随机选取8名女大学生,其身高和体重数据如表1-1所示。
编号 1 2 3 4 5 6 7 8
身高/cm 165 165 157 170 175 165 155 170
体重/kg 48 57 50 54 64 61 43 59
10. 正确理解分析方法与结果
什么是回归分析:
“回归”一词是由英国生物学家F.Galton在研究人体身高的遗传问题时首先提出的。
根据遗传学的观点,子辈的身高受父辈影响,以X记父辈身高,Y记子辈身高。 虽然子辈身高一般受父辈影响,但同样身高的父亲,其子身高并不一致,因此, X和Y之间存在一种相关关系。
发现:图中各点,大致分布在某条直线附近。
y 水稻产量
500
· · 450
( x i ,y i )
· · 400 | y i - y i |
··· 350
( x i ,y i )
300
10 20 30 40
怎样求回归直线?
施化肥量
50
x
n
Q ( a , b ) = ( y i-b x i-a ) 2取 最 小 值 时 , a , b 的 值 . i = 1