线性回归方程_公开课课件
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
线性回归方程
会作两个变量的散点图,会利用散点图认识两个变量间的相关关系/了解最小 二乘法的思想,能建立线性回归方程/了解独立性检验的基本思想、方法及初 步应用/了解回归的基本思想、方法及初步应用
【命题预测】
1.通过收集现实问题中两个有关联变量的数据并作出散点图,直观认识变量间 的相关关系,能根据给出的线性回归方程系数公式建立线性回归方程.能利用列 联表进行独立性检验.
变式1:在某地区的12~30岁居民中随机抽取了10个人的身高和体重的统计资 料如表:
根据上述数据,画出散点图并判断居民的身高和体重之间是否有相关
关 系.
身高 14 15 15 17 16 17 17 16 16 16 (cm) 3 6 9 2 5 1 7 1 4 0
体重 (kg) 41 49 61 79 68 69 74 69 68 54
【知识拓展】 相关系数的性质:
(1)|r|≤1. (2)当|r|越接近于1时,相关程度越大.特殊地,r=1时,n个点在同一直线上,当 |r|越接近于0时,相关程度越小. (3)|r|的大小反映了x与y之间的线性关系的强弱,相关系数|r|至少大到什么程度才 可以认为x和y的线性关系是显著的呢?这就需要进行显著性检验,即相关性检
①正方体的棱长与体积;②单位面积产量为常数时,土地面积与产量;
③日照时间与水稻的亩产量;④电压一定时,电流与电阻.
解析:①②④中两个变量间的关系都是确定的,所以是函数关系,③中
的两个变量是相关关系,对于日照时间一定的水稻,仍可以有不同的亩产
量.
答案:③
2.已知回归方程为 =0.50x-0.81,则x=25时, 的估计值为________.
a= -b =-0.857 5,所以,回归直线方程 =0.728 6x-0.857 5. (2)由 =0.728 6x-0.857 5≤10,得x≤14.901 8,所以,机器的速度不能超过 14.901 8 rad/s.
变式2:高三(一)班学生每周用于数学学习的时间x(单位:h)与数学成绩y(单位:
bx+a为拟合这n对数据的线性回归方程,该方程所表示的直线称 为 回归直线 .线性回归方程 =bx+a中的系数a,b可以用下面的公式计
算.
3.相关系数
(1)相关系数
(2)性质:①|r|≤1.②|r|越接近于1,x,y的线性相关程度越强.
③|r|越接近于0,x,y的线性相关程度越弱.
1.下列两个变量之间的关系是相关关系的是________(填序号).
百度文库
当x=18时, =3.53×18+13.48≈77,故该同学预计可得77分左右.
【规律方法总结】
1.线性相关关系的理解:相关关系与函数关系不同.函数关系中的两个变量 间是一种确定性关系.例如正方形面积S与边长x之间的关系S=x2就是函数关 系.相关关系是一种非确定性关系,即相关关系是非随机变量与随机变量之 间的关系.例如商品的销售额与广告费是相关关系.两个变量具有相关关系 是回归分析的前提.
【例2】 一机器可以按各种不同的速度运转,其生产的物件有一些会有问题,每 小时生产有问题物件的多少随机器运转的速度而变化,下表即为其试验结果.
速度(rad/s)
8 12 14 16
每小时生产有问题
物件数
5 8 9 11
(1)求出两变量间的回归直线方程;
(2)若实际生产中所允许的每小时最大问题物件数为10,那么,机器的速度不得
解析:把x=25代入 =0.50x-0.81,得 =11.69.
答案:11.69
3.(盐城市调研)某单位为了了解用电量y度与气温x℃之间的关系,随机统计 了某4天的用电量与当天气温,并制作了对照表:
气温(℃) 18 13 10 -1
用电量
(度) 24 34 38 64
由表中数据得线性回归方程 =bx+a中b=-2,预测当气温为-4℃时,用
(1)作出散点图,你能从散点图中发现含碳量与冶炼时间的一般规律吗?
(2)求回归方程;
(3)预测当钢水含碳量为160时,应冶炼多少分钟? 规范解答:(1)可作散点图如图所示:
由图可知它们呈线性相关关系. .…… 6分
(2) =159.8, =172,
……8分
b=
≈1.267.
a= -b =172-1.267×159.8≈-30.47. ∴ =1.267x-30.47. .…… 10分 (3)把x=160代入得y=172.25(分钟), 预测当钢水含碳量为160时,应冶炼172.25分钟.……14分
量较大,计算时应仔细谨慎,分层进行,避免因计算产生失误.
解:∵xiyi:9,14,15,12,5,5,15,12,14,9, =0, =0,
∴b=
=
a= -b =0-b×0=0, 故所求回归直线方程为 =x.
2.高考在考查这一部分内容时一般以应用题的形式出现,并且体现统计知识的 综合应用.而线性回归和独立性检验都要对数据进行统计和分析,因此,这一部
分知识在考查时一般都会以图表的形式出现,以现实生活中的例子为背景,对某 些实际问题进行理性的分析.
3.高考一般在这一部分尽量减小运算难度,主要在对图表的认识和分析上出 题.题目以填空题的形式为主,属于小题中的中等难度的题目,主要考查考生对
2.线性回归方程 一般地,设有n对观察数据如下:
x x1 x2 x3 … xn y y1 y2 y3 … yn
当a,b使Q=(y1-bx1-a)2+(y2-bx2-a)2+…+(yn-bxn-a)2取得最小值时, 就称方程 =bx+a为拟合这n对数据的线性回归方程,该方程所表示的直当a, b使Q=(y1-bx1-a)2+(y2-bx2-a)2+…+(yn-bxn-a)2取得最小值时,就称 方程 =
验. ❖一般地,由公式计算出样本的相关系数r查表得到相应的临界值ra,比较|r|与ra 的大小.若|r|≥ra,就认为x与y线性相关显著;若|r|<ra,就认为在显著水平a下, x与y线性相关不显著.
1.相关关系
(1)相关关系:相关关系:是指变量之间有一定的联系,但不能完全用函数来表 达.
(2) 线 性 相 关 关 系 : 能 用 直 线 方 程 性 相关关系 .
1.观察两相关变量得如下数据:
x:-1,-2,-3,-4,-5, 5, 3, 4, 2, 1;
y:-9,-7,-5,-3,-1, 1, 5, 3, 7, 9.
求两变量间的回归方程.
分析:按照求回归方程的方法,先设方程为=bx+a,再确定b,a的
值.求回归直线方程,关键在于正确地求出系数a,b,由于求a,b的计算
系.如果 已测得炉料熔化完毕时,钢水的含碳量x与冶炼时间y(从炉料 熔化完毕 到出钢的时间)的一列数据,如下表所示:
x(0.0 10 18 19 17 14 13 15 19 20 12 1%) 4 0 0 7 7 4 0 1 4 1 y(分 10 20 21 18 15 13 17 20 23 12 钟) 0 0 0 5 5 5 0 5 5 5
2.求回归直线方程,关键在于正确求出系数a,b,由于a,b的计算量大,计 算时应仔细谨慎,分层进行,避免因计算而产生错误.(注意回归直线方程中 一次项系数为b,常数项为a,这与一次函数的习惯表示不同).
3.判断两个变量是否具有线性相关时,可以从散点图判断,也可以求出相关 系数r进行判断.
【例3】 (本小题满分14分)炼钢是一个氧化降碳的过程,钢水含碳量的多 少直接 影响冶炼时间的长短,必须掌握钢水含碳量和冶炼时间的关
超过每秒多少转?
思路点拨:先把题中的量用回归分析的专用术语改写,再用回归分析的一般 步骤解题.
解:(1)用x来表示机器的运转速度,y表示每小时生产有问题的物件数,那 么4个样本数据为:(x1,y1)=(8,5),(x2,y2)=(12,8),(x3,y3)=(14,9),(x4, y4) = (16,11) , 则 = 12.5 , = 8.25 , 所 以 , 回 归 直 线 的 斜 率 为 b = =0.728 6,
图表及实际问题的分析能力,体现学以致用的数学价值,增强考生对学习数学的 兴趣.
【应试对策】
1.对相关关系的理解要注意以下几点:(1)不能把相关关系等同于函数关系;(2) 相关关系不一定是因果关系,也可能是伴随关系;(3)如何判断相关关系,统计
学发挥着重要作用,由于变量之间的相关关系带有不确定性,就需要收集大量的 数据,对数据进行统计分析,发现规律,然后才能作出科学的判断;(4)相关关 系是进行回归分析的基础.
电量的度数约为________.
解析:根据题意得, =
=10, =
=40,
所以a= -b =40-(-2)×10=60,所以,当x=-4时, =bx+a
=-2×(-4)+60=68.
答案:68
判断变量间有无相关关系,一种常用的简便可行的方法就是绘制散点图.散点 图就是利用散点(坐标点)的分布形态反映变量统计关系的一种图形,其特点是能 直观表现出影响因素和预测对象之间的总体关系趋势,能通过直观醒目的图形 方式反映变量间关系的变化形态,以便决定用何种数学表达方式来模拟变量之 间的关系.
3.独立性检验是数理统计的一种方法,是数学中的一种基本理论,是数学体系 中对数据关系进行探索的一种基本思想.当然,对数据的统计分析得出的结论只 能是在一定程度上对某种关系进行判断,而不是一种确定性的关系,这也是统计 思想与确定性思维的差异所在.独立性检验在实际中也有着广泛的应用,是对实 际生活中的数据进行分析的一种方法,通过这种分析得出的结论对实际生活或者 生产都有一定的指导作用.
2.若要考查变量a(随机变量)与b(非随机变量)的相关性,则b为因变量,a为 自变量,画散点图时,自变量在x轴上,因变量在y轴上.统计中用相关系数r 来衡量两个变量之间线性关系的强弱:
(1)|r|≤1,相关程度大;(2)|r|→1,相关程度大;(3)|r|→0,相关程度小.
对于回归分析的步骤可以记忆为:分析建方程,预报看结果,误差看效 果.相关分析是用相关系数来表示两个变量间相互的直线关系,并判断其密切 程度的统计方法.相关系数没有单位,在-1~+1范围内变动,其绝对值愈接 近1,两个变量间的相关愈密切,其绝对值愈接近0,两个变量间的相关愈不密 切.相关系数若为正,说明一变量随另一变量增减而增减,方向相同;若为负, 表示一变量增加、另一变量减少,即方向相反,但它不能表达直线以外(如各 种曲线)的关系.
分)之间有如下数据:x:24,15,23,19,16,11,20,16,17,13;y:
92,79,97,89,64,47,83,68,71,59.
某同学每周用于数学学习的时间为18 h,试预测该生的数学成绩.
解:利用计算器求得b≈3.53,a≈13.48,因此,可求得回归直线方程为
=3.53x+13.48.
【例1】 5名学生的化学和生物成绩(单位:分)如下表.
画出散点图,并判断它们是否有相关关系.
学科
学 生A B C D E
化学 80 75 70 65 60
生物 70 65 68 64 62
思路点拨:涉及两个变量:化学成绩与生物成绩,可以以化学成绩为自变量, 考察因变量生物成绩的变化趋势. 解:以x轴表示化学成绩,y轴表示生物成绩,可得相应的散点图如图所示.由 散点图可见,两者之间具有相关关系.
解:以x轴表示身高,y轴表示体重,可得到相应的散点图如图所示: 由散点图可知,两者之间具有相关关系.
回归直线方程在现实生活与生产中有着广泛的应用.应用回归直线方程可以把 非确定性问题转化成确定性问题,把“无序”变为“有序”,并对实际情况进 行估测、补充.因此,学过回归直线方程以后,应增强应用回归直线方程解决 相关实际问题的意识.
= bx + a 近 似 表 示 的 相 关 关 系 , 叫 做 线
探究:相关关系与函数关系有什么异同点?
提示:相同点:两者均是指两个变量的关系. 不同点:①函数关系是一种确定的关系,相关关系是一种非确定的关系,事
实上,函数关系是两个非随机变量的关系,而相关关系是非随机变量与随机 变量的关系. ②函数关系是一种因果关系,而相关关系不一定是因果关系,也可能是伴随 关系.
会作两个变量的散点图,会利用散点图认识两个变量间的相关关系/了解最小 二乘法的思想,能建立线性回归方程/了解独立性检验的基本思想、方法及初 步应用/了解回归的基本思想、方法及初步应用
【命题预测】
1.通过收集现实问题中两个有关联变量的数据并作出散点图,直观认识变量间 的相关关系,能根据给出的线性回归方程系数公式建立线性回归方程.能利用列 联表进行独立性检验.
变式1:在某地区的12~30岁居民中随机抽取了10个人的身高和体重的统计资 料如表:
根据上述数据,画出散点图并判断居民的身高和体重之间是否有相关
关 系.
身高 14 15 15 17 16 17 17 16 16 16 (cm) 3 6 9 2 5 1 7 1 4 0
体重 (kg) 41 49 61 79 68 69 74 69 68 54
【知识拓展】 相关系数的性质:
(1)|r|≤1. (2)当|r|越接近于1时,相关程度越大.特殊地,r=1时,n个点在同一直线上,当 |r|越接近于0时,相关程度越小. (3)|r|的大小反映了x与y之间的线性关系的强弱,相关系数|r|至少大到什么程度才 可以认为x和y的线性关系是显著的呢?这就需要进行显著性检验,即相关性检
①正方体的棱长与体积;②单位面积产量为常数时,土地面积与产量;
③日照时间与水稻的亩产量;④电压一定时,电流与电阻.
解析:①②④中两个变量间的关系都是确定的,所以是函数关系,③中
的两个变量是相关关系,对于日照时间一定的水稻,仍可以有不同的亩产
量.
答案:③
2.已知回归方程为 =0.50x-0.81,则x=25时, 的估计值为________.
a= -b =-0.857 5,所以,回归直线方程 =0.728 6x-0.857 5. (2)由 =0.728 6x-0.857 5≤10,得x≤14.901 8,所以,机器的速度不能超过 14.901 8 rad/s.
变式2:高三(一)班学生每周用于数学学习的时间x(单位:h)与数学成绩y(单位:
bx+a为拟合这n对数据的线性回归方程,该方程所表示的直线称 为 回归直线 .线性回归方程 =bx+a中的系数a,b可以用下面的公式计
算.
3.相关系数
(1)相关系数
(2)性质:①|r|≤1.②|r|越接近于1,x,y的线性相关程度越强.
③|r|越接近于0,x,y的线性相关程度越弱.
1.下列两个变量之间的关系是相关关系的是________(填序号).
百度文库
当x=18时, =3.53×18+13.48≈77,故该同学预计可得77分左右.
【规律方法总结】
1.线性相关关系的理解:相关关系与函数关系不同.函数关系中的两个变量 间是一种确定性关系.例如正方形面积S与边长x之间的关系S=x2就是函数关 系.相关关系是一种非确定性关系,即相关关系是非随机变量与随机变量之 间的关系.例如商品的销售额与广告费是相关关系.两个变量具有相关关系 是回归分析的前提.
【例2】 一机器可以按各种不同的速度运转,其生产的物件有一些会有问题,每 小时生产有问题物件的多少随机器运转的速度而变化,下表即为其试验结果.
速度(rad/s)
8 12 14 16
每小时生产有问题
物件数
5 8 9 11
(1)求出两变量间的回归直线方程;
(2)若实际生产中所允许的每小时最大问题物件数为10,那么,机器的速度不得
解析:把x=25代入 =0.50x-0.81,得 =11.69.
答案:11.69
3.(盐城市调研)某单位为了了解用电量y度与气温x℃之间的关系,随机统计 了某4天的用电量与当天气温,并制作了对照表:
气温(℃) 18 13 10 -1
用电量
(度) 24 34 38 64
由表中数据得线性回归方程 =bx+a中b=-2,预测当气温为-4℃时,用
(1)作出散点图,你能从散点图中发现含碳量与冶炼时间的一般规律吗?
(2)求回归方程;
(3)预测当钢水含碳量为160时,应冶炼多少分钟? 规范解答:(1)可作散点图如图所示:
由图可知它们呈线性相关关系. .…… 6分
(2) =159.8, =172,
……8分
b=
≈1.267.
a= -b =172-1.267×159.8≈-30.47. ∴ =1.267x-30.47. .…… 10分 (3)把x=160代入得y=172.25(分钟), 预测当钢水含碳量为160时,应冶炼172.25分钟.……14分
量较大,计算时应仔细谨慎,分层进行,避免因计算产生失误.
解:∵xiyi:9,14,15,12,5,5,15,12,14,9, =0, =0,
∴b=
=
a= -b =0-b×0=0, 故所求回归直线方程为 =x.
2.高考在考查这一部分内容时一般以应用题的形式出现,并且体现统计知识的 综合应用.而线性回归和独立性检验都要对数据进行统计和分析,因此,这一部
分知识在考查时一般都会以图表的形式出现,以现实生活中的例子为背景,对某 些实际问题进行理性的分析.
3.高考一般在这一部分尽量减小运算难度,主要在对图表的认识和分析上出 题.题目以填空题的形式为主,属于小题中的中等难度的题目,主要考查考生对
2.线性回归方程 一般地,设有n对观察数据如下:
x x1 x2 x3 … xn y y1 y2 y3 … yn
当a,b使Q=(y1-bx1-a)2+(y2-bx2-a)2+…+(yn-bxn-a)2取得最小值时, 就称方程 =bx+a为拟合这n对数据的线性回归方程,该方程所表示的直当a, b使Q=(y1-bx1-a)2+(y2-bx2-a)2+…+(yn-bxn-a)2取得最小值时,就称 方程 =
验. ❖一般地,由公式计算出样本的相关系数r查表得到相应的临界值ra,比较|r|与ra 的大小.若|r|≥ra,就认为x与y线性相关显著;若|r|<ra,就认为在显著水平a下, x与y线性相关不显著.
1.相关关系
(1)相关关系:相关关系:是指变量之间有一定的联系,但不能完全用函数来表 达.
(2) 线 性 相 关 关 系 : 能 用 直 线 方 程 性 相关关系 .
1.观察两相关变量得如下数据:
x:-1,-2,-3,-4,-5, 5, 3, 4, 2, 1;
y:-9,-7,-5,-3,-1, 1, 5, 3, 7, 9.
求两变量间的回归方程.
分析:按照求回归方程的方法,先设方程为=bx+a,再确定b,a的
值.求回归直线方程,关键在于正确地求出系数a,b,由于求a,b的计算
系.如果 已测得炉料熔化完毕时,钢水的含碳量x与冶炼时间y(从炉料 熔化完毕 到出钢的时间)的一列数据,如下表所示:
x(0.0 10 18 19 17 14 13 15 19 20 12 1%) 4 0 0 7 7 4 0 1 4 1 y(分 10 20 21 18 15 13 17 20 23 12 钟) 0 0 0 5 5 5 0 5 5 5
2.求回归直线方程,关键在于正确求出系数a,b,由于a,b的计算量大,计 算时应仔细谨慎,分层进行,避免因计算而产生错误.(注意回归直线方程中 一次项系数为b,常数项为a,这与一次函数的习惯表示不同).
3.判断两个变量是否具有线性相关时,可以从散点图判断,也可以求出相关 系数r进行判断.
【例3】 (本小题满分14分)炼钢是一个氧化降碳的过程,钢水含碳量的多 少直接 影响冶炼时间的长短,必须掌握钢水含碳量和冶炼时间的关
超过每秒多少转?
思路点拨:先把题中的量用回归分析的专用术语改写,再用回归分析的一般 步骤解题.
解:(1)用x来表示机器的运转速度,y表示每小时生产有问题的物件数,那 么4个样本数据为:(x1,y1)=(8,5),(x2,y2)=(12,8),(x3,y3)=(14,9),(x4, y4) = (16,11) , 则 = 12.5 , = 8.25 , 所 以 , 回 归 直 线 的 斜 率 为 b = =0.728 6,
图表及实际问题的分析能力,体现学以致用的数学价值,增强考生对学习数学的 兴趣.
【应试对策】
1.对相关关系的理解要注意以下几点:(1)不能把相关关系等同于函数关系;(2) 相关关系不一定是因果关系,也可能是伴随关系;(3)如何判断相关关系,统计
学发挥着重要作用,由于变量之间的相关关系带有不确定性,就需要收集大量的 数据,对数据进行统计分析,发现规律,然后才能作出科学的判断;(4)相关关 系是进行回归分析的基础.
电量的度数约为________.
解析:根据题意得, =
=10, =
=40,
所以a= -b =40-(-2)×10=60,所以,当x=-4时, =bx+a
=-2×(-4)+60=68.
答案:68
判断变量间有无相关关系,一种常用的简便可行的方法就是绘制散点图.散点 图就是利用散点(坐标点)的分布形态反映变量统计关系的一种图形,其特点是能 直观表现出影响因素和预测对象之间的总体关系趋势,能通过直观醒目的图形 方式反映变量间关系的变化形态,以便决定用何种数学表达方式来模拟变量之 间的关系.
3.独立性检验是数理统计的一种方法,是数学中的一种基本理论,是数学体系 中对数据关系进行探索的一种基本思想.当然,对数据的统计分析得出的结论只 能是在一定程度上对某种关系进行判断,而不是一种确定性的关系,这也是统计 思想与确定性思维的差异所在.独立性检验在实际中也有着广泛的应用,是对实 际生活中的数据进行分析的一种方法,通过这种分析得出的结论对实际生活或者 生产都有一定的指导作用.
2.若要考查变量a(随机变量)与b(非随机变量)的相关性,则b为因变量,a为 自变量,画散点图时,自变量在x轴上,因变量在y轴上.统计中用相关系数r 来衡量两个变量之间线性关系的强弱:
(1)|r|≤1,相关程度大;(2)|r|→1,相关程度大;(3)|r|→0,相关程度小.
对于回归分析的步骤可以记忆为:分析建方程,预报看结果,误差看效 果.相关分析是用相关系数来表示两个变量间相互的直线关系,并判断其密切 程度的统计方法.相关系数没有单位,在-1~+1范围内变动,其绝对值愈接 近1,两个变量间的相关愈密切,其绝对值愈接近0,两个变量间的相关愈不密 切.相关系数若为正,说明一变量随另一变量增减而增减,方向相同;若为负, 表示一变量增加、另一变量减少,即方向相反,但它不能表达直线以外(如各 种曲线)的关系.
分)之间有如下数据:x:24,15,23,19,16,11,20,16,17,13;y:
92,79,97,89,64,47,83,68,71,59.
某同学每周用于数学学习的时间为18 h,试预测该生的数学成绩.
解:利用计算器求得b≈3.53,a≈13.48,因此,可求得回归直线方程为
=3.53x+13.48.
【例1】 5名学生的化学和生物成绩(单位:分)如下表.
画出散点图,并判断它们是否有相关关系.
学科
学 生A B C D E
化学 80 75 70 65 60
生物 70 65 68 64 62
思路点拨:涉及两个变量:化学成绩与生物成绩,可以以化学成绩为自变量, 考察因变量生物成绩的变化趋势. 解:以x轴表示化学成绩,y轴表示生物成绩,可得相应的散点图如图所示.由 散点图可见,两者之间具有相关关系.
解:以x轴表示身高,y轴表示体重,可得到相应的散点图如图所示: 由散点图可知,两者之间具有相关关系.
回归直线方程在现实生活与生产中有着广泛的应用.应用回归直线方程可以把 非确定性问题转化成确定性问题,把“无序”变为“有序”,并对实际情况进 行估测、补充.因此,学过回归直线方程以后,应增强应用回归直线方程解决 相关实际问题的意识.
= bx + a 近 似 表 示 的 相 关 关 系 , 叫 做 线
探究:相关关系与函数关系有什么异同点?
提示:相同点:两者均是指两个变量的关系. 不同点:①函数关系是一种确定的关系,相关关系是一种非确定的关系,事
实上,函数关系是两个非随机变量的关系,而相关关系是非随机变量与随机 变量的关系. ②函数关系是一种因果关系,而相关关系不一定是因果关系,也可能是伴随 关系.