学新教材高中数学概率与统计统计模型相关关系与回归直线方程教案新人教B版选择性必修第二册
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
4.3统计模型
4.3.1一元线性回归模型第1课时相关关系与回归直线方程
学
习目标核心素养
1.了解变量间的相关关系.(易混点)
2.会根据散点图判断数据是否具有相关关系.(重点)
3.了解最小二乘法的思想,会求回归直线方程,掌握回归方程的性质.(重点、难点)1.通过回归直线方程及相关关系的学习,体会数学建模与直观想象的素养.
2.借助回归直线方程的求法,培养数学运算的素养.
你知道“名师出高徒”的意思吗?——高明的师傅一定能教出技艺高的徒弟,比喻学识丰富的人对于培养人才的重要.也就是说,高水平的老师往往能教出高水平的学生.
问题:那么老师的水平与学生的水平之间具有怎样的关系呢?这种关系是确定的吗?该关系与函数关系相同吗?
1.相关关系
如果两个变量之间确实有一定的关系,但没有达到可以互相决定的程度,它们之间的关系带有一定的随机性,像这样两个变量之间的关系,统计学上都称为相关关系.
思考1:函数关系是相关关系吗?
[提示] 不是.函数关系中两个变量之间是一种确定关系.
2.线性相关
(1)散点图
一般地,如果收集到了变量x和变量y的n对数据(简称为成对数据),如下表所示.
序号i123…n
变量x x1x2x3…x n
变量y y1y2y3…y n
则在平面直角坐标系xOy i i n对数据的散点图.(2)线性相关:如果由变量的成对数据、散点图或直观经验可知,变量x与变量y之间的关系可以近似地用一次函数来刻画,则称x与y线性相关.
(3)正相关和负相关
若x与y线性相关,如果一个变量增大,另一个变量大体上也增大,则称这两个变量正相关;如果一个变量增大,另一个变量大体上减少,则称这两个变量负相关.
3.回归直线方程
(1)一般地,已知变量x与y的n对成对数据(x i,y i),i=1,2,3,…,n.任意给定一个一次函数y=bx+a,对每一个已知的x i,由直线方程可以得到一个估计值错误!i=bx i+a,
如果一次函数错误!=错误!x+错误!能使
错误!
取得最小值,则错误!=错误!x+错误!称为y关于x的回归直线方程(对应的直线称为回归直线).因为是使得平方和最小,所以其中涉及的方法称为最小二乘法.
其中,回归系数错误!=错误!=错误!,
错误!=错误!—错误!错误!.
错误!=错误!(x1+x2+…+x n)=错误!错误!x i;
错误!=错误!(y1+y2+…+y n)=错误!错误!y i.
4.回归直线方程:错误!=错误!x+错误!的性质
(1)回归直线一定过点(错误!,错误!).
(2)回归系数错误!的实际意义
1错误!是回归方程的斜率;
2当x增大一个单位时,错误!增大错误!个单位.
思考2:y与x正负相关的充要条件分别是什么?
[提示] 当错误!>0时,y与x正相关,反之也成立,同理错误!<0是y与x负相关的充要条件.
1.思考辨析(正确的打“√”,错误的打“×”)
(1)相关关系是两个变量之间的一种确定的关系. .()
(2)回归直线方程一定过样本中心点.()
(3)选取一组数据的部分点得到的回归方程与由整组数据得到的回归方程一定相同.
(4)根据回归直线方程得到的结论一定是可靠的.()
[答案] (1)×(2)√(3)×(4)×
2.下列两个变量具有正相关关系的是()
A.正方形的面积与边长
B.吸烟与健康
C.数学成绩与物理成绩
D.汽车的重量与汽车每消耗1L汽油所行驶的平均路程
C[正方形的面积与边长是函数关系,A错误;吸烟与健康具有负相关关系,B错误;汽车越重,每消耗1L汽油所行驶的平均路程越短,所以汽车的重量与汽车每消耗1L汽油所行驶的平均路程具有负相关关系,D错误;数学成绩越好,物理成绩也会越好,所以数学成绩与物理成绩具有正相关关系,C正确.]
3.已知x与y之间的一组数据.
若y与x线性相关,则y与x!必过点()
A.(2,2)B.(1.5,0)
C.(1,2)D.(1.5,4)
D[∵错误!=错误!=1.5,
错误!=错误!=4,
∴回归直线必过点(1.5,4).故选D.]
4.已知回归直线的斜率的估计值是1.23,且过定点(4,5),则线性回归方程是________.错误!=1.23x+0.08 [回归直线的斜率的估计值为1.23,
即错误!=1.23,又回归直线过定点(4,5),
∴错误!=5—1.23×4=0.08,
∴错误!=1.23x+0.08.]
变量间相关关系的判断
1扇形的半径与面积之间的关系;
2农作物的产量与施肥量之间的关系;
3出租车费与行驶的里程;
4降雪量与交通事故的发生率之间的关系.
(2)某种产品的广告费支出x与销售额y之间有如下对应数据(单位:百万元).
x24568
y3040605070
1画出散点图;
2从散点图中判断销售金额与广告费支出成什么样的关系?
(1)24[在1中,扇形的半径与面积之间的关系是函数关系;在2中,农作物的产量与施肥量之间不具有严格的函数关系,但具有相关关系;3为确定的函数关系;在4中,降雪量与交通事故的发生率之间具有相关关系.]
(2)[解] 1以x对应的数据为横坐标,以y对应的数据为纵坐标,所作的散点图如图所示.
2从图中可以发现广告费支出与销售金额之间具有相关关系,并且当广告费支出由小变大时,销售金额也大多由小变大,图中的数据大致分布在某条直线的附近,即x与y成正相关关系.
两个变量是否相关的两种判断方法
1.根据实际经验:借助积累的经验进行分析判断.
2.利用散点图:通过散点图,观察它们的分布是否存在一定的规律,直观地进行判断.如果发现点的分布从整体上看大致在一条直线附近,那么这两个变量就是线性相关的,注意不要受个别点的位置的影响.
错误!
1.在下列所示的四个图中,每个图的两个变量具有相关关系的图是()
(1)(2)(3)(4)
A.(1)(2)B.(1)(3)
C.(2)(4)D.(2)(3)
D[图(1)的两个变量具有函数关系;图(2)(3)的两个变量具有相关关系;图(4)的两个变量之间既不是函数关系,也不是相关关系.]
求回归直线方程
能耗y(吨标准煤)的几组对应数据.
x3456
y2.5344.5
(2)请根据上表提供的数据,用最小二乘法求出y关于x的线性回归方程错误!=错误!x+错误!;
(3)已知该厂技改前100吨甲产品的生产能耗为90吨标准煤,试根据(2)求出的线性回归方程,预测生产100吨甲产品的生产能耗比技改前降低多少吨标准煤?
(参考数值:3×2.5+4×3+5×4+6×4.5=66.5)
[解] (1)由题设所给数据,可得散点图如图.
(2)由对照数据,计算得:错误!x错误!=86,
错误!=错误!=4.5,
错误!=错误!=3.5,
已知错误!x i y i=66.5,
所以,由最小二乘法确定的回归方程的系数为
错误!=错误!=错误!=0.7,
错误!=错误!—b错误!=3.5—0.7×4.5=0.35.
因此,所求的线性回归方程为错误!=0.7x+0.35.
(3)由(2)的回归方程及技改前生产100吨甲产品的生产能耗,得降低的生产能耗为90—(0.7×100+0.35)=19.65(吨标准煤).
求回归方程的一般步骤
(1)收集样本数据,设为(x i,y i)(i=1,2,…,n).
(2)作出散点图,确定x,y具有线性相关关系.
(3)计算错误!,错误!,错误!x错误!,错误!x i y i.
(4)代入公式计算错误!,错误!,公式为错误!
(5)写出回归方程错误!=错误!x+错误!.
错误!
2.已知变量x,y有如下对应数据.
x1234
y1345
(1)作出散点图;
(2)用最小二乘法求关于x,y的回归方程.
[解] (1)散点图如图所示.
(2)错误!=错误!=错误!,错误!=错误!=错误!,
错误!x i y i=1+6+12+20=39,
错误!x错误!=1+4+9+16=30,
错误!=错误!=错误!,
错误!=错误!—错误!×错误!=0,
所以错误!=错误!x即为所求的回归方程.
回归直线方程的性质及应用
假设y与x具有相关关系,而且回归直线方程为错误!=错误!x+错误!.
1.回归直线方程的单调性由哪个参数决定?
[提示] 错误!.
2.该方程必过哪个定点?
[提示] (错误!,错误!).
【例3】(多选题)设某大学的女生体重y(单位:kg)与身高x(单位:cm)具有线性相关关系,根据一组样本数据(x i,y i)(i=1,2,…,n),用最小二乘法建立的回归方程为错误!=0.85x—85.71,则下列结论中正确的是()
A.y与x具有正的线性相关关系
B.回归直线过样本点中心(错误!,错误!)
C.若该大学某女生身高增加1cm,则其体重约增加0.85kg
D.若该大学某女生身高为170 cm,则可断定其体重必为58.79 kg
ABC[当x=170时,错误!=0.85×170—85.71=58.79,
体重的估计值为58.79 kg,故D错误,ABC均正确.]
1.相关关系的正、负相关类同于函数的增、减性,与其斜率有关,必要时可画散点图以增强直观性.2.由回归方程得出的函数值不一定是准确值,只是个估计值.
错误!
3.(1)根据如下样本数据得到的回归方程为错误!=错误!x+错误!,则()
x
345678
y4.02.5—0.50.5
—
2.0
—
3.0
A.错误!>0,
C.错误!<0,错误!>0 D.错误!<0,错误!<0
(2)某单位为了了解用电量y度与气温x℃之间的关系,随机统计了某4天的用电量与当天气温,并制作了对照表.
气温(℃)181
3
10—1
用电量(度)2
4
3
4
3864
℃时,用电
量的度数约为________度.
(1)B(2)68 [(1)画出散点图,知错误!>0,错误!<0.
(2)错误!=10,错误!=40,回归方程过点(错误!,错误!),∴40=—2×10+错误!.
∴错误!=60.∴错误!=—2x+60.
令x=—4,∴错误!=(—2)×(—4)+60=68.]
1.相关关系和函数关系的异同点
(1)相同点:两者均是指两个变量的关系.
(2)不同点:函数关系是一种确定的关系,而相关关系是一种非确定的关系.
2.判断变量之间有无相关关系,一种简便可行的方法就是绘制散点图.根据散点图,可以很容易看出两个变量是否具有相关关系,是不是线性相关,是正相关还是负相关.
3.回归方程必过点(错误!,错误!).利用回归方程,我们可以进行估计和预测,若回归方程为错误!=错误!x+错误!,则在x=x0处的估计值为错误!0=错误!x0+错误!.
1.以下四个散点图中,两个变量的关系适合用线性回归模型刻画的是()
1234
A.12B.13
C.23D.34
B[13中的点分布在一条直线附近,适合线性回归模型.]
2.由变量x与y相对应的一组数据(1,y1),(5,y2),(7,y3),(13,y4),(19,y5)得到的线性回归方程为错误!=2x+45,则错误!=()
A.135B.90
C.67 D.63
D[∵错误!=错误!(1+5+7+13+19)=9,错误!=2错误!+45,
∴错误!=2×9+45=63,故选D.]
3.工人工资y(元)与劳动生产率x(千元)的相关关系的回归方程为错误!=50+80x,下列判
断正确的是()
A.劳动生产率为1000元时,工人工资为130元
B.劳动生产率提高1000元时,工人工资平均提高80元
C.劳动生产率提高1000元时,工人工资平均提高130元
D.当月工资为250元时,劳动生产率为2000元
B[因为回归直线的斜率为80,所以x每增加1,y平均增加80,即劳动生产率提高1000元时,工人工资平均提高80元.]
4.某地区近居民的年收入x与年支出y之间的关系大致符合错误!=0.8x+0.1(单位:亿元),预计今年该地区居民收入为15亿元,则今年支出估计是________亿元.
12.1[将x=15代入错误!=0.8x+0.1,得错误!=12.1.]
5.由某种设备的使用年限x i(年)与所支出的维修费y i(万元)的数据资料算得如下结果,错误!x 错误!=90,错误!x i y i=112,错误!x i=20,错误!y i=25.
(1)求所支出的维修费y对使用年限x的线性回归方程错误!=错误!x+错误!;
(2)1判断变量x与y之间是正相关还是负相关;
2当使用年限为8年时,试估计支出的维修费是多少?
[解] (1)∵错误!x i=20,错误!y i=25,
∴错误!=错误!错误!x i=4,错误!=错误!错误!y i=5,
∴错误!=错误!=错误!=1.2,
错误!=错误!—错误!错误!=5—1.2×4=0.2.
∴线性回归方程为错误!=1.2x+0.2.
(2)1由(1)知错误!=1.2>0,∴变量x与y之间是正相关.
2由(1)知,当x=8时,错误!=1.2×8+0.2=9.8,即使用年限为8年时,支出的维修费约是9.8万元.。