2019人教A版高中数学必修三《两个变量的线性相关》第二课时教案
高中高中数学第二章统计2.3.1变量之间的相关关系2.3.2两个变量的线性相关课件新人教A版必修3
解:(1)画出散点图.
(2)判断变量x,y是否具有相关关系?如果具有相关关系,那么是正相关还是 负相关?
解:(2)具有相关关系.根据散点图,左下角到右上角的区域,变量x的值由小 变大时,另一个变量y的值也由小变大,所以它们具有正相关关系.
方法技巧 两个随机变量x和y是否具有相关关系的确定方法: (1)散点图法:通过散点图,观察它们的分布是否存在一定规律,直观地判断 (如本题); (2)表格、关系式法:结合表格或关系式进行判断; (3)经验法:借助积累的经验进行分析判断.
4
4
解:(2)由表中的数据得: xi yi =52.5, x =3.5, y =3.5, xi2 =54,
i 1
i 1
n
所以 b =
xi yi n x y
i 1
n
xi2
2Hale Waihona Puke nx=52.5 4 3.5 3.5 54 4 3.52
=0.7,
i 1
a = y - b x =3.5-0.7×3.5=1.05,
年份x
储蓄存款 y(千亿元)
2013 5
2014 6
2015 7
2016 8
2017 10
为了研究计算的方便,工作人员将上表的数据进行了处理,t=x-2 012,z=y-5 得到表2:
时间代号t
1
2
3
4
5
z
0
1
2
3
5
(1)求z关于t的线性回归方程;
5
5
解:(1) t =3, z =2.2, ti zi=45, ti2 =55,
知识探究
1.相关关系与函数关系不同 函数关系中的两个变量间是一种确定性关系,相关关系是一种不确定性关系. 2.正相关和负相关 (1)正相关 在散点图中,点散布在从左下角到右上角的区域,对于两个变量的这种相关 关系,我们就称它为正相关. (2)负相关 在散点图中,点散布在从左上角到右下角的区域,对于两个变量的这种相关 关系,我们就称它为负相关.
一元线性回归模型参数的最小二乘估计(第二课时)课件-高二数学人教A版(2019)选择性必修第三册
残差比较均匀地分布在以取
值为0的横轴为对称轴的水
平带状区域内. 所以在四幅
残差图中,只有图(4)满足
一元线性回归模型对随机误
差的假设.
典例 1:下面给出了根据某地区 2013~2019 年水果人均占有量 y(单位:kg)和年份代码
x 绘制的散点图和经验回归方程的残差图(2013~2019 年的年份代码 x 分别为 1~7).
注意到100m短跑的第一个世界纪录产生于1896年,因此可认为散点集中在曲线
y=c1+c2ln(t-1895)的周围. 其中c1和c2为未知参数,且c2 < 0.
用上述函数刻画数据变化的趋势,这是一个非线性经验回归函数,其中c1, c2 是待
定参数. 现在问题转化为如何利用成对数据估计参数c1和c2.
መ
以计算出=0.839
,ො
=28.957,
求出儿子身高Y关于父亲身高x的经验回归方
程为
ŷ 0.839 x 28.957
相应的经验回归直线如图所示.
ŷ 0.839 x 28.957
ො
思考:当x=176时,≈177.
如果一位父亲身高为176cm,他儿子长大成人后的身高一
定是177cm吗? 为什么?
残差是随机误差的估计结果,通过对残差的分析可以判断模型刻画数据的效果,以及判断
原始数据中是否存在可疑数据等,这方面工作称为残差分析。
残差分析:
残差表:将残差以表格的形式呈现;
残差图:将残差以图象的形式呈现。
残差表:
编号
父亲身高/cm
儿子身高观测值/cm
儿子身高预测值/cm
残差/cm
1
174
高中数学第二章统计23变量间的相关关系课件新人教A版必修3(2)
总费用y/万元 2.2 3.8 5.5 6.5 7.0
(1)根据表格数据,画出散点图;
(2)求线性回归方程y^=b^x+a^的系数a^,b^; (3)估计使用年限为 10 年时,车的使用总费用是多少?
【解题探究】(1)利用描点法作出散点图; (2)把数据代入公式,可得回归方程的系数; (3)把x=10代入回归方程得y值,即为总费用的估计 值.
【答案】A 【解析】在A中,若b确定,则a,b,c都是常数,Δ= b2-4ac也就唯一确定了,因此,这两者之间是确定性的函数 关系;一般来说,光照时间越长,果树亩产量越高;降雪量越 大,交通事故发生率越高;施肥量越多,粮食亩产量越高,所 以B,C,D是相关关系.故选A.
两个变量x与y相关关系的判断方法 1.散点图法:通过散点图,观察它们的分布是否存在 一定规律,直观地判断.如果发现点的分布从整体上看大致在 一条直线附近,那么这两个变量就是线性相关的,注意不要受 个别点的位置的影响. 2.表格、关系式法:结合表格或关系式进行判断. 3.经验法:借助积累的经验进行分析判断.
变量之间的相关关系的判断
【 例 1】 下 列 变 量 之 间 的 关 系 不 是 相 关 关 系 的 是 ()
A.二次函数y=ax2+bx+c中,a,c是已知常数,取b 为自变量,因变量是判别式Δ=b2-4ac
B.光照时间和果树亩产量 C.降雪量和交通事故发生率 D.每亩田施肥量和粮食亩产量
【解题探究】判断两个变量之间具有相关关系的关键是 什么?
①反映^y与 x 之间的函数关系;
②反映 y 与 x 之间的函数关系;
③表示^y与 x 之间的不确定关系;
④表示最接近 y 与 x 之间真实关系的一条直线.
A.①②
人教A版高中数学必修三新课标算法案例教案(2)
1.3 算法案例整体设计教学分析在学生学习了算法的初步知识,理解了表示算法的算法步骤、程序框图和程序三种不同方式以后,再结合典型算法案例,让学生经历设计算法解决问题的全过程,体验算法在解决问题中的重要作用,体会算法的基本思想,提高逻辑思维能力,发展有条理地思考与数学表达能力.三维目标1.理解算法案例的算法步骤和程序框图.2.引导学生得出自己设计的算法程序.3. 体会算法的基本思想,提高逻辑思维能力,发展有条理地思考与数学表达能力.重点难点教学重点:引导学生得出自己设计的算法步骤、程序框图和算法程序.教学难点:体会算法的基本思想,提高逻辑思维能力,发展有条理地思考与数学表达能力.课时安排3课时教学过程第1课时案例1 辗转相除法与更相减损术导入新课思路1(情境导入)大家喜欢打乒乓球吧,由于东、西方文化及身体条件的不同,西方人喜欢横握拍打球,东方人喜欢直握拍打球,对于同一个问题,东、西方人处理问题方式是有所不同的.在小学,我们学过求两个正整数的最大公约数的方法:先用两个数公有的质因数连续去除,一直除到所得的商是互质数为止,然后把所有的除数连乘起来. 当两个数公有的质因数较大时(如8 251与6 105),使用上述方法求最大公约数就比较困难.下面我们介绍两种不同的算法——辗转相除法与更相减损术,由此可以体会东、西方文化的差异.思路2(直接导入)前面我们学习了算法步骤、程序框图和算法语句.今天我们将通过辗转相除法与更相减损术来进一步体会算法的思想.推进新课新知探究提出问题(1)怎样用短除法求最大公约数?(2)怎样用穷举法(也叫枚举法)求最大公约数?(3)怎样用辗转相除法求最大公约数?(4)怎样用更相减损术求最大公约数?讨论结果:(1)短除法求两个正整数的最大公约数的步骤:先用两个数公有的质因数连续去除,一直除到所得的商是两个互质数为止,然后把所有的除数连乘起来.(2)穷举法(也叫枚举法)穷举法求两个正整数的最大公约数的解题步骤:从两个数中较小数开始由大到小列举,直到找到公约数立即中断列举,得到的公约数便是最大公约数.(3)辗转相除法辗转相除法求两个数的最大公约数,其算法步骤可以描述如下:第一步,给定两个正整数m,n.第二步,求余数r:计算m除以n,将所得余数存放到变量r中.第三步,更新被除数和余数:m=n,n=r.第四步,判断余数r是否为0.若余数为0,则输出结果;否则转向第二步继续循环执行.如此循环,直到得到结果为止. 这种算法是由欧几里得在公元前300年左右首先提出的,因而又叫欧几里得算法.(4)更相减损术我国早期也有解决求最大公约数问题的算法,就是更相减损术. 《九章算术》是中国古代的数学专著,其中的“更相减损术”也可以用来求两个数的最大公约数,即“可半者半之,不可半者,副置分母、子之数,以少减多,更相减损,求其等也.以等数约之.”翻译为现代语言如下:第一步,任意给定两个正整数,判断它们是否都是偶数,若是,用2约简;若不是,执行第二步.第二步,以较大的数减去较小的数,接着把所得的差与较小的数比较,并以大数减小数,继续这个操作,直到所得的数相等为止,则这个数(等数)或这个数与约简的数的乘积就是所求的最大公约数.应用示例例1 用辗转相除法求8 251与6 105的最大公约数,写出算法分析,画出程序框图,写出算法程序.解:用两数中较大的数除以较小的数,求得商和余数:8 251=6 105×1+2 146.由此可得,6 105与2 146的公约数也是8 251与6 105的公约数,反过来,8 251与6 105的公约数也是6 105与2 146的公约数,所以它们的最大公约数相等.对6 105与2 146重复上述步骤:6 105=2 146×2+1 813.同理,2 146与1 813的最大公约数也是6 105与2 146的最大公约数.继续重复上述步骤:2 146=1 813×1+333,1 813=333×5+148,333=148×2+37,148=37×4.最后的除数37是148和37的最大公约数,也就是8 251与6 105的最大公约数.这就是辗转相除法.由除法的性质可以知道,对于任意两个正整数,上述除法步骤总可以在有限步之后完成,从而总可以用辗转相除法求出两个正整数的最大公约数.算法分析:从上面的例子可以看出,辗转相除法中包含重复操作的步骤,因此可以用循环结构来构造算法.算法步骤如下:第一步,给定两个正整数m,n.第二步,计算m除以n所得的余数为r.第三步,m=n,n=r.第四步,若r=0,则m,n的最大公约数等于m;否则,返回第二步.程序框图如下图:程序:INPUT m,nDOr=m MOD nm=nn=rLOOP UNTIL r=0PRINT mEND点评:从教学实践看,有些学生不能理解算法中的转化过程,例如:求8 251与6 105的最大公约数,为什么可以转化为求6 105与2 146的公约数.因为8 251=6 105×1+2 146,可以化为8 251-6 105×1=2 164,所以公约数能够整除等式两边的数,即6 105与2 146的公约数也是8 251与6 105的公约数.变式训练你能用当型循环结构构造算法,求两个正整数的最大公约数吗?试画出程序框图和程序.解:当型循环结构的程序框图如下图:程序:INPUT m,nr=1WHILE r>0r=m MOD nm=nn=rWENDPRINT mEND例2 用更相减损术求98与63的最大公约数.解:由于63不是偶数,把98和63以大数减小数,并辗转相减,如下图所示.98-63=3563-35=2835-28=728-7=2121-7=1414-7=7所以,98和63的最大公约数等于7.点评:更相减损术与辗转相除法的比较:尽管两种算法分别来源于东、西方古代数学名著,但是二者的算理却是相似的,有异曲同工之妙.主要区别在于辗转相除法进行的是除法运算,即辗转相除;而更相减损术进行的是减法运算,即辗转相减,但是实质都是一个不断的递归过程.变式训练用辗转相除法或者更相减损术求三个数324,243,135的最大公约数.解:324=243×1+81,243=81×3+0,则324与243的最大公约数为81.又135=81×1+54,81=54×1+27,54=27×2+0,则81 与135的最大公约数为27.所以,三个数324、243、135的最大公约数为27.另法:324-243=81,243-81=162,162-81=81,则324与243的最大公约数为81.135-81=54,81-54=27,54-27=27,则81与135的最大公约数为27.所以,三个数324、243.135的最大公约数为27.例3 (1)用辗转相除法求123和48的最大公约数.(2)用更相减损术求80和36的最大公约数.解:(1)辗转相除法求最大公约数的过程如下:123=2×48+27,48=1×27+21,27=1×21+6,21=3×6+3,6=2×3+0,最后6能被3整除,得123和48的最大公约数为3.(2)我们将80作为大数,36作为小数,因为80和36都是偶数,要除公因数2.80÷2=40,36÷2=18.40和18都是偶数,要除公因数2.40÷2=20,18÷2=9.下面来求20与9的最大公约数,20-9=11,11-9=2,9-2=7,7-2=5,5-2=3,3-2=1,2-1=1,可得80和36的最大公约数为22×1=4.点评:对比两种方法控制好算法的结束,辗转相除法是到达余数为0,更相减损术是到达减数和差相等.变式训练分别用辗转相除法和更相减损术求1 734,816的最大公约数.解:辗转相除法:1 734=816×2+102,816=102×8(余0),∴1 734与816的最大公约数是102.更相减损术:因为两数皆为偶数,首先除以2得到867,408,再求867与408的最大公约数.867-408=459,459-408=51,408-51=357,357-51=306,306-51=255,255-51=204,204-51=153,153-51=102,102-51=51.∴1 734与816的最大公约数是51×2=102.利用更相减损术可另解:1 734-816=918,918-816=102,816-102=714,714-102=612,612-102=510,510-102=408,408-102=306,306-102=204,204-102=102.∴1 734与816的最大公约数是102.知能训练求319,377,116的最大公约数.解:377=319×1+58,319=58×5+29,58=29×2.∴377与319的最大公约数为29,再求29与116的最大公约数.116=29×4.∴29与116的最大公约数为29.∴377,319,116的最大公约数为29.拓展提升试写出利用更相减损术求两个正整数的最大公约数的程序.解:更相减损术程序:INPUT “m,n=”;m,nWHILE m<>nIF m>n THENm=m-nELSEm=n-mEND IFWENDPRINT mEND课堂小结(1)用辗转相除法求最大公约数.(2)用更相减损术求最大公约数.思想方法:递归思想.作业分别用辗转相除法和更相减损术求261,319的最大公约数.分析:本题主要考查辗转相除法和更相减损术及其应用.使用辗转相除法可依据m=nq+r,反复执行,直到r=0为止;用更相减损术就是根据m-n=r,反复执行,直到n=r为止.解:辗转相除法:319=261×1+58,261=58×4+29,58=29×2.∴319与261的最大公约数是29.更相减损术:319-261=58,261-58=203,203-58=145,145-58=87,87-58=29,58-29=29,∴319与261的最大公约数是29.设计感想数学不仅是一门科学,也是一种文化,本节的引入从东、西方文化的不同开始,逐步向学生渗透数学文化.从知识方面主要学习用两种方法求两个正整数的最大公约数,从思想方法方面,主要学习递归思想.本节设置精彩例题,不仅让学生学到知识,而且让学生进一步体会算法的思想,培养学生的爱国主义情操.。
2019年最新-人教版高中数学必修三第二章-统计-3.1《变量之间的相关关系》ppt课件
2.相关关系的概念
自变量取值一定时,因变量的取值带有一定的随机性的两个变量之间的 关系叫相关关系.
(1)相关关系与函数关系的异同点: 相同点:均是指两个变量的关系 不同点:函数关系是一种确定的关系; 而相关关系是一种非确定关系;
谢谢!
墨子,(约前468~前376)名翟,鲁人 ,一说 宋人, 战国初 期思想 家,政 治家, 教育家 ,先秦 堵子散 文代表 作家。 曾为宋 国大夫 。早年 接受儒 家教育 ,后聚 徒讲学 ,创立 与儒家 相对立 的墨家 学派。 主张•兼 爱”“ 非攻“ 尚贤” “节用 ”,反 映了小 生产者 反对兼 并战争 ,要求 改善经 济地位 和社会 地A 完整地聆听歌曲。
点散布在从左下角 到右上角的区域
称它们成 正相关。
脂肪含量
40
35
如图: 30
25
20
15
10
5
年龄
O
20 25 30 35 40 45 50 55 60 65
下列关系属于负相关关系的是( )
C
A.父母的身高与子女的身高
B.农作物产量与施肥的关系
C.吸烟与健康的关系
D.数学成绩与物理成绩的关系
我们再观察它的图像发现这些点大致分布在一条直线附近,像这样,如果 散点图中点的分布从整体上看大致在一条直线附近,我们就称这两个变量之间具 有线性相关关系;
2.3 变量间的相关关系
2.3.1 变量之间的相关关系
本课主要学习变量间的相关关系与散点图的相关内容,具体包括相关关系的 定义以及通过散点图如何判断变量间的关系。
8-2第2课时 一元线性回归模型的综合问题(教学课件) 高中数学人教A版(2019)选择性必修第三册
由题意知lg lg
ห้องสมุดไป่ตู้
300=klg 200=klg
300+b 2 000+b,
解得k=-14 b=285,
所以 lg f=-14lg W+285,
25
1
所以f关于W的函数解析式为f=10 8 W 4 .
03 残差平方和与决定系数R2
问题3 例2中给出了两个模型,那么如何比较这两个模型的拟合效果? 提示 残差平方和、决定系数.
(2)当声音强度大于60 dB时属于噪音,会产 生噪声污染,城市中某点P共受到两个声源的 影响,这两个声源的声音能量分别是I1和I2, 且 I11+I42=1010.已知点P的声音能量等于声音 能量I1与I2之和,请根据(1)中的经验回归方 程,判断P点是否受到噪声污染的干扰,并 说明理由.
点P的声音能量I=I1+I2, ∵I11+I42=1010, ∴I=I1+I2=10-10·I11+I42(I1+I2)=10-10· 5+II21+4II21≥9×10-10(当且仅当II21=4II21,即 I2=2I1 时等号成立), 根据(1)中的经验回归方程,点 P 的声音强度 D 的最小预测值为D^ = 10·lg(9×10-10)+160.7=10·lg 9+60.7>60,
量 I 的经验回归方程D^ =a^ +b^ ·lg I;
附:对于一组数据(u1,v1),(u2,v2),…,(un,vn),其经验回归直线v^ =
n
ui- u vi- v
i=1
α^ +β^ u 的斜率和截距的最小二乘估计分别为β^ =
,α^ = v
n
ui- u 2
i=1
-β^ ·u .
由Wi=lg Ii,先建立D关于W的经验回归方程,
人教版高中数学-两个变量的线性相关
《2.3.2两个变量的线性相关》一、内容和内容解析本节课是人教A版高中数学必修三2.3.2两个变量的线性相关的第二课时。
上节课通过大量的生活实例,学生已经初步认识两个变量间的相关关系,并可以借助散点图呈现收集的数据。
通过对单变量样本数据中“平均数的几何意义”(切合学生的认知需要)的介绍,为本节课的内容做了铺垫。
本节课的主要内容是用最小二乘法求线性回归方程,基础知识是回归直线的概念,也是本节课的核心概念;基本思想是“最小二乘法”思想;根据线性回归方程的系数公式求回归直线是本节课的基本技能.就统计学科而言,对不同的数据处理方法进行“优劣评价”是“假设检验”的萌芽,而后者是统计学学科研究的另一重要领域了解“最小二乘法”思想,比较各种“估算方法”,体会它的科学性,既是统计学教学发展的需要,又在体会此思想的过程中促进学生对核心概念的进一步理解.“样本估计总体”是本节课的上位思想也是整个第二章的核心思想,而“最小二乘法思想”作为本节课的核心思想,由此得以体现.回归思想和贯穿统计学科中的随机思想,也在本节课中有所渗透.本节课通过引导学生经历“收集数据一一整理数据(作散点图)一一探究并确定回归直线的数学意义一一求回归直线方程一一应用”完整的回归分析的过程,鼓励学生独立思考、自主探究、合作交流和计算机操作等方式展开学习,从而发挥本节课的育人价值。
整个学习过程渗透了数据分析和数学建模的核心素养。
通过引导学生对散点图中的点大致分布在一条直线附近的观察,渗透直观想象的核心素养;通过尝试提出找回归直线的想法、用自己的语言描述对这条直线的初步认识到探究从数学的角度定义回归直线的过程,渗透数学抽象和逻辑推理的核心素养;最后,根据回归直线方程的系数公式,引导学生先求出公式中的基本统计量,再代入公式的过程和指导学生利用Excel电子表格求回归方程的过程,提升数学运算的核心素养。
基于上述内容分析,本节课的教学重点为:了解最小二乘法思想,并能根据给出的线性回归方程的系数公式,建立线性回归方程二、目标和目标设置基于对本节课教学内容的解析,结合《普通高中数学课程标准(2017年版)》的要求,制定本节课的教学目标如下:1.了解一元线性回归模型的含义:(1)能根据散点图解释两个相关变量的线性相关关系;(2)能用自己的语言解释回归直线的统计意义;2. 了解最小二乘原理:(1)经历用不同方法确定回归直线的过程,能认识到回归直线是“从整体上看,各点与此直线上的点的距离最小”的直线;(2)能用数学符号刻画“从整体上看,各点与此直线上的点的距离最小”的表达方式;(3)通过对表达方式的转化(距离最小到偏差平方和最小),体会最小二乘法原理,并能用自己的语言表述;3.针对实际应用问题,能根据给出的线性回归方程系数公式建立线性回归方程;4.在经历完整的线性回归分析的过程中,重点提升数据分析和数学建模核心素养;5.针对实际应用问题,会用一元线性回归模型进行预测.第1页(共6页)三、学生学情分析在经历用不同估算方法描述两个变量线性相关的过程后,在学生现有知识能力范围内,如何选择一个最优方法,成为知识发展的逻辑必然而上节课的“从平均数的几何意义说起”符合学生的认知需要和支撑点,同时引起了学生的兴趣,为这节课的最小二乘法思想的产生做了重要的铺垫.“最小二乘法”作为经典的回归方程估算方法,通过用数学方法刻画“从整体上看,各点与此直线的距离最小”这一直观的几何描述,采取合适的数学处理方法,最终获得回归直线,对学生认可统计估算的科学性有很大帮助.其中对于数形结合发现距离与偏差的等价性,二元二次函数的特征辨识等都是这节课学生所要具备的认知基础.基于此,如何把“从整体上看,各点与此直线的距离最小”用合适的代数符号刻画并化简,化几何问题为代数问题,是学生顺利了解解“最小二乘法”思想的前提;而如何化简复杂的代数表达式,学生缺乏处理的经验,在计算能力的要求上也较高,这里就造成了已有认知与现需认知的差异,而且是学生不能独立突破的要了解“最小二乘法思想”,接受“由系数公式得到的线性方程”为回归方程,理解此方程可作为“两个具有线性相关关系的变量的代表”这一回归直线概念的本质,并体现相对于其他估算方法法的优越性,又必须要求对给出的系数公式来源进行一定的说理,这里的认知差异也是学生无法自己消除的,需要老师的引导和帮忙.知识发展的要求与学生能力和经验的欠缺成为本节课将会遇到的最大矛盾.教学中,要防止两种倾向:一是直接套用回归系数公式求解回归方程而回避说理过程;二是过多纠缠于数学刻画过程,甚至在课堂上花大量时间对回归系数公式进行证明说理.这两种倾向,都脱离了实际情况,前者忽略了“最小二乘法思想”迷失了本节课的教学目标后者人为拔高教材要求,脱离了本节课教学要求.所以,本节课的教学难点是:如何通过数学方法刻画“从整体上看,各点与此直线的距离最小”,并在此过程中了解最小二乘法思想对于该教学难点,教师通过精准问题串层层分解学生认知的难点,不断寻找学生的认知原点,关键处动画展示,直观形象,突破教学难点. 本节课涉及大量数据计算,形成操作上的一个难点,通过小组合作,教师培训模式突破难点.四、教学策略分析本节课在课前让学生收集身高与体重的数据,一方面对前面学过的知识有一个巩固,同时让本节课进行线性回归分析的过程更加完整;二是从学生身边的真实数据出发,更容易促进学习动机,而且给学生带来的体验也更为真实。
变量间的相关关系教学设计(广东深圳第二高级中学董正林)
课题:变量间的相关关系(第2课时)授课教师:深圳市第二高级中学董正林教材:数学·人教社A版·必修三·第二章第三节一、教学内容解析本课作为“变量间的相关关系”第2课时,主要内容是探究如何用一条直线来近似刻画两个变量之间的相关关系,并且能用所得的直线方程进行预测,在这个过程中渗透多个重要的数理统计思想——最小二乘思想、随机思想与用样本估计总体的思想.通过第1课时的学习,学生已经能够理解相关关系这一概念,能通过绘制散点图对相关关系进行直观、定性的描述,比如根据散点图判断两个变量间是否存在相关关系,是正相关还是负相关等.本课内容是上节课内容的延续与深入,通过用一条直线来近似代表变量间的线性相关关系,从而实现对相关关系进行定量研究.显然,在整体上与样本点最接近的直线能最大程度地近似代表真实关系.为此我们需要建立一个量化标准,也就是对“从整体上看,直线最接近样本点”进行精准的数学语言刻画.这样量化标准有很多,最经典、最常采用的就是最小二乘思想.以最小二乘法建立起线性回归方程后,我们就能对所研究的总体情况进行预测.将解释变量代入回归方程计算得到一个数值并不难,更重要地是学生需要正确理解预测值的含义,明确预测值只是实际值的一个近似,是对总体情况的一种估计.基于上述分析,本节课的教学重点定为:理解回归直线只是对相关关系的一种近似描述,最小二乘法只是确定回归直线的一种方法,理解回归方程的含义以及背后蕴含的统计思想.教学难点则是对“从整体上看,直线与样本点最接近”进行数学刻画,并在这个过程中引出最小二乘法这一重要数学思想.二、教学目标设置1、知识与技能:了解线性相关关系、回归直线、回归方程等基本概念,能熟练操作图形计算器进行绘图、计算,认识最小二乘法.2、过程与方法:在探究如何用一条直线去很好地近似变量间线性相关关系的过程中,学习如何用数学知识去定量刻画实际问题,掌握线性回归的基本方法.3、情感、态度与价值观:通过合作探究、类比思考,理解回归方程的随机性以及用样本估计总体的思想,感受“见微知著”、“一叶知秋”的哲学原理以及认识客观事物的一种角度.三、学生学情分析本课纯粹知识层面的内容并不多,但涉及许多重要且新颖的数学思想方法,有些思想方法与学生已有的认知基础偏离较远,比如学生已经习惯了一个问题无论有多少种解法,答案都是唯一确定的,但本课需要学生实现由确定性思维向统计思维的转变,因此学生要真正做到建构知识体系、抓住本质问题、理解核心概念不是一件容易的事情.此外,学生对大量的样本数据、复杂的公式结构以及代数运算可能心存畏惧,这些都会影响到课堂教学.有利的地方在于学生已经学习过方差的概念,能够理解用平均数去估计总体数字特征,以此作为其思维的“最近发展区”,便于其更好地认识最小二乘思想.同时,学生对新知识的旺盛求解欲望、对问题进行积极思考的态度也是顺利完成本课的重要保证.四、教学策略分析根据学生情况,为了更好地达成教学重点、突破教学难点,本课采用如下教学策略:1、注重由特殊到一般的思维引导.本课以预设问题链激发学生思考、推动课堂教学.问题的设置体现了由特殊到一般的认知规律——学生先判定有限个方程中哪个方程的拟合效果更好,然后再推广到一般情形,探究如何在所有直线中寻找“最佳”直线.2、强调实验探究,主张在学生自主活动的基础上进行思考、领悟.比如让学生在散点图中任意添加直线并求其方程,经过实验,就会发现每个人求得的直线都不一样,从而很自然地触发讨论——如何建立起量化标准,用数学知识来度量到底哪一条直线才是最接近样本点的,最终获得最小二乘思想.3、采用类比思考法.将最小二乘法与方差的概念进行类比,将“用最小二乘意义下的回归直线来近似代表两个变量间的线性相关关系”这一原理与“以多个测量值的平均值作为某物理量真实值的估计”进行类比.通过类比帮助学生更好地理解数学思想,提升思维品质.4、注意几何直观与代数运算的相互转化.比如将“回归直线并不经过所有的样本点”这个几何问题代数化为“由回归方程计算出来的值与实际值存在偏差”,将“比较各点偏差的绝对值之和”这个代数问题几何化为“样本点与直线间的斜线段的长度和最小”等.5、应用现代教育技术手段.本课内容涉及大量的图形绘制与复杂的数据运算,用传统教学手段既耗时费力,又难以有效推进教学.TI-图形计算器的强大功能为数据的快捷处理提供了技术支持,让学生有更多的时间来探究、交流,便于达成教学目标.图形计算器在本课的应用包括如下几个地方:(1)搭建无线网络平台,实现数据的实时上传与共享——借助图形计算器的“即时调查”功能,现场收集学生的身高、体重数据,并将汇总后的数据实时下发给学生,一方面为本课学习营造一个真实的案例,另一方面也避免了大量数据的手工逐一输入.(2)运用图形计算器的“图形”功能,快速绘制散点图,从散点图中发现样本点大致分布在一条直线附近.在此基础上,请学生凭直观感觉,在散点图中任作一条与样本点整体上最接近的直线,并通过“坐标与方程”功能得到该直线的方程.经过操作学生自会发现,每个人眼中的直线都不一样,到底哪一条直线才是最接近的需要建立起量化标准,用数学语言来精准度量,从而很自然地触发讨论,最终引出最小二乘思想.(3)利用图形计算器,进行快速计算.包括:在“列表与电子表格”中调用sum()函数求和;利用“统计计算/线性回归”功能直接求出一组数据的线性回归方程;尤其值得一提的是,在“计算器”页面中调用completesquare()函数可以实现对多项式的快速配方,这样我们就可以选取三个特殊样本点,对目标函数进行配方,帮助学生更好地认识系数公式的来历.五、教学过程与设计教学环节问题或任务双边活动设计意图创设情景【实验】身高和体重是生活中最常见的相关关系之一.请在图形计算器中输入你的身高、体重数据,然后根据汇总后的数据绘制散点图,并根据散点图思考下列问题:学生在图形计算器的手持端输入数据,然后提交;教师将数据汇总,然后下发给学生;现场搜集数据,创设与学生实际密切相关的问题情景,激发兴趣.。
2.3.1 变量之间的相关关系 2.3.2 两个变量的线性相关
2.3 变量间的相关关系 2.3.1 变量之间的相关关系 2.3.2 两个变量的线性相关考点 学习目标核心素养 相关关系的概念理解两个变量的相关关系的概念 数学抽象 散点图 会作散点图,并利用散点图判断两个变量之间是否具有相关关系逻辑推理、数学建模回归直线方程会求回归直线方程数学运算问题导学(1)相关关系分为哪两种? (2)什么叫散点图?(3)什么叫回归直线?求回归直线的方法及步骤是什么?1.两个变量的线性相关(1)散点图:将样本中n 个数据点(x i ,y i )(i =1,2,…,n )描在平面直角坐标系中得到的图形.(2)正相关与负相关①正相关:散点图中的点散布在从左下角到右上角的区域; ②负相关:散点图中的点散布在从左上角到右下角的区域. 2.回归直线的方程(1)回归直线:如果散点图中点的分布从整体上看大致在一条直线附近,我们就称这两个变量之间具有线性相关关系,这条直线叫做回归直线.(2)回归方程:回归直线对应的方程叫回归直线的方程,简称回归方程. (3)最小二乘法求回归直线方程y ^=b ^x +a ^时,使得样本数据的点到回归直线的距离的平方和最小的方法叫做最小二乘法.其中b ^是回归方程的斜率,a ^是回归方程在y 轴上的截距. ■名师点拨 (1)散点图的作用散点图形象地反映了各对数据的密切程度.根据散点图中点的分布趋势分析两个变量之间的关系,可直观地判断并得出结论.(2)回归直线的性质由a ^=y --b ^x -可知回归直线一定经过点(x -,y -),因此点(x -,y -)通常称为样本点的中心,其中,x -,y -分别是变量x 1,x 2,…,x n 和y 1,y 2,…,y n 的平均数.(3)线性相关关系强弱的定性分析线性相关关系的强弱体现在散点图中就是样本点越集中在某条直线附近,两变量的线性相关关系越强;样本点在某条直线附近越分散,两变量的线性相关关系越弱.判断正误(对的打“√”,错的打“×”) (1)线性回归方程必经过点(x -,y -).( )(2)对于方程y ^=b ^x +a ^,x 增加一个单位时,y 平均增加b ^个单位.( ) (3)样本数据中x =0时,可能有y =a ^.( ) (4)样本数据中x =0时,一定有y =a ^.( )解析:根据回归直线方程的意义知,(1)(2)都正确,而(3)(4)中,样本数据x =0时,y 的值可能为a ^,也可能不是a ^,故(3)正确.答案:(1)√ (2)√ (3)√ (4)×下列各图中所示的两个变量具有相关关系的是( )A .(1)(2)B .(1)(3)C .(2)(4)D .(2)(3)解析:选D.(1)为函数关系;(2)(3)为相关关系;(4)中,因为点分布得比较分散,两者之间无相关关系.5位学生的数学成绩和物理成绩如下表: 学科 A B C D E 数学 80 75 70 65 60 物理7066686462A .是函数关系B .是相关关系,但相关性很弱C .具有较好的相关关系,且是正相关D .具有较好的相关关系,且是负相关解析:选C.数学成绩x 和物理成绩y 的散点图如图所示.从图上可以看出数学成绩和物理成绩具有较好的相关关系,且成正相关. 设有一个回归方程为y ^=2-1.5x ,则变量x 每增加1个单位时,y 平均减少____________个单位.,解析:因为y ^=2-1.5x ,所以变量x 每增加1个单位时,y 1-y 2=[2-1.5(x +1)]-(2-1.5x )=-1.5,所以y 平均减少1.5个单位.答案:1.5相关关系的判断以下是在某地搜集到的不同楼盘新房屋的销售价格y(单位:万元)和房屋面积x(单位:m2)的数据:房屋面积x(m2)11511080135105销售价格y(万元)24.821.619.429.222(2)判断新房屋的销售价格和房屋面积之间是否具有相关关系?如果有相关关系,是正相关还是负相关?【解】(1)数据对应的散点图如图所示:(2)通过以上数据对应的散点图可以判断,新房屋的销售价格和房屋的面积之间具有相关关系,且是正相关.相关关系的判断方法(1)两个变量x和y具有相关关系的判断方法①散点图法:通过散点图,观察它们的分布是否存在一定规律,直观地判断;②表格、关系式法:结合表格或关系式进行判断;③经验法:借助积累的经验进行分析判断.(2)判断两个变量x和y之间是否具有线性相关关系,常用的简便方法就是绘制散点图,如果发现点的分布从整体上看大致在一条直线附近,那么这两个变量就是线性相关的,注意不要受个别点的位置的影响.[易错警示]在解答本题过程中,易出现如下错误:虽然五点中有四点大致分布在一条直线附近,但第二个点离这条直线太远,所以两个变量不相关,导致错误的原因是没有看主流点,而过分关注了不影响大局的个别点.对变量x,y有观测数据(x i,y i)(i=1,2,…,10),得散点图如图所示.由这个散点图可以判断()A.变量x与y正相关B.变量x与y不相关C.变量x与y负相关D.变量x与y是函数关系解析:选C.由这个散点图可以判断,变量x与y负相关,故选C.线性回归方程的求法下表提供了某厂节能降耗技术改造后生产甲产品过程中记录的产量x(吨)与相应的生产能耗y(吨标准煤)的几组对照数据:x 345 6y 2.534 4.5 (2)请根据上表提供的数据,用最小二乘法求出y关于x的线性回归方程y^=b^x+a^. 【解】(1)散点图如图.(2)x-=3+4+5+64=4.5,y-=2.5+3+4+4.54=3.5,∑i=14x i y i=3×2.5+4×3+5×4+6×4.5=66.5,∑i=14x2i=32+42+52+62=86,所以b ^=∑4i =1x i y i -4x -y-∑4i =1x 2i -4x-2=66.5-4×4.5×3.586-4×4.52=0.7, a ^=y --b ^x -=3.5-0.7×4.5=0.35. 所以所求的线性回归方程为y ^=0.7x +0.35.如果把例题中的y 的值2.5及4.5分别改为2和5,如何求回归直线方程? 解:散点坐标分别为(3,2),(4,3),(5,4),(6,5). 可验证这四点共线, 斜率k =3-24-3=1,所以直线方程为y -2=x -3, 即回归直线方程为y ^=x -1.求线性回归方程的步骤(1)计算平均数x -,y -.(5)用a ^=y --b ^x -,求a ^. (6)写出回归方程.某化工厂为预测某产品的回收率y ,需要研究它和原料有效成分含量x之间的相关关系,现取了8对观测值,计算得:则y 关于x 的回归直线方程是( )A.y ^=11.47+2.62x B.y ^=-11.47+2.62x C.y ^=2.62+11.47x D.y ^=11.47-2.62x解析:选A.利用题目中的已知条件可以求出x -=6.5,y -=28.5,然后利用回归直线方程的计算公式得b ^=∑8i =1x i y i -8x -y-∑8i =1x 2i -8x-2=1 849-8×6.5×28.5478-8×6.52≈2.62, a ^=y --b ^x -=11.47,因此回归直线方程为y ^=11.47+2.62x .线性回归方程的应用(2020·黑龙江省大庆铁人中学期末考试)某班主任为了对本班学生的月考成绩进行分析,从全班40名同学中随机抽取一个容量为6的样本进行分析.随机抽取6位同学的数学、物理分数对应如表:学生编号 1 2 3 4 5 6 数学分数x 60 70 80 85 90 95 物理分数y728088908595(1) (2)如果具有线性相关性,求出线性回归方程(系数精确到0.1);如果不具有线性相关性,请说明理由;(3)如果班里的某位同学数学成绩为50,请预测这位同学的物理成绩.【解】 (1)画出散点图:通过图象可以看出物理成绩y 与数学成绩x 之间具有线性相关性. (2)x -=16×(60+70+80+85+90+95)=80,y -=16×(72+80+88+90+85+95)=85,故b ^=0.6,a ^=37.故回归方程是y =0.6x +37. (3)当x =50时,解得y =67.故数学成绩为50,预测这位同学的物理成绩是67.利用线性回归方程解题的常见思路及注意点(1)利用回归直线过样本点的中心,可以求参数问题,参数可涉及回归方程或样本点数据.(2)利用回归方程中系数b ^的意义,分析实际问题.(3)利用回归直线进行预测,此时需关注两点:①所得的值只是一个估计值,不是精确值;②变量x 与y 成线性相关关系时,线性回归方程才有意义,否则即使求出线性回归方程也是毫无意义的,用其估计和预测的量也是不可信的.(2020·江西省临川第一中学期末考试)我国西部某贫困地区2011年至2017年农村居民家庭人均年收入y (千元)的数据如下表:年份 2011 2012 2013 2014 2015 2016 2017 年份代号x 1 2 3 4 5 6 7 人均年收入y2.93.33.64.44.85.25.9(2)利用(1)中的回归方程,预测该地区2019年农村居民家庭人均年收入将达到多少千元.解:(1)依题意x -=4,y -=4.3,从而b ^=0.5,a ^=y --b ^x -=4.3-0.5×4=2.3, 故所求线性回归方程为y ^=0.5x +2.3. (2)令x =9,得y ^=0.5×9+2.3=6.8.预测该地区在2019年农村居民家庭人均年收入为6.8千元.1.我们常说“吸烟有害健康”,吸烟与健康之间的关系是( ) A .正相关 B .负相关 C .无相关D .不确定解析:选B.烟吸得越多,则健康程度越差.2.关于回归直线方程y ^=a ^+b ^x 的叙述正确的是( ) ①反映y ^与x 之间的函数关系; ②反映y 与x 之间的函数关系; ③表示y ^与x 之间的不确定关系;④表示最接近y 与x 之间真实关系的一条直线. A .①② B .②③ C .③④ D .①④解析:选D.y ^=a ^+b ^x 表示y ^与x 之间的函数关系,而不是y 与x 之间的函数关系,它反映的关系最接近y 与x 之间的真实关系.故①④正确.3.在最小二乘法中,用来刻画各个样本点到直线y =a ^+b ^x 的“距离”的量是( ) A .|y i -y -| B .(y i -y -)2 C .|y i -(a ^+b ^x i )|D .[y i -(a ^+b ^x i )]2解析:选D.最小二乘法的定义明确给出,用[y i -(a ^+b ^x i )]2来刻画各个样本点与这条直线之间的“距离”(即二者之间的接近程度),用它们的和表示所有样本点与这条直线的接近程度.4.已知工厂加工零件的个数x 与花费时间y (h)之间的线性回归方程为y ^=0.01x +0.5,则加工200个零件大约需要________小时.解析:将200代入线性回归方程y ^=0.01x +0.5, 得y ^=2.5. 答案:2.5[A 基础达标]1.如图所示是具有相关关系的两个变量的一组数据的散点图,去掉哪个点后,两个变量的相关关系更明显( )A .DB .EC .FD .A解析:选C.A 、B 、C 、D 、E 五点分布在一条直线附近且贴近该直线,而F 点离得远,故去掉点F .2.(2020·江西省上饶市期末统考)某车间为了规定工时定额,需要确定加工零件所花费用的时间,为此进行了5次实验,根据收集到的数据(如下表),由最小二乘法求得回归直线方程为y ^=7.8x +40.2.零件数x (个) 1 23 4 5 加工时间y (min)50677179A .55B .55.8C .59D .51解析:选 D.设表中模糊的数据为m .由表中的数据可得x -=1+2+3+4+55=3,y -=50+m +67+71+795=267+m5,又由回归直线的方程为y ^=7.8x +40.2,所以267+m 5=7.8×3+40.2,解得m =51.即表中模糊的数据为51.故选D.3.已知变量x 和y 满足关系y =-0.1x +1,变量y 与z 正相关.下列结论中正确的是( ) A .x 与y 正相关,x 与z 负相关 B .x 与y 正相关,x 与z 正相关 C .x 与y 负相关,x 与z 负相关 D .x 与y 负相关,x 与z 正相关解析:选C.因为y =-0.1x +1的斜率小于0,故x 与y 负相关.因为y 与z 正相关,可设z =b ^y +a ^,b ^>0,则z =b ^y +a ^=-0.1b ^x +b ^+a ^,故x 与z 负相关.4.已知x 与y 之间的几组数据如下表:假设根据上表数据所得线性回归方程为y =b x +a .若某同学根据上表中的前两组数据(1,0)和(2,2)求得的直线方程为y =b ′x +a ′,则以下结论正确的是( )A.b ^>b ′,a ^>a ′ B.b ^>b ′,a ^<a ′ C.b ^<b ′,a ^>a ′D.b ^<b ′,a ^<a ′解析:选C.由两组数据(1,0)和(2,2)可求得直线方程为y =2x -2,从而b ′=2,a ′=-2.而利用线性回归方程的公式与已知表格中的数据,可求得b ^=∑6i =1x i y i -6x -·y-∑6i =1x 2i -6x-2=58-6×72×13691-6×⎝⎛⎭⎫722=57,a ^=y --b ^x -=136-57×72=-13,所以b ^<b ′,a ^>a ′. 5.(2020·广西钦州市期末考试)若回归直线y ^=b ^x +a ^的斜率估值为1.23,样本中心点为(4,5),当x =2时,估计y 的值为____________.解析:因为回归直线y ^=b ^x +a ^的斜率估值为1.23,所以b ^=1.23,y ^=1.23x +a ^. 因为样本中心点为(4,5),所以5=1.23×4+a ^,a ^=0.08,y ^=1.23x +0.08, 代入x =2,y =1.23×2+0.08=2.54. 答案:2.546.(2020·湖北省宜昌市葛洲坝中学期末考试)某公司借助手机微信平台推广自己的产品,对今年前5个月的微信推广费用x 与利润额y (单位:百万元)进行了初步统计,得到下列表格中的数据:x 2 4 5 6 8 y304060p70经计算,月微信推广费用x 与月利润额y 满足线性回归方程y ^=6.5x +17.5,则p 的值为____________.解析:由题中数据可得x -=2+4+5+6+85=5,y -=30+40+60+p +705=200+p5.由线性回归方程y ^=6.5x +17.5经过样本中心(x -,y -), 有200+p 5=6.5×5+17.5,解得p =50.答案:507.对某台机器购置后的运营年限x (x =1,2,3,…)与当年利润y 的统计分析知具备线性相关关系,线性回归方程为y ^=10.47-1.3x ,估计该台机器使用________年最合算.解析:只要预计利润不为负数,使用该机器就算合算,即y ^≥0,所以10.47-1.3x ≥0,解得x ≤8.05,所以该台机器使用8年最合算.答案:88.(2020·湖南省张家界市期末联考)为了解某地区某种农产品的年产量x (单位:吨)对价格y (单位:千元/吨)的影响,对近五年该农产品的年产量和价格统计如表:x 1 2 3 4 5 y86542(1)求x -,y -;(2)求y 关于x 的线性回归方程y ^=b ^x +a ^; (3)若年产量为4.5吨,试预测该农产品的价格.解:(1)计算可得x -=1+2+3+4+55=3,y -=8+6+5+4+25=5.(2)b ^=∑5i =1x i y i -5x -y-∑5i =1x 2i -5x-2=61-5×3×555-5×32=-1.4, 因为线性回归直线过(x -,y -),则a ^=y --b ^x -=5-(-1.4×3)=9.2, 故y 关于x 的线性回归方程是y ^=-1.4x +9.2. (3)当x =4.5时,y ^=-1.4×4.5+9.2=2.9(千元/吨).9.(2020·河北省石家庄市期末考试)在一段时间内,分5次测得某种商品的价格x (万元)和需求量y (吨)之间的一组数据为(1)根据上表数据,求出回归直线方程y =b x +a ;(2)试根据(1)中求出的回归方程预估当价格为1.9万元时,需求量大约是多少吨?(参考公式:b ^=∑ni =1(x i -x -)(y i -y -)∑ni =1(x i -x -)2=∑ni =1x i y i -n x -y -∑n i =1x 2i -n (x )-2,a ^=y --b ^x -)解:(1)因为x -=15×9=1.8,y -=15×37=7.4,∑i =15 x i y i =62,∑i =15x 2i =16.6,所以 b ^=∑5i =1x i y i -5x -y-∑5i =1x 2i -5(x )-2=62-5×1.8×7.416.6-5×1.82=-11.5, a ^=y --b ^x -=7.4+11.5×1.8=28.1, 故y 对x 的线性回归方程为y ^=28.1-11.5x . (2)y =28.1-11.5×1.9=6.25(吨).所以如果价格为1.9万元,则需求量大约是6.25吨.[B 能力提升]10.对两个变量的四组数据进行统计,获得以下散点图,关于两个变量相关系数的比较,正确的是( )A .r 2<r 4<0<r 3<r 1B .r 4<r 2<0<r 1<r 3C .r 4<r 2<0<r 3<r 1D .r 2<r 4<0<r 1<r 3解析:选A.由相关系数的定义以及散点图的含义,可知r 2<r 4<0<r 3<r 1.11.期中考试后,某校高三(9)班班主任对全班65名学生的成绩(单位:分)进行分析,得到数学成绩y 关于总成绩x 的回归直线方程为y ^=6+0.4x .由此可以估计:若2名同学的总成绩相差50分,则他们的数学成绩大约相差________分.解析:设两名同学的总成绩分别为x 1,x 2,则对应的数学成绩估计为y ^1=6+0.4x 1,y ^2=6+0.4x 2,所以|y ^1-y ^2|=|0.4(x 1-x 2)|=0.4×50=20.答案:2012.(2020·湖北省宜昌县域高中协同发展共同体期末考试)为研究冬季昼夜温差大小对某反季节大豆新品种发芽率的影响,某校课外兴趣小组记录了5组昼夜温差与100颗种子发芽数,得到如下资料:组号 1 2 3 4 5 温差x (℃) 10 11 13 12 8 发芽数y (颗)2325302616组数据中选取3组数据求出线性回归方程,再用没选取的2组数据进行检验.(1)若选取的是第2,3,4组的数据,求出y 关于x 的线性回归方程y ^=b ^x +a ^; (2)若由线性回归方程得到的估计数据与所选出的检验数据的误差均不超过2颗,则认为得到的线性回归方程是可靠的,试问(1)中所得的线性回归方程是否可靠?(参考公式:b ^=∑ni =1(x i -x -)(y i -y -)∑ni =1 (x i -x -)2=∑ni =1x i y i -n x -y -∑n i =1x 2i -n x-2,a ^=y --b ^x -)解:(1)由题意:x -=11+13+123=12,y -=25+30+263=27,b ^=∑3i =1 (x i -x -)(y i -y -)∑3i =1 (x i -x -)2=(x 1-x -)(y 1-y -)+(x 2-x -)(y 2-y -)+(x 3-x -)(y 3-y -)(x 1-x -)2+(x 2-x -)2+(x 3-x -)2=(11-12)×(25-27)+(13-12)×(30-27)+(12-12)×(26-27)(11-12)2+(13-12)2+(12-12)2=52, a ^=y --b ^x -=27-52×12=-3,故回归直线方程为y ^=52x -3.(2)当x =10时,y =52×10-3=22,|22-23|=1<2,当x =8时,y =52×8-3=17,|17-16|=1<2,所以(1)中所得的回归直线方程是可靠的.13.(选做题)(2019·黑龙江省牡丹江市第一高级中学期末考试)某公司为确定下一年度投入某种产品的宣传费,需了解年宣传费x (单位:千元)对年销售量y (单位:t)和年利润z (单位:千元)的影响,对近8年的年宣传费x i 和年销售量y i (i =1,2,…,8)数据作了初步处理,得到下面的散点图及一些统计量的值.表中w i=xi,w-=18i=18w i.(1)根据散点图判断,y=a+bx与y=c+d x哪一个适宜作为年销售量y关于年宣传费x 的回归方程类型?(给出判断即可,不必说明理由)(2)根据(1)的判断结果及表中数据,建立y关于x的回归方程;(3)已知这种产品的年利润z与x、y的关系为z=0.2y-x.根据(2)的结果回答下列问题:(ⅰ)年宣传费x=49时,年销售量及年利润的预报值是多少?(ⅱ)年宣传费x为何值时,年利润的预报值最大?附:对于一组数据(u1,v1),(u2,v2),…,(u n,v n),其回归线v=α+βu的斜率和截距的最小二乘估计分别为解:(1)由散点图可以判断,y=c+d x适宜作为年销售量y关于年宣传费x的回归方程类型.(2)令w=x,先建立y关于w的线性回归方程.由于d=108.81.6=68,c^=y--d^w-=563-68×6.8=100.6,所以y关于w的线性回归方程为y^=100.6+68w,因此y关于x的回归方程为y^=100.6+68x.(3)(ⅰ)由(2)知,当x=49时,年销售量y的预报值y^=100.6+6849=576.6,年利润z的预报值z^=576.6×0.2-49=66.32.(ⅱ)根据(2)的结果知,年利润z的预报值z^=0.2(100.6+68x)-x=-x+13.6x+20.12.所以当x=13.62=6.8,即x=46.24时,z^取得最大值.故年宣传费为46.24千元时,年利润的预报值最大.。
高一数学人教A版必修3课件:2.3变量间的相关关系(第二课时)
求回归方程的关键是如何用数学的方法来刻画 “从整体上看,各点与直线的距离最小”。 思考6:对一组具有线性相关关系的样本数据: (x1,y1),(x2,y2),„,(xn,yn),设其回归 方程为 可以用哪些数量关系来刻画各 样本点与回归直线的接近程度?
回归直线
实际上,求回归直线的关键是如何用数学的方 法来刻画“从整体上看,各点到此直线的距离最 小”.
b
( x x)( y y) x y n x y
i 1 i i
n
n
( x x)
i 1 i
n
i 1 n
i
i
2
x nx
i 1 2 i
,
2
a y bx
以上公式的推导较复杂,故不作推导,但它的原 理较为简单:即各点到该直线的距离的平方和最 小,这一方法叫最小二乘法。
3、回归直线方程 (1)回归直线:观察散点图的特征,如果各点大致分 布在一条直线的附近,就称两个变量之间具有线性相关的 关系,这条直线叫做回归直线。 (2)最小二乘法
n n
b
( x x )( y y ) x y nx y
年龄 23
脂肪 9.5 年龄 53
27
54
39
56
41
57
45
58
49
60
50
61
17.8 21.2 25.9 27.5 26.3 28.2
脂肪 29.6 30.2 31.4 30.8 33.5 35.2 34.6
思考2:为了确定年龄和人体脂肪含量之间的 更明确的关系,我们需要对数据进行分析, 通过作图可以对两个变量之间的关系有一个 直观的印象.以x轴表示年龄,y轴表示脂肪含 量,你能在直角坐标系中描出样本数据对应 的图形吗?
高中数学必修三第二章《统计》学案2.3.变量间的相关关系(学生专用)(A版)
高中数学必修三第二章《统计》学案2.3.变量间的相关关系(学生专用)(A版)普通高中数学必修3(A版)学案 2.3. 变量间的相关关系2.3.1变量之间的相关关系授课时间:年月日【学习目标】通过收集现实问题中两个有关联变量的数据认识变量间的相关关系。
【重点难点】1. 通过收集现实问题中两个有关联变量的数据直观认识变量间的相关关系。
2. 变量之间相关关系的理解。
【学习过程】一、学习引导在中学校园里,有这样一种说法:“如果你的数学成绩好,那么你的物理学习就不会有什么大问题.”按照这种说法,似乎学生的物理成绩与数学成绩之间存在着某种关系,我们把数学成绩和物理成绩看成是两个变量,那么这两个变量之间的关系是函数关系吗?二、合作交流(教师可做点拨)相关关系的概念:两个变量之间的关系可能是确定的关系(如:函数关系),或非确定性关系。
当自变量取值一定时,因变量也确定,则为确定关系;当自变量取值一定时,因变量带有随机性,这种变量之间的关系称为相关关系。
相关关系是一种非确定性关系。
(分析:两个变量→自变量取值一定→因变量带有随机性→相关关系)三、随堂练习思考1:考察下列问题中两个变量之间的关系:(1)商品销售收入与广告支出经费;(2)粮食产量与施肥量;(3)人体内的脂肪含量与年龄.这些问题中两个变量之间的关系是函数关系吗?思考2:“名师出高徒”可以解释为教师的水平越高,学生的水平就越高,那么学生的学业成绩与教师的教学水平之间的关系是函数关系吗?你能举出类似的描述生活中两个变量之间的这种关系的成语吗?思考3:商品销售收入与广告支出经费之间的关系。
(还与商品质量,居民收入,生活环境等有关)四、能力提升1. 上述两个变量之间的关系是一种非确定性关系,称之为相关关系,那么相关关系的含义如何?2. 对于一个变量,可以控制其数量大小的变量称为可控变量,否则称为随机变量,那么相关关系中的两个变量有哪种类型?3. 相关关系与函数关系的异同点?【小结反思】1. 变量具有不确定性,需要通过收集大量的数据(通过调查或试验)在对数据进行统计分析的基础上,发现其中的规律,才能对它们之间的关系做出正确的判断。
本册综合-人教A版高中数学选择性必修第三册(2019版)教案
本册综合-人教A版高中数学选择性必修第三册(2019版)教案一、教材简介《本册综合-人教A版高中数学选择性必修第三册(2019版)》是人民教育出版社出版的一本高中数学教材,适合高中三年级学生使用,主要包括以下内容:•函数及三角函数•导数与微分•不等式与极值•平面向量•空间向量•平面解析几何•空间解析几何•推理与证明教材全面、系统性强,涉及到大量的数学概念和知识点,便于学生深入理解数学原理,并能在应用中灵活运用,提升数学水平。
二、教学目标本教案旨在使学生掌握本册综合教材中重要的数学概念和知识点,提高学生数学解决问题的能力和实际应用能力,具体包括以下目标:1.掌握函数的概念,具有根据函数图像和性质解决实际问题的能力。
2.了解导数的概念和几何意义,掌握常用函数的导数公式及其在实际问题中的应用。
3.掌握解不等式的基本方法,了解函数中极值、最值的概念,通过实际问题的应用,培养思维能力和判断能力。
4.掌握平面向量和空间向量的基本概念、数量表示法和运算法则,熟悉向量的几何意义及其在实际问题中的应用。
5.理解平面解析几何和空间解析几何的基本思想和方法,掌握重要公式和定理,熟悉解析几何应用题的解法。
6.培养逻辑思维能力,掌握推理和证明方法,能够进行简单的数学证明。
三、教学内容与方法1. 函数与三角函数内容•函数概念•函数性质(奇偶性、单调性、周期性等)•常用函数(幂函数、指数函数、对数函数、三角函数等)•函数图像和应用方法•教师讲解+学生思考•教师示范+学生练习•学生小组合作完成练习题和应用题2. 导数与微分内容•导数的概念和含义•常用函数的导数公式(标准函数、初等函数、反三角函数等)•函数的微分及其应用方法•教师讲解+学生思考•教师示范+学生练习•学生小组合作完成练习题和应用题3. 不等式与极值内容•不等式的基本性质和解法•函数极值和最值的概念•常用不等式及其应用(比如柯西-施瓦茨不等式、均值不等式等)方法•教师讲解+学生思考•教师示范+学生练习•学生小组合作完成练习题和应用题4. 平面向量和空间向量内容•向量的基本概念和数量表示法•向量的加减法和数量积、向量积运算•向量的几何意义及其在空间几何中的应用(平行四边形定理、共面向量定理等)•向量的坐标表示和平面向量在平面直角坐标系下的应用(平面向量共线、垂直等问题)方法•教师讲解+学生思考•教师示范+学生练习•学生小组合作完成练习题和应用题5. 平面解析几何和空间解析几何内容•平面解析几何基本思想和方法(点、线、圆等的方程及其特殊情况的处理)•空间解析几何基本思想和方法(点、直线、平面等的方程和参数式)方法•教师讲解+学生思考•教师示范+学生练习•学生小组合作完成练习题和应用题6. 推理与证明内容•命题概念和表示方法•命题的逻辑运算和关系•常见的逻辑命题和其真值表•数学证明方法和技巧方法•教师讲解+学生思考•教师示范+学生练习•学生小组合作完成练习题和应用题四、教学评价与反馈本教学计划采用阶段性、多元化的评价方式,包括课堂测验、作业评查、小组合作成果评价等。
一元线性回归模型(教学课件)(人教A版2019选择性必修第三册)
175
170
165
160
父亲身高/cm
160
165
1
图8.2-1
环节三:抽象概括,形成概念
图8.2-1中的散点大致分布在一条直线附近,表明儿子身高和父亲身高这两个 变量之间有较强的线性相关关系,因此我们可以用一次函数来刻画父亲身高 对儿子身高的影响,而把影响儿子身高的其他因素,如母亲身高、生活环境、 饮食习惯等作为随机误差,得到刻画两个变量之间关系的线性回归模型其中, 随机误差是一个随机变量.
3.将图8.2-1中的点按父亲身高的大小次序用折线连起来,所得到的图 象是一个折线图,可以用这条折线表示儿子身高和父亲身高之间的关系 吗?
不能.一是父亲的身高与儿子的身高之间是随机关系,不是函数关系;
二是这组数据仅是总体的一个样本,不一定能很好地描述两个变量之间
的关系.
儿子身高/cm
190
185
180
的线性相关程度越弱;特别地,当|r|=0时,成对数据的没有线性相关关系;当 |r|=1时,成对数据都落在一条直线上.
恩格尔系数(Engel’s Coefficient)是根据恩格尔定律得出 的比例数,指居民家庭中食物支出占消费总支出的比重,是表示 生活水平高低的一个指标. 其计算公式:恩格尔系数=食物支出金额÷总支出金额.
i 1
n
n
( xi x)2 ( yi y)2
i 1
i 1
n
xi yi nx y
i 1
.
n
n
xi2 nx2
yi2 ny 2
i 1
i 1
2.相关系数的性质: ① 当r>0时,称成对样本数据正相关;当r<0时,称成对样本数据负相关. ② |r|≤1; ③ 当|r|越接近1时,成对数据的线性相关程度越强;当|r|越接近0时,成对数据
课标人教A版必修3全套课件第二章变量间的相关关系2.3 变量间的相关关系
英国科学家探险家和人类测量学家。 英国科学家探险家和人类测量学家。1822年2月16日生于伯明 年 月 日生于伯明 日卒于伦敦附近的萨里。 翰,1911年1月17日卒于伦敦附近的萨里。C.R.达尔文的表弟 年 月 日卒于伦敦附近的萨里 达尔文的表弟 高尔顿和 首先发现回归现象的是英国生物学家高尔顿 首先发现回归现象的是英国生物学家高尔顿和皮尔 他们分别在遗传学研究中发现, 逊,他们分别在遗传学研究中发现,生物后代的属 性与其父母有关, 性与其父母有关,这种关系仅仅在平均程度上有所 差别。他们发现, 差别。他们发现,高个子父母的子代平均高度比较 矮个子父母的子代平均高度比较低, 高,矮个子父母的子代平均高度比较低,进一步的 研究又发现, 研究又发现,高个子子代的平均高度要比父代的高 度低,而矮个子子代的平均高度要比父代的高度高, 度低,而矮个子子代的平均高度要比父代的高度高, 形成向种族平均高度靠拢的趋势, 形成向种族平均高度靠拢的趋势,高尔顿将这种现 象称作为“回归” 象称作为“回归”。 回归分析的目的就是确定变量之间数量关系的可能 形式,并用一个数学模型来表示这种关系形式。 形式,并用一个数学模型来表示这种关系形式。
在一次对人体脂肪含量和年龄的关系研究中,研究人员获得 在一次对人体脂肪含量和年龄的关系研究中 研究人员获得 了一份样本数据: 了一份样本数据
说明:各个年龄阶段的脂肪数据是这个年龄样本的平均数 说明 各个年龄阶段的脂肪数据是这个年龄样本的平均数
根据上述数据,人体的脂肪含量与年龄之间有什么样的关系 根据上述数据 人体的脂肪含量与年龄之间有什么样的关系? 人体的脂肪含量与年龄之间有什么样的关系
x y 1.08 1.12 1.19 1.28 1.36 1.48 1.59 1.68 1.80 1.87 1.98 2.07 2.25 2.37 2.40 2.55 2.64 2.75 2.92 3.03 3.14 3.26 3.36 3.50
2-3-1、2 变量之间的相关关系 两个变量的线性相关
第二章
2 .3
2.3.1、2
成才之路 ·高中新课程 ·学习指导 ·人教A版 ·数学 ·必修3
马蹄铁上一个钉子是否丢失与一个帝国存与亡关系有多 大呢?显然,这种关系不能用我们熟悉的函数关系来描述, 那么这究竟是一种什么样的关系?本节,我们共同研究.
第二章
2 .3
2.3.1、2
成才之路 ·高中新课程 ·学习指导 ·人教A版 ·数学 ·必修3
[答案] A
第二章
2 .3
2.3.1、2
成才之路 ·高中新课程 ·学习指导 ·人教A版 ·数学 ·必修3
4.在初中数学及《数学必修1》中,我们研究了两个变 量之间的函数关系,变量之间的函数关系是一种确定的关 系,当自变量x的值确定之后,都有唯一确定的y值与之对 应,这种关系是一种理想的关系模型.但现实生活中两个变 量之间存在着另外一种关系,其中一个变量与另一个变量有 关,但确定这个变量的因素不止一个,这种关系就是本节我 们要学习的变量间的相关关系,学习这种相关关系要同变量 间的函数关系区分开来.
第二章
2 .3
2.3.1、2
成才之路 ·高中新课程 ·学习指导 ·人教A版 ·数学 ·必修3
(1)下列变量之间的关系不是相关关系的是(
)
A.二次函数y=ax2+bx+c中,a,c是已知常数,取b为 自变量,因变量是判别式Δ=b2-4ac B.光照时间和果树亩产量 C.降雪量和交通事故发生率 D.每亩田施肥量和粮食亩产量
第二章
2.3.1 2.3.2 变量之间的相关关系 两个变量的线性相关
第二章
统计
成才之路 ·高中新课程 ·学习指导 ·人教A版 ·数学 ·必修3
课前自主预习 基础巩固训练 思路方法技巧 能力强化提升 名师辨误做答
高中数学选择性必修三 8 2 一元线性回归模型及其应用教学设计
8.2 一元线性回归模型及其应用本节课选自《2019人教A 版高中数学选择性必修第三册》,第七章《随机变量及其分布列》,本节课主本节课主要学习一元线性回归模型及其应用.本章主要学习统计方面知识,在之前学生已经对统计相关的知识做了大概的了解,本节学生要继续探讨的是变量之间的相关关系,变量之间有两类关系;函数关系和相关关系,它们的联系与区别;并了解线性相关及相关系数,为了解线性回归的基本思想和方法以及求回归直线的方程和相关性检验做准备。
重点:决定系数R 2的意义和作用难点:某些非线性回归问题转化为线性回归问题多媒体探究2. 根据表中的数据,儿子身高和父亲身高这两个变量之间的关系可以用函数模型刻画吗?编号 1 2 3 4 5 6 7 8 910 11121314父亲身高/cm 174171731691821721817216816618217316418儿子身高/cm 176176171718517617817417168178172165182表中的数据,存在父亲身高相同而儿子身高不同的情况.例如,第6个和第8个观测父亲的身高均为172cm,而对应的儿子的身高为176cm和174cm;同样在第3,4个观测中,儿子的身高都是170cm,而父亲的身高分别为173cm,169cm.可见儿子的身高不是父亲身高的函数同样父亲的身高也不是儿子身高的函数,所以不能用函数模型来刻画.探究3:从成对样本数据的散点图和样本相关系数可以发现,散点大致分布在一条直线附近表明儿子身高和父亲身高有较强的线性关系.我们可以这样理解,由于有其他因素的存在,使儿子身高和父亲身高有关系但不是函数关系.那么影响儿子身高的其他因素是什么?影响儿子身高的因素除父亲的身外,还有母亲的身高、生活的环境、饮食习惯、营养水平、体育锻炼等随机的因素,儿子身高是父亲身高的函数的原因是存在这些随机的因素.探究3:由探究3我们知道,正是因为存在这些随机的因素,使得儿子的身高呈现出随机性各种随机因素都是独立的,有些因素又无法量化.你能否考虑到这些随机因素的作用,用类似于函数的表达式,表示儿子身高与父亲身高的关系吗?如果用x 表示父亲身高,Y 表示儿子的身高,用e 表示各种其他随机因素影响之和,称e 为随机误差,由于儿子身高与父亲身高线性相关,所以Y=bx+a.一元线性回归模型用X 表示父亲身高,Y 表示儿子身高,e 表示随机误差,假定随机误差e 的均值为0,方差为与父亲身高无关的定值σ2,则它们之间的关系可以表示为{Y =bx +a +eE(e)=0,D(e)=σ2), (1) 我们称(1)式为Y 关于x 的一元线性回归模型(simple linear regression model).其中,Y 称为因变量或响应变量,x 称为自变量或解释变量;a 和b 为模型的未知参数,a 称为截距参数,b 称为斜率参数;e 是Y 与bx +a 之间的随机误差,模型中的Y 也是随机变量,其值虽然不能由变量x 的值确定,但是却能表示为bx +a 与e 的和(叠加),前一部分由x 所确定,后一部分是随机的,如果e =0,那么Y 与x 之间的关系就可用一元线性函数模型来描述.问题1. 你能结合父亲与儿子身高的实例,说明回归模型①的意义?可以解释为父亲身高为x i 的所有男大学生身高组成一个子总体,该子总体的均值为b x i +a ,即该子总体的均值与父亲的身高是线性函数关系.2,()0,().Y bx a e E e D e σ=++⎧⎨==⎩①而对于父亲身高为x i 的某一名男大学生,他的身高y i 并不一定为b x i +a ,它仅是该子总体的一个观测值,这个观测值与均值有一个误差项e i =y i-(bx i +a ).问题2.你能结合具体实例解释产生模型①中随机误差项的原因吗? 产生随机误差e 的原因有:(1)除父亲身高外,其他可能影响儿子身高的因素,比如母亲身高、生活环境、饮食习惯和锻炼时间等.(2)在测量儿子身高时,由于测量工具、测量精度所产生的测量误差.(3)实际问题中,我们不知道儿子身高和父亲身高的相关关系是什么,可以利用一元线性回归模型来近似这种关系,这种近似关系也是产生随机误差e 的原因.与函数模型不同,回归模型的参数一般是无法精确求出的,只能通过成对样本数据估计这两个参数。
人教A版高中数学必修三变量之间的相关关系教案(1)(1)
2.3.1变量之间的相关关系教学目标:通过收集现实问题中两个有关联变量的数据作出散点图,并利用散点图直观认识变量间的相关关系。
教学重点:通过收集现实问题中两个有关联变量的数据作出散点图,并利用散点图直观认识变量间的相关关系。
教学过程:案例分析:一般说来,一个人的身高越高,他的人就越大,相应地,他的右手一拃长就越长,因此,人的身高与右手一拃长之间存在着一定的关系。
为了对这个问题进行调查,我们收集了北京市某中学2003年高三年级96名学生的身高与右手一拃长的数据如下表。
(1)根据上表中的数据,制成散点图。
你能从散点图中发现身高与右手一拃长之间的近似关系吗?(2)如果近似成线性关系,请画出一条直线来近似地表示这种线性关系。
(3)如果一个学生的身高是188cm,你能估计他的一拃大概有多长吗?解:根据上表中的数据,制成的散点图如下。
从散点图上可以发现,身高与右手一拃长之间的总体趋势是成一直线,也就是说,它们之间是线性相关的。
那么,怎样确定这条直线呢?同学1:选择能反映直线变化的两个点,例如(153,16),(191,23)二点确定一条直线。
同学2:在图中放上一根细绳,使得上面和下面点的个数相同或基本相同。
同学3:多取几组点对,确定几条直线方程。
再分别算出各个直线方程斜率、截距的算术平均值,作为所求直线的斜率、截距。
同学4:我从左端点开始,取两条直线,如下图。
再取这两条直线的“中间位置”作一条直线。
同学5:我先求出相同身高同学右手一拃长的平均值,画出散点图,如下图,再画出近似的直线,使得在直线两侧的点数尽可能一样多。
1015202530150155160165170175180185190195同学6:我先将所有的点分成两部分,一部分是身高在170 cm 以下的,一部分是身高在170 cm 以上的;然后,每部分的点求一个“平均点”——身高的平均值作为平均身高、右手一拃的平均值作为平均右手一拃长,即(164,19),(177,21);最后,将这两点连接成一条直线。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
2019人教A版高中数学必修三《两个变量的线性相关》第二课时教案做散点图.(a.如果所有的样本点都落在某一函数曲线上,就用该函数来描述变量之间的关系,即变量之间具有函数关系.b.如果所有的样本点都落在某一函数曲线附近,变量之间就有相关关系.c.如果所有的样本点都落在某一直线附近,变量之间就有线性相关关系)(2)如果散点图中的点散布在从左下角到右上角的区域内,称为正相关.如果散点图中的点散布在从左上角到右下角的区域内,称为负相关. (3)如果所有的样本点都落在某一直线附近,变量之间就有线性相关的关系.(4)大体上来看,随着年龄的增加,人体中脂肪的百分比也在增加,呈正相关的趋势,我们可以从散点图上来进一步分析.(5)如下图:从散点图上可以看出,这些点大致分布在通过散点图中心的一条直线附近.如果散点图中点的分布从整体上看大致在一条直线附近,我们就称这两个变量之间具有线性相关关系,这条直线叫做回归直线(regression line).如果能够求出这条回归直线的方程(简称回归方程),那么我们就可以比较清楚地了解年龄与体内脂肪含量的相关性.就像平均数可以作为一个变量的数据的代表一样,这条直线可以作为两个变量具有线性相关关系的代表.(6)从散点图上可以发现,人体的脂肪百分比和年龄的散点图,大致分布在通过散点图中心的一条直线.那么,我们应当如何具体求出这个回归方程呢?有的同学可能会想,我可以采用测量的方法,先画出一条直线,测量出各点与它的距离,然后移动直线,到达一个使距离的和最小的位置,测量出此时的斜率和截距,就可得到回归方程了.但是,这样做可靠吗?有的同学可能还会想,在图中选择这样的两点画直线,使得直线两侧的点的个数基本相同.同样地,这样做能保证各点与此直线在整体上是最接近的吗?还有的同学会想,在散点图中多取几组点,确定出几条直线的方程,再分别求出各条直线的斜率、截距的平均数,将这两个平均数当成回归方程的斜率和截距.同学们不妨去实践一下,看看这些方法是不是真的可行?(学生讨论:1.选择能反映直线变化的两个点.2.在图中放上一根细绳,使得上面和下面点的个数相同或基本相同.3.多取几组点对,确定几条直线方程.再分别算出各个直线方程斜率、截距的算术平均值,作为所求直线的斜率、截距.)教师:分别分析各方法的可靠性.如下图:上面这些方法虽然有一定的道理,但总让人感到可靠性不强.实际上,求回归方程的关键是如何用数学的方法来刻画“从整体上看,各点与此直线的距离最小”.人们经过长期的实践与研究,已经得出了计算回归方程的斜率与截距的一般公式⎪⎪⎪⎩⎪⎪⎪⎨⎧-=--=---=∑∑∑∑====.)1(,)())((2121121x b y a x n x y x n y x x x y y x x b n i i n i i i n i i n i i i其中,b 是回归方程的斜率,a 是截距.推导公式①的计算比较复杂,这里不作推导.但是,我们可以解释一下得出它的原理.假设我们已经得到两个具有线性相关关系的变量的一组数据(x 1,y 1),(x 2,y 2),…,(x n ,y n ),且所求回归方程是^y =bx+a, 其中a 、b 是待定参数.当变量x 取x i (i=1,2,…,n)时可以得到^y =bx i +a(i=1,2,…,n), 它与实际收集到的y i 之间的偏差是yi-^y=y i-(bx i+a)(i=1,2,…,n).这样,用这n个偏差的和来刻画“各点与此直线的整体偏差”是比较合适的.由于(yi-^y)可正可负,为了避免相互抵消,可以考虑用∑=-niiiyy1^| |来代替,但由于它含有绝对值,运算不太方便,所以改用Q=(y1-bx1-a)2+(y2-bx2-a)2+…+(yn-bxn-a)2②来刻画n个点与回归直线在整体上的偏差.这样,问题就归结为:当a,b取什么值时Q最小,即总体偏差最小.经过数学上求最小值的运算,a,b的值由公式①给出.通过求②式的最小值而得出回归直线的方法,即求回归直线,使得样本数据的点到它的距离的平方和最小,这一方法叫做最小二乘法(method of least square).(7)利用计算机求回归直线的方程.根据最小二乘法的思想和公式①,利用计算器或计算机,可以方便地求出回归方程.以Excel软件为例,用散点图来建立表示人体的脂肪含量与年龄的相关关系的线性回归方程,具体步骤如下:①在Excel中选定表示人体的脂肪含量与年龄的相关关系的散点图(如下图),在菜单中选定“图表”中的“添加趋势线”选项,弹出“添加趋势线”对话框.②单击“类型”标签,选定“趋势预测/回归分析类型”中的“线性”选项,单击“确定”按钮,得到回归直线.③双击回归直线,弹出“趋势线格式”对话框.单击“选项”标签,选定“显示公式”,最后单击“确定”按钮,得到回归直线的回归方程^y=0.577x-0.448.(8)利用计算器求回归直线的方程.用计算器求这个回归方程的过程如下:所以回归方程为^y=0.577x-0.448.正像本节开头所说的,我们从人体脂肪含量与年龄这两个变量的一组随机样本数据中,找到了它们之间关系的一个规律,这个规律是由回归直线来反映的.直线回归方程的应用:①描述两变量之间的依存关系;利用直线回归方程即可定量描述两个变量间依存的数量关系.②利用回归方程进行预测;把预报因子(即自变量x)代入回归方程对预报量(即因变量Y)进行估计,即可得到个体Y值的容许区间.③利用回归方程进行统计控制规定Y值的变化,通过控制x的范围来实现统计控制的目标.如已的浓度和汽车流量间的回归经得到了空气中NO2方程,即可通过控制汽车流量来控制空气中NO2的浓度.应用示例思路1例1 有一个同学家开了一个小卖部,他为了研究气温对热饮销售的影响,经过统计,得到一个卖出的热饮杯数与当天气温的对比表:摄氏温度/℃-5 0 4 7 12 15 19 23 27 31 36热饮杯数156151321281311610489 93 76 54(1)画出散点图;(2)从散点图中发现气温与热饮销售杯数之间关系的一般规律;(3)求回归方程;(4)如果某天的气温是2 ℃,预测这天卖出的热饮杯数.解:(1)散点图如下图所示:(2)从上图看到,各点散布在从左上角到右下角的区域里,因此,气温与热饮销售杯数之间呈负相关,即气温越高,卖出去的热饮杯数越少. (3)从散点图可以看出,这些点大致分布在一条直线的附近,因此,可用公式①求出回归方程的系数.利用计算器容易求得回归方程^y=-2.352x+147.767.(4)当x=2时,^y=143.063.因此,某天的气温为2 ℃时,这天大约可以卖出143杯热饮.思考气温为 2 ℃时,小卖部一定能够卖出143杯左右热饮吗?为什么?这里的答案是小卖部不一定能够卖出143杯左右热饮,原因如下:1.线性回归方程中的截距和斜率都是通过样本估计出来的,存在随机误差,这种误差可以导致预测结果的偏差.2.即使截距和斜率的估计没有误差,也不可能百分之百地保证对应于x的预报值,能够与实际值y很接近.我们不能保证点(x,y)落在回归直线上,甚至不能百分之百地保证它落在回归直线的附近,事实上,y=bx+a+e=^y+e.这里e是随机变量,预报值^y与实际值y的接近程度由随机变量e的标准差所决定.一些学生可能会提出问题:既然不一定能够卖出143杯左右热饮,那么为什么我们还以“这天大约可以卖出143杯热饮”作为结论呢?这是因为这个结论出现的可能性最大.具体地说,假如我们规定可以选择连续的3个非负整数作为可能的预测结果,则我们选择142,143和144能够保证预测成功(即实际卖出的杯数是这3个数之一)的概率最大.例2 下表为某地近几年机动车辆数与交通事故数的统计资料.(1)请判断机动车辆数与交通事故数之间是否有线性相关关系,如果不具有线性相关关系,说明理由;(2)如果具有线性相关关系,求出线性回归方程. 解:(1)在直角坐标系中画出数据的散点图,如下图.直观判断散点在一条直线附近,故具有线性相关关系.(2)计算相应的数据之和:∑=81i ix =1 031,∑=81i iy =71.6,∑=812i ix =137 835,∑=81i ii y x =9 611.7.将它们代入公式计算得b≈0.077 4,a=-1.024 1, 所以,所求线性回归方程为=0.077 4x-1.024 1.思路2例 1 给出施化肥量对水稻产量影响的试验数据: 施化肥量x 15 20 25 30 35 40 45水稻产量y330 345 365 405 445 450 455(1)画出上表的散点图; (2)求出回归直线的方程. 解:(1)散点图如下图.(2)表中的数据进行具体计算,列成以下表格: i 1 2 3 4 5 6 7 x i 15 20 25 30 35 40 45 y i 330 345 365 405 445 450 455 x i y i4950 6900 9125 12150 15575 18000 2047587175,1132725,7000,3.399,3071712712=====∑∑∑===i i i i ii iy x y x y x故可得到b=230770003.39930787175⨯-⨯⨯-≈4.75, a=399.3-4.75×30≈257.从而得回归直线方程是^y =4.75x+257.例 2 一个车间为了规定工时定额,需要确定加工零件所花费的时间.为此进行了10次试验,测得数据如下:零件个数x(个)10 20 30 40 50 60 70 80 90 100加工时间y(分)62 68 75 81 89 95 102 108 115 122请判断y与x是否具有线性相关关系,如果y与x具有线性相关关系,求线性回归方程.解:在直角坐标系中画出数据的散点图,如下图.直观判断散点在一条直线附近,故具有线性相关关系.由测得的数据表可知:∑===1012,7.91,55iixyx=38 500,∑=1012iiy=87 777,∑=101iiiyx=55 950.b=2210121015510385007.915510559501010⨯-⨯⨯-=--∑∑==xxyxyxiiiii≈0.668.a=x by-=91.7-0.668×55≈54.96.因此,所求线性回归方程为^y=bx+a=0.668x+54.96.例3 已知10条狗的血球体积及红血球数的测量值如下:血球体积x(mL)45 42 46 48 42 35 58 40 39 50红血球数y(百万)6.536.309.527.506.995.909.496.206.558.72(1)画出上表的散点图;(2)求出回归直线的方程.解:(1)散点图如下.(2)101=x (45+42+46+48+42+35+58+40+39+50)=44.50,101=y (6.53+6.30+9.52+7.50+6.99+5.90+9.49+6.20+6.55+8.72)=7.37. 设回归直线方程为^y=bx+a,则b=210121011010x xy x yx i ii ii --∑∑===0.175,a=x b y -=-0.418,所以所求回归直线的方程为^y =0.175x-0.148. 点评:对一组数据进行线性回归分析时,应先画出其散点图,看其是否呈直线形,再依系数a,b 的计算公式,算出a,b .由于计算量较大,所以在计算时应借助技术手段,认真细致,谨防计算中产生错误,求线性回归方程的步骤:计算平均数yx ,;计算x i 与y i 的积,求∑x i y i ;计算∑x i 2;将结果代入公式求b ;用a=x b y -求a ;写出回归直线方程. 知能训练1.下列两个变量之间的关系哪个不是函数关系( )A.角度和它的余弦值B.正方形边长和面积C.正n边形的边数和它的内角和D.人的年龄和身高答案:D2.三点(3,10),(7,20),(11,24)的线性回归方程是()A.^y=5.75-1.75xB.^y=1.75+5.75xC.^y=1.75-5.75xD.^y=5.75+1.75x答案:D3.已知关于某设备的使用年限x与所支出的维修费用y(万元),有如下统计资料:设y对x呈线性相关关系.试求:(1)线性回归方程^y=bx+a的回归系数a,b;(2)估计使用年限为10年时,维修费用是多少?答案:(1)b=1.23,a=0.08;(2)12.38. 4.我们考虑两个表示变量x与y之间的关系的模型,δ为误差项,模型如下:模型1:y=6+4x;模型2:y=6+4x+e.(1)如果x=3,e=1,分别求两个模型中y的值;(2)分别说明以上两个模型是确定性模型还是随机模型.解:(1)模型1:y=6+4x=6+4×3=18;模型2:y=6+4x+e=6+4×3+1=19.(2)模型1中相同的x值一定得到相同的y值,所以是确定性模型;模型2中相同的x值,因δ的不同,所得y值不一定相同,且δ为误差项是随机的,所以模型2是随机性模型.5.以下是收集到的新房屋销售价格y与房屋大小x的数据:(1)画出数据的散点图;(2)用最小二乘法估计求线性回归方程.解:(1)散点图如下图.(2)n=5,∑=51i ix =545,x =109,∑=51i iy =116,y =23.2,∑=512i ix =60 952,∑=51i ii y x =12 952,b=2545609525116545129525-⨯⨯-⨯≈0.199,a=23.2-0.199×109≈1.509,所以,线性回归方程为y=0.199x+1.509. 拓展提升某调查者从调查中获知某公司近年来科研费用支出(X i )与公司所获得利润(Y i )的统计资料如下表: 科研费用支出(X i )与利润(Y i )统计表单位:万元年份 科研费用支出利润 1998 1999 2000 2001 20025 11 4 5 331 40 30 34 25要求估计利润(Y i )对科研费用支出(X i )的线性回归模型.解:设线性回归模型直线方程为:iiX Y1^0^^ββ+=,因为:630==∑n X x i=5,6180==∑n YY i=30,根据资料列表计算如下表:现求解参数β0、β1的估计值: 方法一:3006009001200540060003020061803010006)(2221^=--=-⨯⨯-⨯=--=∑∑∑∑i i ii i X X n Y Y X n β=2,x Y 1^0^ββ-==30-2×5=20.方法二:501005620030561000)(2221^=⨯-⨯⨯-=--=∑∑x n X Yx n Y X ii i β=2,x Y 1^0^ββ-==30-2×5=20.方法三:50100)())((21^=---=∑∑x X Y Y x X ii iβ=2, x Y 1^0^ββ-==30-2×5=20.所以利润(Y i )对科研费用支出(X i )的线性回归模型直线方程为:iY ^=20+2X i .课堂小结1.求线性回归方程的步骤: (1)计算平均数y x ,;(2)计算x i 与y i 的积,求∑x i y i ; (3)计算∑x i 2,∑y i 2,(4)将上述有关结果代入公式⎪⎪⎪⎩⎪⎪⎪⎨⎧-=--=---=∑∑∑∑====xb y a x n x yx n yx x x y y x x b n i i ni ii n i i ni i i ,)())((1221121求b,a,写出回归直线方程.2.经历用不同估算方法描述两个变量线性相关的过程.知道最小二乘法的思想,能根据给出的线性回归方程系数公式建立线性回归方程. 作业习题2.3A 组3、4,B 组1、2.设计感想本节课在上节课的基础上,利用实例分析了散点图的分布规律,推导出了线性回归直线的方程的求法,并利用回归直线的方程估计可能的结果,本节课讲得较为详细,实例较多,便于同学们分析比较.思路1和思路2的例题对知识进行了巩固和加强,另外,本节课通过选取一些学生特别关心的身边事例,对学生进行思想情操教育、意志教育和增强学生的自信心,养成良好的学习态度,树立时间观,培养勤奋、刻苦的精神.。