北师大版高中数学选修回归分析学案
北师大版高中数学选修第三章第三课时可线性化的回归分析教案
![北师大版高中数学选修第三章第三课时可线性化的回归分析教案](https://img.taocdn.com/s3/m/7c27cca0d15abe23492f4d1a.png)
江西省九江市实验中学高中数学 第三章 第三课时 可线性化的回归分析教案 北师大版选修2-3一、教学目标:通过典型案例的探究,进一步了解回归分析的基本思想、方法及初步应用。
二、教学重点:通过探究使学生体会有些非线性模型通过变换可以转化为线性回归模型,了解在解决实际问题的过程中寻找更好的模型的方法。
教学难点:了解常用函数的图象特点,选择不同的模型建模,并通过比较相关指数对不同的模型进行比较。
三、教学方法:讨论交流,探析归纳 四、教学过程: (一)、复习引入:1、给出例题:一只红铃虫的产卵数y 和温度x 有关,现收集了7组观测数据列于下表中,试建立y 与x 之间的回归方程.(学生描述步骤,教师演示)2、讨论:观察右图中的散点图,发现样本点并没有分布在某个带状区域内,即两个变量不呈线性相关关系,所以不能直接用线性回归方程来建立两个变量之间的关系. (二)、新课探究:1. 探究非线性回归方程的确定:① 如果散点图中的点分布在一个直线状带形区域,可以选线性回归模型来建模;如果散点图中的点分布在一个曲线状带形区域,就需选择非线性回归模型来建模.② 根据已有的函数知识,可以发现样本点分布在某一条指数函数曲线y =2C 1e x C 的周围(其中12,c c 是待定的参数),故可用指数函数模型来拟合这两个变量. ③ 在上式两边取对数,得21ln ln y c x c =+,再令ln z y =,则21ln z c x c =+,而z 与x 间的关系如下:观察z 与x 程来拟合.④ 利用计算器算得 3.843,0.272a b =-=,z 与x 间的线性回归方程为0.272 3.843z x =-,因此红铃虫的产卵数对温度的非线性回归方程为0.272 3.843x y e -=.⑤ 利用回归方程探究非线性回归问题,可按“作散点图→建模→确定方程”这三个步骤进行.其关键在于如何通过适当的变换,将非线性回归问题转化成线性回归问题. 2. 小结:(1)、用回归方程探究非线性回归问题的方法、步骤.(2)、化归思想(转化思想)在实际问题中,有时两个变量之间的关系并不是线性关系,这就需要我们根据专业知识或散点图,对某些特殊的非线性关系,选择适当的变量代换,把非线性方程转化为线性回归方程,从而确定未知参数.下面列举出一些常见的曲线方程,并给出相应的化为线性回归方程的换元公式. (1)b y a x =+,令'y y =,1'x x=,则有''y a bx =+. (2)by ax =,令'ln y y =,'ln x x =,'ln a a =,则有'''y a bx =+.(3)bxy ae =,令'ln y y =,'x x =,'ln a a =,则有'''y a bx =+.(4)b xy ae =,令'ln y y =,1'x x=,'ln a a =,则有'''y a bx =+. (5)ln y a b x =+,令'y y =,'ln x x =,则有''y a bx =+. (三)、巩固练习:为了研究某种细菌随时间x 变化,繁殖的个数,收集数据如下:(1(2)试求出预报变量对解释变量的回归方程。
数学北师大版高中选修1-2北师大版数学选修1-2 第一章 统计案例 §1回归分析
![数学北师大版高中选修1-2北师大版数学选修1-2 第一章 统计案例 §1回归分析](https://img.taocdn.com/s3/m/539f7e32b7360b4c2e3f6492.png)
庐山区一中高效课堂导学案北师大版数学选修1-2 第一章 统计案例 §1回归分析§1.1.1 回归分析(总第1课时)主编:查道强 审核:柯愈勇 审批:【预习案】学习目标:1、知识与技能:通过对统计案例的探究,会对两个随机变量进行线性回归分析。
2、过程与方法:学生通过实例分析学习最小二乘法,及其求解回归方程。
3、情感态度与价值观:(1)进一步树立数形结合的思想。
(2)进一步体会构建模型的作用。
教学重点:散点图的画法,回归直线方程的求解方法。
教学难点:回归直线方程的求解方法。
使用说明&学法指导:1、用15分钟左右时间,阅读探究课本P1-P6的内容,熟记基础知识,自主高效学习,提升自己的阅读理解能力。
2、完成教材助读设置的问题,然后结合课本的基础知识例题,完成预习自测题。
3、将预习中不能解决的问题标记出来,并写到后面“我的疑问”处。
(一)相关知识——知识储备,学以致用请同学们回顾前面所学知识对下面的问题做出回答:问题1:现实生活中两个变量间的关系有哪些呢?问题2:相关关系与函数关系有怎样的不同?问题3:对于线性相关的两个变量用什么方法来刻划之间的关系呢?问题4:你知道最小二乘法吗?(二)教材助读——精心阅读,仔细思考1、必修课程中,我们已经会用最小二乘法求变量之间的线性回归方程。
假设样本点为112233(,),(,),(,),(,)n n x y x y x y x y …,,设线性回归方程为 ,我们的想法就是要求a,b ,使这n 个点与直线 的“距离”平方之和 。
2、在统计中,我们使用 表示一组数据123,,,,n x x x x …的平均值,即 。
为了简化表示,我们引进求和符号,记作 。
3、1()n ii x x =-=∑ 。
1()ni i y y =-=∑ 。
4、____________________________________xx xy yy l l l ===5、线性回归方程y a bx =+,其中b=a=(三)预习自测——自我检测,自我完善自测题体现一定的基础性,又有一定的思维含量,只有“细心才对,思考才会”。
高中数学第一章统计案例1.1回归分析学案含解析北师大版选修1
![高中数学第一章统计案例1.1回归分析学案含解析北师大版选修1](https://img.taocdn.com/s3/m/0f78cafeb7360b4c2f3f646b.png)
学习资料§1 回归分析授课提示:对应学生用书第1页[自主梳理]一、线性回归方程y =a +bx 的求法 1.平均值的符号表示 假设样本点为(x 1,y 1),(x 2,y 2),…,(x n ,y n ),在统计上,用错误!表示一组数据x 1,x 2,…,x n 的平均值,即错误!=________=________;用错误!表示一组数据y 1,y 2,…,y n 的平均值,即错误!=________=________。
2.参数a 、b 的求法 b =l xyl xx=______________=______________,a =______________。
二、相关系数1.相关系数r 的计算假设两个随机变量的数据分别为(x 1,y 1),(x 2,y 2),…,(x n ,,y n ),则变量间线性相关系数r =错误!=______________=______________。
2.相关系数r 的性质(1)r 的取值范围为________;(2)|r |值越大,误差Q 越小,变量之间的线性相关程度越________; (3)|r |值越接近0,Q 越大,变量之间的线性相关程度越________. 3.相关性的分类(1)当________时,两个变量正相关; (2)当________时,两个变量负相关; (3)当________时,两个变量线性不相关. 曲线方程 曲线图形 变换公式变换后的线性函数y =ax bc =ln a v =ln x u =ln y ______y =a e bxc =ln a u =ln y______y =a e 错误!c =ln a v =错误! u =ln y y =a + ______b ln xv =ln x u =y______1.下列变量是相关关系的是( ) A .人的身高与视力B .圆心角的大小与其所对的圆弧长C.直线上某点的横坐标与纵坐标D.人的年龄与身高2.已知回归方程y=1.5x-15,则下面正确的是()A。
数学北师大版高中选修1-2选修1-2第一章 统计案例 §1.1.1回归分析导学案
![数学北师大版高中选修1-2选修1-2第一章 统计案例 §1.1.1回归分析导学案](https://img.taocdn.com/s3/m/768596518e9951e79a892718.png)
........试题试卷 第一章 统计案例§1.1.1回归分析预习案【学习目标】1. 理解并掌握用回归分析处理两个变量之间的不确定关系的统计方法。
2. 了解回归分析的意义。
3. 以极度的热情,自动自发、如痴如醉,投入到学习中,充分享受学习的快乐。
【使用说明与学法指导】1. 课前(前一天晚自习)自学课本并完成导学案,要求限时完成,书写规范;2. 带“★”的C 层可以选做,带“★★”的B,C 层可以选做.3. 自主探究先行一步,遇到难以理解的地方先做好标记,然后再通过小组讨论解决,如果小组不能解决的问题第二天在课堂上讨论解决。
一、预习自学: 基础知识梳理 问题导引知识点一:两个变量的关系与回归分析函数关系是一种 关系,而相关关系是一种 关系。
回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法。
知识点二:线性回归方程1.求线性回归直线方程的步骤:(1) 作出散点图,将问题所给的数据在平面直角坐标系中描点,这样表示出的具有相关关系的两个变量的一组数据的图形就是散点图,从散点图中我们可以看出样本点是否呈条状分布,来判断两个量是否具有线性相关关系;(2) 求回归系数a ,b ,其中∑∑∑∑====--=---=n i i n i i i n i i n i i i xn x y x n y x x xy y x x b 121121)())((,x b y a -= (3) 写出回归直线方程a bx y +=,并用回归直线方程进行预测。
2. 回归直线a bx y +=过点),(y x ,这个点称为样本的中心.【预习自测】(大约10分钟,包括预习自学)1. 设有一个回归方程为22.5y x ∧=-,当变量x 增加一个单位时,( ) A 、y 平均增加2.5个单位 B 、y 平均增加2个单位C 、y 平均减少2.5个单位D 、y 平均减少2个单位2. 在一次试验中,测得),(y x 的四组数据值为(1,2),(2,3),(3,4),(4,5),则y 与x 之间的线性回归方程为 ( ) A.1+=x y B.2+=x y C.12+=x y D.1-=x y3.为研究变量x 和y 的线性相关性,甲、乙二人分别作了研究,利用线性回归方法得到回归直线方程1l 和2l ,两人计算知x 相同,y 也相同,下列正确的是( )A. 1l 与2l 一定平行B. 1l 与2l 相交于点),(y xC.1l 与2l 重合D. 无法判断1l 和2l 是否相交【我的疑惑】(将在预习中不能理解的问题写下来,供课堂上处理)1.2.3.。
高中数学(北师大版)选修1-2精品学案:第一章 统计案例 第2课时 回归分析的应用
![高中数学(北师大版)选修1-2精品学案:第一章 统计案例 第2课时 回归分析的应用](https://img.taocdn.com/s3/m/c74ea9ed58fb770bf78a55cc.png)
第2课时回归分析的应用1.根据线性回归方程,对相关结论进行预测.2.理解从散点图进行非线性回归分析的意义,掌握如何将非线性回归问题转化为线性回归问题的方法.3.了解在解决实际问题的过程中寻找更好的模型的方法.重点:根据线性回归方程,对相关结论进行预测,探究非线性模型通过变换转化为线性回归模型的方法.难点:了解常用函数的图像特点,选择不同的模型建模,并通过相关指数对不同的模型进行比较.有关法律规定:香烟盒上必须印上“吸烟有害健康”的警示语,那么吸烟和健康之间有因果关系吗?每一个吸烟者的健康问题都是由吸烟引起的吗?你认为“健康问题不一定是由吸烟引起的,所以可以吸烟”的说法对吗?要回答这个问题,我们先来一起学习本节的知识吧!问题1:相关系数的概念及相关系数r的性质相关系数r用来描述线性相关关系的强弱,且样本相关系数r===.r有如下性质:(1)|r|≤1;(2)|r|越接近于1,误差Q越小,x,y的线性相关程度越强;(3)|r|越接近于0,误差Q越大,x,y的线性相关程度越弱;(4)当r>0时,称两个变量正相关;当r<0时,称两个变量负相关;当r=0时,称两个变量线性不相关.问题2:在回归分析中,通过模型计算预测变量的值时,应注意的问题.(1)回归方程只适用于我们所研究的样本的总体;(2)我们所建立的回归方程一般都有时间性;(3)样本取值的范围会影响回归方程的适用范围;(4)不能期望回归方程得到的预测值就是预测变量的精确值.问题3:几种能转化为线性回归模型的非线性回归模型(1)幂函数曲线y=ax b作变换u=ln y,v=ln x,c=ln a,得线性函数u=c+bv.(2)指数曲线y=a e bx作变换u=ln y,c=ln a,得线性函数u=c+bx.(3)倒指数曲线y=a作变换u=ln y,c=ln a,v=,得线性函数u=c+bv.(4)对数曲线y=a+b ln x作变换u=y,v=ln x,得线性函数u=a+bv.问题4:非线性回归问题进行回归分析的方法(1)若问题中已给出经验公式,这时可以将解释变量进行交换(换元),将变量的非线性关系转化为线性关系,将问题化为线性回归分析问题来解决.(2)若问题中没有给出经验公式,需要我们画出已知数据的散点图,通过与各种函数(如指数函数、对数函数、幂函数等)的图像作比较,选择一种与这些散点拟合得最好的函数,然后采用适当的变量交换,将问题化为线性回归分析问题来解决.从以下几个方面认识相关关系:(1)相关关系与函数关系不同.函数关系中的两个变量间是一种确定性关系;相关关系是一种非确定性关系.(2)函数关系是一种因果关系,而相关关系不一定是因果关系,也可能是伴随关系.相关关系在现实生活中大量存在,从某种意义上讲,函数关系是一种理想的关系模型,而相关关系是一种更为一般的情况.因此研究相关关系,不仅可以使我们处理更为广泛的数学应用问题,还可以使我们对函数关系的认识上升到一个新的高度.一般情况下,在尚未断定两个变量之间是否具有线性相关关系的情况下,应先进行相关性检验,在确认其具有线性相关关系后,再求其回归直线方程;由部分数据得到的回归直线,可以对两个变量间的线性相关关系进行估计,这实际上是将非确定性的相关关系问题转化成确定性的函数关系问题进行研究.由于回归直线将部分观测值所反映的规律性进行了延伸,它在情况预测、资料补充等方面有着广泛的应用.1.下列两个变量之间的关系不是函数关系的是().A.角度和它的余弦值B.正方形的边长和面积C.正n边形的边数和各内角度数之和D.人的年龄和身高【解析】函数关系就是一种变量之间的确定性的关系,A,B,C三项都是函数关系,它们的函数表达式分别为f(θ)=cos θ,g(a)=a2,h(n)=nπ-2π.D项不是函数关系,对于年龄确定的人群,仍可以有不同的身高,故选D.【答案】D2.为了表示n个点与相应直线在整体上接近程度,我们常用()表示.A.(y i-y)B.(y i-)C.(y i-y)2D.(y i-)2【解析】由回归直线方程y=a+bx,可知y为一个量的估计量,而y i为它的实际值,在最小二乘法中[y i-(a+bx)]2,即(y i-y)2,故选C.【答案】C3.在一次实验中,测得(x,y)的四组值分别是A(1,2),B(2,3),C(3,4),D(4,5),则y与x之间的回归直线方程为.【解析】因为A,B,C,D四点都在直线y=x+1上,故填y=x+1.【答案】y=x+14.1907年一项关于16艘轮船的研究中,船的吨位区间位于192吨到3246吨,船员的人数从5人到32人,船员的人数关于船的吨位的回归分析得到如下结果:船员人数=9.1+0.006×吨位.(1)假定两艘轮船吨位相差1000吨,船员平均人数相差多少?(2)估计最小的船的船员数和最大的船的船员数.【解析】(1)船员平均人数之差=0.006×吨位之差=0.006×1000=6,即船员平均相差6人.(2)9.1+0.006×192=10.252,估计最小的船的船员数为10.9.1+0.006×3246=28.576,估计最大的船的船员数为28.利用公式,确定回归直线方程某5名学生的数学和化学成绩如下表:学生A B C D E学科数学成绩(x)8876736663化学成绩(y)7865716461(1)画出散点图;(2)求化学成绩(y)对数学成绩(x)的回归直线方程.【方法指导】熟记公式,根据表格计算公式中所需的各种数据.【解析】(1)散点图(略).(2)=73.2,=67.8,x i y i=25054,=27174,所以b==≈0.625.a=-b=67.8-0.625×73.2=22.05.所以y对x的回归直线方程为y=0.625x+22.05.【小结】利用公式求解时应注意以下几点:①求b时应先求出,,x i y i,,再由a=-b求a的值,并写出回归直线方程.②线性回归方程中的截距a和斜率b都是通过样本估计而来,存在着误差,这种误差可能导致预测结果的偏差.③回归直线方程y=a+bx中的b表示x增加1个单位时y的变化量为b,而a是不随x的变化而变化的量.④可以利用回归直线方程y=a+bx预测在x取某一个值时,y的估计值.根据回归直线方程,对结果进行分析或预测从某大学中随机选取8 名女大学生,其身高和体重数据如下表:编号12345678身高/cm165165157170175165155170体重/kg4857505464614359求根据女大学生的身高预测体重的回归方程,并预测一名身高为172 cm 的女大学生的体重.【方法指导】可以计算出r≈0.798.这表明体重与身高有较强的线性相关关系,从而可以建立身高和体重的线性回归方程,根据身高和体重的线性回归方程,由身高预测体重.【解析】由于问题中要求根据身高预测体重,因此选取身高为自变量x,体重为因变量y.作出散点图(如图).从图中可以看出,样本点呈条状分布,身高和体重有较强的线性相关关系,因此可以用线性回归方程来近似刻画它们之间的关系,根据公式,可以得到b≈0.848,a≈-85.712.于是得到回归方程y=0.848x-85.712.因此,对于身高172 cm 的女大学生,由回归方程可以预测其体重为y=0.848×172-85.712=60.144 kg.【小结】解析中b=0.848是斜率的估计值,说明身高x每增加1个单位时,体重y就增加0.848 kg,这表明体重与身高具有正的线性相关关系.尽管身高172 cm的女大学生的体重不一定是60.144 kg,但一般可以认为她的体重接近60.144 kg.可线性化的非线性回归问题一只红铃虫的产卵数y和温度x之间的7组观测数据列于下表:温度x/℃21232527293235产卵数y/个711212466115325试建立y与x之间的回归方程,并预测温度为28 ℃时产卵数目.【方法指导】作出散点图(或根据已知的散点图)分析欲采用较为恰当的拟合曲线,用换元法转化成线性关系再进行回归分析.【解析】选择变量,画散点图.在散点图中,根据已有的函数知识,可以发现样本点分布在某一条指数函数曲线y=c1的周围,其中c1和c2是待定参数.即问题变为如何估计待定参数c1和c2.我们可以通过对数变换把指数关系变为线性关系.令z=ln y,则变换后样本点应该分布在直线z=bx+a(a=ln c1,b=c2)的周围.这样,就可以利用线性回归模型来建立y和x之间的非线性回归方程了.由已知表的数据可以得到变换后的样本数据表(下表):x21232527293235z1.9463.3983.0453.1784.1904.7455.784下图给出了表中数据的散点图.从图中可以看出,变换后的样本点分布在一条直线附近,因此可以用线性回归方程来拟合.由表中的数据得到线性回归方程z=0.242x-2.884.相关系数r≈0.953.因此红铃虫的产卵数对温度的非线性回归方程为y=e0.242x-2.884.当x=28 ℃时,y ≈49.预测当气温为28 ℃时,产卵数为49个.综上所述,在本题中指数函数模型比一元线性模型、二次函数模型有更好的拟合效果.【小结】对于给定的样本点(x1,y1),(x2,y2),…,(x n,y n),其中a和b都是未知参数.应先根据散点图或利用相关系数r判断两变量间是否存在线性相关关系,若两变量线性相关性显著,采用例1的方法进行线性回归分析;若两变量线性相关性不显著,则可采用例2的方法和步骤进行拟合效果分析.在某种产品表面进行腐蚀线实验,得到腐蚀深度y与腐蚀时间t之间对应的一组数据:时间t(s)5101520304050607090120深度y(μm)610101316171923252946试求腐蚀深度y对时间t的回归直线方程.【解析】经计算可得相关系数r≈0.982,所以可以认为y与t之间有较强的线性相关关系.≈46.36,≈19.45,=36750,=5422,t i y i=13910.b==≈0.3.a=-b=19.45-0.3×46.36≈5.542.故所求的回归直线方程为y=0.3t+5.542.一机器可以按各种不同的速度运转,其生产物件有一些会有缺点,每小时生产有缺点物件的多少随机器运转速度而变化,用x表示转速(单位:转/秒),用y表示每小时生产的有缺点物件个数,现观测得到(x,y)的4组观测值为(8,5),(12,8),(14,9),(16,11).(1)假定y与x之间有线性相关关系,求y对x的回归直线方程;(2)若实际生产中所容许的每小时最大有缺点物件数为10,则机器的速度不得超过多少转/秒.(精确到1转/秒)【解析】(1)设回归直线方程为y=bx+a,=12.5,=8.25,=660,x i y i=438.于是b===,a=-b=8.25-×12.5=-×=-.故所求的回归直线方程为y=x-.(2)由y=x-≤10,得x≤≈15,即机器速度不得超过15转/秒.为了研究某种细菌随时间x变化时,繁殖个数y的变化,收集数据如下:天数x/天123456繁殖个数y/个612254995190(1)用天数x作解释变量,繁殖个数y作预测变量,作出这些数据的散点图;(2)建立解释变量x与预测变量y之间的回归方程.【解析】(1)所作散点图如图所示.(2)由散点图看出样本点分析在一条指数函数y=c1的周围,于是令z=ln y,则x、z数据如下表格,x123456z1.792.483.223.894.555.25由计算器得z=0.69x+1.112,r≈0.9999,则有y=e0.69x+1.112.1.给定x与y的一组样本数据,求得相关系数r=-0.990,则().A.y与x不相关B.y与x非线性相关C.y与x正相关D.y与x负相关【解析】因为r<0,故选D.【答案】D2.下列两个变量之间的关系不是函数关系的是().A.角度和它的正切值B.人的右手一柞长和身高C.正方体的棱长和表面积D.真空中自由落体运动物体的下落距离和下落时间【解析】由正切函数y=tan x知A是函数关系;人的右手一柞长和身高不是确定的关系,故B不是函数关系;设正方体的棱长为a,则它的表面积S=6a2,C是函数关系;由物理知识知,自由落体运动物体的下落距离h和下落时间t满足h=gt2(t>0),D是函数关系.【答案】B3.已知回归直线的方程为y=2-2.5x,则当x=25时,y的估计值是.【解析】将x=25代入方程得y=2-2.5×25=-60.5.【答案】-60.54.某市统计1994~2019年在校中学生每年高考考入大学的百分比,把农村、县镇、城市分开统计,为了便于计算,把1994年编号为0,1995年编号为1,…,2019年编号为10,如果把每年考入大学的百分比作为统计变量,把年份从0到10作为自变量进行回归分析,可得到下面三条回归直线,城市:y=9.50+2.54x;县镇:y=6.76+2.32x;农村:y=1.80+0.42x.(1)对于农村学生来讲,系数等于0.42意味着什么?(2)在这一阶段,哪里的大学入学率增长最快?【解析】(1)对于农村学生来讲,系数等于0.42意味着1994~2019年在校中学生每年高考考入大学的百分比逐年增加0.42.(2)在这一阶段,城市的大学入学率增长最快.(2019年·山东卷)某产品的广告费用x(万元)与销售额y(万元)的统计数据如下表:广告费用x(万元)4235销售额y(万元)49263954根据上表可得回归方程y=bx+a中的b为9.4,据此模型预测广告费用为6万元时销售额为().A.63.6万元B.65.5万元C.67.7万元D.72.0万元【解析】由表可计算==,==42,因为点(,42)在回归直线y=bx+a上,且b为9.4,所以42=9.4×+a,解得a=9.1,故回归方程为y=9.4x+9.1,将x=6代入方程得y=65.5,选B.【答案】B1.观察两个变量(存在线性相关关系)的数据如下:x-10-6.99-5.01-2.983.9857.998.01y-9-7-5-34.014.9978则两变量间的线性回归方程为().A.y=x+1B.y=xC.y=2x+D.y=x+1【解析】由于线性回归方程一定经过样本点的中心(,),所以本题只需求出,,然后代入所给选项进行检验,即可得到答案.由表中数据可得=0,=0,只有B项中的方程过点(0,0),故选B.【答案】B2.在以下四个散点图中(如图所示),适用于作线性回归的散点图为().A.①②B.①③C.②③D.③④【解析】①表示正相关,③表示负相关.【答案】B3.若线性回归方程y=a+bx中,b=0,则相关系数r=.【解析】由b==0,得(x i-)(y i-)=0,所以r==0.【答案】04.某种产品的广告费用支出x(万元)与销售额y(万元)之间有如下的对应数据:x(万元)24568y(万元)3040605070(1)求相关系数和回归直线方程;(2)据此预测广告费用支出为10万元时销售收入y的值.【解析】(1)=(2+4+5+6+8)=5,=(30+40+60+50+70)=50,=22+42+52+62+82=145,=302+402+602+502+702=13500 ,x i y i=1380,r=≈0.919,即两变量间有很强的线性相关关系.b==6.5,a=-b=50-6.5×5=17.5,故回归直线方程为y=6.5x+17.5.(2)当x=10时,预测y的值为y=10×6.5+17.5=82.5.5.已知对一组观测值(x i,y i)作出散点图后,确定其具有线性相关关系.若对于y=bx+a,求得b=0.51,=61.75,=38.14,则回归直线方程为().A.y=0.51x+6.65B.y=6.65x+0.51C.y=0.51x+42.30D.y=42.30x+0.51【解析】y=bx+a过点(,),∴a=-b=38.14-0.51×61.75≈6.65,∴y=0.51x+6.65.【答案】A6.炼钢时钢水的含碳量与冶炼时间是().A.确定性关系B.相关关系C.函数关系D.无任何关系【解析】解答本题的关键是弄清相关关系的定义及相关关系与函数关系的区别.【答案】B7.某化工厂为预测某产品的回收率y,需要研究它和原料有效成分含量x之间的线性相关关系,现取8组观测值,计算得x i=52,y i=228,=478,x i y i=1849,则y与x的回归直线方程是.(精确到小数点后两位数)【解析】根据给出的数据可先求=x i=6.5,=y i=28.5,然后代入公式b==≈2.62,从而a=-bx=28.5-2.62×6.5=11.47,所以回归直线方程y=11.47+2.62x.【答案】y=11.47+2.62x8.在彩电显影中,由经验可知形成染料光学密度y与析出银的光学密度x的公式为y=A(b<0),现测得试验数据如下:x i0.050.060.250.310.070.100.380.430.140.200.47y i0.100.141.001.120.230.371.191.250.590.791.29试求y对x的回归方程.【解析】由题意知,对于给定的公式y=A(b<0)两边取自然对数,得ln y=ln A+.与线性回归方程相对照可以看出,只要令u=,v=ln y,a=ln A,就有v=a+bu.这是v对u的线性回归方程,对此再套用相关系数公式,求回归系数a和b.题目中所给的数据由变量置换u=,v=ln y,变为如下所示的数据:u i20.00016.6674.0003.22614.28610.000v i-2.303-1.96600.113-1.470-0.994u i2.6322.3267.1435.0002.128v i0.1740.223-0.528-0.2360.255可以求出|r|≈0.998.可知u与v具有很强的线性相关关系.再求出b≈-0.146,a≈0.548,所以v=0.548-0.146u,把u和v置换回来,得ln y=0.548-,所以y==e0.548·≈1.73,所以y对x的回归方程为y=1.73.9.一唱片公司预测支出费用x(十万元)与唱片销售量y(千张)之间的关系,从其所发行的唱片中随机抽选了10千张,得到如下的资料:x i=28,=303.4,y i=75,=598.5,x i y i=237,则y与x的相关系数r 的绝对值为.【解析】根据公式,得相关系数r===0.3,所以|r|=0.3.【答案】0.310.测得某国10对父子身高(单位:英寸)如下:父亲身高(x)60626465666768707274儿子身高(y)63.665.26665.566.967.167.468.370.170(1)对变量y与x进行相关性检验;(2)如果y与x之间具有线性相关关系,求回归方程;(3)如果父亲的身高为73英寸,估计儿子的身高.【解析】(1)=66.8,=67.01,=4462.24,=44974,=4490.3401,=44941.93,x i y i=44842.4,r===≈0.98,所以y与x之间具有很强的线性相关关系.(2)设回归方程为y=bx+a.由b===≈0.4646,a=-b=67.01-0.4646×66.8≈35.97.故所求的回归方程为y=0.4646x+35.97.(3)当x=73时,y=0.4646×73+35.97≈69.9,所以当父亲的身高为73英寸时,估计儿子的身高为69.9英寸.。
高中数学 3.1回归分析(二)教案 北师大选修2-3
![高中数学 3.1回归分析(二)教案 北师大选修2-3](https://img.taocdn.com/s3/m/3b7e8c22a6c30c2259019e81.png)
3.1回归分析(教案)教学目标:1. 通过对统计案例的探究,会对两个随机变量进行线性回归分析.2. 理解相关系数的含义,会计算两个随机变量的线性相关系数,会通过线性相关系数判断它们之间的线性相关程度.3. 通过对数据之间散点图的观察,能够对两个随机变量进行可线性化的回归分析. 教学重点:散点图的画法,回归直线方程的求解方法;相关系数的求法与应用. 教学难点回归直线方程的求解方法; 相关系数的求法与应用; ;能够对两个随机变量进 行可线性化的回归分析. 教法:启发诱导式第一课时(回归分析)教学过程 一、问题情境客观事物是相互联系的过去研究的大多数是因果关系,但实际上更多存在的是一种非因果关系比如说:某某同学的数学成绩与物理成绩,彼此是互相联系的,但不能认为数学是“因”,物理是“果”,或者反过来说事实上数学和物理成绩都是“果”,而真正的“因”是学生的理科学习能力和努力程度所以说,函数关系存在着一种确定性关系但还存在着另一种非确定性关系——相关关系 二、新授在必修课程中,我们已经学习了最小二乘法,并会建立变量之间的线性回归方程.引导学生阅读教材,然后完成知识点的填充.(一) 知识讲解 1.相关关系的概念两个变量间的关系可分为确定关系和非确关系,前者又称为函数关系,后者又称为相关关系.2.回归方程设有n 对观测数据(,)i i x y (1,2,3,,)i n = ,根据线性回归模型,对于每一个i x ,对应的随机偏差项()i i i y a bx ε=-+,我们希望总偏差越小越好,即要使21nii ε=∑越小越好.所以,只要求出使21(,)()niii Q y x αββα==--∑取得最小值时的α,β值作为a ,b 的估计值,记为 a,b . 注:这里的i ε就是拟合直线上的点(),i i x a bx +到点(),i i i P x y 的距离.用什么方法求 a,b ? 回忆《数学3(必修)》“2.4线性回归方程”P71“热茶问题”中求a ,b 的方法:最小二乘法.利用最小二乘法可以得到 a,b 的计算公式为 1122211()()()()n ni i i i i i n ni ii i x x y y x y nx y b x x x n x a y bx====⎧---⎪⎪==⎪⎨--⎪⎪=-⎪⎩∑∑∑∑ , 其中11n i i x x n ==∑,11ni i y y n ==∑由此得到的直线 y a bx =+ 就称为这n 对数据的回归直线,此直线方程即为线性回归方程.其中 a ,b 分别为a ,b 的估计值, a 称为回归截距,b 称为回归系数, y 称为回归值.(二) 举例应用 例1.下表给出了我国从1949年至1999年人口数据资料,试根据表中数据估计我国2004年的人口数.解:为了简化数据,先将年份减去1949,并将所得值用x 表示,对应人口数用y表示,得到下面的数据表:作出11个点(),x y 构成的散点图,由图可知,这些点在一条直线附近,可以用线性回归模型y a bx ε=++来表示它们之间的关系.根据公式(1)可得14.453,527.591.b a ⎧≈⎪⎨≈⎪⎩ 这里的 ,ab 分别为,a b 的估 计值,因此线性回归方程 为 527.59114.453y x =+由于2004年对应的55x =,代入线性回归方程 527.59114.453y x =+可得1322.506y =(百万),即2004年的人口总数估计为13.23亿. 对应练习:课本6P 练习小结:1.线性相关的概念;2.理解回归方程的系数来历;3.求回归方程的步骤. 作业:课本15P 习题1-1,1题的第二问第二节相关系数教学过程: 一.问题情境对任意给定的样本数据,由计算公式都可以求出相应的线性回归方程,但求得的线性回归方程未必有实际意义.左图中的散点明显不在一条直线附近,不能进行线性拟合,求得的线性回归方程是没有实际意义的;右图中的散点基本上在一条直线附近,我们可以粗略地估计两个变量间有线性相关关系,但它们线性相关的程度如何,如何较为精确地刻画线性相关关系呢?为了回答这个问题,我们需要对变量x 与y 的线性相关性进行检验(简称相关性检验),那么就需要学习相关系数来处理. 二、新授(一)知识点讲解1.相关系数的计算公式:对于x ,y 随机取到的n 对数据(,)i i x y (1,2,3,,)i n = ,样本相关系数r 的计算公式为()()nniii ix x y y x y nx yr ---==∑∑.()22.相关系数r 的性质: (1)||1r ≤;(2)||r 越接近与1,x ,y 的线性相关程度越强; (3)||r 越接近与0,x ,y 的线性相关程度越弱.可见,一条回归直线有多大的预测功能,和变量间的相关系数密切相关. (二) 应用举例要分析学生高中入学的数学成绩对高一年级数学学习的影响,在高一年级学生中随机抽取10名学生,分析他们入学的数学成绩和高一年级期末数学考试成绩如下表:(2)如果x 与y 之间具有线性相关关系,求线性回归方程;(3)若某学生入学数学成绩为80分,试估计他高一期末数学考试成绩.解:(1)因为()16367767010x =⨯+++= ,()16578757610y =⨯+++= , 101()()1894xy i i i L x x y y ==--=∑,2101()2474xx i i L x x ==-=∑,1021()2056yy i i L y y ==-=∑.因此求得相关系数为10()()0.840iix x y y L r --===∑.结果说明这两组数据的相关程度是比较高的;点评:解决这类问题的解题步骤:(1)作出散点图,直观判断散点是否在一条直线附近; (2)求相关系数r ;(3)计算 a,b ,写出线性回归方程. 对应练习:课本9P 练习五.回顾小结:1.相关系数的计算公式与回归系数b计算公式的比较; 2.相关系数的性质;3.探讨相关关系的基本步骤.六.课外作业:1516P -习题1-1第2题.第三节可线性化的回归分析教学过程: 一.问题情境前面我们学习的是利用线性回归方程与相关系数判断两个随机变量间的相关关系的,那么能否利用散点图将其他的常见函数拟合成线性关系呢?这也是我们本节课将要学习的可线性化的回归分析问题 二、新授(一)知识点讲解在实际问题中,有时两个变量之间的关系并不是线性关系,这就需要我们根据专业知识或散点图,对某些特殊的非线性关系,选择适当的变量代换,把非线性方程转化为线性回归方程,从而确定未知参数.下面列举出一些常见的曲线方程,并给出相应的化为线性回归方程的换元公式. (1)b y a x =+,令'y y =,1'x x=,则有''y a bx =+. (2)by ax =,令'ln y y =,'ln x x =,'ln a a =,则有'''y a bx =+.(3)bx y ae =,令'ln y y =,'x x =,'ln a a =,则有'''y a bx =+. (4)b xy ae =,令'ln y y =,1'x x=,'ln a a =,则有'''y a bx =+. (5)ln y a b x =+,令'y y =,'ln x x =,则有''y a bx =+.(二)应用举例某地区对本地的企业进行了一次抽样调查,下表是这次抽查中所得到的各企业的人均资本x (万元)与人均产出y (万元)的数据:(1)设y 与x 之间具有近似关系b y ax ≈(,a b 为常数),试根据表中数据估计a 和b 的值; (2)估计企业人均资本为16万元时的人均产出(精确到0.01).分析:根据x ,y 所具有的关系可知,此问题不是线性回归问题,不能直接用线性回归方程处理.但由对数运算的性质可知,只要对b y ax ≈的两边取对数,就能将其转化为线性关系.解(1)在b y ax ≈的两边取常用对数,可得lg lg lg y a b x ≈+,设lg y z =,lg a A =,lg x X =,则z A bX ≈+.相关数据计算如图327--所示.仿照问题情境可得A ,b 的估计值 A ,b 分别为 0.2155,1.5677,A b ⎧=-⎪⎨=⎪⎩ 由 lg 0.2155a =-可得 0.6088a≈,即a ,b 的估计值分别为0.6088和1.5677.(2)由(1)知 1.56770.6088y x =.样本数据及回归曲线的图形如图328--(见书本102P页)当16x =时, 1.56770.60881647.01y =⨯≈(万元),故当企业人均资本为16万元时,人均产值约为47.01万元. 2.练习:13P 练习. 五.回顾小结:1. 线性回归模型y a bx ε=++与确定性函数y a bx =+相比,它表示y 与x 之间是统计相关关系(非确定性关系)其中的随机误差ε提供了选择模型的准则以及在模型合理的情况下探求最佳估计值 a,b 的工具; 2. 线性回归方程 y abx =+ 中 a ,b 的意义是:以 a 为基数,x 每增加1个单位,y 相应地平均增加b个单位; 3.求线性回归方程的基本步骤. 六.课外作业:16P 第4题.。
北师大版高中数学导学案《回归分析》
![北师大版高中数学导学案《回归分析》](https://img.taocdn.com/s3/m/44c04cfd998fcc22bcd10dfc.png)
§1.1回归分析一、学习目标1、理解两个变量间的函数关系与相关关系的区别;(重点)2、通过对案例的探究,会对两个随机变量进行线性回归分析;(重点)3、理解相关系数的含义,户计算两个随机变量的线性相关系数,会通过线性相关系数判断它们之间的线性相关程度;(重点)4、通过对数据之间的散点图的观察,能够对两个随机变量进行可线性化的回归分析。
(难点)二、自主学习(预习教材,找出疑惑之处)复习:1.相关关系概念: . 2.回归分析的相关概念:回归分析是处理两个变量之间的一种统计方法.若两个变量之间具有线性相关关系,则称相应的回归分析为.3. 回归直线方程 其中=∧b,=∧a,恒过定点新课:4.平均值的符号表示:假设样本点为()(),,,,2211y x y x …()n n y x , ,在统计上,用x 表示一组数据,,21x x …n x 的平均值,即x = = ,用y 表示一组数据,,21y y …n y 的平均值,即y = = 。
5. 参数a ,b 的求法:==xxxy l l b =。
=a 。
6.相关系数的计算:假设两个随机变量的数据分别为()(),,,,2211y x y x …()n n y x , ,则变量间线性相关系数==yyxx xy l l l r= 。
7.相关系数的性质:① r 的取值范围: ;② |r|值越大,误差Q 越小,变量之间的线性相关程度越 ; ③ |r|值越接近0,误差Q 越大,变量之间的线性相关程度越 ; ④ 相关性的分类: , , 。
8.可线性化的回归分析:Ⅰ 幂函数曲线如何做变化?变换公式?变换后的线性函数为什么? Ⅱ 指数曲线,倒指数曲线,对数曲线呢?三、典例分析例1 从某大学中随机选取8名女大学生,其身高和体重数据如下表所示:生的体重.提示:第一步:作散点图第二步:求回归方程 第三步:代值计算探究一 如何理解回归直线方程中的系数b ∧,a ∧?探究二 身高为172cm 的女大学生的体重一定是60.316kg 吗?例2 为分析学生初中升高中的数学成绩对高一数学学习的成绩,在高一年级随机抽取10(1) 画出散点图;(2)对变量x 与y 进行相关性检验,如果x 与y 之间具有线性相关关系求出回归直线方程;(3)若某学生入学的数学成绩为80分,试估计他在高一期末考试中的数学成绩。
高中数学(北师大版)选修1-2精品学案:第一章 统计案例 第1课时 回归分析
![高中数学(北师大版)选修1-2精品学案:第一章 统计案例 第1课时 回归分析](https://img.taocdn.com/s3/m/323c430a5f0e7cd18425364f.png)
第1课时回归分析1.会对两个变量的相关关系进行分析、判断.2.了解回归分析的基本思想,会对两个变量的具体问题进行回归分析.3.掌握运用最小二乘法建立回归模型的基本步骤和方法.重点:熟练掌握回归分析,建立回归模型,求各相关指数的步骤.难点:如何求回归直线方程以及对相关系数r的理解和运用.我们每个人都有自己的身高和体重,那么如果把身高和体重分别作为变量,它们能够构成函数关系吗?问题1:散点图在考虑两个量的关系时,为了对变量之间的关系有一个大致的了解,人们通常将变量所对应的点描出来,这些点就组成了变量之间的一个图,通常称这种图为变量之间的散点图.问题2:相关关系与线性回归相关关系:对于两个变量,当自变量取值一定时,因变量的取值带有一定随机性的两个变量之间的关系称为相关关系.相关关系分为线性相关和非线性相关.函数关系中的两个变量间是一种确定性关系,相关关系是一种非确定性关系.线性回归:对具有相关关系的两个变量进行统计分析的一种常用方法.问题3:线性相关系数r=称为两个变量数据(x i,y i)(i=1,2,…,n)的线性相关系数.r用来刻画两个变量的线性回归效果:当r>0时,表明两个变量正相关;当r<0时,表明两个变量负相关;r的绝对值越接近于0 时,表明两个变量之间越不存在线性相关关系.问题4:线性回归分析的步骤对于一组具有线性相关关系的数据:(x1,y1),(x2,y2),…,(x n,y n).(1) 画散点图:看散点图是否呈条状分布.(2) 求回归直线方程(最小二乘法):b=, =x i,=y i,其中(,)为样本中心点,回归直线方程必经过样本中心点(,),得a=-b ;(3) 得出相关结论:回归直线方程为y=a+bx ,利用回归直线方程进行预测.“一只蝴蝶在巴西扇动翅膀,有可能会在美国的德克萨斯州引起一场龙卷风.”这就是洛伦兹1979年12月在华盛顿的“美国科学促进会”上的一次演讲中提出的“蝴蝶效应”.这次演讲给人们留下了极其深刻的印象.从此以后,所谓“蝴蝶效应”之说就不胫而走,名声远扬.“蝴蝶效应”之所以令人着迷、令人激动、发人深省,不但在于其大胆的想象力和迷人的美学色彩,而且在于其深刻的科学内涵和内在的哲学魅力.1.下列关系不属于相关关系的是( ).A.父母的身高与子女的身高B.人的身高与体重C.居民的收入与消费D.正方体的表面积和体积【解析】相关关系是一种非确定性关系,而D项是确定的关系,为函数关系,故选D.【答案】D2.设两个变量x与y之间具有线性相关关系,相关系数是r,回归方程为y=a+bx,那么必有( ).A.b与r符号相同B.a与r符号相同C.b与r符号相反D.a与r符号相反【解析】因为b与r的分母均为正,且分子相同,所以b与r同号.【答案】A3.某医院用光电比色检验尿汞时,得到尿汞含量x(毫克/升)与消化系数y的一组数据如下表:。
高中数学第三章统计案例1回归分析学案北师大版选修23
![高中数学第三章统计案例1回归分析学案北师大版选修23](https://img.taocdn.com/s3/m/1158d0340b1c59eef8c7b4c9.png)
§1 回归分析学习目标重点难点1.会用最小二乘法求线性回归直线方程. 2.会求相关系数,并用其判断相关程度. 3.会进行可线性化的回归分析,拟合函数.并根据拟合程度调整函数关系.重点:利用所给数据求线性回归直线方程.难点:函数模型的选取和确立以及函数的拟合.1.回归分析(1)函数关系是一种确定性的关系,而相关关系是一种非确定性关系.回归分析是对具有相关关系的两个变量进行统计分析的常用方法.(2)线性回归直线方程y =a +bx 中,b =∑i =1n(x i -x)(y i -y )∑i =1n(x i -x)2=∑i =1nx i y i -n x y∑i =1nx 2i -n x2,a =y -b x .预习交流1线性回归直线方程y =a +bx 与一次函数y =a +kx 有何区别?提示:一次函数y =a +kx 是y 与x 的确定关系,给x 一个值,y 有唯一确定的值与之对应,而线性回归直线方程是y 与x 的相关关系的近似反映,两个数据x ,y 组成的点(x ,y )可能适合线性回归直线方程,也可能不适合.2.相关系数假设两个随机变量的数据分别为(x 1,y 1),(x 2,y 2),…,(x n ,y n ),则变量间线性相关系数r 的计算公式为:r =∑i =1n(x i -x)(y i -y )∑i =1n(x i -x)2·∑i =1n(y i -y )2=∑i =1nx i y i -n x y∑i =1nx 2i -n x2∑i =1ny 2i -n y 2.变量之间相关系数r 的取值范围为[-1,1],|r |值越大,误差Q 越小,变量之间的线性相关程度越高,|r |值越接近于0,Q 越大,变量之间的线性相关程度越低.当r >0时,b >0,两个变量的值总体上呈现出同时增减的趋势,此时称两个变量正相关;当r <0时,b <0,一个变量增加,另一个变量有减少的趋势,称两个变量负相关;当r =0时,称两个变量线性不相关.预习交流2如何由样本的相关系数r =∑i =1n(x i -x)(y i -y )∑i =1n(x i -x)2·∑i =1n(y i -y )2判定两变量的相关性?提示:当r >0时,表明两个变量正相关,当r <0时,表示两个变量负相关,r 的绝对值越接近于1,表明两个变量线性相关性越强;r 的绝对值越接近于0,表明两变量之间几乎不存在线性相关关系,通常当|r |>时,认为两个变量有很强的线性相关关系.3.可线性化的回归分析通过变换先将非线性函数转化成线性函数,利用最小二乘法得到线性回归方程,再通过相应变换得到非线性回归方程.预习交流3如何将函数y =a e bx转化为线性函数?提示:先对y =ae bx两边取对数得ln y =ln a +bx .若记u =ln y ,c =ln A .则u =c +bx ,就把函数y =a e bx转化成了线性函数u =c +bx .一、线性回归方程的求法汞含量x 2 4 6 810 消光系数y 64 138 205 285360(1) 思路分析:求线性回归方程必须先对两个变量进行相关性判断,若两个变量存在较大的相关性,则可利用公式求线性回归方程的系数;若两个变量不具备相关关系,则求线性回归方程将变得毫无意义.解:(1)散点图如图.(2)由散点图可知,y 与x 呈相关关系,设线性回归方程为:y =bx +A .经计算,得x =6,y =,∑5i =1x 2i =220,∑5i =1x i y i =7 790. ∴b =7 790-5×6×220-5×62=, a =-×6=-.∴线性回归方程为:y =-.已知两个变量x 和y 之间具有线性相关性, 甲、乙两个同学各自独立地做了10次和15次试验,并且利用线性回归的方法求得回归直线分别为l 1和l 2,已知两个人在试验中发现对变量x 的观测数据的平均数都为s ,对变量y 的观测数据的平均数都是t ,则下列说法正确的是( ).A .l 1与l 2一定有公共点(s ,t )B .l 1与l 2相交,但交点一定不是(s ,t )C .l 1与l 2必定平行D .l 1与l 2必定重合答案:A解析:由于回归直线y =bx +a 恒过(x ,y )点,又两人对变量x 的观测数据的平均值为s ,对变量y 的观测数据的平均值为t ,所以l 1和l 2恒过点(s ,t ).作出散点图可直观地判断两个变量的相关关系.线性回归直线方程y =bx +a 一定过样本中心(x ,y ).二、相关系数及相关性检验现随机抽取了我校10名学生在入学考试中的数学成绩(x )与入学后的第一次考试中的学生号 1 2 3 4 5 6 7 8 9 10 x 120 108 117 104 103 110 104 105 99 108 y 84 64 84 68 69 68 69 46 5771 思路分析:先利用相关系数计算公式r =∑i =1nx i y i -n x y(∑i =1nx 2i -n x 2)(∑i =1ny 2i -n y 2)计算出r ,当|r |越接近于1时,两个变量越具有很强的线性关系.解:由题意得:x =110(120+108+…+99+108)=,y =110(84+64+…+57+71)=68,∑i =110x 2i =1202+1082+…+992+1082=116 584,∑i =110y 2i =842+642+…+572+712=47384,∑i =1nx i y i =120×84+108×64+…+108×71=73 796,∴r =错误! ≈ 6.∵ 6接近于1,∴两次数学考试成绩有显著性线性相关关系.炼钢是一个氧化降碳的过程,钢水含碳量的多少直接影响冶炼时间的长短.必须掌握钢水含碳量和冶炼时间的关系.如果已测得炉料熔化完毕时钢水的含碳量x 与冶炼时间y (从x %) 104 180 190 177 147 134 150 191 204 121 y /min 100 200 210 185 155 135 170 205 235 125 (2)如果y 与x 具有线性相关关系,求线性回归方程. (3)预测当钢水含碳量为160个%时,应冶炼多少分钟? i 1 2 3 4 5 6 7 8 9 10x i 104 180 190 177 147 134 150 191 204 121 y i 100 200 210 185 155 135 170 205 235 125 x i y i 10 400 36 000 39 900 32 745 22 785 18 090 25 500 39 155 47 940 15 125x =,y =172,∑10i =1x 2i =265 448,∑10i =1y 2i =312 350,∑10i =1x i y i =287 640 于是r =∑i =1x i y i -10x y(∑10i =1x 2i -10x 2)(∑10i =1y 2i -10y 2)≈ 6.∵ 6非常接近于1,∴y 与x 具有显著的线性相关关系.(2)设所求的线性回归方程为y =bx +a ,其中a ,b 的值使Q =∑10i =1(y i -bx i -a )2的值最小.b =∑10i =1x i y i -10x y∑10i =1x 2i -10x2≈,a =y -b x ≈-,即所求的线性回归方程为 y =-.(3)当x =160时,y =×160-≈172,即大约冶炼172 min.如果两个变量不具备线性相关关系或者线性相关关系不显著,即使求出线性回归方程也无意义,用于估计和测量的结果也是不可信的.1.在下列各量与量之间的关系中是相关关系的是( ). ①正方体的体积与棱长之间的关系;②一块农田的小麦的产量与施肥量之间的关系; ③人的身高与年龄之间的关系; ④家庭的收入与支出之间的关系; ⑤某家庭用水量与水费之间的关系.A .②③B .③④C .④⑤D .②③④ 答案:D解析:①⑤属于函数关系,②③④属于相关关系.2.在建立两个变量y 与x 的回归模型中,分别选择了4个不同模型,它们的相关指数r 如下,其中拟合得最好的模型为( ).A .模型1的相关指数r 为B .模型2的相关指数r 为C .模型3的相关指数r 为D .模型4的相关指数r 为 答案:B解析:相关指数|r |的值越大,说明模型的拟合效果越好. 3.对有线性相关关系的两个变量建立的回归直线方程y =a +bx 中,回归系数b ( ). A .可以小于0 B .大于0 C .能等于0 D .只能小于0 答案:A解析:因为b =0时,则r =0,这时不具有线性相关关系,但b 可以大于0也可以小于0.4x 2 4 5 6 8 y 30 40 60 50 70若y 与x ______万元.答案:10解析:由已知x =5,y =50,∑i =15x 2i =145,∑i =15y 2i =13 500,∑i =1nx i y i =1 380,∴b =1 380-5×5×50145-5×25=.∴a =y -b x =.∴回归直线方程为y =+.∴由y ≥,即+≥,解得x ≥10. 故广告费支出最少是10万元.5.有一台机床可以按各种不同的速度运转,其加工的零件有一些是二级品,每小时生机床运转的速度(转/秒) 每小时生产二级品的数量(个)8 5 12 8 14 9 16 11(1)(2)求出机床运转的速度x 与每小时生产的二级品数量y 的回归直线方程.(3)若实际生产中所允许的二级品不超过10个,那么机床的运转速度不得超过多少转/秒?解:(1)散点图如下:(2)易求得x =,y =,∴回归直线的斜率b =∑i =1nx i y i -n x y∑i =1nx 2i -n x2= 6,截距a =y -b x =- 1.∴所求回归直线的方程为y = 6x - 1.(3)根据经验公式,要使y ≤10,只需 6x - 1≤10,解得x ≤ 3,即机床的运转速度不能超过 3转/秒.。
高中数学选修回归分析教案
![高中数学选修回归分析教案](https://img.taocdn.com/s3/m/4c36d055fe00bed5b9f3f90f76c66137ef064f6d.png)
高中数学选修回归分析教案教学内容:1. 线性回归分析的基本概念2. 简单线性回归分析3. 多元线性回归分析4. 回归模型的拟合度检验教学目标:1. 了解线性回归分析的基本概念及相关原理2. 能够运用简单线性回归分析进行数据分析与预测3. 能够应用多元线性回归分析解决实际问题4. 能够进行回归模型的拟合度检验,评估模型的有效性教学重难点:1. 理解线性回归分析中的相关概念,包括自变量、因变量、回归方程等2. 掌握简单线性回归的计算方法和实际应用3. 理解多元线性回归的基本原理,能够运用多元线性回归进行数据分析4. 掌握回归模型的拟合度检验方法及其应用教学过程:第一课时:1. 引入线性回归分析的概念和应用领域2. 讲解简单线性回归的原理和计算方法3. 给出简单线性回归的实例并进行计算练习第二课时:1. 复习简单线性回归的内容2. 讲解多元线性回归的概念和应用3. 给出多元线性回归的实例并进行计算练习第三课时:1. 复习多元线性回归的内容2. 讲解回归模型的拟合度检验方法3. 给出拟合度检验的实例并进行计算练习教学方法:1. 讲解结合实例分析2. 组织学生进行小组讨论与分享3. 带领学生进行数据分析与计算实践4. 指导学生进行模型拟合度检验的实验操作教学评估:1. 利用课堂练习、作业和小考查学生对于概念和计算方法的掌握情况2. 设计实际应用题目,评估学生对于多元线性回归和拟合度检验的应用能力3. 结合学生提问和错误答案进行即时纠正和指导教学资源:1. 课本《数学选修-回归分析》2. 计算器、电脑及相关软件3. 实例数据集和计算练习题教学反思:通过本次教学,学生对线性回归分析有了更深入的理解,能够应用简单线性回归和多元线性回归解决实际问题,同时也能够进行回归模型的拟合度检验,提高了数学分析和实际应用能力。
但在教学过程中,需要更加关注学生的实际操作能力和问题解决能力,进一步提高教学效果。
1.1回归分析-北师大版选修2-3教案
![1.1回归分析-北师大版选修2-3教案](https://img.taocdn.com/s3/m/da38157feffdc8d376eeaeaad1f34693daef1036.png)
1.1 回归分析-北师大版选修2-3教案一、教学目标1.理解回归分析的基本概念。
2.掌握最小二乘法求解一元线性回归方程的方法。
3.能够利用回归分析解决实际问题。
4.培养学生运用数学知识分析问题和解决问题的能力。
二、教学重点1.回归分析的定义和基本原理。
2.最小二乘法求解一元线性回归方程的步骤。
3.运用回归分析解决实际问题。
三、教学难点1.最小二乘法求解一元线性回归方程的方法。
2.运用回归分析解决实际问题的能力。
四、教学方法1.讲授法2.示例法3.练习法五、教学资源1.北师大版选修2-3教材2.教学投影仪3.计算器六、教学过程6.1 导入1.引入回归分析的概念,让学生了解回归分析的应用场景。
2.引入最小二乘法的基本概念。
3.引入一元线性回归方程的概念。
6.2 讲授1.讲解回归分析的定义和基本原理。
2.讲解最小二乘法求解一元线性回归方程的步骤。
6.3 示例演练1.通过一个实际问题,示范如何利用回归分析解决问题。
2.带领学生一步一步跟随示例演练。
6.4 训练1.提供多个实际问题,让学生自己运用回归分析解决问题。
2.提供必要的支持和指导。
6.5 总结1.回顾回归分析的基本概念和最小二乘法求解方法。
2.总结回归分析的应用场景和作用。
七、课后作业1.完成教材相关思考题和练习题。
2.自选一道实际问题,利用回归分析解决。
3.总结回归分析的基本原理、方法和应用场景。
八、教学评估1.教师检查学生完成的练习和作业情况。
2.教师记录课堂表现优秀的学生,有针对性地给予表扬或加分。
九、教学反思经过这次教学,我发现学生对于最小二乘法和一元线性回归方程的理解还比较浅,需要在教学时细化概念,加强示范和练习,以便他们更好地吸收掌握。
此外,针对应用场景的演示需更丰富,让学生在现实问题上获得更多的直观感受。
数学北师大版选修1-2学案:第一章第1节回归分析第2课
![数学北师大版选修1-2学案:第一章第1节回归分析第2课](https://img.taocdn.com/s3/m/4f5d0c38a8114431b90dd871.png)
1.2 相关系数1.了解回归分析的概念和最小二乘法的求法及作用. 2.理解相关系数的含义及求法.3.了解回归分析的基本思想.会建立回归模型,并能利用回归分析进行有效预测.1.变量间的关系往往会表现出某种不确定性,________就是研究这种变量之间的关系的一种方法,通过对变量之间关系的研究,从而发现蕴涵在事物或现象中的某些规律.【做一做1】 下列两变量中具有相关关系的是( ). A .正方体的体积与边长 B .人的身高与体重 C .匀速行驶的车辆的行驶距离与时间 D .球的半径与体积2.假设样本点为(x 1,y 1),(x 2,y 2),…,(x n ,y n ),我们可用____________求变量之间的线性回归方程y =a +bx ,即求a ,b ,使这n 个点与直线y =a +bx 的“距离”平方之和最小,即使得Q (a ,b )=(y 1-a -bx 1)2+(y 2-a -bx 2)2+…+(y n -a -bx n )2达到最小.3.Q (a ,b )=l yy +n [y -(a +b x )]2+l xx ⎝⎛⎭⎫b -l xyl xx 2-xx y xx ll 2. 其中x =x 1+x 2+…+x n n =1n ∑i =1nx i ,y =y 1+y 2+…+y n n =1n ∑i =1ny i ,l xx =∑i =1n(x i -x )2=∑i =1nx 2i -n x 2,l xy =∑i =1n (x i -x )(y i -y )=∑i =1nx i y i -n x y ,l yy =∑i =1n(y i -y )2=∑i =1ny 2i -n y 2.当Q (a ,b )取最小值时,b =____________,a =________.y 对x 的线性回归方程为__________,此直线一定过点______.公式比较复杂难记,只需记住a ,b 的求值公式即可.做题要细心,不可遗漏数据,使y =bx +a 必过点【做一做2-2】 4.判断两个变量之间的线性相关关系的方法有(1)________________________;(2)______________________.两个变量之间是否有线性相关关系,可以通过画散点图直观判断,但是在某些情况下,从散点图中不容易判断变量之间的线性相关关系,特别是当数据量较大时,画散点图比较麻烦,此时就可以通过计算,用线性相关系数r 来作出判断,比较容易实施.5.假设两个随机变量的数据分别为(x 1,y 1),(x 2,y 2),…,(x n ,y n ),则变量间线性相关系数r 的计算公式为r =__________________.线性相关系数|r |≤1,|r |越大,变量之间的线性相关程度越高,用直线拟合的效果就越好.线性相关系数r 的计算公式虽然比较复杂,但是可以分开计算.因为在求线性回归方程时,也要计算x ,y ,∑i =1nx i y i 和∑i =1nx 2i 等量,只需再把∑i =1ny 2i 计算出来即可.通常是通过列表格来完成上述各项的计算.【做一做3】 在建立两个变量y 与x 的线性回归模型中,分别选择了4个不同的模型,它们的相关系数r 如下,其中拟合得最好的模型是( ).A .模型1的相关系数r 为0.98B .模型2的相关系数r 为0.80C .模型3的相关系数r 为0.50D .模型4的相关系数r 为0.25答案:1.回归分析【做一做1】 B 选项A 中正方体的体积为边长的立方,有固定的函数关系;选项C 中匀速行驶的车辆的行驶距离与时间成正比,也有函数关系;选项D 中球的体积是43π与半径的立方相乘,有固定的函数关系.所以只有选项B 中人的身高与体重具有相关关系.2.最小二乘法3.l xy l xx=∑i =1n (x i -x )(y i -y )∑i =1n(x i -x )2=∑i =1nx i y i -n x y∑i =1nx 2i -n x2y -b x y =a +bx (x ,y )【做一做2-1】 ⎝⎛⎭⎫32,4 线性回归方程一定过点(x ,y ), 又x =14×(0+1+2+3)=32,y =14×(1+3+5+7)=4,∴线性回归方程必过点⎝⎛⎭⎫32,4.【做一做2-2】 分析:样本点共有三个,可以直接计算.解:由所给数据可得:x =7,y =18,∑i =13x i y i =434,∑=312i i x =179,进而可以求得b =∑i =13x i y i -3x y∑i =13x 2i -3x2=434-3×7×18179-3×49=1.75,a =y -b x =18-1.75×7=5.75. ∴线性回归方程为y =5.75+1.75x . 4.(1)画散点图 (2)计算线性相关系数5.∑i =1nxi y i -n x y∑i =1nx 2i -n x2∑i =1ny 2i -n y2【做一做3】 A1.求线性回归方程的一般步骤 剖析:(1)作散点图:对于样本点(x 1,y 1),(x 2,y 2),…,(x n ,y n ),在坐标系内作出散点图,并观察各样本点是否呈条状分布,是否都分布在一条直线的两侧.若是,则可设其线性回归方程为y =a +bx.(2)列表:对于所给出的数据x ,y 列成相应的表格.(3)x =1n ∑n i =1x i ,y =1n ∑ni =1y i ,b =∑∑==--n i i ni i i xn x y x n y x 1221 ,a =y -b x . (4)写出回归方程:y =a +bx .2.样本的选取是否影响两个变量的线性回归方程剖析:会影响.这是因为我们所采集的样本只是两个变量之间的部分数据的关系,而且它们的散点图分布在某一条直线的附近,不一定就在直线上,所以不能用某个一次函数y =a +bx 来准确地表达它们之间的关系,我们只能近似地看作两个变量之间满足线性关系,符合一个一次函数y =a +bx ,而将x =x i 代入时,得到y 的值与所测得的y i 之间存在着一定的误差,误差为y i -y =y i -(a +bx i )=y i -a -bx i (i =1,2,…,n),那么,我们要想用y =a +bx 拟合得好一点,就要使误差小一点.但不能把这些误差直接相加,这是因为它们有正有负,相加可能抵消一部分,为了不使误差之和正负抵消,我们可设全部误差的平方和为Q(a ,b),即Q(a ,b)=∑ni =1(y i -a -bx i )2,用Q 的大小来度量总的误差大小,Q 是a ,b 的二元函数.当b =∑ni =1x i y i -n x y∑ni =1x 2i -n x2时,Q(a ,b)最小,此时a =y -b x .由此看来,所取的样本点不同,有可能得到的线性回归方程不同.题型一 求线性回归方程【例题1】 一个车间为了规定工时定额,需要确定加工零件所花费的时间,为此进行(1)求y 对x 的线性回归方程;(2)据此估计加工200个零件所用的时间是多少? 反思:计算线性回归方程比较麻烦,对于样本点较少的情况可直接代入公式计算求值.实际问题中的数据都不好算,一般要借助计算器来完成.题型二 计算线性相关系数【例题2】 某工厂有一大型机器设备,其使用年限x(年)与所支出的维修费用y(万元)方程.分析:本题为探索两个变量之间是否具有线性相关关系的题型,可通过计算线性相关系数来加以判断,因为数据比较多,可列表分项计算.反思:对于数量比较多的数据判断它们相应的变量是否线性相关,可通过计算线性相关系数来判断.题型三 利用回归分析进行有效预测【例题3】 为了了解某地母亲身高x 与女儿身高y 的相关关系,现随机测得10对母女(1)试对x 与y 进行线性回归分析,并预测当母亲身高为161 cm 时,女儿的身高为多少? (2)求相关系数r ,并分析模型的拟合效果.分析:通过观察两变量对应的数据,可判断x 与y 之间存在线性相关关系,通过列表计算,求出回归方程,并通过计算线性相关系数来判断两变量的线性相关程度.反思:一个模型拟合得好不好,可通过计算线性相关系数r 来判断,|r|的值越接近于1,变量之间的线性相关程度越高,拟合得越好.答案:【例题1】 解:(1)列出下表,并用科学计算器进行计算.同时,利用上表可得b =∑10i =1x i y i -10x y∑10i =1x 2i -10x 2=55 950-10×55×91.738 500-10×552≈0.668,a =y -b x ≈91.7-0.668×55=54.96,即所求的线性回归方程为y =0.668x +54.96.(2)这个线性回归方程的意义是当x 增大1时,y 的值约增加0.668,而54.96是y 不随x 增大而变化的部分.因此当x =200时,y 的估计值为y =54.96+0.668×200=188.56≈189. 故加工200个零件时所用的时间约为189分. 【例题2】由此可得:x =5,y ≈6.185 7,∑i =17x i y i =251.1,∑i =17x 2i =203,∑i =17y 2i =311.51.∴线性相关系数r =∑i =17x i y i -7x y∑i =17x 2i -7x2∑i =17y 2i -7y2≈251.1-7×5×6.185 7203-7×52×311.51-7×6.185 72≈0.989 5.∴维修费用与使用年限之间存在线性相关关系.b =∑i =17x i y i -7x y∑i =17x 2i -7x2≈251.1-7×5×6.185 7203-7×52≈1.235 7,a =y -b x ≈6.185 7-1.235 7×5 =0.007 2,∴线性回归方程为y =0.007 2+1.235 7x . 【例题3】 解:列表:(1)由表可得x =158.8,y=159.1,∑i =110x 2i =252 222,∑i =110y 2i =253 185,∑i =110x i y i =252 688,进而可以求得b =∑10i =1x i y i -10x y∑10i =1x 2i -10x2=252 688-10×158.8×159.1252 222-10×158.82≈0.78,a =y -b x =159.1-0.78×158.8≈35,∴线性回归方程为y =35+0.78x .当x =161 cm 时,y =160.58 cm ,即女儿的身高为160.58 cm.(2)r =∑10i =1x i y i -10x y∑10i =1x 2i -10x2∑10i =1y 2i -10y2=252 688-10×158.8×159.1252 222-10×158.82×253 185-10×159.12 ≈0.715,说明模型拟合得效果较好.1由一组数据(x 1,y 1),(x 2,y 2),…,(x n ,y n )得到的线性回归方程为y =a +bx ,则下列说法正确的是( ).A .直线y =a +bx 必过点( x , y )B .直线y =a +bx 至少经过点(x 1,y 1),(x 2,y 2),…,(x n ,y n )中的一点C .直线y =a +bx 是由(x 1,y 1),(x 2,y 2),…,(x n ,y n )中的两点确定的D .(x 1,y 1),(x 2,y 2),…,(x n ,y n )这n 个点到直线y =a +bx 的距离之和最小答案:A 正确理解线性回归方程的含义,所求的线性回归方程并不一定要经过这n 个样本点中的某些点,而是这n 个点到直线的距离的平方和最小,即用最小二乘法求出线性回归方程中a ,b 的值,由于a =x b y -,即x b a y +=,由此可以看出(x ,y )适合线性回归方程y =a +bx ,所以直线y =a +bx 必过点(x ,y ).2对于线性相关系数r ,下列说法正确的是( ).A .r ∈(-∞,+∞),r 越大,相关程度越强;反之,相关程度越弱B .|r|∈(0,+∞),|r|越大,相关程度越强;反之,相关程度越弱C .|r|≤1,且|r|越大,相关程度越强;反之,相关程度越弱D .以上说法都不正确答案:C 熟记关于线性相关系数r 的重要结论是解决此类问题的关键.3某工厂为预测某产品的回收率y ,需要研究它和原料的有效成分含量x 之间的相关关系,现取8对观察值,计算得∑-=8152i i x ,∑-=81228i i y ,∑-=8121478i x ,∑-=811849i i i y x ,则y 对x 的线性回归方程为( ).A .y =11.47+2.62xB .y =-11.47+2.62xC .y =2.62+11.47xD .y =11.47-2.62x答案:A 由已知条件,得x =6.5,y =28.5,代入,得b =∑∑==--8122818y8i ii i i xx x y x =25.684785.285.681849⨯-⨯⨯-≈2.62,a =y -b x ≈28.5-2.62×6.5=11.47,∴线性回归方程为y =11.47+2.62x . 4(2012·由其散点图,可知用水量y 与月份x 之间有较好的线性相关关系,其线性回归方程是________________________________________________________________________.答案:y =-0.7x +5.25 由已知,得x =2.5,y =3.5,∑=412i ix =30,∑=41i i i y x =31.5,所以b =∑∑==--4122414y4i ii i i xx x y x =-0.7.所以a =y -b x =5.25.所以线性回归方程是y =-0.7x +5.25.5求y 解:由表中数据可得:x =6.5,y =8.327612=∑=i i x ,∑=61i i i y x =396,进而可以求得b =∑∑==--6122616y 6i i i i i xx x y x =25.6632785.66396⨯-⨯⨯-≈1.143,a =y -b x ≈8-1.143×6.5=0.570 5. ∴所求的线性回归方程为y =0.570 5+1.143x . 由y ≤16,即0.570 5+1.143x ≤16.解得x ≤13.5,所以进价应不超过13.5元.。
北师大版高中数学选修回归分析教案
![北师大版高中数学选修回归分析教案](https://img.taocdn.com/s3/m/eac5c793e009581b6bd9ebf9.png)
回归分析教学目标:1.通过对典型案例的探究,进一步了解回归的基本思想,方法及初步应用.2.培养学生的应用意识和解决实际问题的能力.教学重点:线性回归模型的建立和线性回归系数的最佳估计值的探求方法. 教学难点:相关性检验及回归分析 教学过程:一.问题情景:对一作直线运动的质点的运动过程观测了8次,得到如下表所示的数据,试估计当x=9时根据《数学必修3》中有关内容,解决这个问题的方法是:先作散点图,如下图所示.从散点图中可以看出,样本点呈直线趋势,时间x 与位置预测值y 之间有着较好的线性关系.因此可以用线性回归方程来刻画它们之间的关系.根据线性回归系数公式,可以得到线性回归方为3.5361 2.1214y x =+,所以当x=9时,由线性回归方程可以估计其位置值为22.6287y =问题:在时刻x=9时,质点的运动位置一定是22.6287cm 吗?二.学生活动:由学生思考,讨论:这些点并不都在同一条直线上,上述直线并不能精确的反映x 与y 之间的关系,x 与y 之间具有的是相关关系,y 的实际值与估计值之间存在着误差. 三.建构数学1.线性回归模型:我们将y a bx ε=++称为线性回归模型.ε称为随机误差. 2.线性回归模型应考虑的问题:I 模型是否合理;II 在合理的情况下,如何求a,b 3.线性回归方程:4.相关系数r :()()nniii ix x y y x y nx yr---==∑∑5.相关系数的性质:(1)r ≤1;(2)r 越接近1,x,y 的线性相关程度越强; (3)r 越接近于0,x,y 的线性相关程度越弱. 6.对相关系数进行显著性检验的步骤:(1)提出统计假设0H :变量x,y 不具有线性相关关系;(2)如果以95%的把握作出推断,那么可以根据1-0.95=0.05与n-2在附录1中查出一个r 的临界值0.05r (其中1-0.95=0.05称为检验水平); (3)计算样本相关系数r ; (4)作出统计推断:若0.05r r >,则否定0H ,表明有95%的把握认为x 与y 之间具有线性相关关系;若r ≤0.05r ,则没有理由拒绝原来的假设0H ,即就目前的数据而言,没有充分的理由认为y 与x 之间有线性相关关系. 四.数学应用例1.下表给出了我国从1949年至1999年人口数据资料,试根据表中数据估计我过2001年的人口数.线性回归方程为527.59114.453y x =+由于2004对应的x=55,代入线性回归方程可得1322.506y =(百万),即2004年的人口为13.23亿.对于例1,可按下面的过程进行检验:(1)作统计假设0H :x 与y 不具有线性相关关系; (2)由0.05与n-2=9在附录1中查得0.050.602r =;(3)根据公式得相关系数r=0.998 (4)因为0.9980.602r =>,即0.05r r >,所以有95%的把握认为x 与y 之间具有线性相关关系,线性回归方程为527.59114.453y x =+例2.下表是随机抽取的8对母女的身高数据,试根据这些数据探讨y 与x 之间的关系.解:所给数据的散点图如图所示:由图可以看出,这些点在一条直线附近,因为25.159=x ,161=y5.59)(88122=-∑=i ix x116)(88122=-∑=i iy y,80881=-∑=i i i y x y x ;所以963.01165.5980≈⨯=r .由检验水平0.05及n-2=6,在附录1中查得707.005.0=r ,因为0.963>0.707,所以可以认为x 与y 之间具有较强的线性相关关系.线性回归方程为x y 345.1191.53+-=.例3.下表是随机抽取的10个家庭的年可支配收入x 与年家庭消费y 的数据,试根据这些数解:所给数据的散点图如图所示, 该图表明,这些点在一条直线附近.相关系数r=0.9826.由检验水平0.05及n-2=8,在附录1中查得632.005.0=r ,因为0.9826>0.632,所以可以认为家庭消费支出与可支配收入之间有较强的线性相关关系;4845.0,53.380≈≈b a ,故线性回归方程为x y 4845.053.380+=五.课堂练习 1.某种产品表面进行腐蚀性刻线试验,得到腐蚀深度y 与腐蚀时间x 间相应的一组观察值,(3)试预测腐蚀时间分别为100s 及150s 时的腐蚀深度.r ≈0.9820; x y 3043.03461.5+=35.78 50.99r ≈0.991 x y 93.22578.0+=(3)求回归直线方程;(4)当播放天数为11天时,估计累计人次为多少? r ≈0.984 x y 9.468.30+=547人六.小结1.通过线性相关系数r 来研究两者之间是否有较强的线性相关关系及其步骤. 2.线性回归方程的求法;。
北师大版数学高二选修1-2学案第一章第1节回归分析(第3课时)
![北师大版数学高二选修1-2学案第一章第1节回归分析(第3课时)](https://img.taocdn.com/s3/m/bde45326f90f76c660371a03.png)
1.3 可线性化的回归分析1.进一步了解回归分析的基本思想,明确建立回归模型的基本步骤.2.了解回归模型与函数模型的区别,体会有些非线性模型通过变换可以转化为线性回归模型,了解在解决问题中寻找更好的模型的方法.1.在具体问题中,我们首先应该作出原始数据(x ,y)的________,从______中看出数据的大致规律,再根据这个规律选择适当的函数进行拟合.2.对于非线性回归模型一般可转化为______________,从而得到相应的回归方程. 3.几种常见模型 (1)幂函数曲线y =ax b .其散点图在如下图所示曲线附近.设__________________,则转化为线性关系:u =c +bv. (2)指数曲线y =ae bx .其散点图在如下图所示曲线附近.设______________,则转化为线性关系:u =c +bx. (3)倒指数曲线xb ae y .其散点图在如下图所示曲线附近.设____________,则转化为线性关系:u =c +bv. (4)对数曲线y =a +b ln x.其散点图在如下图所示曲线附近.设________,则转化为线性关系:y =a +bv.【做一做1】 如图中曲线所表示的函数最有可能是( ).A .y =ln xB .y =e xC .xe y 13=D .xey 13-=【做一做2】 若一函数模型为y =2+3log 2x ,则作变换u =__________,才能转化为y 是u 的线性回归方程.答案:1.散点图 散点图 2.线性回归模型3.(1)u =ln y ,v =ln x ,c =ln a (2)u =ln y ,c =ln a (3)u =ln y ,c =ln a ,v =1x (4)v=ln x【做一做1】 D 【做一做2】 log 2x1.实际问题中非线性相关的函数模型的选取剖析:(1)要先作散点图;(2)选取所有符合的可能类型;(3)将非线性关系转变为线性关系后,可再作线性相关的散点图来进一步辨别,也可通过计算线性相关系数作比较.2.常见的几种模型在转化为线性关系时应注意的问题剖析:常见的几种函数模型的解析式在转变为线性相关关系时,要根据函数式的特点,灵活地换元转变为线性函数关系.常见的几种模型在使用时要注意散点图的形状符合哪一种类型曲线的形状,有时不太容易辨别,可采用多种模型拟合,并转变为线性回归关系.利用线性相关系数来判断检验用哪一种拟合效果较好,就用哪一种模型.3.利用线性回归拟合曲线的一般步骤剖析:(1)绘制散点图.一般根据数据性质结合专业知识便可确定数据的曲线类型.不能确定时,可在方格坐标纸上绘制散点图,根据散点的分布,选择接近的、合适的曲线类型.(2)进行变量替换.令y′=f(y),x′=g(x),使变换后的两个变量呈线性相关关系.(3)按最小二乘法原理求线性回归方程并进行检验.(4)将线性回归方程转换为关于原始变量x,y的回归方程.题型一已知模拟函数类型确定解析式若y与t之间满足y=a e b(t 1 950)的关系,求函数解析式.若按此增长趋势,问我国2012年人口将达到多少亿?分析:本题中已知函数模型的类型,可通过变形转化为线性关系,从而求出.反思:本题中已知函数模型,可通过恰当的变换将函数转化为线性函数关系u=c+bt′,然后通过变换公式计算出相应的u与t′之间的数据关系表,根据求线性回归直线的公式计算出u与t′之间的函数关系,并将u与t′之间的关系再转回到y与t之间的函数关系.题型二通过数据探寻函数关系模型【例题2】某种书每册的成本费y(元)与印刷册数x(千册)有关,经统计得到数据如下检验每册书的成本费y 与印刷册数的倒数1x 之间是否具有线性相关关系,如有,求出y对x 的回归方程.分析:本题中y 与x 不具有线性相关关系,而y 与1x可能具有线性相关关系,故先把x转化为1x ,不妨设u =1x,建立y 与u 的回归分析即可,最后转化为y 与x 的关系.反思:在拿不准y 与1x 之间是否具有线性相关关系时,可以通过变换u =1x 找y 与u 之间的关系,并通过画散点图或计算线性相关系数来进一步判断y 与u 之间是否具有线性相关关系,从而进一步完成运算.答案:【例题1】 解:设u =ln y ,c =ln a ,t ′=t -1 950,则u =c +bt ′. u 与t ′之间的关系数据如下表:由此可得:∑i =110t i ′2=285,∑i =110t i ′u i =497.593 6,t ′=4.5,u =11.016 7,进而可以得b =∑∑=='-''-'1012210110 10i i i i i t t ut u t=497.593 6-10×4.5×11.016 7285-10×4.52≈0.022 3,∴c =u -b t ′=11.016 7-0.022 3×4.5≈10.916 4. ∴u =10.916 4+0.022 3t ′.∴y =e 10.916 4+0.022 3(t -1 950)=e 10.916 4·e 0.022 3(t -1 950).当t =2 012时,u =10.916 4+0.022 3×(2 012-1 950)=12.299, ∴y =e 12.299≈219 476.40(万人),即如果按此增长趋势,到2012年将达到21.947 640亿人. 【例题2】 解:设u =1x ,则y 与u 的数据关系如下表:由此可得:∑i =110u 2i =1.412 989,∑i =110y 2i =171.803,∑i =110u i y i =15.208 78,u=0.224 8,y =3.14,则线性相关系数r =∑i =110u i y i -10u y∑i =110u 2i -10u2∑i =110y 2i -10y2=15.208 78-10×0.224 8×3.141.412 989-10×0.224 82×171.803-10×3.142≈0.999 8.这表明u 与y 之间有较强的线性相关关系,从而求y 与u 的线性回归方程是有意义的.∵b =∑i =110u i y i -10u y∑i =110u 2i -10u2≈8.98,a =y -b u =3.14-8.98×0.224 8≈1.12, ∴y =1.12+8.98u .∴x 与y 之间的回归方程为y =1.12+8.98x .1幂函数曲线y =x b ,当b >1时的图像为( ).答案:A 当b >1时,图像为选项A ;当0<b <1时,图像为选项B ;当b <0时,图像为选项C ;当b =1时,图像为选项D.2倒指数曲线xb ae y ,当a >0,b >0时的图像为( ).答案:A3某市居民2005~2009年家庭年平均收入x(单位:万元)与年平均支出Y(单位:万元)根据统计资料,居民家庭年平均收入的中位数是__________万元,家庭年平均收入与年平均支出有__________线性相关关系.答案:13 正 根据中位数的定义,居民家庭年平均收入的中位数是13,家庭年平均收入与年平均支出有正线性相关关系.则x ,y 之间符合的函数模型为__________.答案:y =x 2 通过数据发现y 的值与x 的平方值比较接近,所以x ,y 之间的函数模型为y =x 2.5 某地今年上半年患某种传染病的人数y(人)与月份x(月)之间满足函数关系,模型为y =a e bx分析:函数模型为指数函数,可转化为线性相关关系,从而求解. 解:设u =ln y ,c =ln a ,得u =c +bx , 则u 与x 的数据关系如下表:由上表,得∑==6121i i x ,∑==613595.25i i u ,∑==61291i i x ,∑==612334.107i i u ,∑==613413.90i i i u x ,5.3=x ,u ≈4.226 58,∴b ≈2612616 6∑∑==--i i i i i xx ux u x=25.369122658.45.363413.90⨯-⨯⨯-≈0.09, c =u -b x ≈4.226 58-0.09×3.5=3.911 58, ∴u =3.911 58+0.09x . ∴y =e 3.911 58·e 0.09x .。
高中数学(北师大版)选修1-2教案:第1章 回归分析注意问题两例
![高中数学(北师大版)选修1-2教案:第1章 回归分析注意问题两例](https://img.taocdn.com/s3/m/97a528b26bec0975f565e20a.png)
回归分析注意问题两例一、相关性判断问题例1 炼钢是一个氧化降碳的过程,钢水含碳量的多少直接影响冶炼时间的长短,必须掌握钢水含碳量和冶炼时间的关系。
如果已测得炉料融化完毕时钢水的含碳量x 与冶炼时间y (从炉料融化完毕到出钢的时间)的一列数据,如下表所示:(1)y 与x 是否具有线性相关关系?(2)如果y 与x 具有线性相关关系,求回归直线方程; (3)预测当钢水含碳量为160个0.01%时,应冶炼多少分钟?分析:判断两变量之间是否具有线性相关关系,要计算出相关系数r ,比较r 与临界值的大小,依据线性回归直线方程,对冶炼时间进行预报。
解析:(1)由已知数据列成下表:于是10100.9906i iX Y x yr -=≈∑,又0.050.632r =,0.05r r >知y 与x 具有线性相关关系。
(2)设所求的回归直线方程y bx a =+,则1011022110 1.267,30.5110i i i ii X Y x yb a y bx Xx==-=≈=-≈--∑∑,即所求的回归直线方程为1.26730.51y x =-(3)当160x =时, 1.26716030.51172(min)y =⨯-≈,即大约冶炼172min 。
导评:已知x 与y 呈线性相关关系,就无需进行相关性检验,否则要进行相关性检验。
如果两个变量不具备相关关系,或者相关关系不显著,即使求出回归方程也是毫无意义的,用其估计和预测也是不可信的。
二、非线性问题例2 在试验中得到变量y 与x 的数据如下:由经验知,y 与1x之间具有线性相关关系,试求y 与x 之间的回归曲线方程;当00.038x =时,预测0y 的值。
分析:通过换元转化为线性回归问题。
解析:令1u x=,由题目所给数据可得下表所示的数据‘计算得0.29,34.32b a==,∴34.320.29y u=+故所求回归曲线方程为0.2934.32yx=+,当0.038x=时,0.2934.3241.950.038y=+≈。
高中数学:1.1回归分析 学案 (北师大选修1-2)
![高中数学:1.1回归分析 学案 (北师大选修1-2)](https://img.taocdn.com/s3/m/a2bde6f7e87101f69f3195ed.png)
1.1回归分析自学目标(1)通过实例引入线性回归模型,感受产生随机误差的原因;(2)通过对回归模型的合理性等问题的研究,渗透线性回归分析的思想和方法;(3)能求出简单实际问题的线性回归方程.重点,难点线性回归模型的建立和线性回归系数的最佳估计值的探求方法.学习过程一.问题情境1.情境:对一作直线运动的质点的运动过程观测了8次,得到如下表所示的数据,试估计当x=9时的位置y的值.时刻x/s1*******位置观测值5.547.5210.0211.7315.6916.1216.9821.06y/cm根据《数学3(必修)》中的有关内容,解决这个问题的方法是:先作散点图,如下图所示:从散点图中可以看出,样本点呈直线趋势,时间x与位置观测值y之间有着较好的线性关系.因此可以用线性回归方程来刻画它们之间的关系.根据线性回归的系数公式,1221()ni i i ni i x y nx y b x n x a y bx==⎧-⎪⎪=⎪⎨-⎪⎪=-⎪⎩∑∑ 可以得到线性回归方为 3.5361 2.1214y x =+,所以当9x =时,由线性回归方程可以估计其位置值为22.6287y =2.问题:在时刻9x =时,质点的运动位置一定是22.6287cm 吗? 二.学生活动思考,讨论:这些点并不都在同一条直线上,上述直线并不能精确地反映x 与y 之间的关系,y 的值不能由x 完全确定,它们之间是统计相关关系,y 的实际值与估计值之间存在着误差. 三.建构数学1.线性回归模型的定义:我们将用于估计y 值的线性函数a bx +作为确定性函数;y 的实际值与估计值之间的误差记为ε,称之为随机误差;将y a bx ε=++称为线性回归模型.说明:(1)产生随机误差的主要原因有:①所用的确定性函数不恰当引起的误差; ②忽略了某些因素的影响; ③存在观测误差.(2)对于线性回归模型,我们应该考虑下面两个问题: ①模型是否合理(这个问题在下一节课解决); ②在模型合理的情况下,如何估计a ,b ? 2.探求线性回归系数的最佳估计值:对于问题②,设有n 对观测数据(,)iix y (1,2,3,,)i n =,根据线性回归模型,对于每一个ix ,对应的随机误差项()ii i y a bx ε=-+,我们希望总误差越小越好,即要使21ni i ε=∑越小越好.所以,只要求出使21(,)()ni i i Q y x αββα==--∑取得最小值时的α,β值作为a ,b 的估计值,记为a ,b .注:这里的iε就是拟合直线上的点(),iix a bx +到点(),iiiP x y 的距离.用什么方法求a ,b ?回忆《数学3(必修)》“2.4线性回归方程”P71“热茶问题"中求a ,b 的方法:最小二乘法.利用最小二乘法可以得到a ,b 的计算公式为1122211()()()()nni i iii i nni ii i x x y y x ynx yb x x xn x a y bx====⎧---⎪⎪==⎪⎨--⎪⎪=-⎪⎩∑∑∑∑,[来源:Z #xx #k 。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
回归分析知识引入你知道日常生活中的天气预报是如何实现的吗?气象学家根据既往的温度、湿度以及降雨等资料,就可以预报未来一段时间某地的天气变化情况。
这要求对这些变量之间的关系有精确的掌握。
前面的学习中,我们知道相关分析可用来帮助我们分析变量之间关系的强度;而倘若要确定变量之间数量关系的可能形式也即数量模型,则通常可采用回归分析法。
回归分析的应用十分广泛,它不但适用于实验数据,还可以分析未作实验控制的观测数据或历史资料。
有人可能会好奇,为什么叫“回归”这个名称,它有什么具体含义?实际上,回归这种现象最早由英国生物统计学家高尔顿在研究父母亲和子女的遗传特性时所发现的一种有趣的现象:身高这种遗传特性表现出“高个子父母,其子代身高也高于平均身高;但不见得比其父母更高,到一定程度后会往平均身高方向发生‘回归’”。
这种效应被称为“趋中回归”。
现在的回归分析则多半指源于高尔顿工作的那样一整套建立变量间数量关系模型的方法和程序。
本章以回归分析中最简单的一元线性回归为例介绍回归分析基本原理,接着概括一元线性回归的主要过程,最后介绍多元线性回归。
第一节回归分析基本原理两变量间的相关关系可以用散点图来反映,图中的每个点都代表一个变量配对样本点,它是自变量与因变量间关系的一个具体代表。
在相关分析中,我们详细地分析过相关关系的几何意义和数量特点。
显然,若这些散点都落在一条直线上(完全相关),则该条直线当然能够代表变量间的数量关系——一次函数关系。
但在回归分析中,我们要解决的是一般情况下(不完全相关),如何寻找一条最恰当的直线能代表呈线性关系的两个变量间的直线关系趋势,也就是能够最大程度拟合这些散点的直线。
最小二乘法原理我们将那条要找的直线用= a + bx 来表示,这个方程称为回归方程。
这里之所以用而不用y,是因为(x,y) 是实际观测的值,而直线上的点(x, )不一定在实际中会出现,也就是说是估计值。
线性回归的目的就是去确定回归方程中的系数a 和b,这些系数称为回归系数。
确定回归系数通常利用最小二乘法原理,即满足最佳拟合要求的回归直线应当使得该直线与所有散点在纵坐标上的总偏差(如上图,这个偏差就是估计值和观测值间的差异,也就是误差)达到最小,下面是用最小二乘法求回归系数的推导过程。
一个点到直线的沿y 轴方向的距离可以表示为:所有点到直线的沿y 轴方向的离差平方和为:由于Q 是 a 和 b 的函数,要使它最小,在数学上采用求偏导并令导数为0 的办法来求解系数a 和b:有困难阅读上面推导的读者只需记住上面推导的结果:①对于中间数据用从这一结果我们看到回归系数 b 与两变量间的相关系数r 有一定的关系,因为、,所以。
②对于原始数据用【例1】根据下面10 对数据,建立心理量(Y)与物理量(X)之间的回归方程,表中物理量是取对数后的值。
解:将表中计算的中间结果代入公式有:因此,回归方程为= 1.95 + 0.81x,有了这个方程,假设又有一个新物理量x = 4.5,可以将它代入方程,求得对应心理量的可能取值为= 1.95 + 0.81×4.5 = 5.6,当然实际当中同一个物理量,对于不同被试或者对同一被试不同时刻进行施测所得到的心理量y 是不同的,根据这里的回归方程所得的只是所有可能y 值的一个平均估计。
第二节一元回归分析过程根据样本数据计算回归方程中的系数是回归分析的第一步。
然而,得出的回归方程是否真正反映两个变量之间的线性关系,用它来预测或估计的有效程度如何,是应用回归方程时首先要解决的问题,因此建立回归方程之后,还要对回归方程进行检验和评价。
对回归方程的检验就是判断方程是否有意义,即变量之间是否存在那样的线性关系,包括两个方面:一个是从总体上对方程进行方差分析,看整个方程是否有意义;另一方面是对每个自变量前的回归系数(b)进行检验,看它是否与0 有显著的差异,与0 有显著差异的系数所对应的自变量才对方程有贡献。
对回归方程的评价主要用于反映回归效果,即回归方程显著的话,它好到什么程度。
一、回归方程的方差分析在散点图中可见任意一点y 与平均数y 的沿Y 轴的距离均可以分为两个部分:一部分是该点到回归直线的距离,另一部分是直线上对应点到平均数y 的距离,即:因此反映总变异的离均差平方和可以分解成两个部分:记为,其中SSR表示总平方和(总变异)中已被x 与y 的线性关系所说明的那部分,称为回归平方和;SSe是点与回归线差异的平方和,它是回归误差,在最小二乘法中已使它达到最小,一般它为误差平方和或剩余平方和。
只有回归平方和显著地大小误差平方和才能说明回归方程有意义。
因此构造统计检验量F :理论上可以求得SSR的自由度dfR = 自变量的个数;SSe的自由度dfe = dft - dfR = (n-1) - 自变量的个数。
不管是一元还是多元回归都采用上述的方差分析过程。
在一元线性回归中为了便于计算常常采用如下公式:对于第一节所举例子,将有关数据代入上面的公式可得方差分析表:可见该回归方程是显著的,是有意义的,两变量间确实存在线性关系。
二、回归系数的显著性检验在一元线性回归中系数的显著性检验公式如下:其中t 分布的自由为((n-1)-自变量个数)。
对于第一节所举例子,将有关数据代入公式有:SEb = √4.793/48.4 = .315t = 0.81/.315 = 2.57 >t0.05/2(8) = 2.306。
说明回归系数0.81 是显著的,自变量X 对因变量是有显著的影响,这一结果与上面的方差分析结果是一样的。
由于一元回归分析只存在一个自变量,实际上,上述过程只需要检验一次。
方差分析和回归系数检验的效果是等价的(上式t统计量平方后等于方差分析中的F统计量)。
因此只有在多元线性回归中,单独的回归系数检验才有意义。
不过其标准误SEB的计算公式有点差别。
在多元线性回归中,某个回归系数不显著时回归方程可能仍然显著,因为方差分析是对整个方程的显著性检验,而与单独进行的每个回归系数的显著性检验不一定等效。
若某个回归系数不显著,应该将其对应的自变量从方程中剔除,再重新进行回归。
如果初步回归之后有多个回归系数都不显著,应逐个剔除自变量并最终选出那些对因变量有贡献的自变量,这里不再细述。
三、回归效果检验反映回归效果的指标称为决定系数或测定系数,它就是回归平方和占总平方和的比率,这个比值反映了变量y 的变异中有多少是由变量x 的变化引起的,也就是说有多少是可以由x 的变异推测出来,因此它能用来反映回归方程的好坏。
这个比值介于0 与 1 之间,显然这个比值越大回归效果越好。
在一元线性回归中,很容易推得测定系数是两变量相关系数的平方,因此测定系数常常用r2来表示,即。
在多元线性回归中,测定系数的平方根,称为复相关系数,记为ry.1,…,k,它表示因变量y 与k 个自变量组合之间的相关,显然它与两个变量之间的相关系数(称为单相关)有点不一样,单相关中两个变量处于同等地位,而复相关中,这k+1 个变量的地位是不一样,其中一个称为因变量,其它的称为自变量,如果在这k+1 个变量中另外选择一个因变量,则求得的复相关系数是不同的。
多元线形回归简介在回归分析中,如果有两个或两个以上的自变量,就称为多元回归(这里元的含义和多元方差分析中的含义不同)。
事实上,一种现象常常是与多个因素相联系的,由多个自变量的最优组合共同来预测或估计因变量,比只用一个自变量进行预测或估计更有效,更符合实际。
因此多元线性回归比一元线性回归的实用意义更大。
多元线性回归的基本原理和基本计算过程与一元线性回归相同,但由于自变量个数多,计算相当麻烦,一般在实际中应用时都要借助统计软件。
这里只介绍多元线性回归的一些基本问题。
多元线性回归方程表示为:= a + b1X1 + b2X2+ … + b k X k但由于各个自变量的单位可能不一样,比如说一个消费水平的关系式中,工资水平、受教育程度、职业、地区、家庭负担等等因素都会影响到消费水平,而这些影响因素(自变量)的单位显然是不同的,因此自变量前系数的大小并不能说明该因素的重要程度,更简单地来说,同样工资收入,如果用元为单位就比用百元为单位所得的回归系数要小,但是工资水平对消费的影响程度并没有变,所以得想办法将各个自变量化到统一的单位上来。
前面学到的标准分就有这个功能,具体到这里来说,就是将所有变量包括因变量都先转化为标准分,再进行线性回归,此时得到的回归系数就能反映对应自变量的重要程度。
这时的回归方程称为标准回归方程,回归系数称为标准回归系数,表示如下:= β1Z x1+ β2Z x2+ … + βk Z xk注意,由于都化成了标准分,所以就不再有常数项 a 了,因为各自变量都取平均水平时,因变量也应该取平均水平,而平均水平正好对应标准分0 ,当等式两端的变量都取0 时,常数项也就为0 了。
多元回归因为计算非常复杂,所以常借助统计软件进行。
其对所选择自变量能否进入最终的回归方程有严格的判定依据和较复杂的筛选过程,常采用所谓逐步回归的方式。
具体请参见教材有关介绍。
阅读材料回归分析最早是19世纪末期高尔顿(Sir Francis Galton)所发展。
高尔顿是生物统计学派的奠基人,他的表哥达尔文的巨著《物种起源》问世以后,触动他用统计方法研究智力进化问题,统计学上的“相关”和“回归”的概念也是高尔顿第一次使用的。
1855年,他发表了一篇“遗传的身高向平均数方向的回归”文章,分析儿童身高与父母身高之间的关系,发现父母的身高可以预测子女的身高,当父母越高或越矮时,子女的身高会比一般儿童高或矮,他将儿子与父母身高的这种现象拟合出一种线形关系。
但是有趣的是:通过观察他注意到,尽管这是一种拟合较好的线形关系,但仍然存在例外现象:矮个的人的儿子比其父要高,身材较高的父母所生子女的身高将回降到人的平均身高。
换句话说,当父母身高走向极端(或者非常高,或者非常矮)的人的子女,子女的身高不会象父母身高那样极端化,其身高要比父母们的身高更接近平均身高。
高尔顿选用“回归”一词,把这一现象叫做“向平均数方向的回归”(regression toward mediocrity)。
而关于父辈身高与子代身高的具体关系是如何的,高尔顿和他的学生K·Pearson观察了1078对夫妇,以每对夫妇的平均身高作为自变量,取他们的一个成年儿子的身高作为因变量,结果发现两者近乎一条直线,其回归直线方程为:y^=33.73+0.516x ,这种趋势及回归方程表明父母身高每增加一个单位时,其成年儿子的身高平均增加0.516个单位。
这样当然极端值就会向中心靠拢。
第八章记数数据统计法—卡方检验法知识引入在各个研究领域中,有些研究问题只能划分为不同性质的类别,各类别没有量的联系。