2.3.2 两个变量的线性相关 教案1

合集下载

人教版高中必修3(B版)2.3.2两个变量的线性相关教学设计

人教版高中必修3(B版)2.3.2两个变量的线性相关教学设计

人教版高中必修3(B版)2.3.2 两个变量的线性相关教学设计1. 教学目标1.了解什么是两个变量的线性相关。

2.掌握用散点图和回归分析判断两个变量间是否存在线性相关。

3.能够利用Excel进行数据的处理和线性回归模型的建立。

4.能够分析不同变量间的线性相关性并进行实际应用。

2. 教学重点1.掌握用散点图和回归分析判断两个变量间是否存在线性相关。

2.理解和掌握线性回归模型的建立方法。

3.实际应用场景中的变量分析。

3. 教学工具1.教师用PPT进行幻灯片的展示。

2.学生使用Excel进行数据处理。

3.学生使用PPT或者报告进行结果汇报。

4. 教学步骤4.1 引入1.利用课件引入什么是线性相关性,同时列出场景案例。

2.让学生思考实际用途,如何帮助决策。

4.2 教学内容1.通过教学案例和数据,帮助学生发现两个变量之间存在的线性关系,将数据进行散点图的展示。

2.利用线性回归方法求出变量间的关系,并进行解释分析,同时重点帮助学生理解回归线和残差。

3.在Excel中模拟数据,并进行线性回归模型的建立,帮助学生掌握模型参数的估计与推断,同时展示数据处理过程。

4.通过网络或者其他途径获得实际数据,并进行数据处理和线性回归分析,展示关键参数和线性回归模型的评估。

4.3 练习和应用1.让学生利用Excel进行数据录入和线性回归模型的建立,同时进行结果展示。

2.让学生分组,进行数据收集处理和建模,完成案例分析和报告撰写,同时进行展示和交流。

4.4 总结1.整理本次课程的重点知识点,巩固学生的掌握程度。

2.引导学生思考如何将所学知识应用到更广泛的场景中。

5. 教学资源1.教材:人教版高中必修3(B版)2.网络课件和视频资源:参考相关资源如慕课网、Coursera等。

6. 教学评估1.观察学生课前预习和课堂参与状况。

2.课堂能力训练:教师提供练习题目并进行课堂答题,加深学生对所学知识点的理解,同时检验学会程度。

3.课堂小组作业和课外大作业的评估:教师通过查看学生PPT报告和答辩情况进行交流和评估。

【公开课教案】人教A版必修二2.3.2-两个变量的线性相关

【公开课教案】人教A版必修二2.3.2-两个变量的线性相关

2.3.2-两个变量的线性相关一、教学目标1、知识与技能目标:利用散点图判断线性相关关系,了解最小二乘法的思想及2回归方程系数公式的推导过程,利用电子表格求出回归直线的方程并对实际问题进行分析和预测,通过实例加强对回归直线方程含义的理解2 、过程与方法目标:①通过自主探究体会数形结合、类比、及最小二乘法的数学思想方法。

②通过动手操作培养学生观察、分析、比较和归纳能力,引出利用计算机等现代化教学工具的必要性。

3、情感、态度与价值观目标:类比函数的表示方法,使学生理解变量间的相关关系,增强应用回归直线方程对实际问题进行分析和预测的意识。

利用计算机让学生动手操作,合作交流激发学生的学习兴趣。

二、教学重点、难点重点:利用散点图直观认识两个变量之间的线性相关关系,了解最小二乘法的思想并利用此思想借助电子表格求出回归方程。

教学内容的难点:对最小二乘法的数学思想和回归方程的理解教学实施过程中的难点:根据给出的线性回归方程的系数公式建立线性回归方程。

三、教学媒体设计本节课涉及大量数据计算及分析,用传统方法很难突破,故我主要采用电子表格和几何画板,通过学生动手操作、教师动画演示、师生合作交流来突出重点、突破难点。

学生学习效果有明显提高。

四、教学设计(一)、创设情境导入新课1、相关关系的理解师:我们曾经研究过两个变量之间的函数关系:一个自变量对应着唯一的一个函数值,这两者之间是一种确定关系。

生活中的任何两个变量之间是不是只有确定关系呢?让学生举例,教师总结如:生:不是。

师:能否举出反例?比如,年龄与身高。

生:身高与体重生:教师水平与学生成绩。

生:网速与下载文件所需时间师:不妨以教师水平与学生成绩为例,学生成绩与教师水平有关吗?生:有,一般来说,教师水平越高,学生成绩越好师:即“名师出高徒”,名师一定出高徒吗?生:不一定。

师:即学生成绩与教师水平之间存在着某种联系,但又不是必然联系,对于学生成绩与教师水平之间的这种不确定关系,我们称之为相关关系。

2.3.2 两个变量的线性相关

2.3.2 两个变量的线性相关

§2.3.2 两个变量的线性相关一、学习目标:1.通过收集现实问题中两个有关联变量的数据作出散点图,并利用散点图直观认识变量间的相关关系.2.了解最小二乘法的含义,知道最小二乘法的思想,能根据给出的线性回归方程系数公式建立线性回归方程. 3.在两个变量具有线性相关关系时,会在散点图中作出线性回归直线,会用线性回归方程进行预测.二、学习重点与难点:学习重点:回归直线方程的求解方法. 学习难点:回归直线方程的求解方法.三、课堂过程:1.创设情境,揭示课题的点在坐标系内标出,得到散点图.从散点图可以看出.这些点大致分布在通过散点图中心的一条直线的附近.如果散点图中点的分布从整体看大致分布在一条直线的附近,我们称这两个变量之间具有线性相关关系,这条直线叫回归直线.如果能够求出这条回归直线的方程,我们就可以比较清楚的了解热茶销量与气温之间的关系.2.最小二乘法选择怎样的直线近似地表示热茶销量与气温之间的关系? 我们有多种思考方案:(1)选择能反映直线变化的两个点,例如取(4,50),(18,24)这两点的直线; (2)取一条直线,使得位于该直线一侧和另一侧的点的个数基本相同;(3)多取几组点,确定几条直线方程,再分别算出各条直线斜率、截距的平均值,作为所求直线的斜率、截距;怎样的直线最好呢? ------从整体上看,各点与此直线的距离最小.即:用方程为ˆybx a =+的直线拟合散点图中的点,应使得该直线与散点图中的点最接近.那么,怎样衡量直线ˆybx a =+与图中六个点的接近程度呢? 我们将表中给出的自变量x 的六个值带入直线方程,得到相应的六个ˆy 的值: 26,18,13,10,4,b a b a b a b a b a b a +++++-+.这六个值与表中相应的实际值应该越接近越好.所以,我们用类似于估计平均数时的思想,考虑离差的平方和:22222222(,)(2620)(1824)(1334)(1038)(450)(64)12866140382046010172Q a b b a b a b a b a b a b a b a ab b a =+-++-++-++-++-+-+-=++--+(,)Q a b 是直线ˆybx a =+与各散点在垂直方向(纵轴方向)上的距离的平方和,可以用来衡量直线ˆy bx a =+与图中六个点的接近程度,所以,设法取,a b 的值,使(,)Q a b 达到最小值.这种方法叫做最小平方法(又称最小二乘法) .先把a 看作常数,那么Q 是关于b 的二次函数.易知,当140382021286a b -=-⨯时, Q 取得最小值.同理, 把b 看作常数,那么Q 是关于a 的二次函数.当14046012b a -=-时, Q 取得最小值.因此,当14038202128614046012a b b a -⎧=-⎪⎪⨯⎨-⎪=-⎪⎩时,Q 取得最小值,由此解得 1.6477,57.5568b a ≈-≈.所求直线方程为ˆ 1.647757.5568y x =-+.当5x =-时,ˆ66y≈,故当气温为5-0C 时,热茶销量约为66杯. 3.线性回归方程的求解方法一般地,设有n 个观察数据如下:当,a b 使1122n n 取得最小值时,就称ybx a =+为拟合这n 对数据的线性回归方程,该方程所表示的直线称为回归直线.上述式子展开后,是一个关于,a b 的二次多项式,应用配方法,可求出使Q 为最小值时的,a b 的值.即⎪⎪⎪⎩⎪⎪⎪⎨⎧-=--=---=---=--==-=--∑∑∑∑x b y a x n x yx n y x x x y y x x b n i i n i i i n i i n i i i 212111)())((,(*) ∑==n i i x n x 11, ∑==n i i y n y 11 线性回归方程是ˆybx a =+,其中b 是回归方程的斜率,a 是截距.系数 4.求线性回归方程的步骤: (1)计算平均数y x ,;(2)计算i i y x 与的积,求∑i i y x ;(3)计算∑2i x ;(4)将结果代入公式∑∑=---=--=ni in i i i xn xyx n y x b 1221,求b ;(5)用 x b y a -=,求a ; (6)写出回归方程5. 线性回归方程的应用(2)求出回归直线方程 解:(1)散点图(略).(2)表中的数据进行具体计算,列成以下表格故可得到2573075.43.399, 75 .430770002≈⨯-=≈⨯-=ab从而得回归直线方程是^ 4.75257y x=+.6.小结:对一组数据进行线性回归分析时,应先画出其散点图,看其是否呈直线形,再依系数,a b的计算公式,算出,a b.写出回归方程7.课后作业:P92练习.。

教学设计3:2.3.1 变量间的相关关系~ 2.3.2 两个变量的线性相关

教学设计3:2.3.1 变量间的相关关系~ 2.3.2 两个变量的线性相关

2.3.1 变量间的相关关系2.3.2 两个变量的线性相关三维目标1.知识与技能通过收集现实问题中两个有关联变量的数据,认识变量间的相关关系.2.过程与方法明确事物间的相互联系.认识现实生活中变量间除了存在确定的关系外,仍存在大量的非确定性的相关关系,并利用散点图直观体会这种相关关系.3.情感、态度与价值观通过对事物之间相关关系的了解,让学生们认识到现实中任何事物都是相互联系的辩证法思想.重点难点重点:(1)通过收集现实问题中两个有关联变量的数据直观认识变量间的相关关系;(2)利用散点图直观认识两个变量之间的线性关系.难点:(1)变量之间相关关系的理解;(2)作散点图和理解两个变量的正相关和负相关.从现实生活入手,抓住学生们的注意力,引导学生分析得出概念,让学生真正参与到概念的形成过程中来.通过对典型事例的分析,向学生们介绍什么是散点图,并总结出如何从散点图上判断变量之间关系的规律.通过实验让学生们感受散点图的主要形成过程,并由此引出线性相关关系强化本节重点.通过学生讨论、交流,用TI图形计算器展示、对比自己作出的散点图,得出线性相关关系、正负相关关系的概念.教师及时将求线性方程的公式展示出来,通过例题的讲解和训练,进一步加深对散点图和回归方程的理解,突破难点.教学建议结合本节课的教学内容和学生的认知水平,充分发挥教师的主导作用,让学生真正成为教学活动的主体.通过多媒体辅助教学,充分调动学生参与课堂教学的主动性与积极性.本节课宜采用探究式课堂教学模式,即在教学过程中,在教师的启发引导下,以学生独立自主和合作交流为前提,以“散点图”为基本探究内容,以周围世界和生活实际为参照对象,为学生提供充分自由表达、质疑、探究、讨论问题的机会,让学生通过个人、小组、集体等多种解难释疑的尝试活动,通过例题和变式训练进一步巩固本节知识,将自己所学知识应用于对现实生活的深入探讨.让学生在“活动”中学习,在“主动”中发展,在“合作”中增知,在“探究”中创新.知识1变量间的相关关系【问题导思】(1)吸烟可导致肺癌.(2)下表是某小卖部6天卖出热茶的杯数与当天气温的对比表.气温(℃)2518121040杯数183037355054(3)y=x2+5(x∈R).问题1:吸烟一定可以导致肺癌吗?吸烟与患肺癌有关吗?提示:吸烟不一定患肺癌,但它们有一定的关系.问题2:小卖部中卖出的热茶杯数与当天气温有关吗?两者之间是如何变化的?提示:两者间有关系.随着气温的降低卖出的热茶杯数增加.问题3:y=x2+5(x∈R)中,x,y间是什么关系?提示:y与x间是函数关系,是一种确定关系.1.相关关系:不像匀速直线运动中时间与路程的关系那样是完全确定的,而是带有不确定性.2.散点图:将样本中几个数据点(x i,y i)(i=1,2,…,n)描在平面直角坐标系中得到的图形.3.正相关与负相关:散点图中的点散布在从左下角到右上角的区域,对于两个变量的这种相关关系,称它为正相关.若散点图中的点分布在从左上角到右下角的区域内,对于两个变量的这种相关关系,称它为负相关.知识2回归直线方程【问题导思】一台机器由于使用时间较长,生产的零件有一些会有缺陷.按不同转速生产出有缺陷的零件的统计数据如下:1.在平面直角坐标系中作出散点图.【提示】2.从散点图中判断x和y之间是否具有相关关系?【提示】 有.3.若转速为10转/秒,能否预测机器每小时生产缺陷的零件件数?【提示】 可以.根据散点图作出一条直线,求出直线方程后可预测.1.回归直线:如果散点图中点的分布从整体上看大致在一条直线附近,就称这两个变量之间具有线性相关关系,这条直线叫做回归直线.2.回归方程:回归直线对应的方程叫回归直线的方程,简称回归方程. 3.最小二乘法求回归直线时,使得样本数据的点到回归直线的距离的平方和最小的方法叫做最小二乘法.4.求回归方程若两个具有线性相关关系的变量的一组数据为:(x 1,y 1),(x 2,y 2),…,(x n ,y n ),则所求的回归方程为y ∧=b ∧x +a ∧,其中a ∧,b ∧为待定的参数,由最小二乘法得:⎩⎪⎨⎪⎧b ∧=∑i =1n(x i -x ) (y i -y )∑i =1n(x i-x )2=∑i =1nx i y i -n x -y-∑i =1nx 2i -n x -2,a ∧=y -b ∧x .b ∧是回归直线斜率,a ∧是回归直线在y 轴上的截距.某地区的环境条件适合天鹅栖息繁衍,有人经统计发现了一个有趣的现象,如果村庄附近栖 息的天鹅多,那么这个村庄的婴儿出生率也高,天鹅少的地方婴儿的出生率低,于是,他就 得出一个结论:天鹅能够带来孩子.你认为这样得到的结论可靠吗?如何证明这个结论的可 靠性? 推进新课 新知探究 提出问题(1)粮食产量与施肥量有关系吗?“名师出高徒”可以解释为教师的水平越高,学生的水平也越高.教师的水平与学生的水平有什么关系?你能举出更多的描述生活中两个变量的相关关系的成语吗?(2)两个变量间的相关关系是什么?有几种?(3)两个变量间的相关关系的判断.讨论结果:(1)粮食产量与施肥量有关系,一般是在标准范围内,施肥越多,粮食产量越高;教师的水平与学生的水平是相关的,如水滴石穿,三人行必有我师等.我们还可以举出现实生活中存在的许多相关关系的问题.例如:商品销售收入与广告支出经费之间的关系.商品销售收入与广告支出经费有着密切的联系,但商品销售收入不仅与广告支出多少有关,还与商品质量、居民收入等因素有关.粮食产量与施肥量之间的关系.在一定范围内,施肥量越大,粮食产量就越高.但是,施肥量并不是决定粮食产量的唯一因素.因为粮食产量还要受到土壤质量、降雨量、田间管理水平等因素的影响.人体内的脂肪含量与年龄之间的关系.在一定年龄段内,随着年龄的增长,人体内的脂肪含量会增加,但人体内的脂肪含量还与饮食习惯、体育锻炼等有关,可能还与个人的先天体质有关.应当说,对于上述各种问题中的两个变量之间的相关关系,我们都可以根据自己的生活、学习经验作出相应的判断,因为“经验当中有规律”.但是,不管你的经验多么丰富,如果只凭经验办事,还是很容易出错的.因此,在分析两个变量之间的相关关系时,我们需要一些有说服力的方法.在寻找变量之间相关关系的过程中,统计同样发挥着非常重要的作用.因为上面提到的这种关系,并不像匀速直线运动中时间与路程的关系那样是完全确定的,而是带有不确定性.这就需要通过收集大量的数据(有时通过调查,有时通过实验),在对数据进行统计分析的基础上,发现其中的规律,才能对它们之间的关系作出判断.(2)相关关系的概念:自变量取值一定时,因变量的取值带有一定随机性的两个变量之间的关系,叫做相关关系.两个变量之间的关系分两类:①确定性的函数关系,例如我们以前学习过的一次函数、二次函数等;②带有随机性的变量间的相关关系,例如“身高者,体重也重”,我们就说身高与体重这两个变量具有相关关系.相关关系是一种非确定性关系.如商品销售收入与广告支出经费之间的关系.(还与商品质量、居民收入、生活环境等有关)(3)两个变量间的相关关系的判断:①散点图.②根据散点图中变量的对应点的离散程度,可以准确地判断两个变量是否具有相关关系.③正相关、负相关的概念.①教学散点图出示例题:在一次对人体脂肪含量和年龄关系的研究中,研究人员获得了一组样本数据:分析数据:大体上来看,随着年龄的增加,人体中脂肪的百分比也在增加.我们可以作散点图来进一步分析.②散点图的概念:将各数据在平面直角坐标系中的对应点画出来,得到表示两个变量的一组数据的图形,这样的图形叫做散点图,如下图.从散点图我们可以看出,年龄越大,体内脂肪含量越高.图中点的趋势表明两个变量之间确实存在一定的关系,这个图支持了我们从数据表中得出的结论.(a.如果所有的样本点都落在某一函数曲线上,就用该函数来描述变量之间的关系,即变量之间具有函数关系.b.如果所有的样本点都落在某一函数曲线附近,变量之间就有相关关系.c.如果所有的样本点都落在某一直线附近,变量之间就有线性相关关系)③正相关与负相关的概念:如果散点图中的点散布在从左下角到右上角的区域内,称为正相关.如果散点图中的点散布在从左上角到右下角的区域内,称为负相关.(注:散点图的点如果几乎没有什么规则,则这两个变量之间不具有相关关系)类型1线性相关关系的判断例1(1)下列关系中,属于相关关系的是________①正方形的边长与面积之间的关系;②农作物的产量与施肥量之间的关系;③人的身高与年龄之间的关系;④降雪量与交通事故的发生率之间的关系.(2)某个男孩的年龄与身高的统计数据如下表所示.年龄(岁)x123456身高(cm)y788798108115120①画出散点图;②判断y与x是否具有线性相关关系.(1)【解析】在①中,正方形的边长与面积之间的关系是函数关系;在②中,农作物的产量与施肥量之间不具有严格的函数关系,但具有相关关系;在③中,人的身高与年龄之间的关系既不是函数关系,也不是相关关系,因为人的年龄达到一定时期身高就不发生明显变化了,因而它们不具有相关关系;在④中,降雪量与交通事故的发生率之间具有相关关系.【答案】(1)②④(2)解①散点图如下图所示.②由图知,所有数据点接近一条直线排列,因此,认为y与x有线性相关关系.类题通法两个变量是否相关的两种判断方法(1)根据实际经验:借助积累的经验进行分析判断.(2)利用散点图:通过散点图,观察它们的分布是否存在一定的规律,直观地进行判断.活学活用如下图所示的两个变量不具有相关关系的有________.【解析】①是确定的函数关系;②中的点大都分布在一条曲线周围;③中的点大都分布在一条直线周围;④中点的分布没有任何规律可言,x,y不具有相关关系.【答案】①④类型2求回归直线方程例2某连锁经营公司所属5个零售店某月的销售额和利润额资料如下表:商店名称 A B C D E 销售额(x )/千万元 3 5 6 7 9 利润额(y )/百万元23345(1)画出销售额和利润额的散点图;(2)若销售额和利润额具有相关关系,计算利润额y 对销售额x 的回归直线方程. 解 (1)散点图如下:(2)数据如下表:i x i y i x 2i x i y i 1 3 2 9 6 2 5 3 25 15 3 6 3 36 18 4 7 4 49 285 9 5 81 45 合计3017200112可以求得b ^=0.5,a ^=0.4, 线性回归方程为y ^=0.5x +0.4. 类题通法求线性回归方程的步骤(1)计算平均数x ,y . (2)计算x i 与y i 的积,求1ni ii x y=∑(3)计算(4)将结果代入公式,求b ^. (5)用a ^=y -b ^x ,求a ^. (6)写出回归方程. 活学活用已知变量x ,y 有如下对应数据:x123421nii x=∑y1 3 4 5(1)作出散点图;(2)用最小二乘法求关于x ,y 的回归直线方程. 解 (1)散点图如下图所示.(2)x =1+2+3+44=52,y =1+3+4+54=134, 41ii x=∑y i =1+6+12+20=39.=1+4+9+16=30,b ^=39-4×52×13430-4×(52)2=1310,a ^=134-1310×52=0,所以y ^=1310x 为所求回归直线方程.类型3利用回归方程对总体进行估计例3 一台机器由于使用时间较长,但还可以使用,它按不同的转速生产出来的某机器零件有一些会有缺点,每小时生产有缺点零件的多少随机器运转的速度而变化,下表是抽样试验结果:转速x (转/秒)(x ∈N *) 16 14 12 8 每小时生产有缺点的零件数y (件)11985(1)如果y 与x 具有线性相关关系,求回归方程;(2)若实际生产中,允许每小时的产品中有缺点的零件数最多为10个,那么机器的转速应该控制在什么范围内?解 (1)由题意,可得x =12.5,y =8.25,41ii x=∑y i =438,∑i =1nx 2i =660,41ii x=∑则b ^=438-4×12.5×8.25660-4×12.52≈0.728 6,a ^=y -b ^x =-0.857 5. 所以回归直线的方程为y ^=0.728 6x -0.857 5. (2)要使y ≤10,则0.728 6x -0.857 5≤10,解得x ≤14.90.所以机器的转速应该控制在15转/秒以下. 类题通法回归分析的三个步骤(1)进行相关性检验,若两变量无线性相关关系,则所求的线性回归方程毫无意义. (2)求回归直线方程,其关键是正确地求得a ^,b ^. (3)根据直线方程进行预测. 活学活用假设关于某设备的使用年限x (年)和所支出的维修费用y (万元),有如下的统计资料:使用年限x 2 3 4 5 6 维修费用y2.23.85.56.57.0由资料可知y 与x 具有相关关系. (1)求回归方程y ^=b ^x +a ^的回归系数a ^,b ^; (2)估计使用年限为10年时维修费用是多少.解 (1)先把数据列成表.序号 1 2 3 4 5 x i 2 3 4 5 6 20 y i 2.2 3.8 5.5 6.5 7.0 25 x i y i 4.4 11.4 22.0 32.5 42.0 112.3 x 2i4916253690由表可知x =4,y =5,由公式可得: b ^=112.3-5×4×590-5×42=12.310=1.23,a ^=y -b ^x =5-1.23×4=0.08. (2)由(1)可知回归方程是y ^=1.23x +0.08,∴当x =10时,y ^=1.23×10+0.08=12.3+0.08=12.38(万元). 故估计使用年限为10年时,维修费用是12.38万元.线性相关关系的判断及回归方程的应用典例 下表提供了某厂节能降耗技术改造后生产甲产品过程中记录的产量x (吨)与相应的生产能耗y (吨标准煤)的几组对照数据:x 3 4 5 6 y2.5344.5(1)请画出上表数据的散点图;(2)请根据上表供的数据,用最小二乘法求出y 关于x 的线性回归方程y ^=b ^x +a ^; (3)已知该厂技改前100吨甲产品的生产能耗为90吨标准煤.试根据(2)求出的线性回归方程,预测生产100吨甲产品的生产能耗比技改前降低多少吨标准煤?解 (1)散点图,如图所示.(2)由题意,得∑i =1nx i y i =3×2.5+4×3+5×4+6×4.5=66.5,x =3+4+5+64=4.5,y =2.5+3+4+4.54=3.5, ∑i =1nx 2i =32+42+52+62=86, ∴b ^=66.5-4×4.5×3.586-4×4.52=66.5-6386-81=0.7, a ^=y -b ^x =3.5-0.7×4.5=0.35, 故线性回归方程为y ^=0.7x +0.35.(3)根据回归方程预测,现在生产100吨产品消耗的标准煤的数量为0.7×100+0.35=70.35, 故耗能约减少了90-70.35=19.65(吨标准煤).类题通法解答回归分析问题的四个注意点 (1)先用散点图确定是否线性相关; (2)准确计算回归方程中的各个系数; (3)回归直线必过样本中心;(4)利用回归直线方程求出的值只是估计值,会与实际值有一定的误差. 活学活用某个体服装店经营某种服装在某周内所获纯利y (元)与该周每天销售这种服装的件数x (件)之间有一组数据如下表:每天销售服装件数x (件) 3 4 5 6 7 8 9 该周内所获纯利y (元) 66697381899091(1)求x ,y ;(2)若纯利y 与每天销售这种服装的件数x 之间是线性相关的,求回归直线方程; (3)若该店每周至少要获纯利200元,请你预测该店每天至少要销售这种服装多少件? (以下数据供选择:721ii x =∑=280,721ii y =∑=45 309,71i i i x y =∑=3 487)解 (1)x =3+4+5+6+7+8+97=6,y =66+69+73+81+89+90+917≈79.86.(2)∵b ^=3 487-7×6×79.86280-7×62≈4.75,a ^=79.86-4.75×6=51.36,∴纯利与每天销售件数x 之间的回归直线方程为y ^=51.36+4.75x . (3)当y ^=200时,200=4.75x +51.36,所以x ≈31.29.因此若该店每周至少要获纯利200元,则该店每天至少要销售这种服装32件.思维启迪1.在研究两个变量是否存在某种关系时,必须从散点图入手,对于散点图,可以做出如下判断:(1)如果所有的样本点都落在某一函数曲线上,那么就用该函数来描述变量之间的关系,即变量之间具有函数关系;(2)如果所有的样本点都落在某一函数曲线附近,那么变量之间具有相关关系; (3)如果所有的样本点都落在某一直线附近,那么变量之间具有线性相关关系.2.利用散点图判断两个变量之间是否具有线性相关关系,体现了数形结合思想的作用,而用回归直线方程进行估计又体现了函数与方程思想的应用.课堂小结1.判断变量之间有无相关关系,一种简便可行的方法就是绘制散点图.根据散点图,可以很容易看出两个变量是否具有相关关系,是否线性相关,是正相关还是负相关. 2.求回归直线方程时应注意的问题(1)知道x 与y 呈线性相关关系,无需进行相关性检验,否则应首先进行相关性检验,如果两个变量之间本身不具有相关关系,或者说,它们之间的相关关系不显著,即使求出回归方程也是毫无意义的,而且用其估计和预测的量也是不可信的.(2)用公式计算a ∧,b ∧的值时,要先算出b ∧,然后才能算出a ∧.3.利用回归方程,我们可以进行估计和预测.若回归直线方程为y ∧=b ∧x +a ∧,则x =x 0处的估计值为y ∧0=b ∧x 0+a ∧.由于回归直线将部分观测值所反映的规律进行了延伸,所以它在情况预报、资料补充等方面有着广泛的应用.当堂检测1.下列命题正确的是( )①任何两个变量都具有相关关系; ②圆的周长与该圆的半径具有相关关系;③某商品的需求量与该商品的价格是一种非确定性关系; ④根据散点图求得的回归直线方程可能是没有意义的;⑤两个变量间的相关关系可以通过回归直线,把非确定性问题转化为确定性问题进行研究.A .①③④B .②③④C .③④⑤D .②④⑤【解析】①显然不对,②是函数关系,③④⑤正确. 【答案】C2.对变量x ,y 有观测数据(x i ,y i )(i =1,2,…,10),得散点图图1;对变量u ,v 有观测数据(u i ,v i )(i =1,2,…,10),得散点图图2.由这两个散点图可以判断( )A .变量x 与y 正相关,u 与v 正相关B .变量x 与y 正相关,u 与v 负相关C .变量x 与y 负相关,u 与v 正相关D .变量x 与y 负相关,u 与v 负相关【解析】由这两个散点图可以判断,变量x 与y 负相关,u 与v 正相关. 【答案】C3.若施肥量x (kg)与水稻产量y (kg)的线性回归方程为y ^=5x +250,当施肥量为80 kg 时,预计水稻产量约为________kg.【解析】把x =80 kg 代入回归方程可得其预测值y ^=5×80+250=650(kg). 【答案】6504.对具有线性相关关系的变量x 和y ,测得一组数据如下表所示.x 2 4 5 6 8 y3040605070若已求得它们的回归直线的斜率为6.5,这条回归直线的方程为________. 【解析】由题意可知x =2+4+5+6+85=5,y =30+40+60+50+705=50.即样本中心为(5,50)设回归直线方程为y ^=6.5x +b ^, ∵回归直线过样本中心(x ,y ), ∴50=6.5×5+b ^,即b ^=17.5, ∴回归直线方程为y ^=6.5x +17.5 【答案】y ^=6.5x +17.55.2013年元旦前夕,某市统计局统计了该市2012年10户家庭的年收入和年饮食支出的统计资料如下表:年收入 x (万元) 24466677810年饮食支 出y (万元)0.9 1.4 1.6 2.0 2.1 1.9 1.8 2.1 2.2 2.3(1)如果已知y 与x 是线性相关的,求回归方程; (2)若某家庭年收入为9万元,预测其年饮食支出. (参考数据:101i i i x y =∑=117.7,1021i i x =∑=406)解 依题意可计算得:x =6,y =1.83,x 2=36,x y =10.98, 又∵101i i i x y =∑=117.7,1021i i x =∑=406,∴b ^=101102211010i ix yi ixi x yx--=-=--∑∑≈0.17,a ^=y -b ^x =0.81, ∴y ^=0.17x +0.81.∴所求的回归方程为y ^=0.17x +0.81.(2)当x =9时,y ^=0.17×9+0.81=2.34(万元).可估计大多数年收入为9万元的家庭每年饮食支出约为2.34万元.。

教学设计1:2.3.2两个变量的线性相关

教学设计1:2.3.2两个变量的线性相关

课题:§2.3.2 两个变量的线性相关整体设计教学分析变量之间的关系是人们感兴趣的问题.教科书通过思考栏目“物理成绩与数学成绩之间的关系”,引导学生考察变量之间的关系.在教师的引导下,可使学生认识到在现实世界中存在不能用函数模型描述的变量关系,从而体会研究变量之间的相关关系的重要性.随后,通过探究人体脂肪百分比和年龄之间的关系,引入描述两个变量之间关系的线性回归方程(模型).教科书在探索用多种方法确定线性回归直线的过程中,向学生展示创造性思维的过程,帮助学生理解最小二乘法的思想.通过气温与饮料销售量的例子及随后的思考,使学生了解利用线性回归方程解决实际问题的全过程,体会线性回归方程作出的预测结果的随机性,并且可能犯的错误.进一步,教师可以利用计算机模拟和多媒体技术,直观形象地展示预测结果的随机性和规律性.三维目标1.通过收集现实问题中两个有关联变量的数据认识变量间的相关关系.2.明确事物间的相互联系.认识现实生活中变量间除了存在确定的关系外,仍存在大量的非确定性的相关关系,并利用散点图直观体会这种相关关系.3.经历用不同估算方法描述两个变量线性相关的过程.知道最小二乘法的思想,能根据给出的线性回归方程的系数公式建立线性回归方程.重点难点教学重点:通过收集现实问题中两个有关联变量的数据直观认识变量间的相关关系;利用散点图直观认识两个变量之间的线性关系;根据给出的线性回归方程的系数公式建立线性回归方程.教学难点:变量之间相关关系的理解;作散点图和理解两个变量的正相关和负相关;理解最小二乘法的思想.课时安排2课时教学过程第1课时导入新课思路1在学校里,老师对学生经常这样说:“如果你的数学成绩好,那么你的物理学习就不会有什么大问题.”按照这种说法,似乎学生的物理成绩与数学成绩之间存在着一种相关关系.这种说法有没有根据呢?请同学们如实填写下表(在空格中打“√” ):学生讨论:我们可以发现自己的数学成绩和物理成绩存在某种关系.(似乎就是数学好的,物理也好;数学差的,物理也差,但又不全对.)物理成绩和数学成绩是两个变量,从经验看,由于物理学习要用到比较多的数学知识和数学方法.数学成绩的高低对物理成绩的高低是有一定影响的.但决非唯一因素,还有其他因素,如是否喜欢物理,用在物理学习上的时间等等.(总结:不能通过一个人的数学成绩是多少就准确地断定他的物理成绩能达到多少.但这两个变量是有一定关系的,它们之间是一种不确定性的关系.如何通过数学成绩的结果对物理成绩进行合理估计有非常重要的现实意义.)为很好地说明上述问题,我们开始学习变量之间的相关关系和两个变量的线性相关.(教师板书课题)思路2某地区的环境条件适合天鹅栖息繁衍,有人经统计发现了一个有趣的现象,如果村庄附近栖息的天鹅多,那么这个村庄的婴儿出生率也高,天鹅少的地方婴儿的出生率低,于是,他就得出一个结论:天鹅能够带来孩子.你认为这样得到的结论可靠吗?如何证明这个结论的可靠性?推进新课新知探究提出问题(1)粮食产量与施肥量有关系吗?“名师出高徒”可以解释为教师的水平越高,学生的水平也越高.教师的水平与学生的水平有什么关系?你能举出更多的描述生活中两个变量的相关关系的成语吗?(2)两个变量间的相关关系是什么?有几种?(3)两个变量间的相关关系的判断.讨论结果:(1)粮食产量与施肥量有关系,一般是在标准范围内,施肥越多,粮食产量越高;教师的水平与学生的水平是相关的,如水滴石穿,三人行必有我师等.我们还可以举出现实生活中存在的许多相关关系的问题.例如:商品销售收入与广告支出经费之间的关系.商品销售收入与广告支出经费有着密切的联系,但商品销售收入不仅与广告支出多少有关,还与商品质量、居民收入等因素有关.粮食产量与施肥量之间的关系.在一定范围内,施肥量越大,粮食产量就越高.但是,施肥量并不是决定粮食产量的唯一因素.因为粮食产量还要受到土壤质量、降雨量、田间管理水平等因素的影响.人体内的脂肪含量与年龄之间的关系.在一定年龄段内,随着年龄的增长,人体内的脂肪含量会增加,但人体内的脂肪含量还与饮食习惯、体育锻炼等有关,可能还与个人的先天体质有关.应当说,对于上述各种问题中的两个变量之间的相关关系,我们都可以根据自己的生活、学习经验作出相应的判断,因为“经验当中有规律”.但是,不管你的经验多么丰富,如果只凭经验办事,还是很容易出错的.因此,在分析两个变量之间的相关关系时,我们需要一些有说服力的方法.在寻找变量之间相关关系的过程中,统计同样发挥着非常重要的作用.因为上面提到的这种关系,并不像匀速直线运动中时间与路程的关系那样是完全确定的,而是带有不确定性.这就需要通过收集大量的数据(有时通过调查,有时通过实验),在对数据进行统计分析的基础上,发现其中的规律,才能对它们之间的关系作出判断.(2)相关关系的概念:自变量取值一定时,因变量的取值带有一定随机性的两个变量之间的关系,叫做相关关系.两个变量之间的关系分两类:①确定性的函数关系,例如我们以前学习过的一次函数、二次函数等;②带有随机性的变量间的相关关系,例如“身高者,体重也重”,我们就说身高与体重这两个变量具有相关关系.相关关系是一种非确定性关系.如商品销售收入与广告支出经费之间的关系.(还与商品质量、居民收入、生活环境等有关)(3)两个变量间的相关关系的判断:①散点图.②根据散点图中变量的对应点的离散程度,可以准确地判断两个变量是否具有相关关系.③正相关、负相关的概念.①教学散点图出示例题:在一次对人体脂肪含量和年龄关系的研究中,研究人员获得了一组样本数据:年龄23 27 38 41 45 49 50脂肪9.5 17.8 21.2 25.9 27.5 26.3 28.2 年龄53 54 56 57 58 60 61脂肪29.6 30.2 31.4 30.8 33.5 35.2 34.6 分析数据:大体上来看,随着年龄的增加,人体中脂肪的百分比也在增加.我们可以作散点图来进一步分析.②散点图的概念:将各数据在平面直角坐标系中的对应点画出来,得到表示两个变量的一组数据的图形,这样的图形叫做散点图,如下图.从散点图我们可以看出,年龄越大,体内脂肪含量越高.图中点的趋势表明两个变量之间确实存在一定的关系,这个图支持了我们从数据表中得出的结论.(a.如果所有的样本点都落在某一函数曲线上,就用该函数来描述变量之间的关系,即变量之间具有函数关系.b.如果所有的样本点都落在某一函数曲线附近,变量之间就有相关关系.c.如果所有的样本点都落在某一直线附近,变量之间就有线性相关关系)③正相关与负相关的概念:如果散点图中的点散布在从左下角到右上角的区域内,称为正相关.如果散点图中的点散布在从左上角到右下角的区域内,称为负相关.(注:散点图的点如果几乎没有什么规则,则这两个变量之间不具有相关关系)应用示例思路1例1 下列关系中,带有随机性相关关系的是_____________.①正方形的边长与面积之间的关系②水稻产量与施肥量之间的关系③人的身高与年龄之间的关系④降雪量与交通事故的发生率之间的关系【解析】两变量之间的关系有两种:函数关系与带有随机性的相关关系.①正方形的边长与面积之间的关系是函数关系.②水稻产量与施肥量之间的关系不是严格的函数关系,但是具有相关性,因而是相关关系.③人的身高与年龄之间的关系既不是函数关系,也不是相关关系,因为人的年龄达到一定时期身高就不发生明显变化了,因而他们不具备相关关系.④降雪量与交通事故的发生率之间具有相关关系,因此填②④.【答案】②④例2 有关法律规定,香烟盒上必须印上“吸烟有害健康”的警示语.吸烟是否一定会引起健康问题?你认为“健康问题不一定是由吸烟引起的,所以可以吸烟”的说法对吗?分析:学生思考,然后讨论交流,教师及时评价.解:从已经掌握的知识来看,吸烟会损害身体的健康,但是除了吸烟之外,还有许多其他的随机因素影响身体健康,人体健康是很多因素共同作用的结果.我们可以找到长寿的吸烟者,也更容易发现由于吸烟而引发的患病者,所以吸烟不一定引起健康问题.但吸烟引起健康问题的可能性大.因此“健康问题不一定是由吸烟引起的,所以可以吸烟”的说法是不对的.点评:在探究研究的过程中,如果能够从两个变量的观察数据之间发现相关关系是极为有意义的,由此可以进一步研究二者之间是否蕴涵因果关系,从而发现引起这种相关关系的本质原因是什么.本题的意义在于引导学生重视对统计结果的解释,从中发现进一步研究的问题.思路2例1 有时候,一些东西吃起来口味越好,对我们的身体越有害.下表给出了不同类型的某种食品的数据.第二列表示此种食品所含热量的百分比,第三列数据表示由一些美食家以百分制给出的对此种食品口味的评价:J 13 52(1)作出这些数据的散点图.(2)关于两个变量之间的关系,你能得出什么结论?解:(1)散点图如下:(2)基本成正相关关系,即食品所含热量越高,口味越好.例2 案例分析:一般说来,一个人的身高越高,他的右手一拃长就越长,因此,人的身高与右手一拃长之间存在着一定的关系.为了对这个问题进行调查,我们收集了北京市某中学2003年高三年级96名学生的身高与右手一拃长的数据如下表.性别身高/cm 右手一拃长/cm 性别身高/cm 右手一拃长/cm 女152 18.5 女153 16.0女156 16.0 女157 20.0女158 17.3 女159 20.0女160 15.0 女160 16.0女160 17.5 女160 17.5女160 19.0 女160 19.0女160 19.0 女160 19.5女161 16.1 女161 18.0女162 18.2 女162 18.5女163 20.0 女163 21.5女164 17.0 女164 18.5女164 19.0 女164 20.0女165 15.0 女165 16.0男180 22.5 男181 21.1男181 21.5 男181 23.0男182 18.5 男182 21.5男182 24.0 男183 21.2男185 25.0 男186 22.0男191 21.0 男191 23.0 (1)根据上表中的数据,制成散点图.你能从散点图中发现身高与右手一拃长之间的近似关系吗?(2)如果近似成线性关系,请画出一条直线来近似地表示这种线性关系.(3)如果一个学生的身高是188 cm,你能估计他的一拃大概有多长吗?解:根据上表中的数据,制成的散点图如下.从散点图上可以发现,身高与右手一拃长之间的总体趋势是成一直线,也就是说,它们之间是线性相关的.那么,怎样确定这条直线呢?同学1:选择能反映直线变化的两个点,例如(153,16),(191,23)两点确定一条直线.同学2:在图中放上一根细绳,使得上面和下面点的个数相同或基本相同.同学3:多取几组点对,确定几条直线方程.再分别算出各个直线方程斜率、截距的算术平均值,作为所求直线的斜率、截距.同学4:从左端点开始,取两条直线,如下图.再取这两条直线的“中间位置”作一条直线.同学5:先求出相同身高同学右手一拃长的平均值,画出散点图,如下图,再画出近似的直线,使得在直线两侧的点数尽可能一样多.同学6:先将所有的点分成两部分,一部分是身高在170 cm以下的,一部分是身高在170 cm 以上的;然后,每部分的点求一个“平均点”——身高的平均值作为平均身高、右手一拃的平均值作为平均右手一拃长,即(164,19),(177,21);最后,将这两点连接成一条直线.同学7:先将所有的点按从小到大的顺序进行排列,尽可能地平均分成三等份;每部分的点按照同学3的方法求一个“平均点”,最小的点为(161.3,18.2),中间的点为(170.5,20.1),最大的点为(179.2,21.3).求出这三个点的“平均点”为(170.3,19.9).我再用直尺连接最大点与最小点,然后平行地推,画出过点(170.3,19.9)的直线.同学8:取一条直线,使得在它附近的点比较多.在这里需要强调的是,身高和右手一拃长之间没有函数关系.我们得到的直线方程,只是对其变化趋势的一个近似描述.对一个给定身高的人,人们可以用这个方程来估计这个人的右手一拃长,这是十分有意义的.知能训练一个车间为了规定工时定额,需要确定加工零件所花费的时间,为此进行了10次试验,收集数据如下:零件数x(个)10 20 30 40 50 60 70 80 90 100 加工时间y(min) 62 68 75 81 89 95 102 108 115 122 画出散点图;关于加工零件的个数与加工时间,你能得出什么结论?【答案】(1)散点图如下:(2)加工零件的个数与所花费的时间呈正线性相关关系.拓展提升以下是某地搜集到的新房屋的销售价格y和房屋的面积x的数据:房屋面积(m2)115 110 80 135 105销售价格(万元)24.8 21.6 18.4 29.2 22 (1)画出数据对应的散点图;(2)指出是正相关还是负相关;(3)关于销售价格y和房屋的面积x,你能得出什么结论?解:(1)数据对应的散点图如下图所示:(2)散点图中的点散分布在从左下角到右上角的区域内,所以是正相关.(3)关于销售价格y和房屋的面积x,房屋的面积越大,价格越高,它们呈正线性相关的关系. 课堂小结通过收集现实问题中两个有关联变量的数据作出散点图,并利用散点图直观认识变量间的相关关系.作业习题2.3A组3、4(1).设计感想本节课学习了变量之间的相关关系和两个变量的线性相关的部分内容,通过身边的具体实例说明了两个变量的相关关系,并学会了利用散点图及其分布来说明两个变量的相关关系的种类,为下一节课作了铺垫,思路1和思路2的例题对知识进行了巩固和加强,另外,本节课通过选取一些学生特别关心的身边事例,对学生进行思想情操教育、意志教育和增强学生的自信心,养成良好的学习态度和学习方法,树立时间观,培养勤奋、刻苦耐劳的精神.。

人教版数学高一教学设计2.3.2两个变量的线性相关

人教版数学高一教学设计2.3.2两个变量的线性相关

2.3.2 两个变量的线性相关一、教学目标1.通过实例引入线性回归模型,感受产生随机误差的原因;2.通过对回归模型的合理性等问题的研究,渗透线性回归分析的思想和方法; 3.能求出简单实际问题的线性回归方程。

二、教学重点,难点线性回归模型的建立和线性回归系数的最佳估计值的探求方法。

三、教学过程探究一:求线形回归方程例1:下表提供了某厂节能降耗技术改造后生产甲产品过程中记录的产量x (吨)与相应的生产能耗y (吨标准煤)的几组对照数据x3 4 5 6 y2.5344.5(1)请画出上表数据的散点图;(2)请根据上表提供的数据,用最小二乘法求出y 关于x 的线性回归方程a x b yˆˆˆ+=; (3)已知该厂技改前100吨甲产品的生产能耗为90吨标准煤.试根据(2)求出的线性回归方程,预测生产100吨甲产品的生产能耗比技改前降低多少吨标准煤? (参考数值:3×2.5+4×3+5×4+6×4.5=66.5) 解(1)略。

由学生自己完成。

(2)由对照数据,计算得:5.6641=∑=ii i yx 8665432222412=+++=∑=i ix5.4=x ,7.05.44865.35.445.66ˆ2=⨯-⨯⨯-=b; 35.05.47.05.3ˆˆ=⨯-=-=x b y a所求的回归方程为35.07.0+=x y(3) 当100=x , 35.7035.07.0100=+⨯=y 吨,预测生产100吨甲产品的生产能耗比技改前降低9070.3519.65-=(吨)反思:讨论:这些点并不都在同一条直线上,上述直线并不能精确地反映x与y之间的关系,y的值不能由x完全确定,它们之间是统计相关关系,y的实际值与估计值之间存在着误差.对于上述问题,设有n对观测数据()),,3,2,1(,niyxii⋅⋅⋅=,根据线性回归模型,对于每一个ix,对应的随机误差项()iiibxay+-=ε,我们希望总误差越小越好,即要使∑=nii12ε越小越好.所以,只要求出()()21,∑=--=niiixyQαββα取得最小值时的βα,值作为ba,,的估计值,记为baˆ,ˆ。

2.3.2(2)两个变量的线性相关(教学设计)

2.3.2(2)两个变量的线性相关(教学设计)

2.3变量间的相关关系(2)(教学设计)2.3.2-2两个变量的线性相关——回归直线教学目标:1、知识与技能(1)知道最小二乘法和回归分析的思想;.(2)能根据线性回归方程系数公式建立线性回归方程或根据给出的数据应用图形计算器建立线性回归方程;(3)通过改变同一问题下样本点的选择进而对照回归方程的差异,体会随机思想;(4)利用回归方程预测,体现用“确定关系研究相关关系”的回归思想.2、过程与方法发现随机变量存在规律,经历用不同估算方法描述两个变量线性相关关系和线性回归分析过程,借助图形计算器得出回归直线,在以上过程中体会随机思想,增强应用数学知识和信息技术解决实际问题的意识.3、情感与价值观通过合作学习,养成倾听别人意见和建议的良好习惯.教学重点、难点:重点:(1)知道最小二乘法和回归分析的思想;(2)能根据给出的线性回归方程的系数公式建立线性回归方程.难点:(1)用数学符号刻画出“从整体上看,各点与此直线上的点的偏差”的表达方式;(2)建立回归思想.教学过程:(一)创设情景、导入课题1、相关关系的概念;2、相关关系与函数关系的异同点:;3、在平面直角坐标系中,表示具有相关关系的两个变量的一组数据图形,称为散点图;4、成正相关和负相关的两个相关变量的散点图分别有什么特点?5、探究:观察人体的脂肪含量百分比和年龄的样本数据的散点图,这两个相关变量成正相关.我们需要进一步考虑的问题是,当人的年龄增加时,体内脂肪含量到底是以什么方式增加呢?(板书课题)(二)师生互动、新课讲解讨论:有些散点图中的点是杂乱分布的,有些散点图中的点的分布有一定的规律性,年龄和人体脂肪含量的样本数据的散点图中的点的分布有什么特点?(见课本P86)这些点大致分布在一条直线附近.如果散点图中的点的分布,从整体上看大致在一条直线附近,则称这两个变量之间具有线性相关关系,这条直线叫做回归直线.并根据回归方程对总体进行估计.如果能够求出这条回归直线的方程(简称回归方程),那么我们就可以比较清楚地了解年龄与体内脂肪含量的相关性.讨论:1、每个同学画的直线相同吗?2、你认为回归直线有很多条吗?3、你可以求出直线方程吗?大家的建议都有一定的道理,但总让人感到可靠性不强.问题1 回归直线与散点图中各点的位置用数学的方法来刻画应具有怎样的关系? 从整体上看,各点与此直线最接近,距离最小. 问题2你能解释这句话的含义吗?讨论:对一组具有线性相关关系的样本数据:(x 1,y 1),(x 2,y 2),…,(x n ,y n ),设其回归方程为a bx y +=,可以用哪些数量关系来刻画各样本点与回归直线的接近程度?我们可以用点(x i ,y i )与这条直线上横坐标为x i 的点之间的距离来刻画点(x i ,y i )到直线的远近.()),,3,2,1(n i a bx y i i =+-为了从整体上反映n 个样本数据与回归直线的接近程度,你认为选用哪个数量关系来刻画比较合适? 用这n 个距离之和来刻画各点到直线的“整体距离”是比较合适的,即可以用()∑=+-ni iia bx y 1表示各点到直线a bx y +=的“整体距离”.由于绝对值使得计算不方便,在实际应用中人们更喜欢用()()()2222211a bx y a bx y a bx y Q n n --++--+--=这样,问题就归结为:当a ,b 取什么值时Q 最小?即点到直线a bx y +=的“整体距离”最小.这样通过求此式的最小值而得到回归直线的方法,即使得一半数据的点到回归直线的距离的平方和最小的方法叫做最小二乘法.根据有关数学原理推导,a ,b 的值由下列公式给出()()()∑∑∑∑--=---====221121xn xy x n yx xxyy x xb ini iini ini i i=x ba-y根据最小二乘法的思想和此公式,利用计算器或计算机可以方便的求得年龄和人体脂肪含量的样本数据的回归方程.以Excel软件为例,用散点图来建立表示人体的脂肪含量与年龄的相关关系的线性回归方程,具体步骤如下:⑴在Excel中选定表示人体的脂肪含量与年龄的相关关系的散点图,在菜单中选定“图表”中的“添加趋势线”选项,弹出“添加趋势线”对话框“.⑵单击“类型”标签,选定“趋势预测/回归分析类型”中的“线性”选项,单击“确定”按钮,得到回归直线.⑶双击回归直线,弹出“趋势线格式”对话框.单击“选项”标签,选定“显示公式”,最后单击“确定”按钮,得到回归直线的回归方程.(三)讲练结合,巩固提高1试一试:将表中的年龄作为x代入上述方程,看看得出的数值与真实数值之间的关系,从中你体会到什么?利用回归直线,我们可以进行预测.类型一线性相关的概念例1以下是某地搜集到的新房屋的销售价格和房屋面积的数据:解散点图如下:由上图可看出,销售价格与房屋面积这两个变量是正相关.反思与感悟如果散点图中点的分布从整体上看大致在一条直线附近,我们就称这两个变量之间具有线性相关关系,呈递增趋势,是正相关;反之为负相关.跟踪训练1一个车间为了规定工时定额,需要确定加工零件所花费的时间,为此进行了10次试验,收集数据如下:(1)(2)关于加工零件的个数与加工时间,你能得出什么结论?解 (1)散点图如下:(2)加工零件的个数与所花费的时间具有正的线性相关关系.类型二 回归方程的求法例2 下表为某地近几年机动车辆数与交通事故数的统计资料.(1) (2)如果具有线性相关关系,求出回归方程.解 (1)在平面直角坐标系中画出数据的散点图,如下图.直观判断散点在一条直线附近,故具有线性相关关系. (2)计算相应的数据之和:∑i =18x i =1 031,∑i =18y i =71.6,∑i =18x 2i =137 835,∑i =18x i y i =9 611.7, x =128.875,y =8.95将它们代入公式计算得b ^≈0.077 4,a ^≈-1.024 9,所以,所求回归方程为y ^=0.077 4x -1.024 9.跟踪训练2 以下是某地搜集到的新房屋的销售价格y 和房屋的面积x 的数据:(1)(2)求回归方程,并在散点图中加上回归直线. 解 (1)数据对应的散点图如图所示:(2)x =15∑i =15x i =109,y =23.2,∑i =15x 2i =60 975,∑i =15x i y i =12 952. 设所求回归方程为y ^=b ^x +a ^,则b ^=∑i =15x i y i -5x y∑i =15x 2i -5x2≈0.196 2,a ^=y -b ^x =23.2-109×0.196 2=1.814 2,故所求回归方程为y ^=0.196 2x +1.814 2. 回归直线如(1)中图所示.类型三 回归方程的应用例3 有一个同学家开了一个小卖部,他为了研究气温对热饮销售的影响,经过统计,得到一个卖出的热饮杯数与当天气温的对比表:(1)(2)从散点图中发现气温与热饮销售杯数之间有什么关系; (3)求回归方程;(4)如果某天的气温是2℃,预测这天卖出的热饮杯数;(5) 气温为2℃时,小卖部一定能够卖出143杯左右热饮吗?为什么? 解 (1)散点图如图所示:(2)从上图看到,各点散布在从左上角到右下角的区域里,因此,气温与热饮销售杯数之间呈负相关,即气温越高,卖出去的热饮杯数越少.(3)从散点图可以看出,这些点大致分布在一条直线的附近,因此,可用公式求出回归方程的系数.利用计算器容易求得回归方程y ^=-2.352x +147.767.(4)当x =2时,y ^=143.063.因此,某天的气温为2℃时,这天大约可以卖出143杯热饮.(5)小卖部不一定能够卖出143杯左右热饮,原因如下:①回归方程中的截距和斜率都是通过样本估计出来的,存在误差,这种误差可以导致预测结果的偏差.②即使截距和斜率的估计没有误差,也不可能百分之百地保证对应于x 的预报值,能够与实际值y 很接近.我们不能保证点(x ,y )落在回归直线上,甚至不能百分之百地保证它落在回归直线的附近. 跟踪训练3 有人统计了同一个省的6个城市某一年的人均国民生产总值(即人均GDP)和这一年各城市患白血病的儿童数,如下表:(1)(2)通过计算可知这两个变量的回归方程为y ^=23.25x +102.15,假如一个城市的人均GDP 为12万元,那么可以断言,这个城市患白血病的儿童一定超过380人,请问这个断言是否正确? 解 (1)散点图如下:根据散点图可以看出,在6个点中,虽然第一个点离这条直线较远,但其余5个点大致分布在这条直线的附近,所以这两个变量具有线性相关关系.(2)上述断言是错误的,将x =12代入y ^=23.25x +102.15得y ^=23.25×12+102.15=381.15>380,但381.15是对该城市人均GDP 为12万元的情况下所作的一个估计,该城市患白血病的儿童可能超过380人,也可能低于380人.参考公式:()()()1122211n ni i i i i i n ni ii i x x y y x y nx y b x x x nx a y bx====⎧---⎪⎪==⎨--⎪⎪=-⎩∑∑∑∑) (四)小结1、求样本数据的线性回归方程的步骤;2、回归方程被样本数据惟一确定,各样本点大致分布在回归直线附近.对同一个总体,不同的样本数据对应不同的回归直线,所以回归直线也具有随机性.3、对一组样本数据,应先作散点图,在具有线性相关关系的前提下再求回归方程.如果一组数据不具有线性相关关系,即不存在回归直线,那么所得的“回归方程”是没有实际意义的. (五)分层作业1.工人月工资(元)依劳动生产率(千元)变化的回归方程为y ^=60+90x ,下列判断正确的是( ) A.劳动生产率为1千元时,工资为50元 B.劳动生产率提高1千元时,工资提高150元 C.劳动生产率提高1千元时,工资约提高90元 D.劳动生产率为1千元时,工资为90元 答案 C解析 因工人月工资依劳动生产率变化的回归方程为y ^=60+90x ,当x 由a 提高到a +1时,y ^2-y ^1=60+90(a +1)-60-90a =90.2.已知x 与y 之间的几组数据如下表:假设根据上表数据所得回归直线方程y ^=b x +a ,若某同学根据上表中的前两组数据(1,0)和(2,2)求得的直线方程为y =b ′x +a ′,则以下结论正确的是( )A.b ^>b ′,a ^>a ′B.b ^>b ′,a ^<a ′C.b ^<b ′,a ^>a ′ D.b ^<b ′,a ^<a ′答案 C解析 b ′=2,a ′=-2,由公式b ^=∑i =16(x i -x )(y i -y )∑i =16(x i -x )2求得,b ^=57,a ^ =y -b ^ x =136-57×72=-13, ∴b ^<b ′,a ^>a ′.选C.3.回归直线方程y ^=b ^x +a ^必过( ) A.点(0,0) B.点(x ,0) C.点(0,y ) D.点(x ,y )答案 D解析 回归直线必过样本点的中心.4.设一个回归方程为y ^=3+1.2x ,则变量x 增加一个单位时( ) A.y 平均增加1.2个单位 B.y 平均增加3个单位 C.y 平均减少1.2个单位 D.y 平均减少3个单位 答案 A解析 回归直线的斜率代表y 随x 的变化率.5.若对某个地区人均工资x 与该地区人均消费y 进行调查统计得y 与x 具有相关关系,且回归方程为y ^=0.7x +2.1(单位:千元),若该地区人均消费水平为10.5,则估计该地区人均消费额占人均工资收入的百分比约为( ) A.70% B.84% C.87.5% D.89.5% 答案 C解析 设该地区人均工资收入为y , 则y =0.7x +2.1,当y =10.5时,x =10.5-2.10.7=12. 10.512×100%=87.5%.6.期中考试后,某校高三(9)班对全班65名学生的成绩进行分析,得到数学成绩y 对总成绩x 的回归方程为y ^=6+0.4x .由此可以估计:若两个同学的总成绩相差50分,则他们的数学成绩相差的分数大约为( ) A.0.4 B.6 C.20 D.50 答案 C解析 令两人的总成绩分别为x 1,x 2. 则对应的数学成绩估计为y ^1=6+0.4x 1,y ^2=6+0.4x 2,所以|y ^1-y ^2|=|0.4(x 1-x 2)|=0.4×50=20.7.对具有线性相关关系的变量x ,y 有一组观测数据(x i ,y i )(i =1,2,…,8),其回归方程是y ^=13x +a ,且x 1+x 2+x 3+…+x 8=2(y 1+y 2+y 3+…+y 8)=6,则实数a 的值是( ) A.116 B.18 C.14 D.12答案 B解析 依题意可知,样本点的中心为(34,38),则38=13×34+a ,解得a =18.8.对于下列表格所示的五个散点,已知求得的线性回归方程为y ^=0.8x -155.则实数m 的值为( ) A.8 B.8.2 C.8.4 D.8.5 答案 A解析 依题意得x =15×(196+197+200+203+204)=200,y =15×(1+3+6+7+m )=17+m 5,因为回归直线必经过样本点中心,所以17+m5=0.8×200-155,解得m =8,选A.9.某工厂生产某种产品的产量x (吨)与相应的生产能耗y (吨标准煤)有如下几组样本数据:0.7,则这组样本数据的回归直线的方程是____________.答案 y ^=0.7x +0.35解析 ∵x =3+4+5+64=4.5,y =2.5+3+4+4.54=3.5, ∴a ^=y -b ^x =3.5-0.7×4.5=0.35.∴回归直线的方程为y ^=0.7x +0.35.10.现有5组数据A (1,3)、B (2,4)、C (4,5)、D (3,10)、E (10,12),去掉________组数据后,剩下的4组数据的线性相关性最大. 答案 D解析 在散点图中,点的分布越接近回归直线,两个变量的相关性越大.11.某数学老师身高176 cm ,他爷爷、父亲和儿子的身高分别是173 cm 、170 cm 和182 cm.因儿子的身高与父亲的身高有关,该老师用线性回归分析的方法预测他孙子的身高为__________cm. 答案 185解析 根据题中所提供的信息,可知父亲与儿子的对应数据可列表如下:x =173,y =176,∴b ^=∑i =13(x i -x )(y i -y )∑i =13(x i -x )2=3×6(-3)2+32=1,a ^=y -b ^x =176-173=3, ∴回归方程为y ^=x +3,从而可预测他孙子的身高为182+3=185(cm).12.某公司的广告费支出x (单位:万元)与销售额y (单位:万元)之间有下列对应数据:资料显示y 与x 成线性相关关系.根据上表提供的数据得到回归方程y ^=b ^x +a ^中的b ^=6.5,预测销售额为115万元时约需________万元广告费. 答案 15解析 x =2+4+5+6+85=5, y =30+40+60+50+705=50. 因为回归方程必过样本点的中心(5,50),代入y ^=6.5x +a ^,得a ^=17.5,所以y ^=6.5x +17.5,当y ^=115时,x =15.13.一台机器由于使用时间较长,生产的零件有一些会缺损,按不同转速生产出来的零件有缺损的统计数据如下表:(1)作出散点图;(2)如果y 与x 成线性相关关系,求出回归方程;(3)若实际生产中,允许每小时的产品中有缺损的零件最多为10个,那么,机器的运转速度应控制在什么范围? 解 (1)根据表中的数据画出散点图如图:(2)设回归方程为y ^=b ^x +a ^,并列表如下:x =12.5,y =8.25,∑i =14x 2i =660,∑i =14x i y i =438,∴b ^=438-4×12.5×8.25660-4×12.52≈0.73,a ^=8.25-0.73×12.5=-0.875,∴y ^=0.73x -0.875.(3)令0.73x -0.875≤10,解得x ≤14.9≈15. 故机器的运转速度应控制在15转/秒内.备用题:1.下表提供了某厂节能降耗技术改造后在生产A 产品过程中记录的产量x (吨)与相应的生产能耗y (吨)的几组对根据上表提供的数据,求出y 关于的线性回归方程为0.70.35y x =+,则表中t 的值( A )A . 3B . 3.15C .3.5D . 4.52.【2012高考湖南文5】设某大学的女生体重y (单位:kg )与身高x (单位:cm )具有线性相关关系,根据一组样本数据(x i ,y i )(i=1,2,…,n ),用最小二乘法建立的回归方程为 y =0.85x-85.71,则下列结论中不正确...的是 A.y 与x 具有正的线性相关关系 B.回归直线过样本点的中心(x ,y ) C.若该大学某女生身高增加1cm ,则其体重约增加0.85kgD.若该大学某女生身高为170cm ,则可断定其体重必为58.79kg 【答案】D【解析】由回归方程为 y =0.85x-85.71知y 随x 的增大而增大,所以y 与x 具有正的线性相关关系,由最小二乘法建立的回归方程得过程知ˆ()y bx a bx y bx a y bx =+=+-=-,所以回归直线过样本点的中心(x ,y ),利用回归方程可以预测估计总体,所以D 不正确.【点评】本题组要考查两个变量间的相关性、最小二乘法及正相关、负相关的概念,并且是找不正确的答案,易错. 3.根据上表可得回归方程ˆˆybx a =+中的ˆb 为9.4,据此模型预报广告费用为6万元时销售额为 A .63.6万元 B .65.5万元 C .67.7万元 D .72.0万元 【答案】B4.已知x 、y 的取值如下表所示:若y 与x 2.6 ;5. 某种产品的广告费支出x y(Ⅰ)求回归直线方程;(Ⅱ)试预测广告费支出为10万元时,销售额多大?(参考数据:521145iix==∑52113500iiy==∑511380i iix y==∑)(Ⅰ)解:2+4+5+6+825=555x==,30+40+60+50+70250=5055y==又已知521145iix==∑,511380i iix y==∑于是可得:5152215138055506.51455555i iiiix y x ybx x==--⨯⨯===-⨯⨯-∑∑, 50 6.5517.5a y bx=-=-⨯=因此,所求回归直线方程为: 6.517.5 y x=+(Ⅱ)解: 根据上面求得的回归直线方程,当广告费支出为10万元时,6.51017.5=82.5y=⨯+(万元) 即这种产品的销售收入大约为82. 5万元.。

高中数学两个变量的线性相关教案1 新人教B版必修3

高中数学两个变量的线性相关教案1 新人教B版必修3

§2.3.2两个变量的线性相关⑴教学目标(1)了解非确定性关系中两个变量的统计方法;(2)掌握散点图的画法及在统计中的作用;(3)掌握回归直线方程的求解方法.教学重点线性回归方程的求解.教学难点回归直线方程在现实生活与生产中的应用.教学过程:1. 函数是研究两个变量之间的依存关系的一种数量形式.对于两个变量,如果当一个变量的取值一定时,另一个变量的取值被惟一确定,则这两个变量之间的关系就是一个函数关系.2. 在中学校园里,有这样一种说法:“如果你的数学成绩好,那么你的物理学习就不会有什么大问题.”按照这种说法,似乎学生的物理成绩与数学成绩之间存在着某种关系,我们把数学成绩和物理成绩看成是两个变量,那么这两个变量之间的关系是函数关系吗?3. 这两个变量是有一定关系的,它们之间是一种不确定性的关系.类似于这样的两个变量之间的关系,有必要从理论上作些探讨,如果能通过数学成绩对物理成绩进行合理估计,将有着非常重要的现实意义.知识探究(一):变量之间的相关关系思考:考察下列问题中两个变量之间的关系,想一想这些问题中两个变量之间的关系是函数关系吗?(1)商品销售收入与广告支出经费;(2)粮食产量与施肥量;(3)人体内的脂肪含量与年龄.知识探究(二):散点图在平面直角坐标系中,表示具有相关关系的两个变量的一组数据图形,称为散点图.问题提出1. 两个变量之间的相关关系的含义如何?成正相关和负相关的两个相关变量的散点图分别有什么特点?自变量取值一定时,因变量的取值带有一定随机性的两个变量之间的关系.正相关的散点图中的点散布在从左下角到右上角的区域,负相关的散点图中的点散布在从左上角到右下角的区域2. 观察人体的脂肪含量百分比和年龄的样本数据的散点图,这两个相关变量成正相关.我们需要进一步考虑的问题是,当人的年龄增加时,体内脂肪含量到底是以什么方式增加呢?对此,我们从理论上作些研究.知识探究(三):回归直线思考:在各种各样的散点图中,有些散点图中的点是杂乱分布的,有些散点图中的点的分布有一定的规律性,年龄和人体脂肪含量的样本数据的散点图中的点的分布有什么特点?这些点大致分布在一条直线附近.思考:对一组具有线性相关关系的样本数据,你认为其回归直线是一条还是几条?思考:在样本数据的散点图中,能否用直尺准确画出回归直线?借助计算机怎样画出回归直线?知识探究(四):回归方程在直角坐标系中,任何一条直线都有相应的方程,回归直线的方程称为回归方程.对一组具有线性相关关系的样本数据,如果能够求出它的回归方程,那么我们就可以比较具体、清楚地了解两个相关变量的内在联系,并根据回归方程对总体进行估计.思考:回归直线与散点图中各点的位置应具有怎样的关系?对于求回归直线方程,你有哪些想法?思考:对一组具有线性相关关系的样本数据:(x 1,y 1),(x 2,y 2),…,(x n ,y n ),设其回归方程为a bx y +=∧可以用哪些数量关系来刻画各样本点与回归直线的接近程度?.)(||2a bx y y y y y i i i i i i +=--∧∧∧其中,或可以用思考:为了从整体上反映n 个样本数据与回归直线的接近程度,你认为选用哪个数量关系来刻画比较合适?思考:根据有关数学原理分析,当 时,总体偏差 为最小,这样就得到了回归方程,这种求回归方程的方法叫做最小二乘法.回归方程中,a ,b 的几何意义分别是什么?思考6:利用计算器或计算机可求得年龄和人体脂肪含量的样本数据的回归方程,由此我们可以根据一个人个年龄预测其体内脂肪含量的百分比的回归值.若某人37岁,则其体内脂肪含量的百分比约为多少? 20.9%练习 3.F 表提供了某厂节能降耗技术改造后生产甲产品过程中记录的产量x(吨)与相应的 (1)请画出上表数据的散点图;(2)请根据上表提供的数据,崩最小二乘法求出Y 关于x 的线性回归方程Y=bx+a ;21ˆ()ni i i Q y y==-∑2221122()()()n n y bx a y bx a y bx a =--+--++--21ˆ()n i i i Q y y==-∑1122211()(),()n n i i i i i i n n i i i i x x y y x y nx y b a y bx x x x nx ====---===---∑∑∑∑48.0577.0-=x y(3)已知该厂技改前100吨甲产品的生产能耗为90吨标准煤.试根据(2)求出的线性 同归方程,预测生产100吨甲产品的生产能耗比技改前降低多少吨标准煤? (参考数值:3×2.5+4×3+5×4+6×4.5=66.5) 解:(1)如图 (2)由对照数据,计算得:4166.5i ii X Y ==∑ 4222221345686ii X==+++=∑ 4.5X =266.54 4.5 3.566.563ˆ0.7864 4.58681b -⨯⨯-===-⨯- ; ˆˆ 3.50.7 4.50.35a Y bX =-=-⨯= 所求的回归方程为 0.70.35y x =+(3) 100x =, 1000.70.3570.35y =⨯+=吨,预测生产100吨甲产品的生产能耗比技改前降低9070.3519.65-=(吨)课堂小结1. 求样本数据的线性回归方程,可按下列步骤进行: 第一步,计算平均数;,y x 第二步,求和;,∑∑==ni i n i i i x y x 121第三步,计算;)())((1221121x b y a xn xy x n yx x xy y x xb ni ini ii ni ini i i-=--=---=∑∑∑∑====,第四步,写出回归方程 .a bx y +=∧2. 回归方程被样本数据惟一确定,各样本点大致分布在回归直线附近.对同一个总体,不同的样本数据对应不同的回归直线,所以回归直线也具有随机性.3. 对于任意一组样本数据,利用上述公式都可以求得“回归方程”,如果这组数据不具有线性相关关系,即不存在回归直线,那么所得的“回归方程”是没有实际意义的.因此,对一组样本数据,应先作散点图,在具有线性相关关系的前提下再求回归方程.课后作业教学反思:§2.3.2两个变量的线性相关⑵教学目标(1)了解非确定性关系中两个变量的统计方法; (2)掌握散点图的画法及在统计中的作用; (3)掌握回归直线方程的求解方法. 教学重点线性回归方程的求解. 教学难点回归直线方程在现实生活与生产中的应用. 教学过程: 一、复习(1)两个变量间由函数关系时,数据点位于某曲线上.(2)两个变量间的关系是相关关系时,数据点位于某曲线附近. (3)两个变量间的关系为线性相关时,数据点位于某直线附近.该直线叫回归直线,对应的方程叫回归方程,该直线作为两个变量有线性相关关系的代表 (4)求回归方程的一般步骤: 第一步,计算平均数;,y x 第二步,求和;,∑∑==ni in i ii xy x 121第三步,计算;)())((1221121x b y a xn xy x n yx x xy y x xb ni ini ii ni ini i i-=--=---=∑∑∑∑====,第四步,写出回归方程 .a bx y +=∧练习1.由一组10个数据(x i ,y i )算得,10,5==y x ,292,583121==∑∑==ni i ni i i x y x 则b = ,a = ,回归方程为 .练习2..).5,4(),4,3(),2,1(),3,2(),(之间的回归直线方程与求的值分别实验测得四组数据x y y x 二、新授1. 两个变量是否有相关关系可以先作出散点图进行判断.2. 两个变量间是否有相关关系也可以通过求相关函数来判断.其中∑∑∑===-⋅---=ni ni i ini i iy y x xy y x xr 11221)()())((.]75.0,1[时,负相关很强当--∈r.]1,75.0[时,正相关很强当∈r.]75.0,30.0[]30.0,75.0[时,相关性一般或当-∈-∈r r .),(1在一条直线上时,数据点当i i y x r =三、习题讲解关系数学成绩与物理成绩的④③吸烟与健康的关系关系②农作物产量与施肥的高的关系①父母的身高与子女身③下列属于线性相关的是)(.1 ),(.),0(.)0,(.)0,0(..2y x D y C x B A Da bx y )必过(线性回归方程+=∧.2210.1301.801.1301.千元元,劳动生产率为当月工资为元;千元,则工资提高劳动生产率提高元;千元,则工资提高劳动生产率提高元;千元,则工资为劳动生产率为D C B A )(下列判断正确的是,程为(千元)变化的回归方(元)与劳动生产率工人月工资B x y x y 805.5+=个单位平均增加个单位平均增加个单位平均减少个单位平均增加)(增加一个单位时,变量设有一个回归方程为3.5.5.3.53.4y D y C y B y A x x y -=)(间的线性回归方程过点之与,则之间的数据如下表所示、已知D x y y x .3),(.),0(.)0,(.)0,0(.y x D y C x B A课后作业教学反思:§2.4小结教学目标(1)本章知识系统化 (2)本章知识网络化 教学重点统计基本知识与方法. 教学难点统计在现实生活与生产中的应用. 教学过程: 一、知识整合 二、巩固练习1、选择题1.下列两个变量之间的关系是相关关系的是( )A. 正方体的棱长和体积B. 单位圆中角的度数和所对应的弧长C. 单位产量为常数时,土地面积和总产量D. 日照时间与水稻的亩产量 2.对一组数据进行分析,下列说法不正确的是( ) A .数据极差越小,样本数据分布越集中、稳定 B .数据平均数越小,样本数据分布越集中、稳定 C .数据标准差越小,样本数据分布越集中、稳定 D .数据方差越小,样本数据分布越集中、稳定3.学校礼堂有25排,每排有20个座位,一次心理讲座时礼堂中坐满了学生,会后留下了座位号是15的所有25名学生测试,这里运用的抽样方法是( )A. 抽签法B. 随机数表法C. 系统抽样法D. 分层抽样法.2910610000062.05.93253246192161970.6人的船员数为人,对于最大的船估计小的船估计的船员数为人,对于最,船员平均人数相差,假定两船吨位相差结论:船员人数位的回归分析得到如下人,由船员人数关于吨人到数目从,船员的吨位区间从艘轮船的研究中,船的年的一项关于t x t t +=-4.为了解某地5000名初三学生的语文测试水平,从中抽取了200学生的成绩进行统计分析,在这个问题中,以下表述不正确的是( ).A .5000名学生成绩的全体是总体B .每个学生的成绩是个体C .抽取200学生成绩的全体是总体的一个样本D .样本的容量是5000 5.为了调查学生的课外阅读情况,随机抽查了50名学生,得到他们在某一天各自课外阅读所用时间的数据,结果用下面的条形图表示.根此可得这50名学生这一天平均每人的课外阅读时间约为 ( )A . 0.6小时 B. 0.9小时C. 1.0小时D. 1.5小时6.下图是某赛季甲、乙两名篮球运动员每场比赛得分的茎叶图,中间的数字表示得分的十位数,下列对乙运动员的判断错误的是 ( )A .乙运动员的最低得分为0分B .乙运动员得分的众数为31C .乙运动员的场均得分高于甲运动员D .乙运动员得分的中位数是28二、填空题7. 某工厂生产A,B,C 三种不同型号的产品,产品数量之比依次为2:3:5.现用分层抽样方法抽出一个容量为n 的样本,样本中A 种型号产品有20件,那么此样本的容量=n . 8.高一年级有4个班,各班的人数分别是52、54、54、53,某次数学考试各班的数学平均成绩分别是81、80、82、839.在一次歌手大奖赛上,4.9 4.8 4.9 4.9 6.9 9.9 7.9去掉一个最高分和一个最低分后,10.右图是200直方图,则时速在[)50,60的汽车大约有 辆11.某校对高二学生的物理成绩y 和数学成绩x 进行了统计调查,得到y 与x 具有相关关系,且回归直线方程为83.3366.0ˆ+=x y (单位:分,满分100分),若小王同学的物理成绩为89,估计他的数学成绩约为 (精确到1分).甲 乙8 04 6 3 1 2 53 6 8 2 54 1 3 8 9 3 1 6 1 74 4 时间(小时) 人数12.一组数据按从大到小排列为2,2,4,x,6,10,已知这组数据的中位数为5,那么这组数据的平均数为 .三、解答题13.中学生的心理健康问题已引起了社会的广泛关注,黎明中学对全校600名高三学生进行了一次“心理健康”知识测试,并从中抽取了部分学生的成绩(得分取正整数,满分为100分)作为样本,绘制了下面尚未完成的频率分布表和频率分布直方图:成绩(分)请填写频率分布表中的空格,并补全频率分布直方图.课后作业:教学反思:。

高中数学新人教版B版精品教案《2.3.2 两个变量的线性相关》

高中数学新人教版B版精品教案《2.3.2 两个变量的线性相关》

课题:两个变量的线性相关(第一课时)教学内容分析:在此前的学习中,学生已经学习过相关关系的概念,能够根据散点图判断是否相关,是正相关还是负相关。

学情分析:学生已经学习过了方差的概念,所以有助于理解最小二乘法的思想。

对复杂的公式,大量的运算可能心存畏惧。

教学目标:经历用不同的方法描述两个变量线性相关的过程,知道最小二乘法。

根据给出的线性回归方程的系数公式建立线性回归方程。

教学重点:经历用不同的方法描述两个变量线性相关的过程,知道最小二乘法。

根据给出的线性回归方程的系数公式建立线性回归方程教学难点:最小二乘法的思想。

教学过程1.复习引入:问题1:通过什么判断两个变量是相关的。

问题2:观察屏幕上的散点图,判断是否相关,正相关还是负相关。

今天将学习两个变量相关的一种特殊相关──线性相关。

2.画出散点图,引出回归直线的概念下表是某小卖部6天卖出热茶的杯数与当天气温的对比表:(1)将上表中的数据制成散点图(2)你能从散点图中发现温度与饮料杯数近似成什么关系吗从图中可以看出温度与杯数具有相关关系,当温度由小到大变化时,杯数的值由大到小所以温度与杯数成负相关。

图中的数据大致分布在一条直线附近,因此温度与杯数成线性相关关系。

分析:这些直线的点近似的分布在一条直线的附近,根据不同的标准,可以画出不同的直线。

而我们希望找出其中的一条,它能最好地反映与Y 之间的关系。

使这条直线“最贴近”已知的数据点。

记此直线方程是上式叫做Y 对于的回归直线方程, b 叫做回归系数。

3引出回归直线方程的求法即最小二乘法。

给出离差的概念,学生自主讨论什么样的直线是最佳直线即n 个偏差的平方和 最小叫做“最小二乘法”。

,b 的公式: 说明:回归系数的意义。

(1)b>0表示两个变量正相关,b bˆ2 1.5yx =-y y y y 0,6课堂小结:1了解最小二乘法原理(2)能根据给出的回归方程系数公式建立线性回归方程ˆy bx a =+21()ni i i Q y bx a ==--∑1122211()()ˆ,()ˆ.nni i i i i i n n i ii i x x y y x y nx y b x x x nx a y bx ====⎧---⎪⎪==⎨--⎪⎪=-⎩∑∑∑∑11,n i i x x n ==∑11nii y y n ==∑7作业:教材79页练习A组,B组8板书设计:课题1.线性回归方程2.最小二乘法3.(1)公式2回归系数的意义4.例题。

两个变量的线性相关教学设计

两个变量的线性相关教学设计

第二章统计2.3.2 两个变量的线性相关一、教学内容解析本节课在新课标实验教材(人教A版必修3 )第二章第三节.主要内容是介绍具有线性相关关系的两个变量的探究方法及“最小二乘法”的重要思想.本节是本章的最后一节,知识面广,应用性强,有助于学生对统计知识的构建和解决实际问题能力的提升.教学重点:“最小二乘法”和回归思想的建立.教学难点:学生对回归思想的理解与应用.二、教学目标设置知识与技能:了解最小二乘法和回归直线及方程,会用公式和现代信息技术求回归方程.过程与方法:亲身经历线性回归分析过程,学会利用统计的方法解决实际问题.情感态度与价值观:增强对回归分析思想的应用意识,体会使用确定性关系估计非确定性关系的思想.三、学生学情分析在知识上:已经学习了抽取样本,处理数据等基础统计知识;在思维上:有一定分析、解决问题的能力;在心理上:乐于探索身边实际问题,对用统计方法处理实际问题有浓厚兴趣.四、教学策略分析在教法设计方面:根据本节内容特点及学情特点,我编写了《导学案》,然后依据《导学案》,采用问题启发、共同探究的方式让学生经历一次回归分析的全过程,以此来完成课标要求.在教学手段设计方面:由于本节课信息量大,需要处理数据较多,同时,也为了让学生感受利用现代信息技术的方便、快捷,故采用多媒体手段和计算器、计算机来辅助教学.五、教学过程设计(一)设置情景,提出问题学生..依据《导学案》,完成上节课留下的实习作业,并在本节课上予以展示,同时回答实习作业上的两个问题.教师..展示自己收集的数据和所画散点图,并以此为基础提出问题:“怎样确定回归方程?” 【实习作业】(以小组为单位,收集高一学生的身高和体重的相关数据,并画出散点图.) (1)收集数据 问题1. 你们的数据是怎样收集的?2.画散点图问题2. 你所画的散点图有什么样的特征?身高/cm【教师展示】提出问题:怎样找到一条合适的直线,它能够最好的刻画身高和体重之间的关系? (二) 合作探究,构建新知 <1> 确定公式让学生以小组为单位讨论..课本第87页寻求回归直线的三种方案是否可行,并简单说明.方案1、先画出一条直线,测量出各点与它的距离,再移动直线,到达一个使距离的和最小时,测出它的斜率和截距,进而得回归方程.方案2、在图中选两点作直线,使直线两侧的点的个数基本相同. 方案3、如果多取几对点,确定多条直线,再求出这些直线的斜率和截距的平均值作为回归直线的斜率和截距,进而得回归方程.以上三种方案分析过后,引出“最小二乘法”.【最小二乘法】(在最小二乘法介绍过程中让学生思考并回答以下4个问题) 问题1. 你对“从总体上看,各点与此直线的距离最小.”作何理解?155160 165 170 175/cm180问题2. 你对点到直线的距离用()i i y bx a -+来刻画有何理解?问题 3. 你对用()()()2221122...n n Q y bx a y bx a y bx a =--+--++--代替()1niii y bx a =-+∑作何理解?问题4. 什么是样本点中心,为什么回归直线过样本点中心? 最小二乘法介绍过程:① 设已经得到具有线性相关关系的变量的一组数据:()()()()1122,,,,...,,...,,i i n n x y x y x y x y ;② 设直线方程:y bx a =+, 其中b ,a 是待定的系数; ③ 用()i i y bx a -+刻画点到直线的距离; ④ 距离和:()1ni i i y bx a =-+∑⑤ 距离平方和:()()()2221122...n n Q y bx a y bx a y bx a =--+--++--当1122211()()ˆ()ˆnni i i ii i nni i i i x x y y x y nx yb x x x nxay bx ====⎧---⎪⎪==⎪⎨--⎪⎪=-⎪⎩∑∑∑∑ 时,Q 最小.<2>求出方程①让学生利用公式求出回归方程;②让学生参照课本研究怎样用计算器或计算机求回归方程,并找学生展示. <3>做出统计推断用求出的回归方程对身高168cm 的学生做出预测并进行检验. 问题:对预报值与真实值存在偏差作何解释? <4>总结步骤让学生总结出考察具有线性相关关系的两个变量的操作步骤. (1)收集相关数据; (2)画出散点图;(3)求出回归方程;(4)做出统计推断.(三)实践操作,运用新知根据以上步骤让各小组继续完善..实习作业(完善3、4步),目的是让学生完整地经历一次线性回归分析的过程以达到教学目标.各小组完善作业后,要求把各组求出的回归方程写在黑板上,观察后提出以下问题:问题1.同样是对高一学生的身高和体重做研究,为什么不同小组求出的回归方程有差异?问题2.能否认定哪个小组求出的回归方程是最好的?(四)回顾小结,整体感知(1)最小二乘法及其推出的公式;(2)相关关系的考察步骤;(3)用确定关系预测非确定性关系的思想.(五)布置作业,巩固新知课本第94页,A组,第3、4题.(六)板书设计,知识再现六、教学反思本堂课,在知识传授方面,达到了理想目标,学生反映良好。

高中数学优质教学设计5:2.3.2两个变量的线性相关 教案

高中数学优质教学设计5:2.3.2两个变量的线性相关 教案

2. 3.2 两个变量的线性相关2.3.2 两个变量的线性相关(第一课时)教学要求:经历用不同估算方法描述两个变量线性相关的过程.知道最小二乘法的思想,能根据给出的线性回归方程的系数公式建立线性回归方程.教学重点:根据给出的线性回归方程的系数公式建立线性回归方程. 教学难点:理解最小二乘法的思想 教学过程: 一、复习准备:1. 作散点图的步骤和方法?正.负相关的概念?2. 提问:看人体的脂肪百分比和年龄的散点图,当人的年龄增加时,体内脂肪含量到底是以什么方式增加的呢? 二、讲授新课: 1. 教学回归直线概念:①从散点图上可以看出,这些点大致分布在通过散点图中心的一条直线。

如果散点图中点的分布从整体上看大致在一条直线附近,我们就称这这两个变量之间具有线形相关关系,直线叫回归直线。

(线形相关→回归直线)②提问:从散点图上可以发现,人体的脂肪百分比和年龄的散点图,大致分布在通过散点图中心的一条直线。

那么,怎样确定这条直线呢?(学生讨论:1.选择能反映直线变化的两个点。

2. 在图中放上一根细绳,使得上面和下面点的个数相同或基本相同。

3. 多取几组点对,确定几条直线方程。

再分别算出各个直线方程斜率、截距的算术平均值,作为所求直线的斜率、截距。

)。

教师:分别分析各方法的可靠性。

2. 教学最小二乘法:①求回归方程的关键是如何用数学的方法刻画“从整体上看,各点与此直线的距离最小”.如果直线的方程为αβ+=x y ,用()i ,,βαρ表示第i 个样本点()i i y x ,与直线之间的距离,则从总体上看各点与此直线的距离可以用所有样本点与回归直线的距离来表示,即用下面的公式()()∑==ni i Q 1,,,βαρβα来表示.注意到上面的等式对于任何实数α和β都有定义,因此可把()βα,Q 看成二元函数.这样,“从整体上看,各点与此直线的距离最小”的含义是回归方程的截距a 和斜率b 构成的点()b a ,应该是函数()βα,Q 的最小值点.特别地,当()()2,,i i i x y i αββαρ--=时,()b a ,应该使函数()()()()2222211,αβαβαββα--++--+--=n n x y x y x y Q Λ达到极小值,即a 和b 由公式①给出。

人教A版高中数学必修三两个变量的线性相关教案

人教A版高中数学必修三两个变量的线性相关教案

2.3.2两个变量的线性相关教学目标:经历用不同估算方法描述两个变量线性相关的过程。

知道最小二乘法的思想,能根据给出的线性回归方程系数公式建立线性回归方程。

教学重点:经历用不同估算方法描述两个变量线性相关的过程。

知道最小二乘法的思想,能根据给出的线性回归方程系数公式建立线性回归方程。

教学过程:1.回顾上节课的案例分析给出如下概念: (1)回归直线方程 (2)回归系数2.最小二乘法3.直线回归方程的应用(1)描述两变量之间的依存关系;利用直线回归方程即可定量描述两个变量间依存的数量关系(2)利用回归方程进行预测;把预报因子(即自变量x )代入回归方程对预报量(即因变量Y )进行估计,即可得到个体Y 值的容许区间。

(3)利用回归方程进行统计控制规定Y 值的变化,通过控制x 的范围来实现统计控制的目标。

如已经得到了空气中NO 2的浓度和汽车流量间的回归方程,即可通过控制汽车流量来控制空气中NO 2的浓度。

4.应用直线回归的注意事项(1)做回归分析要有实际意义;(2)回归分析前,最好先作出散点图; (3)回归直线不要外延。

5.实例分析: 某调查者从调查中获知某公司近年来科研费用支出(i X )与公司所获得利润(i Y )的统计资料如下表:i X i Y 要求估计利润(i Y )对科研费用支出(i X )的线性回归模型。

解:设线性回归模型直线方程为:i i X Y 10ˆˆˆββ+=因为:5630===∑n X X i306180===∑nYY i现利用公式(Ⅰ)、(Ⅱ)、(Ⅲ)求解参数10的估计值:23006009001200540060003020061803010006)(ˆ2221==--=-⨯⨯-⨯=--=∑∑∑∑∑i i i i i i X X n Y X Y X n β 205230ˆˆ10=⨯-=-=X Y ββ∑∑--=-=22110)(ˆˆˆX n X Y X n Y X X Y ii i βββ 205230ˆˆ10=⨯-=-=X Y ββ25010056200305610002==⨯-⨯⨯-=∑∑---=-=2110)())((ˆˆˆX X Y Y X X X Y ii iβββ 205230ˆˆ10=⨯-=-=X Y ββ250100==所以:利润(i Y )对科研费用支出(i X )的线性回归模型直线方程为:i i X Y 220ˆ+=6、求直线回归方程,相关系数和作图,这些EXCEL 可以方便地做到。

高中数学2.3.2两个变量的线性相关(第1课时)教案新人教A版必修3

高中数学2.3.2两个变量的线性相关(第1课时)教案新人教A版必修3

2.3.2 两个变量的线性相关(第一课时)(新授课)一、教学目标:明确事物间的相互联系。

认识现实生活中变量间除了存在确定的关系外,仍存在大量的非确定性的相关关系,并利用散点图直观体会这种相关关系。

二、教学重点与难点重点:利用散点图直观认识两个变量之间的线性关系.难点:作散点图和理解两个变量的正相关和负相关。

三、教学过程:(一)引入1. 人的身高和体重之间的关系?2. 学生设计一个统计问题,并指出问题涉及的总体是什么,所涉及的变量是什么.(二)讲授新课:1、散点图(1)例题:在一次对人体脂肪含量和年龄关系的研究中,研究人员获得了一组样本数据:年龄23 27 38 41 45 49 50脂肪9.5 17.8 21.2 25.9 27.5 26.3 28.2年龄53 54 56 57 58 60 61脂肪29.6 30.2 31.4 30.8 33.5 35.2 34.6分析数据:大体上来看,随着年龄的增加,人体中脂肪的百分比也在增加。

我们可以作散点图来进一步分析。

(2)散点图的概念:将各数据在平面直角坐标中的对应点画出来,得到表示两个变量的一组数据的图形,这样的图形叫做散点图。

(1.如果所有的样本点都落在某一函数曲线上,就用该函数来描述变量之间的关系,即变量之间具有函数关系.2.如果所有的样本点都落在某一函数曲线附近,变量之间就有相关关系。

3. 如果所有的样本点都落在某一直线附近,变量之间就有线性相关关系)(3)正相关与负相关概念:如果散点图中的点散布在从左下角到右上角的区域内,称为正相关。

如果散点图中的点散布在从左上角到右下角的区域内,称为负相关。

(注:散点图的点如果几乎没有什么规则,则这两个变量之间不具有相关关系)(4)讨论:你能举出一些生活中的变量成正相关或负相关的例子吗?(比如高学历高收入现象)(三)课堂练习:一个工厂为了规定工时定额,需要确定加工零件所花费的时间,为此进行了10次调查,收集数据如下:零件数10 20 30 40 50 60 70 80 90 100加工时间62 68 75 81 89 95 102 108 115 1221. 画出散点图。

人教版数学必修三第二章2.3.2 两个变量之间的线性相关 经典教学教案

人教版数学必修三第二章2.3.2 两个变量之间的线性相关 经典教学教案

设计意图 联系现实问题,提升学生的求知欲、探索欲,使学生保持良好、积极的情
感体验。
第二阶段:形成思路,实施探究
1/8
知识像烛光,能照亮一个人,也能照亮无数的人。--培根
下面我分以下几步来实施探究: Step1:探究增长方式,引出“线性”回归 Step2:师生合作探究回归直线的确定方法 Step3:用数学的语言来描述回归直线的定义 Step4:探求距离的简化 Step5:解析问题,获得新知 下面首进行第一步:
4/8
知识像烛光,能照亮一个人,也能照亮无数的人。--培根
例 2 我国是一个人口大国,估计人口数量及发展趋势是我们制定经济发展计划等一系 列相关政策的基础,人口数量预测是一个复杂的问题,不仅是人口与时间两个变量之间 的 关系,还与国家经济状况,科技发展,自然灾害和战争等其他因素有关。我们看下面的统计 表 1949 至 1994 年人口数据资料如下
三、教学目标
根据上述简析,考虑到学生已有认知结构和心理特征,结合本节课内容我制定了以下教 学目标:
1、知识与技能目标
(1)知道最小二乘法的思想,了解其公式的推导过程;(2)会用公式求解回归方程。
2、过程与方法目标
(1)通过自主探究体会数形结合、类比、及最小二乘法的数学思想方法。培养学生观
0/8
知识像烛光,能照亮一个人,也能照亮无数的人。--培根
i =1
i =1
i =1
(3)代入公式求 aˆ , bˆ ;
(4)列出直线方程。
这样,使学生能回顾总结梳理所学知识,系统掌握所学知识,使课堂效果得到加强。
第五阶段:练习反馈
高考题是高考要求的具体体现,让学生以它们为范例,对于强化“高考意识”十分必要。 因此设计了以下练习题:

两个变量的线性相关教案

两个变量的线性相关教案

两个变量的线性相关教案第一章:引言1.1 教学目标让学生理解什么是两个变量的线性相关性。

让学生掌握散点图的绘制和解读。

让学生了解线性相关的概念和特点。

1.2 教学内容介绍两个变量的概念和关系。

介绍散点图的概念和作用。

介绍线性相关的概念和特点。

1.3 教学方法使用案例分析和实际数据进行讲解。

使用图表和图形进行直观展示。

引导学生进行思考和讨论。

1.4 教学评估学生能够准确描述两个变量的关系。

学生能够正确绘制和解读散点图。

学生能够理解线性相关的概念和特点。

第二章:散点图的绘制和解读2.1 教学目标让学生掌握散点图的绘制方法。

让学生能够正确解读散点图。

2.2 教学内容介绍散点图的绘制方法。

介绍散点图的解读方法。

2.3 教学方法使用软件工具进行散点图的绘制和解读。

使用实际数据进行示例和练习。

2.4 教学评估学生能够熟练使用软件工具绘制散点图。

学生能够准确解读散点图并得出结论。

第三章:线性相关的概念和特点3.1 教学目标让学生理解线性相关的概念和特点。

3.2 教学内容介绍线性相关的概念。

介绍线性相关的特点。

3.3 教学方法使用案例分析和实际数据进行讲解。

使用图表和图形进行直观展示。

3.4 教学评估学生能够准确描述线性相关的概念和特点。

第四章:线性回归方程的建立4.1 教学目标让学生掌握线性回归方程的建立方法。

让学生能够利用线性回归方程进行预测。

4.2 教学内容介绍线性回归方程的概念和作用。

介绍最小二乘法的原理和应用。

介绍如何利用线性回归方程进行预测。

4.3 教学方法使用软件工具进行线性回归方程的建立和预测。

使用实际数据进行示例和练习。

4.4 教学评估学生能够熟练使用软件工具建立线性回归方程。

学生能够利用线性回归方程进行预测并得出结论。

第五章:线性相关性的检验5.1 教学目标让学生掌握线性相关性的检验方法。

让学生能够判断线性相关的强度和方向。

5.2 教学内容介绍线性相关性检验的方法。

介绍判定系数R²的概念和作用。

高中数学优质教学设计2:2.3.2两个变量的线性相关 教案

高中数学优质教学设计2:2.3.2两个变量的线性相关 教案

§2.3.2 两个变量的线性相关导入新课思路1客观事物是相互联系的,过去研究的大多数是因果关系,但实际上更多存在的是一种非因果关系.比如说:某某同学的数学成绩与物理成绩,彼此是互相联系的,但不能认为数学是“因”,物理是“果”,或者反过来说.事实上数学和物理成绩都是“果”,而真正的“因”是学生的理科学习能力和努力程度.所以说,函数关系存在着一种确定性关系,但还存在着另一种非确定性关系——相关关系.为表示这种相关关系,我们接着学习两个变量的线性相关——回归直线及其方程.思路2某小卖部为了了解热茶销售量与气温之间的关系,随机统计并制作了某6天卖出热茶的杯数与当天气温的对照表:气温/℃26 18 13 10 4 -1 杯数20 24 34 38 50 64如果某天的气温是-5 ℃,你能根据这些数据预测这天小卖部卖出热茶的杯数吗?为解决这个问题我们接着学习两个变量的线性相关——回归直线及其方程.推进新课新知探究提出问题(1)作散点图的步骤和方法?(2)正、负相关的概念?(3)什么是线性相关?(4)看人体的脂肪百分比和年龄的散点图,当人的年龄增加时,体内脂肪含量到底是以什么方式增加的呢?(5)什么叫做回归直线?(6)如何求回归直线的方程?什么是最小二乘法?它有什么样的思想?(7)利用计算机如何求回归直线的方程?(8)利用计算器如何求回归直线的方程?活动:学生回顾,再思考或讨论,教师及时提示指导.讨论结果:(1)建立相应的平面直角坐标系,将各数据在平面直角坐标中的对应点画出来,得到表示两个变量的一组数据的图形,这样的图形叫做散点图.(a.如果所有的样本点都落在某一函数曲线上,就用该函数来描述变量之间的关系,即变量之间具有函数关系.b.如果所有的样本点都落在某一函数曲线附近,变量之间就有相关关系.c.如果所有的样本点都落在某一直线附近,变量之间就有线性相关关系)(2)如果散点图中的点散布在从左下角到右上角的区域内,称为正相关.如果散点图中的点散布在从左上角到右下角的区域内,称为负相关.(3)如果所有的样本点都落在某一直线附近,变量之间就有线性相关的关系.(4)大体上来看,随着年龄的增加,人体中脂肪的百分比也在增加,呈正相关的趋势,我们可以从散点图上来进一步分析.(5)如下图:从散点图上可以看出,这些点大致分布在通过散点图中心的一条直线附近.如果散点图中点的分布从整体上看大致在一条直线附近,我们就称这两个变量之间具有线性相关关系,这条直线叫做回归直线(regression line).如果能够求出这条回归直线的方程(简称回归方程),那么我们就可以比较清楚地了解年龄与体内脂肪含量的相关性.就像平均数可以作为一个变量的数据的代表一样,这条直线可以作为两个变量具有线性相关关系的代表.(6)从散点图上可以发现,人体的脂肪百分比和年龄的散点图,大致分布在通过散点图中心的一条直线.那么,我们应当如何具体求出这个回归方程呢?有的同学可能会想,我可以采用测量的方法,先画出一条直线,测量出各点与它的距离,然后移动直线,到达一个使距离的和最小的位置,测量出此时的斜率和截距,就可得到回归方程了.但是,这样做可靠吗?有的同学可能还会想,在图中选择这样的两点画直线,使得直线两侧的点的个数基本相同.同样地,这样做能保证各点与此直线在整体上是最接近的吗?还有的同学会想,在散点图中多取几组点,确定出几条直线的方程,再分别求出各条直线的斜率、截距的平均数,将这两个平均数当成回归方程的斜率和截距. 同学们不妨去实践一下,看看这些方法是不是真的可行?(学生讨论:1.选择能反映直线变化的两个点.2.在图中放上一根细绳,使得上面和下面点的个数相同或基本相同.3.多取几组点对,确定几条直线方程.再分别算出各个直线方程斜率、截距的算术平均值,作为所求直线的斜率、截距.)教师:分别分析各方法的可靠性.如下图:上面这些方法虽然有一定的道理,但总让人感到可靠性不强.实际上,求回归方程的关键是如何用数学的方法来刻画“从整体上看,各点与此直线的距离最小”.人们经过长期的实践与研究,已经得出了计算回归方程的斜率与截距的一般公式⎪⎪⎪⎩⎪⎪⎪⎨⎧-=--=---=∑∑∑∑====.)1(,)())((2121121x b y a x n xyx n yx x x y y x x b ni ini ii n i i n i i i其中,b 是回归方程的斜率,a 是截距.推导公式①的计算比较复杂,这里不作推导.但是,我们可以解释一下得出它的原理. 假设我们已经得到两个具有线性相关关系的变量的一组数据(x1,y1),(x2,y2),…,(x n,y n),且所求回归方程是^y=bx+a,其中a、b是待定参数.当变量x取x i(i=1,2,…,n)时可以得到^y=bx i+a(i=1,2,…,n),它与实际收集到的y i之间的偏差是y i-^y=y i-(bx i+a)(i=1,2,…,n).这样,用这n个偏差的和来刻画“各点与此直线的整体偏差”是比较合适的.由于(y i-^y)可正可负,为了避免相互抵消,可以考虑用∑=-niiiyy1^||来代替,但由于它含有绝对值,运算不太方便,所以改用Q=(y1-bx1-a)2+(y2-bx2-a)2+…+(y n-bx n-a)2②来刻画n个点与回归直线在整体上的偏差.这样,问题就归结为:当a,b取什么值时Q最小,即总体偏差最小.经过数学上求最小值的运算,a,b的值由公式①给出.通过求②式的最小值而得出回归直线的方法,即求回归直线,使得样本数据的点到它的距离的平方和最小,这一方法叫做最小二乘法(method of least square).(7)利用计算机求回归直线的方程.根据最小二乘法的思想和公式①,利用计算器或计算机,可以方便地求出回归方程.以Excel软件为例,用散点图来建立表示人体的脂肪含量与年龄的相关关系的线性回归方程,具体步骤如下:①在Excel中选定表示人体的脂肪含量与年龄的相关关系的散点图(如下图),在菜单中选定“图表”中的“添加趋势线”选项,弹出“添加趋势线”对话框.②单击“类型”标签,选定“趋势预测/回归分析类型”中的“线性”选项,单击“确定”按钮,得到回归直线.③双击回归直线,弹出“趋势线格式”对话框.单击“选项”标签,选定“显示公式”,最后单击“确定”按钮,得到回归直线的回归方程^y=0.577x-0.448.(8)利用计算器求回归直线的方程. 用计算器求这个回归方程的过程如下:所以回归方程为^y=0.577x-0.448.正像本节开头所说的,我们从人体脂肪含量与年龄这两个变量的一组随机样本数据中,找到了它们之间关系的一个规律,这个规律是由回归直线来反映的.直线回归方程的应用:①描述两变量之间的依存关系;利用直线回归方程即可定量描述两个变量间依存的数量关系.②利用回归方程进行预测;把预报因子(即自变量x)代入回归方程对预报量(即因变量Y)进行估计,即可得到个体Y值的容许区间.③利用回归方程进行统计控制规定Y值的变化,通过控制x的范围来实现统计控制的目标.如已经得到了空气中NO2的浓度和汽车流量间的回归方程,即可通过控制汽车流量来控制空气中NO2的浓度.应用示例思路1例1 有一个同学家开了一个小卖部,他为了研究气温对热饮销售的影响,经过统计,得到一个卖出的热饮杯数与当天气温的对比表:摄氏温度/℃-5 0 4 7 12 15 19 23 27 31 36 热饮杯数156 150 132 128 130 116 104 89 93 76 54 (1)画出散点图;(2)从散点图中发现气温与热饮销售杯数之间关系的一般规律;(3)求回归方程;(4)如果某天的气温是2 ℃,预测这天卖出的热饮杯数.解:(1)散点图如下图所示:(2)从上图看到,各点散布在从左上角到右下角的区域里,因此,气温与热饮销售杯数之间呈负相关,即气温越高,卖出去的热饮杯数越少.(3)从散点图可以看出,这些点大致分布在一条直线的附近,因此,可用公式①求出回归方程的系数.利用计算器容易求得回归方程^y=-2.352x+147.767.(4)当x=2时,^y=143.063.因此,某天的气温为2 ℃时,这天大约可以卖出143杯热饮.思考气温为2 ℃时,小卖部一定能够卖出143杯左右热饮吗?为什么?这里的答案是小卖部不一定能够卖出143杯左右热饮,原因如下:1.线性回归方程中的截距和斜率都是通过样本估计出来的,存在随机误差,这种误差可以导致预测结果的偏差.2.即使截距和斜率的估计没有误差,也不可能百分之百地保证对应于x的预报值,能够与实际值y很接近.我们不能保证点(x,y)落在回归直线上,甚至不能百分之百地保证它落在回归直线的附近,事实上,y =bx +a +e =^y +e .这里e 是随机变量,预报值^y 与实际值y 的接近程度由随机变量e 的标准差所决定. 一些学生可能会提出问题:既然不一定能够卖出143杯左右热饮,那么为什么我们还以“这天大约可以卖出143杯热饮”作为结论呢?这是因为这个结论出现的可能性最大.具体地说,假如我们规定可以选择连续的3个非负整数作为可能的预测结果,则我们选择142,143和144能够保证预测成功(即实际卖出的杯数是这3个数之一)的概率最大. 例2 下表为某地近几年机动车辆数与交通事故数的统计资料. 机动车辆数x /千台 95 110 112 120 129 135 150 180 交通事故数y /千件6.27.57.78.58.79.810.213(1)请判断机动车辆数与交通事故数之间是否有线性相关关系,如果不具有线性相关关系,说明理由;(2)如果具有线性相关关系,求出线性回归方程. 解:(1)在直角坐标系中画出数据的散点图,如下图.直观判断散点在一条直线附近,故具有线性相关关系. (2)计算相应的数据之和:∑=81i ix=1 031,∑=81i iy=71.6,∑=812i ix=137 835,∑=81i ii yx =9 611.7.将它们代入公式计算得b ≈0.077 4,a =-1.024 1, 所以,所求线性回归方程为y =0.077 4x -1.024 1.思路2例1 给出施化肥量对水稻产量影响的试验数据: 施化肥量x15202530354045水稻产量y330345365405445450455(1)画出上表的散点图; (2)求出回归直线的方程. 解:(1)散点图如下图.(2)表中的数据进行具体计算,列成以下表格:i 1 2 3 4 5 6 7 x i 15 20 25 30 35 40 45 y i 330 345 365 405 445 450 455 x i y i4 9506 9009 12512 15015 57518 00020 47587175,1132725,7000,3.399,3071712712=====∑∑∑===i i i i ii iy x y x y x故可得到 b =230770003.39930787175⨯-⨯⨯-≈4.75, a =399.3-4.75×30≈257.从而得回归直线方程是^y =4.75x +257.例2 一个车间为了规定工时定额,需要确定加工零件所花费的时间.为此进行了10次试验,测得数据如下: 零件个数x (个) 10 20 30 40 50 60 70 80 90 100 加工时间y (分)626875818995102108115122请判断y 与x 是否具有线性相关关系,如果y 与x 具有线性相关关系,求线性回归方程. 解:在直角坐标系中画出数据的散点图,如下图.直观判断散点在一条直线附近,故具有线性相关关系.由测得的数据表可知:∑===1012,7.91,55i ix y x =38 500,∑=1012i iy =87 777,∑=101i i i y x =55 950.b =2210121015510385007.915510559501010⨯-⨯⨯-=--∑∑==x xyx yx i ii ii≈0.668. a =x b y -=91.7-0.668×55≈54.96.因此,所求线性回归方程为^y =bx +a =0.668x +54.96.例3 已知10条狗的血球体积及红血球数的测量值如下: 血球体积x (mL) 45 42 46 48 42 35 58 40 39 50 红血球数y (百万)6.536.309.527.506.995.909.496.206.558.72(1)画出上表的散点图; (2)求出回归直线的方程. 解:(1)散点图如下.(2)101=x (45+42+46+48+42+35+58+40+39+50)=44.50, 101=y (6.53+6.30+9.52+7.50+6.99+5.90+9.49+6.20+6.55+8.72)=7.37.设回归直线方程为^y=bx+a,则b=210121011010xxyxyxiiiii--∑∑===0.175,a=x by-=-0.418,所以所求回归直线的方程为^y=0.175x-0.148.点评:对一组数据进行线性回归分析时,应先画出其散点图,看其是否呈直线形,再依系数a,b 的计算公式,算出a,b.由于计算量较大,所以在计算时应借助技术手段,认真细致,谨防计算中产生错误,求线性回归方程的步骤:计算平均数yx,;计算x i与y i的积,求∑x i y i;计算∑x i2;将结果代入公式求b;用a=x by-求a;写出回归直线方程.知能训练1.下列两个变量之间的关系哪个不是函数关系()A.角度和它的余弦值B.正方形边长和面积C.正n边形的边数和它的内角和D.人的年龄和身高【答案】D2.三点(3,10),(7,20),(11,24)的线性回归方程是()A.^y=5.75-1.75x B.^y=1.75+5.75xC.^y=1.75-5.75x D.^y=5.75+1.75x【答案】D3.已知关于某设备的使用年限x与所支出的维修费用y(万元),有如下统计资料:使用年限x 2 3 4 5 6 维修费用y2.2 3.8 5.5 6.5 7.0 设y对x呈线性相关关系.试求:(1)线性回归方程^y=bx+a的回归系数a,b;(2)估计使用年限为10年时,维修费用是多少?【答案】(1)b=1.23,a=0.08;(2)12.38.4.我们考虑两个表示变量x与y之间的关系的模型,δ为误差项,模型如下:模型1:y=6+4x;模型2:y=6+4x+e.(1)如果x=3,e=1,分别求两个模型中y的值;(2)分别说明以上两个模型是确定性模型还是随机模型.解:(1)模型1:y=6+4x=6+4×3=18;模型2:y=6+4x+e=6+4×3+1=19.(2)模型1中相同的x值一定得到相同的y值,所以是确定性模型;模型2中相同的x值,因δ的不同,所得y值不一定相同,且δ为误差项是随机的,所以模型2是随机性模型.5.以下是收集到的新房屋销售价格y与房屋大小x的数据:房屋大小x(m2)80 105 110 115 135销售价格y(万元)18.4 22 21.6 24.8 29.2 (1)画出数据的散点图;(2)用最小二乘法估计求线性回归方程.解:(1)散点图如下图.(2)n=5,∑=51iix=545,x=109,∑=51iiy=116,y=23.2,∑=512iix=60 952,∑=51iiiyx=12 952,b=2545609525116545129525-⨯⨯-⨯≈0.199,a=23.2-0.199×109≈1.509,所以,线性回归方程为y=0.199x+1.509.拓展提升某调查者从调查中获知某公司近年来科研费用支出(X i)与公司所获得利润(Y i)的统计资料如下表:科研费用支出(X i)与利润(Y i)统计表单位:万元年份科研费用支出利润1998199951131402000 2001 2002 2003 4 5 3 2 30 34 25 20 合计30180要求估计利润(Y i )对科研费用支出(X i )的线性回归模型. 解:设线性回归模型直线方程为:i i X Y 1^0^^ββ+=, 因为:630==∑nXx i=5,6180==∑nYY i=30, 根据资料列表计算如下表: 年份 X i Y i X i Y i X i 2 X i -X Y i -Y (X i -X )2 (X i -X )(Y i -Y ) 1998 1999 2000 2001 2002 2003 5 11 4 5 3 2 31 40 30 34 25 20 155 440 120 170 75 40 25 121 16 25 9 4 0 6 -1 0 -2 -3 1 10 0 4 -5 -10 0 36 1 0 4 9 0 60 0 0 10 30 合计301801 00020050100现求解参数β0、β1的估计值: 方法一:3006009001200540060003020061803010006)(2221^=--=-⨯⨯-⨯=--=∑∑∑∑i i ii i X X n Y Y X n β=2, x Y 1^0^ββ-==30-2×5=20.方法二:501005620030561000)(2221^=⨯-⨯⨯-=--=∑∑x n X Yx n Y X ii i β=2, x Y 1^0^ββ-==30-2×5=20.方法三:50100)())((21^=---=∑∑x X Y Y x X ii iβ=2, x Y 1^0^ββ-==30-2×5=20.所以利润(Y i )对科研费用支出(X i )的线性回归模型直线方程为:i Y ^=20+2X i . 课堂小结1.求线性回归方程的步骤: (1)计算平均数y x ,; (2)计算x i 与y i 的积,求∑x i y i ; (3)计算∑x i 2,∑y i 2,(4)将上述有关结果代入公式⎪⎪⎪⎩⎪⎪⎪⎨⎧-=--=---=∑∑∑∑====xb y a x n x yx n yx x x y y x x b n i i ni ii ni i ni i i ,)())((1221121求b ,a ,写出回归直线方程.2.经历用不同估算方法描述两个变量线性相关的过程.知道最小二乘法的思想,能根据给出的线性回归方程系数公式建立线性回归方程. 作业习题2.3A 组3、4,B 组1、2.设计感想本节课在上节课的基础上,利用实例分析了散点图的分布规律,推导出了线性回归直线的方程的求法,并利用回归直线的方程估计可能的结果,本节课讲得较为详细,实例较多,便于同学们分析比较.思路1和思路2的例题对知识进行了巩固和加强,另外,本节课通过选取一些学生特别关心的身边事例,对学生进行思想情操教育、意志教育和增强学生的自信心,养成良好的学习态度,树立时间观,培养勤奋、刻苦的精神.。

2.3.2两个变量的线性相关 精品课教案

2.3.2两个变量的线性相关 精品课教案

§2.3.2两个变量的线性相关一、教学内容解析本节课为两个变量的线性相关,是人教A版必修三第二章第三节的内容,通过用线性回归分析,刻画两个变量之间的相关关系,让学生经历一个相对完整的统计过程,感受统计与实际生活的联系以及在解决实际问题中的重要作用。

两变量的线性回归内容,既是前面单变量数据样本估计总体的拓展,也是统计学科回归分析的典型,为选修2-3回归分析的学习提供思路与模型,起到承上启下的教学作用。

对于具有线性相关关系的两个变量,应鼓励学生用多种方法探索确定线性回归直线方程,在此基础上,再引导学生了解最小二乘法思想,根据给出的公式求出线性回归直线方程。

在学生“经历收集数据——画散点图——用不同估算方法描述两个变量线性相关关系”的过程后,解决好用数学方法刻画“从整体上看,各点与此直线的距离最小”,让学生在此基础上了解更为科学的数据处理方式——最小二乘法,有助于更好地理解核心概念,并最终体现回归方法的应用价值。

考虑到本节课教学侧重点和新课标的要求,并充分注意到已有的相关教与学的的实践经验与教训,对线性回归方程系数的计算公式,可直接给出。

由于公式的复杂性,一方面,既要通过教学设计合理体现知识发生过程,不搞“割裂”;另一方面,要合理归纳回归方程求解步骤,让学生获得具体的程序化解题,尽量避免求解过程出错。

同时,也鼓励学生尝试计算器,和Excel软件功能,简化繁琐的系数求解过程,利用现代化工具解决统计问题。

二、学生学情分析经过调查,多数学生虽然具备初步的统计基础知识,但是良好的统计观念普遍尚未形成,统计经验比较缺乏,另外,学生的计算能力也比较欠缺。

知识发展的要求和学生能力和经验的欠缺成为本节课将会遇到期的最大矛盾。

教学中,要防止两种倾向:一是直接套用回归系数公式求解回归方程而回避说理过程;二是过多纠缠于数学刻画过程,甚至在课堂内花大量时间对回归系数公式进行证明说理.这两种倾向都脱离了学生的实际,前者忽略了“最小二乘法思想”,迷失了本节课的教学目标;后者人为拔高教材的要求,背离了本节课的教学要求.三、教学目标与重难点知识与技能目标能根据散点图判断两变量的线性相关,了解最小二乘法思想,掌握回归方程系数公式求回归方程,理解回归分析思想;过程与方法目标经历一个相对完整的统计推断过程,了解“最小二乘法”思想建立回归方程,学生学科素养和能力得到到发展,自主探究,合作探究等习惯得到培养;结合具体案例,经历数据收集整理,观察分析,运算操作,应用结论预测等完整步骤,培养了学生应用统计方法解决实际问题的能力与意识。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

2.3.2两个变量的线性相关
教学目标:经历用不同估算方法描述两个变量线性相关的过程。

知道最小二乘法的思想,能
根据给出的线性回归方程系数公式建立线性回归方程。

教学重点:经历用不同估算方法描述两个变量线性相关的过程。

知道最小二乘法的思想,能
根据给出的线性回归方程系数公式建立线性回归方程。

教学过程:
1.回顾上节课的案例分析给出如下概念: (1)回归直线方程 (2)回归系数
2.最小二乘法
3.直线回归方程的应用
(1)描述两变量之间的依存关系;利用直线回归方程即可定量描述两个变量间依存
的数量关系
(2)利用回归方程进行预测;把预报因子(即自变量x )代入回归方程对预报量(即
因变量Y )进行估计,即可得到个体Y 值的容许区间。

(3)利用回归方程进行统计控制规定Y 值的变化,通过控制x 的范围来实现统计控
制的目标。

如已经得到了空气中NO 2的浓度和汽车流量间的回归方程,即可通过控制汽车流量来控制空气中NO 2的浓度。

4.应用直线回归的注意事项
(1)做回归分析要有实际意义;
(2)回归分析前,最好先作出散点图; (3)回归直线不要外延。

5.实例分析: 某调查者从调查中获知某公司近年来科研费用支出(i X )与公司所获得利润(i Y )的统计资料如下表:
i X i Y 要求估计利润(i Y )对科研费用支出(i X )的线性回归模型。

解:设线性回归模型直线方程为:i i X Y 10ˆˆ
ˆββ+=
因为:
5630==
=
∑n X
X i
306180
==
=∑n
Y
Y i
现利用公式(Ⅰ)、(Ⅱ)、(Ⅲ)求解参数
10的估计值:
2
300600900120054006000302006180
3010006)(ˆ22
2
1==--=
-⨯⨯-⨯=
--=∑∑∑∑∑i i i i i i X X n Y X Y X n β 20
5
230ˆˆ10=⨯-=-=X Y ββ
∑∑--=-=2
21
10)
(ˆˆˆX n X Y
X n Y X X Y i
i i βββ 20
5
230ˆˆ10=⨯-=-=X Y ββ
2501005620030
5610002==⨯-⨯⨯-= ∑∑---=-=2
1
10)())((ˆˆˆX X Y Y X X X Y i
i i
βββ 20
5
230ˆˆ1
0=⨯-=-=X Y ββ
250100==
所以:利润(i Y )对科研费用支出(i X )的线性回归模型直线方程为:
i i X Y 220ˆ+=
6、求直线回归方程,相关系数和作图,这些EXCEL 可以方便地做到。

仍以上题的数据为例。

于 EXCEL 表 中的空白区,选用"插入"菜单命令中的"图表",选中 XY 散 点图类型,在弹出的图表向导中按向导的要求一步一步地 操作,如有错误可以返回去重来或在以后修改。

适当修饰 图的大小、纵横比例、字体大小、和图符的大小等,使图 美观,最后得到图1,图中有直线称为趋势线,还有直线方程和相关系数。

图中的每一个部份如坐标、标题、图例 等都可以分别修饰,这里主要介绍趋势线和直线方程。

图1散点图
鼠标右键点击图中的数据点,出现一个对话框,选 " 添加趋势线" ,图中自动画上一条直线,再以鼠标右击此线,出现趋势线格式对话框,选择线条的粗细和颜色,在选项中选取显示公式和显示R 平方值,确定后即在图中显示回归方程和相关系数。

课堂练习:第83页,练习A,练习B
小结:经历用不同估算方法描述两个变量线性相关的过程。

知道最小二乘法的思想,能根据
给出的线性回归方程系数公式建立线性回归方程。

课后作业:第84页,习题2-3A 第1、2题,。

相关文档
最新文档