2017学年数学必修三:2.3.1-变量之间的相关关系~2.3.2 两个变量的线性相关2
2.3.1(2.3.2)变量之间的相关关系和线性关系
2.3 变量间的相关关系2.3.1 变量之间的相关关系2.3.2 两个变量的线性相关整体设计教学分析变量之间的关系是人们感兴趣的问题.教科书通过思考栏目“物理成绩与数学成绩之间的关系”,引导学生考察变量之间的关系.在教师的引导下,可使学生认识到在现实世界中存在不能用函数模型描述的变量关系,从而体会研究变量之间的相关关系的重要性.随后,通过探究人体脂肪百分比和年龄之间的关系,引入描述两个变量之间关系的线性回归方程(模型).教科书在探索用多种方法确定线性回归直线的过程中,向学生展示创造性思维的过程,帮助学生理解最小二乘法的思想.通过气温与饮料销售量的例子及随后的思考,使学生了解利用线性回归方程解决实际问题的全过程,体会线性回归方程作出的预测结果的随机性,并且可能犯的错误.进一步,教师可以利用计算机模拟和多媒体技术,直观形象地展示预测结果的随机性和规律性.三维目标1.通过收集现实问题中两个有关联变量的数据认识变量间的相关关系.2.明确事物间的相互联系.认识现实生活中变量间除了存在确定的关系外,仍存在大量的非确定性的相关关系,并利用散点图直观体会这种相关关系.3.经历用不同估算方法描述两个变量线性相关的过程.知道最小二乘法的思想,能根据给出的线性回归方程的系数公式建立线性回归方程.重点难点教学重点:通过收集现实问题中两个有关联变量的数据直观认识变量间的相关关系;利用散点图直观认识两个变量之间的线性关系;根据给出的线性回归方程的系数公式建立线性回归方程.教学难点:变量之间相关关系的理解;作散点图和理解两个变量的正相关和负相关;理解最小二乘法的思想.课时安排2课时教学过程第1课时导入新课思路1在学校里,老师对学生经常这样说:“如果你的数学成绩好,那么你的物理学习就不会有什么大问题.”按照这种说法,似乎学生的物理成绩与数学成绩之间存在着一种相关关系.这种说法有没有根据呢?的,物理也好;数学差的,物理也差,但又不全对.)物理成绩和数学成绩是两个变量,从经验看,由于物理学习要用到比较多的数学知识和数学方法.数学成绩的高低对物理成绩的高低是有一定影响的.但决非唯一因素,还有其他因素,如是否喜欢物理,用在物理学习上的时间等等.(总结:不能通过一个人的数学成绩是多少就准确地断定他的物理成绩能达到多少.但这两个变量是有一定关系的,它们之间是一种不确定性的关系.如何通过数学成绩的结果对物理成绩进行合理估计有非常重要的现实意义.)为很好地说明上述问题,我们开始学习变量之间的相关关系和两个变量的线性相关.(教师板书课题)思路2某地区的环境条件适合天鹅栖息繁衍,有人经统计发现了一个有趣的现象,如果村庄附近栖息的天鹅多,那么这个村庄的婴儿出生率也高,天鹅少的地方婴儿的出生率低,于是,他就得出一个结论:天鹅能够带来孩子.你认为这样得到的结论可靠吗?如何证明这个结论的可靠性?推进新课新知探究提出问题(1)粮食产量与施肥量有关系吗?“名师出高徒”可以解释为教师的水平越高,学生的水平也越高.教师的水平与学生的水平有什么关系?你能举出更多的描述生活中两个变量的相关关系的成语吗?(2)两个变量间的相关关系是什么?有几种?(3)两个变量间的相关关系的判断.讨论结果:(1)粮食产量与施肥量有关系,一般是在标准范围内,施肥越多,粮食产量越高;教师的水平与学生的水平是相关的,如水滴石穿,三人行必有我师等.我们还可以举出现实生活中存在的许多相关关系的问题.例如:商品销售收入与广告支出经费之间的关系.商品销售收入与广告支出经费有着密切的联系,但商品销售收入不仅与广告支出多少有关,还与商品质量、居民收入等因素有关.粮食产量与施肥量之间的关系.在一定范围内,施肥量越大,粮食产量就越高.但是,施肥量并不是决定粮食产量的唯一因素.因为粮食产量还要受到土壤质量、降雨量、田间管理水平等因素的影响.人体内的脂肪含量与年龄之间的关系.在一定年龄段内,随着年龄的增长,人体内的脂肪含量会增加,但人体内的脂肪含量还与饮食习惯、体育锻炼等有关,可能还与个人的先天体质有关.应当说,对于上述各种问题中的两个变量之间的相关关系,我们都可以根据自己的生活、学习经验作出相应的判断,因为“经验当中有规律”.但是,不管你的经验多么丰富,如果只凭经验办事,还是很容易出错的.因此,在分析两个变量之间的相关关系时,我们需要一些有说服力的方法.在寻找变量之间相关关系的过程中,统计同样发挥着非常重要的作用.因为上面提到的这种关系,并不像匀速直线运动中时间与路程的关系那样是完全确定的,而是带有不确定性.这就需要通过收集大量的数据(有时通过调查,有时通过实验),在对数据进行统计分析的基础上,发现其中的规律,才能对它们之间的关系作出判断.(2)相关关系的概念:自变量取值一定时,因变量的取值带有一定随机性的两个变量之间的关系,叫做相关关系.两个变量之间的关系分两类:①确定性的函数关系,例如我们以前学习过的一次函数、二次函数等;②带有随机性的变量间的相关关系,例如“身高者,体重也重”,我们就说身高与体重这两个变量具有相关关系.相关关系是一种非确定性关系.如商品销售收入与广告支出经费之间的关系.(还与商品质量、居民收入、生活环境等有关)(3)两个变量间的相关关系的判断:①散点图.②根据散点图中变量的对应点的离散程度,可以准确地判断两个变量是否具有相关关系.③正相关、负相关的概念.①教学散点图出示例题:在一次对人体脂肪含量和年龄关系的研究中,研究人员获得了一组样本数据:图来进一步分析.②散点图的概念:将各数据在平面直角坐标系中的对应点画出来,得到表示两个变量的一组数据的图形,这样的图形叫做散点图,如下图.从散点图我们可以看出,年龄越大,体内脂肪含量越高.图中点的趋势表明两个变量之间确实存在一定的关系,这个图支持了我们从数据表中得出的结论.(a.如果所有的样本点都落在某一函数曲线上,就用该函数来描述变量之间的关系,即变量之间具有函数关系.b.如果所有的样本点都落在某一函数曲线附近,变量之间就有相关关系.c.如果所有的样本点都落在某一直线附近,变量之间就有线性相关关系)③正相关与负相关的概念:如果散点图中的点散布在从左下角到右上角的区域内,称为正相关.如果散点图中的点散布在从左上角到右下角的区域内,称为负相关.(注:散点图的点如果几乎没有什么规则,则这两个变量之间不具有相关关系)应用示例思路1例1 下列关系中,带有随机性相关关系的是_____________.①正方形的边长与面积之间的关系②水稻产量与施肥量之间的关系③人的身高与年龄之间的关系④降雪量与交通事故的发生率之间的关系解析:两变量之间的关系有两种:函数关系与带有随机性的相关关系.①正方形的边长与面积之间的关系是函数关系.②水稻产量与施肥量之间的关系不是严格的函数关系,但是具有相关性,因而是相关关系.③人的身高与年龄之间的关系既不是函数关系,也不是相关关系,因为人的年龄达到一定时期身高就不发生明显变化了,因而他们不具备相关关系.④降雪量与交通事故的发生率之间具有相关关系,因此填②④.答案:②④例2 有关法律规定,香烟盒上必须印上“吸烟有害健康”的警示语.吸烟是否一定会引起健康问题?你认为“健康问题不一定是由吸烟引起的,所以可以吸烟”的说法对吗?分析:学生思考,然后讨论交流,教师及时评价.解:从已经掌握的知识来看,吸烟会损害身体的健康,但是除了吸烟之外,还有许多其他的随机因素影响身体健康,人体健康是很多因素共同作用的结果.我们可以找到长寿的吸烟者,也更容易发现由于吸烟而引发的患病者,所以吸烟不一定引起健康问题.但吸烟引起健康问题的可能性大.因此“健康问题不一定是由吸烟引起的,所以可以吸烟”的说法是不对的.点评:在探究研究的过程中,如果能够从两个变量的观察数据之间发现相关关系是极为有意义的,由此可以进一步研究二者之间是否蕴涵因果关系,从而发现引起这种相关关系的本质原因是什么.本题的意义在于引导学生重视对统计结果的解释,从中发现进一步研究的问题.思路2例1 有时候,一些东西吃起来口味越好,对我们的身体越有害.下表给出了不同类型的某种食品的数据.第二列表示此种食品所含热量的百分比,第三列数据表示由一些美食家以百分制给出的对此种食品口味的评价:(2)关于两个变量之间的关系,你能得出什么结论?解:(1)散点图如下:(2)基本成正相关关系,即食品所含热量越高,口味越好.例2 案例分析:一般说来,一个人的身高越高,他的右手一拃长就越长,因此,人的身高与右手一拃长之间存在着一定的关系.为了对这个问题进行调查,我们收集了北京市某中学2003年高三年级96名学生的身高与右手一拃长的数据如下表.(1)根据上表中的数据,制成散点图.你能从散点图中发现身高与右手一拃长之间的近似关系吗?(2)如果近似成线性关系,请画出一条直线来近似地表示这种线性关系.(3)如果一个学生的身高是188 cm,你能估计他的一拃大概有多长吗?解:根据上表中的数据,制成的散点图如下.从散点图上可以发现,身高与右手一拃长之间的总体趋势是成一直线,也就是说,它们之间是线性相关的.那么,怎样确定这条直线呢?同学1:选择能反映直线变化的两个点,例如(153,16),(191,23)两点确定一条直线.同学2:在图中放上一根细绳,使得上面和下面点的个数相同或基本相同.同学3:多取几组点对,确定几条直线方程.再分别算出各个直线方程斜率、截距的算术平均值,作为所求直线的斜率、截距.同学4:从左端点开始,取两条直线,如下图.再取这两条直线的“中间位置”作一条直线.同学5:先求出相同身高同学右手一拃长的平均值,画出散点图,如下图,再画出近似的直线,使得在直线两侧的点数尽可能一样多.同学6:先将所有的点分成两部分,一部分是身高在170 cm以下的,一部分是身高在170 cm 以上的;然后,每部分的点求一个“平均点”——身高的平均值作为平均身高、右手一拃的平均值作为平均右手一拃长,即(164,19),(177,21);最后,将这两点连接成一条直线.同学7:先将所有的点按从小到大的顺序进行排列,尽可能地平均分成三等份;每部分的点按照同学3的方法求一个“平均点”,最小的点为(161.3,18.2),中间的点为(170.5,20.1),最大的点为(179.2,21.3).求出这三个点的“平均点”为(170.3,19.9).我再用直尺连接最大点与最小点,然后平行地推,画出过点(170.3,19.9)的直线.同学8:取一条直线,使得在它附近的点比较多.在这里需要强调的是,身高和右手一拃长之间没有函数关系.我们得到的直线方程,只是对其变化趋势的一个近似描述.对一个给定身高的人,人们可以用这个方程来估计这个人的右手一拃长,这是十分有意义的.知能训练一个车间为了规定工时定额,需要确定加工零件所花费的时间,为此进行了10次试验,收集数据如下:关于加工零件的个数与加工时间,你能得出什么结论?答案:(1)散点图如下:(2)加工零件的个数与所花费的时间呈正线性相关关系.拓展提升以下是某地搜集到的新房屋的销售价格y和房屋的面积x的数据:(2)指出是正相关还是负相关;(3)关于销售价格y和房屋的面积x,你能得出什么结论?解:(1)数据对应的散点图如下图所示:(2)散点图中的点散分布在从左下角到右上角的区域内,所以是正相关.(3)关于销售价格y和房屋的面积x,房屋的面积越大,价格越高,它们呈正线性相关的关系. 课堂小结通过收集现实问题中两个有关联变量的数据作出散点图,并利用散点图直观认识变量间的相关关系.作业习题2.3A组3、4(1).设计感想本节课学习了变量之间的相关关系和两个变量的线性相关的部分内容,通过身边的具体实例说明了两个变量的相关关系,并学会了利用散点图及其分布来说明两个变量的相关关系的种类,为下一节课作了铺垫,思路1和思路2的例题对知识进行了巩固和加强,另外,本节课通过选取一些学生特别关心的身边事例,对学生进行思想情操教育、意志教育和增强学生的自信心,养成良好的学习态度和学习方法,树立时间观,培养勤奋、刻苦耐劳的精神.备课资料数学家关肇直关肇直(1919.2.13—1982.11.12),中国科学院院士,是中国数学家,生于北京.原籍广东省南海县.父亲关葆麟早年留学德国,回国后任铁道工程师多年,于1932年故世;母亲陆绍馨,是北平女子师范大学的毕业生,曾从教于北京师范大学.关葆麟去世后,母亲以微薄的收入艰难地抚育关肇直及其弟妹多人.全国解放后,关肇直尽心亲侍慈母,直至1967年去世.关肇直于1959年1月与刘翠娥结婚,他们有两个女儿.刘翠娥系中国科学院工程物理研究所研究人员.关肇直于1927年进入北京培华中学附属小学学习.1931年入英国人办的崇德中学学习.学校对英文要求十分严格,加上关肇直自小就由父母习以英文、德文,为日后掌握英文、德文、法文、西班牙文和俄文奠定了良好基础.1936年高中毕业后考入清华大学土木工程系,后于1938年转入燕京大学数学系学习.毕业后在燕京大学(后迁成都)任教.参加成都教授联谊会,担任学生进步组织的导师,积极支持抗日救国学生运动.1946年春从成都返回北平(北京),不久从燕京大学转到北京大学数学系任教.1947年通过考试成为国民政府派遣的中法交换生赴法国留学.名义上去瑞士学哲学,实际上去了巴黎大学庞加莱研究所研究数学,导师是著名数学家、一般拓朴与泛函分析的创始人弗雷歇(M.R.F rechetl),1948年参加革命团体“中国科学工作者协会”,是该会旅法分会的创办人之一.1949年10月,新中国诞生,他毅然决定放弃获得博士学位的机会.于12月回到祖国,满腔热情地参加了新中国的建设.他立即参加了组建中国科学院的工作.他和其他同志一起,协助郭沫若院长筹划建院事宜,确定科学院的方向、任务、体制等,组建科学院图书馆,担任图书管理处处长,编译局处长.1952年参加筹建中国科学院数学研究所的工作,并在数学研究所从事数学研究,历任副研究员、研究员、研究室主任、副所长、学术委员会副主任.他还是中国科学院声学研究所学术委员会委员及原子能研究所学术委员会委员.从1952年起,兼任北京师范大学、北京大学、中国人民大学和中国科技大学等校教授以及华南工学院名誉教授;并兼任过中国科学院成都分院学术顾问、该院数理科学研究室主任、中国科学院武汉数学物理研究所顾问、研究员.他还是国家科委数学学科组副组长、自动化学科组成员;曾担任北京数学会理事长,中国数学会秘书长,国际自动控制联合会理论委员会成员及《中国科学》《科学通报》《数学学报》和《系统科学与数学》等杂志的编委或主编等职.1980年,他与其他科学家一起创建中国科学院系统科学研究所,担任研究所所长.他还担任中国自动化学会副理事长、中国系统工程学会理事长.1980年当选为中国科学院数理学部委员.关肇直长期从事泛函分析、数学物理、现代控制理论等领域的研究,成绩卓著,为我国的社会主义现代化建设作出了重大贡献,1978年获全国科学大会奖,1980年获国防科委、国工办科研奖十几项,1982年获国家自然科学二等奖;关肇直参与主持的项目《尖兵一号返回型卫星和东方红一号》获1985年国家科技进步特等奖,他本人获“科技进步”奖章.关肇直从事泛函分析、数学物理和现代控制理论研究方面,取得水平很高的成果.主要成果有以下几个方面.(一)最速下降法与单调算子思想关肇直于《数学学报》第6卷第4期(1956)发表了学术论文“解非线性函数方程的最速下降法”,第一次把梯度法(又称最速下降法)由有限维空间推广到无限维空间,而且和线性问题相仿,其收敛速度是依照等比级数的.这种方法可以用来解某些非线性积分方程以及某些非线性微分方程边值问题.并在文中首先提出了单调算子的思想,比外国学者早四五年.国外关于单调算子的概念,最早见于1960年扎朗顿尼罗和闵梯(E.H.Z afantonello,G.J.M inty)的工作.单调算子是非线性泛函分析中很基本的概念之一,单调算子理论已成为泛函分析中的一个重要分支,在处理力学、物理学中的许多非线性问题中被广泛地应用.(二)激光问题的数学理论在数学物理方面,关肇直也进行了深入的研究.他在《中国科学》第14卷第7期(1956)上用法文发表了学术论文“关于…激光理论‟中积分方程的非零本征值的存在性”在论文中他利用泛函分析工具,在很弱的假设下,用极为简短的方式证明了激光理论中一般形式的具有非对称核的线性积分方程非零本征值的存在.这一结果受到国际上的重视.被国外书刊广泛引用,如M agraw H ill图书公司1972年出版的柯克朗(J.A.C ochran)著的《线性积分方程分析》一书就曾详细地引用过.(三)中子迁移理论关肇直在数学物理方面的另一个创造,就是关于中子迁移理论的研究.1963年他用希尔伯特空间与不定规度空间的算子谱理论解决了平板几何情形的中子迁移的本征函数问题,著有“关于一类本征值问题”(当时未发表).这比国外罕日布鲁克(H angelbrook)1973年的同类工作早10年.卡帕(H.G.K aper)和兹维贝尔(P.F.Z weibel)在1975年举行的国际迁移理论第四次会议上的报告(载于期刊《T ranspost T heory and S tatistical P hysiss》V ol.4,N o.3,第105—123页,1975)中,在“迁移理论中有什么创新”标题下,把罕日布鲁克的方法称为求解方程的新方法;但是,罕氏著作中所解决的问题,在关肇直的文章中是早已解决了的.关肇直于1963年完成的这篇论文直到他去世后于1984年发表在《数学物理学报》上,国外同行当得知他在60年代就作出了如此高水平的工作时都深表惊异.(四)飞行器弹性控制理论关肇直在《中国科学》1974年第4期上发表了“弹性振动的镇定问题”,首先提出了用线性算子紧扰动理论解决飞行器弹性振动的镇定问题.在这之前,美国的著名控制论专家鲁塞尔(D.L.R ussell)曾用别的方法讨论过此类问题,但他自己认为他所得的结果“当然并非完全满意”,“增益系数的增大应能改进系统的稳定性,但这样整体性结果没有得到……”他甚至认为:显然他所用的方法“带来必须小的缺陷,……,但很怀疑这里定理所表述的结果的确切化用任何别的技术来实现.”可是,与鲁塞尔的怀疑相反,关肇直用了算子紧扰动方法技巧,此方法与鲁塞方法有本质的区别,它确实摆脱了放大系数很小的限制,得出了工程意义更合理的结果.这项成果已经应用到我国的国防尖端技术设计上,成为导弹运载火箭所必不可少的一个设计理论.(五)几本主要著作1.《泛函分析讲义》1958年高等教育出版社出版了关肇直的《泛函分析讲义》.该书吸取了当时国际上几部有名的介绍泛函分析概要的书的长处,内容适中,很具特色,便于自学.这是国内第一部包括当时泛函分析各分支的较全面的专著,国内当时这类书很少;国内除此之外,迄今也仍只有一些教科书性质的出版物,还没有别的书代替它.关肇直曾使用这部著作在1956年和1957年分别为中国科学院数学研究所一批青年同志和北京大学第一届泛函分析专门化学生讲授过《泛函分析》课程,培养了一批从事泛函分析等方面的中青年骨干教师和科研人员.此书至今仍有重大参考价值.2.《拓扑空间榻论》科学出版社于1958年出版了关肇直教授的这本书.本书是为了数学分析方面的青年数学工作者的需要而写的.目的是使读者获得关于拓扑空间理论的基础知识.本书在当时是这方面较系统的也是较早的一部专著.作者是按照自己的观点来写的,书中许多定理的证明都是作者给出的,他尽可能地遵循一般实变函数论中的叙述问题的方式,因而有自己的特色.这是为了使读者感到新知识与原有知识有联系,对新的抽象概念不至感到突然,同时又帮助读者直达科学研究的前沿.根据研究概率论方面的读者反映,对他们研究极限定理一类工作颇有帮助.3.《高等数学教程》人民教育出版社于1959年出版.本书是关肇直在中国科技大学开办应用数学专业讲授高等数学课程而编写的教材,特点是:材料比较丰富,注意理论联系实际.4.《线性泛函分析入门》上海科技出版社于1979年出版.关肇直同他的学生张恭庆、冯德兴合著.著书的目的是为了满足多方面科学研究工作者的需要,因为当时线性泛函分析已成为许多从事科学技术研究的人所渴望了解和应用的一门数学学科.此书的特点是:尽可能从一些问题提炼出泛函分析中的基本概念,让读者透过叙述方法了解到研究的过程.5.《现代控制系统理论小丛书》这是由关肇直主编的,包括线性系统理论、非线性系统理论、极值控制理论、系统辨识、最优控制与随机控制理论、分布参数系统理论及其他有关内容,共分十几分册,由科学出版社从1975年开始陆续出版.这套丛书介绍了现代控制系统理论的各个部分,并着重说明这种理论怎样由工程实践的需要而产生,又怎样用来解决工程设计中的实际问题.此丛书主要是为从事控制理论研究的科学工作者和工程技术人员而撰写的.此丛书的出版,对于促进我国的控制理论和控制技术的发展起到了很好的作用.。
高中数学第二章统计2.3变量的相关性2.3.1-2.3.2变量间的相关关系两个变量的线性相关教学案新人教B版必修3
2.3.1 & 2.3.2 变量间的相关关系 两个变量的线性相关习课本P73~78,思考并完成以下问题预(1)相关关系是函数关系吗?(2)什么是正相关、负相关?与散点图有什么关系?(3)回归直线方程是什么?如何求回归系数?(4)如何判断两个变量之间是否具备相关关系?[新知初探]1.两个变量的关系分类函数关系相关关系 特征两变量关系确定两变量关系带有随机性2.散点图将样本中n 个数据点(x i ,y i )(i =1,2,…,n )描在平面直角坐标系中得到的图形. 3.正相关与负相关(1)正相关:如果一个变量的值由小变大时,另一个变量的值也由小变大,这种相关称为正相关.(2)负相关:如果一个变量的值由小变大时,另一个变量的值由大变小,这种相关称为负相关.4.最小二乘法设x ,Y 的一组观察值为(x i ,y i ),i =1,2,…,n ,且回归直线方程为y ^=a +bx ,当x 取值x i (i =1,2,…,n )时,Y 的观察值为y i ,差y i -y ^i (i =1,2,…,n )刻画了实际观察值y i 与回归直线上相应点纵坐标之间的偏离程度,通常是用离差的平方和,即Q =i =1n(y i -a-bx i)2作为总离差,并使之达到最小.这样,回归直线就是所有直线中Q取最小值的那一条.由于平方又叫二乘方,所以这种使“离差平方和最小”的方法,叫做最小二乘法.5.回归直线方程的系数计算公式回归直线方程回归系数系数a^的计算公式方程或公式y^=a^+b^x b^=∑i=1nxiyi-n x-y-∑i=1nx2i-n x2a^=y-b^x-上方加记号“^ ”的意义区分y的估计值y^与实际值ya,b上方加“^ ”表示由观察值按最小二乘法求得的估计值[小试身手]1.下列命题正确的是( )①任何两个变量都具有相关关系;②圆的周长与该圆的半径具有相关关系;③某商品的需求量与该商品的价格是一种非确定性关系;④根据散点图求得的回归直线方程可能是没有意义的;⑤两个变量间的相关关系可以通过回归直线,把非确定性问题转化为确定性问题进行研究.A.①③④B.②③④C.③④⑤D.②④⑤解析:选C ①显然不对,②是函数关系,③④⑤正确.v,u;对变量1,得散点图图10),…,1,2=i)(iy,ix(有观测数据y,x.对变量2)(由这两个散点图可以判断2.,得散点图图10),…,1,2=i)(iv,iu(有观测数据A.变量x与y正相关,u与v正相关B.变量x与y正相关,u与v负相关C .变量x 与y 负相关,u 与v 正相关D .变量x 与y 负相关,u 与v 负相关解析:选C 由这两个散点图可以判断,变量x 与y 负相关,u 与v 正相关.80,当施肥量为250+x 5=y ^归方程为的线性回(kg)y 与水稻产量(kg)x .若施肥量3kg 时,预计水稻产量约为________kg..650(kg)=250+5×80=y ^代入回归方程可得其预测值80=x 解析:把 答案:6504.对具有线性相关关系的变量x 和y ,测得一组数据如下表所示.x 2 4 5 6 8y 30 40 60 50 70若已求得它们的回直线的方程为______________________.,5=2+4+5+6+85=x 解析:由题意可知 y50.=30+40+60+50+705=即样本中心为(5,50).,a ^+x 6.5=y ^设回归直线方程为 ,)y ,x (回归直线过样本中心∵ ,7.51=a ^,即a ^+6.5×5=50∴ 17.5+x 6.5=y ^回归直线方程为∴ 17.5+x 6.5=y ^答案:相关关系的判断[典例] (1) ①正方形的边长与面积之间的关系; ②农作物的产量与施肥量之间的关系; ③人的身高与年龄之间的关系;④降雪量与交通事故的发生率之间的关系. (2)某个男孩的年龄与身高的统计数据如下表所示.年龄x (岁)123456身高y (cm)78 87 98 108 115 120①画出散点图;②判断y 与x 是否具有线性相关关系.[解析] (1)在①中,正方形的边长与面积之间的关系是函数关系;在②中,农作物的产量与施肥量之间不具有严格的函数关系,但具有相关关系;在③中,人的身高与年龄之间的关系既不是函数关系,也不是相关关系,因为人的年龄达到一定时期身高就不发生明显变化了,因而它们不具有相关关系;在④中,降雪量与交通事故的发生率之间具有相关关系.答案:②④(2)解:①散点图如图所示.②由图知,所有数据点接近一条直线排列,因此,认为y 与x 具有线性相关关系.两个变量是否相关的两种判断方法(1)根据实际经验:借助积累的经验进行分析判断.(2)利用散点图:通过散点图,观察它们的分布是否存在一定的规律,直观地进行判断.[活学活用]如图所示的两个变量不具有相关关系的是________(填序号).解析:①是确定的函数关系;②中的点大都分布在一条曲线周围;③中的点大都分布在一条直线周围;④中点的分布没有任何规律可言,x ,y 不具有相关关系.答案:①④求回归方程[典例] (1)已知变量x 与y 正相关,且由观测数据算得样本平均数x =3,y =3.5,则由该观测数据算得的线性回归方程可能是( )A.y ^=0.4x +2.3B.y ^=2x -2.4C.y ^=-2x +9.5 D.y ^=-0.3x +4.4(2)一台机器按不同的转速生产出来的某机械零件有一些会有缺点,每小时生产有缺点的零件的多少随机器的运转的速度的变化而变化,下表为抽样试验的结果:转速x (转/秒)16 14 12 8 每小时生产有缺点的零件数y (件)11985①画出散点图;②如果y 对x 有线性相关关系,请画出一条直线近似地表示这种线性关系; ③在实际生产中,若它们的近似方程为y =5170x -67,允许每小时生产的产品中有缺点的零件最多为10件,那么机器的运转速度应控制在什么范围内?[解析] (1)依题意知,相应的回归直线的斜率应为正,排除C 、D.且直线必过点(3,3.5),代入A 、B 得A 正确.答案:A(2)解:①散点图如图所示:②近似直线如图所示:秒/转14,所以机器的运转速度应控制在≤14.9x ,解得≤1067-x 5170得≤10y 由③内.求回归直线方程的步骤.)数据一般由题目给出)(n ,…,1,2=i )(i y ,i x (收集样本数据,设为(1) (2)作出散点图,确定x ,y 具有线性相关关系..i y i x ,2i x ,i y ,i x 把数据制成表格(3).iy i ∑i =1nx ,2i ∑i =1n x ,y ,x 计算(4) ⎩⎪⎨⎪⎧b ^=∑i =1nxiyi -n x y ∑i =1n x2i -n x 2,a ^=y -b ^ x .,公式为a ^,b ^代入公式计算(5).a ^+x b ^=y ^写出回归直线方程(6) [活学活用]已知变量x ,y 有如下对应数据:x 1 2 3 4 y1345(1)作出散点图;(2)用最小二乘法求关于x ,y 的回归直线方程. 解:(1)散点图如图所示.,52=1+2+3+44=x (2) y ,134=1+3+4+54=∑i=14x 39.=20+12+6+1=i y i ∑i =14x 2i ,30=16+9+4+1= b^,1310=39-4×52×13430-4×⎝ ⎛⎭⎪⎫522=a^,0=52×1310-134= .为所求的回归直线方程x 1310=y ^所以 利用线性回归方程对总体进行估计[典例x (吨)与相应的生产能耗y (吨标准煤)的几组对照数据:x 3 4 5 6 y2.5344.5(1)请画出上表数据的散点图;(2)请根据上表提供的数据,求出y 关于x 的回归直线方程y ^=b ^x +a ^;(3)已知该厂技改前100吨甲产品的生产能耗为90吨标准煤.试根据(2)求出的回归直线方程,预测生产100吨甲产品的生产能耗比技改前降低了多少吨标准煤?[解] (1)散点图如图:,3.5=2.5+3+4+4.54=y ,4.5=3+4+5+64=x (2) ∑i=14x ,66.5=6×4.5+5×4+4×3+3×2.5=i y i ∑i=14x 2i ,86=26+25+24+23= ∑i =14xiyi -4xy∑i =14x2i -4x 2=b ^所以 ,0.7=66.5-4×4.5×3.586-4×4.52=a ^0.35.=0.7×4.5-3.5=x b ^-y = 0.35.+x 0.7=y ^所以所求的线性回归方程为 ,)吨标准煤70.35(=0.35+0.7×100=y ^时,100=x 当(3) 90-70.35=19.65(吨标准煤).即生产100吨甲产品的生产能耗比技改前降低了19.65吨标准煤.只有当两个变量之间存在线性相关关系时,才能用回归直线方程对总体进行估计和预测.否则,如果两个变量之间不存在线性相关关系,即使由样本数据求出回归直线方程,用其估计和预测结果也是不可信的.[活学活用](重庆高考)随着我国经济的发展,居民的储蓄存款逐年增长.设某地区城乡居民人民币储蓄存款(年底余额)如下表:年份 2010 2011 2012 2013 2014 时间代号t 1 2 3 4 5 储蓄存款y (千亿元)567810(1)求y 关于t 的回归方程y ^=b ^t +a ^;(2)用所求回归方程预测该地区2015年(t =6)的人民币储蓄存款. 解:(1)列表计算如下:it iy it 2it i y i1 1 5 1 52 2 6 4 123 3 7 9 214 4 8 16 325 5 10 25 50 ∑153655120这里n =5,t -=1n ∑i =1n t i =155=3,y -=1n ∑i =1n y i =365=7.2.又∑i =1nt2i -n t -2=55-5×32=10,i =1n t i y i -n t-y -=120-5×3×7.2=12,从而b ^=1210=1.2,a ^=y --b ^t -=7.2-1.2×3=3.6,故所求回归方程为y ^=1.2t +3.6.(2)将t =6代入回归方程可预测该地区2015年的人民币储蓄存款为y ^=1.2×6+3.6=10.8(千亿元).[层级一 学业水平达标]1.下列变量具有相关关系的是( )A .人的体重与视力B .圆心角的大小与所对的圆弧长C .收入水平与购买能力D .人的年龄与体重解析:选C B 为确定性关系;A ,D 不具有相关关系,故选C.2.已知变量x ,y 之间具有线性相关关系,其散点图如图所示,则其回归方程可能为2+x 1.5=y ^A. 2+x 1.5=-y ^B. 2-x 1.5=y ^C. 2-x 1.5=-y ^D. 之间负相关,回归直线y ,x ,由散点图可知变量a ^+x b ^=y ^设回归方程为 B 解析:选 2.+x 1.5=-y ^,因此方程可能为>0a ^,<0b ^轴上的截距为正数,所以y 在 个样本点,n 的y 和x 是变量)n y ,n x (,…,)2y ,2x (,)1y ,1x (设3.直线l 是由这些样本点通过最小二乘法得到的线性回归直线如图所示,则以下结论正确的是( ))y ,x (过点l .直线A B .回归直线必通过散点图中的多个点C .直线l 的斜率必在(0,1)D .当n 为偶数时,分布在l 两侧的样本点的个数一定相同解析:选A A 是正确的;回归直线可以不经过散点图中的任何点,故B 错误;回归直线的斜率不确定,故C 错误;分布在l 两侧的样本点的个数不一定相同,故D 错误. 4.一项关于16艘轮船的研究中,船的吨位区间为[192,3 246](单位:吨),船员的,x 0.006 2+9.5=y ^的回归方程为x 关于吨位y 人,船员人数32~5人数 (1)若两艘船的吨位相差1 000,求船员平均相差的人数;(2)估计吨位最大的船和最小的船的船员人数.,则2x ,1x 设两艘船的吨位分别为(1)解: y^)2x 6 20.00+(9.5-1x 0.006 2+9.5=2y ^-1 =0.006 2×1 000≈6, 即船员平均相差6人.,0.006 2×192≈11+9.5=y ^时,192=x 当(2) 0.006 2×3 246≈30.+9.5=y ^时,3 246=x 当 即估计吨位最大和最小的船的船员数分别为30人和11人.[层级二 应试能力达标]1.一个口袋中有大小不等的红、黄、蓝三种颜色的小球若干个(大于5个),从中取5次,那么取出红球的次数和口袋中红球的数量是( ) A .确定性关系 B .相关关系 C .函数关系D .无任何关系 解析:选 B 每次从袋中取球取出的球是不是红球,除了和红球的个数有关外,还与球的大小等有关系,所以取出红球的次数和口袋中红球的数量是一种相关关系.,下x 80+50=y ^变化的回归直线方程为)千元(x 依劳动生产率)元(y .农民工月工资2列判断正确的是( )A .劳动生产率为1 000元时,工资为130元B .劳动生产率提高1 000元时,工资水平提高80元C .劳动生产率提高1 000元时,工资水平提高130元D .当月工资为210元时,劳动生产率为2 000元的单x ,但要注意80增加y ,1每增加x 知,x 80+50=y ^由回归直线方程 B 解析:选位是千元,y 的单位是元.3.为了解儿子身高与其父亲身高的关系,随机抽取5对父子身高数据如下:则y 对x 的线性回归方程为( )A .y =x -1B .y =x +1x 12+88=y .C176=y .D =y ,176=174+176+176+176+1785=x 计算得, C 解析:选符合.C 检验知,)y ,x (,根据回归直线经过样本中心176=175+175+176+177+17754.已知x 与y 之间的几组数据如下表:,若某同学根据上表中的前两组a ^+x b ^=y ^假设根据上表数据所得线性回归直线方程为数据(1,0)和(2,2)求得的直线方程为y =b ′x +a ′,则以下结论正确的是( )′a <a ^,′b >y ^′ B.a >a ^,′b >b ^A. ′a <a ^,′b <y ^′ D.a >a ^,′b <b ^C. 解析:选C 由(1,0),(2,2)求b ′,a ′.2.=-2×1-0=′a ,2=2-02-1=′b ,58=24+15+12+3+4+0=i y i ∑i =16x 时,a ^,b ^求 x ,136=y ,3.5= ∑i=16x 2i ,91=36+25+16+9+4+1= ,57=58-6×3.5×13691-6×3.52=b ^∴ a^,13=-52-136=×3.557-136= ′.a >a ^,′b <b ^∴ =y ^的回归方程为(cm)x 对身高(kg)y 岁的人,体重38岁到18.正常情况下,年龄在50.72x -58.2,张红同学(20岁)身高为178 cm ,她的体重应该在________ kg 左右. =y ^时,178=x 的人的体重进行预测,当178 cm 解析:用回归方程对身高为0.72×178-58.2=69.96(kg).答案:69.966.某工厂为了对新研发的一种产品进行合理定价,将该产品按事先拟定的价格进行试销,得到如下数据:________.=a ,则a +x 4=-y 由表中数据,求得线性回归方程为 ,132=4+5+6+7+8+96=x 解析: y,80=92+82+80+80+78+686=)y ,x (由回归方程过样本中心点 .a ^+1324×=-80得 106.=1324×+80=a ^即 答案:1067.对某台机器购置后的运行年限x (x =1,2,3,…)与当年利润y 的统计分析知x ,y ,估计该台机器最为划算的使用年限为x 1.3-10.47=y ^具备线性相关关系,回归方程为________年.解析:当年利润小于或等于零时应该报废该机器,当y =0时,令10.47-1.3x =0,解得x ≈8,故估计该台机器最为划算的使用年限为8年.答案:88.某个体服装店经营某种服装在某周内所获纯利y (元)与该周每天销售这种服装的件数x (件)之间有一组数据如下表:;y ,x 求(1) (2)若纯利y 与每天销售这种服装的件数x 之间是线性相关的,求回归直线方程; (3)若该店每周至少要获纯利200元,请你预测该店每天至少要销售这种服装多少件?3 487)=i y i ∑i =17x ,45 309=2i ∑i =17y ,280=2i ∑i =17x 提示:( ,6=3+4+5+6+7+8+97=x (1)解: y≈79.86.66+69+73+81+89+90+917= ,≈4.753 487-7×6×79.86280-7×62=b ^∵(2) a^,51.36=4.75×6-79.86= .x 4.75+51.36=y ^之间的回归直线方程为x 纯利与每天销售件数∴ ≈31.29.x ,所以651.3+x 4.75=200时,200=y ^当(3) 因此若该店每周至少要获纯利200元,则该店每天至少要销售这种服装32件.9.2016年元旦前夕,某市统计局统计了该市2015年10户家庭的年收入和年饮食支出的统计资料如下表:年收入x (万元)2 4 4 6 6 6 7 7 8 10年饮食 支出y(万元)0.9 1.4 1.6 2.0 2.1 1.9 1.8 2.1 2.2 2.3(2)若某家庭年收入为9万元,预测其年饮食支出.406)=2i ∑i =110x ,117.7=i y i ∑i =110x 参考数据:( 解:依题意可计算得:x,10.98=y x ,36=2x ,1.83=y ,6= ,406=2i ∑i =110x ,117.7=i y i ∑i =110x ∵又,≈0.17∑i=110xiyi -10x y ∑i =110x2i -10x 2=b ^∴ a^0.81.+x 0.17=y ^∴,0.81=x b ^-y = 1.0.8+x 0.17=y ^所求的回归方程为∴ .)万元2.34(=0.81+0.17×9=y ^时,9=x 当(2) 可估计年收入为9万元的家庭每年饮食支出约为2.34万元.(时间120分钟,满分150分)一、选择题(本大题共12小题,每小题5分,共60分.在每小题给出的四个选项中,只有一项是符合题目要求的)1.下列三个抽样:①一个城市有210家某商品的代理商,其中大型代理商有20家,中型代理商有40家,小型代理商有150家,为了掌握该商品的销售情况,要从中抽取一个容量为21的样本;②在某公司的50名工人中,依次抽取工号为5,10,15,20,25,30,35,40,45,50的10名工人进行健康检查;③某市质量检查人员从一食品生产企业生产的两箱(每箱12盒)牛奶中抽取4盒进行质量检查.则应采用的抽样方法依次为( )A .简单随机抽样;分层抽样;系统抽样B .分层抽样;简单随机抽样;系统抽样C .分层抽样;系统抽样;简单随机抽样D .系统抽样;分层抽样;简单随机抽样解析:选 C ①中商店的规模不同,所以应利用分层抽样;②中抽取的学号具有等距性,所以应是系统抽样;③中总体没有差异性,容量较小,样本容量也较小,所以应采用简单随机抽样.故选C.2.将某班的60名学生编号为01,02,…,60,采用系统抽样方法抽取一个容量为5的样本,且随机抽得的一个号码为04,则剩下的四个号码依次是( )A .09,14,19,24B .16,28,40,52C .10,16,22,28D .08,12,16,20 解析:选B 分成5组,每组12名学生,按等间距12抽取.选项B 正确.3.某学校有教师200人,男学生1 200人,女学生1 000人.现用分层抽样的方法从全体师生中抽取一个容量为n 的样本,若女学生一共抽取了80人,则n 的值为( )A .193B .192C .191D .190 192.=n ,求得80=n200+1 200+1 0001 000× B 解析:选 4.某商品销售量y (件)与销售价格x (元/件)负相关,则其回归方程可能是( )200+x 10=y ^200 B.+x 10=-y ^A. 200-x 10=y ^200 D.-x 10=-y ^C. 解析:选A 由于销售量y 与销售价格x 成负相关,故排除B ,D.又因为销售价格x >0,则C 中销售量全小于0,不符合题意,故选A.,则y 和x ,它们的平均数分别是n y ,…,2y ,1y 与n x ,…,2x ,1x .设有两组数据5)(的平均数是1+n y 3-n x 2,…,1+2y 3-2x 1,2+1y 3-1x 2新的一组数据 y 3-x 2.A 1+y 3-x 2.By 9-x 4.C1+y 9-x 4.D ,)n ,…,1,2=i 1(+i y 3-i x 2=i z 设 B 解析:选 =⎝ ⎛⎭⎪⎫1+1+…+1n +)n y +…+2y +1y (3n -)n x +…+2x +1x (2n =)n z +…+2z +1z (1n =z 则 1.+y 3-x 2 6.有一个容量为66的样本,数据的分组及各组的频数如下:[11.5,15.5) 2 [15.5,19.5) 4 [19.5,23.5) 9 [23.5,27.5) 18 [27.5,31.5) 11 [31.5,35.5) 12[35.5,39.5) 7 [39.5,43.5) 3则总体中大于或等于31.5的数据所占比例约为( )211A.13B. 12C.23D. 解析:选B 由题意知,样本的容量为66,而落在[31.5,43.5)内的样本个数为12+7.13=2266的数据约占31.5,故总体中大于或等于22=3+ 7.某学习小组在一次数学测验中,得100分的有1人,得95分的有1人,得90分的有2人,得85分的有4人,得80分和75分的各有1人,则该小组数学成绩的平均数、众数、中位数分别是( )A .85,85,85B .87,85,86C .87,85,85D .87,85,90 解析:选C ∵得85分的人数最多为4人,∴众数为85,中位数为85,87.=75)+80+85×4+90×2+95+(100110平均数为 8.某出租汽车公司为了了解本公司司机的交通违章情况,随机调查了50名司机,得到了他们某月交通违章次数的数据,结果制成了如图所示的统计图,根据此统计图可得这50名出租车司机该月平均违章的次数为( )A .1B .1.8C .2.4D .3 1.8.=5×0+20×1+10×2+10×3+5×450B 解析:选 9.下表是某厂1~4月份用水量情况(单位:百吨)的一组数据月份x 1 2 3 4用水量y 4.5 4 3 2.5的a ,则a +x 0.7=-y 之间具有线性相关关系,其线性回归方程为x 与月份y 用水量值为( )A .5.25B .5C .2.5D .3.5 解析:选A 线性回归方程经过样本的中心点,根据数据可得样本中心点为(2.5,3.5),所以a =5.25.10.如图是在元旦晚会举办的挑战主持人大赛上,七位评委为某选手打出的分数的茎叶统计图,去掉一个最高分和一个最低分后,所剩数据的平均数和方差分别为( )A .84,4.84B .84,1.6C .85,1.2D .85,4 +5+6+3+(515+80,平均数为77,去掉一个最低分95去掉一个最高分 C 解析:选,因此1.2=]286)-(85+285)-(85+286)-(85+283)-(85+285)-[(8515,方差为85=6)选C.,…,2+2x 2,3+1x 3,则2s ,方差是x 的平均数是n x ,…,3x ,2x ,1x .如果数据11)(的平均数和方差分别是2+n x 32s 和x A.2s 9和x 3.B2s 9和2+x 3.C4+2s 12和2+x 3.D nx …,2x ,1x ,由于数据2+x 3的平均数是2+n x 3,…,2+2x 2,3+1x 3 C 解析:选.2s 9的方差为2+n x 3,…,2+2x 2,3+1x 3,所以2s 的方差为 12.如图是某赛季甲、乙两名篮球运动员5场比赛得分的茎叶图,已知甲的成绩的极差为31,乙的成绩的平均值为24,则下列结论错误的是( ) A .x =9 B .y =8C .乙的成绩的中位数为26D .乙的成绩的方差小于甲的成绩的方差解析:选B 因为甲的成绩的极差为31,所以其最高成绩为39,所以x =9;因为乙的成绩的平均值为24,所以y =24×5-(12+25+26+31)-20=6;由茎叶图知乙的成绩的中位数为26;对比甲、乙的成绩分布发现,乙的成绩比较集中,故其方差较小. 二、填空题(本大题共4小题,每小题5分,共20分,把答案填在题中横线上) 13.某人5次上班途中所花的时间(单位:分钟)分别为x ,y,10,11,9.已知这组数据的平均数为10,方差为2,则|x -y |的值为________.∴,2;又方差为20=y +x ,则10=159)×+11+10+y +x (,得10解析:由平均数为=xy 208,2=2y +2x ,得2=15]×210)-(9+210)-(11+210)-(10+210)-y (+210)-x [( 4.=x2+y2-2xy =x -y 2=|y -x |∴,192 答案:414.一支田径队有男运动员48人,女运动员36人,若用分层抽样的方法从该队的全体运动员中抽取一个容量为21的样本,则抽取男运动员的人数为________.12.=×482148+36解析:抽取的男运动员的人数为 答案:1215.要考察某种品牌的500颗种子的发芽率,抽取60粒进行实验,利用随机数表抽取种子时,先将500颗种子按001,002,…,500进行编号,如果从随机数表第7行第8列的数3开始向右读,请你依次写出最先检测的5颗种子的编号:________,________,________,________,________.(下面摘取了随机数表第7行至第9行)59408 66368 36016 26247 25965 49487 26968 86021 77681 83458 21540 62651 69424 78197 20643 67297 76413 66306 51671 54964 87683 30372 39469 97434解析:以3开始向右读,每次读取三位,重复和不在范围内的不读,依次为368,360,162,494,021.答案:368,360,162,494,02116.从某小学随机抽取100名同学,将他们的身高(单位:cm)数据绘制成频率分布直方图(如下图).由图中数据可知a =________.若要从身高在[120,130),[130,140),[140,150]三组的学生中,用分层抽样的方法选取18人参加一项活动,则从身高在[140,150]的学生中选取的人数应为________.解析:∵0.005×10+0.035×10+a ×10+0.020×10+0.010×10=1,∴a =0.030.设身高在[120,130),[130,140),[140,150]三组的学生分别有x ,y ,z 人,10.=z ,20=y 同理,30.=x ,解得0.030×10=x100则3.=×181030+20+10的学生中选取的人数为[140,150]故从 答案:0.030 3三、解答题(本大题共6小题,共70分.解答应写出文字说明,证明过程或演算步骤) ,应如何110名学生中抽取50为调查某班学生的平均身高,从)分10本小题满分(.17抽样?若知道男生、女生的身高显著不同(男生30人,女生20人),应如何抽样? 抽签法或随机数(人,采用简单随机抽样法5,即抽取110名学生中抽取50解:从法).若知道男生、女生的身高显著不同,则采用分层抽样法,按照男生与女生的人数比为30∶20=3∶2进行抽样,则男生抽取3人,女生抽取2人.18.(本小题满分12分)某车间共有12名工人,随机抽取6名,他们某日加工零件个数的茎叶图如图所示. (1)根据茎叶图计算样本均值;(2)日加工零件个数大于样本均值的工人为优秀工人.根据茎叶图推断该车间12名工人中有几名优秀工人?22.=1326=17+19+20+21+25+306样本均值为1)(解: 4=1312×名工人中有12,故推断该车间13=26知样本中优秀工人所占比例为(1)由(2)名优秀工人.19.(本小题满分12分)2016年春节前,有超过20万名广西、四川等省籍的外出务工人员选择驾乘摩托车沿321国道长途跋涉返乡过年,为防止摩托车驾驶人员因长途疲劳驾驶,手脚僵硬影响驾驶操作而引发交通事故,肇庆市公安交警部门在321国道沿线设立了多个长途行驶摩托车驾乘人员休息站,让返乡过年的摩托车驾乘人员有一个停车休息的场所.交警小李在某休息站连续5天对进站休息的驾驶人员每隔50辆摩托车就进行一次省籍询问,询问结果如图所示:(1)交警小李对进站休息的驾驶人员的省籍询问采用的是什么抽样方法?(2)用分层抽样的方法对被询问了省籍的驾驶人员进行抽样,若广西籍的有5人,则四川籍的应抽取几人?解:(1)交警小李对进站休息的驾驶人员的省籍询问采用的是系统抽样法.(2)从题图可知,被询问了省籍的驾驶人员广西籍的有5+20+25+20+30=100(人);四川籍的有15+10+5+5+5=40(人).2,即四川籍的应抽取2=x ,解得x40=5100人,依题意得x 设四川籍的驾驶人员应抽取人.20.(本小题满分12分)某化肥厂有甲、乙两个车间包装肥料,在自动包装传送带上每隔30分钟抽取一包产品,称其重量(单位:kg),分别记录抽查数据如下:甲:102,101,99,98,103,98,99; 乙:110,115,90,85,75,115,110.(1)这种抽样方法是哪一种方法?(2)试计算甲、乙车间产品重量的平均数与方差,并说明哪个车间产品较稳定?解:(1)甲、乙两组数据间隔相同,所以采用的方法是系统抽样.,100=99)+98+103+98+99+101+(10217=甲x (2) x,100=110)+115+75+85+90+115+(11017=乙 ,1)≈3.43+4+9+4+1+1+(417=2甲s ,228.57=100)+225+625+225+100+225+(10017=2乙s ,故甲车间产品比较稳定.2乙s <2甲s ∴ 21.(本小题满分12分)对某校高一年级学生参加社区服务次数进行统计,随机抽取M 名学生作为样本,得到这M 名学生参加社区服务的次数.根据此数据作出了频数与频率的统计表和频率分布直方图如下:分组频数 频率[10,15) 10 0.25[15,20) 25n [20,25) mp[25,30] 20.05 合计M1(1)求出表中M ,p 及图中a 的值;(2)若该校高一学生有360人,试估计该校高一学生参加社区服务的次数在区间[10,15)的人数.解:(1)由分组[10,15)的频数是10, 40.=M ,所以0.25=10M知,0.25频率是 因为频数之和为40,所以10+25+m +2=40,解得m =3.0.075.=340=p 故 因为a 是对应分组[15,20)的频率与组距的商,125.0.=2540×5=a 所以 (2)因为该校高一学生有360人,分组[10,15)的频率是0.25,所以估计该校高一学生参加社区服务的次数在此区间内的人数为360×0.25=90.22.(本小题满分12分)从某居民区随机抽取10个家庭,获得第i 个家庭的月收入iy i ∑i =110x ,20=i ∑i =110y ,80=i ∑i =110x 的数据资料,算得)单位:千元(i y 与月储蓄)单位:千元(i x 720.=2i ∑i =110x ,184= ;a ^+xb ^=y ^的线性回归方程x 对月收入y 求家庭的月储蓄(1) (2)判断变量x 与y 之间是正相关还是负相关;(3)若该居民区某家庭月收入为7千元,预测该家庭的月储蓄.,8=8010=i ∑i =1n x 1n =x ,10=n 由题意知(1)解: y ,2=2010=i ∑i =1n y 1n = ,80=210×8-720=2x 10-2i ∑i =110x 又 ∑i=110x ,24=10×8×2-184=y x 10-i y i ,0.3=2480=∑i =110xiyi -10x y∑i =110x2i -10x 2=b ^由此得 a^,0.4=-0.3×8-2=x b ^-y = 0.4.-x 0.3=y ^故所求回归方程为 (2)由于变量y 的值随x 的值增加而增加(b =0.3>0),故x 与y 之间是正相关.(3)将x =7代入回归方程可以预测该家庭的月储蓄为y =0.3×7-0.4=1.7千元.。
高中高中数学第二章统计2.3.1变量之间的相关关系2.3.2两个变量的线性相关课件新人教A版必修3
解:(1)画出散点图.
(2)判断变量x,y是否具有相关关系?如果具有相关关系,那么是正相关还是 负相关?
解:(2)具有相关关系.根据散点图,左下角到右上角的区域,变量x的值由小 变大时,另一个变量y的值也由小变大,所以它们具有正相关关系.
方法技巧 两个随机变量x和y是否具有相关关系的确定方法: (1)散点图法:通过散点图,观察它们的分布是否存在一定规律,直观地判断 (如本题); (2)表格、关系式法:结合表格或关系式进行判断; (3)经验法:借助积累的经验进行分析判断.
4
4
解:(2)由表中的数据得: xi yi =52.5, x =3.5, y =3.5, xi2 =54,
i 1
i 1
n
所以 b =
xi yi n x y
i 1
n
xi2
2Hale Waihona Puke nx=52.5 4 3.5 3.5 54 4 3.52
=0.7,
i 1
a = y - b x =3.5-0.7×3.5=1.05,
年份x
储蓄存款 y(千亿元)
2013 5
2014 6
2015 7
2016 8
2017 10
为了研究计算的方便,工作人员将上表的数据进行了处理,t=x-2 012,z=y-5 得到表2:
时间代号t
1
2
3
4
5
z
0
1
2
3
5
(1)求z关于t的线性回归方程;
5
5
解:(1) t =3, z =2.2, ti zi=45, ti2 =55,
知识探究
1.相关关系与函数关系不同 函数关系中的两个变量间是一种确定性关系,相关关系是一种不确定性关系. 2.正相关和负相关 (1)正相关 在散点图中,点散布在从左下角到右上角的区域,对于两个变量的这种相关 关系,我们就称它为正相关. (2)负相关 在散点图中,点散布在从左上角到右下角的区域,对于两个变量的这种相关 关系,我们就称它为负相关.
高中数学必修三《2.3.1-2.3.2两个变量的相关性》课件
^
yi
的
n
个偏差构成的总偏差越小越好,这才说明所求的直线是
最贴近已知点的.
课前探究学习
课堂讲练互动 第七页,编辑活于页星期规日范:二训十三练点 四十四分。
一个自然的想法是将各个偏差加起来作为总偏差.可是,由于 偏差有正有负,直接相加会相互抵消,这样就无法反映这些数
n
据点的贴近程度,即这个总偏差不能用 n 个偏差之和
课前探究学习
课堂讲练互动 第一页,编辑活于页星期规日范:二训十三练点 四十四分。
自学导引
1.两个变量的线性相关 (1)散点图:将样本中n个数据点(xi,yi)(i=1,2,…,n)描在平面 直角坐标系中得到的图形. (2)正相关与负相关 ①正相关:散点图中的点散布在从__左__下_角__到__右__上__角_的区域. ②负相关:散点图中的点散布在从__左__上__角_到__右__下__角_的区域.
答案 ②④
课前探究学习
课堂讲练互动 第十三页,编活辑页于星规期范日:训二十练三点 四十四分。
题型二 求线性回归方程
【例2】 某地10户家庭的年收入和年饮食支出的统计资料如下:
年收入 x(万元)
2 4 4 6 6 6 7 7 8 10
年饮食支出 y(万元)
0.9
1.4
1.6
2.0
2.1
1.9
1.8
2.1
设所求的回归直线方程为^y =^b x+^a , 由上表可得 x =55, y =91.7,
n
xiyi-10 x y
i=1
∴^b=
10
=55 398505-001-0×105×5×55921.7≈0.668;
xi2-10 x 2
i=1
2.3.1变量之间的相关关系
O
负相关的特点:一个变量随另一个变量的变大而 变小,散点图中的点散布在从左上角到右下角的 区域
120 100 80 60 40 20
0 0 20 40 60 80 100
注:若两个变量散点图呈上图,则不具 有相关关系。
回归直线
问题:那么如何才能使所有点到回归直线的“整体距 离”最小呢?
脂肪含量
x2i
x 12
x
2 2
x
2 3
……
x
2 n
n
x
y
xi2
i 1
n
xi yi
i 1
课堂练习
例、某汽车销售公司作了一次抽样调查,并统计得出某
款车的使用年限 x 与所支出的总费用 y(万元)有如下的数据资
料:
使用年限
23456
x
总费用 y 2.2 3.8 5.5 6.5 7.0
若由资料,知 y 对 x 呈线性相关关系.试求:
40
35
30 25
(xi,yi)
20
11(05x1, y1)
5
(xn,yn)
0
20 25 30 35 4(0x2,45 y2)50 55 60 65 年龄
应用最小二乘法可算得:
i
12
3 …… n
xi
x1
x2
x3 …… xn
yi
y1
y2
ቤተ መጻሕፍቲ ባይዱ
y3 …… yn
xiyi
x1 y1 x2 y2 x3 y3 …… xn yn
以x轴表示年龄,y轴表示脂肪含量,在直角坐标系中 描出样本数据对应的图形。
脂肪含量
40 35 30 25 20 15 10 5 0
2.3.1和2.3.2-2 变量间的相关关系
热饮杯数
当x=2时,y=143.063. x=2时
小结作业 1.求样本数据的线性回归方程 求样本数据的线性回归方程, 1.求样本数据的线性回归方程,可按 下列步骤进行: 下列步骤进行: 第一步, 第一步,计算平均数 x , y
第二步,求和 第二步,
∧
n i=1 n i i
n
第三步, 第三步,计算 b = i=1
摄氏温 度( ℃) 热饮杯 数 15 116 -5 156 19 104 0 150 23 89 4 132 27 93 7 128 31 76 12 130 36 54
摄氏温 度( ℃) 热饮杯 数 15 116
-5 156 19 104
0 150 23 89
4 132 27 93
7 128 31 76
思考6 思考6:利用计算器或计算机可求得年龄和 人体脂肪含量的样本数据的回归方程为 y = 0.577x - 0.448,由此我们可以根据 一个人个年龄预测其体内脂肪含量的百分 比的回归值 若某人37 回归值. 37岁 比的回归值.若某人37岁,则其体内脂肪含 量的百分比约为多少? 量的百分比约为多少?
(xi,yi) (x1, y1) (x2,y2) (xn,yn)
可以用 | yi 其中
- yi | 或 (yi - y )
2 , i
yi = bxi + a .
思考4:为了从整体上反映n个样本数 思考4 为了从整体上反映n 据与回归直线的接近程度,你认为选 据与回归直线的接近程度, 用哪个数量关系来刻画比较合适? 用哪个数量关系来刻画比较合适?
脂肪含量 40 35 30 25 20 15 10 5 0 20 25 30 35 40 45 50 55 60 65 年龄
高中数学必修三第二章《随机抽样》2.3.1变量之间的相关关系-2.3.2两个变量的线性相关
跟踪训练1 下表是某地的年降雨量与年平均气温的统计表,判断两者是 否具有相关关系,求线性回归方程有意义吗? 解答
年平均气温(℃) 12.51 12.74 12.64 13.69 13.33 12.84 13.05 年降雨量(mm) 748 542 507 813 574 701 432
命题角度2 函数关系与相关关系的区别与联系 例2 下列关系中,是相关关系的是__②__④____. 答案 解析 ①正方形的边长与面积之间的关系; ②农作物的产量与施肥量之间的关系; ③人的身高与年龄之间的关系; ④降雪量与交通事故的发生率之间的关系.
命题角度1 判断两个变量的相关性 例1 为了研究质量对弹簧长度的影响,对6根相同的弹簧进行测量,所 得数据如下:
质量(g)
5
10
15
20
25
30
弹簧长度(cm) 7.25 8.12 8.95 9.90 10.90 11.80
判断它们是否有相关关系,若有,判断是正相关还是负相关. 解答
反思与感悟
在研究两个变量之间是否存在某种关系时,必须从散点图入手,对于散 点图,可以作出如下判断: (1)如果所有的样本点都落在某一函数曲线上,那么就用该函数来描述变 量之间的关系,即变量之间具有函数关系; (2)如果所有的样本点都落在某一直线附近,那么变量之间就有线性相关 关系; (3)如果散点图中的点的分布几乎没有什么规律,那么这两个变量之间不 具有相关关系,即两个变量之间是相互独立的.
梳理 回归直线的方程
(1)回归直线:如果散点图中点的分布从整体上看大致在 一条直附线近 , 就 称 这两个变量之间具有 线性相关关系,这条直线叫做回归直线. (2)线性回归方程:对回应归的直方线程叫做回归直线的方程,简称回归方程.
2.3.1 变量之间的相关关系 2.3.2 两个变量的线性相关
2.3变量间的相关关系2.3.1变量之间的相关关系2.3.2两个变量的线性相关1.理解两个变量的相关关系的概念.(难点)2.会作散点图,并利用散点图判断两个变量之间是否具有相关关系.(重点) 3.会求回归直线方程.(重点)4.相关关系与函数关系.(易混点)[基础·初探]教材整理1变量之间的相关关系阅读教材P84~P86的内容,完成下列问题.1.相关关系:不像匀速直线运动中时间与路程的关系那样是完全确定的,而是带有不确定性.2.散点图:将样本中几个数据点(x i,y i)(i=1,2,…,n)描在平面直角坐标系中得到的图形.3.正相关与负相关:散点图中的点散布在从左下角到右上角的区域,对于两个变量的这种相关关系,称它为正相关.若散点图中的点分布在从左上角到右下角的区域内,对于两个变量的这种相关关系,称它为负相关.4.相关关系与函数关系的辨析相关关系与函数关系均是指两个变量间的关系,它们的不同点如下: (1)函数关系是一种确定的关系;相关关系是一种非确定的关系,即不能用一个函数关系式来严格地表示变量之间的关系.(2)函数关系是一种因果关系,而相关关系不一定是因果关系,也可能是伴随关系.例如,有人发现,对于在校儿童,脚的大小与阅读能力有很强的相关关系,然而学会更多的新词并不能使脚变大,而是涉及第三个因素——年龄,当儿童长大一些以后,他们的阅读能力会提高,而且脚也会变大.如图2-3-1所示的两个变量不具有相关关系的有________.图2-3-1【解析】 ①是确定的函数关系;②中的点大都分布在一条曲线周围;③中的点大都分布在一条直线周围;④中点的分布没有任何规律可言,x ,y 不具有相关关系.【答案】 ①④教材整理2 回归直线方程阅读教材P 87~P 89的内容,完成下列问题.1.回归直线:如果散点图中点的分布从整体上看大致在一条直线附近,就称这两个变量之间具有线性相关关系,这条直线叫做回归直线.2.回归方程:回归直线对应的方程叫回归直线的方程,简称回归方程. 3.最小二乘法:求回归直线时,使得样本数据的点到回归直线的距离的平方和最小的方法叫做最小二乘法.4.求回归方程:若两个具有线性相关关系的变量的一组数据为:(x 1,y 1),(x 2,y 2),…,(x n ,y n ),则所求的回归方程为y ^=b ^x +a ^,其中a ^,b ^为待定的参数,由最小二乘法得:⎩⎪⎨⎪⎧b ^=∑i =1n(x i-x )(y i-y )∑i =1n(x i-x )2=∑i =1nx i y i-n x -y -∑i =1nx 2i-n x -2,a ^=y -b^x .b ^是回归直线斜率,a ^是回归直线在y 轴上的截距.1.判断(正确的打“√”,错误的打“×”)(1)回归方程中,由x 的值得出的y 值是准确值.( ) (2)回归方程一定过样本点的中心.( ) (3)回归方程一定过样本中的某一个点.( )(4)选取一组数据中的部分点得到的回归方程与由整组数据得到的回归方程是同一个方程.( )【答案】 (1)× (2)√ (3)× (4) ×2.过(3,10),(7,20),(11,24)三点的回归直线方程是( ) A.y ^=1.75+5.75x B.y ^=-1.75+5.75x C.y ^=5.75+1.75xD.y ^=5.75-1.75x【解析】 求过三点的回归直线方程,目的在于训练求解回归系数的方法,这样既可以训练计算,又可以体会解题思路,关键是能套用公式.代入系数公式得b ^=1.75,a ^=5.75.代入直线方程,求得y ^=5.75+1.75x .故选C.【答案】 C3.已知x 与y 之间的一组数据:则y 与x 的线性回归方程y =bx +a 必过点( ) A .(1,2) B .(5,2) C .(2,5)D .(2.5,5)【解析】线性回归方程一定过样本中心(x,y).由x=0+1+2+3+45=2,y=1+3+5+7+95=5.故必过点(2,5).【答案】 C[小组合作型](1))A.正方体的棱长和体积B.圆半径和圆的面积C.正n边形的边数和内角度数之和D.人的年龄和身高(2)对变量x,y有观测数据(x i,y i)(i=1,2,…,10),得散点图①;对变量u,v有观测数据(u i,v i)(i=1,2,…,10),得散点图②.由这两个散点图可以判断()图2-3-2A.变量x与y正相关,u与v正相关B.变量x与y正相关,u与v负相关C.变量x与y负相关,u与v正相关D.变量x与y负相关,u与v负相关【精彩点拨】结合相关关系,函数关系的定义及正负相关的定义分别对四个选项作出判断.【尝试解答】(1)A、B、C都是函数关系,对于A,V=a3;对于B,S=πr2;对于C,g(n)=(n-2)π.而对于D,年龄确定的不同的人可以有不同的身高,∴选D.(2)由图象知,变量x与y呈负相关关系;u与v呈正相关关系.【答案】(1)D(2)C判断两个变量x和y间是否具有线性相关关系,常用的简便方法就是绘制散点图,如果发现点的分布从整体上看大致在一条直线附近,那么这两个变量就是线性相关的,注意不要受个别点的位置的影响.[再练一题]1.某公司2011~2016年的年利润x(单位:百万元)与年广告支出y(单位:百万元)的统计资料如下表所示:A.B.利润中位数是18,x与y有负线性相关关系C.利润中位数是17,x与y有正线性相关关系D.利润中位数是17,x与y有负线性相关关系【解析】由表知,利润中位数是12(16+18)=17,且y随x的增大而增大,故选C.【答案】 C一个车间为了规定工时定额,需要确定加工零件所花费的时间,为此进行了10次试验,收集数据如下:(2)如果y 与x 具有线性相关关系,求y 关于x 的回归直线方程. 【精彩点拨】 画散点图→确定相关关系→求回归直线系数 →写回归直线方程【尝试解答】 (1)画散点图如下:由上图可知y 与x 具有线性相关关系. (2)列表、计算:b ^=∑i =110x i y i -10x y ∑i =110x 2i -10x 2=55 950-10×55×91.738 500-10×552≈0.668,a ^=y -b ^x =91.7-0.668×55=54.96. 即所求的回归直线方程为:y ^=0.668x +54.96.用公式求回归方程的一般步骤:(1)列表x i ,y i ,x i y i ;(2)计算x ,y,∑i =1nx 2i ,∑i =1n x i y i ;(3)代入公式计算a ^,a ^的值;(4)写出回归方程.[再练一题]2.已知变量x ,y 有如下对应数据:(1)(2)用最小二乘法求关于x ,y 的回归直线方程. 【解】 (1)散点图如图所示:(2)x =1+2+3+44=52,y =1+3+4+54=134, ∑i =14x i y i =1+6+12+20=39,∑i =14x 2i =1+4+9+16=30,b ^=39-4×52×13430-4×⎝ ⎛⎭⎪⎫522=1310,a ^=134-1310×52=0,所以y ^=1310x 为所求回归直线方程.x (吨)与相应的生产能耗y (吨标准煤)的几组对照数据:(2)请根据上表提供的数据,用最小二乘法求出回归方程y ^=b ^x +a ^; (3)已知该厂技改前100吨甲产品的生产能耗为90吨标准煤.试根据(2)求出的线性回归方程,预测生产100吨甲产品的生产能耗比技改前降低多少吨标准煤?【精彩点拨】 (1)以产量为横坐标,以生产能耗对应的测量值为纵坐标,在平面直角坐标系内画散点图;(2)应用计算公式求得线性相关系数b ^,a ^的值;(3)实际上就是求当x =100时,对应的v 的值.【尝试解答】 (1)散点图,如图所示:(2)由题意,得∑i =14x i y i =3×2.5+4×3+5×4+6×4.5=66.5,x =3+4+5+64=4.5,y =2.5+3+4+4.54=3.5,∑i =14x 2i =32+42+52+62=86,∴b ^=66.5-4×4.5×3.586-4×4.52=66.5-6386-81=0.7,a ^=y -b ^x =3.5-0.7×4.5=0.35, 故线性回归方程为y ^=0.7x +0.35.(3)根据回归方程的预测,现在生产100吨产品消耗的标准煤为0.7×100+0.35=70.35(吨),故耗能减少了90-70.35=19.65(吨)标准煤.回归分析的三个步骤:(1)判断两个变量是否线性相关:可以利用经验,也可以画散点图;(2)求线性回归方程,注意运算的正确性;(3)根据回归直线进行预测估计:估计值不是实际值,两者会有一定的误差.[再练一题]3.某种产品的广告费支出y (百万元)与销售额x (百万元)之间的关系如下表所示.(1)假定y (2)若广告费支出不少于60百万元,则实际销售额应不少于多少?【解】 (1)设回归直线方程为y ^=b ^x +a ^,则b ^=(8×5+12×8+14×9+16×11)-4×8+12+14+164×5+8+9+114(82+122+142+162)-4×⎝⎛⎭⎪⎫8+12+14+1642=438-412.5660-625=25.535=5170,a ^=y -b ^x =5+8+9+114-5170×8+12+14+164=334-5170×252=-67,则所求回归直线方程为y ^=5170x -67.(2)由y ^=5170x -67≥60,得x ≥4 26051≈84,所以实际销售额不少于84百万元.[探究共研型]探究1 变量之间的关系?【提示】 任意两个统计数据均可以作出散点图,对于作出的散点图,如果所有的样本点都落在某一函数曲线上,就用该函数来描述变量之间的关系,即变量之间具有函数关系.特别地,若所有的样本点都落在某一直线附近,变量之间就具有线性相关关系;如果所有的样本点都落在某一函数曲线附近,变量之间就有相关关系;如果散点图中的点的分布几乎没有什么规则,则这两个变量之间不具有相关关系.探究2 【提示】 (1)建立直角坐标系,两轴的长度单位可以不一致. (2)将n 个数据点描在平面直角坐标系中.(3)画回归直线时,一定要画在多数点经过的区域,可以先观察有哪两个点在直线上.探究3 回归系数b ^的含义是什么?【提示】 (1)b ^代表x 每增加一个单位,y 的平均增加单位数,而不是增加单位数.(2)当b ^>0时,两个变量呈正相关关系,含义为:x 每增加一个单位,y 平均增加b ^个单位数;当b ^<0时,两个变量呈负相关关系,含义为:x 每增加一个单位,y 平均减少b ^个单位数.探究4 回归直线方程与直线方程的区别是什么?【提示】 线性回归直线方程中y 的上方加记号“^ ”是与实际值y 相区别,因为线性回归方程中的“y ^”的值是通过统计大量数据所得到的一个预测值,它具有随机性,因而对于每一个具体的实际值而言,y ^的值只是比较接近,但存在一定的误差,即y =y ^+e (其中e 为随机变量),预测值y ^与实际值y 的接近程度由随机变量e 的标准差决定.已知x 与y 之间的几组数据如下表:假设根据上表数据所得线性回归直线方程为y =b x +a .若某同学根据上表中的前两组数据(1,0)和(2,2)求得的直线方程为y =b ′x +a ′,则以下结论正确的是( )A.b ^>b ′,a ^>a ′ B.b ^>b ′,a ^<a ′ C.b ^<b ′,a ^>a ′D.b ^<b ′,a ^<a ′【精彩点拨】 先由已知条件分别求出b ′,a ′的值,再由b ^,a ^的计算公式分别求解b ^,a ^的值,即可作出比较.【尝试解答】 根据所给数据求出直线方程y =b ′x +a ′和回归直线方程的系数,并比较大小.由(1,0),(2,2)求b ′,a ′. b ′=2-02-1=2, a ′=0-2×1=-2. 求b ^,a ^时,i =16x i y i =0+4+3+12+15+24=58,x =3.5,y =136,i =16x 2i =1+4+9+16+25+36=91,∴b ^=58-6×3.5×13691-6×3.52=57,a ^=136-57×3.5=136-52=-13, ∴b ^<b ′,a ^>a ′. 【答案】 C [再练一题]4.设某大学的女生体重y (单位:kg)与身高x (单位:cm)具有线性相关关系.根据一组样本数据(x i ,y i )(i =1,2,…,n ),用最小二乘法建立的回归方程为y ^=0.85x -85.71,则下列结论中不正确的是( )A .y 与x 具有正的线性相关关系B .回归直线过样本点的中心(x ,y )C .若该大学某女生身高增加1 cm ,则其体重约增加0.85 kgD .若该大学某女生身高为170 cm ,则可断定其体重必为58.79 kg 【解析】 b ^为正数,所以两变量具有正的线性相关关系,故A 正确;B ,C 显然正确;若该大学某女生身高为170 cm ,则可估计其体重为58.79 kg.【答案】D1.设一个回归方程y ^=3+1.2x ,则变量x 增加一个单位时( ) A .y 平均增加1.2个单位 B .y 平均增加3个单位 C .y 平均减少1.2个单位 D .y 平均减少3个单位【解析】 由b =1.2>0,故选A. 【答案】 A2.下列有关线性回归的说法,不正确的是( )A .变量取值一定时,因变量的取值带有一定随机性的两个变量之间的关系叫做相关关系B .在平面直角坐标系中用描点的方法得到表示具有相关关系的两个变量的一组数据的图形叫做散点图C .回归方程最能代表观测值x 、y 之间的线性关系D .任何一组观测值都能得到具有代表意义的回归直线【解析】 只有数据点整体上分布在一条直线附近时,才能得到具有代表意义的回归直线.【答案】 D3.已知变量x 与y 正相关,且由观测数据算得样本平均数x =3,y =3.5,则由该观测数据算得的线性回归方程可能是( )A.y ^=0.4x +2.3 B.y ^=2x -2.4 C.y ^=-2x +9.5D.y ^=-0.3x +4.4【解析】 因为变量x 和y 正相关,则回归直线的斜率为正,故可以排除选项C 和D.因为样本点的中心在回归直线上,把点(3,3.5)的坐标分别代入选项A 和B 中的直线方程进行检验,可以排除B ,故选A.【答案】 A4.对具有线性相关关系的变量x 和y ,测得一组数据如下表所示.【解析】 由题意可知x =2+4+5+6+85=5,y =30+40+60+50+705=50.即样本中心为(5,50),设回归直线方程为y ^=6.5x +b ^, ∵回归直线过样本中心(5,50), ∴50=6.5×5+b ^,即b ^=17.5,∴回归直线方程为y ^=6.5x +17.5. 【答案】 y ^=6.5x +17.5学业分层测评(十四) 变量间的相关关系(建议用时:45分钟)[学业达标]一、选择题 1.有几组变量:①汽车的重量和汽车每消耗1升汽油所行驶的平均路程; ②平均日学习时间和平均学习成绩; ③立方体的棱长和体积. 其中两个变量成正相关的是( ) A .①③ B .②③ C .②D .③【解析】 ①是负相关;②是正相关;③是函数关系,不是相关关系. 【答案】 C2.对于给定的两个变量的统计数据,下列说法正确的是( ) A .都可以分析出两个变量的关系B .都可以用一条直线近似地表示两者的关系C .都可以作出散点图D .都可以用确定的表达式表示两者的关系【解析】 由两个变量的数据统计,不能分析出两个变量的关系,A 错;不具有线性相关的两个变量不能用一条直线近似地表示他们的关系,更不能用确定的表达式表示他们的关系,B ,D 错.【答案】 C3.对有线性相关关系的两个变量建立的回归直线方程y ^=a ^+b ^x 中,回归系数b^( ) A .不能小于0 B .不能大于0 C .不能等于0D .只能小于0【解析】当b^=0时,r=0,这时不具有线性相关关系,但b^能大于0,也能小于0.【答案】 C4.四名同学根据各自的样本数据研究变量x,y之间的相关关系,并求得回归直线方程,分别得到以下四个结论:①y与x负相关且y^=2.347x-6.423;②y与x负相关且y^=-3.476x+5.648;③y与x正相关且y^=5.437x+8.493;④y与x正相关且y^=-4.326x-4.578.其中一定不正确...的结论的序号是()A.①②B.②③C.③④D.①④【解析】由正负相关性的定义知①④一定不正确.【答案】 D5.某产品的广告费用x与销售额y的统计数据如下表:根据上表可得回归方程y=b x+a中的b为9.4,据此模型预报广告费用为6万元时,销售额为()A.63.6万元B.65.5万元C.67.7万元D.72.0万元【解析】x=14(4+2+3+5)=3.5,y=14(49+26+39+54)=42,所以a^=y-b^x=42-9.4×3.5=9.1,所以回归方程为y^=9.4x+9.1,令x=6,得y^=9.4×6+9.1=65.5(万元).故选B.【答案】 B二、填空题6.若施化肥量x(千克/亩)与水稻产量y(千克/亩)的回归方程为y^=5x+250,当施化肥量为80千克/亩时,预计水稻产量为亩产________千克左右.【解析】当x=80时,y^=400+250=650.【答案】6507.已知一个回归直线方程为y^=1.5x+45,x∈{1,7,5,13,19},则y=________.【解析】因为x=15(1+7+5+13+19)=9,且回归直线过样本中心点(x,y),所以y=1.5×9+45=58.5.【答案】58.58.调查了某地若干户家庭的年收入x(单位:万元)和年饮食支出y(单位:万元),调查显示年收入x与年饮食支出y具有线性相关关系,并由调查数据得到y 对x的回归直线方程:y^=0.254x+0.321.由回归直线方程可知,家庭年收入每增加1万元,年饮食支出平均增加________万元.【解析】由于y^=0.254x+0.321知,当x增加1万元时,年饮食支出y增加0.254万元.【答案】0.254三、解答题9.某工厂对某产品的产量与成本的资料分析后有如下数据:(1)(2)求成本y与产量x之间的线性回归方程.(结果保留两位小数)【解】(1)散点图如图所示.(2)设y与产量x的线性回归方程为y^=b^x+a^,x =2+3+5+64=4,y =7+8+9+124=9, b^=∑i =1nx i y i -n x y∑i =1nx 2i -n x 2=(x 1y 1+x 2y 2+x 3y 3+x 4y 4)-4x yx 21+x 22+x 23+x 24-4x2=1110=1.10,a ^=y -b ^x -=9-1.10×4=4.60. ∴回归方程为:y ^=1.10x +4.60.[能力提升]1.根据如下样本数据:得到的回归方程为y =bx +a ,则( ) A .a >0,b >0 B .a >0,b <0 C .a <0,b >0D .a <0,b <0【解析】 作出散点图如下:观察图象可知,回归直线y ^=bx +a 的斜率b <0,当x =0时,y ^=a >0.故a >0,b <0.【答案】 B2.期中考试后,某校高三(9)班对全班65名学生的成绩进行分析,得到数学成绩y 对总成绩x 的回归直线方程为y ^=6+0.4x .由此可以估计:若两个同学的总成绩相差50分,则他们的数学成绩大约相差________分.【解析】 令两人的总成绩分别为x 1,x 2. 则对应的数学成绩估计为 y ^1=6+0.4x 1,y ^2=6+0.4x 2,所以|y ^1-y ^2|=|0.4(x 1-x 2)|=0.4×50=20. 【答案】 203.从某居民区随机抽取10个家庭,获得第i 个家庭的月收入x i (单位:千元)与月储蓄y i (单位:千元)的数据资料,算得∑i =110x i =80,∑i =110y i =20,∑i =110x i y i =184,∑i =1100x2i =720.(1)求家庭的月储蓄y 对月收入x 的线性回归方程y =bx +a ; (2)判断变量x 与y 之间是正相关还是负相关;(3)若该居民区某家庭月收入为7千元,预测该家庭的月储蓄.附:线性回归方程y =bx +a 中,b =∑i =1nx i y i -n x y ∑i =1nx 2i -n x 2,a =y -b x ,其中x ,y 为样本平均值,线性回归方程也可写为y ^=b^x +a ^.【解】 (1)由题意知n =10,x =1n ∑i =1n x i =8010=8,y =1n ∑i =1n y i =2010=2,又l xx =∑i =1nx 2i -n x 2=720-10×82=80,l xy =∑i =1nx i y i -n x y =184-10×8×2=24,由此得b=l xyl xx=2480=0.3,a=y-b x=2-0.3×8=-0.4.故所求线性回归方程为y=0.3x-0.4.(2)由于变量y的值随x值的增加而增加(b=0.3>0),故x与y之间是正相关.(3)将x=7代入回归方程可以预测该家庭的月储蓄为y=0.3×7-0.4=1.7(千元).。
2017-2018学年高中数学人教B版 必修3第2章 2-3 变量的
2.3 变量的相关性2.3.1 变量间的相关关系2.3.2 两个变量的线性相关1.理解两个变量的相关关系的概念.(重点)2.会作散点图,并利用散点图判断两个变量之间是否具有相关关系.(重点)3.能根据给出的线性回归方程系数公式求回归直线方程.(重点))4.对最小二乘法原理的理解及应用.(难点[基础·初探]教材整理1变量间的相关关系阅读教材P73,完成下列问题.1.两个变量的关系将样本中n个数据点(x i,y i)(i=1,2,…,n)描在平面直角坐标系中得到的图形.3.正相关与负相关(1)正相关:如果一个变量的值由小变大时,另一个变量的值也由小变大,这种相关称为正相关.(2)负相关:如果一个变量的值由小变大时,另一个变量的值由大变小,这种相关称为负相关.如图2-3-1所示的两个变量不具有相关关系的有________.图2-3-1【解析】 ①是确定的函数关系;②中的点大都分布在一条曲线周围;③中的点大都分布在一条直线周围;④中点的分布没有任何规律可言,x ,y 不具有相关关系.【答案】 ①④教材整理2 两个变量的线性相关 阅读教材P 74~P 76,完成下列问题. 1.最小二乘法设x 、Y 的一组观察值为(x i ,y i ),i =1,2,…,n ,且回归直线方程为y ^=a +bx .当x 取值x i (i =1,2,…,n )时,Y 的观察值为y i ,差y i -y ^i (i =1,2,…,n )刻画了实际观察值y i 与回归直线上相应点纵坐标之间的偏离程度,通常是用离差的平方和,即Q =∑i =1n(y i -a -bx i )2作为总离差,并使之达到最小.这样,回归直线就是所有直线中Q 取最小值的那一条.由于平方又叫二乘方,所以这种使“离差平方和最小”的方法,叫做最小二乘法.2.回归直线方程的系数计算公式1.判断(正确的打“√”,错误的打“×”)(1)回归直线方程中,由x 的值得出的y 值是准确值.( ) (2)回归直线方程一定过样本点的中心.( ) (3)回归直线方程一定过样本中的某一个点.( )(4)选取一组数据中的部分点得到的回归方程与由整组数据得到的回归方程是同一个方程.( )【答案】 (1)× (2)√ (3)× (4) ×2.过(3,10),(7,20),(11,24)三点的回归直线方程是( ) A. y ^=1.75+5.75x B. y ^=-1.75+5.75x C. y ^=5.75+1.75xD. y ^=5.75-1.75x【解析】 求过三点的回归直线方程,目的在于训练求解回归系数的方法,这样既可以训练计算,又可以体会解题思路,关键是能套用公式.代入系数公式得b^=1.75,a ^=5.75.代入直线方程,求得y ^=5.75+1.75x .故选C.【答案】 C[小组合作型](1)( ) A .正方体的棱长和体积 B .圆半径和圆的面积C .正n 边形的边数和内角度数之和D .人的年龄和身高(2)对变量x,y有观测数据(x i,y i)(i=1,2,…,10),得散点图①;对变量u,v有观测数据(u i,v i)(i=1,2,…,10),得散点图②.由这两个散点图可以判断()图2-3-2A.变量x与y正相关,u与v正相关B.变量x与y正相关,u与v负相关C.变量x与y负相关,u与v正相关D.变量x与y负相关,u与v负相关【精彩点拨】结合相关关系,函数关系的定义及正负相关的定义分别对四个选项作出判断.【尝试解答】(1)A、B、C都是函数关系,对于A,V=a3;对于B,S=πr2;对于C,g(n)=(n-2)π.而对于年龄确定的不同的人可以有不同的身高,∴选D.(2)由图象知,变量x与y呈负相关关系;u与v呈正相关关系.【答案】(1)D(2)C判断两个变量x和y间是否具有线性相关关系,常用的简便方法就是绘制散点图,如果发现点的分布从整体上看大致在一条直线附近,那么这两个变量就是线性相关的,注意不要受个别点的位置的影响.[再练一题]1.某公司2009~2014年的年利润x(单位:百万元)与年广告支出y(单位:百万元)的统计资料如下表所示:B.利润中位数是18,x与y有负线性相关关系C.利润中位数是17,x与y有正线性相关关系D.利润中位数是17,x与y有负线性相关关系【解析】由表知,利润中位数是12(16+18)=17,且y随x的增大而增大,故选C.【答案】 C一个车间为了规定工时定额,需要确定加工零件所花费的时间,为此进行了10次试验,收集数据如下:(2)如果y与x具有线性相关关系,求y关于x的回归直线方程.【精彩点拨】画散点图→确定相关关系→求回归直线系数→写回归直线方程【尝试解答】(1)画散点图如下:由上图可知y与x具有线性相关关系.(2)列表、计算:b^=∑i =110x i y i -10x y∑i =110x 2i -10x2=55 950-10×55×91.738 500-10×552≈0.668,a^=y -b ^x =91.7-0.668×55=54.96. 即所求的回归直线方程为:y ^=0.668x +54.96.用公式求回归直线方程的一般步骤: (1)列表x i ,y i ,x i y i ; (2)计算x ,y,∑ni =1x 2i ,∑ni =1x i y i ; (3)代入公式计算b ^、a ^的值;(4)写出回归直线方程.[再练一题]2.已知变量x ,y 有如下对应数据:(1)作出散点图;(2)用最小二乘法求关于x ,y 的回归直线方程. 【解】 (1)散点图如图所示:(2)x =1+2+3+44=52, y =1+3+4+54=134,∑i =14x i y i =1+6+12+20=39.∑i =14x 2i =1+4+9+16=30,b^=39-4×52×13430-4×⎝ ⎛⎭⎪⎫522=1310,a^=134-1310×52=0, 所以y ^=1310x 为所求回归直线方程.x (吨)与相应的生产能耗y (吨标准煤)的几组对照数据:(1)(2)请根据上表提供的数据,用最小二乘法求出回归直线方程y ^=b ^x +a ^; (3)已知该厂技改前100吨甲产品的生产能耗为90吨标准煤.试根据(2)求出的线性回归方程,预测生产100吨甲产品的生产能耗比技改前降低多少吨标准煤?【导学号:00732062】【精彩点拨】 (1)以产量为横坐标,以生产能耗对应的测量值为纵坐标,在平面直角坐标系内画散点图;(2)应用计算公式求得线性相关系数b ^,a ^的值;(3)实际上就是求当x =100时,对应的v 的值.【尝试解答】 (1)散点图,如图所示:(2)由题意,得∑i =14x i y i =3×2.5+4×3+5×4+6×4.5=66.5,x =3+4+5+64=4.5, y =2.5+3+4+4.54=3.5,∑i =14x 2i =32+42+52+62=86, ∴b^=66.5-4×4.5×3.586-4×4.52=66.5-6386-81=0.7,a^=y -b ^x =3.5-0.7×4.5=0.35,故线性回归直线方程为y ^=0.7x +0.35.(3)根据回归直线方程的预测,现在生产100吨产品消耗的标准煤为0.7×100+0.35=70.35(吨),故耗能减少了90-70.35=19.65(吨)标准煤.回归分析的三个步骤:(1)判断两个变量是否线性相关:可以利用经验,也可以画散点图; (2)求线性回归直线方程,注意运算的正确性;(3)根据回归直线进行预测估计:估计值不是实际值,两者会有一定的误差.[再练一题]3.某种产品的广告费支出y (百万元)与销售额x (百万元)之间的关系如下表所示.(1)假定y 与x . (2)若广告费支出不少于60百万元,则实际销售额应不少于多少? 【解】 (1)设回归直线方程为y ^=bx +a ,则b ^=(8×5+12×8+14×9+16×11)-4×8+12+14+164×5+8+9+114(82+122+142+162)-4×⎝⎛⎭⎪⎫8+12+14+1642=438-412.5660-625=25.535=5170,a ^=y -b ^x =5+8+9+114-5170×8+12+14+164=334-5170×252=-67, 则所求回归直线方程为y ^=5170x -67.(2)由y ^=5170x -67≥60,得x ≥4 26051≈84,所以实际销售额不少于84百万元.[探究共研型]探究1 变量之间的关系?【提示】 任意两个统计数据均可以作出散点图,对于作出的散点图,如果所有的样本点都落在某一函数曲线上,就用该函数来描述变量之间的关系,即变量之间具有函数关系.特别地,若所有的样本点都落在某一直线附近,变量之间就具有线性相关关系;如果所有的样本点都落在某一函数曲线附近,变量之间就有相关关系;如果散点图中的点的分布几乎没有什么规则,则这两个变量之间不具有相关关系.探究2【提示】(1)建立直角坐标系,两轴的长度单位可以不一致.(2)将n个数据点描在平面直角坐标系中.(3)画回归直线时,一定要画在多数点经过的区域,可以先观察有哪两个点在直线上.^的含义是什么?探究3回归系数b^代表x每增加一个单位,y的平均增加单位数,而不是增加【提示】(1)b单位数.(2)当b^>0时,两个变量呈正相关关系,含义为:x每增加一个单位,y平均^个单位数;增加b^<0时,两个变量呈负相关关系,含义为:x每增加一个单位,y平均减当b^个单位数.少b探究4回归直线方程与直线方程的区别是什么?【提示】线性回归直线方程中y的上方加记号“^”是与实际值y相区别,^”的值是通过统计大量数据所得到的一个预测值,它因为线性回归方程中的“y^的值只是比较接近,但存在具有随机性,因而对于每一个具体的实际值而言,y^+e(其中e为随机变量),预测值y^与实际值y的接近程度由一定的误差,即y=y随机变量e的标准差决定.已知x与y之间的几组数据如下表:假设根据上表数据所得线性回归直线方程为y=bx+a.若某同学根据上表中的前两组数据(1,0)和(2,2)求得的直线方程为y=b′x+a′,则以下结论正确的是()A.b^>b′,a^>a′B.b^>b′,a^<a′C.b^<b′,a^>a′D.b^<b′,a^<a′【精彩点拨】 先由已知条件分别求出b ′,a ′的值,再由b ^,a ^的计算公式分别求解b^,a ^的值,即可作出比较.【尝试解答】 根据所给数据求出直线方程y =b ′x +a ′和回归直线方程的系数,并比较大小.由(1,0),(2,2)求b ′,a ′. b ′=2-02-1=2, a ′=0-2×1=-2. 求b^,a ^时, ∑i =16x i y i =0+4+3+12+15+24=58,x =3.5,y =136,∑i =16x 2i =1+4+9+16+25+36=91,∴b^=58-6×3.5×13691-6×3.52=57,a^=136-57×3.5=136-52=-13, ∴b^<b ′,a ^>a ′. 【答案】C求回归直线方程时应注意的问题:(1)知道x 与y 呈线性相关关系,无需进行相关性检验,否则应首先进行相关性检验,如果两个变量之间本身不具有相关关系,即使求出回归方程也是毫无意义的.(2)用公式计算a ^、b ^的值时,要先算出b ^,然后才能算出a ^,由a ^=y ^-b ^x 知回归直线必经过点(x ,y ).(3)利用回归直线方程,我们可以进行估计和预测.若回归直线方程为y ^=bx +a ,则x =x 0处的估计值为y ^=bx 0+a .[再练一题]4.设某大学的女生体重y (单位:kg)与身高x (单位:cm)具有线性相关关系.根据一组样本数据(x i ,y i )(i =1,2,…,n ),用最小二乘法建立的回归直线方程为y ^=0.85x -85.71,则下列结论中不正确的是( )A .y 与x 具有正的线性相关关系B .回归直线过样本点的中心(x ,y )C .若该大学某女生身高增加1 cm ,则其体重约增加0.85 kgD .若该大学某女生身高为170 cm ,则可断定其体重必为58.79 kg【解析】 b^为正数,所以两变量具有正的线性相关关系,故A 正确;B ,C显然正确;若该大学某女生身高为170 cm ,则可估计其体重为58.79 kg.【答案】 D1.设一个回归方程y ^=3+1.2x ,则变量x 增加一个单位时( ) A .y 平均增加1.2个单位 B .y 平均增加3个单位 C .y 平均减少1.2个单位 D .y 平均减少3个单位【解析】 由b =1.2>0,故选A. 【答案】 A2.下列有关线性回归的说法,不正确的是( )A .变量取值一定时,因变量的取值带有一定随机性的两个变量之间的关系叫做相关关系B .在平面直角坐标系中用描点的方法得到表示具有相关关系的两个变量的一组数据的图形叫做散点图C.回归直线方程最能代表观测值x、y之间的线性关系D.任何一组观测值都能得到具有代表意义的回归直线【解析】只有数据点整体上分布在一条直线附近时,才能得到具有代表意义的回归直线.【答案】 D3.已知变量x与y正相关,且由观测数据算得样本平均数x=3,y=3.5,则由该观测数据算得的线性回归方程可能是()A.y^=0.4x+2.3B.y^=2x-2.4C.y^=-2x+9.5D.y^=-0.3x+4.4【解析】因为变量x和y正相关,则回归直线的斜率为正,故可以排除选项C和D.因为样本点的中心在回归直线上,把点(3,3.5)的坐标分别代入选项A 和B中的直线方程进行检验,可以排除B,故选A.【答案】 A4.对具有线性相关关系的变量x和y,测得一组数据如下表所示.________.【导学号:00732063】【解析】由题意可知x=2+4+5+6+85=5,y=30+40+60+50+705=50.即样本中心为(5,50),设回归直线方程为y^=6.5x+b,∵回归直线过样本中心(5,50),∴50=6.5×5+b^,即b^=17.5,∴回归直线方程为y^=6.5x+17.5.【答案】y^=6.5x+17.5。
2017学年数学必修三:2.3.1-变量之间的相关关系~2.3.2 两个变量的线性相关
2.下列两个变量之间的关系,哪个不是函数关系 ( ) A.正方体的棱长和体积 B.圆半径和圆的面积 C.正n边形的边数和内角度数之和 D.人的年龄和身高 【解析】选D.A,B,C都是函数关系.而对于年龄确定的不同的人可以 有不同的身高.
3.下列有关回归方程 y$ b$x a$的叙述正确的是 ( ) ①反映与x之间的函数关系;
x
3
4
5
6
y
2.5
3
4
4.5
(1)请画出上表数据的散点图. (2)请根据上表提供的数据,用最小二乘法求出y关于x的回归直线方 程 y$ b$x a$. (3)已知该厂技改前100吨甲产品的生产能耗为90吨标准煤.试根据 (2)求出的回归直线方程,预测生产100吨甲产品的生产能耗比技改前 降低了多少吨标准煤?(参考数值:3×2.5+4×3+5×4+6×4.5=66.5)
树龄
2
3
4
5
6
7
8
体积
30 34 40 60 55 62 70
价值(元) 2 400 2 720 3 200 4 800 4 400 4 960 5 600
以x轴表示树木的树龄,y轴表示树木的价值,可得相应的散点图如图 所示:
类型三 利用回归方程对总体进行估计 【典例】下表提供了某厂节能降耗技术改造后生产甲产品过程中记录 的产量x(吨)与相应的生产能耗y(吨标准煤)的几组对照数据:
(2)作出散点图,确定x,y具有线性相关关系.
(3)把数据制成表格xi,yi,xi2,xiyi.
(4)计算
n
x,y,
n
xi2,
xi yi,
i1
i1
(5)代入公式计算
高一数学必修三2.3.1 变量间的相关关系
变量之间的关系是相互唯一确定的.
注:相关关系和函数关系的异同点 相同点:两者均是指两个变量间的关系 不同点:函数关系是一种确定关系,
相关关系是一种非确定的关系。
精选完整ppt课件
11
练习:
数学 成绩
学习 兴趣
花费 时间
其他 因素
如果单纯从数学对物理的影响来考虑,就是考虑这两者之 间的相关关系
我们在生活中,碰到很多相关关系的问题:
精选完整ppt课件
4
商品销售收入
? 广告支出经费
粮食产量
?
施肥量
人体脂肪含量
? 年龄
精选完整ppt课件
5
1〉商品销售收入与广告支出经费之间的关系。
商品销售收入与广告支出经费之间有着密切的联系, 但商品收入不仅与广告支出多少有关,还与商品质 量、居民收入等因素有关。
精选完整ppt课件
18
思考4:如果两个变量成负相关,从整体上看这两 个变量的变化趋势如何?其散点图有什么特点?
散点图中的点散布在从左上角到右下角的区域.
运鱼车的单位时间与存活比例
存活比例
1.5 1
0.5 0 0
0.2
0.4
0.6
单位时间
பைடு நூலகம்
思考5:你能列举一些生活中的变量成正 相关或负相关的实例吗?
精选完整ppt课件
更明确的关系,我们需要对数据进行分析,
通过作图可以对两个变量之间的关系有一个
直观的印象.以x轴表示年龄,y轴表示脂肪含
量,你能在直角坐标系中描出样本数据对应
的图形吗?
高中数学精品课件 2.3.1 变量之间的相关关系--2.3.2 两个变量的线性相关
①画出数据对应的散点图; ②判断房屋的销售价格和房屋面积之间是否具有相关关系,如果 有相关关系,是正相关还是负相关?
解 ①数据对应的散点图如图所示.
②通过以上数据对应的散点图可以判断,房屋的销售价格和房屋 面积之间具有相关关系,并且是正相关.
x0123 y1357 则 y 与 x 的线性回归方程为y^=b^ x+a^ 必过点( )
A.(2,2)
B.(1,2)
C.(1.5,0)
D.(1.5,4)
解析 易得-x=1.5,-y=4,由于回归直线过样本点的中心(-x,
-y),故选 D. 答案 D
4.小学生身高 y 与年龄 x 之间的线性回归直线方程为y^=8.8x+65, 预测一名 10 岁的小学生的身高为________. 解析 当 x=10 时,y^=8.8×10+65=153. 答案 153
题型三 利用回归方程对总体进行估计 【例3】 某地最近十年粮食需求量逐年上升,下表是部分统计数
据:
年份
2008 2010 2012 2014 2016
需求量/万吨 236 246 257 276 286
(1)利用所给数据求年需求量与年份之间的回归直线方程y^=b^ x+ a^ ; (2)利用(1)中所求出的直线方程预测该地 2018 年的粮食需求量.
函数关系
变量之间的关系可以用函数表示
相关关系 变量之间有一定的联系,但不能完全用函数表示
2.相关关系与函数关系的区别与联系
类别
区别
联系
函 ①函数关系中两个变量间是一种确定性 ①在一定的条件下可以相
高中数学 第二章 统计 2.3.1-2.3.2 变量之间的相关关系 两个变量的线性相关课件 新人教
A .1 B .1 C .1 D .1 1 6 8 4 2
35
【思路导引】利用回归直线方程必过样本点的中心求解.
【解析】选B.依题意可知样本点的中心为 ( 3 , ,3 )
48
则3
8
= 1×
3
+3
4
,a 解得
=a .
1 8Βιβλιοθήκη 36【拓展延伸】相关关系的强弱
(1)若相应于变量x的取值xi,变量y的观测值为yi(1≤i≤n),称r=
6
(2)你能举例说明你对正相关与负相关的理解吗? 提示:随自变量的变大(或变小),因变量也随之变大(或变小),这种带有随机性 的相关关系,我们称为正相关.例如,人年龄由小变大时,体内脂肪含量也由少 变多. 随自变量的变大(或变小),因变量却随之变小(或变大),这种带有随机性的相关 关系,我们称为负相关.例如,汽车越重,每消耗1 L汽油所行驶的平均路程就 越短.
n
n
x i2,
xi y,i
i1
i1
30
(5)代入公式计算
b ,a,公式为
n
x iyi n x y
b
i1
n
x
2 i
n
x
2
i1
,
a y b x .
(6)写出回归直线方程 = x+ .
yb a
31
【跟踪训练】 已知变量x,y有如下对应数据:
x1234 y1345
(1)作出散点图. (2)用最小二乘法求关于x,y的回归直线方程.
42
【思路导引】(1)以产量为横坐标,以生产能耗对应的测量值为纵坐标, 在平面直角坐标系内画散点图. (2)应用计算公式求得线性相关系数 bˆ , aˆ 的值. (3)实际上就是求当x=100时,对应的 yˆ 的值.
人教A版高中数学必修三2.3.1 2.3.2变量间的相关关系(一)
►If I had not been born Napoleon, I would have liked to have been born Alexander. 如果今天我不是拿破仑的话,我想成为亚历山大。
►Never underestimate your power to change yourself! 永远不要低估你改变自我的能力!
什么函数模型模拟效果比较好?
年份 1393 1578 1764
人口/亿 0.6 0.6 2
1849
4.1
1928
4.7
1949
5.4
1982
10.3
1990
11.6
反思与感悟
解析答案
跟踪训练3 伦敦金属交易所(LME)是世界上最大的有色金属交易所,伦敦 金属交易所的价格和库存对世界范围的有色金属生产和销售有着重要的影 响.下图是该所给出的库存消费比与铜价的散点图.观察图象,你能得出什 么结论? 解 由图可知,库存消费比与铜价是负 相关关系.
第二章 §2.3 变量间的相关关系
2.3.1 变量之间的相关关系 2.3.2 两个变量的线性相关(一)
学习目标
1.了解相关关系; 2.了解正相关,负相关的概念; 3.会作散点图,并能通过散点图判断两个变量之间是否具有相关关系.
问题导学
题型探究
达标检测
问题导学
新知探究 点点落实
知识点一 相关关系 思考 数学成绩y与学习数学所用时间t之间的关系,能否用函数关系刻画? 答案 一般来说,学数学的时间越长,成绩越好.但用时10小时,数学成 绩却不是一个确定的数字.故不能用函数关系刻画. 一般地,如果两个变量中一个变量的取值一定时,另一个变量的取值带有 一定的 随机 性,那么这两个变量之间的关系,叫做相关关系.
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
(2)问题2中,从表里数据能得出小麦的产量y与施肥量x之间的 函数关系式吗? 提示:从表格里我们很容易发现施肥量越大 ,小麦的产量就越高. 但是,施肥量并不是影响小麦产量的唯一因素 ,小麦的产量还受 土壤的质量、降雨量、田间管理等诸多因素影响 ,这时两个变
量之间就不是确定性的函数关系,因此不能得到y和x的函数关
1.两个变量的线性相关 左下角 到_______. 右上角 (1)正相关:点散布的方向:从_______ 左上角 到_______. 右下角 (2)负相关:点散布的方向:从_______ (3)回归直线:如果散点图中点的分布从整体上看在一条直线附
线性相关 关系,这条直线叫做 近,就称这两个变量之间具有_________
【解析】(1)作出散点图如图所示,
(2)由散点图可知,各点并不在一条直线附近,所以两个变量是
非线性相关关系.
类型二
求回归方程
1.(2013·锦州高一检测)已知一组观测值具有线性相关关系,
bx a ,求得 b =0.51, x =61.75, y =38.14, 则回归方 若对于 y
【探究总结】
1.散点图的作用
(1)判断两个变量之间有无相关关系,一种常用的简便可行的方
法是绘制散点图.
(2)根据散点图很容易看出两个变量之间是否具有相关关系,是
不是线性相关关系,是正相关还是负相关,相关关系强还是弱.
2.利用散点图判断变量间的关系的方法 (1)如果所有的样本点都落在某一函数的曲线上,就用该函数来 描述变量间的关系,即变量具有函数关系. (2)如果所有的样本点都落在某一函数曲线附近,变量之间就有 相关关系. (3)如果所有的样本点都落在某一条直线附近,变量之间就有线 性相关关系.
三、回归方程
bx a ”思考下面的问题: 请根据回归方程“ y
b 的几何意义分别是什么? 探究1:回归方程中 ,a,
是截距. 提示: b 是回归方程的斜率, a
探究2:对一组具有线性相关关系的样本数
bx a ,可 据:(x1,y1),(x2,y2),…,(xn,yn),设其回归方程为 y
(3)当y=20时,20=0.8x-3.4,所以x=29.25.
【规律总结】求回归方程的步骤及注意事项 (1)步骤 第一步,计算平均数 x, y ; 第二步,求和 x i yi, x 2;
3.线性回归直线方程恒过定点 【解析】恒过样本点的中心( x , y ). 答案:( x , y )
.
4.在下列各图中,每个图的两个变量具有相关关系的图 是 .
【解析】图(1)是函数关系,图(2)和图(3)是相关关系,图(4)没
有相关关系.
答案:(2)(3)
=4.4x+838.19,则可估计x与y的增长速度之 5.已知回归方程 y
施肥量x 产量y
20 440
30 460
40 470
50 480
(1)问题1中,从表里数据能得出油量y与时间t之间的函数关系
式吗?
提示:因为是以均匀的速度注入桶里,所以注入的油量y与注入
的时间t成正比例关系,由数据表格知,注入的油量y与注入的时
间t之间的函数关系式为y=2t(t≥0)(实际问题,因此自变量的
4 4
x
i 1
4
2 i
276. x i yi 112,
4
所以 b
x y
i 1 4 i
4
i 1
i
4xy 4x
2
x
i 1
2 i
112 4 8 3 0.8, 276 4 64
所以 a y bx 3 0.8 8 3.4, 所以y 0.8x 3.4.
【自主解答】1.选A.①中学生的学习态度与学习成绩之间不是 因果关系,但具有相关性,是相关关系.②教师的执教水平与学 生的学习成绩之间的关系是相关关系.③④都不具备相关关系. 2.选B.由散点图可以判断日期与发烧人数具有线性相关关系, 但不是函数关系,更不是一次函数关系,因为所有点不在一条直 线上,而是在一条直线附近.
比约为
.
22
【解析】比值约为1∶4.4= 5 . 答案:5∶22
一、变量间的相关关系 探究1:通过对下列两个问题的探究,认识两变量间的相关关系. 问题1:将汽油以均匀的速度注入桶里,注入的时间t与注入的油 量y的关系如下表: 时间t 油量y 1 2 2 4 3 6 4 8
问题2:小麦的产量y千克每亩与施肥量x千克每亩之间的关系如 下表:
定参数.
n n x i x yi y x i yi n x y i 1 i1 b n n 2 2 2 xi x xi n x i 1 i 1 a y bx. 截距 斜率 a 是回归方程的_____, 是_____. 其中 b
【拓展延伸】样本中心的含义 点( x , y )是在用最小二乘法计算回归直线方程时出现的一个 特殊点,我们又称为样本中心点.可以验证样本中心点一定在回 归直线上,这一性质在解决回归直线问题时要灵活应用,巧妙代 入,从而简化计算.
类型一
相关关系的判断及散点图 ( )
1.下列关系中,是相关关系的为
①学生的学习态度与学习成绩之间的关系; ②教师的执教水平与学生的学习成绩之间的关系; ③学生的身高与学生的学习成绩之间的关系; ④家庭的经济条件与学生的学习成绩之间的关系.
【变式训练】 科研人员为了全面掌握棉花新品种的生产情况,查看了气象局对 该地区年降雨量与年平均气温的统计数据(单位分别是mm,℃), 并作了统计. 年平均 12.51 12.84 12.84 13.69 13.33 12.74 13.05 气温
年降 雨量
748
542
507
813
574
701
432
(1)试画出散点图. (2)判断两个变量是否具有线性相关关系.
的值验证即可. 求出 a
2.根据数据,得到坐标,画出图形,再利用最小二乘法得到b和a 的值,从而得到方程.
=y-bx =38.14-0.51×61.75≈6.65. 【自主解答】1.选A. a
2.(1)
(2) x 5 7 9 11 8, y 1 2 3 6 3,
二、散点图和线性相关 根据右图,回答下列问题:
探究1:年龄和人体脂肪含量的样本数据的散点图中的点的分布 有什么特点?如果上述样本的数据形成的点均匀分布于一个圆 内,数据之间还能线性相关吗? 提示:这些点分布在一条直线附近;点均匀分布于一个圆内,这 样的点不具有线性相关关系.
探究2:画散点图时,坐标系中的横、纵坐标的长度单位必须相 同吗? 提示:可以不同,应考虑数据分布的特征. 探究3:成正相关和负相关的两个相关变量的散点图分别有什么 特点? 提示:正相关的散点图中的点散布在从左下角到右上角的区域 , 负相关的散点图中的点散布在从左上角到右下角的区域 .
2.3 变量间的相关关系
1.通过实例了解变量之间的相互关系,认识现实生活中变量间
存在的非确定性的相关关系,体会研究此类问题在现实生活中
的重要性.
2.会作散点图,学会用数量来描述现实关系. 3.知道最小二乘法的思想,了解其公式的推导过程. 4.能根据给出的线性回归方程系数公式建立线性回归方程(线 性回归方程系数公式不要求记忆).
以用哪些数量关系来刻画各样本点与回归直线的接近程度?
|或(yi- y =bxi+a.(如图) )2,其中 y 提示:可以用|yi- y i i i
探究3:对一组具有线性相关关系的样本数据,你认为其回归直 线是一条还是几条? 提示:对一组具有线性相关关系的样本数据,如果能够求出它的 回归方程,依照求回归直线的过程求出,回归直线只有一条. Nhomakorabea
1.下列变量之间的关系是函数关系的是
(
)
A.已知二次函数y=ax2+bx+c,其中a,c是已知常数,取b为自变量, 因变量是这个函数的判别式Δ =b2-4ac B.光照时间和果树亩产量 C.降雪量和交通事故发生率 D.父母的身高和子女的身高
【解析】选A.由函数关系和相关关系的定义可知A中Δ=b2-4ac, 因为a,c是已知常数,b为自变量,所以给定一个b的值,就有唯一 确定的Δ与之对应,所以Δ与b之间是一种确定的关系,是函数 关系.B,C,D中两个变量之间的关系都是随机的、不确定的,所 以不是函数关系.
【规律总结】 1.散点图在判断相关性中的作用 散点图是由大量数据对应的点的分布构成的,对于性质不明确 的两组数据可先作散点图,直观地分析它们有无相关关系及关 系的密切程度. 2.相关模型的判断方法 两变量具有相关关系但不一定是线性相关 ,所以当画出的点明 显在一条曲线附近时,两变量也具有相关关系,但不是线性相关 的.
程为
(
)
=6.65x+0.51 B. y =42.30x+0.51 D. y
=0.51x+6.65 A. y =0.51x+42.30 C. y
2.变量x,y有如下观测数据
x
5
7
9
11
y
(1)画散点图.
1
2
3
6
(2)求x,y的回归方程.
(3)根据方程,预测y=20时x的值.
【解题指南】1.根据回归方程过定点( x , y ),代入式子,只需
【探究总结】 1.回归方程的意义 回归方程只能估计变量之间的关系,不同于函数关系式,得到的 值不是准确值.通过回归方程,可以清楚地让我们了解变量之间 的相关性.
2.回归方程计算得到的数据存在误差的原因 (1)回归方程中的截距和斜率都是通过样本估计出来的,存在随 机误差,这种误差可以导致计算结果的偏差. (2)即使截距和斜率没有误差,也不可能百分之百地保证能够和 实际的y的值很接近.