高中数学 第一章 统计案例 第1节 回归分析(第2课时)学案 北师大版选修1-21

合集下载

高中数学北师大版选修1-2第一章《统计案例》(章末小结)精品学案

高中数学北师大版选修1-2第一章《统计案例》(章末小结)精品学案

第一章章末小结1.回归分析(1)回归分析步骤:回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法.其步骤:收集数据→作散点图→求回归直线方程→利用方程进行预测.(2)线性回归模型:y=bx+a,其中= x i,= y i,2.相关系数样本相关系数:对于变量y与x的一组观测值,把r==叫作变量y与x之间的样本相关系数,简称相关系数,用它来衡量两个变量之间的线性相关程度,|r|≤1.当r>0时,表明两个变量正相关;当r<0时,表明两个变量负相关.|r|越接近1,相关程度越大;|r|越接近0,相关程度越小.3.条件概率与相互独立事件(1)条件概率的定义设A,B为两个事件,且P(A)>0,称P(B|A)= 为在事件A发生的条件下,事件B发生的条件概率.(2)条件概率相关性质①0≤P(B|A)≤1.②若P(B)≠0,则P(AB)=P(B)P(A|B);若P(A)≠0,则P(AB)=P(A)P(B|A).(3)相互独立事件的定义设A,B为两个事件,如果P(AB)=P(A)P(B),则称事件A与事件B相互独立.事件A(或B)是否发生对事件B(或A)发生的概率没有影响,这样的两个事件叫作相互独立事件.(4)相互独立事件的性质如果事件A与B相互独立,那么A与,与B,与也都是相互独立的.(5)如果一系列的事件A1,A2,…,A n相互独立,那么这n个事件同时发生的概率等于每个事件发生的概率的积,即P(A1·A2·…·A n)=P(A1)·P(A2)·…·P(A n).4.χ2的计算公式及其特点(1)根据2×2列联表与构造的随机变量χ2= (其中n=a+b+c+d是样本容量)来计算χ2的值.(2)当数据量较大时,统计学中已有明确的结论,随机事件χ2≥x0发生的概率如下:当χ2≤2.706时,没有充分的证据判定变量A、B有关联,可以认为变量A、B是没有关联的;当χ2>2.706时,有90%的把握判定变量A、B有关联;当χ2>3.841时,有95%的把握判定变量A、B有关联;当χ2>6.635时,有99%的把握判定变量A、B有关联.由于抽样的随机性,由样本得到的推断有可能正确,也有可能错误.利用χ2进行独立性检验,可以对推断正确的概率做出估计,样本容量n越大,估计越准确.题型1:线性回归方程已知关于某设备的使用年数x和支出的维修费用y(万元),由资料统计得5组数据(x i,y i)(i=1,2,3,4,5),由资料知y与x线性相关,并且由统计的五组数据得平均值分别为=4,=5.4,若用5组数据得到的线性回归方程y=bx+a去估计使用8年的维修费用比使用7年的维修费用多1.1万元.(1)求回归直线方程;(2)估计使用年数为10年时,维修费用约是多少.【解析】(1)因为直线y=bx+a经过定点(,),又=4,=5.4,所以5.4=4b+a,又8b+a-(7b+a)=1.1,解得b=1.1,a=1,所以回归方程为y=1.1x+1.(2)将x=10代入线性回归方程得y=12.所以,估计使用年数为10年时,维修费用约是12万元.【小结】回归方程一定过中心点(,).本题运用方程的思想,采用待定系数法求解.线性回归方程类似于一次函数的解析式,故有问题可类比一次函数,将问题转化为求函数值.题型2:线性回归模型问题一台机器使用时间较长,但还可以使用.它按不同的转速生产出来的某机械零件有一些会有缺点,:(1)求变量y与x的相关系数,并对其相关性做出判断;(2)如果y与x有线性相关关系,求回归直线方程;(3)若在实际生产中,允许每小时的产品中有缺点的零件最多为10个,那么,机器的运转速度应控制在什么范围内?【方法指导】(1(2(3【解析】(1)=12.5,=8.25,x i y i=438,4 =412.5,=660,=291,所以r===≈≈0.9954.所以y与x有很强的线性相关关系.(2)由(1)可求得b=0.7286,a=-0.8571,所以y=0.7286x-0.8571.(3)要使y≤10,得0.7286x-0.8571≤10,所以x≤14.901.所以机器的转速应控制在14.901转/秒以下.【小结】若能从散点图直观地判断相关关系,就利用散点图进行判断;若散点图不明显时,我们就要根据相关系数r进行判断.在求回归直线方程时学会合理进行运算很关键,为准确运算,可先列表求出相关数据,然后求解.题型3:非线性相关问题:检测每册书的成本费y与印刷册数的倒数之间是否具有线性相关关系.如有,求出y对x的回归方程.【方法指导】本题是非线性回归分析问题,不妨设变量u=,题意要求对u与y作相关性检验,如果它们具有线性相关关系,就可以进一步求出y对u的回归直线方程,这时,再代回u=,就得到了y对x的回归曲线方程.【解析】:经计算得r=0.9998,从而认为u与y之间具有线性相关关系,由公式得a=1.125,b=8.973,所以y=1.125+8.973u.最后代入u=,可得y=1.125+.【小结】在某些情况下可以借助于线性回归模型,研究呈现非线性相关关系的两个变量之间的关系,分析哪个模型拟合效果更好.题型4:相互独立事件的概率甲、乙两人都进行一次射击,如果两人击中目标的概率都是0.8,两人之间相互没有影响.计算:(1)两人都击中目标的概率;(2)恰有一人击中目标的概率;(3)至少有一人击中目标的概率.【方法指导】(1(2(3【解析】设“甲击中目标”记为事件A,“乙击中目标”记为事件B,A与B相互独立.(1)两人各射击一次都击中目标即为事件AB,由事件A与B相互独立,得P(AB)=P(A)P(B)=0.8×0.8=0.64;(2)P(A+B)=P(A)+P(B)=P(A)P()+P()·P(B)=0.8×0.2+0.2×0.8=0.32;(3)P()=P()P()=(1-P(A))·(1-P(B))=(1-0.8)×(1-0.8)=0.04,1-P()=1-0.04=0.96.【小结】把一个复杂的事件拆分成几个互斥或者相互独立的事件,是解决较为复杂概率问题的根本方法.题型5:独立性检验模型为了考察某种药物预防疾病的效果,任选105只动物做试验,其中55只服用此种药,50只未服用此种药,之后发现服药的55只中有10只患病,未服药的50只动物中有20只患病,请判断此种药物是否有效.【解析】根据公式:χ2=≈6.1>3.841.所以我们有95%以上的把握判断该药物有效.【小结】在实际问题中,独立性检验的结论也仅仅是一种数学关系,得到的结论可能犯错误,这是数学中的统计思维与确定性思维的不同之处,但我们可以利用统计分析的结果去预测实际问题的结果.用独立性检验的方法准确地判断两个变量的关联性,但要注意其一般步骤及准确计算.1.(2014年·湖北卷)得到的回归方程为=bx+a,则().A.a>0,b>0B.a>0,b<0C.a<0,b>0D.a<0,b<0【解析】作出散点图如下:观察图像可知,回归直线=bx+a的斜率b<0,当x=0时,y=a>0.故a>0,b<0.【答案】B2.(2014年·江西卷)某人研究中学生的性别与成绩、视力、智商、阅读量这4个变量的关系,随机抽查了52名中学生,得到统计数据如表1至表4,则与性别有关联的可能性最大的变量是().表1表2表3表4A.成绩B.视力C.智商D.阅读量【解析】A中,a=6,b=14,c=10,d=22,a+b=20,c+d=32,a+c=16,b+d=36,n=52,χ2==.B中,a=4,b=16,c=12,d=20,a+b=20,c+d=32,a+c=16,b+d=36,n=52,χ2==.C中,a=8,b=12,c=8,d=24,a+b=20,c+d=32,a+c=16,b+d=36,n=52,χ2==.D中,a=14,b=6,c=2,d=30,a+b=20,c+d=32,a+c=16,b+d=36,n=52,χ2==.∵<<<,∴与性别有关联的可能性最大的变量是阅读量.【答案】D一、选择题1.设某产品产量与产品单位成本之间的线性相关系数为-0.97,这说明二者之间存在着().A.高度相关B.中度相关C.弱度相关D.极弱相关【答案】A2.设有回归直线方程y=2-1.5x,当变量x增加1个单位时().A.y平均增加1.5个单位B.y平均增加2个单位C.y平均减少1.5个单位D.y平均减少2个单位【解析】设变量x增加1个单位后y变为y',则y'=2-1.5(x+1)=2-1.5x-1.5=y-1.5.【答案】C3.已知对一组观测值(x i,y i)作出散点图后,确定其具有线性相关关系.若对于y=bx+a,求得b=0.51,=61.75,=38.14,则回归直线方程为().A.y=0.51x+6.6475B.y=6.6475x+0.51C.y=0.51x+42.30D.y=42.30x+0.51【答案】A4.若事件M、N相互独立,则下列三个结论:①M与相互独立;②N与相互独立;③与相互独立.其中正确的个数为().A.0B.1C.2D.3【解析】由两个事件相互独立的概念可以判定.【答案】D5.某学校开展研究性学习活动,:对于表中数据,现给出以下拟合曲线,其中拟合程度最好的是().A.y=2x-2B.y=()xC.y=log2xD.y=(x2-1)【解析】将给定的点代入比较即可.【答案】D6.下面是一个2×2列联表:则表中a+b+c+d等于().A.125B.128C.133D.147【解析】∵a+21=73,∴a=52,又由b+46=73+27,知b=54.∵c+d=27,∴a+b+c+d=133.【答案】C7.在研究变量x和y的线性相关性时,甲、乙二人分别做了研究,利用最小二乘法得到线性回归方程l1和l2,两人计算的相同,也相同,下列说法正确的是().A.l1与l2重合B.l1与l2一定平行C.l1与l2相交于点(,)D.无法判断l1和l2是否相交【解析】回归直线方程过点(,).【答案】C8.设有一个回归方程y=3-3.5x,若变量x增加一个单位,则().A.y平均增加3.5个单位B.y平均增加3个单位C.y平均减少3.5个单位D.y平均减少3个单位【解析】x的系数为-3.5,所以减少.【答案】C9.某市通过随机询问100,得到如下的2×2列联表:得到的正确结论是().A.在犯错误的概率不超过1%的前提下,认为“该市居民能否做到‘光盘’与性别有关”B.在犯错误的概率不超过1%的前提下,认为“该市居民能否做到‘光盘’与性别无关”C.有90%以上的把握认为“该市居民能否做到‘光盘’与性别有关”D.有90%以上的把握认为“该市居民能否做到‘光盘’与性别无关”【解析】χ2=≈3.030,因为χ2>2.706,所以说有90%以上的把握认为“该市居民能否做到‘光盘’与性别有关”.【答案】C10.某道路的A、B、C三处都设有交通灯,这三盏灯在一分钟内开放绿灯的时间分别为25秒、35秒、45秒,某辆车在这条路上行驶时,三处都不停车的概率是().A.B.C.D.【解析】××=.【答案】A二、填空题11.有下列关系:(1)人的年龄与他(她)的身高之间的关系;(2)圆的体积与半径之间的关系;(3)直线上的点与该点的坐标之间的关系.其中有相关关系的是(填写你认为正确的序号).【答案】(1)12.从散点图上看,点散布在从左下角到右上角的区域内,则两个变量的这种相关关系称为.【答案】正相关13.对四对变量y与x进行相关性检验,已知n是观测值的组数,r是相关系数.且已知:(1)n=7,r=0.9533;(2)n=15,r=0.3012;(3)n=17,r=0.4991;(4)n=3,r=0.9950.则变量y与x的线性关系很强的是.【解析】统计学中常用相关系数r来衡量两个变量之间线性关系的强弱,|r|≤1,|r|越接近于1,则y与x的线性关系越强.【答案】(1)(4)14.已知随机事件A的概率P(A)=0.5,事件B的概率P(B)=0.6,事件AB的概率P(AB)=0.4,则条件概率P(B|A)=.【解析】P(B|A)===0.8.【答案】0.815.幂函数曲线y=ax b,作变换u=ln y,v=ln x,c=ln a,得线性函数.【解析】将u=ln y,v=ln x,c=ln a代入y=ax b,消去x、y得u=c+bv.【答案】u=c+bv三、解答题16.因冰雪灾害,某柑橘基地果树严重受损,为此有关专家提出一种拯救果树的方案,该方案需分两年实施且相互独立.该方案预计第一年可以使柑橘产量恢复到灾前的1.0、0.9、0.8的概率分别为0.2、0.4、0.4;第二年可以使柑橘产量为第一年产量的1.5倍、1.25倍、1.0倍的概率分别是0.3、0.3、0.4.(1)求两年后柑橘产量恰好达到灾前产量的概率;(2)求两年后柑橘产量超过灾前产量的概率.【解析】(1)令A表示两年后柑橘产量恰好达到灾前产量这一事件,则P(A)=0.2×0.4+0.4×0.3=0.2.(2)令B表示两年后柑橘产量超过灾前产量这一事件,则P(B)=0.2×0.6+0.4×0.6+0.4×0.3=0.48.17.某工厂积极响应节能减排的号召,经过技术改造后,降低了能源消耗,下表提供了该厂记录的某种产品的产量x(吨):根据相关性检验,这组样本数据具有线性相关关系.(1)请根据上表提供的数据,用最小二乘法求出y关于x的线性回归方程y=bx+a;(2)已知该厂技改前100吨此种产品的生产能耗为90吨.试根据求出的线性回归方程,预测生产100吨此产品的生产能耗比技改前降低多少吨?【解析】(1)==4.5,==3.5,=86,x i y i=66.5,b===0.7,a=-b=3.5-0.7×4.5=0.35.故线性回归方程为y=0.7x+0.35.(2)根据回归方程预测生产100吨产品消耗的能耗约为0.7×100+0.35=70.35.故耗能减少了90-70.35=19.65吨.18.企业为了研究员工工作积极性和对待企业改革态度的关系,随机抽取了189名员工进行调查,其中积极支持企业改革的调查者中,工作积极的有54人,工作一般的有32人,而不太赞成企业改革的调查者中,工作积极的有40人,工作一般的有63人.(1)根据以上的数据建立一个2×2列联表;(2)对于人力资源部的研究项目,根据以上数据是否可以认为企业的全体员工对待企业改革的态度与其工作积极性有关系?【解析】(1)(2)由公式得χ2=≈10.759,因为10.759>6.635,所以有99%以上的把握说抽样员工对待企业改革的态度与工作积极性是有关的,也可以认为企业的全体员工对待企业改革的态度与其工作积极性是有关的. 19.(1)利用所给数据求年需求量与年份之间的回归直线方程y=bx+a;(2)利用(1)中所求出的直线方程预测该地2016年的粮食需求量.【解析】(1)由所给数据看出,年需求量与年份之间是近似直线上升,下面来求回归直线方程,对预处理后的数据,容易算得=0,=3.2,b==6.5,a=-b=3.2.由上述计算结果,知所求回归直线方程为:y-257=b(x-2010)+a=6.5(x-2010)+3.2,即y=6.5x-12804.8.(2)利用回归直线方程,可预测2016年的粮食需求量约为6.5×(2016-2010)+260.2=6.5×6+260.2=299.2万吨.20.某市工薪阶层关于“延迟退休年龄”的态度进行调查,随机抽调了50人,他们月收入的频数(1)由以上统计数据填下面2×2列联表并问分析“月收入以5000为分界点”对“延迟退休年(2)若参加此次调查的人中,有9人为公务员,现在要从这9人中,随机选出2人统计调查结果,其中a、b恰为统计局工作人员,求两人至少有1人入选的概率.【解析】(1)2×2χ2=≈6.27>3.841.所以有95%以上的把握认为“月收入以5000为分界点”对“延迟退休年龄”的态度有差异.(2)设9人分别为a,b,c,d,e,f,g,h,k,则选出的2人所有可能的情况为:ab,ac,ad,ae,af,ag,ah,ak;bc,bd,be,bf,bg,bh,bk;cd,ce,cf,cg,ch,ck;de,df,dg,dh,dk; ef,eg,eh,ek;fg,fh,fk;gh,gk;hk.共36种,其中a、b至少有1人入选的情况有15种,∴a、b两人至少有1人入选的概率为P==.21.某种电路开关闭合后,会出现红灯或绿灯闪动.已知开关第一次闭合后,出现红灯和绿灯的概率都是,从开关第二次闭合起,若前一次出现红灯,则下一次出现红灯的概率是,出现绿灯的概率是;若前一次出现绿灯,则下一次出现红灯的概率是,出现绿灯的概率是.(1)第二次闭合后出现红灯的概率是多少?(2)前三次发光中,出现一次红灯、两次绿灯的概率是多少?【解析】(1)概率P1=P(红红)+P(绿红)=×+×=.(2)概率P2=P(红绿绿)+P(绿红绿)+P(绿绿红)=××+××+××=.。

2018-2019学年高中数学 第一章 统计案例 1.1 回归分析学案 北师大版选修1-2

2018-2019学年高中数学 第一章 统计案例 1.1 回归分析学案 北师大版选修1-2

1.1 回归分析学习目标 1.会建立线性回归模型分析两个变量间的相关关系.2.掌握建立线性回归模型的步骤.知识点 线性回归方程 思考 (1)什么叫回归分析?(2)回归分析中,利用线性回归方程求出的函数值一定是真实值吗? 答案 (1)回归分析是对具有相关关系的两个变量进行统计分析的一种方法.(2)不一定是真实值,利用线性回归方程求的值,在很多时候是个预报值,例如,人的体重与身高存在一定的线性关系,但体重除了受身高的影响外,还受其他因素的影响,如饮食、是否喜欢运动等.梳理 (1)平均值的符号表示假设样本点为(x 1,y 1),(x 2,y 2),…,(x n ,y n ),在统计上,用x 表示一组数据x 1,x 2,…,x n 的平均值,即x =x 1+x 2+…+x n n =1n ∑i =1nx i ;用y 表示一组数据y 1,y 2,…,y n 的平均值,即y =y 1+y 2+…+y n n =1n ∑i =1ny i .(2)参数a ,b 的求法b =l xy l xx=i =1n (x i -x )(y i -y )i =1n(x i -x )2=∑i =1nx i y i -n x y∑i =1nx 2i -n x2,a =y -b x .(3)样本点的中心(x ,y ),回归直线过样本点的中心.1.现实生活中的两个变量要么是函数关系,要么是相关关系.( ×)2.散点图能准确判定两个变量是否具有线性相关关系.( ×)3.回归直线不一定过样本中的点,但一定过样本点的中心.( √)类型一概念的理解和判断例1 有下列说法:①线性回归分析就是由样本点去寻找一条直线,使之贴近这些样本点的数学方法;②利用样本点的散点图可以直观判断两个变量的关系是否可以用线性关系表示;③通过回归方程y=bx+a可以估计观测变量的取值和变化趋势;④因为由任何一组观测值都可以求得一个线性回归方程,所以没有必要进行相关性检验.其中正确命题的个数是( )A.1B.2C.3D.4考点回归分析题点回归分析的概念和意义答案 C解析①反映的正是最小二乘法思想,正确;②反映的是画散点图的作用,正确;③反映的是回归方程y=bx+a的作用,正确;④不正确,在求回归方程之前必须进行相关性检验,以体现两变量的关系.跟踪训练1 下列变量关系是相关关系的是( )①学生的学习时间与学习成绩之间的关系;②某家庭的收入与支出之间的关系;③学生的身高与视力之间的关系;④球的体积与半径之间的关系.A.①②B.①③C.②③D.②④考点回归分析题点回归分析的概念和意义答案 A解析对①,学习时间影响学生的学习成绩,但是学生学习的刻苦程度、学生的学习方法、教师的授课水平等其他因素也影响学生的成绩,因此学生的学习时间与学习成绩之间具有相关关系;对②,家庭收入影响支出,但支出除受收入影响外,还受其他因素影响,故它们是相关关系;对③,身高与视力之间互不影响,没有任何关系;对④,球的体积由半径决定,是一种确定性关系,故它们是函数关系.类型二回归分析命题角度1 求线性回归方程例2 某研究机构对高三学生的记忆力x和判断力y进行统计分析,得下表数据:x 681012y 235 6(1)请画出上表数据的散点图;(2)请根据上表提供的数据,用最小二乘法求出y关于x的线性回归方程y=bx+a;(3)试根据求出的线性回归方程,预测记忆力为9的同学的判断力.⎝⎛⎭⎪⎪⎫相关公式:b=∑i=1nx i y i-n x y∑i=1nx2i-n x2,a=y-b x考点线性回归方程题点求线性回归方程解(1)如图:(2)∑i=14x i y i=6×2+8×3+10×5+12×6=158,x =6+8+10+124=9,y =2+3+5+64=4,∑i =14x 2i =62+82+102+122=344, b =158-4×9×4344-4×92=1420=0.7, a =y -b x =4-0.7×9=-2.3,故线性回归方程为y =0.7x -2.3.(3)由(2)中线性回归方程可知,当x =9时,y =0.7×9-2.3=4,预测记忆力为9的同学的判断力约为4.反思与感悟 (1)求线性回归方程的基本步骤①列出散点图,从直观上分析数据间是否存在线性相关关系.②计算:x ,y ,∑i =1nx 2i ,∑i =1ny 2i ,∑i =1nx i y i .③代入公式求出y =bx +a 中参数b ,a 的值. ④写出线性回归方程并对实际问题作出估计.(2)需特别注意的是,只有在散点图大致呈线性时,求出的回归方程才有实际意义,否则求出的回归方程毫无意义.跟踪训练2 已知某地区4~10岁女孩各自的平均身高数据如下:求y 对x 的线性回归方程.(保留两位小数) 考点 线性回归方程 题点 求线性回归方程 解 制表x =7,y =8097,∑i =17x 2i =371,∑i =17x i y i =5798b =∑i =17x i y i -7x y∑i =17x 2i -7x 2=5798-7×7×8097371-7×72≈4.82, a =y -b x =8097-4.82×7≈81.83. 所以线性回归方程为y =81.83+4.82x . 命题角度2 线性回归分析与回归模型构建例3 某商场经营一批进价是30元/台的小商品,在市场试验中发现,此商品的销售单价x (x 取整数)(元)与日销售量y (台)之间有如下关系:x 35 40 45 50 y56412811(1)画出散点图,并判断y 与x 是否具有线性相关关系; (2)求日销售量y 对销售单价x 的线性回归方程;(3)设经营此商品的日销售利润为P 元,根据(2)写出P 关于x 的函数关系式,并预测当销售单价x 为多少元时,才能获得最大日销售利润. 考点 线性回归分析 题点 回归直线方程的应用解 (1)散点图如图所示,从图中可以看出这些点大致分布在一条直线附近,因此两个变量线性相关.(2)因为x =14×(35+40+45+50)=42.5,y =14×(56+41+28+11)=34.∑i =14x i y i =35×56+40×41+45×28+50×11=5410.∑i =14x 2i =352+402+452+502=7350. 所以b =∑i =14x i y i -4x y∑i =14x 2i -4x 2=5410-4×42.5×347350-4×42.52=-370125≈-3. a =y -b x =34-(-3)×42.5=161.5.所以线性回归方程为y =161.5-3x .(3)依题意,有P =(161.5-3x )(x -30)=-3x 2+251.5x -4845=-3⎝⎛⎭⎪⎫x -251.562+251.5212-4845.所以当x =251.56≈42时,P 有最大值,约为426元.即预测当销售单价为42元时,能获得最大日销售利润.反思与感悟 解答线性回归题目的关键是首先通过散点图来分析两变量间的关系是否线性相关,然后再利用求线性回归方程的公式求解线性回归方程,在此基础上,借助线性回归方程对实际问题进行分析.跟踪训练3 一台机器由于使用时间较长,生产的零件有一些会缺损,按不同转速生产出来的零件有缺损的统计数据如下表:(1)作出散点图;(2)如果y 与x 线性相关,求出线性回归方程;(3)若在实际生产中,允许每小时的产品中有缺损的零件最多为10个,那么,机器的运转速度应控制在什么范围? 考点 线性回归分析 题点 回归直线方程的应用解 (1)根据表中的数据画出散点图如图.(2)设线性回归方程为:y =bx +a ,并列表如下:i 12 3 4 x i 16 14 12 8 y i 11 9 8 5 x i y i1761269640x =12.5,y =8.25,∑i =14x 2i =660,∑i =14x i y i =438,所以b =438-4×12.5×8.25660-4×12.52≈0.73,a =8.25-0.73×12.5=-0.875, 所以y =0.73x -0.875.(3)令0.73x -0.875≤10,解得x <14.9≈15, 故机器的运转速度应控制在15转/秒内.1.某商品销售量y (件)与销售价格x (元/件)负相关,则其线性回归方程可能是( ) A .y =-10x +200 B .y =10x +200 C .y =-10x -200 D .y =10x -200考点 线性回归分析 题点 线性回归方程的应用 答案 A解析 因为y 与x 负相关,所以排除B ,D , 又因为C 项中x >0时,y <0不合题意,所以C 错.2.如图四个散点图中,适合用线性回归模型拟合其中两个变量的是( )A .①②B.①③C.②③D.③④ 考点 回归分析题点 回归分析的概念和意义 答案 B解析 由图易知①③两个图中样本点在一条直线附近,因此适合用线性回归模型. 3.下表是x 和y 之间的一组数据,则y 关于x 的回归直线必过点( )x 1 2 3 4 y1357A.(2,3) B .(1.5,4) C .(2.5,4) D .(2.5,5)考点 线性回归方程 题点 样本点中心的应用 答案 C解析 回归直线必过样本点中心(x ,y ),即(2.5,4).4.面对竞争日益激烈的消费市场,众多商家不断扩大自己的销售市场,以降低生产成本.某白酒酿造企业市场部对该企业9月份的产品销量x (单位:千箱)与单位成本y (单位:元)的资料进行线性回归分析,结果如下:x =72,y =71,∑i =16x 2i =79,∑i =16x i y i =1481,则销量每增加1000箱,单位成本下降________元. 考点 线性回归分析 题点 线性回归方程的应用 答案 1.8182解析 由题意知,b =1481-6×72×7179-6×⎝ ⎛⎭⎪⎫722≈-1.8182,a =71-(-1.8182)×72≈77.36,∴y 关与x 的线性回归方程为y =-1.8182x +77.36,即销量每增加1千箱,单位成本下降1.8182元. 5.已知x ,y 之间的一组数据如下表:x 0 1 2 3 y1357(1)分别计算:x ,y ,x 1y 1+x 2y 2+x 3y 3+x 4y 4,x 21+x 22+x 23+x 24; (2)已知变量x 与y 线性相关,求出线性回归方程. 考点 线性回归方程 题点 求线性回归方程解 (1)x =0+1+2+34=1.5,y =1+3+5+74=4,x 1y 1+x 2y 2+x 3y 3+x 4y 4=0×1+1×3+2×5+3×7=34,x 21+x 22+x 23+x 24=02+12+22+32=14.(2)b =34-4×1.5×414-4×1.52=2,a =y -b x =4-2×1.5=1,故线性回归方程为y =2x +1.回归分析的步骤(1)确定研究对象,明确哪个变量是自变量,哪个变量是因变量.(2)画出确定好的因变量关于自变量的散点图,观察它们之间的关系(如是否存在线性关系等).(3)由经验确定回归方程的类型(如果呈线性关系,则选用线性回归方程y =bx +a ). (4)按一定规则估计回归方程中的参数.一、选择题1.对变量x,y由观测数据(x i,y i)(i=1,2,…,10),得散点图(1);对变量u,v由观测数据(u i,v i)(i=1,2,…,10),得散点图(2),由这两个散点图可以判断( )A.变量x与y正相关,u与v正相关B.变量x与y正相关,u与v负相关C.变量x与y负相关,u与v正相关D.变量x与y负相关,u与v负相关考点回归分析题点回归分析的概念和意义答案 C解析由题图(1)可知,各点整体呈递减趋势,x与y负相关;由题图(2)可知,各点整体呈递增趋势,u与v正相关.2.某医学科研所对人体脂肪含量与年龄这两个变量研究得到一组随机样本数据,运用Excel 软件计算得y=0.577x-0.448(x为人的年龄,y为人体脂肪含量).对年龄为37岁的人来说,下面说法正确的是( )A.年龄为37岁的人体内脂肪含量为20.90%B.年龄为37岁的人体内脂肪含量约为21.01%C.年龄为37岁的人群中的大部分人的体内脂肪含量约为20.90%D.年龄为37岁的人群中的大部分人的体内脂肪含量约为31.5%考点线性回归分析题点线性回归方程的应用答案 C解析当x=37时,y=0.577×37-0.448=20.901≈20.90,由此估计,年龄为37岁的人群中的大部分人的体内脂肪含量约为20.90%.3.已知变量x和y满足关系y=-0.1x+1,变量y与z正相关,下列结论中正确的是( )A.x与y负相关,x与z负相关B.x与y正相关,x与z正相关C.x与y正相关,x与z负相关D.x与y负相关,x与z正相关考点回归分析题点回归分析的概念和意义答案 A解析由正相关和负相关的定义知A正确.4.某同学在研究性学习中,收集到某制药厂今年前5个月甲胶囊生产产量(单位:万盒)的数据如下表所示:若x,y线性相关,线性回归方程为y=0.7x+a,估计该制药厂6月份生产甲胶囊产量约为( )A.8.0万盒B.8.1万盒C.8.9万盒D.8.6万盒考点线性回归分析题点线性回归方程的应用答案 B解析回归直线一定过样本点中心.由已知数据可得x=3,y=6,代入回归方程,可得a =y-0.7x=3.9,即线性回归方程为y=0.7x+3.9.把x=6代入,可近似得y=8.1,故选B.5.工人月工资y(单位:元)关于劳动生产率x(单位:千元)的回归方程为y=650+80x,下列说法中正确的个数是( )①劳动生产率为1000元时,工资约为730元;②劳动生产率提高1000元,则工资提高80元;③劳动生产率提高1000元,则工资提高730元;④当月工资为810元时,劳动生产率约为2000元.A.1B.2C.3D.4考点 线性回归分析 题点 线性回归方程的应用 答案 C解析 代入方程计算可判断①②④正确.6.某化工厂为预测某产品的回收率y ,而要研究它和原料有效成分含量之间的相关关系,现取了8对观测值,计算得∑i =18x i =52,∑i =18y i =228,∑i =18x 2i =478,∑i =18x i y i =1849,则y 与x 的线性回归方程是( ) A .y =11.47+2.62x B .y =-11.47+2.62x C .y =2.62+11.47x D .y =11.47-2.62x考点 线性回归方程 题点 求线性回归方程 答案 A解析 由题中数据,得x =6.5,y =28.5,∴b =∑i =18x i y i -8x y∑i =18x 2i -8x 2=1849-8×6.5×28.5478-8×6.52=367140≈2.62, a =y -b x ≈28.5-2.62×6.5=11.47,∴y 对x 的线性回归方程是y =2.62x +11.47,故选A.7.为研究变量x 和y 的线性相关性,甲、乙二人分别作了研究,利用线性回归方法得到回归直线l 1和l 2,两人计算知x 相同,y 也相同,下列正确的是( ) A .l 1与l 2一定重合 B .l 1与l 2一定平行C .l 1与l 2相交于点(x ,y )D .无法判断l 1和l 2是否相交 考点 回归直线方程 题点 样本点中心的应用答案 C解析 因为两个人在试验中发现对变量x 的观测数据的平均值都是x ,对变量y 的观测数据的平均值都是y ,所以两组数据的样本点中心都是(x ,y ),因为回归直线经过样本点的中心,所以l 1和l 2都过(x ,y ). 二、填空题8.某校小卖部为了了解奶茶销售量y (杯)与气温x (℃)之间的关系,随机统计了某4天卖出的奶茶杯数与当天的气温,得到下表中的数据,并根据该样本数据用最小二乘法建立了线性回归方程y =-2x +60,则样本数据中污损的数据y 0应为________.考点 线性回归分析 题点 线性回归方程的应用 答案 64解析 由表中数据易知x =10,代入y =-2x +60中, 得y =40.由y 0+34+38+244=40,得y 0=64.9.调查某移动公司的三名推销员,其工作年限与年推销金额的数据如下表所示.由表中数据算出线性回归方程y =bx +a 中的b =726.若该公司第四名推销员的工作年限为6年,则估计他的年推销金额约为________万元. 考点 线性回归分析 题点 线性回归方程的应用 答案 3解析 x =6,y =3,由回归直线经过样本点中心可知,该推销员年推销金额约为3万元.10.某人对一地区人均工资x (千元)与该地区人均消费y (千元)进行统计调查,发现y 与x 有相关关系,并得到线性回归方程y =0.66x +1.562.若该地区的人均消费水平为7.675千元,则估计该地区的人均消费额占人均工资收入的百分比约为________.(精确到0.1%) 考点 线性回归分析 题点 线性回归方程的应用 答案 82.9%解析 当y =7.675时,x ≈9.262,所以该地区的人均消费额占人均工资收入的百分比约为7.6759.262×100%≈82.9%.11.某数学老师身高为176cm ,他爷爷、父亲和儿子的身高分别是173cm,170cm 和182cm.因儿子的身高与父亲的身高有关,该老师用线性回归分析的方法预测他孙子的身高为________cm. 考点 线性回归分析 题点 线性回归方程的应用 答案 183.5解析 记从爷爷起向下各代依次为1,2,3,4,5,用变量x 表示,其中5代表孙子.各代人的身高为变量y ,则有计算知x =2.5,y =175.25.由回归系数公式得b =3.3,a =y -b x =175.25-3.3×2.5=167,∴线性回归方程为y =3.3x +167,当x =5时,y =3.3×5+167=183.5,故预测其孙子的身高为183.5cm. 三、解答题12.从某居民区随机抽取10个家庭,获得第i 个家庭的月收入x i (单位:千元)与月储蓄y i (单位:千元)的数据资料,算得∑i =110x i =80,∑i =110y i =20,∑i =110x i y i =184,∑i =110x 2i =720.(1)求家庭的月储蓄y 对月收入x 的线性回归方程y =bx +a ; (2)判断变量x 与y 之间是正相关还是负相关;(3)若该居民区某家庭月收入为7千元,预测该家庭的月储蓄.附:b =∑i =1nx i y i -n x y∑i =1nx 2i -n x 2,a =y -b x .考点 线性回归方程 题点 线性回归方程的应用解 (1)由题意,n =10,∑i =110x i =80,∑i =110y i =20,∴x =8010=8,y =2010=2.又∑i =110x 2i -10x 2=720-10×82=80,∑i =110x i y i -10x y =184-10×8×2=24,由此得b =∑i =110x i y i -10x y∑i =110x 2i -10x 2=2480=0.3,a =y -b x =2-0.3×8=-0.4, 故所求线性回归方程为y =0.3x -0.4.(2)由于变量y 的值随x 值的增加而增加(b =0.3>0),故x 与y 之间是正相关. (3)将x =7代入回归方程可以预测该家庭的月储蓄约为y =0.3×7-0.4=1.7(千元). 13.随着我国经济的发展,居民的储蓄存款逐年增长.设某地区城乡居民人民币储蓄存款(年底余额)如下表:(1)求y 关于t 的回归方程y =bt +a ;(2)用所求回归方程预测该地区2019年(t =10)的人民币储蓄存款.附:回归方程y =bt +a 中,b =∑i =1nt i y i -n t y∑i =1nt 2i -n t 2,a =y -b t .考点 线性回归方程 题点 求线性回归方程 解 (1)列表计算如下:此时n =5,t =1n ∑i =1n t i =155=3,y =1n ∑i =1n y i =365=7.2.又l tt =∑i =1nt 2i -n t 2=55-5×32=10,l ty =∑i =1nt i y i -n t y =120-5×3×7.2=12,从而b =l ty l tt =1210=1.2,a =y -b t =7.2-1.2×3=3.6, 故所求回归方程为y =1.2t +3.6.(2)将t =10代入回归方程,可预测该地区2019年的人民币储蓄存款为y =1.2×10+3.6=15.6(千亿元). 四、探究与拓展14.某工厂为了对新研发的一种产品进行合理定价,将该产品按事先拟定的价格进行试销,得到如下数据:(1)求线性回归方程y =bx +a ,其中b =-20,a =y -b x ;(2)预计在今后的销售中,销量与单价仍然服从(1)中的关系,且该产品的成本是4元/件,为使工厂获得最大利润,该产品的单价应定为多少元?(利润=销售收入-成本) 解 (1)x =8+8.2+8.4+8.6+8.8+96=8.5,y =16(90+84+83+80+75+68)=80.∵b =-20,a =y -b x , ∴a =80+20×8.5=250, ∴线性回归方程为y =-20x +250. (2)设工厂获得的利润为L 元,则L =x (-20x +250)-4(-20x +250)=-20⎝⎛⎭⎪⎫x -3342+361.25,∴该产品的单价应定为334元,才使工厂获得的利润最大.。

数学北师大版高中选修1-2北师大版数学选修1-2 第一章 统计案例 §1回归分析

数学北师大版高中选修1-2北师大版数学选修1-2     第一章  统计案例 §1回归分析

庐山区一中高效课堂导学案北师大版数学选修1-2 第一章 统计案例 §1回归分析§1.1.1 回归分析(总第1课时)主编:查道强 审核:柯愈勇 审批:【预习案】学习目标:1、知识与技能:通过对统计案例的探究,会对两个随机变量进行线性回归分析。

2、过程与方法:学生通过实例分析学习最小二乘法,及其求解回归方程。

3、情感态度与价值观:(1)进一步树立数形结合的思想。

(2)进一步体会构建模型的作用。

教学重点:散点图的画法,回归直线方程的求解方法。

教学难点:回归直线方程的求解方法。

使用说明&学法指导:1、用15分钟左右时间,阅读探究课本P1-P6的内容,熟记基础知识,自主高效学习,提升自己的阅读理解能力。

2、完成教材助读设置的问题,然后结合课本的基础知识例题,完成预习自测题。

3、将预习中不能解决的问题标记出来,并写到后面“我的疑问”处。

(一)相关知识——知识储备,学以致用请同学们回顾前面所学知识对下面的问题做出回答:问题1:现实生活中两个变量间的关系有哪些呢?问题2:相关关系与函数关系有怎样的不同?问题3:对于线性相关的两个变量用什么方法来刻划之间的关系呢?问题4:你知道最小二乘法吗?(二)教材助读——精心阅读,仔细思考1、必修课程中,我们已经会用最小二乘法求变量之间的线性回归方程。

假设样本点为112233(,),(,),(,),(,)n n x y x y x y x y …,,设线性回归方程为 ,我们的想法就是要求a,b ,使这n 个点与直线 的“距离”平方之和 。

2、在统计中,我们使用 表示一组数据123,,,,n x x x x …的平均值,即 。

为了简化表示,我们引进求和符号,记作 。

3、1()n ii x x =-=∑ 。

1()ni i y y =-=∑ 。

4、____________________________________xx xy yy l l l ===5、线性回归方程y a bx =+,其中b=a=(三)预习自测——自我检测,自我完善自测题体现一定的基础性,又有一定的思维含量,只有“细心才对,思考才会”。

高中数学第一章统计案例1.1回归分析学案含解析北师大版选修1

高中数学第一章统计案例1.1回归分析学案含解析北师大版选修1

学习资料§1 回归分析授课提示:对应学生用书第1页[自主梳理]一、线性回归方程y =a +bx 的求法 1.平均值的符号表示 假设样本点为(x 1,y 1),(x 2,y 2),…,(x n ,y n ),在统计上,用错误!表示一组数据x 1,x 2,…,x n 的平均值,即错误!=________=________;用错误!表示一组数据y 1,y 2,…,y n 的平均值,即错误!=________=________。

2.参数a 、b 的求法 b =l xyl xx=______________=______________,a =______________。

二、相关系数1.相关系数r 的计算假设两个随机变量的数据分别为(x 1,y 1),(x 2,y 2),…,(x n ,,y n ),则变量间线性相关系数r =错误!=______________=______________。

2.相关系数r 的性质(1)r 的取值范围为________;(2)|r |值越大,误差Q 越小,变量之间的线性相关程度越________; (3)|r |值越接近0,Q 越大,变量之间的线性相关程度越________. 3.相关性的分类(1)当________时,两个变量正相关; (2)当________时,两个变量负相关; (3)当________时,两个变量线性不相关. 曲线方程 曲线图形 变换公式变换后的线性函数y =ax bc =ln a v =ln x u =ln y ______y =a e bxc =ln a u =ln y______y =a e 错误!c =ln a v =错误! u =ln y y =a + ______b ln xv =ln x u =y______1.下列变量是相关关系的是( ) A .人的身高与视力B .圆心角的大小与其所对的圆弧长C.直线上某点的横坐标与纵坐标D.人的年龄与身高2.已知回归方程y=1.5x-15,则下面正确的是()A。

高中数学第一章统计案例1回归分析教案含解析北师大版选修1_2

高中数学第一章统计案例1回归分析教案含解析北师大版选修1_2

1回归分析回归分析1.线性回归方程设样本点为(x 1,y 1),(x 2,y 2),…,(x n ,y n ),线性回归方程为y =a +bx . 则l xx =∑i =1n(x i -x -)2=∑i =1nx 2i -n x 2,l xy =∑i =1n (x i -x -)(y i -y -)=∑i =1nx i y i -n x - y -,l yy =∑i =1n (y i -y -)2=∑i =1ny 2i -n y -2,b =l xy l xx=∑i =1nx i -x-y i -y-∑i =1nx i -x-2=∑i =1nx i y i -n x - y-∑i =1nx 2i -n x -2,a =y --b x -.2.相关系数计算r =l xyl xx l yy=∑i =1nx i -xy i -y∑i =1nx i -x2∑i =1ny i -y2=∑i=1nx iy i -n x y∑i=1nx2i-n x2∑i=1ny2i-n y2性质范围r∈[-1,1]线性相关程度(1)|r|越大,线性相关程度越高;(2)|r|越接近于0,线性相关程度越低;(3)当r>0时,两个变量正相关;(4)当r<0时,两个变量负相关;(5)当r=0时,两个变量线性不相关1.回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法.2.回归直线y=a+bx过点(x,y),其中x=1n∑i=1nx i,y=1n∑i=1ny i.3.相关系数的绝对值越接近于1,相关性越强;相关系数越接近于0,相关性越弱.线性回归方程[例1] )有如下的统计资料:使用年限x/年2345 6维修费用y/万元 2.2 3.8 5.5 6.57.0若y对x(1)请画出上表数据的散点图;(2)请根据最小二乘法求出线性回归方程;(3)预测使用年限为10年时,维修费用是多少.[思路点拨] 先利用散点图分析设备使用年限与所支出的维修费用是否线性相关,若相关再利用线性回归模型求解.[精解详析] (1)作出散点图如图所示.(2)由表知,x =2+3+4+5+65=4,y =2.2+3.8+5.5+6.5+75=5,∑i =15x i y i =2×2.2+3×3.8+4×5.5+5×6.5+6×7=112.3,∑i =15x 2i =22+32+42+52+62=90, 所以b =∑i =15x i y i -n x y∑i =15x 2i -n x 2=112.3-5×4×590-5×42=1.23, a =y -b x =5-1.23×4=0.08.所以线性回归方程为y =1.23x +0.08.(3)根据(2)中的线性回归方程,可预测使用年限为10年时,维修费用约为y =1.23×10+0.08=12.38万元.[一点通] 求回归直线方程的基本步骤:1.已知变量x 与y 正相关,且由观测数据算得样本平均数x =3,y =3.5,则由该观测数据算得的线性回归方程可能为( )A.y=0.4x+2.3 B.y=2x-2.4C.y=-2x+9.5 D.y=-0.3x+4.4解析:选A 依题意知,相应的回归直线的斜率应为正,排除C,D.且直线必过点(3,3.5)代入A,B得A正确.2.调查了某地若干户家庭的年收入x(单位:万元)和年饮食支出y(单位:万元),调查显示年收入x与年饮食支出y具有线性相关关系,并由调查数据得到y对x的线性回归方程:y=0.254x+0.321.由线性回归方程可知,家庭年收入每增加1万元,年饮食支出平均增加________万元.解析:以x+1代x,得y=0.254(x+1)+0.321,与y=0.254x+0.321相减可得,年饮食支出平均增加0.254万元.答案:0.2543.某研究机构对高三学生的记忆力x和判断力y进行统计分析,得下表数据x 681012y 235 6(1)(2)请根据上表提供的数据,用最小二乘法求出y关于x的线性回归方程y=bx+a;(3)试根据求出的线性回归方程,预测记忆力为9的同学的判断力.解:(1)散点图如图:(2)∑i=1nx i y i=6×2+8×3+10×5+12×6=158,x=6+8+10+124=9,y=2+3+5+64=4,∑i=1nx2i=62+82+102+122=344.b=158-4×9×4344-4×92=1420=0.7,a=y-b^x=4-0.7×9=-2.3,故线性回归方程为y=0.7x-2.3.(3)由(2)中线性回归方程知,当x=9时,y=0.7×9-2.3=4,故预测记忆力为9的同学的判断力约为4.相关系数[例2] 关于两个变量x和y的7组数据如下表所示:x 21232527293235y 711212466115325试判断x与y之间是否有线性相关关系.[思路点拨] 首先求出r的值,再判断相关关系.[精解详析] x-=17×(21+23+25+27+29+32+35)≈27.4,y-=17×(7+11+21+24+66+115+325)≈81.3,∑i=17x2i=212+232+252+272+292+322+352=5 414,∑i=17x i y i=21×7+23×11+25×21+27×24+29×66+32×115+35×325=18 542,∑i=17y2i=72+112+212+242+662+1152+3252=124 393,∴r=∑i=17x i y i-7x-y-∑i=17x2i-7x-2∑i=17y2i-7y-2=18 542-7×27.4×81.35 414-7×27.42×124 393-7×81.32≈0.837 5.由于r≈0.837 5与1比较接近,∴x与y具有线性相关关系.[一点通] 回归分析是定义在具有相关关系的两个变量的基础上的,对于相关关系不明确的两个变量,可先作散点图,由图粗略地分析它们是否具有相关关系,在此基础上,求其回归方程,并作回归分析.4.对四对变量y和x进行线性相关检验,已知n是观测值组数,r是相关系数,且已知:①n =7,r =0.953 3;②n =15,r =0.301 2; ③n =17,r =0.499 1;④n =3,r =0.995 0. 则变量y 和x 线性相关程度最高的两组是( ) A .①和② B .①和④ C .②和④D .③和④解析:选B 相关系数r 的绝对值越大,变量x ,y 的线性相关程度越高,故选B. 5.对四组数据进行统计,获得以下散点图,关于其相关系数比较,正确的是( )A .r 2<r 4<0<r 3<r 1B .r 4<r 2<0<r 1<r 3C .r 4<r 2<0<r 3<r 1D .r 2<r 4<0<r 1<r 3解析:选A 观察散点图可知r 1>0,r 3>0,r 2<0,r 4<0,根据散点的分散程度反映出的相关性的强弱,可知r 2<r 4<0<r 3<r 1.6.在研究硝酸钠的可溶性程度时,在不同的温度(单位:℃)下观测它在水中的溶解度,得观测结果如下:温度x 0 10 20 50 70 溶解度y66.776.085.0112.3128.0解:∑5i =1x i =150,∑5i =1y i =468,∑5i =1x 2i =7 900,∑5i =1y 2i =46 445.18, x =30,y =93.6,∑5i =1x i y i =17 035, r =∑5i =1x i y i -5x y∑5i =1x 2i -5x 2∑5i =1y 2i -5y2=17 035-5×30×93.67 900-5×302×46 445.18-5×93.62≈0.999 6.可线性化的回归分析问题[例3] 为了研究某种细菌随时间x变化繁殖个数y的变化,收集数据如下:时间x/天12345 6繁殖个数y 612254995190(1)作出这些数据的散点图;(2)求y与x之间的回归方程.[思路点拨] 作出数据的散点图,选择合适的函数模型转化为线性模型.[精解详析] (1)散点图如图所示:(2)由散点图看出样本点分布在一条指数函数y=c1e c2x图像的周围,于是令z=ln y,则x 12345 6z 1.79 2.48 3.22 3.89 4.55 5.25则有y=e0.69x+1.112.[一点通] 可线性化的回归方程的求解步骤:7.下列数据x,y符合哪一种函数模型( )x 12345678910y 2 2.693 3.38 3.6 3.84 4.08 4.2 4.3x B.y=2e xA.y=2+3。

高中数学第一章统计案例章末小结教案含解析北师大版选修1_2

高中数学第一章统计案例章末小结教案含解析北师大版选修1_2

第一章 统计案例章末小结一、回归分析1.线性回归分析设样本点(x 1,y 1),(x 2,y 2),…,(x n ,y n ),其线性回归直线方程为y =a +bx ,其中b =l xy l xx =∑i =1n x i -xy i -y ∑i =1n x i -x 2=∑i =1nx i y i -n x y ∑i =1nx 2i -n x 2, a =y -b x .2.相关系数r =l xy l xx l yy=∑i =1nx i -xy i -y ∑i =1n x i -x2∑i =1ny i -y 2=∑i =1n x i y i -n x y∑i =1n x 2i -n x 2∑i =1n y 2i -n y 2. |r |值越大,变量之间的线性相关程度越高;|r |值越接近0,变量之间的线性相关程度越低.二、条件概率1.条件概率的计算公式P (B |A )=P AB P A =n AB n A. 2.计算条件概率时,必须搞清楚欲求的条件概率是在哪一个事件发生的条件下的概率,从而选择合适的条件概率公式.三、独立事件1.独立事件的判断方法(1)定义法:对两个事件A,B,如果P(AB)=P(A)P(B),则称A,B相互独立.若A,B 相互独立,则A与B,A与B,A与B也相互独立.(2)事件A是否发生对事件B发生的概率无影响.2.相互独立事件同时发生的概率的求法P(AB)=P(A)P(B).3.相互独立事件往往与互斥事件、对立事件在题目中综合考查,要注意正确运用公式.四、独立性检验独立性检验的一般步骤(1)列出2×2列联表;(2)代入公式计算χ2=n ad-bc2a +b c+d a+c b+d;(3)根据χ2的值的大小作出判断.。

2019-2020年高中数学 1.1.1回归分析教案教材分析与导入设计 北师大选修1-2

2019-2020年高中数学 1.1.1回归分析教案教材分析与导入设计 北师大选修1-2

2019-2020年高中数学 1.1.1回归分析教案教材分析与导入设计北师大选修1-2本节教材分析课本通过这个例子回归用最小二乘法求两个变量(肱骨长度和股骨长度)之间的线性回归方程的方法,并利用所求得的线性回归方程预测当股骨长度为50cm时肱骨的长度.让学生通过这个实例明白回归方程的求解步骤及原理,以及如何运用最小二乘法如何处理两个变量.三维目标1. 知识与技能:通过对统计案例的探究,会对两个随机变量进行线性回归分析.2. 过程与方法:学生通过实例分析学习最小二乘法,及其求解回归方程.3.情感.态度与价值观:(1)进一步树立数形结合的思想.(2)进一步体会构建模型的作用.教学重点:散点图的画法,回归直线方程的求解方法.教学难点:回归直线方程的求解方法..教学建议:本节课主要通过实例回归用最小二乘法求两个变量之间的线性回归方程.教学时应引导学生阅读,再结合阅读基础讲解最小二乘法的推导原理,并强调求回归方程的具体解题步骤,让学生明白回归方程的求解用途.新课导入设计导入一:(复习导入) 在必修课程中,我们已经学习了最小二乘法,并会建立变量之间的线性回归方程.引导学生阅读教材,然后完成知识点的填充.导入二:(直接导入)本节课我们在必修课的基础上,来学习利用最小二乘法来求解回归方程,下面我通过具体的实例来分析说明.2019-2020年高中数学 1.1.1构成空间几何体的基本元素教案新人教B版必修2一、教学目标1、知识与技能目标:掌握空间点、线、面之间的相互关系以及相互之间的位置关系。

2、过程与方法目标:通过让学生探究点、线、面之间的相互关系,掌握文字语言、符号语言、图示语言之间的相互转化。

3、情感、态度与价值目标:通过用集合论的观点和运动的观点讨论点、线、面、体之间的相互关系培养学生会从多角度,多方面观察和分析问题,体会将理论知识和现实生活建立联系的快乐,从而提高学生学习数学的兴趣。

二、教学重点和难点重点:点、线、面之间的相互关系,以及文字语言、符号语言、图示语言之间的相互转化。

2019-2020学年高中数学 第1章《统计案例》1.1.1回归分析(2)导学案北师大版选修1-2.doc

2019-2020学年高中数学 第1章《统计案例》1.1.1回归分析(2)导学案北师大版选修1-2.doc

2019-2020学年高中数学第1章《统计案例》1.1.1回归分析(2)导学案北师大版选修1-2学习目标1. 通过典型案例的探究,进一步了解回归分析的基本思想、方法及初步应用;2. 了解评价回归效果的三个统计量:总偏差平方和、残差平方和、回归平方和.3. 会用相关指数,残差图评价回归效果.学习过程一、课前准备复习1:用相关系数r可衡量两个变量之间关系.r>0, 相关,r<0 相关;r越接近于1,两个变量的线性相关关系,它们的散点图越接近;r>,两个变量有关系.复习2:评价回归效果的三个统计量:总偏差平方和;残差平方和;回归平方和.二、新课导学※学习探究探究任务:如何评价回归效果?新知:1、评价回归效果的三个统计量(1)总偏差平方和:(2)残差平方和:(3)回归平方和:2、相关指数:2R表示对的贡献,公式为:2R=2R的值越大,说明残差平方和,说明模型拟合效果 .3、残差分析:通过来判断拟合效果.通常借助图实现.残差图:横坐标表示,纵坐标表示 .残差点比较均匀地落在的区的区域中,说明选用的模型,带状区域的宽度越,说明拟合精度越,回归方程的预报精度越 .※ 典型例题 例1关于x 与y 有如下数据:x 24 5 6 8 y30 40 60 50 70 为了对x 、y 两个变量进行统计分析,现有以下两种线性模型: 6.517.5y x =+,717y x =+,试比较哪一个模型拟合的效果更好?※ 动手试试练1. 某班5名学生的数学和物理成绩如下表:学生 学科A B C D E 数学成绩(x )88 76 75 64 62 物理成绩(y ) 78 65 70 62 60(导学案第1页例1)(4)求学生A,B,C,D,E 的物理成绩的实际成绩和回归直线方程预报成绩的差2i i e y y =-.并作出残差图评价拟合效果.学习评价※ 自我评价 你完成本节导学案的情况为( ).A. 很好B. 较好C. 一般D. 较差※ 当堂检测(时量:5分钟 满分:10分)计分:1. 两个变量 y 与x 的回归模型中,分别选择了 4 个不同模型,它们的相关指数 2R 如下 ,其中拟合效果最好的模型是( ).A. 模型 1 的相关指数2R 为 0.98B. 模型 2 的相关指数2R 为 0.80C. 模型 3 的相关指数2R 为 0.50D. 模型 4 的相关指数2R 为 0.252. 在回归分析中,残差图中纵坐标为( ).A. 残差B. 样本编号C. xD. n e3. 通过12,,,n e e e 来判断模拟型拟合的效果,判断原始数据中是否存在可疑数据,这种分工称为( ).A.回归分析B.独立性检验分析C.残差分析D. 散点图分析4.2R 越接近1,回归的效果 .5. 在研究身高与体重的关系时,求得相关指数2R = ,可以叙述为“身高解释了69%的体重变化,而随机误差贡献了剩余 ”所以身高对体重的效应比随机误差的 .课后作业练.(07广东文科卷)下表提供了某厂节能降耗技术改造后生产甲产品过程中记录的产量x (吨)与相应的生产能耗y (吨标准煤)的几组对照数据(1)请画出上表数据的散点图; (2)请根据上表提供的数据,用最小二乘法求出y 关于x 的线性回归方程y bx a =+; x 3 4 5 6 y 2.5 3 4 4.5(3)已知该厂技改前100吨甲产品的生产能耗为90吨标准煤.试根据(2)求出的线性同归方程,预测生产100吨甲产品的生产能耗比技改前降低多少吨标准煤?⨯+⨯+⨯+⨯=)(参考数值3 2.543546 4.566.5(4)求相关指数评价模型.。

高中数学 第一章 统计案例 第1节 回归分析(第3课时)学案 北师大版选修1-21

高中数学 第一章 统计案例 第1节 回归分析(第3课时)学案 北师大版选修1-21

1.3 可线性化的回归分析1.进一步了解回归分析的基本思想,明确建立回归模型的基本步骤.2.了解回归模型与函数模型的区别,体会有些非线性模型通过变换可以转化为线性回归模型,了解在解决问题中寻找更好的模型的方法.1.在具体问题中,我们首先应该作出原始数据(x,y)的________,从______中看出数据的大致规律,再根据这个规律选择适当的函数进行拟合.2.对于非线性回归模型一般可转化为______________,从而得到相应的回归方程.3.几种常见模型(1)幂函数曲线y=ax b.其散点图在如下图所示曲线附近.设__________________,则转化为线性关系:u=c+bv.(2)指数曲线y=ae bx.其散点图在如下图所示曲线附近.设______________,则转化为线性关系:u=c+bx. (3)倒指数曲线x b aey .其散点图在如下图所示曲线附近.设____________,则转化为线性关系:u=c+bv.(4)对数曲线y=a+b ln x.其散点图在如下图所示曲线附近.设________,则转化为线性关系:y=a+bv.【做一做1】如图中曲线所表示的函数最有可能是( ).A .y =ln xB .y =e xC .xe y 13=D .xey 13-=【做一做2】 若一函数模型为y =2+3log 2x ,则作变换u =__________,才能转化为y 是u 的线性回归方程.答案:1.散点图 散点图 2.线性回归模型3.(1)u =ln y ,v =ln x ,c =ln a (2)u =ln y ,c =ln a (3)u =ln y ,c =ln a ,v =1x(4)v=ln x【做一做1】 D 【做一做2】 log 2x1.实际问题中非线性相关的函数模型的选取剖析:(1)要先作散点图;(2)选取所有符合的可能类型;(3)将非线性关系转变为线性关系后,可再作线性相关的散点图来进一步辨别,也可通过计算线性相关系数作比较.2.常见的几种模型在转化为线性关系时应注意的问题剖析:常见的几种函数模型的解析式在转变为线性相关关系时,要根据函数式的特点,灵活地换元转变为线性函数关系.常见的几种模型在使用时要注意散点图的形状符合哪一种类型曲线的形状,有时不太容易辨别,可采用多种模型拟合,并转变为线性回归关系.利用线性相关系数来判断检验用哪一种拟合效果较好,就用哪一种模型.3.利用线性回归拟合曲线的一般步骤剖析:(1)绘制散点图.一般根据数据性质结合专业知识便可确定数据的曲线类型.不能确定时,可在方格坐标纸上绘制散点图,根据散点的分布,选择接近的、合适的曲线类型.(2)进行变量替换.令y′=f(y),x′=g(x),使变换后的两个变量呈线性相关关系.(3)按最小二乘法原理求线性回归方程并进行检验.(4)将线性回归方程转换为关于原始变量x,y的回归方程.题型一已知模拟函数类型确定解析式【例题1】我国1950~1959年人口数据资料如下表所示:若y与t之间满足y=a e b(t-1 950)的关系,求函数解析式.若按此增长趋势,问我国2012年人口将达到多少亿?分析:本题中已知函数模型的类型,可通过变形转化为线性关系,从而求出.反思:本题中已知函数模型,可通过恰当的变换将函数转化为线性函数关系u=c+bt′,然后通过变换公式计算出相应的u与t′之间的数据关系表,根据求线性回归直线的公式计算出u与t′之间的函数关系,并将u与t′之间的关系再转回到y与t之间的函数关系.题型二通过数据探寻函数关系模型【例题2】某种书每册的成本费y(元)与印刷册数x(千册)有关,经统计得到数据如下表所示:检验每册书的成本费y 与印刷册数的倒数1x 之间是否具有线性相关关系,如有,求出y对x 的回归方程.分析:本题中y 与x 不具有线性相关关系,而y 与1x 可能具有线性相关关系,故先把x转化为1x ,不妨设u =1x,建立y 与u 的回归分析即可,最后转化为y 与x 的关系.反思:在拿不准y 与1x 之间是否具有线性相关关系时,可以通过变换u =1x 找y 与u 之间的关系,并通过画散点图或计算线性相关系数来进一步判断y 与u 之间是否具有线性相关关系,从而进一步完成运算.答案:【例题1】 解:设u =ln y ,c =ln a ,t ′=t -1 950,则u =c +bt ′.u 与t ′之间的关系数据如下表:由此可得:∑i =110t i ′2=285,∑i =110t i ′u i =497.593 6,t ′=4.5,u =11.016 7,进而可以得b =∑∑=='-''-'1012210110 10i i i i i t t ut u t=497.593 6-10×4.5×11.016 7285-10×4.52≈0.022 3,∴c =u -b t ′=11.016 7-0.022 3×4.5≈10.916 4. ∴u =10.916 4+0.022 3t ′.∴y =e 10.916 4+0.022 3(t -1 950)=e 10.916 4·e 0.022 3(t -1 950).当t =2 012时,u =10.916 4+0.022 3×(2 012-1 950)=12.299, ∴y =e 12.299≈219 476.40(万人),即如果按此增长趋势,到2012年将达到21.947 640亿人. 【例题2】 解:设u =1x,则y 与u 的数据关系如下表:由此可得:∑i =110u 2i =1.412 989,∑i =110y 2i =171.803,∑i =110u i y i =15.208 78,u =0.224 8,y =3.14,则线性相关系数r =∑i =110u i y i -10u y∑i =110u 2i -10u2∑i =110y 2i -10y2=15.208 78-10×0.224 8×3.141.412 989-10×0.224 82×171.803-10×3.142≈0.999 8.这表明u 与y 之间有较强的线性相关关系,从而求y 与u 的线性回归方程是有意义的.∵b =∑i =110u i y i -10uy∑i =110u 2i -10u2≈8.98,a =y -b u =3.14-8.98×0.224 8≈1.12,∴y =1.12+8.98u .∴x 与y 之间的回归方程为y =1.12+8.98x.1幂函数曲线y =x b ,当b >1时的图像为( ).答案:A 当b>1时,图像为选项A;当0<b<1时,图像为选项B;当b<0时,图像为选项C;当b=1时,图像为选项D.2倒指数曲线x b aey ,当a>0,b>0时的图像为( ).答案:A3某市居民2005~2009年家庭年平均收入x(单位:万元)与年平均支出Y(单位:万元)的统计资料如下表所示:根据统计资料,居民家庭年平均收入的中位数是__________万元,家庭年平均收入与年平均支出有__________线性相关关系.答案:13 正根据中位数的定义,居民家庭年平均收入的中位数是13,家庭年平均收入与年平均支出有正线性相关关系.4 x,y满足如下表的关系:则x,y之间符合的函数模型为__________.答案:y=x2通过数据发现y的值与x的平方值比较接近,所以x,y之间的函数模型为y =x 2.5 某地今年上半年患某种传染病的人数y(人)与月份x(月)之间满足函数关系,模型为y =a e bx ,确定这个函数解析式.分析:函数模型为指数函数,可转化为线性相关关系,从而求解. 解:设u =ln y ,c =ln a ,得u =c +bx , 则u 与x的数据关系如下表:由上表,得∑==6121i i x ,∑==613595.25i i u ,∑==61291i i x ,∑==612334.107i i u ,∑==613413.90i i i u x ,5.3=x ,u ≈4.226 58,∴b ≈2612616 6∑∑==--i i i i i xx ux u x=25.369122658.45.363413.90⨯-⨯⨯-≈0.09, c =u -b x ≈4.226 58-0.09×3.5=3.911 58,∴u =3.911 58+0.09x . ∴y =e 3.911 58·e 0.09x .。

2018_2019学年高中数学第一章统计案例1回归分析课件北师大版选修1_2

2018_2019学年高中数学第一章统计案例1回归分析课件北师大版选修1_2
2.相关系数 r 可以定量地反映出变量间的相关程度,明 确地给出有无必要建立两变量间的线性回归方程.
t2i -5 t 2
i=1
a= y -b t ≈7.2-4.134 4×1.55≈0.791 7, ∴y=4.134 4t+0.791 7. ∴y 与 x 的回归方程是 y=4.1x34 4+0.791 7.
1.判断变量之间的线性相关关系,一般用散点图,但在 作图中,由于存在误差,有时很难判断这些点是否分布在一条 直线的附近,从而就很难判断两个变量之间是否具有线性相关 关系,此时就必须利用线性相关系数来判断.
A.y=2+31x
B.y=2ex
C.y=2ex1
D.y=2+ln x
解析:选项 A 中当 x=8,9,10 时,函数值与所给数值偏 差较大,不合题意;选项 B 中当 x=10 时,y=2·e10, 远远大于 4.3,不合题意;选项 C 中的函数在(0,+∞) 上为减函数,不合题意.故选 D.
答案:D
③n=17,r=0.499 1;④n=3,r=0.995 0.
则变量 y 和 x 线性相关程度最高的两组是
()
A.①和②
B.①和④
C.②和④
D.③和④
解析:相关系数 r 的绝对值越大,变量 x,y 的线性相关
程度越高,故选 B.
答案:B
5.对四组数据进行统计,获得以下散点图,关于其相关系数比较,
正确的是
断力.
解:(1)散点图如图:
n
(2) xiyi=6×2+8×3+10×5+12×6=158,
i=1
x =6+8+410+12=9, y =2+3+4 5+6=4,
n
x2i =62+82+102+122=344.

北师大高中数学选修1-2第一章统计案例全章教案

北师大高中数学选修1-2第一章统计案例全章教案

第一章统计案例教材整体分析回归分析和独立性检验都是常用的统计方法,在统计学中也占有很重要的地位。

本章是在《数学3(必修)》的统计知识的基础上,通过对典型案例的讨论,进一步学习线性回归分析模型及其应用,并初步了解独立性检验的基本思想,认识统计思想的应用价值。

一、教学目标学习统计最好通过活动和案例来进行,抛开实际意义的作图和计算是不能帮助学生理解好统计内容的. 因此,应该通过统计活动的过程对典型案例进行探究,学习下列一些常用的统计方法,并能初步应用这些方法解决一些实际问题。

1.通过对典型案例的探究,进一步了解回归的基本思想、方法及初步应用。

2.通过对典型案例的探究,了解独立性检验(只要求列联表)的基本思想、方法及初步应用。

二、主要内容与设计思路统计是用以“收集数据、整理数据、分析数据、由数据得出结论”的一组概念、法则和方法。

统计学最关心的问题是数据能给我们提供哪些信息。

具体地说,面对一个实际问题时,我们关心如何抽取数据、如何从数据中提取信息、所得结论是否可靠等。

本章的教学内容主要由回归分析(§1)和独立性检验(§2)这两个部分组成,在章末安排有一个统计活动即“学习成绩与视力之间的关系”。

在“回归分析”的内容中,教科书首先通过真实的例子,对用最小二乘法建立变量之间线性回归方程的一般原则和方法进行了复习;接着介绍了刻画变量之间线性相关程度的另一种方法—计算线性相关系数,并通过一个具体例子引导学生进一步体会引入线性相关系数的必要性;最后介绍了可以化成线性回归的非线性回归模型,让学生通过具体的问题进一步了解回归的基本思想和应用。

在“独立性检验”的内容中,教科书首先通过实例介绍了条件概率与独立事件;接着通过对“吸烟与肺癌是否相关”的分析介绍了独立性检验的方法;然后通过引入统计量初步感受独立性检验的基本思想;最后介绍独立性检验的应用解决了一些实际问题。

当然,统计的学习离不开实践。

因此,教科书还设计了一个统计活动:学习成绩与视力之间的关系,希望通过这个统计活动,使学生经历较为系统的数据处理过程,并在此过程中综合运用前面所学的知识和统计方法去解决实际问题。

2018_2019学年高中数学第一章统计案例章末复习学案北师大版选修1_2

2018_2019学年高中数学第一章统计案例章末复习学案北师大版选修1_2

第一章 统计案例章末复习学习目标 1.会求线性回归方程,并用回归直线进行预报.2.理解独立性检验的基本思想及实施步骤.一、线性回归分析 1.线性回归方程在线性回归方程y =a +bx 中,b =∑n i =1(x i -x )(y i -y )∑ni =1 (x i -x )2=∑ni =1x i y i -n x y ∑n i =1x 2i -n x 2,a =y -b x .其中x =1n ∑n i =1x i ,y =1n∑ni =1y i . 2.相关系数(1)相关系数r 的计算公式r =∑n i =1x i y i -n x y∑n i =1x 2i -n x2∑ni =1y 2i -n y2.(2)相关系数r 的取值范围是[-1,1],|r |值越大,变量之间的线性相关程度越高. (3)当r >0时,b >0,称两个变量正相关; 当r <0时,b <0,称两个变量负相关; 当r =0时,称两个变量线性不相关. 二、条件概率 1.条件概率的概念设A ,B 为两个事件,已知B 发生的条件下,A 发生的概率,称为B 发生时A 发生的条件概率,记为P (A |B ). 2.计算公式P (B |A )=P (AB )P (A )=n (AB )n (A ).三、独立事件 1.独立事件的概念设A,B为两个事件,若P(AB)=P(A)P(B),则称事件A与事件B相互独立.2.相互独立事件与互斥事件的对比四、独立性检验1.2×2列联表设A,B为两个变量,每一变量都可以取两个值,得到表格其中,a表示变量A取A1,且变量B取B1时的数据,b表示变量A取A1,且变量B取B2时的数据;c表示变量A取A2,且变量B取B1时的数据;d表示变量A取A2,且变量B取B2时的数据.上表在统计中称为2×2列联表.2.统计量χ2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d).3.独立性检验当χ2≤2.706时,没有充分的证据判定变量A,B有关联,可以认为变量A,B是没有关联的.当χ2>2.706时,有90%的把握判定变量A,B有关联.当χ2>3.841时,有95%的把握判定变量A,B有关联.当χ2>6.635时,有99%的把握判定变量A,B有关联.类型一回归分析例1 如图所示的是某企业2011年至2017年污水净化量(单位:吨)的折线图.(1)由折线图看出,可用线性回归模型拟合y 和t 的关系,请用相关系数加以说明; (2)建立y 关于t 的回归方程,预测2019年该企业污水净化量.附注:参考数据:y =54,i =17(t i -t )(y i -y )=21,14≈3.74,i =17(y i -y )2=18.参考公式:相关系数r =i =1n(t i -t )(y i -y )i =1n(t i -t )2i =1n(y i -y )2,回归方程y =a +bt 中斜率和截距的最小二乘法估计公式分别为b =i =1n(t i -t )(y i -y )i =1n(t i -t )2,a =y -b t .考点 线性回归分析 题点 线性回归方程的应用解 (1)由题意,t =4,i =17(t i -t )(y i -y )=21,∴r =i =17(t i -t )(y i -y )i =17(t i -t )2i =17(y i -y )2=2128×18≈0.936.∵0.936>0.75,故y 与t 之间存在较强的正相关关系.(2)由题意,y =54,b =i =17(t i -t )(y i -y )i =17(t i -t )2=2128=34, a =y -b t =54-34×4=51,∴y 关于t 的回归方程为y =34t +51.当t =9时,y =34×9+51=57.75,预测2019年该企业污水净化量约为57.75吨.反思与感悟 解决回归分析问题的一般步骤 (1)画散点图.根据已知数据画出散点图.(2)判断变量的相关性并求回归方程.通过观察散点图,直观感知两个变量是否具有相关关系;在此基础上,利用最小二乘法求回归系数,然后写出回归方程. (3)实际应用.依据求得的回归方程解决实际问题.跟踪训练1 某兴趣小组欲研究昼夜温差大小与患感冒人数之间的关系,他们分别到气象局与某医院抄录了1至6月份每月10号的昼夜温差x (℃)与因患感冒而就诊的人数y ,得到如下资料:该兴趣小组确定的研究方案是:先从这六组数据中选取2组,用剩下的4组数据求线性回归方程,再用被选取的2组数据进行检验. (1)求选取的2组数据恰好是相邻两个月的概率;(2)若选取的是1月与6月的两组数据,请根据2至5月份的数据,求出y 关于x 的线性回归方程y =bx +a ;(3)若由线性回归方程得到的估计数据与所选出的检验数据的误差均不超过2人,则认为得到的线性回归方程是理想的,试问该小组所得线性回归方程是否理想?(参考公式:b =∑i =1nx i y i -n x y∑i =1nx 2i -n x2=i =1n(x i -x )(y i -y )i =1n(x i -x )2,a =y -b x )考点 线性回归分析 题点 线性回归方程的应用解 (1)设抽到相邻两个月的数据为事件A .试验发生包含的事件是从6组数据中选取2组数据,共有15种情况,每种情况都是等可能出现的,其中抽到相邻两个月的数据的情况有5种,∴P (A )=515=13.(2)由数据求得x =11,y =24,由公式求得b =187,∴a =y -b x =-307,∴y 关于x 的线性回归方程为y =187x -307.(3)当x =10时,y =1507,⎪⎪⎪⎪⎪⎪1507-22<2;当x =6时,y =787,⎪⎪⎪⎪⎪⎪787-12<2. ∴该小组所得线性回归方程是理想的. 类型二 条件概率与独立事件例2 (1)一个盒子中有6支好晶体管,4支坏晶体管,任取两次,每次取一支,第一次取后不放回,若已知第一支是好的,则第二支也是好的概率为________. 答案 59解析 设A i (i =1,2)表示“第i 支是好的”. 由题意,得P (A 1)=610=35,P (A 1A 2)=610×59=13,∴P (A 2|A 1)=P (A 1A 2)P (A 1)=1335=59.(2)小张参加某电视台举办的百科知识竞赛的预选赛,只有闯过了三关的人才能参加决赛.按规则:只有过了第一关,才能去闯第二关;只有过了第二关,才能去闯第三关.对小张来说,过第一关的概率为0.8,如果不按规则去闯第一关,而直接去闯第二关能通过的概率为0.75,直接去闯第三关能通过的概率为0.5. ①求小张在第二关被淘汰的概率; ②求小张不能参加决赛的概率.解 记“小张能过第一关”为事件A ,“直接去闯第二关能通过”为事件B ,“直接闯第三关能通过”为事件C ,则P (A )=0.8,P (B )=0.75,P (C )=0.5. ①小张在第二关被淘汰的概率为P (A B )=P (A )[1-P (B )]=0.8×(1-0.75)=0.2.②小张不能参加决赛的概率为1-P (ABC )=1-P (A )·P (B )P (C )=1-0.8×0.75×0.5=0.7. 反思与感悟 (1)要正确理解条件概率公式的意义,P (AB )为事件A ,B 同时发生的概率,P (A |B )表示在B 发生的前提下,A 发生的概率.(2)在解决互斥事件、对立事件与独立事件的综合问题时,一般先利用独立事件的定义求出各互斥事件发生的概率,然后利用概率加法公式求概率.(3)“至多”“至少”类题目可考虑利用对立事件的概率公式求解,以简化计算. 跟踪训练2 若某种动物由出生算起活到20岁的概率为0.8,活到25岁的概率为0.4,现有一只20岁的这种动物,则它能活到25岁的概率是________. 答案 0.5解析 设“动物活到20岁”为事件A ,“活到25岁”为事件B ,则P (A )=0.8,P (B )=0.4,由于AB =B ,所以P (AB )=P (B )=0.4. 所以20岁的动物活到25岁的概率为P (B |A )=P (AB )P (A )=P (B )P (A )=0.40.8=0.5.类型三 独立性检验思想及应用例3 奥运会期间,为调查某高校学生是否愿意提供志愿者服务,用简单随机抽样方法从该校调查了60人,结果如下:(1)用分层抽样的方法在愿意提供志愿者服务的学生中抽取6人,其中男生抽取多少人? (2)你能否在犯错误的概率不超过0.01的前提下认为该高校学生是否愿意提供志愿者服务与性别有关?下面的临界值表供参考:独立性检验统计量χ2=n (ad -bc )2(a +b )(c +d )(a +c )(b +d ),其中n =a +b +c +d .考点 独立性检验思想的应用题点 分类变量与统计、概率的综合性问题 解 (1)由题意,可知男生抽取6×2020+10=4(人).(2)χ2=60×(20×20-10×10)230×30×30×30≈6.667,由于6.667>6.635,所以能在犯错误的概率不超过0.01的前提下认为该高校学生是否愿意提供志愿者服务与性别有关.反思与感悟独立性检验问题的求解策略通过公式χ2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d)先计算χ2的值,再与临界值表作比较,最后得出结论.跟踪训练3 某学生对其亲属30人的饮食习惯进行了一次调查,并用茎叶图表示30人的饮食指数,如图所示.(说明:图中饮食指数低于70的人,饮食以蔬菜为主;饮食指数高于70的人,饮食以肉类为主).(1)根据茎叶图,帮助这位同学说明其亲属30人的饮食习惯;(2)根据以上数据完成下列2×2列联表;(3)在犯错误的概率不超过0.01的前提下,是否能认为“其亲属的饮食习惯与年龄有关”?考点独立性检验思想的应用题点独立性检验在分类变量中的应用解(1)30位亲属中50岁以上的人饮食多以蔬菜为主,50岁以下的人饮食多以肉类为主.(2)2×2列联表如表所示:(3)χ2=30×(8-128)212×18×20×10=10>6.635,故在犯错误的概率不超过0.01的前提下能够认为“其亲属的饮食习惯与年龄有关”.1.下列相关系数r对应的变量间的线性相关程度最强的是( )A.r=0.90 B.r=0.5C.r=-0.93 D.r=0考点线性相关系数题点线性相关系数的应用答案 C2.某工程施工在很大程度上受当地年降水量的影响,施工期间的年降水量X(单位:mm)对工期延误天数Y的影响及相应的概率P如下表所示:在年降水量X至少是100的条件下,工期延误小于30天的概率为( )A.0.7B.0.5C.0.3D.0.2考点条件概率的定义及计算公式题点直接利用公式求条件概率答案 B解析设事件A为“年降水量X至少是100”,事件B为“工期延误小于30天”,则P(B|A)=P(AB)P(A)=0.2+0.10.2+0.1+0.3=0.5,故选B.3.某化妆品公司为了增加其商品的销售利润,调查了该商品投入的广告费用x与销售利润y 的统计数据如下表:由表中数据,得线性回归方程l:y=bx+a,则下列结论正确的是( )A.b<0 B.a<0C.直线l过点(4,8) D.直线l过点(2,5)考点线性回归方程题点样本点中心的应用答案 C解析 由表计算可得x =4,y =8,b =1.4>0,a =y -b x =8-1.4×4=2.4>0,所以排除A ,B ;因为y =1.4x +2.4,所以1.4×2+2.4=5.2≠5,所以点(2,5)不在直线l 上,所以排除D ;因为x =4,y =8,所以回归直线l 过样本点的中心(4,8),故选C. 4.在西非肆虐的“埃博拉病毒”的传播速度很快,这已经成为全球性的威胁.为了考察某种埃博拉病毒疫苗的效果,现随机抽取100只小鼠进行试验,得到如下列联表:附表:参照附表,在犯错误的概率不超过________(填百分比)的前提下,认为“小鼠是否被感染与服用疫苗有关”.考点 独立性检验及其基本思想 题点 独立性检验的方法 答案 5%解析 χ2=100×(10×30-20×40)230×70×50×50≈4.762>3.841,所以在犯错误的概率不超过5%的前提下,认为“小鼠是否被感染与服用疫苗有关”.5.对于线性回归方程y =bx +a ,当x =3时,对应的y 的估计值是17,当x =8时,对应的y 的估计值是22,那么,该线性回归方程是_______,根据线性回归方程判断当x =______时,y 的估计值是38.考点 线性回归分析 题点 线性回归方程的应用 答案 y =x +14 24解析 首先把两组值代入线性回归方程,得⎩⎪⎨⎪⎧3b +a =17,8b +a =22,解得⎩⎪⎨⎪⎧b =1,a =14.所以线性回归方程是y =x +14.令x +14=38,可得x =24,即当x =24时,y 的估计值是38.1.建立回归模型的基本步骤 (1)确定研究对象,明确变量. (2)画出散点图,观察它们之间的关系. (3)由经验确定回归方程的类型.(4)按照一定的规则估计回归方程中的参数. 2.条件概率的两个求解策略(1)定义法:计算P (A ),P (B ),P (AB ),利用P (A |B )=P (AB )P (B )⎝ ⎛⎭⎪⎫或P (B |A )=P (AB )P (A )求解. (2)缩小样本空间法:利用P (B |A )=n (AB )n (A )求解. 其中(2)常用于古典概型的概率计算问题.3.独立性检验是研究两个分类变量间是否存在相关关系的一种案例分析方法.一、选择题1.有人收集了春节期间平均气温x 与某取暖商品销售额y 的有关数据如表:则该商品销售额与平均气温有( ) A .确定性关系 B .正相关关系 C .负相关关系 D .函数关系考点 回归分析题点 回归分析的概念和意义 答案 C解析 根据春节期间平均气温x 与某取暖商品销售额y 的有关数据知,y 随x 的减小而增大,是负相关关系,故选C.2.如果χ2的观测值为8.654,可以认为“x 与y 无关”的可信度为( ) A .99.5%B .0.5%C .99%D .1% 考点 独立性检验及其基本思想 题点 独立性检验的方法 答案 B解析 ∵8.654>7.879,∴x 与y 无关的可信度为0.5%. 3.根据如下样本数据:得到的线性回归方程为y =bx +a .若样本点的中心为(5,0.9),则当x 每增加1个单位时,y 就( )A .增加1.4个单位B .减少1.4个单位C .增加7.9个单位D .减少7.9个单位考点 线性回归分析 题点 线性回归方程的应用 答案 B 解析 依题意得,a +b -25=0.9,故a +b =6.5,①又样本点的中心为(5,0.9),故0.9=5b +a ,②联立①②,解得b =-1.4,a =7.9,则y =-1.4x +7.9, 可知当x 每增加1个单位时,y 就减少1.4个单位.4.经过对统计量χ2的研究,得到了若干个临界值,当χ2<2.706时,我们认为事件A 与B ( ) A .在犯错误的概率不超过0.05的前提下有关系 B .在犯错误的概率不超过0.01的前提下有关系 C .没有充分理由认为A 与B 有关系 D .不能确定考点 独立性检验及其基本思想 题点 独立性检验的方法 答案 C解析 因为χ2<2.706,而犯错误的概率大于10%, 所以没有充分理由认为A 与B 有关系.5.某考察团对10个城市的职工人均工资x (千元)与居民人均消费y (千元)进行调查统计,得出y 与x 具有线性相关关系,且回归方程为y =0.6x +1.2.若某城市职工人均工资为5千元,估计该城市人均消费额占人均工资收入的百分比为( ) A .66% B .67% C .79%D .84%考点 线性回归分析题点 回归直线方程的应用 答案 D解析 因为y 与x 具有线性相关关系,满足回归方程y =0.6x +1.2,该城市居民人均工资为x =5,所以可以估计该城市的职工人均消费水平y =0.6×5+1.2=4.2,所以可以估计该城市人均消费额占人均工资收入的百分比为4.25×100%=84%.6.为了了解疾病A 是否与性别有关,在某医院随机地对入院的50人进行了问卷调查,得到了如下的列联表:则认为疾病A 与性别有关的把握约为( ) 临界值表:A.95% B .99% C .99.5%D .99.9%考点 独立性检验及其基本思想 题点 独立性检验的方法 答案 C解析 由公式得χ2=50×(20×15-5×10)225×25×30×20≈8.333>7.879,故有(1-0.005)×100%=99.5%的把握认为疾病A 与性别有关. 7.下列说法:①设有一个线性回归方程y =3-5x ,变量x 增加一个单位时,y 平均增加5个单位; ②回归方程y =bx +a 必过(x ,y );③在一个2×2列联表中,由计算得χ2=13.079,则有99%的把握确认这两个变量间有关系. 其中错误的个数是( ) A .0B .1C .2D .3 答案 B解析 回归方程中x 的系数具备直线斜率的功能,对于回归方程y =3-5x ,当x 增加一个单位时,y 平均减少5个单位,①错误;由线性回归方程的定义知,线性回归方程y =bx +a 必过点(x ,y ),②正确;因为χ2>6.635,故有99%的把握确认这两个变量有关系,③正确.故选B. 二、填空题8.将两枚质地均匀的骰子各掷一次,设事件A ={两个点数互不相同},B ={出现一个5点},则P (B |A )=________.考点 条件概率的定义及计算公式 题点 利用缩小基本事件空间求条件概率 答案 13解析 出现点数互不相同的共有n (A )=6×5=30(种), 出现一个5点,共有n (AB )=5×2=10(种), 所以P (B |A )=n (AB )n (A )=13. 9.为了规定工时定额,需要确定加工零件所花费的时间,为此进行5次试验,得到5组数据(x 1,y 1),(x 2,y 2),(x 3,y 3),(x 4,y 4),(x 5,y 5).根据收集到的数据可知x 1+x 2+x 3+x 4+x 5=150,由最小二乘法求得线性回归方程为y =0.67x +54.9,则y 1+y 2+y 3+y 4+y 5的值为________. 考点 线性回归方程 题点 样本点中心的应用 答案 375解析 由题意,得x =15(x 1+x 2+x 3+x 4+x 5)=30,且回归直线y =0.67x +54.9恒过点(x ,y ),则y =0.67×30+54.9=75,所以y 1+y 2+y 3+y 4+y 5=5y =375.10.某工厂为了调查工人文化程度与月收入之间的关系,随机调查了部分工人,得到如下表所示的2×2列联表(单位:人):由2×2列联表计算可知,我们有________以上的把握认为“文化程度与月收入有关系”.附:χ2=n (ad -bc )2(a +b )(c +d )(a +c )(b +d )考点 独立性检验及其基本思想 题点 独立性检验的方法 答案 97.5%解析 由表中的数据可得χ2=105×(10×30-45×20)255×50×30×75≈6.109,由于6.109>5.024,所以我们有97.5%以上的把握认为“文化程度与月收入有关系”.11.某炼钢厂废品率x (%)与成本y (元/吨)的线性回归方程为y =105.492+42.569x .当成本控制在176.5元/吨时,可以预计生产的1000吨钢中,约有________吨钢是废品.(结果保留两位小数)考点 线性回归分析 题点 线性回归方程的应用 答案 16.68解析 因为176.5=105.492+42.569x ,解得x ≈1.668,即当成本控制在176.5元/吨时,废品率约为1.668%,所以生产的1000吨钢中,约有1000×1.668%=16.68(吨)是废品. 三、解答题12.某农科所对冬季昼夜温差大小与某反季节大豆新品种发芽多少之间的关系进行分析研究,他们分别记录了12月1日至12月5日的每天昼夜温差与实验室每天每100颗种子中的发芽数,得到如下资料:该农科所确定的研究方案是:先从这五组数据中选取2组,用剩下的3组数据求线性回归方程,再对被选取的2组数据进行检验.(1)求选取的2组数据恰好是不相邻2天数据的概率;(2)若选取的是12月1日与12月5日的两组数据,请根据12月2日至12月4日的数据,求出y 关于x 的线性回归方程y =bx +a ;(3)若由线性回归方程得到的估计数据与所选出的检验数据的误差均不超过2颗,则认为得到的线性回归方程是可靠的,试问(2)中所得的线性回归方程是否可靠? 考点 线性回归分析题点 线性回归方程的应用解 (1)设事件A 表示“选取的2组数据恰好是不相邻2天的数据”,则A 表示“选取的数据恰好是相邻2天的数据”.基本事件总数为10,事件A 包含的基本事件数为4. ∴P (A )=410=25,∴P (A )=1-P (A )=35.(2)x =12,y =27,∑i =13x i y i =977,∑i =13x 2i =434,∴b =∑i =13x i y i -3x y∑i =13x 2i -3x 2=977-3×12×27434-3×122=2.5, a =y -b x =27-2.5×12=-3,∴y =2.5x -3.(3)由(2)知:当x =10时,y =22,误差不超过2颗; 当x =8时,y =17,误差不超过2颗. 故所求得的线性回归方程是可靠的. 四、探究与拓展13.对某台机器购置后的运营年限x (x =1,2,3,…)与当年利润y 的统计分析知具备线性相关关系,线性回归方程为y =10.47-1.3x ,估计该台机器使用________年最合算. 考点 线性回归分析 题点 线性回归方程的应用 答案 8解析 只要预计利润不为负数,使用该机器就算合算,即y ≥0,所以10.47-1.3x ≥0,解得x ≤8.05,所以该台机器使用8年最合算.14.某校高一年级理科有8个班,在一次数学考试中成绩情况分析如下:附:∑8i =1x i y i =171,∑8i =1x 2i =204. (1)求145分以上成绩人数y 对班级序号x 的线性回归方程;(精确到0.0001)(2)能否在犯错误的概率不超过0.01的前提下认为7班与8班的成绩是否优秀(大于145分)与班级有关系.考点 独立性检验思想的应用题点 独立性检验与线性回归方程、均值的综合应用解 (1)x =4.5,y =5,∑8i =1x i y i =171,∑8i =1x 2i =204, b =∑8i =1x i y i -8x y∑8i =1x 2i -8x2=171-8×4.5×5204-8×4.52=-314≈-0.2143, a =y -b x =5-(-0.2143)×4.5≈5.9644,∴线性回归方程为y =-0.2143x +5.9644. (2)χ2=90×(3×38-42×7)245×45×80×10=1.8,∵1.8<6.635,∴不能在犯错误的概率不超过0.01的前提下认为7班与8班的成绩是否优秀(大于145分)与班级有关系.。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

1.2 相关系数1.了解回归分析的概念和最小二乘法的求法及作用.2.理解相关系数的含义及求法.3.了解回归分析的基本思想.会建立回归模型,并能利用回归分析进行有效预测.1.变量间的关系往往会表现出某种不确定性,________就是研究这种变量之间的关系的一种方法,通过对变量之间关系的研究,从而发现蕴涵在事物或现象中的某些规律.【做一做1】下列两变量中具有相关关系的是( ).A.正方体的体积与边长B.人的身高与体重C .匀速行驶的车辆的行驶距离与时间D .球的半径与体积2.假设样本点为(x 1,y 1),(x 2,y 2),…,(x n ,y n ),我们可用____________求变量之间的线性回归方程y =a +bx ,即求a ,b ,使这n 个点与直线y =a +bx 的“距离”平方之和最小,即使得Q (a ,b )=(y 1-a -bx 1)2+(y 2-a -bx 2)2+…+(y n -a -bx n )2达到最小.3.Q (a ,b )=l yy +n [y -(a +b x )]2+l xx ⎝ ⎛⎭⎪⎫b -l xy l xx 2-xxy xx l l 2.其中x =x 1+x 2+…+x n n=1n∑i =1nx i ,y =y 1+y 2+…+y n n=1n∑i =1ny i ,l xx =∑i =1n (x i -x )2=∑i =1nx 2i -n x2,l xy =∑i =1n(x i -x )(y i -y )=∑i =1nx i y i -n xy ,l yy =∑i =1n(y i -y )2=∑i =1ny 2i -n y2.当Q (a ,b )取最小值时,b =____________,a =________.y 对x 的线性回归方程为__________,此直线一定过点______.公式比较复杂难记,只需记住a,b的求值公式即可.做题要细心,不可遗漏数据,使用公式计算时,可通过列出表格,进行计算,表格如下:【做一做2-1】已知x与y之间的一组数据如下表,则y与x的线性回归方程y=bx +a必过点__________.【做一做2-2】已知三个样本点(3,10),(7,20),(11,24),求出其线性回归方程.4.判断两个变量之间的线性相关关系的方法有(1)________________________;(2)______________________.两个变量之间是否有线性相关关系,可以通过画散点图直观判断,但是在某些情况下,从散点图中不容易判断变量之间的线性相关关系,特别是当数据量较大时,画散点图比较麻烦,此时就可以通过计算,用线性相关系数r来作出判断,比较容易实施.5.假设两个随机变量的数据分别为(x1,y1),(x2,y2),…,(x n,y n),则变量间线性相关系数r的计算公式为r=__________________.线性相关系数|r|≤1,|r|越大,变量之间的线性相关程度越高,用直线拟合的效果就越好.线性相关系数r 的计算公式虽然比较复杂,但是可以分开计算.因为在求线性回归方程时,也要计算x ,y ,∑i =1nx i y i 和∑i =1nx 2i 等量,只需再把∑i =1ny 2i 计算出来即可.通常是通过列表格来完成上述各项的计算.【做一做3】 在建立两个变量y 与x 的线性回归模型中,分别选择了4个不同的模型,它们的相关系数r 如下,其中拟合得最好的模型是( ).A .模型1的相关系数r 为0.98B .模型2的相关系数r 为0.80C .模型3的相关系数r 为0.50D .模型4的相关系数r 为0.25答案:1.回归分析【做一做1】 B 选项A 中正方体的体积为边长的立方,有固定的函数关系;选项C 中匀速行驶的车辆的行驶距离与时间成正比,也有函数关系;选项D 中球的体积是43π与半径的立方相乘,有固定的函数关系.所以只有选项B 中人的身高与体重具有相关关系.2.最小二乘法3.l xy l xx=∑i =1nx i -x y i -y∑i =1nx i -x2=∑i =1nx i y i -n xy∑i =1nx 2i -n x2y -b x y =a +bx (x ,y )【做一做2-1】 ⎝ ⎛⎭⎪⎫32,4 线性回归方程一定过点(x ,y ),又x =14×(0+1+2+3)=32,y =14×(1+3+5+7)=4,∴线性回归方程必过点⎝ ⎛⎭⎪⎫32,4.【做一做2-2】 分析:样本点共有三个,可以直接计算.解:由所给数据可得:x =7,y =18,∑i =13x i y i =434,∑=312i ix=179,进而可以求得b=∑i =13x i y i -3xy∑i =13x 2i -3x2=434-3×7×18179-3×49=1.75,a =y -b x =18-1.75×7=5.75.∴线性回归方程为y =5.75+1.75x . 4.(1)画散点图 (2)计算线性相关系数5.∑i=1nx i y i-n x y∑i=1nx2i-n x2∑i=1ny2i-n y2【做一做3】A1.求线性回归方程的一般步骤剖析:(1)作散点图:对于样本点(x1,y1),(x2,y2),…,(x n,y n),在坐标系内作出散点图,并观察各样本点是否呈条状分布,是否都分布在一条直线的两侧.若是,则可设其线性回归方程为y=a +bx.(2)列表:对于所给出的数据x,y列成相应的表格.(3)计算:x=1n∑ni=1x i,y=1n∑ni=1y i,b=∑∑==--niiniiix nxyx nyx1221,a=y-b x.(4)写出回归方程:y=a+bx.2.样本的选取是否影响两个变量的线性回归方程剖析:会影响.这是因为我们所采集的样本只是两个变量之间的部分数据的关系,而且它们的散点图分布在某一条直线的附近,不一定就在直线上,所以不能用某个一次函数y=a+bx来准确地表达它们之间的关系,我们只能近似地看作两个变量之间满足线性关系,符合一个一次函数y=a+bx,而将x=x i代入时,得到y的值与所测得的y i之间存在着一定的误差,误差为y i-y=y i-(a+bx i)=y i-a-bx i(i=1,2,…,n),那么,我们要想用y=a +bx拟合得好一点,就要使误差小一点.但不能把这些误差直接相加,这是因为它们有正有负,相加可能抵消一部分,为了不使误差之和正负抵消,我们可设全部误差的平方和为Q(a,b),即Q(a,b)=∑ni=1(y i-a-bx i)2,用Q的大小来度量总的误差大小,Q是a,b的二元函数.当b=∑ni=1x i y i-n x y∑n i=1x2i-n x2时,Q(a,b)最小,此时a=y-b x.由此看来,所取的样本点不同,有可能得到的线性回归方程不同.题型一求线性回归方程【例题1】一个车间为了规定工时定额,需要确定加工零件所花费的时间,为此进行了10次试验.测得的数据如下表所示:(1)求y对x的线性回归方程;(2)据此估计加工200个零件所用的时间是多少?反思:计算线性回归方程比较麻烦,对于样本点较少的情况可直接代入公式计算求值.实际问题中的数据都不好算,一般要借助计算器来完成.题型二计算线性相关系数【例题2】某工厂有一大型机器设备,其使用年限x(年)与所支出的维修费用y(万元)有如下的统计资料:请问维修费用y与使用年限x之间是否具有线性相关关系?如果具有,请求出线性回归方程.分析:本题为探索两个变量之间是否具有线性相关关系的题型,可通过计算线性相关系数来加以判断,因为数据比较多,可列表分项计算.反思:对于数量比较多的数据判断它们相应的变量是否线性相关,可通过计算线性相关系数来判断.题型三利用回归分析进行有效预测【例题3】为了了解某地母亲身高x与女儿身高y的相关关系,现随机测得10对母女的身高,所得数据如下表所示:(1)试对x与y进行线性回归分析,并预测当母亲身高为161 cm时,女儿的身高为多少?(2)求相关系数r,并分析模型的拟合效果.分析:通过观察两变量对应的数据,可判断x与y之间存在线性相关关系,通过列表计算,求出回归方程,并通过计算线性相关系数来判断两变量的线性相关程度.反思:一个模型拟合得好不好,可通过计算线性相关系数r来判断,|r|的值越接近于1,变量之间的线性相关程度越高,拟合得越好.答案:【例题1】解:(1)列出下表,并用科学计算器进行计算.设所求的回归直线方程为y=bx+a.同时,利用上表可得b=∑10i=1x i y i-10x y∑10 i=1x2i-10x2=55 950-10×55×91.738 500-10×552≈0.668,a=y-b x≈91.7-0.668×55=54.96,即所求的线性回归方程为y=0.668x+54.96.(2)这个线性回归方程的意义是当x增大1时,y的值约增加0.668,而54.96是y不随x增大而变化的部分.因此当x=200时,y的估计值为y=54.96+0.668×200=188.56≈189.故加工200个零件时所用的时间约为189分.【例题2】解:列表:由此可得:x =5,y ≈6.185 7,∑i =17x i y i =251.1,∑i =17x 2i =203,∑i =17y 2i =311.51.∴线性相关系数r =∑i =17x i y i -7x y∑i =17x 2i -7x2∑i =17y 2i -7y2≈251.1-7×5×6.185 7203-7×52×311.51-7×6.185 72≈0.989 5.∴维修费用与使用年限之间存在线性相关关系.b =∑i =17x i y i -7xy∑i =17x 2i -7x2≈251.1-7×5×6.185 7203-7×52≈1.235 7,a =y -b x ≈6.185 7-1.235 7×5=0.007 2,∴线性回归方程为y =0.007 2+1.235 7x . 【例题3】 解:列表:(1)由表可得x =158.8,y =159.1,∑i =110x 2i =252 222,∑i =110y 2i =253 185,∑i =110x i y i =252688,进而可以求得b =∑10i =1x i y i -10xy∑10i =1x 2i -10x2=252 688-10×158.8×159.1252 222-10×158.82≈0.78,a =y -b x =159.1-0.78×158.8≈35,∴线性回归方程为y =35+0.78x .当x =161 cm 时,y =160.58 cm ,即女儿的身高为160.58 cm.(2)r=∑10i=1x i y i-10x y∑10i=1x2i-10x2∑10i=1y2i-10y2=252 688-10×158.8×159.1252 222-10×158.82×253 185-10×159.12≈0.715,说明模型拟合得效果较好.1由一组数据(x1,y1),(x2,y2),…,(x n,y n)得到的线性回归方程为y=a+bx,则下列说法正确的是( ).A.直线y=a+bx必过点(x,y)B.直线y=a+bx至少经过点(x1,y1),(x2,y2),…,(x n,y n)中的一点C.直线y=a+bx是由(x1,y1),(x2,y2),…,(x n,y n)中的两点确定的D.(x1,y1),(x2,y2),…,(x n,y n)这n个点到直线y=a+bx的距离之和最小答案:A 正确理解线性回归方程的含义,所求的线性回归方程并不一定要经过这n个样本点中的某些点,而是这n个点到直线的距离的平方和最小,即用最小二乘法求出线性回归方程中a,b的值,由于a=x by-,即x bay+=,由此可以看出(x,y)适合线性回归方程y=a+bx,所以直线y=a+bx必过点(x,y).2对于线性相关系数r ,下列说法正确的是( ).A .r∈(-∞,+∞),r 越大,相关程度越强;反之,相关程度越弱B .|r|∈(0,+∞),|r|越大,相关程度越强;反之,相关程度越弱C .|r|≤1,且|r|越大,相关程度越强;反之,相关程度越弱D .以上说法都不正确答案:C 熟记关于线性相关系数r 的重要结论是解决此类问题的关键.3某工厂为预测某产品的回收率y ,需要研究它和原料的有效成分含量x 之间的相关关系,现取8对观察值,计算得∑-=8152i i x ,∑-=81228i i y ,∑-=8121478i x ,∑-=811849i i i y x ,则y 对x 的线性回归方程为( ).A .y =11.47+2.62xB .y =-11.47+2.62xC .y =2.62+11.47xD .y =11.47-2.62x答案:A 由已知条件,得x =6.5,y =28.5,代入,得b =∑∑==--8122818y8i ii i i xx x y x =25.684785.285.681849⨯-⨯⨯-≈2.62,a =y -b x ≈28.5-2.62×6.5=11.47,∴线性回归方程为y =11.47+2.62x .4(2012·太原一模)下表是某厂1~4月份用水量(单位:百吨)的一组数据:由其散点图,可知用水量y 与月份x 之间有较好的线性相关关系,其线性回归方程是________________________________________________________________________.答案:y =-0.7x +5.25 由已知,得x =2.5,y =3.5,∑=412i i x =30,∑=41i i i y x =31.5,所以b =∑∑==--4122414y4i ii i i xx x y x =-0.7.所以a =y -b x =5.25.所以线性回归方程是y =-0.7x +5.25.5某商店统计了最近6个月某商品的进价x 与售价y(单位:元)的对应数据如下表所示:求y 关于x 的线性回归方程,要使售价不超过16元,则进价应不超过多少? 解:由表中数据可得:x =6.5,y =8.327612=∑=i i x ,∑=61i i i y x =396,进而可以求得b =∑∑==--6122616y 6i i i i i xx x y x =25.6632785.66396⨯-⨯⨯-≈1.143,a =y -b x ≈8-1.143×6.5=0.570 5.∴所求的线性回归方程为y =0.570 5+1.143x . 由y ≤16,即0.570 5+1.143x ≤16. 解得x ≤13.5,所以进价应不超过13.5元.。

相关文档
最新文档