必修三2.3.2两个变量的线性相关关系
高中数学第二章统计2.3变量的相关性2.3.1-2.3.2变量间的相关关系两个变量的线性相关教学案新人教B版必修3
2.3.1 & 2.3.2 变量间的相关关系 两个变量的线性相关习课本P73~78,思考并完成以下问题预(1)相关关系是函数关系吗?(2)什么是正相关、负相关?与散点图有什么关系?(3)回归直线方程是什么?如何求回归系数?(4)如何判断两个变量之间是否具备相关关系?[新知初探]1.两个变量的关系分类函数关系相关关系 特征两变量关系确定两变量关系带有随机性2.散点图将样本中n 个数据点(x i ,y i )(i =1,2,…,n )描在平面直角坐标系中得到的图形. 3.正相关与负相关(1)正相关:如果一个变量的值由小变大时,另一个变量的值也由小变大,这种相关称为正相关.(2)负相关:如果一个变量的值由小变大时,另一个变量的值由大变小,这种相关称为负相关.4.最小二乘法设x ,Y 的一组观察值为(x i ,y i ),i =1,2,…,n ,且回归直线方程为y ^=a +bx ,当x 取值x i (i =1,2,…,n )时,Y 的观察值为y i ,差y i -y ^i (i =1,2,…,n )刻画了实际观察值y i 与回归直线上相应点纵坐标之间的偏离程度,通常是用离差的平方和,即Q =i =1n(y i -a-bx i)2作为总离差,并使之达到最小.这样,回归直线就是所有直线中Q取最小值的那一条.由于平方又叫二乘方,所以这种使“离差平方和最小”的方法,叫做最小二乘法.5.回归直线方程的系数计算公式回归直线方程回归系数系数a^的计算公式方程或公式y^=a^+b^x b^=∑i=1nxiyi-n x-y-∑i=1nx2i-n x2a^=y-b^x-上方加记号“^ ”的意义区分y的估计值y^与实际值ya,b上方加“^ ”表示由观察值按最小二乘法求得的估计值[小试身手]1.下列命题正确的是( )①任何两个变量都具有相关关系;②圆的周长与该圆的半径具有相关关系;③某商品的需求量与该商品的价格是一种非确定性关系;④根据散点图求得的回归直线方程可能是没有意义的;⑤两个变量间的相关关系可以通过回归直线,把非确定性问题转化为确定性问题进行研究.A.①③④B.②③④C.③④⑤D.②④⑤解析:选C ①显然不对,②是函数关系,③④⑤正确.v,u;对变量1,得散点图图10),…,1,2=i)(iy,ix(有观测数据y,x.对变量2)(由这两个散点图可以判断2.,得散点图图10),…,1,2=i)(iv,iu(有观测数据A.变量x与y正相关,u与v正相关B.变量x与y正相关,u与v负相关C .变量x 与y 负相关,u 与v 正相关D .变量x 与y 负相关,u 与v 负相关解析:选C 由这两个散点图可以判断,变量x 与y 负相关,u 与v 正相关.80,当施肥量为250+x 5=y ^归方程为的线性回(kg)y 与水稻产量(kg)x .若施肥量3kg 时,预计水稻产量约为________kg..650(kg)=250+5×80=y ^代入回归方程可得其预测值80=x 解析:把 答案:6504.对具有线性相关关系的变量x 和y ,测得一组数据如下表所示.x 2 4 5 6 8y 30 40 60 50 70若已求得它们的回直线的方程为______________________.,5=2+4+5+6+85=x 解析:由题意可知 y50.=30+40+60+50+705=即样本中心为(5,50).,a ^+x 6.5=y ^设回归直线方程为 ,)y ,x (回归直线过样本中心∵ ,7.51=a ^,即a ^+6.5×5=50∴ 17.5+x 6.5=y ^回归直线方程为∴ 17.5+x 6.5=y ^答案:相关关系的判断[典例] (1) ①正方形的边长与面积之间的关系; ②农作物的产量与施肥量之间的关系; ③人的身高与年龄之间的关系;④降雪量与交通事故的发生率之间的关系. (2)某个男孩的年龄与身高的统计数据如下表所示.年龄x (岁)123456身高y (cm)78 87 98 108 115 120①画出散点图;②判断y 与x 是否具有线性相关关系.[解析] (1)在①中,正方形的边长与面积之间的关系是函数关系;在②中,农作物的产量与施肥量之间不具有严格的函数关系,但具有相关关系;在③中,人的身高与年龄之间的关系既不是函数关系,也不是相关关系,因为人的年龄达到一定时期身高就不发生明显变化了,因而它们不具有相关关系;在④中,降雪量与交通事故的发生率之间具有相关关系.答案:②④(2)解:①散点图如图所示.②由图知,所有数据点接近一条直线排列,因此,认为y 与x 具有线性相关关系.两个变量是否相关的两种判断方法(1)根据实际经验:借助积累的经验进行分析判断.(2)利用散点图:通过散点图,观察它们的分布是否存在一定的规律,直观地进行判断.[活学活用]如图所示的两个变量不具有相关关系的是________(填序号).解析:①是确定的函数关系;②中的点大都分布在一条曲线周围;③中的点大都分布在一条直线周围;④中点的分布没有任何规律可言,x ,y 不具有相关关系.答案:①④求回归方程[典例] (1)已知变量x 与y 正相关,且由观测数据算得样本平均数x =3,y =3.5,则由该观测数据算得的线性回归方程可能是( )A.y ^=0.4x +2.3B.y ^=2x -2.4C.y ^=-2x +9.5 D.y ^=-0.3x +4.4(2)一台机器按不同的转速生产出来的某机械零件有一些会有缺点,每小时生产有缺点的零件的多少随机器的运转的速度的变化而变化,下表为抽样试验的结果:转速x (转/秒)16 14 12 8 每小时生产有缺点的零件数y (件)11985①画出散点图;②如果y 对x 有线性相关关系,请画出一条直线近似地表示这种线性关系; ③在实际生产中,若它们的近似方程为y =5170x -67,允许每小时生产的产品中有缺点的零件最多为10件,那么机器的运转速度应控制在什么范围内?[解析] (1)依题意知,相应的回归直线的斜率应为正,排除C 、D.且直线必过点(3,3.5),代入A 、B 得A 正确.答案:A(2)解:①散点图如图所示:②近似直线如图所示:秒/转14,所以机器的运转速度应控制在≤14.9x ,解得≤1067-x 5170得≤10y 由③内.求回归直线方程的步骤.)数据一般由题目给出)(n ,…,1,2=i )(i y ,i x (收集样本数据,设为(1) (2)作出散点图,确定x ,y 具有线性相关关系..i y i x ,2i x ,i y ,i x 把数据制成表格(3).iy i ∑i =1nx ,2i ∑i =1n x ,y ,x 计算(4) ⎩⎪⎨⎪⎧b ^=∑i =1nxiyi -n x y ∑i =1n x2i -n x 2,a ^=y -b ^ x .,公式为a ^,b ^代入公式计算(5).a ^+x b ^=y ^写出回归直线方程(6) [活学活用]已知变量x ,y 有如下对应数据:x 1 2 3 4 y1345(1)作出散点图;(2)用最小二乘法求关于x ,y 的回归直线方程. 解:(1)散点图如图所示.,52=1+2+3+44=x (2) y ,134=1+3+4+54=∑i=14x 39.=20+12+6+1=i y i ∑i =14x 2i ,30=16+9+4+1= b^,1310=39-4×52×13430-4×⎝ ⎛⎭⎪⎫522=a^,0=52×1310-134= .为所求的回归直线方程x 1310=y ^所以 利用线性回归方程对总体进行估计[典例x (吨)与相应的生产能耗y (吨标准煤)的几组对照数据:x 3 4 5 6 y2.5344.5(1)请画出上表数据的散点图;(2)请根据上表提供的数据,求出y 关于x 的回归直线方程y ^=b ^x +a ^;(3)已知该厂技改前100吨甲产品的生产能耗为90吨标准煤.试根据(2)求出的回归直线方程,预测生产100吨甲产品的生产能耗比技改前降低了多少吨标准煤?[解] (1)散点图如图:,3.5=2.5+3+4+4.54=y ,4.5=3+4+5+64=x (2) ∑i=14x ,66.5=6×4.5+5×4+4×3+3×2.5=i y i ∑i=14x 2i ,86=26+25+24+23= ∑i =14xiyi -4xy∑i =14x2i -4x 2=b ^所以 ,0.7=66.5-4×4.5×3.586-4×4.52=a ^0.35.=0.7×4.5-3.5=x b ^-y = 0.35.+x 0.7=y ^所以所求的线性回归方程为 ,)吨标准煤70.35(=0.35+0.7×100=y ^时,100=x 当(3) 90-70.35=19.65(吨标准煤).即生产100吨甲产品的生产能耗比技改前降低了19.65吨标准煤.只有当两个变量之间存在线性相关关系时,才能用回归直线方程对总体进行估计和预测.否则,如果两个变量之间不存在线性相关关系,即使由样本数据求出回归直线方程,用其估计和预测结果也是不可信的.[活学活用](重庆高考)随着我国经济的发展,居民的储蓄存款逐年增长.设某地区城乡居民人民币储蓄存款(年底余额)如下表:年份 2010 2011 2012 2013 2014 时间代号t 1 2 3 4 5 储蓄存款y (千亿元)567810(1)求y 关于t 的回归方程y ^=b ^t +a ^;(2)用所求回归方程预测该地区2015年(t =6)的人民币储蓄存款. 解:(1)列表计算如下:it iy it 2it i y i1 1 5 1 52 2 6 4 123 3 7 9 214 4 8 16 325 5 10 25 50 ∑153655120这里n =5,t -=1n ∑i =1n t i =155=3,y -=1n ∑i =1n y i =365=7.2.又∑i =1nt2i -n t -2=55-5×32=10,i =1n t i y i -n t-y -=120-5×3×7.2=12,从而b ^=1210=1.2,a ^=y --b ^t -=7.2-1.2×3=3.6,故所求回归方程为y ^=1.2t +3.6.(2)将t =6代入回归方程可预测该地区2015年的人民币储蓄存款为y ^=1.2×6+3.6=10.8(千亿元).[层级一 学业水平达标]1.下列变量具有相关关系的是( )A .人的体重与视力B .圆心角的大小与所对的圆弧长C .收入水平与购买能力D .人的年龄与体重解析:选C B 为确定性关系;A ,D 不具有相关关系,故选C.2.已知变量x ,y 之间具有线性相关关系,其散点图如图所示,则其回归方程可能为2+x 1.5=y ^A. 2+x 1.5=-y ^B. 2-x 1.5=y ^C. 2-x 1.5=-y ^D. 之间负相关,回归直线y ,x ,由散点图可知变量a ^+x b ^=y ^设回归方程为 B 解析:选 2.+x 1.5=-y ^,因此方程可能为>0a ^,<0b ^轴上的截距为正数,所以y 在 个样本点,n 的y 和x 是变量)n y ,n x (,…,)2y ,2x (,)1y ,1x (设3.直线l 是由这些样本点通过最小二乘法得到的线性回归直线如图所示,则以下结论正确的是( ))y ,x (过点l .直线A B .回归直线必通过散点图中的多个点C .直线l 的斜率必在(0,1)D .当n 为偶数时,分布在l 两侧的样本点的个数一定相同解析:选A A 是正确的;回归直线可以不经过散点图中的任何点,故B 错误;回归直线的斜率不确定,故C 错误;分布在l 两侧的样本点的个数不一定相同,故D 错误. 4.一项关于16艘轮船的研究中,船的吨位区间为[192,3 246](单位:吨),船员的,x 0.006 2+9.5=y ^的回归方程为x 关于吨位y 人,船员人数32~5人数 (1)若两艘船的吨位相差1 000,求船员平均相差的人数;(2)估计吨位最大的船和最小的船的船员人数.,则2x ,1x 设两艘船的吨位分别为(1)解: y^)2x 6 20.00+(9.5-1x 0.006 2+9.5=2y ^-1 =0.006 2×1 000≈6, 即船员平均相差6人.,0.006 2×192≈11+9.5=y ^时,192=x 当(2) 0.006 2×3 246≈30.+9.5=y ^时,3 246=x 当 即估计吨位最大和最小的船的船员数分别为30人和11人.[层级二 应试能力达标]1.一个口袋中有大小不等的红、黄、蓝三种颜色的小球若干个(大于5个),从中取5次,那么取出红球的次数和口袋中红球的数量是( ) A .确定性关系 B .相关关系 C .函数关系D .无任何关系 解析:选 B 每次从袋中取球取出的球是不是红球,除了和红球的个数有关外,还与球的大小等有关系,所以取出红球的次数和口袋中红球的数量是一种相关关系.,下x 80+50=y ^变化的回归直线方程为)千元(x 依劳动生产率)元(y .农民工月工资2列判断正确的是( )A .劳动生产率为1 000元时,工资为130元B .劳动生产率提高1 000元时,工资水平提高80元C .劳动生产率提高1 000元时,工资水平提高130元D .当月工资为210元时,劳动生产率为2 000元的单x ,但要注意80增加y ,1每增加x 知,x 80+50=y ^由回归直线方程 B 解析:选位是千元,y 的单位是元.3.为了解儿子身高与其父亲身高的关系,随机抽取5对父子身高数据如下:则y 对x 的线性回归方程为( )A .y =x -1B .y =x +1x 12+88=y .C176=y .D =y ,176=174+176+176+176+1785=x 计算得, C 解析:选符合.C 检验知,)y ,x (,根据回归直线经过样本中心176=175+175+176+177+17754.已知x 与y 之间的几组数据如下表:,若某同学根据上表中的前两组a ^+x b ^=y ^假设根据上表数据所得线性回归直线方程为数据(1,0)和(2,2)求得的直线方程为y =b ′x +a ′,则以下结论正确的是( )′a <a ^,′b >y ^′ B.a >a ^,′b >b ^A. ′a <a ^,′b <y ^′ D.a >a ^,′b <b ^C. 解析:选C 由(1,0),(2,2)求b ′,a ′.2.=-2×1-0=′a ,2=2-02-1=′b ,58=24+15+12+3+4+0=i y i ∑i =16x 时,a ^,b ^求 x ,136=y ,3.5= ∑i=16x 2i ,91=36+25+16+9+4+1= ,57=58-6×3.5×13691-6×3.52=b ^∴ a^,13=-52-136=×3.557-136= ′.a >a ^,′b <b ^∴ =y ^的回归方程为(cm)x 对身高(kg)y 岁的人,体重38岁到18.正常情况下,年龄在50.72x -58.2,张红同学(20岁)身高为178 cm ,她的体重应该在________ kg 左右. =y ^时,178=x 的人的体重进行预测,当178 cm 解析:用回归方程对身高为0.72×178-58.2=69.96(kg).答案:69.966.某工厂为了对新研发的一种产品进行合理定价,将该产品按事先拟定的价格进行试销,得到如下数据:________.=a ,则a +x 4=-y 由表中数据,求得线性回归方程为 ,132=4+5+6+7+8+96=x 解析: y,80=92+82+80+80+78+686=)y ,x (由回归方程过样本中心点 .a ^+1324×=-80得 106.=1324×+80=a ^即 答案:1067.对某台机器购置后的运行年限x (x =1,2,3,…)与当年利润y 的统计分析知x ,y ,估计该台机器最为划算的使用年限为x 1.3-10.47=y ^具备线性相关关系,回归方程为________年.解析:当年利润小于或等于零时应该报废该机器,当y =0时,令10.47-1.3x =0,解得x ≈8,故估计该台机器最为划算的使用年限为8年.答案:88.某个体服装店经营某种服装在某周内所获纯利y (元)与该周每天销售这种服装的件数x (件)之间有一组数据如下表:;y ,x 求(1) (2)若纯利y 与每天销售这种服装的件数x 之间是线性相关的,求回归直线方程; (3)若该店每周至少要获纯利200元,请你预测该店每天至少要销售这种服装多少件?3 487)=i y i ∑i =17x ,45 309=2i ∑i =17y ,280=2i ∑i =17x 提示:( ,6=3+4+5+6+7+8+97=x (1)解: y≈79.86.66+69+73+81+89+90+917= ,≈4.753 487-7×6×79.86280-7×62=b ^∵(2) a^,51.36=4.75×6-79.86= .x 4.75+51.36=y ^之间的回归直线方程为x 纯利与每天销售件数∴ ≈31.29.x ,所以651.3+x 4.75=200时,200=y ^当(3) 因此若该店每周至少要获纯利200元,则该店每天至少要销售这种服装32件.9.2016年元旦前夕,某市统计局统计了该市2015年10户家庭的年收入和年饮食支出的统计资料如下表:年收入x (万元)2 4 4 6 6 6 7 7 8 10年饮食 支出y(万元)0.9 1.4 1.6 2.0 2.1 1.9 1.8 2.1 2.2 2.3(2)若某家庭年收入为9万元,预测其年饮食支出.406)=2i ∑i =110x ,117.7=i y i ∑i =110x 参考数据:( 解:依题意可计算得:x,10.98=y x ,36=2x ,1.83=y ,6= ,406=2i ∑i =110x ,117.7=i y i ∑i =110x ∵又,≈0.17∑i=110xiyi -10x y ∑i =110x2i -10x 2=b ^∴ a^0.81.+x 0.17=y ^∴,0.81=x b ^-y = 1.0.8+x 0.17=y ^所求的回归方程为∴ .)万元2.34(=0.81+0.17×9=y ^时,9=x 当(2) 可估计年收入为9万元的家庭每年饮食支出约为2.34万元.(时间120分钟,满分150分)一、选择题(本大题共12小题,每小题5分,共60分.在每小题给出的四个选项中,只有一项是符合题目要求的)1.下列三个抽样:①一个城市有210家某商品的代理商,其中大型代理商有20家,中型代理商有40家,小型代理商有150家,为了掌握该商品的销售情况,要从中抽取一个容量为21的样本;②在某公司的50名工人中,依次抽取工号为5,10,15,20,25,30,35,40,45,50的10名工人进行健康检查;③某市质量检查人员从一食品生产企业生产的两箱(每箱12盒)牛奶中抽取4盒进行质量检查.则应采用的抽样方法依次为( )A .简单随机抽样;分层抽样;系统抽样B .分层抽样;简单随机抽样;系统抽样C .分层抽样;系统抽样;简单随机抽样D .系统抽样;分层抽样;简单随机抽样解析:选 C ①中商店的规模不同,所以应利用分层抽样;②中抽取的学号具有等距性,所以应是系统抽样;③中总体没有差异性,容量较小,样本容量也较小,所以应采用简单随机抽样.故选C.2.将某班的60名学生编号为01,02,…,60,采用系统抽样方法抽取一个容量为5的样本,且随机抽得的一个号码为04,则剩下的四个号码依次是( )A .09,14,19,24B .16,28,40,52C .10,16,22,28D .08,12,16,20 解析:选B 分成5组,每组12名学生,按等间距12抽取.选项B 正确.3.某学校有教师200人,男学生1 200人,女学生1 000人.现用分层抽样的方法从全体师生中抽取一个容量为n 的样本,若女学生一共抽取了80人,则n 的值为( )A .193B .192C .191D .190 192.=n ,求得80=n200+1 200+1 0001 000× B 解析:选 4.某商品销售量y (件)与销售价格x (元/件)负相关,则其回归方程可能是( )200+x 10=y ^200 B.+x 10=-y ^A. 200-x 10=y ^200 D.-x 10=-y ^C. 解析:选A 由于销售量y 与销售价格x 成负相关,故排除B ,D.又因为销售价格x >0,则C 中销售量全小于0,不符合题意,故选A.,则y 和x ,它们的平均数分别是n y ,…,2y ,1y 与n x ,…,2x ,1x .设有两组数据5)(的平均数是1+n y 3-n x 2,…,1+2y 3-2x 1,2+1y 3-1x 2新的一组数据 y 3-x 2.A 1+y 3-x 2.By 9-x 4.C1+y 9-x 4.D ,)n ,…,1,2=i 1(+i y 3-i x 2=i z 设 B 解析:选 =⎝ ⎛⎭⎪⎫1+1+…+1n +)n y +…+2y +1y (3n -)n x +…+2x +1x (2n =)n z +…+2z +1z (1n =z 则 1.+y 3-x 2 6.有一个容量为66的样本,数据的分组及各组的频数如下:[11.5,15.5) 2 [15.5,19.5) 4 [19.5,23.5) 9 [23.5,27.5) 18 [27.5,31.5) 11 [31.5,35.5) 12[35.5,39.5) 7 [39.5,43.5) 3则总体中大于或等于31.5的数据所占比例约为( )211A.13B. 12C.23D. 解析:选B 由题意知,样本的容量为66,而落在[31.5,43.5)内的样本个数为12+7.13=2266的数据约占31.5,故总体中大于或等于22=3+ 7.某学习小组在一次数学测验中,得100分的有1人,得95分的有1人,得90分的有2人,得85分的有4人,得80分和75分的各有1人,则该小组数学成绩的平均数、众数、中位数分别是( )A .85,85,85B .87,85,86C .87,85,85D .87,85,90 解析:选C ∵得85分的人数最多为4人,∴众数为85,中位数为85,87.=75)+80+85×4+90×2+95+(100110平均数为 8.某出租汽车公司为了了解本公司司机的交通违章情况,随机调查了50名司机,得到了他们某月交通违章次数的数据,结果制成了如图所示的统计图,根据此统计图可得这50名出租车司机该月平均违章的次数为( )A .1B .1.8C .2.4D .3 1.8.=5×0+20×1+10×2+10×3+5×450B 解析:选 9.下表是某厂1~4月份用水量情况(单位:百吨)的一组数据月份x 1 2 3 4用水量y 4.5 4 3 2.5的a ,则a +x 0.7=-y 之间具有线性相关关系,其线性回归方程为x 与月份y 用水量值为( )A .5.25B .5C .2.5D .3.5 解析:选A 线性回归方程经过样本的中心点,根据数据可得样本中心点为(2.5,3.5),所以a =5.25.10.如图是在元旦晚会举办的挑战主持人大赛上,七位评委为某选手打出的分数的茎叶统计图,去掉一个最高分和一个最低分后,所剩数据的平均数和方差分别为( )A .84,4.84B .84,1.6C .85,1.2D .85,4 +5+6+3+(515+80,平均数为77,去掉一个最低分95去掉一个最高分 C 解析:选,因此1.2=]286)-(85+285)-(85+286)-(85+283)-(85+285)-[(8515,方差为85=6)选C.,…,2+2x 2,3+1x 3,则2s ,方差是x 的平均数是n x ,…,3x ,2x ,1x .如果数据11)(的平均数和方差分别是2+n x 32s 和x A.2s 9和x 3.B2s 9和2+x 3.C4+2s 12和2+x 3.D nx …,2x ,1x ,由于数据2+x 3的平均数是2+n x 3,…,2+2x 2,3+1x 3 C 解析:选.2s 9的方差为2+n x 3,…,2+2x 2,3+1x 3,所以2s 的方差为 12.如图是某赛季甲、乙两名篮球运动员5场比赛得分的茎叶图,已知甲的成绩的极差为31,乙的成绩的平均值为24,则下列结论错误的是( ) A .x =9 B .y =8C .乙的成绩的中位数为26D .乙的成绩的方差小于甲的成绩的方差解析:选B 因为甲的成绩的极差为31,所以其最高成绩为39,所以x =9;因为乙的成绩的平均值为24,所以y =24×5-(12+25+26+31)-20=6;由茎叶图知乙的成绩的中位数为26;对比甲、乙的成绩分布发现,乙的成绩比较集中,故其方差较小. 二、填空题(本大题共4小题,每小题5分,共20分,把答案填在题中横线上) 13.某人5次上班途中所花的时间(单位:分钟)分别为x ,y,10,11,9.已知这组数据的平均数为10,方差为2,则|x -y |的值为________.∴,2;又方差为20=y +x ,则10=159)×+11+10+y +x (,得10解析:由平均数为=xy 208,2=2y +2x ,得2=15]×210)-(9+210)-(11+210)-(10+210)-y (+210)-x [( 4.=x2+y2-2xy =x -y 2=|y -x |∴,192 答案:414.一支田径队有男运动员48人,女运动员36人,若用分层抽样的方法从该队的全体运动员中抽取一个容量为21的样本,则抽取男运动员的人数为________.12.=×482148+36解析:抽取的男运动员的人数为 答案:1215.要考察某种品牌的500颗种子的发芽率,抽取60粒进行实验,利用随机数表抽取种子时,先将500颗种子按001,002,…,500进行编号,如果从随机数表第7行第8列的数3开始向右读,请你依次写出最先检测的5颗种子的编号:________,________,________,________,________.(下面摘取了随机数表第7行至第9行)59408 66368 36016 26247 25965 49487 26968 86021 77681 83458 21540 62651 69424 78197 20643 67297 76413 66306 51671 54964 87683 30372 39469 97434解析:以3开始向右读,每次读取三位,重复和不在范围内的不读,依次为368,360,162,494,021.答案:368,360,162,494,02116.从某小学随机抽取100名同学,将他们的身高(单位:cm)数据绘制成频率分布直方图(如下图).由图中数据可知a =________.若要从身高在[120,130),[130,140),[140,150]三组的学生中,用分层抽样的方法选取18人参加一项活动,则从身高在[140,150]的学生中选取的人数应为________.解析:∵0.005×10+0.035×10+a ×10+0.020×10+0.010×10=1,∴a =0.030.设身高在[120,130),[130,140),[140,150]三组的学生分别有x ,y ,z 人,10.=z ,20=y 同理,30.=x ,解得0.030×10=x100则3.=×181030+20+10的学生中选取的人数为[140,150]故从 答案:0.030 3三、解答题(本大题共6小题,共70分.解答应写出文字说明,证明过程或演算步骤) ,应如何110名学生中抽取50为调查某班学生的平均身高,从)分10本小题满分(.17抽样?若知道男生、女生的身高显著不同(男生30人,女生20人),应如何抽样? 抽签法或随机数(人,采用简单随机抽样法5,即抽取110名学生中抽取50解:从法).若知道男生、女生的身高显著不同,则采用分层抽样法,按照男生与女生的人数比为30∶20=3∶2进行抽样,则男生抽取3人,女生抽取2人.18.(本小题满分12分)某车间共有12名工人,随机抽取6名,他们某日加工零件个数的茎叶图如图所示. (1)根据茎叶图计算样本均值;(2)日加工零件个数大于样本均值的工人为优秀工人.根据茎叶图推断该车间12名工人中有几名优秀工人?22.=1326=17+19+20+21+25+306样本均值为1)(解: 4=1312×名工人中有12,故推断该车间13=26知样本中优秀工人所占比例为(1)由(2)名优秀工人.19.(本小题满分12分)2016年春节前,有超过20万名广西、四川等省籍的外出务工人员选择驾乘摩托车沿321国道长途跋涉返乡过年,为防止摩托车驾驶人员因长途疲劳驾驶,手脚僵硬影响驾驶操作而引发交通事故,肇庆市公安交警部门在321国道沿线设立了多个长途行驶摩托车驾乘人员休息站,让返乡过年的摩托车驾乘人员有一个停车休息的场所.交警小李在某休息站连续5天对进站休息的驾驶人员每隔50辆摩托车就进行一次省籍询问,询问结果如图所示:(1)交警小李对进站休息的驾驶人员的省籍询问采用的是什么抽样方法?(2)用分层抽样的方法对被询问了省籍的驾驶人员进行抽样,若广西籍的有5人,则四川籍的应抽取几人?解:(1)交警小李对进站休息的驾驶人员的省籍询问采用的是系统抽样法.(2)从题图可知,被询问了省籍的驾驶人员广西籍的有5+20+25+20+30=100(人);四川籍的有15+10+5+5+5=40(人).2,即四川籍的应抽取2=x ,解得x40=5100人,依题意得x 设四川籍的驾驶人员应抽取人.20.(本小题满分12分)某化肥厂有甲、乙两个车间包装肥料,在自动包装传送带上每隔30分钟抽取一包产品,称其重量(单位:kg),分别记录抽查数据如下:甲:102,101,99,98,103,98,99; 乙:110,115,90,85,75,115,110.(1)这种抽样方法是哪一种方法?(2)试计算甲、乙车间产品重量的平均数与方差,并说明哪个车间产品较稳定?解:(1)甲、乙两组数据间隔相同,所以采用的方法是系统抽样.,100=99)+98+103+98+99+101+(10217=甲x (2) x,100=110)+115+75+85+90+115+(11017=乙 ,1)≈3.43+4+9+4+1+1+(417=2甲s ,228.57=100)+225+625+225+100+225+(10017=2乙s ,故甲车间产品比较稳定.2乙s <2甲s ∴ 21.(本小题满分12分)对某校高一年级学生参加社区服务次数进行统计,随机抽取M 名学生作为样本,得到这M 名学生参加社区服务的次数.根据此数据作出了频数与频率的统计表和频率分布直方图如下:分组频数 频率[10,15) 10 0.25[15,20) 25n [20,25) mp[25,30] 20.05 合计M1(1)求出表中M ,p 及图中a 的值;(2)若该校高一学生有360人,试估计该校高一学生参加社区服务的次数在区间[10,15)的人数.解:(1)由分组[10,15)的频数是10, 40.=M ,所以0.25=10M知,0.25频率是 因为频数之和为40,所以10+25+m +2=40,解得m =3.0.075.=340=p 故 因为a 是对应分组[15,20)的频率与组距的商,125.0.=2540×5=a 所以 (2)因为该校高一学生有360人,分组[10,15)的频率是0.25,所以估计该校高一学生参加社区服务的次数在此区间内的人数为360×0.25=90.22.(本小题满分12分)从某居民区随机抽取10个家庭,获得第i 个家庭的月收入iy i ∑i =110x ,20=i ∑i =110y ,80=i ∑i =110x 的数据资料,算得)单位:千元(i y 与月储蓄)单位:千元(i x 720.=2i ∑i =110x ,184= ;a ^+xb ^=y ^的线性回归方程x 对月收入y 求家庭的月储蓄(1) (2)判断变量x 与y 之间是正相关还是负相关;(3)若该居民区某家庭月收入为7千元,预测该家庭的月储蓄.,8=8010=i ∑i =1n x 1n =x ,10=n 由题意知(1)解: y ,2=2010=i ∑i =1n y 1n = ,80=210×8-720=2x 10-2i ∑i =110x 又 ∑i=110x ,24=10×8×2-184=y x 10-i y i ,0.3=2480=∑i =110xiyi -10x y∑i =110x2i -10x 2=b ^由此得 a^,0.4=-0.3×8-2=x b ^-y = 0.4.-x 0.3=y ^故所求回归方程为 (2)由于变量y 的值随x 的值增加而增加(b =0.3>0),故x 与y 之间是正相关.(3)将x =7代入回归方程可以预测该家庭的月储蓄为y =0.3×7-0.4=1.7千元.。
人教B版高中数学必修三2.3.2 两个变量的线性相关.doc
图2.3.2-1高中数学学习材料鼎尚图文*整理制作2.3.2 两个变量的线性相关 【目标要求】1.了解线性回归的意义. 2.会求回归直线方程. 【巩固教材——稳扎马步】1.变量y 与x 之间的回归方程表示 ( ) A.表示y 与x 之间的函数关系 B.表示y 和x 之间的不确定关系C.反映y 和x 之间真实关系的形式 D.反映y 与x 之间的真实关系达到最大限度的吻合2.在回归分析中,自变量同因变量地位不同,在变量x 与y 中,y 依x 回归同x 依y 回归是 ( ) A.同一个问题 B.有联系但意义不同的问题 C.一般情况下是相同的问题 D.是否相同,视两相关变量的具体内容而定 3.一个直线回归方程为 ,则变量x 增加一个单位时 ( ) A.y 平均增加1.5个单位 B. y 平均增加2个单位 C. y 平均减少1.5个单位 D. y 平均减少2个单位4.线性回归方程=bx+a 必过点 ( ) A.(0,0) B.(0,x ) C.(y ,0) D.(y x ,)5.在线性回归中,点(y x ,)是散点图中n 个点的 ( ) A.内心 B.外心 C.重心 D.垂心【重难突破——重拳出击】6.工人月工资(元)依劳动生产率(千元)变化的回归方程为 ,下列判断正确的是 ( ) A .劳动生产率为1000元时,工资为150元 B .劳动生产率提高1000元时,工资提高150元 C .劳动生产率提高1000元时,工资提高90元 D .劳动生产率为1000元时,工资为90元7.某校经济管理类的学生学习《统计学》的时间(x)与考试成绩(y)之间建立线性回归方程y=a+bx .经计算,方程为y =20-0.8x ,则该方程参数的计算 ( ) A .a 值是明显不对的 B .b 值是明显不对的 C .a 值和b 值都是不对的 D .a 值和b 值都是正确的8.2003年春季,我国部分地区SARS 流行,党和政府采取果断措施,防治结合,很快使病情得到控制.下表是某同学记载的5月1日至5月12日每天北京市SARS 病患者治愈者数据,及根据这些数据绘制出的散点图(图2.3.2-1) .^^2 1.5y x =-y x y 9060^+=下列说法:①根据此散点图,可以判断日期与人数具有线性相关关系;②日期与人数具有的相关关系为正相关;③根据此散点图,可以判断日期与人数具有一次函数关系.其中正确的个数为 ( ) A .0个 B .1个 C .2个 D .3个9.实验测得四组(x,y )值为(1,2),(2,3.5),(4,6.5),(6,9.5),则y 与x 之间的线性回归方程为 ;当x 为5时,估算y 的值为 __; 【巩固提高——登峰揽月】10. 根据某地区历年人均收入(元)与商品销售额(万元)资料计算的有关数据如下: (x 代表人均收,y 代表销售额) ∑∑∑∑=========ni i i n i i n i i n i i y x x y x n 1121116918,3436,260,546,9(1) 建立以商品销售额为因变量的直线回归方程,并解释回归系数含义; (2) 若1996年人均收为400元,试推算该年商品销售额. (要求写出公式和计算过程,结果保留两位小数.)11.已知某地每单位面积菜地年平均使用氮肥量xkg 与每单位面积蔬菜年平均产量yt 之间的关系有如下数据:年份1985 1986 1987 1988 1989 1990 1991 1992 x(kg) 70 74 80 78 85 92 90 95 y(t) 5.1 6.0 6.8 7.8 9.0 10.2 10.0 12.0年份1993 1994 1995 1996 1997 1998 1999 x(kg) 92 108 115 123 130 138 145 y(t) 11.5 11.0 11.8 12.2 12.5 12.8 13.0若x 与y 线性相关,求蔬菜产量y 与使用氮肥量之间的回归直线方程,并估计每单位面积施肥150kg 时,每单位面积蔬菜的年平均产量.日期5.15.25.35.45.55.6人数 100 109 115 118 121 134 日期 5.75.8 5.9 5.10 5.11 5.12 人数 141 152 168 175 186 20312.假设关于某设备的使用年限x 和所支出的维修费用y (万元),有如下的统计资料:x 2 3 4 5 6 y 2.2 3.8 5.5 6.5 7.0若由资料可知y 对x 呈线性相关关系.试求: (1)线性回归方程;(2)估计使用年限为10年时,维修费用是多少?【课外拓展——超越自我】13. 回归直线参数a , b 是用什么方法计算的,回归直线方程中待定参数a.b 的涵义是什么?试给出回归直线参数a , b 的推导过程.2.3.2 两个变量的线性相关1.D ;2.B ;3.C ;4.D ;5.C ;6.C ;7.B ;8.C ;10.(1) 直线回归方程为: y c =-26.92+0.92x ;回归系数b 表示当人均收入每增加一元时, 商品销售额平均增加0.92万元.(2) 当x=400时:y c =-26.92+0.92x =341.08 (万元) 11.列出下表,并用科学计算器进行有关计算:i 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 i x 70 74 80 78 85 92 90 95 92 108 115 123 130 138 145i y 5.1 6.0 6.8 7.8 9.0 10.2 10.0 12.0 11.5 11.0 11.8 12.2 12.5 12.8 13.0 i i y x357 444 544 608.4765 938.4900 1140 1058 1188 1357 1500.61625 1766.41885101151515==x ,11.10157.151==y ,1611251512=∑=i ix,55.16281512=∑=i iy,8.16076151=∑=i ii yx .设所求的回归直线方程为a bx y +=^,则0937.01011516112511.10101158.160761515221512151≈⨯-⨯⨯-=--=∑∑==xxy x yx b i ii ii , 6463.01010937.011.10≈⨯-=-=x b y a ,∴回归直线方程为)(701.146463.00937.0^t x y =+=.说明:求解两个变量的相关系数及它们的回归直线方程的计算量较大,需要细心、谨慎地计算.如果会使用含统计的科学计算器,能简单得到∑=n i ix 1,∑=n i iy 1,∑=ni iy12,∑=ni iy12,∑=ni ii yx 1这些量,也就无需有制表这一步,直接算出结果就行了.另外,利用计算机中有关应用程序也可以对这些数据进行处理. 12.(1)列表如下:i 1 2 3 4 5i x2 3 4 5 6 i y 2.2 3.8 5.5 6.5 7.0 i i y x 4.4 11.4 22.0 32.5 42.0 2i x491625364=x ,5=y ,90512=∑=i ix ,3.11251=∑=i i i y x .23.145905453.112552251251=⨯-⨯⨯-=--=∑∑==xx yx yx b i i i ii , 08.0423.15=⨯-=-=bx y a .∴线性回归方程为:08.023.1^+=+=x a bx y .(2)当x=10时,38.1208.01023.1^=+⨯=y (万元) 即估计使用10年时维修费用是12.38万元.13. 最小平方法, 回归直线方程中待定参数a 代表直线的起点值,在数学上称为直线的纵轴截距;b 代表自变量增加一个单位时因变量的平均增加值,数学上称为斜率,也称回归系数.。
人教A版高中数学必修三第二章第3节 2.3.2两个变量的线性相关 课件(共28张PPT)
【学习目标】 1、理解线性相关、正相关、负相关、散点图; 2、理清线性相关和散点图之间的关系;(定性) 3、在两个变量具有线性相关关系时,会作出线
性直线。(定量) 【学法指导】
在解决统计问题的过程中,系统地经历数据 收集和处理的全过程,进一步体会用样本估计总 体的思想,理解数形结合的数学思想和回归分析 的统计思想。
【探究新知】
在一次对人体脂肪含量和年龄关系的研究中,研究人员获 得了一组样本数据:
.
根据上述数据,你能分析人体的脂肪含量与年龄 之间有怎样的关系吗?
【小组合作】
探究一 收集数据 (1)回忆前面学过的统计知识,表中数据可能是如何收集到的?举例说明 (2)如何理解23岁对应的脂肪百分比为9.5? 探究二 分析数据 (1)统计学中常用什么方法分析收集到的数据? (2)高一在函数应用章节,如何根据已知数据预测其它数据? (3)你发现年龄与脂肪含量这两个变量之间是什么关系?怎样发现的? 探究三 寻找回归直线(定量) (1)回归直线一定过样本点的中心吗?为什么? (2)为什么要找回归直线?找到这条直线是否说明年龄与脂肪含量是函数关系? (3)假如我45岁,我的脂肪含量大约是多少?是表中的27.5吗? (4)如何具体求出这个回归直线的方程呢?回归直线与散点图中各点的位置应
人体内脂肪含量与年龄之间是相关关系
在一定年龄段内,随着年龄的增长,人体内的脂肪 含量会增加,但人体内的脂肪含量还与饮食习惯、体 育锻炼等有关,可能还与个人的先天体质有关。
对某一个人来说,他的体内脂肪含量不一定随年龄 增长而增加或减少,但是如果把很多个体放在一起, 就可能表现出一定的规律性.
散点图:
——具有函数关系. 2.如果所有的样本点都落在某一函数曲线附近,那么这两个 变量之间有关系吗?关系确定吗?是什么关系? ——有关系,不确定,有相关关系。 3. 如果所有的样本点都落在某一直线附近,变量之间就有线 性相关关系。线性相关又分正相关和负相关。(呈条形状) 4.如果散点图的点几乎没有什么规则,则这两个变量之间 关系又如何? ——没有相关关系
2017学年数学必修三:2.3.1-变量之间的相关关系~2.3.2 两个变量的线性相关2
(2)问题2中,从表里数据能得出小麦的产量y与施肥量x之间的 函数关系式吗? 提示:从表格里我们很容易发现施肥量越大 ,小麦的产量就越高. 但是,施肥量并不是影响小麦产量的唯一因素 ,小麦的产量还受 土壤的质量、降雨量、田间管理等诸多因素影响 ,这时两个变
量之间就不是确定性的函数关系,因此不能得到y和x的函数关
1.两个变量的线性相关 左下角 到_______. 右上角 (1)正相关:点散布的方向:从_______ 左上角 到_______. 右下角 (2)负相关:点散布的方向:从_______ (3)回归直线:如果散点图中点的分布从整体上看在一条直线附
线性相关 关系,这条直线叫做 近,就称这两个变量之间具有_________
【解析】(1)作出散点图如图所示,
(2)由散点图可知,各点并不在一条直线附近,所以两个变量是
非线性相关关系.
类型二
求回归方程
1.(2013·锦州高一检测)已知一组观测值具有线性相关关系,
bx a ,求得 b =0.51, x =61.75, y =38.14, 则回归方 若对于 y
【探究总结】
1.散点图的作用
(1)判断两个变量之间有无相关关系,一种常用的简便可行的方
法是绘制散点图.
(2)根据散点图很容易看出两个变量之间是否具有相关关系,是
不是线性相关关系,是正相关还是负相关,相关关系强还是弱.
2.利用散点图判断变量间的关系的方法 (1)如果所有的样本点都落在某一函数的曲线上,就用该函数来 描述变量间的关系,即变量具有函数关系. (2)如果所有的样本点都落在某一函数曲线附近,变量之间就有 相关关系. (3)如果所有的样本点都落在某一条直线附近,变量之间就有线 性相关关系.
2020版人教A数学必修3 课件:2.3.1 变量之间的相关关系2.3.2 两个变量的线性相关
x (0.01%)
104
180 190 177
147
134
150
191
204
121
学霸经验分享区 (1)回归分析是对具有相关关系的两个变量进行统计分析的方法,两 个变量具有相关关系是回归分析的前提. (2)散点图是定义在具有相关关系的两个变量基础上的,对于关系不 明确的两组数据,可先作散点图,在图上看它们有无相关关系,然后再 进行相关回归分析. (3)通过对散点图的观察,一般地,若图中数据大致分布在一条直线附 近,那么这两个变量近似成线性相关关系. (4)求线性回归方程,应注意到,只有大部分点分布在某条直线附近, 求出的线性回归方程才有实际意义,否则,求出的线性回归方程毫无 意义.
名师点津 对回归直线方程的几点说明 (1)a,b的上方加“^ ”,表示是由观察值按最小二乘法求得的估计值.
(2)(xi,yi)(i=1,2,…,n)的( x , y )在回归直线上.
(3)由回归直线方程知 x 处的估计值为 yˆ = aˆ + bˆ x.
(4)回归直线使得样本数据中的点到它的距离的平方和最小. (5)求回归直线方程,计算量大,一般应学会使用计算器求解. (6)利用回归直线方程可以对总体进行估计.
解:散点图分别如图(1)(2)所示.
从图中可以看出两图中的点各自分布在一条直线附近,因此两对变量 都具有相关关系. 图(1)中A的值由小变大时,B的值却是由大变小,即A和B成负相关; 图(2)中C的值由小变大时,D的值也是由小变大,即C和D成正相关.
高中数学必修三教案-两个变量的线性相关
2.3 变量间的相关关系2.3.1 变量之间的相关关系2.3.2 两个变量的线性相关整体设计教学分析变量之间的关系是人们感兴趣的问题.教科书通过思考栏目“物理成绩与数学成绩之间的关系”,引导学生考察变量之间的关系.在教师的引导下,可使学生认识到在现实世界中存在不能用函数模型描述的变量关系,从而体会研究变量之间的相关关系的重要性.随后,通过探究人体脂肪百分比和年龄之间的关系,引入描述两个变量之间关系的线性回归方程(模型).教科书在探索用多种方法确定线性回归直线的过程中,向学生展示创造性思维的过程,帮助学生理解最小二乘法的思想.通过气温与饮料销售量的例子及随后的思考,使学生了解利用线性回归方程解决实际问题的全过程,体会线性回归方程作出的预测结果的随机性,并且可能犯的错误.进一步,教师可以利用计算机模拟和多媒体技术,直观形象地展示预测结果的随机性和规律性.三维目标1.通过收集现实问题中两个有关联变量的数据认识变量间的相关关系.2.明确事物间的相互联系.认识现实生活中变量间除了存在确定的关系外,仍存在大量的非确定性的相关关系,并利用散点图直观体会这种相关关系.3.经历用不同估算方法描述两个变量线性相关的过程.知道最小二乘法的思想,能根据给出的线性回归方程的系数公式建立线性回归方程.重点难点教学重点:通过收集现实问题中两个有关联变量的数据直观认识变量间的相关关系;利用散点图直观认识两个变量之间的线性关系;根据给出的线性回归方程的系数公式建立线性回归方程.教学难点:变量之间相关关系的理解;作散点图和理解两个变量的正相关和负相关;理解最小二乘法的思想.课时安排2课时教学过程第1课时导入新课思路1在学校里,老师对学生经常这样说:“如果你的数学成绩好,那么你的物理学习就不会有什么大问题.”按照这种说法,似乎学生的物理成绩与数学成绩之间存在着一种相关关系.这种说法有没有根据呢?请同学们如实填写下表(在空格中打“√” ):学生讨论:我们可以发现自己的数学成绩和物理成绩存在某种关系.(似乎就是数学好的,物理也好;数学差的,物理也差,但又不全对.)物理成绩和数学成绩是两个变量,从经验看,由于物理学习要用到比较多的数学知识和数学方法.数学成绩的高低对物理成绩的高低是有一定影响的.但决非唯一因素,还有其他因素,如是否喜欢物理,用在物理学习上的时间等等.(总结:不能通过一个人的数学成绩是多少就准确地断定他的物理成绩能达到多少.但这两个变量是有一定关系的,它们之间是一种不确定性的关系.如何通过数学成绩的结果对物理成绩进行合理估计有非常重要的现实意义.)为很好地说明上述问题,我们开始学习变量之间的相关关系和两个变量的线性相关.(教师板书课题)思路2某地区的环境条件适合天鹅栖息繁衍,有人经统计发现了一个有趣的现象,如果村庄附近栖息的天鹅多,那么这个村庄的婴儿出生率也高,天鹅少的地方婴儿的出生率低,于是,他就得出一个结论:天鹅能够带来孩子.你认为这样得到的结论可靠吗?如何证明这个结论的可靠性?推进新课新知探究提出问题(1)粮食产量与施肥量有关系吗?“名师出高徒”可以解释为教师的水平越高,学生的水平也越高.教师的水平与学生的水平有什么关系?你能举出更多的描述生活中两个变量的相关关系的成语吗?(2)两个变量间的相关关系是什么?有几种?(3)两个变量间的相关关系的判断.讨论结果:(1)粮食产量与施肥量有关系,一般是在标准范围内,施肥越多,粮食产量越高;教师的水平与学生的水平是相关的,如水滴石穿,三人行必有我师等.我们还可以举出现实生活中存在的许多相关关系的问题.例如:商品销售收入与广告支出经费之间的关系.商品销售收入与广告支出经费有着密切的联系,但商品销售收入不仅与广告支出多少有关,还与商品质量、居民收入等因素有关.粮食产量与施肥量之间的关系.在一定范围内,施肥量越大,粮食产量就越高.但是,施肥量并不是决定粮食产量的唯一因素.因为粮食产量还要受到土壤质量、降雨量、田间管理水平等因素的影响.人体内的脂肪含量与年龄之间的关系.在一定年龄段内,随着年龄的增长,人体内的脂肪含量会增加,但人体内的脂肪含量还与饮食习惯、体育锻炼等有关,可能还与个人的先天体质有关.应当说,对于上述各种问题中的两个变量之间的相关关系,我们都可以根据自己的生活、学习经验作出相应的判断,因为“经验当中有规律”.但是,不管你的经验多么丰富,如果只凭经验办事,还是很容易出错的.因此,在分析两个变量之间的相关关系时,我们需要一些有说服力的方法.在寻找变量之间相关关系的过程中,统计同样发挥着非常重要的作用.因为上面提到的这种关系,并不像匀速直线运动中时间与路程的关系那样是完全确定的,而是带有不确定性.这就需要通过收集大量的数据(有时通过调查,有时通过实验),在对数据进行统计分析的基础上,发现其中的规律,才能对它们之间的关系作出判断.(2)相关关系的概念:自变量取值一定时,因变量的取值带有一定随机性的两个变量之间的关系,叫做相关关系.两个变量之间的关系分两类:①确定性的函数关系,例如我们以前学习过的一次函数、二次函数等;②带有随机性的变量间的相关关系,例如“身高者,体重也重”,我们就说身高与体重这两个变量具有相关关系.相关关系是一种非确定性关系.如商品销售收入与广告支出经费之间的关系.(还与商品质量、居民收入、生活环境等有关)(3)两个变量间的相关关系的判断:①散点图.②根据散点图中变量的对应点的离散程度,可以准确地判断两个变量是否具有相关关系.③正相关、负相关的概念.①教学散点图出示例题:在一次对人体脂肪含量和年龄关系的研究中,研究人员获得了一组样本数据:年龄23 27 38 41 45 49 50脂肪9.5 17.8 21.2 25.9 27.5 26.3 28.2年龄53 54 56 57 58 60 61脂肪29.6 30.2 31.4 30.8 33.5 35.2 34.6分析数据:大体上来看,随着年龄的增加,人体中脂肪的百分比也在增加.我们可以作散点图来进一步分析.②散点图的概念:将各数据在平面直角坐标系中的对应点画出来,得到表示两个变量的一组数据的图形,这样的图形叫做散点图,如下图.从散点图我们可以看出,年龄越大,体内脂肪含量越高.图中点的趋势表明两个变量之间确实存在一定的关系,这个图支持了我们从数据表中得出的结论.(a.如果所有的样本点都落在某一函数曲线上,就用该函数来描述变量之间的关系,即变量之间具有函数关系.b.如果所有的样本点都落在某一函数曲线附近,变量之间就有相关关系.c.如果所有的样本点都落在某一直线附近,变量之间就有线性相关关系)③正相关与负相关的概念:如果散点图中的点散布在从左下角到右上角的区域内,称为正相关.如果散点图中的点散布在从左上角到右下角的区域内,称为负相关.(注:散点图的点如果几乎没有什么规则,则这两个变量之间不具有相关关系)应用示例思路1例1 下列关系中,带有随机性相关关系的是_____________.①正方形的边长与面积之间的关系②水稻产量与施肥量之间的关系③人的身高与年龄之间的关系④降雪量与交通事故的发生率之间的关系解析:两变量之间的关系有两种:函数关系与带有随机性的相关关系.①正方形的边长与面积之间的关系是函数关系.②水稻产量与施肥量之间的关系不是严格的函数关系,但是具有相关性,因而是相关关系.③人的身高与年龄之间的关系既不是函数关系,也不是相关关系,因为人的年龄达到一定时期身高就不发生明显变化了,因而他们不具备相关关系.④降雪量与交通事故的发生率之间具有相关关系,因此填②④.答案:②④例2 有关法律规定,香烟盒上必须印上“吸烟有害健康”的警示语.吸烟是否一定会引起健康问题?你认为“健康问题不一定是由吸烟引起的,所以可以吸烟”的说法对吗?分析:学生思考,然后讨论交流,教师及时评价.解:从已经掌握的知识来看,吸烟会损害身体的健康,但是除了吸烟之外,还有许多其他的随机因素影响身体健康,人体健康是很多因素共同作用的结果.我们可以找到长寿的吸烟者,也更容易发现由于吸烟而引发的患病者,所以吸烟不一定引起健康问题.但吸烟引起健康问题的可能性大.因此“健康问题不一定是由吸烟引起的,所以可以吸烟”的说法是不对的.点评:在探究研究的过程中,如果能够从两个变量的观察数据之间发现相关关系是极为有意义的,由此可以进一步研究二者之间是否蕴涵因果关系,从而发现引起这种相关关系的本质原因是什么.本题的意义在于引导学生重视对统计结果的解释,从中发现进一步研究的问题. 思路2例1 有时候,一些东西吃起来口味越好,对我们的身体越有害.下表给出了不同类型的某种食品的数据.第二列表示此种食品所含热量的百分比,第三列数据表示由一些美食家以百分制给出的对此种食品口味的评价:(1)作出这些数据的散点图.(2)关于两个变量之间的关系,你能得出什么结论?解:(1)散点图如下:(2)基本成正相关关系,即食品所含热量越高,口味越好.例2 案例分析:一般说来,一个人的身高越高,他的右手一拃长就越长,因此,人的身高与右手一拃长之间存在着一定的关系.为了对这个问题进行调查,我们收集了北京市某中学2003年高三年级96名学生的身高与右手一拃长的数据如下表.性别身高/cm 右手一拃长/cm 性别身高/cm 右手一拃长/cm女152 18.5 女153 16.0女156 16.0 女157 20.0女158 17.3 女159 20.0女160 15.0 女160 16.0女160 17.5 女160 17.5女160 19.0 女160 19.0女160 19.0 女160 19.5女161 16.1 女161 18.0女162 18.2 女162 18.5女163 20.0 女163 21.5女164 17.0 女164 18.5女164 19.0 女164 20.0女165 15.0 女165 16.0女165 17.5 女165 19.5女166 19.0 女167 19.0女167 19.0 女168 16.0男178 21.0 男178 22.5男178 24.0 男179 21.5男179 21.5 男179 23.0男180 22.5 男181 21.1男181 21.5 男181 23.0男182 18.5 男182 21.5男182 24.0 男183 21.2男185 25.0 男186 22.0男191 21.0 男191 23.0(1)根据上表中的数据,制成散点图.你能从散点图中发现身高与右手一拃长之间的近似关系吗?(2)如果近似成线性关系,请画出一条直线来近似地表示这种线性关系.(3)如果一个学生的身高是188 cm,你能估计他的一拃大概有多长吗?解:根据上表中的数据,制成的散点图如下.从散点图上可以发现,身高与右手一拃长之间的总体趋势是成一直线,也就是说,它们之间是线性相关的.那么,怎样确定这条直线呢?同学1:选择能反映直线变化的两个点,例如(153,16),(191,23)两点确定一条直线. 同学2:在图中放上一根细绳,使得上面和下面点的个数相同或基本相同.同学3:多取几组点对,确定几条直线方程.再分别算出各个直线方程斜率、截距的算术平均值,作为所求直线的斜率、截距.同学4:从左端点开始,取两条直线,如下图.再取这两条直线的“中间位置”作一条直线.同学5:先求出相同身高同学右手一拃长的平均值,画出散点图,如下图,再画出近似的直线,使得在直线两侧的点数尽可能一样多.同学6:先将所有的点分成两部分,一部分是身高在170 cm以下的,一部分是身高在170 cm以上的;然后,每部分的点求一个“平均点”——身高的平均值作为平均身高、右手一拃的平均值作为平均右手一拃长,即(164,19),(177,21);最后,将这两点连接成一条直线. 同学7:先将所有的点按从小到大的顺序进行排列,尽可能地平均分成三等份;每部分的点按照同学3的方法求一个“平均点”,最小的点为(161.3,18.2),中间的点为(170.5,20.1),最大的点为(179.2,21.3).求出这三个点的“平均点”为(170.3,19.9).我再用直尺连接最大点与最小点,然后平行地推,画出过点(170.3,19.9)的直线.同学8:取一条直线,使得在它附近的点比较多.在这里需要强调的是,身高和右手一拃长之间没有函数关系.我们得到的直线方程,只是对其变化趋势的一个近似描述.对一个给定身高的人,人们可以用这个方程来估计这个人的右手一拃长,这是十分有意义的.知能训练一个车间为了规定工时定额,需要确定加工零件所花费的时间,为此进行了10次试验,收集数据如下:零件数x(个)10 20 30 40 50 60 70 80 90 100 加工时间62 68 75 81 89 95 102 108 115 122 y(min)画出散点图;关于加工零件的个数与加工时间,你能得出什么结论?答案:(1)散点图如下:(2)加工零件的个数与所花费的时间呈正线性相关关系.拓展提升以下是某地搜集到的新房屋的销售价格y和房屋的面积x的数据:房屋面积(m2)115 110 80 135 105销售价格(万元)24.8 21.6 18.4 29.2 22(1)画出数据对应的散点图;(2)指出是正相关还是负相关;(3)关于销售价格y和房屋的面积x,你能得出什么结论?解:(1)数据对应的散点图如下图所示:(2)散点图中的点散分布在从左下角到右上角的区域内,所以是正相关.(3)关于销售价格y和房屋的面积x,房屋的面积越大,价格越高,它们呈正线性相关的关系. 课堂小结通过收集现实问题中两个有关联变量的数据作出散点图,并利用散点图直观认识变量间的相关关系.作业习题2.3A组3、4(1).设计感想本节课学习了变量之间的相关关系和两个变量的线性相关的部分内容,通过身边的具体实例说明了两个变量的相关关系,并学会了利用散点图及其分布来说明两个变量的相关关系的种类,为下一节课作了铺垫,思路1和思路2的例题对知识进行了巩固和加强,另外,本节课通过选取一些学生特别关心的身边事例,对学生进行思想情操教育、意志教育和增强学生的自信心,养成良好的学习态度和学习方法,树立时间观,培养勤奋、刻苦耐劳的精神.。
人教版高中数学-两个变量的线性相关
《2.3.2两个变量的线性相关》一、内容和内容解析本节课是人教A版高中数学必修三2.3.2两个变量的线性相关的第二课时。
上节课通过大量的生活实例,学生已经初步认识两个变量间的相关关系,并可以借助散点图呈现收集的数据。
通过对单变量样本数据中“平均数的几何意义”(切合学生的认知需要)的介绍,为本节课的内容做了铺垫。
本节课的主要内容是用最小二乘法求线性回归方程,基础知识是回归直线的概念,也是本节课的核心概念;基本思想是“最小二乘法”思想;根据线性回归方程的系数公式求回归直线是本节课的基本技能.就统计学科而言,对不同的数据处理方法进行“优劣评价”是“假设检验”的萌芽,而后者是统计学学科研究的另一重要领域了解“最小二乘法”思想,比较各种“估算方法”,体会它的科学性,既是统计学教学发展的需要,又在体会此思想的过程中促进学生对核心概念的进一步理解.“样本估计总体”是本节课的上位思想也是整个第二章的核心思想,而“最小二乘法思想”作为本节课的核心思想,由此得以体现.回归思想和贯穿统计学科中的随机思想,也在本节课中有所渗透.本节课通过引导学生经历“收集数据一一整理数据(作散点图)一一探究并确定回归直线的数学意义一一求回归直线方程一一应用”完整的回归分析的过程,鼓励学生独立思考、自主探究、合作交流和计算机操作等方式展开学习,从而发挥本节课的育人价值。
整个学习过程渗透了数据分析和数学建模的核心素养。
通过引导学生对散点图中的点大致分布在一条直线附近的观察,渗透直观想象的核心素养;通过尝试提出找回归直线的想法、用自己的语言描述对这条直线的初步认识到探究从数学的角度定义回归直线的过程,渗透数学抽象和逻辑推理的核心素养;最后,根据回归直线方程的系数公式,引导学生先求出公式中的基本统计量,再代入公式的过程和指导学生利用Excel电子表格求回归方程的过程,提升数学运算的核心素养。
基于上述内容分析,本节课的教学重点为:了解最小二乘法思想,并能根据给出的线性回归方程的系数公式,建立线性回归方程二、目标和目标设置基于对本节课教学内容的解析,结合《普通高中数学课程标准(2017年版)》的要求,制定本节课的教学目标如下:1.了解一元线性回归模型的含义:(1)能根据散点图解释两个相关变量的线性相关关系;(2)能用自己的语言解释回归直线的统计意义;2. 了解最小二乘原理:(1)经历用不同方法确定回归直线的过程,能认识到回归直线是“从整体上看,各点与此直线上的点的距离最小”的直线;(2)能用数学符号刻画“从整体上看,各点与此直线上的点的距离最小”的表达方式;(3)通过对表达方式的转化(距离最小到偏差平方和最小),体会最小二乘法原理,并能用自己的语言表述;3.针对实际应用问题,能根据给出的线性回归方程系数公式建立线性回归方程;4.在经历完整的线性回归分析的过程中,重点提升数据分析和数学建模核心素养;5.针对实际应用问题,会用一元线性回归模型进行预测.第1页(共6页)三、学生学情分析在经历用不同估算方法描述两个变量线性相关的过程后,在学生现有知识能力范围内,如何选择一个最优方法,成为知识发展的逻辑必然而上节课的“从平均数的几何意义说起”符合学生的认知需要和支撑点,同时引起了学生的兴趣,为这节课的最小二乘法思想的产生做了重要的铺垫.“最小二乘法”作为经典的回归方程估算方法,通过用数学方法刻画“从整体上看,各点与此直线的距离最小”这一直观的几何描述,采取合适的数学处理方法,最终获得回归直线,对学生认可统计估算的科学性有很大帮助.其中对于数形结合发现距离与偏差的等价性,二元二次函数的特征辨识等都是这节课学生所要具备的认知基础.基于此,如何把“从整体上看,各点与此直线的距离最小”用合适的代数符号刻画并化简,化几何问题为代数问题,是学生顺利了解解“最小二乘法”思想的前提;而如何化简复杂的代数表达式,学生缺乏处理的经验,在计算能力的要求上也较高,这里就造成了已有认知与现需认知的差异,而且是学生不能独立突破的要了解“最小二乘法思想”,接受“由系数公式得到的线性方程”为回归方程,理解此方程可作为“两个具有线性相关关系的变量的代表”这一回归直线概念的本质,并体现相对于其他估算方法法的优越性,又必须要求对给出的系数公式来源进行一定的说理,这里的认知差异也是学生无法自己消除的,需要老师的引导和帮忙.知识发展的要求与学生能力和经验的欠缺成为本节课将会遇到的最大矛盾.教学中,要防止两种倾向:一是直接套用回归系数公式求解回归方程而回避说理过程;二是过多纠缠于数学刻画过程,甚至在课堂上花大量时间对回归系数公式进行证明说理.这两种倾向,都脱离了实际情况,前者忽略了“最小二乘法思想”迷失了本节课的教学目标后者人为拔高教材要求,脱离了本节课教学要求.所以,本节课的教学难点是:如何通过数学方法刻画“从整体上看,各点与此直线的距离最小”,并在此过程中了解最小二乘法思想对于该教学难点,教师通过精准问题串层层分解学生认知的难点,不断寻找学生的认知原点,关键处动画展示,直观形象,突破教学难点. 本节课涉及大量数据计算,形成操作上的一个难点,通过小组合作,教师培训模式突破难点.四、教学策略分析本节课在课前让学生收集身高与体重的数据,一方面对前面学过的知识有一个巩固,同时让本节课进行线性回归分析的过程更加完整;二是从学生身边的真实数据出发,更容易促进学习动机,而且给学生带来的体验也更为真实。
高中数学必修三第二章《随机抽样》2.3.1变量之间的相关关系-2.3.2两个变量的线性相关
跟踪训练1 下表是某地的年降雨量与年平均气温的统计表,判断两者是 否具有相关关系,求线性回归方程有意义吗? 解答
年平均气温(℃) 12.51 12.74 12.64 13.69 13.33 12.84 13.05 年降雨量(mm) 748 542 507 813 574 701 432
命题角度2 函数关系与相关关系的区别与联系 例2 下列关系中,是相关关系的是__②__④____. 答案 解析 ①正方形的边长与面积之间的关系; ②农作物的产量与施肥量之间的关系; ③人的身高与年龄之间的关系; ④降雪量与交通事故的发生率之间的关系.
命题角度1 判断两个变量的相关性 例1 为了研究质量对弹簧长度的影响,对6根相同的弹簧进行测量,所 得数据如下:
质量(g)
5
10
15
20
25
30
弹簧长度(cm) 7.25 8.12 8.95 9.90 10.90 11.80
判断它们是否有相关关系,若有,判断是正相关还是负相关. 解答
反思与感悟
在研究两个变量之间是否存在某种关系时,必须从散点图入手,对于散 点图,可以作出如下判断: (1)如果所有的样本点都落在某一函数曲线上,那么就用该函数来描述变 量之间的关系,即变量之间具有函数关系; (2)如果所有的样本点都落在某一直线附近,那么变量之间就有线性相关 关系; (3)如果散点图中的点的分布几乎没有什么规律,那么这两个变量之间不 具有相关关系,即两个变量之间是相互独立的.
梳理 回归直线的方程
(1)回归直线:如果散点图中点的分布从整体上看大致在 一条直附线近 , 就 称 这两个变量之间具有 线性相关关系,这条直线叫做回归直线. (2)线性回归方程:对回应归的直方线程叫做回归直线的方程,简称回归方程.
2.3.1 变量之间的相关关系 2.3.2 两个变量的线性相关
2.3 变量间的相关关系 2.3.1 变量之间的相关关系 2.3.2 两个变量的线性相关考点 学习目标核心素养 相关关系的概念理解两个变量的相关关系的概念 数学抽象 散点图 会作散点图,并利用散点图判断两个变量之间是否具有相关关系逻辑推理、数学建模回归直线方程会求回归直线方程数学运算问题导学(1)相关关系分为哪两种? (2)什么叫散点图?(3)什么叫回归直线?求回归直线的方法及步骤是什么?1.两个变量的线性相关(1)散点图:将样本中n 个数据点(x i ,y i )(i =1,2,…,n )描在平面直角坐标系中得到的图形.(2)正相关与负相关①正相关:散点图中的点散布在从左下角到右上角的区域; ②负相关:散点图中的点散布在从左上角到右下角的区域. 2.回归直线的方程(1)回归直线:如果散点图中点的分布从整体上看大致在一条直线附近,我们就称这两个变量之间具有线性相关关系,这条直线叫做回归直线.(2)回归方程:回归直线对应的方程叫回归直线的方程,简称回归方程. (3)最小二乘法求回归直线方程y ^=b ^x +a ^时,使得样本数据的点到回归直线的距离的平方和最小的方法叫做最小二乘法.其中b ^是回归方程的斜率,a ^是回归方程在y 轴上的截距. ■名师点拨 (1)散点图的作用散点图形象地反映了各对数据的密切程度.根据散点图中点的分布趋势分析两个变量之间的关系,可直观地判断并得出结论.(2)回归直线的性质由a ^=y --b ^x -可知回归直线一定经过点(x -,y -),因此点(x -,y -)通常称为样本点的中心,其中,x -,y -分别是变量x 1,x 2,…,x n 和y 1,y 2,…,y n 的平均数.(3)线性相关关系强弱的定性分析线性相关关系的强弱体现在散点图中就是样本点越集中在某条直线附近,两变量的线性相关关系越强;样本点在某条直线附近越分散,两变量的线性相关关系越弱.判断正误(对的打“√”,错的打“×”) (1)线性回归方程必经过点(x -,y -).( )(2)对于方程y ^=b ^x +a ^,x 增加一个单位时,y 平均增加b ^个单位.( ) (3)样本数据中x =0时,可能有y =a ^.( ) (4)样本数据中x =0时,一定有y =a ^.( )解析:根据回归直线方程的意义知,(1)(2)都正确,而(3)(4)中,样本数据x =0时,y 的值可能为a ^,也可能不是a ^,故(3)正确.答案:(1)√ (2)√ (3)√ (4)×下列各图中所示的两个变量具有相关关系的是( )A .(1)(2)B .(1)(3)C .(2)(4)D .(2)(3)解析:选D.(1)为函数关系;(2)(3)为相关关系;(4)中,因为点分布得比较分散,两者之间无相关关系.5位学生的数学成绩和物理成绩如下表: 学科 A B C D E 数学 80 75 70 65 60 物理7066686462A .是函数关系B .是相关关系,但相关性很弱C .具有较好的相关关系,且是正相关D .具有较好的相关关系,且是负相关解析:选C.数学成绩x 和物理成绩y 的散点图如图所示.从图上可以看出数学成绩和物理成绩具有较好的相关关系,且成正相关. 设有一个回归方程为y ^=2-1.5x ,则变量x 每增加1个单位时,y 平均减少____________个单位.,解析:因为y ^=2-1.5x ,所以变量x 每增加1个单位时,y 1-y 2=[2-1.5(x +1)]-(2-1.5x )=-1.5,所以y 平均减少1.5个单位.答案:1.5相关关系的判断以下是在某地搜集到的不同楼盘新房屋的销售价格y(单位:万元)和房屋面积x(单位:m2)的数据:房屋面积x(m2)11511080135105销售价格y(万元)24.821.619.429.222(2)判断新房屋的销售价格和房屋面积之间是否具有相关关系?如果有相关关系,是正相关还是负相关?【解】(1)数据对应的散点图如图所示:(2)通过以上数据对应的散点图可以判断,新房屋的销售价格和房屋的面积之间具有相关关系,且是正相关.相关关系的判断方法(1)两个变量x和y具有相关关系的判断方法①散点图法:通过散点图,观察它们的分布是否存在一定规律,直观地判断;②表格、关系式法:结合表格或关系式进行判断;③经验法:借助积累的经验进行分析判断.(2)判断两个变量x和y之间是否具有线性相关关系,常用的简便方法就是绘制散点图,如果发现点的分布从整体上看大致在一条直线附近,那么这两个变量就是线性相关的,注意不要受个别点的位置的影响.[易错警示]在解答本题过程中,易出现如下错误:虽然五点中有四点大致分布在一条直线附近,但第二个点离这条直线太远,所以两个变量不相关,导致错误的原因是没有看主流点,而过分关注了不影响大局的个别点.对变量x,y有观测数据(x i,y i)(i=1,2,…,10),得散点图如图所示.由这个散点图可以判断()A.变量x与y正相关B.变量x与y不相关C.变量x与y负相关D.变量x与y是函数关系解析:选C.由这个散点图可以判断,变量x与y负相关,故选C.线性回归方程的求法下表提供了某厂节能降耗技术改造后生产甲产品过程中记录的产量x(吨)与相应的生产能耗y(吨标准煤)的几组对照数据:x 345 6y 2.534 4.5 (2)请根据上表提供的数据,用最小二乘法求出y关于x的线性回归方程y^=b^x+a^. 【解】(1)散点图如图.(2)x-=3+4+5+64=4.5,y-=2.5+3+4+4.54=3.5,∑i=14x i y i=3×2.5+4×3+5×4+6×4.5=66.5,∑i=14x2i=32+42+52+62=86,所以b ^=∑4i =1x i y i -4x -y-∑4i =1x 2i -4x-2=66.5-4×4.5×3.586-4×4.52=0.7, a ^=y --b ^x -=3.5-0.7×4.5=0.35. 所以所求的线性回归方程为y ^=0.7x +0.35.如果把例题中的y 的值2.5及4.5分别改为2和5,如何求回归直线方程? 解:散点坐标分别为(3,2),(4,3),(5,4),(6,5). 可验证这四点共线, 斜率k =3-24-3=1,所以直线方程为y -2=x -3, 即回归直线方程为y ^=x -1.求线性回归方程的步骤(1)计算平均数x -,y -.(5)用a ^=y --b ^x -,求a ^. (6)写出回归方程.某化工厂为预测某产品的回收率y ,需要研究它和原料有效成分含量x之间的相关关系,现取了8对观测值,计算得:则y 关于x 的回归直线方程是( )A.y ^=11.47+2.62x B.y ^=-11.47+2.62x C.y ^=2.62+11.47x D.y ^=11.47-2.62x解析:选A.利用题目中的已知条件可以求出x -=6.5,y -=28.5,然后利用回归直线方程的计算公式得b ^=∑8i =1x i y i -8x -y-∑8i =1x 2i -8x-2=1 849-8×6.5×28.5478-8×6.52≈2.62, a ^=y --b ^x -=11.47,因此回归直线方程为y ^=11.47+2.62x .线性回归方程的应用(2020·黑龙江省大庆铁人中学期末考试)某班主任为了对本班学生的月考成绩进行分析,从全班40名同学中随机抽取一个容量为6的样本进行分析.随机抽取6位同学的数学、物理分数对应如表:学生编号 1 2 3 4 5 6 数学分数x 60 70 80 85 90 95 物理分数y728088908595(1) (2)如果具有线性相关性,求出线性回归方程(系数精确到0.1);如果不具有线性相关性,请说明理由;(3)如果班里的某位同学数学成绩为50,请预测这位同学的物理成绩.【解】 (1)画出散点图:通过图象可以看出物理成绩y 与数学成绩x 之间具有线性相关性. (2)x -=16×(60+70+80+85+90+95)=80,y -=16×(72+80+88+90+85+95)=85,故b ^=0.6,a ^=37.故回归方程是y =0.6x +37. (3)当x =50时,解得y =67.故数学成绩为50,预测这位同学的物理成绩是67.利用线性回归方程解题的常见思路及注意点(1)利用回归直线过样本点的中心,可以求参数问题,参数可涉及回归方程或样本点数据.(2)利用回归方程中系数b ^的意义,分析实际问题.(3)利用回归直线进行预测,此时需关注两点:①所得的值只是一个估计值,不是精确值;②变量x 与y 成线性相关关系时,线性回归方程才有意义,否则即使求出线性回归方程也是毫无意义的,用其估计和预测的量也是不可信的.(2020·江西省临川第一中学期末考试)我国西部某贫困地区2011年至2017年农村居民家庭人均年收入y (千元)的数据如下表:年份 2011 2012 2013 2014 2015 2016 2017 年份代号x 1 2 3 4 5 6 7 人均年收入y2.93.33.64.44.85.25.9(2)利用(1)中的回归方程,预测该地区2019年农村居民家庭人均年收入将达到多少千元.解:(1)依题意x -=4,y -=4.3,从而b ^=0.5,a ^=y --b ^x -=4.3-0.5×4=2.3, 故所求线性回归方程为y ^=0.5x +2.3. (2)令x =9,得y ^=0.5×9+2.3=6.8.预测该地区在2019年农村居民家庭人均年收入为6.8千元.1.我们常说“吸烟有害健康”,吸烟与健康之间的关系是( ) A .正相关 B .负相关 C .无相关D .不确定解析:选B.烟吸得越多,则健康程度越差.2.关于回归直线方程y ^=a ^+b ^x 的叙述正确的是( ) ①反映y ^与x 之间的函数关系; ②反映y 与x 之间的函数关系; ③表示y ^与x 之间的不确定关系;④表示最接近y 与x 之间真实关系的一条直线. A .①② B .②③ C .③④ D .①④解析:选D.y ^=a ^+b ^x 表示y ^与x 之间的函数关系,而不是y 与x 之间的函数关系,它反映的关系最接近y 与x 之间的真实关系.故①④正确.3.在最小二乘法中,用来刻画各个样本点到直线y =a ^+b ^x 的“距离”的量是( ) A .|y i -y -| B .(y i -y -)2 C .|y i -(a ^+b ^x i )|D .[y i -(a ^+b ^x i )]2解析:选D.最小二乘法的定义明确给出,用[y i -(a ^+b ^x i )]2来刻画各个样本点与这条直线之间的“距离”(即二者之间的接近程度),用它们的和表示所有样本点与这条直线的接近程度.4.已知工厂加工零件的个数x 与花费时间y (h)之间的线性回归方程为y ^=0.01x +0.5,则加工200个零件大约需要________小时.解析:将200代入线性回归方程y ^=0.01x +0.5, 得y ^=2.5. 答案:2.5[A 基础达标]1.如图所示是具有相关关系的两个变量的一组数据的散点图,去掉哪个点后,两个变量的相关关系更明显( )A .DB .EC .FD .A解析:选C.A 、B 、C 、D 、E 五点分布在一条直线附近且贴近该直线,而F 点离得远,故去掉点F .2.(2020·江西省上饶市期末统考)某车间为了规定工时定额,需要确定加工零件所花费用的时间,为此进行了5次实验,根据收集到的数据(如下表),由最小二乘法求得回归直线方程为y ^=7.8x +40.2.零件数x (个) 1 23 4 5 加工时间y (min)50677179A .55B .55.8C .59D .51解析:选 D.设表中模糊的数据为m .由表中的数据可得x -=1+2+3+4+55=3,y -=50+m +67+71+795=267+m5,又由回归直线的方程为y ^=7.8x +40.2,所以267+m 5=7.8×3+40.2,解得m =51.即表中模糊的数据为51.故选D.3.已知变量x 和y 满足关系y =-0.1x +1,变量y 与z 正相关.下列结论中正确的是( ) A .x 与y 正相关,x 与z 负相关 B .x 与y 正相关,x 与z 正相关 C .x 与y 负相关,x 与z 负相关 D .x 与y 负相关,x 与z 正相关解析:选C.因为y =-0.1x +1的斜率小于0,故x 与y 负相关.因为y 与z 正相关,可设z =b ^y +a ^,b ^>0,则z =b ^y +a ^=-0.1b ^x +b ^+a ^,故x 与z 负相关.4.已知x 与y 之间的几组数据如下表:假设根据上表数据所得线性回归方程为y =b x +a .若某同学根据上表中的前两组数据(1,0)和(2,2)求得的直线方程为y =b ′x +a ′,则以下结论正确的是( )A.b ^>b ′,a ^>a ′ B.b ^>b ′,a ^<a ′ C.b ^<b ′,a ^>a ′D.b ^<b ′,a ^<a ′解析:选C.由两组数据(1,0)和(2,2)可求得直线方程为y =2x -2,从而b ′=2,a ′=-2.而利用线性回归方程的公式与已知表格中的数据,可求得b ^=∑6i =1x i y i -6x -·y-∑6i =1x 2i -6x-2=58-6×72×13691-6×⎝⎛⎭⎫722=57,a ^=y --b ^x -=136-57×72=-13,所以b ^<b ′,a ^>a ′. 5.(2020·广西钦州市期末考试)若回归直线y ^=b ^x +a ^的斜率估值为1.23,样本中心点为(4,5),当x =2时,估计y 的值为____________.解析:因为回归直线y ^=b ^x +a ^的斜率估值为1.23,所以b ^=1.23,y ^=1.23x +a ^. 因为样本中心点为(4,5),所以5=1.23×4+a ^,a ^=0.08,y ^=1.23x +0.08, 代入x =2,y =1.23×2+0.08=2.54. 答案:2.546.(2020·湖北省宜昌市葛洲坝中学期末考试)某公司借助手机微信平台推广自己的产品,对今年前5个月的微信推广费用x 与利润额y (单位:百万元)进行了初步统计,得到下列表格中的数据:x 2 4 5 6 8 y304060p70经计算,月微信推广费用x 与月利润额y 满足线性回归方程y ^=6.5x +17.5,则p 的值为____________.解析:由题中数据可得x -=2+4+5+6+85=5,y -=30+40+60+p +705=200+p5.由线性回归方程y ^=6.5x +17.5经过样本中心(x -,y -), 有200+p 5=6.5×5+17.5,解得p =50.答案:507.对某台机器购置后的运营年限x (x =1,2,3,…)与当年利润y 的统计分析知具备线性相关关系,线性回归方程为y ^=10.47-1.3x ,估计该台机器使用________年最合算.解析:只要预计利润不为负数,使用该机器就算合算,即y ^≥0,所以10.47-1.3x ≥0,解得x ≤8.05,所以该台机器使用8年最合算.答案:88.(2020·湖南省张家界市期末联考)为了解某地区某种农产品的年产量x (单位:吨)对价格y (单位:千元/吨)的影响,对近五年该农产品的年产量和价格统计如表:x 1 2 3 4 5 y86542(1)求x -,y -;(2)求y 关于x 的线性回归方程y ^=b ^x +a ^; (3)若年产量为4.5吨,试预测该农产品的价格.解:(1)计算可得x -=1+2+3+4+55=3,y -=8+6+5+4+25=5.(2)b ^=∑5i =1x i y i -5x -y-∑5i =1x 2i -5x-2=61-5×3×555-5×32=-1.4, 因为线性回归直线过(x -,y -),则a ^=y --b ^x -=5-(-1.4×3)=9.2, 故y 关于x 的线性回归方程是y ^=-1.4x +9.2. (3)当x =4.5时,y ^=-1.4×4.5+9.2=2.9(千元/吨).9.(2020·河北省石家庄市期末考试)在一段时间内,分5次测得某种商品的价格x (万元)和需求量y (吨)之间的一组数据为(1)根据上表数据,求出回归直线方程y =b x +a ;(2)试根据(1)中求出的回归方程预估当价格为1.9万元时,需求量大约是多少吨?(参考公式:b ^=∑ni =1(x i -x -)(y i -y -)∑ni =1(x i -x -)2=∑ni =1x i y i -n x -y -∑n i =1x 2i -n (x )-2,a ^=y --b ^x -)解:(1)因为x -=15×9=1.8,y -=15×37=7.4,∑i =15 x i y i =62,∑i =15x 2i =16.6,所以 b ^=∑5i =1x i y i -5x -y-∑5i =1x 2i -5(x )-2=62-5×1.8×7.416.6-5×1.82=-11.5, a ^=y --b ^x -=7.4+11.5×1.8=28.1, 故y 对x 的线性回归方程为y ^=28.1-11.5x . (2)y =28.1-11.5×1.9=6.25(吨).所以如果价格为1.9万元,则需求量大约是6.25吨.[B 能力提升]10.对两个变量的四组数据进行统计,获得以下散点图,关于两个变量相关系数的比较,正确的是( )A .r 2<r 4<0<r 3<r 1B .r 4<r 2<0<r 1<r 3C .r 4<r 2<0<r 3<r 1D .r 2<r 4<0<r 1<r 3解析:选A.由相关系数的定义以及散点图的含义,可知r 2<r 4<0<r 3<r 1.11.期中考试后,某校高三(9)班班主任对全班65名学生的成绩(单位:分)进行分析,得到数学成绩y 关于总成绩x 的回归直线方程为y ^=6+0.4x .由此可以估计:若2名同学的总成绩相差50分,则他们的数学成绩大约相差________分.解析:设两名同学的总成绩分别为x 1,x 2,则对应的数学成绩估计为y ^1=6+0.4x 1,y ^2=6+0.4x 2,所以|y ^1-y ^2|=|0.4(x 1-x 2)|=0.4×50=20.答案:2012.(2020·湖北省宜昌县域高中协同发展共同体期末考试)为研究冬季昼夜温差大小对某反季节大豆新品种发芽率的影响,某校课外兴趣小组记录了5组昼夜温差与100颗种子发芽数,得到如下资料:组号 1 2 3 4 5 温差x (℃) 10 11 13 12 8 发芽数y (颗)2325302616组数据中选取3组数据求出线性回归方程,再用没选取的2组数据进行检验.(1)若选取的是第2,3,4组的数据,求出y 关于x 的线性回归方程y ^=b ^x +a ^; (2)若由线性回归方程得到的估计数据与所选出的检验数据的误差均不超过2颗,则认为得到的线性回归方程是可靠的,试问(1)中所得的线性回归方程是否可靠?(参考公式:b ^=∑ni =1(x i -x -)(y i -y -)∑ni =1 (x i -x -)2=∑ni =1x i y i -n x -y -∑n i =1x 2i -n x-2,a ^=y --b ^x -)解:(1)由题意:x -=11+13+123=12,y -=25+30+263=27,b ^=∑3i =1 (x i -x -)(y i -y -)∑3i =1 (x i -x -)2=(x 1-x -)(y 1-y -)+(x 2-x -)(y 2-y -)+(x 3-x -)(y 3-y -)(x 1-x -)2+(x 2-x -)2+(x 3-x -)2=(11-12)×(25-27)+(13-12)×(30-27)+(12-12)×(26-27)(11-12)2+(13-12)2+(12-12)2=52, a ^=y --b ^x -=27-52×12=-3,故回归直线方程为y ^=52x -3.(2)当x =10时,y =52×10-3=22,|22-23|=1<2,当x =8时,y =52×8-3=17,|17-16|=1<2,所以(1)中所得的回归直线方程是可靠的.13.(选做题)(2019·黑龙江省牡丹江市第一高级中学期末考试)某公司为确定下一年度投入某种产品的宣传费,需了解年宣传费x (单位:千元)对年销售量y (单位:t)和年利润z (单位:千元)的影响,对近8年的年宣传费x i 和年销售量y i (i =1,2,…,8)数据作了初步处理,得到下面的散点图及一些统计量的值.表中w i=xi,w-=18i=18w i.(1)根据散点图判断,y=a+bx与y=c+d x哪一个适宜作为年销售量y关于年宣传费x 的回归方程类型?(给出判断即可,不必说明理由)(2)根据(1)的判断结果及表中数据,建立y关于x的回归方程;(3)已知这种产品的年利润z与x、y的关系为z=0.2y-x.根据(2)的结果回答下列问题:(ⅰ)年宣传费x=49时,年销售量及年利润的预报值是多少?(ⅱ)年宣传费x为何值时,年利润的预报值最大?附:对于一组数据(u1,v1),(u2,v2),…,(u n,v n),其回归线v=α+βu的斜率和截距的最小二乘估计分别为解:(1)由散点图可以判断,y=c+d x适宜作为年销售量y关于年宣传费x的回归方程类型.(2)令w=x,先建立y关于w的线性回归方程.由于d=108.81.6=68,c^=y--d^w-=563-68×6.8=100.6,所以y关于w的线性回归方程为y^=100.6+68w,因此y关于x的回归方程为y^=100.6+68x.(3)(ⅰ)由(2)知,当x=49时,年销售量y的预报值y^=100.6+6849=576.6,年利润z的预报值z^=576.6×0.2-49=66.32.(ⅱ)根据(2)的结果知,年利润z的预报值z^=0.2(100.6+68x)-x=-x+13.6x+20.12.所以当x=13.62=6.8,即x=46.24时,z^取得最大值.故年宣传费为46.24千元时,年利润的预报值最大.。
2017学年数学必修三231变量之间的相关关系~232 两个变量的线性相关
【解题探究】1.典例1中样本中心点( , )与回归直线有什么关系?
x xy y x y nxy i i y 提示:典例1中回归直线必过样本中心点( , ),即点(3,3.5)在
ii
i1 i1 回归直线上.
x
2.从总体上看,典例2中每小时生产的有缺点的零件数随机器转速的增加是增加还是减少?
b n 提示:随转速的增加而减少.
ii
算得样本平均数 =3, =3.5,则由该观测数据算得的线性回归方
i1 程可能是 ( )
b A. =0.4x+2.3 C. =-2x+9.5
n x B. =2x-2.4
2
D. =-0.3x+4.4
x x x
ix
x
i1 x
i1 n
xi2
2
nx
.
i1
a
n
n y bx a
2.一台机器按不同的转速生产出来的某机械零件有一些会有缺点,每小时生产有缺点的零件的多少随机器的
x x x nx i
i
i1
i1
6
120
2
.
a
n
n y bx a
【解题探究】1.典例1中判断两个变量之间具有相关关系的关键是什么?
x xy y x y nxy i i 提示:关键是看它们之间的关系是否带有相关性.
ii
2.典例2中利用散点图判断两个变量是否具有相关关系的依据是什么?
i1 i1 提示:散点图形象地体现了数据的密切程度,因此可用散点图来判断两个变量有没有线性关系.
i1 i1 (2)画散点图时应注意合理选择单位长度,避免图形过大或偏小,或者使点的坐标在坐标系中画不准,使图形
b . n 失真,导致得出错误结论.
高中数学精品课件 2.3.1 变量之间的相关关系--2.3.2 两个变量的线性相关
①画出数据对应的散点图; ②判断房屋的销售价格和房屋面积之间是否具有相关关系,如果 有相关关系,是正相关还是负相关?
解 ①数据对应的散点图如图所示.
②通过以上数据对应的散点图可以判断,房屋的销售价格和房屋 面积之间具有相关关系,并且是正相关.
x0123 y1357 则 y 与 x 的线性回归方程为y^=b^ x+a^ 必过点( )
A.(2,2)
B.(1,2)
C.(1.5,0)
D.(1.5,4)
解析 易得-x=1.5,-y=4,由于回归直线过样本点的中心(-x,
-y),故选 D. 答案 D
4.小学生身高 y 与年龄 x 之间的线性回归直线方程为y^=8.8x+65, 预测一名 10 岁的小学生的身高为________. 解析 当 x=10 时,y^=8.8×10+65=153. 答案 153
题型三 利用回归方程对总体进行估计 【例3】 某地最近十年粮食需求量逐年上升,下表是部分统计数
据:
年份
2008 2010 2012 2014 2016
需求量/万吨 236 246 257 276 286
(1)利用所给数据求年需求量与年份之间的回归直线方程y^=b^ x+ a^ ; (2)利用(1)中所求出的直线方程预测该地 2018 年的粮食需求量.
函数关系
变量之间的关系可以用函数表示
相关关系 变量之间有一定的联系,但不能完全用函数表示
2.相关关系与函数关系的区别与联系
类别
区别
联系
函 ①函数关系中两个变量间是一种确定性 ①在一定的条件下可以相
人教版数学必修三两个变量之间的线性相关课堂课件
人教版数学必修三第二章2.3.2 两个变量之间的线性相关 课堂课件(共18张PPT)
求回归方程的一般方法:
1、列表
n
n
2、计算 x,
y,
x
2 i
,
xi yi
i 1
i 1
3、求 a , b
4、代入回归直线方程
人教版数学必修三第二章2.3.2 两个变量之间的线性相关 课堂课件(共18张PPT)
作出散点图发现,它们散 布在从左上角到右下角的区 域内。又如汽车的载重和汽 车每消耗1升汽油所行使的 平均路程,称它们成负相关. O
注:可考虑让学生思考书P86的思考.
我们再观察它的图像发现这些点大致分布在一条直线附 近,像这样,如果散点图中点的分布从整体上看大致在 一条直线附近,我们就称这两个变量之间具有线性相 关关系,这条直线叫做回归直线,该方程叫回归方程。
探究:
年龄 23 27 39 41 45 49 50 53 54 56 57 58 60 61 脂肪 9.5 17.8 21.2 25.9 27.5 26.3 28.2 29.6 30.2 31.4 30.8 33.5 35.2 34.6
如上的一组数据,你能分析人体的脂肪含量与年龄之间有怎样的关系吗?
从上表发现,对某个人不一定有此规律,但对很多个体放在 一起,就体现出“人体脂肪随年龄增长而增加” 这一规律.而表中各年龄对应的脂肪数是这个年龄 人群的样本平均数.我们也可以对它们作统计图、 表,对这两个变量有一个直观上的印象和判断.
下面我们以年龄为横轴, 脂肪含量为纵轴建立直 40 角坐标系,作出各个点,35 称该图为散点图。
人教新课标版数学高一必修3课件2.3.2两个变量的线性相关(二)
解析答案
(2)从散点图中发现气温与热饮销售杯数之间有什么关系; 解 从上图看到,各点散布在从左上角到右下角的区域里, 因此,气温与热饮销售杯数之间呈负相关,即气温越高,卖出去的热饮 杯数越少. (3)求回归方程; 解 从散点图可以看出,这些点大致分布在一条直线的附近, 因此,可用公式求出回归方程的系数. 利用计算器容易求得回归方程y^=-2.352x+147.767.
1.理解两个变量线性相关的概念; 2.了解用最小二乘法建立线性回归方程的思想,会用给出的公式建立回 归方程; 3.理解回归直线与观测数据的关系.
检查预习
课前预习课本相应部分,检查提问“自主学 习”部分
自主学习
知识点一 线性相关 思考 回顾上一节你看到的散点图,大致呈哪些形状? 答案 饼状,曲线状,直线状. 如果散点图中点的分布从整体上看大致在一条直线附近,就称这两个变量 之间具有线性相关关系. 两个变量线性相关是相关关系的一种.
元时销售额为( )
A.63.6 万元
B.65.5 万元
C.67.7 万元
D.72.0 万元
解析答案
1 2345
4.四名同学根据各自的样本数据研究变量 x,y 之间的相关关系,并求得回
归方程,分别得到以下四个结论:
①y 与 x 负相关且y^ =2.347x-6.423;
②y 与 x 负相关且y^ =-3.476x+5.648;
解析答案
(2)通过计算可知这两个变量的回归方程为
^
y
=23.25x+102.15,假如一个
城市的人均GDP为12万元,那么可以断言,这个城市患白血病的儿童一定
人教B版高中数学必修三232两个变量的线性相关学案
2.3.2两个变量的线性相关教学目标:1.明确事物间的相互联系。
认识现实生活中变量间除了存在确定的关系外,仍存在大量的非确定性的相关关系,并利用散点图直观体会这种相关关系。
2.经历用不同估算方法描述两个变量线性相关的过程.知道最小二乘法的思想,能根据给出的线性回归方程的系数公式建立线性回归方程.教学重点:1.利用散点图直观认识两个变量之间的线性关系.2.根据给出的线性回归方程的系数公式建立线性回归方程.教学难点:1.作散点图和理解两个变量的正相关和负相关。
2.理解最小二乘法的思想教学过程:一、复习准备:1. 人的身高和体重之间的关系?2. 学生设计一个统计问题,并指出问题涉及的总体是什么,所涉及的变量是什么.二、讲授新课:1. 教学散点图①出示例题:在一次对人体脂肪含量和年龄关系的研究中,研究人员获得了一组样本数据:据的图形,这样的图形叫做散点图。
正相关与负相关概念:如果散点图中的点散布在从左下角到右上角的区域内,称为正相关。
如果散点图中的点散布在从左上角到右下角的区域内,称为负相关。
④讨论:你能举出一些生活中的变量成正相关或负相关的例子吗?⑤练习:一个工厂为了规定工时定额,需要确定加工零件所花费的时间,为此进行了10次调查,收集数据如下:2. 指出是正相关还是负相关。
3. 关于加工零件的个数与加工时间,你能得出什么结论? ⑥ 小结:1.散点图的画法。
2.正相关与负相关的概念。
三、回归方程1. 教学回归直线概念:① 从散点图上可以看出,这些点大致分布在通过散点图中心的一条直线。
如果散点图中点的分布从整体上看大致在一条直线附近,我们就称这这两个变量之间具有线形相关关系,直线叫回归直线。
②提问:从散点图上可以发现,人体的脂肪百分比和年龄的散点图,大致分布在通过散点图中心的一条直线。
那么,怎样确定这条直线呢? 2. 教学最小二乘法:①求回归方程的关键是如何用数学的方法刻画“从整体上看,各点与此直线的距离最小”.如果直线的方程为αβ+=x y ,用()i ,,βαρ表示第i 个样本点()i i y x ,与直线之间的距离,则从总体上看各点与此直线的距离可以用所有样本点与回归直线的距离来表示,即用下面的公式()()∑==ni i Q 1,,,βαρβα来表示.注意到上面的等式对于任何实数α和β都有定义,因此可把()βα,Q 看成二元函数.这样,“从整体上看,各点与此直线的距离最小”的含义是回归方程的截距a 和斜率b 构成的点()b a ,应该是函数()βα,Q 的最小值点.特别地,当()()2,,i i i x y i αββαρ--=时,()b a ,应该使函数()()()()2222211,αβαβαββα--++--+--=n n x y x y x y Q 达到极小值,即a 和b 由公式①给出。
人教版高中数学必修三两个变量的线性相关课件
人教版高中数学必修三第二章第3节 2.3.2两个变量的线性相关 课件(共30张PPT)
案例:年龄与人体脂肪含量的关系 人教版高中数学必修三第二章第3节 2.3.2两个变量的线性相关 课件(共30张PPT)
整理数据 人体的脂肪百分比和年龄的样本数据
年龄 23 27 39 41 45 49 50
?
人教版高中数学必修三第二章第3节 2.3.2两个变量的线性相关 课件(共30张PPT)
案例:年龄与人体脂肪含量的关系 人教版高中数学必修三第二章第3节 2.3.2两个变量的线性相关 课件(共30张PPT)
整理数据
让我们一起回顾整理、分析 单变量样本数据的统计方法, 看看能否给我们研究双变量 样本数据带来启示!
案例:年龄与人体脂肪含量的关系 人教版高中数学必修三第二章第3节 2.3.2两个变量的线性相关 课件(共30张PPT)
收集数据
我们用所学的抽样方法,在 50岁的人群中抽样调查其脂 肪含量百分比,然后可以用 样本的平均数作为50岁人群 对应的体脂率。
样本的特征数字!
抽样
人教版高中数学必修三第二章第3节 2.3.2两个变量的线性相关 课件(共30张PPT)
人教版高中数学必修三第二章第3节 2.3.2两个变量的线性相关 课件(共30张PPT)
?
案例:年龄与人体脂肪含量的关系 人教版高中数学必修三第二章第3节 2.3.2两个变量的线性相关 课件(共30张PPT)
收集数据 抽样
整理数据 统计图/表
单 变
量
分析数据 数字特征
样 本
数
预测决策 样本估计总体 据
抽样
人教版高中数学必修三第二章第3节 2.3.2两个变量的线性相关 课件(共30张PPT)
高中数学优质课件2-3-2两个变量的线性相关课件
(x1, y1)
(xn,yn)
(x2,y2)
可以用 yi yˆi 或(yi yˆi)2,其中yˆi bxi a.
诱思探究7
为了从整体上反映n个样本数据与回归直线的接近程度,你认为选用哪个 数量关系来刻画比较合适?
(x1, y1)
(xi,yi)
(xn,yn)
(x2,y2)
n
Q (yi yˆi )2 i 1
5 0
20 25 30 35 40 45 50 55 60 65 年龄
在直角坐标系中,任何一条直线都有相应的方程,回归直线的方程 称为回归方程.对一组具有线性相关关系的样本数据,如果能够求出它 的回归方程,那么我们就可以比较具体、清楚地了解两个相关变量的内 在联系,并根据回归方程对总体进行估计.
诱思探究4 回归直线与散点图中各点的位置应具有怎样的关系?
bˆ i1 n
( xi x)2
i 1 n
xi 2
2
nx
i 1
i 1
aˆ y bˆx
回归方程为: yˆ bˆx aˆ
诱思探究8
利用计算器或计算机可求得年龄和人体脂肪含量的样本数据的回 归方程为 yˆ 0.577 x 0.448,由此我们可以根据一个人个年龄预 测其体内脂肪含量的百分比的回归值.若某人37岁,则其体内脂肪含 量的百分比约为多少?
诱思探究2
4.线性相关关系的有关概念:如果散点图中的点的分 布,从整体上看大致在一条直线附近,则称这两个变 量之间具有线性相关关系,这条直线叫做回归直线.
诱思探究3
对具有线性相关关系的两个变量,其回归直线一定通过样本点 的中心吗?
脂肪含量
回归直线一定通过样本 点的中心.
40 35 30 25 20 15 10
人教新课标版数学高一必修3课件变量之间的相关关系两个变量的线性相关(一)
B.①③ D.②③
答案
1 2345
3.下列语句所表示的事件中的因素不具有相关关系的是( D )
A.瑞雪兆丰年
B.上梁不正下梁歪
C.吸烟有害健康
D.喜鹊叫喜,乌鸦叫丧
答案
4.下列两个变量之间的关系,哪个不是函数关系( D ) A.匀速行驶的车辆的行驶距离与时间 B.角度和它的正弦值 C.等腰直角三角形的腰长与面积 D.在一定年龄段内,人的年龄与身高 解析 在一定年龄段内,人的年龄与身高具有相关关系.
解析答案
返回
课堂检测
1 2345
1.对于给定的两个变量的统计数据,下列说法正确的是( C )
A.都可以分析出两个变量的关系
B.都可以用一条直线近似地表示两者的关系
C.都可以作出散点图
D.都可以用确定的表达式表示两者的关系
答案
2.观察下列散点图,具有相关关系的是( D )
1 2345
A.①② C.②④
解析答案Biblioteka 类型二 正相关与负相关的理解 例2 在一次对人体脂肪含量和年龄关系的研究中,研究人员获得了一组 样本数据:
年龄 23 27 39 41 45 49 50 脂肪 9.5 17.8 21.2 25.9 27.5 26.3 28.2 年龄 53 54 56 57 58 60 61 脂肪 29.6 30.2 31.4 30.8 33.5 35.2 34.6 画出散点图,分析年龄与人体脂肪含量的关系.
1 2345
解析答案
5.下列变量之间的关系是函数关系的是( A ) A.圆的周长与半径 B.施肥量和小麦亩产量 C.降雨量和交通事故发生率 D.学习时间和学习成绩
1 2345
答案
小结作业
1.判断变量之间有无相关关系,一种简便可行的方法就是绘制散点图.根据 散点图,可以很容易看出两个变量是否具有相关关系,是不是线性相关, 是正相关还是负相关. 2.函数关系中的两个变量间是一种确定性关系;相关关系是一种非确定性 关系.函数关系是一种因果关系而相关关系不一定是因果关系,也可能是 伴随关系,函数关系与相关关系之间有着密切联系,在一定条件下可以互 相转化.
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
2.3.2 回归直线及其方程教材分析本节内容数学必修3(人教A版)第二章的第三节的第三课,本节课是在学生已经具备了对样本数据进行初步分析的能力,能够根据两个相关变量的数据作出散点图的基础上进行的.本节课介绍线性回归直线的找法、回归方程的求法以及利用线性回归思想对实际问题进行分析与预测,基于本节课的内容特点和学生的年龄特征,首先采用探究式教学方法创设情境,然后教师作为引导者和帮助者,采用启发式教学方法与学生共同经历回归方程的寻找过程来完成教学,为以后研究选修2-3第三章回归分析思想的应用奠定基础.本节课的教学重点是了解最小二乘法和回归分析的思想,根据给出的线性回归方程的系数公式建立回归方程;难点是建立回归思想,理解回归直线与观测数据的关系.通过本节课的自主探究让学生体会数形结合的方法及最小二乘法的数学思想,培养学生观察、分析、比较和归纳能力.课时分配本节内容用3课时的时间完成,这是第二课时,主要是知道最小二乘法和回归分析的思想,能根据线性回归方程系数公式建立回归方程.教学目标重点: 了解最小二乘法和回归分析的思想,根据给出的线性回归方程的系数公式建立回归方程.难点:如何通过数学方法刻画“从整体上看,各点与此直线的距离最小”,并在此过程中了解最小二乘法思想.知识点:根据给出的线性回归方程的系数公式建立回归方程.能力点:探究体会数形结合的方法及最小二乘法的数学思想.教育点:学生通过合作学习、自主学习和探究式学习的方式完成一个完整的数学学习过程.自主探究点:自学例2.考试点:根据给出的线性回归方程的系数公式建立回归方程.易错易混点:如何化简复杂的代数表达式,学生缺乏处理的经验,在计算能力的要求上也较高.拓展点:事件、样本数据、回归直线方程三者关系.教具准备投影仪和三角板课堂模式学案导学一、复习引入【设计意图】为本节课学生能够更好的建构新的知识做好充分的准备,对旧的知识进行简要的提问复习,为能够顺利的完成本节课的内容提供必要的基础.【设计说明】学生动手操作得出散点图回答.【设计意图】通过讨论比较,调动学生的学习积极性和兴趣,活跃课堂气氛.【设计说明】设计该问题,引导学生自己发现问题,鼓励学生大胆表达自己的看法,充分暴露思维过程.发现:图1很乱,两个变量没有相关关系;图2呈上升趋势,图中点的分布呈条状,所有点都落在某一直线的附近,这样由图2自然地引出线性相关、回归直线的概念,同时引入课题. 引入:为此我们引入今天的课题-回归直线及其方程. 【设计意图】循序渐进,符合学生的认知规律.二、探究新知(一)探索回归直线的概念1.回归直线的定义:如果散点图中的点的分布,从整体上看大致在一条直线附近,则称这两个变量之间具有线性相关关系,这条直线叫做回归直线. 【设计意图】培养自学能力和数学阅读能力.【设计说明】让学生阅读教材,通过阅读教材学习线性相关,回归直线,回归方程的概念,并分析概念中应注意的问题.注意:概念的前提是点的分布在一条直线附近. (二)探索回归直线的找法结合引例—年龄与体内脂肪含量相关性的散点图观察,思考以下问题.问题1.对一组具有线性相关关系的样本数据,你认为其回归直线是一条还是几条?【设计意图】让学生通过观察、分析,自己发现回归直线的条数只有一条,从而培养学生观察、分析问题的能力.问题2.回归直线与散点图中各点的位置应具有怎样的关系?【设计意图】让学生分析两者的关系,教师引导学生发现两者整体上最接近,以进一步培养学生观察、分析问题的能力.问题3.那么在样本数据的散点图中,能否用直尺准确画出回归直线?【设计意图】让学生动手操作画回归直线,建立回归思想,以分解难点、突破难点,培养学生的动手操作能力.问题4.如果能够求出回归方程,那么我们就可以比较清楚的了解年龄与体内脂肪含量的相关性.那么我们应当如何具体求出这个回归方程呢?对于求回归直线方程,你有哪些想法?【设计意图】充分暴露学生的思维过程, 通过讨论比较,调动学生的学习积极性和兴趣,活跃课堂气氛,培养学生动脑思考问题的能力.【设计说明】结合教材,学生会出现以下方案.方案一:采用测量的方法,先画出一条直线,测量出各点与它的距离,然后移动直线,到达一个使距离的和最小的位置,测出此时的斜率和截距,就是回归方程了.如图脂肪含量脂肪含量方案二:在图中选两点作直线,使直线两侧的点的个数基本相同.如图脂肪含量方案三:如果多取几对点,确定多条直线,再求出这些直线的斜率和截距的平均值作为回归直线的斜率和截距,得回归方程.如图问题5.以上这些方法是不是真的可行?为什么?【设计意图】结合以上三个方案让学生画图,然后教师引导学生讨论、交流方案的可行性,体会回归直线的特征.【设计说明】教师先展示学生画图情况,学生说明理由;然后教师总结回归直线的特征:整体上看散点图中的点到此直线的距离最小.问题6.如何用数学的方法来刻画“从整体上看,各点到此直线的距离小”?【设计意图】这样设疑符合学生的认知规律,增强了学生的求知欲. 【设计说明】教师引导学生进行下面的分析:引导学生以等效性和简化计算为目标,将点到直线的距离转化为自变量x 取值一定时,纵坐标的偏差.这样自然引出下面求回归方程的方法. 问题7.结合以上分析,我们认为以“偏差”最小的直线作为回归直线比较恰当,那你能用代数式来刻画“从整体上看,各点与此直线的偏差最小”吗?【设计意图】几何问题代数化,为下一步探究作好准备,经历“几何直观”转化为“代数表达”过程,为引出“最小二乘法”作准备.【设计说明】假设我们已经得到两个具有线性相关关系的变量的一组数据:11(,)x y ,22(,)x y ,,(,)n n x y .当自变量x 取i x ),,2,1(n i =时,可以得到ˆi y bx a =+),,2,1(n i =,它与实际收集到的i y 之间的偏差(如图)是ˆ()i i i i y yy bx a -=-+),,2,1(n i =.问题8.教师启发学生比较下列三个模型,哪个模型比较可行? 模型一:1ˆ()nii i yy=-∑最小 模型二:1ˆ||nii i yy=-∑最小 模型三:21ˆ()n ii i yy=-∑最小【设计意图】先向学生说明1ni =∑的意义,体会如何选取恰当的计算方法建立回归方程的过程,提高学生分析问题的能力;培养学生的动手操作能力.【设计说明】教师指出:模型一中ˆ()i i y y-可能有正有负,互相抵消怎么办?学生一般会想到加绝对值. 模型二中ˆ||i i y y -去绝对值非常困难(可以提问,让学生思考),是否有其它的方法,同时可以类比方差的处理方法,引导学生思考.师生一起分析后,得出用模型三来制定标准评价一条直线是否为“最好”的直线较为方便. (三) 利用最小二乘法推导回归系数公式问题9.通过对上述问题的分析,我们知道可以用Q =2211ˆ()()nnii i i i i yyy bx a ==-=--∑∑最小来表示偏差最小,那么在这个式子中,当样本点的坐标(,)i i x y 确定时,a ,b 等于多少,Q 能取到最小值呢?【设计意图】体会最小二乘法思想,不经历公式化简无法真正理解其意义,而直接从n 个点的公式化简,教学要求、教学时间、学生能力都没达到这个高度.因而由具体到抽象,由特殊到一般,将是学生顺利完成这一认知过程的一般性原则.通过这个问题,让学生了解这个式子的结构,为后续的学习打下基础,同时渗透最小值的思想.【设计说明】我们采用n 个偏差的平方和Q =2221122()()()n n y bx a y bx a y bx a --+--++--表示n 个点与相应直线在整体上的接近程度:记Q =21()nii i ybx a =--∑.通过化简,得到的其实是关于a 、b 的二元二次函数求最值的问题,一定存在这样的a 、b ,使Q 取到最小值. 教师指出:(1)在此基础上,视Q 为b 的二次函数时,根据有关数学原理分析,可求出使Q 为最小值时的b 的值的线性回归方程系数公式:1122211()(),().nnii i ii i nniii i xx y y x ynx y b xx xnxa y bx ====⎛--- ==-- =-⎝∑∑∑∑这样,回归方程的斜率为b ,截距为a ,即回归方程为y b x a =+.(2)),(y x 称为样本点的中心,可以证明回归直线一定过样本点的中心,所以可得a y bx =-.最小二乘法:这种通过上式的最小值而得到回归直线的方法,即使得样本数据的点到回归直线的距离的平方和最小的方法叫做最小二乘法.三、理解新知理解回归系数公式思考1.线性回归方程y bx a =+为何不记为y bx a =+?你能说明对于确定的x ,根据y bx a =+计算出的y 的意义吗?【设计意图】使学生理解线性回归方程的真正意义与作用,明确y 只是y 的一个估计值. 【设计说明】学生思考,教师帮助学生理解线性回归方程的意义与作用.思考2.这个公式不要求记忆,但要会运用这个公式进行运算,那么,要求,b a 的值,你会按怎样的顺序求呢?【设计意图】公式不要求推导,又不要求记忆,学生对这个公式缺少感性的认识,通过这个问题,使学生从感性的层次上对公式有所了解.【设计说明】由于这个公式比较复杂,因此在运用这个公式求,b a 时,必须要有条理,先求什么,再求什么.比如,我们可以按照i i x y 、n 、x 、y 、1ni ii x y =∑、21nii x=∑顺序来求,再代入公式.四、运用新知例1.进一步探究引例—年龄与体内脂肪含量【设计意图】公式形式化程度高、表达复杂,通过分解计算,可加深对公式结构的理解.同时,通过例题,反映数据处理的繁杂性,体现计算器处理的优越性.【设计说明】可让学生观察公式,充分讨论,通过计算:i i x y 、n 、x 、y 、1n i ii x y =∑、21nii x=∑六个数据带入回归方程公式得到线性回归方程,体会求线性回归方程的原理与方法.而后教师可偕同学生,对计算器操作方式提供示范,师生共同完成,得出回归直线方程为:0.6541 4.5659y x =-.(2)利用计算器,根据表二,请同学们独立解决求出表中两变量的回归方程.【设计意图】让学生独立体验运用计算器求回归直线方程,在重复求解回归直线的过程中,使学生掌握利用计算器求回归直线的操作方法.得出回归直线方程为:0.57650.4478y x =-.【设计说明】学生独立运用计算器求回归直线方程,对于不会操作的学生,教师给予必要的指导.继续思考下列问题:问题1.请同学们从表格中选取年龄x 的一个值代入上述回归直线的方程,看看得出的数据与真实数值之间的关系.如:x =50时,得出估计值为28.3772,而实际值为28.2,有偏差为什么?【设计意图】使学生理解线性回归方程的真正意义与作用,明确y 只是y 的一个估计值,将x 值带入后肯定有误差.问题2.试预测某人37岁时,他体内的脂肪含量,并说明结果的含义. 【设计意图】进一步理解线性回归方程的真正意义与作用.【设计说明】学生代入计算得20.883.教师进一步提问:我们能不能说他的体内脂肪含量的百分比一定是20.883%?学生思考回答:不能,只能说他体内的脂肪含量在20.90%附近的可能性比较大.问题3.同样问题背景,为什么回归直线不止一条?回归方程求出后,变量间的相关关系是否就转变成确定关系?【设计意图】明确样本的选择影响回归直线方程,体现统计的随机思想.同时,明确其揭示的是相关关系而非函数的确定关系,而且最小二乘法只是某一标准下的一种数据处理方法,使学生更全面的理解回归直线这一核心概念.【设计说明】教师说明回归直线方程由数据唯一决定,提供的数据不同,回归直线方程当然不同,同时回归直线方程又能反映数据的本质.例2.下表是某小卖部6天卖出热茶的杯数与当天气温的对比表(不用计算器直接求回归直线方程):(1)画散点图;(2)从散点图中发现温度与热饮销售杯数之间关系的一般规律; (3)求回归方程;(4)按照回归方程,计算温度为10度时销售杯数.为什么与表中不同?如果某天的气温是-5℃时,预测这天小卖部卖出热茶的杯数.【设计意图】通过此题,让学生完整经历求回归直线过程.其中第4问,让学生体会到即使是相比下“最优”的所获得的回归直线,也存在着一定的误差,从中体会无论方法的优劣,统计学中随机性无法避免.而在预测值的计算中,体现了回归直线的应用价值,加深学生对回归方程的理解,体验数学在实际生活中的应用.【设计说明】①本题不能用计算器运算,以考查学生的运算能力;②本题让学生自学,爬黑板板书过程,教师进一步规范学生的解题步骤; ③结合这两个例题让学生总结求回归直线方程的步骤. 拓展:通过对以上两个案例的分析,思考:事件、样本数据、回归直线方程三者关系.1.数据采样本身就具有随机性,同样23岁的人,脂肪含量可能9.5%,也有可能30%,这种误差我们称之为随机误差,随机误差是不可避免的.2.回归分析是寻找相关关系中非确定关系中的某种确定性,虽然一个数据具有随机误差,但总体还是具有某种确定的关系.3.在数据采样都符合统计要求的情况下,取三个回归直线方程中的任意一个都是合理的,不存在哪条最合适的问题,但一般情况下,选择数据多一些的比较合理. 因此,事件、样本数据、回归直线方程三者具有如下的关系:五、课堂小结教师提问:本节课我们学习了哪些知识,涉及到哪些数学思想方法?学生作答: 1.知识:(1)求回归直线方程的方法.(2)求回归直线方程的步骤: ①先判断变量是否线性相关;②若线性相关,可按下面的步骤求回归直线方程;第一步,计算平均数x 、y ; 第二步,求和1ni i i x y =∑、21ni i x =∑; 第三步,计算1122211()()()nnii i ii i nniii i xx y y x ynx yb xx xnx====---==--∑∑∑∑;第四步,写出回归直线方程为y bx a =+.③利用回归方程对生活实际问题进行分析与预测. (3)回归直线方程的作用及意义.2.思想:数形结合、归纳、类比、最小二乘法和回归分析的思想. 教师总结:提醒学生:在学习新知时,也要经常复习前面学过的内容,“温故而知新”.在应用中增强对知识的理解,及时查缺补漏,从而更好地运用知识,解题要有目的性,加强对数学知识、思想方法的认识与自觉运用.【设计意图】培养学生自主梳理知识能力,加强对学生学习方法的指导.六、布置作业1.书面作业预测抽样 统计意义上的反映 决定选取代表 事件样本数据 回归直线方程1.有5(1) (2)关于两个变量之间的关系,你能得出什么结论?2.下表提供了某厂节能降耗技术改造后生产甲产品过程中记录的产量x (吨)与相应的生产能耗y (吨标准(1)(2)根据上表提供的数据,用最小二乘法求出回归方程;(3)已知该厂技改前100吨甲产品的生产能耗为90吨标准煤.试根据(2)求出的线性回归方程,预测生产100吨甲产品的生产能耗比技改前降低多少吨标准煤?【设计意图】通过作业的解决,让学生巩固熟悉回归方程求解的过程,并体会运用回归方程进行预测. 2.课外思考利用最小二乘法求出回归直线的方程后,可以对上面两个变量的关系进行分析与预测. 思考:是不是所有的相关关系都可以求出回归直线的方程?请大家观察这两幅图:【变量之间的关系.显然求回归直线的方程是没有意义的.有些变量线性相关,有些非线性相关,怎样衡量变量的线性相关程度呢?带着这个问题让学生课后阅读第92页的内容.【设计意图】设计书面作业必做题,是引导学生先复习,再作业,培养学生良好的学习习惯.书面作业的布置,是为了让学生进一步掌握求回归直线方程的步骤;课外思考的安排,是让学生在应用知识的同时开阔了学生视野,将课堂内涵延伸到课外.七、教后反思1.本教案的亮点是整个教学设计过程采用研究性学习方法,由学生自己去探究,去解决问题.不是生硬的抛出,而是水到渠成.例题也是变讲为练,都是学生在独立或小组讨论中解决的,很好的调动学生的积极性与主动性,提高了学生的解题能力.2.由于各校的情况不同,建议教师在使用本教案时灵活掌握,但必须在求回归直线方程的步骤上下足功夫.3.本节课的弱项是课容量大,时间所限,在课堂上没有充分暴露学生的思维过程,感觉一节课下来比较紧,学生理解不透彻,尤其是学生对回归直线的找法还存在一定的困难.bx a +,回归方程的斜率为b ,截距为其中回归方程系数公式:1.i n b bx ==∑1i nb ==∑bx a +.③利用回归方程对生活实际问题进行分析与预测.。