高中数学 变量间的相关关系教案 新人教版必修3
高中数学第二章统计2.3变量的相关性2.3.1-2.3.2变量间的相关关系两个变量的线性相关教学案新人教B版必修3
2.3.1 & 2.3.2 变量间的相关关系 两个变量的线性相关习课本P73~78,思考并完成以下问题预(1)相关关系是函数关系吗?(2)什么是正相关、负相关?与散点图有什么关系?(3)回归直线方程是什么?如何求回归系数?(4)如何判断两个变量之间是否具备相关关系?[新知初探]1.两个变量的关系分类函数关系相关关系 特征两变量关系确定两变量关系带有随机性2.散点图将样本中n 个数据点(x i ,y i )(i =1,2,…,n )描在平面直角坐标系中得到的图形. 3.正相关与负相关(1)正相关:如果一个变量的值由小变大时,另一个变量的值也由小变大,这种相关称为正相关.(2)负相关:如果一个变量的值由小变大时,另一个变量的值由大变小,这种相关称为负相关.4.最小二乘法设x ,Y 的一组观察值为(x i ,y i ),i =1,2,…,n ,且回归直线方程为y ^=a +bx ,当x 取值x i (i =1,2,…,n )时,Y 的观察值为y i ,差y i -y ^i (i =1,2,…,n )刻画了实际观察值y i 与回归直线上相应点纵坐标之间的偏离程度,通常是用离差的平方和,即Q =i =1n(y i -a-bx i)2作为总离差,并使之达到最小.这样,回归直线就是所有直线中Q取最小值的那一条.由于平方又叫二乘方,所以这种使“离差平方和最小”的方法,叫做最小二乘法.5.回归直线方程的系数计算公式回归直线方程回归系数系数a^的计算公式方程或公式y^=a^+b^x b^=∑i=1nxiyi-n x-y-∑i=1nx2i-n x2a^=y-b^x-上方加记号“^ ”的意义区分y的估计值y^与实际值ya,b上方加“^ ”表示由观察值按最小二乘法求得的估计值[小试身手]1.下列命题正确的是( )①任何两个变量都具有相关关系;②圆的周长与该圆的半径具有相关关系;③某商品的需求量与该商品的价格是一种非确定性关系;④根据散点图求得的回归直线方程可能是没有意义的;⑤两个变量间的相关关系可以通过回归直线,把非确定性问题转化为确定性问题进行研究.A.①③④B.②③④C.③④⑤D.②④⑤解析:选C ①显然不对,②是函数关系,③④⑤正确.v,u;对变量1,得散点图图10),…,1,2=i)(iy,ix(有观测数据y,x.对变量2)(由这两个散点图可以判断2.,得散点图图10),…,1,2=i)(iv,iu(有观测数据A.变量x与y正相关,u与v正相关B.变量x与y正相关,u与v负相关C .变量x 与y 负相关,u 与v 正相关D .变量x 与y 负相关,u 与v 负相关解析:选C 由这两个散点图可以判断,变量x 与y 负相关,u 与v 正相关.80,当施肥量为250+x 5=y ^归方程为的线性回(kg)y 与水稻产量(kg)x .若施肥量3kg 时,预计水稻产量约为________kg..650(kg)=250+5×80=y ^代入回归方程可得其预测值80=x 解析:把 答案:6504.对具有线性相关关系的变量x 和y ,测得一组数据如下表所示.x 2 4 5 6 8y 30 40 60 50 70若已求得它们的回直线的方程为______________________.,5=2+4+5+6+85=x 解析:由题意可知 y50.=30+40+60+50+705=即样本中心为(5,50).,a ^+x 6.5=y ^设回归直线方程为 ,)y ,x (回归直线过样本中心∵ ,7.51=a ^,即a ^+6.5×5=50∴ 17.5+x 6.5=y ^回归直线方程为∴ 17.5+x 6.5=y ^答案:相关关系的判断[典例] (1) ①正方形的边长与面积之间的关系; ②农作物的产量与施肥量之间的关系; ③人的身高与年龄之间的关系;④降雪量与交通事故的发生率之间的关系. (2)某个男孩的年龄与身高的统计数据如下表所示.年龄x (岁)123456身高y (cm)78 87 98 108 115 120①画出散点图;②判断y 与x 是否具有线性相关关系.[解析] (1)在①中,正方形的边长与面积之间的关系是函数关系;在②中,农作物的产量与施肥量之间不具有严格的函数关系,但具有相关关系;在③中,人的身高与年龄之间的关系既不是函数关系,也不是相关关系,因为人的年龄达到一定时期身高就不发生明显变化了,因而它们不具有相关关系;在④中,降雪量与交通事故的发生率之间具有相关关系.答案:②④(2)解:①散点图如图所示.②由图知,所有数据点接近一条直线排列,因此,认为y 与x 具有线性相关关系.两个变量是否相关的两种判断方法(1)根据实际经验:借助积累的经验进行分析判断.(2)利用散点图:通过散点图,观察它们的分布是否存在一定的规律,直观地进行判断.[活学活用]如图所示的两个变量不具有相关关系的是________(填序号).解析:①是确定的函数关系;②中的点大都分布在一条曲线周围;③中的点大都分布在一条直线周围;④中点的分布没有任何规律可言,x ,y 不具有相关关系.答案:①④求回归方程[典例] (1)已知变量x 与y 正相关,且由观测数据算得样本平均数x =3,y =3.5,则由该观测数据算得的线性回归方程可能是( )A.y ^=0.4x +2.3B.y ^=2x -2.4C.y ^=-2x +9.5 D.y ^=-0.3x +4.4(2)一台机器按不同的转速生产出来的某机械零件有一些会有缺点,每小时生产有缺点的零件的多少随机器的运转的速度的变化而变化,下表为抽样试验的结果:转速x (转/秒)16 14 12 8 每小时生产有缺点的零件数y (件)11985①画出散点图;②如果y 对x 有线性相关关系,请画出一条直线近似地表示这种线性关系; ③在实际生产中,若它们的近似方程为y =5170x -67,允许每小时生产的产品中有缺点的零件最多为10件,那么机器的运转速度应控制在什么范围内?[解析] (1)依题意知,相应的回归直线的斜率应为正,排除C 、D.且直线必过点(3,3.5),代入A 、B 得A 正确.答案:A(2)解:①散点图如图所示:②近似直线如图所示:秒/转14,所以机器的运转速度应控制在≤14.9x ,解得≤1067-x 5170得≤10y 由③内.求回归直线方程的步骤.)数据一般由题目给出)(n ,…,1,2=i )(i y ,i x (收集样本数据,设为(1) (2)作出散点图,确定x ,y 具有线性相关关系..i y i x ,2i x ,i y ,i x 把数据制成表格(3).iy i ∑i =1nx ,2i ∑i =1n x ,y ,x 计算(4) ⎩⎪⎨⎪⎧b ^=∑i =1nxiyi -n x y ∑i =1n x2i -n x 2,a ^=y -b ^ x .,公式为a ^,b ^代入公式计算(5).a ^+x b ^=y ^写出回归直线方程(6) [活学活用]已知变量x ,y 有如下对应数据:x 1 2 3 4 y1345(1)作出散点图;(2)用最小二乘法求关于x ,y 的回归直线方程. 解:(1)散点图如图所示.,52=1+2+3+44=x (2) y ,134=1+3+4+54=∑i=14x 39.=20+12+6+1=i y i ∑i =14x 2i ,30=16+9+4+1= b^,1310=39-4×52×13430-4×⎝ ⎛⎭⎪⎫522=a^,0=52×1310-134= .为所求的回归直线方程x 1310=y ^所以 利用线性回归方程对总体进行估计[典例x (吨)与相应的生产能耗y (吨标准煤)的几组对照数据:x 3 4 5 6 y2.5344.5(1)请画出上表数据的散点图;(2)请根据上表提供的数据,求出y 关于x 的回归直线方程y ^=b ^x +a ^;(3)已知该厂技改前100吨甲产品的生产能耗为90吨标准煤.试根据(2)求出的回归直线方程,预测生产100吨甲产品的生产能耗比技改前降低了多少吨标准煤?[解] (1)散点图如图:,3.5=2.5+3+4+4.54=y ,4.5=3+4+5+64=x (2) ∑i=14x ,66.5=6×4.5+5×4+4×3+3×2.5=i y i ∑i=14x 2i ,86=26+25+24+23= ∑i =14xiyi -4xy∑i =14x2i -4x 2=b ^所以 ,0.7=66.5-4×4.5×3.586-4×4.52=a ^0.35.=0.7×4.5-3.5=x b ^-y = 0.35.+x 0.7=y ^所以所求的线性回归方程为 ,)吨标准煤70.35(=0.35+0.7×100=y ^时,100=x 当(3) 90-70.35=19.65(吨标准煤).即生产100吨甲产品的生产能耗比技改前降低了19.65吨标准煤.只有当两个变量之间存在线性相关关系时,才能用回归直线方程对总体进行估计和预测.否则,如果两个变量之间不存在线性相关关系,即使由样本数据求出回归直线方程,用其估计和预测结果也是不可信的.[活学活用](重庆高考)随着我国经济的发展,居民的储蓄存款逐年增长.设某地区城乡居民人民币储蓄存款(年底余额)如下表:年份 2010 2011 2012 2013 2014 时间代号t 1 2 3 4 5 储蓄存款y (千亿元)567810(1)求y 关于t 的回归方程y ^=b ^t +a ^;(2)用所求回归方程预测该地区2015年(t =6)的人民币储蓄存款. 解:(1)列表计算如下:it iy it 2it i y i1 1 5 1 52 2 6 4 123 3 7 9 214 4 8 16 325 5 10 25 50 ∑153655120这里n =5,t -=1n ∑i =1n t i =155=3,y -=1n ∑i =1n y i =365=7.2.又∑i =1nt2i -n t -2=55-5×32=10,i =1n t i y i -n t-y -=120-5×3×7.2=12,从而b ^=1210=1.2,a ^=y --b ^t -=7.2-1.2×3=3.6,故所求回归方程为y ^=1.2t +3.6.(2)将t =6代入回归方程可预测该地区2015年的人民币储蓄存款为y ^=1.2×6+3.6=10.8(千亿元).[层级一 学业水平达标]1.下列变量具有相关关系的是( )A .人的体重与视力B .圆心角的大小与所对的圆弧长C .收入水平与购买能力D .人的年龄与体重解析:选C B 为确定性关系;A ,D 不具有相关关系,故选C.2.已知变量x ,y 之间具有线性相关关系,其散点图如图所示,则其回归方程可能为2+x 1.5=y ^A. 2+x 1.5=-y ^B. 2-x 1.5=y ^C. 2-x 1.5=-y ^D. 之间负相关,回归直线y ,x ,由散点图可知变量a ^+x b ^=y ^设回归方程为 B 解析:选 2.+x 1.5=-y ^,因此方程可能为>0a ^,<0b ^轴上的截距为正数,所以y 在 个样本点,n 的y 和x 是变量)n y ,n x (,…,)2y ,2x (,)1y ,1x (设3.直线l 是由这些样本点通过最小二乘法得到的线性回归直线如图所示,则以下结论正确的是( ))y ,x (过点l .直线A B .回归直线必通过散点图中的多个点C .直线l 的斜率必在(0,1)D .当n 为偶数时,分布在l 两侧的样本点的个数一定相同解析:选A A 是正确的;回归直线可以不经过散点图中的任何点,故B 错误;回归直线的斜率不确定,故C 错误;分布在l 两侧的样本点的个数不一定相同,故D 错误. 4.一项关于16艘轮船的研究中,船的吨位区间为[192,3 246](单位:吨),船员的,x 0.006 2+9.5=y ^的回归方程为x 关于吨位y 人,船员人数32~5人数 (1)若两艘船的吨位相差1 000,求船员平均相差的人数;(2)估计吨位最大的船和最小的船的船员人数.,则2x ,1x 设两艘船的吨位分别为(1)解: y^)2x 6 20.00+(9.5-1x 0.006 2+9.5=2y ^-1 =0.006 2×1 000≈6, 即船员平均相差6人.,0.006 2×192≈11+9.5=y ^时,192=x 当(2) 0.006 2×3 246≈30.+9.5=y ^时,3 246=x 当 即估计吨位最大和最小的船的船员数分别为30人和11人.[层级二 应试能力达标]1.一个口袋中有大小不等的红、黄、蓝三种颜色的小球若干个(大于5个),从中取5次,那么取出红球的次数和口袋中红球的数量是( ) A .确定性关系 B .相关关系 C .函数关系D .无任何关系 解析:选 B 每次从袋中取球取出的球是不是红球,除了和红球的个数有关外,还与球的大小等有关系,所以取出红球的次数和口袋中红球的数量是一种相关关系.,下x 80+50=y ^变化的回归直线方程为)千元(x 依劳动生产率)元(y .农民工月工资2列判断正确的是( )A .劳动生产率为1 000元时,工资为130元B .劳动生产率提高1 000元时,工资水平提高80元C .劳动生产率提高1 000元时,工资水平提高130元D .当月工资为210元时,劳动生产率为2 000元的单x ,但要注意80增加y ,1每增加x 知,x 80+50=y ^由回归直线方程 B 解析:选位是千元,y 的单位是元.3.为了解儿子身高与其父亲身高的关系,随机抽取5对父子身高数据如下:则y 对x 的线性回归方程为( )A .y =x -1B .y =x +1x 12+88=y .C176=y .D =y ,176=174+176+176+176+1785=x 计算得, C 解析:选符合.C 检验知,)y ,x (,根据回归直线经过样本中心176=175+175+176+177+17754.已知x 与y 之间的几组数据如下表:,若某同学根据上表中的前两组a ^+x b ^=y ^假设根据上表数据所得线性回归直线方程为数据(1,0)和(2,2)求得的直线方程为y =b ′x +a ′,则以下结论正确的是( )′a <a ^,′b >y ^′ B.a >a ^,′b >b ^A. ′a <a ^,′b <y ^′ D.a >a ^,′b <b ^C. 解析:选C 由(1,0),(2,2)求b ′,a ′.2.=-2×1-0=′a ,2=2-02-1=′b ,58=24+15+12+3+4+0=i y i ∑i =16x 时,a ^,b ^求 x ,136=y ,3.5= ∑i=16x 2i ,91=36+25+16+9+4+1= ,57=58-6×3.5×13691-6×3.52=b ^∴ a^,13=-52-136=×3.557-136= ′.a >a ^,′b <b ^∴ =y ^的回归方程为(cm)x 对身高(kg)y 岁的人,体重38岁到18.正常情况下,年龄在50.72x -58.2,张红同学(20岁)身高为178 cm ,她的体重应该在________ kg 左右. =y ^时,178=x 的人的体重进行预测,当178 cm 解析:用回归方程对身高为0.72×178-58.2=69.96(kg).答案:69.966.某工厂为了对新研发的一种产品进行合理定价,将该产品按事先拟定的价格进行试销,得到如下数据:________.=a ,则a +x 4=-y 由表中数据,求得线性回归方程为 ,132=4+5+6+7+8+96=x 解析: y,80=92+82+80+80+78+686=)y ,x (由回归方程过样本中心点 .a ^+1324×=-80得 106.=1324×+80=a ^即 答案:1067.对某台机器购置后的运行年限x (x =1,2,3,…)与当年利润y 的统计分析知x ,y ,估计该台机器最为划算的使用年限为x 1.3-10.47=y ^具备线性相关关系,回归方程为________年.解析:当年利润小于或等于零时应该报废该机器,当y =0时,令10.47-1.3x =0,解得x ≈8,故估计该台机器最为划算的使用年限为8年.答案:88.某个体服装店经营某种服装在某周内所获纯利y (元)与该周每天销售这种服装的件数x (件)之间有一组数据如下表:;y ,x 求(1) (2)若纯利y 与每天销售这种服装的件数x 之间是线性相关的,求回归直线方程; (3)若该店每周至少要获纯利200元,请你预测该店每天至少要销售这种服装多少件?3 487)=i y i ∑i =17x ,45 309=2i ∑i =17y ,280=2i ∑i =17x 提示:( ,6=3+4+5+6+7+8+97=x (1)解: y≈79.86.66+69+73+81+89+90+917= ,≈4.753 487-7×6×79.86280-7×62=b ^∵(2) a^,51.36=4.75×6-79.86= .x 4.75+51.36=y ^之间的回归直线方程为x 纯利与每天销售件数∴ ≈31.29.x ,所以651.3+x 4.75=200时,200=y ^当(3) 因此若该店每周至少要获纯利200元,则该店每天至少要销售这种服装32件.9.2016年元旦前夕,某市统计局统计了该市2015年10户家庭的年收入和年饮食支出的统计资料如下表:年收入x (万元)2 4 4 6 6 6 7 7 8 10年饮食 支出y(万元)0.9 1.4 1.6 2.0 2.1 1.9 1.8 2.1 2.2 2.3(2)若某家庭年收入为9万元,预测其年饮食支出.406)=2i ∑i =110x ,117.7=i y i ∑i =110x 参考数据:( 解:依题意可计算得:x,10.98=y x ,36=2x ,1.83=y ,6= ,406=2i ∑i =110x ,117.7=i y i ∑i =110x ∵又,≈0.17∑i=110xiyi -10x y ∑i =110x2i -10x 2=b ^∴ a^0.81.+x 0.17=y ^∴,0.81=x b ^-y = 1.0.8+x 0.17=y ^所求的回归方程为∴ .)万元2.34(=0.81+0.17×9=y ^时,9=x 当(2) 可估计年收入为9万元的家庭每年饮食支出约为2.34万元.(时间120分钟,满分150分)一、选择题(本大题共12小题,每小题5分,共60分.在每小题给出的四个选项中,只有一项是符合题目要求的)1.下列三个抽样:①一个城市有210家某商品的代理商,其中大型代理商有20家,中型代理商有40家,小型代理商有150家,为了掌握该商品的销售情况,要从中抽取一个容量为21的样本;②在某公司的50名工人中,依次抽取工号为5,10,15,20,25,30,35,40,45,50的10名工人进行健康检查;③某市质量检查人员从一食品生产企业生产的两箱(每箱12盒)牛奶中抽取4盒进行质量检查.则应采用的抽样方法依次为( )A .简单随机抽样;分层抽样;系统抽样B .分层抽样;简单随机抽样;系统抽样C .分层抽样;系统抽样;简单随机抽样D .系统抽样;分层抽样;简单随机抽样解析:选 C ①中商店的规模不同,所以应利用分层抽样;②中抽取的学号具有等距性,所以应是系统抽样;③中总体没有差异性,容量较小,样本容量也较小,所以应采用简单随机抽样.故选C.2.将某班的60名学生编号为01,02,…,60,采用系统抽样方法抽取一个容量为5的样本,且随机抽得的一个号码为04,则剩下的四个号码依次是( )A .09,14,19,24B .16,28,40,52C .10,16,22,28D .08,12,16,20 解析:选B 分成5组,每组12名学生,按等间距12抽取.选项B 正确.3.某学校有教师200人,男学生1 200人,女学生1 000人.现用分层抽样的方法从全体师生中抽取一个容量为n 的样本,若女学生一共抽取了80人,则n 的值为( )A .193B .192C .191D .190 192.=n ,求得80=n200+1 200+1 0001 000× B 解析:选 4.某商品销售量y (件)与销售价格x (元/件)负相关,则其回归方程可能是( )200+x 10=y ^200 B.+x 10=-y ^A. 200-x 10=y ^200 D.-x 10=-y ^C. 解析:选A 由于销售量y 与销售价格x 成负相关,故排除B ,D.又因为销售价格x >0,则C 中销售量全小于0,不符合题意,故选A.,则y 和x ,它们的平均数分别是n y ,…,2y ,1y 与n x ,…,2x ,1x .设有两组数据5)(的平均数是1+n y 3-n x 2,…,1+2y 3-2x 1,2+1y 3-1x 2新的一组数据 y 3-x 2.A 1+y 3-x 2.By 9-x 4.C1+y 9-x 4.D ,)n ,…,1,2=i 1(+i y 3-i x 2=i z 设 B 解析:选 =⎝ ⎛⎭⎪⎫1+1+…+1n +)n y +…+2y +1y (3n -)n x +…+2x +1x (2n =)n z +…+2z +1z (1n =z 则 1.+y 3-x 2 6.有一个容量为66的样本,数据的分组及各组的频数如下:[11.5,15.5) 2 [15.5,19.5) 4 [19.5,23.5) 9 [23.5,27.5) 18 [27.5,31.5) 11 [31.5,35.5) 12[35.5,39.5) 7 [39.5,43.5) 3则总体中大于或等于31.5的数据所占比例约为( )211A.13B. 12C.23D. 解析:选B 由题意知,样本的容量为66,而落在[31.5,43.5)内的样本个数为12+7.13=2266的数据约占31.5,故总体中大于或等于22=3+ 7.某学习小组在一次数学测验中,得100分的有1人,得95分的有1人,得90分的有2人,得85分的有4人,得80分和75分的各有1人,则该小组数学成绩的平均数、众数、中位数分别是( )A .85,85,85B .87,85,86C .87,85,85D .87,85,90 解析:选C ∵得85分的人数最多为4人,∴众数为85,中位数为85,87.=75)+80+85×4+90×2+95+(100110平均数为 8.某出租汽车公司为了了解本公司司机的交通违章情况,随机调查了50名司机,得到了他们某月交通违章次数的数据,结果制成了如图所示的统计图,根据此统计图可得这50名出租车司机该月平均违章的次数为( )A .1B .1.8C .2.4D .3 1.8.=5×0+20×1+10×2+10×3+5×450B 解析:选 9.下表是某厂1~4月份用水量情况(单位:百吨)的一组数据月份x 1 2 3 4用水量y 4.5 4 3 2.5的a ,则a +x 0.7=-y 之间具有线性相关关系,其线性回归方程为x 与月份y 用水量值为( )A .5.25B .5C .2.5D .3.5 解析:选A 线性回归方程经过样本的中心点,根据数据可得样本中心点为(2.5,3.5),所以a =5.25.10.如图是在元旦晚会举办的挑战主持人大赛上,七位评委为某选手打出的分数的茎叶统计图,去掉一个最高分和一个最低分后,所剩数据的平均数和方差分别为( )A .84,4.84B .84,1.6C .85,1.2D .85,4 +5+6+3+(515+80,平均数为77,去掉一个最低分95去掉一个最高分 C 解析:选,因此1.2=]286)-(85+285)-(85+286)-(85+283)-(85+285)-[(8515,方差为85=6)选C.,…,2+2x 2,3+1x 3,则2s ,方差是x 的平均数是n x ,…,3x ,2x ,1x .如果数据11)(的平均数和方差分别是2+n x 32s 和x A.2s 9和x 3.B2s 9和2+x 3.C4+2s 12和2+x 3.D nx …,2x ,1x ,由于数据2+x 3的平均数是2+n x 3,…,2+2x 2,3+1x 3 C 解析:选.2s 9的方差为2+n x 3,…,2+2x 2,3+1x 3,所以2s 的方差为 12.如图是某赛季甲、乙两名篮球运动员5场比赛得分的茎叶图,已知甲的成绩的极差为31,乙的成绩的平均值为24,则下列结论错误的是( ) A .x =9 B .y =8C .乙的成绩的中位数为26D .乙的成绩的方差小于甲的成绩的方差解析:选B 因为甲的成绩的极差为31,所以其最高成绩为39,所以x =9;因为乙的成绩的平均值为24,所以y =24×5-(12+25+26+31)-20=6;由茎叶图知乙的成绩的中位数为26;对比甲、乙的成绩分布发现,乙的成绩比较集中,故其方差较小. 二、填空题(本大题共4小题,每小题5分,共20分,把答案填在题中横线上) 13.某人5次上班途中所花的时间(单位:分钟)分别为x ,y,10,11,9.已知这组数据的平均数为10,方差为2,则|x -y |的值为________.∴,2;又方差为20=y +x ,则10=159)×+11+10+y +x (,得10解析:由平均数为=xy 208,2=2y +2x ,得2=15]×210)-(9+210)-(11+210)-(10+210)-y (+210)-x [( 4.=x2+y2-2xy =x -y 2=|y -x |∴,192 答案:414.一支田径队有男运动员48人,女运动员36人,若用分层抽样的方法从该队的全体运动员中抽取一个容量为21的样本,则抽取男运动员的人数为________.12.=×482148+36解析:抽取的男运动员的人数为 答案:1215.要考察某种品牌的500颗种子的发芽率,抽取60粒进行实验,利用随机数表抽取种子时,先将500颗种子按001,002,…,500进行编号,如果从随机数表第7行第8列的数3开始向右读,请你依次写出最先检测的5颗种子的编号:________,________,________,________,________.(下面摘取了随机数表第7行至第9行)59408 66368 36016 26247 25965 49487 26968 86021 77681 83458 21540 62651 69424 78197 20643 67297 76413 66306 51671 54964 87683 30372 39469 97434解析:以3开始向右读,每次读取三位,重复和不在范围内的不读,依次为368,360,162,494,021.答案:368,360,162,494,02116.从某小学随机抽取100名同学,将他们的身高(单位:cm)数据绘制成频率分布直方图(如下图).由图中数据可知a =________.若要从身高在[120,130),[130,140),[140,150]三组的学生中,用分层抽样的方法选取18人参加一项活动,则从身高在[140,150]的学生中选取的人数应为________.解析:∵0.005×10+0.035×10+a ×10+0.020×10+0.010×10=1,∴a =0.030.设身高在[120,130),[130,140),[140,150]三组的学生分别有x ,y ,z 人,10.=z ,20=y 同理,30.=x ,解得0.030×10=x100则3.=×181030+20+10的学生中选取的人数为[140,150]故从 答案:0.030 3三、解答题(本大题共6小题,共70分.解答应写出文字说明,证明过程或演算步骤) ,应如何110名学生中抽取50为调查某班学生的平均身高,从)分10本小题满分(.17抽样?若知道男生、女生的身高显著不同(男生30人,女生20人),应如何抽样? 抽签法或随机数(人,采用简单随机抽样法5,即抽取110名学生中抽取50解:从法).若知道男生、女生的身高显著不同,则采用分层抽样法,按照男生与女生的人数比为30∶20=3∶2进行抽样,则男生抽取3人,女生抽取2人.18.(本小题满分12分)某车间共有12名工人,随机抽取6名,他们某日加工零件个数的茎叶图如图所示. (1)根据茎叶图计算样本均值;(2)日加工零件个数大于样本均值的工人为优秀工人.根据茎叶图推断该车间12名工人中有几名优秀工人?22.=1326=17+19+20+21+25+306样本均值为1)(解: 4=1312×名工人中有12,故推断该车间13=26知样本中优秀工人所占比例为(1)由(2)名优秀工人.19.(本小题满分12分)2016年春节前,有超过20万名广西、四川等省籍的外出务工人员选择驾乘摩托车沿321国道长途跋涉返乡过年,为防止摩托车驾驶人员因长途疲劳驾驶,手脚僵硬影响驾驶操作而引发交通事故,肇庆市公安交警部门在321国道沿线设立了多个长途行驶摩托车驾乘人员休息站,让返乡过年的摩托车驾乘人员有一个停车休息的场所.交警小李在某休息站连续5天对进站休息的驾驶人员每隔50辆摩托车就进行一次省籍询问,询问结果如图所示:(1)交警小李对进站休息的驾驶人员的省籍询问采用的是什么抽样方法?(2)用分层抽样的方法对被询问了省籍的驾驶人员进行抽样,若广西籍的有5人,则四川籍的应抽取几人?解:(1)交警小李对进站休息的驾驶人员的省籍询问采用的是系统抽样法.(2)从题图可知,被询问了省籍的驾驶人员广西籍的有5+20+25+20+30=100(人);四川籍的有15+10+5+5+5=40(人).2,即四川籍的应抽取2=x ,解得x40=5100人,依题意得x 设四川籍的驾驶人员应抽取人.20.(本小题满分12分)某化肥厂有甲、乙两个车间包装肥料,在自动包装传送带上每隔30分钟抽取一包产品,称其重量(单位:kg),分别记录抽查数据如下:甲:102,101,99,98,103,98,99; 乙:110,115,90,85,75,115,110.(1)这种抽样方法是哪一种方法?(2)试计算甲、乙车间产品重量的平均数与方差,并说明哪个车间产品较稳定?解:(1)甲、乙两组数据间隔相同,所以采用的方法是系统抽样.,100=99)+98+103+98+99+101+(10217=甲x (2) x,100=110)+115+75+85+90+115+(11017=乙 ,1)≈3.43+4+9+4+1+1+(417=2甲s ,228.57=100)+225+625+225+100+225+(10017=2乙s ,故甲车间产品比较稳定.2乙s <2甲s ∴ 21.(本小题满分12分)对某校高一年级学生参加社区服务次数进行统计,随机抽取M 名学生作为样本,得到这M 名学生参加社区服务的次数.根据此数据作出了频数与频率的统计表和频率分布直方图如下:分组频数 频率[10,15) 10 0.25[15,20) 25n [20,25) mp[25,30] 20.05 合计M1(1)求出表中M ,p 及图中a 的值;(2)若该校高一学生有360人,试估计该校高一学生参加社区服务的次数在区间[10,15)的人数.解:(1)由分组[10,15)的频数是10, 40.=M ,所以0.25=10M知,0.25频率是 因为频数之和为40,所以10+25+m +2=40,解得m =3.0.075.=340=p 故 因为a 是对应分组[15,20)的频率与组距的商,125.0.=2540×5=a 所以 (2)因为该校高一学生有360人,分组[10,15)的频率是0.25,所以估计该校高一学生参加社区服务的次数在此区间内的人数为360×0.25=90.22.(本小题满分12分)从某居民区随机抽取10个家庭,获得第i 个家庭的月收入iy i ∑i =110x ,20=i ∑i =110y ,80=i ∑i =110x 的数据资料,算得)单位:千元(i y 与月储蓄)单位:千元(i x 720.=2i ∑i =110x ,184= ;a ^+xb ^=y ^的线性回归方程x 对月收入y 求家庭的月储蓄(1) (2)判断变量x 与y 之间是正相关还是负相关;(3)若该居民区某家庭月收入为7千元,预测该家庭的月储蓄.,8=8010=i ∑i =1n x 1n =x ,10=n 由题意知(1)解: y ,2=2010=i ∑i =1n y 1n = ,80=210×8-720=2x 10-2i ∑i =110x 又 ∑i=110x ,24=10×8×2-184=y x 10-i y i ,0.3=2480=∑i =110xiyi -10x y∑i =110x2i -10x 2=b ^由此得 a^,0.4=-0.3×8-2=x b ^-y = 0.4.-x 0.3=y ^故所求回归方程为 (2)由于变量y 的值随x 的值增加而增加(b =0.3>0),故x 与y 之间是正相关.(3)将x =7代入回归方程可以预测该家庭的月储蓄为y =0.3×7-0.4=1.7千元.。
高中数学23变量间的相关关系一二全册精品教案新人教A版必修3教案
高中数学23变量间的相关关系一二全册精品教案新人教A版必修3教案教案名称:高中数学23变量间的相关关系一、二全册精品教案教材版本:新人教A版必修3教学目标:1.掌握变量之间的相关关系的概念;2.理解相关系数的含义和计算方法;3.能够应用相关关系解决实际问题;4.培养学生分析和解决问题的能力。
教学重点:1.相关系数的计算方法;2.相关关系的实际应用。
教学难点:1.相关系数的计算和解释;2.相关关系在实际问题中的应用。
教学准备:1.教师准备板书工具,包括黑板、彩色粉笔等;2.教师准备教学用具,如教学课件、实验仪器等。
教学过程:第一课时:1.导入(5分钟)教师通过引入相关关系在日常生活中的例子,引起学生的思考和兴趣,如“你有没有觉得吃得越多睡得越香?”、“你觉得天气越热人们购买冷饮的数量会有什么变化?”等。
2.引入(10分钟)教师通过示意图和简单的计算,引导学生理解变量之间的相关关系,并介绍相关系数的定义和计算方法。
3.基础知识讲解(25分钟)3.1相关系数的含义和计算方法:教师通过示例和公式解释相关系数的含义和计算方法,让学生掌握相关系数的计算公式。
3.2相关系数的性质和意义:教师讲解相关系数的性质和意义,引导学生理解相关系数与变量之间的线性关系程度的关系。
4.练习(10分钟)教师布置一些相关系数的计算练习题,让学生进行个人或小组练习。
第二课时:5.复习(5分钟)回顾上节课学习的内容,教师提问学生相关系数的计算方法及其含义,并解答学生疑惑。
6.拓展(15分钟)6.1相关系数的解读:教师通过实例和图表解释如何解读相关系数的大小和正负号。
6.2相关系数的应用:教师介绍相关系数在实际问题中的应用,如市场调研、经济预测等。
7.实验(20分钟)教师组织学生进行相关系数实验,通过观察和数据统计,让学生进一步理解相关系数的计算方法和含义。
8.总结归纳(10分钟)教师引导学生总结相关系数的计算方法、含义和应用,并与学生一起完成相关关系的概念思维导图。
高中数学 2.3变量间的相关关系教案 新人教A版必修3
高一数学必修3导学案(教师版)〖复习回顾〗标准差的公式为:______________________________________________________〖创设情境〗1、函数是研究两个变量之间的依存关系的一种数量形式.对于两个变量,如果当一个变量的取值一定时,另一个变量的取值被惟一确定,则这两个变量之间的关系就是一个函数关系2、在中学校园里,有这样一种说法:“如果你的数学成绩好,那么你的物理学习就不会有什么大问题。
”按照这种说法,似乎学生的物理成绩与数学成绩之间存在着某种关系,我们把数学成绩和物理成绩看成是两个变量,那么这两个变量之间的关系是函数关系吗?3、“名师出高徒”可以解释为教师的水平越高,学生的水平就越高,那么学生的学业成绩与教师的教学水平之间的关系是函数关系吗?〖新知探究〗思考:考察下列问题中两个变量之间的关系:(1)商品销售收入与广告支出经费;(2)粮食产量与施肥量;(3)人体内的脂肪含量与年龄.这些问题中两个变量之间的关系是函数关系吗?一、相关关系:自变量取值一定时,因变量的取值带有一定随机性的两个变量之间的关系,叫做相关关系。
【说明】函数关系是一种非常确定的关系,而相关关系是一种非确定性关系。
思考探究:1、有关法律规定,香烟盒上必须印上“吸烟有害健康”的警示语。
吸烟是否一定会引起健康问题?你认为“健康问题不一定是由吸烟引起的,所以可以吸烟”的说法对吗?2、某地区的环境条件适合天鹅栖息繁衍,有人经统计发现了一个有趣的现象,如果村庄附近栖息的天鹅多,那么这个村庄的婴儿出生率也高,天鹅少的地方婴儿出生率低,于是他得出了一个结论:天鹅能够带来孩子。
你认为这样的结论可靠吗?如何证明这个问题的可靠性?分析:(1)吸烟只是影响健康的一个因素,对健康的影响还有其他的一些因素,两者之间非函数关系即非因果关系;(2)不对,这也是相关关系而不是函数关系。
上面提到了很多相关关系,那它们之间的相关关系强还是弱?我们下面来研究一下。
高中数学人教A版必修3《2.3.1变量间的相关关系》教案4
必修三 2.3.1 变量间的相关关系教学目标1、知识与技能(1)了解变量之间的相关关系。
(2)会区别变量之间的函数关系与变量相关关系。
(3)会举例说明现实生活中变量之间的相关关系。
(4)让学生了解产生变量之间的相关关系是由许多不确定的随机因素的影响。
2、过程与方法(1)通过复习变量之间的函数关系引出变量相关关系,有熟悉到生疏的过程便于学生理解。
(2)通过对变量之间的关系的学习让学生了解从总的变化趋势来看变量之间存在某种关系,但这种关系又不能用确定的函数关系精确表达出来,也让学生了解变量之间的不确定性关系是很普遍的,帮助学生树立科学的辨证唯物主义观点,感受自然的辩证法。
(3)通过对本课的学习,引导学生关注社会,关注生活,进一步学会观察、比较、归纳、分析等一般方法的运用。
3、情感、态度与价值观(1)通过引导学生观察生活中的例子,使学生由能直接找出变量之间的函数关系引出到无法直接找出变量之间的函数关系,即变量之间的相关关系,激发学生的求知欲。
(2)通过引导学生感受生活中实际问题转化为数学问题,学会查找资料,收取信息,学会用统计知识对实际问题进行数学分析。
教学重点1、变量之间的相关关系。
2、会区别变量之间的函数关系与变量相关关系。
3、会举例说明现实生活中变量之间的相关关系。
教学难点1、对变量之间的相关关系的理解。
2、变量之间的函数关系与变量相关关系的区别。
教辅手段教学过程一、情景设置问题1:将汽油以均匀的速度注入桶里,注入的时间t与注入的油量y的关系如下表:从表里数据得出油量y与时间t之间的函数关系式为:问题2、甲、乙两地相距150千米,某人骑车从甲地到乙地,则他的速度v(千米/时)和时间t(小时)的函数大致图象是怎样的?问题3、小麦的产量y千克每亩与施肥量x千克每亩之间的关系如下表:从表里数据能得出小麦的产量y与施肥量x之间的函数关系式吗?提问学生以下三个问题。
问题1:因为是以均匀的速度注入桶里,所以注入的油量y与注入的时间t成正比例关系,由数据表格知,注入的油量y与注入的时间t之间的函数关系式为y=2t(t 0)(实际问题,因此自变量的取值范围应该有意义)问题2:路程一定,所以走完全程所用的时间t与速度v成反比例关系所以其函数图象是反例函数图象。
必修3教案变量间的相关关系
2.3.1变量间的相关关系教材分析《变量间的相关关系》自于高中教材新课程人教A版必修3第二章第三节,本章我们所要学习的主要内容就是统计,在前面的章节中我们已经对统计的相关知识作了大致的了解.本节课我们要继续探讨的是变量之间的相关关系,教科书通过思考栏目“物理成绩与数学成绩之间的关系”,引导学生考察变量之间的关系.在教师的引导下,可使学生认识到在现实世界中存在不能用函数模型描述的变量关系,从而体会研究变量之间的相关关系的重要性.它为接下来要学习的两个变量的线性相关打下基础.这是一个与现实实际生活联系很紧密的知识,在教师的引导下,可使学生认识到在现实世界中存在不能用函数模型描述的变量关系,,从而体会研究变量之间的相关关系的重要性.课时分配变量间的相关关系设计1课时教学目标重点:认识两个变量间的相关关系.难点: 对相关关系的理解以及与函数关系的对比.知识点:相关关系的定义、与函数关系的对比以及相关关系在生活中例子及简单应用.教育点:通过对相关关系的学习培养学生收集数据,利用数据分析指导决策的能力.自主探究点:两变量间的相关关系与函数关系的区别于联系.考试点: 两变量间的相关关系在生活中的应用举例.易错易混点: 两变量间的相关关系与函数关系的区别.拓展点:相关关系的分类.教具准备多媒体课件三角板圆规课堂模式学案导学单元组的自主合作与探究一、引入新课:情景:在学校里,老师对学生经常这样说:“如果你的数学成绩好,那么你的物理学习就不会有什么大问题.”按照这种说法,似乎学生的物理成绩与数学成绩之间存在着一种相关关系.这种说法有没有根据呢?【师生活动】我们可以发现自己的数学成绩和物理成绩存在某种关系.(似乎就是数学好的,物理也好;数学差的,物理也差,但又不全对.)物理成绩和数学成绩是两个变量,从经验看,由于物理学习要用到比较多的数学知识和数学方法.数学成绩的高低对物理成绩的高低是有一定影响的.但决非唯一因素,还有其他因素,如是否喜欢物理,用在物理学习上的时间等等.总结:不能通过一个人的数学成绩是多少就准确地断定他的物理成绩能达到多少.但这两个变量是有一定关系的,它们之间是一种不确定性的关系.如何通过数学成绩的结果对物理成绩进行合理估计有非常重要的现实意义.【设计意图】数学来源于生活,通过实例分析,引导学生认识到生活中的变量之间除了存在确定的函数关系之外还存在着不确定的相关关系,这种关系是如何定义的,有什么特点呢?与函数关系又有什么区别和联系呢?为引入新课打下铺垫.二、探究新知思考1:考察下列问题中两个变量之间的关系,想一想这些问题中两个变量之间的关系是函数关系吗?(1)商品销售收入与广告支出经费;(2)粮食产量与施肥量;(3)人体内的脂肪含量与年龄.思考2: “名师出高徒”可以解释为教师的水平越高,学生的水平越高,那么学生的学业成绩与教师的教学水平之间的关系是函数关系吗?你能举出类似的描述生活中两个变量之间的这种关系的成语吗?思考3:上述两个变量之间的关系是一种非确定性关系,称之为相关关系,你能说出相关关系的含义吗? 【师生活动】在教师的引导下,学生以单元组为单位,经过自主探究、小组讨论的形式完成对以上三个思考的分析,各小组得出初步的结论,最后教师加以点评,形成共识. (一)相关关系的概念定义:如果两个变量中一个变量的取值一定时,另一个变量的取值带有一定的随机性,那么这两个变量之间的关系叫相关关系.请同学们回忆一下,我们以前是否学过变量间的关系呢?它的定义是什么?函数:设A ,B 是非空的数集,如果按照某种对应关系f ,使对于集合A 中的任意一个数x ,在集合B 中都有唯一的数()f x 和它对应,那么称:f A B 为从集合A 到集合B 的一个函数.(二)相关关系与函数关系的异同点相同点:两者均是指两个变量之间的关系.不同点:(1) 函数关系是一种确定的关系;相关关系是一种非确定的关系.事实上,函数关系是两个非随机变量之间的关系,而相关关系是随机变量与随机变量之间的关系.(2) 函数关系是一种因果关系,而相关关系不一定是因果关系,也可能是伴随关系. 问题1 调查一下本组成员的视力与各自的学习成绩关系. 问题2 调查一下本组成员的身高与各自的体重之间的关系. 让各组的同学共同探究一下,然后将结果宣布一下.问题1 通过对本组所有的成员的调查,我们得到的结论是: 学习成绩好的视力都不太好,都配了近视眼镜.但是,这个结论对全班来说就不一定成立,人的视力还与用眼卫生习惯、遗传因素等密切关系.问题2身材高的同学的体重一般来说都比较重要,但是,人的体重还与饮食习惯、遗传因素等有密切关系. 【设计意图】学生结合思考1至3的实例和函数定义自己先归纳相关关系的特点,然后教师再加以点拨,接着形成可操作性结论,最后通过两个问题加深对相关关系的理解,这充分体现出学生的主体性地位. (三)相关关系的判断思考4:如何判断两个变量之间有没有相关关系呢?【师生活动】教师引导: 在现实生活中存在着大量的相关关系,如何判断和描述相关关系,统计学发挥着非常重要的作用,变量之间的相关关系带有不确定性,这需要通过惧大量的数据,对数据进行统计分析,发现规律,才能作出科学的判断.对具有相关关系的两个变量进行统计分析的方法叫回归分析.思考5: 图中的两个变量是相关关系的是 ( )A .①②B .①③C .②④D.②③学生观察题中的四个图形,分析变量之间的关系,单元组内讨论后给出答案.说明:在这里引导学生得出可以在平面直角坐标系中通过描点的方法寻找两个变量之间的关系,在本节先不给出散点图的定义.师生探究:通过分析可知图①反映的两个变量间的函数关系;图②和图③反映的是两个变量间的相关关系;图④反映的两个变量不具有相关关系.故答案为D.知识拓展:分析图②和图③可知,它们所显示的虽然都是相关关系,但有所不同, 图②的点大致分布在一条直线附近, 图③的点大致分布在一条曲线附近.故可将相关关系分成两类⎧⎨⎩②线性相关(图相关关系非)③相(图)线性关【设计意图】通过具体的例子对知识展开分析和拓展,符合学生的认知发展规律;同时也为下节课学习线性相关的有关知识做好铺垫.三、理解新知对于两个变量间的相关关系引导学生通过具体事例和与函数关系的对比加深对本节知识的理解,最后辅以相关题目予以加深.四、运用新知随堂练习1.以下关于相关关系的说法正确的个数是()①相关关系是函数关系②函数关系是相关关系③线性相关关系是一次函数关系④相关关系有两种,分别是线性相关关系和非线性相关关系A.0B.1 C.2D.32.下列关系属于线性负相关的是()A.父母的身高与子女身高的关系B.农作物产量与施肥量的关系C.吸烟与健康的关系D.数学成绩与物理成绩的关系3.对于给定的两个变量的统计数据,下列说法正确的是()A.都可以分析出两个变量的关系B.都可以用一条直线近似地表示两者的关系C.都可以在平面直角坐标系中以坐标的形式描出它们D.都可以用确定的表达式表示两者的关系4.下列两个变量之间的关系具有相关关系的是()A.家庭的支出与收入B.某家庭用电量与水价间的关系C.单位圆中角的度数与其所对孤长D.正方形的周长与其边长5.如图所示,有5组(x,y)数据去掉哪一组数据之后,剩下的4组数据成线性相关关系()A.EB.DC.BD.A6.有下列关系:①人的年龄与其拥有的财富之间的关系;②曲线上的点与该点的坐标之间的关系;③苹果的产量与气候之间的关系;④森林中的同一树木,其横截面直径与高度之间的关系;⑤学生与其学号之间的关系.其中具有相关关系的是________.7.下列关系中,是带有随机性相关关系的是.①正方形的边长与面积的关系;②水稻产量与施肥量之间的关系;③人的身高与年龄之间的关系;④降雪量与交通事故发生之间的关系.8.据两个变量x,y之间的观测数据,在平面直角坐标系中描出它们的坐标,这两个变量是否具有线性相关关系(答是与否)__________.答案: 1.B 2.C 3.C 4 .A 5.B 6.①③④ 7. ②③④ 8.否【设计意图】通过随堂练习及时巩固,加深学生对本节内容的理解.五、课堂小结引导学生归纳本课时的主要学习内容,交流成果,教师帮助完善.1、通过具体事例理解变量之间的相关关系是不确定的关系.2、体会变量之间的函数关系与变量相关关系的区别.3、学会全面考察现实生活中变量之间的相关关系,体会统计的数学思想.【设计意图】让学生自己归纳本节课所学内容,在知识、方法和思想层面再次深化和提升.六、布置作业书面作业P习题A组 1.必做题:课本94P 1,3.选做题:自主学习丛书45课外作业搜集生活中具有相关关系的具体实例3至5个.七、教后反思把数学知识与生活实际相联系,再用生动形象的语言将它们表述出来,使学生能更好地理解掌握数学知识,感受数学的趣味和作用,从而对数学产生亲切感.在课堂上,把生活中的例子引进数学课堂,让学生更多地自主参与观察、研究、思考、讨论,可以说,这样的课堂教学抓住了学生的心,自然就能更好地提高课堂效率.。
人教版高中数学必修三学案设计:2.3变量间的相关关系导学案设计(教师用)
课题: 变量的相关关系 课时:第1课时【学习目标】1.正确作出关于两个变量统计数据的散点图,并利用散点图判断两个变量之间是否具有相关关系.2.理解两个变量之间的线性相关,回归直线方程的推导.3.理解回归分析实际上是将非确定性的相关关系问题转化成确定性的函数关系进行研究.,4.能准确求得回归方程并能利用回归方程对两个变量间的相关关系进行估计.第一环节:导入学习(激情导入)1.两个变量的线性相关 (1)正相关在散点图中,点散布在从左下角到右上角的区域,对于两个变量的这种相关关系,我们将它称为正相关. (2)负相关在散点图中,点散布在从左上角到右下角的区域,两个变量的这种相关关系称为负相关. (3)线性相关关系、回归直线如果散点图中点的分布从整体上看大致在一条直线附近,就称这两个变量之间具有线性相关关系,这条直线叫做回归直线. 2.回归方程 (1)最小二乘法求回归直线,使得样本数据的点到它的距离的平方和最小的方法叫做最小二乘法. (2)回归方程方程y ^=b ^x +a ^是两个具有线性相关关系的变量的一组数据(x 1,y 1),(x 2,y 2),…,(x n ,y n )的回归方程,其中a ^,b ^是待定参数.⎩⎨⎧b ^=∑ni =1(x i -x )(y i -y )∑n i =1(x i-x )2=∑ni =1x i y i -n x y ∑ni =1x 2i -n x2,a ^=y -b ^x .3.回归分析(1)定义:对具有相关关系的两个变量进行统计分析的一种常用方法.(2)样本点的中心对于一组具有线性相关关系的数据(x 1,y 1),(x 2,y 2),…,(x n ,y n ),其中(x ,y )称为样本点的中心. (3)相关系数当r >0时,表明两个变量正相关; 当r <0时,表明两个变量负相关.r 的绝对值越接近于1,表明两个变量的线性相关性越强.r 的绝对值越接近于0,表明两个变量之间几乎不存在线性相关关系.通常|r |大于0.75时,认为两个变量有很强的线性相关性.第二环节:自主学习(知识点以题的形式呈现)(一)基础学习(本课需要掌握的基础知识)1判断下面结论是否正确(请在括号中打“√”或“×”)(1)相关关系与函数关系都是一种确定性的关系,也是一种因果关系.( × ) (2)“名师出高徒”可以解释为教师的教学水平与学生的水平成正相关关系.( √ ) (3)只有两个变量有相关关系,所得到的回归模型才有预测价值.( √ )(4)某同学研究卖出的热饮杯数y 与气温x (℃)之间的关系,得回归方程y ^=-2.352x +147.767,则气温为2℃时,一定可卖出143杯热饮.( × )2.已知变量x 和y 满足关系y ^=-0.1x +1,变量y 与z 正相关.下列结论中正确的是( C ) A.x 与y 正相关,x 与z 负相关 B.x 与y 正相关,x 与z 正相关 C.x 与y 负相关,x 与z 负相关 D.x 与y 负相关,x 与z 正相关3.试从下面四个图中的点在散点图上的分布状态,直观上初步判断两个变量之间有线性相关关系的是( C )4.四名同学根据各自的样本数据研究变量x ,y 之间的相关关系,并求得回归直线方程,分别得到以下四个结论:①y 与x 负相关且y ^=2.347x -6.423;②y 与x 负相关且y ^=-3.476x +5.648; ③y 与x 正相关且y ^=5.437x +8.493;④y 与x 正相关且y ^=-4.326x -4.578. 其中一定不正确的结论的序号是( D ) A .①② B .②③ C .③④D .①④5.为了解儿子身高与其父亲身高的关系,随机抽取5对父子身高数据如下:父亲身高x(cm) 174 176 176 176 178 儿子身高y(cm)175175176177177则y 对x 的线性回归方程为( C ) A .y =x -1 B .y =x +1 C .y =88+12xD .y =1765.C 计算得,x =174+176+176+176+1785=176,y =175+175+176+177+1775=176,根据回归直线经过样本中心(x ,y )检验知,C符合.(二)深入学习(需掌握的知识转化成能力——知识运用)某车间为了制定工时定额,需要确定加工零件所花费的时间,为此做了四次试验,得到的数据如下:零件的个数x (个) 2 3 4 5 加工的时间y (小时)2.5344.5(1)在给定的坐标系中画出表中数据的散点图;(2)求出y 关于x 的线性回归方程y ^=b ^x +a ^,并在坐标系中画出回归直线;(3)试预测加工10个零件需要多少小时?(注:b ^=∑i =1nx i y i -n x y∑i =1nx 2i -n x2,a ^=y -b ^x )解 (1)散点图如图.(2)由表中数据得:∑i =14x i y i =52.5,x =3.5,y=3.5,∑i =14x 2i =54,∴b ^=0.7,∴a ^=1.05,∴y ^=0.7x +1.05,回归直线如图所示.(3)将x =10代入线性回归方程, 得y ^=0.7×10+1.05=8.05,故预测加工10个零件约需要8.05小时.第三环节:互助学习 第四环节:展示学习第五环节:精讲学习(学生对应的是反思学习)。
高中数学人教A版必修三2.3.1教学设计《变量之间的相关关系》
变量之间的相关关系1.知识与技能(1)通过收集现实问题中两个有关联变量的数据认识变量间的相关关系和函数关系。
(2)明确事物间的相互联系,认识现实生活中变量间除了存在确定的关系外,仍存在大量的非确定性的相关关系并利用散点图直观体会这种相关关系。
(3)通过实例体会并利用散点图直观体会相关关系,了解正相关,负相关。
2.过程与方法通过对现实生活的探究,感知应用数学知识解决问题的方法,理解数形结合的数学思想和逻辑推理的数学方法。
3.情感态度与价值观通过对样本分析和总体估计的过程,感受数学对实际生活的需要,认识到数学知识源于生活并指导生活的事实,体会数学知识与现实世界的联系。
【教学重点】会画散点图,利用散点图直观认识两个变量之间的线性关系。
【教学难点】会画散点图,利用散点图直观认识两个变量之间的线性关系。
(一)新课导入在学校里,老师对学生经常这样说:“如果你的数学成绩好,那么你的物理学习就不会有什么大问题。
”按照这种说法,似乎学生的物理成绩与数学成绩之间存在着某种关系,显然,这种关系不能用我们熟悉的函数关系来描述,那么这究竟是一种什么关系?下面我们共同来研究。
(二)新课讲授(1)两变量之间的关系①函数关系:当自变量取值一定时,因变量取值由它唯一确定;例:正方形面积S与其边长x之间的函数关系S=x2 ,对自变量边长的每一个确定值,都有唯一确定的面积的值与之对应。
(确定关系)②相关关系:当自变量取值一定时,因变量的取值带有一定的随机性;例:一块农田的水稻产量与施肥量之间的关系。
水稻产量并不是由施肥量唯一确定,在取值上带有随机性。
(不确定关系)思考1:当一个变量的取值一定时,另一个变量的取值被唯一确定,则这两个变量之间是怎样的关系?考察下列问题中两个变量之间是什么关系?为什么?(1)商品销售收入与广告支出经费;(2)粮食产量与施肥量;(3)人体内的脂肪含量与年龄。
答:当一个变量的取值一定时,另一个变量的取值被唯一确定,这两个变量是一个函数关系。
高中数学(23变量间的相关关系)教案设计 新人教A版必修3 教案
2.3 变量间的相关关系2.3.1 变量之间的相关关系2.3.2 两个变量的线性相关整体设计教学分析变量之间的关系是人们感兴趣的问题.教科书通过思考栏目“物理成绩与数学成绩之间的关系”,引导学生考察变量之间的关系.在教师的引导下,可使学生认识到在现实世界中存在不能用函数模型描述的变量关系,从而体会研究变量之间的相关关系的重要性.随后,通过探究人体脂肪百分比和年龄之间的关系,引入描述两个变量之间关系的线性回归方程(模型).教科书在探索用多种方法确定线性回归直线的过程中,向学生展示创造性思维的过程,帮助学生理解最小二乘法的思想.通过气温与饮料销售量的例子及随后的思考,使学生了解利用线性回归方程解决实际问题的全过程,体会线性回归方程作出的预测结果的随机性,并且可能犯的错误.进一步,教师可以利用计算机模拟和多媒体技术,直观形象地展示预测结果的随机性和规律性.三维目标1.通过收集现实问题中两个有关联变量的数据认识变量间的相关关系.2.明确事物间的相互联系.认识现实生活中变量间除了存在确定的关系外,仍存在大量的非确定性的相关关系,并利用散点图直观体会这种相关关系.3.经历用不同估算方法描述两个变量线性相关的过程.知道最小二乘法的思想,能根据给出的线性回归方程的系数公式建立线性回归方程.重点难点教学重点:通过收集现实问题中两个有关联变量的数据直观认识变量间的相关关系;利用散点图直观认识两个变量之间的线性关系;根据给出的线性回归方程的系数公式建立线性回归方程.教学难点:变量之间相关关系的理解;作散点图和理解两个变量的正相关和负相关;理解最小二乘法的思想. 课时安排2课时教学过程第1课时导入新课思路1在学校里,老师对学生经常这样说:“如果你的数学成绩好,那么你的物理学习就不会有什么大问题.”按照这种说法,似乎学生的物理成绩与数学成绩之间存在着一种相关关系.这种说法有没有根据呢?请同学们如实填写下表(在空格中打“√” ):学生讨论:我们可以发现自己的数学成绩和物理成绩存在某种关系.(似乎就是数学好的,物理也好;数学差的,物理也差,但又不全对.)物理成绩和数学成绩是两个变量,从经验看,由于物理学习要用到比较多的数学知识和数学方法.数学成绩的高低对物理成绩的高低是有一定影响的.但决非唯一因素,还有其他因素,如是否喜欢物理,用在物理学习上的时间等等.(总结:不能通过一个人的数学成绩是多少就准确地断定他的物理成绩能达到多少.但这两个变量是有一定关系的,它们之间是一种不确定性的关系.如何通过数学成绩的结果对物理成绩进行合理估计有非常重要的现实意义.)为很好地说明上述问题,我们开始学习变量之间的相关关系和两个变量的线性相关.(教师板书课题)思路2某地区的环境条件适合天鹅栖息繁衍,有人经统计发现了一个有趣的现象,如果村庄附近栖息的天鹅多,那么这个村庄的婴儿出生率也高,天鹅少的地方婴儿的出生率低,于是,他就得出一个结论:天鹅能够带来孩子.你认为这样得到的结论可靠吗?如何证明这个结论的可靠性?推进新课新知探究提出问题(1)粮食产量与施肥量有关系吗?“名师出高徒”可以解释为教师的水平越高,学生的水平也越高.教师的水平与学生的水平有什么关系?你能举出更多的描述生活中两个变量的相关关系的成语吗?(2)两个变量间的相关关系是什么?有几种?(3)两个变量间的相关关系的判断.讨论结果:(1)粮食产量与施肥量有关系,一般是在标准范围内,施肥越多,粮食产量越高;教师的水平与学生的水平是相关的,如水滴石穿,三人行必有我师等.我们还可以举出现实生活中存在的许多相关关系的问题.例如:商品销售收入与广告支出经费之间的关系.商品销售收入与广告支出经费有着密切的联系,但商品销售收入不仅与广告支出多少有关,还与商品质量、居民收入等因素有关.粮食产量与施肥量之间的关系.在一定范围内,施肥量越大,粮食产量就越高.但是,施肥量并不是决定粮食产量的唯一因素.因为粮食产量还要受到土壤质量、降雨量、田间管理水平等因素的影响.人体内的脂肪含量与年龄之间的关系.在一定年龄段内,随着年龄的增长,人体内的脂肪含量会增加,但人体内的脂肪含量还与饮食习惯、体育锻炼等有关,可能还与个人的先天体质有关.应当说,对于上述各种问题中的两个变量之间的相关关系,我们都可以根据自己的生活、学习经验作出相应的判断,因为“经验当中有规律”.但是,不管你的经验多么丰富,如果只凭经验办事,还是很容易出错的.因此,在分析两个变量之间的相关关系时,我们需要一些有说服力的方法.在寻找变量之间相关关系的过程中,统计同样发挥着非常重要的作用.因为上面提到的这种关系,并不像匀速直线运动中时间与路程的关系那样是完全确定的,而是带有不确定性.这就需要通过收集大量的数据(有时通过调查,有时通过实验),在对数据进行统计分析的基础上,发现其中的规律,才能对它们之间的关系作出判断.(2)相关关系的概念:自变量取值一定时,因变量的取值带有一定随机性的两个变量之间的关系,叫做相关关系.两个变量之间的关系分两类:①确定性的函数关系,例如我们以前学习过的一次函数、二次函数等;②带有随机性的变量间的相关关系,例如“身高者,体重也重”,我们就说身高与体重这两个变量具有相关关系.相关关系是一种非确定性关系.如商品销售收入与广告支出经费之间的关系.(还与商品质量、居民收入、生活环境等有关)(3)两个变量间的相关关系的判断:①散点图.②根据散点图中变量的对应点的离散程度,可以准确地判断两个变量是否具有相关关系.③正相关、负相关的概念.①教学散点图出示例题:在一次对人体脂肪含量和年龄关系的研究中,研究人员获得了一组样本数据:年龄23 27 38 41 45 49 50脂肪9.5 17.8 21.2 25.9 27.5 26.3 28.2年龄53 54 56 57 58 60 61脂肪29.6 30.2 31.4 30.8 33.5 35.2 34.6分析数据:大体上来看,随着年龄的增加,人体中脂肪的百分比也在增加.我们可以作散点图来进一步分析.②散点图的概念:将各数据在平面直角坐标系中的对应点画出来,得到表示两个变量的一组数据的图形,这样的图形叫做散点图,如下图.从散点图我们可以看出,年龄越大,体内脂肪含量越高.图中点的趋势表明两个变量之间确实存在一定的关系,这个图支持了我们从数据表中得出的结论.(a.如果所有的样本点都落在某一函数曲线上,就用该函数来描述变量之间的关系,即变量之间具有函数关系.b.如果所有的样本点都落在某一函数曲线附近,变量之间就有相关关系.c.如果所有的样本点都落在某一直线附近,变量之间就有线性相关关系)③正相关与负相关的概念:如果散点图中的点散布在从左下角到右上角的区域内,称为正相关.如果散点图中的点散布在从左上角到右下角的区域内,称为负相关.(注:散点图的点如果几乎没有什么规则,则这两个变量之间不具有相关关系)应用示例思路1例1 下列关系中,带有随机性相关关系的是_____________.①正方形的边长与面积之间的关系②水稻产量与施肥量之间的关系③人的身高与年龄之间的关系④降雪量与交通事故的发生率之间的关系解析:两变量之间的关系有两种:函数关系与带有随机性的相关关系.①正方形的边长与面积之间的关系是函数关系.②水稻产量与施肥量之间的关系不是严格的函数关系,但是具有相关性,因而是相关关系.③人的身高与年龄之间的关系既不是函数关系,也不是相关关系,因为人的年龄达到一定时期身高就不发生明显变化了,因而他们不具备相关关系.④降雪量与交通事故的发生率之间具有相关关系,因此填②④.答案:②④例2 有关法律规定,香烟盒上必须印上“吸烟有害健康”的警示语.吸烟是否一定会引起健康问题?你认为“健康问题不一定是由吸烟引起的,所以可以吸烟”的说法对吗?分析:学生思考,然后讨论交流,教师及时评价.解:从已经掌握的知识来看,吸烟会损害身体的健康,但是除了吸烟之外,还有许多其他的随机因素影响身体健康,人体健康是很多因素共同作用的结果.我们可以找到长寿的吸烟者,也更容易发现由于吸烟而引发的患病者,所以吸烟不一定引起健康问题.但吸烟引起健康问题的可能性大.因此“健康问题不一定是由吸烟引起的,所以可以吸烟”的说法是不对的.点评:在探究研究的过程中,如果能够从两个变量的观察数据之间发现相关关系是极为有意义的,由此可以进一步研究二者之间是否蕴涵因果关系,从而发现引起这种相关关系的本质原因是什么.本题的意义在于引导学生重视对统计结果的解释,从中发现进一步研究的问题.思路2例1 有时候,一些东西吃起来口味越好,对我们的身体越有害.下表给出了不同类型的某种食品的数据.第二列表示此种食品所含热量的百分比,第三列数据表示由一些美食家以百分制给出的对此种食品口味的评价: 品牌所含热量的百分比口味记录A 25 89B 34 89C 20 80D 1978E 26 75F 20 71G 19 65H 24 62I 19 60J 13 52(1)作出这些数据的散点图.(2)关于两个变量之间的关系,你能得出什么结论?解:(1)散点图如下:(2)基本成正相关关系,即食品所含热量越高,口味越好.例2 案例分析:一般说来,一个人的身高越高,他的右手一拃长就越长,因此,人的身高与右手一拃长之间存在着一定的关系.为了对这个问题进行调查,我们收集了北京市某中学2003年高三年级96名学生的身高与右手一拃长的数据如下表.性别身高/cm 右手一拃长/cm 性别身高/cm 右手一拃长/cm女152 18.5 女153 16.0女156 16.0 女157 20.0女158 17.3 女159 20.0女160 15.0 女160 16.0女160 17.5 女160 17.5女160 19.0 女160 19.0女160 19.0 女160 19.5女161 16.1 女161 18.0 女162 18.2 女162 18.5 女163 20.0 女163 21.5 女164 17.0 女164 18.5 女164 19.0 女164 20.0 女165 15.0 女165 16.0 女165 17.5 女165 19.5 女166 19.0 女167 19.0 女167 19.0 女168 16.0 女168 19.0 女168 19.5 女170 21.0 女170 21.0 女170 21.0 女171 19.0 女171 20.0 女171 21.5 女172 18.5 女173 18.0 女173 22.0 男162 19.0 男164 19.0 男165 21.0 男168 18.0 男168 19.0 男169 17.0 男169 20.0 男170 20.0 男170 21.0 男170 21.5 男170 22.0 男171 21.5 男171 21.5 男171 22.3 男172 21.5 男172 23.0 男173 20.0 男173 20.0 男173 20.0 男173 20.0 男173 21.0 男174 22.0 男174 22.0男175 16.0 男175 20.0男175 21.0 男175 21.2男175 22.0 男176 16.0男176 19.0 男176 20.0男176 22.0 男176 22.0男177 21.0 男178 21.0男178 21.0 男178 22.5男178 24.0 男179 21.5男179 21.5 男179 23.0男180 22.5 男181 21.1男181 21.5 男181 23.0男182 18.5 男182 21.5男182 24.0 男183 21.2男185 25.0 男186 22.0男191 21.0 男191 23.0(1)根据上表中的数据,制成散点图.你能从散点图中发现身高与右手一拃长之间的近似关系吗?(2)如果近似成线性关系,请画出一条直线来近似地表示这种线性关系.(3)如果一个学生的身高是188 cm,你能估计他的一拃大概有多长吗?解:根据上表中的数据,制成的散点图如下.从散点图上可以发现,身高与右手一拃长之间的总体趋势是成一直线,也就是说,它们之间是线性相关的.那么,怎样确定这条直线呢?同学1:选择能反映直线变化的两个点,例如(153,16),(191,23)两点确定一条直线.同学2:在图中放上一根细绳,使得上面和下面点的个数相同或基本相同.同学3:多取几组点对,确定几条直线方程.再分别算出各个直线方程斜率、截距的算术平均值,作为所求直线的斜率、截距.同学4:从左端点开始,取两条直线,如下图.再取这两条直线的“中间位置”作一条直线.同学5:先求出相同身高同学右手一拃长的平均值,画出散点图,如下图,再画出近似的直线,使得在直线两侧的点数尽可能一样多.同学6:先将所有的点分成两部分,一部分是身高在170 cm以下的,一部分是身高在170 cm以上的;然后,每部分的点求一个“平均点”——身高的平均值作为平均身高、右手一拃的平均值作为平均右手一拃长,即(164,19),(177,21);最后,将这两点连接成一条直线.同学7:先将所有的点按从小到大的顺序进行排列,尽可能地平均分成三等份;每部分的点按照同学3的方法求一个“平均点”,最小的点为(161.3,18.2),中间的点为(170.5,20.1),最大的点为(179.2,21.3).求出这三个点的“平均点”为(170.3,19.9).我再用直尺连接最大点与最小点,然后平行地推,画出过点(170.3,19.9)的直线.同学8:取一条直线,使得在它附近的点比较多.在这里需要强调的是,身高和右手一拃长之间没有函数关系.我们得到的直线方程,只是对其变化趋势的一个近似描述.对一个给定身高的人,人们可以用这个方程来估计这个人的右手一拃长,这是十分有意义的. 知能训练一个车间为了规定工时定额,需要确定加工零件所花费的时间,为此进行了10次试验,收集数据如下:零件数x(个)10 20 30 40 50 60 70 80 90 100加工时间y(min) 62 68 75 81 89 95 102 108 115 122 画出散点图;关于加工零件的个数与加工时间,你能得出什么结论?答案:(1)散点图如下:(2)加工零件的个数与所花费的时间呈正线性相关关系.拓展提升以下是某地搜集到的新房屋的销售价格y和房屋的面积x的数据:房屋面积(m2)115 110 80 135 105销售价格(万元)24.8 21.6 18.4 29.2 22(1)画出数据对应的散点图;(2)指出是正相关还是负相关;(3)关于销售价格y和房屋的面积x,你能得出什么结论?解:(1)数据对应的散点图如下图所示:(2)散点图中的点散分布在从左下角到右上角的区域内,所以是正相关.(3)关于销售价格y和房屋的面积x,房屋的面积越大,价格越高,它们呈正线性相关的关系.课堂小结通过收集现实问题中两个有关联变量的数据作出散点图,并利用散点图直观认识变量间的相关关系.作业习题2.3A组3、4(1).设计感想本节课学习了变量之间的相关关系和两个变量的线性相关的部分内容,通过身边的具体实例说明了两个变量的相关关系,并学会了利用散点图及其分布来说明两个变量的相关关系的种类,为下一节课作了铺垫,思路1和思路2的例题对知识进行了巩固和加强,另外,本节课通过选取一些学生特别关心的身边事例,对学生进行思想情操教育、意志教育和增强学生的自信心,养成良好的学习态度和学习方法,树立时间观,培养勤奋、刻苦耐劳的精神.。
高中数学必修3第二章第三节《变量间的相关关系》全套教案
2.3.变量间的相关关系2.3.1变量间的相关关系【教学目标】(1)了解变量之间的相关关系。
(2)会区别变量之间的函数关系与变量相关关系。
(3)会举例说明现实生活中变量之间的相关关系。
【教学重点难点】1、变量之间的相关关系。
2、会区别变量之间的函数关系与变量相关关系。
3、会举例说明现实生活中变量之间的相关关系。
【学前准备】:多媒体,预习例题个准确的函数来表示,广告费(自变量x)一定时销售额(因变量y)并没有确定,而是因为受多种因素的影响带有一定的随机性。
2、你能试着总结一下相关关系的定义吗?变量间的相关关系定义:自变婴儿出生率也高,天鹅少的地方婴儿出生率低,于是他得出了一个结论:天鹅能够带来孩子。
你认为这样的结论可靠吗?如何证明这个问题的可靠性?分析:(1)吸烟只是影响健康的一个因素,对健康的影响还有其他的一些因素,两者之间非函数关系即非因果关系;(2)不对,这也是相关关系而不是函数关系。
上面提到了很多相关关系,那它们之间的相关关系强还是弱?我们下面来研究一下。
散点图.2.3.2两个变量的线性相关【教学目标】(1)了解最小二乘法的思想及回归直线方程的推导过程;(2)通过实例加强对回归直线方程含义的理解。
【教学重难点】重点:利用散点图直观地判断两个变量之间的线性相关关系,了解统计学中,数据处理的经典方法——最小二乘法,掌握回归方程系数公式求回归方程,且进行实际预测。
难点:通过代数的方法刻画“从整体上看,各点与回归直线的距离最小”的几何特征,让学生了解最小二乘法思想,形成回归分析思想。
【学前准备】:多媒体,预习例题学生预分类情况:分类1:分成三组(1)(5),(2)(3(4)(8), 其中(1)(5)图中的点分布在一条直线上;(3)(6)(7)图中的点大部分的点落在某条直线附近,呈带状分布;(4)(8)图中的点分布比2.为考虑广告费用x与销售额y之间的关系,抽取了5家餐厅,得到如下数据:广告费用(千元) 1.0 4.0 6.0 10.0 14.销售额(千元) 19.0 44.0 40.0 52.0 53.(1)画出散点图。
人教版高中数学必修三 第二章 统计《变量间相关关系》教学设计
《变量间相关关系》教学设计一、教材分析学生情况分析:学生已经具备了对样本数据进行初步分析的能力,且掌握了一定的计算机基础,主要是电子表格的使用。
二、教材地位和作用:变量间的相关关系是高中新教材人教A版必修 3 第二章 2.3 节的内容,本节课主要探讨如何利用线性回归思想对实际问题进行分析与预测。
为以后学习回归分析思想的应用奠定基础。
三、教学目标:1、知识与技能:利用散点图判断线性相关关系,了解最小二乘法的思想及回归方程系数公式的推导过程,利用EXCEL求出回归直线的方程并对实际问题进行分析和预测,通过实例加强对回归直线方程含义的理解2 、过程与方法:①通过自主探究体会数形结合、类比、及最小二乘法的数学思想方法。
②通过动手操作培养学生观察、分析、比较和归纳能力,引出利用计算机等现代化教学工具的必要性。
3、情感、态度与价值观:类比函数的表示方法,使学生理解变量间的相关关系,增强应用回归直线方程对实际问题进行分析和预测的意识。
利用电子书包让学生动手操作,合作交流激发学生的学习兴趣。
四、教学内容的重点:利用散点图直观认识两个变量之间的线性相关关系,了解最小二乘法的思想并利用此思想借助电子表格求出回归方程。
教学内容的难点:对最小二乘法的数学思想和回归方程的理解教学实施过程中的难点:根据给出的线性回归方程的系数公式建立线性回归方程。
五、教学媒体设计:本节课涉及大量数据计算及分析,用传统方法很难突破,故我主要通过电子书包,课前发布预学案、上课时发布课堂学案,通过学生动手操作、教师动画演示、师生合作交流来突出重点、突破难点。
六、教学过程:(一)课前通过电子书包平台,发布预学案。
学生完成预学案。
(如下)1、2、通过思考我们知道上述三个关系均不是函数关系,它们均称为相关关系。
3、(二)课堂上点评预学案完成情况:1、展示学生讨论情况,并明确两变量间的函数关系与相关关系的区别2、点评课前自测。
(三)师生探究与互动1、探究如何确定两变量间是否有相关关系?具有怎样的相关关系?(1)探究人体年龄与脂肪含量关系是否具有相关关系思考:判断以下案例是否有相关关系:(a)2007届高三总分前10名的学生每周用于数学学习时间x(单位:h)与数学成绩y(单(c)样本序号n(2)探究:由脂肪与年龄的散点图我们知道它们具有正相关,能否更具体些,确定它们以什么方式正相关呢?分析:年龄与脂肪含量的散点图这些点大致分布在一条直线附近,像这样,如果散点图中点的分布从整体上看大致在一条直线附近.提炼:我们就称这两个变量之间具有线性相关关系,这条直线叫做回归直线,该直线叫回归方程.思考:我们该怎样来求出这个回归方程?分析:问题1:回归直线应具有什么特征?(从整体上看,各点与此直线的距离)问题2:如何刻画各点与直线的接近程度? (设直线方程为:y=a+bx ,任意给定一个样本点(i i y x ,),我们用来刻画点与直线的接近程度。
人教课标版高中数学必修三《变量间的相关关系》教案-新版
第二章统计2.3 变量间的相关关系一、教学目标1.核心素养通过本节学习,让学生初步形成数据处能理.2.学习目标(1)两个变量之间的相关关系的理解;(2)利用散点图直观认识两个变量之间的线性关系.(2)根据给出的线性回归方程的系数公式建立线性回归方程.3.学习重点根据线性回归方程的系数公式建立线性回归方程.4.学习难点回归思想的建立,对回归直线与观测数据关系的理解.二、教学设计(一)课前设计1.预习任务任务1阅读P84-P91,思考:两个变量的关系有哪些?如何发现两个变量的关系?任务2写出线性回归直线方程的系数公式,明白公式各部分的意义2.预习自测1.下列两个变量之间的关系不是函数关系的是()A.圆的半径和它的面积B.正方形边长和它的面积C.正n边形的边数和内角和D.人的年龄和身高解:D2.设有一个回归方程为y^=2-1.5x,则变量x增加一个单位时,y平均() A.增加1.5个单位B.增加2个单位C.减少1.5个单位D.减少2个单位解:C3.已知回归直线的斜率的估计值是1.23,样本点的中心为(4,5),则回归直线的方程是()A.y^=1.23x+4B.y^=1.23x+5C.y^=1.23x+0.08D.y^=0.08x+1.23解:C(二)课堂设计1.知识回顾(1)频率分布表,频率分布直方图,频率分布折线图,密度曲线.(2)中数,众数,平均数,方差,标准差.2.问题探究问题探究一两个变量之间有哪些关系,如何呈现?(★▲)●活动一创设情景,感知相关关系考察下列问题中两个变量之间的关系,想一想这些问题中两个变量之间的关系是函数关系吗?(1)商品销售收入与广告支出经费(2)粮食产量与施肥量;(3)人体内的脂肪含量与年龄.(1)(2)(3)都不是函数关系,因为前者的好坏或多与少还由其它因素来确定. 述两个变量之间的关系是一种非确定性关系,称之为相关关系,也即是说自变量取值一定时,因变量的取值带有一定随机性的两个变量之间的关系,叫做相关关系.●活动二增设反例,深化相关关系的理解下列两个变量间,哪些是函数关系?哪些是相关关系?①已知二次函数y=ax2+bx+c,其中a、c是已知常数,取b为自变量,因变量是这个函数的判别式△=b2-4ac;②光照时间和果树亩产量;③每亩施用肥料量和粮食产量.它们之间的关系是函数关系的有①,是相关关系的有②③.函数关系中的两个变量间是一种确定性关系;相关关系是一种非确定性关系.函数关系是一种因果关系而相关关系不一定是因果关系,也可能是伴随关系.函数关系与相关关系之间有着密切联系,在一定条件下可以互相转化.问题探究二 在一次对人体脂肪含量和年龄关系的研究中,研究人员获得了一组样本数据:50494541392723年龄28.226.327.525.921.217.89.5脂肪61605857565453年龄34.635.233.530.831.430.229.6脂肪其中各年龄对应的脂肪数据是这个年龄人群脂肪含量的样本平均数. ●活动一 初识案例,感知两个变量间的关系思考1:观察上表中的数据,大体上看,随着年龄的增加,人体脂肪含量怎样变化?随着年龄的增加,人体脂及含量在增加.思考2:以x 轴表示年龄,y 轴表示脂肪含量,你能在直角坐标系中描出样本数据对应的图形吗?在平面直角坐标系中,表示具有相关关系的两个变量的一组数据图形,称为散点图.在上面的散点图中,这些点散布在从左下角到右上角的区域,对于两个变量的这种相关关系,我们将它称为正相关.一般地,如果两个变量成正相关,散点图中的点散布在从左上角到右下角的区域两个变量成负相关. ●活动二 再析案例,用直线拟合两变量的关系有些散点图中的点是杂乱分布的,有些散点图中的点的分布有一定的规律性,年龄和人体脂肪含量的样本数据的散点图中的点大致分布在一条直线附近.称这两个变量线性相关.思考3:对于一组具有线性相关关系的样本数据,你认为其回归直线是一条还是几条?在样本数据的散点图中,能否用直尺准确画出回归直线?借助计算机怎样画出回归直线呢?●活动三 回归直线方程的求法在直角坐标系中,任何一条直线都有相应的方程,回归直线的方程称为回归方程.对一组具有线性相关关系的样本数据,如果能够求出它的回归方程,那么我们就可以比较具体、清楚地了解两个相关变量的内在联系,并根据回归方程对总体进行估计.回归直线与散点图中各点的位置整体上最接近 .如何求回归直线呢?思考4:对一组具有线性相关关系的样本数据:(x 1,y 1),(x 2,y 2),…,(x n ,y n ),设其回归方程为a bx y +=∧可以用哪些数量关系来刻画各样本点与回归直线的接近程度?.)(||2a bx y y y y y i i i i i i +=--∧∧∧其中,或可以用21ˆ()ni i i Q y y==-∑2221122()()()n n y bx a y bx a y bx a =--+--++--为了从整体上反映n 个样本数据与回归直线的接近程度,你认为选用哪个数量关系来刻画比较合适?根据有关数学原理分析,当1122211()(),()n niii ii i nniii i x x y y x y nx yb a y bx x x xnx ====---===---∑∑∑∑时,总体偏差21)ˆ(∑=-=ni i yy Q 最小,这样就得到了回归方程,这种求回归方程的方法叫做最小二乘法.回归方程中,a ,b 的几何意义分别是什么?因此利用计算器或计算机可求得年龄和人体脂肪含量的样本数据的回归方程为48.0577.0-=x y ,由此我们可以根据一个人个年龄预测其体内脂肪含量的百分比的回归值.若某人37岁,则其体内脂肪含量的百分比约为20.9% 问题探究三例1.四名同学根据各自的样本数据研究变量x ,y 之间的相关关系,并求得线性回归方程,分别得到以下四个结论:①y 与x 负相关且y ^=2.347x -6.423; ②y 与x 负相关且y ^=-3.476x +5.648;③y 与x 正相关且y ^=5.437x +8.493; ④y 与x 正相关且y ^=-4.326x -4.578. 其中一定不正确的结论的序号是( ) A.①② B.②③ C.③④ D.①④ 【知识点:正相关、负相关】解 D :由回归方程y ^=b ^x +a ^知当b ^>0时,y 与x 正相关,当b ^<0时,y 与x 负相关,∴①④一定错误.例2.设某大学的女生体重y (单位:kg)与身高x (单位:cm)具有线性相关关系,根据一组样本数据(x i ,y i )(i =1,2,…,n ),用最小二乘法建立的回归方程为y ^=0.85x -85.71,则下列结论中不正确的是( )A.y 与x 具有正的线性相关关系B.回归直线过样本点的中心(x ,y )C.若该大学某女生身高增加1 cm ,则其体重约增加0.85 kgD.若该大学某女生身高为170 cm ,则可断定其体重必为58.79 kg 【知识点:回归方程的简单应用】解:D ∵0.85>0,∴y 与x 正相关,∴A 正确;∵回归直线经过样本点的中心(x ,y ),∴B 正确;∵Δy =0.85(x +1)-85.71-(0.85x -85.71)=0.85,∴C 正确.例 3.某车间为了制定工时定额,需要确定加工零件所花费的时间,为此做了四次试验,得到的数据如下:(1)(2)求出y 关于x 的线性回归方程y ^=b ^x +a ^,并在坐标系中画出回归直线;(3)试预测加工10个零件需要多少小时? 【知识点:回归方程】 解:(1)散点图如图.(2)由表中数据得:x =3.5,y =3.5 ∴b ^=0.7,∴a ^=1.05, ∴y ^=0.7x +1.05,回归直线如图所示.(3)将x =10代入线性回归方程,得y ^=0.7×10+1.05=8.05,故预测加工10个零件约需要8.05小时. 3.课堂总结(1)相关关系与函数关系的区别与联系①函数关系中的两个变量间是一种确定性关系,相关关系是一种非确定性的关系.线性相关关系是相关关系的一种特殊性况,它也是一种不确定的关系.②函数关系是一种因果关系,而相关关系不一定是因果关系,也可能是伴随关系. ③函数关系与相关关系之间有着密切联系,在一定条件下可以相互转化.而对于具有线性相关关系的两个变量来说,当求得其回归直线方程后,又可以用一种确定性的关系对这两个变量间的取值进行估计.④相关关系在现实生活中大量存在,从某种意义上讲,函数关系是一种理想的关系模型,而相关关系是一种更为一般的情况.因此研究相关关系,不仅可以用来处理更为广泛的数学应用问题,还可以将对函数关系的认识上升到一个新的高度.(2)回归直线①回归直线的特征:像平均数可以作为一个变量的数据代表一样,回归直线也可以作为两个变量之间具有相关关系的代表.回归直线是样本数据点最大程度的吻合,即散点回归.②线性回归思想:把相关关系(不确定性关系)转化为函数关系(确定性关系).当两个具有相关关系的变量近似满足一次函数关系时,所进行的回归分析叫线性回归分析.③求回归直线方程的步骤:第一步:计算平均数x 和y ; 第二步:计算211,nni i i i i x y x ==∑∑;第三步:计算x b y axn x yx n yx x x y y x xbn i i ni ii ni i ni i iˆˆ,)()()(ˆ2121121-=--=--⋅-=∑∑∑∑====; 第四步:写出回归直线方程y bx a =+.(称点),(y x 为样本中心点,样本中心点),(y x 一定位于回归直线上)④得用回归直线方程对总体进行估计:利用回归直线方程对总体进行估计时,虽然这个值只是估计值,不是精确值,具有随机性,但它是根据统计规律得到 4.随堂检测 1.有五组变量:①汽车的重量和汽车每消耗1升汽油所行驶的平均路程;②平均日学习时间和平均学习成绩; ③某人每日吸烟量和身体健康情况; ④圆的半径与面积; ⑤汽车的重量和每千米耗油量. 其中两个变量成正相关的是( )A .①③B .②④C .②⑤D .④⑤ 【知识点:正相关,负相关】解:C 由变量的相关关系的概念知,②⑤是正相关,①③是负相关,④为函数关系.2. 设(x 1,y 1),(x 2,y 2),…,(x n ,y n )是变量x 和y 的n 个样本点,直线l 是由这些样本点通过最小二乘法得到的线性回归直线(如图),以下结论正确的是( )A .直线l 过点(x ,y )B .x 和y 的相关系数为直线l 的斜率C .x 和y 的相关系数在0到1之间D .当n 为偶数时,分布在l 两侧的样本点的个数一定相同 【知识点:回归直线】解A. 由样本的中心(x ,y )落在回归直线上可知A 正确;x 和y 的相关系数表示为x 与y 之间的线性相关程度,不表示直线l 的斜率,故B 错;x 和y 的相关系数应在-1到1之间,故C 错;分布在回归直线两侧的样本点的个数并不绝对平均,即无论样本点个数是奇数还是偶数,故D 错. 3. 某产品的广告费用x 与销售额y 的统计数据如下表:6万元时销售额为( )A .63.6万元B .65.5万元C .67.7万元D .72.0万元 【知识点:回归直线】 解:B经计算可知,回归方程为9.4x +9.1, ∴当x =6(万元)时,9.4×6+9.1=65.5(万元). (三)课后作业 基础型 自主突破1.判断下面结论是否正确(请在括号中打“√”或“×”)(1)相关关系与函数关系都是一种确定性的关系,也是一种因果关系.( × ) (2)“名师出高徒”可以解释为教师的教学水平与学生的水平成正相关关系.( √ )(3)只有两个变量有相关关系,所得到的回归模型才有预测价值.( √ ) (4)某同学研究卖出的热饮杯数y 与气温x (℃)之间的关系,得回归方程y ^=-2.352x +147.767,则气温为2℃时,一定可卖出143杯热饮.( × ) 【知识点:正相关、负相关概念;回归方程】 解:× √ √ ×2. 在下列各图中,两个变量具有线性相关关系的图是( )(1)(2)(3)(4)A.(1)(2) B.(1)(3) C.(2)(4) D.(2)(3)【知识点:散点图】解:D3.在对两个变量x,y进行线性回归分析时,有下列步骤:①对所求出的线性回归方程作出解释;②收集数据(x i,y i),i=1,2,…,n;③求线性回归方程;④求相关系数;⑤根据所搜集的数据绘制散点图.如果根据可行性要求能够作出变量x,y具有线性相关结论,则在下列操作顺序中正确的是()A.①②⑤③④B.③②④⑤①C.②④③①⑤D.②⑤④③①【知识点:散点图,回归直线】解:D4. 下列结论正确的是()①函数关系是一种确定性关系;②相关关系是一种非确定性关系;③回归分析是对具有函数关系的两个变量进行统计分析的一种方法;④回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法.A.①②B.①②③C.①②④D.①②③④【知识点:相关关系,函数关系】解:C能力型师生共研5.根据下面给出的2004年至2013年我国二氧化硫排放量(单位:万吨)柱形图.以下结论不正确的是( )A .逐年比较,2008年减少二氧化硫排放量的效果最显著B .2007年我国治理二氧化硫排放显现C .2006年以来我国二氧化硫年排放量呈减少趋势D .2006年以来我国二氧化硫年排放量与年份正相关 【知识点:相关关系】 解:D6.根据如下样本数据得到的回归方程为y ^=b ^x +a ^,则( ) A.a ^>0,b ^>0 B.a ^>0,b ^<0 C.a ^<0,b ^>0 D.a ^<0,b ^<0 【知识点:回归方程】解B :作出散点图如下:观察图象可知,回归直线y ^=b ^x +a ^的斜率b ^<0,当x =0时,y ^=a ^>0.故a ^>0,b ^<0.7.设某大学的女生体重y (单位:kg)与身高x (单位:cm)具有线性相关关系,根据一组样本数据(x i ,y i )(i =1,2,…,n ),用最小二乘法建立的回归方程为y ^=0.85x -85.71,则下列结论中不正确的是( )A.y 与x 具有正的线性相关关系B.回归直线过样本点的中心(x ,y )C.若该大学某女生身高增加1 cm ,则其体重约增加0.85 kgD.若该大学某女生身高为170 cm ,则可断定其体重必为58.79 kg 【知识点:回归方程】解B ∵0.85>0,∴y 与x 正相关,∴A 正确;∵回归直线经过样本点的中心(x ,y ),∴B 正确;∵Δy =0.85(x +1)-85.71-(0.85x -85.71)=0.85,∴C 正确.故选D.8.从某居民区随机抽取10个家庭,获得第i 个家庭的月收入i x (单位:千元)与月储蓄i y (单位:千元)的数据资料,算得10180i i x ==∑,10120i i y ==∑,101184i i i x y ==∑,1021720i i x ==∑.(1)求家庭的月储蓄y 对月收入x 的线性回归方程y bx a =+; (2)判断变量x 与y 之间是正相关还是负相关;(3)若该居民区某家庭月收入为7千元,预测该家庭的月储蓄.附:线性回归方程y bx a =+中,1221ni ii nii x y nx yb xnx==-=-∑∑,a y bx =-,其中x ,y 为样本平均值,线性回归方程也可写为y bx a =+. 【知识点:回归方程】 解析:(1)由题知21,81,1011=====∑∑==n i n i i i y n y x n x n ,80640720212=-=-∑=x n x ni i ,241601841=-=-∑=y x n y x ni i .因此4.083.02ˆ,3.0ˆ-=⨯-=-==x b y a b,故所求的回归方程为4.03.0-=x y (2)由0>b ,故x 与y 是正相关的.(3)代入回归方程中可以预测该项家庭的月储蓄为7.14.073.0=-⨯=y . 探究型 多维突破9.某公司为确定下一年度投入某种产品的宣传费,需了解年宣传费x (单位:千元)对年销售量y (单位:t )和年利润z (单位:千元)的影响,对近8年的年宣传费i x 和年销售量i y (i =1,2,···,8)数据作了初步处理,得到下面的散点图及一些统计量的值.表中i w =,w =81ii w=∑(Ⅰ)根据散点图判断,y=a +bx 与y =c +d y 关于年宣传费x 的回归方程类型?(给出判断即可,不必说明理由) (Ⅱ)根据(Ⅰ)的判断结果及表中数据,建立y 关于x 的回归方程; (Ⅲ)已知这种产品的年利率z 与x 、y 的关系为z =0.2y -x.根据(Ⅱ)的结果回答下列问题:(ⅰ)年宣传费x =49时,年销售量及年利润的预报值是多少? (ⅱ)年宣传费x 为何值时,年利率的预报值最大? 【知识点:回归方程】解析:(1)由散点图可以判断x d c y +=适合作为年销售y 关于年宜传费用x 的回归方程类型(2)先建立y 关于w 的线性回归方程,由于68168.108)())((ˆ81281==---=∑∑==i ii i iw wy y w wd6.1008.668563ˆˆ=⨯-=-=∴d c,所以y 关于w 的线性回归方程为w y686.100ˆ+=,即y 关于x 的线性回归方程为x y 686.100ˆ+=. (3)由(1)和(2)知,当49=x 时,年销售量y 的预报值为6.57649686.100ˆ=+=y, 32.66492.06.576ˆ=-⨯=z,年利润z 的预报值为 12.206.13)686.100(2.0ˆ++-=-+=x x x x z, 所以当8.626.13==x ,即24.46=x 时,zˆ取得最大值. 自助餐1.已知变量x ,y 呈线性相关关系,线性回归方程为y =0.5+2x ,则变量x ,y 是( )A .线性正相关关系B .由回归方程无法判断其正负相关C .线性负相关关系D .不存在线性相关关系 【知识点: 相关关系】 解:A2.已知变量x 与y 正相关,且由观测数据算得样本平均数3x =, 3.5y =,则由该观测的数据算得的线性回归方程可能是( ).0.4 2.3A y x =+ .2 2.4B y x =- .29.5C y x =-+ .0.3 4.4C y x =-+ 【知识点: 回归直线】 解:A3.已知变量x 和y 满足关系y ^=-0.1x +1,变量y 与z 正相关.下列结论中正确的是( )A.x 与y 正相关,x 与z 负相关B.x 与y 正相关,x 与z 正相关C.x 与y 负相关,x 与z 负相关D.x 与y 负相关,x 与z 正相关 【知识点:相关关系】 解 C.4.为了解某社区居民的家庭年收入所年支出的关系,随机调查了该社区5户家庭,得到如下统计数据表:根据上表可得回归直线方程ˆˆˆybx a =+ ,其中ˆˆˆ0.76,b a y bx ==- ,据此估计,该社区一户收入为15万元家庭年支出为( )A .11.4万元B .11.8万元C .12.0万元D .12.2万元【知识点: 回归直线】 解B :由已知得8.28.610.011.311.9105x ++++==(万元),6.27.58.08.59.885y ++++==(万元),故80.76100.4a =-⨯=,所以回归直线方程为ˆ0.760.4y x =+,当社区一户收入为15万元家庭年支出为ˆ0.76150.411.8y=⨯+=(万元). 5.在一组样本数据(x 1,y 1),(x 2,y 2),…,(x n ,y n )(n ≥2,x 1,x 2,…,x n 不全相等)的散点图中,若所有样本点(x i ,y i )(i =1,2,…,n )都在直线y =12x +1上,则这组样本数据的样本相关系数为( )A .-1B .0 C.12 D .1【知识点:散点图,回归直线】 解 D6.四名同学根据各自的样本数据研究变量x ,y 之间的相关关系,并求得线性回归方程,分别得到以下四个结论:①y 与x 负相关且y ^=2.347x -6.423; ②y 与x 负相关且y ^=-3.476x +5.648;③y 与x 正相关且y ^=5.437x +8.493; ④y 与x 正相关且y ^=-4.326x -4.578. 其中一定不正确的结论的序号是( ) A.①② B.②③ C.③④ D.①④ 【知识点:正相关、负相关概念】解D :由回归方程y ^=b ^x +a ^知当b ^>0时,y 与x 正相关,当b ^<0时,y 与x 负相关,∴①④一定错误.7.已知x 与y 之间的几组数据如下表:假设根据上表数据所得线性回归直线方程为a x b yˆˆˆ+=.若某同学根据上表中前两组数据)0,1(和)2,2(求得的直线方程为y b x a ''=+,则以下结论正确的是( )A.a a b b'>'>ˆ,ˆ B.a a b b '<'>ˆ,ˆ C. ˆˆ,b b a a ''<> D.a a b b '<'<ˆ,ˆ 【知识点:回归直线】 解:C ,画图即可求得8.如图所示,有A ,B ,C ,D ,E,5组数据,去掉________组数据后,剩下的4组数据具有较强的线性相关关系.【知识点:散点图】 解:D9.工人月工资y (元)与劳动生产率x (千元)的回归方程为y ^=50+80x ,当劳动生产率提高1000元时,月工资平均提高________元. 【知识点:回归直线】解D:回归直线是用来估计总体的,所以我们求的值都是估算值,所以我们得到的结果也是近似的,只要把自变量的值代入回归直线方程即可求得结果为145.83(cm).10.某车间为了制定工时定额,需要确定加工零件所花费的时间,为此做了四次试验,得到的数据如下:(1)(2)求出y 关于x 的线性回归方程y ^=b ^x +a ^,并在坐标系中画出回归直线; (3)试预测加工10个零件需要多少小时? 【知识点:回归方程的综合应用】 解 (1)散点图如图.(2)由表中数据得:x =3.5,y =3.5 ∴b ^=0.7,∴a ^=1.05, ∴y ^=0.7x +1.05,回归直线如图所示.(3)将x =10代入线性回归方程,得y ^=0.7×10+1.05=8.05,故预测加工10个零件约需要8.05小时.11.某工厂为了对新研发的一种产品进行合理定价,将该产品按事先拟定的价格进行试销,得到如下数据:(1)求回归直线方程y =bx +a ,其中b =-20,a =y -b x ;(2)预计在今后的销售中,销量与单价仍然服从(1)中的关系,且该产品的成本是4元/件,为使工厂获得最大利润,该产品的单价应定为多少元?(利润=销售收入-成本)解:(1)由于x -=16(x 1+x 2+x 3+x 4+x 5+x 6)=8.5,y -=16(y 1+y 2+y 3+y 4+y 5+y 6)=80.所以a =y --b x -=80+20×8.5=250,从而回归直线方程为y ^=-20x +250. (2)设工厂获得的利润为L 元,依题意得L =x (-20x +250)-4(-20x +250)=-20x 2+330x -1000=-20⎝ ⎛⎭⎪⎫x -3342+361.25.当且仅当x =8.25时,L 取得最大值.故当单价定为8.25元时,工厂可获得最大利润.12.下图是我国2008年至2014年生活垃圾无害化处理量(单位:亿吨)的折线图(Ⅰ)由折线图看出,可用线性回归模型拟合y 与t 的关系,请用相关系数加以说明;(Ⅱ)建立y 关于t 的回归方程(系数精确到0.01),预测2016年我国生活垃圾无害化处理量.附注:参考数据:719.32i i y ==∑,7140.17i i i t y ==∑0.55=,7≈2.646.参考公式:相关系数()()niit t y y r --=∑ 回归方程y a bt =+ 中斜率和截距的最小二乘估计公式分别为:121()()()nii i nii tt y y b tt ==--=-∑∑,=.a y bt -解:(1)99.0646.2255.089.2,89.2))((,28)(,471271≈⨯⨯≈=--=-=∑∑==r y y t t t t t i i i i i(Ⅱ)103.02889.2)())((ˆ71271≈=---=∑∑==i ii i it ty tb, 92.04103.0331.1ˆˆ≈⨯-≈-=t b y a. 所以,y 关于t 的回归方程为:t y 10.092.0ˆ+=.将2016年对应的9=t 代入回归方程得:82.1910.092.0ˆ=⨯+=y. 所以预测2016年我国生活垃圾无害化处理量将约1.82亿吨.考点:线性相关与线性回归方 程的求法与应用. 五、数学视野最小二乘法最早称为回归分析法.由著名的英国生物学家、统计学家道尔顿(F .Gallton )——达尔文的表弟所创,早年,道尔顿致力于化学和遗传学领域的研究.他研究父亲的身高与儿子的身高之间的关系时,建立了回归分析法.在科学研究和实际工作中,常常会遇到这样的问题:给定两个变量x ,y 的n 组试验数据(x 1,y 1),(x 2,y 2),…,(x n ,y n ),如何从中找出这两个变量间的函数关系的近似解析表达式(也称为经验公式),使得能对x 与y 之间的除了数据外的对应情况作出判断. 这样的问题一般可以分为两类:一类是对x 与y 之间所存在的对应规律一无所知,这时要从试验数据中找出切合实际的近似解析表达式是相当困难的,俗称这类问题为黑箱问题;另一类是依据对问题所作的分析,通过数学建模或者通过整理归纳试验数据,能够判断出x 与y 之间满足或大体上满足某种类型的函数关系式y=f (x ,a ),其中a=(a 1,a 2,…,a n )是n 个待定的参数,这些参数的值可以通过m 组试验数据来确定(一般要求m>n ),这类问题称为灰箱问题.解决灰箱问题的原则通常是使用拟合函数在x i 处的值与试验数据的偏差平方和最小,即[f (x i ,a )-y i ]2取得最小值.这种在方差意义下对试验数据实现最佳拟合的方法称为“最小二乘法”,a 1,a 2,…,a n 称为最小二乘解,y=f (x ,a )称为拟合函数.现在回归分析法已远非道尔顿的本意,已经成为探索变量之间关系最重要的方法,用以找出变量之间关系的具体表现形式.。
2.3《变量间的相互关系》教案(新人教必修3)
2.3.1变量之间的相关关系教学目标:通过收集现实问题中两个有关联变量的数据作出散点图,并利用散点图直观认识变量间的相关关系。
教学重点:通过收集现实问题中两个有关联变量的数据作出散点图,并利用散点图直观认识变量间的相关关系。
教学过程:案例分析:一般说来,一个人的身高越高,他的人就越大,相应地,他的右手一拃长就越长,因此,人的身高与右手一拃长之间存在着一定的关系。
为了对这个问题进行调查,我们收集了北京市某中学2003年高三年级96名学生的身高与右手一拃长的数据如下表。
关系吗?(2)如果近似成线性关系,请画出一条直线来近似地表示这种线性关系。
(3)如果一个学生的身高是188cm ,你能估计他的一拃大概有多长吗? 解:根据上表中的数据,制成的散点图如下。
它们之间是线性相关的。
那么,怎样确定这条直线呢?同学1:选择能反映直线变化的两个点,例如(153,16),(191,23)二点确定一条直线。
同学2:在图中放上一根细绳,使得上面和下面点的个数相同或基本相同。
同学3:多取几组点对,确定几条直线方程。
再分别算出各个直线方程斜率、截距的算术平均值,作为所求直线的斜率、截距。
同学4:我从左端点开始,取两条直线,如下图。
再取这两条直线的“中间位置”作一条直线。
同学5:我先求出相同身高同学右手一拃长的平均值,画出散点图,如下图,再画出近似的直线,使得在直线两侧的点数尽可能一样多。
1015202530150155160165170175180185190195同学6:我先将所有的点分成两部分,一部分是身高在170 cm 以下的,一部分是身高在170 cm 以上的;然后,每部分的点求一个“平均点”——身高的平均值作为平均身高、右手一拃的平均值作为平均右手一拃长,即(164,19),(177,21);最后,将这两点连接成一条直线。
同学7:我先将所有的点按从小到大的顺序进行排列,尽可能地平均分成三等份;每部分的点按照同学3的方法求一个“平均点”,最小的点为(161.3,18.2),中间的点为(170.5,20.1),最大的点为(179.2,21.3)。
高中数学必修三变量间的相关关系(三)教案教案课件
2.3变量间的相互关系(三)一、复习(1)两个变量间由函数关系时,数据点位于某曲线上.(2)两个变量间的关系是相关关系时,数据点位于某曲线附近.(3)两个变量间的关系为线性相关时,数据点位于某直线附近.该直线叫回归直线,对应的方程叫回归方程,该直线作为两个变量有线性相关关系的代表(4)求回归方程的一般步骤: 第一步,计算平均数;,y x第二步,求和;,∑∑==n i i n i ii x y x 121 第三步,计算;)())((1221121x b y a x n x y x n y x x x y y x x b ni i ni i i n i i n i i i -=--=---=∑∑∑∑====, 第四步,写出回归方程 .a bx y +=∧练习1.由一组10个数据(x i ,y i )算得,10,5==y x,292,583121==∑∑==ni i n i i i x y x 则b = ,a = ,回归方程为 .练习2. .).5,4(),4,3(),2,1(),3,2(),(之间的回归直线方程与求的值分别实验测得四组数据x y y x二、新授1. 两个变量是否有相关关系可以先作出散点图进行判断.2. 两个变量间是否有相关关系也可以通过求相关函数来判断. 其中∑∑∑===-⋅---=n i n i i i n i i i y y x xy y x x r 11221)()())(( .]75.0,1[时,负相关很强当--∈r.]1,75.0[时,正相关很强当∈r.]75.0,30.0[]30.0,75.0[时,相关性一般或当-∈-∈r r.),(1在一条直线上时,数据点当i i y x r =三、习题讲解关系数学成绩与物理成绩的④③吸烟与健康的关系关系②农作物产量与施肥的高的关系①父母的身高与子女身③下列属于线性相关的是)(.1),(.),0(.)0,(.)0,0(..2y x D y C x B A Da bx y )必过(线性回归方程+=∧ )(间的线性回归方程过点之与,则之间的数据如下表所示、已知D x y y x .3 ),(.),0(.)0,(.)0,0(.y x D y C x B A个单位平均增加个单位平均增加个单位平均减少个单位平均增加)(增加一个单位时,变量设有一个回归方程为3.5.5.3.53.4y D y C y B y A x x y -=)(下列判断正确的是,程为(千元)变化的回归方(元)与劳动生产率工人月工资B x y x y 805.5+= .2210.1301.801.1301.千元元,劳动生产率为当月工资为元;千元,则工资提高劳动生产率提高元;千元,则工资提高劳动生产率提高元;千元,则工资为劳动生产率为D C B A .2910610000062.05.93253246192161970.6人的船员数为人,对于最大的船估计小的船估计的船员数为人,对于最,船员平均人数相差,假定两船吨位相差结论:船员人数位的回归分析得到如下人,由船员人数关于吨人到数目从,船员的吨位区间从艘轮船的研究中,船的年的一项关于t x t t +=-活动目的:教育学生懂得“水”这一宝贵资源对于我们来说是极为珍贵的,每个人都要保护它,做到节约每一滴水,造福子孙万代。
人教版高中数学必修三(教案)2.3 变量之间的相关关系(4课时)
第一课时 2.3.1 变量之间的相关关系教学要求:通过收集现实问题中两个有关联变量的数据认识变量间的相关关系。
教学重点:通过收集现实问题中两个有关联变量的数据直观认识变量间的相关关系。
教学难点:变量之间相关关系的理解。
教学过程:一、新课准备:1.粮食产量与施肥量有关系吗?2. 提问:“名师出高徒”可以解释为教师的水平越高,学生的水平也越高。
教师的水平与学生的水平有什么关系?你能举出更多的描述生活中两个变量的相关关系的成语吗?(水滴石穿三人行必有我师等)二、讲授新课:1. 问题的提出1.请同学们如实填写下表(在空格中打“√” )学生讨论:我们可以发现自己的数学成绩和物理成绩存在某种关系。
(似乎就是数学好的,物理也好;数学差的,物理也差,但又不全对。
)物理成绩和数学成绩是两个变量,从经验看,由于物理学习要用到比较多的数学知识和数学方法。
数学成绩的高低对物理成绩的高低是有一定影响的。
但决非唯一因素,还有其它因素,如是否喜欢物理,用在物理学习上的时间等等。
(总结:不能通过一个人的数学成绩是多少就准确地断定他的物理成绩能达到多少。
但这两个变量是有一定关系的,它们之间是一种不确定性的关系。
如何通过数学成绩的结果对物理成绩进行合理估计有非常重要的现实意义。
)2.给出相关关系的概念1.相关关系的概念:两个变量之间的关系可能是确定的关系(如:函数关系),或非确定性关系。
当自变量取值一定时,因变量也确定,则为确定关系;当自变量取值一定时,因变量带有随机性,这种变量之间的关系称为相关关系。
相关关系是一种非确定性关系。
(分析:两个变量→自变量取值一定→因变量带有随机性→相关关系)2.例:商品销售收入与广告支出经费之间的关系。
(还与商品质量,居民收入,生活环境等有关)3.小结:1.现实生活中相关关系的实例。
2.相关关系的概念。
三.巩固练习1.练习:教材P76 1,2题。
2.分析:人的身高和年龄是一对相关关系。
因为在某一个年龄上,人的身高在取值上带有一定的随机性,如受遗传.营养.体育锻炼.心理素质等因素的影响。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
2.3 变量间的相关关系(教师用书独具)●三维目标1.知识与技能通过收集现实问题中两个有关联变量的数据,认识变量间的相关关系.2.过程与方法明确事物间的相互联系.认识现实生活中变量间除了存在确定的关系外,仍存在大量的非确定性的相关关系,并利用散点图直观体会这种相关关系.3.情感、态度与价值观通过对事物之间相关关系的了解,让学生们认识到现实中任何事物都是相互联系的辩证法思想.●重点难点重点:(1)通过收集现实问题中两个有关联变量的数据直观认识变量间的相关关系;(2)利用散点图直观认识两个变量之间的线性关系.难点:(1)变量之间相关关系的理解;(2)作散点图和理解两个变量的正相关和负相关.从现实生活入手,抓住学生们的注意力,引导学生分析得出概念,让学生真正参与到概念的形成过程中来.通过对典型事例的分析,向学生们介绍什么是散点图,并总结出如何从散点图上判断变量之间关系的规律.通过实验让学生们感受散点图的主要形成过程,并由此引出线性相关关系强化本节重点.通过学生讨论、交流,用TI图形计算器展示、对比自己作出的散点图,得出线性相关关系、正负相关关系的概念.教师及时将求线性方程的公式展示出来,通过例题的讲解和训练,进一步加深对散点图和回归方程的理解,突破难点.(教师用书独具)●教学建议结合本节课的教学内容和学生的认知水平,充分发挥教师的主导作用,让学生真正成为教学活动的主体.通过多媒体辅助教学,充分调动学生参与课堂教学的主动性与积极性.本节课宜采用探究式课堂教学模式,即在教学过程中,在教师的启发引导下,以学生独立自主和合作交流为前提,以“散点图”为基本探究内容,以周围世界和生活实际为参照对象,为学生提供充分自由表达、质疑、探究、讨论问题的机会,让学生通过个人、小组、集体等多种解难释疑的尝试活动,通过例题和变式训练进一步巩固本节知识,将自己所学知识应用于对现实生活的深入探讨.让学生在“活动”中学习,在“主动”中发展,在“合作”中增知,在“探究”中创新.●教学流程创设问题情境引入问题:人体内脂肪的含量与年龄之间有何关系?⇒错误!⇒错误!⇒错误!⇒通过例2及其变式训练,使学生掌握线性回归方程的求法⇒研究现实生活中的实际问题,应用本节知识完成例3及变式能够对总体进行估计⇒归纳整理,进行课堂小结,整体把握本节知识⇒完成当堂双基达标,巩固所掌握的知识,并进行反馈矫正(见学生用书第41页)下表是水稻产量与施化肥量的一组观测数据:【提示】散点图如下:2.施化肥量与水稻产量有关系吗?【提示】有关系.1.相关关系:不像匀速直线运动中时间与路程的关系那样是完全确定的,而是带有不确定性.2.散点图:将样本中几个数据点(x i,y i)(i=1,2,…,n)描在平面直角坐标系中得到的图形.3.正相关与负相关:散点图中的点散布在从左下角到右上角的区域,对于两个变量的这种相关关系,称它为正相关.若散点图中的点分布在从左上角到右下角的区域内,对于两个变量的这种相关关系,称它为负相关.【问题导思】一台机器由于使用时间较长,生产的零件有一些会有缺陷.按不同转速生产出有缺陷的零件的统计数据如下:【提示】2.从散点图中判断x 和y 之间是否具有相关关系? 【提示】 有.3.若转速为10转/秒,能否预测机器每小时生产缺陷的零件件数? 【提示】 可以.根据散点图作出一条直线,求出直线方程后可预测.1.回归直线:如果散点图中点的分布从整体上看大致在一条直线附近,就称这两个变量之间具有线性相关关系,这条直线叫做回归直线.2.回归方程:回归直线对应的方程叫回归直线的方程,简称回归方程. 3.最小二乘法求回归直线时,使得样本数据的点到回归直线的距离的平方和最小的方法叫做最小二乘法.4.求回归方程若两个具有线性相关关系的变量的一组数据为:(x 1,y 1),(x 2,y 2),…,(x n ,y n ),则所求的回归方程为y ∧=b ∧x +a ∧,其中a ∧,b ∧为待定的参数,由最小二乘法得:⎩⎪⎨⎪⎧b ∧=∑i =1nx i-x y i-y ∑i =1nx i-x 2=∑i =1nx i y i -n x -y-∑i =1nx 2i -n x -2,a ∧=y -b ∧x .b ∧是回归直线斜率,a ∧是回归直线在y 轴上的截距.(见学生用书第41页)以下是在某地搜集到的不同楼盘新房屋的销售价格y(单位:万元)和房屋面积x(单位:m2)的数据:(2)判断新房屋的销售价格和房屋面积之间是否具有相关关系?如果有相关关系,是正相关还是负相关?【思路探究】涉及两个变量房屋面积与销售价格,以房屋面积为自变量,考察销售价格的变化趋势从而做出判断.【自主解答】(1)数据对应的散点图如图所示:(2)通过以上数据对应的散点图可以判断,新房屋的销售价格和房屋的面积之间具有相关关系,且是正相关.两个随机变量x和y相关关系的确定方法:1.散点图法:通过散点图,观察它们的分布是否存在一定规律,直观地判断.2.表格、关系式法:结合表格或关系式进行判断.3.经验法:借助积累的经验进行分析判断.5个学生的数学和物理成绩如下表:【解】以x轴表示数学成绩,y轴表示物理成绩,可得相应的散点图如图所示,由散点图可知,两者之间具有线性相关关系,且是正相关.一个车间为了规定工时定额,需要确定加工零件所花费的时间,为此进行了10次试验,收集数据如下:(2)如果y与x具有线性相关关系,求y关于x的回归直线方程.【思路探究】 画散点图→确定相关关系→ 求回归直线系数→写回归直线方程 【自主解答】 (1)画散点图如下:由上图可知y 与x 具有线性相关关系. (2)列表、计算:x =55,y =91.7,∑i =110=x 2i =38 500,∑i =110y 2i =87 777,∑i =110x i y i =55 950b ∧=∑i =110x i y i -10x y∑i =110x 2i -10x 2=55 950-10×55×91.738 500-10×552≈0.668, a ∧=y -b ∧x =91.7-0.668×55=54.96.即所求的回归直线方程为:y ∧=0.668x +54.96.用公式求回归方程的一般步骤: 1.列表x i ,y i ,x i y i ;2.计算x ,y ,∑ni =1x 2i ,∑ni =1x i y i ; 3.代入公式计算b ∧、a ∧的值; 4.写出回归方程.从某一行业随机抽取12家企业,它们的生产产量与生产费用的数据如下表:(2)如果两个变量之间是线性相关关系,请用最小二乘法求出其回归直线方程. 【解】 (1)两个变量x 和y 之间的关系的散点图如图所示.(2)根据散点图可知,两个变量x 和y 之间的关系是线性相关关系.下面用最小二乘法求回归直线方程.x ≈87.08,y ≈160.1,n x y =167 298.096,n x 2≈90 995.116 8设所求的回归直线方程是y ∧=b ∧x +a ∧,所以b ∧=∑i =1nx i y i -n x y∑i =1nx 2i -n x 2=173 094-167 298.096104 835-90 995.116 8=5 795.90413 839.883 2≈0.42,a ∧=y -b ∧x =160.1-0.42×87.08≈123.53.所求的回归直线方程是y ∧=0.42x +123.53.(12分)下表提供了某厂节能降耗技术改造后生产甲产品过程中记录的产量x (吨)与相应的生产能耗y (吨标准煤)的几组对照数据:(1)(2)请根据上表提供的数据,用最小二乘法求出回归方程y ∧=b ∧x +a ∧;(3)已知该厂技改前100吨甲产品的生产能耗为90吨标准煤.试根据(2)求出的线性回归方程,预测生产100吨甲产品的生产能耗比技改前降低多少吨标准煤?【思路探究】 (1)以产量为横坐标,以生产能耗对应的测量值为纵坐标,在平面直角坐标系内画散点图;(2)应用计算公式求得线性相关系数b ∧,a ∧的值;(3)实际上就是求当x =100时,对应的y 的值.【自主解答】 (1)散点图,如图所示.(2)由题意,得∑i =14x i y i =3×2.5+4×3+5×4+6×4.5=66.5,x =3+4+5+64=4.5, y =2.5+3+4+4.54=3.5,∑i =14x 2i =32+42+52+62=86,∴b ∧=66.5-4×4.5×3.586-4×4.52=66.5-6386-81=0.7, a ∧=y -b ∧x =3.5-0.7×4.5=0.35,故线性回归方程为y ∧=0.7x +0.35.(3)根据回归方程的预测,现在生产100吨产品消耗的标准煤为0.7×100+0.35=70.35(吨),故耗能减少了90-70.35=19.65(吨标准煤).1.回归分析是寻找相关关系中非确定性关系的某种确定性.2.只有当两个变量之间存在线性相关关系时,才能用回归直线方程对总体进行估计和预测.否则,如果两个变量之间不存在线性相关关系,即使由样本数据求出回归直线方程,用其估计和预测结果也是不可信的.炼钢是一个氧化降碳的过程,钢水含碳量的多少直接影响冶炼时间的长短,必须掌握钢水含碳量和冶炼时间的关系.如果已测得炉料熔化完毕时,钢水含碳量x 与冶炼时间y (从炉料熔化完毕到出钢的时间)的几种对应数据如下表所示:(2)求回归直线方程;(3)预测当钢水含碳量为160个0.01%时应冶炼多少分钟.【解】 (1)以x 轴表示含碳量,y 轴表示冶炼时间,可作散点图如图所示.从图中可以看出,各点散布在一条直线附近,即它们线性相关. (2)列表如下:x =159.8,y =172,∑i =110x 2i =265 448,∑i =110x i y i =287 640设所求的回归直线方程为y ∧=b ∧x +a ∧.b ∧=∑i =110x i y i -10x y∑i =110x 2i -10x 2=287 640-10×159.8×172265 448-10×159.82≈1.27,a ∧=y -b ∧x ≈172-1.27×159.8≈-30.95,即所求的回归直线方程为y ∧=1.27x -30.95.(3)当x =160时,y ∧=1.27×160-30.95≈172(分),即大约冶炼172分钟.(见学生用书第43页)数形结合在线性相关性中的应用(12分)下表数据是退水温度x(℃)对黄硐延长性y(%)效应的试验结果,y是以延长度计算的,且对于给定的x,y为正态变量,其方差与x无关.(2)指出x,y是否线性相关;(3)若线性相关,求y关于x的线性回归方程;(4)估计退水温度是1 000 ℃时,黄硐延长性的情况.【思路点拨】根据所给数据画出散点图,然后可借助函数的思想分析.【规范解答】(1)散点图如图所示.4分(2)由散点图可以看出样本点分布在一条直线的附近,可见y与x线性相关.(3)列出下表,并用科学计算器进行有关计算.b ∧=∑i =16x i y i -6x y∑i =16x 2i -6x 2=198 400-6×550×571 990 000-6×5502 ≈0.058 857,a ∧=y -b ∧x =57-0.058 857×550=24.628 65.9分因此所求的线性回归方程为y ∧=0.058 857x +24.628 65.(4)将x =1 000代入回归方程得y ∧=0.058 857×1 000+24.628 65=83.486,即退水温度是1 000 ℃时,黄硐延长性大约是83.486%.1.在研究两个变量是否存在某种关系时,必须从散点图入手,对于散点图,可以做出如下判断:(1)如果所有的样本点都落在某一函数曲线上,那么就用该函数来描述变量之间的关系,即变量之间具有函数关系;(2)如果所有的样本点都落在某一函数曲线附近,那么变量之间具有相关关系;(3)如果所有的样本点都落在某一直线附近,那么变量之间具有线性相关关系.2.利用散点图判断两个变量之间是否具有线性相关关系,体现了数形结合思想的作用,而用回归直线方程进行估计又体现了函数与方程思想的应用.1.判断变量之间有无相关关系,一种简便可行的方法就是绘制散点图.根据散点图,可以很容易看出两个变量是否具有相关关系,是否线性相关,是正相关还是负相关.2.求回归直线方程时应注意的问题(1)知道x 与y 呈线性相关关系,无需进行相关性检验,否则应首先进行相关性检验,如果两个变量之间本身不具有相关关系,或者说,它们之间的相关关系不显著,即使求出回归方程也是毫无意义的,而且用其估计和预测的量也是不可信的.(2)用公式计算a ∧,b ∧的值时,要先算出b ∧,然后才能算出a ∧.3.利用回归方程,我们可以进行估计和预测.若回归直线方程为y ∧=b ∧x +a ∧,则x =x 0处的估计值为y ∧0=b ∧x 0+a ∧.由于回归直线将部分观测值所反映的规律进行了延伸,所以它在情况预报、资料补充等方面有着广泛的应用.(见学生用书第44页)1.下列变量之间的关系是相关关系的是( ) A .正方体的表面积与体积 B .光照时间与果树产量C .匀速行驶车辆的行驶距离与时间D .中国足球队的比赛成绩与中国乒乓球队的比赛成绩 【解析】 A 、C 是函数关系,D 无相关关系. 【答案】 B2.设一个回归方程y ∧=3+1.2x ,则变量x 增加一个单位时( ) A .y 平均增加1.2个单位 B .y 平均增加3个单位 C .y 平均减少1.2个单位 D .y 平均减少3个单位【解析】 由b =1.2>0,故选A. 【答案】 A3.若施化肥量x (千克/亩)与水稻产量y (千克/亩)的回归方程为y ∧=5x +250,当施化肥量为80千克/亩时,预计水稻产量为亩产________千克左右.【解析】 当x =80时,y ∧=400+250=650. 【答案】 6504.某公司利润y (单位:千万元)与销售总额x (单位:千万元)之间有如下表对应数据:(2)判断y 与x 是否具有线性相关关系. 【解】 (1)散点图如下:(2)由图可知,所有数据点接近直线排列,因此,认为y与x有线性相关关系,且为正相关.(见学生用书第105页)一、选择题1.判断下列图形中具有相关关系的两个变量是( )【解析】A、B为函数关系,D无相关关系.【答案】 C2.(2013·广州高一检测)已知x与y之间的一组数据:则y与x的线性回归方程y=bx+a必过点( )A.(1,2) B.(5,2)C.(2,5) D.(2.5,5)【解析】线性回归方程一定过样本中心(x,y).由x =0+1+2+3+45=2,y =1+3+5+7+95=5.故必过点(2,5). 【答案】 C3.(2013·长沙高一检测)某商品销售量y (件)与销售价格x (元/件)呈负相关,其回归方程可能是( )A.y ∧=-10x +200 B.y ∧=10x +200C.y ∧=-10x -200 D.y ∧=10x -200【解析】 由于y 与x 呈负相关,∴x 的系数为负, 又y 不能为负值,∴常数必须是正值. 【答案】 A4.两个相关变量满足如下关系:A.y ∧=0.56x +997.4 B.y ∧=0.63x -231.2C.y ∧=50.2x +501.4 D.y ∧=60.4x +400.7 【解析】 x =15(10+15+20+25+30)=20,y =15(1 003+1 005+1 010+1 011+1 014)=1 008.6,代入所给选项A 符合. 【答案】 A5.(2012·湖南高考)设某大学的女生体重y (单位:kg)与身高x (单位:cm)具有线性相关关系,根据一组样本数据(x i ,y i )(i =1,2,…,n ),用最小二乘法建立的回归方程为y ∧=0.85x -85.71,则下列结论中不正确...的是( ) A .y 与x 具有正的线性相关关系 B .回归直线过样本点的中心(x ,y )C .若该大学某女生身高增加1 cm ,则其体重约增加0.85 kgD .若该大学某女生身高为170 cm ,则可断定其体重必为58.79 kg【解析】 由于线性回归方程中x 的系数为0.85,因此y 与x 具有正的线性相关关系,故A 正确.又线性回归方程必过样本中心点(x ,y ),因此B 正确.由线性回归方程中系数的意义知,x 每增加1 cm ,其体重约增加0.85 kg ,故C 正确.当某女生的身高为170 cm 时,其体重估计值是58.79 kg ,而不是具体值,因此D 不正确.【答案】 D 二、填空题6.调查了某地若干户家庭的年收入x (单位:万元)和年饮食支出y (单位:万元),调查显示年收入x 与年饮食支出y 具有线性相关关系,并由调查数据得到y 对x 的回归直线方程:y ∧=0.254x +0.321.由回归直线方程可知,家庭年收入每增加1万元,年饮食支出平均增加________万元.【解析】 由于y ∧=0.254x +0.321知,当x 增加1万元时,年饮食支出y 增加0.254万元.【答案】 0.2547.某服装商场为了了解毛衣的月销售量y (件)与月平均气温x (℃)之间的关系,随机统计了某4个月的月销售量与当月平均气温,其数据如下表:由表中数据算出线性回归方程中的b =-2.气象部门预测下个月的平均气温约为6 ℃,据此估计,该商场下个月毛衣的销售量约为________件.【解析】 样本中心点是(10,35.5), 则a ∧=y --b ∧x -=35.5-(-2)×10=55.5, 故线性回归方程为y ∧=-2x +55.5,将x =6代入得y ∧=-2×6+55.5=43.5≈44. 【答案】 448.某公司的广告费支出x 与销售额y (单位:万元)之间有下列对应数据(由资料显示y 与x 呈线性相关关系):根据上表提供的数据得到回归方程y =b x +a 中的b =6.5,预测销售额为115万元时约需________万元广告费.【解析】 x =15(2+4+5+6+8)=5,y =15(30+40+60+50+70)=50,由b ∧=6.5知,a ∧=y -b ∧·x =50-6.5×5=17.5,∴y ∧=17.5+6.5x ,当y ∧=115时,解得x =15. 【答案】 15 三、解答题9.某工厂对某产品的产量与成本的资料分析后有如下数据:(1)画出散点图;(2)求成本y 与产量x 之间的线性回归方程.(结果保留两位小数) 【解】 (1)散点图如图所示.(2)设y 与产量x 的线性回归方程为y ∧=b ∧x +a ∧,x =2+3+5+64=4,y =7+8+9+124=9, b ∧=∑i =1nx i y i -n x y∑i =1nx 2i -n x 2=x 1y 1+x 2y 2+x 3y 3+x 4y 4-4x yx 21+x 22+x 23+x 24-4x2=1110=1.10, a ∧=y -b ∧x =9-1.10×4=4.60.∴回归方程为:y ∧=1.10x +4.60.10.高三(1)班的10名学生每周用于数学学习的时间x (h)与数学成绩y (分)之间有如下对应数据:【解】 列出下表,并用科学计算器进行有关计算.b ∧=∑i =110x i y i -10x·y∑i =110x 2i -10x2=545.4154.4≈3.53, a ∧=y -b ∧x =74.9-3.53×17.4≈13.48,∴所求的回归方程是y ∧=3.53x +13.48.11.某地最近十年粮食需求量逐年上升,下表是部分统计数据:(1)(2)利用(1)中所求出的直线方程预测该地2014年的粮食需求量.【解】 (1)由所给数据看出,年需求量与年份之间是近似直线上升,下面来求回归直线方程,先将数据预处理如下:对预处理的数据,容易算得x =0,y =3.2,b ∧=--+--+2×19+4×2942+22+22+42=26040=6.5, a ∧=y -b ∧x =3.2.由上述计算结果,知所求回归直线方程为y ∧-257=b ∧(x -2 006)+a ∧=6.5(x -2 006)+3.2. 即y ∧=6.5×(x -2 006)+260.2.(2)利用所求得的回归方程,可预测2014年的粮食需求量为 6.5×(2 014-2 006)+260.2=6.5×8+260.2=312.2(万吨).(教师用书独具)一般地,一个人的身高越高,他的手就越大.为了调查这一问题,对10名高三男生的身高与右手一拃长测量得如下数据(单位:cm):(2)如果两个变量近似成线性关系,求线性回归方程; (3)如果一个学生身高185 cm ,估计他的右手一拃长.【思路探究】 作散点图→判断→求a ∧,b ∧→得回归方程→估计 【自主解答】 (1)以横轴表示身高,以纵轴表示一拃长,作散点图.由散点图可以看出,各点散布在一条直线附近,即它们线性相关.(2)设线性回归方程为y ∧=b ∧x +a ∧.用计算器计算可得b ∧≈0.303,a ∧≈-31.246,∴回归方程为y ∧=0.303x -31.246.(3)当x =185时,y ∧=24.809.即一个学生身高185 cm ,估计他的右手一拃长24.809 cm.在10年间,某城市居民的年收入x (万元)与某种商品的销售额y (万元)之间的关系有如下数据:(2)如果散点图中的各点大致分布在一条直线的附近,求y 与x 之间的回归直线方程. 【解】 (1)散点图如图所示:(2)列表如下:x =37.97,y =39.1,∑i =110x 2i =14 663.67,∑i =110x i y i =15 202.9b ∧=∑i =110x i y i -10x -y-∑i =110x 2i -10 x 2=15 202.9-10×37.97×39.114 663.67-10×37.972=356.63246.461≈1.447, a ∧=y --b ∧x -=39.1-1.447×37.97≈-15.843,因此所求的回归直线方程是y ∧=b ∧x +a ∧=1.447x -15.843.(见学生用书第45页)三种方法的共同特点是在抽样过程中每个个体被抽取的机会相同,体现了这些抽样方法的客观性和公平性.其中简单随机抽样是最简单和最基本的抽样方法.在进行系统抽样和分层抽样时都要用到简单随机抽样方法.当总体中的个体数较少时,常采用简单随机抽样;当总体中的个体数较多时,常采用系统抽样;当已知总体由差异明显的几部分组成时,常采用分层抽样.实现简单随机抽样,常用抽签法和随机数表法.某装订厂平均每小时装订图书362册,要求检验员每小时抽取40册图书检验其质量情况,请设计一个抽样方案.【思路点拨】因为总体容量比较大,样本容量也比较大,所以可用系统抽样的方法抽样.【规范解答】第一步:把这些图书分成40个小组,由于362÷40的商是9,余数是2,所以每个组有9册书,还剩余2册书,这时抽样间距就是9;第二步:先用简单随机抽样的方法从这些书中抽取2册书,不进行检查; 第三步:将剩下的书进行编号,编号分别为0,1, (359)第四步:从第一组(编号为0,1,…,8)书中用简单随机抽样的方法,抽取1册书,设其编号为k ;第五步:抽取编号分别为下面数字的书:k ,k +9,k +18,k +27,…,k +39×9,这样就抽取了有40个个体的样本.某工厂平均每天生产某种机器零件大约10 000件,要求产品检验员每天抽取50件零件检查其质量状况,假设一天的生产时间中生产机器零件的件数是均等的,请你设计一个抽样方案.【解】 第一步:按生产时间将一天分为50个时间段,也就是说,每个时间段大约生产10 00050=200件产品,这时抽样间距就是200;第二步:将一天中生产的零件进行顺序编号,比如第一个生产出来的零件就是0号,第二个生产出来的零件就是1号等等;第三步:从第一个时间段中按照简单随机抽样的方法抽取一个产品,比如是第k 号零件; 第四步:顺次地抽取编号分别为下列数字的零件:k +200,k +400,k +600,…,k +9 800,这样就抽取了一个容量为50的样本.的方法,明确图表中有关数据的意义是正确分析问题的关键.从图形与图表中获取有关信息加以整理,是近年来高考命题的热点问题.(1)用样本频率分布估计总体频率分布时,通常要对给定的一组数据进行列表、作图处理,作频率分布表与频率分布直方图时要注意其方法步骤.(2)茎叶图刻画数据有两个优点:一是所有信息都可以从图中得到,二是便于记录和表示,但数据位数较多时不方便.某中学高一女生共有450人,为了了解高一女生的身高情况,随机抽取部分高一女生测量身高,所得数据整理后列出频率分布表如下:(1)(2)在给出的直角坐标系中画出频率分布直方图;(3)估计该校高一女生身高在149.5~165.5 cm范围内有多少人?【思路点拨】利用频率分布表的特征求出m,n,M,N,根据画频率分布直方图的步骤画出频率分布直方图,最后利用图形估计总体的分布.【规范解答】(1)由题意M=80.16=50,落在区间165.5~169.5内数据频数m=50-(8+6+14+10+8)=4,频率为n=0.08,总频率N=1.00.(2)(3)该所学校高一女生身高在149.5~165.5 cm之间的比例为0.12+0.28+0.20+0.16=0.76,则该校高一女生在此范围内的人数为450×0.76=342(人).下表给出了某校500名12岁男孩中用随机抽样得出的120人的身高资料(单位:cm)(2)画出频率分布直方图;(3)估计身高低于134 cm 的人数占总人数的百分比. 【解】 (1)列出样本频率分布表:(2)(3)因为样本中身高低于134 cm 的人数的频率为 5+8+10120=23120≈0.19. 所以估计身高低于134 cm 的人数约占总人数的19%.总体的平均数与标准差往往通过样本的平均数、标准差来估计.一般地,样本容量越大,对总体的估计越精确.平均数描述集中趋势,方差、标准差描述波动大小,也可以说方差、标准差反映各个数据与其平均数的离散程度.一组数据的方差或标准差越大,说明这组数据波动越大.方差的单位是原数据单位的平方,标准差的单位与原单位相同.某化肥厂甲、乙两个车间包装肥料,在自动包装传送带上每隔30 min抽取一包产品,称其重量,分别记录抽查数据如下:甲:102,101,99,98,103,98,99 乙:110,115,90,85,75,115,110 (1)这种抽样方法是哪一种? (2)将这两组数据用茎叶图表示;(3)将两组数据比较,说明哪个车间产品较稳定. 【思路点拨】 (1)由简单随机抽样的特点判断. (2)“茎”上写十位或百位,“叶”上写个位. (3)计算方差的大小比较稳定性.【规范解答】 (1)根据三种抽样的特点可知为系统抽样. (2)茎叶图为:(3)x 甲=17(102+101+99+103+98+99+98)=100,x 乙=17(110+115+90+85+75+115+110)=100,所以x 甲=x 乙=100.s 2甲=17[(102-100)2+(101-100)2+(99-100)2+(103-100)2+(98-100)2+(99-100)2+(98-100)2]≈3.428 6,s 2乙=17[(110-100)2+(115-100)2+(90-100)2+(85-100)2+(75-100)2+(115-100)2+(110-100)2]≈228.571 4.由于x甲=x乙,s2甲<s2乙,所以甲车间产品较稳定.如图2-1是甲、乙两个数字网站在24天中每天的点击量统计的茎叶图,据图回答下列各题:(1)请说明哪个网站更受欢迎;(2)若每次点击给网站带来0.2元的收益,则甲、乙网站每天的平均收益各约为多少元?【解】(1)由茎叶图可知,甲网站点击量集中在60次以下,而乙网站点击量集中在60次以上,故乙网站更受欢迎.(2)x甲=124×(32+39×4+44×4+49×2+51+54×4+55+63+67×2+72+73+83×2)=124×1 292≈54;x乙=124×(37×3+51+53×2+65×6+67+70+73×6+79+80+86×2)=124×1564≈65,∴甲网站每天的平均收益约为0.2×54=10.8(元),乙网站每天的平均收益约为0.2×65=13(元).之间的关系——相关关系.在本章中,我们学习了一元线性相关关系,通过建立回归直线方程就可以根据其部分观测值,获得对这两个变量之间的整体关系的了解.借助散点图可以直观地看出两个变量之间是否具有相关关系,用最小二乘法建立线性回归方程,定量地描述两个变量的关系.下面是水稻产量与施化肥量的一组观测数据:(2)你能从散点图中发现施化肥量与水稻产量近似成什么关系吗?水稻产量会一直随施化肥量的增加而增长吗?【思路点拨】两变量是否具有线性相关关系,要看大部分点是否分布在一条直线附近,个别点是不是影响“大局”.【规范解答】(1)散点图如下:(2)从图中可以发现施化肥量与水稻产量具有线性正相关关系,当施化肥量由小到大变化时,水稻产量由小变大,图中的数据点大致分布在一条直线的附近,因此施化肥量和水稻产量近似成线性正相关关系,但水稻产量只是在一定范围内随着化肥施用量的增加而增长.某5名学生的总成绩和数学成绩如下表:(2)如果一个学生的总成绩为450分,试预测这个学生的数学成绩.【解】 (1)列表:b ∧=∑i =15x i y i -5x·y∑i =15x 2i -5x 2=137 760-5×2 0125×3395819 794-2 01252≈0.132,a ∧=y -b ∧x ≈3395-0.132×2 0125≈14.683. ∴回归方程为y ∧=0.132x +14.683.(2)根据上面求得的回归方程,当总成绩为450分时,y ∧=0.132×450+14.683≈74. 即数学成绩大约为74分.本思想,解题的过程实际上就是一步步转化的过程.统计中充分体现了转化与化归的思想方法,如部分与整体的转化、数与图的转化、随机性问题与确定性问题的转化等.甲、乙两人在相同的条件下各射靶10次,每次射靶成绩(单位:环)如图2-2所示.图2-2(1)填写下表:①从平均数和方差结合分析偏离程度; ②从平均数和中位数结合分析谁的成绩好些;③从平均数和命中9环以上的次数相结合看谁的成绩好些; ④从折线图上两人射击命中环数及走势分析谁更有潜力.【思路点拨】 结合图形完成表(1),由数字特征对总体作出估计.【规范解答】 (1)乙的射靶环数依次为2,4,6,8,7,7,8,9,9,10.所以x 乙 =110(2+4+6+8+7+7+8+9+9+10)=7,乙的射靶环数从小到大排列为2,4,6,7,7,8,8,9,9,10,所以中位数是7+82=7.5;甲的射靶环数从小到大排列为5,6,6,7,7,7,7,8,8,9,所以中位数为7.于是填充后的表格如下表所示:甲乙平均数的程度大.②甲、乙的平均水平相同,而乙的中位数比甲大,说明乙射靶环数的优秀次数比甲多.。