高中数学必修三《相关关系的强与弱》优秀教学设计

合集下载

高中数学第二章统计2.3变量的相关性2.3.1-2.3.2变量间的相关关系两个变量的线性相关教学案新人教B版必修3

高中数学第二章统计2.3变量的相关性2.3.1-2.3.2变量间的相关关系两个变量的线性相关教学案新人教B版必修3

2.3.1 & 2.3.2 变量间的相关关系 两个变量的线性相关习课本P73~78,思考并完成以下问题预(1)相关关系是函数关系吗?(2)什么是正相关、负相关?与散点图有什么关系?(3)回归直线方程是什么?如何求回归系数?(4)如何判断两个变量之间是否具备相关关系?[新知初探]1.两个变量的关系分类函数关系相关关系 特征两变量关系确定两变量关系带有随机性2.散点图将样本中n 个数据点(x i ,y i )(i =1,2,…,n )描在平面直角坐标系中得到的图形. 3.正相关与负相关(1)正相关:如果一个变量的值由小变大时,另一个变量的值也由小变大,这种相关称为正相关.(2)负相关:如果一个变量的值由小变大时,另一个变量的值由大变小,这种相关称为负相关.4.最小二乘法设x ,Y 的一组观察值为(x i ,y i ),i =1,2,…,n ,且回归直线方程为y ^=a +bx ,当x 取值x i (i =1,2,…,n )时,Y 的观察值为y i ,差y i -y ^i (i =1,2,…,n )刻画了实际观察值y i 与回归直线上相应点纵坐标之间的偏离程度,通常是用离差的平方和,即Q =i =1n(y i -a-bx i)2作为总离差,并使之达到最小.这样,回归直线就是所有直线中Q取最小值的那一条.由于平方又叫二乘方,所以这种使“离差平方和最小”的方法,叫做最小二乘法.5.回归直线方程的系数计算公式回归直线方程回归系数系数a^的计算公式方程或公式y^=a^+b^x b^=∑i=1nxiyi-n x-y-∑i=1nx2i-n x2a^=y-b^x-上方加记号“^ ”的意义区分y的估计值y^与实际值ya,b上方加“^ ”表示由观察值按最小二乘法求得的估计值[小试身手]1.下列命题正确的是( )①任何两个变量都具有相关关系;②圆的周长与该圆的半径具有相关关系;③某商品的需求量与该商品的价格是一种非确定性关系;④根据散点图求得的回归直线方程可能是没有意义的;⑤两个变量间的相关关系可以通过回归直线,把非确定性问题转化为确定性问题进行研究.A.①③④B.②③④C.③④⑤D.②④⑤解析:选C ①显然不对,②是函数关系,③④⑤正确.v,u;对变量1,得散点图图10),…,1,2=i)(iy,ix(有观测数据y,x.对变量2)(由这两个散点图可以判断2.,得散点图图10),…,1,2=i)(iv,iu(有观测数据A.变量x与y正相关,u与v正相关B.变量x与y正相关,u与v负相关C .变量x 与y 负相关,u 与v 正相关D .变量x 与y 负相关,u 与v 负相关解析:选C 由这两个散点图可以判断,变量x 与y 负相关,u 与v 正相关.80,当施肥量为250+x 5=y ^归方程为的线性回(kg)y 与水稻产量(kg)x .若施肥量3kg 时,预计水稻产量约为________kg..650(kg)=250+5×80=y ^代入回归方程可得其预测值80=x 解析:把 答案:6504.对具有线性相关关系的变量x 和y ,测得一组数据如下表所示.x 2 4 5 6 8y 30 40 60 50 70若已求得它们的回直线的方程为______________________.,5=2+4+5+6+85=x 解析:由题意可知 y50.=30+40+60+50+705=即样本中心为(5,50).,a ^+x 6.5=y ^设回归直线方程为 ,)y ,x (回归直线过样本中心∵ ,7.51=a ^,即a ^+6.5×5=50∴ 17.5+x 6.5=y ^回归直线方程为∴ 17.5+x 6.5=y ^答案:相关关系的判断[典例] (1) ①正方形的边长与面积之间的关系; ②农作物的产量与施肥量之间的关系; ③人的身高与年龄之间的关系;④降雪量与交通事故的发生率之间的关系. (2)某个男孩的年龄与身高的统计数据如下表所示.年龄x (岁)123456身高y (cm)78 87 98 108 115 120①画出散点图;②判断y 与x 是否具有线性相关关系.[解析] (1)在①中,正方形的边长与面积之间的关系是函数关系;在②中,农作物的产量与施肥量之间不具有严格的函数关系,但具有相关关系;在③中,人的身高与年龄之间的关系既不是函数关系,也不是相关关系,因为人的年龄达到一定时期身高就不发生明显变化了,因而它们不具有相关关系;在④中,降雪量与交通事故的发生率之间具有相关关系.答案:②④(2)解:①散点图如图所示.②由图知,所有数据点接近一条直线排列,因此,认为y 与x 具有线性相关关系.两个变量是否相关的两种判断方法(1)根据实际经验:借助积累的经验进行分析判断.(2)利用散点图:通过散点图,观察它们的分布是否存在一定的规律,直观地进行判断.[活学活用]如图所示的两个变量不具有相关关系的是________(填序号).解析:①是确定的函数关系;②中的点大都分布在一条曲线周围;③中的点大都分布在一条直线周围;④中点的分布没有任何规律可言,x ,y 不具有相关关系.答案:①④求回归方程[典例] (1)已知变量x 与y 正相关,且由观测数据算得样本平均数x =3,y =3.5,则由该观测数据算得的线性回归方程可能是( )A.y ^=0.4x +2.3B.y ^=2x -2.4C.y ^=-2x +9.5 D.y ^=-0.3x +4.4(2)一台机器按不同的转速生产出来的某机械零件有一些会有缺点,每小时生产有缺点的零件的多少随机器的运转的速度的变化而变化,下表为抽样试验的结果:转速x (转/秒)16 14 12 8 每小时生产有缺点的零件数y (件)11985①画出散点图;②如果y 对x 有线性相关关系,请画出一条直线近似地表示这种线性关系; ③在实际生产中,若它们的近似方程为y =5170x -67,允许每小时生产的产品中有缺点的零件最多为10件,那么机器的运转速度应控制在什么范围内?[解析] (1)依题意知,相应的回归直线的斜率应为正,排除C 、D.且直线必过点(3,3.5),代入A 、B 得A 正确.答案:A(2)解:①散点图如图所示:②近似直线如图所示:秒/转14,所以机器的运转速度应控制在≤14.9x ,解得≤1067-x 5170得≤10y 由③内.求回归直线方程的步骤.)数据一般由题目给出)(n ,…,1,2=i )(i y ,i x (收集样本数据,设为(1) (2)作出散点图,确定x ,y 具有线性相关关系..i y i x ,2i x ,i y ,i x 把数据制成表格(3).iy i ∑i =1nx ,2i ∑i =1n x ,y ,x 计算(4) ⎩⎪⎨⎪⎧b ^=∑i =1nxiyi -n x y ∑i =1n x2i -n x 2,a ^=y -b ^ x .,公式为a ^,b ^代入公式计算(5).a ^+x b ^=y ^写出回归直线方程(6) [活学活用]已知变量x ,y 有如下对应数据:x 1 2 3 4 y1345(1)作出散点图;(2)用最小二乘法求关于x ,y 的回归直线方程. 解:(1)散点图如图所示.,52=1+2+3+44=x (2) y ,134=1+3+4+54=∑i=14x 39.=20+12+6+1=i y i ∑i =14x 2i ,30=16+9+4+1= b^,1310=39-4×52×13430-4×⎝ ⎛⎭⎪⎫522=a^,0=52×1310-134= .为所求的回归直线方程x 1310=y ^所以 利用线性回归方程对总体进行估计[典例x (吨)与相应的生产能耗y (吨标准煤)的几组对照数据:x 3 4 5 6 y2.5344.5(1)请画出上表数据的散点图;(2)请根据上表提供的数据,求出y 关于x 的回归直线方程y ^=b ^x +a ^;(3)已知该厂技改前100吨甲产品的生产能耗为90吨标准煤.试根据(2)求出的回归直线方程,预测生产100吨甲产品的生产能耗比技改前降低了多少吨标准煤?[解] (1)散点图如图:,3.5=2.5+3+4+4.54=y ,4.5=3+4+5+64=x (2) ∑i=14x ,66.5=6×4.5+5×4+4×3+3×2.5=i y i ∑i=14x 2i ,86=26+25+24+23= ∑i =14xiyi -4xy∑i =14x2i -4x 2=b ^所以 ,0.7=66.5-4×4.5×3.586-4×4.52=a ^0.35.=0.7×4.5-3.5=x b ^-y = 0.35.+x 0.7=y ^所以所求的线性回归方程为 ,)吨标准煤70.35(=0.35+0.7×100=y ^时,100=x 当(3) 90-70.35=19.65(吨标准煤).即生产100吨甲产品的生产能耗比技改前降低了19.65吨标准煤.只有当两个变量之间存在线性相关关系时,才能用回归直线方程对总体进行估计和预测.否则,如果两个变量之间不存在线性相关关系,即使由样本数据求出回归直线方程,用其估计和预测结果也是不可信的.[活学活用](重庆高考)随着我国经济的发展,居民的储蓄存款逐年增长.设某地区城乡居民人民币储蓄存款(年底余额)如下表:年份 2010 2011 2012 2013 2014 时间代号t 1 2 3 4 5 储蓄存款y (千亿元)567810(1)求y 关于t 的回归方程y ^=b ^t +a ^;(2)用所求回归方程预测该地区2015年(t =6)的人民币储蓄存款. 解:(1)列表计算如下:it iy it 2it i y i1 1 5 1 52 2 6 4 123 3 7 9 214 4 8 16 325 5 10 25 50 ∑153655120这里n =5,t -=1n ∑i =1n t i =155=3,y -=1n ∑i =1n y i =365=7.2.又∑i =1nt2i -n t -2=55-5×32=10,i =1n t i y i -n t-y -=120-5×3×7.2=12,从而b ^=1210=1.2,a ^=y --b ^t -=7.2-1.2×3=3.6,故所求回归方程为y ^=1.2t +3.6.(2)将t =6代入回归方程可预测该地区2015年的人民币储蓄存款为y ^=1.2×6+3.6=10.8(千亿元).[层级一 学业水平达标]1.下列变量具有相关关系的是( )A .人的体重与视力B .圆心角的大小与所对的圆弧长C .收入水平与购买能力D .人的年龄与体重解析:选C B 为确定性关系;A ,D 不具有相关关系,故选C.2.已知变量x ,y 之间具有线性相关关系,其散点图如图所示,则其回归方程可能为2+x 1.5=y ^A. 2+x 1.5=-y ^B. 2-x 1.5=y ^C. 2-x 1.5=-y ^D. 之间负相关,回归直线y ,x ,由散点图可知变量a ^+x b ^=y ^设回归方程为 B 解析:选 2.+x 1.5=-y ^,因此方程可能为>0a ^,<0b ^轴上的截距为正数,所以y 在 个样本点,n 的y 和x 是变量)n y ,n x (,…,)2y ,2x (,)1y ,1x (设3.直线l 是由这些样本点通过最小二乘法得到的线性回归直线如图所示,则以下结论正确的是( ))y ,x (过点l .直线A B .回归直线必通过散点图中的多个点C .直线l 的斜率必在(0,1)D .当n 为偶数时,分布在l 两侧的样本点的个数一定相同解析:选A A 是正确的;回归直线可以不经过散点图中的任何点,故B 错误;回归直线的斜率不确定,故C 错误;分布在l 两侧的样本点的个数不一定相同,故D 错误. 4.一项关于16艘轮船的研究中,船的吨位区间为[192,3 246](单位:吨),船员的,x 0.006 2+9.5=y ^的回归方程为x 关于吨位y 人,船员人数32~5人数 (1)若两艘船的吨位相差1 000,求船员平均相差的人数;(2)估计吨位最大的船和最小的船的船员人数.,则2x ,1x 设两艘船的吨位分别为(1)解: y^)2x 6 20.00+(9.5-1x 0.006 2+9.5=2y ^-1 =0.006 2×1 000≈6, 即船员平均相差6人.,0.006 2×192≈11+9.5=y ^时,192=x 当(2) 0.006 2×3 246≈30.+9.5=y ^时,3 246=x 当 即估计吨位最大和最小的船的船员数分别为30人和11人.[层级二 应试能力达标]1.一个口袋中有大小不等的红、黄、蓝三种颜色的小球若干个(大于5个),从中取5次,那么取出红球的次数和口袋中红球的数量是( ) A .确定性关系 B .相关关系 C .函数关系D .无任何关系 解析:选 B 每次从袋中取球取出的球是不是红球,除了和红球的个数有关外,还与球的大小等有关系,所以取出红球的次数和口袋中红球的数量是一种相关关系.,下x 80+50=y ^变化的回归直线方程为)千元(x 依劳动生产率)元(y .农民工月工资2列判断正确的是( )A .劳动生产率为1 000元时,工资为130元B .劳动生产率提高1 000元时,工资水平提高80元C .劳动生产率提高1 000元时,工资水平提高130元D .当月工资为210元时,劳动生产率为2 000元的单x ,但要注意80增加y ,1每增加x 知,x 80+50=y ^由回归直线方程 B 解析:选位是千元,y 的单位是元.3.为了解儿子身高与其父亲身高的关系,随机抽取5对父子身高数据如下:则y 对x 的线性回归方程为( )A .y =x -1B .y =x +1x 12+88=y .C176=y .D =y ,176=174+176+176+176+1785=x 计算得, C 解析:选符合.C 检验知,)y ,x (,根据回归直线经过样本中心176=175+175+176+177+17754.已知x 与y 之间的几组数据如下表:,若某同学根据上表中的前两组a ^+x b ^=y ^假设根据上表数据所得线性回归直线方程为数据(1,0)和(2,2)求得的直线方程为y =b ′x +a ′,则以下结论正确的是( )′a <a ^,′b >y ^′ B.a >a ^,′b >b ^A. ′a <a ^,′b <y ^′ D.a >a ^,′b <b ^C. 解析:选C 由(1,0),(2,2)求b ′,a ′.2.=-2×1-0=′a ,2=2-02-1=′b ,58=24+15+12+3+4+0=i y i ∑i =16x 时,a ^,b ^求 x ,136=y ,3.5= ∑i=16x 2i ,91=36+25+16+9+4+1= ,57=58-6×3.5×13691-6×3.52=b ^∴ a^,13=-52-136=×3.557-136= ′.a >a ^,′b <b ^∴ =y ^的回归方程为(cm)x 对身高(kg)y 岁的人,体重38岁到18.正常情况下,年龄在50.72x -58.2,张红同学(20岁)身高为178 cm ,她的体重应该在________ kg 左右. =y ^时,178=x 的人的体重进行预测,当178 cm 解析:用回归方程对身高为0.72×178-58.2=69.96(kg).答案:69.966.某工厂为了对新研发的一种产品进行合理定价,将该产品按事先拟定的价格进行试销,得到如下数据:________.=a ,则a +x 4=-y 由表中数据,求得线性回归方程为 ,132=4+5+6+7+8+96=x 解析: y,80=92+82+80+80+78+686=)y ,x (由回归方程过样本中心点 .a ^+1324×=-80得 106.=1324×+80=a ^即 答案:1067.对某台机器购置后的运行年限x (x =1,2,3,…)与当年利润y 的统计分析知x ,y ,估计该台机器最为划算的使用年限为x 1.3-10.47=y ^具备线性相关关系,回归方程为________年.解析:当年利润小于或等于零时应该报废该机器,当y =0时,令10.47-1.3x =0,解得x ≈8,故估计该台机器最为划算的使用年限为8年.答案:88.某个体服装店经营某种服装在某周内所获纯利y (元)与该周每天销售这种服装的件数x (件)之间有一组数据如下表:;y ,x 求(1) (2)若纯利y 与每天销售这种服装的件数x 之间是线性相关的,求回归直线方程; (3)若该店每周至少要获纯利200元,请你预测该店每天至少要销售这种服装多少件?3 487)=i y i ∑i =17x ,45 309=2i ∑i =17y ,280=2i ∑i =17x 提示:( ,6=3+4+5+6+7+8+97=x (1)解: y≈79.86.66+69+73+81+89+90+917= ,≈4.753 487-7×6×79.86280-7×62=b ^∵(2) a^,51.36=4.75×6-79.86= .x 4.75+51.36=y ^之间的回归直线方程为x 纯利与每天销售件数∴ ≈31.29.x ,所以651.3+x 4.75=200时,200=y ^当(3) 因此若该店每周至少要获纯利200元,则该店每天至少要销售这种服装32件.9.2016年元旦前夕,某市统计局统计了该市2015年10户家庭的年收入和年饮食支出的统计资料如下表:年收入x (万元)2 4 4 6 6 6 7 7 8 10年饮食 支出y(万元)0.9 1.4 1.6 2.0 2.1 1.9 1.8 2.1 2.2 2.3(2)若某家庭年收入为9万元,预测其年饮食支出.406)=2i ∑i =110x ,117.7=i y i ∑i =110x 参考数据:( 解:依题意可计算得:x,10.98=y x ,36=2x ,1.83=y ,6= ,406=2i ∑i =110x ,117.7=i y i ∑i =110x ∵又,≈0.17∑i=110xiyi -10x y ∑i =110x2i -10x 2=b ^∴ a^0.81.+x 0.17=y ^∴,0.81=x b ^-y = 1.0.8+x 0.17=y ^所求的回归方程为∴ .)万元2.34(=0.81+0.17×9=y ^时,9=x 当(2) 可估计年收入为9万元的家庭每年饮食支出约为2.34万元.(时间120分钟,满分150分)一、选择题(本大题共12小题,每小题5分,共60分.在每小题给出的四个选项中,只有一项是符合题目要求的)1.下列三个抽样:①一个城市有210家某商品的代理商,其中大型代理商有20家,中型代理商有40家,小型代理商有150家,为了掌握该商品的销售情况,要从中抽取一个容量为21的样本;②在某公司的50名工人中,依次抽取工号为5,10,15,20,25,30,35,40,45,50的10名工人进行健康检查;③某市质量检查人员从一食品生产企业生产的两箱(每箱12盒)牛奶中抽取4盒进行质量检查.则应采用的抽样方法依次为( )A .简单随机抽样;分层抽样;系统抽样B .分层抽样;简单随机抽样;系统抽样C .分层抽样;系统抽样;简单随机抽样D .系统抽样;分层抽样;简单随机抽样解析:选 C ①中商店的规模不同,所以应利用分层抽样;②中抽取的学号具有等距性,所以应是系统抽样;③中总体没有差异性,容量较小,样本容量也较小,所以应采用简单随机抽样.故选C.2.将某班的60名学生编号为01,02,…,60,采用系统抽样方法抽取一个容量为5的样本,且随机抽得的一个号码为04,则剩下的四个号码依次是( )A .09,14,19,24B .16,28,40,52C .10,16,22,28D .08,12,16,20 解析:选B 分成5组,每组12名学生,按等间距12抽取.选项B 正确.3.某学校有教师200人,男学生1 200人,女学生1 000人.现用分层抽样的方法从全体师生中抽取一个容量为n 的样本,若女学生一共抽取了80人,则n 的值为( )A .193B .192C .191D .190 192.=n ,求得80=n200+1 200+1 0001 000× B 解析:选 4.某商品销售量y (件)与销售价格x (元/件)负相关,则其回归方程可能是( )200+x 10=y ^200 B.+x 10=-y ^A. 200-x 10=y ^200 D.-x 10=-y ^C. 解析:选A 由于销售量y 与销售价格x 成负相关,故排除B ,D.又因为销售价格x >0,则C 中销售量全小于0,不符合题意,故选A.,则y 和x ,它们的平均数分别是n y ,…,2y ,1y 与n x ,…,2x ,1x .设有两组数据5)(的平均数是1+n y 3-n x 2,…,1+2y 3-2x 1,2+1y 3-1x 2新的一组数据 y 3-x 2.A 1+y 3-x 2.By 9-x 4.C1+y 9-x 4.D ,)n ,…,1,2=i 1(+i y 3-i x 2=i z 设 B 解析:选 =⎝ ⎛⎭⎪⎫1+1+…+1n +)n y +…+2y +1y (3n -)n x +…+2x +1x (2n =)n z +…+2z +1z (1n =z 则 1.+y 3-x 2 6.有一个容量为66的样本,数据的分组及各组的频数如下:[11.5,15.5) 2 [15.5,19.5) 4 [19.5,23.5) 9 [23.5,27.5) 18 [27.5,31.5) 11 [31.5,35.5) 12[35.5,39.5) 7 [39.5,43.5) 3则总体中大于或等于31.5的数据所占比例约为( )211A.13B. 12C.23D. 解析:选B 由题意知,样本的容量为66,而落在[31.5,43.5)内的样本个数为12+7.13=2266的数据约占31.5,故总体中大于或等于22=3+ 7.某学习小组在一次数学测验中,得100分的有1人,得95分的有1人,得90分的有2人,得85分的有4人,得80分和75分的各有1人,则该小组数学成绩的平均数、众数、中位数分别是( )A .85,85,85B .87,85,86C .87,85,85D .87,85,90 解析:选C ∵得85分的人数最多为4人,∴众数为85,中位数为85,87.=75)+80+85×4+90×2+95+(100110平均数为 8.某出租汽车公司为了了解本公司司机的交通违章情况,随机调查了50名司机,得到了他们某月交通违章次数的数据,结果制成了如图所示的统计图,根据此统计图可得这50名出租车司机该月平均违章的次数为( )A .1B .1.8C .2.4D .3 1.8.=5×0+20×1+10×2+10×3+5×450B 解析:选 9.下表是某厂1~4月份用水量情况(单位:百吨)的一组数据月份x 1 2 3 4用水量y 4.5 4 3 2.5的a ,则a +x 0.7=-y 之间具有线性相关关系,其线性回归方程为x 与月份y 用水量值为( )A .5.25B .5C .2.5D .3.5 解析:选A 线性回归方程经过样本的中心点,根据数据可得样本中心点为(2.5,3.5),所以a =5.25.10.如图是在元旦晚会举办的挑战主持人大赛上,七位评委为某选手打出的分数的茎叶统计图,去掉一个最高分和一个最低分后,所剩数据的平均数和方差分别为( )A .84,4.84B .84,1.6C .85,1.2D .85,4 +5+6+3+(515+80,平均数为77,去掉一个最低分95去掉一个最高分 C 解析:选,因此1.2=]286)-(85+285)-(85+286)-(85+283)-(85+285)-[(8515,方差为85=6)选C.,…,2+2x 2,3+1x 3,则2s ,方差是x 的平均数是n x ,…,3x ,2x ,1x .如果数据11)(的平均数和方差分别是2+n x 32s 和x A.2s 9和x 3.B2s 9和2+x 3.C4+2s 12和2+x 3.D nx …,2x ,1x ,由于数据2+x 3的平均数是2+n x 3,…,2+2x 2,3+1x 3 C 解析:选.2s 9的方差为2+n x 3,…,2+2x 2,3+1x 3,所以2s 的方差为 12.如图是某赛季甲、乙两名篮球运动员5场比赛得分的茎叶图,已知甲的成绩的极差为31,乙的成绩的平均值为24,则下列结论错误的是( ) A .x =9 B .y =8C .乙的成绩的中位数为26D .乙的成绩的方差小于甲的成绩的方差解析:选B 因为甲的成绩的极差为31,所以其最高成绩为39,所以x =9;因为乙的成绩的平均值为24,所以y =24×5-(12+25+26+31)-20=6;由茎叶图知乙的成绩的中位数为26;对比甲、乙的成绩分布发现,乙的成绩比较集中,故其方差较小. 二、填空题(本大题共4小题,每小题5分,共20分,把答案填在题中横线上) 13.某人5次上班途中所花的时间(单位:分钟)分别为x ,y,10,11,9.已知这组数据的平均数为10,方差为2,则|x -y |的值为________.∴,2;又方差为20=y +x ,则10=159)×+11+10+y +x (,得10解析:由平均数为=xy 208,2=2y +2x ,得2=15]×210)-(9+210)-(11+210)-(10+210)-y (+210)-x [( 4.=x2+y2-2xy =x -y 2=|y -x |∴,192 答案:414.一支田径队有男运动员48人,女运动员36人,若用分层抽样的方法从该队的全体运动员中抽取一个容量为21的样本,则抽取男运动员的人数为________.12.=×482148+36解析:抽取的男运动员的人数为 答案:1215.要考察某种品牌的500颗种子的发芽率,抽取60粒进行实验,利用随机数表抽取种子时,先将500颗种子按001,002,…,500进行编号,如果从随机数表第7行第8列的数3开始向右读,请你依次写出最先检测的5颗种子的编号:________,________,________,________,________.(下面摘取了随机数表第7行至第9行)59408 66368 36016 26247 25965 49487 26968 86021 77681 83458 21540 62651 69424 78197 20643 67297 76413 66306 51671 54964 87683 30372 39469 97434解析:以3开始向右读,每次读取三位,重复和不在范围内的不读,依次为368,360,162,494,021.答案:368,360,162,494,02116.从某小学随机抽取100名同学,将他们的身高(单位:cm)数据绘制成频率分布直方图(如下图).由图中数据可知a =________.若要从身高在[120,130),[130,140),[140,150]三组的学生中,用分层抽样的方法选取18人参加一项活动,则从身高在[140,150]的学生中选取的人数应为________.解析:∵0.005×10+0.035×10+a ×10+0.020×10+0.010×10=1,∴a =0.030.设身高在[120,130),[130,140),[140,150]三组的学生分别有x ,y ,z 人,10.=z ,20=y 同理,30.=x ,解得0.030×10=x100则3.=×181030+20+10的学生中选取的人数为[140,150]故从 答案:0.030 3三、解答题(本大题共6小题,共70分.解答应写出文字说明,证明过程或演算步骤) ,应如何110名学生中抽取50为调查某班学生的平均身高,从)分10本小题满分(.17抽样?若知道男生、女生的身高显著不同(男生30人,女生20人),应如何抽样? 抽签法或随机数(人,采用简单随机抽样法5,即抽取110名学生中抽取50解:从法).若知道男生、女生的身高显著不同,则采用分层抽样法,按照男生与女生的人数比为30∶20=3∶2进行抽样,则男生抽取3人,女生抽取2人.18.(本小题满分12分)某车间共有12名工人,随机抽取6名,他们某日加工零件个数的茎叶图如图所示. (1)根据茎叶图计算样本均值;(2)日加工零件个数大于样本均值的工人为优秀工人.根据茎叶图推断该车间12名工人中有几名优秀工人?22.=1326=17+19+20+21+25+306样本均值为1)(解: 4=1312×名工人中有12,故推断该车间13=26知样本中优秀工人所占比例为(1)由(2)名优秀工人.19.(本小题满分12分)2016年春节前,有超过20万名广西、四川等省籍的外出务工人员选择驾乘摩托车沿321国道长途跋涉返乡过年,为防止摩托车驾驶人员因长途疲劳驾驶,手脚僵硬影响驾驶操作而引发交通事故,肇庆市公安交警部门在321国道沿线设立了多个长途行驶摩托车驾乘人员休息站,让返乡过年的摩托车驾乘人员有一个停车休息的场所.交警小李在某休息站连续5天对进站休息的驾驶人员每隔50辆摩托车就进行一次省籍询问,询问结果如图所示:(1)交警小李对进站休息的驾驶人员的省籍询问采用的是什么抽样方法?(2)用分层抽样的方法对被询问了省籍的驾驶人员进行抽样,若广西籍的有5人,则四川籍的应抽取几人?解:(1)交警小李对进站休息的驾驶人员的省籍询问采用的是系统抽样法.(2)从题图可知,被询问了省籍的驾驶人员广西籍的有5+20+25+20+30=100(人);四川籍的有15+10+5+5+5=40(人).2,即四川籍的应抽取2=x ,解得x40=5100人,依题意得x 设四川籍的驾驶人员应抽取人.20.(本小题满分12分)某化肥厂有甲、乙两个车间包装肥料,在自动包装传送带上每隔30分钟抽取一包产品,称其重量(单位:kg),分别记录抽查数据如下:甲:102,101,99,98,103,98,99; 乙:110,115,90,85,75,115,110.(1)这种抽样方法是哪一种方法?(2)试计算甲、乙车间产品重量的平均数与方差,并说明哪个车间产品较稳定?解:(1)甲、乙两组数据间隔相同,所以采用的方法是系统抽样.,100=99)+98+103+98+99+101+(10217=甲x (2) x,100=110)+115+75+85+90+115+(11017=乙 ,1)≈3.43+4+9+4+1+1+(417=2甲s ,228.57=100)+225+625+225+100+225+(10017=2乙s ,故甲车间产品比较稳定.2乙s <2甲s ∴ 21.(本小题满分12分)对某校高一年级学生参加社区服务次数进行统计,随机抽取M 名学生作为样本,得到这M 名学生参加社区服务的次数.根据此数据作出了频数与频率的统计表和频率分布直方图如下:分组频数 频率[10,15) 10 0.25[15,20) 25n [20,25) mp[25,30] 20.05 合计M1(1)求出表中M ,p 及图中a 的值;(2)若该校高一学生有360人,试估计该校高一学生参加社区服务的次数在区间[10,15)的人数.解:(1)由分组[10,15)的频数是10, 40.=M ,所以0.25=10M知,0.25频率是 因为频数之和为40,所以10+25+m +2=40,解得m =3.0.075.=340=p 故 因为a 是对应分组[15,20)的频率与组距的商,125.0.=2540×5=a 所以 (2)因为该校高一学生有360人,分组[10,15)的频率是0.25,所以估计该校高一学生参加社区服务的次数在此区间内的人数为360×0.25=90.22.(本小题满分12分)从某居民区随机抽取10个家庭,获得第i 个家庭的月收入iy i ∑i =110x ,20=i ∑i =110y ,80=i ∑i =110x 的数据资料,算得)单位:千元(i y 与月储蓄)单位:千元(i x 720.=2i ∑i =110x ,184= ;a ^+xb ^=y ^的线性回归方程x 对月收入y 求家庭的月储蓄(1) (2)判断变量x 与y 之间是正相关还是负相关;(3)若该居民区某家庭月收入为7千元,预测该家庭的月储蓄.,8=8010=i ∑i =1n x 1n =x ,10=n 由题意知(1)解: y ,2=2010=i ∑i =1n y 1n = ,80=210×8-720=2x 10-2i ∑i =110x 又 ∑i=110x ,24=10×8×2-184=y x 10-i y i ,0.3=2480=∑i =110xiyi -10x y∑i =110x2i -10x 2=b ^由此得 a^,0.4=-0.3×8-2=x b ^-y = 0.4.-x 0.3=y ^故所求回归方程为 (2)由于变量y 的值随x 的值增加而增加(b =0.3>0),故x 与y 之间是正相关.(3)将x =7代入回归方程可以预测该家庭的月储蓄为y =0.3×7-0.4=1.7千元.。

人教A版高中数学必修三新课标优秀教案示范教案两个变量的线性相关

人教A版高中数学必修三新课标优秀教案示范教案两个变量的线性相关

2.3 变量间的相关关系2.3.1 变量之间的相关关系2.3.2 两个变量的线性相关整体设计教学分析变量之间的关系是人们感兴趣的问题.教科书通过思考栏目“物理成绩与数学成绩之间的关系”,引导学生考察变量之间的关系.在教师的引导下,可使学生认识到在现实世界中存在不能用函数模型描述的变量关系,从而体会研究变量之间的相关关系的重要性.随后,通过探究人体脂肪百分比和年龄之间的关系,引入描述两个变量之间关系的线性回归方程(模型).教科书在探索用多种方法确定线性回归直线的过程中,向学生展示创造性思维的过程,帮助学生理解最小二乘法的思想.通过气温与饮料销售量的例子及随后的思考,使学生了解利用线性回归方程解决实际问题的全过程,体会线性回归方程作出的预测结果的随机性,并且可能犯的错误.进一步,教师可以利用计算机模拟和多媒体技术,直观形象地展示预测结果的随机性和规律性.三维目标1.通过收集现实问题中两个有关联变量的数据认识变量间的相关关系.2.明确事物间的相互联系.认识现实生活中变量间除了存在确定的关系外,仍存在大量的非确定性的相关关系,并利用散点图直观体会这种相关关系.3.经历用不同估算方法描述两个变量线性相关的过程.知道最小二乘法的思想,能根据给出的线性回归方程的系数公式建立线性回归方程.重点难点教学重点:通过收集现实问题中两个有关联变量的数据直观认识变量间的相关关系;利用散点图直观认识两个变量之间的线性关系;根据给出的线性回归方程的系数公式建立线性回归方程.教学难点:变量之间相关关系的理解;作散点图和理解两个变量的正相关和负相关;理解最小二乘法的思想.课时安排2课时教学过程第1课时导入新课思路1在学校里,老师对学生经常这样说:“如果你的数学成绩好,那么你的物理学习就不会有什么大问题.”按照这种说法,似乎学生的物理成绩与数学成绩之间存在着一种相关关系.这种说法有没有根据呢?的,物理也好;数学差的,物理也差,但又不全对.)物理成绩和数学成绩是两个变量,从经验看,由于物理学习要用到比较多的数学知识和数学方法.数学成绩的高低对物理成绩的高低是有一定影响的.但决非唯一因素,还有其他因素,如是否喜欢物理,用在物理学习上的时间等等.(总结:不能通过一个人的数学成绩是多少就准确地断定他的物理成绩能达到多少.但这两个变量是有一定关系的,它们之间是一种不确定性的关系.如何通过数学成绩的结果对物理成绩进行合理估计有非常重要的现实意义.)为很好地说明上述问题,我们开始学习变量之间的相关关系和两个变量的线性相关.(教师板书课题)思路2某地区的环境条件适合天鹅栖息繁衍,有人经统计发现了一个有趣的现象,如果村庄附近栖息的天鹅多,那么这个村庄的婴儿出生率也高,天鹅少的地方婴儿的出生率低,于是,他就得出一个结论:天鹅能够带来孩子.你认为这样得到的结论可靠吗?如何证明这个结论的可靠性?推进新课新知探究提出问题(1)粮食产量与施肥量有关系吗?“名师出高徒”可以解释为教师的水平越高,学生的水平也越高.教师的水平与学生的水平有什么关系?你能举出更多的描述生活中两个变量的相关关系的成语吗?(2)两个变量间的相关关系是什么?有几种?(3)两个变量间的相关关系的判断.讨论结果:(1)粮食产量与施肥量有关系,一般是在标准范围内,施肥越多,粮食产量越高;教师的水平与学生的水平是相关的,如水滴石穿,三人行必有我师等.我们还可以举出现实生活中存在的许多相关关系的问题.例如:商品销售收入与广告支出经费之间的关系.商品销售收入与广告支出经费有着密切的联系,但商品销售收入不仅与广告支出多少有关,还与商品质量、居民收入等因素有关.粮食产量与施肥量之间的关系.在一定范围内,施肥量越大,粮食产量就越高.但是,施肥量并不是决定粮食产量的唯一因素.因为粮食产量还要受到土壤质量、降雨量、田间管理水平等因素的影响.人体内的脂肪含量与年龄之间的关系.在一定年龄段内,随着年龄的增长,人体内的脂肪含量会增加,但人体内的脂肪含量还与饮食习惯、体育锻炼等有关,可能还与个人的先天体质有关.应当说,对于上述各种问题中的两个变量之间的相关关系,我们都可以根据自己的生活、学习经验作出相应的判断,因为“经验当中有规律”.但是,不管你的经验多么丰富,如果只凭经验办事,还是很容易出错的.因此,在分析两个变量之间的相关关系时,我们需要一些有说服力的方法.在寻找变量之间相关关系的过程中,统计同样发挥着非常重要的作用.因为上面提到的这种关系,并不像匀速直线运动中时间与路程的关系那样是完全确定的,而是带有不确定性.这就需要通过收集大量的数据(有时通过调查,有时通过实验),在对数据进行统计分析的基础上,发现其中的规律,才能对它们之间的关系作出判断.(2)相关关系的概念:自变量取值一定时,因变量的取值带有一定随机性的两个变量之间的关系,叫做相关关系.两个变量之间的关系分两类:①确定性的函数关系,例如我们以前学习过的一次函数、二次函数等;②带有随机性的变量间的相关关系,例如“身高者,体重也重”,我们就说身高与体重这两个变量具有相关关系.相关关系是一种非确定性关系.如商品销售收入与广告支出经费之间的关系.(还与商品质量、居民收入、生活环境等有关)(3)两个变量间的相关关系的判断:①散点图.②根据散点图中变量的对应点的离散程度,可以准确地判断两个变量是否具有相关关系.③正相关、负相关的概念.①教学散点图分析数据:大体上来看,随着年龄的增加,人体中脂肪的百分比也在增加.我们可以作散点图来进一步分析.②散点图的概念:将各数据在平面直角坐标系中的对应点画出来,得到表示两个变量的一组数据的图形,这样的图形叫做散点图,如下图.从散点图我们可以看出,年龄越大,体内脂肪含量越高.图中点的趋势表明两个变量之间确实存在一定的关系,这个图支持了我们从数据表中得出的结论.(a.如果所有的样本点都落在某一函数曲线上,就用该函数来描述变量之间的关系,即变量之间具有函数关系.b.如果所有的样本点都落在某一函数曲线附近,变量之间就有相关关系.c.如果所有的样本点都落在某一直线附近,变量之间就有线性相关关系)③正相关与负相关的概念:如果散点图中的点散布在从左下角到右上角的区域内,称为正相关.如果散点图中的点散布在从左上角到右下角的区域内,称为负相关.(注:散点图的点如果几乎没有什么规则,则这两个变量之间不具有相关关系)应用示例思路1例1 下列关系中,带有随机性相关关系的是_____________.①正方形的边长与面积之间的关系②水稻产量与施肥量之间的关系③人的身高与年龄之间的关系④降雪量与交通事故的发生率之间的关系解析:两变量之间的关系有两种:函数关系与带有随机性的相关关系.①正方形的边长与面积之间的关系是函数关系.②水稻产量与施肥量之间的关系不是严格的函数关系,但是具有相关性,因而是相关关系.③人的身高与年龄之间的关系既不是函数关系,也不是相关关系,因为人的年龄达到一定时期身高就不发生明显变化了,因而他们不具备相关关系.④降雪量与交通事故的发生率之间具有相关关系,因此填②④.答案:②④例2 有关法律规定,香烟盒上必须印上“吸烟有害健康”的警示语.吸烟是否一定会引起健康问题?你认为“健康问题不一定是由吸烟引起的,所以可以吸烟”的说法对吗?分析:学生思考,然后讨论交流,教师及时评价.解:从已经掌握的知识来看,吸烟会损害身体的健康,但是除了吸烟之外,还有许多其他的随机因素影响身体健康,人体健康是很多因素共同作用的结果.我们可以找到长寿的吸烟者,也更容易发现由于吸烟而引发的患病者,所以吸烟不一定引起健康问题.但吸烟引起健康问题的可能性大.因此“健康问题不一定是由吸烟引起的,所以可以吸烟”的说法是不对的.点评:在探究研究的过程中,如果能够从两个变量的观察数据之间发现相关关系是极为有意义的,由此可以进一步研究二者之间是否蕴涵因果关系,从而发现引起这种相关关系的本质原因是什么.本题的意义在于引导学生重视对统计结果的解释,从中发现进一步研究的问题.思路2例1 有时候,一些东西吃起来口味越好,对我们的身体越有害.下表给出了不同类型的某种食品的数据.第二列表示此种食品所含热量的百分比,第三列数据表示由一些美食家以百分制给出的对此种食品口味的评价:(2)关于两个变量之间的关系,你能得出什么结论?解:(1)散点图如下:(2)基本成正相关关系,即食品所含热量越高,口味越好.例2 案例分析:一般说来,一个人的身高越高,他的右手一拃长就越长,因此,人的身高与右手一拃长之间存在着一定的关系.为了对这个问题进行调查,我们收集了北京市某中学2003年高三年级96名学(1)根据上表中的数据,制成散点图.你能从散点图中发现身高与右手一拃长之间的近似关系吗?(2)如果近似成线性关系,请画出一条直线来近似地表示这种线性关系.(3)如果一个学生的身高是188 cm,你能估计他的一拃大概有多长吗?解:根据上表中的数据,制成的散点图如下.从散点图上可以发现,身高与右手一拃长之间的总体趋势是成一直线,也就是说,它们之间是线性相关的.那么,怎样确定这条直线呢?同学1:选择能反映直线变化的两个点,例如(153,16),(191,23)两点确定一条直线.同学2:在图中放上一根细绳,使得上面和下面点的个数相同或基本相同.同学3:多取几组点对,确定几条直线方程.再分别算出各个直线方程斜率、截距的算术平均值,作为所求直线的斜率、截距.同学4:从左端点开始,取两条直线,如下图.再取这两条直线的“中间位置”作一条直线.同学5:先求出相同身高同学右手一拃长的平均值,画出散点图,如下图,再画出近似的直线,使得在直线两侧的点数尽可能一样多.同学6:先将所有的点分成两部分,一部分是身高在170 cm以下的,一部分是身高在170 cm 以上的;然后,每部分的点求一个“平均点”——身高的平均值作为平均身高、右手一拃的平均值作为平均右手一拃长,即(164,19),(177,21);最后,将这两点连接成一条直线.同学7:先将所有的点按从小到大的顺序进行排列,尽可能地平均分成三等份;每部分的点按照同学3的方法求一个“平均点”,最小的点为(161.3,18.2),中间的点为(170.5,20.1),最大的点为(179.2,21.3).求出这三个点的“平均点”为(170.3,19.9).我再用直尺连接最大点与最小点,然后平行地推,画出过点(170.3,19.9)的直线.同学8:取一条直线,使得在它附近的点比较多.在这里需要强调的是,身高和右手一拃长之间没有函数关系.我们得到的直线方程,只是对其变化趋势的一个近似描述.对一个给定身高的人,人们可以用这个方程来估计这个人的右手一拃长,这是十分有意义的.知能训练一个车间为了规定工时定额,需要确定加工零件所花费的时间,为此进行了10次试验,收集数据如下:画出散点图;关于加工零件的个数与加工时间,你能得出什么结论?答案:(1)散点图如下:(2)加工零件的个数与所花费的时间呈正线性相关关系.拓展提升(1)画出数据对应的散点图;(2)指出是正相关还是负相关;(3)关于销售价格y和房屋的面积x,你能得出什么结论?解:(1)数据对应的散点图如下图所示:(2)散点图中的点散分布在从左下角到右上角的区域内,所以是正相关.(3)关于销售价格y和房屋的面积x,房屋的面积越大,价格越高,它们呈正线性相关的关系. 课堂小结通过收集现实问题中两个有关联变量的数据作出散点图,并利用散点图直观认识变量间的相关关系.作业习题2.3A组3、4(1).设计感想本节课学习了变量之间的相关关系和两个变量的线性相关的部分内容,通过身边的具体实例说明了两个变量的相关关系,并学会了利用散点图及其分布来说明两个变量的相关关系的种类,为下一节课作了铺垫,思路1和思路2的例题对知识进行了巩固和加强,另外,本节课通过选取一些学生特别关心的身边事例,对学生进行思想情操教育、意志教育和增强学生的自信心,养成良好的学习态度和学习方法,树立时间观,培养勤奋、刻苦耐劳的精神.。

人教A版高中数学必修3《二章 统计 2.3 变量间的相关关系 阅读与思考 相关关系的强与弱》优质课教案_9

人教A版高中数学必修3《二章 统计  2.3 变量间的相关关系  阅读与思考 相关关系的强与弱》优质课教案_9



有些老师常说:“如果你的数学成绩好,那么你的物理学习就不会有什么大问题.”按照这种说法,似乎学生的物理成绩与数学成绩之间存在着一种相关关系。
在散点图中,从整体上点的分布看,大致在一条直线附近,我们就称物理成绩和数学成绩这两个变量之间具有线性相关关系,这条直线叫做回归直线。
我们可以利用线性关系来进行预测。
思考:
的值越大,是否意味着正相关程度越强?(给出两幅图让学生观察思考)
(3)
问题:为什么不用协方差除以各自的标准差,反而要除以各自的标准差?
思考:
什么时候取到最值?它的取值范围是什么?
统计学认为:
,Байду номын сангаас
则相关程度很强;

则相关程度一般;

则相关程度很弱
学生思考回答
根据以往经验,学生可以想到和班级均分做比较









1.散点图中,我
们看到物理成 绩和数学成绩这两个变量成正相关关系,它们具有相同的变化趋势,即数学成绩好,物理成绩也好。
(1)问题1:
怎么分析一个同学的数学成绩
和物理成绩的好与不好?
(2)
问题2:怎么从数说明随着数学成绩增加,物理成绩也增加?
协方差的定义及其意义
(3)
1.(1)
教师提问:怎么分析一个同学的数学成绩和物理成绩的好不好?
利用物理成绩和数学成绩之间的这种线性关系来进行预测的准确度有多高?即物理成绩与数学成绩的相关关系的程度有多大?这是要去考虑的一个问题。
书写板书
“相关关系的强与弱”
回顾之前所学:相关关系,散点图,回归直线。
从学生学过的知识出发,引出本节课学习的必要性,在课前激发学生对本节课的兴趣,引起他们的重视。

人教A版高中数学必修3《二章统计2.3变量间的相关关系阅读与思考相关关系的强与弱》优质课教案_4

人教A版高中数学必修3《二章统计2.3变量间的相关关系阅读与思考相关关系的强与弱》优质课教案_4

课堂教学设计案四、教学环境及资源准备让不同层次的学生优化组合,围圈而坐,相互促进•把制作模型的材料分类整理好摆放在学具摆放区,并设置好卡片、张贴板与多媒体课件进行辅助教学.主持台学具摆放区多媒体展示区成果展示区习题训练区C. r 2 :: r 4 :: 0 . r 1 ■■■. r 3D. .r 4 :: r 2 :: 0 :: r 3 :: r 1两个变量x 与y 正(负)相关时,他们就有相同(反)的变化趋势, 当x 和由小变大时,相应的 y 有由小(大)变大(小)的趋势,因此可 以用回归直线来描述这种关系。

与此相关的一个问题是:如何描述 x与y 之间的这种线性关系的强弱?【阅读与思考】(约10分钟)1•两个变量的相关关系的计算公式为r= ____________2•对于变量x,y ,如果 产 ________ ,那么负相关很强;产 __________ , 那么正相关很强; 如果r 匕 _________ 或r 匕 _________ ,那么相关性一般; 如果 汚 __________ ,那么相关性较弱.【知识启航站】(约5分钟)例1:对四组数据进行统计,获得如图所示的散点图,关于其相关关系 的比较,正确的是( ) Is1S536提出问题, 学生主动思 考并完成卡 片上的问题检验学生 对基础知识的掌握 能力•有 利于对新 课的引入 5 10 15 20 25 M 35 A .r 2 :: r 4 :: 0 :: r 3 :: r 1B. r 4 :: r 2 :: 0 :: A :: r 3 学生小组内 交换交流, 相互检查纠 正规范书 写,强调 细节,使 学生再次 熟悉上节 课内容, 有利于本 节课知识 的学习学生通过阅 读课本92-93页内容,了解相 关系数的强 与弱的概 念,思考相 关系数的强 与弱的计算 方法,并尝 试计算相关 系数.让单调的 数学概念 问题变得 有活力,提高学生 的参与例2.甲、乙、丙、丁四位同学各自对A,B 两变量的线性相关关系做实验,并用回归分析的方法分别求得相关系数如表:则哪位同学的试验结果体现 A,B 两变量有更强的相关性()A.甲B.乙 C 丙D. 丁【合作与探究】(品出知识,品出题型,品出方法)例3. 5个学生的数学和物理成绩如下表:画出散点图,计算相关系数,并判断它们相关关系的强弱 学生小组讨论完成,教 师在各个小 组间个别指 导学生小组讨 论完成,未 完成及错误 的由学生先 补充,老师 做适当点 评,完成后 各小组展示 讨论成果通过思考 形成结 论,有利 于学生掌 握与记忆让学生通 过实践计算,初步 掌握相关 系数的计练习3.下表提供了某厂节能降耗技术改造后生产甲产品过程中 记录的产量x(吨)与相应的生产能耗 y(吨标准煤)的几组对照数据 (2) 请根据上表提供的数据,计算相关系数,并判断它们相关关 系的强弱.(J2.5 : 3.54)练习4.某公司利润y (单位:万元)与销售总额 x (单位:千 万元)之间有如表对应数据:(1) 画出散点图;(2) 求相关系数r,判断x 与y 线性相关强度学生完成后 在白板上展 示自己的讨 论结果,并讲 解给其他同 学听 老师对学生 未说明和错 的地方做适 当的补充和 纠正检验学生所 学知识的运 用能力,锻 炼学生的思 维严密性以 及语言表达 能力培养学生小 组合作思 考、解决问 题的能力, 并提高思维 的灵活性学生通过思 考和观察,在 生活中寻找 两个变量,并通过Excel 软件,快速计算 出相关系数, 再应用所学 知识,判断两 个变量间的 关系让学生体会 生活中变量 之间的关 系,培养学 生归纳能力,给予自 我展示的机 会,提高学 生的自信心学生思考、总 结,并发表自 己的意见,教 师指导,并给 出完整小结 重温知识 点,让学生 再次回顾本 节课知识【课堂小结】【实践与探索】每个小组选取合适的样本,收集好数据,并用 Excel 展示两组数据的散点图,并对它们的相关性进行讨论和展示.我是第—小组代表,我们搜集了 ________________________ 与 ______ 之间的数据,从搜集的数据的散点图中我们估计, ________ 与 ______ 之间存在 (正相关、负相关、不相关)的 关系。

人教版高中数学必修三《相关关系的强与弱》

人教版高中数学必修三《相关关系的强与弱》

n
n

y
i 1
i
y
2
有关系,即还要考虑它们
各自的标准差. 除以标准差,
就是把变量变化的幅度对
n

i 1 n
xi x yi y
2 n 2 i 1
i 1
xi x yi y
相关程度的影响剔除掉了.
Page
8
8
相关系数
统计中用相关系数 r 来衡量两个变量之间线性关系的强弱.
若相应于变量 x 的取值 x i ,变量 y 的观测值为 yi (1 i n) ,
则两个变量的相关系数的计算公式为:
r
i 1 n
xi x yi y
2 n 2 i 1
n
思考: 相关系数取值
i 1
xi x yi y
范围是多少?
1 r 1
72 73 71 65 60 46 59 50 58 61
51 37 67 60 75 67 95 91 81 82
72 75 59 74 58 50 81 67 50 57
66 66 61 49 89 88 75 61 71 60
72 72 64 63 66 73 64 43 72 77
yi y D(Y )
n
72 72 64 63 66 73 64 43 72 77
74 72 73 68 88 70 65 52 59 41
i
63 55 79 83 72 66 70 79 42 50
83 74 82 69 69 60 67 55 46 41
i
86 70 80 85 61 63 82 65 45 40
问题2:

高中数学新人教版B版精品教案《人教版B高中数学必修3 2.3.1 变量间的相关关系》0

高中数学新人教版B版精品教案《人教版B高中数学必修3 2.3.1 变量间的相关关系》0

变量间的相关关系——陈世亮教学目标:1通过收集现实问题中两个变量的数据,探究变量间的关系;2通过散点图直观判断两变量间的相关关系;3通过收集、整理、分析数据,培养学生解决问题的能力。

教学重点:通过收集现实问题中两个有关联变量的数据,利用散点图直观认识并判断变量间的相关关系。

教学难点:变量间相关关系的理解,回归分析思想的理解。

教学用具:电教平台。

教学方法:类比、观察、交流、讨论、迁移。

教学过程:一情景引入问题1:现实生活中存在许多变量,请判断下列几组变量之间是否存在关系?是的话,是什么关系?1人的身高与视力;2正方形边长与面积;3商品销售收入与广告支出经费;4粮食产量与施肥量;5人体内的脂肪含量与年龄学生通过类比、观察、交流、讨论,得出结论,并由两名学生回答问题。

老师点评并得出:小结一1函数关系:当自变量取值一定时,因变量的取值由它唯一确定,是一种确定的关系。

2相关关系:当自变量取值一定时,因变量的取值带有一定的随机性,是一种不确定的关系。

3相关关系与函数关系的异同点与联系:函数关系相关关系相同点 均是指两个变量的关系不同点1确定关系;2是因果关系,有这样的因,必有 那样的果。

1非确定的关系;2不一定是因果关系,可能是伴随关 系。

联系在一定条件下可相互转化对具有相关关系的两个变量进行统计分析的方法叫回归分析。

练习一1下列两个变量之间的关系是相关关系的是 A 正方体的棱长和体积 B 学生的身高与数学成绩 C 圆的半径与圆的周长 D 日照时间与水稻的亩产量 2下列关系中,属于相关关系的是 填序号. ①人的身高与体重的关系;②做自由落体运动的物体的质量与落地时间的关系; ③降雪量与交通事故的发生率之间的关系.学生思考,并回答问题。

老师点评并引导学生得出:要分析这些变量之间相关程度的强弱, 一是凭经验粗略估计; 二是可发挥统计知识的作用, 用一些有说服力的数据来确定变量之间的相关关系二探究新知问题2:为了研究人体脂肪含量和年龄关系,研究人员获得了一组样本数据:思考1:观察上表中的数据,人体的脂肪含量与年龄之间有怎样的关系? 思考2:以轴表示年龄,轴表示脂肪含量,你能在直角坐标系中描出样本数据对应的图形吗?50494541392723年龄28.226.327.525.921.217.89.5脂肪61605857565453年龄34.635.233.530.831.430.229.6脂肪学生思考,并上黑板画出图形。

最新人教A版必修3高中数学2.3变量间的相关关系教学设计

最新人教A版必修3高中数学2.3变量间的相关关系教学设计

2. 3变量间的相关关系一、教材分析本节知识内容不多,但分析本节内容,至少有下列特点:1)知识的联系面广,应用性强,概念的真正理解有难度,教学既要承前启后,完成统计必修基础知识的构建;也要知道知识的来龙去脉,提升学生运用统计知识解决实际问题的能力,更要抓住本质,正确理解统计推断的结论。

2)通过典型案例进行教学,使知识形成的过程中具有可操作性,易于创设问题情境,引导学生参与,而学生借助解决问题,通过自主思维活动,会产生感悟、发现,能提出问题,思考交流,不仅能正确、全面地理解基础知识和基本方法,而且能促进、发展学生的统计意识、统计思想。

二、教学目标1. 通过收集现实问题中两个有关联变量的数据作出散点图,并利用散点图直观认识变量间的相关关系;2. 知道最小二乘法的思想,能根据给出的线性回归方程系数公式建立线性回归方程。

三、教学重点难点重点:作出散点图和根据给出的线性回归方程系数公式建立线性回归方程。

难点:对最小二乘法的理解。

四、学情分析本节是一种对样本数据的处理方法,但侧重的是由样本推断总体,其方法是学生初识的、知识的作用也是学生初见的。

知识量并不大,但涉及的数学方法、数学思想较充分,同时,在教材中留有供发现的点,设有开放性问题,既具有体验数学方法、数学思想的功能,也具有培养学生从具体到抽象能力、锻炼创造性思维能力的作用。

五、教学方法1.自主探究,互动学习2.学案导学:见后面的学案。

3.新授课教学基本环节:预习检查、总结疑惑→情境导入、展示目标→合作探究、精讲点拨→反思总结、当堂检测→发导学案、布置预习六、课前准备1.学生的学习准备:预习课本,初步把握必须的定义。

2.教师的教学准备:多媒体课件制作,课前预习学案,课内探究学案,课后延伸拓展学案。

七、课时安排:1课时八、教学过程〖复习回顾〗标准差的公式为:______________________________________________________ 〖创设情境〗1、函数是研究两个变量之间的依存关系的一种数量形式.对于两个变量,如果当一个变量的取值一定时,另一个变量的取值被惟一确定,则这两个变量之间的关系就是一个函数关系2、在中学校园里,有这样一种说法:“如果你的数学成绩好,那么你的物理学习就不会有什么大问题。

第 3 章 强联系和弱联系

第 3 章 强联系和弱联系
• 或者“最关键”的边:许多节点之间的 最短路径都要经过它 • 介数--一条边承载的一种“流量”
– 两个节点A和B,设想1个单位的流量从A到B ,均分到它们之间所有的最短路径上
• K条路径,则每条路径上分得1/k, • 若一条边被m条路径共用,则在它上面流过m/k
– 所有节点对都考虑后,一条边上的累记流量 就是它的介数(betweenness)
有没有数据来支持这结论?
• 上述结论的精神:两人关系的强度与是否 有共同朋友直接相关
– 捷径意味着没有共同朋友,强度为“弱”。
• 推论:共同朋友数越多,关系的强度越高
– 精细一些,可以说共同朋友数在总朋友数中 的占比(邻里重叠度)
• 我们来找一个能验证这个推论的场景,从 而也就间接验证上述结论
逐步删除高介数边:例
• b(7,8) = 49
– 两边各7个节点,都要经 过它,7*7;7个节点内 部则不经过
• b(3,7)=b(6,7)=b(8,9)= b(8,12) = 33 – 3*7+3*4 • b(1,3)=… = 12
– 涉及1和3-­­14等12个节点
• b(1,2)=… b(13,14) = 1
• 若A有两个强关系邻居B和C,但B-­­C之间没 有任何关系(s或w),则称节点A违背了 强三元闭包原理; • 如果节点A没有违背强三元闭包原理,则 称节点A符合强三元闭包原理。
注意:如同聚集系数,一个节点是否符合强三元闭包也是严 格定义的,即每个节点要么“符合”,要么“违背”。
哪些节点符合/违背强三元闭包?
自底向上 -每个节点得单位流量 -在其上面的边上按最 短路径数的比例分配
社会网络的基本概念 及其在OSN上的体现 •
三元闭包,关系的强度及其与网络结构的关系, 同质性及其影响,正负关系及其平衡,幂率, 小世界,节点的地位与关系的均衡,…

人教A版高中数学必修3《二章 统计 2.3 变量间的相关关系 阅读与思考 相关关系的强与弱》优质课教案_3

人教A版高中数学必修3《二章 统计  2.3 变量间的相关关系  阅读与思考 相关关系的强与弱》优质课教案_3

相关关系的强与弱学情分析:高一学生已经学习了前一节变量间的相关关系,但是总让学生有种感觉,画完散点图就求线性回归方程。

但是实际上不是这样,这里面的道理学生不明,总会让很多同学产生疑问,而数学学习很重要一点就是教会学生严谨、完整地思考并解决问题,所以本阅读材料的学习非常能激起学生的学习欲望,也能彻底清除学生学习的困惑点,符合学生的最近发展区理论,满足了学生思维发展的需要.教学目标:1、理解先观察散点图再求线性回归方程的原因2、了解相关关系的强与弱与散点图及回归方程的关系教学重难点:重点:用相关系数公式进行计算难点:相关系数如何刻画两变量间的相关关系强与弱教学用具:计算器、直尺教学过程一、复习1、相关关系、正负相关、样本中心等概念复习2、在散点图中,我们发现其散点散点大都分布在某一条直线线附近。

则我们把类似的相关关系叫做线性相关关系。

求线性回归方程的一般步骤:第一步:画散点图;第二步:列表计算;第三步:代入公式;第四步:写出回归方程.二、提出问题:为什么要“先观察散点图再求线性回归方程”?三、新知学习1、两个变量的相关关系的强弱用什么来衡量?计算公式是什么?相关系数2、下面4个图的相关关系和图形的散点分布有什么关系?四、典例分析例:测得某国家10对父子身高(单位,英寸)如下:(1)求相关系数r 的值;(2)如果y 与x 之间具有线性相关关系,求回归直线方程;()()n i i x x y y r --=∑n i ix y nxy r -=∑五、小结1、如何探讨生活中两个变量相关关系?2、计算相关系数的价值何在?六、拓展作业你能试着对自己身边的某个问题,确定两个变量,通过收集数据,计算相关系数,然后分析一下能否用线性回归模型来拟合它们间的关系吗?。

高二数学《相关关系》教学设计

高二数学《相关关系》教学设计

课题:变量间的相关关系北京师范大学附属实验中学王宏一、教学目标:1、通过教学使学生理解变量间的相关关系以及正相关和负相关的概念2、通过教师引导,学生合作寻找生活中具有相关关系的两个变量,让学生体会数学与生活的密切关系以及合作会带成功。

3、结合教学内容培养学生学习数学的兴趣以及“用数学”的意识,鼓励学生勇于创新二、教学重点和难点:重点:收集现实问题中有关联变量的数据做出散点图难点:利用散点图认识变量间的相关关系三、教学方法:师生合作、自主探索、生生合作四、教学手段:实物投影五、教学过程:1、创设情景首先给两个变量 X和Y数学中的例子(1)Y =2X生活中的例子X:身高 Y:体重2、引入新课(1)中两个变量是函数关系,是确定的(2)中代表身高和体重的两个变量的关系是不确定的并且有关系,我们称这两个变量具有相关关系。

今天我们一起来学习变量间的相关关系。

为了能直观的反应两个变量的相关关系,我们可以在平面直角坐标系中描点(x i,y i))得到图像来表示两个变量的相关关系,我们称之为散点图。

下面请各组同学合作举出生活中具有相关关系的两个变量的例子并画出散点图,再进行交流。

学生通过实物投影展示例子(后附)(学生分组举例并由一名同学展示,教师点评)根据学生给出的例子,引导学生给出正相关和负相关的概念正相关:一个变量由小变大时,另一个变量也由小变大。

负相关:一个变量由小变大时,另一个变量由大变小。

3、练习与作业:教材P74 练习A 、练习B六、归纳总结(学生总结,教师完善)1、变量与变量之间的关系有两类:(1)确定性关系(象函数关系)(2)相关关系2、变量间的相关关系的描述性定义及散点图表示3、数学源于生活七、作业:各组完善课上所举例子;预习2.3.2。

人教A版高中数学必修3《二章 统计 2.3 变量间的相关关系 阅读与思考 相关关系的强与弱》优质课教案_0

人教A版高中数学必修3《二章 统计  2.3 变量间的相关关系  阅读与思考 相关关系的强与弱》优质课教案_0

《相关关系的强与弱》教学设计相关关系的强与弱【教案目标】知识与技能:理解先观察散点图再求回归方程的原因;了解相关关系的强与弱与散点图及回归方程的关系;过程与方法:通过定量,定性分析两变量的相关关系,体会数学的严密性。

情感态度与价值观:通过本节学习,培养学生利用整体的观点和互相联系的观点,来分析问题,进一步加强数学的应用意识。

【教学重点】相关系数的理解及其性质【教学难点】相关系数与线性回归模型的拟合效果【教学过程】一、复习回顾1、两个变量的关系(1)不相关关系(2)函数关系(3)相关关系2、用最小二乘法求线性回归方程(1)画散点图(2)求回归系数(3)写出回归方程二、教学过程(一)课堂导入5个学生的数学和物理成绩如下表:画出散点图,判断它们是否具有相关关系。

老师常说:“学不好数学,物理也是学不好的。

” 你认为老师的说法对吗?思考:如何描述相关关系的强弱? (二)新课讲授统计中用相关系数r 来衡量两个变量之间线性关系的强弱。

则两个变量的相关系数的计算公式为yyxx xy ni ni i i ni iil l l y y x x y yx x r =----=∑∑∑===11221)()())((注:∑∑∑====---=-=ni i i xy ni i yy ni i xx y y x x l y y l x x l 11212))((,)(,)(据前面的分析,回归系数 b a , 使得误差xxxyxxxy xx yy ni i i l ll l b l x b a y n l bx a y b a Q 22212)()]([)]([),(--++-+=+-=∑=的最小值为:)1()1(),(222r l l l l l l l l b a Q yy yyxx xyyy xxxyyy -=-=-=相关系数的性质:(1)当0>r 时,0>b ,两变量的值总体上呈现同时增加的趋势,则称两变量正相关;当 0<r 时,0<b ,一变量增加,另一变量有减小的趋势,则称两变量负相关;当 0=r 时,则称两变量线性不相关。

人教A版高中数学必修三新课标优秀教案示范教案两个变量的线性相关第课时

人教A版高中数学必修三新课标优秀教案示范教案两个变量的线性相关第课时

第2课时导入新课思路1客观事物是相互联系的,过去研究的大多数是因果关系,但实际上更多存在的是一种非因果关系.比如说:某某同学的数学成绩与物理成绩,彼此是互相联系的,但不能认为数学是“因”,物理是“果”,或者反过来说.事实上数学和物理成绩都是“果”,而真正的“因”是学生的理科学习能力和努力程度.所以说,函数关系存在着一种确定性关系,但还存在着另一种非确定性关系——相关关系.为表示这种相关关系,我们接着学习两个变量的线性相关——回归直线及其方程.思路2某小卖部为了了解热茶销售量与气温之间的关系,随机统计并制作了某6天卖出热茶的这个问题我们接着学习两个变量的线性相关——回归直线及其方程.推进新课新知探究提出问题(1)作散点图的步骤和方法?(2)正、负相关的概念?(3)什么是线性相关?(4)看人体的脂肪百分比和年龄的散点图,当人的年龄增加时,体内脂肪含量到底是以什么方式增加的呢?(5)什么叫做回归直线?(6)如何求回归直线的方程?什么是最小二乘法?它有什么样的思想?(7)利用计算机如何求回归直线的方程?(8)利用计算器如何求回归直线的方程?活动:学生回顾,再思考或讨论,教师及时提示指导.讨论结果:(1)建立相应的平面直角坐标系,将各数据在平面直角坐标中的对应点画出来,得到表示两个变量的一组数据的图形,这样的图形叫做散点图.(a.如果所有的样本点都落在某一函数曲线上,就用该函数来描述变量之间的关系,即变量之间具有函数关系.b.如果所有的样本点都落在某一函数曲线附近,变量之间就有相关关系.c.如果所有的样本点都落在某一直线附近,变量之间就有线性相关关系)(2)如果散点图中的点散布在从左下角到右上角的区域内,称为正相关.如果散点图中的点散布在从左上角到右下角的区域内,称为负相关.(3)如果所有的样本点都落在某一直线附近,变量之间就有线性相关的关系.(4)大体上来看,随着年龄的增加,人体中脂肪的百分比也在增加,呈正相关的趋势,我们可以从散点图上来进一步分析.(5)如下图:从散点图上可以看出,这些点大致分布在通过散点图中心的一条直线附近.如果散点图中点的分布从整体上看大致在一条直线附近,我们就称这两个变量之间具有线性相关关系,这条直线叫做回归直线(regression line).如果能够求出这条回归直线的方程(简称回归方程),那么我们就可以比较清楚地了解年龄与体内脂肪含量的相关性.就像平均数可以作为一个变量的数据的代表一样,这条直线可以作为两个变量具有线性相关关系的代表.(6)从散点图上可以发现,人体的脂肪百分比和年龄的散点图,大致分布在通过散点图中心的一条直线.那么,我们应当如何具体求出这个回归方程呢?有的同学可能会想,我可以采用测量的方法,先画出一条直线,测量出各点与它的距离,然后移动直线,到达一个使距离的和最小的位置,测量出此时的斜率和截距,就可得到回归方程了.但是,这样做可靠吗?有的同学可能还会想,在图中选择这样的两点画直线,使得直线两侧的点的个数基本相同.同样地,这样做能保证各点与此直线在整体上是最接近的吗?还有的同学会想,在散点图中多取几组点,确定出几条直线的方程,再分别求出各条直线的斜率、截距的平均数,将这两个平均数当成回归方程的斜率和截距.同学们不妨去实践一下,看看这些方法是不是真的可行?(学生讨论:1.选择能反映直线变化的两个点.2.在图中放上一根细绳,使得上面和下面点的个数相同或基本相同.3.多取几组点对,确定几条直线方程.再分别算出各个直线方程斜率、截距的算术平均值,作为所求直线的斜率、截距.)教师:分别分析各方法的可靠性.如下图:上面这些方法虽然有一定的道理,但总让人感到可靠性不强.实际上,求回归方程的关键是如何用数学的方法来刻画“从整体上看,各点与此直线的距离最小”.人们经过长期的实践与研究,已经得出了计算回归方程的斜率与截距的一般公式⎪⎪⎪⎩⎪⎪⎪⎨⎧-=--=---=∑∑∑∑====.)1(,)())((2121121x b y a x n xyx n yx x x y y x x b ni ini ii n i i ni i i其中,b 是回归方程的斜率,a 是截距.推导公式①的计算比较复杂,这里不作推导.但是,我们可以解释一下得出它的原理. 假设我们已经得到两个具有线性相关关系的变量的一组数据(x 1,y 1),(x 2,y 2),…,(x n ,y n ), 且所求回归方程是^y =bx+a,其中a 、b 是待定参数.当变量x 取x i (i=1,2,…,n)时可以得到^y =bx i +a(i=1,2,…,n), 它与实际收集到的y i 之间的偏差是y i -^y =y i -(bx i +a)(i=1,2,…,n).这样,用这n 个偏差的和来刻画“各点与此直线的整体偏差”是比较合适的.由于(y i -^y )可正可负,为了避免相互抵消,可以考虑用∑=-ni i iy y1^||来代替,但由于它含有绝对值,运算不太方便,所以改用Q=(y 1-bx 1-a)2+(y 2-bx 2-a)2+…+(y n -bx n -a)2 ②来刻画n 个点与回归直线在整体上的偏差.这样,问题就归结为:当a,b 取什么值时Q 最小,即总体偏差最小.经过数学上求最小值的运算,a,b 的值由公式①给出.通过求②式的最小值而得出回归直线的方法,即求回归直线,使得样本数据的点到它的距离的平方和最小,这一方法叫做最小二乘法(method of least square ). (7)利用计算机求回归直线的方程.根据最小二乘法的思想和公式①,利用计算器或计算机,可以方便地求出回归方程. 以Excel 软件为例,用散点图来建立表示人体的脂肪含量与年龄的相关关系的线性回归方程,具体步骤如下:①在Excel 中选定表示人体的脂肪含量与年龄的相关关系的散点图(如下图),在菜单中选定“图表”中的“添加趋势线”选项,弹出“添加趋势线”对话框.②单击“类型”标签,选定“趋势预测/回归分析类型”中的“线性”选项,单击“确定”按钮,得到回归直线.③双击回归直线,弹出“趋势线格式”对话框.单击“选项”标签,选定“显示公式”,最后单击“确定”按钮,得到回归直线的回归方程^y =0.577x-0.448.(8)利用计算器求回归直线的方程.用计算器求这个回归方程的过程如下:所以回归方程为^y =0.577x-0.448.正像本节开头所说的,我们从人体脂肪含量与年龄这两个变量的一组随机样本数据中,找到了它们之间关系的一个规律,这个规律是由回归直线来反映的. 直线回归方程的应用:①描述两变量之间的依存关系;利用直线回归方程即可定量描述两个变量间依存的数量关系.②利用回归方程进行预测;把预报因子(即自变量x )代入回归方程对预报量(即因变量Y )进行估计,即可得到个体Y 值的容许区间.③利用回归方程进行统计控制规定Y 值的变化,通过控制x 的范围来实现统计控制的目标.如已经得到了空气中NO 2的浓度和汽车流量间的回归方程,即可通过控制汽车流量来控制空气中NO 2的浓度. 应用示例思路1例1 有一个同学家开了一个小卖部,他为了研究气温对热饮销售的影响,经过统计,得到一个卖出的热饮杯数与当天气温的对比表:(1)画出散点图;(2)从散点图中发现气温与热饮销售杯数之间关系的一般规律; (3)求回归方程;(4)如果某天的气温是2 ℃,预测这天卖出的热饮杯数. 解:(1)散点图如下图所示:(2)从上图看到,各点散布在从左上角到右下角的区域里,因此,气温与热饮销售杯数之间呈负相关,即气温越高,卖出去的热饮杯数越少.(3)从散点图可以看出,这些点大致分布在一条直线的附近,因此,可用公式①求出回归方程的系数.利用计算器容易求得回归方程^y =-2.352x+147.767.(4)当x=2时,^y =143.063.因此,某天的气温为2 ℃时,这天大约可以卖出143杯热饮. 思考气温为2 ℃时,小卖部一定能够卖出143杯左右热饮吗?为什么? 这里的答案是小卖部不一定能够卖出143杯左右热饮,原因如下:1.线性回归方程中的截距和斜率都是通过样本估计出来的,存在随机误差,这种误差可以导致预测结果的偏差.2.即使截距和斜率的估计没有误差,也不可能百分之百地保证对应于x 的预报值,能够与实际值y 很接近.我们不能保证点(x,y )落在回归直线上,甚至不能百分之百地保证它落在回归直线的附近,事实上,y=bx+a+e=^y +e.这里e 是随机变量,预报值^y 与实际值y 的接近程度由随机变量e 的标准差所决定. 一些学生可能会提出问题:既然不一定能够卖出143杯左右热饮,那么为什么我们还以“这天大约可以卖出143杯热饮”作为结论呢?这是因为这个结论出现的可能性最大.具体地说,假如我们规定可以选择连续的3个非负整数作为可能的预测结果,则我们选择142,143和144能够保证预测成功(即实际卖出的杯数是这3个数之一)的概率最大.(1)请判断机动车辆数与交通事故数之间是否有线性相关关系,如果不具有线性相关关系,说明理由;(2)如果具有线性相关关系,求出线性回归方程. 解:(1)在直角坐标系中画出数据的散点图,如下图.直观判断散点在一条直线附近,故具有线性相关关系. (2)计算相应的数据之和:∑=81i ix=1 031,∑=81i iy=71.6,∑=812i ix=137 835,∑=81i ii yx =9 611.7.将它们代入公式计算得b≈0.077 4,a=-1.024 1, 所以,所求线性回归方程为=0.077 4x-1.024 1.思路2例1 给出施化肥量对水稻产量影响的试验数据:(1)画出上表的散点图; (2)求出回归直线的方程. 解:(1)散点图如下图.b=230770003.39930787175⨯-⨯⨯-≈4.75,a=399.3-4.75×30≈257.从而得回归直线方程是^y =4.75x+257.例2 一个车间为了规定工时定额,需要确定加工零件所花费的时间.为此进行了10次试验,测得数据如下:请判断y 与x 是否具有线性相关关系,如果y 与x 具有线性相关关系,求线性回归方程. 解:在直角坐标系中画出数据的散点图,如下图.直观判断散点在一条直线附近,故具有线性相关关系.由测得的数据表可知:∑===1012,7.91,55i ix y x =38 500,∑=1012i iy =87 777,∑=101i i i y x =55 950.b=2210121015510385007.915510559501010⨯-⨯⨯-=--∑∑==x xyx yx i ii ii≈0.668.a=x b y -=91.7-0.668×55≈54.96.因此,所求线性回归方程为^y =bx+a=0.668x+54.96. 例3 已知10条狗的血球体积及红血球数的测量值如下: (1)画出上表的散点图; (2)求出回归直线的方程. 解:(1)散点图如下.(2)101=x (45+42+46+48+42+35+58+40+39+50)=44.50, 101=y (6.53+6.30+9.52+7.50+6.99+5.90+9.49+6.20+6.55+8.72)=7.37. 设回归直线方程为^y =bx+a,则b=210121011010x xyx yx i ii ii --∑∑===0.175,a=x b y -=-0.418,所以所求回归直线的方程为^y =0.175x-0.148.点评:对一组数据进行线性回归分析时,应先画出其散点图,看其是否呈直线形,再依系数a,b 的计算公式,算出a,b .由于计算量较大,所以在计算时应借助技术手段,认真细致,谨防计算中产生错误,求线性回归方程的步骤:计算平均数y x ,;计算x i 与y i 的积,求∑x i y i ;计算∑x i 2;将结果代入公式求b ;用a=x b y -求a ;写出回归直线方程. 知能训练1.下列两个变量之间的关系哪个不是函数关系( )A.角度和它的余弦值B.正方形边长和面积C.正n边形的边数和它的内角和D.人的年龄和身高 答案:D2.三点(3,10),(7,20),(11,24)的线性回归方程是( ) A.^y =5.75-1.75x B.^y =1.75+5.75x C.^y =1.75-5.75x D.^y =5.75+1.75x答案:D设y 对x 呈线性相关关系.试求: (1)线性回归方程^y =bx+a 的回归系数a,b ;(2)估计使用年限为10年时,维修费用是多少? 答案:(1)b=1.23,a=0.08;(2)12.38.4.我们考虑两个表示变量x 与y 之间的关系的模型,δ为误差项,模型如下:模型1:y=6+4x ;模型2:y=6+4x+e .(1)如果x=3,e=1,分别求两个模型中y 的值;(2)分别说明以上两个模型是确定性模型还是随机模型. 解:(1)模型1:y=6+4x=6+4×3=18; 模型2:y=6+4x+e=6+4×3+1=19.(2)模型1中相同的x 值一定得到相同的y 值,所以是确定性模型;模型2中相同的x 值,因δ的不同,所得y 值不一定相同,且δ为误差项是随机的,所以模型2是随机性模型.(1)画出数据的散点图;(2)用最小二乘法估计求线性回归方程. 解:(1)散点图如下图.(2)n=5,∑=51i ix=545,x =109,∑=51i iy=116,y =23.2,∑=512i ix=60 952,∑=51i ii yx =12 952,b=2545609525116545129525-⨯⨯-⨯≈0.199,a=23.2-0.199×109≈1.509, 所以,线性回归方程为y=0.199x+1.509. 拓展提升某调查者从调查中获知某公司近年来科研费用支出(X i )与公司所获得利润(Y i )的统计资料如下表:科研费用支出(X i )与利润(Y i )统计表单位:万 要求估计利润(Y i )对科研费用支出(X i )的线性回归模型.解:设线性回归模型直线方程为:i i X Y 1^0^^ββ+=,因为:630==∑nX x i=5,6180==∑nYY i=30, 根据资料列表计算如下表:01方法一:3006009001200540060003020061803010006)(2221^=--=-⨯⨯-⨯=--=∑∑∑∑i i ii i X X n Y Y X n β=2, x Y 1^0^ββ-==30-2×5=20.方法二:501005620030561000)(2221^=⨯-⨯⨯-=--=∑∑x n X Y x n Y X ii i β=2, x Y 1^0^ββ-==30-2×5=20.方法三:50100)())((21^=---=∑∑x X Y Y x X ii iβ=2,x Y 1^0^ββ-==30-2×5=20.所以利润(Y i )对科研费用支出(X i )的线性回归模型直线方程为:i Y ^=20+2X i . 课堂小结1.求线性回归方程的步骤: (1)计算平均数y x ,; (2)计算x i 与y i 的积,求∑x i y i ; (3)计算∑x i 2,∑y i 2,(4)将上述有关结果代入公式⎪⎪⎪⎩⎪⎪⎪⎨⎧-=--=---=∑∑∑∑====xb y a x n x yx n yx x x y y x x b n i i ni ii ni i ni i i ,)())((1221121凡事豫(预)则立,不豫(预)则废。

8.1.2样本相关系数教学设计2023-2024学年高二下学期数学人教A版(2019)选择性必修三

8.1.2样本相关系数教学设计2023-2024学年高二下学期数学人教A版(2019)选择性必修三

8.1.2 样本相关系数教学内容样本相关系数的定义,样本相关系数的统计含义.教学目标(1)通过类比单变量数据的数字特征涵义,经历构造相关系数的过程,能用自己的语言说明数据“中心化”“标准化”的作用,解释相关系数定义的合理性,获得利用数学工具刻画数据统计特征的经验.(2)能举例说明样本相关系数的正负与相关关系正负性的关系;能通过样本相关系数与标准化数据对应的多维向量数量积关系,举例说明样本相关系数大小与线性相关程度的关系,从而理解样本相关系数的统计含义.(3)结合散点图和通过样本相关系数的计算,能比较多组成对数据间的线性相关程度的强弱,并能解释其在具体情境中的含义.教学重点与难点(1)教学重点:样本相关系数的定义,样本相关系数的统计含义.(2)教学难点:了解样本相关系数的统计含义.教学过程设计环节一提出问题,构造数字特征引导语利用散点图可以对成对样本数据的相关关系进行一个大致的定性推断,如上一节课图8.1-1和图8.1-5(4)都是正相关,但这两个散点图反映的成对样本数据的相关程度大小显然不一样,怎么构造一个数字特征量化成对样本数据的线性相关程度呢?问题1表8.1-2中成对数据(x i,y i)其实对应两组数据:一个个体的年龄数据x i和脂肪含量数据y i.回忆以前的统计知识,一组数据的量化数字特征有哪些?代表什么涵义?能用它们来解释成对数据的信息吗?师生活动学生独立思考后进行交流,回忆出单个变量的数字特征通常有均值和方差,即数据x i的数字特征有x̅,s x,数据y i的数字特征有y̅,s y,如均值x̅代表年龄的平均数,y̅代表脂肪的平均含量,很容易想到(x̅,y̅)代表14个人的平均年龄对应的平均脂肪含量,不妨把(x̅,y̅)叫做成对数据(x i,y i)的中心点.而s x,s y反应的是数据偏离平均数的平均程度,即x i−x̅的平均情况,y i−y̅的平均情况,因此反应的是数据的波动情况,因此s x,s y与成对数据(x i−x̅,y i−y̅)的两个维度的大小有关,我们把(x i−x̅,y i−y̅)看作是(x i,y i)以(x̅,y̅)为零点进行平移得到的,其实就是成对数据(x i,y i)的中心点(x̅,y̅)移到原点,数据对应变成(x i−x̅,y i−y̅),这一过程称为数据的“中心化”处理,它不改变原数据的分布规律,在统计中常常用到.设计意图通过单变量数字特征的回忆,激发学生寻找单变量处理与成对变量处理之间的关系,了解“中心化”处理在统计中的涵义,为构造成对数据数字特征做好铺垫.追问1结合表8.1-2中数据(x i,y i)的思考,线性正相关的数据中心化处理后,得到的数据(x i−x̅,y i−y̅)以及散点图有什么特点呢?为什么?师生活动教师给出(x i,y i),(x i−x̅,y i−y̅)的散点图(如图8.1-6),学生思考、讨论、交流.学生通过观察、讨论发现,正线性相关的散点规律是从左下角到右上角,由于中心平移到原点的道理,分布规律没有改变,中心化处理的数据得到的散点大多数分布在一、三象限,也即大多数散点的横坐标x i−x̅与纵坐标y i−y̅同号,即(x i−x̅,y i−y̅)>0,所以大多数点同时为正或同时为负.同理,线性负相关的数据中心化处理后,得到的散点大多数分布在二、四象限,也即大多数散点的横坐标x i−x̅与纵坐标y i−y̅异号,即(x i−x̅,y i−y̅)<0.如图8.1-7所示,(1)正相关,(2)负相关.一般地,如果变量x和y正相关,那么关于均值平移后的大多数散点将分布在第一、三象限,对应的成对数据同号的居多;如果变量x和y负相关,那么关于均值平移后的大多数散点将分布在第二、四象限,对应的成对数据异号的居多.设计意图了解中心化处理数据的作用,为构造刻画正负性相关关系的数字特征搭建桥梁.追问2根据上述分析,你能利用样本数据平移后呈现的正负号规律,构造一个度量成对样本数据是正相关还是负相关的数字特征吗?师生活动学生分小组讨论再展示交流,利用平移后的横、纵坐标的符号规律,学生可以构造出一个数字特征:L=(x1−x̅)(y1−y̅)+(x2−x̅)(y2−y̅)+⋯+(x n−x̅)(y n−y̅)来刻画成对样本数据相关的正负性,即L>0时,正相关;L<0时,负相关.此时教师再加以引导,当成对变量的样本数据很多时,L可能会很大,使用很不方便,用什么方法消除数据个数的影响呢?学生可能会根据单变量数字特征“均值”的定义,平均化的方法来消除个数的影响,即得到数字特征:[(x1−x̅)(y1−y̅)+(x2−x̅)(y2−y̅)+⋯+(x n−x̅)(y n−y̅)].L xy=1n一般情形下,L xy>0表明成对样本数据正相关;L xy<0表明成对样本数据负相关.设计意图借助追问1的分析,趁热打铁,构造数字特征刻画变量相关的正负性;体验L xy形成的过程,理解数学是一门讲“道理”的科学.追问3有了数字特征L xy,我们可以用数值符号来说明成对数据之间相关性的正负,若把表8.1-2中脂肪含量的数据变成原来的100倍,即y i变成100y i,年龄数据x i不变,此时计算出的L xy一样吗?你认为L xy的大小一定能度量出成对样本数据的相关程度吗?师生活动学生思考后发现,同一组成对数据,单位不一样,计算结果不一样,但是并没有改变数据的相关程度,不同组数据,涉及的行业不一样,单位也不一样,所以没有办法通过L xy的大小来判断不同组数据的相关程度大小,除非单位统一.设计意图让学生认识L xy到刻画相关程度的局限性,需要统一中心化后的数据量纲.追问4怎么消除度量单位的影响呢?师生活动教师引导学生思考:一般情况下,要消除单位的影响,这些数据“量纲”要相同,现实中的数据不可能单位都相同,因此我们可以把数据转化为某种不带单位的比例来思考,这就是数据的“标准化”处理.我们把中心化处理后得到的数据(x i−x̅,y i−y̅)的两个维度除以相应的标准差,得到标准化数据(x i−x̅s x ,y i−y̅s y),该数据反应的是原始数据偏离平均值的长度与标准差的倍数关系,这样就消除了单位带来的影响,这里s x=√1n ∑(x i−x̅)2ni=1,s y=√1n∑(y i−y̅)2ni=1.所以把(x1−x̅s x ,y1−y̅s y),(x2−x̅s x,y2−y̅s y),⋯,(x n−x̅s x,y n−y̅s y)称为标准化数据,为简单起见,把以上“标准化”处理后的成对数据分别记为:(x1′,y1′),(x2′,y2′),⋯,(x n′,y n′).标准化数据不改变中心化处理后数据的符号,但解决了单位的统一问题,所以模仿之前构造数字特征L xy的方法,可以得到:r=1n(x1′y1′+x2′y2′+⋯+x n′y n′)=1n∑(x i−x̅)(y i−y̅)ni=1s x s y=∑()()ni=1√∑(x i−x̅)2√∑(y i−y̅)2ni=1ni=1我们称,为变量x和y之间的样本相关系数,它可以刻画变量的相关性,同时又可以刻画数据的相关程度.设计意图让学生了解数据“标准化”的必要性,知道标准化数据的含义,体验合理建构样本相关系数的过程,知道样本相关系数可以刻画相关关系的正负性,也可以用来刻画相关程度.环节二剖析概念,理解数字特征问题2 样本相关系数r=1n(x1′y1′+x2′y2′+⋯+x n′y n′),这个结构形式和前面学习的什么知识有关?你能否根据这个结构形式关联相关知识,探究出与相关系数r有关的一些结论?师生活动学生自主思考,然后小组讨论,最后全班展示,教师引导学生开展生生互动和点评.若学生自己联想向量有难度时,教师则可引导学生观察x1′y1′+x2′y2′+⋯+x n′y n′,联想前面学习过的向量数量积定义,类比二维、三维向量数量积的定义推广到n维;也可提前安排学生学习“阅读与思考:向量概念的推广与应用”,了解有关知识.教师引导学生可以发现:(1)若将x1′y1′+x2′y2′+⋯+x n′y n′看作两个n维向量x′=(x1′+x2′+⋯+x n′)和y′=(y1′+y2′+⋯+y n′)的数量积,则有r=1n x1′·y1′=1n|x′||y′|cosθ.(2)|x′|=√(x1−x̅s x )2+(x2−x̅s x)2+⋯(x n−x̅s x)2=√∑(x i−x̅)2ni=1s x2=√∑(x i−x̅)2ni=11n∑(x i−x̅)2ni=1=√n.同理|y′|=√n.此处化简有难度,可留足够时间让学生自己演算探究.(3)由r=1n x′∙y′=1n|x′||y′|cosθ,可得r=cosθ,其中θ为x′和∙y′之间的夹角.即样本相关系数r就是标准化数据向量夹角的余弦值,由cosθ∈[−1,1],可得r∈[−1,1].(4)若|r|=1,则θ=0或π,此时向量x′和y′共线,即存在实数λ使得y′=λx′;若r=0,则向量x′和y′垂直.设计意图让学生深入理解相关系数r的结构特征,学会用联系的观点分析问题,也为深入学习r刻画变量的相关程度做铺垫,同时培养学生的探究能力和创新意识.追问当|r|=1时,向量x′和y′共线,存在实数λ使得y′=λx′,即y i−y̅s y =λx i−x̅s y,i=1,2,⋯,n,成对样本数据(x i,y i)是否在一条直线上呢?当r=0时呢?|r|的大小与成对数据的相关程度有什么内在联系?师生活动学生独立思考,教师启发引导.当|r|=1时,则成对样本数据(x i,y i)都落在直线y−y̅=λs ys x(x−x̅)上.这时,成对样本数据的两个变量间满足一种线性关系.若r=0,则说明成对样本数据间没有线性相关关系,但不排除它们之间有其他相关关系.当0<|r|<1时,则是一种中间的渐变状态,可见|r|大小刻画了样本点集中于某条直线的程度,因此r也叫样本线性相关系数.最后教师引导学生获得结论:r∈[−1,1]当|r|越接近于1时,成对样本数据的线性相关程度越强;当|r|越接近于0时,成对样本数据的线性相关程度越弱;对于其他相关类型如曲线相关,|r|的大小则不具有指导意义.需要注意的是:|r|=1,成对样本数据的两个变量之间满足线性关系,并不能认为总体中的两个变量一定有线性关系,可以推断它们的相关程度很强.设计意图了解r与向量的关系,明确样本相关系数与标准化处理后数据的向量夹角之间的关系,借助向量的位置关系理解r大小与变量相关程度的内在联系,最终理解r的统计含义.环节三数形结合,强化数字特征引导语上节课,我们学习了从散点图中直观观察成对数据的线性相关问题,本节课,我们建构了相关系数来刻画变量的相关程度,二者之间匹配时是怎样的感觉呢?问题3图8.1-8给出了四幅散点图和相应的相关系数,你能利用所学知识进行分析吗?师生活动学生独立思考,并分享交流,教师抽问点评.图(1)中的散点有明显的从左下角到右上角沿直线分布的趋势,说明成对样本数据呈现出线性相关关系;样本系数为r=0.97,表明成对样本数据的正线性相关程度很强.图(2)中的散点有明显的从左上角到右下角沿直线分布的趋势,说明成对样本数据也呈现出线性相关关系;样本系数为r=−0.85,表明成对样本数据的负线性相关程度比较强.从样本相关系数来看,图(1)中成对样本数据的线性相关程度要比图(2)中强一些;图(3)中的成对样本数据的线性相关程度很弱,图(4)中的成对样本数据的线性相关程度极弱.设计意图让学生体会散点图中观察到的线性相关和相关系数大小判断的线性相关的匹配关系,由数形结合来认识线性相关关系.追问1你能说一说散点图和相关系数在判断变量相关关系时的区别吗?师生活动先分小组讨论,再抽学生发言分享.教师引导时主要围绕以下几点:(1)散点图可以从直观上定性的判断成对样本数据的相关性,但是对于相关程度只能大致判断而不能具体明确.(2)线性相关系数可以定量地判断成对样本数据相关的正负和线性相关程度.(3)散点图可以直观地发现成对样本数据的整体规律(包括线性和非线性),还可以发现异常样本点.(4)线性相关系数虽可以定量分析,但是对于非线性相关则不一定有指导意义.设计意图旨在让学生理解在分析成对样本数据的相关性上,散点图和样本相关系数各有优势,互相不能代替,并不是样本相关系数更好.追问2有了样本相关系数,是否就能确切地反映总体成对数据的相关程度?师生活动学生独立思考、讨论后再全班交流,教师帮助总结:在实际生活中获得总体所有成对数据是不容易的,也是不现实的,因此要用样本估计总体的思想,通过样本相关系数去估计总体相关系数.但样本具有随机性,所以样本相关系数也具有随机性.一般地,样本容量越大,用样本相关系数估计两个变量的相关系数的效果越好.设计意图让学生了解样本相关系数的随机性,了解样本相关系数和总体相关系数的关系,体会样本估计总体的思想处处存在.环节四例题练习,巩固应用例2根据表8.1-2中脂肪含量和年龄的样本数据,推断两个变量是否线性相关,计算样本相关系数,并推断它们的相关程度.师生活动学生根据数据和前面的散点图8.1-1定性推断脂肪含量和年龄线性正相关,然后根据公式用计算器独立计算r,初步体会手工计算比较繁琐,教师此时引导学生:对样本相关系数公式中的分子乘积式、分母平方式展开,你能进一步得到什么式子?是否能简化部分运算?让学生对公式展开运算,化简得r =∑(x −x̅)(y −y̅)n i=1√∑(x i −x̅)2√∑(y i −y̅)2n i=1n i=1=∑x y −nxy̅̅̅n i=1√∑x i 2n i=1−nx̅2√√∑y i2n i=1−ny ̅2学生能意识到x i 与y i 具有对等、对应地位,新的式子可以减少部分运算,即利用计算工具可得x̅≈48.07,y ̅≈27.26,∑x i 14i=1y i =19403.2,∑x i 214i=1=34181,∑y i 214i=1=11051.77,代入上述公式可得,r ≈0.97,由此用量化的方式推断出脂肪含量和年龄这两个变量线性正相关,且相关程度很强.展开化简后的式子虽然计算量上要少一些,但还是有些麻烦,能否利用技术手段直接计算出结果呢?教师引出用Excle 软件中的函数CORREL 或者用R 软件中函数cor 可以直接得出r 的结果,学生体验用软件直接计算,体会技术带来的便捷.设计意图 让学生感受直观判断与量化计算判断的一致性,体会量化计算的确定性;通过从手工直接计算到计算的优化,再到技术的支持,强化样本相关系数公式的结构特征,体会技术的优越性.例3 在某校高一年级中随机抽取25名男生,测得他们的身高、体重、臂展等数据,如表8.1-5所示.表8.1-5编号 身高/cm 体重/kg 臂展/cm 编号 身高/cm 体重/kg 臂展/cm 1 173 55 169 14 166 66 161 2 179 71 170 15 176 61 166 3 175 52 172 16 176 49 165 4 179 62 177 17 175 60 173 5 182 82 174 18 169 48 162 6 173 63 166 19 184 86 189 7 180 55 174 20 169 58 164 8 170 81 169 21 182 54 170 9 169 54 166 22 171 58 164 1017754176231776117311 177 59 170 24 173 58 16512 178 67 174 25 173 51 16913 174 56 170体重与身高、臂展与身高分别具有怎样的相关性?师生活动由于表格不方便直接看出关系,先让学生根据日常的经验猜测体重与身高、臂展与身高的关系,学生可能猜测两者都是正相关.接着教师引导,若都是正相关,那么相关程度一样吗?我们还可以借助散点图来初步观察.学生利用技术工具画图:根据样本数据画出体重与身高、臂展与身高的散点图,如图8.1-9所示.根据散点图直观判断,两组随机变量都成正线性相关状态,但是身高与体重的线性正相关程度不如身高与臂展理想.教师引导学生思考,这种直观判断是否和量化计算的结果一致呢?学生通过利用统计软件计算样本相关系数,得到体重与身高、臂展与身高的样本相关系数分别约为0.34和0.78,都为正线性相关,但相关程度不一样,和直观判断一致.最后让学生结合统计结果在具体情境中作出合理的解释:相对臂展与身高关系,体重更容易受到饮食、环境、锻炼等多种因素的影响,因此体重与身高的线性相关程度低,设计意图通过直观比较到量化计算比较,体现散点图和样本相关系数在推断相关关系时各自的优劣,体会推断相关关系的一般过程,在猜测、直观、量化、解释的环节中培养学生分析和解决问题的能力.环节五回顾小结,形成结构问题4 回顾本单元课所学内容,并回答下列问题:(1)本单元知识产生发展的过程和研究思路是怎样的?(2)构造样本相关系数定义的过程中用到了哪些处理数据的基本方法?(3)样本相关系数与标准化处理后数据对应的向量有什么关系?这种关系与相关程度的关系是怎样的?(4)散点图和样本相关系数之间的关系是怎样的?它们有哪些优缺点?(5)在应用问题中推断两个变量相关关系的一般步骤是什么?你有什么启发?设计意图通过回顾小结,明确本单元的结构和思想方法,反思重要概念的形成过程,深刻体会散点图的直观和样本相关系数的量化相结合对解决实际问题的重要性.环节六目标检测,检验效果1,(多选题)对两个变量的样本相关系数r,下列说法正确的是()A.|r|越大,线性相关程度越强B.|r|越小,线性相关程度越弱C.|r|趋近于0时,没有相关关系D.|r|越接近1,线性相关程度越强2.已知变量x和变量y的3对随机观测数据(2,2),(3,−1),(5,−7),计算成对样本数据的样本相关系数.能据此推断这两个变量线性相关吗?为什么?3.5个学生的数学和物理成绩如表8.1-6.表8.1-6学生A B C D E学科数学80 75 70 65 60物理70 66 68 64 62试用散点图和样本相关系数r判断它们是否具有线性相关关系,若有,是正相关还是负相关?设计意图第1题考查学生对于|r|大小的统计含义的理解;第2题体现样本相关系数r=−1和总体相关系数的关系,认识样本选取的合理性和样本相关系数的随机性;第3题考查学生应用散点图及样本相关系数分析问题的能力.环节七布置作业,应用迁移作业:教科书第103页练习第3、4题,第104页习题8.1第2、3题.。

人教A版高中数学必修3《二章 统计 2.3 变量间的相关关系 阅读与思考 相关关系的强与弱》优质课教案_7

人教A版高中数学必修3《二章 统计  2.3 变量间的相关关系  阅读与思考 相关关系的强与弱》优质课教案_7

《阅读与思考 相关关系的强与弱》教学设计教材分析:本课内容是人教A 版必修三第二章《统计》第3节《变量间的相关关系》第三课时的教学内容,是在第一课时学习“变量之间的相关关系”、第二课时学习“两个变量的线性相关”的基础上的进一步深化,旨在使学生从定量的角度判定两个具有相关关系的变量的相关性的强弱,进一步培养并发展学生的数学运算和数据分析的数学素养.教学目标:1.体会用散点图直观地判断两个变量相关性的强弱;2.会根据两个变量的相关系数的计算公式()()nii xx y y r --=∑量之间相关性及线性关系的强弱;3.通过讲练结合、师生互动的教学实践,培养学生发现和提出问题,并应用知识分析和解决问题的能力;通过两种方法判断相关关系的强弱比较,培养与发展学生直观想象、数据处理、数学运算等数学核心素养.教学重点:会根据相关系数的计算公式衡量两个变量之间线性相关关系的强弱. 教学难点:相关系数的计算. 教学方法:讲练结合法、信息技术融合法. 教学准备:PPT 课件、EXCEL 表等. 教学过程: 一、复习引入【问题1】何为两个变量的相关关系?变量间确实存在关系,但又不具备函数关系所要求的确定性,它们的关系是带有随机性的,那么这两个变量之间的关系叫做相关关系.两个变量之间的关系可分为函数关系和相关关系. 【问题2】什么叫正相关与负相关?正相关:如果一个变量的值由小变大时,另一个变量的值也由小变大,这种相关称为正相关.负相关:如果一个变量的值由小变大时,另一个变量的值由大变小,这种相关称为负相关.【问题3】粮食产量与施肥量之间的相关关系是正相关还是负相关? 在施肥不过量的情况下,施肥越多,粮食产量越高,所以是正相关. 【问题4】如何判断的?根据自己的生活经验、学习经验作出的判断.【问题5】怎样数学地判断一组数据是否具有线性相关关系?画出散点图,若样本点大致分布在一条直线附近,就说明这两个变量具有线性相关关系,否则不具有线性相关关系.【问题6】什么叫散点图?将样本中n个数据点(x i,y i)(i=1,2,…,n)描绘在平面直角坐标系中得到的图形叫做散点图.【问题7】一台机器按不同的转速生产出来的某机械零件有一些会有缺点,每小时生解析:散点图如图所示:近似直线如图所示:由散点图可以看出两个变量对应的点大致分布在一条直线附近,因此可以得出结论:每小时生产有缺点的零件数y(件)与机器运转速度x(转/秒)这两个变量具有相关关系,且它们是正相关关系.总结:在研究两个变量之间是否存在某种关系时,可以散点图入手.对于散点图,可以作出如下判断:(1)若所有的样本点都落在某一函数曲线上,则就用该函数来描述变量之间的关系,即变量之间具有函数关系;(2)若所有的样本点都落在某一直线附近,则变量之间就有线性相关关系;(3)若散点图中的点的分布几乎没有什么规律,则这两个变量之间不具有相关关系,即两个变量之间是相互独立的.【问题8】每小时生产有缺点的零件数y(件)与机器运转速度x(转/秒)这两个变量具有相关关系,相关强度如何?用什么来衡量呢?二、新课讲练统计中,我们用相关系数来衡量两个变量之间相关关系的强弱.(一)概念讲解1. 相关系数散点图可反映两个变量之间的相互关系及其相关方向,但无法确切地表明两个变量之间相关的程度.于是,著名英国统计学家卡尔·皮尔逊设计了统计指标——相关系数(Correlation coefficient).相关系数是用以反映变量之间相关关系密切程度的统计指标.相关系数是按积差方法计算,同样以两变量与各自平均值的离差为基础,通过两个离差相乘来反映两变量之间相关程度;着重研究线性的单相关系数.2.3.衡量办法(1)当0r >时,表明变量,x y 正相关;当0r <时,表明变量,x y 负相关. (2)||r 的越大,表明变量,x y 相关性越强;||r 的越小,表明变量,x y 相关性越弱.具体说,若0||0.30r ≤<,则相关性较弱或几乎没有什么关系;若0.30||0.75r ≤<,则相关性一般; 若0.75||1r ≤≤,则相关性很强. 【思考】||1r >吗? 柯西不等式:设1212,,,,,,,n n a a a b b b 为实数,则 222222212121122()()()n n n n a a a b b b a b a b a b ++++++≥+++,当且仅当0(1,2,,)i b i n ==或存在一个数k ,使得(1,2,,)i i a kb i n ==时等号成立.根据此不等式得222111()()()()nn nii i i i i i xx y y x x y y ===⎡⎤--≥--⎢⎥⎣⎦∑∑∑ ,1()()ni i i x x y y =≥--∑,于是||1r ≤.(二)知识应用例1 根据下面四个散点图及相关系数的值,说说变量间的相关性强弱.r=也说明两个变量正相关,且相关性很图1中的点有明显的沿直线分布趋势,0.97强.r=-也说明两个变量负相关,且相关图2中的点也有明显的沿直线分布趋势,0.85性很强.图3中的点的分布几乎没有什么规则,不能用线性回归模型来描述两个变量之间的关r=也说明两个变量相关性很弱.系,0.24图4中的点的分布更没有什么规则,更不能用线性回归模型来描述两个变量之间的关r=-也说明两个变量几乎没有什么关系.系,0.05例2 一台机器按不同的转速生产出来的某机械零件有一些会有缺点,每小时生产有(Ⅱ)根据相关系数的值,判定它们是正相关还是负相关及相关性的强弱.问题(Ⅰ):前面已经解决.问题(Ⅱ):在由相关系数表明,两个变量是正相关,且相关性很强.(三)课堂练习练习1为了分析学生的物理、政治与数学成绩的关系,请从给出的几位同学近期考试的数学与物理、政治成绩,利用相关系数来判定物理与数学、政治与数学是否具有相关性,练习2为了分析学生的物理、政治成绩与数学成绩的关系,现收集了我班48名学生如何?强弱有明显的变化?需要指出的是,相关系数有一个明显的缺点,即它接近于1的程度与数据组数n 相关,这容易给人一种假象.因为,当n 较小时,相关系数的波动较大,对有些样本相关系数的绝对值易接近于1;当n 较大时,相关系数的绝对值容易偏小.特别是当n=2时,相关系数的绝对值总为1.因此在样本容量n 较小时,我们仅凭相关系数较大就判定变量x 与y 之间有密切的线性关系是不妥当的.另外,相关系数也与样本有关,因为样本是随机的.三、归纳总结请同学们总结本节课主要的学习内容.1.相关系数是用以反映变量之间相关关系密切程度的统计指标.2.两个变量的相关系数的计算公式:()()nii xx y y r --=∑3.衡量办法:(1)当0r >时,变量,x y 正相关;当0r <时,变量,x y 负相关.(2)||r 的越大,变量,x y 相关性越强;||r 的越小,变量,x y 相关性越弱. 若0.75||1r ≤≤,则变量,x y 具有很强的相关性.四、作业布置1.请根据我班48名学生本学期期中考试的成绩,分析学生的哪一科成绩与数学成绩的相关性最强?2.请根据我班48名学生本学期期中考试的成绩,分析学生各学科成绩间的相关关系,找到相关性最强的两个学科.。

人教A版高中数学必修3《二章 统计 2.3 变量间的相关关系 阅读与思考 相关关系的强与弱》优质课教案_2

人教A版高中数学必修3《二章 统计  2.3 变量间的相关关系  阅读与思考 相关关系的强与弱》优质课教案_2

阅读与思考 相关关系的强与弱一、 教学内容分析本节课是《普通高中课程标准实验教科书·数学(3)》(人教A 版)第二章第三节课后阅读与思考《相关关系的强与弱》。

根据我所任教的学生的实际情况,我课前让学生充分阅读,搜集问卷调查利用相关系数的计算公式得出结论,两个变量之间的相关关系用相关系数更准确的描述出相关程度。

让学生真正体验,数学源于生活,相关关系在生活及生产实际中有着广泛的应用,来激发学生的学习兴趣。

利用相关系数判断线性相关程度利用最小二乘法求出回归直线的方程后,可以对上面两个变量的关系进行分析与预测。

是不是所有的相关关系都可以求出回归直线的方程?请大家观察这4幅图结论:前两个是线性相关,可以求回归方程,后两个是非线性相关,直线不能很好地反映图中两个变量之间的关系。

显然求回归直线的方程是没有意义的。

有些变量线性相关,有些非线性相关,怎样衡量变量的线性相关程度呢?0.97r =图120.84r =-图0.27r =图30.05r =-图4这时我们引入一个量:相关系数()()niix x y y r --=∑注意它的符号:当0r >时,x ,y 正相关,当0r <时,x ,y 负相关,统计学认为:对于r ,若[]1,0.75r ∈--,那么负相关很强,若[]0.75,1r ∈,那么正相关很强,若(][)0.75,0.30r ∈--∈或r 0.30,0.75,那么相关性一般, 若[]0.25,0.25r ∈-,那么相关性较弱,不同的相关性可以从散点图上直观地反应出来,观察这几幅散点图,判断图中的两个变----量的相关关系的强弱。

图1、2正线性相关,图1中的点密集,相关性比图2好。

利用相关系数也可以看出相关性,图1中r=0.97接近1,图2中r=-0.85,所以可以总结出相关系数的绝对值越大,线性相关关系就越强。

二、 学生学习情况分析学生已经具备了对样本数据进行初步分析的能力,且掌握了一定的计算基础。

相关关系的强与弱

相关关系的强与弱

r
i 1
n
n
(xi x)2 ( yi y)2
i 1
i 1
n
xi yi nx • y
i 1
n
xi 2
n
2
x
n
yi 2
2
ny
i1
i1
相关系数的性质: (1) 当r>0时,两个变量正相关; 当r<0时,两个变量负相关; 当r=0时,两个变量不相关。
(2) 相关系数的取值范围:|r|≤1 |r|越接近于1,相关程度越强; |r|越接近于0,相关程度越弱。
例1:10名同学在高一和高二的数学成绩如下 表:
x 74 71 72 68 76 73 67 70 65 74
y 76 75 71 70 76 79 65 77 62 72
其中x为高一数学成绩,y为高二数学成绩。
(1)y与x是否具有相关关系;
(2)如果y是x相关关系,求回归直线方程。
10
xi 710
平均 温度x
-2 1 5 20 25 30 34 29 17 15 8 0
空调 平均销量y
8 6 14 20 35 100 280 298 120 55 20 5
电热毯 平均销量y
380 320 180 50 3 0 0 0 3 10 150 297
电视 平均销量y
74 56 52 77 66 28 72 85 91 20 80 51
10
yi 723
10
xi yi 51467
i 1
i 1
i1
10
xi2 50520
i1
10
yi2 52541
i1
练习:测得10对父子身高(单位:英寸)如下表:

人教A版高中数学必修3《二章 统计 2.3 变量间的相关关系 阅读与思考 相关关系的强与弱》优质课教案_2

人教A版高中数学必修3《二章 统计  2.3 变量间的相关关系  阅读与思考 相关关系的强与弱》优质课教案_2

教学设计课题:相关关系的强与弱课时:1课时授课教师:一、教学目标:(1)知识与技能目标:学生能够知道相关关系的强与弱是什么,掌握相关系数r,应用相关系数去解决实际问题。

(2)过程与方法目标:通过小组讨论、自主探究的学习方法,提高提出问题、发现问题、解决的能力。

(3)情感、态度、价值观:通过本节课的学习,学生的数学兴趣得以提高,学生的合作探索兴趣得以培养,能够进一步的体会数学来源于生活并服务于生活的本领。

二、教学的重点和难点:(2)教学重点:知道相关关系的强与弱是什么,掌握相关系数r,应用相关系数去解决实际问题。

(3)教学难点:掌握相关系数r,应用相关系数去解决实际问题。

二、教学方法:讲授法,提问法,在本节课的教学中还要渗透自主探究法、小组讨论法等。

四、教学过程:(一)导入新课本课主要采用:直接导入教师提问:物理成绩与数学成绩正相关,但数学成绩能够在多大程度上决定物理成绩?这就是相关强弱的问题。

设计意图:这种方法,不仅能引起学生的兴趣,而且能够引导学生思考,并且引出新课题。

(二)讲授新课:相关系数(三)巩固练习:下图是我国2008年至2014年生活垃圾无害化处理量(单位:亿吨)的折线图(I)由折线图看出,可用线性回归模型拟合y与t的关系,请用相关系数加以说明;(II)建立y关于t的回归方程(系数精确到0.01),预测2016年我国生活垃圾无害化处理量。

参考数据:,,,≈2.646.(四)小结:教师引导学生对本节课的知识进行小结,学生畅谈本节课的收获,教师给予点评和补充。

(五)作业布置:回家复习本节课的知识。

五、板书设计(1)相关关系的强与弱使用相关系数r来描述的(2)r的范围-1~1(3)r大于零正相关,r小于零负相关(4)0.75法则(5)散点图中的所有点同时落在一条直线上则r=-1或r=1。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

《相关关系的强与弱》
教学设计
教学过程
教学过程一、导入新课:
我们知道,两个变量x与y正(负)相关时,他们就有相同(反)
的变化趋势,当x和由小变大时,相应的y有由小(大)变大(小)
的趋势,因此可以用回归直线来描述这种关系。

与此相关的一个问题
是:如何描述x与y之间的这种线性关系的强弱?例如,物理成绩与
数学成绩正相关,但数学成绩能够在多大程度上决定物理成绩?这就是
相关强弱的问题,类似的还有吸烟语健康的负相关强度、父母身高与
子女身高的正相关强度、农作物的产量与施肥量的正相关强度等。

从上节课的例题我们来看一看两个变量之间的相关强度如何:
1.下图是人体脂肪含量与年龄的散点图:
如下图:
从散点图发现:年龄越大,体内脂肪含量越高,点的位置散布在
从左下角到右上角的区域,成正相关。

2.汽车的载重和汽车每消耗1升汽油所行使的平均路程,作出散点图发
现,它们散布在从左上角到右下角的区域内,它们成负相关。

3.5个学生的数学和物理成绩如下表:
画出散点图,看它们相关关系的强弱。

展示)

发,让学生
充分体会数
学与实际生
活的联系,
从而使得本
节知识的形
成更自然、
更生动。

借助多媒体
辅助教学进
行演示,引
导学生观察
并分析由图
形得出的结
论。

设置问题,
教学过由散点图可见,两者之间具有正相关关系。

4.气温与热饮销售杯数之间关系的散点图:
可见气温与热饮杯数成负相关,即气温越高,卖出去的热饮杯数越少。

5.看下面一组图片:
引发学生的
思考,激发
学生的求知
欲望。

以教师为主
导,遵从学
生认识规律
进行启发;
以学生为主
体,合作探
究式进行学
习。

答物理成绩
50
55
60
65
70
75
80
405060708090
40
50
60
70
80
90
100
110
120
130
140
150
160
-10010203040

教引出相关系数r及其含义
从这些案例的散点图中我们能比较直观的看出两个变量之间是否具有
线性关系,且初步判断强弱,但我们并不能确切地量化
的进行区分,下面我看看如何用数据进行判断。

统计中用相关系数r来衡量两个变量之间线性关系的强弱,若相
应于变量x的取值i x,变量y的观测值为i y)
1(n
i≤
≤,则两个变量
的相关系数的计算公式为
.
11
2
2
1
∑∑

==
-
-
=
-
-




⎛-




⎛-




⎛-




⎛-
=
n
i
n
i
i
i
n
i
i
i
y
y
x
x
y
y
x
x
r
不同的相关性可以从散点图上直观地反映出来。

图1、图2反映了变量
x和y之间很强的线性相关关系,而图4中的两个变量的线性相关程
度很弱。

对于相关系数r,首先值得注意的是他的符号,当r为正时,表明变量
x和y正相关;当r为负时,表明变量x和y负相关,反映在散点图
上,图1中的变量x和y正相关,这时的r为正,图2中的变量x和y
负相关,这时的r为负。

另一个值得注意的是r的大小。

统计学认为,对于变量x、y,如果[]75.0,1-
-

r,那么负相关很强;如果[]1,75.0

r,那么正相关很强,
如果(]30.0,75.0-
-

r或[),
75
.0,
30
.0

r那么相关性一般,如果
借助多媒体
辅助教学进
行演示,引
导学生观察
并分析由图
形得出的结
论。

学过程

[)25.0,25.0-

r,那么相关性较弱。

反映在散点图上,图1的r=0.97,
这些点有明显的从左下角到右上角沿直线分布趋势,这时用线性回归
模型描述两个变量之间的关系效果很好;图2的r=-0.85,这些点也有
明显的从左上角到右下角沿直线分布趋势,这时用线性回归模型描述
两个变量之间的关系也有好的效果;图3 的r=0.24,这些点的分布几
乎没有什么规则,这时不能用线性回归模型描述两个变量之间的关系;
图4 的r=-0.05,两个变量之间几乎没有什么关系,这时就更不能用线
性回归模型描述两个变量之间的关系。

你能试着对自己身边的某个问题,确定两个变量,通过收集数据,极
端相关系数,计算相关系数,然后分析一下能否用线性回归模型来拟
合它们之间的关系吗?
看下面的问题:
例1:甲、乙、丙、丁四位同学各自对A,B两变量的线性相关关系做实
验,并用回归分析的方法分别求得相关系数r如表:
甲乙丙丁
r-0.82 -0.78 -0.69 -0.85
则哪位同学的试验结果体现A,B两变量有更强的相关性( )
A.甲
B.乙
C.丙
D.丁
例2:对四组数据进行统计,获得如图所示的散点图,关于其相关关系
的比较,正确的是()
1
3
4
2
.r
r
r
r
A
3
1
2
4
.r
r
r
r
B
1
3
2
4
.r
r
r
r
C
3
1
4
2
,r
r
r
r
D
例3:某公司利润y(单位:万元)与销售总额x(单位:千万元)之
间有如表对应数据:
x10 15 17 20 25 28 32
y 1 1.3 1.8 2 2.6 2.7 3.3
(1)画出散点图;
(2)求相关系数r判断y与x线性相关强度.
例4:一个车间为了规定工时定额,需要确定加工零件所花费的时间,
为此进行了10次试验,收集数据如下:
零件(个
数)
10 20 30 40 50 60 70 80 90 100
加工时
间(min)
62 68 75 81 89 95 102 108 115 122
(1) 画出散点图;
学生活动,
动手计算,
做出相关结
论。

学生活动:。

相关文档
最新文档