变量间的相关关系教案
高中数学第二章统计2.3变量的相关性2.3.1-2.3.2变量间的相关关系两个变量的线性相关教学案新人教B版必修3
2.3.1 & 2.3.2 变量间的相关关系 两个变量的线性相关习课本P73~78,思考并完成以下问题预(1)相关关系是函数关系吗?(2)什么是正相关、负相关?与散点图有什么关系?(3)回归直线方程是什么?如何求回归系数?(4)如何判断两个变量之间是否具备相关关系?[新知初探]1.两个变量的关系分类函数关系相关关系 特征两变量关系确定两变量关系带有随机性2.散点图将样本中n 个数据点(x i ,y i )(i =1,2,…,n )描在平面直角坐标系中得到的图形. 3.正相关与负相关(1)正相关:如果一个变量的值由小变大时,另一个变量的值也由小变大,这种相关称为正相关.(2)负相关:如果一个变量的值由小变大时,另一个变量的值由大变小,这种相关称为负相关.4.最小二乘法设x ,Y 的一组观察值为(x i ,y i ),i =1,2,…,n ,且回归直线方程为y ^=a +bx ,当x 取值x i (i =1,2,…,n )时,Y 的观察值为y i ,差y i -y ^i (i =1,2,…,n )刻画了实际观察值y i 与回归直线上相应点纵坐标之间的偏离程度,通常是用离差的平方和,即Q =i =1n(y i -a-bx i)2作为总离差,并使之达到最小.这样,回归直线就是所有直线中Q取最小值的那一条.由于平方又叫二乘方,所以这种使“离差平方和最小”的方法,叫做最小二乘法.5.回归直线方程的系数计算公式回归直线方程回归系数系数a^的计算公式方程或公式y^=a^+b^x b^=∑i=1nxiyi-n x-y-∑i=1nx2i-n x2a^=y-b^x-上方加记号“^ ”的意义区分y的估计值y^与实际值ya,b上方加“^ ”表示由观察值按最小二乘法求得的估计值[小试身手]1.下列命题正确的是( )①任何两个变量都具有相关关系;②圆的周长与该圆的半径具有相关关系;③某商品的需求量与该商品的价格是一种非确定性关系;④根据散点图求得的回归直线方程可能是没有意义的;⑤两个变量间的相关关系可以通过回归直线,把非确定性问题转化为确定性问题进行研究.A.①③④B.②③④C.③④⑤D.②④⑤解析:选C ①显然不对,②是函数关系,③④⑤正确.v,u;对变量1,得散点图图10),…,1,2=i)(iy,ix(有观测数据y,x.对变量2)(由这两个散点图可以判断2.,得散点图图10),…,1,2=i)(iv,iu(有观测数据A.变量x与y正相关,u与v正相关B.变量x与y正相关,u与v负相关C .变量x 与y 负相关,u 与v 正相关D .变量x 与y 负相关,u 与v 负相关解析:选C 由这两个散点图可以判断,变量x 与y 负相关,u 与v 正相关.80,当施肥量为250+x 5=y ^归方程为的线性回(kg)y 与水稻产量(kg)x .若施肥量3kg 时,预计水稻产量约为________kg..650(kg)=250+5×80=y ^代入回归方程可得其预测值80=x 解析:把 答案:6504.对具有线性相关关系的变量x 和y ,测得一组数据如下表所示.x 2 4 5 6 8y 30 40 60 50 70若已求得它们的回直线的方程为______________________.,5=2+4+5+6+85=x 解析:由题意可知 y50.=30+40+60+50+705=即样本中心为(5,50).,a ^+x 6.5=y ^设回归直线方程为 ,)y ,x (回归直线过样本中心∵ ,7.51=a ^,即a ^+6.5×5=50∴ 17.5+x 6.5=y ^回归直线方程为∴ 17.5+x 6.5=y ^答案:相关关系的判断[典例] (1) ①正方形的边长与面积之间的关系; ②农作物的产量与施肥量之间的关系; ③人的身高与年龄之间的关系;④降雪量与交通事故的发生率之间的关系. (2)某个男孩的年龄与身高的统计数据如下表所示.年龄x (岁)123456身高y (cm)78 87 98 108 115 120①画出散点图;②判断y 与x 是否具有线性相关关系.[解析] (1)在①中,正方形的边长与面积之间的关系是函数关系;在②中,农作物的产量与施肥量之间不具有严格的函数关系,但具有相关关系;在③中,人的身高与年龄之间的关系既不是函数关系,也不是相关关系,因为人的年龄达到一定时期身高就不发生明显变化了,因而它们不具有相关关系;在④中,降雪量与交通事故的发生率之间具有相关关系.答案:②④(2)解:①散点图如图所示.②由图知,所有数据点接近一条直线排列,因此,认为y 与x 具有线性相关关系.两个变量是否相关的两种判断方法(1)根据实际经验:借助积累的经验进行分析判断.(2)利用散点图:通过散点图,观察它们的分布是否存在一定的规律,直观地进行判断.[活学活用]如图所示的两个变量不具有相关关系的是________(填序号).解析:①是确定的函数关系;②中的点大都分布在一条曲线周围;③中的点大都分布在一条直线周围;④中点的分布没有任何规律可言,x ,y 不具有相关关系.答案:①④求回归方程[典例] (1)已知变量x 与y 正相关,且由观测数据算得样本平均数x =3,y =3.5,则由该观测数据算得的线性回归方程可能是( )A.y ^=0.4x +2.3B.y ^=2x -2.4C.y ^=-2x +9.5 D.y ^=-0.3x +4.4(2)一台机器按不同的转速生产出来的某机械零件有一些会有缺点,每小时生产有缺点的零件的多少随机器的运转的速度的变化而变化,下表为抽样试验的结果:转速x (转/秒)16 14 12 8 每小时生产有缺点的零件数y (件)11985①画出散点图;②如果y 对x 有线性相关关系,请画出一条直线近似地表示这种线性关系; ③在实际生产中,若它们的近似方程为y =5170x -67,允许每小时生产的产品中有缺点的零件最多为10件,那么机器的运转速度应控制在什么范围内?[解析] (1)依题意知,相应的回归直线的斜率应为正,排除C 、D.且直线必过点(3,3.5),代入A 、B 得A 正确.答案:A(2)解:①散点图如图所示:②近似直线如图所示:秒/转14,所以机器的运转速度应控制在≤14.9x ,解得≤1067-x 5170得≤10y 由③内.求回归直线方程的步骤.)数据一般由题目给出)(n ,…,1,2=i )(i y ,i x (收集样本数据,设为(1) (2)作出散点图,确定x ,y 具有线性相关关系..i y i x ,2i x ,i y ,i x 把数据制成表格(3).iy i ∑i =1nx ,2i ∑i =1n x ,y ,x 计算(4) ⎩⎪⎨⎪⎧b ^=∑i =1nxiyi -n x y ∑i =1n x2i -n x 2,a ^=y -b ^ x .,公式为a ^,b ^代入公式计算(5).a ^+x b ^=y ^写出回归直线方程(6) [活学活用]已知变量x ,y 有如下对应数据:x 1 2 3 4 y1345(1)作出散点图;(2)用最小二乘法求关于x ,y 的回归直线方程. 解:(1)散点图如图所示.,52=1+2+3+44=x (2) y ,134=1+3+4+54=∑i=14x 39.=20+12+6+1=i y i ∑i =14x 2i ,30=16+9+4+1= b^,1310=39-4×52×13430-4×⎝ ⎛⎭⎪⎫522=a^,0=52×1310-134= .为所求的回归直线方程x 1310=y ^所以 利用线性回归方程对总体进行估计[典例x (吨)与相应的生产能耗y (吨标准煤)的几组对照数据:x 3 4 5 6 y2.5344.5(1)请画出上表数据的散点图;(2)请根据上表提供的数据,求出y 关于x 的回归直线方程y ^=b ^x +a ^;(3)已知该厂技改前100吨甲产品的生产能耗为90吨标准煤.试根据(2)求出的回归直线方程,预测生产100吨甲产品的生产能耗比技改前降低了多少吨标准煤?[解] (1)散点图如图:,3.5=2.5+3+4+4.54=y ,4.5=3+4+5+64=x (2) ∑i=14x ,66.5=6×4.5+5×4+4×3+3×2.5=i y i ∑i=14x 2i ,86=26+25+24+23= ∑i =14xiyi -4xy∑i =14x2i -4x 2=b ^所以 ,0.7=66.5-4×4.5×3.586-4×4.52=a ^0.35.=0.7×4.5-3.5=x b ^-y = 0.35.+x 0.7=y ^所以所求的线性回归方程为 ,)吨标准煤70.35(=0.35+0.7×100=y ^时,100=x 当(3) 90-70.35=19.65(吨标准煤).即生产100吨甲产品的生产能耗比技改前降低了19.65吨标准煤.只有当两个变量之间存在线性相关关系时,才能用回归直线方程对总体进行估计和预测.否则,如果两个变量之间不存在线性相关关系,即使由样本数据求出回归直线方程,用其估计和预测结果也是不可信的.[活学活用](重庆高考)随着我国经济的发展,居民的储蓄存款逐年增长.设某地区城乡居民人民币储蓄存款(年底余额)如下表:年份 2010 2011 2012 2013 2014 时间代号t 1 2 3 4 5 储蓄存款y (千亿元)567810(1)求y 关于t 的回归方程y ^=b ^t +a ^;(2)用所求回归方程预测该地区2015年(t =6)的人民币储蓄存款. 解:(1)列表计算如下:it iy it 2it i y i1 1 5 1 52 2 6 4 123 3 7 9 214 4 8 16 325 5 10 25 50 ∑153655120这里n =5,t -=1n ∑i =1n t i =155=3,y -=1n ∑i =1n y i =365=7.2.又∑i =1nt2i -n t -2=55-5×32=10,i =1n t i y i -n t-y -=120-5×3×7.2=12,从而b ^=1210=1.2,a ^=y --b ^t -=7.2-1.2×3=3.6,故所求回归方程为y ^=1.2t +3.6.(2)将t =6代入回归方程可预测该地区2015年的人民币储蓄存款为y ^=1.2×6+3.6=10.8(千亿元).[层级一 学业水平达标]1.下列变量具有相关关系的是( )A .人的体重与视力B .圆心角的大小与所对的圆弧长C .收入水平与购买能力D .人的年龄与体重解析:选C B 为确定性关系;A ,D 不具有相关关系,故选C.2.已知变量x ,y 之间具有线性相关关系,其散点图如图所示,则其回归方程可能为2+x 1.5=y ^A. 2+x 1.5=-y ^B. 2-x 1.5=y ^C. 2-x 1.5=-y ^D. 之间负相关,回归直线y ,x ,由散点图可知变量a ^+x b ^=y ^设回归方程为 B 解析:选 2.+x 1.5=-y ^,因此方程可能为>0a ^,<0b ^轴上的截距为正数,所以y 在 个样本点,n 的y 和x 是变量)n y ,n x (,…,)2y ,2x (,)1y ,1x (设3.直线l 是由这些样本点通过最小二乘法得到的线性回归直线如图所示,则以下结论正确的是( ))y ,x (过点l .直线A B .回归直线必通过散点图中的多个点C .直线l 的斜率必在(0,1)D .当n 为偶数时,分布在l 两侧的样本点的个数一定相同解析:选A A 是正确的;回归直线可以不经过散点图中的任何点,故B 错误;回归直线的斜率不确定,故C 错误;分布在l 两侧的样本点的个数不一定相同,故D 错误. 4.一项关于16艘轮船的研究中,船的吨位区间为[192,3 246](单位:吨),船员的,x 0.006 2+9.5=y ^的回归方程为x 关于吨位y 人,船员人数32~5人数 (1)若两艘船的吨位相差1 000,求船员平均相差的人数;(2)估计吨位最大的船和最小的船的船员人数.,则2x ,1x 设两艘船的吨位分别为(1)解: y^)2x 6 20.00+(9.5-1x 0.006 2+9.5=2y ^-1 =0.006 2×1 000≈6, 即船员平均相差6人.,0.006 2×192≈11+9.5=y ^时,192=x 当(2) 0.006 2×3 246≈30.+9.5=y ^时,3 246=x 当 即估计吨位最大和最小的船的船员数分别为30人和11人.[层级二 应试能力达标]1.一个口袋中有大小不等的红、黄、蓝三种颜色的小球若干个(大于5个),从中取5次,那么取出红球的次数和口袋中红球的数量是( ) A .确定性关系 B .相关关系 C .函数关系D .无任何关系 解析:选 B 每次从袋中取球取出的球是不是红球,除了和红球的个数有关外,还与球的大小等有关系,所以取出红球的次数和口袋中红球的数量是一种相关关系.,下x 80+50=y ^变化的回归直线方程为)千元(x 依劳动生产率)元(y .农民工月工资2列判断正确的是( )A .劳动生产率为1 000元时,工资为130元B .劳动生产率提高1 000元时,工资水平提高80元C .劳动生产率提高1 000元时,工资水平提高130元D .当月工资为210元时,劳动生产率为2 000元的单x ,但要注意80增加y ,1每增加x 知,x 80+50=y ^由回归直线方程 B 解析:选位是千元,y 的单位是元.3.为了解儿子身高与其父亲身高的关系,随机抽取5对父子身高数据如下:则y 对x 的线性回归方程为( )A .y =x -1B .y =x +1x 12+88=y .C176=y .D =y ,176=174+176+176+176+1785=x 计算得, C 解析:选符合.C 检验知,)y ,x (,根据回归直线经过样本中心176=175+175+176+177+17754.已知x 与y 之间的几组数据如下表:,若某同学根据上表中的前两组a ^+x b ^=y ^假设根据上表数据所得线性回归直线方程为数据(1,0)和(2,2)求得的直线方程为y =b ′x +a ′,则以下结论正确的是( )′a <a ^,′b >y ^′ B.a >a ^,′b >b ^A. ′a <a ^,′b <y ^′ D.a >a ^,′b <b ^C. 解析:选C 由(1,0),(2,2)求b ′,a ′.2.=-2×1-0=′a ,2=2-02-1=′b ,58=24+15+12+3+4+0=i y i ∑i =16x 时,a ^,b ^求 x ,136=y ,3.5= ∑i=16x 2i ,91=36+25+16+9+4+1= ,57=58-6×3.5×13691-6×3.52=b ^∴ a^,13=-52-136=×3.557-136= ′.a >a ^,′b <b ^∴ =y ^的回归方程为(cm)x 对身高(kg)y 岁的人,体重38岁到18.正常情况下,年龄在50.72x -58.2,张红同学(20岁)身高为178 cm ,她的体重应该在________ kg 左右. =y ^时,178=x 的人的体重进行预测,当178 cm 解析:用回归方程对身高为0.72×178-58.2=69.96(kg).答案:69.966.某工厂为了对新研发的一种产品进行合理定价,将该产品按事先拟定的价格进行试销,得到如下数据:________.=a ,则a +x 4=-y 由表中数据,求得线性回归方程为 ,132=4+5+6+7+8+96=x 解析: y,80=92+82+80+80+78+686=)y ,x (由回归方程过样本中心点 .a ^+1324×=-80得 106.=1324×+80=a ^即 答案:1067.对某台机器购置后的运行年限x (x =1,2,3,…)与当年利润y 的统计分析知x ,y ,估计该台机器最为划算的使用年限为x 1.3-10.47=y ^具备线性相关关系,回归方程为________年.解析:当年利润小于或等于零时应该报废该机器,当y =0时,令10.47-1.3x =0,解得x ≈8,故估计该台机器最为划算的使用年限为8年.答案:88.某个体服装店经营某种服装在某周内所获纯利y (元)与该周每天销售这种服装的件数x (件)之间有一组数据如下表:;y ,x 求(1) (2)若纯利y 与每天销售这种服装的件数x 之间是线性相关的,求回归直线方程; (3)若该店每周至少要获纯利200元,请你预测该店每天至少要销售这种服装多少件?3 487)=i y i ∑i =17x ,45 309=2i ∑i =17y ,280=2i ∑i =17x 提示:( ,6=3+4+5+6+7+8+97=x (1)解: y≈79.86.66+69+73+81+89+90+917= ,≈4.753 487-7×6×79.86280-7×62=b ^∵(2) a^,51.36=4.75×6-79.86= .x 4.75+51.36=y ^之间的回归直线方程为x 纯利与每天销售件数∴ ≈31.29.x ,所以651.3+x 4.75=200时,200=y ^当(3) 因此若该店每周至少要获纯利200元,则该店每天至少要销售这种服装32件.9.2016年元旦前夕,某市统计局统计了该市2015年10户家庭的年收入和年饮食支出的统计资料如下表:年收入x (万元)2 4 4 6 6 6 7 7 8 10年饮食 支出y(万元)0.9 1.4 1.6 2.0 2.1 1.9 1.8 2.1 2.2 2.3(2)若某家庭年收入为9万元,预测其年饮食支出.406)=2i ∑i =110x ,117.7=i y i ∑i =110x 参考数据:( 解:依题意可计算得:x,10.98=y x ,36=2x ,1.83=y ,6= ,406=2i ∑i =110x ,117.7=i y i ∑i =110x ∵又,≈0.17∑i=110xiyi -10x y ∑i =110x2i -10x 2=b ^∴ a^0.81.+x 0.17=y ^∴,0.81=x b ^-y = 1.0.8+x 0.17=y ^所求的回归方程为∴ .)万元2.34(=0.81+0.17×9=y ^时,9=x 当(2) 可估计年收入为9万元的家庭每年饮食支出约为2.34万元.(时间120分钟,满分150分)一、选择题(本大题共12小题,每小题5分,共60分.在每小题给出的四个选项中,只有一项是符合题目要求的)1.下列三个抽样:①一个城市有210家某商品的代理商,其中大型代理商有20家,中型代理商有40家,小型代理商有150家,为了掌握该商品的销售情况,要从中抽取一个容量为21的样本;②在某公司的50名工人中,依次抽取工号为5,10,15,20,25,30,35,40,45,50的10名工人进行健康检查;③某市质量检查人员从一食品生产企业生产的两箱(每箱12盒)牛奶中抽取4盒进行质量检查.则应采用的抽样方法依次为( )A .简单随机抽样;分层抽样;系统抽样B .分层抽样;简单随机抽样;系统抽样C .分层抽样;系统抽样;简单随机抽样D .系统抽样;分层抽样;简单随机抽样解析:选 C ①中商店的规模不同,所以应利用分层抽样;②中抽取的学号具有等距性,所以应是系统抽样;③中总体没有差异性,容量较小,样本容量也较小,所以应采用简单随机抽样.故选C.2.将某班的60名学生编号为01,02,…,60,采用系统抽样方法抽取一个容量为5的样本,且随机抽得的一个号码为04,则剩下的四个号码依次是( )A .09,14,19,24B .16,28,40,52C .10,16,22,28D .08,12,16,20 解析:选B 分成5组,每组12名学生,按等间距12抽取.选项B 正确.3.某学校有教师200人,男学生1 200人,女学生1 000人.现用分层抽样的方法从全体师生中抽取一个容量为n 的样本,若女学生一共抽取了80人,则n 的值为( )A .193B .192C .191D .190 192.=n ,求得80=n200+1 200+1 0001 000× B 解析:选 4.某商品销售量y (件)与销售价格x (元/件)负相关,则其回归方程可能是( )200+x 10=y ^200 B.+x 10=-y ^A. 200-x 10=y ^200 D.-x 10=-y ^C. 解析:选A 由于销售量y 与销售价格x 成负相关,故排除B ,D.又因为销售价格x >0,则C 中销售量全小于0,不符合题意,故选A.,则y 和x ,它们的平均数分别是n y ,…,2y ,1y 与n x ,…,2x ,1x .设有两组数据5)(的平均数是1+n y 3-n x 2,…,1+2y 3-2x 1,2+1y 3-1x 2新的一组数据 y 3-x 2.A 1+y 3-x 2.By 9-x 4.C1+y 9-x 4.D ,)n ,…,1,2=i 1(+i y 3-i x 2=i z 设 B 解析:选 =⎝ ⎛⎭⎪⎫1+1+…+1n +)n y +…+2y +1y (3n -)n x +…+2x +1x (2n =)n z +…+2z +1z (1n =z 则 1.+y 3-x 2 6.有一个容量为66的样本,数据的分组及各组的频数如下:[11.5,15.5) 2 [15.5,19.5) 4 [19.5,23.5) 9 [23.5,27.5) 18 [27.5,31.5) 11 [31.5,35.5) 12[35.5,39.5) 7 [39.5,43.5) 3则总体中大于或等于31.5的数据所占比例约为( )211A.13B. 12C.23D. 解析:选B 由题意知,样本的容量为66,而落在[31.5,43.5)内的样本个数为12+7.13=2266的数据约占31.5,故总体中大于或等于22=3+ 7.某学习小组在一次数学测验中,得100分的有1人,得95分的有1人,得90分的有2人,得85分的有4人,得80分和75分的各有1人,则该小组数学成绩的平均数、众数、中位数分别是( )A .85,85,85B .87,85,86C .87,85,85D .87,85,90 解析:选C ∵得85分的人数最多为4人,∴众数为85,中位数为85,87.=75)+80+85×4+90×2+95+(100110平均数为 8.某出租汽车公司为了了解本公司司机的交通违章情况,随机调查了50名司机,得到了他们某月交通违章次数的数据,结果制成了如图所示的统计图,根据此统计图可得这50名出租车司机该月平均违章的次数为( )A .1B .1.8C .2.4D .3 1.8.=5×0+20×1+10×2+10×3+5×450B 解析:选 9.下表是某厂1~4月份用水量情况(单位:百吨)的一组数据月份x 1 2 3 4用水量y 4.5 4 3 2.5的a ,则a +x 0.7=-y 之间具有线性相关关系,其线性回归方程为x 与月份y 用水量值为( )A .5.25B .5C .2.5D .3.5 解析:选A 线性回归方程经过样本的中心点,根据数据可得样本中心点为(2.5,3.5),所以a =5.25.10.如图是在元旦晚会举办的挑战主持人大赛上,七位评委为某选手打出的分数的茎叶统计图,去掉一个最高分和一个最低分后,所剩数据的平均数和方差分别为( )A .84,4.84B .84,1.6C .85,1.2D .85,4 +5+6+3+(515+80,平均数为77,去掉一个最低分95去掉一个最高分 C 解析:选,因此1.2=]286)-(85+285)-(85+286)-(85+283)-(85+285)-[(8515,方差为85=6)选C.,…,2+2x 2,3+1x 3,则2s ,方差是x 的平均数是n x ,…,3x ,2x ,1x .如果数据11)(的平均数和方差分别是2+n x 32s 和x A.2s 9和x 3.B2s 9和2+x 3.C4+2s 12和2+x 3.D nx …,2x ,1x ,由于数据2+x 3的平均数是2+n x 3,…,2+2x 2,3+1x 3 C 解析:选.2s 9的方差为2+n x 3,…,2+2x 2,3+1x 3,所以2s 的方差为 12.如图是某赛季甲、乙两名篮球运动员5场比赛得分的茎叶图,已知甲的成绩的极差为31,乙的成绩的平均值为24,则下列结论错误的是( ) A .x =9 B .y =8C .乙的成绩的中位数为26D .乙的成绩的方差小于甲的成绩的方差解析:选B 因为甲的成绩的极差为31,所以其最高成绩为39,所以x =9;因为乙的成绩的平均值为24,所以y =24×5-(12+25+26+31)-20=6;由茎叶图知乙的成绩的中位数为26;对比甲、乙的成绩分布发现,乙的成绩比较集中,故其方差较小. 二、填空题(本大题共4小题,每小题5分,共20分,把答案填在题中横线上) 13.某人5次上班途中所花的时间(单位:分钟)分别为x ,y,10,11,9.已知这组数据的平均数为10,方差为2,则|x -y |的值为________.∴,2;又方差为20=y +x ,则10=159)×+11+10+y +x (,得10解析:由平均数为=xy 208,2=2y +2x ,得2=15]×210)-(9+210)-(11+210)-(10+210)-y (+210)-x [( 4.=x2+y2-2xy =x -y 2=|y -x |∴,192 答案:414.一支田径队有男运动员48人,女运动员36人,若用分层抽样的方法从该队的全体运动员中抽取一个容量为21的样本,则抽取男运动员的人数为________.12.=×482148+36解析:抽取的男运动员的人数为 答案:1215.要考察某种品牌的500颗种子的发芽率,抽取60粒进行实验,利用随机数表抽取种子时,先将500颗种子按001,002,…,500进行编号,如果从随机数表第7行第8列的数3开始向右读,请你依次写出最先检测的5颗种子的编号:________,________,________,________,________.(下面摘取了随机数表第7行至第9行)59408 66368 36016 26247 25965 49487 26968 86021 77681 83458 21540 62651 69424 78197 20643 67297 76413 66306 51671 54964 87683 30372 39469 97434解析:以3开始向右读,每次读取三位,重复和不在范围内的不读,依次为368,360,162,494,021.答案:368,360,162,494,02116.从某小学随机抽取100名同学,将他们的身高(单位:cm)数据绘制成频率分布直方图(如下图).由图中数据可知a =________.若要从身高在[120,130),[130,140),[140,150]三组的学生中,用分层抽样的方法选取18人参加一项活动,则从身高在[140,150]的学生中选取的人数应为________.解析:∵0.005×10+0.035×10+a ×10+0.020×10+0.010×10=1,∴a =0.030.设身高在[120,130),[130,140),[140,150]三组的学生分别有x ,y ,z 人,10.=z ,20=y 同理,30.=x ,解得0.030×10=x100则3.=×181030+20+10的学生中选取的人数为[140,150]故从 答案:0.030 3三、解答题(本大题共6小题,共70分.解答应写出文字说明,证明过程或演算步骤) ,应如何110名学生中抽取50为调查某班学生的平均身高,从)分10本小题满分(.17抽样?若知道男生、女生的身高显著不同(男生30人,女生20人),应如何抽样? 抽签法或随机数(人,采用简单随机抽样法5,即抽取110名学生中抽取50解:从法).若知道男生、女生的身高显著不同,则采用分层抽样法,按照男生与女生的人数比为30∶20=3∶2进行抽样,则男生抽取3人,女生抽取2人.18.(本小题满分12分)某车间共有12名工人,随机抽取6名,他们某日加工零件个数的茎叶图如图所示. (1)根据茎叶图计算样本均值;(2)日加工零件个数大于样本均值的工人为优秀工人.根据茎叶图推断该车间12名工人中有几名优秀工人?22.=1326=17+19+20+21+25+306样本均值为1)(解: 4=1312×名工人中有12,故推断该车间13=26知样本中优秀工人所占比例为(1)由(2)名优秀工人.19.(本小题满分12分)2016年春节前,有超过20万名广西、四川等省籍的外出务工人员选择驾乘摩托车沿321国道长途跋涉返乡过年,为防止摩托车驾驶人员因长途疲劳驾驶,手脚僵硬影响驾驶操作而引发交通事故,肇庆市公安交警部门在321国道沿线设立了多个长途行驶摩托车驾乘人员休息站,让返乡过年的摩托车驾乘人员有一个停车休息的场所.交警小李在某休息站连续5天对进站休息的驾驶人员每隔50辆摩托车就进行一次省籍询问,询问结果如图所示:(1)交警小李对进站休息的驾驶人员的省籍询问采用的是什么抽样方法?(2)用分层抽样的方法对被询问了省籍的驾驶人员进行抽样,若广西籍的有5人,则四川籍的应抽取几人?解:(1)交警小李对进站休息的驾驶人员的省籍询问采用的是系统抽样法.(2)从题图可知,被询问了省籍的驾驶人员广西籍的有5+20+25+20+30=100(人);四川籍的有15+10+5+5+5=40(人).2,即四川籍的应抽取2=x ,解得x40=5100人,依题意得x 设四川籍的驾驶人员应抽取人.20.(本小题满分12分)某化肥厂有甲、乙两个车间包装肥料,在自动包装传送带上每隔30分钟抽取一包产品,称其重量(单位:kg),分别记录抽查数据如下:甲:102,101,99,98,103,98,99; 乙:110,115,90,85,75,115,110.(1)这种抽样方法是哪一种方法?(2)试计算甲、乙车间产品重量的平均数与方差,并说明哪个车间产品较稳定?解:(1)甲、乙两组数据间隔相同,所以采用的方法是系统抽样.,100=99)+98+103+98+99+101+(10217=甲x (2) x,100=110)+115+75+85+90+115+(11017=乙 ,1)≈3.43+4+9+4+1+1+(417=2甲s ,228.57=100)+225+625+225+100+225+(10017=2乙s ,故甲车间产品比较稳定.2乙s <2甲s ∴ 21.(本小题满分12分)对某校高一年级学生参加社区服务次数进行统计,随机抽取M 名学生作为样本,得到这M 名学生参加社区服务的次数.根据此数据作出了频数与频率的统计表和频率分布直方图如下:分组频数 频率[10,15) 10 0.25[15,20) 25n [20,25) mp[25,30] 20.05 合计M1(1)求出表中M ,p 及图中a 的值;(2)若该校高一学生有360人,试估计该校高一学生参加社区服务的次数在区间[10,15)的人数.解:(1)由分组[10,15)的频数是10, 40.=M ,所以0.25=10M知,0.25频率是 因为频数之和为40,所以10+25+m +2=40,解得m =3.0.075.=340=p 故 因为a 是对应分组[15,20)的频率与组距的商,125.0.=2540×5=a 所以 (2)因为该校高一学生有360人,分组[10,15)的频率是0.25,所以估计该校高一学生参加社区服务的次数在此区间内的人数为360×0.25=90.22.(本小题满分12分)从某居民区随机抽取10个家庭,获得第i 个家庭的月收入iy i ∑i =110x ,20=i ∑i =110y ,80=i ∑i =110x 的数据资料,算得)单位:千元(i y 与月储蓄)单位:千元(i x 720.=2i ∑i =110x ,184= ;a ^+xb ^=y ^的线性回归方程x 对月收入y 求家庭的月储蓄(1) (2)判断变量x 与y 之间是正相关还是负相关;(3)若该居民区某家庭月收入为7千元,预测该家庭的月储蓄.,8=8010=i ∑i =1n x 1n =x ,10=n 由题意知(1)解: y ,2=2010=i ∑i =1n y 1n = ,80=210×8-720=2x 10-2i ∑i =110x 又 ∑i=110x ,24=10×8×2-184=y x 10-i y i ,0.3=2480=∑i =110xiyi -10x y∑i =110x2i -10x 2=b ^由此得 a^,0.4=-0.3×8-2=x b ^-y = 0.4.-x 0.3=y ^故所求回归方程为 (2)由于变量y 的值随x 的值增加而增加(b =0.3>0),故x 与y 之间是正相关.(3)将x =7代入回归方程可以预测该家庭的月储蓄为y =0.3×7-0.4=1.7千元.。
变量间的相关关系教案
变量间的相关关系教案一、教学目标1. 让学生理解变量间的相关关系的概念。
2. 让学生掌握如何判断两个变量之间的相关关系。
3. 让学生学会如何绘制相关系数图。
4. 让学生能够运用相关关系解决实际问题。
二、教学内容1. 变量间的相关关系定义。
2. 相关关系的判断方法。
3. 相关系数图的绘制。
4. 实际问题中的应用。
三、教学重点与难点1. 教学重点:变量间的相关关系概念,判断方法,相关系数图的绘制。
2. 教学难点:相关系数图的绘制,实际问题中的应用。
四、教学方法1. 讲授法:讲解变量间的相关关系定义、判断方法和绘制相关系数图的步骤。
2. 案例分析法:分析实际问题,让学生学会运用相关关系解决问题。
3. 互动教学法:引导学生提问、讨论,提高学生的参与度。
五、教学过程1. 导入:通过一个实例引入变量间的相关关系概念。
2. 讲解:讲解变量间的相关关系定义、判断方法,并进行相关系数图的绘制演示。
3. 案例分析:分析实际问题,让学生学会运用相关关系解决问题。
4. 练习:让学生独立完成相关系数图的绘制,并分析实际问题。
6. 作业布置:布置相关练习题,巩固所学知识。
六、教学评价1. 评价方式:采用课堂表现、练习完成情况和课后作业三种方式进行评价。
2. 评价内容:(1)课堂表现:观察学生在课堂上的参与程度、提问和回答问题的情况。
(2)练习完成情况:检查学生练习题的完成质量,包括相关系数图的绘制和实际问题的分析。
(3)课后作业:评估学生作业的完成情况,巩固所学知识。
七、教学反思1. 反思内容:(1)教学内容:回顾本节课的教学内容,确认是否全面覆盖了变量间的相关关系概念、判断方法和实际应用。
(3)课堂互动:评估学生的参与程度,思考如何提高学生的积极性和主动性。
(4)作业布置:检查作业的难度和量,确保学生能够通过作业巩固所学知识。
八、拓展与延伸1. 相关研究:介绍变量间相关关系在学术研究中的应用,如心理学、经济学等领域。
2. 实际案例:分析更多实际问题,让学生了解相关关系在生活中的重要作用。
高三数学人教版A版数学(理)高考一轮复习教案变量间的相关关系、统计案例1
第四节 变量间的相关关系、统计案例变量间的相关关系、统计案例 1.变量间的相关关系(1)会作两个有关联变量的数据的散点图,会利用数点图认识变量间的相关关系. (2)了解最小二乘法的思想,能根据给出的线性回归方程系数公式建立线性回归方程. 2.统计案例了解下列一些常见的统计方法,并能应用这些方法解决一些实际问题. (1)独立性检验了解独立性检验(只要求2×2列联表)的基本思想、方法及其简单应用. (2)回归分析了解回归分析的基本思想、方法及其简单应用. 知识点一 回归分析 1.变量间的相关关系(1)常见的两变量之间的关系有两类:一类是函数关系,另一类是相关关系;与函数关系不同,相关关系是一种非确定性关系.(2)从散点图上看,点分布在从左下角到右上角的区域内,两个变量的这种相关关系称为正相关,点分布在左上角到右下角的区域内,两个变量的相关关系为负相关.2.两个变量的线性相关(1)从散点图上看,如果这些点从整体上看大致分布在通过散点图中心的一条直线附近,称两个变量之间具有线性相关关系,这条直线叫回归直线.(2)回归方程为y ^=b ^x +a ^,其中b ^=∑ni =1x i y i -n x y∑ni =1x 2i -n x 2,a ^=y -b ^x . (3)通过求Q =∑ni =1(y i -bx i -a )2的最小值而得出回归直线的方法,即求回归直线,使得样本数据的点到它的距离的平方和最小,这一方法叫作最小二乘法.(4)相关系数:当r >0时,表明两个变量正相关; 当r <0时,表明两个变量负相关.r 的绝对值越接近于1,表明两个变量的线性相关性越强.r 的绝对值越接近于0时,表明两个变量之间几乎不存在线性相关关系.通常|r |大于0.75时,认为两个变量有很强的线性相关性.易误提醒1.易混淆相关关系与函数关系,两者的区别是函数关系是一种确定的关系,而相关关系是一种非确定的关系,函数关系是一种因果关系,而相关关系不一定是因果关系,也可能是伴随关系.2.回归分析中易误认为样本数据必在回归直线上,实质上回归直线必过(x ,y )点,可能所有的样本数据点都不在直线上 .3.利用回归方程分析问题时,所得的数据易误认为准确值,而实质上是预测值(期望值).[自测练习]1.已知x ,y 的取值如下表,从散点图可以看出y 与x 线性相关,且回归方程为y ^=0.95x +a ^,则a ^=( )x 0 1 3 4 y2.24.3 4.86.7A.3.25 B .2.6 C .2.2D .0解析:∵回归直线必过样本点的中心(x ,y ),又x =2,y =4.5,代入回归方程,得a ^=2.6.答案:B2.(2016·镇江模拟)如图所示,有A ,B ,C ,D ,E 5组(x ,y )数据,去掉________组数据后,剩下的4组数据具有较强的线性相关关系.解析:由散点图知呈带状区域时有较强的线性相关关系,故去掉D . 答案:D知识点二 独立性检验 独立性检验假设有两个分类变量X 和Y ,它们的取值分别为{x 1,x 2}和{y 1,y 2},其样本频数列联表(称为2×2列联表)为:y1y2总计x1 a b a+bx2 c d c+d总计a+c b+d a+b+c+dK2=n(ad-bc)2(a+b)(a+c)(b+d)(c+d)(其中n=a+b+c+d为样本容量).易误提醒(1)独立性检验是对两个变量有关系的可信程度的判断,而不是对其是否有关系的判断.(2)独立性检验得出的结论是带有概率性质的,只能说结论成立的概率有多大,而不能完全肯定一个结论,因此才出现了临界值表.在分析问题时一定要注意这点,不可对某个问题下确定性结论,否则就可能对统计计算的结果做出错误的解释.[自测练习]3.下面是2×2列联表:y1y2总计x1 a 2173x2222547总计 b 46120则表中a,b的值分别为()A.94,72B.52,50C.52,74 D.74,52解析:∵a+21=73,∴a=52,又a+22=b,∴b=74.答案:C考点一相关关系的判断|1.对四组数据进行统计,获得如图所示的散点图,关于其相关系数的比较,正确的是()A.r2<r4<0<r3<r1B.r4<r2<0<r1<r3C.r4<r2<0<r3<r1D.r2<r4<0<r1<r3解析:易知题中图(1)与图(3)是正相关,图(2)与图(4)是负相关,且图(1)与图(2)中的样本点集中分布在一条直线附近,则r2<r4<0<r3<r1.答案:A2.(2015·高考湖北卷)已知变量x和y满足关系y=-0.1x+1,变量y与z正相关.下列结论中正确的是()A.x与y正相关,x与z负相关B.x与y正相关,x与z正相关C.x与y负相关,x与z负相关D.x与y负相关,x与z正相关解析:因为y=-0.1x+1,x的系数为负,故x与y负相关;而y与z正相关,故x与z 负相关.答案:C相关关系的判断的两种方法(1)散点图法.(2)相关系数法:利用相关系数判定,当|r|越趋近于1相关性越强.考点二回归分析|(2015·高考全国卷Ⅰ)某公司为确定下一年度投入某种产品的宣传费,需了解年宣传费x(单位:千元)对年销售量y(单位:t)和年利润z(单位:千元)的影响.对近8年的年宣传费x i和年销售量y i(i=1,2,…,8)数据作了初步处理,得到下面的散点图及一些统计量的值.xyw∑8i =1(x i -x)2∑8i =1(w i -w)2∑8i =1(x i -x )(y i-y )∑8i =1(w i -w )(y i -y ) 46.6 563 6.8 289.8 1.6 1 469108.8表中w i =x i ,w =18∑i =1w i.(1)根据散点图判断,y =a +bx 与y =c +d x 哪一个适宜作为年销售量y 关于年宣传费x 的回归方程类型?(给出判断即可,不必说明理由)(2)根据(1)的判断结果及表中数据,建立y 关于x 的回归方程;(3)已知这种产品的年利润z 与x ,y 的关系为z =0.2y -x .根据(2)的结果回答下列问题: ①年宣传费x =49时,年销售量及年利润的预报值是多少? ②年宣传费x 为何值时,年利润的预报值最大?附:对于一组数据(u 1,v 1),(u 2,v 2),…,(u n ,v n ),其回归直线v =α+βu 的斜率和截距的最小二乘估计分别为β^=∑ni =1 (u i -u )(v i -v )∑ni =1(u i -u )2,α^=v -β^ u . [解] (1)由散点图可以判断,y =c +d x 适宜作为年销售量y 关于年宣传费x 的回归方程类型.(2)令w =x ,先建立y 关于w 的线性回归方程.由于 d ^=∑8i =1(w i -w )(y i -y )∑8i =1 (w i -w )2=108.81.6=68, c ^=y -d ^w =563-68×6.8=100.6,所以y 关于w 的线性回归方程为y ^=100.6+68w ,因此y 关于x 的回归方程为y ^=100.6+68x .(3)①由(2)知,当x =49时,年销售量y 的预报值 y ^=100.6+6849=576.6, 年利润z 的预报值 z ^=576.6×0.2-49=66.32.②根据(2)的结果知,年利润z 的预报值 z ^=0.2(100.6+68x )-x =-x +13.6x +20.12. 所以当x =13.62=6.8,即x =46.24时,z ^取得最大值.故年宣传费为46.24千元时,年利润的预报值最大.回归直线方程的求法(1)利用公式,求出回归系数b ^,a ^.(2)待定系数法:利用回归直线过样本点中心求系数.1.(2016·银川一中模拟)下表提供了某厂节能降耗技术改造后生产甲产品过程中记录的产量x (吨)与相应的生产能耗y (吨标准煤)的几组对照数据.x 3 4 5 6 y2.5344.5(1)请根据上表提供的数据,用最小二乘法求出y 关于x 的线性回归方程y ^=b ^x +a ^. (2)已知该厂技改前,100吨甲产品的生产能耗为90吨标准煤,试根据(1)求出的线性回归方程,预测生产100吨甲产品的生产能耗比技改前降低了多少吨标准煤?(参考数值:3×2.5+4×3+5×4+6×4.5=66.5)解:(1)由对照数据,计算得∑4i =1x 1y 1=66.5,∑4i =1x 21=32+42+52+62=86,x =4.5,y =3.5,b ^=66.5-4×4.5×3.586-4×4.52=66.5-6386-81=0.7,a ^=y -b ^x =3.5-0.7×4.5=0.35,所求的回归方程为y ^=0.7x +0.35.(2)x =100,y ^=100×0.7+0.35=70.35,预测生产100吨甲产品的生产能耗比技改前降低90-70.35=19.65(吨标准煤).考点三 独立性检验|(2016·邯郸模拟)为了解少年儿童的肥胖是否与常喝碳酸饮料有关,现对30名六年级学生进行了问卷调查得到如下列联表.平均每天喝500 mL 以上为常喝,体重超过50 kg 为肥胖.常喝 不常喝 合计 肥胖 2 不肥胖 18 合计30已知在全部30人中随机抽取1人,抽到肥胖的学生的概率为415.(1)请将上面的列联表补充完整.(2)是否有99.5%的把握认为肥胖与常喝碳酸饮料有关?说明你的理由.(3)设常喝碳酸饮料且肥胖的学生中有2名女生,现从常喝碳酸饮料且肥胖的学生中抽取2人参加电视节目,则正好抽到一男一女的概率是多少?参考数据:K 2≥k 0 0.15 0.10 0.05 0.025 0.010 0.005 0.001 k 02.0722.7063.8415.0246.6357.87910.828参考公式:K 2=n (ad -bc )(a +b )(c +d )(a +c )(b +d ),其中n =a +b +c +d .[解] (1)设常喝碳酸饮料肥胖的学生有x 人,x +230=415,解得x =6.常喝 不常喝 合计 肥胖 6 2 8 不肥胖 4 18 22 合计102030(2)由已知数据可求得K 2=30×(6×18-2×4)210×20×8×22≈8.523>7.879.因此有99.5%的把握认为肥胖与常喝碳酸饮料有关.(3)设常喝碳酸饮料的肥胖男生为A ,B ,C ,D ,女生为E ,F ,任取两人的取法有AB ,AC ,AD ,AE ,AF ,BC ,BD ,BE ,BF ,CD ,CE ,CF ,DE ,DF ,EF ,共15种.其中一男一女的取法有AE ,AF ,BE ,BF ,CE ,CF ,DE ,DF ,共8种.故抽出一男一女的概率是P =815.解独立性检验的应用问题的关注点(1)两个明确: ①明确两类主体; ②明确研究的两个问题. (2)两个关键:①准确画出2×2列联表; ②准确理解K 2.提醒:准确计算K 2的值是正确判断的前提.2.通过随机询问110名性别不同的行人,对过马路是愿意走斑马线还是愿意走人行天桥进行抽样调查,得到如下的列联表:男 女 总计 走天桥 40 20 60 走斑马线 20 30 50 总计6050110K 2=n (ad -bc )2(a +b )(c +d )(a +c )(b +d ),n =a +b +c +d .附表:P (K 2≥k 0)0.050 0.010 0.001 k 03.8416.63510.828A .有99%以上的把握认为“选择过马路的方式与性别有关”B .有99%以上的把握认为“选择过马路的方式与性别无关”C .在犯错误的概率不超过0.1%的前提下,认为“选择过马路的方式与性别有关”D .在犯错误的概率不超过0.1%的前提下,认为“选择过马路的方式与性别无关” 解析:K 2=110×(40×30-20×20)260×50×60×50≈7.8.P (K 2≥6.635)=0.01=1-99%,∴有99%以上的把握认为“选择过马路的方式与性别有关”,故选A.答案:A12.独立性检验与概率交汇综合问题的答题模板【典例】(12分)(2016·保定调研)某高校为调查学生喜欢“应用统计”课程是否与性别有关,随机抽取了选修课程的55名学生,得到数据如下表:(1)判断是否有(2)用分层抽样的方法从喜欢统计课程的学生中抽取6名学生做进一步调查,将这6名学生作为一个样本,从中任选2人,求恰有1个男生和1个女生的概率.下面的临界值表供参考:(参考公式:K2=n(ad-bc)(a+b)(c+d)(a+c)(b+d),其中n=a+b+c+d)[规范解答](1)由公式K2=55×(20×20-10×5)230×25×25×30≈11.978>7.879,(3分) 所以有99.5%的把握认为喜欢“应用统计”课程与性别有关.(6分)(2)设所抽样本中有m个男生,则630=m20,得m=4,所以样本中有4个男生,2个女生,分别记作B1,B2,B3,B4,G1,G2.从中任选2人的基本事件有(B1,B2),(B1,B3),(B1,B4),(B1,G1),(B1,G2),(B2,B3),(B2,B4),(B2,G1),(B2,G2),(B3,B4),(B3,G1),(B3,G2),(B4,G1),(B4,G2),(G1,G2),共15个,(9分)其中恰有1个男生和1个女生的事件有(B1,G1),(B1,G2),(B2,G1),(B2,G2),(B3,G1),(B3,G2),(B4,G1),(B4,G2),共8个.(11分)所以恰有1个男生和1个女生的概率为815.(12分)[模板形成]分析2×2列联表数据↓利用K 2公式计算K 2值↓对分类变量的相关性作出判断↓求相应事件的概率↓反思解题过程,注意规范化[跟踪练习] 某班主任对全班50名学生学习积极性和参加社团活动情况进行调查,统计数据见下表所示:(1)加社团活动且学习积极性一般的学生的概率是多少?(2)运用独立性检验的思想方法分析:学生的学习积极性与参加社团活动情况是否有关系?并说明理由.附:K 2=n (ad -bc )2(a +b )(c +d )(a +c )(b +d );其中n =a +b +c +d .解:(1)随机从该班抽查一名学生,抽到参加社团活动的学生的概率是2250=1125;抽到不参加社团活动且学习积极性一般的学生的概率是2050=25.(2)因为K 2=n (ad -bc )2(a +b )(c +d )(a +c )(b +d )=50×(17×20-5×8)225×25×22×28≈11.688>10.828,所以大约有99.9%的把握认为学生的学习积极性与参加社团活动情况有关系.A 组 考点能力演练1.根据如下样本数据得到的回归方程为y ^=b ^x +a ^,则( )A.a ^>0,b ^>0 B.a >0,b <0 C.a ^<0,b ^>0D.a ^<0,b ^<0解析:把样本数据中的x ,y 分别当作点的横、纵坐标,在平面直角坐标系xOy 中作出散点图(图略),由图可知b ^<0,a ^>0.故选B.答案:B2.已知变量x 与y 正相关,且由观测数据算得样本平均数x =3,y =3.5,则由该观测数据算得的线性回归方程可能为( )A.y ^=0.4x +2.3 B.y ^=2x -2.4 C.y ^=-2x +9.5D.y^=-0.3x +4.4解析:依题意知,相应的回归直线的斜率应为正,排除C ,D.且直线必过点(3,3.5),代入A ,B 得A 正确.答案:A3.春节期间,“厉行节约,反对浪费”之风悄然吹开,某市通过随机询问100名性别不同的居民是否能做到“光盘”行动,得到如下的列联表:附表及公式K 2=n (ad -bc )(a +b )(c +d )(a +c )(b +d ),其中n =a +b +c +d .则下面的正确结论是( )A .有90%以上的把握认为“该市居民能否做到‘光盘’与性别有关”B .在犯错误的概率不超过1%的前提下,认为“该市居民能否做到‘光盘’与性别无关”C .在犯错误的概率不超过1%的前提下,认为“该市居民能否做到‘光盘’与性别有关”D .有90%以上的把握认为“该市居民能否做到‘光盘’与性别无关”解析:由2×2列联表得到a =45,b =10,c =30,d =15,则a +b =55,c +d =45,a +c =75,b +d =25,ad =675,bc =300,n =100,计算得K 2的观测值k 0=100×(675-300)255×45×75×25≈3.030.因为2.706<3.030<3.841,所以有90%以上的把握认为“该市居民能否做到‘光盘’与性别有关”,故选A.答案:A4.根据如下样本数据:得到的回归方程为y =b x +a .若样本点的中心为(5,0.9),则当x 每增加1个单位时,y 就( )A .增加1.4个单位B .减少1.4个单位C .增加7.9个单位D .减少7.9个单位解析:依题意得,a +b -25=0.9,故a ^+b ^=6.5①;又样本点的中心为(5,0.9),故0.9=5b ^+a ^②,联立①②,解得b ^=-1.4,a ^=7.9,则y ^=-1.4x +7.9,可知当x 每增加1个单位时,y 就减少1.4个单位,故选B.答案:B5.已知x 与y 之间的几组数据如下表:假设根据上表数据所得线性回归直线方程为y =b x +a ,若某同学根据上表中的前两组数据(1,0)和(2,2)求得的直线方程为y =b ′x +a ′,则以下结论正确的是( )A.b ^>b ′,a ^>a ′ B.b ^>b ′,a ^<a ′ C.b ^<b ′,a ^>a ′D.b ^<b ′,a ^<a ′解析:由两组数据(1,0)和(2,2)可求得直线方程为y =2x -2,b ′=2,a ′=-2.而利用线性回归方程的公式与已知表格中的数据,可求得b ^=∑6i =1x i y i -6x ·y ∑6i =1x 2i -6x2=58-6×72×13691-6×⎝⎛⎭⎫722=57,a ^=y -b ^x =136-57×72=-13,所以b ^<b ′,a ^>a ′.答案:C6.(2016·忻州联考)已知x ,y 的取值如下表:从散点图分析,y 与x 线性相关,且回归方程为y =1.46x +a ,则实数a ^的值为________. 解析:x =2+3+4+54=3.5,y =2.2+3.8+5.5+6.54=4.5,回归方程必过样本的中心点(x ,y ).把(3.5,4.5)代入回归方程,计算得a ^=-0.61.答案:-0.617.为了解某班学生喜爱打篮球是否与性别有关,对该班50名学生进行了问卷调查,得到了如下的2×2列联表:(请用百分数表示).解析:K 2=n (ad -bc )2(a +b )(c +d )(a +c )(b +d )=50×(20×15-5×10)225×25×30×20≈8.333>7.879.答案:0.5%8.已知下表所示数据的回归直线方程为y ^=4x +242,则实数a =________.解析:回归直线y ^=4x +242必过样本点的中心点(x ,y ),而x =2+3+4+5+65=4,y =251+254+257+a +2665=1 028+a 5,∴1 028+a 5=4×4+242,解得a =262.答案:2629.(2015·东北三校联考)某学生对其亲属30人的饮食习惯进行了一次调查,并用下图所示的茎叶图表示30人的饮食指数.(说明:图中饮食指数低于70的人,饮食以蔬菜为主;饮食指数高于70的人,饮食以肉类为主)(1)根据以上数据完成下列2×2列联表:主食蔬菜主食肉类合计 50岁以下 50岁以上 合计(2)能否有99% 解:(1)2×2列联表如下:主食蔬菜主食肉类合计 50岁以下 4 8 12 50岁以上 16 2 18 合计201030(2)因为K 2=30×(8-128)212×18×20×10=10>6.635,所以有99%的把握认为其亲属的饮食习惯与年龄有关.10.(2015·高考重庆卷)随着我国经济的发展,居民的储蓄存款逐年增长.设某地区城乡居民人民币储蓄存款(年底余额)如下表:年份 2010 2011 2012 2013 2014 时间代号t12345(1)求y 关于t 的回归方程y =b t +a ;(2)用所求回归方程预测该地区2015年(t =6)的人民币储蓄存款. 附:回归方程y ^=b ^t +a ^中, b ^=∑ni =1t i y i -n t y ∑ni =1t 2i -n t2,a ^=y -b ^t .解:(1)列表计算如下这里n =5,t =1n ∑n i =1t i =155=3,y =1n ∑n i =1y i =365=7.2. 又l tt =∑ni =1t 2i -n t2=55-5×32=10,l ty =∑ni =1t i y i-n t y =120-5×3×7.2=12,从而b ^=l ty l tt =1210=1.2,a ^=y -b ^t =7.2-1.2×3=3.6,故所求回归方程为y ^=1.2t +3.6.(2)将t =6代入回归方程可预测该地区2015年的人民币储蓄存款为y ^=1.2×6+3.6=10.8(千亿元).B 组 高考题型专练1.(2015·高考福建卷)为了解某社区居民的家庭年收入与年支出的关系,随机调查了该社区5户家庭,得到如下统计数据表:根据上表可得回归直线方程y =b x +a ,其中b =0.76,a =y -b x .据此估计,该社区一户年收入为15万元家庭的年支出为( )A .11.4万元B .11.8万元C.12.0万元D.12.2万元^=0.76,∴a^=8-0.76×10=0.4,∴回归方程为y^=0.76x 解析:∵x=10.0,y=8.0,b+0.4,把x=15代入上式得,y^=0.76×15+0.4=11.8(万元),故选B.答案:B2.(2015·高考北京卷)高三年级267位学生参加期末考试,某班37位学生的语文成绩、数学成绩与总成绩在全年级中的排名情况如图所示,甲、乙、丙为该班三位学生.从这次考试成绩看,(1)在甲、乙两人中,其语文成绩名次比其总成绩名次靠前的学生是________;(2)在语文和数学两个科目中,丙同学的成绩名次更靠前的科目是________.解析:(1)由题图分析乙的语文成绩名次略比甲的语文成绩名次靠前,但总成绩名次靠后,所以甲、乙两人中语文成绩名次比总成绩靠前的是乙;(2)丙同学的数学成绩名次位于中间稍微靠后,而总成绩名次相对靠后,所以丙同学的语文成绩名次比较靠后,所以丙同学的成绩名次靠前的科目是数学.答案:乙数学。
变量间的相关关系 说课稿 教案 教学设计
变量之间的相关关系两个变量的线性相关整体设计教学分析变量之间的关系是人们感兴趣的问题.教科书通过思考栏目“物理成绩与数学成绩之间的关系”,引导学生考察变量之间的关系.在教师的引导下,可使学生认识到在现实世界中存在不能用函数模型描述的变量关系,从而体会研究变量之间的相关关系的重要性.随后,通过探究人体脂肪百分比和年龄之间的关系,引入描述两个变量之间关系的线性回归方程(模型).教科书在探索用多种方法确定线性回归直线的过程中,向学生展示创造性思维的过程,帮助学生理解最小二乘法的思想.通过气温与饮料销售量的例子及随后的思考,使学生了解利用线性回归方程解决实际问题的全过程,体会线性回归方程作出的预测结果的随机性,并且可能犯的错误.进一步,教师可以利用计算机模拟和多媒体技术,直观形象地展示预测结果的随机性和规律性.三维目标1.通过收集现实问题中两个有关联变量的数据认识变量间的相关关系.2.明确事物间的相互联系.认识现实生活中变量间除了存在确定的关系外,仍存在大量的非确定性的相关关系,并利用散点图直观体会这种相关关系.3.经历用不同估算方法描述两个变量线性相关的过程.知道最小二乘法的思想,能根据给出的线性回归方程的系数公式建立线性回归方程.重点难点教学重点:通过收集现实问题中两个有关联变量的数据直观认识变量间的相关关系;利用散点图直观认识两个变量之间的线性关系;根据给出的线性回归方程的系数公式建立线性回归方程.教学难点:变量之间相关关系的理解;作散点图和理解两个变量的正相关和负相关;理解最小二乘法的思想.课时安排2课时教学过程第1课时导入新课思路1在学校里,老师对学生经常这样说:“如果你的数学成绩好,那么你的物理学习就不会有什么大问题.”按照这种说法,似乎学生的物理成绩与数学成绩之间存在着一种相关关系.这种说法有没有根据呢?学生讨论:我们可以发现自己的数学成绩和物理成绩存在某种关系.(似乎就是数学好的,物理也好;数学差的,物理也差,但又不全对.)物理成绩和数学成绩是两个变量,从经验看,由于物理学习要用到比较多的数学知识和数学方法.数学成绩的高低对物理成绩的高低是有一定影响的.但决非唯一因素,还有其他因素,如是否喜欢物理,用在物理学习上的时间等等.(总结:不能通过一个人的数学成绩是多少就准确地断定他的物理成绩能达到多少.但这两个变量是有一定关系的,它们之间是一种不确定性的关系.如何通过数学成绩的结果对物理成绩进行合理估计有非常重要的现实意义.)为很好地说明上述问题,我们开始学习变量之间的相关关系和两个变量的线性相关.(教师板书课题)思路2某地区的环境条件适合天鹅栖息繁衍,有人经统计发现了一个有趣的现象,如果村庄附近栖息的天鹅多,那么这个村庄的婴儿出生率也高,天鹅少的地方婴儿的出生率低,于是,他就得出一个结论:天鹅能够带来孩子.你认为这样得到的结论可靠吗?如何证明这个结论的可靠性?推进新课新知探究提出问题(1)粮食产量与施肥量有关系吗?“名师出高徒”可以解释为教师的水平越高,学生的水平也越高.教师的水平与学生的水平有什么关系?你能举出更多的描述生活中两个变量的相关关系的成语吗?(2)两个变量间的相关关系是什么?有几种?(3)两个变量间的相关关系的判断.讨论结果:(1)粮食产量与施肥量有关系,一般是在标准范围内,施肥越多,粮食产量越高;教师的水平与学生的水平是相关的,如水滴石穿,三人行必有我师等.我们还可以举出现实生活中存在的许多相关关系的问题.例如:商品销售收入与广告支出经费之间的关系.商品销售收入与广告支出经费有着密切的联系,但商品销售收入不仅与广告支出多少有关,还与商品质量、居民收入等因素有关.粮食产量与施肥量之间的关系.在一定范围内,施肥量越大,粮食产量就越高.但是,施肥量并不是决定粮食产量的唯一因素.因为粮食产量还要受到土壤质量、降雨量、田间管理水平等因素的影响.人体内的脂肪含量与年龄之间的关系.在一定年龄段内,随着年龄的增长,人体内的脂肪含量会增加,但人体内的脂肪含量还与饮食习惯、体育锻炼等有关,可能还与个人的先天体质有关.应当说,对于上述各种问题中的两个变量之间的相关关系,我们都可以根据自己的生活、学习经验作出相应的判断,因为“经验当中有规律”.但是,不管你的经验多么丰富,如果只凭经验办事,还是很容易出错的.因此,在分析两个变量之间的相关关系时,我们需要一些有说服力的方法.在寻找变量之间相关关系的过程中,统计同样发挥着非常重要的作用.因为上面提到的这种关系,并不像匀速直线运动中时间与路程的关系那样是完全确定的,而是带有不确定性.这就需要通过收集大量的数据(有时通过调查,有时通过实验),在对数据进行统计分析的基础上,发现其中的规律,才能对它们之间的关系作出判断.(2)相关关系的概念:自变量取值一定时,因变量的取值带有一定随机性的两个变量之间的关系,叫做相关关系.两个变量之间的关系分两类:①确定性的函数关系,例如我们以前学习过的一次函数、二次函数等;②带有随机性的变量间的相关关系,例如“身高者,体重也重”,我们就说身高与体重这两个变量具有相关关系.相关关系是一种非确定性关系.如商品销售收入与广告支出经费之间的关系.(还与商品质量、居民收入、生活环境等有关)(3)两个变量间的相关关系的判断:①散点图.②根据散点图中变量的对应点的离散程度,可以准确地判断两个变量是否具有相关关系.③正相关、负相关的概念.①教学散点图年龄23 27 38 41 45 49 50 脂肪9.5 17.8 21.2 25.9 27.5 26.3 28.2 年龄53 54 56 57 58 60 61 脂肪29.6 30.2 31.4 30.8 33.5 35.2 34.6 分析数据:大体上来看,随着年龄的增加,人体中脂肪的百分比也在增加.我们可以作散点图来进一步分析.②散点图的概念:将各数据在平面直角坐标系中的对应点画出来,得到表示两个变量的一组数据的图形,这样的图形叫做散点图,如下图.从散点图我们可以看出,年龄越大,体内脂肪含量越高.图中点的趋势表明两个变量之间确实存在一定的关系,这个图支持了我们从数据表中得出的结论.(a.如果所有的样本点都落在某一函数曲线上,就用该函数来描述变量之间的关系,即变量之间具有函数关系.b.如果所有的样本点都落在某一函数曲线附近,变量之间就有相关关系.c.如果所有的样本点都落在某一直线附近,变量之间就有线性相关关系)③正相关与负相关的概念:如果散点图中的点散布在从左下角到右上角的区域内,称为正相关.如果散点图中的点散布在从左上角到右下角的区域内,称为负相关.(注:散点图的点如果几乎没有什么规则,则这两个变量之间不具有相关关系)应用示例思路1例1 下列关系中,带有随机性相关关系的是_____________.①正方形的边长与面积之间的关系②水稻产量与施肥量之间的关系③人的身高与年龄之间的关系④降雪量与交通事故的发生率之间的关系解析:两变量之间的关系有两种:函数关系与带有随机性的相关关系.①正方形的边长与面积之间的关系是函数关系.②水稻产量与施肥量之间的关系不是严格的函数关系,但是具有相关性,因而是相关关系.③人的身高与年龄之间的关系既不是函数关系,也不是相关关系,因为人的年龄达到一定时期身高就不发生明显变化了,因而他们不具备相关关系.④降雪量与交通事故的发生率之间具有相关关系,因此填②④.答案:②④例 2 有关法律规定,香烟盒上必须印上“吸烟有害健康”的警示语.吸烟是否一定会引起健康问题?你认为“健康问题不一定是由吸烟引起的,所以可以吸烟”的说法对吗?分析:学生思考,然后讨论交流,教师及时评价.解:从已经掌握的知识来看,吸烟会损害身体的健康,但是除了吸烟之外,还有许多其他的随机因素影响身体健康,人体健康是很多因素共同作用的结果.我们可以找到长寿的吸烟者,也更容易发现由于吸烟而引发的患病者,所以吸烟不一定引起健康问题.但吸烟引起健康问题的可能性大.因此“健康问题不一定是由吸烟引起的,所以可以吸烟”的说法是不对的.点评:在探究研究的过程中,如果能够从两个变量的观察数据之间发现相关关系是极为有意义的,由此可以进一步研究二者之间是否蕴涵因果关系,从而发现引起这种相关关系的本质原因是什么.本题的意义在于引导学生重视对统计结果的解释,从中发现进一步研究的问题.思路2例1 有时候,一些东西吃起来口味越好,对我们的身体越有害.下表给出了不同类型的某种食品的数据.第二列表示此种食品所含热量的百分比,第三列数据表示由一些美食家以百分品牌所含热量的百分比口味记录A 25 89B 34 89C 20 80D 19 78E 26 75F 20 71G 19 65H 24 62I 19 60J 13 52(1)作出这些数据的散点图.(2)关于两个变量之间的关系,你能得出什么结论?解:(1)散点图如下:(2)基本成正相关关系,即食品所含热量越高,口味越好.例2 案例分析:一般说来,一个人的身高越高,他的右手一拃长就越长,因此,人的身高与右手一拃长之间存在着一定的关系.为了对这个问题进行调查,我们收集了北京市某中学2003年高三年级96名学生的身高与右手一拃长的数据如下表.性别身高/cm 右手一拃长/cm 性别身高/cm 右手一拃长/cm 女152 18.5 女153 16.0女156 16.0 女157 20.0女158 17.3 女159 20.0女160 15.0 女160 16.0女160 17.5 女160 17.5(1)根据上表中的数据,制成散点图.你能从散点图中发现身高与右手一拃长之间的近似关系吗?(2)如果近似成线性关系,请画出一条直线来近似地表示这种线性关系.(3)如果一个学生的身高是188 cm,你能估计他的一拃大概有多长吗?解:根据上表中的数据,制成的散点图如下.从散点图上可以发现,身高与右手一拃长之间的总体趋势是成一直线,也就是说,它们之间是线性相关的.那么,怎样确定这条直线呢?同学1:选择能反映直线变化的两个点,例如(153,16),(191,23)两点确定一条直线. 同学2:在图中放上一根细绳,使得上面和下面点的个数相同或基本相同.同学3:多取几组点对,确定几条直线方程.再分别算出各个直线方程斜率、截距的算术平均值,作为所求直线的斜率、截距.同学4:从左端点开始,取两条直线,如下图.再取这两条直线的“中间位置”作一条直线.同学5:先求出相同身高同学右手一拃长的平均值,画出散点图,如下图,再画出近似的直线,使得在直线两侧的点数尽可能一样多.同学6:先将所有的点分成两部分,一部分是身高在170 cm以下的,一部分是身高在170 cm 以上的;然后,每部分的点求一个“平均点”——身高的平均值作为平均身高、右手一拃的平均值作为平均右手一拃长,即(164,19),(177,21);最后,将这两点连接成一条直线. 同学7:先将所有的点按从小到大的顺序进行排列,尽可能地平均分成三等份;每部分的点按照同学3的方法求一个“平均点”,最小的点为(161.3,18.2),中间的点为(170.5,20.1),最大的点为(179.2,21.3).求出这三个点的“平均点”为(170.3,19.9).我再用直尺连接最大点与最小点,然后平行地推,画出过点(170.3,19.9)的直线.同学8:取一条直线,使得在它附近的点比较多.在这里需要强调的是,身高和右手一拃长之间没有函数关系.我们得到的直线方程,只是对其变化趋势的一个近似描述.对一个给定身高的人,人们可以用这个方程来估计这个人的右手一拃长,这是十分有意义的.知能训练一个车间为了规定工时定额,需要确定加工零件所花费的时间,为此进行了10次试验,收集数据如下:零件数x(个)10 20 30 40 50 60 70 80 90 100 加工时间62 68 75 81 89 95 102 108 115 122y(min)关于加工零件的个数与加工时间,你能得出什么结论?答案:(1)散点图如下:(2)加工零件的个数与所花费的时间呈正线性相关关系.拓展提升房屋面积(m2)115 110 80 135 105销售价格(万元)24.8 21.6 18.4 29.2 22(2)指出是正相关还是负相关;(3)关于销售价格y和房屋的面积x,你能得出什么结论?解:(1)数据对应的散点图如下图所示:(2)散点图中的点散分布在从左下角到右上角的区域内,所以是正相关.(3)关于销售价格y和房屋的面积x,房屋的面积越大,价格越高,它们呈正线性相关的关系. 课堂小结通过收集现实问题中两个有关联变量的数据作出散点图,并利用散点图直观认识变量间的相关关系.。
高中数学变量间关联教案
高中数学变量间关联教案
教学目标:
1. 熟练掌握变量间的关联性概念;
2. 能够运用相关概念解决实际问题;
3. 提高学生的数学推理和解决问题能力。
教学内容:
1. 变量间的关联性概念介绍;
2. 如何判断变量之间的关联程度;
3. 使用相关系数等工具进行变量间的关联性分析。
教学步骤:
一、导入(5分钟)
通过一个实际的例子引入变量间的关联性概念,激发学生的思考和探索欲望。
二、概念讲解(15分钟)
1. 讲解变量的概念及其分类;
2. 介绍相关系数的定义和计算方法;
3. 分析变量之间的线性关联和非线性关联。
三、案例分析(20分钟)
1. 案例一:某城市的降雨量和地表径流量之间的关系;
2. 案例二:身高和体重之间的关联性分析。
四、实践操作(15分钟)
让学生自行从网上或书籍中搜索相关数据,利用相关系数等工具对两个变量之间的关联性进行分析。
五、总结与展望(5分钟)
总结今天的学习内容,鼓励学生多关注身边的变量间的关联关系,培养数学思维。
教学评估:
1. 学生对变量间关联性概念的理解;
2. 学生分析案例的能力;
3. 学生的实践操作结果和分析能力。
拓展延伸:
1. 鼓励学生自主探索更多关于变量间关联性的案例;
2. 可以让学生设计自己的实验或调查,收集数据进行相关性分析;
3. 拓展学生的数学思维,探讨更多实际应用场景下变量间的关联性。
(注:以上内容仅供参考,具体实施时应根据学生实际情况做出调整。
)。
变量间的相关关系教案
变量间的相关关系优秀教案一、教学目标:1. 让学生理解相关关系的概念,能够识别和描述两种变量之间的相关关系。
2. 学生能够运用相关系数来衡量两个变量之间的相关程度。
3. 学生能够运用图表和数学模型来分析变量之间的相关关系。
4. 培养学生的数据分析能力和问题解决能力。
二、教学内容:1. 相关关系的概念和类型。
2. 相关系数的计算和解读。
3. 散点图在分析相关关系中的应用。
4. 线性回归方程的构建和应用。
5. 实际案例分析,运用相关关系解决实际问题。
三、教学重点与难点:重点:相关关系的概念和类型,相关系数的计算和解读,散点图在分析相关关系中的应用。
难点:线性回归方程的构建和应用,实际案例分析。
四、教学方法:1. 采用问题驱动的教学方法,引导学生通过实际案例来理解和应用相关关系。
2. 使用多媒体教学资源,如图表和数学软件,辅助学生直观地理解相关关系。
3. 组织小组讨论和合作活动,培养学生的团队合作能力和问题解决能力。
4. 提供充足的练习机会,让学生通过实践来巩固所学知识。
五、教学过程:1. 引入:通过一个简单的实际案例,引导学生思考两种变量之间的关系。
2. 讲解相关关系的概念和类型,解释相关系数的意义。
3. 演示如何通过散点图来分析两种变量之间的相关关系。
4. 讲解线性回归方程的构建过程,并演示如何应用线性回归方程来预测未知数据。
5. 提供实际案例分析,让学生运用相关关系来解决实际问题。
7. 布置作业,让学生通过练习来巩固所学知识。
六、教学评估与反馈:1. 通过课堂练习和作业,评估学生对相关关系概念的理解程度。
2. 通过小组讨论和案例分析,评估学生在实际问题中运用相关关系的能力。
3. 收集学生的疑问和困难,及时给予反馈和解答。
4. 鼓励学生提出自己的观点和思考,促进学生的主动学习。
七、拓展与深化:1. 介绍相关关系在社会科学、自然科学和工程科学中的应用。
2. 探讨非线性相关关系和多变量相关关系的研究方法。
《用表格表示的变量间关系》教案
《用表格表示的变量间关系》教案一、教学目标1. 让学生理解什么是变量,能够识别常量和变量。
2. 让学生掌握表格表示变量间关系的方法。
3. 培养学生运用表格解决实际问题的能力。
二、教学重点与难点1. 教学重点:识别变量和常量。
运用表格表示变量间的关系。
2. 教学难点:理解变量间关系的表达方式。
将实际问题转化为表格表示。
三、教学方法1. 采用问题驱动的教学方法,引导学生通过观察、思考、操作、交流等活动,发现变量间的关系。
2. 利用实例讲解,让学生在实际问题中体验变量间关系的表达方法。
3. 组织小组讨论,培养学生合作学习的能力。
四、教学准备1. 教学课件或黑板。
2. 实例材料。
3. 纸张、笔等学习用具。
五、教学过程1. 导入新课利用生活中的实例,如身高、体重等,引导学生认识变量。
讲解常量和变量的概念。
2. 讲解变量间关系通过实例,讲解变量间的关系,如身高与体重之间的关系。
引导学生观察、分析实例,发现变量间的规律。
3. 学习用表格表示变量间关系讲解如何用表格表示变量间的关系。
示例:以身高和体重为例,制作一个表格,展示身高和体重之间的对应关系。
4. 实践操作让学生分组,每组选择一个实际问题,如“某班级学生的身高和体重数据”,用表格表示变量间的关系。
学生分组讨论、操作,教师巡回指导。
5. 总结与拓展对学生进行总结,巩固所学知识。
提出拓展问题,激发学生思考,如“如何用表格表示复杂的多变量关系?”6. 布置作业让学生完成课后练习,运用表格表示变量间关系。
选择一个实际问题,制作表格,并分析变量间的关系。
六、教学评价1. 评价内容:学生对变量和常量的理解程度。
学生运用表格表示变量间关系的能力。
学生解决实际问题的能力。
2. 评价方法:课堂提问,检查学生对概念的理解。
作业批改,评估学生的实际操作能力。
小组讨论,观察学生的合作和问题解决能力。
七、教学反思1. 教师在课后应对本节课的教学效果进行反思,包括:学生对课堂内容的掌握情况。
北师大七年级下册数学《第3章变量之间的关系》全章教案
量之间关系的分析,尝试对某些变化趋势进行预测.
【本章思想方法】
1.体会和掌握由特殊到一般的思想方法,如通过一些具体、特殊的实例,找出一般的 规律,再用这个规律指导实践,得出所需要的具体的数据.
2.体会数形结合的思想方法,如利用图象确定变量之间关系以及预测变化趋势等,其 关键是明确横轴、纵轴所表示的实际意义.
时间 t(时)之间的关系式为 s=40t.
【互动探索】(引发学生思考)什么是常量?什么是变量?各有什么特点?
【解答】(1)常量:6;变量:n、t.
(2)常量:40;变量:s、t.
【互动总结】(学生总结,老师点评)解此类题时,先确定在某过程中哪些量是变化的,
而哪些量又是不变的,再根据“数值发生变化的量为变量,数值始终不变的量为常量”解决
问题.
【例 2】某电动车厂 2018 年各月生产电动车的数量情况如下表:
时间 x/月
1 2 34 5
6
月产量 y/万辆 8 8.5 9 10 11 12
时间 x/月
7 8 9 10 11 12
月产量 y/万辆 10 9.5 9 10 10 10.5
(1)为什么称电动车的月产量 y 为因变量?它是谁的因变量?
3.体会分类讨论的思想方法,如根据题目给出的不同条件进行判断,然后分类讨论, 找出合适的等量关系,列出方程并求解.
课时计划
1 用表格表示的变量间关系 2 用关系式表示的变量间关系 3 用图象表示的变量间关系
1 课时 1 课时 2 课时
1 用表格表示的变量间关系
教学目标
一、基本目标 1.理解变量、自变量和因变量的意义,明确可以列表格表示两个变量之间的关系. 2.能从表格中读取信息,并解决相关问题. 二、重难点目标 【教学重点】 能从表格的数据中分清什么是变量、自变量、因变量,以及因变量随自变量的变化情况. 【教学难点】 对表格所表达的两个变量关系的理解. 环节 1 自学提纲,生成问题 【5 min 阅读】 阅读教材 P62~P63 的内容,完成下面练习. 【3 min 反馈】 1.完成教材 P62 引入问题: 解:(1)1.59 s. (2)随着 h 逐渐变大,t 逐渐变小. (3)不相同. (4)根据(3)中的发现进行估计,可以是 1.35 s 到 1.29 s 中的任意一值. (5)小车下滑时间 t 及下滑速度 v 等量发生变化,小车质量始终不发生变化. 归纳总结:(1)在教材 P62 的表 1 中,支撑物高度 h 和小车下滑时间 t 都在变化,它们都 是变量.其中 t 随 h 的变化而变化,h 是自变量,t 是因变量; (2)在某一变化过程中,可以取不同数值的量,叫做变量;取值始终保持不变的量,叫 做常量. 2.完成教材 P62“议一议”: 解:(1)随着 x 的增大,y 逐渐增大. (2)答案不唯一,如:从 1949 年起,时间每向后推移 10 年,我国人口分别增加 1.3 亿、 1.35 亿、1.68 亿、1.32 亿、1.52 亿、0.76 亿. 3.世纪花园居民小区收取电费的标准是 0.6 元/千瓦时,当用电量为 x(单位:千瓦时) 时,收取电费为 y(单位:元).在这个问题中,下列说法正确的是( D ) A.x 是自变量,0.6 元/千瓦时是因变量 B.y 是自变量,x 是因变量
3.2用关系式表示变量间的关系(教案)
实践活动环节,学生们分组讨论和实验操作的积极性很高,这让我感到非常欣慰。不过,我也发现部分小组在讨论过程中出现了偏离主题的现象。为了提高讨论的效率,我计划在下次活动中加强对学生的引导,确保讨论能够紧扣主题,更好地为学习服务。
1.讨论主题:学生将围绕“关系式在实际生活中的应用”这一主题展开讨论。他们将被鼓励提出自己的观点和想法,并与其他小组成员进行交流。
2.引导与启发:在讨论过程中,我将作为一个引导者,帮助学生发现问题、分析问题并解决问题。我会提出一些开放性的问题来启发他们的思考。
3.成果分享:每个小组将选择一名代表来分享他们的讨论成果。这些成果将被记录在黑板上或投影仪上,以便全班都能看到。
这三个方面的核心素养目标与新教材重点
1.教学重点
-掌握关系式的概念:强调关系式是表达变量间关系的一种数学表达方式,如线性关系、正比例关系、反比例关系等。
-理解变量与常量的区别:使学生明白在关系式中,变量是可变的,而常量是固定不变的。
2.继续采用案例教学、举例对比等方法,强化学生对关系式概念的理解。
3.在实践活动和小组讨论中加强对学生的引导,确保讨论紧扣主题,提高课堂效率。
4.注重培养学生的自信心,鼓励他们在课堂上积极表达自己的观点。
-理解关系式的推导过程:在关系式的推导过程中,学生可能会对公式的由来和推导方法产生困惑。
-运用关系式进行问题求解:在解决问题时,学生可能会对如何运用关系式求解感到困难。
教案二:如何通过相关系数体现变量之间的关系?
教案二:如何通过相关系数体现变量之间的关系?。
一、什么是相关系数?相关系数是一种度量两个连续变量之间相关性的统计指标。
具体地说,它描述的是一个变量的改变与另一个变量的改变之间的关系。
相关系数的值在-1到1之间,值越接近1,说明两个变量之间的关系越强,值越接近-1,说明两个变量之间的关系越弱,值为0时说明两个变量之间不存在相关性。
二、相系数的类型相关系数主要有两种类型:皮尔逊相关系数和斯皮尔曼相关系数。
1.皮尔逊相关系数皮尔逊相关系数(Pearson correlation coefficient)是用于度量两个连续变量之间线性关系强度的统计指标。
当两个变量线性相关时,其皮尔逊相关系数的值为1或-1,当两个变量不相关时,其皮尔逊相关系数的值为0。
皮尔逊相关系数的计算公式如下:其中,x和y分别是两个变量的观测值,n是变量的数量,μx和μy是两个变量的均值,σx和σy是两个变量的标准差。
皮尔逊相关系数可以用来衡量两个变量之间的线性关系。
如果变量之间不是线性关系,皮尔逊相关系数就不是一个很好的度量了。
2.斯皮尔曼相关系数斯皮尔曼相关系数(Spearman's rank correlation coefficient)是用于度量两个连续变量之间的“等级”关系的统计指标。
斯皮尔曼相关系数是基于对两个变量进行等级转换之后的结果来计算的,它可以用来对非线性关系进行度量。
斯皮尔曼相关系数的计算公式如下:其中,di=x[i]-y[i],n是变量的数量,r是斯皮尔曼相关系数,P是秩次和公式,而P1和P2分别是x和y的秩次和,d是P1和P2的差。
当变量之间存在一个单调的关系时,斯皮尔曼相关系数为1或-1,当变量之间不存在单调关系时,斯皮尔曼相关系数为0。
三、如何解释相关系数了解相关系数是很重要的,但它们有什么意义呢?相关系数可以给你关于两个变量之间的关系提供重要信息。
通常来说,相关系数是通过检查数据点是否散布在一个线性模型周围来计算的,这个模型的形状是由公式y=mx+b定义的。
变量间的相关关系教案
变量间的相关关系优秀教案第一章:引言1.1 教学目标让学生理解变量间的相关关系概念让学生掌握绘制散点图的方法让学生了解相关系数的概念1.2 教学内容变量间的相关关系定义散点图的绘制方法相关系数的概念及计算方法1.3 教学过程1.3.1 导入通过实际例子引入变量间的相关关系概念,如身高与体重的关系。
1.3.2 新课导入讲解变量间的相关关系定义,解释相关系数的概念。
演示如何绘制散点图,让学生跟随操作。
1.3.3 案例分析提供一些实际数据,让学生绘制散点图,并计算相关系数。
1.3.4 练习与讨论让学生回答相关问题,巩固所学内容。
引导学生讨论实际问题中的变量间相关关系。
1.4 教学评价通过课堂练习和讨论,评估学生对变量间的相关关系的理解和应用能力。
第二章:线性相关关系2.1 教学目标让学生理解线性相关关系的概念让学生掌握线性相关关系的判断方法让学生学会绘制线性回归直线2.2 教学内容线性相关关系的定义线性相关关系的判断方法线性回归直线的绘制方法2.3 教学过程2.3.1 导入通过实际例子引入线性相关关系概念,如房价与面积的关系。
2.3.2 新课导入讲解线性相关关系的定义,解释线性回归直线的概念。
演示如何判断线性相关关系,让学生跟随操作。
2.3.3 案例分析提供一些实际数据,让学生判断线性相关关系,并绘制线性回归直线。
2.3.4 练习与讨论让学生回答相关问题,巩固所学内容。
引导学生讨论实际问题中的线性相关关系。
2.4 教学评价第三章:非线性相关关系3.1 教学目标让学生理解非线性相关关系的概念让学生掌握非线性相关关系的判断方法让学生学会绘制非线性回归直线3.2 教学内容非线性相关关系的定义非线性相关关系的判断方法非线性回归直线的绘制方法3.3 教学过程3.3.1 导入通过实际例子引入非线性相关关系概念,如温度与冰点的关系。
3.3.2 新课导入讲解非线性相关关系的定义,解释非线性回归直线的概念。
演示如何判断非线性相关关系,让学生跟随操作。
2014届高考数学一轮复习教学案变量间的相关关系统计案例
变量间的相关关系__统计案例[知识能否忆起]一、变量间的相关关系1.常见的两变量之间的关系有两类:一类是函数关系,另一类是相关关系;与函数关系不同,相关关系是一种非确定性关系.2.从散点图上看,点分布在从左下角到右上角的区域内,两个变量的这种相关关系称为正相关,点分布在左上角到右下角的区域内,两个变量的相关关系为负相关.二、两个变量的线性相关1.从散点图上看,如果这些点从整体上看大致分布在通过散点图中心的一条直线附近,称两个变量之间具有线性相关关系,这条直线叫回归直线.2.回归方程为y ^=b ^x +a ^,其中b ^=∑i =1nx i y i -n x y∑i =1nx 2i -n x2,a ^=y -b ^x .3.通过求Q =∑i =1n(y i -bx i -a )2的最小值而得到回归直线的方法,即使得样本数据的点到回归直线的距离的平方和最小的方法叫做最小二乘法.4.相关系数=∑i =1n(x i -x )(y i -y )∑i =1n(x i -x )2∑i =1n(y i -y )2,当r >0时,表明两个变量正相关; 当r <0时,表明两个变量负相关.r 的绝对值越接近于1,表明两个变量的线性相关性越强.r 的绝对值越接近于0时,表明两个变量之间几乎不存在线性相关关系.通常|r |大于0.75时,认为两个变量有很强的线性相关性.三、独立性检验1.2×2列联表:假设有两个分类变量X 和Y ,它们的值域分别为{x 1,x 2}和{y 1,y 2},其样本频数列联表(称2×2列联表)为:K 2=n (ad -bc )2(a +b )(a +c )(b +d )(c +d )(其中n =a +b +c +d 为样本容量).2.用K 2的大小可以决定是否拒绝原来的统计假设H 0,若K 2值较大,就拒绝H 0,即拒绝事件A 与B 无关.3.当K 2>3.841时,则有95%的把握说事件A 与B 有关; 当K 2>6.635时,则有99%的把握说事件A 与B 有关; 当K 2>2.706时,则有90%的把握说事件A 与B 有关.[小题能否全取]1.(教材习题改编)观察下列各图形其中两个变量x 、y 具有相关关系的图是( ) A .①② B .①④ C .③④D .②③解析:选C 由散点图知③④具有相关关系.2.(教材习题改编)已知变量x ,y 之间具有线性相关关系,其回归方程为y ^=-3+bx ,若∑i =110x i =17,∑i =110y i =4,则b 的值为( )A .2B .1C .-2D .-1解析:选A 依题意知,x =1710=1.7,y =410=0.4,而直线y ^=-3+bx 一定经过点(x ,y ),所以-3+b ×1.7=0.4,解得b =2.3.在一次对性别与说谎是否相关的调查中,得到如下数据:根据表中数据,得到如下结论中正确的一项是( ) A .在此次调查中有95%的把握认为是否说谎与性别有关 B .在此次调查中有99%的把握认为是否说谎与性别有关 C .在此次调查中有99.5%的把握认为是否说谎与性别有关 D .在此次调查中没有充分的证据显示说谎与性别有关解析:选D 由于K 2=30×(6×9-7×8)213×17×14×16≈0.0024,由于K 2很小,因此,在此次调查中没有充分的证据显示说谎与性别有关.故选D.4.某考察团对全国10大城市的居民人均工资收入x (万元/年)与居民人均消费y (万元/年)进行统计调查,发现y 与x 具有相关关系,且y 对x 的回归方程为y ^=0.66x +1.562.若某城市居民人均消费为7.675(万元/年),估计该城市人均消费占人均工资收入的百分比约为________.解析:因为当y ^=7.675时,x =7.675-1.5620.66≈9.262,则7.6759.262≈0.829≈83%. 答案:83%5.已知x ,y 之间的数据如表所示,则回归直线过点________.解析:x =3,y =2.5,∴样本点中心为(3,2.5),回归直线过样本点中心. 答案:(3,2.5)1.回归分析是对具有相关关系的两个变量进行统计分析的方法,只有在散点图大致呈线性时,求出的线性回归方程才有实际意义,否则,求出的线性回归方程毫无意义.2.由回归方程进行预报,仅是一个预报值,而不是真实发生的值.3.使用K 2统计量作2×2列联表的独立性检验时,要求表中的4个数据都要大于5,在选取样本容量时一定要注意.典题导入[例1] (2012·新课标全国卷)在一组样本数据(x 1,y 1),(x 2,y 2),…,(x n ,y n )(n ≥2,x 1,x 2,…,x n 不全相等)的散点图中,若所有样本点(x i ,y i )(i =1,2,…,n )都在直线y =12x +1上,则这组样本数据的样本相关系数为( )A .-1B .0 C.12D .1[自主解答] 因为所有的点都在直线上,所以它就是确定的函数关系,所以相关系数为1.[答案] D由题悟法1.相关关系的判断方法一是利用散点图直观判断,二是利用相关系数作出判断. 2.对于由散点图作出相关性判断时,若散点图呈带状且区域较窄,说明两个变量有一定的线性相关性,若呈曲线型也是有相关性.3.由相关系数r 判断时|r |越趋近于1相关性越强.以题试法1.已知变量x ,y 之间具有线性相关关系,其散点图如图所示,则其回归方程可能为( )A.y ^=1.5x +2 B.y ^=-1.5x +2 C.y ^=1.5x -2 D.y ^=-1.5x -2解析:选B 设回归方程为y ^=bx +a .由散点图可知变量x 、y 之间负相关,回归直线在y 轴上的截距为正数,所以b <0,a >0,因此其回归直线方程可能为y ^=-1.5x +2.典题导入[例2] (2012·福建高考)某工厂为了对新研发的一种产品进行合理定价,将该产品按事先拟定的价格进行试销,得到如下数据:(1)求回归直线方程y ^=bx +a ,其中b =-20,a =y --b x -;(2)预计在今后的销售中,销量与单价仍然服从(1)中的关系,且该产品的成本是4元/件,为使工厂获得最大利润,该产品的单价应定为多少元?(利润=销售收入-成本)[自主解答] (1)由于x =16(x 1+x 2+x 3+x 4+x 5+x 6)=8.5,y =16(y 1+y 2+y 3+y 4+y 5+y 6)=80.所以a =y -b x =80+20×8.5=250,从而回归直线方程为y ^=-20x +250. (2)设工厂获得的利润为L 元,依题意得 L =x (-20x +250)-4(-20x +250) =-20x 2+330x -1 000 =-20⎝⎛⎭⎫x -3342+361.25. 当且仅当x =8.25时,L 取得最大值.故当单价定为8.25元时,工厂可获得最大利润.由题悟法1.最小二乘法估计的一般步骤: (1)作出散点图,判断是否线性相关; (2)如果是,则用公式求a ^,b ^,写出回归方程; (3)根据方程进行估计.2.回归直线方程必过定点(x ,y ).以题试法2.(2012·长春模拟)已知x 、y 取值如下表:从所得的散点图分析可知:y 与x 线性相关,且y ^=0.95x +a ,则a =( ) A .1.30 B .1.45 C .1.65D .1.80解析:选B 依题意得,x =16×(0+1+4+5+6+8)=4,y =16×(1.3+1.8+5.6+6.1+7.4+9.3)=5.25;又直线y ^=0.95x +a 必过中心点(x ,y ),即点(4,5.25),于是有5.25=0.95×4+a ,由此解得a =1.45.典题导入[例3] (2012·湖南衡阳第二次联考)衡阳市第一次联考后,某校对甲、乙两个文科班的数学考试成绩进行分析,规定:大于或等于120分为优秀,120分以下为非优秀.统计成绩后,得到如下的2×2列联表,且已知在甲、乙两个文科班全部110人中随机抽取1人为优秀的概率为311.(1)请完成上面的列联表;(2)根据列表中的数据,若按99.9%的可靠性要求,能否认为“成绩与班级有关系”. 参考公式与临界值表:K 2=n (ad -bc )2(a +b )(c +d )(a +c )(b +d )[自主解答] (1)列联表如下:(2)根据列联表中的数据,得到K 2=110×(10×30-20×50)260×50×30×80≈7.486<10.828.因此按99.9%的可靠性要求,不能认为“成绩与班级有关系”.由题悟法1.独立性检验的一般步骤: (1)根据样本数据制成2×2列联表;(2)根据公式K 2=n (ad -bc )2(a +b )(a +d )(a +c )(b +d )计算K 2的值;(3)查表比较K 2与临界值的大小关系,作统计判断.2.在实际问题中,独立性检验的结论也仅仅是一种数学关系,得到的结论也可能犯错误.以题试法3.(2012·嘉兴联考)为了判断高中三年级学生选修文科是否与性别有关,现随机抽取50名学生,得到如下2×2列联表:已知P (K 2≥3.841)≈0.05,P (K 2≥5.024)≈0.025.根据表中数据,得到K 2=50×(13×20-10×7)223×27×20×30≈4.844,则认为选修文科与性别有关系出错的可能性约为________.解析:由K 2=4.844>3.841.故认为选修文科与性别有关系出错的可能性约为5%. 答案:5%。
第六章 - 变量之间的关系教案
第六章 - 变量之间的关系教案教案:第三章变量之间的关系一、教学目标1.经历探索具体情境中两个变量之间关系的过程,进一步发展符号感和抽象思维.2.能发现实际情境中的变量及其相互关系,并确定其中的自变量或因变量.3.能从表格、图象中分析出某些变量之间的关系,并能用自己的语言进行表达,发展有条理地进行思考和表达的能力.4.能根据具体问题,选取用表格或关系式来表示某些变量之间的关系,并结合对变量之间关系的分析,尝试对变化趋势进行初步的预测.5.体验从运动变化的角度认识数学对象的过程,发展对数学的认识.二、课时安排建议1小车下滑的时间~~~~~~~~~~~~~1课时 2变化中的三角形~~~~~~~~~~~~~1课时 3温度的变化~~~~~~~~~~~~~~~1课时 4速度的变化~~~~~~~~~~~~~~~1课时回顾与思考~~~~~~~~~~~~~~~~1课时三、教学建议1.创设丰富的现实情境,使学生在对变化规律的丰富经历中理解变量之间的相依关系.本章主要讨论的是现实世界中大量存在的变量,讨论如何用数学的方法去理解、表示变量之间的关系,并解决一些问题和进行预测.因此在教学中,教师要创设丰富的现实情境使学生体会变量以及变量之间相互依赖的关系,而不是形式地讨论函数的有关概念.教师可以充分利用教科书中提供的问题,也可以根据学生实际创设新的情境,或鼓励学生自己从生活中寻找有关素材供课堂讨论. 2.注重使学生亲身经历探索现实世界变化规律的过程.运用数学的语言、方法、知识去理解、刻画现实世界中的变化规律,是本章学习的主要目标之一.而实现这一目标的重要途径是使学生亲身经历探索现实世界变化规律的过程,在探索活动中理解变量之间的相依关系,并尝试用语言和符号去刻画.例如,在探索小车下滑过程中下滑时间与支撑物高度的关系时,教师应鼓励学生充分地从表格中获取信息,运用自己的语言进行描述,并与同伴进行交流.有条件的地方,教师可以让学生亲自实践这个实验或实践其他可操作性的实验,使他们获得变量之间关系的直观体验,并体会收集数据、整理数据、由数据进行推断的思考方式.3.注重使学生从表格、关系式、图象中尽可能多地获取信息,并运用语言进行表达.前面已经提到,为了发展学生对函数思想的理解,必须使他们对函数的多种表示――数值表示、解析表示、图象表示有相当丰富的经历.因此,教科书安排了大量由表格、关系式、图象所表达的变量之间关系的实例.在学生讨论这些例子时,教师要留给他们充分思考的时间,鼓励他们从表格、关系式、图象中尽可能多地获取信息,并运用自己的语言进行表达.当学生运用语言进行表达时,教师不要苛求语言的统一性以及对关系的精确描述,只要学生能大致描述出变量之间的关系即可.四、评价建议1.关注对学生探索现实世界变化规律的过程的评价.在本章的学习中,学生花费了较多的时间经历从具体问题中抽象出变化规律、理解符号所代表的变化规律等活动,这些活动对于学生发展符号感具有重要的价值.因此,对上述活动过程的考查应当成为评价的首要方面.对这一方面评价的重点显然不是记忆概念的准确性和使用技能、法则的熟练程度,而是对以下诸方面的考查:从事活动的投入程度,从表格、关系式、图象中获取信息的准确性和广泛性,对具体情境中变量之间关系的敏感性,运用语言等描述变量之间关系的合理性等.例如,在对学生探索小车下滑时间与支撑物高度关系的过程进行评价时,可以关注以下几个方面:学生是否积极地进行活动,并在活动中进行独立思考;能否从实际操作或表格中意识到下滑时间与支撑物高度之间存在着相依关系;能否从表格中获取尽可能多的信息;能否运用自己的语言描述下滑时间与支撑物高度之间的关系等.2.在现实情境中评价学生对变量之间关系的理解.在考查学生对变量之间关系的理解时,应关注学生是否能够感受周围世界中的变量,是否能够发现变量之间互相依赖的关系;关注学生是否能从表格和图象中获取信息,并由此进行预测;关注学生能否运用语言、表格、关系式描述一些变量之间的关系等.评价时应提供具体的问题情境,从大量实际问题或学生感兴趣的问题出发.避免形式化地对函数性质本身(如单值对应、三种表达形式)进行讨论.§3.1 小车下滑的时间一、[教学目标]1.经历探索具体情境中两个变量之间关系的过程,获得探索变量之间关系的体验,进一步发展符号感。
北师大版七下数学3.2用关系式表示的变量间关系教案
北师大版七下数学3.2用关系式表示的变量间关系教案一. 教材分析本节课的主题是“用关系式表示的变量间关系”,属于北师大版七下数学的第三章“多变量的关系”的第二节。
通过本节课的学习,学生能够理解变量间的关系,并能够用关系式进行表示。
教材通过丰富的实例,引导学生探究变量之间的关系,从而达到理解并掌握关系式的目的。
二. 学情分析学生在学习本节课之前,已经掌握了变量和函数的概念,能够理解一个变量随另一个变量的变化而变化。
但是,对于用关系式表示变量间的关系,可能还存在一定的困难。
因此,在教学过程中,教师需要通过实例引导学生,让学生能够逐步理解和掌握关系式的表示方法。
三. 教学目标1.理解变量间的关系,并能够用关系式进行表示。
2.能够分析实际问题中的变量关系,并用关系式进行表达。
3.培养学生的逻辑思维能力和解决问题的能力。
四. 教学重难点1.教学重点:理解变量间的关系,并能够用关系式进行表示。
2.教学难点:对于复杂的关系式,能够理解和运用。
五. 教学方法采用问题驱动的教学方法,通过丰富的实例,引导学生探究变量之间的关系,从而达到理解并掌握关系式的目的。
在教学过程中,注重学生的参与和思考,培养学生的逻辑思维能力和解决问题的能力。
六. 教学准备1.准备相关的实例,用于引导学生探究变量之间的关系。
2.准备关系式的模板,方便学生进行填写和练习。
七. 教学过程1.导入(5分钟)通过一个实际问题,引出变量间的关系,例如“两个人共同完成一项任务,他们的工作效率与工作时间之间的关系是什么?”让学生思考并回答。
2.呈现(10分钟)呈现一些实例,让学生观察并分析变量间的关系。
例如,一个人跑步的速度与时间的关系,一个人的工资与工作时间的关系等。
引导学生发现,变量间的关系可以用关系式进行表示。
3.操练(10分钟)让学生分组讨论,每组找出一个实例,分析变量间的关系,并用关系式进行表示。
教师巡回指导,给予学生帮助和指导。
4.巩固(10分钟)让学生独立完成一些练习题,巩固所学的关系式的表示方法。
变量间的相关关系教案
变量间的相关关系优秀教案一、教学目标:1. 让学生理解相关关系的概念,掌握相关系数的定义和计算方法。
2. 培养学生运用相关系数分析实际问题,判断变量间的关系。
3. 引导学生利用图表和数据进行推理和分析,提高学生的数据分析能力。
二、教学内容:1. 相关关系的概念和性质2. 相关系数的定义和计算方法3. 相关系数的大小与变量间关系的强度和方向4. 实际问题中的相关关系分析三、教学重点与难点:1. 重点:相关关系的概念、相关系数的定义和计算方法,相关系数的大小与变量间关系的判断。
2. 难点:相关系数计算公式的理解和应用,实际问题中的相关关系分析。
四、教学方法:1. 采用问题驱动的教学方法,引导学生通过实例认识相关关系。
2. 利用图表和数据进行分析,帮助学生理解相关系数的含义和作用。
3. 结合生活中的实际问题,培养学生运用相关系数分析和解决问题的能力。
五、教学准备:1. 准备相关关系的实例和数据,制作PPT进行展示。
2. 准备相关系数计算器,方便学生进行实践操作。
3. 准备一些实际问题,用于课堂讨论和分析。
六、教学过程:1. 引入:通过一个简单的实例,如身高和体重之间的关系,引导学生思考变量间的关系。
2. 讲解相关关系的概念和性质,解释相关系数的作用。
3. 讲解相关系数的定义和计算方法,引导学生理解相关系数的大小与变量间关系的强度和方向。
4. 进行实际问题分析,让学生运用相关系数判断变量间的关系。
5. 总结本节课的重点内容,布置课后作业。
七、课堂练习:1. 让学生使用相关系数计算器,计算给定数据集的相关系数。
2. 让学生分析实际问题中的相关关系,判断变量间的关系强度和方向。
3. 让学生解释相关系数在实际问题中的应用和意义。
八、课堂讨论:1. 引导学生讨论实际问题中的相关关系,分享彼此的想法和观点。
2. 引导学生从相关系数的角度分析实际问题,提出解决方案。
3. 鼓励学生提出问题,促进课堂互动和思考。
九、课后作业:1. 让学生完成相关关系练习题,巩固所学知识。
【随机变量及其与事件的联系】教学能手教案
随机变量及其与事件的联系教学能手教案教学目标:1. 理解随机变量的概念及其在实际问题中的应用。
2. 掌握随机变量与事件之间的联系,能够运用随机变量描述不确定现象。
3. 学会运用数学方法分析和解决与随机变量相关的问题。
教学内容:一、随机变量的概念1. 引入随机试验和样本空间的概念。
2. 讲解随机变量的定义及其分类(离散型随机变量和连续型随机变量)。
二、随机变量与事件的关系1. 引入事件的概念。
2. 讲解随机变量与事件的联系,如何通过随机变量来描述事件。
3. 举例说明随机变量可以用来解决事件的概率问题。
三、离散型随机变量的概率分布1. 引入离散型随机变量的概率分布的概念。
2. 讲解概率分布的性质和意义。
3. 学习常见的离散型随机变量概率分布(如二项分布、泊松分布等)。
四、离散型随机变量的期望和方差1. 讲解离散型随机变量的期望的定义和计算方法。
2. 讲解离散型随机变量的方差的定义和计算方法。
3. 举例说明期望和方差在实际问题中的应用。
五、连续型随机变量1. 引入连续型随机变量的概念。
2. 讲解连续型随机变量的概率密度函数及其性质。
3. 学习常见的连续型随机变量(如正态分布、均匀分布等)。
教学方法:1. 采用讲授法,系统讲解随机变量及其与事件的关系。
2. 利用案例分析,让学生通过实际问题理解随机变量的应用。
3. 运用数形结合的方法,直观展示随机变量的概率分布和期望方差的概念。
教学评估:1. 课堂练习:及时检测学生对随机变量的理解和运用能力。
2. 课后作业:布置相关题目,巩固学生对随机变量知识的学习。
3. 课程报告:让学生选取实际问题,运用随机变量和相关知识进行分析,培养学生的综合运用能力。
六、随机变量的数字特征1. 讲解随机变量的数字特征的概念和重要性。
2. 学习随机变量的期望、方差、协方差等数字特征的定义和计算方法。
3. 举例说明数字特征在描述随机变量的集中趋势和离散程度方面的应用。
七、随机变量函数1. 引入随机变量函数的概念。
变量间的相关关系教案
变量间的相关关系优秀教案第一章:引言1.1 课程介绍本课程旨在帮助学生理解变量间的相关关系,并学会如何进行相关性分析。
通过本章的学习,学生将能够掌握相关性概念,并了解相关性在实际应用中的重要性。
1.2 变量间的相关关系概念1.2.1 变量概念变量是研究对象的特征或属性,可以用来衡量或描述。
在本课程中,我们将关注两种类型的变量:定量变量和分类变量。
1.2.2 相关关系概念相关关系是指两个变量之间的相互关系或关联程度。
相关关系可以是正相关的,即一个变量增加时,另一个变量也增加;也可以是负相关的,即一个变量增加时,另一个变量减少。
第二章:皮尔逊相关系数2.1 皮尔逊相关系数的概念皮尔逊相关系数是衡量两个定量变量之间线性相关程度的一种统计方法。
它的取值范围在-1到1之间,当相关系数为1时,表示完全正相关;当相关系数为-1时,表示完全负相关;当相关系数为0时,表示没有相关关系。
2.2 计算皮尔逊相关系数2.2.1 数据收集收集两组定量变量的数据,并将其整理成表格形式。
2.2.2 计算步骤(1)计算两组数据的均值;(2)计算两组数据的标准差;(3)计算协方差;(4)计算皮尔逊相关系数。
2.3 应用案例通过实际案例,让学生了解如何使用皮尔逊相关系数进行相关性分析,并解释结果。
第三章:斯皮尔曼等级相关系数3.1 斯皮尔曼等级相关系数的概念斯皮尔曼等级相关系数是衡量两个变量之间单调相关程度的一种非参数方法。
它适用于非正态分布的数据或有序分类变量。
3.2 计算斯皮尔曼等级相关系数3.2.1 数据收集收集两组有序分类变量的数据,并将其整理成表格形式。
3.2.2 计算步骤(1)将数据进行等级排序;(2)计算等级差的积;(3)计算等级差的平均值;(4)计算斯皮尔曼等级相关系数。
3.3 应用案例通过实际案例,让学生了解如何使用斯皮尔曼等级相关系数进行相关性分析,并解释结果。
第四章:肯德尔等级相关系数4.1 肯德尔等级相关系数的概念肯德尔等级相关系数是衡量多于两个变量之间单调相关程度的一种非参数方法。
2017-2018学年高中数学人教A版必修3教学案:第二章 2.3 变量间的相关关系
变量间的相关关系(1)函数关系与相关关系的区别与联系是什么?(2)如何判断两个变量之间是否具备相关关系?(3)什么是正相关、负相关?与散点图有什么关系?[新知初探]1.相关关系如果两个变量中一个变量的取值一定时,另一个变量的取值带有一定的随机性,那么这两个变量之间的关系叫做相关关系.2.散点图将各数据在平面直角坐标系中的对应点画出来,得到表示两个变量的一组数据的图形,这样的图形叫做散点图,利用散点图,可以判断两个变量是否相关,相关时是正相关还是负相关.3.正相关和负相关(1)正相关:散点图中的点散布在从左下角到右上角的区域.(2)负相关:散点图中的点散布在从左上角到右下角的区域.[点睛]对正相关和负相关的理解(1)正相关随自变量的变大(或变小),因变量也随之变大(或变小),这种带有随机性的相关关系,我们称为正相关.例如,人年龄由小变大时,体内脂肪含量也由少变多.(2)负相关随自变量的变大(或变小),因变量却随之变小(或变大),这种带有随机性的相关关系,我们称为负相关.例如,汽车越重,每消耗1 L 汽油所行驶的平均路程就越短.4.回归直线方程(1)回归直线:如果散点图中点的分布从整体上看大致在一条直线附近,就称这两个变量之间具有线性相关关系,这条直线叫做回归直线.(2)回归方程:回归直线的方程,简称回归方程. (3)回归方程的推导过程:①假设已经得到两个具有线性相关关系的变量的一组数据(x 1,y 1),(x 2,y 2),…,(x n ,y n ).②设所求回归方程为y ^=b ^x +a ^,其中a ^,b ^是待定参数. ③由最小二乘法得⎩⎪⎨⎪⎧b ^=∑i =1n(x i-x )(y i-y )∑i =1n (x i-x )2=∑i =1nx i y i-n x y ∑i =1n x 2i-n x 2a ^=y -b ^x其中:b ^是回归方程的斜率,a ^是截距.[小试身手]1.下列命题正确的是( ) ①任何两个变量都具有相关关系; ②圆的周长与该圆的半径具有相关关系;③某商品的需求量与该商品的价格是一种非确定性关系; ④根据散点图求得的回归直线方程可能是没有意义的;⑤两个变量间的相关关系可以通过回归直线,把非确定性问题转化为确定性问题进行研究.A .①③④B .②③④C .③④⑤D .②④⑤解析:选C ①显然不对,②是函数关系,③④⑤正确.2.对变量x ,y 有观测数据(x i ,y i )(i =1,2,…,10),得散点图图1;对变量u ,v 有观测数据(u i ,v i )(i =1,2,…,10),得散点图图2.由这两个散点图可以判断( )A .变量x 与y 正相关,u 与v 正相关B .变量x 与y 正相关,u 与v 负相关C .变量x 与y 负相关,u 与v 正相关D .变量x 与y 负相关,u 与v 负相关解析:选C 由这两个散点图可以判断,变量x 与y 负相关,u 与v 正相关. 3.若施肥量x (kg)与水稻产量y (kg)的线性回归方程为y ^=5x +250,当施肥量为80 kg 时,预计水稻产量约为________kg.解析:把x =80代入回归方程可得其预测值y ^=5×80+250=650(kg). 答案:6504.对具有线性相关关系的变量x 和y ,测得一组数据如下表所示.x 2 4 5 6 8 y3040605070若已求得它们回归直线的方程为______________________.解析:由题意可知x =2+4+5+6+85=5,y =30+40+60+50+705=50.即样本中心为(5,50).设回归直线方程为y ^=6.5x +a ^, ∵回归直线过样本中心(x ,y ), ∴50=6.5×5+a ^,即a ^=17.5, ∴回归直线方程为y ^=6.5x +17.5 答案:y ^=6.5x +17.5相关关系的判断①正方形的边长与面积之间的关系;②农作物的产量与施肥量之间的关系;③出租车费与行驶的里程;④降雪量与交通事故的发生率之间的关系.(2)某个男孩的年龄与身高的统计数据如下表所示.年龄x(岁)12345 6身高y(cm)788798108115120①画出散点图;②判断y与x是否具有线性相关关系.[解析](1)在①中,正方形的边长与面积之间的关系是函数关系;在②中,农作物的产量与施肥量之间不具有严格的函数关系,但具有相关关系;③为确定的函数关系;在④中,降雪量与交通事故的发生率之间具有相关关系.答案:②④(2)解:①散点图如图所示.②由图知,所有数据点接近一条直线排列,因此,认为y与x具有线性相关关系.两个变量是否相关的两种判断方法(1)根据实际经验:借助积累的经验进行分析判断.(2)利用散点图:通过散点图,观察它们的分布是否存在一定的规律,直观地进行判断.[活学活用]如图所示的两个变量不具有相关关系的是________(填序号).解析:①是确定的函数关系;②中的点大都分布在一条曲线周围;③中的点大都分布在一条直线周围;④中点的分布没有任何规律可言,x ,y 不具有相关关系.答案:①④[典例] (1)已知变量x 与y 正相关,且由观测数据算得样本平均数x =3,y =3.5,则由该观测数据算得的线性回归方程可能是( )A.y ^=0.4x +2.3 B.y ^=2x -2.4 C.y ^=-2x +9.5D.y ^=-0.3x +4.4(2)一台机器按不同的转速生产出来的某机械零件有一些会有缺点,每小时生产有缺点的零件的多少随机器的运转的速度的变化而变化,下表为抽样试验的结果:转速x (转/秒)16 14 12 8 每小时生产有缺点的零件数y (件)11985②如果y 对x 有线性相关关系,请画出一条直线近似地表示这种线性关系; ③在实际生产中,若它们的近似方程为y =5170x -67,允许每小时生产的产品中有缺点的零件最多为10件,那么机器的运转速度应控制在什么范围内?[解析] (1)依题意知,相应的回归直线的斜率应为正,排除C 、D.且直线必过点(3,3.5),代入A 、B 得A 正确.答案:A(2)解:①散点图如图所示:②近似直线如图所示:③由y ≤10得5170x -67≤10,解得x ≤14.9,所以机器的运转速度应控制在14转/秒内.求回归直线方程的步骤(1)收集样本数据,设为(x i ,y i )(i =1,2,…,n )(数据一般由题目给出). (2)作出散点图,确定x ,y 具有线性相关关系. (3)把数据制成表格x i ,y i ,x 2i ,x i y i . (4)计算x ,y,∑i =1nx 2i ,∑i =1nx i y i . (5)代入公式计算b ^,a ^,公式为⎩⎪⎨⎪⎧b ^=∑i =1n x i y i -n x y∑i =1n x 2i-n x2,a ^=y -b ^x .(6)写出回归直线方程y ^=b ^x +a ^. [活学活用]已知变量x ,y 有如下对应数据:x 1 2 3 4 y1345(1)作出散点图;(2)用最小二乘法求关于x ,y 的回归直线方程. 解:(1)散点图如图所示.(2)x =1+2+3+44=52,y =1+3+4+54=134, ∑i =14x i y i =1+6+12+20=39.∑i =14x 2i =1+4+9+16=30,b ^=39-4×52×13430-4×⎝⎛⎭⎫522=1310,a ^=134-1310×52=0,所以y ^=1310x 为所求的回归直线方程.利用线性回归方程对总体进行估计[典例] 下表提供了某厂节能降耗技术改造后生产甲产品过程中记录的产量x (吨)与相应的生产能耗y (吨标准煤)的几组对照数据:x 3 4 5 6 y2.5344.5(1)请画出上表数据的散点图;(2)请根据上表提供的数据,求出y 关于x 的回归直线方程y ^=b ^x +a ^;(3)已知该厂技改前100吨甲产品的生产能耗为90吨标准煤.试根据(2)求出的回归直线方程,预测生产100吨甲产品的生产能耗比技改前降低了多少吨标准煤?[解] (1)散点图如图:(2)x =3+4+5+64=4.5,y =2.5+3+4+4.54=3.5,∑i =14x i y i =3×2.5+4×3+5×4+6×4.5=66.5,∑i =14x 2i =32+42+52+62=86, 所以b ^=∑i =14x i y i -4x y ∑i =14x 2i -4x2=66.5-4×4.5×3.586-4×4.52=0.7,a ^=y -b ^x =3.5-0.7×4.5=0.35. 所以所求的线性回归方程为y ^=0.7x +0.35.(3)当x =100时,y ^=0.7×100+0.35=70.35(吨标准煤),90-70.35=19.65(吨标准煤).即生产100吨甲产品的生产能耗比技改前降低了19.65吨标准煤.只有当两个变量之间存在线性相关关系时,才能用回归直线方程对总体进行估计和预测.否则,如果两个变量之间不存在线性相关关系,即使由样本数据求出回归直线方程,用其估计和预测结果也是不可信的.[活学活用](重庆高考)随着我国经济的发展,居民的储蓄存款逐年增长.设某地区城乡居民人民币储蓄存款(年底余额)如下表:年份 2010 2011 2012 2013 2014 时间代号t 1 2 3 4 5 储蓄存款y (千亿元)567810(1)求y 关于t 的回归方程y ^=b ^t +a ^;(2)用所求回归方程预测该地区2015年(t =6)的人民币储蓄存款. 解:(1)列表计算如下:i t i y i t 2i t i y i 1 2 3 4 51 2 3 4 55 6 7 8 101 4 9 16 255 12 21 32 50这里n =5,t -=1n ∑i =1n t i =155=3,y -=1n ∑i =1ny i =365=7.2.∑i =1nt 2i -n t -2=55-5×32=10,∑i =1nt i y i -n t -y -=120-5×3×7.2=12,从而b ^=1210=1.2,a ^=y --b ^t -=7.2-1.2×3=3.6,故所求回归方程为y ^=1.2t +3.6.(2)将t =6代入回归方程可预测该地区2015年的人民币储蓄存款为y ^=1.2×6+3.6=10.8(千亿元).[层级一 学业水平达标]1.下列变量具有相关关系的是( ) A .人的体重与视力B .圆心角的大小与所对的圆弧长C .收入水平与购买能力D .人的年龄与体重解析:选C B 为确定性关系;A ,D 不具有相关关系,故选C. 2.已知变量x ,y 之间具有线性相关关系,其散点图如图所示,则其回归方程可能为A.y ^=1.5x +2 B.y ^=-1.5x +2 C.y ^=1.5x -2 D.y ^=-1.5x -2解析:选B 设回归方程为y ^=b ^x +a ^,由散点图可知变量x ,y 之间负相关,回归直线在y 轴上的截距为正数,所以b ^<0,a ^>0,因此方程可能为y ^=-1.5x +2.3.设(x 1,y 1),(x 2,y 2),…,(x n ,y n )是变量x 和y 的n 个样本点,直线l 是由这些样本点通过最小二乘法得到的线性回归直线如图所示,则以下结论正确的是( )A .直线l 过点(x ,y )B .回归直线必通过散点图中的多个点C .直线l 的斜率必在(0,1)D .当n 为偶数时,分布在l 两侧的样本点的个数一定相同解析:选A A 是正确的;回归直线可以不经过散点图中的任何点,故B 错误;回归直线的斜率不确定,故C 错误;分布在l 两侧的样本点的个数不一定相同,故D 错误.4.对有线性相关关系的两个变量建立的回归直线方程y ^=a ^+b ^x 中,回归系数b ^( ) A .不能小于0 B .不能大于0 C .不能等于0D .只能小于0解析:选C 当b ^=0时,r =0,这时不具有线性相关关系,但b ^能大于0,也能小于0. 5.2016年元旦前夕,某市统计局统计了该市2015年10户家庭的年收入和年饮食支出的统计资料如下表:(2)若某家庭年收入为9万元,预测其年饮食支出. (参考数据:∑i =110x i y i =117.7,∑i =110x 2i =406)解:依题意可计算得:x =6,y =1.83,x 2=36,x y =10.98, 又∵∑i =110x i y i =117.7,∑i =110x 2i =406,∴b ^=∑i =110x i y i -10x y∑i =110x 2i -10x2≈0.17,a ^=y -b ^x =0.81,∴y ^=0.17x +0.81. ∴所求的回归方程为y ^=0.17x +0.81.(2)当x =9时,y ^=0.17×9+0.81=2.34(万元).可估计年收入为9万元的家庭每年饮食支出约为2.34万元.[层级二 应试能力达标]1.一个口袋中有大小不等的红、黄、蓝三种颜色的小球若干个(大于5个),从中取5次,那么取出红球的次数和口袋中红球的数量是( )A .确定性关系B .相关关系C .函数关系D .无任何关系解析:选B 每次从袋中取球取出的球是不是红球,除了和红球的个数有关外,还与球的大小等有关系,所以取出红球的次数和口袋中红球的数量是一种相关关系.2.农民工月工资y (元)依劳动生产率x (千元)变化的回归直线方程为y ^=50+80x ,下列判断正确的是( )A .劳动生产率为1 000元时,工资为130元B .劳动生产率提高1 000元时,工资水平提高80元C .劳动生产率提高1 000元时,工资水平提高130元D .当月工资为210元时,劳动生产率为2 000元解析:选B 由回归直线方程y ^=50+80x 知,x 每增加1,y 增加80,但要注意x 的单位是千元,y 的单位是元.3.为了解儿子身高与其父亲身高的关系,随机抽取5对父子身高数据如下:父亲身高x (cm) 174 176 176 176 178 儿子身高y (cm)175175176177177则y 对x 的线性回归方程为( ) A .y =x -1 B .y =x +1 C .y =88+12xD .y =176解析:选C 计算得,x =174+176+176+176+1785=176,y =175+175+176+177+1775=176,根据回归直线经过样本中心(x ,y )检验知,C 符合.4.已知x 与y 之间的几组数据如下表:假设根据上表数据所得线性回归直线方程为y ^=b ^x +a ^,若某同学根据上表中的前两组数据(1,0)和(2,2)求得的直线方程为y =b ′x +a ′,则以下结论正确的是( )A.b ^>b ′,a ^>a ′B.y ^>b ′,a ^<a ′C.b ^<b ′,a ^>a ′D.y ^<b ′,a ^<a ′解析:选C 由(1,0),(2,2)求b ′,a ′. b ′=2-02-1=2,a ′=0-2×1=-2.求b ^,a ^时,∑i =16x i y i =0+4+3+12+15+24=58,x =3.5,y =136, ∑i =16x 2i =1+4+9+16+25+36=91,∴b ^=58-6×3.5×13691-6×3.52=57, a ^=136-57×3.5=136-52=-13,∴b ^<b ′,a ^>a ′.5.正常情况下,年龄在18岁到38岁的人,体重y (kg)对身高x (cm)的回归方程为y ^=0.72x -58.2,张红同学(20岁)身高为178 cm ,她的体重应该在________ kg 左右.解析:用回归方程对身高为178 cm 的人的体重进行预测,当x =178时,y ^=0.72×178-58.2=69.96(kg).答案:69.966.某工厂为了对新研发的一种产品进行合理定价,将该产品按事先拟定的价格进行试销,得到如下数据:由表中数据,求得线性回归方程为y =-4x +a ,则a =________. 解析:x =4+5+6+7+8+96=132,y =92+82+80+80+78+686=80,由回归方程过样本中心点(x ,y ) 得80=-4×132+a ^.即a ^=80+4×132=106.答案:1067.对某台机器购置后的运行年限x (x =1,2,3,…)与当年利润y 的统计分析知x ,y 具备线性相关关系,回归方程为y ^=10.47-1.3x ,估计该台机器最为划算的使用年限为________年.解析:当年利润小于或等于零时应该报废该机器,当y =0时,令10.47-1.3x =0,解得x ≈8,故估计该台机器最为划算的使用年限为8年.答案:88.一项关于16艘轮船的研究中,船的吨位区间为[192,3 246](单位:吨),船员的人数5~32人,船员人数y 关于吨位x 的回归方程为y ^=9.5+0.006 2x ,(1)若两艘船的吨位相差1 000,求船员平均相差的人数; (2)估计吨位最大的船和最小的船的船员人数. 解:(1)设两艘船的吨位分别为x 1,x 2,则 y ^1-y ^2=9.5+0.006 2x 1-(9.5+0.006 2x 2) =0.006 2×1 000≈6, 即船员平均相差6人.(2)当x =192时,y ^=9.5+0.006 2×192≈11, 当x =3 246时,y ^=9.5+0.006 2×3 246≈30.即估计吨位最大和最小的船的船员数分别为30人和11人.9.某个体服装店经营某种服装在某周内所获纯利y (元)与该周每天销售这种服装的件数x (件)之间有一组数据如下表:(1)求x ,y ;(2)若纯利y 与每天销售这种服装的件数x 之间是线性相关的,求回归直线方程; (3)若该店每周至少要获纯利200元,请你预测该店每天至少要销售这种服装多少件? (提示:∑i =17x 2i =280,∑i =17y 2i =45 309,∑i =17x i y i =3 487)解:(1)x =3+4+5+6+7+8+97=6,y =66+69+73+81+89+90+917≈79.86.(2)∵b ^=3 487-7×6×79.86280-7×62≈4.75,a ^=79.86-4.75×6=51.36,∴纯利与每天销售件数x 之间的回归直线方程为y ^=51.36+4.75x . (3)当y ^=200时,200=4.75x +51.36,所以x ≈31.29.因此若该店每周至少要获纯利200元,则该店每天至少要销售这种服装32件.(时间120分钟,满分150分)一、选择题(本大题共12小题,每小题5分,共60分.在每小题给出的四个选项中,只有一项是符合题目要求的)1.下列三个抽样:①一个城市有210家某商品的代理商,其中大型代理商有20家,中型代理商有40家,小型代理商有150家,为了掌握该商品的销售情况,要从中抽取一个容量为21的样本;②在某公司的50名工人中,依次抽取工号为5,10,15,20,25,30,35,40,45,50的10名工人进行健康检查;③某市质量检查人员从一食品生产企业生产的两箱(每箱12盒)牛奶中抽取4盒进行质量检查.则应采用的抽样方法依次为( )A .简单随机抽样;分层抽样;系统抽样B .分层抽样;简单随机抽样;系统抽样C .分层抽样;系统抽样;简单随机抽样D .系统抽样;分层抽样;简单随机抽样解析:选C ①中商店的规模不同,所以应利用分层抽样;②中抽取的学号具有等距性,所以应是系统抽样;③中总体没有差异性,容量较小,样本容量也较小,所以应采用简单随机抽样.故选C.2.将某班的60名学生编号为01,02,…,60,采用系统抽样方法抽取一个容量为5的样本,且随机抽得的一个号码为04,则剩下的四个号码依次是( )A .09,14,19,24B .16,28,40,52C .10,16,22,28D .08,12,16,20解析:选B 分成5组,每组12名学生,按等间距12抽取.选项B 正确.3.某学校有教师200人,男学生1 200人,女学生1 000人.现用分层抽样的方法从全体师生中抽取一个容量为n 的样本,若女学生一共抽取了80人,则n 的值为( )A .193B .192C .191D .190解析:选B 1 000×n200+1 200+1 000=80,求得n =192.4.某商品销售量y (件)与销售价格x (元/件)负相关,则其回归方程可能是( )A.y ^=-10x +200 B.y ^=10x +200 C.y ^=-10x -200D.y ^=10x -200解析:选A 由于销售量y 与销售价格x 成负相关,故排除B ,D.又因为销售价格x >0,则C 中销售量全小于0,不符合题意,故选A.5.设有两组数据x 1,x 2,…,x n 与y 1,y 2,…,y n ,它们的平均数分别是x 和y ,则新的一组数据2x 1-3y 1+1,2x 2-3y 2+1,…,2x n -3y n +1的平均数是( )A .2x -3yB .2x -3y +1C .4x -9yD .4x -9y +1解析:选B 设z i =2x i -3y i +1(i =1,2,…,n ),则z =1n (z 1+z 2+…+z n )=2n (x 1+x 2+…+x n )-3n (y 1+y 2+…+y n )+⎝⎛⎭⎫1+1+…+1n =2x -3y +1.6.有一个容量为66的样本,数据的分组及各组的频数如下: [11.5,15.5) 2 [15.5,19.5) 4 [19.5,23.5) 9 [23.5,27.5) 18 [27.5,31.5) 11 [31.5,35.5) 12 [35.5,39.5) 7 [39.5,43.5) 3则总体中大于或等于31.5的数据所占比例约为( ) A.211 B.13 C.12D.23解析:选B 由题意知,样本的容量为66,而落在[31.5,43.5)内的样本个数为12+7+3=22,故总体中大于或等于31.5的数据约占2266=13.7.某学习小组在一次数学测验中,得100分的有1人,得95分的有1人,得90分的有2人,得85分的有4人,得80分和75分的各有1人,则该小组数学成绩的平均数、众数、中位数分别是( )A .85,85,85B .87,85,86C .87,85,85D .87,85,90解析:选C ∵得85分的人数最多为4人, ∴众数为85,中位数为85,平均数为110(100+95+90×2+85×4+80+75)=87.8.某出租汽车公司为了了解本公司司机的交通违章情况,随机调查了50名司机,得到了他们某月交通违章次数的数据,结果制成了如图所示的统计图,根据此统计图可得这50名出租车司机该月平均违章的次数为( )A .1B .1.8C .2.4D .3解析:选B5×0+20×1+10×2+10×3+5×450=1.8.9.下表是某厂1~4月份用水量情况(单位:百吨)的一组数据月份x 1 2 3 4 用水量y4.5432.5用水量y 与月份x 之间具有线性相关关系,其线性回归方程为y ^=-0.7x +a ,则a 的值为( )A .5.25B .5C .2.5D .3.5解析:选A 线性回归方程经过样本的中心点,根据数据可得样本中心点为(2.5,3.5),所以a =5.25.10.如图是在元旦晚会举办的挑战主持人大赛上,七位评委为某选手打出的分数的茎叶统计图,去掉一个最高分和一个最低分后,所剩数据的平均数和方差分别为( )A .84,4.84B .84,1.6C .85,1.2D .85,4解析:选C 去掉一个最高分95,去掉一个最低分77,平均数为80+15(5+3+6+5+6)=85,方差为15[(85-85)2+(85-83)2+(85-86)2+(85-85)2+(85-86)2]=1.2,因此选C.11.如果数据x 1,x 2,x 3,…,x n 的平均数是x ,方差是s 2,则3x 1+2,3x 2+2,…,3x n +2的平均数和方差分别是( )A.x 和s 2 B .3x 和9s 2 C .3x +2和9s 2D .3x +2和12s 2+4解析:选C 3x 1+2,3x 2+2,…,3x n +2的平均数是3x +2,由于数据x 1,x 2,…x n的方差为s2,所以3x1+2,3x2+2,…,3x n+2的方差为9s2.12.如图是某赛季甲、乙两名篮球运动员5场比赛得分的茎叶图,已知甲的成绩的极差为31,乙的成绩的平均值为24,则下列结论错误的是()A.x=9B.y=8C.乙的成绩的中位数为26D.乙的成绩的方差小于甲的成绩的方差解析:选B因为甲的成绩的极差为31,所以其最高成绩为39,所以x=9;因为乙的成绩的平均值为24,所以y=24×5-(12+25+26+31)-20=6;由茎叶图知乙的成绩的中位数为26;对比甲、乙的成绩分布发现,乙的成绩比较集中,故其方差较小.二、填空题(本大题共4小题,每小题5分,共20分)13.某人5次上班途中所花的时间(单位:分钟)分别为x,y,10,11,9.已知这组数据的平均数为10,方差为2,则|x-y|的值为________.解析:由平均数为10,得(x+y+10+11+9)×15=10,则x+y=20;又方差为2,∴[(x-10)2+(y-10)2+(10-10)2+(11-10)2+(9-10)2]×15=2,得x2+y2=208,2xy=192,∴|x-y|=(x-y)2=x2+y2-2xy=4.答案:414.一支田径队有男运动员48人,女运动员36人,若用分层抽样的方法从该队的全体运动员中抽取一个容量为21的样本,则抽取男运动员的人数为________.解析:抽取的男运动员的人数为2148+36×48=12.答案:1215.要考察某种品牌的500颗种子的发芽率,抽取60粒进行实验,利用随机数表抽取种子时,先将500颗种子按001,002,…,500进行编号,如果从随机数表第7行第8列的数3开始向右读,请你依次写出最先检测的5颗种子的编号:________,________,________,________,________.(下面摘取了随机数表第7行至第9行)84 42 17 53 3157 24 55 06 8877 04 74 47 6721 76 33 50 2583 92 12 06 7663 01 63 78 5916 95 55 67 1998 10 50 71 7512 86 73 58 0744 39 52 38 7933 21 12 34 29 78 64 56 07 82 52 42 07 44 38 15 51 00 13 42 99 66 02 79 54 解析:选出的三位数分别为331,572,455,068,877,047,447,…,其中572,877均大于500,将其去掉,剩下的前5个编号为331,455,068,047,447.答案:331 455 068 047 44716.从某小学随机抽取100名同学,将他们的身高(单位:cm)数据绘制成频率分布直方图(如下图).由图中数据可知a =________.若要从身高在[120,130),[130,140),[140,150]三组的学生中,用分层抽样的方法选取18人参加一项活动,则从身高在[140,150]的学生中选取的人数应为________.解析:∵0.005×10+0.035×10+a ×10+0.020×10+0.010×10=1, ∴a =0.030.设身高在[120,130),[130,140),[140,150]三组的学生分别有x ,y ,z 人, 则x100=0.030×10,解得x =30.同理,y =20,z =10. 故从[140,150]的学生中选取的人数为1030+20+10×18=3.答案:0.030 3三、解答题(本大题共6小题,共70分.解答应写出文字说明,证明过程或演算步骤) 17.(本小题满分10分)为调查某班学生的平均身高,从50名学生中抽取110,应如何抽样?若知道男生、女生的身高显著不同(男生30人,女生20人),应如何抽样?解:从50名学生中抽取110,即抽取5人,采用简单随机抽样法(抽签法或随机数法).若知道男生、女生的身高显著不同,则采用分层抽样法,按照男生与女生的人数比为30∶20=3∶2进行抽样,则男生抽取3人,女生抽取2人.18.(本小题满分12分)某车间共有12名工人,随机抽取6名,他们某日加工零件个数的茎叶图如图所示.(1)根据茎叶图计算样本均值;(2)日加工零件个数大于样本均值的工人为优秀工人.根据茎叶图推断该车间12名工人中有几名优秀工人?解:(1)样本均值为17+19+20+21+25+306=1326=22.(2)由(1)知样本中优秀工人所占比例为26=13,故推断该车间12名工人中有12×13=4名优秀工人.19.(本小题满分12分)2016年春节前,有超过20万名广西、四川等省籍的外出务工人员选择驾乘摩托车沿321国道长途跋涉返乡过年,为防止摩托车驾驶人员因长途疲劳驾驶,手脚僵硬影响驾驶操作而引发交通事故,肇庆市公安交警部门在321国道沿线设立了多个长途行驶摩托车驾乘人员休息站,让返乡过年的摩托车驾乘人员有一个停车休息的场所.交警小李在某休息站连续5天对进站休息的驾驶人员每隔50辆摩托车就进行一次省籍询问,询问结果如图所示:(1)交警小李对进站休息的驾驶人员的省籍询问采用的是什么抽样方法?(2)用分层抽样的方法对被询问了省籍的驾驶人员进行抽样,若广西籍的有5人,则四川籍的应抽取几人?解:(1)交警小李对进站休息的驾驶人员的省籍询问采用的是系统抽样法.(2)从题图可知,被询问了省籍的驾驶人员广西籍的有5+20+25+20+30=100(人); 四川籍的有15+10+5+5+5=40(人).设四川籍的驾驶人员应抽取x 人,依题意得5100=x 40,解得x =2,即四川籍的应抽取2人.20.(本小题满分12分)某化肥厂有甲、乙两个车间包装肥料,在自动包装传送带上每隔30分钟抽取一包产品,称其重量(单位:kg),分别记录抽查数据如下:甲:102,101,99,98,103,98,99; 乙:110,115,90,85,75,115,110. (1)这种抽样方法是哪一种方法?(2)试计算甲、乙车间产品重量的平均数与方差,并说明哪个车间产品较稳定? 解:(1)甲、乙两组数据间隔相同,所以采用的方法是系统抽样. (2)x 甲=17(102+101+99+98+103+98+99)=100,x 乙=17(110+115+90+85+75+115+110)=100,s 2甲=17(4+1+1+4+9+4+1)≈3.43,s 2乙=17(100+225+100+225+625+225+100)=228.57, ∴s 2甲<s 2乙,故甲车间产品比较稳定.21.(本小题满分12分)对某校高一年级学生参加社区服务次数进行统计,随机抽取M 名学生作为样本,得到这M 名学生参加社区服务的次数.根据此数据作出了频数与频率的统计表和频率分布直方图如下:(1)求出表中M ,p 及图中a 的值;(2)若该校高一学生有360人,试估计该校高一学生参加社区服务的次数在区间[10,15)的人数.解:(1)由分组[10,15)的频数是10, 频率是0.25知, 10M =0.25,所以M =40. 因为频数之和为40,所以10+25+m +2=40,解得m =3. 故p =340=0.075.因为a 是对应分组[15,20)的频率与组距的商, 所以a =2540×5=0.125.(2)因为该校高一学生有360人,分组[10,15)的频率是0.25,所以估计该校高一学生参加社区服务的次数在此区间内的人数为360×0.25=90.22.(本小题满分12分)从某居民区随机抽取10个家庭,获得第i 个家庭的月收入x i (单位:千元)与月储蓄y i (单位:千元)的数据资料,算得∑i =110x i =80,∑i =110y i =20,∑i =110x i y i =184,∑i =110x 2i =720.(1)求家庭的月储蓄y 对月收入x 的线性回归方程y ^=b ^x +a ^; (2)判断变量x 与y 之间是正相关还是负相关;(3)若该居民区某家庭月收入为7千元,预测该家庭的月储蓄.解:(1)由题意知n =10,x =1n ∑i =1n x i =8010=8, y =1n ∑i =1n y i =2010=2, 又∑i =110x 2i -10x 2=720-10×82=80,∑i =110x i y i -10x y =184-10×8×2=24,由此得b ^=∑i =110x i y i -10x y∑i =110x 2i -10x 2=2480=0.3, a ^=y -b ^x =2-0.3×8=-0.4,故所求回归方程为y ^=0.3x -0.4.(2)由于变量y 的值随x 的值增加而增加(b =0.3>0),故x 与y 之间是正相关.(3)将x =7代入回归方程可以预测该家庭的月储蓄为y =0.3×7-0.4=1.7千元.。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
总结: 第二种方法好,因为所有的点离这条直线最近。从整体上看,各点与此直线的距离和最小。
2、利用最小二乘法推导回归系数公式
假设我们已经得到两个具有线性相关关系的变量的一组数据: …… 。当自变量 取 ( =1,2,……,n)时,可以得到 ( =1,2,……,n),它与实际收集到的 之间的偏差是 ( =1,2,……,n),这样用n个偏差的和来刻画“各点与此直线的整体偏差”是比较合适的。总的偏差为 ,偏差有正有负,易抵消,所以采用绝对值 ,由于带绝对值计算不方便所以换成平方, 现在的问题就归结为:当 ,b取什么值时Q最小。
数学实验2:求出下列各式的值(n=14)
= = = = =
通过计算,求出了
求出回归直线方程有什么用呢表格中选取年龄x的一个值代入上述回归直线的方程,看看得出的数据与真实数值之间的关系。
估计值是 ,与实际值 有偏差,为什么会出现这样的结果回归直线是估计出的,把 带入肯定有误差。试预测某人37岁时,他体内的脂肪含量。并说明结果的含义。
法2 (题目给出不用记忆)
(这个公式需要自己记忆,稍微简单些)
(4)求常数 ,既
最后写出写出回归方程 。可以改写为: ( 不做区分)
例:已知 之间的一组数据:
0
1
2
3
1
3
5
7
求 与 的回归方程:
解:(1)先求变量 的平均值,既
(2)求变量 的平均值,既
(3)求变量 的系数 ,有两个方法
法1
法2
(4)求常数 ,既
这时我们引入一个量:相关系数
注意它的符号:当 时,x,y正相关,当 时,x,y负相关,统计学认为:
对于r,若 ,那么负相关很强,若 ,那么正相关很强,
若 ,那么相关性一般,
若 ,那么相关性较弱,
不同的相关性可以从散点图上直观地反应出来,观察这几幅散点图,判断图中的两个变----量的相关关系的强弱。图1、2正线性相关,图1中的点密集,相关性比图2好。利用相关系数也可以看出相关性,图1中r=接近1,图2中r=,所以可以总结出相关系数的绝对值越大,线性相关关系就越强。
摄氏温度/℃
-5
0
4
7
12
15
19
23
27
31
36
热饮杯数
156
150
132
128
130
116
104
89
93
76
54
(1)画出散点图
(2)从散点图中发现气温与热饮销售杯数之间关系的一般规律
(3)求回归方程
(4)如果某天的气温是2℃,预测这天卖出的热饮杯数
数学实验3:求出下列各式的值(n=11)
= = = = =
(三)、循序渐进、延伸拓展
1、找回归直线
师:下面我们再来看一下年龄与脂肪的散点图,
从整体上看,它们是线性相关的。如果可以求出回归直线的方程,我们就可以清楚地了解年龄与体内脂肪含量的相关性。这条直线可以作为两个变量具有线性相关关系的代表。能否画出这条直线
数学实验1:画出回归直线学生方Leabharlann 一 学生方案二第一种 第二种
年龄
23
27
39
41
45
49
50
53
54
56
57
58
60
61
脂肪
结论:随着年龄增长,脂肪含量在增加。用x轴表示年龄,y轴表示脂肪。一组样本数据就对应着一个点。
年龄
脂肪
23
27
39
41
45
49
50
53
54
56
57
58
60
61
散点图
这个图跟我们所学过的函数图象有区别,它叫作散点图。
2、判断正、负相关、线性相关:
(五)、归纳总结,内化知识
回归直线方程的求法:
①先判断变量是否线性相关
②若线性相关,利用公式计算出 、b
③利用回归方程对生活实际问题进行分析与预测
高考统计部分线性回归方程具体如何应用
线性回归方程为 的求法:
(1)先求变量 的平均值,既
(2)求变量 的平均值,既
(3)求变量 的系数 ,有两个方法
法1 (题目给出不用记忆) (需理解并会代入数据)
(二)、初步探索,直观感知
1、根据样本数据作出散点图,直观感知变量之间的相关关系。在研究相关关系前,先回忆一下函数的表示方法有哪些——列表,画图象,求解析式。下面我们就用这些方法来研究相关关系。看这样一组数据:在一次对人体脂肪含量和年龄关系的研究中,研究人员获得了一组样本数据,根据样本数据,人体的脂肪含量与年龄之间有怎样的关系
将上式展开、再合并,就可以得到可以求出Q取最小值时
(其中 , )
推导过程用到偏差的平方,由于平方又叫二乘方,所以这种使“偏差的和”最小的方法叫 “最小二乘法”。
3、求出回归直线方程,并分析它的意义
利用最小二乘法就可以求出回归系数,进一步求出回归方程。下面我们具体操作一下。 我们先明确几个符号的含义: 表示年龄, 是23, 是27,直到 是61。 从1到14, 表示脂肪, 是, 是 。 表示年龄与脂肪的成绩, 表示 年龄的平方
年龄
脂肪
23
529
27
729
39
1521
41
1681
45
2025
49
2401
50
1410
2500
53
2809
54
2916
56
3136
57
3249
58
1943
3364
60
2112
3600
61
3721
34181
表示自变量年龄的平均数, 表示因变量脂肪的平均数, 表示自变量的平方和, 表示自变量与因变量乘积的和。要求出 a,b,必须先求出这些量。
3、情感、态度与价值观:类比函数的表示方法,使学生理解变量间的相关关系,增强应用回归直线方程对实际问题进行分析和预测的意识。
三、教学重点、难点
重点:利用散点图直观认识两个变量之间的线性相关关系,了解最小二乘法的思想并利用此思想求出回归方程。
难点:对最小二乘法的数学思想和回归方程的理解,教学实施过程中的难点是根据给出的线性回归方程的系数公式建立线性回归方程。
变量间的相关关系教案
变量间的相关关系
一、教材分析
学生情况分析:学生已经具备了对样本数据进行初步分析的能力,且掌握了一定的计算基础。
教材地位和作用:变量间的相关关系是高中新教材人教A版必修3第二章节的内容,本节课主要探讨如何利用线性回归思想对实际问题进行分析与预测。为以后更好地研究选修2-3第三章节回归分析思想的应用奠定基础。
请观察这4幅图,看有什么特点
图1呈上升趋势,图2呈下降趋势。这就像函数中的增函数和减函数。即一个变量从小到大,另一个变量也从小到大,或从大到小。对于图1中的两个变量的相关关系,我们称它为正相关。图2中的两个变量的相关关系,称为负相关。
后面两个图很乱,前面两个图中点的分布呈条状。从数学的角度来解释:即图1、2中的点的分布从整体上看大致在一条直线附近。我们称图1、2中的两个变量具有线性相关关系。这条直线叫做回归直线。图3、4中的两个变量是非线性相关关系
四、教学设计)
(一)、创设情境导入新课
1、相关关系的理解
我们曾经研究过两个变量之间的函数关系:一个自变量对应着唯一的一个函数值,这两者之间是一种确定关系。生活中的任何两个变量之间是不是只有确定关系呢 如:学生成绩与教师水平之间存在着某种联系,但又不是必然联系,对于学生成绩与教师水平之间的这种不确定关系,我们称之为相关关系。这就是我们这节课要共同探讨的内容————变量间的相关关系。 生活中还有很多描述相关关系的成语,如:“虎父无犬子”,“瑞雪兆丰年”。通过学生熟悉的函数关系,引导学生关注生活中两个变量之间还存在的相关关系。让学生体会研究变量之间相关关系的重要性。感受数学来源于生活。
代入计算
我们不能说他的体内脂肪含量的百分比一定是%只能说他体内的脂肪含量在%,附近的可能性比较大。
(四)、线性回归分析思想在实际中的应用
总结:我们利用回归直线对年龄与脂肪的关系做了上述分析,这种分析方法叫做线性回归分析。利用这种分析方法可以对生活中的很多问题进行分析与预测。
例2有一个同学家开了一个小卖部,他为了研究气温对销售热饮的影响,经过统计,得到一个卖出的热饮杯数与当天气温的对比表:
最后写出写出回归方程
数学实验
1、画出回归直线
2、求出下列各式的值
= =
= =
=
(五)利用相关系数判断线性相关程度
利用最小二乘法求出回归直线的方程后,可以对上面两个变量的关系进行分析与预测。是不是所有的相关关系都可以求出回归直线的方程请大家观察这4幅图
结论:前两个是线性相关,可以求回归方程,后两个是非线性相关,直线不能很好地反映图中两个变量之间的关系。显然求回归直线的方程是没有意义的。有些变量线性相关,有些非线性相关,怎样衡量变量的线性相关程度呢
二、教学目标
1、知识与技能:利用散点图判断线性相关关系,了解最小二乘法的思想及线性回归方程系数公式的推导过程,求出回归直线的方程并对实际问题进行分析和预测,通过实例加强对回归直线方程含义的理解。
2、过程与方法:
①通过自主探究体会数形结合、类比、及最小二乘法的数学思想方法。②通过动手操作培养学生观察、分析、比较和归纳能力。