2018年陕西省高三数学第1章《统计案例》导学案:1.1.3可线性化的回归分析习题
2018年高中数学第1章统计案例1.2回归分析学案苏教版选修1_2
回归分析.线性回归模型()线性回归模型=++ε,其中+是确定性函数,ε称为随机误差.()随机误差产生的原因主要有以下几种:①所用的确定性函数不恰当引起误差;②忽略了某种因素的影响;③存在观测误差.()在线性回归方程=+中=错误!=错误!,=-(其中=,=).其中,,分别为,的估计值,称为回归截距,称为回归系数,称为回归值..相关系数()计算两个随机变量间线性相关系数的公式)-(,\(-))))-(,\(-)))=()具有如下性质:①≤;②越接近于,,的线性相关程度越强;③越接近于,,的线性相关程度越弱..对相关系数进行显著性检验的基本步骤()提出统计假设:变量,不具有线性相关关系;()如果以的把握作出判断,那么可以根据-=与-在教材附录中查出一个的临界值(其中-=称为检验水平);()计算样本相关系数;()作出统计推断:若>,则否定,表明有的把握认为与之间具有线性相关关系;若≤,则没有理由拒绝原来的假设,即就目前数据而言,没有充分理由认为与之间有线性相关关系.我们把相关关系(不确定性关系)转化为函数关系(确定性关系),当两个具有相关关系的变量近似地满足一次函数关系时,我们所求出的函数关系式=+就是回归直线方程.求回归直线方程的一般方法是借助于工作软件求出回归直线方程,也可以利用计算器计算出,再由=-求出,写出回归直线方程=+.计算时应注意:()求时,利用公式=-)),\(=)\()-(,\(-))),先求出=(++…+),=(++…+),=++…+,=++…+.再由=-求出的值,并写出回归直线方程.()线性回归方程中的截距和斜率都是通过样本估计而来的,存在着误差,这种误差可能导致估计结果的偏差.()回归直线方程=+中的表示增加个单位时,的变化量为,而表示不随的变化而变化的部分.()可以利用回归直线方程=+求在取某一个值时的估计值.[例] 假设关于某设备的使用年限(年)和所支出的维修费用(万元)有如下的统计资料:若由数据可知,对呈线性相关关系.()求线性回归方程;()估计使用年限为年时,维修费用是多少?[思路点拨] 由于题目条件已经指明对呈线性相关关系,所以可直接利用公式求与,然后求出线性回归方程,最后把代入,估计维修费用.[精解详析] ()列表如下:。
2017_2018学年高中数学第一章统计案例1.1回归分析的基本思想及其初步应用学案含解析新人教A版
1.1 回归分析的基本思想及其初步应用线性回归模型[提出问题]问题 1:由《数学必修 3》的知识可知,相关关系中自变量和因变量的关系是确定的吗? 提示:不是.问题 2:利用线性回归方程求出的函数值一定是真实值吗? 提示:不一定. [导入新知] 1.回归分析(1)函数关系是一种确定性关系,而相关关系是一种非确定性关系,即自变量取值一定时, 因变量的取值带有一定的随机性的两个变量之间的关系叫做相关关系.(2)由《数学必修 3》的知识可知,回归分析是对具有线性相关关系的两个变量进行统计 分析的一种常用方法,回归分析的基本步骤是画出两个变量的散点图,求回归直线方程,并用 回归直线方程进行预报.2.线性回归模型(1)线性回归模型 y =bx +a +e ,其中 a 和b 是模型的未知参数,e 称为随机误差.自变量x 称为解释变量,因变量 y 称为预报变量.^ ^ ^(2)在回归方程 y = bx + a 中,^b----nn∑i=1x i - x y i - y∑i =1x i y i -n x y==,--nn∑i=1x i - x2∑i =1x 2i -n x 2^ a - ^-= y - b x .nn- 1 - 1 - -∑∑其中 x =x i , y = y i, (x , y )称为样本点的中心. n ni =1i =1[化解疑难]对线性回归方程的理解^ ^ ^ - - - -(1)回归直线方程 y = bx + a 一定经过点(x , y ).我们把(x , y )称为样本点的中心, 因此,回归直线必过样本点的中心.^ ^ ^ ^ ^(2)线性回归方程 y = bx + a 中的截距 a 和斜率 b 都是通过估计而得来的,存在着误差,这种误差可能导致预测结果的偏差.1^ ^(3)当b>0时,变量y与x具有正的线性相关关系;当b<0时,变量y与x具有负的线性相关关系.线性回归分析[提出问题]问题1:利用什么方法判断所建立的线性模型的拟合效果?提示:利用残差.问题2:由散点图知,残差有正、负,如何更好地判断拟合效果?n^∑提示:利用残差平方和,即(y i-y i)2越小,R2越大,拟合效果越好.i=1[导入新知]1.残差分析(1)残差^ ^ ^ ^ ^ 样本点(x n,y n)的随机误差e i=y i-bx i-a,其估计值为e i=y i-y i=y i-b x i-a,e i称为相应于点(x i,y i)的残差(residual).(以上i=1,2,…,n)(2)残差图作图时,纵坐标为残差,横坐标可以选为样本编号,或x i数据,或y i数据,这样作出的图形称为残差图.(3)残差分析残差分析即通过残差发现原始数据中的可疑数据,判断所建立模型的拟合效果,其步骤为:计算残差——画残差图——在残差图中分析残差特性.残差点比较均匀地落在水平的带状区域中,说明选用的模型比较合适,这样的带状区域的宽度越窄,说明模型拟合精度越高,回归方程的预报精度越高.2.相关指数我们可以用相关指数R2来刻画回归的效果,其计算公式是:^i2n∑i=1y i-yR2=1-.-n∑i=1y i-y2n n^∑∑R2越大,残差平方和(y i-y i)2越小,即模型的拟合效果越好;R2越小,残差平方和i=1 i=1 ^(y i-y i)2越大,即模型的拟合效果越差.在线性回归模型中,R2的取值范围为[0,1],R2表示解释变量对于预报变量变化的贡献率,1-R2表示随机误差对于预报变量变化的贡献率.R2越接近于1,表示回归的效果越好.2[化解疑难]残差分析的注意点在残差图中,可疑数据的特征表现为:(1)个别样本点的残差过大,即大多数的残差点比较均匀地落在水平的带状区域中,而个别残差点偏离该区域过于明显,需要确认在采集这些样本点的过程中是否有人为的错误.如果采集数据有错误,那么需要纠正,然后重新利用线性回归模型拟合数据;如果数据采集没有错误,那么需要寻找其他原因.(2)残差图有异常,即残差呈现不随机的规律性,此时需要考虑所采用的线性回归模型是否合适.线性回归分析[例1]某研究机构对高三学生的记忆力x和判断力y进行统计分析,得下表数据:x 6 8 10 12y 2 3 5 6(1)请画出上表数据的散点图(要求:点要描粗);^ ^ ^(2)请根据上表提供的数据,用最小二乘法求出y关于x的线性回归方程y=bx+a;(3)试根据求出的线性回归方程,预测记忆力为14的同学的判断力.[解](1)散点图如图所示:-6+8+10+12 -2+3+5+6(2)x==9,y==4,4 44-∑(x i-)2=9+1+1+9=20,xi=14--∑(x i-x)(y i-y)=(-3)×(-2)+(-1)×(-1)+1×1+3×2=14,i=13^ b--4∑i=1x i-xy i-y14===0.7,-204∑i=1x i-x2^ a-^-=y-b x=4-0.7×9=-2.3,^故线性回归方程为y=0.7x-2.3.(3)由(2)中线性回归方程知,当x=14时,^y =0.7×14-2.3=7.5,预测记忆力为14的同学的判断力约为7.5.[类题通法]求线性回归方程的步骤(1)列表表示x i,y i;n n-----∑∑(2)计算x,,(x i-)(y i-),(x i-)2;y x y xi=1 i=1^ ^(3)代入公式计算a,b的值;(4)写出回归直线方程.[活学活用]某公司利润y(单位:千万元)与销售总额x(单位:千万元)之间有如下对应数据:x 10 15 17 20 25 28 32y 1 1.3 1.8 2 2.6 2.7 3.3(1)画出散点图;(2)求回归直线方程;(3)估计销售总额为24千万元时的利润.解:(1)散点图如图:(2)列下表,并利用科学计算器进行有关计算.i 1 2 3 4 5 6 7x i 10 15 17 20 25 28 32y i 1 1.3 1.8 2 2.6 2.7 3.34x=21,y=2.17 7∑∑x2i=3 447,x i y i=346.3i=1 i=1^ 346.3-7 × 21 × 2.1于是b=≈0.104.3 447-7 × 212^a =2.1-0.104×21=-0.084,^因此回归直线方程为y=0.104x-0.084.(3)当x=24时,y=0.104×24-0.084=2.412(千万元).残差分析[例2]某车间为了规定工时定额,需要确定加工零件所花费的时间,为此进行了10次试验,测得的数据如下:编号 1 2 3 4 5 6 7 8 9 10 零件数x/个10 20 30 40 50 60 70 80 90 100 加工时间y/分62 68 75 81 89 95 102 108 115 122(1)建立零件数为解释变量,加工时间为预报变量的回归模型,并计算残差;(2)你认为这个模型能较好地刻画零件数和加工时间的关系吗?[解](1)根据表中数据画出散点图,如图所示.由图可看出,这些点在一条直线附近,可以用线性回归模型来拟合数据.计算得加工时间^对零件数的线性回归方程为y=0.668x+54.93.残差数据如下表:编号 1 2 3 4 5^残差e 0.39 -0.29 0.03 -0.65 0.67编号 6 7 8 9 105^残差e -0.01 0.31 -0.37 -0.05 0.27(2)以零件数为横坐标,残差为纵坐标画出残差图如图所示.由图可知,残差点分布较均匀,即用上述回归模型拟合数据效果很好.但需注意,由残差图可以看出,第4个样本点和第5个样本点的残差比较大,需要确认在采集这两个样本点的过程中是否有人为的错误.[类题通法]残差分析应注意的问题利用残差分析研究两个变量间的关系时,首先要根据散点图来粗略判断它们是否线性相关,^ ^是否可以用线性回归模型来拟合数据.然后通过图形来分析残差特性,用残差e1,e2,…,^e n来判断原始数据中是否存在可疑数据,用R2来刻画模型拟合的效果.[活学活用]已知某种商品的价格x(元)与需求量y(件)之间的关系有如下几组数据:x 14 16 18 20 22y 12 10 7 5 3求y关于x的回归直线方程,并说明回归模型拟合效果的好坏.- 1解:x=×(14+16+18+20+22)=18,5- 1y=×(12+10+7+5+3)=7.4,55∑x2i=142+162+182+202+222=1 660,i=15∑x i y i=14×12+16×10+18×7+20×5+22×3=620,i=1--5∑i=1x i y i-5xy^所以b=-5∑i=1x2i-5x26620-5 × 18 × 7.4==-1.15,1 660-5 × 182^a =7.4+1.15×18=28.1,所以所求回归直线方程是^y =-1.15x+28.1.列出残差表:0 0.3 -0.4 -0.1 0.2^y i-y i-4.6 2.6 -0.4 -2.4 -4.4y i-y5^∑所以(y i-i)2=0.3,yi=15-∑(y i-)2=53.2,yi=1^i25∑i=1y i-yR2=1-≈0.994,-5∑i=1y i-y2所以回归模型的拟合效果很好.非线性回归分析[例3]在一次抽样调查中测得样本的5个样本点,数值如下表:x 0.25 0.5 1 2 4y 16 12 5 2 1试建立y与x之间的回归方程.[解]作出变量y与x之间的散点图如图所示.由图可知变量y与x近似地呈反比例函数关系.k 1设y=,令t=,则y=kt.x x7由 y 与 x 的数据表可得 y 与 t 的数据表:t 4 2 1 0.5 0.25 y1612521作出 y 与 t 的散点图如图所示.由图可知 y 与 t 近似地呈线性相关关系.55- -∑∑又 t =1.55, =7.2,i y i =94.25,t 2i =21.312 5, yti =1i =1^b=--5∑i =1t i y i -5t y-5∑i =1t 2i -5t 294.25-5 × 1.55 × 7.2= ≈4.134 4, 21.312 5-5 × 1.552^ a - ^-= y - b t =7.2-4.134 4×1.55≈0.8, ^∴ y =4.134 4t +0.8.^ 4.134 4所以 y 与 x 之间的回归方程是 y = +0.8.x[类题通法]非线性回归分析的步骤非线性回归问题有时并不给出经验公式.这时我们可以画出已知数据的散点图,把它与学 过的各种函数(幂函数、指数函数、对数函数等)图象作比较,挑选一种跟这些散点拟合得最好 的函数,然后采用适当的变量变换,把问题化为线性回归分析问题,使之得到解决.其一般步 骤为:8[活学活用]为了研究某种细菌随时间x变化繁殖个数y的变化,收集数据如下时间x/天 1 2 3 4 5 6繁殖个数y 6 12 25 49 95 190(1)用时间作解释变量,繁殖个数作预报变量作出这些数据的散点图;(2)求y与x之间的回归方程.解:(1)散点图如图所示:(2)由散点图看出样本点分布在一条指数函数y1=c1e c2x(c1>0)的周围,则ln y=ln c1+c2x,于是令z=ln y,则x 1 2 3 4 5 6z 1.79 2.48 3.22 3.89 4.55 5.25画出相应的散点图(图略),可知变换后的样本点分布在一条直线附近,因此可用线性回归^ ^方程来拟合,由表中数据得到线性回归方程为z=0.69x+1.115,则有y=e0.69x+1.115.1.错误理解残差的概念而致误[典例]某种产品的广告费支出x(单元:万元)与销售额y(单位:万元)之间有下表关系:x 2 4 5 6 8y 30 40 60 50 70^y与x的线性回归方程为y=6.5x+17.5,当广告费支出5万元时,随机误差的效应(残差)为()A.10B.209C.30 D.40^ ^ [解析]因为y与x的线性回归方程为y=6.5x+17.5,当x=5时,y=50,当广告费支出5万元时,由表格得y=60,故随机误差的效应(残差)为60-50=10.[答案] A[易错防范]^ ^ ^ ^ ^1.对残差e i不理解,误认为e i=y i-y i=b x i-a-y i,i=1,2,…,n.2.残差平方和越小,说明模型的拟合效果就越好.[成功破障]^已知方程y=0.85x-82.71是根据女大学生的身高预报她的体重的回归方程,其中x的^单位是cm,y的单位是kg,那么针对某个体(160,53)的残差是________.^ ^解析:把x=160代入y=0.85x-82.71,得y=0.85×160-82.71=53.29,所以残差^ e^=y-y=53-53.29=-0.29.答案:-0.29[随堂即时演练]1.(湖北高考)四名同学根据各自的样本数据研究变量x,y之间的相关关系,并求得回归直线方程,分别得到以下四个结论:^①y与x负相关且y=2.347x-6.423;^②y与x负相关且y=-3.476x+5.648;^③y与x正相关且y=5.437x+8.493;^④y与x正相关且y=-4.326x-4.578.其中一定不正确的结论的序号是()A.①②B.②③C.③④D.①④解析:选D①中y与x负相关而斜率为正,不正确;④中y与x正相关而斜率为负,不正确.2.关于回归分析,下列说法错误的是()A.在回归分析中,变量间的关系若是非确定性关系,那么因变量不能由自变量唯一确定10B.线性相关系数可以是正的也可以是负的C.在回归分析中,如果r2=1或r=±1,说明x与y之间完全线性相关D.样本相关系数r∈(-1,1)解析:选D样本的相关系数应满足-1≤r≤1.3.在研究气温和热茶销售杯数的关系时,若求得相关指数R2≈0.85,则表明气温解释了________的热茶销售杯数变化,而随机误差贡献了剩余的________,所以气温对热茶销售杯数的效应比随机误差的效应大得多.解析:由相关指数R2的意义可知,R2≈0.85表明气温解释了85%,而随机误差贡献了剩余的15%.答案:85%15%4.某医院用光电比色计检验尿汞时,得尿汞含量(mg/L)与消光系数计数的结果如下:尿汞含量x 2 4 6 8 10消光系数y 64 138 205 285 360若y与x具有线性相关关系,则回归直线方程是______________________________.5--∑解析:由已知表格中的数据,利用科学计算器进行计算得x=6,y=210.4,x2i=i=1 220,5∑x i y i=7 790,i=1--5∑i=1x i y i-5x y^所以b==36.95,-5∑i=1x2i-5x2^ a-^-=y-b x=-11.3.^所以回归直线方程为y=-11.3+36.95x.^答案:y=-11.3+36.95x5.某工厂为了对新研究的一种产品进行合理定价,将该产品按事先拟定的价格进行试销,得到如下数据:单价x/元8 8.2 8.4 8.6 8.8 9销量y/件90 84 83 80 75 68^ ^ ^ ^ ^ -^-(1)求回归直线方程y=bx+a,其中b=-20,a=y-b x;11(2)预计在今后的销售中,销量与单价仍然服从(1)中的关系,且该产品的成本是4元/件,为使工厂获得最大利润,该产品的单价应定为多少元?(利润=销售收入-成本)- 1解:(1)x=×(8+8.2+8.4+8.6+8.8+9)=8.5,6- 1y=×(90+84+83+80+75+68)=80,6^ --从而a=y+20x=80+20×8.5=250,^故y=-20x+250.(2)由题意知,工厂获得利润z=(x-4)y=-20x2+330x-1 00033(x-4)2+361.25,=-2033所以当x==8.25时,4z max=361.25(元).即当该产品的单价定为8.25元时,工厂获得最大利润.[课时达标检测]一、选择题--1.(重庆高考)已知变量x与y正相关,且由观测数据算得样本平均数x=3,y=3.5,则由该观测数据算得的线性回归方程可能为()^ ^A.y=0.4x+2.3B.y=2x-2.4^ ^C.y=-2x+9.5D.y=-0.3x+4.4解析:选A依题意知,相应的回归直线的斜率应为正,排除C、D.且直线必过点(3,3.5),代入A、B得A正确.2.甲、乙、丙、丁四位同学在建立变量x,y的回归模型时,分别选择了4种不同模型,计算可得它们的相关指数R2分别如下表:甲乙丙丁R2 0.98 0.78 0.50 0.85建立的回归模型拟合效果最好的同学是()A.甲B.乙C.丙D.丁解析:选A相关指数R2越大,表示回归模型拟合效果越好.123.设某大学的女生体重y(单位:kg)与身高x(单位:cm)具有线性相关关系.根据一组样^本数据(x i,y i)(i=1,2,…,n),用最小二乘法建立的回归方程为y=0.85x-85.71.则下列结论中不正确的是()A.y与x具有正的线性相关关系--B.回归直线过样本点的中心(x,y)C.若该大学某女生身高增加1 cm,则其体重约增加0.85 kgD.若该大学某女生身高为170 cm,则可断定其体重必为58.79 kg解析:选D回归方程中x的系数为0.85>0,因此y与x具有正的线性相关关系,A正确;--由回归方程系数的意义可知回归直线过样本点的中心(x,y),B正确;^ ^依据回归方程中b的含义可知,x每变化1个单位,y相应变化约0.85个单位,C正确;用回归方程对总体进行估计不能得到肯定结论,故D不正确.4.甲、乙、丙、丁4位同学各自对A,B两变量做回归分析,分别得到散点图与残差平方n^∑和(y i-i)2,如下表:yi=1甲乙丙丁散点图残差平方和115 106 124 103哪位同学的试验结果体现拟合A,B两变量关系的模型拟合精度高?()A.甲B.乙C.丙D.丁解析:选D从题中的散点图上来看,丁同学的散点图中的点更加近似在一条直线附近;从残差平方和来看,丁同学的最小,说明拟合精度最高.5.(福建高考)已知x与y之间的几组数据如下表:x 1 2 3 4 5 6y 0 2 1 3 3 4^ ^ ^假设根据上表数据所得线性回归直线方程为y=bx+a,若某同学根据上表中的前两组数据(1,0)和(2,2)求得的直线方程为y=b′x+a′,则以下结论正确的是()^ ^ ^ ^A.b>b′,a>a′B.b>b′,a<a′13^ ^ ^ ^C.b<b′,a>a′D.b<b′,a<a′解析:选C由两组数据(1,0)和(2,2)可求得直线方程为y=2x-2,b′=2,a′=-2. 而利用线性回归方程的公式与已知表格中的数据,-6∑i=1x i y i-6x^可求得b=-6∑i=1x2i-6x2 -y7 1358-6 ××2 6 5==,7 7 91-6 ×(2 )2^ a-^-13 5 7 1 =y-b x=-×=-,6 7 2 3^ ^所以b<b′,a>a′.二、填空题6.在一组样本数据(x1,y1),(x2,y2),…,(x n,y n)(n≥2,x1,x2,…,x n不全相等)1 的散点图中,若所有样本点(x i,y i)(i=1,2,…,n)都在直线y=x+1上,则这组样本数据2的样本相关系数为_________.解析:根据样本相关系数的定义可知,当所有样本点都在直线上时,相关系数为1.答案:17.某咖啡厅为了了解热饮的销售量y(个)与气温x(℃)之间的关系,随机统计了某4天的销售量与气温,并制作了对照表:气温(℃)18 13 10 -1销售量(个) 24 34 38 64^由表中数据,得线性回归方程y=-2x+a.当气温为-4 ℃时,预测销售量约为________.1 1解析:∵x=(18+13+10-1)=10,y=(24+34+38+64)=40,∴40=-2×10+a,∴a4 4=60,当x=-4时,y=-2×(-4)+60=68.答案:688.关于x与y有如下数据:x 2 4 5 6 8y 30 40 60 50 7014^ ^为了对 x ,y 两个变量进行统计分析,现有以下两种线性模型:甲: y =6.5x +17.5, 乙:y =7x +17,则____________(填“甲”或“乙”)模型拟合的效果更好.解析:设甲模型的相关指数为 R 21,^5∑i=1y i - y i2155则 R 21=1-=1- =0.845;-1 0005∑i=1y i - y 2设乙模型的相关指数为 R 2, 180 则 R 2=1- =0.82. 1 000 因为 0.845>0.82,即 R 21>R 2, 所以甲模型拟合效果更好. 答案:甲 三、解答题9.(新课标全国卷Ⅱ)某地区 2007年至 2013年农村居民家庭人均纯收入 y (单位:千元) 的数据如下表:年份 2007 2008 2009 2010 2011 2012 2013 年份代号 t 1 2 3 4 5 6 7 人均纯收入 y2.93.33.64.44.85.25.9(1)求 y 关于 t 的线性回归方程;(2)利用(1)中的回归方程,分析 2007年至 2013年该地区农村居民家庭人均纯收入的变化 情况,并预测该地区 2015年农村居民家庭人均纯收入.--n∑i=1t i - ty i - y^附:回归直线的斜率和截距的最小二乘估计公式分别为 b =,-n∑i=1t i - t 2^ a - ^- = y - b t .解:(1)由所给数据计算得- 1t = ×(1+2+3+4+5+6+7)=4,7- 1y = ×(2.9+3.3+3.6+4.4+4.8+5.2+5.9)=4.3,77-∑(t i - t )2=9+4+1+0+1+4+9=28,i =1 7- -∑(t i-t)(y i-y)=(-3)×(-1.4)+(-2)×(-1)+(-1)×(-0.7)+0×0.1+i=1151×0.5+2×0.9+3×1.6=14,^b--7∑i=1t i-ty i-y14===0.5,-287∑i=1t i-t 2^a-^-=y-b t=4.3-0.5×4=2.3,^所求回归方程为y=0.5t+2.3.^(2)由(1)知,b=0.5>0,故2007年至2013年该地区农村居民家庭人均纯收入逐年增加,平均每年增加0.5千元.^将2015年的年份代号t=9代入(1)中的回归方程,得y=0.5×9+2.3=6.8,故预测该地区2015年农村居民家庭人均纯收入为6.8千元.10.(全国丙卷)下图是我国2008 年至2014 年生活垃圾无害化处理量(单位:亿吨)的折线图.(1)由折线图看出,可用线性回归模型拟合y与t的关系,请用相关系数加以说明;(2)建立y关于t的回归方程(系数精确到0.01),预测2016年我国生活垃圾无害化处理量.7 7 7∑∑∑参考数据:y i=9.32,i y i=40.17, y i-y2=0.55,7≈2.646.ti=1 i=1 i=1n∑i=1t i-t y i-y^ ^ ^ 参考公式:相关系数r=,回归方程y=a+b t中斜率和n n∑i=1t i-t2∑i=1y i-y2n^ ∑i=1t i-t y i-y^ ^截距的最小二乘估计公式分别为b=,a=y-b t.n∑i=1t i-t2解:(1)由折线图中的数据和附注中的参考数据得7 7∑∑t=4,(t i-t)2=28, =0.55,y i-y2i=1 i=1167 7 7∑∑∑(t i -t )(y i -y )=t i y i -ty i =40.17-4×9.32=2.89,i =1i =1i =12.89∴r ≈ ≈0.99. 0.55 × 2 × 2.646因为 y 与 t 的相关系数近似为 0.99,说明 y 与 t 的线性相关程度相当大,从而可以用线 性回归模型拟合 y 与 t 的关系.9.32 (2)由y = ≈1.331及(1)得77^ ∑i=1t i -ty i -y2.89 b == ≈0.103. 728∑i=1t i -t 2^ a ^=y - b t ≈1.331-0.103×4≈0.92. ^所以 y 关于 t 的回归方程为 y =0.92+0.10t .^将 2016年对应的 t =9代入回归方程得 y =0.92+0.10×9=1.82. 所以预测 2016年我国生活垃圾无害化处理量约为 1.82亿吨.17。
2017_18版高中数学第一章统计案例1.2回归分析一学案
1.2 回归分析(一)明目标、知重点 1.会建立线性回归模型分析两个变量间的相关关系.2.能通过相关系数判断两个变量间的线性相关程度.1.回归直线方程在回归直线方程y ^=a ^+b ^x 中,b ^=∑ni =1x i -xy i -y∑n i =1x i -x 2=∑ni =1x i y i -n x y∑n i =1x 2i -n x2,a ^=y-b ^x .其中x =1n ∑ni =1x i ,y =1n∑n i =1y i . (x ,y )称为样本点的中心,回归直线过样本点的中心. 2.相关系数(1)对于变量x 与y 随机抽到的n 对数据(x 1,y 1),(x 2,y 2),…,(x n ,y n ),检测统计量是样本相关系数r =∑n i =1 x i -xy i -y∑n i =1x i -x2∑n i =1y i -y2=∑ni =1x i y i -n x y∑n i =1x 2i -n x2∑ni =1y 2i -n y2.(2)相关系数r 的取值范围是[-1,1],|r |值越大,变量之间的线性相关程度越高;|r |值越接近0,变量之间的线性相关程度越低.当|r |>r 0.05时,表明有95%的把握认为两个变量之间有线性相关关系.[情境导学]“名师出高徒”这句谚语的意思是什么?有名气的老师就一定能教出厉害的学生吗?这两者之间是否有关? 探究点一 回归直线方程思考1 两个变量之间的关系分几类? 答 分两类:①函数关系,②相关关系.函数关系是一种确定性关系,而相关关系是一种非确定性关系. 上面所提的“名师”与“高徒”之间的关系就是相关关系.思考2 什么叫回归分析?答 回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法. 思考3 对具有线性相关关系的两个变量进行回归分析有哪几个步骤? 答 基本步骤为画散点图,求回归直线方程,用回归直线方程进行预报. 例1 若从某大学中随机选取8名女大学生,其身高和体重数据如下表所示:编号 1 2 3 4 5 6 7 8 身高/cm 165 165 157 170 175 165 155 170 体重/kg4857505464614359. 解 (1)画散点图选取身高为自变量x ,体重为因变量y ,画出散点图,展示两个变量之间的关系,并判断二者是否具有线性关系.由散点图可以发现,样本点呈条状分布,身高和体重有比较好的线性相关关系,因此可以用回归直线y =bx +a 来近似刻画它们之间的关系.(2)建立回归方程由计算器可得b ^=0.849,a ^=-85.712.于是得到回归直线方程为y ^=0.849x -85.712. (3)预报和决策当x =172时,y ^=0.849×172-85.712=60.316(kg). 即一名身高为172 cm 的女大学生的体重预报值为60.316 kg. 反思与感悟 在使用回归直线方程进行预报时要注意: (1)回归直线方程只适用于我们所研究的样本的总体; (2)我们所建立的回归直线方程一般都有时间性; (3)样本取值的范围会影响回归直线方程的适用范围;(4)不能期望回归直线方程得到的预报值就是预报变量的精确值.跟踪训练1 某研究机构对高三学生的记忆力x 和判断力y 进行统计分析,得下表数据:x 6 8 10 12 y2356(1)请画出上表数据的散点图((2)请根据上表提供的数据,用最小二乘法求出y 关于x 的回归直线方程y ^=b ^x +a ^; (3)试根据求出的回归直线方程,预测记忆力为9的同学的判断力. 解 (1)如图:(2)∑ni =1x i y i =6×2+8×3+10×5+12×6=158, x =6+8+10+124=9,y =2+3+5+64=4, ∑ni =1x 2i =62+82+102+122=344, b ^=158-4×9×4344-4×92=1420=0.7, a ^=y -b ^x =4-0.7×9=-2.3,故线性回归方程为y ^=0.7x -2.3.(3)由(2)中回归直线方程,当x =9时,y ^=0.7×9-2.3=4,预测记忆力为9的同学的判断力约为4.探究点二 相关性检验思考1 给出n 对数据,按照公式求出的回归直线方程,是否一定能反映这组成对数据的变化规律?答 如果数据散点图中的点都大致分布在这条直线附近,这条直线就能反映这组成对数据的变化规律,否则求出的方程没有实际意义. 思考2 怎样定量确定两个变量的相关关系?答 可以通过计算相关系数r 来确定,若|r |>r 0.05,可以有95%的把握认为两个变量具有线性相关关系;若|r |≤r 0.05,则没有理由认为两个变量具有线性相关关系,此时寻找回归直线方程毫无意义.例2 维尼纶纤维的耐热水性能的好坏可以用指标“缩醛化度”y 来衡量,这个指标越高,耐热水性能也越好,而甲醛浓度是影响缩醛化度的重要因素,在生产中常用甲醛浓度x (g/L)去控制这一指标,为此必须找出它们之间的关系,现安排一批实验,获得如下数据:甲醛浓度(g/L) 18 20 22 24 26 28 30 缩醛化度(克分子%) 26.8628.3528.7528.8729.7530.0030.36(1)画散点图; (2)求回归直线方程;(3)求相关系数r ,并进行相关性检验. 解 (1)散点图如下图:(2)可以看出,两变量之间有近似的线性相关关系,下面用列表的方法计算a ^,b ^.ix iy ix i 2x i y i1 18 26.86 324 483.482 20 28.35 400 5673 22 28.75 484 632.5 4 24 28.87 576 692.88 5 26 29.75 676 773.5 6 28 30.00 784 8407 30 30.36 900 910.80 ∑168202.944 1444 900.16x =1687=24,y =202.947, b ^ =∑7i =1x i y i -7x y ∑7i =1x i 2-7x 2=4 900.16-7×24×202.9474 144-7×242≈0.264 3, a ^=y -b ^x =202.947-0.264 3×24≈22.648, ∴回归直线方程为y ^=22.648+0.264 3x .(3)∑7i =1y i 2≈5 892,r =∑7i =1x i y i -7x y∑7i =1x i 2-7x2∑7i =1y i 2-7y2=4 900.16-7×24×202.9474 144-7×242×[5 892-7×⎝ ⎛⎭⎪⎫202.9472]≈0.96.∵r =0.96>r 0.05=0.754.∴有95%的把握认为“甲醛浓度与缩醛化度有关系”,求得的回归直线方程有意义. 反思与感悟 根据已知数据求得回归直线方程后,可以利用相关系数和临界值r 0.05比较,进行相关性检验.跟踪训练2 为了研究3月下旬的平均气温(x )与4月20日前棉花害虫化蛹高峰日(y )的关系,某地区观察了2007年至2012年的情况,得到了下面的数据:年份2007 2008 2009 2010 2011 2012 x (℃) 24.4 29.6 32.9 28.7 30.3 28.9 y (日)19611018(1)对变量x 、y 进行相关性检验;(2)据气象预测,该地区在2013年3月下旬平均气温为27℃,试估计2013年4月化蛹高峰日为哪天.解 由已知条件可得下表:i 1 2 3 4 5 6 x i 24.4 29.6 32.9 28.7 30.3 28.9 y i19611018x ≈29.13,y =7.5,∑i =16x i 2=5 130.92,∑i =16y i 2=563,∑i =16x i y i =1 222.6(1)r =∑i =16x i y i -6x y∑i =16x i 2-6x2∑i =16y i 2-6y2≈-0.934 1.查表知:r 0.05=0.811.由|r |>r 0.05,可知变量y 和x 存在线性相关关系.(2)b ^=1 222.6-6×29.13×7.55 130.92-6×29.132≈-2.23, a ^=y -b ^x ≈72.46.所以回归直线方程为y ^=-2.23x +72.46.当x =27时,y ^=-2.23×27+72.46≈12.据此,可估计该地区2013年4月12日为化蛹高峰日.1.下列各组变量之间具有线性相关关系的是( ) A.出租车费与行驶的里程 B.学习成绩与学生身高 C.身高与体重 D.铁的体积与质量 答案 C2.对变量y 和x 进行相关性检验,已知n 为数据的对数,r 是相关系数,且已知①n =3,r =0.995 0;②n =7,r =0.953 3;③n =15,r =0.301 2;④n =17,r =0.499 1.则变量y 和x 具有线性相关关系的是( )A.①和②B.①和③C.②和④D.③和④答案 C解析 ①n =3时,r 0.05=0.997,所以|r |<r 0.05,我们没有理由拒绝原来的假设,这时寻找回归直线方程是毫无意义的.②n =7时,r 0.05=0.754,所以|r |>r 0.05,表明有95%的把握认为x 与y 之间具有线性相关关系.③n =15时,r 0.05=0.514,所以|r |<r 0.05,我们没有理由拒绝原来的假设,这时寻找回归直线方程是毫无意义的.④n =17时,r 0.05=0.482,所以|r |>r 0.05,表明有95%的把握认为x 与y 之间具有线性相关关系.所以②和④满足题意.3.某商品销售量y (件)与销售价格x (元/件)负相关,则其回归直线方程可能是( )A.y ^=-10x +200B.y ^=10x +200C.y ^=-10x -200D.y ^=10x -200 答案 A解析 由于销售量y 与销售价格x 成负相关,故排除B 、D.又当x =10时,A 中y =100,而C 中y =-300,C 不符合题意,故选A.4.调查了某地若干户家庭的年收入x (单位:万元)和年饮食支出y (单位:万元),调查显示年收入x 与年饮食支出y 具有线性相关关系,并由调查数据得到y 对x 的回归直线方程:y ^=0.254x +0.321.由回归直线方程可知,家庭年收入每增加1万元,年饮食支出平均增加 万元. 答案 0.2540.254x+1+0.321-(0.254x+0.321)=0.254.解析由题意知[][呈重点、现规律]1.对具有相关关系的两个变量进行统计分析,可从散点图观察大致呈条状分布,可以求回归直线方程并进行预报.2.通过求相关系数并和临界值r0.05比较可以判断两个变量是否有线性相关关系,求得的回归直线方程是否有意义.。
【数学】高中数学第一章统计案例113可线性化的回归分析同步测控北师大版选修12
【关键字】数学高中数学第一章统计案例 1.1.3 可线性化的回归分析同步测控北师大版选修1-2我夯基我达标1.设在海拔x m处的大气压强是y Pa,y与x之间的关系为y=cekx,其中c、k为常量,如果某游客从大气压为1.01×105 Pa的海平面地区,到了海拔为2 ,大气压为0.90×105 Pa的一个高原地区,则k与c的取值分别是( )A. B.C. D.解析:将和,分别代入y=cekx,得答案:A2.我国1990~2000年的国内生产总值如下表所示:则反映这一时期国内生产总值发展变化的函数模型可能为( )A.y=aekxB.y=a+bxC.y=axbD.y=解析:画出散点图,观察可用y=a+bx刻画国民生产总值发展变化的趋势.答案:B3.下列数据x、y符合的函数模型为( )解析:取x=1,2,…,10,分别代入各解析式判断.答案:D4.指数曲线y=aebx的图像为( )解析:∵y=aebx,a>0时,y>0,排除A、C,且x∈R,排除D,选B.答案:B5.倒指数曲线y=的图像为( )解析:y=,当a>0,b>0时,图像为A.答案:A6.幂函数曲线y=xb,当b>1时的图像为( )解析:当b>1时,图像为A;当0<b<1时,图像为B;当b<0时,图像为C;当b=1时,图像为D.答案:A7.x、y满足则x 、y 之间符合函数模型为___________. 解析:画出散点图,形如y=xb,其中b=2. 答案:y=x2 8.x 、y 满足则x 、y 之间符合函数模型为___________.解析:画出散点图,形如y=a ·ebx,其中a=2,b=1. 答案:y=exln2我综合 我发展9.若x 、y 满足解析:画出散点图,观察图像形如y=,其中b=2. 答案:y=10.若x 、y 满足 则x 、y 满足函数关系是_______________.解析:画出散点图,当x 无限大时,y 逐渐接近于1,符合函数模型y=,其中a=1,b=-1. 答案:y=若y 与t 之间满足y=aebt 关系,求函数解析式,若按此增长趋势估计大约在哪一年我国人口达到14亿?解析:将函数转化为一次函数求解. 解:设μ=lny,c=lna,则μ=c+bt. =45,=110.167 0,=285,=497.593 6,=4.5,=11.016 7, b===0.022 3,c=-b=11.016 7-0.022 3×4.5=10.916 4,∴μ=10.916 4+0.022 3t,y=e10.916 4+0.022 3t.令y=140 000万,则10.916 4+0.022 3t=ln140 000=11.849 4, ∴t=41.838 5,即大约在1950年后的第42年(即1992年)我国人口达到14亿.由此看来,计划生育是我国的基本国策.12.如下表所示,某地区一段时间内观察到的大于或等于某震级x 的地震个数为N,建立回归解析:根据散点图判断函数类型为y=ae ,作变换求解.解:由散点图,知函数模型为y=ae bx, 设μ=lny,c=lna,则μ=c+bx,∑=111i ix=1x i =91.2,∑=111i iμ=138.05,∑=1912i ix=460.56,∑=191i ii x μ=624.622,x =4.8,μ=7.265 8,b=219121911919xx x x i i i ii--∑∑==μμ=28.41956.4602658.78.419622.624⨯-⨯⨯-=-1.667 5,c=μ-b x =7.265 8+1.667 5×4.8=15.269 8,μ=15.269 8-1.667 5x, ∴y=e 15.269 8-1.667 5x.(1)描点画出1990~2000年国内生产总值的图像;(2)建立一个能基本反映这一时期国内生产总值发展变化的函数模型,并根据这个模型,预测2020年的国内生产总值.解析:画出散点图,观察函数类型. 解:(1)作散点图(略).(2)由散点图,可知函数为y=a+bx,∑=111i i t =1x i =21 945,∑=111i i y =592 425.3,∑=1112i i x =43 780 385,∑=111i ii yx =1 182 725 833,x =1 995,y =53 856.845,b=211121111111xx yx yx i i i ii∑∑==--=219951143780385845.538561995111182725833⨯-⨯⨯-=7 612.359 1,a=y -b x =53 856.845-7 612.359 1×1 995=-15 132 799.56,∴y=-15 132 799.56+7 612.359 1x.当x=2 020时,y=244 165.822亿元, 即预测2020年国民生产总值约为244 165.822亿元.我创新 我超越14.在平炉炼钢中,由于矿石与炉气中的氧气作用,铁水的总含量不断下降,现测得含碳量求回归方程.解析:画出散点图观察样本点分布在一条指数函数曲线y=ae bx的周围,再应用换元转化为线性回归问题求解. 则∑=111i it=66,∑=111i iz=6.816,∑=1112i it=400.4,∑=111i ii tz =32.778 2,t =6,z =0.6196,b=22111116114.4006196.06117782.321111⨯-⨯⨯-=--∑∑==tt z zt tz ti i i i ii =4.41178.8-=-1.845,c=z -b t =11.689. ∴z=-1.845t+11.689.∴y=e -1.845t+11.689.此文档是由网络收集并进行重新排版整理.word 可编辑版本!。
2018-2019学年高中数学 第一章 统计案例 1.2 回归分析学案 苏教版选修1-2
1.2 回归分析学习目标 1.会建立线性回归模型分析两个变量间的相关关系.2.能通过相关系数判断两个变量间的线性相关程度.3.了解非线性回归分析.知识点一 线性回归模型思考 某电脑公司有5名产品推销员,其工作年限与年推销金额数据如下表:推销员编号 1 2 3 4 5 工作年限x /年 3 5 6 7 9 年推销金额y /万元23345请问如何表示年推销金额y 与工作年限x 之间的相关关系?y 关于x 的线性回归方程是什么? 答案 画出散点图,由图可知,样本点散布在一条直线附近,因此可用回归直线表示两变量之间的相关关系.设所求的线性回归方程为y ^=b ^x +a ^,则b ^=i =15(x i -x )(y i -y )i =15(x i -x )2=1020=0.5, a ^=y -b ^x =0.4.所以年推销金额y 关于工作年限x 的线性回归方程为y ^=0.5x +0.4.梳理 线性回归模型 (1)随机误差具有线性相关关系的两个变量的取值x ,y ,y 的值不能由x 完全确定,可将x ,y 之间的关系表示为y =a +bx +ε,其中a +bx 是确定性函数,ε称为随机误差. (2)随机误差产生的主要原因①所用的确定性函数不恰当引起的误差. ②忽略了某些因素的影响. ③存在观测误差.(3)线性回归模型中a ,b 值的求法y =a +bx +ε称为线性回归模型.a ,b 的估计值为a ^,b ^,则⎩⎪⎨⎪⎧b ^=∑i =1nx i y i-n x y ∑i =1nx 2i-n (x )2,a ^=y -b ^x .(4)回归直线和线性回归方程直线y ^=a ^+b ^x 称为回归直线,此直线方程即为线性回归方程,a ^称为回归截距,b ^称为回归系数,y ^称为回归值. 知识点二 样本相关系数r具有相关关系的两个变量的线性回归方程为y ^=b ^x +a ^.思考1 变量y ^与真实值y 一样吗? 答案 不一定.思考2 变量y ^与真实值y 之间误差大了好还是小了好? 答案 越小越好.梳理 样本相关系数r 及其性质(1)r =∑i =1nx i y i -n x y(∑i =1nx 2i -n (x )2)(∑i =1ny 2i -n (y )2).(2)r 具有以下性质: ①|r |≤1.②|r |越接近于1,x ,y 的线性相关程度越强. ③|r |越接近于0,x ,y 的线性相关程度越弱.知识点三 对相关系数r 进行显著性检验的基本步骤 1.提出统计假设H 0:变量x ,y 不具有线性相关关系.2.如果以95%的把握作出判断,那么可以根据1-0.95=0.05与n -2在教材附录1中查出一个r 的临界值r 0.05(其中1-0.95=0.05称为检验水平). 3.计算样本相关系数r .4.作出统计推断:若|r |>r 0.05,则否定H 0,表明有95%的把握认为x 与y 之间具有线性相关关系;若|r |≤r 0.05,则没有理由拒绝原来的假设H 0,即就目前数据而言,没有充分理由认为y 与x 之间有线性相关关系.1.求线性回归方程前可以不进行相关性检验.( × )2.在残差图中,纵坐标为残差,横坐标可以选为样本编号.( √ ) 3.利用线性回归方程求出的值是准确值.( × )类型一 求线性回归方程例1 某研究机构对高三学生的记忆力x 和判断力y 进行统计分析,得下表数据:x 6 8 10 12 y2356(1)请画出上表数据的散点图;(2)请根据上表提供的数据,用最小二乘法求出y 关于x 的线性回归方程y ^=b ^x +a ^; (3)试根据求出的线性回归方程,预测记忆力为9的同学的判断力.⎝ ⎛⎭⎪⎪⎫相关公式:b ^=∑i =1nx i y i-n x y ∑i =1nx 2i-n (x )2,a ^=y -b ^x 考点 线性回归方程 题点 求线性回归方程 解 (1)如图:(2)∑i =14x i y i =6×2+8×3+10×5+12×6=158,x =6+8+10+124=9,y =2+3+5+64=4,∑i =14x 2i =62+82+102+122=344, b ^=158-4×9×4344-4×92=1420=0.7, a ^=y -b ^x =4-0.7×9=-2.3,故线性回归方程为y ^=0.7x -2.3.(3)由(2)中线性回归方程可知,当x =9时,y ^=0.7×9-2.3=4,预测记忆力为9的同学的判断力约为4.反思与感悟 (1)求线性回归方程的基本步骤①列出散点图,从直观上分析数据间是否存在线性相关关系.②计算:x ,y ,∑i =1nx 2i ,∑i =1nx i y i .③代入公式求出y ^=b ^x +a ^中参数b ^,a ^的值. ④写出线性回归方程并对实际问题作出估计.(2)需特别注意的是,只有在散点图大致呈线性时,求出的回归方程才有实际意义. 跟踪训练1 某班5名学生的数学和物理成绩如下表:学生编号 12345学科编号 ABCDE数学成绩(x ) 88 76 73 66 63 物理成绩(y )7865716461(1)画出散点图;(2)求物理成绩y 对数学成绩x 的线性回归方程; (3)一名学生的数学成绩是96,试预测他的物理成绩.考点 线性回归方程 题点 求线性回归方程 解 (1)散点图如图.(2)x =15×(88+76+73+66+63)=73.2,y =15×(78+65+71+64+61)=67.8.∑i =15x i y i =88×78+76×65+73×71+66×64+63×61=25054.∑i =15x 2i =882+762+732+662+632=27174. 所以b ^=∑i =15x i y i -5x y∑i =15x 2i -5(x )2=25054-5×73.2×67.827174-5×73.22≈0.625. a ^=y -b ^x ≈67.8-0.625×73.2=22.05.所以y 对x 的线性回归方程是y ^=0.625x +22.05.(3)当x =96时,y ^=0.625×96+22.05≈82,即可以预测他的物理成绩约是82. 类型二 线性回归分析例2 现随机抽取了某中学高一10名在校学生,他们入学时的数学成绩(x )与入学后第一次考试的数学成绩(y )如下表:学生号1 2 3 4 5 6 7 8 9 10 x 120 108 117 104 103 110 104 105 99 108 y84648468696869465771请问:这10名学生的两次数学成绩是否具有线性关系? 考点 题点解 x =110(120+108+…+99+108)=107.8, y =110(84+64+…+57+71)=68.∑i =110x 2i =1202+1082+…+992+1082=116584. ∑i =110y 2i =842+642+…+572+712=47384. ∑i =110x i y i =120×84+108×64+…+99×57+108×71=73796.所以相关系数为r =73796-10×107.8×68(116584-10×107.82)(47384-10×682)≈0.751. 由检验水平0.05及n -2=8, 在附录1中查得r 0.05=0.632. 因为0.751>0.632,由此可看出这10名学生的两次数学成绩具有较强的线性相关关系. 反思与感悟 相关关系的两种判定方法 (1)利用散点图判定(2)利用相关系数判定计算r ―→结合r 的值与相关性检验临界值表中的值进行比较判断跟踪训练2 一台机器由于使用时间较长,但还可以使用,它按不同的转速生产出来的某机械零件有一些会有缺点,每小时生产有缺点的零件的多少随机器运转的速度而变化,下表为抽样试验的结果:转速x (转/秒)16 14 12 8 每小时生产有缺点的零件数y (件)11985对变量y 与x 进行线性相关性检验. 考点 题点解 由题中数据可得x =12.5,y =8.25,∑i =14x i y i =438,4x y =412.5,∑i =14x 2i =660,∑i =14y 2i =291, 所以r =∑i =14x i y i -4x y(∑i =14x 2i -4(x )2)(∑i =14y 2i -4(y )2)=438-412.5(660-625)×(291-272.25)=25.5656.25≈0.995. 由检验水平0.05及n -2=2,在教材附录1中查得r 0.05=0.950,因为r >r 0.05,所以y 与x 具有线性相关关系. 类型三 非线性回归分析 例3 下表为收集到的一组数据:x 21 23 25 27 29 32 35 y711212466115325(1)作出x 与y 的散点图,并猜测x 与y 之间的关系; (2)建立x 与y 的关系;(3)利用所得模型,估计当x =40时y 的值. 考点 非线性回归分析 题点 非线性回归分析解 (1)作出散点图如图,从散点图可以看出x 与y 不具有线性相关关系,根据已有知识可以发现样本点分布在某一条指数型函数曲线y =c 1e c 2x 的周围,其中c 1,c 2为待定的参数.(2)对两边取对数把指数关系变为线性关系,令z =ln y ,则有变换后的样本点应分布在直线z =bx +a ,a =ln c 1,b =c 2的周围,这样就可以利用线性回归模型来建立y 与x 之间的非线性回归方程,数据可以转化为x 21 23 25 27 29 32 35z1.9462.3983.045 3.1784.190 4.7455.784x=17(21+23+…+32+35)=27.429,z =17(1.946+2.398+…+4.745+5.784)=3.612,∑i =17x i z i =733.741,∑i =17x 2i =5414. 求得线性回归方程为z ^=0.273x -3.876,∴y ^=e0.273x -3.876.(3)当x =40时,y ^=e 0.273x -3.876≈1146.反思与感悟 非线性回归问题的处理方法 (1)指数型函数y =e bx +a①函数y =ebx +a的图象②处理方法:两边取对数,得ln y =lnebx +a,即ln y =bx +a .令z =ln y ,把原始数据(x ,y )转化为(x ,z ),再根据线性回归模型的方法求出a ,b . (2)对数型函数y =b ln x +a ①函数y =b ln x +a 的图象:②处理方法:设x ′=ln x ,原方程可化为y =bx ′+a , 再根据线性回归模型的方法求出a ,b . (3)y =bx 2+a 型处理方法:设x ′=x 2,原方程可化为y =bx ′+a ,再根据线性回归模型的方法求出a ,b . 跟踪训练3 已知某种食品每千克的生产成本y (元)与生产该食品的重量x (千克)有关,经生产统计得到以下数据:x 1 2 3 5 10通过以上数据,判断该食品的生产成本y (元)与生产的重量x (千克)的倒数1x之间是否具有线性相关关系.若有,求出y 关于1x的回归方程,并估计一下生产该食品500千克时每千克的生产成本约是多少.(精确到0.01) 考点 非线性回归分析 题点 非线性回归分析解 设u =1x,通过已知数据得到y 与u 的相应数据为根据上述数据可求得相关系数r =∑i =110u i ·y i -10u ·y(∑i =110u 2i -10·(u )2)(∑i =110y 2i -10·(y )2)≈0.9998,于是有很大的把握认为y 与1x具有线性相关关系.而b ^=∑i =110u i ·y i -10u ·y∑i =110u 2i -10(u )2≈8.973,a ^=y -b ^·u ≈1.126,于是y 与1x 的回归方程为y ^=8.973x+1.126.当x =500时,y ^=8.973500+1.126≈1.14.所以估计生产该食品500千克时每千克的生产成本约是1.14元.1.设有一个线性回归方程y ^=2-1.5x ,当变量x 增加1个单位时,y 平均________个单位. 考点 线性回归分析 题点 线性回归方程的应用 答案 减少1.5解析 由回归方程中两个变量之间的关系可以得到.2.如图四个散点图中,适合用线性回归模型拟合其中两个变量的是________.(填序号)考点 回归分析题点 建立回归模型的基本步骤 答案 ①③解析 由图易知①③两个图中样本点在一条直线附近,因此适合用线性回归模型. 3.某厂节能降耗技术改造后,在生产A 产品过程中记录的产量x (吨)与相应的生产能耗y (吨)的几组对应数据如表:x 3 4 5 6 y2.5t44.5根据上表提供的数据,求出y 关于x 的线性回归方程为y ^=0.7x +0.35,则上表中的t =________.考点 线性回归分析 题点 线性回归方程的应用 答案 34.下表是x 和y 之间的一组数据,则y 关于x 的回归直线必过点________.x 1 2 3 4 y1357考点 线性回归方程 题点 样本点中心的应用答案 (2.5,4)解析 回归直线必过样本点中心(x ,y ),即(2.5,4). 5.已知x ,y 之间的一组数据如下表:x 0 1 2 3 y1357(1)分别计算:x ,y ,x 1y 1+x 2y 2+x 3y 3+x 4y 4,x 21+x 22+x 23+x 24; (2)已知变量x 与y 线性相关,求出回归方程. 考点 线性回归方程 题点 求线性回归方程解 (1)x =0+1+2+34=1.5,y =1+3+5+74=4,x 1y 1+x 2y 2+x 3y 3+x 4y 4=0×1+1×3+2×5+3×7=34,x 21+x 22+x 23+x 24=02+12+22+32=14.(2)b ^=34-4×1.5×414-4×1.52=2,a ^=y -b ^x =4-2×1.5=1,故y ^=2x +1.回归分析的步骤(1)确定研究对象,明确哪个变量是自变量,哪个变量是因变量.(2)画出确定好的因变量关于自变量的散点图,观察它们之间的关系(如是否存在线性关系等).(3)由经验确定回归方程的类型(如果呈线性关系,则选用线性回归方程y ^=b ^x +a ^). (4)按一定规则估计回归方程中的参数.一、填空题1.根据如下样本数据:x 3 4 5 6 7 8 y4.02.5-0.50.5-2.0-3.0得到的回归方程为y ^=b ^x +a ^,则a ^,b ^与0的大小关系是________. 考点 线性回归分析 题点 线性回归方程的应用答案 a ^>0,b ^<0 解析 作出散点图如下:观察图象可知,回归直线y ^=b ^x +a ^的斜率b ^<0,当x =0时,y ^=a ^>0.故a ^>0,b ^<0.2.某同学在研究性学习中,收集到某制药厂今年前5个月甲胶囊生产产量(单位:万盒)的数据如下表所示:x (月份) 1 2 3 4 5 y (万盒)55668若x ,y 线性相关,线性回归方程为y ^=0.7x +a ^,估计该制药厂6月份生产甲胶囊产量约为________万盒. 考点 线性回归方程 题点 样本点中心的应用 答案 8.1解析 回归直线一定过样本点中心.由已知数据,可得x =3,y =6,代入回归方程,可得a ^=y -0.7x =3.9,即回归方程为y ^=0.7x +3.9.把x =6代入,可得y ^=8.1,所以6月份的产量约为8.1万盒.3.某化工厂为预测某产品的回收率y ,而要研究它和原料有效成分含量之间的相关关系,现取了8对观测值,计算得∑i =18x i =52,∑i =18y i =228,∑i =18x 2i =478,∑i =18x i y i =1849,则y 与x 的线性回归方程是________________. 考点 线性回归方程题点 求线性回归方程答案 y ^=2.62x +11.47解析 由题中数据得x =6.5,y =28.5,∴b ^=∑i =18x i y i -8x·y∑i =18x 2i -8(x )2=1849-8×6.5×28.5478-8×6.52=367140≈2.62, a ^=y -b ^x ≈28.5-2.62×6.5=11.47,∴y 与x 的线性回归方程是y ^=2.62x +11.47. 4.已知x ,y 的取值如下表:从所得的散点图分析,y 与x 线性相关,且y ^=0.95x +a ^,则a ^=________. 考点 题点 答案 2.6解析 ∵x =2,y =4.5.又回归直线恒过定点(x ,y ),代入得a ^=2.6.5.从某大学随机选取8名女大学生,其身高x (cm)和体重y (kg)的线性回归方程为y ^=0.849x -85.712,则身高172cm 的女大学生,由线性回归方程可以估计其体重为________kg. 考点 题点 答案 60.316解析 y ^=0.849×172-85.712=60.316. 6.有下列关系:①曲线上的点与该点的坐标之间的关系; ②苹果的产量与气候之间的关系;③森林中的同一种树木,其断面直径与高度之间的关系; ④学生与其学号之间的关系.其中有相关关系的是________.(填序号) 考点 题点 答案 ②③解析 由相关关系定义分析.7.某产品的广告费用x 与销售额y 的统计数据如下表:根据上表可得线性回归方程y ^=b ^x +a ^中的b ^为9.4,据此模型估计广告费用为6万元时的销售额为____________万元. 考点 题点 答案 65.5解析 样本点中心是(3.5,42),则a ^=y -b ^x =42-9.4×3.5=9.1,所以线性回归方程是y ^=9.4x +9.1,把x =6代入,得y ^=65.5.8.在一组样本数据(x 1,y 1),(x 2,y 2),…,(x n ,y n )(n ≥2,x 1,x 2,…,x n 不全相等)的散点图中,若所有样本点(x i ,y i )(i =1,2,…,n )都在直线y =12x +1上,则这组样本数据的样本相关系数为________. 考点 线性相关系数题点 线性相关系数的概念及计算 答案 1解析 根据样本相关系数的定义可知,当所有样本点都在一条直线上且直线斜率大于零时,相关系数为1.9.对于回归分析,有下列叙述:①在回归分析中,变量间的关系若是非确定性关系,则因变量不能由自变量唯一确定; ②线性相关系数可以是正的或是负的;③回归分析中,如果r 2=1或r =±1,说明x 与y 之间完全线性相关; ④样本相关系数r ∈(-∞,+∞). 其说法正确的序号是________.考点 题点 答案 ①②③解析 由回归模型及其性质易知①②③是正确的.相关系数的取值范围应为|r |≤1,所以④是错误的.10.在研究两个变量的相关关系时,观察散点图发现样本点集中于某一条指数曲线y =ebx +a的周围.令z =ln y ,求得线性回归方程为z ^=0.25x -2.58,则该模型的回归方程为________. 考点 非线性回归分析 题点 非线性回归分析 答案 y =e0.25x -2.58解析 因为z ^=0.25x -2.58,z =ln y ,所以y ^=e0.25x -2.58.11.在对两个变量进行回归分析时,甲、乙分别给出两个不同的回归方程,并对回归方程进行检验.对这两个回归方程进行检验时,与实际数据(个数)的对比结果如下:则从表中数据分析,________回归方程更好.(即与实际数据更贴近) 考点 两个模型拟合效果的比较 题点 两个模型拟合效果的比较 答案 甲解析 可以根据表中数据分析,两个回归方程对数据预测的正确率进行判断,甲回归方程的数据准确率为3240=45,而乙回归方程的数据准确率为4060=23.显然甲的准确率高些,因此甲回归方程好些. 二、解答题12.某车间为了规定工时定额,需要确定加工零件所花费的时间,为此作了四次试验,得到的数据如下:(1)在给定的坐标系中画出表中数据的散点图;(2)求出y 关于x 的线性回归方程y ^=b ^x +a ^,并在坐标系中画出回归直线; (3)试预测加工10个零件需要多少时间?(注:b ^=∑i =1nx i y i -n x y∑i =1nx 2i -n (x )2,a ^=y -b ^x ) 考点 线性回归方程 题点 求线性回归方程 解 (1)散点图如图.(2)由表中数据得∑i =14x i y i =52.5,x =3.5,y =3.5,∑i =14x 2i =54,所以b ^=∑i =14x i y i -4x y∑i =14x 2i -4(x )2=0.7,所以a ^=y -b ^x =1.05.所以y ^=0.7x +1.05. 回归直线如第(1)问图所示.(3)将x =10代入线性回归方程,得y ^=0.7×10+1.05=8.05,所以预测加工10个零件需要8.05小时.13.为了研究某种细菌随时间x 的变化繁殖个数y 的变化情况,收集数据如下:时间x (天) 1 2 3 4 5 6 繁殖个数y612254995190(1)(2)求y 与x 之间的回归方程. 考点 非线性回归分析 题点 非线性回归分析 解 (1)散点图如图所示:(2)由散点图看出样本点分布在一条指数曲线y =c 1e c 2x 的周围,于是令z =ln y ,则x 1 2 3 4 5 6 z1.792.483.223.894.555.25所以z ^=0.69x +1.115,则有y ^=e 0.69x +1.115.三、探究与拓展14.已知x ,y 的取值如下表:x 2 3 5 6 y2.74.36.16.9从散点图分析y 与x 具有线性相关关系,且回归方程为y ^=1.02x +a ^,则a ^=________. 考点 题点 答案 0.92解析 由题意得x =4,y =5,又(x ,y )在直线y ^=1.02x +a ^上,所以a ^=5-4×1.02=0.92.15.在一段时间内,分5次测得某种商品的价格x (万元)和需求量y (t)之间的一组数据为1234 5价格x 1.4 1.6 1.82 2.2需求量y 121075 3已知∑i=15x i y i=62,∑i=15x2i=16.6.(1)画出散点图;(2)求出y对x的线性回归方程;(3)如果价格定为1.9万元,预测需求量大约是多少?(精确到0.01t) 考点题点解(1)散点图如图所示:(2)因为x=15×9=1.8,y=15×37=7.4,∑i=15x i y i=62,∑i=15x2i=16.6,所以b^=∑i=15x i y i-5x y∑i=15x2i-5(x)2=62-5×1.8×7.416.6-5×1.82=-11.5,a^=y-b^x=7.4+11.5×1.8=28.1,故y对x的线性回归方程为y^=-11.5x+28.1.(3)y^=28.1-11.5×1.9=6.25(t).故价格定为1.9万元,预测需求量大约为6.25 t.。
2018年陕西省高三数学第1章《统计案例》导学案:1.1.1回归分析的基本思想及其初步应用(1)
1. 通过典型案例的探究,进一步了解回归分析的基本思想、方法及初步应用;2. 了解线性回归模型与函数模型的差异,了解衡量两个变量之间线性相关关系得方法---相关系数.24 问题1:“名师出高徒”这句彦语的意思是什么?有名气的老师就一定能教出厉害的学生吗?这两者之间是否有关?复习1:函数关系是一种 关系,而相关关系是一种 关系.复习2:回归分析是对具有 关系的两个变量进行统计分析的一种常用方法,其步骤: → → → .二、新课导学 ※ 学习探究实例问题为172cm 的女大学生的体重.解:由于问题中要求根据身高预报体重,因此 选 自变量x , 为因变量. (1)做散点图:从散点图可以看出 和 有比较好的 相关关系.(2) x = y =81i ii x y==∑821ii x==∑所以81822188i ii ii x yx y b xx==-==-∑∑a y bx=-≈于是得到回归直线的方程为r>0, 相关, r<0 相关;相关系数的绝对值越接近于1,两个变量的线性相关关系,它们的散点图越接近;r>,两个变量有关系.※典型例题例1某班5名学生的数学和物理成绩如下表:(2)求物理成绩y对数学成绩x的回归直线方程;(3)该班某学生数学成绩为96,试预测其物理成绩;变式:该班某学生数学成绩为55,试预测其物理成绩;小结:求线性回归方程的步骤:※动手试试练.(07广东文科卷)下表提供了某厂节能降耗技术改造后生产甲产品过程中记录的产量x(吨)与相应的生产能耗y(吨标准煤)的几组对照数据(1)请画出上表数据的散点图;(2)请根据上表提供的数据,用最小二乘法求出y关于x的线性回归方程=+;y bx a(3)已知该厂技改前100吨甲产品的生产能耗为90吨标准煤.试根据(2)求出的线性同归方程,预测生产100吨甲产品的生产能耗比技改前降低多少吨标准煤?⨯+⨯+⨯+⨯=)(参考数值3 2.543546 4.566.5三、总结提升※学习小结1. 求线性回归方程的步骤:2. 线性回归模型与一次函数有何不同※知识拓展※自我评价你完成本节导学案的情况为().A. 很好B. 较好C. 一般D. 较差※当堂检测(时量:5分钟满分:10分)计分:1. 下列两个变量具有相关关系的是()A. 正方体的体积与边长B. 人的身高与视力C.人的身高与体重D.匀速直线运动中的位移与时间2. 在画两个变量的散点图时,下面哪个叙述是正确的()A.预报变量在x 轴上,解释变量在y 轴上B. 解释变量在x 轴上,预报变量在y 轴上C. 可以选择两个变量中任意一个变量在x 轴上D. 可选择两个变量中任意一个变量在y 轴上3. 回归直线y bx a=+必过()A. (0,0)B. (,0)x C. (0,)y D. (,)x y4.r越接近于1,两个变量的线性相关关系.5. 已知回归直线方程0.50.81=-,则25y xx=时,y的估计值为.。
2017-2018学年高中数学 第一章 统计案例 1.1 回归分析 1.1.1 回归分析 1.1.2 相关系数课件 北师大版选修1-2
年龄 x/岁 4
5
6
7
8
9
10
身高 y/cm 100 106 112 116 121 124 130
求y对x的线性回归方程. 思路分析:根据求回归系数的公式求a,b,再写出回归直线方程.
探究一
探究二
探究三
思维辨析
解:制表
i
123456
xi
456789
yi 100 106 112 116 121 124
探究一
探究二
探究三
思维辨析
������ = 1 15515=101,������ = 15115.7≈10.11,
15
15
15
5, ∑ xiyi=16 076.8.
������=1
i=1
������=1
故蔬菜产量与施用氮肥量的相关系数
所以当每单位面积施氮肥 150 kg 时,每单位面积蔬菜年平均产
量为 0.646 3+0.093 7×150≈14.701(t).
探究一
探究二
探究三
思维辨析
反思感悟线性回归分析的简要步骤 1.随机抽取样本,确定样本数据. 2.判断两变量是否具有线性相关关系,可画出散点图用散点图判 断;也可计算相关系数r,用相关系数作出判断. 3.若两变量线性相关,用最小二乘法求出回归直线方程. 4.分析模型的拟合效果,看有无特殊点,不合适时,分析错因,加以 纠正. 5.依据回归方程作出预报.
() (4)因为由任何一组观测值都可以求得一个线性回归方程,所以没有 必要进行相关性检验. ( ) (5)回归分析是具有相关关系的两个变量进行统计分析的一种方法.
()
答案:(1)√ (2)√ (3)√ (4)× (5)√
高中数学 第一章 统计案例 1.1.1 回归分析的基本思想及其初步应用导学案新人教A版选修1-2
回归分析的基本思想及其初步应用
—相关指数和残差分析.
.当一个变量取值改变时,另一个变量的取值随之改变,
这样的两个变量之间的关系叫做相关关系.
知识点2:线性回归分析
.回归分析是处理两个变量之间__________常用的一种统计方法.若两个变
的绝对值越接近
线性相关关系.通常当
__________
.在研究两
数据中是否存在可疑数据,这方面的分析
往
x
负相关
的观测数据的平均值都是
,则回归直线方程是
②利用样本点的散点图可以直观判断两个变量的关系是否可以用线性关系
有如下的统计:。
近年高中数学第1章统计案例1.2回归分析(二)学案苏教版选修1-2(2021年整理)
2018高中数学第1章统计案例1.2 回归分析(二)学案苏教版选修1-2 编辑整理:尊敬的读者朋友们:这里是精品文档编辑中心,本文档内容是由我和我的同事精心编辑整理后发布的,发布之前我们对文中内容进行仔细校对,但是难免会有疏漏的地方,但是任然希望(2018高中数学第1章统计案例1.2 回归分析(二)学案苏教版选修1-2)的内容能够给您的工作和学习带来便利。
同时也真诚的希望收到您的建议和反馈,这将是我们进步的源泉,前进的动力。
本文可编辑可修改,如果觉得对您有帮助请收藏以便随时查阅,最后祝您生活愉快业绩进步,以下为2018高中数学第1章统计案例1.2 回归分析(二)学案苏教版选修1-2的全部内容。
§1.2回归分析(二)课时目标 1.会对变量x与y进行相关性检验.2.进一步理解回归分析的基本思想.1.根据给定的样本数据,求得的线性回归方程未必有实际意义.2.对相关系数r进行显著性检验的基本步骤如下:(1)提出统计假设H0:变量x,y________________;(2)如果以95%的把握作出推断,可以根据1-0。
95=0。
05与n-2在附录1中查出一个r的__________(其中1-0.95=0.05称为____________);(3)计算__________________;(4)作出统计推断:若__________,则否定H0,表明有________的把握认为x与y之间具有__________________;若________,则没有理由拒绝原来的假设H0,即就目前数据而言,没有充分理由认为x与y之间有__________________.一、填空题1.下列说法正确的是________.(填序号)①y=2x2+1中的x、y是具有相关关系的两个变量②正四面体的体积与其棱长具有相关关系③电脑的销售量与电脑的价格之间是一种确定性的关系④传染病医院感染甲型H1N1流感的医务人员数与医院收治的甲型流感人数是具有相关关系的两个变量2.某考察团对全国10大城市进行职工人均工资水平x(千元)与居民人均消费水平y(千元)统计调查,y与x具有相关关系,线性回归方程为错误!=0.66x+1.562,若某城市居民人均消费水平为7。
2018年高三数学(北师大版)选修1-2精品学案:第一章 统计案例 第1课时 回归分析
第1课时回归分析1.会对两个变量的相关关系进行分析、判断.2.了解回归分析的基本思想,会对两个变量的具体问题进行回归分析.3.掌握运用最小二乘法建立回归模型的基本步骤和方法.重点:熟练掌握回归分析,建立回归模型,求各相关指数的步骤.难点:如何求回归直线方程以及对相关系数r的理解和运用.我们每个人都有自己的身高和体重,那么如果把身高和体重分别作为变量,它们能够构成函数关系吗?问题1:散点图在考虑两个量的关系时,为了对变量之间的关系有一个大致的了解,人们通常将变量所对应的点描出来,这些点就组成了变量之间的一个图,通常称这种图为变量之间的散点图.问题2:相关关系与线性回归相关关系:对于两个变量,当自变量取值一定时,因变量的取值带有一定随机性的两个变量之间的关系称为相关关系.相关关系分为线性相关和非线性相关.函数关系中的两个变量间是一种确定性关系,相关关系是一种非确定性关系.线性回归:对具有相关关系的两个变量进行统计分析的一种常用方法.问题3:线性相关系数r=称为两个变量数据(x i,y i)(i=1,2,…,n)的线性相关系数.r用来刻画两个变量的线性回归效果:当r>0时,表明两个变量正相关;当r<0时,表明两个变量负相关;r的绝对值越接近于0时,表明两个变量之间越不存在线性相关关系.问题4:线性回归分析的步骤对于一组具有线性相关关系的数据:(x1,y1),(x2,y2),…,(x n,y n).(1)画散点图:看散点图是否呈条状分布.(2)求回归直线方程(最小二乘法):b=,=x i,=y i,其中(,)为样本中心点,回归直线方程必经过样本中心点(,),得a= -b;(3)得出相关结论:回归直线方程为y=a+bx,利用回归直线方程进行预测.“一只蝴蝶在巴西扇动翅膀,有可能会在美国的德克萨斯州引起一场龙卷风.”这就是洛伦兹1979年12月在华盛顿的“美国科学促进会”上的一次演讲中提出的“蝴蝶效应”.这次演讲给人们留下了极其深刻的印象.从此以后,所谓“蝴蝶效应”之说就不胫而走,名声远扬.“蝴蝶效应”之所以令人着迷、令人激动、发人深省,不但在于其大胆的想象力和迷人的美学色彩,而且在于其深刻的科学内涵和内在的哲学魅力.1.下列关系不属于相关关系的是().A.父母的身高与子女的身高B.人的身高与体重C.居民的收入与消费D.正方体的表面积和体积【解析】相关关系是一种非确定性关系,而D项是确定的关系,为函数关系,故选D.【答案】D2.设两个变量x与y之间具有线性相关关系,相关系数是r,回归方程为y=a+bx,那么必有().A.b与r符号相同B.a与r符号相同C.b与r符号相反D.a与r符号相反【解析】因为b与r的分母均为正,且分子相同,所以b与r同号.【答案】A3.某医院用光电比色检验尿汞时,得到尿汞含量x(毫克/升)与消化系数y的一组数据如下表:若x与y具有线性相关关系,则回归直线方程是.【解析】利用公式b==26.95,a=-b=28.7,从而回归直线方程为y=26.95x+28.7.【答案】y=26.95x+28.74.某10名同学的数学、物理、语文成绩如下表:试分别研究他们的数学成绩与物理成绩的关系、数学成绩与语文成绩的关系,你能发现什么规律?【解析】可求出物理成绩与数学成绩的相关系数r≈0.87,从而认为物理成绩与数学成绩之间具有很强的线性相关关系.而由语文成绩与数学成绩的相关系数|r|≈0.092很接近0,说明语文成绩与数学成绩不具有线性相关关系.因此,数学成绩好的同学,一般来说物理成绩也较好,它们之间的联系较紧密,而数学成绩好的同学,语文成绩可能好也可能差,它们之间的关系不大.相关关系的判断与分析有下列关系:①人的年龄与他(她)拥有的财富之间的关系;②曲线上的点与该点的坐标之间的关系;③苹果的产量与气候之间的关系;④森林中的同一种树木,其断面直径与高度之间的关系;⑤学生与他(她)的学号之间的关系.其中有相关关系的是(填写你认为正确的序号).【方法指导】根据相关关系的概念进行判断.【解析】【答案】①③④【小结】相关关系是一种非确定性关系,是指两个变量之间有关系,但是两者之间的关系还受其他因素的影响,只是影响大小的问题.回归直线过样本中心点(,)的性质的应用观察两个相关变量的如下数据:则两个变量间的回归直线方程为().A.y=0.5x-1B.y=xC.y=2x+0.3D.y=x+1【方法指导】根据回归直线方程y=a+bx经过样本中心点(,)可计算出结果.【解析】∵=0,=0,回归直线方程经过样本中心点(,),代入所给选项中检验,可知,只有y=x 符合条件.【答案】B先判定相关性,再求回归直线方程某种图书每册的成本费y(元)与印刷册数x(千册)有关,经统计得到数据如下:检验每册书的成本费y与印刷册数的倒数之间是否有线性相关关系?如果有,求出y 对x的回归方程.【方法指导】本题是非线性回归分析问题,不妨设变量u=,题意要求对u与y作相关性检验,如果它们具有线性相关关系,就可以进一步求出y对u的回归直线方程,这时,再回代u=,就得到了y对x的回归曲线方程.【解析】将上表数据列表分析如下:∴=42.1,=1772.41,=3.14,n=10,10=1321.94,可以求得r=0.9998,由r=0.9998,因此变量y 与之间具有较强的线性相关关系.∵b====-0.02,∴a=-b=3.14-(-0.02)×42.1=3.98.∴y与x的回归方程为y=3.98-0.02x.[问题]当x=1时,由回归方程得y=3.96,而实际上y=10.15,为什么有这么大的偏差?上述回归方程是y与x的回归方程吗?[结论]因为y与之间具有较强的线性相关关系,而y与x之间没有明显的线性相关关系,故应先通过变量变换(即换元),令u=,并通过对u与y作相关性检验,求出y对u的回归直线方程,最后再回代u=,得到y对x的回归方程.于是正确解如下:首先作变量变换,令u=,则题目所给数据变成如下表所示的数据:可以求得r≈0.9998,因此变量y与u之间具有较强的线性相关关系,并且b≈8.973,a=-b≈1.125,最后回代u=可得y=+1.125.因此y与x的回归方程为y=+1.125.【小结】本题中y与x之间不具有线性相关关系,因而是非线性回归分析问题,对此类回归分析问题,应先求线性相关系数r,利用r来判断两个变量之间是否具有线性相关关系.当|r|越接近1时,认为线性相关关系越强,可以求回归直线方程,并可用求得的回归直线方程来预测变量的取值;当|r|越接近0时,认为两个变量之间线性相关关系越不显著,这时求回归直线方程没有多大的实际价值,要采用变量变换(即换元法)转化为线性回归问题求解.由施肥量x.【解析】散点图为:通过图像可知是正相关.已知x、y,且y=0.95x+a,求a的值.【解析】由表中数据得=2,=4.56,由于线性回归方程一定经过样本中心点(,),即(2,4.56),在回归直线方程y=bx+a中,代入点(2,4.56)得a=-b=4.56-0.95×2=2.66.10其中x为高一数学成绩,y为高二数学成绩.(1)y与x是否具有相关关系;(2)如果y与x具有相关关系,求回归直线方程.【解析】(1)由已知表格中的数据,利用计算器进行计算得=71,=72.3,x i y i=51467,=50520,=52541.则r==≈0.78.即认为x与y之间具有线性相关关系.(2)y与x具有线性相关关系,设回归直线方程为y=a+bx,则b==≈1.22,a=-b=72.3-1.22×71=-14.32,所以y关于x的回归直线方程为y=1.22x-14.32.1.对相关系数r,下列说法正确的是().A.r越大,两变量的线性相关程度越大B.r越小,两变量的线性相关程度越大C.|r|越大,两变量的线性相关程度越大;|r|越小,两变量的线性相关程度越小D.|r|≤1,且|r|越接近1,两变量的线性相关程度越大;|r|越接近0,两变量的线性相关程度越小【解析】由两个变量的相关系数公式r=可知,相关程度的强弱与|r|和1的接近程度有关,|r|越接近1,两变量的线性相关程度越大,|r|越接近0,两变量的线性相关程度越小.【答案】D2.工人月工资y(元)关于劳动生产率x(千元)的回归方程为y=650+80x,下列说法正确的个数是().①劳动生产率为1000元,工资约为730元;②劳动生产率提高1000元,则工资约提高80元;③劳动生产率提高1000元,则工资约提高730元;④当月工资为810元,劳动生产率约为2000元.A.1B.2C.3D.4【解析】①②④正确,注意单位的一致性,故选C.【答案】C3.若预报体重y(kg)和身高x(cm)之间的线性回归方程为y=0.849x-85.712,如果要找到体重为41.638 kg的人,(填“一定”或“不一定”)在身高为150 cm的人群中.【解析】体重不仅受身高的影响,还受其他因素的影响.【答案】不一定4.某个体服装店经营某种服装,一周内获纯利润y(元)与该周每天销售这种服装的件数x之间的一组数据如下:已知=280,=45309,x i y i=3487.(1)求,;(2)一周内获纯利润y与该周每天销售件数x之间是否线性相关?如果线性相关,求出回归直线方程.【解析】(1)=(3+4+5+6+7+8+9)=6,=(66+69+73+81+89+90+91)≈79.86.(2)根据已知=280,=45309,x i y i=3487,得相关系数r=≈0.973.所以纯利润y与每天销售件数x之间具有显著的线性相关关系.利用已知数据可求得回归直线方程为y=4.746x+51.386.(2013年·湖南卷)四名同学根据各自的样本数据研究变量x,y之间的相关关系,并求得回归直线方程,分别得到以下四个结论:①y与x负相关且y=2.347x-6.423;②y与x负相关且y=-3.476x+5.648;③y与x正相关且y=5.437x+8.493;④y与x正相关且y=-4.326x-4.578.其中一定不正确的结论的序号是().A.①②B.②③C.③④D.①④【解析】由正相关、负相关的性质可知在①中,斜率为2.347>0,不可能负相关;在④中,斜率为-4.326<0,不可能正相关,故①④一定不正确.选D.【答案】D1.下列两个变量之间的关系是相关关系的是().A.圆的面积与半径B.球的体积与半径C.角度与它的正弦值D.一个考生的数学成绩与物理成绩【解析】由题意知A表示圆的面积与半径之间的关系S=πr2;B表示球的体积与半径之间的关系V=πr2;C表示角度与它的正弦值y=sin α,以上所说的都是确定的函数关系,相关关系不是确定性的关系,故选D.【答案】D2.在对两个变量x,y进行线性回归分析时有下列步骤:①对所求出的回归方程作出解释;②收集数据(x i,y i),其中i=1,2,…,n;③求线性回归方程;④求相关系数;⑤根据所搜集的数据绘制散点图.如果根据可靠性要求能够作出变量x,y具有线性相关结论,那么在下列操作顺序中正确的是().A.①②⑤③④B.③②④⑤①C.②④③①⑤D.②⑤④③①【解析】根据线性回归分析思想可知,两个变量x,y进行线性回归分析时,应先收集数据(x i,y i),然后绘制散点图,再求相关系数和线性回归方程,最后对所求的回归方程作出解释,因此选D.【答案】D3.如图所示有5组数据,去掉后,剩下的4组数据的线性相关性更强.【解析】根据散点图判定两变量的线性相关性,样本数据点越集中在某一直线附近,这两变量的线性相关性越强,显然去掉D(3,10)后,其余各点更能集中在某一直线附近,即线性相关性更强.【答案】D(3,10)4.一个工厂在某年里每月产品的总成本y(万元)与该月产量x(万件)之间由如下一组数据:(1)画出散点图;(2)检验相关系数r的显著性水平;(3)求月总成本y与月产量x之间的回归直线方程.【解析】(1)画出散点图,如图所示.(2)r==≈0.99,这说明每月产品的总成本y(万元)与该月产量x(万件)之间存在显著的线性相关关系.(3)设回归直线方程y=bx+a,利用计算a,b,得b≈1.215,a=-b≈0.974,即回归直线方程为y=1.215x+0.974.5.设一个回归方程为y=3-5x,当变量x增加一个单位时().A.y平均增加3个单位B.y平均减小5个单位C.y平均增加5个单位D.y平均减小3个单位【解析】-5是斜率的估计值,说明x每增加一个单位,y平均减少5个单位.【答案】B6.对于一组具有线性相关关系的数据(x1,y1),(x2,y2),…,(x n,y n),其回归方程的截距为().A.a=y+bxB.a=+bC.a=y-bxD.a=-b【解析】回归直线方程中的截距即为a,由公式=b+a得a=-b,故选D.【答案】D7.许多因素都会影响贫穷,教育也许是其中之一,在研究这两个因素的关系时收集了美国50个州的成年人受过9年或更少教育的百分比(x)和收入低于官方规定的贫困线的人数占本州人数的百分比(y)的数据,建立的回归直线方程为y=0.8x+4.6,则成年人受过9年或更少教育的百分比(x)和收入低于官方的贫困线的人数占本州人数的百分比(y)之间的相关系数.(填“大于0”或“小于0”)【解析】一个地区受过9年或更少教育的百分比每增加1%,收入低于官方规定的贫困线的人数占本州人数的百分比将增加0.8%左右.【答案】大于08.假设关于某设备的使用年限x和所支出的维修费用y(万元)有如下的统计资料:若由资料知y对x呈线性相关关系.试求:(1)线性回归方程y=bx+a的回归系数a,b;(2)估计使用年限为10年时的维修费用.【解析】(1)制表如下:于是b===1.23,a=-b=5-1.23×4=0.08.(2)由(1)知回归直线方程为y=1.23x+0.08,当x=10时,y=1.23×10+0.08=12.3+0.08=12.38,即估计使用10年时的维修费用是12.38万元.9.若y与x之间的一组数据如下:则拟合这5对数据的回归直线一定经过的点是.【解析】根据回归直线y=bx+a一定过样本中心点(,),且==2,==4,知点(2,4)一定在回归直线上.【答案】(2,4)10.某工业部门进行一项研究,分析该部门的产量与生产费用之间的关系,从这个工业部门内随机抽选了10个企业作样本,有如下资料:完成下列要求:(1)计算x与y的相关系数;(2)这两个变量之间是否线性相关?若线性相关,求回归直线方程y=bx+a.【解析】(1)制表如下:r=≈0.808.即x与y的相关系数r≈0.808.(2)因为r较接近1,所以x与y之间具有很强的线性相关关系.则b=≈0.398,a=165.7-×77.7b≈134.8,所以回归直线方程为y=0.398x+134.8.。
2018年陕西省高三数学第1章《统计案例》导学案:1.1.1回归分析的基本思想及其初步应用(2)
1. 通过典型案例的探究,进一步了解回归分析的基本思想、方法及初步应用;2. 了解评价回归效果的三个统计量:总偏差平方和、残差平方和、回归平方和.3. 会用相关指数,残差图评价回归效果.47复习1:用相关系数r可衡量两个变量之间关系.r>0, 相关,r<0 相关;r越接近于1,两个变量的线性相关关系,它们的散点图越接近;r>,两个变量有关系.复习2:评价回归效果的三个统计量:总偏差平方和;残差平方和;回归平方和.二、新课导学※学习探究探究任务:如何评价回归效果?新知:1、评价回归效果的三个统计量(1)总偏差平方和:(2)残差平方和:(3)回归平方和:2、相关指数:2R表示对的贡献,公式为:2R=2R的值越大,说明残差平方和,说明模型拟合效果.3、残差分析:通过来判断拟合效果.通常借助图实现.残差图:横坐标表示,纵坐标表示.残差点比较均匀地落在的区的区域中,说明选用的模型,带状区域的宽度越,说明拟合精度越,回归方程的预报精度越.小结:分清总偏差平方和、残差平方和、回归平方和,初步了解如何评价两个不同模型拟合效果的好坏.例2 假定小麦基本苗数x 与成熟期有效苗穗y 之间存在相关关系,今测得5组数据如下:(2)求回归方程并对于基本苗数56.7预报期有效穗数;(3)求2R ,并说明残差变量对有效穗数的影响占百分之几.(参考数据:2115101.51,6746.76,n ni i i i i x x y ====∑∑ 521()50.18i i yy =-=∑, 521()9.117i i i y y =-=∑)※ 动手试试练1. 某班5名学生的数学和物理成绩如下表:(4)求学生A,B,C,D,E 的物理成绩的实际成绩和回归直线方程预报成绩的差2i i e y y =-.并作出残差图评价拟合效果.小结:1. 评价回归效果的三个统计量:2. 相关指数评价拟合效果:3. 残差分析评价拟合效果:三、总结提升※ 学习小结一般地,建立回归模型的基本步骤:1、确定研究对象,明确解释、预报变量;2、画散点图;3、确定回归方程类型(用r 判定是否为线性);4、求回归方程;5、评价拟合效果.※ 知识拓展在现行回归模型中,相关指数2R 表示解释变量对预报变量的贡献率,2R 越接近于1,表示回归效果越好.如果某组数据可以采取几种不同的回归方程进行回归分析,则可以通过22R 大的模型.※ 自我评价 你完成本节导学案的情况为( ).A. 很好B. 较好C. 一般D. 较差※ 当堂检测(时量:5分钟 满分:10分)计分:1. 两个变量 y 与x 的回归模型中,分别选择了 4 个不同模型,它们的相关指数 2R 如下 ,其中拟合效果最好的模型是( ).A. 模型 1 的相关指数2R 为 0.98B. 模型 2 的相关指数2R 为 0.80C. 模型 3 的相关指数2R 为 0.50D. 模型 4 的相关指数2R 为 0.252. 在回归分析中,残差图中纵坐标为( ).A. 残差B. 样本编号C. xD. n e3. 通过12,,,n e e e 来判断模拟型拟合的效果,判断原始数据中是否存在可疑数据,这种分工称为().A.回归分析B.独立性检验分析C.残差分析D. 散点图分析4.2R越接近1,回归的效果.5. 在研究身高与体重的关系时,求得相关指数2R ,可以叙述为“身高解释了69%的体重变化,而随机误差贡献了剩余”所以身高对体重的效应比随机误差的.。
2018年陕西省高三数学第1章《统计案例》导学案:1.1.3可线性化的回归分析
;2. 通过探究使学生体会有些非线性模型通过变换可以转化为线性回归模型,了解在解决实际问题的过程中寻找更好的模型的方法.3. 了解常用函数的图象特点,选择不同的模型建模,并通过比较相关指数对不同的模型进行比较.47复习1:求线性回归方程的步骤复习2:作函数和的图像2x y =20.25y x =+二、新课导学※ 学习探究探究任务:如何建立非线性回归模型?实例一只红铃虫的产卵数和温度有关,现收集了7组观测数据列于下表中,试建立y x 与之间的回归方程.y x 温度/x C 21232527293235产卵数个y 711212466115325(1)根据收集的数据,做散点图上图中,样本点的分布没有在某个 区域,因此两变量之间不呈 关系,所以不能直接用线性模型.由图,可以认为样本点分布在某一条指数函数曲线的周围(bx a y e +=为待定系数).,a b对上式两边去对数,得ln y =令,则变换后样本点应该分布在直线ln ,z y = 的周围.这样,就利用 模型来建立y 和x 的非线性回归方程.x21232527293235y711212466115325ln z y=作散点图(描点)(,)i i x z由上表中的数据得到回归直线方程z= 因此红铃虫的产卵数和温度的非线性回归方程为y x ※ 典型例题例1一只红铃虫的产卵数和温度有关,现收集了7组观测数据列于下表中,y x 温度/x C 21232527293235产卵数个y 711212466115325(散点图如由图,可以认为样本点集中于某二次曲线的附近,其中为234y c x c =+12,c c 待定参数)试建立与之间的回归方程.y x思考:评价这两个模型的拟合效果.三、总结提升※ 学习小结利用线性回归方程探究非线性回归问题,可按“作散点图建模确定方程”这三个步→→骤进行.※ 知识拓展非线性回归问题的处理方法:1、指数函数型bx ay e +=① 函数的图像:bx a y e +=② 处理方法:两边取对数得,即.令把原始数据ln ln()bx a y e +=ln y bx a =+ln ,z y =(x,y )转化为(x,z ),再根据线性回归模型的方法求出.,b a 2、对数曲线型ln y b x a =+① 函数的图像ln y b x a =+② 处理方法:设,原方程可化为ln x x '=y bx a '=+再根据线性回归模型的方法求出.,a b 3、型2y bx a =+处理方法:设,原方程可化为,再根据线性回归模型的方法求出.2x x '=y bx a '=+,a b). A. 很好 B. 较好 C. 一般 D. 较差※ 当堂检测(时量:5分钟 满分:10分)计分:2. 在回归分析中,求得相关指数,则( ).20.89R =A. 解释变量解对总效应的贡献是 11%B. 解释变量解对总效应的贡献是 89%C. 随机误差的贡献是89%D. 随机误差的贡献是0.89%3. 通过来判断模拟型拟合的效果,判断原始数据中是否存在可疑数据,这种分12,,,n e e e 析称为( ).A .回归分析B .独立性检验分析C .残差分析 D. 散点图分析4.在研究两个变量的相关关系时,观察散点图发现样本点集中于某一条指数曲线的bx a y e +=周围,令,求得回归直线方程为,则该模型的回归方程为 .ln z y =0.25 2.58zx =- 5. 已知回归方程,则时,y 的估计值为.0.5ln ln 2y x =-100x =天数x /天123456繁殖个数y /个612254995190。
2018年陕西省高三数学第1章《统计案例》导学案:1.1回归分析与相关系数习题
1. 通过典型案例的探究,进一步了解回归分析的基本思想、方法及初步应用;2. 了解评价回归效果的三个统计量:总偏差平方和、残差平方和、回归平方和.3. 会用相关指数,残差图评价回归效果.一、基础过关1.下列变量之间的关系是函数关系的是() A.已知二次函数y=ax2+bx+c,其中a,c是已知常数,取b为自变量,因变量是这个函数的判别式Δ=b2-4acB.光照时间和果树亩产量C.降雪量和交通事故发生率D.每亩施用肥料量和粮食产量2.在以下四个散点图中,其中适用于作线性回归的散点图为() A.①②B.①③C.②③D.③④3.下列变量中,属于负相关的是() A.收入增加,储蓄额增加B.产量增加,生产费用增加C.收入增加,支出增加D.价格下降,消费增加4.已知对一组观察值(x i,y i)作出散点图后确定具有线性相关关系,若对于y=bx+a,求得b=0.51,x=61.75,y=38.14,则线性回归方程为() A.y=0.51x+6.65 B.y=6.65x+0.51C.y=0.51x+42.30 D.y=42.30x+0.515. 对于回归分析,下列说法错误的是 ( )A .在回归分析中,变量间的关系若是非确定关系,那么因变量不能由自变量唯一确定B .线性相关系数可以是正的,也可以是负的C .回归分析中,如果r 2=1,说明x 与y 之间完全相关D .样本相关系数r ∈(-1,1)6. 下表是x 和y 之间的一组数据,则y 关于x 的回归方程必过( )A.点(2,3) C .点(2.5,4)D .点(2.5,5)7. 若线性回归方程中的回归系数b =0,则相关系数r =________. 二、能力提升8. 某医院用光电比色计检验尿汞时,得尿汞含量(mg/L)与消光系数计数的结果如下:若y 与x .9. 若施化肥量x (kg)与小麦产量y (kg)之间的线性回归方程为y =250+4x ,当施化肥量为50 kg 时,预计小麦产量为________ kg.10.某车间为了规定工时定额,需确定加工零件所花费的时间,为此做了4次试验,得到的数据如下:若加工时间y (1)求加工时间与零件个数的线性回归方程; (2)试预报加工10个零件需要的时间.11.在一段时间内,分5次测得某种商品的价格x (万元)和需求量y (t)之间的一组数据为:已知∑5i =1x i y i =62,∑i =1x 2i =16.6. (1)画出散点图;(2)求出y 对x 的线性回归方程;(3)如果价格定为1.9万元,预测需求量大约是多少?(精确到0.01 t).。
2018年陕西省高三数学第1章《统计案例》导学案:第一章复习
一、选择题1、散点图在回归分析中的作用是 ( )A .查找个体数目B .比较个体数据关系C .探究个体分类D .粗略判断变量是否呈线性关系4、下列说法正确的是 ( )A .任何两个变量都具有相关系B .球的体积与球的半径具有相关关系C .农作物的产量与施肥量是一种确定性关系D .某商品的产量与销售价格之间是非确定性关系5、在画两个变量的散点图时,下面哪个叙述是正确的 ( )A. 预报变量在x 轴上,解释变量在 y 轴上B. 解释变量在x 轴上,预报变量在 y 轴上C. 可以选择两个变量中任意一个变量在x 轴上D. 可以选择两个变量中任意一个变量在 y 轴上6、回归直线必过 ( ) y bx a =+ A . B . C . D .(0,0)(,0)x (0,)y (x y7、三维柱形图中,主、副对角线上两个柱形高度的 相差越大,要推断的论述成立的可能性就越大 ( )A .和B .差C .积D .商8、两个变量 y 与x 的回归模型中,求得回归方程为,当预报变量0.232x y e -=10x =( )A. 解释变量B. 解释变量大于30y e -=y 30e -C. 解释变量小于D. 解释变量在左右y 30e -y 30e -9、在回归分析中,求得相关指数,则( )20.89R =A. 解释变量解对总效应的贡献是11%B. 解释变量解对总效应的贡献是 89%C. 随机误差的贡献是89%C. 随机误差的贡献是0.89%10、在吸烟与患肺病这两个分类变量的计算中,下列说法正确的是 ( )A .若k =6.635,则有99%的把握认为吸烟与患肺病有关,那么100名吸烟者中,有99个患肺病.B .从独立性检验可知,有99%的把握认为吸烟与患肺病有关时,可以说某人吸烟,那么他有99%的可能性患肺病.C .若从统计量中求出有95%的把握认为吸烟与患肺病有关,是指有5%的可能性使得推断出现错误.D .以上三种说法都不对.11、3. 通过来判断模拟型拟合的效果,判断原始数据中是否存在可疑数据,这12,,,n e e e 种分析称为( )A .回归分析B .独立性检验分析C .残差分析D. 散点图分析12、在独立性检验时计算的的观测值=3.99,那么我们有 的把握认为这两个分2K k 类变量有关系 ( )A .90%B .95%C .99%D .以上都不对二、填空题13、已知回归直线方程,则时,y 的估计值为 .0.50.81y x =-25x =14、如下表所示:计算= .2K 15、下列关系中:(1)玉米产量与施肥量的关系;(2)等边三角形的边长和周长;(3)电脑的销售量和利润的关系;(4)日光灯的产量和单位生产成本的关系.不是函数关系的是.16、在一项打鼾与患心脏病的调查中,共调查1768人,经计算的=27.63,根据这一数2K 据分析,我们有理由认为打鼾与患心脏病是 的.(填“有关”“无关”)三、解答题18、为考察某种药物预防疾病的效果,进行动物试验,得到如下列联表能以97.5%的把握认为药物有效吗?为什么?不健康健 康总计不优秀41626667优 秀37296333总 计789221000患 病未患病总 计用 药41626667不用药37296333总 计789221000。
2018版高中数学第一章统计1.3统计图表学案
统计图表1.掌握常用四种统计图表(条形统计图、扇形统计图、折线统计图和茎叶图)的功能及其特点.(重点)2.能针对实际问题和收集到的数据的特点,选择科学的统计图表.(难点)3.能从统计图表中获取有价值的信息.(难点、易错点)[基础·初探]教材整理1 统计图表阅读教材P16~P20“练习1”以上部分,完成下列问题.1.条形统计图条形统计图是用一个单位长度表示一定的数量,根据数量的多少画成长短不同的直条,然后把这些直条按照一定的顺序排列起来.其优点是便于看出和比较各种数量的多少,即条形统计图能清楚地表示出每个项目的具体数目,易于比较数据间的差别.缺点是不能明确显示部分与整体的对比.2.折线统计图建立直角坐标系,用横轴上的数字表示样本值,用纵轴上的单位长度表示一定的数量,根据样本值和数量的多少描出相应点,然后用直线段顺次连接相邻点,得到一条折线,用这条折线表示样本数据情况,这种表述和分析数据的统计图称为折线统计图.折线统计图不但可以表示数量的多少,而且能够用折线的起伏清楚直观地表示数量的增减变化的情况,但不适合总体分布较多的情况.3.扇形统计图扇形统计图中,用圆面积代表总体,圆面中的各个扇形分别代表总体中的不同部分,扇形面积的大小反映所表示的那部分占总体的百分比的大小.优点:扇形统计图可以很清楚地表示各部分数量同总数之间的关系,即扇形统计图能清楚地表示出各部分在总体中所占的百分比.缺点:会丢失部分数据信息且不适合总体中部分较多的情况.判断(正确的打“√”,错误的打“×”)(1)扇形统计图比其他统计图更优越.( )(2)统计图和统计表相比,用直线、折线来说理比用数据说理来的形象一些,数量关系也更明显.( )(3)要反映台州市某一周每天的最高气温的变化趋势,宜采用条形统计图.( )【解析】(1)×,扇形统计图与其他统计图各有优缺点.(2)√,统计图比统计表表达的更明确.(3)×,适合用折线统计图.【答案】(1)×(2)√(3)×教材整理2 茎叶图阅读教材P21第三自然段到P22“信息技术应用”以上部分,完成下列问题.1.茎叶图茎叶图的制作:茎相同的共用一个茎,茎按从小到大的顺序从上到下列出,共茎的叶一般按从大到小或从小到大的顺序同时列出.2.用茎叶图表示数据有两个突出特点第一,统计图上没有信息的损失,所有的原始数据都可以从这个茎叶图中得到;第二,茎叶图可以随时记录,方便表示与比较.但是,当数据量很大或有多组数据时,茎叶图就不那么直观、清晰了.判断(正确的打“√”,错误的打“×”)(1)制作茎叶图时,茎叶图的茎按从小到大的顺序从上向下列出,共茎的叶一般按从大到小(或从小到大)的顺序同行列出.( )(2)茎叶图只方便记录两组的数据,两个以上的数据虽然能够记录,但是没有表示两个记录那么直观,清晰.( )(3)茎叶图对重复出现的数据不可以重复记录.( )【解析】(1)√,结合茎叶图的做法,茎按从小到大的顺序从上向下列出,叶无规定的顺序.(2)√,结合茎叶图的特点可知,用茎叶图表达两组数据很方便,但若是多组数据,却不是那么方便,直观、清晰了.(3)×,茎叶图中的数据应当全部记录,不可以遗漏,包括重复数据.【答案】(1)√(2)√(3)×[小组合作型]条形统计图为了丰富校园文化生活,某校计划在午间校园广播台播放“百家讲坛”的部分内容.为了了解学生的喜好,抽取若干名学生进行问卷调查(每人只选一项内容),整理调查结果,绘制统计图如图131所示.图131请根据统计图提供的信息回答以下问题:(1)求抽取的学生数;(2)若该校有3 000名学生,估计喜欢收听易中天《品三国》的学生人数;(3)估计该校喜欢收听刘心武评《红楼梦》的女学生人数约占全校学生人数的百分比.【精彩点拨】 先搞清条形图中横轴及纵轴所表示的实际意义,然后根据条形图中的有关数据做出回答.【自主解答】 (1)从统计图上可以看出:喜欢收听于丹析《庄子》的男生有20人,女生有10人;喜欢收听《故宫博物院》的男生有30人,女生有15人;喜欢收听于丹析《论语》的男生有30人,女生有38人;喜欢收听易中天《品三国》的男生有64人,女生有42人;喜欢收听刘心武评《红楼梦》的男生有6人,女生有45人.所以抽取的学生数为20+10+30+15+30+38+64+42+6+45=300(人).(2)喜欢收听易中天《品三国》的男生有64人,女生有42人,共有106人,占所抽取总人数的比例为106300, 由于该校有3 000名学生,因此可以估计喜欢收听易中天《品三国》的学生有106300×3 000=1 060(名).(3)该校喜欢收听刘心武评《红楼梦》的女学生人数约占全校学生人数的比例为45300×100%=15%.1.在绘制条形统计图时,要搞清统计图的横轴和纵轴所表示的实际意义.2.条形统计图是用一个单位长度表示一定的数量,根据数量的多少画成长短不同的直条,然后把这些直条按照一定的顺序排列起来;其特点是便于看出和比较各种数量的多少,即条形统计图能清楚地表示出每个项目的具体数目.[再练一题]1.为了解学生身高情况,某校以10%的比例对全校700名学生按性别进行分层抽样调查,测得学生的身高情况的统计图如图132所示.【导学号:】图132(1)估计该校男生的人数;(2)估计该校学生身高在170~185 cm 之间的学生占总人数的百分比是多少.【解】 (1)样本中男生人数为40人,由分层抽样比例为10%,估计全校男生人数为400人.(2)由统计图知,样本中身高在170~185 cm 之间的学生有14+13+4+2+3+1=37(人),样本容量为70,所以样本中学生身高在170~185 cm 之间的占3770≈53%,故可估计该校学生身高在170~185 cm 之间的学生占总人数的53%.折线统计图与扇形统计图绘制的折线统计图,试根据折线统计图反映的信息,绘制该市3月1日到10日最低气温(单位:℃)的条形统计图和扇形统计图.图133【精彩点拨】 根据折线图得出与日期对应的温度列成表格,经过分析后绘制出条形统计图和扇形统计图.【自主解答】 该城市3月1日至10日的最低气温(单位:℃)情况如下表:日期12345678910最低-3-20-1120-122气温扇形统计图如图所示:1.折线统计图是用一个单位长度表示一定的数量,根据数量的多少描出各点,然后把各点用线段顺次连接起来.折线统计图不但可以表示出数量的多少,而且能够清楚地表示数量增减变化的情况,即折线统计图能够清晰地反映数据的变化情况.2.扇形统计图中,用圆面代表总体,圆面中的各个扇形分别代表总体中的不同部分,扇形的大小反映部分占总体的百分比的大小.扇形统计图可以很清楚地表示各部分数量同总数之间的关系,即扇形统计图能清楚地表示出各部分在总体中所占的百分比.[再练一题]2.贵阳市是我国西部的一个多民族城市,总人口数为370万(2000年普查统计).如图134和图135所示的是2000年该市各民族人口的统计图,请你根据统计图提供的信息回答下列问题.图13 4 图135(1)2000年贵阳市少数民族的总人口数是多少(2)2000年贵阳市总人口中的苗族所占的百分比是多少(3)若2000年贵阳市参加中考的学生有40 000人,则参加中考的少数民族的学生人数约为多少【解】(1)15%×370=(万人),即2000年贵阳市少数民族的总人口数是万人.(2)40%×15%=6%,即2000年贵阳市总人口中的苗族所占的百分比为6%.(3)40 000×15%=6 000(人),即2000年贵阳市参加中考的少数民族的学生约有6000人.[探究共研型]茎叶图探究1【提示】一般地说,数据是两位数时,十位上数字为“茎”,个位数字为“叶”,如果是小数时,通常把整数部分作为“茎”,小数部分作为“叶”.探究2 茎叶图的应用范围是什么【提示】茎叶图只适用于样本数据较少的情况.探究3 茎叶图有什么优缺点【提示】优点:能保留原始数据,并随时记录,记录和表示比较方便.缺点:当数据量很大或有多组数据时不便表示.某赛季甲、乙两名篮球运动员每场比赛的得分情况如下:甲的得分:12,15,24,25,31,31,36,36,37,39,44,49,50;乙的得分:8,13,14,16,23,26,28,33,38,39,51.(1)画出甲、乙两名运动员得分数据的茎叶图;(2)根据茎叶图分析甲、乙两名运动员的水平.【精彩点拨】(1)利用十位数作“茎”,个位数作为“叶”绘制.(2)根据数据的对称情况进行判断.【自主解答】(1)做出茎叶图如下图:(2)由上面的茎叶图可以看出,甲运动员的得分情况是大致对称的;乙运动员的得分情况除一个特殊得分外,也大致对称.因此甲运动员的发挥比较稳定,总体得分情况比乙运动员好.1.画茎叶图时,用中间的数表示数据的十位或百位数,两边的数分别表示两组数据的个位数.要先确定中间的数取数据的哪几位,填写数据时边读边填.比较数据时从数据分布的对称性、中位数、稳定性等几方面来比较.2.绘制茎叶图的关键是分清茎和叶,一般地说数据是两位数时,十位数字为“茎”,个位数字为“叶”;如果是小数的,通常把整数部分作为“茎”,小数部分作为“叶”.解题时要根据数据的特点合理选择茎和叶.[再练一题]3.某良种培育基地正在培育一种小麦新品种A.将其与原有的一个优良品种B进行对照试验.两种小麦各种植了25亩,所得亩产数据(单位:千克)如下:品种A:357,359,367,368,375,388,392,399,400,405,412,414,415,421,423,423, 427,430,430,434,443,445,445,451,454;品种B:363,371,374,383,385,386,391,392,394,394,395,397,397,400,401,401, 403,406,407,410,412,415,416,422,430.(1)画出两种小麦亩产的茎叶图;(2)用茎叶图处理现有的数据,有什么优点(3)通过观察茎叶图,对品种A与B的亩产量及其稳定性进行比较,写出统计结论.【解】(1)茎叶图如图所示:(2)用茎叶图处理现有数据不仅可以看出数据的分布状况,而且可以看出每组中的具体数据.(3)通过观察茎叶图,可以发现品种A的亩产量不稳定,而品种B的亩产量比较集中.所以品种B的亩产量较稳定.1.没有信息的损失,所有的原始数据都可以从图中得到的统计图是( )A.折线统计图B.扇形统计图C.条形统计图D.茎叶图【解析】结合各个统计图的特点可知,茎叶图可以保留原始数据,且没有信息损失.【答案】D2.当收集到的数据量很大或有多组数据时,用哪种统计图表示较合适( )A.茎叶图B.条形统计图C.折线统计图D.扇形统计图【解析】结合各种统计图的特征知适合用条形统计图.【答案】B3.如图136所示是从一批产品中抽样得到的数据的条形统计图,由图可看出数据出现机会最大的范围是( )图136A., B.,C., D.,【解析】由图可以看出数据出现在,范围内的机会最大.【答案】C4.如图137是华联商厦某个月甲、乙、丙三种品牌彩电的销售量统计图,则甲、丙两种品牌彩电该月的销售量之和为________台.图137【解析】由图知甲品牌该月的销售量为45台,乙品牌该月的销售量为20台,丙品牌该月的销售量为30台,故甲、丙品牌销售量之和为75台.【答案】755.从全年级的两个班的考试成绩中每班任意抽取20名学生的数学成绩(满分150分)如下:甲班:120,118,135,134,140,146,108,110,98,88,142,126,118,112,95,103,148, 92,121,132;乙班:138,124,147,96,108,117,125,137,119,108,132,121,97,104,114,135,127, 124,135,107试用茎叶图分析,哪个班成绩比较稳定【解】茎叶图如图所示(以十位和百位为茎,个位为叶).从茎叶图可以看出:甲班有4名同学超过140分,且成绩比乙班分散一些,所以乙班的成绩较集中,较稳定.。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
1. 通过典型案例的探究,进一步了解回归分析的基本思想、方法及初步应用;
2. 通过探究使学生体会有些非线性模型通过变换可以转化为线性回归模型,了解在解决实际问题的过程中寻找更好的模型的方法.
3. 了解常用函数的图象特点,选择不同的模型建模,并通过比较相关指数对不同的模型进行比较.
一、基础过关
3.对于指数曲线y=a e bx,令u=ln y,c=ln a,经过非线性化回归分析之后,可以转化成的形式为() A.u=c+bx B.u=b+cx
C.y=b+cx D.y=c+bx
4.下列说法错误的是() A.当变量之间的相关关系不是线性相关关系时,也能直接用线性回归方程描述它们之间的相关关系
B.把非线性回归化为线性回归为我们解决问题提供一种方法
C.当变量之间的相关关系不是线性相关关系时,也能描述变量之间的相关关系
D.当变量之间的相关关系不是线性相关关系时,可以通过适当的变换使其转换为线性关系,将问题化为线性回归分析问题来解决
5.每一吨铸铁成本y c(元)与铸件废品率x%建立的回归方程y c=56+8x,下列说法正确的是() A.废品率每增加1%,成本每吨增加64元
B.废品率每增加1%,成本每吨增加8%
C.废品率每增加1%,成本每吨增加8元
D.如果废品率增加1%,则每吨成本为56元
二、能力提升
7.研究人员对10个家庭的儿童问题行为程度(X)及其母亲的不耐心程度(Y)进行了评价结果如下,家庭1,2, 3,4,5,6,7,8,9,10,儿童得分:72,40,52,87,39,95,12,64,49,46,母亲得分:79,62,53,89,81,90,10,82,78,70.
下列哪个方程可以较恰当的拟合() A.y=0.771 1x+26.528
B.y=36.958ln x-74.604
C.y=1.177 8x1.014 5
D.y=20.924e0.019 3x
8.已知x,y之间的一组数据如下表:
则y与x之间的线性回归方程y=bx+a必过点________.
9.已知线性回归方程为y=0.50x-0.81,则x=25时,y的估计值为________.
10.在一次抽样调查中测得样本的5个样本点,数值如下表:
如何建立y与x
11.某地区六年来轻工业产品利润总额y与年次x的试验数据如下表所示:
求y关于x的回归方程.(保留三位有效数字)。