1.1.1(1)回归分析的基本思想及其初步应用(一)
2018-2019学年人教A版 选修1-2 回归分析的基本思想及其初步应用(一) 教案
一、复习准备:
1. 提问:“名师出高徒”这句彦语的意思是什么?有名气的老师就一定能教出厉害的学生吗?这两者之间是否有关?
2. 复习:函数关系是一种确定性关系,而相关关系是一种非确定性关系. 回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法,其步骤:收集数据作散点图求回归直线方程利用方程进行预报.
二、讲授新课:
1. 教学例题:
①例1从某大学中随机选取8名女大学生,其身高和体重数据如下表所示:
1 2 3 4 5 6 7 8
编
号
165 165 157 170 175 165 155 170 身高
/cm
体重 48 57 50 54 64 61 43 59
/kg
求根据一名女大学生的身高预报她的体重的回归方程,并预报一名身高为172cm的女大学生的体重.
(分析思路教师演示学生整理)
第一步:作散点图
第二步:求回归方程
第三步:代值计算
②提问:身高为172cm的女大学生的体重一定是60.316kg吗?
不一定,但一般可以认为她的体重在60.316kg左右.
③解释线性回归模型与一次函数的不同
一次函数模型是线性回归模型的特殊形式,线性回归模型是一次函数模型的一般形式.
2. 相关系数:相关系数的绝对值越接近于1,两个变量的线性相关关系越强,它们的散点图越接近一条直线,这时用线性回归模型拟合这组数据就越好,此时建立的线性回归模型是有意义.
3、小结:求线性回归方程的步骤、线性回归模型与一次函数的不同.
板
书
教学
反思。
回归分析的基本思想及其初步应用
回归分析的基本思想及其初步应用1.回归分析回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法,回归分析的基本步骤是画出两个变量的散点图,求回归直线方程,并用回归直线方程进行预报. 2.线性回归模型(1)在线性回归直线方程y ^=a ^+b ^x 中,b ^=∑ni =1 (x i -x )(y i -y )∑ni =1(x i -x )2,a ^=y --b ^x -,其中x -=1n ∑ni =1x i ,y -=1n∑ni =1y i ,(x ,y )称为样本点的中心,回归直线过样本点的中心. (2)线性回归模型y =bx +a +e ,其中e 称为随机误差,自变量x 称为解释变量,因变量y 称为预报变量.[注意] (1)非确定性关系:线性回归模型y =bx +a +e 与确定性函数y =a +bx 相比,它表示y 与x 之间是统计相关关系(非确定性关系),其中的随机误差e 提供了选择模型的准则以及在模型合理的情况下探求最佳估计值a ,b 的工具.(2)线性回归方程y ^=b ^x +a ^中a ^,b ^的意义是:以a ^为基数,x 每增加1个单位,y 相应地平均增加b ^个单位.3.刻画回归效果的方式方式方法计算公式 刻画效果R 2R 2=1-∑ni =1(y i -y ^i )2∑n i =1(y i -y )2R 2越接近于1,表示回归的效果越好残差图e ^i 称为相应于点(x i ,y i )的残差,e ^i =y i -y ^i残差点比较均匀地落在水平的带状区域中,说明选用的模型比较合适,其中这样的带状区域的宽度越窄,说明模型拟合精度越高,回归方程的预报精度越高残差平方和∑ni =1(y i -y ^i )2 残差平方和越小,模型的拟合效果越好判断正误(正确的打“√”,错误的打“×”) (1)求线性回归方程前可以不进行相关性检验.( )(2)在残差图中,纵坐标为残差,横坐标可以选为样本编号.( )(3)利用线性回归方程求出的值是准确值.( ) 答案:(1)× (2)√ (3)×变量x 与y 之间的回归方程表示( )A .x 与y 之间的函数关系B .x 与y 之间的不确定性关系C .x 与y 之间的真实关系形式D .x 与y 之间的真实关系达到最大限度的吻合 答案:D在两个变量y 与x 的回归模型中,分别选择了4个不同的模型,它们的相关指数R 2如下,其中拟合效果最好的模型是( )A .模型1的相关指数R 2为0.98 B .模型2的相关指数R 2为0.80 C .模型3的相关指数R 2为0.50 D .模型4的相关指数R 2为0.25 答案:A已知线性回归方程y ^=0.75x +0.7,则x =11时,y 的估计值为________. 答案:8.95探究点1 线性回归方程在某种产品表面进行腐蚀刻线试验,得到腐蚀深度y 与腐蚀时间x 之间的一组观察值如下表.x (s) 5 10 15 20 30 40 50 60 70 90 120 y (μm)610101316171923252946(1)画出散点图;(2)求y 对x 的线性回归方程;(3)利用线性回归方程预测时间为100 s 时腐蚀深度为多少. 【解】 (1)散点图如图所示.(2)从散点图中,我们可以看出y 对x 的样本点分布在一条直线附近,因而求回归直线方程有意义.x =111(5+10+15+ (120)=51011,y =111(6+10+10+…+46)=21411,a ^=y -b ^x ≈21411-0.304×51011= 5.36. 故腐蚀深度对腐蚀时间的线性回归方程为y =0.304x + 5.36.(3)根据(2)求得的线性回归方程,当腐蚀时间为100 s 时,y ^=5.36+0.304×100=35.76(μm),即腐蚀时间为100 s 时腐蚀深度大约为35.76 μm.求线性回归方程的三个步骤(1)画散点图:由样本点是否呈条状分布来判断两个量是否具有线性相关关系. (2)求回归系数:若存在线性相关关系,则求回归系数.(3)写方程:写出线性回归方程,并利用线性回归方程进行预测说明.炼钢是一个氧化降碳的过程,钢水含碳量的多少直接影响冶炼时间的长短,必须掌握钢水含碳量和冶炼时间的关系.如果已测得炉料熔化完毕时钢水的含碳量x 与冶炼时间y (从炼料熔化完毕到出钢的时间)的数据(x i ,y i )(i =1,2,…,10)并已计算出=1589,i =110y i =1 720,故冶炼时间y 对钢水的含碳量x 的回归直线方程为y ^=1.267x -30.47. 探究点2 线性回归分析假定小麦基本苗数x 与成熟期有效穗y 之间存在相关关系,今测得5组数据如下:(1)以x 为解释变量,y 为预报变量,作出散点图;(2)求y 与x 之间的回归方程,对于基本苗数56.7预报有效穗; (3)计算各组残差,并计算残差平方和;(4)求相关指数R 2,并说明残差变量对有效穗的影响占百分之几? 【解】 (1)散点图如下.(2)由图看出,样本点呈条状分布,有比较好的线性相关关系,因此可以用回归方程刻画它们之间的关系.设回归方程为y ^=b ^x +a ^,x -=30.36,y -=43.5,(1)该类题属于线性回归问题,解答本题应先通过散点图来分析两变量间的关系是否线性相关,然后再利用求回归方程的公式求解回归方程,并利用残差图或相关指数R 2来分析函数模x 15.0 25.8 30.0 36.6 44.4 y39.442.942.943.149.2型的拟合效果,在此基础上,借助回归方程对实际问题进行分析. (2)刻画回归效果的三种方法①残差图法:残差点比较均匀地落在水平的带状区域内说明选用的模型比较合适; ②残差平方和法:残差平方和 i =1n(y i -y ^i )2越小,模型的拟合效果越好;关于x 与y 有如下数据:x 2 4 5 6 8 y3040605070由(2)可得y i -y ^i 与y i -y -的关系如下表:y i -y ^i -1 -5 8 -9 -3 y i -y --20-101020由于R 21=0.845,R 22=0.82,0.845>0.82, 所以R 21>R 22.所以(1)的拟合效果好于(2)的拟合效果. 探究点3 非线性回归分析某地今年上半年患某种传染病的人数y (人)与月份x (月)之间满足函数关系,模型为y =a e bx ,确定这个函数解析式.月份x /月 1 2 3 4 5 6 人数y /人526168747883【解】 设u =ln y ,c =ln a , 得u ^=c ^+b ^x ,则u 与x 的数据关系如下表:x12 3 4 56u =ln y 3.95 4.114.224.3044.356 7 4.418 8非线性回归方程的步骤(1)确定变量,作出散点图.(2)根据散点图,选择恰当的拟合函数.(3)变量置换,通过变量置换把非线性回归问题转化为线性回归问题,并求出线性回归方程. (4)分析拟合效果:通过计算相关指数或画残差图来判断拟合效果. (5)根据相应的变换,写出非线性回归方程.某种书每册的成本费y (元)与印刷册数x (千册)有关,经统计得到数据如下:x(千册)1 2 3 5 10 20 30 50 100 200 y (元)10.155.524.082.852.111.621.411.301.211.15检验每册书的成本费y (元)与印刷册数的倒数1x之间是否具有线性相关关系,如有,求出y 对x 的回归方程,并画出其图形.解:首先作变量置换u =1x,题目中所给的数据变成如下表所示的10对数据.u i 1 0.5 0.33 0.2 0.1 0.05 0.03 0.02 0.01 0.005 y i10.155.524.082.852.111.621.411.301.211.15然后作相关性检测.经计算得r ≈0.999 8>0.75,从而认为u 与y 之间具有线性相关关系,由公式得a ^≈1.125,b ^≈8.973,所以y ^=1.125+8.973u ,最后回代u =1x ,可得y ^=1.125+8.973x.这就是题目要求的y 对x 的回归方程.回归方程的图形如图所示,它是经过平移的反比例函数图象的一个分支.1.关于回归分析,下列说法错误的是( ) A .回归分析是研究两个具有相关关系的变量的方法 B .散点图中,解释变量在x 轴,预报变量在y 轴C .回归模型中一定存在随机误差D .散点图能明确反映变量间的关系解析:选D.用散点图反映两个变量间的关系时,存在误差. 2.下列关于统计的说法:①将一组数据中的每个数据都加上或减去同一个常数,方差恒不变; ②回归方程y ^=b ^x +a ^必经过点(x ,y ); ③线性回归模型中,随机误差e =y i -y ^i ;④设回归方程为y ^=-5x +3,若变量x 增加1个单位,则y 平均增加5个单位. 其中正确的为________(写出全部正确说法的序号).解析:①正确;②正确;③线性回归模型中,随机误差的估计值应为e ^i =y i -y ^i ,故错误;④若变量x 增加1个单位,则y 平均减少5个单位,故错误. 答案:①②3.某商场经营一批进价是30元/台的小商品,在市场试销中发现,此商品的销售单价x (x 取整数)(元)与日销售量y (台)之间有如下关系:x 35 40 45 50 y56412811(1)画出散点图,并判断y 与x 是否具有线性相关关系;(2)求日销售量y 对销售单价x 的线性回归方程(方程的斜率保留一个有效数字); (3)设经营此商品的日销售利润为P 元,根据(2)写出P 关于x 的函数关系式,并预测当销售单价x 为多少元时,才能获得最大日销售利润.解:(1)散点图如图所示,从图中可以看出这些点大致分布在一条直线附近,因此两个变量具有线性相关关系.(2)因为x -=14×(35+40+45+50)=42.5,(3)依题意有P =(161.5-3x )(x -30) =-3x 2+251.5x -4 845=-3⎝⎛⎭⎪⎫x -251.562+251.5212-4 845. 所以当x =251.56≈42时,P 有最大值,约为426元.故预测当销售单价为42元时,能获得最大日销售利润.知识结构深化拓展线性回归模型的模拟效果(1)残差图法:观察残差图,如果残差点比较均匀地落在水平的带状区域中,说明选用的模型比较合适,这样的带状区域的宽度越窄,说明模型拟合精度越高,回归方程的预报精度越高.(2)残差的平方和法:一般情况下,比较两个模型的残差比较困难(某些样本点上一个模型的残差的绝对值比另一个模型的小,而另一些样本点的情况则相反),故通过比较两个模型的残差的平方和的大小来判断模型的拟合效果.残差平方和越小的模型,拟合的效果越好.(3)R 2法:R 2的值越大,说明残差平方和越小,也就是说模型拟合的效果越好.[注意] r 的绝对值越大说明变量间的相关性越强,通常认为r 的绝对值大于等于0.75时就是有较强的相关性,同样R 2也是如此,R 2越大拟合效果越好.[A 基础达标]1.废品率x %和每吨生铁成本y (元)之间的回归直线方程为y ^=256+3x ,表明( ) A .废品率每增加1%,生铁成本增加259元 B .废品率每增加1%,生铁成本增加3元 C .废品率每增加1%,生铁成本平均每吨增加3元 D .废品率不变,生铁成本为256元解析:选C.回归方程的系数b ^表示x 每增加一个单位,y ^平均增加b ^,当x 为1时,废品率应为1%,故当废品率增加1%时,生铁成本平均每吨增加3元.2.已知某产品连续4个月的广告费用为x i (i =1,2,3,4)千元,销售额为y i (i =1,2,3,4)万元,经过对这些数据的处理,得到如下数据信息:①x 1+x 2+x 3+x 4=18,y 1+y 2+y 3+y 4=14;②广告费用x 和销售额y 之间具有较强的线性相关关系;③回归直线方程y ^=b ^x +a ^中,b ^=0.8(用最小二乘法求得),那么当广告费用为6千元时,可预测销售额约为( )A .3.5万元B .4.7万元C .4.9万元D .6.5万元解析:选B.依题意得x =4.5,y =3.5,由回归直线必过样本点中心得a ^=3.5-0.8×4.5=-0.1,所以回归直线方程为y ^=0.8x -0.1.当x =6时,y ^=0.8×6-0.1=4.7.3.某化工厂为预测某产品的回收率y ,需要研究它和原料有效成分含量之间的相关关系,现取了8对观测值,计算得的线性回归方程是( )A.y ^=11.47+2.62xB.y ^=-11.47+2.62x C.y ^=2.62+11.47x D.y ^=11.47-2.62x 解析:选A.由题中数据得x =6.5,y =28.5,a ^=y -b ^x =28.5-2.62×6.5=11.47,所以y 与x 的线性回归方程是y ^=2.62x +11.47.故选A.4.若某地财政收入x 与支出y 满足线性回归方程y =bx +a +e (单位:亿元),其中b =0.8,a =2,|e |≤0.5.如果今年该地区财政收入10亿元,则年支出预计不会超过( )A .10亿元B .9亿元C .10.5亿元D .9.5 亿元解析:选C.代入数据y =10+e ,因为|e |≤0.5, 所以9.5≤y ≤10.5,故不会超过10.5亿元.5.某种产品的广告费支出x 与销售额y (单位:万元)之间的关系如下表:y 与x 的线性回归方程为y =6.5x +17.5,当广告支出5万元时,随机误差的效应(残差)为________.解析:因为y 与x 的线性回归方程为y ^=6.5x +17.5,当x =5时,y ^=50,当广告支出5万元时,由表格得:y =60,故随机误差的效应(残差)为60-50=10. 答案:106.若一组观测值(x 1,y 1),(x 2,y 2),…,(x n ,y n )之间满足y i =bx i +a +e i (i =1,2,…,n ),且e i 恒为0,则R 2为________.解析:由e i 恒为0,知y i =y ^i ,即y i -y ^i =0, 故R 2=1-∑ni =1 (y i -y ^i )2∑n i =1 (y i -y )2=1-0=1.答案:17.某个服装店经营某种服装,在某周内获纯利y (元)与该周每天销售这种服装件数x 之间的一组数据关系见表:已知∑7i =1x 2i =280,∑7i =1x i y i =3 487. (1)求x ,y ;(2)已知纯利y 与每天销售件数x 线性相关,试求出其回归方程. 解:(1)x =3+4+5+6+7+8+97=6,y =66+69+73+81+89+90+917=5597.(2)因为y 与x 有线性相关关系,所以b ^=∑7i =1x i y i-7x y ∑7i =1x 2i -7x 2=3 487-7×6×5597280-7×36=4.75,a ^=5597-6×4.75=71914≈51.36.故回归方程为y ^=4.75 x +51.36.8.已知某校5个学生的数学和物理成绩如下表:(1)假设在对这5名学生成绩进行统计时,把这5名学生的物理成绩搞乱了,数学成绩没出现问题,问:恰有2名学生的物理成绩是自己的实际分数的概率是多少?(2)通过大量事实证明发现,一个学生的数学成绩和物理成绩具有很强的线性相关关系,在上述表格是正确的前提下,用x 表示数学成绩,用y 表示物理成绩,求y 与x 的回归方程; (3)利用残差分析回归方程的拟合效果,若残差和在(-0.1,0.1)范围内,则称回归方程为“优拟方程”,问:该回归方程是否为“优拟方程”?参考数据和公式:y ^=b ^x +a ^,其中.解:(1)记事件A 为“恰有2名学生的物理成绩是自己的实际成绩”, 则P (A )=2C 25A 55=16.(2)因为x =80+75+70+65+605=70,y =70+66+68+64+625=66,学生的编号i 1 2 3 4 5 数学x i 80 75 70 65 60 物理y i7066686462[B 能力提升]9.假设关于某设备的使用年限x和所支出的维修费用y(万元)有如表的统计资料:使用年限x 2 3 4 5 6 维修费用y 2.2 3.8 5.5 6.5 7.010.(选做题)某地区不同身高的未成年男性的体重平均值如表所示:身高x(cm)60708090100110体重y(kg) 6.137.909.9912.1515.0217.50身高x(cm)120130140150160170体重y(kg)20.9226.8631.1138.8547.2555.05 (1)(2)如果体重超过相同身高男性体重平均值的1.2倍为偏胖,低于0.8倍为偏瘦,那么这个地区一名身高175 cm 、体重82 kg 的在校男生体重是否正常? 解:(1)根据题表中的数据画出散点图如图所示.由图可看出,样本点分布在某条指数函数曲线y =c 1e c 2x的周围, 于是令z =ln y ,得下表:x 60 70 80 90 100 110 z 1.81 2.07 2.30 2.50 2.71 2.86 x 120 130 140 150 160 170 z3.043.293.443.663.864.01作出散点图如图所示:由表中数据可得z 与x 之间的回归直线方程为 z ^=0.662 5+0.020x ,则有y ^=e 0.662 5+0.020x .(2)当x =175时,预报平均体重为y ^=e 0.662 5+0.020×175≈64.23, 因为64.23×1.2≈77.08<82,所以这个男生偏胖.。
1[1].1回归分析的基本思想及其初步应用
求根据女大学生的身高预报体重的回归方程,并 预报一名身高为172cm的女大学生的体重.
例1
从某大学中随机选出8名女大学生……
解:由于问题中要求根据身高预报体重,因此选取
61 (0.849 165 85.712) 6.627
0.849 x 85.712 y
编 号 身 高 体 重 1 165 48 2 165 57 3 157 50 4 170 54 5 175 64 6 165 61 7 155 43 8 170 59
残差平方和
把每一个残差所得的值平方后加起来,用数学符号表示为: n ( yi i ) 2 称为残差平方和 y
结合例1除了身高影响体重外的其他因素是不可测量的,不能希望有某种方法获 取随机误差的值以提高预报变量的估计精度,但却可以估计预报变量观测值中所 包含的随机误差,这对我们查找样本数据中的错误和模型的评价极为有用,因此 在此我们引入残差概念。
残差
数据点和它在回归直线上相应位置的差异 ei =yi 称为 yi 相应于点(xi,yi ) 的残差。 例:编号为6的女大学生,计算随机误差的效应(残差)
身 高 与 体 重 残 差 图
异 常 点
• 错误数据 • 模型问题
误差与残差,这两个概念在某程度上具有很大的相似性, 都是衡量不确定性的指标,可是两者又存在区别。 误差与测量有关,误差大小可以衡量测量的准确性,误差 越大则表示测量越不准确。误差分为两类:系统误差与 随机误差。其中,系统误差与测量方案有关,通过改进测 量方案可以避免系统误差。随机误差与观测者,测量工具, 被观测物体的性质有关,只能尽量减小,却不能避免。 残差――与预测有关,残差大小可以衡量预测的准确性。 残差越大表示预测越不准确。残差与数据本身的分布特性, 回归方程的选择有关。
人教版A版高中数学选修1-2课后习题解答
人教版A版高中数学选修1-2课后习题解答高中数学选修1-2课后题答案第一章统计案例1.1 回归分析的基本思想及其初步应用回归分析是一种统计分析方法,用于探究自变量与因变量之间的关系。
它的基本思想是通过建立数学模型,利用已知数据进行拟合,从而预测或解释未知数据。
回归分析的初步应用包括简单线性回归和多元线性回归。
1.2 独立性检验的基本思想及其初步应用独立性检验是一种用于检验两个变量之间是否存在关联的方法。
其基本思想是通过观察两个变量之间的频数或频率分布,来判断它们是否相互独立。
独立性检验的初步应用包括卡方检验和Fisher精确检验。
第二章推理证明2.1 合情推理与演绎推理合情推理是指根据已知事实和常识,推断出可能的结论。
演绎推理是指根据已知的前提和逻辑规则,推导出必然的结论。
两种推理方法都有其适用的场合,需要根据具体情况进行选择。
2.2 直接证明与间接证明直接证明是指通过逻辑推理,直接证明所要证明的命题成立。
间接证明是指采用反证法或归谬法,证明所要证明的命题的否定不成立,从而推出所要证明的命题成立。
第三章数系的扩充与复数的引入3.1 数系的扩充与复数的概念数系的扩充是指在实数系的基础上引入新的数,使得一些原来不可解的方程可以得到解。
复数是指由实部和虚部组成的数,可以表示在平面直角坐标系中的点。
复数的引入扩充了数系,使得一些原本无解的方程可以得到解。
3.2 复数的代数形式的四则运算复数的代数形式是指将复数表示为实部和虚部的和的形式。
复数的四则运算包括加减乘除四种运算,可以通过对实部和虚部分别进行运算来得到结果。
第四章框图4.1 流程图流程图是一种用图形表示算法或过程的方法。
它由各种基本符号和连线构成,用于描述算法或过程的各个步骤及其执行顺序。
流程图可以帮助人们更好地理解算法或过程,从而提高效率。
4.2 结构图结构图是一种用于描述程序结构的图形表示方法。
它包括顺序结构、选择结构和循环结构三种基本结构,可以用来表示程序的控制流程。
回归分析基本思想及初步应用
首页
上一页
结束
下一页
末页
结束
列出残差表:
yi-^yi
0 0.3 -0.4 -0.1 0.2
yi--y 4.6 2.6 -0.4 -2.4 -4.4
5
所以
(yi-^yi)2=0.3,
i=1
首页
上一页
下一页
末页
5
(yi--y )2=53.2,
i=1
5
yi-^yi2
i=1
R2=1-
≈0.994,
5
Hale Waihona Puke yi--y 2又-t =1.55,-y =7.2,
5
tiyi=94.25,
5
t2i =21.312
5,
i=1
i=1
5 tiyi-5-t -y
b^=i=1
5 ti2-5-t 2
=9241.2.351-2 55×-15.×551×.575.22≈4.134 4,
i=1
首页
上一页
下一页
末页
结束
a^=-y -b^-t =7.2-4.134 4×1.55≈0.8, ∴^y=4.134 4t+0.8. 所以 y 与 x 之间的回归方程是^y=4.13x4 4+0.8.
由图可知变量 y 与 x 近似地呈反比例函数关系.
首页
上一页
下一页
末页
设 y=kx,令 t=1x,则 y=kt.
由 y 与 x 的数据表可得 y 与 t 的数据表:
t
4
2 1 0.5 0.25
y 16 12 5 2
1
作出 y 与 t 的散点图,如图所示.
结束
首页
上一页
下一页
2014年人教A版选修1-2课件 1.1 回归分析的基本思想及其初步应用
例1. 从某大学中随机选取 8 名女大学生, 其身高和 体重数据如下表所示: 1 2 3 4 5 6 7 8 编号 165 165 157 170 175 165 155 170 身高 64 61 43 59 体重/kg 48 57 50 54 由最小二乘法得 求根据女大学生的身高预报体重的回归方程 , 并预报一名 n n n 1 1 身高为 172 cm 的女大学生的体重 . xi , y = yi . x = x y n x y i i n i =1 n i =1 i = 1 由身高预报体重 解: b= n ,, 则以身高为自变量 x, 体重为 2 2 得 b ≈0.849, x n x 因变量 y , 画出散点图 . i 70 i =1 a= 85.712. 60 由图看出样本点呈条状 a = y bx . 50 分布, 于是得回归直线的方程为 身高和体重有较好的 ˆ40 y = 0.849x 85.712. 30 线性相关关系. ˆ = 60.316. 20 当 x=172 时, y 10 设回归直线为 y=bx+a. 0 ∴ 预计这位大学生的体重大约 60 kg. 150 155 160 165 170 175 180
例1. 从某大学中随机选取 8 名女大学生, 其身高和 体重数据如下表所示: 编号 身高 体重/kg 1 2 3 4 5 6 7 8 165 165 157 170 175 165 155 170 48 57 50 54 64 61 43 59
求根据女大学生的身高预报体重的回归方程, 并预报一名 身高为 172 cm 的女大学生的体重. 解: 由身高预报体重, 则以身高为自变量 x, 体重为 因变量 y, 画出散点图. 70 60 由图看出样本点呈条状 50 分布, 身高和体重有较好的 40 30 线性相关关系. 20 10 设回归直线为 y=bx+a. 0
回归分析的基本思想及其初步应用 (1)
主备:杜爱琴备导学案时间: 3 月 23 日备课组长:贺艾弘统稿时间: 3 月 24 日签审:上课时间:月日导学案顺序号:学习目标1. 知道回归分析的基本思想3. 知道求回归直线方程的步骤以及什么是随机误差一、探究新知【没有老师的帮助,你可以完成多少呢?】读课本回答下列问题1.(1)什么是函数关系,什么是相关关系?(2)什么是回归分析?以及利用回归分析的方法研究问题时,其步骤是什么?(3)什么是样本点的中心?(4)什么是随机误差?随机误差产生的原因是什么?二、基础训练【看看你学会了吗?试一试】2.若从某大学中随机选取8名女大学生,其身高和体重数据如下表所示:编号 1 2 3 4 5 6 7 8身高/cm 165 165 157 170 175 165 155 170体重/kg 48 57 50 54 64 61 43 59求根据一名女大学生的身高预报她的体重的回归方程,并预报一名身高为172cm的女大学生的体重思考:散点图可以直观地判断两个变量是否具有线性相关性,那么还有什么方法可以描述线性相关性的强弱?3.身高为172cm的女大学生的体重一定是60.316kg吗?如果不是,你能解释一下原因吗?三、能力提升【相信自己,你一定行!】4.测得10对父子的身高(单位:英才)如下:父亲身高60 62 64 65 66 67 68 70 72 74儿子身高63.665.266 65.566.967.167.4 68.3 70.170(1)对变量y与x进行相关性检验;(2)如果y与x之间具有线性相关关系,求线性回归方程;(3)如果父亲的身高为73英寸,估计儿子的身高。
过程创意反思重难点重点分析:回归分析的基本思想;求回归直线方程的步骤以及什么是随机误差难点分析:利用回归分析的基本思想处理实际问题,随机误差的来源环节预设导入(1)出示目标(1)自学(10)讨论(4)准备展示(4)展示(15)小结、巩固检测(11)预设问题及方法提示r>0,表示两个变量正相关。
高中数学《1.1回归分析的基本思想及其初步应用》导学案1 新人教A版选修1-2
回归分析的基本思想及其初步应用(一)学习目标2. 了解线性回归模型与函数模型的差异,了解衡量两个变量之间线性相关关系得方法---相关系数.学习过程一、课前准备24问题1:“名师出高徒”这句彦语的意思是什么?有名气的老师就一定能教出厉害的学生吗?这两者之间是否有关?复习1:函数关系是一种关系,而相关关系是一种关系.复习2:回归分析是对具有关系的两个变量进行统计分析的一种常用方法,其步骤:→→→ .二、新课导学※学习探究实例编号 1 2 3 4 5 6 7 8身高165 165 157 170 175 165 155 170体重48 57 50 54 64 61 43 59为172cm的女大学生的体重.解:由于问题中要求根据身高预报体重,因此选自变量x,为因变量.(1)做散点图:从散点图可以看出和有比较好的相关关系.(2) x= y=81i iix y==∑821iix==∑所以81822188i iiiix y x ybx x==-==-∑∑$$a y bx$=-≈于是得到回归直线的方程为(3)身高为172cm的女大学生,由回归方程可以预报其体重为$y=问题:身高为172cm的女大学生,体重一定是上述预报值吗?思考:线性回归模型与一次函数有何不同?新知:用相关系数r可衡量两个变量之间关系.计算公式为r =r>0, 相关, r<0 相关;相关系数的绝对值越接近于1,两个变量的线性相关关系,它们的散点图越接近;r>,两个变量有关系.※典型例题例1某班5名学生的数学和物理成绩如下表:(2)求物理成绩y对数学成绩x的回归直线方程;(3)该班某学生数学成绩为96,试预测其物理成绩;变式:该班某学生数学成绩为55,试预测其物理成绩;小结:求线性回归方程的步骤:※动手试试练.(07广东文科卷)下表提供了某厂节能降耗技术改造后生产甲产品过程中记录的产量x(吨)与相应的生产能耗y (吨标准煤)的几组对照数据(1)请画出上表数据的散点图;(2)请根据上表提供的数据,用最小二乘法求出y关于x的线性回归方程y bx a=+;(3)已知该厂技改前100吨甲产品的生产能耗为90吨标准煤.试根据(2)求出的线性同归方程,预测生产100吨甲产品的生产能耗比技改前降低多少吨标准煤?⨯+⨯+⨯+⨯=)(参考数值3 2.543546 4.566.5三、总结提升※学习小结1. 求线性回归方程的步骤:2. 线性回归模型与一次函数有何不同※知识拓展※自我评价你完成本节导学案的情况为().A. 很好B. 较好C. 一般D. 较差※当堂检测(时量:5分钟满分:10分)计分:1. 下列两个变量具有相关关系的是()A. 正方体的体积与边长B. 人的身高与视力C.人的身高与体重D.匀速直线运动中的位移与时间2. 在画两个变量的散点图时,下面哪个叙述是正确的()A. 预报变量在x 轴上,解释变量在y 轴上B. 解释变量在x 轴上,预报变量在y 轴上C. 可以选择两个变量中任意一个变量在x 轴上D. 可选择两个变量中任意一个变量在y 轴上$必过()3. 回归直线$$y bx a=+A. (0,0)B. (,0)x yx C. (0,)y D. (,)4.r越接近于1,两个变量的线性相关关系 .5. 已知回归直线方程$0.50.81=-,则25y xx=时,y的估计值为 .但还可以使用,它按不同的转速生产出来的某机械零件有一些会有下表为抽样试验的结果:(2)求回归直线方程;(3)若实际生产中,允许每小时的产品中有缺点的零件最多为 10 个,那么机器的运转速度应控制在什么范围内?。
1.11 回归分析的基本思想及其初步应用(文、理)
1.1 回归分析的基本思想及其初步应用【学习目标】1. 通过对实际问题的分析,了解回归分析的必要性与回归分析的一般步骤。
2. 能作出散点图,能求其回归直线方程。
3. 会用所学的知识对简单的实际问题进行回归分析。
【要点梳理】要点一、变量间的相关关系1. 变量与变量间的两种关系:(1) 函数关系:这是一种确定性的关系,即一个变量能被另一个变量按照某种对应法则唯一确定.例如圆的面积.S 与半径r 之间的关系S=πr 2为函数关系.(2)相关关系:这是一种非确定性关系.当一个变量取值一定时,另一个变量的取值带有一定的随机性,这两个变量之间的关系叫做相关关系。
例如人的身高不能确定体重,但一般来说“身高者,体重也重”,我们说身高与体重这两个变量具有相关关系. 2. 相关关系的分类:(1)在两个变量中,一个变量是可控制变量,另一个变量是随机变量,如施肥量与水稻产量; (2)两个变量均为随机变量,如某学生的语文成绩与化学成绩. 3. 散点图:将两个变量的各对数据在直角坐标系中描点而得到的图形叫做散点图.它直观地描述了两个变量之间有没有相关关系.这是我们判断的一种依据. 4. 回归分析:与函数关系不同,相关关系是一种非确定性关系,对具有相关关系的两个变量进行统计分析的方法叫做回归分析。
要点二、线性回归方程:1.回归直线如果散点图中点的分布从整体上看大致在一条直线附近,我们就称这两个变量之间具有线性相关关系,这条直线叫作回归直线。
2.回归直线方程ˆˆˆybx a =+ 对于一组具有线性相关关系的数据11(,)x y ,22(,)x y ,……,(,)n n x y ,其回归直线ˆˆˆybx a =+的截距和斜率的最小二乘法估计公式分别为:121()()ˆ()niii ni i x x y y bx x ==--=-∑∑,ˆˆay bx =- 其中x 表示数据x i (i=1,2,…,n )的均值,y 表示数据y i (i=1,2,…,n )的均值,xy 表示数据x i y i (i=1,2,…,n )的均值.a、b 的意义是:以 a 为基数,x 每增加一个单位,y 相应地平均变化b 个单位. 要点诠释:①回归系数121()()ˆ()niii nii x x y y bx x ==--=-∑∑,也可以表示为1221ˆni ii nii x y nx ybxnx==-=-∑∑,这样更便于实际计算。
回归分析的基本思想及其初步应用说课稿
回归分析的基本思想及其初步应用
一、教材分析 二、目的分析 三、过程分析 四、教法分析 五、评价分析
回归分析的基本思想及其初步应用
一、教材分析 二、目的分析 三、过程分析 四、教法分析 五、评价分析
回归分析的基本思想及其初步应用
肇庆市第十二中学信息技术科 上机实践报告及自评表 班级: 学号: 姓名: 教师评分:
一、教材分析 二、目的分析 三、过程分析 四、教法分析 五、评价分析
回归分析的基本思想及其初步应用
实践操作法 一、教材分析 二、目的分析 三、过程分析 四、教法分析 五、评价分析
回归分析的基本思想及其初步应用
演示法 一、教材分析 二、目的分析 三、过程分析 四、教法分析 五、评价分析
回归分析的基本思想及其初步应用
实践操作法
任务驱动法
回归分析的基本思想及其初步应用
一、教材分析 二、目的分析 三、过程分析 自我评价 四、教法分析 五、评价分析 小组评价
回归分析的基本思想及其初步应用
实际问题 采集数据) (采集数据) 画图分析 建立数学模型 数学分析 解决实际问题
一、教材分析 二、目的分析 三、过程分析 四、教法分析 五、评价分析
一、教材分析 二、目的分析 三、过程分析 四、教法分析 五、评价分析
回归分析的基本思想及其初步应用
一、教材分析 二、目的分析 三、过程分析 四、教法分析 五、评价分析
回归分析的基本思想及其初步应用
一、教材分析 二、目的分析 三、过程分析 四、教法分析 五、评价分析
回归分析的基本思想及其初步应用
任务驱动法 一、教材分析 二、目的分析 三、过程分析 四、教法分析 五、评价分析
回归分析的基本思想及其初步应用
回归分析的基本思想及其初步应用
t检验用于检验单个自变量对因变量的影响是否显著。如果t检验的P值小于显著性水平,则认为该自变 量对因变量的影响是显著的。
回归系数的解释
偏效应
回归系数表示在其他自变量保持不变 的情况下,某一自变量变化一个单位 时因变量的平均变化量。它反映了自 变量对因变量的偏效应。
标准化回归系数
为了消除自变量量纲的影响,可以对 回归系数进行标准化处理。标准化回 归系数表示自变量和因变量的标准化 值之间的相关系数,具有可比性。
03
回归分析的初步应用
一元线性回归分析
01
建立一元线性回归模型
通过收集样本数据,以自变量 和因变量的线性关系为基础, 建立一元线性回归模型。
02
参数估计
利用最小二乘法等估计方法, 对模型中的参数进行估计,得 到回归方程的系数。
03
假设检验
对回归方程进行显著性检验, 判断自变量和因变量之间是否 存在显著的线性关系。
通过调整模型参数或引入新的 变量等方式优化模型,提高模 型的拟合精度和预测能力。
逐步回归分析
1 引入变量
从所有自变量中逐步引入对因变量有显著影响的变量, 建立初始回归模型。
2 检验与调整
从所有自变量中逐步引入对因变量有显著影响的变量, 建立初始回归模型。
3 逐步筛选
从所有自变量中逐步引入对因变量有显著影响的变量, 建立初始回归模型。
立
详细阐述了线性回归模型的构建 过程,包括模型的假设、参数的 估计和模型的检验等步骤。
回归分析的初步应
用
通过实例演示了回归分析在解决 实际问题中的应用,包括预测、 解释变量关系和控制变量等方面 的应用。
对未来学习的建议与展望
深入学习回归分析的理论知识
最新回归分析练习题(有答案)
最新回归分析练习题(有答案)1.1回归分析的基本思想及其初步应⽤⼀、选择题 1. 某同学由x 与y 之间的⼀组数据求得两个变量间的线性回归⽅程为y bx a =+,已知:数据x 的平均值为2,数据y 的平均值为3,则 ( )A .回归直线必过点(2,3)B .回归直线⼀定不过点(2,3)C .点(2,3)在回归直线上⽅D .点(2,3)在回归直线下⽅2. 在⼀次试验中,测得(x,y)的四组值分别是A(1,2),B(2,3),C(3,4),D(4,5),则Y 与X 之间的回归直线⽅程为()A .$yx 1=+B .$y x 2=+C .$y 2x 1=+ D.$yx 1=-3. 在对两个变量x ,y 进⾏线性回归分析时,有下列步骤:①对所求出的回归直线⽅程作出解释;②收集数据(i x 、i y ),1,2i =,…,n ;③求线性回归⽅程;④求未知参数;⑤根据所搜集的数据绘制散点图如果根据可⾏性要求能够作出变量,x y 具有线性相关结论,则在下列操作中正确的是() A .①②⑤③④ B .③②④⑤① C .②④③①⑤ D .②⑤④③①4. 下列说法中正确的是()A .任何两个变量都具有相关关系B .⼈的知识与其年龄具有相关关系C .散点图中的各点是分散的没有规律D .根据散点图求得的回归直线⽅程都是有意义的5. 给出下列结论:(1)在回归分析中,可⽤指数系数2R 的值判断模型的拟合效果,2R 越⼤,模型的拟合效果越好;(2)在回归分析中,可⽤残差平⽅和判断模型的拟合效果,残差平⽅和越⼤,模型的拟合效果越好;(3)在回归分析中,可⽤相关系数r 的值判断模型的拟合效果,r 越⼩,模型的拟合效果越好;(4)在回归分析中,可⽤残差图判断模型的拟合效果,残差点⽐较均匀地落在⽔平的带状区域中,说明这样的模型⽐较合适.带状区域的宽度越窄,说明模型的拟合精度越⾼.以上结论中,正确的有()个.A .1B .2C .3D .4 6. 已知直线回归⽅程为2 1.5y x =-,则变量x 增加⼀个单位时(A.y 平均增加1.5个单位B.y 平均增加2个单位C.y 平均减少1.5个单位D.y 平均减少2个单位7. 下⾯的各图中,散点图与相关系数r 不符合的是()8. ⼀位母亲记录了⼉⼦3~9岁的⾝⾼,由此建⽴的⾝⾼与年龄的回归直线⽅程为?7.1973.93yx =+,据此可以预测这个孩⼦10岁时的⾝⾼,则正确的叙述是()A .⾝⾼⼀定是145.83cmB .⾝⾼超过146.00cmC .⾝⾼低于145.00cmD .⾝⾼在145.83cm 左右9. 在画两个变量的散点图时,下⾯哪个叙述是正确的( ) (A)预报变量在x 轴上,解释变量在y 轴上 (B)解释变量在x 轴上,预报变量在y 轴上 (C)可以选择两个变量中任意⼀个变量在x 轴上 (D)可以选择两个变量中任意⼀个变量在y 轴上10. 两个变量y 与x 的回归模型中,通常⽤2R 来刻画回归的效果,则正确的叙述是()A. 2R 越⼩,残差平⽅和⼩B. 2R 越⼤,残差平⽅和⼤C. 2R 于残差平⽅和⽆关 D. 2R 越⼩,残差平⽅和⼤ 11. 两个变量y 与x 的回归模型中,分别选择了4个不同模型,它们的相关指数2R 如下,其中拟合效果最好的模型是( )A.模型1的相关指数2R 为0.98B.模型2的相关指数2R 为0.80C.模型3的相关指数2R 为0.50 D.模型4的相关指数2R 为0.2512. 在回归分析中,代表了数据点和它在回归直线上相应位置的差异的是( ) A.总偏差平⽅和 B.残差平⽅和 C.回归平⽅和 D.相关指数R 2产率为1000元时,⼯资为90元14. 下列结论正确的是()①函数关系是⼀种确定性关系;②相关关系是⼀种⾮确定性关系;③回归分析是对具有函数关系的两个变量进⾏统计分析的⼀种⽅法;④回归分析是对具有相关关系的两个变量进⾏统计分析的⼀种常⽤⽅法.A.①②B.①②③C.①②④D.①②③④15. 已知回归直线的斜率的估计值为1.23,样本点的中⼼为(4,5),则回归直线⽅程为()A.$1.234y x =+B.$1.235y x =+ C.$1.230.08y x =+ D.$0.08 1.23y x =+ ⼆、填空题16. 在⽐较两个模型的拟合效果时,甲、⼄两个模型的相关指数2R 的值分别约为0.96和0.85,则拟合效果好的模型是.17. 在回归分析中残差的计算公式为.18. 线性回归模型y bx a e =++(a 和b 为模型的未知参数)中,e 称为.19. 若⼀组观测值(x 1,y 1)(x 2,y 2)…(x n ,y n )之间满⾜y i =bx i +a+e i (i=1、2.…n)若e i 恒为0,则R 2为_____三、解答题20. 调查某市出租车使⽤年限x和该年⽀出维修费⽤y(万元),得到数据如下:使⽤年限x 2 3 4 5 6维修费⽤y2.2 3.8 5.5 6.5 7.0(2)由(1)中结论预测第10年所⽀出的维修费⽤.(121()()()ni iiniix x y yb==-?-=-=-∑∑)21. 以下是某地搜集到的新房屋的销售价格y和房屋的⾯积x的数据:(1)画出数据对应的散点图;(2)求线性回归⽅程,并在散点图中加上回归直线;(3)据(2)的结果估计当房屋⾯积为2150m时的销售价格.(4)求第2个点的残差。
回归分析的基本思想及其初步应用(第1课时)教案及说明
1.1回归分析的基本思想及其初步应用(第1课时)教案教材:人民教育出版社A版必修3授课教师:中卫市第一中学俞清华【教学目标】在《数学③(必修)》之后,学生已经学习了两个变量之间的相关关系,包括画散点图,最小二乘法求回归直线方程等内容.在人教A版选修1-2第一章第一节“回归分析的基本思想及其初步应用”这一节中进一步介绍回归分析的基本思想及其初步应用.这部分内容《教师用书》共计4课时,第一课时:介绍线性回归模型的数学表达式,解释随机误差项产生的原因,使学生能正确理解回归方程的预报结果;第二课时:从相关系数、相关指数和残差分析角度探讨回归模型的拟合效果,以及建立回归模型的基本步骤;第三课时:介绍两个变量非线性相关关系;第四课时:回归分析的应用. 本节课是第一课时的内容.1、知识与技能目标认识随机误差;2、过程与方法目标(1)会使用函数计算器求回归方程;(2)能正确理解回归方程的预报结果.3、情感、态度、价值观通过本节课的学习,加强数学与现实生活的联系,以科学的态度评价两个变量的相关性,理解处理问题的方法,形成严谨的治学态度和锲而不舍的求学精神.培养学生运用所学知识,解决实际问题的能力.教学中适当地利用学生合作与交流,使学生在学习的同时,体会与他人合作的重要性.【教学重点】随机误差e的认识【教学难点】随机误差的来源和对预报变量的影响【教学方法】启发式教学法【教学手段】多媒体辅助教学【教学流程】【教学过程设计】.几点注明:1、复习引入时教师做示范——提供5组身高与体重的数据,用Excel展示如何画散点图、用最小二乘法求线性回归方程.随机抽样并列表如下:2、计算机做散点图的步骤如下:(1)进入Excel软件操作界面,在A1,B1分别输入“身高”和“体重”,在A,B 列输入相应的数据.(2)点击“图表向导”图标,进入“图表类型”对话框,选择“标准类型”中的“XY散点图”,单击“下一步”.(3)在“图表向导”中的“图表数据源”对话框中,选择“系列”选项,单击“添加”按钮添加系列1,在“X值”栏中输入身高所在数据区域,在“Y值”栏中输入体重所在数据区域,单击“下一步”.(4)进入“图表向导”中的图表选项对话框,对图表的一些属性进行设置. (5)单击“完成”按钮.注:也可以直接使用我们提供的文件来给学生演示,相对节约课堂时间.3、学生使用函数计算器求回归方程的过程如下:MODE SHIFT CLR =1 13 , DT 165 49 ,DT17565, DT 165 58 , DT 157 51 , DT 170 53 SHIFT CLRSHIFTCLR2==1 (进入回归计算模式)(清除统计存储器)(输入五组数据)所以回归方程为 yˆ0.673x-56.79 (计算参数a) (计算参数b)(学生还会使用更先进的计算器)4、课堂使用的数据如下高二女生前15组数据列表:高二女生中间15组数据列表:高二女生后15组数据列表:课本P2例题1 女大学生8组数据列表:例1.1.1回归分析的基本思想及其初步应用(第1课时)教案说明教材:人民教育出版社A版必修3授课教师:中卫市第一中学俞清华1、设计理念《数学课程标准》明确指出:有效的数学学习活动不能单纯地模仿与记忆,动手实践、自主探索与合作交流,可以促进学生自主、全面、可持续的发展,是学生学习数学的重要方式.为使教学真正做到以学生为本,我对教材P2—P3的知识进行了适当地重组和加工,力求给学生提供研究、探讨的时间与空间,让学生充分经历“做数学”的过程,促使学生在自主中求知,在合作中获取,在探究中发展.2、授课内容的数学本质与教学目标定位回归分析,是一种从事物因果关系出发进行预测的方法.操作中,是在掌握大量观察数据的基础上,利用数理统计方法建立因变量与自变量之间的回归关系函数表达式(称回归方程式),预测今后事物发展的趋势.然而,所建立的回归方程与样本点的分布之间还存在有差异,这一差异就是我们本节课学习的主要内容:随机变量.3、学习本课内容的基础以及应用本课内容安排在《数学3(必修)》之后,学生已经学习了两个变量之间的相关关系,包括画散点图,会利用最小二乘法求回归直线方程等内容.以此为基础,进一步讨论一元线性回归模型,分析产生模型中随机误差项的原因,从而让学生了解线性回归模型与函数模型之间的区别与联系,体会统计思维与确定性思维的区别与联系.通过本节课的学习,为后继课程了解偏差平方和分解思想和相关指数的含义、了解相关指数R2和模型拟合的效果之间的关系、了解残差图的作用,体会什么是回归分析、回归分的必要性,都起到铺垫作用.在本节课的教学中,学生使用了函数计算器,教师则利用电脑Excel表格完成对数据的整理,需要学生有一定的动手能力.4、学习本课内容时容易了解与容易误解的地方由于学生对必修3中的线性回归知识已经熟悉,会抽取样本、会画散点图、会利用最小二乘法求出线性回归方程,所以本节课学生容易了解:(1)从散点图看出,样本点呈条状分布,体重与身高具有线性相关关系,因此可以用线性回归方程来近似刻画它们之间的关系.(2)可以发现样本点并不完全落在回归方程上,有随机误差存在.(3)容易理解由一条回归方程预测到的身高172cm的女生体重不是都一样,它只是一个平均值.在学习过程中,相对不易理解的地方有:(1)对于随机误差的来源,学生是能够从样本的个体差异上来理解的,但是对于由用线性回归模型近似真实模型所引起的误差,学生理解还是有一定困难的.(2)随机误差对预报变量的影响,学生从感性上很好理解,当然是随机误差越小越好.但是从理性上认识,怎样从数据上刻画出随机误差是否变小了呢?学生还有困难.5、本节课的教法特点以及预期效果分析5.1 改造创新教师通过分析教材和学生认知规律,创造性地使用教材,做到既重视教材,更重视学生.具体说来有以下改造:(1)创设生活情景.利用学生的“体检经验”设置问题,既没有脱离课本例题1的相关内容,又能激发学生对数学的亲切感,引发学生看个究竟的冲动,兴趣盎然地投入学习.(2)充分体现随机观念.课本上仅仅希望利用8组数据就要学生体会到统计的思想和后继课程中回归分析的必要性,实在是为难学生了.在本课教学设计学生操作时强调“增多数据,加强比较”. 帮助学生体会“不同事件(如课本例1女大学生和高二女生)”,则统计结果不同、“同一事件(如都是高二女生),采样不同结果也不同”的基本事实.(3)教师的作用. 在这节课里,教师在学生操作结束后,利用更多数据的操作,形成一个与学生结果的对比,这一操作与展示为学生创造了新的思维增长点,引领学生进入更深层领悟.5.2 问题性本课教学以问题引导学习活动,通过恰时恰点地提出问题,提好问题,给学生提问的示范,使他们领悟发现和提出问题的艺术,引导他们更加主动和有兴趣地学,逐步培养学生的问题意识,孕育创新精神.例如,在“结果的分析”中的问题4、“预测出的体重值都不同,那么它还有参考价值吗?”目的是让学生充分认识随机误差e的来源和对预报变量的影响,而这一问题的提出,立刻吸引学生细细体会随机观念,同时激发出学生的好奇心,提升深入探求的欲望.5.3 合作、探究的学习方式本节课的合作学习体现在两个方面:除了体现在每个小组内部成员之间,还体现在整堂课的教学结构上.小组成员内部提倡“不同的人作不同的事”,面对不同分组,学生可以自主选择的不同工作,动手带动动脑,遇到小的问题,通过探讨和帮助,能做到“学生的问题由学生自己解决”,促进对某一问题更清晰的认识,还能感受到团结合作的好处与必要.同时,每个小组的劳动成果共同构成课堂教学需要的多条回归方程,组与组之间的合作推动整节课的比较与区分得以实现.5.4教学手段本课积极将数学课程与信息技术进行整合,采用多种技术手段,特点主要体现如下:(1)以PPT 为操作平台,界面活泼,操作简单,能有效支持多种其它技术;(2)教师用Excel图表展示,直观形象,节约时间,帮助学生顺利完成学习内容;(3)学生使用函数计算器动手操作,求出回归方程.本课预期:(1)学生可以很好地复习使用函数计算器求回归方程,虽然在要求学生自己操作前教师有一个示例,但是还是会有一少部分人不会使用,所以在教学前要有一定的思想准备,和必要措施.(2)在分析各个组的预测结果为什么有差异时,由于个体经验不同,对问题的挖掘深度产生不同,这时教师的启发引导可能会十分必要,不能完全由学生漫无目的的“讨论”,使学生活动流于形式.(3)“结果分析”前,由学生展示操作成果,这些结果已经够用来说明问题,教师不要急于参与.在“结果分析”的第4个问题中引入教师利用电脑求出的由45 组数据得到的回归方程,让学生再一次通过比较得到新的思考点——怎样知道自己模拟的回归方程身高变化对体重变化影响有多大呢?这样会使学生自然而然渴望进一步了解相关回归分析的知识,为后继课程做好伏笔.对于体现本节课承上启下的作用,可能更好一些.6 教学反思通过本节课的教学实践,我再次体会到什么是由“关注知识”转向“关注学生”,在教学过程中,注意到了由“给出知识”转向“引起活动”,由“完成教学任务”转向“促进学生发展”,课堂上的真正主人应该是学生.一堂好课,师生一定会有共同的、积极的情感体验.本节课的教学中,知识点均是学生通过探索“发现”的,学生充分经历了探索与发现的过程.教学中没有以练习为主,而是定位在知识形成过程的探索,注重数学的思想性,如统计思想、随机观念、函数思想、数形结合的思想方法等,引导学生体验数学中的理性精神,加强数学形式下的思考和推理。
回归分析的基本思想及其应用(一)
第40课时 回归分析基本思想及其初步应用(一)学习目标:1、了解相关关系的概念及其与函数关系的区别;2、掌握线性回归方程的求法及其步骤;3、了解线性回归模型及随机误差的含义。
教学重点; 线性回归方程 教学难点: 线性回归模型 教学工具: Powerpoint 教学过程:(一) 复习引入1、相关关系:对于两个变量,当自变量的取值一定时,因变量的取值带有一定随机性的两个变量之间的关系。
2、函数关系:两个变量之间是一种确定性关系;3、两个具有线性相关关系的变量的统计分析步骤(板书): 设样本点(x 1,y 1),(x 2,y 2),……,(x n ,y n ) (1) 画出散点图; (2) 求回归直线方程abx y+=∧,其中∑∑∑∑====∧--=---=ni i ni i i ni i ni i i xn x yx n y x x x y y x x b 1221121)())((………①xb y a ∧∧-= ………②(3) 利用线性回归方程进行预报 这种方法叫做回归分析,是对具有相关关系的两个变量进行统计分析的一种常用方法。
板书:(y x ,)叫做样本点的中心,回归直线过样本点的中心。
(二)推进新课60.316kg 的女大学生的身高(精确到1cm )。
解:由于问题中要求根据体重预报身高,因此选取体重为自变量x ,身高为因变量y.作出散点图如下:从图中可以看出,样本点呈条状分布,体重和身高有比较好的线必相关关系,因此可以用回归直线y=bx+a 来近似刻画它们之间的关系。
又据表中数据计算得:5.54=x ,25.165=y,24116812=∑=i i x ,218774812=∑=i i y ,7231581=∑=i i i y x于是根据前面的公式①②,可以得∧b=7514.05.54102411625.1655.5410723152=⨯-⨯⨯-xb y a ∧∧-==165.25-0.7514×54.5=124.3于是得到回归方程:124.30.7514x y+=∧∧b=0.7514是回归直线的斜率的估计值,说明体重每增加1单位时,身高就增加0.7514个单位,这表明身高y 和体重x 具有正的线性相关关系.因此,对于体重为60.316kg 的女大学生,由回归方程可以预报其身高为:cm17062.169124.360.3160.7514y ≈=+⨯=∧探究(1)体重60.316kg 的女大学生的身高一定是170cm 吗?如果不是,其原因是什么? 显然,体重60.316kg 的女大学生的身高不一定是170cm ,但一般可以认为她的身高在170cm 左右。
回归分析的基本思想及其初步应用
我们可以用相关指数R2来刻画回归的效果,其计算公式是
显然,R2的值越大,说明残差平方和越小,也就是说模型拟合效果越好。
在线性回归模型中,R2表示解释量对预报变量变化的贡献率。
R2越接近1,表示回归的效果越好(因为R2越接近1,表示解释变量和预报变量的线性相关性越强)。
我们可以用相关指数R2来刻画回归的效果,其计算公式是
如果某组数据可能采取几种不同回归方程进行回归分析,则可以通过比较R2的值来做出选择,即选取R2较大的模型作为这组数据的模型。
总的来说: 相关指数R2是度量模型拟合效果的一种指标。 在线性模型中,它代表自变量刻画预报变量的能力。
我们可以用相关指数R2来刻画回归的效果,其计算公式是
例1的R2≈0.64 ,解释变量对总效应约贡献了64%,可以叙述为“身高解析了64%的体重变化”,而随机误差贡献了剩余的36%。所以,身高对体重的效应比随机误差的效应大得多。
回归方程:
3、回归分析的基本步骤:
画散点图
求回归方程
用回归直线方程预报、决策
这种方法称为回归分析.
回归分析是对具有相关关系的两个变量进行统计 分析的一种常用方法.
函数模型与回归模型之间的差别
函数模型:
回归模型:
线性回归模型y=bx+a+e增加了随机误差项e,因变量y的值由自变量x和随机误差项e共同确定,即自变量x只能解释部分y的变化。
错误数据 模型问题
几点说明: 第1个样本点和第6个样本点的残差比较大,需要确认在采集过程中是否有人为的错误。如果数据采集有错误,就予以纠正,然后再重新利用线性回归模型拟合数据;如果数据采集没有错误,则需要寻找其他的原因。另外,残差点比较均匀地落在水平的带状区域中,说明选用的模型比较合适,这样的带状区域的宽度越窄,说明模型拟合精度越高,回归方程的预报精度越高。
1.1回归分析的基本思想及其初步应用(1)
1
165 48
2
165 57
3
157 50
4
170 54
5
175 64
6
165 61
7
155 43
8
170 59
(1)画散点图,从图中发现身高与体重之间的关系; (2)求根据女大学生的身高预报她的体重的回归方程; (3)并预报一名身高为172cm的女大学生的体重; (4)计算相关系数r。
例1 从某大学中随机选出8名女大学生,其身高 和体重数据如下表:
编号 1 2 3 4 5 6 7 8
身高 体重
165 48
165 57
157 50
170 54
175 64
165 61
155 43
170 59
(1)画散点图,从图中发现身高与体重之间的关系; (2)求根据女大学生的身高预报她的体重的回归方程; (3)并预报一名身高为172cm的女大学生的体重。
n
x
i 1
nx
2
,
1 n x xi n i 1
1 n y yi n i 1
a y b x
y bxa 从而得到回归直线:
不能用一次函数 y=bx+a严格的刻画它 们之间的关系。
用线性回归模型 y=bx+a+e来描述身高和 体重的关系:其中a和b为模型的未知参数。 e:称为随机误差 x(身高):解释变量 y(体重):预报变量 产生随机误差项e的原因是什么?
原因:饮食习惯、运动影响,没有人知道身高和体重 之间的真正关系是什么,现在只是利用线性回归方程 来近似这种关系。
解释变量x(身高) 预报变量y(体重) 随机误差e e是一个随机变量,一般假定它的均值为0,也就 是y的期望值是x的一次函数。在实际问题中,线 性回归模型适用的范围要比一次函数大得多。
1-1 回归分析的基本思想及其初步应用
1.由一组数据(x 1,y 1),(x 2,y 2),…,(x n ,y n )得到的回归直线方程y ^=b ^x +a^,则下列说法不正确的是( ) A .直线y ^=b ^x +a^必过点(x ,y ) B .直线y ^=b ^x +a ^至少经过点(x 1,y 1)(x 2,y 2)……(x n ,y n)中的一个点D .直线y ^=b ^x +a ^和各点(x 1,y 1),(x 2,y 2),…,(x n ,y n)的偏差是该坐标平面上所有直线与这些点的偏差中最小的直线[答案] B2.当建立了多个模型来拟合某一数据时,为了比较各个模型的拟合效果,我们可以通过计算________来确定.( )(1)残差平方和 (2)相关指数R 2 (3)相关系数r A .(1)(3) B .(1)(2) C .(2)(3) D .(1)(2)(3)[答案] B3.某种产品的广告费支出x 与销售额y (单位:万元)之间有下表关系:x24568y 30 40 60 50 70已知y 与x 之间是线性相关关系,若实际销售额不低于82.5万元,则广告费支出最少是__________万元.[答案] 10[解析] 由本节例2可知y 关于x 的回归直线方程为y ^=6.5x +17.5由6.5x +17.5≥82.5得x ≥10.故广告费支出最少为10万元.4.为了解篮球爱好者小李的投篮命中率与打篮球时间之间的关系,下表记录了小李某月1号到5号每天打篮球的时间x (单位:h)与当天投篮命中率y 之间的关系:时间x 1 2 3 4 5 命中率y0.40.50.60.60.4小李这5天的平均投篮命中率为________,用线性回归分析法的方法, 预测小李该月6号打6h 篮球的投篮命中率为________.[答案] 0.5 0.53[解析] 这5天的平均投篮命中率为 y -=0.4+0.5+0.6+0.6+0.45=0.5, x -=1+2+3+4+55=3. ∑i =15(x i -x )(y i -y )=(1-3)×(0.4-0.5)+(2-3)×(0.5-0.5)+(3-3)×(0.6-0.5)+(4-3)×(0.6-0.5)+(5-3)×(0.4-0.5)=0.1.∑i =15(x i -x )2=(1-3)2+(2-3)2+(3-3)2+(4-3)2+(5-3)2=10.b ^=0.110=0.01,a^=y -b ^x =0.5-0.03=0.47.所以回归直线方程为y^=0.01x+0.47.当x=6时,y^=0.01×6+0.47=0.53.5.在某种产品表面进行腐蚀刻线试验,得到腐蚀深度y与腐蚀时间x的一组数据如下表所示:x(s)510152*********y(mm)610111316171923(1)画出数据的散点图;(2)根据散点图,你能得出什么结论.[解析](1)如图所示:(2)结论:设x与y是具有相关关系的两个变量,且相应于n组观测值的n个点大致分布在一条直线附近,其中整体上与这n个点最接近的一条直线最能代表变量x与y之间的关系.。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
(文)§1.1.1回归分析的基本思想及其初步应用(一)
1. 通过典型案例的探究,进一步了解回归分析的基本思想、方法及初步应用;
---相关系数.
重点:了解线性回归模型与函数模型的差异,了解判断刻画模型拟合效果的方法-相关指数和残差分析.
难点:解释残差变量的含义,了解偏差平方和分解的思想.
【知识链接】
(预习教材P 2~ P 4,找出疑惑之处)
问题1:“名师出高徒”这句彦语的意思是什么?有名气的老师就一定能教出厉害的学生吗?这两者之间是否有关?
复习1:函数关系是一种 关系,而相关关系是一种 关系.
复习2:回归分析是对具有 关系的两个变量进行统计分析的一种常用方法,其步骤:
【学习过程】
※ 学习探究
实例
问题:画出散点图,172cm 的女大学生的体重.
解:由于问题中要求根据身高预报体重,因此 选 自变量x , 为因变量.
(1)做散点图:
从散点图可以看出 和 有比较好的
相关关系.
(2) x = y =
所以81
822188i
i i i
i x y x y b x
x ==-==-∑∑ 于是得到回归直线的方程为
(3)身高为172cm 的女大学生,由回归方程可以预报其体重为
问题:身高为172cm 的女大学生,体重一定是上述预报值吗?
思考:线性回归模型与一次函数有何不同?
新知:用相关系数r 可衡量两个变量之间 关系.计算公式为
r =
r >0, 相关, r <0 相关;
相关系数的绝对值越接近于1,两个变量的线性相关关系 ,它们的散点图越接近 ; r >
,两个变量有 关系.
※ 典型例题
(1) 画散点图;
(2) 求物理成绩y 对数学成绩x 的回归直线方程;
(3) 该班某学生数学成绩为96,试预测其物理成绩;
变式:该班某学生数学成绩为55,试预测其物理成绩;
小结:求线性回归方程的步骤:
※ 动手试试
练.(07广东文科卷)下表提供了某厂节能降耗技术改造后生产甲产品过程中记录的产量x (吨)与相应的生产能耗y (吨标准煤)的几组对照数据
(1)请画出上表数据的散点图; (2)请根据上表提供的数据,用最小二乘法求出
程y bx a =+; y 关于x 的线性回归方
(3)已知该厂技改前100吨甲产品的生产能耗为90吨标准煤.试根据(2)求出的线性同归方程,预测生产100吨甲产品的生产能耗比技改前降低多少吨标准煤? (参考数值3 2.543546 4.566.5⨯+⨯+⨯+⨯=)
【学习反思】
※ 学习小结
1. 求线性回归方程的步骤:
2. 线性回归模型与一次函数有何不同
※ 知识拓展
※ 自我评价 你完成本节导学案的情况为( ).
A. 很好
B. 较好
C. 一般
D. 较差
※ 当堂检测(时量:5分钟 满分:10分)计分:
1. 下列两个变量具有相关关系的是( )
A. 正方体的体积与边长
B. 人的身高与视力
C.人的身高与体重
D.匀速直线运动中的位移与时间
2. 在画两个变量的散点图时,下面哪个叙述是正确的( )
A. 预报变量在x 轴上,解释变量在 y 轴上
B. 解释变量在x 轴上,预报变量在 y 轴上
C. 可以选择两个变量中任意一个变量在x 轴上
D. 可选择两个变量中任意一个变量在 y 轴上
3. 回归直线y bx a =+必过( )
A. (0,0)
B. (,0)x
C. (0,)y
D. (,)x y
4.r 越接近于1,两个变量的线性相关关系 .
5. 已知回归直线方程0.50.81y x =-,则25x =时,y 的估计值为
.
一台机器使用的时间较长,但还可以使用,它按不同的转速生产出来的某机械零件有一些会有
(2)求回归直线方程;
(3)若实际生产中,允许每小时的产品中有缺点的零件最多为 10 个,那么机器的运转速度应控制 在什么范围内?。