高中数学学案回归分析
高中数学 3.2 回归分析学案 新人教B版选修2-3(2021年整理)

2016-2017学年高中数学3.2 回归分析学案新人教B版选修2-3 编辑整理:尊敬的读者朋友们:这里是精品文档编辑中心,本文档内容是由我和我的同事精心编辑整理后发布的,发布之前我们对文中内容进行仔细校对,但是难免会有疏漏的地方,但是任然希望(2016-2017学年高中数学3.2 回归分析学案新人教B版选修2-3)的内容能够给您的工作和学习带来便利。
同时也真诚的希望收到您的建议和反馈,这将是我们进步的源泉,前进的动力。
本文可编辑可修改,如果觉得对您有帮助请收藏以便随时查阅,最后祝您生活愉快业绩进步,以下为2016-2017学年高中数学3.2 回归分析学案新人教B版选修2-3的全部内容。
3.2 回归分析1。
通过对典型案例的探究,了解回归分析的基本思想、方法及其初步应用。
2。
会求回归直线方程,并用回归直线方程进行预报。
(重点难点)[基础·初探]教材整理1 回归直线方程阅读教材P83~P84探究与研究以上部分,完成下列问题。
1。
回归直线方程其中错误!的计算公式还可以写成错误!=错误!.2.线性回归模型:y=bx+a+εi,其中εi称为随机误差项,a和b是模型的未知参数,自变量x称为解释变量,因变量y称为预报变量。
设某大学的女生体重y(单位:kg)与身高x(单位:cm)具有线性相关关系.根据一组样本数据(x i,y i)(i=1,2,…,n),用最小二乘法建立的回归方程为错误!=0。
85x-85.71,则下列结论中正确的是________(填序号)。
(1)y与x具有正的线性相关关系;(2)回归直线过样本点的中心(x,错误!);(3)若该大学某女生身高增加1 cm,则其体重约增加0.85 kg;(4)若该大学某女生身高为170 cm,则可断定其体重必为58.79 kg.【解析】回归方程中x的系数为0。
85〉0,因此y与x具有正的线性相关关系,A正确;由回归方程系数的意义可知回归直线过样本点的中心(错误!,错误!),B正确;依据回归方程中错误!的含义可知,x每变化1个单位,错误!相应变化约0.85个单位,C正确;用回归方程对总体进行估计不能得到肯定结论,故D不正确.【答案】(1)(2)(3)教材整理2 相关性检验阅读教材P87~P89例3以上部分,完成下列问题。
高中数学必修3回归直线最新学案

回归分析 一、定义1、两个变量x,y, x 变,y 也变,随x 的变化而变化,y 与x 的关系可以用一个式子来表达,我们称,x 与y 具有函数关系。
2、两个变量x,y, x 变,y 也变,随x 的变化而变化,y 与x 的关系不可以用一个式子来表达,我们称x 与y 具有相关关系。
3、相关关系是一种不确定的关系。
二、1、对于相关关系的两个变量进行分析,称之为回归分析2、两个变量的相关性可以分为正相关、负相关。
如3、上图中将两个变量的关系用一个图形表示出来,称为作散点图。
4、如果散点途中两个变量对应的点都大致分布在一条直线周围,称该相关为线性相关。
5、高中只研究线性相关。
6、具有相关关系的两个变量x,y ,一般先画散点图,再利用公式求回归直线yˆ=b ˆx+a 7、bˆ=∑∑==--i in i i ix n xy x n y x 1221,a=x b y -。
8、n x x x x n +++=...21,ny y y y n +++= (21)9、∑=+++=ni nn ii y x y x y x yx 12211...10、例题:已知产品销售量与广告投放有关,先收集近5年产品销量y 与广告费x 数据如下:(1)画出散点图(1)求回归方程yˆ=b ˆx+a (3)根据回归方程预计投放广告费x=100时,销售量Y11、相关系数r 是用来衡量相关性强弱的,|r |≤1,r=±1表示完全相关,也就是我们所说的函数关系。
12、所有的回归直线都要经过样本中心点(y x ,)。
由于样本点不可能共线,而只是散布在一条直线的周围,所以回归直线也可以用直线y=bx+a+e 来表示。
e 称随机误差。
13、因为y 可以预计下一步销售量,称之为预报变量,x 叫解释变量。
14、随机误差越小,相关性越强,当e=0,完全相关。
15、残差 :已知两个变量线性相关,回归直线为 y=x+2 所对应的数据表如下求残差16、残差分布图如下:残差比较均匀的分布在一带状区域,说明回归分析拟合好,带状区域越窄,精度越高16、相关指数=2R 1-偏差平方和残差平方和,2R 越接近1,残差越小,回归拟合越好,2R =0.64,说明x 对整体的贡献为0.64,另外的0.36来自于随机误差。
高中数学回归讲解教案

高中数学回归讲解教案
教案主题:回归分析
教学目标:
1. 了解回归分析的基本概念和原理
2. 掌握简单线性回归分析和多元线性回归分析的计算方法
3. 能够应用回归分析方法解决实际问题
4. 培养学生的数理统计思维和分析能力
教学内容:
1. 回归分析的概念和基本原理
2. 简单线性回归分析
3. 多元线性回归分析
4. 实际问题的回归分析方法应用
教学步骤:
第一步:导入(5分钟)
介绍回归分析的基本概念和作用,引起学生对回归分析的兴趣和重要性。
第二步:简单线性回归分析(20分钟)
1. 讲解简单线性回归的定义和公式
2. 演示简单线性回归的计算方法
3. 给出一个简单线性回归的实例,让学生自行计算
第三步:多元线性回归分析(20分钟)
1. 讲解多元线性回归的定义和公式
2. 演示多元线性回归的计算方法
3. 给出一个多元线性回归的实例,让学生自行计算
第四步:实际问题应用(15分钟)
1. 给出一个实际问题,让学生利用回归分析方法进行分析
2. 引导学生思考回归分析在实际问题中的应用价值
第五步:总结(10分钟)
1. 总结回归分析的基本原理和方法
2. 强调回归分析在实际问题中的重要性和应用价值
3. 解答学生的问题并进行互动交流
教学反思:
通过本节课的教学,学生了解了回归分析的基本概念和原理,掌握了简单线性回归和多元线性回归的计算方法,并通过实际问题的应用进行了综合训练。
同时,也培养了学生的数理统计思维和分析能力,提高了他们解决实际问题的能力。
希望学生能够在今后的学习和工作中,充分运用回归分析方法,发挥其应用价值。
最新高三教案-高三数学回归分析 精品

总 课 题
高三数学回归分析
总课时
1
第 1课时
课 题
回归分析
课型
新授课
教学目标
1、通过典型案例的探究,进一步了解回归分析的基本思想、方法及初步应用
2、培养学生的应用意识和解决问题的能力
教学重点
线性回归模型的建立和线性回归系数的最佳估计值的探求方法
教学难点
相关性检验及回归分析
教学过程
教学内容
教法设计与学法指导
一、引入课题:
对一作直线运动的质点的运动过程观测了8次,得到如下表所示的数据,试估计当x=9时的位置y的值.
时刻x/s
1
2
3
4
5
6
7
8
位置观测
值y/cm
5.5
7.5
10
11.73
15.7
16
17
21
二、新课讲解:
1.线性回归模型:我们将 称为线性回归模型. 称为随机误差.
2.线性回归模型应考虑的问题: 模型是否合理; 在合理的情况下,如何求a,b
3.线性回归方程:
4.相关系数r:
5.相关系数的性质:(1) ≤1;(2) 越接近1,x,y的线性相关程度越强;(3) 越接近于0,x,y的线性相关程度越弱.
6.对相关系数进行显著性检验的步骤:
(1)提出统计假设 :变量x,y不具有线性相关关系;
三、典型例题
例1、某工厂1—8月份某种产品的产量与成本的统计数据见下表:
月份
1
2
3
4
5
6
7
8
产量
5.6
6.0
6.1
6.4
人教新课标版数学高一-学案 1.2 回归分析

1.2 回归分析1.会建立线性回归模型分析两个变量间的相关关系.2.能通过相关系数判断两个变量间的线性相关程度.1.什么叫回归分析?答 回归分析是对具有相关关系的两个变量进行统计分析的一种方法. 2.回归分析中,利用回归直线方程求出的函数值一定是真实值吗?答 不一定是真实值,利用线性回归方程求的值,在很多时候是个预报值,例如,人的体重与身高存在一定的线性关系,但体重除了受身高的影响外,还受其他因素的影响,如饮食、是否喜欢运动等.1.回归直线方程在回归直线方程y ^=a ^+b ^x 中,b ^=i =1n (x i -x )(y i -y )i =1n (x i -x )2=∑i =1nx i y i -n x y∑i =1nx 2i -n x2,a ^=y -b ^x .其中x =1n ∑i =1n x i ,y =1n ∑i =1ny i ,(x ,y )称为样本点的中心,回归直线过样本点的中心. 2.相关系数对于变量x 与y 随机抽到的n 对数据(x 1,y 1),(x 2,y 2),…,(x n ,y n ),检测统计量是样本相关系数r =i =1n (x i -x )(y i -y )i =1n (x i -x )2i =1n (y i -y )2=∑i =1nx i y i -n x y(∑i =1nx 2i -n x 2)(∑i =1ny2i -n y 2)相关系数r 的取值范围是[-1,1],|r |越接近1,变量之间的线性相关程度越高,|r |越接近0,线性相关程度越弱,当|r |>r 0.05时,有95%的把握认为两个变量之间有线性相关关系. 3.非线性回归分析回归曲线方程也可以线性化(1)将幂函数型函数y =ax n (a 为常数,a ,x ,y 均取正值)化为线性函数:将y =ax n 两边取常用对数,则有lg y =n lg x +lg a ,令μ=lg y ,v =lg x ,b =lg a ,代入上式得μ=n v +b (其中n 、b 是常数),其图象是一条直线.(2)将指数型函数y =ca x (a >0,c >0,a ,c 为常数)化为线性函数;将y =ca x 两边取常用对数,则有lg y =x lg a +lg c ,令μ=lg y ,b =lg c ,d =lg a ,代入上式得μ=dx +b (d ,b 是常数),它的图象是一条直线.要点一 求回归直线方程例1 某班5名学生的数学和物理成绩如下表:(1)画出散点图;(2)求物理成绩y 对数学成绩x 的回归直线方程; (3)一名学生的数学成绩是96,试预测他的物理成绩. 解 (1)散点图如图.(2)x =15×(88+76+73+66+63)=73.2,y =15×(78+65+71+64+61)=67.8.∑i =15x i y i =88×78+76×65+73×71+66×64+63×61=25054.∑i =15x 2i =882+762+732+662+632=27174.所以b ^=∑i =15x i y i -5x y∑i =15x 2i -5x2=25054-5×73.2×67.827174-5×73.22≈0.625.a ^=y -b ^x ≈67.8-0.625×73.2=22.05. 所以y 对x 的回归直线方程是y ^=0.625x +22.05. (3)x =96,则y ^=0.625×96+22.05≈82, 即可以预测他的物理成绩是82.规律方法 (1)散点图是定义在具有相关关系的两个变量基础上的,对于性质不明确的两组数据,可先作散点图,在图上看它们有无关系,关系的密切程度,然后再进行相关回归分析. (2)求回归直线方程,首先应注意到,只有在散点图大致呈线性时,求出的回归直线方程才有实际意义,否则,求出的回归直线方程毫无意义.跟踪演练1 某研究机构对高三学生的记忆力x 和判断力y 进行统计分析,得下表数据:(1)请画出上表数据的散点图((2)请根据上表提供的数据,用最小二乘法求出y 关于x 的回归直线方程y ^=b ^x +a ^; (3)试根据求出的回归直线方程,预测记忆力为9的同学的判断力.解 (1)如图:(2)∑ni =1x i y i =6×2+8×3+10×5+12×6=158, x =6+8+10+124=9,y =2+3+5+64=4,∑ni =1x 2i =62+82+102+122=344, b ^=158-4×9×4344-4×92=1420=0.7,a ^=y -b ^x =4-0.7×9=-2.3, 故回归直线方程为y ^=0.7x -2.3.(3)由②中回归直线方程当x =9时,y ^=0.7×9-2.3=4,预测记忆力为9的同学的判断力约为4.要点二 相关性检验例2 下面的数据是从年龄在40到60岁的男子中随机抽出的6个样本,分别测定了心脏的功能水平y (满分100)以及每天花在看电视上的平均时间x (小时).(1)(2)求心脏的功能水平y 与每天花在看电视上的平均时间x 的回归直线方程,并讨论方程是否有意义;(3)估计平均每天看电视3小时的男子的心脏的功能水平. 解 n =6,x =16(4.4+4.6+…+4.6)≈3.7167,y =16(52+53+…+65)≈64.1667,∑i =16x 2i -6(x )2=(4.42+4.62+…+4.62)-6×3.71672≈19.7668,∑i =16y 2i -6(y )2=(522+532+…+652)-6×64.16672≈964.8077,∑i =16x i y i -6x y =(4.4×52+4.6×53+…+4.6×65)-6×3.7167×64.1667≈-124.6302.(1)心脏的功能水平y 与每天花在看电视上的平均时间x 之间的相关系数r =∑i =16x i y i -6x y(∑i =16x 2i -6(x )2)(∑i =16y 2i -6(y )2)≈-124.630219.7668×964.8077≈-0.9025.(2)b ^=∑i =16x i y i -6x y∑i =16x 2i -6(x )2≈-124.630219.7668≈-6.3050,a ^=y -b ^x ≈64.1667+6.3050×3.7167≈87.6005,所以心脏的功能水平y 与每天花在看电视上的平均时间x 的回归直线方程为y ^=-6.3050x +87.6005.查表n -2=4,r 0.05=0.811,因为|r |≈0.9025>0.811,所以有95%以上的把握认为y 与x 之间有线性关系,这个方程是有意义的.(3)将x =3代入回归直线方程y ^=-6.3050x +87.6005可得y ^≈69(分).因此估计平均每天看电视3小时的男子的心脏的功能水平为69分.规律方法 解决这一类问题时,首先应对问题进行必要的相关性检验,如果不作相关性检验,我们仍然可以求出x 与y 的回归直线方程,但不知道这时的回归直线方程是否有意义,也就不知道能否反映变量x 与y 之间的变化规律,只有在x 与y 之间具有相关关系时,求得的回归直线方程才有意义.跟踪演练2 维尼纶纤维的耐热水性能的好坏可以用指标“缩醛化度”y 来衡量,这个指标越高,耐热水性能也越好,而甲醛浓度是影响缩醛化度的重要因素,在生产中常用甲醛浓度x (g/L)去控制这一指标,为此必须找出它们之间的关系,现安排一批实验,获得如下数据.(2)求回归直线方程;(3)求相关系数r ,并进行相关性检验. 解 (1)(2)列表:x =1687=24,y =202.947,b ^=∑i =17x i y i -7x y∑i =17x 2i -7(x )2=4900.16-7×24×202.9474144-7×242=0.2643,a ^=y -b ^x =202.947-0.2643×24≈22.648,∴回归直线方程为y ^=22.648+0.2643x . (3)∑i =17y 2i =5892,r =∑i =17x i y i -7x y(∑i =17x 2i -7(x )2)(∑i =17y 2i -7(y )2)=4900.16-7×24×202.947(4144-7×242)×(5892-7×(202.947)2)=0.96.计算得r =0.96>r 0.05=0.754.说明甲醛浓度与缩醛化度两个变量之间有较强的线性相关关系. 要点三 非线性回归模型例3 某地区不同身高的未成年男性的体重平均值如下表:解 根据上表中数据画出散点图如图所示.由图看出,样本点分布在某条指数型函数曲线y =c 12e c x的周围,于是令z =ln y .由计算器计算可得下表,由表中数据可得z 与x 之间的回归直线方程: z ^=0.693+0.020x ,则有y ^=e 0.693+0.020x .规律方法 根据已有的函数知识,可以发现样本分布在某一条指数型函数曲线y =c 12e c x的周围,其中c 1和c 2是待定参数;可以通过对x 进行对数变换,转化为线性相关关系. 跟踪演练3 某种书每册的成本费Y (元)与印刷册数x (千册)有关,经统计得到数据如下:检验每册书的成本费Y 与印刷册数的倒数1x之间是否具有线性相关关系?若有,求出Y 对x的回归方程;若无,说明理由.解 设μ=1x ,则Y 与μ的数据关系如下表所示:0.05=0.632.从而有95%的把握认为这两个变量具有线性相关关系,从而求Y 与μ的回归直线方程有意义.又b ^=Σ10i =1μi y i -10μy Σ10i =1μ2i -10μ2=15.20878-10×0.2248×3.141.413014-10×0.22482≈8.98, a ^=y -b ^μ=3.14-8.98×0.2248=1.12,所以y 关于μ的回归直线方程为y ^=1.12+8.98μ,Y 与x 的回归方程为y ^=1.12+8.98x.1.下列各组变量之间具有线性相关关系的是( ) A.出租车费与行驶的里程 B.学习成绩与学生身高 C.身高与体重 D.铁的体积与质量 答案 C2.若劳动生产率x (千元)与月工资y (元)之间的回归直线方程为y ^=50+80x ,则下列判断正确的是( )A.劳动生产率为1000元时,月工资为130元B.劳动生产率提高1000元时,月工资平均提高80元C.劳动生产率提高1000元时,月工资平均提高130元D.月工资为210元时,劳动生产率为2000元 答案 B3.某商品销售量y (件)与销售价格x (元/件)负相关,则其回归直线方程可能是( ) A.y ^=-10x +200 B.y ^=10x +200 C.y ^=-10x -200D.y ^=10x -200答案 A解析 由于销售量y 与销售价格x 成负相关,故排除B.D.又当x =10时,A 中y =100,而C 中y =-300,C 不符合实际情况,故选A.4.某电脑公司有6名产品推销员,其工作年限与年推销金额数据如下表:(1)求年推销金额y (2)若第6名推销员的工作年限为11年,试估计他的年推销金额. 解 (1)设所求的回归直线方程为y ^=b ^x +a ^,则b ^=i =15(x i -x )(y i -y )i =15(x i -x )2=1020=0.5, a ^=y -b ^x =0.4.所以年推销金额y 关于工作年限x 的回归直线方程为y ^=0.5x +0.4. (2)当x =11时,y ^=0.5x +0.4=0.5×11+0.4=5.9(万元). 所以可以估计第6名推销员的年推销金额为5.9万元.回归分析的基本思路:(1)确定研究对象,明确哪个变量是解释变量,哪个变量是预报变量;(2)画出确定好的解释变量和预报变量的散点图,观察它们之间的关系(如是否存在线性关系等);(3)由经验确定回归方程的类型(如果呈线性关系,则选用回归直线方程y ^=b ^x +a ^); (4)按一定规则估计回归方程中的参数.。
高中数学 3.2 回归分析教案2 苏教版选修23

3.2回归分析(2)教学目标(1)通过实例了解相关系数的概念和性质,感受相关性检验的作用; (2)能对相关系数进行显著性检验,并解决简单的回归分析问题; (3)进一步了解回归的基本思想、方法及初步应用. 教学重点,难点相关系数的性质及其显著性检验的基本思想、操作步骤. 教学过程 一.问题情境1.情境:下面是一组数据的散点图,若求出相应的线性回归方程,求出的线性回归方程可以用作预测和估计吗?2.问题:思考、讨论:求得的线性回归方程是否有实际意义. 二.学生活动对任意给定的样本数据,由计算公式都可以求出相应的线性回归方程,但求得的线性回归方程未必有实际意义.左图中的散点明显不在一条直线附近,不能进行线性拟合,求得的线性回归方程是没有实际意义的;右图中的散点基本上在一条直线附近,我们可以粗略地估计两个变量间有线性相关关系,但它们线性相关的程度如何,如何较为精确地刻画线性相关关系呢?这就是上节课提到的问题①,即模型的合理性问题.为了回答这个问题,我们需要对变量x 与y 的线性相关性进行检验(简称相关性检验). 三.建构数学1.相关系数的计算公式:对于x ,y 随机取到的n 对数据(,)i i x y (1,2,3,,)i n =L ,样本相关系数r 的计算公式为112222221111()()()()(())(())nniii ii i n nn niii i i i i i x x y y x y nx yr x x y y x n x y n y ======---==-⋅-⋅--∑∑∑∑∑∑.()22.相关系数r 的性质:246810051015系0246810051015(1)||1r ≤;(2)||r 越接近与1,x ,y 的线性相关程度越强; (3)||r 越接近与0,x ,y 的线性相关程度越弱.可见,一条回归直线有多大的预测功能,和变量间的相关系数密切相关. 3.对相关系数r 进行显著性检验的步骤:相关系数r 的绝对值与1接近到什么程度才表明利用线性回归模型比较合理呢?这需要对相关系数r 进行显著性检验.对此,在统计上有明确的检验方法,基本步骤是:(1)提出统计假设0H :变量x ,y 不具有线性相关关系;(2)如果以95%的把握作出推断,那么可以根据10.950.05-=与2n -(n 是样本容量)在附录2(教材P111)中查出一个r 的临界值0.05r (其中10.950.05-=称为检验水平);(3)计算样本相关系数r ;(4)作出统计推断:若0.05||r r >,则否定0H ,表明有95%的把握认为变量y 与x 之间具有线性相关关系;若0.05||r r ≤,则没有理由拒绝0H ,即就目前数据而言,没有充分理由认为变量y 与x 之间具有线性相关关系.说明:1.对相关系数r 进行显著性检验,一般取检验水平0.05α=,即可靠程度为95%. 2.这里的r 指的是线性相关系数,r 的绝对值很小,只是说明线性相关程度低,不一定不相关,可能是非线性相关的某种关系.3.这里的r 是对抽样数据而言的.有时即使||1r =,两者也不一定是线性相关的.故在统计分析时,不能就数据论数据,要结合实际情况进行合理解释. 4.对于上节课的例1,可按下面的过程进行检验: (1)作统计假设0H :x 与y 不具有线性相关关系;(2)由检验水平0.05与29n -=在附录2中查得0.050.602r =; (3)根据公式()2得相关系数0.998r =;(4)因为0.9980.602r =>,即0.05r r >,所以有95﹪的把握认为x 与y 之间具有线性相关关系,线性回归方程为$527.59114.453y x =+是有意义的. 四.数学运用 1.例题:例1.下表是随机抽取的8对母女的身高数据,试根据这些数据探讨y与x之间的关系.母亲身高/x cm154157158159160161162163女儿身高/y cm155156159162161164165166解:所给数据的散点图如图所示:由图可以看出,这些点在一条直线附近,因为()1541571638159.25x=+++÷=L,()1551561668161y=+++÷=L,()82222218()1541638159.2559.5iix x=-=++-⨯=∑L,()82222218()1551668161116iiy y=-=++-⨯=∑L,()8181541551631668159.2516180i iix y x y=-⨯++⨯-⨯⨯=∑L,所以963.01165.5980≈⨯=r,由检验水平0.05及26n-=,在附录2中查得707.005.0=r,因为0.9630.707>,所以可以认为x与y之间具有较强的线性相关关系.线性回归模型y a bxε=++中,a b 的估计值$,a b$分别为()81822181.345,8i iiiix y x ybx x==-=≈-∑∑$53.191a y bx=-≈-$,故y对x的线性回归方程为xy345.1191.53+-=).例2.要分析学生高中入学的数学成绩对高一年级数学学习的影响,在高一年级学生中学生编号1 2 3 4 5 6 7 8 9 10入学成绩x 63 67 45 88 81 71 52 99 58 76 高一期末成绩y65 78 52 82 92 89 73 98 56 75 x y (2)如果x 与y 之间具有线性相关关系,求线性回归方程;(3)若某学生入学数学成绩为80分,试估计他高一期末数学考试成绩.解:(1)因为()16367767010x =⨯+++=L ,()16578757610y =⨯+++=L ,101()()1894xy i i i L x x y y ==--=∑,2101()2474xx i i L x x ==-=∑,1021()2056yy i i L y y ==-=∑.因此求得相关系数为10110102211()()0.840()()iii xx yyi i i i x x y y L r L L x x y y ===--===--∑∑∑.结果说明这两组数据的相关程度是比较高的;小结解决这类问题的解题步骤:(1)作出散点图,直观判断散点是否在一条直线附近; (2)求相关系数r ;(3)由检验水平和2n -的值在附录中查出临界值,判断y 与x 是否具有较强的线性相关关系; (4)计算$a,b $,写出线性回归方程. 2.练习:104P 练习第1题. 五.回顾小结:1.相关系数的计算公式与回归系数b$计算公式的比较; 2.相关系数的性质;3.探讨相关关系的基本步骤. 六.课外作业:106P 习题3.2第1题.。
人教版高中数学全套教案导学案3.2 回归分析(1)

§3.2 回归分析(1)教学目标(1)通过实例引入线性回归模型,感受产生随机误差的原因;(2)通过对回归模型的合理性等问题的研究,渗透线性回归分析的思想和方法; (3)能求出简单实际问题的线性回归方程. 教学重点,难点线性回归模型的建立和线性回归系数的最佳估计值的探求方法. 教学过程一.问题情境1. 情境:对一作直线运动的质点的运动过程观测了8次,得到如下表所示的数据,试估计当根据《数学(必修)》中的有关内容,解决这个问题的方法是: 先作散点图,如下图所示:从散点图中可以看出,样本点呈直线趋势,时间x 与位置观测值y 之间有着较好的线性关系.因此可以用线性回归方程来刻画它们之间的关系.根据线性回归的系数公式,1221()ni i i n i i x y nx y b x n x a y bx==⎧-⎪⎪=⎪⎨-⎪⎪=-⎪⎩∑∑ 可以得到线性回归方为 3.5361 2.1214y x =+,所以当9x =时,由线性回归方程可以估计其位置值为22.6287y =2.问题:在时刻9x =时,质点的运动位置一定是22.6287cm 吗?二.学生活动思考,讨论:这些点并不都在同一条直线上,上述直线并不能精确地反映x 与y 之间的关系,y 的值不能由x 完全确定,它们之间是统计相关关系,y 的实际值与估计值之间存在着误差. 三.建构数学1.线性回归模型的定义:我们将用于估计y 值的线性函数a bx +作为确定性函数;y 的实际值与估计值之间的误差记为ε,称之为随机误差;将y a bx ε=++称为线性回归模型.说明:(1)产生随机误差的主要原因有:①所用的确定性函数不恰当引起的误差; ②忽略了某些因素的影响; ③存在观测误差.(2)对于线性回归模型,我们应该考虑下面两个问题: ①模型是否合理(这个问题在下一节课解决); ②在模型合理的情况下,如何估计a ,b ? 2.探求线性回归系数的最佳估计值:对于问题②,设有n 对观测数据(,)i i x y (1,2,3,,)i n =,根据线性回归模型,对于每一个i x ,对应的随机误差项()i i i y a bx ε=-+,我们希望总误差越小越好,即要使21nii ε=∑越小越好.所以,只要求出使21(,)()niii Q y x αββα==--∑取得最小值时的α,β值作为a ,b 的估计值,记为a ,b .注:这里的i ε就是拟合直线上的点(),i i x a bx +到点(),i i i P x y 的距离. 用什么方法求a ,b ?回忆《数学3(必修)》“2.4线性回归方程”P71“热茶问题”中求a ,b 的方法:最小二乘法.利用最小二乘法可以得到a ,b 的计算公式为1122211()()()()nni i i ii i n ni ii i x x y y x y nx yb x x xn x a y bx====⎧---⎪⎪==⎪⎨--⎪⎪=-⎪⎩∑∑∑∑,其中11n i i x x n ==∑,11ni i y y n ==∑由此得到的直线y a bx =+就称为这n 对数据的回归直线,此直线方程即为线性回归方程.其中a ,b 分别为a ,b 的估计值,a 称为回归截距,b 称为回归系数,y 称为回归值.在前面质点运动的线性回归方程 3.5361 2.1214y x =+中, 3.5361a =, 2.1214b =. 3. 线性回归方程y a bx =+中a ,b 的意义是:以a 为基数,x 每增加1个单位,y 相应地平均增加b 个单位;4. 化归思想(转化思想)在实际问题中,有时两个变量之间的关系并不是线性关系,这就需要我们根据专业知识或散点图,对某些特殊的非线性关系,选择适当的变量代换,把非线性方程转化为线性回归方程,从而确定未知参数.下面列举出一些常见的曲线方程,并给出相应的化为线性回归方程的换元公式. (1)b y a x =+,令'y y =,1'x x=,则有''y a bx =+. (2)by ax =,令'ln y y =,'ln x x =,'ln a a =,则有'''y a bx =+. (3)bxy ae =,令'ln y y =,'x x =,'ln a a =,则有'''y a bx =+. (4)b x y ae =,令'ln y y =,1'x x=,'ln a a =,则有'''y a bx =+. (5)ln y a b x =+,令'y y =,'ln x x =,则有''y a bx =+.四.数学运用 1.例题:例1.下表给出了我国从1949年至1999年人口数据资料,试根据表中数据估计我国2004年的人口数.解:为了简化数据,先将年份减去1949,并将所得值用x 表示,对应人口数用y 表示,作出11个点(),x y 构成的散点图,由图可知,这些点在一条直线附近,可以用线性回归模型y a bx ε=++来表示它们之间的关系.根据公式(1)可得14.453,527.591.b a ⎧≈⎪⎨≈⎪⎩ 这里的,a b 分别为,a b 的估 计值,因此线性回归方程 为527.59114.453y x =+由于2004年对应的55x =,代入线性回归方程527.59114.453y x =+可得1322.50y =(百万),即2004年的人口总数估计为13.23亿. 例2. 某地区对本地的企业进行了一次抽样调查,下表是这次抽查中所得到的各企业的人均资本x (万元)与人均产出y (万元)的数据:(1)设y 与x 之间具有近似关系by ax ≈(,a b 为常数),试根据表中数据估计a 和b 的值; (2)估计企业人均资本为16万元时的人均产出(精确到0.01).分析:根据x ,y 所具有的关系可知,此问题不是线性回归问题,不能直接用线性回归方程处理.但由对数运算的性质可知,只要对by ax ≈的两边取对数,就能将其转化为线性关系.解(1)在by ax ≈的两边取常用对数,可得lg lg lg y a b x ≈+,设lg y z =,lg a A =,lg x X =,则z A bX ≈+.相关数据计算如图327--所示.仿照问题情境可得A ,b 的估计值A ,b 分别为0.2155,1.5677,A b ⎧=-⎪⎨=⎪⎩由lg 0.2155a =-可得0.6088a ≈,即a ,b 的估计值分别为0.6088和1.5677.(2)由(1)知1.56770.6088y x =.样本数据及回归曲线的图形如图328--(见书本102P页)当16x =时, 1.56770.60881647.01y =⨯≈(万元),故当企业人均资本为16万元时,人均产值约为47.01万元.2.练习:104P 练习第1题. 五.回顾小结:1. 线性回归模型y a bx ε=++与确定性函数y a bx =+相比,它表示y 与x 之间是统计相关关系(非确定性关系)其中的随机误差ε提供了选择模型的准则以及在模型合理的情况下探求最佳估计值a ,b 的工具;2. 线性回归方程y a bx =+中a ,b 的意义是:以a 为基数,x 每增加1个单位,y 相应地平均增加b 个单位; 3.求线性回归方程的基本步骤. 六.课外作业:106P 第2题.。
北师大版高中数学导学案《回归分析》

§1.1回归分析一、学习目标1、理解两个变量间的函数关系与相关关系的区别;(重点)2、通过对案例的探究,会对两个随机变量进行线性回归分析;(重点)3、理解相关系数的含义,户计算两个随机变量的线性相关系数,会通过线性相关系数判断它们之间的线性相关程度;(重点)4、通过对数据之间的散点图的观察,能够对两个随机变量进行可线性化的回归分析。
(难点)二、自主学习(预习教材,找出疑惑之处)复习:1.相关关系概念: . 2.回归分析的相关概念:回归分析是处理两个变量之间的一种统计方法.若两个变量之间具有线性相关关系,则称相应的回归分析为.3. 回归直线方程 其中=∧b,=∧a,恒过定点新课:4.平均值的符号表示:假设样本点为()(),,,,2211y x y x …()n n y x , ,在统计上,用x 表示一组数据,,21x x …n x 的平均值,即x = = ,用y 表示一组数据,,21y y …n y 的平均值,即y = = 。
5. 参数a ,b 的求法:==xxxy l l b =。
=a 。
6.相关系数的计算:假设两个随机变量的数据分别为()(),,,,2211y x y x …()n n y x , ,则变量间线性相关系数==yyxx xy l l l r= 。
7.相关系数的性质:① r 的取值范围: ;② |r|值越大,误差Q 越小,变量之间的线性相关程度越 ; ③ |r|值越接近0,误差Q 越大,变量之间的线性相关程度越 ; ④ 相关性的分类: , , 。
8.可线性化的回归分析:Ⅰ 幂函数曲线如何做变化?变换公式?变换后的线性函数为什么? Ⅱ 指数曲线,倒指数曲线,对数曲线呢?三、典例分析例1 从某大学中随机选取8名女大学生,其身高和体重数据如下表所示:生的体重.提示:第一步:作散点图第二步:求回归方程 第三步:代值计算探究一 如何理解回归直线方程中的系数b ∧,a ∧?探究二 身高为172cm 的女大学生的体重一定是60.316kg 吗?例2 为分析学生初中升高中的数学成绩对高一数学学习的成绩,在高一年级随机抽取10(1) 画出散点图;(2)对变量x 与y 进行相关性检验,如果x 与y 之间具有线性相关关系求出回归直线方程;(3)若某学生入学的数学成绩为80分,试估计他在高一期末考试中的数学成绩。
高中数学回归分析教案

高中数学回归分析教案一、教学目标:1. 了解回归分析的概念和基本原理;2. 掌握最小二乘法求解回归方程的方法;3. 能够应用回归分析解决实际问题;4. 培养学生分析问题和解决问题的能力。
二、教学内容:1. 回归分析的概念和基本原理;2. 最小二乘法求解回归方程的方法;3. 简单线性回归分析;4. 多元线性回归分析;三、教学重点和难点:1. 重点:最小二乘法求解回归方程的方法;2. 难点:多元线性回归分析。
四、教学过程:第一节:回归分析的概念和基本原理1. 引入回归分析的概念和应用背景;2. 讲解回归分析的基本原理和作用;3. 给出回归分析的基本定义和公式;4. 分析回归分析在实际生活中的应用。
第二节:最小二乘法求解回归方程的方法1. 讲解最小二乘法的概念和原理;2. 推导最小二乘法求解回归方程的公式;3. 基于实例演示最小二乘法求解回归方程的步骤;4. 练习求解回归方程的题目。
第三节:简单线性回归分析1. 介绍简单线性回归的概念和特点;2. 解释如何进行简单线性回归分析;3. 演示简单线性回归分析的计算步骤;4. 练习简单线性回归分析的题目。
第四节:多元线性回归分析1. 介绍多元线性回归的概念和特点;2. 解释如何进行多元线性回归分析;3. 演示多元线性回归分析的计算步骤;4. 练习多元线性回归分析的题目。
五、教学方法:1. 讲授相结合;2. 案例分析;3. 互动讨论;4. 练习与实践。
六、教学资源:1. 课本资料;2. PowerPoint教学课件;3. 实例数据。
七、教学评估:1. 课后作业;2. 期中测试;3. 期末考试。
八、教学反思:1. 辅导学生解决实际问题的能力;2. 创设多种教学方法提高教学效果;3. 关注学生的学习情况,及时调整教学节奏。
以上为高中数学回归分析教案范本,希朐对您有所帮助。
新人教版必修1高考数学总复习回归分析的基本思想及其初步应用学案

高考数学总复习回归分析的基本思想及其初步应用学案【学习目标】:通过典型案例的探究,进一步了解回归分析的基本思想、方法及初步应用. 【学习重点】:利用散点图直观认识两个变量之间的线性关系,求线性回归直线方程。
【学习难点】:求线性回归直线方程。
【教学过程】:一:回顾预习案1、线性回归方程ax b y ˆ+= ,其中1221ˆni ii ni i x y nx yb x nx==-=-∑∑,x b y aˆˆ-= ●2、y 与x 之间的线性回归方程ax b y ˆ+=必定过(x ,y )点 3,练习(1)已知某车间加工零件的个数x 与所花费时间y (h )之间的线性回归方程为y ^=0.01x +0.5,则加工600个零件大约需要__________h 。
A .6.5B .5.5C .3.5D .0.5(2)工人月工资y (元)依劳动生产率x (千元)变化的回归方程y ^=50+80x ,下列判断正确的是( )A .劳动生产率为1000元时,工资为130元;B .劳动生产率提高1000元时,则工资提高80元;C .劳动生产率提高1000元,则工资提高130元;D .当月工资为210元时,劳动生产率为2000元.(3)某商品销售量y (件)与销售价格x (元/件)负相关,则其回归方程可能是( )A.y ^=-10x +200B.y ^=10x +200C.y ^=-10x -200D.y ^=10x -200 (4)已知x 与y 之间的一组数据:则y 与x 的线性回归方程y =b ^x +a ^必过( ) A .(2,2)点 B .(1.5,0)点 C .(1,2)点D .(1.5,4)点(5)在一次实验中,测得(),x y 的四组值分别是()1,2A ,()2,3B ,()3,4C ,()4,5D ,则y 与x 之间的回归直线方程为( )A .1y x =+B .2y x =+C .21y x =+D .1y x =-(6)已知回归直线的斜率的估计值是1.23,样本点的中心为(4,5),则回归直线的方程是 A .423.1+=x y B .523.1+=x y C .08.023.1+=x y D .23.108.0+=x y(7)、某种产品的广告费支出x 和销售额y (单位:百万元)之间有如下一组数据;(2)求出线性回归方程;(3)预测若想要得到9千万的销售额,需投入广告费多少?4,新知学习:研究课本第2页的例1,回答下列问题:(1)________称为样本点的中心,b是回归直线的_____的估计值。
高中数学_回归分析教学设计学情分析教材分析课后反思

【教学设计】回归分析_数学_高中__本节课的内容是高中数学选修1-2第一章第二节《统计案例》的第2课时——回归分析。
新课标指出,学生是教学的主体,教师的教要应本着从学生的认知规律出发,以学生活动为主线,在原有知识的基础上,建构新的知识体系。
我将以此为基础从下面这几个方面加以说明。
一、教材分析(包括教材处理、教材的地位和作用、教学的重点和难点)1、教材处理:本节涉及线性相关性的检验及线性回归分析。
使用了教材中的例题2,增加了分析数学成绩和物理成绩的变式练习。
通过对母女身高关系问题的探讨,层层深入,说明相关性检验的必要性、过程方法及解题步骤。
这样更能体现回归分析合理建模、科学预测的回归分析的思想和方法,学生通过对身高的预测和分析数学成绩与物理成绩的相关关系,容易激发学生的学习兴趣。
2、教材的地位和作用:本节课是学生在必修三第二章统计中已学习了变量的相关性的基础上,进一步研究两个变量的相关关系,以及在确定了两个变量的相关关系后合理建模,科学预测。
它一方面可以进一步深化学生对两个变量相关关系的理解与认识,使学生得到较系统的回归分析的过程方法和步骤,同时也为今后进一步研究变量的非线性关系打下坚实的基础。
因此,本节课的内容十分重要,它对知识起到了承上启下的作用。
此外,《回归分析》的知识是一种应用于许多领域的广泛的分析研究方法,在经济理论研究和实证研究中也发挥着重要作用,因此也是学生终身发展的需要。
3、教学的重点和难点:关键在于重难点如何确定、难点如何突破。
教学重点:回归分析的思想和方法。
【重点的确定】回归分析的思想和方法,它一方面可以进一步深化学生对两个变量相关关系的理解与认识,使学生得到较系统的回归分析知识和研究方法,同时也为今后进一步处理非线性的变量相关关系打下坚实的基础,因此它是本节课的重点内容。
教学难点:回归分析的初步应用【难点的确定】相关性检验的公式繁琐,计算量大导致了回归方程的求解过程复杂,难于理解。
高中数学选修回归分析教案

高中数学选修回归分析教案教学内容:1. 线性回归分析的基本概念2. 简单线性回归分析3. 多元线性回归分析4. 回归模型的拟合度检验教学目标:1. 了解线性回归分析的基本概念及相关原理2. 能够运用简单线性回归分析进行数据分析与预测3. 能够应用多元线性回归分析解决实际问题4. 能够进行回归模型的拟合度检验,评估模型的有效性教学重难点:1. 理解线性回归分析中的相关概念,包括自变量、因变量、回归方程等2. 掌握简单线性回归的计算方法和实际应用3. 理解多元线性回归的基本原理,能够运用多元线性回归进行数据分析4. 掌握回归模型的拟合度检验方法及其应用教学过程:第一课时:1. 引入线性回归分析的概念和应用领域2. 讲解简单线性回归的原理和计算方法3. 给出简单线性回归的实例并进行计算练习第二课时:1. 复习简单线性回归的内容2. 讲解多元线性回归的概念和应用3. 给出多元线性回归的实例并进行计算练习第三课时:1. 复习多元线性回归的内容2. 讲解回归模型的拟合度检验方法3. 给出拟合度检验的实例并进行计算练习教学方法:1. 讲解结合实例分析2. 组织学生进行小组讨论与分享3. 带领学生进行数据分析与计算实践4. 指导学生进行模型拟合度检验的实验操作教学评估:1. 利用课堂练习、作业和小考查学生对于概念和计算方法的掌握情况2. 设计实际应用题目,评估学生对于多元线性回归和拟合度检验的应用能力3. 结合学生提问和错误答案进行即时纠正和指导教学资源:1. 课本《数学选修-回归分析》2. 计算器、电脑及相关软件3. 实例数据集和计算练习题教学反思:通过本次教学,学生对线性回归分析有了更深入的理解,能够应用简单线性回归和多元线性回归解决实际问题,同时也能够进行回归模型的拟合度检验,提高了数学分析和实际应用能力。
但在教学过程中,需要更加关注学生的实际操作能力和问题解决能力,进一步提高教学效果。
课堂新坐标高中数学北师大版选修学案回归分析含解析

§1 回归分析 1.1 回归分析 1.2 相关系数 1.3 可线性化的回归分析1.了解回归分析的思想和方法.(重点)2.掌握相关系数的计算和判断线性相关的方法.(重点)3.了解常见的非线性回归模型转化为线性回归模型的方法.(难点)[基础·初探]教材整理1 回归分析阅读教材P 3~P 6“练习”以上部分,完成下列问题.设变量y 对x 的线性回归方程为y =a +bx ,由最小二乘法知系数的计算公式为:b =l xyl xx=∑i =1n (x i -x )(y i -y )∑i =1n(x i -x )2=∑i =1nx i y i -n x y∑i =1nx 2i -n x 2,a =y -b x.某产品的广告费用x 与销售额y 的统计数据如下表:万元时,销售额为( ) 【导学号:67720000】A.63.6万元B.65.5万元C.67.7万元D.72.0万元【解析】x=4+2+3+54=3.5,y=49+26+39+544=42,∴a=y-b x=42-9.4×3.5=9.1,∴回归方程为y=9.4x+9.1,∴当x=6时,y=9.4×6+9.1=65.5,故选B.【答案】 B教材整理2相关系数阅读教材P6“练习”以下至P9“练习”以上部分,完成下列问题.1.相关系数r的计算假设两个随机变量的数据分别为(x1,y1),(x2,y2),…,(x n,y n),则变量间线性相关系数r=l xyl xx l yy=∑i=1n(x i-x)(y i-y)∑i=1n(x i-x)2∑i=1n(y i-y)2=∑i=1nx i y i-n x y∑i=1nx2i-n x2∑i=1ny2i-n y2.2.相关系数r与线性相关程度的关系(1)r的取值范围为[-1,1];(2)|r|值越大,误差Q越小,变量之间的线性相关程度越高;(3)|r|值越接近0,误差Q越大,变量之间的线性相关程度越低.3.相关性的分类(1)当r>0时,两个变量正相关;(2)当r<0时,两个变量负相关;(3)当r=0时,两个变量线性不相关.判断(正确的打“√”,错误的打“×”)(1)两个变量的相关系数r>0,则两个变量正相关.()(2)两个变量的相关系数越大,它们的相关程度越强.()(3)若两个变量负相关,那么其回归直线的斜率为负.()【答案】(1)√(2)×(3)√教材整理3可线性化的回归分析阅读教材P9~P13“练习”以上部分,完成下列问题.1.非线性回归分析对不具有线性相关关系的两个变量做统计分析,通过变量代换,转化为线性回归模型.2.非线性回归方程下列数据x ,y 符合哪一种函数模型( )A .y =2+13x B .y =2e x C .y =2e 1xD .y =2+ln x【解析】 分别将x 的值代入解析式判断知满足y =2+ln x . 【答案】 D[质疑·手记]预习完成后,请将你的疑问记录,并与“小伙伴们”探讨交流: 疑问1:___________________________________________解惑:_____________________________________________________ 疑问2:_____________________________________________________ 解惑:_____________________________________________________ 疑问3:_____________________________________________________ 解惑:___________________________________________[小组合作型],变量间的相关关系及判定(1)对变量x ,y 有观测数据(x i ,y i )(i =1,2,…,10),得散点图1-1-1①,对变量u ,v 有观测数据(u i ,v i )(i =1,2,…,10),得散点图1-1-1②.由这两个散点图可以判断( )图1-1-1A.变量x与y正相关,u与v正相关B.变量x与y正相关,u与v负相关C.变量x与y负相关,u与v正相关D.变量x与y负相关,u与v负相关(2)(2016·上饶高二检测)两个变量x,y与其线性相关系数r有下列说法:①若r>0,则x增大时,y也随之相应增大;②若r<0,则x增大时,y也相应增大;③若r=1或r=-1,则x与y的关系完全对应(有函数关系),在散点图上各个散点均在一条直线上,其中正确的有()A.①②B.②③C.①③D.①②③(3)有五组变量:①汽车的重量和汽车每消耗1升汽油所行驶的平均路程;②平均日学习时间和平均学习成绩;③某人每日吸烟量和其身体健康情况;④正方形的边长和面积;⑤汽车的重量和百公里耗油量.其中两个变量成正相关的是()A.①③B.②④C.②⑤D.④⑤【精彩点拨】可借助于线性相关概念及性质作出判断.【自主解答】(1)由这两个散点图可以判断,变量x与y负相关,u与v正相关,故选C.(2)根据两个变量的相关性与其相关系数r之间的关系知,①③正确,②错误,故选C.(3)其中①③成负相关关系,②⑤成正相关关系,④成函数关系,故选C.【答案】(1)C(2)C(3)C1.线性相关系数是从数值上来判断变量间的线性相关程度,是定量的方法.与散点图相比较,线性相关系数要精细得多,需要注意的是线性相关系数r 的绝对值小,只是说明线性相关程度低,但不一定不相关,可能是非线性相关.2.利用相关系数r 来检验线性相关显著性水平时,通常与0.75作比较,若r >0.75,则线性相关较为显著,否则为不显著.[再练一题]1.下列两变量中具有相关关系的是( ) A .正方体的体积与边长 B .人的身高与体重C .匀速行驶车辆的行驶距离与时间D .球的半径与体积【解析】 选项A 中正方体的体积为边长的立方,有固定的函数关系;选项C 中匀速行驶车辆的行驶距离与时间成正比,也是函数关系;选项D 中球的体积是43π与半径的立方相乘,有固定函数关系.只有选项B 中人的身高与体重具有相关关系.【答案】 B,求线性回归方程(2016·九江高二检测)某服装商场为了了解毛衣的月销售量y (件)与月平均气温x (℃)之间的关系,随机统计了某4个月的月销售量与当月平均气温,其数据如下表:(1)(2)气象部门预测下个月的平均气温约为6 ℃,据此估计该商场下个月毛衣的销售量.【精彩点拨】 (1)可利用公式求解;(2)把月平均气温代入回归方程求解. 【自主解答】(1)由散点图易判断y 与x 具有线性相关关系. x =(17+13+8+2)÷4=10, y =(24+33+40+55)÷4=38,∑4i =1x i y i =17×24+13×33+8×40+2×55=1 267, ∑4 i =1x 2i =526, b =∑4 i =1x i y i -4x y ∑4 i =1x 2i -4x2=1 267-4×10×38526-4×102≈-2.01,a =y -b x ≈38-(-2.01)×10=58.1, 所以线性回归方程为y =-2.01x +58.1.(2)气象部门预测下个月的平均气温约为6 ℃,据此估计,该商场下个月毛衣的销售量为y =-2.01x +58.1=-2.01×6+58.1≈46(件).1.回归分析是定义在具有相关关系的两个变量基础上的,因此,在做回归分析时,要先判断这两个变量是否相关,利用散点图可直观地判断两个变量是否相关.2.利用回归直线,我们可以进行预测.若回归直线方程y =a +bx ,则x =x 0处的估计值为y 0=a +bx 0.3.线性回归方程中的截距a 和斜率b 都是通过样本估计而得到的,存在着误差,这种误差可能导致预报结果的偏差,所以由线性回归方程给出的是一个预报值而非精确值.4.回归直线必过样本点的中心点.[再练一题]2.某研究机构对高三学生的记忆力x 和判断力y 进行统计分析,得到下表数据:(1)(2)请根据上表提供的数据,用最小二乘法求出y 关于x 的线性回归方程y =bx +a ;(3)试根据求出的线性回归方程,预测记忆力为9的同学的判断力. 【导学号:67720001】【解】 (1)如图:(2)∑ni =1x i y i =6×2+8×3+10×5+12×6=158, x =6+8+10+124=9,y =2+3+5+64=4, ∑ni =1x 2i =62+82+102+122=344, b =158-4×9×4344-4×92=1420=0.7,a =y -b x =4-0.7×9=-2.3,故线性回归方程为y=0.7x-2.3.(3)由(2)中线性回归方程知当x=9时,y=0.7×9-2.3=4,预测记忆力为9的同学的判断力约为4.[探究共研型],可线性化的回归分析探究1如何解答非线性回归问题?【提示】非线性回归问题有时并不给出经验公式.这时我们可以画出已知数据的散点图,把它与学过的各种函数(幂函数、指数函数、对数函数等)图像作比较,挑选一种跟这些散点拟合得最好的函数,然后采用适当的变量变换,把问题化为线性回归分析问题,使之得到解决.其一般步骤为:探究2已知x和y之间的一组数据,则下列四个函数中,模拟效果最好的为哪一个?①y=3×2x-1; ②y2③y=4x; ④y=x2.【提示】观察散点图中样本点的分布规律可判断样本点分布在曲线y=3×2x-1附近.所以模拟效果最好的为①.某地区不同身高的未成年男性的体重平均值如下表:(2)如果一名在校男生身高为168 cm,预测他的体重约为多少?【精彩点拨】先由散点图确定相应的拟合模型,再通过对数变换将非线性相关转化为线性相关的两个变量来求解.【自主解答】(1)根据表中的数据画出散点图,如下:由图看出,这些点分布在某条指数型函数曲线y=c1e c2x的周围,于是令z=ln y,列表如下:由表中数据可求得z与x之间的回归直线方程为z=0.693+0.020x,则有y =e0.693+0.020x.(2)由(1)知,当x=168时,y=e0.693+0.020×168≈57.57,所以在校男生身高为168 cm,预测他的体重约为57.57 kg.两个变量不具有线性关系,不能直接利用线性回归方程建立两个变量的关系,可以通过变换的方法转化为线性回归模型,如y =c 1e c 2x ,我们可以通过对数变换把指数关系变为线性关系,令z =ln y ,则变换后样本点应该分布在直线z =bx +a (a =ln c 1,b =c 2)的周围.[再练一题]3.在一次抽样调查中测得样本的5个样本点,数据如下表:试建立y 【解】 作出变量y 与x 之间的散点图如图所示.由图可知变量y 与x 近似地呈反比例函数关系.设y =k x ,令t =1x ,则y =kt .由y 与x 的数据表可得y 与t 的数据表:作出y 与t由图可知y 与t 呈近似的线性相关关系.又t =1.55,y =7.2,∑i =15t i y i =94.25,∑i =15t 2i =21.312 5,b =∑i =15t i y i -5t y ∑i =15t 2i -5t 2=94.25-5×1.55×7.221.312 5-5×1.552≈4.134 4,a =y -b t =7.2-4.134 4×1.55≈0.8, ∴y =4.134 4t +0.8.所以y 与x 的回归方程是y =4.134 4x +0.8. [构建·体系]1.下列结论正确的是( )①函数关系是一种确定性关系;②相关关系是一种非确定性关系;③回归分析是对具有函数关系的两个变量进行统计分析的一种方法;④回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法.A .①②B .①②③C .①②④D .①②③④【解析】 函数关系和相关关系的区别是前者是确定性关系,后者是非确定性关系,故①②正确;回归分析是对具有相关关系的两个变量进行统计分析的一种方法,故③错误,④正确.【答案】 C2.下表是x 和y 之间的一组数据,则y 关于x 的线性回归方程必过点( )A .(2,3)B .(1.5,4)C .(2.5,4)D .(2.5,5)【解析】 线性回归方程必过样本点的中心(x ,y ), 即(2.5,4),故选C . 【答案】 C3.对具有线性相关关系的变量x 和y ,由测得的一组数据求得回归直线的斜率为6.5,且恒过(2,3)点,则这条回归直线的方程为________.【解析】 由题意知x =2,y =3,b =6.5,所以a =y -b x =3-6.5×2=-10,即回归直线的方程为y =-10+6.5x .【答案】 y =-10+6.5x4.部门所属的10个工业企业生产性固定资产价值与工业增加值资料如下表(单位:百万元):【解析】 x =3+3+5+6+6+7+8+9+9+1010=6.6.y =15+17+25+28+30+36+37+42+40+4510=31.5.所以r =∑i =110(x i -x )(y i -y )∑i =110(x i -x )2∑i =110(y i -y )2≈0.991 8.【答案】 0.991 85.(2015·重庆高考)随着我国经济的发展,居民的储蓄存款逐年增长.设某地区城乡居民人民币储蓄存款(年底余额)如下表:(1)求y 关于t 的回归方程y =bt +a ;(2)用所求回归方程预测该地区2015年(t =6)的人民币储蓄存款. 附:回归方程y =bt +a 中,b =∑i =1nt i y i -n t y ∑i =1nt 2i -n t 2,a =y -b t .【解】 (1)列表计算如下:这里n =5,t =1n ∑i =1n t i =155=3,y =1n ∑i =1n y i =365=7.2.又l tt =∑i =1nt 2i -n t 2=55-5×32=10,l ty =∑i =1nt i y i -n t -y -=120-5×3×7.2=12,从而b =l ty l tt=1210=1.2,a =y -b t =7.2-1.2×3=3.6, 故所求回归方程为y =1.2t +3.6.(2)将t =6代入回归方程可预测该地区2015年的人民币储蓄存款为y ^=1.2×6+3.6=10.8(千亿元).我还有这些不足:(1)______________________________________________________(2) ______________________________________________________我的课下提升方案:(1) ______________________________________________________(2) ____________________________________________学业分层测评(一)(建议用时:45分钟)[学业达标]一、选择题1.为了考查两个变量x和y之间的线性相关性,甲、乙两名同学各自独立地做了10次试验和15次试验,并且利用线性回归方法,求得回归直线分别为l1和l2.已知两个人在试验中发现对变量x的观测数据的平均数都为s,对变量y的观测数据的平均数都为t,那么下列说法中正确的是()A.直线l1和l2都过点(s,t)B.直线l1和l2相交,但交点不一定是(s,t)C.直线l1和l2必平行D.直线l1和l2必重合【解析】线性回归方程y=bx+a恒过点(x,y),故直线l1和l2都过点(s,t).【答案】 A2.已知人的年龄x与人体脂肪含量的百分数y的回归方程为y=0.577x-0.448,如果某人36岁,那么这个人的脂肪含量()A.一定是20.3%B.在20.3%附近的可能性比较大C.无任何参考数据D .以上解释都无道理【解析】 将x =36代入回归方程得y =0.577×36-0.448≈20.3.由回归分析的意义知,这个人的脂肪含量在20.3%附近的可能性较大,故选B .【答案】 B3.关于回归分析,下列说法错误的是( ) A .回归分析是研究两个具有相关关系的变量的方法 B .线性相关系数可以是正的或负的 C .回归模型中一定存在随机误差 D .散点图反映变量间的确定关系【解析】 用散点图反映两个变量间的关系时,存在误差,故D 错误. 【答案】 D4.某学校开展研究性学习活动,某同学获得一组试验数据如下表:) A .y =2x -2 B .y =⎝ ⎛⎭⎪⎫12xC .y =log 2xD .y =12(x 2-1)【解析】 代入检验,当x 取相应的值时,所得y 值与已知数据差的平方和最小的便是拟合程度最高的.【答案】 D5.在一组样本数据(x 1,y 1),(x 2,y 2),…,(x n ,y n )(n ≥2,x 1,x 2,…,x n 不全相等)的散点图中,若所有样本点(x i ,y i )(i =1,2,…,n )都有直线y =12x +1上,则这组样本数据的样本相关系数为( )A .-1B .0C .12D .1【解析】 所有点均在直线上,则样本相关系数最大即为1,故选D . 【答案】 D 二、填空题6.回归分析是处理变量之间________关系的一种数量统计方法.【解析】回归分析是处理变量之间相关关系的一种数量统计方法.【答案】相关7.已知某个样本点中的变量x,y线性相关,相关系数r<0,则在以(x,y)为坐标原点的坐标系下的散点图中,大多数的点都落在第________象限.【解析】∵r<0时b<0,∴大多数点落在第二、四象限.【答案】二、四8.某中学期中考试后,对成绩进行分析,从某班中选出5名学生的总成绩和外语成绩如下表:【解析】∵x=482+383+421+364+3625=402.4,y=78+65+71+64+615=79.8,∴b=(482-402.4)(78-79.8)+…+(362-402.4)(61-79.8)(482-402.4)2+…+(362-402.4)2≈0.132,∴a=79.8-0.132×402.4=14.5,∴方程为y=0.132x+14.5.【答案】y=0.132x+14.5三、解答题9.(2016·包头高二检测)关于某设备的使用年限x和所支出的维修费用y(万元),有如下的统计资料:若由资料可知y (1)线性回归方程;⎝ ⎛⎭⎪⎪⎫a =y -b x -,b =∑i =1nx i y i -n x -y -∑i =1nx 2i-n x 2(2)估计使用年限为10年时,维修费用是多少? 【解】 (1)x =2+3+4+5+65=4,y =2.2+3.8+5.5+6.5+7.05=5,∑i =15x 2i =90,∑i =15x i y i =112.3, b =∑i =15x i y i -5x -y -∑i =15x 2i -5x 2=112.3-5×4×590-5×42=1.23.于是a =y -b x =5-1.23×4=0.08. 所以线性回归方程为y =1.23x +0.08.(2)当x =10时,y =1.23×10+0.08=12.38(万元), 即估计使用10年时维修费用是12.38万元.10.某小卖部为了了解热茶销售量与气温之间的关系,随机统计并制作了某6天卖出热茶的杯数与当天气温的对比表.【解】 画出散点图如图所示.x =16(26+18+13+10+4-1)≈11.7, y =16(20+24+34+38+50+64)≈38.3,∑ 6 i =1x i y i =26×20+18×24+13×34+10×38+4×50-1×64=1 910, ∑ 6 i =1x 2i =262+182+132+102+42+(-1)2=1 286, ∑ 6 i =1y 2i =202+242+342+382+502+642=10 172,∑ n i =1由r =∑ ni =1 x i y i -n x y ∑ ni =1x 2i -n x 2∑ ni =1y 2i -n y 2,可得r ≈0.97.由于r 的值接近于1,所以x 与y 具有很强的线性相关关系.[能力提升]1.(2016·安徽皖南八校联考)某同学在研究性学习中,收集到某制药厂今年前5个月甲胶囊生产产量(单位:万盒)的数据如下表所示:若x ,y 6月份生产甲胶囊产量为( )A .8.1万盒B .8.2万盒C .8.9万盒D .8.6万盒【解析】 由题意知x =3,y =6,则a =y -0.7x =3.9, ∴x =6时,y =8.1.【答案】 A2.已知x 与y 之间的几组数据如下表:a .若某同学根据上表中的前两组数据(1,0)和(2,2)求得的直线方程为y =b ′x +a ′,则以下结论正确的是( ) 【导学号:67720002】A .b >b ′,a >a ′B .b >b ′,a <a ′C .b <b ′,a >a ′D .b <b ′,a <a ′【解析】 由(1,0),(2,2)求b ′,a ′. b ′=2-02-1=2, a ′=0-2×1=-2. 求b ,a 时,∑i =16x i y i =0+4+3+12+15+24=58,x =3.5,y =136,∑i =16x 2i =1+4+9+16+25+36=91,∴b =58-6×3.5×13691-6×3.52=57,a =136-57×3.5=136-52=-13, ∴b <b ′,a >a ′. 【答案】 C3.(2016·江西吉安高二检测)已知x ,y 的取值如下表所示,由散点图分析可知y 与x 线性相关,且线性回归方程为y =0.95x +2.6,那么表格中的数据m 的值为________.【解析】 x =0+4=2,y =+m 4=11.3+m 4,把(x -,y -)代入回归方程得11.3+m 4=0.95×2+2.6,解得m =6.7.【答案】 6.74.某商店各个时期的商品流通率y (%)和商品零售额x (万元)资料如下:散点图显示出x 与y 的变动关系为一条递减的曲线.经济理论和实际经验都证明,流通率y 决定于商品的零售额x ,体现着经营规模效益,假定它们之间存在关系式:y =a +bx .试根据上表数据,求出a 与b 的估计值,并估计商品零售额为30万元时的商品流通率.【解】 设u =1x ,则y ≈a +bu ,得下表数据:进而可得n =10,u ≈0.060 4,y =3.21,∑10i =1u 2i -10u 2≈0.004 557 3, i =110u i y i -10u y ≈0.256 35,b ≈0.256 350.004 557 3≈56.25, a =y -b ·u ≈-0.187 5,所求的回归方程为y=-0.187 5+56.25 x.当x=30时,y=1.687 5,即商品零售额为30万元时,商品流通率约为1.687 5%.。
最新整理高中数学教案回归分析.doc

高中数学教案回归分析教学目标:1.通过对典型案例的探究,进一步了解回归的基本思想,方法及初步应用.2.培养学生的应用意识和解决实际问题的能力.教学重点:线性回归模型的建立和线性回归系数的最佳估计值的探求方法. 教学难点:相关性检验及回归分析 教学过程:一.问题情景:对一作直线运动的质点的运动过程观测了8次,得到如下表所示的数据,试估计当x=9时根据《数学必修3》中有关内容,解决这个问题的方法是:先作散点图,如下图所示.从散点图中可以看出,样本点呈直线趋势,时间x 与位置预测值y 之间有着较好的线性关系.因此可以用线性回归方程来刻画它们之间的关系.根据线性回归系数公式,可以得到线性回归方为 3.5361 2.1214y x =+,所以当x=9时,由线性回归方程可以估计其位置值为22.6287y =问题:在时刻x=9时,质点的运动位置一定是22.6287cm 吗?二.学生活动:由学生思考,讨论:这些点并不都在同一条直线上,上述直线并不能精确的反映x 与y 之间的关系,x 与y 之间具有的是相关关系,y 的实际值与估计值之间存在着误差. 三.建构数学1.线性回归模型:我们将y a bx ε=++称为线性回归模型.ε称为随机误差. 2.线性回归模型应考虑的问题:I 模型是否合理;II 在合理的情况下,如何求a,b 3.线性回归方程:4.相关系数r :()()nniii ix x y y x y nx yr ---==∑∑5.相关系数的性质:(1)r ≤1;(2)r 越接近1,x,y 的线性相关程度越强;(3)r 越接近于0,x,y 的线性相关程度越弱. 6.对相关系数进行显著性检验的步骤:(1)提出统计假设0H :变量x,y 不具有线性相关关系;(2)如果以95%的把握作出推断,那么可以根据1-0.95=0.05与n-2在附录1中查出一个r 的临界值0.05r (其中1-0.95=0.05称为检验水平); (3)计算样本相关系数r ; (4)作出统计推断:若0.05r r >,则否定0H ,表明有95%的把握认为x 与y 之间具有线性相关关系;若r ≤0.05r ,则没有理由拒绝原来的假设0H ,即就目前的数据而言,没有充分的理由认为y 与x 之间有线性相关关系. 四.数学应用例1.下表给出了我国从1949年至1999年人口数据资料,试根据表中数据估计我过2001年的人口数.作出散点图,根据公式可得线性回归方程为527.59114.453y x =+由于2004对应的x=55,代入线性回归方程可得1322.506y =(百万),即2004年的人口为13.23亿.对于例1,可按下面的过程进行检验:(1)作统计假设0H :x 与y 不具有线性相关关系; (2)由0.05与n-2=9在附录1中查得0.050.602r =;(3)根据公式得相关系数r=0.998 (4)因为0.9980.602r =>,即0.05r r >,所以有95%的把握认为x 与y 之间具有线性相关关系,线性回归方程为527.59114.453y x =+例2.下表是随机抽取的8对母女的身高数据,试根据这些数据探讨y 与x 之间的关系.解:所给数据的散点图如图所示:由图可以看出,这些点在一条直线附近,因为25.159=x ,161=y5.59)(88122=-∑=i ix x116)(88122=-∑=i iy y,80881=-∑=i i i y x y x ;所以963.01165.5980≈⨯=r .由检验水平0.05及n-2=6,在附录1中查得707.005.0=r ,因为0.963>0.707,所以可以认为x 与y 之间具有较强的线性相关关系.线性回归方程为x y 345.1191.53+-=.例3.下表是随机抽取的10个家庭的年可支配收入x 与年家庭消费y 的数据,试根据这些数据探讨y 与x 之间的关系.解:所给数据的散点图如图所示, 该图表明,这些点在一条直线附近.相关系数r=0.9826.由检验水平0.05及n-2=8,在附录1中查得632.005.0=r ,因为0.9826>0.632,所以可以认为家庭消费支出与可支配收入之间有较强的线性相关关系;4845.0,53.380≈≈b a ,故线性回归方程为x y 4845.053.380+=五.课堂练习1.某种产品表面进行腐蚀性刻线试验,得到腐蚀深度y 与腐蚀时间x 间相应的一组观察值,如下表(3)试预测腐蚀时间分别为100s 及150s 时的腐蚀深度.r ≈0.9820; x y 3043.03461.5+=35.78 50.99r ≈0.991 x y 93.22578.0+=(1)画出散点图;(2)判断是否有线性相关关系,求回归直线方程是否有意义; (3)求回归直线方程;(4)当播放天数为11天时,估计累计人次为多少? r ≈0.984 x y 9.468.30+=547人六.小结1.通过线性相关系数r 来研究两者之间是否有较强的线性相关关系及其步骤. 2.线性回归方程的求法; 七.课后作业 书P19 1,2。
人教B版高中数学选修回归分析教案—

1.2回归分析教学目标:通过对典型案例的探究,了解回归的基本思想、方法及其初步应用。
教学重点:通过对典型案例的探究,了解回归的基本思想、方法及其初步应用。
教学过程一、变量的相关关系中最为简单的是线性相关关系,设随机变量与变量之间存在线性相关关系,则由试验数据得到的点(,)将散布在某一直线周围,因此,可以认为关于的回归函数的类型为线性函数,即,下面用最小二乘法估计参数、b,设服从正态分布,分别求对、b的偏导数,并令它们等于零,得方程组解得其中,且为观测值的样本方差.线性方程称为关于的线性回归方程,称为回归系数,对应的直线称为回归直线.顺便指出,将来还需用到,其中为观测值的样本方差.二、现在讨论线性相关的显著性检验中最简便、最常用的一种方法,即相关系数的显著性检验法.我们早在前面的学习中知道,变量与的相关系数是表示与之间线性相关关系的一个数字特征,因此,要检验随机变量与变量之间的线性相关关系是否显著,自然想到考察相关系数的大小,若相关系数的绝对值很小,则表明与之间的线性相关关系不显著,或者它们之间根本不存在线性相关关系;当且仅当相关系数的绝对值接近1时,才表明与之间的线性相关关系显著,这时求关于的线性回归方程才有意义.在相关系数未知的情况下,可用样本相关系数r作为相关系数的估计值,参照相关系数的定义,并用样本均值与样本方差分别作为数学期望与方差的估计值,定义与的样本相关系数如下:因此,根据试验数据(,),得到的值后可进一步算出样本相关系数r的值. 若使用的是具有线性回归计算功能的电子计算器时,把所有试验数据(,)逐对存入计算器中,则可直接算出r的值.由于样本相关系数r是相关系数的估计值,所以,r的绝对值越接近1,与之间的线性相关关系越显著. 当r>0时,称与正相关;当r<0时,称与负相关. 而当r的绝对值接近0时,则可认为与之间不存在线性相关关系.三、例1.在7块并排、形状大小相同的试验田上进行施化肥量对水稻产量影响的试验,得数据如下(单位:kg)1x2)检验相关系数r 的显著性水平:r=∑∑∑===---7171222271)7)(7(7i i i i i ii y y x x yx yx =)3.39971132725)(3077000(3.3993078717522⨯-⨯-⨯⨯-≈0.9733,在“相关系数检验的临界值表”查出与显著性水平0.05及自由度7-2=5相应的相关数临界值r 0 05=0.754<0.9733,这说明水稻产量与施化肥量之间存在线性相关关系.3)设回归直线方程a bx y +=ˆ,利用⎪⎪⎪⎩⎪⎪⎪⎨⎧-=--=∑∑==xb y a x x y x y x b i i i i i 71227177计算a ,b , 得b=75.430770005.399307871752≈⨯-⨯⨯- a=399.3-4.75×30≈257,则回归直线方程25775.4ˆ+=x yx例2.一个工厂在某年里每月产品的总成本y (万元)与该月产量x (万件)之间由如下一组数据:归直线方程.1)画出散点图:x2)r=∑∑∑===---1211212222121)12)(12(12i i i i i ii y y x x yx yx=18.534.1754.243120.997891-⨯⨯=在“相关系数检验的临界值表”查出与显著性水平0.05及自由度12-2=10相应的相关数临界值r 0 05=0.576<0.997891, 这说明每月产品的总成本y (万元)与该月产量x (万件)之间存在线性相关关系.3)设回归直线方程a bx y+=ˆ, 利用⎪⎪⎪⎩⎪⎪⎪⎨⎧-=--=∑∑==xb y a x x y x y x b i i i i i 121221211212,计算a ,b ,得b ≈1.215, a=x b y -≈0.974,∴回归直线方程为:974.0215.1ˆ+=x y课堂小节:本节课学习了回归的基本思想、方法及其初步应用 课堂练习:略课后作业:第7页习题A:1,2,3,4,5。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
§3.2 回归分析(1)
教学目标
(1)通过实例引入线性回归模型,感受产生随机误差的原因;
(2)通过对回归模型的合理性等问题的研究,渗透线性回归分析的思想和方法; (3)能求出简单实际问题的线性回归方程. 教学重点,难点
线性回归模型的建立和线性回归系数的最佳估计值的探求方法. 教学过程
一.问题情境
1. 情境:对一作直线运动的质点的运动过程观测了8次,得到如下表所示的数据,试估计当
根据《数学(必修)》中的有关内容,解决这个问题的方法是: 先作散点图,如下图所示:
从散点图中可以看出,样本点呈直线趋势,时间x 与位置观测值y 之间有着较好的线性关系.因此可以用线性回归方程来刻画它们之间的关系.根据
线性回归的系数公式,
1
221()n
i i i n i i x y nx y b x n x a y bx
==⎧
-⎪
⎪=⎪⎨-⎪⎪=-⎪⎩∑∑ 可以得到线性回归方为 3.5361 2.1214y x =+,所以当9x =时,由线性回归方程可以估计其位置值为22.6287y =
2.问题:在时刻9x =时,质点的运动位置一定是22.6287cm 吗?
二.学生活动
思考,讨论:这些点并不都在同一条直线上,上述直线并不能精确地反映x 与y 之间的关系,y 的值不能由x 完全确定,它们之间是统计相关关系,y 的实际值与估计值之间存在着误差. 三.建构数学
1.线性回归模型的定义:
我们将用于估计y 值的线性函数a bx +作为确定性函数;
y 的实际值与估计值之间的误差记为ε,称之为随机误差;
将y a bx ε=++称为线性回归模型.
说明:(1)产生随机误差的主要原因有:
①所用的确定性函数不恰当引起的误差; ②忽略了某些因素的影响; ③存在观测误差.
(2)对于线性回归模型,我们应该考虑下面两个问题: ①模型是否合理(这个问题在下一节课解决); ②在模型合理的情况下,如何估计a ,b ? 2.探求线性回归系数的最佳估计值:
对于问题②,设有n 对观测数据(,)i i x y (1,2,3,
,)i n =,根据线性回归模型,对于
每一个i x ,对应的随机误差项()i i i y a bx ε=-+,我们希望总误差越小越好,即要使
2
1
n
i
i ε
=∑越小越好.所以,只要求出使2
1
(,)()
n
i
i
i Q y x αββα==
--∑取得最小值时的α,β值作
为a ,b 的估计值,记为a ,b .
注:这里的i ε就是拟合直线上的点(),i i x a bx +到点(),i i i P x y 的距离. 用什么方法求a ,b ?
回忆《数学3(必修)》“2.4线性回归方程”P71“热茶问题”中求a ,b 的方法:最小二乘法.
利用最小二乘法可以得到a ,b 的计算公式为
1
1
22211
()()()()n
n
i i i i
i i n n
i i
i i x x y y x y nx y
b x x x
n x a y bx
====⎧
---⎪
⎪==⎪⎨--⎪⎪=-⎪⎩∑∑∑∑,
其中11n i i x x n ==∑,1
1n
i i y y n ==∑
由此得到的直线y a bx =+就称为这n 对数据的回归直线,此直线方程即为线性回归方程.其中a ,b 分别为a ,b 的估计值,a 称为回归截距,b 称为回归系数,y 称为回归值.
在前面质点运动的线性回归方程 3.5361 2.1214y x =+中, 3.5361a =, 2.1214b =. 3. 线性回归方程y a bx =+中a ,b 的意义是:以a 为基数,x 每增加1个单位,y 相应地
平均增加b 个单位;
4. 化归思想(转化思想)
在实际问题中,有时两个变量之间的关系并不是线性关系,这就需要我们根据专业知识或散点图,对某些特殊的非线性关系,选择适当的变量代换,把非线性方程转化为线性回归方程,从而确定未知参数.下面列举出一些常见的曲线方程,并给出相应的化为线性回归方程的换元公式. (1)b y a x =+
,令'y y =,1
'x x
=,则有''y a bx =+. (2)b
y ax =,令'ln y y =,'ln x x =,'ln a a =,则有'''y a bx =+. (3)bx
y ae =,令'ln y y =,'x x =,'ln a a =,则有'''y a bx =+. (4)b x y ae =,令'ln y y =,1
'x x
=
,'ln a a =,则有'''y a bx =+. (5)ln y a b x =+,令'y y =,'ln x x =,则有''y a bx =+.
四.数学运用 1.例题:
例1.下表给出了我国从1949年至1999年人口数据资料,试根据表中数据估计我国2004年的人口数.
解:为了简化数据,先将年份减去1949,并将所得值用x 表示,对应人口数用
y 表示,
作出11个点(),x y 构成的散点图,
由图可知,这些点在一条直线附近,可以用线性回归模型y a bx ε=++来表示它们之间的关系.
根据公式(1)可得
14.453,
527.591.
b a ⎧≈⎪⎨
≈⎪⎩ 这里的,a b 分别为,a b 的估 计值,因此线性回归方程 为527.59114.453y x =+
由于2004年对应的55x =,代入线性回归方程527.59114.453y x =+可得1322.50
y =(百万),即2004年的人口总数估计为13.23亿. 例2. 某地区对本地的企业进行了一次抽样调查,下表是这次抽查中所得到的各企业的
人均资本x (万元)与人均产出y (万元)的数据:
(1)设y 与x 之间具有近似关系b
y ax ≈(,a b 为常数),试根据表中数据估计a 和b 的值; (2)估计企业人均资本为16万元时的人均产出(精确到0.01).
分析:根据x ,y 所具有的关系可知,此问题不是线性回归问题,不能直接用线性回归方
程处理.但由对数运算的性质可知,只要对b
y ax ≈的两边取对数,就能将其转化为线性关系.
解(1)在b
y ax ≈的两边取常用对数,可得lg lg lg y a b x ≈+,设lg y z =,lg a A =,
lg x X =,则z A bX ≈+.相关数据计算如图327--所示.
仿照问题情境可得A ,b 的估计值A ,b 分别为0.2155,
1.5677,
A b ⎧=-⎪⎨=⎪⎩由lg 0.2155a =-可得
0.6088a ≈,即a ,b 的估计值分别为0.6088和1.5677.
(2)由(1)知1.56770.6088y x =.样本数据及回归曲线的图形如图328--(见书本102P
页)
当16x =时, 1.56770.60881647.01y =⨯≈(万元),故当企业人均资本为16万元时,人均产值约为47.01万元.
2.练习:104P 练习第1题. 五.回顾小结:
1. 线性回归模型y a bx ε=++与确定性函数y a bx =+相比,它表示y 与x 之间是统计相
关关系(非确定性关系)其中的随机误差ε提供了选择模型的准则以及在模型合理的情况下探求最佳估计值a ,b 的工具;
2. 线性回归方程y a bx =+中a ,b 的意义是:以a 为基数,x 每增加1个单位,y 相应地
平均增加b 个单位; 3.求线性回归方程的基本步骤. 六.课外作业:106P 第2题.。