可线性化的回归方程
回归分析(5)
而知。 为此,研究者选用二元二次多项 式回归模型 2 y 0 1 x1 2 x2 11 x1
2 22 x2
12 x1 x2
并检验交互效应和风险反感度的二次 效应。
2016/5/10 28
序号
x1
x2
y
1
2 3 4
66.29
40.964 72.996 45.01
7
5 10 6
196
63 252 84
5
6
57.204
26.852 38.122 35.84
4
5 4 6
126
14 49 49
数 据 表
7 8
9
10 11 12
75.796
37.408 54.376 46.186
9
5 2 7
266
49 105 98
13
14 15 16
第10章 非线性回归
线性回归的理论较为成熟,应用 也较为广泛。但当被解释变量与解释 变量之间呈某种曲线关系时,就必须 用非线性回归。 本章首先介绍可线性化的非线性 回归,然后介绍多项式回归,最后简 要介绍了一般的非线性回归模型。
2016/5/10 2
§1 可线性化的非线性回归
1. 线性化的含义及途径 因为线性回归的“线性”是针对 参数而言,而不是针对自变量而言, 所以有些非线性回归模型可以通过变 量代换转化为线性回归模型。 例如, bx y 0 1e (b已知)
首先做三元线性回归,结果如下:
2016/5/10 37
线性回归
2016/5/10
38
显然,回归效果极差。 可将所有项选入,然后选择逐步 回归法,结果如下:
05_回归方程的函数形式
b1 ln Y0 , b 2 ln(1 r ) , 并 加 上 随 机 误 差 项 ,
则复利公式变成了对数到线性的半对数模型:
ln(Yt ) b1 b 2 t u t
所以复利增长率 1。 Example 9.4 The growth of the U.S. Population,1970 to 1999 pp258-259
Y / Y Y / Y X b2 ( 是 一 个 b2 ( 是 个 常 数 ) X / X Y X / X
变量)
注:当用 X 和 Y 的样本均值 代 入 时( b2
X ) ,即 为 样 本 期 Y
的平均产弹性。
Y 对 X 的 斜率 判定系 数 R2
b2 ( 常 数 )
X 对 Y 变动的解释比例
两边取以 e 为底的对数得:
ln Yt ln a1 a 2 ln X t u t
设
Yt* ln Yt , X* t ln X t , b1 ln a 1 , b 2 a 2 则 模 型 变 为 : Yt* b1 b 2 X* t u t( 变 换 后 的 模 型 为 线 性 模 型 ,该 模
厦门大学经济学院 胡朝霞
1
当 当 的。
b2 1 时 , 则 称 该 商 品 的 价 格 是 有 弹 性 的 ;
b2 1 时 , 则 称 该 商 品 的 价 格 是 无 ( 缺 乏 ) 弹 性
思 考 : 如 何 检 验 价 格 弹 性 的 特 征 ? (用 t 检 验 ) 由于双对数模型的弹性是一个常数,所以双对数模 型又称为不变弹性模型。 2. 双 对 数 模 型 与 一 般 线 性 模 型 的 比 较 :
r eb 1, 即 等 于 回 归 系 数 的 反 对 数 减
高考冲刺作业(80)(答案)回归分析、独立性检验
高考冲刺作业(80)2020年3月20日 (回归分析、独立性检验)考点1线性回归分析提示:由最小二乘法得回归直线方程:(认真阅读、深刻理解)y a bx =+,其中1122211()()()n niii ii i nniii i x x y y x y nx yb x x xnx====---==--∑∑∑∑,a y bx =-.有时这样表述:对于一组数据11(,)u v ,22(,)u v ,L ,(,)n n u v ,其线性回归方程v u αβ=+的斜率和截距的最小二乘估计分别为:121()()()nii i nii uu v v uu β==--=-∑∑,v u αβ=-.1.(2015·重庆卷·文理)随着我国经济的发展,居民的储蓄存款逐年增长.设(Ⅰ)求y 关于t 的回归方程y bt a =+; 1.2 3.6y t =+(Ⅱ)用所求回归方程预测该地区2015年(6t =)的人民币储蓄存款. 10.8 2.已知x ,y 的取值如下表所示:如果y 与x 呈线性相关,且线性回归方程为 3.5y bx =+,则b = . 0.5b = 3.(2011·陕西卷·理科)设11(,)x y ,22(,)x y ,L ,(,)n n x y 是变量x 和y 的n 个样本点,直线l 是由这些样本点通过最小二乘法得到的线性回归直线(如图),以下结论中正确的是 DA.x 和y 的相关系数为直线l 的斜率B.x 和y 的相关系数在0到1之间C.当n为偶数时,分布在l两侧的样本点的个数一定相同D.直线l过点(,)x y Array4.已知x,y的取值如下表根据上表提供的数据,求出y关于x的线性回归直线方程为0.80.4y x=+,那么表中t的值为 CA.4.8B.5.2C.5.5D.5.65.设有一个线性回归方程为3 2.5y x=-,则变量x增加一个单位时 C A.y平均增加2.5个单位 B.y平均增加1个单位C.y平均减少2.5个单位D.y平均减少1个单位6.(2015·福建卷)为了解某社区居民的家庭年收入与年支出的关系,随机调查=+,其中0.76b=,a y bx社区一户收入为15万元家庭年支出为 BA.11.4万元B.11.8万元C.12.0万元D.12.2万元7.对四组变量,x y进行相关性检验,r是相关系数,已知①0.96r=,r=,②0.30③0.99r=-,④0.48r=-.则,x y线性相关程度最高的两组是 .8.(2010·湖南卷·文科)某商品销售量y(件)与销售价格x(元/件)负相关,则其回归方程可能是 AA.$10200=-- D.$10200y x=+ y xy x=-+ B.$10200y x=+ C.$10200考点2可线性化回归分析1.(2015·全国卷Ⅰ·文理)某公司为确定下一年度投入某种产品的宣传费,需了解年宣传费x (单位:千元)对年销售量y (单位:t )和年利润z (单位:千元)的影响,对近8年的年宣传费i x 和年销售量i y (1,2,,8)i =L 数据作了初步处理,得到下面的散点图及一些统计量的值.表中i w =8118i i w w ==∑.(Ⅰ)根据散点图判断,y a bx =+与y c =+哪一个适宜作为年销售量y 关于年宣传费x 的回归方程类型?(给出判断即可,不必说明理由) (Ⅱ)根据(Ⅰ)的判断结果及表中数据,建立y 关于x 的回归方程; (Ⅲ)已知这种产品的年利率z 与x ,y 的关系为0.2z y x =-.根据(Ⅱ)的结果回答下列问题:(i )年宣传费49x =时,年销售量及年利润的预报值是多少? (ii )年宣传费x 为何值时,年利率的预报值最大?解析:(Ⅰ)根据散点图判断,y c =+y 关于年宣传费x 的回归方程类型;年宣传费/千元(Ⅱ)根据(Ⅰ)的判断结果,令w =y c d ω=+,81821()()()iii ii w w y y d w w ==--==-∑∑108.8681.6=,56368 6.8100.6c y d ω=+=-⨯=,所以100.668y ω=+,于是y 关于x的回归方程是:100.6y =+(Ⅲ)(i )由0.2z y x =-及当49x =时,100.6y =+,0.2576.6z =⨯-4966.32=,年销售量576.6千元及年利润的预报值是66.32千元.(ii )由0.2z y x =-及100.6y =+0.2(100.6z x x =⨯+-=-+20.04+t =,2()13.620.04h t t t =-++,当 6.8t =,即46.24x =时,年利率的预报值最大.2.已知某种细菌的适宜生长温度为1025C C o o :,为了研究该种细菌的繁殖数量y (单位:个)随温度x (温度:C o )变化的规律,收集数据如下:对数据进行初步处理后,得到了一些统计量的值,如下表所示:其中,ln i i k y =,7117i i k k ==∑.参考数据: 5.5245e ≈.(Ⅰ)绘出y 关于x 的散点图,并根据散点图判断,y a bx =+与21c x y c e =哪一个适宜作为该种细菌的繁殖数y 关于温度x 的回归方程类型?(给出判断即可,不必说明理由)(Ⅱ)根据(Ⅰ)的判断结果及表中数据,建立y 关于x 的回归方程(结果精确到0.1).(Ⅲ)当温度为25C o 时,该种细菌繁殖数量的预报值为多少? 解析:(Ⅰ)根据散点图可知:21c x y c e =比较合适;(Ⅱ)由(Ⅰ)知,21c x y c e =得12ln ln y c c x =+,即2k m c x =+,712721()()()iii ii x x kk c x x ==--=-∑∑20.50.1830.2112=≈≈, 3.80.183180.5m k bx =-=-⨯≈,即1ln 0.5c =,所以 ln 0.50.2y x =+,于是y 关于x 的回归方程是:0.50.2x y e +=.(Ⅲ)当25x =时,0.50.225 5.5245y e e +⨯==≈,即当温度为25C o 时,该种细菌繁殖数量的预报值为245.3.噪音污染已经成为影响人们身体健康和生活质量的严重问题,为了了解声音强度D (单位:分贝)与声音能量I (单位:2/W cm )之间的关系,将测量得到的声音强度i D 和声音能量i I (1,2,,10i =L )数据作了初步处理,得到下面的散点图即一些统计量的值.(Ⅰ)根据散点图判断,D c dI =+与lg D a b I =+哪一个适宜作为声音强度D 关于声音能量I 的回归方程类型?(Ⅱ)根据表中数据,建立D 关于I 的回归方程;(Ⅲ)当声音强度大于60分贝时,属于噪音,会产生噪音污染,城市中某点P 共DIg g g gg g g ggg 1020 10 0 20 30 30 40 50 40 50 60受到两个声源的影响,这两个声音能量分别为1I ,2I ,且10121410I I +=.已知点P 的声音能量等于1I 和2I 声音能量之和,请根据(Ⅰ)中回归方程,判断点P 是否受到噪音污染的干扰,并说明理由.参考数据:其中表中lg i i W I =,101110i i W W ==∑,截距的最小二乘估计分别为:v u αβ=-,121()()()nii i nii uu v v uu β==--=-∑∑.解析:(Ⅰ)根据散点图可知,lg D a b I =+适宜作为声音强度D 关于声音能量I 的回归方程;(Ⅱ)由(Ⅰ)知,lg D a b I =+,D a bW =+,1011021()()5.1100.51()iii ii W W D D b W W ==--===-∑∑, 45.710(11.5)160.7a D bW =-=-⨯=,所以D 关于I 的回归方程为:160.710lg D I =+(Ⅲ)点P 的声音能量等于1I 和2I 声音能量之和,101212121410()()I I I I I I I -=+=++ 10102112410[5()]109I I I I --=++≥⨯,10min 160.710lg(109)60.710lg 960D -=+⨯=+>,P 会受到噪音污染的干扰.4.2019年12月以来,湖北省武汉市持续开展流感及相关疾病监测,发现多起病毒性肺炎病例,均诊断为病毒性肺炎/肺部感染,后被命名为新型冠状病毒肺炎( 2019Corona Virus Disease , 2019COVID ),简称“新冠肺炎”.下图是2020年1月15日至1月24日累计确诊人数随时间变化的散点图.为了预测在未采取强力措施下,后期的累计确诊人数,建立了累计确诊人数y 与时间变量t 的两个回归模型,根据1月15日至1月24日的数据(时间变量t 的值依次1,2,L ,10),建立模型y c dt =+和 1.5t y a b =+⋅.(Ⅰ)根据散点图判断,$y c dt =+和$ 1.5t y a b =+⋅哪一个适宜作为累计确诊人数y 与时间变量t 的回归方程类型?(给出判断即可,不必说明理由); (Ⅱ)根据(Ⅰ)的判断结果及附表中数据,建立y 关于t 的回归方程; (Ⅲ)以下是1月25日至1月29日累计确诊人数的真实数据,根据(Ⅱ)的结果时间1月25日 1月26日 1月27日 1月28日 1月29日 累计确诊人数的真实数据19752744451559747111①当1月25日至1月27日这3天的误差(模型预测数据与真实数据差值的绝对值与真实数据的比值)都小于0.1,则认为模型可靠,请判断(Ⅱ)的回归方程是否可靠?②2020年1月24日在人民政府的强力领导下,全国人民共同采取了强力的预防“新冠肺炎”的措施,若采取措施5天后,真实数据明显低于预测数据,则认为防护措施有效,请判断预防措施是否有效?附:对于一组数据11(,)u v ,22(,)u v ,L ,(,)n n u v ,其回归线v u αβ=+的斜率和截距的最小二乘估计分别为:121()()()nii i nii uu v v uu β==--=-∑∑,v u αβ=-参考数据:其中 1.5it i ω=,101110i i ωω==∑.解析:(Ⅰ)根据散点图可知:$ 1.5t y a b =+⋅适宜作为累计确诊人数y 与时间变t 的回归方程类型;(Ⅱ)令 1.5tω=,$y a b ω=+⋅,1011021()()()iii ii y y bωωωω==--=-∑∑$101102211010i ii ii y yωωωω==-=-∑∑,215470010193902076401019-⨯⨯==-⨯,390201910a y b ω=-=-⨯=,$1020y ω=+⋅,即 $1020 1.5t y =+⨯;(Ⅲ)①当11t =时,111.5100=,10201002010y =+⨯=,201019753519752010-=0.0170.1≈<,当12t =时,121.5150=,10201503010y =+⨯=,301027442744-=2660.0970.12744≈<,当13t =时,131.5225=,10202254510y =+⨯=,451045154515-50.14515=<.所以(Ⅱ)的回归方程可靠; ②当15t =时,$10150y =,远大于7111,所以防护措施有效.考点3独立性检验构造随机变量(卡方统计量)统计量2χ(也可表示2K),来判断“两个分类变量有关联”的方法称为独立性检验.其中22()()()()()n ad bca b c d a c b dχ-=++++,n a b c d=+++.1.(2010·课标全国卷·文科)为调查某地区老年人是否需要志愿者提供帮助,(Ⅰ)估计该地区老年人中,需要志愿提供帮助的老年人的比例;(Ⅱ)能否有99℅的把握认为该地区的老年人是否需要志愿者提供帮助与性别有关?解:(Ⅰ)调查的500位老年人中有70位需要志愿者提供帮助,因此该地区老年人中需要帮助的老年人的比例的估计值为7014% 500=.(Ⅱ)22500(4027030160)9.96720030070430K⨯⨯-⨯=≈⨯⨯⨯.由于9.967 6.635>所以有99%的把握认为该地区的老年人是否需要帮助与性别有关.2.(2014·辽宁卷)某大学餐饮中心为了了解新生的饮食习惯,在全校一年级学(Ⅰ)根据表中数据,问是否有95%的把握认为“南方学生和北方学生在选用甜品的饮食习惯方面有差异”;(Ⅱ)已知在被调查的北方学生中有5名数学系的学生,其中2名喜欢甜品,现在从这5名学生中随机抽取3人,求至多有1人喜欢甜品的概率.22100(60102010)100 4.7627030802021K ⨯⨯-⨯==≈⨯⨯⨯, 710p =.3.(2018·全国卷Ⅲ·文理科)某工厂为了提高生产效率,开展技术创新活动,提出了完成某项生产任务的两种新的生产方式.为比较两种生产方式的效率,选取40名工人,将他们随机分成两组,每组20名工人,第一组工人用第一种生产方式,第二组工人用第二种生产方式.根据工人完成生产任务的工作时间(单位:min )绘制了如下茎叶图:(Ⅰ)根据茎叶图判断哪种生产方式的效率更高?并说明理由.(Ⅱ)求40名工人完成生产任务所需的时间的中位数m ,并将完成生产任务所(Ⅲ)根据(Ⅱ)中列联表,能否有99%把握认为两种生产方式的效率有差异? 解析:(Ⅰ)第二中生产方式效率更高.(Ⅱ)7981802m +==.(Ⅲ)2240(151555)10 6.63520202020K ⨯⨯-⨯==>⨯⨯⨯.所以有99%把握认为两种生产方式的效率有差异.4.(2019·全国卷Ⅰ·文科)某商场为提高服务质量,随机调查了50名男顾客和50名女顾客,每位顾客对该商场的服务给出满意或不满意的评价,得到下面列联表:(Ⅰ)分别估计男、女顾客对该商场服务满意的概率;(Ⅱ)能否有95%的把握认为男、女顾客对该商场服务的评价有差异?第一种生产方式第二种生产方式 8 8765 56 8 90 1 2 2 3 4 5 6 6 8 1 4 4 5 099 7 6 2 9 8 7 7 6 5 4 3 3 2 2 1 1 0 0解析:(Ⅰ)由调查数据,男顾客中对该商场服务满意的比率为400.850=,因此男顾客对该商场服务满意的概率的估计值为0.8.女顾客中对该商场服务满意的比率为300.650=,因此女顾客对该商场服务满意的概率的估计值为0.6.22100(40203010) 4.76250507030K ⨯⨯-⨯=≈⨯⨯⨯.由于4.762 3.841>,故有95%的把握认为男、女顾客对该商场服务的评价有差异. 5.(2017·全国卷Ⅱ·文科)淡水养殖场进行某水产品的新、旧网箱养殖方法的产量对比,收获时各随机抽取100个网箱,测量各箱水产品的产量(单位:kg )某频率直方图如下:(Ⅰ)设两种养殖方法的箱产量相互独立,记A 表示事件:“旧养殖法的箱产量低于50kg ”,估计A 的概率;0.62(Ⅱ)填写下面列联表,并根据列联表判断是否有99%的把握认为箱产量与养殖22200(62663438)15.70510010096104K ⨯⨯-⨯=≈⨯⨯⨯.6.(2017·全国卷Ⅱ·文科)淡水养殖场进行某水产品的新、旧网箱养殖方法的/kg旧养殖法kg新养殖法产量对比,收获时各随机抽取100个网箱,测量各箱水产品的产量(单位:kg )某频率直方图如下:(Ⅰ)设两种养殖方法的箱产量相互独立,记A 表示事件:旧养殖法的箱产量低于50kg ,新养殖法的箱产量不低于50kg ,估计A 的概率;(Ⅱ)填写下面列联表,并根据列联表判断是否有99%的把握认为箱产量与养殖(Ⅲ)根据箱产量的频率分布直方图,求新养殖法箱产量的中位数的估计值(精确到0.01)7.(2013·福建卷)某工厂有25周岁以上(含25周岁)工人300名,25周岁以下工人200名.为研究工人的日平均生产量是否与年龄有关,现采用分层抽样的方法,从中抽取了100名工人,先统计了他们某月的日平均生产件数,然后按工人年龄在“25周岁以上(含25周岁)”和“25周岁以下”分为两组,再将两组工人的日平均生产件数分为5组:)[50,60,)[60,70,)[70,80,)[80,90,)[90,100, 分别加以统计,得到如图所示的频率分布直方图.(Ⅰ)从样本中日平均生产件数不足60件的工人中随机抽取2人,求至少抽到一名“25周岁以下组”工人的概率;(Ⅱ)规定日平均生产件数不少于80件者为“生产能手”,请你根据已知条件完/kg旧养殖法kg新养殖法成列联表,并判断是否有90%的把握认为“生产能手与工人所在的年龄组有关”?710p =,22100(45152515)25 1.797030604014K ⨯⨯-⨯==≈⨯⨯⨯.没有把握.8.(2010·辽宁卷·理科)为了比较注射A ,B 两种药物后产生的皮肤疱疹的面积,选200只家兔做实验,将这200只家兔随机地分成两组.每组100只,其中一组注射药物A ,另一组注射药物B .下表1和表2分别是注射药物A 和药物B 后的实验结果.(疱疹面积单位:2mm )(Ⅰ)完成下面频率分布直方图,并比较注射两种药物后疱疹面积的中位数大小;(Ⅱ)完成下面22⨯列联表,并回答能否有99.9%的把握认为“注射药物A 后的25周岁以上组25周岁以下组注射药物A 后皮肤疱疹面积的频率分布直方图注射药物B 后皮肤疱疹面积的频率分布直方图22200(70653530)24.5610010010595K ⨯⨯-⨯=≈⨯⨯⨯,210.828K >.有99.9%的把握认为“注射药物A 后的疱疹面积与注射药物B 后的疱疹面积有差异”.。
§3.5 可以化为线性的多元非线性回归模型
一、非标准线性回归模型 二、可线性化的非线性回归模型 三、不可线性化的非线性回归模型
一、非标准线性回归模型---变量直接置换 非标准线性回归模型---变量直接置换 --1、倒数变换模型 、
1 1 1 Yi = β0 + β1 + ui或 = β0 + β1 + ui Xi Y Xi i
中 国 城 镇 居 民 人 均 食 品 消 费
1800 1600 1400 1200 1000 800 600 400 200 82 84 86 88 90 92 94 96 98 00 Q
特征: 特征: 消费行为在 1981~1995年间表 现出较强的一致性 1995年之后呈现出 另外一种变动特征。
Q = f ( X / P0 , P1 / P0 )
(**)
为了进行比较,将同时估计( 为了进行比较,将同时估计(*)式与(**)式。 式与(**)
首先,确定具体的函数形式 根据恩格尔定律 恩格尔定律,居民对食品的消费支出与居 恩格尔定律 民的总支出间呈幂函数 幂函数的变化关系: 幂函数 对数变换:
令Yi = lnYi 或 Xi = ln Xi
* *
4、多项式模型: 、多项式模型:
Yi = β0 + β1Xi + β2 Xi +... + βk Xi + i
2 k
令X = Xi , j =1,2,..., k
* i j
5、S型曲线模型 、 型曲线模型
1 Yi = α + βe Xi + i
(****)式也可看成是对(***)式施加如下约束而得 β1 + β 2 + β 3 = 0
回归线性方程公式
回归线性方程公式
回归线性方程是统计学中反映数据之间关系的重要统计模型,它
具有表达力强,数值运算简单的特性。
它是利用建立数据之间关系的
拟合性模型,以数学的方式描述一个数量和另一个数据之间的联系,
从而找到一个具有可预测作用的测量模型。
线性回归方程可以用一个
函数来描述离散点或一组数据点之间的联系,通过线性拟合法来确定
线性回归方程。
回归线性方程的一般形式为:y = ax + b,其中ax+b是系数,y
是自变量(x)的应变量,a是斜率,b是常数项。
基于已有的观测值
来求解系数时,需要使用最小二乘法来解决,系数的最优解为使得误
差平方和最小的可行解。
例如,已知一组观测数据的x和y的坐标,
假设存在一个未知的函数,其输入是x,输出是y,则经过多次观测,
可以找到该函数的表达式为y=ax+b,其中a与b是待求参数。
回归线性方程不仅可以用于反映数据之间的相关性,还可以运用
在统计学中,用来分析两个变量之间的关系,并进行预测。
回归线性
方程是统计学家根据已有数据提出一种对数据进行统计推断的先进方式。
它不但提供了一个简单易用的方法来把数据和理论结合,而且也
可以智能地逃避直接的、实证的假设。
回归线性方程是统计学的重要工具,它利用模型来表达数据之间
的关系,从而帮助提高对现实情况的预测能力。
它是一种强大、易用
的统计分析方式,能够有效地帮助人们分析数据,并作出正确地预测,以更好地利用数据资源。
回归方程解读
回归方程解读回归方程是统计学中常用的工具,用于描述两个或多个变量之间的关系。
它的一般形式可以表示为:Y = β0 + β1X1 + β2X2 + ... + βnXn + ε其中,Y是被解释变量,也被称为因变量;X1, X2, ..., Xn是解释变量,也被称为自变量;β0, β1, β2, ..., βn是回归系数,表示自变量对因变量的影响程度;ε是误差项,表示模型无法完全解释的随机因素。
回归方程的解读有助于我们理解自变量对因变量的影响,并且可以用于预测因变量的值。
下面我们将对回归方程的各个部分进行详细解读:1.截距项(β0):该项表示当所有解释变量的取值都为0时,因变量的预测值。
在解释方程时,我们需要注意截距项是否有实际意义,可以根据具体情况来判断。
2.自变量(X):回归方程中的自变量表示我们想要研究的解释变量。
它们的系数(β)表示解释变量对因变量的影响程度。
系数的正负符号表明了自变量与因变量的方向关系,正符号表示正相关,负符号表示负相关。
3.回归系数(β):回归系数代表了自变量对因变量的影响程度。
具体地说,它们表示当自变量的取值增加1个单位时,因变量的平均变化量。
例如,如果β1为2,表示当X1增加1个单位时,Y的平均变化量为2。
4.误差项(ε):回归方程中的误差项表示模型无法完全解释的随机因素。
它代表了由于未知或未观察到的变化引起的因变量的波动。
在回归分析中,我们通常假设误差项是独立同分布的,并且是服从正态分布的。
在解读回归方程时,我们可以通过检验假设来确定自变量对因变量的显著影响。
常见的方法是通过计算回归系数的置信区间或进行假设检验,例如t检验或F检验。
如果回归系数的p值小于设定的显著性水平(通常是0.05),则我们可以拒绝零假设,即自变量对因变量有显著影响。
此外,回归方程还可以用来进行预测。
根据给定的自变量的取值,我们可以利用回归方程来估计因变量的值。
然而,需要注意的是,预测的准确性受到回归方程的稳定性,样本数据的外推性等因素的影响。
[整理]2--可线性化的非线性回归.
2. 可线性化的非线性回归例:已知某小型企业自1998年1月至1989年3月间各月的销售收入(万元),见下表。
求销售收入与月份间的关系,并预测未来1989年4、5月份的销售收入。
表2 某小型企业各月统计收入情况2.1 基本绘图操作(1) 输入数据输入投资x与盈利y数据,并选中x、y数据。
图26(2) 插入散点图点击菜单栏的插入,选择图表。
图27点击图表,选择“标准类型”中的XY散点图,并点击子图表类型的第一个。
图28 点击下一步。
图29点击下一步,并分别点击标题、网格线、图例等进行查看和修改。
图30点击下一步。
图31 点击完成。
图32右击绘图区,修改绘图区格式。
图33 双击坐标轴,修改坐标轴刻度。
图34最后的月份x与销售收入y的散点图见图35图352.2 回归分析 首先观察散点图35,依据经验及散点图的趋势进行分析,可以看出,该散点图可以用双曲线、指数函数、对数函数等曲线来拟合。
2.2.1 双曲线 双曲线函数的方程为:1y ba x =+(1)(1) 双曲函数的线性化及成图 将方程1线性化后,得到方程2''y a bx =+ (2)其中,1'y y =1'x x =。
在excel 表格中计算新数据''x y ,并选中''x y 数据。
图36点击菜单栏的插入,选择图表。
图37点击图表,选择“标准类型”中的XY散点图,并点击子图表类型的第一个。
图38点击下一步,得到图39,图39点击下一步,并分别点击标题、网格线、图例等进行查看和修改。
图40 点击下一步,选择“作为其中的对象插入”图41 点击完成。
图42 右击绘图区,修改绘图区格式。
图43 双击做坐标轴,修改坐标轴刻度。
图44 最后获得月份x与销售收入y的散点图45.图45 选中散点,右击散点,选择添加趋势线。
图46 选择“线性”类型。
图47 选项中选择显示公式和显示R2。
图48 得到趋势线如图49所示。
第三章 1.3可线性化的回归分析
可线性化的回归分析[学习目标]1.进一步体会回归分析的基本思想.2.通过非线性回归分析,判断几种不同模型的拟合程度.[知识链接]1.有些变量间的关系并不是线性相关,怎样确定回归模型答首先要作出散点图,如果散点图中的样本点并没有分布在某个带状区域内,则两个变量不呈现线性相关关系,不能直接利用线性回归方程来建立两个变量之间的关系,这时可以根据已有函数知识,观察样本点是否呈指数函数关系或二次函数关系,选定适当的回归模型.2.如果两个变量呈现非线性相关关系,怎样求出回归方程答可以通过对解释变量进行变换,如对数变换或平方变换,先得到另外两个变量间的回归方程,再得到所求两个变量的回归方程.([预习导引]1.非线性回归分析对不具有线性相关关系的两个变量做统计分析,通过变量代换,转化为线性回归模型.2.非线性回归方程曲线方程曲线图形公式变换变换后的线性函数y=ax b·c=ln av=ln xu=ln yu=c+bvy =a e bxc =ln a u =ln yu =c +bxy =a e b x.c =ln a v =1xu =ln yu =c +bvy =a +b ln xv =ln x u =yu =a +bv#要点一 线性回归分析例1 某产品的广告费用x 与销售额y 的统计数据如下表:广告费用x (万元) 4 2 35 销售额y (万元)4926…3954(1)由数据易知y 与x 具有线性相关关系,若b =,求线性回归方程y =a +bx ; (2)据此模型预报广告费用为4万元时的销售额.解 (1)x -=4+2+3+54=,y -=49+26+39+544=42,∴a =y --b x -=42-×= ∴回归直线方程为y =+. (2)当x =4时,y =+×4=, 故广告费用为6万元时销售额为万元.跟踪演练1 为了研究3月下旬的平均气温(x )与4月20日前棉花害虫化蛹高峰日(y )的关系,某地区观察了2006年2011年的情况,得到了下面的数据:(1)对变量x,y进行相关性检验;(2)据气象预测,该地区在2012年3月下旬平均气温为27 ℃,试估计2012年4月化蛹高峰日为哪天.解制表.(1)r=∑6i=1xiyi-6x-y-(∑6i=1x2i-6x-2)(∑6i=1y2i-6y-2)≈- 8.由|r|>,可知变量y和x存在很强的线性相关关系.(2)b=错误!≈-,a=错误!-b错误!≈.所以,线性回归方程为y=-.当x=27时,y=-×27=.据此,可估计该地区2012年4月12日或13日为化蛹高峰日."要点二可线性化的回归分析例2 在一化学反应过程中,化学物质的反应速度y(g/min)与一种催化剂的量x(g)有关,现收集了8组观测数据列于表中:催化剂的量x/g15182124273033\ 36化学物质的反应速度y(g·min-1)6830277020565350解根据收集的数据,作散点图(如图),根据已有的函数知识,可以发现样本点分布在某一条指数函数曲数y=c1e c2x的周围,其中c1和c2是待定的参数.令z=ln y,则z=ln y=ln c1+c2x,即变换后的样本点应该分布在直线z=a+bx(a=ln c1,b=c2)的周围.由y与x的数据表可得到变换后的z与x的数据表:x15182124!27303336z,作出z与x的散点图(如图).由散点图可观察到,变换后的样本点分布在一条直线的附近,所以可用线性回归方程来拟合.由z与x的数据表,可得线性回归方程:z=+,所以y与x之间的非线性回归方程为y=e-+.*规律方法 可线性化的回归分析问题,画出已知数据的散点图,选择跟散点拟合得最好的函数模型进行变量代换,作出变换后样本点的散点图,用线性回归模型拟合.跟踪演练2 电容器充电后,电压达到100 V ,然后开始放电,由经验知道,此后电压U 随时间t 变化的规律用公式U =A e bt (b <0)表示,现测得时间t (s)时的电压U (V)如下表:t /s 0 1 2 3 4 56(7 8910U /V 100 75 55 40 30$2015101055试求:电压U 对时间t 的回归方程.(提示:对公式两边取自然对数,把问题转化为线性回归分析问题)解 对U =A e bt 两边取对数得ln U =ln A +bt ,令y =ln U ,a =ln A ,x =t ,则y =a +bx ,得y 与x 的数据如下表:x.1 2345678910{y/根据表中数据作出散点图,如下图所示,从图中可以看出,y 与x 具有较强的线性相关关系,由表中数据求得x -=5,y -≈,进而可以求得b ≈-,a =y --bx -=,所以y 对x 的线性回归方程为y =-.由y =ln U ,得U =e y ,U =-=·e -,因此电压U 对时间t 的回归方程为U =·e-.要点三非线性回归模型的综合应用例3 某地区不同身高的未成年男性的体重平均值如下表:身高x/cm60【708090100110体重y/kg-身高x/cm120130140150160170体重y/kg(试建立y与x之间的回归方程.解根据题干表中数据画出散点图如图所示.由图看出,样本点分布在某条指数函数曲线y=c1e c2x的周围,于是令z=ln y. *x 60708090100110120130140¥150160170z&画出散点图如图所示.由表中数据可得z与x之间的线性回归方程:z=+,则有y=+.规律方法根据已有的函数知识,可以发现样本分布在某一条指数型函数曲线y =c1e c2x的周围,其中c1和c2是待定参数;可以通过对x进行对数变换,转化为线性相关关系.*跟踪演练3 对两个变量x ,y 取得4组数据(1,1),(2,,(3,,(4,,甲、乙、丙三人分别求得数学模型如下: 甲 y =+1, 乙 y =-++,丙 y =-·+,试判断三人谁的数学模型更接近于客观实际. 解 甲模型,当x =1时,y =;当x =2时,y =; 当x =3时,y =;当x =4时,y =.乙模型,当x =1时,y =1;当x =2时,y =; 当x =3时,y =;当x =4时,y =.丙模型,当x =1时,y =1;当x =2时,y =; 当x =3时,y =;当x =4时,y =.观察4组数据并对照知,丙的数学模型更接近于客观实际.1.在一次试验中,当变量x 的取值分别为1,12,13,14时,变量y 的值分别为2,3,4,5,则y 与1x的回归方程为( )A .y =1x +1B .y =2x+3C .y =2x +1D .y =x -1 答案 A解析 由数据可得,四个点都在曲线y =1x+1上.2.某种产品的广告费支出与销售额(单位:百万元)之间有如下对应数据:广告费2~5 6 84销售额3040605070@则广告费与销售额间的相关系数为( )A. B.0.919 C. D.答案B3.根据统计资料,我国能源生产发展迅速.下面是我国能源生产总量(单位:亿吨标准煤)的几个统计数据:年份1996200120062011产量·根据有关专家预测,到2020年我国能源生产总量将达到亿吨左右,则专家所选择的回归模型是下列四种模型中的哪一种( )A.y=ax+b(a≠0) B.y=ax2+bx+c(a≠0)C.y=a x(a>0且a≠1) D.y=log a x(a>0且a≠1)答案A4.某种产品的广告费支出x与销售额y之间有下表关系,现在知道其中一个数据弄错了,则最可能错的数据是__________.x/万元)24568y/万元3040605070答案(6,50)一、基础达标1.下表提供了某厂节能降耗技术改造后生产某产品过程中记录的产量x(吨)与相应的生产能耗y(吨)的几组对应数据.根据表中提供的数据,求出y关于x的线性回归方程是y=+,那么表中t的值是( )x3456,yt4A.4.5 B.4 C.3 D.答案C2.下列数据x,y符合哪一种函数模型( )x1$2345678910y 。
直线回归方程公式
直线回归方程公式直线回归方程是统计学中最基本的一种模型,在各个领域都有广泛的应用。
本文将详细介绍直线回归方程的定义、求解方法以及应用场景。
一、定义直线回归方程是一种用来描述两个变量之间关系的数学模型,通常表示为Y=a+bX。
其中,a是截距,b是斜率,X和Y代表两个变量。
在实际应用中,我们通常会收集到一组数据,这些数据是由两个变量组成的二元组。
要根据这些数据求出直线回归方程,就需要用到回归分析的方法。
二、求解方法1. 一元线性回归一元线性回归是指只有一个自变量和一个因变量的情况。
在求解一元线性回归方程时,我们需要先对数据进行线性拟合,即找到尽可能接近所有数据的一条直线。
通常使用最小二乘法来拟合这条直线。
最小二乘法是一种常见的数学优化方法,它的目标是让直线到所有数据点的距离平方和最小。
具体的计算公式如下:其中,y表示实际值,y'表示预测值,n表示样本数量。
常数a和斜率b的计算公式如下:2. 多元线性回归多元线性回归是指有多个自变量和一个因变量的情况。
在求解多元线性回归方程时,我们需要先对所有自变量进行标准化处理,然后使用最小二乘法求出回归系数。
多元线性回归的计算公式为:其中,y表示因变量,x1、x2、...、xn表示自变量,β1、β2、...、βn表示回归系数,ε表示误差项。
三、应用场景直线回归方程在各个领域都有广泛的应用,下面介绍几个常见的例子。
1. 金融领域直线回归方程可以用来建立股票价格和市场指数之间的关系模型。
通过回归分析,我们可以发现两者之间的关系并根据这个模型来预测股票价格的变化趋势。
2. 医疗领域直线回归方程可以用来建立身高和体重之间的关系模型。
通过回归分析,我们可以发现身高和体重之间的相关性,这可以帮助我们更好地了解人体的生理特征。
3. 生产和制造领域直线回归方程可以用来建立生产数量和销售额之间的关系模型。
通过回归分析,我们可以发现生产数量和销售额之间的关系,这可以帮助企业更好地规划生产计划和销售策略。
北师大版高中数学选修1-2 同步练习:第1章 1 第2课时 可线性化的回归分析
第一章 §1 第2课时A 级 基础巩固一、选择题1.由一组数据(x 1,y 1),(x 2,y 2),…,(x n ,y n )得到的回归直线方程y ^=b ^x +a ^,则下列说法不正确的是( B )A .直线y ^=b ^x +a ^必过点(x ,y )B .直线y ^=b ^x +a ^至少经过点(x 1,y 1)(x 2,y 2)…(x n ,y n )中的一个点C .直线y ^=b ^x +a ^的斜率为∑ni =1x i y i -n x y ∑ni =1x 2i -n x 2D .直线y ^=b ^x +a ^和各点(x 1,y 1),(x 2,y 2),…,(x n ,y n )的偏差是该坐标平面上所有直线与这些点的偏差中最小的直线2.对于指数曲线y =ae bx,令u =lny,c =lna,经过非线性化回归分析之后,可以转化成的形式为( A ) A .u =c +bx B .u =b +cx C .y =b +cxD .y =c +bx[解析] 对方程y =ae bx 两边同时取对数,然后将u =lny,c =lna 代入,不难得出u =c +bx. 3.某学校开展研究性学习活动,某同学获得一组实验数据如下表:x 1.99 3 4 5.1 6.12 y1.54.047.51218.01对于表中数据,A .y =2x -2 B .y =(12)xC .y =log 2xD .y =12(x 2-1)[解析] 代入检验,当x 取相应的值时,所得y 值与已知数据差的平方和最小的便是拟合程度最高的. 4.下列数据符合的函数模型为( D )x 1 2 3 4 5 6 7 8 9 10 y22.6933.383.63.844.084.24.3A .y =2+3xB .y =2e xC .y =2e 1xD .y =2+lnx[解析] 分别将x 的值代入解析式判断知满足y =2+lnx. 二、填空题5.在两个变量的回归分析中,作散点图的目的是__从散点图中看出数据的大致规律,再根据这个规律选择适当的函数进行拟合__;相关系数是度量__两个变量之间线性相关程度__的量.6.若回归直线方程中的回归系数b =0时,则相关系数r 的值为__0__.[解析] 若b =0,则∑i =1nx i y i -n x y =0,∴r =0.三、解答题7.某工厂今年1~4月份生产某种产品的数量分别是1万件、1.2万件、1.3万件、1.37万件.为了估测以后每个月的产量,可用函数y =ae bx来模拟该产品的月产量y(万件)与月份x 的关系,求模拟函数.[解析] 设μ=lny,c =lna,则μ=c +bx.∑i =14x i =10,∑i =14μi =0.759 5,∑i =14x 2i=30,∑i =14μ2i ≈0.201 2, ∑i =14x i μi =2.411,x =2.5,μ≈0.189 9,相关系数r =∑i =14x i μi -4xμ∑i =14x 2i -4(x)2∑i =14μ2i -4(μ)2≈2.411-4×2.5×0.189 930-4×2.52×0.201 2-4×0.189 92≈0.959 7,相关程度较强.b =∑i =14x i μi -4xμ∑i =14x 2i -4(x )2≈2.411-4×2.5×0.189 930-4×2.52=0.102 4,c =μ-b x ≈0.189 9-0.102 4×2.5=-0.066 1,所以μ=-0.066 1+0.102 4x,y =e-0.066 1+0.0102 4x.B 级 素养提升一、选择题1.我国1990—2000年的国内生产总值如下表所示:A .y =ae kxB .y =a +bxC .y =ax bD .y =ae bx[解析] 画出散点图,观察可用y =a +bx 刻画国内生产总值发展变化的趋势.2.设由线性相关的样本点(x 1,y 1),(x 2,y 2),(x 3,y 3),…,(x n ,y n ),求得的回归直线方程为y ^=bx +a,定义残差e i =y i -y ^i =y i -bx i -a,i =1,2,…,n,残差平方和m =e 21+e 22+…+e 2n .已知甲、乙、丙、丁四位同学各自对A 、B 两变量的线性相关性做试验,并用回归分析方法分别求得相关系数r 与残差平方和m 如下表:则哪位同学的试验结果体现A .甲 B .乙 C .丙D .丁[解析] r 越接近1,相关性越强,残差平方和m 越小,相关性越强,故选D . 二、填空题3.若一函数模型为y =ax 2+bx +c(a≠0),则作变换t =__(x +b 2a )2 才能转为y 是t 的线性回归方程.[解析] ∵y =ax 2+bx +c =a(x +b 2a )2+4ac -b 24a ,∴令t =(x +b 2a )2,则y =at +4ac -b24a,此时y 为t 的线性回归方程.4.若x 、y 满足则可用来描述__y =2e __. [解析] 画出散点图,形如y =a·e bx,其中a≈2,b≈1. ∴y =2e x. 5.若x 、y 满足x 0.1 0.2 0.3 0.5 1 2 3 4 5 y2096420.940.650.510.45则可用来描述x 与y 之间关系的函数解析式为__y =2x.[解析] 画出散点图,观察图像形如y =b x ,通过计算知b≈2,∴y =2x .三、解答题6.如下表所示,某地区一段时间内观察到的大于或等于某震级x 的地震次数为N,试建立N 对x 的回归方程,并表述二者之间的关系.震级 3 3.2 3.4 3.6 3.8 4 4.2 4.4 地震数 28 381 20 380 14 795 10 695 7 641 5 502 3 842 2 698 震级 4.6 4.8 5.0 5.2 5.4 5.6 5.8 6 地震数 1 919 1 356 973 746 604 435 274 206 震级 6.2 6.4 6.6 6.8 7 地震数14898574125[解析] 由表中数据得散点图如图1.从散点图中可以看出,震级x 与大于或等于该震级的地震次数N 之间呈现出一种非线性的相关性,随着x 的减少,所考察的地震数N 近似地以指数形式增长.于是令y =lgN.得到的数据如下表所示.图1x 3 3.2 3.4 3.6 3.8 4 4.2 4.4 y 4.453 4.309 4.170 4.029 3.883 3.741 3.585 3.431 x 4.6 4.8 5.0 5.2 5.4 5.6 5.8 6 y 3.283 3.132 2.988 2.873 2.781 2.638 2.438 2.314 x 6.2 6.4 6.6 6.8 7 y2.1701.9911.7561.6131.398x图2从散点图2中可以看出x 和y 之间有很强的线性相关性,因此由最小二乘法得a≈6.704,b≈-0.741,故线性回归方程为y =-0.741x +6.704.因此,所求的回归方程为:lgN =-0.741x +6.704,故N ^=10-0.741x +6.704.7.下表所示是一组试验数据:x 0.5 0.25 16 0.125 0.1 y64138205285360(1)作出散点图,并猜测y 与x 之间的关系; (2)利用所得的函数模型,预测x =10时y 的值.[解析] (1)散点图如图所示,从散点图可以看出y 与x 不具有线性相关关系.根据已有知识发现样本点分布在函数y =b x +a 的图像的周围,其中a,b 为待定参数.令x′=1x ,y′=y,由已知数据制成下表:序号i x i ′ y i ′ x′2i y′2i x′i y′i 1 2 64 4 4 096 128 2 4 138 16 19 044 552 3 6 205 36 42 025 1 230 4 8 285 64 81 225 2 280 5 10 360 100 129 600 3 600 ∑301 052220275 9907 790x ′=6,y ′=210.4,故∑i =15x ′2i-5(x ′)2=40,∑i =15y ′2i -5y ′2=54 649.2,r =779 0-5×6×210.440×54 649.2≈0.999 7,由于r 非常接近于1,∴x′与y′具有很强的线性关系,计算知b≈36.95,a =210.4-36.95×6=-11.3, ∴y′=-11.3+36.95x′,∴y 对x 的回归曲线方程为y =36.95x -11.3.(2)当x =10时,y =36.9510-11.3=-7.605.C 级 能力提高1.以下是某地搜集到的新房屋的销售价格y 和房屋的面积x 的数据:房屋面积(m 2) 115 110 80 135 105 销售价格(万元)24.821.618.429.222(1)画出数据对应的散点图;(2)求线性回归方程,并在散点图中加上回归直线; (3)据(2)的结果估计当房屋面积为150m 2时的销售价格. [解析] (1)数据对应的散点图如下图所示:(2)x =15∑5 i =1x i =109,l xx =∑5i =1 (x i -x )2=1 570,y =23.2,l xy =∑5i =1 (x i -x )(y i -y )=308. 设所求回归直线方程为y ^=b ^x +a ^,则b ^=l xy l xx =3081 570≈0.196 2,a ^=y -b ^x =1.816 6.故所求回归直线方程为y ^=0.196 2x +1.816 6. (3)据(2),当x =150 m 2时,销售价格的估计值为 y ^=0.196 2×150+1.816 6=31.246 6(万元).2.某商店各个时期的商品流通率y(%)和商品零售额x(万元)资料如下:散点图显示出x 与y ,流通率y 决定于商品的零售额x,体现着经营规模效益,假定它们之间存在关系式:y =a +bx .试根据上表数据,求出a 与b 的估计值,并估计商品零售额为30万元时的商品流通率.[解析] 设u =1x,则y≈a+bu,得下表数据:进而可得n =10,u ≈0.060 4,y =3.21,∑i =110u 2i -10u 2≈0.004 557 3, ∑i =110u i y i -10uy ≈0.256 35,b≈0.256 350.004 557 3≈56.25, a =y -b·u ≈-0.187 5,所求的回归方程为y ^=-0.187 5+56.25x .当x =30时,y =1.687 5,即商品零售额为30万元时,商品流通率为1.687 5%.。
第3章 1.1 回归分析 1.2 相关系数 1.3 可线性化的回归分析
§1回归分析1.1回归分析1.2相关系数1.3可线性化的回归分析1.了解回归分析的思想和方法.(重点)2.掌握相关系数的计算和判断线性相关的方法.(重点)3.了解常见的非线性回归模型转化为线性回归模型的方法.(难点)[基础·初探]教材整理1回归分析阅读教材P73~P75,完成下列问题.设变量y对x的线性回归方程为y=a+bx,由最小二乘法知系数的计算公式为:b=l xyl xx=∑i=1n(x i-x)(y i-y)∑i=1n(x i-x)2=∑i=1nx i y i-n x y∑i=1nx2i-n x2,a=y-b x.教材整理2相关系数阅读教材P76~P78,完成下列问题.1.相关系数r的计算假设两个随机变量的数据分别为(x1,y1),(x2,y2),…,(x n,y n),则变量间线性相关系数r=l xyl xx l yy=∑i=1n(x i-x)(y i-y)∑i=1n(x i-x)2∑i=1n(y i-y)2=∑i=1nx i y i-n x y∑i=1nx2i-n x2∑i=1ny2i-n y2.2.相关系数r与线性相关程度的关系(1)r的取值范围为[-1,1];(2)|r|值越大,误差Q越小,变量之间的线性相关程度越高;(3)|r|值越接近0,误差Q越大,变量之间的线性相关程度越低.3.相关性的分类(1)当r>0时,两个变量正相关;(2)当r<0时,两个变量负相关;(3)当r=0时,两个变量线性不相关.判断(正确的打“√”,错误的打“×”)(1)两个变量的相关系数r>0,则两个变量正相关.()(2)两个变量的相关系数越大,它们的相关程度越强.()(3)若两个变量负相关,那么其回归直线的斜率为负.()【答案】(1)√(2)×(3)√教材整理3可线性化的回归分析阅读教材P79~P82,完成下列问题.1.非线性回归分析对不具有线性相关关系的两个变量做统计分析,通过变量代换,转化为线性回归模型.2.非线性回归方程A.y =2+13x B .y =2e x C .y =2e 1xD .y =2+ln x【解析】 分别将x 的值代入解析式判断知满足y =2+ln x . 【答案】 D[质疑·手记]预习完成后,请将你的疑问记录,并与“小伙伴们”探讨交流: 疑问1: 解惑: 疑问2: 解惑:[小组合作型]i i 3-1-1①,对变量u ,v 有观测数据(u i ,v i )(i =1,2,…,10),得散点图②.由这两个散点图可以判断()图3-1-1A.变量x与y正相关,u与v正相关B.变量x与y正相关,u与v负相关C.变量x与y负相关,u与v正相关D.变量x与y负相关,u与v负相关(2)两个变量x,y与其线性相关系数r有下列说法:①若r>0,则x增大时,y也随之相应增大;②若r<0,则x增大时,y也相应增大;③若r=1或r=-1,则x与y的关系完全对应(有函数关系),在散点图上各个散点均在一条直线上,其中正确的有()A.①②B.②③C.①③D.①②③(3)有五组变量:①汽车的重量和汽车每消耗1升汽油所行驶的平均路程;②平均日学习时间和平均学习成绩;③某人每日吸烟量和其身体健康情况;④正方形的边长和面积;⑤汽车的重量和百公里耗油量.其中两个变量成正相关的是A.①③B.②④C.②⑤D.④⑤【精彩点拨】可借助于线性相关概念及性质作出判断.【自主解答】(1)由这两个散点图可以判断,变量x与y负相关,u与v正相关,故选C.(2)根据两个变量的相关性与其相关系数r之间的关系知,①③正确,②错误,故选C.(3)其中①③成负相关关系,②⑤成正相关关系,④成函数关系,故选C.【答案】(1)C(2)C(3)C1.线性相关系数是从数值上来判断变量间的线性相关程度,是定量的方法.与散点图相比较,线性相关系数要精细得多,需要注意的是线性相关系数r的绝对值小,只是说明线性相关程度低,但不一定不相关,可能是非线性相关.2.利用相关系数r 来检验线性相关显著性水平时,通常与0.75作比较,若r >0.75,则线性相关较为显著,否则为不显著.[再练一题]1.下列两变量中具有相关关系的是( )【导学号:62690052】A .正方体的体积与边长B .人的身高与体重C .匀速行驶车辆的行驶距离与时间D .球的半径与体积【解析】 选项A 中正方体的体积为边长的立方,有固定的函数关系;选项C 中匀速行驶车辆的行驶距离与时间成正比,也是函数关系;选项D 中球的体积是43π与半径的立方相乘,有固定函数关系.只有选项B 中人的身高与体重具有相关关系.【答案】 Bx (℃)之间的关系,随机统计了某4个月的月销售量与当月平均气温,其数据如下表:(1)(2)气象部门预测下个月的平均气温约为6 ℃,据此估计该商场下个月毛衣的销售量.【精彩点拨】 (1)可利用公式求解; (2)把月平均气温代入回归方程求解.【自主解答】 (1)由散点图易判断y 与x 具有线性相关关系.x=(17+13+8+2)÷4=10,y=(24+33+40+55)÷4=38,∑4i=1x i y i=17×24+13×33+8×40+2×55=1 267,∑4i=1x2i=526,b=∑4i=1x i y i-4x y ∑4i=1x2i-4x2=1 267-4×10×38526-4×102≈-2.01,a=y-b x≈38-(-2.01)×10=58.1,所以线性回归方程为y=-2.0x+58.1.(2)气象部门预测下个月的平均气温约为6 ℃,据此估计,该商场下个月毛衣的销售量为y=-2.0 x+58.1=-2.0×6+58.1≈46(件).1.回归分析是定义在具有相关关系的两个变量基础上的,因此,在作回归分析时,要先判断这两个变量是否相关,利用散点图可直观地判断两个变量是否相关.2.利用回归直线,我们可以进行预测.若回归直线方程y=a+bx,则x=x0处的估计值为y0=a+bx0.3.线性回归方程中的截距a和斜率b都是通过样本估计而得到的,存在着误差,这种误差可能导致预报结果的偏差,所以由线性回归方程给出的是一个预报值而非精确值.4.回归直线必过样本点的中心点.[再练一题]2.某研究机构对高三学生的记忆力x和判断力y进行统计分析,得下表数据:(1)(2)请根据上表提供的数据,用最小二乘法求出y关于x的线性回归方程y=bx+a;(3)试根据求出的线性回归方程,预测记忆力为9的同学的判断力.【解】(1)如图:(2)∑4i=1x i y i=6×2+8×3+10×5+12×6=158,x=6+8+10+124=9,y=2+3+5+64=4,∑4i=1x2i=62+82+102+122=344,b=158-4×9×4344-4×92=1420=0.7,a=y-b x=4-0.7×9=-2.3,故线性回归方程为y=0.7x-2.3.(3)由(2)中线性回归方程得当x=9时,y=0.7×9-2.3=4,预测记忆力为9的同学的判断力约为4.[探究共研型]探究1【提示】非线性回归问题有时并不给出经验公式.这时我们可以画出已知数据的散点图,把它与学过的各种函数(幂函数、指数函数、对数函数等)图象作比较,挑选一种跟这些散点拟合得最好的函数,然后采用适当的变量变换,把问题化为线性回归分析问题,使之得到解决.其一般步骤为:探究2已知x和y之间的一组数据,则下列四个函数中,模拟效果最好的为哪一个?①y=32③y=4x; ④y=x2.【提示】观察散点图中样本点的分布规律可判断样本点分布在曲线y=3×2x-1附近.所以模拟效果最好的为①.某地区不同身高的未成年男性的体重平均值如下表:(2)如果一名在校男生身高为168 cm,预测他的体重约为多少?【精彩点拨】先由散点图确定相应的拟合模型,再通过对数变换将非线性相关转化为线性相关的两个变量来求解.【自主解答】(1)根据表中的数据画出散点图,如下:由图看出,这些点分布在某条指数型函数曲线y=c1e c2x的周围,于是令z=ln y,列表如下:作出散点图,如下:由表中数据可求得z与x之间的回归直线方程为z^=0.693+0.020x,则有y =e0.693+0.020x.(2)由(1)知,当x=168时,y=e0.693+0.020×168≈57.57,所以在校男生身高为168 cm,预测他的体重约为57.57 kg.两个变量不具有线性关系,不能直接利用线性回归方程建立两个变量的关系,可以通过变换的方法转化为线性回归模型,如y=c1e c2x,我们可以通过对数变换把指数关系变为线性关系,令z=ln y,则变换后样本点应该分布在直线z=bx+a(a=ln c1,b=c2)的周围.[再练一题]3.在一次抽样调查中测得样本的5个样本点,数据如下表:【解】作出变量y与x之间的散点图如图所示.由图可知变量y与x近似地呈反比例函数关系.设y=kx,令t=1x,则y=kt.由y与x的数据表可得y与t的数据表:作出y 与t 的散点图如图所示.由图可知y 与t 呈近似的线性相关关系.又t =1.55,y =7.2,∑i =15t i y i =94.25,∑i =15t 2i =21.312 5,b =∑i =15t i y i -5t y∑i =15t 2i -5t 2=94.25-5×1.55×7.221.312 5-5×1.552≈4.134 4,a =y -b t =7.2-4.134 4×1.55≈0.8, ∴y =4.134 4t +0.8.所以y 与x 的回归方程是y =4.134 4x+0.8.[构建·体系]1.下列结论正确的是( )①函数关系是一种确定性关系;②相关关系是一种非确定性关系;③回归分析是对具有函数关系的两个变量进行统计分析的一种方法;④回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法.A .①②B .①②③C .①②④D .①②③④【解析】 函数关系和相关关系的区别是前者是确定性关系,后者是非确定性关系,故①②正确;回归分析是对具有相关关系的两个变量进行统计分析的一种方法,故③错误,④正确.【答案】 C2.下表是x 和y 之间的一组数据,则y 关于x 的线性回归方程必过点( )C.(2.5,4) D.(2.5,5)【解析】线性回归方程必过样本点的中心(x,y),即(2.5,4),故选C.【答案】 C3.对具有线性相关关系的变量x和y,由测得的一组数据求得回归直线的斜率为6.5,且恒过(2,3)点,则这条回归直线的方程为________.【导学号:62690053】【解析】由题意知x=2,y=3,b=6.5,所以a=y-b x=3-6.5×2=-10,即回归直线的方程为y=-10+6.5x.【答案】y=-10+6.5x4.部门所属的10个工业企业生产性固定资产价值与工业增加值资料如下表(单位:百万元):【解析】x=3+3+5+6+6+7+8+9+9+1010=6.6.y=15+17+25+28+30+36+37+42+40+4510=31.5.∴r=∑10i=1(x i-x)(y i-y)∑10i=1(x i-x)2∑10i=1(y i-y)2=0.991 8.【答案】0.991 85.某工厂为了对新研发的一种产品进行合理定价,将该产品按事先拟定的价格进行试销,得到如下数据:(1)求回归直线方程y =bx +a ,其中b =-20,a =y -b x ;(2)预计在今后的销售中,销量与单价仍然服从(1)中的关系,且该产品的成本是4元/件,为使工厂获得最大利润,该产品的单价应定为多少元?(利润=销售收入-成本)【解】 (1)x =16(8+8.2+8.4+8.6+8.8+9)=8.5, y =16(90+84+83+80+75+68)=80, ∵b =-20,a =y -b x , ∴a =80+20×8.5=250, ∴回归直线方程为y =-20x +250.(2)设工厂获得的利润为L 元,则L =x (-20x +250)-4(-20x +250)=-20⎝ ⎛⎭⎪⎫x -3342+361.25, ∴该产品的单价应定为334元时,工厂获得的利润最大.我还有这些不足:(1) (2)我的课下提升方案: (1) (2)。
回归方程的俩种类型
回归方程的俩种类型回归分析是一种统计学方法,用于建立一个数学模型,以预测一个变量与一个或多个其他变量之间的关系。
在回归分析中,回归方程是描述这种关系的数学表达式。
根据变量的性质和数学形式,回归方程可以分为线性回归方程和非线性回归方程。
1.线性回归方程(Linear Regression Equation):线性回归方程是回归分析中最简单也是最常用的一种形式。
它是一个线性函数,用于描述自变量与因变量之间的线性关系。
线性回归方程通常采用最小二乘法进行估计,以找到最佳拟合线(或平面)。
线性回归方程的一般形式可以表示为:Y = a + bX其中,Y是因变量(或响应变量),X是自变量(或解释变量),a是截距,b是斜率。
线性回归方程的关键是估计截距和斜率的值。
这可以通过最小化观测值与回归线之间的残差平方和来实现。
通过拟合最佳拟合线,可以在给定自变量的情况下预测因变量的值。
线性回归方程的应用广泛,用于各种领域的数据分析和预测。
它可以解释变量之间的线性关系,并用于预测结果。
线性回归方程是许多其他回归模型的基础,包括多元线性回归和广义线性模型。
2.非线性回归方程(Nonlinear Regression Equation):非线性回归方程用于描述自变量与因变量之间的非线性关系。
相比于线性回归方程,非线性回归方程更加灵活,可以适应更复杂的数据模式。
非线性回归方程的一般形式可以表示为:Y = f(X, β) + ε其中,Y是因变量,X是自变量,β是参数矢量,f(X, β)是非线性函数,ε是误差项。
非线性回归方程的关键在于拟合一个最佳的非线性函数,以最小化观测值和模型预测值之间的残差。
通常使用最小二乘估计法或最大似然估计法来估计参数的值。
非线性回归方程可以描述一系列复杂的数据关系,例如曲线、指数、对数、多项式等。
它在许多实际应用中被广泛使用,例如生物学、物理学、经济学等。
非线性回归方程的建立和分析通常需要更复杂的数学处理和迭代计算。
线形回归方程公式
线形回归方程公式
线性回归方程是指对于一系列自变量与因变量之间存在线性关系
的数据,通过求解最小二乘法得到的一条直线方程,用于描述自变量
与因变量之间的关系。
其具体的数学公式为:
y = b0 + b1x1 + b2x2 + … + bnxn
其中,y表示因变量,x1 ~ xn表示n个自变量,b0 ~ bn表示
n+1个回归系数,表示自变量对因变量的影响程度。
线性回归方程就是找到一组最佳的回归系数,使得该方程最小化各数据点与该直线之间
的距离和。
线性回归方程在数据分析、金融预测、医学研究等诸多领域中都
有广泛应用。
在金融研究中,线性回归方程可用于分析股票市场中股
票价格与各种因素之间的关系,帮助投资者更准确地预测市场发展趋势。
在医学领域,线性回归方程可以用于分析药品的剂量与患者的病
情之间的关系,为医生提供更科学的治疗方案。
但是,在使用线性回归方程时,我们也需要注意到它的局限性。
例如,线性回归方程假定自变量与因变量之间存在线性关系,但在实
际应用中,许多自变量与因变量之间的关系并不满足这个条件。
此外,也需要考虑到可能存在的多重共线性问题,避免因为自变量之间存在
相关性而对回归系数的估计产生误差。
因此,在使用线性回归方程时,需要结合实际情况做出合理的分析和判断。
总之,线性回归方程是数据分析中的重要工具,能够帮助我们发
现数据中存在的关系,并为我们提供预测和决策的参考。
但在使用时,我们也需要注意它的限制和适用条件,以免误导我们的决策。
线性回归算法的原理及其应用
线性回归算法的原理及其应用随着数据科学和人工智能的发展,线性回归算法越来越被广泛应用在各个领域。
那么到底什么是线性回归算法呢?本文将会从原理和应用两个角度来介绍线性回归。
一、线性回归算法的原理线性回归是一种统计方法,用来分析两个变量之间的关系。
其中,一个变量是自变量,另一个变量是因变量。
线性回归假设两个变量之间具有线性关系,也就是说,当自变量发生变化时,因变量也会发生相应的变化。
通过收集自变量和因变量之间的数据,我们可以利用回归算法来预测因变量的值。
线性回归的基本形式是一条直线方程:y = ax + b ,其中 x 为自变量,y 为因变量,a 和 b 是回归系数。
在该方程中,a 代表着自变量对因变量的影响程度,b 则是截距,表示当自变量为 0 时,因变量应该是多少。
为了找到最好的直线,我们需要使用最小二乘法。
即,我们需要找到一条直线,使得每个数据点到直线的距离的平方和最小。
这条直线在二维平面上可以表示为一条斜率为 a,截距为 b 的直线。
我们可以通过下面的公式来计算最小二乘法的回归系数 a 和 b:a = (nΣ(xy) - ΣxΣy) / (nΣ(x^2) - (Σx)^2)b = (Σy - aΣx) / n其中,n 是样本的个数,Σ 表示求和,x 和 y 分别是自变量和因变量,xy 表示两个变量的乘积,x^2 表示 x 的平方。
二、线性回归算法的应用现实生活中,线性回归算法广泛应用于金融、自然科学、社会科学、工程等领域。
下面介绍一些具体的应用。
1、金融领域线性回归算法被广泛用于股市预测,即通过过去股票价格的数据来预测未来的价格。
此外,线性回归还可以用于信用评估,即通过个人的收入、年龄、性别等信息来预测其未来的信用状况。
2、自然科学在自然科学领域,线性回归算法可以用于天气预测、长期气候变化预测等。
此外,线性回归还可以用于精细化农业,通过预测土壤酸度、湿度等指标,来实现作物的精准种植和管护。
3、社会科学在社会科学领域,线性回归算法可以用于预测经济增长、失业率等经济指标。
线性回归的显著性检验及回归预测
解:根据前面的计算结果有
n 16, Se 2.457, yc 51.6011, ta / 2 (n 2) t0.025 (14) 2.1448
x
x
/
n
57.25,
nS
2 x
( x x)2 2645
故置信上下限为:
51.6011 2.1448 2.457 1 1 (73 57.25)2 / 2645 16
y
预测区间上限
yc a bx
预测区间下限
x x0
x
第四节 可线性化的回归方程
一、可线性化的常用曲线类型 二、配合回归曲线的问题 三、非线性判定系数与相关系数
拒绝H0,表明总体的两变量之间存在着 显著的线性相关关系,即能源消耗量与 工业总产值之间存在显著的线性相关关 系。
回归方程的显著性检验
1、目的:对回归方程拟合优度的检验 2、具体方法:将回归离差平方和(SSR)同 剩余离差平方和(SSE)加以比较,应用F检 验来分析二者之间的差别是否显著
♥如果是显著的,两个变量之间存在线性 关系 ♥如果不显著,两个变量之间不存在线性 关系
H1: b 0
❖ 构造检验统计量 t b ~ t(n 2)
S(b)
1 S(b) Se n
( xi x)2
n
i 1
n
n
( xi
x )2
nS
2 x
xi2 ( x)2 / n
i 1
i 1
i 1
•计算实际统计量t的值
•确定显著性水平a,查t分布表得临界值 ta/2(n-2),作出统计决策: ♥ |t|>=ta/2,拒绝H0,说明变量X与Y之间存 在着显著的线性关系;
即51.6011 5.6666
第8章非线性回归
(8.2)
于是得到y关于x1,x2,…,xp
y=β0+β1x1+β2x2+…+βpxp+ε
(8.2)式本来只有一个自变量x,是一元p次多项式回归, 在线性化后,变为p元线性回归。
§8.1 可化为线性回归的曲线回归
可线性化的曲线回归模型, 也称为本质线性回归模型
y=aeb xeε
(8.3)
对等式两边同时取自然对数,得:
(a>0, b>0)
§8.1 可化为线性回归的曲线回归
2. S型曲线
y
a
1 bex
此S型曲线当a>0,b>0时,是x的增函数。 当x→+∞时,y→1/a ; x→-∞时,y→0。 y=0与y=1/a是这条曲线的两条渐进线。 S型曲线有多种,其共同特点是曲线首先是缓慢增长,在达 到某点后迅速增长,在超过某点后又变为缓慢增长,并且趋于 一个稳定值。 S型曲线在社会经济等很多领域都有应用,例如某种产品的 销售量与时间的关系,树木、农作物的生长与时间的关系等。
一、几种常见的多项式回归模型
一元二次多项式模型yi=β0+β1xi+β11+εi 的回归函数yi=β0+β1xi+β11是一条抛物线方程,通常称 为二项式回归函数。 回归系数β1为线性效应系数,β11为二次效应系数。
相应地,回归模型 yi=β0+β1xi+β11+β111+εi 称为一元三次多项式模型。
§8.1 可化为线性回归的曲线回归
§8.1 可化为线性回归的曲线回归
SPSS软件中的S型曲线y=exp(b0+b1/t): 当b1<0时是t的增函数,当t从右侧趋于0时,曲线趋于 0;当t→+∞时,曲线以y=exp(b0)为渐进线,属于通常意 义下的S型曲线。
回归方程
y=ƒ(x)近似,则可通过适当的变换,将非线性问题线性化,下面列举常见的几种情况。 (1)双曲线
1 b = a + (图 10-1) y x
图 10-1 令 y′ =
1 1 , x ′ = , 则有y ′ = a + bx ′ y x
ˆ i ) 2 = ∑ [ y i − (b0 + b1 x i )]2 Q = ∑ ( yi − y
i =1 i =1
n
n
达到最小。记
x=
1 n 1 n ˆ = ∑ yi , xi , y ∑ n i =1 n i =1
n n 2
s xx = ∑ ( xi − x ) 2 = ∑ xi −
i =1 n i =1 n 2
i =1 i =1
得到β1,β0的最小二乘估计
b1 =
∑x y
i =1 n i
n
i
− nx y = − nx
2
∑ (x
i =1 n
n
i
− x )( y i − y )
i
∑x
i =1
2 i
∑ (x
i ቤተ መጻሕፍቲ ባይዱ1
=
S xy S xx
(10.4)
− x)
2
b0 = y − b1 x
2.相关检验 由(10.4)及(10.5)得到经验回归方程
y2-y1≥l(x1)
y 2 + y1 2
y 2 − y1 〉 2t a ⋅ S
2
当 n 较小时,控制问题无实际意义,当 n 较大,并且
⎧ y1 = b0 + b1 x1 − t a S ⎪ 2 时,从方程组 ⎨ ⎪ y 2 = b0 + b1 x 2 +t a S 2 ⎩
最简单的线形回归模型
最简单的线形回归模型线性回归是一种基本的统计分析方法,用于研究两个或多个变量之间的线性关系。
它是一种预测模型,通过拟合一条直线,来描述自变量和因变量之间的关系。
线性回归模型可以用于预测因变量的值,并对自变量的影响进行量化。
线性回归模型的基本形式是y = β0 + β1x,其中y是因变量,x 是自变量,β0和β1是回归系数。
β0是截距,表示当自变量x为0时,因变量y的值。
β1是斜率,表示因变量y对自变量x的变化率。
通过最小化残差平方和,也就是实际值与预测值之间的差异的平方和,可以得到最佳拟合直线。
线性回归模型的建立需要满足一些假设条件,包括线性关系、独立性、常态性、同方差性等。
如果这些假设条件不满足,可能会导致回归结果不准确或失效。
因此,在进行线性回归分析时,需要对数据进行严格的前处理,检验假设条件的合理性。
线性回归模型的拟合程度可以通过R方值来衡量,R方值越接近1,说明模型拟合程度越好。
然而,R方值并不是唯一的评估指标,还可以通过残差分析、方差分析等方法来评估模型的准确性。
线性回归模型的应用非常广泛。
在经济学领域,线性回归模型可以用于分析不同因素对经济增长的影响;在医学领域,可以用于预测某种疾病的发生风险;在市场营销领域,可以用于分析广告投放对销售额的影响等。
线性回归模型还可以进行扩展,包括多元线性回归模型、多项式回归模型、非线性回归模型等。
这些模型可以更好地拟合数据,提高预测准确性。
在实际应用中,线性回归模型也存在一些局限性。
例如,线性回归模型假设自变量和因变量之间存在线性关系,但实际情况中很多关系是非线性的。
此外,线性回归模型对异常值和离群点比较敏感,需要进行异常值检测和处理。
线性回归模型是一种简单但常用的统计分析方法,可以用于研究变量之间的线性关系。
通过拟合一条直线来描述自变量和因变量之间的关系,并对自变量的影响进行量化。
线性回归模型的应用广泛,但也需要满足一些假设条件,并进行严格的前处理和模型评估。
回归方程回归系数含义
回归方程回归系数含义回归分析是一种经常在统计学和机器学习中使用的方法,用于建立一个输入变量和一个或多个输出变量之间的关系模型。
回归方程是回归分析的核心,它描述了输入变量与输出变量之间的线性关系。
回归系数则是这个关系模型的参数,它表示了输入变量对于输出变量的影响程度。
回归方程通常采用如下形式:Y = β0 + β1X1 + β2X2 + ... + βnXn其中,Y表示输出变量,X1、X2、...、Xn表示输入变量,β0、β1、β2、...、βn表示回归系数。
回归系数的值可以通过最小二乘法等统计方法估计得到。
回归系数的含义根据具体的回归方程而定。
下面列举一些常见的回归系数含义及相关参考内容:1. 常数项系数(β0):回归方程中的常数项,表示当所有输入变量都等于零时,输出变量的期望值。
一般来说,它代表了在没有任何输入变量的情况下,输出变量的基准水平。
2. 斜率系数(β1、β2、...、βn):回归方程中每个输入变量的斜率系数表示了该变量对输出变量的影响程度。
例如,当斜率系数为正时,表示该变量的增加与输出变量的增加呈正相关;当斜率系数为负时,表示该变量的增加与输出变量的减少呈负相关。
斜率系数的绝对值越大,表示该变量对输出变量的影响越大。
3. 显著性水平和置信区间:回归系数的显著性水平和置信区间可以用来判断回归系数的估计是否统计显著。
如果回归系数的置信区间不包含零,那么可以认为该系数是显著不为零的。
4. 直观解释和模型解释:回归系数的具体含义常常需要根据所研究的具体领域和问题来解释。
例如,在房价预测模型中,各个回归系数可以表示房屋面积、地理位置、厨房数量等因素对房价的影响程度。
因此,解释回归系数时需要结合实际情况来进行直观解释和模型解释。
5. 对数变换和交互项:在某些情况下,为了解决数据非线性或变量之间的非线性关系,可能需要对变量进行对数变换或引入交互项。
对数变换可以将指数关系线性化,而交互项可以表示不同变量之间的相互作用关系。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
§5.2 可线性化的回归方程
在实际问题中,随机变量Y和x的相关关系未必是线性的,而是某种曲线关系. 需要根据相应的专业知识或散点图,
选择适当类型的曲线. 这种问题称为曲线回归分析或非线
性回归分析.
有些非线性回归问题,可以利用变量代换,把回归曲线
方程化为回归直线方程,然后再利用线性回归的方法解决.
根据上述给出的数据,计算得下表:
i i u ln i i z u 2i t 2i
z i i t z i t 1 0 100 4.605 0 0 21.2060252 1 75 4.317 1 4.317 18.6364893 2 55 4.007 4 8.014 16.056049 4 3 40 3.689 9 11.067 13.6087215 4 30 3.401 16 13.604 11.5668016 5 20 2.996 25 14.980 8.9760167 6 15 2.708 36 16.248 7.3332648 7 10 2.303 49 16.121 5.3038099 8 10 2.303 64 18.424 5.30380910 9 5 1.609 81 14.481 2.588881 11 10 5 1.609 100 16.090 2.588881Σ 55 365 33.547 385 133.346 113.168745
整理得正规方程组为
⎪⎪⎪⎩⎪⎪⎪⎨⎧=⎪⎭⎫ ⎝⎛+⎪⎭⎫ ⎝⎛+⎪⎭
⎫ ⎝⎛=⎪⎭⎫ ⎝⎛+⎪⎭⎫ ⎝⎛+⎪⎭
⎫ ⎝⎛=⎪⎭⎫ ⎝⎛+⎪⎭⎫ ⎝⎛+∑∑∑∑∑∑∑∑∑∑∑===========.
,
,1112211141111301112111211131111201111112111211110i i i i i i i i i i i i i i i i i i i i i i i i y x b x b x b x y x b x b x b x y b x b x nb 将观测数据代入上面的方程组,得
⎪⎩
⎪⎨⎧=++=++=++.4.63084405328242001540,6.3804242001540110,6.248154011011210210210b b b b b b b b b
由此解得
.139.0ˆ,2165.0ˆ,9727.0ˆ210===b b b 于是所求的抛物线回归方程为
.139.02165.09727.0ˆ2x x y ++=。