回归分析的应用 课件
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
2,a^=
y
-
^ b
x =1.816 6.
故所求回归直线方程为y^=0.196 2x+1.816 6. (3) 据 (2) , 当 x = 150 m2 时 , 销 售 价 格 的 估 计 值 为 y^= 0.196 2×150+1.816 6=31.246 6(万元).
点评:已知x与y呈线性相关关系,就无需进行相关性检 验,否则要进行相关性检验.如果两个变量不具备相关关系, 或者相关关系不显著,即使求出回归方程也是毫无意义的, 用其估计和预测也是不可信的.进行线性相关的判断,可通 过散点图直观判断,散点图不明显的可进行相关性检验.
(5)分析__残__差__图__是否有异常.
2.指数函数模型.
样 本 点 分 布 在 某 一 条 指 数 函 数 曲 线 y = __c1_e_c_2_x__ 的 周 围 (其中c1,c2是待定的参数),故可用指数函数模型来拟合这两 个变量.
在上式两边取__对__数____,得____ln__y=__c_2_x_(_1_+__ln__c1_)__,再 令z=ln y,则_z_=__c_2x_(_1_+__l_n_c_1_) ,而z与x间的关系是线性的.
(2)残差分析:通过__残__差____来判断模型拟合的效果,判 断原始数据中是否存在可疑数据,这方面的分析工作称为 _残__差__分__析_.
(3) 残 差 图 : 以 __残__差____ 为 横 坐 标 , 以 _样__本__编__号___ 或 _身__高__数__据_,或_体__重__估__计__值___等为横坐标,作出的图形称为残 差图.观察残差图,如果残差点比较均匀地落在水平的带状 区域中,说明选用的模型比较合适,这样的带状区域的宽度 越窄,模型拟合精度越高,回归方程的预报精度越高.一般
其中正确命题的个数是( D ) A.0个 B.1个 C.2个 D.3个
3.对于回归方程y=4.75x+257,当x=28时,y^的估计 值是__3_9_0______.
线性回归分析的应用
以下是某地搜集到的新房屋的销售价格y和房屋的 面积x的数据:
房屋面积/m2 115 110 80 135 105 销售价格/万元 24.8 21.6 18.4 29.2 22 (1)画出数据对应的散点图; (2)求线性回归方程, 并在散点图中加上回归直线; (3)据(2)的结果估计当房屋面积为150 m2时的销售价格.
解析:(1)数据对应的散点图如
下图所示:
(2) x =155 xi=109, i=1
5
lxx= (xi- x )2=1 570,
i=1
5
y =23.2,lxy= (xi- x )(yi- y )=308.
i=1
设所求回归直线方程为 ^y= ^bx+ ^a,
则b^=llxxxy=1350780≈0.196
3.二次函数模型.
用二次函数模型y=c3x2+c4来拟合两个变量间的关系(令 t=x2,则y=c3t+c4).
例如:为了研究某种细菌随时间x变化繁殖的个数,收集 数据如下:
天数x/天
12 3 4 5 6
繁殖个数y/个 6 12 25 49 95 190
(1)用指数函数模型来拟合这两个变量; (2)用二次函数模型来拟合这两个变量.
(1)所求非线性回归方程为 ^y=e0.69x+1.112=3.051 9e0.690 2x
(2)所求非线性回归方程为 ^y=10.304x2-38.039x+39.7
4.残差分析.
(1) 残 差 : 样 本 值 与 回 归 值 的 差 叫 做 残 差 , 即 __e_=__yi_-__y^_i __.
回归分析的应用
1.建立回归模型的基本步骤: (1)确定研究对象,明确哪个变量是解__释__变__量__,哪个变量 是_预__报__变__量_. (2)画出确定好的解释变量和预报变量的_散__点__图___,观察 它们之间的关系.
(3)确定回归方程的__类__型____. (4)按一定规则估计回归方程中的__参__数____.
1.某农场对单位面积化肥用量x(kg)和水稻相应产量y(kg) 的关系作了统计,得到数据如下:
x 15 20 25 30 35 40 45
y 330 345 365 405 445 450 455 如果x与y之间具有线性相关关系,求出回归直线方程, 并预测当单位面积化肥用量为32 kg时水稻的产量大约是多少? (精确到0.01 kg)
解析:列表如下:
序号
x
y
1
15
330
ห้องสมุดไป่ตู้
2
20
345
3
25
365
4
30
405
5
35
445
6
40
450
7
45
455
210 2 795
x2 225 400 625 900 1 225 1 600 2 025 7 000
xy 4 950 6 900 9 125 12 150 15 575 18 000 20 475 87 175
情况下,比较两个模型的残差比较困难(某些样本点上一个模 型的残差的绝对值比另一个模型的小,而另一些样本点的情 况则相反),故通过比较两个模型的残差的平方和的大小来判 断模型的拟合效果.__残__差__平__方__和__越小的模型,拟合的效果 越好.
例如:分别用指数函数模型和二次函数模型来拟合两个 变量,残差平方和分别为1 450.673和15 448.432,故选用 _指_数__函__数__模型的拟合效果远远优于_二__次__函__数_模型.
1.有下列说法:
①线性回归分析就是由样本点去寻找一条直线贴近这些 样本点的数学方法;
②利用样本点的散点图可以直观判断两个变量是否具有 线性关系;
③通过回归方程^y=^bx+^a及其回归系数^b,可以估计变量 的取值和变化趋势;
④因为由任何一组观测值都可以求得一个回归直线方程, 所以没有必要进行相关性检验.
其中正确命题的个数是( C )
A.1个
B.2个
C.3个
D.4个
2.有下列说法: ①在残差图中,残差点比较均匀地落在水平的带状区域 内,说明选用的模型比较合适;
②用相关指数R2来刻画回归的效果,R2值越大,说明模 型的拟合效果越好;
③比较两个模型的拟合效果,可以比较残差平方和的大 小,残差平方和越小的模型,拟合效果越好.