回归分析的基本思想
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
姚明 身高:226cm 体重:134kg
创设情景
篮球明星的身高和体重
球星 身高/cm 体重/kg
乔丹 198 98
科比 201 100
安东尼 203 104
詹姆斯 203 113
加内特 211 109
姚明 226 134
1、身高和体重之间有怎样的关系? 1、两个变量之间的关系分为哪几类?并 举例说明 2、如何来研究它们之间的这种关系?
用这个模型预测这个孩子10岁时的身高,则正确的叙 述是( D )
A.身高一定是145.83cm; B.身高在145.83cm以上; C.身高在145.83cm以下; D.身高在145.83cm左右.
小结 1、回归分析的基本思想是什么? 2、如何建立回归模型?
布置作业
2、进行线性回归分析的一般步骤是什么?
温故知新
不相关
两个变量的关系
函数关系 线性相关
相关关系 非线性相关
相关关系:对于两个变量,当自变量取值一定时,因
变量的取值带有一定随机性的两个变量之间的关系.
函数关系是一种确定性关系。 相关关系是一种非确定性关系。
回归分析是对具有相关关系的两个变量进行统计分 析的一种常用方法
实例讲解
问题2、在某次考试中,高二年级的某同学因为突发事件, 物理考试缺考,已知他的语文成绩70分,数学成绩86分。 你能想到什么方法来预测一下如果他参加物理考试,能 考多少分?(其他同学的成绩已知)
姓语数物 名文学理 1 71 88 89 2 82 92 76 3 70 94 88 4 83 82 68 5 77 92 80 6 82 96 76 7 76 81 68 8 70 87 81 9 76 87 88 ………… 424 91 88 78
y 在线性回归模型中,e是bx+a预报真实值y的随 机误差,它是一个不可观测量,那么应该怎样 研究随机误差呢?
eˆ5
y5
yˆ5
yˆ 5 y5
y1 eˆ1 y1 yˆ1 yˆ1
x1 x2 x3
x4 x5
x
在实际应用中,我们用回归方程中 yˆ bˆx aˆ 中的 yˆ
来估计y=bx+a+e中的bx+a,由于随机误差e=y-(bx+a),所以
思考1
产生随机误差项e的原因是什么?
身高 模型选取
体重
饮遗 食传 习因 惯素
……
测+e
解释变量x(身高)
随机误差e
预报变量y(体重)
思考2
一次函数模型和线性回归模型的区别 和联系是什么?
特殊
一次函数模型:
y=bx+a
一般
线性函数模型: y=bx+a+e
探究2
eˆ
y
yˆ
是e的估计量。
eˆi
称为相应点(xi,yi)的残差
思考3
如何发现数据中的错误?如何衡量模型 的拟合效果?
我们可以利用图形来分析残差特性。
作图时纵坐标为残差,横坐标可以选为样本编号, 或身高数据,或体重估计值等,这样作出的图形称 为残差图。
1、找出残差绝对值比较大的点。
2、观察残差点是否均匀地落在水平带状区域中。
回归分析的基本思想及初步应用
100 80 60 40 20 0 0
20
40
物理
物理
60
80
100
120
创设情景
篮球明星的身高和体重
乔丹 身高:198cm 体重:98kg
科比 身高:201cm 体重:100kg
安东尼 身高:203cm 体重:104kg
詹姆斯 身高:203cm 体重:113kg
加内特 身高:211cm 体重:109kg
随堂练习
1、一项研究要确定是否能够根据施肥量预测作物的产 量,这里的解释变量是( 施肥量 )
2、已知回归方程中,回归系数为1.23,样本点的中心
为(4,5),则回归直线为( yˆ 1.23x 0.08 )
3、若一个样本的总偏差平方和为80,残差平方和为60, 则相关指数 R2为( 0.25 )
4、 一位母亲记录了儿子3~9岁的身高,由此建立的 身高与年龄的回归模型为y=7.19x+73.93
问题呈现
例1、当堂统计10名高二男生的身高体重数据,汇 总后求出根据身高预报体重的回归方程,并随机 调查一名高二男生的身高数据并预测出体重。
学生
1 2 3 4 5 6 7 8 9 10
身高/cm
体重/kg
身高和体重的关系用线性回归模型
y=bx+a+e来表示, 其中a和b为模型的
未知参数,e称为随机误差。