《回归分析》教案1
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
《回归分析》教案1
【教学目标】
1. 了解相关系数r ;
2. 了解随机误差;
3. 会简单应用残差分析
【教学重难点】
教学重点:相关系数和随机误差 教学难点:残差分析应用.
【教学过程】
一、设置情境,引入课题
上节例题中,身高172cm 女大学生,体重一定是60kg 吗?如果不是,其原因是什么? 二、引导探究,发现问题,解决问题
1 0.84985.712y x =-对于0.849b =是斜率的估计值,说明身高x 每增加1个单位,体重就 ,表明体重与身高具有 的线性相关关系.
2 如何描述线性相关关系的强弱?
()()
n
i
i
x x y y r --=
∑
(1)r >0表明两个变量正相关;(2)r <0表明两个变量负相关;
(3)r 的绝对值越接近1,表明相关性越强,r 的绝对值越接近0,表明相关性越弱. (4)当r 的绝对值大于0.75认为两个变量具有很强的相关性关系.
3 身高172cm 的女大学生显然不一定体重是60.316kg ,但一般可以认为她的体重接近于60.316kg .
①样本点与回归直线的关系
②所有的样本点不共线,而是散布在某一条直线的附近,该直线表示身高与体重的关系的线性回归模型表示y bx a ε=++
e 是y 与y bx a =+的误差,e 为随机变量,e 称为随机误差. ③E (e )=0,D (e )= 2σ>0.④D (e )越小,预报真实值y 的精度越高. ⑤随机误差是引起预报值y 与真实值y 之间的误差之一.
⑥,a b 为截距和斜率的估计值,与a ,b 的真实值之间存在误差,这种误差也引起y 与真
实值y 之间的误差之一.
4 思考
产生随机误差项e 的原因是什么?
5 探究在线性回归模型中,e 是用y 预报真实值y 的误差,它是一个不可观测的量,那么应该怎样研究随机误差?如何衡量预报的精度?
①2
()D e σ=来衡量随机误差的大小.②i i i e y y =- ③i i i i i e y y y bx a =-=--
④2
2111
(,)(2)22
n i e Q a b n n n σ===>--∑ ⑤(,)Q a b 称为残差平方和,2
σ越小,预报精度越高. 6 思考
当样本容量为1或2时,残差平方和是多少?用这样的样本建立的线性回归方程的预报误差为0吗?
7 残差分析
①判断原始数据中是否存在可疑数据;②残差图 ③相关指数2
2
1
2
1
()
1()
n
i
i
i n
i
i y y R y y ==-=-
-∑∑
④R 2越大,残差平方和越小,拟合效果越好;R 2越接近1,表明回归的效果越好. 8 建立回归模型的基本步骤:
①确定研究对象,明确哪个变量时解释变量,哪个变量时预报变量. ②画出确定好的解释变量和预报变量得散点图,观察它们之间的关系; ③由经验确定回归方程的类型; ④按一定规则估计回归方程中的参数; ⑤得出结果后分析残差图是否异常. 三、典型例题
例1 下表是某年美国旧轿车价格的调查资料,今以x 表示轿车的使用年数,y 表示响应的年均价格,求y 关于x 的回归方程
减,但不在一条直线附近,但据此认为y 与x 之间具有线性回归关系是不科学的,要根据图的形状进行合理转化,转化成线性关系的变量间的关系.
解:作出散点图如下图
可以发现,各点并不是基本处于一条直线附近,因此,y 与x 之间应是非线性相关关系.与已学函数图像比较,用bx a y e +=来刻画题中模型更为合理,令ln z y =,则z bx a =+,
题中数据变成如下表所示: 拟合,由表中数据可得0.996,0.75r r ≈->,认为x 与z 之间具有线性相关关系,由表中数据的0.298,8.165,b a ≈-≈所以0.2988.165z x =-+,最后回代ln z y =,
即0.2988.165x y e -+= 四、当堂练习:
1 两个变量y 与x 的回归模型中,分别选择了4个不同模型,它们的相关指数R 2如下,其中拟合效果最好的模型是( )
A 模型1的20.98R =
B 模型2的20.80R =
C 模型3的20.50R =
D 模型4的20.25R = 答案 A 五、课堂小结
1 相关系数r 和相关指数R
2 2 残差分析
y
500