高中数学 选修1-2 1.线性回归模型
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
1.线性回归模型
教学目标 班级_____姓名________
1.了解回归分析的基本思想、方法及初步应用.
2.掌握建立线性回归模型的方法.
3.理解线性回归模型与函数模型的差异.
教学过程
一、回归分析的方法.
1.变量与变量的关系:(1)函数关系:一种确定关系;(2)相关关系:一种非确定关系.
2.回归分析:对具有相关关系的两个变量进行统计分析的一种常用方法.
3.回归分析的步骤:(1)确定研究对象;(2)采集数据;(3)画散点图;(4)求回归直线方程;(5)预测结果;(6)建线性回归模型,求残差,画残差图;(7)求2
R ,刻画拟合效果.
二、例题分析.
例1:研究某大学女大学生身高与体重的关系. (例见教科书2P )
1.确定研究对象:某大学女大学生身高与体重的关系.
2.采集数据: (表见教科书2P )
3.画散点图:(以身高为自变量x ,体重为因变量y ) (图见教科书2P ) 样本点呈带状分布,说明身高和体重有较好的线性相关关系.
4.求回归直线方程:(1)求身高平均值2
5.165=x 、体重平均值5.54=y ,),(y x 称为样本点的中心,回归直线必过该点. (2)求回归直线a x b y
ˆˆˆ+=的参数b ˆ、a ˆ;解得 849.0)(...)()())((...))(())(()())((ˆ2822218822112
11=-++-+---++--+--=-∑--∑===x x x x x x y y x x y y x x y y x x x x y y x x b i n i i i n
i 712.85ˆˆ-=-=x b y a
, (3)得回归直线方程712.85849.0ˆ-=x y . 5.预测结果:将身高x 代入回归直线a x b y
ˆˆˆ+=,可预测体重. 身高为172cm 的女大学生,体重为316.60712.85172849.0ˆ=-⨯=y
. 6.建立线性回归模型,求残差,画残差图:
(1)身高与体重不是确定关系;
(2)函数是一种确定关系;
(3)不能用函数来描述身高与体重的关系;
(4)建立线性回归模型e a x b y ++=ˆˆ.(e 称为随机误差);
(5)表示体重真实值与预测值之间的误差(真实值:真实体重,如表格中样本点的体重数据;预测值:根据身高用回归直线求出的体重数值);
(6)y 是由x 和e 共同确定,x 只能解释部分y 的变化.x 称为解释变量,y 称为预报变量.
(7)由e a x b y ++=ˆˆ(表示真实值),a x b y ˆˆˆ+=(表示预测值)可得a x b y y
y e ˆˆˆ--=-=;(8)对于每个样本点),(11y x ,都有a x b y e i
i i ˆˆˆ--=; (9)i e
ˆ称为相应于点),(i i y x 的残差; (10)残差图:(纵坐标为残差,横坐标可选为样本编号或身高数据等)(图见教科书5P );
(11)残差点比较均匀地落在水平带状区域中,说明选用的模型比较合适;带状区域的宽度越窄,说明模型精度越高,预报越准;残差较大,可能是数据采集有错误,或其他原因造成.
7.求2
R ,刻画拟合效果: (1)2121
2)()ˆ(1y y y
y R i n i i i n i -∑-∑-===(2
1)ˆ(i i n i y y -∑=表示残差平方和,i y 表示样本真实值,i y ˆ表示样本预测值,y 表示样本平均值)
(2)2R 表示x 对于y 变化的贡献率;2
R 越接近1,表示回归效果越好;
(3)2R 是常用的选择模型的指标之一,在实际应用中应尽量选择2R 大的回归模型. (4)可得64.0)(...)()()ˆ(...)ˆ()ˆ()()ˆ(128222128822221128
128
12≈-++-+--++-+-=-∑-∑-===y y y y y y y y y y y y y y y y R i i i i i , 表明“女大学生的体重差异有0064是由身高引起的”.
作业:某运动员训练次数与成绩之间的数据关系如下:
(1)作出散点图;(2)求出回归方程;(3)作出残差图;(4)计算相关指数2R ;
(5)试预测该运动员训练47次及55次的成绩.