回归分析教学案例
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
《回归分析》教学案例
山东省青州实验中学262500聂公民王垒
适用人民教育出版教学选修2-3 第三章统计案例《回归分析》教学
教学目标
1、知识与技能
(1)学生通过收集现实问题中两个变量的数据,会画出散点图,分析数据,认为判断两个变量的关系。
(2)能求出回归系数,确定回归方程,并根据回归方程作出数据预测。
(3)了解非线性回归问题,能找出解决一般问题的思路。
(4)通过相关检验,了解回归分析的思想与方法,例如用表格收集数据,画散点图分析数据等。
2、过程与方法
(1)通过复习线性回归方程,探究相关性检验的基本方法与思想。
(2)通过收集数据,分析数据,培养学生类比、迁移、化归的能力,合情推理推理的能力,解决问题的能力。
3、情感态度与价值观
培养学生合作探究、积极参与、大胆探索的精神,增强学生的数据分析意识。
教学重点与难点
重点:回归分析的思想与方法
难点:回归分析的应用
教学方法:
学生自主实践探究为主,教师指导为辅,形成完整的知识结构。师生共同将知识深入探究,为增强直观性,采用多媒体辅助教学,注重计算机、计算机在数据分析中的应用,注意计算机、计算器的操作指导。
预备活动
教师准备A.预备活动纸(见附件1),B.课上活动纸(见附件2),C.课后活动纸(见附件3),提前一天分发给学生,学生利用课余时间提前完成。
设计意图:帮助学生回顾复习必修3相关内容,为学习新知识作好准备。
并提出启发性问题,便于引入课题。
教学过程:
一、复习引入
学生回答“预备活动纸”。
教师总结由活动纸上问题“比较三组数据的相关性显著程度”引出相关检验,进入课题。
设计意图:为新知识讲授作铺垫。
二、举例精解
教师分发课上活动纸。
例1(1)研究某灌溉渠道的水流速度y m/s与水深x m之间的关系,测得数据如下:
表格 1
预测当水深为1.50m时水流速度为多少?
(2)为了解某地母亲身亲x与女儿身高y的相关关系,随机测得10对母女的身高数据如下:
表格 2
母亲身高为161cm,预测女儿身高为多少?
课件展示。
师生共同用软件Excel 画出散点图,并求出回归直线方程和相关系数等,作出预测。
引导问题:从这两例画出的散点图我们发现数据的成性相关性显著程度有何不同?
设计意图:使学生了解Excel在数据分析中的应用,引出课题。
师生共同归纳总结出:(1)中数据的线性相关关系比(2)中数据更为显著。在数据分析中用相关系数表示这特征。
教师展示相关系数r,
()()x x y y x y
nxy
r ---=
=
说明:① 1r ≤;
② r 越接近1,线性相关系越强; ③ r 越近0线性相关程度越弱。
④ r ≥0.95两个变量有很显著的线性相关关系 0.90≤r ≤0.95两个变量有显著的线性相关关系 0.75≤r ≤0.90两个变量有较显著的线性相关关系
教师展示例1(2)建立回归模型的方法及步骤,归结如下(课件展示): (1)确定研究对象,明确哪个变量是解释变量,哪个变量是预报变量。 (2)画出解释变量和预报变量的散点图,观察它们之间的关系(如是否存在线性关系)。
(3)由经验确定回归方程的类型(如我们观察数据呈线性关系,则选用线性回归方程 y = a + b x ).
(4)按一定规则估计回归方程中参数(如最小二乘法)。
(5)得出结果后分析残差图是否有异常(个别数据残差过大,或残差呈现不随机规律性,等),若存在异常,则检查数据是否有误,或模型是否合适等。
按上述步骤教师示范。教师指导学生Excel 的使用方法,使用说明见附件4。 ⒈画散点图
图表 1
⒉回归方程:y = 0.7815x + 34.996
⒊用Excel数据分析工具得到的数据:
表格 3
SUMMARY OUTPUT
回归统计
Multiple R 0.714798
R Square 0.510936
Adjusted R Square 0.449803
标准误差 1.865065
观测值10
表格 4
方差分析
df SS MS F Significance F 回归分析 1 29.07227 29.07227 8.357783 0.020169 残差8 27.82773 3.478466
总计9 56.9
表格 5
Coefficients 标准误差t Stat P-value Lower
95%
Upper
95%
下限
95.0%
上限
95.0%
Intercept 34.9958 42.93208 0.815143 0.438582 -64.0058 133.9973 -64.0058 133.9973 X Variable 1 0.781513 0.270328 2.890983 0.020169 0.158136 1.404889 0.158136 1.404889 表格 6
RESIDUAL OUTPUT
观测值预测 Y 残差
1 159.256 -1.2563
2 160.038 -1.0378
3 160.038 -0.0378
4 162.382 -1.3824
5 159.25
6 1.7437
6 155.349 -0.3487
7 159.256 2.7437
8 158.475 -1.4748
9 159.256 2.7437
10 157.693 -1.6933
⒋画残差图
残差图(如图表2)中各点在水平带状区域分布不均匀,而且R 2 = 0.5109,
r = 0.714798,故此线性回归方程不是很合适。所以这个模型需改进。
改进方法:可以去掉残差为正值的两组数据再作分析。