第一章 统计案例
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
12
1. 通过典型案例的探究,进一步了解回归分析的基本思想、方法及初步应用;
2. 了解评价回归效果的三个统计量:总偏差平方和、残差平方和、回归平方和.
3. 会用相关指数,残差图评价回归效果.
复习1:用相关系数r可衡量两个变量之间关
系.r>0, 相关, r<0 相关; r越接近于1,两个变量的线性相关关系,它们的散点图越接近;r>,两个变量有关系.
复习2:评价回归效果的三个统计量:
总偏差平方和;残差平方和;回归平方和.
二、新课导学
※学习探究
探究任务:如何评价回归效果?
新知:
1、评价回归效果的三个统计量
(1)总偏差平方和:
(2)残差平方和:
(3)回归平方和:
2、相关指数:2R表示对的贡献,公式为:
2
R=
2
R的值越大,说明残差平方和,说明模型拟合效果.
3、残差分析:通过
来判断拟合效果.通常借助图实现.
残差图:横坐标表示,纵坐标表示.
残差点比较均匀地落在的区的区域中,说明选用的模型,带状区域
的宽度越,说明拟合精度越,回归方程
14
A. 很好
B. 较好
C. 一般
D. 较差
※ 当堂检测(时量:5分钟 满分:10分)计分: 1. 两个变量 y 与x 的回归模型中,分别选择了 4 个不同模型,它们的相关指数 2R 如下 ,其中拟合 效果最好的模型是( ).
A. 模型 1 的相关指数2R 为 0.98
B. 模型 2 的相关指数2R 为 0.80
C. 模型 3 的相关指数2R 为 0.50
D. 模型 4 的相关指数2R 为 0.25
2. 在回归分析中,残差图中纵坐标为( ). A. 残差 B. 样本编号 C. x D. n e
3. 通过12,,,n e e e 来判断模拟型拟合的效果,判断原始数据中是否存在可疑数据,这种分工称为( ). A.回归分析 B.独立性检验分析 C.残差分析 D. 散点图分析
4.2R 越接近1,回归的效果 .
5. 在研究身高与体重的关系时,求得相关指数
2R = ,可以叙述为“身高解释了69%的体重变化,而随机误差贡献了剩余 ”所以身高对体重的效应比随机误差的 . 练.(07广东文科卷)下表提供了某厂节能降耗技术改造后生产甲产品过程中记录的产量x (吨)与相应的生产能耗y (吨标准煤)的几组对照数据
(1)(2)请根据上表提供的数据,用最小二乘法求出y 关于x 的线性回归方程y bx a =+;
(3)已知该厂技改前100吨甲产品的生产能耗为90吨标准煤.试根据(2)求出的线性同归方程,预测生产100吨甲产品的生产能耗比技改前降低多少吨标准煤?
(参考数值3 2.543546 4.566.5⨯+⨯+⨯+⨯=) (4)求相关指数评价模型.
§1.1.1回归分析的基本思想及其初步
应用(三)
由上表中的数据得到回归直线方程上图中,样本点的分布没有在某个区域,因
16
思考:评价这两个模型的拟合效果.
小结:利用线性回归方程探究非线性回归问题,可按“作散点图→建模→确定方程”这三个步骤进行. 其关键在于如何通过适当的变换,将非线性回归问题转化成线性回归问题.
三、总结提升 ※ 学习小结
利用线性回归方程探究非线性回归问题,可按“作散点图→建模→确定方程”这三个步骤进行.
※ 知识拓展
非线性回归问题的处理方法: 1、 指数函数型bx a y e +=
① 函数bx a y e +=的图像:
② 处理方法:两边取对数得ln ln()bx a
y e +=,即ln y bx a =+.令ln ,z y =把原始数据(x,y )转化为(x,z ),再根据线性回归模型的方法求出,b a . 2、对数曲线型ln y b x a =+ ① 函数ln y b x a =+的图像
② 处理方法:设ln x x '=,原方程可化为y bx a '=+ 再根据线性回归模型的方法求出,a b . 3、2y bx a =+型
处理方法:设2x x '=,原方程可化为y bx a '=+,再根据线性回归模型的方法求出,a b .
※ 自我评价 你完成本节导学案的情况为( ).
17
1.通过探究“吸烟是否与患肺癌有关系”引出独立性检验的问题,并借助样本数据的列联表、柱形图和条形图展示在吸烟者中患肺癌的比例比不吸烟者中患肺癌的比例高,让学生亲身体验独立性检验的必要性;
2.会根据22⨯列联表求统计量2
K .
学习过程
一、课前准备
1214
复习1:回归分析的方法、步骤,刻画模型拟合效果的方法(相关指数、残差分析)、步骤.
二、新课导学 ※ 学习探究 新知1:
1.分类变量: .
2. 22⨯列联表: .
试试:你能列举出几个分类变量吗?
探究任务:吸烟与患肺癌的关系
1.由列联表可粗略的看出:
(1)不吸烟者有 患肺癌; (2)不吸烟者有 患肺癌.
因此,直观上课的结论: . 2.用三维柱柱图和二维条形图直观反映: (1)根据列联表的数据,作出三维柱形图:
由上图可以直观地看出, 吸烟与患肺癌 .
(2) 根据列联表的数据,作出二维条形图:
由上图可以直观地看出, 吸烟与患肺癌 .
根据列联表的数据,作出等高条形图:
由上图可以直观地看出, 吸烟与患肺癌 .
反思:(独立性检验的必要性)通过数据和图形,我们得到的直观印象是患肺癌有关.那是否有一定的把握认为“吸烟与患肺癌有关”呢?
新知2:统计量2
K
吸烟与患肺癌列联表