回归分析PPT演示文稿
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
在必修模块中 , 我们学习过关于抽样、 用 样本估计总体、线性回 归等基本知识.本 章中 , 我们将在此基础上 , 通过对典型例案 的讨论, 进一步讨论线性回归分 析方法及 其应用, 并初步了解独立性检验 的基本思 想, 认识统计方法在决策中 的作用 .
1.1 回归分析的基本思想及 其初步应用
我们知道 ,函数关系是一种确定 性关系 , 而相关关系是一种非确 定性关系 .回归分 析(regression analysis ) 是对具有相关关 系的两个变量进行统计 分 析的一种常用 方法.在《数学3 》中, 我们对两个具有线 性相关关系的变量利用回归分析 的方法 进行了研究, 其步骤为画散点图, 求回归 直线方程 , 并用回归直线方程进行预报.
第一章 统计案例
在现实中 , 我们经常会遇到类似下 面的问题 : 肺癌是严重威胁人类性命的一种疾病 , 吸烟 与患肺癌有关系吗 ? 肥胖是影响人类健康的 一个重要因素,身高和 体重之间是否存在 线 性相关关系 ? 等等.
为了回答这些问题 ,必须明确问题涉及的对 象 (总体) 是什么, 用怎样的量来描述要解 决的问 题, 并确定获取变量值 (数据)的方法,然后用恰 当的方法分析数据 ,以得到最可靠的结论 .
2 i1
n
i1
yi βxi y βx 2 yi βxi y βx
n
y βx α ny βx α ,
2
i1
i1
注意到 yi βxi y βx y βx α
i1
n
,
2
2
n 1 n 其中x x i , y yi .x, y 称为样本点的 n i1 i1 公式吗? 中心.你能推导出这两个计算
回归直线过样本点的中 心.
ˆ 分别是使 ˆ 和斜率b 从已经学过的知识知道 , 截距a Qα,β yi βxi α 取最小值时α,β的值.
x
180
ห้องสมุดไป่ตู้
图1.1 1
从图 1.1 1中可以看出 , 样本点呈条状分布, 身 高和体 重有比 较好的 线性相关关系,因此可 以用线 性回归方程刻
y
70 65 60 55 50 45 40 150 155 160 165 170 175
x
180
画它们之间的关系 . 1和2,可以得到 根据探究中的公式 ˆ 0.849. ˆ 85.712, b a
n
i
x y i y
i
x
i1
x
, α y βx .
2
这正是我们所要推导的 公式.
下面我们通过案例 , 进一步学习回归分析的 基本思想及其应用 .
例1 从某大学中随机选取8名女大学生, 其身高和体 重数据如表1 1所示. 编号 1 2 3 4 5 6 7 8 身高/ cm 165 165 157 170 175 165 155 170 体重 / kg 48 57 50 54 64 61 43 59
y βx α yi βxi y βx
i1
n
n n y βx α yi β xi ny βx i1 i1
y βx αny nβx ny βx 0,
所以 Qα, β y i βx i y βx ny βx α
n
2
x i x y i y n 2 i1 y i y . n 2 i1 x x i
n i1
2
在上式中 ,后两项和α,β无关,而前两项为非负 数,因此要使Q取最小值 ,当且仅当前两项的值 均为0,即有
β
x
i1 n
求根据一名女大学生的 身高预报她的体重的回 归方程, 并预报一名身高为 172cm的女大学生的体重 . 70 y 解 由于问题中要求根
65
据身高预报体重 ,因此选 取身高为自变量 x , 真实 体重为因变量 y .作散点 图 (图1.1 1) :
60 55 50 45 40 150 155 160 165 170 175
2 n i1
由于Qα,β yi βxi y βx y βx α
n
2
y βx α y βx α
2 n 2
yi βxi y βx 2yi βxi y βx
2 i1 n 2
β2 x i x 2β x i x y i y
2 i1 i1
n
n
y i y ny βx α
2 i1
n
2
xi x yi y n 2 2 ny βx α xi x β i1 n 2 i1 x x i i1
图1.1 1
ˆ 0.849x ˆ 85.712. 于是得到回归方程 y 所以, 对身高为 172cm的女大学生 ,由回归方程可以 预报其体重为 y 0.849 172 85.712 60.316kg .
b 0.849是斜率的估计值 ,说明身高x每增加 1个单位时 , 体重y就增加0.849个单位, 这表明 体重与身高具有正的线 性相关关系 .如何描述 它们之间线性相关关系 的强弱? 在必修3中, 我们介绍了用相关系数 r来衡量 两个变量之间线性相关 关系的方法 .样本相 关系数的具体计算公式 为
探究 对于一组具有线性相关关系的数据 x1, y1 , x 2 , y 2 , , xn , yn , 我们知道其回归方程的截距和斜率的最小 二乘估计公式分别为: n
ˆx ˆ y b a
1
ˆ b
x
i1 n
i
x y i y
i
x
i1
x