选修1-2,回归分析课件
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
利用 r 样本
求出 n n 2 2 相关系数 ( xi X ) ( yi Y )
i 1 i 1
(x
i 1
n
i
X )( yi Y )
判断r的绝对值与1的接近程度,从而判断出 x,y是否具有较强的线性相关性。若具有较 强的线性相关性则选用线性回归方程模型求 解,否则,根据经验选用别的模型建立函数 模型! 根据10组数据求得:r=0.9998;可见x,y的线 性关系很强
(1)y与x是否具有线性相关?
(2)若y与x具有线性相关关系,求回归直线方程
(3)预测加工200个零件需花费多少时间?
分析:这是一个回归分析问题,应先进行 线性相关检验或作散点图来判断x与y是否 具有线性相关才可以求解后面的问题。
作散点图如下:不难看出x,y成线性相关。
150 100 系列1 50 0 0 50 100 150
对于具有相关关系的两个变量用什么方法 来研究呢? 回归分析 回归分析的基本步骤: 画散点图 求回归方程
预报、决策
对具有线性相关的两个变量,我们可以用 最小二乘法来求它的线性回归方程:
y bx a
b
(x
i 1 n
n
i
X )( yi Y )
2 ( X X ) i i 1
来源 解释变量 随机误差
平方和 225.639
(回归平方和)
比例 0.64 0.36
128.361
(残差平方和)
总偏差
354
(总偏差平方和)
1.00
怎样判断模型的拟合效果?---用残差判断
判断原始数据中是否存在可疑数据--残差分析
进行残差分析的手段有哪些? 1.表格分析;2.画残差图
用身高预报体重时须注意下面问题: 1.适用范围;2.适用时间;3.样本选取影响 方程适用范围;4:预报值是预报变量可能 值的平均值
总偏差平方和=
(y
i 1
n
i
Y)
2
如例1中的总偏差平方和为354
问题:
那么“总偏差平方和”中又有多少来自于 随机误差? 观测值和它在回归直线上相应位置的差异叫:
残差=
ei yi y i
2 (yi y i ) i 1 n
残差平方和=
残差平方和----刻划随机误差效应
a Y bX
怎样描述两个变量之间的线性相关关系的强弱?
答:用相关系数r来衡量。
r
(x
i 1 n i 1
n
i
X )( yi Y )
n
2 2 ( x X ) ( y Y ) i i i 1
说明:①r>0(两个变量)正相关,r<0 负相关;
②︱r︱接近1表明相关性强,︱r︱接近0表明
解(1)列出下表:
i
xi yi x iy i
1
10
62
620
2
20 68
1360
3
30 75
2250
4
40 81
3240
5
50 89
4450
6
60
7
70
8
80
9
10
90 100
95 102 108 115 122
5700 7140 8640 10350 12200
求出r判断
选择函数模型
求相关数据
求预报值
问题:如何刻画预报变量(体重)在多大程 度上与解释变量(身高)、随机误差有关? 如:一位女大学生若其体重不受身高、随机误 差的影响其体重应为54.5(平均值)公斤,但 她的实际体重为61公斤,这说明什么? 说明体重受到身高、随机误差的双重影响, 这时解释变量和随机误差的组合效应是-6.5。
我们把每个“观测值减去总平均值的平方和”称 --总偏差平方和 它刻画了:解释变量、随机误差的效应总和
回归平方和
总偏差平方和
残差平方和
回归平方和----反映解释变量的效应
例1的解释变量的效应为354-128.361=225.639
用什么来刻划回归的效果?用相关指数R2
2 (yi yi ) n
R =1-
2
( y
i 1
i 1 n
i
Y)
2
作用:R2越大--残差平方和越小--模
型的拟合效果越好!反之相反。
检验拟合效果
两变量几乎不相关;
③ ︱r︱>0.75时表示有很强的相关关系。
用线性回归方程y=bx+a进行回归分析会 有误差吗?怎样体现误差产生的影响?
用下面的线性回归模型:y=bx+a+e 解释更客观。
e表示随机误差; a、b是模型的未知参数。
就例1而言,随机误差项e产生的原因是什么?
解释变量x
预报变量y 随机误差e
必修3回顾
确定对象
收集数据 数据分析 简单随机抽样
统计的步骤
抽样方法
系统抽样
分层抽样
统计图表
条形图 折线图 直方图 茎叶图 用样本频率分布估计 总体分布 用样本的数字特征估 计总体的数字特征
用Hale Waihona Puke Baidu本估计总体
现实生活中两个变量间的关系有哪些呢?
两 个 变 量 的 关 系
函数关系
线性相关 相关关系 非线性相关
建立回归方程的步骤:
确立研究对象 按规律估计a、b 分析残差图是否异常 画散点图 由经验确定回 归方程类型
例题1.一个车间为了规定工时定额,需要确定 加工零件所花费的时间,为此进行了10次试验, 测得数据如下:
零件数 10 20 30 40 50 60 70 (x)个
80
90 100
加工时 62 68 75 81 89 95 102 108 115 122 间y