变量间的相互关系解析

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

n
yi bxi a
i 1
yi bxi a
(x1,y1)
(xi,yi) (xn,yn)
(x2,y2)
由于绝对值使得计算不方便,在实际应用 中人们更喜欢用
Q y1 bx1 a2 y2 bx2 a2 yn bxn a2
yi bxi a
(x1,y1)
(xi,yi) (xn,yn)
2.3变量间的相互关系
阅读教材P84-91
1.两个变量的关系
1.变量与变量之间的关系大致可分为两种类型:确 定的__函__数__关系和不确定的相关关系.
2.两个变量的关系可通过它们所对应的点在平面上 表现出来,这些点对应的图形叫做_散__点___图.
3.若两个变量的散点图中,所有点看上去都在一条 直线附近波动,则称这两个变量是__线__性__相__关____的,而若 所有点看上去在___某__条__曲__线___附近波动,则称此相关为非 线性相关,如果所有点在散点图中没有显示任何关系,则 称变量间__不__相__关__.
0 10 20 30 40 50 60
40 30 20 10
0 10 20 30 40 50 60
4.回归直线方程
• 1.回归直线 • 2.回归方程 • 3.最小二乘法 • 4.求回归方程
如果散点图中的点的分布,从整体上看大致在一条 直线附近,则称这两个变量之间具有线性相关关系,这 条直线叫做回归直线.并根据回归方程对总体进行估计.
35 30
25 20 15 10
5
年龄
0 20 25 30 35 40 45 50 55 60 65
讨论:对一组具有线性相关关系的样本数据: (x1,y1),(x2,y2),…,(xn,yn),
设其回归方程为 y bx a ,可以用哪些数量关
系来刻画各样本点与回归直线的接近程度?
(x1,y1)
i 1
i 1
10
xxy x b
i 1 10
10 x y
i
i
110 10 0 1
2 10 2
110 10 0
i
i 1
a ybx 0b0 0
∴所求回归直线方程为 y=^x
求线性回归直线方程的步骤:
第一步:列表
xi ,
y, i
xi
y i

第二步:计算
n
n
x,
y,
x
2,
i
xi
y i
xi yi nx y
b i1 n
2
xi x
i 1 n
xi 2
2
nx
i 1
百度文库
i 1
根据最小二乘法的思想和
此公式,利用计算器或计算机
a y b x 可以方便的求得年龄和人体脂
肪含量的样本数据的回归方程.
求线性回归方程 观察两相关变量得如下表:
x -1 -2 -3 -4 -5 5 3 4 2 1 y -9 -7 -5 -3 -1 1 5 3 7 9
(xi,yi) (xn,yn)
(x2,y2)
用这n个距离之和来刻画各点到直线的 “整体距离”是比较合适的,即可以用
n
yi bxi a
i 1
表示各点到直线 y bx a 的“整体距
离”.
(x1,y1)
(xi,yi) (xn,yn)
(x2,y2)
用这n个距离之和来刻画各点到直线的 “整体距离”是比较合适的,即可以用
脂肪含量)
40 30 20 10
0 10 20 30 40 50 60
年龄
. 方案1、先画出一条直线,测量出各点与
它的距离,再移动直线,到达一个使距离的和 最小时,测出它的斜率和截距,得回归方程。
脂肪含量 40
35 30
25 20 15 10
5
年龄
0 20 25 30 35 40 45 50 55 60 65
(x2,y2)
这样,问题就归结为:当a,b取什么值时Q最小?即
点到直线 y bx a 的“整体距离”最小.
Q y1 bx1 a2 y2 bx2 a2 yn bxn a2
yi bxi a
(x1,y1)
(xi,yi) (xn,yn)
(x2,y2)
这样,问题就归结为:当a,b取什么值时Q最小?即
求两变量间的回归方程
解1: 列表:
i 1 2 3 4 5 6 7 8 9 10
xi -1 -2 -3 -4 -5 5 3 4 2 1
y i
-9
-7
-5
-3
-1
1
5
3
7
9
xi
y i
9
14 15 12
5
5 15 12 14 9
计算得: x 0, y 0
10
10
x2 i
110,
xi
y i
110

i 1
i 1
第三步:代入公式计算b,a的值;
第四步:写出直线方程。
1.两个变量的关系
导学案 P50例1
2.线性相关关系的判断
导学案 P50例2
3.正相关和负相关
从散点图上看,点散布在从左下角到右上角的区域内, 两个变量的这种相关关系称为_正__相__关___,点散布在从左上 角到右下角的区域内,两个变量的这种相关关系称为 __负__相__关__.
40 30 20 10
(xi,yi) (xn,yn)
(x2,y2)
我们可以用点(xi,yi)与这条直线上横坐 标为xi的点之间的距离来刻画点(xi,yi)到直 线的远近.
yi bxi a (i 1,2,3,, n)
为了从整体上反映n个样本数据与回归直线的
接近程度,你认为选用哪个数量关系来刻画比较合
适?
(x1,y1)
. 方案2、在图中选两点作直线,使直线
两侧的点的个数基本相同。
脂肪含量 40
35 30
25 20 15 10
5
年龄
0 20 25 30 35 40 45 50 55 60 65
方案3、如果多取几对点,确定多条直线,再 求出这些直线的斜率和截距的平均值作为回归直
线的斜率和截距。而得回归方程。
脂肪含量 40
点到直线 y bx a 的“整体距离”最小.
Q y1 bx1 a2 y2 bx2 a2 yn bxn a2
这样通过求此式的最小值而得到回归直线的方 法,即使得一半数据的点到回归直线的距离的平方 和最小的方法叫做最小二乘法.
根据有关数学原理推导,a,b的值由下列公式给出
n
n
xi x yi y
相关文档
最新文档