《线性回归方程》教案(1)(1)
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
线性回归方程
教学目标:
(1)收集现实问题中两个有关联变量的数据作散点图,利用散点图直观认识变量间的相关关系;
(2)在两个变量具有线性相关关系时,在散点较长中作出线性直线,用线性回归方程进行预测;
(3)理解最小二乘法的含义及思想,能根据给出的线性回归方程系数公式建立线性回归方程。
教学重点:散点图的画法,回归直线方程的求解方法。
教学难点:回归直线方程的求解方法。
教学过程:
一、问题情境
问题1:
客观事物是相互联系的,存在着一种确定性关系,过去研究的大多数是因
果关系,但实际上更多存在的是一种非因果关系即非确定性关系——相关关系。
你能举出一些这样的事例吗?
问题2:
某小卖部为了了解热茶销售量与气温之间的关系,随机统计并制作了某6天卖出热茶的杯数与当天气温的对照表:
-
气温/0C 26 18 13 10 4 1
杯数20 24 34 38 50 64
-0C,你能根据这些数据预测这天小卖部卖出热茶的杯数吗?
如果某天的气温是5
二、学生活动
为了了解热茶销量与气温的大致关系,我们以横坐标x表示气温,纵坐标y表示热茶销量,建立直角坐标系,将表中数据构成的6个数对所表示的点在坐标系内标出,得到下图,今后我们称这样的图为散点图(scatterplot).
从右图可以看出.这些点散布在一条直线的附近,故可用一个线性函数近似地表示热茶销量与气温之间的关系.
选择怎样的直线近似地表示热茶销量与气温之间的关系?
我们有多种思考方案:
(1)选择能反映直线变化的两个点,例如取(4,50),(18,24)这两点的直线; (2)取一条直线,使得位于该直线一侧和另一侧的点的个数基本相同;
(3)多取几组点,确定几条直线方程,再分别算出各条直线斜率、截距的平均值,作为所求直线的斜率、截距; ……………… 怎样的直线最好呢? 三、建构数学 1、最小平方法:
用方程为ˆy
bx a =+的直线拟合散点图中的点,应使得该直线与散点图中的点最接近.那么怎样衡量直线ˆy
bx a =+与图中六个点的接近程度呢? 我们将表中给出的自变量x 的六个值代入直线方程,得到相应的六个值:
26,18,13,10,4,b a b a b a b a b a b a +++++-+
它们与表中相应的实际值应该越接近越好.
所以,我们用类似于估计平均数时的思想,考虑离差的平方和
2222
22
22(,)(2620)(1824)(1334)(1038)(450)(64)12866140382046010172
Q a b b a b a b a b a b a b a b a ab b a =+-++-+-++-++-+-+-=++--+ (,)Q a b 是直线ˆy
bx a =+与各散点在垂直方向(纵轴方向)上的距离的平方和,可以用来衡量直线ˆy
bx a =+与图中六个点的接近程度。 所以,设法取(,)a b 的值,使(,)Q a b 达到最小值.这种方法叫做最小平方法(又称最小二乘法) 。
2、线性相关关系:
像这样能用直线方程ˆy
bx a =+近似表示的相关关系叫做线性相关关系。 3、线性回归方程:
一般地,设有n 个观察数据如下:
x x 1 x 2 x 3 … x n
y y 1 y 2 y 3 … y n
当a ,b 使222
1122()()...()n n Q y bx a y bx a y bx a =--+--++--取得最小值时,就
称ˆy
bx a =+为拟合这n 对数据的线性回归方程,该方程所表示的直线称为回归直线。 上述式子展开后,是一个关于,a b 的二次多项式,应用配方法,可求出使Q 为最小值时的,a b 的值.即
111
2211()()()
n n n i i i i i i i n
n
i i i i n x y x y b n x x a y bx
=====⎧
-⎪
⎪=⎨-⎪⎪=-⎪⎩∑∑∑∑∑,(*) ∑==n i i x n x 1
1, ∑==n
i i y n y 11
四、数学运用 1.例题:
例1、下表为某地近几年机动车辆数与交通事故数的统计资料,请判断机动车辆数与交通事故数之间是否有线性相关关系,如果具有线性相关关系,求出线性回归方程;如果不具有线性相关关系,说明理由.
机动车辆数x /千台 95 110 112[ 120 129 135 150 180 交通事故数y /千件
6.2
7.5
7.7
8.5
8.7
9.8
10.2
13
解:在直角坐标系中画出数据的散点图,直观判断散点在一条直线附近,故具有线性相关关系.计算相应的数据之和:
8
8
8
8
2
1
1
1
1
1031,71.6,137835,9611.7i
i i i i i i i i x
y x x y ========∑∑∑∑,
将它们代入(*)式计算得0.0774, 1.0241b a ≈=-,
所以,所求线性回归方程为0.0774 1.0241y x =-.
例2、设有一个回归方程x y
23ˆ+-=,当变量x 增加1个单位时( A ) A y
ˆ平均增加2个单位 B y ˆ平均增加3个单位 C y
ˆ平均减少2个单位 D y ˆ平均减少3个单位.