《线性回归方程》教案(1)(1)

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

线性回归方程

教学目标:

(1)收集现实问题中两个有关联变量的数据作散点图,利用散点图直观认识变量间的相关关系;

(2)在两个变量具有线性相关关系时,在散点较长中作出线性直线,用线性回归方程进行预测;

(3)理解最小二乘法的含义及思想,能根据给出的线性回归方程系数公式建立线性回归方程。

教学重点:散点图的画法,回归直线方程的求解方法。

教学难点:回归直线方程的求解方法。

教学过程:

一、问题情境

问题1:

客观事物是相互联系的,存在着一种确定性关系,过去研究的大多数是因

果关系,但实际上更多存在的是一种非因果关系即非确定性关系——相关关系。

你能举出一些这样的事例吗?

问题2:

某小卖部为了了解热茶销售量与气温之间的关系,随机统计并制作了某6天卖出热茶的杯数与当天气温的对照表:

-

气温/0C 26 18 13 10 4 1

杯数20 24 34 38 50 64

-0C,你能根据这些数据预测这天小卖部卖出热茶的杯数吗?

如果某天的气温是5

二、学生活动

为了了解热茶销量与气温的大致关系,我们以横坐标x表示气温,纵坐标y表示热茶销量,建立直角坐标系,将表中数据构成的6个数对所表示的点在坐标系内标出,得到下图,今后我们称这样的图为散点图(scatterplot).

从右图可以看出.这些点散布在一条直线的附近,故可用一个线性函数近似地表示热茶销量与气温之间的关系.

选择怎样的直线近似地表示热茶销量与气温之间的关系?

我们有多种思考方案:

(1)选择能反映直线变化的两个点,例如取(4,50),(18,24)这两点的直线; (2)取一条直线,使得位于该直线一侧和另一侧的点的个数基本相同;

(3)多取几组点,确定几条直线方程,再分别算出各条直线斜率、截距的平均值,作为所求直线的斜率、截距; ……………… 怎样的直线最好呢? 三、建构数学 1、最小平方法:

用方程为ˆy

bx a =+的直线拟合散点图中的点,应使得该直线与散点图中的点最接近.那么怎样衡量直线ˆy

bx a =+与图中六个点的接近程度呢? 我们将表中给出的自变量x 的六个值代入直线方程,得到相应的六个值:

26,18,13,10,4,b a b a b a b a b a b a +++++-+

它们与表中相应的实际值应该越接近越好.

所以,我们用类似于估计平均数时的思想,考虑离差的平方和

2222

22

22(,)(2620)(1824)(1334)(1038)(450)(64)12866140382046010172

Q a b b a b a b a b a b a b a b a ab b a =+-++-+-++-++-+-+-=++--+ (,)Q a b 是直线ˆy

bx a =+与各散点在垂直方向(纵轴方向)上的距离的平方和,可以用来衡量直线ˆy

bx a =+与图中六个点的接近程度。 所以,设法取(,)a b 的值,使(,)Q a b 达到最小值.这种方法叫做最小平方法(又称最小二乘法) 。

2、线性相关关系:

像这样能用直线方程ˆy

bx a =+近似表示的相关关系叫做线性相关关系。 3、线性回归方程:

一般地,设有n 个观察数据如下:

x x 1 x 2 x 3 … x n

y y 1 y 2 y 3 … y n

当a ,b 使222

1122()()...()n n Q y bx a y bx a y bx a =--+--++--取得最小值时,就

称ˆy

bx a =+为拟合这n 对数据的线性回归方程,该方程所表示的直线称为回归直线。 上述式子展开后,是一个关于,a b 的二次多项式,应用配方法,可求出使Q 为最小值时的,a b 的值.即

111

2211()()()

n n n i i i i i i i n

n

i i i i n x y x y b n x x a y bx

=====⎧

-⎪

⎪=⎨-⎪⎪=-⎪⎩∑∑∑∑∑,(*) ∑==n i i x n x 1

1, ∑==n

i i y n y 11

四、数学运用 1.例题:

例1、下表为某地近几年机动车辆数与交通事故数的统计资料,请判断机动车辆数与交通事故数之间是否有线性相关关系,如果具有线性相关关系,求出线性回归方程;如果不具有线性相关关系,说明理由.

机动车辆数x /千台 95 110 112[ 120 129 135 150 180 交通事故数y /千件

6.2

7.5

7.7

8.5

8.7

9.8

10.2

13

解:在直角坐标系中画出数据的散点图,直观判断散点在一条直线附近,故具有线性相关关系.计算相应的数据之和:

8

8

8

8

2

1

1

1

1

1031,71.6,137835,9611.7i

i i i i i i i i x

y x x y ========∑∑∑∑,

将它们代入(*)式计算得0.0774, 1.0241b a ≈=-,

所以,所求线性回归方程为0.0774 1.0241y x =-.

例2、设有一个回归方程x y

23ˆ+-=,当变量x 增加1个单位时( A ) A y

ˆ平均增加2个单位 B y ˆ平均增加3个单位 C y

ˆ平均减少2个单位 D y ˆ平均减少3个单位.

相关文档
最新文档