苏教版数学高二-1.2素材 线性回归问题中是怎样展现从相关关系到最小二乘法含义与思想的

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

线性回归问题中是怎样展现从相关关系到最小二乘法含义与思想的

一.创设情境 客观事物是相互联系的 过去研究的大多数是因果关系,但实际上更多存在的是一种非因果关系 学是“因”,物理是“果”,或者反过来说 事实上数学和物理成绩都是“果”,而真正的“因”是学生的理科学习能力和努力程度 所以说,函数关系存在着一种确定性关系但还存在着另一种非确定性关系——相关关系

二.提出问题:

某小卖部为了了解热茶销售量与气温之间的关系,随机统计并制作了某6天卖出热茶的气温/0C 26 18 13 10 4 1- 杯数 20

24 34 38 50 64 如果某天的气温是5-C ,你能根据这些数据预测这天小卖部卖出热茶的杯数吗?

二、开展活动

为了了解热茶销量与气温的大致关系,我们以横坐标x 表示气温,纵坐标y 表示热茶销量,建立直角坐标系,将表中数据构成的6个数对所表示的点在坐标系内标出,得到下图,今后我们称这样的图为散点图(scatterplot).

从右图可以看出.这些点散布在一条直线的附近,故可用一个线性函数近似地表示热茶销量与气温之间的关系.

选择怎样的直线近似地表示热茶销量与气温之间的关系?

我们有多种思考方案:

(1)选择能反映直线变化的两个点,例如取(4,50),(18,24)这两点的直线;

(2)取一条直线,使得位于该直线一侧和另一侧的点的个数基本相同;

(3)多取几组点,确定几条直线方程,再分别算出各条直线斜率、截距的平均值,作为所求直线的斜率、截距;

………………

怎样的直线最好呢?

三、建构方法

1.最小平方法:

用方程为ˆy

bx a =+的直线拟合散点图中的点,应使得该直线与散点图中的点最接近。那么,怎样衡量直线ˆy

bx a =+与图中六个点的接近程度呢? 我们将表中给出的自变量x 的六个值带入直线方程,得到相应的六个ˆy

的值:

26,18,13,10,4,b a b a b a b a b a b a +++++-+.这六个值与表中相应的实

际值应该越接近越好.所以,我们用类似于估计平均数时的思想,考虑离差的平

方和

222222

22(,)(2620)(1824)(1334)(1038)(450)(64)12866140382046010172Q a b b a b a b a b a b a b a b a ab b a =+-++-++-++-+

+-+-+-=++--+

(,)Q a b 是直线ˆy

bx a =+与各散点在垂直方向(纵轴方向)上的距离的平方和,可以用来衡量直线ˆy

bx a =+与图中六个点的接近程度,所以,设法取,a b 的值,使(,)Q a b 达到最小值.这种方法叫做最小平方法(又称最小二乘法) .

先把a 看作常数,那么Q 是关于b 的二次函数.易知,当140382021286

a b -=-⨯时, Q 取得

最小值.同理, 把b 看作常数,那么Q 是关于a 的二次函数.当14046012

b a -=-

时, Q 取得最小值.因此,当140382021286140460

12a b b a -⎧=-⎪⎪⨯⎨-⎪=-⎪⎩时,Q 取的最小值,由此解得 1.6477,57.5568b a ≈-≈.所求直线方程为ˆ 1.647757.5568y

x =-+. 当5x =-时,ˆ66y

≈,故当气温为5-0C 时,热茶销量约为66杯. 2.线性相关关系:

像能用直线方程ˆy

bx a =+近似表示的相关关系叫做线性相关关系. 3.线性回归方程:

当,a b 使1122()()...()n n Q y bx a y bx a y bx a =--+--++--取得最小值时,就称

ˆy

bx a =+为拟合这n 对数据的线性回归方程,该方程所表示的直线称为回归直线. 上述式子展开后,是一个关于,a b 的二次多项式,应用配方法,可求出使Q 为最小值时的,a b 的值.即

11122

11()()()n n n i i i i i i i n n i i i i n x y x y b n x x a y bx =====⎧-⎪=⎪⎨-⎪⎪=-⎪⎩∑∑∑∑∑,(*) ∑==n i i x n x 11, ∑==n i i y n y 1

1 四、例题展示

例.下表为某地近几年机动车辆数与交通事故数的统计资料,请判断机动车辆数与交通事故数之间是否有线性相关关系,如果具有线性相关关系,求出线性回归方程;如果不具有

关系.计算相应的数据之和:

8888

211111031,71.6,137835,9611.7i i i i i i i i i x

y x x y ========∑∑∑∑, 将它们代入(*)式计算得0.0774, 1.0241b a ≈=-,

所以,所求线性回归方程为0.0774 1.0241y x =-.

相关文档
最新文档