苏教版数学高二-1.2素材 线性回归问题中是怎样展现从相关关系到最小二乘法含义与思想的
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
线性回归问题中是怎样展现从相关关系到最小二乘法含义与思想的
一.创设情境 客观事物是相互联系的 过去研究的大多数是因果关系,但实际上更多存在的是一种非因果关系 学是“因”,物理是“果”,或者反过来说 事实上数学和物理成绩都是“果”,而真正的“因”是学生的理科学习能力和努力程度 所以说,函数关系存在着一种确定性关系但还存在着另一种非确定性关系——相关关系
二.提出问题:
某小卖部为了了解热茶销售量与气温之间的关系,随机统计并制作了某6天卖出热茶的气温/0C 26 18 13 10 4 1- 杯数 20
24 34 38 50 64 如果某天的气温是5-C ,你能根据这些数据预测这天小卖部卖出热茶的杯数吗?
二、开展活动
为了了解热茶销量与气温的大致关系,我们以横坐标x 表示气温,纵坐标y 表示热茶销量,建立直角坐标系,将表中数据构成的6个数对所表示的点在坐标系内标出,得到下图,今后我们称这样的图为散点图(scatterplot).
从右图可以看出.这些点散布在一条直线的附近,故可用一个线性函数近似地表示热茶销量与气温之间的关系.
选择怎样的直线近似地表示热茶销量与气温之间的关系?
我们有多种思考方案:
(1)选择能反映直线变化的两个点,例如取(4,50),(18,24)这两点的直线;
(2)取一条直线,使得位于该直线一侧和另一侧的点的个数基本相同;
(3)多取几组点,确定几条直线方程,再分别算出各条直线斜率、截距的平均值,作为所求直线的斜率、截距;
………………
怎样的直线最好呢?
三、建构方法
1.最小平方法:
用方程为ˆy
bx a =+的直线拟合散点图中的点,应使得该直线与散点图中的点最接近。那么,怎样衡量直线ˆy
bx a =+与图中六个点的接近程度呢? 我们将表中给出的自变量x 的六个值带入直线方程,得到相应的六个ˆy
的值:
26,18,13,10,4,b a b a b a b a b a b a +++++-+.这六个值与表中相应的实
际值应该越接近越好.所以,我们用类似于估计平均数时的思想,考虑离差的平
方和
222222
22(,)(2620)(1824)(1334)(1038)(450)(64)12866140382046010172Q a b b a b a b a b a b a b a b a ab b a =+-++-++-++-+
+-+-+-=++--+
(,)Q a b 是直线ˆy
bx a =+与各散点在垂直方向(纵轴方向)上的距离的平方和,可以用来衡量直线ˆy
bx a =+与图中六个点的接近程度,所以,设法取,a b 的值,使(,)Q a b 达到最小值.这种方法叫做最小平方法(又称最小二乘法) .
先把a 看作常数,那么Q 是关于b 的二次函数.易知,当140382021286
a b -=-⨯时, Q 取得
最小值.同理, 把b 看作常数,那么Q 是关于a 的二次函数.当14046012
b a -=-
时, Q 取得最小值.因此,当140382021286140460
12a b b a -⎧=-⎪⎪⨯⎨-⎪=-⎪⎩时,Q 取的最小值,由此解得 1.6477,57.5568b a ≈-≈.所求直线方程为ˆ 1.647757.5568y
x =-+. 当5x =-时,ˆ66y
≈,故当气温为5-0C 时,热茶销量约为66杯. 2.线性相关关系:
像能用直线方程ˆy
bx a =+近似表示的相关关系叫做线性相关关系. 3.线性回归方程:
当,a b 使1122()()...()n n Q y bx a y bx a y bx a =--+--++--取得最小值时,就称
ˆy
bx a =+为拟合这n 对数据的线性回归方程,该方程所表示的直线称为回归直线. 上述式子展开后,是一个关于,a b 的二次多项式,应用配方法,可求出使Q 为最小值时的,a b 的值.即
11122
11()()()n n n i i i i i i i n n i i i i n x y x y b n x x a y bx =====⎧-⎪=⎪⎨-⎪⎪=-⎪⎩∑∑∑∑∑,(*) ∑==n i i x n x 11, ∑==n i i y n y 1
1 四、例题展示
例.下表为某地近几年机动车辆数与交通事故数的统计资料,请判断机动车辆数与交通事故数之间是否有线性相关关系,如果具有线性相关关系,求出线性回归方程;如果不具有
关系.计算相应的数据之和:
8888
211111031,71.6,137835,9611.7i i i i i i i i i x
y x x y ========∑∑∑∑, 将它们代入(*)式计算得0.0774, 1.0241b a ≈=-,
所以,所求线性回归方程为0.0774 1.0241y x =-.