数据的相关性-课件
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
i xi yi
x iy i
12345 482 383 421 364 362 78 65 71 64 61 375 248 298 232 220 96 95 91 96 82
∴ x =20512, y =3539,
S
2 x
=2033.04,sxy=269.28.
b=
S xy
S
2 x
=2206393.2.084≈0.132452,
所以回归方程为 y=0.8136x+0.0043.
考点三 利用回归方程对总体进行估计
利用回归直线,我们可以进行预测.若回归直 线方程为y=bx+a,则x=x0处的估计值为:y =bx0+a.
例3 某5名学生总成绩和数学成绩(单位:分) 如下表所示:
学生 A B C D E 总成绩(x) 482 383 421 364 362 数学成绩(y) 78 65 71 64 61
•
9、有时候读书是一种巧妙地避开思考 的方法 。2021/3/12021/3/1M onday, March 01, 2021
•
10、阅读一切好书如同和过去最杰出 的人谈 话。2021/3/12021/3/12021/3/13/1/2021 10:31:24 AM
•
11、越是没有本领的就越加自命不凡 。2021/3/12021/3/12021/3/1M ar-211- Mar-21
a= y -b x ≈3539-0.132452×20512≈14.501315.
∴回归方程为 y=0.132452x+14.501315.
(3)当 x=450 时,y≈74,
即当一个学生的总成绩为 450 分时,他的数学
成绩约为 74 分.
【名师点评】 (1)回归分析是寻找相关关系 中非确定性关系的某种确定性; (2)求回归直线方程,关键在于正确地求出系 数a,b,由于a,b的计算量大,计算时要仔 细,避免计算失误. 变式训练3 一台机器由于使用时间较长, 生产的零件有一些会缺损,按不同转速生产 出来的零件有缺损的统计数据如下表:
房屋面积 x(m2)
115 110 80 135 105
销售价格y(万 24.
元)
8
21. 6
19. 4
29. 2
22
(1)画出数据对应的散点图; (2)判断新房屋的销售价格和房屋面积之间是 否具有相关关系?如果有相关关系,是正相 关还是负相关? 【思路点拨】 先建立直角坐标系,画出散 点图,再判断相关关系.
,sxy;
(2)计算
b=
S xy
S
2 x
,a=
y
-b
x
;
பைடு நூலகம்
(3)写出方程 y=bx+a.
变式训练2 随着我国经济的快速发展, 城乡居民的生活水平不断提高,为研究某 市家庭平均收入与月平均生活支出的关系, 该市统计部门随机调查10个家庭,得数据 如下表:
家庭编号 1 2 3 4 5 6 7 8 9 10
施化肥 量x
15
20
25
30
35
40
45
水稻产 量y
330
34 5
365
40 5
445
45 0
455
施化肥量x和水稻产量y是否具有相关关系?
解:作出散点图进行分析.散点图如下:
从散点图可以看出施化肥量x和水稻产量y的 确存在一定相关关系,大体上随着施化肥量 的增加,水稻的产量也在增加.
考点二 求回归直线方程
提示:假设样本点为(x1,y1),(x2,y2),…, (xn,yn),记 x =n1(x1+x2+…+xn), y =n1(y1 +y2+…+yn),则( x ,y )为样本点的中心,回 归直线一定过这一点,对于单变量样本数据而 言,平均数是样本数据的中心,类似地,对于 双变量样本点而言,回归直线是样本点的中 心.
12.4 数据的相关性 12.4.1 相关性 12.4.2 回归直线
12.4.2
回 归 直 线
课前自主学案 课堂互动讲练 知能优化训练
学习目标 1.理解两个变量的相关关系的概念; 2.会作散点图,并利用散点图判断两个变 量之间是否具有相关关系; 3.会求回归直线方程.
课前自主学案
温故夯基
1.用样本估计总体主要有:用样本的 __频__率__分_布______ 估 计 总 体 的 频 率 分 布 ; 用 样 本 的数__字__特__征_______估计总体的数字特征. 2 . 样 本 的 数 字 特 征 主 平要均有数______众__数_ 、 ____中__位__数 、 __方__差______ 标、准差__.______ 及 ____________ 3.在确现定实生活中两个变量之间的函数关系是一 种_______的关系.
5 60 62 3720 3600
x
=70,
y
=66,sxy=18,
S
2 x
=50
设所求回归方程为 y=bx+a,
则由上表可得
b=
S xy
S
2 x
=295=0.36,
a= y -b x =40.8.
∴所求回归方程为
y=0.36x+40.8.
【名师点评】 求回归方程的步骤:
(1)计算
x
,
y
,
S
2 x
【解】 (1)数据对应的散点图如图所示. (2)通过以上数据对应的散点图可以判断,新 房屋的销售价格和房屋的面积之间具有相关 关系,且是正相关.
【名师点评】 两个随机变量x和y相关关系 的确定方法: (1)散点图法:通过散点图,观察它们的分布 是否存在一定规律,直观地判断; (2)表格、关系式法:结合表格或关系式进行 判断; (3)经验法:借助积累的经验进行分析判断. 变式训练1 某地农业技术指导站的技术员, 经过在7块并排大小相同的试验田上进行施 化肥量对水稻产量影响的试验,得到如下表 所示的一组数据:(单位:千克)
(1)作出散点图; (2)求数学成绩y对总成绩x的回归方程; (3)如果一个学生的总成绩为450分,试预测 这个学生的数学成绩. 【思路点拨】 进行线性回归分析的关键是 求出线性回归直线方程.由于求回归系数a、 b的运算量很大,故可用列表法并借助计算 器求解.
【解】 (1)散点图如图所示:
(2)列表:
xi(收入)/千 元
0.8
1.1
1.3
1.5
1.5
1.8
2.0
2.2
2.4
2.8
yi(支出)/千 元
0.7
1.0
1.2
1.0
1.3
1.5
1.3
1.7
2.0
2.5
(1)判断家庭平均收入与月平均生活支出是否 相关; (2)若二者线性相关,求回归直线方程.
解:(1)作出散点图: 观察发现各个数据对应的点都在一条直线附 近,所以二者有线性相关关系
(3)令 0.73x-0.875≤10,解得 x≤14.9≈15.
故机器的运转速度应控制在 15 转/秒内.
方法感悟
1.在研究两个变量是否存在某种关系时,必须 从散点图入手,对于散点图,可以做出如下判 断:(1)如果所有的样本点都落在某一函数曲线 上,那么就用该函数来描述变量之间的关系, 即变量之间具有函数关系;(2)如果所有的样本 点都落在某一函数曲线附近,那么变量之间具 有相关关系;(3)如果所有的样本点都落在某一 直线附近,那么变量之间具有线性相关关系.
②负相关:散点图中的点散布在从 __左__上__角____到_右__下__角_____的区域. 3.回归直线的方程 (1)回归直线:如果散点图中点的分布从整体 上 看 大 致 在 _一__条__直__线_____ 附 近 , 就 称 这 两 个 变 量 之 间 具 有 _线__性__相__关_______ 关 系 , 这
条直线叫做回归直线. (2)回归方程:___回__归__直_线_____对应的方程叫
回归直线的方程,简称回归方程. (3)回归直线方程y=bx+a,其中
b是回归方程的斜率,a是截距.
4.最小二乘估计
n
(yi-bxi-a)2
我们可以求Q(a,b)=_i_=1_______________
的最小值,如果常数a,b使Q(a,b)达到最
知新益能
1.相关关系 与 函 数 关 系 不 同 , 相 关 关 系非是确一定种 _________性关系. 2.两个变量的线性相关 (1)散点图:将样本中n个数据点(xi,yi)(i= 1,2,…,n)描在平面直角坐标系中得到的图 形. (2)正相关与负相关 ①正相关:散点图中的点散布在从__左__下__角__ 到__右__上__角_____的区域.
课堂互动讲练
考点一
考点突破 相关关系的判断
在现实生活中存在着大量的相关关系,如何判 断和描述相关关系,统计学发挥着非常重要的 作用.由于变量间的相关关系带有不确定性, 这就需要通过收集大量的数据,对数据进行统 计分析,发现规律,从而作出科学的判断.
例1 以下是在某地搜集到的不同楼盘新房 屋的销售价格y(单位:万元)和房屋面积x(单 位:m2)的数据:
小,就称直线l:y=bx+a为{xi}与{yi}的回
归直线,回归直线中的a、b分别是固有值a0、
b0的最小二乘估计.
问题探究
1.相关关系与函数关系有什么不同? 提示:函数关系是一种确定的关系,相关关 系是一种非确定的关系.函数关系是一种因 果关系,而相关关系不一定是因果关系,也 可能是伴随关系. 2.回归直线通过样本点的中心,对照平均 数与样本数据之间的关系,你能说说回归直 线与散点图中各点之间的关系吗?
【解】 以x轴表示数学成绩,y轴表示物理 成绩,可得到相应的散点图如图所示.
由散点图可知,两者之间具有相关关系,且 为线性相关. 列表,计算
i
xi yi x iy i
x2i
1 80 70 5600 6400
2 75 66 4950 5625
34 70 65 68 64 4760 4160 4900 4225
据最小二乘估计思想的公式,用待定系数法求 出a,b,从而确定回归直线方程.
例2 5个学生的数学和物理成绩(单位:分) 如下表:
学生 学科
数学 物理
ABCDE
80 75 70 65 60 70 66 68 64 62
画出散点图,判断它们是否具有相关关 系,若相关,求出回归方程.
【思路点拨】 作散点图 → 判断 → 求a,b → 回归方程
(2) x =110(0.8+1.1+1.3+1.5+1.5+1.8+2.0+
2.2+2.4+2.8)=1.74,
y =110(0.7+1.0+1.2+1.0+1.3+1.5+1.3+1.7
+2.0+2.5)=1.42,
b=
S xy
S
2 x
≈0.8136,
a=1.42-1.74×0.8136≈0.0043,
•
12、越是无能的人,越喜欢挑剔别人 的错儿 。2021/3/12021/3/12021/3/1M onday, March 01, 2021
•
13、知人者智,自知者明。胜人者有 力,自 胜者强 。2021/3/12021/3/12021/3/12021/3/13/1/2021
•
14、意志坚强的人能把世界放在手中 像泥块 一样任 意揉捏 。2021年3月1日星期 一2021/3/12021/3/12021/3/1
i 1 2 34 xi 16 14 12 8 yi 11 9 8 5 xiyi 176 126 96 40
x
=12.5,
y
=8.25,
S
2 x
=6.375,sxy=8.75,
∴b=
S xy
S
2 x
=68..37755≈0.73,
a=8.25-0.73×12.5=-0.875,
∴y=0.73x-0.875.
转速x(转/秒) 16 14 12 8
每小时生产缺损 零件数y(件)
11 9
8
5
(1)作出散点图; (2)如果y与x线性相关,求出回归直线方程; (3)若实际生产中,允许每小时的产品中有缺损 的零件最多为10个,那么,机器的运转速度应 控制在什么范围?
解:(1)根据表中的数据画出散点图如图:
(2)设回归直线方程为:y=bx+a,并列表如 下:
3.“回归直线”方程能否按解析几何中求直 线方程的方法来求? 提示:不能.求回归直线方程的方法是用最小 二乘估计.因为所有数据点都分布在一条直线 附近时,这样的直线可画出许多条,而“回归 直线”是这些直线中“最贴近”已知数据的, 但并不一定过数据中的某个点,故一般不按解 析几何中求直线方程的方法来求.
2.知道x与y呈线性相关关系,无需进行相 关性检验,否则,应首先进行相关性检验, 如果本身两个变量不具备相关关系,或者说, 它们之间相关关系不显著,即使求出回归直 线方程也是毫无意义的,而且用其估计和预 测的量也是不可信的. 3.利用回归方程估计总体,只是反映了x与 y的一种近似的相关关系,即y值并不一定是 真实值.