北师大版高中数学选修(1-2)-1.1《相关系数》参考课件
2020北师大版高中数学选修1-2:第一章 回归分析相关系数
第一章统计案例§1回归分析1.1回归分析1.2相关系数课时过关·能力提升1.下列说法中,错误的是()A.如果变量x与y之间存在着线性相关关系,那么我们根据试验数据得到的点(x i,y i)(i=1,2,…,n)将散布在某一条直线的附近B.如果两个变量x与y之间不存在线性相关关系,那么根据它们的一组数据(x i,y i)(i=1,2,…,n)不能写出一个线性回归方程C.线性相关系数可以是正的,也可以是负的D.为使求出的线性回归方程有意义,可先用相关系数r来判断变量y与x之间线性相关程度的大小答案:B2.若线性回归方程为y=a+bx(b<0),则x与y之间的相关系数()A.r=0B.r=1C.0<r<1D.-1<r<0答案:D3.已知x,y之间的一组数据:1则y与x的线性回归直线y=a+bx必过点()A.(2,2)B.(1.5,0)C.(1,2)D.(1.5,4)解析:回归直线必经过点由于故选D.答案:D4.一位母亲记录了儿子3~9岁生日那天的身高,由此建立的身高与年龄的线性回归方程为y=7.19x+73.93,用这个模型预测这个孩子10岁生日那天的身高,下列叙述正确的是()A.身高一定是145.83 cmB.身高在145.83 cm以上C.身高在145.83 cm以下D.身高在145.83 cm左右答案:D5.已知x与y之间的一组数据如下表:x123456假设根据上表数据所得线性回归方程为y=a+bx,若某同学根据上表中的前两对数据(1,0)和(2,2)求得的直线方程为y=a'+b'x,则以下结论正确的是()A.a>a',b>b'B.a<a',b>b'C.a>a',b<b'D.a<a',b<b'解析:先分别求出方程y=a+bx和y=a'+b'x,再比较a与a',b与b'的大小.2答案:C6.在下面各图中,散点图与相关系数r不符合的是()答案:B7.下表是某厂1~4月份用水量(单位:百吨)的一组数据:已知用水量y与月份x之间有较强的线性相关关系,则其线性回归方程是.解析:由已知,得-进而可以求得b-所以所求线性回归方程是y=5.25-0.7x.答案:y=5.25-0.7x8.某单位为了了解用电量y(单位:kW·h)与气温x(单位:℃)之间的关系,随机统计了某4天的用电量与当天气温,并制作了对照表如下:3由表中数据得线性回归方程y=a+bx中,b≈-2,预测当天气温为-4 ℃时,用电量约为kW·h.解析:线性回归方程y=a+bx中,b≈-2则a≈40+2×10=60,即y=60-2x,所以当气温为-4 ℃时,用电量约为68 kW·h.答案:689.春节期间,某销售公司每天销售某种取暖商品的销售额y(单位:万元)与当天的平均气温x(单位:℃)有关.现收集了春节期间这个销售公司4天的x与y的数据列于下表:根据以上数据,求得y对x的线性回归方程y=bx+a的系数b=则解析:由题意可得∴a-答案:10.研究某品牌学习机的广告投入x(单位:万元)和销售额y(单位:万元)的关系时,得到以下数据:4利用散点图和相关系数r判断广告投入x和销售额y之间的相关性.解:利用题中给出的数据,作散点图如图所示.从散点图中可以发现:样本点大致分布在一条直线附近,因此我们认为广告投入x和销售额y之间具有线性相关关系.但是这种判断的准确度我们无法给出.利用题中数据可知:380500.则线性相关系数-≈0.919 2.r--此时,我们认为广告投入x和销售额y之间具有较强的线性相关关系.11.某小卖部为了解雪糕销售量与气温之间的关系,随机统计并制作了卖出雪糕数与当天气温的对照表如下:求出y对x的线性回归方程,并预测当天气温为37 ℃时卖出雪糕的数量.分析:这是一个常见的实际问题,要想有效地进行预测,需要先由公式写出线性回归方程,再依据方程进行预测.5解:由表中数据可得:466884进而可以求得b----≈2.78,a≈37.25-2.78×28=-40.59,即线性回归方程为y=-40.59+2.78x.当x=37时,y=-40.59+2.78×37=62.27≈62.故可预测气温为37 ℃时卖出雪糕的数量为62.12.★为了对2018年某中学的中考成绩进行分析,在60分及以上的全体同学中随机抽出8位,他们的数学成绩(已折算为百分制)从低到高排列是60,65,70,75,80,85,90,95;物理成绩从低到高排列是72,77,80,84,88,90,93,95;化学成绩从低到高排列是67,72,76,80,84,87,90,92.若这8位同学的数学、物理、化学成绩事实上对应如下表:(1)用变量y与x,z与x的相关系数说明物理成绩与数学成绩、化学成绩与数学成绩的相关程度;(2)求y与x,z与x的线性回归方程(系数精确到0.01).6参考数据≈32.404≈21.375≈23.452.分析:利用样本相关系数公式求出r,再利用r的值分析两个变量之间相关程度的大小.解:(1)变量y与x的相关系数为--≈0.993,变量z与x的相关系数为r----≈0.994,r'--可以看出物理成绩与数学成绩、化学成绩与数学成绩之间都有较强的线性相关关系,且为正相关.(2)设y与x,z与x的线性回归方程分别是y=a+bx,z=a'+b'x,根据所给的数据,计算出:--≈0.65,b-a--≈0.72,b'-a'所以y与x,z与x的线性回归方程分别为y=34.5+0.65x,z=25.2+0.72x.7。
北师大版高中数学选修1-2同步教学:第1章 1 第1课时 回归分析 相关系数
• 1.关于散点图要注意以下方面:
• 散点图可以说明变量间有无线性相关关系,相关的方向,但 不能精确地说明两个变量之间关系的密切程度,因此需要计 算相关系数来描述两个变量之间关系的密切程度.
• 2.相关关系与函数关系
• (1)两者之间的不同点
• ①相关关系是一种非确定性关系.即相关关系是非随机变 量与随机变量之间的关系.如人的身高与年龄;商品的销 售额与广告费等都是相关关系,而函数关系中的两个变量是 一种确定性关系.如正方形的面积S与边长x之间的关系S =x2就是函数关系,即对于边长x的每一个确定的值,都有面 积S的唯一确定的值与之对应.
• |r|值越大,误差Q越小,变量之间线性相关程度越高;|r|值越 小,误差Q越大,变量之间线性相关程度越低;当r=0时,两 个变量线性不相关.
• (3)r的正负对相关性的影响:
• r>0时,b>0,两个变量的值总体上呈现同时增减的趋势,此时 称两个变量正相关;
• r<0时,b<0,当一个变量增加时,另一个变量有减少的趋势,此 时称两个变量负相关.
第一章
统计案例
• ●情景导学
• 哲学知识告诉我们事物之间是有联系的、联系是普遍的,任 何事物都是运动的、任何两个事物之间都存在着普遍联系 .具体到现实问题中,我们会发现有些问题是从变化的角度 来分析是存在两个都在变化的量,关系非常密切,一个现象 发生一定量的变化,另一个现象一般也会发生相应的变化, 但又不能用函数概念去定义,也无法用函数的模型来代言. 如商场销售收入每增加一万元时,因所卖商品不同,销售利 润一般会增加不同的数值;施肥量增加一斤,一般地产量也 会增加,但值有时不固定.
• C.x与y负相关,x与z负相关
• D.x与y负相关,x与z正相关
高中数学 第一章 统计案例本章知识体系课件 北师大版选修1-2
【规律方法】 对于条件概率的计算,首先要作出准 确判断是否为条件概率,具体计算时,通常设出事件 A 和 B,要理解 A 和 B 所表示的含义,然后代入条件概率计算公 式.
设两个独立事件 A 和 B 都不发生的概率为19,A 发生 B 不发生的概率与 B 发生 A 不发生的概率相同,则 A 发生的 前提下,B 发生的概率是多少?
【解析】 由已知 P( A B )=19,P(A B )=P(B A ), 即 P(A)P( B )=P(B)P( A ), 即 P(A)[1-P(B)]=P(B)[1-P(A)], ∴P(A)-P(A)P(B)=P(B)-P(A)P(B). ∴P(A)=P(B). ∴P( A )=P( B )=13.
某地最近十年粮食需求量逐年上升,下表是部分统计
数据:
年份
2002 2004 2006 2008 2010
需求量(万吨) 236 246 257 276 286
(1)利用所给数据求年需求量与年份之间的回归直线方
程 y=bx+a;
(2)利用(1)中所求的直线方程预测该地 2012 年的粮食
需求量.
【解析】 由所给数据看出,年需求量与年份之间近 似直线上升,下面来求回归直线方程,为此对数据预处理 如下:
∴P(A)=23,P(B)=23,P(AB)=P(A)P(B)=49.
4 ∴P(B|A)=PPAAB=92=23.
3
独立性检验
两个变量之间是否有关联,可通过 2×2 列联表用公 式 χ2=a+bcn+add-ab+cc2b+d计算,与临界值比较判断 两个变量之间的关联程度,χ2 越大,两个变量关联程度 越大.当 χ2≤2.706 时认为两个变量无关联;当 χ2>2.706 时有 90%的把握认为两个变量有关联;当 χ2>3.841 时就 有 95%的把握认为两变量有关联;当 χ2>6.635 时就有 99%的把握认为两个变量有关联.
高中数学第三章统计案例1.1回归分析1.2相关系数ppt课件北师大版选修2_3
19 解答
(2)画出散点图; 解 散点图如下:
2021/5/26
20 解答
(3)求纯获利y与每天销售件数x之间的回归方程.
7
7
解 因为 xiyi=3 487, x2i =280,
i=1
i=1
7
xiyi-7 x y
i=1
3 487-7×6×79.86
所以 b=
7
= 280-7×62 ≈4.75.
2021/5/26
8 答案
思考2
怎样通过相关系数刻画变量之间的线性相关关系?
答案 |r|值越接近1,变量之间的线性相关程度越高;|r|值越 接近0,变量之间的线性相关程度越低;当r=0时,两个变量线 性不相关.
2021/5/26
9 答案
梳理
(1)相关系数 r 的计算公式 r=
n
∑xiyi-n x y
=bx+a;
4
解 因为 xiyi=6×2+8×3+10×5+12×6=158,
i=1
6+8+10+12
2+3+5+6
x=
4
=9, y =
4
=4,
4
x2i =62+82+102+122=344,
i=1
所以 b=15384-4-4×4×9×924=2104=0.7,
a= y -b x =4-0.7×9=-2.3,
2021/5/26
22 解答
(2)求日销售量y对销售单价x的线性回归方程;
2021/5/26
24 解答
(3)设经营此商品的日销售利润为P元,根据(2)写出P关于x的函数关系式, 并预测当销售单价x为多少元时,才能获得最大日销售利润. 解 依题意,有P=(161.5-3x)(x-30)=-3x2+251.5x-4 845 =-3(x-2561.5)2+25112.52-4 845. 所以当 x=2561.5≈42 时,P 有最大值,约为 426 元. 即预测当销售单价为42元时,能获得最大日销售利润.
北师大版高中数学选修1-2相关系数
12
0.198
二、点二列相关
(一)概念及适用条件 1、概念 两列变量一列是正态连续变量,另一列是二分 变量,描述这两个变量之间的相关,称为点二列 相关。 2、适用条件 一列是正态连续变量,另一列是二分变量(如 男与女,对与错等)。
(二)计算方法 点二列相关系数以表示rpb,公式为
rpb
X
p Xq
xy 2.72 40.02 -11.88 49.82 -0.68 7.42 6.02 -2.28 5.92 -5.28
91.8
解:依表上的资料,计算结果为
r xy
N x y
91.80
10 4.454 4.337
0.475
即 10名学生的政治与语文成绩的 相关程度为0.475。
二、计算方法 (一)基本公式计算法 步骤:
1计算X、
Y、
、
x
y;
2计算xy;
3计算 xy;
4将上述数据代入公式5.1, 求得r。
例1 某学校为调查学生学习各科目之间 的能力迁移问题,随机抽取10名学生的政治 与语文成绩见下表,请计算其相关程度。
学生序号 X(政治) Y(语文)
(2)适用条件 ①两变量的资料为等级测量数据,且具有线
性关系。 ②连续变量的测量数据,按其大小排成等级,
亦可用等级相关计算。 ③不要求总体呈正态分布。 2、计算方法
6
D2
rR 1 N ( N 2 1)
(5.4)
式中:D为两变量每对数据的等级之差;N表示样本容量。
计算步骤: (1)计算两变量等级之差D; (2)计算D2; (3)计算∑ D2; (4)代入公式(5.4),求得rR
1.1.2《相关系数》北师大版高中数学选修1-2
0
25
0
0
2
-4
3
16
9
-12
3
-3
4
9
16
-12
4
0
5
0
25
0
5
3
4
9
16
12
y 2.71 .
n
xi yi nx y
进而可求得:r
i 1
n
xi2
2
nx
n
yi2
n
2
y
i 1
i 1
0 7 0 2.71
0
100 7 02 75 7 2.712
从散点图容易看出,表格中的数据都在同一个半圆上,此时建立 线性回归方程是没有任何意义的,这与线性相关系数r的计算结果 是一致的。
2
y
i 1
i 1
i 1
i 1
02 新 知 讲 授
预习提纲
(1) Q(a,b) 的范围为
(2)r的取值范围为
(3)当r 时,b 0,两个变量正相关,当r 时,b (4)| r |越大,Q误差越小,变量之间线性相关程度 (5)| r |值越接近 0,Q误差越大,变量之间线性相关程度
(6)r =0时,则称两个变量线性
因为y与t的相关系数近似为0.99,说明y与t的
线性相关程度相当高,从而可以用线性回归
模型拟合y与t的关系.
7
7
(2)
b
(ti t)( yi
i 1 7
(ti t)2
y)
ti yi 7t y
i 1
7 ti2 7t-2
2.89 28
0.103
i 1
i 1
a y bt 1.331 0.103 4 0.92
2020北师大版高中数学选修1-2:第一章 回归分析相关系数
2 − . ���������2���������
������������������
������
������ ������=1
y
=
y1
+
y2
+… n
+
yn
=
1n
n
∑ ������������,
i=1
lxx=
������
∑ (������������ − ������)2 =
������
∑
���������2���
=
∑ (������������ -������)(������������ -������ )
������=1
������
∑
(������������ -������)2
������=1
=
∑ ������������ ������������ -������������ ������
������=1
2 i
-n
x
2
i
n
∑y
=1
2 i
-n
y
2
性 (1)范围:|r|≤1;(2)|r|越接近 1,x,y 之间的线性相关程度越 质 高;(3)|r|越接近 0,x,y 之间的线性相关程度越低
一二
知识梳理
3.正相关、负相关与线性不相关
(1)正相关:当
r>0
时,lxy>0,从而
b=
������������������ ������������������
所以线性回归方程为 y=0.007 2+1.235 7x.
题型一
题型二
题型三
题型四
高中数学 1.1 第1课时回归分析相关系数课件 北师大版选修12
[解析] 由题意知(s,t)是甲、乙两位同学所做试验的样本点 的中心,而线性回归直线恒过样本点的中心,故选A.
3.设两个变量x和y之间具有线性相关关系,它们的相关系数 是r,y关于x的回归直线的斜率是b,纵截距是a,那么必有
()
A.a与r符号相同
B.a与r符号相反
C.b与r符号相同 D.b与r符号相反
[答案] C
[解析] 根据b与r的计算公式可知,b与r符号相同.
4.(2013·山东沂水县高二期中)已知回归直线的斜率的估计 值是1.23,样本点的中心为(4,5),则回归直线方程是 ________.
[答案] ^y=1.23x+0.08 [解析] 设回归直线方程为^y=1.23x+b, ∵回归直线过点(4,5), ∴5=1.23×4+b, ∴b=0.08, 故回归直线方程为^y=1.23x+0.08.
系,但其相关的程度无法作出定量描述.有没有一种方法能 量的刻画两变量之间相关的程度.
新知导学
4.相关系数
假设两个随机变量的数据分别为(x1,y1),(x2,y2),…,(xn,
yn),则变量间线性相关系数 r 的计算公式如下:
n
xi- x yi- y
i=1
n
xi- x 2
n
yi- y 2
下面变量关系是相关关系的是( ) ①学生的学习态度与学习成绩之间的关系; ②教师的执教水平与学生的学习成绩之间的关系; ③学生的身高与学生的学习成绩之间的关系; ④家庭的经济条件与学生的学习成绩之间的关系. A.①② B.①③ C.②③ D.②④ [答案] A [解析] ①②是相关关系,③④是非相关关系.
高中数学北师大版选修1-2第一章《相关系数》ppt课件
① 根据课堂提问抓住老师的思路。老师在讲课过程中往往会提出一些问题,有的要求回答,有的则是自问自答。一般来说,老师在课堂上提出的问 题都是学习中的关键,若能抓住老师提出的问题深入思考,就可以抓住老师的思路。
n
r lxy
(xi x)( yi y)
i 1
lxx l yy
n
n
(xi x)2 ( yi y)2
i 1
i 1
n
xi yi nx y
i 1
n
xi 2
2
nx
n
yi 2
n
2
y
i 1
i 1
误差Leabharlann Q(a,b) lyy Qmin
lyy
x -5 -4 -3 0 3 4 5 y0345430
经计算后得 r=0。
y
5
通常,|r|越大,线性关系越强,用直
4
线拟合的效果就越好。一般来说 :
3 2
1
x
r∈[-1,-0.75]或[0.75,1],线性关-6 -4 -2 0 2 4 6
系很强;
r∈[-0.75,0.75],线性关系很弱。
编后语
1.2 相关系数
复习
给定n个样本点(x1,y1),(x2,y2),…(xn,yn),如 果图像上面显示它们具有线性相关关系的话,就可以
通过下面的公式计算出a,b的值,代入 y=a+bx 即可得
线性回归方程。
n
b lxy lxx
北师大版选择性必修第一册第七章2.12.2相关系数 成对数据的线性相关性分析课件(26张)
)
数学
探究点二
成对数据的线性相关性
[问题2] 两个变量Y与X的回归模型中,分别选择了4个不同的模型,它们的
相关系数r如表,其中拟合效果最好的模型是哪一个?
模型
模型1
模型2
模型3
模型4
相关系数r
0.15
0.48
0.96
0.50
∑ ( -)(-)
最小二乘估计公式分别为 b̂ ==
∑ ( -)
=
, â =- b̂ .
数学
∑ ( -)( -) .
解:(2)计算 b̂ ==
∑ ( -)
=
≈0.219,
=
â =- b̂ ≈3-0.219×11=0.591,
所以 Y 关于 X 的线性回归方程为 Y=0.219X+0.591.
令 Y=0.219X+0.591>6,解得 x>24.699≈24.70,
即实现产品销量超 6 万件,预测至少需要投入促销费用 24.70 万元.
数学
变式训练2-1:为分析人体肥胖程度对总胆固醇与空腹血糖的影响,在肥胖人
群中随机抽出8人,他们的体质指数BMI值、总胆固醇TC指标值(单位:mmol/L)、
提示:模型3.
知识点2:样本的线性相关系数满足|r|值越接近1,两个随机变量之间的线
性相关 程度越强
,|r|值越接近0,说明两个随机变量之间的线性相关
程度越弱
.我们认为两个变量存在着很强的线性相关关系,这时求线性
回归方程有必要也有意义.
北师大版选修1-2--第一章-1-1.1-回归分析--1.2-相关系数----课件(42张)
10
∑ -10
进而可以求得 b= =110
∑ 2 -10
2
=1
=
252 688-10×158.8×159.1
18 542
典例透析
题型一
题型四
题型三
题型二
由此可得≈27.4, ≈81.3,
7
∑
=1
xi2
7
= 5 414, ∑
i=1
7
= 124 393, ∑ = 18 542.
=1
7
所以 r=
∑ -7
=1
7
∑
=1
≈
2
2
2 -7
7
2
∑ 2 -7
=1
18 542-7×27.4×81.3
i
1
2
3
4
5
6
7
∑
xi
21
23
25
27
29
32
35
192
yi
7
11
21
24
66
115
325
569
xi2
yi2
441
529
625
729
841
1 024
1 225
5 414
49
121
441
576
4 356
13 225
105 625
124 393
xiyi
147
253
525
648
1 914
3 680
11 375
题型四
反思对于两个变量的数据比较多的时候判断它们之间是否线性相
关,可通过计算线性相关系数来判断.
高中数学北师大版选修1-2 1.1.2 相关系数课件(35张)
xHale Waihona Puke yi-15 x yb=i=1 2 x2 i -15 x i=1
15
=
16 076.8-15×101×10.11 161 125-15×101
2
≈0.093 7,
a= y -b x ≈10.11-0.093 7×101=0.646 3,
∴线性回归方程为y=0.646 3+0.093 7x. ∴当每单位面积施氮肥150 kg时,每单位面积蔬菜年平均产
量完全负相关.
知识点二 误差表达式
lxy Q(a,b)= [yi-(a+bxi)] =lyy+n[ y -(a+b x )] +lxx(b-l ) xx
n 2 2 i=1
l2 xy -l , xx Qmin=lyy(1-r2)(Q≥0).
知识点三 相关系数r的性质 (1)r的取值范围为 [-1,1] ; (2)|r|值越大,误差Q越小,变量之间的线性相关程度 越高 ;
≈0.750 6.
由此可看出这10名学生的两次数学成绩具有线性相关关系.
反思与感悟
利用相关系数r判断相关关系,需要应用公
式计算出r的值,由于数据较大,需要借助计算器.
跟踪训练1 假设关于某种设备的使用年限x(年)与所支出的 维修费用y(万元)有如下统计资料: x y
5 5
2 2.2
3 3.8
5
4 5.5
(3)|r|值越接近0,Q越大,变量之间的线性相关程度 越低 .
题型一
例1
利用相关系数检验两变量间的相关性
现随机抽取了某中学高一10名在校学生,他们入学时的
数学成绩(x)与入学后第一次考试的数学成绩(y)如下:
学生号 1 2 3 4 5 6 7 8 9 10
北师大版数学选修1-2同步教学课件:第1章统计案例章末复习
12345
解析 答案
3.某化妆品公司为了增加其商品的销售利润,调查了该商品投入的广告 费用x与销售利润y的统计数据如下表:
广告费用x(万元)
2
3
5
6
销售利润y(万元)
5
7
9 11
由表中数据,得线性回归方程l:y=bx+a,则下列结论正确的是
A.b<0
√C.直线l过点(4,8)
B.a<0 D.直线l过点(2,5)
第一章 统计案例
章末复习
学习目标
1.会求线性回归方程,并用回归直线进行预报. 2.理解独立性检验的基本思想及实施步骤.
内容索引
知识梳理 题型探究 达标检测
知识梳理
一、线性回归分析
1.线性回归方程
n
n
∑ xi- x yi- y ∑xiyi-n x y
i=1
i=1
n
n
在线性回归方程y=a+bx中,b=
a+bc+da+cb+d
χ2=
.
3.独立性检验 当χ2≤2.706时,没有充分的证据判定变量A,B有关联,可以认为变量A, B是没有关联的. 当χ2>2.706时,有90%的把握判定变量A,B有关联. 当χ2>3.841时,有95%的把握判定变量A,B有关联. 当χ2>6.635时,有99%的把握判定变量A,B有关联.
跟踪训练2 若某种动物由诞生算起活到20岁的概率为0.8,活到25岁的概 率为0.4,现有一只20岁的这种动物,则它能活到25岁的概率是_0_._5__. 解析 设“动物活到20岁”为事件A,“活到25岁”为事件B, 则P(A)=0.8,P(B)=0.4, 由于AB=B,所以P(AB)=P(B)=0.4. 所以 20 岁的动物活到 25 岁的概率为 P(B|A)=PPAAB=PPBA=00..48=0.5.
志鸿同步测控设计2015-2016学年北师大版数学选修1-2全册课件 1.1.1-1.1.2 回归分析--相关系数
D典例透析 S随堂演练
IANLI TOUXI
UITANGYANLIAN
-16-
1.1 回归分析 1.2 相关系数
题型一 题型二 题型三
M 目标导航 Z 知识梳理 Z 重难聚焦
UBIAODAOHANG HISHI SHULI
HONGNAN JVJIAO
D典例透析 S随堂演练
IANLI TOUXI
UITANGYANLIAN
10 i=1
∑
xi2 =38
500, ∑ xiyi=55 950
i=1
10
设所求的线性回归方程为 y=a+bx. 同时,利用上表可得
∑ xi yi -10x ������=1 b= 10 2 ∑ ������2 10 ������ ������ i=1
10
y
=
55 950-10×55×91.7 38 500-10×55
UBIAODAOHANG HISHI SHULI
HONGNAN JVJIAO
D典例透析 S随堂演练
IANLI TOUXI
UITANGYANLIAN
【做一做2-1】 判断:(正确的打“√”,错误的打“×”) (1)两个变量的相关系数r>0,则两个变量正相关. ( (2)两个变量的相关系数越大,它们的相关程度越强. ( (3)若两个变量负相关,那么其回归直线的斜率为负. ( 答案:(1)√ (2)× (3)√ ) ) )
-19-
1.1 回归分析 1.2 相关系数
题型一 题型二 题型三
M 目标导航 Z 知识梳理 Z 重难聚焦
UBIAODAOHANG HISHI SHULI
HONGNAN JVJIAO
D典例透析 S随堂演练
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
a y bx
若b>0则正相关;若b<0则负相关
但是在样本点非常多的情况下,散点图 不好做,那么我们如何来刻画他们之间是否 具有线性相关关系呢?
如何描述它们之 间线性相关关系
的强弱呢?
假设两个随机变量的取值分别是(x1,y1),(x2,y2),
…(xn,yn),则变量间线性相关系数r的计算公式如下:
1.2 相关系数
复习
给定n个样本点(x1,y1),(x2,y2),…(xn,yn),如 果图像上面显示它们具有线性相关关系的话,就可以
通过下面的公式计算出a,b的值,代入 y=a+bx 即可得
线性回归方程。
n
b lxy lxx
xi yi nx y
i 1
n
xi 2
2
nx
i 1
若r 0,则lxy
0,即 b lxy 0
lxx
,则两变量正相关;
若r 0,则 b 0,则两变量负相关;
若 r 0,则两变量不相关。
相关系数取值及其意义
完全负相关
无线性相关
完全正相关
-1.0 -0.5
0
0.5
1.0
r
负相关程度增加 正相关程度增加
1.试计算课本P9中变量的线性相关系数r。 2.计算下表中两变量的线性相关系数r:
x -5 -4 -3 0 3 4 5 y0345430
经计算后得 r=0。
y
5
通常,|r|越大,线性关系越强,用直
4
线拟合的效果就越好。一般来说 :
3 2
1
x
r∈[-1,-0.75]或[0.75,1],线性 -6 -4 -2 0 2 4 6
关系很强;
r∈[-0.75,0.75],线性关系很弱。
n
r lxy
(xi x)( yi y)
i 1
lxx l yy
n
n
(xi x)2 ( yi y)2
i 1
i 1
n
xi yi nx y
i 1
n
xi 2
2
nx
n
yi 2
2
ny
i 1
i 1
误差
Q(a,b) lyy
Qmin
lyy
lxy 2 lxx
n[ y (a bx)]2
l
yy
(1
lxy 2 lyylxx
)
lxx
(b
lxy lxx
lyy (1 r2 )
)2
lxy 2 lxx
由于 Q 0 ,所以 r2 1 ,即 r [1,1]
|r|越接近1,误差 Q 越小,变量间的线性程度越强;
|r|越接近 0,误差 Q 越大,变量间的线性程度越弱.