回归分析北师大版
高中数学北师大版选修1-2 1.1.1 回归分析课件(41张)
跟踪训练2
某研究机构对高三学生的记忆力x和判断力y进
行统计分析,得下表数据:
x 6 8 10 12
y
2
3
5
6
(1)请画出上表数据的散点图(要求:点要描粗);
解 (1)如图:
(2)请根据上表提供的数据 ,用最小二乘法求出 y 关于 x的线
性回归方程y=bx+a;
解
i=1 n
∑ xiyi=6×2+8×3+10×5+12×6=158,
题型二 求线性回归方程
例2 已知某地区4~10岁女孩各自的平均身高数据如下:
年龄x/岁
4
5
106
6
112
7
116
8
121
9
124
10
130
身高y/cm 100
求y对x的线性回归方程.
解 制表 i xi yi 1 4 100 2 5 106 3 6 112 4 7 116 5 8 121 6 9 124 7 10 130
可以用线性关系表示;
③通过线性回归方程y=a+bx,可以估计和观察变量的取值 和变化趋势; ④因为由任何一组观测值都可以求得一个线性回归方程,所 以没有必要进行相关性检验. 其中正确命题的个数是( )
A.1
B.2
C.3
D.4
解析 ①反映的正是最小二乘法思想,故正确. ②反映的是画散点图的作用,也正确. ③解释的是线性回归方程y=bx+a的作用,故也正确. ④是不正确的,在求线性回归方程之前必须进行相关性检验, 以体现两变量的关系.
B.在平面直角坐标系中用描点的方法得到表示具有相关关系 的两个量的一组数据的图形叫作散点图 C.线性回归方程最能代表具有线性相关关系的x,y之间的关系 D.任何一组观测值都能得到具有代表意义的线性回归方程
高中数学北师大选修1-2课件:第一章 §1 回归分析
2.参数 a、b 的求法
n
xi- x yi- y
i=1
n
xiyi-n x y
i=1
b=llxxxy=______i_=n_1__x_i_-__x__2___________=____i_=n_1x_2i_-__n__x_2_,a=____y_-___b_x_____.
二、相关系数
1.相关系数 r 的计算
lxxlyy
2.相关系数 r 的性质 (1)r 的取值范围为_[_-__1_,1_]__; (2)|r|值越大,误差 Q 越小,变量之间的线性相关程度越___高_____; (3)|r|值越接近 0,Q 越大,变量之间的线性相关程度越__低______.
3.相关性的分类 (1)当__r_>_0____时,两个变量正相关; (2)当__r<__0____时,两个变量负相关; (3)当_r_=__0____时,两个变量线性不相关.
解析:(1)由数据,求得 x =12, y =27,
3
∑xiyi=11×25+13×30+12×26=977,
i= 1
3
∑x2i =112+132+122=434,
i= 1
3
所以
∑xiyi-3 x b=i=1 3
1.某农科所对冬季昼夜温差大小与某反季节大豆新品种发芽多少之间的关系进行分析研
究,他们分别记录了 12 月 1 日至 12 月 5 日的每天昼夜温差与实验室每天 100 颗种子中
的发芽数,得到如下资料:
日期
12 月 1 日 12 月 2 日 12 月 3 日 12 月 4 日 12 月 5 日
温差 x(℃)
假设两个随机变量的数据分别为(x1,y1),(x2,y2),…,(xn,,yn),则变量间线性相关系
北师大版高中数学选择性必修第一册 第七章 §1 一元线性回归
年份-2 015
-4
-2
0
2
4
需求量-257
-21
-11
0
19
29
对处理的数据,设 T=X-2 015,Z=Y-257,容易算得=0,=3.2.
^
(-4)×(-21)+(-2)×(-11)+0×0+2×19+4×29-5×0×3.2
=
260
= =6.5,
40
2
2
3:Q=(y1-bx1-a)2+(y2-bx2-a)2+…+(yn-bxn-a)2.
请同学们分析比较三种模型的特点.
知识点拨
一、直线的拟合
1.如图是关于体重随身高的变化的规律,每个点对应的一对数据(xi,yi),称为
成对数据,这些点构成的图称为散点图.
2.从散点图上可以看出,如果变量之间存在着某种关系,这些点会有一个大
^ ^
线称作 Y 关于 X 的回归直线,a, b是这个线性回归方程的系数.
名师点析1.线性回归系数的求解公式还可以写成如下形式:
n
^
∑ (xi -x)(yi -y)
b = i=1 n
∑ (xi -x)2
^
^
, a = y − b x.
i=1
2.在回归分析中,利用线性回归方程求出的值不一定是真实值,很多时候只
(2)当X=200时,Y=0.72×200+6.24=150.24(微克/立方米).
所以可以预测此时PM2.5的浓度为150.24微克/立方米.
素养形成
方法优化——求线性回归方程的技巧
典例某地粮食需求量逐年上升,部分统计数据如下表:
高中数学 《回归分析》课件北师大版选修PPT75页
16、业余生活要有意义,不要越轨。——华盛顿 17、一个人即使已登上顶峰,也仍要自强不息。——罗素·贝克 18、最大的挑战和突破在于用人,而用人最大的突破在于信任人。——马云 19、自己活着,就是为了使别人过得更美好。——雷锋 20、要掌握书,莫被书掌握;要为生而读,莫为读而生。——布尔沃
END
高中数学 《回归分析》课件北师大版 选修
•
6、黄金时代是在我们的前面,而不在 我们的 后面。
•
7、心急吃不了热汤圆。
•
8、你可以很有个性,但某些时候请收 敛。
•
பைடு நூலகம்
9、只为成功找方法,不为失败找借口 (蹩脚 的工人 总是说 工具不 好)。
•
10、只要下定决心克服恐惧,便几乎 能克服 任何恐 惧。因 为,请 记住, 除了在 脑海中 ,恐惧 无处藏 身。-- 戴尔. 卡耐基 。
数学北师大课件:1.1 回归分析(三)(选修1-2)
涉及到统计的一些思想:
模型适用的总体; 模型的时间性; 样本的取值范围对模型的影响; 模型预报结果的正确理解。
2019/9/4
郑平正 制作
什么是回归分析?
(内容)
1. 从一组样本数据出发,确定变量之间的数学关 系式
2. 对这些关系式的可信程度进行各种统计检验, 并从影响某一特定变量的诸多变量中找出哪些 变量的影响显著,哪些不显著
郑平正 制作
练习 假设关于某设备的使用年限x和所支出的维修费用 y(万
元),有如下的统计资料。
2019/9/4
郑平正 制作
案例2 一只红铃虫的产卵数y和温度x有关。现
收集了7组观测数据列于表中:
温度xoC 21 23 25 27 29 32 35 产卵数y/个 7 11 21 24 66 115 325
(1)试建立产卵数y与温度x之间的回归方程;并 预测温度为28oC时产卵数目。 (2)你所建立的模型中温度在多大程度上解释了 产卵数的变化?
当x=28oC 时,y ≈44 ,指数回归
模型中温度解释了98.5%的产卵数的
2.8 2.4
2 1.6 1.2 0.8 0.4
0 0
z
36
x
9 12 15 18 21 24 27 30 33 36 39
变化
2019/9/4
郑平正 制作
最好的模型是哪个?
产卵数
400
300
200
100
0
0
5
10
15
20
n 2 i1
n2
为 2 的估计量, 2越小,预报精度越高。
(2)我们可以用相关指数R2来刻画回归的效果,其
最新-高中数学 18《回归分析》课件 北师大版选修1-2 精品
i 1
i1
i1
上式中三项平方和的意义如下:
m
( yi y)2
i1
m
( yˆi y)2
i1
m
( yi yˆi )2
i1
代表在试验范围内,观测值 yi 总 的波动情况,称此为总平方和。
代表 x 变化所引起的 y 值变化大小的量, 即yi 波动中,可以通过回归方程计算出 来的那一部分,称之为回归平方和。
如果误差服从正态分布,则概率 P(e1, e2, …, em)为:
P(e1, e2 ,, em )
1
2
exp
m(
i 1
yi
2
yˆi )2
2
(5—6)
当P最大时,求得的曲线就应当是最佳形式。从图5-1a中可以看
出,显然,此时下式应最小:
S
m
( yi
yˆi
)2
m
ei
2
i 1
i 1
(5—7)
即残差平方和最小,这就是最小二乘法原理的由来。
m
m
m
( xi )2
lxx (xi x)2 xi 2
i 1
i 1
i 1
m
m
令
m
m
( yi )2
l yy ( yi y)2 yi 2
i 1
i 1
i 1
m
5-21
m
m
m
m
( xi )( yi )
lxy (xi x)(yi y) xi yi i1
i 1
i 1
i 1
完成表5-2的计算,就可得到回归直线方程:
yˆ 3.21x 45.01 5-23
编号 1 2 3 4 5 6 7 8 9 10 11
2024_2025学年高中数学课时跟踪检测一回归分析含解析北师大版选修1_2
课时跟踪检测(一)回来分析1.已知两个有线性相关关系的变量的相关系数为r,则r取下列何值时,两个变量的线性相关关系最强( )A.-0.91 B.0.25C.0.6 D.0.86解析:选A 在四个r值中,|-0.91|最接近1,故此时,两个变量的线性相关关系最强.2.依据如下样本数据x 345678y 4.0 2.5-0.50.5-2.0-3.0 得到的回来方程为y=bx+a,则( )A.a>0,b>0 B.a>0,b<0C.a<0,b>0 D.a<0,b<0解析:选B 由表中数据画出散点图,如图.由散点图可知b<0,a>0,选B.3.设某高校的女生体重y(单位:kg)与身高x(单位:cm)具有线性相关关系,依据一组样本数据(x i,y i)(i=1,2,…,n),用最小二乘法建立的回来方程为y=0.85x-85.71,则下列结论中不正确的是( )A.y与x具有正的线性相关关系B.回来直线过样本点的中心(x,y)C.若该高校某女生身高增加1 cm,则其体重约增加0.85 kgD.若该高校某女生身高为170 cm,则可断定其体重必为58.79 kg解析:选D 由于回来直线的斜率为正值,故y与x具有正的线性相关关系,选项A中的结论正确;回来直线过样本点的中心,选项B中的结论正确;依据回来直线斜率的意义易知选项C中的结论正确;由于回来分析得出的是估计值,故选项D中的结论不正确.4.为了解某社区居民的家庭年收入与年支出的关系,随机调查了该社区5户家庭,得到如下统计数据表:收入x(万元)8.28.610.011.311.9支出y(万元) 6.27.58.08.59.8 依据上表可得回来直线方程y=bx+a,其中b=0.76,a=y-b x.据此估计,该社区一户年收入为15万元家庭的年支出为( )A .11.4万元B .11.8万元C .12.0万元D .12.2万元解析:选B 由题意知,x =8.2+8.6+10.0+11.3+11.95=10,y =6.2+7.5+8.0+8.5+9.85=8,∴a =8-0.76×10=0.4,∴当x =15时,y =0.76×15+0.4=11.8(万元).5.在一组样本数据(x 1,y 1),(x 2,y 2),…,(x n ,y n )(n ≥2,x 1,x 2,…,x n 不全相等)的散点图中,若全部样本点(x i ,y i )(i =1,2,…,n )都在直线y =12x +1上,则这组样本数据的样本相关系数为________.解析:依据样本相关系数的定义可知, 当全部样本点都在直线上时, 相关系数为1. 答案:16.某咖啡厅为了了解热饮的销售量y (个)与气温x (℃)之间的关系,随机统计了某4天的销售量与气温,并制作了比照表:________.解析:∵x =14(18+13+10-1)=10,y =14(24+34+38+64)=40,∴40=-2×10+a ,∴a =60,当x =-4时,y =-2×(-4)+60=68.答案:687.某种产品的广告费用支出x 与销售额y 之间有如下的对应数据(单位:万元).(1)(2)求回来方程;(3)据此估计广告费用支出为10万元时,销售额y 的值. 解:(1)作出散点图如下图.(2)由散点图可知,样本点近似地分布在一条直线旁边,因此,x ,y 之间具有线性相关关系.由表中的数据可知,x -=15×(2+4+5+6+8)=5,y -=15×(30+40+60+50+70)=50.所以b =∑i =15x i -x-y i -y-∑i =15x i -x-2=6.5,a =y --b x -=50-6.5×5=17.5,因此线性回来方程为y =17.5+6.5x .(3)x =10时,y =17.5+10×6.5=82.5(万元). 即当支出广告费用10万元时,销售额为82.5万元.8.某工厂为了对新研发的一种产品进行合理定价,将该产品按事先拟定的价格进行试销,得到如下数据:单价x (元) 8 8.2 8.4 8.6 8.8 9 销量y (件)908483807568(1)求回来直线方程y =bx +a ,其中b =-20,a =y -b x ;(2)预料在今后的销售中,销量与单价仍旧听从(1)中的关系,且该产品的成本是4元/件,为使工厂获得最大利润,该产品的单价应定为多少元?(利润=销售收入-成本)解:(1)x =16(8+8.2+8.4+8.6+8.8+9)=8.5,y =16(90+84+83+80+75+68)=80,从而a =y +20x =80+20×8.5=250, 故y =-20x +250.(2)由题意知, 工厂获得利润z =(x -4)y =-20x 2+330x -1 000=-20⎝⎛⎭⎪⎫x -3342+361.25,所以当x =334=8.25时,z max =361.25(元).即当该产品的单价定为8.25元时,工厂获得最大利润.9.在钢铁碳含量对于电阻的效应探讨中,得到如下数据表:碳含量x (%) 0.10 0.30 0.40 0.55 0.70 0.80 0.95 20 ℃时电阻(Ω)1518192122.623.626解:由已知数据得x -=17×∑i =17x i ≈0.543,y -=17×145.2≈20.74,∑i =17x 2i =2.595,∑i =17y 2i =3 094.72,∑i =17x i y i =85.45.∴b ≈85.45-7×0.543×20.742.595-7×0.5432≈12.46, a =20.74-12.46×0.543≈13.97.线性回来方程为y =13.97+12.46x . 下面利用相关系数检验是否显著.∑i =17x i y i -7x - y -=85.45-7×0.543×20.74≈6.62,∑i =17x 2i -7x -2=2.595-7×(0.543)2≈0.531, ∑i =17y 2i -7y -2=3 094.72-7×(20.74)2=83.687. ∴r =6.620.531×83.687≈0.993.由于r 接近于1,故钢铁碳含量对电阻的效应线性相关关系显著.。
北师大版选修1-2--第一章-1-1.1-回归分析--1.2-相关系数----课件(42张)
10
∑ -10
进而可以求得 b= =110
∑ 2 -10
2
=1
=
252 688-10×158.8×159.1
18 542
典例透析
题型一
题型四
题型三
题型二
由此可得≈27.4, ≈81.3,
7
∑
=1
xi2
7
= 5 414, ∑
i=1
7
= 124 393, ∑ = 18 542.
=1
7
所以 r=
∑ -7
=1
7
∑
=1
≈
2
2
2 -7
7
2
∑ 2 -7
=1
18 542-7×27.4×81.3
i
1
2
3
4
5
6
7
∑
xi
21
23
25
27
29
32
35
192
yi
7
11
21
24
66
115
325
569
xi2
yi2
441
529
625
729
841
1 024
1 225
5 414
49
121
441
576
4 356
13 225
105 625
124 393
xiyi
147
253
525
648
1 914
3 680
11 375
题型四
反思对于两个变量的数据比较多的时候判断它们之间是否线性相
关,可通过计算线性相关系数来判断.
1.1《回归分析》ppt-北师大版选修课件
回归分析:对具有相关关系的两个变量进行统 计分析的一种常用方法。
一、温故知新,引入新课
【问题】在一次对人体脂肪含量和年龄关系的研究中,研 究人员获得了一组样本数据:
年龄 23 27 39 41 45 49 50
脂肪 9.5 17.8 21.2 25.9 27.5 26.3 28.2
一、温故知新,引入新课
线性回归方程: y? ? b?x ? a?
? ? ? ?? 其中:
n
n
(x ? x)(y ? y) x y ? nx y
i
i
ii
b ? i?1
? i?1
,
n
(x ? x)2
n x2 ? nx 2
i
i
i?1
i?1
a ? y ? bx
回归直线一定经过样本 点的中心( x, y)。
第一章 统计案例
1.1回归分析的基本思想及其初步应用(1)
一、温故知新,引入新课
必修3(第二章 统计)知识结构
收集数据
(随机抽样 )
整理、分析数据 估计、推断
用样本估计总体 变量间的相关关系
简 分 系 用样本 用样本
线
单层 统 随抽 抽 机样 样 抽
的频率 分布估 计总体
数字特 征估计 总体数
性 回 归 分
一、温故知新,引入新课 回忆2:若两个变量之间的关系是一种非确定性关系,称
之为 相关关系 ,那么相关关系的含义如何?
两个变量间 存在着某种关系,但带有 不确定性 (随机性), 不能用函数关系精确地表达出来,我 们说这两个变量具有相关关系 .
注:相关关系和函数关系的异同点 相同点:两者均是指两个变量间的关系 不同点:函数关系是一种确定关系,
3.1《回归分析》课件(北师大版选修2-3)
5.下表是某厂~4月份用水量(单位:百吨)的一组数据,
由某散点图可知,用水量y与月份x之间有较好的线性相关关系,
并且其线性回归方程是y=-0.7x+a,则a=_____.
【解题提示】由 a=y-b x 即可求得a的值.
【解析】x=2.5,y=3.5, b=-0.7,
∴a=3.5-(-0.7)×2.5=5.25.
题精析
知能巩固提升
一、选择题(每题5分,共15分) 1.下列变量之间的关系是相关关系的是( )
(A)某家庭一个月的电费与用电量
(B)小麦的产量与施肥量 (C)圆的面积与半径
(D)角的余弦值与它的弧度数
答案:5.25
三、解答题(6题12分,7题13分,共25分) 6.有人统计了同一个省的6个城市某一年的人均国内生产总值 (即人均GDP)和这一年各城市患白血病的儿童数量,如下表:
(1)画出散点图;
(2)求y对x的线性回归方程;
(3)如果这个省的某一城市同时期年人均GDP为12万元,估计 这个城市一年患白血病的儿童数目.
≈381,估计这个城市一年患白血病的儿童数目约为381.
7.下表提供了某厂节能降耗技术改造后生产甲产品过程中记录 的产量x(吨)与相应的生产能耗y(吨标准煤)的几组对照数 据
(1)请画出上表数据的散点图;
(2)请根据上表提供的数据,求出y关于x的线性回归方程
y=a+bx; (3)已知该厂技术改造前100吨甲产品能耗为90吨标准煤; 试根据(2)求出的线性回归方程,预测生产100吨甲产品的 生产能耗比技术改造前降低多少吨标准煤?
产品的生产能耗比技术改造前降低19.65吨标准煤.
1.(5分)(2010·湖南高考)某商品销售量y(件)与销售价 格x(元/件)负相关,则其回归方程可能是( (A)ˆ =-10x+200 y
高中数学新北师大版精品教案《1.1回归分析》
高中数学北师大版选修2-3第三章统计案例 第一课时 1.1回归分析教学目标(1)掌握和了解相关关系的概念以及回归分析的基本思想;(2)通过对回归模型的合理性等问题的研究,渗透线性回归分析的思想和方法; (3)能求出简单实际问题的线性回归方程.教学重点、难点:了解回归分析的基本思想,会对两个变量进行回归分析,明确建立回归模型的基本步骤,并对具体问题进行回归分析,解决实际应用问题。
教学过程: 一、复习准备:1. 提问:就目前为止,我们学过变量间的哪些关系?2. 复习:(1)函数关系:函数关系是一种确定性的关系,即对于自变量的每一个值,因变量都有唯一确定的值与之相对应.(2)相关关系:相关关系是一种非确定性关系,即当自变量取值一定时,因变量的取值带有一定的随机性。
然后引出回归分析的定义:回归分析是对具有相关关系的两个变量进行统计分析的方法。
二、讲授新课:探究:对于一组具有线性相关关系的数据:(11,x y ) , (22,x y ) ,…, (,n n x y ), 根据必修3的学习,我们知道能够利用最小二乘估计法求出对应的线性回归方程。
称为线性回归方程。
这样得到的直线方程:由最小二乘法可以求得表示用表示用bx a y xb y a x n x yx n yx x x y y x xb ny y y y nx x x x ni ini iini i ni i inn+=-=--=---=++++∑∑∑∑====,)())((,,12211212121强调:b>0是正相关,b<0是负相关。
注意:(1)回归直线方程y=a+bx 经过样本点的中心),y x (,点),y x (称为样本点的中心,回归直线一定经过此点;(2)线性回归方程中的截距a 和斜率b 都是通过样本估计而得来的,存在着一定误差。
这种误差可能导致预测结果的偏差;(3)回归直线方程y=a+bx 中的b 表示x 增加1个单位时y 的变化量; (4)可以利用回归直线方程y=a+bx 预测在x 取某一个值时,y 的估计值。
高中数学 北师大选修4-4 1.1《回归分析》课时2 课件
观察它们之间的关系.
100 50
0
20 22 24 26 28 30 32 34 36 温度
(1)是否存在线性关系?
图1.1 4
非线性关系
(2)散点图具有哪种函数特征?
指数函数、二次函数、三次函数
(3)以指数函数模型为例,如何设模型函数?
非线性回归模型
设指数函数曲线 y c1其ec中2x 和 c是1 待c定2 参数。 现在问题变为如何估计待定参数 c和1 ?c2 我们可以通过对数变换把指数关系变为线性关系 令 z ln y 则变换后样本点分布在直线的周围。 z bx a(a lnc1,b c2 ) 这样就可以利用线性回归模型来建立z与 x回归模型, 进而找到y与x的非线性回归方程 。
xi x yi y
i1
xiyi nx y
i1
.
n
2n
2
xi x yi y
(
n
x
2 i
n
x
2
)(
n
yi2
Hale Waihona Puke n2y)
i1
i1
i1
i1
(7)相关系数r与R2 (1)R2是相关系数的平方,其变化范围为[0,1],而相关系 数的变化范围为[-1,1]. (2)相关系数可较好地反映变量的相关性及正相关或负 相关,而R2反映了回归模型拟合数据的效果. (3)当|r|接近于1时说明两变量的相关性较强,当|r|接 近于0时说明两变量的相关性较弱,而当R2接近于1时,说 明线性回归方程的拟合效果较好.
表 1-5 是 红 铃 虫 的 产 卵 数 和 对 应 的 温 度 的 平 方 , 图 1.1-6是相应的散点图.
表1 5
t 441 529 625 729 841 1024 1225 y 7 11 21 24 66 115 325
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
百万元)之间有如下的对应关系:x 2 4 6 8( Nhomakorabea)
y
30
40
50
70
判断x与y之间是否存在线性相关关系.
解:画出(x,y)的散点图,如图所示,由图可知x,y呈现 线性相关关系.
- x =5,- y =47.5, x2 i =120,
i=1 4 4
4
y2 i =9 i=1
900, xiyi=1 080,
1.(2011· 辽宁高考)调查了某地若干户家庭的年收入x(单位:
万元)和年饮食支出y(单位:万元),调查显示年收入x与年 饮食支出y具有线性相关关系,并由调查数据得到y对x的线 性回归方程:y=0.254x+0.321.由线性回归方程可知,家 庭年收入每增加1万元,年饮食支出平均增加________万
n
2
* r 值越大,误差 Q 越小,则变量的线性相关程度
就越高; r 值越接近于0,Q 越大,线性相关程度就
越低。 * 当 r 0 时,两变量正相关;当 r 0 时,两变量 负相关;当 r 0 时,两变量线性不相关。
4.对四对变量y和x进行线性相关检验,已知n是观测值组 数,r是相关系数,且已知:
拓展思考
相关系数r越大,变量间的线性关系就越 强,那么r的值究竟大到什么程度就认为线性 关系较强??
相关系数
n (xi -x)(yi -y) i=1 r= n n 2 2 (xi -x) × (yi -y) i=1 i=1
r>0正相关;r<0负相关.通常, r∈[-1,-0.75]——负相关很强; r∈[0.75,1]——正相关很强; r∈[-0.75,-0.3]——负相关一般; r∈[0.3, 0.75]——正相关一般; r∈[-0.25, 0.25]——相关性较弱;
i=1
i=1
x - y xiyi-4-
4
r=
4 2 2 2 - xi -4- x y2 - 4 y i i=1 i=1
4
1 080-4×5×47.5 = 120-4×529 900-4×47.52 ≈0.982 7. 故 x 与 y 之间存在线性相关关系.
复习回顾
* 线性相关系数r及性质:
正相关
负相关
思考交流
对于课本P73给出的例题,变量的线性相关系数r 如何求? 我们知道,相关系数的计算公式为:
r
x y
i 1 i 2 2 x n x i i 1 n
n
i
nx y
2 2 y n y i i 1
n
n 2 i n
n
2 x y 要求r,只需求出相关的量: xi yi , , i ,
(3)写回归直线方程 y a bx,并用方程进 行预测说明.
新课探究
任何数据,不管它们的线性相关关系如何,都
可以用最小二乘法求出线性回归方程,为使建立的
线性回归方程有意义,在利用最小二乘法求线性回 归方程之前,先要对变量间的线性相关关系作个判 断,通常可以作散点图。但在某些情况下,从散点 图中不容易判断变量间的线性关系,另外,如果数
据量较大时,画散点图比较麻烦,此时我们有没有
其他方法来刻画变量之间的线性相关关系呢?
新课探究
为解决这个问题,我们可通过计算线性相关系数
r,来判断变量间相关程度的大小,计算公式为:
r lxy lxxl yy
( x x )( y y )
i 1 i i 2 ( x x ) i i 1 n 2 ( y y ) i i 1 n
yi
0 3 4 5 4 3 0 19
x
2 i
y
0 9
2 i
xi yi
0 -12 -12 0 12 12 0 0
25 16 9 0 9 16 25 100
16 25 16 9 0 75
由表可知:
2 2 x 1 00 , y i i 75 , xi yi 0 ,
n
n
n
i 1
i 1
(2)如果y与x之间具有线性相关关系,求线性回归方程.
解:(1)散点图如图.
(2)由散点图可知,y 与 x 呈相关关系,设线性回归方程 为 y=bx+a.
5 2 - 经计算, 得- x =6, y =210.4, xi =220, xiyi=7 i=1 i=1
5
790.
7 790-5×6×210.4 ∴b= =36.95, 2 220-5×6 a=210.4-36.95×6=-11.3. ∴线性回归方程为 y=36.95x-11.3.
相关关系的测度
(相关系数取值及其意义)
完全负相关 无线性相关 完全正相关
-1.0
-0.5
0
+0.5
正相关程度增加
+1.0
r
负相关程度增加
小结
* 线性相关系数r:
r
x y
i 1 i
n
i
nx y
2 2 y n y i i 1 n
,其中 1 r 1 。
x nx
i 1 2 i
x 和 y 。
i 1
i 1
i 1
由数据表,经过计算,可知(P77):
2 2 y x 17633 x y 20040 i i , i , i 22790,
i 1
i 1
n
n
n
i 1
330 291 66 ,可得 x 58.2 , y 5 5
r
20040 5 58.2 66
相关系数
1.计算公式
r=
(x
i=1
n
i
- x)(yi - y)
2
(x
i=1
n
i
- x)
(y
i=1
n
2
x y
i 1 i
n
i
nxy
i
- y)
x
i 1
n
2 i
nx
2
y
i 1
n
2 i
ny 2
2.相关系数的性质 (1)|r|≤1; (2)|r|越接近于1,相关程度越大;|r|越接近 于0,相关程度越小. 问题:达到怎样程度,x、y线性相关呢?它们 的相关程度怎样呢?
就越高; r 值越接近于0,Q 越大,线性相关程度就
越低。 相关系数r的性质
当 r 0 时, b 0 ,两变量的值总体上呈现同
时增加的趋势,则称两变量正相关;
当 r 0 时, b 0 ,一变量增加,另一变量有 减小的趋势,则称两变量负相关; 当 r 0 时,则称两变量线性不相关。
y=bx +a
( xi x)( yi y ) xi yi nx y i 1 i 1 b n n 2 2 2 ( x x ) x n ( x ) i i i 1 i 1 a y bx 1 n 1 n y yi x xi 其中 n i 1 n i 1
新课讲解
下表按年份给出了1981~2001年我国出口贸易 量(亿美元)的数据,根据此表你能预测2008年我 国的出口贸易量么?
回归分析的基本思想及其初步应用
3.1.1
回归分析
回顾复习 问题1:现实生活中两个变量间的关系有哪些呢? 不相关 1、两个变量的关系
函数关系
线性相关 相关关系
非线性相关 相关关系:对于两个变量,当自变量取值一定 时,因变量的取值带有一定随机性的两个变量 之间的关系。
思考:相关关系与函数关系有怎样的不同?
答案:C
复习回顾
* 用线性回归方程进行回归分析: (1)画散点图;
(2)求回归系数 a , b :
b
(x
i 1 n
n
i
x )( yi y )
2 ( x x ) i i 1
x y
i 1 n i i 1
n
i
nx y
2 2 x n x i
a y bx
r
x y
i 1 i
n
i
nx y
2 2 y n y i i 1 n
x nx
i 1 2 i
n
,其中 1 r 1 。
2
* r 值越大,变量的线性相关程度就越高; r 值越接近于0,线性相关程度就越低。
* 当 r 0 时,两变量正相关; 当 r 0 时,两变量负相关; 当 r 0 时,两变量线性不相关。
①n=7,r=0.953 3;②n=15,r=0.301 2;
③n=17,r=0.499 1;④n=3,r=0.995 0. 则变量y和x线性相关程度最高的两组是 A.①和② C.②和④ 程度越高,故选B. 答案:B B.①和④ D.③和④ ( )
解析:相关系数r的绝对值越大,变量x,y的线性相关
5.某厂的生产原料耗费x(单位:百万元)与销售额y(单位:
i 1
x 0 ,y 2.71,则可得
r 0 7 0 2.71 100 7 0 2 75 7 2.712 0
你发现什么了?? r=0,则变量间并不存在线性相关关系。即此时 建立线性回归方程是没有意义的。
实际上,从散点图上我们也可以验证这一点:
易看出,几个样本点都落在同一个半圆上,而不 是条状分布,此时建立线性回归方程无任何意义,这 与相关系数r的计算结果相一致。
n
x y nxy
i 1 i i 2 2 x nx i i 1 n 2 2 y ny i i 1 n
n
新课探究
据前面的分析,回归系数 a , b 使得误差