人教版·选修1-2 §1.1.1 回归分析

合集下载

高中数学人教版选修1-2全套教案

高中数学人教版选修1-2全套教案

高中数学人教版选修1-2全套教案第一章统计案例第一课时 1.1回归分析的基本思想及其初步应用(一)教学目标1、知识与技能目标 认识随机误差;2、过程与方法目标(1)会使用函数计算器求回归方程; (2)能正确理解回归方程的预报结果. 3、情感、态度、价值观通过本节课的学习,加强数学与现实生活的联系,以科学的态度评价两个变量的相关性,理解处理问题的方法,形成严谨的治学态度和锲而不舍的求学精神.培养学生运用所学知识,解决实际问题的能力.教学中适当地利用学生合作与交流,使学生在学习的同时,体会与他人合作的重要性.教学重点:了解线性回归模型与函数模型的差异,了解判断刻画模型拟合效果的方法-相关指数和残差分析. 教学难点:解释残差变量的含义,了解偏差平方和分解的思想. 教学过程: 一、复习准备:1. 提问:“名师出高徒”这句彦语的意思是什么?有名气的老师就一定能教出厉害的学生吗?这两者之间是否有关?2. 复习:函数关系是一种确定性关系,而相关关系是一种非确定性关系. 回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法,其步骤:收集数据→作散点图→求回归直线方程→利用方程进行预报. 二、讲授新课: 1. 教学例题:① 例1 从某大学中随机选取8名女大学生,其身高和体重数据如下表所示: 编 号 1 2 3 4 5 6 7 8 身高/cm165165 157 170 175 165 155 170 体重/kg 4857505464614359求根据一名女大学生的身高预报她的体重的回归方程,并预报一名身高为172cm 的女大学生的体重. (分析思路→教师演示→学生整理)第一步:作散点图第二步:求回归方程 第三步:代值计算010203040506070150155160165170175180身高/cm体重/k g② 提问:身高为172cm 的女大学生的体重一定是60.316kg 吗? 不一定,但一般可以认为她的体重在60.316kg 左右. ③ 解释线性回归模型与一次函数的不同事实上,观察上述散点图,我们可以发现女大学生的体重y 和身高x 之间的关系并不能用一次函数y bx a =+来严格刻画(因为所有的样本点不共线,所以线性模型只能近似地刻画身高和体重的关系). 在数据表中身高为165cm 的3名女大学生的体重分别为48kg 、57kg 和61kg ,如果能用一次函数来描述体重与身高的关系,那么身高为165cm 的3名女在学生的体重应相同. 这就说明体重不仅受身高的影响还受其他因素的影响,把这种影响的结果e (即残差变量或随机变量)引入到线性函数模型中,得到线性回归模型y bx a e =++,其中残差变量e 中包含体重不能由身高的线性函数解释的所有部分. 当残差变量恒等于0时,线性回归模型就变成一次函数模型. 因此,一次函数模型是线性回归模型的特殊形式,线性回归模型是一次函数模型的一般形式.2. 相关系数:相关系数的绝对值越接近于1,两个变量的线性相关关系越强,它们的散点图越接近一条直线,这时用线性回归模型拟合这组数据就越好,此时建立的线性回归模型是有意义.3. 小结:求线性回归方程的步骤、线性回归模型与一次函数的不同.第二课时 1.1回归分析的基本思想及其初步应用(二)教学目标:1知识与技能:会建立回归模型,进而学习相关指数(相关系数r 、总偏差平方和、随机误差的效应即残差、残差平方和、回归平方和、相关指数R2、残差分析) 2过程与方法:通过学习会求上述的相关指数3情感态度价值观:从实际问题发现已有知识不足,激发好奇心、求知欲。

选修1-2 1.1-回归分析的基本思想及其初步应用

选修1-2  1.1-回归分析的基本思想及其初步应用

几点说明: 身高 /cm 165
第一个样本点和第6个样本点的残差比较大,需要确认在采集过程中是否有人为的错误。 如果数据采集有错误,就予以纠正,然后再重新利用线性回归模型拟合数据;如果数据采 48 57 50 54 64 61 43 59 体重/kg 集没有错误,则需要寻找其他的原因。 另外,残差点比较均匀地落在水平的带状区域中,说明选用的模型计较合适,这样的带 预报体 54.373 54.373 47.581 58.618 62.863 54.373 45.883 58.618 状区域的宽度越窄,说明模型拟合精度越高,回归方程的预报精度越高。 重
预报体 54.373 54.373 47.581 58.618 62.863 54.373 45.883 58.618 重
残差
-6.373 2.627 2.419 -4.618 1.137 6.627 -2.883 0.382
你会计算上面的总体偏差平方和、残差平方和、回归平方和吗?
354
128.361
残差
-6.373
2.627
2.419
-4.618
1.137
6.627
-2.883
0.382
异 常 点
• 错误数据 • 模型问题
如何发现数据中的错误?如何衡量随机模型的拟合效果?
1)计算 ei y b x a ( (i=1,2,...n) i i 残差分析( 2)画残差图 ( 1)查找异常样本数据 (3)分析残差图( 2)残差点分布在以O为中心的水平带状区域,并沿 水平方向散点的分布规律相同。
R2
0.98 0.80
由图的对比可以看出,指数模拟优于线性模拟
回 归 分 析 基 本 思 想 及 其 初 步 应 用

新课标人教A版高中数学选修1-2 《1.1 回归分析的基本思想及其初步应用》(共45张PPT)

新课标人教A版高中数学选修1-2 《1.1 回归分析的基本思想及其初步应用》(共45张PPT)
在本例中,根据上面的公式,可以得到 ˆ = 0.849,a ˆ = -85.712. b ˆ = 0.849 x - 85.712. 于是得到线性回归方程y
n
n
ˆ = 0.849是回归直线的斜率的估计值,说明身高x b 每增加1个单位,体重y就增加0.849个单位,这表明体重 与身高具有正的线性相关关系.
图1.1 1
ˆ 和a ˆ, 未知参数 b 和 a 的最小二乘估计分别为 b 其计算公式如下:
ˆ b
x
i 1 n
n
i
x yi y
i
x
i 1
x
,
2
ˆ x, ˆ = y-b a
1 1 其中 x = xi ,y = yi . x,y 称为样本点 的 中心 . n i=1 n i=1
思考:如何发现数据中的错误?如何衡量模型的拟 合效果? 可以通过残差发现原始数据中的可疑数据,判 断所建立模型的拟合效果.下表列出了女大学生身 高和体重的原始数据以及相应的残差数据.
编号 1 2 3 4 170 5 6 7 155 8 170
身 高 / cm 165
165 157
175 165
体 重 / kg 48 57Fra bibliotek50 54 64 61 43 59 ˆ 6 .373 2 .627 2 .419 4 .618 1 .137 6 .627 2 .883 0 .382 残 差e
我们可以利用图形来分析残差特性.作图时纵 坐标为残差, 横坐标可以选为样本编号, 或身高数据, 或 体重估计值等, 这样作出的图形为残差图.下图 是以 样本编号为横坐标的残差图.
所以 ,对身高为 172 cm的女大学生 , 由回归方程可以 预报其体重为 ˆ = 0.849 172 - 85.712 = 60.316 ( kg) . y

高中数学人教a版选修1-2课件:第一章 1.1 回归分析的基本思想及其初步应用

高中数学人教a版选修1-2课件:第一章 1.1 回归分析的基本思想及其初步应用

(3)线性回归模型 线性回归模型用 y=bx+a+e 来表示,其中 a 和 b 为模型 的 未知参数,e 称为随机误差. (4)刻画回归效果的方式 残差 把随机误差的估计值^ e i 称为相应 于点(xi,yi)的残差 作图时纵坐标为 残差 ,横坐标 残差图 可以选为样本编号,或身高数 据,或体重估计值等,这样作出 的图形称为残差图
(2)所有的两个相关变量都可以求回归 方程吗?
Hale Waihona Puke 提示:不一定.2.归纳总结,核心必记 (1)回归分析 回归分析是对具有 相关关系 的两个变量进行统计分 析的一种常用方法. (2)回归直线方程 方程^ y =^ b x+^ a 是两个具有线性相关关系的变量的一 组数据(x1,y1),(x2,y2),…,(xn,yn)的回归方程,其中^ a, ^ b 是待定参数,其最小二乘估计分别为:
xiyi 60 160 300 300 560 1 380
5 25 250 所以, x = =5, y = =50, x2 i =145, 5 5 i= 1
xiyi=1 380.
i= 1
5
x- y xiyi-5- 于是可得^ b=
i= 1 5 2 x2 i -5 x i= 1
5
1 380-5×5×50 = =6.5, 2 145-5×5 ^ a =- y -^ b- x =50-6.5×5=17.5. 所以所求的线性回归方程为^ y =6.5x+17.5.
n 2 (2)计算 x , y , xi , xiyi; i= 1 i= 1

n

(3)代入公式计算^ a ,^ b 的值; (4)写出线性回归方程.
讲一讲 1.(链接教材 P2-例 1)某种产品的广告费用支出 x 与 销售额 y(单位:百万元)之间有如下的对应数据: x/百万元 2 4 5 6 8

2019年人教版选修1-2高中数学1.1回归分析的基本思想及其初步应用优质课课件

2019年人教版选修1-2高中数学1.1回归分析的基本思想及其初步应用优质课课件
回顾复 习
必修3(第二章 统计)知识结构
整理、分析数据 估计、推断 用样本估计总体 变量间的相关关系
收集数据
(随机抽样)
简 单 随 机 抽 样
分 层 抽 样
系 统 抽 样
用样本 的频率 分布估 计总体 分布
用样本 数字特 征估计 总体数 字特征
线 性 回 归 分 析
回顾复 习 问题1:现实生活中两个变量间的关系有哪些呢?
法一:我们可以通过残差分析发现原始数据中的可疑数据, 判断建立模型的拟合效果。
(1)计算 ei yi b xi a (i=1,2,...n) 残差分析( 2)画残差图 ①查找异常样本数据 3)分析残差图 ( ②残差点分布在以x轴为中心的水平带状区域,并沿 水平方向散点的分布规律相同。
3.
7.
y=bx+a
4.
用回归直线方程 解决应用问题
8. 9.
自学指 导
阅读课本1页—6页思考回答下列问题
(注意:时间12分钟)
1:结合例1得出线性回归模型及随机误差,并且区分 函数模型和回归模型。
2:在线性回归模型中,e是用bx+a预报真实值y的随 机误差,它是一个不可观测的量,那么应如何研究随机 误差呢? 3:如何发现数据中的错误?如何衡量随机模型的拟合效 果? 4:结合例1思考:用回归方程预报体重时应注意什 么? 5:归纳建立回归模型的基本步骤。
残差图的制作和作用: 制作:坐标纵轴为残差变量, 横轴可以有不同的选择.可以为编号;可以为解释变 量 作用:判断模型的适用性若模型选择的正确,残差图中 的点应该分布在以横轴为中心的水平带状区域.
下面表格列出了女大学生身高和体重的原始数据以及相应的残差数

新人教A版(选修1-2)1.1《回归分析的基本思想及其初步应用》ppt课件2

新人教A版(选修1-2)1.1《回归分析的基本思想及其初步应用》ppt课件2

2
3
4
5
6
维修费用y
2.2
3.8
5.5
6.5
7.0
若由资料知,y对x呈线性相关关系。试求:
(1)线性回归方程 yˆ bˆx aˆ 的回归系数 aˆ、bˆ ;
(2)求残差平方和;
R (3)求相关系数 2;
(4)估计使用年限为10年时,维修费用是多少?
一般地,建立回归模型的基本步骤为:
(1)确定研究对象,明确哪个变量是解析变量,哪个变量 是预报变量。
线性关系
方案2
产卵数
400
300
200
100


0
-40 -30 -20 -10 0 -100
10 20 30 40
-200
方案2解答
平方变换:令t=x2,产卵数y和温度x之间二次函数模型y=bx2+a 就转化为产卵数y和温度的平方t之间线性回归模型y=bt+a
温度
21
23
25
27
29
32
35
温度的平方t 441
在统计中,我们也把自变量x称为解析变量,因变 量y为预报变量。
残差
数据点和它在回归直线上相应位置的差异 称为相应于点(xi,yi ) 的残差。
ei =yi
yi
例:编号为6的女大学生,计算随机误差的效应(残差)
61 (0.849165 85.712) 6.627
残差平方和
把每一个n 残差所得的值平方后加起来,用数学符号表





体 重



• 错误数据

• 模型问题
我们可以用相关指数R2来刻画回归的效果,其计算公式是

人教A版选修1-2----1.1-回归分析的基本思想及其初步应用----课件(49张)

人教A版选修1-2----1.1-回归分析的基本思想及其初步应用----课件(49张)

方法技巧 求线性回归方程的基本步骤 (1)列出散点图,从直观上分析数据间是否存在线性相关关系;
n
n
n
(2)计算: x , y ,x2i ,y2i ,xiyi;
i=1
i=1
i=1
(3)代入公式求出^y =^b x+^a 中参数^b ,^a 的值; (4)写出线性回归方程并对实际问题作出估计.
提醒:只有在散点图大致呈线性时,求出的回归方程才有实际意义,否则求出的回归 方程毫无意义.
相应的散点图如图 2.
z 1.79 2.48 3.22 3.89 4.55 5.25
从图 2 可以看出,变换后的样本点分布在一条直线附近,因此可以用线性回归方程来
拟合.
6
xi- x zi- z
i=1
由^b=
≈0.69,
6
xi- x 2
i=1
^a= z -^b x =1.115,得^z =0.69x+1.115; 则有^y =e0.69x+1.115.
其中 x =
n1i=n1xi , y n1i=n1yi ,( x , y )称为样本点的 中心 .
知识点二 线性回归分析 预习教材P3-8,思考并完成以下问题 (1)利用什么方法判断所建立的线性模型的拟合效果? 提示:利用残差.
(2)由散点图知,残差有正、负,如何更好地判断拟合效果?
n
提示:利用残差平方和,即 (yi-^yi)2 越小,R2 越大,拟合效果越好.
5
xiyi=1 380.
i=1
5
xiyi-5 x y
i=1
于是可得^b=
5
xi2-5 x 2
i=1
=1 318405--55××55×2 50=6.5,

人教A版高中选修1-2《1.1回归分析的基本思想及其初步应用》课件

人教A版高中选修1-2《1.1回归分析的基本思想及其初步应用》课件

2 y - y i
n
=1-0=1.
1
2
3
4
5
解析
答案
4.面对竞争日益激烈的消费市场,众多商家不断扩大自己的销售市场, 以降低生产成本 .某白酒酿造企业市场部对该企业 9 月份的产品销量 x(单 位:千箱 ) 与单位成本 y( 单位:元 ) 的资料进行线性回归分析,结果如下:
6 6 7 2 x =2, y =71, xi =79, xiyi=1 481.则销量每增加 1 000 箱,单位成 i=1 i=1
^
a= y -b x =4-2×1.5=1, 故y=2x+1.
^
^
1
2
3
4
5
解答
回归分析的步骤
规律与方法
(1)确定研究对象,明确哪个变量是解释变量,哪个变量是预报变量;
(2)画出确定好的解释变量和预报变量的散点图,观察它们之间的关系
(如是否存在线性关系等);
(3)由经验确定回归方程的类型(如果呈线性关系,则选用线性回归方程 y=bx+a);
^ ^ ^
(4)按一定规则估计回归方程中的参数; (5)得出结果后分析残差图是否有异常(个别数据对应的残差过大,或残 差呈现不随机的规律性等),若存在异常,则检查数据是否有误或模型是 否合适等.
本课结束
R2=1-
i=1
2 y - y i
,R2表示 解释 变量对于 预报 变量变
化的贡献率,R2越接近于1,表示回归的效果越好
题型探究
类力x和判断力y进行统计分析,得下表
数据: x y 6 2 8 3 10 5 12 6
(1)请画出上表数据的散点图;
答案
3.若一组观测值(x1,y1),(x2,y2),…,(xn,yn)之间满足yi=bxi+a+ei 1 (i=1,2,…,n),且ei恒为0,则R2为_____.

2017-2018学年高中数学人教A版选修1-2:第一章 1.1 回归分析的基本思想

2017-2018学年高中数学人教A版选修1-2:第一章 1.1 回归分析的基本思想

回归分析的基本思想及其初步应用预习课本P2~8,思考并完成以下问题 1.什么是回归分析?2.什么是线性回归模型?3.求线性回归方程的步骤是什么?[新知初探]1.回归分析 (1)回归分析回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法. (2)回归方程的相关计算对于两个具有线性相关关系的变量的一组数据(x 1,y 1),(x 2,y 2),…,(x n ,y n ).设其回归直线方程为y ^=b ^x +a ^,其中a ^,b ^是待定参数,由最小二乘法得b ^=∑i =1n (x i -x )(y i -y )∑i =1n(x i -x )2=∑i =1nx i y i -nx y∑i =1nx 2i -n x2,a ^=y -b ^x . (3)线性回归模型线性回归模型⎩⎪⎨⎪⎧y =bx +a +e ,E (e )=0,D (e )=σ2,其中a ,b 为模型的未知参数,通常e 为随机变量,称为随机误差.x 称为解释变量,y 称为预报变量.[点睛] 对线性回归模型的三点说明(1)非确定性关系:线性回归模型y =bx +a +e 与确定性函数y =a +bx 相比,它表示y 与x 之间是统计相关关系(非确定性关系),其中的随机误差e 提供了选择模型的准则以及在模型合理的情况下探求最佳估计值a,b的工具.(2)线性回归方程y^=b^x+a^中a^,b^的意义是:以a^为基数,x每增加1个单位,y相应地平均增加b^个单位.2.线性回归分析(1)残差:对于样本点(x i,y i)(i=1,2,…,n)的随机误差的估计值e^i=y i-y^i称为相应于点(x i,y i)的残差,∑i=1n(y i-y^i)2称为残差平方和.(2)残差图:利用图形来分析残差特性,作图时纵坐标为残差,横坐标可以选为样本编号,或身高数据,或体重的估计值等,这样作出的图形称为残差图.(3)R2=1-∑i=1n(y i-y^i)2∑i=1n(y i-y)2越接近1,表示回归的效果越好.[小试身手]1.判断下列命题是否正确.(正确的打“√”,错误的打“×”)(1)残差平方和越小,线性回归方程的拟合效果越好.()(2)在画两个变量的散点图时,预报变量在x轴上,解释变量在y轴上.()(3)R2越小,线性回归方程的拟合效果越好.()答案:(1)√(2)×(3)×2.从散点图上看,点散布在从左下角到右上角的区域内,两个变量的这种相关关系称为________.答案:正相关3.在残差分析中,残差图的纵坐标为________.答案:残差4.如果发现散点图中所有的样本点都在一条直线上,则残差平方和等于________,解释变量和预报变量之间的相关系数等于________.答案:01或-1求线性回归方程[典例]某研究机构对高三学生的记忆力x和判断力y进行统计分析,得下表数据x 681012y 235 6(1)请画出上表数据的散点图;(2)请根据上表提供的数据,用最小二乘法求出y关于x的线性回归方程y^=b^x+a^;(3)试根据求出的线性回归方程,预测记忆力为9的同学的判断力.[解](1)散点图如图:(2)∑i=1nx i y i=6×2+8×3+10×5+12×6=158,x=6+8+10+124=9,y=2+3+5+64=4,∑i=1nx2i=62+82+102+122=344.b^=158-4×9×4344-4×92=1420=0.7,a^=y-b^x=4-0.7×9=-2.3,故线性回归方程为y^=0.7x-2.3.(3)由(2)中线性回归方程知,当x=9时,y^=0.7×9-2.3=4,故预测记忆力为9的同学的判断力约为4.求线性回归方程的三个步骤(1)画散点图:由样本点是否呈条状分布来判断两个量是否具有线性相关关系.(2)求回归系数:若存在线性相关关系,则求回归系数.(3)写方程:写出线性回归方程,并利用线性回归方程进行预测说明.[活学活用]某工厂1~8月份某种产品的产量与成本的统计数据见下表:月份12345678产量(吨)5.66.06.16.47.07.58.08.2成本(万元)130136143149157172183188(1)画出散点图;(2)y与x是否具有线性相关关系?若有,求出其回归方程.解:(1)由表画出散点图,如图所示.(2)从上图可看出,这些点基本上散布在一条直线附近,可以认为x和y线性相关关系显著,下面求其回归方程,首先列出下表.x i y i x2i x i y i15.613031.36728.026.013636.00816.036.114337.21872.346.414940.96953.657.015749.00 1 099.067.517256.25 1 290.078.018364.00 1 464.088.218867.24 1 541.6∑54.8 1 258382.028 764.5计算得x=6.85,y=157.25.∴b^=∑i=18x i y i-8xy∑i=18x2i-8x2=8 764.5-8×6.85×157.25382.02-8×6.852≈22.17,a^=y-b^x=157.25-22.17×6.85≈5.39,故线性回归方程为y^=22.17x+5.39.回归分析1.在一段时间内,某种商品的价格x元和需求量y件之间的一组数据为:x 1416182022y 121075 3求出y 对x 的回归直线方程,并说明拟合效果的程度. 解:x =15(14+16+18+20+22)=18,y =15(12+10+7+5+3)=7.4.∑i =15x 2i =142+162+182+202+222=1 660, ∑i =15x i y i =14×12+16×10+18×7+20×5+22×3=620,可得回归系数b ^=∑i =15x i y i -5xy∑i =15x 2i -5x2=620-5×18×7.41 660-5×182=-1.15.所以a ^=7.4+1.15×18=28.1所以回归直线方程:y ^=-1.15x +28.1. 列出残差表:则∑i =15(y i -y ^i )2=0.3,∑i =15(y i -y )2=53.2. R 2=1-∑i =15(y i -y ^i )2∑i =15(y i -y )2≈0.994.所以回归模型的拟合效果很好. 题点二:非线性回归分析2.为了研究某种细菌随时间x 变化繁殖个数y 的变化,收集数据如下(1) (2)求y 与x 之间的回归方程. 解:(1)散点图如图所示:(2)由散点图看出样本点分布在一条指数函数y 1=c 1e c 2x 的周围,于是令z =ln y ,则x 123456z1.79 2.48 3.22 3.89 4.55 5.25由计算器算得,z ^=0.69x +1.112,则有y ^=e 0.69x +1.112.(1)当两个变量已明显呈线性相关关系时,则无需作散点图,就可直接求回归直线方程,否则要先判定相关性再求回归方程.判断拟合效果的好坏需要利用R 2确定,R 2越接近1,说明拟合效果越好.(2)非线性回归方程的求法①根据原始数据(x ,y )作出散点图; ②根据散点图,选择恰当的拟合函数;③作恰当的变换,将其转化成线性函数,求线性回归方程;④在③的基础上通过相应的变换,即可得非线性回归方程.层级一 学业水平达标1.在对两个变量x ,y 进行线性回归分析时,有下列步骤: ①对所求出的回归直线方程作出解释; ②收集数据(x i ,y i ),i =1,2,…,n ; ③求线性回归方程; ④求相关系数;⑤根据所搜集的数据绘制散点图.如果根据可行性要求能够作出变量x ,y 具有线性相关的结论,则在下列操作顺序中正确的是( )A .①②⑤③④B .③②④⑤①C .②④③①⑤D .②⑤④③①解析:选D 对两个变量进行回归分析时,首先收集数据(x i ,y i ),i =1,2,…,n ;根据所搜集的数据绘制散点图.观察散点图的形状,判断线性相关关系的强弱,求相关系数,写出线性回归方程,最后依据所求出的回归直线方程作出解释;故正确顺序是②⑤④③①, 故选D .2.有下列说法:①在残差图中,残差点比较均匀地落在水平的带状区域内,说明选用的模型比较合适; ②R 2来刻画回归的效果,R 2值越大,说明模型的拟合效果越好;③比较两个模型的拟合效果, 可以比较残差平方和的大小,残差平方和越小的模型,拟合效果越好.其中正确命题的个数是( ) A .0 B .1 C .2D .3解析:选D ①选用的模型是否合适与残差点的分布有关; 对于②③, R 2的值越大, 说明残差平方和越小, 随机误差越小,则模型的拟合效果越好.3.下图是根据变量x ,y 的观测数据(x i ,y i )(i =1,2,…,10)得到的散点图,由这些散点图可以判断变量x ,y 具有相关关系的图是( )A .①②B .①④C .②③D .③④解析:选D 根据散点图中点的分布情况,可判断③④中的变量x ,y 具有相关的关系. 4.(重庆高考)已知变量x 与y 正相关,且由观测数据算得样本平均数x =3,y =3.5,则由该观测数据算得的线性回归方程可能为( )A .y ^=0.4x +2.3B .y ^=2x -2.4 C .y ^=-2x +9.5 D .y ^=-0.3x +4.4解析:选A 依题意知,相应的回归直线的斜率应为正,排除C ,D .且直线必过点(3,3.5)代入A ,B 得A 正确.5.为了解某社区居民的家庭年收入与年支出的关系,随机调查了该社区5户家庭,得到如下统计数据表:收入x (万元) 8.2 8.6 10.0 11.3 11.9 支出y (万元)6.2 7.58.08.59.8根据上表可得回归直线方程y =b x +a ,其中b =0.76,a =y -b x .据此估计,该社区一户年收入为15万元家庭的年支出为( )A .11.4万元B .11.8万元C .12.0万元D .12.2万元解析:选B 由题意知,x =8.2+8.6+10.0+11.3+11.95=10,y =6.2+7.5+8.0+8.5+9.85=8,∴a ^=8-0.76×10=0.4,∴当x =15时,y ^=0.76×15+0.4=11.8(万元). 6.以下是某地区的降雨量与年平均气温的一组数据: 年平均气温(℃) 12.51 12.84 12.84 13.69 13.33 12.74 13.05 年降雨量(mm)542507813574701432464或“不具有”)解析:画出散点图,观察可知,降雨量与年平均气温没有相关关系.答案:不具有7.在一组样本数据(x 1,y 1),(x 2,y 2),…,(x n ,y n )(n ≥2,x 1,x 2,…,x n 不全相等)的散点图中,若所有样本点(x i ,y i )(i =1,2,…,n )都在直线y =12x +1上,则这组样本数据的样本相关系数为________.解析:根据样本相关系数的定义可知, 当所有样本点都在直线上时, 相关系数为1. 答案:18.下列说法正确的命题是________(填序号). ①回归直线过样本点的中心(x ,y );②线性回归方程对应的直线y ^=b ^x +a ^至少经过其样本数据点(x 1,y 1),(x 2,y 2),…,(x n ,y n )中的一个点;③在残差图中,残差点分布的带状区域的宽度越宽,其模型拟合的精度越高; ④在回归分析中,R 2为0.98的模型比R 2为0.80的模型拟合的效果好. 解析:由回归分析的概念知①④正确,②③错误.答案:①④9.某工厂为了对新研发的一种产品进行合理定价,将该产品按事先拟定的价格进行试销,得到如下数据:(1)求回归直线方程y =b x +a ,其中b =-20,a =y -b x ;(2)预计在今后的销售中,销量与单价仍然服从(1)中的关系,且该产品的成本是4元/件,为使工厂获得最大利润,该产品的单价应定为多少元?(利润=销售收入-成本)解:(1)x =16(8+8.2+8.4+8.6+8.8+9)=8.5,y =16(90+84+83+80+75+68)=80,从而a ^=y +20x =80+20×8.5=250, 故y ^=-20x +250.(2)由题意知, 工厂获得利润z =(x -4)y =-20x 2+330x -1 000=-20⎝⎛⎭⎫x -3342+361.25,所以当x =334=8.25时,z max =361.25(元).即当该产品的单价定为8.25元时,工厂获得最大利润.10.关于x 与y 有以下数据:已知x 与y 线性相关,由最小二乘法得b ^=6.5, (1)求y 与x 的线性回归方程;(2)现有第二个线性模型:y ^=7x +17,且R 2=0.82.若与(1)的线性模型比较,哪一个线性模型拟合效果比较好,请说明理由. 解:(1)依题意设y 与x 的线性回归方程为y ^=6.5x +a ^. x =2+4+5+6+85=5,y =30+40+60+50+705=50,∵y ^=6.5x +a ^经过(x ,y ),∴50=6.5×5+a ^,∴a ^=17.5,∴y 与x 的线性回归方程为y ^=6.5x +17.5. (2)由(1)的线性模型得y i -y ^i 与y i -y 的关系如下表:所以∑i =15(y i -y ^i )2=(-0.5)2+(-3.5)2+102+(-6.5)2+0.52=155.∑i =15(y i -y )2=(-20)2+(-10)2+102+02+202=1 000.所以R 21=1-∑i =15(y i -y ^i )2∑i =15(y i -y )2=1-1551 000=0.845. 由于R 21=0.845,R 2=0.82知R 21>R 2,所以(1)的线性模型拟合效果比较好.层级二 应试能力达标1.在建立两个变量y 与x 的回归模型中,分别选择4个不同模型,求出它们相对应的R 2如表,则其中拟合效果最好的模型是( )A .模型1B .模型2C .模型3D .模型4 解析:选B 线性回归分析中,相关系数为r ,|r |越接近于1, 相关程度越大; |r |越小, 相关程度越小,故其拟合效果最好. 故选B .2.如果某地的财政收入x 与支出y 满足线性回归方程y =bx +a +e (单位:亿元),其中b =0.8,a =2,|e |≤0.5,如果今年该地区财政收入为10亿元,则年支出预计不会超过( )A .10亿B .9亿C .10.5亿D .9.5亿解析:选C ∵x =10时,y =0.8×10+2+e =10+e , 又∵|e |≤0.5,∴y ≤10.5.3.某咖啡厅为了了解热饮的销售量y (个)与气温x (℃)之间的关系,随机统计了某4天的销售量与气温,并制作了对照表:气温(℃) 18 13 10 -1 销售量(个)24343864由表中数据,得线性回归方程y =-2x +a .当气温为-4 ℃时,预测销售量约为( ) A .68 B .66 C .72D .70解析:选A ∵x =14(18+13+10-1)=10,y =14(24+34+38+64)=40,∴40=-2×10+a ,∴a =60,当x =-4时,y =-2×(-4)+60=68.4.甲、乙、丙、丁4位同学各自对A ,B 两变量进行回归分析,分别得到散点图与残差平方和i =1n (y i -y ^i )2如下表:甲 乙 丙 丁散点图残差平方和115106124103哪位同学的试验结果体现拟合A ,B 两变量关系的模型拟合精度高( ) A .甲 B .乙 C .丙D .丁解析:选D 根据线性相关的知识,散点图中各样本点条状分布越均匀,同时保持残差平方和越小(对于已经获取的样本数据,R 2的表达式中i =1n(y i -y )2为确定的数,则残差平方和越小,R 2越大),由回归分析建立的线性回归模型的拟合效果越好,由试验结果知丁要好些.故选D .5.在研究两个变量的相关关系时,观察散点图发现样本点集中于某一条指数曲线y =e bx+a的周围,令z ^=ln y ,求得回归直线方程为z ^=0.25x -2.58,则该模型的回归方程为________.解析:因为z ^=0.25x -2.58,z ^=ln y ,所以y =e 0.25x -2.58. 答案:y =e 0.25x -2.586.调查了某地若干户家庭的年收入x (单位:万元)和年饮食支出y (单位:万元),调查显示年收入x 与年饮食支出y 具有线性相关关系,并由调查数据得到y 对x 的回归直线方程:y ^=0.254x +0.321.由回归直线方程可知,家庭年收入每增加1万元,年饮食支出平均增加________万元.解析:以x +1代x ,得y ^=0.254(x +1)+0.321,与y ^=0.254x +0.321相减可得,年饮食支出平均增加0.254万元.答案:0.2547.下表是某年美国旧轿车价格的调查资料. 使用年数 12345678910平均价格(美元)2 6511 9431 4941 087765538484290226204观察表中的数据,试问平均价格与使用年数间存在什么样的关系? 解:设x 表示轿车的使用年数,y 表示相应的平均价格,作出散点图.由散点图可以看出y 与x 具有指数关系, 令z =ln y ,变换得 x 12345678910z7.883 7.572 7.309 6.991 6.640 6.288 6.182 5.670 5.421 5.318 作出散点图:由图可知各点基本上处于一直线,由表中数据可求出线性回归方程: z ^=8.166-0.298x .因为旧车的平均价格与使用年数具有指数关系,其非线性回归方程为y ^=e 8.166-0.298x .8.某公司利润y (单位:千万元)与销售总额x (单位:千万元)之间有如下对应数据:x 10 151720 252832y11.3 1.8 22.6 2.7 3.3(1)画出散点图; (2)求回归直线方程;(3)估计销售总额为24千万元时的利润.解:(1)散点图如图:(2)列下表,并利用科学计算器进行有关计算.i 1 2 3 4 5 6 7 x i 10 151720 252832y i11.3 1.8 22.6 2.7 3.3x =21,y =2.1∑i =17x 2i =3 447,∑i =17x i y i =346.3于是b ^=346.3-7×21×2.13 447-7×212≈0.104.a ^=2.1-0.104×21=-0.084, 因此回归直线方程为y ^=0.104x -0.084.(3)当x =24时,y =0.104×24-0.084=2.412(千万元).。

最新人教版高中数学选修1-2《回归分析的基本思想及其初步应用》教材梳理

最新人教版高中数学选修1-2《回归分析的基本思想及其初步应用》教材梳理

庖丁巧解牛知识·巧学 一、回归分析回归分析是根据变量观测数据分析变量间关系的常用统计分析方法.通常把变量观测数据称为样本.1.散点图与回归方程(1)设对y 及x 做n 次观测得数据(x i ,y i )(i=1,2,…,n).以(x i ,y i )为坐标在平面直角坐标系中描点,所得到的这张图便称之为散点图.其中x 是可观测、可控制的普通变量,常称它为自变量,y 为随机变量,常称其为因变量.知识拓展 散点图是直观判断变量x 与y 是否相关的有效手段. (2)a 与回归系数b 的计算方法若散点呈直线趋势,则认为y 与x 的关系可以用一元回归模型来描述.设线性回归方程为y=a+bx+ε.其中a 、b 为未知参数,ε为随机误差,它是一个分布与x 无关的随机变量.最小二乘估计aˆ和b ˆ是未知参数a 和b 的最好估计. x b y aˆˆ-=,b ˆ=∑∑==---ni ini i ix xy y x x121)())((.深化升华 bˆ的计算还可以用公式b ˆ=∑∑==--ni ini ii x n xyx n yx 1221来计算,这时只需列表求出相关的量代入即可. 2.相关性检验如下图中的两个散点图,很难判断这些点是不是分布在某条直线附近.假如不考虑散点图,按照最小二乘估计计算a 与b ,我们可以根据一组成对数据,求出一个回归直线方程.但它不能反映这组成对数据的变化规律.为了解决上述问题,我们有必要对x 与y 作线性相关性的检验,简称相关性检验.对于变量x 与y 随机抽取到的n 对数据(x 1,y 1),(x 2,y 2),…,(x n ,y n ),检验统计量是样本相关系数r.r=∑∑∑∑∑∑======---=----ni i ni i ni ii ni i n i i ni i iy n y x n x yx n yx y y x x y y x x122122112121)()()()())((.r 具有以下性质:当r 大于0时,表明两个变量正相关,当r 小于0时,表明两个变量负相关;|r|≤1;|r|越接近1,线性相关程度越强;|r|越接近0,线性相关程度越弱.通常当|r|大于0.75时,认为两个变量有很强的线性相关关系.相关性检验临界值如下表所示.相关性检验的临界值表深化升华 相关性检验的步骤也可如下: (1)作统计假设:X 与Y 不具有线性相关关系.(2)根据小概率0.05与n-2在相关性检验的临界值表中查出r 的一个临界值r 0.05. (3)根据样本相关系数计算公式算出r 的值.(4)作出统计推断.如果|r|>r 0.05,表明有95%的把握认为X 与Y 之间具有线性相关关系.如果|r|≤r 0.05,我们没有理由拒绝原来的假设.这时寻找回归直线方程是没有意义的. 3.回归分析的基本概念(1)在数学上,把每个效应(观测值减去总的平均值)的平方和加起来,即用∑=-ni iy y12)(表示总的效应,称为总偏差平方和.(2)数据点和它在回归直线上相应位置的差异(y i -i yˆ)是随机误差的效应,称i e ˆ=(y i -i y ˆ)为残差.(3)分别将残差的值平方后回来,用数学符号表示为∑=-ni i iy y12)(称为残差平方和.它代表了随机误差的效应.(4)总偏差平方和与残差平方和的差称为回归平方和.(5)回归效果的刻画我们可以用相关指数R 2反映.R 2=1-∑∑==--n i ini i iy y yy1212)()ˆ(.显然,R 2的值越大,说明残差平方和越小,也就是说模型的拟合效果越好.4.非线性回归问题 在实际问题中,当变量之间的相关关系不是线性相关关系时,不能用线性回归方程描述它们之间的相关关系,需要进行非线性回归分析,然而非线性回归方程一般很难求,因此把非线性回归化为线性回归应该说是解决问题的好方法.首先,所研究对象的物理背景或散点图可帮助我们选择适当的非线性回归方程yˆ=μ(x;a,b).其中a及b为未知参数,为求参数a及b的估计值,往往可以先通过变量置换,把非线性回归化为线性回归,再利用线性回归的方法确定参数a及b的估计值.问题·探究问题函数关系是一种确定性关系,而对一种非确定性关系——相关关系,我们如何研究?导思:由于相关关系不是一种确定性关系,我们经常运用统计分析的方法,即回归分析,按照画散点图,求回归方程,用回归方程预报等步骤进行.探究:我们可以知道,相关关系中,由部分观测值得到的回归直线,可以对两个变量间的线性相关关系进行估计,这实际上是将非确定性问题转化成确定性问题来研究.由于回归直线将部分观测值所反映的规律性进行了延伸,它在情况预报、资料补充等方面有着广泛的应用,从某种意义上看,函数关系是一种理想的关系模型,而相关关系是一种更为一般的情况.因此研究相关关系,不仅可使我们处理更为广泛的数学应用问题,还要使我们对函数关系的认识上升到一种新的高度.典题·热题思路解析:散点图是表示具有相关关系的两个变量的一组数据的图形.解:散点图如下:例2每立方米混凝土的水泥用量x(单位:kg)与28天后混凝土的抗压强度(单位:kg/cm2)之间的关系有如下数据:(2)如果y与x之间具有线性相关关系,求回归直线方程.思路解析:求回归直线方程和相关系数,可以用计算器来完成.在有的较专门的计算器中,可通过直接按键得出回归直线方程的系数和相关系数,而如果要用一般的科学计算器进行计算,则要先列出相应的表格,有了表格中的那些相关数据,回归方程中的系数和相关系数就都容易求出了.解:(1)r=)6.721294.64572)(20512518600(6.722051218294322⨯-⨯-⨯⨯-≈0.999>0.75.说明变量y 与x 之间具有显著的线性正相关关系.bˆ=143004347205125186006.72205121829432=⨯-⨯⨯-≈0.304, x b y aˆˆ-==72.6-0.304×205=10.28. 于是所求的线性回归方程为yˆ=0.304x+10.28. 深化升华 为了进行相关性检验,通常将有关数据列成表格,然后借助于计算器算出各个量,为求回归直线方程扫清障碍.若由资料知y 对x 有线性相关关系.试求:(1)线性回归方程yˆ=b ˆx+a ˆ的回归系数a ˆ,b ˆ. (2)使用年限为10年时,估计维修费用是多少?思路解析:因为y 对x 有线性相关关系,所以可以用一元线性相关的方法解决问题.利用公式bˆ=∑∑==--ni i ni ii x n x yx n yx 1221,aˆ=y -b ˆx 来计算回归系数.有时为了方便常列表对应写出x i y i ,x i 2,以利于求和.解:(1)x =4,y =5,∑=ni ix12=90,∑=ni ii yx 1=112.3,于是bˆ=245905453.112⨯-⨯⨯-=1.23,aˆ=y -b ˆx =5-1.23×4=0.08. (2)回归直线方程为yˆ=1.23x+0.08.当x=10年时,y ˆ=1.23×10+0.08=12.38(万元),即估计使用10年的维修费用是12.38万元.方法归纳 知道y 与x 呈线性相关关系,就无需进行相关性检验,否则,应首先进行相关性检验.如果本身两个变量不具有相关关系,或者说,它们之间相关关系不显著,即使求出了回归方程也是毫无意义的,而且估计和预测的量也是不可信的.例4一只红铃虫的产卵数y与x有关,现收集了7组观测数据列于表中,试建立y与x之间思路解析:首先要作出散点图,根据散点图判定y与x之间是否具有线性相关关系,若具有线性相关关系,再求线性回归方程.在散点图中,样本点并没有分布在某个带状区域内,因此两个变量不呈线性相关关系,所以不能直接利用线性回归方程来建立两个变量之间的关系.根据已有的函数知识,可以发现样本分布在某一指数函数曲线的周围.解:散点图如下所示:由散点图可以看出:这些点分布在某一条指数函数y=pe qx(p,q为待定的参数)的周围.现在,问题变为如何估计待定的参数p和q,我们可以通过对数变换把指数关系变为线性关系.令z=lny,则变换后样本点应该分布在直线z=bx+a(a=lnp,b=q)周围.这样就可以利用线性回归模型来建立y与x之间的非线性回归方程了.由下图可看出,变换后的样本点分布在一条直线的附近,因此可以用线性回归方程来拟合.经过计算得到线性回归方程为zˆ=0.272x-3.843.因此红铃虫的产卵数对温度的非线性回归方程为yˆ=e0.272x-3.843.方法归纳线性回归问题在解决前可以先画散点图,通过散点图判断是否为线性回归,如果不是线性回归,要先转换为线性回归问题.。

人教版高中数学选修1-2教案1.1.1线性回归的思想方法及应用

人教版高中数学选修1-2教案1.1.1线性回归的思想方法及应用

统计案例1.1回归分析的基本思想及初步应用1.1.1线性回归的思想方法及应用课前预习学案一、课前预习预习目标:回顾回归直线的求法,并利用回归直线进行总体估计。

二、预习内容1.回归直线:如果散点图中点的分布从整体上看大致在一条直线附近,我们就称这两个变量之间具有线性相关关系,这条直线叫作回归直线。

求回归直线方程的一般步骤:①;②;③2.典型例题:研究某灌溉渠道水的流速与水深之间的关系,测得一组数据如下:水深 1.40 1.50 1.60 1.70 1.80 1.90 2.00 2.10流速 1.70 1.79 1.88 1.95 2.03 2.10 2.16 2.21 (1)求对的回归直线方程;(2)预测水深为1.95时水的流速是多少?课内探究学案一、学习目标:通过典型案例的探究,进一步了解回归分析的基本思想、方法及初步应用.学习重点:了解线性回归模型与函数模型的差异,了解判断刻画模型拟合效果的方法-相关指数和残差分析.学习难点:解释残差变量的含义,了解偏差平方和分解的思想.二、学习过程1. 提问:“名师出高徒”这句彦语的意思是什么?有名气的老师就一定能教出厉害的学生吗?这两者之间是否有关?2. 复习:函数关系是一种确定性关系,而相关关系是一种非确定性关系. 回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法,其步骤:收集数据→作散点图→求回归直线方程→利用方程进行预报.3. 典型例题:编号 1 2 3 4 5 6 7 8 165 165 157 170 175 165 155 170身高/cm体重48 57 50 54 64 61 43 59/kg求根据一名女大学生的身高预报她的体重的回归方程,并预报一名身高为172cm的女大学生的体重. (分析思路→教师演示→学生整理)评注:事实上,观察上述散点图,我们可以发现女大学生的体重y和身高x之间的关系并不=+来严格刻画(因为所有的样本点不共线,所以线性模型只能近似地能用一次函数y bx a刻画身高和体重的关系).在数据表中身高为165cm的3名女大学生的体重分别为48kg、57kg和61kg,如果能用一次函数来描述体重与身高的关系,那么身高为165cm的3名女在学生的体重应相同. 这就说明体重不仅受身高的影响还受其他因素的影响,把这种影响的结=++,果e(即残差变量或随机变量)引入到线性函数模型中,得到线性回归模型y bx a e其中残差变量e中包含体重不能由身高的线性函数解释的所有部分. 当残差变量恒等于0时,线性回归模型就变成一次函数模型. 因此,一次函数模型是线性回归模型的特殊形式,线性回归模型是一次函数模型的一般形式.4.相关系数:相关系数的绝对值越接近于1,两个变量的线性相关关系越强,它们的散点图越接近一条直线,这时用线性回归模型拟合这组数据就越好,此时建立的线性回归模型是有意义.5. 小结:求线性回归方程的步骤、线性回归模型与一次函数的不同.课后练习与提高1.对具有相关关系的两个变量统计分析的一种常用的方法是()A.回归分析 B.相关系数分析 C.残差分析 D.相关指数分析2.在画两个变量的散点图时,下面叙述正确的是()A.预报变量在轴上,解释变量在轴上B.解释变量在轴上,预报变量在轴上C.可以选择两个变量中任意一个变量在轴上D.可以选择两个变量中任意一个变量在轴上3.两个变量相关性越强,相关系数()A.越接近于0 B.越接近于1 C.越接近于-1 D.绝对值越接近14.若散点图中所有样本点都在一条直线上,解释变量与预报变量的相关系数为()A.0 B.1 C.-1 D.-1或15.一位母亲记录了她儿子3到9岁的身高,数据如下表:年龄(岁) 3 4 5 6 7 8 9身高(94.8 104.2 108.7117.8 124.3 130.8 139.0由此她建立了身高与年龄的回归模型,她用这个模型预测儿子10岁时的身高,则下面的叙述正确的是()A.她儿子10岁时的身高一定是145.83B.她儿子10岁时的身高在145.83以上C.她儿子10岁时的身高在145.83左右D.她儿子10岁时的身高在145.83以下统计案例1.1回归分析的基本思想及初步应用1.1.1线性回归的思想方法及应用教学要求:通过典型案例的探究,进一步了解回归分析的基本思想、方法及初步应用.教学重点:了解线性回归模型与函数模型的差异,了解判断刻画模型拟合效果的方法-相关指数和残差分析.教学难点:解释残差变量的含义,了解偏差平方和分解的思想.教学过程:一、复习准备:1. 提问:“名师出高徒”这句彦语的意思是什么?有名气的老师就一定能教出厉害的学生吗?这两者之间是否有关?2. 复习:函数关系是一种确定性关系,而相关关系是一种非确定性关系. 回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法,其步骤:收集数据→作散点图→求回归直线方程→利用方程进行预报.二、讲授新课:1. 教学例题:①例1从某大学中随机选取8名女大学生,其身高和体重数据如下表所示:编号 1 2 3 4 5 6 7 8身高165 165 157 170 175 165 155 170 /cm48 57 50 54 64 61 43 59 体重/kg求根据一名女大学生的身高预报她的体重的回归方程,并预报一名身高为172cm的女大学生的体重. (分析思路→教师演示→学生整理)第一步:作散点图第二步:求回归方程第三步:代值计算②提问:身高为172cm的女大学生的体重一定是60.316kg吗?不一定,但一般可以认为她的体重在60.316kg左右.③解释线性回归模型与一次函数的不同事实上,观察上述散点图,我们可以发现女大学生的体重y和身高x之间的关系并不能用一=+来严格刻画(因为所有的样本点不共线,所以线性模型只能近似地刻画身次函数y bx a高和体重的关系). 在数据表中身高为165cm的3名女大学生的体重分别为48kg、57kg和61kg,如果能用一次函数来描述体重与身高的关系,那么身高为165cm的3名女在学生的体重应相同. 这就说明体重不仅受身高的影响还受其他因素的影响,把这种影响的结果e(即=++,其中残残差变量或随机变量)引入到线性函数模型中,得到线性回归模型y bx a e差变量e中包含体重不能由身高的线性函数解释的所有部分. 当残差变量恒等于0时,线性回归模型就变成一次函数模型. 因此,一次函数模型是线性回归模型的特殊形式,线性回归模型是一次函数模型的一般形式.2. 相关系数:相关系数的绝对值越接近于1,两个变量的线性相关关系越强,它们的散点图越接近一条直线,这时用线性回归模型拟合这组数据就越好,此时建立的线性回归模型是有意义.3. 小结:求线性回归方程的步骤、线性回归模型与一次函数的不同.。

高中数学人教A版选修1-2 1-1-1 回归分析的基本思想及

高中数学人教A版选修1-2 1-1-1 回归分析的基本思想及

选修1-2 第一章 1.1 回归分析的基本思想及其初步应用(1)检测(检测教师版)班级: 姓名:一、单选题1.根据如下样本数据:得到回归方程 1.412.ˆ4yx =-+,则 A. 5a =B. 变量x 与y 线性正相关C. 当x =11时,可以确定y =3D. 变量x 与y 之间是函数关系 【答案】A【解析】由题意可得: 357964x +++==,6321144a ay ++++==,回归方程过样本中心点,则:11 1.4612.44a+=-⨯+, 求解关于实数a 的方程可得: 5a =,由 1.40ˆb=-<可知变量x 与y 线性负相关; 当x =11时,无法确定y 的值;变量x 与y 之间是相关关系,不是函数关系. 本题选择A 选项.2.身高与体重有关系可以用________来分析.( ) A. 残差 B. 回归分析 C. 等高条形图 D. 独立检验 【答案】B【解析】人的身高和体重是两种相关性的量,可以用回归分析来分析. 故选:B .3.某家具厂的原材料费支出x 与销售量y (单位:万元)之间有如下数据,根据表中提供的全部数据,用最小二乘法得出y 与x 的线性回归方程为ˆ8ˆyx b =+,则ˆb 为( )A. 5B. 15C. 12D. 20 【答案】C【解析】由题意可得: 2456855x ++++==, 2535605575525y ++++==,回归方程过样本中心点,则: 5285,1ˆˆ2bb =⨯+∴=.本题选择C 选项. 4.对于自变量x 和因变量y ,当x 取值一定时,y 的取值带有一定的随机性,x ,y 之间的这种非确定性关系叫做( ) A. 函数关系 B. 线性关系 C. 相关关系 D. 回归关系 【答案】C【解析】对于自变量x 和因变量y ,当x 取值一定时,y 的取值带有一定的随机性,x ,y 之间的这种非确定性关系叫相关关系,故选:C 5.散点图在回归分析过程中的作用是( ) A. 查找个体个数 B. 比较个体数据大小关系 C. 探究个体分类 D. 粗略判断变量是否线性相关 【答案】D【解析】由于散点图在回归分析过程中的作用是粗略判断变量是否线性相关, 则D 正确,故选:D6.四名同学根据各自的样本数据研究变量,x y 之间的相关关系,并求得回归直线方程,分别得到以下四个结论:①y 与x 负相关且 2.7567.3ˆ25yx =-+. ②y 与x 负相关且 3.47654ˆ.68y x =+ ③y 与x 正相关且 1.226 6.5ˆ78yx =-- ④y 与x 正相关且8.96786ˆ.13y x =+ 其中一定不正确的结论的序号是( ) A. ①② B. ②③ C. ③④ D. ①④ 【答案】B【解析】根据题意,依次分析4个结论:对于①、y 与x 负相关且ˆy =−2.756x+7.325,此结论正确,线性回归方程符合负相关的特征; 对于②、y 与x 负相关且ˆy=3.476x+5.648,此结论误,由线性回归方程知,此两变量的关系是正相关;对于③、y 与x 正相关且ˆy=−1.226x−6.578,此结论误,由线性回归方程知,此两变量的关系是负相关;对于④、y 与x 正相关且ˆy =8.967x+8.163,此结论正确,线性回归方程符合正相关的特征;故②③一定错误; 本题选择B 选项. 二、填空题7.如图所示,有A ,B ,C ,D ,E ,5组数据,去掉____组数据后,剩下的4组数据具有较强的线性相关关系.(请用A B 、、 C D E 、、作答)【答案】D【解析】从点的分布看,去掉D ,余下各组,,,A B C E 具有较强的线性相关关系,故填D . 8.已知x 、y 之间的一组数据如下:则线性回归方程ˆya bx =+所表示的直线必经过点________. 【答案】(1.5,5)【解析】由题意可得: 0123 1.54x +++==, 826454y +++==,线性回归方程过样本中心点,即线性回归方程ˆya bx =+所表示的直线必经过点(1.5,5)9.某城市2007年到2011年人口总数与年份的关系如表所示. 据此估计2017年该城市人口总数_____. 年份(参考数据和公式: )【答案】35.6【解析】,,,故关于的线性回归方程为,当时,10.某企业节能降耗技术改造后,在生产某产品过程中记录的产量x (吨)与相应的生产能耗y (吨)的几组对应数据如下表所示:若根据表中数据得出y 关于x 的线性回归方程为0.70.35y x =+,则表中a 的值为_________________. 【答案】4.5【解析】由题意可知:产量x 的平均值为13456 4.54x =+++=(),由线性回归方程为0.70.35y x =+,过样本中心点x y (,),则0.70.350.7 4.50.35 3.5y x =+=⨯+=,由2.534 3.5y a =+++=() ,解得: 4.5a =,表中a 的值为4.5,故答案为: 4.5.。

高中数学人教A版选修1-2 1-1-1 回归分析的基本思想及

高中数学人教A版选修1-2 1-1-1 回归分析的基本思想及

选修1-2 第一章 1.1 回归分析的基本思想及其初步应用(2)检测(检测教师版)班级: 姓名:一、单选题1.下列关于回归分析的说法中错误的是( ) A. 回归直线一定过样本中心(),x yB. 残差图中残差点比较均匀地落在水平的带状区域中,说明选用的模型比较合适C. 两个模型中残差平方和越小的模型拟合的效果越好D. 甲、乙两个模型的2R 分别约为0.98和0.80,则模型乙的拟合效果更好 【答案】D【解析】对于A ,回归直线一定过样本中心,正确;对于B ,可用残差图判断模型的拟合效果,残差点比较均匀地落在水平的带状区域中,说明这样的模型比较合适。

带状区域的宽度越窄,说明模型的拟合精度越高。

故正确; 对于C ,可用残差平方和判断模型的拟合效果,残差平方和越小,模型的拟合效果越好,故正确;对于D ,∵相关指数2R 取值越大,说明残差平方和越小,模型的拟合效果越好,又∵甲、乙两个模型的相关指数2R 的值分别约为0.98和0.80,0.98>0.80,∴甲模型的拟合效果好,故不正确。

本题选择D 选项.2.两个变量y 与x 的回归模型中,分别选择了4个不同模型,对于样本点()11,x y ,()22,x y ,…, (),n n x y ,可以用()()22121ˆ1n i i i nii y y R y y ==-=--∑∑来刻画回归的效果,已知模型1中20.96R =,模型2中20.85R =,模型3中20.55R =,模型4中20.41R =,其中拟合效果最好的模型是( )A. 模型1B. 模型2C. 模型3D. 模型4 【答案】A【解析】2R 值越大效果越好,所以选A.3.在线性回归模型y =bx +a +e 中,下列说法正确的是( ) A. y =bx +a +e 是一次函数B. 因变量y 是由自变量x 唯一确定的C. 因变量y 除了受自变量x 的影响外,可能还受到其它因素的影响,这些因素会导致随机误差e 的产生D. 随机误差e 是由于计算不准确造成的,可以通过精确计算避免随机误差e 的产生. 【答案】C【解析】根据线性回归的定义,按照自变量和因变量之间的关系类型,可分为线性回归分析和非线性回归分析,故A 不正确;根据线性回归方程做出的y 的值是一个预报值,不是由x 唯一确定,故B 不正确;y 除了受自变量x 的影响之外还受其他因素的影响,故C 正确;随机误差不是由于计算不准造成的,故D 不正确. 故选C .4.如图,5个(),x y 数据,去掉()3,10D 后,下列说法错误的是( )A. 相关系数r 变大B. 残差平方和变大C. 相关指数2R 变大 D. 解释变量x 与预报变量y 的相关性变强 【答案】B【解析】依据线性相关的有关知识可知:去掉数据()3,10D 后相关系数r 变大;相关指数2R也变大;同时解释变量与预报变量y 的相关性也变强,相应的残差平方和变小,故应选答案C 。

1.1.1《回归分析》课件(新人教版A选修1-2) 公开课一等奖课件

1.1.1《回归分析》课件(新人教版A选修1-2)  公开课一等奖课件

语文
小魔方站作品 盗版必究
谢谢您下载使用!
更多精彩内容,微信扫描二维码获取
扫描二维码获取更多资源
附赠 中高考状元学习方法


高考状元是一个特殊的群体,在许多 人的眼中,他们就如浩瀚宇宙里璀璨夺目 的星星那样遥不可及。但实际上他们和我 们每一个同学都一样平凡而普通,但他们 有是不平凡不普通的,他们的不平凡之处 就是在学习方面有一些独到的个性,又有 着一些共性,而这些对在校的同学尤其是 将参加高考的同学都有一定的借鉴意义。
y a bx
其中a+bx是确定性函数, 是随机误差
注: 产生的主要原因:
(1)所用确定性函数不恰当; (2)忽略了某些因素的影响; (3)观测误差。
对于线性回归模型
y a bx
应注意以下两个问题: I 模型的合理性; II 在模型合理的情况下,如何估计a,b.
8
8 4.50 21.06 13.08 168.5 64 560.1 204
3、回归分析的基本步骤:
画散点图
求回归方程
预报、决策
1. 2. 3. 4.
数学3——统计 画散点图 求出b,a的值。 求回归直线方程 用回归直线方程解决应用问题
思考:在时刻x=9s时,质点运动位置一定 是22.6287cm吗? 4、线性回归模型
选修1-2
(一)
必修3(第二章 统计)知识结构
收集数据
(随机抽样)
整理、分析数据 估计、推断 用样本估计总体 变量间的相关关系
简 单 随 机 抽 样
分 层 抽 样
系 统 抽 样
用样本 的频率 分布估 计总体 分布
用样本 数字特 征估计 总体数 字特征
相关主题
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

案例1: 案例 :女大学生的身高与体重
从某大学中随机选取8名女大学生 名女大学生, 例1 从某大学中随机选取 名女大学生,其身高和体重数据 如下表所示: 如下表所示:
1 2 3 4 5 6 7 8 编号 身高/cm 165 165 157 170 175 165 155 170 体重/kg 48 57 50 54 64 61 43 59
x = , = y , xi = ∑
2 i=1 n
, xi yi = ∑
i=1
n
.
于是有b= 于是有
∑ x y − nx ⋅ y
i =1 n i i
n
xi 2 − nx ∑
i =1
2
= 0.849 a = y − b x = − 85.712
所以回归方程是
$ = 0.849x − 85.712 y
思考1:相关关系与函数关系有 怎样的不同?
1.函数关系中的两个变量间是一种确定性关系; 相关关系是一种非确定性关系. 2. 函数关系是一种理想的关系模型; 相关关系在现实生活中大量存在,是更 一 般的情况. 练习:下面各组两变量间具相关关系的是( A)
①正方体的体积与棱长,②某农田的水稻产量与施肥量, 正方体的体积与棱长, 某农田的水稻产量与施肥量, ③家庭的支出与收入, ④某户家庭的用电量与电价。 家庭的支出与收入, 某户家庭的用电量与电价。 A②③ B③④ C②③④ D①②③④
2002
2003
函 = 回归模型: y数bx + a + e
y= + bxa
可以提供 选择模型的准则
函数模型与回归模型之间的差别
线性回归模型y=bx+a+e增加了随机误差项e 因变量y 线性回归模型y=bx+a+e增加了随机误差项e,因变量y的值 y=bx+a+e增加了随机误差项 由自变量x和随机误差项e共同确定, 自变量x 由自变量x和随机误差项e共同确定,即自变量x只能解析部分 的变化。 y的变化。 在统计中,我们也把自变量x称为解析变量,因变量y称为预报变量。 在统计中,我们也把自变量x称为解析变量,因变量y称为预报变量。 解析变量 预报变量
b = i=1 −2 n 2 ∑ xi − n x
i= 1
∑ xi yi − n x y
n
− −
a = y− b x


3、线性回归模型 、
y = a + bx + ε
其中a+bx是确定性函数, ε 是随机误差 是确定性函数, 其中 是确定性函数 产生的主要原因: 注:ε 产生的主要原因: (1)所用确定性函数不恰当; 所用确定性函数不恰当; 所用确定性函数不恰当 (2)忽略了某些因素的影响; 忽略了某些因素的影响; 忽略了某些因素的影响 (3)观测误差。 观测误差。 观测误差
相关系数r的绝对值与1 相关系数r的绝对值与1接近到什么程度才表明利用 线性回归模型比较合理呢? 线性回归模型比较合理呢?
相关关系的测度
(相关系数取值及其意义) 相关系数取值及其意义)
完全负相关 无线性相关 完全正相关
-1.0
-0.5
0
+0.5
正相关程度增加
+1.0
r
负相关程度增加
①.求相关系数r的步骤: 求相关系数r的步骤: (1)计算平均数 (1)计算平均数 x, y n (2)计算 n 的积, (2)计算 xi 与 yi 的积,求 ∑xi yi n i= 1 2 2 (3)计算 (3)计算 ∑xi , ∑yi i= 1 i= 1 (4)将上述有关结果代入公式 将上述有关结果代入公式, (4)将上述有关结果代入公式,求r
i=1
∑ xi yi − n x y
−2 n 2 i=1
n
− −
(∑ xi − n x )(∑ yi − n y )
如果0.75<|r|<1,可以认为有较强的线 , 如果 性相关关系。 性相关关系。
−2
建构数学
• 1.计算公式 1.计算公式
(x ∑ r=
i=1 n i
相关系数
n

- x)(yi - y)
ˆ ˆ = bx + a ˆ y
ˆ b=
∑(x − X )( y −Y )
i=1 i i
n
∑(X − X )
i=1 i
n
2
= i=1 n −2 2 ∑ xi − n x
i=1
∑ xi yi − n x y
n
− −
ˆ ˆ a = Y − bX
②.求线性回归方程的步骤: 求线性回归方程的步骤: (1)计算平均数 (1)计算平均数 x, y n (2)计算 n 的积, (2)计算 xi 与 yi 的积,求 ∑xi yi n i= 1 2 2 (3)计算 (3)计算 ∑xi , ∑yi i= 1 i= 1 (4)将上述有关结果代入公式 将上述有关结果代入公式, (4)将上述有关结果代入公式,求b、a, 写出回归直线方程. 写出回归直线方程.
n ∑ (xi -x)(yi -y) 相关系数 r= i=1 n 2× n (y -y)2 ∑ (xi -x) ∑ i i=1 i=1 r>0正相关;r< 负相关.通常, ;r<0 r>0正相关;r<0负相关.通常,
r∈[-1,-0.75]--负相关很强; 0.75]--负相关很强; --负相关很强 r∈[0.75,1]—正相关很强 ∈ 正相关很强; 正相关很强 r∈[-0.75,-0.3]--负相关一般; 负相关一般; ∈ r∈[0.3, 0.75]—正相关一般 正相关一般; ∈ 正相关一般 0.25]--相关性较弱; --相关性较弱 r∈[-0.25, 0.25]--相关性较弱; 对r进行 显著性检验
思考2:如何判断两个变量之间是否 存在线性相关关系?
问题2:什么是回归分析: 问题 :什么是回归分析
由数据画散点图 求回归方程 预报、 预报、决策
问题3:有时散点图的各点并不集中在一
条直线的附近,仍然可以按照求回归直线方 程的步骤求回归直线,显然这样的回归直线 没有实际意义。在怎样的情况下求得的回归 直线方程才有实际意义?
∵回归直线恒过点
−- −- , 为样本点的中心。 ( x y) ,故称 ( x y)为样本点的中心。 ,
案例1: 案例 :女大学生的身高与体重
从某大学中随机选取8名女大学生 名女大学生, 例1 从某大学中随机选取 名女大学生,其身高和体重数据 如下表所示: 如下表所示:
1 2 3 4 5 6 7 8 编号 身高/cm 165 165 157 170 175 165 155 170 体重/kg 48 57 50 54 64 61 43 59
人教版·选修 - 人教版 选修1-2 选修
§1.1.1 回归分析
问题1: 问题 :现实生活中两个变量间的关 系有哪些呢? 系有哪些呢? 函数关系
1、两个变量的关系 、 相关 关系
线性相关 非线性相关
相关关系:对于两个变量, 相关关系:对于两个变量,当自变量取值一定 时,因变量的取值带有一定随机性的两个变量 之间的关系。 之间的关系。
所以,对于身高为172cm的女大学生,由回归方程可以预报 所以,对于身高为172cm的女大学生, 172cm的女大学生 其体重为
$ = 0.849 × 72 − 85.712 = 60.316(kg ) y
探究P4: 探究 : 身高为172cm的女大学生的体重一定是 的女大学生的体重一定是60.316kg吗? 身高为 的女大学生的体重一定是 吗 如果不是,你能解析一下原因吗? 如果不是,你能解析一下原因吗? 身高为172cm的女大学生的体重不一定是60.316kg 172cm的女大学生的体重不一定是60.316kg, 答:身高为172cm的女大学生的体重不一定是60.316kg, 但一般可以认为她的体重在60.316kg左右。 60.316kg左右 但一般可以认为她的体重在60.316kg左右。
计算可得r=0.798,所以可以线性相关求回归方程。 ,所以可以线性相关求回归方程。 计算可得
函数模型与回归模型之间的差别
中国GDP散点图 120000
100000
80000
GP D
60000
40000
20000
0 1992
1993
1994
1995
1996
1997 年
1998
1999
2000
2001
求根据一名女大学生的身高预报她的体重的回归方程, 求根据一名女大学生的身高预报她的体重的回归方程, 并预报一名身高为172cm的女大学生的体重。 172cm的女大学生的体重 并预报一名身高为172cm的女大学生的体重。 解:1、选取身高为自变量x,体重为因变量y,作散点图: 选取身高为自变量x 体重为因变量y 作散点图: 2、由散点图知道身高和体重有比较好的 线性相关关系, 线性相关关系,因此可以用线性回归方程 刻画它们之间的关系。 刻画它们之间的关系。 3、从散点图还看到,样本点散布在某一条 从散点图还看到, 直线的附近,而不是在一条直线上, 直线的附近,而不是在一条直线上,所以 不能用一次函数y=bx+a描述它们关系。 y=bx+a描述它们关系 不能用一次函数y=bx+a描述它们关系。
n 2 i=1
i=1
∑ xi yi − n x y
−2 n 2 −2 i=1
n
− −
(∑ xi − n x )(∑ yi − n y )
问题4: 问题 :对于线性相关的两个变量用 什么方法来刻划之间的关系呢? 什么方法来刻划之间的关系呢? 2、最小二乘估计 、 最小二乘估计下的线性回归方程: ①最小二乘估计下的线性回归方程:
r=
n 2 i=1
相关文档
最新文档