高中数学回归分析_课件苏教版选修1-2
高中数学 12 回归分析教案 苏教版选修1-2 教案
图 #0!0"
!
统计案例
第章
变量3 与2 之间的关系!
$ 本相关系数通过公式算出" 的值作出 统 计 推 断若#"#&
!! 点 拨 散点图能帮 助 我 们 发 现 变 量 之 间 的 线 性 关 系 直 $ ")!)'则否定 #)表明有-'.的把握认为3 与2 之间具有线
观地反映了数据的变化规律!
合计
工作积极
'%
工作一般
"!
%)
-%
("
-'
合计
,(
#)"
#,-
&!'提 出 假 设
#)!企业的全体员工对待企业改 革 的 态 度 与 其 工 作 积
极性无关!
根 据 &#'中 列 联 表 的 数 据 #可 以 求 得
!
*#,--$%&$'%-'$$(",(*$%)#)$""!'!
+
%34'#我们希望 总 误 差 越 小 越 好#即 要 使 )4! 4*#
越 小 越 好!于
$ $
+
$
12*1$&1%3*)!(-%,1)!+""3! &!'由上述&#'中 求 出 的 回 归 直 线 方 程#把 3*#!-' 代
是 #只 要 求 出 使
5&#'* ) &24)34)'! 4*#
#)!+'-+!,+-#
苏教版高三数学选修1-2电子课本课件【全册】
0002页 0056页 0108页 0161页 0201页 0251页 0298页
第一章统计案例 1.2回归分析 2.1合情推理与演绎推理 第三章数系的扩充与复数的引入 3.2复数的四则运算 第四章 框图 4.2结构图
第一章统计案例
苏教版高三数学选修1-2电子课本 源自件【全册】2.1合情推理与演绎推理
苏教版高三数学选修1-2电子课本 课件【全册】
2.2直接证明与间接证明
苏教版高三数学选修1-2电子课本 课件【全册】
第三章数系的扩充与复数的引 入
苏教版高三数学选修1-2电子课本 课件【全册】
3.1数系的扩充
苏教版高三数学选修1-2电子课本 课件【全册】
3.2复数的四则运算
苏教版高三数学选修1-2电子课本 课件【全册】
3.3复数的几何意义
苏教版高三数学选修1-2电子课本 课件【全册】
第四章 框图
苏教版高三数学选修1-2电子课本 课件【全册】
4.1流程图
苏教版高三数学选修1-2电子课本 课件【全册】
1.1独立性检验
苏教版高三数学选修1-2电子课本 课件【全册】
1.2回归分析
苏教版高三数学选修1-2电子课本 课件【全册】
第二章推理与证明
苏教版高三数学选修1-2电子课本 课件【全册】
高中选修1-2回归分析和独立性检验知识总结与联系
高中选修1-2回归分析和独立性检验知识总结与联系-CAL-FENGHAI-(2020YEAR-YICAI)_JINGBIAN1122211()()()n n i i i i i i n n i i i i x x y y x y nx y b x x x nx a y bx ====⎧---⎪⎪==⎪⎨--⎪⎪=-⎪⎩∑∑∑∑选修1-2第一部分 变量间的相关关系与统计案例【基础知识】一、回归分析1.两个变量的线性相关:判断是否线性相关 ①用散点图(1)正相关:在散点图中,点散布在从左下角到右上角的区域.对于两个变量的这种相关关系,我们将它称为正相关.(2)负相关:在散点图中,点散布在从左上角到右下角的区域,两个变量的这种相关关系称为负相关.(3)线性相关关系、回归直线:如果散点图中点的分布从整体上看大致在一条直线附近,就称这两个变量之间具有线性相关关系,这条直线叫做回归直线. ②用相关系数r(3)除用散点图外,还可用样本相关系数r 来衡量两个变量x ,y 相关关系的强弱,ni ix y nx yr -•=∑当r >0,表明两个变量正相关,当r <0,表明两个变量负相关,r 的绝对值越接近于1,表明两个变量的线性相关性越强;r 的绝对值越接近于0,表明两个变量之间几乎不存在线性相关关系,通常|r |0.75>时,认为这两个变量具有很强的线性相关关系. 2.回归方程:两个变量具有线性相关关系,数据收集如下:可用最小二乘法得到回归方程ˆy bx a =+,其中3.回归分析的基本思想及其初步应用(1)回归分析是对具有相关关系的两个变量进行统计分析的方法,其常用的 研究方法步骤是画出散点图,求出回归直线方程,并利用回归直线方程进行预报.(2)对n 个样本数据(x 1,y 1)、(x 2,y 2)、…、(xn ,yn ),(,)x y 称为样本点的中心.样本点中心一定落在回归直线上。
4、回归效果的刻画:用相关指数2R来刻画回归的效果,公式是2 2121()1()ni iiniiy yRy y==-=--∑∑2R的值越大,说明残差平方和越小,也就是说模型拟合效果好二.独立性检验的基本思想及其初步应用题型一相关关系的判断【例1】对四组数据进行统计,获得以下散点图,关于其相关系数比较,正确的是()A.r2<r4<0<r3<r1B. r4<r2<0<r 1<r3C. r4<r2<0<r3<r1D. r2<r4<0<r1<r3【变式1】 根据两个变量x ,y 之间的观测数据画成散点图如图所示,这两个变量是否具有线性相关关系________(填“是”与“否”).题型二 线性回归方程【例2】在2013年元旦期间,某市物价部门对本市五个商场销售的某商品一天的销售量及其价格进行调查,五个商场的售价x 元和销售量y 件之间的一价格x 9 9.5 10 10.5 11销售量y11 10 8 6 5 y 关于商品的价格x 的线性回归方程为________.(参考公式:b ^= ,a ^=y -b ^x )【变式3】为了解儿子身高与其父亲身高的关系,随机抽取5对父子的身高数据如下:父亲身高x /cm 174 176 176 176 178儿子身高y /cm175 175 176 177 177则y 对x 的线性回归方程为( ). A .y =x -1 B .y =x +1C .y =88+12x D .y =176题型三 独立性检验【例4】通过随机询问110名性别不同的行人,对过马路是愿意走斑马线由K 2=n (ad -dc )(a +b )(c +d)(a +c )(b +d ),算得K 2=110×(40×30-20×20)260×50×60×50≈7.8.附表:A. 有99%以上的把握认为“选择过马路的方式与性别有关”B. 有99%以上的把握认为“选择过马路的方式与性别无关”C. 在犯错误概率不超过0.1%的前提下,认为“选择过马路的方式与性别有关”D. 在犯错误概率不超过0.1%的前提下,认为“选择过马路的方式与性别无关【变式2】 某企业有两个分厂生产某种零件,按规定内径尺寸(单位:mm)的值落在[29.94,30.06)的零件为优质品.从两个分厂生产的零件中各抽出了500件,(2)由以上统计数据填下面2×2列联表,并问是否有99%的把握认为“两个分附 K 2巩固提高1.下列说法:①将一组数据中的每个数据都加上或减去同一个常数后,方差恒不变;②设有一个回归方程y ^=3-5x ,变量x 增加一个单位时,y 平均增加5个单位;③线性回归方程y ^=b ^x +a ^必过(x ,y );④在一个2×2列联表中,由计算得K 2=13.079,则有99%的把握确认这两个变量间有关系;其中错误的个数是( )A. 0B. 1C. 2D. 32.已知回归直线斜率的估计值为1.23,样本点的中心为点(4,5),则回归直线的方程为( ) A. y ^=1.23x +4 B. y ^=1.23x +5 C. y ^=1.23x +0.08 D. y ^=0.08x +1.23 3.从所得的散点图分析可知:y 与x 线性相关,且y =0.95x +a ,则a =( ) A. 1.30 B. 1.45 C. 1.65 D. 1.804.根据上表可得回归直线方程:y =0.56x +a ,据此模型预报身高为172 cm 的高三男生的体重为( )A. 70.09 kgB. 70.12 kgC. 70.55 kgD. 71.05 kg5.调查了某地若干户家庭的年收入x (单位:万元)和年饮食支出y (单位:万元),调查显示年收入x 与年饮食支出y 具有线性相关关系,并由调查数据得到y 对x的回归直线方程:y ^=0.254x +0.321.由回归方程可知,家庭年收入每增加1万元,年饮食支出平均增加________万元.6.利用独立性检验对两个分类变量是否有关系进行研究时,若在犯错误的概率不超过0.005的前提下认为事件A 和B 有关系,则具体计算出的数据应该是( )A .k≥6.635B .k <6.635C .k≥7.879D .k <7.8797.某高校“统计初步”课程的教师随机调查了选该课的一些学生的情况,具体数据如下表:非统计专业统计专业男13 10女7 20为了判断主修统计专业是否与性别有关系,根据表中数据得到,k=50(13×20-10×7)220×30×23×27≈4.844,因为k>3.841,所以确定主修统计专业与性别有关系,那么这种判断出错的可能性为________.与销售额(单位:百万元)之间有如下对应数据:(1)画出散点图;(2)求线性回归方程;(3)试预测广告费支出为百万元时,销售额多大?9.下表提供了某厂节能降耗技术改造后生产甲产品过程中记录的产量x(吨)与相应的生产能耗y(吨标准煤)的几组对照数据.(1)请画出上表数据的散点图;(2)请根据上表提供的数据,用最小二乘法求出关于的线性回归方程;(3)已知该厂技改前吨甲产品的生产能耗为吨标准煤,试根据(2)求出的线性回归方程,预测生产吨甲产品的生产能耗比技改前降低多少吨标准煤(参考数值:)9.某大学餐饮中心为了了解新生的饮食习惯,在全校一年级学生中进行了抽样调查,调查结果如下表所示:喜欢甜品不喜欢甜品合计南方学生60 20 80北方学生10 10 20合计70 30 100(1)甜品的饮食习惯方面有差异”;(2)已知在被调查的北方学生中有5名数学系学生,其中2名习惯甜品,现在从这5名学生中随机抽取3人,求至多有1人喜欢甜品的概率.10、我市某校某数学老师这学期分别用两种不同的教学方式试验高一甲、乙两个班(人数均为人,入学数学平均分和优秀率都相同,勤奋程度和自觉性都一样)。
高中数学选修1-2
第二章 推理与证明 §2.1 合情推理与演绎推理 2.1.1 合情推理 2.1.2 演绎推理
§2.2 直接证明与间接证明 2.2.1 综合法和分析法 2.2.2 反证法 全章素养整合 章末检测(二)
第三章 数系的扩充与复数的引入 §3.1 数系的扩充和复数的概念 3.1.1 数系的扩充和复数的概念 3.1.2 复数的几何意义
§3.2 复数代数形式的四则运算 3.2.1 复数代数形式的加减运算及其几何
意义 3.2.2 复数代数形式乘除运算 全章素养整合 章末检测(三)
第四章 框图 §4.1 流程图 §4.2 结构图 全章素养整合 章末检测(四)
返回上层
山东金太阳书业有限公司 数学(选修1-2)
使用说明
1 本光盘为成盘,欢迎使用。 本光盘内容为可编辑模式,使用中如发现压字现象,
2
请关闭全部幻灯片,重新打开即可。 3 点击——直接进入本科目内容演示
第一章 统计案例 §1.1 回归分析的基本思想及其初步应
用 §1.2 独立性检验的基本思想及其初步
应用 全章素养整合 章末检测(一)
苏教版高中数学选修1-2回归分析课件(21张)
11
思考:在时刻x=9s时,质点运动位置一定 是22.6287cm吗?
4、线性回归模型
y a bx
其中a+bx是确定性函数, 是随机误差
注:随机误差 产生的主要原因:
(1)所用的确定性函数不恰当;
(2)忽略了某些因素的影响;
(3)存在观测误差。
2020年1月3日5时52分
12
5
5 15.69 25 78.45
6
6 16.12 36 96.72
7
7 16.98 49 118.9
8
8 21.06 64 168.5
∑
36 104.66 204 560.1
其中:x 2020年1月3日5时52分
xi 4.50 y n
yi 13.08 n
8
(3)求线性回归方程:
20
15 系列1
10
5
0
0
2
4
6
8
10
从散点图看出,样本呈直线趋势,时间x与位置
观测值y有较好的线性关系,可以用线性回归方
程202刻0年1月画3日它5时52们分 之间的关系.
7
(2) 列表
i
xi
yi
xi2
xiyi
1
1
5.54
1
5.54
2
2
7.52
4 15.04
3
3 10.02 9 30.06
4
4 11.73 16 46.92
xi
yi
xi2
xiyi
0
542
0
0
5
603
25
3015
10
672
选 修1-2第一章
第 一 章 统 计 案 例1.1 回归分析的基本思想及其初步应用飞跃,这里是最好的起点……1. 下列两个变量之间的关系中,是函数关系的是( ). A. 学生的性别与他的数学成绩 B. 人的工作环境与健康状况 C. 女儿的身高与父亲的身高 D. 正三角形的边长与面积2. 给出下列变量间的关系:①学生的学习态度与学习成绩之间的关系;②教师的执教水平与学生的学习成绩之间的关系; ③学生的身高与学生的学习成绩之间的关系; ④家庭的经济条件与学生的学习成绩之间的关系. 其中是相关关系的是( ). A. ①② B. ①③ C. ①④ D. ②③3. 下面两个变量间的关系不是函数关系的是( ). A. 正方体的棱长与体积 B. 角的度数与它的正弦值C. 单产为常数时,土地面积与粮食总产量D. 日照时间与水稻亩产量4. 关于变量y 与x 之间的回归直线方程叙述正确的是( ). A. 表示y 与x 之间的一种确定性关系 B. 表示y 与x 之间的相关关系 C. 表示y 与x 之间的最真实的关系D. 表示y 与x 之间真实关系的一种效果最好的拟合 5. 已知变量x 与y 间的一组数据如下:由表可计算出变量x ,y 的线性回归方程为________.6. 将形如y =ax b +c (b ≠0)的函数转化成线性函数的方法:令________,则得到方程________,其函数的图象是一条直线.7. 有下列关系:①名师出高徒;②球的体积与该球的半径之间的关系;③苹果的产量与气候之间的关系;④森林中的同一种树,其断面直径与高度之间的关系;⑤学生与他(她)的学号之间的关系;⑥乌鸦叫,没好兆.其中,具有相关关系的是________.8. 若回归直线方程中的回归系数b =0,则相关系数r =______. 9. 在某年一项关于16艘轮船的研究中,船的吨位区间从192吨到3 246吨,船员的数目从5人到32人.船员人数y 关于船的吨位x 的线性回归方程为y ^=9.5+0.0 062x . (1)假设两艘轮船吨位相差1 000吨,则船员平均人数相差多少? (2)对于最小的船,估计的船员数是多少?对于最大的船,估计的船员数是多少?(结果保留整数)10. )有如下的统计资料:若由资料可知y 对x (1)y 与x 之间的线性回归方程;(2)估计使用年限为10年时,维修费用是多少万元.课内与课外的桥梁是这样架起的……11. 为了考查两个变量x 和y 之间的线性相关性,甲、乙两位同学各自独立地做了100次和150次试验,并且利用线性回归方法,求得回归直线分别为l 1和l 2,已知两个人在试验中发现对变量x 的观测数据的平均值都是s ,对变量y 的观测数据的平均值都是t ,那么下列说法正确的是( ).A. l 1和l 2有交点(s ,t )B. l 1和l 2相交,但交点不一定是(s ,t )C. l 1与l 2必定平行D. l 1与l 2必定重合12. 若某地财政收入x 与支出y 满足回归直线方程y ^=bx +a +e (单位:亿元),其中b =0.8,a =2,|e |≤0.5,如果今年该地区财政收入10亿元,则今年支出预计不会超过( ).A. 10亿元B. 9亿元C. 10.5亿元D. 9.5亿元13. 许多因素都会影响贫富,教育也是其中之一,在研究这两者的关系时收集了美国50个州的成年人受过9年或更少教育的百分比(x )和收入低于官方规定的贫困线的人数占本州人数的百分比(y )的数据,建立的回归直线方程y ^=0.8x +4.6,斜率的估计等于0.8,说明________________;成年人受过9年或更少教育的百分比(x )或收入低于官方规定的贫困线的人数占本州人数的百分比(y )之间的相关系数________.(填“大于0”或“小于0”)14. 用施化肥量x (kg)预报水稻产量y (kg)的回归直线方程为y ^=5x +250,当施化肥量为80 kg 时,水稻产量________为650 kg.(填“一定”或“不一定”)16. 在7块面积相同的试验田上进行关于施的化肥量对水稻产量影响的试验,得到如下(1)(2)当施的化肥量x =28 kg 时,预测水稻的产量.(2009·复旦大学)设Q 是有理数集,集合X ={X |X =2+2b ,a ,b ∈Q ,x ≠0},在下列集合:①{2x |x ∈X };②{x /2|x ∈X };③{1/x |x ∈X };④{x 2|x ∈X }中,和X 相同的集合有________个.答案:317. 已知10只狗的血球体积及红血球的测量值如下:(x (血球体积,单位:mm 3),(2)求出x ,y ,∑i =110x i y i ,∑i =110x 2i ;(3)由散点图判断能否用线性回归方程来刻画x 与y 之间的关系,若能,求出线性回归方程.对未知的探究,你也行!18. 某考察团对全国10大城市进行职工人均平均工资x 与居民人均消费y 进行统计调查,y 与x 具有相关关系,回归方程y ^=0.66x +1.562(单位:千元),若某城市居民消费水平为7.675,估计该城市消费额占人均工资收入的百分比为( ).A. 10%B. 72.3%C. 67.3%D. 83%19.则y 与x A. y ^=380.530+0.4 845x B. y ^=442+0.210 9x C. y ^=275.697 2+0.486 7x D. y ^=150.0+0.50x20. 为考虑广告费用x 与销售额y 之间的关系,随机抽取5家超市,得到如下表所表示的数据:21. 为研究弹簧质量x (单位:克)对长度y (单位:厘米)的影响,对不同质量的6根弹簧进(1)(2)如果散点图中的各点大致分布在一条直线的附近,求y 与x 之间的线性回归方程; (3)对x ,y 两个变量进行相关性检验.解剖真题,体验情境。
高中数学选修1-2-回归分析第一节.ppt
,a^ = y -b^ x ,
n
xi- x 2
n
x2i -n x 2
i=1
i=1
其中 x =1ni=n1xi, y =1ni=n1yi,( x , y )称为样本点的中心.
课前探究学习
课堂讲练互动
(3)解释变量和预报变量 线性回归模型与一次函数模型的不同之处是增加了随机误差项e, 因变量y由 自变量x 和 随机误差e 共同确定,即自变量x只解 释部分y的变化,在统计中,我们也把自变量x称为解释变量,因变 量y称为预报变量.
课前探究学习
课堂讲练互动
【变式1】 以下是某地搜集到的新房屋的销售价格y和房屋的面积x 的数据:
房屋面积/m2 115 110 80 135 105 销售价格/万元 24.8 21.6 18.4 29.2 22
(1)画出数据对应的散点图; (2)求线性回归方程,并在散点图中加上回归直线; (3)据(2)的结果估计当房屋面积为150 m2时的销售价格.
1.1 回归分析的基本思想及其初步应用
课前探究学习
课堂讲练互动
【课标要求】 1.了解随机误差、残差、残差分析的概念; 2.会用残差分析判断线性回归模型的拟合效果; 3.掌握建立回归模型的步骤; 4.通过对典型案例的探究,了解回归分析的基本思想方法
和初步应用.
课前探究学习
课堂讲练互动
【核心扫描】 1.利用散点图分析两个变量是否存在相关关系,求线性回归方
6
所以
(yi-y^ i)2≈0.013
6
18,
(yi- y )2=14.678 4.
i=1
i=1
所以,R2=1-01.40.16378184≈0.999 1, 回归模型的拟合效果较好.
【高考一轮复习】高中数学(苏教版选修1-2)配套课件:1.2 回归分析
想一想:回归分析中,利用回归直线求出的函数值是真实值吗?
为什么?
提示 不一定是真实值,利用回归直线方程求出的值,在很多
时候是个预报值,与真实值之间可能有差异,因为真实值还 受到其他因素的影响.
课前探究学习
课堂讲练互动
名师点睛 1.回归分析 (1)回归分析是对具有相关关系的两个变量进行统计分析的一 种方法,若两个变量不具有相关关系,则分析没有意义. (2)线性回归模型 y=bx+a+ε 与一次函数的不同之处是增加了 随机误差项 ε,最小二乘估计a和b就是对未知参数 a、b 的最好 估计,它与真实值 a 和 b 之间也存在着误差.因变量 y 由自变 量 x 和随机误差共同确定,即自变量 x 只解释部分 y 的变化. (3)线性回归方程y=a+bx,一定过( x , y ),可利用该直线方 程对 y 的值做出估计.
2在临界值表中查出一个r的 临界值r0.05 (其中1-0.95=0.05称
为 检验水平 ); (3)计算 样本相关系数r ; (4)作出统计推断:若 |r|>r0.05 ,则否定H0,表明有 95% 的把握 认为x与y之间具有 线性相关关系 ;若 |r|≤r0.05 , 则 没 有 理 由 拒绝原来的假设H0,即就目前数据而言,没有充分理由认为x 与y之间有 线性相关关系 .
y 76 75 71 70 76 79 65 77 62 72
试求初一和初二数学分数间的线性回归方程.
课前探究学习
课堂讲练互动
[思路探索] 用公式求出b,a,得直线方程. 解 因为 x =71, xi2=50 520, y =72.3,
i=1 10 10
^
^
i=1
xiyi=51 467,
高二数学选修1-2全册课件2、1章末
a=70
c=35
b=30
d=65
100
100
合计
105
950×65-35×30)2 K2 = ≈24.56 100×100×105×95
由于K2>10.828,所以有99.9%的把握认为“注射药物A
后的疱疹面积与注射药物B后的疱疹面积有差异”. [点评] 本题比较新颖,将统计学与古典概型、组合 联系在一起,难度不大,但考查知识全面,而且还需要一 定的识图表能力,是今年命题一热点方向.
人 教 A 版 数 学
10
^ a≈7.37-0.1752×44.5=-0.4175. ^ ∴回归直线方程为y=0.1752x-0.4175.
第一章
统计案例
[例2] 想象一下一个人从出生到死亡,在每个生日都 测量身高,并作出这些数据散点图,这些点将不会落在一 条直线上,但在一段时间内的增长数据有时可以用线性回 归来分析.下表是一位母亲给儿子作的成长记录. 年龄/周岁 身高/cm 年龄/周岁 身高/cm 3 4 5 6 7 8 9 90.8 97.6 104.2 110.9 115.6 122.0 128.5 10 11 12 13 14 15 16 134. 140. 147.6 154.2 160.9 167.5 173.0 2 8
R2≈0.999,
所以残差平方和为4.53,相关指数为0.999,故该函数
模型能够较好地反映年龄与身高的关系.
人 教 A 版 数 学
第一章
统计案例
[例3]
(2010·辽宁理,18)为了比较注射A,B两种药
物后产生的皮肤疱疹的面积,选200只家兔做实验,将这
200只家兔随机地分成两组,每组100只,其中一组注射药 物A,另一组注射药物B. 下表1和表2分别是注射药物A和B后的试验结果.(疱 疹面积单位:mm2)
高中数学选修一《回归分析》课件
解:画出散点图
y/cm
x/cm
列表:
i
xi
yi
xi2
yi2
1
154 155 23 716 24 025
2
157 156 24 649 24 336
3
158 159 24 964 25 281
4
159 162 25 281 26 244
5
160 161 25 600 25 921
6
161 164 25 921 26 896
例 始祖鸟是一种已经灭绝的动物.在一次考古活动中,
科学家发现了始祖鸟的化石标本共6个,其中5个同时
保有股骨(一种腿骨)和肱骨(上臂的骨头).科学家检
查了这5个标本股骨和肱骨的长度如下:
编号
1
2
3
4
5
股骨长度x/cm 38 56 59
64
74
肱骨长度y/cm 41 63 70
72
84
(1)求出肱骨长度y对股骨长度x的线性回归方程.
得 Q(a,b) ( y1 a bx1 )2 ( y2 a bx2 )2 ( yn a bxn )2 达到最小.此时
n
n
b lxy lxx
(xi x)(yi y)
i1
n
(xi x)2
xiyi nxy
i1 n
,
x
2 i
nx 2
i1
i1
a y bx.
解(1)画散点图如下,两个变量呈现出近似的线性关
【提升总结】 线性回归方程的求解步骤:
(1)画散点图,通过图形来判断是否线性相关.
(2)求回归系数 a,b:
n
n
(xi x)(yi y)
2019-2020学年苏教版选修1-2 回归分析 课件(17张)
������
������
量是样本相关系数 r= ������∑=1(������������-������)(������������-������) =
������∑=1������������������������-n������ ������
.
������∑=������1(������������-������)2������∑=������1(������������-������)2
一二
4.作统计推断.如果|r|>r0.05,表明有 95%的把握认为 x 与 Y 之间具有线 性相关关系.如果|r|≤r0.05,我们没有理由拒绝原来的假设.这时寻找回归直
线方程是毫无意义的.
思考 4 两个变量具有相关关系和具有函数关系有何区别?
提示:相关关系与函数关系不同,因为函数关系是一种确定性的关系;而 相关关系是一种非确定性的关系,它包括两种情况:一是两个变量中,一个变 量为可控制变量,另一个变量为随机变量;二是两个变量均为随机变量.而函 数关系可以看成是两个非随机变量之间的关系.另一方面,函数关系是一种 因果关系,而相关关系不一定是因果关系,也可以是伴随关系.
^
(4)当 x=10 时,������=1.23×10+0.08=12.38(万元),即假设使用 10 年时,维修
费用约为 12.38 万元.
探究一
探究二
点评:求回归直线方程的步骤:
(1)在分析两个变量的相关关系时,可根据样本数据散点图确定两个变
量之间是否存在相关关系.
(2)把数据制成表,从表中计算出������, ������, ������12 + ������22+…+���������2��� ,x1y1+x2y2+…+xnyn
高中数学选修1-2精品课件2:1.1 回归分析的基本思想及其初步应用(二)
的统计资料:
使用年限 x
2
3
4
5
6
维修费用 y 2.2 3.8 5.5 6.5 7.0
若由资料知,y 与 x 呈线性相关关系. 试求:(1)线性回归方程^y =b^ x+^a 的回归系数^a 、b^ ;
(2)求残差平方和;
(3)求相关指数 R2;
(4)估计使用年限为 10 年时,维修费用是多少?
解:(1)由已知条件制成下表:
i
12
3
4
5 合计
xi
23
4
5
6
20
yi 2.2 3.8 5.5 6.5 7.0 25
xiyi 4.4 11.4 22.0 32.5 42.0 112.3
x2i
4
9 16 25 36 90
n
n
x =4; y =5;x2i =90; xiyi=112.3
i=1
i=1
于是有b^=1129.03- -55× ×44× 2 5=1120.3=1.23,
所以回归模型的的拟合效果较好.
^a=
y
^
-b
x
=5-1.23×4=0.08.
∴^y =1.23x+0.08.
(2)由公式^y 1=1.23×2+0.08=2.54,得: ^y 2=1.23×3+0.08=3.77, ^y 3=1.23×4+0.08=5, ^y 4=1.23×5+0.08=6.23, ^y 5=1.23×6+0.08=7.46,
练习
2.为研究重量 x(单位:克)对弹簧长度 y(单位:厘米)的影 响,对不同重量的 6 个物体进行测量,数据如下表所示:
x 5 10 15 20 25 30 y 7.25 8.12 8.95 9.90 10.9 11.8 (1)作出散点图,并求线性回归方程: (2)求相关指数 R2,并判断模型的拟合效果; (3)进行残差分析.
2019-2020学年苏教版选修1-2 回归分析 课件(25张)
2.举例说明怎样确定线性回归的模型 剖析:在确定数据适合哪种模型之前,首先应该对观测数据绘图,以便进 行简单的观测.例如:为了研究建立初始工资与当前工资的回归模型,首先对 观测数据绘图如下图所示.
从图中可以发现初始工资与当前工资的趋势大概呈线性关系,可以建 立线性回归方程.如果观测数据不呈线性分布,那么还可以根据其他方程模 型的观测数据分布图形的特点以及对建立各方程后所得的 R2 进行比较以 便确定一种最佳方程式.
(2)回归分析是对具有相关关系的两个变量进行统计分析的一种常用
方法.
(3)对于一组具有线性相关关系的数据(x1,y1),(x2,y2),…,(xn,yn),回归直线
���^���
=
���^���x+���^���的斜率和截距的最小二乘估计公式分别为���^���
=
������
������∑=1(������������ -������)(������������ -������) ������∑=������1(������������-������)2
的图形称为残差图.
(5)我们可以用相关指数 R2 来刻画回归的效果,其计算公式是
R2=1-������∑���=���∑���=���������11((������������������������--^���������������)���)22.
(6)R2
������
越大,意味着残差平方和∑
1.相关分析的意义和作用是什么 剖析:函数是大家比较熟悉的概念,它是指变量之间的确定性关系,即当 X 取某一数值 x 时,变量 Y 按照某种规则总有一个确定的数值与之对应.相 关关系则是指变量之间的非确定性关系,由于随机因素的干扰,当变量 X 取 确定值 x 时,变量 Y 的取值不确定,是一个随机变量,但它的概率分布与 X 的 取值有关.这里,我们看到了函数关系与相关关系的本质区别,在函数关系中 变量 X 对应的是变量 Y 的确定值,而在相关关系中,变量 X 对应的是变量 Y 的概率分布.换句话说,相关关系是随机变量之间或随机变量与非随机变量 之间的一种数量依存关系,对于这种关系,只能运用统计方法进行研究.通过 对相关关系的研究又可以总结规律,从而指导人们的生活与生产实践.
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
几个值都可以算出来(通过计算器计算)
∴r
x y nxHale Waihona Puke yi 1 i in
( xi2 n( x) 2 )( yi2 n( y ) 2 )
i 1 i 1
n
n
0.963
又∵ r0.05 0.707 0.963 ∴认为x与y具有线性关系
ˆ 1.345 b 又由公式(1)得 ˆ 53.191 a 则回归方程为 y ˆ 53.191 1.345x
教学目标: 1.通过对典型案例的探究,进一步了解回归的 基本思想方法及初步应用。 2.能通过公式求出回归方程。 3.能运用相关性检验判断两个变量构成的回归 方程是否有意义。 重难点: 1.回归思想的理解与运用。 2.如何求回归方程并会判断方程有无意义。
新课程网校原创资料 版权所有 转载必究
ˆx 称为线性回归方程,对应的直线 ˆ a ˆ b y
ˆ 3.5361 2.1214x y
数学应用1:
例1:下表给出了我国从1949年到1999年的人口数据
资料,根据表中数据估计我国2004年的人口数。
年份(x)
人口数/ 百万(y)
1949 1954
1959 672
1964 705
1969 807
1974 909
1979 975
1984 1035
1989 1107
1994 1177
1999 1246
542
603
简解:作出散点图发现点在一条直线附近,可以用 y a bx
ˆ 14.453 b 来表示变量x与y关系,根据公式(1)算得 ˆ 527.591 a
ˆ 527.591 14.453x 则线性回归方程为 y
• 我们希望总误差最小,即下式值最小
i 1
通常记为
n
2 i
( yi bxi a)
i 1
n
2
而此时求出的a与b值可作为较精确的值,
ˆ ˆ与b a
n ( xi x )( yi y ) 计算公式为: i 1 b n (1 ) 2 ( xi x ) i 1 a y b x
0
对于刚才讲的例题1,可以这样检 验:
(1)提出统计假设 H 0 :变量x, y不具有线性相关关系 (2)由0.05与 n 2 在课本93页查得 r0.05 0.602 (3)根据公式(2)计算得线性相关系数为r =0.998 (4)因为|r| =0.998>0.602,所以有95%的把握认为变量 x, y具有线性相关关系,即所求出的线性方程是有意义的
程度越弱;
对r进行显著性检验,步骤如下:
(1)提出统计假设 H 0:变量x, y不具有线性 相关关系 (2)如果以95%的把握做判断,通过课本93页的 附录1查出一个r的临界值 r0.05 (其中1-0.95=0.05称为检验水平) (3)计算样本相关系数r (4)做出统计判断: 若 r r0.05 则否定假设H ,表明有95%的 把握认为变量x, y之间具有线性相关关系; 若 r r0.05 则不拒绝假设,即没有充分理由 认为变量x, y具有线性相关关系
从而估计出2004年的人口数。
求回归方程步骤:
(1)作散点图(有样本点是否呈直线趋势来判断两个 变量是否线性相关) ˆ 和回归截距 a ˆ (2)根据公式求回归系数 b
(3)写出回归方程,根据需要进行预测估计
再解决问题(1):检验模型
是否合理?
• 对随机抽取的n对数据 ( xi , yi )(i 1,2,3n) 样本相关系数r的计算公式为 (2)
25 20 15 10 5 0
● ● ● ● ●
●
● ●
2
4
6
8
10
从图中我们看出点呈直线趋势,即时间x与观测值y之间 有着较好的线性关系。再根据《数学》(必修3)的线 性回归的系数公式得线性回归方程为: 那么问题就解决了!
ˆ 3.5361 2.1214x y
ˆ 22.6287 令x 9, 则y
先解决问题(2):如何求a与b的精确值?
• 设有n对数据 ( xi , yi )(i 1,2,3n) 先描出散点图(部分)如下所示: 25 ●B 20 ●D ● ● 15 ● ● 10 ● A ● 5 c
.
0 2 4 6 8 10 图中每一个点,都有一对应的随机误差
i yi (a bxi )
r
n
• 称 为 对 两 个 变 量 的 相 关 性 检 验
x y
i 1 i i 1
n
i
nx y
n
( xi2 n( x) 2 )( yi2 n( y ) 2 )
i 1
相关系数r的性质:
(1)r 1
(2)
r
越接近于1,x与y的线性相关
程度越强; (3) r 越接近于0,x与y的线性相关
此 处 为 最 小 二 乘 法 ( 见 《 数 学 》 必 修 3 )
• 也可以化为
n xi yi nx y i 1 b n 2 2 x n ( x ) i i 1 a y b x
ˆ 为回归系数, ˆ y ˆ 为回归截距, b 为回归直线, a 为回归值。
建构数学: • 用 y a bx
表示上述两个变量x与y关系,也称为线性回归模型。 其中
是确定性函数关系, 表示随机误差 。
• 对于一个问题来说,如果用
y a bx
y a bx
这样的模型表示两个变量的关系,那么
(1)这个模型合理吗? (2)如果模型合理,又如何求出其中的a与b的值?
数学应用2: 例2:随机抽取8对母女的身高数据,试根据这 些数据探讨y与x之间的关系。 母亲身高 154 157 158 159 160 161 162 163
x/cm
女儿身高 y/cm
155 156
159
162
161
164
165
166
简解:作出散点图发现点在一条直线附近,
2 2 x , y , x , y ∵ i i , xi yi , i 1 i 1 i 1 n n n
提醒:
在用公式(2)计算样本相关系数r时,需要根据
公式特点先求出
x , y , x , y , xi yi ,
i 1 2 i i 1 2 i i 1
n
n
n
回顾反思:
1.判断两个变量是否具有线性相关关系, 可以通过散点图或者进行相关性检验判 断。 2.对具有线性关系的两个变量,他们的回 归方程通过公式(1)来求出,方程到底 是否有意义还需要进行相关性检验(用 到公式(2))来判断。
学生活动:
ˆ 22.6287 令x 9, 则y
• 这个结果是否一定很准确?为什么?
• 结果不准确,而是存在一些误差,其原因有: ①所用的确定型函数不恰当②忽略了某些因素 的影响③存在观测误差
• 注:两个相互联系的变量之间的关系大体有两
种:一是确定性函数关系,另一个是非确定性 关系(如相关关系)
回归分析
问题情境:
对一作直线运动的质点的运动过程观测了8次, 得到如下表所示的数据:
时刻 x/s 位置观测值 y/cm 1 5.5 2 3 4 5 6 7 8 7.5 10.0 11.7 15.7 16.1 17.0 21.1
• 问题:试估计x为9s时的位置y的值是多少?
方法是:先作出散点图,如下所示