陕西省榆林育才中学高中数学 第1章《统计案例》1.1.1回归分析的基本思想及其初步应用(1)导学案(
北师大版选修1-2高中数学1.1.1回归分析的大体思想及其

陕西省榆林育才中学高中数学第1章《统计案例》1.1.1回归分析的大体思想及其初步应用(2)导学案(无答案)北师大版选修1-2学习目标1. 通过典型案例的探讨,进一步了解回归分析的大体思想、方式及初步应用;2. 了解评价回归效果的三个统计量:总误差平方和、残差平方和、回归平方和.3. 会用相关指数,残差图评价回归效果.学习进程一、课前预备(预习教材P4~ P7,找出疑惑的地方)温习1:用相关系数r可衡量两个变量之间关系.r>0, 相关, r<0 相关;r越接近于1,两个变量的线性相关关系,它们的散点图越接近;r>,两个变量有关系.温习2:评价回归效果的三个统计量:总误差平方和;残差平方和;回归平方和.二、新课导学※学习探讨探讨任务:如何评价回归效果?新知:一、评价回归效果的三个统计量(1)总误差平方和:(2)残差平方和:(3)回归平方和:二、相关指数:2R表示对的奉献,公式为:2R=2R的值越大,说明残差平方和,说明模型拟合效果 .3、残差分析:通过来判断拟合效果.通常借助图实现.残差图:横坐标表示,纵坐标表示 .残差点比较均匀地落在的区的区域中,说明选用的模型,带状区域的宽度越,说明拟合精度越,回归方程的预报精度越 .小结:分清总误差平方和、残差平方和、回归平方和,初步了解如何评价两个不同模型拟合效果的好坏.例2 假定小麦大体苗数x 与成熟期有效苗穗y 之间存在相关关系,今测得5组数据如下: xy(2)求回归方程并对于基本苗数预报期有效穗数;(3)求2R ,并说明残差变量对有效穗数的影响占百分之几.(参考数据:2115101.51,6746.76,n ni i i i i x x y ====∑∑ 521()50.18i i yy =-=∑, 521()9.117i i i y y =-=∑)※ 动手试试练1. 某班5名学生的数学和物理成绩如下表:学生学科A B C D E 数学成绩(x )88 76 75 64 62 物理成绩(y ) 78 65 70 62 60(导学案第1页例1)(4)求学生A,B,C,D,E 的物理成绩的实际成绩和回归直线方程预报成绩的差2i i e y y =-.并作出残差图评价拟合效果.小结:1. 评价回归效果的三个统计量:2. 相关指数评价拟合效果:3. 残差分析评价拟合效果:三、总结提升※ 学习小结一般地,成立回归模型的大体步骤:一、肯定研究对象,明确解释、预报变量;二、画散点图;3、肯定回归方程类型(用r 判定是不是为线性);4、求回归方程;五、评价拟合效果.※ 知识拓展在现行回归模型中,相关指数2R 表示解释变量对预报变量的奉献率,2R 越接近于1,表示回归效果越好.若是某组数据能够采取几种不同的回归方程进行回归分析,则能够通过2R 作出选择,即选择2R 大的模型.学习评价).A. 专门好B. 较好C. 一般D. 较差※ 当堂检测(时量:5分钟 满分:10分)计分:1. 两个变量 y 与x 的回归模型中,别离选择了 4 个不同模型,它们的相关指数 2R 如下 ,其中拟合效果最好的模型是( ).A. 模型 1 的相关指数2R 为B. 模型 2 的相关指数2R 为C. 模型 3 的相关指数2R 为D. 模型 4 的相关指数2R 为2. 在回归分析中,残差图中纵坐标为( ).A. 残差B. 样本编号C. xD. n e3. 通过12,,,n e e e 来判断模拟型拟合的效果,判断原始数据中是不是存在可疑数据,这种分工称为( ).A.回归分析B.独立性查验分析C.残差分析D. 散点图分析4.2R 越接近1,回归的效果 .5. 在研究身高与体重的关系时,求得相关指数2R ,能够叙述为“身高解释了69%的体重转变,而随机误差奉献了剩余 ”所以身高对体重的效应比随机误差的 .。
高中数学 第一章 统计案例 1.1 回归分析的基本思想及初步应用说课稿 新人教A版选修12

回归分析的基本思想及初步应用课标理解以及教学应对:回归分析是高中阶段较难的一个内容,它属于统计学部分。
在教学中,抓住统计学的基本思想“用样本数据估计总体的数据”,让学生知道统计学知识的这个共性;展现概率统计学的应用功能——“分析统计出来的数据为决策提供依据”;让学生体会学以致用。
学生在学过必修三《两个变量的线性关系》的基础上,为学习本节做了很好的铺垫,在教学中从这个基础出发,逐渐展开,分析对比,扩展出必修三中两变量分析过程中没有的“通过误差分析判断是否需要重新建模”这步,通过完善已学内容完成新课教学,从实质上降低本节内容难度。
通过本节的学习,也为后一节“独立性检验的基本思想”的建立提供一个很好的参照模板。
教材理解及教学应对:本节的重点为:回归分析思想的建立,利用最小思想二乘法求回归直线斜率及截距、,残差分析、求相关指数;难在计算和回归思想的建立,在“两难”的情况下,择“一难”即“回归思想建立”作为突破口,回归思想的建立重在逻辑思维的提升,步骤套路的形成,反而比求刻板、复杂回归方程的斜率及截距,相关指数等等更简单,也更具有趣味性,学生在攻克“回归思想建立”的难关后,增强了掌握本节内容了自信心,在“突破口”的带动作用下,促使学生自己在技巧性不是很强的计算方面下功夫,故而使这节内容是在学生脑海里“枝繁叶茂”。
学生学情及教学应对:针对公安一种大多数学生基础较好,本节课没用在公式推导,计算展示上花过多时间,更注重思想的形成和探究能力的培养,为了使少数基础薄弱的学生也能跟得上,本节课多次采用归纳类比法,使得知识模块之间更清晰明了和问题解决也“有模可参”,从而降低了知识内容的难度。
教法:本节课主要采用“问题探究法”引导课堂内容层层推进,力求每个问题与前后知识都紧密联系、承上启下,确保整节课内容主干清晰、逻辑严密。
每个问题都有完整的“发现问题分析问题解决问题”过程。
而且在问题探究的过程中,采用归纳类比法,比如由“线性回归方程”提出“非线性回归方程”,以及“在什么情形是选择非线性回归模型分析两变量关系?”问题的提出都是“举一反三”。
高中数学 第一章 统计案例 1.1 回归分析的基本思想及

高中数学 第一章 统计案例 1.1 回归分析的基本思想及其初步应用预习导航 新人教A 版选修1-21.线性回归模型(1)线性回归模型y =bx +a +e ,其中a 和b 为模型的未知参数,e 称为随机误差.自变量x 称为解释变量,因变量y 称为预报变量. (2)在线性回归方程y ^=a ^+b ^x 中,b ^=121n i ii n ii x x y y x x ==(-)(-)(-)∑∑,a ^=y -b ^x ,其中x =11n i i x n =∑,y =11ni i y n =∑,(x ,y )称为样本点的中心,回归直线过样本点的中心. 思考1 线性回归模型与一次函数模型的区别在哪里?提示:线性回归模型与一次函数模型的不同之处是增加了随机误差项e ,在线性回归模型y =bx +a +e 中,因变量y 的值由自变量x 和随机误差e 共同确定,即自变量x 只能解释部分y 的变化.在实际问题中,线性回归模型适用的范围要比一次函数模型适用的范围大得多,当随机变量e 恒等于0时,线性回归模型就变成了一次函数模型,因此一次函数模型是线性回归模型的特殊形式,线性回归模型是一次函数模型的一般形式.思考2 回归分析中,利用线性回归方程求出的函数值一定是真实值吗?为什么? 提示:不一定是真实值,利用线性回归方程求出的值,只是个预报值,例如人的体重与身高存在一定的线性关系,但体重除了受身高影响外,还受其他因素影响,如饮食等.2.刻画回归效果的方式提示:R2的值越大,说明回归模型拟合的效果越好,残差平方和越小,反之,亦成立.思考4 怎样理解散点图和R2的关系?提示:散点图可以说明变量间有无线性相关关系,但不能精确地说明两个变量之间关系的密切程度,因此需要计算R2来描述两个变量之间的密切程度.。
高中数学第一章统计案例1.1回归分析的基本思想及其初步应用1教案文新人教A版选修1

1.1回归分析的基本思想及其初步应用(1)精美句子1、善思则能“从无字句处读书”。
读沙漠,读出了它坦荡豪放的胸怀;读太阳,读出了它普照万物的无私;读春雨,读出了它润物无声的柔情。
读大海,读出了它气势磅礴的豪情。
读石灰,读出了它粉身碎骨不变色的清白。
2、幸福幸福是“临行密密缝,意恐迟迟归”的牵挂;幸福是“春种一粒粟,秋收千颗子”的收获. 幸福是“采菊东篱下,悠然见南山”的闲适;幸福是“奇闻共欣赏,疑义相与析”的愉悦。
幸福是“随风潜入夜,润物细无声”的奉献;幸福是“夜来风雨声,花落知多少”的恬淡。
幸福是“零落成泥碾作尘,只有香如故”的圣洁。
幸福是“壮志饥餐胡虏肉,笑谈渴饮匈奴血”的豪壮。
幸福是“先天下之忧而忧,后天下之乐而乐”的胸怀。
幸福是“人生自古谁无死,留取丹心照汗青”的气节。
3、大自然的语言丰富多彩:从秋叶的飘零中,我们读出了季节的变换;从归雁的行列中,我读出了集体的力量;从冰雪的消融中,我们读出了春天的脚步;从穿石的滴水中,我们读出了坚持的可贵;从蜂蜜的浓香中,我们读出了勤劳的甜美。
4、成功与失败种子,如果害怕埋没,那它永远不能发芽。
鲜花,如果害怕凋谢,那它永远不能开放。
矿石,如果害怕焚烧(熔炉),那它永远不能成钢(炼成金子)。
蜡烛,如果害怕熄灭(燃烧),那它永远不能发光。
航船,如果害怕风浪,那它永远不能到达彼岸。
5、墙角的花,当你孤芳自赏时,天地便小了。
井底的蛙,当你自我欢唱时,视野便窄了。
笼中的鸟,当你安于供养时,自由便没了。
山中的石!当你背靠群峰时,意志就坚了。
水中的萍!当你随波逐流后,根基就没了。
空中的鸟!当你展翅蓝天中,宇宙就大了。
空中的雁!当你离开队伍时,危险就大了。
地下的煤!你燃烧自己后,贡献就大了6、朋友是什么?朋友是快乐日子里的一把吉它,尽情地为你弹奏生活的愉悦;朋友是忧伤日子里的一股春风,轻轻地为你拂去心中的愁云。
朋友是成功道路上的一位良师,热情的将你引向阳光的地带;朋友是失败苦闷中的一盏明灯,默默地为你驱赶心灵的阴霾。
高中数学第一章统计案例1.1回归分析的基本思想及初步应用2教案新人教A版选修12

高中数学第一章统计案例1.1 回归分析的基本思想及初步应用2教案新人教 A 版选修12【学情分析】:学生已掌握建立线性回归模型的知识,并能用所学知识解决一些简单的实际问题。
在教学中,要结合实例让学生了解评价回归效果的三个统计量:总偏差平方和、残差平方和、回归平方和。
初步了解可以通过求回归模型的相关指数或利用残差分析不同的回归模型的拟合精确度。
在起点低的班级中注重让学生参与实践,鼓励学生通过收集数据,经历数据处理的过程,从而进一步体会回归分析中的数理计算,初步形成运用统计方法解决实际问题的基本思想,认识统计方法在决策中的作用。
让学生直观的观察、思考,借助于线性回归模型研究呈非线性关系的两个变量之间的关系。
【教学目标】:(1 )知识与技能:了解评价回归效果的三个统计量:总偏差平方和、残差平方和、回归平方和;了解偏差平方和分解的思想;了解判断刻画模型拟合效果的方法——相关指数和残差分析;了解非线性模型通过变换转化为线性回归模型。
(2 )过程与方法:本节内容先从大学中女大学生的甚高和体重之间的关系入手,求出相应的回归直线方程,从中也找出存在的不足,从而有进行回归分析的必要性,进而学习相关指数,用相关指数来刻画回归的效果。
(3)情感态度与价值观:从实际问题中发现自己已有知识的不足之处,激发学生的好奇心和求知欲,培养学生不满足于已有知识,勇于求知的良好个性品质,引导学生积极进取。
【教学重点】:1、了解判断刻画模型拟合效果的方法——相关指数和残差分析;2、通过探究使学生体会有些非线性模型通过变换可以转化为线性回归模型。
【教学难点】:1、解释残差变量的含义;2、了解偏差平方和分解的思想。
【课前准备】:课件【教学过程设计】:教学环节教学活动设计意图一、创设情境二、探究新知1由例1知,预报变量(体重)的值受解释变量(身高)或随机误差的影响。
2.问题一:为了刻画预报变量(体重)的变化在多大程度上与解释变量(身高)有关?在多大程度上与随机误差有关?我们引入了评价回归效果的三个统计量:总偏差平方和、残差平方和、回归平方和。
高中数学 第一章 统计案例 1.1 回归分析的基本思想及

回归分析的基本思想及其初步应用方法总结
1.建立回归模型的基本步骤为:
(1)确定研究对象,明确哪个变量是解释变量,哪个变量是预报变量.
(2)画出解释变量和预报变量的散点图,观察它们之间的关系(如是否存在线性关系等).
(3)由经验确定回归方程的类型(如观察到数据呈线性关系,则选用线性回归方程).
(4)按一定规则(如最小二乘法)估计回归方程中的参数.
(5)得出结果后分析残差图是否有异常(如个别数据对应残差过大,残差呈现不随机的规律性等).若存在异常,则检查数据是否有误,或模型是否合适等.
2.分析两个变量相关关系的常用方法有:
(1)利用散点图进行判断:把样本数据表示的点在平面直角坐标系中作出,从而得到散点图,如果这些点大致分布在通过散点图中心的一条直线附近,那么就说这两个变量之间具有线性相关关系.
(2)利用相关指数R2进行判断.
3.对具有相关关系的两个变量进行统计分析时,首先进行相关性检验,在确认具有线性相关关系后,再求回归直线方程.
对于非线性回归问题,可以转化为线性回归问题去解决.
1。
高中数学第一章统计案例1.1回归分析的基本思想及其初步应用预习导航新人教A版选修1-2

高中数学 第一章 统计案例 1.1 回归分析的基本思想及其初步应用
预习导航 新人教A 版选修1-2
1.线性回归模型 (1)线性回归模型y =bx +a +e ,其中a 和b 为模型的未知参数,e 称为随机误差.自变量x 称为解释变量,因变量y 称为预报变量. (2)在线性回归方程y ^=a ^+b ^x 中,b ^ =,a ^=y -b ^x ,其中x =,y =,(x ,y )称为样本点的中心,回归直线过样本点的中心.
思考1 线性回归模型与一次函数模型的区别在哪里?
提示:线性回归模型与一次函数模型的不同之处是增加了随机误差项e ,在线性回归模型y =bx +a +e 中,因变量y 的值由自变量x 和随机误差e 共同确定,即自变量x 只能解释部分y 的变化.在实际问题中,线性回归模型适用的范围要比一次函数模型适用的范围大得多,当随机变量e 恒等于0时,线性回归模型就变成了一次函数模型,因此一次函数模型是线性回归模型的特殊形式,线性回归模型是一次函数模型的一般形式.
思考2 回归分析中,利用线性回归方程求出的函数值一定是真实值吗?为什么? 提示:不一定是真实值,利用线性回归方程求出的值,只是个预报值,例如人的体重与身高存在一定的线性关系,但体重除了受身高影响外,还受其他因素影响,如饮食等.
2.刻画回归效果的方式
提示:R2的值越大,说明回归模型拟合的效果越好,残差平方和越小,反之,亦成立.思考4 怎样理解散点图和R2的关系?
提示:散点图可以说明变量间有无线性相关关系,但不能精确地说明两个变量之间关系的密切程度,因此需要计算R2来描述两个变量之间的密切程度.。
高中数学 第一章 统计案例 1.1 回归分析的基本思想及其初步应用课件2 新人教A版选修1-2

另外, 我们还可以用相关指数R2来刻画回归的效果,
n
yi yˆi 2
其计算公式是 : R2
1
i 1 n
.
yi y 2
i 1
显然, R 2取值越大,意味着残差平方和越小,也就
我们可以利用图形来分析残差特性.作图时纵 坐标为残差, 横坐标可以选为样本编号,或身高数据,或 体重估计值等,这样作出的图形为残差图.下图 是以 样本编号为横坐标的残差图.
残差
编号
图1.14
从图1.1-4中可以看出,第1个样本点和第6个样本 点的残差比较大,需要确认在采集这两个样本点的过程 中是否有人为的错误.如果数据采集有错误,就予以纠 正,然后再重新利用线性回归模型拟合数据;如果数据 采集没有错误,则需要寻找其他的原因.另外,残差点 比较均匀地落在水平的带状区域中,说明选用的模型比 较合适.这样的带状区域的宽度越窄,说明模型拟合精 度越高,回归方程的预报精度越高.
从图1.1 - 1中可以看出,
样本点呈条状分布 ,身高和体
·
体重/kg
重有比 较好的线性相关关系 ,
因此可以用回归直线y = bx + a
来近似刻画它们之间的关系.
身高/cm 图1.11
未知参数b和a的最小二乘估计分别为bˆ 和aˆ,
其计算公式如下:
n
xi x yi y
bˆ i1 n
,
xi x 2
随机
思考:在线性回归模型中,e是用bx + a预报真实值y的 随机误差,它是一个不可观测的量,那么应该怎样研究 随机误差呢?
在实际应用中,我们用回归方程yˆ bˆx aˆ中 的yˆ估计(1)中的bx a.由于随机误差e y (bx a), 所以eˆ y yˆ是e的估计量.对于样本点
高中数学1-2 第一章 统计案例1.1回归分析的基本思想及初步应用(1)【学案】

1。
1.1 回归分析的基本思想及其初步应用课标转述:①通过对典型案例(如“人的体重与身高的关系"等)的探究,了解回归的基本思想、方法及初步应用②通过对现行案例(如“质量控制"“新药是否有效”等)的探究,了解实际推断原理和假设检验的基本思想、方法及初步应用。
③通过对典型案例(如“昆虫分类”等)的探究,了解聚类分析的基本思想、方法及初步应用。
④通过对典型案例(如“肺癌与吸烟有关吗”等)的探究,了解独立性检验的基本思想、方法及初步应用。
学习目标:通过典型案例的探究,进一步了解回归分析的基本思想、方法及初步应用。
学习重、难点:了解线性回归模型与函数模型的差异,了解判断刻画模型拟合效果的方法-相关指数和残差分析。
学习过程:一、复习准备:1。
提问:“名师出高徒”这句彦语的意思是什么?有名气的老师就一定能教出厉害的学生吗?这两者之间是否有关?2. {⎧⎨⎩确定关系两个变量间的关系相关不确定关系不相关复习:函数关系是一种确定性关系,而相关关系是一种非确定性关系。
回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法,其步骤:→ → →3。
最小二乘法:线性回归模型ˆy bx a=+,其中 ˆb=ˆa=二、学习新知:1.例题分析:①例1从某大学中随机选取8名女大学生,其身高和体重数据如下表所示:程,并预报一名身高为172cm的女大学生的体重。
解:由于问题中要求根据身高预报体重,因此选取身高为自变量x,体重为因变量y,做散点图:55504540150 155 160 165 170 175 180 x由图可知,样本点呈条状分布,身高和体重有比较好的线性相关关系,可以用线性回归模型ˆy bx a =+来刻画。
由最小二乘法计算:121()()ˆ()ni ii n ii x x y y b x x ==--=-∑∑,ˆay bx =- 其中1111,n n i i i i x x y y n n ====∑∑经计算得:ˆ0.849,85.712b a ==- 于是得线性回归方程得:0.84985.712y x =-所以,对于身高为172cm 得女大学生,由回归方程可以预报其体重为ˆ0.84917285.71260.316()ykg =⨯-=b 得意义是什么?0.849②身高为172cm的女大学生的体重一定是60.316kg吗?如果不是,你能解释以下原因么?2.随机误差和残差⑴引入线性回归模型:Y=bx+a+e解释变量x ,预报变量y,随机误差e产生随机误差的项e的原因是什么?练习反馈研究某灌溉渠道水的流速y与水深x之间的关系,测得一组数据如下:1。
2016_2017学年高中数学第一章统计案例1.1回归分析的基本思想及其初步应用课件新人教A版选修1_2

解析:
5
yi-∧yi2
i=1
∵R2甲=1-
5
=1-1105050=0.845,
yi- y 2
i=1
(3)残差分析 作残差图如下图所示,由图可知,残差点比较均匀地分布 在水平带状区域中,说明选用的模型比较合适.
(4)计算相关指数 R2 计算相关指数 R2≈0.985 5.说明了该运动员的成绩的差异 有 98.55%是由训练次数引起的. (5)做出预报 由上述分析可知,我们可用回归方程∧y=1.041 5x-0.003 875 作为该运动员成绩的预报值. 将 x=47 和 x=55 分别代入该方程可得∧y=49 和∧y=57. 故预测该运动员训练 47 次和 55 次的成绩分别为 49 和 57.
(1)画出散点图; (2)求物理成绩y对数学成绩x的回归直线方程; (3)一名学生的数学成绩是96,试预测他的物理成绩.
[思路点拨]
(1)散点图如图.
(2) x =15×(88+76+73+66+63)=73.2, y =15×(78+65+71+64+61)=67.8.
5
x iyi = 88×78 + 76×65 + 73×71 + 66×64 + 63×61 = 25
5
yi-∧yi2
i=1
R2乙=1-
5
=1-1108000=0.82,
yi- y 2
i=1
∵84.5%>82%,∴甲模型拟合的效果更好.
合作探究•课堂互动
线性回归分析
高中数学 第一章 统计案例 1.1 回归分析的基本思想及初步应用(1)练习(含解析)新人教A版选修1

高中数学第一章统计案例1.1 回归分析的基本思想及初步应用(1)练习(含解析)新人教A版选修1-2编辑整理:尊敬的读者朋友们:这里是精品文档编辑中心,本文档内容是由我和我的同事精心编辑整理后发布的,发布之前我们对文中内容进行仔细校对,但是难免会有疏漏的地方,但是任然希望(高中数学第一章统计案例1.1 回归分析的基本思想及初步应用(1)练习(含解析)新人教A版选修1-2)的内容能够给您的工作和学习带来便利。
同时也真诚的希望收到您的建议和反馈,这将是我们进步的源泉,前进的动力。
本文可编辑可修改,如果觉得对您有帮助请收藏以便随时查阅,最后祝您生活愉快业绩进步,以下为高中数学第一章统计案例1.1 回归分析的基本思想及初步应用(1)练习(含解析)新人教A版选修1-2的全部内容。
回归分析的基本思想及其初步应用(一)班级:姓名:_____________1.下列命题中正确的是().①任何两个变量都具有相关关系②圆的周长与圆的半径具有相关关系③某商品的需求量与该商品的价格是一种非确定性关系④根据散点图求得的线性回归方程可能是没有意义的⑤两个变量的线性相关关系可以通过线性回归方程,把非确定性问题转化为确定性问题进行研究A.①③④B.②④⑤C.③④⑤D.②③⑤解析显然①是错误的,而②中圆的周长与圆的半径的关系为:C=2πR,是一种确定性的函数关系,故应选C.答案C2.设两个变量x和y之间具有线性相关关系,它们的相关系数是r,y关于x的回归直线的斜率是b,纵轴上的截距是a,那么必有( ).A.b与r的符号相同B.a与r的符号相同C.b与r的符号相反D.a与r的符号相反解析因为b>0时,两变量正相关,此时r>0;b<0时,两变量负相关,此时r<0.答案A3.下面4 个散点图中,不适合用线性回归模型拟合其中两个变量的是( )A. B.C. D.答案A4.为了考察两个变量x和y之间的线性相关性,甲、乙两位同学各自独立地做了100次和150次试验,并且利用线性回归方法,求得回归直线分别为l1和l2.已知两个人在试验中发现对变量x的观测数据的平均值都是s,对变量y的观测数据的平均值都是t,那么下列说法正确的是().A.l1和l2有交点(s,t)B.l1与l2相交,但交点不一定是(s,t)C.l1与l2必定平行D.l1与l2必定重合解析都过样本中心点(s,t),但斜率不确定.答案A5.某医学科研所对人体脂肪含量与年龄这两个变量研究得到一组随机样本数据,运用Excel 软件计算得错误!=0。
高中数学 第一章 统计案例 1.1 回归分析的基本思想及初步应用知识点精析 新人教A版1-2 精

回归分析的基本思想及其初步应用一.知识要点,学习目标1.如果一组具有相关关系的数据1122(,),(,),,(,),n n x y x y x y 作出散点图大致分布在一条直线附近,那么我们称这样的变量之间的关系为线性相关关系(也称一元线性相关),这条直线就是回归直线,记为ˆybx a =+. 2.在所求回归直线方程ˆybx a =+中,当x 取i x 时,i i y bx a =+与实际收集到的数据i y 之间的偏差为()i i i i y y y bx a -=-+,偏差的平方为22()[()]i i i i y y y bx a -=-+即以21()n i ii Q y bx a ==--∑ 来刻画出n 个点与回归直线在整体上偏差的平方和,显然Q 取最小值时的,a b 的值就是我们所求的。
应注意,这个最小距离不是通常所指的各数据的点(,)i i x y 到直线的距离,而是各数据点(,)i i x y 沿平行y 轴方向到直线的距离. 121()()()n i i i n ii x x y y b x x ==--=-∑∑1221ni ii n i i x y nx y x nx ==-=-∑∑ a y bx =-这就是我们所要求的公式(无特殊要求时以此公式求回归方程中的a 、b ).其中(,)i i x y 为样本数据,11,n ni i i ix x y y n n ==∑∑为样本平均数,(,)x y 称为样本点中心,且所求线性回归直线经过样本点中心点(如图2所示).当回归直线斜率0b >时,为线性正相关,0b <时为线性负相关.线性回归分析:回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法.前面我们给出了线性回归方程,这里我们主要结合教材分析一元线性回归问题.1.以散点图分析线性相关关系,散点图是较粗略地分析和判断两个具有相关关系的变量是否线性相关的问题,如果是线性相关的,我们可以求其线性回归方程,如果不是线性向相关的,即使求得线性回归方程,也是无效的;也就是说不能对一些数据进行分析判断,不能应用它解决和解释一些实际问题.2.以相关系数分析线性相关关系的强弱两个变量之间的相关关系的样本相关系数:()()ni ix x y y r --=∑可衡量是否线性相关,以及线性相性关系的强弱.由于分子与线性回归方程中的斜率b 的分子一样(这也给出了公式的内在联系以及公式的记法),因此,当0r >时,两个变量正相关;当0r <时两个变量负相关.当r 的绝对值接近1,表明两个变量的线性相关性很强;当r 的绝对值接近0,表明两个变量之间几乎不存在线性相关关系.规定当0.75r >时,我们认为两个变量有很强的线性相关关系.3.解释变量与随机误差对预报精度的影响以及残差分析(1)有关概念由于样本数据点与一元线性回归方程ˆy bx a =+上的点还有一定的差距,这说明了另外的一个因素随机误差e 的影响.于是有线性回归模型y bx a e =++其中a 和b 为模型的未知参数;x 称为解释变量,y 称为预报变量;e 是y 与ˆybx a =+之间的误差,e 叫随机误差。
高中数学 第一章 统计案例 1.1 回归分析的基本思想及其初步应用课堂探究 新人教A版选修12

高中数学 第一章 统计案例 1.1 回归分析的基本思想及其初步应用课堂探究 新人教A 版选修1-2探究一 求回归直线方程 求回归直线方程的一般方法是:(1)作出散点图,将问题所给的数据在平面直角坐标系中描点,这样表示出的具有相关关系的两个变量的一组数据的图形就是散点图.从散点图中我们可以看出样本点是否呈条状分布,从而判断两个量是否具有线性相关关系.(2)求回归系数a ^,b ^,其计算公式如下:b ^=∑i =1nx i -xy i -y∑i =1nx i -x2=∑i =1nx i y i -n x y∑i =1nx 2i -n x 2;a ^=y -b ^x .其中x =∑i =1nx in,y =∑i =1ny in,(x ,y )称为样本点的中心.(3)写出回归直线方程y ^=b ^x +a ^,并用回归直线方程进行预测说明:当x 取x 0时,由线性回归方程可得y 0^的值,从而可进行相应的判断.【典型例题1】某班5名学生的数学和物理成绩如下表:(1)画出散点图;(2)求物理成绩y 对数学成绩x 的回归直线方程; (3)一名学生的数学成绩是96,试预测他的物理成绩.思路分析:先画散点图,分析物理与数学成绩是否有线性相关关系,若相关,再利用公式求线性回归模型.解:(1)如图所示.(2)因为x =15×(88+76+73+66+63)=73.2,y =15×(78+65+71+64+61)=67.8,∑i =15x i y i =88×78+76×65+73×71+66×64+63×61=25 054,∑i =15x 2i =882+762+732+662+632=27 174. 所以b ^=∑i =15x i y i -5x y∑i =15x 2i -5x 2=25 054-5×73.2×67.827 174-5×73.22≈0.625, a ^=y -b ^x ≈67.8-0.625×73.2=22.05.所以y 对x 的回归直线方程是y ^=0.625x +22.05.(3)x =96,则y ^=0.625×96+22.05≈82, 即可以预测他的物理成绩是82. 探究二 残差分析1.利用残差分析研究两个变量间的关系时,首先要根据散点图来判断它们是否线性相关,是否可以用线性回归模型来拟合数据,然后通过残差e 1^,e 2^,…,e n ^来判断模型拟合的效果.2.若残差点比较均匀地分布在水平带状区域中,带状区域越窄,说明模型拟合度越高,回归方程预报精确度越高.【典型例题2】假定小麦基本苗数x 与成熟期有效穗y 之间存在相关关系,今测得5组数据如下:(1)以x (2)求y 与x 之间的回归方程,对于基本苗数56.7预报有效穗; (3)计算各组残差,并计算残差平方和;(4)求R 2,并说明残差变量对有效穗的影响占百分之几?思路分析:求出参数b ^与a ^,然后求出回归直线方程,再检验模型拟合效果,计算出残差,得出结论.解:(1)散点图如下.(2)由图看出,样本点呈条状分布,有比较好的线性相关关系,因此可以用线性回归方程刻画它们之间的关系.设回归方程为y ^=b ^x +a ^,x =30.36,y =43.5,∑i =15x i 2=5 101.56,∑i =15y i 2=9 511.43.x y =1 320.66,x 2=921.729 6,∑i =15x i y i =6 746.76.由b ^=51522155i ii ii x yx y xx ==--∑∑≈0.29,a ^ =y -b ^x ≈34.70,故所求的回归直线方程为y ^=34.70+0.29x.当x =56.7时,y ^=34.70+0.29×56.7=51.143. 估计成熟期有效穗为51.143.(3)由于y i ^=b ^ x i +a ^ ,可以算得e i ^=y i -y i ^分别为e 1^=0.35,e 2^=0.718,e 3^=-0.5,e 4^=-2.214,e 5^=1.624,残差平方和:¶521ii e=∑≈8.43.(4)可得:∑i =15(y i -y )2=50.18,∴R 2=1-8.4350.18≈0.832.所以解释变量小麦基本苗数对总效应约贡献了83.2%,残差变量贡献了约1-83.2%=16.8%.探究三 非线性回归分析在解决实际问题时,研究的两个变量不一定都呈线性相关关系.对于这类问题,常采用适当的变量代换,把问题转化为线性回归问题,求出线性回归模型后,再通过相应的变换,得到非线性回归方程.【典型例题3】某地区六年来轻工业产品利润总额y 与年次x 的试验数据如下表所示:0b 均为正数,求y 关于x 的回归方程.思路分析:解答此题可根据散点图选择恰当的拟合函数,而本题已经给出,只需将其转化为线性函数,利用最小二乘法求得回归直线方程,再将其还原为非线性回归方程即可.解:对y =ab xe 0两边取自然对数,得ln y =ln ae 0+x ln b ,令z =ln y ,则z 与x 的数据如下表:由z =ln ae 0ln b ≈0.047 7,ln ae 0=2.378,即z ^=2.378+0.047 7x ,所以y ^=10.8×1.05x. 规律小结 非线性回归方程的求法探究四 易错辨析易错点 求回归方程时忽略相关性检验致误【典型例题4】在一化学反应过程中,某化学物质的反应速度y (g/min)与一种催化剂的量x (g)有关,现收集了如下表所示的8组数据,试建立y 与x 之间的回归方程.错解:由表中数据可得x =25.5,y =95.125,∑i =18x i 2=5 580,∑i =18x i y i =24 297,所以b ^=81822188i ii ii x yx yxx ==--∑∑=24 297-19 405.55 580-5 202≈12.94,a ^ =y -b ^x ≈95.125-12.94×25.5=-234.845,所以y 与x 之间的回归方程为y ^=12.94x -234.845.错因分析:解题前没有审好题,原题求的是回归方程,并不是回归直线方程,故应先进行相关性检验,再求回归方程,不能盲目地求回归直线方程.正解:根据收集的数据作散点图,如图所示.根据样本点的分布情况,可选用指数型函数模型y =c 12e c x(c 1,c 2为待定的参数),令z =ln y ,则z =c 2x +ln c 1,即变换后样本点应该分布在直线z =bx +a (a =ln c 1,b =c 2)的周围,由y 与x 的数据表得z 与x 的数据表如下:所以可用线性回归方程来拟合.由表中数据可得b ^≈0.181 2,a ^≈-0.848 5,故z ^=0.181 2x -0.848 5,所以y ^=e0.181 2x -0.848 5,因此该化学物质的反应速度与催化剂的量的非线性回归方程为y ^=e0.181 2x -0.848 5.。
高中数学第一章统计案例1.1回归分析的基本思想及初步应用教学反思新人教A版选修1-2

回归剖析的基本思想及初步应用回本单元内容是一般高中课程标准实验教科书《数学(选修 1-2 )》第一章统计事例 1.1 归剖析的基本思想及其初步应用。
考虑到在《数学(必修 3)》的“统计”一章中,学生已经学习了两个变量之间的有关关系,本单元在此基础长进一步介绍回归模型的基本思想及其初步应用,所以依据教材,我在教课中设计以下主要流程进行:一、让学生回想成立线性回归模型的基本步骤。
二、写出教材第二页的例 1,和学生一同手工制作身高与体重的散点图,并指引学生议论后猜想回归模型 y=^bx+^a。
三、介绍参数b、a及有关系数r的计算公式,并指导学生运用计算器进行计算。
四、介绍残差ê的计算公式并指导学生运用计算器计算、画残差图进行模型拟合成效分析。
五、指引学生研究假如不是线性回归模型怎样预计参数,解说教材中的例 2 并练习。
六、指导学生作业。
详细实行下来,在教师的指导下教课目的达成了,但经过课后的教课反应,发现教课成效其实不理想,学生仅限于记着了公式,会套用公式计算,全力找寻标准答案,并无真实达到学致使用的目的。
向来以来,我们教师的任务仿佛不过教课,只需依据教科书、教课参照资料、考试一试卷和标准答案去授课就行了。
教师是依据教课纲领和教材上规定的内容严格进行教课的,教师充任的是一个课程履行者而不是踊跃参加者。
教师被动地、忠实地履行教课纲领,学生被动地、机械地接受知识。
所以,不论对教师仍是学生来说,这类教课形式,关注的是知识自己的输出输入,抱着教材是威望的观点,达成教材内容的学习就算达到教课目的,其余的则极少关注。
经过与同组教师商讨、与学生沟通后,我有以下新的认识:存在的问题:1.本单元的内容属于新增加知识,所以,关于教课要点与难点理解不透,教法选择不适合,成效不显然。
2.教课观点没有完全转变,还不过依据教科书、教课参照资料、标准答案去授课,没有创建性的使用新教材。
在新课程中,从其基本理念、课程标准的设计到课程构造、内容以及课程的详细实行与评价,都以学生的全面可连续发展和个性特色为出发点,关注学生的学习过程与方法以及陪伴这一过程而产生的踊跃感情体验和正确的价值观,关注学生的亲身参加生动的思想活动、实践与创新过程,要修业生学习“生活化的知识”、“有生命力的知识” ,让学生懂得学致使用。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
陕西省榆林育才中学高中数学第1章《统计案例》1.1.1回归分析的基本思想及其初步应用(1)导学案(无答案)北师大版选
修1-2
学习目标
1. 通过典型案例的探究,进一步了解回归分析的基本思想、方法及初步应用;
2. 了解线性回归模型与函数模型的差异,了解衡量两个变量之间线性相关关系得方法---相关系数.
学习过程
一、课前准备
(预习教材P2~ P4,找出疑惑之处)
问题1:“名师出高徒”这句彦语的意思是什么?有名气的老师就一定能教出厉害的学生吗?这两者之间是否有关?
复习1:函数关系是一种关系,而相关关系是一种关系.
复习2:回归分析是对具有关系的两个变量进行统计分析的一种常用方法,其步骤:→→
→ .
二、新课导学
※学习探究
实例从某大学中随机选取8名女大学生,其身高/cm和体重/kg数据如下表所示:
编号 1 2 3 4 5 6 7 8
身高165 165 157 170 175 165 155 170
体重48 57 50 54 64 61 43 59
问题:画出散点图,求根据一名女大学生的身高预报她的体重的回归方程,并预报一名身高为172cm 的女大学生的体重.
解:由于问题中要求根据身高预报体重,因此选自变量x,为因变量. (1)做散点图:
从散点图可以看出和有比较好的
相关关系.
(2) x= y=
8
1i i
i
x y =
=
∑
821i i x
==∑ 所以8
1822188i i i i
i x y x y
b x
x ==-==-∑∑$ $a
y bx =-≈$ 于是得到回归直线的方程为
r >0, 相关, r <0 相关; 相关系数的绝对值越接近于1,两个变量的线性相关关系 ,它们的散点图越接近 ; r > ,两个变量有 关系.
※ 典型例题
例1某班5名学生的数学和物理成绩如下表:
学生 学科
A B C D E 数学成绩(x )
88 76 75 64 62 物理成绩(y ) 78 65 70 62 60
(2) 求物理成绩y 对数学成绩x 的回归直线方程;
(3) 该班某学生数学成绩为96,试预测其物理成绩;
变式:该班某学生数学成绩为55,试预测其物理成绩;
小结:求线性回归方程的步骤:
※ 动手试试
练.(07广东文科卷)下表提供了某厂节能降耗技术改造后生产甲产品过程中记录的产量x (吨)与相应的生产能耗y (吨标准煤)的几组对照数据
(1)请画出上表数据的散点图;
(2)请根据上表提供的数据,用最小二乘法求出y
关于x 的线性回归方程y bx a =+;
(3)已知该厂技改前100吨甲产品的生产能耗为90吨标准煤.试根据(2)求出的线性同归方程,预测生产100吨甲产品的生产能耗比技改前降低多少吨标准煤?
(参考数值3 2.543546 4.566.5⨯+⨯+⨯+⨯=)
三、总结提升
※ 学习小结
1. 求线性回归方程的步骤:
2. 线性回归模型与一次函数有何不同
※ 知识拓展
在实际问题中,是通过散点图来判断两变量之间的性关系的, x 3 4 5 6 y 2.5 3 4 4.5
学习评价
※自我评价你完成本节导学案的情况为().
A. 很好
B. 较好
C. 一般
D. 较差
※当堂检测(时量:5分钟满分:10分)计分:
1. 下列两个变量具有相关关系的是()
A. 正方体的体积与边长
B. 人的身高与视力
C.人的身高与体重
D.匀速直线运动中的位移与时间
2. 在画两个变量的散点图时,下面哪个叙述是正确的()
A. 预报变量在x 轴上,解释变量在y 轴上
B. 解释变量在x 轴上,预报变量在y 轴上
C. 可以选择两个变量中任意一个变量在x 轴上
D. 可选择两个变量中任意一个变量在y 轴上
$必过()
3. 回归直线$$
y bx a
=+
A. (0,0)
B. (,0)
x C. (0,)y D. (,)
x y
4.r越接近于1,两个变量的线性相关关系 .
5. 已知回归直线方程$0.50.81
y x
=-,则25
x=时,y的估计值为 .。