2015-2016学年人教B版高中数学课件 选修2-3:第三章 统计案例 1《回归分析》课时1
2015年秋高二人教B版数学选修2-3课件:第3章 统计案例 3.1
3.1
成才之路 ·高中新课程 ·学习指导 ·人教B版 ·数学 ·选修2-3
相互独立事件的概念与性质 没有影响, 1.定义:事件 A是否发生对事件 B发生的概率________ P(B) ,这时,我们称两个事件A,B相互独立, 即P(B|A)=________ 并把这两个事件叫做相互独立事件.
2 . 性 质 : 当 事 件 A , B 相 互 独 立 时 , ________ 与 A
下面是一个 2×2 列联表 y1 x1 x2 总计 a 2 b y2 21 25 46 ) 总计 73 27
则表中 a,b 处的值分别为( A.94、96 C.52、54 [答案] C
B.52、50 D.54、52
第三章 3.1
成才之路 ·高中新课程 ·学习指导 ·人教B版 ·数学 ·选修2-3
[ 解析]
2 n n n - n n 11 22 12 21 是 χ2= . n1+n2+n+1n+2
用它的大小可以决定是否拒绝原来的统计假设 H0.如果算 出的 χ2 值较大,就拒绝 H0,也就是拒绝“事件 A 与 B 无关”, 从而就认为它们是有关的了.
第三章 3.1
成才之路 ·高中新课程 ·学习指导 ·人教B版 ·数学 ·选修2-3
第三章
统计案例
成才之路 ·高中新课程 ·学习指导 ·人教B版 ·数学 ·选修2-3
第三章
3.1 独立性检验 第2课时 离散型随机变量的方差
第三章
3.1
成才之路 ·高中新课程 ·学习指导 ·人教B版 ·数学 ·选修2-3
1
课前自主预习
2
课堂典例探究
3
课 时 作 业
第三章
3.1
成才之路 ·高中新课程 ·学习指导 ·人教B版 ·数学 ·选修2-3
高中数学第三章统计案例本章概览素材新人教B版选修2-3
第三章统计案例
本章概览
内容提要
1.独立性检验的含义:前提是事件A与事件B独立,此时,应有P(AB)=P(A)·P(B)成立.故统计假设H0∶P(AB)=P(A)·P(B).
在H0成立的条件下,下列式子也成立,即
P(B)=P()·P(B),P(A)=P(A )·P() P()=P()·P().然后根据概率的统计定义,上述事件用相应的频率来估计.
2.φ2=
①若φ2值较大,即拒绝H0,则A、B有关.
②当φ2>3.841时,有95%的把握说A、B有关.
当φ2>6.635时,有99%的把握说A、B有关.
当φ2≤2.706时,没有充分的证据显示A与B有关系.
3.a与回归系数b的确定
=-b =
4.相关系数r=,r具有以下性质:|r|≤1,并且|r|越近于1,线
性相关性越强;|r|越接近0,线性相关程度越弱.
学法指导
1.要熟记本章中出现的公式,体会解题思想.
2.通过对典型案例的探究和学习,要了解独立性检验的思想方法及初步应用,了解推断原理和假设检验,了解聚类分析及回归分析的基本思想和初步应用.
1 / 1。
2015-2016学年高中数学 第三章 统计案例整合课件 北师大版选修2-3
≈1.22,
a=������-b������≈72.3-1.22×71=-14.32, 所以 y 关于 x 的回归直线方程为 y=1.22x-14.32.
专题一
专题二
【例 2】在试验中得到变量 y 与 x 的数据如下表: x 19 23 27 31 35 y 4 11 24 109 325 试求 y 与 x 之间的回归方程,当 x=40 时,预测 y 的值.
作散点图,如图所示.
从图中可以看出 x 与 z 有很强的线性相关性. 由上表中的数据得到线性回归方程 z=0.277x-3.998. 所以,变量 y 关于 x 的非线性回归方程为 y=e0.277x-3.998.
专题一
专题二
点评非线性回归问题有时并不给出经验公式,这时我们可以画出
已知数据的散点图,把它与前面学过的幂函数、 指数函数、 对数函数等函数 的图像作比较,挑选一种跟这些散点拟合得最好的函数图像,然后采用适当 的变量置换,把问题转化为线性回归分析问题,使其得到解决.
2
������(������������-������������)2 = 应该很小. (������+������)(������+������)(������ +������)(������ +������)
专题一
专题二
【例 3】气管炎是一种常见的呼吸道疾病,医药研究人员对两种中草药 治疗慢性气管炎的疗效进行对比,所得数据如下表. 药效情况 有效 无效 总计 草药情况 复方江剪刀草 184 61 245 胆黄片 91 9 100 总计 275 70 345 问:它们的疗效有无差异. 思路分析:根据 2×2 列联表计算出 χ2 的值,再结合临界值即可作出合理 的判断. 解:根据列联表的数据可以求得 χ
人教版高三数学选修2-3全册教学课件
2.1 离散型随机变量及其分布 列
人教版高三数学选修2-3全册教学 课件
2.2 二项分布及其应用
人教版高三数学选修2-3全册教学 课件
探究与发现 服从二项分布的 随机变量取何值时概率最大
人教版高三数学选修2-3全册教 学课件目录
0002页 0090页 0167页 0211页 0276页 0360页 0445页 0487页 0560页 0589页 0660页 0731页
第一章 计数原理 探究与发现 子集的个数有多少 探究与发现 组合数的两个性质 探究与发现 “杨辉三角”中的一些秘密 复习参考题 2.1 离散型随机变量及其分布列 探究与发现 服从二项分布的随机变量取何值时概率最 2.4 正态分布 小结 第三章 统计案例 3.2 独立性检验的基本思想及其初步应用 小结
人教版高三数学选修2-3全册Fra bibliotek学 课件1.2 排列与组合
人教版高三数学选修2-3全册教学 课件
探究与发现 组合数的两个性 质
人教版高三数学选修2-3全册教学 课件
第一章 计数原理
人教版高三数学选修2-3全册教学 课件
1.1 分类加法计数原理与分步 乘法计数原理
人教版高三数学选修2-3全册教学 课件
探究与发现 子集的个数有多 少
人教版高三数学选修2-3全册教学 课件
1.3 二项式定理
人教版高三数学选修2-3全册教学 课件
探究与发现 “杨辉三角”中的 一些秘密
人教版高三数学选修2-3全册教学 课件
小结
人教版高三数学选修2-3全册教学 课件
复习参考题
人教版高三数学选修2-3全册教学 课件
第二章 随机变量及其分布
人教版高三数学选修2-3全册教学 课件
2015年秋高二北师大版数学选修2-3课件:第3章 统计案例 §2
本节重点:独立性检验的基本思想及实施步骤.
本节难点:独立性检验的基本思想.
第三章
§2
成才之路 ·高中新课程 ·学习指导 ·北师大版 ·数学 · 选修2-3
1.2×2 列联表 设 A, B 为两个变量, 每一个变量都可以取两个值, 变量 A∶ A1,A2= A1 ;变量 B∶B1,B2= B 1.其频数表(称为 2×2 列联表) 为 BA A1 A2 B1 a c B2 b d 总计 a+b c+d
成才之路 ·数学
北师大版 ·选修2-3
路漫漫其修远兮 吾将上下而求索
成才之路 ·高中新课程 ·学习指导 ·北师大版 ·数学 · 选修2-3
第三章
统计案例
第三章
统计案例
成才之路 ·高中新课程 ·学习指导 ·北师大版 ·数学 · 选修2-3
第三章
§2 独立性检验
第三章
统计案例
成才之路 ·高中新课程 ·学习指导 ·北师大版 ·数学 · 选修2-3
第三章 §2
成才之路 ·高中新课程 ·学习指导 ·北师大版 ·数学 · 选修2-3
a a+b a+c 若有式子 = · ,则可以认为 A1 与 B1 独立. n n n b a+b b+d 同理,若 = · ,则可以认为 A1 与 B2 独立. n n n c c+d a+c 若 = · ,则可以认为 A2 与 B1 独立; n n n d c+d b+d 若 = · ,则可以认为 A2 与 B2 独立. n n n a a+b a+c a a+b a+c 但在 = · 中,由于 、 、 表示的是频率, n n n n n n 不同于概率,即使变量之间独立,式子两边也不一定恰好相 等.但是当两边相差很大时,变量之间就不独立.
用它的大小来检验变量之间是否独立.当 χ2 较大时,说明变量 之间不独立.
2015年秋高二人教B版数学选修2-3课件:第3章 统计案例 章末归纳总结3
③计算 r ,根据 r 的值作统计推断,若 |r|>r0.05 ,表明有 95%
的把握认为 X 与 Y 之间具有线性相关关系,如果|r|≤r0.05 ,就拒 绝H0.
第三章
章末归纳总结
成才之路 ·高中新课程 ·学习指导 ·人教B版 ·数学 · 选修2-3
(3)对于一组数据(xi,yi) i=1、2„n,如果它们线性相关, 则线性回归方程为y=bx+a,其中
2 i=1 i=1
n
n
2
n 2 2 2 xi -n x y2 - n y i i=1 i=1
n
这里|r|≤1,当|r|从 0 逐渐接近于 1 时,X 与 Y 线性相关程 度渐强.
第三章 章末归纳总结
成才之路 ·高中新课程 ·学习指导 ·人教B版 ·数学 · 选修2-3
(2)检验线性相关的步骤是: ①作统计假设H0:X与Y不具有线性相关关系; ②根据小概率 0.05 与 n - 2 在附表中查出 r 的一个临界值都不小于 5 时,常用随机变量
第三章 章末归纳总结
成才之路 ·高中新课程 ·学习指导 ·人教B版 ·数学 · 选修2-3
2 n ad - bc χ2 = 来检验统计假设 H0: “A 与 B a+bc+da+cb+d
无关”是否成立,当 χ2 值较大就拒绝 H0.检验中常用的两个临 界值为: χ2>3.841, 认为有 95%的把握说 A 与 B 有关; χ2>6.635, 认为有 99%的把握说 A 与 B 有关,当 χ2≤3.841 时认为事件 A 与 B 无关.
第三章
章末归纳总结
成才之路 ·高中新课程 ·学习指导 ·人教B版 ·数学 · 选修2-3
2.线性相关及其检验 (1)用来检验随机变量 X 与 Y 是否线性相关的方法称为相关 性检验.检验统计量为样本相关系数.
高二数学PPT之(人教版)高中数学选修2-3:3
数学 选修2-3
第三章 统计案例
自主学习 新知突破
合作探究 课堂互动
3.在吸烟与患肺病是否有关旳判断中,有下面旳说 法:
①若K2旳观察值k>6.635,则在犯错误旳概率不超出0.01 旳前提下,以为吸烟与患肺病有关系,那么在100个吸烟旳人 中必有99人患有肺病;
②从独立性检验可知在犯错误旳概率不超出0.01旳前提 下,以为吸烟与患肺病有关系时,若某人吸烟,则他有99%旳 可能患有肺病;
8分
此时,K2 的观测值 k=861×4×5×722×2-555×0×3192≈5.785.10 分
由于 5.785>5.024,
所以在犯错误的概率不超过 0.025 的前提下认为该种疾病
与饮用不干净水有关.
数学 选修2-3
第三章 统计案例
自主学习 新知突破
合作探究 课堂互动
两个样本都能统计得到传染病与饮用不洁净水有关这一
∵54.21>10.828,所以拒绝 H0. 因此在犯错误的概率不超过 0.001 的前提下认为这种传染
病与饮用不干净水有关.
6分
数学 选修2-3
第三章 统计案例
自主学习 新知突破
合作探究 课堂互动
(2)依题意得 2×2 列联表:
得病 不得病 合计
干净水
5
50
55
不干净水 9
22
31
合计
14
72
86
数学 选修2-3
第三章 统计案例
自主学习 新知突破
合作探究 课堂互动
[规律方法] 1.判断分类变量及其关系的方法: (1)利用数形结合思想,借助等高条形图来判断两个分类变 量是否相关是判断变量相关的常见方法; (2)一般地,在等高条形图中,a+a b与c+c d相差越大,两个 分类变量有关系的可能性就越大.
高中数学 第三章 统计案例章末归纳总结课件 新人教B版选修2-3
(2)列表计算(如下表).
x
y
63
65
67
78
45
52
88
82
81
92
71
89
52
73
99
98
58
56
76
75
x2 3 969 4 489 2 025 7 744 6 561 5 041 2 704 9 801 3 364 5 776
xy 4 095 5 226 2 340 7 216 7 452 6 319 3 796 9 702 3 248 5 700
≈0.765
56 , a^ ≈76 - 0.765
56×70≈22.41,所以所求的回归直线方程为^y=22.41+0.765
56x.
(3)若学生王明亮入学成绩为 80 分,代入上面回归直线方 程^y=22.41+0.765 56x,可求得^y≈84(分).所以王明亮同学高 一期末考试的数学成绩预测值为 84 分.
(2)检验线性相关的步骤是:
①作统计假设H0:X与Y不具有线性相关关系; ②根据小概率 0.05与n-2在附表中查出 r的一个临界值
r0.05; ③计算r,根据r的值作统计推断,若|r|>r0.05,表明有95%
的把握认为X与Y之间具有线性相关关系,如果|r|≤r0.05,就拒 绝H0.
(3)对于一组数据(xi,yi) i=1、2…n,如果它们线性相关,
χ2=a+bcn+add-ab+cc2b+d来检验统计假设 H0:“A 与 B 无关”是否成立,当 χ2 值较大就拒绝 H0.检验中常用的两个临 界值为:χ2>3.841,认为有 95%的把握说 A 与 B 有关;χ2>6.635, 认为有 99%的把握说 A 与 B 有关,当 χ2≤3.841 时认为事件 A 与 B 无关.
北师大版高中数学选修2-3课件:第三章 统计案例 §1
数学D 选修2-3
第三章 统计案例
课前预习学案 课堂互动讲义 课后演练提升
xiyi-n x y
i=1
5
∴r=
5 2 2 2 xi -n x y2 - n y i i= 1 i=1
5
=
25 054-5×73.2×67.8 27 174-5×73.2223 167-5×67.82
A.r2<r1<0
C.r2<0<r1
B.0<r2<r1
D.r2Байду номын сангаасr1
数学D 选修2-3
第三章 统计案例
课前预习学案 课堂互动讲义 课后演练提升
解析:
对于变量Y与X而言,Y随X的增大而增大,故Y与
X正相关,即r1>0;对于变量V与U而言,V随U的增大而减小,
故V与U负相关,即r2<0,所以有r2<0<r1.故选C. 答案: C
i= 1
10
∴r=
73 796-10×107.8×68 116 584-10×107.8247 384-10×682
≈0.750 6. ∵0.750 6 接近于 1,∴两次数学考试成绩有显著性线性相 关关系.
数学D 选修2-3
第三章 统计案例
课前预习学案 课堂互动讲义 课后演练提升
课堂互动讲义
怎样确定回归的模型
1.确定研究对象,明确要考虑哪两个变量之间的相关关 系. 2.画出确定好的两个变量的散点图,观察它们之间的关 系(如是否存在线性关系等).
3 .由经验确定回归方程的类型 ( 如观察到数据呈线性关
系,则选用线性回归方程=bx+a). 4.按一定规则估计回归方程中的参数(如最小二乘法).得 出回归方程.
最新人教版高中数学选修2-3《统计案例》本章概览
最新人教版高中数学选修2-3《统计案例》本章概览
第三章统计案例
本章概览
三维目标
通过收集现实问题中的两个有关联变量的数据作出散点图,并能利用散点图直观认识两变量的相关关系.通过对典型案例的探究,进一步了解回归的基本思想、方法及初步应用.
通过案例来认识、思考,根据问题的需求合理地选择不同的方法,合理地选取样本,从样本数据中提取需要的数字特征,经历数据处理全过程,在此过程中学习并应用回归分析的一些方法.
学会对数据的收集、整理和分析,增强社会实践能力,提高解决问题的能力.
通过对典型案例的分析与探究,认识、归纳和总结独立性检验的基本思想、方法及其初步应用.
通过探究案例、解决实际问题的过程,了解独立性检验这种统计方法的用法与本质.
经历数据处理的过程,从而训练我们对数据的直观感觉,体会统计方法应用的广泛性,养成科学严谨的学习态度与品质.。
2015年秋高二北师大版数学选修2-3课件:第3章 统计案例 §1
第三章
§1
成才之路 ·高中新课程 ·学习指导 ·北师大版 ·数学 · 选修2-3
4.可线性化的回归分析 1.在实际问题中,有时两个变量之间的关系并不是线性 关系,这就需要根据散点图选择适当的函数模型来拟合观测数
据,然后通过适当的变量代换,把非线性问题转化为线性问
题,从而确定未知参数,建立相应的线性回归方程. 2.常见的非线性回归模型转化为线性回归模型如下: (1)幂函数曲线y=axb 作变换u=lny,v=lnx,c=lna,得线性函数u=c+bv.
成才之路 ·数学
北师大版 ·选修2-3
路漫漫其修远兮 吾将上下而求索
成才之路 ·高中新课程 ·学习指导 ·北师大版 ·数学 · 选修2-3
第三章
统计案例
第三章
统计案例
成才之路 ·高中新课程 ·学习指导 ·北师大版 ·数学 · 选修2-3
本章知识概述 本章内容是新课标教材的新增内容,目的是通过案例介绍 一些统计方法,体会运用统计方法解决实际问题的基本思想, 认识统计方法在决策中的作用.因此高考试题中注重的是统计 思想,所涉及的数据计算不会很繁琐. 本章的重点是: 回归分析与独立性检验的基本思想与方法; 难点是:回归分析与独立性检验的初步应用.学习时,应注意 以下几点:
课前自主预习
第三章
§1
成才之路 ·高中新课程 ·学习指导 ·北师大版 ·数学 · 选修2-3
1.通过收集现实问题中两个有关联变量的数据作出散点
图,并利用散点图直观认识变量间的相关关系.
2.通过求线性回归方程,探究相关性检验的基本思想. 3.通过对典型案例的探究,体会回归分析在生产实践和
日常生活中的广泛应用.
第三章
§1
成才之路 ·高中新课程 ·学习指导 ·北师大版 ·数学 · 选修2-3
人教版高中选修2-3第三章统计案例课程设计
人教版高中选修2-3第三章统计案例课程设计课程目标本课程旨在帮助学生通过现实统计案例的学习,加深对统计学知识的理解,并学会运用统计方法进行数据分析和推断。
具体课程目标包括:1.了解统计学的基本概念和方法,包括描述性统计和推论统计;2.掌握常见的统计方法和工具,如样本调查、假设检验等;3.学会运用统计方法进行数据分析和推断,并能通过数据可视化工具呈现分析结果;4.能够阅读与理解统计报告、统计学术论文等。
课程内容Part 1 统计学基础概念和方法本部分主要介绍统计学的基本概念和方法,包括数据类型、数据的中心趋势和离散程度等内容。
1.1 数据类型•定义:介绍数据的种类,包括定量数据和定性数据。
•实战练习:举例区分不同类型的数据。
1.2 中心趋势和离散程度•定义:介绍数据的中心趋势和离散程度的计算方法,如均值、中位数、众数、方差、标准差等。
•实战练习:利用给定数据计算中心趋势和离散程度,并对结果进行分析。
Part 2 统计方法和工具本部分主要介绍统计方法和工具,包括样本调查、假设检验等内容。
2.1 样本调查•定义:介绍样本调查的基本概念和实现方法,如随机抽样、分层抽样等。
•实战练习:通过样本调查,进行数据收集和分析,并进行推断。
2.2 假设检验•定义:介绍假设检验的基本概念和实现方法,如单样本t检验、双样本t检验、卡方检验等。
•实战练习:通过假设检验讨论问题,并进行数据分析和推断。
Part 3 统计案例分析本部分主要包括一些实际应用统计学的案例,包括医疗保健、环境污染等内容。
3.1 医疗保健案例•定义:介绍医疗保健案例的背景和数据收集方法。
•实战练习:通过医疗保健案例,进行数据分析和推断,讨论如何优化医疗保健服务。
3.2 环境污染案例•定义:介绍环境污染案例的背景和数据收集方法。
•实战练习:通过环境污染案例,进行数据分析和推断,讨论如何加强环保管理。
课程作业本课程作业旨在让学生将所学的统计知识运用到实际问题中,并通过数据分析和可视化工具呈现结果。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
作残差分析时,一般从以下几个方面予以说明: (1)散点图;(2)相关指数;(3)残差图中的异常点 和样本点的带状分布区域的宽窄.
解答 (1)散点图如图
1 - x = (5+10+ 15+ 20+25+30)=17.5, 6 1 - y = (7.25+ 8.12+ 8.95+ 9.90+10.9+11.8)≈9.487, 6 x2 i =2 i=1
从某大学中随机选取8名女大学生,其身高和体重数 据如下表所示:
编号
身高/cm 体重/kg
1
165 48
2
165 57
3
157 50
4
170 54
5175 64Fra bibliotek6165 61
7
155 43
8
170 59
怎样根据一名女大学生的身高预报她的体重,并预
报一名身高为172 cm的女大学生的体重?
根据必修3 2.3变量相关关系解决这个问题的方法: 1.先判断是两个变量是否具有线性相关关系 (1)作散点图,如图所示(见课本P82:图3.1-1) (2)计算相关系数 具有较好的线性相关关系
预报变量. (2)画出确定好的解释变量和预报变量的散点图,观察它们 之间的关系(如是否存在线性关系等). (3)由经验确定回归方程的类型(如我们观察到数据呈线性关
系,则选用线性回归方程).
(4)按一定规则(如最小二乘法)估计回归方程中的参数. (5)得出结果后分析残差图是否有异常(如个别数据对应残差
6
275, xiyi= 1 076.2
i=1
6
计算得,^ b ≈0.183,^ a ≈6.285, 所求回归直线方程为^ y =0.183x+6.285. (2)列表如下:
yi-^ yi yi-- y
6
0.05
0.005
-0.08 -0.045
0.04
0.025
-2.24 -1.37 -0.54
区域内,两个变量的这种相关关系为 正相关 .
(2)在残差分析中,残差图的纵坐标为
残差
.
(3)如果发现散点图中所有的样本点都在一条直 线上,则残差平方和等于
0
,解释变量和预报 .
变量之间的相关系数R等于 1或-1
3.已知某种商品的价格x(元)与需求量y(件)之间 的关系有如下一组数据:
x y 14 12 16 10 18 7 20 5 22 3
关关系(非确定性关系),其中的随机误差e提供了
选择模型的准则以及在模型合理的情况下探求最
佳估计值a,b的工具.
$ $ y $ bx $ a 中$ (2)线性回归方程 $ , 的意义是:以 a为 b a
基数,x每增加1个单位,y相应地平均增加 $ b 个单位.
(3)线性回归模型中随机误差的主要来源 ①线性回归模型与真实情况引起的误差; ②观测与计算产生的误差; ③省略了一些因素的影响产生的误差.
性质:回归直线一定过样本中心点.
这些点并不都在同一条直线上,上述直线并不能精确 地反映x与y之间的关系,y 的值不能完全由x 确定, 它们之间是统计相关关系,y 的实际值与估计值之间 存在着误差. 因此,在统计学中设它们的线性回归模型为:
y bx a e
其中a,b为模型的未知参数,e为y与bx+a之间的误差, 称它为随机误差,它是随机变量。且E e 0, D e 2
yi-^ yi yi-- y
0
0.3
-0.4
-0.1
0.2
4.6
2.6
-0.4
-2.4
-4.4
所以, (yi-^ y i)2=0.3, (yi-- y )2=53.2,
i= 1 i= 1 5
5
5
y i 2 yi-^
i= 1
R2=1-
y 2 yi--
i= 1
5
≈0.994,
i=1
xiyi=14×12+16×10+18×7+20×5+22×3=620,
i= 1 5
5
x- y xiyi-5- 所以^ b=
i= 1
x2 x2 i - 5-
i= 1
5
620-5×18×7.4 = =-1.15. 1 660-5×182
^ a =7.4+1.15×18=28.1, 所以所求回归直线方程是:^ y =-1.15x+28.1. 列出残差表:
对于样本点 x i , yi
i 1,2,3,L ,n
它们的随机误差为 ei yi bx i a µ y y µ y $ bx $ a 估计值为 e
i i i i i
i 1, 2,3,L , n n 1, 2,3,L n
µ称相应于点 x , y 的残差 e i i i
i 1 i i
x x y y
n 2 n i 1 i i 1 i
2
x y nx y
i 1 i i
n
( x nx )( y ny )
i 1 2 i 2 i 1 2 i 2
n
n
.
建立回归模型的基本步骤
(1)确定研究对象,明确哪个变量是解释变量,哪个变量是
线性回归模型完整表达式为 y bx a e,
2 E e 0,D e ,
x称为
解释
变量,y称为
预报
变量.
线性回归模型中随机误差的主要来源:
y与真实情况y引 ①线性回归模型中的预报值 $ 起的误差;
②观测与计算(用 $ b
$ a 代替b
a)产生的误差;
2.根据线性回归的系数公式, $ 求回归直线方程 b $ y =0.849x-85.712 3.由线性回归方程可以估计其位
y =60.316(千克)左右。 置值为 $
x
n i 1 n
i
x yi y
i
x
i 1
x
2
$ a y $ bx.
一个模型的小,而另一些样本点的情况则相反),故通过 比较两个模型的残差的平方和的大小来判断模型的拟 合效果.残差平方和越小的模型,拟合的效果越好. (3)R2法:R2的值越大,说明残差平方和越小,也就是说
模型拟合的效果越好.
3.相关系数与R2 (1)R2是相关系数的平方,其变化范围为[0,1],而 相关系数的变化范围为[-1,1]. (2)相关系数可较好地反映变量的相关性及正相
2.线性回归模型的模拟效果 (1)残差图法:观察残差图,如果残差点比较均匀 地落在水平的带状区域中,说明选用的模型比较 合适,这样的带状区域的宽度越窄,说明模型拟合
精度越高,回归方程的预报精度越高.
(2)残差的平方和法:一般情况下,比较两个模型的残差
比较困难(某些样本点上一个模型的残差的绝对值比另
本节课通过必修3熟悉有例题回顾线性相关关系
知识,通过实际问题中发现已有知识的不足,引出 随机误差、残差、残差分析的概念,进而运用残差 来进行数据分析,通过例题讲解掌握用残差分析判 断线性回归模型的拟合效果。掌握建立回归模型的
步骤。
本节内容学生内容不易掌握,通过知识整理与 比较引导学生进行区分、理解。通过对典型案例的 探究,练习进行巩固了解回归分析的基本思想方法 和初步应用.
过大,或残差呈现不随机的规律性等).若存在异常,则检
查数据是否有误,或模型是否合适等.
为研究重量x(单位:克)对弹簧长度y(单位:厘米) 的影响,对不同重量的6个物体进行测量,数据如下表 所示:
x 5 10 15 20 25 30
y
7.25
8.12
8.95
9.90
10.9
11.8
(1)作出散点图并求线性回归方程; (2)求出R2; (3)进行残差分析.
3.1 回归分析的基本思 想 及其初步应用
(第一课时)
1.通过典型案例的探究,进一步了解回归分析的基 本思想、方法及其初步应用. 2.让学生经历数据处理的过程,培养他们对数据的 直观感觉,体会统计方法的特点,认识统计方法的应 用,通过使用转化后的数据,求相关指数,运用相关 指数进行数据分析、处理的方法. 3.从实际问题中发现已有知识的不足,激发好奇心, 求知欲,通过寻求有效的数据处理方法,开拓学生的 思路,培养学生的探索精神和转化能力,通过案例的 分析使学生了解回归分析在实际生活中的应用,增强 数学取之生活,用于生活的意识,提高学习兴趣.
ˆ1,e ˆ2,e ˆ3, .....e ˆn,来判断模型拟合的效果这种分 通过残差 e
析工作称为残差分析.
通过残差表或残差图判断模型拟合的效果是直观判
断,如何精确判断模型拟合的效果?
引入参数R2
R2 1
n i 1 n i 1
yi $ yi
i
2
y
i
y
2
来精确该画模型拟合效果
(2)R2与原来学过的相关系数r有区别吗?
提示:它们都是刻画两个变量之间的的相关关系的,区
别是R2表示解释变量对预报变量变化的贡献率,其表 达式为R2=1
n i 1 n i 1
yi $ yi
i
2
y
n
y
2
;
相关系数r是检验两个变量相关性的强弱程度, 其表达式为 r
x x y y
残差的作用
1.通过残差表或残差图发现原始数据中的可疑数据 • 坐标纵轴为残差变量,横轴可以有不同的选择; • 若模型选择的正确,残差图中的点应该分布在以 横轴为中心的带形区域; • 对于远离横轴的点,要特别注意。
身 高 与 体 重 残 差 图 异 常 点 •错误数据 •模型问题