高中数学选修1211回归分析的基本思想及其初步应用PPT课件
合集下载
高中数学人教A版选修1-2课件:1.1 回归分析的基本思想及其初步应用
题型一
题型二
题型三
题型四
题型一
题型二
题型三
题型四
【变式训练2】 已知某种商品的价格x(单位:元)与需求量y(单位:件) 之间的关系有如下5组数据:
x y 14 12 16 10 18 7 20 5 22 3
求y对x的回归直线方程,并说明回归模型拟合效果的好坏.
题型一
题型二
题型三
题型四
解:由条件,得������ =
5
^
2
5
∴R2=1 −
∑ (������������ - ������ ������ ) ������=1
作出散点图 → 求回归方程 → 计算 R2 → 进行残差分析
题型一
题型二
题型三
题型四
解:(1)散点图如图所示 .
通过散点图可知这两个变量具有线性相关关系. ������ = × (5+10+15+20+25+30)=17.5, ������ = × (7.25+8.12+8.95+9.90+10.9+11.8)≈9.487, ∑
������=1
������
∑ (������������ -������)
������
2
, ������ = ������ − ������ ������, 其中������ =
^
^
1 ������ ∑ ������ ������ ������ =1
������ , ������ =
(������, ������)称为样本点的中心, 回归直线过样本点的中心.
6
1 6
1 6
������ =1
2019人教版高中数学选修1-2课件:1.1 回归分析的基本思想及其初步应用(共40张PPT)
序号 1 2 3 4 5
总计
ui 15.0 25.8 30.0 36.6 44.4 151.8
yi
uiyi
39.4 225 591
42.9 665.64 1106.82
41.0 900 1230
43.1 1339.56 1577.46
49.2 1971.36 2184.48
215.6 5101.56 6689.76
考点类析
x 0.066 70.038 80.033 30.027 30.022 5 y 39.4 42.9 41.0 43.1 49.2
备课素材 求回归直线方程的方法技巧 [例] 某地最近十年粮食需求量逐年上升,下表是部分统计数据:
年份 2002 2004 2006 2008 2010
需求量/万吨 236 246 257 276 286 (1)利用所给数据求年需求量与年份之间的回归直线方程y^=b^x+a^; (2)利用(1)中所求出的直线方程预测该地 2012 年的粮食需求量.
考点类析
考点一 线性回归方程 例1 某设备的使用年限x和所支出的维修费 y(万元)有如下的统计资料:
x23456 y 2.2 3.8 5.5 6.5 7.0 若由资料可知,y与x之间具有线性相关关系. (1)求线性回归方程. (2)估计使用年限为10年时,维修费用为多少 万元?
解:(1)列表如下:
解:(1)该运动员训练次数(x)与成绩 (y)之间的散点图如图所示.
考点类析
例2 某运动员训练次数与运动成绩之间的 数据关系如下:
编号 1 2 3 4 5 6 7 8 次数(x) 30 33 35 37 39 44 46 50 成绩(y) 30 34 37 39 42 46 48 51 (1)作出散点图; (2)求出线性回归方程; (3)作出残差图,并说明模型的拟合效果; (4)计算R2,并说明其含义.
人教版高中数学选修1-2(A版)课件:第一章 1.1回归分析的基本思想及其初步应用 (共93张PPT)
择决定命运唯一的今天。
昨日的明天是今天。明天的昨日是今天。为什么要计较于过去呢(先别急着纠正我的错误,你确实可以在评判过去中学到许多)。但是我发现有的人过分地瞻前顾后了。为 何不想想“现在”呢?为何不及时行乐呢?如果你的回答是“不”,那么是时候该重新考虑一下了。成功的最大障碍是惧怕失败。这些句子都教育我们:不要惧怕失败。如 果你失败了他不会坐下来说:“靠,我真失败,我放弃。”并且不是一个婴儿会如此做,他们都会反反复复,一次一次地尝试。如果一条路走不通,那就走走其他途径,不 断尝试。惧怕失败仅仅是社会导致的一种品质,没有人生来害怕失败,记住这一点。宁愿做事而犯错,也不要为了不犯错而什么都不做。不一定要等到时机完全成熟才动手。 开头也许艰难,但是随着时间的流逝,你会渐渐熟悉你的事业。世上往往没有完美的时机,所以当你觉得做某事还不是时候,先做起来再说吧。喜欢追梦的人,切记不要被 梦想主宰;善于谋划的人,切记空想达不到目标;拥有实干精神的人,切记选对方向比努力做事重要。太阳不会因为你的失意,明天不再升起;月亮不会因为你的抱怨,今 晚不再降落。蒙住自己的眼睛,不等于世界就漆黑一团;蒙住别人的眼睛,不等于光明就属于自己!鱼搅不浑大海,雾压不倒高山,雷声叫不倒山岗,扇子驱不散大雾。鹿 的脖子再长,总高不过它的脑袋。人的脚指头再长,也长不过他的脚板。人的行动再快也快不过思想!以前认为水不可能倒流,那是还没有找到发明抽水机的方法;现在认 为太阳不可能从西边出来,这是还没住到太阳从西边出来的星球上。这个世界只有想不到的,没有做不到的!不是井里没有水,而是挖的不够深;不是成功来的慢,而是放 弃速度快。得到一件东西需要智慧,放弃一样东西则需要勇气!终而复始,日月是也。死而复生,四时是也。奇正相生,循环无端,涨跌相生,循环无端,涨跌相生,循环 无穷。机遇孕育着挑战,挑战中孕育着机遇,这是千古验证了的定律!种子放在水泥地板上会被晒死,种子放在水里会被淹死,种子放到肥沃的土壤里就生根发芽结果。选
昨日的明天是今天。明天的昨日是今天。为什么要计较于过去呢(先别急着纠正我的错误,你确实可以在评判过去中学到许多)。但是我发现有的人过分地瞻前顾后了。为 何不想想“现在”呢?为何不及时行乐呢?如果你的回答是“不”,那么是时候该重新考虑一下了。成功的最大障碍是惧怕失败。这些句子都教育我们:不要惧怕失败。如 果你失败了他不会坐下来说:“靠,我真失败,我放弃。”并且不是一个婴儿会如此做,他们都会反反复复,一次一次地尝试。如果一条路走不通,那就走走其他途径,不 断尝试。惧怕失败仅仅是社会导致的一种品质,没有人生来害怕失败,记住这一点。宁愿做事而犯错,也不要为了不犯错而什么都不做。不一定要等到时机完全成熟才动手。 开头也许艰难,但是随着时间的流逝,你会渐渐熟悉你的事业。世上往往没有完美的时机,所以当你觉得做某事还不是时候,先做起来再说吧。喜欢追梦的人,切记不要被 梦想主宰;善于谋划的人,切记空想达不到目标;拥有实干精神的人,切记选对方向比努力做事重要。太阳不会因为你的失意,明天不再升起;月亮不会因为你的抱怨,今 晚不再降落。蒙住自己的眼睛,不等于世界就漆黑一团;蒙住别人的眼睛,不等于光明就属于自己!鱼搅不浑大海,雾压不倒高山,雷声叫不倒山岗,扇子驱不散大雾。鹿 的脖子再长,总高不过它的脑袋。人的脚指头再长,也长不过他的脚板。人的行动再快也快不过思想!以前认为水不可能倒流,那是还没有找到发明抽水机的方法;现在认 为太阳不可能从西边出来,这是还没住到太阳从西边出来的星球上。这个世界只有想不到的,没有做不到的!不是井里没有水,而是挖的不够深;不是成功来的慢,而是放 弃速度快。得到一件东西需要智慧,放弃一样东西则需要勇气!终而复始,日月是也。死而复生,四时是也。奇正相生,循环无端,涨跌相生,循环无端,涨跌相生,循环 无穷。机遇孕育着挑战,挑战中孕育着机遇,这是千古验证了的定律!种子放在水泥地板上会被晒死,种子放在水里会被淹死,种子放到肥沃的土壤里就生根发芽结果。选
高中数学 1.1 回归分析的基本思想及其初步应用课件 新人教A版选修12
标
课 前
转速x(转/秒) 16 14 12 8
自
主
每小时生产有缺
课 时
导 学
11 9 8 5 陷的零件数y(件)
作 业
课 堂 互 动 探 究
教 师 备 课 资 源
菜单
新课标 ·数学 选修1-2
教
学
易
教
错
法
易
分
误
析
辨
1.在平面直角坐标系中作出散点图.
析
教
学
方
【提示】
当 堂
案
双
设
基
计
达
标
课
前
自
课
主
时
导
课 时 作 业
教 师 备 课 资 源
教 学 教 法 分 析
教 学 方 案 设 计
课 前 自 主 导 学
课 堂 互 动 探 究
菜单
新课标 ·数学 选修1-2
易 错 易 误 辨 析
当 堂 双 基 达 标
课 时 作 业
教 师 备 课 资 源
教 学 教 法 分 析
教 学 方 案 设 计
课 前 自 主 导 学
作
学
辨 析
教
学
当
方
堂
案
设
●三维目标
双 基
计
1.知识与技能
达 标
课 前
通过典型案例的探究,了解回归分析的基本思想,会对
自 主
两个变量进行回归分析,明确解决回归模型的基本步骤,并
课 时
导 学
对具体问题进行回归分析以解决实际应用问题.了解最小二
作 业
乘法的推导,解释残差变量的含义,了解偏差平方和分解的
高中数学 1.1回归分析的基本思想及其初步应用课件 新人教A版选修1-2
测一测 2-1
散点图在回归分析过程中的作用是( ) A .查找个体个数 B.比较个体数据的大小关系 C.探究个体分类 D.粗略判断变量是否线性相关 解析 :散点图能直观形象地反映两个变量间的关系,可以粗略判断两个 变量间是否存在线性相关关系.故选 D. 答案 :D
首页 1 2 3 4 5
XINZHIDAOXUE 新知 ZHONGNANTANJIU 重难探究 DANGTANGJ 当堂 导学 检测
首页 1 2 3 4 5
XINZHIDAOXUE 新知 ZHONGNANTANJIU 重难探究 DANGTANGJ 当堂 导学 检测
5 .建立回归模型的基本步骤 (1)确定研究对象,明确哪个变量是解释变量,哪个变量是预报变量. (2)画出解释变量和预报变量的散点图,观察它们之间的关系(如是否存 在线性关系等). (3)由经验确定回归方程的类型(如观察到数据呈线性关系,则选用线性 回归方程). (4)按一定规则(如最小二乘法)估计回归方程中的参数. (5)得出结果后分析残差图是否有异常(如个别数据对应残差过大,残差 呈现不随机的规律性等).若存在异常,则检查数据是否有误,或模型是否合 适等.
答案 :C
5
首页 1 2 3 4 5
XINZHIDAOXUE 新知 ZHONGNANTANJIU 重难探究 DANGTANGJ 当堂 导学 检测
3 .线性回归模型 (1)线性回归模型 y=bx+a+e,其中 a 和 b 是模型的未知参数,e 称为随机 误差.在统计中,自变量 x 又称为解释变量,因变量 y 又称为预报变量. (2)随机误差产生的原因.
首页 1
残差
XINZHIDAOXUE 新知 ZHONGNANTANJIU 重难探究 DANGTANGJ 当堂 导学 检测
高中数学选修1-2-回归分析第一节.ppt
=
,a^ = y -b^ x ,
n
xi- x 2
n
x2i -n x 2
i=1
i=1
其中 x =1ni=n1xi, y =1ni=n1yi,( x , y )称为样本点的中心.
课前探究学习
课堂讲练互动
(3)解释变量和预报变量 线性回归模型与一次函数模型的不同之处是增加了随机误差项e, 因变量y由 自变量x 和 随机误差e 共同确定,即自变量x只解 释部分y的变化,在统计中,我们也把自变量x称为解释变量,因变 量y称为预报变量.
课前探究学习
课堂讲练互动
【变式1】 以下是某地搜集到的新房屋的销售价格y和房屋的面积x 的数据:
房屋面积/m2 115 110 80 135 105 销售价格/万元 24.8 21.6 18.4 29.2 22
(1)画出数据对应的散点图; (2)求线性回归方程,并在散点图中加上回归直线; (3)据(2)的结果估计当房屋面积为150 m2时的销售价格.
1.1 回归分析的基本思想及其初步应用
课前探究学习
课堂讲练互动
【课标要求】 1.了解随机误差、残差、残差分析的概念; 2.会用残差分析判断线性回归模型的拟合效果; 3.掌握建立回归模型的步骤; 4.通过对典型案例的探究,了解回归分析的基本思想方法
和初步应用.
课前探究学习
课堂讲练互动
【核心扫描】 1.利用散点图分析两个变量是否存在相关关系,求线性回归方
6
所以
(yi-y^ i)2≈0.013
6
18,
(yi- y )2=14.678 4.
i=1
i=1
所以,R2=1-01.40.16378184≈0.999 1, 回归模型的拟合效果较好.
,a^ = y -b^ x ,
n
xi- x 2
n
x2i -n x 2
i=1
i=1
其中 x =1ni=n1xi, y =1ni=n1yi,( x , y )称为样本点的中心.
课前探究学习
课堂讲练互动
(3)解释变量和预报变量 线性回归模型与一次函数模型的不同之处是增加了随机误差项e, 因变量y由 自变量x 和 随机误差e 共同确定,即自变量x只解 释部分y的变化,在统计中,我们也把自变量x称为解释变量,因变 量y称为预报变量.
课前探究学习
课堂讲练互动
【变式1】 以下是某地搜集到的新房屋的销售价格y和房屋的面积x 的数据:
房屋面积/m2 115 110 80 135 105 销售价格/万元 24.8 21.6 18.4 29.2 22
(1)画出数据对应的散点图; (2)求线性回归方程,并在散点图中加上回归直线; (3)据(2)的结果估计当房屋面积为150 m2时的销售价格.
1.1 回归分析的基本思想及其初步应用
课前探究学习
课堂讲练互动
【课标要求】 1.了解随机误差、残差、残差分析的概念; 2.会用残差分析判断线性回归模型的拟合效果; 3.掌握建立回归模型的步骤; 4.通过对典型案例的探究,了解回归分析的基本思想方法
和初步应用.
课前探究学习
课堂讲练互动
【核心扫描】 1.利用散点图分析两个变量是否存在相关关系,求线性回归方
6
所以
(yi-y^ i)2≈0.013
6
18,
(yi- y )2=14.678 4.
i=1
i=1
所以,R2=1-01.40.16378184≈0.999 1, 回归模型的拟合效果较好.
新人教A版(选修1-2)1.1《回归分析的基本思想及其初步应用》ppt课件2
2
3
4
5
6
维修费用y
2.2
3.8
5.5
6.5
7.0
若由资料知,y对x呈线性相关关系。试求:
(1)线性回归方程 yˆ bˆx aˆ 的回归系数 aˆ、bˆ ;
(2)求残差平方和;
R (3)求相关系数 2;
(4)估计使用年限为10年时,维修费用是多少?
一般地,建立回归模型的基本步骤为:
(1)确定研究对象,明确哪个变量是解析变量,哪个变量 是预报变量。
线性关系
方案2
产卵数
400
300
200
100
气
温
0
-40 -30 -20 -10 0 -100
10 20 30 40
-200
方案2解答
平方变换:令t=x2,产卵数y和温度x之间二次函数模型y=bx2+a 就转化为产卵数y和温度的平方t之间线性回归模型y=bt+a
温度
21
23
25
27
29
32
35
温度的平方t 441
在统计中,我们也把自变量x称为解析变量,因变 量y为预报变量。
残差
数据点和它在回归直线上相应位置的差异 称为相应于点(xi,yi ) 的残差。
ei =yi
yi
例:编号为6的女大学生,计算随机误差的效应(残差)
61 (0.849165 85.712) 6.627
残差平方和
把每一个n 残差所得的值平方后加起来,用数学符号表
身
高
异
与
常
体 重
点
残
差
• 错误数据
图
• 模型问题
我们可以用相关指数R2来刻画回归的效果,其计算公式是
人教A版高中选修1-2《1.1回归分析的基本思想及其初步应用》课件
2 y - y i
n
=1-0=1.
1
2
3
4
5
解析
答案
4.面对竞争日益激烈的消费市场,众多商家不断扩大自己的销售市场, 以降低生产成本 .某白酒酿造企业市场部对该企业 9 月份的产品销量 x(单 位:千箱 ) 与单位成本 y( 单位:元 ) 的资料进行线性回归分析,结果如下:
6 6 7 2 x =2, y =71, xi =79, xiyi=1 481.则销量每增加 1 000 箱,单位成 i=1 i=1
^
a= y -b x =4-2×1.5=1, 故y=2x+1.
^
^
1
2
3
4
5
解答
回归分析的步骤
规律与方法
(1)确定研究对象,明确哪个变量是解释变量,哪个变量是预报变量;
(2)画出确定好的解释变量和预报变量的散点图,观察它们之间的关系
(如是否存在线性关系等);
(3)由经验确定回归方程的类型(如果呈线性关系,则选用线性回归方程 y=bx+a);
^ ^ ^
(4)按一定规则估计回归方程中的参数; (5)得出结果后分析残差图是否有异常(个别数据对应的残差过大,或残 差呈现不随机的规律性等),若存在异常,则检查数据是否有误或模型是 否合适等.
本课结束
R2=1-
i=1
2 y - y i
,R2表示 解释 变量对于 预报 变量变
化的贡献率,R2越接近于1,表示回归的效果越好
题型探究
类力x和判断力y进行统计分析,得下表
数据: x y 6 2 8 3 10 5 12 6
(1)请画出上表数据的散点图;
答案
3.若一组观测值(x1,y1),(x2,y2),…,(xn,yn)之间满足yi=bxi+a+ei 1 (i=1,2,…,n),且ei恒为0,则R2为_____.
高中数学人教A版选修1-2第一章 1.1 回归分析的基本思想及其初步应用课件
判断力.
[解] (1)散点图如图:
n
(2) xiyi=6×2+8×3+10×5+12×6=158,
i=1
x =6+8+410+12=9, y =2+3+4 5+6=4,
n
xi2=62+82+102+122=344.
i=1
^b=15384-4-4×4×9×924=1240=0.7,^a= y -^b x =4-0.7×9=-2.3, 故线性回归方程为^y=0.7x-2.3. (3)由(2)中线性回归方程知,当 x=9 时,^y=0.7×9-2.3=4, 故预测记忆力为 9 的同学的判断力约为 4.
求线性回归方程
[典例] 某研究机构对高三学生的记忆力 x 和判断力 y 进行 统计分析,得下表数据
x6
8
10 12
y2
3
5
6
(1)请画出上表数据的散点图;
(2)请根据上表提供的数据,用最小二乘法求出 y 关于 x 的
线性回归方程 ^y=^bx+^a; (3)试根据求出的线性回归方程,预测记忆力为 9 的同学的
回归分析
题点一:线性回归分析
1.在一段时间内,某种商品的价格 x 元和需求量 y 件之间的一组 数据为:
x 14 16 18 20
22
y 12 10 7 5
3
求出 y 对 x 的回归直线方程,并说明拟合效果的程度.
解: x =15(14+16+18+20+22)=18,
y =15(12+10+7+5+3)=7.4.
(2)非线性回归方程的求法 ①根据原始数据(x,y)作出散点图; ②根据散点图,选择恰当的拟合函数; ③作恰当的变换,将其转化成线性函数,求线性回归方程; ④在③的基础上通过相应的变换,即可得非线性回归方程.
[解] (1)散点图如图:
n
(2) xiyi=6×2+8×3+10×5+12×6=158,
i=1
x =6+8+410+12=9, y =2+3+4 5+6=4,
n
xi2=62+82+102+122=344.
i=1
^b=15384-4-4×4×9×924=1240=0.7,^a= y -^b x =4-0.7×9=-2.3, 故线性回归方程为^y=0.7x-2.3. (3)由(2)中线性回归方程知,当 x=9 时,^y=0.7×9-2.3=4, 故预测记忆力为 9 的同学的判断力约为 4.
求线性回归方程
[典例] 某研究机构对高三学生的记忆力 x 和判断力 y 进行 统计分析,得下表数据
x6
8
10 12
y2
3
5
6
(1)请画出上表数据的散点图;
(2)请根据上表提供的数据,用最小二乘法求出 y 关于 x 的
线性回归方程 ^y=^bx+^a; (3)试根据求出的线性回归方程,预测记忆力为 9 的同学的
回归分析
题点一:线性回归分析
1.在一段时间内,某种商品的价格 x 元和需求量 y 件之间的一组 数据为:
x 14 16 18 20
22
y 12 10 7 5
3
求出 y 对 x 的回归直线方程,并说明拟合效果的程度.
解: x =15(14+16+18+20+22)=18,
y =15(12+10+7+5+3)=7.4.
(2)非线性回归方程的求法 ①根据原始数据(x,y)作出散点图; ②根据散点图,选择恰当的拟合函数; ③作恰当的变换,将其转化成线性函数,求线性回归方程; ④在③的基础上通过相应的变换,即可得非线性回归方程.
高二数学人教A版选修1-2课件:1.1 回归分析的基本思想及其初步应用
知识精要
典题例解
迁移应用
由图可知,残差点比较均匀地分布在水平带状区域中,说明选用的模型比较合适. (4)计算得相关指数R2=0.985 5,说明了该运动员成绩的差异有98.55%是由训练次数引起的.
一 二三
知识精要
典题例解
迁移应用
为了研究三月下旬的平均气温x(℃)与四月二十日前棉花害虫化蛹高峰日y(日)的关系,某地观察了2008年至 2013年间的情况,得到下面数据表:
一 二三
知识精要
【例2】 某运动员训练次数与运动成绩之间的数据关系如下:
典题例解
迁移应用
训练次数(x) 30 33 35 37 39 44 46 50
成绩(y)
30 34 37 39 42 46 48 51
(1)作出散点图; (2)求出线性回归方程; (3)作出残差图,并说明模型的拟合效果; (4)计算R2,并说明其含义. 思路分析:先画出散点图,确定是否具有线性相关关系,求出回归方程,再求出残差,确定模型的拟合效果和R2 的含义.
其估计值为
���^��������� =yi-���^��������� =yii=-���1^���,2x,…i-���,^n���,,
���^���称������ 为相应于点(xi,yi)的残差.
目标导航
预习导引
1234
3.回归模型拟合效果的刻画
类别 特点
残差图法
残差点比较均匀 地落在水平的带 状区域中,说明选 用的模型比较合 适,这样的带状区 域的宽度越窄,说 明模型拟合精度 越高
5
∑ ���������2��� =882+762+732+662+632=27 174.
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第一章 统计案例
1
整体概述
概况一
点击此处输入相关文本内容 点击此处输入相关文本内容
概况二
点击此处输入相关文本内容 点击此处输入相关文本内容
概况三
点击此处输入相关文本内容 点击此处输入相关文本内容
2
a. 比《数学3》中“回归”增加的内
数学3——统计
容选修1-2——统计案例
5. 引入线性回归模型
1. 画散点图
不能用一次函数y=bx+a描述它们关系。
我们可以用下面的线性回归模型来表示: y=bx+a+e,其中a和b为模型的未知参数, e称为随机误差。
思考 产生随机误差项e的原因是什么?
随机误差e的来源(可以推广到一般): 1、其它因素的影响:影响体重y 的因素不只
是身高 x,可能还包括遗传基因、饮食习惯、 生长环境等因素; 2、用线性回归模型近似真实模型所引起的误 差; 3、身高 x 的观测误差。
1 n
n i1
yi
例1 从某大学中随机选取8名女大学生,其身高和体重数据如表1-1所示。
编号 1 2 3 4 5 6 7 8 身高/cm 165 165 157 170 175 165 155 170
体重/kg 48 57 50 54 64 61 43 59
求根据一名女大学生的身高预报她的体重的回归方程,并预报一名身高为 172cm的女大学生的体重。
于是得到
(x, y)称为
^
^
b0.84, 9a85.712
样本点的中心
探究P4:
所以回身归高方为程17是2cmy的女0大.8学49生x的体85重.7一1定2是60.316kg吗?
如果不是,你能解析一下原因吗?
所以,对于身高为172cm的女大学生,由回归方程可以预报
其体重为
y 0 .8 4 9 7 2 8 5 .7 1 2 6 0 .3 1 6 (k g )
函数模型与回归模型之间的差别
函数模型: ybxa
回归模型: ybxae
线性回归模型y=bx+a+e增加了随机误差项e,因变量y的值 由自变量x和随机误差项e共同确定,即自变量x只能解析部分y 的变化。
在统计中,我们也把自变量x称为解析变量,因变量y称为预 报变量。
函数模型与回归模型之间的差别
120000
中国GDP散点图
100000
80000
GDP
60000
40000
20000
0 1992
1993
1994
1995
1996
1997
1998
年
1999
2000
2001
2002
2003
函数模型: ybxa
回归模型: ybxae
可以提供 选择模型的准则
例1 从某大学中随机选取8名女大学生,其身高和体重数据如表1-1所示。
3
复习:变量之间的两种关系
问题1:正方形的面积y与正方形的边长x之间
的函数关系是 y = x2
确定性关系
问题2:某水田水稻产量y与施肥量x之间是否
-------有一个确定性的关系?
例如:在 7 块并排、形状大小相同的试验田 上 进行施肥量对水稻产量影响的试验,得到 如下所示的一组数据:
施化肥量x 15 20 25 30 35 40 45
n
( xi x )( yi y )
b i1 n
(xi x)2
i 1
a ybx
n
xi yi n x y
i 1 n
xi 2
2
nx
i 1
制表 i 1
xi x
yi y
(xi x)(yi y)
(xi x)2
2 3 4 5 6 7 8 合计
x , y ,
其中
x
1 n
n i1
xi,y
水稻产量y 330 345 365 405 445 450 455
1、定义:
自变量取值一定时,因变量的取值带有一定随 机性的两个变量之间的关系叫做相关关系。
注 1):相关关系是一种不确定性关系; 2):对具有相关关系的两个变量进行 统计分析的方法叫回归分析。
2、现实生活中存在着大量的相关关系。
如:人的身高与年龄; 产品的成本与生产数量; 商品的销售额与广告费; 家庭的支出与收入。等等
求根据一名女大学生的身高预报她的体重的回归方程,并预报一名身高为 172cm的女大学生的体重。 解:1、选取身高为自变量x,体重为因变量y,作散点图:
2、由散点图知道身高和体重有比较好的
线性相关关系,因此思可考以用P线3性回归方程
刻画它们之间的产关生系随。机误差项e 3直、线从的散附点近图,还而看的不到原是,在因样一是本条什点直散么线布?上在,某所一以条
探究P4: 身高为172cm的女大学生的体重一定是60.316kg吗? 如果不是,你能解析一下原因吗?
答:身高为172cm的女大学生的体重不一定是 60.316kg,但一般可以认为她的体重在60.316kg左右。
60.136kg不是每个身高为172cm的女大学生的体重 的预测值,而是所有身高为172cm的女大学生平均 体重的预测值。
探索2:在这些点附近可画直线不止一条, 哪条直线最能代表x与y之间的关系呢?
案例1:女大学生的身高与体重
例1 从某大学中随机选取8名女大学生,其身高和体重数据如表1-1所示。
编号 1 2 3 4 5 670 175 165 155 170
体重/kg 48 57 50 54 64 61 43 59
探索:水稻产量y与施肥量x之间大致有何 规律?
施化肥量x 15 20 25 30 35 40 45
水稻产量y 330 345 365 405 445 450 455
y
500 水稻产量
450
···
400
·
350 ···
300
散点图 施化肥量
10 20 30 40 50
x
发现:图中各点,大致分布在某条直线附近。
2. 了解最小二乘法 的思想
y=bx+a+e
6. 了解模型中随机误差项e产 生的原因
3. 求回归直线方程
y=bx+a
4. 用回归直线方程 解决应用问题
7. 了解相关指数 R2 和模型拟 合的效果之间的关系
8. 了解残差图的作用
9. 利用线性回归模型解决一类 非线性回归问题
10. 正确理解分析方法与结果
编号 1 2 3 4 5 6 7 8 身高/cm 165 165 157 170 175 165 155 170
体重/kg 48 57 50 54 64 61 43 59
求根据一名女大学生的身高预报她的体重的回归方程,并预报一名身高为 172cm的女大学生的体重。
根据最小二乘法估计a 和b 就是未知参数a和b的最好估计,
1
整体概述
概况一
点击此处输入相关文本内容 点击此处输入相关文本内容
概况二
点击此处输入相关文本内容 点击此处输入相关文本内容
概况三
点击此处输入相关文本内容 点击此处输入相关文本内容
2
a. 比《数学3》中“回归”增加的内
数学3——统计
容选修1-2——统计案例
5. 引入线性回归模型
1. 画散点图
不能用一次函数y=bx+a描述它们关系。
我们可以用下面的线性回归模型来表示: y=bx+a+e,其中a和b为模型的未知参数, e称为随机误差。
思考 产生随机误差项e的原因是什么?
随机误差e的来源(可以推广到一般): 1、其它因素的影响:影响体重y 的因素不只
是身高 x,可能还包括遗传基因、饮食习惯、 生长环境等因素; 2、用线性回归模型近似真实模型所引起的误 差; 3、身高 x 的观测误差。
1 n
n i1
yi
例1 从某大学中随机选取8名女大学生,其身高和体重数据如表1-1所示。
编号 1 2 3 4 5 6 7 8 身高/cm 165 165 157 170 175 165 155 170
体重/kg 48 57 50 54 64 61 43 59
求根据一名女大学生的身高预报她的体重的回归方程,并预报一名身高为 172cm的女大学生的体重。
于是得到
(x, y)称为
^
^
b0.84, 9a85.712
样本点的中心
探究P4:
所以回身归高方为程17是2cmy的女0大.8学49生x的体85重.7一1定2是60.316kg吗?
如果不是,你能解析一下原因吗?
所以,对于身高为172cm的女大学生,由回归方程可以预报
其体重为
y 0 .8 4 9 7 2 8 5 .7 1 2 6 0 .3 1 6 (k g )
函数模型与回归模型之间的差别
函数模型: ybxa
回归模型: ybxae
线性回归模型y=bx+a+e增加了随机误差项e,因变量y的值 由自变量x和随机误差项e共同确定,即自变量x只能解析部分y 的变化。
在统计中,我们也把自变量x称为解析变量,因变量y称为预 报变量。
函数模型与回归模型之间的差别
120000
中国GDP散点图
100000
80000
GDP
60000
40000
20000
0 1992
1993
1994
1995
1996
1997
1998
年
1999
2000
2001
2002
2003
函数模型: ybxa
回归模型: ybxae
可以提供 选择模型的准则
例1 从某大学中随机选取8名女大学生,其身高和体重数据如表1-1所示。
3
复习:变量之间的两种关系
问题1:正方形的面积y与正方形的边长x之间
的函数关系是 y = x2
确定性关系
问题2:某水田水稻产量y与施肥量x之间是否
-------有一个确定性的关系?
例如:在 7 块并排、形状大小相同的试验田 上 进行施肥量对水稻产量影响的试验,得到 如下所示的一组数据:
施化肥量x 15 20 25 30 35 40 45
n
( xi x )( yi y )
b i1 n
(xi x)2
i 1
a ybx
n
xi yi n x y
i 1 n
xi 2
2
nx
i 1
制表 i 1
xi x
yi y
(xi x)(yi y)
(xi x)2
2 3 4 5 6 7 8 合计
x , y ,
其中
x
1 n
n i1
xi,y
水稻产量y 330 345 365 405 445 450 455
1、定义:
自变量取值一定时,因变量的取值带有一定随 机性的两个变量之间的关系叫做相关关系。
注 1):相关关系是一种不确定性关系; 2):对具有相关关系的两个变量进行 统计分析的方法叫回归分析。
2、现实生活中存在着大量的相关关系。
如:人的身高与年龄; 产品的成本与生产数量; 商品的销售额与广告费; 家庭的支出与收入。等等
求根据一名女大学生的身高预报她的体重的回归方程,并预报一名身高为 172cm的女大学生的体重。 解:1、选取身高为自变量x,体重为因变量y,作散点图:
2、由散点图知道身高和体重有比较好的
线性相关关系,因此思可考以用P线3性回归方程
刻画它们之间的产关生系随。机误差项e 3直、线从的散附点近图,还而看的不到原是,在因样一是本条什点直散么线布?上在,某所一以条
探究P4: 身高为172cm的女大学生的体重一定是60.316kg吗? 如果不是,你能解析一下原因吗?
答:身高为172cm的女大学生的体重不一定是 60.316kg,但一般可以认为她的体重在60.316kg左右。
60.136kg不是每个身高为172cm的女大学生的体重 的预测值,而是所有身高为172cm的女大学生平均 体重的预测值。
探索2:在这些点附近可画直线不止一条, 哪条直线最能代表x与y之间的关系呢?
案例1:女大学生的身高与体重
例1 从某大学中随机选取8名女大学生,其身高和体重数据如表1-1所示。
编号 1 2 3 4 5 670 175 165 155 170
体重/kg 48 57 50 54 64 61 43 59
探索:水稻产量y与施肥量x之间大致有何 规律?
施化肥量x 15 20 25 30 35 40 45
水稻产量y 330 345 365 405 445 450 455
y
500 水稻产量
450
···
400
·
350 ···
300
散点图 施化肥量
10 20 30 40 50
x
发现:图中各点,大致分布在某条直线附近。
2. 了解最小二乘法 的思想
y=bx+a+e
6. 了解模型中随机误差项e产 生的原因
3. 求回归直线方程
y=bx+a
4. 用回归直线方程 解决应用问题
7. 了解相关指数 R2 和模型拟 合的效果之间的关系
8. 了解残差图的作用
9. 利用线性回归模型解决一类 非线性回归问题
10. 正确理解分析方法与结果
编号 1 2 3 4 5 6 7 8 身高/cm 165 165 157 170 175 165 155 170
体重/kg 48 57 50 54 64 61 43 59
求根据一名女大学生的身高预报她的体重的回归方程,并预报一名身高为 172cm的女大学生的体重。
根据最小二乘法估计a 和b 就是未知参数a和b的最好估计,