高中数学 第三章 统计案例 3.1 回归分析 3.1.1 回归分析 北师大版选修2-3

合集下载

2018版高中数学北师大版选修2-3课件:第三章 1-1 回归

2018版高中数学北师大版选修2-3课件:第三章 1-1 回归

解答
反思与感悟
(1)求线性回归方程的基本步骤 ①列出散点图,从直观上分析数据间是否存在线性相关关系.
n 2 ②计算: x , y , xi , xiyi. i=1 i=1

n

③代入公式,求出y=bx+a中参数b,a的值. ④写出线性回归方程并对实际问题作出估计. (2)需特别注意的是,只有在散点图大致呈线性时,求出的回归方程 才有实际意义,否则求出的回归方程毫无意义.
跟踪训练2
某个服装店经营某种服装,在某周内纯获利 y(元) 与该周
每天销售这种服装件数x之间的一组数据如下表:
x y (1)求样本点的中心;
解 x =6, y ≈79.86,样本点的中心为(6,79.86).
解答
3 66
4 69
5 73
6 81
7 89
8 90
9 91
(2)画出散点图;
解 散点图如下:
(2)参数a,b的求法
i=1
xi- x yi- y xi- x
n 2
n
i=1
xiyi-n x y
2 - n x x2 i n
n
lxy b= = lxx
i=1

i=1
,a= y -b x .
知识点二
相关系数
思考1
给出n对数据,按照公式求出的线性回归方程,是否一定能反映 这n对数据的变化规律? 答案 如果数据散点图中的点都大致分布在一条直线附近,这
i=1 n
∑ xiyi-n x y
i=1 2 ∑ y2 - n y i n
n
i=1
2 ∑ x2 - n x i
.
(2)相关系数r的取值范围是 [-1,1] ,|r|值越大,变量之间的线性相

高中数学第3章统计案例3.1回归分析课件北师大版选修2-3

高中数学第3章统计案例3.1回归分析课件北师大版选修2-3

设 y=kx,令 t=1x,则 y=kt.由 y 与 x 的数据表可得 y 与 t 的数据表:
t
4
2 1 0.5 0.25
y 16 12 5
2
1
作出 y 与 t 的散点图如图所示.
1.下列结论正确的是( ) ①函数关系是一种确定性关系;②相关关系是一种非确定性关系;③回归
分析是对具有函数关系的两个变量进行统计分析的一种方法;④回归分析是对
2.利用相关系数 r 来检验线性相关显著性水平时,通常与 0.75 作比较,若 r>0.75,则线性相关较为显著,否则为不显著.
求线性回归方程 (2016·九江高二检测)某服装商场为了了解毛衣的月销售量 y(件)与月
平均气温 x(℃)之间的关系,随机统计了某 4 个月的月销售量与当月平均气温,
其数据如下表:



1.1 回归分析

阶 段 二
1.2 相关系数
业 分

1.3 可线性化的回归分析
测 评
1.了解回归分析的思想和方法.(重点) 2.掌握相关系数的计算和判断线性相关的方法.(重点) 3.了解常见的非线性回归模型转化为线性回归模型的方法.(难点)
[基础·初探]
教材整理 1 回归分析
下列数据 x,y 符合哪一种函数模型( )
x 1 2 3 4 5 6 7 8 9 10
y 2 2.69 3 3.38 3.6 3.8 4 4.08 4.2 4.3
A.y=2+13x
B.y=2ex
C.y=2e1x
D.y=2+ln x
【解析】 分别将 x 的值代入解析式判断知满足 y=2+ln x.
【答案】 D
n
xiyi-n x y

高中数学第3章统计案例1回归分析北师大版选修

高中数学第3章统计案例1回归分析北师大版选修

n

i=1xiyi-n x y
x -n x y -n n
2
i=1 i
2 n 2 i=1 i
y
.2
(2)线性相关系数r与相关关系的强弱: ①当__r_>__0_____时,两个变量正相关; ②当__r_<__0_____时,两个变量负相关; ③当___r_=__0____时,称两个变量线性不相关; ④r的取值在__[_-__1_,_1_] __ 之间,_|_r_| ____ 值越大,变量之 间的线性相关程度越高; ⑤r的绝对值越接近于___0____,表示两个变量之间的线性 相关程度越低.
第三 章
统计案例
§1 回归分析
课前预习学案
某中学随机选取 8 名女生,测得其身高和体重数据如下表:
编号
12345678
身高(cm) 165 165 157 170 175 165 155 170
体重(kg) 48 57 50 54 64 61 43 59
求根据一名女中学生的身高预测她的体重的回归方程,并
2.对有线性相关关系的两个变量建立的线性回归方程y=
a+bx中,回归系数b( )
A.可以小于0
B.大于0
C.可能等于0
D.只能小于0
解析: b可能大于0,也可能小于0,但当b=0时,x、y
不具有线性相关关系.
答案: A
3.如图是x和y的一组样本数据的散点图,去掉一组数据 ____________后,剩下的4组数据的相关指数最大.
1.相关关系的概念
两个变量间的关系可分为确定性关系和_非__确__定__性___关系, 前者又称为__函__数____关系,后者又称为相关关系.
2.相关系数
n
i=1 xi- x yi- y (1)r= llxxxylyy=____i_=n_1 __x_i-__x__2_·i_=n_1__y_i-___y__2 __

2020_2021学年高中数学第三章统计案例3.1回归分析课件北师大版选修2_3

2020_2021学年高中数学第三章统计案例3.1回归分析课件北师大版选修2_3

i=1
i=1
定两变量的相关性?
提示:当 r>0 时,表明两个变量正相关,当 r<0 时,表示两 个变量负相关,r 的绝对值越接近于 1,表明两个变量线性相关 性越强;r 的绝对值越接近于 0,表明两变量之间几乎不存在线 性相关关系,通常当|r|>0.75 时,认为两个变量有很强的线性相 关关系.
知识点三 可线性化的回归分析 [填一填]
两个变量的值总体上呈现出同时增减的趋势,此时称两个变量
正相关 ;当 r<0 时,b<0,一个变量增加,另一个变量有减少 的趋势,称两个变量 负相关 ;当 r=0 时,称两个变量线性 不相关.
[答一答]
2.如何由样本的相关系数 r=
n
xi- x yi- y
i=1

n
n
xi- x 2· yi- y 2
§1 回归分析
01 预习篇
02课堂篇
03提高篇
04 巩固篇
课时作业
知识点一 回归分析
[填一填] (1)函数关系是一种 确定性 的关系,而相关关系是一种 非确定性 关系. 回归分析 是对具有相关关系的两个变量进
行统计分析的常用方法.
[答一答] 1.线性回归直线方程 y=a+bx 与一次函数 y=a+kx 有何 区别?
通过变换先将非线性函数转化成线性函数,利用 最小二乘法 得到线性回归方程,再通过相应变换得到非线性 回归方程.
[答一答] 3.如何将函数 y=aebx 转化为线性函数?
提示:先对 y=aebx 两边取对数得 lny=lna+bx.若记 u=lny, c=lna.
则 u=c+bx,就把函数 y=aebx 转化成了线性函数 u=c+bx.
3.如何根据原始数据求出拟合函数? (1)可先由原始数据作出散点图;(2)对于一些函数模型的图 形要熟悉.如教材第 8 项的幂函数曲线 y=axb、指数曲线 y=aebx、 倒指数曲线 y=aebx和对数曲线 y=a+blnx 要熟悉;(3)由散点图 找出拟合比较好的函数类型;(4)将非线性函数转化为线性函数; (5)求出回归方程.

高中数学3-1-1回归分析同步课件北师大版选修

高中数学3-1-1回归分析同步课件北师大版选修

y1+y2+…+yn 用 y 表示数据 y1,y2,…,yn 的平均值,即 y = n

1n . y i ni=1
(2)参数 a、b 的求法 n n xiyi-n x y lxy xi- x yi- y b= = i=1 = i=1 , lxx
xi- x
i=1
n
2
2 - n x x2 i i=1
809 x =7, y = , 7
7 2 xi =371, xiyi=5 i=1 i=1

7

798
xiyi-7 x y
i=1
7
b=
2 - 7 x x2 i i=1
7
809 5 798-7×7× 7 = ≈4.82, 371-7×72
809 ^ a= y -b x = -4.82×7≈81.83. 7 所以线性回归方程为 y=81.83+4.82x.
B.在平面直角坐标系中用描点的方法得到表示具有相关 关系的两个量的一组数据的图形叫做散点图 C.线性回归方程最能代表具有线性相关关系的x,y之间 的关系 D.任何一组观测值都能得到具有代表意义的线性回归方

解析 只有对两个变量具有线性相关性作出判断时,利用最小二
乘法求出线性方程才有意义.
答案 D
题型二 求线性回归方程
【例2】 已知某地区4岁~10岁女孩各自的平均身高数据如下: 4 100 5 106 6 112 7 116 8 121 9 124 10 130
年龄x/岁 身高y/cm
求y对x的线性回归直线方程.
[思路探索] 要求线性回归方程 → 运用最小二乘法 → 求出a,b
解 制表 i xi yi xi yi 1 4 100 400 2 5 106 530 3 6 112 672 4 7 116 812 5 8 121 968 6 9 124 1 116y -b x

2021_2021学年高中数学第三章统计案例3.1回归分析3.1.3可线性化的回归分析课件北师大版选

2021_2021学年高中数学第三章统计案例3.1回归分析3.1.3可线性化的回归分析课件北师大版选
据如下表:
温度 x/℃
2
某项指标 y
5.790 6.810 8.199 10.001 12.190 14.790 17.801
3
4
5
6
7
8
试建立某项指标y与温度x的回归模型,并判断回归模型的拟合效
果.
分析:根据表中的数据画出散点图,再由散点图设出相应的回归
模型.
题型一
题型二
题型三
解:画出散点图如下图,观察形状大致呈二次函数图像的形状,可
解:设u=ln y,c=ln a,那么u=c+bx.
由得下表:
x
1
2
3
4
5
6
u=ln y
3.951 2
4.110 9
4.219 5
4.304 1
4.356 7
4.418 8
题型一
题型二
题型三
6
6
=1
i=1
∑ xi=21, ∑ ui=25.361
6
6
6
2
2, ∑ =91, ∑ 2
=1
=1
x 1 2
y 2 2.69
1
A.y=2+ x
3
1
C.y=2e
3 4
3 3.38
5
3.6
6
3.8
7 8
4 4.08
9
4.2
)
10
4.3
B.y=2ex
D.y=2+ln x
解析:选项 C 中的函数在区间(0,+∞)内为减函数,不合题意.
选项 B 中当 x=10 时,y=2·e10,远远大于 4.3,不合题意.
数进展拟合.

3.1_回归分析(三)

3.1_回归分析(三)
5 i i
xi2 1660, yi2 327, xi yi 620,
i 1 i 1 i 1
ˆ b
x y 5x y
i 1 5
x
i 1
2 i
5x
2
620 5 18 7.4 1.15. 2 1660 5 18
ˆ a 7.4 1.15 18 28.1.
残差图的制作及作用 几点说明: 1、坐标纵轴为残差变量,横轴可以有不同的选择; 第一个样本点和第6个样本点的残差比较大,需要确认在采集过程中是否有人为 2、若模型选择的正确,残差图中的点应该分布在以横 的错误。如果数据采集有错误,就予以纠正,然后再重新利用线性回归模型拟合数 据;如果数据采集没有错误,则需要寻找其他的原因。 轴为心的带形区域; 另外,残差点比较均匀地落在水平的带状区域中,说明选用的模型计较合适,这 样的带状区域的宽度越窄,说明模型拟合精度越高,回归方程的预报精度越高。 3、对于远离横轴的点,要特别注意。
x
6 9 12 15 18 21 24 27 30 33 36 39
郑平正 制作
最好的模型是哪个?
400 300
400 300 200 100 0
0 5 10 15 20 25 30 35 40
产卵数
产卵数
200 100 0 -100
450 400 350 300 250
产卵数
-40
-30
-20
-10 0 -100 -200
2013-6-13
郑平正 制作
复习回顾
1、线性回归模型: y=bx+a+e, (3)

y=bx+a+e,
E(e)=0,D(e)=

高中数学 统计案例3.1回归分析3.1.2相关系数课件北师大版

高中数学 统计案例3.1回归分析3.1.2相关系数课件北师大版

∑ 1 031
题型一
题型二
由此可得,������=128.875,������=8.950. 进而求得 r=
9 611.7-8×128.875×8.950 137 835-8×128.8752 × 671.00-8×8.9502
≈0.993.
因此,交通事故数 y 与机动车辆数 x 有较强的线性相关程度.
1
2
3
4
4.某企业的某种产品产量与单位成本数据如下表:
产量 x/千件 单位成 本 y/(元/件) 2 73 3 72 4 71 3 73 4 69 5 68
(1)试确定相关系数r及回归直线; (2)指出产量每增加1千件时,单位成本下降多少; (3)产量为6千件时,单位成本是多少?单位成本为70元时,产量应为 多少?
5
∑ xiyi=8 285, ∑ ������������2 =59 051,������=15,������=108.6.
∑ ������������ ������������ -5������ ������ ������=1
2 5 2 2 2 ∑ ������������ -5������ ∑ ������������ -5������ ������=1 ������=1 5 5
求相关系数r.
题型一
题型二
解:列表如下:
i 1 2 3 4 5 6 7 xi 18 20 22 24 26 28 30 yi 26.86 28.35 28.75 28.87 29.75 30.00 30.36 202.94 xi2 324 400 484 576 676 784 900 4 144 xiyi 483.48 567 632.5 692.88 773.5 840 910.8 4 900.16 yi2 721.459 6 803.722 5 826.562 5 833.476 9 885.062 5 900 921.729 6 5 892.013 6

数学北师大课件:1.1 回归分析(三)(选修1-2)

数学北师大课件:1.1 回归分析(三)(选修1-2)
事实上,它是预报变量的可能取值的平均值。
涉及到统计的一些思想:
模型适用的总体; 模型的时间性; 样本的取值范围对模型的影响; 模型预报结果的正确理解。
2019/9/4
郑平正 制作
什么是回归分析?
(内容)
1. 从一组样本数据出发,确定变量之间的数学关 系式
2. 对这些关系式的可信程度进行各种统计检验, 并从影响某一特定变量的诸多变量中找出哪些 变量的影响显著,哪些不显著
郑平正 制作
练习 假设关于某设备的使用年限x和所支出的维修费用 y(万
元),有如下的统计资料。
2019/9/4
郑平正 制作
案例2 一只红铃虫的产卵数y和温度x有关。现
收集了7组观测数据列于表中:
温度xoC 21 23 25 27 29 32 35 产卵数y/个 7 11 21 24 66 115 325
(1)试建立产卵数y与温度x之间的回归方程;并 预测温度为28oC时产卵数目。 (2)你所建立的模型中温度在多大程度上解释了 产卵数的变化?
当x=28oC 时,y ≈44 ,指数回归
模型中温度解释了98.5%的产卵数的
2.8 2.4
2 1.6 1.2 0.8 0.4
0 0
z
36
x
9 12 15 18 21 24 27 30 33 36 39
变化
2019/9/4
郑平正 制作
最好的模型是哪个?
产卵数
400
300
200
100
0
0
5
10
15
20
n 2 i1
n2
为 2 的估计量, 2越小,预报精度越高。
(2)我们可以用相关指数R2来刻画回归的效果,其

25-3.1回归分析的基本思想及其初步应用(1)

25-3.1回归分析的基本思想及其初步应用(1)

3.1回归分析的基本思想及其应用教材分析本节内容是数学选修2-3 第三章 统计案例 的起始课,是在《数学③(必修)》之后,学生已经学习了两个变量之间的相关关系,包括画散点图,最小二乘法求回归直线方程等内容.在这一节中进一步介绍回归分析的基本思想及其初步应用.这部分内容《教师用书》共计4课时,第一课时:介绍线性回归模型的数学表达式,解释随机误差项产生的原因,使学生能正确理解回归方程的预报结果,并能从残差分析角度讨论回归模型的拟合效果;第二课时:从相关系数、相关指数角度探讨回归模型的拟合效果,以及建立回归模型的基本步骤;第三课时:介绍两个变量非线性相关关系;第四课时:回归分析的应用. 本节课是第一课时的内容.本节课的重点是回归分析的基本方法、随机误差e 的认识、残差,难点是回归分析的基本方法.课时分配本节内容用1课时的时间完成,主要介绍线性回归模型的数学表达式,解释随机误差项产生的原因,使学生能正确理解回归方程的预报结果,并能从残差分析角度讨论回归模型的拟合效果.教学目标重点: 回归分析的基本方法、随机误差e 的认识、残差. 难点:回归分析的基本方法.知识点:回归分析的基本方法、随机误差e 、残差.能力点:如何探寻回归分析的基本方法,数形结合的数学思想的运用.教育点:经历由特殊到一般的研究数学问题的过程,体会探究的乐趣,激发学生的学习热情. 自主探究点:如何运用最小二乘法求回归直线方程.考试点:求解线性回归方程,从残差的角度讨论回归模型的拟合效果. 易错易混点:随机误差e 与残差之间的区别与联系.拓展点:从相关系数、相关指数角度探讨回归模型的拟合效果,以及建立回归模型的基本步骤.教具准备 多媒体课件 课堂模式 学案导学 一、引入新课对于一组具有线性相关关系的数据112233(,),(,),(,),,(,).n n x y x y x y x y 其回归直线方程的截距和斜率的最小二乘法估计公式分别为:a y bx =- 121()()()niii nii x x y y b x x ==--=-∑∑11n i i x x n ==∑ 11ni i y y n ==∑ (,)x y 称为样本点的中心. 如何推导这两个计算公式?【设计意图】由学生所熟悉的最小二乘法引入新课,消除了学生对新知的恐惧感,引出最小二乘法的中的系数,a b ∧∧的计算公式的推导过程.二、探究新知从已经学过的知识,截距a 和斜率b 分别是使21(,)()niii Q y x αββα==--∑取最小值时,αβ的值,由于212212211(,)[((]{[(2[([(][(]}[(2[([(](ni i i ni i i i i nni i i i i i Q y x y x y x y x y x y x y x y x y x y x y x y x y x y x n y x αββββαβββββαβαβββββαβα=====-----=---+---⋅--+--=---+---⋅--+--∑∑∑∑)+))])])))])]))因为1111[((([(([(]([(]0,nniiiii i n ni i i i y x y x y x y x y x y x y x y x n y x y x ny n x n y x βββαβαβββαβββαββ====-----=-----=-----=-----=∑∑∑∑)])))]))))所以2212222111222221122111[([(]()2()()()(()()[()()](()[]()()()ni i i n n ni i ii i i i nniii i ni i i i nni i iii i Q y x y x n y x x x x x y y y y n y x x x y y x x y y n y x x x y y x x x x αββββαβββαβαβ==========---+--=----+-+------=--+---+---∑∑∑∑∑∑∑∑∑(,))])))1n=∑在上式中,后两项和,αβ无关,而前两项为非负数,因此要使Q 取得最小值,当且仅当前两项的值均为0.,既有121()()()niii nii x x y y x x β==--=-∑∑y x αβ=-通过上式推导,可以训练学生的计算能力,观察分析能力,能够很好训练学生数学能力,必须在老师引导下让学生自己推出.所以:a y bx =- 121()()()niii nii x x y y b x x ==--=-∑∑这正是我们所要推导的公式.三、理解新知准确理解最小二乘法中系数,a b ∧∧的计算公式,以及回归方程的求解过程. 【设计意图】为准确地运用新知,作必要的铺垫.四、运用新知例1、 从某大学中随机选取8名女大学生,其身高和体重的数据如图所示:(1) 画出以身高为自变量x,体重为因变量y 的散点图;(2) 求根据女大学生的身高预报体重的回归方程;(3) 求预报一名身高为172cm 的女大学生的体重. 解:(1)由于问题中要求根据身高预报体重,因此选取身高为自变量x ,体重为因变量y 作散点图:(2)0.849,85.712:0.84985.712.b a y x ==-∴=-回归方程(3)对于身高172cm 的女大学生,由回归方程可以预报体重为:0.84917285.71260.316()y kg =⨯-=ˆ0.849b=是斜率的估计值,说明身高x 每增加1个单位时,体重y 就增加0.849 个单位,这表明体重与身高具有正的线性相关关系.如何描述它们之间线性相关关系的强弱?【设计意图】通过具体例子让学生感受回归分析思想的应用.最后的问题为接下来引入残差做了铺垫.在必修 3 中,我们介绍了用相关系数;来衡量两个变量之间线性相关关系的方法.本相关系数的具体计算公式为()()niix x y y r --=∑当r >0时,表明两个变量正相关;当r <0时,表明两个变量负相关.r 的绝对值越接近1,表明两个变量的线性相关性越强;r 的绝对值接近于0时,表明两个变量之间几乎不存在线性相关关系.通常,当r 的绝对值大于0. 75 时认为两个变量有很强的线性相关关系.165在本例中,可以计算出r =0. 798.这表明体重与身高有很强的线性相关关系,从而也表明我们建立的回归模型是有意义的.显然,身高172cm 的女大学生的体重不一定是60. 316 kg ,但一般可以认为她的体重接近于60 . 316 kg .图3 . 1- 2 中的样本点和回归直线的相互位置说明了这一点.由于所有的样本点不共线,而只是散布在某一条直线的附近,所以身高和体重的关系可用下面的线性回归模型来表示:y bx a e =++, ( 3 )这里a 和b 为模型的未知参数,e 是y 与y bx a =+之间的误差.通常e 为随机变量,称为随机误差,它的均值 E (e )=0,方差D (e )=2()D e σ=>0 .这样线性回归模型的完整表达式为:2,()0,().y bx a e E e D e σ=++⎧⎨==⎩ (4) 在线性回归模型(4)中,随机误差e 的方差越小,通过回归直线y bx a =+ (5)预报真实值y 的精度越高.随机误差是引起预报值y 与真实值y 之间的误差的原因之一,大小取决于随机误差的方差.另一方面,由于公式(1)和(2)中a 和b 为截距和斜率的估计值,它们与真实值a 和b 之间也存在误差,这种误差是引起预报值y 与真实值y 之间误差的另一个原因.【设计意图】引入随机误差e 后,将回归方程推广到回归模型. 思考:产生随机误差项e 的原因是什么?一个人的体重值除了受身高的影响外,还受许多其他因素的影响.例如饮食习惯、是否喜欢运动、度量误差等.事实上,我们无法知道身高和体重之间的确切关系是什么,这里只是利用线性回归方程来近似这种关系.这种近似以及上面提到的影响因素都是产生随机误差 e 的原因.因为随机误差是随机变量,所以可以通过这个随机变量的数字特征来刻画它的一些总体特征.均值是反映随机变量取值平均水平的数字特征,方差是反映随机变量集中于均值程度的数字特征,而随机误差的均值为0,因此可以用方差2σ来衡量随机误差的大小.为了衡量预报的精度,需要估计护的值.一个自然的想法是通过样本方差来估计总体方差.如何得到随机变量e 的样本呢?由于模型(3)或(4)中的e 隐含在预报变量y 中,我们无法精确地把它从y 中分离出来,因此也就无法得到随机变量e 的样本.解决问题的途径是通过样本的估计值来估计2σ.根据截距和斜率的估计公式(1)和(2 ) , 可以建立回归方程y bx a =+,因此y 是(5)中y 的估计量.由于随机误差e y y =-,所以e y y =-是e 的估计量.对于样本点(11,x y ) , (22,x y ) ,…, (,n n x y ) 而言,相应于它们的随机误差为,1,2,,i i i i i e y y y bx a i n =-=--=,其估计值为,1,2,,i i i i i e y y y b x a i n ∧∧∧∧=-=--=,i e ∧称为相应于点(,)i i x y 的残差(residual ).类比样本方差估计总体方差的思想,可以用22111(,)(2)22n i i e Q a b n n n σ∧∧∧∧===>--∑ 作为2σ的估计量, 其中a 和b 由公式(1) (2)给出,Q (a ,b )称为残差平方和(residual sum of squares ).可以用2σ∧衡量回归方程的预报精度.通常,2σ∧越小,预报精度越高.在研究两个变量间的关系时,首先要根据散点图来粗略判断它们是否线性相关,是否可以用线性回归模型来拟合数据.然后,可以通过残差12,,,n e e e ∧∧∧来判断模型拟合的效果,判断原始数据中是否存在可疑数据.这方面的分析工作称为残差分析. 【设计意图】引入残差的概念,使学生会运用残差分析的思想分析模型的拟合效果. 表3- 2 列出了女大学生身高和体重的原始数据以及相应的残差数据.e -6.373 的估计值等,这样作出的图形称为残差图.【设计意图】通过例1的具体数据让学生感受残差分析的应用. 【变式练习】观察两相关变量得如下数据:求两个变量的回归方程. 解:10102110,0,110,110,i i i i i x y x x y ======∑∑10110221101101001,000.11010010i ii i i x y x yb a y b x b x x∧∧∧∧==--⨯∴====-=-⋅=-⨯-∑∑ 所以所求回归直线方程为y x =【设计意图】让学生自己动手解决求回归方程的问题,加深对回归分析思想的印象.五、课堂小结教师提问:本节课我们学习了哪些知识,涉及到哪些数学思想方法? 学生作答:1.回归直线方程,随机误差及残差.2.思想:回归分析的思想、数形结合的思想、残差分析的思想.教师总结: 公式的证明过程用到了前面两章学过的知识,提醒学生: 在学习新知时,也要经常复习前面学过的内容,“温故而知新”.在应用中增强对知识(如本节的随机误差和残差)的理解,及时查缺补漏,从而更好地运用知识,解题要有目的性,加强对数学知识、思想方法的认识与自觉运用. 【设计意图】 加强对学生学习方法的指导,做到“授人以渔”.六、布置作业1.阅读教材P80—84;2.书面作业 P89 习题3.1 1.(1)、(2)、(4).3.课外思考:如何运用回归分析的思想对未知量进行预报轨迹呢?【设计意图】设计作业1,2,是引导学生先复习,再作业,培养学生良好的学习习惯.书面作业的布置,是为了让学生能够运用回归分析的思想,解决简单的数学问题;课外思考的安排,是让学生理解回归分析的思想,从而让学生深刻地体会随机误差,残差分析的思想,培养学生回归分析的基本思想,起到承上启下的作用.七、教后反思1.由于各校的情况不同,建议教师在使用本教案时灵活掌握,但必须在公式的证明思路的探寻上下足功夫.2.本节课的弱项是由于整堂课课堂容量较大,在课堂上没有充分暴露学生的思维过程,并给予针对性地诊断与分析.八、板书设计1i nb ==∑bx。

北师大版高中数学课本目录(含重难点及课时分布)

北师大版高中数学课本目录(含重难点及课时分布)

高中数学课本内容及其重难点北师大版高中数学必修一·第一章集合(考点的难度不是很大,是高考的必考点)· 1、集合的基本关系· 2、集合的含义与表示· 3、集合的基本运算(重点)(2课时)·第二章函数· 1、生活中的变量关系· 2、对函数的进一步认识· 3、函数的单调性(重点)· 4、二次函数性质的再研究(重点)· 5、简单的幂函数(5课时)·第三章指数函数和对数函数· 1、正整数指数函数· 2、指数概念的扩充· 3、指数函数(重点)· 4、对数· 5、对数函数(重点)· 6、指数函数、幂函数、对数函数增减性(重点)(3课时)·第四章函数应用· 1、函数与方程· 2、实际问题的函数建模(2课时)北师大版高中数学必修二·第一章立体几何初步· 1、简单几何体· 2、三视图(重点)· 3、直观图(1课时)· 4、空间图形的基本关系与公理(重点)· 5、平行关系(重点)· 6、垂直关系(重点)· 7、简单几何体的面积和体积(重点)· 8、面积公式和体积公式的简单应用(重点、难点)(4课时)·第二章解析几何初步· 1、直线与直线的方程· 2、圆与圆的方程· 3、空间直角坐标系(4课时)北师大版高中数学必修三·第一章统计· 1、统计活动:随机选取数字· 2、从普查到抽样· 3、抽样方法· 4、统计图表· 5、数据的数字特征(重点)· 6、用样本估计总体· 7、统计活动:结婚年龄的变化· 8、相关性· 9、最小二乘法(3课时)·第二章算法初步· 1、算法的基本思想· 2、算法的基本结构及设计(重点)· 3、排序问题(重点)· 4、几种基本语句(2课时)·第三章概率· 1、随机事件的概率(重点)· 2、古典概型(重点)· 3、模拟方法――概率的应用(重点、难点)(4课时)北师大版高中数学必修四·第一章三角函数· 1、周期现象与周期函数· 2、角的概念的推广· 3、弧度制· 4、正弦函数(重点)· 5、余弦函数(重点)· 6、正切函数(重点)· 7、函数的图像(重点)· 8、同角三角函数的基本关系(重点、难点)(5课时)·第二章平面向量· 1、从位移、速度、力到向量· 2、从位移的合成到向量的加法(重点)· 3、从速度的倍数到数乘向量(重点)· 4、平面向量的坐标(重点)· 5、从力做的功到向量的数量积(重点)· 6、平面向量数量积的坐标表示(重点)· 7、向量应用举例(难点)(5课时)·第三章三角恒等变形(重点)· 1、两角和与差的三角函数· 2、二倍角的正弦、余弦和正切· 3、半角的三角函数· 4、三角函数的和差化积与积化和差· 5、三角函数的简单应用(难点)(4课时)北师大版高中数学必修五·第一章数列· 1、数列的概念· 2、数列的函数特性· 3、等差数列(重点)· 4、等差数列的前n项和(重点)· 5、等比数列(重点)· 6、等比数列的前n项和(重点)· 7、数列在日常经济生活中的应用(6课时)·第二章解三角形(重点)· 1、正弦定理与余弦定理正弦定理· 2、正弦定理· 3、余弦定理· 4、三角形中的几何计算(难点)· 5、解三角形的实际应用举例(6课时)·第三章不等式· 1、不等关系· 1。

3.1回归分析的基本思想及其初步应用

3.1回归分析的基本思想及其初步应用
的关系(如是否存在线性关系等).
(3)由经验确定回归方程的类型(如我们观察到数据呈 线性关系,则选用线性回归方程). ( 4)按 一 定 规 则 ( 如 最 小 二 乘 法 )估 计 回 归 方 程 中 的 参 数 .
(5)得出结果后分析残差图是否有异常(如个别数据对 应残差过大,残差呈现不随机的规律性等),若存在异常, 则检查数据是否有误,或模型是否合适等.
对于一组具有线性相关关系的数据
x1, y1 ,x2, y2 ,,xn , yn ,
我们知道其回归直线y = bx + a的斜率和截距 的最小二乘估计分别为
n
xi x yi y
bˆ i1 n
,
1
aˆ y bˆx,
2
xi x 2
i 1
这正是我们所要推导的公式.
下面我们通过案例 ,进一步学习回归分析的基本 思想及其应用.
例1 从某大学中随机选取8名女大学生,其身高和体 重数据如表 3-1所示.
表 3-1 编号 1 2 3 4 5 6 7 8
身 高 / cm 165 165 157 170 175 165 155 170 体 重 /kg 48 57 50 54 64 61 43 59
4.不能期望回归方程得到的预报值就是预报变量的 精 确 值.事 实 上, 它 是 预 报 变 量 的 可 能 取 值 的 平 均 值. 一 般 地 ,建 立 回 归 模 型 的 基 本 步 骤 为 :
( 1)确 定 研 究 对 象 ,明 确 哪 个 变 量 是 解 释 变 量 ,哪 个 变 量是预报变量. ( 2)画 出 解 释 变 量 和 预 报 变 量 的 散 点 图 ,观 察 它 们 之 间
第三章 统计案例

3.1回归分析的基本思想及其初步应用(二)

3.1回归分析的基本思想及其初步应用(二)

n


★其中:(1)|r|≤1; (2)|r|越接近于1,相关程度越强, |r|越接近于0,相关程度越弱; (3) b 与 r 同号。
3
温故知新
3、线性回归模型:
y bx a e 2 E (e ) 0, D(e )
其中:e是随机误差,均值E(e)=0,方差D(e)=σ2>0 当随机误差e恒等于0时,线性回归模型就变成一 次函数模型。即:一次函数模型是线性回归模型的特
例2、一只红铃虫的产卵数y和温度x有关,现收集了7 组观测数据列于下表,试建立y与x之间的回归方程. 温度x/0C 产卵数y/个 21 7 23 11 25 21 27 24 29 66 32 35
115 325
解:收集数据作散点图:
350 300 250
产卵数
200 150 100 50 0 0 10 20 温度 30 40

(x X i
i 1
i 1
nn
2
i
)x X n
2 2
2
温故知新
2、我们通常用相关系数r来描述两个变量之间 线性相关关系的强弱。
r
x y n xy
i i i1 n 2 2 n 2 2 xi n x yi n y i1 i1
由条件R2分别为0.98和0.80
故指数函数模型的拟合效果比二次函数的模拟效果好.
15
习题3.1
A组 1、3
16
殊形式。
4、相关系数r与随机误差e一般有什么关系?

ˆ y y ˆ e
样本点: ( x1 , y1 ),( x2 , y2 ), ... ,( xn , yn )

2019_2020学年高中数学第三章统计案例1回归分析课件北师大版选修2_3

2019_2020学年高中数学第三章统计案例1回归分析课件北师大版选修2_3

5
xiyi=88×78+76×65+73×71+66×64+63×61
i=1
=25 054.
5
x2i =882+762+732+662+632=27 174.
i=1
5
xiyi-5 x y
i=1
所以 b=
5
x2i -5 x 2
i=1
=25
054-5×73.2×67.8 27 174-5×73.22
探究二 相关系数
[例 2] 下面的数据是从年龄在 40 岁到 60 岁的男子中随机抽出的 6 个样本,分别测定 了心脏的功能水平 y(满分 100),以及每天花在看电视上的平均时间 x(小时).
看电视的平均时间 x 4.4 4.6 2.7 5.8 0.2 4.6 心脏功能水平 y 52 53 69 57 89 65
(1)作出散点图; (2)如果 y 与 x 之间具有线性相关关系,求线性回归方程.
解析:(1)散点图如图.
(2)由散点图可知,y 与 x 呈线性相关关系,设线性回归方程为:y=bx+a. 经计算,得 x =6, y =210.4,i∑=51x2i =220,∑i=51xiyi=7 790. ∴b=7 7902-205-×56××62210.4=36.95, a=210.4-36.95×6=-11.3. ∴线性回归方程为:y=36.95x-11.3.
2.随机抽样中测得四个样本点为(1,2),(2,3),(3,4),(4,5),则 y 与 x 之间的回归直线
方程为( A )
A.y=x+1
B.y=x+2
C.y=2x+1
D.y=x-1
解析: x =1+2+4 3+4=52, y =2+3+4 4+5=72,∴回归直线过(52,72),代
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
相关文档
最新文档