选修1-2统计案例 ppt课件

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
复习回顾
1、线性回归模型:
y=bx+a+e,
其中a和b为模型的未知参数,e称为随机误差。
2是、随数机据误点差和的它效在应回,归称直e$线i =上y相i 应$y位i 为置残的差差。异(yi $yi )
3、对每名女大学生计算这个差异,然后分别将所得
的值平方后加起来,用数学符号表示为:n ( yi $yi )2 i 1
假设线性回归方程为 :ŷ=bx+a
由计算器得:线性回归方程为y=19.87x-463.73
分析和预测
相关指数R2=r2≈0.8642=0.7464
当当xx==2288时时,,yy==191.98.78×7×282-486-436.733.≈739≈3 93
所以,一次函数模型中温度解释了74.64%的产卵数变化。
-200
方案2解答
平方变换:令t=x2,产卵数y和温度x之间二次函数模型y=bx2+a 就转化为产卵数y和温度的平方t之间线性回归模型y=bt+a
温度 温度的平方t 产卵数y/个
21 441 7
23 529 11
25 625 21
27 729 24
29 841 66
32 1024 115
35 1225 325
当x=28oC 时,y ≈44 ,指数回归
模型中温度解释了98.5%的产卵数的
2.8 2.4
2 1.6 1.2 0.8 0.4
0 0
z
36
x
9 12 15 18 21 24 27 30 33 36 39
变化
最好的模型是哪个?
产卵数
400 300 200 100
0 0
-100
5
10 15 20 25 30
问题:一只红铃虫的产卵数y与温度x有关,现收 集了7组观测数据,试建立y与x之间的回归方程
温度x 21 23 25 27 29 32 35 产卵数y 7 11 21 24 66 115 325
解:1)作散点图; 350 300
250
200
产卵数
150
100
50
0
20
22
24
26
28
30
32
34
36
令 z lg y, a lg c1, b c2 ,则 y c110c2x
就转换为z=bx+a
温度xoC z=lgy 产卵数y/个
21 0.85 7
23 1.04 11
25 1.32 21
27 1.38 24
29 1.82 66
32 2.06 115
35 2.51 325
由计算器得:z关于x的线性回归方程 为z=0.118x-1.665 ,y 100.118x-1.665 相关指数R2=r2≈0.99252=0.985
35
40
线性模型
产卵数
400
300
200
100

0

-40 -30 -20 -10 0 10 20 30 40
-100
-200
450 产卵数
400
350
300
250
200 150

100

50
0
-10 -5-50 0 5 10 15 20 25 30 35 40
二次函数模型
指数函数模型
最好的模型是哪个?
作散点图,并由计算器得:y和t之间的线性回归方程为 y=0.367t-202.54,相关指数R2=r2≈0.8962=0.802
将t=x2代入线性回归方程得: y=0.367x2 -202.54
当x=28时,y=0.367×282-
202.54≈85,且R2=0.802, 所以,二次函数模型中温度解 释了80.2%的产卵数变化。
方案3
问题1 问题2
如何选取指数函数的底?
y c1ec2x
非线性关系
y c110c2x
对数变换
y=bx+a 线性关系
方案3解答
对数变换:在 y c110c2x中两边取常用对数得
lg y lg(c110c2x ) lg c1 lg10c2x lg c1 c2x lg10 c2x lg c1
93>66 ? 模型不好?
奇 怪 ?
合作探究
问题1 问题2 问题3
二次函数模型
方案2
选用y=bx2+a ,还是y=bx2+cx+a ?
如何求a、b ?
y=bx2+a 非线性关系
变换 t=x2
y=bt+a 线性关系
400 产卵数
300
200
-40
-30
-20
100
0
-10
0
-100

10
20
30
温 40
回归分析
1. 从一组样本数据出发,确定变量之间的数学 关系式
2. 对这些关系式的可信程度进行各种统计检验, 并从影响某一特定变量的诸多变量中找出哪 些变量的影响显著,哪些不显著
3. 利用所求的关系式,根据一个或几个变量的 取值来预测或控制另一个特定变量的取值, 并给出这种预测或控制的精确程度
回归分析与相关分析的区别
称为残差平方和,它代表了随机误差的效应。
刻画模型拟合的精度
n
( yi yˆi )2
相关指数:R2
1
i 1 n
( yi y)2
i 1
R2取值越大,则残差平方和越小,即模型的拟合效果 越好.
建立回归模型的基本步骤
1)确定解释变量和预报变量; 2)画出散点图; 3)确定回归方程类型; 4)求出回归方程; 5)利用相关指数或残差进行分析.
1. 相关分析中,变量 x 变量 y 处于平等的地位;回 归分析中,变量 y 称为因变量,处在被解释的地 位,x 称为自变量,用于预测因变量的变化
2. 相关分析中所涉及的变量 x 和 y 都是随机变量; 回归分析中,因变量 y 是随机变量,自变量 x 可 以是随机变量,也可以是非随机的确定变量
3. 相关分析主要是描述两个变量之间线性关系的密 切程度;回归分析不仅可以揭示变量 x 对变量 y 的影响大小,还可以由回归方程进行预测和控制
产卵数y/个
350 300 250 200 150 100
50 0 0
t
150 300 450 600 750 900 1050 1200 1350
合作探究
指数函数模型
-10
450 400 350 300 250 200 150 100
50 0
-5-50 0
产卵数
气 温
5百度文库
10 15 20 25 30 35 40
从散点图中可以看出产卵数和温度之间 温度 的关系并不能
用线性回归模型来很好地近似。这些散点更像是集中
在一条指数曲线或二次曲线的附近。
探索新知
选变量
一元线性模型
方案1
解:选取气温为解释变量x,产卵数
350
为预报变量y。
300
250
画散点图
200
150
100
选模型 估计参数
50
0 0 3 6 9 12 15 18 21 24 27 30 33 36 39
相关文档
最新文档