数学建模-回归分析例题共22页

合集下载

数学建模之回归分析

数学建模之回归分析
设:推销开支——x1
实际帐目数——x2 同类商品竞争数——x3 地区销售潜力——x4
第二十九页,共56页。
X= x1
11
5.5
2
2.5
31
8.0
41
3.0
51
3.0
6
2.9
7.
8.0
8.
9.0
9 10
.
4.0 6.5
11 1
5.5
12 13
1
5.0 6.0
14 1
5.0
15 16
1
3.5 8.0
17 1
问题分析:
钢材消费量--------试验指标(因变量)Y; 国民收入-----------自变量 x;
建立数据拟合函数 y = E(Y | x)= f(x); 作拟合曲线图形分析。
第四页,共56页。
y=a+bx
钢材消费量y与国民收入x的散点图
第五页,共56页。
回归分析是研究变量间相关关系的一种统计分析。
输入:[Y,delta]=polyconf(p,x,S);Y
结果: Y= 22.5243
28.3186 27.0450 22.5243 26.0582 27.0450 24.1689
26.0582 24.1689 27.9896 19.6904
27.9896 19.6904 28.3186
拟合效果图:
假设:
1、因变量Y是随机变量,并且它服从正态分布; 2、f(x1,x2,x3,x4)是线性函数(非线性);
模型: Y 0 1 x1 2 x2 3 x3 4 x4 ~ N (0, 2 )
第三十一页,共56页。
知识介绍
2、多元线性回归模型

数学建模回归分析共34页

数学建模回归分析共34页
数学建模回归分析

46、寓形宇内复几时,曷不委心任去 留。

47、采菊东篱下,悠然见南山。

48、啸勤学如春起之苗,不见其增,日 有所长 。

50、环堵萧然,不蔽风日;短褐穿结 ,箪瓢 屡空, 晏如也 。
56、书不仅是生活,而且是现在、过 去和未 来文化 生活的 源泉。 ——库 法耶夫 57、生命不可能有两次,但许多人连一 次也不 善于度 过。— —吕凯 特 58、问渠哪得清如许,为有源头活水来 。—— 朱熹 59、我的努力求学没有得到别的好处, 只不过 是愈来 愈发觉 自己的 无知。 ——笛 卡儿

60、生活的道路一旦选定,就要勇敢地 走到底 ,决不 回头。 ——左

数学建模案例分析回归分析实用教案

数学建模案例分析回归分析实用教案
配曲线(qūxiàn)的一般方法是:
2021/11/8
14
第第1十4四页页,/共共525页2。页
通常(tōngcháng)选择的六类曲线如下:
2021/11/8
返回(fǎnhuí)
解例 2.由散点图我们选配到指数曲线 y=a eb / x 根据线性化方法,算得 bˆ = 1.1107 , Aˆ = 2.4587
2021/11/8
17
第第1十7七页页,/共共525页2。页
2021/11/8
返回 (fǎnhuí)
18
第1第8十八页页,/共共525页。2页
三、多元线性回归(huíguī)中的检验与 预测
(Ⅰ)F 检验法
(Ⅱ)r 检验法
2021/11/8
第1第9十九页页,/共共525页。2页
(残差平方和)
19

逐 步 回 归
回分
归析



1
第第1一页页,/共共525页2。页
一、数学模型
例1 测16名成年女子的身高与腿长所得(suǒ dé)数据如下:
以身高x为横坐标,以腿长y为纵坐标将这些(zhèxiē)数据点(xi,yi)在平面直角坐标系上标出.
解答(jiědá)
散点图
2021/11/8
2
第第2二页页,/共共525页2。页
(1)确定多项式系数的命令:[p,S]=polyfit(x,y,m)
其中 x=(x1,x2,…,xn),y=(y1,y2,…,yn); p=(a1,a2,…,am+1)是多项式 y=a1xm+a2xm-1+…+amx+am+1 的系数;S 是一个矩阵,用来估计预测误差.

回归分析例题

回归分析例题
(4)按一定规则估计回归方程中的参数(如最小二乘法)。 (5)得出结果后分析残差图是否有异常(个别数据对应残差过大,或残 差呈现不随机的规律性,等等),过存在异常,则检查数据是否有误,或 模型是否合适等。
ˆ b
x y 5x y
i 1 5 i i
x
i 1
2 i
5x
2
620 5 18 7.4 1.15. 2 1660 5 18
ˆ 1.15 x 28.1. 回归直线方程为:y
ˆ 7.4 1.15 18 28.1. a
练习、在一段时间内,某中商品的价格x元和需求量Y件之 间的一组数据为:
R2 1
2 ˆ ( y y ) i i 2 ( y y ) i i 1 i 1 5

0.994
因而,拟合效果较好。
小结
用身高预报体重时,需要注意下列问题: ——这些问题也使用于其他问题。 1、回归方程只适用于我们所研究的样本的总体; 2、我们所建立的回归方程一般都有时间性; 3、样本采集的范围会影响回归方程的适用范围; 4、不能期望回归方程得到的预报值就是预报变量的精确值。 事实上,它是预报变量的可能取值的平均值。
价格x
14
16
18
20
22
需求量Y
12
10
7
5
3
求出Y对的回归直线方程,并说明拟合效果的好坏。 列出残差表为
ˆi yi y
yi y
5 i 1
0 4.6
5
0.3 2.6
5 i 1
-0.4 -0.4
-0.1 -2.4
0.2 -4.4
ˆi )2 0.3, ( yi y
2 ( y y ) 53.2, i

高中数学回归分析精选题

高中数学回归分析精选题

回归分析精选题20道一.选择题(共12小题)1.设某大学的女生体重y (单位:)k g 与身高x (单位:)cm 具有线性相关关系,根据一组样本数据(i x ,)(1i y i=,2,⋯,)n ,用最小二乘法建立的回归方程为ˆ0.8585.71y x =-,则下列结论中不正确的是()A .y 与x 具有正的线性相关关系B .回归直线过样本点的中心(x ,)yC .若该大学某女生身高增加1c m ,则其体重约增加0.85k gD .若该大学某女生身高为170c m ,则可断定其体重必为58.79k g2.某商品销售量y (件)与销售价格x (元/件)负相关,则其回归方程可能是()A .ˆ10200yx =-+ B .ˆ10200yx =+ C .ˆ10200yx =-- D .ˆ10200yx =-3.有一散点图如图所示,在5个(,)x y 数据中去掉(3,10)D 后,下列说法正确的是( )A .残差平方和变小B .相关系数r 变小C .相关指数2R 变小D .解释变量x 与预报变量y 的相关性变弱4.在线性回归模型中,分别选择了4个不同的模型,它们的相关指数2R 依次为0.36、0.95、0.74、0.81,其中回归效果最好的模型的相关指数2R 为( )A .0.95B .0.81C .0.74D .0.365.已知四个命题:①在回归分析中,2R 可以用来刻画回归效果,2R 的值越大,模型的拟合效果越好; ②在独立性检验中,随机变量2K 的值越大,说明两个分类变量有关系的可能性越大;③在回归方程ˆ0.212yx =+中,当解释变量x 每增加1个单位时,预报变量ˆy平均增加1个单位;④两个随机变量相关性越弱,则相关系数的绝对值越接近于1; 其中真命题是( )A .①④B .②④C .①②D .②③6.某地区植被被破坏,土地沙化越来越严重,最近三年测得沙漠面积增加值分别为0.2万公顷、0.39万公顷和0.78万公顷,则沙漠面积增加数y (万公顷)关于年数x (年)的函数关系较为接近的是( )A .0.2yx= B .20.10.1y x x=+ C .40.2lo g yx=+ D .210xy=7.对于给定的样本点所建立的模型A 和模型B ,它们的残差平方和分别是212,,a a R 的值分别为1b ,2b ,下列说法正确的是( )A .若12a a <,则12b b <,A 的拟合效果更好 B .若12a a <,则12b b <,B 的拟合效果更好 C .若12a a <,则12b b >,A 的拟合效果更好 D .若12a a <,则12b b >,B 的拟合效果更好8.下列结论正确的是( )①函数关系是一种确定性关系; ②相关关系是一种非确定性关系;③回归分析是对具有函数关系的两个变量进行统计分析的一种方法; ④回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法. A .①②B .①②③C .①②④D .①②③④9.某车间加工零件的数量x 与加工时间y 的统计数据如表:现已求得上表数据的回归方程ˆˆˆy bx a =+中的ˆb 值为0.9,则据此回归模型可以预测,加工100个零件所需要的加工时间约为( )A .84分钟B .94分钟C .102分钟D .112分钟10.两个变量y与x的回归模型中,分别选择了4个不同模型,它们对应的22121()1()ni i i ni i y y Ry y ==-=--∑∑的值如下,其中拟合效果最好的模型是()A .模型1对应的20.48R =B .模型3对应的20.15R =C .模型2对应的20.96R =D .模型4对应的20.30R =11.对于回归分析,下列说法错误的是( )A .在残差图中,纵坐标表示残差B .若散点图中的一组点全部位于直线ˆ32yx =-+的图象上,则相关系数1r =C .若残差平方和越小,则相关指数2R 越大D .在回归分析中,变量间的关系若是非确定关系,那么因变量不能由自变量唯一确定 12.在回归分析中,代表了数据点和它在回归直线上相应位置的差异的是( )A .总偏差平方和B .残差平方和C .回归平方和D .相关指数二.多选题(共1小题)13.下列有关回归分析的结论中,正确的有()A .运用最小二乘法求得的回归直线一定经过样本点的中心(x ,)yB .若相关系数r 的绝对值越接近于1,则相关性越强C .若相关指数2R 的值越接近于0,表示回归模型的拟合效果越好D .在残差图中,残差点分布的带状区域的宽度越窄,说明模型拟合的精度越高 三.填空题(共4小题)14.某商店统计了最近6个月某商品的进价x 与售价y (单位:元)的对应数据如表:假设得到的关于x 和y 之间的回归直线方程是ˆˆˆy bx a =+,那么该直线必过的定点是 .15.对具有线性相关关系的变量x ,y ,测得一组数据如表:根据上表,利用最小二乘法得它们的回归直线方程为ˆˆ10.5y x a=+,据此模型预测,当10x=时,y 的估计值是16.已知x 与y 之间的一组数据:已求得关于y 与x 的线性回归方程ˆ 2.10.85y x =+,则m 的值为 .17.对某城市进行职工人均工资水平x (千元)与居民人均消费水平y (千元)统计调查后知,y 与x 具有线性相关关系,满足回归方程0.6 1.5yx =+,若该城市居民人均消费水平为7.5(千元),则可以估计该城市人均消费额占人均工资收入的百分比约为 . 四.解答题(共3小题)18.某同学在生物研究性学习中想对春季昼夜温差大小与黄豆种子发芽多少之间的关系进行研究,于是他在4月份的30天中随机挑选了5天进行研究,且分别记录了每天昼夜温差与每天每100颗种子浸泡后的发芽数,得到如下资料:(1)从这5天中任选2天,记发芽的种子数分别为m ,n ,求事件“m ,n 均不小于25的概率.(2)从这5天中任选2天,若选取的是4月1日与4月30日的两组数据,请根据这5天中的另三天的数据,求出y 关于x 的线性回归方程ˆˆˆybx a =+;(3)若由线性回归方程得到的估计数据与所选出的检验数据的误差均不超过2颗,则认为得到的线性回归方程是可靠的,试问(2)中所得的线性回归方程是否可靠?(参考公式:1221ˆni i i ni i x y n x yb x n x==-=-∑∑,ˆˆ)ay bx =-19.随着人们经济收入的不断增长,个人购买家庭轿车已不再是一种时尚.车的使用费用,尤其是随着使用年限的增多,所支出的费用到底会增长多少,一直是购车一族非常关心的问题.某汽车销售公司作了一次抽样调查,并统计得出某款车的使用年限x 与所支出的总费用y(万元)有如下的数据资料:(1)在给出的坐标系中做出散点图;(2)求线性回归方程ˆˆˆybx a =+中的ˆa、ˆb ; (3)估计使用年限为10年时,车的使用总费用是多少?(最小二乘法求线性回归方程系数公式1221ˆni i i ni i x y n x yb x n x==-=-∑∑,ˆˆ)ay bx =-.20.一台机器使用的时间较长,但还可以使用,它按不同的转速生产出来的某机械零件有一些会有缺点,每小时生产有缺点零件的多少,随机器的运转的速度而变化,下表为抽样试验的结果:(1)画散点图;(2)如果y对x有线性相关关系,求回归直线方程;(3)若实际生产中,允许每小时的产品中有缺点的零件最多为89个,那么机器的运转速度应控制在什么范围内?(参考数值:511380 i iix y==∑,521145)iix==∑回归分析精选题20道参考答案与试题解析一.选择题(共12小题)1.设某大学的女生体重y (单位:)k g 与身高x (单位:)cm 具有线性相关关系,根据一组样本数据(i x ,)(1i y i=,2,⋯,)n ,用最小二乘法建立的回归方程为ˆ0.8585.71y x =-,则下列结论中不正确的是()A .y 与x 具有正的线性相关关系B .回归直线过样本点的中心(x ,)yC .若该大学某女生身高增加1c m ,则其体重约增加0.85k gD .若该大学某女生身高为170c m ,则可断定其体重必为58.79k g【分析】根据回归方程为ˆ0.8585.71yx =-,0.85>,可知A ,B ,C 均正确,对于D 回归方程只能进行预测,但不可断定. 【解答】解:对于A ,0.85>,所以y 与x 具有正的线性相关关系,故正确;对于B ,回归直线过样本点的中心(x ,)y ,故正确;对于C ,回归方程为ˆ0.8585.71yx =-,∴该大学某女生身高增加1c m ,则其体重约增加0.85k g,故正确;对于D ,170xc m=时,ˆ0.8517085.7158.79y =⨯-=,但这是预测值,不可断定其体重为58.79k g,故不正确故选:D .【点评】本题考查线性回归方程,考查学生对线性回归方程的理解,属于中档题. 2.某商品销售量y (件)与销售价格x (元/件)负相关,则其回归方程可能是()A .ˆ10200yx =-+ B .ˆ10200yx =+ C .ˆ10200yx =-- D .ˆ10200yx =-【分析】本题考查的知识点是回归分析的基本概念,根据某商品销售量y (件)与销售价格x(元/件)负相关,故回归系数应为负,再结合实际进行分析,即可得到答案.【解答】解:由x 与y 负相关, 可排除B 、D 两项,而C 项中的ˆ102000yx =--<不符合题意.故选:A .【点评】两个相关变量之间的关系为正相关关系,则他们的回归直线方程中回归系数为正;两个相关变量之间的关系为负相关关系,则他们的回归直线方程中回归系数为负.3.有一散点图如图所示,在5个(,)D后,下列说法正确的是()x y数据中去掉(3,10)A.残差平方和变小B.相关系数r变小C.相关指数2R变小D.解释变量x与预报变量y的相关性变弱【分析】利用散点图分析数据,判断相关系数,相关指数,残差的平方和,的变化情况.【解答】解:从散点图可分析得出:只有D点偏离直线远,去掉D点,变量x与变量y的线性相关性变强,相关系数变大,相关指数变大,残差的平方和变小,故选:A.【点评】本题考查了利用散点图分析数据,判断变量的相关性问题,属于运用图形解决问题的能力,属于容易出错的题目.4.在线性回归模型中,分别选择了4个不同的模型,它们的相关指数2R依次为0.36、0.95、0.74、0.81,其中回归效果最好的模型的相关指数2R为()A.0.95B.0.81C.0.74D.0.36【分析】根据两个变量y与x的回归模型中,它们的相关指数2R越接近于1,这个模型的拟合效果就越好,由此选出选项中的答案.【解答】解:两个变量y与x的回归模型中,它们的相关指数2R越接近于1,这个模型的拟合效果就越好,在所给的四个选项中0.95是相关指数最大的值,∴其拟合效果也最好.故选:A.【点评】本题考查了相关指数,这里不用求相关指数,而是根据所给的相关指数判断模型的拟合效果,解题的关键是理解相关指数越大拟合效果越好.5.已知四个命题:①在回归分析中,2R可以用来刻画回归效果,2R的值越大,模型的拟合效果越好;②在独立性检验中,随机变量2K的值越大,说明两个分类变量有关系的可能性越大;③在回归方程ˆ0.212y x=+中,当解释变量x每增加1个单位时,预报变量ˆy平均增加1个单位;④两个随机变量相关性越弱,则相关系数的绝对值越接近于1;其中真命题是()A.①④B.②④C.①②D.②③【分析】对4个选项分别进行判断,即可得出结论.【解答】解:①相关指数2R是用来刻画回归效果的,2R表示解释变量对预报变量的贡献率,2R越接近于1,表示解释变量和预报变量的线性相关关系越强,越趋近0,关系越弱,故2R的值越大,说明回归模型的拟合效果越好,故①正确.②由2K的计算公式可知,对分类变量X与Y的随机变量2K的观测值k来说,k越小,判断“X与Y有关系”的把握越小,随机变量2K的值越大,说明两个分类变量有关系的可能性越大,故②正确;③在回归直线方程ˆ0.212=+中,当解释变量x每增加一个单位时,预报变量ˆy平均增加y x0.2个单位,故③错误.④两个随机变量相关性越强,则相关系数的绝对值越接近于1;两个随机变量相关性越弱,则相关系数的绝对值越接近于0,故④不正确.故选:C.【点评】本题以命题的真假判断为载体,考查了抽样方法,相关系数,回归分析,独立性检验等知识点,难度不大,属于基础题.6.某地区植被被破坏,土地沙化越来越严重,最近三年测得沙漠面积增加值分别为0.2万公顷、0.39万公顷和0.78万公顷,则沙漠面积增加数y (万公顷)关于年数x (年)的函数关系较为接近的是( )A .0.2yx= B .20.10.1y x x=+ C .40.2lo g yx=+D .210xy=【分析】将(1,0.2),(2,0.39),(3,0.78)分别代入0.2y x=,20.10.1yx x=+,40.2lo g yx=+和210xy=中,验证即可.【解答】解:将(1,0.2),(2,0.39),(3,0.78)代入0.2y x=,当3x=时,0.6y=,和0.78相差较大;将(1,0.2),(2,0.39),(3,0.78)代入20.10.1y x x=+,当2x=时,0.6y=,和0.39相差较大;将(1,0.2),(2,0.39),(3,0.78)代入40.2lo g y x=+,当2x=时,0.7y=,和0.39相差较大;将(1,0.2),(2,0.39),(3,0.78)代入210xy =,当1x =时,0.2y =,当2x =时,0.4y =,与0.39相差0.01, 当3x=时,0.8y=,和0.78相差0.02;综合以上分析,选用函数关系210xy =较为近似.故选:D .【点评】本题考查了函数模型的应用问题,也考查了运算求解能力,是基础题.7.对于给定的样本点所建立的模型A 和模型B ,它们的残差平方和分别是212,,a a R 的值分别为1b ,2b ,下列说法正确的是( )A .若12a a <,则12b b <,A 的拟合效果更好 B .若12a a <,则12b b <,B 的拟合效果更好 C .若12a a <,则12b b >,A 的拟合效果更好D .若12a a <,则12b b >,B 的拟合效果更好【分析】比较两个模型的拟合效果时,如果模型残差平方和越小,则相应的相关指数2R 越大,该模型拟合的效果越好,即可得出结论.【解答】解:比较两个模型的拟合效果时,如果模型残差平方和越小, 则相应的相关指数2R 越大,该模型拟合的效果越好. 故选:C .【点评】本题是基础题.考查残差平方和、相关指数. 8.下列结论正确的是()①函数关系是一种确定性关系; ②相关关系是一种非确定性关系;③回归分析是对具有函数关系的两个变量进行统计分析的一种方法; ④回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法. A .①②B .①②③C .①②④D .①②③④【分析】本题是一个对概念进行考查的内容,根据相关关系的定义与回归分析的统计意义进行判断.【解答】解:①函数关系是一种确定性关系,这是一个正确的结论. ②相关关系是一种非确定性关系,是一个正确的结论.③回归分析是对具有相关关系的两个变量进行统计分析的一种方法,所以③不对. 与③对比,依据定义知④是正确的, 故选:C .【点评】本题的考点是相关关系,对本题的正确判断需要对相关概念的熟练掌握. 9.某车间加工零件的数量x 与加工时间y 的统计数据如表:现已求得上表数据的回归方程ˆˆˆy bx a =+中的ˆb 值为0.9,则据此回归模型可以预测,加工100个零件所需要的加工时间约为( )A .84分钟B .94分钟C .102分钟D .112分钟【分析】根据表中所给的数据,做出横标和纵标的平均数,得到样本中心点,代入样本中心点求出a 的值,写出线性回归方程.将100x=代入回归直线方程,得y ,可以预测加工100个零件需要102分钟,这是一个预报值,不是生产100个零件的准确的时间数. 【解答】解:由表中数据得:20x =,30y=,又ˆb 值为0.9,故300.92012a=-⨯=,0.912y x ∴=+.将100x=代入回归直线方程,得0.910012102y =⨯+=(分钟).∴预测加工100个零件需要102分钟.故选:C .【点评】本题考查线性回归方程的求法和应用,解题的关键是正确应用最小二乘法求出线性回归方程的系数的运算,再一点就是代入样本中心点可以求出字母a 的值,是一个中档题目. 10.两个变量y与x的回归模型中,分别选择了4个不同模型,它们对应的22121()1()ni i i ni i y y Ry y ==-=--∑∑的值如下,其中拟合效果最好的模型是()A .模型1对应的20.48R =B .模型3对应的20.15R =C .模型2对应的20.96R =D .模型4对应的20.30R =【分析】根据回归分析中相关指数2R 越接近于1,拟合效果越好,即可得出答案. 【解答】解:回归分析中,相关指数2R 越接近于1,拟合效果越好; 越接近0,拟合效果越差,由模型2对应的2R 最大,其拟合效果最好. 故选:C .【点评】本题考查了利用相关指数判断模型拟合效果的应用问题,是基础题. 11.对于回归分析,下列说法错误的是( )A .在残差图中,纵坐标表示残差B .若散点图中的一组点全部位于直线ˆ32y x =-+的图象上,则相关系数1r =C .若残差平方和越小,则相关指数2R 越大D .在回归分析中,变量间的关系若是非确定关系,那么因变量不能由自变量唯一确定 【分析】根据题意,对选项种的命题分析判断正误即可.【解答】解:对于A ,在残差图中,纵坐标为残差,横坐标可以选为样本编号,或身高数据,或体重的估计值等,所以A 正确;对于B,散点图中的一组点全部位于直线ˆ32=-+的图象上,则x,y成负相关,且相关y x关系最强,此时相关系数1r=-,所以B错误;对于C,若残差平方和越小,则残差点分布的带状区域的宽度越窄,其相关性越强,相关指数2R越大,所以C正确;对于D,回归分析中,变量间的关系若是非确定关系,即变量间的关系不是函数关系,因变量不能由自变量唯一确定,所以D正确.故选:B.【点评】本题考查了统计知识的概念与应用问题,掌握相关概念的含义是解题的关键,是基础题.12.在回归分析中,代表了数据点和它在回归直线上相应位置的差异的是() A.总偏差平方和B.残差平方和C.回归平方和D.相关指数【分析】本题考查的回归分析的基本概念,根据拟合效果好坏的判断方法我们可得,数据点和它在回归直线上相应位置的差异是通过残差的平方和来体现的.【解答】解:拟合效果好坏的是由残差的平方和来体现的,而拟合效果即数据点和它在回归直线上相应位置的差异故据点和它在回归直线上相应位置的差异是通过残差的平方和来体现的.故选:B.【点评】拟合效果好坏的是由残差的平方和来体现的,也可以理解为拟合效果即数据点和它在回归直线上相应位置的差异,故据点和它在回归直线上相应位置的差异是通过残差的平方和来体现的.二.多选题(共1小题)13.下列有关回归分析的结论中,正确的有()A.运用最小二乘法求得的回归直线一定经过样本点的中心(x,)yB.若相关系数r的绝对值越接近于1,则相关性越强C.若相关指数2R的值越接近于0,表示回归模型的拟合效果越好D.在残差图中,残差点分布的带状区域的宽度越窄,说明模型拟合的精度越高【分析】利用回归分析中的相关知识对四个选项逐一分析判断即可.【解答】解:对于A,回归方程必定经过样本中心(x,)y,故选项A正确;对于B,由相关系数的意义可知,相关系数r的绝对值越接近于1,则相关性越强,故选项B正确;对于C ,若相关指数2R 的值越接近于1,表示回归模型的拟合效果越好,故选项C 错误; 对于D ,在残差图中,残差点分布的带状区域的宽度越窄,说明模型拟合的精度越高,故选项D 正确. 故选:A B D .【点评】本题考查了回归分析的理解,主要考查了回归方程的性质,相关系数的意义等,属于基础题.三.填空题(共4小题)14.某商店统计了最近6个月某商品的进价x 与售价y (单位:元)的对应数据如表:假设得到的关于x 和y 之间的回归直线方程是ˆˆˆy bx a =+,那么该直线必过的定点是13(2,8).【分析】根据回归方程必过点(,)x y ,计算出,x y 即可求得答案. 【解答】解:35289121362x+++++==,4639121486y+++++==,回归方程必过点(,)x y ,∴该直线必过的定点是13(2,8).故答案为:13(2,8).【点评】本题考查了回归方程,线性回归方程必过样本中心点(,)x y ,这是线性回归中最常考的知识点,希望大家熟练掌握.属于基础题.15.对具有线性相关关系的变量x ,y ,测得一组数据如表:根据上表,利用最小二乘法得它们的回归直线方程为ˆˆ10.5y x a=+,据此模型预测,当10x=时,y 的估计值是 106.5【分析】根据表中数据计算x 、y ,代入回归直线方程求得ˆa的值, 写出回归直线方程,利用方程求出10x =时ˆy的值即可. 【解答】解:根据表中数据,计算1(24568)55x=⨯++++=,1(2040607080)545y =⨯++++=,代入回归直线方程ˆˆ10.5y x a=+中,求得ˆ5410.55 1.5a =-⨯=,∴回归直线方程为ˆ10.5 1.5yx =+,据此模型预测,10x=时,ˆ10.510 1.5106.5y=⨯+=,即y 的估计值是106.5. 故答案为:106.5.【点评】本题考查了线性回归方程的应用问题,是基础题. 16.已知x 与y 之间的一组数据:已求得关于y 与x 的线性回归方程ˆ 2.10.85y x =+,则m 的值为 0.5 .【分析】首先求出这组数据的横标和纵标的平均数,写出这组数据的样本中心点,把样本中心点代入线性回归方程求出m 的值. 【解答】解:0123342x +++==,3 5.5715.544m m y++++==,∴这组数据的样本中心点是3(2,15.5)4m +, 关于y 与x 的线性回归方程ˆ 2.10.85y x =+,∴15.532.10.8542m +=⨯+,解得0.5m =,m∴的值为0.5.故答案为:0.5.【点评】本题考查回归分析,考查样本中心点满足回归直线的方程,考查求一组数据的平均数,是一个运算量比较小的题目,并且题目所用的原理不复杂,是一个好题.17.对某城市进行职工人均工资水平x (千元)与居民人均消费水平y (千元)统计调查后知,y 与x 具有线性相关关系,满足回归方程0.6 1.5yx =+,若该城市居民人均消费水平为7.5(千元),则可以估计该城市人均消费额占人均工资收入的百分比约为 75%.【分析】根据y 与x 具有线性相关关系,且满足回归方程,和该城市居民人均消费水平为,把消费水平的值代入线性回归方程,可以估计该市的职工均工资水平,做出人均消费额占人均工资收入的百分比. 【解答】解:y与x 具有线性相关关系,满足回归方程0.6 1.5yx =+,该城市居民人均消费水平为7.5y=,∴可以估计该市的职工均工资水平7.50.6 1.5x =+,10x ∴=,∴可以估计该城市人均消费额占人均工资收入的百分比约为7.5100%75%10⨯=,故答案为:75%【点评】本题考查线性回归方程的应用,考查用线性回归方程估计方程中的一个变量,利用线性回归的知识点解决实际问题. 四.解答题(共3小题)18.某同学在生物研究性学习中想对春季昼夜温差大小与黄豆种子发芽多少之间的关系进行研究,于是他在4月份的30天中随机挑选了5天进行研究,且分别记录了每天昼夜温差与每天每100颗种子浸泡后的发芽数,得到如下资料:(1)从这5天中任选2天,记发芽的种子数分别为m ,n ,求事件“m ,n 均不小于25的概率.(2)从这5天中任选2天,若选取的是4月1日与4月30日的两组数据,请根据这5天中的另三天的数据,求出y 关于x 的线性回归方程ˆˆˆybx a =+;(3)若由线性回归方程得到的估计数据与所选出的检验数据的误差均不超过2颗,则认为得到的线性回归方程是可靠的,试问(2)中所得的线性回归方程是否可靠?(参考公式:1221ˆni i i ni i x y n x yb x n x==-=-∑∑,ˆˆ)ay bx =-【分析】(1)用数组(,)m n 表示选出2天的发芽情况,用列举法可得m ,n 的所有取值情况,分析可得m ,n 均不小于25的情况数目,由古典概型公式,计算可得答案;(2)根据所给的数据,先做出x ,y 的平均数,即做出本组数据的样本中心点,根据最小二乘法求出线性回归方程的系数,写出线性回归方程.(3)根据估计数据与所选出的检验数据的误差均不超过2颗,就认为得到的线性回归方程是可靠的,根据求得的结果和所给的数据进行比较,得到所求的方程是可靠的.【解答】解:(1)用数组(,)m n 表示选出2天的发芽情况,m,n 的所有取值情况有(23,25),(23,30),(23,26),(23,16),(25,30),(25,26),(25,16),(30,26),(30,16),(30,26),共有10个设“m ,n 均不小于25”为事件A ,则包含的基本事件有(25,30),(25,26),(30,26) 所以3()10P A =,故事件A 的概率为310(2)由数据得12,27xy ==,3972x y=,31977i i i x y ==∑,321434i i x ==∑,23432x =由公式,得9779725ˆ4344322b -==-,5ˆ271232a=-⨯=-所以y 关于x 的线性回归方程为5ˆ32yx =-(3)当10x =时,ˆ22y=,|2223|2-<,当8x=时,ˆ17y=,|1716|2-<所以得到的线性回归方程是可靠的.【点评】本题考查回归直线方程的计算与应用,涉及古典概型的计算,是基础题,在计算线性回归方程时计算量较大,注意正确计算.19.随着人们经济收入的不断增长,个人购买家庭轿车已不再是一种时尚.车的使用费用,尤其是随着使用年限的增多,所支出的费用到底会增长多少,一直是购车一族非常关心的问题.某汽车销售公司作了一次抽样调查,并统计得出某款车的使用年限x 与所支出的总费用y(万元)有如下的数据资料:(1)在给出的坐标系中做出散点图;(2)求线性回归方程ˆˆˆybx a =+中的ˆa、ˆb ; (3)估计使用年限为10年时,车的使用总费用是多少?(最小二乘法求线性回归方程系数公式1221ˆni i i ni i x y n x yb x n x==-=-∑∑,ˆˆ)ay bx =-.【分析】(1)利用描点法作出散点图;(2)把数据代入公式,利用最小二乘法求回归方程的系数,可得回归直线方程; (3)把10x=代入回归方程得y 值,即为预报变量.【解答】解:(1)散点图如图,由图知y 与x 间有线性相关关系.(2)4x=,5y=,52190i i x ==∑,51112.3i i i x y ==∑,∴112.354512.3ˆ 1.239054210a-⨯⨯===-⨯;ˆˆ5 1.2340.08a y b x =-=-⨯=.(3)线性回归直线方程是ˆ 1.230.08y x =+,当10x=(年)时,ˆ 1.23100.0812.38y=⨯+=(万元),即估计使用10年时,支出总费用是12.38万元.【点评】本题考查了线性回归直线方程的求法及利用回归方程估计预报变量,解答此类问题的关键是利用公式求回归方程的系数,计算要细心.20.一台机器使用的时间较长,但还可以使用,它按不同的转速生产出来的某机械零件有一些会有缺点,每小时生产有缺点零件的多少,随机器的运转的速度而变化,下表为抽样试验的结果:(1)画散点图;(2)如果y 对x 有线性相关关系,求回归直线方程;(3)若实际生产中,允许每小时的产品中有缺点的零件最多为89个,那么机器的运转速度应控制在什么范围内?(参考数值:511380i i i x y ==∑,521145)i i x ==∑【分析】(1)根据表格数据,可得散点图;(2)先求出横标和纵标的平均数,代入求系数b 的公式,利用最小二乘法得到系数,再根据公式求出a 的值,写出线性回归方程,得到结果.(3)允许每小时的产品中有缺点的零件最多为89个,即线性回归方程的预报值不大于89,写出不等式,解关于x 的一次不等式,得到要求的机器允许的转数. 【解答】解:(1)散点图如图;(2)5x =,50y=,511380i i i x y ==∑,521145i i x ==∑∴13805550ˆ 6.5145555b-⨯⨯==-⨯⨯,ˆˆ17.5ay b x =-=∴回归直线方程为:ˆ 6.517.5yx =+;(3)由89y …得6.517.589x+…,解得11x …∴机器的运转速度应控制11转/秒内【点评】本题考查线性回归分析,考查线性回归方程,考查线性回归方程的应用,考查不等式的解法,是一个综合题目.。

数学建模——回归分析

数学建模——回归分析

回归分析——20121060025 吕佳琪企业编号生产性固定资产价值(万元)工业总产值(万元)131852429101019320063844098155415913650292873146058121015169102212191012251624合计65259801(1)说明二变量之间的相关方向;(2)建立直线回归方程;(3)计算估价标准误差;(4)估计生产性固定资产(自变量)为1100万元时总产值(因变量)的可能值。

解:(1)画出散点图,观察二变量的相关方向x=[318 910 200 409 415 502 314 1210 1022 1225];y=[524 1019 638 815 913 928 605 1516 1219 1624];plot(x,y,'or')xlabel('生产性固定资产价值(万元)')ylabel('工业总产值(万元)')由图形可得,二变量的相关方向应为直线(2)x=[318 910 200 409 415 502 314 1210 1022 1225];y=[524 1019 638 815 913 928 605 1516 1219 1624];X = [ones(size(x))', x'];[b,bint,r,rint,stats] = regress(y',X,0.05);b,bint,statsb =395.56700.8958bint =210.4845 580.64950.6500 1.1417stats =1.0e+004 *0.0001 0.0071 0.0000 1.6035上述相关系数r为1,显著性水平为0Y=395.5670+0.8958*x(3)计算方法:W=((Y1-y1)^2+……+(Y10-y10)^2)^(1/2)/10 利用SPSS进行回归分析:可以看出:标准估计误差为126.62795(万元)(4)有上述MATLAB编程可得y(总产值)-x(生产性固定资产)的关系为y1=210.4845 +0.6500*xy2=580.6495 +1.1417*xy=395.5670+0.8958*xx=1100;y=395.5670+0.8958*xy1=210.4845 +0.6500*xy2=580.6495 +1.1417*xy =1.3809e+003y1 =925.4845y2 =1.8365e+003所以在生产性固定资产(自变量)为1100万元时总产值(因变量)的可能值为925.4845-1836.5之间(1)确立适宜的回归模型;(2)计算有关指标,判断这三种经济现象之间的相关紧密程度。

数学建模竞赛统计回归分析相关练习题

数学建模竞赛统计回归分析相关练习题

1. 一个班有7名男性工人,他们的身高和体重列于下表
请把他们分成若干类并指出每一类的特征。

这里身高以米为单位,体重以千克为单位。

2. 有两种跳蚤共10只,分别测得它们四个指标值如表。

1)用距离判别法建立判别准则。

2)问(192, 287, 141, 198)和(197, 303, 170, 205)各属于哪一种?
求y 关于x 的线性回归方程,检验回归效果是否显著,并预测x=42℃时产量的估值
4.在研究化学动力学反应过程中,建立了一个反应速度和反应物 含量的数学模型,形式为
3
423125
3
211x x x x x y βββββ+++-
=
其中51,,ββ 是未知参数,321,,x x x 是三种反应物(氢,n 戊烷, 异构戊烷)的含量,y 是反应速度.今测得一组数据如表,试由 此确定参数51,,ββ
序号反应速度y 氢x1 n戊烷x2 异构戊烷x3
1 8.55 470 300 10
2 3.79 285 80 10
3 4.82 470 300 120
4 0.02 470 80 120
5 2.75 470 80 10
6 14.39 100 190 10
7 2.54 100 80 65
8 4.35 470 190 65
9 13.00 100 300 54
10 8.50 100 300 120
11 0.05 100 80 120
12 11.32 285 300 10
13 3.13 285 190 120 5.主成分与卡方检验已课件为主。

数学建模回归分析例题 ppt课件

数学建模回归分析例题 ppt课件
在社会经济现象中,变量与变量之间的关系是错 综复杂的 ,既可以是线性相关关系,又可以是非线性 相关关系。究竟如何来确定变量间是什么关系呢?最 直观的办法就是绘制变量与变量之间的散点图,由图 形进行判断并选择配合适当的预测模型 ,如:直线模 型、二次曲线模型、双曲线模型、S型曲线模型等等, 再利用模型作进一步的统计分析。SPSS 中的曲线配 合过程就实现了这一功能.下面就居民储蓄与居民收 入模型为例作介绍,由1997年《中国统计年鉴》可得 中国城镇居民家庭人均生活费收入(x)和城镇储蓄 (y)两个变量(1984年至1996年)数据如下:
Y 87.40 97.60 96.70 98.20 99.80
(上接) 103.20 104.00 100.00 100.30 102.00 95.40 92.40 94.50 98.80 105.80 100.20 100.50 99.90 105.20 106.20
103.20 99.50 108.20 104.00 101.10 105.60 100.00 104.80 109.80 100.30 96.40 108.70 102.00 91.20 100.60 95.40 93.10 81.00 92.40 98.80 68.60 94.50 102.90 70.90 98.80 98.80 81.40 105.80 95.10 102.30 100.20 98.50 105.00 100.50 86.50 110.50 99.90 104.00 92.50 105.20 105.80 89.30
资料:对某地区不同收入情况的家庭 作抽样调查,得到1999年已购买家庭小型 摄录机家庭户数的资料表10.4.29所示:
数学建模回归分析例题
组别
1 2 3 4 5 6 7

回归分析(数学建模)

回归分析(数学建模)
156.23 155.09 156.77 157.2 156.31 158.26
16 17 18 19 20 21
166.88 164.07 164.27 164.57 163.89 166.35
141.4 143.03 142.29 141.44 143.61 139.29
-144.34 -140.97 -142.15 -143.3 -140.25 -144.2
正规方程组
一元线性回归
整理得
n n n 0 xi 1 yi i 1 i 1 n n 2 xi 0 xi 1 i 1 i 1
( 2)
x
i 1
n
i
yi
一元线性回归
ˆ ˆ 0 y x 1 n x i y i n xy ˆ 1 i 1 n 2 2 xi n x i 1
(x
i 1 n
n
i
x )( y i y )
2
( 3)
( xi x )
i 1
1一元线性回归一元线性回归模型为其中x是自变量y是因变量为未知的待定常数称为回归系数是随机误差且假设其中相互独立且使其随机误差的平方和达到最小即一元线性回归正规方程组一元线性回归整理得一元线性回归其中参数的最小二乘估计一元线性回归xxxx的无偏估计量
线性回归分析
华北电力大学数理系 雍雪林
一、引言
2004年全国数模竞赛的B题 “电力市场的 输电阻塞管理” 第一个问题: 某电网有8台发电机组,6条主要线路,表 1和表2中的方案0给出了各机组的当前出力和 各线路上对应的有功潮流值,方案1~32给出了 围绕方案0的一些实验数据,试用这些数据确 定各线路上有功潮流关于各发电机组出力的近 似表达式。

数学建模-回归分析例题

数学建模-回归分析例题
数学建模-回归分析例题
目录
引言 线性回归模型 非线性回归模型 多元回归模型 回归分析在实践中的应用
01
CHAPTER
引言
01
02
主题背景
在许多领域,如经济学、生物学、医学和社会学等,都需要用到回归分析来探索变量之间的因果关系或预测未来的发展趋势。
回归分析是数学建模中常用的统计方法,用于研究变量之间的关系。
残差分析
R方值
AIC和BIC值
预测能力
多元回归模型的评估
01
02
03
04
分析残差与拟合值之间的关系,检验模型的假设条件。
计算模型的决定系数,评估模型对数据的拟合程度。
使用信息准则评估模型的复杂度和拟合优度。
使用模型进行预测,评估预测结果的准确性和可靠性。
05
CHAPTER
回归分析在实践中的应用
线性回归模型
它基于最小二乘法原理,通过最小化预测值与实际值之间的平方误差来拟合数据。
线性回归模型适用于因变量与自变量之间存在线性关系的情况,且自变量对因变量的影响是线性的。
线性回归模型是一种预测模型,通过找到最佳拟合直线来描述因变量和自变量之间的关系。
线性回归模型介绍
首先需要明确研究的问题和目标,并确定因变量和自变量。
结果解释
数据分析
THANKS
感谢您的观看。
非线性回归模型
非线性回归模型适用于因变量和自变量之间存在幂函数、对数函数、多项式函数等非线性关系的场景。
适用场景
非线性回归模非线性函数。
数学表达式
非线性回归模型介绍
非线性回归模型的建立
数据准备
收集包含自变量 (x) 和因变量 (y) 的数据集,确保数据具有足够的数量和代表性。

回归分析典型例题

回归分析典型例题

下图是我国2008年至2014年生活垃圾无害化处理量(单位:亿吨)的折线图.(1)由折线图看出,可用线性回归模型拟合y 与t 的关系,请用相关系数加以说明;(2)建立y 关于t 的回归方程(系数精确到0.01),预测2016年我国生活垃圾无害化处理量. 参考数据:646.27,55.0)(,17.40,32.97127171≈=-==∑∑∑===i ii ii i iy y yt y参考公式:相关系数:.)()())((11221∑∑∑===----=ni ni iini i iy yt ty y t tr回归方程中斜率和截距的最小二乘估计公式:.ˆˆ,)())((ˆ121t b y at ty y t tbni ini i i-=---=∑∑==某互联网公司为了确定下一季的前期广告投入计划,收集了近6个月广告投入量x (单位:万元)和收益y (单位:万元)的数据如下表:月份 1 2 3 4 5 6 广告投入量 2 4 6 8 10 12 收益14.2120.3131.831.1837.8344.67他们分别用两种模型① y =bx +a ,② y =a e bx 分别进行拟合,得到相应回归方程并进行残差分析,得到如图所示的残差图及一些统计量的值。

xy∑=61i ii yx∑=612i ix730 1464.24 364(1)根据残差图,比较模型①,②的拟合效果,应该选择哪个模型?并说明理由; (2)残差绝对值大于2的数据被认为是异常数据,需要剔除: (i )剔除异常数据后求出(1)中所选模型的回归方程; (ii )若广告投入量x =18时,该模型收益的预报值时多少?附:对于一组数据(x 1 , y 1),(x 2 , y 2), … ,(x n , y n ),其回归直线a x b yˆˆˆ+=的斜率和截距的最小二乘估计分别为:.ˆˆ,)())((ˆ1221121x b y a x n xyx n yx x xy y x xbni ini i i ni ini i i-=--=---=∑∑∑∑====某公司为确定下一年度投人某种产品的宣传费,需了解年宣传费x (单位:千元)对年销售量y (单位:t )和年利润z (单位:千元)的影响. 对近8年的年宣传费x i 和年销售量y i (i =1,2,..,8)数据作了初步处理,得到下面的散点图及一些统计量的值.xyw∑=-812)(i ix x∑=-812)(i iw w∑=--81))((i i iy y x x∑=--81))((i iiy yw w46.6 563 6.8289.8 1.61469108.8其中:i i x w =,.8181∑==i iw w(1)根据散点图判断,bx a y +=与x d c y +=哪一个适宜作为年销售量y 关于年宣传费x 的回归方程类型?(给出判断即可,不必说明理由)(2)根据(1)的判断结果及表中数据,建立y 关于x 的回归方程;(3) 已知这种产品的年利润z 与y x ,的关系为x y z -=2.0.根据(2)的结果回答下列问题: (i)年宣传费49=x 时,年销售量及年利润的预报值是多少? (ii)年宣传费x 为何值时,年利润的预报值最大?附:对于一组数据),(,,),(,),(2211n n v u v u v u ,其回归直线u v βα+=的斜率和截距的最小二乘估计分别为.ˆ,)())((ˆ121u v u uv v u uni ini i iβαβ-=---=∑∑==为了预测2018年双十一购物狂欢节成交额,建立了y 与时间变量t 的两个回归模型。

回归分析练习题及参考答案

回归分析练习题及参考答案

回归分析练习题及参考答案求:(1)⼈均GDP 作⾃变量,⼈均消费⽔平作因变量,绘制散点图,并说明⼆者之间的关系形态。

(2)计算两个变量之间的线性相关系数,说明两个变量之间的关系强度。

(3)求出估计的回归⽅程,并解释回归系数的实际意义。

(4)计算判定系数,并解释其意义。

(5)检验回归⽅程线性关系的显著性(0.05α=)。

(6)如果某地区的⼈均GDP 为5000元,预测其⼈均消费⽔平。

(7)求⼈均GDP 为5000元时,⼈均消费⽔平95%的置信区间和预测区间。

解:(1)可能存在线性关系。

(2)相关系数:(3)回归⽅程:734.6930.309y x=+回归系数的含义:⼈均GDP没增加1元,⼈均消费增加0.309元。

%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%% 注意:图标不要原封不动的完全复制软件中的图标,要按规范排版。

系数(a)模型⾮标准化系数标准化系数t 显著性B 标准误Beta1 (常量)734.693 139.540 5.265 0.003⼈均GDP(元)0.309 0.008 0.998 36.492 0.000 a. 因变量: ⼈均消费⽔平(元)%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%⼈均GDP对⼈均消费的影响达到99.6%。

%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%注意:图标不要原封不动的完全复制软件中的图标,要按规范排版。

模型摘要模型R R ⽅调整的R ⽅估计的标准差1 .998(a) 0.996 0.996 247.303a. 预测变量:(常量), ⼈均GDP(元)。

%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%(5)F 检验:回归系数的检验:t 检验注意:图标不要原封不动的完全复制软件中的图标,要按规范排版。

系数(a)模型⾮标准化系数标准化系数t 显著性B 标准误 Beta1(常量) 734.693 139.540 5.2650.003 ⼈均GDP (元)0.3090.0080.99836.4920.000a. 因变量: ⼈均消费⽔平(元)%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%(6)某地区的⼈均GDP 为5000元,预测其⼈均消费⽔平为 734.6930.30950002278.693y =+?=(元)。

数学建模实验回归分析 - 副本

数学建模实验回归分析 - 副本

回归分析1、有十个同类企业生产性固定资产年平均价值和工业总产值资料如下:1、说明两变量之间的相关方向;2、建立直线回归方程3、计算估计标准误差4、估计生产型固定资产(自变量)为1100万元是总产值(因变量)的可能值:解:1、自变量:生产型固定资产价值因变量:工业总产值2、(1)散点图x=[318 910 200 409 415 502 314 1210 1022 1225];>> y=[524 1019 638 815 913 928 605 1516 1219 1624];>> plot(x,y,'or')>> xlabel('生产型固定资产价值')>> ylabel('工业总产值')>>(2)方程x=[318 910 200 409 415 502 314 1210 1022 1225]; y=[524 1019 638 815 913 928 605 1516 1219 1624]; >> X=[ones(size(x))',x'];>> [b,bint,r,rint,stats]=regress(y',X);>> b,bint,statsb =395.56700.8958bint =210.4845 580.64950.6500 1.1417stats =1.0e+004 *0.0001 0.0071 0.0000 1.6035y=395.5670+0.8958 x有上面的结果看到R^2=1,F=71,显著性水平为0。

3、使用SPSS可以观察到:标准估计误差是186.78690万元4、又第二问中可以看到,bint的就是方程系数的置信区间,也就是可能取值。

所以:y1=210.4845+0.6500*x;y2=580.6495+1.1417*x;y=395.5670+0.8958*x;所以:x=1100y1=210.4845+0.6500*xy2=580.6495+1.1417*xy=395.5670+0.8958*xx =1100y1 =925.4845y2 =1.8365e+003y =1.3809e+003也就是说当X=1100万元时,Y的可能取值在925.4845到13809.9之间。

数学模型---回归分析案例题

数学模型---回归分析案例题

案例1.在一项对某社区家庭对某种消费品的消费需要调查中,得到下表所示的资料序号对某商品的消费支出Y 商品单价X1家庭月收入X2序号对某商品的消费支出Y商品单价X1家庭月收入X21 591.9 23.56 7620 6 644.4 34.14 129202 654.5 24.44 9120 7 680.0 35.30 143403 623.6 32.07 10670 8 724.0 38.70 159604 647.0 32.46 11160 9 757.1 39.63 180005 674.0 31.15 11900 10 706.8 46.68 19300对该社区家庭对商品的消费需求支出作二元线性回归分析(1)估计回归方程的参数,计算R2(2)对方程进行F检验,对参数进行t检验,并构造参数95%的置信区间(3)如果商品单价变为35元,则某一月收入20000元的家庭消费水平支出估计是多少?构造该估计值的95%的置信区间案例2.下表列出中国某年按行业分的全部制造国有企业及规模以上制造业非国有企业的工业总产值Y,资产合计K及职工人数L序号工业总产值Y/亿元资产合计K/亿元职工人数L/万人序号工业总产值Y/亿元资产合计K/亿元职工人数L/万人1 3722.70 3078.22 113 17 812.70 1118.81 432 1442.52 1684.43 67 18 1899.70 2052.16 613 1752.37 2742.77 84 19 3692.85 6113.11 2404 1451.29 1973.82 27 20 4732.90 9228.25 2225 5149.30 5917.01 327 21 2180.23 2866.65 806 2291.16 1758.77 120 22 2539.76 2545.63 967 1345.17 939.10 58 23 3046.95 4787.90 2228 656.77 694.94 31 24 2192.63 3255.29 1639 370.18 363.48 16 25 5364.83 8129.68 24410 1590.36 2511.99 66 26 4834.68 5260.20 14511 616.71 973.73 58 27 7549.58 7518.79 13812 617.94 516.01 28 28 867.91 984.52 4613 4429.19 3785.91 61 29 4611.39 18626.94 21814 5749.02 8688.03 254 30 170.30 610.91 1915 1781.37 2798.90 83 31 325.53 1523.19 4516 1243.07 1808.44 33设定模型为Y=AKαLβeμ利用上述资料,进行回归分析案例3.根据理论和经验分析,影响粮食生产(Y)的主要因素有:农业化肥施用量(X1)、粮食播种面积(X2)、成灾面积(X3)、农业机械总动力(X4)、农业劳动力(X5),其中,成灾面积的符号为负,其余均为正,下表给出中国粮食生产的相关数据,拟建立中国粮食生产函数。

数学建模-回归分析例题共22页文档

数学建模-回归分析例题共22页文档
数学建模-回归分析例题
51、没有哪个社会可以制订一部永远 适用的 宪法, 甚至一 条永远 适用的 法律。 ——杰 斐逊 52、法律源于人的自卫本能。——英 格索尔
53、人们通常会发现,法律就是这样 一种的 网,触 犯法律 中 等的才 会坠入 网中。 ——申 斯通 54、法律就是法律它是一座雄伟的大 夏,庇 护着我 们大家 ;它的 每一块 砖石都 垒在另 一块砖 石上。 ——高 尔斯华 绥 55、今天的法律未必明天仍是法律。 ——罗·伯顿
谢谢
11、越是没有本领的就越加自命不凡。——邓拓 12、越是无能的人,越喜欢挑剔别人的错儿。——爱尔兰 13、知人者智,自知者明。胜人者有力,自胜者强。——老子 14、意志坚强的人能把世界放在手中像泥块一样任意揉捏。——歌德 15、最具挑战性的挑战莫过于提升自我。——迈克尔·F·斯特利

数学建模——回归分析

数学建模——回归分析

回归分析——吕佳琪1、有10个同类企业的生产性固定资产年平均价值和工业总产值资料如下:企业编号生产性固定资产价值〔万元〕工业总产值〔万元〕131852429101019320063844098155415913650292873146058121015169102212191012251624合计65259801(1)说明二变量之间的相关方向;(2)建立直线回归方程;(3)计算估价标准误差;(4)估计生产性固定资产〔自变量〕为1100万元时总产值〔因变量〕的可能值。

解:〔1〕画出散点图,观察二变量的相关方向x=[318 910 200 409 415 502 314 1210 1022 1225];y=[524 1019 638 815 913 928 605 1516 1219 1624];plot(x,y,'or')xlabel('生产性固定资产价值〔万元〕')ylabel('工业总产值〔万元〕')由图形可得,二变量的相关方向应为直线〔2〕x=[318 910 200 409 415 502 314 1210 1022 1225];y=[524 1019 638 815 913 928 605 1516 1219 1624];X = [ones(size(x))', x'];[b,bint,r,rint,stats] = regress(y',X,0.05);b,bint,statsb =395.56700.8958bint =210.4845 580.64950.6500 1.1417stats =1.0e+004 *0.0001 0.0071 0.0000 1.6035上述相关系数r为1,显著性水平为0Y=395.5670+0.8958*x〔3〕计算方法:W=((Y1-y1)^2+……+(Y10-y10)^2)^(1/2)/10 利用SPSS进展回归分析:可以看出:标准估计误差为126.62795〔万元〕〔4〕有上述MATLAB编程可得y〔总产值〕-x〔生产性固定资产〕的关系为y1=210.4845 +0.6500*xy2=580.6495 +1.1417*xy=395.5670+0.8958*xx=1100;y=395.5670+0.8958*xy1=210.4845 +0.6500*xy2=580.6495 +1.1417*xy =1.3809e+003y1 =925.4845y2 =1.8365e+003所以在生产性固定资产〔自变量〕为1100万元时总产值〔因变量〕的可能值为925.4845-1836.5之间2、设某公司下属10个门市部有关资料如下:(1)确立适宜的回归模型;(2)计算有关指标,判断这三种经济现象之间的相关严密程度。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
相关文档
最新文档