非线性回归分析练习题
非线性回归方程经典题型-打印
非线性回归方程经典题型-打印非线性回归方程经典题型一、解答题(本大题共16小题,共192.0分)1.一只药用昆虫的产卵数y与一定范围内的温度x有关,现收集了该种药用昆虫的6经计算得:,,,,,线性回归模型的残差平方和,,其中,分别为观测数据中的温度和产卵数,,2,3,4,5,6.Ⅰ若用线性回归模型,求y关于x的回归方程精确到;Ⅱ若用非线性回归模型求得y关于x的回归方程为,且相关指数.试与Ⅰ中的回归模型相比,用说明哪种模型的拟合效果更好.用拟合效果好的模型预测温度为时该种药用昆虫的产卵数结果取整数.附:一组数据,,,,其回归直线的斜率和截距的最小二乘估计为,;相关指数.2.对某地区儿童的身高与体重的一组数据,我们用两种模型,拟合,得到回归方程分别为,,作Ⅱ根据残差比较模型,的拟合效果,决定选择哪个模型;Ⅲ残差大于1kg的样本点被认为是异常数据,应剔除,剔除后对Ⅱ所选择的模型重新建立回归方程.结果保留到小数点后两位附:对于一组数据,,,其回归直线的斜率和截距的最小二乘法估计分别为,.3.某厂生产不同规格的一种产品,根据检测标准,其合格产品的质量与尺寸之间近似满足关系式、c为大于0的常数按照某项指标测定,当产品质量与尺寸的比在区间内时为优等品现随机抽取6件合格产品,测得已知优等品的收益单位:千元与x,y的关系为,当优等品的质量与尺寸之比为时,求其收益的预报值精确到附:对于样本2,,,其回归直线的斜率和截距的最小二乘估计公式分别为:,,.4.某公司为评估两套促销活动方案方案1运作费用为5元件;方案2的运作费用为2元件,在某地区部分营销网点进行试点每个试点网点只采用一种促销活动方案,运作一年后,对比该地区上一年度的销售情况,制作相应的等高条形图如图所示.请根据等高条形图提供的信息,为该公司今年选择一套较为有利的促销活动方案不必说明理由;已知该公司产品的成本为10元件未包括促销活动运作费用,为制定本年度该地区的产品销售价格,统计上一年度的8组售价单位:元件,整数和销量单型进行拟合;附:相关指数5.二手车经销商小王对其所经营的A型号二手汽车的使用年数x与销售价格单位:万元辆进行整理,得到如下数据:下面是z关于x的折线图:由折线图可以看出,可以用线性回归模型拟合z与x的关系,请用相关数加以说明;求y关于x的回归方程并预测某辆A型号二手车当使用年数为9年时售价约为多少?、小数点后保留两位有效数字.基于成本的考虑,该型号二手车的售价不得低于7118元,请根据求出的回归方程预测在收购该型号二手车时车辆的使用年数不得超过多少年?参考公式:回归方程中斜率和截距的最小二乘估计公式分别为:,,.参考数据:,,,,,,,.6.为了调查历城区城乡居民人民生活水平,随机抽取了10个家庭,得到第2,,个家庭月收入单位:千元与月流动资金单位:千元的数据资料如下表:Ⅰ求方程;Ⅱ已知某家庭9月收入为9千元,该家庭计划用当月流动资金购置价格为499元的九阳豆浆机,问计划能否成功?附:对一组数据2,,,其回归直线的最小二乘法估计为,.7.近年来,随着汽车消费的普及,二手车流通行业得到迅猛发展某汽车交易市场对2017年成交的二手车的交易前的使用时间以下简称“使用时间”进行统计,得到如图1所示的频率分布直方图在图1对使用时间的分组中,将使用时间落入各组的频率视为概率.若在该交易市场随机选取3辆2017年成交的二手车,求恰有2辆使用年限在的概率;根据该汽车交易市场往年的数据,得到图2所示的散点图,其中单位:年表示二手车的使用时间,单位:万元表示相应的二手车的平均交易价格.由散点图判断,可采用作为该交易市场二手车平均交易价格y关于其使用年限x的回归方程,相关数据如下表表中,:试选用表中数据,求出关于的回归方程;该汽车交易市场拟定两个收取佣金的方案供选择.甲:对每辆二手车统一收取成交价格的的佣金;乙:对使用8年以内含8年的二手车收取成交价格的的佣金,对使用时间8年以上不含8年的二手车收取成交价格的的佣金.假设采用何种收取佣金的方案不影响该交易市场的成交量,根据回归方程和图表1,并用各时间组的区间中点值代表该组的各个值判断该汽车交易市场应选择哪个方案能获得更多佣金.附注:对于一组数据,,,,其回归直线的斜率和截距的最小二乘估计分别为;参考数据:,,,,.。
非线性回归实例
非线性回归实例例3.5.1 建立中国城镇居民食品消费需求函数模型。
根据需求理论,居民对食品的消费需求函数大致为),,(01P P X f Q = (3.5.13)其中,Q 为居民对食品的需求量,X 为消费者的消费支出总额、1P 为食品价格指数,0P 为居民消费价格总指数。
引入居民消费价格总指数0P 的原因,主要在于研究居民其他消费对食品的替代性。
需求理论同时指出,上述需求函数应具有零阶齐次性,即当所有商品和消费者货币支出总额按同一比例变动时,需求量保持不变,这就是所谓的消费者无货币幻觉。
按照需求函数的这一特征,(3.5.13)式可写为 )/,/(010P P P X f Q = (3.5.14) (3.5.14)式表明,居民对食品的消费需求,取决于居民的实际消费总支出0/P X 以及食品的相对价格01/P P 。
显然,该式具有零阶齐次性。
为了进行比较,我们将同时估计(3.5.13)式与(3.5.14)式。
首先确定具体的函数形式。
根据恩格尔定律,随着居民消费支出的增加,居民对食品的消费支出也增加,但食品消费支出比例会逐渐下降。
因此,居民对食品的消费支出与居民的总支出间呈幂函数的变化关系。
同时,为了方便考察需求的价格弹性等相关问题,将(3.5.13)式具体写为32101βββP P AX Q = (3.5.15)经对数变换,(3.5.15)式可用如下双对数线性回归模型进行估计:μββββ++++=031210ln ln ln )ln(P P X Q (3.5.16) 式中,A ln 0=β。
同样地,(3.5.14)式可用如下线性回归模型进行估计: μβββ+++=)/ln()/ln()ln(012010P P P X Q (3.5.17)采用双对数线性回归模型,能够方便地考察需求函数中零阶齐次性的特征。
显然,对(3.5.16)式施加0321=++βββ的约束,即可化为(3.5.17)式。
因此,对(3.5.17)式进行回归,就意味着原需求函数满足零阶齐次性条件。
回归分析练习题(有标准答案)
回归分析练习题(有答案)作者:日期:1.1回归分析的基本思想及其初步应用一、选择题1.某同学由x 与y 之间的一组数据求得两个变量间的线性回归方程为均值为2,数据y 的平均值为3,则()A .回归直线必过点(2,3)C 点(2,3)在回归直线上方B.回归直线一定不过点(2,3)D 点(2,3)在回归直线下方y bx a ,已知:数据x 的平2.在一次试验中,测得(x, y)的四组值分别是A (1,2),B(2,3),C(3,4),D(4,5),则丫与X 之间的回归直线方程为()A.$x1B .$ x 2C$2x1D.$ x 13.在对两个变量x ,y 进行线性回归分析时,有下列步骤:①对所求出的回归直线方程作出解释;③求线性回归方程;④求未知参数;②收集数据(X j 、y i ),i 1,2,…,n ;⑤根据所搜集的数据绘制散点图)如果根据可行性要求能够作岀变量A.①②⑤③④Bx, y 具有线性相关结论,则在下列操作中正确的是(C.②④③①⑤D .②⑤④③①.③②④⑤①4.下列说法中正确的是()B人的知识与其年龄具有相关关系D 根据散点图求得的回归直线方程都是有意义的A.任何两个变量都具有相关关系C.散点图中的各点是分散的没有规律5.给出下列结论:2 2(1)在回归分析中,可用指数系数R 的值判断模型的拟合效果,R 越大,模型的拟合效果越好;(2)在回归分析中,可用残差平方和判断模型的拟合效果,残差平方和越大,模型的拟合效果越好;(3)在回归分析中,可用相关系数r 的值判断模型的拟合效果,较合适带状区域的宽度越窄,说明模型的拟合精度越高.A.y 平均增加1.5个单位B.A. 1B )个..2r 越小,模型的拟合效果越好;(4)在回归分析中,可用残差图判断模型的拟合效果,残差点比较均匀地落在水平的带状区域中,说明这样的模型比y 平均增加2个单位C.y 平均减少1.5个单位C.3DD.y 平均减少2个单位.4以上结论中,正确的有(6.已知直线回归方程为y7.2 1.5x ,则变量x 增加一个单位时()下面的各图中,散点图与相关系数r 不符合的是()\ 1V ||一1,— 1 < r<(>■r?■* ■■■■* ■..* .**打4X(7UV1)D.'8.一位母亲记录了儿子39岁的身高,由此建立的身高与年龄的回归直线方程为据此可以预测这个孩子10岁时的身高,则正确的叙述是(A.身高一定是145.83cm C.身高低于145.00cm BD)7.19x 73.93,.身高超过146.00cm身高在145.83cm左右9.(A)预报变量在x轴上,解释变量在y轴上(B)解释变量在x轴上,预报变量在y轴上(C)(D)在画两个变量的散点图时,下面哪个叙述是正确的()可以选择两个变量中任意一个变量在x轴上可以选择两个变量中任意一个变量在y轴上10.两个变量y与x的回归模型中,通常用R2来刻画回归的效果,则正确的叙述是(22)A.R越小,残差平方和小2B.R越大,残差平方和大2c.R于残差平方和无关D.R越小,残差平方和大211.两个变量y与x的回归模型中,分别选择了4个不同模型,它们的相关指数R2如下,其中拟合效果最好的模型是()A.模型1的相关指数R2为0.98 B.模型2的相关指数R2为0.802 2C.模型3的相关指数R为0.50 D.模型4的相关指数R为0.2512.回归直线上相应位置的差异的是A.总偏差平方和B.C.回归平方和13.回归直线方程为残差平方和D.相关指数R2在回归分析中,代表了数据点和它在()工人月工资(元)依劳动生产率(千元)变化的60 90x,下列判断正确的是()A.劳动生产率为1000元时,工资为50元B.劳动生产率提高1000元时,工资提高150元C.劳动生产率提高1000元时,工资提高90元D.劳动生产率为1000元时,工资为90元14.下列结论正确的是()①函数关系是一种确定性关系;②相关关系是一种非确定性关系;③回归分析是对具有函数关系的两个变量进行统计分析的一种方法;④回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法.A.①② E.①②③ C.①②④ D.①②③④15.已知回归直线的斜率的估计值为中心为(4,5),则回归直线方程为()1.23,样本点的A.$ 1.23x 4B.$ 1.23x 5C.$ 1.23x 0.08D.y 0.08x 1.2316.在比较两个模型的拟合效果时,甲、乙两个模型的相关指数果好的模型是 __________.17.在回归分析中残差的计算公式为 ____________.18.线性回归模型y bx a e(a和b为模型的未知参数)中,e称为_________________.19.若一组观测值(X1,yJ(X2,y2)…(Xn,y“)之间满足yi=bXi+a+e(i=1、2.…n)若恒为0,则氏为______________R2的值分别约为0.96和0.85,则拟合效20.调查某市出租车使用年限x 和该年支出维修费用y (万元),得到数据如下:使用年限x 维修费用y(求线性回归方程;n22.233.845.556. 567.0(2)由(1)中结论预测第10年所支出的维修费用.i 1(X i x) (y iy).n(X ii 1x)2bx21.以下是某地搜集到的新房屋的销售价格闵屋面积Ey 和房屋的面积x 的数据:11524.Q1102 1. CIB-413G29.21口丘22t 肖年愉梧(1)画岀数据对应的散点图;(2)求线性回归方程,并在散点图中加上回归直线;(3)据(2)的结果估计当房屋面积为150m2时的销售价格(4)求第2个点的残差。
计量经济学题库第4章非线性回归模型的线性化
第4章 非线性回归模型的线性化习 题一、问答题1.不可线性化的非线性回归模型的线性化估计方法。
2.解释下列模型中参数的含义:(1);(2);(3)二、计算题某商场1990年~1998年间皮鞋销售额(万元)的统计资料如下表所示。
某商场1990年~1998年间皮鞋销售额统计资料年份 1990 1991 1992 1993 1994 1995 1996 1997 1998 时间t 1 2 3 4 5 6 7 8 9 销售额Y4.15.37.29.612.917.123.229.537.4考虑对数增长模型,试用上表的数据进行回归分析,并预测1999该商场皮鞋的销售额。
习题答案一、问答题1.答:(1)直接搜索法(Direct Search Method );(2)直接优化法(DirectOptimization Method );(3)迭代线性化法(Iterative Linearzation Method )。
2.答:(1)是Y 对X 的弹性,即X 变化1%,Y 变化%. (2)表示X 变化1个单位,Y 变化100*%.(3)表示X 变化1%,Y 增加或减少/100.二、计算题1β01ln ln t t t Y X u ββ=++01ln t t t Y X u ββ=++01ln t t t Y X u ββ=++ln Y t u αβ=++1β1β1β1β1β1β解:回归分析的结果如下:1999年该商场的销售额:2 3.2913.74ln (0.65)(4.30)0.7254,18.4913,0.5524y tR F DW =-+-===1999 3.2913.74*ln(10) 3.2913.74*2.302628.35y =-+=-+=。
非线性回归方程经典题型-打印
非线性回归方程经典题型一、解答题(本大题共16小题,共192.0分)1. 一只药用昆虫的产卵数y 与一定范围内的温度x 有关,现收集了该种药用昆虫的6经计算得:x =16∑x i 6i=1=26,y =16∑y i 6i=1=33,∑(6i=1x i −x)(y i −y)=557,∑(6i=1x i −x)2=84,∑(6i=1y i −y)2=3930,线性回归模型的残差平方和∑(6i=1y i−y ^i )2=236.64,e8.0605≈3167,其中x i ,y i 分别为观测数据中的温度和产卵数,i =1,2,3,4,5,6.(Ⅰ)若用线性回归模型,求y 关于x 的回归方程y =bx +a(精确到0.1); (Ⅱ)若用非线性回归模型求得y 关于x 的回归方程为y ^=0.06e 0.2303x ,且相关指数R 2=0.9522.(i)试与(Ⅰ)中的回归模型相比,用R 2说明哪种模型的拟合效果更好.(ii)用拟合效果好的模型预测温度为35∘C 时该种药用昆虫的产卵数(结果取整数). 附:一组数据(x 1,y 1),(x 2,y 2),…,(x n ,y n ),其回归直线y ^=b ^x +a ^的斜率和截距的最小二乘估计为b ^=ni=1i −x)(y i −y)∑(n x −x)2,a ^=y −b ^x ;相关指数R 2=1−n i=1i ^i 2∑(n y −y)2.2. 对某地区儿童的身高与体重的一组数据,我们用两种模型①y =bx +a ,②y =ce dx 拟合,得到回归方程分别为y ^(1)=0.24x −8.81,y ^(2)=1.70e 0.022x ,作残差分析,如表:(Ⅱ)根据残差比较模型①,②的拟合效果,决定选择哪个模型;(Ⅲ)残差大于1kg 的样本点被认为是异常数据,应剔除,剔除后对(Ⅱ)所选择的模型重新建立回归方程.(结果保留到小数点后两位)附:对于一组数据(x 1,y 1),(x 2,y 2),…(x n ,y n ),其回归直线y =bx +a 的斜率和截距的最小二乘法估计分别为b ^=∑(n i=1x i −x)(y i −y)∑(n i=1x i −x)2,a ^=y .−b ^x ..3. 某厂生产不同规格的一种产品,根据检测标准,其合格产品的质量y(g)与尺寸x(mm)之间近似满足关系式y =c ⋅x b (b 、c 为大于0的常数).按照某项指标测定,当产品质量与尺寸的比在区间(e 9,e7)内时为优等品.现随机抽取6件合格产品,测得数据如下: 尺寸x(mm) 38 48 58 68 78 88 质量y(g) 16.8 18.8 20.7 22.4 24 25.5 质量与尺寸的比yx0.4420.3920.3570.3290.3080.290(1)现从抽取的6件合格产品中再任选2件,求恰有一件优等品的概率;(2)根据测得数据作出如下处理:令v i =lnx i ,u i =lny i ,得相关统计量的值如下表:∑v i 6i=1u i∑v i 6i=1∑u i 6i=1∑v i 26i=175.3 24.6 18.3 101.4 (ⅰ)根据所给统计量,求y 关于x 的回归方程;(ⅰ)已知优等品的收益z(单位:千元)与x ,y 的关系为z =2y −0.32x ,当优等品的质量与尺寸之比为e8时,求其收益的预报值.(精确到0.1)附:对于样本(v i ,u i )(i =1,2,…,n),其回归直线u =b ⋅v +a 的斜率和截距的最小二乘估计公式分别为:b ^=∑(n i=1v i −v)∑(n i=1v i −u)2=∑v i n i=1u i −nvu∑v i 2n i=1−nv2,a ^=u −b ^v ,e ≈2.7182.4. 某公司为评估两套促销活动方案(方案1运作费用为5元/件;方案2的运作费用为2元/件),在某地区部分营销网点进行试点(每个试点网点只采用一种促销活动方案),运作一年后,对比该地区上一年度的销售情况,制作相应的等高条形图如图所示.(1)请根据等高条形图提供的信息,为该公司今年选择一套较为有利的促销活动方案(不必说明理由);(2)已知该公司产品的成本为10元/件(未包括促销活动运作费用),为制定本年度该地区的产品销售价格,统计上一年度的8组售价x i (单位:元/件,整数)和销量y i (单位:件)(i =1,2,…,8)如下表所示:售价x 3335 37 39 41 43 45 47 销量y 840800 740 695 640 580 525 460 ①请根据下列数据计算相应的相关指数R 2,并根据计算结果,选择合适的回归模型进行拟合;②根据所选回归模型,分析售价x 定为多少时?利润z 可以达到最大.y ^=−1200lnx +5000 y ^=−27x +1700 y ^=−13x 2+1200∑(8i=1y i −y ^i )249428.74 11512.43 175.26∑(8i=1y i −y .)2 124650(附:相关指数 R 2=1−∑(n i=1y i −y ^i )2∑(n i=1y i−y)2)5. 二手车经销商小王对其所经营的A 型号二手汽车的使用年数x 与销售价格y(单位:万元/辆)进行整理,得到如下数据:使用年数x2 3 4 5 6 7 售价y 20 12 8 6.4 4.4 3 z =lny3.002.482.081.861.481.10下面是z 关于x 的折线图:(1)由折线图可以看出,可以用线性回归模型拟合z 与x 的关系,请用相关数加以说明;(2)求y 关于x 的回归方程并预测某辆A 型号二手车当使用年数为9年时售价约为多少?(b^、a ^小数点后保留两位有效数字). (3)基于成本的考虑,该型号二手车的售价不得低于7118元,请根据(2)求出的回归方程预测在收购该型号二手车时车辆的使用年数不得超过多少年?参考公式:回归方程y ^=b ^x +a^中斜率和截距的最小二乘估计公式分别为: b ^=∑(n i=1x i −x)(y i −y)∑(n i=1x i −x)2=∑x i n i=1y i −nxy ∑x i2ni=1−nx 2,a ^=y .−b ^x .,r =∑(n i=1x i −x)(y i −y)√∑(n i=1x i −x)2∑(n i=1y i −y)2.参考数据:∑x i 6i=1y i =187.4,∑x i 6i=1z i =47.64,∑x i 26i=1=139,√∑(6i=1x i −x .)2=4.18,√∑(6i=1y i −y .)2=13.96,√∑(6i=1z i −z .)2=1.53,ln1.46≈0.38,ln0.7118≈−0.34.6. 为了调查历城区城乡居民人民生活水平,随机抽取了10个家庭,得到第i(i =1,2,…,10)个家庭月收入x i (单位:千元)与月流动资金y i (单位:千元)的数据资料如下表:∑x i 10i=1∑y i 10i=1∑ωi 10i=1∑x i 10i=1y i∑ωi 10i=1y ii i (Ⅰ)求方程y =d +c √x ;(Ⅱ)已知某家庭9月收入为9千元,该家庭计划用当月流动资金购置价格为499元的九阳豆浆机,问计划能否成功?附:对一组数据(x i ,y i )(i =1,2,…,10),其回归直线y =b ^x +a ^的最小二乘法估计为b =∑x i n i=1y i −nxy∑x i 2n i=1−n(x)2,a =y .−bx ..7. 近年来,随着汽车消费的普及,二手车流通行业得到迅猛发展.某汽车交易市场对2017年成交的二手车的交易前的使用时间(以下简称“使用时间”)进行统计,得到如图1所示的频率分布直方图.在图1对使用时间的分组中,将使用时间落入各组的频率视为概率.(1)若在该交易市场随机选取3辆2017年成交的二手车,求恰有2辆使用年限在(8,16]的概率;(2)根据该汽车交易市场往年的数据,得到图2所示的散点图,其中x(单位:年)表示二手车的使用时间,y(单位:万元)表示相应的二手车的平均交易价格. ①由散点图判断,可采用y =e a+bx 作为该交易市场二手车平均交易价格y 关于其使用年限x 的回归方程,相关数据如下表(表中Y i =lny i ,Y =110∑Yi 10i=1):试选用表中数据,求出关于的回归方程;②该汽车交易市场拟定两个收取佣金的方案供选择. 甲:对每辆二手车统一收取成交价格的5%的佣金;乙:对使用8年以内(含8年)的二手车收取成交价格的4%的佣金,对使用时间8年以上(不含8年)的二手车收取成交价格的10%的佣金.假设采用何种收取佣金的方案不影响该交易市场的成交量,根据回归方程和图表1,并用各时间组的区间中点值代表该组的各个值.判断该汽车交易市场应选择哪个方案能获得更多佣金. 附注:①对于一组数据(u 1,v 1),(u 2,v 2),…,(u n ,v n ),其回归直线v =α+βu 的斜率和截距的最小二乘估计分别为β^=∑u i n i=1v i −nuv∑u i 2n i=1−nu2,α^=v −β^u ;②参考数据:e 2.95≈19.1,e 1.75≈5.75,e 0.55≈1.73,e −0.65≈0.52,e −1.85≈0.16.8. 近期,济南公交公司分别推出支付宝和微信扫码支付乘车活动,活动设置了一段时间的推广期,由于推广期内优惠力度较大,吸引越来越多的人开始使用扫码支付.某线路公交车队统计了活动刚推出一周内每一天使用扫码支付的人次,用x 表示活动推出的天数,y 表示每天使用扫码支付的人次(单位:十人次),统计数据如表1所示: 1根据以上数据,绘制了散点图.(1)根据散点图判断,在推广期内,y =a +bx 与c ⋅d x (c,d 均为大于零的常数)哪一个适宜作为扫码支付的人次y 关于活动推出天数x 的回归方程类型?(给出判断即可,不必说明理由); (2)根据(1)的判断结果及表1中的数据,建立y 关于x 的回归方程,并预测活动推出第8天使用扫码支付的人次;(3)推广期结束后,车队对乘客的支付方式进行统计,结果如下 表2:车队为缓解周边居民出行压力,以万元的单价购进了一批新车,根据以往的经验可知,每辆车每个月的运营成本约为0.66万元.已知该线路公交车票价为2元,使用现金支付的乘客无优惠,使用乘车卡支付的乘客享受8折优惠,扫码支付的乘客随机优惠,根据统计结果得知,使用扫码支付的乘客中有16的概率享受7折优惠,有13的概率享受8折优惠,有12的概率享受9折优惠.预计该车队每辆车每个月有1万人次乘车,根据给数据以事件发生的频率作为相应事件发生的概率,在不考虑其它因素的条件下,按照上述收费标准,假设这批车需要n(n ∈N n )年才能开始盈利,求n 的值. 参考数据:其中其中υi =lgy i ,υ=17∑υi 7i=1参考公式:对于一组数据(u i ,υi ),(u 2,υ2),…,(u n ,υn ),其回归直线υ̂=a ̂+β̂u 的斜率和截距的最小二乘估计公式分别为:β̂=∑u i ni=1υi −nuυ∑u i 2n i=1−nu2,a ̂=υ−β̂u . 9. 某厂生产不同规格的一种产品,根据检测标准,其合格产品的质量y(g)与尺寸x(mm)之间近似满足关系式y =c ⋅x b (b 、c 为大于0的常数).按照某项指标测定,当产品质量与尺寸的比在区间(e 9,e7)内时为优等品.现随机抽取6件合格产品,测得数据如下: 尺寸x(mm) 38 48 58 68 78 88 质量y(g)16.818.8 20.7 22.4 24 25.5 质量与尺寸的比yx 0.4420.3920.3570.3290.3080.290(1)现从抽取的6件合格产品中再任选3件,记ξ为取到优等品的件数,试求随机变量ξ的分布列和期望;(2)根据测得数据作了初步处理,得相关统计量的值如下表:∑(6i=1lnx i ⋅lny i )∑(6i=1lnx i )∑(6i=1lny i )∑(6i=1lnx i )275.3 24.6 18.3 101.4(i)根据所给统计量,求y 关于x 的回归方程;(ii)已知优等品的收益z(单位:千元)与x ,y 的关系为z =2y −0.32x ,则当优等品的尺寸x 为何值时,收益z 的预报值最大?附:对于样本(v i ,u i )(i =1,2,…,n),其回归直线u =b ⋅v +a 的斜率和截距的最小二乘估计公式分别为:b ^=∑(n i=1v i −v)(u i −u)∑(n i=1v i −v)2=∑v i n i=1u i −nvu∑v i 2n i=1−nv2,a ^=u −b ^v ,e ≈2.7182.10. 经统计,2015年,某公路在部分界桩附近发生的交通事故次数如下表:把界桩公里数记为,公里数记为,,数据绘成的散点图如图所示,以x 为解释变量、交通事故数y 为预报变量,建立了两个不同的回归方程y (1)=29.9+50.2×1x 和y (2)=33.9+125.9e −x 表述x ,y 二者之间的关系. (Ⅰ)计算R 2的值,判断这两个回归方程中哪个拟合效果更好?并解释更好的这个拟合所对R 2的意义;(Ⅱ)若保险公司在每次交通事故中理赔60万元的概率为0.01,理赔2万元的概率为0.19,理赔0.2万元的概率为0.8,利用你得到的拟合效果更好的这一个回归方程,试预报这一年在界桩1040公里附近处发生的交通事故的理赔费(理赔费精确到0.1万元).附:对回归直线y =α̂+β̂x ,有R 2=1−∑(n i=1y i −y ^i )2∑(n i=1y i −y)2.一些量的计算值:表中:y ̂i (1)=29.9+50.2×1x i ,y ^i (2)=33.9+125.9e −x i ,140=0.025,e −40≈0.11. x(2)某同学认为,y =px 2+qx +r 更适宜作为y 关于x 的回归方程类型,他求得的回归方程是y =−0.30x 2+10.17x +68.07.经调查,该地11岁男童身高的中位数为145.3cm.与(1)中的线性回归方程比较,哪个回归方程的拟合效果更好?附:回归方程y ^=a ^+b ^x 中的斜率和截距的最小二乘估计公式分别为:b ^=n i=1i −x)(y i −y)∑(n x −x)2,a ^=y −b ^x .12. 某互联网公司为了确定下一季度的前期广告投入计划,收集了近期前期广告投入量x(单位:万元)和收益y(单位:万元)的数据.对这些数据作了初步处理,得到了下面的散点图(共21个数据点)及一些统计量的值.为了进一步了解广告投入量x 对收益y 的影响,公司三位员工①②③对历史数据进行分析,查阅大量资料,分别提出了三个回归方程模型:表中u i =lnx i ,v i =√x i ,参考数据:√2=1.41,√10=3.16. 表一x y∑(21i=1x i −x)2∑(21i=1x i −x)(y i−y) ∑(21i=1y i −y)240 62770 250200表二μ̂ ∑(21i=1μi −μ)2∑(21i=1μi−μ)(y i −y)v∑(21i=1(v i −v)2∑(21i=1v i−v)(y i −y)3.600.499.806.35.0030.00(1)根据散点图判断,哪一位员工提出的模型不适合用来描述x 与y 之间的关系?简要说明理由.(2)根据据(1)的判断结果及表中数据,在余下两个模型中分别建立收益y 关于投入量x 的关系,并从数据相关性的角度考虑,在余下两位员工提出的回归模型中,哪一个是最优模型(即更适宜作为收益y 关于投入量x 的回归方程)?说明理由: 附:对于一组数据(x 1,y 1),(x 2,y 2),……,(x n ,y n ),其中回归直线y ^=b ^x +a ^的斜率,截距的最小二乘估计以及相关系数分别为:b ̂=∑(ni=1x i −x)(y i −y)∑(n i=1x i−x)2,a ̂=y −b ̂x,r =∑(n i=1x i −x)(y i −y)√∑(n i=1x i −x)2∑(n i=1y i −y)2,其中r 越接近于是,说明变量x 与y 的线性相关程度越好.13. 在冬季,由于受到低温和霜冻的影响,蔬菜的价格会随着需求量的增加而上升,已知某供应商向饭店定期供应某种蔬菜,日供应量x 与单价y 之间的关系,统计数据如表所示:日供应量x(kg) 38 48 58 68 78 88 单价y(元/kg)16.818.820.722.42425.5(Ⅰ)根据上表中的数据得出日供应量x 与单价y 之间的回归方程为y =ax b ,求a ,b 的值;(Ⅱ)该地区有14个饭店,其中10个饭店每日对蔬菜的需求量在60kg 以下(不含60kg),4个饭店对蔬菜的需求量在60kg 以上(含60kg),则从这14个饭店中任取4个进行调查,记这4个饭店中对蔬菜需求量在60kg 以下的饭店数量为X ,求X 的分布列及数学期望. 参考公式及数据:对一组数据(x 1,y 1),(x 2,y 2),…,(x n ,y n ),其回归直线y ^=b ^x +a ^的斜率和截距的最小二乘估计分别为:b ̂=∑x i ni=1y i −nxy ∑x i 2n i=1nx2,a ^=y −b ^x ∑(6i=1lnx i ⋅lny i )∑(6i=1lnx i )∑(6i=1lny i )∑(6i=1lnx i )273.524.6 18.3 101.414. 某地级市共有200000中小学生,其中有7%学生在2017年享受了“国家精准扶贫”政策,在享受“国家精准扶贫”政策的学生中困难程度分为三个等次:一般困难、很困难、特别困难,且人数之比为5:3:2,为进一步帮助这些学生,当地市政府设立“专项教育基金”,对这三个等次的困难学生每年每人分别补助1000元、1500元、2000元.经济学家调查发现,当地人均可支配年收入较上一年每增加n%,一般困难的学生中有3n%会脱贫,脱贫后将不再享受“精准扶贫”政策,很困难的学生中有2n%转为一般困难,特别困难的学生中有n%转为很困难.现统计了该地级市2013年到2017年共5年的人均可支配年收入,对数据初步处理后得到了如图所示的散点图和表中统计量的值,其中年份x 取13时代表2013年,x 与y(万元)近似满足关系式y =C 1⋅2C 2x ,其中C 1,C 2为常数.(2013年至2019年该市中学生人数大致保持不变)y k ∑(5i=1k i −k)2∑(5i=1y i −y)2∑(5i=1x i −x)(y i −y)∑(5i=1x i −x)(k i −k) 2.31.23.14.621其中k i =log 2y i ,k =15∑k i 5i=1(Ⅰ)估计该市2018年人均可支配年收入;(Ⅱ)求该市2018年的“专项教育基金”的财政预算大约为多少?附:①对于一组具有线性相关关系的数据(u 1,v 1),(u 2,v 2)…,(u n ,v n ),其回归直线方程v ∧=βu ∧+α的斜率和截距的最小二乘估计分别为β∧=∑(n i=1u i −u)(vv i −v)∑(n i=1u i −u)2,α∧=v −β∧u②2−0.7 2−0.3 20.1 21.7 21.8 21.9 0.60.81.13.23.53.7315. 参加数学选修课的同学,对某公司的一种产品销量与价格进行了统计,得到如下数据和散点图:定价x(元/kg) 10 20 30 40 50 60 年销量y(kg)1150 643 424 262 165 86 z =2lny14.112.912.111.110.28.9下列数据计算时可供参考:∑(6i=1x i −x)(y i −y)=−34580∑(6i=1x i −x)(z i −z)=−175.5e 6=403.43∑(6i=1y i −y)2=776840∑(6i=1y i −y)(z i −z)=3465.2e 5=148.41(Ⅰ)根据散点图判断出y 与x 和z 与x 分别是正相关还是负相关,再比较判断y 与x 和z 与x 哪一对具有较强的线性相关性?(给出判断即可,不必说明理由)(Ⅱ)根据(Ⅰ)的判断结果及相关数据,选择合理模型建立y 关于x 的回归方程.(方程中的系数均保留两位有效数字).(Ⅲ)根据由(Ⅱ)得到的回归方程,计算当定价x =30时的残差.附:对于一组数据(x 1,y 1),(x 2,y 2),…,(x n ,y n ),其回归直线的斜率和截距的最小二乘估计分别为:b ∧=n i=1i −x)⋅(y i −y)∑(n x −x)2a ∧=y −b ∧x16. 为落实“精准扶贫”战略,某县决定利用扶贫资金帮扶具有地方特色的传统手工业发展.扶贫项目组利用数据分析技术,模拟扶贫项目的未来预期,模拟结果显示,项目投资x(万元)和产品利润y(万元)关系如表所示:分析发现用模型y =bx 利润的关系.设t i =x i 2(i =1,2,3,4,5),t =15∑t i 5i=1,对数据初步处理得到下面一些统计量的值:y =b x +a(回归系数四舍五入,小数点后保留两位数字); (II)该扶贫项目用于支付工人劳动所得资金总额用公式w =y −1.2x 计算(其中x 为项目投资,y 为产品利润,单位:万元),并以(I)中所求回归方程预报产品利润,当工人劳动所得资金总额不少于120万元时,则认为该项目可以完成“脱贫”任务.假设政府投入该项目的扶贫资金(单位:万元)可以是区间[45,80]内的任意整数值,求可以完成“脱贫”任务的概率.附:对于具有线性相关的一组数据(x i ,y i )(i =1,2,…n),其回归方程为y ^=b ^x +a^. 其中:b ^=n i=1i −x)(y i −y)∑(n x −x)2x =1n ∑x i,n i=1y =1n ∑y in i=1.答案和解析【答案】1. 解:(Ⅰ)依题意,n =6,b ^=6i=1i −x)(y i −y)∑(6x −x)2=55784≈6.6, a ≈33−6.6×26=−138.6 ∴y 关于x 的线性回归方程为y =6.6x −138.6(Ⅱ) ( i )利用所给数据,∑(6i=1y i −y ^i )2=236.64,∑(6i=1y i −y)2=3930得, 线性回归方程y =6.6x −138.6 的相关指数R 2=1−6i=1i ^i 2∑(6y −y)2=1−236.643930≈1−0.0602=0.9398.∵0.9398<0.9522,因此,回归方程y ^=0.06e 0.2303x 比线性回归方程y ^=6.6x −138.6拟合效果更好; (ii)由( i )得温度x =35∘C 时,y ̂=0.06e 0.2303×35=0.06×e 8.0605 又∵e 8.0605≈3167, ∴y ^≈0.06×3167≈190(个)所以当温度x =35∘C 时,该种药用昆虫的产卵数估计为190个.2. 解:(Ⅰ)根据残差分析,把x =80代入y ^(1)=0.24x −8.81得y ^(1)=10.39.10−10.39=−0.39.所以表中空格内的值为−0.39.(Ⅱ)模型①残差的绝对值和为0.41+0.01+0.39+1.21+0.19+0.41=2.62,模型②残差的绝对值和为0.36+0.07+0.12+1.69+0.34+1.12=3.7.2.62<3.7, 所以模型①的拟合效果比较好,选择模型①.(Ⅲ)残差大于1kg 的样本点被剔除后,剩余的数据如表由公式:b ^=∑(n i=1x i −x)(y i −y)∑(n i=1x i −x)2,a ^=y .−b ^x ..得回归方程为y =0.24x −8.76.3. 解:由已知,优等品的质量与尺寸的比在区间(e 9,e7)内,即yx ∈(0.302 , 0.388)则随机抽取的6件合格产品中,有3件为优等品A 1,A 2,A 3,3件为非优等品B 1,B 2,B 3 现从任选2件,共有(A 1,A 2)、(A 1,A 3)、(A 1,B 1)、(A 1,B 2)、 (A 1,B 3)、(A 2,A 3)、(A 2,B 1)、(A 2,B 2)、(A 2,B 3)、 (A 3,B 1)、(A 3,B 2)、(A 3,B 3)、(B 1,B 2)、(B 1,B 3)、(B 2,B 3)15种方法 设任选2件恰有一件优等品为事件C ,则事件C 包含(A 1,B 1)、(A 1,B 2)、 (A 1,B 3)、(A 2,B 1)、(A 2,B 2)、(A 2,B 3)、(A 3,B 1)、 (A 3,B 2)、(A 3,B 3)共9种方法由古典概型有P(C)=915=35,故所求概率为35(2)解:对y =c ⋅x b (b,c >0)两边取自然对数得lny =lnc +blnx 由v i =lnx i ,u i =lny i ,得u =b ⋅v +a ,且a =lnc (ⅰ)根据所给统计量及最小二乘估计公式有b ^=75.3−24.6×18.3÷6101.4−24.62÷6=0.270.54=12a ^=u −b ^v =(18.3−12×24.6)÷6=1,得a ^=lnc ^=1,故c ^=e所求y 关于x 的回归方程为y =e ⋅x 12(ⅰ)由(ⅰ)可知,y ^=e ⋅x 12,则z ^=2e √x −0.32x当y^x=ex 12x=√x=e8,即√x =8, x =64时 得收益的预报值z ^=16e −0.32×64≈23.0(千元).4. 解:(1)由等高条形图可知,年度平均销售额与方案1的运作相关性强于方案2.(2)①由已知数据可知,回归模型y ^=−1200lnx +5000对应的相关指数R 12=0.6035;回归模型y ^=−27x +1700对应的相关指数R 22=0.9076; 回归模型y ^=−13x 2+1200对应的相关指数R 32=0.9986.因为R 32>R 22>R 12,所以采用回归模型y ^=−13x 2+1200进行拟合最为合适. ②由(1)可知,采用方案1的运作效果较方案2好, 故年利润z =(−13x 2+1200)(x −15),,当x ∈(0,40)时,z =(−13x 2+1200)(x −15)单调递增; 当x ∈(40,+∞)时,z =(−13x 2+1200)(x −15)单调递减, 故当售价x =40时,利润达到最大.5. 解:(1)由题意,计算x .=16×(2+3+4+5+6+7)=4.5,z .=16×(3+2.48+2.08+1.86+1.48+1.10)=2,且∑x i 6i=1z i =47.64,√∑(6i=1x i −x .)2=4.18, √∑(6i=1z i −z .)2=1.53,∴r =∑n i=1i i √∑(n i=1x i −x)2∑(n i=1y i−y)2=47.64−6×4.5×24.18×1.53=−6.366.3954(或−6.366.40) ≈−0.99;∴z 与x 的相关系数大约为0.99,说明z 与x 的线性相关程度很高; (2)利用最小二乘估计公式计算b ̂=∑x i ni=1y i −nxy ∑x i2n i=1−nx 2=47.64−6×4.5×2139−6×4.52=−6.3617.5≈−0.36, ∴â=z .−b ̂x .=2+0.36×4.5=3.62, ∴z 与x 的线性回归方程是z ∧=−0.36x +3.62, 又z =lny ,∴y 关于x 的回归方程是y ∧=e −0.36x+3.62; 令x =9,解得y ∧=e −0.36×9+3.62≈1.46,即预测某辆A 型号二手车当使用年数为9年时售价约1.46万元; (3)当y ∧≥0.7118时,e −0.36x+3.62≥0.7118=e ln0.7118=e −0.34, ∴−0.36x +3.62≥−0.34, 解得x ≤11,因此预测在收购该型号二手车时车辆的使用年数不得超过11年. 6. 解:(Ⅰ)由y 与x 满足函数模型y =d +c √x ,则y =d +cω, ω.=∑ωi 10i=110=8,y .=∑y i 10i=110=2,则c =∑ωi 10i=1y i −10×ωy∑ωi 210i=1−10×ω2=184−10×8×2720−10×82=0.3,则d =y .−cω.=2−0.3×8=0.4,∴y =−0.4+0.3√x ;(Ⅱ)由(Ⅰ)可知:当x =9时,则y =−0.4+0.3×3=0.5,∴当某家庭9月收入为9千元,该家庭计划用当月流动资金500元,大于499元, ∴当月收入为9千元时,当月流动资金能成功购置价格为499元的九阳豆浆机. 7. 解:(1)由频率分布直方图知,该汽车交易市场2017年成交的二手车使用时间在(8,12]的频率为0.07×4=0.28,使用时间在(12,16]的频率为0.03×4=0.12.所以在该汽车交易市场2017年成交的二手车随机选取1辆,其使用时间在(8,16]的概 率为0.28+0.12=0.4,…(2分)所以所求的概率为P =C 320.42⋅(1−0.4)=0.288;…(3分)(2)①由y =e a+bx 得lny =a +bx ,则Y 关于x 的线性回归方程为Y =a +bx ,…(4分)由于b ̂=10i=1i −x)(Y i −Y)∑(10x −x)2=∑x i 10i=1Y i −10x⋅Y ∑x i 210i=1−10x2=79.75−10×5.5×1.9385−10×5.52=−0.3, â=Y −β̂⋅x =1.9−(−0.3)×5.5=3.55, 则Y 关于x 的线性回归方程为Y^=3.55−0.3x ,……………………………(6分) 所以y 关于x 的回归方程为y ^=e 3.55−0.3x ;………………………(7分)②根据频率分布直方图和①中的回归方程,对成交的二手汽车可预测: 使用时间在(0,4]的频率为0.05×4=0.2,对应的成交价格的预测值为e 3.55−0.3×2=e 2.95≈19.1; 使用时间在(4,8]的频率为0.09×4=0.36,对应的成交价格预测值为e 3.55−0.3×6=e 1.75≈5.75; 使用时间在(8,12]的频率为0.07×4=0.28,对应的成交价格的预测值为e 3.55−0.3×10=e 0.55≈1.73; 使用时间在(12,16]的频率为0.03×4=0.12,对应的成交价格的预测值为e 3.55−0.3×14=e −0.65≈0.52; 使用时间在(16,20]的频率为0.01×4=0.04,对应的成交价格的预测值为e 3.55−0.3×18=e −1.85≈0.16;……………………(9分) 若采用甲方案,预计该汽车交易市场对于成交的每辆车可获得的平均佣金为(0.2×19.1+0.36×5.75+0.28×1.73+0.12×0.52+0.04×0.16)×5% =0.32166≈0.32万元;若采用乙方案,预计该汽车交易市场对于成交的每辆车可获得的平均佣金为(0.2×19.1+0.36×5.75)×4%+(0.28×1.73+0.12×0.52+0.04×0.16)×10% =0.29092≈0.29(万元);……………………(11分)因为0.32>0.29,所以采用甲方案能获得更多佣金. ……………(12分)8. 解:(1)根据散点图判断,y =c ⋅d x 适宜作为扫码支付的人数y 关于活动推出天数x 的回归方程类型;(2)∵y =c ⋅d x ,两边同时取常用对数得:1gy =1g(c ⋅d x )=1gc +1gd ⋅x ;设1gy =v ,∴v =1gc +1gd ⋅x ,∵x =4,v =1.55,∑X i 27i=1=140,∴lgd =∑7i=1x i v i −7xv∑x i 27i=1−7x2=50.12−7×4×1.54140−7×42=728=0.25,把样本中心点(4,1.54)代入v =1gc +1gd ⋅x ,得:lgd =0.54,∴v̂=0.54+0.25x ,∴1gy =0.54+0.25x , ∴y 关于x 的回归方程式:y ̂=100.54+0.25x =100.54(100.54)x =3.47(100.54)x ;把x =8代入上式:∴ŷ=100.54+0.25×8=102.54=102×100.54=347; 活动推出第8天使用扫码支付的人次为3470; (3)记一名乘客乘车支付的费用为Z ,则Z 的取值可能为:2,1.8,1.6,1.4;P(Z =2)=0.1;P(Z =1.8)=0.3×12=0.15;P(Z =1.6)=0.6+0.3×13=0.7;P(Z =1.4)=0.3×16=0.05所以,一名乘客一次乘车的平均费用为:2×0.1+1.8×0.15+1.6×0.7+1.4×0.05=1.66(元)由题意可知:1.66×1×12⋅n −0.66×12⋅n −80>0,n >203,所以,n 取7;估计这批车大概需要7年才能开始盈利.9. 解:(1)由已知,优等品的质量与尺寸的比在区间(e 9,e 7)内.即yx ∈(0.302,0.388).则随机抽取的6件合格产品中,有3件为优等品,3件为非优等品.现从抽取的6件合格产品再任选3件,则取到优等品的件数ξ=0,1,2,3. P(ξ=0)=C 30C 33C 63=120,P(ξ=1)=C 31C 32C 63=920,P(ξ=2)=C 32C 31C 63=920,P(ξ=3)=C 33C 30C 63=120.E(ξ)=0×120+1×920+2×920+3×120=32. (2)解:对y =c ⋅x b (b,c >0)两边取自然对数得lny =lnc +blnx .令v i =lnx i ,u i =lny i .得u =b ⋅v +a.且a =1nc . (i)根据所给统计量及最小二乘估计公式有:b ̂=∑v i ni=1u i −nvu ∑v i 2n i=1−nv2=75.3−24.6×18.3÷6101.4−24.62÷6=0.270.54=12, a ^=u −b ^v =(18.3−12×24.6)÷6=1,得a ^=ln c ^=1,c ^=e ,所求y 关于x 的回归方程为y =e ⋅x 12. (ii)由(i)可知y =e ⋅x 12,则z ^=2e √x −0.32x . 由优等品质量与尺寸的比ŷx=ex 12x=√x ∈(e 9,e7)⇒√x ∈(7,9),即x ∈(49,81). 当t =√x =e0.32≈8.5∈(7,9)时,z ^取最大值.即优等品的尺寸x ≈72.3(mm),收益z ^的预报值最大.10. 解:(Ⅰ)y (1)=29.9+50.2×1x 拟合时,R 12=1−0.8751821≈0.9995; y (2)=33.9+125.9e −x 拟合时,R 22=1−48.41821≈0.9734 ∵0.9995>0.9734,∴y (1)=29.9+50.2×1x 比y (2)=33.9+125.9e −x 拟合效果更好,R 12=1−0.8751821≈0.9995,表明界桩公里数解释了99.95%的交通事故发生次数的变化;(Ⅱ)界桩1040公里取x =40,由y (1)=29.9+50.2×140≈31.16,每次交通事故的理赔费=60×0.01+2×0.19+0.2×0.8=1,14万元,∴预报这一年在界桩1040公里附近处发生的交通事故的理赔费为31.16×1.14≈35.5万元.11. 解:(1)由题意,x =5.5,y =112.45,b ^=n i=1i −x)(y i −y)∑(n x −x)2=566.8582.50≈6.87, a ^=y −b ^x =112.45−6.87×5.5≈74.67; ∴y 关于x 的线性回归方程y =6.87x +74.67;(2)某同学认为,y =px 2+qx +r 更适宜作为y 关于x 的回归方程类型,他求得的回归方程是y =−0.30x 2+10.17x +68.07.当x =11时,代入回归方程是y =−0.30x 2+10.17x +68.07.可得y =142.74; 当x =11时,代入回归方程是y =6.87x +74.67;可得y =150.24; 由11岁男童身高的中位数为145.3cm .可得回归方程是y =6.87x +74.67计算的误差比较大.故回归方程是y =−0.30x 2+10.17x +68.07模拟合效果更好. 12. 解:(1)根据散点图判断,员工①提出的模型不适合, 因为散点图中x 与y 之间不是线性关系;(2)令v =√x ,先建立y 关于v 的线性回归方程, 由于d ∧=21i=1i −v)(y i −y)∑(21v −v)2=30.005.00=6,∴c ∧=y −d ∧v =62−6×6.3=24.2; ∴y 关于v 的线性回归方程为y ∧=24.2+6v , 因此模型②为y 2∧=24.2+6√x ;同理,令u =lnx ,建立y 关于u 的线性回归方程; f ∧=21i=1i −u)(y i −y)∑(21u −u)2=9.800.49=20,e ∧=y −f ∧u =62−20×3.60=−10, ∴y 关于u 的线性回归方程为y ∧=−10+20u , 因此模型③为y 3∧=−10+20lnx ; (i)模型②中,相关系数为 r 2=21i=1i −v)(y i −y)√∑(i=1v i −v)∑(i=1y i −y)=√5×200=310√10≈0.3×3.16=0.948; 模型③中,相关系数为 r 3=21i=1i −u)(y i −y)√∑(i=1u i −u)2∑(i=1y i −y)2=√0.49×200=710√2≈0.7×1.41=0.987; 可得1>r 3>r 2,说明变量u 与y 的线性相关程度更好, 即模型③为y 3∧=−10+20lnx 更为准确,模型③为最优模型.13. 解:(I)对y =ax b 两边同取对数得lny =blnx +lna ,令v =lnx ,u =lny ,得u =bv +lna∴b =∑v i 6i=1u i −6vu∑v i 26i=1−6v2=75.3−4.1×18.3101.4−6×4.12=12,∴lna =18.36−12×24.66=1,即a =e .(II)由题意知,X 的所有可能取值为0,1,2,3,4.P(X =0)=C 44C 144=11001,P(X =1)=C 43C 101C 144=401001,P(X =0)=C 42C 102C 144=2701001,P(X =1)=C 41C 103C 144=4801001,P(X =1)=C 104C 144=2101001.∴X 的分布列为∴E(X)=1×401001+2×2701001+3×4801001+4×2101001=207.14. 解:(Ⅰ)因为x =15(13+14+15+16+17)=15所以:∑(5i=1x i −x)2=(−2)2+(−1)2+12+22=10;关系式y =C 1⋅2C 2,其中k i =log 2y i 得:k =log 2C 1⋅2C 2x , ∴k =log 2C 1+C 2x ,所以C 2=5i=1i −x)(k i −k)∑(5x −x)2=110∴log 2C 1=k −C 2x =1.2−110×15=−0.3所以C 1=2−0.3=0.8 所以y =0.8×2x10当x =18时,2018年人均可支配年收入y =0.8×21.8=2.8(万)(Ⅱ)由题意知2017年时该市享受“国家精准扶贫”政策的学生共200000×7%=14000人一般困难、很困难、特别困难的中学生依次有7000人、4200人、2800人 2018年人均可支配收入比2017年增长0.8×21.8−0.8×21.70.8×21.7=20.1−1=0.1=10%所以2018年该市特别困难的中学生有2800×(1−10%)=2520人, 很困难的学生有4200×(1−20%)+2800×10%=3640人 一般困难的学生有7000×(1−30%)+4200×20%=5740人所以2018年的“专项教育基金”的财政预算大约为5740×1000+3640×1500+2520×2000=1624万.15. 解:(Ⅰ)根据散点图(1)知y 与x 是负相关, 根据散点图(2)知z 与x 是负相关;散点图(2)中各点都集中在一条直线附近, 即z 与x 具有较强的线性相关性;(Ⅱ)由x =16×(10+20+30+40+50+60)=35, z =16×(14.1+12.9+12.1+11.1+10.2+8.9)=11.55, ∴b ∧=6i=1i −x)(z i −z)∑(6x −x)2=−175.51750≈−0.10,由a ∧=z −b ∧x =11.55−(−0.10)×35=15.05≈15,∴z 关于x 的回归方程是z ∧=15−0.10x , 则y 关于x 的回归方程为y ∧=e z 2=e 12(15−0.10x), 即y ∧=e 12(15−0.10x);(Ⅲ)x =30时,y ∧=e 12×(15−0.10×30)=e 6=403.43,当定价x =30时的残差为|403.34−424|≈11. 16. 解:(I)由题意,t =2700,y =192,∑(5i=1t i −t)2=10140000,∑(5i=1t i −t)(y i −y)=586000; ∴b ∧=5i=1i −t)(y i −y)∑(5i=1t −t)2=58600010140000≈0.06;∴a ∧=y −b ∧t =192−0.06×2700=30, 又t =x 2,∴回归方程为y ∧=0.06x 2+30;(II)由w =y −1.2x ,y =0.06x 2+30,∴w =0.06x 2−1.2x +30, 令w ≥120,得0.06x 2−1.2x +30≥120, 解得x ≤−30或x ≥50, ∴取x ≥50;又政府投入该项目的扶贫资金是区间[45,80]内的任意整数值,满足题意的x ≥50; ∴所求的概率为P =80−50+180−45+1=3136.【解析】1. 本题考查了线性回归方程的应用问题,也考查了相关指数的应用问题,是难题. (Ⅰ)求出n 的值,计算相关系数,求出回归方程即可;(Ⅱ)(i)根据相关指数的大小,即可比较模型拟合效果的优劣;(ii)代入求值计算即可. 2. (Ⅰ)根据残差分析,把x =80代入y^(1)=0.24x −8.81得y ^(1)=10.39.10−10.39=−0.39,即可求表中空格内的值;(Ⅱ)求出残差的绝对值和,即可得出结论;(Ⅲ)确定残差大于1kg 的样本点被剔除后,剩余的数据,即可求出回归方程. 本题考查回归方程、残差分析,考查学生的计算能力,属于中档题.3. (1)由题意首先确定ξ的取值,然后求解相应的分布列和数学期望即可;(2)(i)结合题中所给的数据计算回归方程即可;(ii)结合计算求得的回归方程得到收益函数,讨论函数的最值即可求得最终结果.本题考查离散型随机变量的分布列,回归方程的计算及其应用等,重点考查学生对基础概念的理解和计算能力,属于中等题.4. (1)由等高条形图可知,年度平均销售额与方案1的运作相关性强于方案2. (2)①求出相关指数,比较可得结论;②由(1)可知,采用方案1的运作效果较方案2好,故年利润z =(−13x 2+1200)(x −15),利用导数的方法,可得结论.本题考查相关指数,考查等高条形图,考查导数知识的运用,属于中档题.5. (1)由题意计算x .、z .,求出相关系数r ,判断z 与x 的线性相关程度;(2)利用最小二乘估计公式计算b ^、a ^,写出z 与x 的线性回归方程, 求出y 关于x 的回归方程,计算x =9时y ∧的值即可;(3)利用线性回归方程求出y ∧≥0.7118时x 的取值范围,即可得出预测结果.本题考查了线性回归方程与线性相关系数的求法与应用问题,计算量大,计算时要细心. 6. (Ⅰ)求得样本中心点(ω.,y .),根据最小二乘法即可求得c 和d ,即可求得y =d +c √x ;(Ⅱ)当x =9时,代入即可求得y ,与0.499比较大小,即可判断答案.本题考查线性回归方程的应用,考查最小二乘法求线性回归方程,考查计算能力,属于中档题.7. (1)由频率分布直方图求得对应的频率,用频率估计概率即可计算所求的概率;(2)①由y =e a+bx 得lny =a +bx ,求出Y 关于x 的线性回归方程,再写出y 关于x 的回归方程;②根据频率分布直方图和①中的回归方程,对成交的二手汽车预测;再分别计算采用甲、乙两种方案,预计该汽车交易市场对于成交的每辆车可获得的平均佣金值.本题考查了频率分布直方图与线性回归方程的应用问题,是难题.8. (1)通过散点图,判断y =c ⋅d x 适宜作为扫码支付的人数y 关于活动推出天数x 的回归方程类型;(2)通过对数运算法则,利用回归直线方程相关系数,求出回归直线方程,然后求解第8天使用扫码支付的人次;(3)记一名乘客乘车支付的费用为Z ,则Z 的取值可能为:2,1.8,1.6,1.4;求出概率,计算期望,然后推出结果.本题考查了线性回归方程的求法及应用,数学期望的应用,考查计算能力,属于基础题.9. (1)由题意首先确定ξ的取值,然后求解相应的分布列和数学期望即可;(2)(i)结合题中所给的数据计算回归方程即可;(ii)结合计算求得的回归方程得到收益函数,讨论函数的最值即可求得最终结果.本题考查离散型随机变量的分布列,回归方程的计算及其应用等,重点考查学生对基础概念的理解和计算能力,属于中等题.10. (Ⅰ)计算R 2的值,即可得出结论;(Ⅱ)求出界桩1040公里取x =40,由y (1)=29.9+50.2×140≈31.16,每次交通事故的理赔费=60×0.01+2×0.19+0.2×0.8=1,14万元,即可得出结论. 本题考查回归方程,考查拟合效果,考查学生的计算能力,属于中档题.11. (1)由题意求出x ,y ,∑x i 210i=1,∑x i 10i=1y i ,代入公式求值,从而得到回归直线方程;(2)将x =11代入回归方程是y =−0.30x 2+10.17x +68.07和(1)问中的方程,得到的结果与145.3cm 比较,即可判断本题考查了线性回归方程的求法及应用,属于基础题.12. (1)根据散点图判断员工①提出的模型不适合,散点图中的点不是线性关系;(2)令v =√x ,建立y 关于v 的线性回归方程,得模型②的线性回归方程; 令u =lnx ,建立y 关于u 的线性回归方程,得模型③的线性回归方程;计算模型②中相关系数r 2,模型③相关系数r 3,比较即可得出结论.本题考查了线性回归方程的应用问题,也考查了相关系数的应用问题,是中档题. 13. (I)对y =ax b 两边同取对数得lny =blnx +lna ,令v =lnx ,u =lny ,得u =bv +lna ,利用计算公式即可得出.(II)由题意知,X 的所有可能取值为0,1,2,3,4.利用超几何分布列计算公式即可得出.。
专题02 非线性回归方程(原卷版)
专题2 非线性回归方程例1. 某景区的各景点从2009年取消门票实行免费开放后,旅游的人数不断地增加,不仅带动了该市淡季的旅游,而且优化了旅游产业的结构,促进了该市旅游向“观光、休闲、会展”三轮驱动的理想结构快速转变.下表是从2009年至2018年,该景点的旅游人数y (万人)与年份x 的数据:模型①:由最小二乘法公式求得y 与x 的线性回归方程5081697=+ˆ..yx ; 模型②:由散点图的样本点分布,可以认为样本点集中在曲线=bx y ae 的附近. (1)根据表中数据,求模型②的回归方程=ˆbx yae .(a 精确到个位,b 精确到001.). (2)根据下列表中的数据,比较两种模型的相关指数2R ,并选择拟合精度更高、更可靠的模型,预测2021年该景区的旅游人数(单位:万人,精确到个位).参考公式、参考数据及说明:①对于一组数据1(v ,1)w ,2(v ,2)w ,⋯,(n v ,)n w ,其回归直线αβ=+ˆˆˆwv 的斜率和截距的最小二乘法估计分别为121βαβ==--==--∑∑()()ˆˆ,()nii i nii ww v v w v vv . ②刻画回归效果的相关指数221211==-=--∑∑()()nii i n ii yy Ryy .③参考数据:546235≈.e ,14342≈..e .表中101110===∑,i i ii u lny u u.例2. 近年来,随着国家综合国力的提升和科技的进步,截至2018年底,中国铁路运营里程达13.2万千米,这个数字比1949年增长了5倍;高铁运营里程突破2.9万千米,占世界高铁运营里程的60%以上,居世界第一位.如表截取了20122016-年中国高铁密度的发展情况(单位:千米/万平方千米).已知高铁密度y 与年份代码x 之间满足关系式=(b y ax a ,b 为大于0的常数).若对=b y ax 两边取自然对数,得到=+lny blnx lna ,可以发现lny 与lnx 线性相关.(1)根据所给数据,求y 关于x 的回归方程ˆ(lna ,ˆb 保留到小数点后一位);(2)利用(1)的结论,预测到哪一年,高铁密度会超过30千米/万平方千米.参考公式:设具有线性相关系的两个变量x ,y 的一组数据为(i x ,1=)(i y i ,2,⋯⋯)n ,则回归方程ˆˆˆybx a =+的系数:121==--=-∑∑()()ˆ()nii i nii xx y y b xx ,=-ˆay bx . 参考数据:515092=-≈∑.ii i lnxlny lnx lny ,5221516=-≈∑()().ii lnx lnx ,515=≈∑ii lnx,5114=≈∑ii lny,274≈.,3034≈.ln .例3. 某公司生产一种产品,从流水线上随机抽取100件产品,统计其质量指数并绘制频率分布直方图(如图1):产品的质量指数在[50,70)的为三等品,在[70,90)的为二等品,在[90,110]的为一等品,该产品的三、二、一等品的销售利润分别为每件1.5,3.5,5.5(单位:元),以这100件产品的质量指数位于各区间的频率代替产品的质量指数位于该区间的概率. (1)求每件产品的平均销售利润;(2)该公司为了解年营销费用x (单位:万元)对年销售量y (单位:万件)的影响,对近5年的年营销费用i x 和年销售量i y (1,2,3,4,5)i =数据做了初步处理,得到的散点图(如图2)及一些统计量的值.表中ln i i u x =,ln i i v y =,5115i i u u ==∑,5115i i v v ==∑根据散点图判断,by a x =可以作为年销售量y (万件)关于年营销费用x (万元)的回归方程.(ⅰ)建立y 关于x 的回归方程;(ⅰ)用所求的回归方程估计该公司应投入多少营销费,才能使得该产品一年的收益达到最大?(收益=销售利润-营销费用,取 4.15964e =)参考公式:对于一组数据:11(,)u v ,22(,)u v ,,(,)n n u v ,其回归直线v u αβ=+的斜率和截距的最小乘估计分别为^121()()()nii i nii uu v v uu β==--=-∑∑,^v u αβ∧∧=-例4. 近年来,随着互联网技术的快速发展,共享经济覆盖的范围迅速扩张,继共享单车、共享汽车之后,共享房屋以“民宿”、“农家乐”等形式开始在很多平台上线.某创业者计划在某景区附近租赁一套农房发展成特色“农家乐”,为了确定未来发展方向,此创业者对该景区附近六家“农家乐”跟踪调查了100天.得到的统计数据如下表,x 为收费标准(单位:元/日),t 为入住天数(单位:),以频率作为各自的“入住率”,收费标准x 与“入住率”y 的散点图如图(1)若从以上六家“农家乐”中随机抽取两家深入调查,记ξ为“入住率”超过0.6的农家乐的个数,求ξ的概率分布列;(2)令ln z x =,由散点图判断ˆˆˆybx a =+与ˆˆy bz a =+哪个更合适于此模型(给出判断即可,不必说明理由)?并根据你的判断结果求回归方程.(ˆb结果保留一位小数)(3)若一年按365天计算,试估计收费标准为多少时,年销售额L 最大?(年销售额365L =⋅入住率⋅收费标准x )参考数据:1221ˆ,ni i i n i i x y nx y b x nx ==-⋅=-∑∑621,200,0.45,32500,ˆˆ0ii a y bx x y x ==-===∑ 615.1,12.7,i i i z y z =≈≈∑6231158.1,148.4ii ze =≈≈∑例5. 已知某种细菌的适宜生长温度为10C 25C ︒~︒,为了研究该种细菌的繁殖数量y (单位:个)随温度x (单位:C ︒)变化的规律,收集数据如下:对数据进行初步处理后,得到了一些统计量的值,如下表所示:其中ln i i k y =,7117i i k k ==∑.(1)请绘出y 关于x 的散点图,并根据散点图判断y bx a =+与21e c xy c =哪一个更适合作为该种细菌的繁殖数量y 关于x 的回归方程类型(结果精确到0.1);(2)当温度为25C ︒时,该种细菌的繁殖数量的预报值为多少?参考公式:对于一组数据()(),1,2,3,...,i i u v i n =,其回归线ˆˆˆvu βα=+的斜率和截距的最小二乘估计分别为:()121ˆ()()niii nii u u v v u u β==--=-∑∑,ˆˆav u β=-.参考数据: 5.5e 245≈.例6. 噪声污染已经成为影响人们身体健康和生活质量的严重问题,为了了解声音强度D (单位:分贝)与声音能量(单位:2/W cm )之间的关系,将测量得到的声音强度1D 和声音能量i I (i =1,2…,10)数据作了初步处理,得到如图散点图及一些统计量的值.表中lg i i W I =,101110i i W W ==∑。
非线性回归例题
例:下表给出了某地区1971—2000年的人口数据(表1)。
试用Matlab软件,对该地区的人口变化进行曲线拟合。
表1 某地区人口变化数据年份时间变量t=年份-1970人口y(人)1971 1 33 815 1972 2 33 981 1973 3 34 004 1974 4 34 165 1975 5 34 212 1976 6 34 327 1977 7 34 344 1978 8 34 458 1979 9 34 498 1980 10 34 476 1981 11 34 483 1982 12 34 488 1983 13 34 5131984 14 34 497 1985 15 34 511 1986 16 34 520 1987 17 34 507 1988 18 34 509 1989 19 34 521 1990 20 34 513 1991 21 34 515 1992 22 34 517 1993 23 34 519 1994 24 34 519 1995 25 34 521 1996 26 34 521 1997 27 34 523 1998 28 34 525 1999 29 34 525 2000 30 34 527根据上表中的数据,做出散点图,见图1。
337003380033900340003410034200343003440034500346001970197219741976197819801982198419861988199019921994199619982000年份人口从图1可以看出,人口随时间的变化呈非线性过程,而且存在一个与横坐标轴平行的渐近线,故可以用Logistic 曲线模型进行拟合。
因为Logistic 曲线模型的基本形式为:tbea y -+=1Matlab 程序如下: people_model.mx=[1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30]; y=[33815 33981 34004 34165 34212 34327 34344 34458 34498 34476 34483 34488 34513 34497 34511 34520 34507 34509 34521 34513 3451534517 34519 34519 34521 34521 34523 34525 34525 34527];b0=[0.0001 0.00001];[beta,r,j] = nlinfit(x,y,@people_fun,b0)people_fun.mfunction yy = people_fun(beta,x)yy = 1 ./ (beta(1) + beta(2) * exp(-x));运行结果: beta =1.0e-004 *0.2902 0.0184 回归函数为:tey -+=00000184.000002902.01在command 窗口输入:>> plot(x,people_fun(beta,x))注:本题也可以考虑转化为线性模型处理。
应用回归分析-第8章课后习题参考答案
第8章 非线性回归思考与练习参考答案8.1 在非线性回归线性化时,对因变量作变换应注意什么问题?答:在对非线性回归模型线性化时,对因变量作变换时不仅要注意回归函数的形式, 还要注意误差项的形式。
如:(1) 乘性误差项,模型形式为e y AK L αβε=, (2) 加性误差项,模型形式为y AK L αβε=+。
对乘法误差项模型(1)可通过两边取对数转化成线性模型,(2)不能线性化。
一般总是假定非线性模型误差项的形式就是能够使回归模型线性化的形式,为了方便通常省去误差项,仅考虑回归函数的形式。
8.2为了研究生产率与废料率之间的关系,记录了如表8.15所示的数据,请画出散点图,根据散点图的趋势拟合适当的回归模型。
表8.15生产率x (单位/周) 1000 2000 3000 3500 4000 4500 5000 废品率y (%)5.26.56.88.110.2 10.3 13.0解:先画出散点图如下图:5000.004000.003000.002000.001000.00x12.0010.008.006.00y从散点图大致可以判断出x 和y 之间呈抛物线或指数曲线,由此采用二次方程式和指数函数进行曲线回归。
(1)二次曲线 SPSS 输出结果如下:从上表可以得到回归方程为:72ˆ 5.8430.087 4.4710yx x -=-+⨯ 由x 的系数检验P 值大于0.05,得到x 的系数未通过显著性检验。
由x 2的系数检验P 值小于0.05,得到x 2的系数通过了显著性检验。
(2)指数曲线ANOVA.5731.57379.538.000.0365.007.6096RegressionResidualTotalSum ofSquares df Mean Square F Sig.The independent variable is x.Coe fficients.000.000.9708.918.0004.003.34811.514.000x(Constant)B Std. E rrorUnstandardizedCoefficientsBetaStandardizedCoefficientst Sig.The dependent variable is ln(y).从上表可以得到回归方程为:0.0002tˆ 4.003y e由参数检验P值≈0<0.05,得到回归方程的参数都非常显著。
非线性回归方程、相关性分析专题 高考数学
并求出线性回归方程.
(4)分析拟合效果:通过计算________或画________图来判断拟合效果.
(5)根据相应的变换,写出________方程.
试卷讲评课件
3.常见的变换
(1)已知函数y = ln bx + a ,左右两边同时取e的指数,得________,
选取函数y = m ⋅ x k m>0, k>0 作为年广告费用x和年利润额y的回归
类型.令u = lnx, v = lny,则v = lnm + ku,则对数据作出如下处理:
令ui = lnxi , vi = lnyi ,得到相关数据如表所示:
试卷讲评课件
10
10
10
10
i=1
i=1
i=1
i=1
令t =________,得________
(2)已知函数y = kx −1 + c,令t =________,得________
(3)已知函数y = ebx+a ,左右两边同时取e的对数,得________,令t =
________,得________
(4)已知函数y = aebx ,左右两边同时取e的对数,得________,令t =_
过0.6的农家乐的个数,求ξ的概率分布列;
+ a与ොy = bz
+ a哪个更合适于
模型(给出判断即可,不必说明理由)?并根据你的判断结果求回归方程;
(ොa,b的结果精确到0.1)
试卷讲评课件
(3)根据第(2)问所求的回归方程,试估计收费标准为多少时,100天销
有效的控制.其中,各大药物企业积极投身到新药的研发中.汕头某药企
回归分析练习题及参考答案
回归分析练习题及参考答案求:(1)⼈均GDP 作⾃变量,⼈均消费⽔平作因变量,绘制散点图,并说明⼆者之间的关系形态。
(2)计算两个变量之间的线性相关系数,说明两个变量之间的关系强度。
(3)求出估计的回归⽅程,并解释回归系数的实际意义。
(4)计算判定系数,并解释其意义。
(5)检验回归⽅程线性关系的显著性(0.05α=)。
(6)如果某地区的⼈均GDP 为5000元,预测其⼈均消费⽔平。
(7)求⼈均GDP 为5000元时,⼈均消费⽔平95%的置信区间和预测区间。
解:(1)可能存在线性关系。
(2)相关系数:(3)回归⽅程:734.6930.309y x=+回归系数的含义:⼈均GDP没增加1元,⼈均消费增加0.309元。
%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%% 注意:图标不要原封不动的完全复制软件中的图标,要按规范排版。
系数(a)模型⾮标准化系数标准化系数t 显著性B 标准误Beta1 (常量)734.693 139.540 5.265 0.003⼈均GDP(元)0.309 0.008 0.998 36.492 0.000 a. 因变量: ⼈均消费⽔平(元)%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%⼈均GDP对⼈均消费的影响达到99.6%。
%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%注意:图标不要原封不动的完全复制软件中的图标,要按规范排版。
模型摘要模型R R ⽅调整的R ⽅估计的标准差1 .998(a) 0.996 0.996 247.303a. 预测变量:(常量), ⼈均GDP(元)。
%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%(5)F 检验:回归系数的检验:t 检验注意:图标不要原封不动的完全复制软件中的图标,要按规范排版。
系数(a)模型⾮标准化系数标准化系数t 显著性B 标准误 Beta1(常量) 734.693 139.540 5.2650.003 ⼈均GDP (元)0.3090.0080.99836.4920.000a. 因变量: ⼈均消费⽔平(元)%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%(6)某地区的⼈均GDP 为5000元,预测其⼈均消费⽔平为 734.6930.30950002278.693y =+?=(元)。
专题五 培优点16 非线性回归问题(解析版)
培优点16 非线性回归问题【方法总结】通过变量间的相关关系对两个变量进行统计分析是数学的重要应用.其中非线性回归问题具有十分重要的现实意义.【典例】 二手车经销商小王对其所经营的A 型号二手汽车的使用年数x 与销售价格y(单位:万元/辆)进行整理,得到如下数据:使用年数x 2 3 4 5 6 7 售价y 20 12 8 6.4 4.4 3 z =ln y3.002.482.081.861.481.10下面是z 关于x 的折线图:(1)由折线图可以看出,可以用线性回归模型拟合z 与x 的关系,请用相关系数加以说明;(2)求y 关于x 的回归方程,并预测当某辆A 型号二手车使用年数为9年时售价约为多少;(b ^,a ^小数点后保留两位有效数字)(3)基于成本的考虑,该型号二手车的售价不得低于7 118元,请根据(2)求出的回归方程预测在收购该型号二手车时车辆的使用年数不得超过多少年. 【解析】解 (1)由题意,知x =16×(2+3+4+5+6+7)=4.5,z =16×(3+2.48+2.08+1.86+1.48+1.10)=2,又i z i =47.64,=4.18, =1.53,∴r =47.64-6×4.5×24.18×1.53=- 6.366.395 4≈-0.99,∴z 与x 的相关系数大约为-0.99,说明z 与x 的线性相关程度很高.(2)b ^=47.64-6×4.5×2139-6×4.52=-6.3617.5≈-0.36, ∴a ^=z -b ^x =2+0.36×4.5=3.62,∴z 与x 的线性回归方程是z ^=-0.36x +3.62, 又z =ln y ,∴y 关于x 的回归方程是y ^=e-0.36x +3.62.令x =9,得y ^=e-0.36×9+3.62=e0.38,∵ln 1.46≈0.38,∴y ^≈1.46.即预测当某辆A 型号二手车使用年数为9年时售价约为1.46万元.(3)当y ^≥0.711 8, 即e-0.36x +3.62≥0.711 8=eln 0.711 8≈e-0.34时,则有-0.36x +3.62≥-0.34,解得x ≤11,因此,预测在收购该型号二手车时车辆的使用年数不得超过11年. 【方法总结】 非线性回归方程的求法 (1)根据原始数据作出散点图. (2)根据散点图,选择恰当的拟合函数.(3)作恰当变换,将其转化成线性函数,求线性回归方程. (4)在(3)的基础上通过相应变换,即可得非线性回归方程. 【拓展训练】某公司为确定下一年度投入某种产品的宣传费,需了解年宣传费x(单位:千元)对年销售量y(单位:t)和年利润z(单位:千元)的影响,于是对近8年的年宣传费x i 和年销售量y i (i =1,2,…,8)的数据进行了初步处理,得到如图所示的散点图及一些统计量的值.xyw(x i -x )2(w i -w )2(x i -x )·(y i -y )(w i -w )· (y i -y ) 46.6 563 6.8 289.8 1.6 1 469108.8注:表中w i =x i ,w =18i .(1)根据散点图判断,y ^=a ^+b ^x 与y ^=c ^+d ^x 哪一个适宜作为年销售量y 关于年宣传费x 的回归方程模型?(给出判断即可,不必说明理由)(2)根据(1)的判断结果及表中数据,建立y 关于x 的回归方程;(3)已知这种产品的年利润z 与x ,y 之间的关系为z ^=0.2y -x ,根据(2)的结果回答下列问题. ①当年宣传费x =49时,年销售量及年利润的预报值是多少? ②年宣传费x 为何值时,年利润的预报值最大?【解析】解 (1)由散点图可以判断,y ^=c ^+d ^x 适宜作为年销售量y 关于年宣传费x 的回归方程模型.(2)令w =x ,先建立y 关于w 的线性回归方程. 由于d ^=108.81.6=68,c ^=y -d ^w =563-68×6.8=100.6,所以y 关于w 的线性回归方程为y ^=100.6+68w ,因此y 关于x 的回归方程为y ^=100.6+68x. (3)①由(2)知,当x =49时,年销售量y 的预报值为y ^=100.6+6849=576.6,年利润z 的预报值为z ^=576.6×0.2-49=66.32.②根据(2)的结果知,年利润z 的预报值z ^=0.2×(100.6+68x)-x =-x +13.6x +20.12,所以当x =13.62=6.8,即x =46.24时,z ^取得最大值.故年宣传费为46.24千元时,年利润的预报值最大.。
非线性回归方程经典题型-打印
非线性回归方程经典题型一、解答题(本大题共16小题,共192.0分)1. 一只药用昆虫的产卵数y 与一定范围内的温度x 有关,现收集了该种药用昆虫的6经计算得:x =16∑x i 6i=1=26,y =16∑y i 6i=1=33,∑(6i=1x i −x)(y i −y)=557,∑(6i=1x i −x)2=84,∑(6i=1y i −y)2=3930,线性回归模型的残差平方和∑(6i=1y i−y ^i )2=236.64,e8.0605≈3167,其中x i ,y i 分别为观测数据中的温度和产卵数,i =1,2,3,4,5,6.(Ⅰ)若用线性回归模型,求y 关于x 的回归方程y =bx +a(精确到0.1); (Ⅱ)若用非线性回归模型求得y 关于x 的回归方程为y ^=0.06e 0.2303x ,且相关指数R 2=0.9522.(i)试与(Ⅰ)中的回归模型相比,用R 2说明哪种模型的拟合效果更好.(ii)用拟合效果好的模型预测温度为35∘C 时该种药用昆虫的产卵数(结果取整数). 附:一组数据(x 1,y 1),(x 2,y 2),…,(x n ,y n ),其回归直线y ^=b ^x +a ^的斜率和截距的最小二乘估计为b ^=ni=1i −x)(y i −y)∑(n x −x)2,a ^=y −b ^x ;相关指数R 2=1−n i=1i ^i 2∑(n y −y)2.2. 对某地区儿童的身高与体重的一组数据,我们用两种模型①y =bx +a ,②y =ce dx 拟合,得到回归方程分别为y ^(1)=0.24x −8.81,y ^(2)=1.70e 0.022x ,作残差分析,如表:(Ⅱ)根据残差比较模型①,②的拟合效果,决定选择哪个模型;(Ⅲ)残差大于1kg 的样本点被认为是异常数据,应剔除,剔除后对(Ⅱ)所选择的模型重新建立回归方程.(结果保留到小数点后两位)附:对于一组数据(x 1,y 1),(x 2,y 2),…(x n ,y n ),其回归直线y =bx +a 的斜率和截距的最小二乘法估计分别为b ^=∑(n i=1x i −x)(y i −y)∑(n i=1x i −x)2,a ^=y .−b ^x ..3. 某厂生产不同规格的一种产品,根据检测标准,其合格产品的质量y(g)与尺寸x(mm)之间近似满足关系式y =c ⋅x b (b 、c 为大于0的常数).按照某项指标测定,当产品质量与尺寸的比在区间(e 9,e7)内时为优等品.现随机抽取6件合格产品,测得数据如下: 尺寸x(mm) 38 48 58 68 78 88 质量y(g) 16.8 18.8 20.7 22.4 24 25.5 质量与尺寸的比yx0.4420.3920.3570.3290.3080.290(1)现从抽取的6件合格产品中再任选2件,求恰有一件优等品的概率;(2)根据测得数据作出如下处理:令v i =lnx i ,u i =lny i ,得相关统计量的值如下表:∑v i 6i=1u i∑v i 6i=1∑u i 6i=1∑v i 26i=175.3 24.6 18.3 101.4 (ⅰ)根据所给统计量,求y 关于x 的回归方程;(ⅰ)已知优等品的收益z(单位:千元)与x ,y 的关系为z =2y −0.32x ,当优等品的质量与尺寸之比为e8时,求其收益的预报值.(精确到0.1)附:对于样本(v i ,u i )(i =1,2,…,n),其回归直线u =b ⋅v +a 的斜率和截距的最小二乘估计公式分别为:b ^=∑(n i=1v i −v)∑(n i=1v i −u)2=∑v i n i=1u i −nvu∑v i 2n i=1−nv2,a ^=u −b ^v ,e ≈2.7182.4. 某公司为评估两套促销活动方案(方案1运作费用为5元/件;方案2的运作费用为2元/件),在某地区部分营销网点进行试点(每个试点网点只采用一种促销活动方案),运作一年后,对比该地区上一年度的销售情况,制作相应的等高条形图如图所示.(1)请根据等高条形图提供的信息,为该公司今年选择一套较为有利的促销活动方案(不必说明理由);(2)已知该公司产品的成本为10元/件(未包括促销活动运作费用),为制定本年度该地区的产品销售价格,统计上一年度的8组售价x i (单位:元/件,整数)和销量y i (单位:件)(i =1,2,…,8)如下表所示:售价x 3335 37 39 41 43 45 47 销量y 840800 740 695 640 580 525 460 ①请根据下列数据计算相应的相关指数R 2,并根据计算结果,选择合适的回归模型进行拟合;②根据所选回归模型,分析售价x 定为多少时?利润z 可以达到最大.y ^=−1200lnx +5000 y ^=−27x +1700 y ^=−13x 2+1200∑(8i=1y i −y ^i )249428.74 11512.43 175.26∑(8i=1y i −y .)2 124650(附:相关指数 R 2=1−∑(n i=1y i −y ^i )2∑(n i=1y i−y)2)5. 二手车经销商小王对其所经营的A 型号二手汽车的使用年数x 与销售价格y(单位:万元/辆)进行整理,得到如下数据:使用年数x2 3 4 5 6 7 售价y 20 12 8 6.4 4.4 3 z =lny3.002.482.081.861.481.10下面是z 关于x 的折线图:(1)由折线图可以看出,可以用线性回归模型拟合z 与x 的关系,请用相关数加以说明;(2)求y 关于x 的回归方程并预测某辆A 型号二手车当使用年数为9年时售价约为多少?(b^、a ^小数点后保留两位有效数字). (3)基于成本的考虑,该型号二手车的售价不得低于7118元,请根据(2)求出的回归方程预测在收购该型号二手车时车辆的使用年数不得超过多少年?参考公式:回归方程y ^=b ^x +a^中斜率和截距的最小二乘估计公式分别为: b ^=∑(n i=1x i −x)(y i −y)∑(n i=1x i −x)2=∑x i n i=1y i −nxy ∑x i2ni=1−nx 2,a ^=y .−b ^x .,r =∑(n i=1x i −x)(y i −y)√∑(n i=1x i −x)2∑(n i=1y i −y)2.参考数据:∑x i 6i=1y i =187.4,∑x i 6i=1z i =47.64,∑x i 26i=1=139,√∑(6i=1x i −x .)2=4.18,√∑(6i=1y i −y .)2=13.96,√∑(6i=1z i −z .)2=1.53,ln1.46≈0.38,ln0.7118≈−0.34.6. 为了调查历城区城乡居民人民生活水平,随机抽取了10个家庭,得到第i(i =1,2,…,10)个家庭月收入x i (单位:千元)与月流动资金y i (单位:千元)的数据资料如下表:∑x i 10i=1∑y i 10i=1∑ωi 10i=1∑x i 10i=1y i∑ωi 10i=1y ii i (Ⅰ)求方程y =d +c √x ;(Ⅱ)已知某家庭9月收入为9千元,该家庭计划用当月流动资金购置价格为499元的九阳豆浆机,问计划能否成功?附:对一组数据(x i ,y i )(i =1,2,…,10),其回归直线y =b ^x +a ^的最小二乘法估计为b =∑x i n i=1y i −nxy∑x i 2n i=1−n(x)2,a =y .−bx ..7. 近年来,随着汽车消费的普及,二手车流通行业得到迅猛发展.某汽车交易市场对2017年成交的二手车的交易前的使用时间(以下简称“使用时间”)进行统计,得到如图1所示的频率分布直方图.在图1对使用时间的分组中,将使用时间落入各组的频率视为概率.(1)若在该交易市场随机选取3辆2017年成交的二手车,求恰有2辆使用年限在(8,16]的概率;(2)根据该汽车交易市场往年的数据,得到图2所示的散点图,其中x(单位:年)表示二手车的使用时间,y(单位:万元)表示相应的二手车的平均交易价格. ①由散点图判断,可采用y =e a+bx 作为该交易市场二手车平均交易价格y 关于其使用年限x 的回归方程,相关数据如下表(表中Y i =lny i ,Y =110∑Yi 10i=1):试选用表中数据,求出关于的回归方程;②该汽车交易市场拟定两个收取佣金的方案供选择. 甲:对每辆二手车统一收取成交价格的5%的佣金;乙:对使用8年以内(含8年)的二手车收取成交价格的4%的佣金,对使用时间8年以上(不含8年)的二手车收取成交价格的10%的佣金.假设采用何种收取佣金的方案不影响该交易市场的成交量,根据回归方程和图表1,并用各时间组的区间中点值代表该组的各个值.判断该汽车交易市场应选择哪个方案能获得更多佣金. 附注:①对于一组数据(u 1,v 1),(u 2,v 2),…,(u n ,v n ),其回归直线v =α+βu 的斜率和截距的最小二乘估计分别为β^=∑u i n i=1v i −nuv∑u i 2n i=1−nu2,α^=v −β^u ;②参考数据:e 2.95≈19.1,e 1.75≈5.75,e 0.55≈1.73,e −0.65≈0.52,e −1.85≈0.16.8. 近期,济南公交公司分别推出支付宝和微信扫码支付乘车活动,活动设置了一段时间的推广期,由于推广期内优惠力度较大,吸引越来越多的人开始使用扫码支付.某线路公交车队统计了活动刚推出一周内每一天使用扫码支付的人次,用x 表示活动推出的天数,y 表示每天使用扫码支付的人次(单位:十人次),统计数据如表1所示: 1根据以上数据,绘制了散点图.(1)根据散点图判断,在推广期内,y =a +bx 与c ⋅d x (c,d 均为大于零的常数)哪一个适宜作为扫码支付的人次y 关于活动推出天数x 的回归方程类型?(给出判断即可,不必说明理由); (2)根据(1)的判断结果及表1中的数据,建立y 关于x 的回归方程,并预测活动推出第8天使用扫码支付的人次;(3)推广期结束后,车队对乘客的支付方式进行统计,结果如下 表2:车队为缓解周边居民出行压力,以万元的单价购进了一批新车,根据以往的经验可知,每辆车每个月的运营成本约为0.66万元.已知该线路公交车票价为2元,使用现金支付的乘客无优惠,使用乘车卡支付的乘客享受8折优惠,扫码支付的乘客随机优惠,根据统计结果得知,使用扫码支付的乘客中有16的概率享受7折优惠,有13的概率享受8折优惠,有12的概率享受9折优惠.预计该车队每辆车每个月有1万人次乘车,根据给数据以事件发生的频率作为相应事件发生的概率,在不考虑其它因素的条件下,按照上述收费标准,假设这批车需要n(n ∈N n )年才能开始盈利,求n 的值. 参考数据:其中其中υi =lgy i ,υ=17∑υi 7i=1参考公式:对于一组数据(u i ,υi ),(u 2,υ2),…,(u n ,υn ),其回归直线υ̂=a ̂+β̂u 的斜率和截距的最小二乘估计公式分别为:β̂=∑u i ni=1υi −nuυ∑u i 2n i=1−nu2,a ̂=υ−β̂u . 9. 某厂生产不同规格的一种产品,根据检测标准,其合格产品的质量y(g)与尺寸x(mm)之间近似满足关系式y =c ⋅x b (b 、c 为大于0的常数).按照某项指标测定,当产品质量与尺寸的比在区间(e 9,e7)内时为优等品.现随机抽取6件合格产品,测得数据如下: 尺寸x(mm) 38 48 58 68 78 88 质量y(g)16.818.8 20.7 22.4 24 25.5 质量与尺寸的比yx 0.4420.3920.3570.3290.3080.290(1)现从抽取的6件合格产品中再任选3件,记ξ为取到优等品的件数,试求随机变量ξ的分布列和期望;(2)根据测得数据作了初步处理,得相关统计量的值如下表:∑(6i=1lnx i ⋅lny i )∑(6i=1lnx i )∑(6i=1lny i )∑(6i=1lnx i )275.3 24.6 18.3 101.4(i)根据所给统计量,求y 关于x 的回归方程;(ii)已知优等品的收益z(单位:千元)与x ,y 的关系为z =2y −0.32x ,则当优等品的尺寸x 为何值时,收益z 的预报值最大?附:对于样本(v i ,u i )(i =1,2,…,n),其回归直线u =b ⋅v +a 的斜率和截距的最小二乘估计公式分别为:b ^=∑(n i=1v i −v)(u i −u)∑(n i=1v i −v)2=∑v i n i=1u i −nvu∑v i 2n i=1−nv2,a ^=u −b ^v ,e ≈2.7182.10. 经统计,2015年,某公路在部分界桩附近发生的交通事故次数如下表:把界桩公里数记为,公里数记为,,数据绘成的散点图如图所示,以x 为解释变量、交通事故数y 为预报变量,建立了两个不同的回归方程y (1)=29.9+50.2×1x 和y (2)=33.9+125.9e −x 表述x ,y 二者之间的关系. (Ⅰ)计算R 2的值,判断这两个回归方程中哪个拟合效果更好?并解释更好的这个拟合所对R 2的意义;(Ⅱ)若保险公司在每次交通事故中理赔60万元的概率为0.01,理赔2万元的概率为0.19,理赔0.2万元的概率为0.8,利用你得到的拟合效果更好的这一个回归方程,试预报这一年在界桩1040公里附近处发生的交通事故的理赔费(理赔费精确到0.1万元).附:对回归直线y =α̂+β̂x ,有R 2=1−∑(n i=1y i −y ^i )2∑(n i=1y i −y)2.一些量的计算值:表中:y ̂i (1)=29.9+50.2×1x i ,y ^i (2)=33.9+125.9e −x i ,140=0.025,e −40≈0.11. x(2)某同学认为,y =px 2+qx +r 更适宜作为y 关于x 的回归方程类型,他求得的回归方程是y =−0.30x 2+10.17x +68.07.经调查,该地11岁男童身高的中位数为145.3cm.与(1)中的线性回归方程比较,哪个回归方程的拟合效果更好?附:回归方程y ^=a ^+b ^x 中的斜率和截距的最小二乘估计公式分别为:b ^=n i=1i −x)(y i −y)∑(n x −x)2,a ^=y −b ^x .12. 某互联网公司为了确定下一季度的前期广告投入计划,收集了近期前期广告投入量x(单位:万元)和收益y(单位:万元)的数据.对这些数据作了初步处理,得到了下面的散点图(共21个数据点)及一些统计量的值.为了进一步了解广告投入量x 对收益y 的影响,公司三位员工①②③对历史数据进行分析,查阅大量资料,分别提出了三个回归方程模型:表中u i =lnx i ,v i =√x i ,参考数据:√2=1.41,√10=3.16. 表一x y∑(21i=1x i −x)2∑(21i=1x i −x)(y i−y) ∑(21i=1y i −y)240 62770 250200表二μ̂ ∑(21i=1μi −μ)2∑(21i=1μi−μ)(y i −y)v∑(21i=1(v i −v)2∑(21i=1v i−v)(y i −y)3.600.499.806.35.0030.00(1)根据散点图判断,哪一位员工提出的模型不适合用来描述x 与y 之间的关系?简要说明理由.(2)根据据(1)的判断结果及表中数据,在余下两个模型中分别建立收益y 关于投入量x 的关系,并从数据相关性的角度考虑,在余下两位员工提出的回归模型中,哪一个是最优模型(即更适宜作为收益y 关于投入量x 的回归方程)?说明理由: 附:对于一组数据(x 1,y 1),(x 2,y 2),……,(x n ,y n ),其中回归直线y ^=b ^x +a ^的斜率,截距的最小二乘估计以及相关系数分别为:b ̂=∑(ni=1x i −x)(y i −y)∑(n i=1x i−x)2,a ̂=y −b ̂x,r =∑(n i=1x i −x)(y i −y)√∑(n i=1x i −x)2∑(n i=1y i −y)2,其中r 越接近于是,说明变量x 与y 的线性相关程度越好.13. 在冬季,由于受到低温和霜冻的影响,蔬菜的价格会随着需求量的增加而上升,已知某供应商向饭店定期供应某种蔬菜,日供应量x 与单价y 之间的关系,统计数据如表所示:日供应量x(kg) 38 48 58 68 78 88 单价y(元/kg)16.818.820.722.42425.5(Ⅰ)根据上表中的数据得出日供应量x 与单价y 之间的回归方程为y =ax b ,求a ,b 的值;(Ⅱ)该地区有14个饭店,其中10个饭店每日对蔬菜的需求量在60kg 以下(不含60kg),4个饭店对蔬菜的需求量在60kg 以上(含60kg),则从这14个饭店中任取4个进行调查,记这4个饭店中对蔬菜需求量在60kg 以下的饭店数量为X ,求X 的分布列及数学期望. 参考公式及数据:对一组数据(x 1,y 1),(x 2,y 2),…,(x n ,y n ),其回归直线y ^=b ^x +a ^的斜率和截距的最小二乘估计分别为:b ̂=∑x i ni=1y i −nxy ∑x i 2n i=1nx2,a ^=y −b ^x ∑(6i=1lnx i ⋅lny i )∑(6i=1lnx i )∑(6i=1lny i )∑(6i=1lnx i )273.524.6 18.3 101.414. 某地级市共有200000中小学生,其中有7%学生在2017年享受了“国家精准扶贫”政策,在享受“国家精准扶贫”政策的学生中困难程度分为三个等次:一般困难、很困难、特别困难,且人数之比为5:3:2,为进一步帮助这些学生,当地市政府设立“专项教育基金”,对这三个等次的困难学生每年每人分别补助1000元、1500元、2000元.经济学家调查发现,当地人均可支配年收入较上一年每增加n%,一般困难的学生中有3n%会脱贫,脱贫后将不再享受“精准扶贫”政策,很困难的学生中有2n%转为一般困难,特别困难的学生中有n%转为很困难.现统计了该地级市2013年到2017年共5年的人均可支配年收入,对数据初步处理后得到了如图所示的散点图和表中统计量的值,其中年份x 取13时代表2013年,x 与y(万元)近似满足关系式y =C 1⋅2C 2x ,其中C 1,C 2为常数.(2013年至2019年该市中学生人数大致保持不变)y k ∑(5i=1k i −k)2∑(5i=1y i −y)2∑(5i=1x i −x)(y i −y)∑(5i=1x i −x)(k i −k) 2.31.23.14.621其中k i =log 2y i ,k =15∑k i 5i=1(Ⅰ)估计该市2018年人均可支配年收入;(Ⅱ)求该市2018年的“专项教育基金”的财政预算大约为多少?附:①对于一组具有线性相关关系的数据(u 1,v 1),(u 2,v 2)…,(u n ,v n ),其回归直线方程v ∧=βu ∧+α的斜率和截距的最小二乘估计分别为β∧=∑(n i=1u i −u)(vv i −v)∑(n i=1u i −u)2,α∧=v −β∧u②2−0.7 2−0.3 20.1 21.7 21.8 21.9 0.60.81.13.23.53.7315. 参加数学选修课的同学,对某公司的一种产品销量与价格进行了统计,得到如下数据和散点图:定价x(元/kg) 10 20 30 40 50 60 年销量y(kg)1150 643 424 262 165 86 z =2lny14.112.912.111.110.28.9下列数据计算时可供参考:∑(6i=1x i −x)(y i −y)=−34580∑(6i=1x i −x)(z i −z)=−175.5e 6=403.43∑(6i=1y i −y)2=776840∑(6i=1y i −y)(z i −z)=3465.2e 5=148.41(Ⅰ)根据散点图判断出y 与x 和z 与x 分别是正相关还是负相关,再比较判断y 与x 和z 与x 哪一对具有较强的线性相关性?(给出判断即可,不必说明理由)(Ⅱ)根据(Ⅰ)的判断结果及相关数据,选择合理模型建立y 关于x 的回归方程.(方程中的系数均保留两位有效数字).(Ⅲ)根据由(Ⅱ)得到的回归方程,计算当定价x =30时的残差.附:对于一组数据(x 1,y 1),(x 2,y 2),…,(x n ,y n ),其回归直线的斜率和截距的最小二乘估计分别为:b ∧=n i=1i −x)⋅(y i −y)∑(n x −x)2a ∧=y −b ∧x16. 为落实“精准扶贫”战略,某县决定利用扶贫资金帮扶具有地方特色的传统手工业发展.扶贫项目组利用数据分析技术,模拟扶贫项目的未来预期,模拟结果显示,项目投资x(万元)和产品利润y(万元)关系如表所示:分析发现用模型y =bx 利润的关系.设t i =x i 2(i =1,2,3,4,5),t =15∑t i 5i=1,对数据初步处理得到下面一些统计量的值:y =b x +a(回归系数四舍五入,小数点后保留两位数字); (II)该扶贫项目用于支付工人劳动所得资金总额用公式w =y −1.2x 计算(其中x 为项目投资,y 为产品利润,单位:万元),并以(I)中所求回归方程预报产品利润,当工人劳动所得资金总额不少于120万元时,则认为该项目可以完成“脱贫”任务.假设政府投入该项目的扶贫资金(单位:万元)可以是区间[45,80]内的任意整数值,求可以完成“脱贫”任务的概率.附:对于具有线性相关的一组数据(x i ,y i )(i =1,2,…n),其回归方程为y ^=b ^x +a^. 其中:b ^=n i=1i −x)(y i −y)∑(n x −x)2x =1n ∑x i,n i=1y =1n ∑y in i=1.答案和解析【答案】1. 解:(Ⅰ)依题意,n =6,b ^=6i=1i −x)(y i −y)∑(6x −x)2=55784≈6.6, a ≈33−6.6×26=−138.6 ∴y 关于x 的线性回归方程为y =6.6x −138.6(Ⅱ) ( i )利用所给数据,∑(6i=1y i −y ^i )2=236.64,∑(6i=1y i −y)2=3930得, 线性回归方程y =6.6x −138.6 的相关指数R 2=1−6i=1i ^i 2∑(6y −y)2=1−236.643930≈1−0.0602=0.9398.∵0.9398<0.9522,因此,回归方程y ^=0.06e 0.2303x 比线性回归方程y ^=6.6x −138.6拟合效果更好; (ii)由( i )得温度x =35∘C 时,y ̂=0.06e 0.2303×35=0.06×e 8.0605 又∵e 8.0605≈3167, ∴y ^≈0.06×3167≈190(个)所以当温度x =35∘C 时,该种药用昆虫的产卵数估计为190个.2. 解:(Ⅰ)根据残差分析,把x =80代入y ^(1)=0.24x −8.81得y ^(1)=10.39.10−10.39=−0.39.所以表中空格内的值为−0.39.(Ⅱ)模型①残差的绝对值和为0.41+0.01+0.39+1.21+0.19+0.41=2.62,模型②残差的绝对值和为0.36+0.07+0.12+1.69+0.34+1.12=3.7.2.62<3.7, 所以模型①的拟合效果比较好,选择模型①.(Ⅲ)残差大于1kg 的样本点被剔除后,剩余的数据如表由公式:b ^=∑(n i=1x i −x)(y i −y)∑(n i=1x i −x)2,a ^=y .−b ^x ..得回归方程为y =0.24x −8.76.3. 解:由已知,优等品的质量与尺寸的比在区间(e 9,e7)内,即yx ∈(0.302 , 0.388)则随机抽取的6件合格产品中,有3件为优等品A 1,A 2,A 3,3件为非优等品B 1,B 2,B 3 现从任选2件,共有(A 1,A 2)、(A 1,A 3)、(A 1,B 1)、(A 1,B 2)、 (A 1,B 3)、(A 2,A 3)、(A 2,B 1)、(A 2,B 2)、(A 2,B 3)、 (A 3,B 1)、(A 3,B 2)、(A 3,B 3)、(B 1,B 2)、(B 1,B 3)、(B 2,B 3)15种方法 设任选2件恰有一件优等品为事件C ,则事件C 包含(A 1,B 1)、(A 1,B 2)、 (A 1,B 3)、(A 2,B 1)、(A 2,B 2)、(A 2,B 3)、(A 3,B 1)、 (A 3,B 2)、(A 3,B 3)共9种方法由古典概型有P(C)=915=35,故所求概率为35(2)解:对y =c ⋅x b (b,c >0)两边取自然对数得lny =lnc +blnx 由v i =lnx i ,u i =lny i ,得u =b ⋅v +a ,且a =lnc (ⅰ)根据所给统计量及最小二乘估计公式有b ^=75.3−24.6×18.3÷6101.4−24.62÷6=0.270.54=12a ^=u −b ^v =(18.3−12×24.6)÷6=1,得a ^=lnc ^=1,故c ^=e所求y 关于x 的回归方程为y =e ⋅x 12(ⅰ)由(ⅰ)可知,y ^=e ⋅x 12,则z ^=2e √x −0.32x当y^x=ex 12x=√x=e8,即√x =8, x =64时 得收益的预报值z ^=16e −0.32×64≈23.0(千元).4. 解:(1)由等高条形图可知,年度平均销售额与方案1的运作相关性强于方案2.(2)①由已知数据可知,回归模型y ^=−1200lnx +5000对应的相关指数R 12=0.6035;回归模型y ^=−27x +1700对应的相关指数R 22=0.9076; 回归模型y ^=−13x 2+1200对应的相关指数R 32=0.9986.因为R 32>R 22>R 12,所以采用回归模型y ^=−13x 2+1200进行拟合最为合适. ②由(1)可知,采用方案1的运作效果较方案2好, 故年利润z =(−13x 2+1200)(x −15),,当x ∈(0,40)时,z =(−13x 2+1200)(x −15)单调递增; 当x ∈(40,+∞)时,z =(−13x 2+1200)(x −15)单调递减, 故当售价x =40时,利润达到最大.5. 解:(1)由题意,计算x .=16×(2+3+4+5+6+7)=4.5,z .=16×(3+2.48+2.08+1.86+1.48+1.10)=2,且∑x i 6i=1z i =47.64,√∑(6i=1x i −x .)2=4.18, √∑(6i=1z i −z .)2=1.53,∴r =∑n i=1i i √∑(n i=1x i −x)2∑(n i=1y i−y)2=47.64−6×4.5×24.18×1.53=−6.366.3954(或−6.366.40) ≈−0.99;∴z 与x 的相关系数大约为0.99,说明z 与x 的线性相关程度很高; (2)利用最小二乘估计公式计算b ̂=∑x i ni=1y i −nxy ∑x i2n i=1−nx 2=47.64−6×4.5×2139−6×4.52=−6.3617.5≈−0.36, ∴â=z .−b ̂x .=2+0.36×4.5=3.62, ∴z 与x 的线性回归方程是z ∧=−0.36x +3.62, 又z =lny ,∴y 关于x 的回归方程是y ∧=e −0.36x+3.62; 令x =9,解得y ∧=e −0.36×9+3.62≈1.46,即预测某辆A 型号二手车当使用年数为9年时售价约1.46万元; (3)当y ∧≥0.7118时,e −0.36x+3.62≥0.7118=e ln0.7118=e −0.34, ∴−0.36x +3.62≥−0.34, 解得x ≤11,因此预测在收购该型号二手车时车辆的使用年数不得超过11年. 6. 解:(Ⅰ)由y 与x 满足函数模型y =d +c √x ,则y =d +cω, ω.=∑ωi 10i=110=8,y .=∑y i 10i=110=2,则c =∑ωi 10i=1y i −10×ωy∑ωi 210i=1−10×ω2=184−10×8×2720−10×82=0.3,则d =y .−cω.=2−0.3×8=0.4,∴y =−0.4+0.3√x ;(Ⅱ)由(Ⅰ)可知:当x =9时,则y =−0.4+0.3×3=0.5,∴当某家庭9月收入为9千元,该家庭计划用当月流动资金500元,大于499元, ∴当月收入为9千元时,当月流动资金能成功购置价格为499元的九阳豆浆机. 7. 解:(1)由频率分布直方图知,该汽车交易市场2017年成交的二手车使用时间在(8,12]的频率为0.07×4=0.28,使用时间在(12,16]的频率为0.03×4=0.12.所以在该汽车交易市场2017年成交的二手车随机选取1辆,其使用时间在(8,16]的概 率为0.28+0.12=0.4,…(2分)所以所求的概率为P =C 320.42⋅(1−0.4)=0.288;…(3分)(2)①由y =e a+bx 得lny =a +bx ,则Y 关于x 的线性回归方程为Y =a +bx ,…(4分)由于b ̂=10i=1i −x)(Y i −Y)∑(10x −x)2=∑x i 10i=1Y i −10x⋅Y ∑x i 210i=1−10x2=79.75−10×5.5×1.9385−10×5.52=−0.3, â=Y −β̂⋅x =1.9−(−0.3)×5.5=3.55, 则Y 关于x 的线性回归方程为Y^=3.55−0.3x ,……………………………(6分) 所以y 关于x 的回归方程为y ^=e 3.55−0.3x ;………………………(7分)②根据频率分布直方图和①中的回归方程,对成交的二手汽车可预测: 使用时间在(0,4]的频率为0.05×4=0.2,对应的成交价格的预测值为e 3.55−0.3×2=e 2.95≈19.1; 使用时间在(4,8]的频率为0.09×4=0.36,对应的成交价格预测值为e 3.55−0.3×6=e 1.75≈5.75; 使用时间在(8,12]的频率为0.07×4=0.28,对应的成交价格的预测值为e 3.55−0.3×10=e 0.55≈1.73; 使用时间在(12,16]的频率为0.03×4=0.12,对应的成交价格的预测值为e 3.55−0.3×14=e −0.65≈0.52; 使用时间在(16,20]的频率为0.01×4=0.04,对应的成交价格的预测值为e 3.55−0.3×18=e −1.85≈0.16;……………………(9分) 若采用甲方案,预计该汽车交易市场对于成交的每辆车可获得的平均佣金为(0.2×19.1+0.36×5.75+0.28×1.73+0.12×0.52+0.04×0.16)×5% =0.32166≈0.32万元;若采用乙方案,预计该汽车交易市场对于成交的每辆车可获得的平均佣金为(0.2×19.1+0.36×5.75)×4%+(0.28×1.73+0.12×0.52+0.04×0.16)×10% =0.29092≈0.29(万元);……………………(11分)因为0.32>0.29,所以采用甲方案能获得更多佣金. ……………(12分)8. 解:(1)根据散点图判断,y =c ⋅d x 适宜作为扫码支付的人数y 关于活动推出天数x 的回归方程类型;(2)∵y =c ⋅d x ,两边同时取常用对数得:1gy =1g(c ⋅d x )=1gc +1gd ⋅x ;设1gy =v ,∴v =1gc +1gd ⋅x ,∵x =4,v =1.55,∑X i 27i=1=140,∴lgd =∑7i=1x i v i −7xv∑x i 27i=1−7x2=50.12−7×4×1.54140−7×42=728=0.25,把样本中心点(4,1.54)代入v =1gc +1gd ⋅x ,得:lgd =0.54,∴v̂=0.54+0.25x ,∴1gy =0.54+0.25x , ∴y 关于x 的回归方程式:y ̂=100.54+0.25x =100.54(100.54)x =3.47(100.54)x ;把x =8代入上式:∴ŷ=100.54+0.25×8=102.54=102×100.54=347; 活动推出第8天使用扫码支付的人次为3470; (3)记一名乘客乘车支付的费用为Z ,则Z 的取值可能为:2,1.8,1.6,1.4;P(Z =2)=0.1;P(Z =1.8)=0.3×12=0.15;P(Z =1.6)=0.6+0.3×13=0.7;P(Z =1.4)=0.3×16=0.05所以,一名乘客一次乘车的平均费用为:2×0.1+1.8×0.15+1.6×0.7+1.4×0.05=1.66(元)由题意可知:1.66×1×12⋅n −0.66×12⋅n −80>0,n >203,所以,n 取7;估计这批车大概需要7年才能开始盈利.9. 解:(1)由已知,优等品的质量与尺寸的比在区间(e 9,e 7)内.即yx ∈(0.302,0.388).则随机抽取的6件合格产品中,有3件为优等品,3件为非优等品.现从抽取的6件合格产品再任选3件,则取到优等品的件数ξ=0,1,2,3. P(ξ=0)=C 30C 33C 63=120,P(ξ=1)=C 31C 32C 63=920,P(ξ=2)=C 32C 31C 63=920,P(ξ=3)=C 33C 30C 63=120.E(ξ)=0×120+1×920+2×920+3×120=32. (2)解:对y =c ⋅x b (b,c >0)两边取自然对数得lny =lnc +blnx .令v i =lnx i ,u i =lny i .得u =b ⋅v +a.且a =1nc . (i)根据所给统计量及最小二乘估计公式有:b ̂=∑v i ni=1u i −nvu ∑v i 2n i=1−nv2=75.3−24.6×18.3÷6101.4−24.62÷6=0.270.54=12, a ^=u −b ^v =(18.3−12×24.6)÷6=1,得a ^=ln c ^=1,c ^=e ,所求y 关于x 的回归方程为y =e ⋅x 12. (ii)由(i)可知y =e ⋅x 12,则z ^=2e √x −0.32x . 由优等品质量与尺寸的比ŷx=ex 12x=√x ∈(e 9,e7)⇒√x ∈(7,9),即x ∈(49,81). 当t =√x =e0.32≈8.5∈(7,9)时,z ^取最大值.即优等品的尺寸x ≈72.3(mm),收益z ^的预报值最大.10. 解:(Ⅰ)y (1)=29.9+50.2×1x 拟合时,R 12=1−0.8751821≈0.9995; y (2)=33.9+125.9e −x 拟合时,R 22=1−48.41821≈0.9734 ∵0.9995>0.9734,∴y (1)=29.9+50.2×1x 比y (2)=33.9+125.9e −x 拟合效果更好,R 12=1−0.8751821≈0.9995,表明界桩公里数解释了99.95%的交通事故发生次数的变化;(Ⅱ)界桩1040公里取x =40,由y (1)=29.9+50.2×140≈31.16,每次交通事故的理赔费=60×0.01+2×0.19+0.2×0.8=1,14万元,∴预报这一年在界桩1040公里附近处发生的交通事故的理赔费为31.16×1.14≈35.5万元.11. 解:(1)由题意,x =5.5,y =112.45,b ^=n i=1i −x)(y i −y)∑(n x −x)2=566.8582.50≈6.87, a ^=y −b ^x =112.45−6.87×5.5≈74.67; ∴y 关于x 的线性回归方程y =6.87x +74.67;(2)某同学认为,y =px 2+qx +r 更适宜作为y 关于x 的回归方程类型,他求得的回归方程是y =−0.30x 2+10.17x +68.07.当x =11时,代入回归方程是y =−0.30x 2+10.17x +68.07.可得y =142.74; 当x =11时,代入回归方程是y =6.87x +74.67;可得y =150.24; 由11岁男童身高的中位数为145.3cm .可得回归方程是y =6.87x +74.67计算的误差比较大.故回归方程是y =−0.30x 2+10.17x +68.07模拟合效果更好. 12. 解:(1)根据散点图判断,员工①提出的模型不适合, 因为散点图中x 与y 之间不是线性关系;(2)令v =√x ,先建立y 关于v 的线性回归方程, 由于d ∧=21i=1i −v)(y i −y)∑(21v −v)2=30.005.00=6,∴c ∧=y −d ∧v =62−6×6.3=24.2; ∴y 关于v 的线性回归方程为y ∧=24.2+6v , 因此模型②为y 2∧=24.2+6√x ;同理,令u =lnx ,建立y 关于u 的线性回归方程; f ∧=21i=1i −u)(y i −y)∑(21u −u)2=9.800.49=20,e ∧=y −f ∧u =62−20×3.60=−10, ∴y 关于u 的线性回归方程为y ∧=−10+20u , 因此模型③为y 3∧=−10+20lnx ; (i)模型②中,相关系数为 r 2=21i=1i −v)(y i −y)√∑(i=1v i −v)∑(i=1y i −y)=√5×200=310√10≈0.3×3.16=0.948; 模型③中,相关系数为 r 3=21i=1i −u)(y i −y)√∑(i=1u i −u)2∑(i=1y i −y)2=√0.49×200=710√2≈0.7×1.41=0.987; 可得1>r 3>r 2,说明变量u 与y 的线性相关程度更好, 即模型③为y 3∧=−10+20lnx 更为准确,模型③为最优模型.13. 解:(I)对y =ax b 两边同取对数得lny =blnx +lna ,令v =lnx ,u =lny ,得u =bv +lna∴b =∑v i 6i=1u i −6vu∑v i 26i=1−6v2=75.3−4.1×18.3101.4−6×4.12=12,∴lna =18.36−12×24.66=1,即a =e .(II)由题意知,X 的所有可能取值为0,1,2,3,4.P(X =0)=C 44C 144=11001,P(X =1)=C 43C 101C 144=401001,P(X =0)=C 42C 102C 144=2701001,P(X =1)=C 41C 103C 144=4801001,P(X =1)=C 104C 144=2101001.∴X 的分布列为∴E(X)=1×401001+2×2701001+3×4801001+4×2101001=207.14. 解:(Ⅰ)因为x =15(13+14+15+16+17)=15所以:∑(5i=1x i −x)2=(−2)2+(−1)2+12+22=10;关系式y =C 1⋅2C 2,其中k i =log 2y i 得:k =log 2C 1⋅2C 2x , ∴k =log 2C 1+C 2x ,所以C 2=5i=1i −x)(k i −k)∑(5x −x)2=110∴log 2C 1=k −C 2x =1.2−110×15=−0.3所以C 1=2−0.3=0.8 所以y =0.8×2x10当x =18时,2018年人均可支配年收入y =0.8×21.8=2.8(万)(Ⅱ)由题意知2017年时该市享受“国家精准扶贫”政策的学生共200000×7%=14000人一般困难、很困难、特别困难的中学生依次有7000人、4200人、2800人 2018年人均可支配收入比2017年增长0.8×21.8−0.8×21.70.8×21.7=20.1−1=0.1=10%所以2018年该市特别困难的中学生有2800×(1−10%)=2520人, 很困难的学生有4200×(1−20%)+2800×10%=3640人 一般困难的学生有7000×(1−30%)+4200×20%=5740人所以2018年的“专项教育基金”的财政预算大约为5740×1000+3640×1500+2520×2000=1624万.15. 解:(Ⅰ)根据散点图(1)知y 与x 是负相关, 根据散点图(2)知z 与x 是负相关;散点图(2)中各点都集中在一条直线附近, 即z 与x 具有较强的线性相关性;(Ⅱ)由x =16×(10+20+30+40+50+60)=35, z =16×(14.1+12.9+12.1+11.1+10.2+8.9)=11.55, ∴b ∧=6i=1i −x)(z i −z)∑(6x −x)2=−175.51750≈−0.10,由a ∧=z −b ∧x =11.55−(−0.10)×35=15.05≈15,∴z 关于x 的回归方程是z ∧=15−0.10x , 则y 关于x 的回归方程为y ∧=e z 2=e 12(15−0.10x), 即y ∧=e 12(15−0.10x);(Ⅲ)x =30时,y ∧=e 12×(15−0.10×30)=e 6=403.43,当定价x =30时的残差为|403.34−424|≈11. 16. 解:(I)由题意,t =2700,y =192,∑(5i=1t i −t)2=10140000,∑(5i=1t i −t)(y i −y)=586000; ∴b ∧=5i=1i −t)(y i −y)∑(5i=1t −t)2=58600010140000≈0.06;∴a ∧=y −b ∧t =192−0.06×2700=30, 又t =x 2,∴回归方程为y ∧=0.06x 2+30;(II)由w =y −1.2x ,y =0.06x 2+30,∴w =0.06x 2−1.2x +30, 令w ≥120,得0.06x 2−1.2x +30≥120, 解得x ≤−30或x ≥50, ∴取x ≥50;又政府投入该项目的扶贫资金是区间[45,80]内的任意整数值,满足题意的x ≥50; ∴所求的概率为P =80−50+180−45+1=3136.【解析】1. 本题考查了线性回归方程的应用问题,也考查了相关指数的应用问题,是难题. (Ⅰ)求出n 的值,计算相关系数,求出回归方程即可;(Ⅱ)(i)根据相关指数的大小,即可比较模型拟合效果的优劣;(ii)代入求值计算即可. 2. (Ⅰ)根据残差分析,把x =80代入y^(1)=0.24x −8.81得y ^(1)=10.39.10−10.39=−0.39,即可求表中空格内的值;(Ⅱ)求出残差的绝对值和,即可得出结论;(Ⅲ)确定残差大于1kg 的样本点被剔除后,剩余的数据,即可求出回归方程. 本题考查回归方程、残差分析,考查学生的计算能力,属于中档题.3. (1)由题意首先确定ξ的取值,然后求解相应的分布列和数学期望即可;(2)(i)结合题中所给的数据计算回归方程即可;(ii)结合计算求得的回归方程得到收益函数,讨论函数的最值即可求得最终结果.本题考查离散型随机变量的分布列,回归方程的计算及其应用等,重点考查学生对基础概念的理解和计算能力,属于中等题.4. (1)由等高条形图可知,年度平均销售额与方案1的运作相关性强于方案2. (2)①求出相关指数,比较可得结论;②由(1)可知,采用方案1的运作效果较方案2好,故年利润z =(−13x 2+1200)(x −15),利用导数的方法,可得结论.本题考查相关指数,考查等高条形图,考查导数知识的运用,属于中档题.5. (1)由题意计算x .、z .,求出相关系数r ,判断z 与x 的线性相关程度;(2)利用最小二乘估计公式计算b ^、a ^,写出z 与x 的线性回归方程, 求出y 关于x 的回归方程,计算x =9时y ∧的值即可;(3)利用线性回归方程求出y ∧≥0.7118时x 的取值范围,即可得出预测结果.本题考查了线性回归方程与线性相关系数的求法与应用问题,计算量大,计算时要细心. 6. (Ⅰ)求得样本中心点(ω.,y .),根据最小二乘法即可求得c 和d ,即可求得y =d +c √x ;(Ⅱ)当x =9时,代入即可求得y ,与0.499比较大小,即可判断答案.本题考查线性回归方程的应用,考查最小二乘法求线性回归方程,考查计算能力,属于中档题.7. (1)由频率分布直方图求得对应的频率,用频率估计概率即可计算所求的概率;(2)①由y =e a+bx 得lny =a +bx ,求出Y 关于x 的线性回归方程,再写出y 关于x 的回归方程;②根据频率分布直方图和①中的回归方程,对成交的二手汽车预测;再分别计算采用甲、乙两种方案,预计该汽车交易市场对于成交的每辆车可获得的平均佣金值.本题考查了频率分布直方图与线性回归方程的应用问题,是难题.8. (1)通过散点图,判断y =c ⋅d x 适宜作为扫码支付的人数y 关于活动推出天数x 的回归方程类型;(2)通过对数运算法则,利用回归直线方程相关系数,求出回归直线方程,然后求解第8天使用扫码支付的人次;(3)记一名乘客乘车支付的费用为Z ,则Z 的取值可能为:2,1.8,1.6,1.4;求出概率,计算期望,然后推出结果.本题考查了线性回归方程的求法及应用,数学期望的应用,考查计算能力,属于基础题.9. (1)由题意首先确定ξ的取值,然后求解相应的分布列和数学期望即可;(2)(i)结合题中所给的数据计算回归方程即可;(ii)结合计算求得的回归方程得到收益函数,讨论函数的最值即可求得最终结果.本题考查离散型随机变量的分布列,回归方程的计算及其应用等,重点考查学生对基础概念的理解和计算能力,属于中等题.10. (Ⅰ)计算R 2的值,即可得出结论;(Ⅱ)求出界桩1040公里取x =40,由y (1)=29.9+50.2×140≈31.16,每次交通事故的理赔费=60×0.01+2×0.19+0.2×0.8=1,14万元,即可得出结论. 本题考查回归方程,考查拟合效果,考查学生的计算能力,属于中档题.11. (1)由题意求出x ,y ,∑x i 210i=1,∑x i 10i=1y i ,代入公式求值,从而得到回归直线方程;(2)将x =11代入回归方程是y =−0.30x 2+10.17x +68.07和(1)问中的方程,得到的结果与145.3cm 比较,即可判断本题考查了线性回归方程的求法及应用,属于基础题.12. (1)根据散点图判断员工①提出的模型不适合,散点图中的点不是线性关系;(2)令v =√x ,建立y 关于v 的线性回归方程,得模型②的线性回归方程; 令u =lnx ,建立y 关于u 的线性回归方程,得模型③的线性回归方程;计算模型②中相关系数r 2,模型③相关系数r 3,比较即可得出结论.本题考查了线性回归方程的应用问题,也考查了相关系数的应用问题,是中档题. 13. (I)对y =ax b 两边同取对数得lny =blnx +lna ,令v =lnx ,u =lny ,得u =bv +lna ,利用计算公式即可得出.(II)由题意知,X 的所有可能取值为0,1,2,3,4.利用超几何分布列计算公式即可得出.。
一元非线性回归分析例题
【一元非线性回归分析例题】商店销售额与流通率的非线性回归分析下列数据是九个商店的销售额与流通率的有关数据表销售额与流通费率数据MATLAB数据处理与分析1.绘制散点图x=[1.5, 4.5, 7.5,10.5,13.5,16.5,19.5,22.5,25.5];y=[7.0,4.8,3.6,3.1,2.7,2.5,2.4,2.3,2.2];sdt(x,y)2.拟合倒幂函数曲线nlin1(x,y)拟合曲线方程是y=2.2254+7.6213/x剩余标准误差Sy=0.42851可决系数R=0.96733'方差来源' '偏差平方和' '自由度' '方差' ' F值' 'F临界值''显著性''回归' [18.7146] [ 1] [18.7146] [101.9186] [ 5.5914]'* *''剩余' [ 1.2854] [ 7] [ 0.1836] [] [12.2464] []'总和' [ 20] [ 8] [] [] [] []3.拟合幂函数曲线nlin3(x,y)拟合曲线方程是y=8.5173x^-0.42589剩余标准误差Sy=0.146可决系数R=0.99626'方差来源' '偏差平方和' '自由度' '方差' ' F值' ' F临界值''显著性''回归' [19.8508] [ 1] [19.8508] [931.2285] [ 5.5914]'* *''剩余' [ 0.1492] [ 7] [ 0.0213] [] [12.2464] []'总和' [ 20] [ 8] [] [] [] []4.拟合指数函数曲线nlin5(x,y)拟合曲线方程是y=2.3957exp(1.7808/x)剩余标准误差Sy=0.6497可决系数R=0.92318'方差来源' '偏差平方和' '自由度' '方差' 'F值' ' F临界值' '显著性''回归' [17.0452] [ 1] [17.0452] [40.3812] [ 5.5914]'* *''剩余' [ 2.9548] [ 7] [ 0.4221] [] [12.2464] []'总和' [ 20] [ 8] [] [] [] []5.拟合对数函数曲线nlin6(x,y)拟合曲线方程是y=1632.5-1.713log(x)剩余标准误差Sy=0.2762可决系数R=0.98656'方差来源' '偏差平方和' '自由度' '方差' ' F值' ' F临界值' '显著性''回归' [19.4660] [ 1] [19.4660] [255.1773] [ 5.5914]'* *'剩余' [ 0.5340] [ 7] [ 0.0763] [] [12.2464] []'总和' [ 20] [ 8] [] [] [] []【说明】函数nlin1,nlin2,nlin3,nlin4,nlin5,nlin6,nlin7分别用来拟合第一(倒幂函数)、二(双曲线)、三(幂函数)、四(指数函数)、五(倒指数函数)、六(对数函数)、七(S型曲线)种类型曲线求非线性回归的回归方程函数,并在同一个图形中绘制散点图和回归线图.这几个函数的调用方式相同,以第一个函数为例[S,Sy,r2,table]=nlin1(x,y)输入参数x,y是长度相等的两个向量.输出参数个数可选如果没有输出参数,则在命令窗口中显示回归线方程,剩余标准误差、可决系数、方差分析表,并绘制散点图和拟合曲线图.如果有输出参数,第一个输出参数是拟合曲线方程.如果有两个输出参数,第二个输出参数是剩余标准误差Sy.如果有三个输出参数,第三个输出参数是可决系数.如果有四个输出参数,第四个输出参数是方差分析表.。
高中数学非线性回归方程专练
非线性回归方程专练三、解答题(本题共4道小题,第1题0分,第2题0分,第3题0分,第4题0分,共0分) 1.某学生为了测试煤气灶烧水如何节省煤气的问题设计了一个实验,并获得了煤气开关旋钮旋转的弧度数x 与烧开一壶水所用时间y 的一组数据,且作了一定的数据处理(如下表),得到了散点图(如下图).xyw1021()ii x x =-∑1021()ii w w =-∑ 101()()i i i x x y y =--∑ 101()()i ii w w y y =--∑1.4720.60.782.35 0.81−19.3 16.2表中102111,10i i i i w w w x ===∑.(1)根据散点图判断,y a bx =+与2dy c x =+哪一个更适宜作烧水时间y 关于开关旋钮旋转的弧度数x 的回归方程类型?(不必说明理由)(2)根据判断结果和表中数据,建立y 关于x 的回归方程;(3)若单位时间内煤气输出量t 与旋转的弧度数x 成正比,那么,利用第(2)问求得的回归方程知x 为多少时,烧开一壶水最省煤气?附:对于一组数据112233(,),(,),(,),,(,)n n u v u v u v u v ⋅⋅⋅,其回归直线ˆˆˆvu αβ=+的斜率和截距的最小二乘法估计值分别为121()()ˆˆˆ,()niii nii v v uu v u uu βαβ==--==--∑∑2.大连市某企业为确定下一年投入某种产品的宣传费,需了解年宣传费x (单位:千元)对年销售量y (单位:t )和年利润z (单位:千元)的影响,对近8年的年宣传费i x 和年销售量()1,2,,8i y i =…数据作了初步处理,得到下面的散点图及一些统计量的值.xyw()821ii x x =-∑()821ii w w =-∑81i ii x y =∑81i ii w y =∑46.65736.8289.8 1.6 215083.4 31280表中i w x ,18i i w w ==∑.()Ⅰ根据散点图判断,y a bx =+与y c x =+哪一个适宜作为年销售量y 关于年宣传费x 的回归方程类型?(给出判断即可,不必说明理由)()Ⅱ根据()Ⅰ的判断结果及表中数据,建立y 关于x 的回归方程;()Ⅲ已知这种产品的年利润z 与x 、y 的关系为0.2z y x =-.根据()Ⅱ的结果回答下列问题:()i 年宣传费64x =时,年销售量及年利润的预报值是多少? ()ii 年宣传费x 为何值时,年利润的预报值最大?附:对于一组数据()()()1122,,,,,,n n u v u v u v ……,其回归直线v u αβ=+的斜率和截距的最小二乘估计分别为:()()()121niii nii u u v v u u β∧==--=-∑∑,v u αβ∧∧=-.3.(12分)为了研究一种昆虫的产卵数y 和温度x 是否有关,现收集了7组观测数据列于下表中,并作出了散点图,发现样本点并没有分布在某个带状区域内,两个变量并不呈线性相关关系,现分别用模型①:y=C 1x 2+C 2与模型②:41C x C e y +=作为产卵数y 和温度x 的回归方程来建立两个变量之间的关系. 温度x/℃ 20 22 24 26 28 30 32 产卵数y/个6 10 21 24 64 113 322 t=x 2 400 484 576 676 784 900 1024 z=lny 1.792.303.043.184.164.735.77xtyz26692803.57∑∑==---71i 2i 71i i i )x x ()y y )(x x (∑∑==---71i 2i 71i i i )t t ()y y )(t t (∑∑==---71i 2i 71i i i )x x ()x x )(z z (∑∑==---71i 2i 71i i i )t t ()t t )(z z (1157.540.430.32 0.00012其中t i =x i 2,∑==71i i t t,z i =lny i ,∑==71i i z u ,附:对于一组数据(u 1,v 1),(u 2,v 2),…,(u n ,v n ),其回归直线v=βu+α的斜率和截距的最小二乘估计分别为:β=∑∑==---n1i 2i n1i i i )u u ()v v )(u u (,α=v ﹣βu .(1)分别画出y 关于t 的散点图、z 关于x 的散点图,根据散点图判断哪一个模型更适宜作为回归方程类型?(给出判断即可,不必说明理由).(2)根据表中数据,分别建立两个模型下建立y关于x的回归方程;并在两个模型下分别估计温度为30℃时的产卵数.(C1,C2,C3,C4与估计值均精确到小数点后两位)(参考数据:e4.65≈104.58,e4.85≈127.74,e5.05≈156.02)(3)若模型①、②的相关指数计算分别为R12=0.82,R22=0.96,请根据相关指数判断哪个模型的拟合效果更好.4.某公司为确定下一年度投入某种产品的宣传费,需了解年宣传费x(单位:千元)对年销售量y(单位:t)和年利润z(单位:千元)的影响,对近8年的宣传费x i和年销售量y i (i=1,2,…,8)数据作了初步处理,得到一些统计量的值.(x i ﹣)2(w i ﹣)2(x i ﹣)(y i﹣)(w i ﹣)(y i﹣)46.6 56.3 6.8 289.8 1.6 1469 108.8表中w i =, =w i(I)根据表中数据,求回归方程y=c+d;(II)已知这种产品的年利润z与x,y的关系为z=0.2y﹣x,根据( II)的结果回答下列问题:(i)当年宣传费x=90时,年销售量及年利润的预报值时多少?(ii)当年宣传费x为何值时,年利润的预报值最大?附:对于一组数据(u1,v1),(u2,v2),…,(u n,v n ),其回归线=α+βu的斜率和截距的最小二乘估计分别为:=, =﹣β.试卷答案1.:(1)2dy c x=+更适宜作烧水时间y 关于开关旋钮旋转的弧度数x 的回归方程类型. ……………………………2分(2)由公式可得:1011021()()16.2200.81()iii ii w w y y d w w ∧==--===-∑∑ ˆ20.6200.785ˆcy dw =-⨯-==, 所以所求回归方程为2205y x=+.………………………………………………………………7分(3)设t kx =,则煤气用量22020(5)520k S yt kx kx k x x ==+=+≥=, 当且仅当205kkx x=时取“=”,即2x =时,煤气用量最小.………………………………12分 2.()Ⅰ由散点图可以判断y c =+适宜作为年销售量y 关于年宣传费x 的回归方程类型.()Ⅱ令w =y 关于w 的线性回归方程()()()()()()()88888111118888222211118iii iiii iii ii i i i i iiiii i i i y y w w w y wy yw wy w y wy w y wyd w w w w w w w w =========----+--====----∑∑∑∑∑∑∑∑∑31280 6.85738681.6-⨯⨯==,57368 6.8110.6c y dw =-=-⨯=,所以y 关于w 的线性回归方程为110.668y w =+,所以y 关于x 的线性回归方程为110.6y =+()Ⅲ()i 由()Ⅱ知,当64x=时,年销售量y 的预报值为110.6654.6y =+=,年利润z 的预报值为654.60.26466.92z =⨯-=.()ii 根据()Ⅱ的结果知,年利润z 的预报值()20.2(110.668)13.622.12 6.868.36z x x x x x =⨯+-=-++=--+,当 6.8x =,即46.24x =时,年利润的预报值最大, 故年宣传费为46.24千元时,年利润预报值最大. 3.【考点】变量间的相关关系;用样本的频率分布估计总体分布.【分析】(1)画出y 关于t 的散点图和z 关于x 的散点图,结合图形判断模型②更适宜作为回归方程类型;(2)计算模型①的回归系数,写出回归方程,求出x=30时的值;计算模型②的回归系数,写出回归方程,求出x=30时的值即可;(3)根据<判断模型②的拟合效果更好.【解答】解:(1)画出y 关于t 的散点图如图1,画出z 关于x 的散点图如图2;根据散点图可以判断模型②更适宜作为回归方程类型; (2)对于模型①,设t=x 2,则y=C 1x 2+C 2=C 1t+C 2,计算C 1==0.43,C2=﹣C1=80﹣0.43×692=﹣217.56,∴所求回归方程为=0.43x2﹣217.56,当x=30时,估计温度为=0.43×302﹣217.56=169.44;对于模型②,设y=,则z=lny=C3x+C4,计算C3==0.32,C4=﹣C3=3.57﹣0.32×26=﹣4.75,∴所求回归方程为=0.32x﹣4.75,即=e0.32x﹣4.75;当x=30时,估计温度为=e0.32×30﹣4.75≈127.74;(3)∵R12=0.82,R22=0.96,∴<,∴模型②的拟合效果更好.【点评】本题考查了散点图以及回归方程和相关指数的应用问题,也考查了分析与判断能力的应用问题,是综合性题目.4.【考点】线性回归方程.【分析】(Ⅰ)先建立中间量w=,建立y关于w的线性回归方程,根据公式求出w,问题得以解决;(Ⅱ)(i)年宣传费x=90时,代入到回归方程,计算即可,(ii)求出预报值得方程,根据函数的性质,即可求出.【解答】解:(Ⅰ)令w=,先建立y关于w的线性回归方程,由于d=68,c=563﹣68×6.8=100.6,所以y关于w的线性回归方程为y=100.6+68w,因此y关于x的回归方程为y=100.6+68,(Ⅱ)(i)由(Ⅰ)知,当x=90时,年销售量y的预报值y=100.6+68=745.2,年利润z的预报值z=745.2×0.2﹣90=59.04,(ii)根据(i)的结果可知,年利润z的预报值z=0.2﹣x=﹣x+13.6+20.12,当=6.8时,年利润的预报值最大为66.36千元.。
课时作业6:8.2.2 第二课时 非线性回归模型及其应用
第二课时 非线性回归模型及其应用基础达标一、选择题1.已知某地财政收入x 与支出y 满足回归方程y ^=b ^x +a ^+e i (单位:亿元)(i =1,2,…),其中b ^=0.8,a ^=2,|e i |<0.5,如果今年该地区财政收入10亿元,年支出预计不会超过( ) A .10亿元 B .9亿元 C .10.5亿元D .9.5亿元解析 y ^=0.8×10+2+e i =10+e i , ∵|e i |<0.5,∴9.5<y ^<10.5. 答案 C2.对变量x ,y 进行回归分析时,依据得到的4个不同的回归模型画出残差图,则下列模型拟合精度最高的是( )解析 用残差图判断模型的拟合效果,残差点比较均匀地落在水平的带状区域中,说明这样的模型比较合适.带状区域的宽度越窄,说明模型的拟合精度越高. 答案 A3.在回归分析中,R 2的值越大,说明残差平方和( ) A .越大B .越小C .可能大也可能小D .以上均错解析 因为R 2=1-∑ni =1 (y i -y ^i )2∑n i =1 (y i -y -)2,所以当R 2越大时,∑n i =1(y i -y ^i )2越小,即残差平方和越小. 答案 B4.若一函数模型为y =sin 2α+2sin α+1,为将y 转化为t 的回归直线方程,则需作变换t 等于( ) A .sin 2 α B .(sin α+1)2 C.⎝ ⎛⎭⎪⎫sin α+122D .以上都不对解析 因为y 是关于t 的回归直线方程,实际上即y 是关于t 的一次函数,又因为y =(sin α+1)2,若令t =(sin α+1)2,则可得y 与t 的函数关系式为y =t ,此时变量y 与变量t 是线性相关关系. 答案 B5.甲、乙、丙、丁4位同学各自对A ,B 两变量进行回归分析,分别得到散点图与残差平方和∑ni =1(y i -y ^i )2如下表:哪位同学的试验结果体现拟合A ,B 两变量关系的模型拟合精度高( ) A .甲 B .乙 C .丙D .丁解析 根据线性相关的知识,散点图中各样本点条状分布越均匀,同时保持残差平方和越小(对于已经获取的样本数据,R 2的表达式中∑n i =1(y i -y -)2为确定的数,则残差平方和越小,R 2越大),由回归分析建立的线性回归模型的拟合效果越好,由试验结果知丁要好些. 答案 D 二、填空题6.某种产品的广告支出费用x (单位:万元)与销售额y (单位:万元)的数据如下表:已知y 关于x 的线性回归方程为y ^=6.5x +17.5,则当广告支出费用为5万元时,残差为__________万元.解析 当x =5时,y ^=6.5×5+17.5=50,表格中对应y =60,于是残差为60-50=10(万元). 答案 107.某商场为了了解某品牌羽绒服的月销售量(单位:件)与月平均气温x (单位:℃)之间的关系,随机统计了某4个月的月销售量与当月平均气温,数据如下表:由表中数据算出线性回归方程y ^=b ^x x +a ^中的b ^≈-2.气象部门预测下个月的平均气温约为 6 ℃,据此估计,该商场下个月该品牌羽绒服的销售量的件数约为________.解析 由表格中数据可得x -=17+13+8+24=10,y -=24+33+40+554=38.又∵b ^≈-2,∴a ^=y --b ^x -≈38+2×10=58,∴y ^=-2x +58.当x =6时,y ^=-2×6+58=46. 答案 468.在研究气温和热茶销售杯数的关系时,若求得决定系数R 2≈0.85,则表明气温解释了__________的热茶销售杯数变化,而随机误差贡献了剩余的__________,所以气温对热茶销售杯数的效应比随机误差的效应大得多.解析 由决定系数R 2的意义可知,R 2≈0.85表明气温解释了85%,而随机误差贡献了剩余的15%. 答案 85% 15% 三、解答题9.从某居民区随机抽取10个家庭,获得第i 个家庭的月收入x i (单位:千元)与月储蓄y i (单位:千元)的数据资料,算得∑10i =1x i =80,∑10i =1y i =20,∑10i =1x i y i =184,∑10i =1x 2i =720. (1)求家庭的月储蓄y 关于月收入x 的线性回归方程y ^=b ^x +a ^;(2)若该居民区某家庭月收入为7千元,预测该家庭的月储蓄. 解 (1)由题意知n =10,x -=1n ∑10i =1x i =110×80=8,y -=1n ∑10i =1y i =110×20=2,所以b ^=∑10i =1x i y i -n x - y - ∑10i =1x 2i -nx -2=184-10×8×2720-10×82=2480=0.3, a ^=y --b ^x -=2-0.3×8=-0.4,故所求线性回归方程为y ^=0.3x -0.4.(2)将x =7代入回归方程,可以预测家庭的月储蓄约为y ^=0.3×7-0.4=1.7(千元). 10.为了研究甲型H1N1中的某种细菌随时间x 变化的繁殖个数y ,收集数据如下:求y 对x 的回归方程.解 作出散点图如图(1)所示.由散点图看出样本点分布在一条指数型曲线y =c e bx 的周围,则ln y =bx +ln c . 令z =ln y ,a =ln c ,则z =bx +a .相应的散点图如图(2)所示.从图(2)可以看出,变换后的样本点分布在一条直线附近,因此可以用线性回归方程来拟合.由表中数据得到线性回归方程为z ^=0.69x +1.112.因此细菌的繁殖个数对温度的非线性回归方程为y ^=e 0.69x +1.112.能力提升11.若对于变量x ,y 的10组统计数据的回归模型中,计算R 2=0.95,又知残差平方和为120.55,那么∑10i =1(y i -y -)2的值为( )A .241.1B .245.1C .2 411D .2 451解析 由题意知残差平方和∑10i =1(y i -y ^i )2=120.55,又R 2=1-∑10i =1(y i -y ^i )2∑10i =1(y i -y -)2=0.95,所以∑10i =1(y i -y -)2=2 411.答案 C12.某电容器充电后,电压达到100 V ,然后开始放电,由经验知道,此后电压U 随时间t 变化的规律用公式U =A e bt (b <0)表示,现测得时间t (s)时的电压U (V)如下表:试求:电压U 对时间t 的回归方程(提示 对公式两边取自然对数,把问题转化为线性回归分析问题).解 对U =A e bt 两边取对数得ln U =ln A +bt ,令y =ln U ,a =ln A ,x =t ,则y =a +bx ,y 与x 的对应数据如下表:根据表中数据画出散点图,如图所示,从图中可以看出,y 与x 具有较好的线性相关关系,由表中数据求得x -=5,y -≈3.045,由公式计算得b ^≈-0.313,a ^=y --b ^x -=4.61,所以y 对x 的线性回归方程为y ^=-0.313x +4.61.所以ln U^=-0.313t +4.61,即U ^=e -0.313t +4.61=e -0.313t ·e 4.61,因此电压U 对时间t 的回归方程为U^=e -0.313t ·e 4.61.创新猜想13.(多选题)如图四个散点图中,适合用线性回归模型拟合其中两个变量关系的是( )A .①B .②C .③D .④解析 由图易知①③两个图中样本点在一条直线附近,因此适合用线性回归模型. 答案 AC14.(多选题)下列说法正确的是( )A.残差的绝对值越小,回归方程的拟合效果越好B.残差平方和越小,决定系数R2越大C.决定系数R2可以大于1D.通过经验回归方程得到的预报值是响应变量的可能取值的平均值,不一定是响应变量的精确值解析R2的计算公式,知B正确,C错误;A,D均正确.答案ABD。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
划求解法所得参数值14年的销售额预测值第6题某企业过去13年的年销售额数据如单元格区域A1:B14所示的形式为:Y=aX b。
请在单元格区域H2:H5中写出回归方程的相关年的销售额及建立历年的销售额回归模型图。
要求如下:
1、使用数学方法及变量代换将此问题转化为一元线性回归问题。
2、分别在单元格区域C2:C14与单元格区域D2:D14中填入新变量LN函数)。
3、以新变量Y'为因变量、新变量U为自变量,并依据要求1所给的求解法求得新变量V和参数b的最优值(V和b的初始假定值均为1
E2:E14中计算出各年的新变量Y'的预测值。
4、在单元格H5中填入题给回归方程的参数a的值(使用EXP函数
5、用规划求解法确定的参数a和b的回归方程,预测第14年的销售格H8。
6、绘制一个过去13年的销售额散点图,在图上添加乘幂趋势线、系数R2的值,并与上法所得到的参数a和b的值进行对照。
7、将计算得到的第14年的销售额预测值添加到散点图上(粉红色
8、生成的图形如下所示,并按所给图示对图形进行相应的格式化注:此题采用无约束条件的规划求解法。
B14所示。
已知回归方程的相关参数,并预测第14
问题。
入新变量Y'与U的值(使用所给的线性关系用规划均为1),并在单元格区域函数)。
年的销售额,并填入单元
势线、回归方程及判定粉红色的点子)。
格式化。