最新高考数学复习点拨-非线性回归问题

合集下载

高考总复习二轮数学精品课件 专题4 概率与统计 培优拓展(七) 非线性回归问题

高考总复习二轮数学精品课件 专题4 概率与统计 培优拓展(七) 非线性回归问题
()
0.778
(2 )
(2 )(|2 )
0.2×0.8
P(A2|C)=
=
=
,
()
()
0.778
(3 )
(3 )(|3 )
0.6×0.75
P(A3|C)= () =
= 0.778 ,
()
因为 0.6×0.75>0.2×0.84>0.2×0.8,
所以可判断该航班飞往其他地区的可能性最大.
率的估计值分别为80%和75%,试解决以下问题:
①现从2023年在该机场起飞的航班中随机抽取一个,求该航班准点放行的
概率;
②若2023年某航班在该机场准点放行,判断该航班飞往A地、B地、其他
地区等三种情况中的哪种情况的可能性最大,说明你的理由.
附:对于一组数据(u1,v1),(u2,v2),…,(un,vn),其回归直线 v=α+βu 的斜率和截距
指标之一.某机场自2012年起采取相关策略优化各个服务环节,运行效率不
断提升.以下是根据近10年年份数xi与该机场飞往A地航班放行准点率
yi(i=1,2,…,10)(单位:%)的统计数据所作的散点图及经过初步处理后得到
的一些统计量的值.
x
y
2017.5
80.4
10

t
1.5
其中 ti=ln(xi-2012), =
147.700
^
= − ≈-3.849,
=1
^
所以 w 关于 x 的经验回归方程为=-3.849+0.272x,
^
因此 y 关于 x 的非线性经验回归方程为 =e-3.849+0.272x.
本 课 结 束

2023年高考数学复习:非线性回归问题

2023年高考数学复习:非线性回归问题
2023年高考数学复习:
通过变量间的相关关系对两个变量进行统计分析是数学的重要应 用,其中非线性回归问题具有十分重要的现实意义.
例 (2021·武汉模拟)近年来,明代著名医药学家李时珍的故乡黄冈市蕲 春县大力发展大健康产业,蕲艾产业化种植已经成为该县脱贫攻坚的主 要产业之一,已知蕲艾的株高y(单位:cm)与一定范围内的温度x(单位:℃) 有关,现收集了蕲艾的13组观测数据,得到如下的散点图: 现根据散点图利用 y=a+b x或 y =c+dx建立 y 关于 x 的非线性回归 方程,令 s= x,t=1x得到如下数据:
^
2 230.8-20=2 210.8,所以z≤2 210.8,
当且仅当x=20时等号成立, 所以当温度为20℃时蕲艾的利润最大.
能力 提升
非线性回归方程的求法 (1)根据原始数据作出散点图. (2)根据散点图,选择恰当的拟合函数. (3)作恰当变换,将其转化成线性函数,求线性回归方程. (4)在(3)的基础上通过相应变换,即可得非线性回归方程.
解 先建立v关于x的线性回归方程. 由y=eλx+t,得ln y=t+λx,即v=t+λx.
12
xi- x vi- v
^ i=1
由于λ=
12
xi- x 2
=71740≈0.018,
i=1
^
^
t= v -λ x =4.20-0.018×20=3.84,
^
所以 v 关于 x 的线性回归方程为v=0.02x+3.84,
i=1
14
(1)设(ui,yi)的相关系数为r1,(xi,vi)的相关系数为r2,请从相关系数的角 度,选择一个拟合程度更好的模型;
解 r1=
12
ui- u yi- y

非线性回归分析的入门知识

非线性回归分析的入门知识

非线性回归分析的入门知识在统计学和机器学习领域,回归分析是一种重要的数据分析方法,用于研究自变量和因变量之间的关系。

在实际问题中,很多情况下自变量和因变量之间的关系并不是简单的线性关系,而是呈现出一种复杂的非线性关系。

因此,非线性回归分析就应运而生,用于描述和预测这种非线性关系。

本文将介绍非线性回归分析的入门知识,包括非线性回归模型的基本概念、常见的非线性回归模型以及参数估计方法等内容。

一、非线性回归模型的基本概念在回归分析中,线性回归模型是最简单和最常用的模型之一,其数学表达式为:$$Y = \beta_0 + \beta_1X_1 + \beta_2X_2 + ... + \beta_pX_p +\varepsilon$$其中,$Y$表示因变量,$X_1, X_2, ..., X_p$表示自变量,$\beta_0, \beta_1, \beta_2, ..., \beta_p$表示模型的参数,$\varepsilon$表示误差项。

线性回归模型的关键特点是因变量$Y$与自变量$X$之间呈线性关系。

而非线性回归模型则允许因变量$Y$与自变量$X$之间呈现非线性关系,其数学表达式可以是各种形式的非线性函数,例如指数函数、对数函数、多项式函数等。

一般来说,非线性回归模型可以表示为:$$Y = f(X, \beta) + \varepsilon$$其中,$f(X, \beta)$表示非线性函数,$\beta$表示模型的参数。

非线性回归模型的关键在于确定合适的非线性函数形式$f(X,\beta)$以及估计参数$\beta$。

二、常见的非线性回归模型1. 多项式回归模型多项式回归模型是一种简单且常见的非线性回归模型,其形式为: $$Y = \beta_0 + \beta_1X + \beta_2X^2 + ... + \beta_nX^n +\varepsilon$$其中,$X^2, X^3, ..., X^n$表示自变量$X$的高次项,$\beta_0, \beta_1, \beta_2, ..., \beta_n$表示模型的参数。

高考回归分析知识点

高考回归分析知识点

高考回归分析知识点回归分析是统计学中一种重要的分析方法,用于研究变量之间的关系和预测。

在高考数学中,回归分析也是一个重要的知识点。

本文将介绍高考中常见的回归分析知识点,并结合具体例子进行解析。

一、简单线性回归1. 定义:简单线性回归是指在研究两个变量之间关系时,其中一个变量为自变量,另一个变量为因变量,且二者之间存在线性关系的情况。

2. 公式:简单线性回归模型的数学表示为:Y = α + βX + ε,其中Y为因变量,X为自变量,α和β为常数,ε为误差项。

3. 参数估计:通过最小二乘法可以估计出回归系数α和β的值,从而建立回归方程。

示例:假设我们想研究学生的学习时间与考试分数之间的关系。

我们收集了一组数据,学习时间(自变量X)和考试分数(因变量Y)的数值如下:学习时间(小时):[5, 10, 15, 20, 25, 30]考试分数(分数):[60, 70, 75, 80, 85, 90]通过简单线性回归分析,我们可以建立回归方程为:Y = 55 + 0.75X,说明学习时间对考试分数有正向影响。

二、多元线性回归1. 定义:多元线性回归是指在研究多个自变量与一个因变量之间关系时的回归分析方法。

它可以用来探究多个因素对因变量的影响程度,并进行预测和解释。

2. 公式:多元线性回归模型的数学表示为:Y = α + β₁X₁ + β₂X₂+ ... + βₚXₚ + ε,其中Y为因变量,X₁、X₂、...、Xₚ为自变量,α和β₁、β₂、...、βₚ为常数,ε为误差项。

3. 参数估计:同样通过最小二乘法可以估计出回归系数α和β₁、β₂、...、βₚ的值,从而建立回归方程。

示例:我们想研究学生的考试分数与学习时间、家庭收入、家庭教育水平等因素之间的关系。

我们收集了一组数据,学习时间(自变量X₁)、家庭收入(自变量X₂)、家庭教育水平(自变量X₃)和考试分数(因变量Y)的数值如下:学习时间(小时):[5, 10, 15, 20, 25, 30]家庭收入(万元):[8, 10, 12, 15, 18, 20]家庭教育水平(年):[10, 12, 14, 16, 18, 20]考试分数(分数):[60, 70, 75, 80, 85, 90]通过多元线性回归分析,我们可以建立回归方程为:Y = 50 +0.7X₁ + 1.2X₂ + 1.5X₃,说明学习时间、家庭收入和家庭教育水平都对考试分数有正向影响。

高考数学非线性问题知识点

高考数学非线性问题知识点

高考数学非线性问题知识点一、引言数学作为一门科学,一直以来都是高考的重要科目之一。

其中,数学的非线性问题是考生们普遍认为较为困难的部分。

本文将重点探讨高考数学非线性问题的知识点,帮助考生们更好地理解和应对这一部分内容。

二、什么是非线性问题在介绍高考数学非线性问题的知识点之前,我们先来了解一下什么是非线性问题。

非线性问题是指不能用线性关系式表达的数学问题。

与线性问题不同,非线性问题的解不再具有简单的直线关系,而是具有曲线、波动等复杂的特征。

三、非线性函数的性质1. 导数的变化在处理非线性问题时,我们需要掌握函数的导数变化对函数性质的影响。

例如,当函数的导数大于零时,函数是单调递增的;当函数的导数小于零时,函数是单调递减的。

这对于理解函数图像的变化以及解题非常重要。

2. 极值点的判定对于非线性函数,我们通常需要找到它的极值点。

极值点可以是函数的最大值或最小值。

判定极值点的方法之一是使用导数。

当函数的导数为零时,该点很可能是极值点。

然后,我们可以对导数的符号进行分析,进一步确认该点的性质。

四、非线性方程的求解除了处理非线性函数外,我们还需要掌握如何求解非线性方程。

求解非线性方程的方法有多种,常见的包括牛顿迭代法、二分法、试位法等。

1. 牛顿迭代法牛顿迭代法是一种有效的求解非线性方程的方法。

它通过不断逼近方程的根,直到满足所需的精度要求。

该方法需要利用函数的导数信息,因此在应用时需要先求出导数,并进行迭代计算。

2. 二分法二分法是一种简单却有效的求解非线性方程的方法。

它利用函数在连续区间上的中间值进行判断,然后不断地缩小区间范围,最终逼近方程的根。

该方法的优点在于不需要求导,适用范围广。

3. 试位法试位法是一种通过区间划分来求解非线性方程的方法。

它将方程的解所在的区间划分为若干段,然后通过函数值的符号变化来判断解所在的区间。

该方法的优点在于可以根据实际情况进行区间的调整,从而更快地逼近方程的根。

五、非线性几何问题的解析方法除了函数和方程的处理外,非线性几何问题也是高考数学中的重要内容。

2023年高考数学复习----回归分析规律方法与典型例题讲解

2023年高考数学复习----回归分析规律方法与典型例题讲解

2023年高考数学复习----回归分析规律方法与典型例题讲解【规律方法】线性回归分析的原理、方法和步骤:(1)利用图表和数字特征可以对数据做简单的分析,但是用回归直线方程可以对数据的未来值进行预测.在选取数据观察的时候,要注意大量相对稳定的数据比不稳定的数据更有价值,近期的数据比过去久远的数据更有价值.(2)判断两组数据是否具有线性相关关系的方法:散点图,相关系数.(3)相关指数2R与相关系数r在含有一个解释变量的线性回归模型中是等价的量()22=,都是用来判断线性回归模型拟合效果好不好的量.R r(4)利用换元法,可以将一元非线性回归转化为线性回归.【典型例题】例1.(2022春·河南·高三信阳高中校联考期末)随着电池充电技术的逐渐成熟,以锂电池为动力的新一代无绳类电动工具以其轻巧便携、工作效率高、环保、可适应多种应用场景下的工作等优势,被广泛使用.在消费者便携无绳化需求与技术发展的双重驱动下,锂电类无绳电动工具及配套充电器市场有望持续扩大.某公司为适应市场并增强市场竞争力,逐年增加研发人员,使得整体研发创新能力持续提升,现对2017~2021年的研发人数作了相关统计,如下图:2017~2021年公司的研发人数情况(年份代码1~5分别对应2017~2021年)(1)根据条形统计图中数据,计算该公司研发人数y 与年份代码x 的相关系数r ,并由此判断其相关性的强弱;(2)试求出y 关于x 的线性回归方程,并预测2023年该公司的研发人数.(结果取整数) 参考数据:()52155960i i y y=−=∑37.4≈.参考公式:相关系数()()niix x y y r −−=∑.线性回归方程的斜率()()()121ˆniii nii x x y y bx x ==−−=−∑∑,截距ˆˆa y bx =−.附:【解析】(1)由条形统计图,得()11234535x =⨯++++=,2042202983964823205y ++++==,所以()()()()()()5222222123451i i x xx x x x x x x x x x =−=−+−+−+−+−∑()()()()()222221323334353=−+−+−+−+− 10=,()()()()()()()51211611000221762162732iii x x y y =−−=−⨯−+−⨯−+⨯−+⨯+⨯=∑.所以()()57320.982374iix x y y r −−===≈≈⨯∑.因为相关系数0.980.75r ≈>,所以y 与x 具有很强的线性相关关系,且为正相关.(2)()()()2515173273.ˆ210iiii i x x y y bx x ==−−===−∑∑, 所以320ˆˆ73.23100.4ay bx =−=−⨯=, 所以73ˆˆˆ.2100.4ybx a x =+=+. 由题意知,2023年对应的年份代码7x =, 当7x =时,73.ˆˆ27100.4612.8ˆybx a =+=⨯+=, 故预测2023年该公司的研发人数约为613人.例2.(2022春·广东·高三校联考阶段练习)红铃虫是棉花的主要害虫之一,能对农作物造成严重伤害,每只红铃虫的平均产卵数y 和平均温度x 有关,现收集了以往某地的7组数据,得到下面的散点图及一些统计量的值.(1)根据散点图判断,y bx a =+与e dxy c =(其中e 2.718=为自然对数的底数)哪一个更适宜作为平均产卵数y 关于平均温度x 的回归方程类型?(给出判断即可,不必说明理由)并由判断结果及表中数据,求出y 关于x 的回归方程,(计算结果精确到0.01) (2)根据以往统计,该地每年平均温度达到28℃以上时红铃虫会造成严重伤害,需要人工防治,其他情况均不需要人工防治,假设该地每年平均温度达到28℃以上的概率为13.该地今后4年中至少有两年需要人工防治的概率.附:回归方程()1122211()()ˆˆˆˆˆˆˆ,,====−−−=+===−−−∑∑∑∑n niii ii i nniii i x x y y x y nxyybx a b ay bx x x xnx . 【解析】(1)由散点图可以判断,e dxy c =适宜作为卵数y 关于温度x 的回归方程类型.对e dxy c =两边取自然对数,得ln ln y c dx =+,令ln ,ln ˆˆˆ,z y a c b d ===,则ˆˆˆz bxa =+, 由数据得21232527293133277x ++++++==,71736.6i ii x zxz =−=∑,()77222117112i i i i x x x x ==−=−=∑∑,所以717221736.6ˆ0.331127i i i i i x z xzbxx ==−==≈−∑∑, 3.60.3327 5.31ˆˆaz bx =−=−⨯=−, 所以z 关于x 的线性回归方程为ˆ0.33 5.31zx =−, 则y 关于x 的回归方程为0.33 5.31ˆe x y−=; (2)若今后4年中有X 年需要人工防治,且服从1(4,)3X,所以,今后4年中至少有两年需要人工防治的概率431421233111C 3338127P ⎛⎫⎛⎫⎛⎫=−−⋅== ⎪ ⎪ ⎪⎝⎭⎝⎭⎝⎭. 例3..(2022·全国·模拟预测)住房和城乡建设部等六部门发布通知提出,到2025年,农村生活垃圾无害化处理水平明显提升.我国生活垃圾主要有填埋、焚烧与堆肥三种处理方式,随着我国垃圾处理结构的不断优化调整,焚烧处理逐渐成为市场主流.根据国家统计局公布的数据,对2013—2020年全国生活垃圾焚烧无害化处理厂的个数y (单位:座)进行统计,得到如下表格:(1)由表中数据可知,可用线性回归模型拟合y 与x 之间的关系,请用相关系数加以说明;(精确到0.01)(2)求出y 关于x 的线性回归方程,并预测2022年全国生活垃圾焚烧无害化处理厂的个数;(3)对于2035年全国生活垃圾焚烧无害化处理厂的个数,还能用所求的线性回归方程预测吗?请简要说明理由.参考公式:相关系数()()niix x y y r −−=∑y bx a =+$$$中斜率和截距的最小二乘估计公式分别为()()()121nii i nii xx y yb xx==−−=−∑∑,a y bx =−$$.参考数据:812292i i y ==∑,821204ii x ==∑,821730348ii y ==∑,8112041i i i x y ==∑,2573328329=,10.2585.84≈.【解析】(1)由题意,12345678982x +++++++==,229257382y ==,相关系数()()8iix x y y r −−==∑88−∑i ix y x y9573120418−⨯⨯==17270.9820.585.84≈≈⨯,因为y 与x 的相关系数0.98r ≈,接近于1,所以y 与x 的线性相关程度相当高,可用线性回归模型拟合y 与x 之间的关系; (2)由题意,()()()8811882221188iii ii i iii i x x y y x y x yb x x xx====−−−===−−∑∑∑∑957312041817272241.12814220484−⨯⨯=≈−⨯, 573941.12101.4622a y bx =−≈−⨯=, 所以y 关于x 的线性回归方程为41.12101.46y x =+, 易知2022年对应的年份代码10x =,当10x =时,41.1210101.46512.66513y =⨯+=≈,所以预测2022年全国生活垃圾焚烧无害化处理厂的个数为513;(3)对于2035年全国生活垃圾焚烧无害化处理厂的个数,不能用所求线性回归方程预测, 理由如下(说出一点即可):①线性回归方程具有时效性,不能预测较远情况;②全国生活垃圾焚烧无害化处理厂的个数有可能达到上限,一段时间内不再新建; ③受国家政策的影响,可能产生新的生活垃圾无害化处理方式.。

2024届高考二轮复习文科数学课件:巧转化速解非线性回归问题

2024届高考二轮复习文科数学课件:巧转化速解非线性回归问题

=1
^
^
6.435
所以 =
≈2.12, =3.55-2.12×2.55≈-1.86,
3.035
所以模型 y=m
^
+n 的回归方程为 =2.12
-1.86.
6
2
(2) ∑ ( -) =(-2.65)2+(-1.55)2+0.652+0.352+1.652+1.552≈15.1,
=1
所以 r1=
r2=
5.55
2.2× 15.1
6.435
3.035× 15.1

=
5.55
33.22
6.435
45.83


5.55
≈0.964,
5.76
6.435
≈0.951,
6.77
因为r1更接近1,所以模型y=2.52ln x-0.99的拟合效果更好,则次年2月净利
润为y≈2.52ln 14-0.99≈5.6(万元).
业情况进行调查统计,得到的数据如下:
2ቤተ መጻሕፍቲ ባይዱ
4
6
月份x
净利润
0.9
2.0
4.2
y/万元
8
10
12
3.9
5.2
5.1
(1)设 μi=ln xi,vi= .试建立 y 关于 x 的非线性回归方程 y=aln x+b 和
y=m +n(保留 2 位小数);
(2)从相关系数的角度确定哪一个模型的拟合效果更好,并据此预测次年2
c=ln a,则μ=bv+c;
(2)指数曲线:y=aebx,两边取对数可得ln y=ln a+bx,令μ=ln y,c=ln a,则

新高考数学复习考点知识专题讲义33---非线性回归问题

新高考数学复习考点知识专题讲义33---非线性回归问题

新高考数学复习考点知识专题讲义第33讲 非线性回归问题通过变量间的相关关系对两个变量进行统计分析是数学的重要应用.其中非线性回归问题具有十分重要的现实意义.例二手车经销商小王对其所经营的A 型号二手汽车的使用年数x 与销售价格y (单位:万元/辆)进行整理,得到如下数据:使用年数x 2 3 4 5 6 7 售价y 20 12 8 6.4 4.4 3 z =ln y3.002.482.081.861.481.10下面是z 关于x 的折线图:(1)由折线图可以看出,可以用线性回归模型拟合z 与x 的关系,请用相关系数加以说明; (2)求y 关于x 的回归方程,并预测当某辆A 型号二手车使用年数为9年时售价约为多少;(b ^,a ^小数点后保留两位有效数字)(3)基于成本的考虑,该型号二手车的售价不得低于7118元,请根据(2)求出的回归方程预测在收购该型号二手车时车辆的使用年数不得超过多少年.参考公式:b ^=i =1n (x i -x )(y i -y )i =1n (x i -x )2=∑i =1nx i y i -n x y∑i =1nx 2i -n x 2,a ^=y -b ^x ,r =i =1n (x i -x )(y i -y )i =1n (x i -x )2i =1n (y i -y )2.参考数据:∑i =16x i y i =187.4,∑i =16x i z i =47.64,∑i =16x 2i =139,i =16(x i -x )2=4.18,i =16(y i -y )2=13.96,i =16(z i -z )2=1.53,ln1.46≈0.38,ln0.7118≈-0.34.解(1)由题意,知x =16×(2+3+4+5+6+7)=4.5, z =16×(3+2.48+2.08+1.86+1.48+1.10)=2,又∑i =16x i z i =47.64,i =16(x i -x )2=4.18,i =16(z i -z )2=1.53,∴r =47.64-6×4.5×24.18×1.53=- 6.366.395 4≈-0.99,∴z 与x 的相关系数大约为-0.99,说明z 与x 的线性相关程度很高. (2)b ^=47.64-6×4.5×2139-6×4.52=-6.3617.5≈-0.36, ∴a ^=z -b ^x =2+0.36×4.5=3.62, ∴z 与x 的线性回归方程是z ^=-0.36x +3.62, 又z =ln y ,∴y 关于x 的回归方程是y ^=e -0.36x +3.62. 令x =9,得y ^=e -0.36×9+3.62=e 0.38, ∵ln 1.46≈0.38,∴y ^≈1.46.即预测当某辆A 型号二手车使用年数为9年时售价约为1.46万元. (3)当y ^≥0.711 8,即e -0.36x +3.62≥0.711 8=e ln 0.711 8≈e -0.34时, 则有-0.36x +3.62≥-0.34,解得x ≤11,因此,预测在收购该型号二手车时车辆的使用年数不得超过11年.非线性回归方程的求法(1)根据原始数据作出散点图. (2)根据散点图,选择恰当的拟合函数.(3)作恰当变换,将其转化成线性函数,求线性回归方程. (4)在(3)的基础上通过相应变换,即可得非线性回归方程.某公司为确定下一年度投入某种产品的宣传费,需了解年宣传费x (单位:千元)对年销售量y (单位:t)和年利润z (单位:千元)的影响,于是对近8年的年宣传费x i 和年销售量y i (i =1,2,…,8)的数据进行了初步处理,得到如图所示的散点图及一些统计量的值.x y wi =18(x i -x )2i =18(w i -w )2i =18(x i -x )·(y i -y )i =18(w i -w )·(y i -y ) 46.6 563 6.8 289.8 1.6 1469108.8注:表中w i =x i ,w =18 i =18w i .(1)根据散点图判断,y ^=a ^+b ^x 与y ^=c ^+d ^x 哪一个适宜作为年销售量y 关于年宣传费x 的回归方程模型?(给出判断即可,不必说明理由)(2)根据(1)的判断结果及表中数据,建立y 关于x 的回归方程;(3)已知这种产品的年利润z 与x ,y 之间的关系为z ^=0.2y -x ,根据(2)的结果回答下列问题.①当年宣传费x =49时,年销售量及年利润的预报值是多少? ②年宣传费x 为何值时,年利润的预报值最大?解(1)由散点图可以判断,y ^=c ^+d ^x 适宜作为年销售量y 关于年宣传费x 的回归方程模型.(2)令w =x ,先建立y 关于w 的线性回归方程.由于d ^=i =18(w i -w )(y i -y )i =18(w i -w )2=108.81.6=68,c ^=y -d ^w =563-68×6.8=100.6,所以y 关于w 的线性回归方程为y ^=100.6+68w , 因此y 关于x 的回归方程为y ^=100.6+68x . (3)①由(2)知,当x =49时,年销售量y 的预报值为 y ^=100.6+6849=576.6,年利润z 的预报值为z ^=576.6×0.2-49=66.32.②根据(2)的结果知,年利润z 的预报值z ^=0.2×(100.6+68x )-x =-x +13.6x +20.12,所以当x =13.62=6.8,即x =46.24时,z ^取得最大值.故年宣传费为46.24千元时,年利润的预报值最大.。

高考数学二轮复习考点题型专题讲解与练习31 线性和非线性回归7种题型归纳

高考数学二轮复习考点题型专题讲解与练习31 线性和非线性回归7种题型归纳

高考数学二轮复习考点题型专题讲解与练习第31讲线性和非线性回归7类【题型一】 线性回归【典例分析】如图是某地2014年至2020年生活垃圾无害化处理量(单位:万吨)的折线图.注:年份代码1~7分别对应年份2014~2020.(1)由折线图看出,可用线性回归模型拟合y 与t 的关系,请用相关系数加以证明; (2)建立y 关于t 的回归方程(系数精确到0.01),预测2022年某地生活垃圾无害化处理量. 附注:参考数据:719.32i i y ==∑,7140.17i i i t y ==∑0.55= 2.646.参考公式:相关系数()()nii tty y r --=∑ˆˆˆya bt =+中斜率和截距的最小二乘法估计公式分别为()()()121ˆniii ni i t t y y bt t ==--=-∑∑,ˆˆay bt =-.【变式演练】1.2020年全面建成小康社会取得伟大历史成就,决战脱贫攻坚取得决定性胜利.某市积极探索区域特色经济,引导商家利用多媒体的优势,对本地特产进行广告宣传,取得了社会效益和经济效益的双丰收,某商家统计了7个月的月广告投入x (单位:万元)与月销量y (单位:万件)的数据如表所示:(1)已知可用线性回归模型拟合y 与x 的关系,请用相关系数加以说明,并求y 关于x 的线性回归方程;(2)根据(1)的结论,预计月广告投入大于多少万元时,月销量能突破70万件. 参考数据:()()71150i i i x x y y =--=∑,()721820i i y y=-=∑37.88.参考公式:相关系数()()niix x y y r --∑回归直线y bx a =+$$$的斜率和截距的最小二乘估计分别为()()()121niii nii x x yyb x x ==--=-∑∑,a y bx =-$$.2.根据国际疫情形势以及传染病防控的经验,加快新冠病毒疫苗接种是当前有力的防控手段,我国正在安全、有序加快推进疫苗接种工作,某乡村采取通知公告、微信推送、广播播放、条幅宣传等形式,积极开展疫苗接种社会宣传工作,消除群众疑虑,提高新冠疫苗接种率,让群众充分地认识到了疫苗接种的重要作用,自宣传开始后村干部统计了本村200名居民(未接种)5天内每天新接种疫苗的情况,得如下统计表:(1)建立y 关于x 的线性回归方程;(2)预测该村80%居民接种新冠疫苗需要几天?参考公式:回归方程y bx a =+$$$中斜率和截距的最小二乘估计公式分别为: 1221ni ii nii x y nx yb xnx==-=-∑∑,a y bx =-.【题型二】 残差【典例分析】2018年9月17日,世界公众科学素质促进大会在北京召开,国家主席习近平向大会致贺信中指出,科学技术是第一生产力,创新是引领发展的第一动力某企业积极响应国家“科技创新”的号召,大力研发新产品,为了对新研发的一批产品进行合理定价,将该产品按事先拟定的价格进行试销,得到一组销售数据{xi ,yi )(i =1,2,3,4,5,6),如表(1)求出p 的值;(2)已知变量x ,y 具有线性相关关系,求产品销量y (件)关于试销单价:x (百元)的线性国归方程y bx a =+$$$(计算结果精确到整数位); (3)用表示用正确的线性回归方程得到的与x 对应的产品销的估计值当销售数据(xi ,yi )的残差的绝对值|yi ﹣y |<1时,则将销售数据称为一个“有效数据”现从这6组销售数中任取2组,求抽取的2组销售数据都是“有效数据”的概率.参考公式及数据611 6i y ==∑yi =80,61i i i x y ==∑1606,621 i i x ==∑91,()()()1122211n niii ii i nniii i x x y y x y nxy b x x x nx====---==--∑∑∑∑,a y bx =-.【变式演练】1.“大众创业,万众创新”是李克强总理在本届政府工作报告中向全国人民发出的口号.某生产企业积极响应号召,大力研发新产品.为了对新研发的一批产品进行合理定价,将该产品按事先拟定的价格进行试销,得到一组销售数据(,)(1,2,,6)i i x y i =,如下表所示:已知611806i i y y ===∑.(1)求出q 的值;(2)已知变量x ,y 具有线性相关关系,求产品销量y (件)关于试销单价x (元)的线性回归方程ˆˆˆybx a =+;(3)用ˆi y表示用正确的线性回归方程得到的与i x 对应的产品销量的估计值.当销售数据(,)i i x y 的残差的绝对值ˆ||1i i y y -≤时,则将销售数据(,)i i x y 称为一个“好数据”.现从6个销售数据中任取2个,求抽取的2个销售数据中至少有1个是“好数据”的概率.2..医学中判断男生的体重是否超标有一种简易方法,就是用一个人身高的厘米数减去105所得差值即为该人的标准体重.比如身高175cm 的人,其标准体重为175-105=70公斤,一个人实际体重超过了标准体重,我们就说该人体重超标了.已知某班共有30名男生,从这30名男生中随机选取6名,其身高和体重的数据如表所示:(1)从这6人中任选2人,求恰有1人体重超标的概率;(2)依据上述表格信息,用最小二乘法求出了体重y 对身高x 的线性回归方程:0.65y x a =+,但在用回归方程预报其他同学的体重时,预报值与实际值吻合不好,需要对上述数据进行残差分析.按经验,对残差在区间[]3.5,3.5-之外的同学要重新采集数据.问上述随机抽取的编号为3,4,5,6的四人中,有哪几位同学要重新采集数据? 参考公式:残差i i i e y bx a =--.【题型三】 剔除数据重新计算【典例分析】习近平总书记在党的十九大报告中指出,要在“幼有所育、学有所教、劳有所得、病有所医、老有所养、住有所居、弱有所扶”上不断取得新进展,保证全体人民在共建共享发展中有更多获得感.现S 市政府针对全市10所由市财政投资建设的敬老院进行了满意度测评,得到数据如下表:(1)求投资额y 关于满意度x 的相关系数;(2)我们约定:投资额y 关于满意度x 的相关系数r的绝对值在0.75以上(含0.75)是线性相关性较强,否则,线性相关性较弱.如果没有达到较强线性相关,则采取“末位淘汰”制(即满意度最低的敬老院市财政不再继续投资,改为区财政投资).求在剔除“末位淘汰”的敬老院后投资额y 关于满意度x 的线性回归方程(系数精确到0.1) 参考数据:21.9,72.1x y ==,1022110288.9=-=∑ii x x 37.16≈,10110452.1i i i x y x y =-⋅=∑,17≈.附:对于一组数据()()()1122,,,,,,n n x y x y x y ⋅⋅⋅,其回归直线ˆˆˆybx a =+的斜率和截距的最小二乘估计公式分别为:1221ˆˆˆ,ni ii nii x y nx ybay bx xnx==-⋅==--∑∑.线性相关系数ni ix y nx yr -⋅∑专题18 概率与统计综合-2020年高考数学(文)母题题源解密(全国Ⅱ专版)【变式演练】1.BMI 指数是用体重公斤数除以身高米数的平方得出的数值,是国际上常用的衡量人体胖瘦程度以及是否健康的一个标准.对于高中男体育特长生而言,当BMI 数值大于或等于20.5时,我们说体重较重,当BMI 数值小于20.5时,我们说体重较轻,身高大于或等于170cm 时,我们说身高较高,身高小于170cm 时,我们说身高较矮.某中小学生成长与发展机构从某市的320名高中男体育特长生中随机选取8名,其身高和体重的数据如表所示:(1)根据最小二乘法的思想与公式求得线性回归方程ˆ0.875.9yx =-.利用已经求得的线性回归方程,请完善下列残差表,并求解释变量(身高)对于预报变量(体重)变化的贡献值2R (保留两位有效数字);(2)通过残差分析,对于残差的最大(绝对值)的那组数据,需要确认在样本点的采集中是否有人为的错误.已知通过重新采集发现,该组数据的体重应该为58(kg ).请重新根据最小二乘法的思想与公式,求出男体育特长生的身高与体重的线性回归方程.参考公式: ()()()()221112222111ˆ1.()ˆnnniiiii ii i i nnniiii i i y yx x yy x ynxy R y y x x n bxx ======----=-==---∑∑∑∑∑∑,ˆˆa y bx =-.ˆˆˆi i ie y bx a =--. 参考数据:8178880i i i x y ==∑,821226112ii x ==∑,168x =,58.5y =,()821226i i y y =-=∑.河北省石家庄市第二中学(南校区)2019-2020学年高三下学期教学质量检测模拟数学(理)试题2.某手机公司生产某款手机,如果年返修率不超过千分之一,则生产部门当年考核优秀,现获得该公司2010-2018年的相关数据如下表所示:(1)(理)专题1.5 概率与统计-回归分析、独立性检验-2021年高考数学解答题挑战满分专项训练(新高考地区专用)从该公司2010-2018年的相关数据中任意选取3年的数据,以X 表示3年中生产部门获得考核优秀的次数,求X 的分布列和数学期望;(2)根据散点图发现2015年数据偏差较大,如果去掉该年的数据,试用剩下的数据求出年利润y (千万元)关于年生产量x (万台)的线性回归方程(精确到0.01).部分计算结果:911 6.29i i y y ===∑,921509ii x==∑,91434.1i i i x y ==∑.附:()()=年返修量台年返修率年生产量台;线性回归方程y bx a =+$$$中,()()()1122211n niii i i i nniii i x x y y x y nx yb x x xnx====---==--∑∑∑∑,a y bx =-.【题型四】 非线性回归1:指数型【典例分析】从集市上买回来的蔬菜仍存有残留农药,食用时需要清洗数次,统计表中的x 表示清洗的次数,y 表示清洗x 次后1千克该蔬菜残留的农药量(单位:微克).(1)在如图的坐标系中,描出散点图,并根据散点图判断,y bx a =+$$$与ˆˆˆx yme n -=+哪一个适宜作为清洗x 次后1千克该蔬菜残留的农药量的回归方程类型;(给出判断即可,不必说明理由)(2)根据判断及下面表格中的数据,建立y 关于x 的回归方程; 表中ix i eω-=,5115i i ωω==∑.(3)对所求的回归方程进行残差分析.附:①线性回归方程y bx a =+$$$中系数计算公式分别为121()()()ˆniii ni i x x y y bx x ==--=-∑∑,a y bx =-$$;②22121()1()nii i n ii yy R yy ==-=--∑∑,20.95R >说明模拟效果非常好;③10.37e ≈,210.14e ≈,310.05e ≈,410.02e ≈,510.01e≈.【变式演练】1.为了研究一种昆虫的产卵数y 和温度x 是否有关,现收集了7组观测数据列于下表中,并做出了散点图,发现样本点并没有分布在某个带状区域内,两个变量并不呈现线性相关关系,现分别用模型①212y C x C =+与模型;②34C x C y e +=作为产卵数y 和温度x 的回归方程来建立两个变量之间的关系.其中2i i t x =,7117i i t t ==∑,ln i iz y =,7117i i z z ==∑. 附:对于一组数据()()()1122,,,,,n n μνμνμν,其回归直线νβμα=+的斜率和截距的最小二乘估计分别为:()()()121n i iin i iμμννμβμ==---=∑∑,ανβμ=-.(1)根据表中数据,模型①、②的相关指数计算分别为210.82R =,220.96R =,请根据相关指数判断哪个模型的拟合效果更好.(2)根据(1)中的判断,在拟合效果更好的模型下求y 关于x 的回归方程;并估计温度为30℃时的产卵数.(1C ,2C ,3C ,4C 与估计值均精确到小数点后两位) (参考数据: 4.6518e 04.5≈, 4.8514e 27.7≈, 5.0512e 56.0≈)2.近年来,由于耕地面积的紧张,化肥的施用量呈增加趋势.一方面,化肥的施用对粮食增产增收起到了关键作用,另一方面,也成为环境污染、空气污染、土壤污染的重要来源之一如何合理地施用化肥,使其最大程度地促进粮食增产,减少对周围环境的污染成为需要解决的重要问题研究粮食产量与化肥施用量的关系,成为解决上述问题的前提某研究团队收集了10组化肥施用量和粮食亩产量的数据并对这些数据作了初步处理,得到了如图所示的散点图及一些统计量的值化肥施用量为x (单位:公斤),粮食亩产量为y (单位:百公斤).参考数据:表中ln ,ln (1,2,,10)i i i i t x z y i ===.(1)根据散点图判断,y a bx =+与d y cx =,哪一个适宜作为粮食亩产量y 关于化肥施用量x 的回归方程类型(给出判断即可,不必说明理由);(2)根据(1)的判断结果及表中数据,建立y 关于x 的回归方程;(3)根据(2)的回归方程,并预测化肥施用量为27公斤时,粮食亩产量y 的值; 附:①对于一组数据(),(1,2,3,,)i i u v i n =,其回归直线ˆˆˆv u βα=+的斜率和截距的最小二乘估计分别为1221,ˆˆˆni i i ni i u v nuvav u unu ββ==-==--∑∑;②取 2.7e ≈.【题型五】 非线性回归2:反比例型【典例分析】为帮助乡村脱贫,某勘探队计划了解当地矿脉某金属的分布情况,测得了平均金属含量y (单位:3g/m )与样本对原点的距离x (单位:m )的数据,并作了初步处理,得到了下面的一些统计量的值.(表中1i i u x =,9119i i u u ==∑).(1)利用样本相关系数的知识,判断y a bx =+与dy c x=+哪一个更适宜作为平均金属含量y 关于样本对原点的距离x 的回归方程类型? (2)根据(1)的结果回答下列问题: (i )建立y 关于x 的回归方程;(ii )样本对原点的距离20x =时,金属含量的预报值是多少?(iii )已知该金属在距离原点m x 时的平均开采成本W (单位:元)与x ,y 关系为()1000ln W y x =-()1100x ≤≤,根据(2)的结果回答,x 为何值时,开采成本最大?附:对于一组数据()()()1122,,,,,,n n t s t s t s ⋅⋅⋅,其线性相关系数()()niit t s s r --=∑,其回归直线s t αβ=+的斜率和截距的最小二乘估计分别为:()()()121ˆnii i nii tts s ttβ==--=-∑∑,ˆˆs t αβ=-.【变式演练】1.近年来,政府相关部门引导乡村发展旅游的同时,鼓励农户建设温室大棚种植高品质农作物.为了解某农作物的大棚种植面积对种植管理成本的影响,甲,乙两同学一起收集6家农户的数据,进行回归分析,得到两个回归摸型:模型①:(1) 1.6285ˆ5.7yx =-+,模型②: (2)26.6 3.ˆ7150y x=+,对以上两个回归方程进行残差分析,得到下表:(1)将以上表格补充完整,并根据残差平方和判断哪个模型拟合效果更好;(2)视残差i e 的绝对值超过1.5的数据视为异常数据,针对(1)中拟合效果较好的模型,剔除异常数据后,重新求回归方程.附:()()()121nii i nii xx y yb x x ==--=-∑∑, a y bx =-$$;222220.270.380.97 1.020.28 2.277++++=2.我国为全面建设社会主义现代化国家,制定了从2021年到2025年的“十四五”规划.某企业为响应国家号召,汇聚科研力量,加强科技创新,准备增加研发资金.现该企业为了了解年研发资金投入额x (单位:亿元)对年盈利额y (单位:亿元)的影响,研究了“十二五”和“十三五”规划发展期间近10年年研发资金投入额i x 和年盈利额i y 的数据.通过对比分析,建立了两个函数模型:①y a bx =+;②dy c x=+,若对于任意一点(,)(12......)i i i P x y i n =,,,过点i P 作与x 轴垂直的直线,交函数y a bx =+的图象于点(',')i i i A x y ,交函数dy c x =+的图象于点('','')i i i B x y ,定义:11'ni i i Q y y ==-∑,21''ni i i Q y y ==-∑,若12Q Q <则用函数y a bx =+来拟合y 与x 之间的关系更合适,否则用函数dy c x=+来拟合y 与x 之间的关系.(1)给定一组变量123456(1,4),(2,5),(3,6),(4,6.5),(5,7),(6,8)P P P P P P ,对于函数23x y +=与函数52x y x-=,试利用定义求1Q ,2Q 的值,并判断哪一个更适合作为点(,)(1,2,......6)i i i P x y i =中的y 与x 之间的拟合函数;(2)若一组变量的散点图符合dy c x=+图象,试利用下表中的有关数据与公式求y 与x 的回归方程,并预测当=10x 时,y 的值为多少.表中的1=x ω,811=8i i ωω=∑附:对于一组数据11(,)u v ,22(,)u v ,⋅⋅⋅(,)n n u v ,其回归直线方程v u αβ=+的斜率和截距的最小二乘估计分别为121()()=()niii nii u u v v u u β==---∑∑,v u αβ=-【题型六】 非线性回归3:对数型【典例分析】某投资公司2012年至2021年每年的投资金额x (单位:万元)与年利润增量y (单位:万元)的散点图如图:该投资公司为了预测2022年投资金额为20万元时的年利润增量,建立了y 关于x 的两个回归模型;模型①:由最小二乘公式可求得y 与x 的线性回归方程: 2.5020ˆ.5yx =-;模型②:由图中样本点的分布,可以认为样本点集中在由线:ln y b x a =+的附近,对投资金额x 做换元,令ln t x =,则y b t a =⋅+,且有101010102111122.00,230,569.00,50.92i i i i i i i i i t y t y t ========∑∑∑∑,(1)根据所给的统计量,求模型②中y 关于x 的回归方程;(2)分别利用这两个回归模型,预测投资金额为20万元时的年利润增量(结果保留两位小数);附:样本()()1,1,2,,i t y i n =⋯的最小乘估计公式为()()()121ˆˆˆ,niii ni i t t y y bay bt t t ==--==--∑∑;参考数据:ln20.6931,ln5 1.6094≈≈.【变式演练】1.有一种速度叫中国速度,有一种骄傲叫中国高铁.中国高铁经过十几年的发展,取得了举世瞩目的成就,使我国完成了从较落后向先进铁路国的跨越式转变.中国的高铁技术不但越来越成熟,而且还走向国外,帮助不少国家修建了高铁.高铁可以说是中国一张行走的名片.截至到2020年,中国高铁运营里程已经达到3.9万公里.下表是2013年至2020年中国高铁每年的运营里程统计表,它反映了中国高铁近几年的飞速发展:根据以上数据,回答下面问题.(1)甲同学用曲线y =bx +a 来拟合,并算得相关系数r 1=0.97,乙同学用曲线y =cedx 来拟合,并算得转化为线性回归方程所对应的相关系数r 2=0.99,试问哪一个更适合作为y 关于x 的回归方程类型,并说明理由;(2)根据(1)的判断结果及表中数据,求y 关于x 的回归方程(系数精确到0.01).参考公式:用最小二乘法求线性回归方程的系数公式:121()()ˆˆ,()niii nii x x y y ba y bxx x ==--==--∑∑;参考数据:882112.48,()()15.50,()42.00,i i i i i y x x y y x x ===--=-=∑∑令()()()8820.1411ln ,0.84, 6.50, 1.01, 1.15.i i i i i w y w x x w w w w e ====--=-==∑∑2.某电器企业统计了近10年的年利润额y (千万元)与投入的年广告费用x (十万元)的相关数据,散点图如图,对数据作出如下处理:令ln i i u x =,ln i i v y =,得到相关数据如表所示:(1)从①y bx a =+;②()0,0ky m x m k =⋅>>;③2y cx dx e =++三个函数中选择一个作为年广告费用x 和年利润额y 的回归类型,判断哪个类型符合,不必说明理由; (2)根据(1)中选择的回归类型,求出y 与x 的回归方程;(3)预计要使年利润额突破1亿,下一年应至少投入多少广告费用?(结果保留到万元) 参考数据:3103.67883.678849.787e≈≈, 参考公式:回归方程ˆˆˆv bu a =+中斜率和截距的最小二乘估计公式分别为1221ˆni i i ni i u v nxybunu==-=-∑∑【题型七】 非线性回归4:其他函数型【典例分析】光伏发电是利用太阳能电池及相关设备将太阳光能直接转化为电能.近几年在国内出台的光伏发电补贴政策的引导下,某地光伏发电装机量急剧上涨,如下表:某位同学分别用两种模型:①2y bx a =+,②y dx c =+进行拟合,得到相应的回归方程并进行残差分析,残差图如下(注:残差等于i i y y -):经过计算得()()8172.8i i i x x y y =--=∑,()82142i i x x=-=∑,()()81686.8i ii t ty y =--=∑,()8213570i i t t =-=∑,其中2i it x =,8118i i t t ==∑.(1)根据残差图,比较模型①,②的拟合效果,应该选择哪个模型?并简要说明理由.(2)根据(1)的判断结果及表中数据建立y 关于x 的回归方程,并预测该地区2020年新增光伏装机量是多少.(在计算回归系数时精确到0.01)附:回归直线的斜率和截距的最小二乘估计公式分别为:()()()121nii i nii xx y yb xx==--=-∑∑,a y bx =-$$.【变式演练】1.2021年11月4日,第四届中国国际进口博览会在上海开幕,共计2900多家参展商参展,420多项新产品,新技术,新服务在本届进博会上亮相.某投资公司现从中选出20种新产品进行投资.为给下一年度投资提供决策依据,需了解年研发经费对年销售额的影响,该公司甲、乙两部门分别从这20种新产品中随机地选取10种产品,每种产品被甲、乙两部门是否选中相互独立.(1)求20种新产品中产品A 被甲部门或乙部门选中的概率;(2)甲部门对选取的10种产品的年研发经费i x (单位:万元)和年销售额()1,2,,10i y i =(单位:十万元)数据作了初步处理,得到下面的散点图及一些统计量的值.根据散点图现拟定y 关于x 的回归方程为()23y b x a =-+.求a 、b 的值(结果精确到0.1);(3)甲、乙两部门同时选中了新产品A ,现用掷骰子的方式确定投资金额.若每次掷骰子点数大于2,则甲部门增加投资1万元,乙部门不增加投资;若点数小于3,则乙部门增加投资2万元,甲部门不增加投资,求两部门投资资金总和恰好为100万元的概率.附:对于一组数据()11,vu 、()22,v u 、L 、(),n n v u ,其回归直线u v αβ=+的斜率和截距的最小二乘估计分别为()()()121niii ni i v v u u v vβ==--=-∑∑,µµu v αβ=-,20162057.529877320520.5277-⨯=-⨯,2016657.51019877365 6.55567-⨯=-⨯.2.某公司为确定下一年度投入某种产品的宣传费,需了解年宣传费x (单位:千元)对年销售量y (单位:吨)的影响,对近8年的年宣传费i x 和年销售量i y ()1,2,3,,8i =数据作了初步处理,得到下面的散点图及一些统计量的值.表中:1w =8118i i w w ==∑(1)根据散点图判断,y a bx =+与y c =+y 关于年宣传费x 的回归方程类型(给出判断即可,不必说明理由);(2)根据(1)的判断结果及表中数据,建立y 关于x 的回归方程;(3)根据(2)中的回归方程,求当年宣传费36x =千元时,年销售预报值是多少?附:对于一组数据()11,u v ,()22,u v ,…,(),n n u v ,其回归线v u αβ=+的斜率和截距的最小二乘估计分别为:()()()81821iii ii u u v v u u β==--=-∑∑,v u αβ=-.【课后练习】1.某课外活动兴趣小组为了解某种植物的生长情况,收集了该种植物月生长量()cm y 与月平均气温x (℃)的6组数据.(1)请根据上面的数据求y 关于x 的线性回归方程(结果保留1位小数);(2)利用(1)中求出的线性回归方程进行残差分析.若用ˆˆˆy bx a =+中的ˆy 估计回归方程y bx a e =++中的bx a +,由于随机误差()e y bx a =-+,所以ˆˆey y =-是e 的估计值,ˆi e 为相应点(),i i x y 的残差.请填写下面的残差表,并绘制残差图,根据得到的残差图,分析该回归方程的拟合效果. 残差表:残差图:参考数据:61105i i x ==∑,6144i i y ==∑,61815i i i x y ==∑,()621375i i x x=-=∑..参考公式:线性回归方程ˆˆˆybx a =+中,()121ˆni ii nii x y nxyb x x ==-=-∑∑,ˆˆay bx =-.2.某新兴环保公司为了确定新开发的产品下一季度的营销计划,需了解月宣传费x (单位:千元)对月销售量y (单位:t )和月利润z (单位:千元)的影响,收集了2019年12月至2020年5月共6个月的月宣传费i x 和月销售量i y (1,2,,6i =⋯)的数据如下表:现分别用两种模型①y bx a =+,②bx y ae =分别进行拟合,得到相应的回归方程并进行残差分析,得到如图所示的残差图及一些统计量的值:(注残差在数理统计中是指实际观察值与估计值(拟合值)之间的差.)(1)根据残差图,比较模型①,②的拟合效果,应选择哪个模型?并说明理由;(2)残差绝对值大于2的数据被认为是异常数据,需要剔除,剔除异常数据后求出(1)中所选模型的回归方程;(3)已知该产品的月利润z 与x ,y 的关系为()2253z y x =-,根据(2)的结果回答下列问题: (i )若月宣传费15x =时,该模型下月销售量y 的预报值为多少? (ii )当月宣传费x 为何值时,月利润z 的预报值最大?附:对于一组数据()11,x y ,()22,x y ,…,(),n n x y ,其回归直线y bx a =+$$$的斜率和截距的最小二乘估计分别为()()()1122211nniii ii i nn i i ii x x y y x y nx yb x nx x x ====---==--∑∑∑∑$,a y bx =-$$3.(衡水金卷高三一轮复习摸底测试卷数学(三))千百年来,人们一直在通过不同的方式传递信息.在古代,烽火狼烟、飞鸽传书、快马驿站等通信方式被人们广泛应用;第二次工业革命后,科技的进步带动了电讯事业的发展,电报电话的发明让通信领域发生了翻天覆地的变化;之后,计算机和互联网的出现则使得“千里眼”“顺风耳”变为现实.现在,5G 的到来给人们的生活带来颠覆性的变革,某科技创新公司基于领先技术的支持,5G 经济收入在短期内逐月攀升,该创新公司在第1月份至6月份的5G 经济收入y (单位:百万元)关于月份x 的数据如表:根据以上数据绘制散点图,如图.(1)根据散点图判断,y ax b =+与,,,(dx y ce a b c d =均为常数)哪一个适宜作为5G 经济收入y 关于月份x 的回归方程类型?(给出判断即可,不必说明理由)(2)根据(1)的结果及表中的数据,求出y 关于x 的回归方程,并预测该公司8月份的5G 经济收入; (3)从前6个月的收入中抽取3个﹐记月收入超过16百万的个数为X ,求X 的分布列和数学期望. 参考数据:其中设()ln ,ln 1,2,3,4,5,6i i u y u y i ===参考公式和数据:对于一组具有线性相关关系的数据()()1,2,,3,,i i x v i n =⋯,其回归直线v x βα=+的斜率和截距的最小二乘估计公式分别为:()()()121ˆniii nii x x v v x x β==--=-∑∑,4.56 4.58,95.58,97.51.a v x e e β=-≈≈4.某保险公司根据官方公布的历年营业收入,制成表格如下: 表1由表1,得到下面的散点图:根据已有的函数知识,某同学选用二次函数模型2y bx a =+(b 和a 是待定参数)来拟合y 和x 的关系.这时,可以对年份序号做变换,即令2t x =,得y bt a =+,由表1可得变换后的数据见表2. 表2(1)根据表中数据,建立y 关于t 的回归方程(系数精确到个位数);(2)根据(1)中得到的回归方程估计2021年的营业收入,以及营业收入首次超过4000亿元的年份.附:对于一组数据()()()1122,,,,,,n n u v u v u v ,其回归直线ˆˆv u βα=+的斜率和截距的最小二乘估计分别为()()()121ˆ niii nii u u v v u u β==--=-∑∑,ˆˆv u αβ=-. 参考数据:()()()10102451138.5,703.45, 1.05110, 2.32710i i ii i t y t tt ty y ===≈-≈⨯--≈⨯∑∑.5.自从新型冠状病毒爆发以来,美国疫情持续升级,以下是美国2020年4月9日-12月14日每隔25天统计1次共计11次累计确诊人数(万).(1)将4月9日作为第1次统计,若将统计时间序号作为变量x ,每次累计确诊人数作为变量x ,得到函数关系()0,0bxy aea b =>>,对上表的数据作初步处理,得到部分数据已作近似处理的一些统计量的值6x =,603.09y =,1111ln 5.9811i i y ==∑,()()11115835.70i i i x y x y =--=∑,()1121110i i x x=-=∑,()1121ln ln 11.90ii y y =-=∑,()()111ln ln 35.10i i i x x y y =--=∑, 4.0657.97e ≈, 4.0758.56e ≈, 4.0859.15e ≈,根据相关数据,确定该函数关系式(参数a ,b 的取值精确到0.01);(2)为了了解患新冠肺炎与年龄的关系,已知某地曾患新冠肺炎的老年、中年、青年的人数分别为45人,30人,15人,按分层抽样的方法随机抽取6人进行问卷调查,再从6人中随机抽取2人进行调查结果对比,求这2人中至少有一人是老年人的概率.参考公式:线性回归方程y bx a =+$$$中,()()()121niii nii x x y y b x x ==--=-∑∑,a y bx =-$$;6.2020年新型冠状病毒肺炎疫情席卷金球,我国在全力保障口罩、防护服等医疗物资供给基础上,重点开展医疗救治急需的呼吸机、心电监护仪等医疗设备的组织生产和及时供应,统筹协调医用物资生产企业高速生产,支援世界各国抗击肺炎疫情.我市某医疗器械公司转型升级,从9月1日开始投入呼吸机生产,该公司9月1目~9月9日连续9天的呼吸机日生产量为i y (单位:百台.., ),数据作了初步处理;得到如图所示的散点图.注:图中日期代码1~9分别对应9月1日~9月9日;表中,(1)从9个样本点中任意选取2个,在2个样本点的生产量都不高于300台的条件下,求2个样本点都高于200台的概率;(2)由散点图分析,样本点都集中在曲线的附近,求y关于t的方程,并估计该公司从生产之日起,需要多少天呼吸机日生产量可超过500台.参考公式:回归直线方程是;,,参考数据:.7.(四川省成都市郫都区高三上学期阶段性检测(二)文科数学试题)某公司对某产品作市场调研,获得了该产品的定价x(单位:万元/吨)和一天销售量y(单位:吨)的一组数据,制作了如下的数据统计表,并作出了散点图.。

高考数学一轮复习专题06 非线性回归方程(原卷版)

高考数学一轮复习专题06 非线性回归方程(原卷版)

概率与统计 专题六:非线性回归方程一、知识储备当经验回归方程并非形如y bx a =+(,a b R ∈)时,称之为非线性经验回归方程,当两个变量不呈线性相关关系时,依据样本点的分布选择合适的曲线方程来模拟,常见的非线性经验回归方程的转换方式总结如下:建立非线性经验回归模型的基本步骤1.确定研究对象,明确哪个是解释变量,哪个是响应变量;2.由经验确定非线性经验回归方程的模型;3.通过变换(一般题目都有明显的暗示如何换元,换元成什么变量),将非线性经验回归模型转化为线性经验回归模型(特别注意:使用线性回归方程的公式,注意代入变换后的变量);4.按照公式计算经验回归方程中的参数,得到经验回归方程;5.消去新元,得到非线性经验回归方程;6.得出结果后分析残差图是否有异常 . 二、例题讲解1.(2022·全国高三专题练习(文))人类已经进入大数据时代.目前,数据量级已经从TB (1TB =1024GB )级别跃升到PB (1PB =1024TB ),EB (1EB =1024PB )乃至ZB (1ZB =1024EB )级别.国际数据公司(IDC )研究结果表明,2008年全球产生的数据量为0.49ZB ,2009年数据量为0.8ZB ,2010年增长到1.2ZB ,2011年数据量更是高达1.82ZB .下表是国际数据公司(IDC )研究的全球近6年每年产生的数据量(单位:ZB )及相关统计量的值:表中ln i i z y =,6116i i z z ==∑. (1)根据上表数据信息判断,方程21c xy c e =⋅(e 是自然对数的底数)更适宜作为该公司统计的年数据量y 关于年份序号x 的回归方程类型,试求此回归方程(2c 精确到0.01).(2)有人预计2022年全世界产生的数据规模将超过2011年的50倍.根据(1)中的回归方程,说明这种判断是否准确,并说明理由.参考数据: 4.5695.58e ≈, 4.5897.51e ≈,回归方程y a bx =+中,斜率最小二乘法公式为()()()1122211n niii ii i nniij i x x y y x y nxyb x x xnx====---==--∑∑∑∑,a y bx =-.2.(2022·全国高三专题练习(文))有一种速度叫中国速度,有一种骄傲叫中国高铁.中国高铁经过十几年的发展,取得了举世瞩目的成就,使我国完成了从较落后向先进铁路国的跨越式转变.中国的高铁技术不但越来越成熟,而且还走向国外,帮助不少国家修建了高铁.高铁可以说是中国一张行走的名片.截至到2021年,中国高铁运营里程已经达到3.9万公里.下表是2013年至2021年中国高铁每年的运营里程统计表,它反映了中国高铁近几年的飞速发展:根据以上数据,回答下面问题.(1)甲同学用曲线y bx a =+来拟合,并算得相关系数10.97r =,乙同学用曲线dxy ce =来拟合,并算得转化为线性回归方程所对应的相关系数10.99r =,试问哪一个更适合作为y 关于x 的回归方程类型,并说明理由;(2)根据(1)的判断结果及表中数据,求y 关于y 的回归方程(系数精确到0.01).参考公式:用最小二乘法求线性回归方程的系数公式:121()()ˆˆ,()niii nii x x y y ba y bxx x ==--==--∑∑;参考数据:882112.48,()()15.50,()42.00,i i i i i y x x y y x x ===--=-=∑∑令()()()8820.1411ln ,0.84, 6.50, 1.01, 1.15.i i i i i w y w x x w w w w e ====--=-==∑∑三、实战练习1.(2022·山东菏泽·高三二模)“十四五”是我国全面建成小康社会、实现第一个百年奋斗目标之后,乘势而上开启全面建设社会主现代化国家新征程、向第二个百年奋斗目标进军的第一个五年,实施时间为2022年到2025年.某企业为响应国家号召,汇聚科研力量,加强科技创新,准备加大研发资金投入,为了解年研发资金投入额x (单位:亿元)对年盈利额y (单位:亿元)的影响,通过对“十二五”和“十三五”规划发展10年期间年研发资金投入额i x 和年盈利额i y ()1,2,,10i =数据进行分析,建立了两个函数模型:2y x αβ=+;e x t y λ+=,其中α,β ,λ,t 均为常数,e 为自然对数的底数令2,ln i ii i u x v y ==()1,2,,10i =,经计算得如下数据:26x =,215y =,680u =, 5.36v =,()2101100i i x x=-=∑,()102122500ii u u =-=∑,()()101260i ii u uy y =--=∑,()21014ii y y =-=∑,()21014i i v v=-=∑,()()10118i i i x x v v =--=∑,问:(1)请从相关系数的角度,分析哪一个模型拟合度更好?(2)根据(1)的选择及表中数据,建立,y 关于x 的回归方程(系数精确到0.01)(3)若希望2022年盈利额y 为500亿元,请预测2022年的研发资金投入额x 为多少亿元?(结果精确到0.01)附:①相关系数r()()niix x yy --∑回归直线y bx a =+中:121()()()niii nii x x yy b x x ==--=-∑∑,a y bx =-参考数据:ln 20.693=,ln5 1.609=.2.(2022·重庆高三三模)近几年,快递业的迅速发展导致行业内竞争日趋激烈.某快递网点需了解一天中收发一件快递的平均成本y (单位:元)与当天揽收的快递件数x (单位:千件)之间的关系,对该网点近5天的每日揽件量i x (单位:千件)与当日收发一件快递的平均成本i y (单位;元)(i =1,2,3,4,5)数据进行了初步处理,得到下面的散点图及一些统计量的值.表中i i w x =,5115i i w w ==∑. (1)根据散点图判断,y a bx =+与dy c x=+哪一个适宜作为y 关于x 的回归方程类型?并根据判断结果及表中数据求出y 关于x 的回归方程;(2)各快递业为提高快递揽收量并实现总利润的增长,除了提升服务质量、提高时效保障外,价格优惠也是重要策略之一.已知该网点每天揽收快递的件数x (单位:千件)与单件快递的平均价格t (单位;元)之间的关系是()252512x t t =-≤≤,收发一件快递的利润等于单件的平均价格减去平均成本,根据(1)中建立的回归方程解决以下问题:①预测该网点某天揽收2000件快递可获得的总利润;②单件快递的平均价格t 为何值时,该网点一天内收发快递所获利润的预报值最大?附:对于一组数据()11,u v ,()22,u v ,…,(),n n u v ,其回归直线v u αβ=+的斜率和截距的最小二乘估计分别为()()()121nii i nii uu v vuuβ==--=-∑∑,v u αβ=-.3.(2022·安徽蚌埠二中高三模拟预测(文))自从新型冠状病毒爆发以来,美国疫情持续升级,以下是美国2021年4月9日-12月14日每隔25天统计1次共计11次累计确诊人数(万).(1)将4月9日作为第1次统计,若将统计时间序号作为变量x ,每次累计确诊人数作为变量x ,得到函数关系()0,0bxy aea b =>>,对上表的数据作初步处理,得到部分数据已作近似处理的一些统计量的值6x =,603.09y =,1111ln 5.9811i i y ==∑,()()11115835.70i i i x y x y =--=∑,()1121110i i x x=-=∑,()1121ln ln 11.90i i y y=-=∑,()()111ln ln 35.10iii x x y y =--=∑, 4.0657.97e≈, 4.0758.56e ≈, 4.0859.15e ≈,根据相关数据,确定该函数关系式(参数a ,b 的取值精确到0.01);(2)为了了解患新冠肺炎与年龄的关系,已知某地曾患新冠肺炎的老年、中年、青年的人数分别为45人,30人,15人,按分层抽样的方法随机抽取6人进行问卷调查,再从6人中随机抽取2人进行调查结果对比,求这2人中至少有一人是老年人的概率.参考公式:线性回归方程y bx a =+中,()()()121niii nii x x y y b x x ==--=-∑∑,a y bx =-;4.(2022·贵州(理))某二手车交易市场对2021年某品牌二手车的交易进行了统计,得到如图所示的频率分布直方图和散点图.用x 表示该车的使用时间(单位:年),y 表示其相应的平均交易价格(单位:万元).(Ⅰ)已知2021年在此交易市场成交的该品牌二手车为100辆,求使用时间在[]12,20的车辆数; (Ⅱ)由散点图分析后,可用bx a y e +=作为此交易市场上该种车辆的平均交易价格y 关于其使用时间x 的回归方程.表中ln z y=,1110i i z z ==∑.根据上述相关数据,求y 关于x 的回归方程.附:对于一组数据()11,u v ,()22,u v ,…,(),n n u v ,其回归直线v u αβ=+的斜率和截距的最小二乘估计分别为:1221ˆni i i nii u vnuv unu β==-=-∑∑,ˆˆv u αβ=-.5.(2022·河南洛阳市·高三二模(理))某厂生产不同规格的一种产品,根据检测标准,其合格产品的质量()g y 与尺寸()mm x 之间近似满足关系式b y c x =⋅(b 、c 为大于0的常数).按照某项指标测定,当产品质量与尺寸的比在区间(),0.302,0.38897e e ⎛⎫≈ ⎪内时为优等品.现随机抽取6件合格产品,测得数据如下:(1)现从抽取的6件合格产品中再任选3件,记ξ为取到优等品的件数,试求随机变量ξ的期望; (2)根据测得数据作了初步处理,得相关统计量的值如表:(i )根据所给统计量,求y 关于x 的回归方程;(ii )已知优等品的收益z (单位:千元)与x 、y 的关系为20.32z y x =-,则当优等品的尺寸x 为何值时,收益z 的预报值最大? 附:对于样本()(),1,2,,n i i v u i =,其回归直线u b v a =⋅+的斜率和截距的最小二乘估计公式分别为:()()()1122211ˆn niii i i i nniii i v v u u v unvu bv v vnv====---==--∑∑∑∑,a u bv =-, 2.7182e ≈.6.(2022·全国(文))2021年新型冠状病毒肺炎疫情席卷金球,我国在全力保障口罩、防护服等医疗物资供给基础上,重点开展医疗救治急需的呼吸机、心电监护仪等医疗设备的组织生产和及时供应,统筹协调医用物资生产企业高速生产,支援世界各国抗击肺炎疫情.我市某医疗器械公司转型升级,从9月1日开始投入呼吸机生产,该公司9月1目~9月9日连续9天的呼吸机日生产量为i y (单位:百台..,1,2,,9i =),数据作了初步处理;得到如图所示的散点图.注:图中日期代码1~9分别对应9月1日~9月9日;表中iy i z e =,1919i i z z ==∑(1)从9个样本点中任意选取2个,在2个样本点的生产量都不高于300台的条件下,求2个样本点都高于200台的概率;(2)由散点图分析,样本点都集中在曲线ln()y bt a =+的附近,求y 关于t 的方程ln()y bt a =+,并估计该公司从生产之日起,需要多少天呼吸机日生产量可超过500台.参考公式:回归直线方程是ˆˆv βμα=+;1122211()()()()innii i ii i n nii i v v v n vn μμμμβμμμμ====---==--∑∑∑∑, ˆˆv αβμ=-, 参考数据:5148.4e ≈.7.(2022·全国高三专题练习)某公司为了了解年研发资金投人量x (单位:亿元)对年销售额y (单位:亿元)的影响.对公司近12年的年研发资金投入量i x 和年销售额i y 的数据,进行了对比分析,建立了两个函数模型:①2y x αβ=+,②2x t y e +=,其中α、β、λ、t 均为常数,e 为自然对数的底数.并得到一些统计量的值.令2i i u x =,ln (1,2,,12)i i y i ν==,经计算得如下数据:(1)请从相关系数的角度,分析哪一个模型拟合程度更好? (2)①根据(1)的选择及表中数据,建立y 关于x 的回归方程;②若下一年销售额y 需达到90亿元,预测下一年的研发资金投入量x 是多少亿元?附:相关系数:()()ni i x x y y r --=∑ˆˆˆya bx =+中公式分别为:121()()ˆ()niii nii x x yy b x x ==--=-∑∑,ˆˆay bx =-; 参考数据:308477=⨯9.4868,4499890e ≈.8.(2022·四川达州·高三二模(理))在能源和环保的压力下,新能源汽车将成为未来汽车的发展方向.我国大力发展新能源汽车的生产和销售.某市近6年的新能源汽车保有量数据如下表(1)从这6年中任意选取两年,求这两年中仅有1年的新能源汽车保有量大于4万辆的概率;(2)用函数模型(0)dx y ce c =>对两个变量x ,y 的关系进行拟合,根据表中数据求出y 关于x 的回归方程(条数精确到0.01).参考数据: 3.5x =, 4.1y =,62191i i x ==∑;设61ln , 1.16,31.89i i i i i t y t x t ====∑.参考公式:回归直线ˆˆv a u β=+的斜率和截距的最小二乘估计公式分别为:0.351221ˆˆˆ,,0.7047ni i ni i i u v nuvav u e unu ββ-==-==-≈-∑∑.9.(2022·陕西高三二模(理))为了迎接十四运,提高智慧城市水平,西安公交公司近期推出支付宝和微信扫码支付乘车活动,活动设置了一段时间的推广期,由于推广期内优惠力度较大,吸引越来越多的人开始使用扫码支付.某线路公交车队统计了活动刚推出一周内每一天使用扫码支付的人次,x 表示活动推出的天数,y 表示每天使用扫码支付的人次(单位:十人次),统计数据如表下所示:根据以上数据,绘制了散点图.(1)根据散点图判断,在推广期内,y a bx =+与x y c d =⋅(,c d 均为大于零的常数),哪一个适宜作为扫码支付的人次y 关于活动推出天数x 的回归方程类型?(给出判断即可,不必说明理由);(2)根据(1)的判断结果及表1中的数据,建立y 与x 的回归方程,并预测活动推出第8天使用扫码支付的人次;(3)推广期结束后,车队对乘客的支付方式进行统计,结果如下表:西安公交六公司车队为缓解周边居民出行压力,以90万元的单价购进了一批新车,根据以往的经验可知,每辆车每个月的运营成本约为0.66万元.已知该线路公交车票价为2元,使用现金支付的乘客无优惠,使用乘车卡支付的乘客享受8折优惠,扫码支付的乘客随机优惠,根据统计结果得知,使用扫码支付的乘客中有16的概率享受7折优惠,有13的概率享受8折优惠,有12的概率享受9折优惠.预计该车队每辆车每个月有2万人次乘车,根据所给数据以事件发生的频率作为相应事件发生的概率,在不考虑其它因素的条件下,按照上述收费标准,请你估计这批车辆需要几年(结果取整数年)才能盈利?参考数据:其中其中lg i i v y =,7117i i v v ==∑,参考公式:对于一组数据()11,u v ,()22,u v ,…,(),n n u v ,其回归直线ˆˆv u αβ=+的斜率和截距的最小二乘估计公式分别为:1221ˆni i i nii u v nu vunu β==-⋅=-∑∑,ˆˆv u αβ=-.10.(2022·吉林高三模拟预测(文))全球化时代,中国企业靠什么在激烈的竞争中成为世界一流企业呢?由人民日报社指导,《中国经济周刊》主办的第十八届中国经济论坛在人民日报社举行,就中国企业如何提升全球行业竞争力进行了研讨.数据显示,某企业近年加大了科技研发资金的投入,其科技投入x (百万元)与收益y (百万元)的数据统计如下:根据数据特点,甲认为样本点分布在指数型曲线2bx a y +=的周围,据此他对数据进行了一些初步处理.如下表:其中2log i i z y =,7117i i z z ==∑.(1)请根据表中数据,建立y 关于x 的回归方程(系数ˆb精确到0.1); (2)①乙认为样本点分布在直线y mx n =+的周围,并计算得回归方程为ˆ8.253yx =+,以及该回归模型的决定系数(即相关指数)20.893R =乙,试比较甲乙两人所建立的模型,谁的拟合效果更好?②由①所得的结论,计算该企业欲使收益达到1亿元,科技投入的费用至少要多少百万元?(精确到0.1) 附:对于一组数据()()()1122,,,,,,n n u v u v u v ⋯,其回归直线方程ˆˆˆvu βα=+的斜率和截距的最小二乘法估计分别为()()()1122211ˆn ni i i i i i nniii i u u v v u v n u u un μνβμ====---==--∑∑∑∑,ˆˆανβμ=-,决定系数:()()22121ˆ1ni i nii v vR v v ==-=--∑∑.参考数据:2log 5 2.3≈.11.(2022·江西(文))每年的4月23日是联合国教科文组织确定的“世界读书日”,又称“世界图书和版权日”.从进入大数据时代以来,人们阅读方式发生了改变,数字媒体阅读方式因为便携,容量大等优点越来越被大众接受,下表是国际数据公司(IDC )研究的全球近6年每年数字媒体阅读产生的数据量(单位:ZB )及相关统计量的值:表中ln i i z y =,6116i i z z ==∑.(1)根据上表数据信息判断,方程21e c xy c =⋅(e 是自然对数的底数)更适宜作为该公司统计的年数据量y关于年份序号x 的回归方程类型,试求此回归方程;(2)根据(1)中的回归方程,预计2024年全世界数字媒体阅读产生的数据量是2022年的多少倍?并说明理由.(参考数据:e 2.718≈ 1.648≈,结果精确到0.1)参考数据:回归方程ˆˆˆy a bx =+中,斜率最小二乘法公式为()()()121ˆni i i nij x x y y bxx ==--=-∑∑1221ni ii nii x ynxyxnx ==-=-∑∑,ˆˆa y bx =-.12.(2022·山东济宁一中高三开学考试)某公司对某产品作市场调研,获得了该产品的定价x (单位:万元/吨)和一天销售量y (单位:吨)的一组数据,制作了如下的数据统计表,并作出了散点图.表中1z x=0.45≈ 2.19. (1)根据散点图判断,ya bx =+与1y c k x -=+⋅哪一个更适合作为y 关于x 的回归方程;(给出判断即可,不必说明理由)(2)根据(1)的判断结果,试建立y 关于x 的回归方程;(3)若生产1吨该产品的成本为0.20万元,依据(2)的回归方程,预计定价为多少时,该产品一天的利润最大,并求此时的月利润.(每月按30天计算,计算结果保留两位小数)(参考公式:回归方程y bx a =+,其中()()()1122211n niii ii i nniii i x x y y x y nxyb x x xnx====---==--∑∑∑∑,a y bx =-)。

非线性回归数学知识点总结

非线性回归数学知识点总结

非线性回归数学知识点总结非线性回归分析通常基于统计原理和方法,通过对观测数据的分析来估计模型参数,从而找到自变量和因变量之间的关系。

对于不同类型的非线性关系,可以采用不同的非线性回归模型来进行分析。

本篇文章将从以下几个方面来总结非线性回归的相关数学知识点:非线性回归模型的基本概念、非线性回归模型的参数估计、非线性回归模型的假设检验、非线性回归模型的模型选择和验证等。

1. 非线性回归模型的基本概念非线性回归模型是一种描述自变量和因变量之间非线性关系的数学模型。

非线性回归模型通常可以表示为如下形式:Y = f(X,θ) + ε其中,Y是因变量,X是自变量,f()是非线性函数,θ是模型参数,ε是误差项。

在实际问题中,我们可以根据问题的特点选择合适的非线性函数f()来描述自变量和因变量之间的关系。

比如,如果我们观测到因变量Y与自变量X之间存在指数关系,那么我们可以选择指数函数来描述这种关系。

如果我们观测到因变量Y与自变量X之间存在对数关系,我们可以选择对数函数来描述这种关系。

2. 非线性回归模型的参数估计在实际问题中,我们通常需要通过观测数据来估计非线性回归模型的参数。

参数估计的目标是求解模型参数θ的值,使得模型与观测数据的拟合程度最好。

参数估计的方法通常包括最小二乘法、最大似然估计、贝叶斯方法等。

其中,最小二乘法是应用最广泛的一种参数估计方法。

最小二乘法的基本思想是求解参数θ,使得模型预测值与观测数据的残差平方和最小。

3. 非线性回归模型的假设检验在参数估计之后,我们通常需要对非线性回归模型的拟合效果进行假设检验。

假设检验的目的是判断模型的拟合程度是否显著。

在假设检验中,通常会进行F检验、t检验、残差分析等。

F检验是用来判断整个模型的符合程度,t检验是用来判断模型参数的显著性。

残差分析是用来检验模型对观测数据的拟合程度。

4. 非线性回归模型的模型选择和验证在实际问题中,我们通常会遇到多个可能的非线性回归模型。

非线性回归方程、相关性分析专题 高考数学

非线性回归方程、相关性分析专题 高考数学
(3)变量置换,通过变量置换把非线性回归问题转化为________问题,
并求出线性回归方程.
(4)分析拟合效果:通过计算________或画________图来判断拟合效果.
(5)根据相应的变换,写出________方程.
试卷讲评课件
3.常见的变换
(1)已知函数y = ln bx + a ,左右两边同时取e的指数,得________,
选取函数y = m ⋅ x k m>0, k>0 作为年广告费用x和年利润额y的回归
类型.令u = lnx, v = lny,则v = lnm + ku,则对数据作出如下处理:
令ui = lnxi , vi = lnyi ,得到相关数据如表所示:
试卷讲评课件
10
10
10
10
i=1
i=1
i=1
i=1
令t =________,得________
(2)已知函数y = kx −1 + c,令t =________,得________
(3)已知函数y = ebx+a ,左右两边同时取e的对数,得________,令t =
________,得________
(4)已知函数y = aebx ,左右两边同时取e的对数,得________,令t =_
过0.6的农家乐的个数,求ξ的概率分布列;
෠ + a与ොy = bz
෠ + a哪个更合适于
模型(给出判断即可,不必说明理由)?并根据你的判断结果求回归方程;

(ොa,b的结果精确到0.1)
试卷讲评课件
(3)根据第(2)问所求的回归方程,试估计收费标准为多少时,100天销
有效的控制.其中,各大药物企业积极投身到新药的研发中.汕头某药企

高中数学总结归纳 非线性回归问题

高中数学总结归纳 非线性回归问题

非线性回归问题两个变量不呈线性关系,不能直接利用线性回归方程建立两个变量的关系,可以通过变换的方法转化为线性回归模型。

分析非线性回归问题的具体做法是:(1)若问题中已给出经验公式,这时可以将变量x进行置换(换元),将变量的非线性关系转化为线性关系,将问题化为线性回归分析问题来解决.(2)若问题中没有给出经验公式,需要我们画出已知数据的散点图,通过与各种已知函数(如指数函数、对数函数、幂函数等)的图象作比较,选择一种与这些散点拟合得最好的函数,然后采用适当的变量置换,将问题化为线性回归分析问题来解决.下面举例说明非线性回归分析问题的解法.例1在彩色显影中,由经验可知:形成染料光学密度y与析出银的光学密度x由公式e b xy A=(b<0)表示,现测得实验数据如下:试求y对x的回归方程.分析:该例是一个非线性回归分析问题,由于题目中已给定了要求的曲线为e b xy A=(b<0)类型,我们只要通过所给的11对样本数据求出A和b,即可确定x与y的相关关系的曲线方程.解:由题意可知,对于给定的公式e b xy A=(b<0)两边取自然对数,得ln ln by Ax =+.与线性回归方程对照可以看出,只要取1ux=,lnv y=,lna A=,就有v a bu=+,这是v对u的线性回归直线方程,对此我们再套用相关性检验,求回归系数b和a.题目中所给数据由变量置换1u=,lnv y=变为如表所示的数据:可以求得r=0.998.由于|r |=0.998>0.602,可知u 与v 具有很强的线性相关关系.再求得0.146b=-$,$0.548a =, ∴v =$0.5480.146u -,把u 和v 置换回来可得$0.146ln 0.548y x=-, ∴$0.1460.1460.1460.5480.548e 1.73xxxy eee---===g ,∴回归曲线方程为$0.1461.73e xy -=.点评:解决本题的思路是通过适当的变量置换把非线性回归方程转化为线性回归方程,然后再套用线性回归分析的解题步骤.例2 为了研究某种细菌随时间x 变化的繁殖个数,收集数据如下: 天数x 1 2 3 4 5 6 繁殖个数y612254995190(1)作出这些数据的散点图; (2)求出y 对x 的回归方程. 解析:(1)作出散点图如图1所示.(2)由散点图看出样本点分布在一条指数型曲线e bxy c =(c >0)的周围,则ln ln y bx c =+.令ln ln z y a c ==,,则z bx a =+.x1 2 3 4 5 6 z1.792.483.223.894.555.25相应的散点图如图2.从图2可以看出,变换后的样本点分布在一条直线附近,因此可以用线性回归方程来拟合.由表中数据得到线性回归方程为0.69 1.115zx =+$.因此细菌的繁殖个数对温度的非线性回归方程为$0.69 1.115e xy+ =.点评:通过作散点图看出,本题是一个非线性回归问题,通过变量置换转化为线性回归问题求解的.值得注意的是,本题的数据与回归曲线是拟合得相当好的,这表明确定性关系(如公式、函数关系式)和相关关系之间并没有一条不可逾越的鸿沟.由于有实验误差、测量误差等存在,变量之间的确定性关系往往通过相关关系表现出来;反过来,在有些问题中,可以研究相关关系来深入了解变量变化的内在规律,从而找到它们的确定性关系.。

2024届高考二轮复习数学课件(新高考新教材):非线性经验回归问题

2024届高考二轮复习数学课件(新高考新教材):非线性经验回归问题
布了《中华人民共和国个人所得税法》,公民依法诚信纳税是义务,更是责
任.现将自2013年至2017年的个人所得税收入统计如下.
年份
时间代号x
个税收入y/千亿元
2013
1
6.53
2014
2
7.38
2015
3
8.62
2016
4
10.09
2017
5
11.97
制作时间代号x与个人所得税收入的散点图如图所示.
பைடு நூலகம்
的斜率和截距的最小二乘估计分别为: = =1

2
∑ 2 -
=1
^
^
, = − .
解 (1)根据散点图判断,在推广期内,y=c·
dx(c,d均为大于零的常数),适宜作为
扫码支付的人次y关于活动推出天数x的经验回归方程类型.
(2)根据(1)的判断结果y=c·
dx,两边取对数得:lg y=lg c+x·
置了一段时间的推广期,由于推广期内优惠力度较大,吸引越来越多的人开
始使用扫码支付.某线路公交车队统计了活动刚推出一周内每一天使用扫
码支付的人次,x表示活动推出的天数,y表示每天使用扫码支付的人次(计
十人次为1个单位,例如y=6表示60人次),统计数据如表所示.
x
y
1
6
2
11
3
21
4
34
5
66
6
101
1.60
83.83
5
5
1
1
表中 z=ln y,w=x2, = ∑ ln yi,w = ∑ 2 ,参考数据:e1.68≈5.37,e0.96≈2.61.
5 =1

专题02 非线性回归方程(解析版)

专题02 非线性回归方程(解析版)

专题2 非线性回归方程例1. 某景区的各景点从2009年取消门票实行免费开放后,旅游的人数不断地增加,不仅带动了该市淡季的旅游,而且优化了旅游产业的结构,促进了该市旅游向“观光、休闲、会展”三轮驱动的理想结构快速转变.下表是从2009年至2018年,该景点的旅游人数y (万人)与年份x 的数据:模型①:由最小二乘法公式求得y 与x 的线性回归方程5081697=+ˆ..yx ; 模型②:由散点图的样本点分布,可以认为样本点集中在曲线=bx y ae 的附近. (1)根据表中数据,求模型②的回归方程=ˆbx yae .(a 精确到个位,b 精确到001.). (2)根据下列表中的数据,比较两种模型的相关指数2R ,并选择拟合精度更高、更可靠的模型,预测2021年该景区的旅游人数(单位:万人,精确到个位).参考公式、参考数据及说明:①对于一组数据1(v ,1)w ,2(v ,2)w ,⋯,(n v ,)n w ,其回归直线αβ=+ˆˆˆwv 的斜率和截距的最小二乘法估计分别为121βαβ==--==--∑∑()()ˆˆ,()nii i nii ww v v w v vv . ②刻画回归效果的相关指数221211==-=--∑∑()()nii i n ii yy Ryy .③参考数据:546235≈.e ,14342≈..e .表中101110===∑,i i ii u lny u u.【解析】解:(1)对=bx y ae 取对数,得=+lny bx lna , 设=u lny ,=c lna ,先建立u 关于x 的线性回归方程.1011021900010883==--==≈-∑∑()().ˆ.()ii i ii xx u u bxx , 6050108555456546=-≈-⨯=≈ˆˆ.....cu bx ,546235=≈≈ˆ.ˆc a e e . ∴模型②的回归方程为011235=.ˆx ye ; (2)由表格中的数据,有3040714607>,即101022113040714607==>--∑∑()()iii i yy yy ,即10102211304071460711==-<---∑∑()()iii i yy yy ,∴2212<R R ,模型①的相关指数21R 小于模型②的22R ,说明回归模型②的拟合效果更好.2021年时,13=x ,预测旅游人数为0111314323523523542987⨯==≈⨯=..ˆ.y e e (万人).例2. 近年来,随着国家综合国力的提升和科技的进步,截至2018年底,中国铁路运营里程达13.2万千米,这个数字比1949年增长了5倍;高铁运营里程突破2.9万千米,占世界高铁运营里程的60%以上,居世界第一位.如表截取了20122016-年中国高铁密度的发展情况(单位:千米/万平方千米).已知高铁密度y 与年份代码x 之间满足关系式=(b y ax a ,b 为大于0的常数).若对=b y ax 两边取自然对数,得到=+lny blnx lna ,可以发现lny 与lnx 线性相关.(1)根据所给数据,求y 关于x 的回归方程ˆ(lna ,ˆb 保留到小数点后一位);(2)利用(1)的结论,预测到哪一年,高铁密度会超过30千米/万平方千米.参考公式:设具有线性相关系的两个变量x ,y 的一组数据为(i x ,1=)(i y i ,2,⋯⋯)n ,则回归方程ˆˆˆybx a =+的系数:121==--=-∑∑()()ˆ()nii i nii xx y y b xx ,=-ˆay bx . 参考数据:515092=-≈∑.ii i lnxlny lnx lny ,5221516=-≈∑()().ii lnx lnx ,515=≈∑ii lnx,5114=≈∑ii lny,274≈.,3034≈.ln .【解析】解:(1)对00=>>(,)b y ax a b 两边取自然对数,得=+lny blnx lna ; 令=i i v lnx ,=i i u lny ,1=i ,2,3,⋯,n ; 得u 与v 具有线性相关关系,计算51522150920575165==-===-∑∑.ˆ..i i i ii v uvubvv ,140575122255=-=-⨯=ˆ..lna u bv , ∴06≈ˆ.b,22≈≈.lna , ∴0622=+ˆ..u v ,故y 关于x 的回归方程为0622+=..ˆlnx y e , 即2206=..ˆye x ; (2)在(1)的回归方程中,0622+=..lnx y e ,高铁密度超过30千米/万平方千米; 即062230+>..lnx e ,06223034+>≈...lnx ln ,2>lnx .274>≈.x e ,即8=x 时,高铁密度超过30千米/万平方千米;所以预测2019年,高铁密度超过30千米/万平方千米.例3. 某公司生产一种产品,从流水线上随机抽取100件产品,统计其质量指数并绘制频率分布直方图(如图1):产品的质量指数在[50,70)的为三等品,在[70,90)的为二等品,在[90,110]的为一等品,该产品的三、二、一等品的销售利润分别为每件1.5,3.5,5.5(单位:元),以这100件产品的质量指数位于各区间的频率代替产品的质量指数位于该区间的概率. (1)求每件产品的平均销售利润;(2)该公司为了解年营销费用x (单位:万元)对年销售量y (单位:万件)的影响,对近5年的年营销费用i x 和年销售量i y (1,2,3,4,5)i =数据做了初步处理,得到的散点图(如图2)及一些统计量的值.表中ln i i u x =,ln i i v y =,5115i i u u ==∑,5115i i v v ==∑根据散点图判断,by a x =可以作为年销售量y (万件)关于年营销费用x (万元)的回归方程.(ⅰ)建立y 关于x 的回归方程;(ⅰ)用所求的回归方程估计该公司应投入多少营销费,才能使得该产品一年的收益达到最大?(收益=销售利润-营销费用,取 4.15964e =)参考公式:对于一组数据:11(,)u v ,22(,)u v ,,(,)n n u v ,其回归直线v u αβ=+的斜率和截距的最小乘估计分别为^121()()()nii i nii uu v v uu β==--=-∑∑,^v u αβ∧∧=-【解析】(1)设每件产品的销售利润为ξ元,则ξ的所有可能取值为1.5,3.5,5.5 由直方图可得:一、二、三等品的频率分别为0.4,0.45,0.15, 所以()1.50.15P ξ==,()3.50.45P ξ==, ()5.50.4P ξ==,所以:随机变量ξ的分布列为:所以, 1.50.15 3.50.45 5.50.44E ξ=⨯+⨯+⨯= 故每件产品的平均销售利润为4元.(2)(ⅰ)由·b y a x =得,()ln ln ?ln ln by a x a b x ==+,令ln u x =,ln v y =,ln c a =,则v c bu =+,由表中数据可得,()()()1210.410.251.6ˆ4ni i i n i i u u v v b u u ==--===-∑∑, 则24.8716.300.25 4.15955ˆc v bu∧∧=-=-⨯= 所以, 4.1590.25v u ∧=+,即14.1594ln 4.1590.25ln ln ?y x e x ∧⎛⎫=+= ⎪⎝⎭因为 4.15964e=,所以1464?y x ∧=故所求的回归方程为1464?y x =(ⅰ)设年收益为z 万元,则()14256z E y x x x ξ=-=-设14t x =,()4256f t t t =-,则()()33'2564464f t t t=-=-当()0,4t ∈时,()'0f t >,()f t 在()0,4单调递增, 当()4,t ∈+∞时,()'0f t <,()f t 在()4,+∞单调递减. 所以,当4t =,即256x =时,z 有最大值为768即该厂应投入256万元营销费,能使得该产品一年的收益达到最大768万元.例4. 近年来,随着互联网技术的快速发展,共享经济覆盖的范围迅速扩张,继共享单车、共享汽车之后,共享房屋以“民宿”、“农家乐”等形式开始在很多平台上线.某创业者计划在某景区附近租赁一套农房发展成特色“农家乐”,为了确定未来发展方向,此创业者对该景区附近六家“农家乐”跟踪调查了100天.得到的统计数据如下表,x 为收费标准(单位:元/日),t 为入住天数(单位:),以频率作为各自的“入住率”,收费标准x 与“入住率”y 的散点图如图(1)若从以上六家“农家乐”中随机抽取两家深入调查,记ξ为“入住率”超过0.6的农家乐的个数,求ξ的概率分布列;(2)令ln z x =,由散点图判断ˆˆˆybx a =+与ˆˆy bz a =+哪个更合适于此模型(给出判断即可,不必说明理由)?并根据你的判断结果求回归方程.(ˆb结果保留一位小数) (3)若一年按365天计算,试估计收费标准为多少时,年销售额L 最大?(年销售额365L =⋅入住率⋅收费标准x )参考数据:1221ˆ,ni i i n ii x y nx y b x nx ==-⋅=-∑∑621,200,0.45,32500,ˆˆ0ii a y bx x y x ==-===∑ 615.1,12.7,i i i z y z =≈≈∑6231158.1,148.4ii ze =≈≈∑【解析】(1)ξ的所有可能取值为0,1,2.则()0P ξ== 2426C C 62,155== ()1124268115C C P C ξ⋅===,()2P ξ== 2226C C 115= ξ∴的分布列(2)由散点图可知ˆˆˆybz a =+更适合于此模型. 其中6162216 1.070.52.0ˆ46i i i i i z y zy bz z ==--==≈--∑∑,ˆ3ˆˆay bz =-= 所求的回归方程为0.5ˆ3ylnx =-+ (3)()3650.53L lnx x =-+=3651095.2xlnx x -+ 365365365322L lnx =--+⨯'令505148.4L lnx x e =⇒=⇒=≈' ∴若一年按365天计算,当收费标准约为148.4元/日时,年销售额L 最大,最大值约为27083元.例5. 已知某种细菌的适宜生长温度为10C 25C ︒~︒,为了研究该种细菌的繁殖数量y (单位:个)随温度x (单位:C ︒)变化的规律,收集数据如下:对数据进行初步处理后,得到了一些统计量的值,如下表所示:其中ln i i k y =,7117i i k k ==∑.(1)请绘出y 关于x 的散点图,并根据散点图判断y bx a =+与21e c xy c =哪一个更适合作为该种细菌的繁殖数量y 关于x 的回归方程类型(结果精确到0.1);(2)当温度为25C ︒时,该种细菌的繁殖数量的预报值为多少?参考公式:对于一组数据()(),1,2,3,...,i i u v i n =,其回归线ˆˆˆvu βα=+的斜率和截距的最小二乘估计分别为:()121ˆ()()niii nii u u v v u u β==--=-∑∑,ˆˆav u β=-.参考数据: 5.5e 245≈.【解析】(1)绘出的散点图如图所示,根据散点图判断21c xy c e =更适合作为该种细菌的繁殖数量y 关于x 的回归方程类型;(2)∵21c xy c e=,∴21lny c x lnc =+,∴()()()71272120.50.2112i ii i i x x k k c x x ==--==≈-∑∑,1220.53.8180.5112lnck c x =-=-⨯≈, ∴0.51c e =,20.20.51c xx y c e e +==,当温度为25C ︒时,该种细菌的繁殖数量的预报值为 5.5245e ≈.例6. 噪声污染已经成为影响人们身体健康和生活质量的严重问题,为了了解声音强度D (单位:分贝)与声音能量(单位:2/W cm )之间的关系,将测量得到的声音强度1D 和声音能量i I (i =1,2…,10)数据作了初步处理,得到如图散点图及一些统计量的值.表中lg i i W I =,101110i i W W ==∑。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

非线性回归问题
两个变量不呈线性关系,不能直接利用线性回归方程建立两个变量的关系,可以通过变换的方法转化为线性回归模型。

分析非线性回归问题的具体做法是: (1)若问题中已给出经验公式,这时可以将变量x 进行置换(换元),将变量的非线性关系转化为线性关系,将问题化为线性回归分析问题来解决.
(2)若问题中没有给出经验公式,需要我们画出已知数据的散点图,通过与各种已知函数(如指数函数、对数函数、幂函数等)的图象作比较,选择一种与这些散点拟合得最好的函数,然后采用适当的变量置换,将问题化为线性回归分析问题来解决. 下面举例说明非线性回归分析问题的解法.
例1 在彩色显影中,由经验可知:形成染料光学密度y 与析出银的光学密度x 由公式
e b
x
y A =(b <0)表示,现测得实验数据如下:
试求对的回归方程.
分析:该例是一个非线性回归分析问题,由于题目中已给定了要求的曲线为e
b
x
y A =(b <0)类型,我们只要通过所给的11对样本数据求出A 和b ,即可确定x 与y 的相关关系的曲线方程.
解:由题意可知,对于给定的公式e b
x
y A =(b <0)两边取自然对数,得ln ln b y A x
=+. 与线性回归方程对照可以看出,只要取1
u x
=
,ln v y =,ln a A =,就有v a bu =+,这是v 对u 的线性回归直线方程,对此我们再套用相关性检验,求回归系数b 和a . 题目中所给数据由变量置换1
u =
,ln v y =变为如表所示的数据:
由于|r |=0.998>0.602,可知u 与v 具有很强的线性相关关系. 再求得0.146b =-,0.548a =,
∴v =0.5480.146u -,把u 和v 置换回来可得0.146
ln 0.548y x
=-
, ∴0.1460.1460.1460.5480.548
e
1.73x
x
x
y e
e
e
-
-
-
===,
∴回归曲线方程为0.1461.73e
x
y -
=.
点评:解决本题的思路是通过适当的变量置换把非线性回归方程转化为线性回归方程,
然后再套用线性回归分析的解题步骤.
(2)求出y 对x 的回归方程. 解析:(1)作出散点图如图1所示.
(2)由散点图看出样本点分布在一条指数型曲线e bx
y c =(c >0)的周围,则
ln ln y bx c =+.
令ln ln z y a c ==,,则z bx a =+.
相应的散点图如图2. 从图2可以看出,变换后的样本点分布在一条直线附近,因此可以用线性回归方程来拟合.
由表中数据得到线性回归方程为0.69 1.115z x =+.因此 细菌的繁殖个数对温度的非线性回归方程为0.69 1.115e x y +=.
点评:通过作散点图看出,本题是一个非线性回归问题,通过变量置换转化为线性回归问题求解的.值得注意的是,本题的数据与回归曲线是拟合得相当好的,这表明确定性关系(如公式、函数关系式)和相关关系之间并没有一条不可逾越的鸿沟.由于有实验误差、测量误差等存在,变量之间的确定性关系往往通过相关关系表现出来;反过来,在有些问题中,可以研究相关关系来深入了解变量变化的内在规律,从而找到它们的确定性关系.。

相关文档
最新文档