一元线性回归模型习题及答案.doc

合集下载

第9章 一元线性回归练习题

第9章 一元线性回归练习题

第9章一元线性回归练习题一.选择题1.具有相关关系的两个变量的特点是()A.一个变量的取值不能由另一个变量唯一确定B.一个变量的取值由另一个变量唯一确定C.一个变量的取值增大时另一个变量的取值也一定增大D.一个变量的取值增大时另一个变量的取值肯定变小2.下面的各问题中,哪个不是相关分析要解决的问题A.判断变量之间是否存在关系B.判断一个变量数值的变化对另一个变量的影响C.描述变量之间的关系强度 D.判断样本所反映的变量之间的关系能否代表总体变量之间的关系3.根据下面的散点图,可以判断两个变量之间存在()A.正线性相关关系B. 负线性相关关系C. 非线性关系D. 函数关系4.下面的陈述哪一个是错误的()A. 相关系数是度量两个变量之间线性关系强度的统计量B.相关系数是一个随机变量C.相关系数的绝对值不会大于1D.相关系数不会取负值5.根据你的判断,下面的相关系数取值哪一个是错误的()A. -0.86B. 0.78C. 1.25D. 06.如果相关系数r=0,则表明两个变量之间()A.相关程度很低B. 不存在任何关系C.不存在线性相关关系D.存在非线性关系7.下列不属于相关关系的现象是()A.银行的年利息率与贷款总额B.居民收入与储蓄存款C.电视机的产量与鸡蛋产量D.某种商品的销售额与销售价格8.设产品产量与产品单位成本之间的线性相关系数为-0.87,这说明二者之间存在着()A. 高度相关B.中度相关C.低度相关D.极弱相关9.在回归分析中,被预测或被解释的变量称为()A.自变量B.因变量C.随机变量D.非随机变量10.对两变量的散点图拟合最好的回归线,必须满足一个基本的条件是()A.2ˆ()yy∑-最小B.2)(ˆyy∑-最大C.2ˆ()yy∑-最大D.2)(ˆyy∑-最小11. 下列哪个不属于一元回归中的基本假定()A.误差项i ε服从正态分布B. 对于所有的X ,方差都相同C. 误差项i ε相互独立D. 0)ˆ=-i i yy E ( 12.如果两个变量之间存在着负相关,指出下列回归方程中哪个肯定有误( )A.x y75.025ˆ-= B. x y 86.0120ˆ+-= C. x y 5.2200ˆ-= D. x y 74.034ˆ--= 13.对不同年份的产品成本拟合的直线方程为,75.1280ˆx y-=y 表示产品成本,x 表示不同年份,则可知( )A.时间每增加一个单位,产品成本平均增加1.75个单位B. 时间每增加一个单位,产品成本平均下降1.75个单位C.产品成本每变动一个单位,平均需要1.75年时间D. 产品成本每减少一个单位,平均需要1.75年时间 14.在回归分析中,F 检验主要是用来检验( )A .相关关系的显著性 B.回归系数的显著性 C. 线性关系的显著性D.估计标准误差的显著性15.说明回归方程拟合优度的统计量是( )A. 相关系数B.回归系数C. 判定系数D. 估计标准误差16.已知回归平方和SSR=4854,残差平方和SSE=146,则判定系数R 2=( ) A.97.08% B.2.92% C.3.01% D. 33.25% 17. 判定系数R2值越大,则回归方程( )A 拟合程度越低B 拟合程度越高C 拟合程度有可能高,也有可能低D 用回归方程进行预测越不准确 18. 居民收入与储蓄额之间的相关系数可能是( ) A -0.9247 B 0.9247 C -1.5362 D 1.536219.在对一元回归方程进行显著性检验时,得到判定系数R 2=0.80,关于该系数的说法正确的是( )A. 该系数越大,则方程的预测效果越好B. 该系数越大,则由回归方程所解释的因变量的变差越多C. 该系数越大,则自变量的回归对因变量的相关关系越显著D. 该回归方程中自变量与因变量之间的相关系数可能小于0.8 20.下列方程中肯定错误的是( )A. x y48.015ˆ-=,r=0.65 B. x y 35.115ˆ--=, r= - 0.81 C. x y85.025ˆ+-=, r=0.42 D. x y 56.3120ˆ-=, r= - 0.96 21. 若两个变量存在负相关关系,则建立的一元线性回归方程的判定系数R 2的取值范围是( )A.【0,1】B. 【-1,0】C. 【-1,1】D.小于0的任意数二. 填空题1.当从某一总体中抽取了一样本容量为30的样本,并计算出某两个变量的相关系数为0.8时,我们是否可认为这两个变量存在着强相关性(不能 ) ,理由是(因为该相关系数为样本计算出的相关系数,它的大小受样本数据波动的影响,它是否显著尚需检验 )。

计量经济学习题第2章-一元线性回归模型

计量经济学习题第2章-一元线性回归模型

第2章 一元线性回归模型一、单项选择题1、变量之间的关系可以分为两大类__________。

A 函数关系与相关关系B 线性相关关系和非线性相关关系C 正相关关系和负相关关系D 简单相关关系和复杂相关关系 2、相关关系是指__________。

A 变量间的非独立关系B 变量间的因果关系C 变量间的函数关系D 变量间不确定性的依存关系 3、进行相关分析时的两个变量__________。

A 都是随机变量B 都不是随机变量C 一个是随机变量,一个不是随机变量D 随机的或非随机都可以 4、表示x 和y 之间真实线性关系的是__________。

A 01ˆˆˆt tY X ββ=+ B 01()t t E Y X ββ=+ C 01t t t Y X u ββ=++ D 01t t Y X ββ=+5、参数β的估计量ˆβ具备有效性是指__________。

A ˆvar ()=0βB ˆvar ()β为最小C ˆ()0ββ-= D ˆ()ββ-为最小 6、对于01ˆˆi i iY X e ββ=++,以σˆ表示估计标准误差,Y ˆ表示回归值,则__________。

A i i ˆˆ0Y Y 0σ∑=时,(-)=B 2iiˆˆ0Y Y σ∑=时,(-)=0 C ii ˆˆ0Y Y σ∑=时,(-)为最小 D 2iiˆˆ0Y Yσ∑=时,(-)为最小 7、设样本回归模型为i 01i i ˆˆY =X +e ββ+,则普通最小二乘法确定的i ˆβ的公式中,错误的是__________。

A ()()()i i 12iX X Y -Y ˆX X β--∑∑=B ()i iii122iin X Y -X Y ˆn X -X β∑∑∑∑∑=C ii122iX Y -nXY ˆX -nXβ∑∑= D i i ii12xn X Y -X Y ˆβσ∑∑∑=8、对于i 01i iˆˆY =X +e ββ+,以ˆσ表示估计标准误差,r 表示相关系数,则有__________。

南财计量经济学答案第二章 一元线性回归模型

南财计量经济学答案第二章 一元线性回归模型

五、计算分析题 1.解:(1)收入、年龄、家庭状况、政府的相关政 策等也是影响生育率的重要的因素,在上述简单 回归模型中,它们被包含在了随机扰动项之中。 有些因素可能与受教育水平相关,如收入水平与 教育水平往往呈正相关、年龄大小与教育水平呈 负相关等。 (2)当归结在随机扰动项中的重要影响因素与模 型中的教育水平educ相关时,上述回归模型不能 够揭示教育对生育率在其他条件不变下的影响, 因为这时出现解释变量与随机扰动项相关的情形, 基本假设3不满足。
ˆ ei2 回归估计的标准误差:
(n 2) 58.3539 (12 2) 2.4157
(3) 对进行显著水平为5%的显著性检验
t
*
^
ˆ 2 2
^
ˆ) SE ( 2
ˆ

ˆ 2
ˆ) SE ( 2

^
~ t (n 2)
ˆ ) SE ( 2
4、解: (1)这是一个横截面序列回归。 (2)截距2.6911表示咖啡零售价为每磅0美元时, 每天每人平均消费量为2.6911杯,这个数字没有 经济意义;斜率-0.4795表示咖啡零售价与消费量 负相关,价格上升1美元/杯,则平均每天每人消 费量减少0.4795杯; (3)不能; (4)不能;在同一条需求曲线上不同点的价格弹性 不同,若要求出,须给出具体的值及与之对应的 值。
2 i

334229.09 0.7863 425053.73
ˆ Y ˆ X 549.8 0.7863 647.88 66.2872 1 2
ˆ 66.2872 0.7863 X 估计结果为: Y i i 说明该百货公司销售收入每增加1元,平均说来销售成本将增 加0.7863元。 (2)计算可决系数和回归估计的标准误差 2 ˆ x )2 ˆ 2 x2 ˆ y ( i 可决系数为:R 2 i 2 i 2

(完整word版)一元线性回归模型习题及答案

(完整word版)一元线性回归模型习题及答案

一元线性回归模型一、单项选择题1、变量之间的关系可以分为两大类__________。

AA 函数关系与相关关系B 线性相关关系和非线性相关关系C 正相关关系和负相关关系D 简单相关关系和复杂相关关系 2、相关关系是指__________。

DA 变量间的非独立关系B 变量间的因果关系C 变量间的函数关系D 变量间不确定性的依存关系 3、进行相关分析时的两个变量__________。

AA 都是随机变量B 都不是随机变量C 一个是随机变量,一个不是随机变量D 随机的或非随机都可以 4、表示x 和y 之间真实线性关系的是__________。

CA 01ˆˆˆt tY X ββ=+ B 01()t t E Y X ββ=+ C 01t t t Y X u ββ=++ D 01t t Y X ββ=+5、参数β的估计量ˆβ具备有效性是指__________。

B A ˆvar ()=0βB ˆvar ()β为最小C ˆ()0ββ-= D ˆ()ββ-为最小 6、对于01ˆˆi i iY X e ββ=++,以σˆ表示估计标准误差,Y ˆ表示回归值,则__________。

B A i i ˆˆ0Y Y 0σ∑=时,(-)=B 2iiˆˆ0Y Y σ∑=时,(-)=0 C ii ˆˆ0Y Y σ∑=时,(-)为最小 D 2iiˆˆ0Y Yσ∑=时,(-)为最小 7、设样本回归模型为i 01i i ˆˆY =X +e ββ+,则普通最小二乘法确定的i ˆβ的公式中,错误的是__________。

D A ()()()i i 12iX X Y -Y ˆX X β--∑∑=B ()i iii122iin X Y -X Y ˆn X -X β∑∑∑∑∑=C ii122iX Y -nXY ˆX -nXβ∑∑= D i i ii12xn X Y -X Y ˆβσ∑∑∑=8、对于i 01i iˆˆY =X +e ββ+,以ˆσ表示估计标准误差,r 表示相关系数,则有__________。

一元线性回归模型练习题

一元线性回归模型练习题

一元线性回归模型练习题P55 3.1实验问题:实验步骤与内容:1、导入数据资料2、定义样本区间3、建立一元线性回归模型4、根据一元线性回归模型解释斜率系数的经济意义以及相关系数r5、对参数进行检验6、通过计算预测2010年财政收入问题解释与结论:(1):建立深圳地方预算内财政收入对GDP的一元线性回归模型。

通过对数据的运用,可以得出一元线性回归方程为Y=26.020961+0.08882X 其中,可以得到散点图为:一元线性回归拟合图为:(2)估计所建立模型的参数,解释斜率系数的经济意义;斜率系数和简单相关系数r的正负号相同吗?=26.02096是样本回归方程的截距,它表示不受国内生产总值影响的地方预算β=0.08882表示国内生产总值每增加一个单位的地方预财政收入为26.0296,β1算财政收入平均增加0.8882个单位,从回归模型不难看出,随着变量X的增大,Y变量的值也在增大。

根据简单相关系数的概念,且从第一题所求出来的回归结果可知,r>0,两个变量之间是正相关,即斜率系数和简单相关系数r的正负号相同。

(3)对回归参数进行t检验。

由此得到t=4.081 p=0.0006808,给定显著性水平 =0.05,查表得t(19)=2.0930,由于t=4.081>2.0930,拒绝原假设,说明斜率在5%的显著性0.05/2水平下显著不为0,这表明,国内生产总值对深圳市地方预算内财政收入有显著影响。

(4)拟合优度R2是多少?由第一题求出的线性回归可得:由上图中数据分析结果可以看出R2=0.9607,说明GDP解释了地方预算内财政收入的96%,模型拟合程度较好。

(6)若2010年的国内生产总值为11000亿元,试预测2010年的财政收入。

由一元线性回归模型可知,当2010年国内生产总值为11000亿元时,地方财政收入为:Y=26.020961+0.08882X=26.020961+0.08882*11000=1003.040961(亿元)3.6实验问题题表3.6是64个国家的儿童死亡率与人均GNP 数据,请用合适的模型作儿童死亡率对人均GNP 的一元线性回归,解释回归结果的含义,画出儿童死亡率对人均GNP 倒数的散点图,并与回归结果对应解释。

计量经济学第三版课后习题答案第二章 经典单方程计量经济学模型:一元线性回归模型

计量经济学第三版课后习题答案第二章  经典单方程计量经济学模型:一元线性回归模型

第二章经典单方程计量经济学模型:一元线性回归模型一、内容提要本章介绍了回归分析的基本思想与基本方法。

首先,本章从总体回归模型与总体回归函数、样本回归模型与样本回归函数这两组概念开始,建立了回归分析的基本思想。

总体回归函数是对总体变量间关系的定量表述,由总体回归模型在若干基本假设下得到,但它只是建立在理论之上,在现实中只能先从总体中抽取一个样本,获得样本回归函数,并用它对总体回归函数做出统计推断。

本章的一个重点是如何获取线性的样本回归函数,主要涉及到普通最小二乘法(OLS)的学习与掌握。

同时,也介绍了极大似然估计法(ML)以及矩估计法(MM)。

本章的另一个重点是对样本回归函数能否代表总体回归函数进行统计推断,即进行所谓的统计检验。

统计检验包括两个方面,一是先检验样本回归函数与样本点的“拟合优度”,第二是检验样本回归函数与总体回归函数的“接近”程度。

后者又包括两个层次:第一,检验解释变量对被解释变量是否存在着显著的线性影响关系,通过变量的t检验完成;第二,检验回归函数与总体回归函数的“接近”程度,通过参数估计值的“区间检验”完成。

本章还有三方面的内容不容忽视。

其一,若干基本假设。

样本回归函数参数的估计以及对参数估计量的统计性质的分析以及所进行的统计推断都是建立在这些基本假设之上的。

其二,参数估计量统计性质的分析,包括小样本性质与大样本性质,尤其是无偏性、有效性与一致性构成了对样本估计量优劣的最主要的衡量准则。

Goss-markov定理表明OLS估计量是最佳线性无偏估计量。

其三,运用样本回归函数进行预测,包括被解释变量条件均值与个值的预测,以及预测置信区间的计算及其变化特征。

二、典型例题分析例1、令kids表示一名妇女生育孩子的数目,educ表示该妇女接受过教育的年数。

生育率对教育年数的简单回归模型为β+μβkids=educ+1(1)随机扰动项μ包含什么样的因素?它们可能与教育水平相关吗?(2)上述简单回归分析能够揭示教育对生育率在其他条件不变下的影响吗?请解释。

一元线性回归模型(习题与解答)

一元线性回归模型(习题与解答)

β1 X i + u i ,试证明
Var ( β 1 ) =
2-7. 试证明: (1) (2) (3)

∑X
σ u2
2 i
∑e
i
= 0 ,从而: e = 0
i
∑e x
i
=0
∑e Y
i
∧ i
= 0 ;即残差 ei 与 Yi 的估计值之积的和为零。
2-8.为什么在一元线性方程中,最小二乘估计量与极大似然估计量的表达式是一致的?证
10) 最小平方法
2-2.判断正误并说明理由: 1) 2) 3) 4) 5) 随机误差项 ui 和残差项 ei 是一回事 总体回归函数给出了对应于每一个自变量的因变量的值 线性回归模型意味着变量是线性的 在线性回归模型中,解释变量是原因,被解释变量是结果 随机变量的条件均值与非条件均值是一回事
2-3.回答下列问题: 1) 2) 3) 4) 线性回归模型有哪些基本假设?违背基本假设的计量经济学模型是否就不可估计? 总体方差与参数估计误差的区别与联系。 随机误差项 ui 和残差项 ei 的区别与联系。 根据最小二乘原理, 所估计的模型已经使得拟合误差达到最小, 为什么还要讨论模型的
其中带“^”者表示“估计值” 。
2-3.下表列出若干对自变量与因变量。对每一对变量,你认为它们之间的关系如何?是正 的、负的、还是无法确定?并说明理由。
因变量 GNP 个人储蓄 小麦产出 美国国防开支 棒球明星本垒打的次数 总统声誉 学生计量经济学成绩 日本汽车的进口量 利率 利率 降雨量 前苏联国防开支 其年薪 任职时间 其统计学成绩 美国人均国民收入 自变量
3
或债券的收益率;rm 表示有价证券的收益率(用市场指数表示,如标准普尔 500 指数) ;t 表示时间。在投资分析中,β1 被称为债券的安全系数β,是用来度量市场的风险程度的, 即市场的发展对公司的财产有何影响。依据 1956~1976 年间 240 个月的数据,Fogler 和 Ganpathy 得到 IBM 股票的回归方程;市场指数是在芝加哥大学建立的市场有价证券指数:

计量经济学:一元线性回归模型和多元线性回顾模型习题以及解析

计量经济学:一元线性回归模型和多元线性回顾模型习题以及解析

第二章经典单方程计量经济学模型:一元线性回归模型一、内容提要本章介绍了回归分析的基本思想与基本方法。

首先,本章从总体回归模型与总体回归函数、样本回归模型与样本回归函数这两组概念开始,建立了回归分析的基本思想。

总体回归函数是对总体变量间关系的定量表述,由总体回归模型在若干基本假设下得到,但它只是建立在理论之上,在现实中只能先从总体中抽取一个样本,获得样本回归函数,并用它对总体回归函数做出统计推断。

本章的一个重点是如何获取线性的样本回归函数,主要涉及到普通最小二乘法(OLS)的学习与掌握。

同时,也介绍了极大似然估计法(ML)以及矩估计法(MM)。

本章的另一个重点是对样本回归函数能否代表总体回归函数进行统计推断,即进行所谓的统计检验。

统计检验包括两个方面,一是先检验样本回归函数与样本点的“拟合优度”,第二是检验样本回归函数与总体回归函数的“接近”程度。

后者又包括两个层次:第一,检验解释变量对被解释变量是否存在着显著的线性影响关系,通过变量的t检验完成;第二,检验回归函数与总体回归函数的“接近”程度,通过参数估计值的“区间检验”完成。

本章还有三方面的内容不容忽视。

其一,若干基本假设。

样本回归函数参数的估计以及对参数估计量的统计性质的分析以及所进行的统计推断都是建立在这些基本假设之上的。

其二,参数估计量统计性质的分析,包括小样本性质与大样本性质,尤其是无偏性、有效性与一致性构成了对样本估计量优劣的最主要的衡量准则。

Goss-markov定理表明OLS估计量是最佳线性无偏估计量。

其三,运用样本回归函数进行预测,包括被解释变量条件均值与个值的预测,以及预测置信区间的计算及其变化特征。

二、典型例题分析例1、令kids表示一名妇女生育孩子的数目,educ表示该妇女接受过教育的年数。

生育率对教育年数的简单回归模型为β+μβkids=educ+1(1)随机扰动项μ包含什么样的因素?它们可能与教育水平相关吗?(2)上述简单回归分析能够揭示教育对生育率在其他条件不变下的影响吗?请解释。

计量经济学:一元线性回归模型习题与答案

计量经济学:一元线性回归模型习题与答案

一、单选题1、假设检验采用的逻辑推理方法是A.归纳推理法B.类比推理法C.反证法D.演绎推理法正确答案:C2、在Eviews软件操作中,预测是用()命令。

A.GENERATEB.PLOTC.FORECASTD.SCAT正确答案:C3、对任意两个随机变量X和Y,若EXY=EX*EY,则()A.X和Y不独立B.X和Y相互独立C.Var(XY)=VarX*VarYD.Var(X+Y)=VarX+VarY正确答案:D4、设随机变量X1,X2,...,Xn(n>1)独立同分布,且方差σ2>0。

令随机变量Y=1n ∑X ini=1,则()A.Var(X1+Y)=n+2nσ2B.Cov(X1,Y)=1nσ2C. Var(X1−Y)=n+2nσ2D. Cov(X1,Y)=σ2正确答案:B5、设随机变量X~t(n)(n>1),Y=1X,则A. Y~F(1,n)B. Y~F(n,1)C. Y~χ2(n−1)D. Y~χ2(b)正确答案:B二、多选题1、变量的显著性T检验的步骤有哪些?A.以原假设H0构造T统计量B.对总体参数提出假设C.给定显著性水平α,查t分布表得临界值tα/2(n-2)D.比较t统计量和临界值正确答案:A、B、C、D2、随机误差项的主要影响因素是A.变量观测值的观测误差的影响B.在解释变量中被忽略的因素的影响C.都不是D.模型关系的设定误差的影响正确答案:A、B、D3、下列中属于最小二乘法基本假设的有A.解释变量X是确定性变量,不是随机变量B.m服从零均值、同方差、零协方差的正态分布:μi~N(0,σμ2) i=1,2, …,nC.随机误差项μ与解释变量X之间不相关:Cov(Xi,μi)=0i=1,2, …,nD.随着样本容量的无限增加,解释变量X的样本方差趋于一有限常数。

正确答案:A、B、C、D4、最小二乘估计量的性质A.有效性B.无偏性C.一致性D.线性性正确答案:A、B、D5、缩小置信区间的途径有哪些A.增大样本容量B.降低模型的拟合优度C.提高模型的拟合优度D.减小样本容量正确答案:A、C三、判断题1、可以通过散点图来确定模型的形式。

高中数学选择性必修三 精讲精炼 8 一元线性回归模型及其应用(精练)(含答案)

高中数学选择性必修三 精讲精炼 8  一元线性回归模型及其应用(精练)(含答案)

8.2 一元线性回归模型及其应用(精练)【题组一 样本中心求参数】1.(2021·全国·高二单元测试)某公司生产某种婴幼儿纸尿裤的产量x 与相应的生产能耗y 有如下样本数据:已知这组样本数据具有线性相关关系,由表中数据,求得回归直线的斜率为0.72,则这组样本数据的回归直线方程是( )A .ˆ0.72 2.05yx =+ B .ˆ0.720.35yx =+ C .ˆ0.720.26yx =+ D .ˆ0.350.72yx =+ 【答案】C【解析】设回归直线方程为ˆˆ0.72yx a =+,由样本数据,可得 4.5x =, 3.5y =, 因为回归直线经过点(),x y ,所以ˆ3.50.72 4.5a=⨯+,解得ˆ0.26a =, 所以回归直线方程为ˆ0.720.26yx =+. 故选:C .2.(2021·江西·吉安一中高二开学考试 )已知x 与y 之间的一组数据:()()()()13253749,,,,,,,,则y 与x 的线性回归方程为y bx a =+必过( )A .()26,B .()38,C .()2.56,D .()3.58,【答案】C【解析】由题意可知:1234 2.54x +++==,357964y +++==, ∴y 与x 的线性回归方程必过点()2.5,6.故选:C.3(2021·河南·孟津县第一高级中学 )为了庆祝建党100周年,某网站从7月1日开始推出党史类书籍免费下载活动,已知活动推出时间x (单位:天)与累计下载量y (单位:万次)的统计数据如表所示:根据上表,利用最小二乘法得到回归直线方程 1.4ˆˆyx a =+,据此模型预测,活动推出11天的累计下载量约A .13.8万次B .14.6万次C .16万次D .18万次【答案】C【解析】由表格数据知4567868910126,955x y ++++++++====,由回归直线方程的性质,得ˆ1.469a⨯+=,所以ˆ0.6a =,故ˆ 1.40.6y x =+, 所以当11x =时, 1.4110.616y =⨯+=(万次), 故选:C.4.(2021·河北·藁城新冀明中学高二月考)(多选)随着养生观念的深入,国民对餐饮卫生条件和健康营养的要求逐渐提高.据了解,烧烤食品含有强致癌物,因此吃烧烤的人数日益减少,烧烤店也随之减少.某市对2014年至2018年这五年间全市烧烤店盈利店铺的个数进行了统计,具体统计数据如下表所示:根据所给数据,得出y 关于t 的回归直线方程为273y bt =+,则下列说法正确的是( ) A .该市2014年至2018年全市烧烤店盈利店铺个数的平均数219y = B .y 关于t 的回归直线方程为18273y t =-+ C .估计该市2020年烧烤店盈利店铺的个数为147D .预测从2025年起,该市烧烤店盈利店铺的个数将不超过100 【答案】ABC【解析】由已知数据得3t =,219y =,故A 正确;因为y 关于t 的回归直线过点()3,219,所以2193273b =+,所以18b =-, 所以y 关于t 的回归直线方程为18273y t =-+.故B 正确;2020年的年份代码为7,故2020年该市烧烤店盈利店铺的个数约为187273147y =-⨯+=.故C 正确; 令18273100t -+≤,由*t N ∈,得10t ≥,故从2023年起,该市烧烤店盈利店铺的个数将不超过100.故D 不正确,故选:ABC.5.(2021·广东惠州 )(多选)某种产品的价格x (单位:元/kg )与需求量y (单位:kg )之间的对应数据如根据表中的数据可得回归直线方程为14.4y bx =+,则以下结论正确的是( ) A .y 与x 正相关 B .y 与x 负相关C .样本中心为()20,8D .该产品价格为35元/kg 时,日需求量大约为3.4kg【答案】BC【解析】由表格数据,随着价格x 的增加,需求量y 随之减少,所以y 与x 负相关. 因为1015202530205x ++++==,111086585y ++++==,故样本中心为()20,8由回归直线14.4y bx =+必过样本点的中心()20,8, 所以有82014.4b =⨯+,解得0.32b =-,所以当35x =时,0.323514.4 3.2y =-⨯+=,日需求量不为最大 故选:BC6.(2021·重庆市秀山高级中学校 )(多选)已知变量x ,y 之间的线性回归方程为0.710.3y x =-+,且变量x ,y 之间的一组相关数据如表所示,则下列说法正确的是( )A .变量x ,y 之间呈负相关关系B .可以预测,当20x 时, 3.7y =-C .4m =D .该回归直线必过点()9,4 【答案】ABD【解析】对于A :由线性回归方程为0.710.3y x =-+可知:0.70-<,所以变量x ,y 之间呈负相关关系,故对于B :当20x 时,0.72010.3 3.7y =-⨯+=-,故选项B 正确;对于C :68101294x +++==,6321144m m y ++++==,因为回归直线过样本中心点,所以110.7910.34m+=-⨯+,解得:5m =,故选项C 不正确; 对于D :由C 可知5m =,所以11544y +==,所以该回归直线必过样本中心点()9,4,故选项D 正确; 故选:ABD.7.(2021·贵州·贵阳一中 )某产品的广告费用x 与销售额y 的统计数据如下表:根据上表已得回归方程为8.6.8ˆ5yx =-,表中一数据模糊不清,请推算该数据的值为___________. 【答案】12【解析】由题中数据可得3,8.63 5.820x y ==⨯-=,故空白数据为12. 故答案为:128.(2021·全国·高二课时练习)已知x ,y 的取值如下表所示,由散点图分析可知y 与x 线性相关,且回归直线方程为ˆ0.95 2.6yx =+,那么表格中的数据m 的值为______.【答案】6.7 【解析】013424x +++==, 2.2 4.3 4.811.344m m y ++++==, 把(),x y 的坐标代入回归直线方程得11.30.952 2.64m+=⨯+, 解得 6.7m =. 故答案为:6.79.(2021·全国·高二课时练习)蟋蟀鸣叫的频率P (每分钟鸣叫的次数)与气温T (单位:℃)有着很大的关系.某观测人员根据下表中的观测数据计算出P 关于T 的线性回归方程ˆ 5.2168PT =-,则下表中k 的值为______.【答案】51【解析】计算()138414239404T =⨯+++=,()110929443644k P k +=⨯+++=, 将点10940,4k +⎛⎫ ⎪⎝⎭的坐标代入P 与T 的线性回归方程ˆ 5.2168P T =-中,得109 5.2401684k +=⨯-, 解得51k =. 故答案为:51.10.(2021·福建宁德·高三期中)某电子产品的成本价格由两部分组成,一是固定成本,二是可变成本,为确定该产品的成本,进行5次试验,收集到的数据如表:由最小二乘法得到回归方程ˆ0.6754.9yx =+,则a =___________. 【答案】75 【解析】1020304050305x ++++==,62688189600.25a y a ++++==+,因为线性回归方程过样本中心点,所以600.20.673054.975a a +=⨯+⇒=,故答案为:75 【题组二 线性回归方程】1.(2021·河北·藁城新冀明中学高二月考)假定产品产量x (千件)与单位成本y (元/件)之间存在相关关系.数据如下:(1)以x 为解释变量,y 为预报变量,作出散点图;(2)求y 与x 之间的回归直线方程,对于单位成本70元/件时,预报产量为多少; (3)计算各组残差,并计算残差平方和;【答案】(1)散点图见解析;(2)ˆ 1.8277.37yx =-+,4.050千件;(3)各组残差见解析,残差平方和为3.8182. 【解析】(1)解:散点图如下:(2)解:因为2343453.56x +++++==,737271736968716y +++++==,61279ii x==∑,611481i ii x y==∑,所以6162221614816 3.571ˆ 1.82796 3.56i i i i ix yx ybx x==-⋅-⨯⨯==≈--⨯-∑∑,ˆˆ71 1.82 3.577.37ay bx =-=+⨯=, 所以回归直线方程为ˆ 1.8277.37yx =-+,令70y =,则70 1.8277.37x =-+,解得 4.050x ≈, 所以单位成本70元/件时,预报产量约为4.050千件. (3)解:各组残差分别为:()11173 1.822ˆ77.370.73ˆey y =--⨯+=-=-, ()22272 1.82377.370.0ˆˆ9ey y =--⨯+==-, ()33371 1.82477.370.9ˆˆ1ey y =--⨯+==-, ()44473 1.82377.37 1.0ˆˆ9ey y =--⨯+==-, ()55569 1.824ˆ77.37 1.09ˆey y =--⨯+=-=-, ()66668 1.825ˆ77.370.27ˆey y =--⨯+=-=-, 残差的平方和为()()()2222621220.730.090.91 1.09 1.090.27 3.2ˆ818i i i y y=--+++--==++∑. 2.(2021·甘肃张掖)某家庭2015~2019年的年收入和年支出情况统计如表:(1)已知y 与x 具有线性相关关系,求y 关于x 的线性回归方程(系数精确到0.01);(2)假设受新冠肺炎疫情影响,该家庭2021年的年收入为9.5万元,请根据(1)中的线性回归方程预测该家庭2021年的年支出金额.附:回归方程ˆˆˆybx a =+中的斜率的最小二乘估计公式为()()()1122211ˆnni iiii i nniii i x ynx y xxy y b xnxxx====---==--∑∑∑∑.【答案】(1)ˆ0.780.24yx =+;(2)7.65万元. 【解析】(1)依题意,1(99.61010.411)105x =++++=,1(7.37.588.58.7)85y =++++=,则()5212.32i i x x=-=∑,()()511.8i ii x xy y =--=∑,则有()()()125151.8ˆ0.782.32iii ii x x y y bx x ==--==≈-∑∑,则ˆˆ0.24a y bx =-≈, 所以y 关于x 的线性回归方程为ˆ0.780.24yx =+; (2)当2021年的年收入为9.5万元时,即9.5x =,ˆ0.789.50.247.65y=⨯+=, 所以预测该家庭2021年的年支出金额为7.65万元.3.(2021·云南师大附中)大气污染物PM 2.5的浓度超过一定的限度会影响人的健康.为了研究PM 2.5的浓度是否受到汽车流量的影响,研究人员选择了24个社会经济发展水平相近的城市,在每个城市选择一个交通点统计24小时内过往的汽车流量x (单位:千辆),同时在低空相同的高度测定该时间段空气中的PM 2.5的平均浓度y(单位:μg/m 3),制作了如图所示的散点图:(1)由散点图看出,可用线性回归模型拟合y 与x 的关系,请用相关系数加以说明(精确到0.01); (2)建立y 关于x 的回归方程;(3)我国规定空气中的PM 2.5浓度的安全标准为24小时平均依度75μg/m 3,某城市为使24小时的PM 2.5浓度的平均值在60~130μg/m 3,根据上述回归方程预测汽车的24小时流量应该控制在什么范围内?附:参考数据: 1.4x =,95y =,2421() 2.1i i x x =-=∑,2421()60343i i y y =-=∑,241()()294i i i x x y y =--=∑,357.参考公式:相关系数()()nii xx y y r --∑,回归方程ˆˆˆya bx =+中斜率和截距的最小二乘估计公式分别为:121()()ˆ()niii nii x x yy b x x ==--=-∑∑,ˆˆay bx =-. 【答案】(1)答案见解析;(2)140101y x =-;(3)24小时的车流量应该控制在1150~1650辆. 【解析】1)由题得2940.82357r =≈, 因为y 与x 的相关系数近似为0.82,说明y 与x 具有很强的相关性, 从而可以用线性回归模型拟合y 与x 的关系.(2)由95y =得2412421()()ˆ()iii ii x x y y bx x ==--=-∑∑2941402.1==,95140 1.4101a y bx =-=-⨯=-, 所以y 关于x 的回归方程为140101y x =-. (3)当60y =时,由14010160x -=得 1.15x =; 当130y =时,由140101130x -=得 1.65x =. 所以24小时的车流量应该控制在1150~1650辆.4.(2021·全国·高三专题练习)实施新规后,某商场2020年1月份至10月份的收入情况如表.并计算得101890i i i x y ==∑,1021385i i x ==∑,101150i i y ==∑75.99.(1)是否可用线性回归模型拟合y 与x 的关系?请用相关系数r 加以说明;(当0.751r ≤≤时,那么变量x ,y 有较强的线性相关关系)(2)建立y 关于x 的回归方程ˆˆˆybx a =+(结果保留1位小数),并预测该商场12月份的收入情况.(结果保留整数)附:()()()1122211ˆn niii ii i nniii i x x y y x y nx ybx x xnx====---==--∑∑∑∑,ˆˆay bx =-. 【答案】(1)y 与x 有较强的线性相关关系,可用线性回归模型拟合,说明答案见解析;(2)ˆ0.810.7yx =+,预测该商场12月份的收入为20万元.【解析】(1)由题中数据得1011155 5.51010i i x x ===⨯=∑,10111150151010i i y y ===⨯=∑,1010 5.515825x y =⨯⨯=,于是得1010111()()1089082565i i i i i x x y y x y y x ==--=-=-=∑∑,75.99,从而10()()650.8675.99iix x y y r --==≈∑,0.75||1r ≤≤, 所以y 与x 有较强的线性相关关系,可用线性回归模型拟合;(2)由(1)知1011065i i i x y x y =-=∑,而1021385i i x ==∑,221010 5.5302.5x =⨯=,从而得10122110106565ˆ0.8385302.582.510i ii i i x y ybx xx ==-===≈--∑∑,65ˆˆ15 5.510.782.5ay bx =-=-⨯=, 所以y 关于x 的线性回归方程为ˆ0.810.7yx =+,当12x =时,ˆ0.81210.720y =⨯+≈, 从而预测该商场12月份的收入为20万元.5(2021·河南许昌 )某新型外贸出口公司对2021年过去9个月的出口销售数据进行整理,得到了今年第x 个月份与截止该月底的销售额y (单位:万元)之间的关系,如下表:(1)若y 与x 满足线性关系,求出y 关于x 的回归方程;(ˆa,ˆb 精确到整数位) (2)预测该公司10月份的销售额附:参考数据:913087i i y ==∑;9117524i i i x y ==∑;921285i i x ==∑;参考公式:()()()1122211n niii ii i nniii i x x y y x y nx yb x x xnx====---==--∑∑∑∑,a y bx =-.【答案】(1)ˆ35169yx =+;(2)答案见解析. 【解析】(1)5x =,343y =,919175249534317524154352089i i i x y xy =∴-=-⨯⨯=-=∑92221952859560ii x=-⨯=-⨯=∑,2089ˆ3560b ∴=≈, 2089ˆ343516960a=-⨯≈, ˆ35169yx ∴=+ (2)当10x =时,ˆ3510169519y=⨯+=, 所以预测该公司10月份销售额为519万元.6.(2021·福建·莆田第二十五中学高三月考)2021年东京奥运会,中国举重选手8人参赛,7金1银,在全世界面前展现了真正的中国力量;举重比赛根据体重进行分级,某次举重比赛中,男子举重按运动员体重分为下列十级:每个级别的比赛分为抓举与挺举两个部分,最后综合两部分的成绩得出总成绩,所举重量最大者获胜,在该次举重比赛中,获得金牌的运动员的体重以及举重成绩如下表 (1)根据表中的数据,求出运动员举重成绩y 与运动员的体重x 的回归直线方程(保留1位小数); (2)某金牌运动员抓举成绩为170公斤,挺举成绩为204公斤,则该运动员最有可能是参加的哪个级别的举重?参考数据:()()()992112620,7076i i i i i x x x x y y ==-=--=∑∑;参考公式:()()()121ˆˆˆ,niii nii x x yy bay bx xx ==--==--∑∑. 【答案】(1) 2.7155.4y x =+;(2)83公斤级举重. 【解析】(1)依题意,5459647076839199106789x ++++++++==,2913043373533633894064214303669y ++++++++==,()()()1217076ˆ 2.702620nii i nii xx y y bxx ==--===-∑∑, 则366 2.778155.4a y bx =-=-⨯=, 故回归方程为: 2.7155.4y x =+.(2)该运动员的抓举和挺举的总成绩为374公斤,根据回归方程可知:374 2.7155.4x =+, 解得81x ≈,即该运动员的体重应该在81公斤左右,即参加的应该是83公斤级举重.7.(2021·西藏·拉萨中学高二月考)珠海国际赛车场(简称ZIC)位于珠海经济特区金鼎镇.创建于1996年,是中国国内第一座符合国际汽车联盟一级方程式标准的国际级赛车场.目前该赛事已打造成集赛车竞技运动、汽车文化极致体验、主题休闲度假为一体的超级汽车文化赛事娱乐综合体.为了减少对环境的污染,某环保部门租用了特制环保车清洁现场垃圾.通过查阅近5年参会人数(万人)与所需环保车辆数量(辆),得到如下统计表:(1)根据统计表所给5组数据,求出关于,x y 的线性回归方程ˆˆy bxa =+. (2)已知租用的环保车平均每辆的使用成本费用C (元)与数量(辆)的关系为3000200035,N 2900t t 35,N t t t C t +<<∈⎧=⎨≥∈⎩,主办方根据实际参会人数投入所需环保车,租车每辆支付费用6000元,超出实际需要的车辆,主办方不支付任何费用.预计本次赛车会大约有14万人参加,根据(1)中求出的线性回归方程,预测环保部门在确保清洁任务完成的前提下,应租用多少辆环保车?获得的利润是多少? (注:利润L =主办方支付费用-使用成本费用C ).参考公式:()()()1122211ˆ,ˆˆn niii ii i nniii i x x y y x y nxybay bx x x xnx ====---===---∑∑∑∑ 【答案】(1) 2.32y x =+;(2)为确保完成任务,需要租用35辆环保车,获得的利润108500元. 【解析】(1)11981012105x ++++==2823202529255y ++++== ()()()()()()()()()22222131******** 2.310111091081010101210ˆb ⨯+-⨯-+-⨯-++⨯===-+-+-+-+- ˆˆ2ay bx =-= 关于,x y 的线性回归方程 2.32y x =+ (2)将14x =代入 2.32y x =+得34.2y =为确保完成任务,需要租用35辆环保车, 所以290035101500C =⨯=获得的利润600035101500108500L =⨯-=元8.(2021·江西·新余市第一中学高二月考)某研究性学习小组对春季昼夜温差大小与某花卉种子发芽多少之间的关系进行研究,他们分别记录了3月1日至3月5日的每天昼夜温差与实验室每天每100颗种子浸泡后的发芽数,得到如下资料:(1)从3月1日至3月5日中任选2天,记发芽的种子数分别为m ,n ,求事件“m ,n 中至少有一个数小于25”的概率;(2)请根据3月2日至3月4日的数据,求出y 关于x 的线性回归方程y bx a =+.(参考公式:回归直线方程为y bx a =+,其中()1221ni ii nii x y nxyb xn x==-=-∑∑,a y bx =-)【答案】(1)710(2)532y x =-【解析】(1)从3月1日至3月5日中任选2天,m ,n 构成的基本事件(m ,n )有:(23,25),(23,30),(23,26),(23,16),(25,30),(25,26),(25,16),(30,26),(30,16),(26,16),共有10个.记“m ,n 至少有一个数小于25”为事件A ,包括:(23,25),(23,30),(23,26),(23,16),(25,16),30,16),(26,16),共有7个基本事件 由古典概型概率公式:7()10P A = (2)11131225302612,27,33x y ++++==== 22221125133012263122751113123122b ⨯+⨯+⨯-⨯⨯==++-⨯. 于是,5271232a =-⨯=-故所求线性回归方程为532y x =- 9.(2021·全国·高二单元测试)某地区2013年至2019年居民纯收入y (单位:千元)的部分数据如表所示:2018和2019年的居民纯收入y (单位:千元)数据采用随机抽样的方式获得,用样本的均值来代替当年的居民人均纯收入,其数据如下:2018年抽取的居民纯收入(单位:千元)数据:5.2 4.8 6.5 5.6 6.0 7.1 6.1 7.3 5.9 7.5 2019年抽取的居民纯收入(单位:千元)数据:6.2 7.8 6.6 5.8 7.1 6.8 7.2 7.9 5.9 7.7 (1)求y 关于t 的线性回归方程;(2)当地政府为了提高居民收入水平,现从2018和2019年居民纯收入(单位:千元)高于7.0千元的样本中随机选择3人进行座谈,了解其工作行业及主要收入来源.设X 为选出的3人中2018年纯收入高于7.0千元的人数,求随机变量X 的分布列和数学期望.附:回归直线的斜率和截距的最小二乘法估计公式分别为:121()()()niii nii t t y y b tt ==--=-∑∑,a y bt =-.【答案】(1)ˆ0.5 3.3yt =+;(2)分布列见解析;期望为98. 【解析】(1)根据2018年的抽样数据可得2018年的人均纯收入为1(5.2 4.8 6.5 5.6 6.07.1 6.17.3 5.97.5) 6.210+++++++++= 千元,根据2019年的抽样数据可得2019年的人均纯收入为1(6.27.8 6.6 5.87.1 6.87.27.9 5.97.75) 6.910+++++++++=千元,由所给的数据得1(1234567)47t =++++++=,1(3.9 4.3 4.6 5.4 5.8 6.2 6.9) 5.37y =++++++=, ∴721()941014928i i t t =-=++++++=∑,71()()(3)( 1.4)(2)(1)(1)(0.7)00.110.520.93 1.614ii i tt y y =--=-⨯-+-⨯-+-⨯-+⨯+⨯+⨯+⨯=∑,∴71721()()14ˆ0.528()ii i ii tt y y btt ==--===-∑∑, 则ˆˆ 5.30.54 3.3ay bt =-=-⨯=, 则所求y 关于t 的线性回归方程为ˆ0.5 3.3yt =+; (2)由2018年和2019年的抽样数据可知,2018年居民纯收入高于7.0千元的有3人,2019年居民纯收入高于7.0千元的有5人,由题意可得,随机变量X 的可能取值为0,1,2,3,则35385(0)28C P X C ===,12353815(1)28C C P X C ===,21353815(2)56C C P X C ===,33381(1)56C P X C ===,∴随机变量X 的分布列为则X 的分布列为:则5151519()0123282856568E X =⨯+⨯+⨯+⨯= 【题组三 非线性回归方程】1.(2021·福建·泉州科技中学 )数独是源自18世纪瑞士的一种数学游戏,玩家需要根据99⨯盘面上的已知数字,推理出所有剩余空格的数字,并满足每一行、每一列、每一个粗线宫(33⨯)内的数字均含1﹣9,不重复.数独爱好者小明打算报名参加“丝路杯”全国数独大赛初级组的比赛.(1)赛前小明在某数独APP 上进行一段时间的训练,每天的解题平均速度y (秒)与训练天数x (天)有关,经统计得到如表的数据:现用by a x=+作为回归方程模型,请利用表中数据,求出该回归方程,并预测小明经过100天训练后,每天解题的平均速度y约为多少秒?(2)小明和小红在数独APP 上玩“对战赛”,每局两人同时开始解一道数独题,先解出题的人获胜,两人约定先胜4局者赢得比赛.若小明每局获胜的概率为34,已知在前3局中小明胜2局,小红胜1局.若不存在平局,请你估计小明最终赢得比赛的概率.参考数据(其中1i t x =)参考公式:对于一组数据()11,u v ,()22,u v ,…,(),n n u v ,其回归直线v u αβ=+的斜率和截距的最小二乘估计公式分别为:1221ni i i nii u v nu vunuβ==-⋅=-∑∑,v u αβ=-⋅.【答案】(1)1000130y x=+,经过100天训练后,每天解题的平均速度y 约为140秒;(2)243256.【解析】(1)由题意,1(990990450320300240210)5007y =++++++=,令1t x=,设y 关于t 的线性回归方程为y bt a =+,则 717221184570.3750010000.5577i ii i i t y t yb t t==-⨯-⨯-===⋅∑∑,则50010000.37130a =-⨯=. ∴1000130y t =+,又1t x=,∴y 关于x 的回归方程为1000130y x=+, 故100x =时,140y =.∴经过100天训练后,每天解题的平均速度y 约为140秒.(2)设比赛再继续进行X 局小明最终赢得比赛,则最后一局一定是小明获胜, 由题意知,最多再进行4局就有胜负.当2X =时,小明4:1胜,∴339(2)4416P X ==⨯=;当3X =时,小明4:2胜,∴123339(3)144432P X C ⎛⎫==⨯⨯-⨯= ⎪⎝⎭;当4X =时,小明4:3胜,∴21333327(4)1444256P X C ⎛⎫==⨯⨯-⨯= ⎪⎝⎭.∴小明最终赢得比赛的概率为99272431632256256++=. 2.(2021·云南大理 )2021年6月17日9时22分,我国酒泉卫星发射中心用长征2F 遥十二运载火箭,成功将神舟十二号载人飞船送入预定轨道,顺利将聂海胜、刘伯明、汤洪波3名航天员送入太空,发射取得圆满成功,这标志着中国人首次进入自己的空间站.某公司负责生产的A 型材料是神舟十二号的重要零件,该材料应用前景十分广泛.该公司为了将A 型材料更好地投入商用,拟对A 型材料进行应用改造、根据市场调研与模拟,得到应用改造投入x (亿元)与产品的直接收益y (亿元)的数据统计如下:当017x <≤时,建立了y 与x 的两个回归模型:模型①: 4.1109ˆ.y x =+,模型②:ˆ14.4y =;当17x >时,确定y 与x 满足的线性回归方程为ˆˆ0.7yx a =-+. (1)根据下列表格中的数据,比较当017x <≤时模型①,②的相关指数2R 的大小,并选择拟合精度更高、更可靠的模型,预测对A 型材料进行应用改造的投入为17亿元时的直接收益;(2)为鼓励科技创新,当应用改造的投入不少于20亿元时,国家给予公司补贴5亿元,以回归方程为预测依据,根据(1)中选择的拟合精度更高更可靠的模型,比较投入17亿元与20亿元时公司收益(直接收益+国家补贴)的大小.附:刻画回归效果的相关指数()()22121ˆ1ni i i nii y yR y y ==-=--∑∑,且当2R 越大时,4.1≈.用最小二乘法求线性回归方程ˆˆˆybx a =+的截距:ˆˆa y bx =-. 【答案】(1)模型②拟合精度更高、更可靠,72.93亿;(2)投入17亿元比投入20亿元时收益小. 【解析】(1)对于模型①, 对应的15222740485460=387y ++++++=,故对应的()12222111271750i i i i y y y y ==-=-=∑∑,故对应的相关指数2179.1310.9551750R =-≈, 对于模型②,同理对应的相关指数2220.210.9881750R =-≈, 故模型②拟合精度更高、更可靠.故对A 型材料进行应用改造的投入为17亿元时的直接收益为ˆ14.472.93=≈y. (2)当17x >时, 后五组的2122232425235x ++++==,68.56867.5+66+65675y ++==,由最小二乘法可得()ˆ670.72383.1a=--⨯=, 故当投入20亿元时公司收益(直接收益+国家补贴)的大小为:0.72083.1+574.172.93-⨯+=>,故投入17亿元比投入20亿元时收益小.3.(2021·全国·高二单元测试)某企业新研发了一种产品,产品的成本由原料成本及非原料成本组成,每件产品的非原料成本y (元)与生产的产品数量x (千件)有关,经统计得到如下数据:根据以上数据,绘制了如下散点图.参考数据:(其中1iu x =) (1)观察散点图判断,by a x=+与y c dx =+哪一个适宜作为非原料成本y 与生产的产品数量x 的回归方程类型?(给出判断即可,不必说明理由)(2)根据(1)的判断结果及表中数据,建立y 关于x 的回归方程; (3)试预测生产该产品10千件时,每件产品的非原料成本为多少元? 【答案】(1)b y a x =+;(2)100ˆ11y x=+;(3)21元.【解析】(1)由题意,根据题设中的散点图,可得这些点分布在b y a x =+的两侧,所以选择函数by a x=+作为非原料成本y 与生产的产品数量x 的回归方程类型. (2)令1u x =,则by a x=+可转化为y a bu =+,则y 与u 的关系可看成线性相关关系. 因为360458y ==,所以8182218183.480.344561ˆ1001.5380.1150.618i ii ii u yu y b uu==-⋅-⨯⨯====-⨯-∑∑,则ˆˆ451000.3411a y bu =-=-⨯=,所以ˆ11100y u =+,代入1u x =,得100ˆ11y x=+.(3)当10x =时,100ˆ112110y=+=,所以预测生产该产品10千件时,每件产品的非原料成本为21元. 4.(2021·全国·高三课时练习)某芯片公司为制订下一年的研发投入计划,需了解年研发资金投入量x (单位:亿元)对年销售额y (单位:亿元)的影响,该公司对历史数据进行对比分析,建立了两个函数模型:①2y x αβ=+,②e x t y λ+=,其中α,β,λ,t 均为常数,e 为自然对数的底数.现该公司对收集的近12年的年研发资金投入量i x 和年销售额i y (1,2,,12i =⋅⋅⋅)的数据作了初步处理,令2u x =,ln v y =,经计算得到如下数据:(1)设u 和y 的样本相关系数为1r ,x 和v 的样本相关系数为2r ,请从样本相关系数(精确到0.01)的角度判断,哪个模型拟合效果更好;(2)(i)根据(1)的选择及表中数据,建立y 关于x 的非线性经验回归方程;(ii)若下一年销售额y 需达到90亿元,预测下一年的研发资金投入量x 约为多少亿元? 参考数据为308477=⨯9.4868, 4.4998e 90≈.【答案】(1)模型e x t y λ+=的拟合效果更好;(2)(i)0.018 3.84ˆe x y+=;(ii)36.66亿元. 【解析】(1)()()121215000.8625000iiu u y y r --====∑,()()12214100.91770.211iix x v v r --====≈⨯∑,因为12r r <,所以从样本相关系数的角度判断,模型e x t y λ+=的拟合效果更好. (2)(i)先建立v 关于x 的经验回归方程. 由e x t y λ+=,得ln y x t λ=+,即v λx t =+.()()()121122114ˆ0.018770iii ii x x v v x x λ==--==≈-∑∑, ˆˆ 4.20.01820 3.84tv x λ=-=-⨯=, 所以v 关于x 的经验回归方程为0.01838ˆ.4vx +=, 所以0.0134ˆln 8.8x y=+,即0.018 3.84ˆe x y +=.(ii)若下一年销售额y 需达到90亿元,则由0.018 3.84ˆe x y+=,得0.018 3.8490e x +=, 又 4.4998e 90≈,所以4.49980.018 3.84x ≈+, 所以 4.4998 3.8436.660.018x -≈≈,所以预测下一年的研发资金投入量约为36.66亿元.5.(2021·全国·高二课时练习)噪声污染已经成为影响人们身体健康和生活质量的严重问题,为了解声音强度D (单位:dB )与声音能量I (单位:2W cm -⋅)之间的关系,将测量得到的声音强度D 和声音能量I 的数据作了初步处理,得到如图所示的散点图:参考数据:111.0410I -⨯=,45.7D =,11.5W =-,()1022111.5610i i I I-=-=⨯∑,()10210.51i i W W=-=∑,()()101116.8810iii IID D -=--=⨯∑,()()1015.1i i i W W D D =-⋅-=∑,其中lg i i W I =,101110i i W W ==∑.(1)根据散点图判断,11D a b I =+与22lg D a b I =+哪一个适宜作为声音强度D 关于声音能量I 的回归模型?(给出判断即可,不必说明理由)(2)求声音强度D 关于声音能量I 的非线性经验回归方程.(3)假定当声音强度大于60dB 时,会产生噪声污染.城市中某点P 处共受到两个声源的影响,这两个声源的声音能量分别是a I 和b I ,且101410a bI I +=.已知点P 处的声音能量等于a I 与b I 之和.请根据(2)中的非线性经验回归方程,判断点P 处是否受到噪声污染,并说明理由.【答案】(1)22lg D a b I =+更适合;(2)ˆ10lg 160.7DI =+;(3)P 会受到噪声污染,理由见解析. 【解析】(1)22lg D a b I =+更适合. (2)设ˆˆD bW a =+,则 ∵()()()10110215.1ˆ100.51iii i i W W D D bW W==--===-∑∑, ∴ˆˆ160.7a D bW=-=, ∴D 关于W 的经验回归方程是ˆ10160.7DW =+,则D 关于I 的非线性经验回归方程是ˆ10lg 160.7DI =+. (3)设点P 处的声音能量为1I ,则1a b I I I =+. ∵101410a bI I +=, ∴()101010141410105910b a a b a b a b a b I I I I I I I I I I I ---=+=++=++≥⎛⎫⎛⎫ ⎪⎝⨯ ⎪⎝⎭⎭(当且仅当10310a I =,93510bI =⨯时等号成立) 根据(2)中非线性经验回归方程,知点P 处的声音强度D 的预报值的最小值,()10min 10lg 910160.710lg960.760D -=⨯+=+>,∴点P 会受到噪声污染.6.(2021·福建·福州三中高二期中)某地从2月20日开始的连续7天的某传染病累计确诊人数如下表:由上述表格得到如下散点图.(1)根据散点图判断lg =+y a b x 与x y c d =⋅(,c d 均为大于0的常数)哪一个更适合作为累计确诊人数y 与天数x 的回归方程类型(给出判断即可,不必说明理由),并求出y 关于x 的回归方程;(2)3月20日,该地的疾控中心接受了1000份血液样本,假设每份样本的检验结果是阳性还是阴性是相互独立的,且每份样本是阳性的概率是0.6,试剂把阳性样本检测出阳性结果的概率是0.99(试剂存在阳性样本检测不出来的情况,但不会把阴性样本检测呈阳性样本),求这1000份样本中检测出呈阳性的份数的期望.参考数据:其中11lg ,7i i i i v y v v ===∑参考公式:对于一组数据()()()1122,,,,,,n n u v u v u v ⋯,其回归直线ˆvu αβ=+的斜率和截距的最小二乘估计公式分别为1221,ni i i ni i u v nuvv u unuβαβ==-==--∑∑,v u αβ=-.【答案】(1)0.253.4710x x y c d y =⋅=⨯; (2)594【解析】(1)由散点图可知,x y c d =⋅更适合作为累计确诊人数y 与天数x 的回归方程类型. 把x y c d =⋅两边取对数,得lg lg lg y c x d =+, 令lg v y =,则lg lg v c x d =+,1(1234567)47x =++++++=,7211.54140i i v x ===∑,, 7172221750.1274 1.54lg 0.25140747i i i i i x v xvd x x==--⨯⨯===-⨯-∑∑,所以lg 1.540.2540.54c =-⨯=,则0.540.25v x =+, 所以y 关于x 的回归方程为0.253.4710x y =⨯; (2)设这1000份样本中检测出呈阳性的份数为X , 每份样本检测出阳性的概率为0.60.990.594P =⨯=, 由题意可知,(10000.594)XB ,,所以()10000.594594E X =⨯=份.故这1000份样本中检测出呈阳性的份数的期望为594.7.(2021·山西太原·高二期中(文))为了更好的指导青少年健康饮食,某机构调查了本地区不同身高的未成年男性,得到他们的体重的平均值,并对数据作了初步处理,得到下面的散点图及一些统计量的值.表中ln i i w y =(1)根据散点图判断,可采用x y a b =⋅作为这个地区未成年男性体重y 千克与身高x 厘米的回归方程.利用表中数据建立y 关于x 的回归方程;(2)若体重超过相同身高男性体重平均值的1.2倍为偏胖,低于0.8倍为偏瘦,那么该地区一名身高为175厘米,体重为78千克的在校男生的体重是否正常? 参考数据:0.020.71751.02,2,1.0231.99e e ===. 参考公式:对于一组数据()()()1122,,,,,,n n u v u v u v ,其回归直线v u αβ=+的斜率和截距的最小二乘估计分别为()()()121ˆˆˆ,nii i nii uu v v v u uu βαβ==--==--∑∑.【答案】(1)2 1.02x y =⨯;(2)体重偏胖. 【解析】(1)由x y a b =⋅,得ln ln ln y a x b =+⋅, 设ˆˆˆw cx d=+,由表格中数据,得801ˆ0.02400050c ===, ˆ 3.40.021350.7d=-⨯=, 则0.70.02ln 0.7,ln 0.02,2, 1.02a b a e b e ======, 则y 关于x 的回归方程为2 1.02x y =⨯.(2)当175x =时,1752 1.02231.9963.98y =⨯=⨯=,因为63.98 1.276.77678⨯=<,所以该名在校男生的体重偏胖.。

统计学一元线性回归课后习题答案

统计学一元线性回归课后习题答案
地区 北京 辽宁 上海 江西 河南 贵州 陕西 人均GDP(元) 22 460 11 226 34 547 4 851 5 444 2 662 4 549 人均消费水平(元) 7 326 4 490 11 546 2 396 2 208 1 608 2 035
要求: (1)人均GDP作自变量,人均消费水平作因变量,绘制散点图,并 说明二者之间的关系形态。
置信区间为
ˆ y0 t 2 ( n 2) se 1 n
x0 x 2 n xi x 2
i 1
1 2278.1078 2.5706*61159.007 7 13625127.29 1990.74915<E(y)2565.46399 人均GDP为5 000元时,人均消费水平95%的 置信区间为[1990.74915,2565.46399]
根据图表显示,二者可能存在正线性相关关系
(2)计算线性相关系数,说明两个变量之间的关系强度
运送距离x 运送距离x 1
运送时间y
运送时间y
0.94894
1
x与y的简单相关系数是0.9489,两 变量之间呈现高度正相关关系
(3)利用最小二乘法求出估计的回归方程,并解释回归系数的实际意义 ^ ^ ^= + x 最小二乘估计:y 0 1
(1)绘制产量与生产费用的散点图,判断二者之间的关系形态。
产量与生产费用 200 180 160 140 120 100 80 60 40 20 0 0 20 40 60 80 产量 100 120 140 160 系列1
费用
产量和费用存在正的线性相关系数
2)计算产量与生产费用之间的线性相关系数。
(1)绘制运送距离和运送时间的散点图,判断二者之间的关系形 态 (2)计算线性相关系数,说明两个变量之间的关系强度。 (3)利用最小二乘法求出估计的回归方程,并解释回归系数的实 际意义。

计量经济学习题第2章-一元线性回归模型

计量经济学习题第2章-一元线性回归模型

第2章 一元线性回归模型一、单项选择题1、变量之间的关系可以分为两大类__________。

A 函数关系与相关关系B 线性相关关系和非线性相关关系C 正相关关系和负相关关系D 简单相关关系和复杂相关关系 2、相关关系是指__________。

A 变量间的非独立关系B 变量间的因果关系C 变量间的函数关系D 变量间不确定性的依存关系 3、进行相关分析时的两个变量__________。

A 都是随机变量B 都不是随机变量C 一个是随机变量,一个不是随机变量D 随机的或非随机都可以 4、表示x 和y 之间真实线性关系的是__________。

A 01ˆˆˆt tY X ββ=+ B 01()t t E Y X ββ=+ C 01t t t Y X u ββ=++ D 01t t Y X ββ=+5、参数β的估计量ˆβ具备有效性是指__________。

A ˆvar ()=0βB ˆvar ()β为最小C ˆ()0ββ-= D ˆ()ββ-为最小 6、对于01ˆˆi i iY X e ββ=++,以σˆ表示估计标准误差,Y ˆ表示回归值,则__________。

A i i ˆˆ0Y Y 0σ∑=时,(-)=B 2iiˆˆ0Y Y σ∑=时,(-)=0 C ii ˆˆ0Y Y σ∑=时,(-)为最小 D 2iiˆˆ0Y Yσ∑=时,(-)为最小 7、设样本回归模型为i 01i i ˆˆY =X +e ββ+,则普通最小二乘法确定的i ˆβ的公式中,错误的是__________。

A ()()()i i 12iX X Y -Y ˆX X β--∑∑=B ()i iii122iin X Y -X Y ˆn X -X β∑∑∑∑∑=C ii122iX Y -nXY ˆX -nXβ∑∑= D i i ii12xn X Y -X Y ˆβσ∑∑∑=8、对于i 01i iˆˆY =X +e ββ+,以ˆσ表示估计标准误差,r 表示相关系数,则有__________。

统计学一元线性回归课后习题答案

统计学一元线性回归课后习题答案

表示实际值与估计值之间的差异程度是0.5
11.5一家物流公司的管理人员想研究货物的运输距离和运输时 间的关系,为此,他抽出了公司最近10个卡车的运货记录的随 机样本,得到运送距离(单位:km)和运送时间(单位:天) 的数据如下表:
运送距离x 825 215 1070 550 480 920 1350 325 670 1215
要求: (1)人均GDP作自变量,人均消费水平作因变量,绘制散点图,并
说明二者之间的关系形态。
人均消费水平
14000 12000 10000
8000 6000 4000 2000
0 0
系列1
10000
20000 人均GDP
30000
40000
产量和生产费用之间存在着正的线性相关关系
(2)计算两个变量之间的线性相关系数,说明两个变量之 间的关系强度。
某地区的人均GDP为5 000元,预测其人均消费 水平为2278.1078元。
(7)求人均GDP为5 000元时,人均消费水平95%的置信区 间和预测区间。
解:已知n=7,t(7-2)=2.5706
n
yi yˆi 2
se
i 1
n2

置信区间为
SSE n2
305795.0343 61159.007 5
ˆ1

7*651007421 2710124051
7*1904918867 857392
=0.308683
ˆ0 4515.571429 0.308683*12248.428
=734.6928
y = 734.6928 + 0.308683x
回归系数的含义:人均GDP每增加1元, 人均消费增加0.309元。

计量经济学习题第2章-一元线性回归模型

计量经济学习题第2章-一元线性回归模型

第2章 一元线性回归模型一、单项选择题1、变量之间的关系可以分为两大类。

A 函数关系与相关关系B 线性相关关系和非线性相关关系C 正相关关系和负相关关系D 简单相关关系和复杂相关关系 2、相关关系是指。

A 变量间的非独立关系B 变量间的因果关系C 变量间的函数关系D 变量间不确定性的依存关系 3、进行相关分析时的两个变量。

A 都是随机变量B 都不是随机变量C 一个是随机变量,一个不是随机变量D 随机的或非随机都可以 4、表示x 和y 之间真实线性关系的是。

A 01ˆˆˆt tY X ββ=+ B 01()t t E Y X ββ=+ C 01t t t Y X u ββ=++ D 01t t Y X ββ=+5、参数β的估计量ˆβ具备有效性是指。

A ˆvar ()=0βB ˆvar ()β为最小C ˆ()0ββ-= D ˆ()ββ-为最小 6、对于01ˆˆi i i Y X e ββ=++,以σˆ表示估计标准误差,Y ˆ表示回归值,则。

A i i ˆˆ0Y Y 0σ∑=时,(-)=B 2iiˆˆ0Y Y σ∑=时,(-)=0 C ii ˆˆ0Y Y σ∑=时,(-)为最小 D 2iiˆˆ0Y Yσ∑=时,(-)为最小 7、设样本回归模型为i 01i i ˆˆY =X +e ββ+,则普通最小二乘法确定的i ˆβ的公式中,错误的是。

A ()()()i i 12iX X Y -Y ˆX X β--∑∑=B()i iii122iin X Y -X Y ˆn X -X β∑∑∑∑∑=C ii122iX Y -nXY ˆX -nXβ∑∑= D i i ii12xn X Y -X Y ˆβσ∑∑∑=8、对于i 01i iˆˆY =X +e ββ+,以ˆσ表示估计标准误差,r 表示相关系数,则有。

A ˆ0r=1σ=时, B ˆ0r=-1σ=时, C ˆ0r=0σ=时, D ˆ0r=1r=-1σ=时,或 9、产量(X ,台)与单位产品成本(Y ,元/台)之间的回归方程为ˆY 356 1.5X -=,这说明。

计量经济学第三版课后习题答案第二章 经典单方程计量经济学模型:一元线性回归模型

计量经济学第三版课后习题答案第二章  经典单方程计量经济学模型:一元线性回归模型

第二章经典单方程计量经济学模型:一元线性回归模型一、内容提要本章介绍了回归分析的基本思想与基本方法。

首先,本章从总体回归模型与总体回归样本回归模型与样本回归函数这两组概念开始,在现实中只能先从总体中抽取一个样本,本章的一个重点是如何获取线性的样本回归函数,主要涉及到普通最小二乘法(本章的另一个重点是对样本回归函数能否代表总体回归函数进行统计推断,即进行所统计检验包括两个方面,本章还有三方面的内容不容忽视。

其一,若干基本假设。

样本回归函数参数的估计以参数估计量统计性质的分析,例1、令kids运用样本回归函数进行预测,建立了回归分析的基本思想。

由总体回归模型在若干基本假设下得到,获得样本回归函数,ML)以及矩估计法(一是先检验样本回归函数与样本点的Goss-markov包括被解释变量条件均值与个educ表示该妇女接受过教育的年数。

生总体回但它只是并用它对总OLS)MM)。

“拟合优度”,t检验完成;第二,OLS估计量1函数、归函数是对总体变量间关系的定量表述,建立在理论之上,体回归函数做出统计推断。

的学习与掌握。

同时,也介绍了极大似然估计法(谓的统计检验。

第二是检验样本回归函数与总体回归函数的“接近”程度。

后者又包括两个层次:第一,检验解释变量对被解释变量是否存在着显著的线性影响关系,通过变量的检验回归函数与总体回归函数的“接近”程度,通过参数估计值的“区间检验”完成。

及对参数估计量的统计性质的分析以及所进行的统计推断都是建立在这些基本假设之上的。

其二,包括小样本性质与大样本性质,尤其是无偏性、有效性与一致性构成了对样本估计量优劣的最主要的衡量准则。

定理表明是最佳线性无偏估计量。

其三,值的预测,以及预测置信区间的计算及其变化特征。

二、典型例题分析表示一名妇女生育孩子的数目,育率对教育年数的简单回归模型为(1)随机扰动项包含什么样的因素?它们可能与教育水平相关吗?(2)上述简单回归分析能够揭示教育对生育率在其他条件不变下的影响吗?请解释。

统计学一元线性回归课后习题答案

统计学一元线性回归课后习题答案

(1)绘制运送距离和运送时间的散点图,判断二者之间的关系形 态 (2)计算线性相关系数,说明两个变量之间的关系强度。 (3)利用最小二乘法求出估计的回归方程,并解释回归系数的实 际意义。
(1)绘制运送距离和运送时间的散点图,判断二者之间的关系形态
6.0 5.0
运送时间(天)
4.0 3.0 2.0 1.0 0.0 0 200 400 600 800 1000 运送距离(公里) 1200 1400 1600
确定显著性水平=0.05,并根据分子自由度1和分母自 由度7-2找出临界值F =6.61 作出决策:若F>F ,拒绝H0,线性关系显著
(6)如果某地区的人均GDP为5 000元,预测其人均消费水平。
y = 734.6928+ 0.308683 x
y = 734.6928+ 0.308683 *5000=2278.1078
2
8*(202 162 ... 222 ) 20 16 ... 22 8*(64 2 612 ... 77 2 ) (64 61 ... 77)
r=0.8621
11.3、根据一组数据建立的线性回归方程 要求: ˆ 的意义。 1)解释截距 0 ˆ 1)解释斜率 1的意义。 2)当=6时的E(y)
系列
二者之间为负的线性相关关系
2)用航班正点率作自变量,建立估计的回归方程,并解释 回归系数的意义
Coefficient s Intercept 429.8986352
标准误差 74.97337331
t Stat 5.734018
P-value 0.000437
航班正点率
-4.7011299
0.985891202

统计学一元线性回归课后习题答案

统计学一元线性回归课后习题答案

6.0
5.0 ) 天 4.0 ( 间 3.0 时 送 2.0 运
1.0
0.0 0
200
400
600
800 1000 1200 1400 1600
运送距离(公里)
根据图表显示,二者可能存在正线性相关关系
(2)计算线性相关系数,说明两个变量之间的关系强度
运送距离x 运送时间 y
运送距离 x
1
运送时间y 0.94894
r?
n ? xy ? ? x ? y
n ? x 2 ? ?? ?x 2 ? n ? y 2 ? ?? ?y 2
?
7*651007421 ? 2710124051
? 0.998123
7*1904918867 ? ?85739 ?2 ? 7*1346900766 ? ?31609 ?2
说明两个变量之间高度相关
s??1 0.98589
t ? ??1 ~ t(8) =2.201
s??1
t=4.7684>t???=2.201,拒绝H0,回归 系数显著
4)如果航班正点率为80%,估计顾客投诉次数
y?80 =429.897-4.7*80=54.2
5)求航班正点率为80%,顾客投诉次数95%的置信区间和预测区间 解:已知n=10,t? ??(10-2)=2.306
运送时间y 3.5 1.0 4.0 2.0 1.0 3.0 4.5 1.5 3.0 5.0
(1)绘制运送距离和运送时间的散点图,判断二者之间的关系形 态 (2)计算线性相关系数,说明两个变量之间的关系强度。 (3)利用最小二乘法求出估计的回归方程,并解释回归系数的实 际意义。
(1)绘制运送距离和运送时间的散点图,判断二者之间的关系形态

8.2 一元线性回归模型及其应用(精讲)(解析版)

8.2 一元线性回归模型及其应用(精讲)(解析版)

8.2 一元线性回归模型及其应用(精讲)考点一 样本中心解小题【例1】(2021·江西赣州市)某产品在某零售摊位上的零售价x (元)与每天的销售量y (个)统计如下表:据上表可得回归直线方程为 6.4151y x =-+,则上表中的m 的值为( ) A .38B .39C .40D .41【答案】D 【解析】由题意1617181917.54x +++==,50343111544m my ++++==,所以115 6.417.51514m+=-⨯+,解得41m =.故选:D . 【一隅三反】1.(2021·江西景德镇市·景德镇一中)随机变量x 与y 的数据如表中所列,其中缺少了一个数值,已知y关于x 的线性回归方程为ˆ0.93yx =+,则缺少的数值为( )A .6B .6.6C .7.5D .8【答案】A【解析】设缺少的数值为m ,由于回归方程为ˆ0.93yx =+过样本中心点(),x y , 且2345645x ++++==,代入0.943 6.6y =⨯+=,所以5679 6.65my ++++==,解得6m =.故选:A.2.(2021·河南信阳市)根据如下样本数据:得到的回归方程为y bx a =+,则( ) A .0a >,0b > B .0a >,ˆ0b < C .0a <,0b > D .0a <,ˆ0b< 【答案】B【解析】由图表中的数据可得,变量y 随着x 的增大而减小,则ˆ0b<, 2345645x ++++==,4 2.50.5230.25y +---==,又回归方程y bx a =+经过点(4,0.2),可得0a >,故选:B .3.(2021·安徽六安市·六安一中)蟋蟀鸣叫可以说是大自然优美、和谐的音乐,殊不知蟋蟀鸣叫的频率x(每分钟鸣叫的次数)与气温y (单位:C )存在着较强的线性相关关系.某地观测人员根据下表的观测数据,建立了y 关于x 的线性回归方程0.25y x k =+.则当蟋蟀每分钟鸣叫62次时,该地当时的气温预报值为( ) A .33C B .34CC .35CD .35.5C【答案】D【解析】由表格中的数据可得2030405060405x ++++==,2527.52932.536305y ++++==,由于回归直线过样本中心点(),x y ,可得300.2540k =⨯+,解得20k =.所以,回归直线方程为0.2520y x =+.在回归直线方程中,令62x =,可得0.25622035.5y =⨯+=.故选:D.考点二一元线性方程【例2】(2021·兴义市第二高级中学)在2010年春节期间,某市物价部门,对本市五个商场销售的某商品一天的销售量及其价格进行调查,五个商场的售价x 元和销售量y 件之间的一组数据如下表所示: 通过分析,发现销售量y 对商品的价格x 具有线性相关关系,求 (1)销售量y 对商品的价格x 的回归直线方程; (2)若使销售量为12,则价格应定为多少.附:在回归直线ˆˆy bxa =+中1221ˆni ii nii x y nxyb xnx ==-=-∑∑,ˆˆay bx =- 【答案】(1) 3.240y x =-+ (2) 8.75 【解析】(1)由题意知10x =,8y =,∴999580635551083.28190.25100110.25121ˆ5100b++++-⨯⨯==-++++-⨯,8(3.2)1040a =--⨯=,∴线性回归方程是 3.240y x =-+;(2)令 3.24012y x =-+=,可得8.75x =,∴预测销售量为12件时的售价是8.75元.【一隅三反】1.(2020·河南开封市)配速是马拉松运动中常使用的一个概念,是速度的一种,是指每公里所需要的时间,相比配速,把心率控制在一个合理水平是安全理性跑马拉松的一个重要策略.图1是一个马拉松跑者的心率y (单位:次/分钟)和配速x (单位:分钟/公里)的散点图,图2是一次马拉松比赛(全程约42公里)前3000名跑者成绩(单位:分钟)的频率分布直方图.(1)由散点图看出,可用线性回归模型拟合y 与x 的关系,求y 与x 的线性回归方程;(2)该跑者如果参加本次比赛,将心率控制在160左右跑完全程,估计他跑完全程花费的时间,并估计他能获得的名次.参考公式:线性回归方程ˆˆˆybx a =+中,12()()ˆ()nii i nixx y y b xx =--=-∑∑,ˆˆay bx =- 参考数据:135y =.【答案】(1)25285x y ∧=-+;(2)210分钟,192名. 【解析】(1)由散点图中数据和参考数据得 4.55677.565x ++++==,1001091301651711355y ++++==,()()()51522222211.536(1)300(5)1(26) 1.5(35)25( 1.5)(1)01 1.5ˆiii i i x x y y bx x ==---⨯+-⨯+⨯-+⨯-+⨯-===--+-+++-∑∑,135(25)62ˆ85ˆay bx =-=--⨯=, 所以y 与x 的线性回归方程为25285x y ∧=-+. (2)将160y =代入回归方程得5x =,所以该跑者跑完马拉松全程所花的时间为425210⨯=分钟. 从马拉松比赛的频率分布直方图可知成绩好于210分钟的累积频率为()0.0008500.00242102000.064⨯+⨯-=,有6.4%的跑者成绩超过该跑者,则该跑者在本次比赛获得的名次大约是0.0643000192⨯=名.2.(2020·云南红河哈尼族彝族自治州)随着电商事业的快速发展,网络购物交易额也快速提升,特别是每年的“双十一”,天猫的交易额数目惊人.2020年天猫公司的工作人员为了迎接天猫“双十一”年度购物狂欢节,加班加点做了大量准备活动,截止2020年11月11日24时,2020年的天猫“双十一”交易额定格在3700多亿元,天猫总公司所有员工对于新的战绩皆大欢喜,同时又对2021年充满了憧憬,因此公司工作人员反思从2014年至2020年每年“双十一”总交易额(取近似值),进行分析统计如下表:(1)通过分析,发现可用线性回归模型拟合总交易额y 与年份代码t 的关系,请用相关系数加以说明; (2)利用最小二乘法建立y 关于t 的回归方程(系数精确到0.1),预测2021年天猫“双十一”的总交易额. 参考数据:71()()138.5ii i tt y y =--=∑26.7= 2.646≈;参考公式:相关系数()()niit t y y r --=∑;回归方程y bt a ∧∧∧=+中,斜率和截距的最小二乘估计公式分别为:()()()711722211niii ii i niii i tty y t y nx yb tttnx∧====---==--∑∑∑∑,=a y bt ∧∧-.【答案】(1)答案见解析;(2)回归方程为ˆ 4.9 1.2yt =-,预测2021年天猫“双十一”的总交易额约为38百亿.【解析】(1)4t =,721()28ii tt =-=∑,17()()138.5i ii t t yy =--=∑26.7=所以()()138.50.982 2.64626.7niit t y y r --=≈≈⨯⨯∑因为总交易额y 与年份代码t 的相关系数近似为0.98, 说明总交易额y 与年份代码t 的线性相关性很强,从而可用线性回归模型拟合总交易额y 与年份代码t 的关系. (2)因为18.4y =,721()28ii tt =-=∑,所以()()71271()138.5ˆ 4.928i ii i i t t yy bt t ==--==≈-∑∑, ˆˆay b =-,18.4 4.94 1.2b ≈-⨯=- 所以y 关于t 的回归方程为ˆ 4.9 1.2yt =- 又将2021年对应的8t =代入回归方程得:ˆ 4.98 1.238y=⨯-=. 所以预测2021年天猫“双十一”的总交易额约为38百亿.3.(2021·湖北省武昌实验中学高二期末)根据统计,某蔬菜基地西红柿亩产量的增加量y (百千克)与某种液体肥料每亩使用量x(千克)之间的对应数据的散点图,如图所示.(1)依据数据的散点图可以看出,可用线性回归模型拟合y与x的关系,请计算相关系数r并加以说明(若0.75r>,则线性相关程度很高,可用线性回归模型拟合);(2)求y关于x的回归方程,并预测当液体肥料每亩使用量为12千克时,西红柿亩产量的增加量约为多少?附:相关系数公式()()n ni i i ix x y y x y nx y r---==∑∑0.55≈0.95≈.回归方程y bx a=+中斜率和截距的最小二乘估计公式分别为()()()1122211n ni i i ii in ni ii ix x y y x y nx ybx x x nx====---==--∑∑∑∑,a y xb=-.【答案】(1)0.95;答案见解析;(2)0.3 2.5y x=+;610千克.【解析】(1)由已知数据可得2456855x++++==,3444545y++++==,所以()()()()()5131100010316i iix x y y=--=-⨯-+-⨯+⨯+⨯+⨯=∑,====所以相关系数()()50.95iix x y y r --===≈∑.因为0.75r >,所以可用线性回归模型拟合y 与x 的关系.(2)()()()5152160.320iii ii x x y y b x x ==--===-∑∑,450.3 2.5a =-⨯=, 所以回归方程为0.3 2.5y x =+. 当12x =时,0.312 2.5 6.1y =⨯+=,即当液体肥料每亩使用量为12千克时,西红柿亩产量的增加量约为610千克.考点三 非一元线性方程【例3】(2020·全国高二课时练习)在一次抽样调查中测得5个样本点,得到下表及散点图.(1)根据散点图判断y a bx =+与1y c k x -=+⋅哪一个适宜作为y 关于x 的回归方程;(给出判断即可,不必说明理由)(2)根据(1)的判断结果试建立y 与x 的回归方程;(计算结果保留整数) (3)在(2)的条件下,设=+z y x 且[)4,x ∈+∞,试求z 的最小值.参考公式:回归方程ˆˆˆybx a =+中,()()()1122211ˆn niii ii i nniii i x x y y x y nx yb x x xnx====---==--∑∑∑∑,a y bx =-.【答案】(1)1y c k x -=+⋅;(2)41y x=+;(3)6. 【解析】(1)由题中散点图可以判断,1y c k x -=+⋅适宜作为y 关于x 的回归方程; (2)令1t x -=,则y c kt =+,原数据变为由表可知y 与t 近似具有线性相关关系,计算得4210.50.251.555t ++++==,16125217.25y ++++==,222222416212150.520.2515 1.557.238.4544210.50.255 1.559.3k ⨯+⨯+⨯+⨯+⨯-⨯⨯==≈++++-⨯,所以,7.24 1.551c y kt =-=-⨯=,则41y t =+. 所以y 关于x 的回归方程是41y x=+. (3)由(2)得41z y x x x=+=++,[)4,x ∈+∞, 任取1x 、24x ≥,且12x x >,即124x x >≥,可得()()()21121212121212124444411x x z z x x x x x x x x x x x x -⎛⎫⎛⎫⎛⎫-=++-++=-+-=-+ ⎪ ⎪ ⎪⎝⎭⎝⎭⎝⎭()()1212124x x x x x x --=,因为124x x >≥,则120x x ->,1216>x x ,所以,12z z >,所以,函数41z x x =++在区间[)4,+∞上单调递增,则min 44164z =++=. 【一隅三反】1.(2020·江苏省如皋中学高二月考)某种新产品投放市场一段时间后,经过调研获得了时间x (天数)与销售单价y (元)的一组数据,且做了一定的数据处理(如表),并作出了散点图(如图).表中10111,10i i i i w w w x ===∑.(1)根据散点图判断y a bx =+,与dy c x=+哪一个更适合作价格y 关于时间x 的回归方程类型?(不必说明理由)(2)根据判断结果和表中数据,建立y 关于x 的回归方程. (3)若该产品的日销售量()g x (件)与时间x 的函数关系为()()100120g x x N x-=+∈,求该产品投放市场第几天的销售额最高?最高为多少元?附:对于一组数据()()()()112233,,,,,,...,,n n u v u v u v u v ,其回归直线vuαβ=+的斜率和截距的最小二乘法估计分别为121()(),()nii i nii vv u u v u u u βαβ==--==--∑∑.【答案】(1)dy c x =+更适合作价格y 关于时间x 的回归方程;(2)120(1)y x=+;(3)第10天,最高销售额为2420元;【解析】(1)根据散点图知dy c x=+更适合作价格y 关于时间x 的回归方程类型; (2)令1w x=,则y c dw =+, 而1011021()()18.4200.92()iii ii w w yy d w w ==--===-∑∑, 37.8200.8920c y dw =-=-⨯=,即有120(1)y x=+;(3)由题意结合(2)知:日销售额为1100()()20(1)(120)f x y g x x x=⋅=+-, ∴2110015()20(1)(120)400(6)f x x x x x=+-=+-, 若1t x =,令221121()655()1020h t t t t =+-=--+, ∴110t =时,max 1121()()1020h t h ==,即10x =天,max 121()(10)400242020f x f ==⨯=元, 所以该产品投放市场第10天的销售额最高,最高销售额为2420元.2.(2021·江苏苏州市)我国为全面建设社会主义现代化国家,制定了从2021年到2025年的“十四五”规划.某企业为响应国家号召,汇聚科研力量,加强科技创新,准备增加研发资金.现该企业为了了解年研发资金投入额x (单位:亿元)对年盈利额y (单位:亿元)的影响,研究了“十二五”和“十三五”规划发展期间近10年年研发资金投入额i x 和年盈利额i y 的数据.通过对比分析,建立了两个函数模型:①2y x αβ=+,②x t y e λ+=,其中α,β,λ,t 均为常数,e 为自然对数的底数.令2i i u x >,()ln 1,2,,10i i v y i ==⋅⋅⋅,经计算得如下数据:(1)请从相关系数的角度,分析哪一个模型拟合程度更好?(2)(ⅰ)根据(1)的选择及表中数据,建立y 关于x 的回归方程;(系数精确到0.01)(ⅱ)若希望2021年盈利额y 为250亿元,请预测2021年的研发资金投入额x 为多少亿元?(结果精确到0.01)附:①相关系数()()niix x y y r --=∑,回归直线ˆˆˆya bx =+中:121()()ˆ()niii nii x x yy b x x ==--=-∑∑,ˆˆay bx =- ②参考数据:ln 20.693≈,ln5 1.609≈. 【答案】(1)模型x ty eλ+=的拟合程度更好;(2)(ⅰ)0.180.56ˆx ye +=;(ⅱ)27.56.【解析】(1)设{}i u 和{}i y 的相关系数为1r ,{}i x 和{}i v 的相关系数为2r ,由题意,()()101130.8715iiu u y y r --===≈∑,()()102120.9213iix x v v r --===≈∑,则12r r <,因此从相关系数的角度,模型x ty e λ+=的拟合程度更好.(2)(ⅰ)先建立v 关于x 的线性回归方程, 由x ty eλ+=,得ln y t x λ=+,即v t x λ=+,()()()101102112ˆ65iii ii x x v v x x λ==--==-∑∑, 12ˆˆ 5.36260.5665tv x λ=-=-⨯=, 所以v 关于x 的线性回归方程为ˆ0.180.56vx =+, 所以ˆln 0.180.56yx =+,则0.180.56ˆx y e +=.(ⅱ)2021年盈利额250y =(亿元), 所以0.180.56250x e +=,则0.180.56ln 250x +=, 因为ln 2503ln5ln 23 1.6090.693 5.52=+≈⨯+=, 所以 5.520.5627.560.18x -≈≈.所以2021年的研发资金投入量约为27.56亿元.。

一元线性回归模型习题与答案

一元线性回归模型习题与答案

一元线性回归模型习题与答案1、为什么模型中要引入随机扰动项?2、令kid表示一名妇女生育孩子的数目,educ表示该妇女接受过教育的年数。

生育率对教育年数的简单回归模型为:kid01educ(1)随机扰动项包含什么样的因素?它们可能与教育水平相关吗?(2)上述简单回归分析能够揭示教育对生育率在其他条件不变下的影响吗?请解释。

3、已知回归模型EN,式中E为某类公司一名新员工的起始薪金(元),N为所受教育水平(年)。

随机扰动项的分布未知,其他所有假设都满足。

(1)从直观及经济角度解释和满足线性、无偏性及有效性吗?简单陈述理由。

和(2)OLS估计量(3)对参数的假设检验还能进行吗?简单陈述理由。

2.690.48某,其中,Y表示墨西哥的咖啡消费量4、假定有如下的回归结果:Ytt(每天每人消费的杯数),某表示咖啡的零售价格(单位:美元/杯),t表示时间。

问:(1)这是一个时间序列回归还是横截面序列回归做出回归线。

(2)如何解释截距的意义它有经济含义吗如何解释斜率(3)能否求出真实的总体回归函数(4)根据需求的价格弹性定义:弹性=斜率某某/Y,依据上述回归结果,你能求出对咖啡需求的价格弹性吗如果不能,计算此弹性还需要其他什么信息5、选择一个经济问题,建立一元线性回归模型,利用EView软件进行回归分析,写出详细的分析步骤。

6、令Y表示一名妇女生育孩子的生育率,某表示该妇女接受教育的年数。

生育率对教育年数的简单回归模型为:Y01某(1)随机干扰项包含什么样的因素?他们可能与教育水平相关吗?(2)上述简单回归分析能够揭示教育对生育率在其它条件不变下的影响吗?请解释?Y,使用美国36年的年度7、对于人均存款与人均收入之间的关系式Sttt数据,得到如下估计模型(括号内为标准差)384.1050.067YStt(151.105)(0.011)R0.538(1)的经济解释是什么?(2)和的符号是什么?为什么?(3)你对于拟合优度的看法?2答:1、随机扰动项是模型中表示其它多种因素的综合影响。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

一元线性回归模型一、单项选择题1、变量之间的关系可以分为两大类__________。

AA 函数关系与相关关系B 线性相关关系和非线性相关关系C 正相关关系和负相关关系D 简单相关关系和复杂相关关系 2、相关关系是指__________。

DA 变量间的非独立关系B 变量间的因果关系C 变量间的函数关系D 变量间不确定性的依存关系 3、进行相关分析时的两个变量__________。

AA 都是随机变量B 都不是随机变量C 一个是随机变量,一个不是随机变量D 随机的或非随机都可以 4、表示x 和y 之间真实线性关系的是__________。

CA 01ˆˆˆt tY X ββ=+ B 01()t t E Y X ββ=+ C 01t t t Y X u ββ=++ D 01t t Y X ββ=+5、参数β的估计量ˆβ具备有效性是指__________。

B A ˆvar ()=0βB ˆvar ()β为最小C ˆ()0ββ-= D ˆ()ββ-为最小 6、对于01ˆˆi i iY X e ββ=++,以σˆ表示估计标准误差,Y ˆ表示回归值,则__________。

BA i i ˆˆ0Y Y 0σ∑=时,(-)=B 2iiˆˆ0Y Y σ∑=时,(-)=0 C ii ˆˆ0Y Y σ∑=时,(-)为最小 D 2iiˆˆ0Y Yσ∑=时,(-)为最小 7、设样本回归模型为i 01i iˆˆY =X +e ββ+,则普通最小二乘法确定的i ˆβ的公式中,错误的是__________。

DA ()()()ii12i X X Y -Y ˆX X β--∑∑=B ()i iii122iin X Y -X Y ˆn X -X β∑∑∑∑∑=C ii 122iX Y -nXY ˆX -nX β∑∑= D i i ii12xn X Y -X Y ˆβσ∑∑∑=8、对于i 01i i ˆˆY =X +e ββ+,以ˆσ表示估计标准误差,r 表示相关系数,则有__________。

DA ˆ0r=1σ=时, B ˆ0r=-1σ=时, C ˆ0r=0σ=时, D ˆ0r=1r=-1σ=时,或 9、产量(X ,台)与单位产品成本(Y ,元/台)之间的回归方程为ˆY356 1.5X -=,这说明__________。

DA 产量每增加一台,单位产品成本增加356元B 产量每增加一台,单位产品成本减少1.5元C 产量每增加一台,单位产品成本平均增加356元D 产量每增加一台,单位产品成本平均减少1.5元10、在总体回归直线01ˆE Y X ββ+()=中,1β表示__________。

B A 当X 增加一个单位时,Y 增加1β个单位 B 当X 增加一个单位时,Y 平均增加1β个单位 C 当Y 增加一个单位时,X 增加1β个单位 D 当Y 增加一个单位时,X 平均增加1β个单位11、对回归模型i 01i i Y X u ββ+=+进行检验时,通常假定i u 服从__________。

CA 2i N 0) σ(, B t(n-2) C 2N 0)σ(, D t(n)12、以Y 表示实际观测值,ˆY表示回归估计值,则普通最小二乘法估计参数的准则是使__________。

Di i 2i i i i 2i i ˆA Y Y 0ˆB Y Y 0ˆC Y Y ˆD Y Y ∑∑∑∑ (-)= (-)= (-)=最小 (-)=最小13、设Y 表示实际观测值,ˆY表示OLS 估计回归值,则下列哪项成立__________。

D ˆˆA YY B Y Y ˆˆC YY D Y Y = = = =14、用OLS 估计经典线性模型i 01i i Y X u ββ+=+,则样本回归直线通过点_________。

DˆA X Y B X YˆC X YD X Y (,) (,) (,) (,)15、以Y 表示实际观测值,ˆY表示OLS 估计回归值,则用OLS 得到的样本回归直线i 01iˆˆˆY X ββ+=满足__________。

A ii2i i 2i i 2i i ˆA Y Y 0B Y Y 0ˆC Y Y 0ˆD Y Y 0∑∑∑∑ (-)= (-)= (-)= (-)=16、用一组有30个观测值的样本估计模型i 01i i Y X u ββ+=+,在0.05的显著性水平下对1β的显著性作t 检验,则1β显著地不等于零的条件是其统计量t 大于__________。

DA t0.05(30)B t0.025(30)C t0.05(28)D t0.025(28) 17、已知某一直线回归方程的判定系数为0.64,则解释变量与被解释变量间的线性相关系数为__________。

BA 0.64B 0.8C 0.4D 0.32 18、相关系数r 的取值范围是__________。

DA r ≤-1B r ≥1C 0≤r ≤1D -1≤r ≤119、判定系数R 2的取值范围是__________。

CA R2≤-1B R2≥1C 0≤R2≤1D -1≤R2≤120、某一特定的X 水平上,总体Y 分布的离散度越大,即σ2越大,则__________。

A A 预测区间越宽,精度越低 B 预测区间越宽,预测误差越小 C 预测区间越窄,精度越高 D 预测区间越窄,预测误差越大 22、如果X 和Y 在统计上独立,则相关系数等于__________。

C A 1 B -1 C 0 D ∞23、根据决定系数R 2与F 统计量的关系可知,当R 2=1时,有__________。

D A F =1 B F =-1 C F =0 D F =∞24、在C —D 生产函数βαK AL Y =中,__________。

A A.α和β是弹性 B.A 和α是弹性 C.A 和β是弹性 D.A 是弹性25、回归模型i i i u X Y ++=10ββ中,关于检验010=β:H 所用的统计量)ˆ(ˆ111βββVar -,下列说法正确的是__________。

DA 服从)(22-n χ B 服从)(1-n t C 服从)(12-n χ D 服从)(2-n t26、在二元线性回归模型i i i i u X X Y +++=22110βββ中,1β表示__________。

A A 当X2不变时,X1每变动一个单位Y 的平均变动。

B 当X1不变时,X2每变动一个单位Y 的平均变动。

C 当X1和X2都保持不变时,Y 的平均变动。

D 当X1和X2都变动一个单位时,Y 的平均变动。

27、在双对数模型i i i u X Y ++=ln ln ln 10ββ中,1β的含义是__________。

D A Y 关于X 的增长量 B Y 关于X 的增长速度 C Y 关于X 的边际倾向 D Y 关于X 的弹性26、根据样本资料已估计得出人均消费支出Y 对人均收入X 的回归模型为i i X Y ln 75.000.2ln +=,这表明人均收入每增加1%,人均消费支出将增加__________。

CA 2%B 0.2%C 0.75%D 7.5%28、按经典假设,线性回归模型中的解释变量应是非随机变量,且__________。

A A 与随机误差项不相关 B 与残差项不相关 C 与被解释变量不相关 D 与回归值不相关29、根据判定系数R 2与F 统计量的关系可知,当R 2=1时有__________。

C A.F=1 B.F=-1 C.F=∞ D.F=0 30、下面说法正确的是__________。

DA.内生变量是非随机变量B.前定变量是随机变量C.外生变量是随机变量D.外生变量是非随机变量31、在具体的模型中,被认为是具有一定概率分布的随机变量是__________。

A A.内生变量 B.外生变量 C.虚拟变量 D.前定变量 32、回归分析中定义的__________。

B A.解释变量和被解释变量都是随机变量B.解释变量为非随机变量,被解释变量为随机变量C.解释变量和被解释变量都为非随机变量D.解释变量为随机变量,被解释变量为非随机变量33、计量经济模型中的被解释变量一定是__________。

C A .控制变量 B .政策变量 C .内生变量 D .外生变量二、多项选择题1、指出下列哪些现象是相关关系__________。

ACDA 家庭消费支出与收入B 商品销售额与销售量、销售价格C 物价水平与商品需求量D 小麦高产与施肥量E 学习成绩总分与各门课程分数2、一元线性回归模型i 01i i Y X u ββ+=+的经典假设包括__________。

ABCDEA ()0t E u =B 2var()t u σ=C cov(,)0t s u u =D (,)0t t Cov x u =E 2~(0,)t u N σ3、以Y 表示实际观测值,ˆY表示OLS 估计回归值,e 表示残差,则回归直线满足__________。

ABEii2i i 2i i i i A X Y ˆB Y YˆC Y Y 0ˆD Y Y 0E cov(X ,e )=0∑∑∑∑ 通过样本均值点(,) = (-)= (-)= 4、ˆY表示OLS 估计回归值,u 表示随机误差项,e 表示残差。

如果Y 与X 为线性相关关系,则下列哪些是正确的__________。

ACi 01ii1ii 01i i i1iii 01i A E Y X ˆˆB Y X ˆˆC Y X e ˆˆˆD YX e ˆˆE E(Y )X ββββββββββ+++++++ ()= = ===5、ˆY表示OLS 估计回归值,u 表示随机误差项。

如果Y 与X 为线性相关关系,则下列哪些是正确的__________。

BEi 01i i 01i ii1iii 01i i i1iA Y XB Y X u ˆˆC Y X u ˆˆˆD Y X u ˆˆˆE YX ββββββββββ+++++++ = =+ ===6、回归分析中估计回归参数的方法主要有__________。

CDE A 相关系数法 B 方差分析法 C 最小二乘估计法 D 极大似然法 E 矩估计法7、用OLS 法估计模型i 01i i Y X u ββ+=+的参数,要使参数估计量为最佳线性无偏估计量,则要求__________。

ABCDEA i E(u )=0B 2i Var(u )=σC i j Cov(u ,u )=0D i u 服从正态分布E X 为非随机变量,与随机误差项i u 不相关。

8、假设线性回归模型满足全部基本假设,则其参数的估计量具备__________。

CDE A 可靠性 B 合理性 C 线性 D 无偏性 E 有效性9、普通最小二乘估计的直线具有以下特性__________。

ABDE A 通过样本均值点(,)X YBˆii Y Y =∑∑C 2ˆ()0iiY Y-=∑ D 0ie =∑E (,)0i i Cov X e =10、由回归直线i 01iˆˆˆY X ββ+=估计出来的i ˆY 值__________。

相关文档
最新文档