应用回归分析简答题及答案

合集下载

数据分析简答题

数据分析简答题

数据分析简答题数据分析是一种通过收集、整理、解释和展示数据来获得洞察和支持决策的过程。

它涉及使用统计学和计量经济学等方法来分析数据,从而揭示数据背后的模式、趋势和关联。

以下是对数据分析的一些常见问题的简答。

1. 数据清洗是什么?为什么它在数据分析中如此重要?数据清洗是指对原始数据进行处理和准备的过程,以确保数据的准确性、完整性和一致性。

在数据分析中,数据清洗是至关重要的,因为原始数据经常包含错误、缺失值和异常值,这些问题会影响到分析的结果。

通过数据清洗,我们可以处理这些问题,使数据变得可靠和可用于分析。

2. 数据可视化的作用是什么?为什么它在数据分析中如此重要?数据可视化是将数据以图形或图表的形式呈现出来的过程。

它的作用是帮助人们更好地理解和解释数据,发现数据中的模式和趋势。

在数据分析中,数据可视化起到了至关重要的作用。

通过可视化,我们可以直观地展示数据,使得数据更容易被理解和分析。

同时,数据可视化还可以帮助我们发现数据中的隐藏信息和关联,从而支持决策和策略制定。

3. 什么是相关性分析?为什么它在数据分析中常被使用?相关性分析是一种用于确定两个或多个变量之间关系的统计方法。

它通过计算相关系数来衡量变量之间的相关性。

在数据分析中,相关性分析常被使用,因为它可以帮助我们理解变量之间的关联程度。

通过相关性分析,我们可以确定变量之间的正相关、负相关或无相关关系,从而为我们提供洞察和指导。

4. 什么是回归分析?它在数据分析中有什么应用?回归分析是一种用于建立变量之间关系的统计方法。

它通过建立数学模型来预测一个或多个自变量对因变量的影响。

在数据分析中,回归分析被广泛应用于预测和建模。

例如,我们可以使用回归分析来预测销售额与广告投入之间的关系,或者预测房价与房屋面积之间的关系。

5. 什么是聚类分析?它在数据分析中有什么应用?聚类分析是一种将数据根据相似性进行分组的统计方法。

它通过计算数据之间的距离或相似度来确定数据的聚类结构。

数据分析简答题

数据分析简答题

数据分析简答题数据分析是指通过收集、整理、分析和解释数据,以发现其中的模式、关联和趋势,并从中提取有价值的信息和洞察。

在进行数据分析时,通常需要回答一系列的问题,以下是几个常见的数据分析简答题。

1. 什么是数据清洗?为什么数据清洗在数据分析中很重要?数据清洗是指对原始数据进行处理,以去除错误、不完整、重复或不相关的数据,并确保数据的准确性和一致性。

数据清洗在数据分析中非常重要,原因如下:- 提高数据质量:清洗数据可以去除错误和不完整的数据,提高数据质量,从而减少分析结果的误差。

- 保证数据一致性:清洗数据可以对数据进行标准化和统一格式化,确保数据在不同来源和格式之间的一致性,方便后续的分析和比较。

- 提高分析效率:清洗数据可以减少重复数据和不相关数据的存在,减少分析的时间和计算资源的消耗。

- 降低分析风险:清洗数据可以减少数据分析过程中的错误和偏差,提高分析结果的可靠性和可信度。

2. 什么是数据可视化?为什么数据可视化在数据分析中很重要?数据可视化是指通过图表、图形、地图等可视化方式展示数据,以帮助人们更直观地理解和分析数据。

数据可视化在数据分析中非常重要,原因如下:- 提供直观理解:通过可视化方式展示数据,可以将抽象的数据转化为直观的图形,帮助人们更容易理解数据的含义和趋势。

- 发现模式和关联:通过可视化数据,可以更容易地发现数据中的模式、关联和趋势,从而提取有价值的信息和洞察。

- 支持决策和沟通:通过可视化数据,可以更清晰地传达数据分析结果,支持决策和沟通,使复杂的数据变得更易于理解和接受。

- 提高效率和效果:通过可视化数据,可以减少人们在分析数据时的认知负荷,提高分析的效率和效果。

3. 什么是相关性分析?如何计算相关系数?相关性分析是指通过计算变量之间的相关系数,来衡量它们之间的线性关系强度和方向。

相关系数可以用来判断两个变量是否具有相关性,以及相关性的强弱和方向。

常用的相关系数包括皮尔逊相关系数和斯皮尔曼相关系数。

统计学简答题与课后答案

统计学简答题与课后答案

统计学简答题1.简述描述统计学的概念、研究容和目的。

概念:它是研究数据收集、整理和描述的统计学分支。

研究容:搜集数据、整理数据、展示数据和描述性分析的理论与方法。

研究目的:描述数据的特征;找出数据的基本数量规律。

2.简述推断统计学的概念、研究容和目的。

概念:它是研究如何利用样本数据来推断总体特征的统计学分支。

研究容:参数估计和假设检验的理论与方法。

研究目的:对总体特征作出推断。

3.什么是总体和样本?总体是指所研究的全部个体(数据)的集合,其中的每一个元素称为个体(也称为总体单位)。

可分为有限总体和无限总体:有限总体的围能够明确确定,且元素的数目是有限的,可数的。

无限总体所包括的元素数目是无限的,不可数的。

总体单位数可用N表示。

样本就是从总体中抽取的一部分元素的集合。

构成样本的元素的数目称为样本容量,记为n。

4.什么是普查?它有哪些特点?普查就是为了特定的研究目的,而专门组织的、非经常性的全面调查。

它有以下的特点:(1)通常是一次性或周期性的(2)一般需要规定统一的标准调查时间(3)数据的规化程度较高(4)应用围比较狭窄。

5.简述统计调查方案的概念及包括的基本容答:统计调查前所制订的实施计划,是全部调查过程的指导性文件。

是调查工作有计划、有组织、有系统进行的保证。

统计调查方案应确定的容有:调查目的与任务、调查对象与调查单位、调查项目与调查表、调查时间和调查时限、调查的组织实施计划。

6.简述统计分组的概念,原则和具体方法答:统计分组是根据事物的在特征和研究要求,将总体按照一定的标准划分为若干部分的一种方法。

统计分组必须遵循“穷举”和“互斥”的原则。

“穷举”是指总体中的任何一个单位都有可能被归入某一组。

“互斥”是指任何一个单位只能归属于一个组,而不能同时归属于两个或两个以上的组。

统计分组方法因选择的分组标志及其组合形式不同而异。

常用的有按一个品质标志或一个数量标志所作的简单分组;将两个或两个以上的分组标志重叠起来所作的复合分组等。

第八章 相关分析与回归分析习题答案

第八章 相关分析与回归分析习题答案

第八章 相关分析与回归分析习题参考答案一、名词解释函数关系:函数关系亦称确定性关系,是指变量(现象)之间存在的严格确定的依存关系。

在这种关系中,当一个或几个相互联系的变量取一定的数值时,必定有另一个且只有一个变量有确定的值与之对应。

相关关系:是指变量(现象)之间存在着非严格、不确定的依存关系。

在这种关系中,当一个或几个相互联系的变量取一定的数值时,可以有另一变量的若干数值与之相对应。

这种关系不能用完全确定的函数来表示。

相关分析:相关分析主要是研究两个或者两个以上随机变量之间相互依存关系的方向和密切程度的方法,直线相关用相关系数表示,曲线相关用相关指数表示,多元相关用复相关系数表示。

回归分析:回归分析是研究某一随机变量关于另一个(或多个)非随机变量之间数量关系变动趋势的方法。

其目的在于根据已知非随机变量来估计和预测随机变量的总体均值。

单相关:单相关是指仅涉及两个变量的相关关系。

复相关:复相关是指一个变量对两个或者两个以上其他变量的相关关系。

正相关:正相关是指两个变量的变化方向是一致的,当一个变量的值增加(或减少)时,另一变量的值也随之增加(或减少)。

负相关:负相关是指两个变量的变化方向相反,即当一个变量的值增加(或减少)时,另一个变量的值会随之减少(或增加)。

线性相关:如果相关的两个变量对应值在直角坐标系中的散点图近似呈一条直线,则称为线性相关。

非线性相关:如果相关的两个变量对应值在直角坐标系中的散点图近似呈现出某种曲线形式,则为非线性相关。

相关系数:相关系数是衡量变量之间线性相关密切程度及相关方向的统计分析指标。

取值在-1到1之间。

两个变量之间的简单样本相关系数的计算公式为:()()niix x y y r --∑二、单项选择1.B;2.D;3.D;4.C;5.A;6.D 。

三、判断题(正确的打“√”,错误的打“×”) 1.×; 2.×; 3.√; 4.×; 5.×; 6.×; 7.×; 8.√. 四、简答题1、什么是相关关系?相关关系与函数关系有什么区别?答:相关关系,是指变量(现象)之间存在着非严格、不确定的依存关系。

应用统计硕士(一元线性回归)模拟试卷1(题后含答案及解析)

应用统计硕士(一元线性回归)模拟试卷1(题后含答案及解析)

应用统计硕士(一元线性回归)模拟试卷1(题后含答案及解析) 题型有:1. 单选选择题 3. 简答题 4. 计算与分析题单选选择题1.在线性回归模型中,预报变量( )。

A.由解释变量所惟一确定B.惟一确定解释变量C.是随机变量D.不是随机变量正确答案:D解析:预报变量即自变量,相当于通常函数关系中的自变量,对这样的变量能够赋予一个需要的值或者能够取到一个可观测但不能人为控制的值。

知识模块:一元线性回归2.在一元线性回归分析中,如果F检验的p-值为0.3,则意味着( )。

A.预报变量与解释变量之间存在很强的线性关系B.预报变量与解释变量之间存在较强的线性关系C.预报变量与解释变量之间的线性关系较弱D.预报变量与解释变量之间没有任何关系正确答案:C解析:在一元线性回归分析中,F检验、t检验和相关系数的检验是等价的。

由于F检验的p-值为0.3相对较大,则不能拒绝原假设H0:β1=0。

在相关系数的检验中,等价于不拒绝原假设H0:p=0。

即认为预报变量与解释变量之间的线性关系较弱。

知识模块:一元线性回归3.将一枚硬币重复投掷n次,用X和Y分别表示正面朝上和反面朝上的次数,则X和Y的相关系数等于( )。

A.-1B.0C.1/2D.1正确答案:A解析:将一枚硬币重复投掷n次,正面朝上和反面朝上的次数关系为X+Y =n,即X=n-Y,X与Y为完全负线性相关关系,所以相关系数为-1。

知识模块:一元线性回归4.某研究人员发现,举重运动员的体重与他能举起的重量之间的相关系数为0.6,则( )。

A.举重能力的60%归因于其体重B.平均来说,运动员能举起其体重60%的重量。

C.如果运动员体重增加10公斤,则可多举6公斤的重量D.运动员体重和能举起的重量之间有正相关关系正确答案:D解析:若运动员举重能力关于其体重的回归模型中,若回归系数为0.6,则可认为:平均来说,运动员能举起其体重60%的重量;如果运动员体重增加10公斤,则平均可多举0.6×10=6公斤的重量。

应用回归分析简答题及答案

应用回归分析简答题及答案

应用回归分析简答题及答案应用回归分析简答题及答案4.为什么要对回归模型进行检验?答:当模型的未知参数估计出来后,就初步建立了一个回归模型。

建立回归模型的目的是应用他来研究经济问题,但如果马上就用这个模型去做预测、控制和分析,显然是不够慎重的。

因为这个模型是否真正揭示了被解释变量与解释变量之间的关系,必须通过对模型的检验才能决定。

5.讨论样本容量n与自变量个数p的关系,他们对模型的参数估计有何影响?答:在多元线性回归模型中,样本容量n与自变量个数p的关系是:n>p。

如果n<=p对模型的参数估计会带来严重的影响。

因为:(1 )在多元线性回归模型中,有p+1个待估参数B,所以样本容量的个数应该大于解释变量的个数,否则参数无法估计。

(2)解释变量X是确定性变量,要求rank(X)=p+1<="">X是一个满秩矩阵7.如何正确理解回归方程显著性检验拒绝Ho,接受Ho ?答:(1)一般情况下,当Ho : B仁0被接受时,表明y的取值倾向不随x的值按线性关系变化,这种状况的原因可能是变量y与x之间的相关关系不显著,也可能虽然变量y与x之间的相关关系显著,但这种相关关系不是线性的而是非线性的。

(2)当Ho : B仁0被拒绝时,没有其他信息,只能认为因变量y 对自变量x是有效的,但并没有说明回归的有效程度,不能断言y与x 之间就一定是线性相关关系,而不是曲线关系或其他的关系。

8■—个回归方程的复相关系数R=0.99,样本决定系数RA2=0.9801,我们能断定这个回归方程就很理想吗?答:1.在样本容量较少,变两个数较大时,决定系数的值容易接近1,而此时可能F检验或者关于回归系数的t检验,所建立的回归方程都没能通过。

2.样本决定系数和复相关系数接近1只能说明Y 与自变量X1,X2,…,Xp整体上的线性关系成立,而不能判断回归方程和每个自变量都是显著的,还需进行F检验和t检验3.在应用过程中发现,在样本量一定的情况下,如果在模型中增加解释变量必定使得自由度减少,使得R A2增大,因此增加解释变量个数引起的R A2的增大与拟合好坏无关。

回归分析期末试题及答案

回归分析期末试题及答案

回归分析期末试题及答案一、简答题1. 请解释回归分析的基本思想。

回归分析是一种统计学方法,用于研究变量之间的关系。

其基本思想是通过建立一个数学模型来描述一个或多个自变量对因变量的影响,并根据观察数据对模型进行拟合和推断。

2. 请解释简单线性回归和多元线性回归的区别。

简单线性回归是建立在一个自变量和一个因变量之间的基础上的回归模型。

多元线性回归则是在两个或更多个自变量和一个因变量之间建立的回归模型。

3. 请解释残差的含义。

残差是指建立回归模型后,观测值与模型预测值之间的差异。

残差可以用来评估模型的拟合程度,如果残差较大,则说明模型无法很好地解释观察数据的变化。

4. 请解释R平方的含义及其优缺点。

R平方是一个用来衡量回归模型拟合程度的指标,其值介于0和1之间。

R平方越接近1,说明模型对观察数据的拟合越好;而R平方越接近0,则说明模型对观察数据的拟合越差。

R平方的优点是简单直观,易于理解,但其缺点是不适用于比较不同自变量的模型。

5. 请简要说明什么是多重共线性问题。

多重共线性问题指的是在多元线性回归中,自变量之间存在高度相关性的情况。

多重共线性会导致回归系数的估计不准确,难以解释自变量与因变量之间的关系。

二、计算题1. 已知一个简单线性回归模型为:Y = 2 + 3X,回归系数的解释是什么?回归系数3表示自变量X每增加1个单位,因变量Y会增加3个单位。

而常数项2表示当自变量X为0时,因变量Y的取值为2。

2. 使用最小二乘法求解简单线性回归模型的参数估计值。

最小二乘法是一种常用的回归分析方法,用于估计回归模型中的参数值。

以简单线性回归模型Y = β0 + β1X 为例,最小二乘法通过最小化观测值Y与模型预测值之间的平方差来估计β0和β1。

3. 请计算多元线性回归模型的回归系数。

多元线性回归模型可以表示为:Y = β0 + β1X1 + β2X2 + ... + βnXn。

回归系数β1、β2、...、βn可以使用最小二乘法来估计,通过最小化观测值Y与模型预测值之间的平方差来得出。

回归分析期末考试试卷

回归分析期末考试试卷

回归分析期末考试试卷1. 简答题(40分)a) 请解释回归分析的基本原理和应用范围。

(10分)b) 比较线性回归和多元回归分析,包括它们的定义、特点和适用情况。

(10分)c) 什么是多重共线性?它对回归分析有什么影响?如何检测和处理多重共线性?(10分)d) 请解释R方统计量在回归分析中的作用和意义。

(10分)2. 计算题(60分)以下数据是一家公司过去10年的销售额和广告费用(单位:百万元):| 年份 | 销售额 | 广告费用 ||------|-------|---------|| 2001 | 20 | 2.5 || 2002 | 25 | 3.0 || 2003 | 30 | 3.5 || 2004 | 35 | 4.0 || 2005 | 40 | 4.5 || 2006 | 45 | 5.0 || 2007 | 50 | 5.5 || 2008 | 55 | 6.0 || 2009 | 60 | 6.5 || 2010 | 65 | 7.0 |a) 请计算销售额和广告费用的平均值和标准差。

(10分)b) 请绘制销售额和广告费用之间的散点图,并添加趋势线。

(10分)c) 进行简单线性回归分析,求出回归方程和相关系数的值。

(10分)d) 对回归方程进行假设检验,判断广告费用对销售额是否有显著影响。

(10分)e) 求出回归方程的可决系数R方,并解释其意义。

(10分)f) 利用回归方程预测2011年的销售额。

(10分)3. 应用题(60分)某医药公司想通过回归分析来预测某种药物的疗效得分(Y)。

他们收集了200个患者的数据,其中包括药物的剂量(X1,以mg为单位)、患者的年龄(X2,以岁为单位)、性别(X3,1代表女性,0代表男性)和治疗时间(X4,以周为单位)。

使用SPSS软件进行多元回归分析,得到回归方程:Y = 2.1X1 + 0.9X2 - 1.5X3 + 0.4X4 + 5.2a) 请解释回归方程中各变量的系数和常数项的含义。

计量经济学模拟试题(六套)及答案

计量经济学模拟试题(六套)及答案

模拟试题一一、单项选择题1. 一元线性样本回归直线可以表示为( )A .i 10i X Y u i ++=ββ B. i X )(Y E 10i ββ+= C. i 1i e X Y ++=∧∧i ββD.i X 10iYββ+=∧2. 如果回归模型中的随机误差存在异方差性,则参数的普通最小二乘估计量是( ) A .无偏的,但方差不是最小的 B.有偏的,且方差不少最小 C .无偏的,且方差最小 D.有偏的,但方差仍最小3. 如果一个回归模型中包含截距项,对一个具有k 个特征的质的因素需要引入( )个虚拟变量A .(k-2) B.(k-1) C.k D.K+14. 如果联立方程模型中某结构方程包含了模型系统中所有的变量,则这个方程是( ) A .恰好识别的 B .不可识别的 C .过渡识别的 D .不确定5. 平稳时间序列的均值和方差是固定不变的,自协方差只与( )有关A .所考察的两期间隔长度B .与时间序列的上升趋势C .与时间序列的下降趋势D .与时间的变化6. 对于某样本回归模型,已求得DW 统计量的值为1,则模型残差的自相关系数ρ∧近似等于( )A .0B .0.5C .-0.5D .17. 对于自适应预期模型i 110t )1(X Y u Y r r r t t +-++=-ββ,估计参数应采取的方法为( )A .普通最小二乘法B .甲醛最小二乘法C .工具变量法D .广义差分法8. 如果同阶单整变量的线性组合是平稳时间序列,则这些变量之间的关系就是( ) A .协整关系 B .完全线性关系 C .伪回归关系 D .短期均衡关系9. 在经济数学模型中,依据经济法规认为确定的参数,如税率、利息率等,称为( ) A .定义参数 B .制度参数 C .内生参数 D .短期均衡关系 10.当某商品的价格下降时,如果其某需求量的增加幅度稍大雨价格的下降幅度,则该商品的需求( )A .缺乏弹性B .富有弹性C .完全无弹性D .完全有弹性二、多项选择题1.在经济计量学中,根据建立模型的目的不同,将宏观经济计量模型分为( ) A .经济预测模型 B .经够分析模型 C .政策分析模型 D .专门模型 E.发达市场经济国家模型2.设k 为回归模型中参数的个数,F 统计量表示为( )A .RSS ESSB .)/(1)-ESS/(k k n RSS -C .221R R -D .)/()1()1/(R 22k n R k --- E. )1/(ESS/k --k n RSS3.狭义的设定误差主要包括( )A.模型中遗漏了有关解释变量B.模型中包括含了无关解释变量C.模型形式设定有误D.模型中有关随机误差项的假设有误E.模型中最小二乘估计量是有偏的、非一致的4.用于作经济预测的经济计量模型须有一定的“优度”保证,通常需要具备的性质有()A.解释能力和合理性B.预测功效好C.参数估计量的优良性D.简单性E.误差项满足古典线性回归模型的所有假定5.对联立方程模型参数的单方程估计法有()A.工具变量B.间接最小二乘法C.二阶段最小二乘法D.完全信息极大似然法E.有限信息极大似然法三、名词解释1.拟合度优2.行为方程3.替代弹性4.K阶单整5.虚拟变量四、简答题1.简述回归分析和相关分析的关系。

应用统计学试题及答案

应用统计学试题及答案

2018 ~2019学年春季学期应用统计 课程考试一、判断题(打√ 或 ×,每题2分,共20分) 1.在相同时点上搜集的数据是截面数据。

( √ )2. 当正态总体的方差未知时,在小样本条件下,估计总体均值使用的分布是正态分布。

( × ) 3.在置信水平不变条件下,要缩小置信区间,则需要增加样本量( √ )4.在其它条件不变的情况下,总体数据的方差越大,估计时所需的样本量就越小。

( × ) 5.在假设检验中,原假设和备择假设都有可能不成立。

( × ) 6. 组中值可以近似表示各组变量值的平均水平。

( √ )7.在假设检验中,第一类错误是指当原假设错误时未拒绝原假设。

( √ ) 8.经管学院男生平均身高175cm ,标准差为5cm ,则229cm 的身高在该学院必定属于异常值。

( √ )9.回归平方和占总平方和的比例称为回归系数。

( × ) 10.移动平均法适合对趋势型数据进行预测。

( × )二、单项选择题(每题2分,共20分)1.下列不属于描述统计的是( A )A 、根据样本信息对总体进行推断B 、了解数据分布特征C 、分析感兴趣的总体特征D 、利用图、表分析数据 2.要了解上海市居民家庭的收支情况,最适合的调查方法是( B )。

A. 普查B. 抽样调查C. 重点调查D. 典型调查 3. 对一组数据排序后,处于25%和75%位置上的值被称为( C )。

A. 众数 B. 中位数 C. 四分位数 D. 平均数4.抽取一个样本容量为100的随机样本,样本均值为81,标准差为12,则总体均值95%的置信区间为( B )A. 81 1.97±B. 81 2.35±C. 81 3.10±D. 81 3.52± 5. 95%的置信水平是指( B )。

A. 总体参数落在一个特定的样本所构造的区间内的概率为95%B. 在同样的方法构造的总体参数的多个区间中,包含总体参数的区间比例为95%C. 总体参数落在一个特定的样本所构造的区间内的概率为5%D. 在同样的方法构造的总体参数的多个区间中,包含总体参数的区间比例为5% 6. 在假设检验中,如果所计算出的P 值越小,说明检验结果( A ) A. 越显著 B. 越不显著 C. 越真实 D. 越不真实 7. X ~ N( μ, σ2 ), H 0: μ = μ0, 且σ2已知,则μ0的拒绝域为( C )。

相关分析与回归分析同步练习试卷2(题后含答案及解析)

相关分析与回归分析同步练习试卷2(题后含答案及解析)

相关分析与回归分析同步练习试卷2(题后含答案及解析)题型有:1. 单项选择题 3. 名词解释题 4. 简答题 5. 计算分析题单项选择题每小题1分,在每小题列出的四个备选项中只有一个是符合题目要求的,请将其代码填写在题后的括号内。

多选无分。

1.总体总量指标的点估计值是()A.平均数乘以样本成数B.样本容量乘以样本成数C.样本指标值乘以总体单位数D.样本指标的区间估计值乘以总体单位数正确答案:C 涉及知识点:相关分析与回归分析2.理论上最符合抽样调查随机原则的形式是()A.整群抽样B.类型抽样C.阶段抽样D.简单随机抽样正确答案:D 涉及知识点:相关分析与回归分析3.()是其他抽样方式的基础,也是衡量其他抽样方式抽样效果的标准。

()A.简单随机抽样B.等距抽样C.类型抽样D.整群抽样正确答案:A 涉及知识点:相关分析与回归分析4.为了解职工家庭生活水平状况,决定采用等距抽样进行调查,首先把职工按工资水平的高低进行排队,此种排队方法属于A.按无关标志排队B.按有关标志排队C.按简单标志排队D.按复杂标志排队正确答案:B 涉及知识点:相关分析与回归分析5.产品的单位成本随着劳动生产率的不断提高而下降,此种现象属于()A.完全相关B.不完全相关C.正相关D.负相关正确答案:D 涉及知识点:相关分析与回归分析6.只反映一个自变量和一个因变量韵相关关系是()A.正相关B.负相关C.单相关D.复相关正确答案:C 涉及知识点:相关分析与回归分析7.当相关关系的—个变量变动时,另—变量也相应地发生大致均等的变动,这种相关关系称为()A.线性相关B.非线性相关C.单相关D.完全相关正确答案:A 涉及知识点:相关分析与回归分析8.完全相关关系就是()A.函数关系B.因果关系C.狭义的相关关系D.广义的相关关系正确答案:A 涉及知识点:相关分析与回归分析9.大多数相关关系属于()A.不相关B.完全相关C.不完全相关D.无法判断正确答案:C 涉及知识点:相关分析与回归分析10.制作双变量分组相关表,应将自变量放在()A.横栏B.纵栏C.中间栏D.任意一栏正确答案:A 涉及知识点:相关分析与回归分析11.相关系数的取值范围是()A.-1≤r≤lB.-1≤r≤lC.-1&lt;r&lt;lD.-1≤r&lt;1正确答案:B 涉及知识点:相关分析与回归分析12.两个变量问的相互依存程度越高,则二者之间的相关系数值越接近于()A.1B.-1C.0D.1或-1正确答案:D 涉及知识点:相关分析与回归分析13.两个现象之间相互依存关系程度越弱,则相关系数r()A.越接近于0B.越接近于-1C.越接近于1D.越接近于0.5正确答案:A 涉及知识点:相关分析与回归分析14.在相关分析中,要求相关的两个变量()A.至少有一个是随机变量B.因变量是随机变量C.都不是随机变量D.自变量是随机变量正确答案:A 涉及知识点:相关分析与回归分析名词解释题每小题3分15.一元线性回归模型正确答案:一元线性回归模型又称简单直线回归模型,它是根据两个变量的成对数据,配合直线方程式,再根据自变量的变动值,来推算因变量的估计值的一种统计分析方法。

应用回归分析简答题

应用回归分析简答题

应用回归分析简答题1. 回归分析与相关分析的区别与联系是什么?回归分析与相关分析的区别与联系是什么?答:相关分析与回归分析有密切的联系,它们都是对变量间相关关系的研究,二者可以相互补充。

相关分析可以表明变量间相关关系的性质和程度,只有当变量间存在一定程度的相关关系时,进行回归分析去寻求相关的具体数学形式才有实际的意义。

同时,在进行相关分析时如果要具体确定变量间相关的具体数学形式,又要依赖于回归分析,而且相关分析中相关系数的确定也是建立在回归分析基础上的。

二者的区别:(1)相关分析中,变量x 和变量y 处于平等的地位;回归分析中,变量y 称为因变量,处在被解释的地位,x 称为自变量,用于预测因变量的变化;(2)相关分析中所涉及的变量x 和 y 都是随机变量;回归分析中,因变量 y 是随机变量,自变量 x 可以是随机变量,也可以是非随机的确定变量; (3)相关分析主要是描述两个变量之间线性关系的密切程度;回归分析不仅可以揭示变量 x 对变量 y 的影响大小,还可以由回归方程进行预测和控制。

制。

2. 线性回归模型的基本假设是什么?线性回归模型的基本假设是什么?(1)Gauss-Markov 假设:a. 误差项e i是一个期望值为0的随机变量,即()0e =i E ;b. 对于自变量12,,,p x xx 的所有值,e i的方差都相同,即2()e s =i D ; c.误差项e i 是彼此相互无关的,即(,)0,=¹i j Cov i j e e (2)解释变量12,,,p x x x 是非随机变量,观测值12,,,i i ip x x x是常数;(3)正态分布的假定:2(0,)es iN ;(4)为了便于数学上的处理,要求>n p 。

3. Gauss-Markov 假设中的三个条件的统计意义是什么?答:a. 误差项e i 是一个期望值为0的随机变量,即()0e =i E ,其统计意义是表明误差项不包含任何系统的趋势,观测值i y 小于或大于均值()i E y 的波动完全是一种随机性; b. 对于自变量12,,,p x x x 的所有值,e i 的方差都相同,即2()e s =i D ,表明要求不同次的观测i y 在其均值附近波动的程度是一样的;c.误差项e i 是彼此相互无关的,即(,)0,e e =¹i j Cov i j ,表明要求不同次的观 测i y 是互不相关的。

统计学课后习题答案第七章相关分析与回归分析

统计学课后习题答案第七章相关分析与回归分析

统计学课后习题答案第七章相关分析与回归分析第七章相关分析与回归分析⼀、单项选择题1.相关分析是研究变量之间的A.数量关系B.变动关系C.因果关系D.相互关系的密切程度2.在相关分析中要求相关的两个变量A.都是随机变量B.⾃变量是随机变量C.都不是随机变量D.因变量是随机变量3.下列现象之间的关系哪⼀个属于相关关系?A.播种量与粮⾷收获量之间关系B.圆半径与圆周长之间关系C.圆半径与圆⾯积之间关系D.单位产品成本与总成本之间关系4.正相关的特点是A.两个变量之间的变化⽅向相反B.两个变量⼀增⼀减C.两个变量之间的变化⽅向⼀致D.两个变量⼀减⼀增5.相关关系的主要特点是两个变量之间A.存在着确定的依存关系B.存在着不完全确定的关系C.存在着严重的依存关系D.存在着严格的对应关系6.当⾃变量变化时, 因变量也相应地随之等量变化,则两个变量之间存在着A.直线相关关系B.负相关关系C.曲线相关关系D.正相关关系7.当变量X值增加时,变量Y值都随之下降,则变量X和Y之间存A.正相关关系B.直线相关关系C.负相关关系D.曲线相关关系8.当变量X值增加时,变量Y值都随之增加,则变量X和Y之间存在着A.直线相关关系B.负相关关系C.曲线相关关系D.正相关关系9.判定现象之间相关关系密切程度的最主要⽅法是A.对现象进⾏定性分析B.计算相关系数C.编制相关表D.绘制相关图10.相关分析对资料的要求是A.⾃变量不是随机的,因变量是随机的B.两个变量均不是随机的C.⾃变量是随机的,因变量不是随机的D.两个变量均为随机的11.相关系数A.既适⽤于直线相关,⼜适⽤于曲线相关B.只适⽤于直线相关C.既不适⽤于直线相关,⼜不适⽤于曲线相关D.只适⽤于曲线相关12.两个变量之间的相关关系称为A.单相关B.复相关C.不相关D.负相关13.相关系数的取值范围是A.-1≤r≤1B.-1≤r≤0C.0≤r≤114.两变量之间相关程度越强,则相关系数A.愈趋近于1B.愈趋近于0C.愈⼤于1D.愈⼩于115.两变量之间相关程度越弱,则相关系数A.愈趋近于1B.愈趋近于0C.愈⼤于1D.愈⼩于116.相关系数越接近于-1,表明两变量间A.没有相关关系B.有曲线相关关系C.负相关关系越强D.负相关关系越弱17.当相关系数r=0时,A.现象之间完全⽆关B.相关程度较⼩B.现象之间完全相关 D.⽆直线相关关系18.假设产品产量与产品单位成本之间的相关系数为-0.89,则说明这两个变量之间存在A.⾼度相关B.中度相关C.低度相关D.显著相关19.从变量之间相关的⽅向看可分为A.正相关与负相关B.直线相关和曲线相关C.单相关与复相关D.完全相关和⽆相关20.从变量之间相关的表现形式看可分为A.正相关与负相关B.直线相关和曲线相关C.单相关与复相关D.完全相关和⽆相关21.物价上涨,销售量下降,则物价与销售量之间属于A.⽆相关B.负相关C.正相关D.⽆法判断22.配合回归直线最合理的⽅法是A.随⼿画线法B.半数平均法C.最⼩平⽅法D.指数平滑法23.在回归直线⽅程y=a+bx中b表⽰A.当x增加⼀个单位时,y增加a的数量B.当y增加⼀个单位时,x增加b的数量C.当x增加⼀个单位时,y的平均增加量D.当y增加⼀个单位时, x的平均增加量24.计算估计标准误差的依据是A.因变量的数列B.因变量的总变差C.因变量的回归变差D.因变量的剩余变差25.估计标准误差是反映A.平均数代表性的指标B.相关关系程度的指标C.回归直线的代表性指标D.序时平均数代表性指标26.在回归分析中,要求对应的两个变量A.都是随机变量B.不是对等关系C.是对等关系D.都不是随机变量27.年劳动⽣产率(千元)和⼯⼈⼯资(元)之间存在回归⽅程y=10+70x,这意味着年劳动⽣产率每提⾼⼀千元时,⼯⼈⼯资平均A.增加70元B.减少70元C.增加80元D.减少80元28.设某种产品产量为1000件时,其⽣产成本为30000元,其中固定成本6000元,则总⽣产成本对产量的⼀元线性回归⽅程为:A.y=6+0.24xB.y=6000+24xC.y=24000+6xD.y=24+6000x29.⽤来反映因变量估计值代表性⾼低的指标称作A.相关系数B.回归参数C.剩余变差D.估计标准误差⼆、多项选择题1.下列现象之间属于相关关系的有A.家庭收⼊与消费⽀出之间的关系B.农作物收获量与施肥量之间的关系C.圆的⾯积与圆的半径之间的关系D.⾝⾼与体重之间的关系E.年龄与⾎压之间的关系2.直线相关分析的特点是A.相关系数有正负号B.两个变量是对等关系C.只有⼀个相关系数D.因变量是随机变量E.两个变量均是随机变量3.从变量之间相互关系的表现形式看,相关关系可分为A.正相关B.负相关C.直线相关D.曲线相关E.单相关和复相关4.如果变量x与y之间没有线性相关关系,则A.相关系数r=0B.相关系数r=1C.估计标准误差等于0D.估计标准误差等于1E.回归系数b=05.设单位产品成本(元)对产量(件)的⼀元线性回归⽅程为y=85-5.6x,则A.单位成本与产量之间存在着负相关B.单位成本与产量之间存在着正相关C.产量每增加1千件,单位成本平均增加5.6元D.产量为1千件时,单位成本为79.4元E.产量每增加1千件,单位成本平均减少5.6元6.根据变量之间相关关系的密切程度划分,可分为A.不相关B.完全相关C.不完全相关D.线性相关E.⾮线性相关7.判断现象之间有⽆相关关系的⽅法有A.对现象作定性分析B.编制相关表C.绘制相关图D.计算相关系数E.计算估计标准误差 8.当现象之间完全相关的,相关系数为A.0B.-1C.1D.0.5E.-0.5 9.相关系数r =0说明两个变量之间是A.可能完全不相关B.可能是曲线相关C.肯定不线性相关D.肯定不曲线相关E.⾼度曲线相关10.下列现象属于正相关的有A.家庭收⼊愈多,其消费⽀出也愈多B.流通费⽤率随商品销售额的增加⽽减少C.产量随⽣产⽤固定资产价值减少⽽减少D.⽣产单位产品耗⽤⼯时,随劳动⽣产率的提⾼⽽减少E.⼯⼈劳动⽣产率越⾼,则创造的产值就越多 11.直线回归分析的特点有A.存在两个回归⽅程B.回归系数有正负值C.两个变量不对等关系D.⾃变量是给定的,因变量是随机的E.利⽤⼀个回归⽅程,两个变量可以相互计算 12.直线回归⽅程中的两个变量A.都是随机变量B.都是给定的变量C.必须确定哪个是⾃变量,哪个是因变量D.⼀个是随机变量,另⼀个是给定变量E.⼀个是⾃变量,另⼀个是因变量13.从现象间相互关系的⽅向划分,相关关系可以分为A.直线相关B.曲线相关C.正相关D.负相关E.单相关 14.估计标准误差是A.说明平均数代表性的指标B.说明回归直线代表性指标C.因变量估计值可靠程度指标D.指标值愈⼩,表明估计值愈可靠E.指标值愈⼤,表明估计值愈可靠 15.下列公式哪些是计算相关系数的公式16.⽤最⼩平⽅法配合的回归直线,必须满⾜以下条件A.∑(y-y c )=最⼩值B.∑(y-y c )=0C.∑(y-y c )2=最⼩值D.∑(y-y c )2=0E.∑(y-y c )2=最⼤值 17.⽅程y c =a+bx222222)()(.)()())((...))((.y y n x x n yx xy n r E y y x x y y x x r D L L L r C L L L r B n y y x x r A xx xy xyyy xx xy y x ∑-∑?∑-∑∑?∑-∑=-∑?-∑--∑===--∑=σσA.这是⼀个直线回归⽅程B.这是⼀个以X为⾃变量的回归⽅程C.其中a是估计的初始值D.其中b是回归系数E.y c是估计值18.直线回归⽅程y c=a+bx中的回归系数bA.能表明两变量间的变动程度B.不能表明两变量间的变动程度C.能说明两变量间的变动⽅向D.其数值⼤⼩不受计量单位的影响E. 其数值⼤⼩受计量单位的影响19.相关系数与回归系数存在以下关系A.回归系数⼤于零则相关系数⼤于零B.回归系数⼩于零则相关系数⼩于零C.回归系数等于零则相关系数等于零D.回归系数⼤于零则相关系数⼩于零E.回归系数⼩于零则相关系数⼤于零20.配合直线回归⽅程的⽬的是为了A.确定两个变量之间的变动关系B.⽤因变量推算⾃变量C.⽤⾃变量推算因变量D.两个变量相互推算E.确定两个变量之间的相关程度21.若两个变量x和y之间的相关系数r=1,则A.观察值和理论值的离差不存在B.y的所有理论值同它的平均值⼀致C.x和y是函数关系D.x与y不相关E.x与y是完全正相关22.直线相关分析与直线回归分析的区别在于A.相关分析中两个变量都是随机的;⽽回归分析中⾃变量是给定的数值,因变量是随机的B.回归分析中两个变量都是随机的;⽽相关分析中⾃变量是给定的数值,因变量是随机的C.相关系数有正负号;⽽回归系数只能取正值D.相关分析中的两个变量是对等关系;⽽回归分析中的两个变量不是对等关系E.相关分析中根据两个变量只能计算出⼀个相关系数;⽽回归分析中根据两个变量只能计算出⼀个回归系数三、填空题1.研究现象之间相关关系称作相关分析。

第二章(简单线性回归模型)2-1答案

第二章(简单线性回归模型)2-1答案

2.1回归分析与回归函数一、判断题1. 总体回归直线是解释变量取各给定值时被解释变量条件期望的轨迹。

(T )2. 线性回归是指解释变量和被解释变量之间呈现线性关系。

( F )3. 随机变量的条件期望与非条件期望是一回事。

(F )4、总体回归函数给出了对应于每一个自变量的因变量的值。

(F )二、单项选择题1.变量之间的关系可以分为两大类,它们是( A )。

A .函数关系与相关关系B .线性相关关系和非线性相关关系C .正相关关系和负相关关系D .简单相关关系和复杂相关关系2.相关关系是指( D )。

A .变量间的非独立关系B .变量间的因果关系C .变量间的函数关系D .变量间不确定性的依存关系3.进行相关分析时的两个变量( A )。

A .都是随机变量B .都不是随机变量C .一个是随机变量,一个不是随机变量D .随机的或非随机都可以4.回归分析中定义的( B )。

A.解释变量和被解释变量都是随机变量B.解释变量为非随机变量,被解释变量为随机变量C.解释变量和被解释变量都为非随机变量D.解释变量为随机变量,被解释变量为非随机变量5.表示x 和y 之间真实线性关系的总体回归模型是( C )。

A .01ˆˆˆt t Y X ββ=+B .01()t t E Y X ββ=+C .01t t t Y X u ββ=++D .01t t Y X ββ=+6.一元线性样本回归直线可以表示为( C )A .i i X Y u i 10++=ββ B. i 10X )(Y E i ββ+=C. i i e X Y ++=∧∧i 10ββ D. i 10X i Y ββ+=∧7.对于i 01i i ˆˆY =X +e ββ+,以ˆσ表示估计标准误差,r 表示相关系数,则有( D)。

A .ˆ0r=1σ=时,B .ˆ0r=-1σ=时,C .ˆ0r=0σ=时,D .ˆ0r=1r=-1σ=时,或8.相关系数r 的取值范围是( D )。

第三章(多元线性回归模型)3-3答案

第三章(多元线性回归模型)3-3答案

3.3 多元线性回归模型的检验一、判断题1、在线性回归模型中,为解释变量或者被解释变量重新选取单位(比如,元变换成千元),会影响t 统计量和 2R 的数值。

( F )2、在多元线性回归中,t 检验和F 检验缺一不可。

( T )3、回归方程总体线性显著性检验的原假设是模型中所有的回归参数同时为零。

( F )4、多元线性回归中,可决系数2R 是评价模型拟合优度好坏的最佳标准。

( F )二 、单项选择1、在模型0112233t t t t t Y X X X ββββμ=++++的回归分析结果中,有462.58F =,0.000000F p =的值,则表明 ( C )A 、解释变量2t X 对t Y 的影响不显著B 、解释变量1t X 对t Y 的影响显著C 、模型所描述的变量之间的线性关系总体上显著D 、解释变量2t X 和1t X 对t Y 的影响显著2、设k 为回归模型中的实解释变量的个数,n 为样本容量。

则对回归模型进行总体显著性 检验(F 检验)时构造的F 统计量为 ( A )A 、1)ESS k F RSS n k =--B 、(1)()ESS k F RSS n k -=- C 、ESS F RSS = D 、1RSS F TSS=- 3、在多元回归中,调整后的可决系数2R 与可决系数2R 的关系为 ( A ) A 、22R R < B 、22R R >C 、22R R =D 、2R 与2R 的关系不能确定4、根据调整的可决系数2R 与F 统计量的关系可知,当21R =时,有 ( C )A 、F=0B 、F=-1C 、F →+∞D 、F=-∞5、下面哪一表述是正确的 ( D ) A 、线性回归模型01i i i Y X ββμ=++的零均值假设是指110ni i n μ==∑ B 、对模型01122i i i i Y X X βββμ=+++进行方程显著性检验(即F 检验),检验的零假 设是0012:0H βββ===C 、相关系数较大意味着两个变量存在较强的因果关系D 、当随机误差项的方差估计量等于零时,说明被解释变量与解释变量之间为函数关系5、对于01122ˆˆˆˆi i i k ki iY X X X e ββββ=+++++…,如果原模型满足线性模型的基本假设则 在零假设0j β=下,统计量ˆˆ()j j s ββ(其中ˆ()js β是j β的标准误差)服从 (B )A 、()t n k -B 、(1)t n k --C 、(1,)F k n k --D 、(,1)F k n k --6、在由的一组样本估计的、包含3个解释变量的线性回归模型中,计算得多重可决系数为0.8500,则调整后的多重可决系数为( D )A 、8603B 、 0.8389C 、0.8655D 、0.83277、可决系数R 2=0.8,说明回归直线能解释被解释变量总变差的:( A )A 、 80%B 、 64%C 、 20%D 、 89%8、线性回归模型01122......t t t k kt t y b b x b x b x u =+++++ 中,检验0:0(0,1,2,...)t H b i k ==时,所用的统计量 服从( C )A.t(n-k+1)B.t(n-k-2)C.t(n-k-1)D.t(n-k+2)三、多项选择题1、对模型满足所有假定条件的模型01122i i i i Y X X βββμ=+++进行总体显著性检验,如果检验结果总体线性关系显著,则很可能出现 ( BCD )A 、120ββ==B 、120,0ββ≠=C 、120,0ββ≠≠D 、120,0ββ=≠E 、120,0ββ==2、设k 为回归模型中的参数个数(包含截距项)则总体线性回归模型进行显著性检验时所 用的F 统计量可以表示为 ( BC )A 、()()()∑∑---1k e k n Y Y 2i 2i i //ˆ B 、()()()∑∑---k n e 1k Y Y 2i2ii //ˆ C 、()()()k n R 11k R 22---// D 、()()()1k R k n R 122---// E 、()()()1k R 1k n R 22---// 3、在多元回归分析中,调整的可决系数2R 与可决系数2R 之间 ( AD )A 、22R R <B 、22R R ≥C 、2R 只可能大于零D 、2R 可能为负值E 、2R 不可能为负值四、简答题30n =1.在多元线性回归分析中,为什么用修正的可决系数衡量估计模型对样本观测值的拟合优度?答:因为人们发现随着模型中解释变量的增多,多重可决系数2R 的值往往会变大,从而增加了模型的解释功能。

spss应用教程考试题及答案

spss应用教程考试题及答案

spss应用教程考试题及答案一、选择题(每题2分,共20分)1. 在SPSS中,数据文件的扩展名是什么?A. .txtB. .xlsC. .savD. .csv答案:C2. SPSS中,用于描述数据集中变量分布情况的统计图是?A. 散点图B. 箱线图C. 条形图D. 饼图答案:B3. 在SPSS中进行相关分析时,通常使用哪个菜单?A. 分析B. 转换C. 描述统计D. 数据管理答案:A4. 如何在SPSS中创建一个新变量?A. 通过数据菜单下的“计算变量”B. 通过转换菜单下的“计算变量”C. 通过分析菜单下的“计算变量”D. 通过文件菜单下的“计算变量”5. 在SPSS中,进行回归分析应该选择哪个菜单?A. 分析B. 转换C. 数据管理D. 描述统计答案:A6. SPSS中,用于比较两组数据均值差异的统计检验是?A. t检验B. 方差分析C. 卡方检验D. 相关分析答案:A7. 在SPSS中,如何对数据进行排序?A. 通过数据菜单下的“排序案例”B. 通过转换菜单下的“排序案例”C. 通过分析菜单下的“排序案例”D. 通过文件菜单下的“排序案例”答案:A8. SPSS中,用于创建数据子集的选项位于哪个菜单下?A. 数据B. 转换C. 分析D. 文件答案:A9. 在SPSS中,执行因子分析应该选择哪个菜单?B. 转换C. 数据管理D. 描述统计答案:A10. SPSS中,如何查看数据的频率分布表?A. 通过分析菜单下的“描述统计”中的“频率”B. 通过转换菜单下的“描述统计”中的“频率”C. 通过数据菜单下的“描述统计”中的“频率”D. 通过文件菜单下的“描述统计”中的“频率”答案:A二、填空题(每空1分,共20分)1. 在SPSS中,数据的录入可以通过________菜单下的“输入数据”来完成。

答案:数据2. SPSS中,数据的导出可以通过________菜单下的“导出数据”来实现。

答案:文件3. 当需要对数据进行分组分析时,可以使用SPSS中的________功能。

《统计预测与决策》复习试卷(共4套、含答案)

《统计预测与决策》复习试卷(共4套、含答案)

试卷一一、单项选择题(共 10 小题,每题 1 分,共 10 分)1 统计预测方法中,以逻辑判断为主的方法属于( c) 。

A 回归预测法B 定量预测法C 定性预测法D 时间序列预测法2 下列哪一项不是统计决策的公理( d ) 。

A 方案优劣可以比较B 效用等同性C 效用替换性D 效用递减性3 根据经验 D-W 统计量在 ( b)之间表示回归模型没有显著自相关问题。

A 1.0-1.5B 1.5-2.5C 1.5-2.0D 2.5-3.54 当时间序列各期值的二阶差分相等或大致相等时 ,可配合(b )进行预测。

A 线性模型B 抛物线模型C 指数模型D 修正指数模型5 ( c)是指国民经济活动的绝对水平出现上升和下降的交替。

A 经济周期B 景气循环C 古典经济周期D 现代经济周期6 灰色预测是对含有( c)的系统进行预测的方法。

A 完全充分信息B 完全未知信息C 不确定因素D 不可知因素7 状态空间模型的假设条件是动态系统符合( c ) 。

A 平稳特性B 随机特性C 马尔可夫特性D 离散性8不确定性决策中“乐观决策准则”以( b)作为选择最优方案的标准。

A 最大损失B 最大收益C 后悔值D α系数9贝叶斯定理实质上是对( c)的陈述。

A 联合概率B 边际概率C 条件概率D 后验概率10 景气预警系统中绿色信号代表( b ) 。

A 经济过热B 经济稳定C 经济萧条D 经济波动过大二、多项选择题(共 5 小题,每题 3 分,共 15 分)1 构成统计预测的基本要素有( acd ) 。

A 经济理论B 预测主体C 数学模型D 实际资料2 统计预测中应遵循的原则是( bd) 。

A 经济原则B 连贯原则C 可行原则D 类推原则3按预测方法的性质,大致可分为( acd)预测方法。

A 定性预测B 情景预测C 时间序列预测D 回归预测4 一次指数平滑的初始值可以采用以下( bd )方法确定。

A 最近一期值B 第一期实际值C 最近几期的均值D 最初几期的均值5 常用的景气指标的分类方法有( abcd) 。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

应用回归分析简答题及答案
4.为什么要对回归模型进行检验?
答:当模型的未知参数估计出来后,就初步建立了一个回归模型。

建立回归模型的目的是应用他来研究经济问题,但如果马上就用这个模型去做预测、控制和分析,显然是不够慎重的。

因为这个模型是否真正揭示了被解释变量与解释变量之间的关系,必须通过对模型的检验才能决定。

5.讨论样本容量n与自变量个数p的关系,他们对模型的参数估计有何影响?
答:在多元线性回归模型中,样本容量n与自变量个数p的关系是:n>p。

如果n<=p对模型的参数估计会带来严重的影响。

因为:(1 )在多元线性回归模型中,有p+1个待估参数B,所以样本容量的个数应该大于解释变量的个数,否则参数无法估计。

(2)解释变量X是确定性变量,要求rank(X)
=p+1<n ,表明设计矩阵X中的自变量列之间不相关,样本容量的个数应该大于解释变量的个数,
X是一个满秩矩阵
7.如何正确理解回归方程显著性检验拒绝Ho,接受Ho ?
答:(1)一般情况下,当Ho : B仁0被接受时,表明y的取值倾向不随x的值按线性关系变化,这种状况的原因可能是变量y与x之间的相关关系不显著,也可能虽然变量y与x之间的相关关系显著,但这种相关关系不是线性的而是非线性的。

(2)当Ho : B仁0被拒绝时,没有其他信息,只能认为因变量y对自变量x是有效的,但并没有说明回归的有效程度,不能断言y与x之间就一定是线性相关关系,而不是曲线关系或其他的关系。

8■—个回归方程的复相关系数R=0.99,样本决定系数
RA2=0.9801,我们能断定这个回归方程就很理想吗?
答:1.在样本容量较少,变两个数较大时,决定系数的值容易接近1,而此时可能F检验或者关于回归系数的t检验,所建立的回归方程都没能通过。

2.样本决定系数和复相关系数接近1只能说明Y 与自变量X1,X2,…,Xp整体上的线性关系成立,而不能判断回归方程和每个自变量都是显著的,还需
进行F检验和t检验
3.在应用过程中发现,在样本量一定的情况下,如果在模型中增加解释变量必定使得自由度减少,使得R A2增大,因此增加解释变量个数引起的R A2的
增大与拟合好坏无关。

9.数据中心化和标准化在回归分析中的意义是什么?
答:原始数据由于自变量的单位不同,会给分析带来一定的困难;又由于涉及的数据量较大,可能会以为舍入误差而使得计算结果并不理想。

中心化和标准化回归系数有利于消除由于量纲不同、数量级不同带来的影响,避免不必要的误差。

10.试举例说明产生异方差的原因。

答:由于实际问题是错综复杂的,因而在建立实际问题的回归模型时,经常会出现某一些因素或一些因素随着解释变量观测值的变化而对被解释变量产生不同的影响,导致随机误差项产生不同方差。

引起异方差的原因很多,担当样本数据为截面数据时容易出现异方差。

例如:烟具城镇居民收入与购买量的关系:
Yi=Bo+B1Xi+Ei,i=1,2,…,n
其中:Yi表示第i户的消费额,Xi表示第i户的收入量
由于低收入的家庭购买差异性比较小,大都购买生活必需品,但高收入的家庭购买行为差异很大,所以随即项Ei具有不同的方差。

11.异方差性带来的后果是什么?
答:(1)参数估计量非有效;(2)变量的显著性检验失去意义;(3)模型的预测失效。

12.简述用加权最小二乘法消除线性回归中异方差性的思想与方法。

答:思想:加权最小二乘法是对原模型加权,使之变成一个新的不存在异方差性的模型,然后采用普通最小二乘法估计其参数。

在异方差的条件下,平方和中的每一项的地位不同,误差项方差大的项,在平方和中作用大,回归线被拉向方差大的项。

加权最小二乘法是在平方和中加入一个适当的权数Wi,以调整各项在平方和中的作用。

方法:加权最小二乘法、BOX-COX 变换法、方差稳定性变换法。

13.试举一可能产生随机误差项序列相关的例子
答:例如,居民消费函数的模型:
Ct=Bo+B1Yt+Et,t=1,2,'、',n
由于居民收入对消费影响有滞后性,而且今年消费水平受上年消费水平影响,则可能出现序列相关性。

另外由于消费习惯的影响被包含在随机误差项中,则可能出现序列相关性(往往是正相关)。

14•序列相关性带来的严重后果是什么?
答:(1)参数估计量非有效;(2)变量的显著性检验失去意义;(3)模型的预测失效。

15.说明引起异常值的原因和消除异常值的方法。

答:原因:
1.数据登记误差,存在抄写或录入的错误;
2•数据测量误差;
3•数据随机误差;
4.缺少重要自变量;
5.缺少观测数据;
6.存在异方差;
7.模型选用错误,线性模型不适用。

方法:1.重新核实数据;
2.重新测量数据;
3■删除或重新官策异常值数据;
4.增加必要的自变量;
5.增加观测数据,适当扩大自变量取值范围;
6.采用加权线性回归;
7.改用非线性回归模型。


16.在运用逐步回归法时,a进和a出的赋值原则是什么?说明理由。

答:原则是要求引入自变量的显著水平a进小于剔除自变量的显著性水平a出,否则可能出现死循环;
17.试述逐步回归的思想方法。

答:逐步回归的基本思想是有进有出。

具体做法是将变量一个一个的引入,当每引入一个自变量后,对已选入的变量要进行逐个检验,当原引入变量由于后面变量的应纳入而变得不再显著时,要将其剔除。

引入一个变量或从回归防方程中剔除一个变量,为逐步回归的一步,每一步都要进行F检验,以确保每次引入新的变量之前回归方程中只包含显著的变量。

这个过程反复进行,直到无显著变量引入回归方程,也无不显著变量从回归方程中剔除为止。

这样就避免了前进法和后退法各自的缺陷,保证了最后得到的回归
子集是最优回归子集
18.多重共线性对回归参数的估计有何影响?
答:1、完全共线性下参数估计量不存在;
2、近似共线性下OLS估计量非有效;
3、参数估计量经济含义不合理;
4、变量的显著性检验失去意义;
5、模型的预测功能失效。

19.具有严重多重共线性的回归方程能不能用来做经济预测?
答:虽然参数估计值方差的变大容易使区间预测的“区间”变大,使预测失去意义。

但如果利用模型去做经济预测,只要保证自变量的相关类型在未来期中一直保持不变,即使回归模型中包含严重多重共线性的变量,也可以得到较好预测结果;否则会对经济预测产生严重的影响。

20.多重共线性的产生于样本容量的个数n、自变量的个数p有无关系?
答:有关系,增加样本容量不能消除模型中的多重共线性,但能适当消除多重共线性造成的后果。

当自变量的个数p较大时,一般多重共线性容易发生,所以自变量应选择少而精。

相关文档
最新文档