[VIP专享]第11章 一元线性回归
贾俊平《统计学》章节题库-第十一章至第十二章(圣才出品)
圣才电子书 十万种考研考证电子书、题库视频学习平台
5.根据下面的散点图,可以判断两个变量之间存在( )。
A.正线性相关关系 B.负线性相关关系 C.非线性关系 D.函数关系 【答案】B 【解析】在线性相关中,若两个变量的变动方向相反,一个变量的数值增加,另一个变 量的数值随之减少,或一个变量的数值减少,另一个变量的数值随之增加,则称为负线性相 关关系。
1 / 88
圣才电子书 十万种考研考证电子书、题库视频学习平台
3.下面的假定中,哪个属于相关分析中的假定( )。 A.两个变量之间是非线性关系 B.两个变量都是随机变量 C.自变量是随机变量,因变量不是随机变量 D.一个变量的数值增大,另一个变量的数值也应增大 【答案】B 【解析】在进行相关分析时,对总体主要有以下两个假定:①两个变量之间是线性关系; ②两个变量都是随机变量。
【答案】C 【解析】在线性相关中,若两个变量的变动方向相反,一个变量的数值增加,另一个变
5 / 88
圣才电子书 十万种考研考证电子书、题库视频学习平台
量的数值随之减少,或一个变量的数值减少,另一个变量的数值随之增加,即 x 值增大时 y 值随之变小,或 x 值变小时 y 值随之增大,则称为负相关。
12.如果相关系数 r=0,则表明两个变量之间( )。 A.相关程度很低 B.不存在任何关系 C.不存在线性相关关系 D.存在非线性相关关系 【答案】C 【解析】相关系数是根据样本数据计算的度量两个变量之间线性关系强度的统计量。如 果相关系数 r=0,说明两个变量之间不存在线性相关关系。
13.设产品产量与产品单位成本之间的线性相关系数为-0.87,这说明二者之间存在着 ( )。
2.下面的各问题中,哪个不是相关分析要解决的问题( )。 A.判断变量之间是否存在关系 B.判断一个变量数值的变化对另一个变量的影响 C.描述变量之间的关系强度 D.判断样本所反映的变量之间的关系能否代表总体变量之间的关系 【答案】B 【解析】相关分析就是对两个变量之间线性关系的描述与度量,它主要解决的问题包括: ①变量之间是否存在关系;②如果存在关系,它们之间是什么样的关系;③变量之间的关系 强度如何;④样本所反映的变量之间的关系能否代表总体变量之间的关系。
第11章回归分析习题解答
B. 是随机变量,且有 y0 N (β0 + β1x0 ,σ 2 ) .
C. 当 β0 , β1 确知时等于 β0 + β1x0 .
D. 等于 βˆ0 + βˆ1x0 .
6. 在回归分析中,检验线性相关显著性常用的三种检验方法,不包含(
A. 相关系数显著性检验法.
B. t 检验法.
; 若 新 保 单 数 x0 = 1000 , 给 出 Y 的 估 计 值 为
yˆ0 = 0.118129 + 0.003585×1000 = 3.703129 .
16. 下表是 16 只公益股票某年的每股帐面价值 x 和当年红利 y ,利用 Excel 的数据分
析功能得到的统计分析结果如下:
方差分析
过 10 周时间,收集了每周加班工作时间的数据和签发的新保单数目, x 为每周签发的新保
单数目,Y 为每周加班工作时间(小时).利用 Excel 的数据分析功能得到统计分析如下表.
Coefficients
标准误差
Intercept X Variable 1
0.118129 0.003585
0.355148 0.000421
15.1
15.1
228.01
228.01
18
15.1
14.5
228.01
210.25
列和
270.1
265
计算可得:
4149.39
3996.14
∑ Syy =
y2 i
−
ny 2
=94.75
∑ Sxx =
x2 i
−
nx 2
=96.39
∑ Sxy = xi yi − nxy = 95.24
第十章 一元线性回归
第十一章 一元线性回归一、填空题1、对回归系数的显著性检验,通常采用的是 检验。
2、若回归方程的判定系数R 2=0.81,则两个变量x 与y 之间的相关系数r 为_________________。
3、若变量x 与y 之间的相关系数r=0.8,则回归方程的判定系数R 2为____________。
4、对于直线趋势方程bx a y c +=,已知∑=,0x ∑=130xy ,n=9,1692=∑x, a=b ,则趋势方程中的b=______。
5、回归直线方程bx a y c +=中的参数b 是_____________。
估计待定参数a 和 b 常用的方法是-_________________。
6、相关系数的取值范围_______________。
7、在回归分析中,描述因变量y 如何依赖于自变量x 和误差项的方程称为 。
8、在回归分析中,根据样本数据求出的方程称为 。
9、在回归模型εββ++=x y 10中的ε反映的是 。
10、在回归分析中,F 检验主要用来检验 。
11、说明回归方程拟合优度检验的统计量称为 。
二、单选题1、年劳动生产率(x :千元)和工人工资(y :元)之间的回归方程为1070y x =+,这意味着年劳动生产率没提高1千元,工人工资平均( )A 、 增加70元B 、 减少70元C 、增加80元D 、 减少80元 2、两变量具有线形相关,其相关系数r=-0.9,则两变量之间( )。
A 、强相关B 、弱相关C 、不相关D 、负的弱相关关系 3、变量的线性相关关系为0,表明两变量之间( )。
A 、完全相关B 、无关系C 、不完全相关D 、不存在线性关系 4、相关关系与函数关系之间的联系体现在( )。
A 、相关关系普遍存在,函数关系是相关关系的特例 B 、函数关系普遍存在,相关关系是函数关系的特例C 、相关关系与函数关系是两种完全独立的现象D 、相关关系与函数关系没有区别 5、已知x 和y 两变量之间存在线形关系,且δx =10, δy =8, δxy2=-7,n=100,则x 和y 存在着( )。
贾俊平统计学第7版课后习题答案
贾俊平《统计学》课后习题答案在线阅读:https:///cUb7v8DC
【解析】数据的测量尺度有四种:①分类尺度,即名义尺度。按照事物的某种属性对其进行 平行的分类,数据表现为类别,如“性别”。②顺序尺度。对事物类别顺序的测度,数据表 现为有序的类别,如“产品登记”“受教育程度”。③差距尺度。对事物类别或次序之间间 距的测度,没有绝对零点,数据表现为数字。④比例尺度。对事物类别或次序之间间距的测 度,有绝对零点,数据表现为数字。 8 以下关于参数和统计量的说法正确的是( )。[中央财经大学 2011 研] A.总体参数是随机变量 B.样本统计量都是总体参数的无偏估计量 C.对一个总体参数进行估计时,统计量的表达式是唯一的 D.样本统计量是随机变量 【答案】D 【解析】参数是用来描述总体特征的概括性数字度量,研究者所关心的参数通常有总体平均 数、总体标准差、总体比例等,由于总体数据通常是不知道的,所以参数是一个未知的常数。 无偏性是指估计量抽样分布的数学期望等于被估计的总体参数,并非所有的估计量都具有无 偏性。对总体参数进行估计时,用不同估计方法得到的估计量可能不同。统计量是根据样本 数据计算出来的一个量,由于抽样是随机的,因此统计量是样本的函数,是随机变量。 9 以下哪一种情形涉及定性数据的收集?( )[中山大学 2012 研] A.质量控制工程师测量电灯泡的寿命 B.社会学家通过抽样调查来估计广州市市民的平均年收入 C.运动器材厂家在区分各大俱乐部棒球选手是左撇子还是右撇子时做的调查 D.婚礼策划公司通过抽样调查来估计上海市市民举办婚礼的平均开销 【答案】C
试读(部分内容)
第 1 章 导 论 一、单项选择题 1 在抽样推断中,总体参数是一个( )。[中央财经大学 2018 研]
贾俊平《统计学》课后习.已知的量 C.统计量 D.确定的量 【答案】D 【解析】参数是用来描述总体特征的概括性数字度量,它是研究者想要了解的总体的某种特 征值。由于总体数据通常是不知道的,所以参数是一个未知的确定的常数。 2 统计年鉴中 2016 年全国各大城市的人均家庭收入数据属于( )。[中央财经大学 2018 研] A.定类数据 B.定序数据 C.截面数据 D.时间序列数据 【答案】C 【解析】按照被描述的现象与时间的关系,可以将统计数据分为截面数据和时间序列数据。 截面数据是在相同或近似相同的时间点上收集的数据,这类数据通常是在不同的空间获得 的,用于描述现象在某一时刻的变化情况。比如,2010 年我国各地区的国内生产总值就是 截面数据。时间序列数据是在不同时间收集到的数据,这类数据是按时间顺序收集到的,用 于描述现象随时间变化的情况。比如 2010~2012 年我国的国内生产总值就是时间序列数 据。 3 在教学评估中,某省三所高校的等级分别是优秀、良好、及格,则“等级”是( )。 [浙江工商大学 2017 研]
一元线性回归PPT演示课件
196.2
15.8
16.0
102.2
12.0
10.0
本年固定资产投资额 (亿元) 51.9 90.9 73.7 14.5 63.2 2.2 20.2 43.8 55.9 64.3 42.7 76.7 22.8 117.1 146.7 29.9 42.1 25.3 13.4 64.3 163.9 44.5 67.9 39.7 97.1
6. r 愈大,表示相关关系愈密切.
例 11.7
根据例11.6的样本数据,计算不良贷款、贷款余额、应收 贷款、贷款项目、固定资产投资额之间的相关系数.
解:用Excel计算的相关系数矩阵如下.
三、相关系数的显著性检验
(一) r 的抽样分布
当样本数据来自正态总体,且 0 时,则
t r n 2 ~ t(n 2) 1 r2
时,yˆ ˆ0 .
二、参数的最小二乘估计
假定样本数据 (xi , yi ) , i 1,2,, n ,满足一元线性回归模 型, 根据(11.6)式则样本回归方程为
yˆi ˆ0 ˆ1xi , i 1,2,, n
(11.7)
最小二乘法是使因变量的观察值 yi 与估计值 yˆi 之间的离差平
i1 i1
n
n
n
n
n xi2 ( xi )2 n yi2 ( yi )2
i 1
i 1
i 1
i 1
( 11.1 ) ( 10.2 )
相关系数的取值范围及意义
1. r 的取值范围为[-1,1].
2. r 1 ,称完全相关,既存在线性函数关系.
r =1,称完全正相关. r =-1,称完全负相关. 3. r =0,称零相关,既不存在线性相关关系. 4. r <0,称负相关. 5. r >0,称正相关.
统计学-第11章一元线性回归学习指导
第11章一元线性回归(相关与回归)学习指导一、本章基本知识梳理基本知识点含义或公式相关关系 客观现象之间确实存在的、但在数量表现上不是严格对应的依存关系。
函数关系 客观现象之间确实存在的、而且数量表现上是严格对应的依存关系。
因果关系有相关关系的现象中能够明确其中一种现象(变量)是引起另一种现象(变量)变化的原因,另一种现象是这种现象变化的结果。
起影响作用的现象(变量)称为“自变量”;而受自变量影响发生变动的现象(变量)称为“因变量”。
因果关系∊相关关系,但相关关系中还包括互为因果关系的情况。
相关关系的种类 按涉及变量多少分为单相关、复相关;按相关方向分为正相关、负相关;按相关形态分为线性相关、非线性相关等。
线性(直线) 相关系数 简称相关系数,反映具有直线相关关系的两个变量关系的密切程度。
()()∑∑∑∑∑∑∑---==2222y yn x xn yx xy n SS S r yx xy相关系数的 显著性检验 ——t 检验 ()().2;,212:0:,0:020221Hn t t Hn t t rn r t HH,拒绝不能拒绝检验统计量-〉-〈--=≠=ααρρ回归方程中的 参数β0和β1为回归直线的截距、起始值,表示在没有自变量x 的影响(即x =0)时,其他各种因素对因变量y 的平均影响;β1为回归系数、斜率,表示自变量x 每变动一个单位,因变量y 的平均变动量。
β1的最小平方估计:∑∑∑∑∑⎪⎭⎫ ⎝⎛--=221x x n yx xy nβ估计标准误差反映因变量实际值与其估计值之间的平均差异程度,表明其估计值对实际值的代表性强弱。
其值越大,实际值与估计值之间的平均差异程度越大,估计值的代表性越差。
()代替。
用大样本条件下,分母可;n n yyS e 2ˆ2--=∑总离差平方和S S T反映因变量的n 个观察值与其均值的总离差。
回归离差平方和S S R 反映自变量x 的变化对因变量y 取值变化的影响;或者说,是由于x 与y 之间的线性关系引起的y 取值的变化,也称为可解释的平方和。
一元线性回归模型的参数估计
斜率(β1)
表示 x 每变化一个单位,y 平均变化的数量。
一元线性回归模型的假设
线性关系
因变量 y 和自变量 x 之间存在线性关系。
误差项独立
误差项 ε 之间相互独 立,且与 x 独立。
误差项的正态性
误差项 ε 的分布是正 态的。
误差项的无偏性
误差项 ε 的期望值为 0,即 E(ε) = 0。
有限的方差
回归分析的分类
一元回归分析
研究一个自变量和一个因变量之间的关系。
多元回归分析
研究多个自变量和一个因变量之间的关系。
线性回归模型
线性回归模型是一种常用的回归分析方法,它假设自变量和因变量之间存在线性关系,即可以用一条 直线来描述它们之间的关系。
在一元线性回归模型中,自变量和因变量之间的关系可以表示为一条直线,即 y = ax + b,其中 a 是斜 率,b 是截距。
确定样本数据
收集用于估计参数的样本数据。
构建估计量
根据模型和样本数据构建用于估计参数的统计量。
计算估计值
通过计算统计量的值得到参数的估计值。
评估估计质量
通过统计检验和图形方法评估估计的质量和可靠性。
05 模型的评估与检验
模型的拟合度评估
决定系数(R^2)
衡量模型解释变量变异程度的指标,值越接 近1表示模型拟合度越好。
数据整理
将数据整理成适合进行统计分析 的格式,如表格或图形,以便后 续分析。
建立一元线性回归模型
确定自变量和因变量
根据研究问题选择合适的自变量和因变量,确 保它们之间存在一定的关联性。
散点图分析
绘制散点图,观察自变量和因变量之间的关系, 初步判断是否适合建立一元线性回归模型。
一元线性回归分析PPT课件
拟合程度评价
拟合程度是指样本观测值聚集在样本回归线周围的紧
密程度. ( Y t Y ) ( Y ˆ t Y ) ( Y t Y ˆ t)
n
n
n
(Y t Y )2 (Y ˆt Y )2 (Y t Y ˆ)2
t 1
t 1
t 1
n
(Yt Y)2 :总离差平方和,记为SST;
t1
n
第8页/共40页
例
食品序号 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16
求和
脂肪Xt 4 6 6 8 19 11 12 12 26 21 11 16 14 9 9 5
热量Yt 110 120 120 164 430 192 175 236 429 318 249 281 160 147 210 120
第1页/共40页
回归分析的分类
一个自变量
一元回归
回归分析
两个及以上自变量
多元回归
线性 回归
非线性 回归
线性 回归
非线性 回归
第2页/共40页
一元线性回归模型
(一)总体回归函数
Yt=0+1Xt+ut
ut是随机误差项,又称随机干扰项,它是一个特殊的 随机变量,反映未列入方程式的其他各种因素对Y的 影响。
(ˆ1t(n2)Sˆ1)
2
第15页/共40页
回归分析的Excel实现
“工具”->“数据分析”->“回归”
第16页/共40页
ˆ 0
S ˆ 0
ˆ 1
S ˆ 1
(ˆ0t(n2)Sˆ0)
2
(ˆ1t(n2)Sˆ1)
2
第17页/共40页
计量经济学课件一元线性回归
二、参数的普通最小二乘估计(OLS)
给定一组样本观测值(Xi, Yi)(i=1,2,…n)要 求样本回归函数尽可能好地拟合这组值. 普通最小二乘法(Ordinary least squares, OLS) 给出的判断标准是:二者之差的平方和
ˆ ˆ X )) 2 ˆ ) (Y ( Q (Yi Y i i 0 1 i
640000 352836 1210000 407044 1960000 1258884 2890000 1334025 4000000 1982464 5290000 2544025 6760000 3876961 8410000 4318084 10240000 6682225 12250000 6400900 53650000 29157448
ˆ Y 顺便指出 ,记 y ˆi Y i
则有
ˆ ˆ X ) ( ˆ ˆ X e) ˆi ( y 0 1 i 0 1 ˆ (X X ) 1 e 1 i n i
可得
ˆx ˆi y 1 i
(**)
(**)式也称为样本回归函数的离差形式。
注意:
在计量经济学中,往往以小写字母表示对均值 的离差。
易知 故
x k x
i
i
2 i
0
k X
i
i
1
ˆ k i i 1 1
ˆ ) E ( k ) k E ( ) E( i i 1 i i 1 1 1
同样地,容易得出
ˆ ) E ( w ) E( ) w E ( ) E( i i i i 0 0 0 0
1 (2 ) n
n 2
1 2
2021年统计学(贾5)课后练答案(11-14章)
第11章 一元线性回归分析欧阳光明(2021.03.07)11.1(1)散点图(略),产量与生产费用之间正的线性相关关系。
(2)920232.0=r(3) 检验统计量2281.24222.142=>=αt t ,拒绝原假设,相关系数显著。
11.2(1)散点图(略)。
11.3 (1)0ˆβ表示当0=x 时y 的期望值。
(2)1ˆβ表示x 每变动一个单位y 平均下降0.5个单位。
11.4 (1)%902=R(2)1=e s11.5 一家物流公司的管理人员想研究货物的运输距离和运输时间的关系,为此,他抽出了公司最近10个卡车运货记录的随机样本,得到运送距离要求:(1)绘制运送距离和运送时间的散点图,判断二者之间的关系形态: (2)计算线性相关系数,说明两个变量之间的关系强度。
(3)利用最小二乘法求出估计的回归方程,并解释回归系数的实际意义。
解:(1)可能存在线性关系。
(2)x 运送距离(km )y 运送时间(天) x 运送距离(km )Pearson 相关性 1.949(**) 显著性(双侧)0.000 N10 10 y 运送时间(天)Pearson 相关性 .949(**) 1显著性(双侧) 0.000 N**. 在 .01 水平(双侧)上显著相关。
有很强的线性关系。
(3)模型非标准化系数标准化系数t 显著性B标准误Beta1(常量) 0.118 0.355 0.333 0.748 x 运送距离(km )a. 因变量: y 运送时间(天)回归系数的含义:每公里增加0.004天。
11.6 下面是7个地区2000年的人均国内生产总值(GDP )和人均消费水要求:(1)人均GDP 作自变量,人均消费水平作因变量,绘制散点图,并说明二者之间的关系形态。
(2)计算两个变量之间的线性相关系数,说明两个变量之间的关系强度。
(3)利用最小二乘法求出估计的回归方程,并解释回归系数的实际意义。
(4)计算判定系数,并解释其意义。
一元线性回归模型
称为(双变量)总体回归函数(population regression function, PRF)。
第19页/共117页
• 含义:回归函数(PRF)说明被解释变量Y的 平均状态(总体条件期望)随解释变量X变化 的规律。
• 函数形式:可以是线性或非线性的。
从变量相关关系变化的方向看
正相关——变量同方向变化 ➢例:生产率提高,产品产量增加 负相关——变量反方向变化 ➢例:价格上升,产品需求量下降
25
20
15
10
5
0
0
2
4
6
8
10
12
25
20
15
10
5
0
0
2
4
6
8
10
12
35 30 25 20 15 10
5 0
0
5
10
15
第6页/共117页
●总体相关系数
统计依赖关系
正相关 线性相关 不相关 相关系数:
负相关 1 XY 1
正相关 非线性相关 不相关
负相关
有因果关系 回归分析 无因果关系 相关分析
第9页/共117页
2. 回归分析的基本概念
• 回归分析(regression analysis)是研究一 个变量关于另一个(些)变量的具体依赖关 系的计算方法和理论。
第2页/共117页
二者在一定条件下可以相互转换 函数关系 考虑对变量的测量误差 相关关系 相关关系 考虑全部影响因素 函数关 系
第3页/共117页
相关关系的种类
从涉及的变量(或因素)数量看 (1)单相关——又称一元相关,指两个变 量之间的相关关系。
贾俊平《统计学》复习笔记课后习题详解及典型题详解 第11章~第12章【圣才出品】
圣才电子书 十万种考研考证电子书、题库视频学习平台
4 / 97
圣才电子书 十万种考研考证电子书、题库视频学习平台
图 11-1 不同形态的散点图
(4)相关系数
通过散点图可以判断两个变量之间有无相关关系,并对变量间的关系形态作出大致的描
有所差异。样本相关系数是总体相关系数的一致估计量。样本相关系数记为 r,其计算公式
为:
r
n xy x y
n x2 ( x)2 n y2 ( y)2
按照上述计算公式计算的相关系数也称为线性相关系数,或 Pearson 相关系数。 ②相关系数的性质 a.r 的取值范围在-1~+1 之间,即-1≤r≤1。若 0<r≤1,表明 x 与 y 之间存在正 线性相关关系;若-1≤r<0,表明 x 与 y 之间存在负线性相关关系;若 r=+1,表明 x 与
5 / 97
圣才电子书 十万种考研考证电子书、题库视频学习平台
y 之间为完全正线性相关关系;若 r=-1,表明 x 与 y 之间为完全负线性相关关系。可见当 |r|=1 时,y 的取值完全依赖于 x,二者之间即为函数关系;当 r=0 时,说明 y 的取值与 x 无关,即二者之间不存在线性相关关系。|r|→1 说明两个变量之间的线性关系越强;|r|→0 说明两个变量之间的线性关系越弱。
b.r 具有对称性。x 与 r 之间的相关系数 rxy 和 y 与 x 之间的相关系数 ryx 相等,即 rxy =ryx。
c.r 数值大小与 x 和 y 的原点及尺度无关。改变 x 和 y 的数据原点及计量尺度,并不 改变 r 的数值大小。
述,但不能准确反映变量之间的关系强度。需要计算相关系数来准确度量两个变量之间的关
系强度。
一元线性回归模型案例分析
一元线性回归模型案例分析一、研究的目的要求居民消费在社会经济的持续发展中有着重要的作用。
居民合理的消费模式和居民适度的消费规模有利于经济持续健康的增长,而且这也是人民生活水平的具体体现。
改革开放以来随着中国经济的快速发展,人民生活水平不断提高,居民的消费水平也不断增长。
但是在看到这个整体趋势的同时,还应看到全国各地区经济发展速度不同,居民消费水平也有明显差异。
例如,2002年全国城市居民家庭平均每人每年消费支出为6029.88元, 最低的黑龙江省仅为人均4462.08元,最高的上海市达人均10464元,上海是黑龙江的2.35倍。
为了研究全国居民消费水平及其变动的原因,需要作具体的分析。
影响各地区居民消费支出有明显差异的因素可能很多,例如,居民的收入水平、就业状况、零售物价指数、利率、居民财产、购物环境等等都可能对居民消费有影响。
为了分析什么是影响各地区居民消费支出有明显差异的最主要因素,并分析影响因素与消费水平的数量关系,可以建立相应的计量经济模型去研究。
二、模型设定我们研究的对象是各地区居民消费的差异。
居民消费可分为城市居民消费和农村居民消费,由于各地区的城市与农村人口比例及经济结构有较大差异,最具有直接对比可比性的是城市居民消费。
而且,由于各地区人口和经济总量不同,只能用“城市居民每人每年的平均消费支出”来比较,而这正是可从统计年鉴中获得数据的变量。
所以模型的被解释变量Y 选定为“城市居民每人每年的平均消费支出”。
因为研究的目的是各地区城市居民消费的差异,并不是城市居民消费在不同时间的变动,所以应选择同一时期各地区城市居民的消费支出来建立模型。
因此建立的是2002年截面数据模型。
影响各地区城市居民人均消费支出有明显差异的因素有多种,但从理论和经验分析,最主要的影响因素应是居民收入,其他因素虽然对居民消费也有影响,但有的不易取得数据,如“居民财产”和“购物环境”;有的与居民收入可能高度相关,如“就业状况”、“居民财产”;还有的因素在运用截面数据时在地区间的差异并不大,如“零售物价指数”、“利率”。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第11章一元线性回归三、选择题1.具有相关关系的两个变量的特点是( )。
A. 一个变量的取值不能由另一个变量唯一确定B. 一个变量的取值由另一个变量唯一确定C. 一个变量的取值增大时,另一个变量的取值也一定增大D. 一个变量的取值增大时,另一个变量的取值肯定变小2.下面的各问题中,哪个不是相关分析要解决的问题( )。
A. 判断变量之间是否存在关系B. 判断一个变量数值的变化对另一个变量的影响C. 描述变量之间的关系强度D. 判断样本所反映的变量之间的关系能否代表总体变量之间的关3.下面的假定中,哪个属于相关分析中的假定( )。
A. 两个变量之间是非线性关系B. 两个变量都是随机变量C. 自变量是随机变量,因变量不是随机变量D. 一个变量的数值增大,另一个变量的数值也应增大4.根据下面的散点图,可以判断两个变量之间存在()A. 正线性相关关系B. 负线性相关关系C. 非线性关系D. 函数关系5.根据下面的散点图,可以判断两个变量之间存在()A. 正线性相关关系B. 负线性相关关系C. 非线性关系D. 函数关系6.如果变量之间的关系近似地表现为一条直线,则称两个变量之间为( )。
A. 正线性相关相关B. 负线性相关关系C. 线性相关关系 D. 非线性相关关系7.如果一个变量的取值完全依赖于另一个变量,各观测点落在一条直线上称为两个变量之间为 ( )。
A. 完全相关关系 B. 正线性相关关系C. 非线性相关关系 D. 负线性相关关系8.下面的陈述哪一个是错误的 ( )。
A. 相关系数是度量两个变量之间线性关系强度的统计量B. 相关系数是一个随机变量C. 相关系数的绝对值不会大于 1D. 相关系数不会取负值9.根据你的判断,下面的相关系数取值哪一个是错误的 ( )。
A. -0.86 B. 0.78 C. 1.25 D. 010.下面关于相关系数的陈述中哪一个是错误的 ( )。
A. 数值越大说明两个变量之间的关系就越强B. 仅仅是两个变量之间线性关系的一个度量,不能用于描述非线性关系C. 只是两个变量之间线性关系的一个度量,不一定意味着两个变量一定有因果关系D. 绝对值不会大于111.变量x 与y 之间的负相关是指 ( )。
A. x 值增大时y 值也随之增大B. x 值减少时y 值也随之减少C. x 值增大时y 值随之减少,或x 值减少时y 值随之增大D. y 的取值几乎不受x 取值的影响12.如果相关系数r =0,则表明两个变量之间 ( )。
A. 相关程度很低 B. 不存在任何关系C. 不存在线性相关关系 D. 存在非线性相关关系13.设产品产量与产品单位成本之间 的线性相关系数为-0.87,这说明二者之间存在着 ( )。
A. 高度相关 B. 中度相关C. 低度相关 D. 极弱相关14.设有4组容量相同的样本数据,即n=8,相关系数分别为:,89.0,74.0,65.0321===r r r ,若取显著性水平进行显著性检验,哪一个相关系数在统计上是不显著92.04=r 05.0=α的 ( )A. B. C. D.1r 2r 3r 4r 15.下面哪一个问题不是回归分析要解决的问题 ( )。
A. 从一组样本数据出发,确定出变量之间的数学关系式B. 对数学关系式的可信程度进行各种统计检验,并从影响某一特定变量的诸多变量中找出 哪些变量的影响是显著的,哪些是不显著的C. 利用所求关系式,根据一个或几个变量的取值来估计或预测另一个特定变量的取值 D. 度量两个变量之间的关系强度16.在回归分析中,被预测或被解释的变量称为 ( )。
A. 自变量 B. 因变量C. 随机变量 D. 非随机变量17.在回归分析中,用来预测或用来解释另一个变量的一个或多个变量称为 ( )。
A. 自 变量 B. 因变量C. 随机变量 D. 非随机变量18.在回归分析中,描述因变量y 如何依赖于自变量x 和误差项的方程称为 ( )。
A. 回归方程 B. 回归模型C. 估计的回归方程 D. 经验回归方程19.在回归分析中,根据样本数据求出的回归方程的估计称为 ( )。
A. 回归方程 B. 回归模型C. 估计的回归方程 D. 理论回归方程20.在回归模型中,反映的是 ( )εββ++=x y 10εA. 由于x 的变化引起y 的线性变化部分B. 由于y 的变化引起x 的线性变化部分C. 除x 和y 的线性关系之外的随机因素对y 的影响D. x 和y 的线性关系对y 的影响21.下面关于回归模型的假定中哪一个是不正确的 ( )A. 自变量x 是随机的B. 误差项是一个期望值为0的随机变量εC. 对于所有的x 值,的方差都相同ε2σD. 误差项是一个服从正态分布的随机变量,且独立ε22.根据最小二乘法拟合直线回归方程是使 ( )A.最小 B. 最小()=-∑2ˆi i y y ()=-∑i i y y ˆC. 最小 D. 最小()=-∑2i i y y ()=-∑i i y y 23.在一元线性回归方程中,回归系数最小的实际意义是 ( )1βA. 当x=0时,y 的期望值B. 当x 变动1个单位时,y 的平均变动数量C. 当x 变动1个单位时,y 增加的总数量D. 当y 变动1个单位时,x 的平均变动数量24.如果两个变量之间存在着负相关,指出下列回归方程中哪个肯定有误 ( )A. B. x y75.025ˆ-=x y 86.0120ˆ+-=C. D. x y5.2200ˆ-=x y 74.034ˆ--=25.对不同年份的产品成本拟合的直线方程为,回归系数表示 x y 75.1280ˆ-=75.1ˆ1-=β( )A. 时间每增加1个单位,产品成本平均增加1.75个单位B. 时间每增加1个单位,产品成本平均下降1.75个单位C. 产品成本每变动1个单位,平均需要1.75个单位D. 时间每减少1个单位,产品成本平均增加1.75个单位26.在回归分析中,F检验主要是用来检验 ( )。
A. 相关系数的显著性 B. 回归系数的显著性C. 线性关系的显著性 D. 估计标准误差的显著性27.说明回归方程拟合优度的统计量是 ( )。
A. 相关系数 B. 回归系数C. 判定系数 D. 估计标准误差28.各实际观测值()与回归值()的离差平方和称为 ( )i y i yˆA. 总变差平方和 B. 残差平方和C. 回归平方和 D. 判定系数29.在直线回归方程中,若回归系数,则表示 ( )x y i 10ˆˆˆββ+=0ˆ1=βA. y 对x 的影响是显著的 B. y 对x 的影响是不显著的C. x 对y 的影响是显著的 D. x 对y 的影响是不显著的30.若两个变量之间完全相关,在以下结论中不正确的是 ( )A.|r|=1 B. 判定系数12=R C. 估计标准误差 D. 回归系数0=y s 0ˆ1=β31.回归平方和占总平方和的比例称为 ( )。
A. 相关系数 B. 回归系数C. 判定系数 D. 估计标准误差32.下面关于估计标准误差的陈述中不正确的是 ( )。
A. 均方残差的平方根()MSE B. 对误差项的标准差的估计εσC. 排除了x对y的线性影响后,y随机波动大小的一个估计量D. 度量了两个变量之间的关系强度33.在回归分析中,利用估计的回归方程,对于x的一个特定值,求出y的平均值的一0x 个估计值,称为 ( )。
()0y E A. 平均值的点估计 B. 个别值的点估计C. 平均值的置信区间估计 D. 个别值的预测区间估计34.在回归分析中,利用估计的回归方程,对于x的一个特定值,求出y的一个个别值0x 的一个估计值,称为 ( )。
y ˆA. 平均值的点估计 B. 个别值的点估计C. 平均值的置信区间估计 D. 个别值的预测区间估计35.已知回归平方和,残差平方和,则判定系数=( )4854=SSR 146=SSE 2RA. 97.08% B. 2.92%C. 3.01% D. 33.25%36.在因变量的总离差平方和中,如果回归平方和所占比重大,则两变量之间 ( )。
A. 相关程度高 B. 相关程度低C. 完全相关 D. 完全不相关37.对于有线性相关关系的两变量建立的直线回归方程中,回归系数 ( x y i 10ˆˆˆββ+=1ˆβ)A. 可能为 0 B. 可能小于0C. 只能是正数 D. 只能是负数38.由最小二乘法得到的回归直线,要求满足因变量的 ( )。
A. 平均值与其估计值的离差平方和最小B. 实际值与其平均值的离差平方和最小C. 实际值与其估计值的离差和为0D. 实际值与其估计值的离差平方和最小39.一个由100名年龄在30~60岁的男子组成的样本,测得其身高与体重的相关系数r=0.45,则下列陈述中正确的是 ( )。
A. 较高的男子趋于较重B. 身高与体重存在低度正相关C. 体重较重的男子趋于较矮D. 45%的较高的男子趋于较重40.如果两个变量之间完全相关,则以下结论中不正确的是 ( )A. 相关系数 B.判定系数1=r 12=R C. 回归系数 D. 估计标准误差0=β0=y s 41.下列方程中肯定错误的是 ( )A. ,x y48.015ˆ-=65.0=r B. ,x y35.115ˆ--=81.0-=r C. ,x y85.025ˆ+-=42.0=r D. ,x y56.3120ˆ-=96.0-=r 42.若两个变量存在负线性相关关系,则建立的一元线性回归方程的判定系数的取值范2R 围是 ( )。
A. [0,1] B. [-1,0]C. [-1,1] D. 小于0的任意数43.在回归估计中,给定自变量的取值,求得的置信区间与预测区间相比 ( )。
0x A. 二者的区间宽度是一样的B. 置信区间比预测区间宽C. 置信区间比预测区间窄D. 置信区间有时比预测区间宽,有时比预测区间窄44.在回归估计中,自变量的取值越远离其平均值,求得的的预测区间 ( )。
0x x y A. 越宽 B. 越窄C. 越准确 D. 越接近实际值45.回归平方和SSR 反映了y 的总变差中 ( )。
A. 由于x 与y 之间的线性关系引起的y 的变化部分B. 除了x 对y 的线性影响之外的其他因素对y 变差的影响C. 由于x 与y 之间的非线性关系引起的y 的变化部分D. 由于x 与y 之间的函数关系引起的y 的变化部分46.残差平方和SSE 反映了y 的总变差中 ( )。
A. 由于x 与y 之间的线性关系引 起的y 的变化部分B. 除了x 对y 的线性影响之外的其他因素对y 变差的影响C. 由于x 与y 之间的非线性关系引起的y 的变化部分D. 由于x 与y 之间的函数关系引起的y 的变化部分47.若变量x 与y 之间的相关系数r=0.8,则回归方程的判定系数=( )。