线性回归分析练习题分析
回归分析练习题与参考答案
求:(1)人均GDP 作自变量,人均消费水平作因变量,绘制散点图,并说明二者之间的关系 形态。
(2) 计算两个变量之间的线性相关系数,说明两个变量之间的关系强度。 (3) 求出估计的回归方程,并解释回归系数的实际意义。 (4) 计算判定系数,并解释其意义。 (5) 检验回归方程线性关系的显著性
(
0.05)。
⑹如果某地区的人均 GDP 为5000元,预测其人均消费水平。
(7)求人均GDP 为5000元时,人均消费水平 95%的置信区间与预测区间。 解: (1)
12000- 1DOO Q-
6000- 6000- 4QD0- 2000- 0- D
10000
20000
人均GDP
30000 4MOO
可能存在线性关系。
(2)相关系数:
a.因变量人均消费水平
有很强的线性关系。 (3)回归方程: y 734.693
0.309x
a.因变量人均消费水平
回归系数的含义:人均 GDP 没增加1元,人均消费增加 0.309元。
%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%% 注意:图标不要原封不动的完全复制软件中的图标,要按规范排版。
系数(a )
a.因变量人均消费水平(元)
%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%% (4)
模型汇总
a.预测变量:(常量),人均GDP
人均GDP 对人均消费的影响达到 99.6%。
%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%% 注意:图标不要原封不动的完全复制软件中的图标,要按规范排版。
回归分析练习试题和参考答案解析
1 下面是7个地区2000年的人均国内生产总值(GDP)和人均消费水平的统计数据:
求:(1)人均GDP作自变量,人均消费水平作因变量,绘制散点图,并说明二者之间的关系形态。
(2)计算两个变量之间的线性相关系数,说明两个变量之间的关系强度。
(3)求出估计的回归方程,并解释回归系数的实际意义。
(4)计算判定系数,并解释其意义。
α=)。
(5)检验回归方程线性关系的显著性(0.05
(6)如果某地区的人均GDP为5000元,预测其人均消费水平。
(7)求人均GDP为5000元时,人均消费水平95%的置信区间和预测区间。
解:(1)
可能存在线性关系。
(2)相关系数:
系数a
模型非标准化系数标准系数
t Sig.
相关性
B标准误差试用版零阶偏部分
1(常量).003
人均GDP.309.008.998.000.998.998.998 a. 因变量: 人均消费水平
有很强的线性关系。
(3)回归方程:734.6930.309
y x
=+
系数a
模型非标准化系数标准系数t Sig.相关性
回归系数的含义:人均GDP没增加1元,人均消费增加元。%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%
注意:图标不要原封不动的完全复制软件中的图标,要按规范排版。
系数(a)
模型非标准化系数标准化系数
t显著性B标准误Beta
1(常量)
人均GDP(元)
%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%(4)
模型汇总
模型R R 方调整 R 方标准估计的误
差
1.998a.996.996
线性回归案例分析
线性回归案例分析
【篇一:线性回归案例分析】
散布图—练习总评估价某建筑公司想了解位于某街区的住宅地产的销房产 79,760售价格y与总评估价x之 98,480间的相关程度到底有多 110,655大?于是从该街区去年 96,859售出的住宅中随机抽10 94,798的总评估价和销售资料 139,850如右表 170,34110 corporatecommunication 28.05.2007 corporatecommunication 28.05.2007 相关分析案例justin tao 销售价格y美元 95,000 116,500 156,900 111,000 110,110 100,000 130,000 170,400 211,500 185,000 绘制散布图,观察其相关关系输入数据点击graph scatterplot 弹出对话框,依次对应x、y输入变量列点击
ok 散布图及关系分析从散布图可以看出:总评估价值x与销售价格y存在线性正相关,相关程度较大;随x增大,y有增长趋corporatecommunication 28.05.2007 corporatecommunication 28.05.2007 计算相关系数输入数据点击stat basic statistics correlation… 弹出对话框,输入x、y变量列点击ok 散布图(相关分析)案例下面是表示某公司广告费用和销售额之间关系的资试求这家公司的广告费和销售额的相关系数广告费 (10万) 销售额 (100万) 2022 15 17 23 18 25 10 20 得出相关系数及检验p值corporatecommunication 28.05.2007 corporatecommunication 28.05.2007 0.002 0.05 (留意水准) ,广告费和销售额的相关关系是有影响的 corporatecommunication 28.05.2007 corporatecommunication 28.05.2007 回归分析案例通过下例观察回归分析和决定系数。为了知道机械的使用年限和设备费用之间有什么关系,得到了有关对相同机械设备记录的如下数据。试求对这个数据说明x 与y之间关系的线性回归方程。若使用年限为10年时,设备费用是多少使用年回归分析输入数据点击 stat regression regression 弹出对话框,依次选择输出变量列、选择输入变设备费39 24 115 105 50 86 67 90 140 112 70 186 43 126 corporatecommunication 28.05.2007 corporatecommunication 28.05.2007 回归分析选择输出变量列选择输入变量列 plot的形态选择显选择显示在残差graph的残差形态 graph的残差形态residualplots corporatecommunication 28.05.2007 corporatecommunication 28.05.2007 回归分析regression 可以
回归分析练习题及参考答案
求:(1)人均GDP 作自变量,人均消费水平作因变量,绘制散点图,并说明二者之间的关系形态。
(2)计算两个变量之间的线性相关系数,说明两个变量之间的关系强度。 (3)求出估计的回归方程,并解释回归系数的实际意义。 (4)计算判定系数,并解释其意义。
(5)检验回归方程线性关系的显著性(0.05α=)。
(6)如果某地区的人均GDP 为5000元,预测其人均消费水平。
(7)求人均GDP 为5000元时,人均消费水平95%的置信区间和预测区间。 解:(1)
可能存在线性关系。 (2)相关系数:
(3)回归方程:734.6930.309
y x
=+
回归系数的含义:人均GDP没增加1元,人均消费增加0.309元。%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%% 注意:图标不要原封不动的完全复制软件中的图标,要按规范排版。
系数(a)
模型
非标准化系数标准化系数
t 显著性B 标准误Beta
1 (常量)734.693 139.540 5.265 0.003
人均GDP(元)0.309 0.008 0.998 36.492 0.000 a. 因变量: 人均消费水平(元)%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%
人均GDP对人均消费的影响达到99.6%。%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%
注意:图标不要原封不动的完全复制软件中的图标,要按规范排版。
模型摘要
模型R R 方调整的R 方估计的标准差
1 .998(a) 0.996 0.996 247.303
一元线性回归分析例题
SPSS一元线性回归分析
例题(体检数据中的体重和肺活量的分析)某单位对12名女工进行体检,体检项目包括体重(kg)和肺活量(L),数据如下:
X(体重:kg) 42.00 42.00 46.00 46.00 46.00 50.00
50.00 50.00 52.00 52.00 58.00 58.00
Y(肺活量:L) 2.55 2.20 2.75 2.40 2.80 2.81
3.41 3.10 3.46 2.85 3.50 3.00
用x表示体重,y表示肺活量,建立数据文件。利用一元线性回归分析描述其关系。
基本操作提示:
Step 1 建立数据文件,并打开该数据文件。
Step 2 选择菜单Analyz e→Regressio n→Linear,打开主对话框。在“Dependent”(因变量)列表框中选择变量“肺活量”,作为线
性回归分析的被解释变量;在“Independent”(自变量)列表框
中选择变量“体重”,作为解释变量。
Step 3 单击“Statistics”按钮,在打开的对话框中,依次选择“Estimates”
(显示回归系数的估计值)、“Confidence intervals”、“Model fit”
(模型拟合)、“Descriptives”、“Casewise diagnostic”(个案诊断)
和“All Cases”选项。选择完毕后,单击“Continue”按钮,
返回主对话框。
Step 4 单击“Plots”(图形)按钮,在打开的主对话框中,选择“DEPENDENT”(因变量)作为y轴变量,“*ZPRED”(标准化
回归分析练习试题和参考答案解析
地区人均GDP/元人均消费水平/元
22460 11226 34547 4851 5444 2662 4549
7326
4490 11546
2396
2208
1608
2035
求:(1)人均GDP作自变量,人均消费水平作因变量,绘制散点图,并说明二者之间的关系形态。
(2)计算两个变量之间的线性相关系数,说明两个变量之间的关系强度。
(3)求出估计的回归方程,并解释回归系数的实际意义。
(4)计算判定系数,并解释其意义。
(5)检验回归方程线性关系的显著性(0.05
α=)。
(6)如果某地区的人均GDP为5000元,预测其人均消费水平。
(7)求人均GDP为5000元时,人均消费水平95%的置信区间和预测区间。
解:〔1〕
可能存在线性关系。
〔2〕相关系数:
〔3〕回归方程:734.6930.309y x =+
%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%
注意:图标不要原封不动的完全复制软件中的图标,要按规排版。
系数(a)
模型 非标准化系数
标准化系数 t 显著性
B 标准误 Beta
1
〔常量〕 734.693 139.540 5.265
0.003 人均GDP 〔元〕
0.309
0.008
0.998
36.492
0.000
a. 因变量: 人均消费水平〔元〕
%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%
〔4〕
%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%
注意:图标不要原封不动的完全复制软件中的图标,要按规排版。
模型摘要
回归分析练习题与参考答案
回归分析练习题与参考答案
1 下面是7个地区2000年的人均国内生产总值(GDP)与人均消费水平的统计数据:
求:(1)人均GDP作自变量,人均消费水平作因变量,绘制散点图,并说明二者之间的关系形态。
(2)计算两个变量之间的线性相关系数,说明两个变量之间的关系强度。
(3)求出估计的回归方程,并解释回归系数的实际意义。
(4)计算判定系数,并解释其意义。
(5)检验回归方程线性关系的显著性(0.05
α=)。
(6)如果某地区的人均GDP为5000元,预测其人均消费水平。
(7)求人均GDP为5000元时,人均消费水平95%的置信区间与预测区间。
解:(1)
%
注意:图标不要原封不动的完全复制软件中的图标,要按规范排版。
模型摘要
模型R R 方调整的R 方估计的标准差
1 .998(a) 0.996 0.996 247.303
a. 预测变量:(常量), 人均GDP(元)。%%%%%%%%%%%%%%%%%%%% %%%%%%%%%%%%%%%%%%%% (5)F检验:
Anova b
模型平方与df 均方 F Sig.
1 回归81444968.680 1 81444968.680 1331.69
2 .000a
残差305795.034 5 61159.007
总计81750763.714 6
a. 预测变量: (常量), 人均GDP。
b. 因变量: 人均消费水平
回归系数的检验:t检验
%%%%%%%%%%%%%%%%%%%% %%%%%%%%%%%%%%%%%%%% %
注意:图标不要原封不动的完全复制软件中的图
标,要按规范排版。
线性回归分析练习题分析
§1 回归分析
1.1 回归分析
1.2 相关系数
一、基础过关
1.下列变量之间的关系是函数关系的是( )
A.已知二次函数y=ax2+bx+c,其中a,c是已知常数,取b为自变量,因变量是这个函数的判别式Δ=b2-4ac
B.光照时间和果树亩产量
C.降雪量和交通事故发生率
D.每亩施用肥料量和粮食产量
2.在以下四个散点图中,
其中适用于作线性回归的散点图为( )
A.①②B.①③C.②③D.③④
3.下列变量中,属于负相关的是( )
A.收入增加,储蓄额增加
B.产量增加,生产费用增加
C.收入增加,支出增加
D.价格下降,消费增加
4.已知对一组观察值(x i,y i)作出散点图后确定具有线性相关关系,若对于y=bx+a,求得b=0.51,x=61.75,y=38.14,则线性回归方程为( )
A.y=0.51x+6.65 B.y=6.65x+0.51
C.y=0.51x+42.30 D.y=42.30x+0.51
5.对于回归分析,下列说法错误的是( )
A.在回归分析中,变量间的关系若是非确定关系,那么因变量不能由自变量唯一确定
B.线性相关系数可以是正的,也可以是负的
C.回归分析中,如果r2=1,说明x与y之间完全相关
D.样本相关系数r∈(-1,1)
6.下表是x和y之间的一组数据,则y关于x的回归方程必过( )
A.点(2,3) B.点(1.5,4)
C.点(2.5,4) D.点(2.5,5)
7.若线性回归方程中的回归系数b=0,则相关系数r=________.
二、能力提升
8.某医院用光电比色计检验尿汞时,得尿汞含量(mg/L)与消光系数计数的结果如下:
线性回归分析习题
上机实验八线性回归方程
一、实验目的
通过本次实验,掌握线性回归的功能及如何进行回归分析。
二、实验性质
必修,基础层次
三、主要仪器及试材
计算机及SPSS软件
四、实验内容
1.线性回归方程的建立方法
2.线性回归方程统计结果的解读
3.线性回归方程统计结果的表述
五、实验学时
4学时
六、实验方法与步骤
1.开机;
2.找到SPSS的快捷按纽或在程序中找到SPSS,打开SPSS;
3.按要求建立数据文件;
4.进行统计分析;
5.撰写实验报告;
6.关闭SPSS,关机。
七、实验注意事项
1.实验中不轻易改动SPSS的参数设置,以免引起系统运行问题。
2.遇到各种难以处理的问题,请询问指导老师。
3.为保证计算机的安全,上机过程中非经指导老师和实验室管理人员同意,禁止使用软盘与移动硬盘。
4.每次上机,个人应按规定要求使用同一计算机,如因故障需更换,应报指导老师或实验室管理人员同意。
5.上机时间,禁止使用计算机从事与课程无关的工作。 八、上机作业
1.有10个同类企业的生产性固定资产年平均价值和工业总产值资料如下:
企业编号 生产性固定资产价值(万元) 工业总产值(万元)
1 2 3 4 5 6 7 8 9 10 318 910 200 409 415 502 314 1210 1022 1225 524 1019 638 815 913 928 605 1516 1219 1624
(1)说明两变量之间的相关方向;
(2)写出一般线性回归方程,分析生产性固定资产价值对工业总产值的影响,并解释各回归系数的意义。
(3)检验回归方程的线性关系是否显著? (4)检验各回归系数是否显著?
统计学一元线性回归分析练习题
统计学一元线性回归分析练习题
一、内容提要
本章介绍了回归分析的基本思想与基本方法。首先,本章从总体回归模型与总体回归函数、样本回归模型与样本回归函数这两组概念开始,建立了回归分析的基本思想。总体回归函数是对总体变量间关系的定量表述,由总体回归模型在若干基本假设下得到,但它只是建立在理论之上,在现实中只能先从总体中抽取一个样本,获得样本回归函数,并用它对总体回归函数做出统计推断。
本章的一个重点是如何获取线性的样本回归函数,主要涉及到普通最小二乘法的学习与掌握。同时,也介绍了极大似然估计法以及矩估计法。
本章的另一个重点是对样本回归函数能否代表总体回归函数进行统计推断,即进行所谓的统计检验。统计检验包括两个方面,一是先检验样本回归函数与样本点的“拟合优度”,第二是检验样本回归函数与总体回归函数的“接近”程度。后者又包括两个层次:第一,检验解释变量对被解释变量是否存在着显著的线性影响关系,通过变量的t检验完成;第二,检验回归函数与总体回归函数的“接近”程度,通过参数估计值的“区间检验”完成。
本章还有三方面的内容不容忽视。其一,若干基本假设。样本回归函数参数的估计以及对参数估计量的统计性质
的分析以及所进行的统计推断都是建立在这些基本假设之上的。其二,参数估计量统计性质的分析,包括小样本性质与大样本性质,尤其是无偏性、有效性与一致性构成了对样本估计量优劣的最主要的衡量准则。Goss-markov定理表明OLS估计量是最佳线性无偏估计量。其三,运用样本回归函数进行预测,包括被解释变量条件均值与个值的预测,以及预测置信区间的计算及其变化特征。
多元线性回归实习实际例题分析
多元线性回归分析实习
线性回归过程(Linear Regression)可用于分析一个或多个自变量与一个因变量之间的线性数量关系,并可进行回归诊断分析。
●[例题3.1]
某地29名13岁男童身高x1(cm),体重x2(kg),肺活量y(L)的实测值数据见表3.1,试建立肺活量与身高、体重的回归关系。
[ 操作过程]
①[ 数据格式] 见数据文件< 多元线性回归例题.sav >
该数据库有4列29行,即4个变量、29个记录(Observation),每个变量占1列,每个记录占1行,该数据格式为一般多元分析的数据格式。
②[ 过程]
单击后可弹出线性回归对话框。该对话框内有诸多选项,现分别介绍。
③[ 选项]
◆因变量。只能选入1个因变量,本例选入变量“肺活量”。
◆自变量。可以是1个或多个,本例选入变量“身高、体重”。
◆当选择不同组合的自变量进行回归分析时,可保存每次选择的自
变量,用按钮和按钮可分别向前、向后翻找各种自变量的组合。
◆选择回归模型拟合的分析方法,有5种可供选择。
Enter 强迫引入法,即一般回归分析,所选自变量全部进入方程,为系统默认方式。
Stepwise 逐步回归法,
加入有显著性意义的变量和剔除无显著性意义的变量,直到所建立的方程式
中不再有可加入和可剔除的变量为止。
Remove 强迫剔除法。根据设定的条件剔除自变量。
Backward向后逐步法。所选自变量全部进入方程,根据Options对话框中设定的标准在计算过程中逐个剔除变量,直到所建立的方程式中不再含有可剔
除的变量为止。
Forward:向前逐步法。根据Options对话框中设定的标准在计算过程中逐个加入单个变量,直到所建立的方程式中不再有可加入的变量为止。
回归分析练习题及参考答案
1 下面是7个地区2000年的人均国内生产总值(GDP)和人均消费水平的统计数据:
地区人均GDP/元人均消费水平/元
北京辽宁上海江西河南贵州陕西 22460
11226
34547
4851
5444
2662
4549
7326
4490
11546
2396
2208
1608
2035
求:(1)人均GDP作自变量,人均消费水平作因变量,绘制散点图,并说明二者之间的关系形态。
(2)计算两个变量之间的线性相关系数,说明两个变量之间的关系强度。
(3)求出估计的回归方程,并解释回归系数的实际意义。
(4)计算判定系数,并解释其意义。
(5)检验回归方程线性关系的显著性(0.05
α=)。
(6)如果某地区的人均GDP为5000元,预测其人均消费水平。
(7)求人均GDP为5000元时,人均消费水平95%的置信区间和预测区间。
解:(1)
可能存在线性关系。
(2)相关系数:
(3)回归方程:734.6930.309
y x
=+
回归系数的含义:人均GDP没增加1元,人均消费增加0.309元。%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%% 注意:图标不要原封不动的完全复制软件中的图标,要按规范排版。
系数(a)
模型
非标准化系数标准化系数
t 显著性B 标准误Beta
1 (常量)734.693 139.540 5.265 0.003
人均GDP(元)0.309 0.008 0.998 36.492 0.000 a. 因变量: 人均消费水平(元)%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%
统计学线性回归分析作业
白杨树重量与其直径、高度、生长地点的相关指标数据表
一、散点图
白杨树重量与地点的散点图相关性很弱。
白杨树重量与高度的散点图相关性较强,为正相关。
白杨树重量与直径的散点图相关性很强,为正相关。
二、检验(统计-回归-回归)
回归分析: 重量与直径, 高度, 地点
回归方程为:重量= - 0.185 + 0.513 直径- 0.210 高度+ 0.0019 地点
自变量系数系数标准误T P
常量-0.18477 0.07859 -2.35 0.043
直径0.51276 0.04428 11.58 0.000
高度-0.21012 0.04172 -5.04 0.001
地点0.00193 0.02861 0.07 0.948
S = 0.0469198 R-Sq = 98.9% R-Sq(调整)= 98.6%
方差分析
来源自由度SS MS F P
回归 3 1.85328 0.61776 280.61 0.000
残差误差9 0.01981 0.00220
合计12 1.87309
来源自由度Seq SS
直径 1 1.78807
高度 1 0.06520
地点 1 0.00001
异常观测值
拟合值标准化
观测值直径重量拟合值标准误残差残差
2 2.12 0.1500 0.242
3 0.022
4 -0.0923 -2.24R
R 表示此观测值含有大的标准化残差
因地点的P值大于0.05,无法通过回归方程检验,故剔除自变量“地点”。回归分析: 重量与直径, 高度
回归方程为:重量= - 0.181 + 0.514 直径- 0.211 高度
回归分析练习题及参考答案
回归分析练习题及参考答案
求:(1)⼈均GDP 作⾃变量,⼈均消费⽔平作因变量,绘制散点图,并说明⼆者之间的关系形态。
(2)计算两个变量之间的线性相关系数,说明两个变量之间的关系强度。 (3)求出估计的回归⽅程,并解释回归系数的实际意义。 (4)计算判定系数,并解释其意义。
(5)检验回归⽅程线性关系的显著性(0.05α=)。
(6)如果某地区的⼈均GDP 为5000元,预测其⼈均消费⽔平。
(7)求⼈均GDP 为5000元时,⼈均消费⽔平95%的置信区间和预测区间。解:(1)
可能存在线性关系。(2)相关系数:
(3)回归⽅程:734.6930.309
y x
=+
回归系数的含义:⼈均GDP没增加1元,⼈均消费增加0.309元。%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%% 注意:图标不要原封不动的完全复制软件中的图标,要按规范排版。
系数(a)
模型
⾮标准化系数标准化系数
t 显著性B 标准误Beta
1 (常量)734.693 139.540 5.265 0.003
⼈均GDP(元)0.309 0.008 0.998 36.492 0.000 a. 因变量: ⼈均消费⽔平(元)%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%
⼈均GDP对⼈均消费的影响达到99.6%。%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%
注意:图标不要原封不动的完全复制软件中的图标,要按规范排版。
模型摘要
模型R R ⽅调整的R ⽅估计的标准差
回归分析练习题(有答案)
回归分析的基本思想及其初步应用
一、选择题 1. 某同学由x 与y 之间的一组数据求得两个变量间的线性回归方程为y bx a =+,已知:数据x 的平
均值为2,数据
y 的平均值为3,则 ( )
A .回归直线必过点(2,3)
B .回归直线一定不过点(2,3)
C .点(2,3)在回归直线上方
D .点(2,3)在回归直线下方
2. 在一次试验中,测得(x,y)的四组值分别是A(1,2),B(2,3),C(3,4),D(4,5),则Y 与X 之间的回归直线方程为( )A .y
x 1=+ B .y x 2=+ C .y 2x 1=+ D.y x 1=-3. 在对两个变量x ,y 进行线性回归分析时,有下列步骤:
①对所求出的回归直线方程作出解释; ②收集数据(i x 、
i y ),1,2i =,…,n ;
③求线性回归方程; ④求未知参数; ⑤根据所搜集的数据绘制散点图
如果根据可行性要求能够作出变量,x y 具有线性相关结论,则在下列操作中正确的是( ) A .①②⑤③④ B .③②④⑤① C .②④③①⑤ D .②⑤④③①
4. 下列说法中正确的是( )
A .任何两个变量都具有相关关系
B .人的知识与其年龄具有相关关系
C .散点图中的各点是分散的没有规律
D .根据散点图求得的回归直线方程都是有意义的
5. 给出下列结论:
(1)在回归分析中,可用指数系数2
R 的值判断模型的拟合效果,2
R 越大,模型的拟合效果越好; (2)在回归分析中,可用残差平方和判断模型的拟合效果,残差平方和越大,模型的拟合效果越好; (3)在回归分析中,可用相关系数r 的值判断模型的拟合效果,r 越小,模型的拟合效果越好; (4)在回归分析中,可用残差图判断模型的拟合效果,残差点比较均匀地落在水平的带状区域中,说明这样的模型比较合适.带状区域的宽度越窄,说明模型的拟合精度越高. 以上结论中,正确的有( )个.
一元线性回归模型习题及答案解析
⼀元线性回归模型习题及答案解析
⼀元线性回归模型
⼀、单项选择题
1、变量之间的关系可以分为两⼤类__________。A
A 函数关系与相关关系
B 线性相关关系和⾮线性相关关系
C 正相关关系和负相关关系
D 简单相关关系和复杂相关关系 2、相关关系是指__________。D
A 变量间的⾮独⽴关系
B 变量间的因果关系
C 变量间的函数关系
D 变量间不确定性的依存关系 3、进⾏相关分析时的两个变量__________。A
A 都是随机变量
B 都不是随机变量
C ⼀个是随机变量,⼀个不是随机变量
D 随机的或⾮随机都可以 4、表⽰x 和y 之间真实线性关系的是__________。C A 01t t
Y X ββ=+ B 01()t t E Y X ββ=+ C 01t t t Y X u ββ=++ D 01t t Y X ββ=+
5、参数β的估计量?β
具备有效性是指__________。B A ?var ()=0β
B ?var ()β为最⼩
C ?()0β
β-= D ?()ββ-为最⼩ 6、对于01??i i i
Y X e ββ=++,以σ?表⽰估计标准误差,Y ?表⽰回归值,则__________。B A i i ??0Y Y 0σ∑
=时,(-)=
B 2
i
i
0Y Y σ∑=时,(-)=0 C i
i ??0Y Y σ∑=时,(-)为最⼩ D 2
i
i
0Y Y
σ∑=时,(-)为最⼩ 7、设样本回归模型为i 01i i
Y =X +e ββ+,则普通最⼩⼆乘法确定的i ?β的公式中,错误的是__________。D A ()()()i
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
§1 回归分析
1.1 回归分析
1.2 相关系数
一、基础过关
1.下列变量之间的关系是函数关系的是( )
A.已知二次函数y=ax2+bx+c,其中a,c是已知常数,取b为自变量,因变量是这个函数的判别式Δ=b2-4ac
B.光照时间和果树亩产量
C.降雪量和交通事故发生率
D.每亩施用肥料量和粮食产量
2.在以下四个散点图中,
其中适用于作线性回归的散点图为( )
A.①②B.①③C.②③D.③④
3.下列变量中,属于负相关的是( ) A.收入增加,储蓄额增加
B.产量增加,生产费用增加
C.收入增加,支出增加
D.价格下降,消费增加
4.已知对一组观察值(x i,y i)作出散点图后确定具有线性相关关系,若对于y=bx+a,求得b=0.51,x=
61.75,y=38.14,则线性回归方程为( )
A.y=0.51x+6.65 B.y=6.65x+0.51
C .y =0.51x +42.30
D .y =42.30x +0.51
5. 对于回归分析,下列说法错误的是
( )
A .在回归分析中,变量间的关系若是非确定关系,那么因变量不能由自变量唯一确定
B .线性相关系数可以是正的,也可以是负的
C .回归分析中,如果r 2=1,说明x 与y 之间完全相关
D .样本相关系数r ∈(-1,1)
6. 下表是x 和y 之间的一组数据,则y 关于x 的回归方程必过
( )
A.点(2,3) B C .点(2.5,4)
D .点(2.5,5)
7. 若线性回归方程中的回归系数b =0,则相关系数r =________. 二、能力提升
8. 某医院用光电比色计检验尿汞时,得尿汞含量(mg/L)与消光系数计数的结果如下:
若y 与x 9. 若施化肥量x (kg)与小麦产量y (kg)之间的线性回归方程为y =250+4x ,当施化肥量为50 kg 时,预计小
麦产量为________ kg.
10.某车间为了规定工时定额,需确定加工零件所花费的时间,为此做了4次试验,得到的数据如下:
若加工时间y (1)求加工时间与零件个数的线性回归方程; (2)试预报加工10个零件需要的时间.
11.在一段时间,分5次测得某种商品的价格x (万元)和需求量y (t)之间的一组数据为:
已知∑5
i =1
x i y i =62,∑5
i =1
x 2i =16.6.
(1)画出散点图;
(2)求出y 对x 的线性回归方程;
(3)如果价格定为1.9万元,预测需求量大约是多少?(精确到0.01 t).
12.某运动员训练次数与运动成绩之间的数据关系如下:
(1)作出散点图;
(2)求出回归方程;
(3)计算相关系数并进行相关性检验;
(4)试预测该运动员训练47次及55次的成绩.
三、探究与拓展
13.从某地成年男子中随机抽取n个人,测得平均身高为x=172 cm,标准差为s x=7.6 cm,平均体重y=
72 kg,标准差s y=15.2 kg,相关系数r=l xy
l xx l yy
=0.5,求由身高估计平均体重的回归方程y=β0+β1x,
以及由体重估计平均身高的回归方程x=a+by.
答案
1.A 2.B 3.D 4.A 5.D 6.C 7.0 8.y =-11.3+36.95x 9.450
10.解 (1)由表中数据,利用科学计算器得
x =2+3+4+54
=3.5,
y =
2.5+3+4+4.5
4
=3.5,
∑4
i =1
x i y i =52.5,∑4
i =1
x 2i =54,
b =
∑4
i =1
x i y i -4x y
∑4
i =1
x 2
i -4x
2
=
52.5-4×3.5×3.5
54-4×3.52
=0.7,
a =y -
b x =1.05,
因此,所求的线性回归方程为y =0.7x +1.05.
(2)将x =10代入线性回归方程,得y =0.7×10+1.05=8.05(小时),即加工10个零件的预报时间为8.05小时.
11.解 (1)散点图如下图所示:
(2)因为x =15×9=1.8,y =1
5
×37=7.4,∑5i =1x i y i =62,∑5i =1x 2i =16.6,
所以b =
∑5
i =1
x i y i -5x y
∑5
i =1
x 2i -5x
2
=62-5×1.8×7.4
16.6-5×1.82
=-11.5,
a =y -
b x =7.4+11.5×1.8=28.1,
故y 对x 的线性回归方程为y =28.1-11.5x . (3)y =28.1-11.5×1.9=6.25(t).
所以,如果价格定为1.9万元,则需求量大约是6.25 t.
12.解 (1)作出该运动员训练次数x 与成绩y 之间的散点图,如下图所示,由散点图可知,它们之间具有线
性相关关系.
(2)列表计算:
次数x i 成绩y i x 2i
y 2i
x i y i
30 30 900 900 900 33 34 1 089 1 156 1 122 35 37 1 225 1 369 1 295 37 39 1 369 1 521 1 443 39 42 1 521 1 764 1 638 44 46 1 936 2 116 2 024 46 48 2 116 2 304 2 208 50
51
2 500
2 601
2 550
由上表可求得x =39.25,y =40.875, ∑8
i =1
x 2i =12 656,∑8
i =1
y 2i =13 731,
∑8
i =1
x i y i =13 180,
∴b =
∑8
i =1
x i y i -8x y
∑8
i =1
x 2i -8x
2
≈1.041 5,
a =y -
b x =-0.003 88,
∴线性回归方程为y =1.041 5x -0.003 88.
(3)计算相关系数r =0.992 7,因此运动员的成绩和训练次数两个变量有较强的相关关系. (4)由上述分析可知,我们可用线性回归方程y =1.041 5x -0.003 88作为该运动员成绩的预报值. 将x =47和x =55分别代入该方程可得y =49和y =57.故预测该运动员训练47次和55次的成绩分别为49和57. 13.解 ∵s x =
l xy
n ,s y =l xy n
,