回归分析测试题-21页文档资料
26、回归分析测试题及答案
中级经济师基础知识
第 1题:单选题(本题1分)
某公司产品当产量为1000单位时,其总成本为4000元;当产量为2000单位时,其总成本为5000,则设产量为x,总成本为y,正确的一元回归方程表达式应该是( )。
A、y = 3000 + x
B、y = 4000 + 4x
C、y = 4000 + x
D、y = 3000 + 4x
【正确答案】:A
【答案解析】:
本题可列方程组:设该方程为y = a + bx,则由题意可得:4000 = a + 1000b5000 = a + 2000b 解该方程,得b=1,a=3000,所以方程为y = 3000 + x
第 2题:单选题(本题1分)
在回归分析中,估计回归系数的最小二乘法的原理是( )。
A、使得因变量观测值与均值之间的离差平方和最小
B、使得因变量估计值与均值之间的离差平方和最小
C、使得观测值与估计值之间的乘积和最小
D、使得因变量观测值与估计值之间的离差平方和最小
【正确答案】:D
【答案解析】:
较偏较难的一道题目。最小二乘法就是使得因变量的观测值与估计值之间的离差平方和最小来估计参数的一种方法
第 3题:多选题(本题2分)
关于相关分析和回归分析的说法,正确的的有()
A、相关分析可以从一个变量的变化来推测另一个变量的变化
B、相关分析研究变量间相关的方向和相关的程度
C、相关分析中需要明确自变量和因变量
D、回归分析研究变量间相互关系的具体形式
E、相关分析和回归分析在研究方法和研究目的有明显区别
【正确答案】:BDE
【答案解析】:
相关分析与回归分析在研究目的和方法上具有明显的区别。 (1)、相关分析研究变量之间相关的方向和相关的程度,无法从一个变量的变化来推测另一变量的变化情况。
统计学相关与回归分析试题
相关与回归分析试题
一、单项选择题
1、自然界和人类社会中的诸多关系基本上可归纳为两种类型,这就是( )
A.函数关系和相关关系
B.因果关系和非因果关系
C.随机关系和非随机关系
D.简单关系和复杂关系 2、相关关系是指变量间的( )
A.严格的函数关系
B.简单关系和复杂关系
C.严格的依存关系
D.不严格的依存关系
3.具有相关关系的两个变量的关系是()
A.一个变量的取值不能由另一个变量唯一确定
B.一个变量的取值由另一个变量唯一决定
C.变量之间的一种确定性的数量关系
D.变量之间存在的一种函数关系 4.当变量x 的值增加时,变量y 的值也随之增加,那么变量x 和变量y 之间存在着()。 A.正相关系 B.负相关系
C.不确定关系
D.非线性相关关系 5.下列相关系数的取值不正确的是()
A. 0
B. -0.96
C.0.87
D.1.06
6.两个变量之间的线性相关关系越不密切,相关系数r 值就越接近() A.-1 B.+1
D.0 D.大于-1或小于+1 7.相关系数的值越接近-1,表明两个变量间()
A.正线性相关关系越弱
B.负线性相关关系越强
C.负线性相关关系越弱
D.正线性相关关系越强 8.回归分析中,被解释的变量称为()
A.自变量
B.因变量
C.随机变量
D.非随机变量 9.根据最小二乘法配合线性回归方程是使()
A.最小)(=∑
2
y ˆ-y B.最小)(=∑y ˆ-y
C.最小)(=∑
2
y -y D.最小)(=∑
y -y
10.回归方程 1.5x 123y
ˆ+=中回归系数的意思是,当自变量每增加一个单位时,因变量()
回归分析的基本知识点及习题
感谢您的观看
汇报人:
回归分析的基本知识点 及习题
汇报人:
目录
添加目录标题
01
多元线性回归分析
04
回归分析概述
02
逻辑回归分析
05
线性回归分析
03
多项式回归分析
06
添加章节标题
Fra Baidu bibliotek
回归分析概述
定义与目的
定义:通过数学模型描述因变量与自变量之间的关系,并预测未来值。 目的:解释变量之间的关系,并对未知值进行预测。
类型与模型
模型的适用性:确定模型是否适用于特定的数据集和问题类型。
逻辑回归分析
逻辑回归模型
逻辑回归是一 种广义的线性 回归分析模型
它通过将二分类 问题转换为回归 问题,使用逻辑 函数拟合数据并
预测分类结果
逻辑回归模型适 用于因变量为二 分类的情况,通 常用于预测和分
类问题
逻辑回归模型在 数据分析和预测 中具有广泛的应 用,尤其在金融、 医疗和市场营销
等领域
参数估计与求解
逻辑回归模型的参 数估计方法
最大似然估计法的 原理
迭代优化算法的实 现过程
参数求解的收敛性 和稳定性分析
模型评估与优化
准确率:使用准确率作为评估指标,评估模型的预测能力。
交叉验证:通过将数据集分成训练集和测试集,使用交叉验证评估模型的泛化能力。
高考真题——回归分析和独立性检验
高考真题——回归分析和独立性检验
副标题
一、选择题(本大题共9小题,共45.0分)
1.有甲、乙两个班级进行数学考试,按照大于等于85分为优秀,85分以下为非优秀
统计成绩,得到如下所示的列联表:
已知在全部105人中随机抽取1人,成绩优秀的概率为,则下列说法正确的是()参考公式:K2=
附表:
列联表中c的值为30,b的值为35
B. 列联表中c的值为15,b的值为50
C. 根据列联表中的数据,若按的可靠性要求,能认为“成绩与班级有关系”
D. 根据列联表中的数据,若按的可靠性要求,不能认为“成绩与班级有关系”
2.某人研究中学生的性别与成绩、视力、智商、阅读量这4个变量的关系,随机抽查
了52名中学生,得到统计数据如表1至表4,则与性别有关联的可能性最大的变量是()
表1
表2
表3
表4
成绩视力 C. 智商 D. 阅读量
3.下列两个变量中具有相关关系的是()
A. 正方形的面积与边长
B. 匀速行驶的车辆的行驶距离与时间
C. 人的身高与体重
D. 人的身高与视力
4.下列说法:
①将一组数据中的每一个数据都加上或减去同一个常数后,方差不变;
②设有一个线性回归方程=3-5x,变量x增加1个单位时,y平均增加5个单位;
③线性回归方程=x+必过(,);
④设具有相关关系的两个变量x,y的相关系数为r,则|r|越接近于0,x和y之间的
线性相关程度越高;
⑤在一个2×2列联表中,由计算得K2的值,则K2的值越大,判断两个变量间有关
联的把握就越大.
其中错误的个数是()
A. 0
B. 1
C. 2
D. 3
5.某次考试,班主任从全班同学中随机抽取一个容量为8的样本,他们的数学、物理
logistic回归
基于临床实际认为对结果有重要影响 基于模型应用条件的分析 引入两个自变量的乘积项
• 交互作用的检验 • 交互作用的解释
2022/2/26
21
第21页,共35页。
6.建立多个模型
• 饱和模型
• 自定义的模型
从饱和模型中选择自变量
再建立模型
2022/2/26
22
第22页,共35页。
第35页,共35页。
此为非条件logistic回归模型 应用于成组数据的分析
2022/2/26
7
第7页,共35页。
自变量取定一些值时,因变量取0、1的概率就是条件
概率,对条件概率进行logistic回归,称为条件 logistic回归
• 表达式:
•
eb1x1+b2x2+… +bkxk
P = 1 - eb1x1+b2x2+… +bkxk
哑变量来表示。
2022/2/26
14
第14页,共35页。
• 哑变量的设置
教育程度:文盲,小学,初中,高中以上
教育程度 X1
X2
X3
文盲:0 0
0
0
小学:1 1
0
0
初中:2 0
1
0
高中:3 0
0
1
2022/2/26
1回归分析测试题
回归分析测试题
A 卷 一、 选择题:
1.炼钢时钢水的含碳量与冶炼时间有( )
A.确定性关系
B.相关关系
C.函数关系
D.无任何关系
2.对相关性的描述正确的是( ) A .相关性是一种因果关系 B .相关性是一种函数关系
C .相关性是变量与变量之间带有随机性的关系
D .以上都不正确 3.∑=n
i i i y x 1等于( )
A.121)(y x x x n +++
B.121)(x y y y n +++
C. ++2211y x y x
D.n n y x y x y x +++ 2211
4.设有一个回归方程为x y
5.22-=,则变量x 增加一个单位时( )
A .y 平均增加2.5个单位 B.y 平均增加2个单位
C.y 平均减少2.5个单位
D.y 平均减少2个单位
5.x 与y 之间的线性回归方程a bx y +=必定过( )
A.(0,0)点
B.(0,x )点
C.(0,y )
D.(y x ,)
6.某化工厂为预测某产品的回收率y ,需要研究它和原料有效成分含量x 之间
的相关关系,现取了8对观测值,计算得
528
1
=∑=i i
x
,
2288
1
=∑=i i
y
,
4788
1
2=∑=i i
x
,18498
1
=∑=i i i y x ,则y 与x 的回归方程是( )
A.x y 62.247.11+=
B.x y 62.247.11+-=
C.62.247.11+=x y
D.x y 62.247.11-=
7.线性回归方程a bx y +=有一组独立的观测数据),(11y x ,),(,),,(22n n y x y x ,则系数b 的值为( )
统计学线性回归分析作业
白杨树重量与其直径、高度、生长地点的相关指标数据表
一、散点图
白杨树重量与地点的散点图相关性很弱。
白杨树重量与高度的散点图相关性较强,为正相关。
白杨树重量与直径的散点图相关性很强,为正相关。
二、检验(统计-回归-回归)
回归分析: 重量与直径, 高度, 地点
回归方程为:重量= - 0.185 + 0.513 直径- 0.210 高度+ 0.0019 地点
自变量系数系数标准误T P
常量-0.18477 0.07859 -2.35 0.043
直径0.51276 0.04428 11.58 0.000
高度-0.21012 0.04172 -5.04 0.001
地点0.00193 0.02861 0.07 0.948
S = 0.0469198 R-Sq = 98.9% R-Sq(调整)= 98.6%
方差分析
来源自由度SS MS F P
回归 3 1.85328 0.61776 280.61 0.000
残差误差9 0.01981 0.00220
合计12 1.87309
来源自由度Seq SS
直径 1 1.78807
高度 1 0.06520
地点 1 0.00001
异常观测值
拟合值标准化
观测值直径重量拟合值标准误残差残差
2 2.12 0.1500 0.242
3 0.022
4 -0.0923 -2.24R
R 表示此观测值含有大的标准化残差
因地点的P值大于0.05,无法通过回归方程检验,故剔除自变量“地点”。回归分析: 重量与直径, 高度
回归方程为:重量= - 0.181 + 0.514 直径- 0.211 高度
Logistic回归分析方法
• 假设自变量在各配比组中对结果变 量的作用是相同的,即自变量的回 归系数与配比组无关。 • 配比设计的Logistic回归模型
logit P=b1x1 b2 x2 bk xk
其中不含常数项。
第22页/共29页
• 可以看出此回归模型与非条件 Logistic回归模型十分相似,只不过 这里的参数估计是根据条件概率得到 的,因此称为条件Logistic回归模型。
第25页/共29页
十、注意事项
•应用条件
1. 各观察对象间相互独立; 2. logit P与自变量呈线性关系。
•异常值 •计量资料间的共线性问题
第2Biblioteka Baidu页/共29页
•暴露率 •样本量
第27页/共29页
谢谢!
第28页/共29页
感谢您的欣赏!
第29页/共29页
• 分析因素xi为连续性变量时, e(bi)表示xi增加一个计量单位时的优势比。
第16页/共29页
多因素Logistic回归分析时, 对回归系数的解释都是指在其 它所有自变量固定的情况下的 优势比。存在因素间交互作用 时, Logistic回归系数的解释 变得更为复杂,应特别小心。
第17页/共29页
第15页/共29页
• 分析因素xi为等级变量时,如果每个等级的作用相同,可按计量资料处理:如以最 小或最大等级作参考组,并按等级顺序依次取为0,1,2,…。此时, e(bi) 表示xi 增加一个等级时的优势比, e(k* bi)表示xi增加k个等级时的优势比。如果每个等级 的作用不相同,则应按多分类资料处理。
2020年智慧树知道网课《应用回归分析》课后章节测试满分答案
第一章测试
1
【多选题】(2分)
当一个经济问题的回归模型通过了各种统计检验,且模型具有合理的经济意义时,该回归模型就可用于
A.
经济变量的因素分析
B.
模型的显著性检验
C.
进行经济预测
D.
给定被解释变量值来控制解释变量值
2
【判断题】(2分)
常用的样本数据有时间序列数据和横截面数据。
A.
错
B.
对
3
【多选题】(2分)
随机误差项主要包括以下哪些因素的影响?
A.
其他随机因素
B.
样本采集过程中的测量误差
C.
由于人们认识的局限性或时间、费用、数据质量等的约束未引入回归模型但又对回归被解释变量有影响的因素
D.
理论模型的设定误差
4
【判断题】(2分)
变量间具有密切关联而又不能由某一个或某一些变量确定另外一个变量的关系称为变量间的统计关系。
A.
对
B.
错
5
【单选题】(2分)
进行回归分析时,假定相关的两个变量()。
A.
都不是随机变量
B.
一个是随机变量,一个不是随机变量
C.
都是随机变量
D.
随机或非随机都可以
第二章测试
1
【单选题】(2分)
总体平方和SST、残差平方和SSE、回归平方和SSR三者之间的关系是()。
A.
SSE=SSR-SST
B.
SST=SSR+SSE
C.
SSR=SST+SSE
D.
SSE=SSR+SST
2
【单选题】(2分)
反映由模型中解释变量所解释的那部分离差大小的是()。
A.
残差平方和
B.
总体平方和
C.
回归平方和
D.
样本平方和
3
【多选题】(2分)
古典线性回归模型的普通最小二乘估计量的特性有()。
A.
无偏性
B.
不一致性
C.
最小方差
D.
线性
4
【判断题】(2分)
一元线性回归分析中的回归平方和SSR的自由度是1。
应用回归分析测试题
应用回归分析测试题
一 选择题 1、
对于一元线性回归
01+(1,2,,)i i i y x i n ββε=+=K ,()0i E ε=,2var()i εσ=, cov(,)0(i j)i j εε=≠,下列说法错误的( B C )
(A) 01ββ,的最小二乘估计01
ˆˆββ,都是无偏估计; (B) 01ββ,的最小二乘估计01ˆˆββ,对12,,n y y y K ,是线性的; (C) 01ββ,的最小二乘估计01
ˆˆββ,之间是相关的; (D) 若误差服从正态分布,01ββ,的最小二乘估计和极大似然估计是不一样的.
2、下列说法错误的是 ( B ) (A)强影响点不一定是异常值;
(B)在多元回归中,回归系数显著性的t 检验与回归方程显著性的F 检验是等价的;
(C)一般情况下,一个定性变量有k 类可能的取值时,需要引入k-1个0-1型自变量;
(D)异常值的识别与特定的模型有关.
3、在对两个变量x ,y 进行线性回归分析时,有下列步骤:
①对所求出的回归直线方程作出解释; ②收集数据{(x ,y )},i=1,2,,n i i L ; ③求线性回归方程; ④求未知参数; ⑤根据所搜集的数据绘制散点图。 如果根据可行性要求能够作出变量, x,y 具有线性相关结论,则在下列操作中正确的是( D )
A .①②⑤③④
B .③②④⑤①
C .②④③①⑤
D .②⑤④③① 4、下列说法中正确的是(B )
A.任何两个变量都具有相关关系 ;
B.人的知识与其年龄具有相关关系 ;
C .散点图中的各点是分散的没有规律 ;
回归分析期中测试
期中测试题
一、填空题
1.变量之间的关系有函数关系、____________. 2. 所有子集回归中自变量选择的准则
有: 、 、 .
3.回归方程x y E 10)(ββ+=的参数0β、1β的最小二乘估计与最大似然估计等价的条件是 .
4.逐步回归方法中当 时,容易出现“死循环”.
5.一元线性回归的残差满足性质(1)=)(i e E ;(2)=)var(i e . 6.对线性回归系数显著性检验的t 检验来说,P 值越小,t 值 . 7.在 条件下,回归系数显著性的t 检验、回归方程显著性的
F 检验及相关系数的显著性检验是等价的.
8.样本容量n 不变而自变量个数p 增加时平方和SST SSR SSE 、、分别如何变化? .
9.回归分析的主要应用有:经济结构分析、 、 . 10. 多元线性回归的基本假设有 、 、 .
11.处理多重共线性问题时,对自变量作线性变换使之两两正交,然后再对其作回归的方法称为 .
12.0ˆβ是线性回归方程x y E 10)(ββ+=中0β的最小二乘估计,则有)ˆ(0βE = ,=)ˆvar(0
β . 13.多元线性回归方程的显著性F 检验通过表明 对因变量y 的线性影响显著.
14.判断某样本是否是异常数据时,我们常常要借助于 图.
15.普通最小二乘估计法的缺点是
二、判断题0
( )1.简单相关系数8.0=r 时,显著性检验可能没有通过;而简单相关系数2.0=r 时,显著性检验可能通过.
( )2.由标准化残差知,当3>i ZRE 时相应的观测值一般是异常值. ( )3.简单相关系数0=r 表明变量间没有任何关系. ( )4.作预测时一般外推的效果要优于内插. ( )5.多重共线性问题在任何情况下都必须处理.
多元回归分析的原理与应用演示文稿
回归方程有效性高低的指标
当残差平方和为 0时, 判定系数为 1 ,为完全 的拟合。
当残差平方和最大时 ,判定系数为 0,为
最差的拟合。
第18页,共41页。
判定系数与相关系数
r2
(n
x2
(n xy x y)2 ( x)2) (n y2 (
y)2 )
第5页,共41页。
1.1 回归分析的含义
• “回归”一词最早由英国统计学家高尔顿(Francis Galton)在19世纪末期研究孩子的身高和他们父母 身高关系时提出。
• 研究发现,孩子的身高总是趋于他们父母身高的平均值。 孩子的身高,比身材矮的父母要高,比身材高的父母要矮,
这种趋于中间值的趋势称作“回归效应”,而他提出 的这种研究两个数值变量关系的方法称作回归分析。
• 独立性:每一个观察值Y彼此间是统计独立的,观察值间没有 关联,即非共线性。
• 直线性:Y 变量的平均数是变量X1,X2,X3,……XK间的线性
函数,此线性函数关系即回归方程。
• 方差齐性:就X1,X2,X3,……XK任何一个组合而言,因变量Y的
变异数均相同。
• 正态性:就任何X1,X2,X3,……XK的线性组合而言,因变量
在回归分析中:
X
自变量(independent variable):解释变量,给定的 或可以控制的、用来解释、预测因变量的变量。
Logistic回归分析
Odds=P/(1-P)
比数比
OR=[P1/(1-P1)]/[P2/(1-P2)]
在患病率较小情况下,OR≈RR
第22页,共52页。
设P表示暴露因素X时个体发病的概率,
则发病的概率P与未发病的概率1-P 之比 为优势(odds), logit P就是odds的对数 值。
• 优势比 • 常把出现某种结果的概率与不出现的概率
根据Wald检验,可知Logistic回归系 数bi服从u分布。因此其可信区间为
bi u Sbi
进而,优势比e(bi)的可信区间为
e(bi uSbi )
第29页,共52页。
五、 Logistic回归分析方法
基本思想同线性回归分析。
从所用的方法看,有强迫法、前进法、 后退法和逐步法。在这些方法中,筛选变量 的过程与线性回归过程的完全一样。但其中 所用的统计量不再是线性回归分析中的F统计 量,而是以上介绍的参数检验方法中的三种 统计量之一。
如二项分类,如某种疾病的患病与否 某一治疗结果有效和无效 器官移植后生存或死亡
多项有序分类:某一治疗结果,治愈、显效、 有效、无效;
多项无序分类:肝炎分型 甲、乙、丙、丁、 戊
研究分类反应变量与多个影响因素之间的 相互关系的一种多变量分析方法,进行疾病的 病因分析。
第1页,共52页。
• Logistic回归的分类 Logistic回归 二分类 有序反应变量
(完整word版)应用回归分析测试题
一 选择题
1、对于一元线性回归01+(1,2,
,)i i i y x i n ββε=+=,()0i E ε=,2var()i εσ=,
cov(,)0(i j)i j εε=≠,下列说法错误的( B C )
(A) 01ββ,的最小二乘估计01ˆˆββ,都是无偏估计; (B ) 01ββ,的最小二乘估计01
ˆˆββ,对12,,n y y y ,是线性的;
(C ) 01ββ,的最小二乘估计01
ˆˆββ,之间是相关的; (D ) 若误差服从正态分布,01ββ,的最小二乘估计和极大似然估计是不一样的. 2、下列说法错误的是 ( B ) (A )强影响点不一定是异常值;
(B)在多元回归中,回归系数显著性的t 检验与回归方程显著性的F 检验是等价的; (C )一般情况下,一个定性变量有k 类可能的取值时,需要引入k —1个0-1型自变量; (D)异常值的识别与特定的模型有关.
3、在对两个变量x ,y 进行线性回归分析时,有下列步骤: ①对所求出的回归直线方程作出解释; ②收集数据{(x ,y )},i=1,2,
,n i i ;
③求线性回归方程; ④求未知参数; ⑤根据所搜集的数据绘制散点图.
如果根据可行性要求能够作出变量, x,y 具有线性相关结论,则在下列操作中正确的是( D ) A .①②⑤③④ B .③②④⑤① C .②④③①⑤ D .②⑤④③① 4、下列说法中正确的是(B ) A.任何两个变量都具有相关关系 ; B 。人的知识与其年龄具有相关关系 ; C .散点图中的各点是分散的没有规律 ;
3多元线性回归详解
-36.411
41.709
X3
3.291
2.467
0.748 1.334 0.199
-1.891
8.473
X4
-0.944
1.298
X5
-5.512
4.512
-0.312 -0.727 0.476
-3.670
1.782
-0.961 -1.221 0.238
-14.991
3.968
X6
4.060
3.957
误差项方差 2的MLE为
ˆ
2 L
1 n
SSE
1 n
(ee)
这是 2的有偏估计,但它满足一致性,
在大样本的情况下,是 的 渐2 进无偏
估计量。
27
第27页,共83页。
参数的最小二乘法(例题分析)
【例3.1】国际旅游外汇收入是国民经济发展的重要 组成部分,影响一个国家或地区旅游收入的因素包括
自然、文化、社会、经济、交通等多方面的因素,本
Model
B
Std. Error
Beta
t
1 (Constant)
-0.584
0.957
-0.610
各项贷款余额 本年累计应收贷款 贷款项目
0.032 0.187 -0.026
0.010 0.083 0.084
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
测试题
1.下列说法中错误的是()
A.如果变量x与y之间存在着线性相关关系,则我们根据试验数据得到的点(i=1,2,3,…, n)将散布在一条直线附近B.如果两个变量x与y之间不存在线性相关关系,那么根据试验数据不能写出一个线性方程。
C.设x,y是具有线性相关关系的两个变量,且回归直线方程是,则叫回归系数
D.为使求出的回归直线方程有意义,可用线性相关性检验的方法判断变量x与y之间是否存在线性相关关系
2.在一次试验中,测得(x,y)的四组值分别是(1,2),(2,3),(3,4),(4,5),则y与 x之间的回归直线方程是()
A.B. C.D.
3.回归直线必过点()
A.(0,0)B. C. D.
4.在画两个变量的散点图时,下面叙述正确的是()
A.预报变量在轴上,解释变量在轴上
B.解释变量在轴上,预报变量在轴上
C.可以选择两个变量中任意一个变量在轴上
D.可以选择两个变量中任意一个变量在轴上
5.两个变量相关性越强,相关系数r()
A.越接近于0 B.越接近于1 C.越接近于-1 D.绝
对值越接近1
6.若散点图中所有样本点都在一条直线上,解释变量与预报变量的相关系数为()
A.0 B.1 C.-1 D.-1或1
7.一位母亲记录了她儿子3到9岁的身高,数据如下表:
年龄(岁)3456789
身高(94.8104.2108.7117.8124.3130.8139.0由此她建立了身高与年龄的回归模型,她用这个模型预测儿子10岁时的身高,
则下面的叙述正确的是()
A.她儿子10岁时的身高一定是145.83
B.她儿子10岁时的身高在145.83以上
C.她儿子10岁时的身高在145.83左右
D.她儿子10岁时的身高在145.83以下
8.两个变量有线性相关关系且正相关,则回归直线方程中,
的系数()
A.B.C.D.
能力提升:
9.一个工厂在某年每月产品的总成本y(万元)与该月产量x(万件)之间有如下数据:
x 1.08 1.12 1.19 1.28 1.36 1.48 1.59 1.68 1.80 1.87 1.98 2.07 y 2.25 2.37 2.40 2.55 2.64 2.75 2.92 3.03 3.14 3.26 3.36 3.50(1)画出散点图;
(2)求每月产品的总成本y与该月产量x之间的回归直线方程。
10.某工业部门进行一项研究,分析该部分的产量与生产费用之间的关系,从这个工业部门内随机抽选了10个企业作样本,有如下资料:
产量x(千件)40424855657988100120140生产费用y(千元)150140160170150162185165190185(1)计算x与y的相关系数;
(2)对这两个变量之间是否线性相关进行相关性检验;
(3)设回归直线方程为,求系数,。
综合探究:
11.一只红铃虫的产卵数y和温度x有关。现收集了7对观测数据列于表中,试建立y与x之间的回归方程。
温度x/℃21232527293235
产卵数y/个711212466115325
参考答案:
基础达标:
1.B
尽管两个变量x与y之间不存在线性相关关系,但是由试验数据仍可求出回归直线方程中的和,从而可写出一个回归直线方程。
2.A
由回归直线经过样本点的中心,由题中所给出的数据,将
,代入中适合,故选A。
3.D
回归直线,必然经过样本点的中心,其坐标为,故选D。
4.B
5.D
6.B
7.C
8.A
9.解析:
(1)画出的散点图如图所示:
(2),,,
∴,
。
所以所求回归直线方程为。
10.解析:
(1)制表:
1401501600225006000 2421401764196005880 3481602304256007680 4551703025289009350
5651504225225009750
67916262412624412798
78818577443422516280
8100165100002722516500
9120190144003610022800
10140185196003422525900
合计777165770903277119132938
,,,,
∴,
即x与y的相关系数r≈0.808。
(2)因为,所以可以认为x与y之间具有很强的线性相关关系。
(3),。
综合探究:
11.解析:
散点图如图所示:
由散点图可以看出:这些点分布在某一条指数函数的图象的周围。
现在,问题变为如何估计待定参数c
1和c
2
,我们可以通过对数变
换把指数关系变为线性关系。
令,则变换后样本点应该分布在直线(,)的周围。
这样,就可以利用线性回归模型来建立y和x之间的非线性回归方程了。
由题中所给数据经变换后得到如下的数据表及相应的散点图x21232527293235
z 1.946 2.398 3.045 3.178 4.190 4.745 5.784
由图可看出,变换后的样本点分布在一条直线的附近,因此可以用线性回归方程来拟合。