线性回归分析练习题
卫生统计学线性回归练习题
一、是非题1.单个自变量的线性回归就是直线回归。
2.直线回归就是指自变量和应变量的观察值落在在一条直线上。
3.直线回归中预测值Y 是固定某个X 值,Y 的总体均数估计值。
4.用逐步回归的方法评价自变量与应变量之间的关联性,只能推断某个自变量与应变量有关联性,不能推断无它们之间无关联性。
二、选择题1.用最小二乘法确定直线回归方程的原则是各观察点()A . 距直线的纵向距离相等B . 距直线的纵向距离的平方和最小C . 与直线的垂直距离相等D . 与直线的垂直距离的平方和最小 2.直线回归的系数假设检验()E . 只能利用相关系数r 的检验方法进行检验F . 只能用t 检验G . 只能用F 检验H . 三者均可3.Y ˆ=7+2X 是1~7岁儿童以年龄(岁)估计体重(公斤)的回归方程,若把体重的单位换成市斤,则此方程( )A .截矩改变B .回归系数改变C . 截矩与回归系数都改变D .回归系数不变E .截矩不变 4.直线回归系数的假设检验,其自由度为( )A .nB .n-1C .n-2D .2n-1E .2n-25.对应变量Y 的离均差平方和,下列哪个分解是正确的?( )A .SS 剩=SS 回B .SS 总=SS 剩C .SS 总=SS 回D .SS 总+SS 剩=SS 回E .SS 总+SS 回=SS 剩三、计算分析题1.15名儿童的身高与肺死腔容积的观察值如表15-3所示。
表15-3 儿童身高与肺死腔容积的观测数据对象号 身高(cm)X 肺死腔容积(ml)Y 对象号 身高(cm)X 肺死腔容积(ml)Y 1 110 45 9 175 102 2 116 32 10 167 111 3 123 41 11 165 88 4 130 45 12 160 65 5 129 43 13 157 79 6 142 67 14 156 92 7 147 58 15 149 58 815357试用该资料进行回归分析:(1)计算样本回归方程的截矩与回归系数; (2)进行回归系数等于0的假设检验; (3)验证是否存在F t b =的关系;(4)估计回归系数β的95%置信区间。
第9章 一元线性回归练习题
第9章一元线性回归练习题一.选择题1.具有相关关系的两个变量的特点是()A.一个变量的取值不能由另一个变量唯一确定B.一个变量的取值由另一个变量唯一确定C.一个变量的取值增大时另一个变量的取值也一定增大D.一个变量的取值增大时另一个变量的取值肯定变小2.下面的各问题中,哪个不是相关分析要解决的问题A.判断变量之间是否存在关系B.判断一个变量数值的变化对另一个变量的影响C.描述变量之间的关系强度 D.判断样本所反映的变量之间的关系能否代表总体变量之间的关系3.根据下面的散点图,可以判断两个变量之间存在()A.正线性相关关系B. 负线性相关关系C. 非线性关系D. 函数关系4.下面的陈述哪一个是错误的()A. 相关系数是度量两个变量之间线性关系强度的统计量B.相关系数是一个随机变量C.相关系数的绝对值不会大于1D.相关系数不会取负值5.根据你的判断,下面的相关系数取值哪一个是错误的()A. -0.86B. 0.78C. 1.25D. 06.如果相关系数r=0,则表明两个变量之间()A.相关程度很低B. 不存在任何关系C.不存在线性相关关系D.存在非线性关系7.下列不属于相关关系的现象是()A.银行的年利息率与贷款总额B.居民收入与储蓄存款C.电视机的产量与鸡蛋产量D.某种商品的销售额与销售价格8.设产品产量与产品单位成本之间的线性相关系数为-0.87,这说明二者之间存在着()A. 高度相关B.中度相关C.低度相关D.极弱相关9.在回归分析中,被预测或被解释的变量称为()A.自变量B.因变量C.随机变量D.非随机变量10.对两变量的散点图拟合最好的回归线,必须满足一个基本的条件是()A.2ˆ()yy∑-最小B.2)(ˆyy∑-最大C.2ˆ()yy∑-最大D.2)(ˆyy∑-最小11. 下列哪个不属于一元回归中的基本假定()A.误差项i ε服从正态分布B. 对于所有的X ,方差都相同C. 误差项i ε相互独立D. 0)ˆ=-i i yy E ( 12.如果两个变量之间存在着负相关,指出下列回归方程中哪个肯定有误( )A.x y75.025ˆ-= B. x y 86.0120ˆ+-= C. x y 5.2200ˆ-= D. x y 74.034ˆ--= 13.对不同年份的产品成本拟合的直线方程为,75.1280ˆx y-=y 表示产品成本,x 表示不同年份,则可知( )A.时间每增加一个单位,产品成本平均增加1.75个单位B. 时间每增加一个单位,产品成本平均下降1.75个单位C.产品成本每变动一个单位,平均需要1.75年时间D. 产品成本每减少一个单位,平均需要1.75年时间 14.在回归分析中,F 检验主要是用来检验( )A .相关关系的显著性 B.回归系数的显著性 C. 线性关系的显著性D.估计标准误差的显著性15.说明回归方程拟合优度的统计量是( )A. 相关系数B.回归系数C. 判定系数D. 估计标准误差16.已知回归平方和SSR=4854,残差平方和SSE=146,则判定系数R 2=( ) A.97.08% B.2.92% C.3.01% D. 33.25% 17. 判定系数R2值越大,则回归方程( )A 拟合程度越低B 拟合程度越高C 拟合程度有可能高,也有可能低D 用回归方程进行预测越不准确 18. 居民收入与储蓄额之间的相关系数可能是( ) A -0.9247 B 0.9247 C -1.5362 D 1.536219.在对一元回归方程进行显著性检验时,得到判定系数R 2=0.80,关于该系数的说法正确的是( )A. 该系数越大,则方程的预测效果越好B. 该系数越大,则由回归方程所解释的因变量的变差越多C. 该系数越大,则自变量的回归对因变量的相关关系越显著D. 该回归方程中自变量与因变量之间的相关系数可能小于0.8 20.下列方程中肯定错误的是( )A. x y48.015ˆ-=,r=0.65 B. x y 35.115ˆ--=, r= - 0.81 C. x y85.025ˆ+-=, r=0.42 D. x y 56.3120ˆ-=, r= - 0.96 21. 若两个变量存在负相关关系,则建立的一元线性回归方程的判定系数R 2的取值范围是( )A.【0,1】B. 【-1,0】C. 【-1,1】D.小于0的任意数二. 填空题1.当从某一总体中抽取了一样本容量为30的样本,并计算出某两个变量的相关系数为0.8时,我们是否可认为这两个变量存在着强相关性(不能 ) ,理由是(因为该相关系数为样本计算出的相关系数,它的大小受样本数据波动的影响,它是否显著尚需检验 )。
线性回归分析经典例题
1. “团购”已经渗透到我们每个人的生活,这离不开快递行业的发展,下表是2013-2017年全国快递业务量(x 亿件:精确到0.1)及其增长速度(y %)的数据(Ⅰ)试计算2012年的快递业务量;(Ⅱ)分别将2013年,2014年,…,2017年记成年的序号t :1,2,3,4,5;现已知y 与t 具有线性相关关系,试建立y 关于t 的回归直线方程a x b yˆˆˆ+=; (Ⅲ)根据(Ⅱ)问中所建立的回归直线方程,估算2019年的快递业务量附:回归直线的斜率和截距地最小二乘法估计公式分别为:∑∑==--=ni ini ii x n xy x n yx b1221ˆ, x b y aˆˆ-=2.某水果种植户对某种水果进行网上销售,为了合理定价,现将该水果按事先拟定的价格进行试销,得到如下数据:单价元 7 8 9 11 12 13 销量120118112110108104已知销量与单价之间存在线性相关关系求y 关于x 的线性回归方程; 若在表格中的6种单价中任选3种单价作进一步分析,求销量恰在区间内的单价种数的分布列和期望.附:回归直线的斜率和截距的最小二乘法估计公式分别为:, .3. (2018年全国二卷)下图是某地区2000年至2016年环境基础设施投资额y (单位:亿元)的折线图.为了预测该地区2018年的环境基础设施投资额,建立了y 与时间变量t 的两个线性回归模型.根据2000年至2016年的数据(时间变量t 的值依次为1217,,…,)建立模型①:ˆ30.413.5y t =-+;根据2010年至2016年的数据(时间变量t 的值依次为127,,…,)建立模型②:ˆ9917.5y t =+. (1)分别利用这两个模型,求该地区2018年的环境基础设施投资额的预测值; (2)你认为用哪个模型得到的预测值更可靠?并说明理由.4.(2014年全国二卷) 某地区2007年至2013年农村居民家庭纯收入y (单位:千元)的数据如下表:年份 2007 2008 2009 2010 2011 2012 2013 年份代号t 1 2 3 4 5 6 7 人均纯收入y 2.93.33.64.44.85.25.9(Ⅰ)求y 关于t 的线性回归方程;(Ⅱ)利用(Ⅰ)中的回归方程,分析2007年至2013年该地区农村居民家庭人均纯收入的变化情况,并预测该地区2015年农村居民家庭人均纯收入.附:回归直线的斜率和截距的最小二乘法估计公式分别为:()()()121niii ni i t t y y b t t ∧==--=-∑∑,ˆˆay bt =-5(2019 2卷)18.11分制乒乓球比赛,每赢一球得1分,当某局打成10∶10平后,每球交换发球权,先多得2分的一方获胜,该局比赛结束.甲、乙两位同学进行单打比赛,假设甲发球时甲得分的概率为0.5,乙发球时甲得分的概率为0.4,各球的结果相互独立.在某局双方10∶10平后,甲先发球,两人又打了X 个球该局比赛结束.(1)求P(X=2);(2)求事件“X=4且甲获胜”的概率.。
(完整版)线性回归方程必练题(强烈推荐).doc
《线性回归方程》强化训练1、(门槛题)某车间为了规定工时定额,需要确定加工零件所花费的时间,为此作了四次试验,得到的数据如下:零件的个数x (个) 2 3 4 5加工的时间y (小时) 2.5 3 4 4.5(Ⅰ)在给定的坐标系中画出表中数据的散点图;(Ⅱ)求出 y 关于 x 的线性回归方程? ? ?,并在坐标系中画出回归直线;y bx a(Ⅲ)试预测加工10个零件需要多少时间?n附录:参考公式:? x i x y i y?i 1 ,?b n y bx .2 ax i xi 12 、(泸州市 2017 届高三一诊第 20 题)某班主任为了解本班学生的数学和物理考试成绩间关系,在某次阶段性测试中, 他在全班学生中随机抽取一个容量为 5 的样本进行分析。
该样本中5位同学的数学和物理成绩对应如下表:学生编号123 4 5 数学分数 x 89 9193 95 97 物理分数 y8789899293( Ⅰ ) 根据上表数据,用变量y 与 x 相关系数说明物理成绩y 与数学成绩 x 之间线性相关关系的强弱; ( Ⅱ ) 建立 y 与 x 的线性回归方程(系数精确到0.01),并预测该班数学分数为 88 的学生的物理分数 .5552附录:参考数据:y i450,x i y i41880,y i y4.90 ;i 1i 1i 1n参考公式:相关系数rx i x y i y?i 1; 回归直线的方程是 ??,nny bxa2 2i 1 x i xi 1 y iyn其中对应的回归估计值:?x i x y iy?i 1, ?,参考值:15 3.87bny bx .2ai 1 x i x3、( 2016年全国新课标高考Ⅲ卷第 18 题)下图是我国 2008 年至2014年生活垃圾无害化处理量(单位:亿吨)的折线图.(Ⅰ)由折线图看出,可用线性回归模型拟合 y 与 t 的关系,请用相关系数加以说明;(Ⅱ)建立 y 关于 t 的回归方程(系数精确到0.01),预测 2016 年我国生活垃圾无害化处理量 777y)2附注:参考数据:y i 9.32 ,t i y i 40.17 ,( y i0.55 , 7 2.646 .i 1 i 1i 1nt y it i y参考公式:相关系数ri 1,nn22t ty i yii 1i 1n)) ))(t i t )( y iy)i 1) )回归方程 ya bt 中斜率和截距的最小二乘估计公式分别为:bn,a=y (t it ) 2i 1.)bt .4 、( 2015 年全国新课标高考Ⅰ卷第 19 题)某公司为确定下一年度投入某种产品的宣传费,需了解年宣传费 x (单位:千元)对年销售量 (单位: )和年利润 (单位:千元)的影响,对近 8 年的宣传费x i 和年销售量 y i i 1,2,L ,8ytz数据作了初步处理,得到下面的散点图及一些统计量的值.r ur ur 8888xyw(x i x) 2(w i w) 2( x i x)( y iy)( w i w)( y i y)i 1i 1i1i 146.6 563 6.8289.81.61469108.8ur8表中 w ix i , w =1w i .8 i 1(Ⅰ)根据散点图判断, y a bx 与 y cd x ,哪一个适宜作为年销售量y 关于年宣传费 x 的回归方程类型?(给出判断即可,不必说明理由)(Ⅱ)根据(Ⅰ)的判断结果及表中数据,建立 y 关于 x 的回归方程;(Ⅲ)已知这种产品的年利润 z 与 x , y 的关系为 z 0.2 y x ,根据(Ⅱ)的结果回答下列问题:(ⅰ)年宣传费 x49 时,年销售量及年利润的预报值是多少? (ⅱ)年宣传费 x 为何值时, 年利润的预报值最大?附:对于一组数据 (u 1, v 1 ) , (u 2 , v 2 ) , , (u n , v n ) , 其回归直线 vu 的斜率和截距的最小二乘估计分别为:n(u iu)(v iv)μ i 1μμ=n,=vu .(u i u)2i 1。
回归分析练习题
1. 从20的样本中得到的有关回归结果是:SSR=60,SSE=40。
要检验x 与y 之间的线性关系是否显著,即检验假设:01:0H β=。
(1)线性关系检验的统计量F 值是多少? (2)给定显著性水平a =0.05,F a 是多少? (3)是拒绝原假设还是不拒绝原假设?(4)假定x 与y 之间是负相关,计算相关系数r 。
(5)检验x 与y 之间的线性关系是否显著?解:(1)SSR 的自由度为k=1;SSE 的自由度为n-k-1=18;因此:F=1SSR k SSE n k --=6014018=27 (2)()1,18F α=()0.051,18F =4.41 (3)拒绝原假设,线性关系显著。
(4),由于是负相关,因此r=-0.7746(5)从F 检验看线性关系显著。
2. 某汽车生产商欲了解广告费用(x)对销售量(y)的影响,收集了过去12年的有关数据。
通过计算得到下面的有关结果:(1)完成上面的方差分析表。
(2)汽车销售量的变差中有多少是由于广告费用的变动引起的?(3)销售量与广告费用之间的相关系数是多少?(4)写出估计的回归方程并解释回归系数的实际意义。
(5)检验线性关系的显著性(a=0.05)。
(2)R2=0.9756,汽车销售量的变差中有97.56%是由于广告费用的变动引起的。
(3)r=0.9877。
(4)回归系数的意义:广告费用每增加一个单位,汽车销量就增加1.42个单位。
(5)回归系数的检验:p=2.17E—09<α,回归系数不等于0,显著。
回归直线的检验:p=2.17E—09<α,回归直线显著。
3. 根据两个自变量得到的多元回归方程为12ˆ18.4 2.014.74yx x =-++,并且已知n =10,SST =6 724.125,SSR =6 216.375,1ˆ0.0813s β=,2ˆs β=0.056 7。
要求:(1)在a=0.05的显著性水平下,12,x x 与y 的线性关系是否显著? (2)在a =0.05的显著性水平下,1β是否显著?(3)在a =0.05的显著性水平下,2β是否显著?解(1)回归方程的显著性检验:假设:H 0:1β=2β=0 H 1:1β,2β不全等于0 SSE=SST-SSR=6 724.125-6 216.375=507.75 F=1SSR p SSE n p --=6724.1252507.751021--=42.85()2,7F α=4.74,F>()2,7F α,认为线性关系显著。
统计学一元线性回归分析练习题
统计学一元线性回归分析练习题一、内容提要本章介绍了回归分析的基本思想与基本方法。
首先,本章从总体回归模型与总体回归函数、样本回归模型与样本回归函数这两组概念开始,建立了回归分析的基本思想。
总体回归函数是对总体变量间关系的定量表述,由总体回归模型在若干基本假设下得到,但它只是建立在理论之上,在现实中只能先从总体中抽取一个样本,获得样本回归函数,并用它对总体回归函数做出统计推断。
本章的一个重点是如何获取线性的样本回归函数,主要涉及到普通最小二乘法的学习与掌握。
同时,也介绍了极大似然估计法以及矩估计法。
本章的另一个重点是对样本回归函数能否代表总体回归函数进行统计推断,即进行所谓的统计检验。
统计检验包括两个方面,一是先检验样本回归函数与样本点的“拟合优度”,第二是检验样本回归函数与总体回归函数的“接近”程度。
后者又包括两个层次:第一,检验解释变量对被解释变量是否存在着显著的线性影响关系,通过变量的t检验完成;第二,检验回归函数与总体回归函数的“接近”程度,通过参数估计值的“区间检验”完成。
本章还有三方面的内容不容忽视。
其一,若干基本假设。
样本回归函数参数的估计以及对参数估计量的统计性质的分析以及所进行的统计推断都是建立在这些基本假设之上的。
其二,参数估计量统计性质的分析,包括小样本性质与大样本性质,尤其是无偏性、有效性与一致性构成了对样本估计量优劣的最主要的衡量准则。
Goss-markov定理表明OLS估计量是最佳线性无偏估计量。
其三,运用样本回归函数进行预测,包括被解释变量条件均值与个值的预测,以及预测置信区间的计算及其变化特征。
二、典型例题分析例1、令kids表示一名妇女生育孩子的数目,educ 表示该妇女接受过教育的年数。
生育率对教育年数的简单回归模型为kids??0??1educ??随机扰动项?包含什么样的因素?它们可能与教育水平相关吗?上述简单回归分析能够揭示教育对生育率在其他条件不变下的影响吗?请解释。
多元线性回归模型习题及答案
多元线性回归模型一、单项选择题1.在由n = 30的一组样本估计的、包含3个解释变量的线性回归模型中,计算得多重决定 系数为,则调整后的多重决定系数为(D ) A. B. C. 下列样本模型中,哪一个模型通常是无效 的(B )A. G (消费)=500+4(收入)B. Q d (商品需求)=10+4(收入)+ P (价格)C.Qs (商品供给)=20+ P (价格)D. 1 (产出量)=L 0'(劳动)£”(资本)3 .用一组有30个观测值的样本估计模型工=b 0 + b i x i t + b 2x 21 + u t 后,在的显著性水平上对b i 的显著性作t 检验,则b i 显著地不等于零的条件是其统计量t 大于等于(Ct (30) t (28) t (27) F (1,28)A. 0.05B. 0.025C. 0.025D. 0.025ln y = ln b + b In x + u , b ,,4 .模型 乙 0 i t t 中,i 的实际含义是(B )A. x 关于y 的弹性B. y 关于x 的弹性C. x 关于y 的边际倾向D. y 关于x的边际倾向5、在多元线性回归模型中,若某个解释变量对其余解释变量的判定系数接近于1,则表明 模型中存在( C )A.异方差性B.序列相关C.多重共线性D.高拟合优度 6 .线性回归模型y = b + bx + b x + ... + b x + u 中,检验H :b = 0(i = 0,1,2,...k ) 时,所用的统计量服从(1 C 2 22 k kt t 0 t (n-k+1) (n-k-2) (n-k-1) (n-k+2)7 . 调整的判定系数与多重判定系数之间有如下关系( D )— n — 1— n — 1 A. R 2 = ------------ R 2B. R 2 = 1 ------------- R 2n 一 k 一 1 n 一 k 一 1 n 一 1n 一 1 ~C. R 2 = 1 ----------- (1+ R 2)D, R 2 = 1 ----------- (1-R 2)n 一 k 一 1n 一 k 一 18 .关于经济计量模型进行预测出现误差的原因,正确的说法是(C )。
线性回归方程练习题
第10课时线性回归方程(1)
分层训练
1.长方形的面积一定时,长和宽具有( ) (A)不确定性关系 (B)相关关系 (C)函数关系 (D)无任何关系 2.三点(3,10),(7,20),(11,24)的线性回归方程是 ( )
(A) x y
175ˆ-= (B) x y 517ˆ+= (C) x y 517ˆ-= (D) x y 517ˆ+-= 3.已知线性回归方程为:81.050.0ˆ-=x y
,则x =25时,y 的估计值为________ 4.一家保险公司调查其总公司营业部的加班效果,收集了10周中每周加班时间y (小时)与签发新保单数目x
则y 关于x 估计的线性回归方程为____________________(保留四位有效数字) 5
求y 与x 的线性回归方程。
(小数点后保留两位有效数字)
思考∙运用
6.在某种产品表面进行腐蚀刻线试验,得到腐蚀深度y 与腐蚀时间x 之间相应的一组观察值如下表:
y (万元),有如下的统计资料:
试求:(1)线性回归方程a bx y
+=ˆ的回归系数a , b ; (2)估计使用年限为10年时,维修费用是多少?
本节学习疑点:
6.4.1 线性回归方程(1)
1.C 2.D 3.11.69
4.x y
003585.01181.0ˆ+= 5.x y
96.168.183ˆ+= 6.x y
304.036.5ˆ+= 7.(1) 23.1=b , 08.0=a
(2) 线性回归方程是 08.023.1ˆ+=x y
当x=10时,38.1208.01023.1ˆ=+⨯=y
即估计使用10年时的维修费用是12.38万元。
第二章 简单线性回归模型练习题
第二章 简单线性回归模型练习题一、术语解释 1 解释变量 2 被解释变量 3 线性回归模型 4 最小二乘法 5 方差分析 6 参数估计 7 控制 8 预测 二、填空1 在经济计量模型中引入反映( )因素影响的随机扰动项t ξ,目的在于使模型更符合( )活动。
2 在经济计量模型中引入随机扰动项的理由可以归纳为如下几条:(1)因为人的行为的( )、社会环境与自然环境的( )决定了经济变量本身的( );(2)建立模型时其他被省略的经济因素的影响都归入了( )中;(3)在模型估计时,( )与归并误差也归入随机扰动项中;(4)由于我们认识的不足,错误的设定了( )与( )之间的数学形式,例如将非线性的函数形式设定为线性的函数形式,由此产生的误差也包含在随机扰动项中了。
3 ( )是因变量离差平方和,它度量因变量的总变动。
就因变量总变动的变异来源看,它由两部分因素所组成。
一个是自变量,另一个是除自变量以外的其他因素。
( )是拟合值的离散程度的度量。
它是由自变量的变化引起的因变量的变化,或称自变量对因变量变化的贡献。
( )是度量实际值与拟合值之间的差异,它是由自变量以外的其他因素所致,它又叫残差或剩余。
4 回归方程中的回归系数是自变量对因变量的( )。
某自变量回归系数β的意义,指的是该自变量变化一个单位引起因变量平均变化( )个单位。
5 模型线性的含义,就变量而言,指的是回归模型中变量的( );就参数而言,指的是回归模型中的参数的( );通常线性回归模型的线性含义是就( )而言的。
6 样本观察值与回归方程理论值之间的偏差,称为( ),我们用残差估计线性模型中的( )。
三、简答题1 在线性回归方程中,“线性”二字如何理解?2 用最小二乘法求线性回归方程系数的意义是什么?3 一元线性回归方程的基本假设条件是什么?4 方差分析方法把数据总的平方和分解成为两部分的意义是什么?5 试叙述t 检验法与相关系数检验法之间的联系。
线性回归习题答案
线性回归习题答案线性回归是统计学中一种常见的数据分析方法,用于建立自变量与因变量之间的线性关系模型。
在实际应用中,线性回归模型常用于预测、趋势分析和关联度分析等领域。
下面将通过一些典型的线性回归习题来探讨其应用。
习题一:某公司根据过去几年的销售数据,建立了一个线性回归模型来预测未来的销售额。
已知公司的广告费用与销售额之间存在着一定的线性关系。
根据模型,当广告费用为1000元时,预测的销售额为15000元。
求该模型的回归方程。
解答:假设回归方程为y = a + bx,其中y表示销售额,x表示广告费用。
根据已知条件,可以得到一个方程:15000 = a + 1000b。
进一步,如果再给出另外一个广告费用与销售额的数据点,就可以求解出回归方程的具体参数a和b。
习题二:某城市的房价与房屋面积之间存在一定的线性关系。
已知一套房子的面积为120平方米,根据线性回归模型预测其价格为80万元。
求该模型的回归方程。
解答:假设回归方程为y = a + bx,其中y表示房价,x表示房屋面积。
根据已知条件,可以得到一个方程:80 = a + 120b。
同样地,如果再给出另外一个房屋面积与价格的数据点,就可以求解出回归方程的具体参数a和b。
习题三:某公司根据市场调研数据,建立了一个线性回归模型来分析产品销售量与价格之间的关系。
已知当产品价格为10元时,预测的销售量为1000个。
根据该模型,求当产品价格为15元时的预测销售量。
解答:假设回归方程为y = a + bx,其中y表示销售量,x表示产品价格。
根据已知条件,可以得到一个方程:1000 = a + 10b。
根据该方程,可以求解出参数a和b的具体值。
然后,将x取15,代入回归方程中,即可得到当产品价格为15元时的预测销售量。
通过以上习题的解答,我们可以看到线性回归模型在实际问题中的应用。
通过建立合适的回归方程,我们可以通过已知的自变量值来预测因变量的取值。
这对于企业决策、市场分析以及经济预测等方面都具有重要意义。
线性回归习题
X 8.12, Y 7.28,
X
2 i
330.62
XiYi 296.37,
n 1 n
X iYi
X
2 i
(
Xi Yi Xi )2
0.846
ˆ0 Y ˆ1X 0.411
Y关于X的样本回归方程为:
Yi 0.411 0.846 X i
2、下列方程哪些是正确的?哪些是错误的?为什么?
Yt X t
Yt X t t
Yt ˆ ˆ Xt t Yˆt ˆ ˆ Xt t
t 1,2,, n t 1,2,, n
t 1,2,,n t 1,2,,n
Yt ˆ ˆ Xt Yˆt ˆ ˆ Xt Yt ˆ ˆ Xt ˆt Yˆt ˆ ˆ Xt ˆt
率项将会成为原回归系数的1/10。同样地,记Y*为原变量Y的
单位扩大10倍的变量,则Y=Y*/10,于是
Y 10
0
1 X ,
Y 100 101 X
可见,被解释变量的单位扩大10倍时,截距项与斜率项都会比 原回归系数扩大10倍。
(2)假定给X的每个观测值都增加2,对原回归的斜率和截距 会有什么样的影响?如果给Y的每个观测值都增加2,又会怎样?
4.对线性回归模型进行最小二乘估计,最小二乘准则是 __残_差_平_方__和_最_小___________。
5. 普通最小二乘法得到的参数估计量具有___线_性_性_____、 __无_偏__性_____、__有__效_性_____统计性质。
6.对计量经济学模型作统计检验包括___似_合_优_度____检验、 __变_量__的_显_著_性__检验、__方__程_的_显_著_性__检验。
归方程为
,这说明()。
A.产量每Yˆ 增 加35一6 台1,.5X单位产品成本增加356元
简单线性回归分析思考与练习参考答案
简单线性回归分析思考与练习参考答案第10章简单线性回归分析思考与练习参考答案⼀、最佳选择题1.如果两样本的相关系数21r r =,样本量21n n =,那么( D )。
A. 回归系数21b b = B .回归系数12b b < C. 回归系数21b b > D .t 统计量11r b t t = E. 以上均错2.如果相关系数r =1,则⼀定有( C )。
A .总SS =残差SSB .残差SS =回归SSC .总SS =回归SSD .总SS >回归SS E.回归MS =残差MS3.记ρ为总体相关系数,r 为样本相关系数,b 为样本回归系数,下列( D )正确。
A .ρ=0时,r =0B .|r |>0时,b >0C .r >0时,b <0D .r <0时,b <0 E. |r |=1时,b =14.如果相关系数r =0,则⼀定有( D )。
A .简单线性回归的截距等于0B .简单线性回归的截距等于Y 或XC .简单线性回归的残差SS 等于0D .简单线性回归的残差SS 等于SS 总E .简单线性回归的总SS 等于05.⽤最⼩⼆乘法确定直线回归⽅程的含义是( B )。
A .各观测点距直线的纵向距离相等B .各观测点距直线的纵向距离平⽅和最⼩C .各观测点距直线的垂直距离相等D .各观测点距直线的垂直距离平⽅和最⼩E .各观测点距直线的纵向距离等于零⼆、思考题1.简述简单线性回归分析的基本步骤。
答:①绘制散点图,考察是否有线性趋势及可疑的异常点;②估计回归系数;③对总体回归系数或回归⽅程进⾏假设检验;④列出回归⽅程,绘制回归直线;⑤统计应⽤。
2.简述线性回归分析与线性相关的区别与联系。
答:区别:(1)资料要求上,进⾏直线回归分析的两变量,若X 为可精确测量和严格控制的变量,则对应于每个X 的Y 值要求服从正态分布;若X 、Y 都是随机变量,则要求X 、Y 服从双变量正态分布。
直线相关分析只适⽤于双变量正态分布资料。
《9.1 线性回归分析》(同步训练)高中数学选择性必修第二册_苏教版_2024-2025学年
《9.1 线性回归分析》同步训练(答案在后面)一、单选题(本大题有8小题,每小题5分,共40分)1、某地区近五年内每年的GDP(单位:亿元)如下表所示:年份 | GDP–|—– 2016 | 300 2017 | 320 2018 | 350 2019 | 370 2020 | 400若要用线性回归分析预测该地区2021年的GDP,以下哪项说法是正确的?A、根据2016年到2020年的数据,拟合直线y=10x+290,则预测2021年GDP为410亿元B、根据2016年到2020年的数据,拟合直线y=10x+280,则预测2021年GDP为420亿元C、根据2016年到2020年的数据,拟合直线y=10x+280,则预测2021年GDP为400亿元D、根据2016年到2020年的数据,拟合直线y=10x+290,则预测2021年GDP为400亿元2、已知一组数据的线性回归方程为(y=1.5x+20),若将(x)的值增加 2,则(y)的值将()。
A、减少 3B、减少 2C、增加 3D、增加 23、(单选题)若线性回归方程为y = 3x + 1,当x增加1个单位时,y大约增加多少个单位?A. 1个单位B. 3个单位C. 4个单位D. 2个单位4、给定一组数据点((x1,y1),(x2,y2),...,(x n,y n)),假设我们已经计算出了线性回归方程(y=ax+b)中的斜率(a)和截距(b)。
如果增加一个新数据点((x n+1,y n+1))到这组数据中,那么新的线性回归方程中的斜率(a′)相对于原来的斜率(a):A. 一定会变大B. 一定会变小C. 可能会变大,可能会变小,也可能会不变D. 一定不会改变5、某校为研究学生身高与体重之间的关系,随机抽取了10名学生的身高和体重数据,并建立了线性回归方程y=50x+35(其中x为身高,y为体重),若某学生的身高为1.75米,则该学生的预测体重约为:A. 70千克B. 75千克C. 80千克D. 85千克6、某研究机构对两种不同品牌的学习卡片销售情况进行了统计,得到了两组数据,为了找到哪种学习卡片的销售趋势更好的线性回归方程,第一组(品牌A)的广告费用与销售额数据如下:广告费用x(元)分别为100、200、300、400、500,对应的销售额y(万元)分别为15、25、35、45、55。
线性回归习题
第9章一元线性回归练习题一.选择题1.具有相关关系的两个变量的特点是()A.一个变量的取值不能由另一个变量唯一确定B.一个变量的取值由另一个变量唯一确定C.一个变量的取值增大时另一个变量的取值也一定增大D.一个变量的取值增大时另一个变量的取值肯定变小2.下面的各问题中,哪个不是相关分析要解决的问题A.判断变量之间是否存在关系B.判断一个变量数值的变化对另一个变量的影响C.描述变量之间的关系强度 D.判断样本所反映的变量之间的关系能否代表总体变量之间的关系3.根据下面的散点图,可以判断两个变量之间存在()A.正线性相关关系B. 负线性相关关系C. 非线性关系D. 函数关系4.下面的陈述哪一个是错误的()A. 相关系数是度量两个变量之间线性关系强度的统计量B.相关系数是一个随机变量C.相关系数的绝对值不会大于1D.相关系数不会取负值5.根据你的判断,下面的相关系数取值哪一个是错误的()A. -0.86B. 0.78C. 1.25D. 06.如果相关系数r=0,则表明两个变量之间()A.相关程度很低B. 不存在任何关系C.不存在线性相关关系D.存在非线性关系7.下列不属于相关关系的现象是()A.银行的年利息率与贷款总额B.居民收入与储蓄存款C.电视机的产量与鸡蛋产量D.某种商品的销售额与销售价格8.设产品产量与产品单位成本之间的线性相关系数为-0.87,这说明二者之间存在着()A. 高度相关B.中度相关C.低度相关D.极弱相关9.在回归分析中,被预测或被解释的变量称为()A.自变量B.因变量C.随机变量D.非随机变量10.对两变量的散点图拟合最好的回归线,必须满足一个基本的条件是()A.2ˆ()yy∑-最小B.2)(ˆyy∑-最大C.2ˆ()yy∑-最大D.2)(ˆyy∑-最小11. 下列哪个不属于一元回归中的基本假定()A.误差项i ε服从正态分布B. 对于所有的X ,方差都相同C. 误差项i ε相互独立D. 0)ˆ=-i i yy E ( 12.如果两个变量之间存在着负相关,指出下列回归方程中哪个肯定有误( )A.x y75.025ˆ-= B. x y 86.0120ˆ+-= C. x y 5.2200ˆ-= D. x y 74.034ˆ--= 13.对不同年份的产品成本拟合的直线方程为,75.1280ˆx y-=y 表示产品成本,x 表示不同年份,则可知( )A.时间每增加一个单位,产品成本平均增加1.75个单位B. 时间每增加一个单位,产品成本平均下降1.75个单位C.产品成本每变动一个单位,平均需要1.75年时间D. 产品成本每减少一个单位,平均需要1.75年时间 14.在回归分析中,F 检验主要是用来检验( )A .相关关系的显著性 B.回归系数的显著性 C. 线性关系的显著性D.估计标准误差的显著性15.说明回归方程拟合优度的统计量是( )A. 相关系数B.回归系数C. 判定系数D. 估计标准误差16.已知回归平方和SSR=4854,残差平方和SSE=146,则判定系数R 2=( ) A.97.08% B.2.92% C.3.01% D. 33.25% 17. 判定系数R2值越大,则回归方程( )A 拟合程度越低B 拟合程度越高C 拟合程度有可能高,也有可能低D 用回归方程进行预测越不准确 18. 居民收入与储蓄额之间的相关系数可能是( ) A -0.9247 B 0.9247 C -1.5362 D 1.536219.在对一元回归方程进行显著性检验时,得到判定系数R 2=0.80,关于该系数的说法正确的是( )A. 该系数越大,则方程的预测效果越好B. 该系数越大,则由回归方程所解释的因变量的变差越多C. 该系数越大,则自变量的回归对因变量的相关关系越显著D. 该回归方程中自变量与因变量之间的相关系数可能小于0.8 20.下列方程中肯定错误的是( )A. x y48.015ˆ-=,r=0.65 B. x y 35.115ˆ--=, r= - 0.81 C. x y85.025ˆ+-=, r=0.42 D. x y 56.3120ˆ-=, r= - 0.96 21. 若两个变量存在负相关关系,则建立的一元线性回归方程的判定系数R 2的取值范围是( )A.【0,1】B. 【-1,0】C. 【-1,1】D.小于0的任意数二. 填空题1.当从某一总体中抽取了一样本容量为30的样本,并计算出某两个变量的相关系数为0.8时,我们是否可认为这两个变量存在着强相关性(不能 ) ,理由是(因为该相关系数为样本计算出的相关系数,它的大小受样本数据波动的影响,它是否显著尚需检验 )。
线性回归分析法例题
线性回归分析法例题一、单选题1.相关分析研究的是()A、变量间相互关系的紧密程度B、变量之间因果关系C、变量之间严苛的相依关系D、变量之间的线性关系2.若变量X的值减少时,变量Y的值也减少,那么变量X和变量Y之间存有着()。
A、正相关关系B、负相关关系C、直线有关关系D、曲线有关关系3.若变量X的值增加时,变量Y的值随之下降,那么变量X和变量Y之间存在着()。
A、正有关关系B、负相关关系C、直线相关关系D、曲线相关关系4.相关系数等于零说明两变量()。
A.是严格的函数关系B.不存在相关关系C.不存有线性相关关系D.存在曲线线性相关关系5.有关关系的主要特征就是()。
A、某一现象的标志与另外的标志之间的关系是不确定的B、某一现象的标志与另外的`标志之间存有着一定的依存关系,但它们不是确认的关系C、某一现象的标志与另外的标志之间存在着严格的依存关系D、某一现象的标志与另外的标志之间存有着不确认的直线关系6.时间数列自身相关是指()。
A、两变量在相同时间上的依存关系B、两变量静态的依存关系C、一个变量随其时间相同其前后期变量值之间的依存关系D、一个变量的数值与时间之间的依存关系7.如果变量X和变量Y之间的相关系数为负1,表明两个变量之间()。
A、不存在相关关系B、相关程度很低C、有关程度很高D、全然负相关8.若物价上涨,商品的需求量愈小,则物价与商品需求量之间()。
A、并无有关B、存有正有关C、存在负相关D、无法判断是否相关9.有关分析对资料的建议就是()。
A.两变量均为随机的B.两变量均不是随机的C、自变量就是随机的,因变量不是随机的D、自变量不是随机的,因变量是随机的10.重回分析中直观重回就是指()。
A.时间数列自身回归B.两个变量之间的回归C.变量之间的线性重回D.两个变量之间的线性重回11.已知某工厂甲产品产量和生产成本有直线关系,在这条直线上,当产量为时,其生产成本为元,其中不随产量变化的成本为元,则成本总额对产量的回归方程为()A. y=+24xB. y=6+0.24xC. y=+6xD. y=24+x12.直线回归方程中,若回归系数为负,则()A.表明现象正相关B.表明现象负相关C.说明有关程度较弱D.无法表明有关方向和程度二、多项选择题1.以下属有关关系的存有()。
5-第11章 回归分析 练习题 统计学
第11章 一元线性回归练习题一、填空题1、拟合简单回归直线最常用的方法是 ,其基本要求是使 达到最小。
2、在简单回归分析中,因变量y 的总离差可以分解为 和 。
3、设SSR=36,SSE=4,n=18,判定系数2R = 。
4、在判定现象相关关系密切程度时,主要用 进行一般性判断,用 进行数量上的说明。
5、在线性回归方程 2.87X 48.53Yˆ+=中,截距项系数48.53的含义是 ,斜率项系数2.87的含义是 。
6、如果从图形上看,两变量之间的关系近似地表现为直线形式,则称这两变量之间存在 关系。
7、回归模型中,对参数β进行显著性检验时,原假设H 是 ,备择假设1H 是 。
8、判定系数的取值范围是 。
9、按某产品产量(千件)与生产费用(万元)之间的相关关系,求得回归方程满足:产量每增加1千件,生产费用将增加2.5万元,当产量为8千件时,生产费用将为26万元。
则直线回归方程为 。
10、反映y 的总变差中由x 和y 的线性关系解释的部分的平方和是 。
二、判断题(共10题,每题1分,共计10分) 1、222i i i i ˆˆ(y y )(y y )(y y )-=-+-∑∑∑,反映了因变量y 的总变异可以分解为两部分,一个好的回归应使等式右端的两部分都小。
( ) 2、用一元线性回归模型中,随机误差项反映的是除了自变量X 以外其他所有因素对因变量Y 的影响。
( ) 3、在一元线性回归模型中对回归系数显著性检验的t 统计量和对因变量与自变量相关系数检验的t 统计量没有关系。
( ) 4、相关系数与回归系数的正负方向是一致的。
( ) 5、根据航班正点率(%)与旅客投诉率(次/万名)建立的回归方程为ˆ 6.020.07yx =-,其中回归系数-0.07,表示航班正点率与旅客投诉率之间是低度相关。
( ) 6、相关系数有正负、有大小,因而它反映的是两现象之间具体的数量变动关系。
( ) 7、当相关系数0r =时,表明现象之间完全无关。
线性回归练习题
线性回归练习一、选择题1.下列两个变量之间的关系中,哪个是函数关系 ( ) A.学生的性别与他的数学成绩 B.人的工作环境与健康状况 C.女儿的身高与父亲的身高 D. 正三角形的边长与面积2.从某大学随机选取8名女大学生,其身高x (cm)和体重y (kg)的回归方程为 ˆ0.84985.712yx =-,则身高172cm 的女大学生,由回归方程可以预报其体重 ( )A.为6 0.316kgB. 约为6 0.316kgC.大于6 0.316kgD.小于6 0.316kg3. 工人月工资(元)依劳动生产率(千元)变化的回归直线方程为ˆ160180yx =+,下列判断正确的是 ( )A .劳动生产率为1000元时,工资为340元B .劳动生产率提高1000元时,工资提高180元C .劳动生产率提高1000元时,工资平均提高180元 D.工资为520元时,劳动生产率为2000元 4.由右表可计算出变量,x y 的线性回归方程为( ) A. ˆ0.350.15y x =-+ B. ˆ0.350.25y x =-+ C. ˆ0.350.15y x =+ D. ˆ0.350.25y x =+ 二、填空题5.下列说法中正确的是 (填序号)①回归分析就是研究两个相关事件的独立性;②回归模型都是确定性的函数;③回归模型都是线性的;④回归分析的第一步是画散点图或求相关系数r ;⑤回归分析就是通过分析、判断,确定相关变量之间的内在的关系的一种统计方法. 6.三点()3,10,(7,20),(11,24)的线性回归方程是三、解答[2016高考新课标Ⅲ文数]下图是我国2008年至2014年生活垃圾无害化处理量(单位:亿吨)的折线图(I )由折线图看出,可用线性回归模型拟合y 与t 的关系,请用相关系数加以说明;(II )建立y 关于t 的回归方程(系数精确到0.01),预测2016年我国生活垃圾无害化处理量. 附注: 参考数据:719.32ii y==∑,7140.17i i i t y ==∑0.55=,7≈2.646.参考公式:相关系数r =回归方程y a b =+中斜率和截距的最小二乘估计公式分别为:121()()()nii i nii tt y y b tt ==--=-∑∑,a y bt =-【2015高考重庆,文17】随着我国经济的发展,居民的储蓄存款逐年增长.设某地区城乡居民人民币储蓄存款(年底余额)如下表:(Ⅰ)求y 关于t 的回归方程^^^t y b a =+(Ⅱ)用所求回归方程预测该地区2015年(6t =)的人民币储蓄存款. 附:回归方程^^^t yb a=+中1122211()(),().nniii ii i nniii i x x y y x y nx yb x x xnxa y bx ====⎧---⎪⎪==⎪⎨--⎪⎪=-⎪⎩∑∑∑∑8、这个世界并不是掌握在那些嘲笑者的手中,而恰恰掌握在能够经受得住嘲笑与批忍不断往前走的人手中。
线性回归分析练习题
§1回归剖析一.基本过关1.下列变量之间的关系是函数关系的是( )A.已知二次函数y=ax2+bx+c,个中a,c是已知常数,取b为自变量,因变量是这个函数的判别式Δ=b2-4acB.光照时光和果树亩产量C.降雪量和交通变乱产生率D.每亩施用肥料量和食粮产量2.在以下四个散点图中,个中实用于作线性回归的散点图为( )A.①②B.①③C.②③D.③④3.下列变量中,属于负相干的是( )A.收入增长,储蓄额增长B.产量增长,临盆费用增长C.收入增长,支出增长D.价钱降低,花费增长4.已知对一组不雅察值(x i,y i)作出散点图后肯定具有线性相干关系,若对于y =bx+a,求得b=0.51,x=61.75,y=38.14,则线性回归方程为A.yx+6.65 B.yxC.yx+42.30 D.yx5.对于回归剖析,下列说法错误的是( )A.在回归剖析中,变量间的关系若长短肯定关系,那么因变量不克不及由自变量独一肯定B.线性相干系数可所以正的,也可所以负的C.回归剖析中,假如r2=1,解释x与y之间完整相干D.样底细关系数r∈(-1,1)6.下表是x 和y 之间的一组数据,则y 关于x 的回归方程必过( )A.点B .点(1.5,4)C .点D .点(2.5,5)7.若线性回归方程中的回归系数b =0,则相干系数r =________. 二.才能晋升8.若施化肥量x (kg)与小麦产量y (kg)之间的线性回归方程为y =250+4x ,当施化肥量为50 kg 时,估计小麦产量为________ kg.9.某车间为了划定工时定额,需肯定加工零件所花费的时光,为此做了4次实验,得到的数据如下:若加工时光y (1)求加工时光与零件个数的线性回归方程; (2)试预告加工10个零件须要的时光.10.在一段时光内,分5次测得某种商品的价钱x (万元)和需求量y (t)之间的一组数据为:已知∑5i =1x i y i =62,∑i =1x 2i =16.6. (1)画出散点图;(2)求出y 对x 的线性回归方程;(3)假如价钱定为1.9万元,猜测需求量大约是若干?(准确到0.01 t). 11.某运发动练习次数与活动成绩之间的数据关系如下:(1)(2)求出回归方程;(3)盘算相干系数并进行相干性磨练;(4)试猜测该运发动练习47次及55次的成绩.答案1.7.0 8.yx 9.45010.解 (1)由表中数据,应用科学盘算器得x =2+3+4+54=3.5,y =2.5+3+4+4.54=3.5,∑4i =1x i y i =52.5,∑4i =1x 2i =54, b =∑4i =1xiyi -4x y ∑4i =1x2i -4x 2=52.5-4××3.554-4×3.52=0.7,a =y -b x =1.05,是以,所求的线性回归方程为yx +1.05.(2)将x =10代入线性回归方程,得y ×10+1.05=8.05(小时),即加工10个零件的预告时光为8.05小时. 11.解 (1)散点图如下图所示:(2)因为x =15×9=1.8,y =15×37=7.4,∑5i =1x i y i =62,∑5i =1x 2i =16.6,所以b =∑5i =1xiyi -5x y ∑5i =1x2i -5x 2=62-5××7.416.6-5×1.82=-11.5,a =y -b x ×1.8=28.1,故y 对x 的线性回归方程为yx . (3)y ×1.9=6.25(t).所以,假如价钱定为1.9万元,则需求量大约是6.25 t.12.解 (1)作出该运发动练习次数x 与成绩y 之间的散点图,如下图所示,由散点图可知,它们之间具有线性相干关系. (2)列表盘算:由上表可求得x =39.25,y =40.875, ∑8i =1x 2i =12 656,∑8i =1y 2i =13 731,∑8i =1x i y i =13 180, ∴b =∑8i =1xiyi -8x y ∑8i =1x2i -8x 2≈1.041 5,a =y -b x =-0.003 88,∴线性回归方程为y =1.041 5x -0.003 88.(3)盘算相干系数r =0.992 7,是以运发动的成绩和练习次数两个变量有较强的相干关系.(4)由上述剖析可知,我们可用线性回归方程y =1.041 5x -0.003 88作为该运发动成绩的预告值.将x =47和x =55分离代入该方程可得y =49和y =57.故猜测该运发动练习47次和55次的成绩分离为49和57. 13.解 ∵s x =lxyn ,s y =lxyn, ∴lxy n=r lxyn·lyy n ××15.2=57.76.∴β1=lxy n lxy n=57.767.62=1, β0=y -β1x =72-1×172=-100.故由身高估量平均体重的回归方程为y =x -100. 由x ,y 地位的对称性,得b =lxyn lxy n =57.7615.22=0.25,∴a =x -b y ×72=154.故由体重估量平均身高的回归方程为xy +154.可线性化的回归剖析一.基本过关1.某商品发卖量y(件)与发卖价钱x(元/件)负相干,则其线性回归方程可能是()A.y=-10x+200 B.y=10x+200C.y=-10x-200 D.y=10x-200 2.在线性回归方程y=a+bx中,回归系数b暗示()A.当x=0时,y的平均值 B.x变动一个单位时,y 的现实变动量C.y变动一个单位时,x的平均变动量 D.x变动一个单位时,y 的平均变动量3.对于指数曲线y=a e bx,令u=ln y,c=ln a,经由非线性化回归剖析之后,可以转化成的情势为()A.u=c+bx B.u=b+cx C.y=b+cx D.y=c+bx4.下列说法错误的是()A.当变量之间的相干关系不是线性相干关系时,也能直接用线性回归方程描写它们之间的相干关系B.把非线性回归化为线性回归为我们解决问题供给一种办法C.当变量之间的相干关系不是线性相干关系时,也能描写变量之间的相干关系D.当变量之间的相干关系不是线性相干关系时,可以经由过程恰当的变换使其转换为线性关系,将问题化为线性回归剖析问题来解决5.每一吨铸铁成本y c(元)与铸件废品率x%树立的回归方程y c=56+8x,下列说法准确的是 ()A.废品率每增长1%,成本每吨增长64元 B.废品率每增长1%,成本每吨增长8%C.废品率每增长1%,成本每吨增长8元 D.假如废品率增长1%,则每吨成本为56元6.为了考核两个变量x和y之间的线性相干性,甲.乙两个同窗各自自力地做10次和15次实验,并且应用线性回归办法,求得回归直线分离为l1和l2.已知在两小我的实验中发明对变量x的不雅测数据的平均值正好相等,都为s,对变量y的不雅测数据的平均值也正好相等,都为t.那么下列说法准确的是 ()A.直线l1和l2有交点(s,t)B.直线l1和l2订交,但是交点未必是点(s,t) C.直线l1和l2因为斜率相等,所以肯定平行 D.直线l1和l2肯定重合二.才能晋升7.研讨人员对10个家庭的儿童问题行动程度(X)及其母亲的不耐烦程度(Y)进行了评价成果如下,家庭1,2,3,4,5,6,7,8,9,10,儿童得分:72,40,52,87,39,95,12,64,49,46,母亲得分:79,62,53,89,81,90,10,82,78,70.下列哪个方程可以较恰当的拟合()A.y=0.771 1x+.y=36.958ln x-C.y=1.177 8x1.014 5D.y=20.924e0.019 3x8.已知x,y之间的一组数据如下表:则y与x.9.已知线性回归方程为y=x-,则x=25时,y的估量值为________.10.在一次抽样查询拜访中测得样本的5个样本点,数值如下表:(1)树立y与x(211.某地区六年来轻工业产品利润总额y 与年次x 的实验数据如下表所示:由经验知ab xe 0.个中a .b 均为正数,求y 关于x 的回归方程.(保存三位有用数字)三.探讨与拓展12.某市肆各个时代的商品流畅率y (%)和商品零售额x (万元)材料如下:散点图显示出x 都证实,流畅率y 决议于商品的零售额x ,表现着经营范围效益,假定它们之间消失关系式:y =a +bx .试依据上表数据,求出a 与b 的估量值,并估量商品零售额为30万元时的商品流畅率.答案1. 8.10.解 画出散点图如图(1)所示,不雅察可知y 与x 近似是反比例函数关系.设y =k x (k ≠0),令t =1x ,则y =kt .可得到y 关于t 的数据如下表:画出散点图如图(2),是以可应用线性回归模子进行拟合,易得: b =∑5i =1tiyi -5t y ∑5i =1t2i -5t 2≈4.134 4,a =y -b t ≈0.791 7,所以y =4.134 4t +0.791 7,所以y 与x 的回归方程是y =4.134 4x +0.791 7.11.解 对y =ab xe 0双方取对数,得ln y =ln a e 0+x ln b ,令z =ln y , 则z 与x 的数据如下表:由z =ln a e 0+a e 0≈, 即z =+0.047 7x ,所以y =×x.12.解 设u =1x,则y ≈a +bu ,得下表数据:进而可得n =10,u ≈0.060 4,y =, ∑i =110u2i -10u 2≈0.004 557 3, ∑i =110u i y i -10u y ≈0.256 35,b ≈0.256 350.004 557 3≈,a =y -b ·u ≈-0.187 5,所求的回归方程为y =-0.187 5+56.25x.当x =30时,y =1.687 5,即商品零售额为30万元时,商品流畅率为1.687 5%.。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
§1 回归分析1.1 回归分析1.2 相关系数一、基础过关1.下列变量之间的关系是函数关系的是( ) A.已知二次函数y=ax2+bx+c,其中a,c是已知常数,取b为自变量,因变量是这个函数的判别式Δ=b2-4acB.光照时间和果树亩产量C.降雪量和交通事故发生率D.每亩施用肥料量和粮食产量2.在以下四个散点图中,其中适用于作线性回归的散点图为( )A.①②B.①③C.②③D.③④3.下列变量中,属于负相关的是( ) A.收入增加,储蓄额增加B.产量增加,生产费用增加C.收入增加,支出增加D.价格下降,消费增加4.已知对一组观察值(x i,y i)作出散点图后确定具有线性相关关系,若对于y=bx+a,求得b=0.51,x=61.75,y=38.14,则线性回归方程为( )A.y=0.51x+6.65 B.y=6.65x+0.51C.y=0.51x+42.30 D.y=42.30x+0.515.对于回归分析,下列说法错误的是( ) A.在回归分析中,变量间的关系若是非确定关系,那么因变量不能由自变量唯一确定B.线性相关系数可以是正的,也可以是负的C.回归分析中,如果r2=1,说明x与y之间完全相关D.样本相关系数r∈(-1,1)6.下表是x和y之间的一组数据,则y关于x的回归方程必过( )A.点(2,3) BC.点(2.5,4) D.点(2.5,5)7.若线性回归方程中的回归系数b=0,则相关系数r=________.二、能力提升8.某医院用光电比色计检验尿汞时,得尿汞含量(mg/L)与消光系数计数的结果如下:若y与x9.若施化肥量x(kg)与小麦产量y(kg)之间的线性回归方程为y=250+4x,当施化肥量为50 kg时,预计小麦产量为________ kg.10.某车间为了规定工时定额,需确定加工零件所花费的时间,为此做了4次试验,得到的数据如下:若加工时间y与零件个数x之间有较好的相关关系.(1)求加工时间与零件个数的线性回归方程;(2)试预报加工10个零件需要的时间.11.在一段时间内,分5次测得某种商品的价格x(万元)和需求量y(t)之间的一组数据为:已知∑5i=1x i y i=62,∑5i=1x2i=16.6.(1)画出散点图;(2)求出y对x的线性回归方程;(3)如果价格定为1.9万元,预测需求量大约是多少?(精确到0.01 t).12.某运动员训练次数与运动成绩之间的数据关系如下:(1)作出散点图;(2)求出回归方程;(3)计算相关系数并进行相关性检验;(4)试预测该运动员训练47次及55次的成绩.三、探究与拓展13.从某地成年男子中随机抽取n个人,测得平均身高为x=172 cm,标准差为s x=7.6 cm,平均体重y=72 kg,标准差s y=15.2 kg,相关系数r=l xyl xx l yy=0.5,求由身高估计平均体重的回归方程y=β0+β1x,以及由体重估计平均身高的回归方程x=a+by.答案1.A 2.B 3.D 4.A 5.D 6.C 7.0 8.y =-11.3+36.95x 9.45010.解 (1)由表中数据,利用科学计算器得x =2+3+4+54=3.5,y =2.5+3+4+4.54=3.5,∑4i =1x i y i =52.5,∑4i =1x 2i =54, b =∑4i =1x i y i -4x y∑4i =1x 2i -4x2=52.5-4×3.5×3.554-4×3.52=0.7,a =y -b x =1.05,因此,所求的线性回归方程为y =0.7x +1.05.(2)将x =10代入线性回归方程,得y =0.7×10+1.05=8.05(小时),即加工10个零件的预报时间为8.05小时.11.解 (1)散点图如下图所示:(2)因为x =15×9=1.8,y =15×37=7.4,∑5i =1x i y i =62,∑5i =1x 2i =16.6,所以b =∑5i =1x i y i -5x y ∑5i =1x 2i -5x 2=62-5×1.8×7.416.6-5×1.82=-11.5, a =y -b x =7.4+11.5×1.8=28.1,故y 对x 的线性回归方程为y =28.1-11.5x . (3)y =28.1-11.5×1.9=6.25(t).所以,如果价格定为1.9万元,则需求量大约是6.25 t.12.解 (1)作出该运动员训练次数x 与成绩y 之间的散点图,如下图所示,由散点图可知,它们之间具有线性相关关系.(2)列表计算:次数x i 成绩y i x 2iy 2ix i y i30 30 900 900 900 33 34 1 089 1 156 1 122 35 37 1 225 1 369 1 295 37 39 1 369 1 521 1 443 39 42 1 521 1 764 1 638 44 46 1 936 2 116 2 024 46 48 2 116 2 304 2 208 50512 5002 6012 550由上表可求得x =39.25,y =40.875, ∑8i =1x 2i =12 656,∑8i =1y 2i =13 731,∑8i =1x i y i =13 180, ∴b =∑8i =1x i y i -8x y ∑8i =1x 2i -8x 2≈1.041 5,a =y -b x =-0.003 88,∴线性回归方程为y =1.041 5x -0.003 88.(3)计算相关系数r =0.992 7,因此运动员的成绩和训练次数两个变量有较强的相关关系. (4)由上述分析可知,我们可用线性回归方程y =1.041 5x -0.003 88作为该运动员成绩的预报值. 将x =47和x =55分别代入该方程可得y =49和y =57.故预测该运动员训练47次和55次的成绩分别为49和57. 13.解 ∵s x =l xy n,s y =l xy n,∴l xy n=rl xy n·l yyn =0.5×7.6×15.2=57.76.∴β1=l xyn l xy n=57.767.62=1, β0=y -β1x =72-1×172=-100.故由身高估计平均体重的回归方程为y =x -100.由x ,y 位置的对称性,得b =l xyn l xy n=57.7615.22=0.25,∴a =x -b y =172-0.25×72=154.故由体重估计平均身高的回归方程为x =0.25y +154.1.3 可线性化的回归分析一、基础过关1.某商品销售量y(件)与销售价格x(元/件)负相关,则其线性回归方程可能是( ) A.y=-10x+200 B.y=10x+200 C.y=-10x-200 D.y=10x-200 2.在线性回归方程y=a+bx中,回归系数b表示( ) A.当x=0时,y的平均值B.x变动一个单位时,y的实际变动量C.y变动一个单位时,x的平均变动量D.x变动一个单位时,y的平均变动量3.对于指数曲线y=a e bx,令u=ln y,c=ln a,经过非线性化回归分析之后,可以转化成的形式为( )A.u=c+bx B.u=b+cx C.y=b+cx D.y=c+bx4.下列说法错误的是( )A.当变量之间的相关关系不是线性相关关系时,也能直接用线性回归方程描述它们之间的相关关系B.把非线性回归化为线性回归为我们解决问题提供一种方法C.当变量之间的相关关系不是线性相关关系时,也能描述变量之间的相关关系D.当变量之间的相关关系不是线性相关关系时,可以通过适当的变换使其转换为线性关系,将问题化为线性回归分析问题来解决5.每一吨铸铁成本y c(元)与铸件废品率x%建立的回归方程y c=56+8x,下列说法正确的是( ) A.废品率每增加1%,成本每吨增加64元B.废品率每增加1%,成本每吨增加8%C.废品率每增加1%,成本每吨增加8元D.如果废品率增加1%,则每吨成本为56元6.为了考察两个变量x和y之间的线性相关性,甲、乙两个同学各自独立地做10次和15次试验,并且利用线性回归方法,求得回归直线分别为l1和l2.已知在两个人的试验中发现对变量x的观测数据的平均值恰好相等,都为s,对变量y的观测数据的平均值也恰好相等,都为t.那么下列说法正确的是( ) A.直线l1和l2有交点(s,t) B.直线l1和l2相交,但是交点未必是点(s,t)C.直线l1和l2由于斜率相等,所以必定平行D.直线l1和l2必定重合二、能力提升7.研究人员对10个家庭的儿童问题行为程度(X)及其母亲的不耐心程度(Y)进行了评价结果如下,家庭1,2,3,4,5,6,7,8,9,10,儿童得分:72,40,52,87,39,95,12,64,49,46,母亲得分:79,62,53,89,81,90,10,82,78,70.下列哪个方程可以较恰当的拟合( )A.y=0.771 1x+26.528 B.y=36.958ln x-74.604C.y=1.177 8x1.014 5 D.y=20.924e0.019 3x8.已知x,y之间的一组数据如下表:则y与x9.已知线性回归方程为y=0.50x-0.81,则x=25时,y的估计值为________.10.在一次抽样调查中测得样本的5个样本点,数值如下表:(1)建立y与xx 时,y大约是多少(2)当811.某地区六年来轻工业产品利润总额y与年次x的试验数据如下表所示:0y关于x的回归方程.(保留三位有效数字)三、探究与拓展12.某商店各个时期的商品流通率y (%)和商品零售额x (万元)资料如下:散点图显示出x 与y y 决定于商品的零售额x ,体现着经营规模效益,假定它们之间存在关系式:y =a +b x.试根据上表数据,求出a 与b的估计值,并估计商品零售额为30万元时的商品流通率.答案1.A 2.D 3.A 4.A 5.C 6.A 7.B 8.(1.16,2.4) 9.11.6910.解 画出散点图如图(1)所示,观察可知y 与x 近似是反比例函数关系.设y =k x(k ≠0),令t =1x,则y =kt .可得到y 关于t 的数据如下表:t 4 2 1 0.5 0.25 y1612521画出散点图如图(2)得:b =∑5i =1t i y i -5t y∑5i =1t 2i -5t2≈4.134 4,a =y -b t ≈0.791 7,所以y =4.134 4t +0.791 7,所以y 与x 的回归方程是y =4.134 4x+0.791 7.。