第十二章 简单回归分析
第12章-多重线性回归分析
6 因变量总变异的分解
P
(X,Y)
Y
(Y Y) (Y Y)
(Y Y)
Y X
Y
Y
9
Y的总变异分解
Y Y Yˆ Y Y Yˆ
Y Y 2 Yˆ Y 2 Y Yˆ 2
总变异 SS总
回归平方和 剩余平方和
SS回
SS剩
10
Y的总变异分解
病程 (X2)
10.0 3.0 15.0 3.0 4.0 6.0 2.9 9.0 5.0 2.0 8.0 20.0
表 12-1 脂联素水平与相关因素的测量数据
空腹
回归模空型腹 ?
瘦素
脂联 BMI 病程 瘦素
脂联
(X3)
血糖 (X4)
素(Y)
(X1)
(X2)
(X3)
血糖 素(Y) (X4)
5.75 13.6 29.36 21.11 9.0 4.90 6.0 17.28
H 0: 1 2 3 4 0 ,即总体中各偏回归系数均为0; H 1:总体中各偏回归系数不为0或不全为0;
= 0.05。
2 计算检验统计量: 3 确定P值,作出推断结论。
拒绝H0,说明从整体上而言,用这四个自变量构成 的回归方程解释糖尿病患者体内脂联素的变化是有统 计学意义的。
的平方和 (Y Yˆ)2为最小。
只有一个自变量
两个自变量
例12-1 为了研究有关糖尿病患者体内脂联素水平的影响因 素,某医师测定30例患者的BMI、病程、瘦素、空腹血糖, 数据如表12-1所示。
BMI (X1)
24.22 24.22 19.03 23.39 19.49 24.38 19.03 21.11 23.32 24.34 23.82 22.86
简单回归分析
一、线性回归分析若是自变数与依变数都是一个,且Y 和X 呈线性关系,这就称为一元线性回归。
例如,以X 表示小麦每667m 2有效穗数,Y 表示小麦每667m 2的产量,有效穗数即属于自变数,产量即属于依变数。
在这种情形下,可求出产量依有效穗数而变更的线性回归方程。
在另一种情形下,两类变数是平行关系很难分出哪个是自变数,哪个是依变数。
例如,大豆脂肪含量与蛋白质含量的关系,依照需要确信求脂肪含量依蛋白质含量而变更的回归方程,或求蛋白质含量依脂肪含量而变更的回归方程。
回归分析要解决的问题要紧有四个方面:一是依如实验观看值成立适当的回归方程;二是查验回归方程是不是适用,或对回归方程中的回归系数的进行估量;三是对未知参数进行假设考试;四是利用成立起的方程进行预测和操纵。
(一)成立线性回归方程用来归纳两类变数互变关系的线性方程称为线性回归方程。
若是两个变数在散点图上呈线性,其数量关系可能用一个线性方程来表示。
这一方程的通式为:上式叫做y 依x 的直线回归。
其中x 是自变数,y ˆ是依变数y 的估量值,a 是x =0时的y ˆ值,即回归直线在y 轴上的截距,称为回归截距,b 是x 每增加一个单位时,y 将平均地增加(b >0时)或减少(b <0时) b 个单位数,称为回归系数或斜率(regression coefficient or slope )。
要使 能够最好地代表Y 和X 在数量上的互变关系,依照最小平方式原理,必需使将Q 看成两个变数a 与b 的函数,应该选择a 与b ,使Q 取得最小值,必需求Q 对a ,b 的一阶偏导数,且令其等于零,即得:()()⎩⎨⎧∑=∑+∑∑=∑+212xyx b x a yx b an ()()∑∑=--=-=nn Q bx a y yy Q 1min212ˆbx a y +=ˆ()1.7ˆbx a y+=由上述(1)解得:将()代入(2),那么得:()的分子 是x 的离均差与y 的离均差乘积总和,简称乘积和(sum of products ),可记为SP ,分母是x 的离均差平方和,也可记为SS x 。
第12章简单回归分析2
假设检验
例: 用上例资料检验脐带血TSH水平对母血TSH水 平的直线关系是否成立?
Ho:β=0 即母血TSH水平与脐带血TSH水平之间 无线性关系
H1:β≠0 即母血TSH水平与脐带血TSH水平之间有 线性关系
α =0.05
方差分析表
已知 υ1=1, υ2=8,查F界值表,得P<0.05,按 α=0.05水准拒绝Ho,接受H1,故可以认为脐带血 TSH水平与母血TSH水平之间有线性关系
残差(residual)或剩余值,即实测值Y与假定回
归线上的估计值 Y ˆ 的纵向距离 Y Yˆ。
求解a、b实际上就是“合理地”找到一条能最好
地代表数据点分布趋势的直线。
原则:最小二乘法(least sum of squares),即可 保证各实测点至直线的纵向距离的平方和最小。
最小二乘法
两部分构成,即:
(yy)(y ˆy)+(yy ˆ)
上式两端平方,然后对所有的n点求和,则有
(yy)2 [(y ˆy)+(yy ˆ)2 ]
离差平方和的分解
(三个平方和的关系)
1. 从图上看有
y y y y ˆ+ y ˆ y
2. 两端平方后求和有
n
求X,Y,l XX,lYY,l XY X 15.79 8 2.00,Y 249.01 8 31.13
lXX 47.0315.972 8 15.15 lYY 8468.78 249.012 8 718.03
lXY 594.4815.97249.01 8 97.39
另一次抽样研究 50岁年龄组舒张压得总体均数估
第十二章 分层回归分析--Hierarchy Regression
分层回归其实是对两个或多个回归模型进行比较。
我们可以根据两个模型所解释的变异量的差异来比较所建立的两个模型。
一个模型解释了越多的变异,则它对数据的拟合就越好。
假如在其他条件相等的情况下,一个模型比另一个模型解释了更多的变异,则这个模型是一个更好的模型。
两个模型所解释的变异量之间的差异可以用统计显著性来估计和检验。
模型比较可以用来评估个体预测变量。
检验一个预测变量是否显著的方法是比较两个模型,其中第一个模型不包括这个预测变量,而第二个模型包括该变量。
假如该预测变量解释了显著的额外变异,那第二个模型就显著地解释了比第一个模型更多的变异。
这种观点简单而有力。
但是,要理解这种分析,你必须理解该预测变量所解释的独特变异和总体变异之间的差异。
一个预测变量所解释的总体变异是该预测变量和结果变量之间相关的平方。
它包括该预测变量和结果变量之间的所有关系。
预测变量的独特变异是指在控制了其他变量以后,预测变量对结果变量的影响。
这样,预测变量的独特变异依赖于其他预测变量。
在标准多重回归分析中,可以对独特变异进行检验,每个预测变量的回归系数大小依赖于模型中的其他预测变量。
在标准多重回归分析中,回归系数用来检验每个预测变量所解释的独特变异。
这个独特变异就是偏相关的平方(Squared semi-partial correlation)-sr2(偏确定系数)。
它表示了结果变量中由特定预测变量所单独解释的变异。
正如我们看到的,它依赖于模型中的其他变量。
假如预测变量之间存在重叠,那么它们共有的变异就会削弱独特变异。
预测变量的独特效应指的是去除重叠效应后该预测变量与结果变量的相关。
这样,某个预测变量的特定效应就依赖于模型中的其他预测变量。
标准多重回归的局限性在于不能将重叠(共同)变异归因于模型中的任何一个预测变量。
这就意味着模型中所有预测变量的偏决定系数之和要小于整个模型的决定系数(R2)。
总决定系数包括偏决定系数之和与共同变异。
简单回归分析(2)
16.153114.881 11.4 54 771
t6.142219.2584 14 212
4.881
查t界值表,t 0.001(12) =4.318,所以p<0.001,拒 绝H0,可以认为体重与基础代谢之间存在线 性回归关系
h
18
3、总体回归系数的可信区间
利用上述对回归系数的t检验,可以得到β的1α双侧可信区间为
b (x (xx )(xy) 2 y)
703.023329 114.54771
61.4229
aYbX632.93 6 2.1 42 2797.27
14
14
11.0 76 864
得到的回归方程为:
Y ˆ11.7086 6.4 4 12X 29
h
10
四、线性回归方程的假设检验
需要检验总体回归方程是否成立!
3500
线性回归直线
3000
30
35
40
45
50
55
60
65
70
75
体重
图 14名中年健康妇女的基础代谢与体重的散点图
h
4
线性回归分析:用一条直线(即直线方程)来描 述两个变量间依存变化的数量关系,得出的直 线方程称为线性回归方程。
线性回归方程的一般表达式:
Yˆ abX
a:截距(intercept),直线与Y轴交点的纵坐标 b:斜率(slope),回归系数(regression coefficient)
h
6
7
8
根据求极值方法可得到a、b的值
b (X ( X X )X Y ) ( 2 Y ) X X 2 Y X X 2 Y /n /n l lX XX Y
[医学]卫生统计学 第六版第12章简单回归分析
14名中年健康妇女基础代谢与体重测量值的关系
基础代谢( Kj/d)
min (Yi Yi )2
6000 5500 5000 4500 4000 3500 3000
35 40 45 50 55 60 65 70 75 体重(kg)
14名中年健康妇女的基础代谢与体重测量值的关系
2. 回归参数估计的最小二乘(LSE)原则:
5
47.8
3987.4
2284.84 15899358.76 190597.72
6
62.8
4970.6
3943.84 24706864.36 312153.68
7
67.3
5359.7
4529.29 28726384.09 360707.81
8
48.6
3970.6
2361.96 15765664.36 192971.16
9
44.6
3983.2
10
58.6
5050.1
11
71.0
5355.5
12
59.7
4560.6
13
62.1
4874.4
14
61.5
5029.2
合计
777.2
63232.9
基础代谢 ((Kj/d)
(1) 由样本数据绘制散点图:
6000 5500 5000 4500 4000 3500 3000
35 40 45 50 55 60 65 70 75
60岁的健3康妇女,测得37.1每人的基础代谢34(6k0j.2/d)与体重的
4
51.7
4020.8
Байду номын сангаас
数据,见5表11-1。据此47数.8 据如何判断这3两987项.4 指标间有无
第12章 回归分析 ppt课件
回归分析中的显著性检验包括两方面的内容:
一是对单个自变量回归系数的显著性检验( t检 验);
二是对整个回归方程(所有自变量回归系数) 显著性的整体检验( F检验)
在一元线性回归模型中,由于只有一个解释 变量X,因此,对β1=0的t检验与对整个方 程的F检验是等价的。
PPT课件
51
一、单个回归系数显著性的t检验
量非线性相关关系的强弱和多变量时的相
关。因此,测定系数的应用范围比相关系
数更广泛。
PPT课件
46
第四节 模型假定
在进行回归分析时,为了建立适当 的模型来说明因变量和自变量之间的关 系,需要做出一些假定。
简单线性回归的假定模型是:
y 0 1x
PPT课件
47
要确定假定模型是否恰当,就需要进 行显著性检验。
b1
xi yi x y
x2
2
nx
b1
n
n
xi yi x2
xi yi x2
12.7a 12.7b
b0 y b1 x (12.8)
PPT课件
23
PPT课件
24
b1
n
xi yi n x2
xi yi x2
PPT课件
30
离差分解图
y
(xi , yi )
{ } y yˆ
yy
}yˆ y
yˆ ˆ0 ˆ1x
y
离差分解图
PPT课件
x
31
离差平方和的分解
y y ( yˆ y) ( y yˆ) (12.9)
两端平方后求和有
yi y2 yˆi y2 yi yˆ 2 (12.10)
(完整版)第十二章相关和回归分析练习试题
第十二章相关与回归分析一、填空1. 如果两变量的相关系数为0,说明这两变量之间__ 。
2.相关关系按方向不同,可分为_____ 和________ 。
3. 相关关系按相关变量的多少,分为和复相关。
4.在数量上表现为现象依存关系的两个变量,通常称为自变量和因变量。
自变量是作为(变化根据)的变量,因变量是随(自变量)的变化而发生相应变化的变量。
5.对于表现为因果关系的相关关系来说,自变量一般都是确定性变量,因变量则一般是(随机性)变量。
6.变量间的相关程度,可以用不知Y与 X有关系时预测 Y的全部误差 E1,减去知道 Y与 X有关系时预测Y的联系误差E2,再将其化为比例来度量,这就是(削减误差比例)。
7.依据数理统计原理,在样本容量较大的情况下,可以作出以下两个1)实际观察值 Y 围绕每个估计值 Y c是服假定:从();(2)分布中围绕每个可能的 Y c 值的()是相同的。
7. 已知:工资(元)倚劳动生产率(千元)的回归方程为yc 10 80x,因此,当劳动生产率每增长 1 千元,工资就平均增加 80 元。
8.根据资料,分析现象之间是否存在相关关系,其表现形式或类型如何,并对具有相关关系的现象之间数量变化的议案关系进行测定,即建立一个相关的数学表达式,称为(回归方程),并据以进行估计和预测。
这种分析方法,通常又称为(回归分析)。
9.积差系数 r 是(协方差)与 X 和 Y 的标准差的乘积之比。
二、单项选择1.欲以图形显示两变量 X 和 Y 的关系,最好创建( D )。
A 直方图 B 圆形图 C 柱形图 D 散点图2.在相关分析中,对两个变量的要求是(A )。
A 都是随机变量B 都不是随机变量C 其中一个是随机变量,一个是常数D 都是常数3.相关关系的种类按其涉及变量多少可分为()。
A. 正相关和负相关B. 单相关和复相关C. 线性相关和非线性相关D. 不相关、不完全相关、完全相关4.关于相关系数,下面不正确的描述是(B )。
简单回归分析及其应用
简单回归分析及其应用简单回归分析是一种常用的统计分析方法,用于研究两个变量之间的关系。
在本文中,将深入探讨简单回归分析的基本原理和应用场景,以帮助读者更好地理解和运用该方法。
一、简单回归分析的基本原理简单回归分析基于线性回归模型,假设两个变量之间存在线性关系。
其数学表达式可以表示为:Y = β₀ + β₁X + ε其中,Y表示因变量,X表示自变量,β₀和β₁是回归系数,ε是误差项。
简单回归分析的目标是通过拟合回归方程,找到最佳的回归系数,从而预测因变量Y的取值。
二、简单回归分析的应用场景简单回归分析可以应用于各种实际问题中,以下列举几个常见的应用场景。
1. 市场营销分析在市场营销领域,可以使用简单回归分析来研究广告投入和销售额之间的关系。
通过对历史数据的回归分析,可以预测在不同广告投入下的销售额,为市场营销决策提供依据。
2. 经济增长预测简单回归分析可以应用于经济领域,用于预测某一指标(如GDP)与其他因素(如人口增长率、投资额等)之间的关系。
通过建立回归模型,可以预测未来的经济增长趋势,为政府制定经济政策提供参考。
3. 教育评估在教育领域,可以使用简单回归分析来研究学生的学习成绩与其他因素(如家庭背景、学习时间等)之间的关系。
这有助于了解不同因素对学生成绩的影响程度,为制定教育改革方案提供依据。
4. 金融风险管理简单回归分析在金融领域也有广泛应用。
例如,可以使用该方法来研究股票收益率与市场指数之间的关系,以评估投资组合的风险。
同时,还可以利用简单回归分析来预测债券收益率与利率之间的关系,为债券投资决策提供参考。
三、简单回归分析的步骤进行简单回归分析通常需要以下步骤:1. 数据收集收集相关的自变量和因变量的数据。
确保数据的准确性和完整性。
2. 拟合回归方程根据收集到的数据,使用回归模型进行参数估计,得到最佳的回归系数。
3. 检验模型拟合度通过计算拟合优度等指标,评估回归模型的拟合程度。
常用的指标包括R方值、均方误差等。
简单回归分析
Simple linear regression analysis
本章内容
第一节 简单线性回归 第二节 线性回归的应用
第一节 简单线性回归
双变量计量资料:每个个体有两个变量值
总体:无限或有限对变量值
样本:从总体随机抽取的n对变量值 (X1,Y1), (X2,Y2), …, (Xn,Yn) 目的:研究X和Y的数量关系 方法:回归与相关
XY
46.02 33.11 27.81 14.88 33.60
232.61 76 23.87 / 8 764 762 / 8 5.8450 0.1392 42
X SX / n 76 / 8 9.5
20.48 Y SY / n 23.87 / 8 2.9838
线性回归的概念及其统计描述
直线回归的概念
目的:研究应变量Y对自变量X的数量依 存关系。 特点:统计关系。 X值和Y的均数的关系, 不同于一般数学上的X 和Y的函数关系
回归
回归描述的是通过自变量的数值反应因变量的平均水 平。因此可以通过可测或易测的变量估计难测或不 可测变量的状态。
例如:通过体重估计体表面积; 通过身高、体重、肺活量估计心室血输出 量、体循环总血量; 本章只涉及一个自变量的回归问题
b
SXY SX SY / n l XY 2 l XX SX 2 SX / n
编号 1 2 3 4 5 6
年龄X 肌酐Y
13 11 9 6 8 10 3.54 3.01 3.09 2.48 2.56 3.36
X2
169 121 81 36 64 100
Y2
12.53 9.06 9.55 6.15 6.55 11.29
第十二章 简单回归分析
第十二章简单回归分析选择题A1型每一道题下面有A、B、C、D、E五个备选答案,请从中选择一个最佳答案。
1、线性回归分析可用于下列()的依存关系的研究A、性别与身高B、年龄与体重C、职业与工龄D、民族语血型E、国籍与智商2、对变量X和Y同时进行线性相关分析和线性回归分析,其结果一定是()A、r>0,b<0B、r<0,b>0C、r b≥0D、r=bE、r与b的符号无关3、已知相关系数r=1,则一定有()A、SS总=SS残B、SS总=SS回C、SS残=SS回D、a=1E、b=14、线性回归分析中,对总体回归系数B是否为0做t检验,其自由度是()A、nB、n-1C、n-2D、2n-1E、2n-25、如果对线性回归模型进行假设检验,结果是没能拒绝H0,这就意味着()A、该模型有应用价值B、该模型无应用价值C、该模型求解错误D、X与Y之间无关系E、尚无充分证据说明X与Y之间有线性关系6、求得X与Y的线性回归方程后,对回归系数作假设检验的目的是:对()作出统计推断A、样本截距B、总体截距C、样本斜率D、总体斜率E、决定系数7、在求出Y关于X变化的线性回归方程后发现,将原始数据中的某一点(X k,Y k)的横坐标值X k代入方程所得的Y k≠Y k,则可以认为()A此现象正常B、此现象无法解释C、计算有错误D、X与Y之间呈非线性关系E、X与Y之间呈线性关系8、对含有两个随机变量的同一批资料,既作线性相关,有作线性回归分析。
对相关系数检验的t值记为t r,对回归系数检验的t值记为t b,则二者之间的关系是()A、t r>t bB、t r<t bC、t r≥t bD、t r≤t bE、t r=t b9、对以X为自变量,Y为因变量作线性回归分析时,下列正确的说法是()A、只要求X服从正态分布B、只要求Y服从正态分布C、只要求X与Y是定量变量D、要求X与Y都服从正态分布E、要求X与Y服从双变量正态分布10、利用最小二乘原则确定回归方程的要求是:使得各数据点()A、距回归直线纵向距离的平方和最小B、距回归直线横向距离的平方和最小C、距回归直线距离的平方和最小D、距回归直线垂直距离的平方和最小E、距回归直线平行距离的平方和最小11、线性回归分析中,当()时,回归方程拟合的效果越佳A、截距越大B、斜率越大C、回归系数越大D、相关系数越大E、决定系数越大12、线性回归分析中,若对总体回归系数B是否为0作方差分析,得到F>F a(v1,v2),则可认为()A、两变量之间存在回归关系B、两变量之间不存在回归关系C、两变量之间存在线性回归关系D、两变量之间不存在线性回归关系E、两变量之间存在因果关系【参考答案】(一)1、B 2、C 3、B 4、C 5、E 6、D 7、A 8、E 9、D 10、A 11、E 12、C。
12 简单回归分析
t Value 30.17 14.58
Pr > |t| <.0001 <.0001
以y为应变量、x1为自变量的回归分析结果: The REG Procedure Model: MODEL1 Dependent Variable: y Analysis of Variance Sum of Mean DF Squares Square 1 432.56864 432.56864 48 67.00397 1.39592 49 499.57261 1.18149 23.97720 4.92755 R-Square Adj R-Sq 0.8659 0.8631
第十二章 简单回归分析 [教学要求] 了解: 总体回归线的 95%置信带与个体预测值 Y 的区间估计; 可线性化的非线性回归的基 本步骤。 熟悉:总体回归系数 β 的统计推断;残差与残差分析。 掌握:回归分析的基本思想与方法;回归的基本概念;回归系数检验的意义与方法;相关 与回归分析的区别与联系。 [重点难点] 第一节 简单线性回归 一、回归模型的前提假设:线性(linear)、独立(independent)、正态(normal)与等方差(equal variance)。 二、最小二乘原则:求解回归方程中参数估计量 a 和 b 值所遵循的策略:使回归残差平方 和达到最小;在最小二乘原则下所获得回归参数的估计量称为最小二乘估计。 三、总体回归系数 β 的统计推断 (一) 标准估计误差(standard error of estimate) 为回归方程所得估计值的标准 离差,
16. 5
16. 0
15. 5
15. 0
14. 5
14. 0
13. 5
13. 0 0. 6 0. 7 0. 8 0. 9 x 1. 0 1. 1 1. 2
第12章 简单回归分析
II型回归
基础代谢 (KJ/day)
5800 5300 4800 4300 3800 3300 2800 30 35 40 45 50 55 60 65 70 75
体重 (kg)
图12-1 14例中老年健康妇女的基础代谢与体重的回归直线
I型回归
表12-1 不同IgG浓度下的沉淀环直径数据
IgG浓度(IU/ml ) X 沉淀环直径(mm ) Y
SYˆ SY X
p
1 n
( X p X )2 l XX
(12-15)
Y | X 的(1- )置信区间为
p
ˆ t Y ˆ p / 2, n 2 SY
(12-16)
p
SYˆ SY X
1
1 ( X1 X )2 1 (50.7 55.5143 ) 2 165 .1311 49.9991 n l XX 14 1144 .5771
线性回归模型(linear regression model):
Y | X X
:截距(intercept)
β:斜率(slope),又称回归系数 (regression coefficient)
样本线性回归方程(regression equation) :
ˆ a bX Y
第十二章
简单回归分析
郝元涛 2008.11.04
引言:
身高与体重存在相关(相关关系)
可否通过身高预测体重的平均水平?
新生儿的体重与体表面积存在相关
可否通过体重预测体表面积?(依存关系)
线性回归(linear regression),又称简单回归
(simple regression),
12h第十二章简单回归分析
总体回归系数 的可信区间
利用上述对回归系数的t检验,可以 得到β的1-α双侧可信区间为
bt,n2Sb
本 例 b=-6.9802, 自 由 度 =13 , t0.05,13=2.16,Sb=0.78655, 代入公式 (12-7)得参数β的95%置信区间为
6.980 2.12 60.78655
儿子身高(Y,英寸)与父亲身高(X, 英寸)存在线性关
系:Y ˆ33.730.516X 。
也即高个子父代的子代在成年之后的身高平均来 说不是更高,而是稍矮于其父代水平,而矮个子父代的子 代的平均身高不是更矮,而是稍高于其父代水平。Galton 将这种趋向于种族稳定的现象称之“回归”
“回归”已成为表示变量之间某种数量依 存关系的统计学术语,相关并且衍生出“回归 方程”“回归系数”等统计学概念。如研究 糖尿病人血糖与其胰岛素水平的关系,研究 儿童年龄与体重的关系等。
线性回归的概念及其统计描述
直线回归的概念
目的:研究应变量Y对自变量X的数量依 存关系。
特点:统计关系。 X值和Y的均数的关系, 不同于一般数学上的X 和Y的函数关系
为了直观地说明直线回归的概念,以15
名健康人凝血酶浓度(X)与凝血时间(Y)
数据(表12-1)进行回归分析,得到图 12-1所示散点图(scatter plot)
SS回 即(Yˆ Y)2 ,为回归平方和。由于特定样本的
均数Y Y 是固定的,所以这部分变异由Yˆi 的大小不同引起。
当 X 被引入回归以后,正是由于Xi 的不同导致了 Yˆi a bXi 不同,所以SS回 反映了在 Y 的总变异中可以用 X 与 Y 的直线关系解释的那部分变异。
b 离 0 越远,X 对 Y 的影响越大,SS回 就越大,说明 回归效果越好。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第十二章简单回归分析习题
一、是非题
1.直线回归反映两变量间的依存关系,而直线相关反映两变量间的相互线性伴随变化关系.
2.对同一组资料,如相关分析算出的r越大,则回归分析算出的b值也越大. 3.对同一组资料,对r与b分别作假设检验,可得t r=t b
4.利用直线回归估计X值所对应的Y值的均数置信区间时,增大残差标准差可以减小区间长度.
5.如果直线相关系数r=0,则直线回归的SS残差必等于0.
二、选择题
1. 用最小二乘法确定直线回归方程的原则是各观察点距直线的( ).
A.纵向距离之和最小 B. 纵向距离的平方和最小
C. 垂直距离之和最小D.垂直距离的平方和最小
E.纵向距离的平方和最大
2.Y=14十4X是1~7岁儿童以年龄(岁)估计体质量(市斤)的回归方程,若体质量换成位kg,则此方程( )
A 截距改变
B 回归系数改变
C 两者都改变
D 两者都不改变
E.相关系数改变
4.直线回归系数假设检验,其自由度为( )
A.n B. n-1
C.n-2 D. 2n-1
E.2(n-1)
5.当r=0时,Y=a+b X回归方程中( )
A a必大于零
B a必大于X
C a必等于零
D a必大于Y
E a必等于b
6.在多元线性回归分析中,反应变量总离均差平方和可以分解为两部分,残差是指( ).
A.观察值与估计值之差B.观察值与平均值之差
C.估计值与平均值的平方和之差D.观察值与平均值之差的平方和E.观察值与估计值之差的平方和
三、筒答题
1.用什么方法考察回归直线是否正确?
2.简述回归系数方差分析Y的平方和与自由度的分解.
3. 举例说明如何用直线回归方程进行预测和控制?
4. 直线回归分析时怎样确定自变量和因变量?
5. 简述曲线回归常用的几种曲线形式.。