数理统计课程设计(一元线性回归)剖析
一元线性回归分析报告
实验报告金融系金融学专业级班实验人:实验地点:实验日期:实验题目:进行相应的分析,揭示某地区住宅建筑面积与建造单位成本间的关系实验目的:掌握最小二乘法的基本方法,熟练运用Eviews软件的一元线性回归的操作,并能够对结果进行相应的分析。
实验内容:实验采用了建筑地编号为1号至12号的数据,通过模型设计、估计参数、检验统计量、回归预测四个步骤对数据进行相关分析。
实验步骤:一、模型设定1.建立工作文件。
双击eviews,点击File/New/Workfile,在出现的对话框中选择数据频率,因为该例题中为截面数据,所以选择unstructured/undated,在observations中设定变量个数,这里输入12。
图12.输入数据。
在eviews 命令框中输入data X Y,回车出现group窗口数据编辑框,在对应的X,Y下输入数据,这里我们可以直接将excel中被蓝笔选中的部分用cirl+c复制,在窗口数据编辑框中1所对应的框中用cirl+v粘贴数据。
图23.作X与Y的相关图形。
为了初步分析建筑面积(X)与建造单位成本(Y)的关系,可以作以X为横坐标、以Y为纵坐标的散点图。
方法是同时选中工作文件中的对象X和Y,双击得X和Y的数据表,点View/Graph/scatter,在File lines中选择Regressions line/ok(其中Regressions line为趋势线)。
得到如图3所示的散点图。
图3 散点图从散点图可以看出建造单位成本随着建筑面积的增加而降低,近似于线性关系,为分析建造单位成本随建筑面积变动的数量规律性,可以考虑建立如下的简单线性回归模型:二、估计参数假定所建模型及其中的随机扰动项满足各项古典假定,可以用OLS法估计其参数。
Eviews软件估计参数的方法如下:在eviews命令框中键入LS Y C X,按回车,即出现回归结果。
Eviews的回归结果如图4所示。
图4 回归结果可用规范的形式将参数估计和检验结果写为:(19.2645)(4.8098)t=(95.7969)(-13.3443)0.9468 F=178.0715 n=12若要显示回归结果的图形,在equation框中,点击resids,即出现剩余项、实际值、拟合值的图形,如图5所示。
数理统计回归分析
yˆ bˆ0 bˆ1x1 bˆp x p (7)
同理,(7)式是否真正描述了 y 与 x1, x2 ,, x p 的客观存在的关系还需进一步检验
yˆ y bˆ(x x) (11)
(11)式给出了最小二乘估计的几何意义.当给定 样本观察值 (x1, y1 ), (x2 , y2 ),, (xn , yn ) 后,散点图中 直线很多.选取点 (xi , yi ) ,i 1,2,, n ,与诸直线的 偏差平方和最小的这条直线是一条通过散点图的几 何中心 (x, y) ,斜率为 bˆ 的直线,可以证明,在某 些假设下,aˆ 与 bˆ 是所有线性无偏估计中最好的.
n
n
n
a
i1
xi
b
i 1
x2i
i 1
xi yi
称为正规方程组,记
x
1 n
n i 1
xi
1 n
y n i1 yi
(9)
xi
由于 xi不完全相同,正规方程组的系数行列式
n
n
xi
i 1
n
xi
i 1
n x2i
n
n
i 1
x2i
9
11.5 11.3
10
13.3 12.0
解: 为求线性回归方程,计算得
x
1 10
10 i 1
xi
11.73
故
10
数理统计课程设计(一元线性回归)
二氧化碳吸附量与活性炭孔隙结构的线性回归分析摘要:本文搜集了不同孔径下不同孔容的活性炭与CO2吸附量的实验数据。
分别以同一孔径下的不同孔容作为自变量,CO2吸附量作为因变量,作出散点图。
选取分布大致呈直线的一组数据为拟合的样本数据。
对样本数据利用最小二乘法进展回归分析,参数确定,并对分析结果进展显著性检验。
同时利用matlab 的regress 函数进展直线拟合。
结果明确:孔径在3. 0~ 3. 5 nm 之间的孔容和CO2吸附量之间存在较好的线性关系。
关键字:活性炭孔容CO2吸附量matlab一、问题分析本文主要研究同一孔径的孔容的活性炭和co2吸附量之间的线性关系,有关实验数据是借鉴双全,罗雪岭等人的研究成果[1]。
以太西无烟煤为原料、硝酸钾为添加剂,将煤粉、添加剂和煤焦油经过充分混合后挤压成条状,在600℃下炭化15 min,然后用水蒸气分别在920℃和860℃下活化一定时间得到2组活性炭,测定了CO2吸附等温线,探讨了2组不同工艺制备的活性炭的CO2吸附量和孔容的关系.数据如下表所示:表1:孔分布与CO2吸附值编号1~12是在不同添加剂量,温度,活化时间处理下的对照组。
因为处理方式不同得到不同结果是互不影响的,可以看出CO2的吸附量的值是互相独立的。
我们将不同孔径下的孔容分为1~7组。
编号孔容/(1110L g μ--⋅)CO2吸附量1/()mL g -⋅1 70 96 115 642 50 913 11 71 65 914 90 76 1225 78 1136 72 56 997 86 1228 13 69 107 9 78 107 10 13 91 137 11 114 110 142 75 12126 114 183作出不同孔径下与CO2吸附量的散点图如下:2468孔容C O 2吸附量10203040506070孔容C O 2吸附量152025303540孔容C O 2吸附量50100150孔容C O 2吸附量406080100120孔容C O 2吸附量5060708090100110孔容C O 2吸附量80100120140160180200孔容C O 2吸附量图1:不同孔容与CO2吸附量的散点图图1中从左往右依次是第1到第7组孔容,从图中可以看出第五、六、七组的点大致分散在一条直线附近,说明两个变量之间有一定的线性相关关系。
概率论与数理统计14-一元线性回归分析
i 1 i 1 i 1 n n n
通常记为 Syy Qe U ,
其中
ˆi y )2 U (y
n
(9.2.5)
称为回归平方和, 它反映了 i 1 ˆx的理论值 y ˆ1 , y ˆ2 ,, y ˆn 对 y平 回归方程 y ˆ a ˆ b
i 1 i 1
n
再由(9.2.5)式得到随机变量关系式
ˆ . Qe SYY bS xY
(9.2.7)
理论研究表明,检验统计量
U F F (1, n 2). Qe /(n 2)
当F>F(1,n-2)时,拒绝原假设H0.
例9.2.2 (续例9.2.1)数据见例9.2.1, 取显 ˆ 0.15 0.859x 著性水平 =0.05, 检验回归方程 y 的显著性. 解 检验 H0 : b 0, H1 : b 0.
^
2
~ t (n 2),
其中
^
2
Qe S bSxY YY n2 n2
是总体N 0, 的方差
2
2
D( )
的无偏估计. 对于给定的置信水平1 ,查自由度为n-2 的t分布表可得满足
P{ t t / 2} 1
的临界值t / 2 .利用不等式的恒等变形,可得
x
i 1 24 24 i
127.5, 829.61,
y
i 1 24
24
i
113.1, 650.93,
x
i 1
2 i
y
概率论与数理统计14-一元线性回归分析
4.0
3.5 22 9.0 8.0
4.5
4.2 23 9.5 8.1
4.6
3.5 24 10 8.1
解 从本例的散点图看出(见图9-1),
强度Y与拉伸倍数x之间大致呈现线性
相关关系, 因此一元线性回归模型是适用Y
与 x的 .
图9-1 例9.2.1数据散点图
现用公式(9.2.4)求 a, b , 这里n=24,
线性回归方程, 其图像就是回归直线, b为回
归系数, a称为回归常数, 也称为回归系数.
现讨论如何根据观测值 ( xi , yi )
(i=1,2,…,n)估计模型(9.2.2) 中回归函数
f(X) =a+bx的回归系数.
采用最小二乘法, 记平方和
Q(a, b) ( yi a bxi )2 .
x
i 1 24 24 i
127.5, 829.61,
y
i 1 24
24
i
113.1, 650.93,
x
i 1
2 i
y
i 1
2 i
x y
i 1 i
24
i
731.6,
1 (127.5) 2 152.266, 24 1 S xy 731.6 127.5 113.1 130.756, 24 1 S yy 650.93 (113.1) 2 117.946, 24 1 x 127.5 5.313, 24 1 y 113.1 4.713. 24 S xx 829.61
1.9
1.4 13 5.0 5.5
2.0
1.3 14 5.2 5.0
2.1
第一节一元线性回归分析-
一元线性回归模型
x的线性函数 随机误差
二、未知参数的估计
Y x , ~ N (0 ,2 ).
对 于 样 本 ( x 1 , Y 1 ) , ( x 2 , Y 2 ) ,, ( x n , Y n ) , 它 满 足
n
x2
] 2
(xi x)2
i 1
则ˆ ~N(,[1
n
n
x2
]2)
(xi x)2
i1
3 .对 x x 0 , 回 归 方 程 Y ˆ 0 = ˆ ˆ x 0 的 分 布
n
Y ˆ0ˆˆx0i n1(n 1n (x(ixi x)xx)2)Yi in 1((xxiixx))x20Yi
(
n i 1
xi
n
( xi
i 1
)ˆ (
) ˆ
n i 1
xi2
n i 1
)ˆ
yi
n i 1
xi
yi
12ˆ 800ˆ 811 800ˆ 53418ˆ 54107
求解得
ˆ= 35.82 ˆ0.476
则 Y 关 于 x 的 线 性 回 归 方 程 为
i 1
i 1
2. (,)的最大似然估 根 计 Y 据 1,Y2, ,Yn的独立性可度 得函 到数 联
Li n 11 2πexp 2 12(yixi)2
(1 2π)nexp 2 12i n 1(yixi)2 .
观 察 散 点 图 ,( x ) 具 有 线 性 函 数 x 的 形 式 .
2.建立回归模型
(x)x一元线性回归问题
高等教育计量经济学一元线性回归分析PPT课件
普通最小二乘法(Ordinary least squares, OLS)给出的判断标准是:二者之差(残差)的 平方和最小。
n
n
Q (Yi Yˆi )2 (Yi (ˆ0 ˆ1X i )) 2
1
1
24
最小二乘法的思路
为了精确地描述Y与X之间的关系,必须使用这两个变 量的每一对观察值(n组观察值),才不至于以点概面 (做到全面)。
ui N (0, )
32
(5) ui 非自相关。 Cov(ui, uj) = E[(ui - E(ui) ) ( uj - E(uj) )] = E(ui, uj) = 0,(i j )。
(6) xi是非随机的。 (7) ui 与xi 相互独立。
Cov(ui, xi) = E[(ui - E(ui) ) (xi - E(xi) )]
称为样本回归函数(sample regression function, SRF)。
18
• 样本回归函数的随机形式/样本回归模型:
样本回归函数也有如下的随机形式:
Yi Yˆi uˆˆii ˆ0 ˆ1 X i ei
式中,ei 称为(样本)残差(或剩余)项(residual),代表
963 1299510 1822500 926599
5769300 7425000 4590020
640000 352836 1210000 407044 1960000 1258884 2890000 1334025 4000000 1982464 5290000 2544025 6760000 3876961 8410000 4318084 10240000 6682225 12250000 6400900 53650000 29157448
一元线性回归分析PPT课件
拟合程度评价
拟合程度是指样本观测值聚集在样本回归线周围的紧
密程度. ( Y t Y ) ( Y ˆ t Y ) ( Y t Y ˆ t)
n
n
n
(Y t Y )2 (Y ˆt Y )2 (Y t Y ˆ)2
t 1
t 1
t 1
n
(Yt Y)2 :总离差平方和,记为SST;
t1
n
第8页/共40页
例
食品序号 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16
求和
脂肪Xt 4 6 6 8 19 11 12 12 26 21 11 16 14 9 9 5
热量Yt 110 120 120 164 430 192 175 236 429 318 249 281 160 147 210 120
第1页/共40页
回归分析的分类
一个自变量
一元回归
回归分析
两个及以上自变量
多元回归
线性 回归
非线性 回归
线性 回归
非线性 回归
第2页/共40页
一元线性回归模型
(一)总体回归函数
Yt=0+1Xt+ut
ut是随机误差项,又称随机干扰项,它是一个特殊的 随机变量,反映未列入方程式的其他各种因素对Y的 影响。
(ˆ1t(n2)Sˆ1)
2
第15页/共40页
回归分析的Excel实现
“工具”->“数据分析”->“回归”
第16页/共40页
ˆ 0
S ˆ 0
ˆ 1
S ˆ 1
(ˆ0t(n2)Sˆ0)
2
(ˆ1t(n2)Sˆ1)
2
第17页/共40页
第11章一元线性回归剖析
相关关系
(类型)
相关关系
线性相关 非线性相关 完全相关 不相关
正相关 负相关
正相关 负相关
相关关系的描述与测度
(散点图)
相关分析及其假定
1. 相关分析要解决的问题
变量之间是否存在关系? 如果存在关系,它们之间是什么样的关系? 变量之间的关系强度如何? 样本所反映的变量之间的关系能否代表总体变量之
(不良贷款对其他变量的散点图)
不良贷款
14
12
10
8பைடு நூலகம்
6
4
2
0
0
100
200
300
400
贷款余额 不良贷款与贷款余额的散点图
14
12
10
8
6
4
2
0 0
10
20
30
40
贷款项目个数
不良贷款与贷款项目个数的散点图
不良贷款
不良贷款
14
12
10
8
6
4
2
0 0
10
20
30
累计应收贷款
不良贷款与累计应收贷款的散点图
第11章 一元线性回归
第11章 一元线性回归
11.1 变量间关系的度量 11.2 一元线性回归 11.3 利用回归方程进行估计和预测 11.4 残差分析
学习目标
1. 相关关系的分析方法 2. 一元线性回归的基本原理和参数的最小
二乘估计 3. 回归直线的拟合优度 4. 回归方程的显著性检验 5. 利用回归方程进行估计和预测 6. 用 Excel 进行回归
性质4:仅仅是x与y之间线性关系的一个度量,它不能用 于描述非线性关系。这意为着, r=0只表示两个变 量之间不存在线性相关关系,并不说明变量之间 没有任何关系
概率论与数理统计课程设计_一元线性回归分析
目录一.设计目的 (1)二.设计问题 (1)三.设计原理 (1)四.方法实现 (5)五.设计总结 (15)参考文献 (15)致谢 (16)一.设计目的了解一元回归方程,回归系数的检验方法及应用一元回归方程进行预测的方法;学会应用MATLAB软件进行一元回归实验的分析方法。
同时更好的了解概率论与数理统计的知识,熟练掌握概率论与数理统计在实际问题上的应用,并将所学的知识结合Excel对数据的处理解决实际问题。
本设计是利用一元线性回归理论对用切削机房进行金属品加工时为了适当地调整机床,测量刀具的磨损速度与测量刀具的厚度间的关系建立数学模型,并用Excel分析工具库中的回归分析软件进行解算。
二.设计问题用切削机床进行金属加工时,为了适当地调节机床,需要测定刀具的磨损速x关于时间y的线性回归方程。
由此,我们利用这些数据做出刀具厚度三.设计原理在实际问题中,经常会出现两个变量之间的相关关系不是线性的(即直线型),而是非线性的(即曲线型)。
设其中有两个变量x 与y ,我们可以用一个确定函数关系式:)(x y x=大致的描述y 与x 之间的相关关系,函数)(x u 称为y 关于x的回归函数,方程)(x u y =成为y 关于x的回归方程。
一元线性回归处理的是两个变量x 与y 之间的线性关系,可以设想y 的值由两部分构成:一部分由自变量x 的线性影响所致,表示x 的线性函数bx a +;另一部分则由众多其他因素,包括随机因素的影响所致,这一部分可以视为随机误差项,记为ε。
可得一元线性回归模型ε++=bx a y (1)式中,自变量x 是可以控制的随机变量,成为回归变量;固定的未知参数a,b成为回归系数;y 称为响应变量或因变量。
由于ε是随机误差,根据中心极限定理,通常假定),0(~2σεN ,2σ是未知参数。
确定y 与x之间的关系前,可根据专业知识或散点图,选择适当的曲线回归方程,而这些方程往往可以化为线性方程或者就是线性方程,因此我们可以用线性方程:bx a y +=大致描述变量y 与x 之间的关系;1)模型回归系数的估计为了估计回归系数,假定试验得到两个变量x与y 的n 个数据对(),3,2,1,,n iy x i i Λ=我们将这n 对观测值代入式(1),得n i bx a y n i i ,3,2,1,Λ=++=ε这里n εεε,,,21K K 互独立的随机变量,军服从正态分布,即n ,1,2,3i ),~N(0,2K =σε回归系数估计的方法有多种,其中使用最广泛的是最小二乘法,即要求选取的a ,b , 的值使得述随机误差ε 的平方和达到最小,即求使得函数()()∑∑==--==nii i nii bx a y b a Q 1221,ε取得最小值的a ,b 。
研究生应用数理统计回归分析(一元)
1 0
^x中 1
0
2
成立:则
2 n 1 , ~ 1 , ~ 2 2 n 2 2 SS R 从而统计量 F ~ F 1, n 2 SS E n 2
SST
~
SS R
2
SS E
对给定的检验水平 ,
H0 的拒绝域为:F
(一元线性回归方程、经验公式) 回归分析的任务是,找出回归方程式,检验方程有效与否, 当方程有效时对Y 的值作预测与控制。
二、未知参数的估计及统计性质
1.最小二乘法 (Least squares estimate)
1, 2,, n) , 我们可以得到一个回归函数 y 0 1 x ,其中 0 , 1 待定。
Regression Models 回归模型的分类
回归模型
1个自变量
简单回归
2个以上自变量
多元回归
线性回归
非线性回归
二、回归分析的应用 (1)根据观测值,在误差尽可能小的情况下,建立因变 量和自变量x1 , ,xn的回归方程,并利用此方程对变量y 进行预测和控制; (2)判断自变量x1 , ,xn中,哪些变量对y的影响是显著 的,哪些是不显著的。
的总的偏差的平方和为
Q( 0 , 1 ) i 2 [ yi ( 0 1 xi )]2
i 1 i 1
n
n
ˆ , ˆ 称为最小二乘估计,这种方法成为最小二乘法 此得到的估计 0 1
我们希望选取适当的 0 , 1 , 使得 Q( 0 , 1 ) 的值最小,由
当x1,x2, ,xn互不相同时,方程组有解 0 y 1x Lxy 1 Lxx
1 n 1 n x xi , y yi n i 1 n i 1 Lxy ( xi x )( yi y ) x与y的离差平方和 Lxx ( xi x ) x, y的离差平方和
第二章二计量经济学一元线性回归分析 ppt课件
第二章二计量经济学一元线性回归
22
分析
对于一元线性回归模型:
Yi 0 1Xi i
i=1,2,…n
随机抽取n 组样本观测值Yi , Xi(i=1,2,…n),假如模型的参数
估计量已经求得到,为0 和1 ,那么Yi 服从如下的正态分布:
Yi ~N(ˆ0 ˆ1Xi ,2)
于 是 , Y i的 概 率 函 数 为
由 于 ˆ0、 ˆ1 的 估 计 结 果 是 从 最 小 二 乘 原 理 得 到 的 , 故 称 为
最 小 二 乘 估 计 量 (least-sq u aresestim ators)。
第二章二计量经济学一元线性回归
28
分析
4、样本回归线的数值性质(numerical properties)
• 样本回归线通过Y和X的样本均值; • Y估计值的均值等于观测值的均值; • 残差的均值为0。
4
一、线性回归模型及其普遍性
第二章二计量经济学一元线性回归
5
分析
1、线性回归模型的特征
• 一个例子
凯恩斯绝对收入假设消费理论:消费(C)是由收 入(Y)唯一决定的,是收入的线性函数:
C = + Y 但实际上上述等式不能准确实现。
(2.2.1)
• 原因 ⑴消费除受收入影响外,还受其他因素的影响; ⑵线性关系只是一个近似描述; ⑶收入变量观测值的近似性:收入数据本身并不绝 对准确地反映收入水平。
第二章二计量经济学一元线性回归
13
分析
二、线性回归模型的基本假设
第二章二计量经济学一元线性回归
14
分析
1、技术线路
• 由于回归分析的主要目的是要通过样本回归函 数(模型)SRF尽可能准确地估计总体回归函 数(模型)PRF。即通过
概率论与数理统计课程设计 一元线性回归分析
数理统计是具有广泛应用的数学分支,而区间估计和假设检验问题在其中占有很重要的地位。
对于正态总体期望和方差的区间估计和假设检验问题已有完备的结论;对于非正态总体期望和方差的区间估计和假设检验问题,在大样本的情况下,可利用中心极限定理转化为正态总体来解决。
但实际问题中常常碰到非正态总体,而且是小样本的情况,因此对它的区间估计和假设检验是一个值得研究的问题本文利用概率纶与数理统计中的所学的回归分析知识,对用切削机房进行金属品加工时为了适当地调整机床,测量刀具的磨损速度与测量刀具的厚度间的关x关于时间y的线性回归方程,系建立数学模型,利用这些数据做出刀具厚度并MATLAB 与EXCEL软件对验数据进行分析处理,得出线性回归系数与拟合系数等数据,并用F检验法检验了方法的可行性,同时用分布参数置信区间和假设检x关于时间y的线性关系显著,并进行了深入研究,验问题,得出了刀具厚度提出了小样本常用分布参数的置信区间与假设检验的解决方法。
关键词:统计量法;置信区间;假设检验;线性关系;回归分析一.设计目的 (2)二.设计问题 (2)三.设计原理 (2)四.方法实现 (6)五.设计总结 (16)参考文献 (16)致谢 (17)一.设计目的了解一元回归方程,回归系数的检验方法及应用一元回归方程进行预测的方法;学会应用MATLAB软件进行一元回归实验的分析方法。
同时更好的了解概率论与数理统计的知识,熟练掌握概率论与数理统计在实际问题上的应用,并将所学的知识结合Excel对数据的处理解决实际问题。
本设计是利用一元线性回归理论对用切削机房进行金属品加工时为了适当地调整机床,测量刀具的磨损速度与测量刀具的厚度间的关系建立数学模型,并用Excel分析工具库中的回归分析软件进行解算。
二.设计问题用切削机床进行金属加工时,为了适当地调节机床,需要测定刀具的磨损速x关于时间y的线性回归方程。
由此,我们利用这些数据做出刀具厚度三.设计原理在实际问题中,经常会出现两个变量之间的相关关系不是线性的(即直线型),而是非线性的(即曲线型)。
概率论与数理统计(9.3 一元线性回归)剖析
2018年11月2日星期五 18
目录 上页 下页 返回
【例 11】(续例 10) 求 Y 关于 x 的线性回归方程.
解 现在 n 6 ,所需计算列表如下:
x
y
40 50 55 60 67 70 342
总和
300 400 500 600 700 800 3300
2018年11月2日星期五 7
目录 上页 下页 返回
一、回归模型
对 于 随 机 误 差 , 常 常 假 定 E( ) 0,0 Var ( ) 2 . 的方差 2 是回归模型的 一个重要参数,因为 E[Y f ( X1, X 2 ,, X p )]2 E( 2 ) Var( ) 2. 这表明, 2 愈小, 用 f ( X1 , X 2 ,, X p ) 逼近 Y 所导致的均 方误差就愈小,回归方程也就愈有用.
1 , 2, , p 称为回归系数(regression coefficient).
2018年11月2日星期五 5
目录 上页 下页 返回
一、回归模型
回归分析的主要任务是根据 X1 , X 2 ,, X p 和 Y 的观 测数据,去估计回归函数 f ( x1, x2 ,, xp ) 及其讨论与此有 关的种种统计推断问题,例如讨论有关的点估计、区间 估计、假设检验等,特别是对随机变量 Y 的观测值作出 点预测和区间预测.
返回
解得 0 , 1 的估计值为
n n n n n xi yi ( xi )( yi ) ( xi x )( yi y ) i 1 i 1 i 1 i 1 , 1 n n n 2 2 2 n x ( x ) ( x x ) i i i i 1 i 1 i 1 n 1 n 1 x. y x y 0 1 i i n i 1 n i 1 1 n 1 n 其中 x xi , y yi . n i 1 n i 1
数理统计第六章第一节 一元线性回归分析
后代的身高有向身高平均值靠拢的趋向. 离开均值 越远,所受到回归的压力也越大。“回归”这个词 就由此而来。
5
输入
X1
输出
X2 …
系统
y
xp
理论模型 Y f (x1, x2 ,..., xp )
观测模型 Y f (x1, x2 ,..., xp )
6
** *
*
* **
* *
* *
*
* ** *
i 1
i 1
n
(bˆ)2 (xi x )2
i 1
S yy 2bˆSxy (bˆ)2 Sxx
由于 Sxy bˆSxx 所以 Qe Syy (bˆ)2 Sxx
18
1.3 线性假设的显著性检验
1) T检验法
对线性假设y=a+bx+进行检验,线性系数
b不应当为0 原假设 H0:b=0 备择假设 H1:b0
Qe的简单计算公式
n
Qe
yi yˆi 2 Syy (bˆ)2 Sxx
i 1
17
证明 n
n
Qe yi yˆi 2 ( yi y) ( yˆi y)2
i 1
i 1
n
(
yi
y
)
bˆ( xi
x
2
)
i 1
n
n
( yi y)2 2bˆ ( yi y)(xi x )
15
2) 2的点估计
对每一个xi,由回归方程有 yˆi aˆ bˆxi
xi处的残差为 yi yˆi
残差平方和
n
n
Qe yi yˆi 2
yi aˆ bˆxi 2
i 1
i 1
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
二氧化碳吸附量与活性炭孔隙结构的线性回归分析摘要:本文搜集了不同孔径下不同孔容的活性炭与CO2吸附量的实验数据。
分别以同一孔径下的不同孔容作为自变量,CO2吸附量作为因变量,作出散点图。
选取分布大致呈直线的一组数据为拟合的样本数据。
对样本数据利用最小二乘法进行回归分析,参数确定,并对分析结果进行显著性检验。
同时利用matlab 的regress 函数进行直线拟合。
结果表明:孔径在3. 0~ 3. 5 nm 之间的孔容和CO2吸附量之间存在较好的线性关系。
关键字:活性炭 孔容 CO2吸附量 matlab一、问题分析1.1.数据的收集和处理本文主要研究同一孔径的孔容的活性炭和co2吸附量之间的线性关系,有关实验数据是借鉴张双全,罗雪岭等人的研究成果[1]。
以太西无烟煤为原料、硝酸钾为添加剂,将煤粉、添加剂和煤焦油经过充分混合后挤压成条状,在600℃下炭化15 min,然后用水蒸气分别在920℃和860℃下活化一定时间得到2组活性炭,测定了CO2吸附等温线,探讨了2组不同工艺制备的活性炭的CO2吸附量和孔容的关系.数据如下表所示:表1:孔分布与CO2吸附值编号1~12是在不同添加剂量,温度,活化时间处理下的对照组。
因为处理方式不同得到不同结果是互不影响的,可以看出CO2的吸附量的值是互相独立的。
我们将不同孔径下的孔容分为1~7组。
编号孔容/(1110L g μ--⋅)CO2吸附量1/()mL g -⋅0.5~0.8nm 0.8~1.2nm 1.2~1.8nm 1.8~2.2nm 2.2~2.2nm 2.5~3.0nm 3.0~3.5nm 1 7.18 16.2 24.4 75.2 70 96 115 64 2 6.59 14.4 18.4 53.7 50 85.6 91 55.1 3 4.54 11 18.9 71 65 78.3 91 53.7 4 5.13 13.4 29.9 10.3 90 76 122 53.7 5 4.16 10.5 18.9 83.8 78 80.5 113 61.7 6 4.92 12.1 23.4 81.6 72 56 99 53.6 7 5.08 12.6 23.8 93.5 86 77.8 122 65.5 8 5.29 13 25.1 88.4 69 66.4 107 57.7 9 7.47 16.9 26.9 46.4 78 93.2 107 58.2 10 5.44 13 21.4 44.1 91 98.6 137 76.6 11 1.81 64.6 18.3 53.1 114 110 142 75 121.2427.739.5 126 114 98.6 183 98.7作出不同孔径下与CO2吸附量的散点图如下:2468孔容C O 2吸附量10203040506070孔容C O 2吸附量152025303540孔容C O 2吸附量50100150孔容C O 2吸附量406080100120孔容C O 2吸附量5060708090100110孔容C O 2吸附量80100120140160180200孔容C O 2吸附量图1:不同孔容与CO2吸附量的散点图图1中从左往右依次是第1到第7组孔容,从图中可以看出第五、六、七组的点大致分散在一条直线附近,说明两个变量之间有一定的线性相关关系。
且自变量的变化导致因变量CO2的浓度变化,因变量变化具有独立性。
我们就选取第七组的数据进行回归分析。
112101()()ˆ()ˆˆni i i ni i x x y y x x y xβββ==⎧--⎪⎪=⎪⎨-⎪⎪=-⎪⎩∑∑二、问题假设1.假设误差分布服从正态分布。
2.为了简化模型,便于回归分析,我们不考虑实验中各种因素对活性炭吸附的影响,考虑孔容与co2吸附量的数据之间的线性关系。
三、模型建立3.1.回归参数的引进回归函数()(|)y f x E Y X x ===是线性函数的回归分析称为线性回归,当可控制变量只有一个时,即回归函数为01()y f x x ββ==+,那么称为一元线性回归模型,上式称为Y 对x 的一元线性回归方程或者一元线性回归直线,0β、1β称为回归系数,常数0β、1β、2σ均未知。
3.2回归方程的构建由于总体回归方程01()y f x x ββ==+中的参数0β、1β在实际中并不知道,需要通过样本值对它们进行估计,得到估计值0ˆβ,1ˆβ,从而得到样本回归方程01ˆˆY x ββ=+,此样本方程可用作总体回归方程()(|)y f x E Y X x ===的估计。
通常可用最小二乘法估计得到公式由于总体回归方程01()y f x x ββ==+中的参数0β、1β在实际中并不知道,需要通过样本值对它们进行估计,得到估计值0ˆβ,1ˆβ,从而得到样本回归方程01ˆˆY x ββ=+,此样本方程可用作总体回归方程()(|)y f x E Y X x ===的估计。
通常可用最小二乘法估计得到公式012(0,)Y x N ββεεσ=++⎧⎨⎩(1)(2)2σ=101ˆ/ˆˆxy xx l l y xβββ⎧=⎪⎨=-⎪⎩其11n i i x x n ==∑,11ni i y y n ==∑,记12112xy i i i l x y x y==-⋅∑= ,1222112xx i i l x x==-∑1222112yy i i l y y ==-∑1ˆ/xy xxl l β=01ˆy x ββ=- 2ˆe T R xx xx S S S l l β=-=- 可得2.3求一定孔容下的CO2的吸附量的回归直线方程利用matlab 对数据进行计算,结果如下表所示:实验编号孔容i xCO2吸附量iy2i x 2i yi i x y1 115 64 13225 4096 73602 91 55.1 8281 3036.01 5014.13 91 53.7 8281 2883.69 4886.74 122 53.7 14884 2883.69 6551.45 113 61.7 12769 3806.89 6972.16 99 53.6 9801 2872.96 5306.47 122 65.5 14884 4290.25 79918 107 57.7 11449 3329.29 6173.9 9 107 58.2 11449 3387.24 6227.4 10 137 76.6 18769 5867.56 10494.2 11 142 75 20164 5625 10650 12 183 98.7 33489 9741.69 18062.1 ∑1429773.517744551820.2795689.3表2:孔容与C02吸附度的回归计算讲结果代入上上述公式可得下列计算表:(3)表3:回归参数的计算表由此可得线性回归方程为:0.49 5.88y x =+四、回归方程的显著性检验对回归方程是否有意义做判断就是对如下的检验问题做出判断:01:0H β=vs 11:0H β≠拒绝域0H 表示回归方程是显著的。
利用F 检验对参数进行检验。
经计算有T yy S l ==63.7711T f =21R xx S l β==48.421R f =e T R S S S =-=15.3510e f =4.1F 值检验取显著水平α=0.05,其拒绝域为:i x ∑=1429.00n=12i y ∑=773.50x =119.08y =64.462ix∑=177445.00i i x y ∑=95689.302iy∑=51820.272nx =2129340.00n x y ⋅⋅=1148271.602ny =621843.24 xx l =7274.92 xy l =3578.34yy l =1961.75e S =201.662σ=63.771/xy xx l l β==0.4901ˆy x ββ=-=5.88(4) (5)(6) (7)(8)1(1,10)F F α-≥查表可得拒绝域的值为: 4.96F ≥ 计算得87.28/(2)Re S F S n ==-,远远大于F 的临界值,说明拒绝原假设,原假设不成立,自变量和因变量有着显著的线性关系。
4.2.p 值检验将(6)(7)(8)中的各平方和和自由度移入方差分析表,继续进行计算可得:这里p 值很小,因此,在显著性水平0.01下回归方程是显著的。
五、计算方法的涉及和计算机的实现4.1用matlab 拟合直线:先将数据以txt 格式保存,再用dlmread 读取ASCII 码文件。
调用matlab 中的regress 多元线性回归函数(代码见附录),对12个样本数据进行拟合,作出散点图和直线拟合图在一张图上如下:9010011012013014015016017018019050556065707580859095100图2:孔容和CO2吸附量的直线拟合孔容C O 2吸附量从图中可以看出样本点大致分布在直线附近,拟合效果比较好。
4.2直线参数的估计值的置信区间以及三种检验利用regess函数求出参数的估计值和置信区间以及参数的检验统计量(设置α=0.05)如下:图3:用matlab计算的参数值和检验值。
其中,R^2=0.8972指因变量(CO2吸附度)有89.7%可由模型确定,F的值远远超过F的临界值。
P远小于α,因而模型从整体上看是可用的。
六、主要的结论孔容和CO2吸附量之间存在线性关系,经过显著性检验,线性方程回归效果较好,即线性方程能基本描述孔径范围3. 0~ 3. 5 nm的活性炭孔容和CO2吸附量七、参考文献[1]张双全,罗雪岭,郭哲,董明建,岳晓明. CO2吸附量与活性炭孔隙结构线性关系的研究[J]. 中国矿业大学学报. 2008(04)附录Matlab制作散点图:M=dlmread('co2.txt');%读取ASCII码文件for i=1:1:7subplot(4,2,i)x1=M(:,i); y=M(:,8);plot(x1,y, 'bo');xlabel('孔容'),ylabel('CO2吸附量');endMatlab直线拟合:clc; format short g;M=dlmread('co2.txt');%读取ASCII码文件x1=M(:,7); y=M(:,8);plot(x1,y, 'bo');b=regress(y,[ones(size(x1)),x1]); % b=[β0 β1] ',列向量x1=sort(x1); %按升序排序,用于画图y=[ones(size(x1)),x1]*b;%使用矩阵乘法hold on;plot(x1,y, '-r');title('图2:孔容和CO2吸附量的直线拟合')xlabel('孔容');ylabel('CO2吸附量');hold off;Matlab参数估计:clc; format compact; format short g;M=dlmread('co2.txt');%读取ASCII码文件x1=M(:,7); y=M(:,8);[b,bint,r,rint,stats]=regress(y,[ones(size(x1)),x1],0.05);fprintf('%2s%5s%11s\n','参数','估计值','置信区间');%1个汉字算1个字符for i=1:length(b)fprintf ('β%1d%9.4f [%7.4f, %7.4f]\n',i-1,[b(i,:),bint(i,:)]); end% %d将i当整数输出,%7.4f按实数格式输出,区域宽7个字符,4位小数fprintf('\nR^2=%.4f F=%.4f p<%.4e s^2=%.4f\n',stats);。