最新02一元线性回归模型070312

合集下载

第02章 一元线性回归模型(讲稿)

第02章 一元线性回归模型(讲稿)

第2章一元线性回归模型§2.1 模型的建立及其假定条件1. 回归分析的概念回归分析是处理变量与变量之间关系的一种数学方法。

1)关系分类(1)确定的函数关系。

例如某企业的销售收入Y i等于产品价格P与销售量X i的乘积,用数学表达式表示为:Y i = P X i(2)非确定的依赖关系。

例如某企业资金的投人X i与产出Y i,一般来讲,资金投入越多,产出也相应提高。

但是由于生产过程中各种条件的变化,使得不同时间内同样的资金投入会有不同的产出。

这些造成了资金的投入与产出之间关系的不确定性,因而不能给出类似于函数的精确表达式。

用u i表示其他影响因素,将这两个变量之间非确定的依赖关系表示成下列形式:Y i = f(X i )+ u i(3)回归分析。

为了分析和利用变量之间非确定的依赖关系,人们建立了各种统计分析方法,其中回归分析方法是最常用的经典方法之一。

回归分析的理论和方法是计量经济模型估计理论和估计方法的主要内容。

2.一元线性回归模型1)概念。

为了说明一元线性回归模型,举一个某商品需求函数的例子。

为了研究某市城镇每年鲜蛋的需求量,首先考察消费者年人均可支配收入对年人均鲜蛋需求量的影响。

由经济理论知,当人均可支配收入提高时,鲜蛋需求量也相应增加。

但是,鲜蛋需求量除受消费者可支配收入影响外,还要受到其自身价格、人们的消费习惯及其他一些随机因素的影响。

为了表示鲜蛋需求量与消费者可支配收入之间非确定的依赖关系,设Y i为鲜蛋需求量,X i为可支配收入,我们将影响鲜蛋需求量的其他因素归并到随机变量吨中,建立这两个变量之间的数学模型:Y i = β0 + β1 X i + u i (2.1)其中Y i——称作被解释变量;X i——称作解释变量;u i——随机误差项(随机扰动项或随机项、误差项);β0 、β1——回归系数(待定系数或待定参数)。

在数学模型(2.1)式中,当X i发生变化时,按照一定规律影响另一变量Y i,而Y i的变化并不影响X i 。

一元线性回归模型.

一元线性回归模型.

二、统计关系与确定性关系
如果给定一个变量X的结果值就可 确定另一个变量Y 的结果值,则称变 量Y是变量X 的函数,即X、Y之间是 函数关系。
在经典物理学中,给定电阻Ω,电
流I 和电压V 之间的关系即为函数
关系,即
I V Ω
。这种典型的变量关系就
是确定性关系。
在经济系统中, 这种变量之间的函 数关系或确定性关系就很少见 。常 见的是变量之间是一种不确定的关系, 既使变量X 是变量Y 的原因, 给定变 量X 的值也不能具体确定变量Y的值, 而只能确定变量Y 的统计特征,通常 称变量X 与Y 之间的这种关系为统计 关系。
在回归分析中,被解释变量Y 被 当作是随机变量,而解释变量X 则被 看作非随机变量。而在相关分析中, 我们把两个变量都看作是随机变量。
例如 ,在学生的数学成绩与统 计学成绩的分析中,如为回归分析 ,则统计学成绩是随机变量,数学 成绩是非随机变量,即数学成绩被 固定在给定的水平上,以此求得统 计学的平均成绩。而在相关分析中 ,两者处于平等地位,不存在谁为 解释变量,谁为被解释变量的问题 ,两者均为随机变量。
(Francis Galton)提出。在一篇研究 父母身高与子女身高相互关系的论文 中,高尔顿发现,虽然有一个趋势, 父母高,子女也高;父母矮,子女也 矮,但给定父母的身高,子女的平均 身高却趋向于或者回归到全体人口的 平均身高。
也就是说,当父母双亲都异常高或 异常矮,则子女的身高有趋向于人 口总体平均身高的趋势。这种现象 被称为高尔顿普遍回归定律。这就 是回归一词的原始含义。
例如,企业总产出Y 与企业的资 本投入K 、劳动力投入L 之间的关系 就是统计关系。虽然资本K 和劳动力 L 是影响产出Y 的两大核心要素,但 是给定K 、L 的值并不能确定产出Y 的值。因为,总产出Y 除了受资本投 入K、劳动力投入L 的影响外,还要

02第二章一元线性回归模型

02第二章一元线性回归模型
假设4. 服从零均值、同方差、零协方差的正 态分布 i~N(0, 2 ) i=1,2, …,n
④相关分析对称地对待任何(两个)变量,两 个变量都被看作是随机的。回归分析对变量 的处理方法存在不对称性,即区分应变量 (被解释变量)和自变量(解释变量):前 者是随机变量,后者不是。
2. 回归分析的基本概念
• 回归分析(regression analysis)是研究一个变量 关于另一个(些)变量的具体依赖关系的计 算方法和理论。
• 相应的函数:
E(Y|Xi)f(Xi)
称为(双变量)总体回归函数(population regression function, PRF)。
• 含义:回归函数(PRF)说明被解释变量Y的平 均状态(总体条件期望)随解释变量X变化的 规律。
• 函数形式:可以是线性或非线性的。
• 例2.1中,将居民消费支出看成是其可支配收入 的线性函数时:
第二章 经典单方程计量经济学模型: 一元线性回归模型
• 回归分析概述 • 一元线性回归模型的参数估计 • 一元线性回归模型检验 • 一元线性回归模型预测 • 实例
§2.1 回归分析概述
一、变量间的关系及回归分析的基本概念 二、总体回归函数(PRF) 三、随机扰动项 四、样本回归函数(SRF)
一、变量间的关系及回归分析的基本概念
Yi 01Xii i=1,2,…,n
Y为被解释变量,X为解释变量,0与1为待估 参数, 为随机干扰项
• 回归分析的主要目的是要通过样本回归函数(模型) SRF尽可能准确地估计总体回归函数(模型)PRF。
• 问题:寻求一种规则和方法使其得到的SRF的参数B1和 B2更可能“接近”总体回归函数中的参数B1和B2的真 实值
E (Y |X i)01 X i 总体回归方程

一元线性回归的模型

一元线性回归的模型

一元线性回归的模型
一元线性回归模型表示如下:
yt = β0 + β1 xt +ut(1)上式表示变量yt 和xt之间的真实关系。

其中yt 称作被解释变量(或相依变量、因变量),xt称作解释变量(或独立变量、自变量),ut称作随机误差项,β0称作常数项(截距项),β1称作回归系数。

在模型(1) 中,xt是影响yt变化的重要解释变量。

β0和β1也称作回归参数。

这两个量通常是未知的,需要估计。

t表示序数。

当t表示时间序数时,xt和yt称为时间序列数据。

当t表示非时间序数时,xt和yt称为截面数据。

ut则包括了除xt以外的影响yt变化的众多微小因素。

ut的变化是不可控的。

上述模型可以分为两部分。

(1)β0 +β1 xt是非随机部分;(2)ut是随机部分。

计量经济学 第二章 一元线性回归模型

计量经济学  第二章  一元线性回归模型

第二章 一元线性回归模型2.1 一元线性回归模型的基本假定2.1.1一元线性回归模型有一元线性回归模型(统计模型)如下, y t = β0 + β1 x t + u t上式表示变量y t 和x t 之间的真实关系。

其中y t 称被解释变量(因变量),x t 称解释变量(自变量),u t 称随机误差项,β0称常数项,β1称回归系数(通常未知)。

上模型可以分为两部分。

(1)回归函数部分,E(y t ) = β0 + β1 x t ,(2)随机部分,u t 。

图2.1 真实的回归直线这种模型可以赋予各种实际意义,居民收入与支出的关系;商品价格与供给量的关系;企业产量与库存的关系;身高与体重的关系等。

以收入与支出的关系为例。

假设固定对一个家庭进行观察,随着收入水平的不同,与支出呈线性函数关系。

但实际上数据来自各个家庭,来自同一收入水平的家庭,受其他条件的影响,如家庭子女的多少、消费习惯等等,其出也不尽相同。

所以由数据得到的散点图不在一条直线上(不呈函数关系),而是散在直线周围,服从统计关系。

“线性”一词在这里有两重含义。

它一方面指被解释变量Y 与解释变量X 之间为线性关系,即1tty x β∂=∂220tt y x β∂=∂另一方面也指被解释变量与参数0β、1β之间的线性关系,即。

1ty x β∂=∂,221ty β∂=∂0 ,1ty β∂=∂,2200ty β∂=∂2.1.2 随机误差项的性质随机误差项u t 中可能包括家庭人口数不同,消费习惯不同,不同地域的消费指数不同,不同家庭的外来收入不同等因素。

所以在经济问题上“控制其他因素不变”是不可能的。

随机误差项u t 正是计量模型与其它模型的区别所在,也是其优势所在,今后咱们的很多内容,都是围绕随机误差项u t 进行了。

回归模型的随机误差项中一般包括如下几项内容: (1)非重要解释变量的省略, (2)数学模型形式欠妥, (3)测量误差等,(4)随机误差(自然灾害、经济危机、人的偶然行为等)。

02一元线性回归模型

02一元线性回归模型

xi xi2 Yi

o
Wi Yi

1
n

X
xi
xi 2

Yi
证: βˆ1
xi yi xi2
xi (Yi Y ) xi2
xiYi Y xi
xi2
xi2
令ki

xi
xi2
,因xi

(Xi

X)

0 ,故有

使偏导数为零
(
e2 i
)
o

2(Yi



o



1 Xi)

0
(
e2 i
)
1


2(Yi



o


1 Xi) Xi
0
得正规方程
Yi = nβo + β 1 Xi XiYi = β o Xi + β 1 Xi2
解得

1
X iYi nXY
14
800
1000
1200
1400
1600
x
y
Fitted values
OLS估计结果:Yˆi 10.7662 0.0051X i (第2版教材第17页)
(第3版教材第15页)
2.3 最小二乘估计量的统计性质
一、线性性
线性特性是指估计式 β^o 和 β 1^是Yi 的线性函数。

1 Ki Yi
如此以来,高的越来越高,矮的越来越矮。他 百思不得其解,同时又发现某人种的平均身高 是相当稳定的。最后得到结论:儿子们的身高 回复于全体男子的平均身高,即“回归”—— 见1889年F.Gallton的论文《普用回归定律》。

第二章 一元线性回归模型(本科生计量经济学)

第二章 一元线性回归模型(本科生计量经济学)

即:正规方程组揭示的是残差的性质。
26
普通最小二乘估计有关 的其他性质(课后习题)
Y Y

^
e Y e y
i ^ i
^
i
0 0
27
i
2、由普通最小二乘估计系数的性质可证
得普通最小二乘估计与参数的关系如下:
1 1 k i u i
^
0 0 wi ui
( 1) ( 2)
( 1)
0 Y 1 X
^

^

Y

1 n
Y , X X
i 1 i 1 n i 1
n

n
i
18
参数的普通最小二乘估计量
ˆ ˆ X )0 (Yi 0 1 i ˆ ˆ X )X 0 ( Y i 0 1 i i
^
33
三、一元线性回归模型参数的最大似 然法(Maximum Likehood,ML)估计
• 基本原理:似然原理
• 一元线性回归模型ML使用的条件:已知随机扰动 项的分布。
34
Y1 , Y2 ,...,Yn
1 f (Yi ) e 2
1 2
1 2
2
Yi ~ N (0 1 X i , 2 )
w 1
i
22
普通最小二乘估计的例
年份
1991 1992 1993 1994
ED(X)
708 793 958 1278
FI(Y)
3149 3483 4349 5218
ed(x)
-551 -466 -301 19
fi(y)
-2351 -2017 -1151 -282

第2章 一元线性回归模型 演示文稿

第2章 一元线性回归模型 演示文稿

般来说,在一定限度内施肥量适当增加,产量就会相应增
加 . 但即使施肥量相同 , 产量并不能由施肥量唯一确定 , 而可能有不同的值 .在该例中 , 施肥量是 自变量 ( 解释变 量),是可以控制的,是确定性变量.而产量受各种偶然因 素的影响,是 不可控制的随机变量 ,是因变量( 被解释变
量).
7
2.1.1 回归分析的内涵
第2章 一元(两变量)线性回归分析
2.1 一元线性回归模型 2.2 一元线性回归模型的参数估计 2.3 古典假设的内涵与参数估计量的性质

2.4 拟合优度评价 、回归显著性检验(F检验)
2.5 一元线性回归系数的检验(t检验)
2.6 预测
##
#
1
2.1 一元线性回归模型
2.1.1 回归分析的内涵 2.1.2 一元线性回归模型的有关概念 2.1.3 有关随机扰动项μi 的古典模型假设
27
2.1.3 有关随机扰动项μi 的古典模型假设
数据是世界运动变化留下的轨迹,是客
体间错综复杂关系的表征。因此,数据背后
存在着某种规律。
由于随机性的存在,事物间的本质联系
(必然性、规律)往往被偶然性所遮蔽,有
待人们用特殊方法去认识与探索。
28
2.1.3 有关随机扰动项μi 的古典模型假设
数据的集合称为变量(变数),这些数据是
155
165 175 189 - 966
175
178 180 185 191
1211
10
散点图
11
2.1.2 一元线性回归模型
一些基本概念 条件分布:以X取定值为条件的Y的条件分布 条件概率:给定X的Y的概率,记为P(Y|X)。 例如,P(Y=55|X=80)=1/5;P(Y=150|X=260)=1/7。 条件期望(conditional Expectation):给定X的Y的期望值, 记为E(Y|X)。 例如,E(Y|X=80)=55×1/5+60×1/5+65×1/5+70×1/5+ 75×1/5=65 总体回归曲线(Popular Regression Curve)(总体回归曲 线的几何意义):当解释变量给定值时因变量的条件期望 值的轨迹。

[经济学]第二章 一元线性回归模型计量经济学ppt课件

[经济学]第二章 一元线性回归模型计量经济学ppt课件
yi b0 b1x1i ui yi b0 b1x2i ui yi b0 b1x3i ui
比较三个模型拟合程度的优劣,用最好的模型估计2009年的预 测值(2009:59942.7,5383,86396.8),给出样本值和预 测值的时间序列图,并求2009年的农业总产值95%的预测区间
4、如果增加一个地区,该地区年可支配收入是12000元,求 该地区的消费支出的点预测值,和该地区人均消费支出95%置 信水平的区间预测。
2021/5/19
台州学院《计量经济学》讲义
34
2021/5/19
台州学院《计量经济学》讲义
35
yˆi 725.346 0.665xi
t (1.589) (22.496)
2021/5/19
台州学院《计量经济学》讲义
33
例3:利用给出的2008年我国城镇居民人均消费支出与人均 可支配收入数据(数据来源:中国统计年鉴2009),回答问题:
1、建立一元线性回归模型,写出回归方程,如何解释斜率?
2、给出显著性水平5%,对参数进行显著性检验
3、弹性定义为自变量变动百分之一所引起的因变量变动的百 分比,用数学形式表示为弹性=斜率*(x/y)。假设仅根据2得 到的回归结果,能求出支出对收入的弹性吗?如果不能,计算 此弹性还需要其它什么信息?
一、重视数据的收集和甄别
一些变量无法直接观测,一些现实数据不能公开 数据缺失或出现异常数据 数据量不够,样本太小 数据不准确、不一致、有矛盾
2021/5/19
台州学院《计量经济学》讲义
29
二、合理确定数据的单位
适当的选取变量的单位,使模型中各变量的数量级大体 一致
2021/5/19
台州学院《计量经济学》讲义

第2章一元线性回归模型2

第2章一元线性回归模型2
人假设,说明斜率1显著地不等于零
• 因此,解释变量X对被解释变量Y具有影 响
2020/6/18
案例分析
• 工资 • 被解释变量:工资(1976年每小时美元数
) • 解释变量:教育(年数) • 计量模型:
• wage = 0 + 1 educ +
• t=10.17 • 问题:如何对待稻草人假设?
2020/6/18
2020/6/18
复习
第2章(1)思考题: • 1、回归分析中的变量有何特点? • 2、被解释变量的两个组成部分的含义是什么
? • 3、刻划被解释变量的两个参数分别是什么? • 4、样本回归模型与总体回归模型有何区别? • 5、最小二乘估计法的核心思想是什么? • 6、回归模型参数的估计量是什么?
t
ˆ 1 se (ˆ 1 )
(3)给定显著性水平a,查t分布表,得临界值c=t a/2(n-2)
(4) 比较,判断


2020/6/18
|t|> t a/2(n-2),则拒绝H0 ,接受H1 ; |t| t a/2(n-2),则拒绝H1 ,接受H0 ;
简易判断法则
• 当n > 30时,t分布近似于正态分布 • 给定显著性水平为5%,临界值c约为2 • 如果t的绝对值大于2,就可以拒绝稻草
解释变量的显著性
Y i 01X ii
• 如果1等于零,则X对Y没有影响
• 1的估计值不等于零
• 但是
• 1真的不等于零吗?
• 问题: • 如何说服我们相信你高考的数学成绩不 是零分? 2020/6/18
1、假设检验概述
•假设检验采用的逻辑推理方法是反证法。
先假定原假设正确,然后根据样本信息,观察由 此假设而导致的结果是否合理,从而判断是否接受 原假设。

2 一元线性回归

2 一元线性回归

• 描述Y的均值E(Y)与 X的关系的方程叫做回归方程
由于
E(0 ) 0
E(1) 1
E() 0
所以
E(Y ) 0 1X
• 可以看出:
简单线性回归方程的图形是一条直线。称为总体回归直线
0是回归直线的截距, 1是回归直线的斜率,E(Y)是给定某个X的
值Y的均值或期望值
结论:在0.05的显著性水平下,房地产的评估价值与销售 价格之间的确存在线性关系
30/36
练习2:对来往车辆进行研究,每隔5分钟获得的数据如 下表,试进行回归分析,并对回归方程作拟合度及显著 性检验。(显著水平为5%)
稠密度(车辆数/千米) 速度(千米/小时)
稠密度(车辆数/千米) 速度(千米/小时)
Y = 0 + 1X + 其中,0、1为参数, 为随机误差项
3/36
随机误差项 的假设
1.误差项是随机变量,它的期望值为0
2.误差项的方差2为常数
3.误差项之间相互独立
• 即与一个值相联系的误差对与另一个值相联系 的误差没有影响
4.随机误差项服从正态分布
4/36
2、一元线性回归方程(Simple linear regression equation)
• 总体回归模型中的是Y与未知的总体回归线之间
的纵向距离,不可直接观测;样本回归模型中的e, 是 Y 与样本回归线之间的纵向距离,可以根据样 本观测值计算得出
7/36
二、一元线性回归模型的估计
1、回归系数的估计
以直线 Yˆ ˆ0 ˆ1X 近似表述变量X与Y间的关系, 如何选择 ˆ0 与 ˆ1 ?
17/36
• S称为估计标准误差。即:

第二章一元线性回归模型

第二章一元线性回归模型

2800
1455 1501 1635 1728 1789 1835 1886 1943 2033 2178 2294 2351 2410
3300
1788 1835 1872 1903 1965 2061 2157 2206 2289 2314 2390 2426 2458 2478 2543
3800
第二章 一元线性回归模型
回归模型概述 一元线性回归模型的参数估计 一元线性回归模型的拟合优度检验 一元线性回归模型的统计推断 一元线性回归模型的预测 案例分析
第一节 回归模型概述
◆ 相关分析与回归分析 ◆ 随机误差项 ◆ 总体回归模型 ◆ 样本回归模型
一、相关分析与回归分析
1. 经济变量之间的关系
例如:
对于供给不足下的生产活动,可以认为产出是由资本、劳动、技术 等投入要素决定的,并且,一般情况下,产出随着投入要素的增加而增 加,但要素的边际产出递减。
计量经济学模型用随机方程揭示经济变量之间的因果关系,对于这 一经济活动,与上述数理经济模型相对应,描述为
Q Ae t K L e
或描述为对数线性函数形式
XY
Co(v X,Y) Va(r X) Va(r Y)
(2-1)
其中,Co(v X,Y)是变量X、Y的协方差,
Va(r X)、Va(r Y)分别是变量X、Y的方差。
如果给定变量X、Y 的一组样本 Xi,Yi ,i 1,2,n,,
则总体相关系数的估计——样本相关系数为
rXY
n
(Xi X)(Yi Y )
计量经济学
—理论·方法·EViews应用
郭存芝 杜延军 李春吉 编著
电子教案
第二章 一元线性回归模型

02一元线性回归模型

02一元线性回归模型

一元线性回归模型1.一元线性回归模型有一元线性回归模型(统计模型)如下,y t = 0 + 1 x t + u t上式表示变量y t 和x t之间的真实关系。

其中y t 称被解释变量(因变量),x t称解释变量(自变量),u t称随机误差项,0称常数项,1称回归系数(通常未知)。

上模型可以分为两部分。

(1)回归函数部分,E(y t) = 0 + 1 x t,(2)随机部分,u t。

图2.1 真实的回归直线这种模型可以赋予各种实际意义,收入与支出的关系;如脉搏与血压的关系;商品价格与供给量的关系;文件容量与保存时间的关系;林区木材采伐量与木材剩余物的关系;身高与体重的关系等。

以收入与支出的关系为例。

假设固定对一个家庭进行观察,随着收入水平的不同,与支出呈线性函数关系。

但实际上数据来自各个家庭,来自各个不同收入水平,使其他条件不变成为不可能,所以由数据得到的散点图不在一条直线上(不呈函数关系),而是散在直线周围,服从统计关系。

随机误差项u t中可能包括家庭人口数不同,消费习惯不同,不同地域的消费指数不同,不同家庭的外来收入不同等因素。

所以在经济问题上“控制其他因素不变”是不可能的。

回归模型的随机误差项中一般包括如下几项内容,(1)非重要解释变量的省略,(2)人的随机行为,(3)数学模型形式欠妥,(4)归并误差(粮食的归并)(5)测量误差等。

回归模型存在两个特点。

(1)建立在某些假定条件不变前提下抽象出来的回归函数不能百分之百地再现所研究的经济过程。

(2)也正是由于这些假定与抽象,才使我们能够透过复杂的经济现象,深刻认识到该经济过程的本质。

通常线性回归函数E(y t) = 0 + 1 x t是观察不到的,利用样本得到的只是对E(y t) = 0 + 1 x t 的估计,即对0和1的估计。

在对回归函数进行估计之前应该对随机误差项u t做出如下假定。

(1) u t 是一个随机变量,u t 的取值服从概率分布。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

02一元线性回归模型070312经济学参考书目:1、高鸿业,《西方经济学:微观部分(第三版)--21世纪经济学系列教材》,《西方经济学:宏观部分(第三版)--21世纪经济学系列教材》,中国人民大学出版社,2005年1月。

《西方经济学学习与教学手册(21世纪经济学系列教材)》,中国人民大学出版社,2005年6月。

2、高鸿业、刘凤良,《20世纪西方经济学的发展》,商务印书馆,2004年4月3、尹伯成,《西方经济学简明教程(第5版)》,世纪出版集团、上海人民出版社,2006年3月。

4、伍柏麟、尹伯成,《经济学基础教程--复旦博学·经济学系列》,复旦大学出版社,2002年3月。

5、姚开建、梁小明,《西方经济学名著导读--经济学经典著作读丛书》,中国经济出版社,2005年1月。

6、梁小民,《西方经济学教程(修订版)》,中国统计出版社,2005年12月。

7、方福前,《当代西方经济学主要流派》,中国人民大学出版社,2004年12月。

8、王志伟,《现代西方经济学主要思潮及流派》,高等教育出版社,2004年9月。

数学参考书目:9、赵萍,《经济数学基础及应用---线性代数及概率论》,哈尔滨工业大学出版社,2006年10月。

10、李尚志,《线性代数》,高等教育出版社,2006年5月。

11、卢刚,《线性代数》,北京大学出版社,2006年。

12、陈维新,《线性代数(第2版)》,北京科学出版社,2006年。

13、冉兆平,《微积分》,上海财经大学出版社,2006年。

14、田长生,《概率统计与微积分》,北京科学出版社,2006年。

15、李林曙,《微积分》,中国人民大学出版社,2006年。

16、王雪标、王拉娣、聂高辉,《微积分》,高等教育出版社,2006年。

17、马恩林,《概率论与数理统计》,人民教育出版社,2006年。

18、吴赣昌,《概率论与数理统计》,中国人民大学出版社,2006年。

19、葛余博等著,《概率论与数理统计通用辅导讲义》,清华大学出版社,2006年。

统计学参考书目:20、邢哲,《统计学原理》,中国金融出版社,2006年8月。

21、李荣平,《统计学》,天津大学出版社,2006年。

22、吴梅村,《数理统计学基本原理和方法》,西南财经大学出版社,2006年。

23、曾五一,《统计学》,中国金融出版社,2006年。

24、(美)A.M.穆德、F.A.格雷比尔著、史定华译,《统计学导论》,北京科学出版社,1978年。

补充材料一、随机变量及其数字特征随机变量及其分布的研究是以事件及其概率的研究为基础展开的。

它是统计推断的理论基础。

随机变量定义:按一定的概率取不同实数值的变量称为随机变量,用x, y 等表示。

如(1)天津站每日的客流人数。

(2)某商场日销售电视机台数。

(3)某储蓄所的日存款余额。

(4)某地区居民的日用水量。

(5)高速公路上单位时间内通过的机动车数量。

(6)流水线上生产的罐装啤酒的净重值。

若随机变量x可能取的值为有限个或可列个,则称x为离散型随机变量。

若随机变量x可能取的值是整个数轴,或数轴上的某个区间,则称x为连续型随机变量。

连续型随机变量的概率分布是通过随机变量在一切可能区域内取值的概率定义的。

最常用和最简便的形式是通过概率密度函数表示。

对于随机变量x,若存在非负可积函数f (x),(- ∞ < x < ∞),使对任意实数a, b, (a < b)有P{a≤x≤b} = ⎰badx x f) (则称x为连续型随机变量。

f (x)为x的概率密度函数(简称概率密度或密度)。

由上式知f (x)在[a, b]区间上的积分等于随机变量x在[a, b]区间取值的概率。

研究经济问题为什么还要学习随机变量?因为许多经济问题都符合随机变量的要求。

通过随机变量把经济问题上升到统计理论高度进行研究,有利于找到经济变量变化的一般规律。

1.1随机变量的数学期望对于离散型随机变量x,若有概率分布P{x = x i} = p i, (i= 1, 2, …, )则称∑ix i p i为x的数学期望,简称为期望或均值。

记作E(x)。

对于连续型随机变量x,若密度函数为f (x),则称⎰b adxx xf) (为x的数学期望。

记作E(x)。

期望属于位置特征。

用来描述随机变量取值的集中位置。

体现了随机变量取值的平均大小。

期望就是随机变量取一切可能值的加权平均。

其中的权数就是概率值。

数学期望的性质如下:(1) 常量的期望就是这个常量本身。

E(k) = k(2) 常量与随机变量和的期望等于这个随机变量的期望与这个常量的和。

E(x + k) = E(x) + k(3) 常量与随机变量乘积的期望等于这个常量与随机变量期望的乘积。

E(k x) = k E(x)(4) 随机变量的线性函数的期望等于这个随机变量期望的同一线性函数。

E(k x + c) = k E(x) + c(5) 两个随机变量和(或差)的期望等于这两个随机变量期望的和(或差)。

E(x±y) = E(x) ± E(y)(6) 两个相互独立随机变量乘积的期望等于这两个随机变量期望的乘积。

E(x y) = E(x) E(y)例:5个学生的英语考试分数是80, 70, 85, 90, 82。

则平均考试分数E(x) =590 85828070++++= 81.41.2随机变量的方差、标准差随机变量x对其均值的离差平方的数学期望,E[x - E(x) ]2称作随机变量x的方差。

记作Var(x)。

)(xVar则称作x的标准差。

方差和标准差用来描述随机变量的离散特征。

它们反映了随机变量取值离散程度的大小。

对于离散型随机变量x,方差的定义是Var(x) = ∑(x i - E(x) )2p ii其中p i表示x取x i值时的概率。

对于连续型随机变量x,方差的定义是Var(x) = ⎰∞[x - E(x) ]2f (x) dx∞-其中f (x) 是x的概率密度函数。

注意:(1)Var(x)的量纲是x的量纲的平方。

(2))Var的量纲与x的量(x纲相同。

随机变量方差的性质:(1) 常量的方差为零。

Var(k) = 0(2) 随机变量与常量之和的方差等于这个随机变量的方差。

Var(x + k) = Var(x)其中x为随机变量,k为常量。

(3) 常量与随机变量乘积的方差等于这个常量的平方与随机变量方差的乘积。

Var(k x) = k2 Var(x)其中k为常量。

证明:由方差定义Var(k x) = E[k x - E(k x) ]2 = E[k x - k E(x) ]2 = k2 E[x - E(x) ]2 = k2 Var(x)(4) 随机变量的方差等于这个随机变量平方的期望减其期望的平方。

Var (x) = E(x2) – [E(x)]2证明:由方差定义Var(x) = E[x - E(x) ]2 = E[x2– 2 x E(x) + [E(x)]2] = E(x2) – 2 E(x) E(x) + (E(x))2= E(x2) – (E(x))2(5) 两个相互独立随机变量之和(或差)的方差等于这两个随机变量方差的和。

Var (x y) = Var (x) + Var (y)下面证明随机变量之差情形。

证明:由方差定义Var (x - y) = E[(x - y) – E (x - y) ]2 = E[x - y– E(x) - E (y) ]2= E[(x– E(x) ) - (y - E (y) ) ]2= E[(x– E(x))2 + (y - E (y))2– 2 (x– E(x)) (y - E(y)) ]= Var (x) + Var (y) – 2 E[(x– E(x)) (y - E(y))]其中E (x – E(x)) (y - E(y)) 是随机变量x与y的协方差。

因为x与y相互独立,所以E[ (x– E(x)) (y - E(y))] = 0(见下面第3小节,随机变量的协方差)。

上式的结果是Var (x - y) = Var (x) + Var (y)注意:两个相互独立随机变量差的方差不等于这两个随机变量方差的差。

(6) 由性质(5)有如下结论:若两个随机变量是相互非独立的,其和与差的方差公式是,Var (x + y) = Var (x) + Var (y) + 2 Cov(x, y)Var (x - y) = Var (x) + Var (y) - 2 Cov(x, y)其中Cov(x, y) 表示x与y的协方差(协方差概念见下)。

1.3 随机变量的协方差协方差定义:随机变量x, y分别对其均值的离差乘积的数学期望E [(x - E(x)) (y - E(y))]称作随机变量x , y 的协方差,记作Cov(x, y)。

其中E(x ), E(y )分别表示x , y 的期望。

协方差用来描述两个随机变量关系的紧密程度。

对于离散型随机变量x , y ,协方差定义为Cov(x, y) = ∑∑ij(x i - E(x )) (y j - E(y )) p (x i , y j )其中p (x i , y j ) = P(x = x i , y = y j ) 表示x = x i , y = y j 条件下的概率。

上式是协偏差[ x i - E(x ) ][y j - E(y )]的加权平均。

对于连续型随机变量x , y ,协方差定义为Cov(x , y ) = ⎰⎰∞∞-∞∞-(x - E(x ) ) (y - E(y ) ) p (x , y ) dx dy其中p (x , y )是x , y 的概率密度函数。

当x , y 相互独立时,Cov(x , y ) = 0。

协方差的大小与x , y 的量纲有关。

一般来说,改变x , y 的量纲,则x , y 协方差的值也要改变。

因此协方差所提供的主要信息是正值、负值还是零。

注意:虽然两个变量相互独立,意味着协方差为零,但反过来不一定成立,即协方差为零,该两个变量未必独立(但肯定不存在线性相关)。

二、正态分布2.1 正态分布与标准正态分布正态分布定义:若连续型随机变量x 的概率密度函数为 f (x ) =σπ21exp(-222)(σμ-x )其中μ, σ为常量,σ > 0,则称x 服从正态分布。

记作x ~ N(μ, σ2 )。

μ, σ分别是x 的数学期望和标准差。

可以证明E(x ) = ⎰∞∞-x f (x ) dx =⎰∞∞-xσπ21exp(-222)(σμ-x ) dx = μVar (x ) = ⎰∞∞-(x - μ)2f (x ) dx = ⎰∞∞-(x - μ)2σπ21exp(-222)(σμ-x ) dx = σ 2)(x Var = σ三种不同参数的正态分布曲线见图1。

相关文档
最新文档