名词解释
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
1、相关分析:相关分析(correlation analysis),相关分析是研究现象之间是否存在某种依存关系,并对具体有依存关系的现象探讨其相关方向以及相关程度,是研究随机变量之间的相关关系的一种统计方法。
2、计量经济学:计量经济学是以一定的经济理论和统计资料为基础,运用数学、统计学方法与电脑技术,以建立经济计量模型为主要手段,定量分析研究具有随机性特性的经济变量关系。
主要内容包括理论计量经济学和应用经济计量学。
3、区间估计:参数估计的一种形式。
通过从总体中抽取的样本,根据一定的正确度与精确度的要求,构造出适当的区间,以作为总体的分布参数(或参数的函数)的真值所在范围的估计。
4、假设检验:假设检验是数理统计学中根据一定假设条件由样本推断总体的一种方法。
具体作法是:根据问题的需要对所研究的总体作某种假设,记作H0;选取合适的统计量,这个统计量的选取要使得在假设H0成立时,其分布为已知;由实测的样本,计算出统计量的值,并根据预先给定的显著性水平进行检验,作出拒绝或接受假设H0的判断。
常用的假设检验方法有u—检验法、t检验法、χ2检验法(卡方检验)、F—检验法,秩和检验等。
5、正态分布:正态分布(Normal distribution)又名高斯分布(Gaussian distribution),是一个在数学、物理及工程等领域都非常重要的概率分布,在统计学的许多方面有着重大的影响力。
若随机变量X服从一个数学期望为μ、方差为σ^2的高斯分布,记为N(μ,σ^2)。
其概率密度函数为正态分布的期望值μ决定了其位置,其标准差σ决定了分布的幅度。
因其曲线呈钟形,因此人们又经常称之为钟形曲线。
我们通常所说的标准正态分布是μ = 0,σ = 1的正态分布。
6、t分布,又称Student t分布,记作t~t(v)。
t分布十分有用,它是总体均数的区间估计和假设检验的理论基础。
自由度(degree of freedom, df)在数学中能够自由取值的变量个数,如有3个变量x、y、z,但x+y+z=18,因此其自由度等于2。
在统计学中,自由度指的是计算某一统计量时,取值不受限制的变量个数。
通常df=n-k。
其中n为样本含量,k为被限制的条件数或变量个数,或计算某一统计量时用到其它独立统计量的个数。
自由度通常用于抽样分布中。
7、参数估计的无偏性:若是总体X的参数θ的一个点估计量,
且,则称是参数θ的无偏估计量.对于待估参数,不同
的样本值就会得到不同的估计值。
这样,要确定一个估计量的好坏,就不能仅仅依据某次抽样的结果来衡量,而必须由大量抽样的结果来衡量。
对此,一个自然而基本的衡量标准是要求估计量无系统偏差。
也就是说,尽管在一次抽样中得到的估计值不一定恰好等于待估参数的真值,但在大量重复抽样时,所得到的估计值平均起来应与待估参数的真值相同,换句话说,希望估计量的均值(数学期望)应等于未知参数的真值,这就是所谓无偏性(Unbiasedness)的要求。
8、参数估计的有效性:若,都是θ的无偏估计量,且,则称
是比有效的估计量.若在θ的一切无偏估计量中,的方差达到最小,则称为θ的有效估计量.
9、参数估计:参数估计(parameter estimation)是根据从总体中抽取的样本估计总体分布中包含的未知参数的方法。
人们常常需要根据手中的数据,分析或推断数据反映的本质规律。
即根据样本数据如何选择统计量去推断总体的分布或数字特征等。
统计推断是数理统计研究的核心问题。
所谓统计推断是指根据样本对总体分布或分布的数字特征等作出合理的推断。
它是统计推断的一种基本形式,是数理统计学的一个重要分支,分为点估计和区间估计两部分。
10、虚拟变量( Dummy Variables) 又称虚设变量、名义变量或哑变量,用以反映质的属性的一个人工变量,是量化了的自变量,通常取值为0或1。
引入哑变量可使线形回归模型变得更复杂,但对问题描述更简明,一个方程能达到俩个方程的作用,而且接近现实。
11、高斯-马尔科夫定理:在给定经典线性回归模型的假定下,最小二乘估计量,在无偏线性估计一类中,有最小方差,就是说,它们是BLUE(best linear unbiased estimator)在统计学中,高斯-马尔可夫定理陈述的是:在误差零均值,同方差,且互不相关的线性回归模型中,回归系数的最佳无偏线性估计(BLUE)就是最小方差估计。
一般而言,任何回归系数的线性组合的最佳无偏线性估计就是它的最小方差估计。
在这个线性回归模型中,误差既不需要假定正态分布,也不需要假定独立(但是需要不相关这个更弱的条件),还不需要假定同分布。
具体而言,假设其中β0和β1是非随机但是未观测到的参数,xi是观测到的变量,εi是随机误差,Y i是随机变量(x小写因为x不是随机变量,Y大写因为Y是随机变量)。
高斯-马尔可夫定理的条件是:“不相关性”。
12、
弹性则是线性模型当中,对数模型里面自变量ln(X)前系数(参数),解释起来是X每增加(减少)1%,Y平均增加(减少)系数值的百分数
13、偏回归系数:在多元回归分析中,随机因变量对各个自变量的回归系数,表示各自变量对随机变量的影响程度。
14、回归分析:回归分析(regression analysis)是确定两种或两种以上变数间相互依赖的定量关系的一种统计分析方法。
运用十分广泛,回归分析按照涉及的自变量的多少,可分为一元回归分析和多元回归分析;按照自变量和因变量之间的关系类型,可分为线性回归分析和非线性回归分析。
如果在回归分析中,只包括一个自变量和一个因变量,且二者的关系可用一条直线近似表示,这种回归分析称为一元线性回归分析。
如果回归分析中包括两个或两个以上的自变量,且因变量和自变量之间是线性关系,则称为多元线性回归分析。
15、判定系数:拟合优度(或称判定系数,决定系数)目的:企图构造一个不含单位,可以相互进行比较,而且能直观判断拟合优劣的指标.拟合优度的定义:意义:拟合优度越大,自变量对因变量的解释程度越高,自变量引起的变动占总变动的百分比高.观察点在回归直线附近越密集.取值范围:0-1判定系数只是说明列入模型的所有解释变量对应变量的联合的影响程度,不说明模型中单个解释变量的影响程度.对时间序列数据,判定系数达到0.9以上是很平常的;但是,对截面数据而言,能够有0.5就不错了.
16、序列相关:序列相关性,在计量经济学中指对于不同的样本值,随机干扰之间不再是完全相互独立的,而是存在某种相关性。
又称自相关(auto correlation),是指总体回归模型的随机误差项之间存在相关关系。
17、多重共线性:所谓多重共线性(Multicollinearity)是指线性回归模型中的解释变量之间由于存在精确相关关系或高度相关关系而使模型估计失真或难
以估计准确。
一般来说,由于经济数据的限制使得模型设计不当,导致设计矩阵中解释变量间存在普遍的相关关系。
18、异方差性:异方差性(heteroscedasticity )是相对于同方差而言的。
所谓同方差,是为了保证回归参数估计量具有良好的统计性质,经典线性回归模型的一个重要假定:总体回归函数中的随机误差项满足同方差性,即它们都有相同的方差。
如果这一假定不满足,即:随机误差项具有不同的方差,则称线性回归模型存在异方差性。