统计学专业英语翻译

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

汉译英
Population 总体,样本总体sample 样本,标本parameter 限制因素
median 中位数odd 奇数,单数even 偶数
range 极差variance 方差standard deviation 标准差Covariance 协方差empty event 空事件product event 积事件
conditional probability 条件概率Random variable 随机变量binominal distribution 二项式分布uniform distribution 均匀分布Poisson distribution 泊松分布residual 残差
central limit theorem 中心极限定律
英译汉
descriptive statistics 描述统计学mathematical statistics 数理统计学inductive statistics 归纳统计学Inferential statistics 推断统计学dimension 维,维数continuous variable 连续变量ordinal variable 有序变量nominal variable 名义变量dichotomous 两分的;二歧的discrete variable 离散变量categorical variable 分类变量location 定位,位置,场所dispersion 分散mean 均值unimodal单峰的
multimodal 多峰的chaotic 无秩序的grouped data 分组数据
frequency distribution频数分布cumulative frequency 累加频数tallying 计算
Uniformly distribution 均匀分布histogram 直方图frequency polygon 频率多边图rectangle 矩形Percentile 百分位数quartile 四分位数
interquartile range 四分位数间距simple event 简单事件Compound event 复合事件mutually exclusive 互斥的,互补相交的complementary event 对立事件Independent 独立的joint probability function 联合概率函数jacobian雅克比行列式
Law of large numbers大数定律point estimate 点估计estimate 估计值
statistic 统计量optimality 最优性Unbiased estimate 无偏估计量efficient estimate 有偏估计量unbiasedness无偏性efficience有效性Consistent estimate 一致估计量
asymptotic properties 渐近性质Confidence interval 置信区间interval estimation 区间估计
null hypothesis 原假设alternative hypothesis 备择假设significance level 显著性水平power function 幂函数testing procedures 检验方法test statistic 检验统计量
rejection region 拒绝区域acceptance region 接受区域critical region 临界区域
first-derivatives 一阶导数second-derivatives 二阶导数Likelihood ratio 似然比dependent variable因变量unexplanatory variable未解释变量independent variable自变量
Error term 误差项regression coefficients 回归系数Sum of squared residuals 残差平方和Marginal probability function 边际概率函数joint probability density function 联合概率密度函数Marginal probability density function边际概率密度函数stochastically independent 随机独立的
Mutually independently distribution 相互独立的分布independently and identically distribution 独立同分布的likelihood function 似然函数maximum likelihood estimator 最大似然估计量
maximum likelihood estimate 最大似然估计值log-likelihood function 对数似然函数
ordinary least squares estimation/estimate/estimator 普通最小二乘估计/估计值/估计量
linear unbiased estimator 线性无偏估计
第三章、概念与符号
[An index]把指数定义成是对一组相关变量之中变化进行测算的一个实数。

从概念上讲,指数可以用来比较随时间或者空间或随两者同时变化的量。

指数用来测算随时间变化的价格与数量,也可以用来衡量不同厂商、行业、地区或国家的水平差异。

价格指数可以指消费者物价投入与产出、价格进出口价格等等,而数量指数可以测算一个厂商或行业随时间变化或者不同厂商在产出商品以及所用投入上的数量变化。

[Index number have]指数在经济学上有着悠久的且与众不同的历史,一些最重要的贡献归功于早在十九世纪晚期的Laspeyres 和Paasche 的研究。

Laspeyres 和Paasche 公式仍旧被全世界一些国家的统计局所广泛应用。

但是,正是Irving Fisher 的工作以及他的著作——在1992年出版的《编
制指数》——认识到使用许多统计公式生成适当的指数的可能性。

rnquist o
T 指数(1936)在生产率测量中起到重要作用。

Diewert 和Nakamura (1993)书中的第二章提供了极好的阐明指数构建的历史背景。

符号
[We use the following]在一这章中我们自始至终地使用下述符号。

设mj p 和mj q 分别表示第m 种(m=1,2,...,M )商品在第j (j=s,t )个时期中的价格与数量。

为了不失一般性,s 与t 除了可以表示时期之外,还可以指两家厂商,而数量可以是投入量,也可以是产出量。

[Conceptually,all]从概念上讲,所有指数测算了来自于一个参考时期的一组变量水平的变化。

参考时期由“基期”表示,用于计算指数的时期称为“现期”。

设st I 表示以s 为基期以t 的现期t
的综合指数。

类似地,设st V ,st P 和st Q 分别表示价值指数、价格指数以及数量指数。

综合指数问题
[The value change from]从时期s 到时期t 的价值变化是在时期s 与t 的商品价值之比值,价值有各自的价格衡量。

因而∑∑===N i is is N i it
it st q p q p V 11
指数st V 测算了从时期s 到t 的M 种商品集合数量价值的变化。

显然,st V 是两种成分即价格变化与数量变化的结果。

尽管st V 容易测算时,但是要剔除价格变化与数量变化的影响就非常难。

我们想要踢除这种影响,因此,比如说,使数量成分可以用于测算数量的变化。

[if we are operating]如果我们在单一商品的世界里处理问题,那么这种分解就很容易做到我们有s t s t s s t t st q q p p q p q p V ⨯== 其中比值
s t p p 与s t q q 测算了相关的价格变化与数量变化,从而不存在指数问题。

[In gennerally]通常当商品数M ≥2时,我们就有了综合问题。

相对价格pmt/pms 测算了第m 种商品价格水平的变化。

相对数量qmt/qms 测算了第m 种商品数量水平的变化。

[Now the]现在的问题是,如何将这m 种不同价格(数量)变化的测算合成一个简单实数,称之为价格(数量)指数。

这个问题有点类似于选择一种合适的中心趋势来测量,在下面两节中我们简要地阐明测算价格指数与数量指数变化的一些最常用的公式。

第四章、非模型处理缺失数据
[if no models]倘若没有模型可以利用,则人们直接分析可用数据,或者分析经过基于非模型估算之后的数据。

只利用可用数据
[Listwise deletion]成列删除或完整个案分析意指,删除数据中有缺失值的一个或多个变量的那种观测值。

在MCAR 假设下,经过成列删除之后,所保留的样本仍是源自最初总体的一个随机样本;
因此,基于该样本的估计是一致的。

不过,其标准误差将会扩大,因为所用信息甚少,若回归元个数很多,则成列删除的总效果导致总观测值会剧烈减少。

这激发人们脱离那种对拥有高比例缺失观测值的变量进行分析,可是,由该种方法所产生的结果却潜在的使人误导。

[if MCAR]如果MCAR 得不到满足且缺失数据仅仅是MAR ,那么估计将是有偏的。

因而,成列删除对违背MCAR 而言是不稳健的。

不过,成列删除对回归分析中各个自变量违背MAR 而言是稳健的。

也就是,当任何回归元出现缺失数据的概率并不依赖于因变量之值。

简约地讲,成列删除是可接受的,如果归因于缺失数据的不完全情况构成了各种各样种情况的比例很小,比如说5%或更少。

更重要的是,成列删除之后的样本是说研究总体的代表。

[Pairwise deletion]成对删除或可用案例分析,时常被认为是比成列删除更好的一种方法。

其思想是估计(x1.x2)的联合样本矩时,运用观测值(x1i,x2i )的全部可能对,并且估计边缘矩时运用个体变量的全部观测值。

因而,在线性回归中,在成对删除下我们运用回归元的所可能对估计(X'X )与(X'y ),而在成列删除下,要在删除任何拥有缺失观测值的全部情况后才能估计(X'X )与(X'y )。

很明显,在成对删除下,我们损失较少信息。

这里建议要运用最大信息量去估计个体概括统计量,诸如均值与协方差,然后使用这些概括统计量去计算回归估计。

[There are two]成对删除有两个重要局限性:(1)一般的讲,估计标准误差与检验统计量都是有偏的;2所得到的回归元协方差矩阵(X'X )可能不是正定的。

不用模型的估算
[There are a number of]统计软件经常执行一系列专门或勉强证明合理的方法。

[Mean imputation]均值估算或均值替补意指,运用可利用值的平均值代替缺失观测值。

该方法是均值保持不变的,但将对数据的边缘布产生影响。

很明显边缘分布中心概率质量表现出增大,该方法也影响到协方差以及与其他变量的相关性。

[Simple hot deck]简单替补估算意指,用来自从那种具有观测值的变量中随机抽取到的值代替缺失值,有点像自助法。

该方法维持了那个变量的边缘分布,但却扭曲了变量之间的协方差与相关性。

[In a regression]在回归背景下,这两个著名方法虽然具有简单性,但却没有一个引人注目。

2.1.1
[We consider an experiment]我们认为一个实验的结果是未知的,而一个事件出现的概率已知,有时也称作随机实验。

一个实验的样本空间是所有可能的结果的集合。

每一个样本空间的元素被称为样本空间的一个元素或样本点,表示每一个结果都从该实验中获得。

一个事件是包括在样本空间中的结果的任意集合,或者说和样本空间的子集是相同的。

一个简单事件是由一个确切的元素和一个由多个元素组成时混合事件组合而成。

样本空间被定义为Ω,样本点为ω。

[Suppose]假如,A 事件是样本Ω的一个子集,令ω为事件A 的一个样本点,然后,我们说一个样本点ω是属于A 样本空间,定义为ω∈A 。

[A set]一个样本点不属于事件A 的集合被叫做A 的互补事件,被表示为C A .一个事件没有任何样本点被叫做空事件,定义为φ。

相反地,一个事件包括了所有可能的样本点,被叫做全事件,表示为Ω。

[Next]接下来考虑,A 和B 事件,一个由所有属于A 或B 事件的样本点的集合被叫做和事件,被定义为B A ⋃,一个由所有同时书A 和B 的样本点组成的集合叫做积事件,被定义为B A ⋂,当B A ⋂为φ时,我们说事件A 和B 是互斥的。

2.7.1
[Suppose that the functional]假如在总体上潜在的分布的函数组成是已知的,但分布中的参数θ是未知的。

总体的分布函数()θ;x f 已给出,令
x 1,x 2,...x n 是来自总体分布的n 个观测数据,考虑用几个观测数据来估计参数θ。

令()x x x n ,...,,21∧θ是观测数据x x n ,...,,21x 的一个函数。

假设()x x x n ,...,,21∧
θ是由估计参数θ的目标组成的。

()x x x n ,...,,21∧θ取一个由n 个观测数据给出的确定值,那么,()x x x n ,...,,21∧θ被叫作θ的点估计,或者说θ的简
单估计。

2.7.5
[The properties of]在2.7.4部分中,x 和
s 2估计量的性质已经讨论过了。

可知x 是μ的一个在正态假定下的无偏的,有效的和一致的估计量,s 2是δ2的一个无偏估计量。

注意,s 2是无偏的但不是一致的。

[The population parameter]总体参数θ依赖于一个由总体分布()θ;x f 的函数组成,符合于服从()δμ2
,的正态分布和服从参数β的指数分布的情况。

现在,更一般的情况,我们想要考虑怎么去估计θ,极大似然估计给了我们一个答案。

[Let]令x x n ,...,,21x 为相互独立同分布的随机样本,x i 有概率密度函数()θ;x f ,在这些假定下,x x n ,...,,21x 的联合概率密度函数被给出为()()∏==n
i i n x x x x f f 121;;,...,θθ,θ表示未知参数。

[Give]给出真实的观测数据
x x n ,...,,21x ,联合密度()θ;,...,1x x n
f 被视为θ的一个函数。

2.8.1
[The testing procedures is]
假设检验的过程如下:
1、基于参数构建一个原假设
2、考虑适当的统计量,我们称它为检验统计量,得到一个检验统计量的分布函数,当0H 时真的
3、从可观测的数据计算,检验统计量的观测量
4、比较分布和检验统计量的观测值,当统计量的观测值是在分布函数的两边的时候,我们认为原假设是不可能发生的,所以我们拒绝原假设。

0H 不可能发生的区域我们称它为0H 的拒绝域,定义为R ,相对的0H 可能发生的区域我们称它为接受域,定义为A 。

相关文档
最新文档