统计学起源详解
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第1章绪论
§1.1 统计学的产生和发展
一般认为,统计学于十七世纪中叶在英国产生。关于统计学的创始人,一种说法认为是英国人约翰·格朗脱(John Graunt,1620~1674)①,另一种说法认为是英国人威廉·配第(William Patty,1623~1687)②。统计史中把他们两人开创的学派叫作“政治算术学派”并称他们二人为政治算术学派的创始人(参见[1]第10页,[2]第29页)。因此,也可以说,十七世纪中叶政治算术学派在英国的创立,标志着统计学的诞生。不过,政治算术学派时代的统计学当时在英国叫作“政治算术”而不叫“统计学”。大体上与政治算术学派同时,在德国有所谓“国势学派”。这个学派曾使用statistik一词(“统计学”一词的德文原形)作为国势学的名称。政治算术学派与国势学派在学术主张上的主要区别是:前者主张用数量来研究国情而后者主张用文字来记述国情。经过百余年的争论,学术界公认把statistik的英译文statistics作为政治算术活动的同义语来使用([1]第67页,[2]第70页)。这样,政治算术学派的活动以及在这种活动的基础上进一步发展的各种新进展便都有了“统计学”的名称。
配第的主要著作有:《赋税论》(1662),《政治算术》(可能完成于1676年,于1690年出版),《献给英明人士》(1664年完成,1691年出版),《爱尔兰的政治解剖》(1672年完成,1691年出版),《货币略论》(1682年完成,1695年出版)([2]第33~34页,[4]第107页)。在这些著作中,从统计学的角度来看,配第的主要贡献是:(1)提出了“政治算术”方法。这种方法的特点是:用数字来描述一国的经济状态和水平,并以此为依据为执政者提出建议。如《政治算术》一书中用数字叙述荷兰和法国、英国和法国国力的对比以及英国国力的增长,论证“英格兰的情况和各种问题,并非处于可悲的状态”,为英国争夺世界霸权出谋划策([1]第11~13页)。(2)提出了国民收入概念并对英国国民收入进行了估算([4]第109页,[25]第1~2页,[26]第8~9页)。这是首次用一个指标反应一国经济总规模的尝试。(3)在配第进行的国民收入的计算中,可以见到现代国民经济核算中计算国民收入的支出法和收入法以及利用复式记账反应经济活动方法的雏型。配第把国民收入(他称作“人民的收入”)定义为每年人民劳动的价值与每年国民财富的收入之和。后者他所指的是地租、利息和利润。与总收入平衡的另一方是总支出,就是人民每年的费用或消费支出,包括私人的和集体的,指食物、住房、衣着及其它等等,然后留下一部分盈余([4]第109页,[25]第1~2页,[26]第8~9页)。(4)提出了根据经济联系推算统计数据的方法。配第在作国情研究的时候,有许多需用的数据在当时很难找到,于是他就通过间接的途径去估算它们。例如,要计算伦敦的人口,他就用30乘以安葬人数——假定每年30人中有1人死亡([4]第108页)。
格朗脱的代表著作是《关于死亡表的自然与政治的观察》(1662)。该著作对统计学的贡献是([3],1999年第3期第61~62页):(1)提出了“数据简约”的概念。即把数量庞大的杂乱无章的数据,依据种种分类标准整理成一些意义明晰的表格,使数据中包含的有用信息凸现出来。这种工作直到今天仍被统计学家视为基础性工作。(2)提出并举例处理了数据的可信性问题。数据的可信性指的是,是否有人出于某种目的而对数据作了篡改,或在获取数据的过程中出现重大的失误(如仪器未调准或登录时书写有误)。样本中这样的数值叫作异常值。鉴别数据中是否有及何者可能为异常值,直到今天仍然是一个在应用上很重要,并在方法研究上受到重视的问题。(3)有了频率稳定性的意识。频率稳定性是说某种特性出现的频率会随着观察次数(样本量)的增加而趋于稳定。格朗脱在书中并未用明确的语言
把这作为一个一般原则提出来,但通过他对数据的具体处理,显示了他的统计分析是基于这样一个原则。他应用伦敦和罗蒙塞两地的男女出生(洗礼)数和死亡数,以8年为一时期,算出在伦敦男、女出生率之比为14:13,在罗蒙塞为16:15。这是在历史上首次通过具体资料证明男、女出生率各自有其稳定值且略有差异。(4)编制生命表。生命表是指现存人口的年龄分布。这有多方面的用途。例如可以计算出在某一年龄间隔内的人数的百分比,可以计算活到某一年龄a的人中,至少再活b年的百分比,而这对于保险金、年金等的计算有直接的关系。格朗脱在本书中首次提出了生命表的概念,并计算了现已知的第一个生命表。虽则它的推理粗糙甚至有些想当然的成分,但仅是引进这个概念,就已对后世有了很大的影响。
从上面所介绍配第和格朗脱所作的工作可以看到,统计学从其产生的时候起就有着两种不同的研究任务③。后面我们还要说到,随着统计学的发展,后来在研究任务上又有了进一步的拓展。下面依照统计学的不同研究任务来勾勒统计学的发展进程。
第一种研究任务
统计学的第一种研究任务是从配第开始的。配第自己提出的任务是用数字描述国家的社会经济状态。这就必须首先设计科学的可操作的统计指标和指标体系。配第做了这样的工作。他提出了国民收入的概念,并设计了这个指标的计算方法。与《政治算术》类似,英国人金(Gregory King,1648~1712)于1696年写成《对英格兰国势的自然观察和政治观察的结论》。他在该书中提供了英格兰、苏格兰、爱尔兰、德国、法国、意大利、荷兰、中国、欧洲、亚洲、非洲和美洲的每人占地亩数和居住亩数;编制出英国各社会集团的收支平衡表;他还估计英国当时的全国国民收入数字为43,500,000镑而支出为41,700,000镑,等等([2],第43~44页)。到19世纪,随着时代的推移,经济生活日趋复杂,人们对于经济问题的关注也与日俱增。首先是国家的需要,为测定经济增长速度和人民生活水平,制订经济、财政和税收计划等,需要有及时、确实的统计数字资料作为依据。其次是社会的需要:经济盛衰的变化,就业机会的多寡,物价的升降,关系到社会上的每一个人,他们希望看到这方面的统计数字。再次是科研的需要:经济学家为实证或建立新的理论,不能不借助于经济统计数字资料。因此,国家统计机关和民间统计组织——包括物产交易所,证券交易所,经济、统计研究机构,大学的经济、统计研究所,都定期或不定期地举办各种经济调查,包括农业统计调查、工业统计调查、商业统计调查等;同时,国民收入核算理论方法的研究和应用、指数理论方法的研究和应用到这时也有了长足的发展 (参见[2],第172~189页)。从上面的叙述中,我们可以看出现今人们所称的经济统计学形成的大致过程。
第二种研究任务
统计学的第二种研究任务是从格朗脱开始的。前面列举了格朗脱对统计学的若干贡献。这些贡献说到底就是如何处理对同类现象不同个体的观察数据,并找出数据中隐藏的规律。在格朗脱工作的影响下,德国牧师约翰·彼得·苏斯密尔希(Johann Peter Süssmilch,1707~1767)继续研究人口数据中的规律,写了一本书叫做《神的秩序》(1741)。他在这本书中比格朗脱进了一步,明确提出,数据中隐藏的规律(他称之为“神定的秩序”)必须在大量的数据中才能揭示出来。所以统计史公认他是明确倡导大量观察法的第一人④(参见[1]第22~26页,[2]第46~49页,[4]第117页)。
十九世纪中叶,比利时统计学家亚道尔夫·凯特勒(L.A.J.Quetelet,1796~1874)继续倡导大量观察法,认为“对性质相同的事物作大量的观察和数量的比较”,可以得到“平均人”(转引自[2],第89页)。他所说的“平均人”是指用我们作大量观察的人群中得到的各种特征的平均值表示的一个典型化、抽象化了的人。实际上这是在大量观察数据中揭示出来的人的各种特征的规律值。无疑(凯特勒自己也指出),进行大量观察的数据应当是同质的。那么,当我们面临一批我们对其背景不很了解的数据时,如何根据数据本身去判断其同质性呢?凯特勒把高斯发现的反复测量同一物体得到的测量误差分布的规律——正态分布——