中级统计师《统计基础理论》教材笔记

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

第一章统计和数据

一.统计的含义

统计学是用以收集数据,分析数据和由数据得出结论的一组概念、原则和方法。统计分析数据分为描述统计和推断统计两大类。

描述统计是研究数据搜集、处理和描述的统计学方法。其内容包括如何取得研究所需要的数据,如何用图表形式对数据进行处理和展示,如何通过对数据的综合、概括与分析,得出所关心的数据特征。

推断统计则是研究如何利用样本数据来推断总体特征的统计学方法,内容包括参数估计与假设检验两大类。

二、数据类型:

1.定性变量的观察结果称为定性数据,这类数据的最大特点是它只能反映现象的属性特点,不能说明具体量的大小和差异。如天气形势:天气晴和阴转多云,职业:生产工人、公务员,教育程度:小学、大学等。这种只能反映现象分类特征的变量又称为分类变量,分类变量的观察结果就是分类数据。如果类别具有一定的顺序,如教育程度,中学的教育程度就是比小学高,大学又比中学高,这样的变量称为顺序变量,相应的观察结果就是顺序数据。

用数值表示其观察结果,而且这些数值具有明确的数值含义,不仅能分类而且能测量出来具体大小和差异,这些变量就是定量变量,也称为数值变量,定量变量的观察结果成为定量数据。如天气温度、上证股指、月收入。

分类变量没有数值特征,所以不能对其数据进行数学运算。分类变量只能用来区分事物,而不能用来表明事物之间的大小、优劣关系。

顺序变量不仅能用来区分客观现象的不同类别,而且还可以表明现象之间的大小、高低、优劣关系。顺序变量之间虽然可以比较大小,却无法计算相互之间的大小、高低和优劣的距离。

很多适用于数值型数据的统计方法并不适用于定性数据,但适用于定性数据的方法则大多可以应用于数值型数据。

2.观测和实验数据

观测数据是对客观现象进行实地观测所取得的数据,在数据取得的过程中一般没有人为的控制和条件约束。是取得数据最主要的方法,用各种调查方法得到的数据都属于观测数据。观测数据可能是全面数据也可能是样本数据。

实验数据一般是在科学实验环境下取得的数据。自然科学研究中所用的数据多为实验数据。

三、数据来源与搜集方法

1.从使用者的角度来看,统计数据资料的来源主要有两种渠道:一种是通过直接的调查或实验获得的原始数据,这是统计数据的直接来源,一般称之为原始或第一手统计数据;另一种是别人调查的数据,并将这些数据进行加工和汇总后公布的数据,通常称之为次级数据或第二手间接的统计数据。一切间接的统计数据都是从原始的、第一手数据过渡而来的。

统计调查或进行实验就是统计数据的直接来源。

数据的间接来源有以下一些:一是公开出版的统计数据,主要来自官方的统计部门和政府、组织、学校、科研机构;二是尚未公开发表的统计数据。

在应用间接数据时应注意以下问题:一是否了解并正确理解了间接数据中变量的含义、计算口径、计算方法,以防止误用、错用他人的数据;二引用间接数据时要注明数据来源,尊重他人的劳动成果和知识产权。

2.搜集数据的方法:

常用的统计调查种类有:

普查:特点是一种全面调查,具有资料包括范围全面、详尽、系统的优点;它是一次性的专门调查,因为普查的工作量大,耗资也多,时间周期较长,一普查不宜经常举行。

抽样调查:例如,想了解某学校学生的零花钱支出情况,可以从中抽了一个样本获得样本数据。这里“全校所有学生”就是总体;从全校学生中抽取300人进行调查,这就是一个样本,构成样本的元素的数目称为样本量。

抽样调查的特点:一是样本单位按随机原则抽取,排除了主观因素对选取样本单位的影响;二是能够根据部分调查的实际资料对调查对象的总体的数据特征进行推断,从而达到对调查总体的认识;三是在抽样调查中会存在抽样误差,但是这个误差可以事先计算并加以控制。

抽样调查既能节省人力、物力、财力,又可以提高资料的时效性,而且能取得比较正确的全面统计资料,具有许多优点。是一种非全面的、一次性的或经常性的专门调查,使用非常广泛。

抽样方法主要有两种:概率抽样和非概率抽样。

从理论上讲,概率抽样是最科学的抽样方法。常用的概率抽样形式为简单随机抽样;分层抽样;整群抽样;系统抽样又称为等距抽样。

非概率抽样由于方法简单、经济,所以也是人们常用的方法。

统计报表:

按报送范围分为全面报表和非全面报表;按报送周期来分分为月报、季报、年报;

统计报表的内容包括以下几个方面:

一是表式;二是填表说明:具体有填报范围、指标解释、分类目录、其他有关事项的规定。

重点调查:

当调查的任务只要求掌握事物的基本善与基本的发展趋势,不要求掌握全面的准确资料,而且在总体中确实存在着重点单位时,进行重点调查是比较适宜的。重点调查可以节省人力、财力,而且及时。

典型调查:

有意识地选择若干具有典型意义的或有性的单位进行调查。主要作用是一是补充全面调查的不足;二是在一定的条件下可以验收全面调查数据的真实性;具有灵活机动、通过少数英武即可取得深入、详实的统计资料的优点。但是在这种调查由于受“有意识地选也若干有代表性”的限制,在很大程度上受人们主观认识的影响,因此,必须同其他调查结合起来使用,才能避免出现片面性。

各类统计调查方法的特点:

第二章数据描述

一、用图表展示定性数据

定性数据包括分类数据和顺序数据,可能用频数分布表和图形来描述。常用饼图和条形图、环形图表示。

饼图:又称圆饼图、图形图,是利用圆形及圆内扇形面积来表示数值大小的图形。

条形图:用宽度相同的条形的高度或长度来表述数据多少的图形。

环形图:环形图是由两个及两个以上大小不一的饼图叠在一起,挖去中间的部分所构成的图形。

二、用图表展示定量数据

定性数据图示的表示方法,也都适用于定量数据。定量数据有一些特定的图示方法,并不适用于定性数据。

一般的分级个数在5-15之间。最大值为上限,最小值为下限。

组距=上限-下限

采取上限不在内的原则,计算在与下限相同的组内。

常用来表述定量数据的统计图形有直方图、折线图、散点图,还有茎叶图、箱线图。

直方图:横坐标代表变量分组,纵坐标代表各变量值出现的频数。

用统计表来表示数据

统计表由五个部分组成:表头、行标题、列标题、数字资料和表外附加构成。

表头放在表的上方,说明的是表的主要内容;

相关文档
最新文档