应用统计复习重点

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

应用统计学

第一章导论

标志:是指表明总体各单位共同具有的属性或特征的名称。

标志表现:各个总体单位在某一标志上的具体表现,或叫做标志值(数据)。

姓名性别年龄工种工资

甲男32 车工812

乙女25 钳工500

丙男40 铣工900

标志和标志表现中的几个问题

1.分类

按标志值是数量还是文字符号分:数量标志和品质标志

按标志值是否可变分:可变标志和不变标志

判断:数量标志一定是可变标志

2. 统计数据类型

品质标志值有时用分类数据来表示对应的标志,此时我们可以得到分类数据

品质标志值有时用顺序数据来表示对应的标志,此时我们可以得到顺序数据

数量标志值用数值型数据来表示对应的标志,我们可以得到数值型数据

3.变量(Variable)的概念

广义的变量:与常量相对应。不变标志是常量,那么可变标志就是变量。

狭义的变量:特指可变的数量标志。

变量又可分为:离散变量和连续变量

统计指标的表现形式

数量指标:描述总体绝对数量规模或水平的外延性统计指标

质量指标:描述总体数量相对程度或一般水平的内涵型统计指标

总量指标:数量指标的表现形式,具体数值表现为绝对数

总量指标分类

按照说明总体的内容的不同分:总体单位指标和总体标志指标

按照反映的时间状态不同分:时期指标和时点指标

质量指标:描述总体数量相对程度或一般水平的内涵型统计指标

相对指标:质量指标的一种表现形式,通过两个有联系的统计指标对比得到,具体数值表现为相对数

结构相对指标=总体部分数值/总体全部数值;

比例相对指标=总体某部分数值/总体不同部分数值;

强度相对指标=某一总体指标数值/另一有联系的总体指标数值

动态相对指标(比如发展速度=报告期指标数值/基期指标数值)

比较相对指标=某条件下的某类指标数值/另一条件下的同类指标数值

计划完成程度相对指标=实际完成指标数值/计划任务数值

平均指标:第四章具体介绍

平均指标:质量指标的另一种表现形式,是总体一般水平的代表值,其具体数值表现为平均数

统计数据还有其他的分类

观测数据和实验数据——按照统计数据收集的方法不同区分数据类型

截面数据和时间序列数据——按照数据与时间的关系区分数据类型

§1.3 统计中的几个基本概念

总体(Population)和样本(Sample)

参数(Parameter)与统计量(Statistic)

变量(Variable)

总体(Population)是包含所研究的全部个体(数据)的集合,它通常由所研究的一些个体或者总体单位组成。

样本(Sample)是从总体中抽取的一部分元素的集合。样本是总体的一个子集。

从总体中获取样本的过程叫做抽样。

理解

总体和个体(总体单位)是相对的,可以相互转化。

描述总体的数据是统计指标,描述个体的数据就是变量值或者标志值。

统计指标通常由标志值用统计学的技术和方法加工而来。

总体的确定

根据研究目的确定

检验一批灯泡的寿命

检验一条生产线生产的灯泡的寿命

有限总体与无限总体

对总体的研究常常通过样本进行推断

统计上的总体表现为一组观测数据,观测数据的载体是个体

参数(Parameter)与统计量(Statistic)

前提:当使用样本推断总体时,会计算统计量,推断总体参数

参数(Parameter)是用来描述总体特征的概括性数字度量,它是研究者想要了解的总体的某种特征值。如:总体均值“μ”总体标准差“σ”总体比例“π”

统计量(Statistic)是用来描述样本特征的概括行数字度量,根据样本计算出来。X(x均值打不出来)表示样本平均数,s表示样本标准差,p表示样本比例。

注意:当总体与个体或总体单位相对存在时,我们常常使用统计指标和标志值。

变量(Variable)

我们在研究样本时,首先是设定一些变量,获取样本中每一个个体的数据值,从数据值进一步计算出样本统计量,进而推断总体参数。

根据计量尺度分类

1.分类变量(Categorical Variable)

2.顺序变量(Rank Variable)

3.数值型变量(Metric Variable)

按时间尺度分类

静态数据(截面数据)是不同主体在同一时间点或同一时间段的数据,表示现象在特定时间、空间相对静止状态下的数据

动态数据(时间序列数据)现象在演变过程中的数据

第二章统计数据搜集

1 数据的来源

数据的间接来源

这是一种我们在研究和学习中使用最多的数据来源

优点:易得、低成本(相对)、取得效率高、数据内容广泛、数据专业性强

缺点:相关性问题、真实性问题、数据与研究的一致性问题

数据的直接来源

通过调查方法获得的数据称为调查数据——社会经济数据往往来源于调查数据、

通过实验方法获得的数据称为实验数据——研究自然现象的数据常常来源于实验数据

优点:适配性强、时效性好、可以获得非常细节的数据

缺点:成本高、取得数据效率低、数据内容狭窄

理解:任何间接数据都来源于直接数据。

2 如何获取调查数据*

调查方法

概率抽样(概念、特点、分类)

概率抽样方法——简单随机抽样

概率抽样方法——分层抽样:先分层,后从各层中随机抽样

概率抽样方法——整群抽样:先将总体中若干单位合并为组(群),后抽取群,对群实施全面调查

概率抽样方法——系统抽样:先将总体的各单位按照某一标志进行排序,在(1,k)之间确定一个初始单位,然后依照初始单位+nk的办法抽样。

概率抽样方法——多阶段抽样:首先抽取群,可以多次抽取群,最终从群中随机抽取若干单位进行调查。

非概率抽样的实施:

目的抽样:调查者主管选择研究对象

方便抽样:偶遇抽样,如医生选择病人样本

判断抽样:即目的抽样,是方向抽样的延伸。如重点抽样、典型抽样、代表抽样等

自愿样本:被调查对象中个体自愿参加。问卷星

滚雪球抽样(推荐抽样):对稀少群体调查

配额抽样:与概率抽样中分层抽样类似,先确定类别及比例,再利用方便抽样或判别抽样,从每一类中按比例选择需要的样本单位数。

注意:非概率抽样不能用样本推断总体

概率抽样和非概率抽样的区别

收集数据的方式:

相关文档
最新文档