应用统计复习重点
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
应用统计学
第一章导论
标志:是指表明总体各单位共同具有的属性或特征的名称。
标志表现:各个总体单位在某一标志上的具体表现,或叫做标志值(数据)。
姓名性别年龄工种工资
甲男32 车工812
乙女25 钳工500
丙男40 铣工900
标志和标志表现中的几个问题
1.分类
按标志值是数量还是文字符号分:数量标志和品质标志
按标志值是否可变分:可变标志和不变标志
判断:数量标志一定是可变标志
2. 统计数据类型
品质标志值有时用分类数据来表示对应的标志,此时我们可以得到分类数据
品质标志值有时用顺序数据来表示对应的标志,此时我们可以得到顺序数据
数量标志值用数值型数据来表示对应的标志,我们可以得到数值型数据
3.变量(Variable)的概念
广义的变量:与常量相对应。不变标志是常量,那么可变标志就是变量。
狭义的变量:特指可变的数量标志。
变量又可分为:离散变量和连续变量
统计指标的表现形式
数量指标:描述总体绝对数量规模或水平的外延性统计指标
质量指标:描述总体数量相对程度或一般水平的内涵型统计指标
总量指标:数量指标的表现形式,具体数值表现为绝对数
总量指标分类
按照说明总体的内容的不同分:总体单位指标和总体标志指标
按照反映的时间状态不同分:时期指标和时点指标
质量指标:描述总体数量相对程度或一般水平的内涵型统计指标
相对指标:质量指标的一种表现形式,通过两个有联系的统计指标对比得到,具体数值表现为相对数
结构相对指标=总体部分数值/总体全部数值;
比例相对指标=总体某部分数值/总体不同部分数值;
强度相对指标=某一总体指标数值/另一有联系的总体指标数值
动态相对指标(比如发展速度=报告期指标数值/基期指标数值)
比较相对指标=某条件下的某类指标数值/另一条件下的同类指标数值
计划完成程度相对指标=实际完成指标数值/计划任务数值
平均指标:第四章具体介绍
平均指标:质量指标的另一种表现形式,是总体一般水平的代表值,其具体数值表现为平均数
统计数据还有其他的分类
观测数据和实验数据——按照统计数据收集的方法不同区分数据类型
截面数据和时间序列数据——按照数据与时间的关系区分数据类型
§1.3 统计中的几个基本概念
总体(Population)和样本(Sample)
参数(Parameter)与统计量(Statistic)
变量(Variable)
总体(Population)是包含所研究的全部个体(数据)的集合,它通常由所研究的一些个体或者总体单位组成。
样本(Sample)是从总体中抽取的一部分元素的集合。样本是总体的一个子集。
从总体中获取样本的过程叫做抽样。
理解
总体和个体(总体单位)是相对的,可以相互转化。
描述总体的数据是统计指标,描述个体的数据就是变量值或者标志值。
统计指标通常由标志值用统计学的技术和方法加工而来。
总体的确定
根据研究目的确定
检验一批灯泡的寿命
检验一条生产线生产的灯泡的寿命
有限总体与无限总体
对总体的研究常常通过样本进行推断
统计上的总体表现为一组观测数据,观测数据的载体是个体
参数(Parameter)与统计量(Statistic)
前提:当使用样本推断总体时,会计算统计量,推断总体参数
参数(Parameter)是用来描述总体特征的概括性数字度量,它是研究者想要了解的总体的某种特征值。如:总体均值“μ”总体标准差“σ”总体比例“π”
统计量(Statistic)是用来描述样本特征的概括行数字度量,根据样本计算出来。X(x均值打不出来)表示样本平均数,s表示样本标准差,p表示样本比例。
注意:当总体与个体或总体单位相对存在时,我们常常使用统计指标和标志值。
变量(Variable)
我们在研究样本时,首先是设定一些变量,获取样本中每一个个体的数据值,从数据值进一步计算出样本统计量,进而推断总体参数。
根据计量尺度分类
1.分类变量(Categorical Variable)
2.顺序变量(Rank Variable)
3.数值型变量(Metric Variable)
按时间尺度分类
静态数据(截面数据)是不同主体在同一时间点或同一时间段的数据,表示现象在特定时间、空间相对静止状态下的数据
动态数据(时间序列数据)现象在演变过程中的数据
第二章统计数据搜集
1 数据的来源
数据的间接来源
这是一种我们在研究和学习中使用最多的数据来源
优点:易得、低成本(相对)、取得效率高、数据内容广泛、数据专业性强
缺点:相关性问题、真实性问题、数据与研究的一致性问题
数据的直接来源
通过调查方法获得的数据称为调查数据——社会经济数据往往来源于调查数据、
通过实验方法获得的数据称为实验数据——研究自然现象的数据常常来源于实验数据
优点:适配性强、时效性好、可以获得非常细节的数据
缺点:成本高、取得数据效率低、数据内容狭窄
理解:任何间接数据都来源于直接数据。
2 如何获取调查数据*
调查方法
概率抽样(概念、特点、分类)
概率抽样方法——简单随机抽样
概率抽样方法——分层抽样:先分层,后从各层中随机抽样
概率抽样方法——整群抽样:先将总体中若干单位合并为组(群),后抽取群,对群实施全面调查
概率抽样方法——系统抽样:先将总体的各单位按照某一标志进行排序,在(1,k)之间确定一个初始单位,然后依照初始单位+nk的办法抽样。
概率抽样方法——多阶段抽样:首先抽取群,可以多次抽取群,最终从群中随机抽取若干单位进行调查。
非概率抽样的实施:
目的抽样:调查者主管选择研究对象
方便抽样:偶遇抽样,如医生选择病人样本
判断抽样:即目的抽样,是方向抽样的延伸。如重点抽样、典型抽样、代表抽样等
自愿样本:被调查对象中个体自愿参加。问卷星
滚雪球抽样(推荐抽样):对稀少群体调查
配额抽样:与概率抽样中分层抽样类似,先确定类别及比例,再利用方便抽样或判别抽样,从每一类中按比例选择需要的样本单位数。
注意:非概率抽样不能用样本推断总体
概率抽样和非概率抽样的区别
收集数据的方式: