统计学笔记(精修版)
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
绪论
第一节统计学的含义和作用
一、什么是统计学
1.统计学的含义
统计学是有效收集、处理、分析和解释数据,发现规律,以便更好决策的一门方法论学科。
2. 分析数据的方法有描述统计、推断统计。
⑴描述统计
①描述统计是将所收集的数据处理后,用数值、表格或图形形式表现的有用信息。
②描述统计是基础,它为推断统计、统计咨询、统计决策提供必要⑵推断统计就是根据样本数据特征去估计或检验总体的数据特征。
二、统计学的作用和重要性
1.统计学的作用
人们用数据发现的规律做出更好的决策。
2.要发现规律,对统计数据通常有要求:客观性、适用性、准确性
和及时性。
三、统计学是如何解决实际问题的?
统计学解决实际问题的基本思路是:
①提出与统计有关的实际问题;
②建立有效的指标体系;
③收集数据;
④选用或创造有效的统计方法处理、显示所收集数据的特征;
⑤根据所收集数据的特征、结合定性、定量知识作出总体特征的合理推断;
⑥根据推断给出更好决策的建议;
不解决问题时,重复第②-⑥步。
第二节统计学的基本概念
一、总体、单位和样本
1.总体
统计总体是根据一定目的确定的,由客观存在的、具有某种同质性的许多个别事物构成的整体。
⑴同质性是确定统计总体的基本标准,它是根据统计的研究目的而定的。研究目的不同,所确定的总体也不同,其同质性的意义也随之变化。
⑵统计总体还应具备大量性,即统计总体应应该由足够数量的同质性单位构成。
2.总体单位(简称单位)是组成总体的各个个体。如典型案例1中英军的每架战机;事例4中的每个居民。
3.由总体的部分单位组成的集合称为样本(又称子样)。构成样本的单位称为样品,样本中样品的数目称为样本容量。
4. 统计学解决问题的目的是认识总体的数据特征。但是,当调查是破坏性的,或者出于成本、时间等因素考虑时,不必要或不可能对构成总体的所有单位都进行调查。
二、标志、指标(参数)和统计量
1.标志:
(1)总体单位普遍具有的属性或特征称为标志。
(2)标志按其表现分为品质标志和数量标志两种。
①品质标志表明单位属性方面的特征,品质标志的表现只能用非
数值来描述.
(如:典型案例1中英军战机的类型,事例4中每个居民的性别。)
②数量标志表明单位数量方面的特征,其表现用数值来描述
(如: 典型案例1中英军战机的弹孔位置,事例4中每个居民的收入。)
2.参数(标志)
⑴统计总体具有的数量特征的概念和数值称为统计指标,也称为参数。
⑵统计指标由两项基本要素构成,即指标的概念和指标的取值。
(指标的概念是对所研究现象本质的抽象概括,也是对总体数量特征的质的规定性。)
(例如事例4中居民人口数100万人,总收入31.4亿元。)
⑶统计指标按表示形式可以分为数量指标和质量指标.
①凡是反映现象总规模、总水平的统计指标称为数量指标,用绝对数来表示。例如事例 4中居民总数100万人、总收入31.4亿元等,
②凡是反映现象相对水平和工作质量的统计指标称为质量指标,用相对数或平均数来表示.例如企业职工平均工资5000元、工人出勤率93%等。质量指标是总量指标的派生指标,以反映现象之间的内在联
系和对比关系。
⑷单个指标不能反映总体的全貌,这便需要设立指标体系。统计指标体系是由一系列相互联系的统计指标组成的有机整体,用以反映所研究现象各方面相互依存相互制约的关系。
3.统计量
⑴统计量是样本观测量的一个已知函数,用来说明样本的特征。是样本观测量的一个已知函数,用来说明样本的特征。
⑵抽取的样本不同,统计量的观测值也就不同。如样本平均数、样本方差、样本比例是统计量,抽取样本后,人们通常用与总体参数对应的统计量观测值, 作为总体参数的估计.
(如某汽车制造企业从生产的一批轿车中抽取了16辆轿车,用这些轿车的平均行驶里程值、合格率值分别作为该批轿车平均行驶里程、合格率的估计。)
三、数据
(一)变量与变量值
1.即说明现象的某一事实或数量的特征称为变量,将上述标志、指标和统计量的名称进行归纳就是变量。
2.变量的具体表现是变量值,数据就是变量及其表现,也可称为反映客观事物的事实或数量依据。
如:收入是一个变量,收入的表现是变量值。
3.将在特定研究过程中收集的所有数据集合在一起,称为数据集。
4.根据变量值的确定与否,变量分为确定性变量(受确定性因素影
响,因素是明确的,可解释,可控制的)与随机变量(受许多不确定因素影响,如员工的起床时间)。
(二)数据的计量尺度
收集数据时需要用到以下四种由低到高的计量尺度:定类尺度、定序尺度、定距尺度和定比尺度,计量尺度的不同决定了不同的数据分析与处理方法。
1.定类尺度是说明客观现象无序类别的计量。定类尺度的主要数学特征是“=”或“≠”.如居民的性别是男、女计量,战机的类型是战斗机、轰炸机、侦察机等计量,这一场合的所使用的数值只作为无序分类的代码。
2. 定序尺度是说明客观现象有序类别的非数值计量。定序尺度的主要数学特征是“<”或“>”.例如,对居民的满意度计量可以分为非常满意、满意、一般、不满意、非常不满意五类。这一场合的所使用的数值只作为有序分类的代码。
3. 定距尺度是说明客观现象数值间距有意义的计量。其用确切的数值反映现象之间在量方面的差异,定距尺度的主要数学特征是“+”“–” 。如总量指标是定距尺度计量的。
(0不代表不存在)
4.定比尺度是说明客观现象两个数值比有意义的计量。定比尺度的主要数学特征是“x”“/”
如质量指标中的相对数、平均数是定比尺度计量的(0代表不存在)5数据分类