统计学期末以及考研复习知识点(内容详细)
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
统计学知识点
第一章绪论
1、今天,“统计”一词有三种含义:
⒈统计工作:搜集、整理和分析统计数据的活动。
⒉统计数据:统计工作的成果。
⒊统计学:指导统计工作的理论。如数理统计学,社会统计学,经
济统计学,应用统计学等。
统计三个含义的关系十分密切:统计工作与统计数据是过程与成果的关系;统计工作与统计学是实践与理论的关系。
2、第一部统计学著作是英国人威廉·配第(1623—1687)的《政治算
术》(1690)一书。
3、统计学是一门搜集、整理、显示和分析统计数据的科学,其目的
是探索数据内在的数量规律性。
4、统计工作全过程一般可以划分为四个环节:
统计设计、统计调查、统计整理、统计分析
5.统计的基本方法
大量观察法、综合分析法(整理、分析)、归纳推断法(分析)
6、统计学与其他学科的关系
(一)统计学与数学的关系
区别:首先,数学研究抽象的数,统计学则研究具体事物的数量;
其次,数学使用纯粹的演绎方法,而统计学则使用演绎与归纳相结合的逻辑方法。
(二)统计学与其他学科的关系
凡涉及处理实质性数据的学科都要以统计方法为工具。可以说,统计学是其他学科的工具。
第二章调查与整理
1、目前,数据的计量尺度由粗略(低级)到精确(高级)分为四个层次,即列名尺度、顺序尺度、定距尺度和定比尺度。
1.列名尺度:按照事物的某种属性对其进行平行的分类。例如,人按性别分为男、女,……。该尺度的数据不能比较大小、优
劣。
2.顺序尺度:对事物之间等级差或顺序差别的一种测度。例如,考试成绩可分为优、良、中、……。该尺度的数据能比较优劣,不能进行数学运算。
3.定距尺度:对事物之间等级差或顺序差别较精确地定量测度。
如考试成绩的95 分、86 分、……;天气温度的50C、00C、-50C、……。该尺度的“0”表示一个水平。该尺度的数据能
进行加、减运算。
4.定比尺度:用来表明数值中存在绝对零点状况下数量特征的描述尺度。例如,企业利润、产品数量等。该尺度的“0”表示“没有”或“不存在”。该尺度的数据能进行加、减、乘、除运算。
2、数据的类型
1.定性数据。也称品质数据,由列名尺度或顺序尺度计量形成,说明事物品质特征,通常用文字描述。
2.定量数据。也称数量数据,由定距尺度或定比尺度计量形成,说明现象的数量特征,用数值表示。
3、统计指标构成要素:①指标名称;②计量单位;③计算方法;④
空间限制;⑤时间限制;⑥指标数值。
4、统计指标的特点:①数量性。②综合性。③具体性。
5、标志按其表现形式不同分为数量标志和品质标志;
标志按其在总体内是否有变异分为不变标志和可变标志。
6、标志与指标的区别:①标志是说明单位的,指标是说明总体的。
②标志有不用数值表示的品质标志,而指标都是用数值表示的。
7、统计指标按表现形式可分为绝对指标、相对指标和平均指标。
8、总量指标按其反映的内容不同,分为总体单位总量和总体标志总
量,简称为单位总量(N)和标志总量(ΣX i)。
9、总量指标按其计量单位不同,分为实物量指标、劳动量指标和价
值量指标。
10、统计调查方式。普查、抽样调查、统计报表、重点调查和典型调
查。
11、调查方案设计。⑴调查目的;⑵调查对象和调查单位;⑶调查项目
和调查表;⑷调查方法;⑸调查时间;⑹调查组织与实施。
12、分组原则:①“相斥”原则;②“穷尽”原则。
13、分组作用:①划分现象的类型;②反映总体的结构;③表明现象
之间的依存关系。
14、确定实际组限的原则有两个:一是“同组同质原则”;二是“上
组限不在内原则”。
15、确定组距的原则有4个:①质别原则(不同质数据分在不同组内);
②特征原则(准确显示同质数据的分布特征);③便利原则(为后续
工作提供方便);④大量原则(所分的每一组都是一个小总体,因而每组应有若干个数据)。综合考虑这4个原则,确定组距为5件。每组起点数值的个位定为0或5。
第三章数据分布特征的描述
1、极差也称全距,是一组数据的最大值与最小值之差。极差计算简
单,易于理解。实践中,常用于工业产品质量的检查和控制。2.统计表的形式。统计表由标题、横行、纵栏和统计数字四部分组成。
3.统计表的种类。统计表按主词的分组情况可分为三种:
⑴简单表:主词不分组的统计表。⑵分组表:主词进行简单分组
的统计表。⑶复合表:主词进行复合分组的统计表。例如
第四章概率与概率分布
⒈古典定义:某一事件A发生的概率,是该事件所包含的基本事件
数m与基本空间中基本事件总数n的比值。(客观存在)
⒉统计定义:在相同条件下重复进行n次试验,事件A发生m次,
随着试验次数n的增大,事件A发生的频率m/n围绕某一常数p 上下波动的幅度愈来愈小,且逐步趋于稳定,则称p为事件A的概率。(多次试验)
⒊主观定义:人们根据经验和所掌握的有关信息,对事件发生的可
能性大小给出的估计值。(调查研究)
4、随机变量的概念。描述随机现象某一侧面的变量。
5、随机变量的特点。①取值的随机性;②取值的规律性。
6、大数定律是阐述大量随机变量的平均结果具有稳定性的一系列定
律的总称。本节只介绍两个最常用的大数定律。
⒈独立同分布大数定律该定律表明,当n足够大时,独立同分
布的一系列随机变量的均值接近(依概率收敛于)数学期望,即平
均数具有稳定性。
⒉贝努力大数定律该定律表明,当n足够大时,事件A发生的
频率接近于事件A发生的概率,即频率具有稳定性。
第五章抽样与抽样估计
⒈全集总体。也叫母体,简称为总体,是指所要认识对象全部单位
的集合体,它是由具有某种共同性质的许多单位组成的。
⒉抽样框:包括全部抽样单位的名单框架。
抽样框的形式:①名单抽样框:可供抽取的所有总体单位的名录
一览表,如企业名单等;②区域抽样框:按地理位置将总体范围
划分为若干小区域,以小区域为抽样单位;③时间表抽样框:把
总体的时间过程分为若干个小的时间单位作为抽样单位,如对流
水线上24小时内生产的产品进行质量抽查时,以10分钟为一个
抽样单位。
3、总体与抽样框的关系:①一致型②包容型
4、抽样调查误差包括登记性误差和代表性误差(随机误差、系统误差)