《统计学》课程 学习指南

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

第一章统计学及其基本概念
一、学习指导
本章介绍统计学的一些基本问题。

通过本章学习可以知道和掌握统计的含义,统计的内容和统计学的产生和发展。

认识数据的类型,理解和掌握统计学的基本概念。

了解统计计算的软件工具。

本章各节的主要内容和学习要点见下表。

二、主要术语
1.统计:统计工作、统计资料和统计学。

2.统计工作:为了认识和管理的需要,对社会经济现象和自然现象进行数量收集的活动。

3.统计资料:统计工作过程中所取得的各项数字资料以及与之相关信息的总称。

4.统计学:在统计工作的经验积累到一定程度时自然产生的,它是收集、整理、描述和分析统计数据的方法和技术,为决策提供“量”方面的依据。

5.描述统计:研究如何取得反映客观现象的数据,并通过图表形式对所收集的数据进行加工处理和显示,进而通过综合、概括与分析得出反映客观现象的规律性数量特征。

6.推断统计:研究如何根据样本数据去推断总体数量特征的方法,它是在对样本数据进行
描述的基础上,对统计总体的未知数量特征作出以概率形式表述的推断。

7.数据:进行各种统计、计算、科学研究或技术设计等所依据的数值。

8.分类数据:对事物进行分类的结果。

9.顺序数据:也称等级数据,是对事物进行分类的结果,并表现出明显的顺序或等级关系。

10. 数值型数据:使用自然或度量衡单位对事物进行测量的结果,其结果表现为具体数值。

11. 时间序列数据:在不同时间上收集到的数据,它所描述的是现象随时间而变化的情况。

12. 截面数据:在相同或近似相同的时间点上收集的数据,它所描述的是现象在某一时刻或某一时间段的变化情况,
13. 面板数据:对若干个单位在不同时间进行重复跟踪调查所形成的数。

14.统计总体:是统计所要研究的事物或现象的全体,即由客观存在的,具有某种共同特征的许多个别事物构成的整体。

15.个体:构成统计总体的个别事物,又称为总体单位。

16.样本:指从统计总体中抽取出来作为代表这一总体的、由部分个体组成的样本总体,其目的是用来推断总体。

17.统计标志:指每个个体所共同具有的属性或特征,它是说明个体的属性或特征的具体名称。

18.品质标志:表明个体属性方面的特征,品质标志的标志表现只能用文字说明,不能用数量表示,即得到分类数据和顺序数据,
19.数量标志:表明个体数量特征的,其标志表现只能用数字表现,即得到数值型数据。

20.不变标志:指某一标志对所有个体而言,具体表现都是相同的,
21.可变标志:指某一标志在各个个体之间的具体表现不尽相同,
22.统计指标:反映总体数量特征的,由各个个体的标志值汇总综合而成。

23. 数量指标:反映客观事物的规模或水平的指标。

24. 质量指标,反映客观现象之间的相互联系、比例关系、发展速度、内部结构的指标。

25.总体指标:了解的总体的某个特征值。

26.样本指标:根据样本数据计算出来的一个量。

27.统计指标体系:一系列相互联系、相互制约的多个统计指标就构成。

28.变量:现象本身所固有的、随条件变化而变化的量。

29.自变量:自身变化会引起其他变量变化的量;
30.因变量:受其他变量影响而变化的量。

31.确定性变量:受确定性因素影响的变量,这种影响变量值变化的因素是明显的、可解释的、人为的或者受人控制的,其影响变量值的大小、方向都可以确定。

32. 随机变量:受随机性因素影响的变量,所谓随机性因素,是指各种不确定的、偶然性的因素,这种因素对变量影响的大小和方向都是不确定的,通常是微小的。

33.离散型变量:一个变量相邻的两个变量值之间不可能再分割出新的变量值。

34.连续型变量:一个变量相邻的两个变量值之间可以继续分割,取得新的变量值。

三、典型习题
一、单项选择题
1. 推断统计学研究()。

A.统计数据收集的方法B.数据加工处理的方法
C.统计数据显示的方法D.如何根据样本数据去推断总体数量特征的方法
2. 在统计史上被认为有统计学之名而无统计学之实的学派是()。

A.数理统计学派 B.政治算术学派 C.社会统计学派 D.国势学派
3. 下列数据中哪个是定比尺度衡量的数据()。

A.性别 B.年龄 C.籍贯 D.民族
4. 统计对总体数量特征的认识是()。

A.从定性到定量B.从定量到定性C.从个体到总体D.从总体到个体
5. 调查10个企业职工的工资水平情况,则统计总体是()。

A.10个企业
B.10个企业职工的全部工资
C.10个企业的全部职工
D.10个企业每个
职工的工资
6. 从统计总体中抽取出来作为代表这一总体的、由部分个体组成的集合体是().
A. 样本
B. 总体单位
C. 个体
D. 全及总体
7. 三名学生期末统计学考试成绩分别为80分、85分和92分,这三个数字是()。

A. 指标
B. 标志
C. 变量
D. 标志值
8. 以一、二、三等品来衡量产品质地的优劣,那么该产品等级是()。

A. 品质标志
B. 数量标志
C. 质量指标
D. 数量指标
9. 出勤率、废品量、劳动生产率、商品流通费用额和人均粮食生产量五个指标中,数
量指标有()。

A. 一个
B. 二个
C. 三个
D. 四个
10.()是用一系列相关联系、相互制约的统计指标反映总体的多个方面。

A. 标志体系
B. 指标体系
C. 标志系统
D. 指标系统
二、多项选择题
1.“统计”一词通常的涵义是指()()()()()。

A.统计学 B.统计工作 C.统计资料 D.统计局 E. 统计核算体系
2、描述统计内容包括()()()()()。

A.统计数据收集方法 B.数据加工处理方法 C.统计数据显示方法
D.数据分布特征的概括 E.抽样推断方法
3. 根据统计分析方法的研究和应用来分,可将统计学分为()()()()()。

A.应用统计学B.推断统计学C.理论统计学
D.描述统计学E.统计数学
4. 下列属于应用统计学范畴的是()()()()()。

A.生物统计学B.农业统计学C.卫生统计学
D.社会统计学E.人口统计学
5. 政治算术学派的创始人有()()()()()。

A.阿亨瓦尔B.凯特勤C.威廉·配第 D.恩格尔E.约翰·格朗特
6. 下列各项中,()()()()()是质量指标。

A. 商品销售额
B. 人口密度
C. 学生出勤率
D. 人均粮食产量
E. 平均工资
7.下列各项中,()()()()()是连续型变量。

A. 汽车产量
B.钢铁产量
C.图书馆藏书
D.图书馆面积
E.公交站点数
8. 统计指标的特点是()()()()()。

A. 可量性
B. 大量性
C. 综合性
D. 差异性
E. 具体性
9. 著名的统计分析软件有()()()()()。

A. SAS
B. SNA
C. SPSS
D. STA TISTICA
E. ERP
10. Excel实现统计分析的主要途径是()()()()()。

A. 公式
B. 函数
C. 过程
D. 方程
E. 数据分析工具
第二章数据的收集和整理
一、学习指导
本章介绍数据的收集和整理方法,首先简介了数据来源的两种形式:原始数据和二手数据,其次详细讲解了数据的收集和整理方法,最后重点讲解了次数分布表的编制原则和步骤。

通过本章的学习,同学们应该能够了解数据的来源,理解数据的收集方法,懂得统计调查方案的设计工作和组织方式,明确数据的整理方式,熟练掌握有关数据收集与整理的实践步骤和次数分布表的编制过程。

本章各节的主要内容和学习要点见下表。

二、主要术语和公式
(一)主要术语
1.原始数据(primary source):是反映被调查对象原始状况的资料。

是反映被调查对象原始状况的资料。

如原始记录、统计台帐、调查问卷答案、实验结果等。

2. 次级数据(second-hand source):是已经存在的经他人整理分析过的资料。

如期刊、报纸、广播、电视以及因特网上的资料,各级政府机构公布的资料,企业内部记录和报告等。

3. 调查单位:是指所需要研究调查的个体,即所要调查的具体单位,它是进行调查登记的标志承担者。

而报告单位则是负责上报调查资料的单位,两者有时一致,有时不一致。

4. 调查对象:是指需要研究调查的由许多性质相同的调查单位所组成的现象总体。

5. 调查项目:就是调查中所要登记的调查单位的特征,即调查单位的标志,它由一系列品质标志和数量标志所构成。

6. 问卷调查:是一种特殊的调查形式,根据调查目的,在调查对象中随机选择或有意识地确定调查单位。

问卷是以书面文字或表格的形式了解被调查者的意见,被调查者可自愿、自
由地回答问卷中所提出的问题。

7. 统计报表制度:是指依照国家统计局或国家各行政管理部门的规定,自上而下地统一布置,以一定的原始记录为依据,按照统一的表式,统一的指标项目,统一的报送时间与报送程序,自下而上地逐级定期提供基本统计资料的一种调查方式。

8. 普查:是对调查对象的全部调查单位逐一进行的调查。

9. 抽样调查:是一种非全面调查,它是在全部调查单位中抽取一部分单位作为样本进行调查,再根据调查结果反映总体状态的一种调查方法。

9. 简单随机抽样(simple random sampling):又叫纯随机抽样,是最简单、最普遍的抽样组织方法。

它是按照随机性原则直接从总体的所有单位中,抽取若干个单位作为样本,保证总体中每个单位在抽选中都有同等被抽中的机会。

10. 分层抽样(stratified sampling):又叫类型抽样,它是先将总体各单位按某一有关标志分成若干个类型组,然后按照一定比例再从各类型组中随机抽取样本单位。

11. 系统抽样(systematic sampling),又叫等距抽样或机械抽样。

它是先把总体所有单位按某一标志排队,并根据总体单位数N与样本容量n的比例计算出抽样间隔,随机确定一个起始点作为第一个调查单位,以后每隔相等的间隔抽取下一个调查单位。

12. 整群抽样(cluster sampling),将总体所有单位划分为若干个群,然后以群为单位从中随机抽取部分群,对抽中的群内所有单位进行全面调查的抽样组织形式。

13. 多阶段抽样(multiple stage sampling),是将总体分成若干小的群体,但并不在每一小的群体中抽取一个样本,而是将这些小群体称为第一阶抽样单元,将它们看作个体进行抽样,然后,再对抽中的第一阶抽样单元中的个体抽样,这样的抽样当然可以不止二阶而是多阶的,先抽第一阶抽样单元,再在第一阶抽样单元钟抽第二阶抽样单元,再在第二阶抽样单元中抽第三阶抽样单元,如此直至最基层的个体。

当总体中个体数量太大,或其他技术上的原因,无法直接对个体编号时,可以采用多阶抽样,先按第一阶单元编号,抽取若干个,再在抽得的第一阶单元内编号,抽取下一级单元。

14. 重复抽样(sampling with replication)每次从总体中抽取一个样品单位,检验后重新放回总体,参加下次抽样。

15不重复抽样(sampling without repeating)每次从总体中抽取的一个样品单位,检验后不再放回总体,这样下次抽样时不会再次抽到已抽中过的样品单位,因此每个样品单位在各次抽样中被抽中的概率是不同的。

16. 重点调查(key-point survey):是指在调查对象中,选择一部分重点调查单位收集统计资料的一种非全面调查。

17. 典型调查(model survey):是指根据调查目的,在对所研究现象全面分析的基础上,有意识地选择有代表性的典型单位进行深入细致地调查,以便认识事物的本质与发展变化规律的一种非全面调查方法。

18. 现场观察法:是观察者带有明确目的到观察现场,借助人的视觉、听觉或者录音录像设备,对调查对象进行直接观察而获得信息资料的一种收集方法,又称为直接观察法。

19. 报告法:亦称通讯法。

这种方法是被调查者根据统计报表的格式要求,按照隶属关系,逐级向有关部门上报统计资料的一种调查方法。

20. 问卷法:是指资料收集者运用统一设计的问卷向被调查者了解情况、征询意见的资料收集方法。

21. 访谈法:是有目的、有计划、有方向的运用口头交谈方式向被调查者了解问题的一种统
计资料收集方法。

22. 实验采集法:是指资料收集者,通过实验对比获取统计资料的一种方法。

23. 登记误差:调查过程中各有关工作环节的失误而造成的。

24. 代表性误差:是由于非全面调查只观察总体一部分单位,这部分单位不能完全反映总体的性质而产生的误差。

25. 数据分组:是指根据统计总体内在的特征与统计研究的任务需要,将统计总体按照一定的标志划分为若干组成部分的一种统计方法。

26. 次数分布:是指在统计分组的基础上,把总体全部单位按组归类整理,将其按一定顺序加以排列,形成总体中每一个单位在各组间的分布
(二)主要公式
三、典型习题
一、单项选择题
1.小吴为写毕业论文去收集数据资料,()是次级数据。

A.班组的原始记录 B. 车间的台帐 C. 统计局网站上的序列 D. 调查问卷上的答案
2.人口普查规定标准时间是为了( )。

A.避免登记的重复与遗漏B.将来资料具有可比性 C.确定调查单位 D.登记的方便
3.要了解某商场电视机的库存情况,宜采用()。

A.现场观察法B.实验采集法 C.问卷法 D.访谈法
4.检查产品寿命应采用()。

A.普查
B.抽样调查
C.重点调查
D.典型调查
5.为掌握商品销售情况,对占该市商品销售额80%的五个大商场进行调查,这种调查方式属于( )。

A.普查B.重点调查 C.抽样调查 D.统计报表
6. 将总体中的各单位按某一标志排列,再依固定间隔抽选调查单位的抽样方式为()。

A. 分层抽样
B. 简单随机抽样
C. 整群抽样
D. 等距抽样
7. 整群抽样是对被抽中的群作全面调查,所以整群抽样是()。

A. 全面调查
B. 非全面调查
C. 一次性调查
D. 经常性调查
8.统计整理所涉及的资料( )。

A.原始数据
B.次级数据
C.原始数据和次级数据
D.统计分析后的数据
9.在进行数据分组时,首先考虑的是( )。

A.分成多少组B.选择什么标志分组C.各组差异大小 D.分组后计算方便
10.某连续变量数列末位组为开口组,下限为200,相邻组组中值为170,则末位组中值为( )。

A.230
B.200
C.210
D.180
二、多项选择题
1.统计调查方案的主要内容是( )( )( )( )( )。

A.调查的目的 B.调查对象 C. 调查单位 D.调查时间 E.调查项目
2.全国工业普查中( )( )( )( )( )。

A.所有工业企业是调查对象 B.每一个工业企业是调查单位 C.每一个工业企业是报告单位
D. 每个工业企业的总产值是统计指标 E.全部国有工业企业数是统计指标
3.普查是()()()()()。

A.非全面调查
B.专门调查
C.全面调查
D.经常性调查
E.一次性调查
4.全面调查形式有()()()()()。

A.重点调查
B.抽样调查
C.典型调查
D.统计报表
E.普查
5. 哪几种抽样方式可以通过提高样本的代表性而减小抽样误差?( )( )( )( )( )。

A. 分层抽样
B. 简单随机抽样
C. 整群抽样
D. 按有关标志排队的系统抽样
E. 按无关标志排队的系统抽样
6. 根据树苗高度的次数分布表,下面哪些说法是正确的?( )( )( )( )( )。

A. 树苗高度低于110厘米的占总数的39.1%
B. 树苗高度低于110厘米的占总数的84.5%
C. 树苗高度高于130厘米的有19棵
D. 树苗高度高于130厘米的有103棵
E. 树苗高度在130-140厘米之间的树苗占总数的10.9%
三、制表
1. 根据提供的数据集Data1_02(1995年世界各国基本情况),统计出各类宗教信仰和各种地区类别的国家数。

2. 根据提供的数据集Data1_02中F列的“妇女期望寿命”,编制组距式的次数分布表,列出各组的频数和频率,以及向上、向下累积的频数和频率。

第三章统计表和统计图
一、学习指导
统计表和统计图是对收集和整理的数据进行直观展示的重要工具。

知识体系上首先要明确这一章在统计学课程中的地位,与前后章节之间的联系和区别,并结合现实案例强调其应用价值。

通过本章学习,要达到如下学习目标:了解统计表和统计图的基本结构、主要分类和设计规则;理解常用统计表和统计图的应用场合;掌握常用统计表和统计图的具体制作方法。

教学方法实施的基本步骤包括:1、通过展示统计表和统计图的实际案例,归纳出统计表和统计图的基本结构、主要类别和设计规则。

2、通过问题导向法阐明统计表中的数据透视表和汇总统计表的应用场合;结合数据计量尺度类型对统计图的应用场合进行分类。

3、规范演示并提炼制作一张标准的统计表和统计图的基本步骤。

本章各节的主要内容和学习要点见下表。

二、主要术语
统计表:把由统计调查所得来的、经过整理的数据,按一定顺序排列而形成的表格
总标题:简明扼要地说明全表的基本内容的名称
横行标题:表示研究内容类别的名称
纵栏标题:表示研究内容的指标名称
数据透视表:对大量数据快速汇总和建立交叉表的动态工作表
二维透视表:同时对研究对象的两组变量进行交叉汇总的动态工作表
立体透视表:同时对研究对象的三组变量进行交叉汇总的动态工作表
汇总统计表:对多个工作表和工作簿内相类似的数据进行合并计算,并将合并结果放到一张合并工作表
完全相同型合并:实施合并计算的工作表,不仅行、列标题完全一样,而且次序也完全一样,但各个数据区的位置可以不一样的一种合并类型。

不完全相同型合并:当源工作表上数据的行列标题种类和位置不完全相同时,使用行、列标题进行合并计算的一种合并类型。

统计图:简洁直观展示统计资料的一种表达方式。

饼图:用圆形和圆内扇形的面积来表示研究对象的数据值大小的图形。

条形图:用宽度相同的条形的高低或长短表示研究对象数据特征的图形。

直方图:在平面坐标上,以横轴根据各组组距的宽度标明各组组距,以纵轴根据次数的高度标示各组次数绘制成的统计图。

茎叶图:将数组中的数按位数进行比较,将数的大小基本不变或变化不大的位作为一个主干(茎),将变化大的位的数作为分枝(叶),列在主干的后面所形成的图形。

箱线图:由矩形框、触须线、中间纵向直线、奇异值和极值构成的反映数据排序后分布特点的图形。

三、典型习题
一、选择题
1. 现有某公司2007年各季度在各个地区销售各种产品的情况,数据库的四个字段是:地区、季度、商品、销售额。

如果要反映各种商品在各地区和各季度的销售情况,应该绘制( D )。

A.地区和商品的二维透视图 B. 季度和商品的二维透视图
C.地区、季度和销售额的三维透视图 D. 地区、季度和商品的三维透视图
2. 用Excel汇总第二季度中三个月份的资料,用( B )功能。

A.透视表 B. 合并计算 C. 单变量求解 D. 分类汇总
3. 小钱收集了上海、江苏和浙江三省2007年三次产业的增加值的资料,如果要反映2007年这三个省三次产业的结构,用什么图形最为合适?(C)
A. 直方图
B. 散点图
C. 饼图
D. 折线图
4. 完整的统计图应包括( A、B、C、D、E )。

A.标题 B. 坐标轴和网格线 C. 图表区 D. 绘图区 E. 图例
二、制表、制图
1. 根据数据集03,按“教育程度”和“性别”计算2007年考核时各个档次的人数。

2. 根据王小毛、吴燕燕和朱青新三人的一年的销售记录,汇总出各种产品的销售量。

比较这六年产业结构的变化状态,并根据这六年的资料绘制三维百分比堆积柱形图。

3. 仿照例题3.3,根据数据集01中的相关资料,编制1953、1963、1973、1983和1993年的饼图,比较这六年产业结构的变化状态,并根据这六年的资料绘制三维百分比堆积柱形图。

第四章数据的描述性分析
一、学习指导
本章介绍数据的描述性分析方法,通过本章的学习,同学们应该明确数据描述性分析的基本方法,熟练掌握集中趋势描述方法和离散程度描述方法,了解分布偏度与峰度的测度,能够运用本章所学内容结合SPSS统计软件解决具体的实际问题。

本章各节的主要内容和学习要点见下表。

二、主要术语和公式
(一)主要术语
1. 相对指标(relative degree):是两个有联系的指标的比率,如产量计划完成程度、性别比例、人均耕地面积等。

反映相对程度的指标分为六类:计划完成程度相对指标、结构相对指标、比例相对指标、比较相对指标、动态相对指标和强度相对指标。

2. 集中趋势(central tendency ):反映的是一组数据向某一中心值靠拢的倾向,在中心值附近的数据数目较多,而远离中心值的较少。

对集中趋势进行描述就是寻找数据一般水平的中心值或代表值。

3. 算术平均数(arithmetic mean )是总体中各个体的某个数量标志的总和与个体总数的比值,一般用符号-
x 表示。

算术平均数是集中趋势中最主要的测度值。

4. 调和平均数(harmonic mean )是各变量值倒数的算术平均数的倒数。

由于它是根据变量值倒数计算的,所以又称作倒数平均数,通常用H x -
表示。

5. 几何平均数(geometric mean )是n 个变量值连乘积的n 次方根。

几何平均数是计算平均比率和平均速度最适用的一种方法。

通常用-
G x 表示。

6. 众数(mode )是一组数据中出现次数最多的那个变量值,通常用o M 表示。

众数具有普遍性,在统计实践中,常利用众数来近似反映社会经济现象的一般水平。

7. 中位数(median )是一组数据按大小顺序排列后,处于中间位置的那个变量值,通常用e M 表示。

其定义表明,中位数就是将某变量的全部数据均等地分为两半的那个变量值。

其中,一半数值小于中位数,另一半数值大于中位数。

中位数是一个位置代表值,因此它不易受极端变量值的影响。

8. 极差(range )也叫全距,是一组数据的最大值与最小值之离差。

9. 标准差(standard deviation )又称均方差,它是各单位变量值与其平均数离差平方的平均数的方根,通常用σ表示。

它是测度数据离散程度的最主要方法。

标准差是具有量纲的,它与变量值的计量单位相同。

10. 离散程度(coefficient of variation )通常是就标准差来计算的,因此,也称为标准差系数,它是一组数据的标准差与其对应的平均数之比,是测度数据离散程度的相对指标。

11. 偏态(skewness )是对分布偏斜方向和程度的测度。

12. 峰度(kurtosis )是分布集中趋势高峰的形状。

(二)主要公式
三、典型习题
一、单项选择题
1.加权算术平均数中的权数为( )。

A .变量值
B .次数的总和
C .变量值的总和
D .次数比重
2.某车间三个班生产同种产品,6月份劳动生产率分别为2、3、4(件/工日),产量分别为400、500、600件,则该车间平均劳动生产率计算式应为( )。

A .
33432=++ B .13.31500
600
450034002=⨯+⨯+⨯ C .88.24323=⨯⨯ D .
9.24
600
350024001500
=++
3.受极端数值影响较小的集中趋势值是( )。

A .算术平均数
B .众数和中位数
C .几何平均数
D .调和平均数
4.某公司2011年管理人员年均收入35000元,生产人员为25000元;2012年各类人员。

相关文档
最新文档