14级上海建桥学院期末统计学复习资料

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

第1章

(考填空)1.统计学(statistics)是收集、处理、分析、解释数据并从数据中得出结论的科学。

2.数据分析所用的方法可分为描述统计方法和推断统计方法。描述统计(descriptive statistics)(图表描述)研究的是数据收集、处理、汇总、图表描述、概括与分析等统计方法。推断统计(inferential statistics)(参数

6.顺序数据(rank data)是只能归于某一有序类别的非数字型数据

7.数值型数据(metric data)是按数字尺度测量的观察值

8.分类数据和顺序数据可统称为定性数据或品质数据(qualitative data);数值型数据可称为定量数据或数量数据(quantitative data)。

9.按统计数据的收集方法,可以分为观测数据(observational data)和实验数据(experimental data)。

10.按时间状况,将统计数据分为截面数据和时间序列数据。

11.截面数据是在相同或近似相同的时间点上收集的数据。

12.时间序列数据是在不同时间收集到的数据

13.总体是包含所研究的全部个体(数据)的集合,它通常由所研究的一些个体组成。

14.总体分为有限总体和无限总体

15.样本是从总体中抽取的一部分元素的集合

16.参数是用来描述总体特征的概括性数字度量

17.统计量是用来描述样本特征的概括性数字度量

18.样本平均数: x 总体平均数:µ 样本标准差:s 总体标准差:σ

样本比例:p 总体比例:π

19.变量:分类变量、顺序变量、数值型变量(离散型变量、连续型变量)

20.变量:经验变量和理论变量

第2章

1.数据来源:间接来源和直接来源

2.收集二手资料须注意什么内容:

(1)资料是谁搜集的? (2)为什么目的而搜集?(3)数据是怎样搜集的?

:也称随机抽样,是指遵循随机原则进行的抽样,总体中每个单位都有一定的机会被选入样本。5.简单随机抽样就是从包括总体N个单位的抽样框中随机地、一个个地抽取n 个单位作为样本,每个单位的入样概率是相等的。

6.分层抽样是将抽样单位按某种特征或某种规则划分为不同的层,然后从不同的层中独立、随机地抽取样本。

7.将总体中若干个单位合并为组,这样的组成为群。抽样时直接抽取群,然后对中选群中的所有单位全部实施调查,这样的抽样方法称为整群抽样。

8.将总体中的所有单位(抽样单位)按一定顺序排列,在规定的范围内随机地抽取一个单位作为初始单位,然后按事先规定好的规则确定其他样本单位,这种抽样方法称为系统抽样。

9.采用类似整群抽样的方法,首先抽取群,但并不调查群内的所有单位,而是再进一步抽样,从选中的群中抽取出若干个单位进行调查。

10.非概率抽样(操作简单、时效快、成本低、对技术要求不是很高):(1)方便抽样(2)判断抽样 (3)自愿样本(4)滚雪球抽样(5)配额抽样

11.概率抽样与非概率抽样的比较:

非概率抽样不是依据随机原则抽选样本,样本统计量的分布不是确切的,因而无法使用样本的结果对总体相应的参数进行推断。

概率抽样是依据随机原则抽选样本,这是样本统计量的理论分布是存在的

12.

13.实验组是指随机抽选的实验对象的子集,而在对照组中,每个单位不接收实验组成员所接受的某种特别的处理。

14.抽样误差是由抽样的随机性引起的样本结果与总体真值之间的误差

15.非抽样误差是相对抽样误差而言的,是指除抽样误差之外的,由其他原因引起的样本观察结果与总体真值之间的差异。

16.概率抽样不可避免,非概率抽样可以避免。

填写齐全等

6.数据排序(升序和降序、寻找数据的基本特征)

7.对于分类数据,如果是字母型数据,排序则有升序、降序之分,单习惯上升序用的更多(排序可借助计算机完成)

如果是汉字型数据,按汉字的首位拼音字母排列,也可按姓氏笔画排序,多用降序

8.对于数值型数据,排序只有两种,即递增和递减

9.数据透视表按分析要求进行汇总和作图,即按需要汇总

10.分类数据的整理与图示

频数与频数分布:频数是落在某一特定类别或组中的数据个数

11.由两个或两个以上变量交叉分类的频数分布表也称为列联表。二维的列联表(两个变量交叉分类)也称交叉表

12.比例也称构成比,它是一个样本(或总体)中各个部分的数据与全部数据之比,通常用于反映样本(或总体)的构成或结构。

13.比率是样本(或总体)中不同类别数据之间的比值

14.分类数据的图示:条形图、帕累托图、饼图、环形图

15.饼图对于研究结构性问题十分有用

16.每个样本用一个环来表示,样本中的每一部分数据用环中的一段表示。因此环形图可显示多个样本各部分所占的相应比例,从而有利于对构成的比较研究。用于展示分类数据和顺序数据。、

17.累积频率是将各有序类别或组的频数逐级累加起来得到的频数

18.累积频率或累积百分比是将各个有序类别或组的百分比逐级累加起来,它也有向上累积和向下累积两种方法

19.数据分组的主要目的是观察数据的分布特征

20.单变量值分组和组距分两种。单变量值分组是把没一个变量值作为一组

21.组距是一个组的上限与下限的差

22.组中值是每一组中下限值与上限值中间的值

组中值=(下限值+上限值)/2

23.直方图与条形图不同。(1)条形图是用条形的长度(横置时)表示各类别频数的多少,其宽度(表示类别)则是固定的;直方图是用面积表示各组频数的多

少,矩形的高度表示每一组的频数或频率,宽度则表示各组的组距,因此其高度与其宽度均有意义。(2)由于分组数据具有连续性,直方图的各矩形通常是连续排列,而条形图则是分开排列。(3)条形图主要用于展示分类数据,而直方图则主要用于展示数值型数据。

24.与直方图相比,茎叶图既能给出数据的分布状况,又能给出每一个原始数值,即保留了原始数据的信息。

25.箱线图是由一组数据的最大值、最小值、中位数、两个四分位数这五个特征值绘制而成的

26.

27.时间序列数据:线图

28.多变量数据的图示:(1)散点图(2)气泡图(3)雷达图

29.表头一般应包括表号、总标题和表中数据的单位等内容。总标题应简明确切的概括出统计表的内容,一般需要说明统计数据的时间(When)、地点(Where)以及何种数据(What),即标题内容应满足3W要求。

第4章

1.集中趋势是指一组数据向某一中心值靠拢的程度,它反映了一组数据中心点的位置所在。低层次数据的集中趋势测度值适用于高层次的测量数据,反过来,不成立。

2.众数可以有0个、1个、多个

3.中位数位置=(n+1)/2

4.

相关文档
最新文档