应用统计学(贾俊平版)综合复习提纲
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
应用统计学复习提纲梦翔儿
应用统计学复习提纲梦翔儿
1. 统计学:收集处理分析解释数据并从数据中得出结论的科学。
2. 描述统计:研究数据收集处理汇总图表描述概括与分析等统计方
法。
3. 推断统计:研究如何利用样本数据来推断总体特征的统计方法。
4. 分类数据:只能归于某一类别的非数字型数据。
5. 顺序数据:只能归于某一有序类别的非数字型数据。
6. 数值型数据:按数字尺度测量的观察值。
7. 观测数据:通过调查或观测而收集到的数据。
8. 实验数据:在实验中控制实验对象而收集到的数据。
9. 截面数据:在相同或近似相同的时间点上收集的数据。
10. 时间序列数据:在不同时间上收集到的数据,这类数据按时间顺序
收集到的。
11. 抽样调查:从总体中随机抽取一部分单位作为样本进行调查,根据
样本调查结果来推断总体特征的数据收集方法。
12. 普查:为特定目的而专门组织的全面调查。
13. 总体:包含所研究的全部个体(数据)的集合。
14. 样本:从总体中抽取的一部分元素的集合。
15. 样本容量:也称样本量,是构成样本的元素数目。
16. 参数:用来描述总体特征的概括性数字度量。
17. 统计量:用来描述样本特征的概括性数字度量。
18. 变量:说明现象某种特征的概念。
19. 分类变量:说明事物类别的一个名称。
20. 顺序变量:说明事物有序类别的一个名称。
21. 数值型变量:说明事物数字特征的一个名称。
22. 离散型变量:只能取可数值的变量。
25. 实验数据:通过实验方法获得的数据
26. 概率抽样:随机抽样,遵循随机原则进行的抽样,总体中每个单位
都有一定的机会被选入样本。
27. 非概率抽样:不随机,根据研究目的对数据的要求,采用某种方式
从总体中抽出部分单位对其实施调查。
28. 简单随机抽样:从包括总体的N个单位的抽样框中随机,一个个抽
取n个单位作为样本,每单位等概论。
29. 抽样框:用于抽选样本的总体单位信息,是概率抽样中所不可缺
30. 分层抽样:将抽样单位按某种特征或某种规则划分为不同的层,然
后从不同层中独立、随机地抽取样本。
31. 整群抽样:总体中若干单位合并为组,群,抽样时直接抽取群,然
后对中选群中的所有单位全部实施调查。
32. 系统抽样:总体中所有单位按顺序排列,在规定范围内随机抽取一
单位作为初始单位,然后按事先规则确定其它样本单位。
33. 多阶段抽样:首先抽取群,再进一步抽样,从选中的群中抽取出若
干个单位进行计查,二阶段抽样。
34. 方便抽样:依据方便原则,自行确定入抽样本的单位。
35. 判段抽样:研究人员根据经验,判断研究对象的了解,有目的选择
一些单位作为样本。
36. 自愿样本:被调查者自愿参加,成为样本中一分子,向调查人员提
供有关信息
37. 滚雪球抽样:对稀少群体调查中,首选选择一组调查单位,调查后,
请他们提供另外属于研究总体的调查对象,调查人员根据所提供的线索,进行此后调查。
38. 配额抽样:将总体中所有单位按一定的标志分若干类,然后每类采
用方便抽样或判断抽样的方案选取样本单位。
39. 自填式:没有调查员协助,被调查者自已填写,完成调查问卷。
40. 面访式:面对面,调查员提问,被调查者回答。
41. 电话式:打电话方式调查。
42. 抽样误差:由于抽样的随机性引起的样本结果与总体真值之的误
差。
43. 非抽样误差:相对抽样误差而言,除抽样误差之外的,由于其它原
因引起的样本观察结果与总体真值之间的差异。
44. 抽样框误差:统计推论的错误是由于抽样框不完善造成的45. 频数:落在某一特定类别或组中的数据个数。
46. 频数分布:各个类别及其相应的频数形成的分布。
47. 比例:一个样本(或总体)中各个部分的数据占全部数据比值。
48. 比率:一个样本(或总体)中各不同类别数据之间的比值。
49. 累积频数:将各有序类别或组的频数逐级累加起来得到的频数。
50. 累积频率或累积百分比:将有序类别或组百分比逐级累加起来。
51. 数据分组:根据统计研究需要,将原始数据按某种标准化分成不同
的组别,。
52. 组距是一个组的上限与下限的差
53. 组距分组是将全部变量依次划分为若干个区间,将这一区间的变量
值作为一组。
54. 等距分组,在组距分组时,如果各组的组距相等。
55. 组中值=下限值+上限值/2 上下限的中间值
56. 直方图:用矩形的宽度和高度(即面积)来表示频数分布的图形。
57. 茎叶图:由茎和叶两部分组成的、反应原始数据分布的图形。
58. 箱线图:由一组数据的最大值、最小值、中位数和两个四分位数5
个特征值绘制而成的、反应原始数据分布图形。
心点的位置所在。
60. 众数:一组数据中出现频数最多的数值
61. 中位数:一组数据排序后处于中间位置上的数值。
62. 四分位数:一组数据排序后处在25%和75%位置上的数值。
63. 平均数:又称均值,是全部数据的算术平均值
64. 简单平均数:未经分组数据计算的平均数称为简单平均数。根据分
组。。。加权平均数。
65. 几何平均数:是n个变量值乘积的n次方根。常用于比例数据的平
均。
66. 异众比率:指非众数组的频数占总频数的比例.
67. 四分位差:75%位置上的四分位数与25%位置上的四分位数之差。顺
序数据。
68. 极差:也称全距,一组数据的最大值与最小值之差。
69. 平均差:也称平均绝对离差,它是各变量值与其平均数离差的绝对
值的平均数。
70. 方差:各数据与其平均数离差平方的平均数。
71. 标准差:方差的平方根。
72. 标准分数:也称标准化值或 z 分数,某个数据与其平均数的离差
除以标准差后的值。
73. 离散系数:一组数据的标准差与其相应的平均数之比。
74. 偏态:对数据分布对称性的测度。测度偏态的统计量偏态系数。
75. 偏态系数:对数据分布不对称性的度量值。
76. 峰态:对数据分布平峰或尖峰程度的测度,测度峰态的统计量则是
峰态系数。
件,也叫偶然事件
79. 必然事件:在同一组条件下,每次试验一定出现的事件。
80. 不可能事件:在同一组条件下,每次试验一定不出现的事件。
81. 基本事件:如果一个事件不能分解成两个或更多个事件,则这个事
件称为基本事件。
82. 概率:对事件发生的可能性大小的度量值。
83. 主观概率:对一些无法重复的试验,确定其结果的概率只能根据经
验,人为确定这个事件的概率。
84. 条件概率:当某事件B已发生,求事件A发生的概率,称为事件B
发生条件下事件A发生的条件概率。
85. 独立事件:两个事件中不论哪一个事件发生与否并不影响另一个事
件发生的概率。
86. 随机变量:事先不能确定其取值的变量。
87. 离散型随机变量:只能取有限个值的随机变量。
88. 连续型随机变量:可以取一个或多个区间中任何值的随机变量。
89. 期望值、数学期望:随机变量的平均取值,各可能值与对应概率乘
积之和。