统计学复习整理
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
1、一组数据中出现次数最多的变量值,称为众数(mode),用M0表示。
2、一组数据排序后,处于中间位置的变量值,称为中位数(median),用Me表示。
3、一组数据排序后处于25%和75%位置上的值,称为四分位数,也称四分点。
4、一组数据相加后除以数据的个数而得的结果,称为均值(mean),也称平均值。
5、各变量值倒数的平均倒数,称为调和平均数(harmonic mean),它是均值的另一种表现形式,用Hm表示。
6、n个变量值乘积n次方根,称为几何平均数(g eometric mean)。
7、非众数组的频数占总频数的比率,称为异众比率(variation ratio),用Vr 表示。
8、上四分位数与下四分位数之差,称为四分位差(quartile deviation),也称为内距或四分间距(inter-quartile range),用Qd表示。
9、一组数据的最大值与最小值之差,称为极差(range),也称全距,用R表示。
10、各变量值与其均值离差绝对值(之和)的平均数,称为平均差(mean deviation),也称平均离差,用Md表示。
11、各变量值与其均值离差平方和的平均数,称为方差(variance)。
12、方差的平方根,称为标准差(standard deviation)。
13、变量值与其平均数的离差除以标准差后的值,称为标准分数(standard score),也称标准化值或 z 分数。
14、一组数据的标准差与其相应的均值之比,称为离散系数(coefficient of variation),也称变异系数。
15、数据分布的不对称,成为偏态(skewness)
16、对数据分布不对称性的度量值,称为偏态系数。
17、数据分布的平峰或尖蜂程度,成为蜂态(kurtosis)。
18、对数据分布峰态的度量值,称为峰态系数。
19、抽样推断:从所研究的总体全部元素(单位)中抽取一部分元素(单位)进行调查,并根据样本数据所提供的信息来推断总体的数量特征。
20、从含有N个元素的总体中,抽取n个元素作为样本,使得每一个容量为n 的样本都有相同的机会(概率)被抽中,这样的抽样方式称为简单随机抽样,也称纯随机抽样。
21、从总体中抽取一个元素后,把这个元素放回总体中再抽取第二个元素,直至抽取n个元素为止。
这样的抽样方法称为重复抽样。
22、一个元素后被抽中后不再放回总体,然后再从剩下的元素中抽取第二个元素,直至抽取n个元素为止。
这样的抽样方法称为不重复抽样。
23、用来估计总体参数的统计量的具体数值,称为估计量,用符号θ表示。
24、用来估计总体参数时计算出来的估计量的具体数值,称为估计值
25、用样本估计量θ的值直接作为总体参数θ的估计值,称为参数的点估计。
26、在点估计的基础上,给出总体参数估计的一个范围,称为参数的区间估计值。
27、估计量抽样分布的数学期望等于被估计的总体参数。
设总体参数为θ,所选择的估计量为θ,如果E(θ)=θ,称θ为θ的无偏估计
28、对同一总体参数的两个无偏估计量θ1和θ2,若D(θ1)<D(θ2),称θ1是比θ2更有效的估计量。
29、随着样本容量的增大,点估计量的值越来越接近总体的参数
30、由样本统计量所构造的总体参数的估计区间,称为置信区间,其中区间的最小值称为置信下限,最大值称为置信上限。
31、如果将构造置信区间的步骤重复多次,置信区间中包含总体参数真值的次数所占的比率,称为置信水平或置信系数。
32、对总体参数的数值所作的陈述,称为统计假设(hypothesis)
33、对总体参数的数值提出某种假设,然后利用样本所提供的信息检验假设是否成立的过程,称为假设检验(hypothesis testing)。
34、通常将研究者想收集证据予以支持的假设称为备(选)择假设(alternativel hypothesis),记作 Hα或 H1 。
35、通常将研究者想收集证据予以反对的假设称为原假设(null hypothesis),或零假设,用H0表示。
36、能够作出拒绝原假设这一结论的所有可能样本取值范围,称为拒绝域。
37、根据样本数据计算出来的,并据以对原假设和备择假设作出决策的某种统计量,称为检验统计量。
38、
众数:
未分组数据的众数:就是次数最多的那个值
分组数据的众数:
中位数:未分组数据
分组数据的中位数:
四分位数:
未分组:
分组:
均值:
调和平均数
几何平均数
异众比率
四位分差
平均差
总体方差与标准差
样本方差与标准差
标准分数(值-平均值 / 标准差)
离散系数
偏态与峰度。