2017年中央财经大学统计与数学学院应用统计硕士复试真题详解【圣才出品】
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
上四分位数与下四分位数之差,用 Qd 表示,计算公式为:Qd=QU-QL。
③方差和标准差,是测度数据离散程度的最常用测度值,用来衡量均值对一组数据的代
表程度。设样本方差为 S2,未分组数据和分组数据计算样本方差的公式分别为:
①未分组数据: ②分组数据:
n
(xi x )2
s2 i1 n 1
3 / 10
2. 答:(1)集中趋势 集中趋势是指一组数据向某一中心值靠拢的程度,它反映了一组数据中心点的位置所在。
1 / 10
圣才电子书 十万种考研考证电子书、题库视频学习平台
www.100xuexi.com
描述数据集中趋势采用的测度值,根据数据类型的不同主要有众数、中位数和平均数。 ①众数:众数是一组数据中出现次数最多的变量值,用 Mo 表示。众数主要用于测度分
圣才电子书 十万种考研考证电子书、题库视频学习平台
www.100xuexi.com
2017 年中央财经大学统计与数学学院应用统计硕士复试真题详解
一、简答题 1. 答:(1)调查误差也称为抽样误差,是由抽样的随机性引起的样本结果与总体真值之 间的误差。抽样误差的大小与样本量和总体的变异性有关:①样本量。样本量越大,抽样误 差就越小。当样本量大到与总体单位相同时,也就是抽样调查变成普查,这时抽样误差便减 小到零,因为这时已经不存在样本选择的随机性问题,每个单位都需要接受调查。②总体的 变异性。总体的变异性越大,即各单位之间的差异越大,抽样误差也就越大,因为有可能抽 中特别大或特别小的样本单位,从而使样本结果偏大或偏小;反之,总体的变异性越小,各 单位之间越相似,抽样误差也就越小。 (2)非调查误差主要分为:①抽样框误差;②回答误差。回答误差是指被调查者在接 受调查时给出的回答与真实情况不符。导致回答误差的原因有多种,主要有理解误差、记忆 误差和有意识误差;③无回答误差。无回答误差是指被调查者拒绝接受调查,调查人员得到 的是一份空白的答卷;④调查员误差。这是指由于调查员的原因而产生的调查误差。例如, 调查员粗心,在记录调查结果时出现错误;⑤测量误差。如果调查与测量工具有关,则很有 可能产生测量误差。
圣才电子书 十万种考研考证电子书、题库视频学习平台
www.100xuexi.com
n
(Mi x)2 fi
s2 i1 n 1
方差开方后即得到标准差。 ④极差 R:一组数据的最大值与最小值之差,R=max(xi)-min(xi)。 ⑤平均差 Md:它是各变量值与其平均数离差绝对值的平均数 根据未分组数据计算平均差的公式为:
查中得到的两个变量的数据,用一个表格的形式来表示它们的分布(频数和百分数),这里
的频数称为观测频数,这种表格称为列联表。如果原假设成立,在这个前提下,可以计算出
列联表中每个格子里的频数,称为期望频数。比较观测频数与期望频数的差,两者的差越大,
表明实际情况与原假设相去甚远;差越小,表明实际情况与原假设越相近。这种差值用一个
其代表性就越好。描述数据离散程度采用的测度值,根据数据类型的不同主要有异众比率、
四分位差、方差和标准差、极差、平均差等。
①异众比率,用于测度分类数据的离散程度,衡量众数对一组数据的代表程度。异众比
率的计算方法为:
Vr
fi fm 1 fm
fi
fi
②四分位差,用于测量顺序数据的离散程度,衡量中位数对一组数据的代表程度。它是
卡方统计量 χ2 来表示。
卡方检验量值的计算公式如下:
k
2=
( fi npi )2
i 1
npi
对卡方统计量的值进行检验,若卡方检验的结果不显著,则不能拒绝原假设,即两变量
是相互独立、互不关联的;若卡方检验的结果显著,则拒绝原假设,即两变量间存在某种关
联。
二、 解:1.标准误代表样本均数与总体均数的相对误差,也就是说样本均值与总体均值的
5 / 10
圣才电子书
当 n 为奇数时
M e x n1 2
当 n 为偶数时
Me
1 2
x
n 2
+x
n 2
+1
③平均数:平均数也称为均值,它是一组数据相加后的和除以数据的个数得到的结果。
平均数是集中趋势的最主要测度值,它主要适用于数值型数据,而不适用于分类数据和顺序
数据。平均数的计算方法为:
当数据未分组时 当数据已分组时
类数据的集中趋势,当然也适用于作为顺序数据以及数值型数据集中趋势的测度值。一般情 况下,只有在数据量较大的情况下,众数才有意义。
②中位数:中位数是一组数据排序后处于中间位置上的变量值,用 Me 表示。中位数将 全部数据等分成两部分,每部分包含 50%的数据,一部分数据比中位数大,另一部分则比 中位数小。中位数主要用于测度顺序数据的集中趋势,当然也适用于测度数值型数据的集中 趋势,但不适用于分类数据。中位数的计算方法为:
4 / 10
圣才电子书
www.100xuexi.com
也都等于 σ2;
十万种考研考证电子书、题库视频学习平台
(5)误差项 ε 是一个服从正态分布的随机变量,且独立,即 ε~N(0,σ2)。
4.
答:(1)二维列联表分析是指用于分析列联表中行变量和列变量是否相互独立的分析
方法。
(2)检验原理为:首先假设两个变量是相互独立,互不关联的,称为原假设。对于调
n
| xi x |
M d i1 n
根据分组数据计算平均差的公式为:
k
| xi x | fi
M d i1 k
fi
i 1
3. 答:对于一元线性回归模型,有以下几个主要假定: (1)因变量 y 与自变量 x 之间具有线性关系; (2)在重复抽样中,自变量 x 的取值是固定的,即假定 x 是非随机的; (3)误差项 ε 是一个期望值为 0 的随机变量,即 E(ε)=0; (4)对于所有的 x 值,ε 的方差 σ2 都相同,这意味着对于一个特定的 x 值,y 的方差
1 n
x n i1 xi
2 / 10
圣才电子书
www.100xuexi.com
(2)离散程度
十万种考研考证电子书、题库视频学习平台
k
Mi fi
x
i 1 k
fi
Βιβλιοθήκη Baidu
i 1
数据的离散程度是数据分布的另一个重要特征,它反映的是各变量值远离其中心值的程
度。数据的离散程度越大,集中趋势的测度值对该组数据的代表性就越差;离散程度越小,