最新统计学复习题目答案

合集下载

统计学考试题及答案

统计学考试题及答案

统计学考试题及答案一、选择题(每题2分,共20分)1. 以下哪个不是描述性统计的范畴?A. 均值B. 中位数C. 众数D. 回归分析2. 标准差是衡量数据的:A. 集中趋势B. 离散程度C. 偏态D. 峰态3. 在正态分布中,数据的分布形态是:A. 双峰B. 单峰C. U形D. 无规律4. 以下哪个是参数估计的目的?A. 描述总体B. 描述样本C. 估计总体参数D. 进行假设检验5. 假设检验中的零假设(H0)通常表示:A. 研究者希望证明的效应B. 没有效应或效应为零C. 效应显著D. 效应不显著二、简答题(每题10分,共30分)6. 简述中心极限定理的内容及其在实际应用中的意义。

7. 解释什么是置信区间,并说明其在统计推断中的作用。

8. 描述什么是相关系数,并解释其在数据分析中的重要性。

三、计算题(每题25分,共50分)9. 给定一组数据:3, 5, 7, 9, 11, 13, 15, 17, 19, 21。

请计算: - 均值- 中位数- 众数- 方差- 标准差10. 假设某产品的质量控制数据服从正态分布,平均重量为100克,标准差为5克。

如果从这批产品中随机抽取100个样本,计算样本均值在95%置信水平下的置信区间。

统计学考试答案一、选择题1. D(回归分析属于推断统计)2. B(标准差是衡量数据离散程度的指标)3. B(正态分布是单峰分布)4. C(参数估计的目的是估计总体参数)5. B(零假设通常表示没有效应或效应为零)二、简答题6. 中心极限定理指出,大量独立同分布的随机变量之和在次数趋于无穷大时趋于正态分布,无论原始分布是什么。

这一定理在抽样调查、质量控制等领域有广泛应用。

7. 置信区间是用于估计总体参数的一个区间范围,它表示在多次抽样的情况下,有特定比例(如95%)的样本统计量会落在这个区间内。

它在统计推断中帮助我们对总体参数进行估计。

8. 相关系数是度量两个变量之间线性关系强度和方向的统计指标。

统计学复习题及答案

统计学复习题及答案

统计学复习题及答案1. 什么是统计学?答:统计学是一门应用数学,它涉及数据的收集、分析、解释、展示和预测。

2. 描述统计学和推断统计学有什么区别?答:描述统计学关注于数据的总结和描述,而推断统计学则使用样本数据来推断总体特征。

3. 列举三种常见的概率分布。

答:正态分布、二项分布和泊松分布。

4. 什么是中心极限定理?答:中心极限定理表明,当样本量足够大时,独立同分布的随机变量之和的分布将趋近于正态分布。

5. 什么是置信区间?答:置信区间是一个区间估计,它给出了总体参数的一个可能范围,并且该范围有一定的置信水平。

6. 解释什么是假设检验。

答:假设检验是一种统计方法,用于根据样本数据来判断一个关于总体的假设是否成立。

7. 什么是相关系数?答:相关系数是度量两个变量之间线性关系强度和方向的统计量。

8. 什么是回归分析?答:回归分析是一种统计方法,用于研究变量之间的关系,特别是一个或多个自变量对因变量的影响。

9. 什么是方差分析?答:方差分析是一种统计方法,用于比较三个或更多组数据的均值是否存在显著差异。

10. 什么是标准差?答:标准差是衡量数据分散程度的一个指标,它是方差的平方根。

11. 什么是均值?答:均值是一组数据的算术平均值,它是所有数据值的总和除以数据的数量。

12. 什么是中位数?答:中位数是一组数据的中间值,当数据按照大小顺序排列时,位于中间位置的数值。

13. 什么是众数?答:众数是一组数据中出现次数最多的数值。

14. 什么是样本?答:样本是从总体中抽取的一部分个体,用于代表总体进行研究。

15. 什么是总体?答:总体是指研究中所有可能的个体的集合。

16. 什么是抽样误差?答:抽样误差是指由于样本的随机性导致样本统计量与总体参数之间的差异。

17. 什么是系统误差?答:系统误差是由于测量或实验设计中的偏差导致的误差,它会导致测量结果持续地偏离真实值。

18. 什么是数据的正态性?答:数据的正态性指的是数据分布接近正态分布,即呈现出对称的钟形曲线。

统计学试题库及答案

统计学试题库及答案

统计学试题库及答案一、单项选择题(每题2分,共20分)1. 统计学中,用来描述数据集中趋势的度量是:A. 方差B. 标准差C. 平均数D. 中位数答案:C2. 以下哪项不是描述数据离散程度的统计量?A. 极差B. 四分位差C. 平均数D. 标准差答案:C3. 在统计学中,用于衡量两个变量之间线性相关程度的统计量是:A. 相关系数B. 回归系数C. 回归方程D. 回归分析答案:A4. 假设检验中,拒绝原假设的决策规则是:A. P值大于显著性水平B. P值小于显著性水平C. 样本均值等于总体均值D. 样本均值不等于总体均值答案:B5. 以下哪个选项不是统计学中的抽样方法?A. 简单随机抽样B. 分层抽样C. 系统抽样D. 回归抽样答案:D6. 用于估计总体均值的点估计量是:A. 样本均值B. 样本方差C. 样本中位数D. 总体均值答案:A7. 在回归分析中,自变量的个数是:A. 1B. 2C. 3D. 任意多个答案:D8. 以下哪个选项是统计学中用于描述数据分布形状的图形?A. 箱线图B. 条形图C. 饼图D. 散点图答案:A9. 以下哪个统计量不能用来衡量数据的集中趋势?A. 平均数B. 中位数C. 众数D. 方差答案:D10. 以下哪个选项是统计学中用于描述数据分布的参数?A. 均值B. 方差C. 标准差D. 所有选项答案:D二、多项选择题(每题3分,共15分)1. 下列哪些是描述数据集中趋势的统计量?A. 平均数B. 中位数C. 众数D. 方差答案:ABC2. 以下哪些是统计学中常用的数据收集方法?A. 观察法B. 实验法C. 调查法D. 抽样法答案:ABC3. 以下哪些是描述数据离散程度的统计量?A. 极差B. 四分位差C. 方差D. 标准差答案:ABCD4. 在统计学中,以下哪些是假设检验的步骤?A. 建立假设B. 选择显著性水平C. 计算检验统计量D. 做出决策答案:ABCD5. 以下哪些是统计学中常用的图形表示方法?A. 条形图B. 饼图C. 散点图D. 箱线图答案:ABCD三、判断题(每题1分,共10分)1. 统计学中,众数是出现次数最多的数据值。

统计学大题考试题库及答案

统计学大题考试题库及答案

统计学大题考试题库及答案一、选择题1. 下列哪个是描述数据集中趋势的度量?A. 方差B. 标准差C. 平均数D. 众数答案:C2. 假设检验中的零假设(Null Hypothesis)通常表示什么?A. 效应存在B. 效应不存在C. 效应显著D. 效应不显著答案:B二、简答题1. 简述什么是标准正态分布,并说明其特点。

答案:标准正态分布是一种特殊的正态分布,其均值为0,标准差为1。

其特点是对称性,曲线的中心位于均值0处,两侧对称;无偏性,曲线的中心线为均值线;稳定性,当两个独立的正态分布变量相加时,其和也是正态分布。

2. 解释什么是样本和总体,并给出它们之间的区别。

答案:样本是从总体中抽取的一部分个体,用于研究和推断总体特性。

总体是指研究对象的全部个体。

样本与总体的主要区别在于规模大小和代表性,样本是部分,总体是全部。

三、计算题1. 给定一组数据:2, 4, 6, 8, 10,计算其平均数、中位数和众数。

答案:- 平均数:(2 + 4 + 6 + 8 + 10) / 5 = 6- 中位数:数据已排序,中位数为中间值6- 众数:数据中没有重复值,因此没有众数2. 如果一个正态分布的总体均值为100,标准差为15,求P(85 < X < 115)。

答案:首先将数据标准化,计算Z值:Z1 = (85 - 100) / 15 = -1,Z2 = (115 - 100) / 15 = 1。

然后使用标准正态分布表查找P(Z < 1) - P(Z < -1),得到P(85 < X < 115)。

四、论述题1. 论述相关性与因果性的区别,并举例说明。

答案:相关性指的是两个或多个变量之间的统计关联,而因果性则表明一个变量的变化导致另一个变量的变化。

例如,吸烟与肺癌之间存在相关性,但只有通过实验证明吸烟是导致肺癌的原因,才能说存在因果性。

以上是统计学大题考试题库及答案的示例。

实际的考试题库可能包含更多的题型和复杂的问题,建议学生在准备考试时,广泛练习不同类型的题目,并深入理解统计学的原理和应用。

《统计学》复习题及答案

《统计学》复习题及答案

《统计学》复习题及答案一、单选题1.某城市进行工业企业未安装设备普查,个体是(B)A.工业企业全部未安装设备B.工业企业每一台未安装设备C.每个工业企业的未安装设备D.每一个工业企业2.工业企业的设备数,产品产值是(A)A.连续变量B.离散变量C.前者是连续变量,后者是离散变量D.前者是离散变量,后者是连续变量3.对某班学生按年龄分成16-18岁、19-21岁、22-24岁三组,则24岁是(A)A.最大值B.组中值C.第三组的上限D.第三组的组中值4.一个组的上限与下限之差称为(D)A.组中值B.组数C.全距D.组距5.连续变量数列中,其末组为开口组,下限是1000,相邻组的组中值为975,则末组的组中值为(D)A.987.5B.1000C.1025D.10506.在建筑业设备普查中,每个建筑企业是(B)A.调查对象B.填报单位C.调查单位D.调查项目7.向上累计次数表示截止到某一组为止(A)A.上限以下的累计次数B.下限以上的累计次数C.各组分布的次数D.各组分布的频率8.一组样本数据为3、3、1、5、13、12、11、9、7。

这组数据的中位数是(D)A.3B.13C.7.1D.79.算术平均数、众数和中位数之间的数量关系决定于总体次数的分布状况。

在对称的钟形分布中(A)A.算术平均数=中位数=众数B.算术平均数>中位数>众数C.算术平均数算术平均数.>众数10.用不考虑顺序的不重复抽样方法,从8个人中抽选3个人,所得样本可能数目的公式为(B)8!8!(831)!3A.3!(83)!B.8C.(83)!D.3!(83)!11.某同学的英语成绩为80分,则“成绩”是(A)A.品质标志B.数量标志C.标志值D.数量指标12.了解某地区工业企业职工的情况,下列哪个是统计指标(C)A.该地区每名职工的工资额B.该地区职工的文化程度C.该地区职工的工资总额D.该地区职工从事的工种13.对于统计分组设计,下列哪种说法是错误的(B)A.分组时各组之间界限要明确,不允许重叠和交叉B.总体中的每一个单位,不都应只属于其中的一个组C.分组时,不能出现有任何一个单位无组可归的情况D.分组方案中,拟定的所有组一定要能够包容总体的所有单位14.随着总体范围的扩大,据以计算的质量指标数值(D)A.一定增大B.肯定不变C.一定缩小D.和总体范围扩大无直接关系15.对某市全部商业企业职工的生活状况进行调查,调查对象是(B)A.该市全部商业企业B.该市全部商业企业职工C.该市每一个商业企业D.该市商业企业的每一名职工16.下列调查中,调查单位与填报单位一致的是(D)A.企业设备调查B.人口普查C.农村耕畜调查D.工业企业现状调查17.某连续变量分为五组:第一组为40—50,第二组为50—60,第三组为60—70,第四组为70—80,第五组为80以上,依习惯上规定(B)A.50在第一组,70在第四组B.60在第二组,80在第五组C.70在第四组,80在第五组D.80在第四组,50在第二组18.次数分布有朝数量大的一边偏尾,曲线高峰偏向数量小的方向,该分布曲线属于(D)A.正态分布曲线B.J型分布曲线C.右偏分布曲线D.左偏分布曲线19.某地区有10万人口,共80个商业网点,平均每个商业网点要服务1250人,这个指标是(A)A.平均指标B.强度相对指标C.总量指标D.发展水平20.将对比的基数抽象为10,则计算出来的相对数称为(D)A.倍数B.百分数C.系数D.成数二、多选题1.下列属于连续变量的是(ACE)A.厂房面积B.职工人数C.原材料库存量D.设备数量E.产值2.下列各项中,属于品质标志分组的有(AB)A.职工按性别分组B.工人按工种分组C.职工按工龄分组D.企业按利润额分组E.企业按经济类型分组3.统计分组的主要作用有(ABCD)A.研究总体内部各个组成部分之间的相互关系B.研究总体的内部结构C.描述相互关联的统计变量之间的依存关系D.描述统计变量的分布情况E.根据研究目的选择分组标志4.某市为了解本年年末的煤炭库存情况,特别向各单位颁发调查表要求填报,这种调查属于(BCD)A.统计报表制度B.普查C.专门调查D.经常性调查E.一次性调查5.在统计上,通常使用的频率分布图主要有(ACD)A.直方图B.散点图C.折线图D.曲线图6.从均值为200、标准差为50的总体中,抽取一个容量为100的简单随机样本,则有(BD)A.样本均值的期望值是2B.样本均值的期望值是200C.样本均值的标准差是5D.样本的均值的标准差是507.简单随机抽样根据取样的方式不同分为(AE)A.重复抽样B.等距抽样C.整群抽样D.分层抽样E.不重复抽样8.影响组距数列分布的要素有(BCD)A.组类B.组限C.组距D.组中值E.组数据9.分布在各组的总体单位数称为(AE)A.次数B.频率C.比率D.次数密度E.频数10.下列属于数值平均数的有(ABD)A.算术平均数B.调和平均数C.中位数D.几何平均数E.众数11.下列关于确定组限的说法中正确的是(ABC)A.不能把不同性质的单位划分在一个组B.尽量让组中值同分到组内各单位的标志值的平均数接近C.有重叠组限与非重叠组限之分D.重叠组限的含义是上限在本组内,下限不在本组内12.在全国工业普查中,每个工业企业是(BDE)A.调查总体B.调查单位C.调查对象D.报告单位E.总体单位13.统计调查表的形式有(AD)A.单一表B.简单表C.分组表D.一览表E.复合分组表14.对于组距数列以下各项表述正确的有(ABCDE)A.最小组下限要低于最小变量值B.最大组上限要高于最大变量值C.组的确定要有利于表现总体分布规律D.连续变量相邻组限一般要重合E.离散变量相邻组限一般要间断15.下列属于时点指标的有(AE)A.某地区人口数B.某地区死亡人口数C.某地区出生人口数D.某地区生产总值E.某地区的学校数16.下列指标中属于平均指标的有(BC)A.人均国民收入B.人口平均年龄C.粮食亩产量D.人口密度E.人口自然增长率17.等距抽样按样本单位抽取的方法不同分为(BCE)A.无关标志等距抽样B.随机起点等距抽样C.中点等距抽样D.有关标志等距抽样E.对称等距抽样18.当现象完全相关时:(BC)A.r=0B.r=1C.r=1D.r=0.5E.r=0.519.测定现象之间有无相关关系的方法有(ABC)A.编制相关表B.绘制相关图C.对客观现象做定性分析D.计算估计标准误E.配合回归直线三、名词解释1.统计指标体系:。

统计学期末考试题库及答案

统计学期末考试题库及答案

统计学期末考试题库及答案一、单项选择题(每题2分,共20分)1. 统计学中,数据的收集方法不包括以下哪一项?A. 观察法B. 实验法C. 调查法D. 推理法答案:D2. 以下哪一项不是统计数据的类型?A. 定量数据B. 定性数据C. 时间序列数据D. 空间数据答案:D3. 在统计分析中,以下哪一项不是描述性统计的内容?A. 数据的集中趋势B. 数据的离散程度C. 数据的分布形态D. 数据的预测分析答案:D4. 以下哪个统计量用于描述数据的离散程度?A. 平均数B. 中位数C. 众数D. 标准差答案:D5. 相关系数的取值范围是?A. -1到1之间B. 0到1之间C. -1到0之间D. 0到正无穷答案:A6. 以下哪一项是统计推断的主要内容?A. 描述性统计B. 概率论C. 假设检验D. 数据收集答案:C7. 以下哪一项不是非参数统计分析的方法?A. 卡方检验B. 秩和检验C. 符号检验D. t检验答案:D8. 在回归分析中,以下哪一项不是回归模型的基本组成部分?A. 因变量B. 自变量C. 误差项D. 常数项答案:D9. 以下哪一项不是时间序列分析的主要方法?A. 移动平均法B. 指数平滑法C. 回归分析D. 聚类分析答案:D10. 以下哪一项不是多元统计分析的内容?A. 聚类分析B. 判别分析C. 因子分析D. 描述性统计答案:D二、多项选择题(每题3分,共30分)11. 以下哪些是统计学的主要分支?A. 描述性统计B. 推断性统计C. 应用统计学D. 理论统计学答案:A, B, C, D12. 在统计学中,以下哪些是常见的概率分布?A. 正态分布B. 二项分布C. 泊松分布D. 均匀分布答案:A, B, C, D13. 以下哪些是统计学中用于描述数据集中趋势的统计量?A. 平均数B. 中位数C. 众数D. 方差答案:A, B, C14. 以下哪些是统计学中用于描述数据离散程度的统计量?A. 极差B. 标准差C. 方差D. 变异系数答案:A, B, C, D15. 以下哪些是统计学中用于描述数据分布形态的统计量?A. 偏度B. 峰度C. 标准差D. 四分位数间距答案:A, B, D16. 在统计推断中,以下哪些是常见的假设检验方法?A. Z检验B. t检验C. F检验D. 卡方检验答案:A, B, C, D17. 以下哪些是时间序列分析中常用的方法?A. 移动平均法B. 指数平滑法C. 自回归模型D. 季节性分解答案:A, B, C, D18. 在多元统计分析中,以下哪些是常用的方法?A. 聚类分析B. 判别分析C. 主成分分析D. 因子分析答案:A, B, C, D19. 以下哪些是统计学中用于数据可视化的方法?A. 条形图B. 折线图C. 散点图D. 饼图答案:A, B, C, D20. 以下哪些是统计学中用于数据预处理的方法?A. 数据清洗B. 数据转换C. 数据归一化D. 数据降维答案:A, B, C, D三、判断题(每题2分,共20分)21. 统计学中的样本量越大,估计的准确性就越高。

统计复习题及答案

统计复习题及答案

统计复习题及答案1. 什么是统计学?统计学是收集、处理、分析、解释数据并从数据中得出结论的科学。

2. 描述统计学和推断统计学的主要区别是什么?描述统计学关注于数据的组织、汇总和描述,而推断统计学则利用样本数据来推断总体特征。

3. 什么是总体和样本?总体是指研究对象的全部个体,样本则是从总体中抽取的一部分个体。

4. 什么是随机抽样?随机抽样是指每个样本单位被选中的概率相等的抽样方法。

5. 什么是变量?变量是可取不同值的量,通常用于描述数据集中的属性或特征。

6. 什么是参数和统计量?参数是总体的特征值,统计量则是样本的特征值。

7. 什么是频率分布?频率分布是将数据分组并计算每组中数据出现的次数。

8. 什么是正态分布?正态分布是一种连续概率分布,其形状呈钟形,也称为高斯分布。

9. 什么是中位数?中位数是将数据集从小到大排序后位于中间位置的数值。

10. 什么是众数?众数是数据集中出现次数最多的数值。

11. 什么是方差和标准差?方差是衡量数据分布离散程度的量,标准差则是方差的平方根。

12. 什么是相关系数?相关系数是衡量两个变量之间线性关系强度和方向的统计量。

13. 什么是回归分析?回归分析是一种统计方法,用于估计变量之间的关系,特别是一个因变量和一个或多个自变量之间的关系。

14. 什么是假设检验?假设检验是一种统计方法,用于根据样本数据对总体参数进行推断。

15. 什么是置信区间?置信区间是一个值的范围,在这个范围内,我们有特定置信水平认为总体参数会落在其中。

答案:1. 统计学是收集、处理、分析、解释数据并从数据中得出结论的科学。

2. 描述统计学关注于数据的组织、汇总和描述,而推断统计学则利用样本数据来推断总体特征。

3. 总体是指研究对象的全部个体,样本则是从总体中抽取的一部分个体。

4. 随机抽样是指每个样本单位被选中的概率相等的抽样方法。

5. 变量是可取不同值的量,通常用于描述数据集中的属性或特征。

6. 参数是总体的特征值,统计量则是样本的特征值。

统计学考试题及答案

统计学考试题及答案

统计学考试题及答案**统计学考试题及答案**一、单项选择题(每题2分,共20分)1. 统计学中的总体是指()。

A. 研究对象的全体B. 研究对象中的一部分C. 研究对象的一个样本D. 研究对象的个体答案:A2. 以下哪项不是统计数据的类型?()A. 定性数据B. 定量数据C. 离散数据D. 连续数据答案:C3. 描述一组数据集中趋势的度量,不包括以下哪项?()A. 平均数B. 中位数C. 众数D. 方差答案:D4. 以下哪项是描述数据离散程度的统计量?()A. 平均数B. 标准差C. 众数D. 极差答案:B5. 相关系数的取值范围是()。

A. -1到1之间B. 0到1之间C. 1到无穷大D. 负无穷大到正无穷大答案:A6. 以下哪项是统计学中的抽样误差?()A. 由于测量不准确造成的误差B. 由于样本选择不当造成的误差C. 由于总体变化造成的误差D. 由于样本量太小造成的误差答案:B7. 在统计学中,置信区间的置信水平通常为()。

A. 90%B. 95%C. 99%D. 100%答案:B8. 以下哪项是统计学中的假设检验?()A. 检验两个样本均值的差异是否显著B. 检验两个样本的方差是否相等C. 检验两个样本的相关性是否显著D. 所有以上选项答案:D9. 以下哪项不是非参数统计方法?()A. 卡方检验B. 曼-惠特尼U检验C. 斯皮尔曼等级相关D. 克鲁斯卡尔-瓦利斯检验答案:A10. 以下哪项是时间序列分析中的趋势分析?()A. 季节性分析B. 周期性分析C. 趋势分析D. 随机性分析答案:C二、多项选择题(每题3分,共15分)11. 以下哪些是统计学中的参数估计方法?()A. 点估计B. 区间估计C. 假设检验D. 置信区间答案:A、B12. 以下哪些是描述数据分布形状的统计量?()A. 偏度B. 峰度C. 中位数D. 众数答案:A、B13. 以下哪些是统计学中的非参数检验方法?()A. t检验B. 卡方检验C. 曼-惠特尼U检验D. 克鲁斯卡尔-瓦利斯检验答案:C、D14. 以下哪些是统计学中的回归分析方法?()A. 简单线性回归B. 多元线性回归C. 逻辑回归D. 泊松回归答案:A、B、C、D15. 以下哪些是统计学中的方差分析方法?()A. 单因素方差分析B. 双因素方差分析C. 协方差分析D. 重复测量方差分析答案:A、B、C、D三、简答题(每题10分,共40分)16. 简述统计学中的中心极限定理及其意义。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

请各位同学全面看书复习,以书本上知识点为主,本复习题为重点,认真准备。

祝大家新年快乐,复习考试顺利!白胜陶121220。

班级:____________姓名:____________学号:____________评分:____________一、判断题(判断下列题目是否正确,如果正确请打“√”,错误请打“×”)1、参数是指描述总体特征的概括性数字度量,是研究者想要了解的总体的某种特征值×2、统计量是指用来描述样本特征的概括性数字度量,它是根据样本数据计算出来的一些量,是样本的函数×3、众数是总体中出现最多的次数。

√4、总量指标和平均指标反映了现象总体的规模和一般水平。

但掩盖了总体各单位的差异情况,因此通过这两个指标不能全面认识总体的特征。

√5、抽样调查是指从总体中随机抽取一部分单位作为样本进行调查,并根据样本调查结果来推断总体特征的数据收集方法×6、普查是指为特定目的专门组织的非经常性全面调查×7、直方图是用条形的长度(横置时)表示各类别频数的多少,其宽度(表示类别)则是固定的√8、直方图是用面积表示各组频数的多少,矩形的高度表示每一组的频数或百分比,宽度则表示各组的组距,其高度与宽度均有意义×9、直方图的各矩形通常是连续排列,条形图则是分开排列√10、茎叶图(stem-and-leaf display)是用于显示未分组的原始数据的分布,由“茎”和“叶”两部分构成,其图形是由数字组成的,以该组数据的高位数值作树茎,低位数字作树叶,树叶上只保留最后一位数字√11、众数是一组数据中出现次数最多的变量值×12、众数(mode)是一组数据中出现次数最多的变量值√13、中位数(median)是数据排序后处于中间位置上的值√14、四分位数(quartile)是数据排序后处于25%和75%位置上的值√15、极差一组数据的最大值与最小值之差×16、平均差(mean deviation)是各变量值与其平均数离差绝对值的平均数√17、自由度是指附加给独立的观测值的约束或限制的个数。

从字面涵义来看,自由度是指一组数据中可以自由取值的个数,当样本数据的个数为n时,若样本平均数确定后,则附加给n 个观测值的约束个数就是1个,因此只有n-1个数据可以自由取值,其中必有一个数据不能自由取值。

按着这一逻辑,如果对n个观测值附加的约束个数为k个,自由度则为n-k。

√18、标准分数的(性质)是均值等于0,方差等于1√19、标准分数(性质)是:z分数只是将原始数据进行了线性变换,它并没有改变一个数据在改组数据中的位置,也没有改变该组数分布的形状,而只是将该组数据变为均值为0,标准差为1 √20、经验法则表明:当一组数据对称分布时:约有68%的数据在平均数加减1个标准差的范围之内,约有95%的数据在平均数加减2个标准差的范围之内,约有99%的数据在平均数加减3个标准差的范围之内√21、离散系数(coefficient of variation)是标准差与其相应的均值之比√22、(stratified sampling) 分层抽样是将总体单位按某种特征或某种规则划分为不同的层,然后从不同的层中独立、随机地抽取样本×23、(systematic sampling) 系统抽样将总体中的所有单位(抽样单位)按一定顺序排列,在规定的范围内随机地抽取一个单位作为初始单位,然后按事先规定好的规则确定其他样本单位,先从数字1到k 之间随机抽取一个数字r 作为初始单位,以后依次取r +k ,r +2k 等单位 ×24、整群抽样(cluster sampling)将总体中若干个单位合并为组(群),抽样时直接抽取群,然后对中选群中的所有单位全部实施调查。

√25、多阶段抽样(multi-stage sampling)是先抽取群,但并不是调查群内的所有单位,而是再进行一步抽样,从选中的群中抽取出若干个单位进行调查群是初级抽样单位,第二阶段抽取的是最终抽样单位。

将该方法推广,使抽样的段数增多,就称为多阶段抽样。

√26、(population distribution)总体分布:总体中各元素的观察值所形成的分布,分布通常是未知的,可以假定它服从某种分布 ×27、总体分布(population distribution)总体中各元素的观察值所形成的分布,分布通常是未知的,可以假定它服从某种分布 √28、样本分布(sample distribution)一个样本中各观察值的分布,也称经验分布,当样本容量n 逐渐增大时,样本分布逐渐接近总体的分布 √29、(sample distribution)样本分布一个样本中各观察值的分布,也称经验分布,当样本容量n 逐渐增大时,样本分布逐渐接近总体的分布30、抽样分布 (sampling distribution),样本统计量的概率分布,是一种理论分布,在重复选取容量为n 的样本时,由该统计量的所有可能取值形成的相对频数分布 。

√ 31、样本均值的数学期望是:√ P143 μ=)(x E 32、统计一词包含统计工作、统计资料、统计学等三种涵义。

√33、样本均值的方差:重复抽样√ n x 22σσ= 34、样本均值的方差:不重复抽样√ ⎪⎭⎫ ⎝⎛--=122N n N n x σσ 35、比例(proportion)总体(或样本)中具有某种属性的单位与全部单位总数之比,不同性别的人与全部人数之比,合格品(或不合格品) 与全部产品总数之比。

√36、样本比例可表示为:√ n n p n n p 101=-=或 37、总体比例可表示为 √ N N N N 101=-=ππ或38、样本比例的抽样分布在重复选取容量为n 的样本时,由样本比例的所有可能取值形成的相对频数分布,是一种理论概率分布。

当样本容量很大时,样本比例的抽样分布可用正态分布近似 √39、样本比例的抽样分布(数学期望与方差),样本比例的数学期望:√π=)(p E 40、样本比例的方差,重复抽样:√n p )1(2ππσ-= 41、样本比例的方差,不重复抽样:×n p )1(2ππσ-= ⎪⎭⎫ ⎝⎛---=1)1(2N n N n p ππσ 42、样本比例的方差,不重复抽样: √ ⎪⎭⎫⎝⎛---=1)1(2N n N n p ππσ43、推断统计(descriptive statistics)是研究数据收集、整理和描述的统计学分支 √44、两个样本均值之差的抽样分布服从正态分布,其分布的数学期望为两个总体均值之差 2121)(μμ-=-x x E √ P14745、两个样本均值之差的抽样分布服从正态分布,其分布的方差为各自的方差之和。

√ 222121221nn x x σσσ+=- 46、分别从两个总体中抽取容量为n 1和n 2的独立样本,当两个样本都为大样本时,两个样本比例之差的抽样分布可用正态分布来近似,分布的数学期望为√ 2121)(ππ-=-p p E 47、分别从两个总体中抽取容量为n 1和n 2的独立样本,当两个样本都为大样本时,两个样本比例之差的抽样分布可用正态分布来近似,分布的方差为各方差之和:√2221112)1()1(21n n p p ππππσ-+-=- 48、点估计(point estimate)是用样本的估计量的某个取值直接作为总体参数的估计值。

√49、点估计无法给出估计值接近总体参数程度的信息,虽然在重复抽样条件下,点估计的均值可望等于总体真值,但由于样本是随机的,抽出一个具体的样本得到的估计值很可能不同于总体真值 √50、区间估计 (interval estimate)是在点估计的基础上,给出总体参数估计的一个区间范围,该区间由样本统计量加减估计误差而得到,根据样本统计量的抽样分布能够对样本统计量与总体参数的接近程度给出一个概率度量。

√51、标志变异指标数值越大,则平均指标的代表性就越小。

√52、抽样估计的置信度就是表明抽样指标和总体指标的误差不超过一定范围的概率保证程度 √53、推断统计是 (inferential statistics)研究如何利用样本数据来推断总体特征的统计学分支 √54、截面数据(cross-sectional data) 是在相同或近似相同的时间点上收集的数据√ 55、回归分析与相关分析的区别是:相关分析中,变量 x 变量 y 处于平等的地位;回归分析中,变量 y 称为因变量,处在被解释的地位,x 称为自变量,用于预测因变量的变化 √ 56、相关系数的经验解释:|r |≥ 1时,可视为两个变量之间高度相关0.5≤|r |<0.8时,可视为中度相关0.3≤|r |<0.5时,视为低度相关|r |<0.3时,说明两个变量之间的相关程度极弱,可视为不相关上述解释必须建立在对相关系数的显著性进行检验的基础之上 √57、时间序列数据(time series data) 是在不同时间点上收集到的数据 ×58、样本是指所研究的 部分个体(数据) 的集合,其中的每一个个体也称为元素×二、多项选择题(有2个或者以上的答案)1、下列标志中属于数量标志的有( CE )A.性别B.工种C.工资D.民族E.年龄2、某工业企业1900年产值为2000万元,1998年为1990年的150%,则年平均增长速度、平均增长量为( BD )A.年平均增长速度=6.25% B.年平均增长速度=5.2% C.年平均增长速度=4.6% D.年平均平等量=125万元E.年平均增长量=111.11万元3、如果用P表示商品价格,用Q表示商品零售量,则公式ΣP1Q1-ΣP0Q1的意义是( DE )A.综合反映价格变动和销售量变动的绝对额b.综合反映多种商品价格变动而增减的销售额C.综合反映总销售额变动的绝对额D.综合反映多种商品销售量变动的绝对额E.综合反映由于价格变动而使消费者增减的货币支出额4、抽样估计的优良标准有( ABD )A.无偏性 B.有效性 C.准确性 D.一致性 E.系统性5、平均数的种类有( ADE )。

A.算术平均数B.众数C.中位数D.调和平均数E.几何平均数6、下列属于正相关的现象是( ABE )A.家庭收入越多,其消费支出也越多B.某产品产量随工人劳动生产率的提高而增加C.流通费用率随商品销售额的增加而减少D.生产单位产品所耗工时随劳动生产率的提高而减少E.产品产量随生产用固定资产价值的减少而减少7、下列哪些关系是相关关系( BCDE )A.圆的半径长度和周长的关系B.农作物收获和施肥量的关系C.商品销售额和利润率的关系D.产品产量与单位成品成本的关系E.家庭收入多少与消费支出增长的关系8、下列属于负相关的现象是( ABD )A.商品流转的规模愈大,流通费用水平越低B.流通费用率随商品销售额的增加而减少C.国民收入随投资额的增加而增长D.生产单位产品所耗工时随劳动生产率的提高而减少E.某产品产量随工人劳动生产率的提高而增加9、若两个变量之间的相关系数为-1,则这两个变量是( AD )A.负相关关系B.正相关关系C.不相关D.完全相关关系E.不完全相关关系10、相关系数是零,说明两个变量之间的关系(A D )A.完全不相关B.高度相关C.低度相关D.不相关E.显著相关11、总体参数估计有(A)和(C)两种方法。

相关文档
最新文档