第三章 数据分布特征的描述

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

( C ) A.平均差 B.标准差 C.全距 平 均 差 与 标 准 差 的 主 要 区 别 在 于 3.2.8 ( B ) A.说明问题的角度不同 B.对离差的数学处理方法不同 C.计算对象不同 3.2.9 标 准 差 系 数 消 除 了 ( B ) A.总体单位数多少的影响 B.平均数大小和计量单位的影响 C.离散程度的影 响 3.2.10 直 接 使用 标 准 差比 较 分 析 两个 同 类 总体 平 均 数 的代 表 性 , 其前 提 条 件是 ( B ) A.两个总体的标准差应该相等 B.两个总体的平均数应该相等 C.两个总体的离差平方和应该相等 3.2.11 下 列 指 标 中 , 实 际 应 用 最 广 泛 的 离 散 程 度 测 度 指 标 是 ( B ) A.平均差 B.标准差 C.离散系数 3.2.12 皮 尔 逊 测 度 法 就 是 利 用 算 术 平 均 数 与 众 数 的 关 系 来 测 度 数 据 分 布 的 ( A ) A.偏斜程度 B.离散程度 C.集中程度
三、多项选择题(在下列 4 个备选答案中,至少有二个是正确的,请将其全部选
出,并把字母填在题干后面的括号内) 3.3. 1 描 述 数 据 分 布 集 中 趋 势 的 指 标 有 ABCD ) A.算术平均数 B.调和平均数 C.众数 D.中位数 3.3.2 描 述 数 据 分 布 离 散 趋 势 的 指 标 有 ABCD ) A.全距 B.平均差 C.标准差 D.离散系数 算 术 平 均 数 所 具 有 的 数 学 性 质 有 3.3.3 AC ) A.各个变量值与其平均数离差之和等于零 B.各个变量值与其平均数离差的绝对值之和等于零 C.各个变量值与其平均数离差的平方和为最小值 D.各个变量值与其平均数离差的平方和为最大值 下 列 不 适 于 计 算 算 术 平 均 数 的 数 据 类 型 有 3.3.4 AB ) A.分类数据 B.顺序数据 C.数值型数据 D.截面数据 3.3.5 加 权 算 术 平 均 数 中 , 各 个 变 量 值 的 权 数 要 起 作 用 必 须 具 备 两 个 条 件 AD ) A.各个变量值之间有差异 B.各个变量值的权数相等 C.各个变量值相等 D.各个变量值的权数有差异 下 列 对 众 数 的 解 释 说 明 中 , 正 确 的 有 3.3.6 ABCD ) A.众数是指一组数据中出现次数最多的变量值 B.一组数据中可能有多个众数,也可能没有众数 C.众数不受极端值的影响 D.众数缺乏灵敏性 下 列 对 中 位 数 的 解 释 说 明 中 , 正 确 的 有 3.3.7 ACD )
状 ) 3.4.13 凡频率分布中各变量值对众数的相对位置都较正态曲线更为分散,其曲线较为 平 缓 , 则 为 低 峰 度 。 ( √ ) 3.4.14 如果以 表示峰度系数,当 0 时,分布曲线为低峰曲线,表明变量值的差 异程度大,平均数代表性差。 ( ×, 0 )
五、简答题
3.5.1 什么是集中趋势?测度集中趋势的主要指标有哪些? 答: 集中趋势是指一组数据向其中心值靠拢的倾向, 测度集中趋势也就是寻找数据一般 水平的代表值或中心值。 取得集中趋势代表值的方法通常有两种:一是从一组数据(即各个变量值)中抽象出具 有一般水平的量,这个量不是某一个具体变量值,但又要反映这些数据的一般水平,这种平 均数称为数值平均数。数值平均数有算术平均数、调和平均数、几何平均数等形式。二是先 将一组数据的变量值按一定顺序排列, 然后取某一位置的变量值来反映这些数据的一般水平, 把这个特殊位置上的数值看作是平均数,称作位置平均数。位置平均数有众数、中位数等形 式。 3.5.2 什么是调和平均数?调和平均数与算术平均数有何关系? 答:调和平均数也称“倒数平均数” ,它是对变量的倒数求平均,然后再取倒数而得到 的平均数。 从数学定义角度看算术平均数与调和平均数是不一样的, 但在社会经济应用领域, 调和 平均数实际上只是算术平均数的另一种表现形式, 二者本质上是一致的, 惟一的区别是计算 时使用了不同的数据。 3.5.3 什么是几何平均数?其应用场合是什么? 答:几何平均数也称几何均值,它是 n 个变量值乘积的 n 次方根。几何平均法是计算 平均比率或平均发展速度最适用的一种方法。 如果分布数列中各变量值呈几何级数变化或频 率分布极不对称,也常采用几何平均法来计算平均数。如果被平均的变量值中有一个为零, 则不能计算几何平均数;如果变量值为负数,开奇次根会形成虚根,失去意义。 3.5.4 什么是离散趋势?测度离散趋势的主要指标有哪些? 答:离散趋势是指各个变量值远离其中心值的程度,是数据分布的另一个重要特征。 描述数据离散程度常用的测度值有全距、异众比率、四分位差、平均差、标准差以及离 散系数,其中标准差最重要。
二、单项选择题(在每小题的 3 个备选答案中选出 1 个正确答案,并将其字母填
在题干后面的括号内) 3.2.1 先将一组数据的变量值按一定顺序排列, 然后取某一位置的变量值来反映这些数 据 的 一 般 水 平 , 把 这 个 特 殊 位 置 上 的 数 值 看 作 是 平 均 数 , 称 为 ( B ) A.数值平均数 B.位置平均数 C.离散系数 3.2.2 算 术 平 均 数 反 映 的 是 数 据 分 布 的 什 么 特 征 ( A ) A.集中趋势 B.离散趋势 C.偏态趋势 3.2.3 根 据 算 术 平 均 数 的 性 质 , 下 列 表 达 式 正 确 的 是 ( A ) A. ( x x ) f 0 B.
第三章
一、填空题
数据分布特征的描述
集中趋势 是指一组数据向其中心值靠拢的倾向。 3.1.1 3.1.2 加权算术平均数受两个重要因素的影响, 一个是 各组变量值 ; 另一个是各组变 量值出现的 频数或频率 。 3.1.3 计算比率的平均数时,如果已知比率及其基本计算式的分母资料,则采用 加权 算术平均法 。 3.1.4 计算比率的平均数时,如果已知比率及其基本计算式的分子资料,则采用 加权 调和平均法 。 几何平均法 是计算平均比率或平均发展速度最适用的一种方法。 3.1.5 3.1.6 众数 是指一组数据中出现次数最多的变量值。 3.1.7 四分位数 是指将按大小顺序排列的一组数据划分为四等分的三个变量值。 3.1.8 十分位数 是指将按大小顺序排列的一组数据划分为 10 等分的 9 个变量值。 3.1.9 在数据分布呈 完全对称的正态分布 时,算术平均数、众数和中位数三者相等。 3.1.10 异众比率是指 非众数组 的频数占总频数的比率。 3.1.11 上四分位数与下四分位数之差的简单算术平均数称为 四分位差 。 3.1.12 各个变量值与其算术平均数离差的绝对值的平均数称为 平均差 。 3.1.13 总体方差是各个数据与其 算术平均数 的离差平方的平均数,通常以 2 表示。 3.1.14 皮尔逊测度法就是利用算术平均数与众数的关系来测度数据分布 偏斜程度 的 一种方法。 中心矩法 是指用标准差的三次方除三阶中心矩计算偏态系数的一种方法。 3.1.15
å
x- x f = 0
C.
å
( x - x )2 f = 0
3.2.4 如果分布数列中各变量值呈几何级数变化或频率分布极不对称, 计算平均数的常 用 方 法 是 ( B ) A.算术平均法 B.几何平均法 C.调和平均法 用各组的组中值代表其实际数据计算算术平均数时,通常假定 3.2.5 ( A ) A.各组数据在组内是均匀分布的 B.各组次数相等 C.各组数据之间没有差异 3.2.6 当 数 据 分 布 为 右 偏 分 布 时 , 算 术 平 均 数 与 中 位 数 、 众 数 的 关 系 表 现 为 ( A ) A. M o M e x B. x M e M o C. x M o M e 离 散 程 度 测 度 指 标 中 , 受 极 端 值 影 响 最 大 的 是 3.2.7
四、判断改错题(在你认为正确的题后括号内打“ 和题后括号内打“× ” ,并在其正下方写出正确的答案来)
√ ” 。在你认为错误的地方
( ( (

( (
3.4.1 算术平均数既适用于数值型数据,也适用于分类数据和顺序数据。 ( ×,不适用于分类数据和顺序数据 ) 3.4.2 根 据 分 组 数 据 计 算 的 平 均 数 只 是 实 际 平 均 数 的 近 似 值 。 √ ) 3.4.3 简单算术平均数的大小只与变量值的大小有关,与权数无关。 √ ) 3.4.4 各 变 量 值 与 其 算 术 平 均 数 的 离 差 平 方 和 为 最 小 值 。 √ ) 3.4.5 众数可直观地说明分布的离散趋势,可用它反映变量值一般水平的代表值。 ( ×,集中趋势 ) 3.4.6 对 于 一 组 数 据 , 可 能 存 在 一 个 或 多 个 众 数 , 也 可 能 不 存 在 众 数 。 √ ) 3.4.7 四分位数是将按大小顺序排列的一组数据划分为三等分的四个变量值。 (×,四等分的三个变量值) 3.4.8 十分位数是指将按大小顺序排列的一组数据划分为 10 等分的 10 个变量值。 ( ×,9 个变量值 ) 3.4.9 在左偏分布中,众数最小,中位数适中,算术平均数最大,即 M o M e x 。 ( ×,右偏分布 ) 3.4.10 数 据 的离 散 程 度越 大 , 集 中趋 势 的 测度 值 对 该 组数 据 的 代 表性 就 越 差。 √ ) 3.4.11 在 实 际 工 作 中 , 全 距 常 用 来 检 查 产 品 质 量 的 稳 定 性 和 进 行 质 量 控 制 。 √ ) 3.4.12 偏态和峰态是对分布集中程度的测度。 ( ×,分布形







A.中位数不受分布数列的极大或极小值影响 B.中位数是指一组数据中出现次数最多的变量值 C.中位数缺乏灵敏性 D.当次数分布偏态时,中位数的代表性会受到影响 下列陈述中正确的是( ABCD ) 3.3.8 以 SK p 表示根据皮尔逊测度法计算的偏态系数, A.经验证明,在适度偏态的情况下, 3 SK p 3 B.当 x M o , SK p 0 时,数据分布呈对称分布 C.当 x M o , SK p 0 时,数据分布呈右(正)偏分布 D.当 x M o , SK p 0 时,数据分布呈左(负)偏分布 3.3.9 下 列 关 于 四 分 位 差 的 解 释 说 明 中 , 正 确 的 有 ( ABCD ) A.四分位差就是上四分位数与下四分位数之差的简单算术平均数 B.四分位差越小,表明中位数的代表性越好 C.四分位差越大,表明中位数的代表性越差 D.四分位差可以避免受极端值的影响 比较不同总体平均数的代表性时,应该使用离散系数,因为 3.3.10 ( AB ) A.离散系数可以消除平均数大小的影响 B.离散系数可以消除计量单位的影响 C.离散系数可以消除总体单位数多少的影响 D.离散系数可以消除变量值之间差异程度的影响
六、计算题
3.6.1 2007 年某企业精加工车间 20 名工人加工 A 零件的产量资料如下:
按日产量分组(件) 28 29 30 31 工人人数(人) 2 4 7 5
32 合 计
2 20
要求:试计算 20 名工人日产量的算术平均数、众数和中位数。 解: (1)20 名工人日产量的算数平均数: xf 28 2 29 4 30 7 31 5 32 2 601 。 x 30.05 (件/人) f 20 20 (2)从该企业的产量资料表可以看出,20 名工人日产量的众数为 30 件; (3)20 名工人日产量的中位数: 工人总数的二分之一是 10 人,从小到大累计人数首次超过 wenku.baidu.com0 的组所对应的日产量为 30 件,则中位数为 30 件。 3.6.2 2007 年某管理局所属 22 个企业的工人工资及工人比重资料如下:
相关文档
最新文档