统计资料分组情况下中位数和众数的计算
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
限公式, 同 理 可 求 得 上 限 公 式 -I $!0 *% ; ", ;F 0;% & ・ >。 ,0 &1 按均匀分布考虑 H 在 长 度 >$!0*%;!0 上 分 布 ,0 个 变 量, 则 单 位 长 度 上 分 布 有 ,0 个 点 , 所以
显然,此时从 分组资料中无法求 可先从 ," 出众数 -.,
从 (< ) 式中可得 (,0;,0;%) !0*%*/,0;,0;%+!0 -.$ /=+ /,0;,0*%+*/,0;,0;%+ 若 令 !%$,0;,0;%#!&$,0;,0*%, !0*%$!0*> (= ) 式 变 为 -. $!0* /> 是 众 数 组 组 距 + 则 !% ・ (? ) > !%*!&
!"#"$
知识丛林 IJ#KJ#-LMNO#M
( 总 第 !"% 期 ) !"" # 年 第 $ 期
统计资料分组情况下
一、 问题的提出 统计分组是统计实务中一 种 非 常 实 用的分析方法。很多看似无规律 或 规 律 不明显的统计资料, 经过统计分组后 , 可 以找出其规律或很强的规律。但 统 计 分 组也象其他科学研究的手段一样 有 其 利 弊的。比如有些统计指标在统计 资 料 未 分组前是容易计算的,但当进行 资 料 分 组后, 其计算就变得有点困难了, 有时甚 至要在某些合理修正之下,才能 求 出 其 近似值。 统计资料分组后, 众数和中位数 的计算就是这样的。 很多从事统计实务和统计 研 究 的 工 作人员,难以对统计分组后的资 料 进 行 众数和中位数的求解,大多只能 从 教 科 书中查找到相关的计算公式,只 知 其 然 而不知其所以然,而且大部分教 科 书 和 研究资料中, 也未给出详细的求出过 程 , 一般只是公式化地进行了 “用插 补 法 求 解” 的说明。 笔者多年从事统计研究与教学工 作,也曾多次给在企事业单位从 事 统 计 工作的实务人员进行培训,研读 过 很 多 统计教科书和相关资料,发现对 统 计 众 数和中位数的求解问题关心者甚多, 但 鉴于理论的缺乏,平时大多只是 照 搬 照 抄教科书公式,真正能理解和正 确 得 出 结论者几乎没有,故在此运用均 匀 分 布 的假定下,给出众数和中位数的 求 解 方 法, 以补充教材和实际操作中的缺憾。 二、 均匀分布及其假定 均匀分布是概率上一种较 常 见 的 分 布函数,它假定随机变量在某一 有 限 区 间内是均匀的,这样其概率密度 函 数 为 如下形式: 率为
7" 计算组合权重
计算各层指标的组合权重是从上而 下逐层进行的, 对于最高层区, 其在步骤
#$ 投资回报评价的难点在于如何及
时、 准确、 完整地取得评价所需的经营数
%" 构造判断矩阵 在 得 到 #$ 投 资 回 报 评 价 指 标 体 系
对指标体系中处于同一上层准则指标支 配的同层指标进行两两比较构造判断矩 阵。
1&4中的权重分配即为组合权重。对于其 据。从 #$ 投资回 报 评 价 指 标 体 系 来 看 , 它层指标, 假定上一层所有指标: 销售、 ’!, ’%, 这些经营数据涉及到企业的财务、
客户、 生产、 成本等方面, 因此需要企业 建立比较完善的基础数据系统。 另外,信息技术的影响需要通过分 析生产能力、 盈利能力、 客户价值以及整 个平衡记分卡来单独进行衡量。我们还 可以分别对他们 进 行 考 察 , 分 析 #$ 投 资 取得良好收益的原因和方法,这对提高 分 别 为 18!, 与 8( 对 应 的 本 层 次 8%" … 834, … 93, 单排序结果为: 指 标 9!, 9%, 1:;, :%, … :34, 若 9( 与 ’< 无 联 系 , 则 有 :<(/6 。 此 时 , 本 层 次 指 标 9( 的 组 合 权 重 为 ! 18( 以确 1:=4。 在 这 里 也 需 进 行 一 致 性 检 验 , 保组合权重分配的合理性。
! 当 ,"D+ECF时 B1,4/ C2+ 当 ,#D+ECF时 6
!
!" 无量纲处理 有 在 #$ 投资回 报 评 价 指 标 体 系 中 ,
的属于正指标, 如销售利润率; 有的属于 适度指标, 如资产负债率; 还有的属于逆 指标, 如客户投诉 率 。 它 们 对 #$ 投 资 效 益的作用趋向不同,因此各个指标之间 不具有可比性, 如果不进行无量纲处理, 就无法进行综合评价。可以采用如下方 法进行无量纲处理。
) 进行一致性检验。一致性 检 验 采 用 如 下公式: -./-# 0 .#
!7P
统计与决策
!"#"$
知识丛林 KLMFLM9NOPQMO
数列计算众数, 也要先确定众数组, 然后 利用上限公式或下限公式计算众数。以 下主要论证组距数列计算众数。 设 对 某 统 计 资 料 !"#"$%#&# … #’ 进 行 分组, 分为 ( 组, 每组组限为 )!"#!"*%+, "$%# 则如表 % 。 &# … ( 各组次数为 ,",
的递阶层次结构以后, 运用专家咨询法, … ’3 的 层 次 总 排 序 已 排 出 , 得到的权值
&" 计算相对权重 对 某 一 准 则 ’( 下 的 判 断 矩 阵 ) , 求 出 其 最 大 特 征 值 !*+,, 所 对 应 的 特 征 向
量, 并正规化处理, 所求特征向量即为各 评价指标相对权重。为确保各评价指标 相对权重分配的合理性,需对判断矩阵
/!%#!&J )!&#!<+ $ )!(#!(*%)
,% ,& $ ,(
/"$%#&# … (+ 中找到最 大值 ,0, 可以假定如
下:
%1,0$023 4,"5, ,0 是 唯 一 的 , ,0 对 应 的
%!"!(
是众数所在组, 简称众数组。 )30#30*%) 中变量是均匀分布 &1 在众数 )30#30*%) 的 众数 -. 的计算推理如下: 方法一、 几何法 如 图 %, 将 统 计 分 组 资 料 以 统 计 次 数分布直方图形式表示, 连结 67 , 89 两 条线, 由均匀分布的假定, 由6到7是 均匀的上升,由 9 到 8 是均匀的下降, 则 必 然 67 与 97 的 交 点 : 是 众 数 -. 所在的位置。
(责任编辑 E 李友平)
:7 /&+
$ -.;!0 !0*%;-.
由 (% ) 、 (& ) 两 式 可 得 : -.;!0 $
!0*%;-.
69 $ ,0;,0;% 87 ,0;,0*%
/<+
,,按照累计组次数 G 与标志变量值 3 作 出统计图如图 & 。
!0
图%
-. !0*%
统计分组资料次数分布图
>" 计算综合评价结果
设经层次分析法得到度量层各指标 … ?3, 各指标 经 无 的 组 合权重为 ?!, ?%, 量纲处理后的评分值为 @!, 则 @%,… @3, #$ 投资回报评价的最终得分: A/@?$。
#$ 回报率,加快企业信息化进程具有重
要意义。 (作者单位 0 武汉理工大学管理学院)
(责任编辑 0 亦 民)
%丁岳维
张晓峰
黄曰爱
中位数和众数的计算
那 么 变 量 落 在 区 间 DGEHF $D+ECF 的 概
B/
H, / G2H " C2+ C2+
G
H
显然在统计分组资料中 , 由 于 资 料 的原始分配情况已被统计整理 后 资 料 所 代替,此时对原始的众数和中 位 数 求 解 已不大可能,只能假定在中位 数 或 众 数 组中是均匀的, 由此进行计算估计 三、统计资料分组中众 数 的 计 算 公 式论证 众数是总体中出现次数 最 多 的 标 志 值,它能够鲜明地反映数据分 布 的 集 中 趋势。 众数也是一种位置平均数, 不受极 端数值的影响,在实际工作中 应 用 较 为 普遍。 众数通常按分组资料计 算 。 由 单 项 数列计算众数时,把次数最多 的 组 定 为 众数组, 该组的变量值即为众数。 由组距
在长度上 (-I;!0) 上 分 布 有 -I;!0 ・ ,0
>
个点, 而在长度 (-I;!0) 内有 ( " , E &;F0;
%
", ;F ) 个 点 故 -I;!0 ・ ,0$ 0;% # -I$ >
!&
"
69 $ 由 !69: 与 !87: 相似可得, 87 6: 7:
(% ) 再由平行线等分线段定理可知 6:
其中: -#/1!*+, 234 0 132!4, .# 查 表 可 得。 认为判断矩阵 ) 具 当 -.56"!6 时 , 有满意的一致性, 说明权重分配合理; 否 则需调整矩阵 ) ,直到达 到 满 意 的 一 致 性为止。
三、 结束语 我 们 把 平 衡 计 分 卡 引 入 到 #$ 投 资 回报的评价工作中,平衡兼顾了战略与 战术, 长期收益与短期目标, 财务指标与 非财务衡量方法,滞后与先行指标的业 绩评价系统, 极 大 地 提 高 了 #$ 投 资 评 价 体系的科学性和规范性。
B
-. $!0 *
,0;,0;% /!0*% ; /,0;,0;%+*/,0;,0*%+ /C+
!0+$!0* !% > !%*!&
且 -. 对应的次数 /C+式与 /?+相同,
&来自百度文库%
>
,.$,0* ! /D+ !%*!& 以上假定 ,0 是唯一的,但如果单位
数少, 或虽多但无明显集中趋势, 就不存 在众数。当变量数列中有两个或两个以 上几个变量的次数比较集中,就可能有 两个或几个众数。 四、统计分组资料中对中位数的计 算公式的论证 中位数是将总体个单位的标志值按 大小顺序排列,处于中间位置的那个标 志值。 仍然按照统计资料分组假定资料如 按分 表 %1 由于 ", E & 是中位数所在位置, 组资料找到中位数所在组,设中位数所 在组的组次数为 ,0, 中 位 数 以 前 各 组 的 中位数以后各组的组 组次累计数为 F0;%, 次累计数为 F0*%,则必有 F0;%*,0*F0*%$"
表% 统计资料分组表 组限 )!"#!"*%+ 组次数 ,"
( 总 第 !"% 期 ) !"" # 年 第 $ 期
式通常是教科书上的下限公式 (? ) 同理可得上限公式: -. $!0 *% ;
!& !%*!&
方法二、 插补法 按图 % 所示, 6, 8, 9, 7 各点坐标分
%1 直线方程插补法 假 定 如 图 6 点 均 匀 变 化 到 8 点 6, (!0#F0;%) 与 (!0*%#F0; 8 两点的坐标分别为 %*,0) 则 68 直线方程为 ,;F0;%$ /F0;%*,0+;F0;% ・ !0*%;!0 ,$", E & 时对应中位数如图中的 将 ,$", E & 代入上式求出 9 点, ", ;F 0;% -I $!0* & /!0*% ;!0+ 此 为 下 ,0 H
F0;%
F0*%
图& 统计分组资料次数分布图
%=A
统计与决策
别为 6 (!0#,0;%) , (!0*%#,0*%) 。 8 9/!0#,0+#7/!0*%# (!;!0)
,0+
则 直 线 67 方 程 为 !%: , ;,0 ;% $ ,0;,0;% /!;! + /@+ 0 !0*%;!0 直 线 89 方 程 为 !&: , ;,0 $ ,0*%;,0 !0*%;!0 /!;!0+ /A+ 联 立 !% 与 !& 方 程 可 得 : 点 横 坐 标 众数 -.
!0* ", E &;F0;% ・ > ,0
五、 结束语 本文在均匀分布的假设前提下, 给 出了众数和中位数的求解公式及其推导 论证过程,加深对众数和中位数计算公 式的理解。另一方面还给出了众数出现 的次数, 而这点到目前为止, 尚未在教科 书或其他科研资料中看到,希望这个结 论能填补目前教科书及其他统计科研资 料上的缺憾。 (作者单位!长安大学经济管理学院)
显然,此时从 分组资料中无法求 可先从 ," 出众数 -.,
从 (< ) 式中可得 (,0;,0;%) !0*%*/,0;,0;%+!0 -.$ /=+ /,0;,0*%+*/,0;,0;%+ 若 令 !%$,0;,0;%#!&$,0;,0*%, !0*%$!0*> (= ) 式 变 为 -. $!0* /> 是 众 数 组 组 距 + 则 !% ・ (? ) > !%*!&
!"#"$
知识丛林 IJ#KJ#-LMNO#M
( 总 第 !"% 期 ) !"" # 年 第 $ 期
统计资料分组情况下
一、 问题的提出 统计分组是统计实务中一 种 非 常 实 用的分析方法。很多看似无规律 或 规 律 不明显的统计资料, 经过统计分组后 , 可 以找出其规律或很强的规律。但 统 计 分 组也象其他科学研究的手段一样 有 其 利 弊的。比如有些统计指标在统计 资 料 未 分组前是容易计算的,但当进行 资 料 分 组后, 其计算就变得有点困难了, 有时甚 至要在某些合理修正之下,才能 求 出 其 近似值。 统计资料分组后, 众数和中位数 的计算就是这样的。 很多从事统计实务和统计 研 究 的 工 作人员,难以对统计分组后的资 料 进 行 众数和中位数的求解,大多只能 从 教 科 书中查找到相关的计算公式,只 知 其 然 而不知其所以然,而且大部分教 科 书 和 研究资料中, 也未给出详细的求出过 程 , 一般只是公式化地进行了 “用插 补 法 求 解” 的说明。 笔者多年从事统计研究与教学工 作,也曾多次给在企事业单位从 事 统 计 工作的实务人员进行培训,研读 过 很 多 统计教科书和相关资料,发现对 统 计 众 数和中位数的求解问题关心者甚多, 但 鉴于理论的缺乏,平时大多只是 照 搬 照 抄教科书公式,真正能理解和正 确 得 出 结论者几乎没有,故在此运用均 匀 分 布 的假定下,给出众数和中位数的 求 解 方 法, 以补充教材和实际操作中的缺憾。 二、 均匀分布及其假定 均匀分布是概率上一种较 常 见 的 分 布函数,它假定随机变量在某一 有 限 区 间内是均匀的,这样其概率密度 函 数 为 如下形式: 率为
7" 计算组合权重
计算各层指标的组合权重是从上而 下逐层进行的, 对于最高层区, 其在步骤
#$ 投资回报评价的难点在于如何及
时、 准确、 完整地取得评价所需的经营数
%" 构造判断矩阵 在 得 到 #$ 投 资 回 报 评 价 指 标 体 系
对指标体系中处于同一上层准则指标支 配的同层指标进行两两比较构造判断矩 阵。
1&4中的权重分配即为组合权重。对于其 据。从 #$ 投资回 报 评 价 指 标 体 系 来 看 , 它层指标, 假定上一层所有指标: 销售、 ’!, ’%, 这些经营数据涉及到企业的财务、
客户、 生产、 成本等方面, 因此需要企业 建立比较完善的基础数据系统。 另外,信息技术的影响需要通过分 析生产能力、 盈利能力、 客户价值以及整 个平衡记分卡来单独进行衡量。我们还 可以分别对他们 进 行 考 察 , 分 析 #$ 投 资 取得良好收益的原因和方法,这对提高 分 别 为 18!, 与 8( 对 应 的 本 层 次 8%" … 834, … 93, 单排序结果为: 指 标 9!, 9%, 1:;, :%, … :34, 若 9( 与 ’< 无 联 系 , 则 有 :<(/6 。 此 时 , 本 层 次 指 标 9( 的 组 合 权 重 为 ! 18( 以确 1:=4。 在 这 里 也 需 进 行 一 致 性 检 验 , 保组合权重分配的合理性。
! 当 ,"D+ECF时 B1,4/ C2+ 当 ,#D+ECF时 6
!
!" 无量纲处理 有 在 #$ 投资回 报 评 价 指 标 体 系 中 ,
的属于正指标, 如销售利润率; 有的属于 适度指标, 如资产负债率; 还有的属于逆 指标, 如客户投诉 率 。 它 们 对 #$ 投 资 效 益的作用趋向不同,因此各个指标之间 不具有可比性, 如果不进行无量纲处理, 就无法进行综合评价。可以采用如下方 法进行无量纲处理。
) 进行一致性检验。一致性 检 验 采 用 如 下公式: -./-# 0 .#
!7P
统计与决策
!"#"$
知识丛林 KLMFLM9NOPQMO
数列计算众数, 也要先确定众数组, 然后 利用上限公式或下限公式计算众数。以 下主要论证组距数列计算众数。 设 对 某 统 计 资 料 !"#"$%#&# … #’ 进 行 分组, 分为 ( 组, 每组组限为 )!"#!"*%+, "$%# 则如表 % 。 &# … ( 各组次数为 ,",
的递阶层次结构以后, 运用专家咨询法, … ’3 的 层 次 总 排 序 已 排 出 , 得到的权值
&" 计算相对权重 对 某 一 准 则 ’( 下 的 判 断 矩 阵 ) , 求 出 其 最 大 特 征 值 !*+,, 所 对 应 的 特 征 向
量, 并正规化处理, 所求特征向量即为各 评价指标相对权重。为确保各评价指标 相对权重分配的合理性,需对判断矩阵
/!%#!&J )!&#!<+ $ )!(#!(*%)
,% ,& $ ,(
/"$%#&# … (+ 中找到最 大值 ,0, 可以假定如
下:
%1,0$023 4,"5, ,0 是 唯 一 的 , ,0 对 应 的
%!"!(
是众数所在组, 简称众数组。 )30#30*%) 中变量是均匀分布 &1 在众数 )30#30*%) 的 众数 -. 的计算推理如下: 方法一、 几何法 如 图 %, 将 统 计 分 组 资 料 以 统 计 次 数分布直方图形式表示, 连结 67 , 89 两 条线, 由均匀分布的假定, 由6到7是 均匀的上升,由 9 到 8 是均匀的下降, 则 必 然 67 与 97 的 交 点 : 是 众 数 -. 所在的位置。
(责任编辑 E 李友平)
:7 /&+
$ -.;!0 !0*%;-.
由 (% ) 、 (& ) 两 式 可 得 : -.;!0 $
!0*%;-.
69 $ ,0;,0;% 87 ,0;,0*%
/<+
,,按照累计组次数 G 与标志变量值 3 作 出统计图如图 & 。
!0
图%
-. !0*%
统计分组资料次数分布图
>" 计算综合评价结果
设经层次分析法得到度量层各指标 … ?3, 各指标 经 无 的 组 合权重为 ?!, ?%, 量纲处理后的评分值为 @!, 则 @%,… @3, #$ 投资回报评价的最终得分: A/@?$。
#$ 回报率,加快企业信息化进程具有重
要意义。 (作者单位 0 武汉理工大学管理学院)
(责任编辑 0 亦 民)
%丁岳维
张晓峰
黄曰爱
中位数和众数的计算
那 么 变 量 落 在 区 间 DGEHF $D+ECF 的 概
B/
H, / G2H " C2+ C2+
G
H
显然在统计分组资料中 , 由 于 资 料 的原始分配情况已被统计整理 后 资 料 所 代替,此时对原始的众数和中 位 数 求 解 已不大可能,只能假定在中位 数 或 众 数 组中是均匀的, 由此进行计算估计 三、统计资料分组中众 数 的 计 算 公 式论证 众数是总体中出现次数 最 多 的 标 志 值,它能够鲜明地反映数据分 布 的 集 中 趋势。 众数也是一种位置平均数, 不受极 端数值的影响,在实际工作中 应 用 较 为 普遍。 众数通常按分组资料计 算 。 由 单 项 数列计算众数时,把次数最多 的 组 定 为 众数组, 该组的变量值即为众数。 由组距
在长度上 (-I;!0) 上 分 布 有 -I;!0 ・ ,0
>
个点, 而在长度 (-I;!0) 内有 ( " , E &;F0;
%
", ;F ) 个 点 故 -I;!0 ・ ,0$ 0;% # -I$ >
!&
"
69 $ 由 !69: 与 !87: 相似可得, 87 6: 7:
(% ) 再由平行线等分线段定理可知 6:
其中: -#/1!*+, 234 0 132!4, .# 查 表 可 得。 认为判断矩阵 ) 具 当 -.56"!6 时 , 有满意的一致性, 说明权重分配合理; 否 则需调整矩阵 ) ,直到达 到 满 意 的 一 致 性为止。
三、 结束语 我 们 把 平 衡 计 分 卡 引 入 到 #$ 投 资 回报的评价工作中,平衡兼顾了战略与 战术, 长期收益与短期目标, 财务指标与 非财务衡量方法,滞后与先行指标的业 绩评价系统, 极 大 地 提 高 了 #$ 投 资 评 价 体系的科学性和规范性。
B
-. $!0 *
,0;,0;% /!0*% ; /,0;,0;%+*/,0;,0*%+ /C+
!0+$!0* !% > !%*!&
且 -. 对应的次数 /C+式与 /?+相同,
&来自百度文库%
>
,.$,0* ! /D+ !%*!& 以上假定 ,0 是唯一的,但如果单位
数少, 或虽多但无明显集中趋势, 就不存 在众数。当变量数列中有两个或两个以 上几个变量的次数比较集中,就可能有 两个或几个众数。 四、统计分组资料中对中位数的计 算公式的论证 中位数是将总体个单位的标志值按 大小顺序排列,处于中间位置的那个标 志值。 仍然按照统计资料分组假定资料如 按分 表 %1 由于 ", E & 是中位数所在位置, 组资料找到中位数所在组,设中位数所 在组的组次数为 ,0, 中 位 数 以 前 各 组 的 中位数以后各组的组 组次累计数为 F0;%, 次累计数为 F0*%,则必有 F0;%*,0*F0*%$"
表% 统计资料分组表 组限 )!"#!"*%+ 组次数 ,"
( 总 第 !"% 期 ) !"" # 年 第 $ 期
式通常是教科书上的下限公式 (? ) 同理可得上限公式: -. $!0 *% ;
!& !%*!&
方法二、 插补法 按图 % 所示, 6, 8, 9, 7 各点坐标分
%1 直线方程插补法 假 定 如 图 6 点 均 匀 变 化 到 8 点 6, (!0#F0;%) 与 (!0*%#F0; 8 两点的坐标分别为 %*,0) 则 68 直线方程为 ,;F0;%$ /F0;%*,0+;F0;% ・ !0*%;!0 ,$", E & 时对应中位数如图中的 将 ,$", E & 代入上式求出 9 点, ", ;F 0;% -I $!0* & /!0*% ;!0+ 此 为 下 ,0 H
F0;%
F0*%
图& 统计分组资料次数分布图
%=A
统计与决策
别为 6 (!0#,0;%) , (!0*%#,0*%) 。 8 9/!0#,0+#7/!0*%# (!;!0)
,0+
则 直 线 67 方 程 为 !%: , ;,0 ;% $ ,0;,0;% /!;! + /@+ 0 !0*%;!0 直 线 89 方 程 为 !&: , ;,0 $ ,0*%;,0 !0*%;!0 /!;!0+ /A+ 联 立 !% 与 !& 方 程 可 得 : 点 横 坐 标 众数 -.
!0* ", E &;F0;% ・ > ,0
五、 结束语 本文在均匀分布的假设前提下, 给 出了众数和中位数的求解公式及其推导 论证过程,加深对众数和中位数计算公 式的理解。另一方面还给出了众数出现 的次数, 而这点到目前为止, 尚未在教科 书或其他科研资料中看到,希望这个结 论能填补目前教科书及其他统计科研资 料上的缺憾。 (作者单位!长安大学经济管理学院)