定量分析技术全套教案
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第一章定量分析方法概述
一、定性分析与定量分析
(一) 定性分析
所谓定性分析,是对事物“质”的方面的分析和研究。
它主要是根据相关管理理论、有关专业知识,凭借已有的技术和经验,依靠人的观察分析及判断能力,运用归纳与演绎、分析与综合、抽象与概括等方法,从研究事物质的角度出发,来分析所研究事物包含的成分、具备的特性、发展规律及其与其他事物之间的联系。
其分析过程和结论一般是用文字来描述的。
一事物的质是它区别于其他事物的固有的规定性,我们要认识某种事物,首先就要把该事物与其他事物区别开来,就要认识这个事物所具有的内在性质和本质特征。
因此,定性分析是我们认识事物的开始,实际中很多问题的分析研究都是从定性分析入手的。
作为分析和研究事物的质的特征的定性分析,无疑是一种最根本、最重要的分析研究方法。
通过定性分析,能由表及里地认识事物的本质,揭示现象的内在规律性。
定性研究主要包括对各种现象的“属性认定(是对现象所固有的内在属性和基本规定性的一种判别)”、“类别归并(运用一定的标准将研究对象与相似相通的其他现象联系起来,归为一类;同时与相背相异的现象区别开来,判为异类)”和“价值判断(以主体需要为标准,表达主体对于客体的肯定或否定态度和追求或舍弃的倾向)”。
定性研究主要运用比较方法(结构、功能、数量、质量、原因、外形、系统、纵向、横向、历史比较分析法等),作到同中求异,异中
求同。
其中最主要的是横向比较方法、纵向比较方法、理论与事实比较方法。
(二)定量分析
所谓“定量分析”,是对事物“量”的方面的分析和研究。
它是在一定的理论指导下, 运用数学原理、数学公式、数学图形等, 通过数学模型的建立、计算和求解, 分析事物内部各组成部分之间的数量关系,或对几个事物的某些性质、特征、相互关系从数量上进行对比分析。
定量分析以数字为语言来对各种现象进行研究,其研究结果通常用“数量”来加以描述。
定量分析是教我们“识数”的。
定量分析是科学管理的重要方法。
它用量化的标准去测量事物, 用数量的方法和工具去分析事物, 并用大量的数据去支持其论断,因此,它可以更加准确、科学地揭示事物内在的特征和规律,使我们对事物的认识进一步精确化,便于我们准确把握事物的本质,理清事物间的关系,掌握事物发展变化的规律和趋势,提高预测和决策的科学性。
定量研究是很多科学家、思想家追求的目标(马克思说“一门科学只有在成功地运用数学时,才算达到了真正完善的地步”),也是各学科发展的一种必然趋势、一种潮流。
(三)定性分析和定量分析的优缺点
1、定量分析比较准确、清晰。
定性分析则比较直观,容易被大众理解,但是比较模糊。
2、定量分析工作量大,花费人力、物力和时间比定性分析多。
3、定性分析依赖个人(或群体)的经验、能力和水平,其标准常常因人而异,往往带有主观任意性。
定量分析则比较客观,随意性较少。
4、借助图表、曲线可以把定量分析的结果直观地描述出来,使之既清晰又容易理解。
5、利用模糊数学、统计数学的理论或其他数学方法,定量分析和定性分析的过程和结果可以相互转换。
定性分析多用在日常生活、人际交往、需要形象描述和比较的情况。
而需要精确地反映某些对象的数量关系时,应该用定量分析。
二、定量分析的重要性
1、数字往往是概括、简化问题的便捷方式,数字反映问题往往比文字更直观、更明了,它往往能把一些用文字难以描述的复杂问题直观、明了地反映出来。
2、在实际工作和研究中,数据最容易产生,且更常被人们利用。
社会调查是人类认识社会的重要武器,而社会调查的结果往往是大量的数据。
3、数据往往比文字更具有说服力。
数据无处不在。
有一些读数能力,掌握一些数量分析的方法和技巧,能使我们在错综复杂的问题中理清脉络,找出关键因素,把握问题的关键,使问题清晰简化,有助于管理者作出更加英明的决策,使管理工作更加科学、准确、有效。
第二节管理定量分析的主要内容
和管理学密切相关的量化分析学科,一门是统计学,一门是运筹学。
统计学是一门数量分析的方法论科学,是人类分析数据,获取信息的重要手段之一。
它的数量分析方法广泛用于社会、经济、天文、生物等各个领域。
运筹学是一门应用学科,它广泛应用现有的科学技术知识和数学方法,解决实际中提出的专门问题,为决策者选择最优决策提供定量化依据。
显然,运筹学是解决“最优化”问题的重要工具。
它主要研究诸如“在一定的人力、财力、物力限制下,如何合理安排计划,以使某一目标达到最佳?”或“目标既定的前提下,如何安排计划,以最大限度地节约人力、财力、物力等资源?”等问题。
本课程从管理学的要求出发,以系统工程的理念为基础,并结合管理工作实际,把统计学和运筹学中与管理关系密切的数量分析方法融合在一起,系统地加以介绍。
全书内容包括:调查与统计描述、概率与分布、参数估计、假设检验、动态分析、相关分析与回归分析、预测、决策、最优化方法等内容。
第二章调查与统计描述
第一节搜集资料——调查
调查是人们认识社会的基本方式,是人类获取信息的主要手段,开展社会调查,搜集相关资料,是量化分析过程的开始。
一、调查的基本原则
1、客观性原则(真实性原则)
2、系统性原则(完整性原则)
3、及时性原则
二、调查的组织形式
按调查对象所包括的范围,可分为⎩
⎨⎧非全面调查全面调查
按组织形式不同,可分为⎪⎪⎪⎩⎪⎪⎪⎨⎧个案调查
抽样调查典型调查
重点调查普查 (一)普查
普查是为了某个特定的目的专门组织的一次性的全面调查。
它主要用来
全面、系统地掌握重要的国情国力方面的统计资料;为国家制定或修改重大方针政策、制定经济社会发展长远规划提供可靠的依据。
普查工作面广量大,需要动员较多的人力、物力,组织工作比较繁重,
因此不宜经常进行。
与其他调查方式相比,普查要求更多的集中统一领导和行动。
组织普查必须规定统一的标准时点、统一的调查期限、统一的调查方法、调查步骤、统一的调查项目、统一的资料整理原则和整理方法、统一解释权归属等。
(二)重点调查
重点调查是在调查对象范围内选择部分重点单位进行调查,搜集资料,
借以了解研究对象基本情况的一种非全面调查。
所谓重点单位,是指在研究对象总体中占有举足轻重地位的单位。
这些单位往往在研究对象中虽然数目不多,但就所调查的指标来说,却在总量中占很大的比重。
重点调查的调查单位少,可以调查较多的项目和指标,了解较为详细的情况,取得资料也及时。
当调查任务只要求了解总体的基本情况,而且总体中确实存在重点单位时,采用重点调查是比较适宜的。
但必须指出,并非所有的总体都可以进行重点调查。
而且,重点调查的结果通常不能用来推算整个总体的特征。
(三)典型调查
典型调查是根据调查的目的和要求,在调查对象中有意识地选取若干具有典型意义的或有代表性的单位进行深入细致的调查。
典型调查的主要特点是:1、典型调查是一种非全面调查,调查单位少,可节省人力、财力和物力,提高调查的时效性;2、典型调查机动灵活,能深入实际,深入群众,搜集详细的第一手资料,包括数字资料和文字资料;3、典型单位是调查人员有意识地选择出来的,对其进行调查,往往能以较小的代价取得代表性较高的资料。
但是,典型调查的结果往往因人而异。
在所有调查方法中,典型调查是受人们主观意识影响最大的调查方法。
典型调查主要用于:1、分析新事物,反映新情况、新问题;2、总结成功的经验和失败的教训;3、可据以推算研究对象总体的特征,可用来补充和验证全面调查的数字。
(四)抽样调查
抽样调查也是一种非全面调查,它是按照随机的原则,从研究对象中抽取一部分单位进行调查,并运用数理统计的原理,以被抽取的那部分单位的
数量特征为代表,对研究对象总体的数量特征和数量规律作出推断。
抽样调查有以下几个特点:
1、抽样调查是一种非全面调查。
2、根据部分单位(样本)的指标数值可以推断研究对象整体的指标数值。
3、抽选调查单位时要遵循随机原则。
4、抽样调查必然会产生抽样误差,但抽样误差可以计算,并可加以控制。
抽样调查的适用范围非常广。
原则上,在任何场合,对任何总体,都可以运用抽样调查方法来取得所需资料;在某些特殊场合,甚至还必须用抽样调查的方法取得。
在所有调查方法中,抽样调查是最具科学性的一种。
(五)个案调查
个案调查是对特定的对象进行详细调查研究的方法。
在这里,特定的对象可以是某特定的事件、组织、群体、家庭,还可以是某个人。
个案调查的优点是研究深入细致、灵活多样,内容全面系统,局限性在于资料对整体缺乏代表性,不能据以推断整体特征,而且只能进行定性分析,无法进行定量分析。
目前,个案调查在犯罪研究、民政工作、信访工作等领域中得到广泛的应用。
第二节分配数列
一、分组
分组就是根据研究的目的和要求,结合数据本身的分布特征,将数据按照一定的标准划分为若干个不同的组成部分。
分组的原则⎩
⎨⎧—不交叉—互斥性—不遗漏—完备性 某校学生身高统计表 身高
学生人数 1.4~1.6
1.6~1.8
1.8~
2.0
2.0以上
13 158 127 2 合计
300 如:某市居民家庭人均收入分组资料如下:(整理的重要性)
家庭人均收入
人数 800以下
800~3500
3500以上
60 420 20 合计
500
二、分配数列的概念和种类
在分组的基础上,将所有数据按组归类整理,并按一定顺序排列,形成
数据在各组间的分布,称为次数分配数列,也叫做变量分布数列(简称变量数列)。
分布在各组的数据个数叫次数,或称为频数;各组次数与总次数之比叫做频率,或比率。
家庭人均收入 人数 500以下 500~2500 2500以上 30 350 120 合计 500
变量数列⎩
⎨⎧组距式变量数列单项式变量数列
1、单项式变量数列
单项式变量数列是将每一个数值列为一个组而编制的数列。
它主要适用
于数值变动范围不大的离散型变量。
如:
表2-2-1 某班学生年龄统计表 年龄 学生人数(次数) 比重(频率、比率)
18
19
20
21
22
2 5 20 18 5 2/50 5/50 20/50 18/50 5/50 合计
50 1 2、组距式变量数列
组距式变量数列是将若干个相邻的数值合并为一组,使每个组都有一个数值变动范围的数列。
这种形式的数列主要适用于数值变动范围较大的离散型变量和连续型变量。
如:
表2-2-2 某班《定量分析方法》成绩统计表
《定量分析方法》成绩 学生人数
比重 90—100
80—90
70—80
60—70
60以下
3 15 19 11 2
3/50 15/50 19/50 11/50 2/50
合计
50 1
二、变量数列的编制 1、整理原始资料(将数据按大小顺序排列)。
全距=最大数值-最小数值x x min max -=
2、确定变量数列的形式(确定编制单项数列还是组距数列)
3、组距式变量数列的编制
(1)确定组距和组数
组距=本组上限-本组下限 组距全距组数=
(2)等距分组和异距分组
(3)确定组限与组中值
组限⎩⎨⎧下限
上限 组⎪⎩⎪⎨⎧⎩⎨⎧下开口组上开口组开口组闭口组 对连续型变量分组,为了保证分组的完备性,做到不遗漏,前一组的上
限与后一组的下限必须重叠。
对离散型变量,组限最好不要重叠,当然也可以不重叠。
在组限重叠的情况下,确定组限所在组的原则为“上限不在组内”。
如对企业按职工人数分组,可分为:
99人以下
100—299人
300—599人
600人以上
组中值是各组上限与下限之间的中点数值,它代表各组数值的平均水平
或一般水平。
当然,前提是各组的数值在本组范围内呈均匀分布或在组中值两侧呈对称分布。
组中值=2
本组下限
本组上限+
对于开口组,在计算组中值时,假定它的组距与邻组的组距相等,首先按邻组的组距确定假定的上限或下限,然后再计算它的组中值。
三、次数分布的表示法
次数分布的表示法⎪⎪
⎪
⎪⎩
⎪⎪⎪⎪⎨
⎧⎪⎪⎪⎩⎪⎪⎪⎨⎧饼图曲线图折线图直方图条形图统计图统计表
1、统计表——用表格的形式来表示数据的分布数列
表2-2-3 某企业职工政治面貌统计表
××年×月×日
政治面貌 职工人数 比重 中共党员 共青团员 民主党派成员 群众 16 25 2 57 16% 25% 2% 57% 合计
100
1
资料来源:×××
其中,表2-2-3为表号;
统计表的标题、时间、地点等为表头;
表中的第一行为标识行,它说明表中各数据所反映内容;
表中的2~6行为主体行, 它是统计表的主体内容;
如果是引用间接资料,则还要通过表尾说明资料的来源。
2、统计图
(1)条形图
条形图是用长条的高度来表示各组的次数或百分比,而长条的宽度没有意义。
长条既可平行于横轴,又可平行于纵轴。
如果变量的取值只有类别之分,而无顺序可言,则长条可按任意次序排列,且长条一般是离散的。
如:
如果变量的取值既有类别之分,又要考虑顺序,则长条可以是紧挨着的,也可以是离散的,但长条必须按顺序排列。
如下图所示:
老中青不及格及格中良优(2)直方图
50 60 70 80 90 100
直方图以长条的面积来表示次数或频率,以长条的宽度表示变量的取值范围(各组组距),以长条的高度表示次数密度或频率密度。
次数密度=组距次数
, 频率密度=组距频率
直方图一般用于组距数列资料的表示。
(3)折线图
50 60 70 80 90 100 (4)曲线图
(5)饼图
图3-3-6 饼图
在饼图中,通常用圆形代表研究对象的全体,用圆瓣代表对象中的某一组成部分,其面积大小代表该组成部分在研究对象总体中所占的比重。
在制作饼图时,只要将各组成部分所占的百分比乘以360°,得到各圆瓣的圆心角度数,即可绘制饼图。
四、累计次数
累计次数⎩
⎨⎧向下累计向上累计
1、向上累计,又称为较小累计制,是将各组次数或比率,由数值低的组向数值高的组逐组累计,向上累计表明各组上限以下所包含的次数合计或比率合计。
2、向下累计,又称为较大累计制,是将各组次数或比率,由数值高的组向数值低的组逐组累计。
向下累计表明各组下限以上所包含的次数合计或比率合计。
表3-3-4 某班《统计学》成绩统计表
《统计学》 成绩 学生 人数 比重 向上累计 次数 向下累计 次数 向上累计 频率 向下累计 频率 90—100 80—90 70—80 60—70 60以下 3 15 19 11 2 6% 30% 38% 22% 4% 50 47 32 13 2 3 18 37 48 50 100% 94% 646% 26% 4% 6% 36% 74% 96% 100%
合计
50
100%
-
-
-
-
不论是向上累计还是向下累计,最后一组的累计次数都应等于总次数,而最后一组的累计频率都应等于1(100%)。
五、次数分布的主要类型
⎪⎪
⎩
⎪
⎪⎨⎧
形分布形分布、反形分布:正形分布左偏分布、右偏分布钟形分布:对称分布、
J J J U 1、钟型分布——“两头小、中间大”
2、U 型分布——“两头大、中间小
3、J 型分布——“一边大、一边小”
第三节 集中趋势测量法
一、算术平均数
算术平均数⎪⎪⎩
⎪⎪⎨
⎧==∑∑∑资料已分组加权算术平均数:资料未分组简单算术平均数:f xf
x n x x
(一)简单算术平均数
例如,现有一组数据:{ 79,52,68,85,93,77,82,86,74,80 }。
x =
n
x x
x n +++ 2
1
6.7710
80
748682779385685279=+++++++++=
(二)加权算术平均数:x =
∑∑f
xf
其中,x 代表各组的数值(或组中值),f 代表各组的次数。
例: 某班《统计学原理》成绩统计表如下,求该班学生的平均成绩。
表2-3-2 某班《统计学原理》成绩统计表 《统计学原理》成绩 组中值
学生人数
比重 90—100 80—90 70—80 60—70 60以下 95 85 75 65 55
3 15 19 11 2 6% 30% 38% 22% 4% 合计
50
100%
解:该班学生的《统计学原理》平均成绩为:
x =
∑∑f
xf 2.7650
3810
21119153255116519751585395==++++⨯+⨯+⨯+⨯+⨯=
(分)
注意以下几点:
1、若变量数列为一组距数列,则上式中的x 用各组的组中值来近似地代替。
这样计算出来的平均数只是真实平均数的一个近似值。
2、各组次数f 对各个数值在计算平均数时所起作用的大小起着权衡轻重的作用,所以把它称为权数。
3、在各组次数f 同比例增加或同比例减少的情况下,只要x 不变,则加权算术平均数的大小也不变。
因为在各组次数f 同比例变化的情况下,各组频率
∑
f
f
并没有发生变化,整个数据的结构不变。
由此可知,加权算术平均数的数
值大小实际上是受各组数值大小x 和结构相对数两个因素的影响,各组频率
∑
f
f
才是真正起权衡轻重作用的因素。
例:某车间工人按生产的产品合格率分组资料如下,试求平均合格率。
产品合格率(%)x i 工人数(人)f i
产品数(件)f i /
70~80 80~90 90~100 6 30 28 200 1200 800 合计
64
2200
解:x =
∑∑f
xf
28
30628%9530%856%75++⨯+⨯+⨯=(错误)
x =∑
∑''f f x 8001200200800%951200%85200%75++⨯+⨯+⨯=(正确) 4、平均数的权数不是人们任意确定的,而是由实际经济现象的内在联系所决定。
在由相对数和平均数计算其算术平均数时,首先要考虑到该相对数或平均数的基本计算公式,认清其分子、分母是什么,然后选择其分母指标为权数。
5、算术平均数的大小容易受到极大值的影响。
如:{ 200,350,410,580,630,790,840,920,1030,10000 } x =1575
(三)算术平均数的数学性质
(1)算术平均数与数据个数的乘积等于各个数据的总和。
即:
∑=x x n , ∑∑=xf f x
(2)若各个数据都加(减)任意数A ,则平均数也要加(减)A 。
即:
A x A x ±=±
(3)若每个数据都乘(除)以任意数A ,则平均数也要乘(除)以A 。
即:
x A Ax =,
A
x
A x = (4)各个数据与算术平均数的离差之和等于0。
即:
0)(=-∑x x , 0)(=-∑f x x
二、几何平均数
几何平均数又称为“对数平均数”,它是n 个数据x 1,x 2,…,x n 的连乘积的n 次方根。
几何平均数特别适合于计算平均速度。
1、简单几何平均数
简单几何平均数的计算公式为:G n
n
x
x x ⨯⨯=⨯ 2
1
=n
x ∏
两边取对数则有:lgG=n 1(lgx 1+lgx 2+…+lgx n )=∑=n
i i x n 1
lg 1
例1、某厂生产某种产品需经过三道工序,三道工序的合格率分别为95%、92%、98%,求该企业产品的平均合格率。
解:企业产品的总合格率为95%、92%和98%的连乘积。
因此,平均合格率为:G =n
x ∏=
3
%98%92%95⨯⨯=94.9684%
例2、某地区2004年的工业总产值比2003年增长6%,2005年比2004年增长8%,2006年比2005年增长3%,2007年比2006年增长5%。
求该地区2004至2007年间工业总产值的年平均增长率。
解:年平均增长率为1%105%103%108%1064-⨯⨯⨯=G
2、加权几何平均数
若数据x 1出现f 1次,x 2出现f 2次,……,x k 出现f k 次,则它们的几何平均数为:
=
G ∑∏f
f
x
例3、一笔存款在银行存了7年,其中有1年的利率为3.14%,有2年的利率为2.76%,有4年的利率为3.68%,求平均利率。
解:设存入N 元钱,则7年后的本利和为:
N ⨯⨯⨯%68.103%76.102%
14.1034
2
所以,平均利率为1742%68.103%76.102%14.103-⨯⨯=G
几何平均数的特点:
①数列中有数值为零或负数,就无法计算几何平均数; ②它受极端值影响较小;
③几何平均数的应用范围较窄,它适用于反映特定现象的平均水平,即现象的总量不等于各数值的总和,而是等于各数值的连乘积的情况。
三、中位数(M e )
将一组数据按大小顺序排列,处于中间位置上的那个数就称为中位数。
中位数把一组数据平均地分为两半,一半数据比它大,另一半数据比它小。
由于中位数居于一个数列的中间位置,因此,有时也可用来代表研究对象总体的一般水平。
中位数用M e 来表示。
中位数的位置⎪⎩
⎪⎨⎧
+221n
n 组距数列:
:资料未分组、单项数列 1、由未分组资料确定中位数
例如,数据组{ 53,64,68,71,77,80,85,86,89,94 }的中位数位置为5.52
1102
1=+=+n ,中位数5.782
8077=+=M e 。
2、由单项数列资料确定中位数
例:根据下表资料计算某班学生年龄的中位数。
表2-3-5 某班学生年龄统计表
年龄 学生人数
比重 向上累计次数 18 19 20 21 22 2 5 27 11 5 2/50 5/50 27/50 11/50 5/50 2 7 34 45 50 合计
50
1
-
解:中位数的位置为5.252
2
==,根据上表中的向上累计次数可知,中位数在第三组的第18个数和第19个数中间,为20岁。
3、由组距数列资料确定中位数
步骤:(1)计算各组的累计次数(或累计频率);
(2)按公式2n
确定中位数的位置;其中,∑
==k
i i
f n 1。
(3)根据累计次数确定中位数所在组;
(4)用线性插值法按比例推算中位数的近似值。
d n
f
S X M m
m L e ⨯-+=-1
2
d n
f
S X M m
m U e ⨯--=+1
2
式中,X L 、X U ——中位数所在组的下限、上限; d 、f m ——中位数所在组的组距、次数;
s m 1-——向上累计至中位数所在组前一组止的累计次数; s m 1+——向下累计至中位数所在组后一组止的累计次数; ∑==k
i i f n 1为数据个数。
例:根据下表资料求某班《统计学原理》成绩的中位数。
表2-3-6 某班《统计学原理》成绩统计表
《统计学原理》 成绩 学生人数 比重
向上累计 次数
向下累计 次数 90—100 80—90 70—80 60—70 60以下 3 15 19 11 2 6% 30% 38% 22% 4% 50 47 32 13 2 3 18 37 48 50 合计
50
100%
—
—
解:由公式2
n =25及向上累计次数可知,70—80这一组为中位数所在组。
下限公式:d n
f
S X M m
m L e ⨯-+=-1
21019132
5070⨯-+= =76.3(分)
上限公式:d n
f
S X M m
m U e ⨯--=+1
21019182
5080⨯--= =76.3(分)
六、众数(M o )——一组数据中出现次数最多的那个数
1、众数的存在条件:数据的个数较多,数据的次数分配有明显的集中趋势。
2、众数的计算方法
(1)单项数列确定众数——观察确定
例:某班学生年龄统计表如下,求该班学生年龄的众数。
表2-3-7 某班学生年龄统计表 年龄 学生人数
比重 18 19 20 21 22 2 5 27 11 5 2/50 5/50 27/50 11/50 5/50 合计
50
1
解:观察可知,该班学生年龄的众数是20岁。
(2)组距数列确定众数——先观察确定众数所在的组,然后用比例插值法推算众数的近似值。
下限公式:d X M L o ⋅++
=∆
∆∆
2
11
上限公式:d
X M U o ⋅+-=∆
∆∆2
1
2
式中,X L ——众数组的下限;
X U
——众数组的上限;
△1——众数组次数与前一组次数之差;
△2——众数组次数与后一组次数之差; d ——众数组的组距。
例:根据下表资料求某市居民家庭人均月收入的众数。
表2-3-8 某市居民家庭人均月收入统计表 家庭人均月收入 人数 比重 300元以下 300—600 600—900 900—1200 1200—1500 1500—1800 1800—2100 2100—2400 2400以上 20 90 170 250 390 220 140 60 10 1.48% 6.67% 12.59% 18.52% 28.89% 16.3% 10.37% 4.44% 0.74% 合计
1350
100%
解:观察上表易知,众数所在组为1200—1500这个组。
下限公式:d X M L o ⋅++
=∆
∆∆
2
1
1
()()
300220390250390250
3901200⨯-+--+
=
=1335.48(元)
上限公式:d X M U o ⋅+-=∆
∆∆2
1
2
()()
300220390250390220
3901500⨯-+---
=
=1335.48(元)
五、各种平均数之间的关系
1、根据同一组数据计算算术平均数和几何平均数,必然有:
G x >
2、算术平均数和中位数、众数三者之间的关系与总体的分布特征有关: (1)当总体呈对称分布时,M M o e X == (2)当总体分布呈左偏时,M M o e X << (3)当总体分布呈右偏时,M M o e X >>
M e =M 0=x x M e M 0 M 0 M e x
图2-3-1 算术平均数和中位数、众数三者之间的关系
英国统计学家皮尔逊提出的经验公式:
在次数分布呈轻微偏斜的条件下,有:)(3M M e o X X -=-
第四节 变量特性分析(离散指标)
{ 55,65,75,85,95 } { 73,74,75,76,77 }
一、标志变异指标(离散指标)的概念和作用
标志变异指标:测定数据离散状况,反映数据差别大小。
标志变异指标的作用:评价平均数代表性的好坏;反映社会生产和经济活动过程的均衡性、协调性、产品质量的稳定性;揭示总体变量分布的离中趋势。
测定数据离散趋势的常用指标有:异众比率、全距、四分位差、平均差、标准差、离散系数。
一、异众比率
异众比率γ是非众数的次数在总次数中所占的比重。
即
N
m
N f 0
-
=
γ
其中,∑=f i N ——总次数 f m
——众数的次数
在数量分析中,常用异众比率来衡量众数的代表性的好坏。
显然,异众比率的数值越大(γ→1),意味着非众数在总次数中所占的比重越大,数据越分散,说明众数的代表性越差;反之,异众比率的数值越小(γ→0),说明众数的代表性越好。
二、全距
全距,又称为“极差”,是一组数据x 1,x 2,…,x n 中的最大值和最小值之差,用以说明一组数据的最大变动范围。
全距通常用R 来表示。
在资料未分组时,全距x x
R min max
-=
在资料已分组时,全距=R 最高组的上限-最低组下限
特点:计算简便,易于理解;但计算粗略,易受到极值的影响,不管中间数值的差异情况,也不受次数分配的影响,不能全面反映所有数据的离散情况。