第三章 调查数据的描述分析资料讲解
数据分布特征的描述
该项活动中,每月都有数据统计及分析以用来进 行该项活动旳调整与实施。
如:有一组有关病人进入“救济”活动旳时间长 度旳数据:
67个样本:时间长度从1天到185天。
除了对该组数据进行频数方面旳描述和分析外, 下面旳统计措施在描述数据分布特征及分析方面也很 主要:
均值(mean):35.7天; 中位数(median):17天; 众数(Mode):1天
X Me Mo 当分布右偏时(阐明存在极端大旳值)
X Me Mo
3、在偏斜度适度旳情况下,不论是左偏还是右偏,中位数
与算术平均数之差约等于众数与算术平均数之差旳1/3,即有如
下经验公式:
Me
X
1 3 (M O
X)
众数、中位数和均值旳应用场合
• 众数、中位数和均值都是对数据集中趋势旳测度,
1、均值由全部数据计算,包括了全部数据旳信息,具有良 好旳数学性质,当数据接近对称分布时,具有很好旳代表性; 但对于偏态分布,其代表性较差。
Graduates Monthly Graduates Monthly Graduates Monthly
Salary($)
Salary($)
Salary($)
1
2350
5
2255
9
2440
2
2450
6
2210
10
2852
3
2550
7
2390
11
2428
4
2380
8
2630
12
2380
未分组时旳算术平均值为:2440
一、均值(Mean)
均值就是一组数据旳平均值(average value),用来测 度中心位置(central location)。
管理统计学:第三章:样本数据特征
• 式中,Xi为样本观察值。
第3.4节 样本数据的离散特征
• 描述数据集合的离散特征的两种方法: • 一、点状描述,如明确样本数据集合中的最小 值和最大值等; • 二、区间描述(基于差值的描述),如样本数 据集合中的最大值与最小值之差。
3.4.1 对样本数据离散特征的点状描述: 极值、四分点与百分位点
• 1.极大值(Maximum)与极小值 (Minimum)
• 极大值与极小值,从一定视角反映了样本 数据集合中样本的离散情况。 • 问:极大值、极小值适用于什么测度? • 另一个位与数的问题:
• 2.下四分点(Lower quartile)与上四分点 (Upper quartile) • 1)上、下四分点的概念 • 下四分点使由小到大排序后的数据集合的左 边部分,包含25%的样本总个数,右边部分 包含75%的样本总个数。 • 上四分点使由小到大排序后的数据集合的左 边部分,包含75%的样本总个数,右边部分 包含25%的样本总个数。 • 上、下四分点在一定意义上反映了样本数据 的离散情况。
• 基于排序,能够简单统计频次:
• 价格(元)9.93 9.94 9.95 9.96 9.97 9.98 9.99 10.00 • 次数: 1 0 1 1 2 3 4 4 • 频率% 3.33 0 3.33 3.33 6.67 10.00 13.33 13.33 • 价格(元)10.01 10.02 10.03 10.04 10.05 10.06 • 次数: 4 2 3 2 2 1 • 频率% 13.33 6.67 10.0 6.67 6.67 3.33
第 3章 样本数据特征的初步 分析
数据的描述与统计分析
数据的描述与统计分析数据是信息时代的重要组成部分,其描述与统计分析对于各行各业都具有重要的意义。
通过对数据的描述,我们可以准确地了解数据的特征和规律,而统计分析则可以帮助我们发现数据之间的关系和趋势。
本文将介绍数据的描述方法以及常见的统计分析技术。
一、数据的描述数据的描述是对数据进行客观、准确、全面的表述,旨在通过描述数据的特征和规律来帮助我们更好地理解数据。
以下是几种常见的数据描述方法:1. 描述性统计:描述性统计是对数据进行总结和概括的统计方法。
常见的描述性统计指标包括均值、中位数、众数、标准差等。
通过这些指标,我们可以了解数据的集中趋势、离散程度等重要特征。
2. 绘图:绘图是一种直观、形象的数据描述方法。
常见的绘图方法包括直方图、折线图、散点图等。
通过图形化展示数据,我们可以更直观地了解数据的分布、趋势和异常值等情况。
3. 呈现数据表格:数据表格是一种对数据进行系统化整理和组织的方法。
通过数据表格,我们可以清晰地呈现数据的各个变量,并进行比较、分析等操作。
二、统计分析统计分析是对数据进行概括和解释的过程,旨在揭示数据之间的关系和趋势。
以下是几种常见的统计分析技术:1. 相关分析:相关分析用于研究两个或多个变量之间的关系。
通过计算相关系数,我们可以衡量变量之间的相关程度,并判断其相关性的方向和强弱。
2. 回归分析:回归分析是一种研究因果关系的统计方法。
通过建立回归模型,我们可以揭示自变量对因变量的影响,并进行预测和解释。
3. 方差分析:方差分析用于比较多个样本之间均值的差异。
通过方差分析,我们可以确定样本之间是否存在显著差异,并进一步分析差异的原因。
4. t检验:t检验用于比较两个样本均值的差异是否显著。
它可以帮助我们判断两个样本是否来自同一总体,并进行假设检验。
5. 交叉分析:交叉分析是一种同时考虑两个或多个变量的统计方法。
通过交叉分析,我们可以研究变量之间是否存在相互影响或交互作用。
三、总结数据的描述与统计分析是理解和应用数据的重要环节。
第三章 描述性研究
第三章描述性研究一、教学大纲要求掌握:现况研究的概念与目的;普查的概念、目的及优缺点;抽样调查的方法;筛检的概念及筛检试验的评价指标。
熟悉:抽样调查估计样本大小的原则;现况研究中常见偏倚及其防止;筛检的应用原则。
了解:抽样调查估计样本大小的公式;生态学研究的概念、研究方法及应用。
二、教学大纲精要描述性研究是流行病学研究的基本步骤,常可通过对疾病和健康状态的分布特征的描述,获得有关病因假设的启发。
㈠现况研究1.概念:是按事先设计的要求在某一人群中应用普查和抽样调查的方法搜集特定时间内疾病的描述性资料,以描述疾病的分布及观察某些因素与疾病之间的关联。
亦称横断面调查或患病率调查。
2.目的:⑴描述疾病或健康状况的三间分布情况,从而发现高危人群及防制的重点疾病,为疾病的防制提供依据。
⑵描述某些因素与疾病或健康状况之间的关联,以逐步建立病因假设。
⑶为评价防制措施及其效果提供有价值的信息。
⑷为疾病的监测或其他类型流行病学研究提供基础。
3.种类⑴普查:是在一定时间内对一定范围内的人群中每一成员所作的调查或检查。
1)普查时必备的条件2)普查的目的3)普查的优缺点⑵抽样调查:用有代表性的样本的调查结果估计出该人群某病的患病率或某些特征的情况的调查方法。
1)抽样方法:①单纯随机抽样②系统抽样③分层抽样④整群抽样⑤多级抽样2)样本大小取决于①对调查结果精确性的要求高低②预期现患率或阳性率的高低3)样品大小的估计公式n= 4s2/d2①计量资料n-样本量s-总体标准差的估计值d-容许误差②计数资料n= 400*Q/pP-总体率的估计值Q=1-P4.现况研究中常见的偏倚及防止5.(1)常见的偏倚1)选择偏倚:①选择性偏倚②幸存者偏倚③无应答偏倚2)信息偏倚:①调查对象引起的偏倚②调查员偏倚③测量偏倚⑵防止偏倚的措施:①抽样遵守随机化原则②提高受检率③选用不易产生偏差的仪器、设备④培训调查员、开展互相监督和服查工作㈡筛检1、定义:是用快速检验方法主动地自人群中发现无症状病人的措施,以便早期发现、早期诊断及早期治疗病人。
《调查数据分析》PPT课件
1
文化生活服务 2.7 2.4 -0.3 0.09 2.9333
0.0333
因为合k-计1=5,设α10=00.051,00查表得— 02.05,5—11.0277.8439
因为χ2>
2 0.05 ,5
拒绝H0,接受H1,两年结构
有显著差异。
实用文档
4
横比
比较相对数甲 乙地 地某 同一 一指 指标 标数 数值 值
实用文档
例
全班学生
性别结构
女生所占比重% 本专科 中专 普中 小学 解放前 17.8 21.4 20.0 25.5 2006 48.06 52.83 46.83 46.66
实用文档
叁 分子、分母属于同类指标 贰 分子必须是分母的一部分
壹 总体各部分比重之和为100%
特点
人口死亡率是否为结构相对数?
年份 新生儿男女
海南省 广东省 湖南省 四川省 重庆市
2002 2002 2003 2003 2005
135.6 130.3 129.1 115.1 114.0
实用文档
比例相对数与结构相对 数可以相互转换。
A :B :C
AB C
A
B
C
A+B+C A+B+C A+B+C
实用文档
结构相似性的判断
判断两种结构是否有显著的差异。χ2检验法。
进行动态分析需要计算一系列动态分析指标
发展水平是时间序列中各具体时间条
件下的数值,反映事物发展变化在一定时期 内或时点上所达到的水平。
实用文档
我国手机用户数
年 份 2004 2005 2006 2007 2008
发展水平 3.3 3.9 4.6 5.5 6.4
现代社会调查方法第三章调查设计
第二节 分析单位
以个人为分析单位的描述性研究一般旨在描述 由那些个人所组成的总体,而那些以个人为分 析单位的解释性研究则是为了发现存在于该总 体中的社会动力。作为分析单位的个人可以用 他(她)所隶属的社会群体来指示其特征。
第二节 分析单位
群体:
如:家庭、班级、同辈群体、团伙 群体的属性:规模、结构、关系、凝聚力,不同与个体 的属性 例: 香港黑社会中青年学生的参与程度(分析单位:个体) 香港黑社会团伙的势力比较(分析单位:群体)
第二节 分析单位
需注意的问题:
1、层次谬误(ecological fallacy) 也称之为区群谬误、生态谬误或体系错误,指的是在 社会调查中,研究者用一种比较大的集群分析单位作 研究,而用另一种比较小的或非集群分析单位作结论 的现象。或者说,研究者在一个比较大的集群的分析 单位上收集资料,而在一个比较小的或非集群的分析 单位上来下结论的现象。
名次
星级排名
学校名称 所在地区 总分 办学类型 6星级
办学层次
中国顶尖大学 中国顶尖大学 中国一流大学 中国一流大学 中国一流大学 中国一流大学
1
2 3 4 5 6
北京大学
清华大学 复旦大学 浙江大学 上海交通大学 南京大学 中山大学
北京
北京 上海 浙江 上海 江苏 广东
100.00
98.25
抽样对象:指的是一次直接抽样时所采用的对象或单位。 抽样对象仅仅只与样本抽取过程以及构成总体的元素有 关。但大多数情况下最终的抽样对象往往与调查对象相 一致。
第三节 设计抽样方案
1、抽样设计 回顾:普查与抽查
流行病学-第三章-描述性研究
14
缺点: - 普查对象多,调查期限短,难免漏查 - 调查质量不易控制 - 患病率低,诊断技术复杂的疾病不宜进行 普查
15
(2)抽样调查 概念:
抽样调查是从总体中随机抽取一个有 代表性的样本作为研究对象,根据样本的 调查结果推论总体情况。
16
目的:
- 以样本统计量估计总体参数所在范围,即 通过样本推断总体,描述疾病或健康状况的 分布及影响因素 - 衡量人群健康水平 - 考核防治效果 - 检查与衡量资料质量
也叫做: - 患病率研究 (prevalence study) - 横断面研究 (cross-sectional study)
- survey
8
2、 研究特点 - 常用的流行病学调查方法 – 开始时一般不设对照组 – 在时序上属于横断面研究 – 不能得出因果关系的结论 – 一般不用于病程比较短的疾病 – 对不会发生改变的暴露因素,可以
30
2)随机抽样
遵循随机化原则,保证总体中每一个对 象都有同等机会被选入作为研究对象 单纯随机抽样
单纯随机抽样 系统抽样 分层抽样 整群抽样 多级抽样
31
①单纯随机抽样(简单随机抽样)
Simple random sampling
• 最简单、最基本的抽样方法
• 从总体N个对象中,利用抽签或其他随 机方法抽取n个
提示因果联系
9
3、研究目的与应用 1)描述疾病或健康状况的分布 2)发现病因线索。描述某些变量与特征与疾病之
间的关系 3)适用于疾病的二级预防 4)进行疾病监测并为评价防治措施的效果提供参 考信息
10
4) 判断某社区人群中是否存在公共卫 生问题 5)确定高危人群 6)确定各项生理指标和正常参考值范围
SPSS数据分析教程-3-描述性统计分析PPT课件
.
46
条形图
.
47
饼图
.
48
帕累托图
.
49
直方图-茎叶图-箱图
描述性->探索
直方图 茎叶图 箱图
示例:数据Employ Data.sav
直方图 茎叶图 箱图
.
50
直方图和茎叶图
.
51
箱图
.
52
从旧对话框作图
重新完成上面两个例子中的图形(箱图除外)
.
53
饼图-帕累托图
SPSS数据分析 教程
.
1
第3章 描述性统计分析
—《SPSS数据分析教程》
.
2
主要内容
描述性统计分析
频率分析 对数据进行描述的图形化方法和数值方法 学习分析数据分布的方法 应用SPSS进行描述性数据分析的方法 常用统计图形的绘制方法和解释技巧 数据标准化
.
3
本章学习目标:
掌握数据分析项目的整个过程; 掌握数据的分类方法; 掌握对数据进行描述的图形化方法和数值方法; 学习分析数据分布的方法; 掌握应用SPSS进行描述性数据分析的方法; 掌握常用统计图形的绘制方法和解释技巧
平均 若i不是整数,则向上取整。
.
28
总结五数
最小值、第一个四分位数、中位数、第三个四 分位数、最大值
从这五个值可以大致看出数据分布的中心和离 散程度。而箱图则是这五个数的图形表现
.
29
3.4 分布的形状
偏度
当偏度0时,分布为正偏 或右偏,布图形在右边拖 尾,分布图有很长的右尾, 尖峰偏左
.
42
设定表格
.
43
表格:摘要统计量设置
.
第三章+数据分布特征的描述(教案)
第三章+数据分布特征的描述(教案)第三章数据分布特征的描述(一)教学目的通过本章的自学,并使同学们正确理解各种指标的概念及计算方法,学会运用适当的统计数据指标对数据的原产特征展开分析表明。
(二)基本要求并使学生熟练掌握数据分布特征的叙述方法。
(三)教学要点1、集中趋势的测度指标及其计算方法;2、离散趋势的测度指标及其计算方法;3、总体分布的偏度与峰度的测度。
(四)教学时数9――10课时(五)学习内容本章共分三节:第一节数据分布分散趋势的测量一、定类数据集中趋势的测度――众数(mode)(一)概念要点众数就是指一组数据中发生次数最少的变量值,用mo表示。
从变量分布的角度看,众数就是具备显著分散趋势点的数值,一组数据分布的最高峰点所对应的数值即为为众数。
当然,如果数据的原产没显著的分散趋势或最高峰点,众数也可以不存有;如果存有多个高峰点,也就存有多个众数。
1.集中趋势的测度值之一2.出现次数最多的变量值3.不受极端值的影响4.可能将没众数或存有几个众数5.主要用于定类数据,也可用于定序数据和数值型数据众数的不唯一性:并无众数原始数据:10591268一个众数原始数据:659855多于一个众数原始数据:252828364242(二)众数的排序根据未分组数据或单变量值分组数据计算众数时,我们只需找出出现次数最多的变量值即为众数。
对于组距分组数据,众数的数值与其相邻两组的频数分布有一定的关系,这种关系可作如下的理解:设众数组的频数为fm,众数前一组的频数为f?1,众数后一组的频数为f?1。
当众数相连两组的频数成正比时,即f?1=f?1,众数组的组中值即为众数;当众数组的前一组的频数多于众数组后一组的频数时,即f?1>f?1,则众数可以向其前一组依靠,众数大于其组中值;当众数组后一组的频数多于众数组前一组的频数时,即f?1<f?1,则众数可以向其后一组依靠,1众数大于其组中值。
基于这种思路,借助几何图形而求出的分组数据众数的计算公式如下:下限公式:mo?l?下限公式:fm?f?1??d?l?1?d(fm?f?1)?(fm?f?1)?1??2(3.1)fm?f?1??d?u?2?d(fm?f?1)?(fm?f?1)?1??2(3.2)mo?u?式中:l表示众数所在组的下限;u表示众数所在组的上限;d表示众数所在组的组距。
整理分析市场调查资料:市场调查资料的描述分析
5.1.3 中位数
是将数据按某一顺序(从大到小,或相反)排 列后,处在最中间位置的数值。
例:
例:某企业委托市场调查公司对顾客在某一时 间段内购买其生产的日用品次数进行调查。对 15个顾客的调查结果按次数排序是:
0、0、0、0、1、1、1、1、1、2、2、2、3、 7、9
中位数是:1,说明被调查人群中在本店购买行为的常态为1次。
注意:
对于n个数据:
1.若n为奇数,排序后,第 (n+1)/2 位置的数 据 就是中位数;
2.若n是偶数,排序后,第 n/2 位置的数据与 n/2 +1 位置的数据的平均值就是中位数。
中位数的要点
(1)集中趋势的测度值之一 (2)排序后处于中间位置上的值 (3)不受极端值的影响 (4)主要用于定序数据,也可用于数值型数据 ,但不能用于定类数据
讨论:
某企业在职员工的月工资情况
工资额(元/月)
人数
1500
50
2000
115
2500
55
9000
10
合计
230
要分析该企业在职员工的月工资的平均水平情况,
你认为应该采取哪种数值更为合适?为什么?
5.2数据的离散程度分析
是指数据在集中分布趋势状态下,同时存在的 偏离数值分布中心的趋势。 用来反映数据之间的差异程度。 检验平均值代表性的大小。
条形图 直方图、折线图
饼形图 环形图
市场调查 资料的定
性分
对比 分析 推理分析 归纳分析
市场调查 资料的解
析分析
任务六
方差 分析
相关 分析
回归 分析
分析操作 适用
分析操作
适用
市场调查 资料的描 述分析
第三章 2-定性资料的统计描述
二、疾病和死因分类
疾病的命名(nomenclature of diseases):标 准化的术语 疾病分类(classification of diseases):将具有 共性的疾病归纳、分类。 区别:前者为疾病名称标准化,后者是统计研究 需要。
1853年,国际统计学会着手编制了统一的疾病 名称和死因分类,先是在欧洲使用。 1893年开始建立国际疾病和死因分类 (International Classification of Diseases,简记 为ICD)
2. 计算相对数时分母应有足够数量 例 甲医院治疗某类患者100人,40人有效; 乙医院治疗同类患者5人,2人有效 有效频率均为40% !?
如果资料的总例数过少,计算得到的相对数 偏差可能会很大,直接报告原始数据更为可取: 甲医院有效率40% 乙医院有效 2/5
3. 正确地合并估计 例 甲医院治疗某类患者100人,40人有效; 乙医院治疗同类患者90人,30人有效 如果两医院总体有效率的确相等, 合并估计: 40 30 有效率 36.8% 100 90 不可将两个频率相加除以2:
(一)人口死亡资料的来源
我国人口死亡资料主要由公安部门负责收集。 国家规定居民死亡后,必须及时报告并注销户口。 死于医院者,医师应负责填写死亡报告单 ----正确填写死因 死因依据:国际统计分类第十版(International classification of diseases, ICD-10)中的死因分类。 注意杜绝婴儿死亡的漏报。
实际工作中,有时近似地 平均人口数 ≈人口总数 理论上, 平均人口 = 各时点人口数相加再除以总时点数 实际中,
平均人口≈相邻两年年末人口数相加再除以2
(二)人口构成及其统计指标
统计数据的描述性分析
统计数据的描述性分析一、引言描述性分析是对数据进行基本统计和图形展示,以揭示数据内在的规律和特点的方法。
在统计分析中,描述性分析是首要的步骤,为后续的推论性分析提供基础。
本文将对描述性分析的概念、方法、工具和应用进行详细阐述,以期提高人们对描述性分析的认识和应用能力。
二、描述性分析的概念描述性分析主要是通过一些统计量和图表来刻画数据的特征,包括数据的分布情况、集中趋势、离散程度等。
具体来说,描述性分析包括了以下几个方面:1. 数据的收集与整理:这是描述性分析的基础,需要对数据进行清洗、分类、分组等处理,以便后续分析。
2. 中心趋势的度量:用于描述数据的集中趋势或平均水平,常见的中心趋势度量包括均值、中位数和众数等。
3. 离散趋势的度量:用于描述数据的分散程度或波动情况,常见的离散趋势度量包括方差、标准差和四分位距等。
4. 数据的分布形态:通过直方图、箱线图等图形展示数据的分布情况,如正态分布、偏态分布等。
三、描述性分析的方法与工具1. 统计量计算:使用统计软件或编程语言(如SPSS、Python等)计算中心趋势和离散趋势的统计量,以便于分析数据的特征和规律。
2. 图表绘制:通过绘制直方图、箱线图、散点图等图表来展示数据的分布情况、相关关系等,使得数据分析更加直观和易于理解。
3. 探索性数据分析(EDA):通过一系列数据可视化和统计检验方法来发现数据中的规律、异常、趋势等,为后续的推论性分析提供参考。
四、描述性分析的应用描述性分析在各个领域都有广泛的应用,如商业分析、金融投资、医学统计等。
下面以几个具体的应用案例来说明描述性分析的实用性和重要性:1. 商业分析:通过收集销售数据,利用描述性分析来刻画产品的销售情况,如销售额、销售量、客户群体等。
通过对这些数据的描述性分析,企业可以发现哪些产品在市场上更受欢迎,哪些客户群体更具购买力等,从而为产品开发和营销策略提供依据。
2. 金融投资:在金融领域,描述性分析可以用来分析股票、基金等金融产品的收益情况、风险水平等。
数据的统计分析与描述剖析精品PPT课件
1
x2
e2
2p
分布函数
F(x)
1
x
y2
e 2 dy
2p
0.4
0.35
0.3
0.25
0.2
0.15
0.1
0.05
0
-4
-2
0
2
4
6
2021/2/1
7
2. 2 分布 2 (n)
若随机变量 X1,X2,…,Xn 相互独立,都 服从标准正态分布 N(0,1),则随机变量
Y=
X
2 1
1. 表示位置的统计量—平均值和中位数.
平均值(或均值,数学期望): X
1 n
n i 1
Xi
中位数:将数据由小到大排序后位于中间位置的那个数值.
2. 表示变异程度的统计量—标准差、方差和极差.
标准差: s
[ 1 n 1
n i1
(Xi
1
X )2 ]2
它是各个数据与均值偏离程度的度量.
方差:标准差的平方.
极差:样本中最大值与最小值之差.
2021/2/1
4
3. 表示分布形状的统计量—偏度和峰度
偏度: g1
1 s3
n
(Xi
i 1
X )3
峰度: g2
1 s4
n
(Xi
i 1
X)4
偏度反映分布的对称性,g1 >0 称为右偏态,此时数据位于均值 右边的比位于左边的多;g1 <0 称为左偏态,情况相反;而 g1 接近 0 则可认为分布是对称的.
2,…,k).这样的统计量称为估计量.
1. 点估计:构造(X1,X2,…,Xn)的函数ˆi ( X1,X2,…,Xn) 作为参数 i 的点估计量,称统计量ˆi 为总体 X 参数 i 的点估计量.
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第三章调查数据的描述分析第三章调查数据的描述分析对整理后的调查数据进行统计分析,首先是认识数据的特征。
由于指标是描述总体数量特征的具体表现,故调查数据特征的认识表现为指标的设计与计算。
设计什么样的指标取决于所要认识的数据特征。
本章讨论的数据特征主要有三个方面,即数据间的数量关系特征、数据分布的集中趋势特征和离中趋势特征,相应地,设计的指标有三类,分别为相对指标、平均指标和变异程度指标。
这些指标的计算和运用构成了本章的主要内容。
第一节相对指标分析一、相对指标的概念与作用将两个有联系的数据值进行对比形成的相对数,称为相对指标,它反映着事物内部或事物间的数量关系特征。
例如:将实际完成的数值与计划任务数值对比,可反映计划执行的进度和完成的程度;将不同时间上的同类数据值对比,可反映现象变化的快慢程度,等等。
相对指标通过对比不同数据值,将现象总体数量上的绝对差异抽象化,从而使那些由于规模不同,条件不同,无法直接对比的现象找到可比较的基础,化不可比为可比。
从这个意义上讲,相对指标在统计分析中的运用主要表现在比较分析中。
多数相对指标采用无名数如系数、倍数、成数、百分数、千分数等表示;但也有相对指标采用名数表示,如流动资金周转率指标用“次”表示。
二、常用相对指标及其计算方法(一)反映数据结构特征的相对指标仅供学习与交流,如有侵权请联系网站删除谢谢44仅供学习与交流,如有侵权请联系网站删除 谢谢451.结构相对指标结构相对指标,是总体的部分数值与总体全部数值的比值,需在数据值分组的基础上计算,通常又称为比重,习惯用百分数表示。
其计算公式为:%100⨯=总体的全部数值总体的各组数值结构相对指标【例3.1】某一项城市住房问题的研究中,调查数据值统计整理如表3-1所示:表3-1 甲城市家庭对住房状况的评价在调查数据的分析中,结构相对指标除了能够反映总体内部的结构状态特征,揭示事物的性质外,还可用来说明总体中各个部分对总体的影响程度,即可以用来寻找主要影响因素。
2.比例相对指标比例相对指标,是同一总体内某一部分数值与另一部分数值的比值,也是在数据分组的基础上计算。
如果说结构相对指标反映的是部分与整体的数量关系,那么,比例相对指标反映的则是部分与部分间的数量关系。
比例相对指标的计算公式为:总体中另一部分数值总体中某一部分数值比例相对指标=仅供学习与交流,如有侵权请联系网站删除 谢谢46比例相对指标既可用百分数表示,也可用一比几或几比几的形式表示。
若总体中多于两个部分对比,通常采用连比的形式来表现,如a:b:c 。
在调查数据的分析中,比例相对指标主要用于对具有结构规律的现象进行探索性分析以及评价各种比例关系是否协调。
(二)用于比较分析的相对指标 1.比较相对指标比较相对指标,是同一时间上不同总体的某一项指标对比的结果,它反映同类现象变化的均衡与否。
其计算公式为:另一总体的该项指标值某总体的某项指标值比较相对指标=比较相对指标通常用系数或倍数表示。
【例3.2】2003年甲市和乙市的城镇居民人均消费支出分别为10284.6元和10464.0元,则可得017.16.102840.10464=说明乙市的人均消费是甲市的1.017倍。
在调查数据的分析中,运用比较相对指标的分析,俗称横向比较分析。
它有助于揭露矛盾,找出差剧,挖掘潜力,促进事物进一步发展。
2.动态相对指标动态相对指标,是某一指标同空间、不同时间上的数值对比的结果,用来反映同一现象在时间上的变化快慢程度,又称为发展速度。
其计算公式为:%100⨯=基期水平值报告期水平值动态相对指标公式中,基期水平值是比较的标准,报告期是观察研究的时期。
【例3.3】某企业2000年的总产值为82067万元,2003年为89404万元,则2003年总产值的发展速度为:仅供学习与交流,如有侵权请联系网站删除 谢谢47总产值的发展速度89404100%108.94%82067=⨯= 说明2003年的总产值为2000年的108.94%,增长了8.94%。
在调查数据的分析中,动态相对指标用于反映现象动态变化的数量特征,所进行的分析俗称纵向比较分析。
(三)计划完成程度相对指标计划完成程度相对指标,是某一时期实际完成的数值与该期计划数值的比值,一般用百分数表示,专门用来考核一项计划完成的情况。
其基本计算公式为:%100⨯=计划数值实际完成的数值计划完成程度由于现象的不同特点,人们在制定计划时,有的以总量指标值和平均指标值作计划数值,有的则以相对指标值作计划数值;又由于不同表现形式的数值具有不同的特点,这些导致计划完成程度相对指标的计算方法不尽相同。
下面结合例子分述如下:1.计划数值为总量指标值和平均指标值 【例3.4】设某企业2004年第一季度A 产品计划产量为200台,实际为240台,则2004年第一季度A 产品产量计划完成程度为:计划完成程度相对指标240100%120%200=⨯=说明该企业A 产品产量计划完成了,超额完成计划20%。
【例3.5】设某企业2004年第一季度A 产品计划单位成本为650元/台,计划执行结果表明,实际为630元/台,则2004年第一季度A 产品单位成本计划完成程度为:计划完成程度相对指标630100%96.9%650=⨯=说明该企业A 产品单位成本计划完成了,超额完成计划3.1%。
仅供学习与交流,如有侵权请联系网站删除 谢谢48归纳以上两例,得一般计算公式为:相对指标计划完成程度()()%100⨯=平均指标值计划总量指标值平均指标值实际完成的总量指标值 还可知,对指标值越大越好的计划,计划完成程度不小于100%为完成计划,而对指标值越小越好的计划,计划完成程度不大于100%为完成计划。
2.计划数值为相对指标值 【例3.6】某企业劳动生产率计划规定2003年比2002年提高5%,实际提高8.5%,问企业劳动生产率计划的完成情况如何?这个问题的解答有两种方式。
方式一:以报告期的计划为考核标准,计算公式为:计划变化率实际变化率计划完成程度±±=11本例中,劳动生产率计划完成程度18.5%100%103.33%15%+=⨯=+计算结果表明,2003年劳动生产率提高计划完成,超额完成了3.33%。
方式二:以基期水平为考核标准,计算公式为:计划完成程度=报告期实际变化率-报告期计划变化率 本例中,劳动生产率计划完成程度 = 8.5%-5% = 3.5(百分点)计算结果表明,在2002年的基础上,2003年劳动生产率实际比其计划多提高了3.5个百分点,2003年劳动生产率计划完成。
方式一的计算特点是包括基数在内,不能直接用报告期的变化率对比来说明计划的完成情况;方式二的特点在于报告期实际与计划变化率的差额为正,表示计划完成,差额为负,表示计划没有完成,而且差额不能用百分数表述,而要用百分点表述。
三、计算和运用相对指标分析时应注意的问题 1.分子数值与分母数值必须具备可比性仅供学习与交流,如有侵权请联系网站删除 谢谢49相对指标分析用的是对比的方法,揭示的是现象间的联系程度,反映的是现象间的差异程度。
对比,当然应具有可比性,否则,必然会歪曲事实,导致判断错误。
分子与分母数值的可比性一般包括:计算内容、计算方法、计算范围、计算价格等。
2.相对指标与绝对指标结合运用相对指标在用对比的方法揭示现象间数量关系的同时,因抽象掉了现象的绝对水平,故反映不出现象间绝对量上的差异;绝对指标虽可反映现象的绝对水平,但又不能反映出现象间的联系及数量关系。
因此,应将相对指标与绝对指标结合起来运用。
在对数据作对比分析时,既要看到现象的变化程度,又要看到这一变化程度下的绝对水平差异,从而深刻认识现象变化的实质。
第二节 集中趋势分析一组数据的集中趋势指的是该组数据值的平均水平。
一组数据各不相等乃个性使然,抹杀个性方能表现共性,也就是说,消除数据间的具体差别才能得到平均值。
在调查数据的分析中,常用平均值描述一组数据的共性(集中趋势)。
平均值是一个代表性数值。
平均的实质在于消除差别。
如何消除数据间的数量差别?这既要考虑平均值是否敏感于数据中的极端值,即耐抗性问题,又要考虑各个数据值作为个量与其总量间的数量关系问题,故可将平均方法作如下分类。
一、数值平均法数值平均法是就一组数据中所有数据值进行平均的方法。
其优点是,数据信息利用得充分;缺点是,该组数据中若存在极端值,则平均值将会受其平均方法算术平均法 几何平均法众数法 分位数法(加法模式) (乘法模式)仅供学习与交流,如有侵权请联系网站删除 谢谢50影响,从而失真,即耐抗性不好。
一笔钱存入银行,存期五年且年利息率不同。
若按单利计算利息,则各年的年利率与五年间的总年利率是和的关系,即个量与其总量呈加法模式,此情境下,算术平均法或调和平均法与年平均利率相匹配;若按复利计算利息,则各年的年利率与五年间的总年利率是乘积的关系,即个量与其总量呈乘法模式,此情境下,几何平均法与年平均利率相匹配,故数值平均法又分算术平均法、调和平均法与几何平均法。
1.算术平均法【例3.7】 设某市2002年城市住户抽样调查资料如表3-2所示:根据表3-2数据,计算平均每户月收入如下:=总收入户均月收入总户数350406509095011012501051550701850502150354090110105705035⨯+⨯+⨯+⨯+⨯+⨯+⨯=++++++=5845001169500=(元) 由上例的计算,不难抽象出算术平均值的一般计算公式:仅供学习与交流,如有侵权请联系网站删除 谢谢51112212(3.1)n n n x f x f x f xfx f f f f+++∑==+++∑将3.1式改写为:1212nnf f f x x x x f ff=+++∑∑∑ 即()(3.2)f x xf=∑∑(3.2)由3.1及3.2式可知,算术平均值的大小受两个因素的影响:其一是组变量值水平(x );其二是组变量值所对应的组次数(f )或组次数所占比重()ff∑。
由于组次数的多少或组次数所占比重的大小能衡量相对应的组变量值对平均值的影响程度,即起着权衡轻重的作用,故理论上将组次数或组次数所占比重称为权数。
权数有两种数值表现形式,一是绝对数形式(f ),二是相对数形式()ff∑,但权数的实质为相对数,即权数对平均值大小的影响不取决于其绝对数的多少,而取决于其所占比重的大小。
考虑到数据分组后的一种极端情形:12n f f f ===3.1式变为x x n∑=(3.3)其中:n 为数据个数。
3.3式告诉我们:平均值的大小只受一个因素——组变量值(x )的影响,且为3.1式的一个特例。
至此,我们可以给算术平均值下定义了。
仅供学习与交流,如有侵权请联系网站删除 谢谢52一组数据值和与该组数据值个数的比值称为算术平均值。