实用统计学第五章
刘超_简明应用统计学_第2版 第5章_统计推断:对总体参数的估计
5-3
简明应用统计学(第2版)
刘超,北京航空航天大学数学与系统科学学院
5.1 引言
• 从数据中提取与研究问题有关的信息,并 利用它得到关于现实世界的结论的过程就 叫做统计推断(statistical inference)。 • 估计(estimation)是统计推断的重要内容之 一。 • 统计推断的另一个主要内容是下一章要介 绍的假设检验(hypothesis testing)。
2 p
5 - 17
简明应用统计学(第2版)
刘超,北京航空航天大学数学与系统科学学院
样本均值的抽样分布 与中心极限定理
当总体服从正态分布N(μ,σ2) 时,来自该总体的所有 容量为 n 的样本的均值 x也服从正态分布, x 的数 学期望为μ,方差为σ2/n。即x~N(μ,σ2/n)
s 10
5-5 简明应用统计学(第2版) 刘超,北京航空航天大学数学与系统科学学院
5.1 引言
• 人们往往先假定某数据来自一个特定的总体族 (比如正态分布族)。
• 要确定是总体族的哪个成员则需要知道总体参 数值(比如总体均值和总体方差)。 • 人们于是可以用相应的样本统计量(比如样本 均值和样本方差)来估计相应的总体参数。
5 - 15
简明应用统计学(第2版)
刘超,北京航空航天大学数学与系统科学学院
样本比例的抽样分布
1. 在重复选取容量为n的样本时,由样本比 例的所有可能取值形成的相对频数分布
2. 一种理论概率分布
3. 当样本容量很大时,样本比例的抽样分布 可用正态分布近似 4. 推断总体比例的理论基础
5 - 16
5 - 13
简明应用统计学(第2版)
刘超,北京航空航天大学数学与系统科学学院
《应用统计学》第五章
(5-11)
这时,两个样本均值之差经标准化后服从自由度为 的 分布,即
的增大而逐渐趋于对称。常用的与 2 分布相关的Excel函数有两个:CHIDIST用 于计算给定 2值和自由度的 2 分布概率;CHIINV用于计算给定概率和自由度 时相应的 2 值。
13
第一节 参数估计的基本原理
第 五 章 参 数 估 计
14
第一节 参数估计的基本原理
第 五 章
参
(四)
有以下性质:① 它是一种非对称分布;② 它有两个自由度,即n1 1 和 n2 1, 相应的分布记为F( n1 1 ,n2 1),n1 1 通常称为分子自由度, n2 1 通常称为 分母自由度;③ F分布是一个以自由度 n1 1 和 n2 1为参数的分布族,不同的自
由度决定了F分布的不同形状,如图5-4所示。常用的与F分布相关的Excel函数有
等都可以是一个估计量。
估计值是指根据一个具体的样本计算出来的估
计量的数值。例如,要估计某城市300万名职工的
月平均工资,从中随机抽取300名职工进行调查,
根据样本计算出月平均工资为3 000元,该城市职
工总体平均工资不知道,于是用样本均值3 000元
估计总体均值,这个3 000元就是估计值。
6
第一节 参数估计的基本原理
别划分的男女学生的生活费支出数据,如表5-1如示。
目
录
页
2
CONTENTS PAGE
引导案例
根据抽样结果,使用95%的置信水平得到的估计结论是:全校本科生的月生活费平 均水平在888.28~941.47元之间;男生的月生活费平均水平在834.57~944.97元之间; 女生的月生活费平均水平在886.59~990.42元之间。
国开作业实用卫生统计学-第五章 抽样误差 自测练习34参考(含答案)
题目:表示均数抽样误差大小的统计指标是?()
选项A:标准误
选项B:方差
选项C:标准差
选项D:变异系数
答案:标准误
题目: C )
选项A:总体标准差
选项B:样本均数的标准差
选项C:总体均数
选项D:总体均数的离散程度
答案:样本均数的标准差
题目:抽样研究中,s为定值,若逐渐增大样本含量,则样本()选项A:标准误增大
选项B:标准误不改变
选项C:标准误减小
选项D:标准误的变化与样本含量无关
答案:标准误减小
题目:均数标准误越大,则表示此次抽样得到的样本均数()
选项A:抽样误差越大
选项B:可靠程度越大
选项C:系统误差越大
选项D:测量误差越大
答案:抽样误差越大
题目:在总体中抽样得到的样本率与总体率不同的原因()
选项A:抽样误差
选项B:均数不同
选项C:测量误差
选项D:总体的本质差异
答案:抽样误差
题目:要减小抽样误差,最切实可行的方法是()
选项A:控制个体变异
选项B:提高仪器精度
选项C:适当增加观察例数
选项D:严格挑选观察对象
答案:适当增加观察例数
题目:已知某地36岁以上的正常成年男性的收缩压总体均数是120mmHg,标准差为11mmHg,后者反映的是?()
选项A:抽样误差
选项B:测量误差
选项C:系统误差
选项D:个体变异
答案:个体变异
题目:在控制了系统误差和测量误差后,从某地30岁正常成年女性总体中随机抽样30名,
样本均数与总体均数有差别,产生差别的原因是?()
选项A:抽样误差
选项B:个体变异。
《统计学第五章》PPT课件
2.平均增长量
平均增长量是时间序列中逐期增长量 的序时平均数,它表明现象在一定时段内平均每 期增加(减少)的数量,其计算公式为:
(yi yi1) / n
计算公式c为:a b
例:某企业2005年计划产值和产值计划完成程度的资 料如下表所示。求平均计划完成程度。
1季 2季 3季 4季
计划产值(万元)b 860 887 875 898 计划完成(%) c 130 135 138 125
10
计划完成程度
实际产值 计划产值
ca b
bc b
bc n bn
定基发展速度是报告期水平与某一固定时期水平(通常是最 初水平)的比值,用 ai 表示,则有
ai
yi y0
2.环比发展速度
环比发展速度是报告期水平与前一期水平的比值,用 bi 表示,
则有
bi
yi yi1
定基发展速度与环比发展速度的数量依存关系:
第一,定基发展速度等于相应时期内各环比 发展速度的连乘积。
(二)时间序列的模型 1.加法模型 加法模型是指时间序列的各个观察值是 上述四种因素之和 :
Y T SCI
2.乘法模型 假设四种因素是相互交错影响的关系,时
间序列(Y)即为 :
Y T SCI
式中 Y , T ,均为绝对指标;S ,C ,
I 则是比率,或称为指数,是在100% 上下波
动,对原数列指标增加或减少的百分比。
2.高次方程法 高次方程法也称累计法。采用这一方法的原
理是:各期发展水平等于序列初始水平与各期环比发 展速度的连乘积,即
统计学 第五章 统计指数及其应用
第三节 平均数指数的编制
一、概念要点
(一) 以某一时期的总量为权数对个体指数加权平均 (二) 权数通常是两个变量的乘积 可以是价值总量,如商品销售额(销售价格与销售 量的乘积)、工业总产值(出厂价格与生产量的乘积) 可以是其他总量,如农产品总产量(单位面积产量 与收获面积的乘积) (三)因权数所属时期的不同,有不同的计算形式
选择正常时期或典型时期作为基期
报告期距基期的长短应适当
二、数量指标综合指数的编制 指数公式的形成:求和、相比、定时三个步 骤。 关于同度量因素的时期确定及其原因 三、数量指标综合指数的编制 指数公式的形成:求和、相比、定时三个步 骤。 关于同度量因素的时期确定及其原因
关于基期加权综合法(拉氏指数) 基期加权综合的指数,是把同度量因素固定在 基期水平编制指数的方法。基期加权综合指数公 式称为拉氏公式。1864年德国学者斯拉贝尔首次 提出而得名。 利用拉氏公式计算指数的特点 优点: 在于指数数列中各期权数相同,指数数值之间 可以进行互相比较,用以说明所研究现象变化的 程度及其规律性。
从理论上讲,一切综合指数都可以变成算术 指数和调和指数。 将质量指标综合指数改变为算术指数,由此 引出零售物价指数的简捷式。
第四节
指数体系及其因素分析
一、指数体系 (一)指数体系的概念
若干个指数由于数量上的联系而形成为一个 整体叫做指数体系。 指数体系因素影响的绝对值之和 等于实际发生的总差额。
(二)指数体系的作用
1、测定某一现象的总变动中,各个构成因素的 影响方向、程度和绝对量。 2、利用指数体系各指数之间的联系,可以由已 知的指数数值求出未知的指数数值。
二、因素分析法
(一)因素分析法的概念
统计指数用于分析受多因素影响的现象的总变 动中各个因素影响的方向和程度时,叫做因素分 析法。
应用统计学(第五章 统计推断)
检验统计量: χ2 (n 1) s2 σ02
例题5 已知某农田受到重金属污染,抽样测定其镉含量
(μg/g)分别为:3.6、4.2、4.7、4.5、4.2、4.0、3.8、
3.7,试检验污染农田镉含量的方差与正常农田镉含量的方 差0.065是否相同。
解:假设 H0:σ 2 σ02 , H A:σ 2 σ02
P(μ-1.960 σ x ≤ x < μ+1.960 σ x)=0.95
否定区
接受区
否定区
左尾
0.025
μ-1.960σ x
0.95
0.025
0 μ+1.960σ x
右尾
临界值: ± uσ x= ± 1.960σ x
双尾检验 = 0.01
P(μ-2.576 σ x ≤ x < μ+2.576 σ x)=0.99
解: 假设: H0: μ ≤ μ0, HA : μ > μ0 确定显著水平:α=0.05 检验统计量:u x μ0 379.2 377.2 1.818 σ n 3.3 9 u0.05=1.645,计算得:u=1.818>u0.05,P<0.05
推断:否定H0,接受HA。
即:栽培条件的改善,显著提高了豌豆籽粒重量。
4)推断
接受/否定H0(HA,实际意义)
例题1 正常人血钙值服从的正态分布,平均值为2.29 mM,标准差为 0.61mM。现有8名甲状旁腺减退患者经治疗后,测得其血钙值平均为 2.01mM,试检验其血钙值是否正常。
1)提出假设 2)确定显著水平 3)计算概率 4)推断
1)提出假设
H0
零假设 /无效假设
对 /检验假设
国开网实用卫生统计学网上作业第五章含答案
下列关于相对比计算的叙述正确的是()。
选择一项:a. 相对比公式中的甲乙指标一定要是绝对数b. 要求两指标必须性质相同,否则无法比较c. 对公式中的甲乙指标无明确限制,相对比的用途可以很广d. 甲乙指标一定要选用相对数题目2正确获得0.80分中的0.80分标记题目题干关于相对数,下列哪一个说法是错误的()选择一项:a. 常用相对数包括:相对比,率与构成比b. 计算相对数时要求分母要足够大c. 率与构成比虽然意义不同,但性质相近,经常可以混用d. 相对数是两个有联系的指标之比题目3正确获得0.80分中的0.80分标记题目题干关于构成比指标,描述正确的是( )。
选择一项:a. 构成比是说明某现象发生的频率或强度的指标b. 构成比的分母是可能发生某现象的观察单位总数c. 以m/n表示构成比,可得出m与n的倍数关系或m是n的几分之几d. 其表示事物内部各部分的比重大小题目4正确获得0.80分中的0.80分标记题目题干某县流脑发病率动态分析显示:以2012年的21.37/10万为基期水平,2013年流脑发病率为5.22/10万,2015年的定基发展速度是( )。
选择一项:a. 79.04%b. 90.47%c. 24.43%d. 27.00%题目5正确获得0.80分中的0.80分标记题目题干为调查某地区某病的发病情况,随机选取男200人、女100人作为调查对象,测得其感染阳为是()。
选择一项:a. 16.7%b. 无法计算c. 35%d. 18.3%题目6正确获得0.80分中的0.80分标记题目题干对两地的结核病死亡率比较时作率的标准化,其目的是()。
选择一项:a. 为了能更好地反映人群实际死亡水平b. 消除两地人口年龄构成不同的影响c. 消除各年龄组死亡率不同的影响d. 消除两地总人数不同的影响题目7正确获得0.80分中的0.80分标记题目题干某日门诊各科疾病分类资料可以作为()。
选择一项:a. 计算死亡率的基础b. 计算构成比的基础c. 计算病死率的基础d. 计算发病率的基础题目8正确获得0.80分中的0.80分标记题目题干对于率的标准化法的理解,不正确的是()。
统计学第五章课后习题答案
统计学第五章课后习题答案一、选择题1:B 、C 【解析】所谓概率抽样,就是要求对总体的每次观察(每一次抽取)都是随机试验,并且有总体相同的分布。
2:D3:A 【解析】221226'42z n n α==∆⎛⎫ ⎪⎝⎭4:B 【解析】一致性是指随着样本容量不断增大,样本统计量接近总体参数的可能性就越来越大。
或者,对于任意给定的偏差控制水平,两者间偏差高于此控制水平的可能性越来越小,接近于0。
5:AC二、计算题 1: x =425 s n 21-=72.049 s 14=8.488s =n s =15488.8=2.1448 ∆=ns n t )1(2-α=2,1448⨯2.1916=4.70 所求μ的置信区间为425-4.701<μ<425+4.70即(420.30,429.70) 2: x =1209 s n 21-=0.005 s 15 =0.0707x s =n s =160707.0=0.017671 )116(05.0-t =2.131)1(2-=∆∂n t n s =2.131×0.017671=0.04所求μ的置信区间为12.09-0.04<μ<12.09+0.04即(12.05,12.13)3:n=600,p=0.1.np=60≥5,可以认为频数n 充分大,∂=0.05.z 2α=z 25.00=1.96 ∆=1.96600.90.10⨯=0.024,因此所求一次投掷中一只概率的置信区间是0.1-0.024<ρ<0.1+0.024,即(0.076,0.124)4: N 16,p ,np 75,,n 0.05====可认为频数充分大,,2z α=0.025 1.96z =0.2431∆== 因此,所求零件长度不合格的置信区间为0.4375—0.2431<ρ<0.4375+0.2431,即(0.19,0.68)5:114820ni i y ==∑, 1114820494(30n i i y y n μ=====∑分钟) 6. n=80 ,p=0.1,np=8≥5,可以认为n 充分大,ɑ≥0.05,96.1025.02==z z α 0657.096.1809.01.0==∆⨯因此,无上网经历的学生所占比率的置信区间为0.1—0.0657<ρ<0.1+0.0657,即(0.0343,0.1657)。
(约翰逊版)实用多元统计分析 第五章课后答案
5.4经计算可得:4.6445.49.965x ⎛⎫ ⎪= ⎪ ⎪⎝⎭, 2.8794 10.0100 -1.809110.0100 199.7884 -5.6400-1.8091 -5.6400 3.6277S ⎛⎫ ⎪= ⎪ ⎪⎝⎭10.5862 -0.0221 0.2580-0.0221 0.0061 -0.00160.2580 -0.0016 0.4018S -⎛⎫ ⎪= ⎪ ⎪⎝⎭S 的特征值和特征向量分别为()()()1122331.3014 ,0.81750.02490.57544.5316,0.5737 0.053 0.8173200.4625,e 0.0508 0.9983 0.0291T TTe e λλλ==--==--==- 由所有(123,,u u u )组成u 的90%置信椭圆为()112323,1734.640.5862 -0.0221 0.2580319204.64,45.4,9.965-0.0221 0.0061 -0.001645.4(0.1)170.2580 -0.0016 0.40189.965u u u u u F u -⎛⎫⎛⎫⨯⎪ ⎪----≤ ⎪ ⎪ ⎪ ⎪-⎝⎭⎝⎭由于3,17(0.1) 2.44F =,故有()1123234.640.5862 -0.0221 0.2580204.64,45.4,9.965-0.0221 0.0061 -0.001645.4 8.18120.2580 -0.0016 0.40189.965u u u u u u -⎛⎫⎛⎫⎪ ⎪----≤ ⎪ ⎪ ⎪ ⎪-⎝⎭⎝⎭其三个主轴的长度分别为:1,2,3,(1)3192()2 1.3014 2.44 24.8071()2017(1)3192()2 4.5316 2.4446.2911()2017(1)3192()2200.4625 2.44307.8849()2017p n p p n p p n p p n F n n p p n F n n p p n F n n p λαλαλα----⨯=⨯⨯=-⨯-⨯=⨯⨯=-⨯-⨯=⨯⨯=-⨯(b )排汗量X1的Q-Q 图:钠含量X2的Q-Q图:钾含量的Q-Q图:X1和X2的散点图:X1和X3的散点图:X2和X3的散点图:由排汗量X1、钠含量X2、钾含量X3数据的Q-Q都接近于直线,而且各对观察值的散点图都近似的接近于椭圆,因此可以认为多元正态假定是合理的。
地大《统计学》第五章 课堂笔记
地大《统计学》第五章假设检验课堂笔记◆主要知识点掌握程度假设检验是统计推断的组成部分,本章讨论的主要内容是:对总体的未知参数作出某种假设,然后抽取样本,构造适当的统计量,对假设的正确性进行判断的一套程序。
学习本章时,重点理解假设检验的基本思想和基本原理,掌握假设检验的步骤,并利用这些方法对未知参数的假设进行检验。
本章例题较多大家看懂后要多做练习,掌握巩固。
◆知识点整理一、假设检验的一般问题参数估计:用样本假设检验:对u提出假设,用检验假设是否成立.(一)什么是假设检验(了解)假设检验是对我们所关心的,却又是未知的总体参数先做出假设,然后抽取样本,利用样本提供的信息对假设的正确性进行判断的过程。
它是进行经济管理和决策的有利工具。
(二)假设检验步骤(掌握)1、提出原假设和替换假设;2、确定统计量;3、规定显著性水平;4、计算检验统计量的值;5、进行决策。
(三)假设检验中的小概率原理(理解)所谓小概率原理,是指发生概率很小的随机事件在一次试验中是几乎不可能发生的。
根据这一原理,我们可以作出是否接受原假设的决定。
(四)假设检验中的两类错误(理解)假设检验是根据样本提供的信息进行判断的,也就是由部分来推断整体,因而假设检验不可能绝对正确,它也可能犯错误。
所犯的错误有两种类型:1.弃真错误,又称错误。
2.取伪错误,又称错误。
二、假设检验方法(一)假设检验不同类型(掌握)1. 双侧假设检验2、单侧假设检验(二)均值检验(掌握)1.总体方差已知【例 5.3】某机床厂加工一种零件,根据检验知道,该厂加工零件的椭圆度渐近服从正态分布,其总体均值为0.081mm,总体标准差为0.025mm。
今另换一种新机床进行加工,取200个零件进行检验,得到椭圆度均值为0.076mm。
试问新机床加工零件的椭圆度总体均值与以前有无显著差别?解:按照假设检验的五个步骤进行第一步:建立假设第二步:选统计量第三步:规定水平.令=0.05(已知)第四步:计算检验统计量第五步:决策【例5.4】某纺织厂生产人造纤维,已知其平均拉力强度为1.56公斤,标准差为0.22公斤。
应用统计学(第五章)
了各标志值与其算术平均数的平均离差,也就反映了各标志值
的平均离散程度。
2021/1/26
应用统计学 第五章
6
第一节 变异指标
4)方差与标准差
平均差为离差绝对值的算术平均数。
方差为离差平方的算术平均数,以σ2表示,即
σ2 = (X X )2
N
方差的计量单位不便于从实际意义上进行解释。例如,身高
据的变异程度的对比或评价。其计算公式为
V
X
100%
2021/1/26
应用统计学 第五章
9
第一节 变异指标
甲组日产量(件):60、65、70、75、80 乙组日产量(台): 2、 5、 7、 9、12
组别 甲 乙
平均数 70(件) 7(台)
标准差
标准差系数 %
7.07(件)
10.1
3.41(台)
第五章 变异与均衡指标
第一节 变异指标 第二节 偏度指标 第三节 峰度指标 第四节 均衡指标
2021/1/26
应用统计学 第五章
1
第一节 变异指标
1 变异指标的意义 平均指标反映总体各单位某一数量标志的共性、集中性。 变异指标反映总体各单位某一数量标志的个性、离散性。 所谓变异指标,就是反映总体各单位标志值的差异程度或离 散程度的指标。 变异指标的分析作用一般可归纳为以下三点:
2021/1/26
应用统计学 第五章
23
第三节 峰度指标
2 峰度的指标 偶数阶中心动差有一特点,即不论数据的离差为正或负,经 偶数次乘方后,皆为正值。由于离差经偶数次乘方后,必加重 较大离差的分量,能使它在度量分布的峰度中发挥作用。 可取数据的偶数阶中心动差,作为分布峰度的测度指标。偶 数阶中心动差只能作为峰度的绝对度量,还须经适当处理,形 成一种峰度的相对度量的指标。 可以证明,正态分布的四阶中心动差与其标准差的四次方之 比值为 3 。所以,通常以数列的四阶中心动差与其标准差的四
《统计学》第5章
M
p
( p P)2 M
M 为全部可能的样本个数
统计 学
5.2.2 抽样平均误差
第
5
1.抽样平均数的抽样平均误差
章
(1)在重复抽样的条件下,计算公式为:
2
x
n
n
(2)在不重复抽样的条件下,计算公式为:
2 (N n)
x n N 1
统计 学
5.2.2 抽样平均误差
2 根据部分推断总体
3 运用了概率估计的方法 4 抽样误差可以事先计算并加以控制
统计 学
5.1.2 抽样推断的理论基础 * 第
5 章
大数定律
中心极限定理
★大量的相互独立的随机因素 对总体的影响相互抵消,其 共同作用的影响相对稳定
★随着样本单位数的增加,抽 样平均数接近于总体平均数 的趋势
★在一定条件下 ,大量相互
章
误差而直接以样本指标代替总体指标,也就
是直接以抽样平均数或抽样成数代替总体平
均数或总体成数。
例如用样本平均数 x 直接估计总数 X , 用样本成数 p 直接估计总体成数 P,用修正
样本方差S
2 n 1
,直接估计总体方差 2
。
统计 学
5.3.1 点估计
第
5
作为一个优良的估计量应该符合以下三个标准
在实践工作中能应用抽样调查原理和方 法组织实施抽样调查;
能正确利用抽样估计原理和方法对经济 现象进行推断估计。
统计 学
第 5 章
5.1 抽样推断的意义 5.2 抽样误差 5.3 抽样估计的方法 5.4 抽样方案的设计 5.5 假设检验
统计 学
5.1 抽样推断的意义
实用统计方法课件shyt1
第一章 描述统计
§1.2 用图表概括数据 (1) 频数表
9
第一章 描述统计
§1.2 用图表概括数据 (2) 直方图(条形图)
10
第一章 描述统计
§1.2 (3) 茎叶图及盒须图
11
第一章
§1.2 (4) 盒形(须)图
描述统计
12
第一章
§1.2 (5) 正态概率图
描述统计
13
附录1 SAS系统入门
DIR
查看某个SAS数据库的内容
VAR
查看SAS数据集的有关信息
OPTIONS 查看及改变SAS的系统设置
HELP
完整的帮助信息窗口
24
第一章 SAS系统简介
§2 SAS 提供的基本运行环境
SAS常用的交互式运行方式:
1.用SAS编程实现各种任务
2.用SAS提供的菜单系统实现各种任务
3.用SAS/ASSIST 4.用SAS桌面系统
§2 SAS 提供的基本运行环境--应用工 作界面 应用工作界面(AWS)
SAS AWS是Windows环境下使用显示管理系统运 行SAS系统的工作界面.
SAS AWS的主窗口是标题为SAS的窗口 SAS AWS还包括:
1.所有打开的SAS窗口(含最小化的窗口) 2.子窗口和对话框 3.菜单条,工具栏,命令框,状态栏…
(SAS/WA) 数据呈现--使信息产生效用 数据分析--获得有意义的信息(SAS/EM)
16
SAS 系统介绍
The SAS System
数据访问
数据管理分 Base SAS
OBaRSs,eQPCNESMCA,NFIBDEAAMSTASaIDCFSR,L,PsSLBC,eAIATNVESASBSISeTAE,,IrSEGSWveT开发工具HrST,,
实用统计学第五章
第五章差异分析第一节差异分析的概念和作用一.什么是差异分析差异分析就是研究不同个体或不同条件下的数值差异大小。
在经济分析中,常用来分析个人收的差异、投资风险、经营风险、财务风险、稳定性等。
二.差异分析的作用(一)说明平均数的代表性平均数作为总体某一数据代表数值,其代表性取决于总体各单位数据值的差异程度。
总体各单位数据值的差异程度。
总体各单位数据值的差异大,说明该总体的平均数的代表差;总体各单位数据值差异小,则说明该平均数的代表性好。
例如,某车间两个小组工人的月工资资料如下:(单位:元)甲组:800 900 1000 1100 1200乙组:900 950 1000 1050 1100这两个小组工人的月平均工资都是1000元,但各组工人工资的差异程度不同:甲组工人工资每人相差100元,乙组只相差50元。
因而,这两具小组工人的平均工资所具有的代表性也不同:甲组各工人工资额的差异较大,其平均数的代表性就差;乙组各工人工资额的差异较小,其平均数的代表性就强。
(二)反映均衡性、稳定性差异分析可以反映均衡性、稳定性,差异愈小,说明事物的稳定性和均衡性越好;差异越大,说明事物的稳定性和均衡性越差。
因此运用差异分析可以考察经济发展的稳定性、生产的稳定性、个人收入水平的均衡性等。
如对某一新品种种子作试验,除确定这一品种作物所达到的平均亩产水平外,还要研究它在生产中的稳定程度。
如果这一品种在不同试验田的亩产比较接近,差异程度较小,说明该品种产量具有稳定性,标志着该品种为优良品种,可以推广种植。
否则推广价值将受到不利影响。
(三)反映经济风险风险就是收益的不稳定性,如果收益差异大,就说明收益不稳定,也就是风险大;如果收益差异小,说明收益稳定,就是风险小。
差异分析常用来分析投资风险、经营风险等。
(四)衡量估计误差大小估计误差包括以样本估计总体的误差和预测值与实际值的误差,估计误差的大小分析,就是用差异分析指标来衡量的。
估计值与实际值差异越大,估计的准67确性越差。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第五章差异分析第一节差异分析的概念和作用一.什么是差异分析差异分析就是研究不同个体或不同条件下的数值差异大小。
在经济分析中,常用来分析个人收的差异、投资风险、经营风险、财务风险、稳定性等。
二.差异分析的作用(一)说明平均数的代表性平均数作为总体某一数据代表数值,其代表性取决于总体各单位数据值的差异程度。
总体各单位数据值的差异程度。
总体各单位数据值的差异大,说明该总体的平均数的代表差;总体各单位数据值差异小,则说明该平均数的代表性好。
例如,某车间两个小组工人的月工资资料如下:(单位:元)甲组:800 900 1000 1100 1200乙组:900 950 1000 1050 1100这两个小组工人的月平均工资都是1000元,但各组工人工资的差异程度不同:甲组工人工资每人相差100元,乙组只相差50元。
因而,这两具小组工人的平均工资所具有的代表性也不同:甲组各工人工资额的差异较大,其平均数的代表性就差;乙组各工人工资额的差异较小,其平均数的代表性就强。
(二)反映均衡性、稳定性差异分析可以反映均衡性、稳定性,差异愈小,说明事物的稳定性和均衡性越好;差异越大,说明事物的稳定性和均衡性越差。
因此运用差异分析可以考察经济发展的稳定性、生产的稳定性、个人收入水平的均衡性等。
如对某一新品种种子作试验,除确定这一品种作物所达到的平均亩产水平外,还要研究它在生产中的稳定程度。
如果这一品种在不同试验田的亩产比较接近,差异程度较小,说明该品种产量具有稳定性,标志着该品种为优良品种,可以推广种植。
否则推广价值将受到不利影响。
(三)反映经济风险风险就是收益的不稳定性,如果收益差异大,就说明收益不稳定,也就是风险大;如果收益差异小,说明收益稳定,就是风险小。
差异分析常用来分析投资风险、经营风险等。
(四)衡量估计误差大小估计误差包括以样本估计总体的误差和预测值与实际值的误差,估计误差的大小分析,就是用差异分析指标来衡量的。
估计值与实际值差异越大,估计的准67确性越差。
第二节差异分析的方法常用的差异分析方法有:全距、平均差、标准差、标准离差率等,最常用的是标准差和标准离差率。
以下分别加以介绍一、全距(一)全距的概念和计算全距又称极差,它是数据最大值和最小值之差,用以说明数据变动范围的大小。
全距=最大值-最小值[例5-1]某车间有两个生产小组,都是七名工人,各人日产产品件数如下:甲组:20、40、60、70、80、100、120乙组:67、68、69、70、71、72、73甲组日产量全距=120-20=100(件)乙组日产量全距=73-67=6(件)从计算可以看出,甲组工人日产量差异大于乙组工人日产量。
全距愈小,反映数据愈集中,差异也就愈小;全距愈大,反映变量值愈分散,则差异愈大。
对于根据组距数列求全距,可以用最高组的上限与最低组的下限之差,求全距的近似值。
(二)全距的特点全距的优点在于计算方便,意义明确。
它是差异分析的最简便方法。
在实际工作中,全距可用于工业产品质量的检查和控制。
在通常的生产条件下,产品质量性能指标如强度、硬度、浓度、尺寸等的差距总是在一定的范围内波动,如果差距超过了一定范围,就说明生产可能出现了问题,必须采取措施。
但全距这个指标很粗略,它只考虑数据的两个极端数值的差异,而不管中间数据值的差异情况,因而不介于全面反映数据值的差异程度。
二、平均差(一)平均差的概念和计算平均差是各数据值与其平均数的差异绝对值的平均数,又称平均离差。
表示平均差异水平。
计算平均差时,由于掌握的资料不同,平均差的计算分为两种情况:1.根据原始数据计算在根据原始数据计算时,采用简单平均法。
其方法为:6869AD=nx x ∑-[例5-2]以[例5-1]所举的甲、乙两组式人日产量为例。
说明平均差的计算方法。
计算见表5-1。
表 5-1AD 甲=71.257180=(件) AD乙=71.1712=(件) 这就是说,在甲、乙两组工人平均日产量相等(都等于70件)的情况下,甲组的平均差明显大于乙组,说明甲组工人日产量水平差异大于乙组。
2.根据分组资料计算在数据经过分组后,形成分布数列,就应采取加权平均法,其方法为:AD=∑∑-ff x x[例5-3]某车间200个工人按日产量分组编成分布数列,计算平均差见表5-2。
70422008400===∑∑fxf x (公斤) AD=∑-ff x x =6.62001320=(公斤)表5-2计算结果表明,200个工人各自日产量与平均日产量平均差异为6.6公斤。
(二)平均差的特点平均差是根据全部数据值计算出来的,所以对全部数据值的差异有充分的代表性。
但平均差计算由于采用取离差绝对值的方法来达到防止正负离差抵消,因而不适合数学方法的应用,所以在统计分析中较少使用。
三、标准差(一)标准差的概念和计算标准差是各个数据值与其平均数的离差平方的平均数的平方根,又称均方差,通常用σ表示。
标准差的平方即方差。
标准差实际上是平均差的另一种算法。
标准差是测定数据差异大小最常用的指标。
其计算方法根据资料的不同也有两种:1.根据原始资料计算根据原始资料计算时,采用简单平均法,计算方法为: nx x 2∑-=)(σ[例5-4]仍以[例5-1]甲、乙两组工人日产量资料为例,计算标准差如表715-3。
9.1872500==甲σ(件) 2728==乙σ(件) 这就是说,在甲、乙两组工人平均日产量的条件下,每人日产量与其平均数的平均差异,甲组为18.9件,乙组为2件,甲组的差异大于乙组。
表5-32.根据分组资料计算根据分组资料即分布数列计算标准差时,采用加权平均法,计算方法为: ∑∑-=ffx x 2)(σ[例5-5]仍以[例5-3]资料,计算标准差。
如表5-4。
728.720012200)(2==-=∑∑fx x σ(公斤)和计算平均数一样,标准差也可以以频率计算,即: ∑∑∑∑-=-=ffx x fx x 22)()(σ仍以本例数据计算如下: 20030169200909200704920010289⨯+⨯+⨯+⨯=σ =%15169%459%3549%5289⨯+⨯+⨯+⨯=8.7(公斤)以频率计算的方法常用于以概率计算标准差的场合。
(二)标准差的特点标准差与平均差一样,考虑到总体所有数据值的差异,但它计算比较复杂。
能准确反映差异情况,标准差的计算方法符合数学原理,所以应用最广。
但它计算比较复杂。
四、标准离差率(一)标准离差率的概念和计算由于标准差(或平均差)反映的是平均绝对离差,而绝对数在不同条件下往往是不可比的。
因此,差异大小的比较,在同等条件下用标准差(或平均差)的大小比较就可以了,如前面的甲、乙两组工人日产量差异的比较,因为两组平均日产量水平都是70件,标准差(或平均差)较大的组差异就大。
但在不同条件下,即不同总体的平均水平不相等的条件下,仅用标准差(或平均差)比较差异大小就是靠不住的。
例如标准差为10,相对于100的平均水平来说差异率为10%,而相对于01000的平均水平来说差异率仅为1%,显然对后者来讲差异小,对前都来讲差异大。
因此,在平均水平不同的条件下,比较差异要看相对差异率的高低。
标准离差率就是反映相对差异水平的相对数,它是标准差与平均数的相对比率,也称标准差系数或离散系数。
适用于不同平均水平条件下的差异分析。
73标准离差率的计算方法就是:xV σσ=[例5-6]有两个不同班组的各5名工人,某日加班费数额如下:甲组: 60、65、70、75、80 乙组: 2、5、7、9、12计算得: 70=甲x 元 07.7=甲σ元7=乙x 元 41.3=乙σ元若根据甲σ>乙σ而断言甲组差异大于乙组是不妥的,因为这两组的平均水平相差悬殊,应计算其标准离差率来比较。
%1.107007.7==甲σV %7.48741.3==乙σV计算结果表明,并非甲组差异大于乙组,而是乙组大于甲组,因为乙组相对差异大。
(二)标准离差率的特点标准离差率是相对数,可用于任何条件下的差异比较和研究,所以它是最主要的差异分析指标。
第三节差异分析的应用一、个体差异分析个体差异分析用来分析如职工工资的差异、个人收入差异、工人完成工作量的差异,学生学习成绩差异等。
个体差异分析的标准差计算方法为:标准差=个体数平均值)(个体值∑-2标准差(或标准离差率)越大,说明个体差异越大,或者说越不均衡。
前面所举的例子,都是个体差异分析,在此就不再另举例了。
二、均衡性、稳定性分析74在社会经济分析中,均衡性、稳定性分析常用来分析企业生产的均衡性、销售或业务量的均衡性。
经济发展的稳定性、市场价格的波动大小等问题。
现举二例说明:[例5-7]某商贸企业,为了消除季节波动对经营的不利影响,本年度采取了一些营销手段试图改善,现有两年的销售资料如表5-5,试分析本年比上年销售均衡性是否有所改善。
表5-5单位:万元上年月平均销售额=(40+50+30+35+50+30+32+35+35+50+40+38)÷12 =38.75(万元) 月销售额标准差=1275.383875.385075.3840222)()()(-+-+-=7.21(万元)本年月平均销售=(45+53+35+40+52+35+35+40+40+52+45+40)÷12=42.67(万元)月销售额标准差=1267.424067.425367.4245222)()()(-+-+-=6.43(万元)由于本年月平均销售额大于上年,而标准差还小于上年,所以本年销售均衡性比上年有改善,改善的程度为:上年标准离差率=%61.1875.3821.7= 本年标准离差率=%07.1567.4243.6=标准离差率即不均衡率降低了3.54%个百分点。
[例5-8]某农产品市场价格在本年5月下与上年同期4周内变动情况如表5-6,试分析哪年份价格较稳定。
(每周上市量基本相同)表5-675上年平均价格=2.141.12.15.10.1=+++(元/公斤)上年标准差=42.11.12.12.12.15.12.10.12222)()()()(-+-+-+-=19.0(元/公斤) 本年平均价格=175.14.12.13.11.1=+++(元/公斤)本年标准=4175.10.1175.12.1175.13.1175.11.12222)()()()(-+-+-+-=11.0(元/公斤)由于两年平均价格不同,需计算标准离差率比较:上年标准离差率=%83.152.119.0= 本年标准离差率=%36.9175.111.0=可见,本年价格较稳定,价格差异率降低了6.47个百分点。
二、 风险分析风险就是不稳定性,如果未来收益差异大,就说明收益不稳定,也就是风险大;如果未来收益差异小,说明收益稳定,就是风险小。