2013-2014-1统计学第四章
统计学第四章课后习题答案

第四章一.思考题1、一组数据的分布特征可以从哪几个方面进行测度?答:可以从三个方面进行测度和描述:一是分布的集中趋势,反映各数据向其中心值靠拢或聚集的程度;二是分布的离散程度,反映各数据远离其中心值的趋势;三是分布的形状,反映数据分布的偏态和峰态。
2、怎样理解平均数在统计学中的地位?答:平均数在统计学中具有重要的地位,它是进行统计分析和统计推断的基础。
从统计学思想上看,平均数是一组数据的重心所在,是数据误差相互抵消后的必然结果。
3、简述四分位数的计算方法。
答:四分位数是一组数据排序后处于25%和75%位子上的值。
四分位数是通过3个点将全部数据等分成4分,其中每部分包含25%的数据。
中间的四分位数就是中位数,因此通常所说的四分位数是指处在25%位置上的数值和处在75%位置上的数值。
它是根据为分组数据计算四分位数时,首先对数据进行排序,然后确定四分位数所在的位置,该位置上的数据就是四分位数。
4、对于比率数据的平均数为什么采用几何平均?答:几何平均数是适用于特殊数据的一种平均数,主要适用于计算平均比率。
当所掌握的变量值本身是比率的形式时,采用几何平均法计算平均比率更为合理。
5、简述众数、中位数、平均数的特点和应用场合。
答:众数是数据中出现次数次数最多的变量值。
主要应用于分类数据。
中位数是一组数据排序后处于中间位置的变量值,其适用于顺序数据。
平均数也称均值,它是一组数据相加后除以数据个数的结果,是集中去世的主要测量值,它适用于数值型数据。
6、简述异众比率、四分位差、方差、标准差的使用场合。
答:异众比率主要适合测度分类数据的离散程度,对于顺序数据以及数值型数据也可以计算异众比率。
四分位差主要用于测度顺序数据的离散程度。
方差和标准差适用于测度数值型数据的离散程度。
7、标准分数有哪些用途?答:首先是比较不同单位和不同质数据的位置。
其次是和正态分布结合起来,求得概率和标准分值之间的对应关系。
还有就是在假设检验和估计中应用。
统计学第四章

平均数指数
• 综合指数
总指数的基本形式。它是通过引入一个同度量因素将 不能相加的变量转化为可相加的总量指标,而后对比所得 到的相对数。
报告期指数化因素×同度量因素 报告期总量指标 基期总量指标
综合指数=
基期指数化因素×同度量因素
=
所要研究其变动程度的 两个时期的某一经济变量
引入一个同一时期的经济量 起到媒介或权数的作用
例:动态相对数、计划完成程度相对数等。
狭义指数
反映不能直接相加的复杂现象综合变动程 度的相对数。
例:零售物价指数、股价指数等。
作用
1 反映复杂的社会经济现象总体的综合变动; 2 测定现象总变动中各个因素的影响; 3 多指标复杂现象综合测评。
分类
按指标的性质分 数量指数 质量指数 定基指数 按采用的基期分 环比指数 个体指数 按对象的范围分 总指 数
q1P0 q0 P0 (q1 q0 ) P0
说明由销售量变动带来的销售额的增(减)量
2、质量指标的综合指数(例:价格指数)
价格指数 p1 q1 p1q1 p0 q1 p0 q1
报告期实际 销售额
报告期和基期的价 格,为指数化因素
报告期销售量作 为同度量因素
Kq K q P0 q0 P0 q0 K q P0 q0 P0 q0
销售量个体指数
q1
q0
与销售量个体指数相对应的 销售额占总销售额的比重
2、加权调和平均数指数 通常用来计算质量指标指数(如价格指数)
KP P 1q1 1 P q P0 1 1 P 1q1 K P P P 1q1 1 1
p1
价格个体指数
p0
统计学-统计四章 71页PPT文档

(五)强度相对指标强度相对指标是指两个性质不同但有一定联系的总 量指标对比所形成的综合指标,其表明现象的强度、密度和普遍 程度。如:人口密度,人均GNP、很多财务比率等
计算公式: 强度相对 另 指一 标有 某联 一系 总而 的 量性 总 指质 量 标不 指 数同 标 值
计量单位表现为两种形式: 一种是复名数,即双重计量单位。在计算这种强度相对指标时,由
GMNX1X2XN 410.54%10.02%10.53%10.45% 10.834%
平均收益率=103.84% - 1 = 3.84%
例4.27 P136 例4.28 P137
IV中位数( )M e
概念:处于中间位置的那个变量值 计算步骤: 1、排序 2、找中间位置:未分组资料: (n+1)/2
分组资料: ∑f/2 3、计算中位数数值:
对于组距数列,要用近似公式计算
下限公式:
上限公式:
f Me L
S 2 m1i f
m
f Me U
S 2 m1i f
m
例4.30 例4.31 例4.32
P139 P139 P141
V众数(
)M O
1、概念:出现次数最多,出现得最频繁的那个 变量值。 2、计算:组距数列情况下
前三者综合指标反映集中的趋势;变异指标反 映离中的趋势;形状指标反映分布的对称程度和 尖峭程度。
第二节集中趋势指标
反映集中趋势的指标包括:总量指标\相对指标和平均指 标.
二、总量指标
是反映现象在一定条件下总体总量、总规模、总水平的 综合指标。
特点:
(1)只有有限总体才能计算总量指标 (2)数值随研究范围的大小而增加或减少 (3)最基 本的指标,是计算其他指标的基础
统计学第四章

m xf H m xf x x
xf f
•
例题:菜场上有1元钱起售的蔬菜,若某人早上用1元钱购买 了一种蔬菜共3斤,每斤0.33元;中午降价时又用1元钱买了4斤, 每斤0.25元,晚上削价处理又用1元钱买了5斤,每斤0.2元,试问, 某人早中晚各用1元钱购买的蔬菜平均每斤多少钱? • 解:上述问题根据不同的资料可用两种方法计算蔬菜的平均价 格: • ① 如已知早上买3斤、中午买4斤、晚上买5斤,又知价格分别为 0.33元/斤、0.25元/斤、0.2元/斤。这时由于每次购买的斤数已知, 就不能用加权调和平均方法,而要用加权算术平均方法计算其平 均价格:
111 3 H 0.25 • (元/斤) 1 0.33 1 0.25 1 0.2 12
• • • 这里,是以支出额为权数的加权调和平均数。 根据不同资料,两种方法计算的结果完全相同,说明调和 平均数与算术平均数之间有一种联系:调和平均数的权数即支出 额,等于被平均的价格和购买蔬菜数量的乘积,支出额=单价购 买的数量。假若被平均的变量存在上述关系,调和平均数可看作 是算术平均数的变形。
例:某管理局所属15个企业销售计划完成情况资料如下表:
销售计划完 组中值(%) 企业数 成程度(%) x 90—100 95 5 100—110 105 8 110—120 115 2 合计 — 实际销售额 (万元)
15
95 840 115 1050
计划完成程度 实际完成数 计划任务数
销售计划完 组中值(%) 企业数 成程度(%) x 90—100 100—110 110—120 合计
假设p0为本金,r为利率,pn为n年后的本利和。
若以单利计算:
p1 p0 p0 r
若以复利计算: p1 p0 p0r p0 (1 r)
统计学讲义第四章

调查方式方法:人口普查登记,采用普查员入户查点询问、
当场填报的方式进行。
调查组织工作:按照“全国统一领导、部门分工协作、地
方分级负责、各方共同参与”的原则组织实施。人口普查所需经 费,由国务院和地方各级人民政府共同负担,并列入相应年度的 财政预算,按时拨付,确保足额到位。同时,各级宣传部门和人 口普查机构应采取多种方式,积极做好人口普查的宣传工作。地 方各级人口普查机构主要负责人要对本行政区域人口普查数据质 量负总责,确保人口普查数据真实、准确、完整、及时。本次普 查每个普查小区至少配备1名普查员,每个普查区至少配备1名普 查指导员,原则上4-5个普查小区配备1名普查指导员。
第四章 统计调查
按照预定的统计任务,运用科学的统计 调查方法有计划有组织地向客观实际 收集资料的过程
统计调查意义
意义:从统计工作的全过程来看,统计 调查是搜集资料获得感性认识的阶段。 既是对现象总体认识的开始,又是进行 资料整理、分析的基础。
要求:准确、及时
统计调查方案
统计调查是一项系统工程,是一 项繁重复杂、步调要求高度统一、 方法要求科学的工作。应该有计 划、有组织地进行。
《第六次全国人口普查方案》
为科学有效地组织实施第六次全国人口普查, 根据《全国人口普查条例》,国家统计局、国 务院第六次全国人口普查领导小组办公室日前 颁布了《第六次全国人口普查方案》。该方案 是组织实施第六次全国人口普查的总纲和基础, 是对普查各项工作的规范。
据悉,第六次全国人口普查的目的是查清 2000年以来我国人口数量、结构、分布和居住 环境等方面的变化情况,按照“全国统一领导、 部门分工协作、地方分级负责、各方共同参与” 的原则组织实施。人口普查所需经费,由国务 院和地方各级人民政府共同负担,并列入相应 年度的财政预算,按时拨付,确保足额到位。 同时,各级宣传部门和人口普查机构应采取多 种方式,积极做好人口普查的宣传工作。地方 各级人口普查机构主要负责人要对本行政区域 人口普查数据质量负总责,确保人口普查数据 真实、准确、完整、及时。
统计学原理第四章PPT学习教案

(二)比例相对指标 (轻重工业比例)
比例相对指标是总体中不同部分数量对比的相对指标,用以分析总 体范围内各个局部、各个分组之间的比例关系和协调平衡状况。
比例相对指标
总体中某一部分数量 总体中另一部分数值
第8页/共41页
第二节 相对指标
(三)比较相对指标
比较相对指标是不同单位的同类现象数量对比而确定的相对指标, 用以说明某一同类现象在同一时间内各单位发展的不平衡程度,以 表明同类实物在不同条件下的数量对比关系。
第9页/共41页
第二节 相对指标
(四)强度相对指标 强度相对指标是两个性质不同但有一定联系的总量指标之间的对比, 用来表明某一现象在另一现象中发展的强度、密度和普遍程度。它和 其他相对指标的根本区别就在于它不是同类现象指标的对比。强度相 对强指度标相以对双指重标计量另单一位个表有示联,系某是而种一性现质种象不复总名量同指数的标。现象总量指标 强度相对指标的分子分母位置可以互换,因而有正指标、逆指标之分。 实际应用时应注意与平均指标的区别。
水泥——(80/100)=80% 第二季度 生铁——(618/600)=103%,钢材—— (300/350)=85.71%
水泥——(180/200)=90% 2)求上半年(一,二季度合并)进货 情况, 解法同 上 生铁——(618+500)/(600+500)= 101.64% 钢材——(300+300)/(250+350)= 100% 水泥——(180+80)/300=86.67% 3)上半年累计计划完成程度执行情况 (计划 期一年 ,实际 期半年 ) 生铁——(618+500)/2000=55.9% 钢材——(600)/1000=60% 水泥——260/500=52%
统计学课后第四章习题答案

统计学课后第四章习题答案第一篇:统计学课后第四章习题答案第4章练习题1、一组数据中出现频数最多的变量值称为()A.众数 B.中位数 C.四分位数 D.平均数2、下列关于众数的叙述,不正确的是()A.一组数据可能存在多个众数B.众数主要适用于分类数据C.一组数据的众数是唯一的D.众数不受极端值的影响3、一组数据排序后处于中间位置上的变量值称为()A.众数 B.中位数 C.四分位数 D.平均数4、一组数据排序后处于25%和75%位置上的值称为()A.众数B.中位数C.四分位数D.平均数5、非众数组的频数占总频数的比例称为()A.异众比率 B.离散系数 C.平均差 D.标准差6、四分位差是()A.上四分位数减下四分位数的结果B.下四分位数减上四分位数的结果C.下四分位数加上四分位数D.下四分位数与上四分位数的中间值7、一组数据的最大值与最小值之差称为()A.平均差 B.标准差 C.极差 D.四分位差8、各变量值与其平均数离差平方的平均数称为()A.极差 B.平均差 C.方差 D.标准差9、变量值与其平均数的离差除以标准差后的值称为()A.标准分数 B.离散系数 C.方差 D.标准差10、如果一个数据的标准分数-2,表明该数据()A.比平均数高出2个标准差B.比平均数低2个标准差C.等于2倍的平均数D.等于2倍的标准差11、经验法则表明,当一组数据对称分布时,在平均数加减2个标准差的范围之内大约有()A.68%的数据B.95%的数据 C.99%的数据D.100%的数据12、如果一组数据不是对称分布的,根据切比雪夫不等式,对于k=4,其意义是()A.至少有75%的数据落在平均数加减4个标准差的范围之内B.至少有89%的数据落在平均数加减4个标准差的范围之内 C.至少有94%的数据落在平均数加减4个标准差的范围之内 D.至少有99%的数据落在平均数加减4个标准差的范围之内13、离散系数的主要用途是()A.反映一组数据的离散程度B.反映一组数据的平均水平C.比较多组数据的离散程度D.比较多组数据的平均水平14、比较两组数据离散程度最适合的统计量是()A.极差B.平均差 C.标准差 D.离散系数15、偏态系数测度了数据分布的非对称性程度。
统计学4章ppt课件

1 300
水平法就是用末年实际水平与计划规定水平对比,来检 查长期计划的完成情况。
水平法适用于检查有明显递增或递减的现象,反映年度 生产力发展水平。
只要连续12个月(可以跨年度)即一个时间达到计划末 年水平,就算完成计划。
计算公式:
长期计划末年实际达到的水平
计划完成程度相对指标=
长期计划规定的水平
2021/3/9
乙的比重1甲与 1 乙之比
甲与
乙 之比 甲 乙
的比 的比
重 重
2021/3/9
第四章 总量指标
21
统计学
3.比较相对指标
比较相对指标是两个同类总体的同类指标 在不同地区、部门、单位之间的对比。
计算公式:
某总体的某一指标 比较相对指标= 另一同类总体的同类指标
2021/3/9
第四章 总量指标
分子与分母 可以互换
35
统计学
例.计划任务用相对数表示
例1:某企业2010年的计划产量是2009年的 105%,2010年实际产值是2009年的110%。
则:
➢ 2010年计划完成程度=110% ÷ 105%=104.8% ➢ 即超额4.8%完成。
例2:某企业2010年的计划劳动生产率比2009年提 高10%,而2010年实际比2009年提高的16%。
济联系的。 强度相对指标一般以有名数表示。 有些强度相对指标的分子与分母可以互换,
这时,强度相对指标有正指标、逆指标之 分。如:用水量/万元产值 与平均数不同。
2021/3/9
第四章 总量指标
26
统计学
例.强度相对指标计算
2003年我国的GDP为117 251.9亿元,钢产
量为22 233.6万吨,人口平均数为128840
统计学第四章答案

五、计算题1.某企业两个车间的工人生产定额完成情况如下表: ..技术水平A车间B车间工人数完成定额工时人均完成工时工人数完成工时定额人均完成工时高50 14000 280 20 6000 300 中30 7500 250 40 10400 260 低20 4000 200 40 8200 205 合计100 25500 255 100 24600 246从表中看,各个技术级别的工人劳动生产率(人均完成工时定额)都是A车间低于B车间,试问:为什么A车间的平均劳动生产率又会高于B车间呢?2.在某个核算年度内,两个建筑施工单位采购同一种建筑材料的价格和批量情况如下表。
试分别计算两个施工单位的平均采购价格。
并从平均数计算的角度说明,为什么两个施工单位的平均采购价格会有差别?..采购单价(元/吨) 采购金额(万元)A单位B单位800 120 100820 105 100835 84 100850 56 100860 35 100合计400 5003.根据某城市500户居民家计调查结果,将居民户按其食品开支占全部消费开支的比重(即恩格尔系数)分组后,得到如下的频数分布资料:..恩格尔系数(%) 居民户数20以下 620~30 3830~40 10740~50 13750~60 11460~70 7470以上24合计500要求:(1)据资料估计该城市恩格尔系数的中位数和众数,并说明这两个平均数的具体分析意义。
(2)利用上表资料,按居民户数加权计算该城市恩格尔系数的算术平均数。
(3)试考虑,上面计算的算术平均数能否说明该城市恩格尔系数的一般水平?为什么?4.某年某月份甲、乙两农贸市场某农产品价格及成交量、成交额的资料如下:品种价格(元/斤) 甲市场成交额(万元) 乙市场成交量(万斤)甲 1.2 1.2 2乙 1.4 2.8 1丙 1.5 1.5 1合计— 5.5 4试问哪一个市场农产品的平均价格高,并说明其原因。
统计学第四章课件

一、分布的集中趋势
1. 简单几何平均数
简单几何平均数适用于资料未进行分组 的情况。其计算公式为
(4-8)
式中, xG 为几何平均数;xi为变量值;n为
变量值个数;Ⅱ为连乘符号。
一、分布的集中趋势
【例4-6】 某企业生产某种产品要经过三个连续的作业车间才能完 成。若某月份第一车间粗加工产品的合格率为95%,第二车间精加工产 品的合格率为93%,第三车间最后装配的合格率为90%,则该产品的企 业合格率(三个车间的平均合格率)为多少?
一、分布的集中趋势
此外,从上述表达式中可以看出,加权算术平均 数受两个因素的影响:一是各组的标志值,二是各组 的单位数或频率。当各组的标志值不变时,其出现的 次数f对于平均数的大小起着权衡轻重的作用,统计学 称其为权数。当各组次数相等时,影响平均数的因素 就只有一个,即各组的标志值,这时加权算术平均数 就等于简单算术平均数。可见,简单算术平均数是加 权算术平均数的特例。
一、分布的集中趋势
【例4-13】 表4-9为某企业工人工资资料,试计算其中位数。
表4-9 某企业工人工资资料
一、分布的集中趋势
确定中位数的方法如下: ①计算累计频数,见表4-9第3栏和第4栏。 ②利用公式∑f/2确定中位数的项次,∑f/2=120/2=60。 ③通过观察,找到中位数(以向上累计为例),从向上累计频数可知,从 第41个工人到第80个工人都包含在了第三组中。由此可以判断,第60个 工人也应在第三组里。 ④利用公式求得中位数近似值(以上限公式为例)。
一、分布的集中趋势
解:中位数的位置=(n+1)/2=(11+1)÷2=6,则 中位数为第6号位置的零件数,即Me=x(6)=24件。
统计学第四章课件

(2) f=27, f-1=16 ) =27,
f+1=20
d=10
L=170 ,U=180
11 M0 =170 + ×10 11+ 7 7 M0 =180 − ×10 11+ 7
M0 =176.11
二、中位数(median) 中位数(median) 1、中位数:是指处在中间位置的变量值 中位数: (n +1) / 2 位置的数
注意: 注意: 无论给出的数据如何,一定要转化为绝对数! 无论给出的数据如何,一定要转化为绝对数!
计划完成程度计算例子
计划完成程度=实际完成绝对数/ 计划完成程度=实际完成绝对数/计划完成绝对数
•
例1 :某年工业增加值计划指标为200万元, 某年工业增加值计划指标为200万元 万元, 实际完成增加值220万元 实际完成增加值220万元 计划完成程度=220/200=110% 计划完成程度=220/200=110% (超计划10%) 超计划10%)
② 确定中位数 Me 设中位数组的上下限为L 设中位数组的上下限为L 和K ,组距为d ,则中 组距为dm n − Sm+1 Me =U − 2 ×d fm
某电脑公司120天销售额分组 某电脑公司120天销售额分组
销售量分组 140- 140-150 150- 150-160 160- 160-170 170- 170-180 180- 180-190 190- 190-200 200- 200-210 210- 210-220 220- 220-230 230- 230-240 合计 频数 4 9 16 27 20 17 10 8 4 5 120
§4.2 相对指标 三、相对指标的种类和计算方法 结构相对指标(比重,频率) 结构相对指标(比重,频率) 结构相对数指标: 结构相对数指标:反映同一时期总体内部组成 状况的相对指标 结构相对指标计算 结构相对指标=部份/ 结构相对指标=部份/全部 例如:女工占全厂职工的比重为40%, 例如:女工占全厂职工的比重为40%,而女工 工作量占全厂工作量的45% 工作量占全厂工作量的45%
统计学第四章课后题及答案解析

第四章一、单项选择题1.由反映总体单位某一数量特征的标志值汇总得到的指标是()A.总体单位总量B.质量指标C.总体标志总量D.相对指标2.各部分所占比重之和等于1或100%的相对数()A.比例相对数 B.比较相对数 C.结构相对数 D.动态相对数3.某企业工人劳动生产率计划提高5%,实际提高了10%,则提高劳动生产率的计划完成程度为()A.104.76%B.95.45%C.200%D.4.76%4.某企业计划规定产品成本比上年度降低10%实际产品成本比上年降低了14.5%,则产品成本计划完成程度()A.14.5%B.95%C.5%D.114.5%5.在一个特定总体内,下列说法正确的是( )A.只存在一个单位总量,但可以同时存在多个标志总量B.可以存在多个单位总量,但必须只有一个标志总量C.只能存在一个单位总量和一个标志总量D.可以存在多个单位总量和多个标志总量6.计算平均指标的基本要求是所要计算的平均指标的总体单位应是()A.大量的B.同质的C.有差异的D.不同总体的7.几何平均数的计算适用于求()A.平均速度和平均比率B.平均增长水平C.平均发展水平D.序时平均数8.一组样本数据为3、3、1、5、13、12、11、9、7这组数据的中位数是()A.3B.13C.7.1D.79.某班学生的统计学平均成绩是70分,最高分是96分,最低分是62分,根据这些信息,可以计算的测度离散程度的统计量是()A.方差B.极差C.标准差D.变异系数10.用标准差比较分析两个同类总体平均指标的代表性大小时,其基本的前提条件是( )A.两个总体的标准差应相等B.两个总体的平均数应相等C.两个总体的单位数应相等D.两个总体的离差之和应相等11.已知4个水果商店苹果的单价和销售额,要求计算4个商店苹果的平均单价,应采用()A.简单算术平均数B.加权算术平均数C.加权调和平均数D.几何平均数12.算术平均数、众数和中位数之间的数量关系决定于总体次数的分布状况。
《统计学》第四章

•各个变量值与算术平均数的离差平方总和为最小 证 明 : 值。 设 x 为 不 等 于 x 的 任 意 值 , c = x − x
0 0
Σ ( x − x )2 = 最 小 值
x 0 = x − c , 则 以 x 0为 中 心 的 离 差 总 和 为 : Σ ( x − x0 )2 = Σ
[x − ( x − c ) ]
3、调和算术平均数:调和平均数是常 用的另一种平均指标,它是根据标志 值的倒数计算的,又称为倒数平均数。
m1 + m2 + ⋅⋅⋅ + mn H = m1 m2 = mn x1 + x2 + ⋅⋅⋅ + xn
∑m ∑
i =1 i =1 n mi xi
n
i
例、假定有A 例、假定有A、B两家公司员工的月工资资 料如下表所示:要求计算平均工资。
60 70 20 150
50 40 25 115
工资总额 平均工资 = ,但职工人数(分母)未知。 职工人数 各组工资总额 m 各组职工人数 = ,f = 各组工资水平 x H A公司 =
∑m ∑
i =1 i =1 3 mi xi
3
i
48000 + 70000 + 32000 = 48000 + 70000 + 32000 800 1000 1600
250
3.13
42 50 × 5 + 150 × 42 + 52.50 16 + 150 × 13 250 × 350 = + 200—300 16 5 + 42 + 16 + 132504 20.00 16900 = 300—400 13 16.25 350 80 =400以上 (百吨) 211 . 26 4 5.00 450 合计 80 100.00 —
统计学基础第四章课件

• 3.正确地选择基数指标
相对指标是通过指标和指标的对比,来反映现象之间的联系, 而基数指标(母项)是对比的基础和标准。
第二节 数据的集中趋势
• 一、集中趋势的含义 • 集中趋势是指一组数据向某一点集中的情况,它能够揭示总体中
• 1、算术平均数的算法
算术平均数
总体标志总量 总体单位总量
算术平均数又分为简单算术平均数和加权算术平均数。
(1)简单算术平均数。所掌握的资料是单个的变量值或数据未经 分组时,就可以将各个变量值简单相加求得总体变量总量,然后除 以个体单位总量,求出平均指标。这种方法称为简单算术平均法, 所得数值称为简单算术平均数,用 X来表示。计算公式可表示如下:
• 例如某小组工人5人,加工某种零件日产量分别是 7 、9、1O 、 11 、13, 则平均每名工人日产量为:
• 即平均每名工人日产量是10 • 从上面的计算可以看出,简单算术平均数只受变量因素的影响。
一般来说,越接近于中间位置的数值便越接近于算术平均数。因 此我们可用标志值所处的位置去大致地判断一下算术平均数的数 值。
• 时期指标能够反映现象在一段时间内活动过程的成果。如工资总 额,基本建设投资额,国民生产总值等;
• 时点指标则反映现象在某一时点(瞬间)的状况。如人口数,物 资库存量,设备台数等。
• 时期指标和时点指标各有不同的特点。 • 第一,时期指标的数值可以连续计数,它的每个数值都说明现
象在这一时期内发生的总量,如一年的总产值是一年四季产值的 累计。而时点指标的数值只能间断计数,它的每个数值都表示现 象发展到一定时点上所处的水平。如月末职工人数,是指月末时 点上的实有人数。 • 第二,时期指标的各期数值直接相加可以说明较长时期内现象 发生的总量,而时点指标的数值直接相加除在有关指标的计算过 程中需要运用外,没有实际意义。 • 第三,一般来讲,同一总体时期指标的数值大小与时间的长短 具有直接关系,如一个季度的销售额必然大于一个月的销售额; 而时点指标的数值大小与时点间的间隔长短没有直接联系。如季 度末的职工人数不一定比月末的职工人数多。因此,在分析研究 现象时,必须考虑现象的特点,来正确的反映事实。
统计学教程 第四章.

(一)用样本均值估计总体均值
1、样本均值x
xf f
(x x)2f
2、样本标准差s
f
3、抽样平均误差 ( x )
s2 n
4、抽样极限误差
5、总体均值的区间估计
(二)用样本成数估计总体成数
1、样本成数 p n 1 n
2、抽样平均误差 (p)
p1 p
n
3、抽样极限误差
4、总体成数的区间估计
(x)
4、构造估计量的置信区间 ,如 x ± Δx ,p ± Δ p。
5、计算抽样估计精度 ,如
三、抽样平均误差的计算
样本均值的平均误差 样本成数的平均误差
(一)样本均值的平均误差
1、重复抽样
s2
ቤተ መጻሕፍቲ ባይዱ(x)
n
2、不重复抽样
(x)
s2 n
1
n N
(二)样本成数的平均误差
1、重复抽样
(p)
p1 p
x x (x x)2 f
-3.972 -1.972 0.028 2.028 4.028
—
236.652 116.664 0.039 164.511 146.023 663.889
x xf1 5 8 0 1 0 .9 7 2 1 1 千 小 时 f 1 4 4
s2 (xx)2f663.8894.610 f 144
样本指标
①样本均值
x
xf f
(x x)2f
样本标准差s
f
②样本成数 p n 1(即样本比例) n
成数的方差= p(1 p) 成数的标准差= p(1 p)
三、抽样误差
抽样调查时不可避免会出现各种误差 , 这些误差主要是 :总误差 、偏差 、抽样 误差 、抽样平均误差和抽样极限误差等
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
L
为中位数组的下限;
i
f m 为中位数组的次数;
为中位数组的组距。
众数
众数是一组数据中出现次数最多的那 个变量值,通常用M0表示。
◆由未分组数据确定众数 ◆由单项数列确定众数 ◆由组距数列确定众数
组距式变量数列计算众数的公式:
1 M0 L i 1 2 M 0 :众数,L:众数组的下限值; 1:众数组次数与下一组次数之差; 2:众数组次数与上一组次数之差; i:众数组的组距。
6、甲乙丙三个班的考试成绩分别服从对称分布、左 偏分布、右偏分布中的哪种分布?为什么?
由组距数列确定中位数
先计算各组的累计次数,再按公式
f
i 1
n
i
确定
中位数的位置,并对照累计次数确定中位数。 下限公式:
2
f
i 1
n
i
Me L
2
s m 1 fm
i
f 为总次数;
Sm 1 为中位数组前一组的向上累计次数;
v4 3
x
n i 1 n i 1
i
x fi
i
4
4
f
3
4
正态分布的峰度系数为0,当>0时为尖峰分 布,当<0时为平顶分布。
第四章讨论题 1、任何平均数都受变量数列中的极端值的影 响。 2、中位数把变量数列分成了两半,一半数值 比他大,一半数值比他小。 3、任何变量数列都存在众数。 4、算术平均数、中位数和众数三者的数量关 系说明什么样的变量分布特征? 5、什么是众数?有什么特点?试举例说明其 应用。 6、极差越小说明数据的代表性越好,数据越 稳定;
对比
1. 众数、中位数和算术平均数的关系
2. 众数、中位数和算术平均数的特点与应用场合
2、几何平均数
用处:用于计算比率、发展速度的平均值。 使用几何平均数的条件:
各个比率或速度的连乘积等于总比率
或总速度; 相乘的各个比率或速度不为零或负值。
15
【例】某流水生产线有前后衔接的五道工 序。某日各工序产品的合格率分别为95﹪、 92﹪、90﹪、85﹪、80﹪,求整个流水生 产线产品的平均合格率。
即12年总本利率等于各年本利率的连乘积,符 合几何平均数的适用条件,故计算平均年本利 率应采用几何平均法。 解:
X
4 2 L 1
1 0.03 1 0.05
4
2
L 1 0.15
12 2.2154 106.85 ﹪ 平均年利率 X G 1 106.85 1 6.85 ﹪ ﹪
16
分析:
设最初投产100A个单位 ,则 第一道工序的合格品为100A×0.95; 第二道工序的合格品为(100A×0.95×0.92) ; …… 第五道工序的合格品为 (100A×0.95×0.92×0.90×0.85×0.80;
因该流水线的最终合格品即为第五道工序 的合格品, 故该流水线总的合格品应为 100A×0.95×0.92×0.90×0.85×0.80; 则该流水线产品总的合格率为:
v3
x
n i 1
i
x
3
fi
3
i 1
n
fi
偏态系数的数值一般在0与±3之间,越接近0, 分布的偏斜度越小;越接近±3,分布的偏斜度 越大。
峰度
峰度是分布集中趋势高峰的形状。在变量数列的 分布特征中,常常以正态分布为标准,观察变量数 列分布曲线顶峰的尖平程度,统计上称之为峰度。
……… ………
第12年末的本利和为:
4 2 2
V 1 3﹪ 1 5﹪ 1 8﹪ 110﹪ 115﹪
3
第12年的计 息基础
则该笔本金12年总的本利率为: 4 2 总的本利和 V 1 0.03 1 0.05 L 1 0.15
本金
4
V
2
1 0.03 1 0.05 L 1 0.15
解: 总合格品 100A 0.95 0.92 0.90 0.85 0.80
总产品 100A 0.95 0.92 0.90 0.85 0.80
X 5 0.95 0.92 0.90 0.85 0.80 5 0.5349 88.24﹪
总合格品 100A 0.95 0.92 0.90 0.85 0.80 总产品 100A 0.95 0.92 0.90 0.85 0.80
即该流水线总的合格率等于各工序合格 率的连乘积,符合几何平均数的适用条 件,故需采用几何平均法计算。
因该流水线的最终合格品即为第五道工序 的合格品, 故该流水线总的合格品应为 100A×0.95×0.92×0.90×0.85×0.80; 则该流水线产品总的合格率为:
某数量标志的总和 算术平均数 对应的个体总数
◆简单算术平均数 ◆加权算术平均数 ◆算术平均数的数学性质
案例1:甲班《统计学》考试情况如下表: 60分以下
60-70 70-80
2
8 22
80-90
90分以上
10
4
案例2:乙班《统计学》考试情况如下表: 60分以下 2
60-70
70-80 80-90 90分以上
【例】某金融机构以复利计息。近12年来 的年利率有4年为 3﹪,2年为5﹪,2年为 8﹪,3年为10﹪末的本利和应为:
V ﹪ 第1年末的本利和为: 1 3
第2年的 计息基础
第2年末的本利和为:V 1 3﹪1 3﹪
• 加权几何平均数
当计算几何平均数的各种变量值出现的次数不 等时,即数据经过了统计分组时,则应采用加权 几何平均数。若以 xi表示第 i 组的变量值,以 fi i 表示第i 组的频数,以k 表示分组数,则加权几 k (i 何平均数的计算公式为: 1, 2, 3,, k )
f i x f1 x f 2 L x f k f i x f i ; x 1 2 k i
30
8 4 1
案例3:丙班《统计学》考试情况如下表: 60分以下 2
60-70
70-80 80-90 90分以上
5
12 25 7
问题
1、计算甲、乙、丙三个班的平均成绩;该平均值是 真实值还是近似值?如是近似值,什么情况下会是 真实值? 2、计算甲、乙、丙三个班的中位数、众数; 3、如要选择从算术平均数、中位数和众数三个平均 数中选择一个数来分别代表甲、乙、丙三个班的整 体水平,请问你会选择哪个平均数?为什么? 4、如要分别反映甲、乙、丙三个班的考试情况,你 会选择用哪些指标来衡量? 5、如要比较甲、乙、丙三个班的考试情况的优劣, 你又会选择什么样的指标来衡量?
第四章 数据的描述性分析
本章内容
第一节 集中趋势的描述
第二节 离散程度的描述 第三节 分布的偏态与峰度
集中趋势
集中趋势反映的是一组数据向某一中心 值靠拢的倾向,在中心附近的数据数目较 多,而远离中心的较少。对集中趋势进行 描述就是寻找数据一般水平的中心值或代 表值。
算术平均数
算术平均数是总体中各个体的某个数量 标志的总和与个体总数的比值,一般用符 号 x表示。
7、四分位差、平均差和标准差衡量的是哪个平均指 标的代表性?上述三个指标哪些优越? 8、如果某同学在英语竞赛中的标准得分为2,并且 知道1%为一等奖,5%为二等奖,10%为三等奖, 则 则他( )。 A.获一等奖 B.获二等奖 C.获三等奖 D.无缘奖项 9、想知道某班同学统计学考试成绩的稳定性,需要 用哪些指标比较好?相比较某班同学统计学考试成 绩和大学英语考试成绩的稳定性,用哪些指标比较 好?
10、在某地区抽取的120家企业按利润额进行分组, 结果如下表所示.
计算120家企业利润额的均值和标准差.
11、某管理局抽查了所属的8家企业,其产品销售数据如 下表所示,试比较产品销售额和销售利润的离散程度.
12、假定某班学生先后两次进行了难度不同的大学英语 综合考试,第一次考试成绩的均值和标准差分别为80分和 10分,而第二次考试成绩的均值和标准差分别为70分和7 分.张三第一、二次考试的成绩分别为92分和80分,那么 全班相比较而言,他哪一次考试的成绩更好呢?
数据标准化
标准化数值是变量值与其平均数的离差 除以标准差后的值,也称为z分数或标准分 数。设标准化数值为z,则有:
z
xi x
偏态
偏态是对分布偏斜方向和程度的测度。变量分 组后,总体中各个体在不同的分组变量值下分布 并不均匀对称,而呈现出偏斜的分布状况,统计 上将其称为偏态分布。
3