统计学4
统计学第4章学习指导
第4章(数据的概括性度量)学习指导数据分布的特征可以从三个方面进行描述:一是分布的集中趋势,反映各数据向其中心值靠拢或聚集的程度;二是分布的离散程度,反映各数据远离其中心值的趋势;三是分布的形状,反映数据分布偏斜程度和峰度。
掌握计算、特点及其应用场合。
主要内容学习要点2.1 集中趋势的度量众数▶概念:众数。
▶众数的特点。
中位数和分位数▶概念:中位数,四分位数。
▶中位数和四分位数的特点。
▶中位数和四分位数的计算。
平均数▶概念:平均数,简单平均数,加权平均数,调和平均数,几何平均数。
▶简单平均数和加权平均数的计算。
▶用Excel中的统计函数计算平均数。
▶几何平均数的计算和应用场合。
众数、中位数和平均数的比较▶众数、中位数和平均数在分布上的关系。
▶众数、中位数和平均数的特点及应用场合。
异众比率▶概念:异众比率异众比率的计算和应用场合。
2.2离散程度的度量四分位差(内距)概念:四分位差。
四分位差的计算。
用Excel中的统计函数计算四分位差。
方差和标准差概念:极差,平均差,方差,标准差。
样本方差和标准差的计算。
用Excel计算标准差。
离散系数概念:离散系数。
离散系数的计算。
离散系数的用途。
2.3偏态与峰态的度量偏态及其测度概念:偏态,偏态系数。
用Excel计算偏态系数。
偏态系数数值的意义。
峰态及其测度概念:峰态,峰态系数。
用Excel计算峰态系数。
峰态系数数值的意义。
Excel统计函数的应用。
一)判断题1,各变量值与其平均数的离差之和为最小值。
( )2.当各组的变量值所出现的频率相等时,加权算术平均数中的权数就失去作用,因而,加权算术平均数也就等于简单算术平均数( )3.比较两总体的平均数的代表性,离散系数较小的总体,平均数代表性亦小。
( )4,平均数与次数和的乘积等于各变量值与次数乘积的和。
( )5.若两总体的平均数不同,而标准差相同,则离散系数也相同。
( )6.并非任意一个变量数列都可以计算其算术平均数、中位数和众数。
统计学第四章
第四章 差异量教学目的:1.理解全距、四分位距、百分位距、平均差、方差、标准差和差异系数等概念;2.掌握各种差异量指标的计算方法。
数据的分布特征不仅有集中趋势,还有离中趋势。
以动态的眼光,从不同的角度看,数据是向中间变动的,也是向两端变动的。
两组数据可能平均水平相同,但两组数据的分布特征并不完全相同。
【如】:比较下列两组数据 A 组:88、82、73、76、81 B 组:92、86、70、72、80两组平均数,80==B A X X 但R A =88-73=15,R B=92-70=22。
即A 组较集中,B 组较分散。
因此,我们描述一组数据的分布特征,既要描述其集中趋势,也要描述其离中趋势。
差异量:表示一组数据的离中趋势或变异程度的量称为差异量。
常用的差异量指标有全距、四分位距、百分位距、平均差、方差、标准差和差异系数。
第一节全距、四分位距、百分位距一、全距全距:是一组数距中最大值与最小值之差。
优点:意义明确,计算方便。
缺点:反应不灵敏,易受极端值影响。
二、四分位距(一)四分位距的的概念四分位距:是指一组按大小顺序排列的数据中间部位50%个频数距离的一半。
)(1.4213Q Q QD -=QD :表示四分位距; Q 3:表示第三四分位数;Q 1:表示第一四分位数。
所以:四分位距的公式又为:22575P P QD -=(二)四分位数的计算方法 1、原始数据计算法(1)将数据由小到大进行排列; (2)分别求出三位四分位数(点); (3)代入公式计算。
【例如】:有以下16个数据25、22、29、12、40、15、14、39、37、31、33、19、17、20、35、30,其中四分位距的计算方法如下:(1)先将原始数据从小到大排列好;12、14、15、17、*19、20、22、25、*29、30、31、33、*35、37、39、40Q 1=18 Md =27 Q 3=34(2)求出Q 1、Md 、Q 3;(3)将Q 1、Md 、Q 3的得数代入公式(4.1)。
统计学 4 综合指标
特征的一种概括。
件下的具体表现。
统计指标
重要特点:数量性;具体性; 综合性
数量指标
质量指标
分类 绝对数指标 相对数指标 平均数指标
总规模、总水平 工作总量的指标 相对水平或工 作质量的指标
指标体系 具有内在联系的一系列指标所
构成的整体,即称为指标体系。
第四章 总量指标和相对指标
第一节 总量指标
概念
总量指标是指用来表明社会经济现象在一定时间、地 点、条件下的总规模、总水平或工作总量的指标。
作用
(1)是对社会经济现象认识的起点; (2)是国民经济宏观管理和企业经济核算的基
础性指标,是实行目标管理的工具; (3)是计算相对指标和平均指标的基础。
分类
按反映总体的内容分 按反映的时间状态分 按计量单位分
x1 f1 x2 f 2 xn f n xf x f1 f 2 f n f
f1 fn f x x1 xn x f f f
•
• •
•
2、影响因素 (1)各组变量值x的大小 (2)各组次数f
当变量值x比较大的次数f也多时,平均 数就靠近变量值大的一方;当变量值x较小而 次数f较多时,平均数就靠近变量值小的一方, 变量值的次数f的多少对平均数的大小起着权 衡轻重的作用,故称f为权数。权数除用次数 f表示外,还可用频率(权重)f/∑f表示。
1.孟加拉国--人口--14737万--面积---14.40万Km2--人口密度---1023人/Km2 2.日本--人口--12762万--面积---37.78万Km2--人口密度—338人/Km2 3.印度--人口-109535万--面积--328.76万Km2--人口密度---333人/Km2 4.菲律宾--人口---8947万--面积---30.00万Km2--人口密度—298人/Km2 5.越南--人口---8440万--面积---32.96万Km2--人口密度---256人/Km2 6.英国--人口---6060万--面积---24.48万Km2--人口密度--248人/Km2 7.德国--人口---8245万--面积---35.70万Km2--人口密度--231人/Km2 8.巴基斯坦--人口--16580万--面积---80.39万Km2--人口密度---206人/Km2 9.意大利--人口---5813万--面积---30.12万Km2--人口密度--193人/Km2 10.尼日利亚--人口--13186万---面积92.38万Km2--人口密度---143人/Km2 11.中国--人口-132256万--面积--959.70万Km2—人口密度—138人/Km2 12.印度尼西亚--人口--24545万--面积--191.94万Km2--人口密度—128人/Km2
统计学第四版--习题集及答案
答案附在后面有一些(在题目上若要打印先把答案去掉)每单元后面都有答案第一章导论【重点】了解统计的科学涵义,明确统计学的学科性质及基本研究方法,掌握统计数据的特点及其不同类型,牢固掌握统计学的基本概念。
【难点】准确掌把数据不同类型,牢固掌握统计学的基本概念并结合实例分析。
思考题1.1什么是描述统计学、推断统计学?怎样理解描述统计学和推断统计学在探索事物数量规律性中的地位和作用?1.2统计学发展史上有哪几个主要学派?1.3“统计学”一词有哪几种含义?1.4什么是统计学?怎样理解统计学与统计数据的关系?1.5统计数据可分为哪几种类型?不同类型的数据各有什么特点?1.6举例说明总体、样本、参数、统计量、变量这几个概念。
练习题一、单项选择题1、指出下面的数据哪一个属于分类数据()A、年龄B、工资C、汽车产量D、购买商品的支付方式(现金、信用卡、支票)2、指出下面的数据哪一个属于顺序数据()A、年龄B、工资C、汽车产量D、员工对企业某项制度改革措施的态度(赞成、中立、反对)3、某研究部门准备在全市200万个家庭中抽取2000个家庭,据此推断该城市所有职工家庭的年人均收入,这项研究的统计量是()A、2000个家庭B、200万个家庭C、2000个家庭的人均收入D、200万个家庭的人均收入4、了解居民的消费支出情况,则()A、居民的消费支出情况是总体B、所有居民是总体C、居民的消费支出情况是总体单位D、所有居民是总体单位5、统计学研究的基本特点是()A、从数量上认识总体单位的特征和规律B、从数量上认识总体的特征和规律C、从性质上认识总体单位的特征和规律D、从性质上认识总体的特征和规律6、一家研究机构从IT从业者中随机抽取500人作为样本进行调查,其中60%的人回答他们的月收入在5000元以上,50%的回答他们的消费支付方式是使用信用卡。
这里的“月收入”是()A、分类变量B、顺序变量C、数值型变量D、离散变量7、要反映我国工业企业的整体业绩水平,总体单位是()A、我国每一家工业企业B、我国所有工业企业C、我国工业企业总数D、我国工业企业的利润总额8、一项调查表明,在所抽取的1000个消费者中,他们每月在网上购物的平均消费是200元,他们选择在网上购物的主要原因是“价格便宜”。
统计学-4
26
数据类型与集中趋势测度值
数据类型和所适用的集中趋势测度值
数据类型 适 用 的 测 度 值 分类数据 众数 — — — — 顺序数据 中位数 四分位数 众数 — — 间隔数据 均值 众数 中位数 四分位数 — 比率数据 均值 几何平均数 中位数 四分位数 众数
3
平均指标的分类: 平均指标的分类:
数值平均数 算术平均数 位置平均数 中位数 众数 分位数
4
调和平均数
几何平均数
1、算术平均数: 、算术平均数:
总体标志总量 算术平均数= 算术平均数= 总体单位总量
n
x=
∑x
i =1
i
n
Xi代表总体各单位的标志值
5
∑x f =∑x f 加权算术平均数: 加权算术平均数:x = ∑f ∑f
Me=一般 一般
18
中位数
对组距数列: 对组距数列: /2确定中位数组, 确定中位数组 按n/2确定中位数组,再按下列公式求中位数
n −F i −1 2 M e = U i −1 + × ( U i − U i −1 ) Fi − Fi − 1
实例: 例 实例:[例4-11]
19
5、众数: 众数: 众数是指总体中最常见的标志值, 众数是指总体中最常见的标志值, 是指总体中最常见的标志值 亦即在研究和考察某种社会经济现象 重复次数最多的标志值。 时,重复次数最多的标志值。
i i i i i
统计学(第4章)
连续变动结果的总量指标,时期指标是
一个流量。
时间维度上
时期指标的三个特点 具有可加性
时期指标可以累计
时期指标数值大小与时期长短有直接关系
时期指标的数值一般为连续登记
2019/6/15
第四章 描述统计
5
统计学
2、时点指标
时点指标又叫存量指标,是指反映社 会经济现象在某一时点上的总量指标,
四 季度
1 500
计划完成百分数=
1400+1420+1470+1500 5000
=115.8%
注:2010年第一季度前的四个季度的累计量已达5000,说明五年计 划提前三个季度完成。
2019/6/15
第四章 描述统计
33
统计学
(2)累计法
如何确定提前 完成时间?
计算公式:
计划完成相对指标 长期计划期间实际累计完成数 长期计划规定的累计数
时点指标是一个存量。
时间维度上
时点指标的三个特点
不具可加性
不同时点指标数值是不能累加
时点指标数值大小与时点间隔长短无直 接关系
时点指标一般为间断统计
2019/6/15
第四章 描述统计
6
统计学
三、总量指标的计量单位
1、实物量单位(包括度量衡单位) 2、价值量单位 3、劳动量单位(工时和工日)
5 000 1 250 1 340 1 280
102.4
52.4
4 000 1 000 1 030 1 215
121.5
56.1
2 000 500 600 400
80.0
50.0
11 000 2 750 2 970 2 895 105.33
统计学第四章
第三种情况:相对数为提高率或降低率时,应根据以下两种
情况处理:
⊙ 以提高率相对数形式出现时:
1+实际提高率
计划完成程度=
1+计划提高率
例8,某工业企业2019年度计划劳动生产率比上年提高10%,
实际提高了15%,则:
100%+15%
劳动生产率计划完成程度=
=104.5%
(4)该指标的数值一般用复合计量单位表示或为无名数。
医疗床位数/千人 ;人口死亡率
5.动态相对数。一般指发展速度指标。是同类指 标在不同时间上的对比,借以反映同一现象在不同 时间上的发展变化情况。
某现象报告期数值 动态相对数=
同一现象基期数值
例5,某企业2019年产值为500万元,2019年为450 万元,则:
(3)在对长期计划完成情况进行检查时,需 要运用以下两种方法:
⊙计划数为计划期内应完成的累计总任务时, 计算计划完成程度指标时,可运用“累计法”进 行,即:
计划期内实际完成的累计数
计划完成程度=
计划期内计划完成的累计数
例9,某地区某五年计划规定的固定资产投资额为 3850万元,各年实际完成情况如下表:
某种现象总量指标 强度相对数=
另一有联系而性质不同的现象总量指标
例4,某年我国国民收入为5485亿元,年 平均人口为103049.5万人,则:
5485
人均国民收入=
=532.3(元/人)
103049.5
商业网点、金融机构、医疗单位、人口等密度 资金利税率 商品流通费用率 人口出生、死亡率 人均国民收入
统计学(4)
.
第一节 数据的收集
统计报表
按实施 范围分
按调查 范围分
按主管 系统分
按填报 单位分
按报送 方式分
国部地 全 非 基 专 基 综 电 书 家门方 面 全本 业 层 合 讯 面 统统统 统 面统 统 报 报 报 报 计计计 计 统计 计 表 表 表 表 报报报 报 计 报 表 表表表 表 报表 报
明确规定调查资料的起止时间; 调查资料登记时间:是指对调查单位进行调查并取得调
查资料的时间; 调查工作期限:是指从调查工作开始到调查工作结束所
经历的全部时间。 2.调查空间: 调查单位应在什么地点接受调查。
.
第一节 数据的收集
(五)制定调查的组织实施计划 调查的组织计划,是指为确保实施调查的具体工作计划。 调查的组织实施计划应包括以下内容: ➢ 建立调查工作的组织领导机构,做好人员的配备与分工; ➢ 做好调查前的准备工作。如宣传教育、人员培训、文件
重点单位:是指这些单位的标志总量在总体标志总量中占 有绝大比重的单位。
选取重点单位的原则:根据调查任务和调查对象的基本情 况确定选取的重点单位及数量;也要注意选取管理比较健全、 业务能力强、统计工作基础好的单位为重点单位。
特点:调查单位少;调查对象的标志值比较集中于某些单 位的场合。
注意:重点单位的选择是客观的。只适用于客观存在着重 点单位的情况。
注:1.资料来源于《世界概况》,由美国中央情报局(CIA出版)最权威报道; 2.中国2010年人均GDP为4283美元,居世界182个国家的95位。
.
第一节 数据的收集
1.定类尺度(类别尺度、列名尺度) 是对统计客体类别差异所作的反映,是最粗略、计量层次 最低的测量尺度。
统计学 第4章 假设检验
【解】研究者想收集证据予以支持的假设是该 城市中家庭拥有汽车的比率超过30%。 因此,建立的原假设和备择假设为 H0 :μ≤30% H1 :μ>30%
结论与建议
◆原假设和备择假设是一个完备事件组, 而且相互对立。在一项假设检验中,原假设和 备择假设必有一个成立,而且只有一个成立; ◆先确定备择假设,再确定原假设。因为 备择假设大多是人们关心并想予以支持和证实 的,一般比较清楚和容易确定; ◆等号“=”总是放在原假设上; ◆因研究目的不同,对同一问题可能提出 不同的假设,也可能得出不同的结论。 ◆假设检验主要是搜集证据来推翻和拒绝 原假设。
◆理想地,只有增加样本容量,能同时减小 犯两类错误的概率,但增加样本容量又受到很多 因素的限制; ◆通常,只能在两类错误的发生概率之间进 行平衡,发生哪一类错误的后果更为严重,就首 要控制哪类错误发生的概率; ◆在假设检验中,一般先控制第Ⅰ类错误的 发生概率。因为犯第Ⅰ类错误的概率是可以由研 究者控制的。
假设检验的过程
提出假设 作出决策
拒绝假设 别无选择!
总体
我认为人口的平 均年龄是50岁
抽取随机样本
均值 x = 20
二、原假设与备择假设
什么是假设?
对总体参数的具体数
值所作的陈述
我认为这种新药的疗效 比原有的药物更有效!
总体参数包括总体均值、 总体比率、总体方差等 分析之前必须陈述
备择假设。
500g
【解】研究者抽检的意图是倾向于证实这种洗 涤剂的平均净含量并不符合说明书中的陈述。 因此,建立的原假设和备择假设为 H0:μ≥500 H1:μ< 500
提出假设例3
一家研究机构估计,某城市中家庭拥有 汽车的比率超过 30% 。为验证这一估计是否 正确,该研究机构随机抽取了一个样本进行 检验。试陈述用于检验的原假设与备择假设
统计学4
用,掌握统计整理的方法,能够针对具体的调查资料
进行分类、汇总并编制统计表。
教学要求:
了解统计整理的概念和步骤,掌握统计分组、
分配数列及统计表的概念,重点掌握统计分组的
方法 、分配数列的编制,并学回会运用统计表来
表现统计资料。
4、1统计整理概述
检查数据是否真实反映客观实际情况,内 容是否符合实际 检查数据是否有错误,计算是否正确等
数据的审核—原始数据
(RAW DATA)
审核数据准确性的方法
1.
2.
逻辑检查 从定性角度,审核数据是否符合逻辑,内容 是否合理,各项目或数字之间有无相互矛盾 的现象 主要用于对分类和顺序据的审核 计算检查 检查调查表中的各项数据在计算结果和计算 方法上有无错误 主要用于对数值型数据的审核
饮料,就将这一饮料的品牌名字记录一次。
下面的表格是记录的原始数据。
顾客购买饮料的品牌名称
旭日升 露露 旭日升 可口可乐 百事可乐 可口可乐 汇源果汁 可口可乐 露露 可口可乐 可口可乐 旭日升 可口可乐 百事可乐 露露 旭日升 旭日升 百事可乐 可口可乐 旭日升 旭日升 可口可乐 可口可乐 旭日升 露露 旭日升 可口可乐 露露 百事可乐 百事可乐 汇源果汁 露露 百事可乐 可口可乐 百事可乐 汇源果汁 可口可乐 汇源果汁 可口可乐 汇源果汁 露露 可口可乐 旭日升 百事可乐 露露 汇源果汁 可口可乐 百事可乐 露露 旭日升
所以要选择组距式分组
第一步:确定组数。
K 1 lg 50 lg 2 7
第二步:确定各组的组距。 最大值为139,最小值为107,
统计学第四章 综合指标
3、计划完成百分数的计算
A、计划数为绝对数。
绝对数的计划完成百分数 实际绝对水平 100% 计划绝对水平
某工业企业总产值资料如下表:
车 名
间 称
总产值(万元) 计划Hale Waihona Puke 实际数计划完成百分数 (%)
(甲)
甲 乙 丙
(1)
50 110 140
(2)
80 100 140
(3)=(2)/(1)
160.00 90.91 100.00
时期指标与时点指标的联系:
1、二者都属于总量指标。 2、二者通常是相互影响的。
总量指标的计算
总量指标的单位一般有: 实物量单位 价值量单位 劳动量单位
1. 实物单位是根据事物的自然属性和特点采用的计 量单位。 实物单位的分类: ①自然单位:它是按照研究现象的自然状况来计量其 数量的一种计量单位。 ②度量衡单位:它是按照同意的度量衡制度的规定来 计量客观事物数量的一种计量单位。 ③双重单位和复合单位:是指在需要同时采用两个或 两个以上单位来计量事物时采用的单位。 ④标准实物单位:按照统一折算的标准来度量被研究 现象数量的一种计量单位。
相对指标在统计分析中的作用:
• 相对指标为人们深入认识事物发展的质 量与状况提供客观的依据,社会经济现 象总是相互联系、相互制约的关系。 • 计算相对指标可以使不能直接对比的现 象找到可以对比的基础,进行有效的分 析。
二、相对指标的种类及计算方法:
1、结构相对指标: • 定义:是在资料分组的基础上,以总体 总量作为比较标准,求出各组总量占总 体总量的比重,来反映总体内部组成情 况的综合指标。
合
计
300
320
106.67
要求:计算各车间和全厂总产值的计划完成百分数。
统计学第4章 参数估计
无偏性
(unbiasedness)
无偏性:估计量抽样分布的数学期望等于被
估计的总体参数
抽样分布
中,样本 P(ˆ)
均值、比 率、方差
无偏
有偏
分别是总
A
B
体均值、
比率、方
差的无偏
估4计- 2量3
ˆ
统计学
STATISTICS
有效性
(efficiency)
有效性:对同一总体参数的两个无偏点估计
置信水平(1-α)表达了区间估计的可靠性。 它是区间估计的可靠概率。
显著性水平α表达了区间估计的不可靠的概 率。
4 - 20
统计学§4.2 点估计的评价标准
STATISTICS
对于同一个未知参数,不同的方法得到的估 计量可能不同,于是提出问题
应该选用哪一种估计量? 用何标准来评价一个估计量的好坏?
常用 标准
4 - 21
(1) 无偏性 (2) 有效性 (3) 一致性
统计学 定义 STATISTICS
无偏性
(unbiasedness)
若 E(ˆ)
则称 ˆ是 的无偏估计量.
定义的合理性
我们不可能要求每一次由样本得到的
估计值与真值都相等,但可以要求这些估 计值的期望与真值相等.
4 - 22
统计学
量,有更小标准差的估计量更有效
P(ˆ)
ˆ1 的抽样分布
B
无偏估计量还 必须与总体参 数的离散程度
比较小
4 - 24
A
ˆ2 的抽样分布
ˆ
统计学
有效性
STATISTICS
定义 设 ˆ1 1(X1, X 2, , X n )
统计学第四章
统计学第四章1.动态数列的构成要素是()。
[单选题] *A)变量和次数B)时间和指标数值(正确答案)C)时间和次数D)主词和宾词2.动态数列中,每个指标数值可以相加的是()。
[单选题] *A)相对数动态数列B)时期数列(正确答案)C)间断时点数列D)平均数动态数列4.定基增长速度与环比增长速度的关系为()。
[单选题] *A)定基增长速度等于相应的各个环比增长速度的算术和B)定基增长速度等于相应的各个环比增长速度的连乘积C)定基增长速度等于相应的各个环比增长速度加1后的连乘积再减1(正确答案)D)定基增长速度等于相应的各个环比增长速度连乘积加1(或100%)5.按季平均法测定季节比率时,各季的季节比率之和应等于() [单选题] *A)100%B)400%(正确答案)C)120%D)1200%9.某城市2016年末有人口750万人,有零售商业网点3万个,则该市的商业网点密度指标是()。
[单选题] *A)2.5千人/个B)250人/个(正确答案)C)0.25个/千人D)250个/人10.按水平法计算的平均发展速度推算可以使() [单选题] *A)推算的各期水平之和等于各期实际水平之和B)推算的期末水平等于实际期末水平(正确答案)C)推算的各期定基发展速度等于实际的各期定基发展速度D)推算的各期增长量等于实际的逐期增长量11.增长1%的绝对值是()。
[单选题] *A)水平指标B)速度指标C)水平与速度相结合的指标(正确答案)D)什么也不是12.评比城市间的社会发展状况,将各城市每人分摊的绿化面积按年排列的动态数列是属于()。
[单选题] *A)总量指标的时期数列B)总量指标的时点数列C)相对指标动态数列(正确答案)D)平均指标动态数列13.年距增长速度的计算公式是()。
[单选题] *A)年距增长量÷最初水平B)逐期增长量÷最初水平C)逐期增长量÷前期水平D)年距增长量÷上年同期发展水平(正确答案)14.动态数列中的发展水平()。
统计学第四章的教材
几个直观的结论
1. 样本均值的均值(数学期望)等于总体均值(式中:M为样本 n 数目); xi 22 23 28 i 1 25 X M 16 2. 抽样误差是随样本不同而不同的随机变量。抽样误差均值 等于0; xX 0
3. 样本均值的方差等于总体方差的1/n。
3
(二)抽样估计的一般步骤 1、设计抽样方案 2、 随机抽取样本(从总体随机抽取部分单位构成样本) 3、搜集样本资料(对样本单位进行调查登记) 4、整理样本资料(审查、分组汇总、计算样本指标的
数值,即计算估计量的具体数值)
5、估计总体指标(即估计总体参数)
总体参数与样本估计量的关系——对于特定的目 的,总体是惟一的,所以参数也是惟一的;而由 于样本是随机的,所以样本估计量是随机变量。
(3)抽样方法。相同条件下,重复抽样的抽样平均误 差大比不重复抽样的抽样平均误差大。
(4)抽样组织方式。由于不同抽样组织方式有不同的 抽样误差,所以,在误差要求相同的情况下,不同抽 样组织方式所必需的抽样数目也不同。
21
不知道总体方差时如何计算
用样本方差代替计算 用过去(总体或样本)方差代替计算 用同类现象(当前 或过去、总体或样本) 方 代替计算 有若干个方差可选择时,选方差最大者 (注意:对比率,即选择最接近0.5的值所 得的方差最大)
进无偏估计量。
29
二、区间估计
(一)区间估计的原理 区间估计就是根据样本估计量以一定 可靠程度推断总体参数所在的区间范围。 特点:考虑了估计量的分布,所以它能 给出估计精度,也能说明估计结果的把握 程度(置信度)。
30
(一)总体均值的置信区间
(1)假定条件
总体服从正态分布,且总体方差(2)已知
统计学第四章统计分析指标
计划完成相对指标
产值计划完成程度若大于100%,说明超额完 成计划;若小于100%,说明没有完成计划, 为正指标。 单位成本计划完成程度若大于100%,说明成 本比计划高,没有完成计划;若小于100%, 说明超额完成计划,为逆指标。 计划完成相对数的分子分母不能互换,在指 标含义、计算范围、核算方法等方面要一致。
计划完成相对指标
长期(通常是五年)计划完成情况—水平法和累计法
总体的一部分单位 总体另一部分单位 比例相对数
人口性别比例 积累与消费比例 农轻重比例
…
…
比例相对指标
人口出生性别比正常值一般在103到107之间。但 我国人口的出生性别比自20世纪80年代中期以来 迅速攀升。 1995年,0岁~4岁人口性别比:118.38 2000年,0岁~4岁人口性别比:120.17 2003年,0岁~4岁人口性6
(1)计划数为绝对数
计划完成相对数=(实际完成数÷同期计划数)×100%
适用于研究分析社会经济现象的规模或水平的计划完成 程度。
计划完成相对指标
〔例〕 某公司2010年计划销售某种产品30万件, 实际销售32万件,则该公司2010年销售计划完成相对 指标是多少?超额完成计划多少?
销售计划完成相对指标 = (32/30)*100% = 106.7% 超额完成计划 = 106.7% - 100% = 6.7%
t1时段
t2时段
t3时段
时期指标的特点: 1. 不同时期的时期指标数值具有可加性; 2. 时期指标的数值大小与时期长短有直接关系; 3. 时期指标数值是连续登记、累计的结果。
时点指标的特点: 1. 不同时期的时点指标数值不具有可加性。 2. 时点指标的数值大小与时间间隔长短无关。 3. 时点指标的数值是间断计数的。
《统计学》 第四章 统计综合指标
第四章统计综合指标(一)(一)填空题1、总量指标是反映社会经济现象的统计指标,其表现形式为绝对数。
2、总量指标按其反映总体的内容不同,分为总体的标志总量和总体单位总量;按其反映的时间状况不同,分为时期结构和时点结构。
反映总体在某一时刻(瞬间)上状况的总量指标称为时点结构,反映总体在一段时期内活动过程的总量指标称为时期结构。
3、相对指标的数值有两种表现形式,一是有名数,二是无名数。
4、某企业中,女职工人数与男职工人数之比为1:3,即女职工占25%,则1:3属于比例相对数,25%属于结构相对数。
(二)单项选择题(在每小题备选答案中,选出一个正确答案)1、银行系统的年末储蓄存款余额是( D )A. 时期指标并且是实物指标B. 时点指标并且是实物指标C. 时期指标并且是价值指标D. 时点指标并且是价值指标2、某企业计划规定本年产值比上年增长4%,实际增长6%,则该企业产值计划完成程度为( B )A、150%B、%C、%D、无法计算3、总量指标具有的一个显着特点是( A )A. 指标数值的大小随总体范围的扩大而增加B. 指标数值的大小随总体范围的扩大而减少C. 指标数值的大小随总体范围的减少而增加D. 指标数值的大小随总体范围的大小没有直接联系4、在出生婴儿中,男性占53%,女性占47%,这是( D )A、比例相对指标B、强度相对指标C、比较相对指标D、结构相对指标5、我国1998年国民经济增长(即国内生产总值为)% ,该指标是( C )A. 结构相对指标B. 比例相对指标C. 动态相对指标D. 比较相对指标6、某商店某年第一季度的商品销售额计划为去年同期的110%,实际执行的结果,销售额比去年同期增长%,则该商店的商品销售计划完成程度的算式为( B )A. %÷210%B. %÷110%C. 210%÷D. 条件不够,无法计算7、下面属于时点指标的是( A )A. 商品库存量B. 商品销售量C. 婴儿出生数D. 平均工资8、将粮食产量与人口数相比得到的人均粮食产量指标是( D )A、统计平均数B、结构相对数C、比较相对数D、强度相对数9、某工业企业总产值计划比去年提高8%,实际比去年提高10%,则实际总产值比计划的任务数提高( B )A. 2%B. %C. 25%D. %10、某企业产值计划完成程度为102%,实际比基期增长12%,则计划规定比基期增长( A )A. %B. 10%C. %D. 6%11、已知某市有各种经济类型的工业企业3128个,工业总产值为210亿元,则在该资料中总体标志总量是( C )A. 各种经济类型的工业企业共3128个B. 其中国有工业企业所占的百分比C. 工业总产值210亿元D. 平均每个工厂的产值为671万元12、比较相对指标是( A )A、同类现象在不同空间上对比B、同类现象在不同时间上对比C、同一现象的部分与总体的对比D、有联系的不同现象的相互对比13、正确计算和应用相对指标的前提条件是( B )A、正确选择对比基础B、严格保持分子、分母的可比性C、相对指标应与总量指标结合应用D、分子、分母必须同类(三)多项选择题(在每小题备选答案中,至少有两个答案是正确的)1、强度相对数是两个不同但有一定联系的总体的总量指标相对比而计算的统计指标,所以( BE )A. 强度相对数的分子、分母都是可以互换的B. 强度相对数的分子、分母有的是可以互换的C. 在各种相对指标中,只有强度相对指标的分子、分母都是可以互换的D. 强度相对指标都是有名数E. 强度相对指标也有的是用无名数来表示2、下列指标中属于时期指标的有( ABCD )A、全年出生人数B、国民生产总值C、粮食总产量D、商品销售额E、产品合格率3、下列各项指标中,属于时点指标的是( ABD )A. 在册职工人数B. 企业数C. 某种商品的销售量D. 某地区1998年年末的人口数E. 企业某年所生产的产品产量4、下列指标中属于时点指标的有( AB )A、年末人口数B、钢材库存量C、粮食产量D、工业总产值E、经济增长率5、无名数是一种抽象化的数值,常用的表示方法有( ABC )A. 系数或倍数B. 成数C. 百分比或千分数D. 人均指标6、总量指标的计量单位有( ABCDE )A、货币单位B、劳动量单位C、自然单位D、度量衡单位E、标准实物单位7、分子与分母可以互换的相对指标有( BCD )A. 结构相对指标B. 比例相对指标C. 强度相对指标D. 比较相对指标E. 计划完成程度相对指标8、相对指标中分子与分母可以互换位置的有( CD )A、计划完成程度许多相对指标B、结构相对指标C、比较相对指标D、强度相对指标E、动态相对指标9、在以下各项指标中,属于强度相对指标的有( BD )A. 平均工资B. 人口自然增长率C. 商品流转次数D. 一个国家的人均粮食产量E. 平均每人的主要产品的产量10、加权算术平均数的大小( ABCD )A、受各组变量值大小的影响B、受各组次数多少的影响C、随X的增大而增大D、随X的减少而减少E、与次数多少成反比关系11、比较相对指标的计算,可以是( ABCE )A. 不同国家、不同地区和不同单位之间的比较B. 先进水平与落后水平的比较C. 有联系的两个不同总体的总量指标的比较D. 同一总体内部部分与整体的比较E. 实际达到的水平与标准水平或平均水平的比较12、总量指标与相对指标的关系表现为( ABCDE )A、总量指标是计算相对指标的基础B、相对指标能补充总量指标的不足C、相对指标可表明总量指标之间的关系D、相对指标要与总量指标结合应用E、总量指标和相对指标都是综合指标13、相对指标的计量形式可以是( ABCDE )A、系数B、倍数C、成数D、百分数E、复名数第四章统计综合指标(二)(一)填空题1、平均指标是指同类社会经济现象在一定时间、地点和条件下将总体内单位的数量差异抽象化的代表性水平指标。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
X
X
i 1 K i 1
i
Fi
i
F
6160 123.(个) 2 50
3.权数对均值的影响——一个例子
[例9]甲乙两组各有10名学生,他们的考试成绩及其分布数 据如下
甲组: 考试成绩(X ): 0 人数分布(F ):20 1 20 1 100 8 100 1
(五)数值型分组数据的众数的计算
1. 众数的值与相邻两组频数的分布有关 2. 相邻两组的频数相等时,众数组的组中值 即为众数 3. 相邻两组的频数不相等时,众数采用下 列近似公式计算
Mo
f f 1 M0 L i ( f f 1 ) ( f f 1 )
4. 该公式假定众数组的频数在众数组内均匀分布
四分位差 方差和标准差 离散系数
峰 度
4.1 集中趋势的测度
定类数据:众数 定序数据:中位数和分位数 定距和定比数据:均值 众数、中位数和均值的比较
一、 集中趋势概述
(Central tendency)
1. 一组数据向其中心值靠拢的倾向和程度 2. 测度集中趋势就是寻找数据一般水平的代表值或中心值 3. 不同类型的数据用不同的集中趋势测度值
第4章 数据的概括性度量
4.1 集中趋势的度量 4.2 离散程度的度量 4.3 偏态与峰态的度量
数据分布特征概述 一、图示
1.集中趋势 (位置) 2.离中趋势 (分散程度) 3.偏态和峰度 (形状)
二、数据分布特征的测度
数据的特征和测度
集中趋势
众 数
离散程度
异众比率
分布的形状
偏 态
中位数
均 值
300/2=150
从累计频数看,中位数 的在“一般”这一组别 中。因此 Me=一般
合计
300
—
2.未分组数据(奇数个数据)
原始数据: 排 序: 位 置: 24 20 1 22 21 2 21 22 3 26 24 4 20 26 5
N 1 5 1 位置 3 2 2
中位数 22
N+ 7+1 = =2 QL位置 = 1 4 4 3(N+1) 3(7+1) = =6 QU位置 = 4 4
QL= 23
QU = 30
3.未分组数据(偶数个数据)
原始数据: 23 21 30 28 25 26 排 序: 21 23 25 26 28 30 位 置: 1 2 3 4 5 6
N+ 下四分位数(QL)位置 = 1 4 3(N+1) 上四分位数(QU)位置 = 4
N 下四分位数(QL)位置 = 4 3N 上四分位数(QL)位置 = 4
未分组数据:
组距分组数据:
(三)四分位数的计算
1.定序数据
【例6】根据表6中的数据,计算甲城市家庭对住房满意状况评 价的四分位数
表6 甲城市家庭对住房状况评价的频数分布 解:下四分位数(QL)的位置为: QL位置=(300)/4=75 上四分位数(QL)的位置为: QU位置=(3×300)/4=225 从累计频数看, QL在“不满意 ”这一组别中; QU在“一般” 这一组别中。因此 QL =不满意 QU =一般
解:这里的变量为“广告类 型”,这是个定类变量,不 同类型的广告就是变量值。 我们看到,在所调查的200 人当中,关注商品广告的人 数最多,为112人,占总被 调查人数的56%,因此众数 为“商品广告”这一类别, 即 Mo=商品广告
(四)定序数据的众数——一个例子
【例2】根据表2中的数据,计算众 数
Mo
Mo
(六)数值型数据众数计算的例子
【例3】根 据表3中的 数据,计 算 50 名 工 人日加工 零件数的 众数
表3 某车间50名工人日加工零件数分组表
按零件数分组 105~110 110~115 115~120 120~125 125~130 130~135 135~140 合计 频数(人) 3 5 8 14 10 6 4 50 累积频数 3 8 16 30 40 46 50 —
50 16 M e 120 2 5 123.21(个) 14
四、分位数
(一)概念
1. 集中趋势的测度值之一
2. 排序后处于25%和75%位置上的值
25%
QL
25%
25%
QM
25%
QU
3. 不受极端值的影响
4. 主要用于定序数据,也可用于数值型数据, 但不能用于定类数据
(二)四分位数位置的确定
14 8 M 0 120 5 123(个) (14 8) (14 10)
三、中位数
中位数的概念 中位数位置的确定
(一)中位数的概念
1. 集中趋势的测度值之一 2. 排序后处于中间位置上的值
50%
3. 不受极端值的影响
50%
Me
4. 主要用于定序数据,也可用数值型数据,但不能用于定 类数据 5. 各变量值与中位数的离差绝对值之和最小,即
X甲 X乙
Xi
i=1
Xi
i=1
n
0×1+20×1+100×8
10
0×8+20×1+100×1 10
82(分) 12(分)
n
(三)均值的数学性质
1.各变量值与均值的离差之和等于零
n
(X
i 1
i
X) 0
2. 各变量值与均值的离差平方和最小
(X
i 1
n
i
X ) min
QL位置=50/4=12.5
50 8 QL 115 4 5 117.81(个) 8
QU位置=3×50/4=37.5
3 50 30 QU 125 4 5 128.75(个) 10
五、均值——算术平均数
均值的概念 均值的计算 均值的性质
(一)均值的概念
i
N
设分组后的数据为:X1 ,X2 ,… ,XK 相应的频数为: F1 , F2,… ,FK 加权均值的计算公式为
X 1 F1 X 2 F2 X N FN X F1 F2 FN
X F
i 1 K i
K
i
F
i 1
i
1.简单均值的例子
原始数据: 10 5 9 13 6 8
1. 2. 3. 4. 5. 集中趋势的测度值之一 最常用的测度值 一组数据的均衡点所在 易受极端值的影响 用于数值型数据,不能用于定类数据和定 序数据
(二)均值的计算公式
设一组数据为:X1 ,X2 ,… ,XN 简单均值的计算公式为
X1 X 2 X N X N
X
i 1
N
2
六、调和平均数
(一)概念及计算公式
1. 集中趋势的测度值之一 2. 均值的另一种表现形式 3. 易受极端值的影响 4. 用于定比数据 5. 不能用于定类数据和定序数据 6. 计算公式为 m X F
X1 X 2 X 3 X 4 X 5 X 6 X N 6 10 5 9 13 6 8 6 8.5
i 1 i
X
N
2.加权均值的例子
【例8】根据表8中的数据,计算50 名工人日加工零件数的均值
表4-1 按零件数分组 105~110 110~115 115~120 120~125 125~130 130~135 135~140 合计
下四分位 数:
上四分位 数:
N SU 4 QU LU iU fU
5.数值型分组数据——计算示例
【例7】根据表7中的数据,计算50 名 工人日加工零件数的四分位数
表7 某车间50名工人日加工零件数分组表
按零件数分组 105~110 110~115 115~120 120~125 125~130 130~135 135~140 合计 频数(人) 3 5 8 14 10 6 4 50 累积频数 3 8 16 30 40 46 50 —
(一)众数的概念
1. 集中趋势的测度值之一 2. 出现次数最多的变量值
3. 不受极端值的影响
4. 可能没有众数或有几个众数
5. 主要用于定类数据,也可用于定序数据 和数值型数据
(二) 众数的特性
无众数情形 原始数据: 10 单众数情形 原始数据:
5
9 12
6
8
6
5
9
8
5
5
多众数情形 原始数据: 25 28 28 36 42 42
回答类别 非常不满意 不满意 一般 满意 非常满意
甲城市
户数 (户) 24 108 93 45 30 累计频数 24 132 225 270 300
合计
300
—
2.未分组数据(奇数个数据)
原始数据: 23 21 30 排 序: 21 23 25 位 置: 1 2 3 32 28 25 26 26 28 30 32 4 5 6 7
K
某车间50名工人日加工零件均值计算表 组中值(Xi) 107.5 112.5 117.5 122.5 127.5 132.5 137.5 — 频数(Fi) 3 5 8 14 10 6 4 50 XiFi 322.5 562.5 940.0 1715.0 1275.0 795.0 550.0 6160.0
4. 低层次数据的集中趋势测度值适用于高层次的测量数据, 反过来,高层次数据的集中趋势测度值并不适用于低层次 的测量数据 5. 选用哪一个测度值来反映数据的集中趋势,要根据所掌握 的数据的类型来确定
二、众数
众数的概念 众数的特性 定类数据众数的计算 定序数据众数的计算 数值型分组数据众数的计算
(三)定类数据的众数——一个例子