统计学第三章3335371页PPT
合集下载
统计学原理 第三章 统计整理PPT课件
• 7、统计分组的关键在于确定( D )。
• A.组中值
B.组距
• C.组数
D.分组标志和分组界限
• 7.对某校学生分别按年级和年龄分组,由此形成的分组
体系是( A )。
• A.平行分组体系
B.复合分组体系
• C. 二者兼而有之
D.二者都不是
• 二、多选题
• 1、统计分组有按品质标志分组和按数量标志分组两种,
下述人口总体分组属数量标志分组的是( BD )。
• A.按性别分组
B.按年龄分组
• C.按文化程度分组
D.按收入水平分组
• E.按居住地区分组
• 2、统计分组是将统计总体按一定标志区分为若干部分的
统计方法。它( ABDE)。
• A.是统计研究中的基本方法 B.是在统计总体内部进行
• C.是在统计总体之间进行 D.对总体而言是分
轻
重
工
工
企
企
业
业
简单分组
按经济类型分
国集 其 有体 他 工工 工 业业 业 企企 企 业业 业
平行分组体系
工业企业
按轻重 工业分
按企业 规模分
轻工企业
大型轻 小型轻 工企业 工企业
重工企业
大型重 小型重 工企业 工企业
按经 济类 型分
国有 大型 轻工 企业
集体 大型 轻工 企业
其他 大型 轻工 企业
2.对原始资料进行审核与检查
3.对原始资料进行 统计分组和统计汇总
基础
中心
4.编制统计表或绘制统计图
(1)完整性 (2)准确性 (3)适用性 (4)时效性
结果
第二节 统计分组
一、统计分组的定义 是指根据客观现象的特点和统计研究的目的要求,按照一 定的标志把总体划分为若干不同性质的组或类型。
统计学原理PPT
1、统计的组织必须贯彻集中统一的原则。 2、我国集中统一的统计系统的组成:综合统计系 统、专业统计系统、基层单位统计组织。 3、社会致意国民经济核算的三种组成:统计核算、 会计核算、业务核算。 4、1984年1月1日颁布《中华人民共和国统计法
1、某城市进行工业企业未安装设备普查,总体单位 是( ) A、工业企业全部未安装设备 B、工业企业每一台未安装设备 C、每个工业企业的未安装设备 D、每一个工业企业 2、了解某地区全部成年人的就业情况,那么( ) A、全部成年人是研究的总体 B、成年人口总数是统计指标 C、成年人口就业率是统计标志 D、 “职业”是每个人的特征,“职业”是数量指标 E、某人职业是“教师”,这里的“教师”是标志表 现
§3、统计分组
一、统计分组的概念与作用
1、统计分组的概念 统计分组:就是根据统计研究的需要,将总体中的所有单位, 按照一定的标志区分为若干组成部分的方法。 统计分组和统计指标是统计的两个基本要素。 2、统计分组的作用 (1)划分社会经济总体现象的类型; (2)研究总体现象内部各组成部分的结构和比例关系; (3)研究总体现象之间的依存关系。
§3 统计学的几个基本概念
二、标志与指标
1、标志是说明总体单位(个体)特征的名称。 按其表现形式有质量标志与数量标志。 品质标志表明的是总体单位的属性特征,是不能用数量表示的。 如性别 数量标志表明的是总体单位量的特征,是可以用数量表现的。 如年龄 注:标志的具体表现是在标志名称后面所表明的属性或数值。 2、指标是反映总体现象数量特征的概念和具体数值。 如国内生产总值、人均工资
§1 统计的意义
学习知识点:
一、统计的涵义: 1、“统计”一词的涵义指:是一种对客观现象总体数量方 面进行数据的搜集、处理、分析的调查研究活动。统计 包括:统计工作、统计资料和统计学。 2、统计工作即统计实践,它是对社会自然现象客观存在的 现实数量方面进行搜集、整理和分析的活动过程。 3、统计资料指统计实践活动过程所取得的各项数字资料及 与之相关的其他实际资料的总称。 4、统计学是关于认识客观现象总体数量特征和数量关系的 科学。 5、统计工作与统计资料是统计活动与统计成果的关系,统 计工作与统计学则是统计实践与统计理论的关系。
实用统计学第3章 PPT课件
2007年全国出生人口性别比(男性比女性)为120.2 %,这个数 字在1982年为108.5%,1987年 为110.9 %,1990 年为111.3 %, 1995年 115.6%,2000年为116.9%。
我国2007年三次产业产值结构为:11.7:49.Байду номын сангаас:39.1。
(不同总体)
4.比较相对数
3.比例相对数
在同一总体内不同部分之比。用于对比总体内部不同部分 之间的比例关系。
比例相对指 总 总 标体 体中 中另 某一 一部 部分 分的 的 10数 数 0%值 值
举例:
2007我国全年货物进出口总额21738亿美元,其中,货物出口 12180亿美元,货物进口9558亿美元,比例为127.41%。
按采用的计量单位不同
实物量指标:根据事物、现象的属性、特点和用途, 采用自然单位、度量衡单位、标准实物量单位和复合 单位计量的总量指标。如,我国2007年全年能源消费总量
26.5亿吨标准煤,比上年增长7.8%。煤炭消费量25.8亿吨,增长 7.9%;原油消费量3.4亿吨,增长6.3%;天然气消费量673亿立 方米,增长19.9%;
将同类(同一)指标在不同地区、单位之间作静态对比的比率。 它可以说明同一时期内某种同类现象在不同单位之间的差异程 度,一般用系数或百分数来表示。其计算公式为:
比较相对指乙 甲 标地 地区 区同 某一 现现 象象 的 1的 数 0% 0数 值值
注意分子、分母必须是同一性质的总量指标、相对指标或平均指标
举例:
07年天津住宅开发总面积中,普通住宅、公寓、别墅 各占80%、13%和7%。
07全年国内生产总值246619亿元,第一产业增加值 28910亿元,第二产业增加值121381亿元,第三产业 增 加 值 96328 亿 元 , 分 别为: 11.72% 、 49.22% 、 39.06%
我国2007年三次产业产值结构为:11.7:49.Байду номын сангаас:39.1。
(不同总体)
4.比较相对数
3.比例相对数
在同一总体内不同部分之比。用于对比总体内部不同部分 之间的比例关系。
比例相对指 总 总 标体 体中 中另 某一 一部 部分 分的 的 10数 数 0%值 值
举例:
2007我国全年货物进出口总额21738亿美元,其中,货物出口 12180亿美元,货物进口9558亿美元,比例为127.41%。
按采用的计量单位不同
实物量指标:根据事物、现象的属性、特点和用途, 采用自然单位、度量衡单位、标准实物量单位和复合 单位计量的总量指标。如,我国2007年全年能源消费总量
26.5亿吨标准煤,比上年增长7.8%。煤炭消费量25.8亿吨,增长 7.9%;原油消费量3.4亿吨,增长6.3%;天然气消费量673亿立 方米,增长19.9%;
将同类(同一)指标在不同地区、单位之间作静态对比的比率。 它可以说明同一时期内某种同类现象在不同单位之间的差异程 度,一般用系数或百分数来表示。其计算公式为:
比较相对指乙 甲 标地 地区 区同 某一 现现 象象 的 1的 数 0% 0数 值值
注意分子、分母必须是同一性质的总量指标、相对指标或平均指标
举例:
07年天津住宅开发总面积中,普通住宅、公寓、别墅 各占80%、13%和7%。
07全年国内生产总值246619亿元,第一产业增加值 28910亿元,第二产业增加值121381亿元,第三产业 增 加 值 96328 亿 元 , 分 别为: 11.72% 、 49.22% 、 39.06%
统计学导论(曾五一)ppt第3章
18 16 14 12 10 8 6 4 2 0 50-60 70-80
35% 30% 25% 20%
`
15% 10% 5% 0% 90-100
统计学
第三章
第三章 数据分布特征的描述
第一节 统计变量集中趋势的测定
第二节 统计变量离散程度的测定
第三节 变量分布的偏度与峰度
3-2
第一节 统计变量集中趋势的测定
3-11
3.由组距数列计算算术平均数
表3-3
使用寿命 (小时) 1000以下 1000-1200 1200-1400 1400-1600 1600-1800 1800-2000
节能灯泡的使用寿命的分组数据
数量 组中 (f) 值 (x) 2 8 16 35 23 12 900 1100 1300 1500 1700 1900
( X Mo) 3( X Me)
3-27
小结:根据变量类型运用正确的指标 分类数据:众数
一组数据中出现次数最多的变量值 适合于数据量较多时使用 不受极端值的影响 一组数据可能没有众数或有几个众数 主要用于分类数据,也可用于顺序数据和 数值型数据
xG 5 88% 85% 90% 92% 96% 90.31%
3-20
三、众数与中位数
f(x)
(一)众数(Mode) MO 众数是一组数据中出现频数最多、频率最高 的变量值,常用 M0 表示。
x
如表3-2中年龄的众数值MO=25。
众数代表的是最常见、最普遍的状况,是对 现象集中趋势的度量。
i 1
n
fi
16% 1600 10% 4750 12% 4000 1211 100% 11.7% 1600 4750 4000 10350
35% 30% 25% 20%
`
15% 10% 5% 0% 90-100
统计学
第三章
第三章 数据分布特征的描述
第一节 统计变量集中趋势的测定
第二节 统计变量离散程度的测定
第三节 变量分布的偏度与峰度
3-2
第一节 统计变量集中趋势的测定
3-11
3.由组距数列计算算术平均数
表3-3
使用寿命 (小时) 1000以下 1000-1200 1200-1400 1400-1600 1600-1800 1800-2000
节能灯泡的使用寿命的分组数据
数量 组中 (f) 值 (x) 2 8 16 35 23 12 900 1100 1300 1500 1700 1900
( X Mo) 3( X Me)
3-27
小结:根据变量类型运用正确的指标 分类数据:众数
一组数据中出现次数最多的变量值 适合于数据量较多时使用 不受极端值的影响 一组数据可能没有众数或有几个众数 主要用于分类数据,也可用于顺序数据和 数值型数据
xG 5 88% 85% 90% 92% 96% 90.31%
3-20
三、众数与中位数
f(x)
(一)众数(Mode) MO 众数是一组数据中出现频数最多、频率最高 的变量值,常用 M0 表示。
x
如表3-2中年龄的众数值MO=25。
众数代表的是最常见、最普遍的状况,是对 现象集中趋势的度量。
i 1
n
fi
16% 1600 10% 4750 12% 4000 1211 100% 11.7% 1600 4750 4000 10350
统计学ppt(全)
概率论—数理统计
概率沦研究起源于17世纪中叶意大利文艺复兴时代,代表人物主要有法国的拉普拉斯和比利时的凯特勒 古典统计时期的概率论基本上是独立发展的,最开始的概率论是从对赌博的研究开始。它与统计学(主要是指政治算术)没有太多的联系 从19世纪中叶到20世纪中叶,概率论的进一步发展为数理统计学的形成和发展奠定了基础。主流从描述性统计学向推断统计学发展 本世纪50年代以后,统计理论、方法和应用进入了一个全面发展的阶段
统计指标体系
由若干个相互联系相互制约的统计指标组成的一个统计指标系统 基本统计指标体系 专题统计指标体系
几种常用的统计软件 (Software)
典型的统计软件 SAS SPSS MINITAB STATISTICA Excel
第一章 绪论
第一节 统计与统计学 第二节 统计学的产生与发展 第三节 统计学的研究对象与方法 第四节 统计学的要素和指标
学习目标
1. 理解统计与统计学的含义 2. 理解统计学的对象和方法 了解统计学的产生与发展过程
第一节 统计与统计学
一. 统计与统计学的含义 二. 统计学的性质和作用
统计数据的内在规律 (一些例子)
正常条件下新生婴儿的性别比为107:100 投掷一枚均匀的硬币,出现正面和反面的频率各为1/2;投掷一枚骰子出现1~6点的频率各为1/6 农作物的产量与施肥量之间存在相关关系
统计学的应用领域
统计学
经济学
管理学
医学
工程学
社会学
…
应用统计的领域
actuarial work (精算) agriculture (农业) animal science (动物学) anthropology (人类学) archaeology (考古学) auditing (审计学) crystallography (晶体学) demography (人口统计学) dentistry (牙医学) ecology (生态学) econometrics (经济计量学) education (教育学) election forecasting and projection (选举预测和策划) engineering (工程) epidemiology (流行病学) finance (金融) fisheries research (水产渔业研究) gambling (赌博) genetics (遗传学) geography (地理学) geology (地质学) historical research (历史研究) human genetics (人类遗传学)
概率沦研究起源于17世纪中叶意大利文艺复兴时代,代表人物主要有法国的拉普拉斯和比利时的凯特勒 古典统计时期的概率论基本上是独立发展的,最开始的概率论是从对赌博的研究开始。它与统计学(主要是指政治算术)没有太多的联系 从19世纪中叶到20世纪中叶,概率论的进一步发展为数理统计学的形成和发展奠定了基础。主流从描述性统计学向推断统计学发展 本世纪50年代以后,统计理论、方法和应用进入了一个全面发展的阶段
统计指标体系
由若干个相互联系相互制约的统计指标组成的一个统计指标系统 基本统计指标体系 专题统计指标体系
几种常用的统计软件 (Software)
典型的统计软件 SAS SPSS MINITAB STATISTICA Excel
第一章 绪论
第一节 统计与统计学 第二节 统计学的产生与发展 第三节 统计学的研究对象与方法 第四节 统计学的要素和指标
学习目标
1. 理解统计与统计学的含义 2. 理解统计学的对象和方法 了解统计学的产生与发展过程
第一节 统计与统计学
一. 统计与统计学的含义 二. 统计学的性质和作用
统计数据的内在规律 (一些例子)
正常条件下新生婴儿的性别比为107:100 投掷一枚均匀的硬币,出现正面和反面的频率各为1/2;投掷一枚骰子出现1~6点的频率各为1/6 农作物的产量与施肥量之间存在相关关系
统计学的应用领域
统计学
经济学
管理学
医学
工程学
社会学
…
应用统计的领域
actuarial work (精算) agriculture (农业) animal science (动物学) anthropology (人类学) archaeology (考古学) auditing (审计学) crystallography (晶体学) demography (人口统计学) dentistry (牙医学) ecology (生态学) econometrics (经济计量学) education (教育学) election forecasting and projection (选举预测和策划) engineering (工程) epidemiology (流行病学) finance (金融) fisheries research (水产渔业研究) gambling (赌博) genetics (遗传学) geography (地理学) geology (地质学) historical research (历史研究) human genetics (人类遗传学)
统计学第三章
2019
151.34
(三)平均发展速度 1、定义 各个时间单位的环比发展速度的序时平均数 2、反映内容: 较长时期内逐期平均发展变化的程度 3、平均发展速度的计算
(1)几何平均法 (2)方程式法
(1)几何平均法(水平法)
基本出发点: 从时间数列的最初发展水平开始,以数列的平均速度去代替各 期的环比发展速度,由此推算出期末理论发展水平与期末实际
《统计学》
中国矿业大学
第三章
下一页
第三章 时间数列
本章内容
引子 第一节 时间数列的基本概念和分类 第二节 时间数列的分析指标 第三节 时间数列分析与预测 小小练习
140000 120000 100000
80000 60000 40000 20000
0
1978—2003年GDP和最终消费(亿元)
an a0 n
首页
(四)平均发展水平 1、概念
社会经济现象各个发展水平的平均,又称序时平 均数或动态平均数。 2、反映内容 现象一定时间内发展变化所达到的一般水平。
3、序时平均数与静态平均数的比较
异同
特点
静态平均数
动态平均数
联系
抽象的反映 内容
一般水平
一般水平
依据的数列
变量数列
时间数列
区别 平均的差异 不同总体单位的
GDP 最终消费
年份 1979 1981 1983 1985 1987 1989 1991 1993 1995 1997 1999 2001
返回本章首页
第一节 时间数列的基本概念和分类
一、时间序列及其用途 二、时间序列的种类 三、时间序列的编制原则
返回本章首页
一、时间序列及其用途
《统计学》完整ppt课件
如销售额、经济增长率等。
.
3. 数据的四个等级 定类数据 也称定名数据,这种数据只对事物的某
种属性和类别进行具体的定性描述。
例如,对人口按性别划分为男性和女性 两类。
定类数据
能够进行的唯一运算是计数,即计算每一 个类型的频数或频率(即比重)。
定序数据,也称序列数据,是对事物所具 有的属性顺序进行描述。
.
(二)数据分类的原则
互斥原则:每一个数据只能划归到某一类型中,而 不能既是这一类,又是那一类 。 穷尽原则:所有被观察的数据都可被归属到适当的 类型中,没有一个数据无从归属。
(三)数据的类型
1. 定性数据和定量数据 定性数据:用文字描述的 。 如在本章的“统计引例”中消费者对永美所提供服 务的总体评价等都属于文字描述的定性数据。
.
定量数据:用数字描述的。
如企业的净资产额、净利润额等。 2. 离散型数据和连续型数据
变量 若我们所研究现象的属性和特征的具体表现在 不同时间、不同空间或不同单位之间可取不同 的数值,则可称这种数据为变量。
离散型变量:数据只能取整数。 类型 如一家公司的职工人数。
连续型变量的数据可以取介于两个数 值之间的任意数值。
(一)普查、抽样、统计报表制度和重点调查
1.普查 特点:工作量大,时间性强,需要大量人力和财力。 任务:搜集重要的国情国力和资源状况的全面资
料,为政府制定规划、方针政策提供依据。
方式:建立专门机构,配备专门人员调查。
利用基层单位原始记录和核算资料进行调查。
也称比率数据,是比定距数据更高一级的 定量数据。它不仅可以进行加减运算,而 且还可以作乘除运算。
如产量、产值、固定资产投资额、居民 货币收入和支出、银行存款余额等。
.
3. 数据的四个等级 定类数据 也称定名数据,这种数据只对事物的某
种属性和类别进行具体的定性描述。
例如,对人口按性别划分为男性和女性 两类。
定类数据
能够进行的唯一运算是计数,即计算每一 个类型的频数或频率(即比重)。
定序数据,也称序列数据,是对事物所具 有的属性顺序进行描述。
.
(二)数据分类的原则
互斥原则:每一个数据只能划归到某一类型中,而 不能既是这一类,又是那一类 。 穷尽原则:所有被观察的数据都可被归属到适当的 类型中,没有一个数据无从归属。
(三)数据的类型
1. 定性数据和定量数据 定性数据:用文字描述的 。 如在本章的“统计引例”中消费者对永美所提供服 务的总体评价等都属于文字描述的定性数据。
.
定量数据:用数字描述的。
如企业的净资产额、净利润额等。 2. 离散型数据和连续型数据
变量 若我们所研究现象的属性和特征的具体表现在 不同时间、不同空间或不同单位之间可取不同 的数值,则可称这种数据为变量。
离散型变量:数据只能取整数。 类型 如一家公司的职工人数。
连续型变量的数据可以取介于两个数 值之间的任意数值。
(一)普查、抽样、统计报表制度和重点调查
1.普查 特点:工作量大,时间性强,需要大量人力和财力。 任务:搜集重要的国情国力和资源状况的全面资
料,为政府制定规划、方针政策提供依据。
方式:建立专门机构,配备专门人员调查。
利用基层单位原始记录和核算资料进行调查。
也称比率数据,是比定距数据更高一级的 定量数据。它不仅可以进行加减运算,而 且还可以作乘除运算。
如产量、产值、固定资产投资额、居民 货币收入和支出、银行存款余额等。
统计学第三章统计数据的整理与显幻灯片PPT
统计学概论
▪ 用Excel进行数据筛选
▪ 8名学生的考试成绩数据
课件
15
中南大学
数据排序
统计学概论
1. 按一定顺序将数据排列,以发现一些明显的特征 或趋势,找到解决问题的线索
2. 排序有助于对数据检查纠错,以及为重新归类或 分组等提供依据
3. 在某些场合,排序本身就是分析的目的之一
4. 排序可借助于计算机完成
课件
17
中南大学
§3.2 分类和顺序数据的整理与显示 统 计 学 概 论
一. 分类数据的整理与显示 二. 顺序数据的整理与显示
课件
18
中南大学
数据整理的几个概念
统计学概论
1. 频数(frequency) :落在各类别中或各组中的 数据个数
2. 频率(比例)(proportion) :某一类(组)别数据 个数占全部数据的比值
频数
比例
百分比 比率
☺☺☺ ☺☺
课件
21
中南大学
分类数据整理—频数分布表 (例题分析)
【例】一家市场调查公司
为研究不同品牌饮料的市场 占有率,对随机抽取的一家 超市进行了调查。调查员在 某 天 对 50 名 顾 客 购 买 饮 料 的品牌进行了记录,如果一 个顾客购买某一品牌的饮料 ,就将这一饮料的品牌名字 记录一次 。右边就是记录 的原始数据
数据整理的步骤: 1.数据的预处理 2.数据的分类和分组 3.编制统计表和统计图 4.统计资料的积累和保管
统计学概论
课件
6
中南大学
§3.1 数据的预处理
一. 数据审核 二. 数据筛选 三. 数据排序
统计学概论
课件
7
中南大学
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
– 简单分组:就是对研究现象按一个标志进行 分组。
– 复合分组:用两个或两个以上标志分组,即 先按一个标志分组,在此基础上再按第二个 标志分小组,又再层叠地按第三个标志分成 更小的组,这称为复合分组。
简单分组和复合分组
例: 某地区2019年底各类工业企业数
按所有制性质分 组
全民所有制企业 集体所有制企业
✓ 下限,上限:组距式分组的每一组变量值中,其最小值为下限, 最大值为上限。
✓ 组距:上下限之间的距离。 ✓ 组限:相邻两组的界限。 ✓ 离散型变量,可间断组距式分组,也可连续组距式分组。连续
型变量,只能采用连续组距式分组。 ✓ “上限在不内”原则:在连续组距式分组中,以同一个数值作
企业数(个) 3204 512 708 1984 1286 286 434 566 152 24 48
比重(%) 64.08 10.24 14.16 39.68 25.72 5.72 8.68 11.32 3.04 0.48 0.96
(接上)
中外合资企业
212
大型
70
中型
74
小型
68
外商独资企业
102
家庭户数 (户) 4 7 2 9 7 11
家庭月平均支出 (元) 1000 1090 1200 1570 1660 1690
三、统计分组的种类
种类
按分组标志性质分 按分组标志个数分 按任务和作用不同
品质分组 变量分组 简单分组 复合分组
类型分组 结构分组 分析分组
1、按分组标志的多少,可分为简单分组和 复合分组。
☺~ ☺
• 适合于连续变量。如身高。 ☺ ~ ☺
• 可采用等距分组,也可采用 ☺ ~ ☺
不等距分组
2、间断组距式分组和连续组距 式分组
• 间断组距式分组:组限不相连的组距式分组。 如儿童按年龄分组。
• 连续组距式分组:组限相连(或称相重叠的), 即以同一数值作为相邻两组的共同界限的组距 式分组。 如学生按成绩分组。
私营企业 中外合资企业 外商独资企业
其他企业 合计
企业数 (个)
比重(%)
3204
64.08
1286
25.721523.来自42124.24
102
2.04
44
0.88
5000
100.00
例: 某班学生分组表
按性别分 男 女
按考试成绩分 组(分) 60分以下 60~70分 70~80分 80~90分 90分以上
或者说各分组的空间足以容纳总体所有的单位。
✓互斥原则:在特定的分组标志下,总体中的任何
一个单位的只能归属于某一组,而不能同时或可能 归属于几个组。
二、统计分组的意义
1、划分现象类型
例:按所有制性质划分,我国工业企业可分为: 国有企业;集体企业;个体企业;合资企业; 外资企业。
2、研究总体结构
例:某市按GDP计算的三次产业结构(%) 1990年 2000年 2019年 2009年
– 分析分组:为研究现象之间依存关系而进行 的统计分组即分析分组。
四、统计分组方法
(一)品质分组的方法 (二)变量分组的方法
(一)品质分组的方法
品质分组一般较简单,分组标志一旦确 定,组数、组名、组与组之间的界限也就 确定。但也有较难的情况,需经专门的研 究才能确定。有些复杂的品质标志分组可 根据统一规定的划分标准和分类目录进行。
其性质和特点,划分为若干类;汇总,加总 计算形成各项统计指标。统计分组和统计指 标是整理的中心工作。 – 3)编制统计表或绘制统计图。 – 4)统计资料的积累、保管和公布。
第二节 统计分组
分组前
分组后
25% 33% 42%
一、统计分组的概念和原则
1、概念 2、原则
✓穷尽原则:使总体中的每一个单位都应有组可归,
人数 60 40 人数
5 30 35 20 10
例: 某班学生分组表
按性别、考分分组
男
60分以下 60~70分 70~80分 80~90分 90分以上
女
60分以下 60~70分 70~80分
人数
60
3 20 22 11 4
40
2 10 13
例: 某地区2019年底各类工业企业及规模构成情况
按所有制性质及规模分组 全民所有制企业 大型 中型 小型 集体所有制企业 大型 中型 小型 私营企业 大型 中型
大型
28
中型
36
小型
38
其他类型企业
44
大型
6
中型
10
小型
28
4.24 1.40 1.48 1.36 2.04 0.56 0.72 0.76 0.88 0.12 0.20 0.56
2、按分组的标志的性质不同,分为品质分 组(或称属性分组)和数量分组(或称 变量分组)。
– 品质分组:按品质(或属性)标志进行分组。 品质分组所形成的数列称为品质数列。
GDP 100
100
100
100
第一产 3.2
4.3
2.5
2.3
业
第二产 75.7 63.8 54.5 52.2 业
第三产 21.1 31.9 43.0 45.5 业
3、研究现象之间的依存关系
例 40户居民家庭按月收入分组
家庭月收入 (元)
1600以下 1600-1700 1700-1800 1800-1900 1900-2000 2000以上
– 数量分组:按数量标志分组,数量标志的变 异性体现在它不断变动自身的数量上,故也 称为变量分组。变量分组所形成的数列称为 变量数列。
3、按分组的作用和任务不同,分为类 型分组、结构分组和分析分组。
– 类型分组:把复杂的现象总体,划分为若干 个不同性质的部分,就是类型分组。
– 结构分组:在对总体分组的基础上计算出各 组对总体的比重,借此研究总体各部分的结 构,即结构分组。
第一节 统计整理的意义和方法
• 一、统计整理的意义 • 二、统计整理的内容与程序
一、统计整理的意义
统计整理是统计工作的中间环节,是 统计调查的继续和发展,是统计分析的前 提和条件,在整个统计工作过程中起承上 启下的作用。
二、统计整理的内容与程序
1、统计数据整理的内容 2、数据整理的程序
– 1)统计资料的审核。 – 2)资料的分组和汇总。分组,即对资料按
(二)变量分组的方法
变量分组方 法
单项式分组
组距式分组
等距分组 不等距分组
1、单项式分组与组距式分组
单项式分组
• 将一个变量值作为一组
☺
• 适合于对变量值较少的离 散变量的分组
☺
• 举例:居民家庭按儿童数
☺
或人口数分组
☺
组距式分组
• 将变量值的一个区间作为一 ☺ ~ ☺
组
☺~ ☺
•
适合于变量值变动大、项数 又较多的离散变量。如分数。
– 复合分组:用两个或两个以上标志分组,即 先按一个标志分组,在此基础上再按第二个 标志分小组,又再层叠地按第三个标志分成 更小的组,这称为复合分组。
简单分组和复合分组
例: 某地区2019年底各类工业企业数
按所有制性质分 组
全民所有制企业 集体所有制企业
✓ 下限,上限:组距式分组的每一组变量值中,其最小值为下限, 最大值为上限。
✓ 组距:上下限之间的距离。 ✓ 组限:相邻两组的界限。 ✓ 离散型变量,可间断组距式分组,也可连续组距式分组。连续
型变量,只能采用连续组距式分组。 ✓ “上限在不内”原则:在连续组距式分组中,以同一个数值作
企业数(个) 3204 512 708 1984 1286 286 434 566 152 24 48
比重(%) 64.08 10.24 14.16 39.68 25.72 5.72 8.68 11.32 3.04 0.48 0.96
(接上)
中外合资企业
212
大型
70
中型
74
小型
68
外商独资企业
102
家庭户数 (户) 4 7 2 9 7 11
家庭月平均支出 (元) 1000 1090 1200 1570 1660 1690
三、统计分组的种类
种类
按分组标志性质分 按分组标志个数分 按任务和作用不同
品质分组 变量分组 简单分组 复合分组
类型分组 结构分组 分析分组
1、按分组标志的多少,可分为简单分组和 复合分组。
☺~ ☺
• 适合于连续变量。如身高。 ☺ ~ ☺
• 可采用等距分组,也可采用 ☺ ~ ☺
不等距分组
2、间断组距式分组和连续组距 式分组
• 间断组距式分组:组限不相连的组距式分组。 如儿童按年龄分组。
• 连续组距式分组:组限相连(或称相重叠的), 即以同一数值作为相邻两组的共同界限的组距 式分组。 如学生按成绩分组。
私营企业 中外合资企业 外商独资企业
其他企业 合计
企业数 (个)
比重(%)
3204
64.08
1286
25.721523.来自42124.24
102
2.04
44
0.88
5000
100.00
例: 某班学生分组表
按性别分 男 女
按考试成绩分 组(分) 60分以下 60~70分 70~80分 80~90分 90分以上
或者说各分组的空间足以容纳总体所有的单位。
✓互斥原则:在特定的分组标志下,总体中的任何
一个单位的只能归属于某一组,而不能同时或可能 归属于几个组。
二、统计分组的意义
1、划分现象类型
例:按所有制性质划分,我国工业企业可分为: 国有企业;集体企业;个体企业;合资企业; 外资企业。
2、研究总体结构
例:某市按GDP计算的三次产业结构(%) 1990年 2000年 2019年 2009年
– 分析分组:为研究现象之间依存关系而进行 的统计分组即分析分组。
四、统计分组方法
(一)品质分组的方法 (二)变量分组的方法
(一)品质分组的方法
品质分组一般较简单,分组标志一旦确 定,组数、组名、组与组之间的界限也就 确定。但也有较难的情况,需经专门的研 究才能确定。有些复杂的品质标志分组可 根据统一规定的划分标准和分类目录进行。
其性质和特点,划分为若干类;汇总,加总 计算形成各项统计指标。统计分组和统计指 标是整理的中心工作。 – 3)编制统计表或绘制统计图。 – 4)统计资料的积累、保管和公布。
第二节 统计分组
分组前
分组后
25% 33% 42%
一、统计分组的概念和原则
1、概念 2、原则
✓穷尽原则:使总体中的每一个单位都应有组可归,
人数 60 40 人数
5 30 35 20 10
例: 某班学生分组表
按性别、考分分组
男
60分以下 60~70分 70~80分 80~90分 90分以上
女
60分以下 60~70分 70~80分
人数
60
3 20 22 11 4
40
2 10 13
例: 某地区2019年底各类工业企业及规模构成情况
按所有制性质及规模分组 全民所有制企业 大型 中型 小型 集体所有制企业 大型 中型 小型 私营企业 大型 中型
大型
28
中型
36
小型
38
其他类型企业
44
大型
6
中型
10
小型
28
4.24 1.40 1.48 1.36 2.04 0.56 0.72 0.76 0.88 0.12 0.20 0.56
2、按分组的标志的性质不同,分为品质分 组(或称属性分组)和数量分组(或称 变量分组)。
– 品质分组:按品质(或属性)标志进行分组。 品质分组所形成的数列称为品质数列。
GDP 100
100
100
100
第一产 3.2
4.3
2.5
2.3
业
第二产 75.7 63.8 54.5 52.2 业
第三产 21.1 31.9 43.0 45.5 业
3、研究现象之间的依存关系
例 40户居民家庭按月收入分组
家庭月收入 (元)
1600以下 1600-1700 1700-1800 1800-1900 1900-2000 2000以上
– 数量分组:按数量标志分组,数量标志的变 异性体现在它不断变动自身的数量上,故也 称为变量分组。变量分组所形成的数列称为 变量数列。
3、按分组的作用和任务不同,分为类 型分组、结构分组和分析分组。
– 类型分组:把复杂的现象总体,划分为若干 个不同性质的部分,就是类型分组。
– 结构分组:在对总体分组的基础上计算出各 组对总体的比重,借此研究总体各部分的结 构,即结构分组。
第一节 统计整理的意义和方法
• 一、统计整理的意义 • 二、统计整理的内容与程序
一、统计整理的意义
统计整理是统计工作的中间环节,是 统计调查的继续和发展,是统计分析的前 提和条件,在整个统计工作过程中起承上 启下的作用。
二、统计整理的内容与程序
1、统计数据整理的内容 2、数据整理的程序
– 1)统计资料的审核。 – 2)资料的分组和汇总。分组,即对资料按
(二)变量分组的方法
变量分组方 法
单项式分组
组距式分组
等距分组 不等距分组
1、单项式分组与组距式分组
单项式分组
• 将一个变量值作为一组
☺
• 适合于对变量值较少的离 散变量的分组
☺
• 举例:居民家庭按儿童数
☺
或人口数分组
☺
组距式分组
• 将变量值的一个区间作为一 ☺ ~ ☺
组
☺~ ☺
•
适合于变量值变动大、项数 又较多的离散变量。如分数。