统计原理演示文稿2(15)
合集下载
统计ppt
全随机设计、随机区组设计、拉丁方设计等。
实验误差控制
03
采取措施控制实验误差,如匹配、随机化、标准化等,确保实
验结果的准确性和可靠性。
03
统计应用领域
社会科学领域
经济学
运用统计方法研究经济现象,如GDP、CPI、就 业率等指标,以评估经济运行情况。
社会学
通过数据分析和调查研究,研究社会现象和问题 ,如人口普查、婚姻与家庭、犯罪率等。
统计的主要特点包括:以数据为基础、具有科学性和客观性 、服务于决策和政策制定。
统计发展历程
统计学的起源可以追溯到古代,但 真正意义上的科学统计是在17世纪 中叶由英国学者G.R.卡恩和德国学 者G.辛普森提出的。
VS
现代统计学的发展经历了三个阶段 :描述统计学、推断统计学和现代 统计学。描述统计学主要关注数据 的收集、整理、分析和解释;推断 统计学则引入了概率论和数理统计 学的原理;现代统计学则更加注重 对数据的深入挖掘和分析,以解决 实际问题。
假设检验
根据一定的假设条件,利用样本信 息,对总体进行假设检验。
方差分析
分析多个样本间的均值差异,判断 是否存在显著性差异。
相关与回归分析
研究变量间的相关关系和回归关系 ,揭示其变化规律。
实验设计
实验设计原则
01
遵循随机、对照、重复等原则,确保实验结果的准确性和可靠
性。
实验设计方案
02
根据研究目的和实际情况,选择合适的实验设计方案,包括完
统计图表的制作
选择图表类型
根据数据特点和展示需求,选择合适的图 表类型,如柱状图、折线图、饼图等。
创建图表
在PPT中创建图表,并将数据添加到图表中 。
统计图表 演示文稿
例2: 2001年上海市居民支出构成情况如表所示: 食品 衣着 家庭 设备 用品 6.2% 医疗 保健 7.0% 交通 和信 息 10.7% 教育 文化 服务 15.9% 居住 杂项 商品 3.5%
39.4% 5.9%
Байду номын сангаас
11.4%
请分别用折线图和扇形图表示以上数据。(链接)
练习2: 如图是某市2013年4月1日至4月7日每天最高、最 低气温的折线统计图,在这7天中,日温差最大 的是哪一天?
六年级
30% 26%
24%
七年级
八年级
九年级
课堂小节: 条形图:适合数据量大的情况,能直观地反映数据的 分布情况,清晰地表示各区间的具体频数,但会损失 数据的部分信息。 茎叶图:不适合数据量大的情况,能在不损失数据信 息的情况下动态地反映数据的分布情况。 扇形图:直观地反映各种情况所占的比例,但看不出 具体数据的多少。 折线图:能动态地表现出数据的变化趋势,但不能反 映数据的分布情况。 作业:全程设计P76
统计图表
芦溪中学 王凤
新课引入: 前面我们已经学习了收集数据的一些方 法。一旦数据被收集后,我们总希望从中找 出所需要的信息。 统计图表就是表达和分析数据的重要工 具,它不仅可以帮助我们从数据中获取有用 的信息,还可以帮助我们直观,准确地理解 相应的结果。 这节课我们将结合一些案例进一步对四 种统计图表的特点和选用加以具体分析。
例 1: 有关部门从甲、乙两个城市所有的自动售货机中分别随机抽 取了16台,记录下上午8:00到位11:00各自的销售情况 (单位:元): 甲:18 8 10 43 5 30 10 22 6 27 25 58 14 18 30 41 乙:22 31 32 42 20 27 48 23 38 43 12 34 18 10 34 23 请分别对这两组数据绘制条形统计图 还可以用别的方式来表达这些数据信息吗?
统计学2章PPT课件
a
1
一、统计调查的含义和要求
1、含义
统计调查是根据统计任务的要求,运用 科学的调查方法,有计划、有组织的向 社会搜集统计资料的过程。
2、要求
准确性和及时性
a
2
全面调查和非全面调查 连续调查和不连续调查 直接调查法、报告法和采访法
a
3
1、确定调查目的和任务 2、确定调查对象、调查单位、调查范
优点:经济性好、实效性强、适应面广、 准确性高。
特点:随机性、部分推断总体、误差可 以事先计算并加以控制。
a
6
从总体中抽取出来作为代表这一总体 的部分单位组成的集合体称总体外部的 单位参加
➢ 从一个总体中可以抽取许多个样本 ➢ 代表性与客观性
a
9
重点调查是在调查对象的全部单 位中,选择一部分重点单位进行 调查。
典型调查是从调查对象中有意识 地选择若干具有代表性的单位进 行调查的一种统计调查方法。
a
10
一、统计误差的种类及产生的原因
统计误差可分为登记性误差和代表 性误差两种。
登记性误差又可分为偶然性误差和 系统性误差。
二、统计资料审核的方法(略)
a
7
抽样框是指对可以选择作为样 本的总体单位列出的名册或排 序编号,以确定总体的抽样范 围和结构。
设计好抽样框后,便可采用抽 签的方式或按随机数表来抽选 必要的单位数。
a
8
统计报表是按照统计机构规定的 统一表式、统一指标内容、统一 报送程序和报送时间,由填报单 位自下而上逐级提供统计资料的 一种统计调查方法。
a
11
1. 什么是统计调查?它在整个统计研究中占有什么地位? 2. 简述普查的概念和特点。 3. 什么是抽样调查?它有哪些特点? 4. 统计调查方案主要包括哪些内容? 5. 调查时间和调查时限的区别是什么?
1
一、统计调查的含义和要求
1、含义
统计调查是根据统计任务的要求,运用 科学的调查方法,有计划、有组织的向 社会搜集统计资料的过程。
2、要求
准确性和及时性
a
2
全面调查和非全面调查 连续调查和不连续调查 直接调查法、报告法和采访法
a
3
1、确定调查目的和任务 2、确定调查对象、调查单位、调查范
优点:经济性好、实效性强、适应面广、 准确性高。
特点:随机性、部分推断总体、误差可 以事先计算并加以控制。
a
6
从总体中抽取出来作为代表这一总体 的部分单位组成的集合体称总体外部的 单位参加
➢ 从一个总体中可以抽取许多个样本 ➢ 代表性与客观性
a
9
重点调查是在调查对象的全部单 位中,选择一部分重点单位进行 调查。
典型调查是从调查对象中有意识 地选择若干具有代表性的单位进 行调查的一种统计调查方法。
a
10
一、统计误差的种类及产生的原因
统计误差可分为登记性误差和代表 性误差两种。
登记性误差又可分为偶然性误差和 系统性误差。
二、统计资料审核的方法(略)
a
7
抽样框是指对可以选择作为样 本的总体单位列出的名册或排 序编号,以确定总体的抽样范 围和结构。
设计好抽样框后,便可采用抽 签的方式或按随机数表来抽选 必要的单位数。
a
8
统计报表是按照统计机构规定的 统一表式、统一指标内容、统一 报送程序和报送时间,由填报单 位自下而上逐级提供统计资料的 一种统计调查方法。
a
11
1. 什么是统计调查?它在整个统计研究中占有什么地位? 2. 简述普查的概念和特点。 3. 什么是抽样调查?它有哪些特点? 4. 统计调查方案主要包括哪些内容? 5. 调查时间和调查时限的区别是什么?
统计学讲稿演示文稿PPT课件
n1=n2
C σ21、σ22未知、且σ21≠σ22、 n1≠n2
第50页/共67页
(二)两个总体均值之差的估计:匹 配样本
(1)大样本
(2)小样本
第51页/共67页
二 两个总体比率之差的区间估计
第52页/共67页
第四节 样本容量的确定
第53页/共67页
一 估计总体均值时样本容量的确定 二 估计总体比率时样本容量的确定
1 正态分布 2 非正态分布 (1)大样本 (2)小样本
第31页/共67页
三 样本均值抽样分布的特征 1 均值 2 方差 (1)重复抽样时 (2)不重复抽样时
第32页/共67页
四 样本比率的抽样分布 1 比率
2 样本比率的抽样分布 (1)均值 (2)方差
重复抽样时 不重复抽样时
第33页/共67页
变量:P10
(变量值)
三
样本:P10
第2页/共67页
第五节 统计学与其它学科的关系
一 统计学与数学的关系 1 联系 2 区别
二 统计学与其它学科的关 系
第3页/共67页
第二章 统计数据的描述
第一节 数据的计量尺度 一 数据的计量尺度 1 列名尺度(定类尺度):P17 2 顺序尺度(定序尺度):P17 3 间隔尺度(定距尺度):P17
第20页/共67页
第七节 分布偏态与峰度的测度
一 偏态及其测度 1 比较法(皮尔逊偏度)
2 动差法 二 峰度及其测度
第21页/共67页
第八节 茎叶图与箱线图
第22页/共67页
第九节 统计表与统计图
第23页/共67页
第四章 抽样与抽样分布
样本统计量 参数
抽样调查
第24页/共67页
C σ21、σ22未知、且σ21≠σ22、 n1≠n2
第50页/共67页
(二)两个总体均值之差的估计:匹 配样本
(1)大样本
(2)小样本
第51页/共67页
二 两个总体比率之差的区间估计
第52页/共67页
第四节 样本容量的确定
第53页/共67页
一 估计总体均值时样本容量的确定 二 估计总体比率时样本容量的确定
1 正态分布 2 非正态分布 (1)大样本 (2)小样本
第31页/共67页
三 样本均值抽样分布的特征 1 均值 2 方差 (1)重复抽样时 (2)不重复抽样时
第32页/共67页
四 样本比率的抽样分布 1 比率
2 样本比率的抽样分布 (1)均值 (2)方差
重复抽样时 不重复抽样时
第33页/共67页
变量:P10
(变量值)
三
样本:P10
第2页/共67页
第五节 统计学与其它学科的关系
一 统计学与数学的关系 1 联系 2 区别
二 统计学与其它学科的关 系
第3页/共67页
第二章 统计数据的描述
第一节 数据的计量尺度 一 数据的计量尺度 1 列名尺度(定类尺度):P17 2 顺序尺度(定序尺度):P17 3 间隔尺度(定距尺度):P17
第20页/共67页
第七节 分布偏态与峰度的测度
一 偏态及其测度 1 比较法(皮尔逊偏度)
2 动差法 二 峰度及其测度
第21页/共67页
第八节 茎叶图与箱线图
第22页/共67页
第九节 统计表与统计图
第23页/共67页
第四章 抽样与抽样分布
样本统计量 参数
抽样调查
第24页/共67页
统计基础第二章PPT演示文稿
16
房地产开发经营情况表
指标名称
甲
一、实收资本合计 其中:国家资本
二、年末资产负债情况 资产总计 固定资产累计折旧 其中:本年折旧 负债总计 所有者权益合计
三、损益情况 1.经营收入总计 (1)土地转让收入 (2)商品房屋销售收入 其中:销售给个人 其中:商品住宅销售收入
代码
乙
201 230
202 203 204 205 206
统计调查
按对象涉及范围分
按调查登记时间分
按调查组织形式分
按搜集资料方法分
全面调查
非全面调查
经常性调查
一次性调查
统计报表
专门调查
文献调查法
访谈调查法
观察调查
法
实验调查法
5
(一)统计调查按范围划分
全面调查
全面调查是对调 查对象中的所有 单位无一例外地
进行一一调查。
非全面调查
1月15日∽1月16日 修改最初设计、印刷
1月17日∽1月20日 挑选和培训调查员
1月21日∽1月26日 调查实施
1月27日∽1月28日 复查、核实情况、查漏补缺
1月29日∽1月30日 上报调查结果
25.10.2020
备注
20
统计调查方案中还需要对调查所采用的方式 方法及汇总方法加以规定,一般来说,选择 什么方式方法进行调查,要取决于调查对象 的特点、调查范围的宽广、调查期限的长短、 调查任务的大小、调查经费的多少、调查资 料的要求等因素。
18
25.10.2020
三、制定调查组 织实施计划
调查工作完成的期限及工 作的进度
确定调查的方式方法 调查前的其他准备工作
19
(一)调查工作完成的期限及工作的进度
房地产开发经营情况表
指标名称
甲
一、实收资本合计 其中:国家资本
二、年末资产负债情况 资产总计 固定资产累计折旧 其中:本年折旧 负债总计 所有者权益合计
三、损益情况 1.经营收入总计 (1)土地转让收入 (2)商品房屋销售收入 其中:销售给个人 其中:商品住宅销售收入
代码
乙
201 230
202 203 204 205 206
统计调查
按对象涉及范围分
按调查登记时间分
按调查组织形式分
按搜集资料方法分
全面调查
非全面调查
经常性调查
一次性调查
统计报表
专门调查
文献调查法
访谈调查法
观察调查
法
实验调查法
5
(一)统计调查按范围划分
全面调查
全面调查是对调 查对象中的所有 单位无一例外地
进行一一调查。
非全面调查
1月15日∽1月16日 修改最初设计、印刷
1月17日∽1月20日 挑选和培训调查员
1月21日∽1月26日 调查实施
1月27日∽1月28日 复查、核实情况、查漏补缺
1月29日∽1月30日 上报调查结果
25.10.2020
备注
20
统计调查方案中还需要对调查所采用的方式 方法及汇总方法加以规定,一般来说,选择 什么方式方法进行调查,要取决于调查对象 的特点、调查范围的宽广、调查期限的长短、 调查任务的大小、调查经费的多少、调查资 料的要求等因素。
18
25.10.2020
三、制定调查组 织实施计划
调查工作完成的期限及工 作的进度
确定调查的方式方法 调查前的其他准备工作
19
(一)调查工作完成的期限及工作的进度
《统计的基本概念》课件
推断统计分析
利用概率和统计方法,根据样本数据对总体进行推断和判断,得出结论。
3
数据解释和应用
将统计分析的结果进行解释和应用,为决策提供依据和支持。
统计学的应用领域
科学研究
统计学在自然科学、社会科学等多个学科领域中发挥着重要的作用,帮助研究者分析和解释 数据,并得出科学结论。
经济分析
统计学在经济学中的应用广泛,可以用来分析生产、消费、投资等经济现象,研究经济关系 和趋势。
市场调查
统计学是市场调查的重要工具,通过收集、分析和解释数据,帮助企业了解市场需求和消费 者行为,制定营销策略。
《统计的基本概念》PPT 课件
统计学是研究数据的收集、分析和解释的科学。
统计学的定义
统计学是一门研究收集、整理、分析和解释数据的科学,通过统计学可以对数据进行量化和描述,从而揭示事 物之间的关系和规律。
统计学的发展历史
1
古代统计学
古代统计学的起源可以追溯到古希腊和古罗马时期,人们通过调查和统计确定国 家的人口、土地产量和财富分布。
2
现代统计学
现代统计学起源于18世纪末19世纪初,随着概率论的发展和统计方法的完善, 统计学逐渐成为一门独立的学科。
3
应用统计学
20世纪以来,应用统计学的发展快速,广泛应用于科学研究、经济分析、市场 调查、医学研究等领域。
统计学的基本概念
总体和样本
总体是指研究对象的全部个体或事物,样本是从总体中选取的一部分,用以进行统计研究。
数据收集方法
调查问卷
通过向受访者提出问题,收集他 们的观点和意见,以获取数据。
观察法
直接观察并记录对象的行为、状 态和特征,以获取数据。
实验法
统计基础知识含动画培训ppt
典型调查:对具有代表性的 单位或个人进行调查,以获 取典型数据
科学实验:通过科学实验的 方式获取数据,如医学、化 学等领域的数据收集
调查问卷 访谈 观察法 实验法
分类整理:按照不同的分类标准对 数据进行整理,如按照时间、地点、 性质等进行分类。
图表整理:将数据以图表的形式进 行整理,更加直观地展示数据之间 的关系和趋势。
统计实践活动的 目的和意义
统计实践活动的 组织和实施过程
统计实践活动的 成果和收获
统计实践活动的 不足和改进方向
政府统计:用于国 家管理和决策,包 括经济、社会、人 口等方面
企业统计:用于企 业管理和决策,包 括市场、销售、生 产等方面
学术研究:用于学 术研究和探索,包 括社会科学、自然 科学、医学等方面
其他领域:如金融 、保险、咨询等也 需要运用统计学知 识进行分析和决策
统计报表:通过定期填报 的统计报表收集数据
统计是认识社会经济现象数量方面的重要工具 单击此处输入你的正文,请阐述观点
统计是认识社会经济现象的重要手段 单击此处输入你的正文,请阐述观点
统计是监测和预警的重要工具 单击此处输入你的正文,请阐述观点
描述统计学:研究如何收集、整理、分析和解释数据的科学 推断统计学:研究如何根据样本信息推断总体特征的学问 理论统计学:研究统计学的基本理论和方法 应用统计学:将统计方法应用于各个领域的实践
普查:对特定对象进行全 面调查
抽样调查:从总体中抽取 部分样本进行调查
其他来源:如互联网、数 据库等
统计报表:通过定期填报统 计报表的方式收集数据
普查:对全部研究对象进行 调查,以获取全面、准确的 数据
抽样调查:从总体中抽取一 部分样本进行调查,以推断 总体情况
统计学原理经典ppt课件说课讲解
二、统计学的研究对象和研究方法
(一)统计包含三种涵义,两重关系
1、统计工作:调查研究。资料收集、整理和分析。
2、统计资料:工作成果。包括统计数据和分析报告。
3、统计学:研究如何搜集、整理、分析数据资料的一
门方法论科学。
统计工作 统计资料
工作与工作成果关系
实践与理 论关系
统 计学
(二)统计学的研究对象
4、变量和变量值 变量 可变的数量标志和统计指标。
分类
确定性变量 随机性变量 离散性变量
连续性变量
变量值:即变量的具体数值,包括标志值和指标数值
社会经济现象中许多变量,既受确定性因素影响,又 受随机性因素影响。要根据具体情况加以认定。
5、样本 是从总体中随机抽取部分单位所构成的集合 体。 特点 必须取自所要研究的总体;
频数分布 统计表
统计图
分组
25% 33%
42%
分组前
分组后
作用:1·划分现象类型
例:按所有制性质划分,我国现有8种经济类型:
国有经济;集体经济;私营经济;个体经济 联营经济;股份制经济;外商投资经济;港 澳台投资经济
2·研究总体结构
例:上海市按GDP计算的三次产业结构(%)
1980年 1990年 1996年 1997年
查
误 差
代表性误差
编差
实际误差
随机误差 抽样平均误差
统计推断中的抽样误差就是抽样平均误差。它是处 于调查所固有的,是对抽样推断精确度的量度。
样本容量
抽样方式
总 体 内 部 差 异
抽样调查的组织方式:
1·简单随机抽样(纯随机抽样)
•方法:将总体单位编成抽样框,而后用抽签或 随机数表抽取样本单位。
(一)统计包含三种涵义,两重关系
1、统计工作:调查研究。资料收集、整理和分析。
2、统计资料:工作成果。包括统计数据和分析报告。
3、统计学:研究如何搜集、整理、分析数据资料的一
门方法论科学。
统计工作 统计资料
工作与工作成果关系
实践与理 论关系
统 计学
(二)统计学的研究对象
4、变量和变量值 变量 可变的数量标志和统计指标。
分类
确定性变量 随机性变量 离散性变量
连续性变量
变量值:即变量的具体数值,包括标志值和指标数值
社会经济现象中许多变量,既受确定性因素影响,又 受随机性因素影响。要根据具体情况加以认定。
5、样本 是从总体中随机抽取部分单位所构成的集合 体。 特点 必须取自所要研究的总体;
频数分布 统计表
统计图
分组
25% 33%
42%
分组前
分组后
作用:1·划分现象类型
例:按所有制性质划分,我国现有8种经济类型:
国有经济;集体经济;私营经济;个体经济 联营经济;股份制经济;外商投资经济;港 澳台投资经济
2·研究总体结构
例:上海市按GDP计算的三次产业结构(%)
1980年 1990年 1996年 1997年
查
误 差
代表性误差
编差
实际误差
随机误差 抽样平均误差
统计推断中的抽样误差就是抽样平均误差。它是处 于调查所固有的,是对抽样推断精确度的量度。
样本容量
抽样方式
总 体 内 部 差 异
抽样调查的组织方式:
1·简单随机抽样(纯随机抽样)
•方法:将总体单位编成抽样框,而后用抽签或 随机数表抽取样本单位。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
40
例5:己知某单位职工工龄频数分布资料 如下 : 工龄X 人数f 3 试计算该单 3 5 位 职工工龄 4 6 的中位数. 5 50 6 15 8 10 10 5 12 4 15
合 计
98
41
2.组距式数列计算 中位数.
※
42
计算公式: Me=中位数组下限 +(中位数组组距÷中 位数组频数)×应包 括项数
43
i N Me= L S m 1 fm 2
其中L—中位数组下限, fm—中位数组频数,i—中 位数组组距,N—总体单位 数,Sm-1—低于中位数组各 组的频数和.
44
例6:已知某单位职工工资资料如下: 按月工资分组(元) 按月工分组(元) 频数(人) 7 500以下 500~800 10 800~1100 20 1100~1400 8 5 14 00以上 50 合 计 试计算该单位职工工资的中位数.
n
X
31
c.加权算术平均数
X 1 f1 X 2 f 2 X k f k X ˆ f1 f 2 f k
k—组数
f
Xf
32
例1:某种商品按每公 斤1.50元和1.80元分 别售出600公斤,800 公斤,求平均价格.
33
例2:己知某单位职工工龄频数分布资料 如下 : 工龄X 人数f 3 试计算该单 3 5 位 职工平均 4 6 工龄. 5 50 6 15 8 10 10 5 12 4 15
80
常用的变异指标有: 极差,四分位差,方差, 标准差, 变异系数.
81
作用:能反映变量值的 均匀程度.变异指标小 的数据均匀整齐, 变异 指标大的数据分散程 度大﹑高低差大.
82
3.3.1极差和四分位差
83
一.极差 R=最大值-最小值 =最大组上限-最小组下限
84
二. 四分位差 定义:先把数据从小到大排队, 排在第1/4位置和第3/4 位置上 的数称为四分位数。 四分位差=的图像显示
20
a. 频数分布直方图 用一组矩形的组合 图形表示频数分布,用横 轴表示变量值,纵轴表示 频数或频率,一个组一个 矩形.
21
设等距分k组,记第i组的下 限,上限,频数分别为 Li,Ui,ni,i=1,2,…,k,则表示 第i组矩形的四个顶点为 (Li ,0),(Ui,0),(Li,n i),(Ui,n i)
架数
499
852
982
1386 1961 2179
(架)
58
2.二要素 (1)现象所属时间; (2) 现象在各个时间 的指标数值.
59
3.分类
60
绝对数时间数列 时间数列 相对数时间数列 平均数时间数列
时期数列 时点数列
61
时期数列与时点数列 的区别: ⑴是否具有可加性; ⑵时间间隔长短; ⑶一个累计得到,一个 按期登记得到.
85
若数据的个数为n,则上、 下四分位数是排在(n+1)/4 位置上的对应的数, 和排在 3(n+1)/4位置上的对应的 数。
86
三. 方差 ⑴简单形式
2
2
X X X X X X X X
n 2 2 i 1 2 n i 1
2
36
权数问题: 算术平均数的大小不 仅取决于变量值的水 平,还取决于变量值出 现次数的大小.
37
3.2.2中位数(Me) 1. 概念.大小处在正中 间的标志值称为中位数.
38
注:奇数项正中间有一 项;偶数项正中间有二 项,应取它们的平均.
39
例4:某班6名学生的统 计学考试成绩分别是: 75,81,53,61,49,66分,求 考试成绩的中位数
⑵ 加权形式
2
n
n
X
1
X f1 X 2 X f 2 X k X f k f1 f 2 f k
87
2
2
2
计算公式: X X
2 2
2
n 1 2 2 其中 X n X i i 1 k
或
2 X
X
i 1 k i 1
试求该单位这一年第1季度 平均职工人数.
74
B. 不等间隔间断时点 数列
a3 a 4 an 1 an a1 a2 f1 f2 f n 1 2 2 2 a f1 f 2 f n 1
其中f—时间间隔长度.
75
例. 某单位某年职工人数资料 如表:
日期 职工人 数 (人 ) 上年12 2月28日 5月31日 9月30日 12月31日 月31曰 743 812 864 826 848
45
注:中位数不受极端值 的影响.
46
3.2.3众数(Mo)
47
1. 概念: 次数出现最多的 标志值称为众数.
48
※2.
组距式数列计算 众数.
49
计算公式:
其中, 其中L—众数组下限, f0—众数组频数,i—众数组 组距,f-1=低于众数组且相邻 组的频数, f+1=高于众数组且 相邻组的频数.
62
二. 时间数列的水平 指标
63
常用的有: 发展水平,平均发 展水平,增长量,平均 增长量 .
64
1. 发展水平 发展水平:时间数列中 各项指标数值.
65
根据发展水平在时间数 列中所处的位置,通常称第1 个指标值为最初水平;最后1 个指标值为最末水平;其余 各个指标值为中间水平;考 察那个时期指标值为报告 期水平; 用来比较那个时期 的指标值为基期水平.
第三章统计数据特 征的分析
1
§3.1总体分布的描述
2
3.1.1. 分布的列表和图形 显示
3
一.频数分布的列表显示
4
1. 频数分布的概念:根据一 定的标志分组,说明总体单 位在各组分配情况的统计 数列.也称分布数列.
5
频数:每组的个体数,称 为该组的频数.也称次 数. 频率:每组频数与总体 单位数之比称为该组的 频率或比率.
53
均值 中位数 众数
均值=中位 数=众数
众数 中位数
均值
左偏分布
对称分布
右偏分布
54
3.2.4与时间有关数据 的平均
55
一. 时间序列概念
56
1.概念: 按时间次序排列 的数据序列.也称动态 数列或时间数列.
57
我国民用飞机架数
年份
1990 1995 2000 2005 2008 2009
71
b. 时点数列 ①连续时点数列
a
i 1
n
ai
72
n
② 间断时点数列 A. 等间隔间断时点数 列
an a1 a2 an 1 2 2 a n 1
73
例. 某单位某年职工人数资 料如表:
日期 职工人 数 (人 ) 1月1曰 2月1日 3月1日 4月1日 240 270 280 280
66
设各指标值依次为 a0,a1,…,an.其中 a0—最初水平; an—最末水平; a1,…,an-1—中间水平.
67
我国外贸进出口总额资料如下:
年份 1978 … … 1997 1998 进出口总额 2 06.4 (亿美元) 1999 年份 3251. 3240 6 2005 2008 2002
252 351 398 433 456 275 358 400 438 467 300 362 410 440 473 318 375 415 445 486 325 378 422 447 499 335 382 428 449 522 346 388 430 450 546
19
试编制频数分布表.
50
f f 0 1 M L i o f f f f 0 1 0 1
注1:众数不受极端值 的影响.
51
注2.平均指标能反映 分布的集中趋势.
52
算术平均数、中位数、众数的 位置关系如下: 对称: X M M e o
左偏: 右偏:
X Me Mo
X Me Mo
614 107
710 110
804 114
试计算⑴1997年的人均利润; ⑵1994~1997年平均每年的人均利润.
78
例. 某单位某月职工人数资 料如表:
日期 3月1曰 3 月7 日 3月20日 3月31日
职工人 数 (人 )
20
22
26
28
试求该单位3月平均职工人 数.
79
§3.3分散程度的描述
合
计
30
100
9
3.变量数列 ⑴分类
变量数列
单项式变量数列﹡
组距式变量数列﹡﹡
﹡:各组变量值只有一个 ﹡﹡:各组变量值为一个范围
10
⑵组距数列 组限:表示各组界限的变 量值. 组上限:每个组的最大值. 组下限:每个组的最小值.
11
组距=上限-下限
12
全距=最大组上限 -最小组下限.
13
等距数列:各组组距 均相等的组距数列. 不等距数列:各组组 距不全相等的组距数 列.
14
组中值=(上限+下限)÷2
15
开口组:上,下限中缺一 个的组.
16
缺上限的开口组的组中值 =下限+相邻组组距÷2 缺下限的开口组的组中值 =上限-相邻组组距÷2
17
⑶组距数列的编制 对离散型变量如项 数不多,数量变动不大, 可以编制单项式数列; 对连续型变量宜编制组 距式数列.
18
例:某市35个商店某年销售额 资料,按从小到大顺序排列如 下(单位:万元):
例5:己知某单位职工工龄频数分布资料 如下 : 工龄X 人数f 3 试计算该单 3 5 位 职工工龄 4 6 的中位数. 5 50 6 15 8 10 10 5 12 4 15
合 计
98
41
2.组距式数列计算 中位数.
※
42
计算公式: Me=中位数组下限 +(中位数组组距÷中 位数组频数)×应包 括项数
43
i N Me= L S m 1 fm 2
其中L—中位数组下限, fm—中位数组频数,i—中 位数组组距,N—总体单位 数,Sm-1—低于中位数组各 组的频数和.
44
例6:已知某单位职工工资资料如下: 按月工资分组(元) 按月工分组(元) 频数(人) 7 500以下 500~800 10 800~1100 20 1100~1400 8 5 14 00以上 50 合 计 试计算该单位职工工资的中位数.
n
X
31
c.加权算术平均数
X 1 f1 X 2 f 2 X k f k X ˆ f1 f 2 f k
k—组数
f
Xf
32
例1:某种商品按每公 斤1.50元和1.80元分 别售出600公斤,800 公斤,求平均价格.
33
例2:己知某单位职工工龄频数分布资料 如下 : 工龄X 人数f 3 试计算该单 3 5 位 职工平均 4 6 工龄. 5 50 6 15 8 10 10 5 12 4 15
80
常用的变异指标有: 极差,四分位差,方差, 标准差, 变异系数.
81
作用:能反映变量值的 均匀程度.变异指标小 的数据均匀整齐, 变异 指标大的数据分散程 度大﹑高低差大.
82
3.3.1极差和四分位差
83
一.极差 R=最大值-最小值 =最大组上限-最小组下限
84
二. 四分位差 定义:先把数据从小到大排队, 排在第1/4位置和第3/4 位置上 的数称为四分位数。 四分位差=的图像显示
20
a. 频数分布直方图 用一组矩形的组合 图形表示频数分布,用横 轴表示变量值,纵轴表示 频数或频率,一个组一个 矩形.
21
设等距分k组,记第i组的下 限,上限,频数分别为 Li,Ui,ni,i=1,2,…,k,则表示 第i组矩形的四个顶点为 (Li ,0),(Ui,0),(Li,n i),(Ui,n i)
架数
499
852
982
1386 1961 2179
(架)
58
2.二要素 (1)现象所属时间; (2) 现象在各个时间 的指标数值.
59
3.分类
60
绝对数时间数列 时间数列 相对数时间数列 平均数时间数列
时期数列 时点数列
61
时期数列与时点数列 的区别: ⑴是否具有可加性; ⑵时间间隔长短; ⑶一个累计得到,一个 按期登记得到.
85
若数据的个数为n,则上、 下四分位数是排在(n+1)/4 位置上的对应的数, 和排在 3(n+1)/4位置上的对应的 数。
86
三. 方差 ⑴简单形式
2
2
X X X X X X X X
n 2 2 i 1 2 n i 1
2
36
权数问题: 算术平均数的大小不 仅取决于变量值的水 平,还取决于变量值出 现次数的大小.
37
3.2.2中位数(Me) 1. 概念.大小处在正中 间的标志值称为中位数.
38
注:奇数项正中间有一 项;偶数项正中间有二 项,应取它们的平均.
39
例4:某班6名学生的统 计学考试成绩分别是: 75,81,53,61,49,66分,求 考试成绩的中位数
⑵ 加权形式
2
n
n
X
1
X f1 X 2 X f 2 X k X f k f1 f 2 f k
87
2
2
2
计算公式: X X
2 2
2
n 1 2 2 其中 X n X i i 1 k
或
2 X
X
i 1 k i 1
试求该单位这一年第1季度 平均职工人数.
74
B. 不等间隔间断时点 数列
a3 a 4 an 1 an a1 a2 f1 f2 f n 1 2 2 2 a f1 f 2 f n 1
其中f—时间间隔长度.
75
例. 某单位某年职工人数资料 如表:
日期 职工人 数 (人 ) 上年12 2月28日 5月31日 9月30日 12月31日 月31曰 743 812 864 826 848
45
注:中位数不受极端值 的影响.
46
3.2.3众数(Mo)
47
1. 概念: 次数出现最多的 标志值称为众数.
48
※2.
组距式数列计算 众数.
49
计算公式:
其中, 其中L—众数组下限, f0—众数组频数,i—众数组 组距,f-1=低于众数组且相邻 组的频数, f+1=高于众数组且 相邻组的频数.
62
二. 时间数列的水平 指标
63
常用的有: 发展水平,平均发 展水平,增长量,平均 增长量 .
64
1. 发展水平 发展水平:时间数列中 各项指标数值.
65
根据发展水平在时间数 列中所处的位置,通常称第1 个指标值为最初水平;最后1 个指标值为最末水平;其余 各个指标值为中间水平;考 察那个时期指标值为报告 期水平; 用来比较那个时期 的指标值为基期水平.
第三章统计数据特 征的分析
1
§3.1总体分布的描述
2
3.1.1. 分布的列表和图形 显示
3
一.频数分布的列表显示
4
1. 频数分布的概念:根据一 定的标志分组,说明总体单 位在各组分配情况的统计 数列.也称分布数列.
5
频数:每组的个体数,称 为该组的频数.也称次 数. 频率:每组频数与总体 单位数之比称为该组的 频率或比率.
53
均值 中位数 众数
均值=中位 数=众数
众数 中位数
均值
左偏分布
对称分布
右偏分布
54
3.2.4与时间有关数据 的平均
55
一. 时间序列概念
56
1.概念: 按时间次序排列 的数据序列.也称动态 数列或时间数列.
57
我国民用飞机架数
年份
1990 1995 2000 2005 2008 2009
71
b. 时点数列 ①连续时点数列
a
i 1
n
ai
72
n
② 间断时点数列 A. 等间隔间断时点数 列
an a1 a2 an 1 2 2 a n 1
73
例. 某单位某年职工人数资 料如表:
日期 职工人 数 (人 ) 1月1曰 2月1日 3月1日 4月1日 240 270 280 280
66
设各指标值依次为 a0,a1,…,an.其中 a0—最初水平; an—最末水平; a1,…,an-1—中间水平.
67
我国外贸进出口总额资料如下:
年份 1978 … … 1997 1998 进出口总额 2 06.4 (亿美元) 1999 年份 3251. 3240 6 2005 2008 2002
252 351 398 433 456 275 358 400 438 467 300 362 410 440 473 318 375 415 445 486 325 378 422 447 499 335 382 428 449 522 346 388 430 450 546
19
试编制频数分布表.
50
f f 0 1 M L i o f f f f 0 1 0 1
注1:众数不受极端值 的影响.
51
注2.平均指标能反映 分布的集中趋势.
52
算术平均数、中位数、众数的 位置关系如下: 对称: X M M e o
左偏: 右偏:
X Me Mo
X Me Mo
614 107
710 110
804 114
试计算⑴1997年的人均利润; ⑵1994~1997年平均每年的人均利润.
78
例. 某单位某月职工人数资 料如表:
日期 3月1曰 3 月7 日 3月20日 3月31日
职工人 数 (人 )
20
22
26
28
试求该单位3月平均职工人 数.
79
§3.3分散程度的描述
合
计
30
100
9
3.变量数列 ⑴分类
变量数列
单项式变量数列﹡
组距式变量数列﹡﹡
﹡:各组变量值只有一个 ﹡﹡:各组变量值为一个范围
10
⑵组距数列 组限:表示各组界限的变 量值. 组上限:每个组的最大值. 组下限:每个组的最小值.
11
组距=上限-下限
12
全距=最大组上限 -最小组下限.
13
等距数列:各组组距 均相等的组距数列. 不等距数列:各组组 距不全相等的组距数 列.
14
组中值=(上限+下限)÷2
15
开口组:上,下限中缺一 个的组.
16
缺上限的开口组的组中值 =下限+相邻组组距÷2 缺下限的开口组的组中值 =上限-相邻组组距÷2
17
⑶组距数列的编制 对离散型变量如项 数不多,数量变动不大, 可以编制单项式数列; 对连续型变量宜编制组 距式数列.
18
例:某市35个商店某年销售额 资料,按从小到大顺序排列如 下(单位:万元):