自考30447数据模型与决策

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
• 一、一般介绍
实证分析的基础是占有数据资料,采集到必要的 数据后,通常需要对数据资料实施描述性分析。
2020/5/23
21
第3章 统计资料描述分析
• 二、数据描述的图表工具 • 1、统计表的种类 • 2、频数分布
频数分布是统计资料整理和描述分析过程中 经常使用的一种方法,频数分布能对观察资料实 施大幅度的压缩和提炼,可以使资料以更加清晰、 简洁的形式展现出来,从而便于直观地了解现象 的内部结构。
2020/5/23
28
第3章 统计资料描述分析
• 三、数据分析的特征数字
• (二)定量数据的特征数字
• 2、定量数据集中趋势特征数字的综合应用
(2)中位数与四分位数的结合应用
从方法性质上,中位数与四分位数没有 本质的不同,都是根据样本数据排序的位置 确定的,所以常称为位置集中趋势测度。但 将它们结合起来使用,也能发挥更大的作用。 比如经常见到的“箱线图”。
2020/5/23
24
第3章 统计资料描述分析
• 二、数据描述的图表工具 • 5、数据描述的图形显示 (1)直方图、折线图与曲线图:功能与绘制; (2)累积分布图:功能与绘制; (3)饼形图与圆环图; (4)帕雷特图:应用与绘制; (5)雷达图:功能、阅读与绘制; (6)散点图:功能、应用与绘制; (7)茎叶图:含义、作用于制作。
2020/5/23
23
第3章 统计资料描述分析
• 二、数据描述的图表工具 • 4、频数分布中的几个概念 (1)频数。每个组观察值出现的次数,统称为 频数,用以反映各组观察值发生的频繁程度。 (2)频率。各个组中的频数与所有组频数之和 的比率。 (3)累积频数。几个相关组发生频数的合计, 能够反映组合并后的观察值总共出现的次数。 (4)累积频率。几个相关组发生频率的累加和, 能够用于描述和解释组合并后观察值出现的相对 频繁程度。
本讲的主要内容: 一、数据资料的来源 二、数据资料的分类 三、数据质量检查的两种方法 四、数据资料的变换
2020/5/23
7
第2章 数据资料的来源、分类与变换
• 一、数据资料的来源 • 1、科学研究过程及方法
定性分析
问题
分析
定量分析
数理分析
实证分析
2020/5/23
8
第2章 数据资料的来源、分类与变换
12
第2章 数据资料的来源、分类与变换
• 一、数据资料的来源
• 6、样本抽取的电子表格实现 利用EXCEL“数据分析”中的“抽样”可以获得
相应抽样方式的样本。
抽样方式 简单抽样 分层抽样 系统抽样
电子表格实现过程
将总体单位列名编辑在EXCEL工作表中;打开 “数据”中的 “数 据分析”;从弹出的对话框中选定“抽样”;在新对话框中将总体单 位列名范围输入到“输入区域”,选定“随机”选项,在“样本数” 框中输入需要的样本单位数目。
2020/5/23
13
第2章 数据资料的来源、分类与变换
• 二、数据资料的分类
• 1、测量尺度分类
2020/5/23
14
第2章 数据资料的来源、分类与变换
• 二、数据资料的分类
• 2、时空要素分类
时空要素
特点
作用
截面数据
同一时刻上搜集的有关 总体各个单位的资料
分析总体内部的构成,了解现象 空间范围内差异。
2020/5/23
25
第3章 统计资料描述分析
• 三、数据分析的特征数字 • (一)综述
2020/5/23
Байду номын сангаас26
第3章 统计资料描述分析
• 三、数据分析的特征数字 • (二)定量数据的特征数字 • 1、定量数据集中趋势的特征数字
定量数据集中趋势的特征数字,常用的 有算术平均数、中位数、众数、截尾均值等。
2020/5/23
33
第3章 统计资料描述分析
• 三、数据分析的特征数字
• (二)定性数据的特征数字
• 1、定性数据集中趋势的特征数字
属性资料集中趋势的测度主要是:众数, 中位数,四分位数等。
• 2、定性数据离散趋势的特征数字
(1)离散比率
k
f j fmode
Vc j1 k
fj
j 1
2020/5/23
2020/5/23
29
第3章 统计资料描述分析
• 三、数据分析的特征数字
• (二)定量数据的特征数字
• 2、定量数据集中趋势特征数字的综合应用
(3)马尔可夫不等式
x1,x2,...,xn为一组非负观察值,x 为算术平均数,
k为大于1常系数,则有
P X
kx
1 k
表明某个数值不小于算术平均数k倍的概率不 会超过1/k 。
34
第3章 统计资料描述分析
• 三、数据分析的特征数字
• (二)定性数据的特征数字
• 2、定性数据离散趋势的特征数字
(2)GINI-SIMPSON指数
(3)熵
k
CGINISIMPSON 1
p
2 j
j 1
k
H p j ln p j j 1
2020/5/23
35
第3章 统计资料描述分析
(3)方差与标准差:含义,计算,应用。
2020/5/23
31
第3章 统计资料描述分析
• 三、数据分析的特征数字 • (二)定量数据的特征数字 • 4、定量数据离散趋势特征数字的综合应用 (1)数据资料标准化。
x j
xj x ,j s
1,2,...,n
(2)变异系数
变异系数是把算术平均数与标准差联系起
将总体单位列名编辑在EXCEL工作表中;建立筛选格式后进行“筛 选”;从筛选出的资料中,按简单抽样规则抽样。
将总体单位列名编辑在EXCEL工作表中;打开菜单栏 “数据”中 的“数据分析”;从弹出的对话框中选定“抽样”;在新对话框中, 将总体单位列名区域输入到“输入区域”,选定“周期”选项,然后 在“间隔”框中输入事先规定的抽样间隔。
时间序列
按时间先后顺序排列在 考察同一现象不同时间发展变化
一起的观察资料
过程及其动态变化趋势
面板数据
截面资料和时间序列资 料交织在一起的资料
同时实现横向比较和纵向分析
2020/5/23
15
第2章 数据资料的来源、分类与变换
• 三、数据质量检查的两种方法 • 1、数据资料质量
准确性,时效性,代表性,系统性,可比性 • 2、数据资料质量的相对性 • 3、数据质量的影响因素
变换等。
2020/5/23
18
第3章 统计资料描述分析
本讲的主要内容: 一、一般介绍 二、数据描述的图表工具 三、数据分析的特征数字 四、电子表格数据处理
2020/5/23
19
第3章 统计资料描述分析
• 一、一般介绍 围绕某个问题开展研究,可以采用定性
和定量分析两种逻辑。
2020/5/23
20
第3章 统计资料描述分析
频数分布是在统计分组的基础上形成的样本 单位在各个组间的分配。
2020/5/23
22
第3章 统计资料描述分析
• 二、数据描述的图表工具 • 3、EXCEL频数分布的制作
利用EXCEL中的函数FREQUENCY,可以编 制频数分布,具体过程是:首先确定分组组数 和组限,一次性选定与组数大小相同的空白行, 然后编写函数“=FREQUENCY(数据区域,{每个 组的上限值})”,最后按CTRL+SHIFT+ENTER。
经济学 社会学 心理学 计算机(软件)
2
第1章 总论
• 一、数据分析的意义 • 2、定类分析类课程的实用性
背景分析1:企业生产经营方式 背景分析2:定价与销售效果 背景分析3:社会救助与公司解雇 背景分析4:销售因素诊断
2020/5/23
3
第1章 总论
• 二、数据、模型与决策关系
数据
模型
管理决策分析
2020/5/23
4
第1章 总论
• 二、数据、模型与决策关系
数据1
数据2
输入
数据n

处理过程
输出

分析 结果
决策方案
2020/5/23
5
第1章 总论
• 三、定量分析的要求
定性分析为先导 管理决策为根本目标 科学方法论为指导 数学模型为主要工具 软件应用为辅助性手段
2020/5/23
6
第2章 数据资料的来源、分类与变换
来的一个测度。
2020/5/23
32
第3章 统计资料描述分析
• 三、数据分析的特征数字 • (二)定量数据的特征数字 • 4、定量数据离散趋势特征数字的综合应用 (3)切比雪夫经验规则
切比雪夫定理:任何一个数据集中,至 少有 1 1 / z2 个数据出现在均值Z个标准差的范 围,其中Z是一个大于1的数。
先将总体单位按某种标识进行排列,在规定的范围内随机抽取 第一个样本单位,此后按一套规则确定其他样本单位。
分几个阶段进行,第一阶段抽取一级样本单位,对抽中的一级 样本单位从中抽取二级样本单位等。
先从总体中随机抽取一个较大的样本,获得第一重样本,再从 第一重样本中随机抽取一个较小的样本
2020/5/23
• 一、数据资料的来源 • 2、数据是开展定量分析的基础
如果选择实证研究,数据资料的采集可能 是一项基础性质的工作。
• 3、数据资料搜集提纲
研究目标,研究对象,研究变量,数据资 料搜集的渠道,区分清楚资料的最终用途。
2020/5/23
9
第2章 数据资料的来源、分类与变换
• 一、数据资料的来源 • 4、数据资料搜集途径
(1)算术平均数:含义,计算方法,应用。 (2)中位数与四分位数:含义,计算,应用。 (3)众数:含义,计算方法,应用。 (4)截尾均值:含义,计算方法,应用。
2020/5/23
27
第3章 统计资料描述分析
• 三、数据分析的特征数字 • (二)定量数据的特征数字 • 2、定量数据集中趋势特征数字的综合应用 (1)算术平均数、中位数、众数的结合应用
配额调查 11
第2章 数据资料的来源、分类与变换
• 一、数据资料的来源 • 5、不同抽样方式下的样本单位确定
抽样调查组织方式 样本单位的确定
简单抽样 分层抽样 整群抽样 系统抽样
阶段抽样
双相抽样
每个单位都有等同的可能性被抽到 先分层或分类,然后从各层中分别抽取一定数量的个体单位 将总体分成若干群,以群为单位抽样,对抽中的群实行全面调查。
将算术平均数、中位数和众数结合起来,可 以大致判断现象存在的对称性。如果现象存在的 状态是对称的,算术平均数、中位数与众数完全 相同 。算术平均数、中位数或众数不相同,说明 现象存在的状态不对称,算术平均数大于中位数 或众数 ,表明现象呈右偏态,频数分布的尾巴拖 向右边。算术平均数小于中位数或众数 ,表明现 象呈左偏态,频数分布曲线的尾巴拖向左边。
数据资料 采集
2020/5/23
直接来源 间接来源
统计调查 实验设计 内容分析 参与观察
商用数据库 网上公开资料 组织积累资料
其他渠道
10
第2章 数据资料的来源、分类与变换
• 一、数据资料的来源 • 4、数据资料搜集途径
全面调查
普查
统计调查
非全面调查
随机抽样调查 非随机抽样调查
判断调查 任意调查
2020/5/23
2020/5/23
16
第2章 数据资料的来源、分类与变换
• 三、数据质量检查的两种方法
• 4、数据质量检查
数据质 量检查
后验 技术
含义
特征
调查已完成,进入数据编辑和整 理阶段所用的评估数据质量的方法。
不再亲临调查现场,通过逻辑 关系分析、对计算等方法,评 估调查数据的质量。
抽样 技术
一次调查之后,紧接着再从这些 检查的结论由样本得出;适用 被调查单位中抽取一定数量的样本 各种场合调查数据检查;不受 单位,经过重新登记,最后将两者 调查项目间关系的假设限制; 的结果进行对比,以检查先前调查 可以修正原调查资料等。 数据的质量,并进行适当的调整。
第1章 总论
本讲主要内容: 一、数据分析的意义 二、数据、模型与决策关系 三、定量分析的要求
2020/5/23
1
第1章 总论
• 一、数据分析的意义
• 1、定量方法类课程在工商管理中的地位
专业理论
专业知识 管理史学
管理专业 知识体系
2020/5/23
专业工具 支撑知识
数学、物理 统计学 运筹学
管理计量分析 哲学
2020/5/23
30
第3章 统计资料描述分析
• 三、数据分析的特征数字
• (二)定量数据的特征数字
• 3、定量数据离散趋势特征数字
观察值之间的差异程度或频数分布的分散
程度,称为离散趋势。常用的离散趋势的特征 数字有:极差,四分位数差,方差与标准差。
(1)极差:含义,计算,应用。
(2)四分位数差:含义,计算,应用。
2020/5/23
17
第2章 数据资料的来源、分类与变换
• 四、数据资料的变换 • 1、数据变换的目的
便于运用简单的方法开展分析,迅速获得更加清晰的直观 认识,保证数据分析所需要的假定条件得到满足,弱化乃至消 除数据资料不准确对计量分析结论的影响,利于选择和建立合 适的分析模型。
• 2、数据变换的方法 线性和线性化变换,差分变换,方差稳定化变换,标准化
相关文档
最新文档