管理学研究方法04-统计分析方法(一)
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
累计频数 4 30 62 76 90 100
--cont’
累计曲线(Ogive)
Cumulative Frequency
50
40
30 20 10 50 60 70 80 90 100 110
累计曲线的意义与应用
Cost ($)
2.3 数据的度量
1. 集中趋势 (位置,location ) 的度量 (measures of central tendency) * 平均数 (mean) x xii
n 1
--cont’
2. 相关系数(Correlation coefficient)
-- 两个随机变量间线性相依程度的度量。
-- 定义:
xy
cov(X , Y )
x y
-- 性质: 0≤│ρxy│≤1; ρxy= 0,X与Y独立; ρxy= -1,完全负相关 ;ρxy=+1,正相关 -- 样本相关系数: s
_
p
N n N 1
p(1 p) n
_ or p
p(1 p) n
2. 点估计及其性质
什么是点估计? 用样本数据计算一个样本统计量, 以此来估计总 体参数。 例子 点估计的性质 -- 如何评价估计的好坏? 无偏性: E ( )
有效性: Var( 1 ) Var( 2 ) 一致性: 0 1 lim P n
关于偏度和峰度
偏度(skewness):偏斜度、偏态系数
是对分布偏斜程度的度量 Sk=μ3/σ3 μ3=E(X-EX)3是X的三阶中心矩 σ是X的标准差 Sk=0,对称分布。通常: Sk<0,曲线分布向 左偏;Sk>0,曲 线分布向右偏。
峰度(kurtosis):峰态系数、峭度 Ek=μ4/σ4 - 3
-- cont’
4. 统计学的分类
* 描述统计学和推断统计学 * 理论统计学和应用统计学
5.
统计分析方法与思想概述
* 统计学的要素:总体、样本、描述、推断、推断的可靠性 * 统计学的方法:数据搜集、整理、度量、描述、分析、推断、 预测、决策
二、 描述统计学
数据的搜集 数据的整理与汇总 数据的度量 两个变量间关联的度量 分组数据
★ 有数据、用数据的地方,就要用统计学方法!
一、统计学与数据
1. 什么是统计学
统计学是一门对群体现象的数量特征进行描述、分析和 推论的科学 要点: ☆ 研究对象→ 群体现象大量性 ☆ 研究内容→ 群体现象的数量表现的内在规律性 ☆ 研究目的→ 计量、描述、分析和推论
2. 统计学在经济和管理中的应用
1. 协方差(covariance) --两个随机变量的联合数字特征,相依存程 度的度量。 -- 定义:cov(X,Y)=E[(X-EX)· (Y-EY)] = E(XY)- EX· EY n _ _ -- 样本协方差: ( xi x)( yi y)
s xy
i 1
-- 协方差的解释:
--cont’
– –
Frequency Distribution
选择组数:
5 ~ 20 组之间 数据集与组数对应(数据集大→组数大,数据集 小→组数小)
选择组宽:
– –
等距分组 Largest Data Value Smallest Data Value 近似组宽 = Number of Classes
主要参考文献
1. 李怀祖:《管理研究方法论》,第5章第1、2节。 2. 陈晓萍:《组织与管理研究的实证方法》,第9章。 3. 马庆国:《管理统计—数据获取、统计原理、SPSS 工具与应用研究》,科学出版社,2006年。 4. [美] 戴维· R· 安德森等著:《商务与经济统计》,中译 本,张建华等译,机械工业出版社,2003年。 5. 柯惠新等:《调查研究中的统计分析方法》, 北京广 播学院出版社, 1999年。 6. 李心愉:《应用统计学》,北京大学出版社,1999年。 7. 卢纹岱主编:《SPSS for Windows -- 统计分析》, 电子 工业出版社, 2000年。
2.1 数据的搜集
原始数据的搜集 * 统计调查方式: 定期统计报表 普查 抽样调查 典型调查 重点调查 * 统计调查方案 * 问卷调查---民意测验 二手数据的搜集:年鉴、年报、出版物
2.2 数据整理与汇总
数据分组 分组:将总体所有单位按一定的标准区分为若干部分, 以此将具有某种共性的个体归入同一组,而将总体内部 个体间的差异通过组别区分开来。 分组标准:数量标志、品质标志、混合分组 频数及频数分布 频数:具有某种属性的个体在某一组中出现的次数。 频数分布:一列表明各组数据频数(个数)的汇总表, 它描述了总体的结构和分布特征。 相对频数:每组的频数/n 累计频数:各组相对频数的累加
--cont’
组数与组宽(距) 组限 组中值 直方图 频数多边形 累积曲线 统计图 统计表
Example: Hudson Auto Repair
The manager of Hudson would like to get a better picture of the distribution of costs for engine tune-up parts. A sample of 50 customer invoices has been taken and the costLeabharlann Baidu of parts, rounded to the nearest dollar, are listed below.
管理学研究方法(4) --统计分析方法(一)
学习目标
了解和认识统计数据在管理研究中的重要作用 理解、掌握统计数据处理的基本方法 理解、掌握统计学的基本概念和基本方法(描 述统计、统计推断、抽样调查) 理解、掌握数据分析的基本技术与方法(方差 分析、相关分析、因素分析、回归分析) 学会应用Microsoft Excel、SPSS进行数据处理、 数据分析、模型估计、假设检验等。 学会用统计分析方法研究实际的管理学问题。
* 经验规则 (3 -- 规则)
--cont’
4. 探索性数据分析 --五数概括法: a. 最小值(min) b. 第1四分位数(Q1) c. 中位数(Q2) d. 第3四分位数(Q3) e. 最大值(max) --盒形图(箱线图):用图形概括数据(上述 5个数据)。
2.4 两个变量间关联的度量
相对频数与百分比频数分布 Cost ($) 相对频数 百分比频数(%) 50-59 .04 4 60-69 .26 26 70-79 .32 32 80-89 .14 14 90-99 .14 14 100-109 .10 10 Total 1.00 100
--cont’
18 16 14 12
直方图(Histogram)
3. 参数估计 -- 区间估计 区间估计的基本概念 区间估计的基本步骤 总体均值的估计 总体比例的估计 总体方差的估计 样本大小的确定
3.1 区间估计的基本概念 区间估计的基本思想:首先求出待估参数的估计 值,然后以此为基础估计出一个区间 ( , ),并 提供总体参数落入该区间的概率。 以概率表示为: P 1 置信区间:以一定的概率保证的总体参数可能落 入的区间,区间 ( , ) 。 置信度或置信水平:(1 -α )100% 显著性水平(Significance Level):α 置信度为(1 -α )100%的置信区间的解释
-- cont’
3. 平均数和标准差的应用 * z -- scores :z=(x-μ)/σ→数据的标准化 * 切比雪夫定理(Chebyshev’s Theorem)
任何数据中,至少有(1-1/k2) 项落在(位于)平均值 (mean)的k个标准差之内。 数学表述:P{│x-μ│≤k σ}≥1-1/ k2
Frequency
10
8 6 4 2 50 60 70 80 90 100 110
Cost ($)
--cont’
累计分布(Cumulative Distributions)
Cost ($) < 59 < 69 < 79 < 89 < 99 < 109
累计频数 2 15 31 38 45 50
累计频数 .04 .30 .62 .76 .90 1.00
μ4=E(X-EX)4是X的四阶中心矩,σ是X的标准差 Ek=0,正态分布。通常, Ek越小,曲线分布的峰越陡峭; Ek 越大,曲线分布的峰越平坦。
三、 统计推断—参数估计
抽样与抽样分布 参数估计(点估计) 参数估计(区间估计) 假设检验(关于总体均值、总体比例、总体 方差)(单个总体、两个总体)
rxy
xy
sx s y
-- 相关系数的解释:
2.5 分组数据的度量
1. 加权平均
x
_
w x w
i i
i
2. 统计分组:意义、方法、要点 _ fi M i 3. 分组数据的平均数 x
n
4. 分组数据的方差
s2
f i ( M i x) 2 n 1
_
5. 分组数据的标准差 : s
n
* 中位数 (median) * 众数 (mode) * 四分位数和百分位数 (quartiles & percentiles)
-- cont’
2. 离散趋势的度量(measures of dispersion) * 全距(极差) : Range = Xmax - Xmin * 四分位数间距(interquartile range): d=Q3 - Q1 * 方差 (variance) (样本) 2 2 ( x x ) i 2 s2 n1 * 标准差 (standard deviation)(样本):s
统计学方法在管理学研究中的应用
1. 描述统计与统计图表:数据分析中的最直接表述! 2. 分组数据的统计与分析:比较分析或对比分析 3. 相关分析:变量间相关与依存关系的解释 4. 回归分析:变量间因果关系及其影响程度 5. 误差与标准差:3σ、6σ与质量控制 6. 假设检验:研究中命题或理论的检验 7. 抽样调查与数据分析:调查研究、市场调研 8. 时间序列与统计决策:预测与决策 9. 因子分析与主成分分析:主要影响因素分析 10. 聚类分析:事物或现象的分类研究与特征揭示
91 71 104 85 62 78 69 74 97 82 93 57 72 89 62 68 88 68 98 101 75 52 99 66 75 79 97 105 77 83 68 71 79 105 79 80 75 65 69 69 97 62 72 76 80 109 67 74 62 73
_
x
N 1 n
_ x n
--cont’
★ 中心极限定理: 从总体中抽取样本容量为 _ n的简单随机样本,当样本 容量很大时,样本均值 x 服从近似的正态分布。 ★ 抽样误差: _ x sampling error = _ ★ 样本容量与 x 的抽样分布的关系 增大样本容量,样本均值落在总体均值某一特定范 围的概率将随之增大。 _ ★ 样本比例 p 的抽样分布 _ E ( p) = p
☆ 经济 :物价、经济增长、就业、贸易、生活 ☆ 管理:计划、组织、营销、生产、成本、财务、质量 ◆ 还广泛应用于各个领域和各个方面:医药、生物、物 理、农林、社会学、人口学、文学、体育等
3. 数据及其类型和来源
数据: --数据类型 (按分布形式、来源、性质、时序分) --数据来源 (官方、半官方(企业)、研究机构或个人、媒体)
--cont’
Frequency Distribution 如果选择6组, 近似组宽 = (109 - 52)/6 = 9.5 10 Cost ($) Frequency 50-59 2 60-69 13 70-79 16 80-89 7 90-99 7 100-109 5 Total 50
--cont’
1. 抽样及抽样分布
★ 总体与样本 ★ 总体参数:总体分布的数字特征 ★ 统计推断:根据样本信息推断总体的数量特征, 及对总体参数的估计和检验。 ★ 简单随机抽样 a. 有限总体 -- 等可能性 b. 无限总体 -- 独立地被抽到
--cont’
★ 抽样分布 a. 一个实例 -EAI _ b. x 的分布 _ _ 的均值: E ( x ) = x _ x 的标准差: N n or