《管理统计学》第三章-2

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
9.95
9.99
9.96
9.97 9.93 l0.01 10.03 l0.03 10.02 10.05 9.99
9.98 10.00 9.97 10.0l 10.00 9.99 9.98 10.00
某商品的价格
单位:元
价格 频率
9.93 9.94 9.95 9.96 9.97 9.98 9.99 10.00 10.01 10.02 10.03 10.04 10.05 10.06
n 1 n 1 2 ① s ( xi x) ② s ( xi x) 2 f f 1 i 1 n 1 i 1
表1
某商品在抽样商店的单价(单位:元) 10.05 10.04 10.06 10.0l
9.98 10.02 10.00 10.04 10.01 9.99
10.03
5 8 17 14 6 50
10 22 34 22 12 100
5 16 33 44 50 —
100 90 68 34 12 —
50名学生统计学考试成绩分布表
成绩 (分)
人数 (人)
频率 (%)
向上累计 向下累计 (%)
60以下 60-70 70-80 80-90 90-100 合 计
5
8 17 14 6 50
9.98 10.00 9.97 10.0l 10.00
小学 初中 高中 大学
9.99 9.98 10.00
硕士研究生
表2 某单位职工受教育程度的结构
受教育程度
各个受教育程度出现的频次 各受教育程度出现的频率(%)
合计 16 100
1
2
2
9
2 12.5
6.25 12.5 12.5 56.25
表3
家具基色调出现的频次
0.2 0.1
-2
-1
1
2
峰度(Kurtosis)
0.4 0.3 0.2 0.1
-2
-1
1
2
峰度大于0表示比正态分布高峰更加陡峭,
为尖顶峰;反之,峰度小于0,为平顶峰。
偏度为0,表示数据分布形式与正态分布偏度 相同;偏度大于0表示正偏差数值较大,为正偏 或右偏,即有一长尾巴拖在左边;反之,小于0 表示负偏差数值较大,为负偏或左偏,即有一长 尾巴拖在右边。
家具的基色调 各个基色调出现的频次
B 1
各个基色调出现的频率(%) 3.33
30 20.00 26.67 16.67 33.33 100
G 6
R 8
W 5
Y 10
合计
①单项数列
某商品的价格 单位:元
价格 9.93 9.94 9.95 9.96 9.97 9.98 9.99 10.00 10.01 10.02 10.03 10.04 10.05 10.06 次数 1 0 1 1 2 3 4 4 4 频率 3.33 ②组距数列
次数 1 0 1
1 2 3 4
4
4
2
3
2
2
1
3.33 0 3.33 3.33 6.67 10.0 13.33 13.33 13.33 6.67 10.0 6.67 6.67 3.33
50名学生统计学考试成绩分布表
成绩 (分)
人数 (人)
频率 (%)
向上累计 向下累计 (%)
60以下 60-70 70-80 80-90 90-100 合 计
3.众数的计算 顺序级的样本数据
名义级的样本数据
表1
某商品在抽样商店的单价(单位:元) 10.05 10.04 10.06 10.0l
9.98 10.02 10.00 10.04 10.01 9.99
10.03
9.95
9.99
9.96
9.97 9.93 l0.01 10.03 l0.03 10.02 10.05 9.99
2
4
6
5
3
算法1:
1 M0 L d 1 2
1 :众数组次数与前一组次数之差 2 :众数组次数与后一组次数之差 L :众数组的下限
d :众数组的组距
算法2:
1 M0 U d 1 2
U :众数组的上限
某工业企业有职工10000人,其中工人8000 人,干部2000人,为了了解职工家庭生活状况, 在工人和干部两个组均以5%的比例抽选职工进 行调查,结果如下表:
②分组数列
刚好大于等于
f 2
的累计数所在的组
算法1:
f S Me L 2 d f
f :中位数组的次数
s :中位数组前一组的向上累计数
d :中位数组的组距
算法2:
f S Me U 2 d f
U :中位数组的上限
50名学生统计学考试成绩分布表
成绩 (分)
人数 (人)
频率 (%)
1 x n
x
i 1
n
i
简单平均数
xf x f
:组中值
加权平均数
x
f
:频次或次数
某专业硕士班学生年龄情况如下表所示:
年龄
20 21 22 23 24
人数
1 4 8 13 12
年龄
25 26 27 28 合计
人数
8 5 3 2 56
调和平均数
① 简单调和平均数
② 加权调和平均数
某水果店某日销售三种水果,其价格、销售 额及销售量如下表,试求其平均价格。
例:求某种商品三地零售价格的平均值
价格(元) 3.3 2.5 2.0 合计 销售量(斤) 3 4 5 12 价格(元) 销售额(元) 10 3.3 2.5 2.0 合计 10 10 30
算术平均
调和平均
xi 3.3 2.5 2.0
10 10 10 xi f i 3.3 3 2.5 4 2.0 5 xH mi x 1 1 1 1 mi 10 10 10 f i 3 45
2
3 2
2 1
0 3.33 3.33 6.67 10.0 13.33 13.33 13.33 6.67 10.0 6.67 6.67 3.33
16.3,16.5 16.8,17.0, 17.5,17.6, 17.8,18.0 18.3,18.5, 18.1,18.2 17.1,17.2 17.7 18.6
10 22 34 22 12 100
5 16 33 44 50 —
100 90 68 34 12 —
f S Me L 2 d f
变异系数 (1)平均差系数
V A. D. A.D. 100 % X
(2)标准差系数
V

X
100 %
S n 1 Vs 100 % X
②Analyze Descriptive Statistics Descriptives, 进入描述统计模块Descriptives
标准化Z分数及其线性转换
定义:从平均数为 ,标准差为 的总体 中抽出一个变量值 x ,Z分数表示此变量大于或 小于平均数几个标准差。 ★目的:由于Z分数的分子与分母单位相同,故 Z分数无计量单位,因此用来比较两个从不同总 体中抽出的变量值。 xi x Xi Zi ★ 计算公式为: Z i Sn1
小结:
频次与频率
计算
样本数据的基本特征
延伸
图形表示
累计频次与频率
对数据的集中描述 点状描述 样本数据的位置特征 对数据的 离散描述 区间描述
样本数据的综合特征描述——箱型图 样本数据的分布特征——峰度和偏度
SPSS的处理过程 ①Analyze Descriptive Statistics Frequencies, 进入频次分析模块Frequencies
★ ★
Z分数的正线性转换是T分数,公式:
T 10 Z 50
检验一个给定的数据是否服从正态分 布的判别方法: 检验均值和中位数是否相等,偏度是 否接近0以及峰度是否接近3来进行初步 的估计。
数据集离散程度的测度
1.极差 2.总体方差和标准差
1 n 2 ( xi x) 2 n i 1

1 ( xi x ) 2 n i 1
n
1 2 f
按家庭 人均月收入(元) 200以下 200——300 300——400 400——600 600以上
合 计
职工人数(人) 工人 干部
20 60 200 80 40
4Байду номын сангаас0
5 13 60 17 5
100
中位数(Median)
1.中位数的使用:
当样本数据的个数(样本容量)为奇数时,样本 中位数适用于顺序级以上的样本数据集合;当 样本数据的个数(样本容量)为偶数时,样本中 位数仅适用于刻度级的样本数据集合(因为顺序 级的数据不能做加减运算)。 2.样本中位数的计算: 未分组 开口 组距数列 数据 分组 单项数列 闭口
水果 苹果 橙子 梨 合计 价格(元)xi 3.4 2.5 2.8 销售额(元) 1020 1125 700 2845 销售量 300 450 250 1000
几何平均数
① 简单几何平均数
② 加权几何平均数 某银行对一笔存款按复利计息,具体数据如 下表,试求其平均年利率。
年限 第1~2年 第3~6年 第7~13年 第14~15年 合计 利率(%) 3 5 6 8 存款年数 2 4 7 2 15
数据集的分布特征
一、峰度(Kurtosis)
4 1 4 kurtosis xi x / SD 3 n 1 i 1 n


二、偏度(Skewness)
3 1 3 Skewness xi x / SD n 1 i 1 n


0.4 0.3
偏度(Skewness)
某班组男职工的身高数据分组
组别 组界 身高 频次 组1 组2 组3 组4 组5 组6 [18.25, 18.75] 组7 [18.75, 19.25) 19.0 1 (15.75, [16.25, [16.75, [17.25, [17.75, 16.25) 16.75] 17.25) 17.75) 18.25) 16.0 1
1 f
( x x)
i 1 i
n
n
2
f
( xi x) 2 f
i 1
样本方差和标准差
样本方差 s 2 的计算公式如下:
n 1 1 2 2 s2 ( xi x) 2 f ① s ( xi x) ② f 1 i 1 n 1 i 1
n
样本标准差(Standard Deviation)s的定义是:
第三章 统计数据的概括性描述
第一节 第二节 第三节 第四节 统计数据的整理与展示 数据集位置的测度 数据集离散程度的测度 数据集的峰度与偏度
第二节 数据集位置的测度
一、众数(Mode)
1.众数定义
单一众数(大多数情况下)
2.众数种类
复众数(一般情况下) 无众数(极端情况下) 刻度级的样本数据
分组 不分组
①未分组数列
(n 当 n 为奇数时,中位数位置= n 1 2 1) 0.5
样本中位数= xn1
2
n 1 1 0.5 (n ) 当 n 是偶数时,中位数位置= 2 样本中位数= ( xn xn ) 2 xn ( xn xn ) 0.5
2 2 1 2 2 1 2
向上累计 向下累计 (%)
60以下 60-70 70-80 80-90 90-100 合 计
5
8 17 14 6 50
10 22 34 22 12 100
5 16 33 44 50 —
100 90 68 34 12 —
f S Me L 2 d f
均值(Mean)
样本均值 x 又称样本平均数仅适用于刻度级 的数据。 ①未分组数列 ②分组数列
众数、中位数和均值的比较



数据对称分布,如果为正态分布,以算术平均 数为对称轴,两边的频数相等,即 众数=中位数=均值 数据左偏分布,峰部在右,即频数最大的变量 值在右,则众数在右,左边各组频数虽小,但 组数多,必定拉动均值向左边靠拢,处于频数 中间的中位数应在两者之间,即 众数﹥中位数﹥均值 数据右偏分布,峰部在左,即频数最大的变量 值在左,则众数在左,右边的变量值必定拉动 均值向左边靠拢,处于频数中间的中位数应在 两者之间,即 众数﹤中位数﹤均值
相关文档
最新文档