《管理统计学》第三章
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
次数 1 0 1 1 2 3 4 4 4
频率 3.33 ②组距数列
3 2
2 1
0 3.33 3.33 6.67 10.0 13.33 13.33 13.33 6.67 10.0 6.67 6.67 3.33
1 M0 L d 1 2
1 :众数组次数与前一组次数之差 2 :众数组次数与后一组次数之差 L :众数组的下限
10.0l 10.00
初中 高中 2 12.5 2 大学 9
9.99
9.98
10.00
合计 16 100
表3.1.2 某单位职工受教育程度的结构
受教育程度
各个受教育程度出现的频次
各受教育程度出现的频率(%)
硕士研究生 2 12.5
12.5 56.25
表3.1.2
家具的基色调
各个基色调出现的频次 各个基色调出现的频率(%)
(5)SPSS实现: Analyze Descriptive Statistics Explore
某商品价格(单位:元) Stem-and-Leaf Plot Frequency Stem & Leaf 1.00 99 . 3 1.00 99 . 5 3.00 99 . 677 7.00 99 . 8889999 8.00 100 . 00001111 5.00 100 . 22333 4.00 100 . 4455 1.00 100 . 6
①未分组数列 (n 1) 0.5 当 n 为奇数时,中位数位置= n 1 2 样本中位数= xn1
当 n 是偶数时,中位数位置=
2 n 1 (n 1 ) 0.5 2
样本中位数= ( xn xn 1 ) 2 xn ( xn 1 xn ) 0.5 2 2 2 2 2 ②组距数列 f 刚好大于 2 的向上累计数所在的组
Stem width: Each leaf: 0.1000 1 case(s)
数据分组的思路
•确定数据的量纲单位
•计算组数 •找出所给数据资料中的最小数据,向下取整。
•计算备选的中心坐标(组中值)=取整后的最小 数据+ k×区间长度。 k=0,1,…且k ×区间长度 <1。 •确定中心坐标。离取整后的最小数据最近的备 选中心坐标 •确定区间=中心坐标±0.5×区间长度
家具基色调出现的频次
B
1 3.33
G
6 20.00
R
8 26.67
W
5
Y
10
合计
30 100
16.67 33.33
频率分布
产量 50—60 60—70 … 合 计
人 数
2 8 … 30
比率(频率%) 6.67% 26.67% 类
属性分布数列
组距数列
单项数列
向上累计数 3.上下十分位点(Percentile)
50名学生统计学考试成绩分布表 产 值 (万元) 60以下 60-70 70-80 80-100 100以上 合 计 人数 (人) 5 11 17 11 6 50 频率 (% ) 10 22 34 22 12 100 向上累计 向下累计 (% ) 5 16 33 44 50 — 100 90 68 34 12 —
f S2 M e L2 2 d2 f2
三、样本均值(Sample Mean)
样本均值 x 又称样本平均数仅适用于刻度级的 数据。 ①未分组数列 ②分组数列
1 x n
xf x f
x
i 1
n
i
简单平均数
加权平均数
x
f
:组中值 :频次或次数
练习 某地区抽样调查职工月奖金资料如下: 人均月奖金(元) 10——20 20——30 30——40 40——50 50——60 60——70 70——90 90以上 职工人数(人) 6 10 20 30 40 240 60 20
93 98 105 108 117 118 121 123 146 158
排序的SPSS实现命令: Data Sort Case
50名学生统计学考试成绩分布表 产 值 (万元) 60以下 60-70 70-80 80-100 100以上 合 计 人数 (人) 5 11 17 11 6 50 频率 (% ) 10 22 34 22 12 100 向上累计 向下累计 (% ) 5 16 33 44 50 — 100 90 68 34 12 —
4.茎叶图
(1)适用范围:适用于顺序级以上的数据。 1.23,茎节宽度为100 (2)基本含义: 123 12.3,茎节宽度为10 (3)“茎节”的宽度 确定原则: 茎节是有变化的 样本值=“茎节.叶”表达ד茎节”的宽度 (4)茎节的长度 ①茎节长度=“允许的最大叶值-最小叶值+1”。 n 茎节宽度 ②茎节长度= 10
第3章
样本数据特征的初步分析
频次与频率 计算
样本数据的基本特征
延伸
图形表示
累计频次与频率
对数据的集中描述 点状描述 样本数据的位置特征 对数据的 离散描述 区间描述
样本数据的综合特征描述——箱型图
样本数据的分布特征——峰度和偏度
3.1 样本数据结构的基本特征:频次与频率 一、频率、频次的含义 1.频次(Frequency) 2.频率(Percentage或Relative Frequency) 种类: 1.刻度级数据的频次与频率 2.顺序级数据的频次与频率 3.名义级数据的频次与频率
变量分布数列
异距数列
二、频率分布的常用指标的计算方法
1.全距(极差)=最大值-最小值 2.组距=全距/组数
3.组中值: (1)闭口组=(上限+下限)/2
(2)开口组=上限-邻近组组距/2(缺下限) 下限+邻近组组距/2(缺上限) 4.组平均数 5.累计数
向上累计数 向下累计数
某班组男职工的身高数据分组
例题
某班男生的身高数据分组
组别 组界 组1 组2 组3 组4 组5 组6
[18.25, 18.75]
组7
[18.75, 19.25) 19.0
(15.75, [16.25, [16.75, [17.25, [17.75, 16.25) 16.75] 17.25) 17.75) 18.25) 16.0
某班级男生的身高数据(单位:厘米) 171 182 175 177 178 181 185 168 170 175 177 180 176 172 165 160 178 186 190 176 163 183
按照‚样本数据集合中的‘茎节’必须是有变 化‛的原则,显然,在本例中, 应以百位数和十位 数为‚茎(节)”,也就是说,‚茎(节)”的宽度是 10(厘米)。这样,“叶‛就只能是个位数了。 于是,按照上述制作规则,我们可以用SPSS软 件得到茎叶图。
1.饼图(Pie Chart)
(1)适用范围:适用于所有测度级别的数据。 (2)SPSS实现: ①Analyze Descriptive Statistics Frequencies Chart ②Graphs Pie
考试成绩频数分布饼状图 50-60 60-70 70-80 80-90 90-100
频次
组频 次
1
1
1
1
1 1
1
2 2 2
2 1 1 1
1 1
1
1
1
2
4
6
5
3
1
50名学生统计学考试成绩分布表 产 值 (万元) 人数 (人) 5 11 17 11 6 频率 (% ) 向上累计 向下累计 (% )
60以下 60-70 70-80 80-100 100以上 合 计
10 22 34 22 12 100
二、样本数据的位置特征: 对数据中心的描述
一、样本众数(Sample Mode)
1.样本众数定义
单一众数(大多数情况下)
2.样本众数种类 复众数(一般情况下)
无众数(极端情况下) 刻度级的样本数据
分组 不分组
3.样本众数的计算 顺序级的样本数据
名义级的样本数据
①单项数列
某商品的价格 2
单位:元
价格 9.93 9.94 9.95 9.96 9.97 9.98 9.99 10.00 10.01 10.02 10.03 10.04 10.05 10.06
组别 组界 身高 组1 组2 组3 组4 组5 组6
[18.25, 18.75]
组7
[18.75, 19.25) 19.0
(15.75, [16.25, [16.75, [17.25, [17.75, 16.25) 16.75] 17.25) 17.75) 18.25) 16.0
16.3,16.5 16.8,17.0, 17.5,17.6, 17.8,18.0 18.3,18.5, 18.1,18.2 17.1,17.2 17.7 18.6
f S2 M e L2 2 d2 f2
f :中位数组的次数
s :中位数组前一组的向上累计数
某车间同工种的10名工人完成个人生产定额 百分数如下(%):
93 98 123 118 158 121 146 l 17 l08 105
试根据上述资料求出工人平均完成生产定额大约 是多少? 该车间工人完成个人生产定额排序如下:
5 16 33 44 50 —
100 90 68 34 12 —
50
二、频率、频次的图形表示法
考试成绩频数分布直方图 40 30 20 10 0
40 30 20 10 0
考试成绩频数分布折线图
考试成绩频数分布饼状图
考试成绩频数分布曲线图
50-60 60-70 70-80 80-90 90-100
40 30 20 10 0 0 2 4 6
百分数如下(%)
83 88 123 118 158 121 146 l 17 l08 105 110 107 137 120 163 125 136 127 142 118 103 87 115 141 117 123 126 138 151 101 86 82 113 114 119 126 135 93 142 108 101 105 95 125 116 132 138 131 127 125 试根据上述资料对数据进行分组。
身高
16.3,16.5 16.8,17.0, 17.5,17.6, 17.8,18.0 18.3,18.5, ,18.1,18. 17.1,17.2 17.7 18.6 2
频次 组频 次
1
1
1
1 1 1 1
2 2 2
2 1 1 1
1 1 1
1
1
2
4
6
5
3
1
练习
某工厂同工种的50名工人完成个人生产定额
2
某商品在抽样商店的单价(单位:元) 9.98 10.02 10.00 10.04 10.01 9.99 10.05 10.04 10.06 10.0l
10.03
9.95
9.99
9.96
9.97
9.98
9.93
10.00
l0.01 10.03 l0.03 10.02 10.05 9.99
9.97
小学 1 6.25
试计算平均月奖金,中位数和众数。
3.4
样本数据的离散特征
一、 点状描述:
Maximum 1.极值 Minimum 适用于顺序级以上数据。 下四分位点Lower Quartile
2.四分位点 中四分位点
上四分位点Upper Quartile
在一般情况下, 仅适用于刻度级的数据。只有 在n+1能够被4整除时,才适用于顺序级的数据。 ①未分组数列
二、样本中位数(Sample median)
1.样本中位数定义: 2.样本中位数的使用:
当样本数据的个数(样本容量)为奇数时,样 本中位数适用于顺序级以上的样本数据集合; 当样本数据的个数(样本容量)为偶数时,样 本中位数仅适用于刻度级的样本数据集合(因 为顺序级的数据不能做加减运算)。
3.样本中位数的计算:
10
2.条形图(Bar Chart)
(1)适用范围:适用于顺序级以上的数据, 也可以“强行”用于名义级。 (2)SPSS实现: ①Analyze Descriptive Statistics Frequencies Chart ②Graphs Bar
3.直方图(Histogram)
(1)适用范围:适用于顺序级以上的数据。 (2)SPSS实现: ①Analyze Descriptive Statistics Frequencies ②Analyze Descriptive Statistics Explore ③Graphs Histogram (3)与条形图的关系:条形图是直方图的特例。
(99.8) (99.9) (100.1) (100.2)
0
1
Q1 的位置
3 Q2 的位置
2
4 Q3 的位置
n 1
②组距数列
2 f 刚好大于 4
的向上累计数所在的组
2 f S2 Q2 M e L2 4 d2 f2
f :中位数(四分位数)组的次数
s :中位数(四分位数)组前一组的