随机现象的特征值
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
统计学讲义 樊丽淑
7
• 下面是一个小故事:
一个人到某公司求职,经过调查,得出 关于该公司工资的一些数据,如果是你, 应该如何选择?
2020/9/7
统计学讲义 樊丽淑
8
挠头的数值
公司员工的月薪如下:
员工
月薪 (元)
经理 6000
副经 理
4000
职员 A
1700
职员 B
1300
职员 C
1200
职员 D
22
如:某商场在过去15天的彩电销售资料如下: 9、3、7、13、14、7、7、4、1、9、7、3、 5、7、2,则:众数 7
2020/9/7
统计学讲义 樊丽淑
23
案例分析
• 例如:甲乙两学生射击的环数如下:甲: 10环、10环、9环、3环。
• 乙:9环、5环、3环、2环。请你试一试 如何评价他们的射击成绩。
• (3)一次测验中,如果已知大一年级各班级 的中位数和众数,也知道各班级的人数,能算 出整个年级的平均分吗?
2020/9/7
统计学讲义 樊丽淑
40
• 分析:(1)一般都会想象是几个高中学生在 游玩。但是如果是一个60岁的大爷带着三个4 岁的孩子在游玩,也有可能吧!或者是一对年 轻夫妇带着他们的两个孩子也有可能。所以, 这是一个不适合用平均数而适合用中位数或者 众数来代表数据的例子。
• 既可手工创建公式计算各种平均数, 也可利用Excel中的统计函数。
• 用于集中趋势测定的常用函数有三 种:均值、中位数、众数及切尾均 值函数。
2020/9/7
统计学讲义 樊丽淑
26
(1)均值函数(AVERAGE)
其语法结构: AVERAGE(number1,number2, ...)。 其中:number1, number2, ...为要 计算平均数的 1~30 个参数。
返回数据分布中心部分的算术平均值。 其语法结构:TRIMMEAN(array,percent) 。
其中:Array为需要进行筛选并求平 均值的数组或数据区域。Percent为计算 时所要除去的数据点的比例。
2020/9/7
统计学讲义 樊丽淑
30
例:
例1 某企业的生产部门使用抽样方法检测一 批新产品的质量,该批产品的抗拉强度 见“原始数据”。管理人员希望知道这
• (2)买礼物当然要看大部分人喜欢什么来荐 定,也就是众数来荐定。该例子中平均数和中 位数都没有什么意义。
• (3)显然是求不出来的。但如果已知的各个 班级的平均数,则可以求出整个年级的平均数。
2020/9/7
统计学讲义 樊丽淑
41
三者之间的数量关系
– A.在对称的正态分布条件下:算术平均数等 于众数等于中位数:
– B.在非对称正态分布的情况下,众数、中位 数和平均数三者的差别取决于偏斜的程度, 偏斜的程度越大,它们之间的差别越大。
2020/9/7
统计学讲义 樊丽淑
42
• 当次数分配呈右偏(正偏)时:算术平均数 受极大值的影响
• 当次数分配呈左偏(负偏)时,算术平均数 受极小值的影响
• 中位数则总是介于众数和平均数之间。
1100
职员 E
1100
职员 F
1100
职员 G
500
我们有三种方法选择集中趋势: (1)根据频数:哪个变量值出现次数越
多,就选择哪个变量值,比如民主决策的表决 机制。
(2)根据居中:比如一个城镇居民的生活 水平,居中的是小康家庭,那么就用小康家庭 来代表该城镇的生活水平。
(3)根据平均:用算数平均数来代表变量 的平均水平。
2020/9/7
统计学讲义 樊丽淑
10
集中趋势测量的指标
平均数
主 要 指 标
2020/9/7
中位数 众数
几何平均数和调和平均数
统计学讲义 樊丽淑
11
• 计算方法:
• (1)直接计算:算术平均值(不分组数据)
• 设某一资料包含n个观测值: x1、 x2、… xn,公式为:
n
x x1 x2 xn i1 xi
2020/9/7
统计学讲义 樊丽淑
4
一、集中趋势特征值
• 统计分析首先要解决的问题,就是寻求 一个简单数值以代表搜集所得资料共同 趋势。
• 集中趋势反映数据集资料中,各数据所 具有的共同趋樊丽淑
5
统计上常使用平均数(average )这一 指标体系描述各数据所具有的共同趋势
平均指标把总体各单位之间的差异加以 抽象概括,其中个别标志值的偶然性被 相互抵消,从而反映出总体分布的集中 趋势。
2020/9/7
统计学讲义 樊丽淑
6
• 上图的分布中,各个变量值与中间位置的距离越近,所出
现的次越多,与中间位置的距离越远,所出现的次数越 少, 从而形成了以中间值为中心的集中趋势。
2020/9/7
• 众数反映了出现次数最多的那个值,因此它用来 表示数据的“多数水平”。
• 在使用这三者时,关键在于根据不同情景,使用 各自适合的指标
2020/9/7
统计学讲义 樊丽淑
39
• 例:(1)草地上有四个人在游玩,他们的平 均年龄为18岁,请想象一下是怎样年龄的四个 人在游玩?
• (2)为了给毕业班的同学选毕业礼物,老师 对全班同学做了民意调查。那么最终决定买什 么礼物,该由调查数据的平均数、中位数还是 众数决定呢?
频数
fi
f1 f2 f3 . . .. . fk
统计学讲义 樊丽淑
组中值(xi)
x1 x2 x3 . . . . xk
16
式中:x i —第i组的组中值;
f i —第i组的次数;
k —分组数
第i组的次数fi是权衡第i组组中值xi在 资料中所占比重大小的数量,因此将fi 称为是xi的“权”,加权法也由此而得
xMe Mo
Mo Me x
2020/9/7
37
均数、中位数、和众数两注意
• 1. 三种统计量的计算方法不同,三者之 间可以相等也可以不等,无固定的大小 关系
• 2. 三者反映数据的特征不同,适用范围 不同
2020/9/7
统计学讲义 樊丽淑
38
• 平均数反映了一组数据的平均大小,因此用来表 示数据的“一般水平”;
• 中位数需要将数据排序后才能得出,它就象一条 分界线,将数据分成前半部分和后半部分,因此 用来表示数据的“中等水平”;
批产品的抗拉强度的平均水平,以决定
产品质量是否合格。由此需要计算抗拉 强度的均值、中位数与众数 。
操作步骤如下:
2020/9/7
统计学讲义 樊丽淑
31
• ①打开“第3章 数据描述分析.xls”工作簿,选择 “抗拉强 度”工作表。如图所示:
• ②在单元格A7中输入“均值”,在A8中输入“中位 数”, 在A9中输入“众数”。
中位数。 ③在单元格B9中输入公式“=MODE(B2:B6))”计算众
数。 计算结果如图所示:
2020/9/7
统计学讲义 樊丽淑
35
计算结果表明,抗拉强度的均值是30,中位数也 是30,由于数据中的数值所出现的次数都为1, 所以没有众数骗人的“平均数”
2020/9/7
统计学讲义 樊丽淑
36
三 集中趋势特征值的特点
2020/9/7
统计学讲义 樊丽淑
32
③选定单元格B7,单击“插入”菜单,选择“函数”选 项,
Excel会弹出“粘贴函数”对话框窗口。
2020/9/7
统计学讲义 樊丽淑
33
• ④在“函数分类”列表中选择“统计”,在 “函数名” 列表中选均值函数“AVERAGE”。单击 “确定”, 则弹出“AVERAGE”函数对话窗口。
当样本含量 n≥30 以上且已分组的数据,可
在次数分布表的基础上采用加权法计算平均数, 也即加权平均值。
公式为:
k
x f1x1 f2x2 f1 f2
fkxk fk
i1 k
fi xi fi
i1
2020/9/7
统计学讲义 樊丽淑
15
频数分布表
分组
1 2 3 . . . . K
2020/9/7
名。
2020/9/7
统计学讲义 樊丽淑
17
例:等候时间
分组
0-10 10-20 20-30 30-40 40-50 50-60
频数
fi
6 7 9 8 5 1
组中值 (xi)
5 15 25 35 45 55
• 组中值 x1=(0+10)/2=5 x2=(10+20)/2 =15 k
fi xi
x
i 1 k
偏态 峰度
2020/9/7
统计学讲义 樊丽淑
2
本章主要内容:
• 3.1 集中趋势的测定与分析 • 3.2 离中趋势的测定与分析 • 3.3 分布形态的测定与分析 • 3.4 描述统计分析工具的使用
2020/9/7
统计学讲义 樊丽淑
3
3.1 集中趋势的测定与分析
• 一 集中趋势的特征值 • 二 集中趋势特征值的Excel计算 • 三 集中趋势特征值的特点 • 四 案例应用
2020/9/7
统计学讲义 樊丽淑
24
• 假设某商家得知宁波理工学院男生较喜 欢A品牌运动鞋,于是决定在周日来理工 进行推销。推销前商家需要了解一些信 息,试问就鞋号而言,商家最想知道的 信息是鞋号的平均数?中位数?众数?
2020/9/7
统计学讲义 樊丽淑
25
二、 集中趋势特征值的Excel计算
2020/9/7
统计学讲义 樊丽淑
34
⑤在“Number1”区域中输入数据B2:B6后,对话窗口底 部便显示出计算结果30。如果对话窗口中没有计算结 果,便说明计算有错误,需要再检查一下。
⑥单击“确定”按钮,计算完成。
或在单元格直接输入公式。具体操作 ①也可以直接在单元格B7中输入均值函数公式
“=AVERAGE(B2:B6)”,然后敲回车键,得到同样结果。 ② 在单元格B8中输入公式“=MEDIAN(B2:B6)”计算
865 36
24.02778
fi
i 1
2020/9/7
统计学讲义 樊丽淑
18
2 中位数
把总体单位某一数量标志的各 个数值按大小顺序排列,位于正 中处的变量值,即为中位数,用 Md表示。
适合条件:各类分布的资料,特别是偏态分布资料
2020/9/7
统计学讲义 樊丽淑
19
计算方法:
n为奇数时, Md= x(n+1)/2
2020/9/7
统计学讲义 樊丽淑
27
(2)中位数函数(MEDIAN)
其语法结构: MEDIAN(number1,number2, ...)。
其中:number1, number2,... 是需要找出 中位数的 1 ~ 30 个数字参数。
2020/9/7
统计学讲义 樊丽淑
28
(3)众数函数(MODE)
语法结构: MODE(number1,number2, ...)。 其中:number1, number2, ...是用于众数 计算的 1 ~ 30 个参数,也可以使用单 一数组(即对数组区域的引用)来代替 由逗号分隔的参数。
2020/9/7
统计学讲义 樊丽淑
29
(4)切尾均值函数(TRIMMEAN)
n是偶数时,
Md
xn/2
x(n/21) 2
2020/9/7
统计学讲义 樊丽淑
20
例如:某商场在过去15天的彩电销售资料如下:9、3、7、 13、14、7、4、1、9、7、3、3、5、7、2,则:中位数? 7 排序:1、 2、3、 3、 3、 4、 5、 7、 7、 7、 7、 9、 9、13、 14
• 平均数考虑了所有数值,其大小容易受总 体中极端数值的影响。
• 众数是总体中出现次数最多的数值,它只 考虑总体中各数值出现频数的多少,不受 极端数值的影响,但当总体中出现多个众
数时,众数便没有意义。
• 中位数只是考虑各单位数值在总体中的顺 序变化,它受极端数值的影响不大。
2020/9/7
统计学讲义 樊丽淑
中位数的计算方法因资料是否分组而有所不同
一般当所获得的数据资料呈偏态分布时(或存在极 端值),中位数的代表性优于算术平均数。
2020/9/7
统计学讲义 樊丽淑
21
3.众数
• 众数是在一组资料中,出现次数(或 频数)呈现出“峰”值的那些变量值,用
Mo表示。
• 众数只与次数有关
2020/9/7
统计学讲义 樊丽淑
第三章:随机现象的特征值分析
引言:
对经济活动的描述,除了上述的 频数分布、图表及图描述以外,还有 一些基本的描述统计量方法,如绝对 指标、相对指标、平均指标和标志变 动度等方法.
2020/9/7
统计学讲义 樊丽淑
1
数据分布性质
集中趋势
算术平均数 中位数 众数
离中趋势
分布形态
全距 四分位距 方差 标准差
n
n
2020/9/7
统计学讲义 樊丽淑
13
例如:某商场在过去15天的彩电销售资料 如下(台):9、3、7、13、14、7、4、1、 9、7、3、3、5、7、2,则15天平均销售多 多少?:
• 算术平均数:
n
xx1x2
xn
xi i1
946.3
n
n 15
2020/9/7
统计学讲义 樊丽淑
14
(2)加权平均数(分组数据,利用频数表):