决策量化方法的准备知识
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
统计抽样与检验方法
假设检验:对总体的某种认识是否得到样本数据的支持。 检验的步骤: • 定义一个关于实际情况的简明、准确的表述(假设)。 • 从总体中取出一个样本。 • 检验这个样本,看一看它是支持假设,还是证明假设不大可能。 • 如果证明假设情况是不大可能的,拒绝这一假设,否则,接受这一假
设。 实例:
原假设实际上是
对的
错的
不拒绝 正确的决策 第二类错误
拒 绝 第一类错误 正确的决策
统计抽样与检验方法
实例:
据说,某行业从业人员平均工资为每周300英镑,标准 差为60英镑。有人认为这一数据已经过时了,为检验实际 情况究竟如何,一个36份工资的随机样本从该行业中抽取 出来。研究确定如果样本工资均值小于270英镑或大于330 英镑,就拒绝原假设。犯一类错误的概率有多大?
数据挖掘技术(Data -mining)
数据挖掘的应用 • 商品销售 • 制造 • 金融服务/信用卡 • 远程通信 • 数据库
•
树立质量法制观念、提高全员质量意 识。20. 11.220. 11.2Mo nday , November 02, 2020
•
人生得意须尽欢,莫使金樽空对月。1 2:20:39 12:20:3 912:20 11/2/20 20 12:20:39 PM
一种佐料装在包装盒中,名义重量为400克。实际重量与这一名义 重量可能略有出入,呈正态分布,标准差为20克。通过在生产线上定 期抽取样本的方法确保重量均值为400克。一个作为样本抽出的盒子 中佐料重量为446克。这能说明现在佐料填装过量了吗?
统计抽样与检验方法
假设检验的误差(增大样本,减少误差)
决策
•
f(x)=
1 1 Z2 e δ·2π e-(x- µ)2/2δ2= δ·2π - 2
其中x-变量值,µ-均值,δ-标准差,π=3.14159 e=2.7183
X-µ Z= δ = 商开均值的标准差个数
P(x1< x < x2)=
1-P(x <x1)-P(x>x2), x1≤µ P(x>x1)-P(x>x2), x1>µ
f(x)
5% 1%
1.75 1.83 1.86
1.64δ 2.33δ
5%显著性
x
1%显著性
基础运筹学(OR Software)
线性规划 整数规划 0 - 1 规划 动态规划 预测
运输问题 指派问题 非线性规划 目标规划 模拟
存贮论 决策分析 对策论 排队论 排序论
基础运筹学(OR Software)
• 运筹学软件
( 1)Excel 2000 (Optimization option); ( 2 ) Lindo or Lingo package; ( 3 ) Cplex; ( 4 ) CUTE, LANCLOT for research; ( 5 ) ERP; ( 6 ) 教学软件; ( 7) 其他。
抽样分布:由随机样本得出的分布。 中心极限定理(central limit theorem):无论原来总体的分布如何,总
体中抽样取大量的随机样本,样本的均值符合正态分布。 假设总体:个数N,均值µ,标准差δ; 样本:个数n,均值X,标准差S; 则:X=µ,S=δ/ n1/2 -(抽样标准误差)
统计抽样与检验方法
统计学、心理学、叠加数据
数据库装入程序
数据仓库
RDBMS
数据提取用于数据挖掘
数据挖掘技术(Data -mining)
数据挖掘中的数据及信息流
数据提取用于数据挖掘
结合规则
生成简要表
其它数据挖掘
供业务决策的信息
数据挖掘技术(Data -mining)
数据挖掘的有关技术 (1) 统计分析系统(SAS,SPSS) (2) DSS,EIS,ES (3) 多维电子表格及数据库 (4) 神经网络 (5) 数据可视化
条件概率(贝叶斯定律):P(A/B)=
P(B/A) P(A) P(B)
概率与概率分布
实例:
购买的二手车,也许会好,也许会不好。如果买的车好,70%的会耗油量较低, 20%的会有中等的耗油量。如果买的车不好,50的会耗油量较高,30%的会有中等 耗油量。对一辆二手车的实验表明该车耗油量较低。如果成交的二手车有60%是好 的,那么,这辆车属于好的概率为多少?
误差平均均值 =
n
n
∑
i=1
[xi-µ]2
n
数据-原始数值
处理
数据-有用形式
数据解释
标准差 = 方差
信息
概率与概率分布
(3) 概率: 事件A发生概率P(A)
P(A)=0 P(A)=1 0<P(A)<1
独立事件概率: P(A∪B)=P(A)+P(B)
(A、B独立事件) P(A∩B)=P(A)•P(B)
统计抽样与检验方法
实例:
某地区公布的人均收入为15,000英镑。一个45人 的样本的平均收入是14,300英镑,标准差为2000英 镑。按照5%的显著性水平检验公布的数字。按1%的 显著性水平检验结果又如何?
统计抽样与检验方法
f(x)
0.025
0.025
µ
--1.96δ--1.96δ--
x
(a)双边检验
P(n次实验中有r次成功)=Crnprqn-r = 均值 = µ = np 方差 = δ2 = n.p.q 标准差 = δ = (n.p.q)1/2
n! r!(n-r)!
prqn-r
柏松分布(pocsson distribution)
柏松分布的特征:
试验次数n较大(大于20);
成功的概率P较小。
统计抽样与检验方法
显著水平:是根据观察值证明样本是取自某一假设总体 的最低可接受概率。(5%)
(拒绝) 0.025
接受假设 0.025(拒绝)
µ
0.95 5%
统计抽样与检验方法
假设检验的步骤: – 表述原假设和备选假设。 – 确定拟采用的显著性水平。 – 计算待检验变量的可接受范围。 – 取得待检验变量的样本值。 – 决定是否拒绝原假设。 – 说明结论。
第二章 决策量化方法准备知识
• 商业电子表格制模(Excel) • 概率与统计简介 • 基础运筹学 • 数据挖掘技术
概率与概率分布
(1) 数权归纳:更易理解、直观、总体状态与趋势,比较结果,应用于量化方法。
(2) 平均数 mean = 中位数
n
∑
i=1
xi
n
=µ
众数
变动幅度:最大数值—最小数值
n
∑ ABS[xi-µ] 绝对商差均值: i=1
•
安全象只弓,不拉它就松,要想保安 全,常 把弓弦 绷。20. 11.212:20:3912 :20Nov -202-N ov-20
•
加强交通建设管理,确保工程建设质 量。12:20:3912 :20:391 2:20M onday , November 02, 2020
•
安全在于心细,事故出在麻痹。20.11. 220.11. 212:20:3912:2 0:39No vember 2, 2020
(d)如果要使脱销概率为0.01,应准备多少品脱的牛奶存货?
f(x)
0.8185
0.1587
0.0228
x
450 500 600
统计抽样与检验方法
系统可靠性分析
R R
R
R
可靠性:1-(1-R)2
.(.....)
可靠性:R2
统计抽样与检验方法
抽样:目的是通过收集式考察少数几个观察值(样本),而不是全部 可能的观察值(总体),得出可靠的数据。
有许多应用TQM后获得成功的实例。例如,在广岛的日本钢铁厂(Japan Steel Works),实施TQM后,在人员数量减少20%的 情况下,产量增长50%,同时,残次品费用由占销售额的1.57%下降到0.4%。美国福特公司实施TQM后,减少了保修期内实际修 理次数45%,根据用户调查,故障减少了50%。惠普公司实施TQM后,劳动生产率提高了40%,同时,在集成电路环节减少质量差 错89%,在焊接环节减少质量差错98%,在最后组装环节减少质量差错93%。
数据挖掘技术(Data -mining)
数据挖掘:构造和使用数据仓库的过程。
数据仓库
数据挖掘技术
达到不同层次用户 可需的最详细的有
过程
用数据、信息
(1)使公司取得更大的市场 (2)更好的形象 (3)更强的竞争力等
数据挖掘技术(Data -mining)
数据挖掘过程
业务数据 提取、滤液、清除、聚集
概率与概率分布
A
B
C
D
E
F
G
H
1
贝叶斯定理
2
3
HOC MOC LOC
HOC MOC LOC
4
GB
0,1
0,2
0,7
0,6 0,06 0,12 0,42
5
BB
0,5
0,3
0,2
0,4 0,2
0,12 0,08
6
0,26 0,24 0,5
7
0,231 0,5
0,84
8
0,769 0,5
0,16
.(.....)
z1 = z2 =
X1-µ δ
X2-µ δ
µ x1 x2
概率分布实例
一个中型超市日销售500品脱牛奶,标准差为50品脱。
(a)如果在一天的开门时,该超市有600品脱的牛奶存货,这一天牛奶 脱销的概率有多少?
(b)一天中牛奶需求在450到600品脱之间的概率有多大?
(c)如果要使脱销概率为0.05,该超市应该准备多少品脱的牛奶存货?
概率与概率分布
概率树:
P(MOC)=0.24
P=0.06
P=0.20 P=0.12 P=0.12 P=0.42 P=0.08
概率分布
二项分布:
特征:每次实验有两种可能的结果,可以称之为成功和失 败;两种结果是互斥的;成功和失败的概率都是一个固定 的常数,分别为P和q=1-P;连续实验的结果之间是独立的。
概率与概率分布
A
B
C
D
E
F
G
H
1 贝叶斯定理
2
3
HOC MOC LOC
HOC MOC LOC
4 GB 0,1 0,2 0,7 0,6 0,06 0,12 0,42
5 BB 0,5 0,3 0,2 0,4 0,2 0,12 0,08
6
0,26 0,24 0,5
7
0,231 0,5 0,84
8
0,769 0,5 0,16
•
踏实肯干,努力奋斗。2020年11月2日 下午12 时20分 20.11.2 20.11.2
•
追求至善凭技术开拓市场,凭管理增 创效益 ,凭服 务树立 形象。2 020年1 1月2日 星期一 下午12 时20分 39秒12 :20:392 0.11.2
•
按章操作莫乱改,合理建议提出来。2 020年1 1月下 午12时2 0分20. 11.212:20November 2, 2020
.(.....)
f(x)
0.05
µ
x
-1.64δ-
(b)单边检验
统计抽样与检验方法
实例:
一个邮递公司对某客户按平均每份邮件1.75公斤,标准差为0.5公斤的情况 确定每份邮件的收费水平。邮费现在很高,而有人提出该客户邮件重量均值 不止1.75公斤。随机抽取该客户100份邮件的样本,平均重量为1.86公斤。这 是否说明重量均值确实已超过1.75公斤?
爱德华·戴明(Edward Deming)是开创了全面质量管理工作的专家之一,他将自己的实践经验总结为以下14条。 1 将产品质量作为一贯性的目的。 2 杜绝即使是客户允许的差错、延误、残次和误差。 3 停止对于成批检验的依赖,从生产开始的第一步就树立严格的质量意识。 4 停止依据采购价格实施奖励的作法-筛选供应商,坚持切实有效的质量检测。 5 开发成本、质量、生产率和服务的持续改进项目。 6 对全体职员进行正规培训。 7 监督工作的焦点在于帮助职员把工作做得更好。 8 通过倡导双向沟通,消除各种惧怕。 9 打破部门间的障碍,提倡通过跨部门的工作小组解决问题。 10 减少以至消除那些并不指明改进和实现目标方法的数字目标、标语和口号。 11 减少以至消除会影响质量的武断的定额。 12 消除有碍于职员工作自豪的各种障碍。 13 实现终身教育、培训和自我改进的正规的有活力的项目。 14 引导职员为实现上述各条而努力工作。
P(r次成功) =
e-µ µr
r!
其中e = 2.7183, µ = 平均成功次数 = n.p
均值 = µ= n.p
方差=δ2 = n.p
标准差=δ= (n.p)1/2
*只用到成功的概率
百度文库
正态分布
特征:
连续的 是关于均值µ对称的 均值、中位数及众数三者相等 曲线下总面积为1
f(x)
µ
观察值x
正态分布
置信区间: 总体均值在某一范围内的可信水平。 总体均值的95%置信区间为:(X-1.96 S ,X+1.96 S)
统计抽样与检验方法
案例:全面质量管理 传统上,有大量的抽样方法应用于质量控制。近年来,许多组织改变了他们对质量的认识。他们不再设定一个残次品水平,
出不再认为达到了这样一个水平就说明组织运转良好。相反,他们代之以“零残次品”为目标,其实施方法是全面质量管理 (Total Quality Management,TQM),这要求整个组织一起努力,系统改进产品质量。