《离散系统仿真与优化——面向工业工程的应用》教学课件 6 - 输入数据分析

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
• 基于历史数据的分析,是获得某一事件发生规律统计特征的唯一方法 • 系统内生变量(endogenous)和外生变量(exogenous),其不确定性只能借助
统计分布进行解释和描述,也就是说所研究变量的各种状态的可能性,都要通过概率 描述的方式进行
• 直接使用历史数据,进行仿真模型的验证,实现系统的“真实重现” • 模型的真实性验证 • “虚构方案”的验证
ቤተ መጻሕፍቲ ባይዱ
一般的检验法,是在总体分布类型已知的情况下,对其中的未知参数进行检验,这类统计检验法 统称为参数检验
在实际问题中,有时我们并不能确切预知总体服从何种分布,这时就需要根据来自总体的样本对 总体的分布进行推断,以判断总体服从何种分布,这类统计检验称为非参数检验。
非参数检验的一种 用于评价哪个分布更好地实现了对观测数据的拟合,即利用样本 X1, X2, , Xk 检验假设
• 建立经验分布,实现快速建模 • 进行分布拟合,找到贴近的理论分布及参数
① 分布的集中趋势,反映各数据向其中心值靠拢或聚集的程度 ② 分布的离散程度,反映各数据远离其中心值的趋势 ③ 分布的形状,反映数据分布的偏态和峰态
① 位置参数(location parameter) ② 尺度参数(scale parameter) ③ 形状参数(shape parameter)
• 中位数是分位数的一种,可称为二分位数,是一组数据排序后处于中间位置上的变量 值,用Me表示
• 中位数将全部数据等分为两个部分,每个部分各包含50%的数据 • 中位数主要用于测度顺序数据的集中趋势,也适用于测度数值型数据的集中趋势,但
是不适用于分类数据。
• 主要有四分位数(Quartile)、八分位数(octile)、十分位数(decile)、十二分 位数(duo-decile)、十六分位数(hexadecile)和百分位数(percentile)等多 种
① 作为数据分布集中趋势的度量 ② 集中趋势(central tendency)是指一组数据向某一中心值靠拢的程度 ③ 该参数的变化会造成分布图形沿着横坐标轴进行左右方向上的整体平移,而分布图
形不发生任何变化,因而该参数又被称为位移参数(shift parameter) ④ 位置参数主要包括
• 均值(mean) • 众数(mode) • 中位数(median) • 分位数(quantile)
是对数据分布对称性的测度。测定偏态的统计量是偏态系数(coefficient of skewness,SK)。 偏态系数的计算方式有很多种,在依据未分组的原始数据计算偏态系数时,通常采用如下公式:
是对数据分布平峰或尖峰程度的测度。测定峰态的统计量是峰态系数(coefficient of kurtosis),
THE END
• 均值也称平均数,是一组数据相加后除以数据个数得到的结果 • 均值是集中趋势的最主要的测度值 • 均值可以分为简单平均数、加权平均数和几何平均数。
• 众数是一组数据中出现次数最多的变量值,众数主要用于测度分类数据的集中趋势, 用M0 表示
• 一般情况下,只有当数据量足够大时,众数才有意义
记作K 。
用峰态系数说明分布的尖峰和扁平程度,是通过与标准正态分布的峰态系数进行比较来实现的。由于正态 分布的峰态系数为0,当K>0时为尖峰分布,数据的分布更为集中;当K<0时为扁平分布,数据的分布越分 散。
经过了分布假设阶段,我们往往有一个或多个分布族作为候选,接下来就要确定分布参数 (parameter),从而唯一确定每个分布族中那个最适合的分布。 参数估计阶段,仍然需要使用样本数据 。通过样本值估计参数的方法有很多种,例如极大似然 估计法(maximum-likelihood estimators,MLEs)、最小二乘估计法(least-squares estimators)、无偏估计法(unbiased estimators)和矩量估计法(method of moments)。 目前使用最为广泛的是极大似然估计法
• 尺度参数刻画了数据分布图形的聚集程度 • 当尺度参数较大时,数据分布比较分散,反之则相对集聚 • 尺度参数的几何意义是将分布函数图形进行横向或纵向的“拉抻”
• 形状参数是统计分布中不属于位置参数和尺度参数的其他所有参数 • 形状参数会影响数据分布图形的形状,而非仅仅是对图形的平移或拉抻
相关文档
最新文档