管理系统模拟.ppt
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
4 输入数据建模
4.1 建立输入数据模型的方法
建立输入数据模型可以采用如下三种方法之一: (1)在仿真运行中直接使用收集到的数据 (2)把收集到的数据定义为经验分布 (3)将数据拟合为某种理论分布
1
处理
直接使用
输入数据模型 原始数据
确定数值范围
经验分布
计算频率
原始数据
预处理 分布类型辨识
理论分布
参数估计 拟合度检验
输入数据建模
2
(1)在仿真运行中直接使用收集到的数据
• 该方法很直接,也可以用来做确定性模型的有效性检验, 但是有两个缺点: (1)只能用收集到的历史数据来驱动仿真模型;
(2)经常没用足够多的数据来进行多次仿真试验。
3
(2)把收集到的数据定义为经验分布
• 该方法可以根据实际数据值的范围、某个数据值出现的频 率,用随机数来产生所需要的随机变量值,能够产生足够 多的数据来进行多次仿真试验。
4
(3)将数据拟合为某种理论分布
• 如果发现所收集的数据能够较好地服从某种理论分布 (Theoretical Distribution),倾向于采用第 3种方法而不 是第2种方法。
• 建立输入数据理论分布的几个主要步骤
– 收集原始数据 – 基本统计分布的辨识 – 参数估计以 – 拟合度检验
5
4.2 收集原始数据
一、收集输入数据的方法 (1)通过实际观测获得系统的输入数据。 (2)由项目管理人员提供的实际系统运行数据。 (3)从已经发表的研究成果、论文中收集类似系统的输入 数据模型。
二、收集数据时,要注意以下几点:
(1)在收集数据的同时就分析数据,确定收集到的数据是 否足够。
(2)将性质相同的数据集组合在一起。
(3)确定两个随机变量是否相关。 (4)注意一组观测到的、似乎是独立的样本是否具有自相 关性。
6
4.3 随机变量分布的辨识 点统计法
• 连续型随机变量分布类型辨识 • 离散型随机变量分布类型辨识
直方图法
点统计法
线图法
7
4.3.1
连续型随机变量分布类型辨识
(1)点统计法 • 点统计法确定连续随机变量分布类型的基本思路为,首先 计算连续型随机变量的偏差系数,再根据偏差系数的特征 寻求与其相近的理论分布,并假设随机变量的分布为这一 理论分布。 • 偏差系数是偏差与均值的比:
其中: var(x)——随机变量分布的方差; E(x)——均值。
8
• 如果有随机变量X,则有:
其中:
——随机变量采集数据的均值; s2(n) ——随机变量采集数据的方差。
X (n)
所以,
9
10
点统计法
例 4- 1: 用汽车到达银行的时间间隔原始数据
接近1,假设间隔服从指数分布。
11
(2)直方图法 • 直方图是一种图形估计方法。 • 基本原理是:用观测到的样本数值建立随机变量 的概率密度函数分布的直方图,然后把得到的直 方图与理论分布的概率密度函数曲线图形做对比, 从图形上直观地判断被观测随机变量是否满足某 种理论分布。
12
•具体做法: 1)将所有观测数值分为k个区间长度相等的相邻区间。 [bj-1,bj),j=1,2,…,k。 区间宽度Δb=bj-bj-1 2)对于第i个区间[bj-1,bj),令gj表示在第j个区间中的观 测数据数量nj占整个观测数据的比例,即gj= nj/n。 3)定义函数,
4)将定义的观测数据取值的区间画在横坐标轴上,在垂直 坐标轴上标记出频率函数,画出被观测变量的直方图。 5)将直方图与理论分布的概率密度函数对比,确定被观测 数据服从哪种理论分布。
13
Δb b0 b1
Δb b2
Δb b3 … bj
Δb bj -1
Δb bk
x1
x2 … xa xa+1 … xb
xb+1 xc
xi+1 xm …
Xm+1 … xn
14
• 例4-2:
• • • 1)首先确定观测数据的范围 在观测到的间隔时间数据中,最小间隔是0.01min,最 大间隔是1.96min,观测数值范围为[0.0,2.0]。 2)确定相邻区间宽度为Δb=0.1,b0=0,b20=2.0,构造
出20个长度相等的相邻区间。
15
• 3)统计第j个区间所包括的观测数据数目占所有观测数据 数目的比例gj,下表中列出了具体数值。
16
• 4)根据上表给出函数h(X)。
• 5)将连续的区间在横轴上表出,将函数h(x)的数值在纵
轴上表出,画出直方图。
从图形上看,间隔符合服从指数分布。
• 6)将直方图与理论分布的概率密度函数曲线做比较。17
•要注意选择区间宽度
18
19
4.3.2 离散型随机变量分布类型的辨识
(1)点统计法
与连续型随机变量点统计法方法相同,同样是采用计 算偏差系数的方法,寻找偏差系数相近的理论分布进行假 设。
20
(2)线图法
• 线图法是把采集到的数据与假设的理论分布的概率质量函 数曲线进行比较。如果找到相近的,则可以假设其为该理 论分布。 • 具体做法步骤如下: ① 设观察数据为:x1,x2,…,xn; ② 将其按递增顺序排列,设共有 m个取值(m≤n),分别 为:x(1),x(2),…,x(m); ③ x(i)的数据个数占整个观测数据个数的比例数为hi; ④ 以x(i)作为自变量,以hi的值为函数值,即: hi=f(x(i)),i=1,2,…,m; ⑤ 由函数值 hi向相应的自变量 X(i)做垂线所得的图形称为 线图(见下图 ); ⑥ 与假设的理论分布的概率质量函数比较,确定随机变量 的分布。 21
22
• 例:观测在.7:00am~7:05am时间段内到达 某十字路口西北拐角的车辆数目。每周观测 5天, 连续观测 20周,在 5分钟内到达的车辆数目列表 4.5中。
23
24
4.4 参数估计 • 用直方图或线图确定样本数据服从的理论分布之后, 还要根据已经观察到的样本计算出理论分布的参数。 如果可以确定理论分布的参数,我们就建立了输入
参数的一个数学模型,可以用前面(第三章)介绍
的方法来生成随机变量的数值。
25
• 按照统计学的说法,假设某随机变量的总体分布是F,分
布F的参数未知,要用已经观测到的部分样本来计算全部 样本总体分布F的参数的真值,这样的统计推断问题被称 为估计(Estimation)。 • 在数理统计学中有许多参数估计的方法。
4.1 建立输入数据模型的方法
建立输入数据模型可以采用如下三种方法之一: (1)在仿真运行中直接使用收集到的数据 (2)把收集到的数据定义为经验分布 (3)将数据拟合为某种理论分布
1
处理
直接使用
输入数据模型 原始数据
确定数值范围
经验分布
计算频率
原始数据
预处理 分布类型辨识
理论分布
参数估计 拟合度检验
输入数据建模
2
(1)在仿真运行中直接使用收集到的数据
• 该方法很直接,也可以用来做确定性模型的有效性检验, 但是有两个缺点: (1)只能用收集到的历史数据来驱动仿真模型;
(2)经常没用足够多的数据来进行多次仿真试验。
3
(2)把收集到的数据定义为经验分布
• 该方法可以根据实际数据值的范围、某个数据值出现的频 率,用随机数来产生所需要的随机变量值,能够产生足够 多的数据来进行多次仿真试验。
4
(3)将数据拟合为某种理论分布
• 如果发现所收集的数据能够较好地服从某种理论分布 (Theoretical Distribution),倾向于采用第 3种方法而不 是第2种方法。
• 建立输入数据理论分布的几个主要步骤
– 收集原始数据 – 基本统计分布的辨识 – 参数估计以 – 拟合度检验
5
4.2 收集原始数据
一、收集输入数据的方法 (1)通过实际观测获得系统的输入数据。 (2)由项目管理人员提供的实际系统运行数据。 (3)从已经发表的研究成果、论文中收集类似系统的输入 数据模型。
二、收集数据时,要注意以下几点:
(1)在收集数据的同时就分析数据,确定收集到的数据是 否足够。
(2)将性质相同的数据集组合在一起。
(3)确定两个随机变量是否相关。 (4)注意一组观测到的、似乎是独立的样本是否具有自相 关性。
6
4.3 随机变量分布的辨识 点统计法
• 连续型随机变量分布类型辨识 • 离散型随机变量分布类型辨识
直方图法
点统计法
线图法
7
4.3.1
连续型随机变量分布类型辨识
(1)点统计法 • 点统计法确定连续随机变量分布类型的基本思路为,首先 计算连续型随机变量的偏差系数,再根据偏差系数的特征 寻求与其相近的理论分布,并假设随机变量的分布为这一 理论分布。 • 偏差系数是偏差与均值的比:
其中: var(x)——随机变量分布的方差; E(x)——均值。
8
• 如果有随机变量X,则有:
其中:
——随机变量采集数据的均值; s2(n) ——随机变量采集数据的方差。
X (n)
所以,
9
10
点统计法
例 4- 1: 用汽车到达银行的时间间隔原始数据
接近1,假设间隔服从指数分布。
11
(2)直方图法 • 直方图是一种图形估计方法。 • 基本原理是:用观测到的样本数值建立随机变量 的概率密度函数分布的直方图,然后把得到的直 方图与理论分布的概率密度函数曲线图形做对比, 从图形上直观地判断被观测随机变量是否满足某 种理论分布。
12
•具体做法: 1)将所有观测数值分为k个区间长度相等的相邻区间。 [bj-1,bj),j=1,2,…,k。 区间宽度Δb=bj-bj-1 2)对于第i个区间[bj-1,bj),令gj表示在第j个区间中的观 测数据数量nj占整个观测数据的比例,即gj= nj/n。 3)定义函数,
4)将定义的观测数据取值的区间画在横坐标轴上,在垂直 坐标轴上标记出频率函数,画出被观测变量的直方图。 5)将直方图与理论分布的概率密度函数对比,确定被观测 数据服从哪种理论分布。
13
Δb b0 b1
Δb b2
Δb b3 … bj
Δb bj -1
Δb bk
x1
x2 … xa xa+1 … xb
xb+1 xc
xi+1 xm …
Xm+1 … xn
14
• 例4-2:
• • • 1)首先确定观测数据的范围 在观测到的间隔时间数据中,最小间隔是0.01min,最 大间隔是1.96min,观测数值范围为[0.0,2.0]。 2)确定相邻区间宽度为Δb=0.1,b0=0,b20=2.0,构造
出20个长度相等的相邻区间。
15
• 3)统计第j个区间所包括的观测数据数目占所有观测数据 数目的比例gj,下表中列出了具体数值。
16
• 4)根据上表给出函数h(X)。
• 5)将连续的区间在横轴上表出,将函数h(x)的数值在纵
轴上表出,画出直方图。
从图形上看,间隔符合服从指数分布。
• 6)将直方图与理论分布的概率密度函数曲线做比较。17
•要注意选择区间宽度
18
19
4.3.2 离散型随机变量分布类型的辨识
(1)点统计法
与连续型随机变量点统计法方法相同,同样是采用计 算偏差系数的方法,寻找偏差系数相近的理论分布进行假 设。
20
(2)线图法
• 线图法是把采集到的数据与假设的理论分布的概率质量函 数曲线进行比较。如果找到相近的,则可以假设其为该理 论分布。 • 具体做法步骤如下: ① 设观察数据为:x1,x2,…,xn; ② 将其按递增顺序排列,设共有 m个取值(m≤n),分别 为:x(1),x(2),…,x(m); ③ x(i)的数据个数占整个观测数据个数的比例数为hi; ④ 以x(i)作为自变量,以hi的值为函数值,即: hi=f(x(i)),i=1,2,…,m; ⑤ 由函数值 hi向相应的自变量 X(i)做垂线所得的图形称为 线图(见下图 ); ⑥ 与假设的理论分布的概率质量函数比较,确定随机变量 的分布。 21
22
• 例:观测在.7:00am~7:05am时间段内到达 某十字路口西北拐角的车辆数目。每周观测 5天, 连续观测 20周,在 5分钟内到达的车辆数目列表 4.5中。
23
24
4.4 参数估计 • 用直方图或线图确定样本数据服从的理论分布之后, 还要根据已经观察到的样本计算出理论分布的参数。 如果可以确定理论分布的参数,我们就建立了输入
参数的一个数学模型,可以用前面(第三章)介绍
的方法来生成随机变量的数值。
25
• 按照统计学的说法,假设某随机变量的总体分布是F,分
布F的参数未知,要用已经观测到的部分样本来计算全部 样本总体分布F的参数的真值,这样的统计推断问题被称 为估计(Estimation)。 • 在数理统计学中有许多参数估计的方法。