概率统计在数学建模中的应用课件
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
人口发展方程
一阶偏微分方程
2019/11/27
太原理工大学
14
背景 • 一个人的出生和死亡是随机事件
一个国家或地区
平均生育率 平均死亡率
确定性模型
一个家族或村落
出生概率 死亡概率
随机性模型
对象
X(t) ~ 时刻 t 的人口, 随机变量. Pn(t) ~概率P(X(t)=n), n=0,1,2,…
e t
1
(7)
Dt的大小表示人口Zt在平均值 Et附近的波动
范围。(7)式说明这个范围不仅随着时间的延续和净
增长率r 的增加而变大,而且即使当r 不变时, 它也随着 和 的上升而增长,这就是说,当出生和死 亡频繁出现时,人口的波动范围变大。
E E(t)+(t)
进一步假设
4)bn与n成正比,记bn=n , ~出生概率; dn与n成正比,记dn=n,~死亡概率。
模型建立
由假设1~ 3,可知Z t t n可分解为三个互不相
容的事件之和:
Z t n 1且t 内出生一人; Z t n 1且t 内死亡一人; Zt n且t 内无人出生或死亡。
n0
E(t)-(t)
0
t
X(t)大致在 E(t)2(t) 范围内( (t) ~均方差)
2019/11/27
太原理工大学
25
实例1.3 传送系统的效率
背
传送带
景 挂钩
产品
工作台
工人将生产出的产品挂在经过他上方的空钩上运走,若工 作台数固定,挂钩数量越多,传送带运走的产品越多。
在生产进入稳态后,给出衡量传送带效 率的指标,研究提高传送带效率的途径
6
1.2 常见概率分布及其数字特征
二项分布 泊松分布 指数分布 负二项分布 均匀分布 正态分布
7
1.3 林德贝格-勒维中心极限定理
8
实例1.1 报童的诀窍
9
报童售报: a (零售价) > b(购进价) > c(退回价)
问 售出一份赚 a-b;退回一份赔 b-c 题 每天购进多少份可使收入最大?
区间估计:以一定的置信水平保证参数落入某 随机区间的一种估计,此法考虑到统计量的随 机性。因而较为常用。区间估计的方法有:枢 轴量法,大样本法,假设检验法,自助法( bootstrap法)
2019/11/27
太原理工大学
36
假设检验:用统计方法检验某种想法或问题是 否正确的一种统计手段。 原假设与备择假设:地位是不对等的 检验:在样本空间里考虑,如何切割样本空间 ,一部分支持原假设,一部分支持备择假设( 接受域,拒绝域) 两类错误 显著性水平 检验统计量(在原假设成立的 小概率事件原理
n 1
k 1
代入(4)并利用(3),则有
dE dt
(
) npn t n 1
Et
(5)
由(2)得 Et 的初始条件 E0 n0,求解微分方程(5)
在初始条件下的解为
Et n0ert , r
(6)
可以看出这个结果与指数模型 xt x0ert 形式上完全
的概率 p ,则 s mp 。
由于任何一只钩子被一名指定工人挂上产品的概
率
1 m
,挂不上产品的概率1
1 m
,即任一只钩子为空钩
的概率是
1
1 m
n
,非空钩的概率
p
1
1
1 m
n
。这样
传送带效率指标为
D m [1 (1 1 )n ]
n
m
若(一周期运行的)挂钩数m远大于工作台数n, 则
确定性连续模型,主要使用微积分、微 分方程及其稳定性、变分法等方法建立 模型;
3
随机性模型,是指研究的对象包含有随 机因素的规律,以概率统计为基本数学 工具,其结果通常也是在概率意义下表 现出来。随机因素的影响可以用概率、 平均值(即数学期望)等的作用来体现 。
4
1.1 概率论基础知识
5
r n 售出r 赚(a b)r
退回n r 赔(b c)(n r)
r n 售出n 赚(a b)n
n
G(n) [(a b)r (b c)(n r)] f (r) (a b)nf (r)
r0
r n1
求 n 使 G(n) 最大
dpn dt
bn1 pn1 t d n1 pn1 t bn
dn pn t
又由假设 4,方程为
dpn dt
n 1pn1t n 1pn1t
npn t
(1)
若初始时刻(t 0)人口为确定数量 n0 ,则 pn t 的初始
概率统计在数学建模 中的应用
1
1 概率模型
自然界中的现象总的来说可以概括为两 大现象: 确定性现象和随机现象。 在确定性现象中可以忽略随机因素的影 响,在随机现象中必须考虑随机因素的 影响。
2
确定性离散模型,主要使用差分方程方 法、层次分析方法以及比较简单的图的 方法和逻辑方法等方法建立模型;
a-b ~售出一份赚的钱 b-c ~退回一份赔的钱
P1 P2
0
n
r
(a b) n , (b c) n
实例1.2 随机人口模型
指数增长模型(马尔萨斯人口模型)
x(t) x0ert
阻滞增长模型(Logistic模型)
x(t)
xm
1
xm x0
1ert
D
m [1 (1 n
n m
n(n 1)
2m2 )] 1
n 1 2m
定义E=1-D (一周期内未运走产品数与生产总数之比)
当n远大于1时, E n/2m ~ E与n成正比,与m成反比
若n=10, m=40,
提高效率
D87.5%
的途径:增加m
2 统计回归模型
由于客观事物内部规律的复杂及人们认识程度的限 制,无法分析实际对象内在的因果关系,建立合乎 机理规律的数学模型.通过对数据的统计分析,找 出与数据拟合最好的模型.回归模型是用统计分析 方法建立的最常用的一类模型.
太原理工大学
34
统计推断:找到描述总体的真实分布或 对某些问题的解答,包括统计量的分布 ,参数估计(点估计,区间估计),假 设检验,统计决策等。
统计量的分布:相当于随机变量函数的 分布情况,大样本下的中心极限定理。
2019/11/27
太原理工大学
35
参数估计:点估计与区间估计
点估计:用样本值的某个函数值(即统计量的 值)作为参数值的估计。点估计的方法有:矩 估计法,极大似然估计法,最小二乘估计法, 贝叶斯估计法
按全概率公式有
pn t t pn1(t)bn1t pn1 t dn1t pn t1 bnt dnt
即
pn
tቤተ መጻሕፍቲ ባይዱ
t
t
pn t
bn1
pn1t
d n1
pn1t
bn
dn
pn
(t)
令t 0,得关于 pn t的微分方程
购进太多卖不完退回赔钱
分 析
购进太少不够销售赚钱少
应根据需求确定购进量
存在一个合 适的购进量
每天需求量是随机的
每天收入是随机的
优化问题的目标函数应是长期的日平均收入 等于每天收入的期望
准 调查需求量的随机规律——每天 备 需求量为 r 的概率 f(r), r=0,1,2…
建 • 设每天购进 n 份,日平均收入为 G(n) 模 • 已知售出一份赚 a-b;退回一份赔 b-c
问题分析
• 进入稳态后为保证生产系统的周期性运转,应假 定工人们的生产周期相同,即每人作完一件产品 后,要么恰有空钩经过他的工作台,使他可将产 品挂上运走,要么没有空钩经过,迫使他放下这 件产品并立即投入下件产品的生产。
• 可以用一个周期内传送带运走的产品数占产品 总数的比例,作为衡量传送带效率的数量指标。
• 工人们生产周期虽然相同,但稳态下每人生产 完一件产品的时刻不会一致,可以认为是随机的, 并且在一个周期内任一时刻的可能性相同。
模型假设
1)n个工作台均匀排列,n个工人生产相互独立, 生产周期是常数;
2)生产进入稳态,每人生产完一件产品的时刻在 一个周期内是等可能的;
3)一周期内m个均匀排列的挂钩通过每一工作台 的上方,到达第一个工作台的挂钩都是空的;
2019/11/27
太原理工大学
37
2.2 统计建模过程:
step1:理论建模(问题的形成及建模) 这部分事实上与数据无关,主要是用统计、概 率、数学语言去描述问题,然后形成统计模型 去表达该问题(主要考虑到随机性)。
注:一定要弄清楚问题的背景,避免遗漏重要因 素或包含不重要因子; 理解解决问题的目标; 确信客户要达到的目标; 用统计语言描述问题。
条件为
pn
0
1, n 0, n
n0 n0
(2)
(1)在(2) 条件下的求解非常复杂,且没有简
单的结果,不过人们感兴趣的是 EZ t和DZ t 。(以 下简记成 E(t)和 D(t) )
按定义
Et
npn
t
n1
对(3)求导并将(1)代入得
(3)
dE
2019/11/27
太原理工大学
32
2.1 统计基本概念
总体:研究对象的全体集合,在统计中往 往是用随机变量来刻画。
样本:相当于做试验,获得证据。数据 (或样本)的获取:抽样调查,试验设计, 记录观测数据
从数据中提取信息:统计量
常用统计量:中心位置(均值,众数,中 位数,分位数等)
研究Pn(t)的变化规律;得到X(t)的期望和方差
模型假设
若X(t)=n, 对t到t+t的出生和死亡概率作以下假设
1)出生一人的概率与t成正比,记bnt ; 出生二人及二人以上的概率为o(t).
2)死亡一人的概率与t成正比,记dnt ; 死亡二人及二人以上的概率为o(t).
3)出生和死亡是相互独立的随机事件。
4)每人在生产完一件产品时都能且只能触到一只 挂钩,若这只挂钩是空的,则可将产品挂上运走; 若该钩非空,则这件产品被放下,退出运送系统。
模型建立
• 定义传送带效率为一周期内运走的产品数(记作s, 待定)与生产总数 n(已知)之比,记作 D=s /n
为确定s,从工人考虑还是从挂钩考虑,哪个方便?
从钩子角度考虑,一周期内的 m 只钩子每只非空
dt
n1
nn
1pn1t
nn 1pn1t n2 pn t
n 1
n1
(4)
注意到
nn 1pn1t kk 1pk t
n 1
k 1
nn 1 pn1 t kk 1pk t
n
(b c)0 p(r)dr (a b)n p(r)dr
dG 0 dn
n
0
n
p(r)dr p(r)dr
a b bc
结果解释
n
0
n
p(r)dr p(r)dr
ab bc
取n使
n
0
p(r)dr
P1 ,
n
p(r)dr
P2
p
P ab 1
P bc 2
一致。随机性模型(6)中出生率 与死亡率 之差 r 即
净增长率,人口期望值呈指数增长,Et 是在人口数
量很多的情况下确定性模型的特例。
对于方差Dt ,按照定义
Dt
n2
pn t
E 2 t
n1
用类似求Et 的方法可以推出
Dt
n0
e()t
求解 将r视为连续变量 f (r) p(r) (概率密度)
G(n)
n
0
[(
a
b)r
(b
c)(n
r
)]
p(r
)dr
n
(a
b)np(r
)dr
dG (a b)np(n)
n
(b c) p(r)dr
dn
0
(a b)np(n) n (a b) p(r)dr
2019/11/27
太原理工大学
33
离散程度(方差,标准差,极差,四分 位极差,变异系数)
分布形状(偏度系数,峰度系数)
充分统计量:不损失有效信息的统计( 考虑方差达到最小的完备充分统计量)
衡量统计量的标准:无偏性,渐近无偏 性,相合性,均方误差(包含了方差及 偏差)
2019/11/27
2019/11/27
太原理工大学
38
step2:收集数据(抽样调查,试验设计,观测 数据)
注: 数据是观测到的,还是实验得到的? 如何收集有代表性的数据? 分类数据还是连续数据 数据是如何编码的? 数据测量的单位(量纲) 注意有没有异常数据