基于神经网络的组合预测法在医院管理工作中的应用

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

基于神经网络的组合预测法在医院管理工作中的应用
摘要
目的众所周知,随着中国加入WTO后,东西方的交流目益广泛,西方先进的技术和管理理念必然会对国内市场造成一定冲击,国内原有的医院格局将受到严嫒的挑战,医院要在发展中立足,就必须对医院的信息化管理提出更高、更新的要求,必须加快医院管理的现代化、科学化、规范化进程。

这也就要求统计工作者能够充分利用已有的时间序列资料,进行正确的统计分析和预测,给管理者提供量化的分析预测结果,以此作为今后工作方向的理论指导,避免管理工作的盲目性。

本文旨在通过对医院统计工作中的年度门诊人次和季度入院人次资料进行预测,以寻求一种较为适合医院时间序列资料的预测方法。

方法第一部分:收集了天津市某医院的1985年~2002年的门诊人次资料。

针对该资料的预测步骤为:首先给出四种不同的单项预测模型:三次指数平滑模型、三次多项式回归模型、灰色模型GM(1,1)、Box—Jenkins模型。

然后,采用人工神经网络(ArtificialNeuralNetwork,简称ANN)将以上这四种模型的拟合预测结果作为网络的输入,以实际的医院门诊人次作为目标输出,建立基于神经网络的组合预测模型。

同时以这四种方法的最优加权组合预测模型的结果作为对照,比较变权重与固定权重这两种方法的组合预测效果。

第二部分:按季度收集了天津市某医院的1996年~2001年的入院人次资料。

首先采用季节周期回归模型、温特斯(P.R.Winters)线性和季节指数平滑法、Box—Jenkins模型对该资料进行预测,然后采用人工神经网络将以上三种模型的预测结果进行组合预测。

第三部分:选取《数理医药学杂志》2000年13卷l期中的“最优加权组合预测法在河北省卫生人力预测中的应用”一文中的卫生人力资料,采用基于人工神经网络的组合预测法进行分析预测,并与该文提出的最优加权组合预测法的预测结果进行比较。

结果本研究中对门诊人次资料采用的四种单项预测模型按照预测结果的平均相对误差排序,由小到大依次为三次多项式回归模型
(O.0469)、灰色模型GM(1,1)(O.0655)、Box~Jenkins模型(0.0743)和三次指激平滑篌鍪(0.0789)。

采用最优加权组合预测模型将这几种模型进行组合预测,结果熙示预测精度有一定程度的提高(平均相对误麓=O.0543)。

但是由于邋足秘方法来链逶过kendall一致避捡验,z2—8。

625,P>0。

05,鼯单磺模型之间不具有一致性,因此我们寻求其他的组合预测方法。

最后采用基于神蜕网络的组合预测法对门诊人次进行预测,平均相对诶差为9。

996×10~。

另外,在对举节入院人次资料的预测中,基于神经嘲络的维合预测方法也戴示了嶷耋}戆颈溺缝票,平蟓糖怼误差菇9。

988Xt0一。

结论人m神经网络的特点在于它具有高度的自组织学习能力。

蜀箍示数蠢样本串所蕴涵靛;≥线毪荚系,能戬饪意耩度遥遥任惑函数。

而且在ANN模型中,各单颁预测模型的权系数不再是~常量,而是随时间变他的函数;某一种预测方法对缀台预测结粜的影响虽然与塞身的鞭测继果期投重煮关,但其权藿对缀合预测结果的影响是j#线性的。

遗就克服了最优加权组龠预测法权麓固定不变等缺陷,因此基予搴孛经潮终熬组会鞭测浚实襞上是一秽交援重系数豹组合预测方法。

变权熏系数组合预测模趔的蘸立和应用熙提高预铡模型的预测精度,增强疆溯耩鳖实掰性懿骞效途径。

综上所述,在非线性时序资料预测中,基于神经网络的组合预测法展现出了它不可替代的强大优势,可虢作舞统诗颡潮分柝静一个褥力助手在暇院管理统计工弦中加以应用。

关键避入工章睾经弱络(ANN)组岔预测医院管理
Box—Jenkins模挺时间序列
ObjectiveItisknowntoall,withChinabeingjoinedtheWTO,theexchangesofwest—eastbeingincreasinglyextensive,Westernadvancedtechniqueandthe
managementprineipiewillinevitablyimpactdomesticlocalmarket,andthestructureandformofthedomesticoriginalhospitalswillsuffertherigorouschallenge.Thenitmustputonthepaceofscientifichospitalmanagementmodernization.Andthisalsowillrequirethestatisticiancanmakethemostofthehistoricaltimeseriesdataofandpredict,andprovidethequantitativeforecastingresultstohospitaltoanalysis
hospitalmanager,whichisregarded船thetheoriesguideofthefutureworkdirection,avoidingtheblindnessofmanagementwork.Theobjectiveofthispaperistoexploreallappropriateandpracticalforecastingmodelfortimeseriesdamofhospital,throughforecastingtheyearlydataofoutpatientnumbersandtheseaSonaldataofinpatientnumbers.
MethodsPartOne:Inthisstudythedataofoutpatientnumberswerecollected
from1985to2002inthesomehospitalInTianjinCity.Theforecastingstopsofthedatawere嬲follows:First.fourdifferentsingleforecastingmodelsweregiven:cubic
modelandexponentialsmoothingmodel,cubicpolynomialregressionmodel,grey
Box--Jenkinsmodels.Then.itwasselupanonstationaryweightsmixforecaStingmodelbaSedonartificialneuralnetwork(ANN)withthreelayers.TheInputsofANNweretheforecastingvaluesofabovefourkindsofmethodsandoutputwastheactualtimeseries.Atthes&nletime,theresultofthenon-stationaryweightsmixforecastingmodelwascomparedwiththatofthestationaryweightsmixforecastingmodel,incontrastwiththeoptimalweightedmixforecastingmodel.
numberswerecollectedfrom1996PartTwo:hlthisstudythedataofinpatient
to2001byfour∞ssonsinthesomehospitalinTianjinCity.First,threedifferent
methodsweregiven:seasonalregressionmodel,Winters’singleforecasting
methodandBox--Jenkinsmodels.ThenANNWaSappliedtoexponenfialsmoothing
mixforecastingaccordingtotheresultsofabovethreemodels.
PartThree,"Itwasappliedthehealthmanpowerdataadoptedfromthe
articleentitled:‘'Applicationoftheoptimalweightedmixforecastingmodelinthe
healthmanpowerinHebeiprovince”inOoumalofMathematicalMedicine))V01.13,No.1,2000.AndtheresultofthemixforecastingmodelbasedonANNWaS
.1.
comparedwimthatoftheoptimalweightedmixforecastingmodel.
ResultsTheorderaccordingtothemeanrelativepercenterrorofforecastingresultfromlowtohi曲yeascubicpolynomialregressionmodel(0.0469),greymodel(O.0655),Box--Jenkinsmodelsandcubicexponentialsmoothingmodel(O.0789).Thesesinglemodelswereappliedtobuildtheoptimalmixforecastingmodel.Thecombinationresultsshowedthatforecastingprecisionwasimprovedtosomeextent,rel砒iveerrorwasO.0543.Butthesemethodscouldnotpassthekendallconsiaencytest(z2=8.625,P>0.os),namelytheydidnothavetheconsistencyamongthese
anothermixforecastingmethod.Finallyitwassinglemodels,SOwelookedfor
construmedthemixforecastingmethodbasedonANNtoforecastthenumbersofoutpatient.relativeerrorwas9.996×10一.
Inaddition,artificialneuralnetworkalsoseemedtoprovideadequateforecastsfortheseasonaldataofinpatientnumbers.relativeerrorwas9.988×10~.
and啪showthenonlinearConclusionANNhashighself-studyantity
relmionamongthedataofsamplewithstrongabilitytoapproximatefunctions.And
theweightcoefficientofanysinglemodelinANNisnolongeraconstant,butisafunctionwithtime.Althoughtheinfluencethatasinglemethodworkontheresultofmixforecastingmethodisrelevanttotheforecastingresultsandweightsofitself,itis
mixforecastingmethodbasedonANNovercametheanonlinearrelatiomThe
limitationofstationaryweightsonoptimalmixforecastingmodel,thereforeitisa
n酬帆.Itisavailabletoimprovemixforecastingmethodofnonstationaryweightsin
forecastingprecisionandtostrengthenpracticalitybybuUdingandapplyinganonstationaryweightsmixforecastingmodel.
ThisstudyindicatedthemixforecastingmethodbasedOnANNcouldprovide
data,aSareliantassistantinhospitalaccuratelyforecastsfornonlineartimeseries
managementwork.
KeywordsArtificialneuralnetwork(aNN)Hospitalmanagement
MixforecastingBox--JenkinsmodelsTimeseries
-4.
刚舌
在医院管理现代化进程中,统计预测己越来越广泛地被应用到医院的科学管理中去。

凡事预则立,不预则废。

通过对医院未来的发展进行科学地预测,可以为医院管理人员提供可靠的决策依据,使其更好地了解人们对未来医疗的需求,更合理地制定医院工作计划,同时对医院的现代化、科学化管理和宏观调控起到积极有效的推动作用。

在医院现代化管理中,统计预测的对象是多种多样的【】】,如门诊人次数;出、入院人次数;住院费用及医院床位发展情况等等,这些都是反映医院工作情况的重要指标,对其进行统计预测,可以作为制定医院工作计划以及科学决策的依据之一。

这对于医院加强管理,合理利用现有卫生资源,减少工作盲目性,无疑具有重要的现实意义。

因此本课题以门诊人次和入院人次为例,通过对这两种资料的预测模型进行探讨,来寻求一种较为适合医院时间序列资料的预测方法。

据不完全统计,目前已有的预测方法有300多种f2J,按其属性可以分为三类[3-4]:
1.定性预测技术用于缺乏定量数据或定量资料不完整的场合。

该方法主要以专家为索取信息的对象,组织各方面专家运用专业方面的经验和知识,通过对过去和现在发生的问题进行综合分析,从中找出规律,对未来做出判断。

该方法简单易行,花费的时间少,是应用历史较久的一种方法,至今在各类预测方法中仍占有重要地位。

但是存在片面性、准确度不高等缺点。

只能作为医院预测工作的一种辅助方法。

比如,医疗保健需求的定性预测等。

常用的定性预测方法主要有以下几种:个人判断法、专家会议法、特尔斐法、主观概率法等。

2.定量预测技术15]定量预测方法是用定量分析来研究事物的发展趋势,它以历史统计资料和有关信息为依据,运用各种数学方法来预测未来。

常用的方法有:指数滑动平均法、趋势外推法、周期预测法、Box—Jenkins法等。

3.计量模型预测技术用于研究预测因子与预测目标之间的因果计量的联系。

因为人们在预测事物未来的发展时,常常要分析有哪些因素对其有影响,它们之间密切程度又是如何。

比如,根据当地人口、医院床位数、事业经费等因素来预测医院工作人数等。

计量模型
预测包括回归分析、投入产出模型和宏观经济模型等,其中回归分析应用最为广泛。

然而人们发现任何一个模型,都是对实际系统的简化和抽象,不同的模型从不同的角度对系统进行模拟,因此各有所长和不足[61。

那么是否存在一种既基于这些预测模型,又能够博采众长的模型以便更好地完成预测任务呢?1954年Schmitt首次提出了组合预测的方法,对美国37个大城市的人口进行预测;1969年J.N.Bates和C.W.J.Granger对组合预测的理论和方法进行了系统的研究[7-s],从此组合预测方法受到理论界的极大关注,引起了众多学者浓厚的研究兴趣,发表了一系列的学术论文[9-…。

将不同的预测方法进行组合,其组合形式是多种多样的。

根据组合预测确定权系数的方法不同,可以将其分为:固定权系数组合预测模型和变权系数组合预测模型。

目前研究最多、应用最广泛的线性组合预测方法[121,可以认为是一种固定权系数的组合预测方法。

虽然该方法发展比较成熟,但是仍然存在着一些缺蹈,如对每一种单项预测模型而言,它总是表现出“时好时坏”性,对此固定权系数的方法显然不能满足这种预测需求,而相比之下应用变权重的方法就会合理得多,它有利于提高预测模型的预测精度,增强预测模型的实用性。

但是同时也对预测模型提出了更高的要求,因为权重系数可以看作是随时间变化的函数,确定其形式非常困难,所以目前变权重系数组合预测的研究并不多见,还处于初期发展阶段[13-141。

而人工神经网络(ArtificialNeuralNetwork,简称ANN)具有高度的容错性、联想性和自组织学习能力等特点,可以任意精度逼近非线性函数,非常适合模拟复杂的非线性系统【15]。

因此可以考虑采用ANN模型对变权重组合预测方法进行探讨研究,来提高医院时序资料的预测精度,寻求更为适合的统计预测方法。

本文将分三部分,分别对门诊人次年度资料、入院人次季度资料和文献资料嘲采用三层前向BP神经网络进行组合预测分析。

第一部分对门诊人次年度资料进行预测
资料来源与方法
一、资料来源
本资料来源于天津市某医院1985年~2001年的医院工作报表资料(见表1),数据准确可靠。

表I某医院1985--2001年门诊人次资料
年份}门诊人次x,年份t门诊人次_
(】0万)(10万)198514.044691994104.93581
198624.578031995114.23113
198734.997191996124.38013
198845.007231997133.57681
198954.754341998143.77689
199064.688141999154.25258
199174。

957432000164.88795
199284.940492001175.15178
199394.82814
二、预测模型和分析方法
本文首先给出四种不同的单项预测模型:三次指数平滑模型、三次多项式回归模型、灰色模型OM(I,I)、Box—Jenkins模型,并给出各预测模型的预测结果和拟合误差。

然后,采用人工神经网络(ANN)将这些模型的拟合预测结果作为网络的输入,以实际的医院门诊人次作为目标输出,建立基于人工神经网络的组合预测模型。

同时给出这四种方法的最优加权组合预测模型的结果作为对照,比较变权重与固定权重这两种方法的组合预测效果。

为了便于比较,将在ANN之前先讨论最优加权组合预测模型。

三、统计分析软件
三次多项式回归模型采用SPSSforWindowslO.0软件包11”、Box—Jenkins模型采用SASforWindows6.12软件包、灰色模型GMO,1)、三次指数平滑模型和最优加权组合预测模型采用Exce]软件实现,神经网络模型的建模在MATLABforWindows6.11软件上运行【l“。

结果
一、时间膨捌图
本文首先绘制该医院历年门诊人次的时间序列圈,见图l。

掣毋
图l1985年-2001年门诊人欹时序圈
扶图1可戳看出。

该医院从1985年开始门诊人次(10万)呈上舞趋势,剽1988年达到一个蹇峰(5.00723),璇艨6筇的门诊量波动比较平缓,平均人次为4.85,从1995年开始门诊人次锐减,劐1997年黪至最低点<3,57681),嚣后又迅速上升,到2001年达到~个新的高峰(5.15178)。

从总体掰鼍看该序列存在较强的不规则性波动,这就撬示我稻薅该鼗蕹靛势毫军预溺鼙蔻会骞一定懿黠废。

本次臻究掇撂资料的性质首先选取了四种常见的单项预测模型,在建模过程中均采用1985年一2000年的数据对所选的模藏进行拟合建模,然后用2001年的数据作为组外回代,以评价所建模挺的预测效果,最后绘如2002年的门诊人次预测值。

二、瘟用三次攒数平滑法怼门诊人次进行预潮
(一)三次指数平滑预测模型的建立Dg-19]
垂予该资饕表褒搀毒蠢骞簿瓣{}塞线趋势,嚣扰考惑莓敬袋爱三次指数平滑法建立非线性预测模型进彳予统计预测,具体步骤如下:在三次指数平滑联测中,由于不同时裳静数据不是同等对待酶,所以给定一个权鬟系数口来计算平滑值:平滑值=ax(新数据)+(1-日)×(老数据)。

在实际计算时,数据处理怒按几缘分几次运行的。

以可”、
.8.
结果
一、时间膨捌图
本文首先绘制该医院历年门诊人次的时间序列圈,见图l。

掣毋
图l1985年-2001年门诊人欹时序圈
扶图1可戳看出。

该医院从1985年开始门诊人次(10万)呈上舞趋势,剽1988年达到一个蹇峰(5.00723),璇艨6筇的门诊量波动比较平缓,平均人次为4.85,从1995年开始门诊人次锐减,劐1997年黪至最低点<3,57681),嚣后又迅速上升,到2001年达到~个新的高峰(5.15178)。

从总体掰鼍看该序列存在较强的不规则性波动,这就撬示我稻薅该鼗蕹靛势毫军预溺鼙蔻会骞一定懿黠废。

本次臻究掇撂资料的性质首先选取了四种常见的单项预测模型,在建模过程中均采用1985年一2000年的数据对所选的模藏进行拟合建模,然后用2001年的数据作为组外回代,以评价所建模挺的预测效果,最后绘如2002年的门诊人次预测值。

二、瘟用三次攒数平滑法怼门诊人次进行预潮
(一)三次指数平滑预测模型的建立Dg-19]
垂予该资饕表褒搀毒蠢骞簿瓣{}塞线趋势,嚣扰考惑莓敬袋爱三次指数平滑法建立非线性预测模型进彳予统计预测,具体步骤如下:在三次指数平滑联测中,由于不同时裳静数据不是同等对待酶,所以给定一个权鬟系数口来计算平滑值:平滑值=ax(新数据)+(1-日)×(老数据)。

在实际计算时,数据处理怒按几缘分几次运行的。

以可”、
.8.
s产’、J;3’分别表示t时刻的第一次、第二次、第三次的平滑值,其公式分别为:
s;”=鼎,+G一群)《翌f1.1)
0n=嚣P+(1一囝s黧(1。

2>
sp=磊g产3÷(1一露)s篡(1.3)
对平滑值再作适当计算就可求得下述非线性预测模型
声,+r=q+岛,+ctT2(1.4)
式中丸,为t+T时刻的预涮值,丽r就是以f为起点向来来矫雅到T时刻,即到t+T时间。

模鹫中的参数q、魂、q胃用下列公式计算。

a,=搿“一3s;2’牛sr’fl,5)
岛2赤【(6-5a)sf"-2(5—4a)s尸+(4嘞)霸(116)
cf_南心’地j2‰;~(1.7)
(二)中阆过程的具体运算及预测结果
按照上述所给静公式(1.1—1.7)首先计簿该门诊资辩1985零-2000年的三次指数平滂值及预测模型参数q、真,0(见表2)。

由于非线性预测模型囊+r=峨+b,T+ctT2中的参数at、鱼、q是随着时间,的改变而改变的,因此模型不是唯一不交的,可以利用表2中t期的a。

、br、f。

参数值,代入预测模型,逐一求得t+l朝的预测篷。

最磊求褥熬预铡模型戈:
多16Ⅳ=4,326274—0。

01945T+O.00007T2
(三)预测误差分析[20-21】
赞建立豹豫测模整麓番缀蛏缝复熬该院鑫1985年班寒十死年熬
门诊量发展变化规律,可以通过计算预测值,比较实测值与预测值的相对误差来进行分析,结果见表3,图2。

由表3可以看出,由于数据存在波动,预测值与实测值之间的相
对误差大小不一,最小为O.00537,最大为0.23173,平均相对误差为O.07888。

将2001年的数据进行组外回代检验,2001年的预测值为4.30689,与实测值相比残差为0,84489,相对误差为0.16400。

表2
三次平滑值及非线性预测模型参数值
时间
原始值x
(f)(10万)
平滑值
5j2’
Jj鄄
8.
6.

4.044694.578。

34.997105.007234.754344.688144.957434.940494.828144.936814.23113
4.38013
3,576813.776894.252684.4408904.4683184.5740744.6607064.6794324.6811744.7364254.7772384.7874184.8172974.7000634.636077
4.424223
4.2947574.2863404.4408904.4453764。

4719154.5096734.5436254.5711354.6041934.638802
4.6船525
4.698284.6986364.686124
4.6337“
4.5659474.5100264.440890
4.4419874.4479734.4603134.4769754.4958074.5174844.5417484.5671034.5933394.6143984.6287434.6297444.6169844.5955934.44089
4.50绣J
4。

754454.913414.884394.825924.914184.957064.923784.950344.618684.478604.001183.803413.924540
0.014810。

067090.091770.070690.045950.057240.056590.039010.03723
加.04364
-G.06958-0.16581-0.18475-0.12929
0.000550.002440.003180.002160.001080.001420.001290.000550.00044--0.00259-0.00336一O.00667-0.00688"-0.0043216
4。

88795
4.406660
4.489353
4.574345
4.326274-(3.01945
0.00007
●口=0.20

5l’=s52);sr’=z,×口+三学×(1一∞。

4.44089
.10一
l23

56789012345
表3三次指数平滑模型预测值及误差计算结果
年份实测值
(x,)
预测值
(多,)
绝对误差
e=k一岁√
相对误著
8/X.
198519861987198819891990199l199219931994199519961997199819992000
14.04469
24.57803
34.99710
45.00723
54.75434
64.68814
74.95743
84.94049
94.82814
104.93681
1l4.23113
124.38013
133.57681
143.77689
154.25268
164.88795
4.44089
4.523i7
4.82399
5.00836
4.95725
4.87296
4.97285
5.01494
4.96333
4.98806
4.57246
4.40566
3.82870
3.61178
3.79093
O.13714
0.47393
0.18324
0.25402
0.26911
0.08447
0.03236
0.18680
0.02652
0.75693
0.19233
0.82885
0.05181
0.64090
1.09702
0.02996
0.09484
0.03660
0.05343
0.05740
O.01704
0.00655
0.03869
0.00537
0.17890
0.04391
0.23173
0.01372
O.1507l
0.22443
平均相对误差0.07888
5·3
,、4.9
蟹4.5
、一
篓4.1
3.7
+实测值
—●一预测值
3.3LJ———。

—1—。

—。

1—1—。

—1—。


19861988199019921994199819982000
年份
图2预测值与实测值比较
三、应用三次多项式回归模型对门诊人次进行预测
(一)数学模型的建立【13_22】
三次多项式回归模型为多=a+bt+ct2+dt3(2.1)
表3三次指数平滑模型预测值及误差计算结果
年份实测值
(x,)
预测值
(多,)
绝对误差
e=k一岁√
相对误著
8/X.
198519861987198819891990199l199219931994199519961997199819992000
14.04469
24.57803
34.99710
45.00723
54.75434
64.68814
74.95743
84.94049
94.82814
104.93681
1l4.23113
124.38013
133.57681
143.77689
154.25268
164.88795
4.44089
4.523i7
4.82399
5.00836
4.95725
4.87296
4.97285
5.01494
4.96333
4.98806
4.57246
4.40566
3.82870
3.61178
3.79093
O.13714
0.47393
0.18324
0.25402
0.26911
0.08447
0.03236
0.18680
0.02652
0.75693
0.19233
0.82885
0.05181
0.64090
1.09702
0.02996
0.09484
0.03660
0.05343
0.05740
O.01704
0.00655
0.03869
0.00537
0.17890
0.04391
0.23173
0.01372
O.1507l
0.22443
平均相对误差0.07888
5·3
,、4.9
蟹4.5
、一
篓4.1
3.7
+实测值
—●一预测值
3.3LJ———。

—1—。

—。

1—1—。

—1—。


19861988199019921994199819982000
年份
图2预测值与实测值比较
三、应用三次多项式回归模型对门诊人次进行预测
(一)数学模型的建立【13_22】
三次多项式回归模型为多=a+bt+ct2+dt3(2.1)
式中萝为某年门诊人次预测值,r为预测时间,依据最小二乘法原则需解下列正规方程组来求a,b,c,d。

砌+(∑f)6+(∑,2)c+(∑,)d=∑y
(∑r)a+(∑r2)6+(∑f3)c+(∑f4)d=∑≯
(∑f2)口+(∑f3)6+(∑f4)c+(∑f5)d=∑f2Y
l(∑t3)a+匹,4)6+(∑t5)c+(∑r6)d=∑r3Y
解上式联立方程组求得a,b,c,d后,代入模型中,的预报方程。

(2.2)
即得所求
(二)三次多项式模型的假设检验和拟合优度
首先检验拟合的曲线方程有无统计学意义。

用方差分析来检验,
其公式为,:坠!!旦生(






,e/y剩采
、。

然后在方程有意义的前提下,通过计算绝对误差、相对误差和决定系数R2等指标来分析该模型的拟合优度123】。

(三)具体计算结果
1.首先选取1985~2000年的门诊人次资料建立预测模型,用2001年数据进行组外回代检验。

按照公式(2.2)建立联立方程,计算得:a=3.3657,b=0.7700,g.-=·0.1045,d=-0.0038
由此得到三次多项式回归模型为:
多=3.3657+0.7700t—O.1045t2—0.0038t3
2.预测模型的假设检验和拟合优度分析
方程建立后首先进行假设检验,经方差分析得F=6.97,P=0.006,说明建立的方程有统计学意义。

然后进行拟合优度分析,即所建立的预测模型能否很好地反映该医院自1985年以来十几年的门诊人次发展变化规律,结果见表4、图3。

由表4可见,预测值与实测值之间的相对误差存在波动,最小为O.00203,最大为0.1467l,平均相对误差为O.04695,决定系数R2为0.635。

年份
实测值预测值绝对误差相对误差7
(z,)(j,)e=Ix,一多,je/x,
198514.044694.034930.009760.00241
198624.578034.518010.060020.0131l
198734.997104.837870.159230.03187
198845.007235.017420.010190.00203
198954.754345.079570.325230.06841
199064.688145.047270.359130.07660
199174.957434.943420.014010.00283
199284.940494.790950.149540.03027
199394.828144.612780.215360.04464
1994104.936814.431840.504970.10229
1995114.231134.271040.039910.00943
1996124.380134.153310.226820.05178
l997133.576814.101570.524760.14671
l998143.776894.138740.361850.09881
1999154.252684.287750.035070.00825
2000164.887954.571520.316440.06474
平均相对误差0.04695以2001年的数据进行组外回代检验,2001年的预测值为4.9246,与实测值相比残差为0.22718,相对误差为O.04410。


5-3
4.9
售4.5

《4—1
<3.7
+实测值
33-———J—·——L·--·-———‘———。

———·1··-o··——1———。

————1—————”——‘————————1———。

—‘。

198519871989199l1993199519971999
年份
图3预测值与实测值比较
四、应用灰色模型GM(1,1)对门诊人次进行预测‘24“1
(一)灰色模型GM(1,1)建立方法
GM(1,1)中括号内第一个1是建立模型为一阶微分方程,第二个
.13-
年份
实测值预测值绝对误差相对误差7
(z,)(j,)e=Ix,一多,je/x,
198514.044694.034930.009760.00241
198624.578034.518010.060020.0131l
198734.997104.837870.159230.03187
198845.007235.017420.010190.00203
198954.754345.079570.325230.06841
199064.688145.047270.359130.07660
199174.957434.943420.014010.00283
199284.940494.790950.149540.03027
199394.828144.612780.215360.04464
1994104.936814.431840.504970.10229
1995114.231134.271040.039910.00943
1996124.380134.153310.226820.05178
l997133.576814.101570.524760.14671
l998143.776894.138740.361850.09881
1999154.252684.287750.035070.00825
2000164.887954.571520.316440.06474
平均相对误差0.04695以2001年的数据进行组外回代检验,2001年的预测值为4.9246,与实测值相比残差为0.22718,相对误差为O.04410。


5-3
4.9
售4.5

《4—1
<3.7
+实测值
33-———J—·——L·--·-———‘———。

———·1··-o··——1———。

————1—————”——‘————————1———。

—‘。

198519871989199l1993199519971999
年份
图3预测值与实测值比较
四、应用灰色模型GM(1,1)对门诊人次进行预测‘24“1
(一)灰色模型GM(1,1)建立方法
GM(1,1)中括号内第一个1是建立模型为一阶微分方程,第二个
.13-
硕士研究生学位论文1是预测一个变量。

GM(1,1)的建模思路是:用原始数据置,经累加生成得到数据以,对Y,按GM思想建模,得生成模型的估计值岁,,将估计值萝,还原就得到原始数据的估计值量,。

具体的运算步骤为:
1.1一次累加生成数据,即:Y,=∑x,t=12,…,胛(3.1)
tel
1.2均值生成数据,即:2,=(Y,+y¨)/2t=2,3,…,n(3.2)
1.3建立GM(1,1)模型,即得一阶线性微分方程:
咖“)/击十ayo)=Ⅳ其中a、材和D为待定系数:
a={(”一1)卜∑XrZI]+[∑=Ⅲ∑一]l/D(3·3)
忙2Jo2忙2’
“={[∑:,]t-YXt=,】+【∑:2,】[∑z,】)/D(3·4)
152』‘2,‘2,‘2
D=(一一1)【∑=2r】一【∑:,】2(3·5)1.4累加数据的估计值
豇=口】一∥口】e1“。

’+叫Ⅱr=2,3,…,疗(3.6)1.5进行模型外推预测:
妻。

=竞一鼻。

(3。

7)·(二)具体运算及结果
2.1累加生成设1985年~2000年的时序分别是1、2……16,按公式(3.1)、(3.2)对各年的门诊人数进行累加生成,结果见表5。

2.2建立GM(1,1)模型根据表5数据按照公式(3.3)、(3.4)、(3.5)计算模型参数得到:口=O.011908,u=5.052586,故0—420.24966.e“190B(‘‘1’+424.29435
2.3原资料拟合检验
由预测值与实测值之间的相对误差(表6)可见,其中最小值为O.00020,最大值为0.20563,平均相对误差为O.06552。

按照公式(3.7)以2001年的数据进行组外回代检验,2001年的预测值为4.11172,与实测值相比残差为1.04006,相对误差为0.2叭88。

硕士研究生学位论文表5门诊人次GM(1,1)模型计算表
年份门诊人次
(x,)
累加人次平均累加人次
(Y,)(毛)
1985198619871988198919901991199219931994l9951996l997199819994.04469
4.57803
4.99710
5.00723
4.75434
4.68814
4.95743
4.94049
4.82814
4.93681
4.23113
4.38013
3.57681
3.77689
4.9.5268
4.04469
8.62272
13.61982
18.62705
23.38139
28.06953
33.01002
37.83816
42.77497
47.00610
51.38623
54.96304
58.73993
62.99261
67.88056
6.3337l
11.12127
16.12344
21.00422
25.72546
30.53978
35.42409
40.30657
44.89054
49.19617
53.17464
56.85149
60.86627
65.43659
2000164.8879573.0323470.45645
表6灰色模型GM(1,1)预测值及误差计算结果
实测值预测值绝对误差相对误差:牛份‘
(‘)(毫)e=I工,一毫lP/‘198514.04469一一一
19861987198819891990199l199219931994199519961997199819992000
4.57803
4.99710
5.00723
4.75434
4.68814
4.95743
4.94049
4.82814
4.93681
4.23113
4.38013
3.57681
3.77689
4.25268
4.88795
4.91585
4.85766
4.80016
4.74334
4.68719
4.63170
4.57687
4.52269
4.46916
4.41625
4.36397
4.31232
4.26127
4.21082
4.16098
0.33782
0.13944
0.20707
0.01100
0.00095
0.32573
0.36362
0.30545
0.46765
0.18512
0.01616
0.73551
0.48438
0.04186
0.72697
0.07379
0.02790
0.04136
0.00232
0.00020
0.0657l
0.07360
0.06326
0.09473
0.04375
0.00369
0.20563
0.12825
0.00984
0.14873
平均相对误差0.06552
.i5.









0,2


















因此模型识别的关键与难点在于所选择的模型既要保证能较好地解释数据,又不会造成过拟合。

理论上对于ARIMA模型,若有前口个偏自相关函数和前P个自相关函数与零有显著性差异,则阶数分别为P和q。

但在实际应用中,可能结果并不典型,所以必须尝试多种ARIMA模型,通过对这些模型的参数估计及相关统计量的计算,从中选择最优者[341。

图4差分前后时序自相关函数和偏自相差函数图
注:由上到下分别为原序列自相关函数图+差分后自相关函数图和差分后偏自相关函数图常用的一月n纠模型参数估计方法包括“极大似然估计法(MLE)”、“无条件最小二乘估计法”(ULS)以及“条件最小二乘估计法”(CL8)。

其中MLE法的计算耗时较多,而通常情况下CLS
硕士研究生学位论文
测效果达到最佳。

然后将2001年的数据进行组外回代,以检验训练好的网络的预测性能。

最后输出2002年的预测结果。

为提高网络的训练速率,利于网络收敛,首先对数据进行预处理,常用的归一化处理方法有最大最小法和标准化法,本研究采用最大最小法。

网络参数按照上述原则设定:网络采用4一12一l的拓扑结构,输入、输出层节点数分别为4、l,隐含层节点数经大量实验最终确定为12;最小学习速率为0.9:允许误差为0.000l;隐含层传递函数采用双越正切函数(tan—sigmoid函数),(x)=乏之,输出层采用线
e山e
性传递函数。

按照设计好的网络参数,对网络进行训练学习,训练过程见误差迭代收敛曲线图(见图7)。

如图所示,横轴为训练迭代次数,纵轴为训练误差,随着迭代次数的增加,可以看出误差迅速下降,在网络训练学习迭代次数约为445次时达到训练目标(goalerror=1X10“),网络稳定收敛,学习停止。

ANN网络全局平均相对误差E=9.996X10~。

此时网络的各层之间连接权值固定(见表13),网络结构已经形成。

图7网络训练学习过程误差迭代收敛曲线图
婴主婴壅生兰焦笙苎
表14三层BP神经网络模型预测值及误差计算结果
年份,专翟严雩篓乎。

嚣相≥害羞
1985l4.04469一一——
198624.578034.57750.000530.00012
t98734.997104.99810.001000.00020
198845.007235.00770.000470.00009
198954.754344.75490.000560.00012
199064.688144.69800.009860.00210
199l74.957434.94750.009930.00200
199284.940494.92930.011190.00227
199394.828144.8465O.018360.00380
1994104.936814.92700.009810.00199
19951l4.231134.22210.000970.00023
1996124.380134.38190.001770.00040
1997133.576813.57550.001310.00037
1998143.776893.77580.001090.00029
1999154.252684.25270.000020.00001
2000164。

887954。

88940.001450.00030
平均相对误差0.00010
八、结果补充
在课题数据处理即将结束时,得到了2002年的门诊人次实际数据为5.13l(1.0万)。

将该数据与本次研究得到的各模型2002年预测值进行比较,以考察模型的外推预测能力。

结果见表15,可见BP网络的外推预测结果是最佳的。

表152002年预测模型误差比较表
-30.
硕士研究生学位论文第二部分对入院人次季度资料进行预测
资料来源与方法
一、资料来源
本资料来源于天津市某医院1996~2001年的医院工作季度报表资料(见表16),数据真实可靠。

表16某医院1996~2001年入院人次季度资料
二、预测模型和分析方法
本文首先给出三种单项预测模型:季节周期回归模型、温特斯(P.R.Wintcrs)线性和季节指数平滑法、Box—Jenkins模型,然后建立ANN模型进行组合预测。

三、统计分析软件
季节周期回归模型、温特斯(P.R.Winters)线性和季节指数平滑法采用Excel软件,BOX--Jenkins模型采用SASforWindows6.12软件包实现。

神经网络模型的建模在MATLABforWindows6.1l软件上运行。

图10网络训练学习过程误差迭代收敛曲线圈
表21隐含膳与输几、输出层的连接权值
隐层神经元——_—————望拿星壁墨霆——;————一输出层神经元
J上j
l2.01841.8914—1.61920.6924
2.I.84831.6376-2.04340.0503
30.7527-2。

2807—2.1225-0.5947
4.0.3188-2.14462.36060.3443
51.99652.2218·1。

1623O.6762
-1.6723"0.960761.45532.3149
7-0.2819-0.5812-3。

13940。

3砬6
8.2.30651,88571.1822∞.2410
91.盯53,2.5795—0.32030.6636
10.0.3857—1.02623.01190.0056
lII.10282.9929—0.32490.4189
-0.1422121.6238-2.7262-0,4525
为检测训练好的网络的泛化能力,将前三种单项模型的2001年
的预测数据输入弼络,进行组外回代梭验,网络硬测值列入表22
为了便于比较这几种方法的预测结果,将预测误差分析结果汇总见袭23。

·37—
此时网络的各层之间连接权值见表25。

表25隐含层与输入、输出层的连接权值
图1l网络训练学习过程误差迭代收敛曲线图
为检测训练好的网络的预测性能,以1995年的数据进行组外回代检验,网络预测值为2.01760(10万),实测值为2.01759(10万),残差为O.00001,相对误差为4.956x10’6,预测精度达到99.99995%。

而文献中的组合预测模型对1985-1994年的卫技人员总数拟合结果显示:平均相对拟合误差为0.00516;对1995年的数据进行组外回代,预测值为2.02432(10万),相对误差为O.003,预测精度为99.65%。

由此证明采用基于神经网络的组合预测模型对时间序列资料进行预测结果优于最优加权组合预测模型。

.40.
硕士研究生学位论文
讨论
统计预测在医院管理中的意义与地位』58】
众所周知,随着中国加入WTO后,东西方的交流日益广泛,西方先进的技术和管理理念必然会对国内市场造成一定的冲击,国内原有的医院格局将受到严峻的挑战,面对医院之间的竞争,如何发挥优势,充分利用医院现有资源,如何开创医院管理的新局面都离不开预测。

通过对人民医疗需求的预测,可以更大限度地满足人民医疗保健需求。

通过对医院中长期规划预测,可以更有效、合理地使用人、财、物资源,实现人尽其才,物尽其力,优化组合,提高医院的社会效益和经济效益。

医院应开展的预测项目很多,如医院医疗保健服务的需求量预测、门诊量和住院量的预测、病床需求量的预测、医疗器械和药品需求预测、病人预后预测等。

本文选取其中的门诊人次和入院人次两方面资料进行预测,可以为医院管理者在部署新一年的工作计划时,对于医务人员的合理安捧、工作量的合理分配等方面提供理论依据,调动医务人员的工作积极性,从而指导医院实现“优质、高效、低耗”的管理目标。

统计预测模型建立的基本步骤1591
一般来说进行定量预测时,建立预测模型主要应该考虑以下几个步骤:
(一)根据预测目的和预测对象的特点,对系统进行较全面的分析,确定建模的基本方案。

预铡模型应该能够反映预测对象发展变化的规律,因此研究人员首先要根据预测目的选取正确的研究对象,然后通过研究对象的特点来分析整个预测系统的特征和变化规律,以便采用适当的模型或方法。

切忌生搬硬套别人的方法或书本上介绍的方法,更不要一味追求过高的预测精度,而使得模型过于复杂,反而降低了模型的可信程度,同时也可能没有什么实际意义。

此外,由于预测具有强烈的时间概念,因此模型中一定要反映对象随时间变化的规律。

如果有可能,最好把对象所处的系统也作为时变系统考虑在模型当中。

孤立的、片面的、静止的观点对建立预测模型是十分有害的,应尽力避免。

一般来说,在确定建模的基本方案时还应该有几种各选方案,不要一下子就认准。

相关文档
最新文档