数据挖掘课程论文
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
廊坊师范学院
《数据挖掘》课程论文
题目:国内游客总人数的时间序列分析学生姓名:xxx
任课老师:曹慧荣
院别:数学与信息科学学院
系别:信息与计算科学系
专业:信息与计算科学
年级:2011级本科1班
学号:xxxxxxx
完成日期2014年6月18日
数据挖掘本科生课程论文
论文题目:国内游客总人数的时间序列分析
摘要:研究的问题:通过对国内游客总人数的变化研究,研究各年人数的变化规律,挖掘有价值的信息.研究的方法:时间序列分析与预测,建立霍特双参数指数平滑模型,对历年的旅游总人数进行分析.得到的结论:旅游人数逐年上升,中国旅游业的前景非常的可观,中国旅游产业发展到一个新阶段,同时也从侧面反映了人们的物质生活条件的提高.
关键词:旅游总人数;时间序列;预测;霍特双参数指数平滑模型.
Title:Time Series Analysis of the Domestic Total Number of Visitors
Abstract:Research: Through the study of changes in the total number of domestic tourists, the number of studies each variation, the excavation of valuable information. Methods: Time series analysis and forecasting, establish Holt two-parameter exponential smoothing model, the total number of tourists over the years analyzed. The conclusion: the number of tourists increased year by year, the prospects of China's tourism industry is very impressive, China's tourism industry to a new stage, but also from the reflection of the improvement of people's material living conditions. Keywords:The total number of tourist;Time series;Forecast;Holt two-parameter model.
1.引言
随着社会的发展,旅游业已成为全球经济中发展中势头最强劲和规模最大的产业之一,日益凸显它在国民经济中的重要地位.旅游业的发展以整个国民经济发展水平为基础并受其制约,同时又直接或间接地促进国民经济有关部门的发展.旅游业的发展经济、社会效益明显,能够促进促进我国产业结构调整和优化,为社会提供大量就业机会,提高人们的物质文化生活水平,在增进国际交流的同时促进招商引资,加快社会主义新农村建设步伐,以及促进经济与环境和社会的协调发展.
2. 霍特双参数指数平滑模型 方法
此模型适用于有线性趋势但没有季节性的序列.针对这种情况 ,霍特提出了对数列的水平和趋势值分别进行平滑 ,然后用这 2 次平滑的结果进行线性外推预测的方法 .霍特双参数指数平滑法使用 2个平滑参数(均在 0~1之间取值 )和 3个方程式 :
^()()(1)((1)(1))
()(()(1))(1)(1)()()()
t L t Y t L t T t T t L t L t T t Y k L t kT t =α+-α-+-=γ--+-γ-=+
这里,L(t)称为数据平滑值,T(t)为趋势平滑值.在简单的指数平滑中,第t+1期的估计值是第t 期的观察值与第t 期估计值的加权平均.如果序列有趋势,L(t)和L(t+1)之间就存在趋势差T(t).当序列呈上升趋势时,L(t+1)会低于实际值,当序列呈下降趋势时,L(t+1)会高于实际值.因此,霍特的方法是一种改进,在估计L(t)时,给L(t-1)加上一个趋势增量T(t-1),解决了估计值的时间滞后问题.这里的这个趋势增量也是一个指数平滑估计值:第t 期的趋势估计值T(t)是第t-1期的趋势估计值T(t-1)与这两期估计值之差L(t)-L(t-1)的加权平均值,也即是用第t 期与t-1期趋势平滑之差来修正第t-1期的趋势值.
3.国内旅游总人数的时间序列分析
数据源:中华人民共和国国家统计局: .cn/workspace/index;jsessionid=10F141EDD473DB4CDA5A1123471F9209?m =hgnd
关于中国近20年的旅游总人数的统计.
说明:数据的变量包括两个,一是年份,二是每年对应的国内游客(百万人次),利用时间序列分析与预测,分析1994年到2012年这19年的数据,预测2013年到2016年这四年的旅游人口变化.
分析流程:
1. 将“数据源”中的Excel 节点添加到数据流区域,将“国内旅游总人数”加载到该
节点,在“类型”标签下,把“年度”的方向设置为“无”,“国内游客(百万人
次)”的方向设置为“输出”.
2.添加“时间区间”节点,建立连接,将“时间区间”的间隔改为“年”,在“预报”
标签下,勾选“将记录扩展至未来”,预测期数为“4”.
3.建立时间序列散点图,将序列选定为“国内游客(百万人次)”,其他默认,单击
“执行”,得到如下散点图.
4.将“时间序列”节点添加到数据流中,选择“指数平滑”方法,选择Holts线性趋
势,其他默认即可.得到如下图结果
5.从图中可以看出,残差序列的自相关系数全部落入95%置信区间内,说明残差序