数据挖掘技术在农产品期货价格预测中的应用研究
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
数据挖掘技术在农产品期货价格预测中的应用研究
邢小丹刘锋易孟华
(塔里木大学信息工程学院,新疆阿拉尔843300)
摘要数据挖掘技术能够获取农产品期货价格的周期性变化规律,在价格预测精度方面具有较好的表现,对于维护农产品市场稳定、指导农产品交易商决策具有一定的参考意义。
本文在介绍农产品期货价格特点、数据挖掘技术概况、农产品期货价格预测要素等的基础上,总结了数据挖掘的主要技术。
关键词数据挖掘技术;农产品期货;价格预测
中图分类号F322文献标识码A
文章编号1007-5739(2023)08-0217-04
DOI:10.3969/j.issn.1007-5739.2023.08.057开放科学(资源服务)标识码(OSID):Research on Application of Data Mining Technology in Forecasting the Agricultural
Products Futures Price
XING Xiaodan LIU Feng YI Menghua
(College of Information Engineering,Tarim University,Alar Xinjiang843300) Abstract Data mining technology can obtain the periodic change rules of futures price of agricultural products, and has good performance in price forecast accuracy.It has certain reference significance for maintaining the stability of agricultural products market and guiding the decision-making of agricultural products traders.This paper summarized the main techniques of data mining on the basis of introducing the characteristics of agricultural products futures price, the overview of data mining technology and the forecasting factors of agricultural products futures price.
Keywords data mining technology;agricultural products futures;price forecast
农产品期货价格波动对于社会稳定和经济发展至关重要。
随着农产品需求的迅速增长,农产品价格也变得极不稳定,众多国家分别从宏观、微观层面针对稳定农产品价格提出多项市场措施。
通常情况下,有效稳定农产品供给和需求所采取的手段为宏观价格调控。
因此,有效预测农产品期货价格变化趋势对稳定农产品期货市场具有一定的积极意义。
为了确保广大农户的种植收益,我国政府相继出台了诸多政策,但政策运行成本大,而且可能会扭曲市场信息,因而采取市场化的风险规避手段才是更优选择。
近年来,农产品期货市场在国内快速发展,国际市场参与度也在不断提升,对我国国民经济发展影响较大。
但是,我国的市场参与者对市场的把握、操作能力相对较弱,相关研究存在一定的滞后性。
通过科学的研究方法把握期货市场价格运行规律,能够有效提高国内市场管理水平,提高管理制度建设的科学性,使之符合市场规律。
对市场参与者来说,该项研究有利于更准确地认识与把握市场,提高操作准确性,降低失误发生率。
对企业来说,采用套期保值的方法,能够有效顺应市场趋势,从而提高企业竞争力。
对农户来说,通过研究期货市场农产品价格变化,充分发挥农产品期货的价格发现功能,可以正确地引导农民合理化种植,使农民的基本利益不受损害。
随着互联网技术的不断发展和用户群体的普及,农产品期货市场也发生了翻天覆地的变化,数据挖掘技术在农产品期货市场研究中的应用越来越广泛。
农产品期货市场每天都会产生大量实时数据,这些数据背后隐藏着许多有价值的信息和规则,可使用数据挖掘技术进行分析。
此外,农产品期货分析预测过程是基于特定知识的决策过程,这与数据挖掘的应用领域也是一致的。
充分利用现代信息与智能技术也能起到农业创
作者简介邢小丹(1998—),女,山东青岛人,在读硕士研究
生。
研究方向:农业信息化。
收稿日期2022-08-16
20238
217
20238
新发展新模式示范作用,从而带动农业经济的发展。
因此,研究数据挖掘技术在农产品期货价格预测中的应用是必要的,也是具有重大现实意义的。
1农产品期货价格的特点
许多学者研究发现,商品期货价格会有集体上涨或集体下降的现象。
这样的集体变动通常是宏观冲击或通货紧缩,或者在生产、消费中存在替代关系造成的[1]。
商品价格的协同变动不仅存在于具有相关关
系的商品之间,在供给和需求的交叉弹性为零的不相关商品之间也会存在价格同升同降的现象。
农产品期货间的协同变动一般主要划分为生产关系和替代关系2种主要类型。
1.1生产关系
农产品之间的生产关系是指一种产品可以通过对另一种产品的加工而得到。
例如,可以通过压榨大豆得到豆粕和豆油,通过压榨油菜籽得到菜粕和菜油,这些都是在商品期货市场上交易活跃的商品期货品种。
1.2替代关系
替代关系是指2种或2种以上的商品之间可以在消费中相互替代。
例如,豆油与菜籽油之间是替代竞争关系,豆粕与玉米在饲料方面存在替代关系,豆粕与菜粕也存在部分替代竞争关系。
正是由于农产品期货品种间存在生产和替代的关系,一种农产品的期货价格收益便不再只受自身价格和库存量的影响,也可能受其他农产品期货价格的影响,出现农产品期货间协同变动现象[2]。
2农产品期货价格预测相关理论研究
目前,农产品期货价格预测主要采用决策树算法、BP神经网络等基本机器学习算法,这些算法在数据基础上进行算法的训练和结果的预测,有效性和可行性良好。
另外,在很多基础算法上进行改进,例如,BP网络中激励函数选取时,通过动态调整函数中的参数提高模型准确度,可对价格进行提前预测[3]。
罗光
华等[4]在梯度提升决策树模型的基础上,用遗传算法
经行优化学习率等参数,基于实证分析,GA-GBDT模型提高了结果的准确度。
何继锐[5]基于石油价格数据,提出了与传统方法结合的EMD(经验模式分解)改进模型,通过数据分解及预测,使预测结果更为理想。
Wang等[6]提出了DPFWR神经网络模型,这种新型的DPFWR混合网络算法是将双重并行前馈神经网络和小波分析理论与随机时间有效函数相结合。
Clark等主要对量价之间的关系进行了研究,结果显示,期货成交数量和价格波动有一定的正向相关关系。
1993年,Grudnitski等[7]运用神经网络算法预测了期货指数和黄金的期货价格。
Dhar等[8]使用决策树和随机森林集成算法来预测股票回报率,以期降低投资风险。
Sim等[9]在动态数据抽样时,引用了一种标准差的方式对马来西亚的期货指数波动率进行预测,通过对价格均衡的量化来做出可靠的分析和决策。
这些理论研究为农产品期货价格预测提供了理论基础。
3数据挖掘技术简介
数据挖掘(data mining,简称DM)技术是从大量数据中提取有用的知识,其挖掘算法种类多样,效率普遍较高。
目前,数据挖掘研究主要集中在数学算法的改进和各个领域的具体创新应用上。
挖掘分析的具体过程可以分为以下步骤:①业务理解。
从业务出发点了解项目指标和需求,转变思维,形成数据挖掘技术解决方案,规划初步解决方案,实现拟定目标,这是理解和定义的一种方式。
②数据理解。
收集大量的相关数据,开展各种可理解数据的活动,包括对数据的描述、预测和验证。
描述数据信息,表达最基本的想法,通过预测猜测数据想要表达什么,进一步验证数据。
③数据准备。
构成最终适合分析和处理的数据集,包括表、记录和属性的选择,数据变换和数据清除。
④建模。
选择与实际情况相符合的挖掘技术,采用具体方法挖掘数据参数。
⑤模型评价。
对所构建的模型进行评价,然后检查构建模型的每一个操作步骤,确定是否完成了最初拟定的业务目的。
模型评价是对最初的商业理解思想的彻底评价。
⑥发布。
在构建模型的基础上加强对数据的理解,即以用户可以使用的方式组织和表达其获得的知识体系。
在发布时,应该将活动模型应用到鞭策制定过程中。
4农产品期货价格预测要素
4.1决策环境和损失函数
农产品期货价格预测是为决策服务的,对应每一个决策问题。
时间序列的预测问题通常假设预测值和实际值是在一个连续的区间内变动,因而需要建立一个更为一般的损失函数。
4.2预测目标
农产品期货价格预测目标有多种,典型的有三类
218
事件:一是结果预测,指在某一个给定时间内,可能发生的某个事件,但事件的结果是不确定的;二是事件发生时间预测,指可能发生某个事件,事件的结果也是已知的,但是事件发生时间是不确定的,可以用来对农产品期货价格拐点出现时间进行预测;三是时间序列预测,指预测某一时间序列的未来值,是最常见的一类问题。
4.3预测说明
预测前必须确定预测的类型,是单一的数值(最优预测值),还是未来值的一个区间,还是未来值的一个完整的概率分布,是做点预测,还是给出时间序列未来发展趋势的一个简单、直接的结果。
但是,随机的和其他不可预测的“噪声”往往会对时间序列产生冲击,会产生预测误差。
区间预测,即根据样本数据计算得到序列未来真实但未知的一个置信区间,其概念与统计学中的置信区间类似,因而区间预测不是一个简单的预测值,而是一个区间,即我们期望序列的实际值以一定的概率落入区间。
密度预测,其给出了序列未来值的完整概率分布,比点预测和区间预测给出更多的信息。
值得注意的是,信息预测方法越多,所需数据越多,相关假设越多,计算方法越先进、越复杂,相对成本也就越高。
4.4预测水平
预测水平是指从现在到预测期的时间跨度,其重要性体现在预测水平的变化,最佳预测模型也随预测水平的变化而变化。
4.5方法与原则
根据具体情况选择理想预测方法或建模策略,即根据预测任务来选择预测工具。
在其他条件相同的情况下,简约原则比复杂原则简单,收缩原则通过约束预测来提高预测效果。
5数据挖掘的主要技术
5.1决策树算法
决策树算法是一种归纳学习算法,它能够从一组毫无规律的数据样本集合中推理出决策树具体的表示形式及分类规则。
常用的决策树算法有ID3算法、C4.5算法等。
在ID3算法中,Entropy(信息熵值)是一个重要概念,同时它也是信息论中最核心的概念。
信息论是应用数学和计算机科学中的重要分支,具有重要的应用价值。
信息熵描述的是变量取值概率的不确定性,不确定性越大,熵值越大。
某件事出现的概率越大,不出现的概率越小,其确定性就越大,熵值就越小;某件事出现的概率和不出现的概率越接近50%,其不确定性就越大,熵值就越小。
C4.5算法作为十大经典数据挖掘算法之一,因其独特的优点[10],在数据挖掘技术中占有极其重要的地位。
C4.5算法分类规则简单,按照属性划分逐步建立得到的决策树易于理解。
它可以处理属性值为连续属性和离散属性的数据,可以对大部分数据集建立决策树,并进行分类和预测,也可以通过剪枝操作来降低噪声数据对分类精度的影响,提高分类器的准确率。
因此,决策树算法在农产品期货价格预测方面具有一定的应用前景。
5.2神经网络
BP(back-propagation)神经网络是在1986年由Rumelhart和McCelland等人提出的一种后向传播算法[11]。
BP过程根据数据训练确定节点间连接的权重,从输出中得出实际值和估计值之间的最小均方误差,旨在最小化网络计算的输出的总误差(或平均误差)。
神经网络首先为连接权重分配初始值,然后预测输出值和实际输出值之间的误差,并通过网络反向传播更新权重。
从理论上讲,神经网络可以在给予充分训练的情况下模拟任何类型的数据模式,在应用于预测之前,必须训练神经网络,通过神经网络对农产品期货进行预测,可提高其价格预测精度。
5.3模糊系统理论
模糊系统理论是由美国加利福尼亚大学伯克利分校的Zadeh教授在1965年提出的,透过模糊化将原本0和1的资料变成0到1之间的数值,其相较于非0即1的二分条件更接近人类思维。
它的优势在于不必对数据对象建立完整的数学模式,通常被用来简化系统设计的复杂性,特别适用于非线性、时变、模型不完全的系统。
随着模糊系统的发展,人们发现它对数据挖掘领域中的聚类、分类任务也有很好的适用性,并且已经有了一些成功的应用,这些应用体现了模糊系统理论在智能控制和数据挖掘领域的适用性。
区别于传统集合中根据二分条件将数据划分成属于和不属于当前集合的理论,每个模糊集都有一个隶属函数(membership function),其值允许取闭区间[0,1]中的任何实数。
隶属函数又称归属函数或模糊元函数,用于表示元素属于某一模糊集合的程度,主要有三角形、梯形、高斯型等。
219
20238
模糊系统的核心在于从数据和模糊集中提取一系列的“IF-THEN”规则,通过这些规则来进行模糊控制或者完成一些分类聚类的任务。
模糊规则的提取方式和定义方式决定了模糊系统的适用性和可解释性。
通常情况下,每个属性上的模糊集使用and连接来形成一条规则,代表需要同时满足,有时也会用or 来连接,代表只需满足其中一个模糊集的条件。
对于相互冲突的“IF-THEN”规则,可以根据置信度来确定保留哪一条,通过删除置信度小的规则来保证模糊规则库的一致性。
模糊系统理论对农产品期货价格预测提供了技术支持,有利于农产品期货价格预测研究的开展。
6结语
农产品期货市场在稳定市场经济和促进市场发展方面有着关键作用。
在农产品期货交易模式下,企业成本、风险控制面临诸多复杂与不确定性因素、决策面临巨大挑战。
人才、资金、信息、物流、管理等市场要素关系复杂、相互作用,利用数据挖掘技术发掘要素间耦合模式与量化关系,可以合理利用社会闲置资金,规避市场风险。
随着农产品期货市场的逐渐发展,人们更加强烈地关注市场潜在的风险和风险所带来的巨大经济损失。
对于生产者来说,农产品期货价格走势有利于农户了解农产品销售价格,辨别销售价格是否合理;对于交易者来说,价格预测与智能分析为其提供了较好的投资投机机会;对于管理者来说,农产品期货价格预测为农业发展提供了保障。
因此,对农产品期货价格走势进行研究,无论是对农产品生产者、交易者、管理者还是国家都具有重要的理论意义和现实意义。
7参考文献
[1]宋朔,周绩宏,牛桂草,等.苹果期货价格发现功能研究[J].
中国果树,2022(4):98-103.
[2]牟敦国,韩玉.商品期货学[M].厦门:厦门大学出版社,2010.
[3]向小东,郭耀煌,刁尚敏.BP算法的改进及其在股票价格
预测中的应用[J].西南交通大学学报,2001,36(4):425-427.
[4]罗光华,陈江,柯翔敏.关于期货商品交易价格预测仿真
研究[J].计算机仿真,2018,35(9):421-426.
[5]何继锐.自组织组合预测模型的EMD改进在石油期货市
场中的应用[D].成都:电子科技大学,2008.
[6]WANG B,WANG J.Energy futures prices forecasting by novel DPFWR neural network and DS-CID evaluation[J]. Neurocomputing,2019,338:1-15.
[7]GRUDNITSKI G,OSBURN L.Forecasting S&P and gold fu-tures prices:an application of neural networks[J].Journal of Futures Markets,1993,13(6):631-643.
[8]DHAR S,MUKHERJEE T,GHOSHAL A K.Performance evaluation of Neural Network approach in financial predic-tion:evidence from Indian market[C]//2010International Conference on Communication and Computational Intelli-gence(INCOCCI).Erode,2010:597-602.
[9]SIM K H,SIM K Y,THENHANG-HVI P.Forecasting price volatility cluster of commodity futures index by using stan-dard deviation with dynamic data sampling based on signifi-cant interval mined from historical data[C]//2014Interna-tional Conference on Control,Decision and Information Technologies.Metz,2014:758-763.
[10]郭超.农产品价格数据挖掘与趋势预测模型的研究[D].
济南:山东大学,2009.
[11]殷书彦,杜庆东.基于蚁群算法的ACO-BP神经网络性
能研究[J].黑龙江科技信息,2015(22):178.
(上接第208页)
茶叶龙头企业、专业合作社、家庭农场和种植大户间的良好配合,也需要政府的高度重视,给予政策和资金扶持,支持茶园基地建设、企业产品研发、品牌推介等。
5参考文献
[1]吴金涛.近代六安城市文化研究[D].南昌:江西师范大学,2019.
[2]胡晓云,李闯,魏春丽,等.2021中国茶叶区域公用品牌价
值评估报告[J].中国茶叶,2021,43(5):32-51. [3]丁菲,荣先卓,严家东.六安市裕安区茶产业发展现状及
对策[J].安徽农学通报,2018,24(19):29-30. [4]吴义鸿.新时期安徽省茶产业发展的态势及对策[J].茶业
通报,2018,40(1):3-7.
[5]李书田.发展订单农业是顺应市场经济现代化的必然趋
势[J].山东经济战略研究,2002(1):35-37.
[6]姜含春,赵荣.品牌文化和茶业品牌战略[J].农业考古,2005(4):
1-5. 220。