云计算环境下基于Markove随机过程的竞价实例价格预测方法文献综述

 2022-11-12 18:52:09
{title}{title}

文献综述:

一、 竞价型实例的发展及特点

云计算是继水、电、气和通信之后的第5效用[1]。出现了亚马逊弹性云EC2和存储云S3,微软Azure的PaaS等公共云[2],仅亚马逊2010年云计算收入就达5亿美元,市场分析机构Gartner预测世界云计算市场规模以每年27%的速度增长[3]

云计算是按需请求资源、按实际用量付费的运行模式,通过虚拟化技术将分布在不同地理位置的计算资源和存储资源封装成服务,向互联网应用提供基础设施即服务(IaaS)、平台即服务(PaaS) 和软件即服务(SaaS)的三大服务模式[4]。亚马逊EC2最早推出云计算服务—弹性计算云(EC2),2009年12月亚马逊提出了现货竞价实例的概念.目前EC2服务有3种定价模式:①按需运行实例(ODI)定价模式, 用户可以根据应用程序的需求提升或降低计算容量,采用按需付费方式,只需要按小时支付计算容量费用,无需签订长期合同或交纳预付款。这种模式与用电类似,用多少付多少,灵活性好,服务有保障,但是单价最高;②保留定制实例(RI)定价模式,用户可以提前预订EC2实例,通常是签订1年到3年的购买合同,并一次性支付费用,类似移动通信的包年和包月 “套餐”,服务质量与按需实例的服务质量相同,而且费用较低;③现货竞价实例(SI)定价模式,这是一种低折扣、竞标租用 EC2的闲置资源的定价模式[5],亚马逊根据供求情况会周期性的发布现货价格,当用户最高竞价高于其现货价格时,实例将运行,反之实例被自动终止[6]。用户可以随时购买,但是由于价格波动,服务随时可能会被中断,竞价型实例最多可以节省90% 的成本。

竞价型实例非常适合数据分析、批处理作业、后台处理和可选的任务。其具有以下优势:①优势充分发挥 Amazon EC2 容量的价值,如果您的出价高于竞价型实例价格,则竞价型实例会运行,并按以市场为导向的较低价格实现 Amazon EC2 的可靠性、安全性、高性能、可控制性和弹性;②降低运营成本,利用竞价型实例,最高可以将运营成本降低 50%–90%(与按需实例相比)。提高应用程序的吞吐量,客户可以在竞价型实例上运行和扩展应用程序,如无状态 Web 服务、图像渲染、大数据分析和大规模并行计算[7].由于竞价型实例通常可降低成本 50%–90%,因此您可以在预算不变的情况下,将计算容量提升 2–10 倍。但ODI和RI价格相对稳定,SI的价格却处于动态变化中,据统计通常现货竞价实例的价格比按需运行实例低52.3%,因此租用现货竞价实例可以大大降低成本,但是伴随着较高的服务中断风险。目前尚无云计算定价标准,如果出价过低,则用户请求的实例无法运行;如果出价过高,增加运营成本,而且失去了利用价格手段平衡系统负载的意义。因此了解实例的定价模式,预测实例价格进行合理投标,就目前来看,是个值得研究的热点问题。

二、 现有的价格预测方法

价格预测是依据市场经济规律,在价格监测的基础上,运用科学的方法,对未来价格的变动趋势及商品价格变化动态所进行的分析研究和判断,是社会经济的一个组成部分。价格预测方法较为多元,总体可分为两大类别,第一类是单一预测方法,第二类是组合预测方法体系。

单一预测方法主要包括:(1)传统计量经济与统计分析方法,如多元回归分析[8]、时间序列分析[9]等;(2)后期发展的现代预测方法,如灰色理论模型[10]、马尔科夫链[11]、logistic模型、小波分析[12]以及人工神经网络模型[13]等。其中传统计量经济和统计分析方法的最大优点就是方法简便,且方法更新发展很快,适应性强。但其缺点是在使用时具有严格的假设条件,再者不能很好地刻画出现实中数据的复杂性特征,用多元回归法进行预测时受制于变量的选取,而变量选取易受建模者本人的主观因素影响,进而影响到预测的精度。

正是由于各种单一预测方法会存在不同程度的优缺点,因而部分学者总是尝试将单一预测方法进行组合,以充分利用各单一方法的优点,避免其缺点,追求更高的预测精度。从构成组合方法体系的不同方法来看,主要包括以下几种组合。(1)同为传统计量方法的组合,如将 ARIMA模型与支持向量回归模型 (SVR) 进行组合来预测 CPI。(2)传统计量方法与现代预测方法的组合,如ARIMA模型、常规的固定参数线性回归模型、时变参数回归模型 (TVR) 和现代的马尔可夫转换模型分别对电价进行预测,并通过等权重的方式对单个模型预测的价格进行组合。(3)现代预测方法的组合,如有学者将神经网络模型与遗传算法组合起来预测黄金价格[14]

结果显示组合预测方法要好很多,但都必须要充分考虑时间序列数据的特性,并据此选取适合的方法加以组合。

其中时间序列分析预测法又分为:a.时间序列平滑法。进行短期预测,消除数据的极端值,以较平滑的中间值作为预测的依据。b.趋势外推预测法。当预测价格依时间变化呈现某种趋向,无明显季节波动,且能找到合适的函数曲线反映这种趋势时,建立趋势模型开展价格预测。c.季节变动预测法。季节变动是指价格由于自然条件、生产条件和生活习惯等的影响,随季节产生周期性变动。

但对于竞价实例的预测方法,已有研究只有针对小时为粒度的预测算法[15],且准确率不高。

三、 隐马尔可夫模型研究现状及特点

隐马尔可夫模型(Hidden Markov Model, HMM)作为一种统计分析模型,是序列数据处理和统计学习的一种重要概率模型,具有建模简单、数据计算量小、运行速度快、识别率高等特点。HMM广泛应用于图像处理,模式识别,语音人工合成和生物信号处理等领域的研究中,取得诸多重要的成果[16]。近年来还广泛应用于计算机视觉、金融市场的波动性分析和经济预算等新兴领域中。其在人的行为分析、网络安全和信息抽取中的新应用进行了综述。

HMM是一个双内嵌式随机过程,即HMM是一个双重随机过程,一个是隐含的状态转移序列,它对应一个单纯的Markov过程;另一个是与隐状态有关的观测序列。在这两个随机过程中,有一个随机过程(状态转移序列)是不可观测的,只能通过另一个随机过程的输出观测序列进行推断,所以称之为隐马尔可夫模型可用一个三元组表示[17],其难点是从可观察的参数中确定该过程的隐含参数。隐含状态可以通过观测向量序列观察到,每个观测向量都是通过某些概率密度分布表现为各种状态,每一个观测向量是由一个具有相应概率密度分布的状态序列产生。HMM在生物信息科学、故障诊断等领域也开始得到应用。

对于马尔可夫过程 (Markov Process),它因俄罗斯数学家安德烈·马尔可夫而得名,代表数学中具有马尔可夫性质的离散随机过程。[18]该过程中,每个状态的转移只依赖于之前的 n 个状态,这个过程被称为1个 n 阶的模型,其中 n 是影响转移状态的数目。马尔可夫链是随机变量 X1, hellip; , Xn 的一个数列。这些变量的范围,即他们所有可能取值的集合,被称为“状态空间”,而 Xn的值则是在时间 n 的状马尔可夫链是随机变量 X1, hellip; , Xn 的一个数列。这些变量的范围,即他们所有可能取值的集合,被称为“状态空间”,而 Xn的值则是在时间 n 的状态。

对 HMM 来说,有三个重要的假设:

假设1:马尔可夫假设(状态构成一阶马尔可夫链)

假设2:不动性假设(状态与具体时间无关)

假设3:输出独立性假设(输出仅与当前状态有关)

隐藏的状态和可观察到的状态之间有一种概率上的关系,也就是说某种隐藏状态 H 被认为是某个可以观察的状态 O1 是有概率的,假设为 P(O1 | H)。如果可以观察的状态有3种,那么很显然 P(O1 | H) P(O2 | H) P(O3 | H) = 1。

针对经典HMM应用中存在的两大问题,Beal[19]等人提出了无限状态隐马尔可夫模型(infinite Hidden Markov Model ,iHMM)。

在 HMM 中有三个典型问题:(一)已知模型参数,计算某一给定可观察状态序列的概率;(二)根据可观察状态的序列找到一个最可能的隐藏状态序列(三) 根据观察到的序列集来找到一个最有可能的HMM

目前,经典隐马尔可夫模型的研究及应用已趋成熟,有关HMM的方法很多,如二阶隐马尔可夫模型,改进的隐马尔可夫模型,自回归隐半马尔可夫模型[20],嵌入式隐马尔可夫模型等,并应用到自然语音识别、人脸识别及人脸表情识别中[21]。因此本课题拟提出基于Markove随机过程的价格预测方法,将HMM应用于竞价型实例价格预测是切实可行的。

四、 参考文献

[1]Rajkumar Burry,Chee Shin Yeo.Cloud computing and emerging IT platforms: Vision,hype and reality for relivering computing as the 5th utility[J].Future Generation Computer Systems,2009(25):599-616.

[2]Zhang Qi,Cheng Lu.Cloud computing:State-of-the-art and research challenges[J]. Journal Internet Servvices and Application,2010(1):7-18.

[3]Sean Marston,Li Zhi.Cloud computing the business perspective[J].Decision Support Systems,2011(51):176-189.

[4]Lin C, Su WB, Meng K, et al. Cloud computing security: architecture, mechanism and modeling[J]. Chinese Journal of Computers, 2013, 36(9):1765-1784.

[5]Paul Marshall,Kate Keahey,Tim Freeman.Improving utilization of infrastructure clouds[C]//11th IEEE/ACM International Symposium on Cluster,Cloud and Grid Computing,2011:205-214.

[6]Orna Agmon Ben-Yehuda,Muli Ben-Yehuda,Assaf Schuster,et al.Deconstructing Amazon EC2 spot instance pricing[C]//IEEE 3rd International Conference on Cloud Computing Technology and Science,2011:304-311.

[7]Chen Dong-lin,Chen Ling,Ma Ming-ming,Fu Min,Study of cloud computing IaaS spot instance pricing on Computer Engineering and Design,2013,34(10):3366-3370.

[8]Joanna Janczura,Stefan Truuml;ck,Rafa? Weron,Rodney C. Wolff. Identifying spikes and seasonal components in electricity spot price data: A guide to robust modeling,Energy Economics 2013(38) 96 -110.

[9]Tai - Liang Chen,Ching - Hsue Cheng,Hia Jong Teoh. Fuzzy time - series based on Fibonacci sequence for stock price forecasting,Physica A 2007 ( 380) 377 -390.

[10]张端端.基于灰色模糊理论的十二五期间河南省物价趋势预测及影响因素研究[J].常熟理工学院学报:哲学社会科学,2012( 7) .

[11]王盼玉.灰色amp;马尔可夫模型在消费者物价指数预测中的应用[J].时代金融,2012( 5) .

[12]葛根,王洪礼,许佳.小波分频技术和混沌时间序列在国际石油价格预测中的应用[ J].系统工程理论与实践,2009( 7) .

[13]李文哲,李晟,刘保成.基于神经网络与遗传算法的物价走势模拟与预测系统[ J].人工智能与识别技术,2012( 3) .

[14]陈光华.人工神经网络在证券价格预测中的应用[J].计算机仿真,2007( 10).

[15]Guo HS, Wang WJ. Dynamical granular support vector regression machine. Ruan Jian Xue Bao/Journal of Software, 2013,24(11):2535-2547.

[16] Bilmes JA. What HMMs can do. IEICE TRANS- ACTIONS on Information and Systems, 2006,89(3):1-24.

[17] Rabiner LR A tutorial on hidden Markov models and selected applications in speech recognition. Proc. of IEEE, 1989,77(2):257-286.

[18]刘河生, 高小榕, 杨福生. 隐马尔可夫模型的原理与实现[J]. 国际生物医学工程杂志, 2002, 25(6):253-259.

[19]Beal MJ, Ghahramani Z, Rasmussen CE. The Infinite Hidden Markov Model. Dietterich ed. Advances in Neural Information Processing Systems. Cambridge, MA:MIT Press, 2002:577-584.

[20]刘震, 王厚军, 龙兵,等. 一种基于加权隐马尔可夫的自回归状态预测模型[J]. 电子学报, 2009, 37(10):2113-2118.

[21]王志堂, 蔡淋波. 隐马尔可夫模型(HMM)及其应用[J]. 湖南科技学院学报, 2009, 30(4):42-44.

发小红书推广免费获取该资料资格。点击链接进入获取推广文案即可: Ai一键组稿 | 降AI率 | 降重复率 | 论文一键排版