应用ARIMA模型分析杭州市上城区主要肠道传染病的流行特征及发病趋势文献综述

 2022-08-14 11:05:05

应用ARIMA模型分析肠道传染病的发病趋势的可行性

摘要:肠道传染病是危害公众健康的全球性重要的公共卫生问题之一,对其发病趋势进行预测,推断未来的流行趋势,可以为制定正确的防控策略提供科学依据,在一定程度上可以减轻各方面的损失。ARIMA模型可依据一系列随时间变化的数据来进行预测分析,并且有较好的预测效果,现已被广泛运用到传染病的预测及预警中。故本文将通过查阅文献,探讨应用ARIMA模型分析肠道传染病的发病趋势的可行性。

关键词:ARIMA模型;肠道传染病;发病趋势;可行性

肠道传染病是病原体经口侵入肠道并能由粪便排出病原体的一类传染病,是全球性重要公共卫生问题之一,发病率高,传播速度快,尤其在亚、非、拉地区[1],并且在一定条件下,如水源或食物被污染时易出现暴发性流行。在我国法定报告的肠道传染病共有8种,分别是甲类传染病中的霍乱,乙类传染病中的病毒性肝炎、伤寒和副伤寒、细菌性痢疾和阿米巴性痢疾,丙类传染病中的手足口病和除伤寒、副伤寒、除细菌性痢疾和阿米巴性痢疾外的其他感染性腹泻[2]。传染病的预测是在传染病爆发机制、传播机制及扩散规律的基础上,通过建立相关的预测模型进行分析,并结合历史的数据对其估计,对未来的发展状况进行预测,为提出预防控制措施提供有力依据。那么对肠道传染病发病率进行预测,推断其未来流行趋势,也可为制定正确的防制规划提供科学的依据。

ARIMA模型是时间序列分析方法中的一种,它的全称为求和自回归积分滑动平均模型法(Auto regressive Integrated Moving Average Model,简记ARIMA),是由博克思(Box)和詹金斯(Jenkins)于1976年提出,依据一列随时间变化且相互关联的动态数据建立的一种效果较好的预测分析方法,现被广泛运用到传染病的预测及预警分析中。其中ARIMA(p,d,q)称为差分自回归移动平均模型,AR是自回归,p为自回归项; MA为移动平均,q为移动平均项数,d为时间序列成为平稳时所做的差分次数[3-5]。ARIMA模型建立的步骤为:1.序列平稳性检验;2.对非平稳的原序列平稳化;3.对平稳的序列进行白噪声检验;4.模型识别,确定模型为ARIMA(p,q,d)或ARIMA(p,d,q)(P,D,Q)s;5.模型诊断和模型拟合优度评价:对残差序列进行检验以诊断模型是否有意义,包括参数是否有统计学意义,残差是否为白噪声序列[6]

构建ARIMA模型的前提是序列的平稳化,可以通过散点图或时间序列图检查方差齐性,来确定趋势性、周期性的现象存在与否。若存在上述现象,可采用差分、平方根变换、对数变换等方法使序列达到平稳化。再利用自相关分析的方法,来分析时间序列的随机性、平稳性以及季节性,然后根据自相关图和偏自相关图,选择自回归和移动平均阶数,确定备选模型。与前一阶段中的备选模型比较,选择最适合的模型。利用非线性最小二乘积法来估计模型参数,对模型的残差序列进行白噪声检验,用以判断ARIMA模型的适合性,如果不恰当,则返回第三阶段,重新选定模型。经过不断的调试比较,选出最佳的模型,此时残差序列为白噪声,标准化的BIC值较小,模型最简洁[7]

国外关于传染病的数学模型研究始于上世纪。Hamer等人(1906)提出了一种离散序列模型对麻疹病的传播进行了研究;Kermack和McKendrick等人(1926)提出了著名的SIR仓室模型和后续的SIS模型,对伦敦黑死病的传播展开了研究,该研究成果对后续的传染病模型研究具有重要的意义,奠定了动力学传染病模型的理论模型[8]

而在国内最早开始应用ARIMA模型进行肠道传染病的预测分析的,有金如锋等人(2008)利用ARIMA模型和GM(1,1)模型对全国甲型肝炎、痢疾、伤寒副伤寒等3种肠道传染病进行了分析,并比较这两种模型的准确率,结果表明对甲型肝炎、痢疾、伤寒副伤寒预测准确率较高的模型分别是GM(1,1)、ARIMA、GM(1,1)模型,故得出对于某种肠道传染病发病率的预测,应同时拟合几种模型的结论[9];也有张翼飞等人(2008)探讨ARIMA模型在肠道传染病预测中的应用,并且通过建立细菌性痢疾月发病数的预测模型,比较ARIMA(0,0,1)(0,1,1)12模型和ARIMA(0,1,1)12模型,表明ARIMA 季节乘积模型是一种短期预测精度较高的预测模型[10]

后来也有学者对单独或者几种肠道传染病进行了ARIMA模型的预测分析。最早如张文增等人(2009)运用ARIMA模型对北京市顺义区的细菌性痢疾进行预测分析,在考虑细菌性痢疾季节性的条件下,建立复合季节模型ARIMA(p,d,q)times;(P,D,Q)S,从而取得较满意的预测与预警效果[11];崔树峰等人(2009)在对北京朝阳区细菌性痢疾周报告发病率预测分析的过程中,应用时间序列分解法剔除时间序列的季节变动因素(S1),然后通过模型识别、参数估计及检验、白噪声检验等过程,建立求和自回归移动平均模型(ARIMA),最后将S1和ARIMA相乘得到预测模型,得出时间序列分解法可以利用按“周”统计的数据进行预测,以此缩短预测周期,还有较高的短期预测精准度[12]

剩余内容已隐藏,您需要先支付 10元 才能查看该篇文章全部内容!立即支付

发小红书推广免费获取该资料资格。点击链接进入获取推广文案即可: Ai一键组稿 | 降AI率 | 降重复率 | 论文一键排版