基于地铁刷卡数据的乘客时空出行模式分析及行为预测文献综述

 2022-09-27 14:45:47

文献综述(或调研报告):

国外研究概况

有关于人类移动性,以往多数研究停留在群体层次上。Alexander[11]等根据出行目的与时间判断出行的起终点(Origin–Destination,OD)并研究了群体大小对预测准确度的影响。Chao[12]等在群体层次上使用联合熵按照用户出行的规律性将出行群体分成了3种,并且发现了用户访问最频繁地点的逗留时间与出行时间都有其区别于访问其他地点的时间特性。但越来越多的学者开始关注个体层次上的移动性预测,Brockmann[13]等发现个体的移动也具有很高的规律性与可预测性。

很多学者从纵向角度出发,研究用户的出行行为随时间的变化。Chu[14]使用移动性与地点多样性的指标分别在四个时间尺度上(一日内、日间、季节间、年间)研究群体与个体的出行行为模式的变化。Briand[15]等考虑了用户出行的时间习惯,提出了一个两级生成模型对用户进行聚类来研究用户五年间出行模式的变化,该模型克服了以往模型只能离散地对时间进行建模的缺点。Zhao[16]等从用户出行行为的三个维度(出行频率、出行时间以及OD)解释出行分布,并通过任一维度的变化来检测用户长期内出行模式的变化。Espinoza[17]等将每个用户的刷卡记录分成一系列时间窗口,然后研究每对时间窗口中用户出行行为的差异与变化。也有学者从横向角度出发,研究不同用户群体之间的行为模式差异。Wang[18]等定义了用户的出行阻抗矩阵,并用代理指标(包括通勤距离、职住地点特性等)来表现用户间的异质性,针对地铁用户下班后出行地点的选择行为进行了研究,结果发现了代理变量会影响用户下班后的出行选择行为。Ebadi[19]等使用当地特殊的只有大学生持有的交通卡数据构建了大学生日常的活动模式与移动轨迹。Sun和Axhausen[20]开发了一个可以处理高维人类移动性数据的分析框架,该框架基于张量分解与概率潜在语义分析建立了一个多向概率分解模型,能够帮助我们以灵活的方式更好地理解人类高阶相互作用下的多向移动性。关于移动性的研究,还有其他特殊的角度,比如Nazem[21]等发现即使是中期的运营线路中断也会对公交网络和高频用户的出行模式造成长期的影响。

关于出行预测问题,现有的大部分方法主要分为机器学习、基于状态的方法、模式匹配算法。其中机器学习包括贝叶斯模型、神经网络模型、聚类算法等。基于状态的方法主要是马尔科夫链(Markov Chain, MC)与隐马尔科夫模型(Hidden Markov Model,HMM)等。模式匹配算法主要是PPM(prediction by Partial Matching,部分匹配预测)算法。这些方法间并不是相互独立的,已经有很多学者考虑将不同的模型进行组合,取长补短,得到最佳的预测结果。Zhao[22]等在个体层次上首先使用逻辑回归和朴素贝叶斯模型对用户该日内是否有新的出行进行判断,在存在新的出行的基础上,提出了一个包含时间和空间维度的2-MC(1)模型,并使用贝叶斯N-Gram模型对出行属性(即出行时间t与OD)进行预测,结果发现一天中的首次出行与出行的时间都更具有预测的挑战性。Ghouti[23]等提出了使用极限学习机来模拟和预测移动自组网络中任意结点的移动性。Do[24]等针对个体移动数据稀疏的问题提出了一个基于核密度估计根据用户历史时间与空间信息来预测未来用户在某一特定时间到达某给定地点概率的模型。Ozturk[25]等基于5G蜂窝网络设计了一个将切换(Hand Over,简称HO)预测作为整体成本的一部分的低开销反复深度学习算法用于移动性预测。Ghouti[26]提出了一个神经网络算法用来预测移动自组网络中的人类移动,该算法较以往算法的准确度有大幅提升。Kim和Song[27]将深度神经网络与深度信念网络模型结合预测移动性并从最优网络中得到人类的个体特性与移动模式的关系。Dekar与Kheddouci[28]使用一个虚拟动态拓扑结构来组织自组网络并将它用于面向用户的移动预测。Daoui[29]等提出了一种即使缺少历史移动数据也能进行预测的基于蚂蚁系统行为的用户位移预测方法。Torkestani[30]基于高斯-马尔科夫随机过程设计了一个预测移动无线网络中的人类移动的自适应学习自动机。Pulliyakode和Kalyani[31]根据预测准确度给基于不同上下文的预测因子赋权重,设计出了一种改进的PPM算法。

国内研究概况

我国也很早就开始了对人类移动性研究的关注。前期研究的数据获取手段还是以问卷调查为主。周素红[32]等使用T-GIS(Time GIS)技术基于ArcGIS编写出居民出行链的分析工具,发现了居民日常出行行为中较强的时空关联性,并发现居民外出的活动时间与活动范围与其收入阶层也存在一定相关性。关美宝[33]等将GIS与叙事分析方法结合,开发了一个计算机辅助地理叙事分析组件用于对时空行为进行定性研究。但是随着我国通信技术快速发展,基础设施迅速建成完善,越来越的学者也开始使用手机移动网络与GPS追踪用户的移动轨迹。吴健生[34]等从手机基站数据获取出行OD,并且结合路网信息对每条路段的交通量进行模拟,发现研究区域的交通量符合20/80规律,即大约80%的交通量仅由20%左右的道路来承担。Shen[35]等使用一周的GPS数据与三维地理可视化技术从时间、空间、模式、路径四个维度上研究通勤灵活性,基于这四个维度识别出7种不同的通勤模式,并发现时间维度的灵活性要高于其他三种。

2010年后,我国城市轨道交通的新线开通不断迎来新高,地铁运量大、速度快、准时舒适的特点极大地影响了我国一些大中城市的居民出行模式,而AFC(Automatic Fare Collection,城市轨道交通自动售检票)系统成为了获取乘客OD最直接最准确的方式,于是我国基于智能交通卡数据的人类移动模式的研究大量涌现。孙世超[9]等使用朴素贝叶斯分类器对出行中的通勤人群进行了识别。赵娟娟[36]使用无监督聚类方法分别从空间模式、时间模式、时空关联模式对人群的出行模式进行了分析,结果发现对于同一OD人们选择的出行方法与不同时间段有关。黄洁[37]等利用从智能交通卡数据中计算提取的出行时间与OD矩阵数据,结合多尺度分析,分别从市辖区、环路和街道尺度分析了北京的客流量的时空分布模式,发现了在前两个尺度中客流的流向与流量都呈现出明显的对称性,而且随着尺度的缩小客流时空分布的差异性越来越大。Jiang[38]等研究了出租、公交和地铁三种公共交通模式的人类移动性,其中地铁出行的位移分布可以很好地拟合伽玛分布,他们首次将多种交通模式融合,并发现三种公交方式的融合位移符合有指数截断的幂律分布。Zhang[39]等设计了一个可以自动学习多尺度时空粒度下的人类出移动特征的深度神经网络,并将用户的出行轨迹进行分类,使我们能够更加全面地理解人类移动性。

剩余内容已隐藏,您需要先支付 10元 才能查看该篇文章全部内容!立即支付

发小红书推广免费获取该资料资格。点击链接进入获取推广文案即可: Ai一键组稿 | 降AI率 | 降重复率 | 论文一键排版