基于B-P神经网络的北京地铁运量预测
摘 要 分析影响北京地铁运量的因素,选取城市轨道交通内部生产、人口因素、乘客收入因素和交通因素等作为运量预测的关键要素,应用B -P神经网络(Back PropagationANN,基于误差反向传播神经网络)模型,对未来几年内北京地铁运量进行预测分析。结果发现B-P神经网络对地铁客运量的预测较为适用,可为北京地铁运营规划提供决策参考。
关键词 B-P神经网络 运量预测 北京地铁 模型
1 研究背景
乘客是城市轨道交通服务的主要对象,客运量是评价运输工作的重要内容和客观指标,同时也是交通运输组织的重要参考和依据。城市轨道交通因其客运量大、密集程度高,导致客流集散拥挤严重,客流组织工作的复杂度高。因此,地铁运量的预测体现出其他交通方式不可比拟的作用,往往是组织客流工作具体事项的决定性因素之一。通过对北京地铁运量的预测,可以有效地规划北京地铁系统运营,编制运输计划,提高运输能力,对实现客流有效控制具有重要意义。
笔者应用B-P神经网络(Back PropagationANN,基于误差反向传播神经网络),对北京地铁总客运量进行预测。考虑到总量预测只是运量预测的一部分,还需要预测出行起讫点交通量(包括生成交通量、分布交通量),才能构成完整意义的运量预测,所以这项预测体现了地铁公司对地铁客运的全局管理,具有总量控制的实际作用。
2 北京地铁交通特点及客流影响因素
2.1 北京地铁交通特点
北京地铁除具备一般地铁的共同特点外,还具备有自身的特点。
1)北京地铁发展时间不长,但是发展势头迅猛,线路长度和线网覆盖率的激增必将导致客运量的增加。自2008年奥运会后,北京市政府提出了至2015年修建561 km地铁线路的目标,城市轨道交通线网覆盖率将达到90.5%,届时北京也将成为国内地铁线路最长、线网覆盖率最高的城市之一。
2)北京地铁的城市引导功能作用明显,沿线居民消费水平与地铁建设发展水平相互影响、相互制约,主要表现在地铁线路的规划和设计拉动沿线土地开发,提供就业岗位,提高居民消费水平,促进沿线经济发展。同时,吸引的客流随城市的发展沿地铁线路分布。如图1所示,北京地铁13号线的建成拉动了沿线的经济发展,形成了较大的通勤客流。
3)地铁在北京的城市交通结构中发挥了的重要作用,随着北京公交优先政策的推行,地铁交通必将成为城市公共客流的主要承担者。
2.2 地铁客运影响因素
地铁的交通特点反映了地铁客运的影响因素。从根本来说,城市人口的数量是地铁运量的来源,城市总人口的变化将影响地铁运量的变化。分析北京的地铁交通特点,地铁运量主要受到以下因素的影响。
2.2.1 城市轨道交通内部生产因素
城市轨道交通内部生产因素的变化是影响地铁运量变化的直接因素。北京地铁处于高速发展时期,进入了地铁建设与管理逐渐成熟的阶段。这个阶段体现了北京地铁内部生产要素的日渐完善和水平的逐步提高,包括地铁线路的增多、长度的增加、线网覆盖率的提高、地铁线路网络化运营模式的成熟、地铁车站数量的增多、地铁运营车辆增加、地铁运营模式的改变、管理质量和调度水平的提高、票价政策的改变等。
2.2.2 乘客经济水平因素
在城市轨道交通发展的任何阶段,都有不同的客流变化趋势。城市轨道交通作为公共交通运输方式的一种,其出发点在于最大限度地方便公共群体,产生公共效益。但是,由于地铁建设、设备维修折旧等成本较高,因此其盈利性也必将成为政府考虑投资运营的一个重要因素,其中涉及乘客的经济水平及承受能力,包括乘客的收入和消费水平、地铁票价的变化情况等。
2.2.3 城市交通结构体内部因素
地铁作为交通运输方式的一种,与其他交通方式构成了完整的交通运输网络。在城市交通结构体中,地铁与其他运输方式既可能形成竞争的关系,也可能形成合作的关系。北京城市交通拥挤的现状迫使客流对交通方式的选择发生改变,城市交通结构体内部的各交通方式相互作用,这种复杂关系将对地铁运量造成较大影响。
3 用B-P神经网络模型预测地铁运量
根据对北京市地铁特点的分析研究,采用B-P(back propagation)神经网络对北京市地铁的目标运量进行预测。B-P神经网络,即误差反向传播算法的学习过程,由信息的正向传播和误差的反向传播两个过程组成。输入层各神经元负责接收来自外界的输入信息,并传递给中间层各神经元;中间层是内部信息处理层,负责信息变换,可以根据信息变化能力的需求,设计为单隐层或者多隐层结构;最后一个隐层传递到输出层各神经元的信息,经进一步处理后,完成一次学习的正向传播处理过程,由输出层向外界输出信息处理结果。当实际输出与期望输出不符时,进入误差的反向传播阶段。误差通过输出层,按误差梯度下降的方式修正各层权值,向隐层、输入层逐层反传。周而复始的信息正向传播和误差反向传播的过程,是各层权值不断调整的过程,也是神经网络学习训练的过程。此过程一直进行到网络输出的误差减少到可以接受的程度,或者到预先设定的学习次数为止。最后,利用训练完全的神经网络对目标进行预测,就完成了预测的过程。
3.1 北京市地铁运量预测过程
3.1.1 B-P神经网络建模思路
首先把历史序列组成的具有可训练功能的样本进行初始化,并作为前馈网络的输入和输出,然后利用B-P算法对网络进行训练,最后得到原始数据与有关指标之间的非线性映射模型,采用该模型进行预测。以地铁运量的影响因素作为神经网络模型的隐层,并根据隐层选择相应的输入变量。对于输入变量的选取做以下说明:基于隐层的输入变量之间相互独立,采用定量化的输入样本数据,同时为了避免过于冗余的计算,数据应尽量精炼并可比性较强。根据上述对输入指标的设定说明,为了保证预测的可实施性,基于城市轨道交通客运影响因素的分析,考虑B-P神经网络模型的收敛性,本研究建立具有17个输入变量、4个隐层节点、1个预测目标的B-P神经网络。输入变量及隐层指标如表1所示, B-P网络拓扑如图2所示。
3.1.2 B-P样本数据归一化
选取1978—2009年共32年的历史数据作为B-P神经网络的学习样本数据,每年的数据见表2。数据源自于《北京市年鉴》(1978—2009),由于数据的来源自1978年后比较完善可信,考虑到B-P网络的学习样本不宜过大,因此对于本研究所设定的神经网络,这32个数据组还是具有可用性的。
在预测时,需要对输入样本数据进行相应预测。根据1978—2009年样本数据的发展变化趋势,对该17组输入样本数据进行预测,分别采用了平滑预测法、移动平均预测法、加权平滑预测法和回归分析法等,对这4年的值进行预测。通过对相关系数的检验,对预测值的合理性做出判断,并最终确定较为正确的预测值。为了保证数据的完备性,利用插值法补充缺失数据,将预测样本和补充样本添加到原始样本数据中,构成完整的输入样本数据。
3.1.2 B-P样本数据归一化
为了提高B-P神经网络学习的效率和收敛速度,对B-P神经网络的输入数据进行归一化处理,以便提高预测精度。输入数据的归一化处理采用了指数归一化的方法,其变化方式为

(1)
式中,j和i分别代表最大值和最小值的下标,n代表任意同种数据归一化后的结果。
这样,所有的数据都归一化为[0, 1]区间的数,减少了识别数据的动态范围,使预测的成功可能性得以提高。在求出预测值后,需通过反归一化的规则进行变化。
3.1.3 B-P算法学习过程
用一组训练样本对网络进行训练,每一个样本都包括输入及期望的输出两部分。在训练时,首先把样本的输入信息输入到网络中,由网络自隐层第一个变量开始逐层地进行计算,并向下一层传递,直至传至输出层,其间每一层神经元只影响到下一层的神经元状态。然后,比较网络的输出与样本的期望输出,如果它们的误差不能满足要求,则沿着原来的网络通路逐层返回,并利用两者的误差按一定的原则对各层节点的连接权值进行调整,使误差逐步缩小,直到满足要求为止,上述过程见图3。
3.1.4 B-P模型的地铁运量预测
本例中采用Matlab神经网络工具箱中的B-P模型程序模块,完成B-P神经网络的建立。具体过程是:从文本文件分别读取样本输入、输出数据,有32个样本、17个输入,设立4个隐层变量、1个输出(地铁运量),建立BP神经网络。通过归一化原始数据,训练BP神经网络,再将原始数据回代到训练好的BP神经网络,反归一化获得真输出,画出拟合图得到实际输出和目标输出。最后,使用新数据代入神经网络,进行预测并画图。
在本预测过程中, B -P神经网络模型采用正切S型-线性传递函数,利用梯度下降的BP算法训练函数,学习步长取0.05,最大的迭代次数选取120000次,收敛误差阈值取0.0020。根据提示,当训练次数达到69 874次时,达到训练阈值的上界,停止学习的过程,其拟合曲线如图4所示。此时,预测值与实际值比较如表2所示。
3.2 北京地铁运量预测结果分析
根据程序输出的拟合曲线,比较预测值与实际值(《北京年鉴》)。不难发现,北京地铁运量的增长并不是呈现出线性增长,中间有些年份(如1996年)由于票价等实际原因,导致客运量变化趋势发生突变,但是,神经网络系统都进行了很好的拟合。同时,考察预测输出值和实际值在最近几年的变化情况,特别体现在2004年后的曲线基本重合,拟合度较高。根据表2,预测输出值与实际值两者的相对误差平均为5.9%,说明预测的精度还是比较高的,训练模型对未来几年内地铁运量的预测结果令人信服。
同时,利用训练好的B -P神经网络,对2010—2012年的地铁运量进行预测。根据预测结果,表示北京地铁运量在这三年里呈现稳步增长的趋势,其原因在于模型预测中对于不定因素票价的处理以票价线性增长函数作为票价变量的变化趋势。由于票价参数变化在地铁客运量的预测中起到了重要的作用,并且票价的变化趋势并不能通过相应的定量方法进行预测,因此预测后的北京城市轨道交通客运量精度受到了一定的影响。但是,预测客运量呈现出增长的趋势,在北京市大力投资城市轨道交通、修建新线、增加车底的背景中是正确的和令人信服的。
为了实现更加精确的预测,本研究利用数学统计方法,进行预测的弹性分析,并对结果进行了修正,如表3和图5所示。
4 结论
地铁运量的预测是地铁发展的基础。结合B-P神经网络模型方法,通过对北京地铁运量的预测,在理论分析和计算机辅助运算的基础上,获得北京地铁运量在中短期内的发展趋势,为北京地铁运营规划提供决策依据。但是,由于B-P神经网络收敛速度慢,并且当新的样本加入时会影响以前学习过的样本,因此应进一步加强探索B-P模型与其他数学理论相结合的实际应用研究。
参考文献
[1]毛保华.城市轨道交通规划与设计[M].北京:人民交通出版社,2006.
[2]毛保华.城市轨道交通系统运营管理[M].北京:人民交通出版社,2006.
[3]毛保华,贾顺平.城市客运管理[M].北京:人民交通出版社,2009.
[4]柴晨.基于ANN模型的北京市公交客运量预测研究[J].廊坊师范学院学报:自然科学版,2008,8(6):55-57.