新型組合模型在鐵路客運(yùn)量預(yù)測(cè)中的應(yīng)用馮冰玉1,鮑學(xué)英1,王起才1,董朝陽2 (1.蘭州交通大學(xué)土木工程學(xué)院,蘭州 730070; 2.蘭州中川鐵路有限公司技術(shù)裝備部,蘭州 730000) 摘 要:客運(yùn)量是用來測(cè)算交通運(yùn)輸業(yè)所承擔(dān)的工作量,反映了運(yùn)輸業(yè)為國(guó)民經(jīng)濟(jì)和人民生活服務(wù)的數(shù)量指標(biāo),準(zhǔn)確的客運(yùn)量預(yù)測(cè)直接影響到鐵路項(xiàng)目的經(jīng)濟(jì)效益評(píng)價(jià)及鐵路交通組織安排。根據(jù)客流量數(shù)據(jù)的特點(diǎn),提出新的組合預(yù)測(cè)方法,構(gòu)建線性時(shí)間序列灰色GM(1,1)模型和考慮客流量影響因素的非線性遺傳算法優(yōu)化BP神經(jīng)網(wǎng)絡(luò)模型。最后結(jié)合新建蘭州至中川機(jī)場(chǎng)鐵路項(xiàng)目及調(diào)查數(shù)據(jù)進(jìn)行客流量的預(yù)測(cè)研究,并將組合模型預(yù)測(cè)結(jié)果和單一模型相比,得出新型線性和非線性組合模型預(yù)測(cè)精度更高,取得了滿意的效果,為客流量的預(yù)測(cè)提供了一種新的工具。 關(guān)鍵詞:鐵路運(yùn)輸;客運(yùn)量預(yù)測(cè);組合模型;灰色理論; BP神經(jīng)網(wǎng)絡(luò);遺傳算法 1 概述鐵路是現(xiàn)在交通運(yùn)輸體系的主要運(yùn)輸方式。我國(guó)鐵路面臨的主要問題是運(yùn)輸能力遠(yuǎn)不能適應(yīng)國(guó)民經(jīng)濟(jì)和社會(huì)發(fā)展的需求。為了提高鐵路投資的準(zhǔn)確性,在建設(shè)的前期必須對(duì)運(yùn)量進(jìn)行可靠地預(yù)測(cè)[1]。隨著計(jì)算機(jī)的進(jìn)步,不斷涌現(xiàn)出新的理論與方法。常用的定性預(yù)測(cè)方法是德爾菲(Delphi)法;定量預(yù)測(cè)方法有指數(shù)平滑法、回歸分析法、神經(jīng)網(wǎng)絡(luò)法、彈性系數(shù)法和灰色系統(tǒng)法等[2]。其中灰色理論和神經(jīng)網(wǎng)絡(luò)相對(duì)靈活,在客流量應(yīng)用中最為廣泛,然而基于時(shí)間序列的灰色GM(1,1)模型假定客流量是一種線性變化的系統(tǒng),考慮客流量影響因素的BP神經(jīng)網(wǎng)絡(luò)模型則假定客流量是一種非線性變化的系統(tǒng)。因此,針對(duì)客運(yùn)量這個(gè)復(fù)雜的大系統(tǒng)來說,提出建立新型線性和非線性組合預(yù)測(cè)模型,并將模型運(yùn)用到蘭州至中川城際鐵路客流量預(yù)測(cè)中,使得單個(gè)模型得到有效的發(fā)揮,盡可能地提高客運(yùn)量預(yù)測(cè)精度,為交通運(yùn)輸規(guī)劃提供一種新的依據(jù)。 2 鐵路客運(yùn)量組合預(yù)測(cè)模型2.1 線性灰色GM(1,1)模型 灰色系統(tǒng)理論是1982年由我國(guó)學(xué)者鄧聚龍教授創(chuàng)立的,是一種研究少數(shù)據(jù)、貧信息不確定性問題的新方法[3]?;疑碚摰念A(yù)測(cè)模型中GM(1,1)是最典型線性動(dòng)態(tài)模型[4-5],主要應(yīng)用于時(shí)間序列預(yù)測(cè)。 設(shè)x(0)為原始時(shí)間序列[6],共有n個(gè)觀察值,即X(0)=(x(0)(1),x(0)(2),…x(0)(n)),對(duì)x(0)進(jìn)行一次累加生成(1-AGO),生成新的數(shù)列x(1) (1) 其中: (2) 對(duì)x(1)建立灰色微分方程,即GM(1,1)模型 (3) (4) 式中,z(1)(k)為緊鄰均值生成序列。 最后,做一次累減還原,得原始數(shù)據(jù)的擬合值和預(yù)測(cè)值 (5) 2.2 非線性GA-BP模型2.2.1 BP神經(jīng)網(wǎng)絡(luò)原理 BP神經(jīng)網(wǎng)絡(luò)(Back Propagation Neural Network)是一種按誤差逆?zhèn)鞑ニ惴ㄓ?xùn)練的多層前饋網(wǎng)絡(luò)[7],由輸入層、隱含層及輸出層組成[8](圖1)。該神經(jīng)網(wǎng)絡(luò)算法流程可分為BP神經(jīng)網(wǎng)絡(luò)的構(gòu)建、訓(xùn)練、預(yù)測(cè)三步驟。 圖1 三層BP神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu) BP網(wǎng)絡(luò)通過擬合非線性函數(shù)的特點(diǎn)確定網(wǎng)絡(luò)結(jié)構(gòu),具體步驟如下。 (1)權(quán)值、閥值初始化 根據(jù)輸入輸出數(shù)列(X,Y),確定輸入層節(jié)點(diǎn)數(shù)n,隱含層節(jié)點(diǎn)數(shù)l,輸出層節(jié)點(diǎn)數(shù)m,初始化輸入層、隱含層和輸出層連接權(quán)值wij,wjk,初始化隱含層閥值a,輸出層閥值b,給定學(xué)習(xí)速率和神經(jīng)元激勵(lì)函數(shù)[9]。 (2)計(jì)算隱含層輸出Hj (6) (7) 式中,f為隱含層激勵(lì)函數(shù);l為隱含層節(jié)點(diǎn)數(shù)。 (3)計(jì)算輸出層輸出Ok (8) (4)計(jì)算誤差ek (9) 式中,O為網(wǎng)絡(luò)預(yù)測(cè)輸出值,Y為網(wǎng)絡(luò)期望輸出值。 (5)權(quán)值和閥值更新 (10) (11) (12) (13) 式中,η為學(xué)習(xí)速率;ek為預(yù)測(cè)誤差。 (6)判斷指標(biāo)是否滿足精度要求,若不滿足,返回步驟2重復(fù)計(jì)算。 2.2.2 遺傳算法優(yōu)化BP神經(jīng)網(wǎng)絡(luò) BP神經(jīng)網(wǎng)絡(luò)具有很強(qiáng)的學(xué)習(xí)能力和適應(yīng)能力,但網(wǎng)絡(luò)訓(xùn)練需要較長(zhǎng)的時(shí)間,易陷入局部最優(yōu)解,遺傳算法(Genetic Algorithms,GA)是模擬達(dá)爾文的遺傳選擇和自然淘汰的生物進(jìn)化過程的計(jì)算模型[7],具有尋找全局最優(yōu)解的特點(diǎn),采用遺傳算法優(yōu)化BP網(wǎng)絡(luò)初始權(quán)值和閥值可改進(jìn)神經(jīng)網(wǎng)絡(luò)的性能[10],形成具有極強(qiáng)的解決非線性問題的GA-BP模型。 遺傳算法將需要求解的問題采用實(shí)數(shù)編碼成染色體的形式[11],計(jì)算每個(gè)染色體的適應(yīng)度fi,根據(jù)適應(yīng)度值選擇優(yōu)良的個(gè)體以pc的概率進(jìn)行交叉,使得信息得到交換,再以pm的概率進(jìn)行變異,開拓問題解的新空間,直到在種群中找到滿意的個(gè)體,達(dá)到要求的收斂精度時(shí)算法結(jié)束。最后,將遺傳算法得到更好的初始權(quán)值和閥值賦給BP神經(jīng)網(wǎng)絡(luò)。 2.3 組合模型 綜合考慮客流量預(yù)測(cè)的特點(diǎn),將不同的預(yù)測(cè)模型進(jìn)行合理的組合,構(gòu)建新型線性和非線性組合模型[12-13],既能夠具備時(shí)間序列的線性特征,又能夠獲取影響因素的非線性特征。數(shù)學(xué)表達(dá)式為 (14) 式中,Lt為組合模型中的線性結(jié)構(gòu);Nt為組合模型中的非線性結(jié)構(gòu)。 首先,通過線性灰色GM(1,1)模型去擬合客運(yùn)量時(shí)間序列的線性部分,則線性模型的預(yù)測(cè)殘差只包含非線性部分[14],再用影響客流量因素的非線性GA-BP模型去擬合殘差Et,得到非線性數(shù)據(jù)特征t。最后,客流量新型組合模型的預(yù)測(cè)值為t,如下式 (15) (16) 式中,t為t時(shí)刻線性灰色GM(1,1)模型的預(yù)測(cè)值;t為t時(shí)刻非線性GA-BP模型的預(yù)測(cè)值。 2.4 鐵路客流分擔(dān)量 采用效用理論的Logit模型進(jìn)行鐵路客流的分布預(yù)測(cè)[15],可以得出每種交通方式分擔(dān)的客流量。其模型的基本形式為 (17) 式中 Pk——k種交通運(yùn)輸方式的分擔(dān)率; Uk——出行人選擇k種交通方式可以觀測(cè)到的效用。 3 實(shí)例研究為滿足蘭州機(jī)場(chǎng)及中川新區(qū)客流集輸,新建蘭州西至中川機(jī)場(chǎng)鐵路項(xiàng)目,本研究選取2006—2014年鐵路沿線車流量數(shù)據(jù),建立線性灰色GM(1,1)模型,再利用Matlab7.0對(duì)灰色殘差序列建立非線性影響客流因素的GA-BP模型,并對(duì)2015年客流量進(jìn)行預(yù)測(cè),最后運(yùn)用Logit模型,采用鐵路客流分擔(dān)的方法,得出蘭州西至中川機(jī)場(chǎng)鐵路運(yùn)量,見表1。 表1 2006~2014年蘭州西至中川客流量統(tǒng)計(jì) 萬人 年份200620072008200920102011201220132014客運(yùn)量168.26246.37328.24447.56549.80663.80796.48941.761109.26 3.1 構(gòu)建客運(yùn)量預(yù)測(cè)組合模型 對(duì)2006~2014年原始數(shù)據(jù)建立線性時(shí)間序列灰色GM(1,1)模型,即x(0)(k)-0.19z(1)(k)=237.86,進(jìn)行客流量預(yù)測(cè)得t,并將預(yù)測(cè)結(jié)果與原始數(shù)據(jù)相比較,得到殘差序列Et,見表2。 表2 2006~2014年灰色客流量預(yù)測(cè)值及殘差值 萬人 年份200620072008200920102011201220132014實(shí)際值168.26246.37328.24447.56549.80663.80796.48941.761109.26預(yù)測(cè)值168.26297.92361.06437.59530.34642.74778.97944.071144.16殘差序列051.5532.82-9.97-19.46-21.06-17.512.3134.9 影響鐵路客流量的因素有很多,本文主要考慮可量化的因素,通過查閱相關(guān)文獻(xiàn),選取具有代表性的蘭州市人口(萬人)、人均收入(元)、國(guó)民生產(chǎn)總值(億元)3個(gè)因素[16-17]。人口的多少與客流量成正比例關(guān)系,人均收入的提高增加了出行的意愿,國(guó)民生產(chǎn)總值反映了當(dāng)?shù)亟?jīng)濟(jì)發(fā)展的水平。收集2006~2014 年蘭州市各項(xiàng)指標(biāo)數(shù)據(jù),具體參見表3。對(duì)灰色模型的殘差序列Et建立非線性影響因素的GA-BP模型。 表3 影響客流量的指標(biāo)數(shù)據(jù) 年份人口/萬人人均收入/元生產(chǎn)總值/億元2006302.009418.00638.472007309.0010271.18732.762008317.0011676.77846.282009332.1812761.00952.982010361.6114061.841100.392011368.3615952.571360.032012374.2918442.761564.412013385.4320767.001776.282014396.9923466.712042.72 對(duì)BP網(wǎng)絡(luò)輸入輸出數(shù)據(jù)預(yù)處理,采用Matlab自帶歸一化函數(shù)mapminmax,其形式為 [inputn,inputps]=mapminmax(input_train); %訓(xùn)練輸入數(shù)據(jù)歸一化 [outputn,outputps]=mapminmax(output_train); %訓(xùn)練輸出數(shù)據(jù)歸一化 遺傳算法計(jì)算個(gè)體適應(yīng)度,通過選擇、交叉、變異得到最優(yōu)的初始權(quán)值和閥值。采用Matlab7.0編程建立具有一個(gè)隱含層的BP神經(jīng)網(wǎng)絡(luò),對(duì)遺傳算法搜索到的最優(yōu)解進(jìn)行訓(xùn)練,客流量影響因素作為神經(jīng)網(wǎng)絡(luò)的輸入,客流量殘差序列作為網(wǎng)絡(luò)輸出Et。遺傳算法中初始種群M=30,交叉概率Pc=0.25,變異概率Pm=0.1,進(jìn)化迭代次數(shù)為100。BP神經(jīng)網(wǎng)絡(luò)中構(gòu)建網(wǎng)絡(luò)函數(shù)為newff,輸入層節(jié)點(diǎn)n=3,輸出層節(jié)點(diǎn)m=1,隱含層節(jié)點(diǎn)l=5,即得到非線性數(shù)據(jù)特征t,如表4所示。 3.2 組合模型預(yù)測(cè)結(jié)果 根據(jù)公式(16),將線性模型預(yù)測(cè)結(jié)果和非線性模型預(yù)測(cè)結(jié)果進(jìn)行合理組合,可得最終組合模型各年客流量,并將預(yù)測(cè)結(jié)果與單一模型進(jìn)行比較,見表5。 表4 GA-BP模型殘差序列預(yù)測(cè)值 萬人 年份200620072008200920102011201220132014殘差序列051.5532.82-9.97-19.46-21.06-17.512.3134.9預(yù)測(cè)值^Nt051.6732.98-9.84-20.08-20.03-17.892.3835.7 表5 各模型預(yù)測(cè)結(jié)果比較 萬人 年份實(shí)際客流量GM(1,1)模型組合模型計(jì)算客流量相對(duì)誤差/%計(jì)算客流量相對(duì)誤差/%2006168.26168.260.00168.260.002007246.37297.9220.92246.250.052008328.24361.0610.00328.080.052009447.56437.592.23447.430.032010549.80530.343.54550.420.112011663.80642.743.17662.770.162012796.48778.972.20796.860.052013941.76944.070.25941.690.0120141109.261144.163.151108.460.07 從計(jì)算結(jié)果可以看出,組合模型的預(yù)測(cè)結(jié)果平均相對(duì)誤差為0.06%,線性時(shí)間序列GM(1,1)平均相對(duì)誤差為5.05%,線性和非線性組合模型的結(jié)果精度大大高于GM(1,1)模型預(yù)測(cè)精度,這說明線性和非線性組合模型預(yù)測(cè)相對(duì)誤差小,效率高,具有很好的預(yù)測(cè)性。 根據(jù)所建立好的組合模型,蘭州市每年人口增長(zhǎng)率按3%,人均收入增長(zhǎng)率按13%,GDP增長(zhǎng)率按15%計(jì)算,得出2015年影響客流量各因素的數(shù)據(jù)。將時(shí)間序列數(shù)據(jù)和影響因素?cái)?shù)據(jù)導(dǎo)入已建好的組合模型中,得出2015年蘭州西至中川鐵路沿線客流量預(yù)測(cè)值1 335.62萬人。 3.3 鐵路客流分擔(dān)量 通過組合模型預(yù)測(cè)出蘭州至中川機(jī)場(chǎng)沿線客流量,根據(jù)蘭州至中川公路客運(yùn)交通費(fèi)和《旅客出行意愿調(diào)查表》[18],從時(shí)間和出行費(fèi)用兩個(gè)方面計(jì)算,運(yùn)用Logit模型,得出鐵路分擔(dān)率約為52%,即蘭州至中川機(jī)場(chǎng)城際鐵路2015年客流量為694.52萬人。 4 結(jié)論鐵路客運(yùn)量是鐵路建設(shè)和行車組織安排的重要依據(jù),本文提出了新型組合模型,巧妙地將線性時(shí)間序列GM(1,1)模型和非線性影響因素的GA-BP模型有效地結(jié)合起來,充分利用客運(yùn)量線性和非線性的數(shù)據(jù)特征,并將組合模型應(yīng)用于蘭州西至中川沿線客運(yùn)量預(yù)測(cè)中,采用鐵路分擔(dān)率的方式,將鐵路沿線交通小區(qū)的公路客流量轉(zhuǎn)換為正在修建蘭州至中川機(jī)場(chǎng)的鐵路客流量。最后,結(jié)果表明組合模型相比單一模型具有更高的預(yù)測(cè)精度,表現(xiàn)出更好的性能,具有較好的應(yīng)用價(jià)值。 參考文獻(xiàn): [1] 謝小山.基于遺傳算法和BP神經(jīng)網(wǎng)絡(luò)的鐵路客運(yùn)量預(yù)測(cè)研究[D].成都:西南交通大學(xué),2010. [2] 王生昌,白韶波,張 慧.公路客運(yùn)量預(yù)測(cè)方法的比較[J].長(zhǎng)安大學(xué)學(xué)報(bào):自然科學(xué)版,2005,25(5):83-84. [3] 劉思峰,黨耀國(guó),方志耕.灰色系統(tǒng)理論及其應(yīng)用[M].3版.北京:科學(xué)出版社,2010. [4] 侯麗敏,馬國(guó)峰.基于灰色線性回歸組合模型鐵路客運(yùn)量預(yù)測(cè)[J].計(jì)算機(jī)仿真,2011,28(7):1-3. [5] Yuan J B, Li X. Study on highway passenger volume forecast by the method of the GM (1, 3)-Markov chain model[J]. Journal of Transport Science and Engineering, 2011,27(4):68-72. [6] 張慶平,趙峰,王思華.基于灰色理論和 PSO 的牽引供電系統(tǒng)可靠性研究[J].鐵道標(biāo)準(zhǔn)設(shè)計(jì),2014,58(12):121-122. [7] 劉 冰,郭海霞.Matlab神經(jīng)網(wǎng)絡(luò)超級(jí)學(xué)習(xí)手冊(cè)[M].北京:人民郵電出版社,2014. [8] Wang Z, Wang Y, Jia L, et al. The application of improved BP neural network in the prediction of railway passenger volume time serial[J]. China railway science, 2005,26(2):128-131. [9] 王小川,史峰, 郁磊,等.MATLAB神經(jīng)網(wǎng)絡(luò)43個(gè)案例分析[M].北京:北京航空航天大學(xué)出版社,2013. [10]呂霽.基于遺傳算法優(yōu)化神經(jīng)網(wǎng)絡(luò)的房地產(chǎn)評(píng)估模型及實(shí)證研究[J].計(jì)算機(jī)科學(xué),2014,41(11):75-77. [11]何祥衛(wèi).基于遺傳算法的鐵路縱斷面優(yōu)化研究[J].鐵道標(biāo)準(zhǔn)設(shè)計(jì),2014,58(6):15-16. [12]Chase J, Boyer F, Rodgers G, et al. Linear and Nonlinear Seismic Structural Impact Response Spectral Analyses[J]. Advances in Structural Engineering, 2015,18(4):555-570. [13]Abdollahzade M, Miranian A, Hassani H, et al. A new hybrid enhanced local linear neuro-fuzzy model based on the optimized singular spectrum analysis and its application for nonlinear and chaotic time series forecasting[J]. Information Sciences, 2015,295:107-125. [14]張毅敏.線性與非線性的組合模型在鐵路客運(yùn)量預(yù)測(cè)中的應(yīng)用研究[D].成都:西南交通大學(xué),2014. [15]豆飛,賈利民,秦勇,等.鐵路客運(yùn)專線模糊k近鄰客流預(yù)測(cè)模型[J].中南大學(xué)學(xué)報(bào) :自然科學(xué)版,2014,45(12):4423-4429. [16]LI M T,JI X F,ZHANG J, RAN B. FA-BP Neural Network-Based Forecast for Railway Passenger Volume[J]. Applied Mechanics and Materials Vols, 2014,641:676-677. [17]Yan X, Li J. Analysis on predict model of railway passenger travel factors judgment with soft-computing methods[J]. Journal of Industrial Engineering and Management, 2014,10(1):100-114. [18]鮑學(xué)英,王起才,董朝陽.蘭州至中川城際鐵路客運(yùn)量分擔(dān)率計(jì)算及應(yīng)用[J].鐵道運(yùn)輸與經(jīng)濟(jì),2015,37(3):55-58. A New Combination Model for Forecasting Railway Passenger VolumeFENG Bing-yu1, BAO Xue-ying1, WANG Qi-cai1, DONG Zhao-yang2 (1.School of Civil Engineering, Lanzhou Jiaotong University, Lanzhou 730070, China;2.Technical Equipment Department, Lanzhou Zhongchuan Railway Co., Ltd., Lanzhou730000, China) Abstract:Passenger traffic is used to measure transportation workload, reflecting the transportation service level for the national economy and people’s living index. Accurate forecast of passenger traffic directly affects the evaluation of economic benefits of railway project and railway traffic organization arrangement. According to the characteristics of the traffic data, this paper puts forward a new combination forecast method, the establishment of the linear time series grey GM(1, 1) model and the nonlinear genetic algorithm to optimize the BP neural network model that considers the influence factor of traffic. Finally, the combination model is illustrated by Lanzhou to Zhongchuan airport railway new project and the survey data. The results are compared with the single model, concluding that the new model of the linear and nonlinear combination forecasting is higher in accuracy with satisfactory results and ideal for predicting passenger traffic. Key words:Railway transportation; Passenger traffic volume prediction; Combination model; Grey theory; Back propagation neural network; Genetic algorithms 收稿日期:2015-05-14; 收稿日期:2015-05-19 作者簡(jiǎn)介:馮冰玉(1990—),女,碩士研究生,E-mail:fengbingyu12345@126.com。 文章編號(hào):1004-2954(2015)12-0006-04 中圖分類號(hào):U293 文獻(xiàn)標(biāo)識(shí)碼:A DOI:10.13238/j.issn.1004-2954.2015.12.002 |
|