時間:2019-04-03 11:31:09來源:孫 敏 彭 磊 李慧云
摘?要?可用停車位預測是智能停車誘導系統的關鍵問題之一。當前基于神經網絡的預測技術在較短預測周期內,預測準確度的平均絕對誤差在10左右,但隨著預測步長或周期的增加,預測精度急劇下降。針對這一問題,該文提出了一種在中長預測時間周期內可保持數據變化特征的泊位預測方法。該方法使用模糊信息粒化獲取特征數據集,通過訓練長短期記憶神經網絡預測未來的特征數據集,基于數據插值方法重建出整個區間可用停車位的連續變化曲線。仿真結果表明,該方法在相同預測步長的可用車位預測上,比傳統預測方法具有更高的預測精度;在保持相近預測精度的條件下,比傳統預測方法具有更高的計算效率。
關鍵詞?停車誘導系統;模糊信息粒化;長短期記憶神經網絡;三次樣條插值
中圖分類號?TG156文獻標志碼?A
1.引言
近年來,隨著經濟的快速發展,市民使用小汽車的數量也快速上升,這使得大城市停車難的問題越來越嚴重,同時也加劇了城市交通的擁堵。研究報告顯示,擁擠交通中有30%是由尋找停車位的汽車造成[1]。而在尋找車位的同時,也增加了不必要的尾氣排放。因此,當前全國各地都在積極開展城市級停車誘導系統的建設工作。停車誘導系統通過給車輛提供停車場位置和可用車位數量等相關信息,幫助車輛快速停車,緩解停車難問題[2-4]。在停車誘導系統中,可用車位預測是非常重要的一部分,車輛需要在距離目的地一定距離時知道:當他到達目的地時,周邊停車場可用的車位數量。可用車位預測技術可以避免出現車輛到達停車場入口時才發現滿位而無法停放的情況,同時起到引導車輛停往車位更寬松的停車場的作用。顯然,可用車位預測是一個典型的時間序列預測問題。當前可以采用自回歸積分移動平均模型(AutoregressiveIntegratedMovingAverageModel,ARIMA)、小波神經網絡等實現精準的短時預測。但需要指出的是,該類方法的高精度是建立在一個基本條件上,即預測步數量足夠少,一般是1~3個預測步長。如果預測步數量增加,那么預測精度將出現大幅下降。由于城市交通環境的復雜性,往往在車輛啟動時就需要了解目的地周邊當前停車場的可用車位情況,并預測當車輛到達時的可用車位情況。這個時間長度一般會超過30min。如果直接使用當前的預測技術,一般是將預測步的時間周期調整變長,如10min為一個預測步。這樣雖然可將30min調整成3個預測步,但由于每10min給出一個預測值,實際上30min僅能給出3個預測值。顯然,這個結果嚴重丟失了該時間區間內更為詳細的車位變化特征,對停車誘導系統的誘導精度帶來很大的負面影響。
目前對可用停車位的實時預測,常見的方法主要分為兩類:一類是以ARIMA為代表的傳統時間預測模型[5],另一類是神經網絡預測方法[6,7]。其中,傳統時間序列預測模型主要通過將時間序列數據分解,對于不平穩序列則還需要通過差分等手段將非平穩時間序列轉換為平穩時間序列,從而實現預測[8,9]。這種預測容易受模型參數的影響,有效性會逐漸降低。神經網絡方法主要通過先對海量數據進行迭代訓練,再擬合數據特征,進而實現預測。相關研究中,Sun等[10]和Yong等[11]研究通過誤差逆向傳播算法訓練的多層前饋
神經網絡模型來預測車位占有率,雖然實現了停車位預測,但魯棒性差,而且計算時需消耗大量的時間;后來有研究人員[12-14]利用小波神經網絡能很好地擬合非線性復雜系統特性,雖對可用停車位進行短期預測,預測速度和穩定性也都得到了很大的提高,但也只是單點預測;Zheng等[15]通過使用回歸樹、神經網絡和支持向量機建立組合模型,實現車位連續變化狀態的預測,但隨著實時數據的增加,動態組合模型切換運算所付出的時間成本也很昂貴。以上所提到的方法均不能很好地解決可用停車位波動區間預測的問題。其中,大部分方法側重于點的預測,雖有少部分方法考慮區間范圍內的變化與趨勢,但計算時間成本也很高。針對這一問題,本文提出了一種預測方法——模糊長短期記憶神經網絡(FuzzyLongShort-TermMemoryNetworkPredictionOnParkingSpaces,FLOPS),可以在較長預測時間周期內保持數據變化特征,并適用于較大時間跨度(>30min)條件下的高精度預測。該方法由3個主要步驟構成:(1)基于模糊信息粒化(FuzzyInformationGranulation,FIG)方法對停車場歷史數據進行海量關鍵信息提取[16],構造預設預測周期的特征集;(2)構造特征集的長短期記憶神經網絡(LongShort-TermMemoryNetwork,LSTM),并對未來1~3個預測步進行特征集預測;(3)基于3次樣條插值對得到的特征集預測結果進行插值重構,由此得到預測時間周期內的停車位連續變化結果。
2.研究方法
對可用停車位的連續變化狀態預測,包括可用停車位數目變化預測和停車高峰的時間預測。本文主要分為3個部分:(1)基于模糊信息粒化的數據變換,獲取時間序列數據對應的特征數據集;(2)基于LSTM神經網絡的區間預測模型,預測可用停車位數目的變化特征;(3)基于3次樣條插值的重構算法,獲得可用泊位的連續變化狀態。
2.1基于模糊信息粒化的數據變換
可用泊位是一個隨時間變化而不斷變化的數據。面對一個如此巨大的非線性時間序列數據,本文通過做壓縮將關鍵信息提取出來,獲得對應的特征數據集合。在本文中,使用基于模糊信息粒化(FIG)方法對可用停車位的時間序列重構及粒化。其中,模糊信息粒化是對海量數據進行關鍵信息提取的有效方法。對時間序列進行模糊信息粒化主要分為2個過程:
(1)將時間序列分割成若干個小子序列,作為操作窗口;
(2)對產生的每一個窗口進行模糊化,生成一個個模糊集,即模糊信息粒。處理后的數據樣本能夠保持原樣本數據特征,得到一系列更小的樣本區間,便于后續進行數據的計算。
停車場的時間序列數據X,如公式(1)所示。
其中,xi為ti時刻可用停車位。按照實際需求確定一個等間隔的時間粒度T(如2min)劃分時間序列數據,可得到多段子序列數據。將每一段子序列數據作為一個粒化窗口,然后獲取各粒化窗口中可用停車位數目的最小值、最大值以及各個粒化窗口中初始時間點和末尾時間點分別對應的可用停車位。其中,分別使用lowk、upk表示第k個粒化窗口內的可用泊車位最小值和最大值,startk、endk表示第k個粒化窗口內的始末可用泊車位值,即
k=1,2......,n。由此,使用4個特征數據來合理表示原來窗口內的數據,簡化了原有的時間序列,即對時間序列數據進行了模糊信息粒化。在獲得low值、up值后,結合每個窗口內的時間屬性可分別獲得low值和up值對應的峰值時間tlow和tup,得到Y1,Y2,…,Yn。其中將時間轉為時間戳Tstamp,因為轉化為時間戳之后數值非常大,難以擬合數據特征,因此定義時間偏移t':
其中,t為預測當天零時零刻的時間戳;Tstamp為當前的時間戳;T為確定的時間粒度;k為第k個粒化窗口。從而將每個粒化窗口內的峰值時刻轉化為(0,60T)范圍內的值,最后對每一個子序列窗口的模糊信息進行組合,得到矩陣X和Y'。其中:
2.2基于長短期記憶神經網絡的預測模型
數據變換得到具有模糊信息的特征矩陣,用于預測可用停車位數目變化特征,本文考慮有記憶模式的預測模型,這能將之前時刻的數據關聯起來具有更好的效果。長短期記憶神經網絡(LSTM)是一種特殊的循環神經網絡,是做時間序列分析的常用方法。它能夠克服傳統循環神經網絡在反向傳播中遇到的梯度爆炸和衰減的缺點,并通過在隱藏層加入記憶單元,將時間序列的短長期相互關聯起來,控制有關信息的刪除與存儲,以此構成記憶網絡。本文的記憶單元結構如圖1所示,主要由輸入門、輸出門、遺忘門和存儲單元組成。其中,門是一種讓信息選擇式通過的方法,其含有sigmoid函數,以決定存儲單元狀態中哪些部分需要輸出,并經過tanh函數得到想要輸出的數據。
在本文中,LSTM預測模型包含多個LSTM記憶單元。其中,選擇“Min-MaxNormaliza-tion”進行數據歸一化處理;選擇“adam”作為優化器;選擇“meansquarederror”作為損失函數。特征矩陣X和Y'為模型輸入,其中可用泊位數量變化的預測由矩陣X來實現,而峰值時間的預測由矩陣Y'來實現。利用LSTM隱藏層迭代計算得到,未來第k+1個粒化窗口的可用泊位數量變化Pk+1=(startk+1,lowk+1,upk+1,endk+1)和對應的峰值時刻t'lowk、t'upk。算法流程如下:
2.3樣條插值重構
LSTM神經網絡模型預測得到startk+1、lowk+1、upk+1、endk+1和t'upk+1、t'lowk+1(其中startk+1和endk+1是第k+1個粒化窗口內的起始點和終止點對應的可用停車位數量,對應的預測特征數據之后,便得到可用停車位數目的變化特征。這些特征數據在數值分布上是離散的,插值就是通過這些離散的數據,去確定某一類已知函數的參數或尋找某個近似函數,使得到的近似函數與已知數據有較高的擬合程度,最后求取“斷鏈”處的模擬值,實現曲線重構。因此,為將這些特征數據重構得到預測區間內可用停車位數目的連續變化狀態,本文采用3次樣條插值進行相應數據處理。這是因為,與更高次樣條相比,它只需較少的計算和存儲,且較穩定,在靈活性和計算速度之間進行了合理的折中。插值重構過程具體如下:
(1)對第k+1個粒子窗口內的時間進行升序排列、劃分區間,并確定對應時刻的可用停車位數值。
其中,xj和yj就相當于某個時間和該時間點上對應的可用停車位數;mj是常數值;使用構造的插值函數對區間進行插值重構。然后,插值該區間的曲線,得到該區間的預測特征數據對應的預測時間序列數據。之后,對和
兩個區間使用同樣的方法,獲取這兩個區間的預測特征數據對應的預測時間序列數據。最后,合并各個區間內的預測時間序列數據,得到完整的預測時間序列數據,從而得到可用停車位波動變化趨勢。
3.可用停車位預測實驗及結果分析
3.1數據變換
本文選擇廣東省深圳市羅湖區寶琳珠寶中心地上停車場的停車數據作為實驗數據,統計時間為2016年7月3日至7月5日,原始可用停車位數據如圖2所示。其中,數據的采樣頻率為每分鐘記錄一次未占用停車位的數據,因此每天會有1440個數據點。
根據FIG理論,本文將時間粒度T設定為30min,即選擇每30個點作為一個粒化窗口,則每天對應48個粒化窗口。在每個粒化窗口內建立模糊集,模糊粒化后的結果如圖3所示。其中,圖中每條柱體都是由特征數據start、low、up和end四個值構成;空心柱體表示在這個時間段內,可用停車位數量是增加的;實心柱體則表示在這個時間段內可用停車位減少。在每一個粒化窗口中,可用泊位數都是在最大值up和最小值low之間波動,同時數據量也由每天的1440個降低到192(48×4)個。由此,便獲得可用停車位的模糊特征數據,用于預測可用停車位數目變化特征。
3.2基于長短期記憶神經網絡的預測結果
預測可用停車位數目變化特征數據是建立在LSTM神經網絡的模型基礎上。神經網絡有很多參數需要設置,如何調整模型的超參數以及如何設置模型的結構以聚合最佳參數是非常重要的。本文分兩次實現對未來停車位的數目變化預測和峰值時間預測。其中,用于停車位數目變化預測的網絡,輸入層和輸出層的神經元個數都為4,隱藏層LSTM的神經元個數為10。而用于峰值時間預測的網絡,輸出層神經元個數為2,其他層不變。首先,利用2016.07.03—2016.07.05的停車特征數據訓練LSTM神經網絡,也就是經過FIG變化后的X、Y'矩陣,網絡訓練次數為100次,當超過訓練次數則終止訓練;然后,將訓練好的網絡模型保存,并利用該模型對可用停車位變化特征數據預測。本文使用2016.07.06的數據進行測試,把前3個時刻的特征數據,即可用停車位數目變化以及峰值時間數據作為輸入,迭代預測下一個時刻的特征數據,實驗結果如圖4所示。圖4中,曲線反映了實際停車位數目變化與預測值的對比情況,start、up、low、end整體預測的平均絕對誤差為2.26。
3.3實驗結果對比分析
預測得到下一時刻可用停車位的特征數據,這只是其中4個點對應的可用停車位和出現的時間。為了讓用戶清楚地知道未來10min內目標停車場可用停車位的連續變化,本文用3次樣條插值算法,重構出可用停車位的連續變化狀態曲線。如圖5所示,每10min是一個預測區間,在17:00—17:30共有三個區間,每個區間插值得到預測時間段內可用停車位的連續變化狀態。圖5中曲線“original”為真實的可用停車位情況。從圖5對比可以看到,當時間步長都為10min時,使用LSTM神經網絡預測只能得到一個點,且區間的變化趨勢只能把各點直接相連;而本文提出的區間變化趨勢預測模型FLOPS,不僅能知道區間內每個點的可用停車位信息情況,而且精確度比LSTM好,同時還能知道區間內何時出現停車高峰,能夠讓用戶掌握更多的停車信息。
接下來,對二者進行均方根誤差對比,結果如圖6所示。結合特征數據重構對比圖(圖5)和誤差分析圖(圖6)不難發現,FLOPS和LSTM對區間端點的預測都比較準確,但在時間步長相同時,LSTM網絡對區間內的值的預測效果明顯不足,均方根誤差波動很大,單獨使用LSTM網絡的平均均方根誤差(RMSE)為6.57,而FLOPS的平均均方根誤差為2.86。同樣地,LSTM網絡要實現區間趨勢的預測,需要付出更多預測步的代價,預測結果如圖7所示。從圖7可以看到,在預測周期為10min時,FLOPS方法與LSTM的預測準確度近似,但FLOPS只需1步就可以預測區間趨勢,計算消耗0.054s;而LSTM需要10步才能完成區間預測,且需要1min才給出一個預測值,計算消耗0.56s,具體的計算代價如圖8所示。因此,在預測準確度相近的情況下,本文所提出的FLOPS具有更好的計算性能優勢。
4.與國內外相似研究的對比分析
現階段對停車場泊位預測的研究,主要集中在傳統的時間序列預測方法和神經網絡模型。在Yu等[9]研究中,ARIMA模型對可用停車位的預測,均方根誤差為4.47,本文提出的方法FLOPS均方根誤差為2.86;Sharma等[13]用小波神經網絡做可用停車位的預測,系統均方根誤差為3.08;且小波神經網絡模型完成一天的預測計算消耗13.3s,而本方法FLOPS計算消耗時間為8.9s。因此,本文提出的將LSTM網絡應用于可用泊車位的預測方法,不僅提高了預測的精度,還提高了計算速度,具有較大的實際應用價值。本文的不足之處是,未根據不同用車時間對停車數據進行更細的劃分,如工作日和非工作日時市民用車情況大不同,可針對二者細分預測模型,這樣應該可以進一步提高模型的預測
準確度。
5.總結
本文提出了一種可以在較長預測時間周期內保持數據變化特征的預測方法,適用于較大時間跨度(>30min)條件下的高精度預測。該方法使用模糊信息粒化的思想獲取特征數據集,通過LSTM網絡對特征數據集進行預測,而后再結合3次樣條插值將特征數據集重構整個預測區間停車位的連續變化狀態。從仿真結果可以看出,該方法在相同預測時間步的可用車位預測上,比傳統預測方法具有更高的精度;在保持相近預測精度的條件下,比傳統預測方法具有更高的計算效率。在未來的工作中,我們會考慮更多維度因素,如天氣、大型活動等突變因素對停車帶來的影響,以進一步提高預測準確度。
標簽:
上一篇: 研控科技ATX-786在視頻監控...
下一篇:基于粗標簽約束的細粒度分類
中國傳動網版權與免責聲明:凡本網注明[來源:中國傳動網]的所有文字、圖片、音視和視頻文件,版權均為中國傳動網(www.hysjfh.com)獨家所有。如需轉載請與0755-82949061聯系。任何媒體、網站或個人轉載使用時須注明來源“中國傳動網”,違反者本網將追究其法律責任。
本網轉載并注明其他來源的稿件,均來自互聯網或業內投稿人士,版權屬于原版權人。轉載請保留稿件來源及作者,禁止擅自篡改,違者自負版權法律責任。
相關資訊
產品新聞
更多>2025-04-11
2025-04-08
2025-03-31
2025-03-26
2025-03-20
2025-03-13