0 引言 DS證據(jù)理論因具有很強(qiáng)的處理不確定信息的能力,近年來在信息融合領(lǐng)域得到廣泛應(yīng)用。然而,如何構(gòu)造DS證據(jù)理論中的基本概率賦值函數(shù)(Basic Probability Assignment,BPA),一直是信息融合中的一大難題。對此,許多學(xué)者都做出了研究[1-8]。ZHU Y M等[1]利用模糊-均值聚類實(shí)現(xiàn)了BPA的獲??;蔣雯等[2]基于樣本差異度的方法構(gòu)造初始BPA函數(shù);FLOREA M C等[3]基于隸屬度生成BPA;周皓等[4]將SVM通過Platt的概率模型來確定BPA;Ai Lingmei 等[5]通過神經(jīng)網(wǎng)絡(luò)的輸出來構(gòu)造BPA。 支持向量機(jī)(Support Vector Machine,SVM)是目前廣泛應(yīng)用的一種智能診斷分類器,該模型建立在統(tǒng)計(jì)學(xué)習(xí)理論和結(jié)構(gòu)風(fēng)險(xiǎn)最小化原理上,不僅能夠克服“維數(shù)災(zāi)難”、“過擬合”以及其他傳統(tǒng)學(xué)習(xí)算法不可避免的問題,還在小樣本學(xué)習(xí)問題上表現(xiàn)出較大優(yōu)勢。但SVM輸出的是測試樣本的類別標(biāo)簽,為硬輸出,進(jìn)行多個(gè)SVM輸出映射時(shí)主要采用的是投票法,這很大程度上限制了SVM在信息融合領(lǐng)域中的應(yīng)用。很多學(xué)者已經(jīng)展開了對于SVM概率輸出問題的研究[9-12]。其中,由PLATT J C[9]提出的計(jì)算后驗(yàn)概率的方法得到普遍的應(yīng)用。 本文提出一種SVM-DS決策融合方法,結(jié)合了DS與SVM的優(yōu)點(diǎn),同時(shí)解決了兩者在實(shí)際應(yīng)用中的一些局限性問題。通過Platt的概率模型分別將RBF核函數(shù)SVM分類器(SVM-RBF)、線性核函數(shù)SVM分類器(SVM-Linear)和多項(xiàng)式核函數(shù)SVM分類器(SVM-Quadratic)的硬輸出轉(zhuǎn)化為相應(yīng)的后驗(yàn)概率;利用混淆矩陣來計(jì)算分類器的局部可信度;根據(jù)SVM后驗(yàn)概率以及分類器局部可信度,建立BPA函數(shù),解決了DS理論在決策融合中BPA難以確定的問題。通過在UCI標(biāo)準(zhǔn)數(shù)據(jù)集、高速鐵路轉(zhuǎn)向架故障數(shù)據(jù)上的實(shí)驗(yàn),也證明了本文決策融合方法能獲得比單一分類器更高的分類準(zhǔn)確率,且有效提高了方法穩(wěn)定性。 2 SVM介紹 2.1 SVM基本概念 2.2 SVM后驗(yàn)概率輸出 PLATT J C[9]利用sigmoid函數(shù),將SVM的硬輸出映射到概率區(qū)間[0,1],計(jì)算后驗(yàn)概率的模型為: 3 基于混淆矩陣的可信度計(jì)算 在實(shí)際問題中,不同分類器對同一類別數(shù)據(jù)的識別能力是不一樣的。將多個(gè)分類器的輸出直接融合,沒有考慮到分類器的可信度,這樣可能會(huì)得到偏離實(shí)際的決策結(jié)果。因此,本文用混淆矩陣對分類器的局部可信度進(jìn)行描述,并將得到的局部可信度作為DS融合時(shí)的折扣因子。 假設(shè)待分類任務(wù)包含k個(gè)類別,數(shù)據(jù)集X中的樣本數(shù)為M,每個(gè)模式類別中有Mi個(gè)樣本(i=1,2,…,k)。利用分類器L對數(shù)據(jù)集分類后可以得到混淆矩陣Cl表示如下: 4 SVM與DS的融合分類方法 (1)將訓(xùn)練樣本分別通過SVM-RBF分類器、SVM- Linear分類器和SVM-Quadratic分類器進(jìn)行訓(xùn)練,將各分類器的硬輸出轉(zhuǎn)化為軟輸出。 (2)獲得各分類器的混淆矩陣,計(jì)算出各分類器的局部可信度。 (3)將獲得的分類器局部可信度作為融合時(shí)的折扣因子。當(dāng)分類器對某一樣本x判決為wi時(shí),該分類器輸出的結(jié)果可信度為PC(wi),后驗(yàn)概率為Pi,則按式(11)進(jìn)行加權(quán)處理: (4)由式(11)獲得DS決策融合時(shí)的BPA,通過DS融合得到最終決策結(jié)果。SVM-DS決策融合模型如圖1所示。 5 實(shí)驗(yàn)結(jié)果及分析 5.1 高鐵轉(zhuǎn)向架故障數(shù)據(jù)實(shí)驗(yàn) 本文研究的高速列車轉(zhuǎn)向架監(jiān)測數(shù)據(jù)由實(shí)測得到。在速度為200 m/s的高速列車上共計(jì)安裝了22個(gè)傳感器,由此22個(gè)傳感器對應(yīng)輸出的58個(gè)通道數(shù)據(jù)作為本文的實(shí)驗(yàn)數(shù)據(jù)。高速列車轉(zhuǎn)向架單故障包含3種工況,分別為正常、橫向減振器失效和抗蛇行減振器失效。 5.1.1 橫向減振器單故障數(shù)據(jù)實(shí)驗(yàn) 橫向減振器失效包含4種不同故障類型,每種故障類型樣本數(shù)均為140組。實(shí)驗(yàn)隨機(jī)采用一半樣本進(jìn)行訓(xùn)練,另一半的樣本用作測試。 對高速列車橫向減振器單故障的實(shí)測數(shù)據(jù)分別提取均值、方差、裕度指標(biāo)等統(tǒng)計(jì)特征組成27維的特征集,特征分布情況見圖2。 將特征集輸入不同核函數(shù)的SVM分類器得到混淆矩陣分別如下,其中CM1、CM2、CM3分別表示SVM- Linear、SVM-Quadratic和SVM-RBF分類器輸出的混淆矩陣。 根據(jù)得到的混淆矩陣,由式(10)計(jì)算各分類器的局部可信度見表1。 按式(11)將局部可信度折扣到后驗(yàn)概率,再以DS理論融合后得到的分類混淆矩陣如下: 對橫向減振器單故障的測試樣本最后的分類情況見表2。 單一分類器中,SVM-Linear表現(xiàn)最好,SVM-Linear的標(biāo)準(zhǔn)差僅為0.008 6,穩(wěn)定性明顯高于其他兩個(gè)單一分類器,其準(zhǔn)確率為96.8%,略大于SVM-RBF分類器,比SVM-Quadratic高出2.09%。 本文SVM-DS決策方法得到的準(zhǔn)確率為97.41%,比單一分類器中表現(xiàn)最好的SVM-Linear分類器提高了0.61%。SVM-DS方法的標(biāo)準(zhǔn)差為0.005 5,穩(wěn)定性遠(yuǎn)高于SVM-Quadratic和SVM-RBF分類器,比單一分類器中表現(xiàn)最好的SVM-Linear分類器的標(biāo)準(zhǔn)差降低了0.003 1,有效地提升了方法的穩(wěn)定性。 5.1.2 抗蛇行減振器單故障數(shù)據(jù)實(shí)驗(yàn) 抗蛇行減振器失效包含5種不同故障類型,樣本數(shù)為150組。實(shí)驗(yàn)中隨機(jī)采用一半的樣本進(jìn)行訓(xùn)練,另一半的樣本用作測試。 由于抗蛇行單故障中各故障類型之間相似度較大,因而各分類器得到的分類準(zhǔn)確率都不太高。由表3知,在單一分類器中,SVM-RBF分類準(zhǔn)確率為84.28%,高于其他兩個(gè)分類器。SVM-Quadratic與SVM- Linear分類器分類準(zhǔn)確率相差不大。就穩(wěn)定性而已,表現(xiàn)最好的是SVM-Linear分類器。本文提出的SVM-DS決策融合方法準(zhǔn)確率為86.14%,比單一分類器中表現(xiàn)最好的SVM-RBF提高了1.86%。SVM-DS方法標(biāo)準(zhǔn)差為0.016 1,比SVM-Linear降低了0.005 3,比SVM-Quadratic降低了0.011 5??梢娫诳股咝袉喂收现校琒VM-DS決策融合方法的穩(wěn)定性遠(yuǎn)高于各單一分類器。 對比兩種工況的分類結(jié)果可以看出,在橫向減振器單故障實(shí)驗(yàn)中,表現(xiàn)最好的是SVM-Linear,在抗蛇行單故障實(shí)驗(yàn)中分類準(zhǔn)確率最好的是SVM-RBF,穩(wěn)定性最好的是SVM-Linear。這說明,分類器對不同故障數(shù)據(jù)的分類能力是不一樣的,單一分類器幾乎無法做到對各種工況的故障數(shù)據(jù)都表現(xiàn)良好,這也是本文要采用多分類器聯(lián)合的決策融合方法的原因。高鐵轉(zhuǎn)向架單故障數(shù)據(jù)實(shí)驗(yàn)驗(yàn)證了本文SVM-DS決策融合方法的有效性,該方法實(shí)現(xiàn)了故障分類的優(yōu)化,穩(wěn)定地提升了故障識別率。 5.2 UCI標(biāo)準(zhǔn)數(shù)據(jù)集驗(yàn)證 為了充分驗(yàn)證SVM-DS決策融合方法的有效性,本文使用表4所示UCI數(shù)據(jù)集進(jìn)行實(shí)驗(yàn)分析。 限于篇幅,特征分布圖以Iris數(shù)據(jù)集的特征集為例。圖3是Iris標(biāo)準(zhǔn)數(shù)據(jù)集是特征集歸一化后的特征分布圖。 在Wine和Iris數(shù)據(jù)集上,單一分類器表現(xiàn)最好的都是SVM-Linear分類器。在Breast-w數(shù)據(jù)集上,不同核函數(shù)SVM分類器分類效果差異不大。但SVM-DS方法在3種數(shù)據(jù)集上的準(zhǔn)確率都高于各單一分類器,穩(wěn)定性也是最好的。這驗(yàn)證了SVM-DS方法在UCI標(biāo)準(zhǔn)數(shù)據(jù)集上提高分類準(zhǔn)確率的同時(shí),也提高了方法的穩(wěn)定性。 6 結(jié)束語 本文提出一種基于SVM與DS相結(jié)合的決策融合方法。該方法根據(jù)SVM的實(shí)際分類結(jié)果,從中獲取分類標(biāo)簽、后驗(yàn)概率和混淆矩陣等信息。用混淆矩陣來衡量分類器性能,計(jì)算局部可信度,再結(jié)合SVM分類器后驗(yàn)概率來構(gòu)造BPA,使獲得的基本概率賦值函數(shù)更加可靠和符合實(shí)際,從而有效解決了證據(jù)理論應(yīng)用中的一大難題。從實(shí)驗(yàn)結(jié)果可以看出,與單一分類器的分類結(jié)果相比,結(jié)合3種不同SVM分類器的SVM-DS決策融合方法能夠穩(wěn)定地提高分類準(zhǔn)確率。 參考文獻(xiàn) [1] ZHU Y M,BENTABET L,DUPUIS O,et al.Automatic determination of mass functions in Dempster-Shafer theory using fuzzy c-means and spatial neighborhood information for image segmentation[J].Optical Engineering,2002,41(4):760-770. [2] 蔣雯,陳運(yùn)東,湯潮,等.基于樣本差異度的基本概率指派生成方法[J].控制與決策,2015,30(1):71-75. [3] FLOREA M C,JOUSSELME A L,GRENIER D,et al.Approximation techniques for the transformation of fuzzy sets into random sets[J].Fuzzy Sets and Systems,2008,159(3):270-288. [4] 周皓,李少洪.支持向量機(jī)與證據(jù)理論在信息融合中的結(jié)合[J].傳感器技術(shù)學(xué)報(bào),2008,21(9):1566-1570. [5] Ai Lingmei,Wang Jue,Wang Xuelian.Multi-features fusion diagnosis of tremor based on artificial neural network and D-S evidence theory[J].Signal Processing,2008,88(12):2927-2935. [6] Han Deqiang,Deng Yong,Han Chongzhao.Novel approaches for the transformation of fuzzy membership function into basic probability assignment based on uncertain optimization[J].International Journal of Uncertainty Fuzziness and Knowledge-Based Systems,2013,21(2):289-322. [7] 韓德強(qiáng),楊藝,韓崇昭.DS證據(jù)理論研究進(jìn)展及相關(guān)問題探討[J].控制與決策,2014,29(1):1-11. [8] SUH D,YOOK J.A method to determine basic probability assignment in context awareness of a moving object[J].International Journal of Distributed Sensor Networks,2013(2):167-174. [9] PLATT J C.Probabilistic outputs for support vector machines and comparisons to regularized likelihood methods[J].Advances in Large Margain Classifiers,2000,10(4):61-74. [10] 王磊.支持向量機(jī)學(xué)習(xí)算法的若干問題研究[D].長沙:國防科學(xué)技術(shù)大學(xué)研究生院,2009. [11] CHANG C C,LIN C J. LIBSVM:a library for support vector machines[J].ACM Transactions on Intelligent Systems and Technology(TIST),2011,2(3):1-27. [12] 雷蕾,王曉丹,邢雅瓊,等.結(jié)合SVM和DS證據(jù)理論的多極化HRRP分類研究[J].控制與決策,2013(6):861-866. [13] 張靜,宋銳,郁文賢,等.基于混淆矩陣和Fisher準(zhǔn)則構(gòu)造層次化分類器[J].軟件學(xué)報(bào),2005,16(9):1560-1567. [14] 袁憲鋒,宋沐民,周風(fēng)余,等.多PCA模型及SVM-DS融合決策的服務(wù)機(jī)器人故障診斷[J].振動(dòng)、測試與診斷,2015,35(3):434-440. 作者信息: 朱 菲,金煒東 (西南交通大學(xué) 電氣工程學(xué)院,四川 成都610031) |
|