一、賽題分析本次比賽主要是針對(duì)大風(fēng)/雷達(dá)回波/降水的短臨預(yù)報(bào),屬于典型的時(shí)空序列預(yù)測(cè)問(wèn)題,此類(lèi)問(wèn)題可以從分類(lèi)和回歸預(yù)測(cè)兩個(gè)角度來(lái)解決。 由于大風(fēng)和降水預(yù)測(cè)很難轉(zhuǎn)換為分類(lèi)預(yù)測(cè)問(wèn)題,而且我們經(jīng)過(guò)大量的模型試驗(yàn)表明,多變量回歸預(yù)測(cè)很難同時(shí)達(dá)到最優(yōu),且很難超越單變量回歸預(yù)測(cè)。 因此,我們最終采用了單變量回歸預(yù)測(cè)思路,并利用過(guò)去一小時(shí)數(shù)據(jù)預(yù)測(cè)未來(lái)兩小時(shí)各氣象要素的時(shí)空演變。以下將圍繞我們決賽最終采用的模型和策略進(jìn)行介紹
二、總體設(shè)計(jì)思路三、數(shù)據(jù)預(yù)處理數(shù)據(jù)清洗: 去除雷達(dá)回波低值偽影以及異常降水值。 樣本重采樣和降采樣: 由于數(shù)據(jù)分布不平衡問(wèn)題,根據(jù)各要素閾值區(qū)間分布情況對(duì)樣本進(jìn)行重采樣和降采樣,以平衡不同強(qiáng)度樣本占比。 數(shù)據(jù)集調(diào)整: 由于所給的數(shù)據(jù)集中相鄰個(gè)例僅相差一幀,重復(fù)率過(guò)高,因此我們將臨近個(gè)例的間隔調(diào)整為5幀,降低樣本重疊率,提升模型訓(xùn)練穩(wěn)定性。
四、模型選擇與優(yōu)化風(fēng)速預(yù)測(cè)—— SEResNet 雷達(dá)回波預(yù)測(cè)模型——TrajGRU 降水預(yù)測(cè)模型:雙模型融合模型一:U2Net模型二:PhyDNet 雙模型融合:兩個(gè)模型預(yù)測(cè)結(jié)果取平均
五、損失函數(shù) 針對(duì)不同模型,設(shè)計(jì)不同損失函數(shù),由于本賽題預(yù)測(cè)對(duì)象均有嚴(yán)重不平衡問(wèn)題,因此針對(duì)MSE和MAE類(lèi)型損失函數(shù)需要給與相應(yīng)權(quán)重設(shè)置。而DiceLoss本身僅針對(duì)目標(biāo)區(qū)域計(jì)算損失,因此無(wú)需再給定權(quán)重。 此外,針對(duì)降水,加入了60/90/120min的累計(jì)降水的損失作為正則項(xiàng)。
六、性能提升策略Two-stage優(yōu)化: 凍結(jié)模型部分層,調(diào)整損失函數(shù)權(quán)重,調(diào)低學(xué)習(xí)率,進(jìn)行模型參數(shù)微調(diào),提高強(qiáng)回波/降水的預(yù)測(cè)技能評(píng)分 模型集成: 針對(duì)降水預(yù)測(cè),融合U2Net與PhyDNet預(yù)測(cè),提升模型泛化能力和穩(wěn)定性 偏差訂正: 考慮了預(yù)測(cè)能力的時(shí)間衰減和閾值的影響,對(duì)模型預(yù)測(cè)進(jìn)行偏差訂正,提高強(qiáng)回波/降水的預(yù)測(cè)技能評(píng)分
七、官方個(gè)例真實(shí)性風(fēng)速預(yù)測(cè) 雷達(dá)回波 降水預(yù)測(cè) 八、總結(jié)樣本不平衡: 樣本重采樣+損失加權(quán)和正則/類(lèi)別不平衡損失+Two-stage優(yōu)化減輕類(lèi)別極度不平衡導(dǎo)致的強(qiáng)回波/降水難預(yù)測(cè)問(wèn)題 模型性能及穩(wěn)定性: 多模型集成進(jìn)一步提高降水的整體預(yù)報(bào)技能評(píng)分及模型的穩(wěn)定性 后處理方法: 引入模型預(yù)測(cè)偏差訂正后處理方法提高強(qiáng)回波/降水預(yù)報(bào)技能評(píng)分
本次比賽我們初賽和復(fù)賽均為第二,其中復(fù)賽實(shí)時(shí)評(píng)測(cè)階段22天大部分時(shí)段取得前6成績(jī),其中10天取得第1,模型總體表現(xiàn)較為穩(wěn)定
|