最近剛給帆軟的可視化夏季挑戰(zhàn)賽當完評委,發(fā)現(xiàn)了一批非常好的數(shù)據(jù)分析項目案例,經過官方授權后,分享給大家。 項目背景 社會老齡化的問題日益嚴重,獨居老人的安危牽動人心。通過智能水表,按照既定的數(shù)據(jù)特征識別出水表可能的用水異常,能夠對獨居老人實行智能守護。 但是水務企業(yè)很少有數(shù)據(jù)部門或者專注研究數(shù)據(jù)的人,去進行數(shù)據(jù)挖掘分析,導致很多工作不能科學的決策,比如熱線排班,供水調度等。希望我們的研究成果能給業(yè)界同行帶來參考價值。
使用到的數(shù)據(jù)集 數(shù)據(jù)來源:本次一共用到23個數(shù)據(jù)集,均取自企業(yè)各大系統(tǒng)真實數(shù)據(jù)并脫敏處理,總數(shù)據(jù)量超1000萬行,涵蓋全市疫情前后一年內的數(shù)據(jù)。 分析思路 首先,我們明確了范圍是疫情期間的用水分析,然后分別從數(shù)據(jù)取值、行業(yè)用水分類、用戶畫像、用水預測四個方面去展開分析。
數(shù)據(jù)處理 某用戶用水波動情況 決策樹是一種有監(jiān)督的常用數(shù)據(jù)挖掘定位工具,使用該算法首先要計算所有特征變量的信息熵,由此確定變量的優(yōu)先級,對用戶用水量、地址、抄表周期等數(shù)據(jù)進行特征提取并進行處理,對處理好的特征使用XGBoost算法進行分類。
部分代碼 被識別出疑似異常的用戶,以高亮的方式在圖表中呈現(xiàn),便于巡檢人員重點定向排查。 可視化報告 營業(yè)收費與用戶用水量分析 疫情期間受影響最大的企業(yè)是經營服務行業(yè),一度下跌到33%以下,疫情后隨報復式增長了14%,但整體卻仍未完全恢復元氣。而行政事業(yè)用水持續(xù)低迷,因為很多學校采取了遠程教育的模式。
居民住宅的用水量占據(jù)了本市最高位置,其次是工業(yè)用水,疫情期間的餐飲、娛樂行業(yè)用水幾近消失,甚至低于消費用水。同時,本市正在大量加強基建工作,基建用水也逐年提升。在杠鈴圖中,我們能清晰地看到各用水組成及其最高/最低值與中位數(shù)。 大用戶的變化分析 分析重點用戶受疫情的影響程度,我們提前了重點大用戶的數(shù)據(jù)進行對比,數(shù)據(jù)隨時間變化的趨勢與整體基本一致,20%的大用戶占據(jù)了全市近80%的用水量,商業(yè)、工廠、市政出現(xiàn)了短暫負增長,但很快也恢復了生機。
用戶數(shù)據(jù)挖掘 隨著社會老齡化不斷加快,一些獨居用戶面臨照料問題。將智能水表進行分析管理,按照既定的數(shù)據(jù)特征識別出水表可能的用水異常;二手手游出售管道水回流、持續(xù)用水、長期零水量等,對獨居用戶實行智能守護,能節(jié)省人力,也提高了效率。
完整作品展示
總結 一個成功的數(shù)據(jù)可視化要滿足兩要素: 1、提供足夠的社會價值/商業(yè)價值:本作品的“群體性事件”分析帶來的重大社會價值,體現(xiàn)了國企的強烈的社會責任感。 2、幫助讀者快速理解信息:本作品無論是內容的信噪比、數(shù)據(jù)表達的準確度,還是突出洞察信息的標識,都達到了一個極高的水平。同時本作品還別出心裁的制作出日歷圖、對比杠鈴圖、環(huán)形分析圖等等創(chuàng)意圖表。 源自:2021帆軟BI可視化夏季挑戰(zhàn)賽參賽作品,未經允許禁止轉載 團隊:水務加BI數(shù)據(jù)聯(lián)隊
|
|
來自: 新用戶8719ag3P > 《待分類》