寫在前面
相信有很多朋友和我一樣,之前聽過數(shù)據(jù)分析,數(shù)據(jù)挖掘,數(shù)據(jù)開發(fā)等等概念或者角色,但是卻對(duì)于數(shù)據(jù)洞察沒有概念 。
本文嘗試通過較為全面地講述,讓大家能夠迅速建立起數(shù)據(jù)洞察的相關(guān)認(rèn)知。
基本概念
數(shù)據(jù)分析/挖掘/洞察定義
這幾個(gè)詞很相似,我們來分別進(jìn)行闡述 :
- 數(shù)據(jù)分析(Business Analysis):傳統(tǒng)定義的數(shù)據(jù)分析,一般通過SQL/Python/Excel等工具匯總數(shù)據(jù),結(jié)合對(duì)業(yè)務(wù)的理解和經(jīng)驗(yàn),主要是由人將數(shù)據(jù)轉(zhuǎn)換為信息;
- 數(shù)據(jù)挖掘:一般通過建模來挖掘數(shù)據(jù)內(nèi)在的關(guān)聯(lián)和信息,主要是機(jī)器從訓(xùn)練集中發(fā)現(xiàn)一定的規(guī)律,從而將數(shù)據(jù)轉(zhuǎn)換為信息;
- 數(shù)據(jù)洞察:通過數(shù)據(jù)分析/挖掘,將數(shù)據(jù)轉(zhuǎn)換為信息,結(jié)合業(yè)務(wù)場(chǎng)景,梳理出影響業(yè)務(wù)結(jié)果的因素和作用鏈路,從而正確地對(duì)于問題進(jìn)行歸因和得出改進(jìn)的方向。
所以我們可以看出數(shù)據(jù)分析和數(shù)據(jù)挖掘是殊途同歸的,最終都收歸于數(shù)據(jù)洞察的體系中。
如何理解數(shù)據(jù)洞察
可能上面關(guān)于數(shù)據(jù)洞察的定義還有一些晦澀,不好理解,接下來我說說我個(gè)人的理解:
- 數(shù)據(jù)分析和數(shù)據(jù)挖掘更加偏向于數(shù)據(jù)處理的手段,通過業(yè)務(wù)或者機(jī)器的方式將數(shù)據(jù)加工成一些信息 ,比如:啤酒和紙尿褲放在銷售量比單賣要高;用戶喜歡在夏天到來時(shí)才購(gòu)買游泳裝備等等。
- 而數(shù)據(jù)洞察更強(qiáng)調(diào)的對(duì)多種信息的加工和處理 —— 結(jié)合業(yè)務(wù)場(chǎng)景,產(chǎn)出對(duì)于業(yè)務(wù)發(fā)展有價(jià)值的結(jié)論。
既然數(shù)據(jù)洞察的目的是推動(dòng)業(yè)務(wù)的發(fā)展,那么就需要我們以業(yè)務(wù)為導(dǎo)向,關(guān)注業(yè)務(wù)中實(shí)際遇到的需求或者問題。并且在得出結(jié)論后,能夠產(chǎn)生可落地的action,去驗(yàn)證和迭代我們的結(jié)論,從而推動(dòng)業(yè)務(wù)的發(fā)展。
我們用一張圖來描述下數(shù)據(jù)洞察的一個(gè)完整鏈路 :
三要素
數(shù)據(jù)洞察的三要素為:數(shù)據(jù)、業(yè)務(wù)場(chǎng)景、標(biāo)準(zhǔn)
- 數(shù)據(jù):我們得出的結(jié)論要基于數(shù)據(jù),避免受到個(gè)案或者特例的影響 ;
- 業(yè)務(wù)場(chǎng)景 :少了業(yè)務(wù)場(chǎng)景,就無法理解孤立的數(shù)據(jù)對(duì)于業(yè)務(wù)的實(shí)際意義;
- 標(biāo)準(zhǔn):結(jié)合業(yè)務(wù)場(chǎng)景,我們才能對(duì)于數(shù)據(jù)的好與壞制定出標(biāo)準(zhǔn),比如說身高150對(duì)于成年男性可能不算高,但是對(duì)于小學(xué)生來說卻是很高了;
具體操作
全景步驟
以上我們了解了數(shù)據(jù)洞察的一些基本概念,接下來我們來講講如何實(shí)際操作。
我在【數(shù)據(jù)向】系列的上一篇文章中產(chǎn)出了一次數(shù)據(jù)分析的完整流程 ,具體可見【數(shù)據(jù)向】(三)數(shù)據(jù)建模、數(shù)據(jù)挖掘、數(shù)據(jù)分析異同。這次我將上次的繪圖融入進(jìn)數(shù)據(jù)洞察的鏈路中,來展現(xiàn)數(shù)據(jù)洞察的全景步驟:
圖上步驟主要分為以下幾個(gè)層級(jí):
- 業(yè)務(wù)層:結(jié)合業(yè)務(wù)的問題和需求,先定義需要哪些數(shù)據(jù),以及這些數(shù)據(jù)在場(chǎng)景中的含義
- 數(shù)據(jù)層:通過數(shù)據(jù)埋點(diǎn)上報(bào)、業(yè)務(wù)數(shù)據(jù)庫同步等方式獲取業(yè)務(wù)所需的數(shù)據(jù),進(jìn)行相應(yīng)的數(shù)據(jù)清洗,避免臟數(shù)據(jù)的影響;將數(shù)據(jù)進(jìn)行合并和整理,便于分析;
- 分析層:通過數(shù)據(jù)分析或數(shù)據(jù)挖掘的手段從數(shù)據(jù)中獲取規(guī)律、現(xiàn)象或者數(shù)據(jù)模型
- 輸出層:結(jié)合分析層得到的信息和業(yè)務(wù)場(chǎng)景,輸出洞察結(jié)論,制定行動(dòng)計(jì)劃;在行動(dòng)后根據(jù)新產(chǎn)生的數(shù)據(jù)驗(yàn)證之前得到的結(jié)論的有效性,進(jìn)行迭代;
最終通過以上的循環(huán),我們可以不斷地積累不同業(yè)務(wù)場(chǎng)景下的洞察結(jié)論。
如何從零培養(yǎng)數(shù)據(jù)洞察力
那么上面我們談了數(shù)據(jù)洞察的全景步驟 ,接下來我們聊聊作為一個(gè)小白,我們?nèi)绾螐牧闩囵B(yǎng)自己的數(shù)據(jù)洞察能力呢?
- 首先從單個(gè)業(yè)務(wù)場(chǎng)景中的單指標(biāo)開始著手:
- 可能整個(gè)業(yè)務(wù)鏈路很長(zhǎng),所以先從鏈路中的一個(gè)場(chǎng)景出發(fā),比如電商購(gòu)物,從流量入口的站外/站內(nèi),到產(chǎn)品詳情頁,到加入購(gòu)物車,到確認(rèn)購(gòu)買頁面,到最后付款流程;
- 先選擇較大的異動(dòng)進(jìn)行分析如暴漲、暴跌:
- 在極端的情況下,比較容易定位背后的影響因素;
- 積累了結(jié)論后對(duì)于小幅度的波動(dòng)也能夠進(jìn)行合理的解讀了;
- 從靜態(tài)到動(dòng)態(tài):總結(jié)周期性規(guī)律,結(jié)合時(shí)間軸
- 比如泳衣銷售的暴漲暴跌可能是由于營(yíng)銷活動(dòng),或者天氣突變;但是對(duì)于漲跌的分析是靜態(tài)的,從一個(gè)點(diǎn)到另一個(gè)點(diǎn)的;
- 一些業(yè)務(wù)場(chǎng)景可能會(huì)有周期性特點(diǎn),結(jié)合一連串的靜態(tài)場(chǎng)景分析可以總結(jié)出周期性規(guī)律,比如上述的泳衣銷售具有季節(jié)性周期的特點(diǎn);再比如新聞的閱讀具有生命周期的特點(diǎn),剛出來時(shí)較熱,后續(xù)逐漸轉(zhuǎn)冷;
- 從單指標(biāo)到多指標(biāo):比如分析游戲的收入時(shí),結(jié)合活躍人數(shù)、付費(fèi)轉(zhuǎn)化率、客單價(jià)等多維度指標(biāo)進(jìn)行協(xié)同分析
寫在最后
通過對(duì)數(shù)據(jù)洞察的了解 ,我們可以發(fā)現(xiàn),數(shù)據(jù)洞察與業(yè)務(wù)的結(jié)合是非常緊密的 。每個(gè)洞察結(jié)論離開了其背后的業(yè)務(wù)場(chǎng)景可能都是無效的。所以數(shù)據(jù)洞察不存在“銀彈“或者“萬金油”,我們 還是要通過不斷地實(shí)操進(jìn)行場(chǎng)景上的積累 ,從而提升數(shù)據(jù)洞察力。
參考
1.數(shù)據(jù)洞察,是數(shù)據(jù)分析的2.0
2.我們?nèi)绾翁嵘约旱臄?shù)據(jù)洞察力?
3.機(jī)器學(xué)習(xí)/NLP常用知識(shí)點(diǎn)和代碼實(shí)現(xiàn)
|