總體框架在介紹數(shù)據(jù)體系和框架前,為了方便大家理解,先簡(jiǎn)單闡述一下O2O營銷的基本組成,我們從渠道和業(yè)務(wù)兩個(gè)維度上抽象簡(jiǎn)化營銷的表現(xiàn)形態(tài)見圖1。 橫軸從營銷發(fā)生的渠道(站內(nèi)和站外),縱軸是營銷的主題業(yè)務(wù)(流量和交易)。在這兩個(gè)維度上,產(chǎn)生了多種營銷的形態(tài)。而數(shù)據(jù)分析和挖掘在這個(gè)環(huán)節(jié)都能發(fā)揮很大的價(jià)值。這次我們主要從站內(nèi)的精準(zhǔn)化用戶營銷活動(dòng)上介紹相關(guān)的工作,以后如有機(jī)會(huì),后續(xù)再為大家分享站外流量和交易獲取維度的內(nèi)容,如DSP的精準(zhǔn)投放,渠道價(jià)值排名和反作弊。 一個(gè)站內(nèi)用戶運(yùn)營活動(dòng)的生命周期大概可以歸納為確定目標(biāo)、選取活動(dòng)對(duì)象、設(shè)計(jì)活動(dòng)方案、活動(dòng)配置與上線、線上精準(zhǔn)營銷與動(dòng)態(tài)優(yōu)化以及效果監(jiān)控與評(píng)估六個(gè)環(huán)節(jié)見圖2。 在整個(gè)周期中,數(shù)據(jù)都存在巨大的發(fā)揮空間與價(jià)值。我們?cè)陧?xiàng)目啟動(dòng)后與業(yè)務(wù)充分溝通,了解其業(yè)務(wù)痛點(diǎn),確定一期主要嘗試從數(shù)據(jù)上幫助運(yùn)營和財(cái)務(wù)同事解決以下幾個(gè)問題:
對(duì)于1的目標(biāo)確定以前更多是拍腦袋決定,缺乏一套穩(wěn)定的分析框架和模型。而活動(dòng)對(duì)象,包括用戶和商戶/團(tuán)單選取,更是需要業(yè)務(wù)和BI同學(xué)每次人工跑數(shù)據(jù)得出,效率低下。 而對(duì)2和3,更是缺乏一套公司的營銷監(jiān)控平臺(tái),時(shí)常出現(xiàn)預(yù)算花超不可控的情況。活動(dòng)結(jié)束后,效果數(shù)據(jù)也是各個(gè)業(yè)務(wù)方自己給出,口徑不一致導(dǎo)致難以整體評(píng)估效果。 系統(tǒng)架構(gòu)基于上述的業(yè)務(wù)場(chǎng)景和需求,我們用分層的金字塔架構(gòu)設(shè)計(jì)了一套營銷數(shù)據(jù)系統(tǒng)和服務(wù),有效滿足了業(yè)務(wù)的訴求并具有很好的平臺(tái)擴(kuò)展性見圖3。 最底層是我們的數(shù)據(jù)倉庫和模型層,這里又大致可以分為三個(gè)主題:畫像、運(yùn)營和營銷以及流量。這三個(gè)都是運(yùn)營活動(dòng)必不可少的數(shù)據(jù)組成部分。 對(duì)于畫像,我們的做法是部分自主建設(shè),同時(shí)集成業(yè)務(wù)方,如搜索、廣告和風(fēng)控團(tuán)隊(duì)開發(fā)的畫像標(biāo)簽,形成統(tǒng)一的畫像寬表,目前我們的用戶標(biāo)簽體系覆蓋了包括基本信息、設(shè)備信息、消費(fèi)瀏覽(如品類偏好和營銷敏感度)以及特征人群等五個(gè)大類的180多個(gè)標(biāo)簽見圖4。在標(biāo)簽的實(shí)現(xiàn)上,我們也秉承從需求出發(fā)的原則逐步迭代,從最初的以統(tǒng)計(jì)和基本的營銷模型如RFM為主,到現(xiàn)在在潛在用戶挖掘和用戶偏好上開始探索使用機(jī)器學(xué)習(xí)的挖掘方法(見表1)。 在營銷運(yùn)營集市上,我們與財(cái)務(wù)和支付系統(tǒng)協(xié)作,開發(fā)了一套公司預(yù)算流水號(hào)系統(tǒng)。運(yùn)營人員在配置活動(dòng)時(shí),從財(cái)務(wù)申請(qǐng)預(yù)算流水號(hào),并在優(yōu)惠后臺(tái)配置與對(duì)應(yīng)活動(dòng)關(guān)聯(lián),用戶享受優(yōu)惠的每一筆訂單都會(huì)在業(yè)務(wù)表中進(jìn)行打點(diǎn),做到在最細(xì)粒度上的預(yù)算監(jiān)控。同時(shí)在用戶、商品等維度建模后,形成了營銷交易評(píng)估的指標(biāo)體系:新用戶成本,新老用戶分布,7天、30天購買留存等。 活動(dòng)評(píng)估的另一個(gè)維度就是流量,活動(dòng)頁的點(diǎn)擊、轉(zhuǎn)化漏斗、不同渠道來源等指標(biāo)是運(yùn)營人員無時(shí)無刻不關(guān)系的指標(biāo),這部分模型作為數(shù)據(jù)中心數(shù)據(jù)倉庫中核心的一環(huán)。我們參考了其他公司的做法,建立了自己的PV、UV、Session以及路徑樹轉(zhuǎn)化等模型,可以很好的滿足運(yùn)營需求。 在數(shù)倉之上,我們建立了數(shù)據(jù)服務(wù)層,在統(tǒng)一使用公司高性能的RPC框架之下,針對(duì)不同的上層選擇了有差異化的數(shù)據(jù)存儲(chǔ)和查詢引擎,如畫像服務(wù)更多的是滿足線上業(yè)務(wù)系統(tǒng)的實(shí)時(shí)訪問需求,并發(fā)和延遲都要求毫秒級(jí)的服務(wù)可用性,我們選用了Redis作為存儲(chǔ),而對(duì)于分析類產(chǎn)品,對(duì)并發(fā)和延遲要求相對(duì)較低,但對(duì)數(shù)據(jù)在不同維度上的聚合操作要求較高,在對(duì)比了Kylin、ElasticSearch、Druid后,我們決定使用ES作為存儲(chǔ)和查詢引擎。主要有兩個(gè)理由:一是我們有留存等指標(biāo),需要重刷數(shù)據(jù),而對(duì)于Kylin來說,這就意味著無法使用增量cube,必須重建整個(gè)cube,代價(jià)很大,同時(shí)ES在同樣的維度上,空間膨脹度上比Kylin少近一半;二是ES整個(gè)系統(tǒng)設(shè)計(jì)和架構(gòu)非常簡(jiǎn)潔,特別是運(yùn)維方案簡(jiǎn)單,也有專門的工具支持,對(duì)于當(dāng)時(shí)沒有專職運(yùn)維的開發(fā)團(tuán)隊(duì)來說是一個(gè)捷徑。 最上層是數(shù)據(jù)產(chǎn)品和應(yīng)用,針對(duì)前面提到的運(yùn)營活動(dòng)的不同階段提供數(shù)據(jù)平臺(tái)和工具:
除了系統(tǒng)化的建設(shè)外,在運(yùn)營活動(dòng)的迭代中,我們與業(yè)務(wù)合作,進(jìn)行了大大小小20多個(gè)專題分析,產(chǎn)出了包括閃惠預(yù)算動(dòng)態(tài)分配,閃惠立減梯度優(yōu)化,用戶價(jià)值分以及免費(fèi)吃喝玩樂選單等主題模型。幫助業(yè)務(wù)提高預(yù)算使用率30%,同時(shí)更好的評(píng)估拉新帶來的用戶價(jià)值。 而在開發(fā)過程中,我們也發(fā)現(xiàn)需要一個(gè)較為通用的挖掘平臺(tái),提供如特征選取和生成,模型訓(xùn)練和評(píng)估等功能,幫助分析師和挖掘工程師快速建模。因此也規(guī)劃了基于Spark開發(fā)機(jī)器學(xué)習(xí)平臺(tái)的建設(shè)。 整體的架構(gòu)最終是為精準(zhǔn)化營銷服務(wù),下面就結(jié)合兩個(gè)案例具體介紹。 案例分享外賣潛在用戶挖掘與精準(zhǔn)營銷精準(zhǔn)營銷一個(gè)主要的方向就是潛在客戶挖掘,特別是在點(diǎn)評(píng)這個(gè)平臺(tái)上,目前已有包括美食、外賣、麗人、教育等近20個(gè)業(yè)務(wù),如何在平臺(tái)近一億的活躍用戶中挖掘垂直頻道的潛在用戶就成了精準(zhǔn)化營銷的一個(gè)很現(xiàn)實(shí)的問題。Facebook和騰訊的廣告系統(tǒng)都提供類似的lookalike功能,幫助客戶找出和投放人群相似的用戶群,其廣告的點(diǎn)擊率和轉(zhuǎn)化率都高于一般鎖定廣泛受眾的廣告。 目前常用的潛在用戶挖掘方案主要就是基于畫像或者關(guān)系鏈的挖掘,我們團(tuán)隊(duì)從需求出發(fā),結(jié)合點(diǎn)評(píng)的畫像體系從關(guān)聯(lián)規(guī)則;聚類和分類模型三個(gè)算法上進(jìn)行了探索。對(duì)比效果如下: 未來我們除了在分類和聚類上進(jìn)一步優(yōu)化外,還計(jì)劃利用點(diǎn)評(píng)好友關(guān)系,使用Spark的GraphX建立標(biāo)簽傳播的算法進(jìn)一步深挖高質(zhì)量的相似用戶。 微信紅包精準(zhǔn)優(yōu)惠券引擎另外一個(gè)精準(zhǔn)營銷的案例是智能發(fā)券引擎Cord,背景是點(diǎn)評(píng)會(huì)在微信群/朋友圈中用紅包發(fā)各種優(yōu)惠券,當(dāng)好友來領(lǐng)券是如何決定發(fā)哪個(gè)業(yè)務(wù)什么面值的券更容易轉(zhuǎn)化。本質(zhì)上是一個(gè)簡(jiǎn)化的推薦問題,我們也參照廣告系統(tǒng)的架構(gòu)設(shè)計(jì)了Cord引擎。 主要包含分流模塊(用于灰度發(fā)布和AB測(cè)試)、召回模塊(負(fù)責(zé)從畫像服務(wù)和優(yōu)惠配置系統(tǒng)獲取人和券的物料信息)、過濾模塊(負(fù)責(zé)進(jìn)行兩者的匹配)和推薦模塊(可以根據(jù)業(yè)務(wù)規(guī)則或者我們挖掘的策略對(duì)結(jié)果進(jìn)行排序),返回給活動(dòng)系統(tǒng)最合適的優(yōu)惠券進(jìn)行發(fā)放。整個(gè)系統(tǒng)實(shí)現(xiàn)完全服務(wù)化和可配置化,外部的活動(dòng)系統(tǒng)可以根據(jù)配置的開關(guān)啟用或者在特殊場(chǎng)景下禁用cord服務(wù);而cord內(nèi)部,也可以根據(jù)配置中心的設(shè)置,動(dòng)態(tài)調(diào)整推薦策略。 在數(shù)據(jù)挖掘上,目前除了業(yè)務(wù)配置規(guī)則外,我們針對(duì)公司主流的運(yùn)營方式,基于畫像中的用戶偏好和優(yōu)惠敏感等標(biāo)簽進(jìn)行綜合打分,抽象了以GMV為目的和以拉新用戶為目的的推薦策略。 總結(jié)精準(zhǔn)營銷是目前大數(shù)據(jù)落地的一個(gè)公認(rèn)的場(chǎng)景,但隨著移動(dòng)互聯(lián)網(wǎng)和O2O的發(fā)展,這一領(lǐng)域也會(huì)有新的問題和挑戰(zhàn)出現(xiàn)。結(jié)合我們這一年多的實(shí)踐經(jīng)驗(yàn),團(tuán)隊(duì)也歸納了一套數(shù)據(jù)系統(tǒng)架構(gòu)的設(shè)計(jì)原則:
展望未來,在數(shù)據(jù)上如何快速的進(jìn)行挖掘模型的開發(fā),在架構(gòu)和產(chǎn)品上滿足更多場(chǎng)景,讓數(shù)據(jù)在營銷上發(fā)揮更大的價(jià)值是下一步的重點(diǎn)方向。 作者簡(jiǎn)介: 曹一帆,2012年7月從上海交通大學(xué)畢業(yè),加入點(diǎn)評(píng)數(shù)據(jù)平臺(tái)團(tuán)隊(duì),進(jìn)行大數(shù)據(jù)ETL,數(shù)據(jù)分析等工作,目前參與點(diǎn)評(píng)用戶增長(zhǎng)的數(shù)據(jù)挖掘工作。 毛天明,點(diǎn)評(píng)數(shù)據(jù)應(yīng)用組高級(jí)工程師,負(fù)責(zé)精準(zhǔn)營銷、用戶畫像等項(xiàng)目,曾就職于百度基礎(chǔ)架構(gòu)部。 樊聰:點(diǎn)評(píng)數(shù)據(jù)中心數(shù)據(jù)應(yīng)用負(fù)責(zé)人,目前主要負(fù)責(zé)點(diǎn)評(píng)精準(zhǔn)化營銷,用戶畫像和數(shù)據(jù)產(chǎn)品等工作,曾就職于微軟,百度,對(duì)數(shù)據(jù)挖掘,大數(shù)據(jù)產(chǎn)品和服務(wù)等領(lǐng)域有一定研究。 責(zé)編:zhonghao@csdn.net |
|