來源:PMCAFF,作者:乘風(fēng)隨行 全文共6220個字,建議閱讀10分鐘 導(dǎo)讀:隨著互聯(lián)網(wǎng)流量逐漸見頂,傳統(tǒng)的粗狂式的買量獲客沖業(yè)績很快會成為業(yè)務(wù)發(fā)展的瓶頸。對于中大型互聯(lián)網(wǎng)公司來說,精細化的運營和精準化營銷是企業(yè)運營老戶,發(fā)揮存量用戶最大價值的必經(jīng)之路。新的流量洼地越來越少,企業(yè)一方面要做到精準獲客,另一方面也要使出渾身解數(shù)提升用戶留存,最大化挖掘用戶價值。運營的精準化需要海量數(shù)據(jù)來支撐,而建設(shè)一個數(shù)據(jù)中臺恰恰是重中之重,其中用戶標簽體系又是數(shù)據(jù)中臺建設(shè)的基礎(chǔ)能力和關(guān)鍵設(shè)施。 用戶標簽是構(gòu)成用戶畫像的核心因素,是將用戶在平臺內(nèi)所產(chǎn)生的業(yè)務(wù)數(shù)據(jù),行為數(shù)據(jù),日志數(shù)據(jù)等分析提煉后生成具有差異性特征的形容詞。即用戶通過平臺,在什么時間什么場景下做了什么行為,平臺將用戶所有行為數(shù)據(jù)提煉出來形成支撐業(yè)務(wù)實現(xiàn)的可視化信息。用戶標簽可以有很多種存在形式,可以是用戶的自然屬性,可以是對用戶交易、資產(chǎn)數(shù)據(jù)的統(tǒng)計指標,也可以是基于某些規(guī)則,總結(jié)出的一些分層。無論是哪種形式,都是對用戶的某個維度特征做描述與刻畫,讓使用者能快速獲取信息。- 可復(fù)用性。標簽可以被多次使用,而非一次性標簽
1. 從更新頻率來分:靜態(tài)標簽、動態(tài)標簽例如“性別”這個標簽,一般來說是不會隨著時間變動的,所以它屬于靜態(tài)標簽;而“最近一次訪問時間”會隨著每次用戶登錄而更新,也就是動態(tài)標簽。 2. 從開發(fā)方式分:事實標簽、規(guī)則標簽、預(yù)測標簽這一種分類方式是從技術(shù)開發(fā)角度區(qū)分的。“事實標簽”是從底層數(shù)據(jù)表中取出原始數(shù)據(jù),進行簡單的加減乘除運算得到的標簽;例如“最近一次登錄距今天數(shù)”這個標簽,它反映基本事實。“規(guī)則標簽”則是進行了業(yè)務(wù)定義后的標簽;例如“流失用戶”這個標簽,基于我們的業(yè)務(wù)認知,可以將“最近一次登錄距今天數(shù)”大于30天的用戶定義為流失用戶,不同公司會有自己的定義方式。 “預(yù)測標簽”是需要利用算法分析預(yù)測才能得到的標簽了;例如電商產(chǎn)品常通過用戶的下單行為,去猜測用戶的性別;通常算法類標簽涉及復(fù)雜的邏輯與權(quán)重,開發(fā)難度大,在所有標簽中占比不高。 3. 從生成規(guī)則分:單一標簽、復(fù)合標簽一般來說,上述的統(tǒng)計類標簽可以說是單一標簽,而規(guī)則類和算法類標簽就是需要多個單一標簽組合而成的復(fù)合標簽。 同樣,層級也是為了業(yè)務(wù)理解更加有序才產(chǎn)生的,例如一級標簽是大類,按具體行業(yè)和業(yè)務(wù)可以分為:人口屬性,行為屬性,營銷屬性,商業(yè)屬性等。二級標簽可以具體下分,比如商業(yè)屬性下二級標簽可以分為優(yōu)惠券,三級標簽分為優(yōu)惠券-敏感度高/中/低用戶。當然,如果業(yè)務(wù)邏輯復(fù)雜,可能還會有三級標簽。以作者多年從業(yè)經(jīng)歷來看,一般的中大型公司或多或少都已經(jīng)有建設(shè)自己的標簽,但實際使用效果卻差強人意,很難驅(qū)動業(yè)務(wù)產(chǎn)生價值。我總結(jié)出互聯(lián)網(wǎng)行業(yè)搭建統(tǒng)一的用戶標簽體系要解決的常見痛點: 用戶畫像、精準營銷平臺人群圈選、算法特征都會涉及到用戶標簽,各個系統(tǒng)存在標簽同義不同值、同值不同義的問題,舉個例子:互金信貸行業(yè)的通過率,就有至少三種不同的統(tǒng)計口徑,風(fēng)控部門是以授信通過或者審核通過為準,財務(wù)部門以放款為準等。不同部門因側(cè)重點不一樣導(dǎo)致對這個指標的定義不一樣。企業(yè)建設(shè)統(tǒng)一的標簽平臺規(guī)范口徑也是數(shù)據(jù)中臺的重要內(nèi)容。 用戶標簽分散,重復(fù)建設(shè),難以統(tǒng)一管理。形成了局部數(shù)據(jù)孤島,存在重復(fù)建設(shè)的問題。比如和標簽生產(chǎn)相關(guān)的團隊就有好幾個:數(shù)據(jù)團隊模型開發(fā)人員要做自己的模型變量標簽,存在多個模型工程師重復(fù)建設(shè)同一標簽而產(chǎn)生大量同質(zhì)的標簽表;數(shù)據(jù)分析團隊歸納業(yè)務(wù)需求總結(jié)出來的標簽,比如用戶生命周期標簽,若分析團隊位于不同部門則重復(fù)建設(shè)情況更為嚴重,再加上技術(shù)開發(fā)同學(xué)做的營銷平臺,消息系統(tǒng),優(yōu)惠券平臺等需要打常規(guī)的用戶標簽來選人等等。 互聯(lián)網(wǎng)公司的標簽生產(chǎn)流程大抵如下:業(yè)務(wù)提標簽需求—>數(shù)據(jù)對接人(一般是數(shù)據(jù)PM or 分析師)收集轉(zhuǎn)化—> 提交給數(shù)據(jù)開發(fā)(離線開發(fā)與實時開發(fā)) —> 數(shù)據(jù)開發(fā)按業(yè)務(wù)邏輯清洗數(shù)據(jù),導(dǎo)入平臺系統(tǒng)—> 后臺開發(fā) 做成數(shù)據(jù)服務(wù)統(tǒng)一對外輸出標簽。一般如果沒有做標簽上線流程的配置化,此時還需要前端開發(fā)介入,整個流程耗時長,平均需求產(chǎn)生到上線耗時一周以上甚至更長時間,和同行朋友聊,有些國有企業(yè)生產(chǎn)常規(guī)運營標簽耗時竟然可以達到1個月,這樣的生產(chǎn)流程根本無法滿足業(yè)務(wù)快速發(fā)展的需求。 4. 業(yè)務(wù)運營靠經(jīng)驗,手工操作流程多周期長在缺乏統(tǒng)一標簽平臺或者沒有精準圈人平臺之前,以信貸行業(yè)為例,一般運營同學(xué)做活動的流程如下:活動前:運營提選人需求->分析師提數(shù)—>風(fēng)控人員規(guī)則過濾用戶—> 運營手動分組 運營將名單導(dǎo)入到營銷系統(tǒng) —> 選擇觸達方式(消息/優(yōu)惠券等)和觸達周期(一次性/周期性/實時等) -> 觸達用戶活動后:運營將名單再次給分析師 —> 分析師提數(shù)給運營—> 運營分析活動效果這里面存在很多拍腦袋決策的節(jié)點,比如運營圈人規(guī)則看不到人群數(shù)量,容易出現(xiàn)圈定人群樣本量過少無法進行營銷活動;運營在看不到人群畫像和分布的情況下,手動盲目對人群進行分組AB Test,容易導(dǎo)致AB Test結(jié)論不可靠。活動效果分析沒有橫向和縱向?qū)Ρ?,無法客觀得出活動到底做的怎么樣。當然這里面還存在諸多手工操作的地方和維護困難的地方,比如每次圈人過風(fēng)控規(guī)則,圈人后手工導(dǎo)入營銷系統(tǒng),手動將名單到給分析師提數(shù)做效果分析等。基于以上種種痛點,那如何建設(shè)一個統(tǒng)一可用的用戶標簽體系呢?核心原則:從業(yè)務(wù)中來,到業(yè)務(wù)中去;以終為始,怎么用來倒推怎么設(shè)計任何脫離業(yè)務(wù)自造的標簽都是自嗨,這也是很多大公司數(shù)據(jù)部門容易犯的錯,數(shù)據(jù)部門想要從數(shù)據(jù)層面去驅(qū)動業(yè)務(wù),基于自身過往從業(yè)經(jīng)驗,拍腦袋梳理和設(shè)計了上百個標簽,卻發(fā)現(xiàn)業(yè)務(wù)根本不買單。數(shù)據(jù)部門價值體現(xiàn)的唯一方式就是融入業(yè)務(wù)團隊,知道業(yè)務(wù)來龍去脈和痛點??偨Y(jié)下來正確的順序是明確商業(yè)目的,梳理業(yè)務(wù)流程,收集業(yè)務(wù)痛點,匯集整理標簽,最后才是開發(fā)標簽反哺業(yè)務(wù)?;谧髡叨嗄杲?jīng)驗,如何設(shè)計標簽可以歸納為以下兩種方法:方法一:基于業(yè)務(wù)主流程來設(shè)計標簽 以信貸行業(yè)為例,梳理后信貸業(yè)務(wù)主流程如下:激活 —>注冊—>登錄—>認證—>申請進件—>風(fēng)控—>放款—>還款—> 逾期催收以激活到注冊流程為例,為精準化識別用戶渠道及后續(xù)做渠道成本結(jié)構(gòu)優(yōu)化,我們這個環(huán)節(jié)可能需要的標簽是注冊渠道,獲客渠道,渠道類型,結(jié)算類型,獲客成本,注冊設(shè)備等再以申請進件到風(fēng)控流程為例,結(jié)合流程中常見的業(yè)務(wù)場景,可能需要的標簽:首次/最近一次申請時間/產(chǎn)品/額度/是否通過,總申請次數(shù)/金額,拒絕次數(shù)/放棄次數(shù),通過類型(人工/系統(tǒng)自動)等 方法二:基于業(yè)務(wù)場景來設(shè)計標簽以典型運營場景為例,信貸業(yè)務(wù)主要靠老戶復(fù)貸掙錢,促老戶復(fù)貸是經(jīng)常會做的一個運營活動,思考活動運營的三個要素(活動對象,在什么場景,執(zhí)行什么策略),我們需要的標簽可能是用戶類型(新老戶),最近一次成功還款時間/金額,最近一次借款產(chǎn)品,產(chǎn)品偏好,優(yōu)惠券敏感度/響應(yīng)度,額度敏感度/響應(yīng)度 等等 一般公司每年會基于大的戰(zhàn)略方向制定公司整體的北極星指標(指引業(yè)務(wù)發(fā)展的指標),然后基于整體業(yè)務(wù)指標自頂向下拆分到各業(yè)務(wù)部門,各業(yè)務(wù)部門再根據(jù)運營策略拆解成更細的指標。舉個例子,某信貸公司制定當年度北極星指標為:利潤,注冊量,放款量,逾期率。其中利潤為主指標,其他三個指標圍繞利潤指標進行平衡。想提升利潤核心是提升放款量,但提升放款量會帶來獲客成本上升以及壞賬成本上升,所以這是三者的平衡。利潤 = 收入 – 成本 收入 = 放款人數(shù) * 人均放款金額 * 收益率 下面我們看看成本指標,信貸公司最大的成本在于兩塊:獲客成本和壞賬成本
- 降低獲客成本:本質(zhì)上需要接入更多優(yōu)質(zhì)渠道以及優(yōu)化CPA/CPS結(jié)算的轉(zhuǎn)化率,基于此這里涉及到的標簽是 注冊時間,注冊渠道,獲客渠道,渠道類型,結(jié)算類型,獲客成本,注冊設(shè)備等
- 降低壞賬:本質(zhì)上是對逾期用戶進行管理,需要很多貸款信息標簽和逾期信息標簽,比如累計逾期金額,累計逾期筆數(shù),最近一次逾期時間,最長逾期時間等等
此外,設(shè)計一個好的用戶標簽平臺還需要考慮如下特征:1. 數(shù)據(jù)和業(yè)務(wù)團隊雙贏策略— 標簽生成自助化讓使用方自助生成標簽是數(shù)據(jù)團隊和業(yè)務(wù)團隊雙贏的策略,即提高了業(yè)務(wù)團隊運營的效率,解決了標簽的業(yè)務(wù)字段邏輯溝通的成本,同時釋放了數(shù)據(jù)團隊開發(fā)標簽維護標簽的工作。標簽生成自助化前期開發(fā)成本較高,適用于在中期上線第一版后再來落地。具體如何設(shè)計自助化打標功能,可以在后續(xù)文章中逐一分享。 2. 標簽系統(tǒng)價值的可持續(xù)性— 建立有效的標簽管理維護機制標簽的維護包括標簽規(guī)則及元信息維護,標簽生產(chǎn)調(diào)度機制及信息同步,有統(tǒng)一的輸出接口。這是持續(xù)釋放用戶標簽平臺的重要步驟,也是容易被忽視的環(huán)節(jié)。 標簽平臺是數(shù)據(jù)產(chǎn)品,既然是產(chǎn)品就需要做運營,讓我們的用戶更好更高效的使用起來。及時關(guān)注用戶反饋,經(jīng)常做一些運營手段來觸發(fā)用戶,讓產(chǎn)品和用戶交互起來。這里引申出一個更大的話題:如何做數(shù)據(jù)產(chǎn)品的運營?這個話題后續(xù)再逐步分享。對標簽的質(zhì)量進行科學(xué)完整地評估,有助于控制標簽質(zhì)量,指導(dǎo)標簽的管理者、開發(fā)者不斷地提升標簽質(zhì)量。通過創(chuàng)建一套完整的評估體系,對于質(zhì)量過差的標簽,可以考慮不進行上線,等達到基本的質(zhì)量要求后才能開放給業(yè)務(wù)使用。不然,既對業(yè)務(wù)帶來不了價值,也容易讓標簽畫像系統(tǒng)失去用戶的信任。 可以從以下三層來評估標簽效果和價值 一般使用三個指標:覆蓋度,準確度,穩(wěn)定性1)覆蓋度是指在一個標簽中,有業(yè)務(wù)含義的人群數(shù)量與總?cè)巳簲?shù)量的比例。舉個例子:【優(yōu)惠券敏感度】標簽,全量用戶是100萬的規(guī)模,其中20萬打上了“高”標簽,20萬打上了“中”標簽,30萬打上了“低”標簽,其他30萬人都沒有打上任何標簽。那么,【優(yōu)惠券敏感度】標簽的覆蓋度就是70%。這個覆蓋度還算是可以,如果- 用標簽進行人群圈選的時候,人數(shù)過少,無法滿足運營活動對樣本量的最低要
- 用標簽統(tǒng)計平臺用戶的特征時,和真實情況會有統(tǒng)計偏差,即樣本無法代表整體。
一般而言,用戶自己填的標簽和模型算法打出來的標簽,覆蓋度會偏低。2)準確度是指給用戶打的標簽中,準確反映事實的人群數(shù)量與總?cè)巳簲?shù)量的比例。舉例子:【性別】標簽,總用戶100萬,真實情況是男60萬,女40萬,系統(tǒng)打標成男50萬,女30萬,其他20萬 根據(jù)交叉矩陣,真實是男且標簽是男用戶40萬,真實是女且標簽為女用戶25萬,則標簽準確率為 (40 + 25)/ 80 = 81.25%真實情況是現(xiàn)實世界標簽的準確度往往是很難評估的。一般會用一些外圍樣本數(shù)據(jù)來輔助驗證,比如對于性別標簽,可以抽樣讓客服電話調(diào)研拿到真實性別數(shù)據(jù),通過樣本來估算整體。3)穩(wěn)定性是指給用戶打的標簽中,能在指定時間點前被準確計算出來的次數(shù)比例。舉個例子,信貸行業(yè)中的關(guān)聯(lián)指標【通訊錄中近30天有借款逾期人員的比例】,這類指標需要計算幾個億的通訊錄表,和業(yè)務(wù)表關(guān)聯(lián)好幾次,計算復(fù)雜度高,高峰時期容易跑不出來。穩(wěn)定性標簽還要根據(jù)各標簽的計算復(fù)雜度來綜合評估,一般靜態(tài)類標簽穩(wěn)定性比較高,算法預(yù)測類標簽復(fù)雜計算邏輯或者關(guān)聯(lián)上下游表比較多的標簽在特殊情況下穩(wěn)定性會差一些。一般而言,穩(wěn)定性要達到99%以上才能被業(yè)務(wù)接受,關(guān)鍵時刻不能掉鏈子。 可以使用兩個指標衡量覆蓋度:產(chǎn)品觸達率和產(chǎn)品打開率產(chǎn)品觸達率 = 觸達用戶數(shù) / 目標用戶數(shù) 舉個例子:標簽產(chǎn)品目標用戶(產(chǎn)品,運營)共計100人,知道該產(chǎn)品的用戶80人,則觸達率為 80%產(chǎn)品使用率 = 使用過的用戶數(shù) / 觸達用戶數(shù)使用度可以綜合從以下幾個指標評估,包括 使用次數(shù),使用熱度,服務(wù)調(diào)用次數(shù)??煽紤]人均聚合或者階段匯總聚合。對于應(yīng)用使用度低的標簽,可以針對性地進行分析,不斷提升每個標簽的使用價值。 業(yè)務(wù)價值是業(yè)務(wù)人員對標簽系統(tǒng)的主要考核價值。標簽系統(tǒng)業(yè)務(wù)層面的應(yīng)用很廣泛,從精準營銷,精細化運營到個性化推薦,廣告匹配系統(tǒng),BI系統(tǒng)。以精準營銷平臺為例,一般業(yè)務(wù)價值可以從降本增效來考慮,比如營銷成本降低,營銷頻次提高,營銷人效提升等角度來衡量。營銷成本降低:以前運營圈人活動平均響應(yīng)3天 -> 現(xiàn)在0.5天覆蓋場景數(shù)提升:以前一周內(nèi)覆蓋50%運營場景 —> 一周內(nèi)覆蓋90%運營場景觸達用戶數(shù)提升:每日觸達2萬用戶 —> 每日可觸達10萬用戶另外一個比較好的指標就是業(yè)務(wù)運營的ROI,業(yè)務(wù)如果用了一個標簽,對一群人進行了投放,ROI是日常投放的好幾倍,那這個標簽的價值可以說是毋庸置疑了。這時,我們可以說這個標簽的業(yè)務(wù)價值很高。標簽系統(tǒng)實際上可以大幅降低了業(yè)務(wù)運營的成本,導(dǎo)致整體ROI提升,這需要和業(yè)務(wù)配合一起做評估。比如有個同類活動在使用標簽系統(tǒng)前的ROI和使用后的ROI對比,更會彰顯標簽系統(tǒng)的價值。如果能找到一些和業(yè)務(wù)核心KPI直接掛鉤的評估手段,那會更加彰顯標簽平臺的重要性。這里有個問題:如何去準確統(tǒng)計這些指標,需要數(shù)據(jù)同事和業(yè)務(wù)同事溝通敲定標簽體系的業(yè)務(wù)價值衡量,確實是個難點,很難直接評估。而業(yè)務(wù)向上匯報過程中往往會將“標簽平臺”價值一帶而過,強調(diào)“人”和“運營”的重要性而忽視“工具”和“平臺”的重要性。這就需要數(shù)據(jù)同學(xué)自己具備業(yè)務(wù)價值量化評估的能力,一個好的方式是多和業(yè)務(wù)部門合作,參加業(yè)務(wù)部門運營活動會議,用數(shù)據(jù)去影響和驅(qū)動業(yè)務(wù)部門,讓業(yè)務(wù)離不開數(shù)據(jù)團隊,自然業(yè)務(wù)就會在給大老板的匯報中多多提現(xiàn)“數(shù)據(jù)標簽”的價值。這樣才能實現(xiàn)業(yè)務(wù)和數(shù)據(jù)團隊的雙贏局面。總結(jié)下全文的創(chuàng)作結(jié)構(gòu)如下:1. 什么是用戶標簽體系 2. 為什么要建設(shè)用戶標簽體系 3. 如何設(shè)計用戶標簽體系 用戶標簽體系是個龐大的系統(tǒng)工程,不可能一蹴而就,需要隨著業(yè)務(wù)發(fā)展情況而不斷迭代完善和豐富。在設(shè)計過程中,需要拋棄一上來就大而全的設(shè)計理念,根據(jù)業(yè)務(wù)需求場景來逐步落實和豐富標簽,畢竟能產(chǎn)生業(yè)務(wù)價值才是評價標簽體系的根本。還要不斷研究和學(xué)習(xí)業(yè)界優(yōu)秀的標簽平臺(CDP/DMP平臺)會給自己設(shè)計產(chǎn)品帶來一些靈感,比如業(yè)界做的比較好的像 神策數(shù)據(jù)用戶畫像,騰訊廣點通,阿里達摩盤,字節(jié)跳動CDP等。企業(yè)在發(fā)展的過程中,要依據(jù)具體的數(shù)據(jù)成熟度和數(shù)據(jù)應(yīng)用度來衡量是否有必要建立自己的用戶標簽體系。大廠標配的CDP平臺并非適用于所有公司。希望業(yè)界朋友都能認識到數(shù)據(jù)驅(qū)動的價值,而數(shù)據(jù)產(chǎn)品存在的本質(zhì)也就是 降低企業(yè)經(jīng)營和業(yè)務(wù)決策的成本,不是嗎? 原文鏈接:https://coffee./article/xeBOgnrEBM/coffee
|