論壇君 面對洶涌而來的海量數(shù)據(jù),絕大多數(shù)從業(yè)者卻無可適從,無法從中發(fā)掘出有用的信息,難以實(shí)現(xiàn)從數(shù)據(jù)到價(jià)值的轉(zhuǎn)換,如果能用好這些豐富的數(shù)據(jù),那將是一筆巨大的財(cái)富。 這是一個(gè)最好的時(shí)代,移動互聯(lián)網(wǎng)技術(shù)為從業(yè)者提供了無比豐富的數(shù)據(jù)。從人們的言行舉止、社交關(guān)系、到地里位置無處不在。這些詳細(xì)寶貴的數(shù)據(jù),蘊(yùn)含了巨大的價(jià)值!但是,這也是一個(gè)最壞的時(shí)代,面對洶涌而來的海量數(shù)據(jù),絕大多數(shù)從業(yè)者卻無可適從,無法從中發(fā)掘出有用的信息,難以實(shí)現(xiàn)從數(shù)據(jù)到價(jià)值的轉(zhuǎn)換,這是何等的遺憾!如果這是絕大多數(shù)人的遺憾,那么這就是整個(gè)行業(yè)和教育的遺憾,我們需要檢討:這是怎么回事,問題出在哪個(gè)環(huán)節(jié)上? 如果嘗試從媒體中尋找答案,那么五花八門。但是,背后的故事基本都是一樣的。那就是需要一個(gè)愛因斯坦一樣的天才,掌握著可樂配方一樣神秘的算法,然后從一群垃圾都不如的數(shù)據(jù)中,產(chǎn)生了驚為天人的發(fā)現(xiàn),造就了巨大的商業(yè)成功。人們管這樣一群神奇的天才叫:數(shù)據(jù)科學(xué)家! “數(shù)據(jù)科學(xué)家”這個(gè)詞匯是一個(gè)偉大的創(chuàng)舉,它籠統(tǒng)地覆蓋了計(jì)算機(jī)、管理科學(xué)、統(tǒng)計(jì)學(xué)、營銷、經(jīng)濟(jì)學(xué)等眾多學(xué)科。因此,每個(gè)學(xué)科都喜歡這個(gè)名詞,都覺得和自己相關(guān)。但是,誰都給不出一個(gè)精確的定義。但是,這不重要,這不妨礙人們以各自的標(biāo)準(zhǔn)去尋找自己心中的那個(gè)“數(shù)據(jù)科學(xué)家”。因此,不少創(chuàng)業(yè)團(tuán)隊(duì)在創(chuàng)始初期,不惜血本,從擁有大量“數(shù)據(jù)科學(xué)家”的知名企業(yè)招攬人才。這些企業(yè)有哪些呢?谷歌系、阿里系、騰訊系、百度系等等。 不管這批“數(shù)據(jù)科學(xué)家”在自己的專業(yè)方面是如何優(yōu)秀(而事實(shí)上也確實(shí)極其優(yōu)秀),他們是否會對這個(gè)新生的創(chuàng)業(yè)團(tuán)隊(duì)帶來相應(yīng)的價(jià)值?無論他們自己是創(chuàng)業(yè)者,還是創(chuàng)業(yè)團(tuán)隊(duì)的核心員工,還是普通員工,他們成功的概率幾何?要讓我賭一把,我一定是賭他:不成功(不一定失敗,不成功的定義是其實(shí)際價(jià)值產(chǎn)出遠(yuǎn)遠(yuǎn)低于預(yù)期)。這里并不是看低這些優(yōu)秀個(gè)體的個(gè)人能力。來自一個(gè)優(yōu)秀企業(yè)的優(yōu)秀員工,其自身在專業(yè)上的出色是毋庸置疑,值得尊敬,甚至崇拜的。但是,一個(gè)基本事實(shí):這些優(yōu)秀的員工在高端大氣上檔次的企業(yè),如龍如虎,價(jià)值發(fā)揮淋漓盡致。但是,一旦到一個(gè)草根初期的創(chuàng)業(yè)團(tuán)隊(duì),他們實(shí)現(xiàn)完全成功的概率極低。為什么?因?yàn)閺钠髽I(yè)到個(gè)人,都沒有仔細(xì)思考過從數(shù)據(jù)到價(jià)值的過程,進(jìn)而無法理解這些優(yōu)秀的個(gè)體在各自的組織中,在當(dāng)前這個(gè)創(chuàng)業(yè)階段,可以起到什么樣的作用。進(jìn)而,對人對事都產(chǎn)生了錯(cuò)誤的判斷。 既然從數(shù)據(jù)到價(jià)值的轉(zhuǎn)變那么重要,那我們一起嘗試描繪一下這個(gè)過程:數(shù)據(jù)是如何演變成為價(jià)值的?我將其拆分成大概四個(gè)階段。 俗話說,巧婦難為無米之炊。沒有數(shù)據(jù),哪來的價(jià)值?對數(shù)據(jù)生產(chǎn)、采集、以及整理的需求催生了形態(tài)各異、內(nèi)容豐富的信息技術(shù)。與其高度相關(guān)的是計(jì)算機(jī)技術(shù)的快速發(fā)展。 例如:條形碼技術(shù)的成熟產(chǎn)生了大量的超市掃描數(shù)據(jù);企業(yè)ERP系統(tǒng)的廣泛實(shí)施產(chǎn)生了詳細(xì)的業(yè)務(wù)流程數(shù)據(jù);商戶CRM系統(tǒng)的成熟應(yīng)用產(chǎn)生了大量客戶的消費(fèi)行為數(shù)據(jù);地磁技術(shù)的應(yīng)用產(chǎn)生了大量的交通路況監(jiān)控?cái)?shù)據(jù);城市中鋪天蓋地的監(jiān)控?cái)z像頭產(chǎn)生了海量的視頻圖像數(shù)據(jù);GPS定位技術(shù)的發(fā)展產(chǎn)生了巨大的位置數(shù)據(jù);以微博微信為代表的移動社交軟件的普及產(chǎn)生了海量的文本以及社交關(guān)系網(wǎng)絡(luò)數(shù)據(jù)。 這是從數(shù)據(jù)到價(jià)值的第一個(gè)階段。其意義在于,人類具備了詳細(xì)刻畫世界的能力。能夠通過可存儲的文檔,詳細(xì)記錄個(gè)人以及社會的方方面面。什么是數(shù)據(jù)?凡是可以記錄的就是數(shù)據(jù)。而以上所述的形態(tài)各異的記錄都是數(shù)據(jù)!這是從數(shù)據(jù)到價(jià)值的一個(gè)基本起點(diǎn)。從這個(gè)角度就可以理解阿里巴巴對新浪微博的收購,可以理解為什么華為進(jìn)軍車聯(lián)網(wǎng)領(lǐng)域。因此,在很多巨頭的眼中,數(shù)據(jù)的生產(chǎn)、采集、與整理是一個(gè)具有戰(zhàn)略意義的階段。因此,是他們布局以及混戰(zhàn)的重點(diǎn)。競爭慘烈!那么請問各位:你們是否一定要介入其中?這不是一個(gè)好回答的問題。 在數(shù)據(jù)生產(chǎn)、采集、與整理的基礎(chǔ)上,人們開始思考:能從數(shù)據(jù)中挖掘什么價(jià)值。不過首先需要明確這個(gè)“價(jià)值”是為誰定義的?在大學(xué)科研機(jī)構(gòu)中,價(jià)值是為研究學(xué)者定義的。而學(xué)者關(guān)注的價(jià)值,主要從科學(xué)興趣的角度。只要是原創(chuàng)的,增進(jìn)人們對自然世界、人類社會認(rèn)知的,甚至純粹有趣的,都可以稱為“價(jià)值”。但是,本文關(guān)注的價(jià)值是面向企業(yè)的“價(jià)值”。面向企業(yè)的價(jià)值就不能以純粹的“興趣”為判斷的標(biāo)準(zhǔn),而要以企業(yè)的戰(zhàn)略目標(biāo)為標(biāo)準(zhǔn),以企業(yè)的業(yè)務(wù)實(shí)踐為標(biāo)準(zhǔn),以企業(yè)的生存、營收、發(fā)展為標(biāo)準(zhǔn)。如果以這樣的視角去看問題,你會發(fā)現(xiàn): (1)市面上能夠看到的和大數(shù)據(jù)相關(guān)的書,恐怕都是“興趣”有余,“價(jià)值”不足;看得都很開心,但是細(xì)想對我的企業(yè)、我的業(yè)務(wù)有什么啟發(fā)?很少! (2)對這些優(yōu)秀的企業(yè)(例如:谷歌、臉譜、騰訊)有意義的“價(jià)值”很可能對我沒有任何價(jià)值。也就是說,價(jià)值因企業(yè)不同而不同,因戰(zhàn)略目標(biāo)不同而不同。小心被高富帥帶進(jìn)溝里! (3)很多看似非常有意義的“價(jià)值”,但是在業(yè)務(wù)層面無法把成本控制在合理的范圍內(nèi),無法通過用戶友好的方式實(shí)現(xiàn),繼而也是沒有“價(jià)值”。 因此,什么是真正的面向企業(yè)的“價(jià)值”,不是非常容易定義。該定義受到企業(yè)戰(zhàn)略目標(biāo)的影響,受到業(yè)務(wù)的限制,受到資源以及實(shí)現(xiàn)能力的約束。請問:這么復(fù)雜的一個(gè)問題,是不是“數(shù)據(jù)科學(xué)家”樂于思考的?可以思考的? 在絕大多數(shù)情況下,他們不會思考,也無力思考這個(gè)問題。為什么?原因很簡單:關(guān)我什么事情?你請我來做一個(gè)具體工作,我認(rèn)真工作,然后拿工資回家。你這些“戰(zhàn)略”問題,和我什么關(guān)系?你的公司第一天倒閉,我第二天換個(gè)工作就好了,反正這個(gè)世界非常缺乏“數(shù)據(jù)科學(xué)家”,我很好找工作的。這個(gè)刻薄有余的諷刺故事雖有點(diǎn)過分。但是也是想和創(chuàng)業(yè)者分享一個(gè)基本事實(shí):從數(shù)據(jù)到價(jià)值的第二個(gè)階段:定義和數(shù)據(jù)相關(guān)的業(yè)務(wù)問題,這是一個(gè)有關(guān)商業(yè)模式,或者業(yè)務(wù)模式的核心問題。只有企業(yè)的核心管理者,站在企業(yè)戰(zhàn)略的高度,才可能關(guān)心該問題,才可能思考該問題。但是,能不能想得明白另說,而且目前看來,大概率想不明白。因此,永遠(yuǎn)不要有不切實(shí)際的幻想:請一個(gè)牛人,配備一個(gè)很牛的團(tuán)隊(duì),然后一切就會翻天覆地的變化。清醒一下,不會的!這個(gè)翻天覆地的變化,應(yīng)該怎么變,只有你才具備思考清楚的可能! 如果我是一個(gè)車聯(lián)網(wǎng)的管理者。我關(guān)心:從車聯(lián)網(wǎng)的數(shù)據(jù),能夠產(chǎn)生什么價(jià)值?經(jīng)過很痛苦的思考摸索,有一天我終于明白了,我需要建立一個(gè)從駕駛員的駕駛習(xí)慣到出險(xiǎn)概率的關(guān)系。我希望通過深刻分析,產(chǎn)生對駕駛員有實(shí)際意義的指導(dǎo),并通過用戶友好的APP展示出來。我希望通過深刻分析,產(chǎn)生對保險(xiǎn)公司定價(jià)有實(shí)際意義的指導(dǎo),并通過風(fēng)險(xiǎn)評估的方式表達(dá)出來。 那么,這個(gè)創(chuàng)業(yè)者順利的完成了第二個(gè)過程。他清楚的知道:車聯(lián)網(wǎng)數(shù)據(jù)里面到底要獲得什么價(jià)值,是一個(gè)具體的從數(shù)據(jù)到業(yè)務(wù)的具體問題。在這個(gè)基礎(chǔ)上,一個(gè)具備良好數(shù)據(jù)挖掘基礎(chǔ)、統(tǒng)計(jì)學(xué)建模訓(xùn)練的專業(yè)團(tuán)隊(duì),就可以接著往下干了。該團(tuán)隊(duì)可以通過嘗試不同的、標(biāo)準(zhǔn)的統(tǒng)計(jì)分析方法、線型非線性模型去刻畫該關(guān)系、預(yù)測駕駛員的出險(xiǎn)可能性。 因此,這是從數(shù)據(jù)到價(jià)值的第3個(gè)階段。這個(gè)階段是在清晰業(yè)務(wù)目的(第2階段的產(chǎn)物)指導(dǎo)下的統(tǒng)計(jì)分析。如果沒有第2個(gè)階段清晰思考的指導(dǎo),泛泛地告訴分析團(tuán)隊(duì):我有車聯(lián)網(wǎng)數(shù)據(jù),請給我發(fā)現(xiàn)價(jià)值!大家可以設(shè)想,數(shù)據(jù)分析團(tuán)隊(duì)?wèi)?yīng)該怎么做?能怎么做?所以,一個(gè)好的管理者,自己可以不懂?dāng)?shù)據(jù)分析,但是要有以下幾點(diǎn)技能: (1)擅長做第2個(gè)階段的工作,擅長于定義從數(shù)據(jù)到價(jià)值的具體業(yè)務(wù)問題; (2)擅長于督促鼓勵(lì)自己的數(shù)據(jù)分析團(tuán)隊(duì)深刻理解業(yè)務(wù)。一個(gè)純粹的統(tǒng)計(jì)分析或者數(shù)據(jù)挖掘團(tuán)隊(duì)是不可能做出好的成果的。 設(shè)想一下,連業(yè)務(wù)都不理解的分析,能靠譜嗎?常見的媒體常常把這一部分描繪得神乎其神。而我恰恰相反,我認(rèn)為這是從數(shù)據(jù)到價(jià)值的轉(zhuǎn)換過程中,最容易的一個(gè)環(huán)節(jié)。為什么?因?yàn)閿?shù)據(jù)挖掘相關(guān)的計(jì)算機(jī)、信息技術(shù)、統(tǒng)計(jì)學(xué)專業(yè)是海內(nèi)外各個(gè)大學(xué)現(xiàn)有的標(biāo)準(zhǔn)學(xué)科。也就是說:每年都有大量的人才產(chǎn)出。相應(yīng)的統(tǒng)計(jì)分析模型也比比皆是。對絕大多數(shù)企業(yè),能正確套用一個(gè)最普通的統(tǒng)計(jì)分析方法,往往效果就好的不得了。但是,如何做到正確套用?卻需要在階段2中把業(yè)務(wù)問題定義地清清楚楚! 有了數(shù)據(jù)基礎(chǔ),想明白了從數(shù)據(jù)到價(jià)值的業(yè)務(wù)問題,也產(chǎn)生不錯(cuò)的統(tǒng)計(jì)分析模型。然后呢?然后就是業(yè)務(wù)的實(shí)施。有可能是一個(gè)新的業(yè)務(wù)流程,有可能是一個(gè)新的產(chǎn)品,有可能是一個(gè)新的算法。無論是什么,沒有這臨門一腳,前面的都白干了。業(yè)務(wù)的實(shí)施有無風(fēng)險(xiǎn)?有。有無成本?有。成本風(fēng)險(xiǎn)是否可以忽略?不好說。依賴于具體情境,非常不一樣。我們常常樂道的,市面媒體中可以看到的大數(shù)據(jù)案例,如果把實(shí)施風(fēng)險(xiǎn)和成本考慮在內(nèi),估計(jì)很多都是沒有價(jià)值的。我們能夠看到的是,很多團(tuán)隊(duì)前面3步都做得很好,但是最后一步,或沒有強(qiáng)有力的執(zhí)行,或沒有出類拔萃的產(chǎn)品設(shè)計(jì),都功虧一簣。 舉一個(gè)具體的例子,很多朋友有網(wǎng)上銀行賬戶,登錄后可以實(shí)現(xiàn)查賬、匯款、投資等多種業(yè)務(wù)行為。大家對各個(gè)銀行的菜單界面設(shè)計(jì)感覺如何?我的感覺是:太專業(yè)了!我在過去至少10年里,一共用過不超過3種功能,但是我滿眼看到的是幾十個(gè)菜單選擇。這背后是否可以有數(shù)據(jù)分析?看看人們的實(shí)際使用習(xí)慣是什么?這些習(xí)慣中的主要習(xí)慣是什么?如何把主要習(xí)慣和次要習(xí)慣平衡好?如何把這種平衡表達(dá)在產(chǎn)品的設(shè)計(jì)上,進(jìn)而實(shí)現(xiàn)令人愉悅的用戶體驗(yàn)?各位網(wǎng)上銀行用戶,我的體驗(yàn)?zāi)阌邢嗨频母惺軉??這個(gè)問題分析相對簡單,不就是看看人們的主要使用習(xí)慣嗎。但是要完成最后的業(yè)務(wù)實(shí)施,難上加難!你發(fā)現(xiàn)我最常使用的功能是:查賬和轉(zhuǎn)賬。請問:產(chǎn)品界面到底又應(yīng)該如何改進(jìn)呢?大家想想360的產(chǎn)品設(shè)計(jì)可以成為一個(gè)非常優(yōu)秀的標(biāo)桿。每天電腦開機(jī)告訴我:您的開機(jī)時(shí)間18秒,擊敗90%的同類型電腦。哇塞,我好厲害??!于是,愉快的一天開始了。請問:這里面有什么了不起的分析?這些分析對錯(cuò)如何?鬼才知道。但是,360的產(chǎn)品設(shè)計(jì),不服不行! 在以上4個(gè)階段論的指導(dǎo)下,我們重新檢討一下自己企業(yè)在數(shù)據(jù)分析方面的實(shí)施情況?;虺晒?,或不成功。人們常常把不成功歸咎于:【階段3】我沒有人才?。∮谑侨ス雀?、微軟、騰訊、百度挖人才,達(dá)到預(yù)期了嗎?;有時(shí)候會歸咎于【階段1】我沒有數(shù)據(jù)?。∮谑窍胱銎脚_,做BD,做一切可以做的方法獲得數(shù)據(jù),然后呢?很少有人把自己的失敗歸咎于【階段4】我沒有出色的產(chǎn)品設(shè)計(jì),沒有流暢的業(yè)務(wù)流程,其實(shí)數(shù)據(jù)分析根本不在話下。更少數(shù)更少數(shù)的人,會把自己的不成功歸咎于【階段2】是我自己stupid,不懂得定義數(shù)據(jù)業(yè)務(wù)問題,手底下人沒法干,大頭蒼蠅亂轉(zhuǎn)!Guess What? 【階段2】是我能看到的數(shù)據(jù)分析不成功的最典型的情形,是核心管理者自己不了解從數(shù)據(jù)到價(jià)值的轉(zhuǎn)換過程,因此定義不出契合業(yè)務(wù)的數(shù)據(jù)問題。 要深刻理解從數(shù)據(jù)到價(jià)值轉(zhuǎn)換過程,能夠準(zhǔn)確清晰定義相關(guān)的業(yè)務(wù)問題。為此,要從三個(gè)方面努力: (1)深刻理解自己的業(yè)務(wù),自己工作都不了解,做不好,啥能做好? (2)要拓寬視野,保持對數(shù)據(jù)源,尤其是新的數(shù)據(jù)源的敏感。具備一流的Vision! (3)要具備根據(jù)數(shù)據(jù)業(yè)務(wù)定義數(shù)據(jù)分析課題的能力,并根據(jù)該定義整合資源,最終實(shí)現(xiàn)從數(shù)據(jù)到價(jià)值的轉(zhuǎn)換! 最后,請記住王老師的名言:“深刻理解業(yè)務(wù),再會點(diǎn)回歸分析,就可以搞倒一大片?!痹趺床恍??請?jiān)囋嚳矗?) 作者:王漢生,現(xiàn)任北京大學(xué)光華管理學(xué)院商務(wù)統(tǒng)計(jì)與經(jīng)濟(jì)計(jì)量系教授,MBA項(xiàng)目嘉茂講席教授。 來源:統(tǒng)計(jì)之都 |
|