導(dǎo) 讀: 大數(shù)據(jù)聽(tīng)得耳朵起繭了,但真正能深入了解嗎?不一定。在此特分享三個(gè)主題,分別是:不一樣的大數(shù)據(jù)框架、不一樣的大數(shù)據(jù)采集平臺(tái)、神一樣的數(shù)據(jù)產(chǎn)品。整編成一篇文章,與大家一起分享! 一、數(shù)據(jù)從哪里來(lái)、應(yīng)去服務(wù)誰(shuí),看完這個(gè)才知道! 對(duì)于大數(shù)據(jù),業(yè)界有各種各樣的解讀,網(wǎng)上、微信中也流傳有很多“一張圖看懂大數(shù)據(jù)”的文章,但這些文章大多數(shù)都是從技術(shù)角度進(jìn)行解析的。更重要的是,很多“一張圖”看了之后就是一張密密麻麻充滿各種Logo的圖,仍然沒(méi)有將大數(shù)據(jù)說(shuō)清楚道明白。 長(zhǎng)期在LinkedIn擔(dān)任數(shù)據(jù)科學(xué)家、有著多年大數(shù)據(jù)實(shí)踐的張溪夢(mèng)給出了他自己多年經(jīng)驗(yàn)所總結(jié)出來(lái)的一套大數(shù)據(jù)框架。張溪夢(mèng)說(shuō),在這種大數(shù)據(jù)結(jié)構(gòu)里,貫穿始末的不再是技術(shù)和業(yè)務(wù),而是客戶。 客戶是大數(shù)據(jù)的來(lái)源也是大數(shù)據(jù)最終要服務(wù)的終點(diǎn)。在這套框架中,數(shù)據(jù)分析的基本框架向下延伸,最基礎(chǔ)從Customers(用戶)開(kāi)始,也在用戶結(jié)束。 1. 大數(shù)據(jù)框架 2.統(tǒng)一的大數(shù)據(jù)平臺(tái) “現(xiàn)在最缺乏的,是統(tǒng)一的大數(shù)據(jù)采集平臺(tái)” 張溪夢(mèng)說(shuō),“大數(shù)據(jù)、大數(shù)據(jù),最重要的就是數(shù)據(jù)。但數(shù)據(jù)在哪里呢?這是大數(shù)據(jù)框架要搞清楚的第一個(gè)問(wèn)題?!币虼?,張溪夢(mèng)認(rèn)為,在一個(gè)企業(yè)的大數(shù)據(jù)框架中,最重要的部分是大數(shù)據(jù)的原始數(shù)據(jù)采集層。 這基本包括三個(gè)層次,最外層是用戶,其次是公司運(yùn)營(yíng)中各種會(huì)產(chǎn)生數(shù)據(jù)的業(yè)務(wù)應(yīng)用系統(tǒng)(如ERP、CRM、SCM、OA等各種企業(yè)應(yīng)用軟件)、網(wǎng)站、APP、社交網(wǎng)絡(luò)、電商平臺(tái)等,在此之上是各種數(shù)據(jù)的采集平臺(tái)。 有人說(shuō),大數(shù)據(jù)是石油,它深埋在地下。企業(yè)的大數(shù)據(jù)采集就相當(dāng)于發(fā)現(xiàn)原油。它在企業(yè)中的位置非常重要,它是我們進(jìn)行大數(shù)據(jù)分析、洞察的基礎(chǔ)。它就是企業(yè)的數(shù)據(jù)資產(chǎn)! 張溪夢(mèng)說(shuō),用戶是企業(yè)大數(shù)據(jù)最重要的來(lái)源。圍繞用戶的一切數(shù)據(jù)是企業(yè)最為重要的數(shù)據(jù)。 現(xiàn)在所謂“互聯(lián)網(wǎng)+”,其本質(zhì)就是要實(shí)現(xiàn)與用戶的連接。其實(shí),如何才算與用戶實(shí)現(xiàn)了連接呢?將用戶相關(guān)的數(shù)據(jù)將能收集上來(lái),并實(shí)現(xiàn)了管理,便是實(shí)現(xiàn)連接的重要表現(xiàn)之一。 因此,數(shù)據(jù)收集的重要方面就是用戶相關(guān)數(shù)據(jù)的收集。當(dāng)然,除了用戶數(shù)據(jù),與企業(yè)運(yùn)營(yíng)、管理相關(guān)的各種數(shù)據(jù),政府、電商平臺(tái)、社交網(wǎng)絡(luò)等各種第三方的數(shù)據(jù)也是非常重要的大數(shù)據(jù)來(lái)源。 不管你信不信,數(shù)據(jù)就在那兒;不管你用不用,數(shù)據(jù)就在那兒!張溪夢(mèng)認(rèn)為,大數(shù)據(jù)已布滿在企業(yè)的各個(gè)地方各個(gè)角落,“我們現(xiàn)在最缺乏的,不是數(shù)據(jù),是一個(gè)統(tǒng)一的數(shù)據(jù)采集平臺(tái)(Data Collection). 3.從ETL到ELT 在數(shù)據(jù)采集上來(lái)之后,接下來(lái)便要對(duì)海量的數(shù)據(jù)進(jìn)行所謂的抽取、轉(zhuǎn)換、加載,即ETL。 “傳統(tǒng)的數(shù)據(jù)分析認(rèn)為,數(shù)據(jù)收集之后是ETL,但現(xiàn)在變成了ELT,未來(lái)有可能只有EL沒(méi)有T,甚至到最后全部將EL結(jié)合到一起,不再有功能性的劃分?!睆埾獕?mèng)說(shuō),這是他們?cè)贚inkedIn經(jīng)過(guò)多年實(shí)踐與探索之后給出的新思考。 為什么會(huì)有這種變化呢? 張溪夢(mèng)介紹說(shuō),這主要是因?yàn)橐郧暗拇鎯?chǔ)、計(jì)算、傳輸成本都很高,數(shù)據(jù)處理要用時(shí)間來(lái)?yè)Q取空間。 因此,當(dāng)時(shí)的重點(diǎn)技術(shù)是要將原來(lái)非結(jié)構(gòu)化的數(shù)據(jù)進(jìn)行結(jié)構(gòu)化轉(zhuǎn)化,把數(shù)據(jù)壓縮變小、節(jié)約存儲(chǔ)空間,從而形成所謂的ETL模式。但很顯然,這種模式存在一個(gè)無(wú)法避免的問(wèn)題,即ETL過(guò)程是需要花費(fèi)很多時(shí)間的?;ヂ?lián)網(wǎng)時(shí)代是快魚(yú)吃慢魚(yú)的時(shí)代,企業(yè)需要實(shí)時(shí)了解各種數(shù)據(jù),需要實(shí)時(shí)進(jìn)行響應(yīng)。費(fèi)時(shí)的ETL模式顯然完全不能適應(yīng)當(dāng)前的時(shí)代潮流。 因此,當(dāng)時(shí)LinkedIn的數(shù)據(jù)科學(xué)家們提出,為了實(shí)現(xiàn)實(shí)時(shí)響應(yīng),可將加載和轉(zhuǎn)化的順序?qū)φ{(diào),即變成ELT。 這能大幅節(jié)約數(shù)據(jù)處理時(shí)間。據(jù)張溪夢(mèng)介紹,三四年前,美國(guó)已經(jīng)完全做到ELT了,中國(guó)目前才剛剛開(kāi)始進(jìn)入這種轉(zhuǎn)變。更進(jìn)一步,張溪夢(mèng)認(rèn)為,變成ELT之后依然有可提升空間,即不用轉(zhuǎn)換,只有EL,甚至EL都將合二為一,即最終實(shí)現(xiàn)功能整合。 在ELT之后,便是我們經(jīng)常見(jiàn)的DW(數(shù)據(jù)倉(cāng)庫(kù))了,包括各種EDW和ODS等。大數(shù)據(jù)要在這兒完成結(jié)構(gòu)化的存儲(chǔ)、處理和分析引擎等服務(wù)。 4. 是先BI后分析,還是先分析后BI? 數(shù)據(jù)倉(cāng)庫(kù)之上,便到了我們經(jīng)常所說(shuō)的BI了。 張溪夢(mèng)說(shuō),BI其實(shí)包括兩個(gè)層次,即Analysis(分析)和BI,其中分析主要為對(duì)數(shù)據(jù)進(jìn)行高維度分析,BI則主要提供數(shù)據(jù)透視和展現(xiàn)?!霸诖髷?shù)據(jù)時(shí)代,這兩個(gè)層次也有一個(gè)巨大的變化。是先BI再分析,還是先分析再BI呢?這是一個(gè)問(wèn)題?!?/p> 以往的做法基本上是先BI,而后在其上進(jìn)行Analysis(分析)。 目前國(guó)內(nèi)絕大部分企業(yè)就是這么做的。大部分企業(yè)把BI與數(shù)據(jù)倉(cāng)庫(kù)中存儲(chǔ)的數(shù)據(jù)相結(jié)合,用于報(bào)表分析、報(bào)表制作等。更重要的是,這類(lèi)工作一般交由IT部門(mén)負(fù)責(zé),使得BI變成了技術(shù)性工作。因此,現(xiàn)在很多企業(yè)中有大量的IT研發(fā)人員在開(kāi)發(fā)報(bào)表。這種做法帶來(lái)了“先BI再分析”的最大問(wèn)題,即用數(shù)據(jù)的人不是做數(shù)據(jù)的人,做數(shù)據(jù)的人不是用數(shù)據(jù)的人。 張溪夢(mèng)說(shuō),很多人認(rèn)為報(bào)表就是分析結(jié)果,但其實(shí)不是這樣的。報(bào)表越多未必就是價(jià)值越多。IT人員優(yōu)勢(shì)在于技術(shù)而非業(yè)務(wù),當(dāng)報(bào)表交由他們負(fù)責(zé)時(shí),他們會(huì)側(cè)重于做出越來(lái)越多的報(bào)表,而不管這些有什么用、誰(shuí)來(lái)用。 事實(shí)上,由于報(bào)表和分析的人不懂業(yè)務(wù),很多數(shù)據(jù)在形成報(bào)表甚至做完分析之后,卻并不能滿足業(yè)務(wù)人員的需求,甚至有的數(shù)據(jù)經(jīng)過(guò)層層審核提交到?jīng)Q策者之后發(fā)現(xiàn)是錯(cuò)的!然后需要再次打回進(jìn)行返工,于是乎整個(gè)的分析周期都被拖慢。 現(xiàn)在的先進(jìn)做法是,將BI與分析進(jìn)行對(duì)調(diào),即先分析再BI,并且分析工作要由熟悉業(yè)務(wù)的數(shù)據(jù)科學(xué)家來(lái)承擔(dān)。 張溪夢(mèng)認(rèn)為,把數(shù)據(jù)倉(cāng)庫(kù)的數(shù)據(jù)和分析直接結(jié)合,通過(guò)相關(guān)的分析技術(shù)和工具,直接挑選出具有商業(yè)價(jià)值的數(shù)據(jù),之后通過(guò)BI迅速將其商業(yè)價(jià)值擴(kuò)大化。這帶來(lái)的好處是,用數(shù)據(jù)的人在分析數(shù)據(jù),并且迅速地讓全公司的相關(guān)人員都能夠?qū)崟r(shí)看到分析結(jié)果,及時(shí)進(jìn)行決策。 做了這種對(duì)調(diào)之后,報(bào)表的制作量將大大減少。這樣,IT人員可以不用花費(fèi)大量時(shí)間研發(fā)報(bào)表,可以大大提高數(shù)據(jù)分析部門(mén)工作效率,滿足當(dāng)今數(shù)據(jù)分析需求的激增。 5. “輸出洞察、輸出決策、輸出價(jià)值” 在分析、BI之后,便到了如何將數(shù)據(jù)價(jià)值發(fā)揮出來(lái)的環(huán)節(jié)。張溪夢(mèng)認(rèn)為,這主要包括DM(數(shù)據(jù)挖掘)、AI(人工智能)、洞察、決策、行動(dòng)、價(jià)值等幾個(gè)階段。 Data Mining、AI是通過(guò)高超的技術(shù)手段,實(shí)現(xiàn)自動(dòng)化的機(jī)器學(xué)習(xí),從而達(dá)到在大數(shù)據(jù)分析處理之后,能夠自動(dòng)化地給企業(yè)的管理者、相關(guān)員工輸出具有洞察力的發(fā)現(xiàn),并且根據(jù)這些洞察和發(fā)現(xiàn)給出決策建議、行動(dòng)建議,最終幫助企業(yè)實(shí)現(xiàn)價(jià)值,滿足客戶需求。 張溪夢(mèng)認(rèn)為,大數(shù)據(jù)框架,最終應(yīng)該著眼于幫助企業(yè)為自己的客戶提供價(jià)值。不能僅局限于技術(shù)本身,只有很好地實(shí)現(xiàn)了洞察、決策、行動(dòng),最終才能真正實(shí)現(xiàn)大數(shù)據(jù)的價(jià)值,達(dá)到通過(guò)大數(shù)據(jù)提升公司效率和業(yè)務(wù)增長(zhǎng)的目的。 6. “底層頻次高價(jià)值低,頂層頻次低價(jià)值高” 從客戶、業(yè)務(wù)系統(tǒng)、數(shù)據(jù)采集、數(shù)據(jù)倉(cāng)庫(kù)、分析、BI、DM、AI、洞察、決策、行為、價(jià)值,再最終回到客戶,這構(gòu)成了張溪夢(mèng)眼中的不一樣的大數(shù)據(jù)框架。 張溪夢(mèng)說(shuō),他在實(shí)踐中還發(fā)現(xiàn),在這個(gè)大數(shù)據(jù)分析框架中,越貼近底層占用時(shí)間越多,而框架頂端的決策耗時(shí)卻很短;從價(jià)值頻率來(lái)講,頂端低頻次,高價(jià)值,底層是高頻次,低價(jià)值。 因此,大數(shù)據(jù)技術(shù)的一個(gè)重要發(fā)展方向是,效率低的部分實(shí)現(xiàn)全方位自動(dòng)化,并且實(shí)現(xiàn)一站式的大數(shù)據(jù)服務(wù)! 這正是張溪夢(mèng)歸國(guó)創(chuàng)辦GrowingIO的重要方向。張溪夢(mèng)希望,GrowingIO能成為他在大數(shù)據(jù)領(lǐng)域創(chuàng)新的載體,將國(guó)外大數(shù)據(jù)領(lǐng)域的最新理念、最新技術(shù)引入到中國(guó)。
二、連采集都不會(huì),怎能開(kāi)始數(shù)據(jù)應(yīng)用第一步?。?/span> 在詳細(xì)介紹了不一樣的大數(shù)據(jù)框架圖之后,張溪夢(mèng)和我們?cè)敿?xì)探討了大數(shù)據(jù)采集平臺(tái)。我們討論所形成的一個(gè)重要觀點(diǎn)是:在數(shù)字經(jīng)濟(jì)時(shí)代,未來(lái)每個(gè)企業(yè)都是數(shù)字企業(yè)。數(shù)字企業(yè)都必須有自己的大數(shù)據(jù)處理體系。而今天我們介紹的,便是張溪夢(mèng)眼中每個(gè)企業(yè)大數(shù)據(jù)處理體系中最基礎(chǔ)和最根本的部分——大數(shù)據(jù)采集平臺(tái)。 1.這才是企業(yè)大數(shù)據(jù)體系的核心 根據(jù)張溪夢(mèng)介紹的不一樣的大數(shù)據(jù)框架,我們總體上可以將企業(yè)大數(shù)據(jù)的體系分成“3+1”,即采集與存儲(chǔ)平臺(tái)、分析與挖掘平臺(tái)、洞察與決策平臺(tái),以及覆蓋全局的數(shù)據(jù)安全平臺(tái)。 采集與存儲(chǔ)平臺(tái)的主要職責(zé)是對(duì)企業(yè)的相關(guān)大數(shù)據(jù)進(jìn)行收集,并將采集到的數(shù)據(jù)存儲(chǔ)起來(lái)。這是企業(yè)的數(shù)據(jù)資產(chǎn)。它也是未來(lái)數(shù)字企業(yè)的最重要資產(chǎn)之一。 分析與挖掘平臺(tái)的主要職責(zé)是對(duì)企業(yè)采集到的大數(shù)據(jù)進(jìn)行專(zhuān)門(mén)的分析、BI等,以及在此基礎(chǔ)上進(jìn)一步的數(shù)據(jù)挖掘、人工智能等。 洞察與決策平臺(tái)的主要職責(zé)是利用大數(shù)據(jù)分析的結(jié)果產(chǎn)生對(duì)商業(yè)的洞察、決策,以及與之對(duì)應(yīng)的行動(dòng)等。 數(shù)據(jù)安全平臺(tái)的主要職責(zé)是負(fù)責(zé)確保數(shù)據(jù)的安全性,保證企業(yè)的數(shù)據(jù)資產(chǎn)不受到損害,例如數(shù)據(jù)不丟失、不損壞、不被竊、不被改等。 一般而言,企業(yè)可以不用自己擁有專(zhuān)門(mén)的大數(shù)據(jù)分析與挖掘平臺(tái),可以租用第三方的專(zhuān)業(yè)工具;但企業(yè)必須自己要有相應(yīng)的商業(yè)洞察、決策與行動(dòng)能力;同時(shí),企業(yè)也必須擁有自己的數(shù)據(jù),必須有數(shù)據(jù)的所有權(quán)。 也即是說(shuō),企業(yè)必須有數(shù)據(jù)采集與存儲(chǔ)平臺(tái),這樣才能擁有自己的大數(shù)據(jù)資產(chǎn)。這是未來(lái)數(shù)字企業(yè)的核心!如果數(shù)據(jù)不在自己手中,或者自己沒(méi)有數(shù)據(jù),則一切的所謂大數(shù)據(jù)都將變成空中樓閣。在虛擬的數(shù)字世界,同樣存在“巧婦難為無(wú)米之炊”?。?/p> 大數(shù)據(jù)的三個(gè)層次 資料來(lái)源:海比研究,2016 2. 大數(shù)據(jù)的采集平臺(tái)也有三個(gè)層次 在未來(lái)的數(shù)字企業(yè)中,大數(shù)據(jù)采集與存儲(chǔ)平臺(tái)將占據(jù)非常重要的位置。將來(lái)自各種數(shù)據(jù)源的原始大數(shù)據(jù)采集回來(lái)、存儲(chǔ)起來(lái),這便相當(dāng)于企業(yè)的大數(shù)據(jù)原油。如果一個(gè)國(guó)家沒(méi)有原油,就只有全部采用進(jìn)口了。這就相當(dāng)于把命脈交給了別人、被別人把控。 一般而言,大數(shù)據(jù)采集與存儲(chǔ)平臺(tái)一般也可以分為三個(gè)層次,即數(shù)據(jù)采集層、預(yù)處理層和存儲(chǔ)層。同時(shí),大數(shù)據(jù)采集平臺(tái)還需要一個(gè)覆蓋全局的數(shù)據(jù)安全體系。 采集層負(fù)責(zé)采集企業(yè)各種來(lái)源的大數(shù)據(jù);預(yù)處理層負(fù)責(zé)對(duì)采集回來(lái)的數(shù)據(jù)進(jìn)行一些規(guī)范化的處理;存儲(chǔ)層則是將預(yù)處理后的大數(shù)據(jù)進(jìn)行存儲(chǔ),將企業(yè)大數(shù)據(jù)資產(chǎn)用一種方式保存起來(lái)。數(shù)據(jù)安全體系和上文所提到的數(shù)據(jù)安全平臺(tái)一樣。 值得注意的是,當(dāng)存儲(chǔ)技術(shù)足夠好、存儲(chǔ)設(shè)備成本足夠低容量足夠大時(shí),或許就可以不用預(yù)處理層了。 大數(shù)據(jù)采集和處理平臺(tái)框架 資料來(lái)源:海比研究,2016 3. 大數(shù)據(jù)采集技術(shù)難題不少 張溪夢(mèng)認(rèn)為,大數(shù)據(jù)時(shí)代的數(shù)據(jù)采集和以前會(huì)很不一樣。 大數(shù)據(jù)采集是一個(gè)很復(fù)雜的工程。 其復(fù)雜性主要有三點(diǎn),第一,數(shù)據(jù)源非常復(fù)雜;第二,實(shí)時(shí)化比較難;第三,存儲(chǔ)和管理、保證安全比較難。有大數(shù)據(jù)專(zhuān)家認(rèn)為,這些復(fù)雜性使大數(shù)據(jù)采集有四類(lèi)典型技術(shù)難題。 第一,各種智能設(shè)備中的運(yùn)行數(shù)據(jù)是企業(yè)大數(shù)據(jù)的一個(gè)重要來(lái)源。在這種大數(shù)據(jù)采集中,很重要的一部分是大數(shù)據(jù)的智能感知,它能實(shí)現(xiàn)大數(shù)據(jù)源的智能識(shí)別、感知、信號(hào)轉(zhuǎn)換、適配、傳輸、載入等技術(shù)。尤其是智能設(shè)備的數(shù)據(jù)中,還會(huì)涉及結(jié)構(gòu)化、半結(jié)構(gòu)化、非結(jié)構(gòu)化等各種數(shù)據(jù),這與以前的純粹結(jié)構(gòu)化數(shù)據(jù)采集會(huì)有巨大不同,也因此而存在許多需要克服的技術(shù)難題。在智能制造、可穿戴設(shè)備等產(chǎn)業(yè)數(shù)字化、物聯(lián)網(wǎng)越來(lái)越發(fā)普及的今天,智能設(shè)備的數(shù)據(jù)采集變得非常重要。 第二,社交網(wǎng)絡(luò)、電商或官方網(wǎng)站、APP應(yīng)用是企業(yè)大數(shù)據(jù)的另一個(gè)重要來(lái)源。在這種大數(shù)據(jù)采集中,高速高可靠數(shù)據(jù)爬取或采集技術(shù)、高速大數(shù)據(jù)預(yù)處理技術(shù)、視頻語(yǔ)音等流數(shù)據(jù)的實(shí)時(shí)采集技術(shù)是當(dāng)前需要重點(diǎn)突破的技術(shù)方向。同時(shí),采用哪種方法采集,例如埋點(diǎn)或無(wú)埋點(diǎn)方法,也是當(dāng)前非常重要的突破方向。 第三,存儲(chǔ)也將越來(lái)越成為大數(shù)據(jù)的關(guān)鍵問(wèn)題。隨著一切產(chǎn)品與物質(zhì)的智能化、數(shù)字化,數(shù)據(jù)量正以前所未有的速度迅猛擴(kuò)大。如果沒(méi)有一套成熟的數(shù)據(jù)存儲(chǔ)和管理方案,我們也終究無(wú)法利用這些巨量的數(shù)據(jù)。大數(shù)據(jù)專(zhuān)家們一致認(rèn)為,大數(shù)據(jù)的索引技術(shù),以及大數(shù)據(jù)的移動(dòng)、備份、復(fù)制等技術(shù)是當(dāng)前技術(shù)難點(diǎn)。 第四,隱私與安全是大數(shù)據(jù)采集中面臨的另一道難關(guān)。對(duì)于隱私,目前采集的界限就很難界定。一些數(shù)據(jù)一旦采集了便涉及到隱私,不采集又會(huì)損失很多重要信息;數(shù)據(jù)如何利用算是侵犯隱私,怎樣才算是合法利用……這些問(wèn)題,看上去是屬于道德或法律范疇,但其實(shí)也是和技術(shù)實(shí)現(xiàn)手段息息相關(guān)。另外,如何保證數(shù)據(jù)不受損、不被修改、不被偷窺、不被偷竊,則是當(dāng)前大數(shù)據(jù)采集所要重點(diǎn)解決的安全問(wèn)題。這會(huì)涉及隱私保護(hù)和推理控制、數(shù)據(jù)真?zhèn)巫R(shí)別和取證、數(shù)據(jù)持有完整性驗(yàn)證等技術(shù)。 4. 數(shù)據(jù)采集制度規(guī)范的重要性 值得注意的,大數(shù)據(jù)的采集還有一件事情非常重要,即整個(gè)企業(yè)要有一套完整、規(guī)范的數(shù)據(jù)管理體系。這個(gè)數(shù)據(jù)管理體系包括數(shù)據(jù)采集流程,以及數(shù)據(jù)管理制度。 張溪夢(mèng)說(shuō),國(guó)內(nèi)大數(shù)據(jù)的技術(shù)服務(wù)公司正在飛速成長(zhǎng),其產(chǎn)品技術(shù)和美國(guó)的差距也正在迅速縮小。但對(duì)于數(shù)據(jù)管理體系,國(guó)內(nèi)很多企業(yè)在這方面的理念、水平及完整性都和美國(guó)企業(yè)有不少差距。這是一個(gè)軟實(shí)力,企業(yè)只有在這方面也強(qiáng)大了,才能真正將大數(shù)據(jù)的價(jià)值準(zhǔn)確、持續(xù)地發(fā)揮出來(lái)。
三、如何創(chuàng)建神一樣的數(shù)據(jù)產(chǎn)品? 1.神一樣的大數(shù)據(jù)產(chǎn)品 這是當(dāng)我和坐在眼前的真正的前LinkedIn數(shù)據(jù)科學(xué)家張溪夢(mèng)一起交流的時(shí)候,我自己的深切感受。我驚人地發(fā)現(xiàn)我自己更加喜歡數(shù)據(jù)科學(xué)家的魅力!我的心告訴我,我有這個(gè)直覺(jué),有從一些看似無(wú)關(guān)卻可能發(fā)現(xiàn)新大陸的數(shù)據(jù)敏感性!在與他交流的過(guò)程中,我完全能感受到,數(shù)據(jù)產(chǎn)品非?!吧瘛保鴶?shù)據(jù)科學(xué)家、數(shù)據(jù)產(chǎn)品經(jīng)理要更神。 張溪夢(mèng)舉了一個(gè)他們?cè)贚inkedIn工作時(shí)的大數(shù)據(jù)分析與產(chǎn)品例子。這很讓我腦洞大開(kāi),也不由對(duì)此有種“飛蛾撲火”般的吸引力與特別想試一下的沖動(dòng)。 據(jù)他介紹,他們當(dāng)時(shí)做了一個(gè)非常有趣的分析,他們用三個(gè)非常簡(jiǎn)單的數(shù)據(jù)構(gòu)建了一個(gè)評(píng)估公司價(jià)值的分析模型,即這個(gè)公司的每名員工是從哪個(gè)公司進(jìn)入的、哪年進(jìn)入的、哪年離開(kāi)的。 他們用這個(gè)大數(shù)據(jù)分析模型對(duì)美國(guó)的一些知名IT公司的價(jià)值進(jìn)行評(píng)估排名,結(jié)果發(fā)現(xiàn)是驚人的準(zhǔn)確!他說(shuō),當(dāng)時(shí)從他們這個(gè)神一樣的數(shù)據(jù)模型分析出來(lái)的結(jié)論是,LinkedIn排名非??壳?。 這在幾年前的發(fā)展?fàn)顩r來(lái)看,有點(diǎn)不太符合當(dāng)時(shí)人們的認(rèn)知。但經(jīng)過(guò)一段時(shí)間的發(fā)展,現(xiàn)在這個(gè)排名看起來(lái)完全正確。 我驚訝的不是結(jié)論的預(yù)見(jiàn)性,而是該數(shù)據(jù)分析模型的構(gòu)建。居然想到從這個(gè)視角、從這樣三個(gè)簡(jiǎn)單的數(shù)據(jù),便反映出一個(gè)看似很難做到的預(yù)測(cè)!我喜歡這個(gè)! 其實(shí),這兩天還有一個(gè)數(shù)據(jù)產(chǎn)品讓所有人都很Happy,也很感慨:2016微信公開(kāi)課PRO版。這就是一個(gè)神一樣的數(shù)據(jù)產(chǎn)品!只要點(diǎn)擊鏈接,它就能給你回放你在微信這個(gè)星球里的運(yùn)行軌跡。 我自己用了一下,它告訴我:我是在2012年11月7日注冊(cè)微信,我的第一個(gè)微信好友是紛享銷(xiāo)客羅旭。多么神奇,又多么溫暖!實(shí)際上,另一個(gè)互聯(lián)網(wǎng)巨頭阿里巴巴以前也曾推出過(guò)類(lèi)似的神來(lái)之筆——淘寶時(shí)光機(jī)。 說(shuō)不準(zhǔn),微信的這個(gè)產(chǎn)品也受到過(guò)淘寶時(shí)光機(jī)的啟發(fā)呢。(不過(guò),從數(shù)據(jù)產(chǎn)品經(jīng)理的角度看,淘寶時(shí)光機(jī)顯然是更勝一籌。時(shí)光機(jī),太有感覺(jué)了!) 2.如何規(guī)劃數(shù)據(jù)產(chǎn)品 “數(shù)據(jù)產(chǎn)品應(yīng)該怎么規(guī)劃?”我問(wèn)張溪夢(mèng)。 有一些國(guó)內(nèi)做得較好的數(shù)據(jù)產(chǎn)品經(jīng)理對(duì)此做了一些介紹。例如,可以從數(shù)據(jù)產(chǎn)品的類(lèi)型進(jìn)行規(guī)劃,如要有數(shù)據(jù)型產(chǎn)品、洞察型產(chǎn)品、決策型產(chǎn)品、智能型產(chǎn)品等;也可以按使用對(duì)象進(jìn)行規(guī)劃,如內(nèi)部使用的數(shù)據(jù)產(chǎn)品、外部使用的數(shù)據(jù)產(chǎn)品;類(lèi)似的規(guī)劃思路還有很多。 張溪夢(mèng)認(rèn)為,這些都是不錯(cuò)的規(guī)劃方法。不過(guò),除了規(guī)劃,“好的數(shù)據(jù)產(chǎn)品也是創(chuàng)意、是想象力、是靈光乍現(xiàn)。”別人看似平淡、看似發(fā)瘋的數(shù)據(jù),但在神一樣的數(shù)據(jù)科學(xué)家、數(shù)據(jù)產(chǎn)品經(jīng)理的眼里,就可能會(huì)產(chǎn)生一個(gè)具有極大意義的數(shù)據(jù)產(chǎn)品。 在大數(shù)據(jù)的深海世界里,有著無(wú)窮無(wú)盡的可能性與創(chuàng)造力。生辰八字、梅花易數(shù)、易經(jīng)、奇門(mén)遁甲、看相算命、風(fēng)水,這些流傳幾千年、看似毫無(wú)科學(xué)道理的迷信手段,如果用大數(shù)據(jù)的眼光來(lái)看,他們其實(shí)也是一種數(shù)據(jù)產(chǎn)品。從這個(gè)角度來(lái)看,綿延五千年的中華民族是非常適合設(shè)計(jì)大數(shù)據(jù)產(chǎn)品的。天生就有這樣的基因! 在張溪夢(mèng)看來(lái),數(shù)據(jù)產(chǎn)品最重要的要素有兩個(gè),第一是創(chuàng)意,第二是數(shù)據(jù)分析算法和分析模型。 因此,張溪夢(mèng)認(rèn)為,規(guī)劃數(shù)據(jù)產(chǎn)品,最重要的是找到優(yōu)秀的充滿創(chuàng)意的人才,規(guī)劃和搭建好整個(gè)大數(shù)據(jù)分析的團(tuán)隊(duì)。其次,便是將基礎(chǔ)數(shù)據(jù)及相關(guān)分析工具準(zhǔn)備好;最后,要將交互界面(UI)設(shè)計(jì)好。只要有這三點(diǎn),就不愁開(kāi)發(fā)不出讓人眼前一亮的數(shù)據(jù)產(chǎn)品! 3.如何創(chuàng)建數(shù)據(jù)公司 最后,我還想說(shuō)一個(gè)非常有意思的觀點(diǎn):未來(lái)會(huì)有海量的數(shù)據(jù)產(chǎn)品誕生,會(huì)有海量的數(shù)據(jù)產(chǎn)品創(chuàng)業(yè)公司! 自己沒(méi)有數(shù)據(jù)能做數(shù)據(jù)產(chǎn)品嗎?自己沒(méi)有數(shù)據(jù)分析工具能做數(shù)據(jù)產(chǎn)品嗎?我的結(jié)論都是肯定的:能!你唯一要有的,就是擁有創(chuàng)意擁有想象力!這是最適合個(gè)人創(chuàng)業(yè)的全新領(lǐng)域! 其實(shí),你沒(méi)有大數(shù)據(jù)嗎?錯(cuò)! 你擁有眾多的大數(shù)據(jù),有很多免費(fèi)或低成本的大數(shù)據(jù)可以供我們每一個(gè)人使用,例如政府部門(mén)的相關(guān)數(shù)據(jù)、各大電商社交網(wǎng)絡(luò)的海量數(shù)據(jù)等。所以,我們每個(gè)人都有大數(shù)據(jù)。 你沒(méi)有數(shù)據(jù)分析工具嗎?錯(cuò)! 你擁有眾多免費(fèi)或非常便宜的大數(shù)據(jù)分析和洞察工具。市場(chǎng)上這樣的數(shù)據(jù)分析提供商非常多,你可以低成本地隨意使用。 有了數(shù)據(jù)、有了工具,再加上你的創(chuàng)意你的想象力,你就能設(shè)計(jì)出讓人意想不到的數(shù)據(jù)產(chǎn)品!一個(gè)好的數(shù)據(jù)產(chǎn)品,可能會(huì)給社會(huì)帶來(lái)變革帶來(lái)進(jìn)步,也可能會(huì)成就你的一生! 注:本文系數(shù)據(jù)觀綜合自GrowingIO稿件整理,作者系中國(guó)軟件網(wǎng)曹開(kāi)彬,著作權(quán)屬原創(chuàng)者所有。數(shù)據(jù)觀整理分享此文并非商業(yè)用途。以上內(nèi)容并不代表數(shù)據(jù)觀觀點(diǎn),如涉著作權(quán)等事宜請(qǐng)聯(lián)系小編更正。 搜索數(shù)據(jù)觀(www.cbdio.com)獲取更多大數(shù)據(jù)相關(guān)資訊? 新聞?lì)l道丨資訊丨觀點(diǎn)丨案例丨專(zhuān)欄丨企業(yè)丨自媒丨大數(shù)據(jù)百科丨慕課丨PPT報(bào)告丨標(biāo)簽丨活動(dòng)丨創(chuàng)客丨貴州大數(shù)據(jù)丨數(shù)博會(huì)丨大數(shù)據(jù)系列圖書(shū)連載 …… |
|
來(lái)自: 湘楚狂士 > 《待分類(lèi)》