一区二区三区日韩精品-日韩经典一区二区三区-五月激情综合丁香婷婷-欧美精品中文字幕专区

分享

一篇文章詳解:大數(shù)據(jù)框架、大數(shù)據(jù)采集平臺(tái)、數(shù)據(jù)產(chǎn)品創(chuàng)建

 湘楚狂士 2016-01-31


導(dǎo) 讀:

大數(shù)據(jù)聽(tīng)得耳朵起繭了,但真正能深入了解嗎?不一定。在此特分享三個(gè)主題,分別是:不一樣的大數(shù)據(jù)框架、不一樣的大數(shù)據(jù)采集平臺(tái)、神一樣的數(shù)據(jù)產(chǎn)品。整編成一篇文章,與大家一起分享!


一、數(shù)據(jù)從哪里來(lái)、應(yīng)去服務(wù)誰(shuí),看完這個(gè)才知道!


對(duì)于大數(shù)據(jù),業(yè)界有各種各樣的解讀,網(wǎng)上、微信中也流傳有很多“一張圖看懂大數(shù)據(jù)”的文章,但這些文章大多數(shù)都是從技術(shù)角度進(jìn)行解析的。更重要的是,很多“一張圖”看了之后就是一張密密麻麻充滿各種Logo的圖,仍然沒(méi)有將大數(shù)據(jù)說(shuō)清楚道明白。


長(zhǎng)期在LinkedIn擔(dān)任數(shù)據(jù)科學(xué)家、有著多年大數(shù)據(jù)實(shí)踐的張溪夢(mèng)給出了他自己多年經(jīng)驗(yàn)所總結(jié)出來(lái)的一套大數(shù)據(jù)框架。張溪夢(mèng)說(shuō),在這種大數(shù)據(jù)結(jié)構(gòu)里,貫穿始末的不再是技術(shù)和業(yè)務(wù),而是客戶。


客戶是大數(shù)據(jù)的來(lái)源也是大數(shù)據(jù)最終要服務(wù)的終點(diǎn)。在這套框架中,數(shù)據(jù)分析的基本框架向下延伸,最基礎(chǔ)從Customers(用戶)開(kāi)始,也在用戶結(jié)束。


1. 大數(shù)據(jù)框架



2.統(tǒng)一的大數(shù)據(jù)平臺(tái)


“現(xiàn)在最缺乏的,是統(tǒng)一的大數(shù)據(jù)采集平臺(tái)”


張溪夢(mèng)說(shuō),“大數(shù)據(jù)、大數(shù)據(jù),最重要的就是數(shù)據(jù)。但數(shù)據(jù)在哪里呢?這是大數(shù)據(jù)框架要搞清楚的第一個(gè)問(wèn)題?!币虼?,張溪夢(mèng)認(rèn)為,在一個(gè)企業(yè)的大數(shù)據(jù)框架中,最重要的部分是大數(shù)據(jù)的原始數(shù)據(jù)采集層。


這基本包括三個(gè)層次,最外層是用戶,其次是公司運(yùn)營(yíng)中各種會(huì)產(chǎn)生數(shù)據(jù)的業(yè)務(wù)應(yīng)用系統(tǒng)(如ERP、CRM、SCM、OA等各種企業(yè)應(yīng)用軟件)、網(wǎng)站、APP、社交網(wǎng)絡(luò)、電商平臺(tái)等,在此之上是各種數(shù)據(jù)的采集平臺(tái)。


有人說(shuō),大數(shù)據(jù)是石油,它深埋在地下。企業(yè)的大數(shù)據(jù)采集就相當(dāng)于發(fā)現(xiàn)原油。它在企業(yè)中的位置非常重要,它是我們進(jìn)行大數(shù)據(jù)分析、洞察的基礎(chǔ)。它就是企業(yè)的數(shù)據(jù)資產(chǎn)!


張溪夢(mèng)說(shuō),用戶是企業(yè)大數(shù)據(jù)最重要的來(lái)源。圍繞用戶的一切數(shù)據(jù)是企業(yè)最為重要的數(shù)據(jù)。


現(xiàn)在所謂“互聯(lián)網(wǎng)+”,其本質(zhì)就是要實(shí)現(xiàn)與用戶的連接。其實(shí),如何才算與用戶實(shí)現(xiàn)了連接呢?將用戶相關(guān)的數(shù)據(jù)將能收集上來(lái),并實(shí)現(xiàn)了管理,便是實(shí)現(xiàn)連接的重要表現(xiàn)之一。


因此,數(shù)據(jù)收集的重要方面就是用戶相關(guān)數(shù)據(jù)的收集。當(dāng)然,除了用戶數(shù)據(jù),與企業(yè)運(yùn)營(yíng)、管理相關(guān)的各種數(shù)據(jù),政府、電商平臺(tái)、社交網(wǎng)絡(luò)等各種第三方的數(shù)據(jù)也是非常重要的大數(shù)據(jù)來(lái)源。


不管你信不信,數(shù)據(jù)就在那兒;不管你用不用,數(shù)據(jù)就在那兒!張溪夢(mèng)認(rèn)為,大數(shù)據(jù)已布滿在企業(yè)的各個(gè)地方各個(gè)角落,“我們現(xiàn)在最缺乏的,不是數(shù)據(jù),是一個(gè)統(tǒng)一的數(shù)據(jù)采集平臺(tái)(Data Collection).


3.從ETL到ELT


在數(shù)據(jù)采集上來(lái)之后,接下來(lái)便要對(duì)海量的數(shù)據(jù)進(jìn)行所謂的抽取、轉(zhuǎn)換、加載,即ETL。


“傳統(tǒng)的數(shù)據(jù)分析認(rèn)為,數(shù)據(jù)收集之后是ETL,但現(xiàn)在變成了ELT,未來(lái)有可能只有EL沒(méi)有T,甚至到最后全部將EL結(jié)合到一起,不再有功能性的劃分?!睆埾獕?mèng)說(shuō),這是他們?cè)贚inkedIn經(jīng)過(guò)多年實(shí)踐與探索之后給出的新思考。


為什么會(huì)有這種變化呢?


張溪夢(mèng)介紹說(shuō),這主要是因?yàn)橐郧暗拇鎯?chǔ)、計(jì)算、傳輸成本都很高,數(shù)據(jù)處理要用時(shí)間來(lái)?yè)Q取空間。


因此,當(dāng)時(shí)的重點(diǎn)技術(shù)是要將原來(lái)非結(jié)構(gòu)化的數(shù)據(jù)進(jìn)行結(jié)構(gòu)化轉(zhuǎn)化,把數(shù)據(jù)壓縮變小、節(jié)約存儲(chǔ)空間,從而形成所謂的ETL模式。但很顯然,這種模式存在一個(gè)無(wú)法避免的問(wèn)題,即ETL過(guò)程是需要花費(fèi)很多時(shí)間的?;ヂ?lián)網(wǎng)時(shí)代是快魚(yú)吃慢魚(yú)的時(shí)代,企業(yè)需要實(shí)時(shí)了解各種數(shù)據(jù),需要實(shí)時(shí)進(jìn)行響應(yīng)。費(fèi)時(shí)的ETL模式顯然完全不能適應(yīng)當(dāng)前的時(shí)代潮流。


因此,當(dāng)時(shí)LinkedIn的數(shù)據(jù)科學(xué)家們提出,為了實(shí)現(xiàn)實(shí)時(shí)響應(yīng),可將加載和轉(zhuǎn)化的順序?qū)φ{(diào),即變成ELT。


這能大幅節(jié)約數(shù)據(jù)處理時(shí)間。據(jù)張溪夢(mèng)介紹,三四年前,美國(guó)已經(jīng)完全做到ELT了,中國(guó)目前才剛剛開(kāi)始進(jìn)入這種轉(zhuǎn)變。更進(jìn)一步,張溪夢(mèng)認(rèn)為,變成ELT之后依然有可提升空間,即不用轉(zhuǎn)換,只有EL,甚至EL都將合二為一,即最終實(shí)現(xiàn)功能整合。


在ELT之后,便是我們經(jīng)常見(jiàn)的DW(數(shù)據(jù)倉(cāng)庫(kù))了,包括各種EDW和ODS等。大數(shù)據(jù)要在這兒完成結(jié)構(gòu)化的存儲(chǔ)、處理和分析引擎等服務(wù)。


4. 是先BI后分析,還是先分析后BI?


數(shù)據(jù)倉(cāng)庫(kù)之上,便到了我們經(jīng)常所說(shuō)的BI了。


張溪夢(mèng)說(shuō),BI其實(shí)包括兩個(gè)層次,即Analysis(分析)和BI,其中分析主要為對(duì)數(shù)據(jù)進(jìn)行高維度分析,BI則主要提供數(shù)據(jù)透視和展現(xiàn)?!霸诖髷?shù)據(jù)時(shí)代,這兩個(gè)層次也有一個(gè)巨大的變化。是先BI再分析,還是先分析再BI呢?這是一個(gè)問(wèn)題?!?/p>


以往的做法基本上是先BI,而后在其上進(jìn)行Analysis(分析)。


目前國(guó)內(nèi)絕大部分企業(yè)就是這么做的。大部分企業(yè)把BI與數(shù)據(jù)倉(cāng)庫(kù)中存儲(chǔ)的數(shù)據(jù)相結(jié)合,用于報(bào)表分析、報(bào)表制作等。更重要的是,這類(lèi)工作一般交由IT部門(mén)負(fù)責(zé),使得BI變成了技術(shù)性工作。因此,現(xiàn)在很多企業(yè)中有大量的IT研發(fā)人員在開(kāi)發(fā)報(bào)表。這種做法帶來(lái)了“先BI再分析”的最大問(wèn)題,即用數(shù)據(jù)的人不是做數(shù)據(jù)的人,做數(shù)據(jù)的人不是用數(shù)據(jù)的人。


張溪夢(mèng)說(shuō),很多人認(rèn)為報(bào)表就是分析結(jié)果,但其實(shí)不是這樣的。報(bào)表越多未必就是價(jià)值越多。IT人員優(yōu)勢(shì)在于技術(shù)而非業(yè)務(wù),當(dāng)報(bào)表交由他們負(fù)責(zé)時(shí),他們會(huì)側(cè)重于做出越來(lái)越多的報(bào)表,而不管這些有什么用、誰(shuí)來(lái)用。


事實(shí)上,由于報(bào)表和分析的人不懂業(yè)務(wù),很多數(shù)據(jù)在形成報(bào)表甚至做完分析之后,卻并不能滿足業(yè)務(wù)人員的需求,甚至有的數(shù)據(jù)經(jīng)過(guò)層層審核提交到?jīng)Q策者之后發(fā)現(xiàn)是錯(cuò)的!然后需要再次打回進(jìn)行返工,于是乎整個(gè)的分析周期都被拖慢。


現(xiàn)在的先進(jìn)做法是,將BI與分析進(jìn)行對(duì)調(diào),即先分析再BI,并且分析工作要由熟悉業(yè)務(wù)的數(shù)據(jù)科學(xué)家來(lái)承擔(dān)。


張溪夢(mèng)認(rèn)為,把數(shù)據(jù)倉(cāng)庫(kù)的數(shù)據(jù)和分析直接結(jié)合,通過(guò)相關(guān)的分析技術(shù)和工具,直接挑選出具有商業(yè)價(jià)值的數(shù)據(jù),之后通過(guò)BI迅速將其商業(yè)價(jià)值擴(kuò)大化。這帶來(lái)的好處是,用數(shù)據(jù)的人在分析數(shù)據(jù),并且迅速地讓全公司的相關(guān)人員都能夠?qū)崟r(shí)看到分析結(jié)果,及時(shí)進(jìn)行決策。


做了這種對(duì)調(diào)之后,報(bào)表的制作量將大大減少。這樣,IT人員可以不用花費(fèi)大量時(shí)間研發(fā)報(bào)表,可以大大提高數(shù)據(jù)分析部門(mén)工作效率,滿足當(dāng)今數(shù)據(jù)分析需求的激增。


5. “輸出洞察、輸出決策、輸出價(jià)值”


在分析、BI之后,便到了如何將數(shù)據(jù)價(jià)值發(fā)揮出來(lái)的環(huán)節(jié)。張溪夢(mèng)認(rèn)為,這主要包括DM(數(shù)據(jù)挖掘)、AI(人工智能)、洞察、決策、行動(dòng)、價(jià)值等幾個(gè)階段。


Data Mining、AI是通過(guò)高超的技術(shù)手段,實(shí)現(xiàn)自動(dòng)化的機(jī)器學(xué)習(xí),從而達(dá)到在大數(shù)據(jù)分析處理之后,能夠自動(dòng)化地給企業(yè)的管理者、相關(guān)員工輸出具有洞察力的發(fā)現(xiàn),并且根據(jù)這些洞察和發(fā)現(xiàn)給出決策建議、行動(dòng)建議,最終幫助企業(yè)實(shí)現(xiàn)價(jià)值,滿足客戶需求。


張溪夢(mèng)認(rèn)為,大數(shù)據(jù)框架,最終應(yīng)該著眼于幫助企業(yè)為自己的客戶提供價(jià)值。不能僅局限于技術(shù)本身,只有很好地實(shí)現(xiàn)了洞察、決策、行動(dòng),最終才能真正實(shí)現(xiàn)大數(shù)據(jù)的價(jià)值,達(dá)到通過(guò)大數(shù)據(jù)提升公司效率和業(yè)務(wù)增長(zhǎng)的目的。


6. “底層頻次高價(jià)值低,頂層頻次低價(jià)值高”


從客戶、業(yè)務(wù)系統(tǒng)、數(shù)據(jù)采集、數(shù)據(jù)倉(cāng)庫(kù)、分析、BI、DM、AI、洞察、決策、行為、價(jià)值,再最終回到客戶,這構(gòu)成了張溪夢(mèng)眼中的不一樣的大數(shù)據(jù)框架。


張溪夢(mèng)說(shuō),他在實(shí)踐中還發(fā)現(xiàn),在這個(gè)大數(shù)據(jù)分析框架中,越貼近底層占用時(shí)間越多,而框架頂端的決策耗時(shí)卻很短;從價(jià)值頻率來(lái)講,頂端低頻次,高價(jià)值,底層是高頻次,低價(jià)值。


因此,大數(shù)據(jù)技術(shù)的一個(gè)重要發(fā)展方向是,效率低的部分實(shí)現(xiàn)全方位自動(dòng)化,并且實(shí)現(xiàn)一站式的大數(shù)據(jù)服務(wù)!


這正是張溪夢(mèng)歸國(guó)創(chuàng)辦GrowingIO的重要方向。張溪夢(mèng)希望,GrowingIO能成為他在大數(shù)據(jù)領(lǐng)域創(chuàng)新的載體,將國(guó)外大數(shù)據(jù)領(lǐng)域的最新理念、最新技術(shù)引入到中國(guó)。

 

二、連采集都不會(huì),怎能開(kāi)始數(shù)據(jù)應(yīng)用第一步?。?/span>


在詳細(xì)介紹了不一樣的大數(shù)據(jù)框架圖之后,張溪夢(mèng)和我們?cè)敿?xì)探討了大數(shù)據(jù)采集平臺(tái)。我們討論所形成的一個(gè)重要觀點(diǎn)是:在數(shù)字經(jīng)濟(jì)時(shí)代,未來(lái)每個(gè)企業(yè)都是數(shù)字企業(yè)。數(shù)字企業(yè)都必須有自己的大數(shù)據(jù)處理體系。而今天我們介紹的,便是張溪夢(mèng)眼中每個(gè)企業(yè)大數(shù)據(jù)處理體系中最基礎(chǔ)和最根本的部分——大數(shù)據(jù)采集平臺(tái)。


1.這才是企業(yè)大數(shù)據(jù)體系的核心


根據(jù)張溪夢(mèng)介紹的不一樣的大數(shù)據(jù)框架,我們總體上可以將企業(yè)大數(shù)據(jù)的體系分成“3+1”,即采集與存儲(chǔ)平臺(tái)、分析與挖掘平臺(tái)、洞察與決策平臺(tái),以及覆蓋全局的數(shù)據(jù)安全平臺(tái)。


采集與存儲(chǔ)平臺(tái)的主要職責(zé)是對(duì)企業(yè)的相關(guān)大數(shù)據(jù)進(jìn)行收集,并將采集到的數(shù)據(jù)存儲(chǔ)起來(lái)。這是企業(yè)的數(shù)據(jù)資產(chǎn)。它也是未來(lái)數(shù)字企業(yè)的最重要資產(chǎn)之一。


分析與挖掘平臺(tái)的主要職責(zé)是對(duì)企業(yè)采集到的大數(shù)據(jù)進(jìn)行專(zhuān)門(mén)的分析、BI等,以及在此基礎(chǔ)上進(jìn)一步的數(shù)據(jù)挖掘、人工智能等。


洞察與決策平臺(tái)的主要職責(zé)是利用大數(shù)據(jù)分析的結(jié)果產(chǎn)生對(duì)商業(yè)的洞察、決策,以及與之對(duì)應(yīng)的行動(dòng)等。


數(shù)據(jù)安全平臺(tái)的主要職責(zé)是負(fù)責(zé)確保數(shù)據(jù)的安全性,保證企業(yè)的數(shù)據(jù)資產(chǎn)不受到損害,例如數(shù)據(jù)不丟失、不損壞、不被竊、不被改等。


一般而言,企業(yè)可以不用自己擁有專(zhuān)門(mén)的大數(shù)據(jù)分析與挖掘平臺(tái),可以租用第三方的專(zhuān)業(yè)工具;但企業(yè)必須自己要有相應(yīng)的商業(yè)洞察、決策與行動(dòng)能力;同時(shí),企業(yè)也必須擁有自己的數(shù)據(jù),必須有數(shù)據(jù)的所有權(quán)。


也即是說(shuō),企業(yè)必須有數(shù)據(jù)采集與存儲(chǔ)平臺(tái),這樣才能擁有自己的大數(shù)據(jù)資產(chǎn)。這是未來(lái)數(shù)字企業(yè)的核心!如果數(shù)據(jù)不在自己手中,或者自己沒(méi)有數(shù)據(jù),則一切的所謂大數(shù)據(jù)都將變成空中樓閣。在虛擬的數(shù)字世界,同樣存在“巧婦難為無(wú)米之炊”?。?/p>


大數(shù)據(jù)的三個(gè)層次

資料來(lái)源:海比研究,2016


2. 大數(shù)據(jù)的采集平臺(tái)也有三個(gè)層次


在未來(lái)的數(shù)字企業(yè)中,大數(shù)據(jù)采集與存儲(chǔ)平臺(tái)將占據(jù)非常重要的位置。將來(lái)自各種數(shù)據(jù)源的原始大數(shù)據(jù)采集回來(lái)、存儲(chǔ)起來(lái),這便相當(dāng)于企業(yè)的大數(shù)據(jù)原油。如果一個(gè)國(guó)家沒(méi)有原油,就只有全部采用進(jìn)口了。這就相當(dāng)于把命脈交給了別人、被別人把控。


一般而言,大數(shù)據(jù)采集與存儲(chǔ)平臺(tái)一般也可以分為三個(gè)層次,即數(shù)據(jù)采集層、預(yù)處理層和存儲(chǔ)層。同時(shí),大數(shù)據(jù)采集平臺(tái)還需要一個(gè)覆蓋全局的數(shù)據(jù)安全體系。


采集層負(fù)責(zé)采集企業(yè)各種來(lái)源的大數(shù)據(jù);預(yù)處理層負(fù)責(zé)對(duì)采集回來(lái)的數(shù)據(jù)進(jìn)行一些規(guī)范化的處理;存儲(chǔ)層則是將預(yù)處理后的大數(shù)據(jù)進(jìn)行存儲(chǔ),將企業(yè)大數(shù)據(jù)資產(chǎn)用一種方式保存起來(lái)。數(shù)據(jù)安全體系和上文所提到的數(shù)據(jù)安全平臺(tái)一樣。

值得注意的是,當(dāng)存儲(chǔ)技術(shù)足夠好、存儲(chǔ)設(shè)備成本足夠低容量足夠大時(shí),或許就可以不用預(yù)處理層了。


大數(shù)據(jù)采集和處理平臺(tái)框架

資料來(lái)源:海比研究,2016


3. 大數(shù)據(jù)采集技術(shù)難題不少


張溪夢(mèng)認(rèn)為,大數(shù)據(jù)時(shí)代的數(shù)據(jù)采集和以前會(huì)很不一樣。


大數(shù)據(jù)采集是一個(gè)很復(fù)雜的工程。


其復(fù)雜性主要有三點(diǎn),第一,數(shù)據(jù)源非常復(fù)雜;第二,實(shí)時(shí)化比較難;第三,存儲(chǔ)和管理、保證安全比較難。有大數(shù)據(jù)專(zhuān)家認(rèn)為,這些復(fù)雜性使大數(shù)據(jù)采集有四類(lèi)典型技術(shù)難題。


第一,各種智能設(shè)備中的運(yùn)行數(shù)據(jù)是企業(yè)大數(shù)據(jù)的一個(gè)重要來(lái)源。在這種大數(shù)據(jù)采集中,很重要的一部分是大數(shù)據(jù)的智能感知,它能實(shí)現(xiàn)大數(shù)據(jù)源的智能識(shí)別、感知、信號(hào)轉(zhuǎn)換、適配、傳輸、載入等技術(shù)。尤其是智能設(shè)備的數(shù)據(jù)中,還會(huì)涉及結(jié)構(gòu)化、半結(jié)構(gòu)化、非結(jié)構(gòu)化等各種數(shù)據(jù),這與以前的純粹結(jié)構(gòu)化數(shù)據(jù)采集會(huì)有巨大不同,也因此而存在許多需要克服的技術(shù)難題。在智能制造、可穿戴設(shè)備等產(chǎn)業(yè)數(shù)字化、物聯(lián)網(wǎng)越來(lái)越發(fā)普及的今天,智能設(shè)備的數(shù)據(jù)采集變得非常重要。


第二,社交網(wǎng)絡(luò)、電商或官方網(wǎng)站、APP應(yīng)用是企業(yè)大數(shù)據(jù)的另一個(gè)重要來(lái)源。在這種大數(shù)據(jù)采集中,高速高可靠數(shù)據(jù)爬取或采集技術(shù)、高速大數(shù)據(jù)預(yù)處理技術(shù)、視頻語(yǔ)音等流數(shù)據(jù)的實(shí)時(shí)采集技術(shù)是當(dāng)前需要重點(diǎn)突破的技術(shù)方向。同時(shí),采用哪種方法采集,例如埋點(diǎn)或無(wú)埋點(diǎn)方法,也是當(dāng)前非常重要的突破方向。


第三,存儲(chǔ)也將越來(lái)越成為大數(shù)據(jù)的關(guān)鍵問(wèn)題。隨著一切產(chǎn)品與物質(zhì)的智能化、數(shù)字化,數(shù)據(jù)量正以前所未有的速度迅猛擴(kuò)大。如果沒(méi)有一套成熟的數(shù)據(jù)存儲(chǔ)和管理方案,我們也終究無(wú)法利用這些巨量的數(shù)據(jù)。大數(shù)據(jù)專(zhuān)家們一致認(rèn)為,大數(shù)據(jù)的索引技術(shù),以及大數(shù)據(jù)的移動(dòng)、備份、復(fù)制等技術(shù)是當(dāng)前技術(shù)難點(diǎn)。


第四,隱私與安全是大數(shù)據(jù)采集中面臨的另一道難關(guān)。對(duì)于隱私,目前采集的界限就很難界定。一些數(shù)據(jù)一旦采集了便涉及到隱私,不采集又會(huì)損失很多重要信息;數(shù)據(jù)如何利用算是侵犯隱私,怎樣才算是合法利用……這些問(wèn)題,看上去是屬于道德或法律范疇,但其實(shí)也是和技術(shù)實(shí)現(xiàn)手段息息相關(guān)。另外,如何保證數(shù)據(jù)不受損、不被修改、不被偷窺、不被偷竊,則是當(dāng)前大數(shù)據(jù)采集所要重點(diǎn)解決的安全問(wèn)題。這會(huì)涉及隱私保護(hù)和推理控制、數(shù)據(jù)真?zhèn)巫R(shí)別和取證、數(shù)據(jù)持有完整性驗(yàn)證等技術(shù)。


4. 數(shù)據(jù)采集制度規(guī)范的重要性


值得注意的,大數(shù)據(jù)的采集還有一件事情非常重要,即整個(gè)企業(yè)要有一套完整、規(guī)范的數(shù)據(jù)管理體系。這個(gè)數(shù)據(jù)管理體系包括數(shù)據(jù)采集流程,以及數(shù)據(jù)管理制度。


張溪夢(mèng)說(shuō),國(guó)內(nèi)大數(shù)據(jù)的技術(shù)服務(wù)公司正在飛速成長(zhǎng),其產(chǎn)品技術(shù)和美國(guó)的差距也正在迅速縮小。但對(duì)于數(shù)據(jù)管理體系,國(guó)內(nèi)很多企業(yè)在這方面的理念、水平及完整性都和美國(guó)企業(yè)有不少差距。這是一個(gè)軟實(shí)力,企業(yè)只有在這方面也強(qiáng)大了,才能真正將大數(shù)據(jù)的價(jià)值準(zhǔn)確、持續(xù)地發(fā)揮出來(lái)。

 

三、如何創(chuàng)建神一樣的數(shù)據(jù)產(chǎn)品?


1.神一樣的大數(shù)據(jù)產(chǎn)品


這是當(dāng)我和坐在眼前的真正的前LinkedIn數(shù)據(jù)科學(xué)家張溪夢(mèng)一起交流的時(shí)候,我自己的深切感受。我驚人地發(fā)現(xiàn)我自己更加喜歡數(shù)據(jù)科學(xué)家的魅力!我的心告訴我,我有這個(gè)直覺(jué),有從一些看似無(wú)關(guān)卻可能發(fā)現(xiàn)新大陸的數(shù)據(jù)敏感性!在與他交流的過(guò)程中,我完全能感受到,數(shù)據(jù)產(chǎn)品非?!吧瘛保鴶?shù)據(jù)科學(xué)家、數(shù)據(jù)產(chǎn)品經(jīng)理要更神。


張溪夢(mèng)舉了一個(gè)他們?cè)贚inkedIn工作時(shí)的大數(shù)據(jù)分析與產(chǎn)品例子。這很讓我腦洞大開(kāi),也不由對(duì)此有種“飛蛾撲火”般的吸引力與特別想試一下的沖動(dòng)。


據(jù)他介紹,他們當(dāng)時(shí)做了一個(gè)非常有趣的分析,他們用三個(gè)非常簡(jiǎn)單的數(shù)據(jù)構(gòu)建了一個(gè)評(píng)估公司價(jià)值的分析模型,即這個(gè)公司的每名員工是從哪個(gè)公司進(jìn)入的、哪年進(jìn)入的、哪年離開(kāi)的。


他們用這個(gè)大數(shù)據(jù)分析模型對(duì)美國(guó)的一些知名IT公司的價(jià)值進(jìn)行評(píng)估排名,結(jié)果發(fā)現(xiàn)是驚人的準(zhǔn)確!他說(shuō),當(dāng)時(shí)從他們這個(gè)神一樣的數(shù)據(jù)模型分析出來(lái)的結(jié)論是,LinkedIn排名非??壳?。


這在幾年前的發(fā)展?fàn)顩r來(lái)看,有點(diǎn)不太符合當(dāng)時(shí)人們的認(rèn)知。但經(jīng)過(guò)一段時(shí)間的發(fā)展,現(xiàn)在這個(gè)排名看起來(lái)完全正確。


我驚訝的不是結(jié)論的預(yù)見(jiàn)性,而是該數(shù)據(jù)分析模型的構(gòu)建。居然想到從這個(gè)視角、從這樣三個(gè)簡(jiǎn)單的數(shù)據(jù),便反映出一個(gè)看似很難做到的預(yù)測(cè)!我喜歡這個(gè)!


其實(shí),這兩天還有一個(gè)數(shù)據(jù)產(chǎn)品讓所有人都很Happy,也很感慨:2016微信公開(kāi)課PRO版。這就是一個(gè)神一樣的數(shù)據(jù)產(chǎn)品!只要點(diǎn)擊鏈接,它就能給你回放你在微信這個(gè)星球里的運(yùn)行軌跡。


我自己用了一下,它告訴我:我是在2012年11月7日注冊(cè)微信,我的第一個(gè)微信好友是紛享銷(xiāo)客羅旭。多么神奇,又多么溫暖!實(shí)際上,另一個(gè)互聯(lián)網(wǎng)巨頭阿里巴巴以前也曾推出過(guò)類(lèi)似的神來(lái)之筆——淘寶時(shí)光機(jī)。

說(shuō)不準(zhǔn),微信的這個(gè)產(chǎn)品也受到過(guò)淘寶時(shí)光機(jī)的啟發(fā)呢。(不過(guò),從數(shù)據(jù)產(chǎn)品經(jīng)理的角度看,淘寶時(shí)光機(jī)顯然是更勝一籌。時(shí)光機(jī),太有感覺(jué)了!)



2.如何規(guī)劃數(shù)據(jù)產(chǎn)品


“數(shù)據(jù)產(chǎn)品應(yīng)該怎么規(guī)劃?”我問(wèn)張溪夢(mèng)。


有一些國(guó)內(nèi)做得較好的數(shù)據(jù)產(chǎn)品經(jīng)理對(duì)此做了一些介紹。例如,可以從數(shù)據(jù)產(chǎn)品的類(lèi)型進(jìn)行規(guī)劃,如要有數(shù)據(jù)型產(chǎn)品、洞察型產(chǎn)品、決策型產(chǎn)品、智能型產(chǎn)品等;也可以按使用對(duì)象進(jìn)行規(guī)劃,如內(nèi)部使用的數(shù)據(jù)產(chǎn)品、外部使用的數(shù)據(jù)產(chǎn)品;類(lèi)似的規(guī)劃思路還有很多。


張溪夢(mèng)認(rèn)為,這些都是不錯(cuò)的規(guī)劃方法。不過(guò),除了規(guī)劃,“好的數(shù)據(jù)產(chǎn)品也是創(chuàng)意、是想象力、是靈光乍現(xiàn)。”別人看似平淡、看似發(fā)瘋的數(shù)據(jù),但在神一樣的數(shù)據(jù)科學(xué)家、數(shù)據(jù)產(chǎn)品經(jīng)理的眼里,就可能會(huì)產(chǎn)生一個(gè)具有極大意義的數(shù)據(jù)產(chǎn)品。


在大數(shù)據(jù)的深海世界里,有著無(wú)窮無(wú)盡的可能性與創(chuàng)造力。生辰八字、梅花易數(shù)、易經(jīng)、奇門(mén)遁甲、看相算命、風(fēng)水,這些流傳幾千年、看似毫無(wú)科學(xué)道理的迷信手段,如果用大數(shù)據(jù)的眼光來(lái)看,他們其實(shí)也是一種數(shù)據(jù)產(chǎn)品。從這個(gè)角度來(lái)看,綿延五千年的中華民族是非常適合設(shè)計(jì)大數(shù)據(jù)產(chǎn)品的。天生就有這樣的基因!


在張溪夢(mèng)看來(lái),數(shù)據(jù)產(chǎn)品最重要的要素有兩個(gè),第一是創(chuàng)意,第二是數(shù)據(jù)分析算法和分析模型。


因此,張溪夢(mèng)認(rèn)為,規(guī)劃數(shù)據(jù)產(chǎn)品,最重要的是找到優(yōu)秀的充滿創(chuàng)意的人才,規(guī)劃和搭建好整個(gè)大數(shù)據(jù)分析的團(tuán)隊(duì)。其次,便是將基礎(chǔ)數(shù)據(jù)及相關(guān)分析工具準(zhǔn)備好;最后,要將交互界面(UI)設(shè)計(jì)好。只要有這三點(diǎn),就不愁開(kāi)發(fā)不出讓人眼前一亮的數(shù)據(jù)產(chǎn)品!


3.如何創(chuàng)建數(shù)據(jù)公司


最后,我還想說(shuō)一個(gè)非常有意思的觀點(diǎn):未來(lái)會(huì)有海量的數(shù)據(jù)產(chǎn)品誕生,會(huì)有海量的數(shù)據(jù)產(chǎn)品創(chuàng)業(yè)公司!


自己沒(méi)有數(shù)據(jù)能做數(shù)據(jù)產(chǎn)品嗎?自己沒(méi)有數(shù)據(jù)分析工具能做數(shù)據(jù)產(chǎn)品嗎?我的結(jié)論都是肯定的:能!你唯一要有的,就是擁有創(chuàng)意擁有想象力!這是最適合個(gè)人創(chuàng)業(yè)的全新領(lǐng)域!


其實(shí),你沒(méi)有大數(shù)據(jù)嗎?錯(cuò)!


你擁有眾多的大數(shù)據(jù),有很多免費(fèi)或低成本的大數(shù)據(jù)可以供我們每一個(gè)人使用,例如政府部門(mén)的相關(guān)數(shù)據(jù)、各大電商社交網(wǎng)絡(luò)的海量數(shù)據(jù)等。所以,我們每個(gè)人都有大數(shù)據(jù)。


你沒(méi)有數(shù)據(jù)分析工具嗎?錯(cuò)!


你擁有眾多免費(fèi)或非常便宜的大數(shù)據(jù)分析和洞察工具。市場(chǎng)上這樣的數(shù)據(jù)分析提供商非常多,你可以低成本地隨意使用。


有了數(shù)據(jù)、有了工具,再加上你的創(chuàng)意你的想象力,你就能設(shè)計(jì)出讓人意想不到的數(shù)據(jù)產(chǎn)品!一個(gè)好的數(shù)據(jù)產(chǎn)品,可能會(huì)給社會(huì)帶來(lái)變革帶來(lái)進(jìn)步,也可能會(huì)成就你的一生!



注:本文系數(shù)據(jù)觀綜合自GrowingIO稿件整理,作者系中國(guó)軟件網(wǎng)曹開(kāi)彬,著作權(quán)屬原創(chuàng)者所有。數(shù)據(jù)觀整理分享此文并非商業(yè)用途。以上內(nèi)容并不代表數(shù)據(jù)觀觀點(diǎn),如涉著作權(quán)等事宜請(qǐng)聯(lián)系小編更正。

搜索數(shù)據(jù)觀(www.cbdio.com)獲取更多大數(shù)據(jù)相關(guān)資訊?

新聞?lì)l道丨資訊丨觀點(diǎn)丨案例丨專(zhuān)欄丨企業(yè)丨自媒丨大數(shù)據(jù)百科丨慕課丨PPT報(bào)告丨標(biāo)簽丨活動(dòng)丨創(chuàng)客丨貴州大數(shù)據(jù)丨數(shù)博會(huì)丨大數(shù)據(jù)系列圖書(shū)連載

……

    本站是提供個(gè)人知識(shí)管理的網(wǎng)絡(luò)存儲(chǔ)空間,所有內(nèi)容均由用戶發(fā)布,不代表本站觀點(diǎn)。請(qǐng)注意甄別內(nèi)容中的聯(lián)系方式、誘導(dǎo)購(gòu)買(mǎi)等信息,謹(jǐn)防詐騙。如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容,請(qǐng)點(diǎn)擊一鍵舉報(bào)。
    轉(zhuǎn)藏 分享 獻(xiàn)花(0

    0條評(píng)論

    發(fā)表

    請(qǐng)遵守用戶 評(píng)論公約

    類(lèi)似文章 更多

    内用黄老外示儒术出处| 日韩成人中文字幕在线一区| 国产精品夜色一区二区三区不卡 | 自拍偷女厕所拍偷区亚洲综合| 日韩欧美三级中文字幕| 高清一区二区三区不卡免费| 国产精品流白浆无遮挡| 久久机热频这里只精品| 欧洲日韩精品一区二区三区| 亚洲视频一区二区久久久| 好吊日在线视频免费观看| 蜜桃传媒在线正在播放| 国产欧美另类激情久久久| 欧美自拍偷自拍亚洲精品| 黄色国产一区二区三区| 伊人久久青草地婷婷综合| 粉嫩一区二区三区粉嫩视频| 在线观看中文字幕91| 日韩中文无线码在线视频| 中文字幕久久精品亚洲乱码| 日韩亚洲精品国产第二页| 免费啪视频免费欧美亚洲| 亚洲av首页免费在线观看| 欧美日韩无卡一区二区| 少妇人妻一级片一区二区三区| 欧美日韩一级黄片免费观看| 午夜国产精品福利在线观看| 日韩精品一区二区不卡| 久久中文字幕中文字幕中文| 日本深夜福利视频在线| 欧美亚洲综合另类色妞| 成人免费高清在线一区二区| 国产欧美日韩在线一区二区| 尹人大香蕉中文在线播放| 神马午夜福利免费视频| 精品欧美日韩一二三区| 中日韩美女黄色一级片| 日韩一级毛一欧美一级乱| 久久综合狠狠综合久久综合| 国产剧情欧美日韩中文在线| 亚洲国产91精品视频|