余晟組團(tuán),飛總專欄原價(jià)199限時(shí)79 最近阿里巴巴分享了《阿里巴巴數(shù)據(jù)中臺(tái)實(shí)踐》這個(gè)PPT(自行搜索原始文章),對(duì)于數(shù)據(jù)中臺(tái)的始作俑者,還是要懷著巨大的敬意去學(xué)習(xí)的,因此仔細(xì)的研讀了,希望能發(fā)現(xiàn)一些不一樣的東西。 讀這些專業(yè)的PPT,實(shí)際是非常耗時(shí)的,你需要把這些PPT外表的光鮮扒光,死摳上面的每一個(gè)字去理解底下隱藏的含義,然后跟你的已有知識(shí)體系去對(duì)比,看看是否有助于完善自己的認(rèn)知,對(duì)于自己不理解的,還需要經(jīng)常去檢索相關(guān)的文檔。當(dāng)然,很多寫(xiě)PPT的用詞沒(méi)這么嚴(yán)謹(jǐn),臨時(shí)造概念的不少,或者是獨(dú)特的說(shuō)法,因此有時(shí)候還要做一些揣測(cè),結(jié)合自己的實(shí)踐去理解,這篇PPT的解讀有6000多字,因此請(qǐng)做好燒腦的準(zhǔn)備,雖然筆者沒(méi)去現(xiàn)場(chǎng)聽(tīng)演講,但希望我的“演講”也能讓你學(xué)到真功夫。看到這個(gè)片子的出處,阿里云智能事業(yè)部,其實(shí)是有點(diǎn)奇怪的,記得阿里的中臺(tái)事業(yè)群包括搜索事業(yè)部、共享業(yè)務(wù)平臺(tái)、數(shù)據(jù)技術(shù)及產(chǎn)品部,阿里云是一個(gè)側(cè)重云業(yè)務(wù)的平臺(tái)事業(yè)部,它來(lái)說(shuō)數(shù)據(jù)中臺(tái)合適嗎?有人會(huì)問(wèn),平臺(tái)和中臺(tái)又有什么區(qū)別呢?阿里云來(lái)講中臺(tái)不是很合適嗎?筆者的疑惑是這樣:一般意義上的平臺(tái)具備業(yè)務(wù)無(wú)關(guān)性,潛心技術(shù)就可以了,而中臺(tái)是業(yè)務(wù)的收斂,跟業(yè)務(wù)的相關(guān)性很大,對(duì)于數(shù)據(jù)中臺(tái),其核心競(jìng)爭(zhēng)力不是平臺(tái)級(jí)的技術(shù),而是數(shù)據(jù)的理解、處理和挖掘。讓一個(gè)做平臺(tái)技術(shù)的人跑到前端去理解數(shù)據(jù)訴求沉淀共性是不現(xiàn)實(shí)的,而這是當(dāng)前數(shù)據(jù)中臺(tái)創(chuàng)造價(jià)值的核心。當(dāng)然講PPT的可以不問(wèn)出身,能理解阿里的數(shù)據(jù)中臺(tái)就可以了。傳統(tǒng)的IT是成本中心,而有了數(shù)據(jù)后,就可能成為價(jià)值中心,這個(gè)價(jià)值體現(xiàn)在:在管理上可以提供決策支持,在生產(chǎn)上可以提供與管理匹配的智能工具,也就是提升生產(chǎn)關(guān)系和生產(chǎn)力的適配能力。這一點(diǎn)提得是不錯(cuò)的,比如浙江移動(dòng)大數(shù)據(jù)中心就是直接定位為利潤(rùn)中心。這里的IT和DT的對(duì)比就不太合適了,兩者不是對(duì)立的關(guān)系,而是融合的關(guān)系,D通過(guò)IT形成DT,比如原來(lái)IT渠道系統(tǒng)僅受理業(yè)務(wù),現(xiàn)在在受理的場(chǎng)景下可以加載基于數(shù)據(jù)的智能推薦。DT只是馬云提得一個(gè)突出數(shù)據(jù)價(jià)值的抽象概念,不能生硬去的理解,現(xiàn)在中國(guó)移動(dòng)提了一個(gè)三融概念:融合,融通,融智,我覺(jué)得IT和DT就要加強(qiáng)融合融通,融合就是搭在一起賣(mài),融通就是能力共享,IT中有DT能力,DT中也要有IT能力。片子中提到的DT是問(wèn)題導(dǎo)向,IT是需求導(dǎo)向,這是一個(gè)問(wèn)題的兩面,而不是DT和IT的區(qū)別;新拋出的DT的授之以漁,IT的授之以網(wǎng)的區(qū)別在于方法的觀點(diǎn)倒是有點(diǎn)道理,比如DT的智能推薦就是提供了方法,而以前IT的推薦靠的是人的判斷。高管團(tuán)隊(duì):看指標(biāo)發(fā)現(xiàn)風(fēng)險(xiǎn)這是BI時(shí)代的基本訴求,沒(méi)啥好說(shuō)的;大數(shù)據(jù)更強(qiáng)大的處理、可視化、實(shí)時(shí)等技術(shù)可以提供更好的看數(shù)據(jù)體驗(yàn),這是相對(duì)于以前BI提升的地方。業(yè)務(wù)團(tuán)隊(duì):提到三個(gè)變化:一是通過(guò)數(shù)據(jù)發(fā)現(xiàn)問(wèn)題,而不是拍腦袋。二是業(yè)務(wù)人員要既懂業(yè)務(wù)也懂?dāng)?shù)據(jù),甚至能自己DIY數(shù)據(jù)和模型。三是數(shù)據(jù)要嵌入生產(chǎn)流程中直接發(fā)揮作用,比如標(biāo)簽庫(kù)要成為營(yíng)銷(xiāo)目標(biāo)用戶的發(fā)起地,風(fēng)控模型要嵌入在用戶操作流程中等等。第一點(diǎn)大家都在做,實(shí)際還是以經(jīng)驗(yàn)為主,數(shù)據(jù)只是參考和佐證,這種模式本質(zhì)上沒(méi)有改變。第二點(diǎn),第三點(diǎn)執(zhí)行到位對(duì)于大多數(shù)企業(yè)都很難。技術(shù)團(tuán)隊(duì):提到三個(gè)要點(diǎn):一是“數(shù)據(jù)多跑路”是智能平臺(tái)的核心,浙江的“最多跑一次”就是要靠數(shù)據(jù)和平臺(tái)整合實(shí)現(xiàn)這個(gè)目標(biāo)。二是IT人員要有數(shù)據(jù)化的思維,這個(gè)提的很好,缺乏數(shù)據(jù)思維的人設(shè)計(jì)IT系統(tǒng)很少考慮智能,現(xiàn)在很多企業(yè)的受理系統(tǒng)跟推薦系統(tǒng)是兩者皮多少有這個(gè)原因。三是通過(guò)數(shù)據(jù)分析發(fā)現(xiàn)新的知識(shí),從而賦能業(yè)務(wù),這是數(shù)據(jù)技術(shù)團(tuán)隊(duì)的使命。這張圖詮釋了阿里的商業(yè)操作系統(tǒng)的引擎:大中臺(tái),小前臺(tái),展示的很清晰了,特別提醒要理解兩個(gè)重要概念:業(yè)務(wù)數(shù)據(jù)化和數(shù)據(jù)業(yè)務(wù)化。業(yè)務(wù)數(shù)據(jù)化:就是所有的商業(yè)活動(dòng)都應(yīng)該記錄下相關(guān)的數(shù)據(jù),這是業(yè)務(wù)中臺(tái)應(yīng)該承擔(dān)的使命。業(yè)務(wù)數(shù)據(jù)化挑戰(zhàn)其實(shí)很大,以前業(yè)務(wù)平臺(tái)在設(shè)計(jì)的時(shí)候,是以功能和流程為核心的,只記錄對(duì)于要實(shí)現(xiàn)功能和流程必需的數(shù)據(jù),其他的就可有可無(wú)了。比如運(yùn)營(yíng)商的一些信令日志記錄不全面導(dǎo)致可能影響后續(xù)的網(wǎng)絡(luò)分析或數(shù)據(jù)價(jià)值變現(xiàn),這就沒(méi)有做到業(yè)務(wù)數(shù)據(jù)化。但業(yè)務(wù)數(shù)據(jù)化有時(shí)意味著巨大的成本投入,說(shuō)來(lái)容易執(zhí)行難,大多企業(yè)的數(shù)據(jù)不是業(yè)務(wù)數(shù)據(jù)化戰(zhàn)略執(zhí)行的結(jié)果,而僅僅是順便摘取的低垂的果實(shí)。數(shù)據(jù)團(tuán)隊(duì)的一個(gè)使命就是業(yè)務(wù)數(shù)據(jù)化,很多好的數(shù)據(jù)是你進(jìn)入前端爭(zhēng)取來(lái)的,這樣才能驅(qū)動(dòng)業(yè)務(wù)記錄數(shù)據(jù)。數(shù)據(jù)業(yè)務(wù)化:本質(zhì)就是從數(shù)據(jù)中發(fā)現(xiàn)價(jià)值,反過(guò)來(lái)賦能業(yè)務(wù),這是很好理解的。數(shù)字孿生這個(gè)詞現(xiàn)在也比較熱了,未來(lái)萬(wàn)物互聯(lián)的世界將你所有的行為實(shí)時(shí)記錄下來(lái),形成另一個(gè)數(shù)字化的你,這就是數(shù)字孿生,如果業(yè)務(wù)中臺(tái)是你,那數(shù)據(jù)中臺(tái)就是你的兄弟。5、數(shù)據(jù)中臺(tái)賦能的四大典型場(chǎng)景(1)全局?jǐn)?shù)據(jù)監(jiān)控:本質(zhì)就是指標(biāo)+報(bào)表+可視化,這是給管理者看得,當(dāng)然業(yè)務(wù)人員也要看,以下給了雙11大屏示例。(2)數(shù)據(jù)化運(yùn)營(yíng)-智能CRM:提到要“基于全鏈路全渠道數(shù)據(jù)的建立以“人”為核心的數(shù)據(jù)連接萃取管理體系,對(duì)用戶進(jìn)行全生命周期的精細(xì)化管理”,這么多形容詞懵不懵逼,到底在說(shuō)啥?全鏈路是指縱向記錄跟蹤整個(gè)商業(yè)過(guò)程的數(shù)據(jù)(包括商品企劃、售前及售中管理、客服管理、訂單處理、倉(cāng)儲(chǔ)物流等等)。全渠道就是各觸點(diǎn)的用戶行為數(shù)據(jù),比如天貓、淘寶、優(yōu)酷等等。因此,通過(guò)匯聚全鏈路全渠道的數(shù)據(jù)才能形成完整的客戶畫(huà)像,然后用連接萃取的方式方便的獲得所需的數(shù)據(jù)進(jìn)行分析,從字面意思看跟我們的標(biāo)簽庫(kù)定位有點(diǎn)像。(3)數(shù)據(jù)植入業(yè)務(wù)-智能推薦:這里講的比較清楚,就是營(yíng)銷(xiāo)閉環(huán)管理,從用戶細(xì)分,千人千面,渠道推薦,再到營(yíng)銷(xiāo)評(píng)估,以下是示例。(4)數(shù)據(jù)業(yè)務(wù)化-生意參謀:這個(gè)是阿里力推的為數(shù)不多的血統(tǒng)純正的數(shù)據(jù)產(chǎn)品,是數(shù)據(jù)業(yè)務(wù)化和數(shù)據(jù)直接變現(xiàn)的典型代表,可以為店主提供端到端的分析支撐,網(wǎng)上介紹很多了,下面這張片子著重說(shuō)明了生意參謀的歷史,現(xiàn)在和未來(lái),有點(diǎn)意思。歷史:百家爭(zhēng)鳴,雖然提了數(shù)據(jù)冗余、體驗(yàn)差等問(wèn)題,但沒(méi)有百家爭(zhēng)鳴,不可能有生意參謀這個(gè)整合產(chǎn)品的出現(xiàn)。現(xiàn)在:生意參謀獨(dú)霸天下,依托的是數(shù)據(jù)中臺(tái)體系,包括OneData、OneService、OnePlatForm等,這個(gè)后面會(huì)解讀。未來(lái):一個(gè)生意參謀還不夠,要打造一個(gè)產(chǎn)品開(kāi)發(fā)平臺(tái),復(fù)制出一個(gè)個(gè)面向不同行業(yè)的生意參謀,也就是參謀X,野心很大。因?yàn)橹T如推薦啥的,數(shù)據(jù)是依附于業(yè)務(wù)流程上的,你評(píng)估數(shù)據(jù)價(jià)值的時(shí)候,很難說(shuō)是業(yè)務(wù)本身好、流程設(shè)計(jì)好、還是你數(shù)據(jù)推薦的好,而純正的數(shù)據(jù)產(chǎn)品是數(shù)據(jù)人員彰顯自身價(jià)值的更好方式。6、阿里巴巴做數(shù)據(jù)中臺(tái)的緣起做數(shù)據(jù)中臺(tái)的緣起跟一般數(shù)據(jù)倉(cāng)庫(kù)融合模型是一樣的,共享復(fù)用的需要,比如原來(lái)基于淘寶數(shù)據(jù)的各種業(yè)務(wù)都自建一套中間層,而這些中間層很多是重復(fù)或類(lèi)似的,比如螞蟻業(yè)務(wù)有交易主題,天貓也有交易主題,那能不能抽象出公共的交易主題為兩個(gè)業(yè)務(wù)都服務(wù)呢?因此你會(huì)看到阿里數(shù)據(jù)中臺(tái)抽象出了會(huì)員、商品、交易、瀏覽、廣告等公共核心主題層,從而為應(yīng)用層服務(wù),各個(gè)應(yīng)用層以前要做很多公共層的東西,現(xiàn)在也可以完全復(fù)用了,理論上可以提升應(yīng)用構(gòu)建的速度。下面這頁(yè)片子從數(shù)據(jù)的依賴關(guān)系圖比對(duì)了前后的變化,一個(gè)是網(wǎng)狀的,代表了相互之間千絲萬(wàn)縷的關(guān)系,冗余肯定是很多的,一個(gè)是放射狀的,一個(gè)節(jié)點(diǎn)可以為更多的后端節(jié)點(diǎn)服務(wù),代表了共享和簡(jiǎn)潔。7、阿里巴巴數(shù)據(jù)中臺(tái)全景圖讀懂這張圖就理解了阿里的數(shù)據(jù)中臺(tái)具體到底干了些什么,有五大部分跟數(shù)據(jù)中臺(tái)直接相關(guān):數(shù)據(jù)中臺(tái)DaaS、數(shù)據(jù)資產(chǎn)管理IPaaS、數(shù)據(jù)研發(fā)平臺(tái)IPaaS及計(jì)算與存儲(chǔ)平臺(tái)IaaS。筆者理解廣義的數(shù)據(jù)中臺(tái)其實(shí)包括數(shù)據(jù)中臺(tái)DaaS、數(shù)據(jù)資產(chǎn)管理IPaaS、數(shù)據(jù)研發(fā)平臺(tái)IPaaS三部分,如果狹義的理解則僅包括數(shù)據(jù)中臺(tái)DaaS,數(shù)據(jù)資產(chǎn)管理IPaaS、數(shù)據(jù)研發(fā)平臺(tái)IPaaS在筆者的企業(yè)叫做能效中臺(tái)。(1)計(jì)算與存儲(chǔ)平臺(tái)IaaS流計(jì)算SteamCompute:應(yīng)該指阿里內(nèi)部的Flink版本。離線計(jì)算MaxCompute:阿里自研的EB級(jí)的數(shù)據(jù)倉(cāng)庫(kù)(原來(lái)的ODPS)。實(shí)時(shí)計(jì)算ADS:AnalyticDB的簡(jiǎn)稱,主要是提供實(shí)時(shí)在線分析,可以認(rèn)為是阿里自研的OLAP版本。 (2)數(shù)據(jù)資產(chǎn)管理IPaaS數(shù)據(jù)資產(chǎn)管理其實(shí)跟元數(shù)據(jù)管理一回事。資產(chǎn)地圖:本質(zhì)上是數(shù)據(jù)字典的圖形化版本,阿里有多少數(shù)據(jù)、如何存儲(chǔ)、數(shù)據(jù)之間關(guān)系如何、如何找、如何用都可以從資產(chǎn)地圖找到答案,蠻形象的,從網(wǎng)上資料看,其設(shè)計(jì)還是值得借鑒,以下是一些界面截圖。資產(chǎn)分析:你可以理解為針對(duì)元數(shù)據(jù)的BI分析,什么結(jié)構(gòu)分析,趨勢(shì)分析什么的,萬(wàn)變不離其宗,你希望通過(guò)元數(shù)據(jù)分析理解現(xiàn)狀,發(fā)現(xiàn)異常,從而指導(dǎo)數(shù)據(jù)資產(chǎn)的治理,比如支付類(lèi)別的數(shù)據(jù)增長(zhǎng)情況如何。資產(chǎn)應(yīng)用:你可以理解為利用元數(shù)據(jù)信息來(lái)提升數(shù)據(jù)資產(chǎn)的利用效率,比如通過(guò)影響分析挖掘出無(wú)效的數(shù)據(jù)資產(chǎn),從而降低數(shù)據(jù)冗余,這個(gè)工作做好,價(jià)值是很大的。資產(chǎn)運(yùn)營(yíng):運(yùn)營(yíng)這個(gè)詞被用爛了,運(yùn)營(yíng)其實(shí)不是一個(gè)功能,而是一個(gè)動(dòng)作,希望通過(guò)各種舉措來(lái)讓數(shù)據(jù)被更多的人使用,從而產(chǎn)生更多的價(jià)值,比如新增數(shù)據(jù)資產(chǎn)的推薦等等。數(shù)據(jù)資產(chǎn)使用的二八定律是非常明顯的,大多數(shù)據(jù)其實(shí)是沒(méi)人訪問(wèn)或使用的,而存儲(chǔ)的成本可是很高的,只有通過(guò)運(yùn)營(yíng)才能讓沉默的數(shù)據(jù)被更多的人使用,無(wú)效的數(shù)據(jù)得到清除,從而實(shí)現(xiàn)降本增效。(3)數(shù)據(jù)研發(fā)平臺(tái)IPaaS這個(gè)平臺(tái)跟筆者以前文章中提到的DACP是一個(gè)東西,就是負(fù)責(zé)數(shù)據(jù)的加工,需要一系列配套功能,包括數(shù)據(jù)規(guī)劃、交換、處理、開(kāi)發(fā)、調(diào)度及監(jiān)控等等。(4)數(shù)據(jù)中臺(tái)DaaS垂直數(shù)據(jù)中心(OneClick):就是傳統(tǒng)數(shù)據(jù)架構(gòu)中的ETL,通過(guò)離線、實(shí)時(shí)等方式將各渠道的數(shù)據(jù)采集過(guò)來(lái)。公共數(shù)據(jù)中心(OneData):就是數(shù)據(jù)倉(cāng)庫(kù)建模需要達(dá)到的目的,保證數(shù)據(jù)口徑的規(guī)范和統(tǒng)一,沉淀共性的數(shù)據(jù),阿里采用的是維度建模,通過(guò)分析業(yè)務(wù)過(guò)程抽象出維度和指標(biāo),最后匯總成所需要的倉(cāng)庫(kù)模型。萃取數(shù)據(jù)中心(OneID):筆者的理解是阿里為了方便對(duì)外提供數(shù)據(jù),形成了一套以各種ID(業(yè)務(wù)核心對(duì)象)為唯一標(biāo)識(shí)的寬表,就好比運(yùn)營(yíng)商需要形成一套以用戶ID(手機(jī)號(hào)碼)、客戶ID、賬戶ID、家庭ID為核心的寬表體系一樣。統(tǒng)一數(shù)據(jù)服務(wù)中間件(OneService):以數(shù)據(jù)倉(cāng)庫(kù)整合計(jì)算好的數(shù)據(jù)作為數(shù)據(jù)源,對(duì)外通過(guò)接口的方式提供數(shù)據(jù)服務(wù)。8、阿里巴巴數(shù)據(jù)中臺(tái)的沉淀與積累數(shù)據(jù)標(biāo)準(zhǔn)化:實(shí)現(xiàn)數(shù)據(jù)資產(chǎn)各域、主題、模型、字段、指標(biāo)命名等的統(tǒng)一規(guī)范,筆者一直強(qiáng)調(diào)數(shù)據(jù)標(biāo)準(zhǔn)化一定要在源頭解決,如果阿里的業(yè)務(wù)系統(tǒng)數(shù)據(jù)資產(chǎn)都遵循這個(gè)原則,那是厲害的很。技術(shù)內(nèi)核工具化:我的理解是規(guī)范的落地必須依托工具來(lái)強(qiáng)制控制,比如你只能按照規(guī)范模板的要求來(lái)建表,否則就執(zhí)行不了,阿里在這方面的管控?fù)?jù)說(shuō)是比較給力的。元數(shù)據(jù)驅(qū)動(dòng)智能化:有了元數(shù)據(jù)分析就能科學(xué)的計(jì)算出對(duì)于資源的訴求,而且可以做得非??焖俸挽`活,擯棄每次規(guī)劃擴(kuò)容到處找依據(jù)的窘境,這跟前面的元數(shù)據(jù)應(yīng)用是類(lèi)似的。OneData是阿里數(shù)據(jù)中臺(tái)非常核心的內(nèi)容,其有一個(gè)Dataphin引擎,可以實(shí)現(xiàn)數(shù)據(jù)標(biāo)準(zhǔn)規(guī)范定義、數(shù)據(jù)模型的自動(dòng)化開(kāi)發(fā)、主題式數(shù)據(jù)服務(wù)即時(shí)生成等功能。具體如下面這個(gè)片子所示,其包括數(shù)據(jù)引入-規(guī)范定義-數(shù)據(jù)建模-數(shù)據(jù)外部關(guān)聯(lián)-數(shù)據(jù)資產(chǎn)沉淀-數(shù)據(jù)服務(wù)生成整個(gè)閉環(huán)鏈條,通過(guò)這一鏈條把數(shù)據(jù)管理的大多要素都實(shí)現(xiàn)了。這種強(qiáng)規(guī)范性的開(kāi)發(fā)模式在一定程度上也降低了靈活性,但其規(guī)模效益是非常好的,否則阿里這么龐大的數(shù)據(jù)資產(chǎn)是根本無(wú)法很好管理的,這個(gè)筆者深有體會(huì),正如我們運(yùn)營(yíng)的DACP一樣,我們?cè)庥龅降模麄円惨欢ㄔ庥龅搅恕?/span>指標(biāo)標(biāo)準(zhǔn)化是筆者嘗試過(guò)的事情,因?yàn)楫?dāng)初深感重復(fù)開(kāi)發(fā)的報(bào)表太多了,而通過(guò)指標(biāo)標(biāo)準(zhǔn)化可以解決這類(lèi)問(wèn)題,這是報(bào)表做到一定程度后自然而然產(chǎn)生的想法,以下阿里的做法跟自己當(dāng)初做的如出一轍,所謂殊途同歸。假設(shè)有一位用戶張三,在第一個(gè)手機(jī)上使用百度地圖, 在ipad上觀看百度愛(ài)奇藝視頻,在第二個(gè)手機(jī)上使用手機(jī)百度app, 在pc電腦上使用百度搜索,如何將同一個(gè)用戶在這些不同端的用戶信息聚合起來(lái)呢? 跟運(yùn)營(yíng)商的天然的以手機(jī)號(hào)碼為唯一標(biāo)識(shí)不同,互聯(lián)網(wǎng)公司的各類(lèi)賬號(hào)ID要打通的挑戰(zhàn)是非常高的,ID-MAPPING是互聯(lián)網(wǎng)公司的一個(gè)核心技術(shù),其需要確保各個(gè)領(lǐng)域搜集的數(shù)據(jù)是可以集成和關(guān)聯(lián)分析的,沒(méi)有統(tǒng)一ID的支持,多樣化的數(shù)據(jù)集中起來(lái)分析是沒(méi)有意義的,這是另一種形式的數(shù)據(jù)孤島。比如下面的四條用戶記錄實(shí)際上表明的是同一個(gè)人。這里的“數(shù)據(jù)資產(chǎn)分析”和“數(shù)據(jù)血緣跟蹤”在前面的“數(shù)據(jù)資產(chǎn)管理IPaaS”都已經(jīng)提及,是數(shù)據(jù)管理里非常基本的東西,特別提下數(shù)據(jù)綜合治理。安全:指的是諸如敏感數(shù)據(jù)分級(jí)和訪問(wèn)控制定義。質(zhì)量:指的是數(shù)據(jù)的質(zhì)量規(guī)則定義。成本:指基于數(shù)據(jù)資產(chǎn)的調(diào)用情況和處理成本給出一個(gè)綜合評(píng)估。人員:大概是數(shù)據(jù)資產(chǎn)指歸屬組織和個(gè)人的定義吧,比如我們的數(shù)據(jù)字典里就有一個(gè)屬性,必須標(biāo)識(shí)出這個(gè)資產(chǎn)的創(chuàng)建人、修改人以便跟蹤追責(zé)。主題式數(shù)據(jù)服務(wù):應(yīng)該是基于元數(shù)據(jù)構(gòu)建的簡(jiǎn)單數(shù)據(jù)服務(wù)查詢引擎,面向業(yè)務(wù)統(tǒng)一數(shù)據(jù)出口與數(shù)據(jù)查詢邏輯,屏蔽多數(shù)據(jù)源與多物理表,就是搞一套業(yè)務(wù)化的偽SQL方便取數(shù)。統(tǒng)一而多樣化的服務(wù):一般查詢指普通SQL查詢,OLAP就是多維分析,在線服務(wù)比較抽象,筆者猜測(cè)是諸如數(shù)據(jù)推送、定時(shí)任務(wù)等定制化服務(wù)形式。跨源數(shù)據(jù)服務(wù):大數(shù)據(jù)由于技術(shù)組件非常多,不同的數(shù)據(jù)往往存儲(chǔ)在不同的數(shù)據(jù)庫(kù)內(nèi),比如hadoop,gbase,oracle等等,如果要進(jìn)行跨異構(gòu)數(shù)據(jù)庫(kù)的即席查詢一般就要做先做數(shù)據(jù)匯聚,但一些輕量級(jí)的取數(shù)希望能直接進(jìn)行關(guān)聯(lián)分析得到結(jié)果,因此出現(xiàn)了這種服務(wù)訴求。PPT就解讀到這里,筆者最大的感受就是阿里的數(shù)據(jù)中臺(tái)技術(shù)體系很龐大,但又非常關(guān)注細(xì)節(jié),幾個(gè)字看著簡(jiǎn)單,但落地則需要付出巨大的代價(jià),而且是個(gè)漸進(jìn)的過(guò)程,比如Dataphin。如要要了解阿里數(shù)據(jù)中臺(tái)的更多技術(shù)細(xì)節(jié),推薦一本書(shū)《阿里巴巴大數(shù)據(jù)實(shí)踐》。其實(shí)數(shù)據(jù)中臺(tái)要搞好不是簡(jiǎn)單的引進(jìn)幾個(gè)工具就可以了,技術(shù)僅僅是技術(shù),你能COPY技術(shù)但COPY不了管理和文化,而這恰恰是數(shù)據(jù)中臺(tái)成功的關(guān)鍵。數(shù)據(jù)中臺(tái)的更大挑戰(zhàn)是:你的企業(yè)對(duì)于數(shù)據(jù)的理解是否已經(jīng)達(dá)到了一定的階段,你是否能夠驅(qū)動(dòng)公司去建立一套適合自己企業(yè)的數(shù)據(jù)管理機(jī)制和流程,而這個(gè)是最難的,你得走出自己的路。
|