一区二区三区日韩精品-日韩经典一区二区三区-五月激情综合丁香婷婷-欧美精品中文字幕专区

分享

干貨:數(shù)據(jù)倉庫基礎(chǔ)知識(全)

 張問驊 2021-07-15

圖片

圖片

1、什么是數(shù)據(jù)倉庫?

權(quán)威定義:數(shù)據(jù)倉庫是一個(gè)面向主題的、集成的、相對穩(wěn)定的、反映歷史變化的數(shù)據(jù)集合,用于支持管理決策。

1)數(shù)據(jù)倉庫是用于支持決策、面向分析型數(shù)據(jù)處理;

2)對多個(gè)異構(gòu)的數(shù)據(jù)源有效集成,集成后按照主題進(jìn)行重組,并包含歷史數(shù)據(jù),而且存放在數(shù)據(jù)倉庫中的數(shù)據(jù)一般不再修改。

面對大數(shù)據(jù)的多樣性,在存儲和處理這些大數(shù)據(jù)時(shí),我們就必須要知道兩個(gè)重要的技術(shù)。

分別是:數(shù)據(jù)倉庫技術(shù)、Hadoop。當(dāng)數(shù)據(jù)為結(jié)構(gòu)化數(shù)據(jù),來自傳統(tǒng)的數(shù)據(jù)源,則采用數(shù)據(jù)倉庫技術(shù)來存儲和處理這些數(shù)據(jù),如下圖:
圖片

2、數(shù)據(jù)倉庫和數(shù)據(jù)庫的區(qū)別?
目標(biāo)、用途、設(shè)計(jì)來說。
1)數(shù)據(jù)庫是面向事務(wù)處理的,數(shù)據(jù)是由日常的業(yè)務(wù)產(chǎn)生的,并且是頻繁更新的;數(shù)據(jù)倉庫是面向主題的,數(shù)據(jù)來源多樣化,經(jīng)過一定的規(guī)則轉(zhuǎn)換得到的,用于分析和決策;
2)數(shù)據(jù)庫一般用來存儲當(dāng)前事務(wù)性數(shù)據(jù),如交易數(shù)據(jù);數(shù)據(jù)倉庫一般存儲的是歷史數(shù)據(jù);
3)數(shù)據(jù)庫設(shè)計(jì)一般符合三范式,有最大的精確度和最小的冗余度,有利于數(shù)據(jù)的插入;數(shù)據(jù)倉庫設(shè)計(jì)一般不符合三范式,有利于查詢。

3、如何構(gòu)建數(shù)據(jù)倉庫?

數(shù)據(jù)倉庫模型的選擇是靈活的,不局限與某種模型方法;
數(shù)據(jù)倉庫數(shù)據(jù)是靈活的,以實(shí)際需求場景為導(dǎo)向;
數(shù)倉設(shè)計(jì)要兼顧靈活性、可擴(kuò)展性、要考慮技術(shù)可靠性和實(shí)現(xiàn)成本。
1)調(diào)研:業(yè)務(wù)調(diào)研、需求調(diào)研、數(shù)據(jù)調(diào)研
2)劃分主題域:通過業(yè)務(wù)調(diào)研、需求調(diào)研、數(shù)據(jù)調(diào)研最終確定主題域
3)構(gòu)建總線矩陣、維度建模
總線矩陣:把總線架構(gòu)列表形成矩陣形式,行表示業(yè)務(wù)處理過程,即事實(shí),列表示一致性的維度,在交叉點(diǎn)上打上標(biāo)記表示該業(yè)務(wù)處理過程與該維度相關(guān)(交叉探查)
4)設(shè)計(jì)數(shù)倉分層架構(gòu)
5)模型落地
6)數(shù)據(jù)治理
4、什么是數(shù)據(jù)中臺?
數(shù)據(jù)中臺是通過數(shù)據(jù)技術(shù),對海量數(shù)據(jù)進(jìn)行采集、計(jì)算、存儲、加工,同時(shí)統(tǒng)一標(biāo)準(zhǔn)和口徑。數(shù)據(jù)中臺把數(shù)據(jù)統(tǒng)一之后,會(huì)形成標(biāo)準(zhǔn)數(shù)據(jù),再進(jìn)行存儲,形成大數(shù)據(jù)資產(chǎn)層,進(jìn)而為客戶提供高效服務(wù)。
這些服務(wù)和企業(yè)的業(yè)務(wù)有較強(qiáng)關(guān)聯(lián)性,是企業(yè)所獨(dú)有且能復(fù)用的,他是企業(yè)業(yè)務(wù)和數(shù)據(jù)的積淀,其不僅能降低重復(fù)建設(shè),減少煙囪式協(xié)助的成本,也是差異化競爭的優(yōu)勢所在。
數(shù)據(jù)中臺是通過整合公司開發(fā)工具、打通全域數(shù)據(jù)、讓數(shù)據(jù)持續(xù)為業(yè)務(wù)賦能,實(shí)現(xiàn)數(shù)據(jù)平臺化、數(shù)據(jù)服務(wù)化和數(shù)據(jù)價(jià)值化。
數(shù)據(jù)中臺更加側(cè)重于“復(fù)用”和“業(yè)務(wù)”。
5、數(shù)據(jù)中臺、數(shù)據(jù)倉庫、大數(shù)據(jù)平臺、數(shù)據(jù)湖的關(guān)鍵區(qū)別是什么?
  • 1)基礎(chǔ)能力上的區(qū)別

數(shù)據(jù)平臺:提供的是計(jì)算和存儲能力
數(shù)據(jù)倉庫:利用數(shù)據(jù)平臺提供的計(jì)算和存儲能力,在一套方法論的指導(dǎo)下建設(shè)的一整套的數(shù)據(jù)表
數(shù)據(jù)中臺:包含了數(shù)據(jù)平臺和數(shù)據(jù)倉庫的所有內(nèi)容,將其打包,并且以更加整合以及更加產(chǎn)品化的方式對外提供服務(wù)和價(jià)值
數(shù)據(jù)湖:一個(gè)存儲企業(yè)各種各樣原始數(shù)據(jù)的大型倉庫,包括結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù),其中湖里的數(shù)據(jù)可供存取、處理、分析和傳輸
  • 2)業(yè)務(wù)能力上的區(qū)別

數(shù)據(jù)平臺:為業(yè)務(wù)提供數(shù)據(jù)主要方式是提供數(shù)據(jù)集
數(shù)據(jù)倉庫:相對具體的功能概念是存儲和管理一個(gè)或多個(gè)主題數(shù)據(jù)的集合,為業(yè)務(wù)提供服務(wù)的方式主要是分析報(bào)表
數(shù)據(jù)中臺:企業(yè)級的邏輯概念,體現(xiàn)企業(yè)數(shù)據(jù)產(chǎn)生價(jià)值的能力,為業(yè)務(wù)提供服務(wù)的主要方式是數(shù)據(jù)API
數(shù)據(jù)湖:數(shù)據(jù)倉庫的數(shù)據(jù)來源
總的來說,數(shù)據(jù)中臺距離業(yè)務(wù)更近,數(shù)據(jù)復(fù)用能力更強(qiáng),能為業(yè)務(wù)提供速度更快的服務(wù),數(shù)據(jù)中臺在數(shù)據(jù)倉庫和數(shù)據(jù)平臺的基礎(chǔ)上,將數(shù)據(jù)生產(chǎn)為一個(gè)個(gè)數(shù)據(jù)API服務(wù),以更高效的方式提供給業(yè)務(wù)。數(shù)據(jù)中臺可以建立在數(shù)據(jù)倉庫和數(shù)據(jù)平臺之上,是加速企業(yè)從數(shù)據(jù)到業(yè)務(wù)價(jià)值的過程的中間層。
6、大數(shù)據(jù)有哪些相關(guān)的系統(tǒng)?
數(shù)倉設(shè)計(jì)中心:按照主題域、業(yè)務(wù)過程,分層的設(shè)計(jì)方式,以維度建模作為基本理論依據(jù),按照維度、度量設(shè)計(jì)模型,確保模型、字段有統(tǒng)一的命名規(guī)范
數(shù)據(jù)資產(chǎn)中心:梳理數(shù)據(jù)資產(chǎn),基于數(shù)據(jù)血緣,數(shù)據(jù)的訪問熱度,做成本的治理
數(shù)據(jù)質(zhì)量中心:通過豐富的稽查監(jiān)控系統(tǒng),對數(shù)據(jù)進(jìn)行事后校驗(yàn),確保問題數(shù)據(jù)第一時(shí)間被發(fā)現(xiàn),避免下游的無效計(jì)算,分析數(shù)據(jù)的影響范圍。
指標(biāo)系統(tǒng):管理指標(biāo)的業(yè)務(wù)口徑、計(jì)算邏輯和數(shù)據(jù)來源,通過流程化的方式,建立從指標(biāo)需求、指標(biāo)開發(fā)、指標(biāo)發(fā)布的全套協(xié)作流程
數(shù)據(jù)地圖:提供元數(shù)據(jù)的快速索引,數(shù)據(jù)字典、數(shù)據(jù)血緣、數(shù)據(jù)特征信息的查詢,相當(dāng)于元數(shù)據(jù)中心的門戶。
7、如何建設(shè)數(shù)據(jù)中臺?
數(shù)據(jù)中臺在企業(yè)落地實(shí)踐時(shí),結(jié)合技術(shù)、產(chǎn)品、數(shù)據(jù)、服務(wù)、運(yùn)營等方面,逐步開展相關(guān)工作
1)理現(xiàn)狀:了解業(yè)務(wù)現(xiàn)狀、數(shù)據(jù)現(xiàn)狀、IT現(xiàn)狀、現(xiàn)有的組織架構(gòu)
2)定架構(gòu):確認(rèn)業(yè)務(wù)架構(gòu)、技術(shù)架構(gòu)、應(yīng)用架構(gòu)、組織架構(gòu)
3)建資產(chǎn):建立貼近數(shù)據(jù)層、統(tǒng)一數(shù)倉層、標(biāo)簽數(shù)據(jù)層、應(yīng)用數(shù)據(jù)層
4)用數(shù)據(jù):對數(shù)據(jù)進(jìn)行輸出、應(yīng)用
5)數(shù)據(jù)運(yùn)營:持續(xù)運(yùn)營、持續(xù)迭代
中臺建設(shè)需要有全員共識,由管理層從上往下推進(jìn),由技術(shù)和業(yè)務(wù)人員去執(zhí)行和落地是一個(gè)漫長的過程,在實(shí)施數(shù)據(jù)中臺時(shí),最困難的地方就是需要有人推動(dòng)。

8、數(shù)據(jù)倉庫最重要的是什么?

個(gè)人認(rèn)為是數(shù)據(jù)集成數(shù)據(jù)質(zhì)量!
企業(yè)的數(shù)據(jù)通常存儲在多個(gè)異構(gòu)數(shù)據(jù)庫中,要進(jìn)行分析,必須對數(shù)據(jù)進(jìn)行一致性整合,整合后才能對數(shù)據(jù)進(jìn)行分析挖掘出潛在的價(jià)值;
數(shù)據(jù)質(zhì)量必須有保障,數(shù)據(jù)質(zhì)量不過關(guān),別人怎么會(huì)使用你的數(shù)據(jù)?

9、概念模型、邏輯模型、物理模型分別介紹一下?

1)概念模型CDM:概念模型是最終用戶對數(shù)據(jù)存儲的看法,反映了最終用戶綜合性的信息需求,以數(shù)據(jù)類的方式描述企業(yè)級的數(shù)據(jù)需求
概念模型的內(nèi)容包括重要的實(shí)體與實(shí)體之間的關(guān)系,在概念模型中不包含實(shí)體的屬性,也不包含定義實(shí)體的主鍵
概念模型的目的是統(tǒng)一業(yè)務(wù)概念,作為業(yè)務(wù)人員和技術(shù)人員之間的溝通橋梁,確定不同實(shí)體之間的最高層次的關(guān)系
2)邏輯模型LDM:邏輯模型反映的是系統(tǒng)分析人員對數(shù)據(jù)存儲的觀點(diǎn),是對概念模型的進(jìn)一步分解和細(xì)化,邏輯模型是根據(jù)業(yè)務(wù)規(guī)則確定的,關(guān)于業(yè)務(wù)對象,業(yè)務(wù)對象的數(shù)據(jù)項(xiàng)以及業(yè)務(wù)對象之間關(guān)系的基本藍(lán)圖
邏輯模型的內(nèi)容包括所有的實(shí)體和關(guān)系,確定每個(gè)實(shí)體的屬性,定義每個(gè)實(shí)體的主鍵,指定實(shí)體的外鍵,需要進(jìn)行范式化處理
邏輯模型的目標(biāo)是盡可能詳細(xì)的描述數(shù)據(jù),并不考慮物理上如何實(shí)現(xiàn)
3)物理模型PDM:物理模型是在邏輯模型的基礎(chǔ)上,考慮各種具體的技術(shù)實(shí)現(xiàn)因素,進(jìn)行數(shù)據(jù)體系結(jié)構(gòu)設(shè)計(jì),真正實(shí)現(xiàn)數(shù)據(jù)在數(shù)據(jù)倉庫中的存放
物理模型的內(nèi)容包括確定所有的表和列,定義外鍵用確認(rèn)表之間的關(guān)系,基于用戶的需求可能要進(jìn)行反范式化等內(nèi)容

10、SCD常用的處理方式有哪些?

slowly changing dimensions 緩慢變化維度
常見的緩慢變化維處理方式有三種:
1)直接覆蓋:不記錄歷史數(shù)據(jù),薪數(shù)據(jù)覆蓋舊數(shù)據(jù)
2)新加一行數(shù)據(jù)(縱向擴(kuò)展):使用代理主鍵+生效失效時(shí)間或者是代理主鍵+生效失效標(biāo)識(保存多條記錄,直接新添一條記錄,同時(shí)保留原有記錄,并用單獨(dú)的專用字段保存)
3)新加兩個(gè)字段(橫向擴(kuò)展):一個(gè)是previous,一個(gè)是current,每次更新只更新這兩個(gè)值,但是這樣職能保留最近兩次的變化(添加歷史列,用不同的字段保存變化痕跡,因?yàn)橹槐4鎯纱巫兓涗?,使用與變化不超過兩次的維度)

11、怎么理解元數(shù)據(jù)?

1、業(yè)務(wù)元數(shù)據(jù)
  • 描述 '數(shù)據(jù)'背后的業(yè)務(wù)含義。

  • 主題定義:每段 ETL、表背后的歸屬業(yè)務(wù)主題。

  • 業(yè)務(wù)描述:每段代碼實(shí)現(xiàn)的具體業(yè)務(wù)邏輯。

  • 標(biāo)準(zhǔn)指標(biāo):類似于 BI 中的語義層、數(shù)倉中的一致性事實(shí);將分析中的指標(biāo)進(jìn)行規(guī)范化。

  • 標(biāo)準(zhǔn)維度:同標(biāo)準(zhǔn)指標(biāo),對分析的各維度定義實(shí)現(xiàn)規(guī)范化、標(biāo)準(zhǔn)化。

  • 不斷的進(jìn)行維護(hù)且與業(yè)務(wù)方進(jìn)行溝通確認(rèn)。

2、技術(shù)元數(shù)據(jù)
數(shù)據(jù)源元數(shù)據(jù):例如:數(shù)據(jù)源的 IP、端口、數(shù)據(jù)庫類型;數(shù)據(jù)獲取的方式;數(shù)據(jù)存儲的結(jié)構(gòu);原數(shù)據(jù)各列的定義及 key 指對應(yīng)的值。
ETL 元數(shù)據(jù):
  1. 根據(jù) ETL 目的的不同,可以分為兩類:數(shù)據(jù)清洗元數(shù)據(jù);數(shù)據(jù)處理元數(shù)據(jù)。

  2. 數(shù)據(jù)清洗,主要目的是為了解決掉臟數(shù)據(jù)及規(guī)范數(shù)據(jù)格式;因此此處元數(shù)據(jù)主要為:各表各列的'正確'數(shù)據(jù)規(guī)則;默認(rèn)數(shù)據(jù)類型的'正確'規(guī)則。

  3. 數(shù)據(jù)處理,例如常見的表輸入表輸出;非結(jié)構(gòu)化數(shù)據(jù)結(jié)構(gòu)化;特殊字段的拆分等。源數(shù)據(jù)到數(shù)倉、數(shù)據(jù)集市層的各類規(guī)則。比如內(nèi)容、清理、數(shù)據(jù)刷新規(guī)則。

數(shù)據(jù)倉庫元數(shù)據(jù):
數(shù)據(jù)倉庫結(jié)構(gòu)的描述,包括倉庫模式、視圖、維、層次結(jié)構(gòu)及數(shù)據(jù)集市的位置和內(nèi)容;業(yè)務(wù)系統(tǒng)、數(shù)據(jù)倉庫和數(shù)據(jù)集市的體系結(jié)構(gòu)和模式等。
BI 元數(shù)據(jù):
匯總用的算法、包括各類度量和維度定義算法。數(shù)據(jù)粒度、主題領(lǐng)域、聚集、匯總、預(yù)定義的查詢與報(bào)告。
3、管理元數(shù)據(jù)
管理領(lǐng)域相關(guān),包括管理流程、人員組織、角色職責(zé)等。

12、數(shù)倉如何確定主題域?

主題是在較高層次上將數(shù)據(jù)進(jìn)行綜合、歸類和分析利用的一個(gè)抽象概念,每一個(gè)主題基本對應(yīng)一個(gè)宏觀的分析領(lǐng)域,在邏輯意義上,他是對企業(yè)中某一宏觀分析領(lǐng)域所涉及的分析對象。
面向主題的數(shù)據(jù)組織方式,就是在較高層次上對分析對象的數(shù)據(jù)的一個(gè)完整并且一致的描述,能刻畫各個(gè)分析對象所涉及的企業(yè)各項(xiàng)數(shù)據(jù),以及數(shù)據(jù)之間的聯(lián)系。
主題域通常是聯(lián)系較為機(jī)密的數(shù)據(jù)主題的集合,可以根據(jù)業(yè)務(wù)的關(guān)注度,將這些數(shù)據(jù)主題劃分到不同的主題域(也就是說對某個(gè)主題進(jìn)行分析后確定的主題的邊界)。
關(guān)于主題域的劃分,可以考慮幾方面:
1、按照業(yè)務(wù)或者業(yè)務(wù)過程劃分:比如一個(gè)靠銷售廣告位置的門戶網(wǎng)站主題域可能會(huì)有廣告域,客戶域等,而廣告域可能就會(huì)有廣告的庫存,銷售分析、內(nèi)部投放分析等主題;
2、根據(jù)需求方劃分:比如需求方為財(cái)務(wù)部,就可以設(shè)定對應(yīng)的財(cái)務(wù)主題域,而財(cái)務(wù)主題域里面可能就會(huì)有員工工資分析,投資回報(bào)比分析等主題;
3、按照功能或者應(yīng)用劃分::比如微信中的朋友圈數(shù)據(jù)域、群聊數(shù)據(jù)域等,而朋友圈數(shù)據(jù)域可能就會(huì)有用戶動(dòng)態(tài)信息主題、廣告主題等;
4、按照部門劃分:比如可能會(huì)有運(yùn)營域、技術(shù)域等,運(yùn)營域中可能會(huì)有工資支出分析、活動(dòng)宣傳效果分析等主題;
總而言之,切入的出發(fā)點(diǎn)邏輯不一樣,就可以存在不同的劃分邏輯。在建設(shè)過程中可采用迭代方式,不糾結(jié)于一次完成所有主題的抽象,可先從明確定義的主題開始,后續(xù)逐步歸納總結(jié)成自身行業(yè)的標(biāo)準(zhǔn)模型。

13、如何控制數(shù)據(jù)質(zhì)量?

1)校驗(yàn)機(jī)制,每天對比數(shù)據(jù)量,比如count()早發(fā)現(xiàn),早修復(fù)
2)數(shù)據(jù)內(nèi)容的比對,抽樣對比
3)復(fù)盤、每月做一次全量

14、模型設(shè)計(jì)的思路?業(yè)務(wù)驅(qū)動(dòng)?數(shù)據(jù)驅(qū)動(dòng)?

構(gòu)建數(shù)據(jù)倉庫有兩種方式:自上而下、自下而上
Bill Inmon推崇自上而下的方式(這里的上指的是數(shù)據(jù)源出發(fā)),一個(gè)企業(yè)建立唯一的數(shù)據(jù)中心,數(shù)據(jù)是經(jīng)過整合、清洗、去掉臟數(shù)據(jù)、標(biāo)準(zhǔn)的、能夠提供統(tǒng)一的視圖。要從整個(gè)企業(yè)的環(huán)境入手,建立數(shù)據(jù)倉庫,要做很全面的設(shè)計(jì)。偏數(shù)據(jù)驅(qū)動(dòng)
Ralph Kimball推崇自下而上的方式(這里的下指的是從業(yè)務(wù)需求出發(fā)),認(rèn)為數(shù)據(jù)倉庫應(yīng)該按照實(shí)際的應(yīng)用需求,架子啊需要的數(shù)據(jù),不需要的數(shù)據(jù)不要加載到數(shù)據(jù)倉庫中。這種方式建設(shè)周期短,用戶能很快看到結(jié)果。偏業(yè)務(wù)驅(qū)動(dòng)

15、為什么需要數(shù)據(jù)倉庫建模?

數(shù)倉建模需要按照一定的數(shù)據(jù)模型,對整個(gè)企業(yè)的數(shù)據(jù)進(jìn)行采集,整理,提供跨部門、完全一致的報(bào)表數(shù)據(jù)。
合適的數(shù)據(jù)模型,對于大數(shù)據(jù)處理來講,可以獲得得更好的性能、成本、效率和質(zhì)量。良好的模型可以幫助我們快速查詢數(shù)據(jù),減少不必要的數(shù)據(jù)冗余,提高用戶的使用效率。
數(shù)據(jù)建模進(jìn)行全方面的業(yè)務(wù)梳理,改進(jìn)業(yè)務(wù)流程,消滅信息孤島,更好的推進(jìn)數(shù)倉系統(tǒng)的建設(shè)。

16、數(shù)據(jù)倉庫建模方法有哪些?

維度模型
維度建模按數(shù)據(jù)組織類型劃分可分為星型模型、雪花模型、星座模型。
Kimball老爺爺維度建模四個(gè)步驟:
選擇業(yè)務(wù)處理過程 > 定義粒度 > 選擇維度 > 確定事實(shí)
  • 星型模型

星型模型主要是維表和事實(shí)表,以事實(shí)表為中心,所有維度直接關(guān)聯(lián)在事實(shí)表上,呈星型分布。
  • 雪花模型

雪花模型,在星型模型的基礎(chǔ)上,維度表上又關(guān)聯(lián)了其他維度表。這種模型維護(hù)成本高,性能方面也較差,所以一般不建議使用。尤其是基于hadoop體系構(gòu)建數(shù)倉,減少join就是減少shuffle,性能差距會(huì)很大。
星型模型可以理解為,一個(gè)事實(shí)表關(guān)聯(lián)多個(gè)維度表,雪花模型可以理解為一個(gè)事實(shí)表關(guān)聯(lián)多個(gè)維度表,維度表再關(guān)聯(lián)維度表。
  • 星座模型

星座模型,是對星型模型的擴(kuò)展延伸,多張事實(shí)表共享維度表。
星座模型是很多數(shù)據(jù)倉庫的常態(tài),因?yàn)楹芏鄶?shù)據(jù)倉庫都是多個(gè)事實(shí)表的。所以星座模型只反映是否有多個(gè)事實(shí)表,他們之間是否共享一些維度表。
范式模型
即實(shí)體關(guān)系(ER)模型,數(shù)據(jù)倉庫之父Immon提出的,從全企業(yè)的高度設(shè)計(jì)一個(gè)3NF模型,用實(shí)體加關(guān)系描述的數(shù)據(jù)模型描述企業(yè)業(yè)務(wù)架構(gòu),在范式理論上符合3NF。此建模方法,對建模人員的能力要求非常高。
特點(diǎn):設(shè)計(jì)思路自上而下,適合上游基礎(chǔ)數(shù)據(jù)存儲,同一份數(shù)據(jù)只存儲一份,沒有數(shù)據(jù)冗余,方便解耦,易維護(hù),缺點(diǎn)是開發(fā)周期一般比較長,維護(hù)成本高。
Data Vault模型
DataVault由Hub(關(guān)鍵核心業(yè)務(wù)實(shí)體)、Link(關(guān)系)、Satellite(實(shí)體屬性) 三部分組成 ,是Dan Linstedt發(fā)起創(chuàng)建的一種模型方法論,它是在ER關(guān)系模型上的衍生,同時(shí)設(shè)計(jì)的出發(fā)點(diǎn)也是為了實(shí)現(xiàn)數(shù)據(jù)的整合,并非為數(shù)據(jù)決策分析直接使用。
Anchor模型
高度可擴(kuò)展的模型,所有的擴(kuò)展只是添加而不是修改,因此它將模型規(guī)范到6NF,基本變成了K-V結(jié)構(gòu)模型。企業(yè)很少使用。

17、數(shù)倉架構(gòu)為什么要分層?

  • 分層可以清晰數(shù)據(jù)結(jié)構(gòu),使用時(shí)更好的定位和理解

  • 方便追蹤數(shù)據(jù)的血緣關(guān)系

  • 規(guī)范數(shù)據(jù)分層,可以開發(fā)一些通用的中間層數(shù)據(jù),能夠減少極大的重復(fù)計(jì)算

  • 把復(fù)雜的問題簡單化

  • 屏蔽原始數(shù)據(jù)的異常,下游任務(wù)沒有感知異常

    本站是提供個(gè)人知識管理的網(wǎng)絡(luò)存儲空間,所有內(nèi)容均由用戶發(fā)布,不代表本站觀點(diǎn)。請注意甄別內(nèi)容中的聯(lián)系方式、誘導(dǎo)購買等信息,謹(jǐn)防詐騙。如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容,請點(diǎn)擊一鍵舉報(bào)。
    轉(zhuǎn)藏 分享 獻(xiàn)花(0

    0條評論

    發(fā)表

    請遵守用戶 評論公約

    類似文章 更多

    色婷婷激情五月天丁香| 爽到高潮嗷嗷叫之在现观看| 中文字幕日韩一区二区不卡| 精品综合欧美一区二区三区| 欧美日韩校园春色激情偷拍| 久久一区内射污污内射亚洲| 亚洲乱码av中文一区二区三区| 日韩人妻毛片中文字幕| 国产精品自拍杆香蕉视频| 中文字幕亚洲人妻在线视频| 日本高清一道一二三区四五区| 99热中文字幕在线精品| 国产精品不卡高清在线观看 | 欧美精品一区二区三区白虎| 国产精品日韩欧美一区二区| 黄色av尤物白丝在线播放网址| 国产日韩熟女中文字幕| 国产又色又粗又黄又爽| 麻豆最新出品国产精品| 国产免费一区二区三区不卡| 亚洲中文字幕在线综合视频| 中文字幕高清不卡一区| 免费观看成人免费视频| 暴力性生活在线免费视频| 精品少妇一区二区视频| 日本国产欧美精品视频| 国产女同精品一区二区| 丁香七月啪啪激情综合| 亚洲中文字幕剧情在线播放| 自拍偷拍福利视频在线观看| 欧美日韩国产精品黄片| 大香伊蕉欧美一区二区三区| 亚洲av日韩一区二区三区四区| 亚洲国产欧美精品久久| 欧美色婷婷综合狠狠爱| 日韩精品第一区二区三区| 男人和女人干逼的视频| 免费大片黄在线观看国语| 我想看亚洲一级黄色录像| 亚洲高清中文字幕一区二区三区| 亚洲一区二区三区三区|