對(duì)于數(shù)據(jù)倉(cāng)庫(kù)以及ETL的知識(shí),我基本上是個(gè)門(mén)外漢。一切都得從頭開(kāi)始,記個(gè)筆記,方便自已了解學(xué)習(xí)進(jìn)度。
首先,我們來(lái)了解最基本的定義: 嗯,也有人將ETL簡(jiǎn)單稱為數(shù)據(jù)抽取。至少在未學(xué)習(xí)之前,領(lǐng)導(dǎo)告訴我的是,你需要做一個(gè)數(shù)據(jù)抽取的工具。 其實(shí)呢,抽取是ETL中的關(guān)鍵環(huán)節(jié),顧名思義,也就將數(shù)據(jù)從不同的數(shù)據(jù)源中抓取(復(fù)制)出來(lái)。 太簡(jiǎn)單了! 上面的解釋無(wú)首無(wú)尾,有點(diǎn)象能讓你吃飽的第七個(gè)燒餅, 仔細(xì)一想,抽取是不可能單獨(dú)存在,我們需要將與之關(guān)聯(lián)的一些其它環(huán)節(jié)拿出來(lái)。 于是,得到ETL的定義: 抽取的源在哪里? 抽取源:大多數(shù)情況下,可以認(rèn)為是關(guān)系數(shù)據(jù)庫(kù),專業(yè)一點(diǎn),就是事務(wù)處理系統(tǒng)(OLTP)。當(dāng)然,廣義一點(diǎn),可能會(huì)是其它數(shù)據(jù)庫(kù)或者是文件系統(tǒng)。 然后,我們來(lái)看看為什么要ETL? 最后,總結(jié)一下, OK,要將生米變?yōu)槭祜?,鴨子放上大盤(pán),一堆廢話之后,我得先看看廚房里都有了一些啥? |
|
來(lái)自: 荷露叮咚 > 《商業(yè)智能》