目錄 - 數(shù)據(jù)庫分類維度:關(guān)系型/非關(guān)系型、交易型/分析型 - NoSQL數(shù)據(jù)庫的進(jìn)一步分類 - OLTP市場(chǎng)規(guī)模:關(guān)系型數(shù)據(jù)庫仍占營收大頭 - 數(shù)據(jù)庫市場(chǎng)份額:云服務(wù)和新興廠商主導(dǎo)NoSQL - 開源數(shù)據(jù)庫 vs. 商業(yè)數(shù)據(jù)庫 - 數(shù)據(jù)庫三大陣營:傳統(tǒng)廠商和云服務(wù)提供商 最近由于時(shí)間原因我寫東西少了,在公眾號(hào)上也轉(zhuǎn)載過幾篇搞數(shù)據(jù)庫朋友的大作。按說我算是外行,沒資格在這個(gè)領(lǐng)域品頭論足,而當(dāng)我看到下面這份報(bào)告時(shí)立即產(chǎn)生了學(xué)習(xí)的興趣,同時(shí)也想就能看懂的部分寫點(diǎn)心得體會(huì)分享給大家。 可能本文比較適合普及性閱讀,讓數(shù)據(jù)庫領(lǐng)域資深的朋友見笑了:) 來自Willian Blair的《Database Software Market:The Long-Awaited Shake-up》,文末我會(huì)提供原報(bào)告出處。或者關(guān)注本公眾號(hào),從后臺(tái)留言“database”獲取下載鏈接。 數(shù)據(jù)庫分類維度:關(guān)系型/非關(guān)系型、交易型/分析型 首先是分類維度,上圖中的縱軸分類為Relational Database(關(guān)系型數(shù)據(jù)庫,RDBMS)和Nonrelational Database (非關(guān)系型數(shù)據(jù)庫,NoSQL),橫軸的分類為Operational(交易型,即OLTP)和Analytical(分析型,即OLAP)。 按照習(xí)慣我們先看關(guān)系型數(shù)據(jù)庫,左上角的交易型類別中包括大家熟悉的商業(yè)數(shù)據(jù)庫Oracle、MS SQL Server、DB2、Infomix,也包括開源領(lǐng)域流行的MySQL(MariaDB是它的一個(gè)分支)、PostgreSQL,還有云上面比較常見的SQL Azure和Amazon Aurora等。 比較有意思的是,SAP HANA正好位于交易型和分析型的中間分界處,不要忘了SAP還收購了Sybase,盡管后者今天不夠風(fēng)光了,而早年微軟的SQL Server都是來源于Sybase。Sybase的ASE數(shù)據(jù)庫和分析型Sybase IQ還是存在的。 右上角的分析型產(chǎn)品中包括幾款知名的列式數(shù)據(jù)倉庫Pivotal Greenplum、Teradata和IBM Netezza(已宣布停止支持),來自互聯(lián)網(wǎng)巨頭的Google Big Query和Amazon RedShift。至于Oracle Exadata一體機(jī),它上面運(yùn)行的也是Oracle數(shù)據(jù)庫,其最初設(shè)計(jì)用途是OLAP,而在后來發(fā)展中也可以良好兼顧OLTP,算是一個(gè)跨界產(chǎn)品吧。 再來看非關(guān)系型數(shù)據(jù)庫,左下角的交易型產(chǎn)品中,有幾個(gè)我看著熟悉的MongoDB、Redis、Amazon DynamoDB和DocumentDB等;右下角的分析型產(chǎn)品包括著名的Hadoop分支Cloudera、Hortonworks(這2家已并購),Bigtable(來自Google,Hadoop中的HBase是它的開源實(shí)現(xiàn))、Elasticsearch等。 顯然非關(guān)系型數(shù)據(jù)庫的分類要更加復(fù)雜,產(chǎn)品在應(yīng)用中的差異化也比傳統(tǒng)關(guān)系型數(shù)據(jù)庫更大。Willian Blair很負(fù)責(zé)任地對(duì)它們給出了進(jìn)一步的分類。 NoSQL數(shù)據(jù)庫的進(jìn)一步分類 上面這個(gè)圖表應(yīng)該說很清晰了。非關(guān)系型數(shù)據(jù)庫可以分為Document-based Store(基于文檔的存儲(chǔ))、Key-Value Store(鍵值存儲(chǔ))、Graph-based(圖數(shù)據(jù)庫)、Time Series(時(shí)序數(shù)據(jù)庫),以及Wide Cloumn-based Store(寬列式存儲(chǔ))。 我們?cè)賮砜聪旅總€(gè)細(xì)分類別中的產(chǎn)品: 文檔存儲(chǔ):MongoDB、Amazon DocumentDB、Azure Cosmos DB等 Key-Value存儲(chǔ):Redis Labs、Oracle Berkeley DB、Amazon DynamoDB、Aerospike等 圖數(shù)據(jù)庫:Neo4j等 時(shí)序數(shù)據(jù)庫:InfluxDB等 WideCloumn:DataStax、Cassandra、Apache HBase和Bigtable等 多模型數(shù)據(jù)庫:支持上面不只一種類別特性的NoSQL,比如MongoDB、Redis Labs、Amazon DynamoDB和Azure Cosmos DB等。 OLTP市場(chǎng)規(guī)模:關(guān)系型數(shù)據(jù)庫仍占營收大頭 上面這個(gè)基于IDC數(shù)據(jù)的交易型數(shù)據(jù)庫市場(chǎng)份額共有3個(gè)分類,其中深藍(lán)色部分的關(guān)系型數(shù)據(jù)庫(RDBMS,在這里不統(tǒng)計(jì)數(shù)據(jù)挖掘/分析型數(shù)據(jù)庫)占據(jù)80%以上的市場(chǎng)。 Dynamic Database(DDMS,動(dòng)態(tài)數(shù)據(jù)庫管理系統(tǒng),同樣不統(tǒng)計(jì)Hadoop)就是我們前面聊的非關(guān)系型數(shù)據(jù)庫。這部分市場(chǎng)顯得?。ǖl(fā)展勢(shì)頭看好),我覺得與互聯(lián)網(wǎng)等大公司多采用開源+自研,而不買商業(yè)產(chǎn)品有關(guān)。 而遵循IDC的統(tǒng)計(jì)分類,在上圖灰色部分的“非關(guān)系型數(shù)據(jù)庫市場(chǎng)”其實(shí)另有定義,參見下面這段文字: 數(shù)據(jù)庫市場(chǎng)份額:云服務(wù)和新興廠商主導(dǎo)NoSQL 請(qǐng)注意,這里的關(guān)系型數(shù)據(jù)庫統(tǒng)計(jì)又包含了分析型產(chǎn)品。Oracle營收份額42%仍居第一,隨后排名依次為微軟、IBM、SAP和Teradata。 代表非關(guān)系型數(shù)據(jù)庫的DDMS分類中(這里同樣加入Hadoop等),云服務(wù)和新興廠商成為了主導(dǎo),微軟應(yīng)該是因?yàn)樵芐QL Server的基礎(chǔ)而小幅領(lǐng)先于AWS,這2家一共占據(jù)超過50%的市場(chǎng),接下來的排名是Google、Cloudera和Hortonworks(二者加起來13%)。 上面是IDC傳統(tǒng)分類中的“非關(guān)系型數(shù)據(jù)庫”,在這里IBM和CA等應(yīng)該主要是針對(duì)大型機(jī)的產(chǎn)品,InterSystems有一款在國內(nèi)醫(yī)療HIS系統(tǒng)中應(yīng)用的Caché數(shù)據(jù)庫(以前也是運(yùn)行在Power小機(jī)上比較多)。我就知道這些,余下的就不瞎寫了。 開源數(shù)據(jù)庫 vs. 商業(yè)數(shù)據(jù)庫 按照流行度來看,開源數(shù)據(jù)庫從2013年到現(xiàn)在一直呈現(xiàn)增長,已經(jīng)快要追上商業(yè)數(shù)據(jù)庫了。 商業(yè)產(chǎn)品在關(guān)系型數(shù)據(jù)庫的占比仍然高達(dá)60.5%,而上表中從這列往左的分類都是開源占優(yōu): Wide Cloumn:開源占比81.8%; 時(shí)序數(shù)據(jù)庫:開源占比80.7%; 文檔存儲(chǔ):開源占比80.0%; Key-Value存儲(chǔ):開源占比72.2%; 圖數(shù)據(jù)庫:開源占比68.4%; 搜索引擎:開源占比65.3% 按照開源License的授權(quán)模式,上面這個(gè)三角形越往下管的越寬松。比如MySQL屬于GPL,在互聯(lián)網(wǎng)行業(yè)用戶較多;而PostgreSQL屬于BSD授權(quán),國內(nèi)有不少數(shù)據(jù)庫公司的產(chǎn)品就是基于Postgre哦。 數(shù)據(jù)庫三大陣營:傳統(tǒng)廠商和云服務(wù)提供商 前面在討論市場(chǎng)份額時(shí),我提到過交易型數(shù)據(jù)庫的4個(gè)巨頭仍然是Oracle、微軟、IBM和SAP,在這里William Blair將他們歸為第一陣營。 隨著云平臺(tái)的不斷興起,AWS、Azure和GCP(Google Cloud Platform)組成了另一個(gè)陣營,在國外分析師的眼里還沒有BAT,就像有的朋友所說,國內(nèi)互聯(lián)網(wǎng)巨頭更多是自身業(yè)務(wù)導(dǎo)向的,在本土發(fā)展公有云還有些優(yōu)勢(shì),短時(shí)間內(nèi)將技術(shù)輸出到國外的難度應(yīng)該還比較大。(當(dāng)然我并不認(rèn)為國內(nèi)缺優(yōu)秀的DBA和研發(fā)人才) 第三個(gè)陣容就是規(guī)模小一些,但比較專注的數(shù)據(jù)庫玩家。 接下來我再帶大家簡單過一下這前兩個(gè)陣容,看看具體的數(shù)據(jù)庫產(chǎn)品都有哪些。 甲骨文的產(chǎn)品,我相對(duì)熟悉一些的有Oracle Database、MySQL以及Exadata一體機(jī)。 IBM DB2也是一個(gè)龐大的家族,除了傳統(tǒng)針對(duì)小型機(jī)、x86(好像用的人不多)、z/OS大型機(jī)和for i的版本之外,如今也有了針對(duì)云和數(shù)據(jù)挖掘的產(chǎn)品。記得抱枕大師對(duì)Informix的技術(shù)比較推崇,可惜這個(gè)產(chǎn)品發(fā)展似乎不太理想。 微軟除了看家的SQL Server之外,在Azure云上還能提供MySQL、PostgreSQL和MariaDB開源數(shù)據(jù)庫。應(yīng)該說他們是傳統(tǒng)軟件License+PaaS服務(wù)兩條腿走路的。 如今人們一提起SAP的數(shù)據(jù)庫就想起HANA,之前從Sybase收購來的ASE(Adaptive Server Enterprise)和IQ似乎沒有之前發(fā)展好了。 在云服務(wù)提供商數(shù)據(jù)庫的3巨頭中,微軟有SQL Server的先天優(yōu)勢(shì),甚至把它移植到了Linux擁抱開源平臺(tái)。關(guān)系型數(shù)據(jù)庫的創(chuàng)新方面值得一提的是Amazon Aurora和Google Spanner(也有非關(guān)系型特性),至于它們具體好在哪里我就不裝內(nèi)行了:) 非關(guān)系型數(shù)據(jù)庫則是Amazon全面開花,這與其云計(jì)算業(yè)務(wù)發(fā)展早并且占據(jù)優(yōu)勢(shì)有關(guān)。Google當(dāng)年的三篇經(jīng)典論文對(duì)業(yè)界影響深遠(yuǎn),Yahoo基于此開源的Hadoop有一段時(shí)間幾乎是大數(shù)據(jù)的代名詞。HBase和Hive如今已不再是人們討論的熱點(diǎn),而Bigtable和BigQuery似乎仍然以服務(wù)Google自身業(yè)務(wù)為主,畢竟GCP的規(guī)模比AWS要小多了。 最后這張DB-Engines的排行榜,相信許多朋友都不陌生,今年3月已經(jīng)不是最新的數(shù)據(jù),在這里列出只是給大家一個(gè)參考。該排行榜幾乎在每次更新時(shí),都會(huì)有國內(nèi)數(shù)據(jù)庫專家撰寫點(diǎn)評(píng)。 以上是我周末的學(xué)習(xí)筆記,班門弄斧,希望對(duì)大家有幫助。 參考資料《Database Software Market:The Long-Awaited Shake-up》 https:///wp-content/uploads/2019/03/Database-Software-Market-White-Paper.pdf |
|