現(xiàn)在是2016年了!
商業(yè)現(xiàn)實(shí)已經(jīng)改變,所以做出長(zhǎng)遠(yuǎn)的決定變得更有價(jià)值。除此以外,技術(shù)本身也在演化進(jìn)步。Kafka, Storm, Trident, Samza, Spark, Flink, Parquet, Avro, Cloud providers等時(shí)髦的技術(shù)被工程師們和在商業(yè)上廣泛使用. 因此,現(xiàn)代基于Hadoop的 M/R通道 (以及Kafka,現(xiàn)代的二進(jìn)制形式如Avro和數(shù)據(jù)倉(cāng)庫(kù)等。在本例中Amazon Redshift用作ad-hoc查詢) 可能看起來(lái)像這樣: 以上M/R通道看起來(lái)很不錯(cuò),但是它仍然是傳統(tǒng)上具有許多缺點(diǎn)的批處理。由于在新數(shù)據(jù)不斷進(jìn)入系統(tǒng)時(shí),批處理過(guò)程通常需要花費(fèi)很多時(shí)間來(lái)完成,它們主要是提供給終端用戶的乏味的數(shù)據(jù)罷了。 |
|
來(lái)自: 俊在晴空 > 《大數(shù)據(jù)》