一区二区三区日韩精品-日韩经典一区二区三区-五月激情综合丁香婷婷-欧美精品中文字幕专区

分享

關(guān)于MapReduce的一些廢話

 Jcstone 2013-11-08
關(guān)于MapReduce的一些廢話  
 
我的廢話1:
    這篇文章不講述有關(guān)mapreduce的具體技術(shù)和代碼示例,只是談?wù)勎覍?duì)mapreduce初試+摸索階段的感受,所以歡迎各路英雄的板磚向我拋來。
我的廢話2:
     MapReduce 讓運(yùn)算散列 且 并行著。
   MapReduce被業(yè)界認(rèn)定是Google推出,如今也不是什么新的技術(shù),自從Apache的hadoop項(xiàng)目啟動(dòng)以來MapReduce就是整個(gè)Hadoop項(xiàng)目的核心內(nèi)容,Pig、Hive和Hbase都是針對(duì)mapreduce框架的實(shí)現(xiàn)工具,所以對(duì)Hbase、Hive、Pig的深入了解必須對(duì)MapReduce有一定研究,以我自己的理解MapReduce就是把要計(jì)算的大型數(shù)據(jù)集切分成多個(gè)小的分區(qū),根據(jù)這些被劃分的小分區(qū)創(chuàng)建多個(gè)對(duì)應(yīng)的任務(wù)去計(jì)算這些被切分的數(shù)據(jù),在集群的節(jié)點(diǎn)上結(jié)合分區(qū)表分布式的執(zhí)行計(jì)算,中間有調(diào)度器和計(jì)數(shù)器的環(huán)節(jié),最后再把多個(gè)任務(wù)的計(jì)算結(jié)果進(jìn)行合并,輸出計(jì)算的結(jié)果。在這些執(zhí)行每個(gè)分塊的分布式集群節(jié)點(diǎn)中,可以使用非常廉價(jià)的機(jī)器,這樣就可以使用低端的設(shè)備組成一個(gè)超大的型的運(yùn)算。
  MapReduce的原理是比較簡單的,并且目前流行大部分語言都能實(shí)現(xiàn)。如今Yahoo利用MapReduce定期在搜索業(yè)務(wù)上使用Hadoop來提高其產(chǎn)品和服務(wù),如排名功能和目標(biāo)廣告。Google利用MapReduce來進(jìn)行分布排序,web連接圖反轉(zhuǎn),每臺(tái)機(jī)器的詞矢量,web訪問日志分析,也有一些開源項(xiàng)目利用MapReduce來實(shí)現(xiàn)產(chǎn)品的功能,例如:最著名的MongoDB和Apache的Nutch,還有一些項(xiàng)目提出使用MapReduce來執(zhí)行對(duì)數(shù)據(jù)庫的分布式計(jì)算,例如:Gearman(Ref),運(yùn)行在微軟云計(jì)算平臺(tái)上的lokad-cloud(Ref) 。  MySpace也自己研制的MapReduce框架Qizmt開源了(Ref),可用于在大規(guī)模Windows集群上開發(fā)或運(yùn)行分布式計(jì)算程序。
   對(duì)于在Hadoop中涵蓋的技術(shù)(Hive/HBase/Pig)對(duì)于傳統(tǒng)的數(shù)據(jù)庫來說,具有天然的可擴(kuò)展性和支持海量數(shù)據(jù)存儲(chǔ)的能力,并且對(duì)非結(jié)構(gòu)化的數(shù)據(jù)處理能力完全超越于傳統(tǒng)的數(shù)據(jù)庫技術(shù)。例如,當(dāng)MySQL運(yùn)行的集群節(jié)點(diǎn)達(dá)到100臺(tái)以上,雖然說理論上MySQL單張表的最大數(shù)據(jù)容量可以達(dá)到2T,但是如果真正需要依靠MySQL來存儲(chǔ)的數(shù)據(jù)上T再加上大并發(fā)的用戶訪問,無論是維護(hù)還是操作都是非常頭痛的事情,讓MySQL或者傳統(tǒng)數(shù)據(jù)庫肩負(fù)超大型的數(shù)據(jù)運(yùn)算/查詢,化九牛二虎之力跑起來穩(wěn)定一段時(shí)間過后,我想也會(huì)把MySQL累個(gè)半死,這是也并不是說讓Hadoop/MapReduce/Hive 這些技術(shù)去替代傳統(tǒng)的技術(shù),而是希望Hadoop/MapReduce/Hive去用于做數(shù)據(jù)轉(zhuǎn)換或者裝載的(ETL)方面的工作,MapReduce適合海量數(shù)據(jù)數(shù)據(jù)被一次寫入和多次讀取的應(yīng)用,在這些場合,MapReduce可以成為傳統(tǒng)數(shù)據(jù)庫的良好補(bǔ)充,而不是替代品。
  某些特定的場景中要存儲(chǔ)上億個(gè)文件本身就是一個(gè)頭疼的問題,還要找出上億個(gè)文件中存儲(chǔ)的文檔、圖片、網(wǎng)頁 哪個(gè)最大,并且還要分別列出3類,那更是雪上加霜,但利用Hadoop提供的MapReduce框架,基于HDFS分布式海量數(shù)據(jù)存儲(chǔ)的手段,相對(duì)傳統(tǒng)的方法而言會(huì)輕松一點(diǎn),因?yàn)槔肏adoop的技術(shù)可以讓廉價(jià)的機(jī)器組成在一起帶來更高的計(jì)算性能,并且支持海量存儲(chǔ),換而言之,如果你的數(shù)據(jù)還沒有上千萬 上了Hadoop基本上是用“關(guān)公的大刀切青菜”,資源浪費(fèi)。
   Hadoop并非是完全用于非結(jié)構(gòu)化和半結(jié)構(gòu)化的數(shù)據(jù)處理,在Apache Hadoop的MapReduce中為了方便MapReduce直接訪問關(guān)系型數(shù)據(jù)庫(Mysql,Oracle),MapReduce輸入的鍵和值并不是數(shù)據(jù)固有的屬性,可以人為的來選擇數(shù)據(jù)來源。Hadoop提供了DBInputFormat和DBOutputFormat兩個(gè)類。這樣就可以將現(xiàn)有數(shù)據(jù)庫中的數(shù)據(jù)轉(zhuǎn)儲(chǔ)到Hadoop/HDFS中,由MapReduce進(jìn)行分布式計(jì)算,通過MapReduce框架對(duì)海量數(shù)據(jù)進(jìn)行分析,或者也可以倒過來從海量的非結(jié)構(gòu)/半結(jié)構(gòu)/結(jié)構(gòu)化的數(shù)據(jù)分析,將計(jì)算的結(jié)果存儲(chǔ)到數(shù)據(jù)庫。關(guān)鍵字:DBOutputFormat、DBInputFormat、DBConfiguration,根據(jù)這幾個(gè)關(guān)鍵字可以Google到更多結(jié)果,暫時(shí)先不提供代碼了,稍后會(huì)提供完整的代碼示例和個(gè)人見解,需要了解的同學(xué)可以先看看這里(Ref)。
讓我更值得關(guān)注的是如何將mapreduce使用在適合的場景,將hadoop mapreduce的框架用途發(fā)揮到極致,或者說當(dāng)面對(duì)大型計(jì)算該如何借用mapreduce框架、原理將計(jì)算進(jìn)項(xiàng)散列在不同的計(jì)算機(jī)上去執(zhí)行同一份作業(yè),去更高的發(fā)揮機(jī)器的資源,更快的得到計(jì)算的運(yùn)行結(jié)果,我想這才是使用mapreduce真正的目標(biāo)吧。

    本站是提供個(gè)人知識(shí)管理的網(wǎng)絡(luò)存儲(chǔ)空間,所有內(nèi)容均由用戶發(fā)布,不代表本站觀點(diǎn)。請(qǐng)注意甄別內(nèi)容中的聯(lián)系方式、誘導(dǎo)購買等信息,謹(jǐn)防詐騙。如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容,請(qǐng)點(diǎn)擊一鍵舉報(bào)。
    轉(zhuǎn)藏 分享 獻(xiàn)花(0

    0條評(píng)論

    發(fā)表

    請(qǐng)遵守用戶 評(píng)論公約

    類似文章 更多

    国产又大又硬又粗又黄| 九九热精品视频免费观看| 中文人妻精品一区二区三区四区| 亚洲国产av在线观看一区| 亚洲熟女乱色一区二区三区| 日本女优一区二区三区免费| 91日韩欧美在线视频| 狠狠亚洲丁香综合久久| 中文字幕精品一区二区三| 五月天丁香婷婷一区二区| 欧美加勒比一区二区三区| 成人免费观看视频免费| 一个人的久久精彩视频| 精品人妻久久一品二品三品| 高潮少妇高潮久久精品99| 成年人黄片大全在线观看| 欧美亚洲三级视频在线观看| 国产一区二区不卡在线播放| 夜色福利久久精品福利| 国产内射一级一片内射高清| 在线免费看国产精品黄片| 色哟哟国产精品免费视频| 亚洲黄色在线观看免费高清| 中文字幕区自拍偷拍区| 国产亚洲中文日韩欧美综合网 | 老司机激情五月天在线不卡| 男生和女生哪个更好色| 99久久精品国产日本| 欧美激情区一区二区三区| 色婷婷视频国产一区视频| 日韩精品一区二区亚洲| 中文字幕久热精品视频在线| 日本91在线观看视频| 男女午夜视频在线观看免费| 色婷婷视频国产一区视频| 东京热男人的天堂久久综合| 午夜福利精品视频视频| 国产精品免费视频专区| 欧美一区二区在线日韩| 日本欧美一区二区三区高清| 少妇丰满a一区二区三区|