一区二区三区日韩精品-日韩经典一区二区三区-五月激情综合丁香婷婷-欧美精品中文字幕专区

分享

告訴你Hadoop是什么

 浸心閣 2016-02-01

Hadoop是什么?Hadoop是一個開發(fā)和運行處理大規(guī)模數(shù)據(jù)的軟件平臺,是Appach的一個用java語言實現(xiàn)開源軟件框架,實現(xiàn)在大量計算機組成的集群中對海量數(shù)據(jù)進行分布式計算.

Hadoop框架中最核心設計就是:HDFS和MapReduce.HDFS提供了海量數(shù)據(jù)的存儲,MapReduce提供了對數(shù)據(jù)的計算.

數(shù)據(jù)在Hadoop中處理的流程可以簡單的按照下圖來理解:數(shù)據(jù)通過Haddop的集群處理后得到結果.

HDFS:Hadoop Distributed File System,Hadoop的分布式文件系統(tǒng).
大文件被分成默認64M一塊的數(shù)據(jù)塊分布存儲在集群機器中.

如下圖中的文件 data1被分成3塊,這3塊以冗余鏡像的方式分布在不同的機器中.

MapReduce:Hadoop為每一個input split創(chuàng)建一個task調用Map計算,在此task中依次處理此split中的一個個記錄(record),map會將結果以key--value的形式輸出,hadoop負責按key值將map的輸出整理后作為Reduce的輸入,Reduce Task的輸出為整個job的輸出,保存在HDFS上.

Hadoop的集群主要由 NameNode,DataNode,Secondary NameNode,JobTracker,TaskTracker組成.

如下圖所示:

NameNode中記錄了文件是如何被拆分成block以及這些block都存儲到了那些DateNode節(jié)點.

NameNode同時保存了文件系統(tǒng)運行的狀態(tài)信息. 

DataNode中存儲的是被拆分的blocks.

Secondary NameNode幫助NameNode收集文件系統(tǒng)運行的狀態(tài)信息.

JobTracker當有任務提交到Hadoop集群的時候負責Job的運行,負責調度多個TaskTracker.

TaskTracker負責某一個map或者reduce任務.

【編輯推薦】

【責任編輯:黃丹 TEL:(010)68476606】

    本站是提供個人知識管理的網(wǎng)絡存儲空間,所有內容均由用戶發(fā)布,不代表本站觀點。請注意甄別內容中的聯(lián)系方式、誘導購買等信息,謹防詐騙。如發(fā)現(xiàn)有害或侵權內容,請點擊一鍵舉報。
    轉藏 分享 獻花(0

    0條評論

    發(fā)表

    請遵守用戶 評論公約

    類似文章 更多

    熟女一区二区三区国产| 99久久免费看国产精品| 国产99久久精品果冻传媒| 黄男女激情一区二区三区| 女厕偷窥一区二区三区在线| 欧美不卡午夜中文字幕| 亚洲中文字幕视频一区二区| 国产精品日韩欧美一区二区| 六月丁香六月综合缴情| 九九热在线视频精品免费| 五月婷日韩中文字幕四虎| 日韩一区二区三区高清在| 五月婷婷六月丁香亚洲| 国产日韩欧美综合视频| 亚洲日本加勒比在线播放| 日韩av亚洲一区二区三区| 大伊香蕉一区二区三区| 国语对白刺激高潮在线视频| 中国日韩一级黄色大片| 亚洲黄香蕉视频免费看| 亚洲另类女同一二三区| 99视频精品免费视频| 91欧美日韩中在线视频| 日韩精品一区二区三区射精| 久久三级国外久久久三级| 亚洲中文字幕一区三区| 日韩丝袜诱惑一区二区| 日本乱论一区二区三区| 亚洲午夜福利不卡片在线| 国产精品久久香蕉国产线| 中国日韩一级黄色大片| 亚洲精品国产主播一区| 亚洲一二三四区免费视频| 亚洲免费视频中文字幕在线观看| 亚洲av日韩av高潮无打码 | 国产精品一区二区视频大全| 日木乱偷人妻中文字幕在线| 亚洲一区二区三区精选| 久久久精品区二区三区| 又大又长又粗又猛国产精品| 国产中文字幕一区二区|