一区二区三区日韩精品-日韩经典一区二区三区-五月激情综合丁香婷婷-欧美精品中文字幕专区

分享

flume上傳文件到hdfs上

 昵稱23016082 2017-05-23

在第一篇文章中我們是將log4j的日志輸出到了agent的日志文件當(dāng)中。配置文件如下:

  1. tier1.sources=source1  
  2. tier1.channels=channel1  
  3. tier1.sinks=sink1  
  4.   
  5. tier1.sources.source1.type=avro  
  6. tier1.sources.source1.bind=0.0.0.0  
  7. tier1.sources.source1.port=44444  
  8. tier1.sources.source1.channels=channel1  
  9.   
  10. tier1.channels.channel1.type=memory  
  11. tier1.channels.channel1.capacity=10000  
  12. tier1.channels.channel1.transactionCapacity=1000  
  13. tier1.channels.channel1.keep-alive=30  
  14.   
  15. tier1.sinks.sink1.type=logger  
  16. tier1.sinks.sink1.channel=channel1  

本次我們把log4j的日志直接采集輸出到hdfs中去。需要修改flume.conf中sink的配置:
  1. tier1.sources=source1  
  2. tier1.channels=channel1  
  3. tier1.sinks=sink1  
  4.   
  5. tier1.sources.source1.type=avro  
  6. tier1.sources.source1.bind=0.0.0.0  
  7. tier1.sources.source1.port=44444  
  8. tier1.sources.source1.channels=channel1  
  9.   
  10. tier1.channels.channel1.type=memory  
  11. tier1.channels.channel1.capacity=10000  
  12. tier1.channels.channel1.transactionCapacity=1000  
  13. tier1.channels.channel1.keep-alive=30  
  14.   
  15. tier1.sinks.sink1.type=hdfs  
  16. tier1.sinks.sink1.channel=channel1  
  17. tier1.sinks.sink1.hdfs.path=hdfs://master68:8020/flume/events  
  18. tier1.sinks.sink1.hdfs.fileType=DataStream  
  19. tier1.sinks.sink1.hdfs.writeFormat=Text  
  20. tier1.sinks.sink1.hdfs.rollInterval=0  
  21. tier1.sinks.sink1.hdfs.rollSize=10240  
  22. tier1.sinks.sink1.hdfs.rollCount=0  
  23. tier1.sinks.sink1.hdfs.idleTimeout=60  
簡單說明一下修改的部分,我們將sink的type由logger變?yōu)閔dfs,然后指定輸出path, 默認(rèn)是輸出到HDFS后為sequencefile,里面的內(nèi)容無法直接打開瀏覽,為了便于直觀看到我們輸出的日志信息,所以我這里將fileType為DataStream, writeFormat=Text,這樣就可以直接打開生成的文件進(jìn)行查看了。

下面幾個(gè)roll開頭的參數(shù)都是用來控制滾動(dòng)日志輸出的,官方文檔上的說明也很詳細(xì),我這里配置的只按文件大小來滾動(dòng)rollSize=10240,也就是10K滾動(dòng)生成一個(gè)新的文件用來接收新的EVENTS。實(shí)際中這個(gè)Size應(yīng)該更大一些,我覺得設(shè)置成HDFS的blocksize大小應(yīng)該挺合適的。

idleTimeout設(shè)置為60秒(默認(rèn)值為0),這里面的原理是這樣的,flume里面每生成一個(gè)接收文件時(shí)的命名規(guī)則如:FlumeData.1406251462179.tmp,.tmp表示這個(gè)文件正在被使用來接收EVENTS,當(dāng)滿10K之后,這個(gè)文件會(huì)被rename成FlumeData.1406251462179,把.tmp后綴去掉,但是如果你停止了應(yīng)用程序后,F(xiàn)lumeData.1406251462179.tmp還沒滿10K,按照默認(rèn)的idleTimeout設(shè)置,不會(huì)將它rename,也就是.tmp后綴一直在,造成了這個(gè)文件一直在使用當(dāng)中的一個(gè)假象,這是有問題的,我們?cè)O(shè)置idleTimeout=60,即60秒后這個(gè)文件還沒有被寫入數(shù)據(jù),就會(huì)關(guān)閉它然后rename它去掉.tmp,以后新進(jìn)來的events,會(huì)新開一個(gè).tmp文件來接收。

我們?cè)龠\(yùn)行第一篇文章中的那個(gè)示例應(yīng)用程序,然后去path指定的目錄下面就能看到log4j輸出的日志信息了。


補(bǔ)充注意點(diǎn)(針對(duì)cm安裝的flume):

首先在hdfs上創(chuàng)建/flume目錄:hadoop fs -mkdir /flume
給該目錄授權(quán)給flume用戶和組:hadoop fs -chown -R flume:flume /flume

注意給目錄授權(quán)很重要,不然會(huì)報(bào)錯(cuò)。

    本站是提供個(gè)人知識(shí)管理的網(wǎng)絡(luò)存儲(chǔ)空間,所有內(nèi)容均由用戶發(fā)布,不代表本站觀點(diǎn)。請(qǐng)注意甄別內(nèi)容中的聯(lián)系方式、誘導(dǎo)購買等信息,謹(jǐn)防詐騙。如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容,請(qǐng)點(diǎn)擊一鍵舉報(bào)。
    轉(zhuǎn)藏 分享 獻(xiàn)花(0

    0條評(píng)論

    發(fā)表

    請(qǐng)遵守用戶 評(píng)論公約

    類似文章 更多

    国产精品尹人香蕉综合网| 狠色婷婷久久一区二区三区| 大香蕉久草网一区二区三区 | 日韩性生活视频免费在线观看 | 国产成人亚洲精品青草天美| 五月婷婷六月丁香在线观看| 91人妻人人做人碰人人九色| 日韩在线中文字幕不卡| 久久久精品区二区三区| 中文字幕人妻综合一区二区| 久久精品少妇内射毛片| 免费特黄欧美亚洲黄片| 久久99这里只精品热在线| 久久99爱爱视频视频| 俄罗斯胖女人性生活视频| 在线观看那种视频你懂的| 人体偷拍一区二区三区| 亚洲一区二区三区一区| 亚洲最新中文字幕一区| 日韩人妻免费视频一专区| 婷婷伊人综合中文字幕| 亚洲精品中文字幕一二三| 日本一区不卡在线观看| 国产又粗又猛又长又黄视频| 日本高清不卡一二三区| 久久黄片免费播放大全| 99国产成人免费一区二区| 亚洲中文字幕人妻av| 亚洲熟女乱色一区二区三区| 日韩精品一区二区三区av在线| 色哟哟精品一区二区三区| 人体偷拍一区二区三区| 日本免费一级黄色录像| 国产不卡一区二区四区| 欧美精品亚洲精品日韩专区| 国产二级一级内射视频播放| 初尝人妻少妇中文字幕在线| 亚洲精品国男人在线视频| 亚洲欧美天堂精品在线| 精品高清美女精品国产区| 国产精品一级香蕉一区|