Nginx的高并發(fā)得益于其采用了epoll模型,與傳統(tǒng)的服務(wù)器程序架構(gòu)不同,epoll是linux內(nèi)核2.6以后才出現(xiàn)的。下面通過比較Apache和Nginx工作原理來比較。
傳統(tǒng)Apache都是多進(jìn)程或者多線程來工作,假設(shè)是多進(jìn)程工作(prefork),apache會(huì)先生成幾個(gè)進(jìn)程,類似進(jìn)程池的工作原理,只不過這里的進(jìn)程池會(huì)隨著請(qǐng)求數(shù)目的增加而增加。對(duì)于每一個(gè)連接,apache都是在一個(gè)進(jìn)程內(nèi)處理完畢。具體是 recv(),以及根據(jù) URI 去進(jìn)行磁盤I/O來尋找文件,還有 send()都是阻塞的。其實(shí)說白了都是 apche 對(duì)于套接字的I/O,讀或者寫,但是讀或者寫都是阻塞的,阻塞意味著進(jìn)程就得掛起進(jìn)入sleep狀態(tài),那么一旦連接數(shù)很多,Apache必然要生成更多的進(jìn)程來響應(yīng)請(qǐng)求,一旦進(jìn)程多了,CPU對(duì)于進(jìn)程的切換就頻繁了,很耗資源和時(shí)間,所以就導(dǎo)致apache性能下降了,說白了就是處理不過來這么多進(jìn)程了。其實(shí)仔細(xì)想想,如果對(duì)于進(jìn)程每個(gè)請(qǐng)求都沒有阻塞,那么效率肯定會(huì)提高很多。
Nginx采用epoll模型,異步非阻塞。對(duì)于Nginx來說,把一個(gè)完整的連接請(qǐng)求處理都劃分成了事件,一個(gè)一個(gè)的事件。比如accept(), recv(),磁盤I/O,send()等,每部分都有相應(yīng)的模塊去處理,一個(gè)完整的請(qǐng)求可能是由幾百個(gè)模塊去處理。真正核心的就是事件收集和分發(fā)模塊,這就是管理所有模塊的核心。只有核心模塊的調(diào)度才能讓對(duì)應(yīng)的模塊占用CPU資源,從而處理請(qǐng)求。拿一個(gè)HTTP請(qǐng)求來說,首先在事件收集分發(fā)模塊注冊(cè)感興趣的監(jiān)聽事件,注冊(cè)好之后不阻塞直接返回,接下來就不需要再管了,等待有連接來了內(nèi)核會(huì)通知你(epoll的輪詢會(huì)告訴進(jìn)程),cpu就可以處理其他事情去了。一旦有請(qǐng)求來,那么對(duì)整個(gè)請(qǐng)求分配相應(yīng)的上下文(其實(shí)已經(jīng)預(yù)先分配好),這時(shí)候再注冊(cè)新的感興趣的事件(read函數(shù)),同樣客戶端數(shù)據(jù)來了內(nèi)核會(huì)自動(dòng)通知進(jìn)程可以去讀數(shù)據(jù)了,讀了數(shù)據(jù)之后就是解析,解析完后去磁盤找資源(I/O),一旦I/O完成會(huì)通知進(jìn)程,進(jìn)程開始給客戶端發(fā)回?cái)?shù)據(jù)send(),這時(shí)候也不是阻塞的,調(diào)用后就等內(nèi)核發(fā)回通知發(fā)送的結(jié)果就行。整個(gè)下來把一個(gè)請(qǐng)求分成了很多個(gè)階段,每個(gè)階段都到很多模塊去注冊(cè),然后處理,都是異步非阻塞。異步這里指的就是做一個(gè)事情,不需要等返回結(jié)果,做好了會(huì)自動(dòng)通知你。 select/epoll的特點(diǎn) select的特點(diǎn):select 選擇句柄的時(shí)候,是遍歷所有句柄,也就是說句柄有事件響應(yīng)時(shí),select需要遍歷所有句柄才能獲取到哪些句柄有事件通知,因此效率是非常低。但是如果連接很少的情況下, select和epoll的LT觸發(fā)模式相比, 性能上差別不大。 Epoll模型主要負(fù)責(zé)對(duì)大量并發(fā)用戶的請(qǐng)求進(jìn)行及時(shí)處理,完成服務(wù)器與客戶端的數(shù)據(jù)交互。其具體的實(shí)現(xiàn)步驟如下: epoll的操作就這么簡(jiǎn)單,總共不過4個(gè) API:epoll_create, epoll_ctl, epoll_wait和close。 可以舉一個(gè)簡(jiǎn)單的例子來說明Apache的工作流程,我們平時(shí)去餐廳吃飯。餐廳的工作模式是一個(gè)服務(wù)員全程服務(wù)客戶,流程是這樣,服務(wù)員在門口等候客人(listen),客人到了就接待安排的餐桌上(accept),等著客戶點(diǎn)菜(request uri),去廚房叫師傅下單做菜(磁盤I/O),等待廚房做好(read),然后給客人上菜(send),整個(gè)下來服務(wù)員(進(jìn)程)很多地方是阻塞的。這樣客人一多(HTTP請(qǐng)求一多),餐廳只能通過叫更多的服務(wù)員來服務(wù)(fork進(jìn)程),但是由于餐廳資源是有限的(CPU),一旦服務(wù)員太多管理成本很高(CPU上下文切換),這樣就進(jìn)入一個(gè)瓶頸。 不管是Nginx還是Squid這種反向代理,其網(wǎng)絡(luò)模式都是事件驅(qū)動(dòng)。事件驅(qū)動(dòng)其實(shí)是很老的技術(shù),早期的select、poll都是如此。后來基于內(nèi)核通知的更高級(jí)事件機(jī)制出現(xiàn),如libevent里的epoll,使事件驅(qū)動(dòng)性能得以提高。事件驅(qū)動(dòng)的本質(zhì)還是IO事件,應(yīng)用程序在多個(gè)IO句柄間快速切換,實(shí)現(xiàn)所謂的異步IO。事件驅(qū)動(dòng)服務(wù)器,最適合做的就是這種IO密集型工作,如反向代理,它在客戶端與WEB服務(wù)器之間起一個(gè)數(shù)據(jù)中轉(zhuǎn)作用,純粹是IO操作,自身并不涉及到復(fù)雜計(jì)算。反向代理用事件驅(qū)動(dòng)來做,顯然更好,一個(gè)工作進(jìn)程就可以run了,沒有進(jìn)程、線程管理的開銷,CPU、內(nèi)存消耗都小。 所以Nginx、Squid都是這樣做的。當(dāng)然,Nginx也可以是多進(jìn)程 + 事件驅(qū)動(dòng)的模式,幾個(gè)進(jìn)程跑libevent,不需要Apache那樣動(dòng)輒數(shù)百的進(jìn)程數(shù)。Nginx處理靜態(tài)文件效果也很好,那是因?yàn)殪o態(tài)文件本身也是磁盤IO操作,處理過程一樣。至于說多少萬的并發(fā)連接,這個(gè)毫無意義。隨手寫個(gè)網(wǎng)絡(luò)程序都能處理幾萬的并發(fā),但如果大部分客戶端阻塞在那里,就沒什么價(jià)值。 再看看Apache或者Resin這類應(yīng)用服務(wù)器,之所以稱他們?yōu)閼?yīng)用服務(wù)器,是因?yàn)樗麄冋娴囊芫唧w的業(yè)務(wù)應(yīng)用,如科學(xué)計(jì)算、圖形圖像、數(shù)據(jù)庫讀寫等。它們很可能是CPU密集型的服務(wù),事件驅(qū)動(dòng)并不合適。例如一個(gè)計(jì)算耗時(shí)2秒,那么這2秒就是完全阻塞的,什么event都沒用。想想MySQL如果改成事件驅(qū)動(dòng)會(huì)怎么樣,一個(gè)大型的join或sort就會(huì)阻塞住所有客戶端。這個(gè)時(shí)候多進(jìn)程或線程就體現(xiàn)出優(yōu)勢(shì),每個(gè)進(jìn)程各干各的事,互不阻塞和干擾。當(dāng)然,現(xiàn)代CPU越來越快,單個(gè)計(jì)算阻塞的時(shí)間可能很小,但只要有阻塞,事件編程就毫無優(yōu)勢(shì)。所以進(jìn)程、線程這類技術(shù),并不會(huì)消失,而是與事件機(jī)制相輔相成,長(zhǎng)期存在。 總言之,事件驅(qū)動(dòng)適合于IO密集型服務(wù),多進(jìn)程或線程適合于CPU密集型服務(wù),它們各有各的優(yōu)勢(shì),并不存在誰取代誰的傾向。
|
|