一、總結(jié)前一天的學(xué)習(xí)從“第三天”的性能測(cè)試一節(jié)中,我們得知了決定性能測(cè)試的幾個(gè)重要指標(biāo),它們是: ü 吞吐量 ü Responsetime ü Cpuload ü MemoryUsage 我們也在第三天的學(xué)習(xí)中對(duì)Apache做過了一定的優(yōu)化,使其最優(yōu)化上述4大核心指標(biāo)的讀數(shù),那么我們的Apache調(diào)優(yōu)了,我們的Tomcat也作些相應(yīng)的調(diào)整,當(dāng)完成今的課程后,到時(shí)你的“小貓”到時(shí)真的會(huì)“飛”起來的,所以請(qǐng)用心看完,這篇文章一方面用來向那位曾寫過“Tomcat如何承受1000個(gè)用戶”的作都的敬,一方面又是這篇原文的一個(gè)擴(kuò)展,因?yàn)樵诎言牡闹R(shí)用到相關(guān)的兩個(gè)大工程中去后解決了: 1) 承受更大并發(fā)用戶數(shù) 2) 取得了良好的性能與改善(系統(tǒng)平均性能提升達(dá)20倍,極端一個(gè)交易達(dá)80倍)。 另外值的一提的是,我們當(dāng)時(shí)工程里用的“小貓”是跑在32位機(jī)下的, 也就是我們的JVM最大受到2GB內(nèi)存的限制,都已經(jīng)跑成“飛”了。。。。。。如果在64位機(jī)下跑這頭“小貓”。。。。。。大家可想而知,會(huì)得到什么樣的效果呢?下面就請(qǐng)請(qǐng)?jiān)敿?xì)的設(shè)置吧! 二、一切基于JVM(內(nèi)存)的優(yōu)化2.1 32位操作系統(tǒng)與64位操作系統(tǒng)中JVM的對(duì)比我們一般的開發(fā)人員,基本用的是都是32位的Windows系統(tǒng),這就導(dǎo)致了一個(gè)嚴(yán)重的問題即:32位windows系統(tǒng)對(duì)內(nèi)存限制,下面先來看一個(gè)比較的表格:
上述問題解決后,我們又碰到一個(gè)新的問題,32位系統(tǒng)下JVM對(duì)內(nèi)存的限制:不能突破2GB內(nèi)存,即使你在Win2003 Advanced Server下你的機(jī)器裝有8GB-16GB的內(nèi)存,而你的JAVA,只能用到2GB的內(nèi)存。 其實(shí)我一直很想推薦大家使用Linux或者是Mac操作系統(tǒng)的,而且要裝64位,因?yàn)楸鼐刮覀兪情_發(fā)用的不是打游戲用的,而Java源自Unix歸于Unix(Linux只是運(yùn)行在PC上的Unix而己)。 所以很多開發(fā)人員運(yùn)行在win32位系統(tǒng)上更有甚者在生產(chǎn)環(huán)境下都會(huì)布署win32位的系統(tǒng),那么這時(shí)你的Tomcat要優(yōu)化,就要講究點(diǎn)技巧了。而在64位操作系統(tǒng)上無論是系統(tǒng)內(nèi)存還是JVM都沒有受到2GB這樣的限制。 Tomcat的優(yōu)化分成兩塊: ü Tomcat啟動(dòng)命令行中的優(yōu)化參數(shù)即JVM優(yōu)化 ü Tomcat容器自身參數(shù)的優(yōu)化(這塊很像ApacheHttp Server) 這一節(jié)先要講的是Tomcat啟動(dòng)命令行中的優(yōu)化參數(shù)。 Tomcat首先跑在JVM之上的,因?yàn)樗膯?dòng)其實(shí)也只是一個(gè)java命令行,首先我們需要對(duì)這個(gè)JAVA的啟動(dòng)命令行進(jìn)行調(diào)優(yōu)。 需要注意的是: 這邊討論的JVM優(yōu)化是基于Oracle Sun的jdk1.6版有以上,其它JDK或者低版本JDK不適用。 2.2 Tomcat啟動(dòng)行參數(shù)的優(yōu)化Tomcat 的啟動(dòng)參數(shù)位于tomcat的安裝目錄\bin目錄下,如果你是Linux操作系統(tǒng)就是catalina.sh文件,如果你是Windows操作系統(tǒng)那么你需要改動(dòng)的就是catalina.bat文件。打開該文件,一般該文件頭部是一堆的由##包裹著的注釋文字,找到注釋文字的最后一段如:
敲入一個(gè)回車,加入如下的參數(shù) Linux系統(tǒng)中tomcat的啟動(dòng)參數(shù)
Windows系統(tǒng)中tomcat的啟動(dòng)參數(shù)
上面參數(shù)好多啊,可能有人寫到現(xiàn)在都沒見一個(gè)tomcat的啟動(dòng)命令里加了這么多參數(shù),當(dāng)然,這些參數(shù)只是我機(jī)器上的,不一定適合你,尤其是參數(shù)后的value(值)是需要根據(jù)你自己的實(shí)際情況來設(shè)置的。 參數(shù)解釋: ü -server 我不管你什么理由,只要你的tomcat是運(yùn)行在生產(chǎn)環(huán)境中的,這個(gè)參數(shù)必須給我加上 因?yàn)閠omcat默認(rèn)是以一種叫java –client的模式來運(yùn)行的,server即意味著你的tomcat是以真實(shí)的production的模式在運(yùn)行的,這也就意味著你的tomcat以server模式運(yùn)行時(shí)將擁有:更大、更高的并發(fā)處理能力,更快更強(qiáng)捷的JVM垃圾回收機(jī)制,可以獲得更多的負(fù)載與吞吐量。。。更。。。還有更。。。 Y給我記住啊,要不然這個(gè)-server都不加,那是要打屁股了。 ü -Xms–Xmx 即JVM內(nèi)存設(shè)置了,把Xms與Xmx兩個(gè)值設(shè)成一樣是最優(yōu)的做法,有人說Xms為最小值,Xmx為最大值不是挺好的,這樣設(shè)置還比較人性化,科學(xué)化。人性?科學(xué)?你個(gè)頭啊。 大家想一下這樣的場(chǎng)景: 一個(gè)系統(tǒng)隨著并發(fā)數(shù)越來越高,它的內(nèi)存使用情況逐步上升,上升到最高點(diǎn)不能上升了,開始回落,你們不要認(rèn)為這個(gè)回落就是好事情,由其是大起大落,在內(nèi)存回落時(shí)它付出的代價(jià)是CPU高速開始運(yùn)轉(zhuǎn)進(jìn)行垃圾回收,此時(shí)嚴(yán)重的甚至?xí)斐赡愕南到y(tǒng)出現(xiàn)“卡殼”就是你在好好的操作,突然網(wǎng)頁像死在那邊一樣幾秒甚至十幾秒時(shí)間,因?yàn)镴VM正在進(jìn)行垃圾回收。 因此一開始我們就把這兩個(gè)設(shè)成一樣,使得Tomcat在啟動(dòng)時(shí)就為最大化參數(shù)充分利用系統(tǒng)的效率,這個(gè)道理和jdbcconnection pool里的minpool size與maxpool size的需要設(shè)成一個(gè)數(shù)量是一樣的原理。 如何知道我的JVM能夠使用最大值?。颗哪X袋?不行! 在設(shè)這個(gè)最大內(nèi)存即Xmx值時(shí)請(qǐng)先打開一個(gè)命令行,鍵入如下的命令: 看,能夠正常顯示JDK的版本信息,說明,這個(gè)值你能夠用。不是說32位系統(tǒng)下最高能夠使用2GB內(nèi)存嗎?即:2048m,我們不防來試試 可以嗎?不可以!不要說2048m呢,我們小一點(diǎn),試試1700m如何 嘿嘿,連1700m都不可以,更不要說2048m了呢,2048m只是一個(gè)理論數(shù)值,這樣說吧我這邊有幾臺(tái)機(jī)器,有的機(jī)器-Xmx1800都沒問題,有的機(jī)器最高只能到-Xmx1500m。 因此在設(shè)這個(gè)-Xms與-Xmx值時(shí)一定一定記得先這樣測(cè)試一下,要不然直接加在tomcat啟動(dòng)命令行中你的tomcat就再也起不來了,要飛是飛不了,直接成了一只瘟貓了。 ü –Xmn 設(shè)置年輕代大小為512m。整個(gè)堆大小=年輕代大小 + 年老代大小 + 持久代大小。持久代一般固定大小為64m,所以增大年輕代后,將會(huì)減小年老代大小。此值對(duì)系統(tǒng)性能影響較大,Sun官方推薦配置為整個(gè)堆的3/8。 ü -Xss 是指設(shè)定每個(gè)線程的堆棧大小。這個(gè)就要依據(jù)你的程序,看一個(gè)線程 大約需要占用多少內(nèi)存,可能會(huì)有多少線程同時(shí)運(yùn)行等。一般不易設(shè)置超過1M,要不然容易出現(xiàn)out ofmemory。 ü -XX:+AggressiveOpts 作用如其名(aggressive),啟用這個(gè)參數(shù),則每當(dāng)JDK版本升級(jí)時(shí),你的JVM都會(huì)使用最新加入的優(yōu)化技術(shù)(如果有的話) ü -XX:+UseBiasedLocking 啟用一個(gè)優(yōu)化了的線程鎖,我們知道在我們的appserver,每個(gè)http請(qǐng)求就是一個(gè)線程,有的請(qǐng)求短有的請(qǐng)求長(zhǎng),就會(huì)有請(qǐng)求排隊(duì)的現(xiàn)象,甚至還會(huì)出現(xiàn)線程阻塞,這個(gè)優(yōu)化了的線程鎖使得你的appserver內(nèi)對(duì)線程處理自動(dòng)進(jìn)行最優(yōu)調(diào)配。 ü -XX:PermSize=128M-XX:MaxPermSize=256M JVM使用-XX:PermSize設(shè)置非堆內(nèi)存初始值,默認(rèn)是物理內(nèi)存的1/64; 在數(shù)據(jù)量的很大的文件導(dǎo)出時(shí),一定要把這兩個(gè)值設(shè)置上,否則會(huì)出現(xiàn)內(nèi)存溢出的錯(cuò)誤。 由XX:MaxPermSize設(shè)置最大非堆內(nèi)存的大小,默認(rèn)是物理內(nèi)存的1/4。 那么,如果是物理內(nèi)存4GB,那么64分之一就是64MB,這就是PermSize默認(rèn)值,也就是永生代內(nèi)存初始大??; 四分之一是1024MB,這就是MaxPermSize默認(rèn)大小。 ü -XX:+DisableExplicitGC 在程序代碼中不允許有顯示的調(diào)用”System.gc()”??吹竭^有兩個(gè)極品工程中每次在DAO操作結(jié)束時(shí)手動(dòng)調(diào)用System.gc()一下,覺得這樣做好像能夠解決它們的out ofmemory問題一樣,付出的代價(jià)就是系統(tǒng)響應(yīng)時(shí)間嚴(yán)重降低,就和我在關(guān)于Xms,Xmx里的解釋的原理一樣,這樣去調(diào)用GC導(dǎo)致系統(tǒng)的JVM大起大落,性能不到什么地方去喲! ü -XX:+UseParNewGC 對(duì)年輕代采用多線程并行回收,這樣收得快。 ü -XX:+UseConcMarkSweepGC 即CMS gc,這一特性只有jdk1.5即后續(xù)版本才具有的功能,它使用的是gc估算觸發(fā)和heap占用觸發(fā)。 我們知道頻頻繁的GC會(huì)造面JVM的大起大落從而影響到系統(tǒng)的效率,因此使用了CMS GC后可以在GC次數(shù)增多的情況下,每次GC的響應(yīng)時(shí)間卻很短,比如說使用了CMS GC后經(jīng)過jprofiler的觀察,GC被觸發(fā)次數(shù)非常多,而每次GC耗時(shí)僅為幾毫秒。 ü -XX:MaxTenuringThreshold 設(shè)置垃圾最大年齡。如果設(shè)置為0的話,則年輕代對(duì)象不經(jīng)過Survivor區(qū),直接進(jìn)入年老代。對(duì)于年老代比較多的應(yīng)用,可以提高效率。如果將此值設(shè)置為一個(gè)較大值,則年輕代對(duì)象會(huì)在Survivor區(qū)進(jìn)行多次復(fù)制,這樣可以增加對(duì)象再年輕代的存活時(shí)間,增加在年輕代即被回收的概率。 這個(gè)值的設(shè)置是根據(jù)本地的jprofiler監(jiān)控后得到的一個(gè)理想的值,不能一概而論原搬照抄。 ü -XX:+CMSParallelRemarkEnabled 在使用UseParNewGC 的情況下, 盡量減少 mark 的時(shí)間 ü -XX:+UseCMSCompactAtFullCollection 在使用concurrent gc 的情況下, 防止 memoryfragmention, 對(duì)live object 進(jìn)行整理, 使 memory 碎片減少。 ü -XX:LargePageSizeInBytes 指定 Java heap的分頁頁面大小 ü -XX:+UseFastAccessorMethods get,set 方法轉(zhuǎn)成本地代碼 ü -XX:+UseCMSInitiatingOccupancyOnly 指示只有在 oldgeneration 在使用了初始化的比例后concurrent collector 啟動(dòng)收集 ü -XX:CMSInitiatingOccupancyFraction=70 CMSInitiatingOccupancyFraction,這個(gè)參數(shù)設(shè)置有很大技巧,基本上滿足(Xmx-Xmn)*(100- CMSInitiatingOccupancyFraction)/100>=Xmn就不會(huì)出現(xiàn)promotion failed。在我的應(yīng)用中Xmx是6000,Xmn是512,那么Xmx-Xmn是5488兆,也就是年老代有5488 兆,CMSInitiatingOccupancyFraction=90說明年老代到90%滿的時(shí)候開始執(zhí)行對(duì)年老代的并發(fā)垃圾回收(CMS),這時(shí)還 剩10%的空間是5488*10%=548兆,所以即使Xmn(也就是年輕代共512兆)里所有對(duì)象都搬到年老代里,548兆的空間也足夠了,所以只要滿 足上面的公式,就不會(huì)出現(xiàn)垃圾回收時(shí)的promotion failed; 因此這個(gè)參數(shù)的設(shè)置必須與Xmn關(guān)聯(lián)在一起。 ü -Djava.awt.headless=true 這個(gè)參數(shù)一般我們都是放在最后使用的,這全參數(shù)的作用是這樣的,有時(shí)我們會(huì)在我們的J2EE工程中使用一些圖表工具如:jfreechart,用于在web網(wǎng)頁輸出GIF/JPG等流,在winodws環(huán)境下,一般我們的app server在輸出圖形時(shí)不會(huì)碰到什么問題,但是在linux/unix環(huán)境下經(jīng)常會(huì)碰到一個(gè)exception導(dǎo)致你在winodws開發(fā)環(huán)境下圖片顯示的好好可是在linux/unix下卻顯示不出來,因此加上這個(gè)參數(shù)以免避這樣的情況出現(xiàn)。 上述這樣的配置,基本上可以達(dá)到: ü 系統(tǒng)響應(yīng)時(shí)間增快 ü JVM回收速度增快同時(shí)又不影響系統(tǒng)的響應(yīng)率 ü JVM內(nèi)存最大化利用 ü 線程阻塞情況最小化 2.3 Tomcat容器內(nèi)的優(yōu)化前面我們對(duì)Tomcat啟動(dòng)時(shí)的命令進(jìn)行了優(yōu)化,增加了系統(tǒng)的JVM可使用數(shù)、垃圾回收效率與線程阻塞情況、增加了系統(tǒng)響應(yīng)效率等還有一個(gè)很重要的指標(biāo),我們沒有去做優(yōu)化,就是吞吐量。 還記得我們?cè)诘谌斓膶W(xué)習(xí)中說的,這個(gè)系統(tǒng)本身可以處理1000,你沒有優(yōu)化和配置導(dǎo)致它默認(rèn)只能處理25。因此下面我們來看Tomcat容器內(nèi)的優(yōu)化。 打開tomcat安裝目錄\conf\server.xml文件,定位到這一行:
這一行就是我們的tomcat容器性能參數(shù)設(shè)置的地方,它一般都會(huì)有一個(gè)默認(rèn)值,這些默認(rèn)值是遠(yuǎn)遠(yuǎn)不夠我們的使用的,我們來看經(jīng)過更改后的這一段的配置:
好大一陀唉。。。。。。 沒關(guān)系,一個(gè)個(gè)來解釋 ü URIEncoding=”UTF-8” 使得tomcat可以解析含有中文名的文件的url,真方便,不像apache里還有搞個(gè)mod_encoding,還要手工編譯 ü maxSpareThreads maxSpareThreads 的意思就是如果空閑狀態(tài)的線程數(shù)多于設(shè)置的數(shù)目,則將這些線程中止,減少這個(gè)池中的線程總數(shù)。 ü minSpareThreads 最小備用線程數(shù),tomcat啟動(dòng)時(shí)的初始化的線程數(shù)。 ü enableLookups 這個(gè)功效和Apache中的HostnameLookups一樣,設(shè)為關(guān)閉。 ü connectionTimeout connectionTimeout為網(wǎng)絡(luò)連接超時(shí)時(shí)間毫秒數(shù)。 ü acceptCount acceptCount為允許最大連接數(shù),比如說并發(fā)300個(gè)VU就是300。 ü maxThreads maxThreads Tomcat使用線程來處理接收的每個(gè)請(qǐng)求。這個(gè)值表示Tomcat可創(chuàng)建的最大的線程數(shù)。 ü maxProcessors與minProcessors 在 Java中線程是程序運(yùn)行時(shí)的路徑,是在一個(gè)程序中與其它控制線程無關(guān)的、能夠獨(dú)立運(yùn)行的代碼段。它們共享相同的地址空間。多線程幫助程序員寫出CPU最 大利用率的高效程序,使空閑時(shí)間保持最低,從而接受更多的請(qǐng)求。 通常Windows是1000個(gè)左右,Linux是2000個(gè)左右。 ü useURIValidationHack 我們來看一下tomcat中的一段源碼:
可以看到如果把useURIValidationHack設(shè)成"false",可以減少它對(duì)一些url的不必要的檢查從而減省開銷。 ü enableLookups="false" 為了消除DNS查詢對(duì)性能的影響我們可以關(guān)閉DNS查詢,方式是修改server.xml文件中的enableLookups參數(shù)值。 ü disableUploadTimeout 類似于Apache中的keeyalive一樣 ü 給Tomcat配置gzip壓縮(HTTP壓縮)功能
HTTP 壓縮可以大大提高瀏覽網(wǎng)站的速度,它的原理是,在客戶端請(qǐng)求網(wǎng)頁后,從服務(wù)器端將網(wǎng)頁文件壓縮,再下載到客戶端,由客戶端的瀏覽器負(fù)責(zé)解壓縮并瀏覽。相對(duì)于普通的瀏覽過程HTML,CSS,Javascript , Text ,它可以節(jié)省40%左右的流量。更為重要的是,它可以對(duì)動(dòng)態(tài)生成的,包括CGI、PHP , JSP , ASP , Servlet,SHTML等輸出的網(wǎng)頁也能進(jìn)行壓縮,壓縮效率驚人。 1)compression="on" 打開壓縮功能 2)compressionMinSize="2048" 啟用壓縮的輸出內(nèi)容大小,這里面默認(rèn)為2KB 3)noCompressionUserAgents="gozilla, traviata" 對(duì)于以下的瀏覽器,不啟用壓縮 4)compressableMimeType="text/html,text/xml" 壓縮類型 最后不要忘了把8443端口的地方也加上同樣的配置,因?yàn)槿绻覀冏遠(yuǎn)ttps協(xié)議的話,我們將會(huì)用到8443端口這個(gè)段的配置,對(duì)吧?
好了,所有的Tomcat優(yōu)化的地方都加上了。結(jié)合第三天中的Apache的性能優(yōu)化,我們這個(gè)架構(gòu)可以“飛奔”起來了,當(dāng)然這邊把有提及任何關(guān)于數(shù)據(jù)庫優(yōu)化的步驟,但僅憑這兩步,我們的系統(tǒng)已經(jīng)有了很大的提升。 舉個(gè)真實(shí)的例子:上一個(gè)項(xiàng)目,經(jīng)過4輪performance testing,第一輪進(jìn)行了問題的定位,第二輪就是進(jìn)行了apache+tomcat/weblogic的優(yōu)化,第三輪是做集群優(yōu)化,第四輪是sql與codes的優(yōu)化。 在到達(dá)第二輪時(shí),我們的性能已經(jīng)提升了多少倍呢?我們來看一個(gè)loaderrunner的截圖吧: 左邊第一列是第一輪沒有經(jīng)過任何調(diào)優(yōu)的壓力測(cè)試報(bào)告。 右邊這一列是經(jīng)過了apache優(yōu)化,tomcat優(yōu)化后得到的壓力測(cè)試報(bào)告。 大家看看,這就提高了多少倍?這還只是在沒有改動(dòng)代碼的情況下得到的改善,現(xiàn)在明白了好好的調(diào)優(yōu)一個(gè)apache和tomcat其實(shí)是多么的重要了?如果加上后面的代碼、SQL的調(diào)優(yōu)、數(shù)據(jù)庫的調(diào)優(yōu)。。。。。。所以我在上一個(gè)工程中有單筆交易性能(無論是吞吐量、響應(yīng)時(shí)間)提高了80倍這樣的極端例子的存在。 |
|