volatile提醒編譯器它后面所定義的變量隨時(shí)都有可能改變,因此編譯后的程序每次需要存儲(chǔ)或讀取這個(gè)變量的時(shí)候,都會(huì)直接從變量地址中讀取數(shù)據(jù)。如果沒有volatile關(guān)鍵字,則編譯器可能優(yōu)化讀取和存儲(chǔ),可能暫時(shí)使用寄存器中的值,如果這個(gè)變量由別的程序更新了的話,將出現(xiàn)不一致的現(xiàn)象。下面舉例說明。在DSP開發(fā)中,經(jīng)常需要等待某個(gè)事件的觸發(fā),所以經(jīng)常會(huì)寫出這樣的程序: short flag; void test() { do1(); while(flag==0); do2(); }
這段程序等待內(nèi)存變量flag的值變?yōu)?(懷疑此處是0,有點(diǎn)疑問,)之后才運(yùn)行do2()。變量flag的值由別的程序更改,這個(gè)程序可能是某個(gè)硬件中斷服務(wù)程序。例如:如果某個(gè)按鈕按下的話,就會(huì)對DSP產(chǎn)生中斷,在按鍵中斷程序中修改flag為1,這樣上面的程序就能夠得以繼續(xù)運(yùn)行。但是,編譯器并不知道flag的值會(huì)被別的程序修改,因此在它進(jìn)行優(yōu)化的時(shí)候,可能會(huì)把flag的值先讀入某個(gè)寄存器,然后等待那個(gè)寄存器變?yōu)?。如果不幸進(jìn)行了這樣的優(yōu)化,那么while循環(huán)就變成了死循環(huán),因?yàn)榧拇嫫鞯膬?nèi)容不可能被中斷服務(wù)程序修改。為了讓程序每次都讀取真正flag變量的值,就需要定義為如下形式: volatile short flag; 需要注意的是,沒有volatile也可能能正常運(yùn)行,但是可能修改了編譯器的優(yōu)化級別之后就又不能正常運(yùn)行了。因此經(jīng)常會(huì)出現(xiàn)debug版本正常,但是release版本卻不能正常的問題。所以為了安全起見,只要是等待別的程序修改某個(gè)變量的話,就加上volatile關(guān)鍵字。
volatile的本意是“易變的” 由于訪問寄存器的速度要快過RAM,所以編譯器一般都會(huì)作減少存取外部RAM的優(yōu)化。比如: static int i=0; int main(void) { ... while (1) { if (i) do_something(); } } /* Interrupt service routine. */ void ISR_2(void) { i=1; } 程序的本意是希望ISR_2中斷產(chǎn)生時(shí),在main當(dāng)中調(diào)用do_something函數(shù),但是,由于編譯器判斷在main函數(shù)里面沒有修改過i,因此可能只執(zhí)行一次對從i到某寄存器的讀操作,然后每次if判斷都只使用這個(gè)寄存器里面的“i副本”,導(dǎo)致do_something永遠(yuǎn)也不會(huì)被調(diào)用。如果變量加上volatile修飾,則編譯器保證對此變量的讀寫操作都不會(huì)被優(yōu)化(肯定執(zhí)行)。此例中i也應(yīng)該如此說明。 一般說來,volatile用在如下的幾個(gè)地方: 1、中斷服務(wù)程序中修改的供其它程序檢測的變量需要加volatile; 2、多任務(wù)環(huán)境下各任務(wù)間共享的標(biāo)志應(yīng)該加volatile; 3、存儲(chǔ)器映射的硬件寄存器通常也要加volatile說明,因?yàn)槊看螌λ淖x寫都可能由不同意義; 另外,以上這幾種情況經(jīng)常還要同時(shí)考慮數(shù)據(jù)的完整性(相互關(guān)聯(lián)的幾個(gè)標(biāo)志讀了一半被打斷了重寫),在1中可以通過關(guān)中斷來實(shí)現(xiàn),2中可以禁止任務(wù)調(diào)度,3中則只能依靠硬件的良好設(shè)計(jì)了。 二、volatile 的含義 volatile總是與優(yōu)化有關(guān),編譯器有一種技術(shù)叫做數(shù)據(jù)流分析,分析程序中的變量在哪里賦值、在哪里使用、在哪里失效,分析結(jié)果可以用于常量合并,常量傳播等優(yōu)化,進(jìn)一步可以死代碼消除。但有時(shí)這些優(yōu)化不是程序所需要的,這時(shí)可以用volatile關(guān)鍵字禁止做這些優(yōu)化,volatile的字面含義是易變的,它有下面的作用: 1 不會(huì)在兩個(gè)操作之間把volatile變量緩存在寄存器中。在多任務(wù)、中斷、甚至setjmp環(huán)境下,變量可能被其他的程序改變,編譯器自己無法知道,volatile就是告訴編譯器這種情況。 2 不做常量合并、常量傳播等優(yōu)化,所以像下面的代碼: volatile int i = 1; if (i > 0) ... if的條件不會(huì)當(dāng)作無條件真。 3 對volatile變量的讀寫不會(huì)被優(yōu)化掉。如果你對一個(gè)變量賦值但后面沒用到,編譯器常??梢允÷阅莻€(gè)賦值操作,然而對Memory Mapped IO的處理是不能這樣優(yōu)化的。 前面有人說volatile可以保證對內(nèi)存操作的原子性,這種說法不大準(zhǔn)確,其一,x86需要LOCK前綴才能在SMP下保證原子性,其二,RISC根本不能對內(nèi)存直接運(yùn)算,要保證原子性得用別的方法,如atomic_inc。 對于jiffies,它已經(jīng)聲明為volatile變量,我認(rèn)為直接用jiffies++就可以了,沒必要用那種復(fù)雜的形式,因?yàn)槟菢右膊荒鼙WC原子性。 你可能不知道在Pentium及后續(xù)CPU中,下面兩組指令 inc jiffies ;; mov jiffies, %eax inc %eax mov %eax, jiffies 作用相同,但一條指令反而不如三條指令快。 三、編譯器優(yōu)化 → C關(guān)鍵字volatile → memory破壞描述符zz
“memory”比較特殊,可能是內(nèi)嵌匯編中最難懂部分。為解釋清楚它,先介紹一下編譯器的優(yōu)化知識(shí),再看C關(guān)鍵字volatile。最后去看該描述符。 1、編譯器優(yōu)化介紹 內(nèi)存訪問速度遠(yuǎn)不及CPU處理速度,為提高機(jī)器整體性能,在硬件上引入硬件高速緩存Cache,加速對內(nèi)存的訪問。另外在現(xiàn)代CPU中指令的執(zhí)行并不一定嚴(yán)格按照順序執(zhí)行,沒有相關(guān)性的指令可以亂序執(zhí)行,以充分利用CPU的指令流水線,提高執(zhí)行速度。以上是硬件級別的優(yōu)化。再看軟件一級的優(yōu)化:一種是在編寫代碼時(shí)由程序員優(yōu)化,另一種是由編譯器進(jìn)行優(yōu)化。編譯器優(yōu)化常用的方法有:將內(nèi)存變量緩存到寄存器;調(diào)整指令順序充分利用CPU指令流水線,常見的是重新排序讀寫指令。對常規(guī)內(nèi)存進(jìn)行優(yōu)化的時(shí)候,這些優(yōu)化是透明的,而且效率很好。由編譯器優(yōu)化或者硬件重新排序引起的問題的解決辦法是在從硬件(或者其他處理器)的角度看必須以特定順序執(zhí)行的操作之間設(shè)置內(nèi)存屏障(memory barrier),linux 提供了一個(gè)宏解決編譯器的執(zhí)行順序問題。 void Barrier(void) 這個(gè)函數(shù)通知編譯器插入一個(gè)內(nèi)存屏障,但對硬件無效,編譯后的代碼會(huì)把當(dāng)前CPU寄存器中的所有修改過的數(shù)值存入內(nèi)存,需要這些數(shù)據(jù)的時(shí)候再重新從內(nèi)存中讀出。 2、C語言關(guān)鍵字volatile C語言關(guān)鍵字volatile(注意它是用來修飾變量而不是上面介紹的__volatile__)表明某個(gè)變量的值可能在外部被改變,因此對這些變量的存取不能緩存到寄存器,每次使用時(shí)需要重新存取。該關(guān)鍵字在多線程環(huán)境下經(jīng)常使用,因?yàn)樵诰帉懚嗑€程的程序時(shí),同一個(gè)變量可能被多個(gè)線程修改,而程序通過該變量同步各個(gè)線程,例如: DWORD __stdcall threadFunc(LPVOID signal) { int* intSignal=reinterpret_cast<int*>(signal); *intSignal=2; while(*intSignal!=1) sleep(1000); return 0; } 該線程啟動(dòng)時(shí)將intSignal 置為2,然后循環(huán)等待直到intSignal 為1 時(shí)退出。顯然intSignal的值必須在外部被改變,否則該線程不會(huì)退出。但是實(shí)際運(yùn)行的時(shí)候該線程卻不會(huì)退出,即使在外部將它的值改為1,看一下對應(yīng)的偽匯編代碼就明白了: mov ax,signal label: if(ax!=1) goto label 對于C編譯器來說,它并不知道這個(gè)值會(huì)被其他線程修改。自然就把它c(diǎn)ache在寄存器里面。記住,C 編譯器是沒有線程概念的!這時(shí)候就需要用到volatile。volatile 的本意是指:這個(gè)值可能會(huì)在當(dāng)前線程外部被改變。也就是說,我們要在threadFunc中的intSignal前面加上volatile關(guān)鍵字,這時(shí)候,編譯器知道該變量的值會(huì)在外部改變,因此每次訪問該變量時(shí)會(huì)重新讀取,所作的循環(huán)變?yōu)槿缦旅鎮(zhèn)未a所示: label: mov ax,signal if(ax!=1) goto label 3、Memory 有了上面的知識(shí)就不難理解Memory修改描述符了,Memory描述符告知GCC: 1)不要將該段內(nèi)嵌匯編指令與前面的指令重新排序;也就是在執(zhí)行內(nèi)嵌匯編代碼之前,它前面的指令都執(zhí)行完畢 2)不要將變量緩存到寄存器,因?yàn)檫@段代碼可能會(huì)用到內(nèi)存變量,而這些內(nèi)存變量會(huì)以不可預(yù)知的方式發(fā)生改變,因此GCC插入必要的代碼先將緩存到寄存器的變量值寫回內(nèi)存,如果后面又訪問這些變量,需要重新訪問內(nèi)存。 如果匯編指令修改了內(nèi)存,但是GCC 本身卻察覺不到,因?yàn)樵谳敵霾糠譀]有描述,此時(shí)就需要在修改描述部分增加“memory”,告訴GCC 內(nèi)存已經(jīng)被修改,GCC 得知這個(gè)信息后,就會(huì)在這段指令之前,插入必要的指令將前面因?yàn)閮?yōu)化Cache 到寄存器中的變量值先寫回內(nèi)存,如果以后又要使用這些變量再重新讀取。 使用“volatile”也可以達(dá)到這個(gè)目的,但是我們在每個(gè)變量前增加該關(guān)鍵字,不如使用“memory”方便。
|