最近一段時(shí)間看到版上關(guān)于浮點(diǎn)變量精度的討論比較多,那么我就給對(duì)這個(gè)問(wèn)題有疑惑的人詳細(xì)的講解一下intel的處理器上是如何處理浮點(diǎn)數(shù)的。為了能更方便的講解,我在這里只以float型為例,從存儲(chǔ)結(jié)構(gòu)和算法上來(lái)講,double和float是一樣的,不一樣的地方僅僅是float是32位的,double是64位的,所以double能存儲(chǔ)更高的精度。還要說(shuō)的一點(diǎn)是文章和程序一樣,兼容性是有一定范圍的,所以你想要完全讀懂本文,你最好對(duì)二進(jìn)制、十進(jìn)制、十六進(jìn)制的轉(zhuǎn)換有比較深入的了解,了解數(shù)據(jù)在內(nèi)存中的存儲(chǔ)結(jié)構(gòu),并且會(huì)使用VC.net編譯簡(jiǎn)單的控制臺(tái)程序。OK,下面我們開(kāi)始。
大家都知道任何數(shù)據(jù)在內(nèi)存中都是以二進(jìn)制(1或著0)順序存儲(chǔ)的,每一個(gè)1或著0被稱為1位,而在x86CPU上一個(gè)字節(jié)是8位。比如一個(gè)16位(2字節(jié))的short int型變量的值是1156,那么它的二進(jìn)制表達(dá)就是:00000100 10000100。由于Intel CPU的架構(gòu)是Little Endian(請(qǐng)參數(shù)機(jī)算機(jī)原理相關(guān)知識(shí)),所以它是按字節(jié)倒序存儲(chǔ)的,那么就因該是這樣:10000100 00000100,這就是定點(diǎn)數(shù)1156在內(nèi)存中的結(jié)構(gòu)。
那么浮點(diǎn)數(shù)是如何存儲(chǔ)的呢?目前已知的所有的C/C++編譯器都是按照IEEE(國(guó)際電子電器工程師協(xié)會(huì))制定的IEEE 浮點(diǎn)數(shù)表示法來(lái)進(jìn)行運(yùn)算的。這種結(jié)構(gòu)是一種科學(xué)表示法,用符號(hào)(正或負(fù))、指數(shù)和尾數(shù)來(lái)表示,底數(shù)被確定為2,也就是說(shuō)是把一個(gè)浮點(diǎn)數(shù)表示為尾數(shù)乘以2的指數(shù)次方再加上符號(hào)。下面來(lái)看一下具體的float的規(guī)格:
float
共計(jì)32位,折合4字節(jié)
由最高到最低位分別是第31、30、29、……、0位
31位是符號(hào)位,1表示該數(shù)為負(fù),0反之。
30-23位,一共8位是指數(shù)位。
22-0位,一共23位是尾數(shù)位。
每8位分為一組,分成4組,分別是A組、B組、C組、D組。
每一組是一個(gè)字節(jié),在內(nèi)存中逆序存儲(chǔ),即:DCBA
我們先不考慮逆序存儲(chǔ)的問(wèn)題,因?yàn)槟菢訒?huì)把讀者徹底搞暈,所以我先按照順序的來(lái)講,最后再把他們翻過(guò)來(lái)就行了。
現(xiàn)在讓我們按照IEEE浮點(diǎn)數(shù)表示法,一步步的將float型浮點(diǎn)數(shù)123456.0f轉(zhuǎn)換為十六進(jìn)制代碼。在處理這種不帶小數(shù)的浮點(diǎn)數(shù)時(shí),直接將整數(shù)部轉(zhuǎn)化為二進(jìn)制表示:1 11100010 01000000也可以這樣表示:11110001001000000.0然后將小數(shù)點(diǎn)向左移,一直移到離最高位只有1位,就是最高位的1:1.11100010010000000一共移動(dòng)了16位,在布耳運(yùn)算中小數(shù)點(diǎn)每向左移一位就等于在以2為底的科學(xué)計(jì)算法表示中指數(shù)+1,所以原數(shù)就等于這樣:1.11100010010000000 * ( 2 ^ 16 )好了,現(xiàn)在我們要的尾數(shù)和指數(shù)都出來(lái)了。顯而易見(jiàn),最高位永遠(yuǎn)是1,因?yàn)槟悴豢赡馨奄I了16個(gè)雞蛋說(shuō)成是買了0016個(gè)雞蛋吧?(呵呵,可別拿你買的臭雞蛋甩我~),所以這個(gè)1我們還有必要保留他嗎?(眾:沒(méi)有!)好的,我們刪掉他。這樣尾數(shù)的二進(jìn)制就變成了:11100010010000000最后在尾數(shù)的后面補(bǔ)0,一直到補(bǔ)夠23位:11100010010000000000000(MD,這些個(gè)0差點(diǎn)沒(méi)把我數(shù)的背過(guò)氣去~)
再回來(lái)看指數(shù),一共8位,可以表示范圍是0 - 255的無(wú)符號(hào)整數(shù),也可以表示-128 - 127的有符號(hào)整數(shù)。但因?yàn)橹笖?shù)是可以為負(fù)的,所以為了統(tǒng)一把十進(jìn)制的整數(shù)化為二進(jìn)制時(shí),都先加上127,在這里,我們的16加上127后就變成了143,二進(jìn)制表示為:10001111
12345.0f這個(gè)數(shù)是正的,所以符號(hào)位是0,那么我們按照前面講的格式把它拼起來(lái):
0 10001111 11100010010000000000000
01000111 11110001 00100000 00000000
再轉(zhuǎn)化為16進(jìn)制為:47 F1 20 00,最后把它翻過(guò)來(lái),就成了:00 20 F1 47。
現(xiàn)在你自己把54321.0f轉(zhuǎn)為二進(jìn)制表示,自己動(dòng)手練一下!
有了上面的基礎(chǔ)后,下面我再舉一個(gè)帶小數(shù)的例子來(lái)看一下為什么會(huì)出現(xiàn)精度問(wèn)題。
按照IEEE浮點(diǎn)數(shù)表示法,將float型浮點(diǎn)數(shù)123.456f轉(zhuǎn)換為十六進(jìn)制代碼。對(duì)于這種帶小數(shù)的就需要把整數(shù)部和小數(shù)部分開(kāi)處理。整數(shù)部直接化二進(jìn)制:100100011。小數(shù)部的處理比較麻煩一些,也不太好講,可能反著講效果好一點(diǎn),比如有一個(gè)十進(jìn)制純小數(shù)0.57826,那么5是十分位,位階是1/10;7是百分位,位階是1/100;8是千分位,位階是1/1000……,這些位階分母的關(guān)系是10^1、10^2、10^3……,現(xiàn)假設(shè)每一位的序列是{S1、S2、S3、……、Sn},在這里就是5、7、8、2、6,而這個(gè)純小數(shù)就可以這樣表示:n = S1 * ( 1 / ( 10 ^ 1 ) ) + S2 * ( 1 / ( 10 ^ 2 ) ) + S3 * ( 1 / ( 10 ^ 3 ) ) + …… + Sn * ( 1 / ( 10 ^ n ) )。把這個(gè)公式推廣到b進(jìn)制純小數(shù)中就是這樣:
n = S1 * ( 1 / ( b ^ 1 ) ) + S2 * ( 1 / ( b ^ 2 ) ) + S3 * ( 1 / ( b ^ 3 ) ) + …… + Sn * ( 1 / ( b ^ n ) )
天哪,可惡的數(shù)學(xué),我怎么快成了數(shù)學(xué)老師了!沒(méi)辦法,為了廣大編程愛(ài)好者的切身利益,喝口水繼續(xù)!現(xiàn)在一個(gè)二進(jìn)制純小數(shù)比如0.100101011就應(yīng)該比較好理解了,這個(gè)數(shù)的位階序列就因該是1/(2^1)、1/(2^2)、1/(2^3)、1/(2^4),即0.5、0.25、0.125、0.0625……。乘以S序列中的1或著0算出每一項(xiàng)再相加就可以得出原數(shù)了?,F(xiàn)在你的基礎(chǔ)知識(shí)因該足夠了,再回過(guò)頭來(lái)看0.45這個(gè)十進(jìn)制純小數(shù),化為該如何表示呢?現(xiàn)在你動(dòng)手算一下,最好不要先看到答案,這樣對(duì)你理解有好處。
我想你已經(jīng)迫不及待的想要看答案了,因?yàn)槟惆l(fā)現(xiàn)這跟本算不出來(lái)!來(lái)看一下步驟:1 / 2 ^1位(為了方便,下面僅用2的指數(shù)來(lái)表示位),0.456小于位階值0.5故為0;2位,0.456大于位階值0.25,該位為1,并將0.45減去0.25得0.206進(jìn)下一位;3位,0.206大于位階值0.125,該位為1,并將0.206減去0.125得0.081進(jìn)下一位;4位,0.081大于0.0625,為1,并將0.081減去0.0625得0.0185進(jìn)下一位;5位0.0185小于0.03125,為0……問(wèn)題出來(lái)了,即使超過(guò)尾數(shù)的最大長(zhǎng)度23位也除不盡!這就是著名的浮點(diǎn)數(shù)精度問(wèn)題了。不過(guò)我在這里不是要給大家講《數(shù)值計(jì)算》,用各種方法來(lái)提高計(jì)算精度,因?yàn)槟翘嬰s了,恐怕我講上一年也理不清個(gè)頭緒啊。我在這里就僅把浮點(diǎn)數(shù)表示法講清楚便達(dá)到目的了。
OK,我們繼續(xù)。嗯,剛說(shuō)哪了?哦對(duì)對(duì),那個(gè)數(shù)還沒(méi)轉(zhuǎn)完呢,反正最后一直求也求不盡,加上前面的整數(shù)部算夠24位就行了:1111011.01110100101111001。某BC問(wèn):“不是23位嗎?”我:“倒,不是說(shuō)過(guò)了要把第一個(gè)1去掉嗎?當(dāng)然要加一位嘍!”現(xiàn)在開(kāi)始向左移小數(shù)點(diǎn),大家和我一起移,眾:“1、2、3……”好了,一共移了6位,6加上127得131(怎么跟教小學(xué)生似的?呵呵~),二進(jìn)制表示為:10000101,符號(hào)位為……再……不說(shuō)了,越說(shuō)越啰嗦,大家自己看吧:
0 10000101 11101101110100101111001
42 F6 E9 79
79 E9 F6 42
下面再來(lái)講如何將純小數(shù)轉(zhuǎn)化為十六進(jìn)制。對(duì)于純小數(shù),比如0.0456,我們需要把他規(guī)格化,變?yōu)?.xxxx * (2 ^ n )的型式,要求得純小數(shù)X對(duì)應(yīng)的n可用下面的公式:
n = int( 1 + log (2)X );
0.0456我們可以表示為1.4592乘以以2為底的-5次方的冪,即1.4592 * ( 2 ^ -5 )。轉(zhuǎn)化為這樣形式后,再按照上面第二個(gè)例子里的流程處理:
1. 01110101100011100010001
去掉第一個(gè)1
01110101100011100010001
-5 + 127 = 122
0 01111010 01110101100011100010001
最后:
11 C7 3A 3D
另外不得不提到的一點(diǎn)是0.0f對(duì)應(yīng)的十六進(jìn)制是00 00 00 00,記住就可以了。
最后貼一個(gè)可以分析并輸出浮點(diǎn)數(shù)結(jié)構(gòu)的函數(shù)源代碼,有興趣的自己看看吧:
// 輸入4個(gè)字節(jié)的浮點(diǎn)數(shù)內(nèi)存數(shù)據(jù)
void DecodeFloat( BYTE pByte[4] )
{
printf( "原始(十進(jìn)制):%d %d %d %d\n" , (int)pByte[0],
(int)pByte[1], (int)pByte[2], (int)pByte[3] );
printf( "翻轉(zhuǎn)(十進(jìn)制):%d %d %d %d\n" , (int)pByte[3],
(int)pByte[2], (int)pByte[1], (int)pByte[0] );
bitset<32> bitAll( *(ULONG*)pByte );
string strBinary = bitAll.to_string<char, char_traits<char>, allocator<char> >();
strBinary.insert( 9, " " );
strBinary.insert( 1, " " );
cout << "二進(jìn)制:" << strBinary.c_str() << endl;
cout << "符號(hào):" << ( bitAll[31] ? "-" : "+" ) << endl;
bitset<32> bitTemp;
bitTemp = bitAll;
bitTemp <<= 1;
LONG ulExponent = 0;
for ( int i = 0; i < 8; i++ )
{
ulExponent |= ( bitTemp[ 31 - i ] << ( 7 - i ) );
}
ulExponent -= 127;
cout << "指數(shù)(十進(jìn)制):" << ulExponent << endl;
bitTemp = bitAll;
bitTemp <<= 9;
float fMantissa = 1.0f;
for ( int i = 0; i < 23; i++ )
{
bool b = bitTemp[ 31 - i ];
fMantissa += ( (float)bitTemp[ 31 - i ] / (float)( 2 << i ) );
}
cout << "尾數(shù)(十進(jìn)制):" << fMantissa << endl;
float fPow;
if ( ulExponent >= 0 )
{
fPow = (float)( 2 << ( ulExponent - 1 ) );
}
else
{
fPow = 1.0f / (float)( 2 << ( -1 - ulExponent ) );
}
cout << "運(yùn)算結(jié)果:" << fMantissa * fPow << endl;
}
累死了,我才發(fā)現(xiàn)這篇文章雖然短,然而確是最難寫(xiě)的。上帝,我也不是機(jī)算機(jī),然而為什么我滿眼都只有1和0?看來(lái)我也快成了黑客帝國(guó)里的那個(gè)看通迅員了……希望大家能不辜負(fù)我的一翻辛苦,幫忙up吧!
也就是32位浮點(diǎn)數(shù)在內(nèi)存中如果存儲(chǔ)為 79 E9 F6 42
則先將其到序 42 F6 E9 79使其高位在前
再將其轉(zhuǎn)化為二進(jìn)制
0 10000101 11101101110100101111001
最高位是符號(hào)位 0表示是正值
接下來(lái)8位是指數(shù)位 轉(zhuǎn)換為十進(jìn)制再減127 結(jié)果6
右移6位111011。01110100101111001
最前面添1 變?yōu)?111011。01110100101111001
整數(shù)部分為1111011 轉(zhuǎn)為十進(jìn)制 123
小數(shù)部分01110100101111001
其中0對(duì)應(yīng)2的-1次方,接下來(lái)的1對(duì)應(yīng)2的-2次方
即0*2(-1)+1*2(-2)+1*2(-3)+1*2(-4)+0*2(-5)+1*2(-6)...... ~ 0.456
最后相加接近于0。456
結(jié)果123.456
IEEE浮點(diǎn)數(shù)表示
從存儲(chǔ)結(jié)構(gòu)和算法上來(lái)講,double和float是一樣的,不一樣的地方僅僅是float是32位的,double是64位的,所以double能存儲(chǔ)更高的精度。
任何數(shù)據(jù)在內(nèi)存中都是以二進(jìn)制(0或1)順序存儲(chǔ)的,每一個(gè)1或0被稱為1位,而在x86CPU上一個(gè)字節(jié)是8位。比如一個(gè)16位(2字節(jié))的short int型變量的值是1000,那么它的二進(jìn)制表達(dá)就是:00000011 11101000。由于Intel CPU的架構(gòu)原因,它是按字節(jié)倒序存儲(chǔ)的,那么就因該是這樣:11101000 00000011,這就是定點(diǎn)數(shù)1000在內(nèi)存中的結(jié)構(gòu)。
目前C/C++編譯器標(biāo)準(zhǔn)都遵照IEEE制定的浮點(diǎn)數(shù)表示法來(lái)進(jìn)行float,double運(yùn)算。這種結(jié)構(gòu)是一種科學(xué)計(jì)數(shù)法,用符號(hào)、指數(shù)和尾數(shù)來(lái)表示,底數(shù)定為2——即把一個(gè)浮點(diǎn)數(shù)表示為尾數(shù)乘以2的指數(shù)次方再添上符號(hào)。下面是具體的規(guī)格:
````````符號(hào)位 階碼 尾數(shù) 長(zhǎng)度
float 1 8 23 32
double 1 11 52 64
臨時(shí)數(shù) 1 15 64 80
由于通常C編譯器默認(rèn)浮點(diǎn)數(shù)是double型的,下面以double為例:
共計(jì)64位,折合8字節(jié)。由最高到最低位分別是第63、62、61、……、0位:
最高位63位是符號(hào)位,1表示該數(shù)為負(fù),0正;
62-52位,一共11位是指數(shù)位;
51-0位,一共52位是尾數(shù)位。
^P
按照IEEE浮點(diǎn)數(shù)表示法,下面將把double型浮點(diǎn)數(shù)38414.4轉(zhuǎn)換為十六進(jìn)制代碼。
把整數(shù)部和小數(shù)部分開(kāi)處理:整數(shù)部直接化十六進(jìn)制:960E。小數(shù)的處理:
0.4=0.5*0+0.25*1+0.125*1+0.0625*0+……
實(shí)際上這永遠(yuǎn)算不完!這就是著名的浮點(diǎn)數(shù)精度問(wèn)題。所以直到加上前面的整數(shù)部分算夠53位就行了(隱藏位技術(shù):最高位的1不寫(xiě)入內(nèi)存)。
如果你夠耐心,手工算到53位那么因該是:38414.4(10)=1001011000001110.0110101010101010101010101010101010101(2)
科學(xué)記數(shù)法為:1.001……乘以2的15次方。指數(shù)為15!
于是來(lái)看階碼,一共11位,可以表示范圍是-1024 ~ 1023。因?yàn)橹笖?shù)可以為負(fù),為了便于計(jì)算,規(guī)定都先加上1023,在這里,15+1023=1038。二進(jìn)制表示為:100 00001110
符號(hào)位:正—— 0 !
合在一起(尾數(shù)二進(jìn)制最高位的1不要):
01000000 11100010 11000001 11001101 01010101 01010101 01010101 01010101
按字節(jié)倒序存儲(chǔ)的十六進(jìn)制數(shù)就是:
55 55 55 55 CD C1 E2 40