DMIPS:Dhrystone Million Instructions executed Per Second,每秒執(zhí)行百萬(wàn)條指令,用來(lái)計(jì)算同一秒內(nèi)系統(tǒng)的處理能力,即每秒執(zhí)行了多少百萬(wàn)條指令。CPU的DMIPS算力計(jì)算公式為:內(nèi)核的數(shù)量 * 主頻 * DMIPS/MHz 。例如,六核A55架構(gòu),主頻為1.6GHz,性能為2.7DMIPS/MHz,算力DMIPS = 6 * 1660MHz * 2.7DMIPS/MHz = 31374 DMIPS. GPU用TOPS和FLOPS描述TOPS(Tera Operations Per Second的縮寫),1TOPS代表處理器每秒鐘可進(jìn)行一萬(wàn)億次(10^12)操作。TOPS=MAC矩陣行 * MAC矩陣列 * 主頻 * 2特斯拉的FSD芯片,96x96 MAC,主頻2GHz TOPS = 96 * 96 * 2000000000 * 2 = 36.864 TOPS FLOPS,即每秒浮點(diǎn)運(yùn)算次數(shù), 是每秒所執(zhí)行的浮點(diǎn)運(yùn)算次數(shù)(Floating-point operations per second;縮寫:FLOPS)的簡(jiǎn)稱,用來(lái)評(píng)價(jià)CPU的算力.MAC/FMA的全稱為Fused Multiply–accumulate operation, 也就是乘積累加指令,這種指令集融合了加法和乘法,使得處理器能夠在一個(gè)指令中同時(shí)完成乘法和加法操作,從而提高了計(jì)算效率。 SIMD的全稱叫做,單指令集多數(shù)據(jù)(Single Instruction Multiple Data)。最直觀的理解就是,向量計(jì)算。比如一個(gè)加法指令周期只能算一組數(shù)(一維向量相加),使用SIMD的話,一個(gè)加法指令周期可以同時(shí)算多組數(shù)(n維向量相加),二者用時(shí)基本相等,極大地提高了運(yùn)算效率。 1 TFLOPS = 10^3 GFLOPS = 10^6 MFLOPS = 10^12 FLOPS FLOPS=核數(shù)*單核主頻*單個(gè)周期浮點(diǎn)計(jì)算值單個(gè)周期浮點(diǎn)計(jì)算值(雙精度)=FMA數(shù)量*2(同時(shí)加法和乘法)*512/64 單個(gè)周期浮點(diǎn)計(jì)算值(單精度)=FMA數(shù)量*2(同時(shí)加法和乘法)*512/32 單精度和雙精度浮點(diǎn)運(yùn)算概念,簡(jiǎn)單的理解單精度就是指32bit的指令長(zhǎng)度的運(yùn)算,對(duì)應(yīng)操作系統(tǒng)就是32位操作系統(tǒng);雙精度就是指64bit指令長(zhǎng)度的運(yùn)算,對(duì)應(yīng)操作系統(tǒng)就是64位操作系統(tǒng)。 512:這個(gè)數(shù)值可能指的是CPU的某些硬件特性,如SIMD(Single Instruction, Multiple Data)寬度。SIMD寬度是CPU能夠同時(shí)處理的數(shù)據(jù)元素?cái)?shù)量。 |
|
來(lái)自: 新用戶74969uxn > 《芯片算力》