多媒體數(shù)據(jù)壓縮編碼技術(shù)(一)

開(kāi)花結(jié)果 2011-04-14

展開(kāi)全文

1、基本概念

信息與數(shù)據(jù)：

·數(shù)據(jù)：用來(lái)記錄和傳送信息，或者說(shuō)數(shù)據(jù)是信息的載體。
·信息：真正有用的不是數(shù)據(jù)本身，而是數(shù)據(jù)所攜帶的信息。
·熵：一種信息定量化描述的量。描述的是系統(tǒng)有序的程度。

數(shù)據(jù)冗余

·冗余：信息量與數(shù)據(jù)量的差。
·I=D-du
I：信息量；D：數(shù)據(jù)量；du：冗余量，是指數(shù)據(jù)量D中含有的數(shù)據(jù)冗余。
·壓縮的必要性
·冗余類別

壓縮編碼

·預(yù)測(cè)編碼 ·變換編碼 ·向量量化編碼 ·統(tǒng)計(jì)編碼 ·子帶編碼 ·模型編碼

量化

·采樣：把時(shí)間上連續(xù)的模擬信號(hào)變成離散的有限個(gè)樣值的信號(hào)。
·采樣定理：香農(nóng)定理對(duì)于一個(gè)包含最高頻率f0的模擬信號(hào)，但選擇的采樣頻率f滿足f>=2f0時(shí)，經(jīng)過(guò)取樣后的離散信號(hào)能夠包含原模擬信號(hào)的全部信息，并且，經(jīng)過(guò)反變換和低通濾波，可以不失真地恢復(fù)出原始信號(hào)。
·量化：在幅度軸上把連續(xù)值的模擬信號(hào)變成為離散值的數(shù)字信號(hào)。
·編碼：把代表特定量化等級(jí)的比較器的輸出狀態(tài)組合，變換成一個(gè)n位表示的二進(jìn)制數(shù)碼。

編碼

·脈沖調(diào)制編碼 ·差分脈沖編碼調(diào)制 ·自適應(yīng)差分脈沖編碼 ·自適應(yīng)脈沖編碼調(diào)制 ·增量調(diào)制 ·自適應(yīng)增量調(diào)制

運(yùn)動(dòng)圖像壓縮標(biāo)準(zhǔn)MPEG

·I圖像（幀內(nèi)圖）：是利用圖像自身的相關(guān)性壓縮，提供壓縮數(shù)據(jù)流中的隨機(jī)存取的點(diǎn)，采用基于ADCT的編碼技術(shù)，壓縮后，每個(gè)像素為1～2比特。

·P圖像（預(yù)測(cè)圖）：是用最近的前一個(gè)I圖像（或P圖像）預(yù)測(cè)編碼得到（前向預(yù)測(cè)），也可以作為下一次預(yù)測(cè)的參照?qǐng)D像。

·B圖像（插補(bǔ)圖）：在預(yù)測(cè)時(shí)，既可使用前一個(gè)圖像作參照，也可使用下一個(gè)圖像作參照或同時(shí)使用前后兩個(gè)圖像作為參照?qǐng)D像（雙向預(yù)測(cè)）。P圖像（predicted picture），B圖像（bidirectional picture）。

·運(yùn)動(dòng)補(bǔ)償：運(yùn)動(dòng)補(bǔ)償假設(shè)當(dāng)前圖片是前面圖片的某種平移：當(dāng)某幀圖片被作為參考幀時(shí)，當(dāng)前編碼的幀和參考幀相比只是由于攝像機(jī)的移動(dòng)造成兩者的不同，這就為使用預(yù)測(cè)和內(nèi)插提供了機(jī)會(huì)。MPEG中，基于塊。

·預(yù)測(cè)編碼：運(yùn)動(dòng)補(bǔ)償試圖在壓縮時(shí)補(bǔ)償物體或攝像機(jī)的這一運(yùn)動(dòng)。為了更簡(jiǎn)單的對(duì)幀進(jìn)行比較，幀并不是作為一個(gè)整體被編碼。而是分成塊，對(duì)塊編碼。對(duì) 雨幀內(nèi)每個(gè)要被編碼的塊，參考幀中的最佳匹配塊都是在許多候選塊中搜索得到的。對(duì)每個(gè)塊都會(huì)產(chǎn)生一個(gè)運(yùn)動(dòng)向量（一個(gè)有大小、有方向的量）。我們可以把這個(gè) 向量看成一個(gè)有方向的箭頭，從參考幀中的位置指向正被編碼的幀中的塊的新位置。

·內(nèi)插編碼：也稱為插補(bǔ)法，運(yùn)動(dòng)向量的產(chǎn)生與兩個(gè)參考幀相關(guān)，在兩個(gè)參考幀中搜索最佳匹配塊，取平均值作為塊在當(dāng)前幀中的位置。

聲音編碼

·波形編譯碼器 ·音源編譯碼器 ·混合編碼器

2、信息與數(shù)據(jù)

2.1、信息與數(shù)據(jù)的概念

　　一個(gè)消息的可能性越小，其信息越多；消息的可能性越大，則信息越少。在數(shù)學(xué)上，所傳輸?shù)南⑹瞧涑霈F(xiàn)概率的單調(diào)下降函數(shù)。信息量是指從N個(gè)相等可能事件中選出一個(gè)事件所需要的信息度量或含量，也就是在辨識(shí)N個(gè)事件中特定的一個(gè)事件的過(guò)程中所需要提問(wèn)“是或否”的最少次數(shù)。

　　例如，要從256個(gè)數(shù)中選定某一個(gè)數(shù)，可以先提問(wèn)“是否大于128？”，不論回答是或否都消去了半數(shù)的可能事件，這樣繼續(xù)問(wèn)下去，只要提問(wèn)8次這類問(wèn)題，就能從256個(gè)數(shù)中選定某一個(gè)數(shù)，這是因?yàn)槊刻釂?wèn)一次都會(huì)得到1bit的信息量。因此，在256個(gè)數(shù)中選定某一個(gè)數(shù)所需要的信息量是：log2256=8bit。

·數(shù)據(jù)：用來(lái)記錄和傳送信息，或者說(shuō)數(shù)據(jù)是信息的載體。
·信息：真正有用的不是數(shù)據(jù)本身，而是數(shù)據(jù)所攜帶的信息。
·信息的定量化：熵，作為一種信息定量化描述的量。描述的是系統(tǒng)有序的程度。
·一個(gè)消息的可能性越小，其信息越多；消息的可能性越大，則信息越少。

　　設(shè)從N個(gè)數(shù)中選定任一個(gè)數(shù)x的概率為p(x)。假定選定任意一個(gè)數(shù)的概率都相等，即p(x)=1/N, 定義信息量為：

I(x)=log2N=-log(1/N)=-log2p(x)=I[p(x)]

　　如果將信源、所有可能事件的信息量進(jìn)行平均，就得到了信息的“熵”（entmpy）。信源X的符號(hào)集為xi(i=12 … N)，設(shè)均出現(xiàn)的概率為p(xi)，則信息源X的熵為 :

H(X)=∑p(xi)·I [p(xi)] = -∑p(xi)log2p(xi)

2.2、信息的數(shù)據(jù)量和壓縮的必要性

　　數(shù)字化了的視頻、音頻等媒體信息的數(shù)據(jù)量是很大的，下面分別以文本、圖形、圖像和聲音等類型的信息為例，計(jì)算它的數(shù)據(jù)量。

·文本

設(shè)屏幕的分辨率為768×512，字符大小為8×8點(diǎn)陣，每個(gè)字符用兩個(gè)字節(jié)表示，則：
滿屏字符的數(shù)量為：(768/8) * (512/8) = 6144（個(gè)）
存儲(chǔ)空間（字節(jié)）為：6144 * (2*8) = 96kbit = 12KB。

·矢量圖形

矢量圖形所需的存儲(chǔ)空間是比較小的。例如，存儲(chǔ)一幅由500條直線組成的矢量圖形，也就是要存儲(chǔ)構(gòu)造圖形的線條信息，每條線的信息可由起點(diǎn)X、起點(diǎn)Y、終點(diǎn)X、終點(diǎn)Y、屬性等五個(gè)項(xiàng)目表示，其中屬性一項(xiàng)是指線的顏色和寬度等性質(zhì)。設(shè)屏幕大小為768×512，屬性位用1字節(jié)表示，則：
每條線的存儲(chǔ)空間為：10*2 + 9*2 + 8 = 46bit
存儲(chǔ)這樣一幅圖形需要的空間為：500*46 = 2.8KB

·點(diǎn)陣圖

以一個(gè)簡(jiǎn)單的全屏點(diǎn)陣圖來(lái)看，設(shè)屏幕大小為768×512，每點(diǎn)是256色，則：
存儲(chǔ)一屏點(diǎn)陣圖需要的空間為：768*512*log2256 = 384KB
復(fù)雜的計(jì)算機(jī)真彩圖像通常是由掃描儀獲取的。如果要將一張11英寸×8.5英寸的彩色照片輸入計(jì)算機(jī)，掃描儀的分辨率設(shè)定為300dpi（點(diǎn)每英寸），每個(gè)像素的R、G、B分量分別為8位，掃描產(chǎn)生的就是24位的真彩圖，經(jīng)掃描儀數(shù)字化后的圖像就要占據(jù)25.245MB的存儲(chǔ)空間。

·數(shù)字化聲音（語(yǔ)音）

聲音的模擬帶寬為4KHz，采樣大小是8bit，采樣頻率為8kHz。存儲(chǔ)1s這樣的聲音需要的空間為：8k×8＝64kbit＝8KB

·數(shù)字化高質(zhì)量音頻

聲音的模擬帶寬為22KHz，采樣大小是32bit，采樣頻率至少為44KHz。存儲(chǔ)1s這樣的數(shù)字化音頻需要的空間為：44×32＝1408kbit＝176KB

·數(shù)字化視頻

PAL制式是歐洲和我國(guó)使用的彩色視頻圖像標(biāo)準(zhǔn)，其視頻帶寬為5MHz，幀速率為25幀/s，樣本寬是24bit，采樣頻率至少為1OMHz。因而存儲(chǔ)一幀數(shù)字化的PAL制式視頻圖像需要的空間為：10/25×24＝9.6Mbit＝1.2MB
存儲(chǔ)一秒種PAL制式的視頻圖像需要的空間為：12×25=30MB

2.3、傳輸多媒體信息的數(shù)據(jù)率和帶寬

數(shù)字音頻的數(shù)據(jù)率

	種	類	采樣率(KHz)	位數(shù)/樣本	數(shù)據(jù)率(kbps)
電話			8	8	64
電話會(huì)議			16	14	224
激光唱盤(CD-Audio)			44.1	16	705.6×2
數(shù)字音頻磁帶(DAT)			48	16	768

數(shù)字電視圖像的數(shù)據(jù)率 ( 未經(jīng)壓縮 ) 如下表所示

·SIF：Souce Input Fomat
·CCIR：Consultative Committee Intemathnal Radio
·HDTV：HidlDefinition Television Fomat

　　對(duì)于數(shù)字化聲音、高音頻信號(hào)以及視頻圖像，由于要實(shí)時(shí)播放，因而還要求加大CPU與內(nèi)存、外存之間的傳輸頻帶寬度：

·全彩色、全屏幕、全運(yùn)動(dòng)的視頻圖像要求數(shù)據(jù)傳輸帶寬為3OMB/s。高質(zhì)量音頻要求數(shù)據(jù)傳輸帶寬為176KB/s。
·語(yǔ)音要求數(shù)據(jù)傳輸帶寬為8KB/s。

3、數(shù)據(jù)冗余的類別

3.1、冗余的基本概念

　　信息量與數(shù)據(jù)量的關(guān)系：I=D-du，I：信息量；D：數(shù)據(jù)量；du：冗余量，是指數(shù)據(jù)量D中含有的數(shù)據(jù)冗余。

3.2、數(shù)據(jù)壓縮可行性

·因?yàn)橐曨l圖像或音頻信號(hào)等原始信號(hào)源存在著很大的冗余度。

·由于人的視覺(jué)對(duì)亮度信息很敏感，而對(duì)邊緣的急劇變化不敏感（視覺(jué)遮蓋效應(yīng)），同時(shí)聽(tīng)覺(jué)也隊(duì)部分頻率的音頻信號(hào)不敏感。

·因此視頻或音頻的數(shù)據(jù)壓縮后，再做解壓處理，人對(duì)恢復(fù)后的圖像或音頻信號(hào)仍有滿意的主觀感覺(jué)，也就是說(shuō)，人的感覺(jué)能接受這種數(shù)據(jù)壓縮。

3.3、數(shù)據(jù)冗余的類別

（1）空間冗余：規(guī)則物體和規(guī)則背景的表面物理特性都具有相關(guān)性，數(shù)字化后表現(xiàn)為數(shù)字冗余。例如：某圖片的畫面中有一個(gè)規(guī)則物體，其表面顏色均勻，各部分的亮度、飽和度相近，把該圖片作數(shù)字化處理，生成位圖后，很大數(shù)量的相鄰像素的數(shù)據(jù)是完全一樣或十分接近的，完全一樣的數(shù)據(jù)當(dāng)然可以壓縮，而十分接近的數(shù)據(jù)也可以壓縮，因?yàn)榛謴?fù)后人亦分辨不出它與原圖有什么區(qū)別，這種壓縮就是對(duì)空間冗余的壓縮。

（2）時(shí)間冗余：序列圖像（如電視圖像和運(yùn)動(dòng)圖像）和語(yǔ)音數(shù)據(jù)的前后有著很強(qiáng)的相關(guān)性，經(jīng)常包含著冗余。在播出該序列圖像時(shí)，時(shí)間發(fā)生了推移，但若干幅畫面的同一部位沒(méi)有變化，變化的只是其中某些地方，這就形成了時(shí)間冗余。

（3）統(tǒng)計(jì)冗余：空間冗余和時(shí)間冗余是把圖像信號(hào)看作概率信號(hào)時(shí)所反應(yīng)出的統(tǒng)計(jì)特性，因此，這兩種冗余也被稱為統(tǒng)計(jì)冗余。

（4）編碼冗余：同樣長(zhǎng)度的編碼可以表示不同的信息。

（5）結(jié)構(gòu)冗余：相似的，對(duì)稱的結(jié)構(gòu)如果都加以記錄就出現(xiàn)結(jié)構(gòu)冗余。

（6）知識(shí)冗余：由圖像的記錄方式與人對(duì)圖像的知識(shí)差異而產(chǎn)生的冗余。人對(duì)許多圖像的理解與某些基礎(chǔ)知識(shí)有很大的相關(guān)性。許多規(guī)律性的結(jié)構(gòu)人可以由先驗(yàn)知識(shí)和背景知識(shí)得到。而計(jì)算機(jī)存儲(chǔ)圖像時(shí)還得把一個(gè)個(gè)像素信息存入，這就形成冗余。

（7）視覺(jué)冗余：視覺(jué)系統(tǒng)對(duì)于圖像場(chǎng)的注意是非均勻和非線性的，視覺(jué)系統(tǒng)不是對(duì)圖像的任何變化都能感知。

4、常用數(shù)據(jù)壓縮技術(shù)概述

4.1、根據(jù)解碼后數(shù)據(jù)與原始數(shù)據(jù)是否完全一致進(jìn)行分類，數(shù)據(jù)壓縮方法一般劃分為兩類：

·無(wú)損壓縮：解碼圖像與原始圖像嚴(yán)格相同。壓縮比大約在2：1～5：1之間。如Huffman編碼、算術(shù)編碼、行程長(zhǎng)度編碼等。

·有損壓縮：還原圖像與原始圖像存在一定的誤差，但視覺(jué)效果一般可以接受，壓縮比可以從幾倍到上百倍。
如PCM（脈沖編碼調(diào)制）、預(yù)測(cè)編碼、變換編碼（主要是離散余弦變換方法）、插值和外推法（空域亞采樣、時(shí)域亞采樣、自適應(yīng)）等等。新一代的數(shù)據(jù)壓縮方法，如矢量量化和子帶編碼、基于模型的壓縮。分形壓縮和小波變換壓縮等等。

4.2、根據(jù)數(shù)據(jù)壓縮的原理進(jìn)行劃分，可以有以下幾類：

·預(yù)測(cè)編碼

它是利用空間中相鄰數(shù)據(jù)的相關(guān)性，利用過(guò)去和現(xiàn)在出現(xiàn)過(guò)的點(diǎn)的數(shù)據(jù)情況來(lái)預(yù)測(cè)未來(lái)點(diǎn)的數(shù)據(jù)。通常用的方法是差分脈沖編碼調(diào)制（DPCM）和自適應(yīng)差分脈沖編碼調(diào)制（ADPCM）。

·變換編碼

該方法將圖像光強(qiáng)矩陣（時(shí)域信號(hào)）變換到頻域空間上進(jìn)行處理。在時(shí)域空間上具有強(qiáng)相關(guān)的信號(hào)，反映在頻域上是某些特定的區(qū)域內(nèi)能量常常被集中在一起，我們只需將主要注意力放在相對(duì)小的區(qū)域上，從而實(shí)現(xiàn)壓縮。一般采用正交變換，如離散余弦變換（DCT）、離散傅立葉變換（DFT）、Walsh- Hadamard變換（WHT）和小波變換（WT），來(lái)實(shí)現(xiàn)壓縮算法。

·量化與向量量化編碼

對(duì)模擬信號(hào)進(jìn)行數(shù)字化時(shí)，要經(jīng)歷一個(gè)量化的過(guò)程。為了使整體量化失真最小，就必須依照統(tǒng)計(jì)的概率分布設(shè)計(jì)最優(yōu)的量化器。最優(yōu)量化器一般是非線性的，已知最優(yōu)量化器是Max量化器。我們對(duì)像元點(diǎn)進(jìn)行量化時(shí)，除了每次僅量化一個(gè)點(diǎn)的做法外，也可以考慮一次量化多個(gè)點(diǎn)的做法，這種方法稱為向量量化。例如我們每次量化相鄰的兩個(gè)點(diǎn)，將兩個(gè)點(diǎn)用一個(gè)量化碼字表示。向量量化的數(shù)據(jù)壓縮能力實(shí)際上與預(yù)測(cè)方法相近。

·統(tǒng)計(jì)編碼（信息熵編碼）

這是根據(jù)信息熵原理，讓出現(xiàn)概率大的符號(hào)用短的碼字表達(dá)，反之用長(zhǎng)的碼字表示。最常見(jiàn)的方法如Huffman編碼、Shannon編碼以及算術(shù)編碼。

·子帶（subband）編碼

將圖像數(shù)據(jù)變換到頻域后，按頻域分帶，然后用不同的量化器進(jìn)行量化，從而達(dá)到最優(yōu)的組合?；蛘叻植綕u近編碼，在初始時(shí)，對(duì)某一頻帶的信號(hào)進(jìn)行解碼，然后逐漸擴(kuò)展到所有頻帶。隨著解碼數(shù)據(jù)的增加，解碼圖像也逐漸變得清晰。

·模型編碼

編碼時(shí)首先將圖像中的邊界、輪廓、紋理等結(jié)構(gòu)特征找出來(lái)，然后保存這些參數(shù)信息。解碼時(shí)根據(jù)結(jié)構(gòu)和參數(shù)信息進(jìn)行合成，恢復(fù)原圖像。具體方法有輪廓編碼、域分割編碼、分析合成編碼、識(shí)別合成編碼、基于知識(shí)的編碼和分形編碼等。

5、量化的概念

5.1、采樣

5.1.1、取樣的概念

　　又稱為采樣，把時(shí)間上連續(xù)的模擬信號(hào)變成離散的有限個(gè)樣值的信號(hào)。

5.1.2、采樣定律

　　香農(nóng)定理對(duì)于一個(gè)包含最高頻率f0的模擬信號(hào)，但選擇的采樣頻率f滿足f>=2f0時(shí)，經(jīng)過(guò)取樣后的離散信號(hào)能夠包含原模擬信號(hào)的全部信息，并且，經(jīng)過(guò)反變換和低通濾波，可以不失真地恢復(fù)出原始信號(hào)。

5.2、量化

　　定義：量化是在幅度軸上把連續(xù)值的模擬信號(hào)變成為離散值的數(shù)字信號(hào)，在時(shí)間軸上已變?yōu)殡x散的樣值脈沖，在幅度軸上仍會(huì)在動(dòng)態(tài)范圍內(nèi)有連續(xù)值，可能出現(xiàn)任意幅度，即在幅度軸上仍是模擬信號(hào)的性質(zhì)，故還必須用有限電平等級(jí)來(lái)代替實(shí)際量值。

　　設(shè)信號(hào)的整個(gè)動(dòng)態(tài)變化范圍為A，共分為M個(gè)量化等級(jí)；每個(gè)量化等級(jí)為 △A，則有：△A=A/M。量化級(jí)通常用二進(jìn)制的位數(shù)n表示，它與十進(jìn)制數(shù)M之間的關(guān)系為M=2n或n=log2M通常稱為量化位數(shù)。例如，對(duì)于8位（bit）量化，相應(yīng)的十進(jìn)制量化等級(jí)M為：M=2^8=256。

　　量化的過(guò)程是把取樣后信號(hào)的電平歸并到有限個(gè)電平等級(jí)上，并以一個(gè)相應(yīng)的數(shù)據(jù)來(lái)表示。按歸并方式，可分為只舍不入方式和舍入方式。

·只舍不入方式，又稱截尾方式，即當(dāng)取樣信號(hào)電平處在兩個(gè)量化等級(jí)之間時(shí)，將其歸并到下面的量化等級(jí)上，而把超過(guò)部分舍去。

·舍取方式，又稱四舍五入方式，當(dāng)取樣信號(hào)電平超過(guò)某一量化等級(jí)一半時(shí)，歸并到上一量化等級(jí)；低于該量化等級(jí)一半時(shí)，則歸并到下一量化等級(jí)。不言而喻，在只舍不入方式中，量化后的電平與取樣信號(hào)實(shí)際電平之間的最大偏差（量化誤差）為一個(gè)量化等級(jí)△A，而在四舍五入方式中誤差為△A。由于四舍五入方式的量化誤差小，故通常選用這種方式。

5.3、編碼

　　編碼是把代表特定量化等級(jí)的比較器的輸出狀態(tài)組合，變換成一個(gè)n位表示的二進(jìn)制數(shù)碼，即每一組二進(jìn)制碼代表一個(gè)取樣值的量化電平等級(jí)。由于每個(gè) 樣值的量化電平等級(jí)由一組n位的二進(jìn)制數(shù)碼表示，所以，取樣頻率f與n位數(shù)的乘積nf就是每秒需處理和發(fā)送的位數(shù)，通常稱為比特率或數(shù)碼率。例如，CD音響的采樣頻率選用44.1kHz，量化位數(shù)n＝16，采用立體聲，相應(yīng)的比特率為：44.1kHz×16×2/8＝176.4kB/s。

6、統(tǒng)計(jì)編碼（信息熵編碼）

　　統(tǒng)計(jì)編碼是根據(jù)消息出現(xiàn)概率的分布特性而進(jìn)行的壓縮編碼，它有別于預(yù)測(cè)編碼和變換編碼。這種編碼的宗旨在于，在消息和碼字之間找到明確的一一對(duì) 應(yīng)關(guān)系，以便在恢復(fù)時(shí)能準(zhǔn)確無(wú)誤地再現(xiàn)出來(lái)，或者至少是極相似地找到相當(dāng)?shù)膶?duì)應(yīng)關(guān)系，并把這種失真或不對(duì)應(yīng)概率限制到可容忍的范圍內(nèi)。但不管什么途徑，它們總是要使平均碼長(zhǎng)或碼率壓低到最低限度。

　　常用的編碼有：Huffman碼、Shannon-Famo碼、算術(shù)編碼等。

6.1、哈夫曼（Huffman）編碼

6.1.1、哈夫曼編碼的方法

編碼過(guò)程如下：

（1）、將信源符號(hào)按概率遞減順序排列；
（2）、把兩個(gè)最小的概率加起來(lái)，作為新符號(hào)的概率；
（3）、重復(fù)步驟（1）、（2），直到概率和達(dá)到1為止；
（4）、在每次合并消息時(shí)，將被合并的消息賦以1和0或0和1；
（5）、尋找從每個(gè)信源符號(hào)到概率為1處的路徑，記錄下路徑上的1和0；
（6）、對(duì)每個(gè)符號(hào)寫出“1”、“0”序列（從碼數(shù)的根到終節(jié)點(diǎn)）。

6.1.2、哈夫曼編碼的特點(diǎn)

①、哈夫曼方法構(gòu)造出來(lái)的碼不是唯一的。

　　原因：
·在給兩個(gè)分支賦值時(shí)，可以是左支（或上支）為0，也可以是右支（或下支）為0，造成編碼的不唯一。
·當(dāng)兩個(gè)消息的概率相等時(shí)，誰(shuí)前誰(shuí)后也是隨機(jī)的，構(gòu)造出來(lái)的碼字就不是唯一的。

②、哈夫曼編碼碼字字長(zhǎng)參差不齊，因此硬件實(shí)現(xiàn)起來(lái)不大方便。

③、哈夫曼編碼對(duì)不同的信源的編碼效率是不同的。

　　·當(dāng)信源概率是2的負(fù)冪時(shí)，哈夫曼碼的編碼效率達(dá)到100%;
·當(dāng)信源概率相等時(shí)，其編碼效率最低。
·只有在概率分布很不均勻時(shí)，哈夫曼編碼才會(huì)收到顯著的效果，而在信源分布均勻的情況下，一般不使用哈夫曼編碼。

④、對(duì)信源進(jìn)行哈夫曼編碼后，形成了一個(gè)哈夫曼編碼表。解碼時(shí)，必須參照這一哈夫編碼表才能正確譯碼。

　　·在信源的存儲(chǔ)與傳輸過(guò)程中必須首先存儲(chǔ)或傳輸這一哈夫曼編碼表在實(shí)際計(jì)算壓縮效果時(shí)，必須考慮哈夫曼編碼表占有的比特?cái)?shù)。在某些應(yīng)用場(chǎng)合，信源概率服從于某一分布或存在一定規(guī)律（這主要由大量的統(tǒng)計(jì)得到），這樣就可以在發(fā)送端和接收端固定哈夫曼編碼表，在傳輸數(shù)據(jù)時(shí)就省去了傳輸哈夫曼編碼表，這種方法稱為哈夫曼編碼表缺省使用。

　　　　使用缺省的哈夫曼編碼表有兩點(diǎn)好處：

　　　　·降低了編碼的時(shí)間，改變了編碼和解碼的時(shí)間不對(duì)稱性；
·便于用硬件實(shí)現(xiàn)，編碼和解碼電路相對(duì)簡(jiǎn)單。這種方法適用于實(shí)時(shí)性要求較強(qiáng)的場(chǎng)合。雖然這種方法對(duì)某一個(gè)特定應(yīng)用來(lái)說(shuō)不一定最好，但從總體上說(shuō)，只要哈夫曼編表基于大量概率統(tǒng)計(jì)，其編碼效果是足夠好的。

6.1.3、哈夫曼編碼舉例

　　現(xiàn)在有8個(gè)待編碼的符號(hào)M0，…，M0它們的概率如下表所示，使用霍夫曼編碼算法求出8個(gè)符號(hào)所分配的代碼。（寫出編碼樹(shù)）

解：為了進(jìn)行哈夫曼編碼，先把這組數(shù)據(jù)由大到小排列，再按上方法處理
（1）、將信源符號(hào)按概率遞減順序排列。
（2）、首先將概率最小的兩個(gè)符號(hào)的概率相加，合成一個(gè)新的數(shù)值。
（3）、把合成的數(shù)值看成是一個(gè)新的組合符號(hào)概率，重復(fù)上述操作，直到剩下最后兩個(gè)符號(hào)。

6.2、Shannon-Famo編碼

　　Shannon-Famo(S-F)編碼方法與Huffman的編碼方法略有區(qū)別，但有時(shí)也能編出最佳碼。

6.2.1、S-F碼主要準(zhǔn)則

　　符合即時(shí)碼條件；在碼字中，1和0是獨(dú)立的，而且是（或差不多是）等概率的。這樣的準(zhǔn)則一方面能保證無(wú)需用間隔區(qū)分碼字，同時(shí)又保證每一位碼字幾乎有1位的信息量。

6.2.2、S-F碼的編碼過(guò)程

·信源符號(hào)按概率遞減順序排列；
·把符號(hào)集分成兩個(gè)子集，每個(gè)子集的概率和相等或近似相等；
·對(duì)第一個(gè)子集賦編碼“0”，對(duì)第二個(gè)子集賦編碼“1”；
·重復(fù)上述步驟，直到每個(gè)子集只包含一個(gè)信源符號(hào)為止。

6.3、游程編碼

　　游程編碼（簡(jiǎn)寫為RLE或RLC）是一種十分簡(jiǎn)單的壓縮方法，它將數(shù)據(jù)流中連續(xù)出現(xiàn)的字符（稱為游程）用單一的記號(hào)來(lái)表示。例如，字符串：

a b a C C C b b a a a a

可以壓縮為：

a b a 3c 2b 4a

　　游程編碼的壓縮效果不太好，但由于簡(jiǎn)單，編碼／解碼的速度非?？?，因此仍然得到廣泛的應(yīng)用。許多圖形和視頻文件，如.BMP、.TIF及.AVI等，都使用了這種壓縮。

6.4、算術(shù)編碼

6.4.1、算術(shù)編碼

　　算術(shù)編碼把一個(gè)信源集合表示為實(shí)數(shù)線上的0到1之間的一個(gè)區(qū)間。這個(gè)集合中的每個(gè)元素都要用來(lái)縮短這個(gè)區(qū)間。信源集合的元素越多，所得到的區(qū)間就越小，當(dāng)區(qū)間變小時(shí)，就需要更多的數(shù)位來(lái)表示這個(gè)區(qū)間，這就是區(qū)間作為代碼的原理。算術(shù)編碼首先假設(shè)一個(gè)信源的概率模型，然后用這些概率來(lái)縮小表示信源集的區(qū)間。

6.4.2、舉例說(shuō)明算術(shù)編碼過(guò)程

[例]設(shè)英文元音字母采用固定模式符號(hào)概率分配如下：

　　設(shè)編碼的數(shù)據(jù)串為eai。令high為編碼間隔的高端，low為編碼間隔的低端，range為編碼間隔的長(zhǎng)度，rangelow為編碼字符分配的間隔低端，rangehigh為編碼字符分配的間隔高端。

初始high=1，low=0，range＝high-low，一個(gè)字符編碼后新的low和high按下式計(jì)算：

·low =low＋range × rangelow
·high =low＋range×rangehigh

（1）、在第一個(gè)字符e被編碼時(shí)，e的rangelow＝0.2，rangehigh=0.5，因此：

low＝0 + 1 × 0.2 ＝ 0.2
high=0 + 1 × 0.5 ＝ 0.5
range=high-low=0.5－0.2=0.3
此時(shí)分配給e的范圍為[0.2,0.5] 。

（2）、第二個(gè)字符a編碼時(shí)使用新生成范圍[0.2,0.5]，a的rangelow=0，rangehigh=0.2，因此：

low=0.2 十 0.3 × 0=0.2
high=0.2 ＋0.3 × 0.2=0.26
range=0.06
范圍變成[0.2,0.26] 。

（3）、對(duì)下一個(gè)字符i編碼，i的rangelow=0.5，rangehigh=0.6，則：

low=0.2 ＋ 0.06 × 0.5=0.23
high=0.2 ＋ 0.06 × 0.6=0.236
即用[0.23,0.236]表示數(shù)據(jù)串eai，如果解碼器知道最后范圍是[0.23,0.236 ]這一范圍，它馬上可解得一個(gè)字符為e，然后依次得到惟一解a，即最終得到eai。

6.4.3、算術(shù)編碼的特點(diǎn)

①、不必預(yù)先定義概率模型，自適應(yīng)模式具有獨(dú)特的優(yōu)點(diǎn)；
②、信源符號(hào)概率接近時(shí)，建議使用算術(shù)編碼，這種情況下其效率高于Huffman編碼；
③、算術(shù)編碼繞過(guò)了用一個(gè)特定的代碼替代一個(gè)輸入符號(hào)的想法，用一個(gè)浮點(diǎn)輸出數(shù)值代替一個(gè)流的輸入符號(hào)，較長(zhǎng)的復(fù)雜的消息輸出的數(shù)值中就需要更多的位數(shù)。
④、算術(shù)編碼實(shí)現(xiàn)方法復(fù)雜一些，但JPEG成員對(duì)多幅圖像的測(cè)試結(jié)果表明，算術(shù)編碼比Huffman編碼提高了5%左右的效率，因此在JPEG擴(kuò)展系統(tǒng)中用算術(shù)編碼取代Huffman編碼。

7、脈沖編碼調(diào)制（PCM）

　　脈沖編碼調(diào)制（pulse code modulation，PCM），它是概念上最簡(jiǎn)單、理論上最完善的編譯系統(tǒng)。PCM的編碼原理比較直觀和簡(jiǎn)單，它的輸入是模擬信號(hào)，輸出是PCM樣本。

第一步采樣，每隔一段時(shí)間間隔讀一次聲音的幅度。

第二步量化，把采樣得到的聲音信號(hào)幅度轉(zhuǎn)換成數(shù)字值，有兩類量化的標(biāo)準(zhǔn)。

　　·均勻量化：采用相同間隔對(duì)采樣得到的信號(hào)做量化，也成為線性量化。量化時(shí)無(wú)論對(duì)多大的輸入信號(hào)還是對(duì)多小的輸入信號(hào)一律采用相同的量化間隔。為了適應(yīng)幅度大的輸入信號(hào)，同時(shí)又要滿足精度的要求，就需要增加樣本的位數(shù)。

　　·非均勻量化：對(duì)輸入信號(hào)進(jìn)行量化時(shí)，大的輸入信號(hào)采用大的量化間隔，小的輸入信號(hào)采用小的量化間隔。在非線性量化中，采用輸入信號(hào)幅度和量化輸出數(shù)據(jù)之間定義了兩種對(duì)應(yīng)關(guān)系，一種是在北美日本使用的壓擴(kuò)標(biāo)準(zhǔn)是U律（G.711）；另一種是在歐洲中國(guó)大陸使用A律（G.711）。

8、預(yù)測(cè)編碼

·預(yù)測(cè)編碼的概念

　　根據(jù)某一模型利用以往的樣本值對(duì)于新樣本值進(jìn)行預(yù)測(cè)，然后將樣本的實(shí)際值與其預(yù)測(cè)值相減得到一個(gè)誤差值，并對(duì)這一誤差值進(jìn)行編碼。如果模型足夠好并且樣本序列在時(shí)間上相關(guān)性較強(qiáng)，那么誤差信號(hào)的幅度將遠(yuǎn)遠(yuǎn)小于原始信號(hào)，從而可以得到較大的數(shù)據(jù)壓縮，可見(jiàn)，建立一個(gè)理想的預(yù)測(cè)器是很關(guān)鍵的。

8.1、差分脈沖編碼調(diào)制（DPCM）

　　差分脈沖編碼調(diào)制（DPCM）最簡(jiǎn)單的預(yù)測(cè)壓縮算法是在像素級(jí)使用差分脈沖編碼調(diào)制技術(shù)。

·差分編碼調(diào)制原理

　　對(duì)于比較相鄰的兩個(gè)像素，只傳送像素間的差異之處，由于相鄰像素通常是類似的，它們之間的差值很小，因而傳送差值需要的位數(shù)總是小于傳送整個(gè)像素需要的位數(shù)。

8.2、自適應(yīng)脈沖編碼調(diào)制（ADPCM）

　　APCMS是一種根據(jù)輸入信號(hào)幅度大小改變量化階大小的一種波形編碼技術(shù)。這種自適應(yīng)可以是瞬間自適應(yīng)，改變量化階的大小方法有兩種：

·前向自適應(yīng)（forward adaptation）就是根據(jù)未量化的樣本值的均方根來(lái)估算輸入信號(hào)的電平，以此來(lái)確定量化階的大小，并對(duì)其電平進(jìn)行編碼作為邊信息傳送到接收端。
·后向自適應(yīng)是從量化器剛輸出的過(guò)去樣本中來(lái)提取量化階信息。

8.3、自適應(yīng)差分脈沖編碼調(diào)制（ADPCM）

　　ADPCM綜合了APCM的自適應(yīng)特性和DPCM系統(tǒng)的差分特性，是一種性能比較好的波形編碼。它的核心想法是：

①、利用自適應(yīng)改變量化階的大小，即使用小的量化階去編碼小的差值，使用大的量化階去編碼大的差值。
②、使用過(guò)去的樣本值估算下一個(gè)輸人樣本的預(yù)測(cè)值，使實(shí)際樣本值和預(yù)測(cè)值之間的差值總是最小。

8.4、增量調(diào)制（DM，delta modulation）

　　它是一種預(yù)測(cè)編碼技術(shù)，是PCM編碼的一種變形。PCM是對(duì)每個(gè)采樣信號(hào)的整個(gè)幅度進(jìn)行量化編碼，因此它具有對(duì)任意波形進(jìn)行編碼的能力。

　　DM是對(duì)實(shí)際的采樣信號(hào)與預(yù)測(cè)的采樣信號(hào)之差的極性進(jìn)行編碼，將極性變成“0”和“1”這兩種可能的取值之一，如果實(shí)際的采樣信號(hào)與預(yù)測(cè)的采樣信號(hào)之差的極性為正，則用“1”表示；相反則用“0”表示，或者相反。由于DM編碼只需一位對(duì)信號(hào)進(jìn)行編碼，所以DM編碼系統(tǒng)又稱為“1位系統(tǒng)”。

8.5、自適應(yīng)增量調(diào)制（ADM，adaptive delta modulation）

　　為了使增量調(diào)制器的量化階也能自適應(yīng)，也就是根據(jù)輸入信號(hào)斜率的變化自動(dòng)調(diào)整量化階的大小，以使斜率過(guò)載和粒狀噪聲都減到最小。幾乎所有的方法基本上都是檢測(cè)到斜率過(guò)載時(shí)就開(kāi)始增大量化階，而在輸入信號(hào)的斜率減小時(shí)降低量化階。

9、頻域編碼

9.1、變換編碼（transform coding）

9.1.1、變換編碼簡(jiǎn)介

　　預(yù)測(cè)編碼的方法能夠壓縮圖像數(shù)據(jù)的空間和時(shí)間冗余性。特點(diǎn)是直觀、簡(jiǎn)捷和易于實(shí)現(xiàn)。在傳輸速度要求很高的應(yīng)用中，大多選用此方法。然而，預(yù)測(cè)方法的不足是壓縮能力有限。為了更好地提高壓縮能力，可以采用變換編碼方法。

　　變換編碼也是一種針對(duì)統(tǒng)計(jì)冗余進(jìn)行壓縮的方法，它是將圖像光強(qiáng)矩陣（時(shí)域信號(hào)）變換到系數(shù)空間（頻域）上進(jìn)行處理的方法。

9.1.2、變換編碼的思路

　　把一組數(shù)據(jù)轉(zhuǎn)換成另一種表示形式，這種表示形式有利于實(shí)現(xiàn)某一特定目標(biāo)。變換是可以反向進(jìn)行的，即存在反變換，以恢復(fù)原來(lái)的數(shù)據(jù)。在圖像壓縮中，一組數(shù)據(jù)是指一組像素（通常是二維數(shù)組）。變換將使這個(gè)二維數(shù)組數(shù)據(jù)量減少，以便于數(shù)據(jù)的傳輸和存儲(chǔ)。解壓縮時(shí)，利用反變換恢復(fù)原始像素。

9.1.3、變換編碼的基本方法

　　對(duì)于一組給定的時(shí)序信號(hào)Y(t)，分析這組信號(hào)的頻率、能量甚至模式等固有的特征或者求解時(shí)，可利用如傅立葉變換或Z變換等工具，比直接對(duì) Y(t)去積分和微分方便得多。這些變換是將時(shí)域上的信號(hào)Y(t)變換到頻域上，再進(jìn)行分析和求解，圖像壓縮問(wèn)題亦可以變換到頻域上去做。

9.1.4、變換方法的特點(diǎn)

①、在頻域上信息是按頻譜的能量與頻率分布排列的。在傅氏變換平面上，圖像信號(hào)場(chǎng)的能量集中在以圓點(diǎn)為中心的圓環(huán)內(nèi)，因而只要對(duì)頻域平面量化器進(jìn)行合理的比特分配，高能量區(qū)給以高比特，低能量區(qū)給以低比特，就可以得到高的壓縮能力。

②、變換運(yùn)算比其他方法的計(jì)算復(fù)雜性高。實(shí)際應(yīng)用中做圖像壓縮處理時(shí)，常用Hadamazd變換、離散余弦變換和傅立葉變換等。

9.2、子帶編碼（subband coding）

　　子帶編碼又稱分頻帶編碼。它將圖像數(shù)據(jù)變換到頻域后，按頻率分帶，然后用不同的量化器進(jìn)行量化，達(dá)到最優(yōu)的組合。

　　語(yǔ)言和圖像信息都有較寬的頻帶，信息的能量集中于低頻區(qū)域，細(xì)節(jié)和邊緣信息則集中于高頻區(qū)域。子帶編碼采取保留低頻系數(shù)舍去高頻系數(shù)的方法進(jìn)行編碼，操作時(shí)對(duì)低頻區(qū)域取較多的比特?cái)?shù)來(lái)編碼，以犧牲邊緣細(xì)節(jié)為代價(jià)來(lái)?yè)Q取比特?cái)?shù)的下降，恢復(fù)后的圖像比原圖模糊。

　　子帶編碼把原始圖像分割成不同頻段的子頻段帶，對(duì)不同的頻段子帶設(shè)計(jì)獨(dú)立的預(yù)測(cè)編碼器，分別進(jìn)行編碼和解碼。子帶編碼的結(jié)構(gòu)原理如圖所示。

　　子帶編碼的特點(diǎn)是：有較高的壓縮比和信噪比。

本站是提供個(gè)人知識(shí)管理的網(wǎng)絡(luò)存儲(chǔ)空間，所有內(nèi)容均由用戶發(fā)布，不代表本站觀點(diǎn)。請(qǐng)注意甄別內(nèi)容中的聯(lián)系方式、誘導(dǎo)購(gòu)買等信息，謹(jǐn)防詐騙。如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容，請(qǐng)點(diǎn)擊一鍵舉報(bào)。

轉(zhuǎn)藏 分享

QQ空間 QQ好友新浪微博微信

獻(xiàn)花（0） +1

來(lái)自：開(kāi)花結(jié)果 > 《知識(shí)解析》

舉報(bào)/認(rèn)領(lǐng)