一区二区三区日韩精品-日韩经典一区二区三区-五月激情综合丁香婷婷-欧美精品中文字幕专区

分享

多媒體數(shù)據(jù)壓縮編碼技術(shù)(一)

 開(kāi)花結(jié)果 2011-04-14

1、基本概念

信息與數(shù)據(jù):

·數(shù)據(jù): 用來(lái)記錄和傳送信息,或者說(shuō)數(shù)據(jù)是信息的載體。
·信息:真正有用的不是數(shù)據(jù)本身,而是數(shù)據(jù)所攜帶的信息。
·熵: 一種信息定量化描述的量。描述的是系統(tǒng)有序的程度。

數(shù)據(jù)冗余

·冗余:信息量與數(shù)據(jù)量的差。
·I=D-du
I:信息量;D:數(shù)據(jù)量;du:冗余量,是指數(shù)據(jù)量D中含有的數(shù)據(jù)冗余。
·壓縮的必要性
·冗余類別

壓縮編碼

·預(yù)測(cè)編碼 ·變換編碼 ·向量量化編碼 ·統(tǒng)計(jì)編碼 ·子帶編碼 ·模型編碼

量化

·采樣: 把時(shí)間上連續(xù)的模擬信號(hào)變成離散的有限個(gè)樣值的信號(hào)。
·采樣定理:香農(nóng)定理對(duì)于一個(gè)包含最高頻率f0的模擬信號(hào),但選擇的采樣頻率f滿足f>=2f0時(shí),經(jīng)過(guò)取樣后的離散信號(hào)能夠包含原模擬信號(hào)的全部信息,并且,經(jīng)過(guò)反變換和低通濾波,可以不失真地恢復(fù)出原始信號(hào)。
·量化:在幅度軸上把連續(xù)值的模擬信號(hào)變成為離散值的數(shù)字信號(hào)。
·編碼:把代表特定量化等級(jí)的比較器的輸出狀態(tài)組合,變換成一個(gè)n位表示的二進(jìn)制數(shù)碼。

編碼

·脈沖調(diào)制編碼 ·差分脈沖編碼調(diào)制 ·自適應(yīng)差分脈沖編碼 ·自適應(yīng)脈沖編碼調(diào)制 ·增量調(diào)制 ·自適應(yīng)增量調(diào)制

運(yùn)動(dòng)圖像壓縮標(biāo)準(zhǔn)MPEG

·I圖像(幀內(nèi)圖):是利用圖像自身的相關(guān)性壓縮,提供壓縮數(shù)據(jù)流中的隨機(jī)存取的點(diǎn),采用基于ADCT的編碼技術(shù),壓縮后,每個(gè)像素為1~2比特。

·P圖像(預(yù)測(cè)圖):是用最近的前一個(gè)I圖像(或P圖像)預(yù)測(cè)編碼得到(前向預(yù)測(cè)),也可以作為下一次預(yù)測(cè)的參照?qǐng)D像。

·B圖像(插補(bǔ)圖):在預(yù)測(cè)時(shí),既可使用前一個(gè)圖像作參照,也可使用下一個(gè)圖像作參照或同時(shí)使用前后兩個(gè)圖像作為參照?qǐng)D像(雙向預(yù)測(cè))。P圖像(predicted picture),B圖像(bidirectional picture)。

·運(yùn)動(dòng)補(bǔ)償:運(yùn)動(dòng)補(bǔ)償假設(shè)當(dāng)前圖片是前面圖片的某種平移:當(dāng)某幀圖片被作為參考幀時(shí),當(dāng)前編碼的幀和參考幀相比只是由于攝像機(jī)的移動(dòng)造成兩者的不同,這就為使用預(yù)測(cè)和內(nèi)插提供了機(jī)會(huì)。MPEG中,基于塊。

·預(yù)測(cè)編碼:運(yùn)動(dòng)補(bǔ)償試圖在壓縮時(shí)補(bǔ)償物體或攝像機(jī)的這一運(yùn)動(dòng)。為了更簡(jiǎn)單的對(duì)幀進(jìn)行比較,幀并不是作為一個(gè)整體被編碼。而是分成塊,對(duì)塊編碼。對(duì) 雨幀內(nèi)每個(gè)要被編碼的塊,參考幀中的最佳匹配塊都是在許多候選塊中搜索得到的。對(duì)每個(gè)塊都會(huì)產(chǎn)生一個(gè)運(yùn)動(dòng)向量(一個(gè)有大小、有方向的量)。我們可以把這個(gè) 向量看成一個(gè)有方向的箭頭,從參考幀中的位置指向正被編碼的幀中的塊的新位置。

·內(nèi)插編碼:也稱為插補(bǔ)法,運(yùn)動(dòng)向量的產(chǎn)生與兩個(gè)參考幀相關(guān),在兩個(gè)參考幀中搜索最佳匹配塊,取平均值作為塊在當(dāng)前幀中的位置。

聲音編碼

·波形編譯碼器 ·音源編譯碼器 ·混合編碼器

2、信息與數(shù)據(jù)

2.1、信息與數(shù)據(jù)的概念

  一個(gè)消息的可能性越小,其信息越多;消息的可能性越大,則信息越少。在數(shù)學(xué)上,所傳輸?shù)南⑹瞧涑霈F(xiàn)概率的單調(diào)下降函數(shù)。信息量是指從N個(gè)相等 可能事件中選出一個(gè)事件所需要的信息度量或含量,也就是在辨識(shí)N個(gè)事件中特定的一個(gè)事件的過(guò)程中所需要提問(wèn)“是或否”的最少次數(shù)。

  例如,要從256個(gè)數(shù)中選定某一個(gè)數(shù),可以先提問(wèn)“是否大于128?”,不論回答是或否都消去了半數(shù)的可能事件,這樣繼續(xù)問(wèn)下去,只要提問(wèn)8次 這類問(wèn)題,就能從256個(gè)數(shù)中選定某一個(gè)數(shù),這是因?yàn)槊刻釂?wèn)一次都會(huì)得到1bit的信息量。因此,在256個(gè)數(shù)中選定某一個(gè)數(shù)所需要的信息量 是:log2256=8bit。

·數(shù)據(jù):用來(lái)記錄和傳送信息,或者說(shuō)數(shù)據(jù)是信息的載體。
·信息:真正有用的不是數(shù)據(jù)本身,而是數(shù)據(jù)所攜帶的信息。
·信息的定量化:熵,作為一種信息定量化描述的量。描述的是系統(tǒng)有序的程度。
·一個(gè)消息的可能性越小,其信息越多;消息的可能性越大,則信息越少。

  設(shè)從N個(gè)數(shù)中選定任一個(gè)數(shù)x的概率為p(x)。假定選定任意一個(gè)數(shù)的概率都相等,即p(x)=1/N, 定義信息量為:

I(x)=log2N=-log(1/N)=-log2p(x)=I[p(x)]

  如果將信源、所有可能事件的信息量進(jìn)行平均,就得到了信息的“熵”(entmpy)。信源X的符號(hào)集為xi(i=12 … N),設(shè)均出現(xiàn)的概率為p(xi),則信息源X的熵為 :

H(X)=∑p(xi)·I [p(xi)] = -∑p(xi)log2p(xi)

2.2、信息的數(shù)據(jù)量和壓縮的必要性

  數(shù)字化了的視頻、音頻等媒體信息的數(shù)據(jù)量是很大的,下面分別以文本、圖形、圖像和聲音等類型的信息為例,計(jì)算它的數(shù)據(jù)量。

·文本

設(shè)屏幕的分辨率為768×512,字符大小為8×8點(diǎn)陣,每個(gè)字符用兩個(gè)字節(jié)表示,則:
滿屏字符的數(shù)量為:(768/8) * (512/8) = 6144(個(gè))
存儲(chǔ)空間(字節(jié))為:6144 * (2*8) = 96kbit = 12KB。

·矢量圖形

矢量圖形所需的存儲(chǔ)空間是比較小的。 例如,存儲(chǔ)一幅由500條直線組成的矢量圖形,也就是要存儲(chǔ)構(gòu)造圖形的線條信息,每條線的信息可由起點(diǎn)X、起點(diǎn)Y、終點(diǎn)X、終點(diǎn)Y、屬性等五個(gè)項(xiàng)目表示, 其中屬性一項(xiàng)是指線的顏色和寬度等性質(zhì)。設(shè)屏幕大小為768×512,屬性位用1字節(jié)表示,則:
每條線的存儲(chǔ)空間為:10*2 + 9*2 + 8 = 46bit
存儲(chǔ)這樣一幅圖形需要的空間為:500*46 = 2.8KB

·點(diǎn)陣圖

以一個(gè)簡(jiǎn)單的全屏點(diǎn)陣圖來(lái)看,設(shè)屏幕大小為768×512,每點(diǎn)是256色,則:
存儲(chǔ)一屏點(diǎn)陣圖需要的空間為:768*512*log2256 = 384KB
復(fù)雜的計(jì)算機(jī)真彩圖像通常是由掃描儀獲取的。如果要將一張11英寸×8.5英寸的彩色照片輸入計(jì)算機(jī),掃描儀的分辨率設(shè)定為300dpi(點(diǎn)每英寸),每 個(gè)像素的R、G、B分量分別為8位,掃描產(chǎn)生的就是24位的真彩圖,經(jīng)掃描儀數(shù)字化后的圖像就要占據(jù)25.245MB的存儲(chǔ)空間。

·數(shù)字化聲音(語(yǔ)音)

聲音的模擬帶寬為4KHz,采樣大小是8bit,采樣頻率為8kHz。存儲(chǔ)1s這樣的聲音需要的空間為:8k×8=64kbit=8KB

·數(shù)字化高質(zhì)量音頻

聲音的模擬帶寬為22KHz,采樣大小是32bit,采樣頻率至少為44KHz。存儲(chǔ)1s這樣的數(shù)字化音頻需要的空間為:44×32=1408kbit=176KB

·數(shù)字化視頻

PAL制式是歐洲和我國(guó)使用的彩色視頻圖像標(biāo)準(zhǔn),其視頻帶寬為5MHz,幀速率為25幀/s,樣本寬是24bit,采樣頻率至少為1OMHz。因而存儲(chǔ)一幀數(shù)字化的PAL制式視頻圖像需要的空間為:10/25×24=9.6Mbit=1.2MB
存儲(chǔ)一秒種PAL制式的視頻圖像需要的空間為:12×25=30MB

2.3、傳輸多媒體信息的數(shù)據(jù)率和帶寬

數(shù)字音頻的數(shù)據(jù)率


采樣率(KHz)

位數(shù)/樣本

數(shù)據(jù)率(kbps)



8

8

64

電話會(huì)議


16

14

224

激光唱盤(CD-Audio)

44.1

16

705.6×2

數(shù)字音頻磁帶(DAT)

48

16

768

數(shù)字電視圖像的數(shù)據(jù)率 ( 未經(jīng)壓縮 ) 表所示

·SIF:Souce Input Fomat
·CCIR:Consultative Committee Intemathnal Radio
·HDTV:HidlDefinition Television Fomat

  對(duì)于數(shù)字化聲音、高音頻信號(hào)以及視頻圖像,由于要實(shí)時(shí)播放,因而還要求加大CPU與內(nèi)存、外存之間的傳輸頻帶寬度:

·全彩色、全屏幕、全運(yùn)動(dòng)的視頻圖像要求數(shù)據(jù)傳輸帶寬為3OMB/s。高質(zhì)量音頻要求數(shù)據(jù)傳輸帶寬為176KB/s。
·語(yǔ)音要求數(shù)據(jù)傳輸帶寬為8KB/s。

3、數(shù)據(jù)冗余的類別

3.1、冗余的基本概念

  信息量與數(shù)據(jù)量的關(guān)系:I=D-du,I:信息量;D:數(shù)據(jù)量;du:冗余量,是指數(shù)據(jù)量D中含有的數(shù)據(jù)冗余。

3.2、數(shù)據(jù)壓縮可行性

·因?yàn)橐曨l圖像或音頻信號(hào)等原始信號(hào)源存在著很大的冗余度。

·由于人的視覺(jué)對(duì)亮度信息很敏感,而對(duì)邊緣的急劇變化不敏感(視覺(jué)遮蓋效應(yīng)),同時(shí)聽(tīng)覺(jué)也隊(duì)部分頻率的音頻信號(hào)不敏感。

·因此視頻或音頻的數(shù)據(jù)壓縮后,再做解壓處理,人對(duì)恢復(fù)后的圖像或音頻信號(hào)仍有滿意的主觀感覺(jué),也就是說(shuō),人的感覺(jué)能接受這種數(shù)據(jù)壓縮。

3.3、數(shù)據(jù)冗余的類別

(1)空間冗余:規(guī)則物體和規(guī)則背景的表面物理特性都具有相關(guān)性,數(shù)字化后表現(xiàn)為數(shù)字冗余。例如:某圖片的畫面中有一個(gè)規(guī)則物體,其表面顏色均勻, 各部分的亮度、飽和度相近,把該圖片作數(shù)字化處理,生成位圖后,很大數(shù)量的相鄰像素的數(shù)據(jù)是完全一樣或十分接近的,完全一樣的數(shù)據(jù)當(dāng)然可以壓縮,而十分接 近的數(shù)據(jù)也可以壓縮,因?yàn)榛謴?fù)后人亦分辨不出它與原圖有什么區(qū)別,這種壓縮就是對(duì)空間冗余的壓縮。

(2)時(shí)間冗余:序列圖像(如電視圖像和運(yùn)動(dòng)圖像)和語(yǔ)音數(shù)據(jù)的前后有著很強(qiáng)的相關(guān)性,經(jīng)常包含著冗余。在播出該序列圖像時(shí),時(shí)間發(fā)生了推移,但若干幅畫面的同一部位沒(méi)有變化,變化的只是其中某些地方,這就形成了時(shí)間冗余。

(3)統(tǒng)計(jì)冗余:空間冗余和時(shí)間冗余是把圖像信號(hào)看作概率信號(hào)時(shí)所反應(yīng)出的統(tǒng)計(jì)特性,因此,這兩種冗余也被稱為統(tǒng)計(jì)冗余。

(4)編碼冗余:同樣長(zhǎng)度的編碼可以表示不同的信息。

(5)結(jié)構(gòu)冗余:相似的,對(duì)稱的結(jié)構(gòu)如果都加以記錄就出現(xiàn)結(jié)構(gòu)冗余。

(6)知識(shí)冗余:由圖像的記錄方式與人對(duì)圖像的知識(shí)差異而產(chǎn)生的冗余。人對(duì)許多圖像的理解與某些基礎(chǔ)知識(shí)有很大的相關(guān)性。許多規(guī)律性的結(jié)構(gòu)人可以由先驗(yàn)知識(shí)和背景知識(shí)得到。而計(jì)算機(jī)存儲(chǔ)圖像時(shí)還得把一個(gè)個(gè)像素信息存入,這就形成冗余。

(7)視覺(jué)冗余:視覺(jué)系統(tǒng)對(duì)于圖像場(chǎng)的注意是非均勻和非線性的,視覺(jué)系統(tǒng)不是對(duì)圖像的任何變化都能感知。

4、常用數(shù)據(jù)壓縮技術(shù)概述

4.1、根據(jù)解碼后數(shù)據(jù)與原始數(shù)據(jù)是否完全一致進(jìn)行分類,數(shù)據(jù)壓縮方法一般劃分為兩類:

·無(wú)損壓縮:解碼圖像與原始圖像嚴(yán)格相同。壓縮比大約在2:1~5:1之間。如Huffman編碼、算術(shù)編碼、行程長(zhǎng)度編碼等。

·有損壓縮:還原圖像與原始圖像存在一定的誤差,但視覺(jué)效果一般可以接受,壓縮比可以從幾倍到上百倍。
如PCM(脈沖編碼調(diào)制)、預(yù)測(cè)編碼、變換編碼(主要是離散余弦變換方法)、插值和外推法(空域亞采樣、時(shí)域亞采樣、自適應(yīng))等等。新一代的數(shù)據(jù)壓縮方法,如矢量量化和子帶編碼、基于模型的壓縮。分形壓縮和小波變換壓縮等等。

4.2、根據(jù)數(shù)據(jù)壓縮的原理進(jìn)行劃分,可以有以下幾類:

·預(yù)測(cè)編碼

它是利用空間中相鄰數(shù)據(jù)的相關(guān)性,利用過(guò)去和現(xiàn)在出現(xiàn)過(guò)的點(diǎn)的數(shù)據(jù)情況來(lái)預(yù)測(cè)未來(lái)點(diǎn)的數(shù)據(jù)。通常用的方法是差分脈沖編碼調(diào)制(DPCM)和自適應(yīng)差分脈沖編碼調(diào)制(ADPCM)。

·變換編碼

該方法將圖像光強(qiáng)矩陣(時(shí)域信號(hào))變換到頻域空間上進(jìn)行處理。在時(shí)域空間上具有強(qiáng)相關(guān)的信號(hào),反映在頻域上是某些特定的區(qū)域內(nèi)能量常常被集中在一 起,我們只需將主要注意力放在相對(duì)小的區(qū)域上,從而實(shí)現(xiàn)壓縮。一般采用正交變換,如離散余弦變換(DCT)、離散傅立葉變換(DFT)、Walsh- Hadamard變換(WHT)和小波變換(WT),來(lái)實(shí)現(xiàn)壓縮算法。

·量化與向量量化編碼

對(duì)模擬信號(hào)進(jìn)行數(shù)字化時(shí),要經(jīng)歷一個(gè)量化的過(guò)程。為了使整體量化失真最小,就必須依照統(tǒng)計(jì)的概率分布設(shè)計(jì)最優(yōu)的量化器。最優(yōu)量化器一般是非線性的, 已知最優(yōu)量化器是Max量化器。我們對(duì)像元點(diǎn)進(jìn)行量化時(shí),除了每次僅量化一個(gè)點(diǎn)的做法外,也可以考慮一次量化多個(gè)點(diǎn)的做法,這種方法稱為向量量化。例如我 們每次量化相鄰的兩個(gè)點(diǎn),將兩個(gè)點(diǎn)用一個(gè)量化碼字表示。向量量化的數(shù)據(jù)壓縮能力實(shí)際上與預(yù)測(cè)方法相近。

·統(tǒng)計(jì)編碼(信息熵編碼)

這是根據(jù)信息熵原理,讓出現(xiàn)概率大的符號(hào)用短的碼字表達(dá),反之用長(zhǎng)的碼字表示。最常見(jiàn)的方法如Huffman編碼、Shannon編碼以及算術(shù)編碼。

·子帶(subband)編碼

將圖像數(shù)據(jù)變換到頻域后,按頻域分帶,然后用不同的量化器進(jìn)行量化,從而達(dá)到最優(yōu)的組合?;蛘叻植綕u近編碼,在初始時(shí),對(duì)某一頻帶的信號(hào)進(jìn)行解碼,然后逐漸擴(kuò)展到所有頻帶。隨著解碼數(shù)據(jù)的增加,解碼圖像也逐漸變得清晰。

·模型編碼

編碼時(shí)首先將圖像中的邊界、輪廓、紋理等結(jié)構(gòu)特征找出來(lái),然后保存這些參數(shù)信息。解碼時(shí)根據(jù)結(jié)構(gòu)和參數(shù)信息進(jìn)行合成,恢復(fù)原圖像。具體方法有輪廓編碼、域分割編碼、分析合成編碼、識(shí)別合成編碼、基于知識(shí)的編碼和分形編碼等。

5、量化的概念

5.1、采樣

5.1.1、取樣的概念

  又稱為采樣,把時(shí)間上連續(xù)的模擬信號(hào)變成離散的有限個(gè)樣值的信號(hào)。

5.1.2、采樣定律

  香農(nóng)定理對(duì)于一個(gè)包含最高頻率f0的模擬信號(hào),但選擇的采樣頻率f滿足f>=2f0時(shí),經(jīng)過(guò)取樣后的離散信號(hào)能夠包含原模擬信號(hào)的全部信息,并且,經(jīng)過(guò)反變換和低通濾波,可以不失真地恢復(fù)出原始信號(hào)。

5.2、量化

  定義:量化是在幅度軸上把連續(xù)值的模擬信號(hào)變成為離散值的數(shù)字信號(hào),在時(shí)間軸上已變?yōu)殡x散的樣值脈沖,在幅度軸上仍會(huì)在動(dòng)態(tài)范圍內(nèi)有連續(xù)值,可能出現(xiàn)任意幅度,即在幅度軸上仍是模擬信號(hào)的性質(zhì),故還必須用有限電平等級(jí)來(lái)代替實(shí)際量值。

  設(shè)信號(hào)的整個(gè)動(dòng)態(tài)變化范圍為A,共分為M個(gè)量化等級(jí);每個(gè)量化等級(jí)為 △A,則有:△A=A/M。量化級(jí)通常用二進(jìn)制的位數(shù)n表示,它與十進(jìn)制數(shù)M之間的關(guān)系為M=2n或n=log2M通常稱為量化位數(shù)。例如,對(duì)于8位 (bit)量化,相應(yīng)的十進(jìn)制量化等級(jí)M為:M=2^8=256。

  量化的過(guò)程是把取樣后信號(hào)的電平歸并到有限個(gè)電平等級(jí)上,并以一個(gè)相應(yīng)的數(shù)據(jù)來(lái)表示。按歸并方式, 可分為只舍不入方式和舍入方式。

·只舍不入方式,又稱截尾方式,即當(dāng)取樣信號(hào)電平處在兩個(gè)量化等級(jí)之間時(shí),將其歸并到下面的量化等級(jí)上,而把超過(guò)部分舍去。

·舍取方式,又稱四舍五入方式,當(dāng)取樣信號(hào)電平超過(guò)某一量化等級(jí)一半時(shí),歸并到上一量化等級(jí);低于該量化等級(jí)一半時(shí),則歸并到下一量化等級(jí)。不言而 喻,在只舍不入方式中,量化后的電平與取樣信號(hào)實(shí)際電平之間的最大偏差(量化誤差)為一個(gè)量化等級(jí)△A,而在四舍五入方式中誤差為△A。由于四舍五入方式 的量化誤差小,故通常選用這種方式。

5.3、編碼

  編碼是把代表特定量化等級(jí)的比較器的輸出狀態(tài)組合,變換成一個(gè)n位表示的二進(jìn)制數(shù)碼,即每一組二進(jìn)制碼代表一個(gè)取樣值的量化電平等級(jí)。由于每個(gè) 樣值的量化電平等級(jí)由一組n位的二進(jìn)制數(shù)碼表示,所以,取樣頻率f與n位數(shù)的乘積nf就是每秒需處理和發(fā)送的位數(shù),通常稱為比特率或數(shù)碼率。例如,CD音 響的采樣頻率選用44.1kHz,量化位數(shù)n=16,采用立體聲,相應(yīng)的比特率為:44.1kHz×16×2/8=176.4kB/s。

6、統(tǒng)計(jì)編碼(信息熵編碼)

  統(tǒng)計(jì)編碼是根據(jù)消息出現(xiàn)概率的分布特性而進(jìn)行的壓縮編碼,它有別于預(yù)測(cè)編碼和變換編碼。這種編碼的宗旨在于,在消息和碼字之間找到明確的一一對(duì) 應(yīng)關(guān)系,以便在恢復(fù)時(shí)能準(zhǔn)確無(wú)誤地再現(xiàn)出來(lái),或者至少是極相似地找到相當(dāng)?shù)膶?duì)應(yīng)關(guān)系,并把這種失真或不對(duì)應(yīng)概率限制到可容忍的范圍內(nèi)。但不管什么途徑,它 們總是要使平均碼長(zhǎng)或碼率壓低到最低限度。

  常用的編碼有:Huffman碼、Shannon-Famo碼、算術(shù)編碼等。

6.1、哈夫曼(Huffman)編碼

6.1.1、哈夫曼編碼的方法

編碼過(guò)程如下:

(1)、將信源符號(hào)按概率遞減順序排列;
(2)、把兩個(gè)最小的概率加起來(lái),作為新符號(hào)的概率;
(3)、重復(fù)步驟(1)、(2),直到概率和達(dá)到1為止;
(4)、在每次合并消息時(shí),將被合并的消息賦以1和0或0和1;
(5)、尋找從每個(gè)信源符號(hào)到概率為1處的路徑,記錄下路徑上的1和0;
(6)、對(duì)每個(gè)符號(hào)寫出“1”、“0”序列(從碼數(shù)的根到終節(jié)點(diǎn))。

6.1.2、哈夫曼編碼的特點(diǎn)

①、哈夫曼方法構(gòu)造出來(lái)的碼不是唯一的。

  原因:
·在給兩個(gè)分支賦值時(shí),可以是左支(或上支)為0,也可以是右支(或下支)為0,造成編碼的不唯一。
·當(dāng)兩個(gè)消息的概率相等時(shí),誰(shuí)前誰(shuí)后也是隨機(jī)的,構(gòu)造出來(lái)的碼字就不是唯一的。

②、哈夫曼編碼碼字字長(zhǎng)參差不齊,因此硬件實(shí)現(xiàn)起來(lái)不大方便。

③、哈夫曼編碼對(duì)不同的信源的編碼效率是不同的。

  ·當(dāng)信源概率是2的負(fù)冪時(shí),哈夫曼碼的編碼效率達(dá)到100%;
·當(dāng)信源概率相等時(shí),其編碼效率最低。
·只有在概率分布很不均勻時(shí),哈夫曼編碼才會(huì)收到顯著的效果,而在信源分布均勻的情況下,一般不使用哈夫曼編碼。

④、對(duì)信源進(jìn)行哈夫曼編碼后,形成了一個(gè)哈夫曼編碼表。解碼時(shí),必須參照這一哈夫編碼表才能正確譯碼。

  ·在信源的存儲(chǔ)與傳輸過(guò)程中必須首先存儲(chǔ)或傳輸這一哈夫曼編碼表在實(shí)際計(jì)算壓縮效果時(shí),必須考慮哈夫曼編碼表占有的比特?cái)?shù)。在某些應(yīng)用場(chǎng)合,信 源概率服從于某一分布或存在一定規(guī)律(這主要由大量的統(tǒng)計(jì)得到),這樣就可以在發(fā)送端和接收端固定哈夫曼編碼表,在傳輸數(shù)據(jù)時(shí)就省去了傳輸哈夫曼編碼表, 這種方法稱為哈夫曼編碼表缺省使用。

    使用缺省的哈夫曼編碼表有兩點(diǎn)好處:

    ·降低了編碼的時(shí)間,改變了編碼和解碼的時(shí)間不對(duì)稱性;
·便于用硬件實(shí)現(xiàn),編碼和解碼電路相對(duì)簡(jiǎn)單。這種方法適用于實(shí)時(shí)性要求較強(qiáng)的場(chǎng)合。雖然這種方法對(duì)某一個(gè)特定應(yīng)用來(lái)說(shuō)不一定最好,但從總體上說(shuō),只要哈夫曼編表基于大量概率統(tǒng)計(jì),其編碼效果是足夠好的。

6.1.3、哈夫曼編碼舉例

  現(xiàn)在有8個(gè)待編碼的符號(hào)M0,…,M0它們的概率如下表所示,使用霍夫曼編碼算法求出8個(gè)符號(hào)所分配的代碼。(寫出編碼樹(shù))

解:為了進(jìn)行哈夫曼編碼,先把這組數(shù)據(jù)由大到小排列,再按上方法處理
(1)、將信源符號(hào)按概率遞減順序排列。
(2)、首先將概率最小的兩個(gè)符號(hào)的概率相加,合成一個(gè)新的數(shù)值。
(3)、把合成的數(shù)值看成是一個(gè)新的組合符號(hào)概率,重復(fù)上述操作,直到剩下最后兩個(gè)符號(hào)。

6.2、Shannon-Famo編碼

  Shannon-Famo(S-F)編碼方法與Huffman的編碼方法略有區(qū)別,但有時(shí)也能編出最佳碼。

6.2.1、S-F碼主要準(zhǔn)則

  符合即時(shí)碼條件;在碼字中,1和0是獨(dú)立的,而且是(或差不多是)等概率的。這樣的準(zhǔn)則一方面能保證無(wú)需用間隔區(qū)分碼字,同時(shí)又保證每一位碼字幾乎有1位的信息量。

6.2.2、S-F碼的編碼過(guò)程

·信源符號(hào)按概率遞減順序排列;
·把符號(hào)集分成兩個(gè)子集,每個(gè)子集的概率和相等或近似相等;
·對(duì)第一個(gè)子集賦編碼“0”,對(duì)第二個(gè)子集賦編碼“1”;
·重復(fù)上述步驟,直到每個(gè)子集只包含一個(gè)信源符號(hào)為止。

6.3、游程編碼

  游程編碼(簡(jiǎn)寫為RLE或RLC)是一種十分簡(jiǎn)單的壓縮方法,它將數(shù)據(jù)流中連續(xù)出現(xiàn)的字符(稱為游程)用單一的記號(hào)來(lái)表示。例如,字符串:

a b a C C C b b a a a a

可以壓縮為:

a b a 3c 2b 4a

  游程編碼的壓縮效果不太好,但由于簡(jiǎn)單,編碼/解碼的速度非???,因此仍然得到廣泛的應(yīng)用。許多圖形和視頻文件,如.BMP、.TIF及.AVI等,都使用了這種壓縮。

6.4、算術(shù)編碼

6.4.1、算術(shù)編碼

  算術(shù)編碼把一個(gè)信源集合表示為實(shí)數(shù)線上的0到1之間的一個(gè)區(qū)間。這個(gè)集合中的每個(gè)元素都要用來(lái)縮短這個(gè)區(qū)間。信源集合的元素越多,所得到的區(qū)間 就越小,當(dāng)區(qū)間變小時(shí),就需要更多的數(shù)位來(lái)表示這個(gè)區(qū)間,這就是區(qū)間作為代碼的原理。算術(shù)編碼首先假設(shè)一個(gè)信源的概率模型,然后用這些概率來(lái)縮小表示信源 集的區(qū)間。

6.4.2、舉例說(shuō)明算術(shù)編碼過(guò)程

[例]設(shè)英文元音字母采用固定模式符號(hào)概率分配如下:

  設(shè)編碼的數(shù)據(jù)串為eai。令high為編碼間隔的高端,low為編碼間隔的低端,range為編碼間隔的長(zhǎng)度,rangelow為編碼字符分配的間隔低端,rangehigh為編碼字符分配的間隔高端。

初始high=1,low=0,range=high-low,一個(gè)字符編碼后新的low和high按下式計(jì)算:

·low =low+range × rangelow
·high =low+range×rangehigh

(1)、在第一個(gè)字符e被編碼時(shí),e的rangelow=0.2,rangehigh=0.5,因此:

low=0 + 1 × 0.2 = 0.2
high=0 + 1 × 0.5 = 0.5
range=high-low=0.5-0.2=0.3
此時(shí)分配給e的范圍為[0.2,0.5] 。

(2)、第二個(gè)字符a編碼時(shí)使用新生成范圍[0.2,0.5],a的rangelow=0,rangehigh=0.2,因此:

low=0.2 十 0.3 × 0=0.2
high=0.2 +0.3 × 0.2=0.26
range=0.06
范圍變成[0.2,0.26] 。

(3)、對(duì)下一個(gè)字符i編碼,i的rangelow=0.5,rangehigh=0.6,則:

low=0.2 + 0.06 × 0.5=0.23
high=0.2 + 0.06 × 0.6=0.236
即用[0.23,0.236]表示數(shù)據(jù)串eai,如果解碼器知道最后范圍是[0.23,0.236 ]這一范圍,它馬上可解得一個(gè)字符為e,然后依次得到惟一解a,即最終得到eai。

6.4.3、算術(shù)編碼的特點(diǎn)

①、不必預(yù)先定義概率模型,自適應(yīng)模式具有獨(dú)特的優(yōu)點(diǎn);
②、信源符號(hào)概率接近時(shí),建議使用算術(shù)編碼,這種情況下其效率高于Huffman編碼;
③、算術(shù)編碼繞過(guò)了用一個(gè)特定的代碼替代一個(gè)輸入符號(hào)的想法,用一個(gè)浮點(diǎn)輸出數(shù)值代替一個(gè)流的輸入符號(hào),較長(zhǎng)的復(fù)雜的消息輸出的數(shù)值中就需要更多的位數(shù)。
④、算術(shù)編碼實(shí)現(xiàn)方法復(fù)雜一些,但JPEG成員對(duì)多幅圖像的測(cè)試結(jié)果表明,算術(shù)編碼比Huffman編碼提高了5%左右的效率,因此在JPEG擴(kuò)展系統(tǒng)中用算術(shù)編碼取代Huffman編碼。

7、脈沖編碼調(diào)制(PCM)

  脈沖編碼調(diào)制(pulse code modulation,PCM),它是概念上最簡(jiǎn)單、理論上最完善的編譯系統(tǒng)。PCM的編碼原理比較直觀和簡(jiǎn)單,它的輸入是模擬信號(hào),輸出是PCM樣本。

第一步采樣,每隔一段時(shí)間間隔讀一次聲音的幅度。

第二步量化,把采樣得到的聲音信號(hào)幅度轉(zhuǎn)換成數(shù)字值,有兩類量化的標(biāo)準(zhǔn)。

  ·均勻量化:采用相同間隔對(duì)采樣得到的信號(hào)做量化,也成為線性量化。量化時(shí)無(wú)論對(duì)多大的輸入信號(hào)還是對(duì)多小的輸入信號(hào)一律采用相同的量化間隔。為了適應(yīng)幅度大的輸入信號(hào),同時(shí)又要滿足精度的要求,就需要增加樣本的位數(shù)。

  ·非均勻量化:對(duì)輸入信號(hào)進(jìn)行量化時(shí),大的輸入信號(hào)采用大的量化間隔,小的輸入信號(hào)采用小的量化間隔。在非線性量化中,采用輸入信號(hào)幅度和量化 輸出數(shù)據(jù)之間定義了兩種對(duì)應(yīng)關(guān)系,一種是在北美日本使用的壓擴(kuò)標(biāo)準(zhǔn)是U律(G.711);另一種是在歐洲中國(guó)大陸使用A律(G.711)。

8、預(yù)測(cè)編碼

·預(yù)測(cè)編碼的概念

  根據(jù)某一模型利用以往的樣本值對(duì)于新樣本值進(jìn)行預(yù)測(cè),然后將樣本的實(shí)際值與其預(yù)測(cè)值相減得到一個(gè)誤差值,并對(duì)這一誤差值進(jìn)行編碼。如果模型足夠 好并且樣本序列在時(shí)間上相關(guān)性較強(qiáng),那么誤差信號(hào)的幅度將遠(yuǎn)遠(yuǎn)小于原始信號(hào),從而可以得到較大的數(shù)據(jù)壓縮,可見(jiàn),建立一個(gè)理想的預(yù)測(cè)器是很關(guān)鍵的。

8.1、差分脈沖編碼調(diào)制(DPCM)

  差分脈沖編碼調(diào)制(DPCM)最簡(jiǎn)單的預(yù)測(cè)壓縮算法是在像素級(jí)使用差分脈沖編碼調(diào)制技術(shù)。

·差分編碼調(diào)制原理

  對(duì)于比較相鄰的兩個(gè)像素,只傳送像素間的差異之處,由于相鄰像素通常是類似的,它們之間的差值很小,因而傳送差值需要的位數(shù)總是小于傳送整個(gè)像素需要的位數(shù)。

8.2、自適應(yīng)脈沖編碼調(diào)制(ADPCM)

  APCMS是一種根據(jù)輸入信號(hào)幅度大小改變量化階大小的一種波形編碼技術(shù)。這種自適應(yīng)可以是瞬間自適應(yīng),改變量化階的大小方法有兩種:

·前向自適應(yīng)(forward adaptation)就是根據(jù)未量化的樣本值的均方根來(lái)估算輸入信號(hào)的電平,以此來(lái)確定量化階的大小,并對(duì)其電平進(jìn)行編碼作為邊信息傳送到接收端。
·后向自適應(yīng)是從量化器剛輸出的過(guò)去樣本中來(lái)提取量化階信息。

8.3、自適應(yīng)差分脈沖編碼調(diào)制(ADPCM)

  ADPCM綜合了APCM的自適應(yīng)特性和DPCM系統(tǒng)的差分特性,是一種性能比較好的波形編碼。它的核心想法是:

①、利用自適應(yīng)改變量化階的大小,即使用小的量化階去編碼小的差值,使用大的量化階去編碼大的差值。
②、使用過(guò)去的樣本值估算下一個(gè)輸人樣本的預(yù)測(cè)值,使實(shí)際樣本值和預(yù)測(cè)值之間的差值總是最小。

8.4、增量調(diào)制(DM,delta modulation)

  它是一種預(yù)測(cè)編碼技術(shù),是PCM編碼的一種變形。PCM是對(duì)每個(gè)采樣信號(hào)的整個(gè)幅度進(jìn)行量化編碼,因此它具有對(duì)任意波形進(jìn)行編碼的能力。

  DM是對(duì)實(shí)際的采樣信號(hào)與預(yù)測(cè)的采樣信號(hào)之差的極性進(jìn)行編碼,將極性變成“0”和“1”這兩種可能的取值之一,如果實(shí)際的采樣信號(hào)與預(yù)測(cè)的采樣 信號(hào)之差的極性為正,則用“1”表示;相反則用“0”表示,或者相反。由于DM編碼只需一位對(duì)信號(hào)進(jìn)行編碼,所以DM編碼系統(tǒng)又稱為“1位系統(tǒng)”。

8.5、自適應(yīng)增量調(diào)制(ADM,adaptive delta modulation)

  為了使增量調(diào)制器的量化階也能自適應(yīng),也就是根據(jù)輸入信號(hào)斜率的變化自動(dòng)調(diào)整量化階的大小,以使斜率過(guò)載和粒狀噪聲都減到最小。幾乎所有的方法基本上都是檢測(cè)到斜率過(guò)載時(shí)就開(kāi)始增大量化階,而在輸入信號(hào)的斜率減小時(shí)降低量化階。

9、頻域編碼

9.1、變換編碼(transform coding)

9.1.1、變換編碼簡(jiǎn)介

  預(yù)測(cè)編碼的方法能夠壓縮圖像數(shù)據(jù)的空間和時(shí)間冗余性。特點(diǎn)是直觀、簡(jiǎn)捷和易于實(shí)現(xiàn)。在傳輸速度要求很高的應(yīng)用中,大多選用此方法。然而,預(yù)測(cè)方法的不足是壓縮能力有限。為了更好地提高壓縮能力,可以采用變換編碼方法。

  變換編碼也是一種針對(duì)統(tǒng)計(jì)冗余進(jìn)行壓縮的方法,它是將圖像光強(qiáng)矩陣(時(shí)域信號(hào))變換到系數(shù)空間(頻域)上進(jìn)行處理的方法。

9.1.2、變換編碼的思路

  把一組數(shù)據(jù)轉(zhuǎn)換成另一種表示形式,這種表示形式有利于實(shí)現(xiàn)某一特定目標(biāo)。變換是可以反向進(jìn)行的,即存在反變換,以恢復(fù)原來(lái)的數(shù)據(jù)。在圖像壓縮 中,一組數(shù)據(jù)是指一組像素(通常是二維數(shù)組)。變換將使這個(gè)二維數(shù)組數(shù)據(jù)量減少,以便于數(shù)據(jù)的傳輸和存儲(chǔ)。解壓縮時(shí),利用反變換恢復(fù)原始像素。

9.1.3、變換編碼的基本方法

  對(duì)于一組給定的時(shí)序信號(hào)Y(t),分析這組信號(hào)的頻率、能量甚至模式等固有的特征或者求解時(shí),可利用如傅立葉變換或Z變換等工具,比直接對(duì) Y(t)去積分和微分方便得多。這些變換是將時(shí)域上的信號(hào)Y(t)變換到頻域上,再進(jìn)行分析和求解,圖像壓縮問(wèn)題亦可以變換到頻域上去做。

9.1.4、變換方法的特點(diǎn)

①、在頻域上信息是按頻譜的能量與頻率分布排列的。在傅氏變換平面上,圖像信號(hào)場(chǎng)的能量集中在以圓點(diǎn)為中心的圓環(huán)內(nèi),因而只要對(duì)頻域平面量化器進(jìn)行合理的比特分配,高能量區(qū)給以高比特,低能量區(qū)給以低比特,就可以得到高的壓縮能力。

②、變換運(yùn)算比其他方法的計(jì)算復(fù)雜性高。實(shí)際應(yīng)用中做圖像壓縮處理時(shí),常用Hadamazd變換、離散余弦變換和傅立葉變換等。

9.2、子帶編碼(subband coding)

  子帶編碼又稱分頻帶編碼。它將圖像數(shù)據(jù)變換到頻域后,按頻率分帶,然后用不同的量化器進(jìn)行量化,達(dá)到最優(yōu)的組合。

  語(yǔ)言和圖像信息都有較寬的頻帶,信息的能量集中于低頻區(qū)域,細(xì)節(jié)和邊緣信息則集中于高頻區(qū)域。子帶編碼采取保留低頻系數(shù)舍去高頻系數(shù)的方法進(jìn)行編碼,操作時(shí)對(duì)低頻區(qū)域取較多的比特?cái)?shù)來(lái)編碼,以犧牲邊緣細(xì)節(jié)為代價(jià)來(lái)?yè)Q取比特?cái)?shù)的下降,恢復(fù)后的圖像比原圖模糊。

  子帶編碼把原始圖像分割成不同頻段的子頻段帶,對(duì)不同的頻段子帶設(shè)計(jì)獨(dú)立的預(yù)測(cè)編碼器,分別進(jìn)行編碼和解碼。子帶編碼的結(jié)構(gòu)原理如圖所示。

  子帶編碼的特點(diǎn)是:有較高的壓縮比和信噪比。

    本站是提供個(gè)人知識(shí)管理的網(wǎng)絡(luò)存儲(chǔ)空間,所有內(nèi)容均由用戶發(fā)布,不代表本站觀點(diǎn)。請(qǐng)注意甄別內(nèi)容中的聯(lián)系方式、誘導(dǎo)購(gòu)買等信息,謹(jǐn)防詐騙。如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容,請(qǐng)點(diǎn)擊一鍵舉報(bào)。
    轉(zhuǎn)藏 分享 獻(xiàn)花(0

    0條評(píng)論

    發(fā)表

    請(qǐng)遵守用戶 評(píng)論公約

    類似文章 更多

    国产丝袜美女诱惑一区二区| 伊人色综合久久伊人婷婷| 色无极东京热男人的天堂| 国产精品亚洲二区三区| 久热香蕉精品视频在线播放| 欧美日韩人妻中文一区二区| 成人午夜视频在线播放| 欧美精品久久一二三区| 久久亚洲国产视频三级黄| 国产在线一区二区三区不卡| 日本午夜乱色视频在线观看| 国产一区二区三区av在线| 免费黄片视频美女一区| 免费在线播放不卡视频| 欧美日韩国产精品自在自线| 亚洲综合伊人五月天中文| 日本福利写真在线观看| 欧美激情中文字幕综合八区| 亚洲天堂精品在线视频| 大伊香蕉一区二区三区| 日韩aa一区二区三区| 精品高清美女精品国产区| 亚洲国产一级片在线观看| 日本一品道在线免费观看| 国产亚洲精品俞拍视频福利区| 一区二区三区国产日韩| 久久综合狠狠综合久久综合| 熟女高潮一区二区三区| 亚洲国产日韩欧美三级| 日本国产欧美精品视频| 99久久精品免费看国产高清| 我的性感妹妹在线观看| 亚洲国产精品久久网午夜| 日韩精品综合免费视频| 九九热视频网在线观看| 日本加勒比系列在线播放| 深夜视频在线观看免费你懂| 久久老熟女一区二区三区福利| 日韩精品在线观看一区| 91欧美亚洲视频在线| 国产精品午夜福利免费阅读|