1、基本概念 信息與數(shù)據(jù): ·數(shù)據(jù): 用來(lái)記錄和傳送信息,或者說(shuō)數(shù)據(jù)是信息的載體。 數(shù)據(jù)冗余 ·冗余:信息量與數(shù)據(jù)量的差。 壓縮編碼 ·預(yù)測(cè)編碼 ·變換編碼 ·向量量化編碼 ·統(tǒng)計(jì)編碼 ·子帶編碼 ·模型編碼 量化 ·采樣: 把時(shí)間上連續(xù)的模擬信號(hào)變成離散的有限個(gè)樣值的信號(hào)。 編碼 ·脈沖調(diào)制編碼 ·差分脈沖編碼調(diào)制 ·自適應(yīng)差分脈沖編碼 ·自適應(yīng)脈沖編碼調(diào)制 ·增量調(diào)制 ·自適應(yīng)增量調(diào)制 運(yùn)動(dòng)圖像壓縮標(biāo)準(zhǔn)MPEG ·I圖像(幀內(nèi)圖):是利用圖像自身的相關(guān)性壓縮,提供壓縮數(shù)據(jù)流中的隨機(jī)存取的點(diǎn),采用基于ADCT的編碼技術(shù),壓縮后,每個(gè)像素為1~2比特。 ·P圖像(預(yù)測(cè)圖):是用最近的前一個(gè)I圖像(或P圖像)預(yù)測(cè)編碼得到(前向預(yù)測(cè)),也可以作為下一次預(yù)測(cè)的參照?qǐng)D像。 ·B圖像(插補(bǔ)圖):在預(yù)測(cè)時(shí),既可使用前一個(gè)圖像作參照,也可使用下一個(gè)圖像作參照或同時(shí)使用前后兩個(gè)圖像作為參照?qǐng)D像(雙向預(yù)測(cè))。P圖像(predicted picture),B圖像(bidirectional picture)。 ·運(yùn)動(dòng)補(bǔ)償:運(yùn)動(dòng)補(bǔ)償假設(shè)當(dāng)前圖片是前面圖片的某種平移:當(dāng)某幀圖片被作為參考幀時(shí),當(dāng)前編碼的幀和參考幀相比只是由于攝像機(jī)的移動(dòng)造成兩者的不同,這就為使用預(yù)測(cè)和內(nèi)插提供了機(jī)會(huì)。MPEG中,基于塊。 ·預(yù)測(cè)編碼:運(yùn)動(dòng)補(bǔ)償試圖在壓縮時(shí)補(bǔ)償物體或攝像機(jī)的這一運(yùn)動(dòng)。為了更簡(jiǎn)單的對(duì)幀進(jìn)行比較,幀并不是作為一個(gè)整體被編碼。而是分成塊,對(duì)塊編碼。對(duì) 雨幀內(nèi)每個(gè)要被編碼的塊,參考幀中的最佳匹配塊都是在許多候選塊中搜索得到的。對(duì)每個(gè)塊都會(huì)產(chǎn)生一個(gè)運(yùn)動(dòng)向量(一個(gè)有大小、有方向的量)。我們可以把這個(gè) 向量看成一個(gè)有方向的箭頭,從參考幀中的位置指向正被編碼的幀中的塊的新位置。 ·內(nèi)插編碼:也稱為插補(bǔ)法,運(yùn)動(dòng)向量的產(chǎn)生與兩個(gè)參考幀相關(guān),在兩個(gè)參考幀中搜索最佳匹配塊,取平均值作為塊在當(dāng)前幀中的位置。 聲音編碼 ·波形編譯碼器 ·音源編譯碼器 ·混合編碼器 2、信息與數(shù)據(jù) 2.1、信息與數(shù)據(jù)的概念 一個(gè)消息的可能性越小,其信息越多;消息的可能性越大,則信息越少。在數(shù)學(xué)上,所傳輸?shù)南⑹瞧涑霈F(xiàn)概率的單調(diào)下降函數(shù)。信息量是指從N個(gè)相等 可能事件中選出一個(gè)事件所需要的信息度量或含量,也就是在辨識(shí)N個(gè)事件中特定的一個(gè)事件的過(guò)程中所需要提問(wèn)“是或否”的最少次數(shù)。 例如,要從256個(gè)數(shù)中選定某一個(gè)數(shù),可以先提問(wèn)“是否大于128?”,不論回答是或否都消去了半數(shù)的可能事件,這樣繼續(xù)問(wèn)下去,只要提問(wèn)8次 這類問(wèn)題,就能從256個(gè)數(shù)中選定某一個(gè)數(shù),這是因?yàn)槊刻釂?wèn)一次都會(huì)得到1bit的信息量。因此,在256個(gè)數(shù)中選定某一個(gè)數(shù)所需要的信息量 是:log2256=8bit。 ·數(shù)據(jù):用來(lái)記錄和傳送信息,或者說(shuō)數(shù)據(jù)是信息的載體。 設(shè)從N個(gè)數(shù)中選定任一個(gè)數(shù)x的概率為p(x)。假定選定任意一個(gè)數(shù)的概率都相等,即p(x)=1/N, 定義信息量為: I(x)=log2N=-log(1/N)=-log2p(x)=I[p(x)] 如果將信源、所有可能事件的信息量進(jìn)行平均,就得到了信息的“熵”(entmpy)。信源X的符號(hào)集為xi(i=12 … N),設(shè)均出現(xiàn)的概率為p(xi),則信息源X的熵為 : H(X)=∑p(xi)·I [p(xi)] = -∑p(xi)log2p(xi) 2.2、信息的數(shù)據(jù)量和壓縮的必要性 數(shù)字化了的視頻、音頻等媒體信息的數(shù)據(jù)量是很大的,下面分別以文本、圖形、圖像和聲音等類型的信息為例,計(jì)算它的數(shù)據(jù)量。 ·文本 設(shè)屏幕的分辨率為768×512,字符大小為8×8點(diǎn)陣,每個(gè)字符用兩個(gè)字節(jié)表示,則: ·矢量圖形 矢量圖形所需的存儲(chǔ)空間是比較小的。
例如,存儲(chǔ)一幅由500條直線組成的矢量圖形,也就是要存儲(chǔ)構(gòu)造圖形的線條信息,每條線的信息可由起點(diǎn)X、起點(diǎn)Y、終點(diǎn)X、終點(diǎn)Y、屬性等五個(gè)項(xiàng)目表示,
其中屬性一項(xiàng)是指線的顏色和寬度等性質(zhì)。設(shè)屏幕大小為768×512,屬性位用1字節(jié)表示,則: ·點(diǎn)陣圖 以一個(gè)簡(jiǎn)單的全屏點(diǎn)陣圖來(lái)看,設(shè)屏幕大小為768×512,每點(diǎn)是256色,則: ·數(shù)字化聲音(語(yǔ)音) 聲音的模擬帶寬為4KHz,采樣大小是8bit,采樣頻率為8kHz。存儲(chǔ)1s這樣的聲音需要的空間為:8k×8=64kbit=8KB ·數(shù)字化高質(zhì)量音頻 聲音的模擬帶寬為22KHz,采樣大小是32bit,采樣頻率至少為44KHz。存儲(chǔ)1s這樣的數(shù)字化音頻需要的空間為:44×32=1408kbit=176KB ·數(shù)字化視頻 PAL制式是歐洲和我國(guó)使用的彩色視頻圖像標(biāo)準(zhǔn),其視頻帶寬為5MHz,幀速率為25幀/s,樣本寬是24bit,采樣頻率至少為1OMHz。因而存儲(chǔ)一幀數(shù)字化的PAL制式視頻圖像需要的空間為:10/25×24=9.6Mbit=1.2MB 2.3、傳輸多媒體信息的數(shù)據(jù)率和帶寬 數(shù)字音頻的數(shù)據(jù)率
數(shù)字電視圖像的數(shù)據(jù)率 ( 未經(jīng)壓縮 ) 如下表所示
·SIF:Souce Input Fomat 對(duì)于數(shù)字化聲音、高音頻信號(hào)以及視頻圖像,由于要實(shí)時(shí)播放,因而還要求加大CPU與內(nèi)存、外存之間的傳輸頻帶寬度: ·全彩色、全屏幕、全運(yùn)動(dòng)的視頻圖像要求數(shù)據(jù)傳輸帶寬為3OMB/s。高質(zhì)量音頻要求數(shù)據(jù)傳輸帶寬為176KB/s。 3、數(shù)據(jù)冗余的類別 3.1、冗余的基本概念 信息量與數(shù)據(jù)量的關(guān)系:I=D-du,I:信息量;D:數(shù)據(jù)量;du:冗余量,是指數(shù)據(jù)量D中含有的數(shù)據(jù)冗余。 3.2、數(shù)據(jù)壓縮可行性 ·因?yàn)橐曨l圖像或音頻信號(hào)等原始信號(hào)源存在著很大的冗余度。 ·由于人的視覺(jué)對(duì)亮度信息很敏感,而對(duì)邊緣的急劇變化不敏感(視覺(jué)遮蓋效應(yīng)),同時(shí)聽(tīng)覺(jué)也隊(duì)部分頻率的音頻信號(hào)不敏感。 ·因此視頻或音頻的數(shù)據(jù)壓縮后,再做解壓處理,人對(duì)恢復(fù)后的圖像或音頻信號(hào)仍有滿意的主觀感覺(jué),也就是說(shuō),人的感覺(jué)能接受這種數(shù)據(jù)壓縮。 3.3、數(shù)據(jù)冗余的類別 (1)空間冗余:規(guī)則物體和規(guī)則背景的表面物理特性都具有相關(guān)性,數(shù)字化后表現(xiàn)為數(shù)字冗余。例如:某圖片的畫面中有一個(gè)規(guī)則物體,其表面顏色均勻, 各部分的亮度、飽和度相近,把該圖片作數(shù)字化處理,生成位圖后,很大數(shù)量的相鄰像素的數(shù)據(jù)是完全一樣或十分接近的,完全一樣的數(shù)據(jù)當(dāng)然可以壓縮,而十分接 近的數(shù)據(jù)也可以壓縮,因?yàn)榛謴?fù)后人亦分辨不出它與原圖有什么區(qū)別,這種壓縮就是對(duì)空間冗余的壓縮。 (2)時(shí)間冗余:序列圖像(如電視圖像和運(yùn)動(dòng)圖像)和語(yǔ)音數(shù)據(jù)的前后有著很強(qiáng)的相關(guān)性,經(jīng)常包含著冗余。在播出該序列圖像時(shí),時(shí)間發(fā)生了推移,但若干幅畫面的同一部位沒(méi)有變化,變化的只是其中某些地方,這就形成了時(shí)間冗余。 (3)統(tǒng)計(jì)冗余:空間冗余和時(shí)間冗余是把圖像信號(hào)看作概率信號(hào)時(shí)所反應(yīng)出的統(tǒng)計(jì)特性,因此,這兩種冗余也被稱為統(tǒng)計(jì)冗余。 (4)編碼冗余:同樣長(zhǎng)度的編碼可以表示不同的信息。 (5)結(jié)構(gòu)冗余:相似的,對(duì)稱的結(jié)構(gòu)如果都加以記錄就出現(xiàn)結(jié)構(gòu)冗余。 (6)知識(shí)冗余:由圖像的記錄方式與人對(duì)圖像的知識(shí)差異而產(chǎn)生的冗余。人對(duì)許多圖像的理解與某些基礎(chǔ)知識(shí)有很大的相關(guān)性。許多規(guī)律性的結(jié)構(gòu)人可以由先驗(yàn)知識(shí)和背景知識(shí)得到。而計(jì)算機(jī)存儲(chǔ)圖像時(shí)還得把一個(gè)個(gè)像素信息存入,這就形成冗余。 (7)視覺(jué)冗余:視覺(jué)系統(tǒng)對(duì)于圖像場(chǎng)的注意是非均勻和非線性的,視覺(jué)系統(tǒng)不是對(duì)圖像的任何變化都能感知。 4、常用數(shù)據(jù)壓縮技術(shù)概述 4.1、根據(jù)解碼后數(shù)據(jù)與原始數(shù)據(jù)是否完全一致進(jìn)行分類,數(shù)據(jù)壓縮方法一般劃分為兩類: ·無(wú)損壓縮:解碼圖像與原始圖像嚴(yán)格相同。壓縮比大約在2:1~5:1之間。如Huffman編碼、算術(shù)編碼、行程長(zhǎng)度編碼等。 ·有損壓縮:還原圖像與原始圖像存在一定的誤差,但視覺(jué)效果一般可以接受,壓縮比可以從幾倍到上百倍。 4.2、根據(jù)數(shù)據(jù)壓縮的原理進(jìn)行劃分,可以有以下幾類: ·預(yù)測(cè)編碼 它是利用空間中相鄰數(shù)據(jù)的相關(guān)性,利用過(guò)去和現(xiàn)在出現(xiàn)過(guò)的點(diǎn)的數(shù)據(jù)情況來(lái)預(yù)測(cè)未來(lái)點(diǎn)的數(shù)據(jù)。通常用的方法是差分脈沖編碼調(diào)制(DPCM)和自適應(yīng)差分脈沖編碼調(diào)制(ADPCM)。 ·變換編碼 該方法將圖像光強(qiáng)矩陣(時(shí)域信號(hào))變換到頻域空間上進(jìn)行處理。在時(shí)域空間上具有強(qiáng)相關(guān)的信號(hào),反映在頻域上是某些特定的區(qū)域內(nèi)能量常常被集中在一 起,我們只需將主要注意力放在相對(duì)小的區(qū)域上,從而實(shí)現(xiàn)壓縮。一般采用正交變換,如離散余弦變換(DCT)、離散傅立葉變換(DFT)、Walsh- Hadamard變換(WHT)和小波變換(WT),來(lái)實(shí)現(xiàn)壓縮算法。 ·量化與向量量化編碼 對(duì)模擬信號(hào)進(jìn)行數(shù)字化時(shí),要經(jīng)歷一個(gè)量化的過(guò)程。為了使整體量化失真最小,就必須依照統(tǒng)計(jì)的概率分布設(shè)計(jì)最優(yōu)的量化器。最優(yōu)量化器一般是非線性的, 已知最優(yōu)量化器是Max量化器。我們對(duì)像元點(diǎn)進(jìn)行量化時(shí),除了每次僅量化一個(gè)點(diǎn)的做法外,也可以考慮一次量化多個(gè)點(diǎn)的做法,這種方法稱為向量量化。例如我 們每次量化相鄰的兩個(gè)點(diǎn),將兩個(gè)點(diǎn)用一個(gè)量化碼字表示。向量量化的數(shù)據(jù)壓縮能力實(shí)際上與預(yù)測(cè)方法相近。 ·統(tǒng)計(jì)編碼(信息熵編碼) 這是根據(jù)信息熵原理,讓出現(xiàn)概率大的符號(hào)用短的碼字表達(dá),反之用長(zhǎng)的碼字表示。最常見(jiàn)的方法如Huffman編碼、Shannon編碼以及算術(shù)編碼。 ·子帶(subband)編碼 將圖像數(shù)據(jù)變換到頻域后,按頻域分帶,然后用不同的量化器進(jìn)行量化,從而達(dá)到最優(yōu)的組合?;蛘叻植綕u近編碼,在初始時(shí),對(duì)某一頻帶的信號(hào)進(jìn)行解碼,然后逐漸擴(kuò)展到所有頻帶。隨著解碼數(shù)據(jù)的增加,解碼圖像也逐漸變得清晰。 ·模型編碼 編碼時(shí)首先將圖像中的邊界、輪廓、紋理等結(jié)構(gòu)特征找出來(lái),然后保存這些參數(shù)信息。解碼時(shí)根據(jù)結(jié)構(gòu)和參數(shù)信息進(jìn)行合成,恢復(fù)原圖像。具體方法有輪廓編碼、域分割編碼、分析合成編碼、識(shí)別合成編碼、基于知識(shí)的編碼和分形編碼等。 5、量化的概念 5.1、采樣 5.1.1、取樣的概念 又稱為采樣,把時(shí)間上連續(xù)的模擬信號(hào)變成離散的有限個(gè)樣值的信號(hào)。 5.1.2、采樣定律 香農(nóng)定理對(duì)于一個(gè)包含最高頻率f0的模擬信號(hào),但選擇的采樣頻率f滿足f>=2f0時(shí),經(jīng)過(guò)取樣后的離散信號(hào)能夠包含原模擬信號(hào)的全部信息,并且,經(jīng)過(guò)反變換和低通濾波,可以不失真地恢復(fù)出原始信號(hào)。 5.2、量化 定義:量化是在幅度軸上把連續(xù)值的模擬信號(hào)變成為離散值的數(shù)字信號(hào),在時(shí)間軸上已變?yōu)殡x散的樣值脈沖,在幅度軸上仍會(huì)在動(dòng)態(tài)范圍內(nèi)有連續(xù)值,可能出現(xiàn)任意幅度,即在幅度軸上仍是模擬信號(hào)的性質(zhì),故還必須用有限電平等級(jí)來(lái)代替實(shí)際量值。 設(shè)信號(hào)的整個(gè)動(dòng)態(tài)變化范圍為A,共分為M個(gè)量化等級(jí);每個(gè)量化等級(jí)為 △A,則有:△A=A/M。量化級(jí)通常用二進(jìn)制的位數(shù)n表示,它與十進(jìn)制數(shù)M之間的關(guān)系為M=2n或n=log2M通常稱為量化位數(shù)。例如,對(duì)于8位 (bit)量化,相應(yīng)的十進(jìn)制量化等級(jí)M為:M=2^8=256。 量化的過(guò)程是把取樣后信號(hào)的電平歸并到有限個(gè)電平等級(jí)上,并以一個(gè)相應(yīng)的數(shù)據(jù)來(lái)表示。按歸并方式, 可分為只舍不入方式和舍入方式。 ·只舍不入方式,又稱截尾方式,即當(dāng)取樣信號(hào)電平處在兩個(gè)量化等級(jí)之間時(shí),將其歸并到下面的量化等級(jí)上,而把超過(guò)部分舍去。 ·舍取方式,又稱四舍五入方式,當(dāng)取樣信號(hào)電平超過(guò)某一量化等級(jí)一半時(shí),歸并到上一量化等級(jí);低于該量化等級(jí)一半時(shí),則歸并到下一量化等級(jí)。不言而 喻,在只舍不入方式中,量化后的電平與取樣信號(hào)實(shí)際電平之間的最大偏差(量化誤差)為一個(gè)量化等級(jí)△A,而在四舍五入方式中誤差為△A。由于四舍五入方式 的量化誤差小,故通常選用這種方式。 5.3、編碼 編碼是把代表特定量化等級(jí)的比較器的輸出狀態(tài)組合,變換成一個(gè)n位表示的二進(jìn)制數(shù)碼,即每一組二進(jìn)制碼代表一個(gè)取樣值的量化電平等級(jí)。由于每個(gè) 樣值的量化電平等級(jí)由一組n位的二進(jìn)制數(shù)碼表示,所以,取樣頻率f與n位數(shù)的乘積nf就是每秒需處理和發(fā)送的位數(shù),通常稱為比特率或數(shù)碼率。例如,CD音 響的采樣頻率選用44.1kHz,量化位數(shù)n=16,采用立體聲,相應(yīng)的比特率為:44.1kHz×16×2/8=176.4kB/s。 6、統(tǒng)計(jì)編碼(信息熵編碼) 統(tǒng)計(jì)編碼是根據(jù)消息出現(xiàn)概率的分布特性而進(jìn)行的壓縮編碼,它有別于預(yù)測(cè)編碼和變換編碼。這種編碼的宗旨在于,在消息和碼字之間找到明確的一一對(duì) 應(yīng)關(guān)系,以便在恢復(fù)時(shí)能準(zhǔn)確無(wú)誤地再現(xiàn)出來(lái),或者至少是極相似地找到相當(dāng)?shù)膶?duì)應(yīng)關(guān)系,并把這種失真或不對(duì)應(yīng)概率限制到可容忍的范圍內(nèi)。但不管什么途徑,它 們總是要使平均碼長(zhǎng)或碼率壓低到最低限度。 常用的編碼有:Huffman碼、Shannon-Famo碼、算術(shù)編碼等。 6.1、哈夫曼(Huffman)編碼 6.1.1、哈夫曼編碼的方法 編碼過(guò)程如下: (1)、將信源符號(hào)按概率遞減順序排列; 6.1.2、哈夫曼編碼的特點(diǎn) ①、哈夫曼方法構(gòu)造出來(lái)的碼不是唯一的。 原因: ②、哈夫曼編碼碼字字長(zhǎng)參差不齊,因此硬件實(shí)現(xiàn)起來(lái)不大方便。 ③、哈夫曼編碼對(duì)不同的信源的編碼效率是不同的。 ·當(dāng)信源概率是2的負(fù)冪時(shí),哈夫曼碼的編碼效率達(dá)到100%; ④、對(duì)信源進(jìn)行哈夫曼編碼后,形成了一個(gè)哈夫曼編碼表。解碼時(shí),必須參照這一哈夫編碼表才能正確譯碼。 ·在信源的存儲(chǔ)與傳輸過(guò)程中必須首先存儲(chǔ)或傳輸這一哈夫曼編碼表在實(shí)際計(jì)算壓縮效果時(shí),必須考慮哈夫曼編碼表占有的比特?cái)?shù)。在某些應(yīng)用場(chǎng)合,信 源概率服從于某一分布或存在一定規(guī)律(這主要由大量的統(tǒng)計(jì)得到),這樣就可以在發(fā)送端和接收端固定哈夫曼編碼表,在傳輸數(shù)據(jù)時(shí)就省去了傳輸哈夫曼編碼表, 這種方法稱為哈夫曼編碼表缺省使用。 使用缺省的哈夫曼編碼表有兩點(diǎn)好處: ·降低了編碼的時(shí)間,改變了編碼和解碼的時(shí)間不對(duì)稱性; 6.1.3、哈夫曼編碼舉例 現(xiàn)在有8個(gè)待編碼的符號(hào)M0,…,M0它們的概率如下表所示,使用霍夫曼編碼算法求出8個(gè)符號(hào)所分配的代碼。(寫出編碼樹(shù)) 解:為了進(jìn)行哈夫曼編碼,先把這組數(shù)據(jù)由大到小排列,再按上方法處理 6.2、Shannon-Famo編碼 Shannon-Famo(S-F)編碼方法與Huffman的編碼方法略有區(qū)別,但有時(shí)也能編出最佳碼。 6.2.1、S-F碼主要準(zhǔn)則 符合即時(shí)碼條件;在碼字中,1和0是獨(dú)立的,而且是(或差不多是)等概率的。這樣的準(zhǔn)則一方面能保證無(wú)需用間隔區(qū)分碼字,同時(shí)又保證每一位碼字幾乎有1位的信息量。 6.2.2、S-F碼的編碼過(guò)程 ·信源符號(hào)按概率遞減順序排列; 6.3、游程編碼 游程編碼(簡(jiǎn)寫為RLE或RLC)是一種十分簡(jiǎn)單的壓縮方法,它將數(shù)據(jù)流中連續(xù)出現(xiàn)的字符(稱為游程)用單一的記號(hào)來(lái)表示。例如,字符串: a b a C C C b b a a a a 可以壓縮為: a b a 3c 2b 4a 游程編碼的壓縮效果不太好,但由于簡(jiǎn)單,編碼/解碼的速度非???,因此仍然得到廣泛的應(yīng)用。許多圖形和視頻文件,如.BMP、.TIF及.AVI等,都使用了這種壓縮。 6.4、算術(shù)編碼 6.4.1、算術(shù)編碼 算術(shù)編碼把一個(gè)信源集合表示為實(shí)數(shù)線上的0到1之間的一個(gè)區(qū)間。這個(gè)集合中的每個(gè)元素都要用來(lái)縮短這個(gè)區(qū)間。信源集合的元素越多,所得到的區(qū)間 就越小,當(dāng)區(qū)間變小時(shí),就需要更多的數(shù)位來(lái)表示這個(gè)區(qū)間,這就是區(qū)間作為代碼的原理。算術(shù)編碼首先假設(shè)一個(gè)信源的概率模型,然后用這些概率來(lái)縮小表示信源 集的區(qū)間。 6.4.2、舉例說(shuō)明算術(shù)編碼過(guò)程 [例]設(shè)英文元音字母采用固定模式符號(hào)概率分配如下: 設(shè)編碼的數(shù)據(jù)串為eai。令high為編碼間隔的高端,low為編碼間隔的低端,range為編碼間隔的長(zhǎng)度,rangelow為編碼字符分配的間隔低端,rangehigh為編碼字符分配的間隔高端。 初始high=1,low=0,range=high-low,一個(gè)字符編碼后新的low和high按下式計(jì)算: ·low =low+range × rangelow (1)、在第一個(gè)字符e被編碼時(shí),e的rangelow=0.2,rangehigh=0.5,因此: low=0 + 1 × 0.2 = 0.2 (2)、第二個(gè)字符a編碼時(shí)使用新生成范圍[0.2,0.5],a的rangelow=0,rangehigh=0.2,因此: low=0.2 十 0.3 × 0=0.2 (3)、對(duì)下一個(gè)字符i編碼,i的rangelow=0.5,rangehigh=0.6,則: low=0.2 + 0.06 × 0.5=0.23 6.4.3、算術(shù)編碼的特點(diǎn) ①、不必預(yù)先定義概率模型,自適應(yīng)模式具有獨(dú)特的優(yōu)點(diǎn); 7、脈沖編碼調(diào)制(PCM) 脈沖編碼調(diào)制(pulse code modulation,PCM),它是概念上最簡(jiǎn)單、理論上最完善的編譯系統(tǒng)。PCM的編碼原理比較直觀和簡(jiǎn)單,它的輸入是模擬信號(hào),輸出是PCM樣本。 第一步采樣,每隔一段時(shí)間間隔讀一次聲音的幅度。 第二步量化,把采樣得到的聲音信號(hào)幅度轉(zhuǎn)換成數(shù)字值,有兩類量化的標(biāo)準(zhǔn)。 ·均勻量化:采用相同間隔對(duì)采樣得到的信號(hào)做量化,也成為線性量化。量化時(shí)無(wú)論對(duì)多大的輸入信號(hào)還是對(duì)多小的輸入信號(hào)一律采用相同的量化間隔。為了適應(yīng)幅度大的輸入信號(hào),同時(shí)又要滿足精度的要求,就需要增加樣本的位數(shù)。 ·非均勻量化:對(duì)輸入信號(hào)進(jìn)行量化時(shí),大的輸入信號(hào)采用大的量化間隔,小的輸入信號(hào)采用小的量化間隔。在非線性量化中,采用輸入信號(hào)幅度和量化 輸出數(shù)據(jù)之間定義了兩種對(duì)應(yīng)關(guān)系,一種是在北美日本使用的壓擴(kuò)標(biāo)準(zhǔn)是U律(G.711);另一種是在歐洲中國(guó)大陸使用A律(G.711)。 8、預(yù)測(cè)編碼 ·預(yù)測(cè)編碼的概念 根據(jù)某一模型利用以往的樣本值對(duì)于新樣本值進(jìn)行預(yù)測(cè),然后將樣本的實(shí)際值與其預(yù)測(cè)值相減得到一個(gè)誤差值,并對(duì)這一誤差值進(jìn)行編碼。如果模型足夠 好并且樣本序列在時(shí)間上相關(guān)性較強(qiáng),那么誤差信號(hào)的幅度將遠(yuǎn)遠(yuǎn)小于原始信號(hào),從而可以得到較大的數(shù)據(jù)壓縮,可見(jiàn),建立一個(gè)理想的預(yù)測(cè)器是很關(guān)鍵的。 8.1、差分脈沖編碼調(diào)制(DPCM) 差分脈沖編碼調(diào)制(DPCM)最簡(jiǎn)單的預(yù)測(cè)壓縮算法是在像素級(jí)使用差分脈沖編碼調(diào)制技術(shù)。 ·差分編碼調(diào)制原理 對(duì)于比較相鄰的兩個(gè)像素,只傳送像素間的差異之處,由于相鄰像素通常是類似的,它們之間的差值很小,因而傳送差值需要的位數(shù)總是小于傳送整個(gè)像素需要的位數(shù)。 8.2、自適應(yīng)脈沖編碼調(diào)制(ADPCM) APCMS是一種根據(jù)輸入信號(hào)幅度大小改變量化階大小的一種波形編碼技術(shù)。這種自適應(yīng)可以是瞬間自適應(yīng),改變量化階的大小方法有兩種: ·前向自適應(yīng)(forward adaptation)就是根據(jù)未量化的樣本值的均方根來(lái)估算輸入信號(hào)的電平,以此來(lái)確定量化階的大小,并對(duì)其電平進(jìn)行編碼作為邊信息傳送到接收端。 8.3、自適應(yīng)差分脈沖編碼調(diào)制(ADPCM) ADPCM綜合了APCM的自適應(yīng)特性和DPCM系統(tǒng)的差分特性,是一種性能比較好的波形編碼。它的核心想法是: ①、利用自適應(yīng)改變量化階的大小,即使用小的量化階去編碼小的差值,使用大的量化階去編碼大的差值。 8.4、增量調(diào)制(DM,delta modulation) 它是一種預(yù)測(cè)編碼技術(shù),是PCM編碼的一種變形。PCM是對(duì)每個(gè)采樣信號(hào)的整個(gè)幅度進(jìn)行量化編碼,因此它具有對(duì)任意波形進(jìn)行編碼的能力。 DM是對(duì)實(shí)際的采樣信號(hào)與預(yù)測(cè)的采樣信號(hào)之差的極性進(jìn)行編碼,將極性變成“0”和“1”這兩種可能的取值之一,如果實(shí)際的采樣信號(hào)與預(yù)測(cè)的采樣 信號(hào)之差的極性為正,則用“1”表示;相反則用“0”表示,或者相反。由于DM編碼只需一位對(duì)信號(hào)進(jìn)行編碼,所以DM編碼系統(tǒng)又稱為“1位系統(tǒng)”。 8.5、自適應(yīng)增量調(diào)制(ADM,adaptive delta modulation) 為了使增量調(diào)制器的量化階也能自適應(yīng),也就是根據(jù)輸入信號(hào)斜率的變化自動(dòng)調(diào)整量化階的大小,以使斜率過(guò)載和粒狀噪聲都減到最小。幾乎所有的方法基本上都是檢測(cè)到斜率過(guò)載時(shí)就開(kāi)始增大量化階,而在輸入信號(hào)的斜率減小時(shí)降低量化階。 9、頻域編碼 9.1、變換編碼(transform coding) 9.1.1、變換編碼簡(jiǎn)介 預(yù)測(cè)編碼的方法能夠壓縮圖像數(shù)據(jù)的空間和時(shí)間冗余性。特點(diǎn)是直觀、簡(jiǎn)捷和易于實(shí)現(xiàn)。在傳輸速度要求很高的應(yīng)用中,大多選用此方法。然而,預(yù)測(cè)方法的不足是壓縮能力有限。為了更好地提高壓縮能力,可以采用變換編碼方法。 變換編碼也是一種針對(duì)統(tǒng)計(jì)冗余進(jìn)行壓縮的方法,它是將圖像光強(qiáng)矩陣(時(shí)域信號(hào))變換到系數(shù)空間(頻域)上進(jìn)行處理的方法。 9.1.2、變換編碼的思路 把一組數(shù)據(jù)轉(zhuǎn)換成另一種表示形式,這種表示形式有利于實(shí)現(xiàn)某一特定目標(biāo)。變換是可以反向進(jìn)行的,即存在反變換,以恢復(fù)原來(lái)的數(shù)據(jù)。在圖像壓縮 中,一組數(shù)據(jù)是指一組像素(通常是二維數(shù)組)。變換將使這個(gè)二維數(shù)組數(shù)據(jù)量減少,以便于數(shù)據(jù)的傳輸和存儲(chǔ)。解壓縮時(shí),利用反變換恢復(fù)原始像素。 9.1.3、變換編碼的基本方法 對(duì)于一組給定的時(shí)序信號(hào)Y(t),分析這組信號(hào)的頻率、能量甚至模式等固有的特征或者求解時(shí),可利用如傅立葉變換或Z變換等工具,比直接對(duì) Y(t)去積分和微分方便得多。這些變換是將時(shí)域上的信號(hào)Y(t)變換到頻域上,再進(jìn)行分析和求解,圖像壓縮問(wèn)題亦可以變換到頻域上去做。 9.1.4、變換方法的特點(diǎn) ①、在頻域上信息是按頻譜的能量與頻率分布排列的。在傅氏變換平面上,圖像信號(hào)場(chǎng)的能量集中在以圓點(diǎn)為中心的圓環(huán)內(nèi),因而只要對(duì)頻域平面量化器進(jìn)行合理的比特分配,高能量區(qū)給以高比特,低能量區(qū)給以低比特,就可以得到高的壓縮能力。 ②、變換運(yùn)算比其他方法的計(jì)算復(fù)雜性高。實(shí)際應(yīng)用中做圖像壓縮處理時(shí),常用Hadamazd變換、離散余弦變換和傅立葉變換等。 9.2、子帶編碼(subband coding) 子帶編碼又稱分頻帶編碼。它將圖像數(shù)據(jù)變換到頻域后,按頻率分帶,然后用不同的量化器進(jìn)行量化,達(dá)到最優(yōu)的組合。 語(yǔ)言和圖像信息都有較寬的頻帶,信息的能量集中于低頻區(qū)域,細(xì)節(jié)和邊緣信息則集中于高頻區(qū)域。子帶編碼采取保留低頻系數(shù)舍去高頻系數(shù)的方法進(jìn)行編碼,操作時(shí)對(duì)低頻區(qū)域取較多的比特?cái)?shù)來(lái)編碼,以犧牲邊緣細(xì)節(jié)為代價(jià)來(lái)?yè)Q取比特?cái)?shù)的下降,恢復(fù)后的圖像比原圖模糊。 子帶編碼把原始圖像分割成不同頻段的子頻段帶,對(duì)不同的頻段子帶設(shè)計(jì)獨(dú)立的預(yù)測(cè)編碼器,分別進(jìn)行編碼和解碼。子帶編碼的結(jié)構(gòu)原理如圖所示。 子帶編碼的特點(diǎn)是:有較高的壓縮比和信噪比。 |
|
來(lái)自: 開(kāi)花結(jié)果 > 《知識(shí)解析》