在寫(xiě)這個(gè)題目是,就感到有些戰(zhàn)戰(zhàn)兢兢,在這個(gè)論壇也混了一段時(shí)間了,說(shuō)實(shí)話,并沒(méi)有感覺(jué)在這里學(xué)到太多東西。而且覺(jué)得大家討論問(wèn)題的深度不及“視頻設(shè)計(jì)芯片論壇”http://china264./index.asp 因?yàn)樽罱诸^的活基本搞完了,人也閑了下來(lái),這么熱的天氣,突然想寫(xiě)這么一篇文章。不過(guò)首先聲明的是我對(duì)H264并不是太熟悉。但多多少少也學(xué)習(xí)了這么久了,寫(xiě)點(diǎn)心得出來(lái)對(duì)自己是個(gè)交待,同時(shí)也希望給新手們一點(diǎn)幫助,只要對(duì)大家有一點(diǎn)點(diǎn)幫助,也就很滿足了。
好,閑話少說(shuō)。如果大家是剛開(kāi)始進(jìn)入圖象領(lǐng)域,那么先看一看"計(jì)算機(jī)圖象處理"方面的教材還是有必要的.不過(guò)稍微了解一下就好了,不用太深入,在以后的對(duì)264的學(xué)習(xí)中,自然會(huì)對(duì)這些基本概念有進(jìn)一步的了解.然后,是對(duì)264的了解,推薦3篇文章. 1、Halsted.Press.H.264.And.MPEG-4.Video. Compression. Video. Coding. For. Next. Generation。 對(duì)視頻編解碼原理講得比較詳細(xì) 2、Video coding using the H.264 MPEG-4 AVC compression standard。 更加關(guān)注于編解碼的各個(gè)模塊的實(shí)現(xiàn)方式 3、Overview of the H.264/AVC Video Coding Standard。 是Thomas Wiegand的大作,對(duì)264較之以往標(biāo)準(zhǔn)的新特性都作了說(shuō)明。 這三篇文章絕對(duì)是了解264的經(jīng)典文章,論壇上好像也有下載的地址。這些都是e文文章,不過(guò)相信對(duì)大多數(shù)人難度都不大。 細(xì)心將這三篇文章看完。對(duì)264就有了一個(gè)比較清楚地認(rèn)識(shí)了。對(duì)一個(gè)這么大的東西,不可能說(shuō)要在短時(shí)間內(nèi)全部搞懂它,因此就要根據(jù)當(dāng)前自己的情況,選擇一個(gè)具體的研究方向,比如說(shuō)運(yùn)動(dòng)估計(jì)、熵編碼等等。我現(xiàn)在以我自己的研究方向運(yùn)動(dòng)估計(jì)作為例子,來(lái)說(shuō)一下我的學(xué)習(xí)方法,當(dāng)然肯定有班門(mén)弄斧的嫌疑,但是既然大家都不認(rèn)識(shí)我,我也就不客氣了。
從入門(mén)的3篇文章中可以看出,幀間編碼(運(yùn)動(dòng)估計(jì))是264的運(yùn)算復(fù)雜度的“主力”部分。那么首先要對(duì)傳統(tǒng)的那些運(yùn)動(dòng)估計(jì)方法作一個(gè)了解,如果是教育網(wǎng)的朋友再ieee的網(wǎng)站上拿motion estimation一搜就能搜到一大堆文章了,我的建議是選一篇比較新而且比較長(zhǎng)的文章,就是那種regular paper 而不是short paper。這些文章中一般會(huì)對(duì)本研究方向的經(jīng)典方法作一個(gè)回顧和比較,這樣,從這篇文章的參考文獻(xiàn)中再進(jìn)一步把本研究方向的歷史和現(xiàn)狀作一個(gè)了解。
所謂對(duì)264的研究的話,基本上就是用更加好的算法來(lái)降低264本身的計(jì)算復(fù)雜度。能夠做到不提高碼率當(dāng)然好,但碼率稍微有點(diǎn)上升也沒(méi)有關(guān)系,不過(guò)那就要在編碼速度上有優(yōu)勢(shì),這樣就可以說(shuō)“本方法利于實(shí)時(shí)實(shí)現(xiàn)“啦,哈哈。就運(yùn)動(dòng)估計(jì)來(lái)說(shuō),傳統(tǒng)的3ss,4ss,ds都要知道是怎么回事,然后像被大家奉為經(jīng)典的mvfast,pmvfast就要專心的看一下了。最好呢,是在這些方法上,能夠提出自己的新觀點(diǎn)、新方法。當(dāng)然,這就不是一個(gè)純粹看論文能夠解決的問(wèn)題了。大家需要對(duì)264的新特點(diǎn)有一個(gè)清楚了了解,然后考慮的方向可以是以前的方法應(yīng)該怎么改善再用在264上,能夠更好地發(fā)揮作用,向連續(xù)消方法,half-way stop的方法,好像國(guó)內(nèi)的都有人出論文。因?yàn)?64的幀間預(yù)測(cè)采用了可變塊大小,因此又引出了一個(gè)問(wèn)題:按什么方法來(lái)分塊是最好的?大家在看那3篇入門(mén)的文章時(shí),就要邊看邊思考,里面說(shuō)采用可變塊大小,就要想到我怎么知道該怎么分塊;里面提到4*4塊幀內(nèi)預(yù)測(cè)有9種模式,就要想到這9種模式如何決策。也就是說(shuō),大家再看這些文章時(shí),要想一下,我該怎么去實(shí)現(xiàn)它。這些問(wèn)題其實(shí)很容易就能提出來(lái),但要解決卻是一個(gè)大問(wèn)題。
比如說(shuō)分塊吧,VBSME(variable block size motion estimation),ieee上可有不少文章,臺(tái)灣國(guó)立成功大學(xué)(?好像是這個(gè)名字)的一篇碩士論文就寫(xiě)的是這個(gè),可見(jiàn)264有好多東西可以去做,養(yǎng)幾個(gè)博士絕對(duì)綽綽有余啊,赫赫。其實(shí)研究方向越細(xì),就能夠?qū)@個(gè)方向把握得越準(zhǔn)確,成天看著,總會(huì)有些新想法出來(lái)吧,嗬嗬,開(kāi)玩笑的說(shuō)。選好了一個(gè)大的研究方向,然后就要知道現(xiàn)在這個(gè)方向大家都是在那些細(xì)節(jié)上做工作。像運(yùn)動(dòng)估計(jì)的話,多幀預(yù)測(cè),可變塊大小的分法,1/4像素估計(jì)精度等等都是熱門(mén)的東西,那基本上來(lái)說(shuō),跟著大家走就好了。了解哪些東西是熱門(mén),基本上*多看文章,同時(shí)建議大家多看e文的,最好是ieee的。我的一個(gè)博士師兄告訴我說(shuō),如果你想發(fā)某一個(gè)檔次的文章,你就應(yīng)該看比這個(gè)雜志高一個(gè)檔次的文章。而且他說(shuō)一般看個(gè)15篇左右,就應(yīng)該要能夠出一篇自己的東西了。這個(gè)師兄現(xiàn)在畢業(yè)了,他發(fā)了好多EI的,羨慕!
如果“不幸”有了自己的新想法,那么就需要驗(yàn)證了。簡(jiǎn)單一點(diǎn)的驗(yàn)證呢,可以放在c語(yǔ)言或者matlab平臺(tái)下進(jìn)行,但是如果要發(fā)論文的話,基本上還是要放在JM下才有說(shuō)服力。而且試驗(yàn)序列最好采用標(biāo)準(zhǔn)序列。這既涉及到一個(gè)讀JM源碼和修改JM源碼的問(wèn)題。我看了一段時(shí)間,實(shí)在是好煩啊,所以,對(duì)不起,在這方面我沒(méi)有太多好的建議。但是我在修改一個(gè)幀內(nèi)預(yù)測(cè)算法時(shí),反而把預(yù)測(cè)速度減慢了,哈哈,按照常理來(lái)說(shuō),我的方法應(yīng)該比JM里的方法好才對(duì),而且我在matlab下的仿真結(jié)果的確如此,很郁悶,希望大家推薦一個(gè)看源碼的方法給我,謝謝先。
除去以上說(shuō)的這些,看標(biāo)準(zhǔn)也是很必要的。200503的那個(gè)prepublished版本好像是最新的,對(duì)于翻譯標(biāo)準(zhǔn),我認(rèn)為不是太必要,但對(duì)了解標(biāo)準(zhǔn)也還是有點(diǎn)幫助,可以放在正常工作時(shí)間以外進(jìn)行,如果大家有這么努力的話。
|
|