IT之家(www.ithome.com):玩音樂必看:且看 Lame 如何改變了MP3的命運(yùn) 本想放松放松身心,收拾收拾好心情,可又忍不住折騰來了,果然生命不息折騰就不會(huì)停止啊。 今天聽歌的時(shí)候發(fā)現(xiàn)了個(gè)奇怪的現(xiàn)象。兩首同樣的且恒定320kbps碼率的歌曲,音質(zhì)差距相當(dāng)大,簡(jiǎn)直是一個(gè)天上一個(gè)地下,果斷干掉了低音質(zhì)的那首。后來又想了想,按理說音質(zhì)相同才對(duì),怎么會(huì)有這么大的差別呢?這完全“不科學(xué)”嘛!詫異之余,為了弄清原因,就又動(dòng)手折騰起來了。搬來Foobar2000、MediaInfo,看了下屬性,果然從中發(fā)現(xiàn)了問題,表面上兩首歌雖然大小相同,都是CBR-320k-mp3,但是編碼器的版本卻有著很大的差異。查閱Wiki,翻遍論壇,折騰了大半天,現(xiàn)在總算有點(diǎn)眉目了。趁此刻頭腦清醒之時(shí),就開始草草地寫起了這篇偽技術(shù)文。 看標(biāo)題或許你已經(jīng)知道我接下來要折騰的是什么了吧,沒錯(cuò),就是lame。lame是啥玩意,可以吃嗎?開個(gè)玩笑,暖暖氛圍先。 要深入了解lame,還是先了解下mp3吧。mp3是一種mpeg1-audio-layer-3音頻格式,也是一種有損音頻壓縮編碼方式,從上世紀(jì)九十年代創(chuàng)立開始,到今天已經(jīng)有二十多年了。二十年是什么概念,按現(xiàn)代社會(huì)發(fā)展規(guī)律講,再好的東西也流行不過十年之久,何況是二十年呢?微軟Windows都開始Win9了,更別談一門九十年代初的技術(shù)。的確,1991年mp3格式發(fā)布之初,用一般編碼器轉(zhuǎn)換出的mp3音質(zhì)甚不理想,mp3幾經(jīng)挫折,走到了快被淘汰的邊緣,幸運(yùn)的是,一次世紀(jì)末與lame的大邂逅徹底改變了mp3的命運(yùn),不但轉(zhuǎn)危為安好好地活了下來,而且一直發(fā)展到今天還充滿著無窮活力,稱霸格式世界。毫不夸張的說,mp3的出現(xiàn),改變了我們聽音樂的方式,影響了世界音樂的歷史進(jìn)程,促進(jìn)了世界人民的文化交流,讓更多人能夠輕松地欣賞到美妙的音樂, 通過音樂了解世界各地的音樂文化。 說了這么多,或許你對(duì)lame還是一知半解吧。lame其實(shí)就是一款相當(dāng)優(yōu)秀并沿用至今的mp3編碼器,利用lame編碼器,可以將無損音樂轉(zhuǎn)換成高質(zhì)量的mp3有損音樂。lame有著優(yōu)異的編碼技術(shù),在保證cd音頻真實(shí)還原的前提下,運(yùn)用人耳遮蔽效應(yīng)原理以及獨(dú)創(chuàng)的心理音響模型技術(shù),使通過lame轉(zhuǎn)換而來的mp3音質(zhì)可以達(dá)到媲美cd的水平。憑借著lame的優(yōu)異性能,原本快要被丟棄的mp3重新被人拾起,發(fā)展至今??梢哉f,lame改變了mp3的命運(yùn)。 lame又是如何工作的呢?答案很簡(jiǎn)單,lame編碼器就是利用無損音樂為原料,按照mp3編碼方式編碼出有損mp3音樂的,而編碼出來的mp3音樂音質(zhì)完全由編碼器決定,當(dāng)然前提是mp3的編碼方式固定不變。這個(gè)編碼過程和DNA的轉(zhuǎn)錄、翻譯很相似。 基本概念講完了,不知道各位明白了沒。再來說說mp3幾個(gè)重要的參數(shù)。經(jīng)常聽音樂的同學(xué)都知道,mp3的碼率越高音質(zhì)也就越好,mp3的碼率上限是多少呢?毫無疑問,320kbps。如果你對(duì)音質(zhì)要求不高的話,動(dòng)態(tài)碼率(VBR)模式轉(zhuǎn)換是個(gè)不錯(cuò)的選擇,但只是對(duì)低碼率音樂的轉(zhuǎn)換起到作用,高碼率情況下還是恒定碼率(CBR)模式具有明顯的優(yōu)勢(shì)。若選擇動(dòng)態(tài)碼率模式來轉(zhuǎn)換音樂的話,轉(zhuǎn)換得到的音樂文件大小就無法預(yù)算了(貌似也沒多大關(guān)系吧)。恒定碼率則不同了,轉(zhuǎn)換后的音樂文件大小可以事先預(yù)算出來,一首五分鐘的歌曲,按最高質(zhì)量320kbps恒定碼率計(jì)算,1kbyte/s=8kbps,5分鐘的歌曲大小就是5*60*320/8=12000KB=12MB,這是理論結(jié)果,從不同mp3編碼器實(shí)際轉(zhuǎn)換情況來看,也是相吻合的(實(shí)際比對(duì)后發(fā)現(xiàn)有極小的誤差,不知為何)。為了獲得高質(zhì)量的MP3,就不必在乎mp3的大小了,所以下面我們就只探討由lame編碼的恒定320kbps碼率的mp3格式音樂之間的關(guān)系。最佳轉(zhuǎn)換參數(shù)既然已經(jīng)確定,還有哪些能夠影響到轉(zhuǎn)換出的mp3的音質(zhì)呢?上文已經(jīng)說了,“在mp3編碼方式固定不變的前提下,編碼出來的音樂音質(zhì)完全由編碼器決定”,顯然mp3編碼方式不會(huì)改變,所以,要得到高質(zhì)量mp3,就要找到最適合的編碼器,lame就是最佳選擇。問題是,lame有多達(dá)十個(gè)以上的版本,而且并非最新版就好。這個(gè)確實(shí)讓人糾結(jié),不光糾結(jié)了我好一陣,還辛苦了廣大的音樂探索者。到底哪個(gè)版本的lame編碼器編碼出來的mp3音質(zhì)最好呢?抱著這樣的疑問,開始了我下面的探索之旅。 一、獲取lame編碼器 在lame的官方網(wǎng)站下載好lame的各版本源文件,再用編譯軟件編譯出不同版本的lame.exe編碼器。 在此補(bǔ)充下,利用不同的編譯軟件、編譯方法以及編譯平臺(tái)得到的相同版本的lame編碼器也有區(qū)別,使用這些同版編碼器轉(zhuǎn)換出的音質(zhì)也就有可能不一樣,但就我實(shí)際轉(zhuǎn)換情況來看,除了編碼器的編碼速度有所不同外,對(duì)音質(zhì)的影響還是極小的,完全可以忽略掉。下文使用的lame編碼器是我個(gè)人win7平臺(tái)通過vc++編譯出來的。網(wǎng)絡(luò)上還有很多個(gè)人編譯版本,比較優(yōu)秀的是某外國友人的編譯版本,可以找找看。還有一種dll后綴的lame編碼器就不介紹了,使用方法較復(fù)雜,質(zhì)量還沒exe版好。 二、設(shè)置轉(zhuǎn)換工具 光有編碼器可不行,這個(gè)lame.exe只是一個(gè)dos命令,還需要配合圖形界面等外殼工具或命令行編碼器來輔助使用,命令行編碼器的自由度更高,我們就用它來轉(zhuǎn)換音樂。下文以Foobar內(nèi)置的命令行編碼器來進(jìn)行說明。使用方法很簡(jiǎn)單,打開Foobar設(shè)置頁,添加自定義編碼預(yù)置方案,載入lame編碼器所在位置,填寫好最高mp3轉(zhuǎn)換參數(shù)“-b 320 -m j -q 2 -h”【注釋1】,保存即可,如下圖:
三、開始轉(zhuǎn)換音樂 將WAV源文件拖入Foobar,選擇剛才的預(yù)置方案進(jìn)行轉(zhuǎn)換,對(duì)轉(zhuǎn)換出來的mp3按lame版本號(hào)命名。按順序替換不同版本的lame編碼器,重復(fù)上述過程。 經(jīng)過上面這三個(gè)步驟,我們得到了各個(gè)版本lame編碼器轉(zhuǎn)換而來的mp3文件,然后就可以通過比較這些mp3文件的音質(zhì)來判斷哪個(gè)lame性能最好了。但,音質(zhì)的好壞又如何判斷呢? 很遺憾,筆者找了好久還是沒能找到最佳的方案。要比較音質(zhì),說實(shí)在話是一件非常令人頭疼的事情,因?yàn)槠駷橹?,還沒有一個(gè)能真正定量反映音樂音質(zhì)的國際評(píng)價(jià)標(biāo)準(zhǔn),判斷音質(zhì)目前來說仍然是個(gè)世界級(jí)的難題,但就現(xiàn)有的普通評(píng)價(jià)體系來看,通常有兩種方法,主觀方法和客觀方法,主觀方法指憑主觀聆聽各種音效,客觀方法即是使用儀器測(cè)試技術(shù)指標(biāo)。由于筆者學(xué)生黨一枚,木有專業(yè)判定設(shè)備,只有靠一對(duì)木耳和質(zhì)量渣渣的前端來折騰折騰了。所以下面就以主觀聽覺感受以及客觀方法中最常用的一個(gè)音頻軟件Adobe Audition來進(jìn)行分析。 一、主觀評(píng)價(jià): 前端;Dell V130,IDT 5 Series/3400 Series Chipset、Teclast X19+ 后端:MX365、AKG K314P 循環(huán)試聽了N遍還是木有聽出各版本的區(qū)別,有點(diǎn)想砸電腦的沖動(dòng)╮(╯▽╰)╭。話說真的是我木耳的原因么?= = ” 二、客觀評(píng)價(jià): 將所有mp3一起拖入Audition里,得到各版本頻譜圖(復(fù)制鏈接至地址欄回車即可) 可以看出,頻率分布主要分為四個(gè)類型,一類,lame 3.90~3.93,保留了21.5khz以下頻段;二類,lame 3.94~3.96,保留了18 khz以下頻段;三類,lame 3.97~3.98,保留了20 khz以下頻段,四類,lame 3.99+, 保留了20 khz以下頻段,且頻譜切線平整。 這里我們就可以來下定結(jié)論了。與WAV源文件相比,lame3.90~3.93對(duì)20khz以上超高頻段的保留程度最高,而其他版本在這個(gè)頻段則損失嚴(yán)重甚至毫無保留。注意不要誤解了,頻譜【注釋2】越是飽滿漂亮,并不意味著音質(zhì)就越完美,聽感就越好,反而可能會(huì)更差,這里我們只是利用它來觀察頻率分布,看看轉(zhuǎn)換后的音樂20khz【注釋3】以上頻段有無保留而已,是無法用來判斷音質(zhì)的,至于為什么,有待各位愛探索的有愛之士繼續(xù)研究研究,我也半知半解。 到這里,你是不是有種抓狂的感覺呢?其實(shí)從一開始,這個(gè)探究就不可能有令人滿意的結(jié)果,只要判定音質(zhì)的國際標(biāo)準(zhǔn)還未發(fā)布之時(shí),這篇文章的研究也就木有理論支持,但至少我們可以通過這些發(fā)現(xiàn),來對(duì)mp3做特定的選擇,如用lame3.90~3.93,搭配最佳轉(zhuǎn)換參數(shù),獲取具有完美高頻的超高音質(zhì)mp3。 說了這么久的mp3,也說累了,換換口味。在有損音樂里,mp3其實(shí)并非最好,目前來說,最好的應(yīng)該是aac,它的體積比mp3還要小,卻比mp3更接近無損,且保留了幾乎100%的高頻信息,是一種更為先進(jìn)更具潛力的有損音樂格式。是金子總會(huì)發(fā)光的,曾被埋沒的aac,今天已被發(fā)掘利用,不斷向mp3發(fā)起挑戰(zhàn),而隨著aac的逐漸普及、支持設(shè)備的快速增多,我相信有一天,aac終會(huì)實(shí)現(xiàn)取代mp3的初衷。 PS下,實(shí)際上我們探究的不同lame對(duì)音質(zhì)的影響可以說是微不足道的,完全可以pass掉,真正影響我們音樂感受最大的還是我們的前端和終端,前端就是音頻流輸入處理設(shè)備,聲卡、解碼芯片,終端即是聲音信號(hào)輸出設(shè)備,耳機(jī)、音響等等。通過解碼芯片還原聲音信號(hào)對(duì)音質(zhì)的損失又很小,所以直接影響我們音樂感受的,除了音源之外也就只有外放設(shè)備了,這也是為什么不同的耳機(jī)聽相同的音樂區(qū)別巨大的原因所在了。我覺得,一個(gè)好耳機(jī),搭配合適的前端,聽有損aac的效果絕對(duì)不遜于無損甚至CD。 【注釋1】 lame的參數(shù)比較多,不同的lame版本可選用的參數(shù)也不盡相同,部分版本還有少量的試驗(yàn)性參數(shù),網(wǎng)上對(duì)于最高的參數(shù)的說法也存在很大分歧。這里就仁者見仁、智者見智了,筆者試驗(yàn)用的是相對(duì)穩(wěn)定的最高參數(shù)“-b 320 -m j -q 2 -h”,“-b 320”是cbr 320kbps的意思,“-m j”表示聯(lián)合立體聲,“-q 2”“-h”指的是質(zhì)量(quality)等級(jí)??梢渣c(diǎn)擊這里了解詳細(xì)的官方參數(shù)說明。 【注釋2】 頻譜法更多的是用來鑒別偽無損,頻率20khz以上有保留就是真無損、無保留則是偽無損。還有專門的識(shí)別偽無損的工具,網(wǎng)上搜索搜索就可以找到。需要特別說明下的是,這兩種鑒別偽無損的方法都不適用于用來識(shí)別itunes plus aac、faac q10 aac這兩種高質(zhì)aac逆向轉(zhuǎn)換出的偽無損文件,而mp3逆向轉(zhuǎn)換可輕易識(shí)別出來,可見aac的強(qiáng)大。 【注釋3】 20khz是人類聽覺的上限,人類的聽覺范圍為20hz-20khz,從低頻到高頻,敏感度逐漸降低,這正是lame官方在最新的版本中摒棄20khz以上頻段的原因,減小體積的同時(shí),還能讓更多的頻率信息分布在人類最敏感的感知范圍內(nèi)。 有趣的是,對(duì)于20khz以上的超高頻聲音,雖然人耳無法直接聽到,但卻能通過人體神奇般地感覺到,有興趣可以看看這里 和 那里。所以最后反而覺得,為了追求完美高頻也不是沒有意義的。 |
|