音頻是個(gè)專業(yè)術(shù)語,音頻一詞已用作一般性描述音頻范圍內(nèi)和聲音有關(guān)的設(shè)備及其作用。
1、Audio,指人耳可以聽到的聲音頻率在20HZ~20kHz之間的聲波,稱為音頻。
2、指存儲(chǔ)聲音內(nèi)容的文件。
3、在某些方面能指作為濾波的振動(dòng)。
大家都承認(rèn)是一個(gè)數(shù)碼時(shí)代,為追求優(yōu)良的音質(zhì)很多人做出了不懈的努力。隨著數(shù)碼時(shí)代的來臨,數(shù)字信號(hào)比模擬信號(hào)優(yōu)越已成為共識(shí)。什么是模擬信號(hào)?其實(shí)任何我們可以聽見的聲音經(jīng)過音頻線或話筒的傳輸都是一系列的模擬信號(hào)。模擬信號(hào)是我們可以聽見的。而數(shù)字信號(hào)就是用一堆數(shù)字記號(hào)(其實(shí)只有二進(jìn)制的1和0)來記錄聲音,而不是用物理手段來保存信號(hào)(用普通磁帶錄音就是一種物理方式)。我們實(shí)際上聽不到數(shù)字信號(hào)。
這樣我們可以簡(jiǎn)略地比較一下模擬時(shí)代的錄音制作與數(shù)碼時(shí)代的區(qū)別:模擬時(shí)代是把原始信號(hào)以物理方式錄制到磁帶上(當(dāng)然在錄音棚里完成了),然后加工、剪接、修改,最后錄制到磁帶、LP等廣大聽眾可以欣賞的載體上。這一系列過程全是模擬的,每一步都會(huì)損失一些信號(hào),到了聽眾手里自然是差了好遠(yuǎn),更不用說什么HI-FI(高保真)了。數(shù)碼時(shí)代是第一步就把原始信號(hào)錄成數(shù)碼音頻資料,然后用硬件設(shè)備或各種軟件進(jìn)行加工處理,這個(gè)過程與模擬方法相比有無比的優(yōu)越性,因?yàn)樗鼛缀醪粫?huì)有任何損耗。對(duì)于機(jī)器來說這個(gè)過程只是處理一下數(shù)字而已,當(dāng)然丟碼的可能性也有,但只要操作合理就不會(huì)發(fā)生。最后把這堆數(shù)字信號(hào)傳輸給數(shù)字記錄設(shè)備如CD等,損耗自然小很多了。
如果我們注意一下身邊的CD片就會(huì)看到很多CD都有如:ADD、AAD、DDD等標(biāo)記。三個(gè)字母按順序各代表該片在錄音、編輯、成品三個(gè)過程中所使用的方法,是模擬(Analog)還是數(shù)字(Digital)。當(dāng)然A代表模擬,D代表數(shù)字。AAD就說明其錄音和編輯是用模擬方式的,而最后灌片是用數(shù)字方式的,這類唱片多是將過去錄制的音樂轉(zhuǎn)成CD片而不做任何修改。ADD則是有一個(gè)修改過程。許多古典音樂大師的演奏或指揮多錄制于模擬時(shí)代,我們聽到的CD是經(jīng)過修改后灌錄的,很多這類唱片都有標(biāo)記ADD。而DDD的唱片必然是較現(xiàn)代的錄音品。自然,CD片必然以D結(jié)尾,而磁帶可以姑且認(rèn)為是AAA,雖然好像并沒有這種說法。
所以說,數(shù)碼音頻是我們保存聲音信號(hào),傳輸聲音信號(hào)的一種方式,它的特點(diǎn)是信號(hào)不容易損失。而模擬信號(hào)是我們最后可以聽到的東西。不過模擬信號(hào)錄制過程中的修改簡(jiǎn)直是一場(chǎng)災(zāi)難,損失太大了。有此僻好的格倫?古爾德若也會(huì)瞠目結(jié)舌的。而數(shù)碼音頻復(fù)制100遍也不會(huì)有損耗,不信大家COPY一個(gè)wav文件試試?
數(shù)碼錄音最關(guān)鍵一步就是要把模擬信號(hào)轉(zhuǎn)換為數(shù)碼信號(hào)。就電腦而言是把模擬聲音信號(hào)錄制成為wav文件,這個(gè)工作Windows自帶的錄音機(jī)也可以做到,但是它的功能十分有限,不能滿足我們的需求,所以我們用其他專業(yè)音頻軟件代替,如Sound Forge等。錄制出來的文件就是wav文件,描述wav文件主要有兩個(gè)指標(biāo),一個(gè)是采樣頻率,或稱采樣率、采率,另一個(gè)是采樣精度也就是比特率。這是數(shù)字音頻制作中十分重要的兩個(gè)概念,下面就來看一下吧。
采樣頻率
采樣頻率就是采用一段音頻,做為樣本,因?yàn)閣av使用的是數(shù)碼信號(hào),它是用一堆數(shù)字來描述原來的模擬信號(hào),所以它要對(duì)原來的模擬信號(hào)進(jìn)行分析,我們知道所有的聲音都有其波形,數(shù)碼信號(hào)就是在原有的模擬信號(hào)波形上每隔一段時(shí)間進(jìn)行一次“取點(diǎn)”,賦予每一個(gè)點(diǎn)以一個(gè)數(shù)值,這就是“采樣”,然后把所有的“點(diǎn)”連起來就可以描述模擬信號(hào)了,很明顯,在一定時(shí)間內(nèi)取的點(diǎn)越多,描述出來的波形就越精確,這個(gè)尺度我們就稱為“采樣頻率”。我們最常用的采樣頻率是44.1kHz,它的意思是每秒取樣44100次。之所以使用這個(gè)數(shù)值是因?yàn)榻?jīng)過了反復(fù)實(shí)驗(yàn)(實(shí)際上是那個(gè)時(shí)代才是視頻27/1.0001時(shí)鐘做CD刻錄遺留問題),人們發(fā)現(xiàn)這個(gè)采樣頻率最合適,低于這個(gè)值就會(huì)有較明顯的損失,而高于這個(gè)值人的耳朵已經(jīng)很難分辨,而且增大了數(shù)字音頻所占用的空間。一般為了達(dá)到“萬分精確”,我們還會(huì)使用48kHz甚至96kHz的采樣頻率,實(shí)際上,96kHz采樣頻率和44.1kHz采樣頻率的區(qū)別絕對(duì)不會(huì)象44.1kHz和22kHz那樣區(qū)別如此之大,我們所使用的CD的采樣標(biāo)準(zhǔn)就是44.1kHz,目前44.1kHz還是一個(gè)最通行的標(biāo)準(zhǔn),有些人認(rèn)為96kHz將是未來錄音界的趨勢(shì)。采樣頻率提高應(yīng)該是一件好事,但我們真的能聽出96kHz采樣頻率制作的音樂與44.1kHz采樣頻率制作的音樂的區(qū)別嗎?不過隨著高端音響設(shè)備的大眾化,我們也許就會(huì)在Party時(shí)聽到更高質(zhì)量的音樂了。
比特率
比特率是大家常聽說的一個(gè)名詞,數(shù)碼錄音一般使用16比特、20比特或24比特制作音樂。什么是“比特”?我們知道聲音有輕有響,影響聲音響度的物理要素是振幅,作為數(shù)碼錄音,必須也要能精確表示樂曲的輕響,所以一定要對(duì)波形的振幅有一個(gè)精確的描述?!氨忍兀╞it)”就是這樣一個(gè)單位,16比特就是指把波形的振幅劃為2^16即65536個(gè)等級(jí),根據(jù)模擬信號(hào)的輕響把它劃分到某個(gè)等級(jí)中去,就可以用數(shù)字來表示了。和采樣頻率一樣,比特率越高,越能細(xì)致地反映樂曲的輕響變化。20比特就可以產(chǎn)生1048576個(gè)等級(jí),表現(xiàn)交響樂這類動(dòng)態(tài)十分大的音樂已經(jīng)沒有什么問題了。剛才提到了一個(gè)名詞“動(dòng)態(tài)”,它其實(shí)指的是一首樂曲最響和最輕的對(duì)比能達(dá)到多少,我們也常說“動(dòng)態(tài)范圍”,單位是dB,而動(dòng)態(tài)范圍和我們錄音時(shí)采用的比特率是緊密結(jié)合在一起的,如果我們使用了一個(gè)很低的比特率,那么就只有很少的等級(jí)可以用來描述音響的強(qiáng)弱,當(dāng)然就不能聽到大幅度的強(qiáng)弱對(duì)比了。動(dòng)態(tài)范圍和比特率的關(guān)系是;比特率每增加1比特,動(dòng)態(tài)范圍就增加6dB。所以假如我們使用1比特錄音,那么我們的動(dòng)態(tài)范圍就只有6dB,這樣的音樂是不可能聽的。16比特時(shí),動(dòng)態(tài)范圍是96dB。這可以滿足一般的需求了。20比特時(shí),動(dòng)態(tài)范圍是120dB,對(duì)比再強(qiáng)烈的交響樂都可以應(yīng)付自如了,表現(xiàn)音樂的強(qiáng)弱是綽綽有余了。發(fā)燒級(jí)的錄音師還使用24比特,但是和采樣精度一樣,它不會(huì)比20比特有很明顯的變化,理論上24比特可以做到144 dB的動(dòng)態(tài)范圍,但實(shí)際上是很難達(dá)到的,因?yàn)槿魏卧O(shè)備都不可避免會(huì)產(chǎn)生噪音,至少在現(xiàn)階段24比特很難達(dá)到其預(yù)期效果。
以下是常見音頻文件格式的特點(diǎn)。
要在計(jì)算機(jī)內(nèi)播放或是處理音頻文件,也就是要對(duì)聲音文件進(jìn)行數(shù)、模轉(zhuǎn)換,這個(gè)過程同樣由采樣和量化構(gòu)成,人耳所能聽到的聲音,最低的頻率是從20Hz起一直到最高頻率20KHZ,20KHz以上人耳是聽不到的,因此音頻的最大帶寬是20KHZ,故而采樣速率需要介于40~50KHZ之間,而且對(duì)每個(gè)樣本需要更多的量化比特?cái)?shù)。音頻數(shù)字化的標(biāo)準(zhǔn)是每個(gè)樣本16位(16bit,即96dB)的信噪比,采用線性脈沖編碼調(diào)制PCM,每一量化步長(zhǎng)都具有相等的長(zhǎng)度。在音頻文件的制作中,正是采用這一標(biāo)準(zhǔn)。
CD格式
天籟
當(dāng)今世界上音質(zhì)最好的音頻格式是什么?當(dāng)然是CD了。因此要講音頻格式,CD自然是打頭陣的先鋒。在大多數(shù)播放軟件的“打開文件類型”中,都可以看到*.cda格式,這就是CD音軌了。標(biāo)準(zhǔn)CD格式也就是44.1K的采樣頻率,速率88K/秒,16位量化位數(shù),因?yàn)镃D音軌可以說是近似無損的,因此它的聲音基本上是忠于原聲的,因此如果你如果是一個(gè)音響發(fā)燒友的話,CD是你的首選。它會(huì)讓你感受到天籟之音。CD光盤可以在CD唱機(jī)中播放,也能用電腦里的各種播放軟件來重放。一個(gè)CD音頻文件是一個(gè)*.cda文件,這只是一個(gè)索引信息,并不是真正的包含聲音信息,所以不論CD音樂的長(zhǎng)短,在電腦上看到的“*.cda文件”都是44字節(jié)長(zhǎng)。注意:不能直接的復(fù)制CD格式的*.cda文件到硬盤上播放,需要使用象EAC這樣的抓音軌軟件把CD格式的文件轉(zhuǎn)換成WAV,這個(gè)轉(zhuǎn)換過程如果光盤驅(qū)動(dòng)器質(zhì)量過關(guān)而且EAC的參數(shù)設(shè)置得當(dāng)?shù)脑?,可以說是基本上無損抓音頻。推薦大家使用這種方法。
WAV
無損
是微軟公司開發(fā)的一種聲音文件格式,它符合 PIFFResource Interchange File Format 文件規(guī)范,用于保存WINDOWS平臺(tái)的音頻信息資源,被WINDOWS平臺(tái)及其應(yīng)用程序所支持?!?.WAV”格式支持MSADPCM、CCITT A LAW等多種壓縮算法,支持多種音頻位數(shù)、采樣頻率和聲道,標(biāo)準(zhǔn)格式的WAV文件和CD格式一樣,也是44.1K的采樣頻率,速率88K/秒,16位量化位數(shù),看到了吧,WAV格式的聲音文件質(zhì)量和CD相差無幾,也是PC機(jī)上廣為流行的聲音文件格式,幾乎所有的音頻編輯軟件都“認(rèn)識(shí)”WAV格式。
這里順便提一下由蘋果公司開發(fā)的AIFF(Audio Interchange File Format)格式和為UNIX系統(tǒng)開發(fā)的AU格式,它們都和和WAV非常相像,在大多數(shù)的音頻編輯軟件中也都支持它們這幾種常見的音樂格式。
MP3
流行
MP3格式誕生于八十年代的德國,所謂的MP3也就是指的是MPEG標(biāo)準(zhǔn)中的音頻部分,也就是MPEG音頻層。根據(jù)壓縮質(zhì)量和編碼處理的不同分為3層,分別對(duì)應(yīng)“*.mp1"/“*.mp2”/“*.mp3”這3種聲音文件。需要提醒大家注意的地方是:MPEG音頻文件的壓縮是一種有損壓縮,MPEG3音頻編碼具有10:1~12:1的高壓縮率,同時(shí)基本保持低音頻部分不失真,但是犧牲了聲音文件中12KHz到16KHz高音頻這部分的質(zhì)量來換取文件的尺寸,相同長(zhǎng)度的音樂文件,用*.mp3格式來儲(chǔ)存,一般只有*.wav文件的1/10,而音質(zhì)要次于CD格式或WAV格式的聲音文件。由于其文件尺寸小,音質(zhì)好;所以在它問世之初還沒有什么別的音頻格式可以與之匹敵,因而為*.mp3格式的發(fā)展提供了良好的條件。直到現(xiàn)在,這種格式還是風(fēng)靡一時(shí),作為主流音頻格式的地位難以被撼動(dòng)。但是樹大招風(fēng),MP3音樂的版權(quán)問題也一直是找不到辦法解決,因?yàn)镸P3沒有版權(quán)保護(hù)技術(shù),說白了也就是誰都可以用。
MP3格式壓縮音樂的采樣頻率有很多種,可以用64Kbps或更低的采樣頻率節(jié)省空間,也可以用320Kbps的標(biāo)準(zhǔn)達(dá)到極高的音質(zhì)。我們用裝有Fraunhofer IIS Mpeg Lyaer3的 MP3編碼器(現(xiàn)在效果最好的編碼器)MusicMatch Jukebox 6.0在128Kbps的頻率下編碼一首3分鐘的歌曲,得到2.82MB的MP3文件。采用缺省的CBR(固定采樣頻率)技術(shù)可以以固定的頻率采樣一首歌曲,而VBR(可變采樣頻率)則可以在音樂“忙”的時(shí)候加大采樣的頻率獲取更高的音質(zhì),不過產(chǎn)生的MP3文件可能在某些播放器上無法播放。我們把VBR的級(jí)別設(shè)定成為與前面的CBR文件的音質(zhì)基本一樣,生成的VBR MP3文件為2.9MB。
MIDI
經(jīng)常玩音樂的人應(yīng)該常聽到MIDI(Musical Instrument Digital Interface)這個(gè)詞,MIDI允許數(shù)字合成器和其他設(shè)備交換數(shù)據(jù)。MID文件格式由MIDI繼承而來。MID文件并不是一段錄制好的聲音,而是記錄聲音的信息,然后在告訴聲卡如何再現(xiàn)音樂的一組指令。這樣一個(gè)MIDI文件每存1分鐘的音樂只用大約5~10KB。今天,MID文件主要用于原始樂器作品,流行歌曲的業(yè)余表演,游戲音軌以及電子賀卡等。*.mid文件重放的效果完全依賴聲卡的檔次。*.mid格式的最大用處是在電腦作曲領(lǐng)域。*.mid文件可以用作曲軟件寫出,也可以通過聲卡的MIDI口把外接音序器演奏的樂曲輸入電腦里,制成*.mid文件。
WMA
最具實(shí)力
WMA (Windows Media Audio) 格式是來自于微軟的重量級(jí)選手,高保真聲音通頻帶寬,音質(zhì)更好,后臺(tái)強(qiáng)硬,音質(zhì)要強(qiáng)于MP3格式,更遠(yuǎn)勝于RA格式,它和日本YAMAHA公司開發(fā)的VQF格式一樣,是以減少數(shù)據(jù)流量但保持音質(zhì)的方法來達(dá)到比MP3壓縮率更高的目的,WMA的壓縮率一般都可以達(dá)到1:18左右,WMA的另一個(gè)優(yōu)點(diǎn)是內(nèi)容提供商可以通過DRM(Digital Rights Management)方案如Windows Media Rights Manager 7加入防拷貝保護(hù)。這種內(nèi)置了版權(quán)保護(hù)技術(shù)可以限制播放時(shí)間和播放次數(shù)甚至于播放的機(jī)器等等,這對(duì)被盜版攪得焦頭亂額的音樂公司來說可是一個(gè)福音,另外WMA還支持音頻流(Stream)技術(shù),適合在網(wǎng)絡(luò)上在線播放,作為微軟搶占網(wǎng)絡(luò)音樂的開路先鋒可以說是技術(shù)領(lǐng)先、風(fēng)頭強(qiáng)勁,更方便的是不用象MP3那樣需要安裝額外的播放器,而Windows操作系統(tǒng)和Windows Media Player的無縫捆綁讓你只要安裝了windows操作系統(tǒng)就可以直接播放WMA音樂,新版本的Windows Media Player7.0更是增加了直接把CD光盤轉(zhuǎn)換為WMA聲音格式的功能,在新出品的操作系統(tǒng)Windows XP中,WMA是默認(rèn)的編碼格式,大家知道Netscape的遭遇,“狼”又來了。WMA這種格式在錄制時(shí)可以對(duì)音質(zhì)進(jìn)行調(diào)節(jié)。同一格式,音質(zhì)好的可與CD媲美,壓縮率較高的可用于網(wǎng)絡(luò)廣播。雖然網(wǎng)絡(luò)上還不是很流行,但是在微軟的大規(guī)模推廣下已經(jīng)是得到了越來越多站點(diǎn)的承認(rèn)和大力支持,在網(wǎng)絡(luò)音樂領(lǐng)域中直逼*.mp3,在網(wǎng)絡(luò)廣播方面,也正在瓜分Real打下的天下。因此,幾乎所有的音頻格式都感受到了WMA格式的壓力。
流動(dòng)旋律
RealAudio主要適用于在網(wǎng)絡(luò)上的在線音樂欣賞,大多數(shù)的用戶仍然在使用56Kbps或更低速率的Modem,所以典型的回放并非最好的音質(zhì)。有的下載站點(diǎn)會(huì)提示你根據(jù)你的Modem速率選擇最佳的Real文件。real的的文件格式主要有這么幾種:有RA(RealAudio)、RM(RealMedia,RealAudio G2)、RMX(RealAudio Secured),還有更多。這些格式的特點(diǎn)是可以隨網(wǎng)絡(luò)帶寬的不同而改變聲音的質(zhì)量,在保證大多數(shù)人聽到流暢聲音的前提下,令帶寬較富裕的聽眾獲得較好的音質(zhì)。
隨著網(wǎng)絡(luò)帶寬的普遍改善,Real公司正推出用于網(wǎng)絡(luò)廣播的、達(dá)到CD音質(zhì)的格式。如果你的RealPlayer軟件不能處理這種格式,它就會(huì)提醒你下載一個(gè)免費(fèi)的升級(jí)包。許多音樂網(wǎng)站 提供了歌曲的Real格式的試聽版本?,F(xiàn)在最新的版本是RealPlayer 11。
VQF
雅馬哈公司另一種格式是*.vqf,它的核心是減少數(shù)據(jù)流量但保持音質(zhì)的方法來達(dá)到更高的壓縮比,可以說技術(shù)上也是很先進(jìn)的,但是由于宣傳不力,這種格式難有用武之地。*.vqf可以用雅馬哈的播放器播放。同時(shí)雅馬哈也提供從*.wav文件轉(zhuǎn)換到*.vqf文件的軟件。 此文件缺少特點(diǎn)外加缺乏宣傳,幾乎已經(jīng)宣布死刑了。
新生代音頻
ogg格式完全開源,完全免費(fèi), 和mp3不相上下的新格式。 與MP3類似,OGGVorbis也是對(duì)音頻進(jìn)行有損壓縮編碼,但通過使用更加先進(jìn)的聲學(xué)模型去減少損失,因此,相同碼率編碼的OGGVorbis比MP3音質(zhì)更好一些,文件也更小一些。另外,MP3格式是受專利保護(hù)的。發(fā)布或者銷售MP3編碼器、MP3解碼器、MP3格式音樂作品,都需要付專利使用費(fèi)。而OGGVorbis就完全沒有這個(gè)問題。OGGVorbis雖然還不普及,但在音樂軟件、游戲音效、便攜播放器、網(wǎng)絡(luò)瀏覽器上都得到廣泛支持。
自由無損音頻
FLAC即是Free Lossless Audio Codec的縮寫,中文可解為無損音頻壓縮編碼。FLAC是一套著名的自由音頻壓縮編碼,其特點(diǎn)是無損壓縮。不同于其他有損壓縮編碼如MP3及AAC,它不會(huì)破壞任何原有的音頻資訊,所以可以還原音樂光盤音質(zhì)。它已被很多軟件及硬件音頻產(chǎn)品所支持。FLAC是免費(fèi)的并且支持大多數(shù)的操作系統(tǒng),包括Windows,基于Unix內(nèi)核而開發(fā)的系統(tǒng) (Linux, *BSD,Solaris,OSX,IRIX),BeOS,OS/2,Amiga。并且FLAC提供了在開發(fā)工具autotools,MSVC,Watcom C,ProjectBuilder上的build系統(tǒng)。
網(wǎng)絡(luò)無損
APE是流行的數(shù)字音樂文件格式之一。與MP3這類有損壓縮方式不同,APE是一種無損壓縮音頻技術(shù),也就是說當(dāng)你將從音頻CD上讀取的音頻數(shù)據(jù)文件壓縮成APE格式后,你還可以再將APE格式的文件還原,而還原后的音頻文件與壓縮前的一模一樣,沒有任何損失。APE的文件大小大概為CD的一半,但是隨著寬帶的普及,APE格式受到了許多音樂愛好者的喜愛,特別是對(duì)于希望通過網(wǎng)絡(luò)傳輸音頻CD的朋友來說,APE可以幫助他們節(jié)約大量的資源。
作為數(shù)字音樂文件格式的標(biāo)準(zhǔn),WAV格式容量過大,因而使用起來很不方便。因此,一般情況下我們把它壓縮為MP3或 WMA 格式。壓縮方法有無損壓縮,有損壓縮,以及混成壓縮。MPEG, JPEG就屬于混成壓縮,如果把壓縮的數(shù)據(jù)還原回去,數(shù)據(jù)其實(shí)是不一樣的。當(dāng)然,人耳是無法分辨的。因此,如果把 MP3, OGG格式從壓縮的狀態(tài)還原回去的話,就會(huì)產(chǎn)生損失。
然而APE壓縮格式即使還原,也能毫無損失地保留原有音質(zhì)。所以,APE可以無損失高音質(zhì)地壓縮和還原。當(dāng)然,只能把音樂CD中的曲目和未壓縮的WAV文件轉(zhuǎn)換成APE格式,MP3文件還無法轉(zhuǎn)換為APE格式。事實(shí)上APE的壓縮率并不高,雖然音質(zhì)保持得很好,但是壓縮后的容量也沒小多少。一個(gè)34MB的WAV文件,壓縮為APE格式后,仍有17MB左右。對(duì)于一整張CD來說,壓縮省下來的容量還是可觀的。
APE的本質(zhì),其實(shí)它是一種無損壓縮音頻格式。龐大的WAV音頻文件可以通過Monkey's Audio這個(gè)軟件壓縮為APE。很多時(shí)候它被用做網(wǎng)絡(luò)音頻文件傳輸,因?yàn)楸粔嚎s后的APE文件容量要比WAV源文件小一半多,可以節(jié)約傳輸所用的時(shí)間。更重要的是,通過Monkey's Audio解壓縮還原以后得到的WAV文件可以做到與壓縮前的源文件完全一致。所以APE被譽(yù)為“無損音頻壓縮格式”,Monkey''s Audio被譽(yù)為“無損音頻壓縮軟件”。與采用WinZip或者WinRAR這類專業(yè)數(shù)據(jù)壓縮軟件來壓縮音頻文件不同,壓縮之后的APE音頻文件是可以直接被播放的。Monkey's Audio會(huì)向Winamp中安裝一個(gè)“in_APE.dll”插件,從而使Winamp也具備播放APE文件的能力。同樣foobar2000,以及千千靜聽也能支持APE的播放。
前途無量
時(shí)下的MP3支持格式最常見的是MP3和WMA。MP3由于是有損壓縮,因此講求采樣率,一般是44.1KHZ。另外,還有比特率,即數(shù)據(jù)流,一般為8---320KBPS。在MP3編碼時(shí),還看看它是否支持可變比特率(VBR,即高音質(zhì)部分采用高比特率,低音質(zhì)部分采用低比特率),出的MP3機(jī)大部分都支持,這樣可以減小有效文件的體積。WMA則是微軟力推的一種音頻格式,相對(duì)來說要比MP3體積更小。
其他格式
當(dāng)然,現(xiàn)在還有更多的音頻合適,應(yīng)用相對(duì)廣泛的有AAC,(高級(jí)音頻編碼技術(shù),Advanced Audio Coding)是杜比實(shí)驗(yàn)室為音樂社區(qū)提供的技術(shù)。AAC號(hào)稱「最大能容納48通道的音軌,采樣率達(dá)96 KHz,并且在320Kbps的數(shù)據(jù)速率下能為5.1聲道音樂節(jié)目提供相當(dāng)于ITU-R廣播的品質(zhì)」。和MP3比起來,它的音質(zhì)比較好,也能夠節(jié)省大約30%的儲(chǔ)存空間與帶寬。它是遵循MPEG-2的規(guī)格所開發(fā)的技術(shù)。
一、音頻媒體的數(shù)字化處理
隨著計(jì)算機(jī)技術(shù)的發(fā)展,特別是海量存儲(chǔ)設(shè)備和大容量?jī)?nèi)存在PC機(jī)上的實(shí)現(xiàn),對(duì)音頻媒體進(jìn)行數(shù)字化處理便成為可能。數(shù)字化處理的核心是對(duì)音頻信息的采樣,通過對(duì)采集到的樣本進(jìn)行加工,達(dá)成各種效果,這是音頻媒體數(shù)字化處理的基本含義。
二、音頻媒體的基本處理
基本的音頻數(shù)字化處理包括以下幾種:
不同采樣率、頻率、通道數(shù)之間的變換和轉(zhuǎn)換。其中變換只是簡(jiǎn)單地將其視為另一種格式,而轉(zhuǎn)換通過重采樣來進(jìn)行,其中還可以根據(jù)需要采用插值算法以補(bǔ)償失真。
針對(duì)音頻數(shù)據(jù)本身進(jìn)行的各種變換,如淡入、淡出、音量調(diào)節(jié)等。
通過數(shù)字濾波算法進(jìn)行的變換,如高通、低通濾波器。
音頻媒體的三維化處理
長(zhǎng)期以來,計(jì)算機(jī)的研究者們一直低估了聲音對(duì)人類在信息處理中的作用。當(dāng)虛擬技術(shù)不斷發(fā)展之時(shí),人們就不再滿足單調(diào)平面的聲音,而更催向于具有空間感的三維聲音效果。聽覺通道可以與視覺通道同時(shí)工作,所以聲音的三維化處理不僅可以表達(dá)出聲音的空間信息,而且與視覺信息的多通道的結(jié)合可以創(chuàng)造出極為逼真的虛擬空間,這在未來的多媒體系統(tǒng)中是極為重要的。這也是在媒體處理方面的重要措施。
人類感知聲源的位置的最基本的理論是雙工理論,這種理論基于兩種因素:兩耳間聲音的到達(dá)時(shí)間差和兩耳間聲音的強(qiáng)度差。時(shí)間差是由于距離的原因造成,當(dāng)聲音從正面?zhèn)鱽?,距離相等,所以沒有時(shí)間差,但若偏右三度則到達(dá)右耳的時(shí)間就要比左耳約少三十微秒,而正是這三十微秒,使得我們辨別出了聲源的位置。強(qiáng)度差是由于信號(hào)的衰減造成,信號(hào)的衰減是因?yàn)榫嚯x而自然產(chǎn)生的,或是因?yàn)槿说念^部遮擋,使聲音衰減,產(chǎn)生了強(qiáng)度的差別,使得靠近聲源一側(cè)的耳朵聽到的聲音強(qiáng)度要大于另一耳。
基于雙工理論,同樣地,只要把一個(gè)普通的雙聲道音頻在兩個(gè)聲道之間進(jìn)行相互混合,便可以使普通雙聲道聲音聽起來具有三維音場(chǎng)的效果。這涉及到以下有關(guān)音場(chǎng)的兩個(gè)概念:音場(chǎng)的寬度和深度。
音場(chǎng)的寬度利用時(shí)間差的原理完成,由于是對(duì)普通立體聲音頻進(jìn)行擴(kuò)展,所以音源的位置始終在音場(chǎng)的中間不變,這樣就簡(jiǎn)化了我們的工作。要處理的就只有把兩個(gè)聲道的聲音進(jìn)行適當(dāng)?shù)难訒r(shí)和強(qiáng)度減弱后相互混合。由于這樣的擴(kuò)展是有局限性的,即延時(shí)不能太長(zhǎng),否則就會(huì)變?yōu)榛匾簟?/span>
音場(chǎng)的深度利用強(qiáng)度差的原理完成,具體的表現(xiàn)形式是回聲。音場(chǎng)越深,則回音的延時(shí)就越長(zhǎng)。所以在回音的設(shè)置中應(yīng)至少提供三個(gè)參數(shù):回音的衰減率、回音的深度和回音之間的延時(shí)。同時(shí),還應(yīng)該提供用于設(shè)置另一通道混進(jìn)來的聲音深度的多少的選項(xiàng)。
“數(shù)字音頻接口”是用來定義兩個(gè)數(shù)字音頻設(shè)備之間的數(shù)字接口協(xié)議的界標(biāo)準(zhǔn)格式,它分為家用的、專業(yè)的、電腦的三種格式:
家用的標(biāo)準(zhǔn)
S/PDIF(索尼/飛利浦?jǐn)?shù)字接口格式),EIAJ CP-340 IEC-958 同軸或光纜,屬不平衡式。其標(biāo)準(zhǔn)的輸出電平是0.5Vpp(發(fā)送器負(fù)載75Ω),輸入和輸出阻抗為75Ω(0.7-3MHz頻寬)。常用的有光纖RCA和BNC。我們常見的是RCA插頭作同軸輸出,但是用RCA作同軸輸出是個(gè)錯(cuò)誤的做法,正確的做法是用BNC作同軸輸出,因?yàn)锽NC頭的阻抗是75Ω,剛剛好適合S/PDIF的格式標(biāo)準(zhǔn),但由于歷史的原因,在一般的家用機(jī)上用的是RCA作同軸輸出。
專業(yè)的標(biāo)準(zhǔn)
AES/EBU(美國音頻工程協(xié)會(huì)/歐洲廣播聯(lián)盟數(shù)字格式),AES3-1992,平衡XLR電纜,屬平衡式結(jié)構(gòu)。輸出電壓是2.7Vpp(發(fā)送器負(fù)載110Ω),輸入和輸出阻抗為110Ω(0.1-6MHz頻寬)。
電腦的標(biāo)準(zhǔn)
AT﹠T(美國電話電報(bào)公司)。
目錄