聲音采樣就是把模擬音頻轉(zhuǎn)成數(shù)字音頻的過(guò)程,所用到的主要設(shè)備便是模擬/數(shù)字轉(zhuǎn)換器(Analog to Digital Converter,即ADC,與之對(duì)應(yīng)的是數(shù)/模轉(zhuǎn)換器,即DAC)。采樣的過(guò)程實(shí)際上是將通常的模擬音頻信號(hào)的電信號(hào)轉(zhuǎn)換成二進(jìn)制碼0和1,這些0和1便構(gòu)成了數(shù)字音頻文件。采樣的頻率越大則音質(zhì)越有保證。由于采樣頻率一定要高于錄制的最高頻率的兩倍才不會(huì)產(chǎn)生失真,而人類的聽力范圍是20Hz~20KHz,所以采樣頻率至少得是20k×2=40KHz,才能保證不產(chǎn)生低頻失真,這也是CD音質(zhì)采用44.1KHz(稍高于40kHz是為了留有余地)的原因。
1,聲音的產(chǎn)生
聲音是大氣以某種連續(xù)的高調(diào)波,傳遞到人的耳內(nèi),引起耳朵內(nèi)的耳膜振動(dòng),再由其他耳內(nèi)的組織傳遞振動(dòng)到基底膜,從而使得基底膜上的聽覺細(xì)胞電位產(chǎn)生變化,不同頻率的振動(dòng)將引起不同位置的聽覺細(xì)胞電位變化,最后這種電位變化傳遞給大腦,就產(chǎn)生了聽覺,即聽到了聲音。
人直接說(shuō)話,振動(dòng)空氣,使身邊的人聽見;打擊樂(lè)器,樂(lè)器振動(dòng)空氣,直接使附近的聽眾聽見。這種情況下,聲音的源頭直接振動(dòng)空氣,所以聲音的頻率特性,即隨著頻率的變化,聲音在空氣某個(gè)具體的位置產(chǎn)生的壓強(qiáng),音壓,也產(chǎn)生變化的特性,能夠很好很完善的傳遞給大氣,從而使人最終聽見。
聲音的傳播需要介質(zhì),在真空中不能傳播。聲波屬于縱波。
2,聲音的分類
1)由聲音內(nèi)容分類
自然聲:自然界發(fā)出的聲音樂(lè)器聲:由樂(lè)器發(fā)出的聲音人聲:由人發(fā)出的聲音
噪聲:上述以外,令人煩躁的聲音
2)由聲音頻譜分類
純音:單一頻率的聲音
復(fù)音:由頻率不同的一些純音合成的聲音單音:由一個(gè)基音與它整數(shù)倍的諧音合成的聲
3)由聲音的頻率范圍分類
次聲:人耳聽不到的低頻率空氣振動(dòng)可聽聲:在人耳能聽到頻率范圍內(nèi)的聲音超聲:人耳聽不到的高頻率空氣振動(dòng)
4)由聲音時(shí)間性分類
周期性聲音,樂(lè)器聲、人聲等周期聲音非周期聲音,噪聲等無(wú)周期聲音
脈沖性聲音,持續(xù)時(shí)間短促的聲音
3,聲音三要素
音調(diào)
由成分音的頻率最低的基音決定,單位是基音的單位 Hz,另外還會(huì)包括各種諧音和不成倍數(shù)的非諧音組成?;纛l率高,音調(diào)就高。
響度
由聲壓大小有效值來(lái)決定,它標(biāo)稱著我們聽到聲音的大小,是一個(gè)對(duì)數(shù)值,單位是方。聲音頻率不同,同等聲壓,我們聽到的響度也不同。
音色
通常,音色由聲音所包含的成分音數(shù)目和振幅大小不同而不同,一般表現(xiàn)為發(fā)聲材料的不同。同樣音調(diào)的鋼琴聲和小提琴聽起來(lái)不同,是由于他們的音色不同。
在數(shù)字音頻領(lǐng)域,常用的采樣率有:
8,000 Hz - 電話所用采樣率, 對(duì)于人的說(shuō)話已經(jīng)足夠
11,025 Hz-AM調(diào)幅廣播所用采樣率
22,050 Hz和24,000 Hz- FM調(diào)頻廣播所用采樣率
32,000 Hz - miniDV 數(shù)碼視頻 camcorder、DAT (LP mode)所用采樣率
44,100 Hz - 音頻 CD, 也常用于 MPEG-1 音頻(VCD, SVCD, MP3)所用采樣率
47,250 Hz - 商用 PCM 錄音機(jī)所用采樣率
48,000 Hz - miniDV、數(shù)字電視、DVD、DAT、電影和專業(yè)音頻所用的數(shù)字聲音所用采樣率
50,000 Hz - 商用數(shù)字錄音機(jī)所用采樣率
96,000 或者 192,000 Hz - DVD-Audio、一些 LPCM DVD 音軌、BD-ROM(藍(lán)光盤)音軌、和 HD-DVD (高清晰度 DVD)音軌所用所用采樣率
2.8224 MHz - Direct Stream Digital 的 1 位 sigma-delta modulation 過(guò)程所用采樣率。
聲音其實(shí)是一種能量波,因此也有頻率和振幅的特征,頻率對(duì)應(yīng)于時(shí)間軸線,振幅對(duì)應(yīng)于電平軸線。波是無(wú)限光滑的,弦線可以看成由無(wú)數(shù)點(diǎn)組成,由于存儲(chǔ)空間是相對(duì)有限的,數(shù)字編碼過(guò)程中,必須對(duì)弦線的點(diǎn)進(jìn)行采樣。采樣的過(guò)程就是抽取某點(diǎn)的頻率值,很顯然,在一秒中內(nèi)抽取的點(diǎn)越多,獲取得頻率信息更豐富,為了復(fù)原波形,一次振動(dòng)中,必須有2個(gè)點(diǎn)的采樣,人耳能夠感覺到的最高頻率為20kHz,因此要滿足人耳的聽覺要求,則需要至少每秒進(jìn)行40k次采樣,用40kHz表達(dá),這個(gè)40kHz就是采樣率。我們常見的CD,采樣率為44.1kHz。
采集過(guò)程中視頻和音頻同步是非常重要的,光有頻率信息是不夠的,我們還必須獲得該頻率的能量值并量化,用于表示信號(hào)強(qiáng)度。量化電平數(shù)為2的整數(shù)次冪,我們常見的CD位16級(jí)的采樣大小,即2的4次方。采樣大小相對(duì)采樣率更難理解,因?yàn)橐@得抽象點(diǎn),舉個(gè)簡(jiǎn)單例子:假設(shè)對(duì)一個(gè)波進(jìn)行8次采樣,采樣點(diǎn)分別對(duì)應(yīng)的能量值分別為A1-A8,但我們只使用2bit的采樣大小,結(jié)果我們只能保留A1-A8中4個(gè)點(diǎn)的值而舍棄另外4個(gè)。如果我們進(jìn)行3bit的采樣大小,則剛好記錄下8個(gè)點(diǎn)的所有信息。采樣率和采樣大小的值越大,記錄的波形更接近原始信號(hào)。