音質(zhì)標(biāo)準(zhǔn)與音質(zhì)評(píng)價(jià)方法
來源:一禾音視頻 編輯:小月亮 2019-07-20 21:54:00 加入收藏
音質(zhì)標(biāo)準(zhǔn)
所謂聲音的質(zhì)量,是指經(jīng)傳輸、處理后音頻信號(hào)的保真度。目前,業(yè)界公認(rèn)的聲音質(zhì)量標(biāo)準(zhǔn)分為4級(jí),即數(shù)字激光唱盤CD-DA質(zhì)量,其信號(hào)帶寬為10Hz~20kHz;調(diào)頻廣播FM質(zhì)量,其信號(hào)帶寬為20Hz~15kHz;調(diào)幅廣播AM質(zhì)量,其信號(hào)帶寬為50Hz~7kHz;電話的話音質(zhì)量,其信號(hào)帶寬為200Hz~3400Hz??梢?,數(shù)字激光唱盤的聲音質(zhì)量最高,電話的話音質(zhì)量最低。除了頻率范圍外,人們往往還用其它方法和指標(biāo)來進(jìn)一步描述不同用途的音質(zhì)標(biāo)準(zhǔn)。
對(duì)模擬音頻來說,再現(xiàn)聲音的頻率成分越多,失真與干擾越小,聲音保真度越高,音質(zhì)也越好。如在通信科學(xué)中,聲音質(zhì)量的等級(jí)除了用音頻信號(hào)的頻率范圍外,還用失真度、信噪比等指標(biāo)來衡量。
對(duì)數(shù)字音頻來說,再現(xiàn)聲音頻率的成分越多,誤碼率越小,音質(zhì)越好。通常用數(shù)碼率(或存儲(chǔ)容量)來衡量,取樣頻率越高、量化比特?cái)?shù)越大,聲道數(shù)越多,存儲(chǔ)容量越大,當(dāng)然保真度就高,音質(zhì)就好。
聲音的類別特點(diǎn)不同,音質(zhì)要求也不一樣。如,語音音質(zhì)保真度主要體現(xiàn)在清晰、不失真、再現(xiàn)平面聲象;樂音的保真度要求較高,營造空間聲象主要體現(xiàn)在用多聲道模擬立體環(huán)繞聲,或虛擬雙聲道3D環(huán)繞聲等方法,再現(xiàn)原來聲源的一切聲象。
音頻信號(hào)的用途不同,采用壓縮的質(zhì)量標(biāo)準(zhǔn)也不一樣。如,電話質(zhì)量的音頻信號(hào)采用ITU-TG?711標(biāo)準(zhǔn),8kHz取樣,8bit量化,碼率64Kbps。AM廣播采用ITU-TG?722標(biāo)準(zhǔn),16kHz取樣,14bit量化,碼率224Kbps。高保真立體聲音頻壓縮標(biāo)準(zhǔn)由ISO和ITU-T聯(lián)合制訂,CD11172-3MPEG音頻標(biāo)準(zhǔn)為48kHz、44.1kHz、32kHz取樣,每聲道數(shù)碼率32Kbps~448Kbps,適合CD-DA光盤用。
對(duì)聲音質(zhì)量要求過高,則設(shè)備復(fù)雜;反之,則不能滿足應(yīng)用。一般以"夠用,又不浪費(fèi)"為原則。
音質(zhì)評(píng)價(jià)方法
評(píng)價(jià)再現(xiàn)聲音的質(zhì)量有主觀評(píng)價(jià)和客觀評(píng)價(jià)兩種方法。例如:
1.語音音質(zhì)
評(píng)定語音編碼質(zhì)量的方法為主觀評(píng)定和客觀評(píng)定。目前常用的是主觀評(píng)定,即以主觀打分 (MOS)來度量,它分為以下五級(jí):5(優(yōu)),不察覺失真;4(良),剛察覺失真,但不討厭;3(中),察覺失真,稍微討厭;2(差),討厭,但不令人反感;1(劣),極其討厭,令人反感。一般再現(xiàn)語音頻率若達(dá)7kHz以上,MOS可評(píng)5分。這種評(píng)價(jià)標(biāo)準(zhǔn)廣泛應(yīng)用于多媒體技術(shù)和通信中,如可視電話、電視會(huì)議、語音電子郵件、語音信箱等。
2.樂音音質(zhì)
樂音音質(zhì)的優(yōu)劣取決于多種因素,如聲源特性(聲壓、頻率、頻譜等)、音響器材的信號(hào)特性(如失真度、頻響、動(dòng)態(tài)范圍、信噪比、瞬態(tài)特性、立體聲分離度等)、聲場(chǎng)特性(如直達(dá)聲、前期反射聲、混響聲、兩耳間互相關(guān)系數(shù)、基準(zhǔn)振動(dòng)、吸聲率等)、聽覺特性(如響度曲線、可聽范圍、各種聽感)等。所以,對(duì)音響設(shè)備再現(xiàn)音質(zhì)的評(píng)價(jià)難度較大。
通常用下列兩種方法:一是使用儀器測(cè)試技術(shù)指標(biāo);二是憑主觀聆聽各種音效。由于樂音音質(zhì)屬性復(fù)雜,主觀評(píng)價(jià)的個(gè)人色彩較濃,而現(xiàn)有的音響測(cè)試技術(shù)又只能從某些側(cè)面反映其保真度。所以,迄今為止,還沒有一個(gè)能真正定量反映樂音音質(zhì)保真度的國際公認(rèn)的評(píng)價(jià)標(biāo)準(zhǔn)。但也有報(bào)道,國際電信聯(lián)盟(ITU-T)近期已批準(zhǔn)一種客觀評(píng)價(jià)音質(zhì)的被稱之為電子耳的新型測(cè)量方法,可對(duì)任何音響器材的音質(zhì)進(jìn)行客觀聽音評(píng)價(jià),也可用于檢測(cè)電話通訊語音編碼系統(tǒng)的缺陷。
現(xiàn)將樂音音質(zhì)評(píng)價(jià)方法綜述如下 :
1.主觀聽判音效
通常,據(jù)樂音音質(zhì)聽感三要素,即響度、音調(diào)和愉快感的變化和組合來主觀評(píng)價(jià)音質(zhì)的各種屬性,如低頻響亮為聲音豐滿,高頻響亮為聲音明亮,低頻微弱為聲音平滑,高頻微弱為聲音清澄。下面結(jié)合聲源、聲場(chǎng)及信號(hào)特性介紹幾種典型的聽感。
?、倭Ⅲw感
主要由聲音的空間感(環(huán)繞感)、定位感(方向感)、層次感(厚度感)等所構(gòu)成的聽感,具有這些聽感的聲音稱為立體聲。自然界的各種聲場(chǎng)本身都是富有立體感的,它是模擬聲源聲象最重要的一個(gè)特征。德?波爾效應(yīng)證明,人耳的生理特點(diǎn)是:人耳在兩聲源的對(duì)稱軸上,當(dāng)聲壓差△p=0dB和時(shí)間差△t=0ms時(shí),感覺兩聲源聲象相同,分不出有兩個(gè)聲源;而當(dāng)△p>15dB或△t>3ms時(shí),人耳就感覺到有兩個(gè)聲源,聲像往聲壓大或?qū)暗穆曉匆苿?dòng),每5dB的聲壓差相當(dāng)于lms的時(shí)間差。哈斯效應(yīng)又進(jìn)一步證明,當(dāng)△t=5ms~35ms時(shí),人耳感到有兩個(gè)聲源;而當(dāng)近次反射聲、滯后直達(dá)聲或兩個(gè)聲源的時(shí)間差△t>50ms時(shí),即使一次反射聲(又稱近次或前期反射聲)或滯后聲的響度比直達(dá)聲或?qū)奥暤捻懚却笤S多倍,聲源方位仍由直達(dá)聲或?qū)奥暃Q定。
根據(jù)人耳的這個(gè)生理特點(diǎn),只要通過對(duì)聲音的強(qiáng)度、延時(shí)、混響、空間效應(yīng)等進(jìn)行適當(dāng)控制和處理,在兩耳人為的制造具有一定的時(shí)間差△t、相位差△θ、聲壓差△P的聲波狀態(tài),并使這種狀態(tài)和原聲源在雙耳處產(chǎn)生的聲波狀態(tài)完全相同,人就能真實(shí)、完整地感受到重現(xiàn)聲音的立體感。與單聲道聲音相比,立體聲通常具有聲象分散、各聲部音量分布得當(dāng)、清晰度高、背景噪聲低的特點(diǎn)。
?、诙ㄎ桓?/p>
若聲源是以左右、上下、前后不同方位錄音后發(fā)送,則接收重放的聲音應(yīng)能將原聲場(chǎng)中聲源的方位重現(xiàn)出來,這就是定位感。根據(jù)人耳的生理特點(diǎn),由同一聲源首先到達(dá)兩耳的直達(dá)聲的最大時(shí)間差為0.44ms~0.5ms,同時(shí)還有一定的聲壓差、相位差。生理心理學(xué)證明:20Hz~200Hz低音主要*人兩耳的相位差定位,300Hz~4kHz中音主要*聲壓差定位,更高的高音主要*時(shí)間差定位。可見,定位感主要由首先到達(dá)兩耳的直達(dá)聲決定,而滯后到達(dá)兩耳的一次反射聲和經(jīng)四面八方多次反射的混響聲主要模擬聲象的空間環(huán)繞感。
?、劭臻g感
一次反射聲和多次反射混響聲雖然滯后直達(dá)聲,對(duì)聲音方向感影響不大,但反射聲總是從四面八方到達(dá)兩耳,對(duì)聽覺判斷周圍空間大小有重要影響,使人耳有被環(huán)繞包圍的感覺,這就是空間感??臻g感比定位感更重要。
④層次感
聲音高、中、低頻頻響均衡,高音諧音豐富,清澈纖細(xì)而不刺耳,中音明亮突出,豐滿充實(shí)而不生硬,低音厚實(shí)而無鼻音。
?、莺穸雀?/p>
低音沉穩(wěn)有力,重厚而不渾濁,高音不缺,音量適中,有一定亮度,混響合適,失真小。
除此之外,還有許多評(píng)價(jià)音質(zhì)的聽感,象力度感、亮度感、臨場(chǎng)感、軟硬感、松緊感、寬窄感等。
2.客觀測(cè)試技術(shù)指標(biāo)
?、偈д娑?/p>
諧波失真,主要引起聲音發(fā)硬、發(fā)炸;而穩(wěn)態(tài)或瞬態(tài)互調(diào)失真主要引起聲音毛糙、尖硬和混濁。二者均使音質(zhì)劣化,若失真度超過3%時(shí),音質(zhì)劣化明顯。音響系統(tǒng)的音箱失真度最大,一般最小的失真度也要超過1%。
相位失真,主要引起1kHz以下的低頻聲音模糊,同時(shí)影響中頻聲音層次和聲象定位。
抖晃失真,主要是電機(jī)轉(zhuǎn)速不穩(wěn),主導(dǎo)軸-壓帶輪壓力不穩(wěn),磁頭拍打磁帶等造成磁帶震動(dòng)和卷帶量變化,進(jìn)而使信號(hào)頻率被調(diào)制,聲音音調(diào)出現(xiàn)混濁、顫抖。抖晃通常用音調(diào)變化的均方根值表示,通常,錄音機(jī)的抖晃率<0.1%,Hi-Fi錄音機(jī)<0.005%,普通錄像機(jī)<0.3%,視盤機(jī)<0.001%。
?、陬l響與瞬態(tài)響應(yīng)
頻響,指音響設(shè)備的增益或靈敏度隨信號(hào)頻率變化的情況,用通頻帶寬度和帶內(nèi)不均勻度表示(如優(yōu)質(zhì)功放的頻響1Hz~200kHz±ldB)。帶寬越寬,高、低頻響應(yīng)越好:不均勻度越小,頻率均衡性能越好。通常,30Hz~150Hz低頻使聲音有一定厚度基礎(chǔ),150Hz~500Hz中低頻使聲音有一定力度,300Hz~500Hz中低頻聲壓過分加強(qiáng)時(shí),聲音渾濁,過分衰減時(shí),聲音乏力;500Hz~5kHz中高頻使聲音有一定明亮度,過分加強(qiáng)時(shí),聲音生硬;過分衰減時(shí),聲音散、飄;5kHz~10kHz高頻段使聲音有一定層次、色彩;過分加強(qiáng)時(shí),聲音尖刺;過分衰減時(shí),聲音暗淡、發(fā)悶。按此規(guī)律,可根據(jù)各種聽感,定量調(diào)節(jié)音響系統(tǒng)的頻響效果。
瞬態(tài)響應(yīng),是指音響系統(tǒng)對(duì)突變信號(hào)的跟隨能力。實(shí)質(zhì)上它反映脈沖信號(hào)的高次諧波失真大小,嚴(yán)重時(shí)影響音質(zhì)的透明度和層次感。瞬態(tài)響應(yīng)常用轉(zhuǎn)換速率V/μs表示,指標(biāo)越高,諧波失真越小。如,一般放大器的轉(zhuǎn)換速率>10V/μs。
?、坌旁氡?/p>
信噪比,表示信號(hào)與噪聲電平的分貝差,用S/N或SNR(dB)表示。噪聲頻率的高低,信號(hào)的強(qiáng)弱對(duì)人耳的影響不一樣。通常,人耳對(duì)4~8kHz的噪聲最靈敏,弱信號(hào)比強(qiáng)信號(hào)受噪聲影響較突出。而音響設(shè)備不同,信噪比要求也不一樣,如Hi-Fi音響要求SNR>70dB,CD機(jī)要求SNR>90dB。
?、苈暤婪蛛x度和平衡度
聲道分離度,是指不同聲道間立體聲的隔離程度,用一個(gè)聲道的信號(hào)電平與串入另一聲道的信號(hào)電平差來表示。這個(gè)差值越大越好。一般要求Hi-Fi音響分離度>50dB。聲道平衡度,是指兩個(gè)聲道的增益、頻響等特性的一致性。否則,將造成聲道聲象的偏移。
評(píng)論comment