探尋數(shù)字聲學空間處理新路徑—深度探索音王集團旗下品牌(CADAC、錄音大師、音王)自適應聲場處理器技術
來源:音王 編輯:站臺丶 2023-09-13 15:34:51 加入收藏
深度探索前,關于聲音的話題:
聲學是研究聲音的學問,也是復雜的較難掌握的科學。聲學的終極目標是要解決聲音整個傳播鏈路的一致性、完整性。而我們本篇所要探索的只是其很小的一個領域,牽扯到聲場形成的某幾個方面。
每天我們都要聽到各種聲音,由于聲音不可視,需要專業(yè)的軟件進行復雜的測量,而且測量指標受聲學環(huán)境影響極大,在不同測量的環(huán)境中得到的結果大相徑庭,解決不同的聲學環(huán)境問題需要不同的信號處理工具,目前更多的還是基于復雜的均衡器的聲場調試,這又會帶來新的相位問題,最終用戶只能接受主觀聽覺的評價,由此聲學在這塊徹底失去了標準。
人類是靠雙耳來分辨聲音的,聲音到達雙耳的時間快慢,是人的大腦從小到大逐漸適應了這種時間信息的分析,大腦可以根據(jù)一個聲音到達雙耳的細微時間差別來分辨發(fā)聲體的位置,也可以根據(jù)反射時間不一樣來判定空間的大小和屬性。大多數(shù)專業(yè)的音頻工程師把注意力放在頻率響應上,因為頻率響應的顯示相對直觀,而相位圖和群延時圖示相對來說不容易提供聽感直觀顯示,音頻工程師忽略了人類對于聲音最為訓練有素的本能。
聲學還音的過程,是依靠揚聲器在特定空間中的播放實現(xiàn)聆聽的,在這個過程中,音源播放,通過功率放大器到分頻器(大多數(shù)喇叭無法表達出20-20K人類聽覺范圍),推到揚聲器震動空氣,到達特定聲場的聽眾耳朵里,在這個復雜的換能過程中,分頻器、房間的結構,聽眾的位置都會大大的影響不同頻率的聲音到達人耳的時間,這種時間關系在聲學中表達為相位關系。而這種相位關系在主觀聽覺中是一個至關重要的聲學指標,不同頻率在時間關系上的正向疊加和反向衰減會帶來頻率響應的不同變化,特別是在20-200Hz時,由于波長相對較長,這種疊加和衰減更加容易發(fā)生,會發(fā)生房間駐波和低音區(qū)無力或多只低音音箱聲能抵消等現(xiàn)象,因此我們希望高低音同時到達我們的耳朵是一個理想值,這種理想值靠調整單只音箱的延遲時間是事倍功半的。我們需要從相位的理念上去糾正來還原聲音的本形。
在聲場處理和控制領域,目前行業(yè)發(fā)展趨勢:
隨著軟硬件技術的螺旋迭代式發(fā)展,我們對于聲場這種瞬變、干涉極為復雜,看似難以把控的聲場能量有序分布,也有越來越多的調控手段。從初級的EQ模式到高級的自適應模式,也呈現(xiàn)出明顯的迭代進化特征:
首先是數(shù)字化和網(wǎng)絡化:隨著數(shù)字技術和網(wǎng)絡技術的不斷發(fā)展,聲場處理器和控制設備也越來越數(shù)字化和網(wǎng)絡化。數(shù)字信號處理技術的應用,使得聲場處理器可以更加精細地控制聲場構建的各種參數(shù),網(wǎng)絡技術的應用,使得多個聲場處理器可以實現(xiàn)聯(lián)網(wǎng)控制和協(xié)同工作,提高聲音處理的效率和精度。
其次是智能化和自適應性:智能化和自適應性是聲場處理器和控制設備的發(fā)展方向之一。智能化技術的應用,使得聲場處理器可以自動采集不同的聲音場景參數(shù),并根據(jù)場景特點自適應地調整聲場參數(shù),極大提高聲音處理的效率和質量。這一點在聲場處理成為各類應用場景所必需的一環(huán),大量需求爆發(fā)式增長當下,幾分鐘搞定一個聲場的調試,極具現(xiàn)實意義。
▊技術發(fā)展趨勢
——突破性的思維路徑,解決空間響應均衡難題
通過應用先進的數(shù)字信號處理技術來設計基于房間響應的一個或多個測量值的均衡器,從而改善房間中的聲音重現(xiàn)。在過去的40年中,各國的聲學研究者對這個主題進行了深入的研究,從而產(chǎn)生了許多有效的技術從各個方面來解決房間問題。
當一個或多個揚聲器再現(xiàn)聲音時,收聽環(huán)境會改變所需聽覺錯覺的感覺。在某種程度上,這可以看作是積極的,因為增加了空間和深度,但是環(huán)境和聲音再現(xiàn)系統(tǒng)也會引入不希望的“偽影”。聆聽環(huán)境中的過多反射或共振可能會導致聽覺錯覺的不良變化。非理想的再現(xiàn)系統(tǒng)甚至可能向原始聲音添加一些偽像(例如,頻段過多增益或衰減,非線性失真)。
我們的研發(fā)人員從理論上研究空間響應均衡方法,并在實踐中推出“APC-acoustic phase calibration” 的方法來改善聲音再現(xiàn)的質量,這與空間環(huán)境和再現(xiàn)系統(tǒng)的不利影響形成了鮮明對比。在該系統(tǒng)中,測試得到聲音再現(xiàn)系統(tǒng)到收聽者的路徑的空間傳遞函數(shù)(Room Tansfer Function), 利用以多種方式實現(xiàn)的適當設計的均衡器來均衡?;舅枷胧鞘褂名溈孙L測量空間脈沖響應(RIR),然后通過其反相獲得均衡器參數(shù)。在過去40年中聲學工程師們開發(fā)了各種各樣的技術。在不同的技術文章中使用了許多不同的名稱,例如“空間均衡”,“空間校正”,“房間補償”,“房間反轉”,“房間去混響”,“去混響”,“減少混響”等。本文中,我們應用“APC-acoustic phase calibration” 來解析RTF測量設計均衡器的大多數(shù)技術。
空間反向濾波器設計有多種替代方案的多維性。也可以考慮非參數(shù)方法(例如最小二乘法或頻率響應的直接反算)來進行FIR的反算,例如自回歸移動平均值(ARMA)建模的參數(shù)方法或低頻時間衰減控制方法。但方法的分類之外,我們也可以根據(jù)濾波器應用來分類,如APC分為最小相位或線性相位。前者僅針對RTF幅度的均衡,而后者除幅度處理外,也作用于相位RTF分量。
大多數(shù)著名的音頻廠商由于DSP技術實現(xiàn)的原因,仍然從物理聲學上對低音相位進行控制,對用戶在特定的房間中的校準,仍然采用關注頻域的方式,使用IIR濾波器(也就是我們經(jīng)常使用的參數(shù)均衡器)進行房間頻率補償,這會帶來兩種惡果,在補償頻率上造成更大的相位畸變,在由于房間造成的頻率提升(波峰)和衰減(波谷)進行反向操作,波峰的反向衰減對于特定位置非常敏感,移動位置則效果相差很大,而對波谷的提升會極大的傷害系統(tǒng)的動態(tài)范圍,造成很大的諧波失真。盡管這些逆濾波器系數(shù)是自動計算的,極大的保障了頻響曲線的平坦,但相位曲線卻更加惡化。
——并行運算,實時的感知并精密處理復雜音頻信號中的最細微波動
為此,我們建立了一套基于聲學空間測量結果的反饋相位修正系統(tǒng),對各頻率產(chǎn)生的不同相位畸變進行最小相位的修正,對于音箱從制造設計,空間中播放產(chǎn)生的諸多相位疊加或抵消進行數(shù)據(jù)分析,并根據(jù)數(shù)據(jù)分析,產(chǎn)生獨特的FIR濾波器系數(shù)對系統(tǒng)進行整體的修正。這套系統(tǒng)摒棄了基于串行計算的高速DSP,而采用并行式的FPGA處理系統(tǒng),我們的FIR濾波器實時的對各頻段進行超過2萬階的實時處理,而花費的時間只有DSP的百分之一。這樣我們保證了我們在處理中不會造成新的相位畸變。
自適應聲場處理器
自適應聲場處理器是一款高端的自適應聲場處理器,它采用了高速并行處理的全FPGA技術平臺和先進的算法,能夠自動調整聲場能量分布,使音樂表現(xiàn)更加層次分明、通透和真實。
它是新一代聲場校準處理工具,能夠通過極簡的操作,迅速校準聲場響應情況,減少空間環(huán)境對聲場的各種負面影響,使各類聲系統(tǒng)在苛刻的環(huán)境下均能發(fā)揮其最優(yōu)性能。
一經(jīng)問世便獲得業(yè)內高度關注和廣泛認可,其優(yōu)異性能離不開突破性的創(chuàng)新路徑和成果。
▊全球首創(chuàng)全FPGA架構空間聲場處理器
全球首臺全FPGA架構的全FIR濾波器聲學空間相位修正系統(tǒng)。通過測量話筒對空間進行單點或多點的聲學測量取樣后,針對音箱在空間中播放由于聲波反射而產(chǎn)生的各種相位疊加或抵消進行數(shù)據(jù)分析,并生成獨特的FIR濾波器系數(shù),然后對聲音相位進整體的修正。最大的特點是采用超大規(guī)模并行算法的高速FPGA處理平臺,對FIR濾波器對各頻率相位進行高達8196階的處理,而花費的時間僅在微秒級,從而保證了在數(shù)字運算處理中不會造成新的相位畸變。
▊每聲道4096階逐點精準全FIR修正
人們在聽音區(qū)域聽到聲音是“直達聲”和“反射聲”的集合, 但由于反射聲的不總是和直達聲同一時間到到你的耳朵,因此直達聲和各種反射聲之間就會由于時間差而造成聲相位干涉,同相的聲音會產(chǎn)生疊加,相位相反的聲音會產(chǎn)生抵消,這些疊加和抵消就會把原來平直的頻響特性扭曲。
通過特別的聲學算法,對話筒取樣回來的聲相位數(shù)據(jù)進行運算分析,并由每聲409點的最小相位FIR濾波器(Minmum phase FIR filters),對 20-20KHz頻段的相位和頻率特性進行精確的修正,從而確保聽音區(qū)域可以獲得正確平直的頻響和相位特性,提高直達聲的清晰度,將空間反射聲的干擾減到最低,為你擺脫不可控的房間聲學缺陷干擾,還你一個準確、真實、清晰有力的低頻,處理后的立體聲音場定位更加精準,舞臺空間感更加寬闊、深邃。
▊RealTime — 低至0.25毫秒
由于傳統(tǒng)DSP芯片串行算法架構對于高階數(shù)FIR相位修正處理有巨大的延遲, 多數(shù)基于DSP架構的音頻處理器仍然采用IIR+低階數(shù)FIR濾波器的處理方式,特別是對于100Hz以下低頻段的處理,相位畸變仍然十分巨大。摒棄DSP架構,采用基于并行算法的高速FPGA平臺,8千多個邏輯門同時執(zhí)行FIR處理,相當于512個DSP芯片同時工作,處理速度只有傳統(tǒng)DSP音頻處理器的百分之一,避免了在處理過程中由于高延遲而帶來新的時鐘失真和相位畸變。
其主要延遲來自AD/DA環(huán)節(jié),F(xiàn)PGA處理只有0.07ms,加上系統(tǒng)其它硬件延遲,總延遲只有0.25ms, 100Hz以下相位延遲不超過35°。
▊極簡操作
傳統(tǒng)的聲學空間問題的解決手段相當?shù)膹碗s,系統(tǒng)工程師需要運用不同的測量和處理工具來解決不同的問題,例如,房間中多個超重低音的擺放,通過多次測量,調整擺放位置,設置不同的延時時間,使重低音能夠同相播放,同時又要顧及重低音與全頻的時間關系,這樣復雜的設置,往往顧此失彼,無法得到相對正確的結果。同時房間和喇叭需要顧及的不只是低音,在中低音區(qū)發(fā)生的房間駐波,中音區(qū)的分頻相位失真,高頻在房間中的早期反射,使系統(tǒng)工程師身心疲憊,在花費大量的時間調試以后,只能把一個千瘡百孔的音響系統(tǒng)交給調音師,調音師只能根據(jù)有缺陷的系統(tǒng)在調音中反復解決系統(tǒng)中出現(xiàn)的問題,根本沒有時間進行音樂的平衡。
當其通過網(wǎng)線接入路由器后,筆記本電腦即可通過無線局域網(wǎng)與其進行無線控制,軟件無需復雜的安裝程序,直接點擊開啟,簡潔的單頁操作界面,用戶只需擺放好測量話筒,在軟件界面上點擊幾個簡單的步驟即可完成測量操作和優(yōu)化處理,沒有復雜的設置過程,也無需額外的專業(yè)測量設備輔助和接受專業(yè)知識的培訓,普通用家也可以熟練掌握,讓專業(yè)的聲學校準變得更加簡單和智能。
其獨特算法只需要對房間中一個點或大型空間中的多個點進行話筒測量,每個測量點的時間只需要三秒鐘,對于空間中的噪聲有極大的容忍度,然后算法會花十秒鐘來發(fā)現(xiàn)系統(tǒng)中存在的相位問題,自動將問題的處理參數(shù)發(fā)送給FPGA,這系列過程中,無需人的干預,只需要支上話筒,按下測量鍵就可以了。調音師在10秒鐘后就能夠得到一個標準的聲學空間,在這個空間里,沒有多個重低音音箱的抵消造成的低音不足,也不會低頻共振,沒有煩人的反饋嘯叫。因為我們的智能算法已經(jīng)對聲場了如指掌,調音師甚至可以通過我們的頻響曲線設計來設計音樂頻響的整體風格。
▊Hi-END級的聲音表現(xiàn)
它是一臺精密的聲場校正的“儀器”,因此對它的性能要求是苛刻的。得益于我們長期研究Hi-END模擬音頻設備的豐富經(jīng)驗,在其數(shù)字處理技術上, 我們比傳統(tǒng)DSP處理方式更注重輸出輸入的延退特性,這個特性是以時間相位度數(shù)(phase degree)為準而非傳統(tǒng)的時間ms(毫秒), 我們通過采樣精度、采樣頻率、相位精度這三個維度的數(shù)字標準來再現(xiàn)真實的聲音本質,在算法和延退之間不做妥協(xié)。
D/A模擬輸出部分采用全平衡線路,輸出聲道均采用總諧波失真低至0.00003%以下的音頻專用頂級發(fā)燒運放,通過反復對比測試,選定對聲音產(chǎn)生關鍵影響的元器件,并量身定制了低噪音高精度,模擬、數(shù)字獨立的電源供應系統(tǒng),極致手段打造發(fā)燒級的聲音,絕不向任何影響音質的因素妥協(xié)。
九大優(yōu)勢:
快捷——測量操作極致簡便,分秒內解決最苛刻聲場難題
精確——高達4096 Tap逐點校正FIR
準確——一切基于高精度測量話筒與算法,避免主觀因素的偏差和干擾
實時——高性能FPGA并行運算帶來近乎零的延時
Hi END——極致聲音表現(xiàn),近似模擬的音質
世界領先的脈沖校正技術,提升音箱的聚能特性
不犧牲音箱的相位響應,實現(xiàn)精確靈活的音箱頻響曲線設計
全球獨步的高階FIR濾波器在零延時的狀況下提升低頻性能,使低音更緊致
大幅提升系統(tǒng)的直達反射聲比率,實現(xiàn)現(xiàn)場混響聲的精確控制
自適應聲場處理器的誕生和應用,將使原有的音頻系統(tǒng)可獲得最佳的聲場效果,發(fā)揮國際上行業(yè)內其他音響處理器所無法替代的聲場處理能力,是一個名副其實的人工智能調音師。為保證音頻系統(tǒng)工程的優(yōu)質和聲場控制能穩(wěn)定發(fā)揮著一個調音師的現(xiàn)場守護與自動運維功能,該產(chǎn)品應用到現(xiàn)有的巨大存量音頻工程系統(tǒng)改造,必將有效的改變原有系統(tǒng)的音響效果,提高觀眾的優(yōu)良聽感,也由此給終端用戶帶來重新的、前所未有的最佳音響效果。因此,我們有理由相信,這個技術的發(fā)明與產(chǎn)品在工程設計的應用,將成為廣大音頻工作者的最佳伙伴和隨身工具,成為現(xiàn)在和將來所有音頻系統(tǒng)工程設計中的必有之選。
系統(tǒng)拓撲圖
各類場景完成調試時間 | |||
場景 | 時間 | 測試點位數(shù) | 音箱數(shù)量 |
主題公園 | 30分鐘 | 16 | 40-60 |
演出租賃 | 15分鐘 | 10-16 | 20-60 |
體育場館 | 30分鐘 | 16 | 40-60 |
大劇院 | 20分鐘 | 16 | 40-60 |
LIVE HOUSE | 15分鐘 | 10-14 | 20-40 |
會議室 | 15分鐘 | 5-8 | 6-30 |
多功能廳 | 10分鐘 | 8-10 | 10-20 |
電影院 | 10分鐘 | 10-14 | 20-40 |
電視臺演播廳 | 30分鐘 | 10-14 | 10-30 |
適用于主題公園、演出租賃、體育場館、大劇院、LIVE HOUSE、會議廳、多功能廳、電影院、電視臺演播室等場所使用。
主題公園 演出租賃 大劇院
會議廳 多功能廳 電視臺演播室
音王集團旗下品牌(CADAC、錄音大師、音王)自適應聲場處理器具備世界先進的脈沖校正技術和高階FIR濾波器,可以提升聲場能量分布均衡、低頻性能和直達反射聲比率,從而實現(xiàn)音頻信號處理的精確控制??旖?、精確、準確的測量和精準算法可以幫助用戶快速解決最苛刻的聲場難題,提高操作效率和準確度。它對于需要實現(xiàn)聲場精確調試,尤其是快速調試的各類PA應用場景,如流動演出、劇場劇院、錄音棚等是一個必備利器。它就像一個智能AI調音師,可以取代大部分調音師的基礎聲場調試工作,而讓調音師真正的沉浸于聲音的藝術創(chuàng)作過程,因此市場潛力巨大。
評論comment