思必馳超遠場定向拾音,拾音屆的“順風(fēng)耳”是如何練成的?
來源:思必馳 編輯:VI菲 2022-07-29 09:18:51 加入收藏
熱播劇《警察榮譽》映照出基層工作者的日常,網(wǎng)友評“非常真實“。新人警員入職第一天便自告奮勇“看500小時監(jiān)控找尿不濕”,心酸又好笑。“給老舊小區(qū)裝監(jiān)控”也成為全劇的高出鏡率的建議。想象下,如果監(jiān)控內(nèi)容是有聲呈現(xiàn)的,能否打破困局,更高效地為基層減負呢?
擁有“視+聽”功能雙結(jié)合的智慧安防設(shè)備為人們的生活帶來滿滿安全感。從傳統(tǒng)安防到智慧城市安防系統(tǒng)建設(shè),從傳統(tǒng)的“啞劇”到如今音視頻一體化監(jiān)控,AI可塑造的軟硬一體化能力,讓安防系統(tǒng)完成了“智變”。
音頻系統(tǒng)也成為智慧安防建設(shè)里的重要一環(huán)。常見的拾音設(shè)備大多是針對中近場的聲音拾取,靈敏度較低,聲音只有在一定距離內(nèi)才能被有效拾取。為解決復(fù)雜聲學(xué)場景下的遠場拾音,思必馳推出超遠場定向拾音技術(shù),實現(xiàn)10m外的聲音拾取。 為智慧安防、智慧政務(wù)、大型會議等需要遠距離拾音的場景設(shè)備提供能力服務(wù)。
“視+聽”雙保險 事事都明了
在民用領(lǐng)域,安防攝像機可以極大地記錄所在空間的人物、事物、環(huán)境的變化,加裝音頻監(jiān)控后將填補天氣、遮擋物、環(huán)境等影響下的監(jiān)控結(jié)果,通過對聲音信號的分析,聯(lián)動視頻畫面進行信息抓取,提高監(jiān)控系統(tǒng)的智能化程度。
隨著高靈敏度、指向性的拾音器出現(xiàn),拾取聲音的能力也將更全面、精準。感受下思必馳“順風(fēng)耳”的功力。
現(xiàn)實場景中,聲音會隨著傳播距離的增加,聲強下降,當聲音傳播到10m以外,音量會衰減到40分貝左右,聽到的效果類似“竊竊私語“。而且此時的音頻信息會被環(huán)境中的本底噪聲和干擾聲淹沒,同時存在的麥克風(fēng)硬件底噪聲也會對音頻拾取產(chǎn)生影響。
思必馳是如何做到強魯棒降噪的同時,清晰保留人聲呢?
芯片+指向麥克風(fēng)陣列 實現(xiàn)清晰拾音
超遠場定向拾音技術(shù)采用思必馳自研AI芯片TH1520進行降噪處理,結(jié)合指向麥克風(fēng)陣列進行波束設(shè)計,配合動態(tài)增益算法,實現(xiàn)空間目標音頻的增強,有效去除環(huán)境噪聲,降低硬件底噪對拾音效果的影響,明顯改善目標方向的音頻質(zhì)量,完成遠距離清晰拾音。
結(jié)合指向麥克風(fēng)的指向特性以及麥克風(fēng)拓撲結(jié)構(gòu)進行目標方向波束設(shè)計 ,可以有效抑制非目標方向的干擾聲音以及反射聲,干擾抑制為25db以上;
穩(wěn)態(tài)噪聲抑制算法, 可以有效去除環(huán)境本底噪聲,其噪聲抑制深度15db以上;
動態(tài)增益算法 ,實現(xiàn)了聲音的自適應(yīng)增益,將聲音幅度規(guī)范到理想?yún)^(qū)間。
以采訪/會議現(xiàn)場為例,遠場拾音設(shè)備運用指向性麥克風(fēng)陣列,通過芯片算法進行降噪后,后排記者也能清晰收錄演講實況。目前,超遠場定向拾音技術(shù),可以運用在遠景拍攝、遠場錄音記錄、安防領(lǐng)域視聽融合等方面,清晰獲取目標群體的聲音。
基于多年語音交互技術(shù)及市場應(yīng)用的積累,思必馳繼推出專注于家居場景下的遠場語音識別、直面喚醒等技術(shù)之后,持續(xù)挖掘聲音在“距離“和”方向感“的魅力,讓超遠場定向拾音技術(shù)契合更多的實用場景。
未來,伴隨著網(wǎng)絡(luò)直播、vlog視頻經(jīng)濟的興起,戶外遠景拍攝亦需要高保真、高清晰度的音頻內(nèi)容加持,配合電影般的質(zhì)感畫面,碰撞出更多精品。擁有超遠場識別能力的拾音技術(shù)將擁有更大的發(fā)展空間。
評論comment