華平音頻信息網(wǎng)絡(luò)數(shù)字化實(shí)時(shí)傳輸技術(shù)
來(lái)源:數(shù)字音視工程網(wǎng) 編輯:數(shù)字音視工程 2013-01-29 14:30:46 加入收藏
技術(shù)背景
隨著視音頻編解碼技術(shù)的提高,各種基于互聯(lián)網(wǎng)絡(luò)的遠(yuǎn)程音視頻交互迅速普及,音頻采集、編解碼、傳輸?shù)燃夹g(shù)得到較快的發(fā)展和進(jìn)步,各種音頻編解碼標(biāo)準(zhǔn)和網(wǎng)絡(luò)傳輸糾錯(cuò)技術(shù)也都有成熟的應(yīng)用。但是,在現(xiàn)有技術(shù)中,網(wǎng)絡(luò)帶寬依然是大多數(shù)網(wǎng)絡(luò)流媒體交互應(yīng)用的瓶頸。因?yàn)樵谠S多應(yīng)用場(chǎng)合中,網(wǎng)絡(luò)帶寬的實(shí)時(shí)穩(wěn)定性根本無(wú)法得到保證。由于網(wǎng)絡(luò)帶寬不足或者帶寬不穩(wěn)定,經(jīng)過(guò)編解碼壓縮后的音頻信息可能無(wú)法完整的傳輸給接收方,或造成通信中斷,更有甚者,常會(huì)因?yàn)橐纛l傳遞質(zhì)量差而導(dǎo)致信息的接收方誤判傳遞信息,從而造成更大損失。
基于上述問(wèn)題,業(yè)界目前的做法是借助其他的手段,例如郵件傳遞、拷貝等,將音頻信息發(fā)送給接收方,這樣不但降低了工作效率,而且大大增加了信息交互的時(shí)間成本。鑒于以上所述現(xiàn)有技術(shù)的缺點(diǎn),華平創(chuàng)造性的推出了一種音頻信息網(wǎng)絡(luò)數(shù)字化實(shí)時(shí)傳輸技術(shù),以解決現(xiàn)有技術(shù)中存在的因網(wǎng)絡(luò)帶寬不足、不穩(wěn)定,丟包率比較高,致使接收方無(wú)法完整接收到音頻信息的問(wèn)題。
技術(shù)介紹
音頻信息網(wǎng)絡(luò)數(shù)字化實(shí)時(shí)傳輸技術(shù),應(yīng)用于具有至少一個(gè)音頻信息發(fā)送端及一個(gè)音頻信息接收端的網(wǎng)絡(luò)架構(gòu)中。該技術(shù)系統(tǒng)包括以下十個(gè)模塊:1、音頻信息輸入模塊,用于采集音頻信息;2、信息源緩存模塊,用于緩存接收到的音頻信息源;3、編碼模塊,用于將音頻信息源編碼為音頻包;4、網(wǎng)絡(luò)傳輸模塊,用于將音頻包通過(guò)網(wǎng)絡(luò)傳輸至音頻信息接收端,還用以將音頻識(shí)別模塊輸出的文字信息傳送至文字顯示模塊;5、檢測(cè)模塊,用于實(shí)時(shí)檢測(cè)網(wǎng)絡(luò)傳輸模塊,將音頻包傳輸給音頻信息接收端時(shí)的丟包率,當(dāng)檢測(cè)到丟包率大于丟包率閥值時(shí),發(fā)出音頻識(shí)別指令;6、音頻識(shí)別模塊,用于接收音頻識(shí)別指令,并將提取的音頻信息源識(shí)別為文字信息;7、文字轉(zhuǎn)音頻識(shí)別模塊,用于接收文字信息,并將該文字信息識(shí)別為音頻信息;8、音頻信息輸出模塊,用于輸出接收到的音頻信息;9、解碼模塊,用于將音頻包進(jìn)行解碼為音頻信息;10、文字顯示模塊,用于將文字信息轉(zhuǎn)換為文字字幕予以顯示。
音頻信息網(wǎng)絡(luò)數(shù)字化實(shí)時(shí)傳輸過(guò)程圖
音頻信息傳輸過(guò)程:首先在音頻信息發(fā)送端設(shè)置一個(gè)丟包率閥值,使用音頻信息輸入模塊采集音頻信息,將采集的音頻信息作為信息源緩存到信息源緩存模塊,同時(shí)使用編碼模塊將信息源編碼為音頻包,通過(guò)網(wǎng)絡(luò)傳輸模塊傳輸至音頻信息接收端,在傳輸過(guò)程中由檢測(cè)模塊實(shí)時(shí)檢測(cè)傳輸時(shí)的丟包率,當(dāng)丟包率大于預(yù)設(shè)的丟包率閥值時(shí),發(fā)出音頻識(shí)別指令,音頻識(shí)別模塊根據(jù)接收到的音頻識(shí)別指令提取緩存的音頻信息源,并將音頻信息源識(shí)別為文字信息經(jīng)由網(wǎng)絡(luò)傳輸至音頻信息接收端,音頻信息接收端再將該文字信息識(shí)別為音頻信息輸出(也可根據(jù)客戶(hù)需求,將音頻信息接收端接收到的文字信息直接轉(zhuǎn)換為文字字幕顯示);若實(shí)時(shí)檢測(cè)的丟包率不大于預(yù)設(shè)的丟包率閥值,音頻信息接收端會(huì)將接收到的音頻包直接解碼為音頻信息輸出。
技術(shù)特點(diǎn)
1、可保證音頻信息的完整傳輸:本技術(shù)主要是將音頻信息在發(fā)送端通過(guò)預(yù)設(shè)丟包率閥值來(lái)判斷網(wǎng)絡(luò)帶寬是否穩(wěn)定,能否滿足音頻傳輸需求,并根據(jù)實(shí)際情況設(shè)置音頻傳輸方式,保證在各種網(wǎng)絡(luò)情況下的音頻信息完整傳輸。
2、靈活的輸出方式:在某些特殊應(yīng)用中,例如不便接收聲音的場(chǎng)合,或者接收信息的場(chǎng)合聲音過(guò)于嘈雜,可直接將語(yǔ)音轉(zhuǎn)成文字輸出。
技術(shù)應(yīng)用
;'
低帶寬、高丟包率的成功應(yīng)用
本技術(shù)被廣泛應(yīng)用于遠(yuǎn)程視頻會(huì)議、遠(yuǎn)程監(jiān)控指揮、視頻教學(xué)等應(yīng)用場(chǎng)景中。解決了現(xiàn)有技術(shù)中存在的因網(wǎng)絡(luò)帶寬不足或不穩(wěn)定,丟包率高等原因,造成對(duì)方無(wú)法完整接收到音頻信息的問(wèn)題,保證了音頻信息在各種復(fù)雜網(wǎng)絡(luò)情況下的完整傳輸。
評(píng)論comment