IVA音視頻識別技術解析
來源:數字音視工程網 編輯:merry2013 2016-03-07 07:04:37 加入收藏
隨著全球觸屏時代的到來,交流平臺的移動化、社交化、智能化已成為必然的發(fā)展方向。在這樣的趨勢下,視頻互動成為視頻行業(yè)制定戰(zhàn)略的最新重要考慮因素。下面重點介紹下在歐美近兩年最受關注的IVA技術。
IVA是In Video Action技術的縮寫,IVA目前與Google Voice的字幕自動化生成技術、百度Video In視頻無痕植入技術并稱改變視頻行業(yè)的三大革命性技術。
隨著觸屏時代的到來,交流平臺的移動化、社交化、智能化已成為必然的發(fā)展方向。在這樣的趨勢下,視頻互動成為視頻行業(yè)制定戰(zhàn)略的重要考慮因素。
IVA技術簡單來說是一種音視頻識別技術,加上一套互動工具所構成的互動體系。識別技術就像一個探頭,能夠尋找視頻中撥動心弦(或人為設定)的時刻,并用互動技術實現(xiàn)與觀眾的互動共鳴。值得一提的是,IVA技術可將直播視頻畫面中的人物、物體、品牌、紋理、場景甚至情緒等信息分揀出來,再通過各種互動工具與受眾進行雙向交流。
IVA的使命分三個層次,初級IVA、中級IVA、高級IVA。
其中,初級IVA是依據音視頻樣本庫標記視頻流中與樣本庫匹配的視頻片斷,比如從視頻流中識別廣告時段和廣告主、識別新聞聯(lián)播等節(jié)目的片頭、根據錄音識別用戶正在觀看的節(jié)目等。
中級IVA利用圖像處理技術、大數據技術和深度學習技術,識別視頻流中的場景、形狀、紋理和人物等。中級IVA可以從視頻流中識別大海、森林、鬧市等多達200多種場景,在場景連續(xù)出現(xiàn)超過30幀的情況下,識別率可以高達90%以上;形狀識別的典型案例是從視頻流中準確識別1000多種飲料瓶的品牌、容積;衣物、布料的質地和品牌識別屬于紋理識別的范疇;人物識別被廣泛應用在機場、車站等場所的嫌疑犯追逃和運動追蹤,也被電視臺用來進行視頻索引和標簽。
高級IVA是識別音視頻對受眾的感性**和情緒影響,比如識別一部電影中的淚點、笑點等,高級IVA才剛剛起步,還有很長的路要走。
目前,IVA已被應用在EPG(電子節(jié)目單)自動校準、視頻自動索引和標簽、電視“搖一搖”等領域。IVA更具廣闊前景的應用是互動營銷(又稱心性營銷)。2011年,國內就引進歐美技術開始了在這方面的嘗試和探索。人性付費模式是在IVA技術基礎上的另一種延伸,利用IVA技術加強視頻內容與受眾之間的情感聯(lián)系,讓觀眾在一定情緒的引導下掏腰包。以《中國好聲音》為例,當觀眾被天籟的聲音所陶醉,通過IVA技術可以彈出互動窗口,讓觀眾為歌手獻上鮮花以資鼓勵;亦或是在破音時,用雞蛋表達無奈;甚至可以在選手表演時,直接通過手機參與到導師轉椅子的過程中。將傳統(tǒng)的被動收視改變?yōu)橛^眾與觀眾之間、觀眾與節(jié)目之間全方位的互動,極大地激發(fā)出觀眾的存在感、溝通欲、控制欲等人性需求。當然,在播放廣告的過程中,在某個消費**點時利用IVA技術,可以出現(xiàn)互動按鈕,為感興趣的用戶直接提供營銷通道,將廣告、銷售合二為一。
評論comment