近日,聯(lián)合圖像專家組JPEG公布了JPEG AI標(biāo)準(zhǔn)平臺提案結(jié)果,火山引擎多媒體實驗室憑借軟件平臺BEE的優(yōu)異表現(xiàn),獲得主觀質(zhì)量性能評比最佳成績。
JPEG是國際標(biāo)準(zhǔn)化組織、國際電工委員會和國際電信聯(lián)盟的工作小組。信息“爆炸”時代,圖像壓縮對于互聯(lián)網(wǎng)數(shù)據(jù)的傳輸和存儲至關(guān)重要。得益于深度學(xué)習(xí)在圖像壓縮技術(shù)上的飛速進(jìn)展,JPEG AI小組發(fā)布了JPEG AI標(biāo)準(zhǔn)平臺提案的征集,希望構(gòu)建全新的智能圖像編碼系統(tǒng),在提升圖片質(zhì)量的同時,也能提高壓縮性能。
來自世界各地的高校、科研院所、企業(yè)等數(shù)十家單位,提交了各自的軟件平臺方案。在相同文件大小的前提下,圖像壓縮最重要的評價指標(biāo)是人類的主觀視覺感受。此次主觀質(zhì)量性能評比中,火山引擎軟件平臺BEE優(yōu)于其他參賽軟件平臺,名列該項評比的榜首。
據(jù)悉,自動駕駛、媒體分發(fā)等場景對圖像壓縮技術(shù)有較高的要求,需要在有限帶寬的條件下傳輸更多高質(zhì)量圖片。智能圖像編碼是人工智能技術(shù)在圖像壓縮上的跨領(lǐng)域應(yīng)用,在工業(yè)應(yīng)用中具有巨大潛力,是圖像壓縮的重要發(fā)展方向。
火山引擎多媒體實驗室負(fù)責(zé)人表示,BEE軟件平臺提出了多個創(chuàng)新算法,解決了智能圖像編碼軟硬件實現(xiàn)中的一系列難題,獨(dú)創(chuàng)的“解耦式熵編碼”技術(shù)更是化解了長期困擾端到端壓縮的數(shù)據(jù)依賴,使得編解碼速度有了根本性提升。
據(jù)介紹,業(yè)界在智能圖像編碼過程中,熵編碼與像素重建過程是高度耦合的,“這就好像一個力工和一個瓦工配合造房,力工每次給瓦工一塊磚,等瓦工抹好水泥砌上并給出收條后,他才會去搬下一塊。這在流程上形成了‘耦合’與‘依賴’,會影響造房效率。”
火山引擎“解耦式熵編碼”技術(shù)打破了這種制約,“力工不用再等瓦工抹水泥,只需要不停地搬磚放到指定位置就可以,甚至可以叫來更多力工一起搬。而瓦工也不用關(guān)注力工,只要指定位置有磚,他就可以不停地砌墻,從而大幅提高生產(chǎn)效率”。

圖1:JPEG官方主觀測試結(jié)果圖,TEAM16、24為火山引擎的方案

圖2:JPEG主觀測試DMOS表,TEAM16、24為火山引擎的方案
測試結(jié)果表明,BEE平臺的解碼速度要比其他參賽軟件平臺高1-3個數(shù)量級,其速度已經(jīng)超過最新的標(biāo)準(zhǔn)H.266/VVC。在圖形處理器GPU加持下,BEE平臺解碼時間僅為H.266/VVC官方參考軟件的一半。
火山引擎多媒體實驗室是字節(jié)跳動旗下的研究團(tuán)隊,致力于探索多媒體領(lǐng)域的前沿技術(shù),參與國際、國內(nèi)的標(biāo)準(zhǔn)化工作,其眾多創(chuàng)新算法已經(jīng)廣泛應(yīng)用在抖音、西瓜視頻等產(chǎn)品的多媒體業(yè)務(wù),并向火山引擎的企業(yè)級客戶提供技術(shù)服務(wù)。