近日,由中國電信云計(jì)算研究院常建慧博士撰寫的論文《Generative Image Coding with Diffusion Prior》已被多媒體技術(shù)領(lǐng)域的頂級國際學(xué)術(shù)會議——IEEE International Conference on Multimedia & Expo(IEEE ICME 2025)接收,并將于近期正式發(fā)表。該研究提出的基于擴(kuò)散先驗(yàn)的生成式圖像編碼框架,為解決當(dāng)下復(fù)雜視覺內(nèi)容編碼難題帶來了新突破。
隨著生成技術(shù)的蓬勃發(fā)展,視覺內(nèi)容的構(gòu)成日益復(fù)雜多樣,傳統(tǒng)編碼技術(shù)和現(xiàn)有智能編碼方法在高壓縮比下難以兼顧主觀重建質(zhì)量、視覺保真度和通用性。此項(xiàng)研究的核心在于借助預(yù)訓(xùn)練擴(kuò)散模型的強(qiáng)大先驗(yàn)知識,通過精心設(shè)計(jì)預(yù)優(yōu)化編碼器、輕量級適配器以及注意力融合模塊,將壓縮后的潛在表示與預(yù)訓(xùn)練模型內(nèi)部特征緊密結(jié)合,同時設(shè)計(jì)分布?xì)w一化方法顯著提升重建保真度。
該圖像編碼技術(shù)能夠大幅提升海量圖像視頻數(shù)據(jù)在云端的存儲和傳輸效率,減少存儲成本和傳輸帶寬需求。從網(wǎng)絡(luò)架構(gòu)角度看,該技術(shù)加速了圖像數(shù)據(jù)處理的云原生化進(jìn)程,有助于構(gòu)建更為高效、靈活的“云 + 網(wǎng)”融合能力體系。其在語義通信、智能融合終端以及無線衛(wèi)星通信、低空視覺通信等場景的應(yīng)用潛力,與智能泛在云“無處不在、按需服務(wù)”的理念高度契合,能夠?yàn)楦黝愓罂蛻籼峁┒ㄖ苹囊曈X通信服務(wù)。
作為中國電信的高層次學(xué)術(shù)研究機(jī)構(gòu),中國電信云計(jì)算研究院密切關(guān)注在智能泛在云環(huán)境下,數(shù)據(jù)的高效處理和傳輸問題,致力于通過技術(shù)創(chuàng)新推動算力網(wǎng)絡(luò)的深度融合,為多元行業(yè)場景提供更優(yōu)質(zhì)、高效的服務(wù)。
國際多媒體與展覽會議(IEEE International Conference on Multimedia & Expo,ICME)由IEEE于 2000 年創(chuàng)立,作為多媒體技術(shù)及應(yīng)用領(lǐng)域的頂尖國際學(xué)術(shù)會議,在全球范圍內(nèi)備受矚目。其會議議題深度覆蓋多媒體信號處理、計(jì)算機(jī)視覺、人機(jī)交互、增強(qiáng)現(xiàn)實(shí)與虛擬現(xiàn)實(shí),以及人工智能驅(qū)動的多媒體解決方案等多個前沿領(lǐng)域。ICME 是中國計(jì)算機(jī)學(xué)會 B 類推薦會議,擁有極為嚴(yán)格的審稿流程,被該會議收錄的論文會被 EI 數(shù)據(jù)庫檢索,在計(jì)算機(jī)多媒體技術(shù)領(lǐng)域具備較高的國際影響力,已成為國內(nèi)科研成果對外展示的關(guān)鍵窗口之一,為國內(nèi)科研人員在國際學(xué)術(shù)舞臺上發(fā)聲、提升中國在多媒體技術(shù)領(lǐng)域的國際話語權(quán)發(fā)揮著重要作用。