近日,中國科學院合肥物質院智能所智慧農業研究中心王儒敬研究員團隊提出了一種基于多尺度空間特征的水下圖像增強方法。相關研究成果以“A Multi-scale feature modulation network for efficient underwater image enhancement”為題發表在計算機科學領域期刊Journal of King Saud University - Computer and Information Sciences上。
高質量圖像對于水下漁業監測、環境和物種保護等領域具有重要意義。然而,現有絕大多數基于深度學習的水下圖像增強網絡與內存和計算能力低的水下設備平臺相沖突。為了解決這個問題,團隊提出一個簡單而有效的多尺度特征調制網絡(MFMN),以實現更好地在模型的效率和重構性能之間的權衡。具體來說,科研團隊在一個類似于視覺變壓器(VIT)的模塊上開發了一個多尺度調制模塊,在該模塊中使用多尺度空間特征模塊提取輸入圖像的特征,動態選擇圖像特征空間中的代表性特征;此外,由于多尺度空間特征模塊從圖像的空間角度來處理圖像特征缺乏通道特征信息,團隊進一步引入了通道混合模塊來執行通道混合。實驗結果表明,該方法在網絡參數方面比目前最先進的水下圖像增強方法要小8.5倍,實現了基本相同性能下的較低計算成本。
鄭世健博士生為論文第一作者,汪六三副研究員為論文通訊作者。該項研究工作得到了國家自然科學基金、國家重點研發計劃的支持。
論文鏈接:https://www.sciencedirect.com/science/article/pii/S1319157823004421

圖1 MFMN網絡結構