感知雜湊算法 5 總結
我們一共做了四種雜湊感知算法的測試。aHash 計算每個像素與平均值的高低,pHash 使用離散餘轉換,將圖像轉換為頻率域上的系數,然後計算每個系數與中位數的高低,wHash 則是使用小波轉換然後計算系數與中位數的高低。dHash 計算相鄰的像素是否比較亮。在閱讀Perceptual hashing for image authentication: A survey 這篇論文之後,對之前四篇文章做一個簡短的總結。
我們做的測試裡面,pHash 及 wHash 是屬於 Invariant feature transform based methods 基於不變特徵轉換的方法。轉換的主要目的是使所有提取的特徵取決於其在變換空間中的頻率係數的值。 目前,大多數功能僅針對一種或幾種類型的攻擊有效,無法全面適用所有的攻擊。aHash 及 dHash 屬於 Statistics features based methods 基於統計特徵的方法。統計特徵通常對噪聲、模糊和壓縮失真更穩健。
因此,之前提到兩個可能的錯誤。第一個錯誤,不同的感知雜湊方式對於不同的圖像操作,有不同的防禦(檢測)能力。實用上可改進的方法是先用速度較快的 dHash 做基本的過濾,如果相似度高於某個閥值,再用 wHash 進行比對。(dHash 可替換為 aHash , wHash 可替換為 pHash)
第二個錯誤,每種圖像操作有更具代表性的做法,而我使用的圖片集裡面的操作不具備代表性。在論文內提到數個圖片集,可替換做為更準確的測試。
總結的總結
測試了四個感知雜湊,對於圖像有更加深入的了解,以前未接觸感知雜湊,現在也進步到可以實作程式。期間再度重新溫習及補足相關的知識,如離散餘弦轉換DCT 、小波轉換 Wavelet Transform 等等。我認為感知雜湊的實用性非常高,在做過的四種方式就已經可以拿來實用,比如拿來做圖片的管理,找出重覆的圖片。或是提供圖片的特徵碼,結合區塊鏈的話可以做為版權證明使用。
參考
Perceptual hashing for image authentication: A survey , https://doi.org/10.1016/j.image.2019.115713