A secured distributed detection system based on IPFS and blockchain
for industrial image and video data security
基於IPFS和區塊鏈的工業圖像視頻數據安全分佈式安全檢測系統
解決什麼問題
侵犯版權會對上傳到不同網站和點對點圖像共享系統的圖像和視頻的版權持有人的利益產生不利影響。 本文解決了檢測版權侵權的問題,以便版權持有人因其工作而獲得應有的榮譽(credit)。
與我們的工作類似,[2,17] 中使用基於 IPFS 的分佈式結構與對等方共享文件。 存儲在 IPFS 平台上的圖像是內容尋址(使用 IPFS 哈希)而不是位置尋址。 此外,區塊鏈技術已被用於確保每個對等方的內容可用性。 區塊鏈結構僅用於存儲帶有哈希值的圖像。 然而,修改和復制的圖像沒有在 IPFS 和區塊鏈結構上進行驗證,以檢測版權侵權,這是我們研究的核心。
用什麼方式解決
我們使用感知散列 (pHash) 技術來檢測多媒體的版權侵犯。
引用
術語侵犯版權被定義為:“對圖像或視頻進行微小更改並獲得作品的讚譽,而無需成為相同作品的原作者”[28]。
今天,侵犯版權不僅包括文本文檔領域,還包括多媒體內容的不同方面,如圖像、視頻和音頻 [40]
各種網站和信息共享門戶上的數據共享呈指數增長 [22,32]。
然而,這種以多種格式出現的數據,如文本、音頻、視頻和圖像,在互聯網這樣龐大的網絡上往往不受保護,容易被盜和修改 [20]。
但是,某些機構可能會使用數據副本來獲取經濟利益或用於其他目的 [46]。
根據全球以某種形式或其他形式存在的數位取證版權保護法,未經所有者許可使用數據副本屬於刑事犯罪。 因此,研究人員正在開發解決這個問題的方法。 不幸的是,幾乎沒有取得成功[43]。
然而,這些技術的特點是雪崩效應,這意味著原始圖像或視頻的最小變化會導致結果哈希的劇烈變化[37]。
圖像和視頻關鍵幀的散列的精確匹配被執行以檢測侵犯版權[4]
感知散列函數具有原始輸入的散列與稍微修改的輸入的散列相關的屬性[29]。
IPFS 是一種點對點分佈式文件共享系統,主要由於其分佈式哈希表 (DHT) 技術而越來越受歡迎 [8,12]。
區塊鏈由各種塊組成,每個塊包含各種交易 [6,7,10,39,42]。
[43] 中的工作提出了一種基於感知哈希的方法,使用離散餘弦變換 (DCT) 技術來提取圖像的特徵。 在該方法中,基於最小化漢明距離並同時匹配目標對象幀的感知哈希來找到最近幀相似度。
一些研究人員使用基於區塊鏈的分散技術,這些技術採用 IPFS 來存儲圖像的水印細節 [2,5]。
在另一項工作[41]中,離散傅立葉變換(DFT)用於生成感知哈希以確保圖像屬性的正確性。 生成的散列大小為 144 位,大於實際感知散列的大小(64 位)。
與我們的工作類似,[2,17] 中使用基於 IPFS 的分佈式結構與對等方共享文件。
差分哈希(dHash):作者在[13,17]中描述了差分哈希技術,用於利用像素值的差異數量及其梯度獲得感知哈希。
[44]中的作者討論了用於獲取感知散列的感知散列(pHash)技術。
[31]中的工作描述了wHash與pHash幾乎相似,唯一的區別是wHash使用離散小波變換(DWT)來找到方程中提到的係數。
內容尋址散列的計算是根據我們的工作 [24] 中實現的算法進行評估的。
提出問題、困難
[40] 中的工作通過結合兩種不同的方法,即基於圖像塊和基於關鍵點的特徵來計算感知哈希。 他們採用 Watson 的模型來提取視覺特徵。 該模型在感知圖像內容方面起著重要作用。 底層方法可以準確檢測局部回火區域; 這種模型的缺點是哈希長度飆升到數万。
基於圖像的形狀和 Hu 不變矩在 [46] 中提出了感知圖像哈希。 但是,使用 Hu 不變矩不適用於平移、縮放和旋轉等操作的變換匹配。
[4] 中的作者提出了基於 DCT 係數的方法。 在該方法中,將RGB圖像轉換為灰度,然後將灰度圖像劃分為4×4、8×8等塊。最後,計算每個塊的二維繫數,並通過歐幾里德距離識別重複塊。 由於丟棄了像素值的高頻,這種方法效率不高。
[33] 中的作者開發了一種對雙交叉模式(DCP)進行編碼以提取紋理特徵的方法。 為了減少紋理特徵和圖像哈希顯著結構特徵的計算。 生成的散列是安全的,但在調和圖像的分類中並不理想。
在 [18] 中,作者使用了光響應非均勻性 (PRNU) 方法,該方法考慮圖像的色調修改來檢測偽造。 但在實際場景中,我們更專注於檢測回火區域,也稱為回火定位。
然而,傳統的密碼技術受到雪崩效應的影響,因此不能有效地用於圖像的感知特徵提取。 區塊鏈結構用於存儲圖像數據及其哈希值。 但是,修改和復制的圖像沒有在 IPFS 和區塊鏈結構上驗證。
[9] 中通過利用最低有效位 (LSB) 技術提出了圖像的內容認證。 不幸的是,這種方法只適用於灰度圖像。 當噪聲添加到圖像時,LSB 技術無法準確識別圖像。
與我們的工作類似,[2,17] 中使用基於 IPFS 的分佈式結構與對等方共享文件。 存儲在 IPFS 平台上的圖像是內容尋址(使用 IPFS 哈希)而不是位置尋址。 此外,區塊鏈技術已被用於確保每個對等方的內容可用性。 區塊鏈結構僅用於存儲帶有哈希值的圖像。 然而,修改和復制的圖像沒有在 IPFS 和區塊鏈結構上進行驗證,以檢測版權侵權,這是我們研究的核心。
[16] 中的工作提出了基於直方圖的感知哈希(指紋)來識別圖像的相似性。 作者還考慮了相同的視頻幀檢測算法(與目標幀最相似的幀)。 但是這種方法會根據視頻的長度生成可變長度的哈希值。
在[26]中,構造高維空間以獲得摘要空間以提取關鍵幀。 關鍵幀可以有效地計算單個幀的代表性。雖然選擇的關鍵幀方法可以代表或匹配原始視頻的內容,但可能會失去視頻序列的動態效果
[45]中的工作提出了一種黃金分割方法來尋找候選框。 在這種方法中,幀的熵被設置為局部最大值。 使用感知散列技術計算幀的散列。 漢明距離用於匹配幀的哈希值。 作者使用邊緣匹配(亮度)技術來消除視頻的冗餘幀。 然而,邊緣匹配技術對幀的亮度很敏感。
在 [3,25,48,49] 中,尺度不變特徵變換 (SIFT) 技術用於識別圖像中的類似特徵。
但是,當發生多個背景特徵更改時,此技術無法匹配圖像。 此外,該方法在模糊操作的情況下無法識別圖像中的區分像素。 尺度不變特徵變換只檢測圖像的區域(部分重複圖像檢測)。
版權技術中的這種集中存儲機制增加了多媒體對象版權領域的安全和隱私威脅的機會。
數字版權管理方面的一些現有工作被呈現為使用區塊鏈技術的分散存儲層。 然而,作者並沒有討論圖像和視頻等多媒體對象的實際數據存儲的鏈下存儲層。
由於集中存儲層,大多數現有作品不可擴展。
本文描述性的
他們中的一些人使用免版稅的商業股票模式,其中競爭很激烈。 他們面臨的主要挑戰是侵犯版權。
侵犯版權是數位取證中的一個重要問題。
由於使用表現出雪崩效應的傳統散列技術, 因此,這種方法不能有效地檢測多媒體內容中的微小變化。在這種情況下,對圖像的輕微篡改將逃脫版權侵犯檢測。因此,這個問題的一個巧妙解決方案是感知哈希函數。
因此,感知散列對於識別已被篡改且不會顯著改變圖像或視頻幀的外觀的圖像和視頻幀是有用的。
除此之外,IPFS 還為每個圖像或視頻採用了 46 字節的唯一哈希,這有助於在訪問和存儲過程中減少原始圖像。
此外,每當作者修改原始圖像和視頻幀時,IPFS 哈希都會在分佈式哈希表中進行修改。
區塊鏈技術提供了交易的不變性、完整性、可靠性和可用性等特性。
存儲在 IPFS 平台上的圖像是內容尋址(使用 IPFS 哈希)而不是位置尋址。
此外,區塊鏈技術已被用於確保每個對等方的內容可用性。
利用區塊鍊和 IPFS 技術解決了多媒體對象版權侵權的現有限制。
我們的模型促進了存儲實際多媒體數據的安全分佈式存儲層,並執行包括感知哈希匹配的內容尋址哈希以檢測圖像或視頻幀中所做的更改,這些信息被共享到區塊鍊網絡以供進一步訪問。
鏈下實際數據(IPFS)的去中心化存儲使整個網絡可擴展,並提供對可尋址散列的安全訪問。
版權侵權檢測是一項重大挑戰,尤其是在多媒體對象的背景下。