NBJL 2020论文导读5:Perceptual Image Hashing Based on Weber Local Binary Pattern and Color Angle Representation

凤佳琦


  • 论文下载地址:https://www.researchgate.net/publication/332065795

  • 论文信息:March2019IEEE Access

  • 作者信息:CHUAN QIN  YECEN HU, HENG YAO, (Member, IEEE), XINTAO DUAN, AND LIPING GAO——School of Optical-Electrical and Computer Engineering, University of Shanghai for Science and Technology, Shanghai 200093, China. Shanghai Key Laboratory of Data Science, Fudan University, Shanghai 200433, China.


一  论文摘要

    1. 背景:数字图像作为人类视觉的载体,本身具有海量数据,冗余度高,内容保密性低的特点,在处理中要求较大的存储开销和算力;同时,数字图像易于编辑,对某些失真不敏感,导致图像容易被篡改和替换,带来版权认证等信息安全问题。研究人员主要关注于如何处理图像并同时满足其高效的存储、快速的检索以及对图像信息的保护。哈希技术作为一种重要的图像处理技术,在图像认证、图像检索等领域应用广泛。一般来说,图像哈希是对图像内容的压缩表示,它将高维图像信息压缩成一小段定长的哈希值,替代了图像数据本身的高冗余。哈希值应该直接反映图像的内容,一般情况下,相似的图像应该拥有相似的哈希值,即为鲁棒性,不同图像的哈希值要有一定的差异,即有区分性。同时图像哈希算法应该有引入密钥对哈希值加密来保证算法的安全性。


    1. 这篇文章的动机和贡献:现有的很多方法都是针对灰度图像设计的,但是颜色信息所传达的内容也是非常重要的,图像的纹理特征和颜色特征都应该要考虑到。其次,文章将哈希算法分成了两类:一类是关注于特征提取的哈希,另一类是基于数据降维的哈希算法。这篇文章将特征提取和数据降维进行结合,提出了一种新的哈希算法。可以看到,哈希算法从图像纹理和颜色两个方面分别计算,经过一系列变换,再分别得到对应的输出再连接成最终的输出。




二、论文内容

论文算法的主要步骤如上图所示,下面介绍具体步骤:

  1. 首先是预处理部分,大部分的图像哈希算法都会有这样的操作。主要包括了图像插值变换来调整图像大小,再一个是高斯滤波处理来平滑图像噪声部分。高斯函数的公式图像如下:

  1. 然后是纹理的特征提取:

    (1)首先是将图像进行DWT变换。DWT变换实际上就是离散小波变换,是一种将信号进行小波分解的处理手段,一维小波变换公式如下:

看着比较抽象,实际上它的意义是一种信号过滤器,将信号分解为高频率和低 频率不同的几个子频带。图像的二维离散小波分解过程如下图所示:

首先对图像的每一行进行 1D-DWT,获得原始图像在水平方向上的低频分量 L 和高频分量 H,然后对变换所得数据的每一列进行 1D-DWT,获得原始图像在水平和垂直方向上的低频分量 LL、水平方向上的低频和垂直方向上的高频 LH、水平方向上的高频和垂直方向上的低频 HL 以及水平和垂直方向上的的高频分量 HH。后面依然可以继续分解过滤,本文中经过DWT变换提取LL1部分即为图像水平和垂直的低频分量,基于此,得到了图像强度(亮度/灰度)变换平缓的地方,这是图像的主要信息。

      (2) LBP是图像的局部二值模式原始的LBP算子定义为在33的窗口内,以窗口中心像素为阈值,将相邻的8个像素的灰度值与其进行比较,若周围像素值大于等于中心像素值,则该像素点的位置被标记为1,否则为0。具体如下图。

这样利用上式,33邻域内的8个点经比较可产生8位二进制数,即得到该窗口中心像素点的LBP值,并用这个值来反映该区域的纹理信息。传统的LBP描述符没有考虑相邻像素和中心像素之间的差异,因此甚至可能为视觉上不同的内容生成相同的二进制代码。此外,由于它对噪声很敏感,对中心或邻域像素的小变化将导致一个截然不同的LBP值。基于此,文章应用了WLBP,即结合韦伯定律的局部二值模式。韦伯定律指的是刺激的增量(I)和原来刺激值(IBG)的比是一个常数(K)意思就是周围像素的大小和中心像素的增量和中心像素之间的比达到一定程度才能引起人的刺激。这边给出了一个例子。

最后计算的到WLBP矩阵W,再利用Histogram统计直方图信息得到U


   3 下来是颜色特征的提取:

   (1)文中提出的颜色角的概念也很简单,就是像素再RGB中通道中的RB通道的投影的正切角,得到正切角矩阵,如下图所示。

    (2)再运用DCT变换,即为离散余弦便函。来对矩阵进行有损数据压缩。离散余弦变换的公式如下,可以看出它将信号分解成不同余弦变换的组合。

这里给出一个例子来理解DCT,矩阵A进行DCT变换得到矩阵B,可以看出大多数的信号的能量都集中在离散余弦变换后的矩阵左上角部分。其他地方的数值都接近0。基于此,算法再进行Zigzag扫描得到前N1个有效数据,再利用下面这个公式将其二值化,其中μ为矩阵B的均值,最后取八位进行十进制化得到提取的颜色特征V’


     4 接下来对UV’进行主成分分析来达到数据降维的效果。主成分分析方法,是一种使用最广泛的数据降维算法。PCA的主要思想是将n维特征映射到k维上,这k维是全新的正交特征也被称为主成分,是在原有n维特征的基础上重新构造出来的k维特征。下面给出PCA降维的算法步骤,比较简单。


PCA 降维算法

Input: samples U={ ,…, }, dimension

Outputreduction matrix: ={,…,},

  1. Centralize all the samples= -

  2. Calculate the covariance matrix of the sample:

  3. Eigenvalue decomposition of the covariance matrix

  4. Take the eigenvector corresponding to the maximum eigenvalue of the first


5 permutation:利用密钥将降维后的数据顺序打乱。

6  论文的实验讨论:

  • 分析不同图像哈希距离的分布,用高斯分布进行拟合。

  • Collision Probabilities:计算哈希值的碰撞概率

  • SECURITY

    • Key-space

    • Image authentication:分析了不同颜色篡改情况下的图像认证情况。



三 自己的认识和体会

  1. Related work:

    1. Feature-extraction-based hashing algorithm.

    2. Dimensionality-reduction-based hashing algorithm.  

收获:利用相关工作的分类介绍,引出论文动机是a)方法和b)方法的结合,使得论文逻辑清晰,动机明确。在论文写作中可以参考。

  1. Experiment:

    1. Tampering with the color

收获:针对算法特点,设计出适合算法的实验,新颖且贴切,更好的反应了方法优势。在实验设计方面应该多思考,设计出适合的实验来提高算法贡献。



Baidu
map