[论文复现] Poisson Image Editing

介绍

这篇论文（Poisson image editing）主要解决的是图像编辑的局部变化问题，比如说图像的无缝融合。之前的一些方法会导致图像的边缘出现接缝，即使用羽化的方法处理，也无法完全解决。

这篇文章提出的是一种通用机制，基于这种机制可以实现无缝图像克隆（Seamless Cloning）和选区编辑（Selection Editing）等功能。

原理

人眼对于二阶变化（如边缘）敏感，而对于一阶的梯度（比如光照、阴影的变化）不敏感。拉普拉斯算子进行了二阶导，光照、阴影这类缓慢的梯度可以近似看成线性函数，二阶导接近 0，这就会导致拉普拉斯算子处理后缓慢梯度被抑制，不过看着不明显。而对于高频变化，如边缘，经过拉普拉斯算子处理，会保留下来，依据拉普拉斯算子处理后的结果进行计算可以尽可能保留这些特征，以此达成“看起来差不多”的效果。

Guided interpolation notations

假设我们有一张源图像，一张目标图像，从源图像上切下来一块区域，移到目标图像上进行融合，那么可以这样看待下面几个符号：

$S$ ： $\R^2$ 上的闭集，可以代表目标区域
$\Omega$ ： $\Omega$ 是 $S$ 上的子集，也就是要融合的区域
$\partial \Omega$ ： $\Omega$ 区域的边缘，即融合的区域的边缘
$f^*$ ：定义在 $S$ 去掉 $\Omega$ 的区域上的标量函数，可以看成源图像未融合部分的像素值。由于我们可以对图像的 RGB 三个分量分别处理，所以这里直接当作标量函数了
$f$ ： $f$ 是定义在 $\Omega$ 上的标量函数，也就是我们要求的图像部分

如果这是一个插值问题，最简单的插值方法是看作这样的最小化问题：

\min_f \iint_{\Omega} |\nabla f|^2 \quad \text{且} \quad f|_{\partial \Omega} = f^*|_{\partial \Omega}

这叫做膜插值，可以让边缘连贯，同时确保内部平滑。这或许能用来修复背景，但跟我们要做的图像融合没啥关系。我们需要对内部的插值做额外的约束，为此引入了一个引导场 $v$ ，将问题转化为：

\min_f \iint_{\Omega} |\nabla f - \mathbf{v}|^2 \quad \text{且} \quad f|_{\partial \Omega} = f^*|_{\partial \Omega}

即让插值区域的梯度尽可能接近引导场 $v$ ，且边缘连续。引导场 $v$ 可能就是源图像的梯度，也可能不是。

这个问题的解又满足：

\Delta f = \text{div} \, \mathbf{v} \text{ over } \Omega \text{ 且 } f|_{\partial \Omega} = f^*|_{\partial \Omega}

由第一段的分析，我们更加确信转化成这样的最小化问题是合理的。

对于图像编辑的问题，我们需要离散地进行求解。直接对上面这个方程离散，不好计算，所以还是选择原本的方程进行离散：

\min_{f \mid_{\Omega}} \sum_{\langle p,q \rangle \cap \Omega \neq \emptyset} ((f_p - f_q) - v_{pq})^2, \text{ with } f_p = f_p^*, \text{ for all } p \in \partial \Omega

其中 $\langle p,q \rangle$ 表示 $q$ 是 $p$ 的上下左右四个方向的像素之一， $v_{pq}$ 表示 $p, q$ 中点处的引导向量场在 $pq$ 方向的投影，即 $v_{pq} = \mathbf{v}\left(\frac{p+q}{2}\right) \cdot \overrightarrow{pq}$ 。