[computer vision]高斯金字塔与拉普拉斯金字塔


高斯金字塔与拉普拉斯金字塔

高斯金字塔

一个下采样的序列,例如原始尺寸是512x512,那么一个图像序列,尺寸例如,512,256,128,...,4,2.这样一些尺寸的图像序列构成了高斯金字塔。这样一个序列的存储空间最大为原图像的4/3,因为每个图像是前一个层级的1/4尺寸,那么等比数列求和就好了。一个金字塔的例子,如下图所示。

高斯金字塔是怎么构建的呢?首先对原图进行高斯平滑然后下采样,然后再平滑再下采样...,最后构成一个图像序列。这里有一点,对图像进行平滑,就已经损失了一些信息,所以我们就没必要存储原尺寸了,对其进行下采样然后存储就好了。

  • 更高level的图像(小)更加平滑。
  • 更高level的图像存储原图中更加平坦的部分。

通过平滑我们损失了一些细节(可能是边缘),所以从高level无法还原出原图像,那我们能做一个无损信息的金字塔吗?可以,拉普拉斯金字塔。

拉普拉斯金字塔

对于每一层来说,存储图像和其平滑后图像的差值,最高层保留小图,用来恢复图像,如图所示

例如对于拉普拉斯金字塔的第0层(或者1层,就是最开始的层),用原图减去原图高斯平滑后的图像(此时还没有下采样,尺寸和原图一致)就得到了拉普拉斯金字塔的第0层。拉普拉斯金字塔的构建方式如下图所示,在拉普拉斯金字塔的构建过程中,我们也自然的得到了高斯金字塔(因为要平滑、下采样)

那我们如何利用拉普拉斯金字塔来恢复图像呢?如下图所示,对于最后保留的小图,上采样然后和拉普斯金字塔的差分图像加起来,然后重复这个过程,就逐步恢复了原始图像。

拉普拉斯金字塔和高斯金字塔比起来,存储的都是差分图像(除了最后用来恢复图像的小图),差分图像的特点就是大部分都是相同的数值,因此应该可以很好的对差分图像进行压缩。(本身金字塔没有压缩图像,反而增加了存储空间的消耗,但是差分图像应该比较容易进行压缩,而且效果很好。)那为什么叫拉普拉斯金字塔呢?因为差分高斯滤波器可以近似为拉普拉斯滤波器。

奈奎斯特定理

奈奎斯特采样定理解释了采样率和所测信号频率之间的关系。 阐述了采样率\(f_s\)必须大于被测信号感兴趣最高频率分量的两倍。 该频率通常被称为奈奎斯特频率\(f_{max}\)

\[f_s>2f_{max} \]

采样频率要大于两倍的信号频率,也就能通过信号线性插值较好的恢复出原信号。

那么高斯金字塔,通过平滑,相当于去掉了一些高频的信号,相当与降低了\(f_{max}\)的值,所以\(f_S\)可以不用那么大,也就是可以少采样一些,也没关系,不会出现走样混叠的情况。所以平滑后下采样可以解决走样混叠的问题。

图像金字塔的应用

例如

  • 图像压缩
  • 多尺度纹理映射(图形学中的mipmap)
  • 图像混合
  • 图像去噪
  • 多尺度图像配准
  • 等等

参考

  • [1]CMU计算机视觉lecture3